BR122020018292B1 - Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr - Google Patents

Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr Download PDF

Info

Publication number
BR122020018292B1
BR122020018292B1 BR122020018292-0A BR122020018292A BR122020018292B1 BR 122020018292 B1 BR122020018292 B1 BR 122020018292B1 BR 122020018292 A BR122020018292 A BR 122020018292A BR 122020018292 B1 BR122020018292 B1 BR 122020018292B1
Authority
BR
Brazil
Prior art keywords
ppr
amino acids
amino acid
selectively binds
ppr motif
Prior art date
Application number
BR122020018292-0A
Other languages
English (en)
Inventor
Takashi Yamamoto
Tetsushi Sakuma
Takahiro Nakamura
Yusuke Yagi
Yasuyuki Okawa
Original Assignee
Hiroshima University
Kyushu University, National University Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hiroshima University, Kyushu University, National University Corporation filed Critical Hiroshima University
Publication of BR122020018292B1 publication Critical patent/BR122020018292B1/pt

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8217Gene switch
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Peptides Or Proteins (AREA)
  • Analytical Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Catching Or Destruction (AREA)

Abstract

[Problema] Com base na previsão de que as regras para reconhecimento de DNA dotadas de um motivo de PPR podem também ser usadas no reconhecimento de DNA, realizar a análise de proteína PPR que está ativa em ligação de DNA, e pesquisar uma proteína PPR que tem tais características. A presente invenção aborda o problema acima mencionado por meio de uma proteína que pode ligar seletivamente à base de DNA ou especificamente à sequência de base de DNA, e que contém uma pluralidade de, preferivelmente 2-30, mais preferivelmente 5-25, e ainda mais preferivelmente 9-15, motivos de PPR tendo a estrutura na fórmula 1 (na fórmula 1: Hélice A é uma parte que pode formar uma estrutura em a-hélice; X é uma parte que não existe ou que compreende 1-9 aminoácidos; Hélice B é uma parte que pode formar uma estrutura em a-hélice; e L é uma parte que compreende 2-7 aminoácidos), o motivo de PPR tendo uma combinação específica de três aminoácidos que correspondem à base de DNA ou sequência de bases alvo: primeiro A.A. de Hélice A e quarto A.A. da Hélice A na fórmula 1, juntamente com o "ii" (-2)-ésimo A.A. contido em L. (Hélice A)-X-(Hélice B)-L (fórmula 1).

Description

Campo Técnico
[001] A presente invenção se refere a uma proteína que pode seletiva ou especificamente se ligar a uma base de DNA ou sequência de DNA alvo. De acordo com a presente invenção, um motivo de repetição de pentatricopeptídeo (PPR) é utilizado. A presente invenção pode ser usada para identificação e projeto de uma proteína de ligação ao DNA, identificação de um DNA alvo de uma proteína com um motivo de PPR, e controle funcional de DNA. A presente invenção é útil nos campos de medicina, ciência agrícola, e assim por diante. A presente invenção também se refere a uma enzima de clivagem de DNA inédita que utiliza um complexo de uma proteína contendo um motivo de PPR e uma proteína que define uma região funcional.
Fundamentos da Invenção
[002] Nos últimos anos, técnicas de ligação de ácido nucleico - ligação de fatores de proteína elucidadas através de várias análises a uma sequência visada foram estabelecidas, e elas estão prestes a ser usadas. O uso desta ligação específica à sequência está possibilitando a análise de localização intracelular de um ácido nucleico alvo (DNA ou RNA), eliminação de uma sequência de DNA alvo, ou controle de expressão (ativação ou inativação) de um gene que codifica proteína existente à jusante de uma sequência de DNA alvo.
[003] Estão sendo conduzidas pesquisas e desenvolvimentos usando a proteína dedo de zinco (Documentos de não patente 1 e 2), efetor TAL (TALE, Documento de Não Patente 3, Documento de patente 1), e CRISPR (Documentos de não patente 4 e 5) como fatores de proteína que agem no DNA como materiais para projetar proteína. Entretanto, os tipos de tais fatores de proteína são ainda extremamente limitados.
[004] Por exemplo, a enzima artificial, nuclease dedo de zinco (ZFN), conhecida como uma enzima de clivagem de DNA artificial, é uma proteína quimera obtida ligando uma parte que é constituída ligando 3 a 6 dedos de zinco que reconhecem especificamente um DNA consistindo em 3 ou 4 nucleotídeos, e se liga nele, e reconhece uma sequência de nucleotídeos em uma unidade da sequência de 3 ou 4 nucleotídeos com um domínio de clivagem de DNA de uma enzima de clivagem de DNA bacteriana (por exemplo, FokI) (Documento de Não Patente 2). Em uma proteína quimera como esta, o domínio de dedo de zinco é um domínio de proteína que é conhecido por se ligar no DNA, e é baseado no conhecimento de que muitos fatores de transcrição têm o domínio supramencionado, e se ligam a uma sequência de DNA específica para controlar a expressão de um gene. Usando duas das ZFNs, cada qual com três dedos de zinco, clivagem de um sítio por 70 bilhões de nucleotídeos pode ser induzida na teoria.
[005] Entretanto, em virtude do alto custo exigido para a produção de ZFNs, etc., os métodos usando ZFNs não chegaram a ser amplamente usados ainda. Além disso, eficiência de classificação funcional de ZFNs é ruim, e é sugerido que os métodos têm um problema também a este respeito. Além disso, uma vez que um domínio de dedo de zinco consistindo em n dos dedos de zinco tende a reconhecer uma sequência de (GNN)n, os métodos também têm um problema de que o grau de liberdade para a sequência genética alvo é baixo.
[006] Uma enzima artificial, TALEN, foi também desenvolvida ligando uma proteína consistindo em uma sequência combinatória de partes de módulo que pode reconhecer cada nucleotídeo, efetor TAL (TALE), com um domínio de clivagem de DNA de uma enzima de clivagem de DNA bacteriana (por exemplo, FokI), e está sendo investigada como uma enzima artificial que pode substituir ZFNs (Documento de Não Patente 3). Esta TALEN é uma enzima gerada fundindo um domínio de ligação de DNA de um fator de transcrição de uma bactéria Xanthomonas de planta patogênica, e o domínio de clivagem de DNA da enzima de restrição de DNA FokI, e é conhecida por se ligar a uma sequência de DNA vizinha para formar um dímero e clivar um DNA de fita dupla. Uma vez que, como para esta molécula, o domínio de ligação de DNA de TALE encontrado de uma bactéria que infecta com plantas reconhece uma base com uma combinação de aminoácidos em dois sítios no motivo TALE consistindo em 34 resíduos de aminoácidos, ela tem uma característica de que a propriedade de ligação para um DNA alvo pode ser escolhida escolhendo-se a estrutura de repetição do módulo TALE. TALEN usando o domínio de ligação de DNA que tem uma característica como esta anteriormente mencionada tem uma característica de que ela permite introdução de mutação em um gene alvo, como ZFNs, mas a significante superioridade da mesma para ZFNs é que o grau de liberdade para o gene alvo (sequência de nucleotídeos) é notadamente melhorado, e o nucleotídeo no qual ela se liga pode ser definido com um código.
[007] Entretanto, uma vez que a conformação total de TALEN não foi elucidada, o sítio de clivagem de DNA de TALEN não foi identificado até hoje. Portanto, tem um problema de que sítio de clivagem de TALEN é impreciso, e não é fixo, comparado com ZFNs, e também cliva mesmo uma sequência similar. Portanto, tem um problema de que uma sequência de nucleotídeos não pode ser precisamente clivada em um sítio alvo visado com uma enzima de clivagem de DNA. Por esses motivos, é desejável desenvolver e fornecer uma enzima de clivagem de DNA artificial inédita livre dos problemas supramencionados.
[008] Com base na informação da sequência genômica, proteínas PPR (proteínas com um motivo de repetição de pentatricopeptídeo (PPR)) constituindo uma grande família de não menos que 500 membros somente para plantas que foram identificadas (Documento de Não Patente 6). As proteínas PPR são proteínas codificadas no núcleo, mas são conhecidas por agir ou estar envolvidas no controle, clivagem, tradução, união, edição de RNA e estabilidade de RNA principalmente a um nível de RNA em organelas (cloroplastos e mitocôndria) de uma maneira específica do gene. As proteínas PPR tipicamente têm uma estrutura consistindo em cerca de 10 motivos de 35 aminoácidos contíguos de baixa capacidade conservativa, isto é, motivos de PPR, e é considerado que a combinação do motivo de PPRs é responsável pela ligação seletiva da sequência com RNA. Praticamente todas as proteínas PPR consistem somente em repetição de cerca de 10 motivos de PPR, e qualquer domínio necessário para exibir uma ação catalítica não é encontrado em muitos casos. Portanto, considera-se que as proteínas PPR são essencialmente adaptadores de RNA (Documento de Não Patente 7).
[009] Em geral, ligação de uma proteína e DNA, e ligação de uma proteína e RNA são obtidas por diferentes mecanismos moleculares. Portanto, uma proteína de ligação ao DNA geralmente não se liga ao RNA, ao passo que uma proteína de ligação de RNA geralmente não se liga ao DNA. Por exemplo, no caso da proteína pumilio, que é conhecida como um fator de ligação de RNA, e pode codificar RNA para ser reconhecida, ligação da mesma no DNA não foi reportada (Documentos de não patente 8 e 9).
[0010] Entretanto, no processo de investigar propriedades de vários tipos de proteínas PPR, ficou claro que poderia ser sugerido que alguns tipos das proteínas PPR funcionaram como fatores de ligação de DNA.
[0011] A p63 de aveia é uma proteína de PPR com 9 motivos de PPR, e é sugerido pelo ensaio de deslocamento de gel que ele se liga a DNA de uma maneira específica à sequência (Documento de Não Patente 10).
[0012] A proteína GUN1 de Arabidopsis thaliana tem 11 motivos de PPR, e é sugerido pelo ensaio de coprecipitação que ela se liga com DNA (Documento de Não Patente 11).
[0013] Foi demonstrado pelo ensaio de transcrição instantânea que a Arabidopsis thaliana pTac2 (proteína com 15 motivos de PPR, Documento de Não Patente 12) e Arabidopsis thaliana DG1 (proteína com 10 motivos de PPR, Documento de Não Patente 12) participam diretamente na transcrição para gerar RNA usando DNA como um molde, e considera-se que eles se ligam ao DNA.
[0014] Uma cepa de Arabidopsis thaliana deficiente no gene de GRP23 (proteína com 11 motivos de PPR, Documento de Não Patente 14) mostra o fenótipo de morte embriônica. Foi demonstrado que esta proteína fisicamente interage com a subunidade principal da polimerase de transcrição de RNA 2 eucariótica, que é uma enzima de transcrição de RNA dependente de DNA e, portanto, considera-se que GRP23 também age para se ligar ao DNA.
[0015] Entretanto, ligações dessas proteínas PPR ao DNA foram sugeridas apenas indiretamente, e a real ligação específica à sequência não foi totalmente verificada. Além disso, mesmo se tais proteínas se ligarem com DNA, considera-se geralmente que a ligação de uma proteína e DNA, e a ligação de uma proteína e RNA são obtidas por diferentes mecanismos moleculares e, portanto, qual tipo de regra de sequência existe especificamente, com a qual a ligação é obtida, etc., não são mesmo absolutamente esperados. Referências da Tecnologia Anterior Documentos Patentes Documento de patente 1: WO2011/072246 Documento de patente 2: WO2011/111829 DOCUMENTOS DE NÃO PATENTES Documento de Não Patente 1: Maeder, M.L., et al. (2008) Rapid "open-source" engineering of customized zinc-finger nucleases for highly efficient gene modification, Mol. Cell 31, 294-301 Documento de Não Patente 2: Urnov, F.D., et al. (2010) Genome editing with engineered zinc finger nucleases, Nature Review Genetics, 11, 636-646 Documento de Não Patente 3: Miller, J.C., et al. (2011) A TALE nuclease architecture for efficient genome editing, Nature Biotech., 29, 143-148 Documento de Não Patente 4: Mali P., et al. (2013) RNA- guided human genome engineering via Cas9, Science, 339, 823-826 Documento de Não Patente 5: Cong L., et al. (2013) Multiplex genome engineering using CRISPR/Cas systems, Science, 339, 819-823 Documento de Não Patente 6: Small, I.D. and Peeters, N. (2000) The PPR motif - a TPR-related motif prevalent in plant organellar proteins, Trends Biochem. Sci., 25, 46-47 Documento de Não Patente 7: Woodson, J.D., and Chory, J. (2008) Coordination of gene expression between organellar and nuclear genomes, Nature Rev. Genet., 9, 383-395 Documento de Não Patente 8: Wang, X., et al. (2002) Modular recognition of RNA by a human pumilio-homology domain, Cell, 110, 501512 Documento de Não Patente 9: Cheong, C.G., and Hall and T.M. (2006) Engineering RNA sequence specificity of Pumilio repeats, Proc. Natl. Acad. Sci. USA 103, 13635-13639 Documento de Não Patente 10: Ikeda T.M. and Gray M.W. (1999) Characterization of a DNA-binding protein implicated in transcription in wheat mitochondria, Mol. Cell Bio., l19 (12):8113-8122 Documento de Não Patente 11: Koussevitzky S., et al. (2007) Signals from chloroplasts converge to regulate nuclear gene expression, Science, 316:715-719 Documento de Não Patente 12: Pfalz J, et al. (2006) PTAC2, - 6, and -12 are components of the transcriptionally active plastid chromosome that are required for plastid gene expression, Plant Cell 18:176-197 Documento de Não Patente 13: Chi W, et al. (2008) The pentatricopeptide repeat protein DELAYED GREENING1 is involved in the regulation of early chloroplast development and chloroplast gene expression in Arabidopsis, Plant Physiol., 147:573-584 Documento de Não Patente 14: Ding YH, et al. (2006) Arabidopsis GLUTAMINE-RICH PROTEIN 23 is essential for early embryogenesis and encodes a novel nuclear PPR motif protein that interacts with RNA polymerase II subunit III, Plant Cell, 18:815-830 Sumário da Invenção
Objetivo a Ser Alcançado Pela Invenção
[0016] Os inventores da presente invenção esperaram que as propriedades das proteínas PPR (proteínas com um motivo de PPR) como adaptadores de RNA seriam determinadas pela propriedade de cada motivo de PPR constituindo as proteínas PPR e combinação de uma pluralidade de motivos de PPR, e propuseram métodos para modificar proteínas de ligação de RNA usando tais motivos de PPR (Documento de patente 2). Então, eles elucidaram que um motivo de PPR e RNA se ligam em correspondência um para um, motivos de PPR contíguos reconhecem bases de RNA contíguas em uma sequência de RNA, e tal reconhecimento de RNA é determinado pela combinação de aminoácidos em três posições específicas entre os 35 aminoácidos que constituem o motivo de PPR, e depositaram um pedido de patente para um método para projetar uma proteína de ligação de RNA customizada utilizando códigos de reconhecimento de RNA de motivos de PPR e uso da mesma (PCT/JP2012/077274; Yagi, Y., et al. (2013) PLoS One, 8, e57286; e Barkan, A., et al. (2012) PLoS Genet., 8, e1002910).
[0017] Foi em geral considerado que a ligação de uma proteína e DNA, e a ligação de uma proteína e RNA são obtidas por diferentes mecanismos moleculares. Entretanto, os inventores da presente invenção previram que a regra de reconhecimento de RNA do motivo de PPR seria também utilizável para reconhecimento de DNA, e analisaram proteínas PPR que agem para se ligar com DNA visando recuperar proteínas PPR com uma característica como esta. Eles também visaram fornecer uma enzima artificial inédita preparando uma proteína de ligação ao DNA customizada que se liga a uma sequência desejada usando uma proteína de PPR como esta que se liga especificamente a um DNA obtido da maneira aqui descrita, e usá-la com uma proteína que define uma região funcional, e fornecer uma enzima de clivagem de DNA artificial inédita usando-a junto com uma região dotada de uma atividade de clivagem de DNA como a região funcional.
Meios Para Atingir o Objetivo
[0018] Como para as proteínas PPR, foi elucidado por vários programas de pesquisa de domínio (Pfam, Prosite, Interpro, etc.) que os motivos de PPR contidos nas proteínas PPR do tipo que liga a RNA comuns e os motivos de PPR contidos nas proteínas PPR de ligação ao DNA de alguns tipos anteriormente mencionados não são particularmente distintos. Portanto, foi considerado que proteínas PPR podem conter aminoácidos (grupo de aminoácido) que determinariam uma propriedade de ligação para DNA ou uma propriedade de ligação para RNA além dos aminoácidos exigidos para o reconhecimento de ácido nucleico.
[0019] Os inventores da presente invenção elucidaram que um motivo de PPR de ligação no RNA e RNA se ligam em correspondência um para um, motivos de PPR contíguos reconhecem bases de RNA contíguas em uma sequência de RNA e, em tal reconhecimento, ligação seletiva da base com RNA é determinada combinação de aminoácidos de reconhecimento de RNA em três posições específicas (ou seja, o primeiro e quarto aminoácidos da primeira hélice (Hélice A) entre as duas estruturas em a-hélice constituindo o motivo (A.A. No. 1 e A.A. No. 4), e o segundo aminoácido contado a partir do terminal C (A.A. No. “ii” (-2))), entre os 35 aminoácidos constituindo o motivo de PPR, e depositaram um pedido de patente para um método para projetar uma proteína de ligação de RNA customizada utilizando códigos de reconhecimento de RNA de motivos de PPR e uso dos mesmos (PCT/JP2012/077274).
[0020] Então, entre as proteínas PPR, para a p63 de aveia supramencionada (Documento de Não Patente 11, a sequência de aminoácidos da proteína homóloga de Arabidopsis thaliana está mostrada como SEQ ID NO: 1), proteína GUN1 de Arabidopsis thaliana (Documento de Não Patente 12, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 2), pTac2 de Arabidopsis thaliana (Documento de Não Patente 13, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 3), DG1 (Documento de Não Patente 14, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 4), e GRP23 de Arabidopsis thaliana (Documento de Não Patente 15, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 5), para as quais ligação com DNA foi sugerida, frequências de aminoácido dos aminoácidos em três posições que levam os códigos de reconhecimento de ácido nucleico no motivo de PPR considerado ser importante quando RNA é um alvo (A.A. No. 1, A.A. No. 4 e A.A. No. “ii” (-2)) foram comparadas com aquelas encontradas no motivo do tipo que se liga ao RNA. Como um resultado, ficou claro que as tendências das frequências de aminoácido encontradas nesses motivos de PPR anteriormente mencionadas, para as quais propriedade de ligação de DNA foi sugerida, e os motivos do tipo que se liga ao RNA concordam substancialmente um com o outro.
[0021] Os resultados apresentados sugerem que os códigos de reconhecimento de ácido nucleico dos motivos de PPR do tipo que se liga ao RNA podem também ser aplicado aos motivos de PPR do tipo que se liga ao DNA. Timina (T) é um derivado de uracila (U) com uma estrutura consistindo em uracila (U) da qual carbono da posição 5 é metilado, como é também denominada 5-metiluracila. Uma característica como esta da base que constitui o ácido nucleico sugere que a combinação dos aminoácidos que reconhecem uracila (U) de um motivo de PPR do tipo que se liga ao RNA é usada para reconhecimento de timina (T) em DNA.
[0022] Com base nas descobertas supramencionadas, foi elucidado que, usando o p63 supramencionado (sequência de aminoácidos de SEQ ID NO: 1), proteína GUN1de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 2), pTac2 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 3), DG1 (sequência de aminoácidos de SEQ ID NO: 4), e GRP23 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 5), que são proteínas PPR do tipo que se liga ao DNA, como um molde, arranjando aminoácidos das três posições (A.A. No. 1, A.A. No. 4 e A.A. No. “ii” (-2)) com aplicação da observação obtida para tais proteínas PPR como um resultado do exame dos motivos de PPR do tipo que se liga ao PPR, uma proteína de ligação ao DNA customizada que se liga a uma sequência de base de DNA arbitrária poderia ser produzida.
[0023] Ou seja, os inventores da presente invenção forneceram uma proteína que compreende 2 ou mais, preferivelmente 2 a 30, mais preferivelmente 5 a 25, acima de tudo preferivelmente 9 a 15, de motivos de PPR com os aminoácidos específicos descritos a seguir como os aminoácidos nas três posições (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR, e podem se ligar ao DNA de uma maneira seletiva da base de DNA ou de uma maneira seletiva da sequência de base de DNA, da qual exemplos típicos são as sequências de aminoácidos de SEQ ID NOS: 1 a 5, e assim desenvolveram a presente invenção.
[0024] A presente invenção fornece o seguinte.
[0025] [1] Uma proteína que pode se ligar de uma maneira seletiva da base de DNA ou de uma maneira específica à sequência de DNA, que contém um ou mais motivos de PPR com uma estrutura da fórmula 1 seguinte:
Figure img0001
(em que, na fórmula 1: Hélice A é uma parte que pode formar uma estrutura em α- hélice; X não existe, ou é uma parte consistindo em 1 a 9 aminoácidos; Hélice B é uma parte que pode formar uma estrutura em α- hélice; e L é uma parte consistindo em 2 a 7 aminoácidos, em que, sob as definições seguintes: o primeiro aminoácido da Hélice A é referido como aminoácido No. 1 (A.A. No. 1), o quarto aminoácido como aminoácido No. 4 (A.A. No. 4), e - quando um motivo de PPR seguinte (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR), o -2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn); - quando um motivo de não-PPR consistindo em 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o aminoácido localizando à montante do primeiro aminoácido do motivo de PPR seguinte (Mn+1) por 2 posições, isto é, o -2o aminoácido; ou - quando qualquer motivo de PPR seguinte (Mn+1) não existir no lado do terminal C do motivo de PPR (Mn), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o 2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2) (A.A. No. “ii” (-2)), um motivo de PPR (Mn) contido na proteína é um motivo de PPR com uma combinação específica de aminoácidos correspondendo a uma base de DNA alvo ou sequência de base de DNA alvo como os três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)
[0026] [2] A proteína de acordo com [1], em que a combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) é uma combinação correspondendo a uma base de DNA alvo ou sequência de base de DNA alvo, e a combinação de aminoácidos é determinada de acordo com qualquer uma das definições seguintes: (1-1) quando A.A. No. 4 é glicina (G), A.A. No. 1 pode ser um aminoácido arbitrário, e A.A. No. “ii” (-2) é ácido aspártico (D), asparagina (N), ou serina (S); (1-2) quando A.A. No. 4 é isoleucina (I), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-3) quando A.A. No. 4 é leucina (L), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-4) quando A.A. No. 4 é metionina (M), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-5) quando A.A. No. 4 é asparagina (N), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-6) quando A.A. No. 4 é prolina (P), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-7) quando A.A. No. 4 é serina (S), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-8) quando A.A. No. 4 é treonina (T), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; e (1-9) quando A.A. No. 4 é valina (V), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário.
[0027] [3] A proteína de acordo com [1], em que a combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) é uma combinação correspondendo a uma base de DNA alvo ou sequência de base de DNA alvo, e a combinação de aminoácidos é determinada de acordo com qualquer uma das definições seguintes: (2-1) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são um aminoácido arbitrário, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-2) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-3) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-4) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-5) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e serina, respectivamente, o motivo de PPR se liga seletivamente a A, e em seguida se liga a C; (2-6) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-7) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-8) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-9) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-10) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e lisina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-11) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-12) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-13) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-14) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a C e T; (2-15) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-16) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-17) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são glicina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-18) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-19) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são treonina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-20) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são valina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-21) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são tirosina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-22) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-23) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-24) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são serina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-25) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-26) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-27) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-28) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-29) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-30) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a T; (2-31) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-32) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-33) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-34) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-35) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são tirosina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-36) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-37) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-38) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-39) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-40) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-41) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-42) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-43) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-44) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-45) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-46) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-47) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e um aminoácido arbitrário, respectivamente, o motivo de PPR que se liga com A, C e T, mas não se liga a G; (2-48) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, valina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a UM; (2-49) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e glicina, respectivamente, o motivo de PPR se liga seletivamente a C; e (2-50) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e treonina, respectivamente, o motivo de PPR se liga seletivamente a T.
[0028] [4] A proteína de acordo com qualquer um de [1] a [3], que contém 2 a 30 dos motivos de PPR (Mn) como definidos em [1].
[0029] [5] A proteína de acordo com qualquer um de [1] a [3], que contém 5 a 25 dos motivos de PPR (Mn) como definidos em [1].
[0030] [6] A proteína de acordo com qualquer um de [1] a [3], que contém 9 a 15 dos motivos de PPR (Mn) como definidos em [1].
[0031] [7] A proteína de PPR de acordo com [6], que consiste em uma sequência selecionada a partir da sequência de aminoácidos de SEQ ID NO: 1 contendo 9 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 2 contendo 11 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 3 contendo 15 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 4 contendo 10 motivos de PPR, e a sequência de aminoácidos de SEQ ID NO: 5 contendo 11 motivos de PPR.
[0032] [8] Um método para identificar uma base de DNA ou sequência de base de DNA que serve como um alvo de uma proteína de ligação ao DNA contendo um ou mais (preferivelmente 2 a 30) motivos de PPR (Mn) como definidos em [1], em que: a base de DNA ou sequência de base de DNA é identificada através da determinação presença ou ausência de uma base de DNA que corresponde a uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) do motivo de PPR com base em qualquer uma das definições (1-1) a (1-9) mencionadas em [2], e (2-1) a (2-50) mencionadas em [3].
[0033] [9] Um método para identificar uma proteína de PPR contendo um ou mais (preferivelmente 2 a 30) motivos de PPR (Mn) como definidos em [1] que pode se ligar a uma base de DNA alvo ou DNA alvo com uma sequência de base específica, em que: a proteína de PPR é identificada através da determinação presença ou ausência de uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) que corresponde à base de DNA alvo ou uma base específica que constitui o DNA alvo com base em qualquer uma das definições (1-1) a (1-9) mencionadas em [2], e (2-1) a (2-50) mencionadas em [3].
[0034] [10] Um método para controlar uma função de DNA, que usa a proteína de acordo com [1].
[0035] [11] Um complexo consistindo em uma região compreendendo a proteína de acordo com [1], e uma região funcional juntamente ligada.
[0036] [12] O complexo de acordo com [11], em que a região funcional é fundida na proteína de acordo com [1] no lado do terminal C da proteína.
[0037] [13] O complexo de acordo com [11] ou [12], em que a região funcional é uma enzima de clivagem de DNA, ou um domínio de nuclease da mesma, ou um domínio de controle de transcrição, e o complexo funciona como uma enzima de clivagem de DNA alvo específica à sequência ou fator de controle de transcrição.
[0038] [14] O complexo de acordo com [13], em que a enzima de clivagem de DNA é o domínio de nuclease de FokI (SEQ ID NO: 6).
[0039] [15] Um método para modificar uma substância genética de uma célula compreendendo as seguintes etapas: preparar uma célula contendo um DNA tendo uma sequência alvo; e introduzir o complexo de acordo com [11] na célula de forma que a região do complexo consistindo na proteína se liga ao DNA tendo uma sequência alvo e, portanto, a região funcional modifica o DNA tendo uma sequência alvo.
[0040] [16] Um método para identificar, reconhecer ou alveja uma base de DNA ou DNA tendo uma sequência de base específica usando uma proteína de PPR contendo um ou mais motivos de PPR.
[0041] [17] O método de acordo com [16], em que a proteína contém um ou mais motivos de PPR nos quais três aminoácidos entre os aminoácidos que constituem o motivo constituem uma combinação específica de aminoácidos.
[0042] [18] O método de acordo com [16] ou [17], em que a proteína contém um ou mais motivos de PPR (Mn) como definidos em [1].
Efeito da Invenção
[0043] De acordo com a presente invenção, um motivo de PPR que pode se ligar a uma base de DNA alvo e uma proteína contendo-o podem ser providos. Pelo arranjo de dois ou mais motivos de PPR, uma proteína que pode se ligar a um DNA alvo com uma sequência ou comprimento arbitrário pode ser provida.
[0044] De acordo com a presente invenção, um DNA alvo de uma proteína de PPR arbitrária pode ser previsto e identificado e, ao contrário, uma proteína de PPR que se liga a um DNA arbitrário pode ser prevista e identificada. Previsão de uma sequência de DNA alvo como esta esclarece a identidade genética da mesma, e aumenta a possibilidade de uso da mesma. Além disso, de acordo com a presente invenção, funcionalidades de genes homólogos de um gene de uma proteína de PPR industrialmente útil que apresenta polimorfismo de aminoácido a um alto nível podem ser determinadas com base na diferença das sequências de base de DNA alvo da mesma.
[0045] Além disso, de acordo com a presente invenção, uma enzima de clivagem de DNA inédita usando um motivo de PPR pode também ser provida. Ou seja, ligando uma proteína como uma região funcional com o motivo de PPR ou proteína de PPR provida pela presente invenção, um complexo contendo uma proteína com uma atividade de ligação para uma sequência de ácido nucleico específica, e uma proteína com uma funcionalidade específica podem ser preparadas.
[0046] A região funcional utilizável na presente invenção é uma que pode conferir, entre várias funções, uma função para qualquer uma de clivagem, transcrição, replicação, restauração, síntese, modificação, etc. de DNA. Pela escolha da sequência dos motivos de PPR, que é a característica da presente invenção, para determinar uma sequência de base de DNA como um alvo, praticamente todas as sequências de DNA podem ser usadas como um alvo, e edição de genoma usando uma função da região funcional tais como aquelas para clivagem, transcrição, replicação, restauração, síntese, modificação, etc. de DNA pode ser realizada com um alvo como este.
[0047] Por exemplo, quando a região funcional tem uma função para clivar DNA, um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de clivagem de DNA juntamente ligada é provido. Um complexo como este pode funcionar como uma enzima de clivagem de DNA artificial, que reconhece uma sequência de base de DNA como um alvo com a parte de proteína de PPR, e então cliva DNA com a região para clivar DNA. Quando a região funcional tem uma função de controle de transcrição, um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de controle de transcrição para DNA juntamente ligada é provido. Um complexo como este pode funcionar como um fator de controle de transcrição artificial, que reconhece uma sequência de base de DNA como um alvo com a parte de proteína de PPR, e então promove transcrição do DNA alvo.
[0048] A presente invenção pode adicionalmente ser utilizada para um método para dispensar o complexo supramencionado em um corpo vivo de forma que o complexo funciona no corpo vivo, e preparação de transformantes utilizando uma sequência de ácido nucleico (DNA e RNA) que codifica uma proteína obtida de acordo com a presente invenção, bem como modificação, controle e comunicação específica de uma função em várias situações em organismos (células, tecidos e indivíduos).
Breve Descrição dos Desenhos
[0049] [Fig. 1] Fig. 1 mostra sequências conservadas e números de aminoácido do motivo de PPR. Fig. 1A mostra os aminoácidos que constituem o motivo de PPR definido na presente invenção, e os números de aminoácido do mesmo. Fig. 1B mostra posições de três aminoácidos (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) que controlam seletividade da base de ligação na estrutura prevista. Fig. 1C mostra dois exemplos da estrutura do motivo de PPR, e as posições dos aminoácidos na estrutura prevista para cada caso. A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são indicados com bastões de cor magenta (cinza escuro no caso de exibição monocrática) nos diagramas conformacionais da proteína.
[0050] [Fig. 2] Fig. 2 sumariza os esboços das estruturas de Arabidopsis thaliana p63 (sequência de aminoácidos de SEQ ID NO: 1), a proteína GUN1 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 2), pTac2 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 3), DG1 (sequência de aminoácidos de SEQ ID NO: 4), e GRP23 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 5), que são proteínas PPR do tipo que se liga ao DNA que funcionam no metabolismo de DNA, e o esboço do sistema de ensaio para demonstrar que elas se ligam ao DNA.
[0051] [Fig. 3] Fig. 3 sumariza as frequências de aminoácido dos aminoácidos nas três posições que levam os códigos de reconhecimento de ácido nucleico no motivo de PPR (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (2)) para os motivos de PPR das proteínas PPR (SEQ ID NOS: 1 a 5), para os quais propriedade de ligação de DNA foi sugerida, e motivos do tipo de ligação ao RNA conhecidos.
[0052] [Fig. 4-1] Fig. 4-1 mostra as posições dos motivos de PPR incluídos no lado de fora das proteínas, e as posições dos três aminoácidos que levam os códigos de reconhecimento de ácido nucleico (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR para cada qual de (A) Arabidopsis thaliana p63 (sequência de aminoácidos de SEQ ID NO: 1) e (B) a proteína GUN1 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 2.
[0053] [Fig. 4-2] Fig. 4-2 mostra as posições dos motivos de PPR incluído no interior das proteínas, e as posições dos três aminoácidos que levam os códigos de reconhecimento de ácido nucleico (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR para cada qual de (C) pTac2 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 3), e (D) DG1 (sequência de aminoácidos de SEQ ID NO: 4).
[0054] [Fig. 4-3] Fig. 4-3 mostra as posições dos motivos de PPR incluído no interior das proteínas, e as posições dos três aminoácidos que levam os códigos de reconhecimento de ácido nucleico (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR para (E) GRP23 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 5).
[0055] [Fig. 5] Fig. 5 mostra a avaliação da capacidade de ligação de DNA específica à sequência das moléculas de PPR. Fatores de transcrição artificiais foram preparados focando cada qual dos três tipos de moléculas de PPR do tipo que liga a DNA (assim consideradas) com VP64, que é um domínio de ativação de transcrição, e se elas poderiam ativar um repórter da luciferase com cada sequência alvo foram examinados em uma célula cultivada de humano.
[0056] [Fig. 6] Fig. 6 mostra a comparação das atividades de luciferase observadas pela cointrodução de pTac2-VP64 ou GUN1-VP64 com pminCMV-luc2 como um controle negativo, ou um vetor repórter compreendendo 4 ou 8 sequências alvos. Como um resultado, foi observada uma tendência de que a atividade aumentou com o aumento da sequência alvo para ambas as moléculas, e assim verificou-se que essas moléculas PPR-VP64 se ligaram especificamente em cada sequência alvo para funcionar como um ativador de transcrição específico do sítio. Modos Para Realizar a Invenção [Motivo de PPR e proteína de PPR]
[0057] O "motivo de PPR" referido na presente invenção significa um polipeptídeo constituído com 30 a 38 aminoácidos e com uma sequência de aminoácidos que mostra, quando a sequência de aminoácidos é analisada com um programa de pesquisa de domínio de proteína na rede (por exemplo, Pfam, Prosite, Uniprot, etc.), um valor E não maior que um valor predeterminado (desejavelmente E-03) obtido em PF01535 no caso de Pfam (http://pfam.sanger.ac.uk/), ou PS51375 no caso de Prosite (http://www.expasy.org/Prosite/), a menos que de outra forma indicado. Os motivos de PPR em várias proteínas são também definidos na base de dados do Uniprot (http://www.uniprot.org).
[0058] Embora a sequência de aminoácidos do motivo de PPR não seja altamente conservada no motivo de PPR da presente invenção, uma estrutura secundária como esta de hélice, laço, hélice, e laço mostrada pela fórmula seguinte é igualmente conservada. [Fórmula 2] (Hélice A)-X-(Hélice B)-L (Fórmula 1)
[0059] Os números de posição dos aminoácidos que constituem o motivo de PPR definidos na presente invenção são de acordo com aqueles definidos em um trabalho dos inventores da presente invenção (Kobayashi K, et al., Nucleic Acids Res., 40, 2712-2723 (2012)). Ou seja, os números de posição dos aminoácidos que constituem o motivo de PPR definido na presente invenção são substancialmente os mesmos números de aminoácido definidos para PF01535 em Pfam, mas correspondem aos números obtidos subtraindo 2 dos números de aminoácido definidos para PS51375 em Prosite (por exemplo, a posição 1 de acordo com a presente invenção é a posição 3 de PS51375), e também correspondem aos números obtidos subtraindo 2 dos números de aminoácido do motivo de PPR definidos em Uniprot.
[0060] Mais precisamente, na presente invenção, o aminoácido No. 1 é o primeiro aminoácido a partir do qual a Hélice A mostrada na fórmula 1 se inicia. O aminoácido No. 4 é o quarto aminoácido contado a partir do aminoácido No. 1. Como para o "ii" (-2)-ésimo aminoácido, - quando um motivo de PPR seguinte (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR, como nos casos, por exemplo, dos Motivos Nos. 1, 2, 3, 4, 6 e 7 na Fig. 4-1 (A)), o -2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2); - quando um motivo de não-PPR (parte que não é o motivo de PPR) consistindo em 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C (como nos casos, por exemplo, dos Motivos Nos. 5 e 8 na Fig. 4-1 (A), e Motivos Nos. 1, 2, 7 e 8 na Fig. 4-3 (D)), o aminoácido localizando à montante do primeiro aminoácido do motivo de PPR seguinte (Mn+1) por 2 posições, isto é, o -2o aminoácido, é referido como aminoácido No. “ii” (-2) (referir-se à Fig.1); ou - quando qualquer motivo de PPR seguinte (Mn+1) não existir no lado do terminal C do motivo de PPR (Mn) (como nos casos, por exemplo, do Motivo No. 9 na Fig. 4-1 (A), e o Motivo No. 11 na Fig. 4-1 (B)), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o 2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2).
[0061] A "proteína de PPR" referida na presente invenção significa uma proteína de PPR com dois ou mais dos motivos de PPR supramencionados, a menos que de outra forma indicado. O termo "proteína" usado nesta especificação significa qualquer substância consistindo em um polipeptídeo (cadeia consistindo em dois ou mais aminoácidos ligados através de ligações de peptídeo), e também inclui aqueles consistindo em um polipeptídeo de peso molecular relativamente baixo, a menos que de outra forma indicado. O "aminoácido" referido na presente invenção significa uma molécula de aminoácido usual, bem como um resíduo de aminoácido constituindo uma cadeia de peptídeo. O que o termo significa ficará aparente aos versados na técnica pelo contexto.
[0062] Muitas proteínas PPR existem em plantas, e 500 proteínas e cerca de 5000 motivos podem ser encontrados em Arabidopsis thaliana. Motivos de PPR e proteínas PPR de várias sequências de aminoácidos também existem em muitas plantas terrestres tais como arroz, álamo e selaginelácea. É sabido que algumas proteínas PPR são importantes fatores para obter sementes F1 para vigor híbrido tais como fatores de restauração de fertilidade que são envolvidos na formação de pólen (gameta masculino). Foi esclarecido que algumas proteínas PPR são envolvidas na evolução de novas espécies, similarmente na restauração da fertilidade. Foi também esclarecido que praticamente todas as proteínas PPR agem em RNA em mitocôndria ou cloroplastos.
[0063] É sabido que, em animais, anomalia da proteína de PPR identificada como LRPPRC causa síndrome de Leigh franco-canadense (LSFC, síndrome de Leigh, encefalomielopatia necrotizante subaguda).
[0064] O termo "seletivo" usado para uma propriedade de um motivo de PPR para ligação com uma base de DNA na presente invenção significa que uma atividade de ligação para qualquer uma base entre as bases de DNA é maior que as atividades de ligação para as outras bases, a menos que de outra forma indicado. Versados na técnica podem confirmar esta seletividade planejando um experimento, ou esta pode também ser obtida por cálculo, como descrito nos exemplos mencionados nesta especificação.
[0065] A base de DNA referida na presente invenção significa uma base de desoxirribonucleotídeo constituindo DNA e, especificamente, significa qualquer de adenina (A), guanina (G), citosina (C) e timina (T), a menos que de outra forma indicado. Embora a proteína de PPR possa ter seletividade para uma base em DNA, ela não se liga a um monômero de ácido nucleico.
[0066] Embora métodos de pesquisa de sequência de aminoácidos conservada como o motivo de PPR tenham sido estabelecidos antes que a presente invenção fosse concluída, qualquer regra concernente à ligação seletiva com base de DNA não foi absolutamente descoberta. [Descobertas providas pela presente invenção]
[0067] As descobertas seguintes são providas pela presente invenção. (1) Informação a respeito de posições de aminoácidos importantes para ligação seletiva
[0068] Especificamente, sob as definições seguintes: o primeiro aminoácido da Hélice A do motivo de PPR é referido como aminoácido No. 1 (A.A. No. 1), o quarto aminoácido como aminoácido No. 4 (A.A. No. 4), e - quando um motivo de PPR seguinte (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR), o -2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn); - quando um motivo de não-PPR consistindo em 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o aminoácido localizando à montante do primeiro aminoácido do motivo de PPR seguinte (Mn+1) por 2 posições, isto é, o -2o aminoácido; ou - quando qualquer motivo de PPR seguinte (Mn+1) não existir no lado do terminal C do motivo de PPR (Mn), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o 2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2) (A.A. No. “ii” (-2)), combinação dos três aminoácidos, o primeiro e quarto aminoácidos da hélice (Hélice A), e os aminoácidos No. i e No. 4, e A.A. No. “ii” (-2) definidos anteriormente (A.A. No. 1, A.A. No. 4 e A.A. No. “ii” (-2)), é importante para ligação seletiva a uma base de DNA, e em qual tipo de base de DNA o motivo se liga podem ser determinados com base na combinação.
[0069] A presente invenção é baseada nas descobertas relativas a combinação dos três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (2), descobertos pelos inventores da presente invenção. Especificamente: (1-1) quando A.A. No. 4 é glicina (G), A.A. No. 1 pode ser um aminoácido arbitrário, A.A. No. “ii” (-2) é ácido aspártico (D), asparagina (N), ou serina (S), e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*GD), - preferivelmente uma combinação de ácido glutâmico (E) e ácido aspártico (D) (EGD), - uma combinação de um aminoácido arbitrário e asparagina (N) (*GN), - preferivelmente uma combinação de ácido glutâmico (E) e asparagina (N) (EGN), ou - uma combinação de um aminoácido arbitrário e serina (S) (*GS); - 1-2) quando A.A. No. 4 é isoleucina (I), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e asparagina (N) (*EM); - 1-3) quando A.A. No. 4 é leucina (L), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*LD), ou - uma combinação de um aminoácido arbitrário e lisina (K) (*LK); - 1-4) quando A.A. No. 4 é metionina (M), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*MD), ou - uma combinação de isoleucina (I) e ácido aspártico (D) (IMD); - 1-5) quando A.A. No. 4 é asparagina (N), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*ND), - uma combinação de qualquer um de fenilalanina (F), glicina (G), isoleucina (I), treonina (T), valina (V) e tirosinas (Y), e ácido aspártico (D) (FND, GND, IND, TND, VND ou YND), - uma combinação de um aminoácido arbitrário e asparagina (N) (*NN), - uma combinação de qualquer um de isoleucina (I), serina (S) e valina (V), e asparagina (N) (INN, SNN ou VNN) - uma combinação de um aminoácido arbitrário e serina (S) (*NS), - uma combinação de valina (V) e serina (S) (VNS), - uma combinação de um aminoácido arbitrário e treonina (T) (*NT), - uma combinação de valina (V) e treonina (T) (VNT), - uma combinação de um aminoácido arbitrário e triptofano (W) (*NW), ou - uma combinação de isoleucina (I) e triptofano (W) (INW); - 1-6) quando A.A. No. 4 é prolina (P), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*PD), - uma combinação de fenilalanina (F) e ácido aspártico (D) (FPD), ou - uma combinação de tirosina (Y) e ácido aspártico (D) (YPD); - 1-7) quando A.A. No. 4 é serina (S), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e asparagina (N) (*SN), - uma combinação de fenilalanina (F) e asparagina (N) (FSN), ou - uma combinação de valina (V) e asparagina (N) (VSN); - 1-8) quando A.A. No. 4 é treonina (T), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*TD), - uma combinação de valina (V) e ácido aspártico (D) (VTD), - uma combinação de um aminoácido arbitrário e asparagina (N) (*TN), - uma combinação de fenilalanina (F) e asparagina (N) (FTN), - uma combinação de isoleucina (I) e asparagina (N) (ITN), ou - uma combinação de valina (V) e asparagina (N) (VTN); e (1-8) quando A.A. No. 4 é valina (V), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de isoleucina (I) e ácido aspártico (D) (IVD), - uma combinação de um aminoácido arbitrário e glicina (G) (*VG), ou - uma combinação de um aminoácido arbitrário e treonina (T) (*VT). (II) Informação a respeito de correspondência da combinação de três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), e base de DNA
[0070] A proteína é uma proteína determinado com base, especificamente, nas definições seguintes, e com uma propriedade de ligação de base de DNA seletiva: (2-1) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-2) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-3) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-4) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-5) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e serina, respectivamente, o motivo de PPR se liga seletivamente a A, e em seguida se liga a C; (2-6) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-7) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-8) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-9) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-10) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e lisina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-11) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-12) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-13) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-14) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a C e T; (2-15) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-16) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-17) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são glicina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-18) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-19) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são treonina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-20) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são valina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-21) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são tirosina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-22) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-23) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-24) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são serina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-25) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-26) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-27) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-28) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-29) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-30) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a T; (2-31) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-32) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-33) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-34) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-35) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são tirosina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-36) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-37) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-38) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-39) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-40) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-41) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-42) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-43) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-44) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-45) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-46) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-47) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga com A, C e T, mas não se liga a G; (2-48) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, valina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a A; (2-49) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e glicina, respectivamente, o motivo de PPR se liga seletivamente a C; e (2-50) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e treonina, respectivamente, o motivo de PPR se liga seletivamente a T.
[0071] Combinação de aminoácidos de posições e propriedade de ligação específicas com uma base de DNA pode ser confirmada por experimentos. Experimentos para tais propósitos incluem preparação de um motivo de PPR ou uma proteína contendo dois ou mais motivos de PPR, preparação de um substrato DNA, e teste de propriedade de ligação (por exemplo, ensaio de deslocamento de gel). Esses experimentos são bem conhecidos pelos versados na técnica, e, para procedimentos e condições mais específicos, por exemplo, o Documento de patente 2 pode ser referido.
[Uso de motivo de PPR e proteína de PPR] Identificação e projeto
[0072] Um motivo de PPR reconhece um tipo específico de base de DNA, e dois ou mais motivos de PPR contíguos podem reconhecer bases contíguas em uma sequência de DNA. Adicionalmente, de acordo com a presente invenção, escolhendo-se apropriadamente aminoácidos em posições específicas, motivos de PPR seletivos para cada qual de A, T, G, e C podem ser escolhidos ou projetados, e uma proteína contendo uma continuação apropriada de tais motivos de PPR pode reconhecer uma sequência específica correspondente. Portanto, de acordo com a presente invenção, uma proteína de PPR de ocorrência natural que se liga seletivamente ao DNA com uma sequência de base específica pode ser prevista ou identificada, ou, ao contrário, DNA como um alvo de ligação de uma proteína de PPR pode ser previsto e identificado. Previsão ou identificação de um alvo como este é útil para esclarecer a identidade genética do alvo, e é também útil de um ponto de vista de que tal previsão ou identificação pode expandir a aplicabilidade do alvo.
[0073] Além disso, de acordo com a presente invenção, um motivo de PPR que pode se ligar seletivamente a uma base de DNA desejada, e uma proteína com dois ou mais motivos de PPR que pode se ligar a um DNA desejado de uma maneira específica à sequência pode ser projetada. Em tal projeto, como para a parte sem ser os aminoácidos nas posições importantes no motivo de PPR, informação de sequência nos motivos de PPR do tipo de ocorrência natural em proteínas PPR do tipo que se liga ao DNA tais como aquelas de SEQ ID NOS: 1 a 5 podem ser referidos. Adicionalmente, o motivo ou proteína pode também ser projetado usando um motivo ou proteína do tipo de ocorrência natural como um todo, e substituindo somente os aminoácidos das posições correspondentes. Embora o número de repetições de motivos de PPR possa ser apropriadamente escolhido de acordo com uma sequência alvo, ele pode ser, por exemplo, 2 ou mais, preferivelmente 2 a 30, mais preferivelmente 5 a 25, acima de tudo preferivelmente 9 a 15.
[0074] No projeto, aminoácidos sem ser aqueles da combinação dos aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) podem ser levados em consideração. Por exemplo, a seleção dos aminoácidos de No. 8 e No. 12 descritos no Documento de patente 2 anteriormente mencionado pode ser importante para apresentar uma atividade de ligação ao DNA. De acordo com as pesquisas dos inventores da presente invenção, o aminoácido No. 8 de um certo motivo de PPR e o aminoácido No. 12 do mesmo motivo de PPR podem cooperar na ligação com DNA. O aminoácido No. 8 pode ser um aminoácido básico, preferivelmente lisina, ou um aminoácido acídico, preferivelmente ácido aspártico, e o aminoácido No. 12 pode ser um aminoácido básico, aminoácido neutro, ou aminoácido hidrofóbico.
[0075] Um motivo projetado ou proteína pode ser preparado por métodos bem conhecidos pelos versados na técnica. Ou seja, a presente invenção fornece um motivo de PPR que se liga seletivamente a uma base específica de DNA, e uma proteína de PPR que se liga especificamente ao DNA com uma sequência específica, na qual atenção é dada à combinação dos aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2). Um motivo e proteína como estes podem ser preparados mesmo em uma quantidade relativamente grande por métodos bem conhecidos pelos versados na técnica, e tais métodos podem compreender determinar uma sequência de ácido nucleico que codifica um motivo ou proteína alvo a partir da sequência de aminoácidos do motivo ou proteína alvo, cloná-lo, e preparar um transformante que produz o motivo ou proteína alvo.
Preparação de complexo e uso do mesmo
[0076] O motivo de PPR ou proteína de PPR provido pela presente invenção pode ser feito em um complexo pela ligação a uma região funcional. A região funcional no geral se refere a uma parte com uma função como esta como uma função biológica específica exercida em um corpo vivo ou célula, por exemplo, função enzimática, função catalítica, função inibitória, função promotora, etc., ou uma função como um marcador. Uma região como esta consiste, por exemplo, em uma proteína, peptídeo, ácido nucleico, substância fisiologicamente ativa, ou medicamento.
[0077] De acordo com a presente invenção, pela ligação de uma região funcional na proteína de PPR, a função de ligação da sequência de DNA alvo exercida pela proteína de PPR, e a função exercida pela região funcional podem ser exibidas em combinação. Por exemplo, se uma proteína com uma função de clivagem de DNA (por exemplo, enzima de restrição tal como FokI) ou um domínio de nuclease da mesma for usada como a região funcional, o complexo pode funcionar como uma enzima de clivagem de DNA artificial.
[0078] A fim de produzir um complexo como este, métodos em geral disponíveis neste campo técnico podem ser usados, e é conhecido um método de sintetizar um complexo como este como uma molécula de proteína, um método de sintetizar separadamente dois ou mais elementos de proteínas, e então combiná-los para formar um complexo, e assim por diante.
[0079] No caso do método de sintetizar um complexo como uma molécula de proteína, por exemplo, um complexo de proteína pode ser projetado de maneira a compreender uma proteína de PPR e uma enzima de clivagem ligada no terminal C da proteína de PPR por meio de um adaptador de aminoácido, uma estrutura de vetor de expressão para expressar o complexo de proteína pode ser construída, e o complexo alvo pode ser expresso a partir da estrutura. Como um método de preparação como este, o método descrito no pedido de patente japonês No. 2011-242250, e assim por diante, pode ser usado.
[0080] Para ligar a proteína de PPR e a proteína da região funcional, qualquer meio de ligação conhecido neste campo técnico pode ser usado, incluindo ligação por meio de um adaptador de aminoácido, ligação utilizando afinidade específica tal como ligação entre avidina e biotina, ligação utilizando um outro adaptador químico, e assim por diante.
[0081] A região funcional utilizável na presente invenção se refere a uma região que pode conferir qualquer uma de várias funções tais como aquelas para clivagem, transcrição, replicação, restauração, síntese, ou modificação de DNA, e assim por diante. Pela escolha da sequência do motivo de PPR para definir uma sequência de base de DNA como um alvo, que é a característica da presente invenção, substancialmente qualquer sequência de DNA pode ser usada como o alvo e, com um alvo como este, edição de genoma utilizando a função da região funcional tais como aquelas para clivagem, transcrição, replicação, restauração, síntese, ou modificação de DNA pode ser realizada.
[0082] Por exemplo, quando a função da região funcional é uma função de clivagem de DNA, é provido um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de clivagem de DNA juntamente ligadas. Um complexo como este pode funcionar como uma enzima de clivagem de DNA artificial que reconhece uma sequência de base de DNA como um alvo pela parte de proteína de PPR, e então cliva DNA pela região de clivagem de DNA.
[0083] Um exemplo da região funcional com uma função de clivagem utilizável para a presente invenção é uma desoxirribonuclease (DNase), que funciona como um endodesoxirribonuclease. Como uma DNase como esta, por exemplo, endodesoxirribonucleases tais como DNase A (por exemplo, ribonuclease pancreática bovina A, PDB 2AAS), DNase H e DNase I, enzimas de restrição derivadas de várias bactérias (por exemplo, FokI (SEQ ID NO: 6) etc.) e domínios de nuclease da mesma podem ser usadas. Um complexo como este compreendendo uma proteína de PPR e uma região funcional não existe na natureza, e é inédito.
[0084] Quando a função da região funcional é uma função de controle de transcrição, é provido um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de controle de transcrição de DNA juntamente ligadas. Um complexo como este pode funcionar como um fator de controle de transcrição artificial, que reconhece uma sequência de base de DNA como um alvo pela parte de proteína de PPR, e então controla a transcrição do DNA alvo.
[0085] A região funcional com uma função de controle de transcrição utilizável para a presente invenção pode ser um domínio que ativa transcrição, ou pode ser um domínio que suprime transcrição. Exemplos do domínio de controle de transcrição incluem VP16, VP64, TA2, STAT-6 e p65. Um complexo como este compreendendo uma proteína de PPR e um domínio de controle de transcrição não existe na natureza, e é inédito.
[0086] Adicionalmente, o complexo obtenível de acordo com a presente invenção pode dispensar uma região funcional em um corpo ou célula viva de uma maneira específica à sequência de DNA, e permitir que ela funcione. Por meio disto é possível realizar modificação ou interrupção de uma maneira específica à sequência de DNA em um corpo ou célula viva, como complexos de proteína utilizando uma proteína dedo de zinco (Documentos de não patente 1 e 2 anteriormente mencionados) ou efetor TAL (Documento de Não Patente 3 e Documento de patente 1 anteriormente mencionados), e assim torna-se possível conferir uma função inédita, isto é, função para clivagem de DNA e edição de genoma utilizando essa função. Especificamente, com uma proteína de PPR compreendendo dois ou mais motivos de PPR que podem se ligar com uma base específica juntamente ligada, uma sequência de DNA específica pode ser reconhecida. Então, edição de genoma da região de DNA reconhecida pode ser realizada pela região funcional ligada à proteína de PPR usando a função da região funcional.
[0087] Além disso, pela ligação um medicamento à proteína de PPR que se liga a uma sequência de DNA de uma maneira específica à sequência de DNA, o medicamento pode ser dispensado na vizinhança da sequência de DNA como o alvo. Portanto, a presente invenção fornece um método para dispensação específica à sequência de DNA de uma substância funcional.
[0088] Foi esclarecido que a proteína de PPR usada como um material na presente invenção funciona para especificar uma posição de edição para edição de DNA, e um motivo de PPR como este com aminoácidos específicos arranjados nas posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) reconhece uma base específica no DNA, e então exibe a atividade de ligação de DNA da mesma. Com base em uma característica como esta, pode- se esperar que uma proteína de PPR deste tipo que tem aminoácidos específicos arranjados nas posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) reconheça uma base em DNA específico para cada proteína de PPR, e, como um resultado, introduz polimorfismo de base, ou que seja usada em um tratamento de uma doença ou condição resultante de um polimorfismo de base e, além do mais, é considerado que a combinação de uma proteína de PPR como esta com uma outra região funcional como esta, como anteriormente mencionado, contribui para modificação ou melhoria das funções para realizar clivagem de DNA para edição de genoma.
[0089] Além disso, uma enzima de clivagem de DNA exógena pode ser fundida no terminal C da proteína de PPR. Alternativamente, mela melhoria da seletividade da base de DNA de ligação do motivo de PPR no lado do terminal N, uma enzima de clivagem de DNA específica à sequência de DNA pode também ser constituída. Além disso, um complexo como este no qual uma parte do marcador tal como GFP é ligada pode também ser usado para visualização de um DNA desejada in vivo.
Exemplos Exemplo 1: Coleção de proteínas PPR e sequências alvos da mesma usadas para edição de DNA
[0090] Referindo-se à informação provida nas referências da tecnologia anterior (Documentos de não patente 11 a 15), estruturas e funções da proteína p63 (SEQ ID NO: 1), proteína GUN1 (SEQ ID NO: 2), pTac2 proteína (SEQ ID NO: 3), proteína DG1 (SEQ ID NO: 4), e proteína GRP23 (SEQ ID NO: 5) foram analisadas.
[0091] Nas estruturas de motivo de PPR em tais proteínas, os números de aminoácido definidos na presente invenção foram conferidos junto com a informação da base de dados Uniprot (http://www.uniprot.org/). Os motivos de PPR contidos nos cinco tipos de proteínas PPR de Arabidopsis thaliana (SEQ ID NOS: 1 a 5) usados para o experimento, e os números de aminoácido dos mesmos estão mostrados na Fig. 3.
[0092] Especificamente, frequências de aminoácido para os aminoácidos nas três posições (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) responsáveis pelos códigos de reconhecimento de ácido nucleico nos motivos de PPR considerados importantes no momento do alvejamento de RNA na proteína p63 supramencionada (SEQ ID NO: 1), proteína GUN1 (SEQ ID NO: 2), proteína pTac2 (SEQ ID NO: 3), proteína DG1 (SEQ ID NO: 4), e proteína GRP23 (SEQ ID NO: 5) foram comparadas com aquelas dos motivos do tipo de ligação ao RNA.
[0093] A proteína p63 de Arabidopsis thaliana (SEQ ID NO: 1) tem 9 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) Na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3.
Figure img0002
[0094] A proteína GUN1 de Arabidopsis thaliana (SEQ ID NO: 2) tem 11 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3.
Figure img0003
[0095] A proteína pTac2 de Arabidopsis thaliana (SEQ ID NO: 3) tem 15 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3.
Figure img0004
(B.G. significa fundo)
[0096] A proteína DG1 de Arabidopsis thaliana (SEQ ID NO: 4) tem 10 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3.
Figure img0005
(B.G. significa fundo)
[0097] A proteína GRP23 de Arabidopsis thaliana (SEQ ID NO: 5) tem 11 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3.
Figure img0006
(B.G. significa fundo)
[0098] As frequências de aminoácido para essas posições foram confirmadas para cada proteína, e comparadas com as frequências de aminoácido para as mesmas posições dos motivos do tipo de ligação ao RNA. Os resultados estão mostrados na Fig. 2. Fica claro que as tendências das frequências de aminoácido nos motivos de PPR das proteínas PPR para as quais propriedade de ligação ao DNA é sugerida, e os motivos do tipo de ligação ao RNA substancialmente concordam entre si. Ou seja, fica claro que as proteínas PPR que agem para ligar ao DNA se ligam com ácido nucleicos de acordo com as mesmas regras de sequência daquelas das proteínas PPR que agem para se ligar ao RNA, e os códigos de reconhecimento de RNA descritos no pedido de patente pendente dos inventores da presente invenção (PCT/JP2012/077274) podem ser aplicados como os códigos de reconhecimento de DNA das proteínas PPR que agem para se ligar ao DNA.
[0099] Com referência aos códigos de reconhecimento de RNA descritos no Documento de Não Patente (Yagi, Y. et al., Plos One, 2013, 8, e57286), os motivos de PPR do tipo que liga ao DNA que se ligam seletivamente a cada base correspondente foram avaliados. Mais precisamente, um teste do qui-quadrado foi realizado com base nas frequências de nucleotídeo ocorridas mostradas na Tabela 6 e frequências de nucleotídeo esperadas calculadas a partir das frequências de fundo. O teste foi realizado para cada base (NT), purina ou pirimidina (AG ou CT, PY), grupo ligado no hidrogênio (AT ou GC, HB), ou forma amino ou ceto (AC ou GT). O valor significante foi definido como P < 0,06 (5E-02, 5% de nível de significância) e, quando um valor significante foi obtido em qualquer dos testes, a combinação de aminoácido No. 1, aminoácido No. 4, e aminoácido No. “ii” (-2) foi escolhida. [Tabela 6-1] Tabela 6: Seletividade de base do código de ligação ao DNA
Figure img0007
Figure img0008
[00100] Na Tabela 1, as combinações dos aminoácidos que apresentaram seletividade da base significante foram mencionadas. Ou seja, esses resultados significam que os motivos de PPR com as espécies de aminoácido do aminoácido No. 1, aminoácido No. 4, e aminoácido No. “ii” (2) ("NSRs (1, 4, e ii)" na tabela) que forneceram um valor P significante são motivos de PPR que conferem capacidade de ligação seletiva da base, e um maior valor "positivo" obtido depois da subtração do fundo significa maior seletividade de base para a base. Entre o aminoácido No. 1, aminoácido No. 4, e aminoácido No. “ii” (-2), o aminoácido No. 4 afeta mais fortemente a seletividade da base, o aminoácido No. “ii” (-2) afeta a seletividade da base menos fortemente, e o aminoácido No. 1 afeta mais fracamente a seletividade da base entre os três aminoácidos. Exemplo 2: Avaliação da capacidade de ligação de DNA específica à sequência de moléculas PPR
[00101] Neste exemplo, fatores de transcrição artificiais foram preparados fundindo VP64, que é um domínio de ativação de transcrição, nos três tipos de Moléculas PPR do tipo que liga ao DNA (supostamente), p63, pTac2, e GUN1, e examinando se elas podem ativar repórteres da luciferase, cada qual tendo uma sequência alvo correspondente em uma célula cultivada de humano, se as moléculas PPR tiveram ou não uma capacidade de ligação de DNA específica à sequência ou foi determinado (Fig. 5). (Método experimental) 1. Preparação de vetor de expressão de PPR-VP64
[00102] Somente as partes correspondentes aos motivos de PPR nas sequências de codificação de p63, pTac2 e GUN1 foram preparadas por síntese artificial. Para a síntese de DNA, o serviço de síntese genética artificial da Biomatik foi usado. O vetor pCS2P com o promoter CMV foi usado como um vetor da espinha dorsal, e cada sequência de PPR sintetizada foi inserida nele. Adicionalmente, o marcador Flag e sinal de transferência nuclear foram inseridos no terminal N da sequência PPR, e a sequência VP64 foi inserida no terminal C da mesma. As sequências produzidas de p63-VP64, pTac2-VP64, e GUN1-VP64 são mostradas na Listagem de Sequência como SEQ ID NOS: 7 a 9. 2. Preparação de vetor repórter com sequência alvo de PPR
[00103] Um vetor repórter (pminCMV-luc2, SEQ ID NO: 10) foi preparado, no qual o gene da luciferase do vagalume foi ligado à jusante do promotor CMV minimal, e um sítio multiclonagem foi colocado à montante do promotor. A sequência alvo prevista de cada PPR foi inserida no vetor no sítio multiclonagem. A sequência alvo de cada PPR (TCTATCACT para p63, AACTTTCGTCACTCA para pTac2, e AATTTGTCGAT para GUN1, SEQ ID NOS: 11 a 13 na Listagem de Sequência) foi determinada prevendo-se os códigos de reconhecimento de motivo-DNA do DNA do tipo que se liga a PPR a partir dos códigos de reconhecimento de motivo-RNA observados no PPR do tipo que se liga ao RNA. Para cada PPR, sequências contendo 4 ou 8 das sequências alvos foram preparadas, e usadas no ensaio seguinte. As sequências de nucleotídeos dos vetores são mostradas como SEQ ID NOS: 14 a 19 na Listagem de Sequência. 3. Transfecção em célula T HEK293
[00104] O vetor de expressão PPR-VP64 preparado na seção 1, o vetor de expressão da luciferase do vagalume preparado na seção 2, e o vetor pRL- CMV (vetor de expressão para Renilla luciferase, Promega) como uma referência foram introduzidos usando Lipofectamina LTX (Life Technologies). O meio DMEM (25 μL) foi adicionado a cada poço de uma placa de 96 poços, e uma mistura contendo o vetor de expressão de PPR- VP64 (400 ng), vetor de expressão da luciferase do vagalume (100 ng), e vetor pRL-CMV (20 ng) foi adicionalmente adicionada. Então, uma mistura do meio DMEM (25 μL) e Lipofectamina LTX (0,7 μL) foi adicionada a cada poço, a placa foi deixada descansar à temperatura ambiente por 30 minutos, então 6 x 104 das células T HEK293 suspensas no meio DMEM contendo 15% de soro fetal bovino (100 μL) foram adicionados, e as células foram cultivadas a 37°C em um incubador de CO2 por 24 horas. 4. Ensaio de Luciferase
[00105] Ensaio de luciferase foi realizado usando Dual-Glo Luciferase Assay System (Promega) de acordo com as instruções anexas no kit. Para a medição da atividade da luciferase, TriStar LB 941 Plate Reader (Berthold) foi usada. (Resultados e discussão)
[00106] A atividade da luciferase foi comparada para os casos de introdução de pTac2-VP64 ou GUN1-VP64 junto com pminCMV-luc2 para um controle negativo, ou o vetor repórter com 4 ou 8 sequências alvos (tabela mencionada a seguir, Fig. 6). A comparação da atividade foi realizada com base em pontuações padronizadas obtidas dividindo os valores medidos obtidos com Fluc (luciferase do vagalume) com o valor medido obtido com Rluc (Renilla luciferase) como a referência (Fluc/Rluc). Como um resultado, observou-se uma tendência de que a atividade aumentou com o aumento do número da sequência alvo para ambos os casos, e assim foi verificado que cada das moléculas PPR-VP64 especificamente ligadas a cada sequência alvo, e funcionou como um ativador de transcrição específico do sítio.
Figure img0009

Claims (7)

1. Método para controlar uma função de DNA tendo uma sequência alvo, caracterizado pelo fato de que usa uma proteína que pode se ligar de uma maneira seletiva à base de DNA ou de uma maneira específica à sequência de base de DNA, o método compreendendo: projetar uma proteína que pode se ligar ao DNA possuindo a sequência alvo, e prepar a proteína desenhada para controlar o DNA, e em que o desenho é feito de tal forma que a proteína contém 2 a 30 motivos de PPR tendo uma estrutura da seguinte fórmula 1:
Figure img0010
(em que, na fórmula 1: Hélice A é uma parte que pode formar uma estrutura em α- hélice; X não existe ou é uma parte que consiste de 1 a 9 aminoácidos; Hélice B é uma parte que pode formar uma estrutura em α- hélice; e L é uma parte que consiste de 2 a 7 aminoácidos), em que, sob as seguintes definições: o primeiro aminoácido da Hélice A é referida como aminoácido No. 1 (A.A. No. 1), o quarto aminoácido como aminoácido No. 4 (A.A. No. 4), e - quando um seguinte motivo de PPR (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR), o -2° aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn); - quando um motivo de não-PPR consistindo de 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o seguinte motivo de PPR (Mn+1) no lado do terminal C, o aminoácido localizando a montante do primeiro aminoácido do seguinte motivo de PPR (Mn+1) por 2 posições, isto é, o -2° aminoácido; ou - quando qualquer seguinte motivo de PPR (Mn+1) não existe no lado do terminal C do motivo de PPR (Mn), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o seguinte motivo de PPR (Mn+1) no lado do terminal C, o segundo aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como No. "ii" (-2) aminoácido (A.A. No. "ii" (-2), cada motivo de PPR (Mn) contido na proteína é um motivo de PPR tendo uma combinação específica de aminoácidos como os três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), em que a combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2) é uma combinação correspondendo a uma base de DNA alvo do alvo, e a combinação de aminoácidos é determinada de acordo com qualquer uma das definições seguintes: (2-1) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-2) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são ácido glutâmico, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-3) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-4) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são ácido glutâmico, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-5) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, glicina e serina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-6) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, isoleucina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-7) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, isoleucina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-8) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, leucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-9) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, leucina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-10) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, leucina e lisina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-11) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, metionina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-12) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-13) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-14) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a C e T; (2-15) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-16) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-17) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são glicina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-18) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-19) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são treonina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-20) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-21) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são tirosina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-22) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-23) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-24) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são serina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-25) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-26) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina, e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-27) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina, e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-28) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-29) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina, e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-30) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a C; (2-31) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a T; (2-32) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, prolina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-33) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, prolina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-34) em que os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, prolina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-35) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são tirosina, prolina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-36) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, serina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-37) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, serina e asparagina, respectivamente, o motivo de PPR seletivamente se liga a A; (2-38) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-39) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-40) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, treonina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-41) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-42) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-43) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, treonina e asparagina, respectivamente, o motivo de PPR seletivamente se liga a A; (2-44) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-45) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-46) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-47) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, valina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga com A, C, e T, mas não se liga a G; (2-48) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, valina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-49) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, valina e glicina, respectivamente, o motivo de PPR se liga seletivamente a C; e (2-50) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, valina e treonina, respectivamente, o motivo de PPR se liga seletivamente a T.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que consiste de uma sequência selecionada a partir da sequência de aminoácidos de SEQ ID NO: 1 contendo 9 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 2 contendo 11 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 3 contendo 15 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 4 contendo 10 motivos de PPR e a sequência de aminoácidos de SEQ ID NO: 5 contendo 11 motivos de PPR.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a proteína é usada como um complexo que consiste em uma região compreendendo a proteína, e uma região funcional juntamente ligada, em que a região funcional é uma enzima de clivagem de DNA, ou um domínio de nuclease da mesma, ou um domínio de controle de transcrição, e o complexo funciona como uma enzima de clivagem de DNA específica da sequência alvo ou fator de controle de transcrição.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a região funcional é fundida à proteína no lado do terminal C da proteína.
5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que a enzima de clivagem de DNA é o domínio de nuclease de FokI (SEQ ID NO: 6).
6. Método para identificar uma sequência de base de DNA que serve como um alvo de uma proteína PPR existente contendo 2 a 30 dos motivos de PPR (Mn) como definidos na reivindicação 1, caracterizado pelo fato de que: a base de DNA ou sequência de base de DNA é identificada através da determinação da presença ou ausência de uma base de DNA que corresponde a uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2) do motivo de PPR contido na proteína PPR com base em qualquer uma das definições (2-1) a (2-50) como definidas na reivindicação 1.
7. Método para identificar uma proteína PPR contendo 2 a 30 dos motivos de PPR (Mn) como definidos na reivindicação 1 que podem se ligar a um DNA existente tendo uma sequência alvo, caracterizado pelo fato de que: a proteína PPR é identificada através da determinação da presença ou ausência de uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2) que corresponde a uma base de DNA alvo da sequência alvo com base em qualquer uma das definições (2-1) a (2-50) como definidas na reivindicação 1.
BR122020018292-0A 2013-04-22 2014-04-22 Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr BR122020018292B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013089840 2013-04-22
JP2013-089840 2013-04-22
PCT/JP2014/061329 WO2014175284A1 (ja) 2013-04-22 2014-04-22 Pprモチーフを利用したdna結合性タンパク質およびその利用

Publications (1)

Publication Number Publication Date
BR122020018292B1 true BR122020018292B1 (pt) 2023-05-16

Family

ID=51791855

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122020018292-0A BR122020018292B1 (pt) 2013-04-22 2014-04-22 Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr
BR122020018288-1A BR122020018288B1 (pt) 2013-04-22 2014-04-22 Métodos para ligar uma proteína a um dna tendo uma sequência alvo, e, para modificar uma substância genética de uma célula
BR112015026707-6A BR112015026707B1 (pt) 2013-04-22 2014-04-22 proteína ppr, e, complexo

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122020018288-1A BR122020018288B1 (pt) 2013-04-22 2014-04-22 Métodos para ligar uma proteína a um dna tendo uma sequência alvo, e, para modificar uma substância genética de uma célula
BR112015026707-6A BR112015026707B1 (pt) 2013-04-22 2014-04-22 proteína ppr, e, complexo

Country Status (12)

Country Link
US (3) US10189879B2 (pt)
EP (2) EP3696186A1 (pt)
JP (6) JP5896547B2 (pt)
KR (5) KR20160007541A (pt)
CN (6) CN116425883A (pt)
AU (5) AU2014258386B2 (pt)
BR (3) BR122020018292B1 (pt)
CA (1) CA2910050A1 (pt)
HK (2) HK1221966A1 (pt)
NZ (3) NZ714264A (pt)
SG (2) SG10201802430VA (pt)
WO (1) WO2014175284A1 (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122020018292B1 (pt) * 2013-04-22 2023-05-16 Hiroshima University Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr
DK3466978T3 (da) * 2016-06-03 2021-04-26 Univ Kyushu Nat Univ Corp Fusionsprotein til forbedring af proteinekspression fra mål-mRNA
SG11201810606TA (en) * 2016-06-03 2018-12-28 Univ Kyushu Nat Univ Corp FUSION PROTEIN FOR IMPROVING PROTEIN EXPRESSION FROM TARGET mRNA
EP3498726A4 (en) * 2016-08-10 2020-03-25 Fujifilm Wako Pure Chemical Corporation DNA-BINDING PROTEIN WITH PPR MOTIF AND USE OF THE DNA-BINDING PROTEIN
CN106591367B (zh) * 2017-01-19 2019-05-07 中国人民解放军第二军医大学 一种在体内获得并纯化大量目的LncRNA的方法
US20230287060A1 (en) * 2018-06-06 2023-09-14 The University Of Western Australia Proteins and their use for nucleotide binding
CN111919257B (zh) * 2018-07-27 2021-05-28 思勤有限公司 降低测序数据中的噪声的方法和系统及其实施和应用
KR20210062639A (ko) * 2018-08-27 2021-05-31 고쿠리츠다이가쿠호진 히로시마다이가쿠 신규 뉴클레아제 도메인 및 그 이용
CN113646429A (zh) 2019-04-05 2021-11-12 国立大学法人大阪大学 敲入细胞的制作方法
EP3977849A4 (en) * 2019-05-29 2023-06-28 Editforce, Inc. Ppr protein with less aggregation and use thereof
CN114729017A (zh) 2019-05-29 2022-07-08 日商基因编辑力股份有限公司 Ppr蛋白的有效制作方法及其应用
CN115698296A (zh) 2020-03-31 2023-02-03 日商基因编辑力股份有限公司 编辑靶标rna的方法
EP4242237A1 (en) 2020-11-06 2023-09-13 Editforce, Inc. Foki nuclease domain variant

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2510096B2 (en) 2009-12-10 2018-02-07 Regents of the University of Minnesota Tal effector-mediated dna modification
JP5485015B2 (ja) 2010-05-18 2014-05-07 株式会社グローバル・ニュークリア・フュエル・ジャパン 燃料集合体
JP2013128413A (ja) * 2010-03-11 2013-07-04 Kyushu Univ Pprモチーフを利用したrna結合性蛋白質の改変方法
EP2784157B1 (en) 2011-10-21 2019-09-18 Kyushu University, National University Corporation Design method for rna-binding protein using ppr motif, and use thereof
BR122020018292B1 (pt) * 2013-04-22 2023-05-16 Hiroshima University Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr
EP3498726A4 (en) * 2016-08-10 2020-03-25 Fujifilm Wako Pure Chemical Corporation DNA-BINDING PROTEIN WITH PPR MOTIF AND USE OF THE DNA-BINDING PROTEIN

Also Published As

Publication number Publication date
HK1221966A1 (zh) 2017-06-16
JP6806822B2 (ja) 2021-01-06
KR102390485B1 (ko) 2022-04-22
SG11201508730TA (en) 2015-11-27
EP3020722A4 (en) 2016-11-30
KR20220076478A (ko) 2022-06-08
US20190169240A1 (en) 2019-06-06
KR20210066947A (ko) 2021-06-07
JP2021045158A (ja) 2021-03-25
HK1223956A1 (zh) 2017-08-11
AU2024202150A1 (en) 2024-05-02
CN116425883A (zh) 2023-07-14
CA2910050A1 (en) 2014-10-30
CN116589544A (zh) 2023-08-15
EP3020722A1 (en) 2016-05-18
SG10201802430VA (en) 2018-05-30
CN116731137A (zh) 2023-09-12
AU2014258386B2 (en) 2018-10-25
JP2016039810A (ja) 2016-03-24
WO2014175284A1 (ja) 2014-10-30
AU2018271425B2 (en) 2020-11-26
KR102606057B1 (ko) 2023-11-23
KR20210037757A (ko) 2021-04-06
AU2018271425A1 (en) 2018-12-20
JP2023096153A (ja) 2023-07-06
AU2022202757A1 (en) 2022-05-19
US20210324019A1 (en) 2021-10-21
US20160075744A1 (en) 2016-03-17
US10189879B2 (en) 2019-01-29
KR20160007541A (ko) 2016-01-20
JP7290233B2 (ja) 2023-06-13
BR112015026707B1 (pt) 2020-12-29
JP7057983B2 (ja) 2022-04-21
KR20230164213A (ko) 2023-12-01
BR112015026707A2 (pt) 2017-09-05
NZ752698A (en) 2021-02-26
KR102326842B1 (ko) 2021-11-15
CN116444634A (zh) 2023-07-18
BR122020018288B1 (pt) 2023-05-16
AU2014258386A1 (en) 2015-12-03
JP5896547B2 (ja) 2016-03-30
NZ752706A (en) 2022-11-25
AU2020264412A1 (en) 2020-12-03
EP3696186A1 (en) 2020-08-19
CN116731198A (zh) 2023-09-12
NZ714264A (en) 2020-10-30
JPWO2014175284A1 (ja) 2017-02-23
JP2022089859A (ja) 2022-06-16
NZ752705A (en) 2023-01-27
CN105392796A (zh) 2016-03-09
AU2014258386A8 (en) 2016-01-28
AU2020264412B2 (en) 2022-02-17
JP2019115347A (ja) 2019-07-18
JP6487306B2 (ja) 2019-03-20

Similar Documents

Publication Publication Date Title
US20210324019A1 (en) Dna-binding protein using ppr motif, and use thereof
US20210403861A1 (en) Nucleotide-specific recognition sequences for designer tal effectors
EP3498726A1 (en) Dna-binding protein using ppr motif and use of said dna-binding protein
JP2014522662A (ja) オルガネラターゲッティングナノキャリア
JP2023036848A (ja) 凝集の少ないpprタンパク質及びその利用
US20220064229A1 (en) Methods for designing dna binding protein containing ppr motifs, and use thereof
NZ752698B2 (en) DNA-binding protein using PPR motif, and use thereof

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 22/04/2014, OBSERVADAS AS CONDICOES LEGAIS