WO2018030488A1 - Pprモチーフを利用したdna結合性タンパク質およびその利用 - Google Patents

Pprモチーフを利用したdna結合性タンパク質およびその利用 Download PDF

Info

Publication number
WO2018030488A1
WO2018030488A1 PCT/JP2017/028995 JP2017028995W WO2018030488A1 WO 2018030488 A1 WO2018030488 A1 WO 2018030488A1 JP 2017028995 W JP2017028995 W JP 2017028995W WO 2018030488 A1 WO2018030488 A1 WO 2018030488A1
Authority
WO
WIPO (PCT)
Prior art keywords
amino acid
amino acids
ppr motif
ppr
order
Prior art date
Application number
PCT/JP2017/028995
Other languages
English (en)
French (fr)
Inventor
昌之 山根
崇裕 中村
祐介 八木
Original Assignee
和光純薬工業株式会社
国立大学法人九州大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 和光純薬工業株式会社, 国立大学法人九州大学 filed Critical 和光純薬工業株式会社
Priority to US16/323,899 priority Critical patent/US20190177378A1/en
Priority to JP2018533549A priority patent/JPWO2018030488A1/ja
Priority to CN201780048281.XA priority patent/CN109563137A/zh
Priority to EP17839555.4A priority patent/EP3498726A4/en
Publication of WO2018030488A1 publication Critical patent/WO2018030488A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Peptides Or Proteins (AREA)

Abstract

PPRを利用したDNA結合性のタンパク質を汎用化、改良することを課題とする。以下の式1の構造を有するPPRモチーフを1個以上含むタンパク質であって、タンパク質に含まれる一のPPRモチーフ(Mn)が、1番A.A.、4番A.A.、および"ii"(-2)番A.A.の3つのアミノ酸を、対象DNA塩基または対象DNA塩基配列に対応した特定のアミノ酸の組み合わせで有するPPRモチーフであり、下記の(a)~(h)からなる群より選択される少なくとも一つを満たす、タンパク質:(a) PPRモチーフ(Mn)の7番A.A.が、イソロイシン(I)である;(b) PPRモチーフ(Mn)の9番A.A.が、アラニン(A)である;(c) PPRモチーフ(Mn)の10番A.A.が、チロシン(Y)である;(d) PPRモチーフ(Mn)の18番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;(e) PPRモチーフ(Mn)の20番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である;(f) PPRモチーフ(Mn)の29番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である;(g) PPRモチーフ(Mn)の31番A.A.が、イソロイシン(I)である;(h) PPRモチーフ(Mn)の32番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である。

Description

PPRモチーフを利用したDNA結合性タンパク質およびその利用
 本発明は、標的DNA塩基またはDNA配列に選択的または特異的に結合可能なタンパク質に関する。本発明では、pentatricopeptide repeat (PPR)モチーフを利用する。本発明はまた、PPRモチーフを利用したタンパク質において、標的DNA塩基またはDNA配列への結合性を高める方法に関する。本発明は、ゲノム編集に応用することができ、医療分野、農学分野等で有用である。
 近年、様々な解析より明らかになった核酸結合性のタンパク質因子を用いて、標的配列に結合する技術が確立され、利用されつつある。この配列特異的な結合を利用することで、標的とする核酸(DNAまたはRNA)の細胞内局在の解析、標的とするDNA配列の除去、またはその下流に存在するタンパク質コード遺伝子の発現の制御(活性化、または不活化)が可能になりつつある。
 DNAに作用するタンパク質性因子として、ジンクフィンガータンパク質(非特許文献1、非特許文献2)やTALエフェクター(TALE、非特許文献3、特許文献1)、CRISPR(非特許文献4、非特許文献5)をタンパク質工学的材料とした研究および開発が行われているが、そのようなタンパク質性因子の種類はいまだ非常に限定されている。
 例えば、人工のDNA切断酵素として知られている人工酵素ジンクフィンガーヌクレアーゼ(ZFN)は、3~4塩基のDNAを特異的に認識して結合するジンクフィンガーを3~6個連結させて構成される3~4塩基の配列単位で塩基配列を認識する部分に対して、細菌のDNA切断酵素(たとえば、FokI)のDNA切断ドメインを1つ連結させたキメラタンパク質である(非特許文献2)。このようなキメラタンパク質は、ジンクフィンガードメインが、DNAに対して結合することが知られているタンパク質ドメインであり、多くの転写調節因子がこのドメインを持ち、特異的なDNA配列に結合して遺伝子の発現調節を行なっていることが知られていることに基づいている。3個のジンクフィンガーをもつこのZFNを2つ用いることにより、理論上は、約700億塩基に1箇所の切断を誘導することができる。
 しかしながら、このZFNを使用する方法は、その作製に費用がかかることなどから、広く利用されるには至っていない。また、機能的なZFNの選別効率が悪く、その点でも問題があることが示唆されている。さらに、n個のジンクフィンガーからなるジンクフィンガードメインは、(GNN)nという配列を認識する傾向があることから、標的遺伝子配列の自由度が低いという問題も有していた。
 一方、1塩基ごとに認識することのできるモジュール部分の組み合わせ配列からなるタンパク質、TALエフェクター(TALE)に、細菌のDNA切断酵素(たとえば、FokI)のDNA切断ドメインを結合させたもの(TALEN)が開発され、ZFNに代わる人工酵素として検討が行われている(非特許文献3)。このTALENは、植物病原細菌Xanthomonasが持つ転写因子のDNA結合ドメインと、DNA制限酵素FokIのDNA切断ドメインとを融合させた酵素であり、近接するDNA配列に結合し、二量体を形成して二本鎖DNAを切断することが知られている。この分子は、植物に感染する細菌から見出されたTALEのDNA結合ドメインは、34アミノ酸からなるTALEモチーフ中の2カ所のアミノ酸の組み合わせで1つの塩基を認識することから、TALEモジュールの繰り返し構造の選択によって、標的DNAへの結合性を選択することができるという特徴を有している。このような特徴を有するDNA結合ドメインを利用したTALENは、ZFNと同様に標的遺伝子への変異導入が可能であるという特徴を有しているが、その標的遺伝子(塩基配列)の自由度が大幅に向上していること、さらに結合塩基をコード化できることが、ZFNと比較したときの大きな優位性である。
 しかしながら、TALENの完全な立体構造が明らかになっていないため、TALENのDNAの切断部位を同定することが現状ではできていない。そのため、TALENは、ZFNと比較して、切断箇所が不正確で一定しておらず、類似の配列まで切断してしまうという問題点を有している。そのため、正確に標的塩基配列箇所をDNA切断酵素により切断することができないという問題点が存在していた。このようなことから、上記の問題点を有しない、新しい人工のDNA切断酵素の開発・提供が望まれている。
 ゲノム配列情報から、植物のみで500個もの大きなファミリーを形成するタンパク質、PPRタンパク質(pentatricopeptide repeat(PPR)モチーフを有するタンパク質)が同定された(非特許文献6)。PPRタンパク質は核コードであるが、専らオルガネラ(葉緑体とミトコンドリア)のRNAレベルでの制御、切断、翻訳、スプライシング、RNA編集、RNA安定性に遺伝子特異的に作用することが知られているタンパク質である。PPRタンパク質は、典型的には、保存性の低い35アミノ酸のモチーフ、すなわちPPRモチーフが約10個連続した構造を有しており、PPRモチーフの組み合わせが、RNAとの配列選択的な結合を担っていると考えられている。ほとんどのPPRタンパク質はPPRモチーフ約10個の繰り返しのみで構成されており、多くの場合、触媒作用を発揮するために必要なドメインが見いだせない。そのため、このPPRタンパク質の実体はRNAアダプターだと考えられている(非特許文献7)。
 本発明者らは、PPRタンパク質のRNAアダプターとしての性質は、PPRタンパク質を構成するそれぞれのPPRモチーフの性質、および複数個のPPRモチーフの組み合わせで決定されると予想し、このPPRモチーフを利用した、RNA結合性タンパク質の改変方法について、提案してきた(特許文献2)。そして、PPRモチーフとRNAが一対一の対応で結合し、連続したPPRモチーフにより、RNA配列中の連続したRNA塩基を認識すること、PPRモチーフを構成する35アミノ酸のうち、特定の3箇所のアミノ酸の組み合わせでRNA認識が決定されることを明らかにし、PPRモチーフのRNA認識コードを利用したカスタムRNA結合タンパク質の設計方法とその利用について特許出願を行った(特許文献3)。
 一般的に、タンパク質とDNAとの間の結合と、タンパク質とRNAとの間の結合とは、異なる分子機構に基づいて行われており、DNA結合型タンパク質は、一般的にはRNAに対して結合せず、反対にRNA結合型タンパク質は、一般的にはDNAに対して結合しない。例えば、RNA結合因子として知られており、認識RNAをコード化することができるPumilioタンパク質の場合、DNAとの結合は報告されていない(非特許文献8および9)。
 一方、小麦のp63は、9個のPPRモチーフを有するPPRタンパク質であるが、ゲルシフトアッセイにより、配列特異的にDNAと結合することが示唆されている(非特許文献10)。シロイヌナズナのGUN1タンパク質は、11個のPPRモチーフを有し、プルダウンアッセイによりDNAと結合することが示唆されている(非特許文献11)。シロイヌナズナのpTac2(15個のPPRモチーフを有するタンパク質、非特許文献12)およびシロイヌナズナのDG1(10個のPPRモチーフを有するタンパク質、非特許文献13)は、DNAを鋳型としてRNAを生成する転写に直接関与することがRun-Onアッセイによって示されており、DNAに結合すると考えられる。シロイヌナズナのGRP23(11個のPPRモチーフを有するタンパク質、非特許文献14)の遺伝子欠損株は、胚性致死の表現形を示すが、そのタンパク質は、DNA依存型RNA転写酵素である真核生物型RNA転写ポリメラーゼ2のメジャーサブユニットと物理的に相互作用することが示されており、このことからGRP23もDNA結合に働くと考えられている。本発明者らは、PPRモチーフが有するRNA認識規則が、DNAの認識に対しても利用可能であるとの予測の下、小麦のp63、シロイヌナズナのGUN1、シロイヌナズナのpTac2、シロイヌナズナのDG1等の構造及び機能を解析し、所望の配列に結合するカスタムDNA結合タンパク質の設計方法を提案した(特許文献4)。
WO2011/072246 WO2011/111829 WO2013/058404 WO2014/175284
Maeder, M.L., et al. (2008). Rapid "open-source" engineeringof customized zinc-fingernucleases for highly efficient gene modification. Mol.Cell 31, 294-301. Urnov, F.D., et al., (2010) Genome editing with engineered zinc finger nucleases, Nature Review Genetics, 11, 636-646 Miller, J.C., et al. (2011). A TALE nuclease architecture for efficient genome editing. Nature biotech. 29, 143-148. Mali P, et al. (2013) RNA-guided human genome engineering via Cas9. Science. 339, 823-826. Cong L, et al. (2013) Multiplex genome engineering using CRISPR/Cas systems. Science. 339, 819-823 Small, I.D., and Peeters, N. (2000). The PPR motif - a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, 46-47. Woodson, J.D., and Chory, J. (2008). Coordination of gene expression between organellar and nuclear genomes. Nature Rev. Genet. 9, 383-395. Wang, X., et al. (2002). Modular recognition of RNA by a human pumilio-homology domain. Cell 110, 501-512. Cheong, C.G., and Hall, T.M. (2006). Engineering RNA sequence specificity of Pumilio repeats. Proc. Natl. Acad. Sci. USA 103, 13635-13639. Ikeda T.M. and Gray M.W. (1999) Characterization of a DNA-binding protein implicated in transcription in wheat mitochondria. Mol Cell Biol19(12):8113-8122 Koussevitzky S, et al. (2007) Signals from chloroplasts converge to regulate nuclear gene expression. Science 316: 715-719. Pfalz J, et al. (2006) pTAC2, -6, and -12 are components of the transcriptionally active plastid chromosome that are required for plastid gene expression. Plant Cell 18: 176-197. Chi W, et al. (2008) The pentratricopeptide repeat proteinDELAYED GREENING1 is involved in the regulation of early chloroplast development and chloroplast gene expression in Arabidopsis. Plant Physiol. 147: 573-584. Ding YH, et al. (2006) Arabidopsis GLUTAMINE-RICH PROTEIN23 is essential for early embryogenesis and encodes a novel nuclear PPR motif protein that interacts with RNA polymerase II subunit III. Plant Cell 18: 815-830.
 実際のdPPRタンパク質(PPRを利用したDNA結合性のタンパク質)としては、特許文献4に記載されているP63、GUN1、pTAC2、GRP23、DG1が存在するに過ぎず、PPR技術に基づいた人工核酸結合モジュールを汎用化、改良するための情報を得るには十分とは言い難い。
 そこで本発明者らは、DNA結合能を有するPPRタンパク質のスクリーニングを行い、dPPRタンパク質を拡充することとした。これまで偶発的に発見されたdPPRタンパク質の遺伝子はイントロンを含む一方で、rPPRタンパク質(PPRを利用したRNA結合性のタンパク質)の遺伝子はほぼ全てイントロンがない。これを指標に、モデル植物であるシロイヌナズナ全ゲノム配列を解析したところ、2個以上のイントロンを含むPPR遺伝子は42種類であった。本発明者らは、この42種類の潜在的dPPR分子のDNA結合能を解析し、新規dPPR分子の同定を試みた。また同定したdPPRタンパク質が有するモジュールのアミノ酸配列情報を基に、dPPRモチーフ特異的アミノ酸配列を解析した。さらにdPPR特異的アミノ酸配列によりPPRタンパク質のDNA結合能が上昇するかを検証する目的で、dPPR特異的アミノ酸配列を組み込んだ改変型rPPRのDNA結合能を調べた。その結果、本発明を完成した。
 本発明は、以下を提供する:
[1]  以下の式1の構造を有するPPRモチーフ:
Figure JPOXMLDOC01-appb-C000003
(式1中:
 Helix Aは、αヘリックス構造を形成可能な部分であり;
 Xは、存在しないかまたは1~9アミノ酸長からなる部分であり;
 Helix Bは、αヘリックス構造を形成可能な部分であり;そして
 Lは、2~7アミノ酸長からなる部分である。)
を1個以上含むタンパク質であって、
タンパク質に含まれる一のPPRモチーフ(Mn)が、
Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
・PPRモチーフ(Mn)のC末端側に連続して次のPPRモチーフ(Mn+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
・PPRモチーフ(Mn)とそのC末端側の次のPPRモチーフ(Mn+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(Mn+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
・PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(Mn+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から2番目のアミノ酸
を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸を、対象DNA塩基または対象DNA塩基配列に対応した特定のアミノ酸の組み合わせで有するPPRモチーフである、DNA塩基選択的に、またはDNA塩基配列特異的に結合可能なタンパク質であって、
下記の(a)~(h)、好ましくは下記(b)~(h)からなる群より選択される少なくとも一つを満たす、タンパク質:
(a) PPRモチーフ(Mn)の7番A.A.が、イソロイシン(I)である;
(b) PPRモチーフ(Mn)の9番A.A.が、アラニン(A)である;
(c) PPRモチーフ(Mn)の10番A.A.が、チロシン(Y)、フェニルアラニン(F)、またはトリプトファン(W)である;
(d) PPRモチーフ(Mn)の18番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;
(e) PPRモチーフ(Mn)の20番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(f) PPRモチーフ(Mn)の29番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である
(g) PPRモチーフ(Mn)の31番A.A.が、イソロイシン(I)、ロイシン(L)、バリン(V)である;
(h) PPRモチーフ(Mn)の32番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である
(ただし、配列番号1~5、および配列番号291~308のアミノ酸配列からなるタンパク質を除く。)。
[2]  1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、1に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
 (1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)である;
 (1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
に基づいて決定される、タンパク質。
[3]  1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、1に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
 (2-1)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-2)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-3)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-4)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-5)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
 (2-6)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
 (2-7)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-8)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
 (2-9)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
 (2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
 (2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
 (2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
 (2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
 (2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
 (2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;
に基づいて決定される、前記タンパク質。
[4]  1に定義されるPPRモチーフ(Mn)が、2~30個含まれる、1~3のいずれか1項に記載のタンパク質。
[5](b)および(c)の組合せ、 (d)および(e)の組合せ、(a)、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、1~4のいずれか1項に記載のタンパク質。好ましくは、(b)および(c)の組合せ、 (d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、1~4のいずれか1項に記載のタンパク質。
[6](b)および(c)の組合せを満たし、かつ(d)および(e)の組合せ、(a)、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、5に記載のタンパク質。好ましくは(b)および(c)の組合せを満たし、かつ(d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、5に記載のタンパク質。
[7](b)および(c)の組合せ、(d)および(e)の組合せ、(a)、ならびに(g)を満たす、6に記載のタンパク質。好ましくは、(b)および(c)の組合せ、(d)および(e)の組合せ、ならびに(g)を満たす、6に記載のタンパク質。
[8] 1~7のいずれか1項に記載のタンパク質であって、PPRモチーフを複数個含み、かつ下記(i)~(viii)の何れかを満たす、タンパク質:
(i)  7番A.A.の少なくとも40%が、イソロイシン(I)である;
(ii) 9番A.A.の少なくとも36%が、アラニン(A)である;
(iii)10番A.A.の少なくとも37%が、チロシン(Y)、フェニルアラニン(F)、またはトリプトファン(W)である;
(iv) 18番A.A.の少なくとも19%が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;
(v)  20番A.A.の少なくとも21%が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(vi) 29番A.A.の少なくとも9%が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(vii) 31番A.A.の少なくとも16%が、イソロイシン(I)、ロイシン(L)、またはバリン(V)である;
(viii)32番A.A.の少なくとも15%が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である。
 または、PPRモチーフを複数個含み、DNA結合性PPRモチーフの含有率が、13%以上である、1~7のいずれか1項に記載のタンパク質。
[9] 配列番号7~214のいずれか一つのアミノ酸配列;
 配列番号291の167~482位のアミノ酸配列、配列番号292の156~575位のアミノ酸配列、配列番号293の243~554位のアミノ酸配列、配列番号294の140~489位のアミノ酸配列、配列番号295の78~419位のアミノ酸配列、配列番号296の122~545位のアミノ酸配列、配列番号297の256~624位のアミノ酸配列、配列番号298の48~362位のアミノ酸配列、配列番号299の198~689位のアミノ酸配列、配列番号300の89~578位のアミノ酸配列、配列番号301の470~911位のアミノ酸配列、配列番号302の156~575位のアミノ酸配列、配列番号303の108~775位のアミノ酸配列、配列番号304の226~1137位のアミノ酸配列、配列番号305の145~496位のアミノ酸配列、配列番号306の104~538位のアミノ酸配列、配列番号307の151~502位のアミノ酸配列、および配列番号308の274~660位のアミノ酸配列からなる群より選択されるいずれか一つのアミノ酸配列;
 配列番号335~361のいずれか一つのアミノ酸配列;または
 配列番号424~427のいずれか一つのアミノ酸配列
からなるタンパク質。
[10] 1~9のいずれか1項に記載されたタンパク質、または配列番号291~308のいずれか一つのアミノ酸配列からなるタンパク質の全部または一部からなる領域;
 配列番号335~361のいずれか一つのアミノ酸配列からなるタンパク質;または
 配列番号424~427のいずれか一つのアミノ酸配列からなるタンパク質
と機能性領域とが連結されてなる、複合体。
[11] 複合体が、タンパク質のC末端側に、機能性領域を融合してなる、10に記載の複合体。
[12] 機能性領域が、DNA切断酵素またはそのヌクレアーゼドメイン、または転写制御ドメインであり、複合体が標的配列特異的DNA切断酵素、または転写制御因子として機能する、10または11に記載の複合体。
[13] DNA切断酵素がFokIのヌクレアーゼドメイン(配列番号6)である、12に記載の複合体。
[14] 配列番号1の230~541位のアミノ酸配列、配列番号2の234~621位のアミノ酸配列、配列番号3の106~632位のアミノ酸配列、配列番号4の106~632位のアミノ酸配列、および配列番号5の256~624位のアミノ酸配列からなる群より選択されるいずれか一のアミノ酸配列を有するタンパク質;
 配列番号1のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号2のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフ、配列番号3のアミノ酸配列からなるタンパク質が有する15個のPPRモチーフ、配列番号4のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号5のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフからなる群より選択されるいずれか一つのPPRモチーフ;
 配列番号291の167~482位のアミノ酸配列、配列番号292の156~575位のアミノ酸配列、配列番号293の243~554位のアミノ酸配列、配列番号294の140~489位のアミノ酸配列、配列番号295の78~419位のアミノ酸配列、配列番号296の122~545位のアミノ酸配列、配列番号297の256~624位のアミノ酸配列、配列番号298の48~362位のアミノ酸配列、配列番号299の198~689位のアミノ酸配列、配列番号300の89~578位のアミノ酸配列、配列番号301の470~911位のアミノ酸配列、配列番号302の156~575位のアミノ酸配列、配列番号303の108~775位のアミノ酸配列、配列番号304の226~1137位のアミノ酸配列、配列番号305の145~496位のアミノ酸配列、配列番号306の104~538位のアミノ酸配列、配列番号307の151~502位のアミノ酸配列、および配列番号308の274~660位のアミノ酸配列からなる群より選択されるいずれか一つのアミノ酸配列を有するタンパク質;または
 配列番号291のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号292のアミノ酸配列からなるタンパク質が有する6個のPPRモチーフ、配列番号293のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号294のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号295のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号296のアミノ酸配列からなるタンパク質が有する12個のPPRモチーフ、配列番号297のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号298のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号299のアミノ酸配列からなるタンパク質が有する14個のPPRモチーフ、配列番号300のアミノ酸配列からなるタンパク質が有する14個のPPRモチーフ、配列番号301のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号302のアミノ酸配列からなるタンパク質が有する12個のPPRモチーフ、配列番号303のアミノ酸配列からなるタンパク質が有する19個のPPRモチーフ、配列番号304のアミノ酸配列からなるタンパク質が有する25個のPPRモチーフ、配列番号305のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号306のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号307のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、および配列番号308のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフからなる群より選択されるいずれか一つのPPRモチーフ
のいずれかにおいて、1に定義した(a)~(h)、好ましくは(b)~(h)からなる群より選択されるいずれかに基づいて一または複数個のアミノ酸を置換する、DNA塩基または特定の塩基配列を有するDNAに結合するタンパク質の設計方法。
[15] DNA塩基または特定の塩基配列を有するDNAに結合するタンパク質の設計方法であって:
タンパク質を、
 以下の式1の構造を有するPPRモチーフ:
Figure JPOXMLDOC01-appb-C000004
(式1中:
 Helix Aは、αヘリックス構造を形成可能な部分であり;
 Xは、存在しないかまたは1~9アミノ酸長からなる部分であり;
 Helix Bは、αヘリックス構造を形成可能な部分であり;そして
 Lは、2~7アミノ酸長からなる部分である。)
を、1個以上含み;
 タンパク質に含まれる一のPPRモチーフ(Mn)が、
Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
・PPRモチーフ(Mn)のC末端側に連続して次のPPRモチーフ(Mn+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
・PPRモチーフ(Mn)とそのC末端側の次のPPRモチーフ(Mn+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(Mn+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
・PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(Mn+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から2番目のアミノ酸
を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、DNA塩基または特定の塩基配列に応じたものとし、かつ下記の(a)~(h)、好ましくは(b)~(h)からなる群より選択される少なくとも一つを満たすようにする、方法:
(a) PPRモチーフ(Mn)の7番A.A.が、イソロイシン(I)である;
(b) PPRモチーフ(Mn)の9番A.A.が、アラニン(A)である;
(c) PPRモチーフ(Mn)の10番A.A.が、チロシン(Y)、フェニルアラニン(F)、またはトリプトファン(W)である;
(d) PPRモチーフ(Mn)の18番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;
(e) PPRモチーフ(Mn)の20番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(f) PPRモチーフ(Mn)の29番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である
(g) PPRモチーフ(Mn)の31番A.A.が、イソロイシン(I)、ロイシン(L)、またはバリン(V)である;
(h) PPRモチーフ(Mn)の32番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である。
[16] 15に記載の方法であって、1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせが、下記のいずれか:
 (1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)である;
 (1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
 (1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
に基づいて決定される、方法。
[17] 15に記載の方法であって、1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせが、下記のいずれか:
 (2-1)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-2)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-3)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-4)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-5)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
 (2-6)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
 (2-7)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-8)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
 (2-9)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
 (2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
 (2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
 (2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
 (2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
 (2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
 (2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;
に基づいて決定される、方法。
[18] (b)および(c)の組合せ、 (d)および(e)の組合せ、(a)、(g)ならびに(h)からなる群から選択される少なくとも一つ、好ましくは(b)および(c)の組合せ、 (d)および(e)の組合せ、 (g)ならびに(h)からなる群から選択される少なくとも一つを満たす、15~17のいずれか1項に記載の方法。
[19] (b)および(c)の組合せを満たし、かつ(d)および(e)の組合せ、(a)、(g)ならびに(h)からなる群から選択される少なくとも一つ、好ましくは(d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、18に記載の方法。
[20] (b)および(c)の組合せ、(d)および(e)の組合せ、(a)、ならびに(g)、好ましくは(b)および(c)の組合せ、(d)および(e)の組合せ、ならびに(g)を満たす、19に記載の方法。
[21] 15~20のいずれか1項に記載の方法であって、タンパク質がPPRモチーフを複数個含み、かつPPRモチーフが下記(i)~(viii)の何れかを満たす、方法:
 (i)  7番A.A.の少なくとも40%が、イソロイシン(I)である;
(ii) 9番A.A.の少なくとも36%が、アラニン(A)である;
(iii)10番A.A.の少なくとも37%が、チロシン(Y)である;
(iv) 18番A.A.の少なくとも19%が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;
(v)  20番A.A.の少なくとも21%が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(vi) 29番A.A.の少なくとも9%が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(vii) 31番A.A.の少なくとも16%が、イソロイシン(I)である;
(viii)32番A.A.の少なくとも15%が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である。
 または、PPRモチーフを複数個含み、DNA結合性PPRモチーフの含有率が、13%以上である、15~20のいずれか1項に記載の方法。
[22] 14~21のいずれか1項に記載された方法によってタンパク質を設計し、その設計されたタンパク質を製造する方法。
[23] 14~21のいずれか1項に記載された方法によってタンパク質を設計し、その設計されたタンパク質からなる領域と機能性領域とを連結して複合体を製造する方法。
[24] 10~13のいずれか1項に記載された複合体を用いること、または
 14~21のいずれか1項に記載された方法によってタンパク質を設計し、その設計されたタンパク質からなる領域と機能性領域とを連結して複合体を製造し、その製造された複合体を用いること
を特徴とする、ゲノムを編集する方法(ヒト個体での実施を除く。)。
[25] 23に記載された方法でゲノムを編集し、その編集されたゲノムを含む細胞を製造する方法(ヒト個体での実施を除く。)。
 本発明により、対象DNA塩基に結合可能なPPRモチーフおよびそれを含むタンパク質が提供できる。複数個のPPRモチーフを配することにより、任意の配列や長さを有する標的DNAに結合可能なタンパク質が提供できる。また、タンパク質をコードする核酸(DNA、RNA)、核酸を用いた形質転換体が提供できる。
 本発明により、特定の核酸配列に対する結合活性を有し、かつ特定の機能(例えば、DNAの切断、転写、複製、修復、合成、修飾等)を有するタンパク質とを含む複合体を調製することができる。複合体により、標的の切断、転写、複製、修復、合成、修飾など、機能性領域がもつ機能を利用したゲノム編集を実現することができる。またゲノム編集により、ゲノムの改変された細胞や生物が提供できる。
dPPRタンパク質を特徴付けるアミノ酸の、存在位置の特定。上段および中段は、すべての箇所における、dPPR分子9種類と既知のrPPR分子5個のPPRモチーフのアミノ酸出現頻度、下段はF検定の結果を示す。出現頻度の比較にはF検定を利用し、5%有意水準とした (p<0.06)。F検定の結果から、7番アミノ酸 (A.A.)、9番A.A.、10番A.A.、18番A.A.、20番A.A.、29番A.A.、31番A.A.、32番A.A.、ii番A.A.の残基におけるアミノ酸出現頻度に差が認められた。ii番A.A. についてはDNA塩基の認識に関わる部位であることから除外した。 改変型crPPRと天然型dPPRとのDNA結合力の比較。DNA結合能をDNA-Protein Pull down assay(実施例1参照)により解析した。crPPR、およびそれぞれのdPPRモチーフ特異的アミノ酸配列を挿入した改変型crPPRのDNA結合力はいずれも、天然型dPPR分子であるGUN1、pTAC2、p63、およびDG1よりも高いという結果が得られた。 各改変型rPPRとcrPPR(7L/31F)とのDNA結合力の比較。プルダウンされたタンパク質の発光輝度をInput 3 %の発光輝度で割って標準化することにより数値化した。各改変型rPPRとcrPPR(7L/31F)のDNA結合力の比較を行ったところ、A.A. 9A、A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yを導入した改変型rPPRについて有意差が認められた。縦軸:DNA結合力 (Pull down signal/Input 3% signal)、横軸:導入したアミノ酸配列、* : p<0.05, ** : p<0.01 性質の似たアミノ酸に置換した場合のDNA結合力の比較。A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yにおいて性質的に類似するアミノ酸を用いた場合においてもその効果を発揮するかを検討した。今回、18番A.A.と32番A.A.にはKと同様に塩基性アミノ酸であるヒスチジン (H)、アルギニン (R)、31番A.A.にはIと同じく分岐鎖を持つバリン (V)、ロイシン(L)、10番A.A.にはYと同じく芳香族基を持つフェニルアラニン (F) とトリプトファン(W) を導入した。各改変型rPPRとcrPPR(7L/31F)のDNA結合力を比較したところ、全ての改変型rPPRにおいて有意差が認められた。縦軸:DNA結合力 (Pull down signal/Input 3% signal)、横軸:導入したアミノ酸配列、* : p<0.05, ** : p<0.01 DNA結合性PPRモチーフの含有率が異なるタンパク質同士のDNA結合力の比較。今回、crPPR(7L/31F)のN末端側から2モチーフ (全体の25%)、および4モチーフ (全体の50%) をこれらのアミノ酸配列を有するモチーフとした改変型rPPRのDNA結合能を解析した。いずれの改変型rPPRにおいても有意差が認められた。縦軸:DNA結合力 (Pull down signal/Input 3% signal)、横軸:導入したアミノ酸配列・含有量、* : p<0.05, ** : p<0.01 天然型dPPRタンパク質とその改変型PPRタンパク質とのDNA結合力の比較。天然型dPPRであるP63とGUN1の全モチーフにA.A. 9A/10Y/18K/31I、およびA.A. 31I/32Kを導入した改変体においてDNA結合能が上昇するかを検討した。いずれのアミノ酸配列を導入したP63、GUN1についてもDNA結合力を上昇させた。縦軸:DNA結合力 (Pull down signal/Input 3% signal), 天然型dPPRとの比較値を算出、横軸:各dPPR、* : p<0.05, ** : p<0.01
[PPR モチーフおよびPPRタンパク質]
 本発明で「PPRモチーフ」というときは、特に記載した場合を除き、Web上のタンパク質ドメイン検索プログラム(例えば、Pfam、Prosite、Uniprotなど)でアミノ酸配列を解析した際に、Pfam(http://pfam.sanger.ac.uk/)においてPF01535、Prosite(http://www.expasy.org/prosite/)においてPS51375で得られるE値が所定値以下(望ましくはE-03)のアミノ酸配列をもつ30~38アミノ酸で構成されるポリペプチドをいう。また、Uniprot database(http://www.uniprot.org)でも、様々なタンパク質中のPPRモチーフが定義されている。
 本発明のPPRモチーフは、PPRモチーフのアミノ酸配列の保存性は低いが、下式で示すようなヘリックス、ループ、ヘリックス、ループ、の2次構造は良く保存されている。
Figure JPOXMLDOC01-appb-C000005
 本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、特に記載した場合を除き、本発明者らによる論文(Kobayashi K, et al., Nucleic Acids Res., 40, 2712-2723 (2012))および特許文献4に準ずる。すなわち、本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、PfamにおけるPF01535のアミノ酸番号とほぼ同義である一方で、PrositeにおけるPS51375のアミノ酸の番号から2引いた数(例;本発明の1番→PS51375の3番)に相当し、Uniprotで定義されるPPRモチーフのアミノ酸の番号からも2引いた数に相当する。
 詳しくは、本発明において、1番アミノ酸は式1で示すHelix Aが始まる最初のアミノ酸である。4番アミノ酸は、1番アミノ酸から数えて4番目のアミノ酸である。ただし、“ii”(-2)番のアミノ酸というときは、
・PPRモチーフ(Mn)のC末端側に連続して次のPPRモチーフ(Mn+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき、例えば、特許文献4の図4-1の(A)では、Motif Nos.1, 2, 3, 4, 6および7が該当する。)は、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸を指す;
・PPRモチーフ(Mn)とそのC末端側の次のPPRモチーフ(Mn+1)の間に1~20アミノ酸の非PPRモチーフ(PPRモチーフではない部分)が見いだされるとき(例えば、特許文献4の図4-1の(A)では、Motif Nos. 5および8が該当する。特許文献4の図4-3の(D)では、Motif Nos. 1, 2, 7および8が該当する。)は、次のPPRモチーフ(Mn+1)の1番アミノ酸に対して2個上流、すなわち-2番目のアミノ酸を“ii”(-2)番アミノ酸とする(特許文献4の図1を参照);そして
・PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないとき(例えば、特許文献4の図4-1では、(A)のMotif No. 9、(B)のMotif No. 11が該当する。)、もしくはC末端側の次のPPRモチーフ(Mn+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から2番目のアミノ酸を“ii”(-2)番のアミノ酸とする。
 あるPPRモチーフ(Mn)のLに含まれるアミノ酸である31番A.A.および32番A.A.は、そのモチーフのC末端側の次のPPRモチーフ(Mn+1)の1番アミノ酸を基準に位置を決定してもよい。具体的には、31番A.A.は次のPPRモチーフ(Mn+1)の1番アミノ酸に対して5個上流、32番A.A.は次のPPRモチーフ(Mn+1)の1番アミノ酸に対して4個上流としてもよい。このとき、PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないときは、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から5番目のアミノ酸を31番A.A.とし、4個上流を32番A.A.とする。
 本発明で「PPRタンパク質」または「PPR分子」というときは、特に記載した場合を除き、上述のPPRモチーフを1個以上有するタンパク質をいう。本明細書で「タンパク質」というときは、特に記載した場合を除き、ポリペプチド(複数のアミノ酸がペプチド結合した鎖)からなる物質全般をいい、比較的低分子のポリペプチドからなるものも含まれる。本発明で「アミノ酸」という場合、通常のアミノ酸分子を指すことがあるほか、ペプチド鎖を構成しているアミノ酸残基を指すことがある。いずれを指しているかは、文脈から、当業者には明らかである。
 PPRタンパク質は植物に多く存在し、シロイヌナズナでは500タンパク質、約5000モチーフが見いだせる。イネ、ポプラ、イワヒバ等、多くの陸上植物にも多様なアミノ酸配列のPPRモチーフおよびPPRタンパク質が存在する。いくつかのPPRタンパク質は、花粉(雄性配偶子)の形成に働く稔性回復因子として、雑種強勢のためのF1種子取得のための重要な遺伝子であることが知られている。稔性回復と類似して、いくつかのPPRタンパク質は種分化に作用していることが明らかになっている。ほとんどのPPRタンパク質は、ミトコンドリアか葉緑体中のRNAに働くことも分かっている。
 動物では、LRPPRCと同定されるPPRタンパク質の異常がLeigh syndromFrench Canadian(LSFC;リー症候群、亜急性壊死性脳脊髄症)を引き起こすことが知られている。
 本発明で、PPRモチーフのDNA塩基との結合性に関し、「選択的」というときは、特に記載した場合を除き、DNA塩基のいずれか一つの塩基に対する結合活性が、他の塩基に対する結合活性より高いことをいう。この選択性は、当業者であれば実験を企画し、確認することができるほか、特許文献4の実施例に開示されているように、計算により求めることもできる。
 本発明でDNA塩基というときは、特に記載した場合を除き、DNAを構成するデオキシリボヌクレオチドの塩基を指し、具体的には、アデニン(A)、グアニン(G)、シトシン(C)、またはチミン(T)のいずれかをいう。なおPPRタンパク質は、DNA中の塩基に対して選択性を有しうるが、核酸モノマーに結合するわけではない。
[本発明により提供される情報、新規dPPRタンパク質等]
 本発明により、DNAとの結合のために重要なアミノ酸の位置および種類に関する情報、それを利用したdPPRタンパク質の設計方法、PPRタンパク質にDNA塩基との結合性を付与する方法、PPRタンパク質のDNAとの結合性を高める方法、および当該設計方法、結合性の付与方法、および結合性を高める方法により得られた新規なdPPRタンパク質が提供される。本発明によって提供されるdPPRタンパク質、および本発明において用いられるdPPRタンパク質は、起源や取得経路等に特に制限はなく、例えば天然のもの、天然のdPPRを改変したもの、化学合成で得られたもの、これらの組み換え体等のいずれでもよく、また、融合タンパク質であってもよい。本発明の権利範囲には、特許請求の範囲において規定された要件を満たす限り、種々のdPPRタンパク質、およびそれを用いる態様が包含される。
 なおタンパク質を設計するとは、本発明により提供される情報にしたがって、タンパク質のアミノ酸配列を決定することを含む。またタンパク質を設計するとは、タンパク質を製造すると言い換えることもできる。タンパク質の設計方法またはタンパク質の製造方法は、次のステップを含む:
 タンパク質をコードする塩基配列を決定する工程;
 塩基配列を有するポリヌクレオチドを調製する工程;
 ポリヌクレオチドが導入され、タンパク質を産生可能な形質転換体を調製する工程。
 PPRタンパク質において、塩基選択的または配列特異的な結合のために重要なアミノ酸の位置に関する情報は、特許文献3および4に記載されている。さらに本発明者らの検討によると、これらの情報を前提にした上で、DNAとの結合に関しては、PPRモチーフ(Mn)の7番アミノ酸 (A.A.)、9番A.A.、10番A.A.、18番A.A.、20番A.A.、29番A.A.、31番A.A.、32番A.A.、 ii番A.A.、好ましくは9番A.A.、10番A.A.、18番A.A.、20番A.A.、29番A.A.、31番A.A.、32番A.A.、 ii番A.A.が重要である。これらに着目することにより、PPRタンパク質にDNA塩基との結合性を付与し、またはPPRタンパク質のDNAとの結合性を高めることができる。なおii番A.A. についてはDNA塩基の認識に関わる部位であることから、除外してもよい。
 あるPPRタンパク質の、DNAとの結合性の有無、および結合能の程度は、当業者であれば適切なDNA-Protein プルダウンアッセイ等を企画し、適宜評価することができる。具体的な実験条件や手順は、特許文献4の実施例や、本明細書の実施例の項を参考にすることができる。
 本発明により得られるPPRタンパク質のDNAとの結合能は、後掲非特許文献15(Coquille et al., 2014, An artificial PPR scaffold for programmable RNA recognition)で報告されているConsensus PPR (cPPR。crPPRと表すこともある。)においてA.A.7IとA.A.31Iを、それぞれロイシン (L)とフェニルアラニン (F) に置換した改変体(crPPR (7L/31F))よりも高い。
 また、本発明により得られるPPRタンパク質の、DNAとの結合能は、既存のDNA結合性のPPR、具体的にはp63( 配列番号1)、GUN1(配列番号2)、pTac2(配列番号3)、DG1(配列番号4)、およびGRP23(配列番号5)からなる群のいずれか一つのDNAとの結合能よりも高いことが好ましく、これらのすべてのタンパク質のDNAとの結合能よりも高いことがより好ましい。実質的に同じ配列を有するRNAとDNAとのうち、DNAにより選択的に結合することがさらに好ましい。
 PPRタンパク質にDNAとの結合性を付与し、またPPRタンパク質のDNAとの結合能を高めるためには、具体的には、塩基選択的にまたは塩基配列特異的に結合可能なPPRタンパク質において、PPRモチーフ(Mn)を、下記の(a)~(h)、好ましくは(b)~(h)からなる群より選択される少なくとも一つを満たすように設計することで達成できる:
(a) PPRモチーフ(Mn)の7番A.A.が、イソロイシン(I)である;
(b) PPRモチーフ(Mn)の9番A.A.が、アラニン(A)である;
(c) PPRモチーフ(Mn)の10番A.A.が、チロシン(Y)、フェニルアラニン(F)、またはトリプトファン(W)である;
(d) PPRモチーフ(Mn)の18番A.A.が、リシン(K)、アルギニン(R)、またはヒスチジン(H)である;
(e) PPRモチーフ(Mn)の20番A.A.が、グルタミン酸(E)、またはアスパラギン酸(D)である;
(f) PPRモチーフ(Mn)の29番A.A.が、グルタミン酸(E)、またはアスパラギン酸(D)である
(g) PPRモチーフ(Mn)の31番A.A.が、イソロイシン(I)、ロイシン(L)、バリン(V)である;
(h) PPRモチーフ(Mn)の32番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である。
 本発明者らの検討によると、あるPPRにおいて、適切な位置のアミノ酸を特定のものとすることによりDNA結合能を高めることができた場合、その特定のアミノ酸を性質の似たアミノ酸に代えても、同様の効果が得られる。グリシンとアラニン(アルキル鎖を有する)、バリンとロイシンとイソロイシン(分岐したアルキル鎖を有する)、フェニルアラニンとチロシンとトリプトファン(芳香族基を有する)、リシンとアルギニンとヒスチジン(二つのアミノ基を有し、塩基性である)、アスパラギン酸とグルタミン酸(二つのカルボキシル基を有し、酸性である)、アスパラギンとグルタミン(アミド基を有する)、セリンとトレオニン(水酸基を有する)、システインとメチオニン(硫黄を含む)は、性質が似ているということができる。
 本発明者らの検討によると、9番A.A.のAと10番A.A.のYが、同一モチーフ内で見られる傾向があり、また18番A.A.がK、R、またはHである場合は、その前のモチーフの20番A.A.がE、またはDである傾向があった。このような観点からは、好ましい態様の一つにおいては、PPRモチーフ(Mn)は、(b)および(c)の組合せ、(d)および(e)の組合せ、(a)、(g)ならびに(h)からなる群から選択される少なくとも一つ;より好ましくは(b)および(c)の組合せ、(d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす。また他の好ましい態様においては、PPRモチーフ(Mn)は、(b)および(c)の組合せを満たし、かつ(d)および(e)の組合せ、(a)、(g)ならびに(h)からなる群から選択される少なくとも一つ;より好ましくは(b)および(c)の組合せを満たし、かつ(d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす。さらに他の好ましい態様においては、PPRモチーフ(Mn)は、(b)および(c)の組合せ、(d)および(e)の組合せ、(a)、ならびに(g);より好ましくは(b)および(c)の組合せ、(d)および(e)の組合せ、ならびに(g)を満たす。
 設計されるPPRタンパク質は、PPRモチーフ(Mn)を1個以上含むが、好ましくは2~30個含み、より好ましくは5~25個含み、さらに好ましくは9~15個含む。
 複数のPPRモチーフを含むタンパク質の場合、含まれるモチーフのすべてが上記の条件を満たさなくても、一定の割合で満たすように設計すれば、PPRタンパク質にDNA塩基との結合性を付与し、またはPPRタンパク質のDNAとの結合性を高めることができる。例えば、下記(i)~(viii)の何れか(例えばいずれか一つ、好ましくはいずれか3つ、より好ましくはいずれか5つ、さらに好ましくはすべて)を満たす、複数のPPRモチーフを含むタンパク質は、本発明の好ましい態様の一つである:
(i)  7番A.A.の少なくとも40%、好ましくは少なくとも44%が、イソロイシン(I)である;
(ii) 9番A.A.の少なくとも36%、好ましくは少なくとも48%が、アラニン(A)である;
(iii)10番A.A.の少なくとも37%、好ましくは少なくとも49%が、チロシン(Y)である;
(iv) 18番A.A.の少なくとも19%が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;
(v)  20番A.A.の少なくとも21%が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(vi) 29番A.A.の少なくとも9%が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
(vii) 31番A.A.の少なくとも16%が、イソロイシン(I)である;
(viii)32番A.A.の少なくとも15%が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である。
 ここで表される割合(%)は[条件を満たすPPRモチーフの数]/[タンパク質に含まれるPPRモチーフの総数]×100で計算される。
 条件を満たすPPRモチーフとは、すなわちDNA結合性PPRモチーフであり、上記の(b)~(h)からなる群より選択される少なくとも一つを満たすPPRモチーフをいう。上記の割合DNA結合性PPRモチーフは、より特定すると「DNA結合性PPRモチーフの含有率」と称することができ、[DNA結合性PPRモチーフの数]/[(DNA結合性PPRモチーフの数)+(DNA結合性PPRモチーフではないPPRモチーフの数)]×100で計算される。DNA結合性PPRモチーフではないPPRモチーフとは、上記の(b)~(h)のすべてを満たさないPPRモチーフ、例えばcrPPR(7L/31F)をいう。
 本発明者らのさらなる検討では、8個のPPRモチーフを含むタンパク質において、DNA結合性PPRモチーフの含有率が25%以上である場合に、含有率が0%である対照タンパク質と比較して、優位にDNA結合能が上昇した一方で、DNA結合性PPRモチーフの含有率が12.5%である場合には、含有率が0%である対照タンパク質と比較した優位なDNA結合能の上昇は見られなかった。。したがって、PPRタンパク質においては、PPRモチーフを複数個含み、DNA結合性PPRモチーフの含有率が13%以上であることが好ましく、15%以上であることがより好ましく、25%以上であることがさらに好ましく、50%以上であることがさらに好ましく、75%以上であることがさらに好ましく、100%であることがさらに好ましい。
 PPRモチーフを複数個含むタンパク質におけるDNA結合PPRの位置は、適宜とすることができるが、N末端により近い位置が好ましい。またPPRモチーフを複数個含むタンパク質において、複数個のDNA結合性PPRとDNA結合性PPRモチーフではないPPRモチーフが存在する場合は、DNA結合性PPRモチーフは連続して配置してもよいし、DNA結合性PPRモチーフの間にDNA結合性PPRモチーフではないPPRモチーフを配置してもよいが、DNA結合性PPRモチーフを連続して配置することが好ましいと考えられる。例えば、8個のPPRモチーフを含むタンパク質において、DNA結合性PPRモチーフの含有率が25%であるときはN末端側の2個の連続するPPRモチーフをDNA結合性PPRモチーフとすることが好ましく、DNA結合性PPRモチーフの含有率が50%であるときはN末端側の4個の連続するPPRモチーフをDNA結合性PPRモチーフとすることが好ましく、DNA結合性PPRモチーフの含有率が75%であるときはN末端側の6個の連続するPPRモチーフをDNA結合性PPRモチーフとすることが好ましいと考えられる。
 上述した、PPRタンパク質にDNAとの結合性を付与し、またPPRタンパク質のDNAとの結合能を高めるための方法は、DNA結合性のPPRタンパク質を新規に設計するために用いることができるのみならず、既存のPPRタンパク質にDNA結合能を付与するために、または既存のPPRタンパク質のDNA結合能を上昇させるために、用いることができる。
 なお、本発明のPPRタンパク質にDNA塩基との結合性を付与し、またはPPRタンパク質のDNAとの結合性を高めるための設計方法の前提となる、特許文献3および4に記載されている、PPRタンパク質において、塩基選択的または配列特異的な結合のために重要なアミノ酸の位置および種類に関する情報を、下記に示す。
 (1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)であり、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*GD)、
・好ましくは、グルタミン酸(E)とアスパラギン酸(D)との組み合わせ(EGD)、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*GN)、
・好ましくは、グルタミン酸(E)とアスパラギン(N)との組み合わせ(EGN)、または
・任意のアミノ酸とセリン(S)との組み合わせ(*GS)、であってもよい;
 (1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*IN)、であってもよい;
 (1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*LD)、または
・任意のアミノ酸とリシン(K)との組み合わせ(*LK)、であってもよい;
 (1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*MD)、または
・イソロイシン(I)とアスパラギン酸(D)との組み合わせ(IMD)、であってもよい;
 (1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*ND)、
・フェニルアラニン(F)、グリシン(G)、イソロイシン(I)、トレオニン(T)、バリン(V)、チロシン(Y)のいずれかとアスパラギン酸(D)との組み合わせ(FND、GND、IND、TND、VND、またはYND)、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*NN)、
・イソロイシン(I)、セリン(S)、バリン(V)のいずれかとアスパラギン(N)との組み合わせ(INN、SNN、またはVNN)、
・任意のアミノ酸とセリン(S)との組み合わせ(*NS)、
・バリン(V)とセリン(S)との組み合わせ(VNS)、
・任意のアミノ酸とトレオニン(T)との組み合わせ(*NT)、
・バリン(V)とトレオニン(T)との組み合わせ(VNT)、
・任意のアミノ酸とトリプトファン(W)との組み合わせ(*NW)、または
・イソロイシン(I)とトリプトファン(W)との組み合わせ(INW)、であってもよい;
 (1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*PD)、
・フェニルアラニン(F)とアスパラギン酸(D)との組み合わせ(FPD)、または
・チロシン(Y)とアスパラギン酸(D)との組み合わせ(YPD)、であってもよい;
 (1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*SN)、
・フェニルアラニン(F)とアスパラギン(N)との組み合わせ(FSN)、または
・バリン(V)とアスパラギン(N)との組み合わせ(VSN)、であってもよい;
 (1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・任意のアミノ酸とアスパラギン酸(D)との組み合わせ(*TD)、
・バリン(V)とアスパラギン酸(D)との組み合わせ(VTD)、
・任意のアミノ酸とアスパラギン(N)との組み合わせ(*TN)、
・フェニルアラニン(F)とアスパラギン(N)との組み合わせ(FTN)、
・イソロイシン(I)とアスパラギン(N)との組み合わせ(ITN)、または
・バリン(V)とアスパラギン(N)との組み合わせ(VTN)、であってもよい;
 (1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよく、一例として1番A.A.と“ii”(-2)番A.A.の組み合わせとしては、
・イソロイシン(I)とアスパラギン酸(D)との組み合わせ(IVD)、
・任意のアミノ酸とグリシン(G)との組み合わせ(*VG)、または
・任意のアミノ酸とトレオニン(T)との組み合わせ(*VT)、であってもよい。
 より詳細な、塩基選択的または配列特異的な結合のために重要なアミノ酸の位置および種類に関する情報を、下記に示す。なお下記では、DNA塩基選択的、DNA配列特異的な結合の場合を例に説明するが、当業者であれば、その説明を適宜、RNA塩基およびRNA配列に当てはめて理解することができる。
 (2-1)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-2)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-3)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-4)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-5)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
 (2-6)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
 (2-7)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-8)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
 (2-9)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
 (2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
 (2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
 (2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
 (2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
 (2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
 (2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
 (2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
 (2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
 (2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
 (2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
 (2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;に基づいて決定される、タンパク質であって、選択的なDNA塩基結合能を有する。
 なお塩基選択的または配列特異的な結合のための設計に際しては、1番A.A.、4番A.A.および“ii”(-2)番A.A.のアミノ酸の組み合わせ以外に配慮してもよい。例えば、前掲特許文献2に記載された8番および12番のアミノ酸の考慮は、DNA結合活性を呈するために重要である場合がある。本発明者らの検討に拠ると、あるPPRモチーフの8番アミノ酸と、それと同じPPRモチーフの12番アミノ酸とが、DNA結合において協同している可能性がある。8番アミノ酸は、塩基性アミノ酸、好ましくはリシン、または酸性アミノ酸、好ましくはアスパラギン酸とすることができ、12番アミノ酸は、塩基性アミノ酸または中性アミノ酸または疎水性アミノ酸とすることができる。
 目的のタンパク質の設計に際しては、PPRモチーフ中の重要な位置のアミノ酸以外の部分は、配列番号1から5に記したようなDNA結合型PPRタンパク質中の天然型のPPRモチーフや、配列番号284に示したcrPPRモチーフの配列情報を参考にすることができる。また、全体として天然型や既存の配列を用い、重要な位置のアミノ酸だけを置換することにより、設計してもよい。
 このような設計に際して利用可能な天然型または既存の配列の例を下記に示す。
・配列番号1~5のいずれか一のアミノ酸配列からなるタンパク質
・配列番号291~308のいずれか一のアミノ酸配列からなるタンパク質
・配列番号1の230~541位のアミノ酸配列、配列番号2の234~621位のアミノ酸配列、配列番号3の106~632位のアミノ酸配列、配列番号4の106~632位のアミノ酸配列、および配列番号5の256~624位のアミノ酸配列からなる群より選択されるいずれか一のアミノ酸配列を有するタンパク質。
・配列番号1のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号2のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフ、配列番号3のアミノ酸配列からなるタンパク質が有する15個のPPRモチーフ、配列番号4のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号5のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフからなる群より選択されるいずれか一つのPPRモチーフ。
・配列番号291の167~482位のアミノ酸配列、配列番号292の156~575位のアミノ酸配列、配列番号293の243~554位のアミノ酸配列、配列番号294の140~489位のアミノ酸配列、配列番号295の78~419位のアミノ酸配列、配列番号296の122~545位のアミノ酸配列、配列番号297の256~624位のアミノ酸配列、配列番号298の48~362位のアミノ酸配列、配列番号299の198~689位のアミノ酸配列、配列番号300の89~578位のアミノ酸配列、配列番号301の470~911位のアミノ酸配列、配列番号302の156~575位のアミノ酸配列、配列番号303の108~775位のアミノ酸配列、配列番号304の226~1137位のアミノ酸配列、配列番号305の145~496位のアミノ酸配列、配列番号306の104~538位のアミノ酸配列、配列番号307の151~502位のアミノ酸配列、および配列番号308の274~660位のアミノ酸配列からなる群より選択されるいずれか一つのアミノ酸配列を有するタンパク質。
・配列番号291のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号292のアミノ酸配列からなるタンパク質が有する6個のPPRモチーフ、配列番号293のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号294のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号295のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号296のアミノ酸配列からなるタンパク質が有する12個のPPRモチーフ、配列番号297のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号298のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号299のアミノ酸配列からなるタンパク質が有する14個のPPRモチーフ、配列番号300のアミノ酸配列からなるタンパク質が有する14個のPPRモチーフ、配列番号301のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号302のアミノ酸配列からなるタンパク質が有する12個のPPRモチーフ、配列番号303のアミノ酸配列からなるタンパク質が有する19個のPPRモチーフ、配列番号304のアミノ酸配列からなるタンパク質が有する25個のPPRモチーフ、配列番号305のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号306のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号307のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、および配列番号308のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフからなる群より選択されるいずれか一つのPPRモチーフ。
 本発明は、上で説明した情報を利用したdPPRタンパク質の設計方法、PPRタンパク質にDNA塩基との結合性を付与する方法、PPRタンパク質のDNAとの結合性を高める方法により得られた、新規なdPPRタンパク質を提供する。このようなdPPRタンパク質の例は、配列番号285~290のいずれか一つのアミノ酸配列を有するPPRモチーフを、少なくとも一つ含むものである。好ましい態様においては、配列番号285~290のいずれか一つのアミノ酸配列を有するPPRモチーフを複数個含んでいてもよく、好ましくは2~30個含み、より好ましくは5~25個含み、さらに好ましくは9~15個含む。
 本発明はまた、新規なPPRモチーフまたはPPRタンパク質として、次のものを提供する。
・配列番号7~214のいずれか一つのアミノ酸配列を有するPPRモチーフ
・配列番号291の167~482位のアミノ酸配列、配列番号292の156~575位のアミノ酸配列、配列番号293の243~554位のアミノ酸配列、配列番号294の140~489位のアミノ酸配列、配列番号295の78~419位のアミノ酸配列、配列番号296の122~545位のアミノ酸配列、配列番号297の256~624位のアミノ酸配列、配列番号298の48~362位のアミノ酸配列、配列番号299の198~689位のアミノ酸配列、配列番号300の89~578位のアミノ酸配列、配列番号301の470~911位のアミノ酸配列、配列番号302の156~575位のアミノ酸配列、配列番号303の108~775位のアミノ酸配列、配列番号304の226~1137位のアミノ酸配列、配列番号305の145~496位のアミノ酸配列、配列番号306の104~538位のアミノ酸配列、配列番号307の151~502位のアミノ酸配列、および配列番号308の274~660位のアミノ酸配列からなる群より選択されるいずれか一つのアミノ酸配列を有する、PPRタンパク質。
・配列番号335~361のいずれか一つのアミノ酸配列からなるタンパク質、およびそれらに含まれるPPRモチーフ。
・配列番号424~427のいずれか一つのアミノ酸配列からなるタンパク質、およびそれらに含まれるPPRモチーフ。
 なお、本発明の範囲には、既存のp63( 配列番号1)、GUN1(配列番号2)、pTac2(配列番号3)、DG1(配列番号4)、およびGRP23(配列番号5)自体は含まれない。また配列番号291~308のアミノ酸配列からなるタンパク質(At1g10910, At1g26460, At3g15590, At3g59040, At5g10690,  At5g24830, At5g67570, At3g42630, At5g42310, At1g12700, At1g30610, At2g35130, At2g41720, At3g18110, At3g53170, At4g21170, At5g48730, At5g50280)自体は含まれない。
[dPPRタンパク質の利用]
 本発明により提供されるdPPRタンパク質は、機能性領域を連結し、複合体とすることができる。機能性領域とは一般的に、生体内または細胞内で特定の生物学的機能、例えば酵素機能、触媒機能、阻害機能、亢進機能などの機能を有する部分、または標識としての機能を有する部分をいう。そのような領域は、例えば、タンパク質、ペプチド、核酸、生理活性物質、薬剤からなる。
 本発明においては、PPRタンパク質に対して、機能性領域を連結させることにより、PPRタンパク質により発揮される標的DNA配列結合機能と、機能性領域により発揮される機能とを、組み合わせて発揮させることができる。例えば、機能性領域として、DNA切断機能を有するタンパク質またはその機能性ドメイン(例えば、制限酵素FokIのヌクレアーゼドメイン、配列番号6)を使用することにより、複合体を人工DNA切断酵素とすることができる。
 このような複合体を製造するためには、当該技術分野において一般的に利用可能である手法を利用することができ、複合体を1つのタンパク質分子として合成する方法や、複数のタンパク質の部材を別途合成したのちにそれらの部材を組み合わせて複合体を形成する方法などが知られている。
 一例として複合体を1つのタンパク質分子として合成する方法の場合、PPRタンパク質のC末端、またはN末端に、アミノ酸リンカーを介して切断酵素を融合したタンパク質複合体を設計し、そのタンパク質複合体を発現するための発現用ベクター構造体を構築し、該構造体から目的の複合体を発現させることができる。この様な調製方法については、特開2013-94148号公報に記載された方法などを使用することができる。
 PPRタンパク質と機能性領域タンパク質との連結は、アミノ酸によるリンカーを介した連結、アビジン-ビオチンなどの特異的親和性を介した連結、その他の化学的リンカーを介した連結など、当該技術分野において知られているいずれの連結手段を用いてもよい。
 本発明において利用することができる機能性領域としては、様々な機能の内、DNAの切断、転写、複製、修復、合成、修飾などのいずれかの機能を付与することができる領域のことをいう。本発明の特徴であるPPRモチーフの配列を調整し、標的とするDNAの塩基配列を定めることにより、ほとんどすべてのDNA配列を標的として利用することができ、その標的で、DNAの切断、転写、複製、修復、合成、修飾など、機能性領域の持つ機能を利用したゲノム編集を実現することができる。
 例えば、機能性領域の機能がDNAの切断機能である場合、本願発明において調製されるPPRタンパク質部分とDNAの切断領域が連結された複合体が提供される。この様な複合体は、PPRタンパク質部分により標的とするDNAの塩基配列を認識したのち、DNAの切断領域によりDNAを切断する、人工DNA切断酵素として機能することができる。
 本発明において使用することができる切断機能を有する機能性領域の例は、エンドデオキシリボヌクレアーゼとして機能するデオキシリボヌクレアーゼ(DNase)である。この様なDNaseの例としては、DNase A(例えば、bovine pancreatic ribonuclease A: PDB 2AAS)、DNase H、DNase Iなどのエンドデオキシリボヌクレアーゼ、あるいは種々の細菌由来の制限酵素(例えば、FokI)やそのヌクレアーゼドメインを利用することができる。このようなPPRタンパク質と機能性領域とを含む複合体は天然には存在せず、新規なものである。
 機能性領域の機能が転写制御機能である場合、本願発明において調製されるPPRタンパク質部分とDNAの転写制御領域が連結された複合体が提供される。この様な複合体は、PPRタンパク質部分により標的とするDNAの塩基配列を認識したのち、目的のDNAの転写を制御する、人工転写制御因子として機能することができる。
 本発明において使用することができる転写制御機能を有する機能性領域は、転写を活性化するドメインであってもよく、転写を抑制するドメインであってもよい。転写制御ドメインの例は、VP16、VP64、TA2、STAT-6、p65である。このようなPPRタンパク質と転写制御ドメインとを含む複合体は天然には存在せず、新規なものである。
 さらに本発明により得られる複合体は、生体内または細胞内に、DNA配列特異的に機能性領域をデリバリーし、機能させることができる可能性がある。これにより、ジンクフィンガータンパク質(前掲非特許文献1および非特許文献2)やTAL effector(前掲非特許文献3、前掲特許文献1)を利用したタンパク質複合体と同様、生体内または細胞内において、DNA配列特異的に改変・破壊を行うことができるようになり、DNA切断およびその機能を利用したゲノム編集という新たな機能を付与できることとなる。具体的には、特定の塩基と結合することができるPPRモチーフを複数連結したPPRタンパク質により、特定のDNA配列を認識することができる。そして、PPRタンパク質に連結した機能性領域により、機能性領域の持つ機能を利用して、認識したDNA領域のゲノム編集を実現することができる。
 さらにはDNA配列特異的に結合するPPRタンパク質に対して薬物を結合することにより、そのDNA配列周辺を標的として、薬物を送達することができる可能性がある。したがって、本発明は、DNA配列特異的な機能性物質の送達方法を提供するものでもある。
 本発明により、PPRタンパク質はDNAへの結合能が高く、DNA上の特異的な塩基を認識し、その結果として塩基多型を導入すること、または塩基多型に起因した疾患または状態を処置することが期待できる他、上述した様な他の機能性領域と組み合わせることを通じて、DNAを切断し、ゲノム編集を実現するための機能の改変・向上に資することができると考えられる。
 また、PPRタンパク質のC末端側には、外来性のDNA切断酵素を融合させることができる。あるいは、N末端側のPPRモチーフの結合DNA塩基選択性を改良することで、DNA配列特異的なDNA切断酵素を構成することもできる。また、GFP等の標識部分を連結した複合体は、所望のDNAを生体内で可視化するために用いることもまた可能である。
[実施例1: 新規dPPR分子の収集]
 既知のdPPRタンパク質は先行特許 (前掲特許文献4) に記載されているP63、GUN1、pTAC2、GRP23、DG1しか存在せず、PPR技術に基づいた人工核酸結合モジュールを汎用化、改良するための情報を得ることは困難であった。そこで今回、DNA結合能を有するPPRタンパク質のスクリーニングを行い、dPPRタンパク質を拡充することとした。これまで偶発的に発見されたdPPR分子の遺伝子はイントロンを含むが、rPPR遺伝子はほぼ全てイントロンを含まない。これを指標に、モデル植物であるシロイヌナズナ全ゲノム配列を解析したところ、2個以上のイントロンを含むPPR遺伝子は42種類であった。本実施例では、この42種類の潜在的dPPR分子のDNA結合能を解析し、新規dPPR分子の同定を試みた。
(実験方法)
1. dPPR発現ベクターの構築
 シロイヌナズナのcDNAを保有する理化学研究所より、10種類の潜在的dPPRの遺伝子を得た。残りの32種類については、GENEWIZ社の遺伝子合成を利用した。入手した42種類の遺伝子のPPRモチーフに相当する領域をコムギ無細胞タンパク質合成用の発現ベクターpEU-E01 (CellFree Science) に組み込んだ。さらに、潜在的dPPR分子の遺伝子の5'末端側にチオレドキシンをコードする遺伝子を、3'末端側にHisタグをコードする遺伝子をそれぞれ挿入した。
2. dPPRタンパク質の合成
 SP6 RNA Polymerase (Promega) を利用し、潜在的dPPR分子のmRNAを得た。反応条件は製品情報に記載されているプロトコルに従った。WEPRO7240H (CellFree Science) を利用し、潜在的dPPRタンパク質を得た。反応条件は製品情報に記載されているプロトコルに従った。
3. DNA-Protein Pull down assay
 潜在的dPPRタンパク質に、ウシ胸腺由来2本鎖DNAセルロースビーズ (Sigma-Aldrich)2 mg、緩衝溶液 (20 mM HEPES-KOH:pH 7.9, 60 mM NaCl, 12.5 mM MgCl2, 0.3% TritonX-100) を加え、4 ℃条件下で1時間反応させた。洗浄液 (10 mM Tris-HCl: pH8.0, 300 mM NaCl, 0.3% TritonX-100) で3回洗浄した後、5x SDS-PAGE Sample緩衝液を添加し95 ℃で5分間熱処理し、潜在的dPPRタンパク質を溶出した。
4. ウエスタンブロット
 10-20 %アクリルアミドゲル (ATTO) を用いてタンパク質を分離し、ニトロセルロース膜に転写した。転写緩衝液にはEzFastBlot (ATTO) を用いた。0.3 %スキムミルク溶液でブロッキングを行った後、HRP標識抗His tag抗体 (MBL) 0.5μg/mlと室温条件下で1時間反応させた。検出にはイモビロンウエスタン化学発光HRP基質 (Millipore) を利用した。化学発光の検出にはVersaDoc (BioRad) を使用した。
(結果・考察)
 潜在的dPPRタンパク質のDNA結合力を陰性コントロールとして用いた既知のrPPR OTP80(Hammani et al., A Study of New Arabidopsis Chloroplast RNA Editing Mutants Reveals General Features of Editing Factors and Their Target Sites, The Plant Cell, Vol. 21: 3686-3699, 2009)と比較した。プルダウンされたタンパク質の発光輝度をInput 1 %のそれで割って標準化した数値に基づき、5%有意水準 (p<0.06) としたT検定によりOTP80との比較を行ったところ、18種類の潜在的dPPRについて有意差が認められた。この結果から、これら18種類のPPRタンパク質がdPPRタンパク質であることが判明した。18種類のdPPRタンパク質のPPRモチーフの配列(1, 2, 3...の順に記載)を下表に示した。
Figure JPOXMLDOC01-appb-T000006
Figure JPOXMLDOC01-appb-T000007
Figure JPOXMLDOC01-appb-T000008
Figure JPOXMLDOC01-appb-T000009
[実施例2: dPPRモチーフ特異的アミノ酸配列解析]
 実施例1により同定したdPPRタンパク質が有するモジュールのアミノ酸配列情報を基に、dPPRモチーフ特異的アミノ酸配列を解析した。
 まず実施例1で同定した18種類のdPPRタンパク質から、F検定の際にrPPRタンパク質のモチーフ数とある程度合わせるために9種類を選定した。具体的には、dPPRタンパク質を、DNA結合力をOTP80とT-TESTで比較して得た数値に基づき0.05-0.01、0.01-0.001、<0.001の3つのグループに分類し、各グループから無作為に3つ抽出することにより、9種類を選定した。dPPR分子9種類と下表の既知のrPPR分子5個のPPRモチーフ(1, 2, 3...の順に記載)のアミノ酸出現頻度をすべての箇所において比較し、dPPRタンパク質を特徴付けるアミノ酸が存在する位置の特定を試みた。検定にはF検定を利用し、5%有意水準とした (p<0.06)。
Figure JPOXMLDOC01-appb-T000010
Figure JPOXMLDOC01-appb-T000011
 F検定の結果(図1)から、7番アミノ酸 (A.A.)、9番A.A.、10番A.A.、18番A.A.、20番A.A.、29番A.A.、31番A.A.、32番A.A.、 ii番A.A.の残基におけるアミノ酸出現頻度に差が認められた。ii番A.A. についてはDNA塩基の認識に関わる部位であることから除外した(前掲特許文献4)。
 次に、これら位置におけるアミノ酸出現頻度を算出し、dPPRとrPPRで最も正の方向に差が大きいアミノ酸を確認した。その結果、dPPR分子においては7番A.A.のI、9番A.A. のA、10番A.A.のY、18番A.A.のK、20番A.A.のE、29番A.A.のE、31番A.A.のI、32番A.A.のKが上昇することが明らかになった。これらの結果から、上記アミノ酸をdPPRモチーフ特異的アミノ酸配列とした。
 新規dPPRタンパク質 (データセットに使用した9種類)と、既知のrPPRにおけるdPPR特異的アミノ酸の含有率(%)を下表に示した。
Figure JPOXMLDOC01-appb-T000012
[実施例3-1: dPPRモチーフ特異的アミノ酸配列に基づく人工核酸結合モジュール構築法の確立1]
 本実施例では、dPPR特異的アミノ酸配列によりPPRタンパク質のDNA結合能が上昇するかを検証する目的で、dPPR特異的アミノ酸配列を組み込んだ改変型rPPRのDNA結合能を調べた。基となるrPPRには、非特許文献15(Coquille et al., 2014, An artificial PPR scaffold for programmable RNA recognition)において報告されているConsensus PPR (cPPR) を用いた。なお、cPPRは、RNA結合性タンパク質として知られており(そのため、crPPRと表すことがある。)、DNAに結合するかどうかは知られていなかった。crPPRの改変にはGenewiz社の遺伝子合成を利用した。改変型crPPRのDNA結合能は、実施例1で用いた手法により解析した。なお、crPPRの標的配列はAAAAAAAAである。
 なお、AA9AとAA10Yは同一モチーフ内で変化している傾向があったため、今回は組み合わせて挿入した。また、AA18Kは、その前のモチーフにAA20Eが組み込まれている傾向があったため、組み合わせて挿入した。全dPPR (データセットに使用したもの以外のdPPRタンパク質分子も含む18種類) からの集計において、同一モチーフ内にAA9Aを持つAA10Yの含有率は43.75%であり、1つ前のモチーフ内にAA 20Eを持つAA18Kの含有率は41.3%であった。cPPRおよび本実施例で調製した改変型のPPRモチーフの配列を下表に示した(1, 2, 3...の順に記載)。
Figure JPOXMLDOC01-appb-T000013
(結果・考察)
 DNA結合力の比較は、プルダウンされたタンパク質の発光輝度をInput 3 %のそれで割って標準化した数値に基づいて行った。結果を図2に示した。
 crPPR、およびそれぞれのdPPRモチーフ特異的アミノ酸配列を挿入した改変型crPPRのDNA結合力はいずれも、天然型dPPR分子であるGUN1、pTAC2、p63、およびDG1よりも高いという結果が得られた。これは、本研究開発において見出したdPPRモチーフ特異的アミノ酸配列はPPRタンパク質のDNA結合能に関与することを示す。
 以上の本実施例における試験結果から、dPPRモチーフ特異的アミノ酸配列を挿入することによりPPRタンパク質にDNA結合能を付与させることが可能であることを発見した。
[実施例3-2: dPPRモチーフ特異的アミノ酸配列に基づく人工核酸結合モジュール構築法の確立2]
 上述のcPPR(非特許文献15)はRNA結合性であるが、A.A. 7IとA.A. 31Iを有しているため、rPPRのアミノ酸出現頻度を参考にそれぞれをロイシン (L)とフェニルアラニン (F) に置換した改変体を用いた。本明細書においては、この改変体をConsensus RNA Binding PPR (7L/31F) (crPPR (7L/31F)) と記載する。なお、A.A. 9AとA.A.10Yは同一モチーフ内で変化している傾向があったため、これらに関しては組み合わせたものについても検討した (データセットに使用したもの以外のdPPRも含む18種類からの集計において、同一モチーフ内にA.A. 9Aを持つA.A. 10Yの割合は43.75%であった)。
(実験方法)
1. 改変型crPPR発現ベクターの構築
 crPPR(7L/31F)、および改変型rPPRを組み込んだ遺伝子は、GENEWIZ社の遺伝子合成を利用した。入手した遺伝子をコムギ無細胞タンパク質合成用の発現ベクターpEU-E01 (CellFree Science) に組み込んだ。さらに、PPR遺伝子の5'末端側にチオレドキシンをコードする遺伝子を、3'末端側にHisタグをコードする遺伝子をそれぞれ挿入した。
2. dPPRタンパク質の合成
 SP6 RNA Polymerase (Promega) を利用し、dPPR分子のmRNAを得た。反応条件は製品情報に記載されているプロトコルに従った。WEPRO7240H (CellFree Science) を利用し、各PPRのタンパク質を得た。反応条件は製品情報に記載されているプロトコルに従った。
3. DNA-Protein Pull down assay
 各改変型rPPR、およびcrPPR(7L/31F)に、ウシ胸腺由来2本鎖DNAセルロースビーズ (Sigma-Aldrich) 2 mg、緩衝溶液 (20 mM HEPES-KOH:pH 7.9, 60 mM NaCl, 12.5 mM MgCl2, 0.3% TritonX-100) を加え、4 ℃条件下で1時間反応させた。洗浄液 (10 mM Tris-HCl: pH8.0, 300 mM NaCl, 0.3% TritonX-100) で3回洗浄した後、5x SDS-PAGE Sample緩衝液を添加し95 ℃で5分間熱処理して溶出した。
4. ウエスタンブロット
 5-20 %アクリルアミドゲル (和光純薬) を用いてタンパク質を分離し、ニトロセルロース膜に転写した。転写緩衝液にはアクアブロット高効率転写バッファー (和光純薬) を用いた。5 %スキムミルク溶液でブロッキングを行った後、HRP標識抗His tag抗体 (和光純薬)1 μg/mlと室温条件下で1時間反応させた。検出にはイムノスターゼータ (和光純薬) を利用した。化学発光の検出にはAmersham Imager 600 (GEヘルスケア) およびLAS-4000 (富士フイルム) を使用した。
(結果・考察)
 DNA結合力は、プルダウンされたタンパク質の発光輝度をInput 3 %の発光輝度で割って標準化することにより数値化した。5 %有意水準 (p<0.06) としたT検定により各改変型rPPRとcrPPR(7L/31F)のDNA結合力と比較を行ったところ、A.A. 9A、A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yを導入した改変型rPPRについて有意差が認められた(図3)。この結果から、これらのアミノ酸配列を導入することによりPPRにDNA結合能を付与できることが明らかになった。
 crPPR (7L/31F) および本実施例で調製した改変型のPPRモチーフの配列を下表に示した。
Figure JPOXMLDOC01-appb-T000014
Figure JPOXMLDOC01-appb-T000015
[実施例4: 性質的が類似するアミノ酸の評価]
 A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yにおいて性質的に類似するアミノ酸を用いた場合においてもその効果を発揮するかを検討した。今回、18番A.A.と32番A.A.にはKと同様に塩基性アミノ酸であるヒスチジン (H)、アルギニン (R)、31番A.A.にはIと同じく分岐鎖を持つバリン (V)、ロイシン(L)、10番A.A.にはYと同じく芳香族基を持つフェニルアラニン (F) とトリプトファン(W) を導入した。DNA結合能の評価は実施例3で用いた手法により解析した。
(結果・考察)
 5 %有意水準 (p<0.06) としたT検定により各改変型rPPRとcrPPR(7L/31F)のDNA結合力を比較したところ、全ての改変型rPPRにおいて有意差が認められた(図4)。以上の結果から、性質的に類似するアミノ酸を使用した場合においてもDNA結合能の付与が可能であることが明らかになった。
 本実施例で調製した改変型rPPRモチーフの配列を下表に示した。
Figure JPOXMLDOC01-appb-T000016
[実施例5: DNA結合能に必要なA.A. 9A、A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yの含有率評価]
 DNA結合能の付与に必要なA.A. 9A、A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yの含有量 (率) を検討した。ここでの含有量 (率) は、PPR分子内において上記アミノ酸配列を有するモチーフの量 (割合) を指す。今回、crPPR(7L/31F)のN末端側から2モチーフ (全体の25%)、および4モチーフ (全体の50%) をこれらのアミノ酸配列を有するモチーフとした改変型rPPRのDNA結合能を解析した。DNA結合能の評価は実施例3で用いた手法により解析した。
(結果・考察)
 5 %有意水準 (p<0.06) としたT検定により各改変型rPPRとcrPPR(7L/31F)のDNA結合力を比較したところ、いずれの改変型rPPRにおいても有意差が認められた(図5)。以上の結果から、A.A. 9A、A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yを導入したPPRモチーフの含有量を2個以上 (もしくは全体の25%以上) とすることによりDNA結合能を付与できることが明らかになった。
 本実施例で調製した改変型rPPRモチーフの配列を下表に示した。
Figure JPOXMLDOC01-appb-T000017
[実施例6: DNA結合能を付与できるアミノ酸配列の汎用性評価]
 これまでの検討は全てcrPPR(7L/31F)を用いて行ったが、A.A. 9A、A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yの導入によるDNA結合能の付与が他のPPRにおいても可能かについて検討を行った。今回、天然型dPPRであるP63とGUN1の全モチーフにA.A. 9A/10Y/18K/31I、およびA.A. 31I/32Kを導入した改変体においてDNA結合能が上昇するかを検討した。DNA結合能の評価は実施例3で用いた手法により解析した。本実施例において、モチーフにおけるA.A.31IとA.A.32Kの位置は、次のモチーフを基準として決定した。具体的には、A.A.31Iは次のPPRモチーフの1番アミノ酸に対して5個上流の位置とし、32番A.A.32Kは次のPPRモチーフの1番アミノ酸に対して4個上流の位置とした。最もC末端側のモチーフの場合(次のPPRモチーフがない場合)は、モチーフを構成するアミノ酸の最後(C末端側)から5番目および4番目の位置のアミノ酸を、それぞれA.A.31IおよびA.A.32Kとした。
(結果・考察)
 5 %有意水準 (p<0.06) としたT検定により各改変型と天然型のDNA結合力を比較したところ、いずれのアミノ酸配列を導入したP63、GUN1についてもDNA結合力を上昇させた(図6)。以上の結果から、A.A. 9A、A.A. 18K、A.A. 31I、A.A. 32K、およびA.A. 9A/10Yの導入によるDNA結合能の付与は、crPPR(7L/31F)以外のPPRタンパク質に対しても有効であることが明らかになった。
 本実施例で調製した改変型rPPRモチーフの配列を下表に示した。
[規則26に基づく補充 25.09.2017] 
Figure WO-DOC-TABLE-8-1
Figure WO-DOC-TABLE-8-2
[実施例の項で引用した文献]
非特許文献15:Coquille et al., 2014, An artificial PPR scaffold for programmable RNA recognition
http://www.nature.com/ncomms/2014/141217/ncomms6729/abs/ncomms6729.html
配列表フリーテキスト
SEQ ID NO.:1, p63 protein
SEQ ID NO.:2, GUN1 protein
SEQ ID NO.:3, pTac2 protein
SEQ ID NO.:4, DG1 protein
SEQ ID NO.:5, GRP23 protein
SEQ ID NO.:6, FokI nuclease domain
SEQ ID NOs.:7 - 214, dPPRs
SEQ ID NOs.:215 - 283, known rPPRs
SEQ ID NO.:284, crPPR
SEQ ID NO.:285, MODIFIED TYPE crPPR-1
SEQ ID NO.:286, MODIFIED TYPE crPPR-2
SEQ ID NO.:287, MODIFIED TYPE crPPR-3
SEQ ID NO.:288, MODIFIED TYPE crPPR-4
SEQ ID NO.:289, MODIFIED TYPE crPPR-5
SEQ ID NO.:290, MODIFIED TYPE crPPR-6
SEQ ID NOs.:291 - 308, At1g10910, At1g26460, At3g15590, At3g59040, At5g10690,  At5g24830, At5g67570, At3g42630, At5g42310, At1g12700, At1g30610, At2g35130, At2g41720, At3g18110, At3g53170, At4g21170, At5g48730, At5g50280
SEQ ID NO.:309, crPPR N terminal side
SEQ ID NO.:310, crPPR C terminal side
SEQ ID NOs.:311-334, modified-type rPPR Motif or C terminal side
SEQ ID NOs.:335-361, modified-type rPPR Protein (Full length)
SEQ ID NOs.:362-423, N/C terminal side, or Motif of original/modified-type of p63 or GUN 1
SEQ ID NOs.:424-427, modified-type p63 or GUN1 protein (Full length)

Claims (25)

  1.  以下の式1の構造を有するPPRモチーフ:
    Figure JPOXMLDOC01-appb-C000001
    (式1中:
     Helix Aは、αヘリックス構造を形成可能な部分であり;
     Xは、存在しないかまたは1~9アミノ酸長からなる部分であり;
     Helix Bは、αヘリックス構造を形成可能な部分であり;そして
     Lは、2~7アミノ酸長からなる部分である。)
    を1個以上含むタンパク質であって、
    タンパク質に含まれる一のPPRモチーフ(Mn)が、
    Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
    ・PPRモチーフ(Mn)のC末端側に連続して次のPPRモチーフ(Mn+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
    ・PPRモチーフ(Mn)とそのC末端側の次のPPRモチーフ(Mn+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(Mn+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
    ・PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(Mn+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から2番目のアミノ酸
    を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸を、対象DNA塩基または対象DNA塩基配列に対応した特定のアミノ酸の組み合わせで有するPPRモチーフである、DNA塩基選択的に、またはDNA塩基配列特異的に結合可能なタンパク質であって、
    下記の(b)~(h)からなる群より選択される少なくとも一つを満たす、タンパク質:
    (b) PPRモチーフ(Mn)の9番A.A.が、アラニン(A)である;
    (c) PPRモチーフ(Mn)の10番A.A.が、チロシン(Y)、フェニルアラニン(F)、またはトリプトファン(W)である;
    (d) PPRモチーフ(Mn)の18番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;
    (e) PPRモチーフ(Mn)の20番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
    (f) PPRモチーフ(Mn)の29番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である
    (g) PPRモチーフ(Mn)の31番A.A.が、イソロイシン(I)、ロイシン(L)、バリン(V)である;
    (h) PPRモチーフ(Mn)の32番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である
    (ただし、配列番号1~5、および配列番号291~308のアミノ酸配列からなるタンパク質を除く。)。
  2.  1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、請求項1に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
     (1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)である;
     (1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
    に基づいて決定される、タンパク質。
  3.  1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、対象DNA塩基または対象DNA塩基配列に応じたものとする、請求項1に記載のタンパク質であって、アミノ酸の組み合わせが、下記のいずれか:
     (2-1)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-2)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-3)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-4)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-5)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
     (2-6)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
     (2-7)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-8)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
     (2-9)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
     (2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
     (2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
     (2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
     (2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
     (2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
     (2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;
    に基づいて決定される、前記タンパク質。
  4.  請求項1に定義されるPPRモチーフ(Mn)が、2~30個含まれる、請求項1~3のいずれか1項に記載のタンパク質。
  5.  (b)および(c)の組合せ、 (d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、請求項1~4のいずれか1項に記載のタンパク質。
  6.  (b)および(c)の組合せを満たし、かつ(d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、請求項5に記載のタンパク質。
  7.  (b)および(c)の組合せ、(d)および(e)の組合せ、ならびに(g)を満たす、請求項6に記載のタンパク質。
  8.  PPRモチーフを複数個含み、DNA結合性PPRモチーフの含有率が、13%以上である、請求項1~7のいずれか1項に記載のタンパク質。
  9.  配列番号7~214のいずれか一つのアミノ酸配列;  配列番号291の167~482位のアミノ酸配列、配列番号292の156~575位のアミノ酸配列、配列番号293の243~554位のアミノ酸配列、配列番号294の140~489位のアミノ酸配列、配列番号295の78~419位のアミノ酸配列、配列番号296の122~545位のアミノ酸配列、配列番号297の256~624位のアミノ酸配列、配列番号298の48~362位のアミノ酸配列、配列番号299の198~689位のアミノ酸配列、配列番号300の89~578位のアミノ酸配列、配列番号301の470~911位のアミノ酸配列、配列番号302の156~575位のアミノ酸配列、配列番号303の108~775位のアミノ酸配列、配列番号304の226~1137位のアミノ酸配列、配列番号305の145~496位のアミノ酸配列、配列番号306の104~538位のアミノ酸配列、配列番号307の151~502位のアミノ酸配列、および配列番号308の274~660位のアミノ酸配列からなる群より選択されるいずれか一つのアミノ酸配列;
     配列番号335~361のいずれか一つのアミノ酸配列;または
     配列番号424~427のいずれか一つのアミノ酸配列
    からなるタンパク質。
  10.  請求項1~9のいずれか1項に記載されたタンパク質;
     配列番号291~308のいずれか一つのアミノ酸配列からなるタンパク質の全部または一部からなる領域;
     配列番号335~361のいずれか一つのアミノ酸配列からなるタンパク質;または
     配列番号424~427のいずれか一つのアミノ酸配列からなるタンパク質
    と機能性領域とが連結されてなる、複合体。
  11.  複合体が、タンパク質のC末端側に、機能性領域を融合してなる、請求項10に記載の複合体。
  12.  機能性領域が、DNA切断酵素またはそのヌクレアーゼドメイン、または転写制御ドメインであり、複合体が標的配列特異的DNA切断酵素、または転写制御因子として機能する、請求項10または11に記載の複合体。
  13.  DNA切断酵素がFokIのヌクレアーゼドメイン(配列番号6)である、請求項12に記載の複合体。
  14.  配列番号1の230~541位のアミノ酸配列、配列番号2の234~621位のアミノ酸配列、配列番号3の106~632位のアミノ酸配列、配列番号4の106~632位のアミノ酸配列、および配列番号5の256~624位のアミノ酸配列からなる群より選択されるいずれか一のアミノ酸配列を有するタンパク質;
     配列番号1のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号2のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフ、配列番号3のアミノ酸配列からなるタンパク質が有する15個のPPRモチーフ、配列番号4のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号5のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフからなる群より選択されるいずれか一つのPPRモチーフ;
     配列番号291の167~482位のアミノ酸配列、配列番号292の156~575位のアミノ酸配列、配列番号293の243~554位のアミノ酸配列、配列番号294の140~489位のアミノ酸配列、配列番号295の78~419位のアミノ酸配列、配列番号296の122~545位のアミノ酸配列、配列番号297の256~624位のアミノ酸配列、配列番号298の48~362位のアミノ酸配列、配列番号299の198~689位のアミノ酸配列、配列番号300の89~578位のアミノ酸配列、配列番号301の470~911位のアミノ酸配列、配列番号302の156~575位のアミノ酸配列、配列番号303の108~775位のアミノ酸配列、配列番号304の226~1137位のアミノ酸配列、配列番号305の145~496位のアミノ酸配列、配列番号306の104~538位のアミノ酸配列、配列番号307の151~502位のアミノ酸配列、および配列番号308の274~660位のアミノ酸配列からなる群より選択されるいずれか一つのアミノ酸配列を有するタンパク質;または
     配列番号291のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号292のアミノ酸配列からなるタンパク質が有する6個のPPRモチーフ、配列番号293のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号294のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号295のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号296のアミノ酸配列からなるタンパク質が有する12個のPPRモチーフ、配列番号297のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号298のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号299のアミノ酸配列からなるタンパク質が有する14個のPPRモチーフ、配列番号300のアミノ酸配列からなるタンパク質が有する14個のPPRモチーフ、配列番号301のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号302のアミノ酸配列からなるタンパク質が有する12個のPPRモチーフ、配列番号303のアミノ酸配列からなるタンパク質が有する19個のPPRモチーフ、配列番号304のアミノ酸配列からなるタンパク質が有する25個のPPRモチーフ、配列番号305のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、配列番号306のアミノ酸配列からなるタンパク質が有する9個のPPRモチーフ、配列番号307のアミノ酸配列からなるタンパク質が有する10個のPPRモチーフ、および配列番号308のアミノ酸配列からなるタンパク質が有する11個のPPRモチーフからなる群より選択されるいずれか一つのPPRモチーフ
    のいずれかにおいて、請求項1に定義した(b)~(h)からなる群より選択されるいずれかに基づいて一または複数個のアミノ酸を置換する、DNA塩基または特定の塩基配列を有するDNAに結合するタンパク質の設計方法。
  15.  DNA塩基または特定の塩基配列を有するDNAに結合するタンパク質の設計方法であって:
    タンパク質を、
     以下の式1の構造を有するPPRモチーフ:
    Figure JPOXMLDOC01-appb-C000002
    (式1中:
     Helix Aは、αヘリックス構造を形成可能な部分であり;
     Xは、存在しないかまたは1~9アミノ酸長からなる部分であり;
     Helix Bは、αヘリックス構造を形成可能な部分であり;そして
     Lは、2~7アミノ酸長からなる部分である。)
    を、1個以上含み;
     タンパク質に含まれる一のPPRモチーフ(Mn)が、
    Helix Aの最初のアミノ酸を1番アミノ酸(1番A.A.)、そして4番目のアミノ酸を4番アミノ酸(4番A.A.)とし、そして
    ・PPRモチーフ(Mn)のC末端側に連続して次のPPRモチーフ(Mn+1)が存在するとき(PPRモチーフ間にアミノ酸挿入がないとき)、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から-2番目のアミノ酸;
    ・PPRモチーフ(Mn)とそのC末端側の次のPPRモチーフ(Mn+1)の間に1~20アミノ酸の非PPRモチーフが見いだされるときは、次のPPRモチーフ(Mn+1)の1番アミノ酸の2個上流、すなわち-2番目のアミノ酸;または
    ・PPRモチーフ(Mn)のC末端側に次のPPRモチーフ(Mn+1)が見いだせないとき、もしくはC末端側の次のPPRモチーフ(Mn+1)との間に21アミノ酸以上の非PPRモチーフを構成するアミノ酸が見いだされる場合、PPRモチーフ(Mn)を構成するアミノ酸の最後(C末端側)から2番目のアミノ酸
    を“ii”(-2)番のアミノ酸(“ii”(-2)番A.A.)としたときに、1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせを、DNA塩基または特定の塩基配列に応じたものとし、かつ下記の(b)~(h)からなる群より選択される少なくとも一つを満たすようにする、方法:
    (b) PPRモチーフ(Mn)の9番A.A.が、アラニン(A)である;
    (c) PPRモチーフ(Mn)の10番A.A.が、チロシン(Y)、フェニルアラニン(F)、またはトリプトファン(W)である;
    (d) PPRモチーフ(Mn)の18番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である;
    (e) PPRモチーフ(Mn)の20番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である;
    (f) PPRモチーフ(Mn)の29番A.A.が、グルタミン酸(E)、またはアスパラギン酸 (D)である
    (g) PPRモチーフ(Mn)の31番A.A.が、イソロイシン(I)、ロイシン(L)、またはバリン(V)である;
    (h) PPRモチーフ(Mn)の32番A.A.が、リシン(K)、アルギニン (R)、またはヒスチジン(H)である。
  16.  請求項15に記載の方法であって、1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせが、下記のいずれか:
     (1-1)4番A.A.がグリシン(G)である場合、1番A.A.は任意のアミノ酸であってもよく、そして“ii”(-2)番A.A.はアスパラギン酸(D)、アスパラギン(N)またはセリン(S)である;
     (1-2)4番A.A.がイソロイシン(I)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-3)4番A.A.がロイシン(L)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-4)4番A.A.がメチオニン(M)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-5)4番A.A.がアスパラギン(N)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-6)4番A.A.がプロリン(P)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-7)4番A.A.がセリン(S)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-8)4番A.A.がトレオニン(T)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
     (1-9)4番A.A.がバリン(V)である場合、1番A.A.および“ii”(-2)番A.A.はいずれも任意のアミノ酸であってもよい;
    に基づいて決定される、方法。
  17.  請求項15に記載の方法であって、1番A.A.、4番A.A.および“ii”(-2)番A.A.の3つのアミノ酸の組み合わせが、下記のいずれか:
     (2-1)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-2)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-3)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-4)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-5)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
     (2-6)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
     (2-7)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-8)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、TおよびCに選択的に結合する;
     (2-9)  1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-10) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-11) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-12) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-13) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-14) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、CおよびTに選択的に結合する;
     (2-15) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-16) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-17) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-18) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-19) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-20) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-21) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-22) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-23) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-24) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-25) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-26) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-27) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-28) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-29) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-30) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
     (2-31) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
     (2-32) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-33) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-34) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-35) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
     (2-36) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
     (2-37) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-38) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-39) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-40) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、AおよびGに選択的に結合する;
     (2-41) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-42) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
     (2-43) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-44) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-45) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-46) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
     (2-47) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、CおよびTに結合するが、Gには結合しない;
     (2-48) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
     (2-49) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
     (2-50) 1番A.A.、4番A.A.、および“ii”(-2)番A.A.の3つのアミノ酸が、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;
    に基づいて決定される、方法。
  18. (b)および(c)の組合せ、 (d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、請求項15~17のいずれか1項に記載の方法。
  19. (b)および(c)の組合せを満たし、かつ(d)および(e)の組合せ、(g)ならびに(h)からなる群から選択される少なくとも一つを満たす、請求項18に記載の方法。
  20. (b)および(c)の組合せ、(d)および(e)の組合せ、ならびに(g)を満たす、請求項19に記載の方法。
  21. PPRモチーフを複数個含み、DNA結合性PPRモチーフの含有率が、13%以上である、請求項15~20のいずれか1項に記載の方法。
  22.  請求項14~21のいずれか1項に記載された方法によってタンパク質を設計し、その設計されたタンパク質を製造する方法。
  23.  請求項14~21のいずれか1項に記載された方法によってタンパク質を設計し、その設計されたタンパク質からなる領域と機能性領域とを連結して複合体を製造する方法。
  24.  請求項10~13のいずれか1項に記載された複合体を用いること、または
     請求項14~21のいずれか1項に記載された方法によってタンパク質を設計し、その設計されたタンパク質からなる領域と機能性領域とを連結して複合体を製造し、その製造された複合体を用いること
    を特徴とする、ゲノムを編集する方法(ヒト個体での実施を除く。)。
  25.  請求項23に記載された方法でゲノムを編集し、その編集されたゲノムを含む細胞を製造する方法(ヒト個体での実施を除く。)。
PCT/JP2017/028995 2016-08-10 2017-08-09 Pprモチーフを利用したdna結合性タンパク質およびその利用 WO2018030488A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US16/323,899 US20190177378A1 (en) 2016-08-10 2017-08-09 Dna-binding protein using ppr motif, and use thereof
JP2018533549A JPWO2018030488A1 (ja) 2016-08-10 2017-08-09 Pprモチーフを利用したdna結合性タンパク質およびその利用
CN201780048281.XA CN109563137A (zh) 2016-08-10 2017-08-09 利用了ppr基序的dna结合性蛋白质及其应用
EP17839555.4A EP3498726A4 (en) 2016-08-10 2017-08-09 DNA-BINDING PROTEIN WITH PPR MOTIF AND USE OF THE DNA-BINDING PROTEIN

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016157698 2016-08-10
JP2016-157698 2016-08-10

Publications (1)

Publication Number Publication Date
WO2018030488A1 true WO2018030488A1 (ja) 2018-02-15

Family

ID=61162181

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/028995 WO2018030488A1 (ja) 2016-08-10 2017-08-09 Pprモチーフを利用したdna結合性タンパク質およびその利用

Country Status (5)

Country Link
US (1) US20190177378A1 (ja)
EP (1) EP3498726A4 (ja)
JP (1) JPWO2018030488A1 (ja)
CN (1) CN109563137A (ja)
WO (1) WO2018030488A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019232588A1 (en) * 2018-06-06 2019-12-12 The University Of Western Australia Proteins and their use for nucleotide binding
JPWO2020241876A1 (ja) * 2019-05-29 2020-12-03
JP7125727B1 (ja) 2021-09-07 2022-08-25 国立大学法人千葉大学 核酸配列改変用組成物および核酸配列の標的部位を改変する方法
WO2022230924A1 (ja) * 2021-04-30 2022-11-03 国立大学法人大阪大学 筋強直性ジストロフィー1型治療薬

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102606057B1 (ko) * 2013-04-22 2023-11-23 고쿠리쓰다이가쿠호진 규슈다이가쿠 피피알 단백질을 이용하여 dna 염기 또는 특정 염기서열을 가지는 dna를 동정, 인식 또는 표적화하는 방법
CN110058014B (zh) * 2019-04-25 2021-06-04 中国科学院化学研究所 用于筛选lrpprc调控剂的产品及鉴定lrpprc调控剂的方法
CN113913455B (zh) * 2020-09-09 2023-06-16 中国农业大学 与植物抗病性相关的水稻线粒体蛋白OsNBL3及其编码基因与应用
CN113066528B (zh) * 2021-04-12 2022-07-19 山西大学 基于主动半监督图神经网络的蛋白质分类方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011111829A1 (ja) * 2010-03-11 2011-09-15 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の改変方法
WO2013058404A1 (ja) * 2011-10-21 2013-04-25 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用
WO2014175284A1 (ja) * 2013-04-22 2014-10-30 国立大学法人九州大学 Pprモチーフを利用したdna結合性タンパク質およびその利用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011111829A1 (ja) * 2010-03-11 2011-09-15 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の改変方法
WO2013058404A1 (ja) * 2011-10-21 2013-04-25 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用
WO2014175284A1 (ja) * 2013-04-22 2014-10-30 国立大学法人九州大学 Pprモチーフを利用したdna結合性タンパク質およびその利用

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
COQUILLE S. ET AL.: "An artificial PPR scaffold for programmable RNA recognition.", NATURE COMMUNICATIONS, vol. 5, 2014, pages 1 - 9, XP055463057, DOI: 10.1038/ncomms6729 *
HOLZLE A. ET AL.: "A RESTORER OF FERTILITY-like PPR gene is required for 5'-end processing of the nad4 mRNA in mitochondria of Arabidopsis thaliana", THE PLANT JOURNAL, vol. 65, no. 5, 2011, pages 737 - 744, XP055463064, DOI: doi:10.1111/j.1365-313X.2010.04460.x *
KOUSSEVITZKY S. ET AL.: "Signals from Chloroplasts Converge to Regulate Nuclear Gene Expression.", SCIENCE, vol. 316, no. 5825, 2007, pages 715 - 719, XP055293994, DOI: doi:10.1126/science.1140516 *
NAKAMURA T. ET AL.: "RNA-binding properties of HCF152, an Arabidopsis PPR protein involved in the processing of chloroplast RNA", EUR. J. BIOCHEM., vol. 270, no. 20, 2003, pages 4070 - 4081, XP055456487, DOI: doi:10.1046/j.1432-1033.2003.03796.x *
OGUCHI T. ET AL.: "Genomic structure of a novel Arabidopsis clock-controlled gene , AtC401, which encodes a pentatricopeptide repeat protein.", GENE, vol. 330, 2004, pages 29 - 37, XP004503491, DOI: doi:10.1016/j.gene.2003.11.012 *
See also references of EP3498726A4 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019232588A1 (en) * 2018-06-06 2019-12-12 The University Of Western Australia Proteins and their use for nucleotide binding
EP3802566A4 (en) * 2018-06-06 2022-03-09 The University Of Western Australia PROTEINS AND THEIR USE FOR NUCLEOTIDE BINDING
JPWO2020241876A1 (ja) * 2019-05-29 2020-12-03
WO2020241876A1 (ja) * 2019-05-29 2020-12-03 エディットフォース株式会社 効率的なpprタンパク質の作製方法及びその利用
WO2022230924A1 (ja) * 2021-04-30 2022-11-03 国立大学法人大阪大学 筋強直性ジストロフィー1型治療薬
JP7461687B2 (ja) 2021-04-30 2024-04-04 エディットフォース株式会社 筋強直性ジストロフィー1型治療薬
JP7125727B1 (ja) 2021-09-07 2022-08-25 国立大学法人千葉大学 核酸配列改変用組成物および核酸配列の標的部位を改変する方法
JP2023038817A (ja) * 2021-09-07 2023-03-17 国立大学法人千葉大学 核酸配列改変用組成物および核酸配列の標的部位を改変する方法

Also Published As

Publication number Publication date
JPWO2018030488A1 (ja) 2019-06-13
EP3498726A1 (en) 2019-06-19
CN109563137A (zh) 2019-04-02
US20190177378A1 (en) 2019-06-13
EP3498726A4 (en) 2020-03-25

Similar Documents

Publication Publication Date Title
JP7290233B2 (ja) Pprモチーフを利用したdna結合性タンパク質およびその利用
WO2018030488A1 (ja) Pprモチーフを利用したdna結合性タンパク質およびその利用
Betti et al. Sequence-specific protein aggregation generates defined protein knockdowns in plants
Bieluszewski et al. NuA4 and H2A. Z control environmental responses and autotrophic growth in Arabidopsis
Zelkowski et al. Arabidopsis NSE4 proteins act in somatic nuclei and meiosis to ensure plant viability and fertility
Liu et al. The plant ovule secretome: a different view toward pollen–pistil interactions
Fíla et al. The beta subunit of nascent polypeptide associated complex plays a role in flowers and Siliques development of Arabidopsis Thaliana
Bourdareau Genetic and epigenetic control of life cycle transitions in the brown alga Ectocarpus sp.
US20220064229A1 (en) Methods for designing dna binding protein containing ppr motifs, and use thereof
Zhao Evolution of Plant Male Germline-Specific Transcription Factor DUO POLLEN 1
Mayo-Smith Functional Analysis of the INHIBITOR OF GROWTH Genes in Medicago truncatula
Best et al. MSP1 encodes an essential RNA-binding PPR factor required for nad1 maturation and complex I biogenesis in Arabidopsis mitochondria
Cheng et al. Exploring the extensin gene family: an updated genome-wide survey in plants and algae
Gipson The Organelle Zinc Finger Family of Proteins Contributes to RNA Processing in Plant Organelles
NZ752698B2 (en) DNA-binding protein using PPR motif, and use thereof

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17839555

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018533549

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2017839555

Country of ref document: EP

Effective date: 20190311