JP2016535603A

JP2016535603A - 最適なダイズ遺伝子座

Info

Publication number: JP2016535603A
Application number: JP2016552441A
Authority: JP
Inventors: サストゥリー−デント，ラクシュミ; カオ，ゼフィ; スリラム，シュリードハラン; ウェブ，スティーブン，アール．; エル．カンペール，デブラ
Original assignee: ダウアグロサイエンシィズエルエルシー
Priority date: 2013-11-04
Filing date: 2014-11-03
Publication date: 2016-11-17
Anticipated expiration: 2034-11-03
Also published as: IL252148A0; CN105980395A; IL252148B; ZA201602552B; US20150128307A1; RU2016121862A; CA2926822A1; BR102014027436A2; BR102014027436A8; IL245305B; MX2016005874A; CL2016001066A1; BR102014027436B1; WO2015066634A2; EP3066109A4; TWI659103B; AU2014341925A1; KR20160079864A; US10233465B2; US11149287B2

Abstract

本明細書に開示されるように、外因性配列の標的化された挿入のための最良の部位を提示する最適なネイティブゲノム遺伝子座が、ダイズ植物などの双子葉植物において同定されている。

Description

関連出願への相互参照
本出願は、米国特許法第１１９条（ｅ）の下で、２０１３年１１月４日出願の米国仮特許出願第６１／８９９，５６６号および２０１３年１１月４日出願の米国仮特許出願第６１／８８９，５８７号に対する利益を主張し、その内容は、その全体が参照により本出願に組み込まれる。

電子工学的に提出された配列表に対する参照
配列表の写しは、２０１４年１１月３日に作成されたファイル名「７４８９２２３２３０８ｓｅｑｌｉｓｔ．ｔｘｔ」を有し、１３．４メガバイトのサイズを有するＡＳＣＩＩフォーマットの配列表として、ＥＦＳ−Ｗｅｂを介して電子工学的に提出され、本明細書と同時的に出願される。このＡＳＣＩＩフォーマットのドキュメント中に含まれる配列表は、本明細書の一部であり、その全体が参照により本明細書に組み込まれる。

電子工学的に提出されたテーブルリストに対する参照
テーブルリストの写しは、２０１４年１１月３日に作成されたファイル名「Ｔａｂｌｅ３」を有し、１１．６メガバイトのサイズを有する．ＰＤＦフォーマットのテーブルリストとして、ＥＦＳ−Ｗｅｂを介して電子工学的に提出され、本明細書と同時的に出願される。この．ＰＤＦフォーマットのドキュメント中に含まれるテーブルリストは、本明細書の一部であり、その全体が参照により本明細書に組み込まれる。

ダイズ植物などの、多数の型の双子葉植物のゲノムが、１９９０年代初期に、導入遺伝子で首尾よく形質転換された。ここ２０年間にわたり、多数の方法論が、ダイズなどの双子葉植物のゲノムを形質転換するために開発されており、ここで、導入遺伝子は、双子葉植物のゲノム中に安定に組み込まれる。双子葉形質転換方法論のこの進化により、ダイズなどの双子葉植物のゲノム内に農学的形質を含む導入遺伝子を首尾よく導入する能力を生じている。１９９０年代後期における双子葉植物内の昆虫抵抗性および除草剤耐性形質の導入は、栽培耕作方法において類を見ない、昆虫および広いスペクトルの雑草を制御するための新しく簡便な技術的革新を有する手順を提供した。最近、トランスジェニック双子葉植物は、世界中で市販されており、新たなトランスジェニック製品、例えばＥｎｌｉｓｔ（商標）ダイズが、増え続ける雑草の問題に対して、改善された解決法を提供している。現代農学実務におけるトランスジェニック双子葉植物の利用は、形質転換方法論の開発および改善を別にすれば、不可能であった。

しかし、現行の形質転換方法論は、ダイズなどの双子葉植物のゲノム内での導入遺伝子のランダム挿入に依存する。ゲノム中への遺伝子のランダム挿入への依存は、いくつかの不利益を有している。トランスジェニック事象は、遺伝子転写配列内にランダムに組み込まれ得、それによって、内因性形質の発現を妨害し、植物の成長および発生を変更する。さらに、これらのトランスジェニック事象は、遺伝子サイレンシングに対して感受性のゲノムの位置中に無差別に組み込まれ得、第一世代または引き続く世代のトランスジェニック植物のいずれかにおける、低減された導入遺伝子発現または導入遺伝子発現の完全な阻害に至る。最後に、植物ゲノム内の導入遺伝子のランダム組込みは、トランスジェニック事象の位置を同定する際および植物に対する農学的影響なしに設計どおりに機能するトランスジェニック事象を選択する際に、かなりの努力および費用を必要とする。新規アッセイを、ダイズトランスジェニック事象などの各トランスジェニック事象について、組み込まれた導入遺伝子の正確な位置を決定するために、持続的に開発しなければならない。植物形質転換方法論のランダムな性質は、形質転換方法論の有効性および効率を妨害する、組み込まれた導入遺伝子の「位置効果」を生じる。

植物の標的化されたゲノム改変は、応用研究および基礎研究の両方の、長期にわたる捉えにくい目的であった。ダイズ植物などの双子葉植物のゲノム中の特定の位置に遺伝子および遺伝子スタックを標的化することは、トランスジェニック事象の品質を改善し、トランスジェニック事象の産生に関連する費用を低減させ、トランスジェニック植物製品を作製するための新たな方法、例えば逐次的遺伝子スタッキングを提供する。全体として、特定のゲノム部位への導入遺伝子の標的化は、商業的に有益である可能性が高い。大幅な進歩が、部位特異的ヌクレアーゼ（例えば、ジンクフィンガーヌクレアーゼ（ＺＦＮ）、メガヌクレアーゼ、転写活性化因子様エフェクターヌクレアーゼ（ＴＡＬＥＮＳ）、および操作されたｃｒＲＮＡ／ｔｒａｃｒＲＮＡと共にクラスター化して規則的な配置の短い回文配列リピート／ＣＲＩＳＰＲ関連ヌクレアーゼ（ＣＲＩＳＰＲ／Ｃａｓ））によってゲノムＤＮＡを標的化および切断するため、標的化された変異誘発を誘導し、細胞ＤＮＡ配列の標的化された欠失を誘導し、所定のゲノム遺伝子座内の外因性ドナーＤＮＡポリヌクレオチドの標的化された組換えを促進するための方法および組成物の開発に向かって、ここ数年間になされてきた。例えば、それらの開示が全ての目的のためにその全体が参照により組み込まれる、米国特許出願公開第２００３０２３２４１０号；同第２００５０２０８４８９号；同第２００５００２６１５７号；同第２００５００６４４７４号；および同第２００６０１８８９８７号、ならびに国際特許公開第ＷＯ２００７／０１４２７５号を参照のこと。米国特許出願公開第２００８０１８２３３２号は、植物ゲノムの標的化された改変のための非正準ジンクフィンガーヌクレアーゼ（ＺＦＮ）の使用を記載し、米国特許出願公開第２００９０２０５０８３号は、植物ＥＰＳＰゲノム遺伝子座の、ＺＦＮ媒介性の標的化された改変を記載している。外因性ＤＮＡの標的化された挿入のための現行の方法には、典型的には、少なくとも１つの導入遺伝子を含むドナーＤＮＡポリヌクレオチドによる植物組織の共形質転換、ならびに活発に転写されたコード配列の特定のゲノム遺伝子座を結合および切断するように設計される部位特異的ヌクレアーゼ（例えば、ＺＦＮ）が関与する。これは、切断されたゲノム遺伝子座内にドナーＤＮＡポリヌクレオチドを安定に挿入させて、活発に転写されたコード配列を含む特定化されたゲノム遺伝子座における標的化された遺伝子付加を生じる。

代替的アプローチは、ダイズなどの双子葉植物のゲノム内の予め選択された標的非遺伝子遺伝子座に、導入遺伝子を標的化することである。近年、いくつかの技術が開発され、ダイズなどの双子葉植物のゲノム内の導入遺伝子の標的化された送達のために、植物細胞に適用されている。しかし、標的化のために適切なゲノム部位の属性については、それほど知られていない。歴史的に、ゲノム中の非必須遺伝子および病原体（ウイルス）組込み部位が、標的化のための遺伝子座として使用されてきた。ゲノム中のかかる部位の数は、かなり限定的であり、したがって、ドナーポリヌクレオチド配列の標的化のために使用され得る標的化可能な最適なゲノム遺伝子座の同定および特徴付けが必要とされている。標的化に従順なことに加えて、最適なゲノム遺伝子座は、導入遺伝子発現および育種適用を支持し得る中立部位であると予測される。標的化された導入遺伝子組込みのための、ダイズ植物などの双子葉植物のゲノム内の最適な非遺伝子遺伝子座を同定するための基準を規定する組成物および方法が、必要とされる。

本開示の一実施形態は、例えばダイズゲノムを含む双子葉ゲノムにおいて、外因性配列の挿入のための最適な部位を同定する方法に関する。文献中には、植物染色体領域が標的化可能であり、発現を支持することを示唆する記述が存在する。本出願人らは、部位特異的な標的化された挿入のための最適な部位である、ネイティブダイズゲノム配列の領域を同定するための基準のセットを構築した。より具体的には、一実施形態によれば、最適な遺伝子座は、非遺伝子であり、標的化可能であり、遺伝子発現を支持し、農学的に中立であり、組換えの証拠を有するべきである。本明細書に開示されるように、本出願人らは、これらの基準を満たし、したがって、外因性配列の挿入のための最適な部位を提示する、ダイズゲノム中のいくつかの遺伝子座を発見した。

一実施形態によれば、組換えダイズ配列が本明細書に開示され、この組換え配列は、少なくとも１Ｋｂの非遺伝子ダイズゲノム配列およびこの非遺伝子ダイズゲノム配列中に挿入された目的のＤＮＡを含み、この非遺伝子ダイズゲノム配列は、目的のＤＮＡの挿入によって改変されている。一実施形態では、このネイティブ非遺伝子ダイズ配列は、低メチル化され、発現可能であり、組換えの証拠を示し、ダイズゲノム中の遺伝子領域の近位の位置に位置する。一実施形態では、非遺伝子配列は、約１Ｋｂ〜約５．７Ｋｂの範囲の長さを有する。一実施形態では、目的のＤＮＡは、例えば、調節配列、制限切断部位、ＲＮＡコード領域またはタンパク質コード領域を含む外因性ＤＮＡ配列を含む。一実施形態では、目的のＤＮＡは、１または複数の導入遺伝子を含む遺伝子発現カセットを含む。

一実施形態によれば、約１Ｋｂ〜約５．７Ｋｂの最適な非遺伝子ダイズゲノム配列および目的のＤＮＡを含む組換え配列が提供され、この非遺伝子ダイズゲノム配列は、以下の特性または特徴：
ａ）前記ダイズゲノム配列の４０Ｋｂ以内に、既知または予測されたダイズコード配列を有すること；
ｂ）前記ダイズゲノム配列の一方の末端の４０Ｋｂ以内に、既知のダイズ遺伝子の２Ｋｂ上流および／または１Ｋｂ下流を含む配列を有すること；
ｃ）この配列内に１％よりも多いＤＮＡメチル化を含まないこと；
ｄ）このダイズゲノム内の任意の他の配列と、４０％よりも高い配列同一性を有する１Ｋｂ配列を含まないこと；ならびに
ｅ）０．０１５７４ｃＭ／Ｍｂよりも高い組換え頻度で組換えの証拠を示すこと
のうち１、２、３、４または５を有する。

一実施形態によれば、そのダイズ植物、ダイズ植物部分またはダイズ植物細胞の同定および標的化された非遺伝子ダイズゲノム配列中に挿入された目的のＤＮＡを含む、ダイズ植物、ダイズ植物部分またはダイズ植物細胞が提供される。一実施形態では、このダイズ植物、ダイズ植物部分またはダイズ植物細胞の非遺伝子ダイズゲノム配列は、低メチル化され、発現可能であり、組換えの証拠を示し、ダイズゲノム中の遺伝子領域の近位の位置に位置する。一実施形態では、このダイズ植物、ダイズ植物部分またはダイズ植物細胞の非遺伝子ダイズゲノム配列は、約１Ｋｂ〜約５．７Ｋｂの長さであり、低メチル化され、以下の特性または特徴：
ａ）前記ダイズゲノム配列の４０Ｋｂ以内に、既知または予測されたダイズコード配列を有すること；
ｂ）前記ダイズゲノム配列の一方の末端の４０Ｋｂ以内に、既知のダイズ遺伝子の２Ｋｂ上流および／または１Ｋｂ下流を含む配列を有すること；
ｃ）この配列内に１％よりも多いＤＮＡメチル化を含まないこと；
ｄ）このダイズゲノム内の任意の他の配列と、４０％よりも高い配列同一性を有する１Ｋｂ配列を含まないこと；ならびに
ｅ）０．０１５７４ｃＭ／Ｍｂよりも高い組換え頻度で組換えの証拠を示すこと
のうち１、２、３または４を有する。

一実施形態では、非遺伝子ダイズゲノム配列に標的化された目的のＤＮＡを含むトランスジェニック植物細胞を作製する方法が提供され、この方法は、以下を含む：
ａ）最適な非遺伝子ダイズゲノム遺伝子座を選択するステップ；
ｂ）部位特異的ヌクレアーゼを植物細胞中に導入するステップであって、この部位特異的ヌクレアーゼは、前記非遺伝子配列を切断する、ステップ；
ｃ）目的のＤＮＡをこの植物細胞中に導入するステップ；
ｄ）目的のＤＮＡを前記非遺伝子配列中に標的化するステップであって、前記非遺伝子配列の切断は、前記非遺伝子配列中へのポリヌクレオチド配列の組込みを刺激する、ステップ；および
ｅ）前記非遺伝子配列に標的化された目的のＤＮＡを含むトランスジェニック植物細胞を選択するステップ。

一実施形態によれば、この選択された非遺伝子配列は、以下の特徴：
ａ）この非遺伝子配列は、メチル化されたポリヌクレオチドを含まないこと；
ｂ）この非遺伝子配列は、ダイズゲノム内で、０．０１５７４〜８３．５２ｃＭ／Ｍｂの比率の組換えを示すこと；
ｃ）この非遺伝子配列は、ダイズゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示すこと；
ｄ）この非遺伝子配列は、ダイズゲノム中に含まれる任意の他の１Ｋｂ配列と、４０％未満の配列同一性を共有すること；
ｅ）この非遺伝子配列は、ダイズ染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有すること；
ｆ）この非遺伝子配列は、１４．３６〜４５．９％のグアニン／シトシンパーセント含量範囲を有すること；
ｇ）この非遺伝子配列は、遺伝子配列の近位に位置すること；および
ｈ）前記非遺伝子配列を含むダイズゲノム配列の１Ｍｂ領域は、１または複数の非遺伝子配列を含むこと
のうち２、３、４、５、６、７または８を含む。

本開示の一実施形態は、非遺伝子ダイズゲノム配列を同定する方法に関し、この方法は、以下のステップを含む：
ａ）１％よりも高いレベルのメチル化を含まない少なくとも１Ｋｂの長さのダイズゲノム配列を同定して、配列の第１のプールを生成するステップ；
ｂ）配列の第１のプールから、ダイズ転写物をコードする任意のダイズゲノム配列を排除するステップ；
ｃ）配列の第１のプールから、組換えの証拠を提供しない任意のダイズゲノム配列を排除するステップ；
ｄ）配列の第１のプールから、ダイズゲノム中に含まれる別の１Ｋｂ配列と４０％以上の配列同一性を共有する１Ｋｂ配列を含む任意のダイズゲノム配列を排除するステップ；
ｅ）配列の第１のプールから、同定された配列の４０Ｋｂ以内に既知のダイズ遺伝子を有さない任意のダイズゲノム配列を排除するステップ；および
ｆ）配列のプール中の残りのダイズゲノム配列を、非遺伝子ダイズゲノム配列として同定するステップ。配列が一旦同定されると、これらは、ネイティブゲノム中の遺伝子座中には見出されない核酸配列の挿入を標的化するために、組換え技術を使用して操作され得る。

一実施形態によれば、ダイズゲノム配列の４０Ｋｂ以内に位置する、既知のダイズ遺伝子を有さない、または既知の遺伝子の２Ｋｂ上流もしくは１Ｋｂ下流の配列を少なくとも有さない任意のダイズゲノム配列は、非遺伝子ダイズゲノム配列のプールから排除される。

一実施形態によれば、ダイズゲノム配列の４０Ｋｂ以内に位置する、ダイズタンパク質を発現する遺伝子を有さない任意のダイズゲノム配列は、非遺伝子ダイズゲノム配列のプールから排除される。

一実施形態によれば、精製されたダイズポリヌクレオチド配列が本明細書に開示され、精製された配列は、少なくとも１Ｋｂの非遺伝子ダイズゲノム配列を含む。一実施形態では、この非遺伝子ダイズ配列は、低メチル化され、発現可能であり、組換えの証拠を示し、ダイズゲノム中の遺伝子領域の近位の位置に位置する。一実施形態では、非遺伝子配列は、約１Ｋｂ〜約５．７Ｋｂの範囲の長さを有する。一実施形態では、目的のＤＮＡは、例えば調節配列、制限切断部位、ＲＮＡコード領域またはタンパク質コード領域を含む外因性ＤＮＡ配列を含む。一実施形態では、目的のＤＮＡは、１または複数の導入遺伝子を含む遺伝子発現カセットを含む。

一実施形態によれば、約１Ｋｂ〜約５．７Ｋｂの最適な非遺伝子ダイズゲノム配列および目的のＤＮＡを含む、精製されたダイズポリヌクレオチド配列が提供され、この非遺伝子ダイズゲノム配列は、以下の特性または特徴：
ａ）前記組換え配列の４０Ｋｂ以内に、既知または予測されたダイズコード配列を有すること；
ｂ）前記非遺伝子の一方の末端の４０Ｋｂ以内に、既知のダイズ遺伝子の２Ｋｂ上流および／または１Ｋｂ下流を含む配列を有すること；
ｃ）メチル化されたポリヌクレオチドを含まないこと；
ｄ）このダイズゲノム内の任意の他の配列と、４０％よりも高い配列同一性を有する１Ｋｂ配列を含まないこと；ならびに
ｅ）０．０１５７４ｃＭ／Ｍｂよりも高い組換え頻度で組換えの証拠を示すこと
のうち１、２、３、４または５を有する。

一実施形態によれば、選択された非遺伝子配列を含む、精製されたダイズポリヌクレオチド配列が提供される。この選択された非遺伝子配列は、以下の特徴：
ａ）この非遺伝子配列は、メチル化されたポリヌクレオチドを含まないこと；
ｂ）この非遺伝子配列は、ダイズゲノム内で、０．０１５７４〜８３．５２ｃＭ／Ｍｂの比率の組換えを示すこと；
ｃ）この非遺伝子配列は、ダイズゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示すこと；
ｄ）この非遺伝子配列は、ダイズゲノム中に含まれる任意の他の１Ｋｂ配列と、４０％未満の配列同一性を共有すること；
ｅ）この非遺伝子配列は、ダイズ染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有すること；
ｆ）この非遺伝子配列は、１４．３６〜４５．９％のグアニン／シトシンパーセント含量範囲を有すること；
ｇ）この非遺伝子配列は、遺伝子配列の近位に位置すること；および
ｈ）前記非遺伝子配列を含むダイズゲノム配列の１Ｍｂ領域は、１または複数の非遺伝子配列を含むこと
のうち２、３、４、５、６、７または８を含む。

一実施形態によれば、０．０１５７４ｃＭ／Ｍｂよりも高い組換え頻度で組換えの証拠を提供しない任意のダイズゲノム配列は、非遺伝子ダイズゲノム配列のプールから排除される。

一実施形態によれば、選択された非遺伝子配列は、以下の特徴：
ａ）この非遺伝子配列は、この配列内に１％よりも多いＤＮＡメチル化を含まないこと；
ｂ）この非遺伝子配列は、ダイズ染色体セントロメアから０．２１１〜０．９７６のゲノム距離の比率の相対的位置値を有すること；
ｃ）この非遺伝子配列は、２５．６２〜４３．７６％のグアニン／シトシンパーセント含量範囲を有すること；および
ｄ）この非遺伝子配列は、約１Ｋｂ〜約４．４Ｋｂの長さであること
を含む。

３２のクラスターへとクラスター化される７，０１８の選択されたゲノム遺伝子座の三次元グラフを示す図である。これらのクラスターは、三次元的にグラフ化され得、色または他の指標によって識別され得る。各クラスターに、可視化の容易さのために独自の識別子が割り当てられ、同じ識別子を有する全ての選択されたゲノム遺伝子座は、同じクラスターに属する。クラスター化プロセスの後、代表的な選択されたゲノム遺伝子座を、各クラスターから選択した。これは、各クラスター内の、そのクラスターの重心に最も近かった、選択されたゲノム遺伝子座を選択することによって実施した。３２のそれぞれのクラスターの各々の重心に最も近いとして選択された最適なゲノム遺伝子座の染色体分布を示す模式図を示す図である。標的化検証のために選択された最適なゲノム遺伝子座のダイズ染色体位置を示す模式図を示す図である。非相同末端結合（ＮＨＥＪ）を介した組込みのための普遍的ドナーポリヌクレオチド配列を示す図である。２つの提案されたベクターが提供され、目的のＤＮＡ（ＤＮＡＸ）は、目的のＤＮＡのいずれかの末端において、１または複数の（即ち、「１〜Ｎ」の）ジンクフィンガー結合部位（ＺＦＮＢＳ）を含む。垂直矢印は、独自の制限部位を示し、水平矢印は、潜在的ＰＣＲプライマー部位を示す。相同組換え修復（ＨＤＲ）を介した組込みのための普遍的ドナーポリヌクレオチド配列を示す図である。目的のＤＮＡ（ＤＮＡＸ）は、目的のＤＮＡに隣接する相同配列（ＨＡ）の２つの領域を含み、ジンクフィンガーヌクレアーゼ結合部位（ＺＦＮ）が、ＤＮＡＸ配列およびＨＡ配列を挟む。垂直矢印は、独自の制限部位を示し、水平矢印は、潜在的ＰＣＲプライマー部位を示す。ＮＨＥＪベースの迅速標的化分析（ＲＴＡ）方法を使用した、ダイズの選択されたゲノム遺伝子座標的の検証を示す図である。ｐＤＡＢ１２４２８０（配列番号７５６１）のプラスミドマップを示す図である。番号付けしたエレメント（即ち、ＧｍＰＰＬ０１ＺＦ３９１ＲおよびＧＭＰＰＬ０１ＺＦ３９１Ｌ）は、対応するジンクフィンガーヌクレアーゼタンパク質によって認識および切断される、約２０〜３５塩基対長のジンクフィンガーヌクレアーゼ結合配列と対応する。これらのジンクフィンガー結合配列および注釈付きの「ＵＺＩ配列」（これは、制限部位およびプライマー設計のためのＤＮＡ配列またはコード配列を含む、１００〜１５０ｂｐの鋳型領域である）は、普遍的ドナーカセットを含む。さらに、このプラスミド設計には、プラスミドベクター内の普遍的ドナーカセットのハイスループットアセンブリ（即ち、Ｇｉｂｓｏｎアセンブリを介する）のための、プラスミドベクターと相同性を共有する配列である「１０４１１３オーバーラップ」が含まれる。ｐＤＡＢ１２４２８１（配列番号７５６２）のプラスミドマップを示す図である。番号付けしたエレメント（即ち、ＧｍＰＰＬ０２ＺＦ４１１ＲおよびＧＭＰＰＬ０２ＺＦ４１１Ｌ）は、対応するジンクフィンガーヌクレアーゼタンパク質によって認識および切断される、約２０〜３５塩基対長のジンクフィンガーヌクレアーゼ結合配列と対応する。これらのジンクフィンガー結合配列および注釈付きの「ＵＺＩ配列」（これは、制限部位およびプライマー設計のためのＤＮＡ配列またはコード配列を含む、１００〜１５０ｂｐの鋳型領域である）は、普遍的ドナーカセットを含む。さらに、このプラスミド設計には、プラスミドベクター内の普遍的ドナーカセットのハイスループットアセンブリ（即ち、Ｇｉｂｓｏｎアセンブリを介する）のための、プラスミドベクターと相同性を共有する配列である「１０４１１３オーバーラップ」が含まれる。ｐＤＡＢ１２１２７８（配列番号７５６３）のプラスミドマップを示す図である。番号付けしたエレメント（即ち、ＧｍＰＰＬ１８＿４およびＧＭＰＰＬ１８＿３）は、対応するジンクフィンガーヌクレアーゼタンパク質によって認識および切断される、約２０〜３５塩基対長のジンクフィンガーヌクレアーゼ結合配列と対応する。これらのジンクフィンガー結合配列および注釈付きの「ＵＺＩ配列」（これは、制限部位およびプライマー設計のためのＤＮＡ配列またはコード配列を含む、１００〜１５０ｂｐの鋳型領域である）は、普遍的ドナーカセットを含む。さらに、このプラスミド設計には、プラスミドベクター内の普遍的ドナーカセットのハイスループットアセンブリ（即ち、Ｇｉｂｓｏｎアセンブリを介する）のための、プラスミドベクターと相同性を共有する配列である「１０４１１３オーバーラップ」が含まれる。ｐＤＡＢ１２３８１２（配列番号７５６４）のプラスミドマップを示す図である。番号付けしたエレメント（即ち、ＺＦ５３８ＲおよびＺＦ５３８Ｌ）は、対応するジンクフィンガーヌクレアーゼタンパク質によって認識および切断される、約２０〜３５塩基対長のジンクフィンガーヌクレアーゼ結合配列と対応する。これらのジンクフィンガー結合配列および注釈付きの「ＵＺＩ配列」（これは、制限部位およびプライマー設計のためのＤＮＡ配列またはコード配列を含む、１００〜１５０ｂｐの鋳型領域である）は、普遍的ドナーカセットを含む。さらに、このプラスミド設計には、プラスミドベクター内の普遍的ドナーカセットのハイスループットアセンブリ（即ち、Ｇｉｂｓｏｎアセンブリを介する）のための、プラスミドベクターと相同性を共有する配列である「１０４１１３オーバーラップ」が含まれる。ｐＤＡＢ１２１９３７（配列番号７５６５）のプラスミドマップを示す図である。番号付けしたエレメント（即ち、ＧｍＰＰＬ３４ＺＦ５９８Ｌ、ＧｍＰＰＬ３４ＺＦ５９８Ｒ、ＧｍＰＰＬ３６ＺＦ５９９Ｌ、ＧｍＰＰＬ３６ＺＦ５９９Ｒ、ＧｍＰＰＬ３６ＺＦ６００ＬおよびＧｍＰＰＬ３６ＺＦ６００Ｒ）は、対応するジンクフィンガーヌクレアーゼタンパク質によって認識および切断される、約２０〜３５塩基対長のジンクフィンガーヌクレアーゼ結合配列と対応する。これらのジンクフィンガー結合配列および注釈付きの「ＵＺＩ配列」（これは、制限部位およびプライマー設計のためのＤＮＡ配列またはコード配列を含む、１００〜１５０ｂｐの鋳型領域である）は、普遍的ドナーカセットを含む。さらに、このプラスミド設計には、プラスミドベクター内の普遍的ドナーカセットのハイスループットアセンブリ（即ち、Ｇｉｂｓｏｎアセンブリを介する）のための、プラスミドベクターと相同性を共有する配列である「１０４１１３オーバーラップ」が含まれる。ｐＤＡＢ１２３８１１（配列番号７５６６）のプラスミドマップを示す図である。番号付けしたエレメント（即ち、ＺＦ５６０ＬおよびＺＦ５６０Ｒ）は、対応するジンクフィンガーヌクレアーゼタンパク質によって認識および切断される、約２０〜３５塩基対長のジンクフィンガーヌクレアーゼ結合配列と対応する。これらのジンクフィンガー結合配列および注釈付きの「ＵＺＩ配列」（これは、制限部位およびプライマー設計のためのＤＮＡ配列またはコード配列を含む、１００〜１５０ｂｐの鋳型領域である）は、普遍的ドナーカセットを含む。さらに、このプラスミド設計には、プラスミドベクター内の普遍的ドナーカセットのハイスループットアセンブリ（即ち、Ｇｉｂｓｏｎアセンブリを介する）のための、プラスミドベクターと相同性を共有する配列である「１０４１１３オーバーラップ」が含まれる。ｐＤＡＢ１２４８６４（配列番号７５６７）のプラスミドマップを示す図である。番号付けしたエレメント（即ち、ＺＦ６３１ＬおよびＺＦ６３１Ｒ）は、対応するジンクフィンガーヌクレアーゼタンパク質によって認識および切断される、約２０〜３５塩基対長のジンクフィンガーヌクレアーゼ結合配列と対応する。これらのジンクフィンガー結合配列および注釈付きの「ＵＺＩ配列」（これは、制限部位およびプライマー設計のためのＤＮＡ配列またはコード配列を含む、１００〜１５０ｂｐの鋳型領域である）は、普遍的ドナーカセットを含む。さらに、このプラスミド設計には、プラスミドベクター内の普遍的ドナーカセットのハイスループットアセンブリ（即ち、Ｇｉｂｓｏｎアセンブリを介する）のための、プラスミドベクターと相同性を共有する配列である「１０４１１３オーバーラップ」が含まれる。ｐＤＡＢ７２２１（配列番号７５６９）のプラスミドマップを示す図である。このプラスミドは、ＧＦＰタンパク質を駆動し、アグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）（ＡｔｕＯＲＦ２４３’ＵＴＲ）が隣接する、キャッサバ葉脈モザイクウイルス（Cassava Vein Mosaic Virus）プロモーター（ＣｓＶＭＶ）を含む。同定された最適な非遺伝子ダイズ遺伝子座についての特徴（長さ、遺伝子座の４０Ｋｂ以内のコード領域の発現、および組換え頻度）のヒストグラムを示す図である。図１５Ａは、最適なゲノム遺伝子座（ＯＧＬ）のポリヌクレオチド配列長の分布を示す。同定された最適な非遺伝子ダイズ遺伝子座についての特徴（長さ、遺伝子座の４０Ｋｂ以内のコード領域の発現、および組換え頻度）のヒストグラムを示す図である。図１５Ｂは、それらの組換え頻度に対する、最適な非遺伝子トウモロコシ遺伝子座の分布を示す。同定された最適な非遺伝子ダイズ遺伝子座についての特徴（長さ、遺伝子座の４０Ｋｂ以内のコード領域の発現、および組換え頻度）のヒストグラムを示す図である。図１５Ｃは、最適なゲノム遺伝子座（ＯＧＬ）への近位性（ｌｏｇスケール）に対する、発現された核酸配列の分布を示す。

定義
本発明を説明および特許請求する際に、以下の用語法が、以下に示す定義に従って使用される。

用語「約」は、本明細書で使用する場合、述べられた値または値の範囲よりも１０パーセント大きいまたは小さいことを意味するが、任意の値または値の範囲をこのより広い定義のみに指定することは意図しない。用語「約」が先行する各値または値の範囲は、述べられた絶対値または絶対値の範囲の実施形態を包含することも意図する。

本明細書で使用する場合、用語「植物」は、植物全体および植物の任意の子孫、細胞、組織または部分を含む。用語「植物部分」は、例えば以下が含まれるがこれらに限定されない、植物の任意の部分を含む：種子（成熟種子および未成熟種子を含む）；植物挿し木；植物細胞；植物細胞培養物；植物器官（例えば、花粉、胚、花、果実、苗条、葉、根、茎および外植片）。植物組織または植物器官は、種子、カルス、または構造的もしくは機能的単位へと組織化される植物細胞の任意の他の群であり得る。植物細胞または組織培養物は、その細胞または組織が取得された植物の生理学的特徴および形態学的特徴を有する植物を再生することが可能であり得、その植物と実質的に同じ遺伝子型を有する植物を再生することが可能であり得る。対照的に、一部の植物細胞は、植物を産生するために再生することが不可能である。植物細胞または組織培養物中の再生可能な細胞は、胚、プロトプラスト、成長点細胞、カルス、花粉、葉、葯、根、根端、トウモロコシの毛（silk）、花、穀粒、穂、トウモロコシの穂軸、トウモロコシの皮（husk）またはトウモロコシの軸（stalk）であり得る。

植物部分には、収穫可能な部分および後代植物の繁殖に有用な部分が含まれる。繁殖に有用な植物部分には、例えば以下が含まれるがこれらに限定されない：種子；果実；挿し木；実生；塊茎；および台木。植物の収穫可能な部分は、例えば以下が含まれるがこれらに限定されない、植物の任意の有用な部分であり得る：花；花粉；実生；塊茎；葉；茎；果実；種子；および根。

植物細胞は、植物の構造的および生理学的単位である。植物細胞には、本明細書で使用する場合、プロトプラストおよび細胞壁を有するプロトプラストが含まれる。植物細胞は、単離された単一の細胞、または細胞の凝集物（例えば、脆弱なカルスおよび培養された細胞）の形態であり得、より高次の組織化された単位（例えば、植物組織、植物器官および植物）の部分であり得る。したがって、植物細胞は、植物全体へと再生できる、プロトプラスト、配偶子産生細胞、または細胞もしくは細胞の収集物であり得る。このように、複数の植物細胞を含み、植物全体へと再生することが可能な種子は、本明細書の実施形態では、「植物部分」とみなされる。

用語「プロトプラスト」とは、本明細書で使用する場合、その細胞壁が完全にまたは部分的に除去され、その脂質二重膜がむき出しになった植物細胞を指す。典型的には、プロトプラストは、細胞培養物または植物全体への再生の潜在力を有する、細胞壁のない単離された植物細胞である。

本明細書で使用する場合、用語「ネイティブ」または「天然の」は、天然に見出される状態を規定する。「ネイティブＤＮＡ配列」は、天然の手段または伝統的な育種技術によって産生されたが、遺伝子操作によって（例えば、分子生物学／形質転換技術を使用して）生成されたわけではない、天然に存在するＤＮＡ配列である。

本明細書で使用する場合、「内因性配列」は、生物中または生物のゲノム中のその天然の位置における、ネイティブ形態のポリヌクレオチド、遺伝子またはポリペプチドを規定する。

用語「単離された」は、本明細書で使用する場合、その天然の環境から取り出されていることを意味する。

用語「精製された」は、本明細書で使用する場合、ネイティブまたは天然の環境においてその分子または化合物と通常関連する夾雑物を実質的に含まない形態での分子または化合物の単離に関し、元の組成物の他の成分から分離された結果として純度が増加していることを意味する。用語「精製された核酸」は、ポリペプチド、脂質および炭水化物が含まれるがこれらに限定されない他の化合物から分離された核酸配列を説明するために、本明細書で使用される。

用語「ポリペプチド」、「ペプチド」および「タンパク質」は、アミノ酸残基のポリマーを指すために、相互交換可能に使用される。この用語は、１または複数のアミノ酸が、対応する天然に存在するアミノ酸の化学的アナログまたは改変された誘導体である、アミノ酸ポリマーにも適用される。

本明細書で使用する場合、「最適な双子葉ゲノム遺伝子座」、「最適な非遺伝子双子葉遺伝子座」、「最適な非遺伝子遺伝子座」または「最適なゲノム遺伝子座（ＯＧＬ）」は、以下の特性：非遺伝子、低メチル化された、標的化可能な、および遺伝子領域の近位の位置にある、を有する、双子葉植物の核ゲノムにおいて見出されるネイティブＤＮＡ配列であり、この最適な双子葉ゲノム遺伝子座の周囲のゲノム領域は、組換えの証拠を示す。

本明細書で使用する場合、用語「最適なダイズゲノム遺伝子座」、「最適な非遺伝子ダイズ遺伝子座」、「最適な非遺伝子遺伝子座」または「最適なゲノム遺伝子座（ＯＧＬ）」は、以下の特性：非遺伝子、低メチル化された、標的化可能な、および遺伝子領域の近位の位置にある、を有する、双子葉植物の核ゲノムにおいて見出されるネイティブＤＮＡ配列を指定するために、相互交換可能に使用され、この最適な双子葉ゲノム遺伝子座の周囲のゲノム領域は、組換えの証拠を示す。

本明細書で使用する場合、用語「非遺伝子双子葉配列」または「非遺伝子双子葉ゲノム配列」は、少なくとも１Ｋｂの長さを有し、オープンリーディングフレーム、遺伝子配列または遺伝子調節配列をいずれも欠く、双子葉植物の核ゲノムにおいて見出されるネイティブＤＮＡ配列を指定するために、相互交換可能に使用される。さらに、この非遺伝子双子葉配列は、いずれのイントロン配列も含まない（即ち、イントロンは、非遺伝子の定義から排除される）。この非遺伝子配列は、転写もタンパク質へと翻訳もされ得ない。多くの植物ゲノムは、非遺伝子領域を含む。ゲノムの９５％もが、非遺伝子であり得、これらの領域は、主に反復性ＤＮＡから構成され得る。

本明細書で使用する場合、用語「非遺伝子ダイズ配列」または「非遺伝子ダイズゲノム配列」は、少なくとも１Ｋｂの長さを有し、オープンリーディングフレーム、遺伝子配列または遺伝子調節配列をいずれも欠く、ダイズ植物の核ゲノムにおいて見出されるネイティブＤＮＡ配列を指定するために、相互交換可能に使用される。さらに、この非遺伝子ダイズ配列は、いずれのイントロン配列も含まない（即ち、イントロンは、非遺伝子の定義から排除される）。この非遺伝子配列は、転写もタンパク質へと翻訳もされ得ない。多くの植物ゲノムは、非遺伝子領域を含む。ゲノムの９５％もが、非遺伝子であり得、これらの領域は、主に反復性ＤＮＡから構成され得る。

本明細書で使用する場合、「遺伝子領域」は、ＲＮＡおよび／またはポリペプチドをコードするオープンリーディングフレームを含むポリヌクレオチド配列として定義される。この遺伝子領域は、コード領域の最大約２Ｋｂ上流かつコード領域の１Ｋｂ下流であるが、場合によりさらに上流または下流の、オープンリーディングフレームの発現の調節に関与する任意の同定可能な隣接する５’および３’の非コードヌクレオチド配列もまた包含し得る。遺伝子領域は、この遺伝子領域中に存在し得る任意のイントロンをさらに含む。さらに、この遺伝子領域は、単一の遺伝子配列、または短いスパン（１Ｋｂ未満）の非遺伝子配列がちりばめられた複数の遺伝子配列を含み得る。

本明細書で使用する場合、「目的の核酸」、「目的のＤＮＡ」または「ドナー」は、ダイズゲノムなどの双子葉ゲノム中への部位特異的な標的化された挿入のために選択された核酸／ＤＮＡ配列として定義される。目的の核酸は、任意の長さのもの、例えば、２ヌクレオチド長と５０，０００ヌクレオチド長との間（または、それらの間またはそれらを上回る任意の整数値）、好ましくは約１，０００ヌクレオチド長と５，０００ヌクレオチド長の間（またはそれらの間の任意の整数値）のものであり得る。目的の核酸は、活発に転写されたおよび／または翻訳された遺伝子配列をさらに含む１または複数の遺伝子発現カセットを含み得る。逆に、この目的の核酸は、機能的遺伝子発現カセットも遺伝子全体も含まないポリヌクレオチド配列を含み得る（例えば、プロモーターなどの調節配列を単に含み得る）か、または任意の同定可能な遺伝子発現エレメントもしくは任意の活発に転写された遺伝子配列を含まない可能性がある。この目的の核酸は、任意選択で分析ドメインを含み得る。例えばダイズの双子葉ゲノム中への目的の核酸の挿入に際し、挿入された配列は、「挿入された目的のＤＮＡ」と呼ばれる。さらに、この目的の核酸は、ＤＮＡまたはＲＮＡであり得、線状または環状であり得、一本鎖または二本鎖であり得る。この目的の核酸は、ネイキッド核酸として、１もしくは複数の送達剤（例えば、リポソーム、ポロキサマー、タンパク質でカプセル化されたＴ鎖など）との複合体として、あるいは細菌またはウイルス送達ビヒクル、例えば、それぞれ、アグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）またはアデノウイルスもしくはアデノ随伴ウイルス（ＡＡＶ）などの中に含まれて、細胞に送達され得る。

本明細書で使用する場合、用語「分析ドメイン」は、核酸配列の標的化された挿入を補助する機能的エレメントを含む核酸配列を規定する。例えば、分析ドメインは、特に設計された制限酵素部位、ジンクフィンガー結合部位、操作されたランディングパッド（landing pad）または操作された導入遺伝子組込みプラットホームを含み得、遺伝子調節エレメントまたはオープンリーディングフレームを含んでも含まなくてもよい。例えば、その全体が参照により本明細書に組み込まれる、米国特許出願公開第２０１１０１９１８９９号を参照のこと。

本明細書で使用する場合、用語「選択された双子葉配列」は、この配列が最適な非遺伝子双子葉ゲノム遺伝子座として適格であるか否かを決定するための分析のために選択された双子葉植物のネイティブゲノムＤＮＡ配列を規定する。

本明細書で使用する場合、用語「選択されたダイズ配列」は、この配列が最適な非遺伝子双子葉ゲノム遺伝子座として適格であるか否かを決定するための分析のために選択されたダイズ植物のネイティブゲノムＤＮＡ配列を規定する。

本明細書で使用する場合、ＤＮＡ配列に関して、用語「低メチル化」または「低メチル化された」は、ＤＮＡの所与の配列中のメチル化されたＤＮＡヌクレオチド残基の低減された状態を規定する。典型的には、減少したメチル化は、ダイズ植物などの双子葉植物のゲノム中に存在する非遺伝子配列において見出されるメチル化の平均レベルと比較した、メチル化されたアデニン残基またはシトシン残基の数に関する。

本明細書で使用する場合、「標的化可能な配列」は、１つの特定の配列中への目的の核酸の部位特異的な標的化された挿入を可能にするために、核ゲノムにおいて十分に独自である、ポリヌクレオチド配列である。

本明細書で使用する場合、用語「非反復的」配列は、ダイズなどの双子葉植物のゲノム内の任意の他の配列と４０％未満の同一性を共有する、長さが少なくとも１Ｋｂの配列として定義される。配列同一性の計算は、例えば、デフォルトパラメーター設定を使用するＮＣＢＩＢＬＡＳＴ（商標）＋ソフトウェア（バージョン２．２．２５）実行を使用するＢＬＡＳＴ（商標）ベースの相同性検索を使用して、双子葉ゲノム、例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノムに対して、選択されたゲノム配列をスキャンすることを含む、当業者に公知の任意の標準的な技術を使用して決定され得る（Stephen F. Altschul et al (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402）。例えば、選択されたダイズ配列（ダイズ（Glycine max）ｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノム由来）を分析した場合、かかる検索から同定された第１のＢＬＡＳＴ（商標）ヒットは、双子葉配列、例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２配列自体を示す。各選択されたダイズ配列についての第２のＢＬＡＳＴ（商標）ヒットを同定し、このヒットのアラインメントカバー度（ＢＬＡＳＴ（商標）ヒットによってカバーされた選択されたダイズ配列のパーセントとして示される）を、ダイズなどの双子葉植物のゲノム内の選択されたダイズ配列の独自性の尺度として使用した。第２のＢＬＡＳＴ（商標）ヒットについてのこれらのアラインメントカバー度値は、最小０％〜最大３９．９７％までの配列同一性の範囲であった。より高いレベルの配列同一性でアラインしたいずれの配列も、考慮しなかった。

用語「遺伝子領域の近位の位置に」は、非遺伝子配列に関して使用する場合、遺伝子領域に対する非遺伝子配列の相対的位置を規定する。具体的には、４０Ｋｂ近隣以内（即ち、選択された最適なダイズゲノム遺伝子座配列のいずれかの末端の４０Ｋｂ以内）の遺伝子領域の数が分析される。この分析を、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅなどの単子葉ゲノムデータベースから抽出された、ダイズなどの既知の双子葉のゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置をアッセイすることによって、完了した。最適な非遺伝子ダイズゲノム遺伝子座の各々、例えば、７，０１８の最適な非遺伝子ダイズゲノム遺伝子座について、最適なゲノム遺伝子座配列の周囲の４０Ｋｂウインドウを規定し、このウインドウとオーバーラップする位置を有する注釈付きの遺伝子の数を計数した。遺伝子領域の数は、４０Ｋｂ近隣以内に、最小１遺伝子〜最大１８遺伝子までの範囲であった。

用語「既知のダイズコード配列」は、本明細書で使用する場合、オープンリーディングフレームを含み、適切な遺伝子調節エレメントの制御下に配置した場合に、イントロン配列のプロセシングの前または後のいずれかに、ｍＲＮＡへと転写され、任意選択でタンパク質配列へと翻訳される、ＳｏｙｂｅａｎＧｅｎｏｍｉｃＤａｔａｂａｓｅ（ｗｗｗ．ｓｏｙｂａｓｅ．ｏｒｇ、Shoemaker, R.C. et al. SoyBase, the USDA-ARS soybean genetics and genomics database. Nucleic Acids Res. 2010 Jan;38(Database issue):D843-6.）を含む任意の双子葉ゲノムデータベースから同定された任意のポリヌクレオチド配列に関する。この既知のダイズコード配列は、ｃＤＮＡ配列またはゲノム配列であり得る。一部の例では、この既知のダイズコード配列は、機能的タンパク質として注釈が付けられ得る。他の例では、この既知のダイズコード配列は、注釈付きでなくてもよい。

用語「予測された双子葉コード配列」は、本明細書で使用する場合、ＳｏｙｂｅａｎＧｅｎｏｍｉｃＤａｔａｂａｓｅなどの双子葉ゲノムデータベース中に記載される任意の発現配列タグ（ＥＳＴ）ポリヌクレオチド配列に関する。ＥＳＴは、逆転写酵素による第１鎖合成を指向するためにオリゴ（ｄＴ）プライマーを使用して構築されたｃＤＮＡライブラリーから同定される。得られたＥＳＴは、ｃＤＮＡ挿入物の５’末端または３’末端のいずれかから取得された５００ｂｐ未満の単一パス配列決定読み取りである。複数のＥＳＴが、単一のコンティグへとアラインされ得る。同定されたＥＳＴ配列は、ＳｏｙｂｅａｎＧｅｎｏｍｉｃＤａｔａｂａｓｅなどの双子葉ゲノムデータベース中にアップロードされ、適切な遺伝子調節エレメントの制御下に配置した場合にｍＲＮＡへと転写され、任意選択でタンパク質配列へと翻訳されるコード配列を含む対応するゲノムポリヌクレオチド配列を予測するために、バイオインフォマティクス方法を介して検索され得る。

用語「予測されたダイズコード配列」は、本明細書で使用する場合、ＳｏｙｂｅａｎＧｅｎｏｍｉｃＤａｔａｂａｓｅなどのダイズゲノムデータベース中に記載される任意の発現配列タグ（ＥＳＴ）ポリヌクレオチド配列に関する。ＥＳＴは、逆転写酵素による第１鎖合成を指向するためにオリゴ（ｄＴ）プライマーを使用して構築されたｃＤＮＡライブラリーから同定される。得られたＥＳＴは、ｃＤＮＡ挿入物の５’末端または３’末端のいずれかから取得された５００ｂｐ未満の単一パス配列決定読み取りである。複数のＥＳＴが、単一のコンティグへとアラインされ得る。同定されたＥＳＴ配列は、ＳｏｙｂｅａｎＧｅｎｏｍｉｃＤａｔａｂａｓｅなどのダイズゲノムデータベース中にアップロードされ、適切な遺伝子調節エレメントの制御下に配置した場合にｍＲＮＡへと転写され、任意選択でタンパク質配列へと翻訳されるコード配列を含む対応するゲノムポリヌクレオチド配列を予測するために、バイオインフォマティクス方法を介して検索され得る。

用語「組換えの証拠」は、本明細書で使用する場合、選択されたダイズ配列を含む染色体領域にわたる、ダイズゲノムマーカーなどの双子葉ゲノムマーカーの任意の対の間での減数分裂組換え頻度に関する。この組換え頻度は、マーカー間の遺伝的距離（センチモルガン（ｃＭ））の、マーカー間の物理的距離（メガベース（Ｍｂ））に対する比率に基づいて計算された。組換えの証拠を有する選択されたダイズ配列について、この選択されたダイズ配列は、複数のマッピング集団から生成された高解像度マーカーデータセットを使用して検出されるように、選択されたダイズ配列に隣接する２つのマーカー間に少なくとも１つの組換え事象を含まなくてはならない。

本明細書で使用する場合、用語「相対的位置値」は、その対応する染色体セントロメアからのゲノム遺伝子座の距離を規定する、計算された値である。各選択されたダイズ配列について、それが位置する染色体のセントロメアまでの、選択されたダイズ配列のネイティブ位置からのゲノム距離は、（Ｂｐで）測定される。染色体内の選択されたダイズ配列の相対的位置は、それが存在する特定の染色体アームの長さ（Ｂｐで測定される）に対する、セントロメアまでのそのゲノム距離の比率として、表される。最適な非遺伝子ダイズゲノム遺伝子座についてのこれらの相対的位置値は、異なる双子葉植物について生成され得、ダイズデータセットについての相対的位置値は、最小０〜最大０．９９６８２のゲノム距離の比率の範囲であった。

用語「外因性ＤＮＡ配列」は、本明細書で使用する場合、そのネイティブ位置から取り出され、移動された核酸配列に隣接する配列を変更する新たな位置中に挿入された、任意の核酸配列である。例えば、外因性ＤＮＡ配列は、別の種由来の配列を含み得る。

「結合」とは、高分子間（例えば、タンパク質と核酸との間）の配列特異的相互作用を指す。その相互作用が全体として配列特異的である限り、結合相互作用の全ての成分が配列特異的である必要はない（例えば、ＤＮＡ骨格中のリン酸残基との接触）。かかる相互作用は、一般に、解離定数（Ｋｄ）によって特徴付けられる。「親和性」とは、結合の強度を指す：増加した結合親和性は、より低い結合定数（Ｋｄ）と相関する。

「結合タンパク質」は、別の分子に結合することができるタンパク質である。結合タンパク質は、例えば、ＤＮＡ分子（ＤＮＡ結合タンパク質）、ＲＮＡ分子（ＲＮＡ結合タンパク質）および／またはタンパク質分子（タンパク質結合タンパク質）に結合し得る。タンパク質結合タンパク質の場合、これは、（ホモダイマー、ホモトリマーなどを形成するために）それ自体に結合し得、および／または異なるタンパク質（単数もしくは複数）の１もしくは複数の分子に結合し得る。結合タンパク質は、１よりも多い型の結合活性を有し得る。例えば、ジンクフィンガータンパク質は、ＤＮＡ結合活性、ＲＮＡ結合活性およびタンパク質結合活性を有する。

本明細書で使用する場合、用語「ジンクフィンガー」は、その構造が亜鉛イオンの配位を介して安定化される、ＤＮＡ結合タンパク質の結合ドメイン内のアミノ酸配列の領域を規定する。

「ジンクフィンガーＤＮＡ結合タンパク質」（または結合ドメイン）は、その構造が亜鉛イオンの配位を介して安定化される、結合ドメイン内のアミノ酸配列の領域である１または複数のジンクフィンガーを介して、配列特異的様式でＤＮＡを結合する、タンパク質、またはより大きいタンパク質内のドメインである。用語、ジンクフィンガーＤＮＡ結合タンパク質は、ジンクフィンガータンパク質またはＺＦＰと略される場合が多い。ジンクフィンガー結合ドメインは、所定のヌクレオチド配列に結合するように「操作され」得る。ジンクフィンガータンパク質を操作するための方法の非限定的な例は、設計および選択である。設計されたジンクフィンガータンパク質は、その設計／組成が合理的基準から主に生じる、天然に存在しないタンパク質である。設計のための合理的基準には、既存のＺＦＰの設計および結合データの情報を保存するデータベース中の情報を処理するための置換ルールおよびコンピューターアルゴリズムの適用が含まれる。例えば、米国特許第６，１４０，０８１号；同第６，４５３，２４２号；同第６，５３４，２６１号および同第６，７９４，１３６号を参照のこと；ＷＯ９８／５３０５８；ＷＯ９８／５３０５９；ＷＯ９８／５３０６０；ＷＯ０２／０１６５３６およびＷＯ０３／０１６４９６もまた参照のこと。

「ＴＡＬＥＤＮＡ結合ドメイン」または「ＴＡＬＥ」は、１または複数のＴＡＬＥ反復ドメイン／単位を含むポリペプチドである。これらの反復ドメインは、その同族標的ＤＮＡ配列へのＴＡＬＥの結合に関与する。単一の「反復単位」（「反復」とも呼ばれる）は、典型的には、３３〜３５アミノ酸長であり、天然に存在するＴＡＬＥタンパク質内の他のＴＡＬＥ反復配列と少なくとも幾分かの配列相同性を示す。例えば、その全体が参照により本明細書に組み込まれる米国特許出願公開第２０１１０３０１０７３号を参照のこと。

ＣＲＩＳＰＲ（クラスター化して規則的な配置の短い回文配列リピート）／Ｃａｓ（ＣＲＩＳＰＲ関連）ヌクレアーゼ系。簡潔に述べると、「ＣＲＩＳＰＲＤＮＡ結合ドメイン」は、ゲノムＤＮＡを選択的に認識、結合および切断し得るＣＡＳ酵素と協調する短鎖ＲＮＡ分子である。このＣＲＩＳＰＲ／Ｃａｓ系は、ゲノム中の所望の標的において二本鎖破断（ＤＳＢ）を創出するように操作され得、ＤＳＢの修復は、エラープローン修復における増加を引き起こす修復阻害剤の使用によって影響され得る。例えば、Jinek et al (2012) Science 337, p. 816-821, Jinek et al, (2013), eLife 2:e00471およびDavid Segal, (2013) eLife 2:e00563）を参照のこと。

ジンクフィンガー、ＣＲＩＳＰＲおよびＴＡＬＥ結合ドメインは、例えば、天然に存在するジンクフィンガーの認識らせん領域の操作（１または複数のアミノ酸を変更する）を介して、所定のヌクレオチド配列に結合するように「操作され」得る。同様に、ＴＡＬＥは、例えば、ＤＮＡ結合に関与するアミノ酸（反復可変二残基またはＲＶＤ領域）の操作によって、所定のヌクレオチド配列に結合するように「操作され」得る。したがって、操作されたＤＮＡ結合タンパク質（ジンクフィンガーまたはＴＡＬＥ）は、天然に存在しないタンパク質である。ＤＮＡ結合タンパク質を操作するための方法の非限定的な例は、設計および選択である。設計されたＤＮＡ結合タンパク質は、その設計／組成が合理的基準から主に生じる、天然に存在しないタンパク質である。設計のための合理的基準には、既存のＺＦＰおよび／またはＴＡＬＥの設計および結合データの情報を保存するデータベース中の情報を処理するための置換ルールおよびコンピューターアルゴリズムの適用が含まれる。例えば、米国特許第６，１４０，０８１号；同第６，４５３，２４２号；および同第６，５３４，２６１号を参照のこと；ＷＯ９８／５３０５８；ＷＯ９８／５３０５９；ＷＯ９８／５３０６０；ＷＯ０２／０１６５３６およびＷＯ０３／０１６４９６ならびに米国特許出願公開第２０１１０３０１０７３号、同第２０１１０２３９３１５号および同第２０１１９１４５９４０号もまた参照のこと。

「選択された」ジンクフィンガータンパク質、ＣＲＩＳＰＲまたはＴＡＬＥは、その産生が、ファージディスプレイ、相互作用トラップまたはハイブリッド選択などの経験的プロセスから主に生じる、天然に見出されないタンパク質である。例えば、米国特許第５，７８９，５３８号；米国特許第５，９２５，５２３号；米国特許第６，００７，９８８号；米国特許第６，０１３，４５３号；米国特許第６，２００，７５９号；ＷＯ９５／１９４３１；ＷＯ９６／０６１６６；ＷＯ９８／５３０５７；ＷＯ９８／５４３１１；ＷＯ００／２７８７８；ＷＯ０１／６０９７０；ＷＯ０１／８８１９７およびＷＯ０２／０９９０８４ならびに米国特許出願公開第２０１１０３０１０７３号、同第２０１１０２３９３１５号および同第２０１１９１４５９４０号を参照のこと。

「組換え」とは、非相同末端結合（ＮＨＥＪ）および相同組換えによるドナー捕捉が含まれるがこれに限定されない、２つのポリヌクレオチド間の遺伝情報の交換のプロセスを指す。本開示の目的のために、「相同組換え（ＨＲ）」とは、例えば、相同組換え修復機構を介した細胞中の二本鎖破断の修復の間に起こる、特定化された形態のかかる交換を指す。このプロセスは、ヌクレオチド配列の相同性を必要とし、「標的」分子（即ち、二本鎖破断を経たヌクレオチド配列）の鋳型修復のために「ドナー」分子を使用し、「非クロスオーバー遺伝子変換」または「ショートトラクト（short tract）遺伝子変換」として種々に公知であるが、それは、このプロセスが、ドナーから標的への遺伝情報の移入をもたらすからである。任意の特定の理論に束縛されることは望まないが、かかる移入には、中断された標的とドナーとの間で形成するヘテロ二重鎖ＤＮＡのミスマッチ補正、および／または標的の一部となる遺伝情報を再合成するためにドナーが使用される「合成依存的鎖アニーリング」、および／または関連プロセスが関与し得る。かかる特定化されたＨＲは、標的分子の配列の変更を生じる場合が多く、その結果、ドナーポリヌクレオチドの配列の一部または全てが、標的ポリヌクレオチド中に取り込まれる。ＨＲ指向性組込みについて、ドナー分子は、少なくとも５０〜１００塩基対長の、ゲノムに対する相同性の少なくとも２つの領域（「相同性アーム」）を含む。例えば、米国特許出願公開第２０１１０２８１３６１号を参照のこと。

本開示の方法では、本明細書に記載される１または複数の標的化されたヌクレアーゼは、所定の部位において標的配列（例えば、細胞クロマチン）中に二本鎖破断を創出し、ＨＲ媒介性の組込みのための中断の領域中のヌクレオチド配列に対する相同性を有する、またはＮＨＥＪ媒介性の組込みのための中断の領域中のヌクレオチド配列に対する相同性を有さない「ドナー」ポリヌクレオチドが、細胞中に導入され得る。二本鎖破断の存在は、ドナー配列の組込みを促進することが示されている。このドナー配列は、物理的に組み込まれ得、またはあるいは、このドナーポリヌクレオチドは、相同組換えを介した中断の修復のための鋳型として使用され、細胞クロマチン中への、ドナー中のものと同様のヌクレオチド配列の全てまたは一部の導入を生じる。したがって、細胞クロマチン中の第１の配列が変更され得、特定の実施形態では、ドナーポリヌクレオチド中に存在する配列へと変換され得る。したがって、用語「置き換える」または「置き換え」の使用は、別のヌクレオチド配列による１つのヌクレオチド配列の置き換え（即ち、情報的意味での配列の置き換え）を示すと理解され得、別のポリヌクレオチドによる１つのポリヌクレオチドの物理的または化学的置き換えを必ずしも必要としない。

本明細書に記載される方法のいずれかにおいて、ジンクフィンガータンパク質、ＣＲＩＳＰＲＳまたはＴＡＬＥＮのさらなる対が、細胞内のさらなる標的部位のさらなる二本鎖切断のために使用され得る。

本明細書に記載される方法のいずれかが、目的の遺伝子の発現を破壊するドナー配列の標的化された組込みによる、細胞における任意のサイズのドナーの挿入、および／または１もしくは複数の標的配列の部分的もしくは完全な不活性化のために、使用され得る。部分的にまたは完全に不活性化された遺伝子を有する細胞株もまた提供される。

さらに、本明細書に記載される標的化された組込みの方法は、１または複数の外因性配列を組み込むためにも使用され得る。この外因性核酸配列は、例えば、１もしくは複数の遺伝子もしくはｃＤＮＡ分子、または任意の型のコード配列もしくは非コード配列、ならびに１もしくは複数の制御エレメント（例えば、プロモーター）を含み得る。さらに、この外因性核酸配列（導入遺伝子）は、１または複数のＲＮＡ分子（例えば、小ヘアピンＲＮＡ（ｓｈＲＮＡ）、阻害ＲＮＡ（ＲＮＡｉ）、ｍｉｃｒｏＲＮＡ（ｍｉＲＮＡ）など）またはタンパク質を産生し得る。

「切断」は、本明細書で使用する場合、ＤＮＡ分子のリン酸−糖骨格の中断を規定する。切断は、ホスホジエステル結合の酵素的または化学的加水分解が含まれるがこれらに限定されない種々の方法によって開始され得る。一本鎖切断および二本鎖切断の両方が可能であり、二本鎖切断が、２つの別個の一本鎖切断事象の結果として生じ得る。ＤＮＡ切断は、平滑末端または付着末端のいずれかの産生を生じ得る。特定の実施形態では、融合ポリペプチドが、標的化された二本鎖ＤＮＡ切断のために使用される。「切断ドメイン」は、ＤＮＡ切断のための触媒活性を有する１または複数のポリペプチド配列を含む。切断ドメインは、単一のポリペプチド鎖中に含まれ得、または切断活性は、２つ（またはそれ以上）のポリペプチドの会合から生じ得る。

「切断ハーフドメイン（half-domain）」は、第２のポリペプチド（同一または異なるのいずれか）と合わさって、切断活性（好ましくは二本鎖切断活性）を有する複合体を形成する、ポリペプチド配列である。用語「第１および第２の切断ハーフドメイン」；「＋および−の切断ハーフドメイン」ならびに「右および左の切断ハーフドメイン」は、ダイマー化する切断ハーフドメインの対を指すために、相互交換可能に使用される。

「操作された切断ハーフドメイン」は、別の切断ハーフドメイン（例えば、別の操作された切断ハーフドメイン）との義務的ヘテロダイマーを形成するように改変された切断ハーフドメインである。それらの全体が参照によって本明細書に組み込まれる、米国特許出願公開第２００５／００６４４７４号、同第２００７０２１８５２８号、同第２００８／０１３１９６２号および同第２０１１／０２０１０５５号もまた参照のこと。

「標的部位」または「標的配列」とは、結合が存在するのに十分な条件のときに、結合分子が結合する核酸の一部分を指す。

核酸は、ＤＮＡおよびＲＮＡを含み、一本鎖または二本鎖であり得；線状、分岐鎖または環状であり得；任意の長さのものであり得る。核酸には、二重鎖を形成することが可能な核酸、ならびに三重鎖形成核酸が含まれる。例えば、米国特許第５，１７６，９９６号および同第５，４２２，２５１号を参照のこと。タンパク質には、ＤＮＡ結合タンパク質、転写因子、クロマチンリモデリング因子、メチル化ＤＮＡ結合タンパク質、ポリメラーゼ、メチラーゼ、デメチラーゼ、アセチラーゼ、デアセチラーゼ、キナーゼ、ホスファターゼ、インテグラーゼ、リコンビナーゼ、リガーゼ、トポイソメラーゼ、ジャイレースおよびヘリカーゼが含まれるがこれらに限定されない。

「外因性核酸の産物」には、ポリヌクレオチド産物およびポリペプチド産物の両方、例えば、転写産物（ＲＮＡなどのポリヌクレオチド）および翻訳産物（ポリペプチド）が含まれる。

「融合」分子は、２以上のサブユニット分子が例えば共有結合により連結された分子である。これらのサブユニット分子は、同じ化学的型の分子であり得、または異なる化学的型の分子であり得る。第１の型の融合分子の例には、融合タンパク質（例えば、ＺＦＰＤＮＡ結合ドメインと切断ドメインとの間の融合物）および融合核酸（例えば、上記融合タンパク質をコードする核酸）が含まれるがこれらに限定されない。第２の型の融合分子の例には、三重鎖形成核酸とポリペプチドとの間の融合物、および副溝結合剤と核酸との間の融合物が含まれるがこれらに限定されない。細胞における融合タンパク質の発現は、細胞への融合タンパク質の送達から、または細胞への融合タンパク質をコードするポリヌクレオチドの送達によって生じ得、そこで、このポリヌクレオチドが転写され、転写物が翻訳されて、融合タンパク質を生成する。トランススプライシング、ポリペプチド切断およびポリペプチドライゲーションもまた、細胞におけるタンパク質の発現に関与し得る。細胞へのポリヌクレオチド送達およびポリペプチド送達のための方法は、本開示の他の場所に提示される。

本開示の目的のために、「遺伝子」は、遺伝子産物をコードするＤＮＡ領域（以下を参照のこと）、ならびにそのような調節配列がコード配列および／または転写された配列に隣接しているか否かまたは作動可能に連結されているか否かに関わらず、遺伝子産物の産生を調節する全てのＤＮＡ領域を含む。したがって、遺伝子には、プロモーター配列、ターミネーター、翻訳調節配列、例えば、リボソーム結合部位および内部リボソーム進入部位、エンハンサー、サイレンサー、インスレーター、境界エレメント、複製起点、マトリックス結合部位および遺伝子座制御領域が含まれるが、必ずしもこれらに限定されない。

「遺伝子発現」とは、遺伝子中に含まれる情報の、遺伝子産物への変換を指す。遺伝子産物は、遺伝子の直接的転写産物（例えば、ｍＲＮＡ、ｔＲＮＡ、ｒＲＮＡ、アンチセンスＲＮＡ、干渉ＲＮＡ、リボザイム、構造的ＲＮＡもしくは任意の他の型のＲＮＡ）またはｍＲＮＡの翻訳によって産生されるタンパク質であり得る。遺伝子産物には、キャッピング、ポリアデニル化、メチル化および編集などのプロセスによって改変されたＲＮＡ、ならびに例えば、メチル化、アセチル化、リン酸化、ユビキチン化、ＡＤＰ−リボシル化、ミリスチル化およびグリコシル化によって改変されたタンパク質もまた含まれる。

配列同一性：用語「配列同一性」または「同一性」とは、２つの核酸配列またはポリペプチド配列の文脈において本明細書で使用する場合、特定化された比較ウインドウにわたって最大の対応を求めてアラインさせた場合に同じである、２つの配列中の残基を指す。

本明細書で使用する場合、用語「配列同一性の百分率」とは、比較ウインドウにわたって２つの最適にアラインされた配列（例えば、核酸配列およびアミノ酸配列）を比較することによって決定される値を指し、ここで、比較ウインドウ中の配列の部分は、２つの配列の最適なアラインメントのために、参照配列（これは、付加も欠失も含まない）と比較して、付加または欠失（即ち、ギャップ）を含み得る。この百分率は、同一のヌクレオチドまたはアミノ酸残基が両方の配列中に存在する位置の数を決定して一致した位置の数を得、一致した位置の数を比較ウインドウ中の位置の総数によって除算し、その結果に１００を乗算して配列同一性の百分率を得ることによって、計算される。

比較のために配列をアラインするための方法は、当該分野で周知である。種々のプログラムおよびアラインメントアルゴリズムが、例えば以下に記載されている：Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman and Wunsch (1970) J. Mol. Biol. 48:443; Pearson and Lipman (1988) Proc. Natl. Acad. Sci. U.S.A. 85:2444; Higgins and Sharp (1988) Gene 73:237-44; Higgins and Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50。配列アラインメント方法および相同性計算の詳細な考察は、例えば、Altschul et al. (1990) J. Mol. Biol. 215:403-10中に見出され得る。ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ）ＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ（ＢＬＡＳＴ（商標）；Altschul et al. (1990)）は、いくつかの配列分析プログラムと関連した使用のために、ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（Ｂｅｔｈｅｓｄａ、ＭＤ）およびインターネット上を含むいくつかの供給源から入手可能である。このプログラムを使用して配列同一性を如何にして決定するかの記載は、ＢＬＡＳＴ（商標）について、「ヘルプ」セクションの下に、インターネット上で入手可能である。核酸配列の比較のために、ＢＬＡＳＴ（商標）（Ｂｌａｓｔｎ）プログラムの「Ｂｌａｓｔ２ｓｅｑｕｅｎｃｅｓ」関数が、デフォルトパラメーターを使用して用いられ得る。参照配列に対してさらに大きい類似性を有する核酸配列は、この方法によって評価した場合に、増加する百分率同一性を示す。

特異的にハイブリダイズ可能な／特異的に相補的な：本明細書で使用する場合、用語「特異的にハイブリダイズ可能な」および「特異的に相補的な」は、安定かつ特異的な結合が核酸分子と標的核酸分子との間で生じるような、十分な程度の相補性を示す用語である。２つの核酸分子間のハイブリダイゼーションには、２つの核酸分子の核酸配列間のアンチパラレルアラインメントの形成が関与する。次いで、これら２つの分子は、十分に安定な場合には当該分野で周知の方法を使用して検出可能である二重鎖分子を形成するために、反対の鎖上の対応する塩基と、水素結合を形成することができる。核酸分子は、特異的にハイブリダイズ可能であるために、その標的配列に対して１００％相補的である必要はない。しかし、ハイブリダイゼーションが特異的であるために存在すべき配列相補性の量は、使用されるハイブリダイゼーション条件の関数である。

特定の程度のストリンジェンシーを生じるハイブリダイゼーション条件は、選択されたハイブリダイゼーション方法の性質ならびにハイブリダイズする核酸配列の組成および長さに依存して変動する。一般に、ハイブリダイゼーションの温度およびハイブリダイゼーション緩衝液のイオン強度（特に、Ｎａ＋および／またはＭｇ＋＋濃度）は、ハイブリダイゼーションのストリンジェンシーを決定するが、洗浄回数もまた、ストリンジェンシーに影響する。特定の程度のストリンジェンシーを得るために必要とされるハイブリダイゼーション条件に関する計算は、当業者に公知であり、例えば、Sambrook et al. (ed.) Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, chapters 9 and 11；およびHames and Higgins (eds.) Nucleic Acid Hybridization, IRL Press, Oxford, 1985において議論されている。核酸のハイブリダイゼーションに関するさらに詳細な指導およびガイダンスは、例えば、Tijssen, “Overview of principles of hybridization and the strategy of nucleic acid probe assays,” in Laboratory Techniques in Biochemistry and Molecular Biology- Hybridization with Nucleic Acid Probes, Part I, Chapter 2, Elsevier, NY, 1993；およびAusubel et al., Eds., Current Protocols in Molecular Biology, Chapter 2, Greene Publishing and Wiley-Interscience, NY, 1995中に見出され得る。

本明細書で使用する場合、「ストリンジェントな条件」は、ハイブリダイゼーション分子と標的核酸分子内の配列との間の２０％未満のミスマッチが存在する場合にのみハイブリダイゼーションが生じる条件を包含する。「ストリンジェントな条件」は、さらなる特定のレベルのストリンジェンシーを含む。したがって、本明細書で使用する場合、「中程度のストリンジェンシー」の条件は、２０％よりも多い配列ミスマッチを有する分子がハイブリダイズしない条件である；「高いストリンジェンシー」の条件は、１０％よりも多いミスマッチを有する配列がハイブリダイズしない条件である；「非常に高いストリンジェンシー」の条件は、５％よりも多いミスマッチを有する配列がハイブリダイズしない条件である。以下は、代表的な非限定的なハイブリダイゼーション条件である。

高いストリンジェンシーの条件（少なくとも９０％の配列同一性を共有する配列を検出する）：６５℃で１６時間の５×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中でのハイブリダイゼーション；室温で各々１５分間の２×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中での２回の洗浄；ならびに６５℃で各々２０分間の０．５×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中での２回の洗浄。

中程度のストリンジェンシーの条件（少なくとも８０％の配列同一性を共有する配列を検出する）：６５〜７０℃で１６〜２０時間の５×〜６×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中でのハイブリダイゼーション；室温で各々５〜２０分間の２×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中での２回の洗浄；ならびに５５〜７０℃で各々３０分間の１×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中での２回の洗浄。

非ストリンジェントな対照条件（少なくとも５０％の配列同一性を共有する配列がハイブリダイズする）：室温〜５５℃で１６〜２０時間の６×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中でのハイブリダイゼーション；室温〜５５℃で各々２０〜３０分間の２×〜３×ＳＳＣ緩衝液（ここで、このＳＳＣ緩衝液は、ＳＤＳなどの界面活性剤、およびサケ精子ＤＮＡ、ＥＤＴＡなどのさらなる試薬などを含む）中での少なくとも２回の洗浄。

本明細書で使用する場合、連続する核酸配列に関して、用語「実質的に相同な」または「実質的な相同性」とは、ストリンジェントな条件下で参照核酸配列とハイブリダイズする、連続するヌクレオチド配列を指す。例えば、参照核酸配列と実質的に相同である核酸配列は、ストリンジェントな条件（例えば、上に示された中程度のストリンジェンシーの条件）下で参照核酸配列とハイブリダイズする、核酸配列である。実質的に相同な配列は、少なくとも８０％の配列同一性を有し得る。例えば、実質的に相同な配列は、約８０％〜１００％の配列同一性、例えば、約８１％；約８２％；約８３％；約８４％；約８５％；約８６％；約８７％；約８８％；約８９％；約９０％；約９１％；約９２％；約９３％；約９４％；約９５％；約９６％；約９７％；約９８％；約９８．５％；約９９％；約９９．５％および約１００％の配列同一性を有し得る。実質的な相同性の特性は、特異的ハイブリダイゼーションと密接に関連する。例えば、核酸分子は、特異的結合が望まれる条件下、例えば、ストリンジェントなハイブリダイゼーション条件下での非標的配列への核酸の非特異的結合を回避するために十分な程度の相補性が存在する場合、特異的にハイブリダイズ可能である。

一部の例では、「相同な」は、共通の先祖ＤＮＡ配列からの系統による、第１の遺伝子と第２の遺伝子との関連性を指すために使用され得る。かかる場合には、用語ホモログは、種分化の事象によって分離された遺伝子間の関連性（オルソログを参照のこと）または遺伝子重複の事象によって分離された遺伝子間の関連性（パラログを参照のこと）を示す。他の例では、「相同な」は、１または複数のポリヌクレオチド配列間の配列同一性のレベルを指すために使用され得、かかる場合には、この１または複数のポリヌクレオチド配列は、共通の先祖ＤＮＡ配列に必ずしも由来しない。当業者は、用語「相同な」の相互交換可能性を承知しており、この用語の適切な適用を理解している。

本明細書で使用する場合、用語「オルソログ」（または「オルソロガスな」）とは、共通の先祖ヌクレオチド配列から進化した、２以上の種において同じ機能を保持し得る、２以上の種における遺伝子を指す。

本明細書で使用する場合、用語「パラロガスな」とは、ゲノム内の重複によって関連する遺伝子を指す。オルソログは、進化の過程において同じ機能を保持するが、パラログは、新たな機能が元の遺伝子機能と無関係である場合であっても、それら新たな機能を進化させる。

本明細書で使用する場合、２つの核酸配列分子は、５’から３’方向で読み取られた配列の全てのヌクレオチドが、３’から５’方向で読み取られた場合の他の配列の全てのヌクレオチドと相補的である場合、「完全な相補性」を示すと言われる。参照ヌクレオチド配列と相補的なヌクレオチド配列は、参照ヌクレオチド配列の逆相補体配列と同一な配列を示す。これらの用語および記載は、当該分野で十分に定義されており、当業者に容易に理解される。

アミノ酸配列間の配列同一性の百分率を決定する場合、アラインメントによって提供される所与の位置におけるアミノ酸の同一性は、アラインされた配列を含むポリペプチドの所望の特性に影響を与えることなく異なり得ることが、当業者に周知である。これらの場合、パーセント配列同一性は、保存的に置換されたアミノ酸間の類似性を説明するために、調整され得る。これらの調整は、周知であり、当業者に一般に使用される。例えば、Myers and Miller (1988) Computer Applications in Biosciences 4:11-7を参照のこと。統計的方法は、当該分野で公知であり、同定された７，０１８の最適なゲノム遺伝子座の分析において使用され得る。

一実施形態として、７，０１８の個々の最適なゲノム遺伝子座配列を含む同定された最適なゲノム遺伝子座は、Ｆ分布検定を介して分析され得る。確率論および統計学では、Ｆ分布は、連続確率分布である。Ｆ分布検定は、Ｆ分布を有する統計的有意性検定であり、ベストフィットするモデルを同定するために、データセットにフィットされた統計モデルを比較する場合に使用される。Ｆ分布は、連続確率分布であり、ＳｎｅｄｅｃｏｒのＦ分布またはＦｉｓｈｅｒ−Ｓｎｅｄｅｃｏｒ分布としても公知である。Ｆ分布は、最も顕著には分散分析において、試験統計量の帰無分布として頻繁に生じる。Ｆ分布は、右の裾野が長い分布である。Ｆ分布は、０の最小値を有するが最大値は有さない、非対称分布である。この曲線は、０の右から遠くない場所でピークに達し、次いで、徐々に水平軸に近づくにつれ、Ｆ値は大きくなる。Ｆ分布は、水平軸に近づくが、決して触れることはない。他の実施形態では、この方程式に対するバリエーションまたは実際に異なる方程式が、当業者によって導出および使用され得、７，０１８の個々の最適なゲノム遺伝子座配列の分析のために適用可能であることが理解される。

作動可能に連結される：第１のヌクレオチド配列が第２のヌクレオチド配列と機能的関連性がある場合、第１のヌクレオチド配列は、第２のヌクレオチド配列と「作動可能に連結される」。例えば、プロモーターがコード配列の転写または発現に影響を与える場合、このプロモーターは、コード配列に作動可能に連結されている。組換え産生される場合、作動可能に連結されたヌクレオチド配列は、一般には連続しており、必要に応じて、２つのタンパク質コード領域を同じリーディングフレームで接続する。しかし、ヌクレオチド配列は、作動可能に連結されるように連続している必要はない。

用語「作動可能に連結される」は、調節配列およびコード配列に関して使用する場合、調節配列が、連結されたコード配列の発現に影響を与えることを意味する。「調節配列」、「調節エレメント」または「制御エレメント」とは、転写、ＲＮＡのプロセシングもしくは安定性、または関連するコード配列の翻訳のタイミングおよびレベル／量に影響を与える、ヌクレオチド配列を指す。調節配列には、プロモーター；翻訳リーダー配列；イントロン；エンハンサー；ステム−ループ構造；リプレッサー結合配列；終結配列；ポリアデニル化認識配列などが含まれ得る。特定の調節配列は、それに作動可能に連結されるコード配列の上流および／または下流に位置し得る。また、コード配列に作動可能に連結される特定の調節配列は、二本鎖核酸分子の関連する相補鎖上に位置し得る。

２以上のアミノ酸配列に関して使用する場合、用語「作動可能に連結される」は、第１のアミノ酸配列が、さらなるアミノ酸配列の少なくとも１つと機能的関連性があることを意味する。

開示された方法および組成物は、ＤＮＡ結合ドメイン（例えば、ＺＦＰ）に作動可能に連結された切断ドメインを含む融合タンパク質を含み、このＤＮＡ結合ドメインは、ダイズの最適なゲノム遺伝子座中の配列への結合により、この配列の近傍に切断ドメインの活性を指向させ、したがって、最適なゲノム遺伝子座において二本鎖破断を誘導する。本開示の別の場所に示すように、ジンクフィンガードメインは、事実上任意の所望の配列に結合するように操作され得る。したがって、１または複数のＤＮＡ結合ドメインは、最適なゲノム遺伝子座中の１または複数の配列に結合するように操作され得る。細胞におけるＤＮＡ結合ドメインおよび切断ドメインを含む融合タンパク質の発現は、標的部位またはその近傍において、切断をもたらす。

実施形態
ダイズ植物などの双子葉植物のゲノム中の特定の位置に導入遺伝子および導入遺伝子スタックを標的化することは、トランスジェニック事象の品質を改善し、トランスジェニック事象の産生に関連する費用を低減させ、トランスジェニック植物製品を作製するための新たな方法、例えば逐次的遺伝子スタッキングを提供する。全体として、特定のゲノム部位への導入遺伝子の標的化は、商業的に有益である可能性が高い。大幅な進歩が、植物および他のゲノム中の予め選択された部位へのドナーポリヌクレオチドの付加を促進し得る、ＺＦＮ、ＣＲＩＳＰＲおよびＴＡＬＥＮなどの部位特異的ヌクレアーゼの開発に向かって、ここ数年間になされてきた。しかし、標的化のために適切なゲノム部位の属性については、それほど知られていない。歴史的に、ゲノム中の非必須遺伝子および病原体（ウイルス）組込み部位が、標的化のための遺伝子座として使用されてきた。ゲノム中のかかる部位の数は、かなり限定的であり、したがって、ドナーポリヌクレオチド配列の標的化のために使用され得る最適なゲノム遺伝子座の同定および特徴付けが必要とされている。標的化に従順なことに加えて、最適なゲノム遺伝子座は、導入遺伝子発現および育種適用を支持し得る中立部位であると予測される。

本出願人らは、さらなる基準が、挿入部位について望ましいことを認識しており、外因性配列の挿入のために、ダイズゲノムなどの双子葉ゲノム中の最適な部位を同定および選択するためにこれらの基準を組み合わせている。標的化の目的のために、選択された挿入の部位は、独自であり、ダイズ植物などの双子葉植物のゲノムの非反復性領域中に存在する必要がある。同様に、挿入のための最適なゲノム部位は、最小の望ましくない表現型効果を有するべきであり、伝統的な育種技術を使用した農学的に精鋭の系統中への浸透性交雑を促進するために、組換え事象に対して感受性であるべきである。列挙した基準を満たすゲノム遺伝子座を同定するために、ダイズ植物のゲノムを、ポリヌクレオチドドナー配列の組込みおよび挿入されたコード配列の引き続く発現に有利な特徴を有する新規ゲノム遺伝子座を同定するために、カスタマイズされたバイオインフォマティクスアプローチおよびゲノム規模のデータセットを使用してスキャンした。

Ｉ．非遺伝子ダイズゲノム遺伝子座の同定
一実施形態によれば、外因性配列の挿入のために最適な非遺伝子ダイズゲノム配列を同定するための方法が提供される。この方法は、低メチル化された、少なくとも１Ｋｂ長のダイズゲノム配列を最初に同定するステップを含む。一実施形態では、この低メチル化されたゲノム配列は、１、１．５、２、２．５、３、３．５、４、４．５、５、５．５、６、６．５、７、７．５、８、８．５、９、１０、１１、１２、１３、１４、１５、１６または１７Ｋｂ長である。一実施形態では、この低メチル化されたゲノム配列は、約１〜約５．７Ｋｂ長であり、さらなる一実施形態では、約２Ｋｂ長である。配列は、その配列内に１％未満のＤＮＡメチル化を有する場合、低メチル化されたとみなされる。一実施形態では、このメチル化状態は、正常な対照ＤＮＡサンプル内の対応するＣｐＧジヌクレオチド、ＣＨＧまたはＣＨＨトリヌクレオチドにおいて見出される総シトシンの量と比較した、選択されたダイズ配列内の１または複数のＣｐＧジヌクレオチド、ＣＨＧまたはＣＨＨトリヌクレオチドにおける５−メチルシトシンの存在に基づいて測定される。ＣＨＨメチル化は、グアニンでなくてもよい２つのヌクレオチドが後に続く５−メチルシトシンを示し、ＣＨＧメチル化とは、グアニンが後に続くアデニン、チミンまたはシトシン塩基に先行する５−メチルシトシンを指す。より具体的には、一実施形態では、この選択されたダイズ配列は、５００ヌクレオチドの選択されたダイズ配列当たり、１未満、２未満または３未満のメチル化されたヌクレオチドを有する。一実施形態では、この選択されたダイズ配列は、５００ヌクレオチドの選択されたダイズ配列当たり、ＣｐＧジヌクレオチドにおいて、１未満、２未満または３未満の５−メチルシトシンを有する。一実施形態では、この選択されたダイズ配列は、１〜４Ｋｂ長であり、５−メチルシトシンを欠く１Ｋｂ配列を含む。一実施形態では、この選択されたダイズ配列は、１、１．５、２、２．５、３、３．５、４、４．５、５、５．５または６Ｋｂ長であり、その全長中に１または０のメチル化されたヌクレオチドを含む。一実施形態では、この選択されたダイズ配列は、１、１．５、２、２．５、３、３．５、４、４．５、５、５．５または６Ｋｂ長であり、その全長内にＣｐＧジヌクレオチドにおける５−メチルシトシンを含まない。一実施形態によれば、選択されたダイズ配列のメチル化は、供給源組織に基づいて変動し得る。かかる実施形態では、配列が低メチル化されているか否かを決定するために使用されるメチル化レベルは、２以上の組織から（例えば、根および苗条から）単離された配列中のメチル化の平均量を示す。

最適なゲノム部位が低メチル化されるべきという要求に加えて、選択されたダイズ配列はまた、非遺伝子でなければならない。したがって、全ての低メチル化されたゲノム配列は、遺伝子領域を含む低メチル化された配列を排除するために、さらにスクリーニングされる。これは、転写物がタンパク質をコードするか否かに関わらず、任意のオープンリーディングフレームを含む。オープンリーディングフレームの発現の調節に関与する任意の同定可能な隣接する５’および３’非コードヌクレオチド配列ならびに遺伝子領域中に存在し得る任意のイントロンを含む遺伝子領域を含む低メチル化されたゲノム配列は、本開示の最適な非遺伝子ダイズゲノム遺伝子座から排除される。

最適な非遺伝子ダイズゲノム遺伝子座はまた、組換えの証拠を実証した配列でなければならない。一実施形態では、この選択されたダイズ配列は、複数のマッピング集団から生成された高解像度マーカーデータセットを使用して検出されるように、選択されたダイズ配列に隣接する２つのマーカー間に少なくとも１つの組換え事象が検出されたダイズ配列でなければならない。一実施形態では、選択されたダイズ配列を含む、０．５、１、１．５Ｍｂの双子葉ゲノム配列、例えばダイズゲノム配列に隣接するマーカーの対は、選択されたダイズ配列について組換え頻度を計算するために使用される。マーカーの各対の間での組換え頻度（マーカー間のゲノム物理的距離（Ｍｂ）に対するセンチモルガン（ｃＭ））で測定される）は、０．０１５７ｃＭ／Ｍｂよりも大きくなければならない。一実施形態では、選択されたダイズ配列を含む１Ｍｂのダイズゲノム配列についてのこの組換え頻度は、約０．０１５７４ｃＭ／Ｍｂ〜約８３．５２ｃＭ／Ｍｂの範囲である。一実施形態では、最適なゲノム遺伝子座は、組換え事象が選択されたダイズ配列内で検出されたゲノム遺伝子座である。

最適な非遺伝子ダイズゲノム遺伝子座はまた、標的化可能な配列、即ち、ダイズゲノム中の比較的独自の配列であり、その結果、選択されたダイズ配列に標的化された遺伝子は、ダイズゲノムの１つの位置のみにおいて挿入する。一実施形態では、最適なゲノム配列の全長は、ダイズゲノム中に含まれる類似の長さの別の配列と、３０％未満、３５％未満または４０％未満の配列同一性を共有する。したがって、一実施形態では、この選択されたダイズ配列は、ダイズゲノム中に含まれる別の１Ｋｂ配列と、２５％超、３０％超、３５％超または４０％超の配列同一性を共有する１Ｋｂ配列を、含み得ない。さらなる一実施形態では、この選択されたダイズ配列は、ダイズゲノム中に含まれる別の５００ｂｐ配列と、３０％超、３５％超または４０％超の配列同一性を共有する５００ｂｐ配列を、含み得ない。一実施形態では、この選択されたダイズ配列は、ダイズ植物などの双子葉植物のゲノム中に含まれる別の１Ｋｂ配列と、４０％超の配列同一性を共有する１Ｋｂ配列を、含み得ない。

最適な非遺伝子ダイズゲノム遺伝子座はまた、遺伝子領域の近位である。より具体的には、選択されたダイズ配列は、遺伝子領域の近傍に位置しなければならない（例えば、遺伝子領域は、ネイティブゲノム中に見出されるような選択されたダイズのいずれかの末端と隣接し連続するゲノム配列の４０Ｋｂ以内に位置しなければならない）。一実施形態では、遺伝子領域は、ネイティブダイズゲノム中に見出されるような選択されたダイズ配列のいずれかの末端に位置する連続するゲノム配列の１０、２０、３０または４０Ｋｂ以内に位置する。一実施形態では、２以上の遺伝子領域が、選択されたダイズ配列の２つの末端に隣接する連続するゲノム配列の１０、２０、３０または４０Ｋｂ以内に位置する。一実施形態では、１〜１８の遺伝子領域が、選択されたダイズ配列の２つの末端に隣接する連続するゲノム配列の１０、２０、３０または４０Ｋｂ以内に位置する。一実施形態では、２以上の遺伝子領域が、選択されたダイズ配列を含む２０、３０または４０Ｋｂのゲノム配列内に位置する。一実施形態では、１〜１８の遺伝子領域が、選択されたダイズ配列を含む４０Ｋｂのゲノム配列内に位置する。一実施形態では、選択されたダイズ配列に隣接する連続するゲノム配列の１０、２０、３０または４０Ｋｂ以内に位置する遺伝子領域は、ダイズ植物などの双子葉植物のゲノム中の既知の遺伝子を含む。

一実施形態によれば、改変された非遺伝子ダイズゲノム遺伝子座が提供され、この遺伝子座は、少なくとも１Ｋｂ長であり、非遺伝子であり、メチル化されたシトシン残基を含まず、ダイズゲノム遺伝子座を包含する１Ｍｂのゲノム領域にわたって０．０１５７４ｃＭ／Ｍｂよりも高い組換え頻度を有し、ダイズゲノム遺伝子座の１Ｋｂ配列は、双子葉ゲノム中に含まれる任意の他の１Ｋｂ配列と４０％未満の配列同一性を共有し、この非遺伝子ダイズゲノム遺伝子座は、非遺伝子ダイズゲノム遺伝子座中への目的のＤＮＡの挿入によって改変される。

一実施形態によれば、例えばダイズゲノム遺伝子座を含む最適な非遺伝子双子葉ゲノム遺伝子座を同定するための方法が提供される。一部の実施形態では、この方法は、１Ｋｂの最小長さを有し低メチル化された選択されたダイズ配列の第１のプールを創出するために双子葉ゲノムをスクリーニングするステップを最初に含み、任意選択で、このゲノム配列は、１％未満のメチル化を有し、任意選択で、このゲノム配列は、いずれのメチル化されたシトシン残基をも欠く。選択されたダイズ配列のこの第１のプールは、最適な非遺伝子ダイズゲノム遺伝子座についての要求を満たさない遺伝子座を排除するために、さらにスクリーニングされ得る。ダイズから取得されたものなどの、双子葉転写物をコードする双子葉ゲノム配列は、類似の長さの別の配列と、４０％超またはそれより高い配列同一性を共有し、組換えの証拠を示さず、選択されたダイズ配列の４０Ｋｂ以内に既知のオープンリーディングフレームを有さず、最適な非遺伝子ダイズ遺伝子座としての資格がある第２のプールの配列を残して、第１のプールの配列から排除される。一実施形態では、既知の双子葉遺伝子（即ち、ダイズ遺伝子）を有さない任意の選択されたダイズ配列、または前記非遺伝子配列の一方の末端の４０Ｋｂ以内の、既知の双子葉遺伝子の２Ｋｂ上流および／もしくは１Ｋｂ下流の領域を含む配列は、第１のプールの配列から排除される。一実施形態では、選択されたダイズ配列の４０Ｋｂ以内にタンパク質を発現する既知の遺伝子を含まない任意の選択されたダイズ配列は、排除される。一実施形態では、０．０１５７４ｃＭ／Ｍｂよりも大きい組換え頻度を有さない任意の選択されたダイズ配列は、排除される。

これらの選択基準を使用して、本出願人らは、最適な非遺伝子ダイズゲノム遺伝子座として機能する、ダイズなどの双子葉の選択された最適なゲノム遺伝子座を同定しており、それらの配列は、配列番号１〜配列番号７，０１８として開示される。本開示は、同定された最適な非遺伝子ダイズゲノム遺伝子座の天然のバリアントまたは改変された誘導体もまた包含し、このバリアントまたは誘導体遺伝子座は、配列番号１〜配列番号７，０１８のいずれかの配列とは、１、２、３、４、５、６、７、８、９または１０ヌクレオチド異なる配列を含む。一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、配列番号１〜配列番号７，０１８から選択される配列、または配列番号１〜配列番号７，０１８から選択される配列と、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％もしくは９９％の配列同一性を共有する配列、を含む。

別の一実施形態では、本開示に従う使用のための双子葉植物は、ダイズ植物、キャノーラ植物、ナタネ植物、アブラナ属（Brassica）植物、ワタ植物およびヒマワリ植物からなる群から選択される任意の植物を含む。使用され得る双子葉植物の例には、キャノーラ、ワタ、ジャガイモ、キノア、アマランス、ソバ、ベニバナ、ダイズ、サトウダイコン、ヒマワリ、キャノーラ、ナタネ、タバコ、シロイヌナズナ属（Arabidopsis）、アブラナ属（Brassica）およびワタが含まれるがこれらに限定されない。

別の一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、ダイズ植物から選択される配列を含む。さらなる一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、ダイズ（Glycine max）近交系から選択される配列を含む。したがって、ダイズ（Glycine max）近交系は、その農学的に精鋭の変種を含む。引き続く一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、形質転換可能なダイズ系統から選択される配列を含む。一実施形態では、代表的な形質転換可能なダイズ系統には、以下が含まれる；Ｍａｖｅｒｉｃｋ、Ｗｉｌｌｉａｍｓ８２、ＭｅｒｒｉｌｌＪａｃｋＰｅｋｉｎｇ、Ｓｕｚｕｙｕｔａｋａ、Ｆａｙｅｔｔｅ、Ｅｎｒｅｉ、Ｍｉｋａｗａｓｈｉｍａ、ＷａｓｅＭｉｄｏｒｉ、Ｊａｃｋ、Ｌｅｃｕｌｕｓ、Ｍｏｒｏｃｃｏ、Ｓｅｒｅｎａ、Ｍａｐｌｅｐｒｅｓｔ、Ｔｈｏｒｎｅ、Ｂｅｒｔ、Ｊｕｎｇｅｒｙ、Ａ３２３７、Ｗｉｌｌｉａｍｓ、Ｗｉｌｌｉａｍｓ７９、ＡＣＣｏｌｉｂｒｉ、Ｈｅｆｅｎｇ２５、Ｄｏｎｇｎｏｎｇ４２、Ｈｉｅｎｏｎｇ３７、Ｊｉｌｉｎ３９、Ｊｉｙｕ５８、Ａ３２３７、ＫｅｎｔｕｃｋｙＷｏｎｄｅｒ、Ｍｉｎｉｄｏｋａおよびそれらの誘導体。当業者は、系統発生学的分岐の結果として、種々の型のダイズ系統が、同一のゲノムＤＮＡ配列を含まないこと、および多型または対立遺伝子バリエーションが、ゲノム配列内に存在し得ることを理解する。一実施形態では、本開示は、同定された最適な非遺伝子ダイズゲノム遺伝子座のかかる多型または対立遺伝子バリエーションを包含し、これらの多型または対立遺伝子バリエーションは、配列番号１〜配列番号７，０１８を有するいずれかの配列とは、１、２、３、４、５、６、７、８、９または１０ヌクレオチド異なる配列を含む。さらなる一実施形態では、本開示は、同定された最適な非遺伝子ダイズゲノム遺伝子座のかかる多型または対立遺伝子バリエーションを包含し、これらの多型または対立遺伝子バリエーションを含む配列は、配列番号１〜配列番号７，０１８のいずれかの配列と、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％または９９％の配列同一性を共有する。

７，０１８の個々の配列を含む同定された最適なゲノム遺伝子座は、多変量分析方法を使用したさらなる分析によって、種々の下位群にカテゴリー分けされ得る。任意の多変量分析の統計プログラムの適用が、変数のセットの潜在的構造（次元）を見出すために使用される。いくつかの異なる型の多変量アルゴリズムが使用され得、例えば、データセットは、重回帰分析、ロジスティック回帰分析、判別分析、多変量分散分析（ＭＡＮＯＶＡ）、因子分析（共通因子分析および主成分分析の両方を含む）、クラスター分析、多次元尺度構成法、対応分析、コンジョイント分析、正準分析、正準相関および構造方程式モデリングを使用して分析され得る。

一実施形態によれば、最適な非遺伝子ダイズゲノム遺伝子座は、主成分分析（ＰＣＡ）などの多変量データ分析を使用して、さらに分析される。本明細書では、簡潔な説明のみが与えられ、より多くの情報は、H. Martens, T. Naes, Multivariate Calibration, Wiley, N.Y., 1989において見出され得る。ＰＣＡは、データの根底にある次元性（潜在的変数）を評価し、そのデータにおける支配的なパターンおよび主要な傾向の概要を与える。一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、主成分分析（ＰＣＡ）統計方法を介してクラスターへとソートされ得る。ＰＣＡは、主成分と呼ばれる線状に無相関な変数の値のセットへと、おそらく相関する変数の観察のセットを変換するために、直交変形を使用する数学的手順である。主成分の数は、元の変数の数よりも少ないかまたは等しい。この変形は、第１の主成分が最も大きい可能な分散を有し（即ち、可能な限り多くの、データにおける変動性を説明する）、各後続成分が次に、先行する成分に対して直交する（即ち、先行する成分と無相関である）という制約の下で可能な最も高い分散を有するような方法で、規定される。主成分は、データセットが合同で正規分布する場合、独立であることが保証される。ＰＣＡは、元の変数の相対的スケーリングに対して感受性である。実体の特徴に基づいて実体のセットをクラスター化するためのＰＣＡの使用の例には、以下が含まれる；Ciampitti, I. et al., (2012) Crop Science, 52(6); 2728-2742, Chemometrics: A Practical Guide, Kenneth R. Beebe, Randy J. Pell, and Mary Beth Seasholtz, Wiley-Interscience, 1 edition, 1998、米国特許第８，３８５，６６２号および欧州特許第２，３４０，９７５号。

一実施形態によれば、主成分分析（ＰＣＡ）を、各同定された最適なダイズゲノム遺伝子座について、以下の１０の特徴を使用して、７，０１８の最適なダイズゲノム遺伝子座に対して実施した：
１．最適なダイズゲノム遺伝子座（ＯＧＬ）の周囲の低メチル化された領域の長さ
ａ．ダイズ（Glycine Max）ｃｕｌｔｉｖａｒＷｉｌｌｉａｍｓ８２などの双子葉植物から単離された根組織および苗条組織のＤＮＡメチル化プロファイルを、ハイスループット全ゲノム配列決定アプローチを使用して構築した。抽出されたＤＮＡを、メチル化されていないシトシンをウラシルに変換するが、メチル化されたシトシンには影響を与えないバイサルファイト処理に供し、次いで、ＩｌｌｕｍｉｎａＨｉＳｅｑテクノロジーを使用して配列決定した（Krueger, F. et al. DNA methylome analysis using short bisulfite sequencing data. Nature Methods 9, 145-151 (2012)）。生配列決定読み取りを、Ｂｉｓｍａｒｋ（商標）マッピングソフトウェア（Krueger F, Andrews SR (2011) Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. (Bioinformatics 27: 1571-1572)に記載されるとおり）を使用して、双子葉参照配列、例えば、ダイズ（Glycine max）参照配列に対してマッピングした。ＯＧＬの各々の周囲の低メチル化された領域の長さを、記載されたメチル化プロファイルを使用して計算した。

２．ＯＧＬの周囲の１ＭＢ領域における組換えの比率
ａ．各ＯＧＬについて、１Ｍｂウインドウ内のＯＧＬのいずれかの側上のマーカーの対を、同定した。染色体にわたるマーカーの各対の間での組換え頻度を、マーカー間の遺伝的距離（センチモルガン（ｃＭ））の、マーカー間のゲノム物理的距離（Ｍｂ）に対する比率に基づいて計算した。

３．ＯＧＬの配列独自性のレベル
ａ．各ＯＧＬについて、ＯＧＬのヌクレオチド配列を、ＢＬＡＳＴベースの相同性検索を使用して、双子葉植物のゲノム、例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノムに対してスキャンした。これらのＯＧＬ配列は、双子葉植物のゲノム、例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノムから同定されるので、この検索を介して同定された第１のＢＬＡＳＴヒットは、ＯＧＬ配列自体を示す。各ＯＧＬについての第２のＢＬＡＳＴヒットを同定し、このヒットのアラインメントカバー度を、ダイズゲノムなどの双子葉ゲノム内のＯＧＬ配列の独自性の尺度として使用した。

４．その近隣における最も近い遺伝子までのＯＧＬからの距離
ａ．双子葉ゲノム、例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、公知の双子葉ゲノムデータベース、例えば、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅ（ｗｗｗ．ｓｏｙｂａｓｅ．ｏｒｇ）から抽出した。各ＯＧＬについて、その上流近隣または下流近隣における最も近い注釈付きの遺伝子を同定し、ＯＧＬ配列とこの遺伝子との間の距離を（ｂｐで）測定した。

５．ＯＧＬ近隣におけるＧＣ％
ａ．各ＯＧＬについて、ヌクレオチド配列を分析して、存在するグアニン塩基およびシトシン塩基の数を推定した。この計数を、各ＯＧＬの配列長の百分率として示し、ＧＣ％についての尺度を提供する。

６．ＯＧＬの周囲の４０Ｋｂ近隣中の遺伝子の数
ａ．双子葉ゲノム、例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、公知の双子葉ゲノムデータベース、例えば、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅ（ｗｗｗ．ｓｏｙｂａｓｅ．ｏｒｇ）から抽出した。各ＯＧＬについて、ＯＧＬの周囲の４０Ｋｂウインドウを規定し、このウインドウとオーバーラップする位置を有する注釈付きの遺伝子の数を計数した。

７．ＯＧＬの周囲の４０Ｋｂ近隣における平均遺伝子発現。
ａ．ダイズ遺伝子などの双子葉遺伝子の転写物レベルでの発現を、ＲＮＡｓｅｑテクノロジーを使用して、双子葉植物組織、例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２の根組織および苗条組織から生成したトランスクリプトームプロファイリングデータを分析することによって測定した。各ＯＧＬについて、ＯＧＬの周囲の４０Ｋｂ近隣中に存在する双子葉ゲノム、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノム内の注釈付きの遺伝子を、同定した。ウインドウ中の遺伝子の各々についての発現レベルを、トランスクリプトームプロファイルから抽出し、平均遺伝子発現レベルを計算した。

８．ＯＧＬの周囲のヌクレオソーム占有率のレベル
ａ．特定のヌクレオチド配列についてヌクレオソーム占有率のレベルを識別することで、染色体機能および配列のゲノム情況についての情報が提供される。ＮｕＰｏＰ（商標）統計パッケージは、任意のサイズのゲノム配列についてのヌクレオソーム占有率および最も確からしいヌクレオソームポジショニングマップを予測するためのユーザーフレンドリーなソフトウェアツールを提供する（Xi, L., Fondufe-Mittendor, Y., Xia, L., Flatow, J., Widom, J. and Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-346）。各ＯＧＬについて、ヌクレオチド配列を、ＮｕＰｏＰ（商標）ソフトウェアに供し、ヌクレオソーム占有率スコアを計算した。

９．染色体内の相対的位置（セントロメアの近位）
ａ．ダイズ染色体などの双子葉染色体の各々におけるセントロメアの位置、および染色体アームの長さに関する情報を、双子葉ゲノムデータベース、例えば、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅ（ｗｗｗ．ｓｏｙｂａｓｅ．ｏｒｇ）から抽出した。各ＯＧＬについて、ＯＧＬ配列からそれが位置する染色体のセントロメアまでのゲノム距離が（ｂｐで）測定される。染色体内のＯＧＬの相対的位置は、それが存在する特定の染色体アームの長さに対する、セントロメアまでのそのゲノム距離の比率として示される。

１０．ＯＧＬの周囲の１Ｍｂ領域中のＯＧＬの数
ａ．各ＯＧＬについて、ＯＧＬ位置の周囲の１Ｍｂゲノムウインドウが規定され、そのゲノム位置がこのウインドウとオーバーラップする、双子葉１ＫｂＯＧＬデータセット中のＯＧＬの数が、集計される。

各最適な非遺伝子ダイズゲノム遺伝子座の特徴および属性のスコアについての結果または値は、実施例２の表３にさらに記載される。得られたデータセットを、ＰＣＡ統計方法において使用して、７，０１８の同定された最適な非遺伝子ダイズゲノム遺伝子座をクラスターへとクラスター化した。クラスター化プロセスの間に、最適なゲノム遺伝子座の「ｐ」個の主成分の推定後に、３２のクラスターのうちの１つへの最適なゲノム遺伝子座の割り当てが、「ｐ」次元ユークリッド空間において進行した。「ｐ」個の軸の各々を、「ｋ」個の区間に分割した。同じ区間に割り当てられた最適なゲノム遺伝子座を、クラスターを形成するように一緒にグループ分けした。この分析を使用して、各ＰＣＡ軸を、２つの区間に分割し、これを、実験的検証に必要とされるクラスターの数に関する先験的情報に基づいて選択した。得られたクラスターの全ての分析および可視化を、ＣｈｅｍｉｃａｌＣｏｍｐｕｔｉｎｇＧｒｏｕｐＩｎｃ．（Ｍｏｎｔｒｅａｌ、Ｑｕｅｂｅｃ、Ｃａｎａｄａ）のＭｏｌｅｃｕｌａｒＯｐｅｒａｔｉｎｇＥｎｖｉｒｏｎｍｅｎｔ（商標）（ＭＯＥ）ソフトウェアを用いて実施した。このＰＣＡアプローチを使用して、上記、それらの特徴値に基づいて、３２の別個のクラスターへと７，０１８の最適なダイズゲノム遺伝子座のセットをクラスター化した。

このＰＣＡプロセスの間に、５つの主成分（ＰＣ）が生成され、上位３つのＰＣは、データセット中の総変動の約９０％を含む（表４）。これら３つのＰＣを使用して、三次元プロット中に３２のクラスターをグラフ的に表示した（図１を参照のこと）。クラスター化プロセスを完了した後、１つの代表的な最適なゲノム遺伝子座を、各クラスターから選択した。これを、計算的方法によって、そのクラスターの重心に最も近かった、各クラスター内の選択された最適なゲノム遺伝子座を選択することによって、実施した（表４）。３２の代表的な最適なゲノム遺伝子座の染色体位置は、図２に示すように、ダイズ染色体の中に均一に分布している。

一実施形態では、実施例２の表６に記載される任意のクラスターから選択される、単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列が提供される。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター３から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター４から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター５から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター６から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター７から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター８から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター９から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１０から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１１から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１２から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１３から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１４から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１５から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１６から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１７から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１８から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター１９から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２０から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２１から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２２から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２３から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２４から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２５から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２６から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２７から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２８から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター２９から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター３０から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター３１から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター３２から選択されるゲノム配列である。

一実施形態によれば、改変された最適な非遺伝子ダイズゲノム遺伝子座が提供され、この最適な非遺伝子ダイズゲノム遺伝子座は、改変されており、１または複数のヌクレオチド置換、欠失または挿入を含む。一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、ゲノム遺伝子座配列のさらなるヌクレオチド重複、欠失または逆位が任意選択で付随する、目的のＤＮＡの挿入によって改変される。

一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、実施例２の表６に記載される任意のクラスターから選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター３から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター４から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター５から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター６から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター７から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター８から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター９から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１０から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１１から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１２から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１３から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１４から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１５から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１６から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１７から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１８から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１９から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２０から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２１から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２２から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２３から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２４から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２５から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２６から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２７から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２８から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２９から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター３０から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター３１から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター３２から選択されるゲノム配列である。

さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０または３１から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９または３０から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８または２９から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７または２８から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６または２７から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５または２６から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４または２５から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３または２４から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２または２３から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１または２２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０または２１から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９または２０から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８または１９から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７または１８から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６または１７から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５または１６から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４または１５から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３または１４から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２または１３から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１または１２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０または１１から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９または１０から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８または９から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７または８から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６または７から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５または６から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４または５から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３または４から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２または３から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１または２から選択されるゲノム配列である。

さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０または３２から選択されるゲノム配列である。

さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９または３２から選択されるゲノム配列である。

さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８または３２から選択されるゲノム配列である。

さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６または２７から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、９、１０、１１、１２、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１５、１６、１７、１８、２５、２６、２７、２８、２９、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２１、２２、２３、２４、３０、３１または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター２、４、６、８、１０、１２、１４、１６、１８、２０、２２、２４、２６、２８、３０または３２から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター１、３、５、７、９、１１、１３、１５、１７、１９、２１、２３、２５、２７、２９または３１から選択されるゲノム配列である。

一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、ｓｏｙ＿ｏｇｌ＿２４７４（配列番号１）、ｓｏｙ＿ｏｇｌ＿７６８（配列番号５０６）、ｓｏｙ＿ｏｇｌ＿２０６３（配列番号２０６３）、ｓｏｙ＿ｏｇｌ＿１９０６（配列番号１０２９）、ｓｏｙ＿ｏｇｌ＿１１１２（配列番号１１１２）、ｓｏｙ＿ｏｇｌ＿３５７４（配列番号１４５２）、ｓｏｙ＿ｏｇｌ＿２５８１（配列番号１６６２）、ｓｏｙ＿ｏｇｌ＿３４８１（配列番号１８６９）、ｓｏｙ＿ｏｇｌ＿１０１６（配列番号２０７１）、ｓｏｙ＿ｏｇｌ＿９３７（配列番号２４８１）、ｓｏｙ＿ｏｇｌ＿６６８４（配列番号２６１４）、ｓｏｙ＿ｏｇｌ＿６８０１（配列番号２８７４）、ｓｏｙ＿ｏｇｌ＿６６３６（配列番号２９７０）、ｓｏｙ＿ｏｇｌ＿４６６５（配列番号３５０８）、ｓｏｙ＿ｏｇｌ＿３３９９（配列番号３６７６）、ｓｏｙ＿ｏｇｌ＿４２２２（配列番号３９９３）、ｓｏｙ＿ｏｇｌ＿２５４３（配列番号４０５０）、ｓｏｙ＿ｏｇｌ＿２７５（配列番号４１０６）、ｓｏｙ＿ｏｇｌ＿５９８（配列番号４４９６）、ｓｏｙ＿ｏｇｌ＿１８９４（配列番号４６２２）、ｓｏｙ＿ｏｇｌ＿５４５４（配列番号４８７５）、ｓｏｙ＿ｏｇｌ＿６８３８（配列番号４８８８）、ｓｏｙ＿ｏｇｌ＿４７７９（配列番号５０６３）、ｓｏｙ＿ｏｇｌ＿３３３３（配列番号５１２２）、ｓｏｙ＿ｏｇｌ＿２５４６（配列番号５５２０）、ｓｏｙ＿ｏｇｌ＿７９６（配列番号５６８７）、ｓｏｙ＿ｏｇｌ＿８７３（配列番号６０８７）、ｓｏｙ＿ｏｇｌ＿５４７５（配列番号６３２１）、ｓｏｙ＿ｏｇｌ＿２１１５（配列番号６５２０）、ｓｏｙ＿ｏｇｌ＿２５１８（配列番号６５７４）、ｓｏｙ＿ｏｇｌ＿５５５１（配列番号６７７５）およびｓｏｙ＿ｏｇｌ＿４５６３（配列番号６８５９）のゲノム配列から選択される。

一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、ｓｏｙ＿ｏｇｌ＿３０８（配列番号４３）、ｓｏｙ＿ｏｇｌ＿３０７（配列番号５６６）、ｓｏｙ＿ｏｇｌ＿２０６３（配列番号７４８）、ｓｏｙ＿ｏｇｌ＿１９０６（配列番号１０２９）、ｓｏｙ＿ｏｇｌ＿２６２（配列番号１３７６）、ｓｏｙ＿ｏｇｌ＿５２２７（配列番号１４６１）、ｓｏｙ＿ｏｇｌ＿４０７４（配列番号１８６７）、ｓｏｙ＿ｏｇｌ＿３４８１（配列番号１８６９）、ｓｏｙ＿ｏｇｌ＿１０１６（配列番号２０７１）、ｓｏｙ＿ｏｇｌ＿９３７（配列番号２４８１）、ｓｏｙ＿ｏｇｌ＿５１０９（配列番号２６３９）、ｓｏｙ＿ｏｇｌ＿６８０１（配列番号２８７４）、ｓｏｙ＿ｏｇｌ＿６６３６（配列番号２９７０）、ｓｏｙ＿ｏｇｌ＿４６６５（配列番号３５０８）、ｓｏｙ＿ｏｇｌ＿６１８９（配列番号３６８２）、ｓｏｙ＿ｏｇｌ＿４２２２（配列番号３９９３）、ｓｏｙ＿ｏｇｌ＿２５４３（配列番号４０５０）、ｓｏｙ＿ｏｇｌ＿３１０（配列番号４３２６）、ｓｏｙ＿ｏｇｌ＿２３５３（配列番号４５９３）、ｓｏｙ＿ｏｇｌ＿１８９４（配列番号４６２２）、ｓｏｙ＿ｏｇｌ＿３６６９（配列番号４８７９）、ｓｏｙ＿ｏｇｌ＿３２１８（配列番号４９３２）、ｓｏｙ＿ｏｇｌ＿５６８９（配列番号５１０２）、ｓｏｙ＿ｏｇｌ＿３３３３（配列番号５１２２）、ｓｏｙ＿ｏｇｌ＿２５４６（配列番号５５２０）、ｓｏｙ＿ｏｇｌ＿１２０８（配列番号５６９８）、ｓｏｙ＿ｏｇｌ＿８７３（配列番号６０８７）、ｓｏｙ＿ｏｇｌ＿５９５７（配列番号６５１５）、ｓｏｙ＿ｏｇｌ＿４８４６（配列番号６５７１）、ｓｏｙ＿ｏｇｌ＿３８１８（配列番号６５８６）、ｓｏｙ＿ｏｇｌ＿５５５１（配列番号６７７５）、ｓｏｙ＿ｏｇｌ＿７（配列番号６９３５）、ｓｏｙ＿ＯＧＬ＿６８４（配列番号４７）、ｓｏｙ＿ＯＧＬ＿６８２（配列番号２１０１）、ｓｏｙ＿ＯＧＬ＿６８５（配列番号４８）、ｓｏｙ＿ＯＧＬ＿１４２３（配列番号６３９）、ｓｏｙ＿ＯＧＬ＿１４３４（配列番号１３７）、ｓｏｙ＿ＯＧＬ＿４６２５（配列番号７６）およびｓｏｙ＿ＯＧＬ＿６３６２（配列番号４４０）のゲノム配列から選択される。

一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、目的のＤＮＡで標的化され、目的のＤＮＡは、ジンクフィンガーヌクレアーゼ標的部位内またはその近位で組み込まれる。一実施形態によれば、最適なトウモロコシの選択されたゲノム遺伝子座の例示的なジンクフィンガー標的部位は、表８に提供される。一実施形態によれば、目的のＤＮＡの組込みは、以下の例示的な標的部位内またはその近位で生じる：配列番号７３６３および配列番号７３６４、配列番号７３６５および配列番号７３６６、配列番号７３６７および配列番号７３６８、配列番号７３６９および配列番号７３７０、配列番号７３７１および配列番号７３７２、配列番号７３７３および配列番号７３７４、配列番号７３７５および配列番号７３７６、配列番号７３７７および配列番号７３７８、配列番号７３７９および配列番号７３８０、配列番号７３８１および配列番号７３８２、配列番号７３８３および配列番号７３８４、配列番号７３８５および配列番号７３８６、配列番号７３８７および配列番号７３８８、配列番号７３８９および配列番号７３９０、配列番号７３９１および配列番号７３９２、配列番号７３９３および配列番号７３９４、配列番号７３９５および配列番号７３９６、配列番号７３９７および配列番号７３９８、配列番号７３９９および配列番号７４００、配列番号７４０１および配列番号７４０２、配列番号７４０３および配列番号７４０４、配列番号７４０５および配列番号７４０６、配列番号７４０７および配列番号７４０８、配列番号７４０９および配列番号７４１０、配列番号７４１１および配列番号７４１２、配列番号７４１３および配列番号７４１４、配列番号７４１５および配列番号７４１６、配列番号７４１７および配列番号７４１８、配列番号７４１９および配列番号７４２０、配列番号７４２１および配列番号７４２２、配列番号７４２３および配列番号７４２４、配列番号７４２５および配列番号７４２６。

一実施形態によれば、このジンクフィンガーヌクレアーゼは、ジンクフィンガー標的部位に結合し、独自のダイズゲノムポリヌクレオチド標的部位を切断し、目的のＤＮＡは、ダイズゲノムポリヌクレオチド標的部位内またはその近位に組み込まれる。一実施形態では、ジンクフィンガー標的部位内の目的のＤＮＡの組込みは、再編成によって生じ得る。一実施形態によれば、これらの再編成は、欠失、挿入、逆位および反復を含み得る。一実施形態では、目的のＤＮＡの組込みは、ジンクフィンガー標的部位の近位で生じる。この実施形態の一態様によれば、ＤＮＡの組込みは、ジンクフィンガー標的部位の近位であり、ジンクフィンガー標的部位に対して２Ｋｂ、１．７５Ｋｂ、１．５Ｋｂ、１．２５Ｋｂ、１．０Ｋｂ、０．７５Ｋｂ、０．５Ｋｂまたは０．２５Ｋｂ以内に組み込まれ得る。ジンクフィンガー標的部位の近位のゲノム領域内の挿入は、当該分野で公知であり、米国特許出願公開第２０１０／０２５７６３８Ａ１（その全体が参照により本明細書に組み込まれる）を参照のこと。

一実施形態によれば、この選択された非遺伝子配列は、以下の特徴を含む：
ａ）この非遺伝子配列は、配列内に１％よりも多いＤＮＡメチル化を含まない；
ｂ）この非遺伝子配列は、ダイズ染色体セントロメアから０．２１１〜０．９７６のゲノム距離の比率の相対的位置値を有する；
ｃ）この非遺伝子配列は、２５．６２〜４３．７６％のグアニン／シトシンパーセント含量範囲を有する；および
ｄ）この非遺伝子配列は、約１Ｋｂ長〜約４．４Ｋｂ長である。

ＩＩ．同定された最適な非遺伝子ダイズゲノム遺伝子座の組換え誘導体
一実施形態によれば、ポリヌクレオチドドナー配列を挿入するための高度に望ましい位置として、ダイズ植物などの双子葉植物のゲノム遺伝子座を同定した後で、１または複数の目的の核酸が、同定されたゲノム遺伝子座中に挿入され得る。一実施形態では、この目的の核酸は、外因性遺伝子配列または他の望ましいポリヌクレオチドドナー配列を含む。別の一実施形態では、ポリヌクレオチドドナー配列を挿入するための高度に望ましい位置として、ダイズ植物などの双子葉植物のゲノム遺伝子座を同定した後で、最適な非遺伝子ダイズゲノム遺伝子座の１または複数の目的の核酸が、任意選択で、同定されたゲノム遺伝子座中への目的のＤＮＡの引き続く組込みと共に、欠失、切除または除去され得る。一実施形態では、最適な非遺伝子ダイズゲノム遺伝子座中への目的の核酸の挿入は、外因性遺伝子配列または他の望ましいポリヌクレオチドドナー配列の除去、欠失または切除を含む。

本開示は、ＺＦＮおよびポリヌクレオチドドナー構築物を使用した、選択されたダイズゲノム遺伝子座中への標的化された組込みのための方法および組成物にさらに関する。最適な非遺伝子ダイズゲノム遺伝子座中に目的の核酸配列を挿入するための方法は、特記しない限り、分子生物学、生化学、クロマチン構造および分析、細胞培養、組換えＤＮＡならびに当業者の技術範囲内の関連の分野における従来の技術を使用する。これらの技術は、文献中に完全に説明されている。例えば、Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolfe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P. M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999;およびMETHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P. B. Becker, ed.) Humana Press, Totowa, 1999を参照のこと。

ダイズゲノム中への核酸挿入のための方法
宿主細胞中にＤＮＡ構築物としてポリヌクレオチドドナー配列およびヌクレアーゼ配列を導入するための周知の手順のいずれかが、本開示に従って使用され得る。これらには、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、ＰＥＧ、エレクトロポレーション、超音波的方法（例えば、ソノポレーション）、リポソーム、マイクロインジェクション、ネイキッドＤＮＡ、プラスミドベクター、ウイルスベクター、エピソームおよび組込みの両方、ならびにクローニングされたゲノムＤＮＡ、ｃＤＮＡ、合成ＤＮＡまたは他の外来遺伝子材料を宿主細胞中に導入するための他の周知の方法のいずれかの使用が含まれる（例えば、Sambrook et al.、上記を参照のこと）。使用される特定の核酸挿入手順は、選択されたタンパク質を発現することが可能な宿主細胞中に少なくとも１つの遺伝子を首尾よく導入することが可能であることだけが必要である。

上述のように、ＤＮＡ構築物は、種々の従来の技術によって、所望の植物種のゲノム中に導入され得る。かかる技術の総説については、例えば、Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463；およびGrierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9を参照のこと。ＤＮＡ構築物は、植物細胞プロトプラスのエレクトロポレーションおよびマイクロインジェクションなどの技術を使用して、シリコンカーバイド繊維による撹拌によって（例えば、米国特許第５，３０２，５２３号および同第５，４６４，７６５号を参照のこと）、植物細胞のゲノムＤＮＡ中に直接導入され得、またはＤＮＡ構築物は、ＤＮＡ粒子衝突（particle bombardment）などのバイオリスティクス（biolistic）方法を使用して、植物組織に直接導入され得る（例えば、Klein et al. (1987) Nature 327:70-73を参照のこと）。あるいは、ＤＮＡ構築物は、ナノ粒子形質転換を介して植物細胞中に導入され得る（例えば、その全体が参照により本明細書に組み込まれる米国特許出願公開第２００９０１０４７００号を参照のこと）。あるいは、ＤＮＡ構築物は、適切なＴ−ＤＮＡ境界／隣接領域と組み合わされ得、従来のアグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）宿主ベクター中に導入され得る。バイナリーベクターの安全化および使用を含む、アグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）媒介性の形質転換技術は、科学文献中に十分に記載されている。例えば、Horsch et al. (1984) Science 233:496-498およびFraley et al. (1983) Proc. Nat'l. Acad. Sci. USA 80:4803を参照のこと。

さらに、遺伝子移入は、非アグロバクテリウム属（Agrobacterium）細菌またはウイルス、例えば、根粒菌属（Rhizobium）種ＮＧＲ２３４、アルファルファ根粒菌（Sinorhizobium meliloti）、メソリゾビウム・ロティ（Mesorhizobium loti）、ジャガイモウイルスＸ、カリフラワーモザイクウイルスおよびキャッサバ葉脈モザイクウイルスおよび／またはタバコモザイクウイルスを使用して達成され得る。例えば、Chung et al. (2006) Trends Plant Sci. 11(1):1-4を参照のこと。アグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）宿主の病原性機能は、バイナリーＴＤＮＡベクター（Bevan (1984) Nuc. Acid Res. 12:8711-8721）または共存培養手順（Horsch et al. (1985) Science 227:1229-1231）を使用して細胞に細菌を感染させる場合、植物細胞ＤＮＡ中への、この構築物および隣接するマーカーを含むＴ鎖の挿入を指向させる。一般に、アグロバクテリウム属（Agrobacterium）形質転換系は、双子葉類植物を操作するために使用される（Bevan et al. (1982) Ann. Rev. Genet. 16:357-384; Rogers et al. (1986) Methods Enzymol. 118:627-641）。アグロバクテリウム属（Agrobacterium）形質転換系は、単子葉類植物および植物細胞を形質転換するため、ならびに単子葉類植物および植物細胞にDNAを移入させるためにも使用され得る。米国特許第５，５９１，６１６号；Hernalsteen et al. (1984) EMBO J. 3:3039-3041; Hooykass-Van Slogteren et al. (1984) Nature 311:763-764; Grimsley et al. (1987) Nature 325:1677-179; Boulton et al. (1989) Plant Mol. Biol. 12:31-40；およびGould et al. (1991) Plant Physiol. 95:426-434を参照のこと。

代替的な遺伝子移入および形質転換の方法には、ネイキッドＤＮＡのカルシウム媒介性、ポリエチレングリコール（ＰＥＧ）媒介性またはエレクトロポレーション媒介性の取り込みを介したプロトプラスト形質転換（Paszkowski et al. (1984) EMBO J. 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82:5824-5828; およびShimamoto (1989) Nature 338:274-276を参照のこと）および植物組織のエレクトロポレーション（D'Halluin et al. (1992) Plant Cell 4:1495-1505）が含まれるがこれらに限定されない。植物細胞形質転換のためのさらなる方法には、マイクロインジェクション、シリコンカーバイド媒介性のＤＮＡ取り込み（Kaeppler et al. (1990) Plant Cell Reporter 9:415-418）および微粒子銃（microprojectile bombardment）（Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85:4305-4309；およびGordon-Kamm et al. (1990) Plant Cell 2:603-618を参照のこと）が含まれる。

一実施形態では、ゲノム中への標的化された挿入のために宿主細胞中に導入される目的の核酸は、標的化された目的の核酸の一方または両方の末端上に相同な隣接配列を含む。かかる一実施形態では、この相同な隣接配列は、この相同な隣接配列とそれが相同性を有するゲノム配列との間の相同組換えを支持するために、ダイズ由来のゲノム配列などの双子葉ゲノム配列に対して十分なレベルの配列同一性を含む。ドナーとゲノム配列との間での、およそ２５、５０、１００、２００、５００、７５０、１０００、１５００もしくは２０００ヌクレオチドまたはそれ超の、７０％〜１００％の範囲の配列同一性（または１０ヌクレオチドと２００ヌクレオチドとの間の任意の整数値、もしくはそれ超）が、それらの間での相同組換えを支持する。

別の一実施形態では、この標的化された目的の核酸は、相同な隣接配列を欠き、この標的化された目的の核酸は、ゲノム配列と、低い〜非常に低いレベルの配列同一性を共有する。

細胞クロマチン中の目的の領域中の配列の標的化された組換えおよび／または置き換えおよび／または変更の他の実施形態では、染色体配列は、外因性「ドナー」ヌクレオチド配列との相同組換えによって変更される。かかる相同組換えは、中断の領域と相同な配列が存在する場合、細胞クロマチン中の二本鎖破断の存在によって刺激される。細胞クロマチン中の二本鎖破断は、非相同末端結合の細胞機構を刺激することもできる。本明細書に記載される方法のいずれかにおいて、第１のヌクレオチド配列（「ドナー配列」）は、目的の領域中のゲノム配列と相同であるが同一ではない配列を含み得、それによって、目的の領域において非同一配列を挿入するための相同組換えを刺激する。したがって、特定の実施形態では、目的の領域中の配列と相同なドナー配列の部分は、置き換えられるゲノム配列に対して、約８０、８５、９０、９５、９７．５〜９９％の間（またはそれらの間の任意の整数）の配列同一性を示す。他の実施形態では、ドナー配列とゲノム配列との間の相同性は、例えば、１ヌクレオチドのみが１００個を超えて連続する塩基対のドナー配列とゲノム配列との間で異なる場合、９９％よりも高い。

特定の場合には、ドナー配列の非相同部分は、目的の領域中に存在しない配列を含み得、その結果、新たな配列が、目的の領域中に導入される。これらの場合、この非相同配列には、一般に、目的の領域中の配列と相同または同一である、５０〜２，０００塩基対（もしくはそれらの間の任意の整数値）、または２，０００よりも多い任意の数の塩基対の配列が、隣接する。他の実施形態では、このドナー配列は、目的の領域と非相同であり、非相同組換え機構によってゲノム中に挿入される。

一実施形態によれば、ジンクフィンガーヌクレアーゼ（ＺＦＮ）が、目的の核酸の挿入を促進するために、標的化されたゲノム遺伝子座中に二本鎖破断を導入するために使用される。ジンクフィンガードメインによる結合のための選択されたゲノム遺伝子座内の標的部位の選択は、例えば、選択された配列に結合するジンクフィンガータンパク質（ＺＦＰ）を設計するための方法もまた開示する、その開示が本明細書に組み込まれる米国特許第６，４５３，２４２号に開示される方法に従って、達成され得る。ヌクレオチド配列の単純な目視検査もまた、標的部位の選択のために使用され得ることは、当業者に明らかである。したがって、標的部位選択のための任意の手段が、本明細書に記載される方法において使用され得る。

ＺＦＰＤＮＡ結合ドメインについて、標的部位は一般に、複数の隣接する標的サブサイトから構成される。標的サブサイトとは、個々のジンクフィンガーによって結合される隣接する四つ組と、１ヌクレオチドがオーバーラップし得る、通常はヌクレオチド三つ組またはヌクレオチド四つ組のいずれかの、配列を指す。例えば、その開示が本明細書に組み込まれるＷＯ０２／０７７２２７を参照のこと。標的部位は、一般に、少なくとも９ヌクレオチドの長さを有し、したがって、少なくとも３つのジンクフィンガーを含むジンクフィンガー結合ドメインによって結合される。しかし、例えば、１２ヌクレオチドの標的部位に対する４フィンガー結合ドメインの結合、１５ヌクレオチドの標的部位に対する５フィンガー結合ドメインの結合、または１８ヌクレオチドの標的部位に対する６フィンガー結合ドメインの結合もまた、可能である。明らかなように、より長い標的部位に対するより大きい結合ドメイン（例えば、７、８、９フィンガーおよびそれ超）の結合もまた、本開示と一致する。

一実施形態によれば、標的部位は、複数の３ヌクレオチドである必要はない。交差鎖相互作用が生じる場合（例えば、米国特許第６，４５３，２４２号およびＷＯ０２／０７７２２７を参照のこと）、多フィンガー結合ドメインの個々のジンクフィンガーの１または複数は、オーバーラップする四つ組サブサイトに結合し得る。結果として、３フィンガータンパク質は、１０ヌクレオチド配列を結合し得、このとき、１０番目のヌクレオチドは、終端フィンガーによって結合される四つ組の一部であり、４フィンガータンパク質は、１３ヌクレオチド配列を結合し得、このとき、１３番目のヌクレオチドは、終端フィンガーによって結合される四つ組の一部である、など。

多フィンガー結合ドメイン中の個々のジンクフィンガー間のアミノ酸リンカー配列の長さおよび性質もまた、標的配列への結合に影響を与える。例えば、多フィンガー結合ドメイン中の隣接するジンクフィンガー間のいわゆる「非正準リンカー」、「長いリンカー」または「構造化リンカー」の存在により、これらのフィンガーは、直接隣接しないサブサイトを結合することができる。かかるリンカーの非限定的な例は、例えば、米国特許第６，４７９，６２６号およびＷＯ０１／５３４８０に記載されている。したがって、ジンクフィンガー結合ドメインに対する標的部位中の１または複数のサブサイトは、１、２、３、４、５またはそれ超のヌクレオチド、互いに分離され得る。１つの非限定的な例は、配列中に、２つの連続する３ヌクレオチドサブサイト、１つの介在ヌクレオチド、および２つの連続する三つ組サブサイトを含む１３ヌクレオチドの標的部位に結合する４フィンガー結合ドメインである。

天然に存在するタンパク質から同定されたＤＮＡ結合ポリペプチドは、典型的には、別々のヌクレオチド配列またはモチーフ（例えば、コンセンサス認識配列）に結合するが、異なるヌクレオチド配列またはモチーフを認識するように多数のかかるＤＮＡ結合ポリペプチドを改変するための方法が存在し、当該分野で公知である。ＤＮＡ結合ポリペプチドには、例えば以下が含まれるがこれらに限定されない：ジンクフィンガーＤＮＡ結合ドメイン；ロイシンジッパー；ＵＰＡＤＮＡ結合ドメイン；ＧＡＬ４；ＴＡＬ；ＬｅｘＡ；Ｔｅｔリプレッサー；ＬａｃＲ；およびステロイドホルモン受容体。

一部の例では、ＤＮＡ結合ポリペプチドは、ジンクフィンガーである。個々のジンクフィンガーモチーフは、ＤＮＡ部位の大きい範囲のいずれかを標的化し、それに特異的に結合するように設計され得る。正準Ｃｙｓ_２Ｈｉｓ_２（ならびに非正準Ｃｙｓ_３Ｈｉｓ）ジンクフィンガーポリペプチドは、標的ＤＮＡ二重らせんの主溝中にα−らせんを挿入することによって、ＤＮＡを結合する。ジンクフィンガーによるＤＮＡの認識は、モジュール式である；各フィンガーは、標的中の３つの保存的塩基対と主に接触し、このポリペプチド中の数個の重要な残基が認識を媒介する。標的化エンドヌクレアーゼ中に複数のジンクフィンガーＤＮＡ結合ドメインを含めることによって、この標的化エンドヌクレアーゼのＤＮＡ結合特異性は、さらに増加され得る（および、したがって、それによって付与される任意の遺伝子調節効果の特異性もまた増加され得る）。例えば、Urnov et al. (2005) Nature 435:646-51を参照のこと。したがって、１または複数のジンクフィンガーＤＮＡ結合ポリペプチドが、操作および利用され得、その結果、宿主細胞中に導入された標的化エンドヌクレアーゼは、宿主細胞のゲノム内の独自のＤＮＡ配列と相互作用する。好ましくは、このジンクフィンガータンパク質は、選択された標的部位に結合するように操作されているという点で、天然に存在しない。例えば、それらの全体が参照によって本明細書に全て組み込まれる、Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; 米国特許第６，４５３，２４２号；同第６，５３４，２６１号；同第６，５９９，６９２号；同第６，５０３，７１７号；同第６，６８９，５５８号；同第７，０３０，２１５号；同第６，７９４，１３６号；同第７，０６７，３１７号；同第７，２６２，０５４号；同第７，０７０，９３４号；同第７，３６１，６３５号；同第７，２５３，２７３号；および米国特許出願公開第２００５／００６４４７４号；同第２００７／０２１８５２８号；同第２００５／０２６７０６１号を参照のこと。

操作されたジンクフィンガー結合ドメインは、天然に存在するジンクフィンガータンパク質と比較して、新規の結合特異性を有し得る。操作方法には、合理的設計および種々の型の選択が含まれるがこれらに限定されない。合理的設計には、例えば、三つ組（または四つ組）ヌクレオチド配列および個々のジンクフィンガーアミノ酸配列を含むデータベースを使用することが含まれ、このとき、各三つ組または四つ組ヌクレオチド配列は、特定の三つ組または四つ組配列を結合するジンクフィンガーの１または複数のアミノ酸配列と関連する。例えば、それらの全体が参照により本明細書に組み込まれる、共有に係る米国特許第６，４５３，２４２号および同第６，５３４，２６１号を参照のこと。

あるいは、このＤＮＡ結合ドメインは、ヌクレアーゼから誘導され得る。例えば、ホーミングエンドヌクレアーゼおよびメガヌクレアーゼ、例えば、Ｉ−ＳｃｅＩ、Ｉ−ＣｅｕＩ、ＰＩ−ＰｓｐＩ、ＰＩ−Ｓｃｅ、Ｉ−ＳｃｅＩＶ、Ｉ−ＣｓｍＩ、Ｉ−ＰａｎＩ、Ｉ−ＳｃｅＩＩ、Ｉ−ＰｐｏＩ、Ｉ−ＳｃｅＩＩＩ、Ｉ−ＣｒｅＩ、Ｉ−ＴｅｖＩ、Ｉ−ＴｅｖＩＩおよびＩ−ＴｅｖＩＩＩの認識配列は、公知である。米国特許第５，４２０，０３２号；米国特許第６，８３３，２５２号；Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353およびNew England Biolabs catalogueもまた参照のこと。さらに、ホーミングエンドヌクレアーゼおよびメガヌクレアーゼのＤＮＡ結合特異性は、非天然の標的部位を結合するように操作され得る。例えば、Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 米国特許出願公開第２００７０１１７１２８号を参照のこと。

別の代替法として、このＤＮＡ結合ドメインは、ロイシンジッパータンパク質から誘導され得る。ロイシンジッパーは、遺伝子発現と関連する重要な転写因子である多くの真核生物調節タンパク質中の、タンパク質−タンパク質相互作用に関与するタンパク質のクラスである。ロイシンジッパーとは、動物、植物、酵母などを含むいくつかの界にわたってこれらの転写因子中で共有される共通の構造的モチーフを指す。このロイシンジッパーは、２つのポリペプチドのロイシン残基がそのらせんの同じ面になるように、ロイシン残基がα−らせん中に等間隔に置かれるような様式で、特異的ＤＮＡ配列に結合する２つのポリペプチド（ホモダイマーまたはヘテロダイマー）によって形成される。ロイシンジッパーのＤＮＡ結合特異性は、本明細書に開示されるＤＮＡ結合ドメインにおいて利用され得る。

一部の実施形態では、このＤＮＡ結合ドメインは、植物病原体キサントモナス属（Xanthomonas）から誘導されるＴＡＬエフェクター由来の操作されたドメインである（Miller et al. (2011) Nature Biotechnology 29(2):143-8; Boch et al, (2009) Science 29 Oct 2009 (10.1126/science.117881) およびMoscou and Bogdanove, (2009) Science 29 Oct 2009 (10.1126/science.1178817;ならびに米国特許出願公開第２０１１０２３９３１５号、同第２０１１０１４５９４０号および同第２０１１０３０１０７３号を参照のこと）。

ＣＲＩＳＰＲ（クラスター化して規則的な配置の短い回文配列リピート）／Ｃａｓ（ＣＲＩＳＰＲ関連）ヌクレアーゼ系は、ゲノム操作のために使用され得る細菌系に基づいて最近操作されたヌクレアーゼ系である。これは、多くの細菌および古細菌の適応免疫応答の一部に基づく。ウイルスまたはプラスミドが細菌に侵入する場合、侵入者のＤＮＡのセグメントは、この「免疫」応答によってＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）に変換される。次いで、このｃｒＲＮＡは、部分的相補性の領域を介して、ｔｒａｃｒＲＮＡと呼ばれる別の型のＲＮＡと会合して、「プロトスペーサー」と呼ばれる標的ＤＮＡ中のｃｒＲＮＡと相同な領域へと、Ｃａｓ９ヌクレアーゼをガイドする。Ｃａｓ９は、ＤＮＡを切断して、ｃｒＲＮＡ転写物内に含まれる２０ヌクレオチドのガイド配列によって特定化される部位におけるＤＳＢにおいて平滑末端を生成する。Ｃａｓ９は、部位特異的なＤＮＡの認識および切断のために、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡの両方を必要とする。ここで、この系は、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡが１つの分子（「単一ガイドＲＮＡ」）へと組み合わされ得るように操作されており、この単一ガイドＲＮＡのｃｒＲＮＡ相当部分は、任意の所望の配列を標的化するようにＣａｓ９ヌクレアーゼをガイドするように操作され得る（Jinek et al (2012) Science 337, p. 816-821, Jinek et al, (2013), eLife 2:e00471およびDavid Segal, (2013) eLife 2:e00563を参照のこと）。したがって、ＣＲＩＳＰＲ／Ｃａｓ系は、ゲノム中の所望の標的において二本鎖破断（ＤＳＢ）を創出するように操作され得、ＤＳＢの修復は、エラープローン修復における増加を引き起こす修復阻害剤の使用によって影響され得る。

特定の実施形態では、Ｃａｓタンパク質は、天然に存在するＣａｓタンパク質の「機能的誘導体」であり得る。ネイティブ配列ポリペプチドの「機能的誘導体」は、ネイティブ配列ポリペプチドと共通する質的な生物学的特性を有する化合物である。「機能的誘導体」には、それらが対応するネイティブ配列ポリペプチドと共通する生物学的活性を有することを条件として、ネイティブ配列の断片、ならびにネイティブ配列ポリペプチドおよびその断片の誘導体が含まれるがこれらに限定されない。本明細書で企図される生物学的活性は、機能的誘導体がＤＮＡ基質を断片へと加水分解する能力である。用語「誘導体」は、ポリペプチドのアミノ酸配列バリアント、共有結合的改変、およびそれらの融合物の両方を包含する。Ｃａｓポリペプチドまたはその断片の適切な誘導体には、Ｃａｓタンパク質またはその断片の変異体、融合物、共有結合的改変が含まれるがこれらに限定されない。Ｃａｓタンパク質またはその断片を含むＣａｓタンパク質、ならびにＣａｓタンパク質またはその断片の誘導体は、細胞から取得可能であり得、または化学的に合成され得、またはこれら２つの手順の組合せによって取得可能であり得る。この細胞は、Ｃａｓタンパク質を天然に産生する細胞、またはＣａｓタンパク質を天然に産生し、かつより高い発現レベルで内因性Ｃａｓタンパク質を産生しもしくは外因的に導入された核酸からＣａｓタンパク質を産生するように遺伝子操作された細胞であり得、この核酸は、内因性Ｃａｓと同じまたは異なるＣａｓをコードする。一部の場合、この細胞は、Ｃａｓタンパク質を天然には産生せず、Ｃａｓタンパク質を産生するように遺伝子操作される。このＣａｓタンパク質は、ＣａｓヌクレアーゼをガイドＲＮＡと共に共発現させることによって、哺乳動物細胞中（および推定上植物細胞内）に配備される。２つの形態のガイドＲＮＡが、Le Cong, F., et al., (2013) Science 339(6121):819-823に開示されるように、Ｃａｓ媒介性のゲノム切断を促進するために使用され得る。

他の実施形態では、このＤＮＡ結合ドメインは、切断（ヌクレアーゼ）ドメインと関連され得る。例えば、ホーミングエンドヌクレアーゼは、ヌクレアーゼ機能を保持しつつ、それらのＤＮＡ結合特異性が改変され得る。さらに、ジンクフィンガータンパク質もまた、ジンクフィンガーヌクレアーゼ（ＺＦＮ）を形成するために、切断ドメインと融合され得る。本明細書に開示される融合タンパク質の切断ドメイン部分は、任意のエンドヌクレアーゼまたはエキソヌクレアーゼから取得され得る。切断ドメインが誘導され得る例示的なエンドヌクレアーゼには、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼが含まれるがこれらに限定されない。例えば、2002-2003 Catalogue, New England Biolabs, Beverly, MA;およびBelfort et al. (1997) Nucleic Acids Res. 25:3379-3388を参照のこと。ＤＮＡを切断するさらなる酵素が公知である（例えば、Ｓ１ヌクレアーゼ；リョクトウヌクレアーゼ；膵臓ＤＮａｓｅＩ；小球菌ヌクレアーゼ；酵母ＨＯエンドヌクレアーゼ；Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993もまた参照のこと）。ホーミングエンドヌクレアーゼおよびメガヌクレアーゼの非限定的な例には、Ｉ−ＳｃｅＩ、Ｉ−ＣｅｕＩ、ＰＩ−ＰｓｐＩ、ＰＩ−Ｓｃｅ、Ｉ−ＳｃｅＩＶ、Ｉ−ＣｓｍＩ、Ｉ−ＰａｎＩ、Ｉ−ＳｃｅＩＩ、Ｉ−ＰｐｏＩ、Ｉ−ＳｃｅＩＩＩ、Ｉ−ＣｒｅＩ、Ｉ−ＴｅｖＩ、Ｉ−ＴｅｖＩＩおよびＩ−ＴｅｖＩＩＩが含まれ、公知である。米国特許第５，４２０，０３２号；米国特許第６，８３３，２５２号; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353およびNew England Biolabs catalogueもまた参照のこと。これらの酵素（またはそれらの機能的断片）の１または複数が、切断ドメインおよび切断ハーフドメインの供給源として使用され得る。

制限エンドヌクレアーゼ（制限酵素）は、多くの種に存在し、（認識部位において）ＤＮＡに配列特異的に結合することが可能であり、結合の部位またはその近傍においてＤＮＡを切断することが可能である。特定の制限酵素（例えば、ＩＩＳ型）は、認識部位から外れた部位においてＤＮＡを切断し、分離可能な結合ドメインおよび切断ドメインを有する。例えば、ＩＩＳ型酵素ＦｏｋＩは、一方の鎖上のその認識部位から９ヌクレオチドの位置においてＤＮＡの二本鎖切断を触媒し、他方の鎖上のその認識部位から１３ヌクレオチドの位置においてＤＮＡの二本鎖切断を触媒する。例えば、米国特許第５，３５６，８０２号；同第５，４３６，１５０号および同第５，４８７，９９４号；ならびにLi et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982を参照のこと。したがって、一実施形態では、融合タンパク質は、操作されていてもいなくてもよい、少なくとも１つのＩＩＳ型制限酵素由来の切断ドメイン（または切断ハーフドメイン）および１または複数のジンクフィンガー結合ドメインを含む。

その切断ドメインが結合ドメインから分離可能な例示的なＩＩＳ型制限酵素は、ＦｏｋＩである。この特定の酵素は、ダイマーとして活性である。Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575。したがって、本開示の目的のために、開示された融合タンパク質において使用されるＦｏｋＩ酵素の部分は、切断ハーフドメインとみなされる。したがって、ジンクフィンガー−ＦｏｋＩ融合物を使用する細胞配列の標的化された二本鎖切断および／または標的化された置き換えのために、各々がＦｏｋＩ切断ハーフドメインを含む２つの融合タンパク質が、触媒的に活性な切断ドメインを再構成するために使用され得る。あるいは、１つのジンクフィンガー結合ドメインおよび２つのＦｏｋＩ切断ハーフドメインを含む単一ポリペプチド分子もまた使用され得る。ジンクフィンガー−ＦｏｋＩ融合物を使用する標的化された切断および標的化された配列変更のためのパラメーターは、本開示の別の箇所に提供される。

切断ドメインまたは切断ハーフドメインは、切断活性を保持するか、または重合（例えばダイマー化）して機能的切断ドメインを形成する能力を保持する、タンパク質の任意の部分であり得る。例示的なＩＩＳ型制限酵素は、その全体が参照により本明細書に組み込まれる国際公開ＷＯ２００７／０１４２７５に記載されている。

切断特異性を増強するために、切断ドメインはまた、改変され得る。特定の実施形態では、切断ハーフドメインのバリアントが使用され、これらのバリアントは、切断ハーフドメインのホモダイマー化を最小化または防止する。かかる改変された切断ハーフドメインの非限定的な例は、その全体が参照により本明細書に組み込まれるＷＯ２００７／０１４２７５に詳細に記載されている。特定の実施形態では、この切断ドメインは、ホモダイマー化を最小化または防止する操作された切断ハーフドメイン（ダイマー化ドメイン変異体とも呼ばれる）を含む。かかる実施形態は、当業者に公知であり、例えば、それらの全ての開示が、それらの全体が本明細書で参照により組み込まれる、米国特許出願公開第２００５００６４４７４号；同第２００６０１８８９８７号；同第２００７０３０５３４６号および同第２００８０１３１９６２号に記載されている。ＦｏｋＩの４４６位、４４７位、４７９位、４８３位、４８４位、４８６位、４８７位、４９０位、４９１位、４９６位、４９８位、４９９位、５００位、５３１位、５３４位、５３７位および５３８位におけるアミノ酸残基は、全て、ＦｏｋＩ切断ハーフドメインのダイマー化に影響するための標的である。

義務的ヘテロダイマーを形成するＦｏｋＩのさらなる操作された切断ハーフドメインは、本明細書に記載されるＺＦＮにおいても使用され得る。義務的ヘテロダイマーを形成するＦｏｋＩの例示的な操作された切断ハーフドメインには、第１の切断ハーフドメインがＦｏｋＩの４９０位および５３８位におけるアミノ酸残基において変異を含み、第２の切断ハーフドメインがアミノ酸残基４８６および４９９において変異を含む、対が含まれる。一実施形態では、４９０における変異は、Ｇｌｕ（Ｅ）をＬｙｓ（Ｋ）で置き換え；５３８における変異は、Ｉｓｏ（Ｉ）をＬｙｓ（Ｋ）で置き換え；４８６における変異は、Ｇｌｎ（Ｑ）をＧｌｕ（Ｅ）で置き換え；４９９位における変異は、Ｉｓｏ（Ｉ）をＬｙｓ（Ｋ）で置き換える。具体的には、本明細書に記載される操作された切断ハーフドメインは、一方の切断ハーフドメインにおいて４９０位（Ｅ→Ｋ）および５３８位（Ｉ→Ｋ）を変異させて「Ｅ４９０Ｋ：Ｉ５３８Ｋ」と称される操作された切断ハーフドメインを産生し、もう一方の切断ハーフドメインにおいて４８６位（Ｑ→Ｅ）および４９９位（Ｉ→Ｌ）を変異させて「Ｑ４８６Ｅ：Ｉ４９９Ｌ」と称される操作された切断ハーフドメインを産生することによって、調製した。本明細書に記載される操作された切断ハーフドメインは、異常な切断が最小化または無効化される義務的ヘテロダイマー変異体である。例えば、その開示が全ての目的のためにその全体が参照により組み込まれる米国特許出願公開第２００８／０１３１９６２号を参照のこと。特定の実施形態では、この操作された切断ハーフドメインは、４８６位、４９９位および４９６位（野生型ＦｏｋＩに対して番号付けした）における変異、例えば、４８６位の野生型Ｇｌｎ（Ｑ）残基をＧｌｕ（Ｅ）残基で置き換える変異、４９９位の野生型Ｉｓｏ（Ｉ）残基をＬｅｕ（Ｌ）残基で置き換える変異、および４９６位の野生型Ａｓｎ（Ｎ）残基をＡｓｐ（Ｄ）またはＧｌｕ（Ｅ）残基で置き換える変異（それぞれ、「ＥＬＤ」ドメインおよび「ＥＬＥ」ドメインとも呼ばれる）を含む。他の実施形態では、この操作された切断ハーフドメインは、４９０位、５３８位および５３７位（野生型ＦｏｋＩに対して番号付けした）における変異、例えば、４９０位の野生型Ｇｌｕ（Ｅ）残基をＬｙｓ（Ｋ）残基で置き換える変異、５３８位の野生型Ｉｓｏ（Ｉ）残基をＬｙｓ（Ｋ）残基で置き換える変異、および５３７位の野生型Ｈｉｓ（Ｈ）残基をＬｙｓ（Ｋ）残基またはＡｒｇ（Ｒ）残基で置き換える変異（それぞれ、「ＫＫＫ」ドメインおよび「ＫＫＲ」ドメインとも呼ばれる）を含む。他の実施形態では、この操作された切断ハーフドメインは、４９０位および５３７位（野生型ＦｏｋＩに対して番号付けした）における変異、例えば、４９０位の野生型Ｇｌｕ（Ｅ）残基をＬｙｓ（Ｋ）残基で置き換える変異、および５３７位の野生型Ｈｉｓ（Ｈ）残基をＬｙｓ（Ｋ）残基またはＡｒｇ（Ｒ）残基で置き換える変異（それぞれ、「ＫＩＫ」ドメインおよび「ＫＩＲ」ドメインとも呼ばれる）を含む。（米国特許出願公開第２０１１０２０１０５５号を参照のこと）。他の実施形態では、この操作された切断ハーフドメインは、「Ｓｈａｒｋｅｙ」および／または「Ｓｈａｒｋｅｙ’」変異を含む（Guo et al, (2010) J. Mol. Biol. 400(1):96-107を参照のこと）。

本明細書に記載される操作された切断ハーフドメインは、任意の適切な方法を使用して、例えば、米国特許出願公開第２００５００６４４７４号；同第２００８０１３１９６２号；および同第２０１１０２０１０５５号に記載されるような、野生型切断ハーフドメイン（ＦｏｋＩ）の部位特異的変異誘発によって、調製され得る。あるいは、ヌクレアーゼは、いわゆる「開裂酵素（split-enzyme）」テクノロジーを使用して、核酸標的部位においてｉｎｖｉｖｏでアセンブルされ得る（例えば、米国特許出願公開第２００９００６８１６４号を参照のこと）。かかる開裂酵素の成分は、別々の発現構築物のいずれか上で発現され得、または個々の成分が、例えば自己切断性２ＡペプチドまたはＩＲＥＳ配列によって分離されて、１つのオープンリーディングフレームで連結され得る。成分は、個々のジンクフィンガー結合ドメイン、またはメガヌクレアーゼ核酸結合ドメインのドメインであり得る。

ヌクレアーゼは、例えば、ＷＯ２００９／０４２１６３およびＷＯ２００９００６８１６４に記載されるような酵母ベースの染色体系における使用の前に、活性についてスクリーニングされ得る。ヌクレアーゼ発現構築物は、当該分野で公知の方法を使用して容易に設計され得る。例えば、米国特許出願公開第２００３０２３２４１０号；同第２００５０２０８４８９号；同第２００５００２６１５７号；同第２００５００６４４７４号；同第２００６０１８８９８７号；同第２００６００６３２３１号；および国際公開ＷＯ０７／０１４２７５を参照のこと。ヌクレアーゼの発現は、構成的プロモーターまたは誘導性プロモーター、例えば、ラフィノースおよび／またはガラクトースの存在下で活性化（抑制解除）され、グルコースの存在下で抑制される、ガラクトキナーゼプロモーター、の制御下にあり得る。

標的部位間の距離とは、互いに最も近い配列の端から測定される、２つの標的部位間に介在するヌクレオチドまたはヌクレオチド対の数を指す。切断が、別々の標的部位への２つのジンクフィンガードメイン／切断ハーフドメイン融合分子の結合に依存する特定の実施形態では、これら２つの標的部位は、反対のＤＮＡ鎖上に存在し得る。他の実施形態では、両方の標的部位が、同じＤＮＡ鎖上に存在する。最適なゲノム遺伝子座中への標的化された組込みのために、１または複数のＺＦＰが、所定の切断部位またはその近傍で標的部位を結合するように操作され、操作されたＤＮＡ結合ドメインおよび切断ドメインを含む融合タンパク質が、細胞において発現される。融合タンパク質のジンクフィンガー部分の標的部位への結合に際して、ＤＮＡは、好ましくは二本鎖破断を介して、切断ドメインによって、標的部位近傍で切断される。

最適なゲノム遺伝子座における二本鎖破断の存在は、相同組換えを介した外因性配列の組込みを促進する。したがって、一実施形態では、標的化されたゲノム遺伝子座中に挿入される目的の核酸配列を含むポリヌクレオチドは、相同組換えを促進するために、標的化されたゲノム遺伝子座と相同性の１または複数の領域を含む。

本明細書に記載される融合分子に加えて、選択されたゲノム配列の標的化された置き換えには、ドナー配列の導入もまた関与する。このポリヌクレオチドドナー配列は、融合タンパク質の発現の前に、それと同時に、またはそれに引き続いて、細胞中に導入され得る。一実施形態では、このドナーポリヌクレオチドは、このドナーポリヌクレオチドと、それが相同性を有する最適なゲノム遺伝子座ゲノム配列との間の相同組換えを支持するために、最適なゲノム遺伝子座との十分な相同性を含む。ドナーとゲノム配列との間のおよそ２５、５０、１００、２００、５００、７５０、１，０００、１，５００、２，０００ヌクレオチドもしくはそれ超の配列相同性、または１０ヌクレオチドと２，０００ヌクレオチドもしくはそれ超との間の任意の整数値が、相同組換えを支持する。特定の実施形態では、相同性アームは、１，０００塩基対長未満である。他の実施形態では、この相同性アームは、７５０塩基対長未満である。一実施形態では、このドナーポリヌクレオチド配列は、細胞クロマチン中の目的の領域と相同ではない配列を含むベクター分子を含み得る。ドナーポリヌクレオチド分子は、細胞クロマチンと相同性のいくつかの非連続領域を含み得る。例えば、目的の領域中に通常は存在しない配列の標的化された挿入のために、前記配列は、ドナー核酸分子中に存在し得、目的の領域中の配列と相同性の領域が隣接し得る。このドナーポリヌクレオチドは、ＤＮＡまたはＲＮＡ、一本鎖または二本鎖であり得、線状形態または環状形態で細胞中に導入され得る。例えば、米国特許出願公開第２０１０００４７８０５号、同第２０１１０２８１３６１号、同第２０１１０２０７２２１号および米国特許出願第１３／８８９，１６２号を参照のこと。線状形態で導入される場合、ドナー配列の末端は、当該分野で公知の方法によって、（例えば、エキソ核酸分解的分解から）保護され得る。例えば、１または複数のダイデオキシヌクレオチド残基が、線状分子の３’末端に付加され、および／または自己相補的オリゴヌクレオチドが、一方または両方の末端にライゲーションされる。例えば、Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889を参照のこと。分解から外因性ポリヌクレオチドを保護するためのさらなる方法には、末端アミノ基の付加、ならびに例えば、ホスホロチオエート、ホスホロアミデート（phosphoramidate）、およびＯ−メチルリボースまたはデオキシリボース残基などの、改変されたヌクレオチド間連結の使用が含まれるがこれらに限定されない。

一実施形態によれば、ダイズ植物などのトランスジェニック双子葉植物を調製する方法が提供され、目的のＤＮＡは、最適な非遺伝子ダイズゲノム遺伝子座中に挿入されている。この方法は、以下のステップを含む：
ａ．目的の核酸の挿入のための標的として、最適な非遺伝子ダイズ遺伝子座を選択するステップ；
ｂ．部位特異的ヌクレアーゼをダイズ植物細胞などの双子葉植物細胞中に導入するステップであって、この部位特異的ヌクレアーゼは、非遺伝子配列を切断する、ステップ；
ｃ．目的のＤＮＡをこの植物細胞中に導入するステップ；および
ｄ．前記非遺伝子配列に標的化された目的のＤＮＡを含むトランスジェニック植物細胞を選択するステップ。

一実施形態によれば、ダイズプロトプラスト細胞などのトランスジェニック双子葉プロトプラスト細胞を調製する方法が提供され、目的のＤＮＡは、最適な非遺伝子ダイズゲノム遺伝子座中に挿入されている。この方法は以下のステップを含む：
ａ．目的の核酸の挿入のための標的として、最適な非遺伝子ダイズ遺伝子座を選択するステップ；
ｂ．部位特異的ヌクレアーゼをダイズプロトプラスト細胞などの双子葉プロトプラスト細胞中に導入するステップであって、この部位特異的ヌクレアーゼは、非遺伝子配列を切断する、ステップ；
ｃ．目的のＤＮＡをダイズプロトプラスト細胞などの双子葉プロトプラスト細胞中に導入するステップ；および
ｄ．前記非遺伝子配列に標的化された目的のＤＮＡを含むダイズプロトプラスト細胞などのトランスジェニック双子葉プロトプラスト細胞を選択するステップ。

一実施形態では、この部位特異的ヌクレアーゼは、ジンクフィンガーヌクレアーゼ、ＣＲＩＳＰＲヌクレアーゼ、ＴＡＬＥＮヌクレアーゼまたはメガヌクレアーゼからなる群から選択され、より具体的には、一実施形態では、この部位特異的ヌクレアーゼは、ジンクフィンガーヌクレアーゼである。一実施形態によれば、目的のＤＮＡは、相同組換え修復組込み方法を介してこの非遺伝子配列内に組み込まれる。あるいは、一部の実施形態では、目的のＤＮＡは、非相同末端結合組込み方法を介して前記非遺伝子配列内に組み込まれる。さらなる実施形態では、目的のＤＮＡは、以前に記載されていない組込み方法を介して前記非遺伝子配列内に組み込まれる。一実施形態では、この方法は、以下の２、３、４、５、６、７または８の特徴を有する、目的のＤＮＡの標的化された挿入のために最適な非遺伝子ダイズゲノム遺伝子座を選択するステップを含む：
ａ．この非遺伝子配列は、少なくとも１Ｋｂ長であり、配列内に１％よりも多いＤＮＡメチル化を含まない；
ｂ．この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノム内で、０．０１５７４〜８３．５２ｃＭ／Ｍｂの比率の組換えを示す；
ｃ．この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示す；
ｄ．この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有する；
ｅ．この非遺伝子配列は、ダイズなどの双子葉染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有する；
ｆ．非遺伝子配列は、１４．４〜４５．９％のグアニン／シトシンパーセント含量範囲を有する；
ｇ．この非遺伝子配列は、遺伝子配列の近位に位置する；および
ｈ．前記非遺伝子配列を含む、ダイズゲノム配列などの双子葉ゲノム配列の１Ｍｂ領域は、１または複数のさらなる非遺伝子配列を含む。一実施形態では、この最適な非遺伝子ダイズ遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、２、３、４、５、６、７、８、９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２の遺伝子座から選択される。

送達
本明細書に開示されるドナー分子は、標的化された相同性非依存的方法および／または相同性依存的方法を介して、細胞のゲノム中に組み込まれる。かかる標的化された組込みのために、このゲノムは、ヌクレアーゼ、例えば、ＤＮＡ結合ドメイン（例えば、ジンクフィンガー結合ドメイン、ＣＲＩＳＰＲまたはＴＡＬエフェクタードメインが、所定の切断部位またはその近傍において標的部位を結合するように操作される）とヌクレアーゼドメイン（例えば、切断ドメインまたは切断ハーフドメイン）との間での融合物を使用して、所望の位置（単数または複数）において切断される。特定の実施形態では、各々がＤＮＡ結合ドメインおよび切断ハーフドメインを含む２つの融合タンパク質が、細胞中で発現され、機能的切断ドメインが再構成されＤＮＡが標的部位の近傍で切断されるような方法で、並置された標的部位に結合する。一実施形態では、切断は、２つのＤＮＡ結合ドメインの標的部位間で生じる。これらのＤＮＡ結合ドメインの一方または両方が、操作され得る。米国特許第７，８８８，１２１号；米国特許出願公開第２００５００６４４７４号ならびに国際特許公開ＷＯ０５／０８４１９０、ＷＯ０５／０１４７９１およびＷＯ０３／０８０８０９もまた参照のこと。

本明細書に記載されるヌクレアーゼは、ポリペプチドおよび／またはポリヌクレオチドとして導入され得る。例えば、各々が上記ポリペプチドの１つをコードする配列を含む２つのポリヌクレオチドが、細胞中に導入され得、それらのポリペプチドが発現され、各々がその標的配列に結合するときに、標的配列またはその近傍において切断が生じる。あるいは、両方の融合ポリペプチドをコードする配列を含む単一のポリヌクレオチドが、細胞中に導入される。ポリヌクレオチドは、ＤＮＡ、ＲＮＡまたは任意の改変された形態もしくはアナログまたはＤＮＡおよび／もしくはＲＮＡであり得る。

目的の領域における二本鎖破断の導入後に、導入遺伝子が、本明細書に記載される二本鎖ドナー分子の線状化後に、非相同性依存的方法（例えば、非相同末端結合（ＮＨＥＪ））を介して、標的化された様式で目的の領域中に組み込まれる。この二本鎖ドナーは、好ましくは、ヌクレアーゼ、例えば、ゲノム中に二本鎖破断を導入するために使用される同じまたは異なるヌクレアーゼの１または複数を用いて、ｉｎｖｉｖｏで線状化される。細胞における染色体およびドナーの同期化された切断は、（細胞中への導入の前のドナー分子の線状化と比較して）ドナーのＤＮＡ分解を制限し得る。ドナーの線状化に使用されるヌクレアーゼ標的部位は、好ましくは、導入遺伝子配列を破壊しない。

この導入遺伝子は、ヌクレアーゼオーバーハングの単純なライゲーションによって予測される方向（「フォワード」または「ＡＢ」配向と称される）で、または代替的方向（「リバース」または「ＢＡ」配向と称される）で、ゲノム中に組み込まれ得る。特定の実施形態では、この導入遺伝子は、ドナーオーバーハングおよび染色体オーバーハングの正確なライゲーション後に組み込まれる。他の実施形態では、ＢＡ配向またはＡＢ配向のいずれかでの導入遺伝子の組込みは、いくつかのヌクレオチドの欠失を生じる。

これらのような技術の適用を介して、事実上任意の種の細胞が、安定に形質転換され得る。一部の実施形態では、形質転換性ＤＮＡは、宿主細胞のゲノム中に組み込まれる。多細胞種の場合、トランスジェニック細胞は、トランスジェニック生物へと再生され得る。これらの技術のいずれかが、例えば、トランスジェニック植物のゲノム中に１または複数のドナーポリヌクレオチド配列を含むトランスジェニック植物を産生するために使用され得る。

核酸の送達は、ＤＮＡ、ＲＮＡ、ペプチドおよび／もしくはタンパク質または核酸およびペプチドの組合せを植物細胞中に送達するための方法において、例えば以下が含まれるがこれらに限定されない、当業者に公知の任意の方法によって、本発明の実施形態において植物細胞中に導入され得る：プロトプラストの形質転換によって（例えば、米国特許第５，５０８，１８４号を参照のこと）；乾燥／阻害媒介性のＤＮＡ取り込みによって（例えば、Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8を参照のこと）；エレクトロポレーションによって（例えば、米国特許第５，３８４，２５３号を参照のこと）；シリコンカーバイド繊維による撹拌によって（例えば、米国特許第５，３０２，５２３号および同第５，４６４，７６５号を参照のこと）；アグロバクテリウム属（Agrobacterium）媒介性の形質転換によって（例えば、米国特許第５，５６３，０５５号、同第５，５９１，６１６号、同第５，６９３，５１２号、同第５，８２４，８７７号、同第５，９８１，８４０号および６，３８４，３０１号を参照のこと）；ＤＮＡ被覆粒子の加速によって（例えば、米国特許第５，０１５，５８０号、同第５，５５０，３１８号、同第５，５３８，８８０号、同第６，１６０，２０８号、同第６，３９９，８６１号および同第６，４０３，８６５号を参照のこと）、ならびにナノ粒子、ナノキャリアおよび細胞透過性ペプチドによって（ＷＯ２０１１２６６４４Ａ２；ＷＯ２００９０４６３８４Ａ１；ＷＯ２００８１４８２２３Ａ１）。

植物中に発現ベクターを導入するために最も広く利用される方法は、アグロバクテリウム属（Agrobacterium）の天然の形質転換系に基づく。アグロバクテリウム・ツメファシエンス（A. tumefaciens）およびアグロバクテリウム・リゾゲネス（A. rhizogenes）は、植物細胞を遺伝的に形質転換する植物病原性土壌細菌である。それぞれアグロバクテリウム・ツメファシエンス（A. tumefaciens）およびアグロバクテリウム・リゾゲネス（A. rhizogenes）のＴ_ｉプラスミドおよびＲ_ｉプラスミドは、植物の遺伝的形質転換を担う遺伝子を有する。Ｔ_ｉ（腫瘍誘導性）プラスミドは、形質転換された植物に移入される、Ｔ−ＤＮＡとして公知の大きいセグメントを含む。Ｔ_ｉプラスミドの別のセグメントｖｉｒ領域は、Ｔ−ＤＮＡの移入を担う。このＴ−ＤＮＡ領域には、末端反復ヌクレオチド配列から各々が構成される左側および右側の境界が境を接する。一部の改変されたバイナリーベクターでは、腫瘍誘導性遺伝子は欠失されており、ｖｉｒ領域の機能が、Ｔ−ＤＮＡ境界配列が境を接する外来ＤＮＡを移入させるために利用される。このＴ領域は、例えば、トランスジェニック植物および細胞の効率的な回収のための選択可能なマーカー、ならびに本発明の融合タンパク質をコードする核酸などを移入させるために配列を挿入するためのマルチクローニング部位もまた、含み得る。

したがって、一部の実施形態では、植物形質転換ベクターは、アグロバクテリウム・ツメファシエンス（A. tumefaciens）のＴ_ｉプラスミド（例えば、米国特許第４，５３６，４７５号、同第４，６９３，９７７号、同第４，８８６，９３７号および同第５，５０１，９６７号；ならびに欧州特許ＥＰ０１２２７９１を参照のこと）またはアグロバクテリウム・リゾゲネス（A. rhizogenes）のＲ_ｉプラスミドから誘導される。さらなる植物形質転換ベクターには、例えば、Herrera-Estrella et al. (1983) Nature 303:209-13; Bevan et al. (1983), 上記; Klee et al. (1985) Bio/Technol. 3:637-42によって記載されたもの；および欧州特許ＥＰ０１２０５１６に記載されたもの、ならびに上述のいずれかから誘導されるものが含まれるがこれらに限定されない。植物と天然に相互作用する他の細菌、例えば、シノリゾビウム属（Sinorhizobium）、根粒菌属（Rhizobium）およびメソリゾビウム属（Mesorhizobium）は、いくつかの多様な植物への遺伝子移入を媒介するように改変され得る。これらの植物関連共生細菌は、安全化されたＴ_ｉプラスミドおよび適切なバイナリーベクターの両方の獲得によって、遺伝子移入について競合するようにされ得る。

目的の核酸
ダイズ植物などの双子葉植物のゲノム遺伝子座中への標的化された挿入のためのポリヌクレオチドドナー配列は、典型的には、長さが約１０〜約５，０００ヌクレオチドの範囲である。しかし、約５、６、７、８、９、１０、１１および１２Ｋｂ長の配列を含む、最大で２０，０００ヌクレオチドの実質的により長いヌクレオチドが、使用され得る。さらに、ドナー配列は、置き換えられた領域と相同ではない配列を含むベクター分子を含み得る。一実施形態では、この目的の核酸は、標的化されたゲノム遺伝子座と相同性を共有する１または複数の領域を含む。一般に、目的の核酸配列の相同な領域は、組換えが望まれるゲノム配列と少なくとも５０％の配列同一性を有する。特定の実施形態では、目的の核酸の相同な領域は、標的化されたゲノム遺伝子座中に位置する配列と、６０％、７０％、８０％、９０％、９５％、９８％、９９％または９９．９％の配列同一性を共有する。しかし、１％と１００％との間の任意の値の配列同一性が、目的の核酸の長さに依存して存在し得る。

目的の核酸は、細胞クロマチンと比較的高い配列同一性を共有する配列のいくつかの非連続領域を含み得る。例えば、標的化されたゲノム遺伝子座中に通常は存在しない配列の標的化された挿入のために、独自の配列がドナー核酸分子中に存在し得、標的化されたゲノム遺伝子座中に存在する配列と比較的高い配列同一性を共有する配列の領域がそれに隣接し得る。

目的の核酸はまた、後の使用のためのレザバとして機能するように、標的化されたゲノム遺伝子座中に挿入され得る。例えば、ダイズ植物などの双子葉植物のゲノムの非遺伝子領域と相同な配列を含むが、目的の核酸（任意選択で、誘導性プロモーターの制御下にＺＦＮをコードする）を含む第１の核酸配列が、標的化されたゲノム遺伝子座において挿入され得る。次に、第２の核酸配列が、ダイズ植物などの双子葉植物の最適な非遺伝子ゲノム遺伝子座中への目的のＤＮＡの挿入を誘導するために、細胞中に導入される。第１の核酸配列が最適な非遺伝子ダイズゲノム遺伝子座に対して特異的なＺＦＮを含み、第２の核酸配列が目的のＤＮＡ配列を含むか、その逆であるかのいずれかである。一実施形態では、このＺＦＮは、最適な非遺伝子ダイズゲノム遺伝子座および目的の核酸の両方を切断する。次いで、ゲノム中の得られた二本鎖破断は、最適なゲノム遺伝子座から放出される目的の核酸のための組込み部位になり得る。あるいは、ゲノム中に既に位置するＺＦＮの発現は、導入された目的の核酸のための組込み部位に次いでなり得るゲノム中の二本鎖破断を誘導するために、目的のＤＮＡの導入後に誘導され得る。この方法で、任意の目的の領域における目的のＤＮＡの標的化された組込みの効率が改善され得るが、それは、この方法が、ＺＦＮをコードする核酸および目的のＤＮＡの両方の同時取り込みに依存しないからである。

目的の核酸はまた、引き続く挿入のための標的部位として機能するように、最適な非遺伝子ダイズゲノム遺伝子座中に挿入され得る。例えば、さらなるＺＦＮ設計のための認識部位を含むＤＮＡ配列から構成される目的の核酸が、この遺伝子座中に挿入され得る。引き続いて、さらなるＺＦＮ設計が、細胞において生成および発現され得、その結果、元の目的の核酸が切断され、修復または相同組換えによって改変される。この方法で、目的の核酸の反復する組込みが、ダイズ植物などの双子葉植物の最適な非遺伝子ゲノム遺伝子座において生じ得る。

最適な非遺伝子ダイズゲノム遺伝子座中に挿入され得る例示的な外因性配列には、任意のポリペプチドコード配列（例えば、ｃＤＮＡ）、プロモーター、エンハンサーおよび他の調節配列（例えば、干渉ＲＮＡ配列、ｓｈＲＮＡ発現カセット、エピトープタグ、マーカー遺伝子、切断酵素認識部位および種々の型の発現構築物が含まれるがこれらに限定されない。かかる配列は、標準的な分子生物学的技術（クローニング、合成など）を使用して容易に取得され得、および／または市販されている。

ＺＦＮを発現させるために、融合タンパク質をコードする配列は、典型的には、転写を指向させるためのプロモーターを含む発現ベクター中にサブクローニングされる。適切な原核生物および真核生物プロモーターは、当該分野で周知であり、例えば、Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3.sup.rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990);およびCurrent Protocols in Molecular Biology (Ausubel et al., 上記)に記載されている。ＺＦＮを発現するための細菌発現系は、例えば、大腸菌（E. coli）、バチルス属（Bacillus）種およびサルモネラ属（Salmonella）において入手可能である（Palva et al., Gene 22:229-235 (1983)）。かかる発現系のためのキットは市販されている。哺乳動物細胞、酵母および昆虫細胞についての真核生物発現系は、当業者に周知であり、市販もされている。

遺伝子材料を細胞中に輸送するために使用される特定の発現ベクターは、融合タンパク質の意図した使用、例えば、植物、動物、細菌、真菌、原生動物などにおける発現に関して、選択される（以下に記載する発現ベクターを参照のこと）。標準的な細菌および動物の発現ベクターは、当該分野で公知であり、例えば、米国特許出願公開第２００５００６４４７４号Ａ１ならびに国際特許公開ＷＯ０５／０８４１９０、ＷＯ０５／０１４７９１およびＷＯ０３／０８０８０９に詳細に記載されている。

標準的なトランスフェクション方法は、標準的な技術を使用して次いで精製され得る大量のタンパク質を発現する細菌、哺乳動物、酵母または昆虫細胞株を産生するために使用され得る（例えば、Colley et al., J. Biol. Chem. 264:17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)を参照のこと）。真核生物細胞および原核生物細胞の形質転換は、標準的な技術に従って実施される（例えば、Morrison, J. Bact. 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds., 1983)を参照のこと。

開示された方法および組成物は、最適な非遺伝子ダイズゲノム遺伝子座の１つなどの所定の位置中にポリヌクレオチドドナー配列を挿入するために使用され得る。ダイズゲノム中に導入された導入遺伝子の発現はその組込み部位に決定的に依存するので、これは有用である。したがって、除草剤耐性、昆虫抵抗性、栄養素、抗生物質または治療分子をコードする遺伝子は、標的化された組換えによって挿入され得る。

一実施形態では、この目的の核酸は、グリホサートもしくは別の除草剤に対するさらなる抵抗性もしくは耐性を提供する遺伝子コード配列と、組み合わされるもしくは「スタックされ」、ならびに／あるいは選択された昆虫もしくは疾患に対する抵抗性および／または栄養増強および／または改善された農学的特徴および／または飼料、食品、工業、医薬もしくは他の使用において有用なタンパク質もしくは他の産物を提供する。植物ゲノム内の２以上の目的の核酸配列の「スタッキング」は、例えば、２以上の事象を使用する従来の植物育種、目的の配列を含む構築物による植物の形質転換、トランスジェニック植物の再形質転換、または相同組換えを介した標的化された組込みによる新たな形質の追加を介して、達成され得る。

目的のかかるポリヌクレオチドドナーヌクレオチド配列には、以下に提供される例が含まれるがこれらに限定されない：
１．有害生物または疾患に対する抵抗性を付与する遺伝子またはコード配列（例えば、ｉＲＮＡ）
（Ａ）植物疾患抵抗性遺伝子。植物防御は、植物における疾患抵抗性遺伝子（Ｒ）の産物と病原体における対応する非病原性（Ａｖｒ）遺伝子の産物との間の特異的相互作用によって活性化される場合が多い。植物変種は、特定の病原体株に対して抵抗性である植物を操作するために、クローニングされた抵抗性遺伝子で形質転換され得る。かかる遺伝子の例には、クラドスポリウム・フルブム（Cladosporium fulvum）に対する抵抗性に関するトマトＣｆ−９遺伝子（Jones et al., 1994 Science 266:789）、シュードモナス・シリンガエ（Pseudomonas syringae）ｐｖ．ｔｏｍａｔｏに対する抵抗性に関するタンパク質キナーゼをコードするトマトＰｔｏ遺伝子（Martin et al., 1993 Science 262:1432）、およびシュードモナス・シリンガエ（Pseudomonas syringae）に対する抵抗性に関するシロイヌナズナ属（Arabidopsis）ＲＳＳＰ２遺伝子（Mindrinos et al., 1994 Cell 78:1089）が含まれる。

（Ｂ）バチルス・チューリンゲンシス（Bacillus thuringiensis）タンパク質、その誘導体またはそれらに基づいてモデル化した合成ポリペプチド、例えば、Ｂｔ δ−エンドトキシン遺伝子（Geiser et al., 1986 Gene 48:109）および植物殺虫剤（vegetative insecticidal）（ＶＩＰ）遺伝子（例えば、Estruch et al. (1996) Proc. Natl. Acad. Sci. 93:5389-94を参照のこと）のヌクレオチド配列。さらに、δ−エンドトキシン遺伝子をコードするＤＮＡ分子は、ＡＴＣＣ受入番号４００９８、６７１３６、３１９９５および３１９９８の下で、ＡｍｅｒｉｃａｎＴｙｐｅＣｕｌｔｕｒｅＣｏｌｌｅｃｔｉｏｎ（Ｒｏｃｋｖｉｌｌｅ、Ｍｄ．）から購入され得る。

（Ｃ）レクチン、例えば、いくつかのクリビア・ミニアータ（Clivia miniata）マンノース結合レクチン遺伝子のヌクレオチド配列（Van Damme et al., 1994 Plant Molec. Biol. 24:825）。

（Ｄ）ビタミン結合タンパク質、例えば、害虫に対する幼虫駆除剤（larvicide）として有用なアビジンおよびアビジンホモログ。米国特許第５，６５９，０２６号を参照のこと。

（Ｅ）酵素阻害剤、例えば、プロテアーゼ阻害剤またはアミラーゼ阻害剤。かかる遺伝子の例には、イネシステインプロテイナーゼ阻害剤（Abe et al., 1987 J. Biol. Chem. 262:16793）、タバコプロテイナーゼ阻害剤Ｉ（Huub et al., 1993 Plant Molec. Biol. 21:985）およびα−アミラーゼ阻害剤（Sumitani et al., 1993 Biosci. Biotech. Biochem. 57:1243）が含まれる。

（Ｆ）昆虫特異的ホルモンまたはフェロモン、例えば、エクジステロイドおよび幼若ホルモンそのバリアント、それらに基づく模倣物、またはそれらのアンタゴニストもしくはアゴニスト、例えば、クローニングされた幼若ホルモンエステラーゼ、幼若ホルモンの不活性化因子のバキュロウイルス発現（Hammock et al., 1990 Nature 344:458）。

（Ｇ）発現の際に、影響される有害生物の生理機能を破壊する、昆虫特異的ペプチドまたは神経ペプチド（J. Biol. Chem. 269:9）。かかる遺伝子の例には、昆虫利尿ホルモン受容体（Regan, 1994）、ディプロプテラ・プンクタータ（Diploptera punctata）において同定されたアロスタチン（allostatin）（Pratt, 1989）および昆虫特異的麻痺性神経毒（米国特許第５，２６６，３６１号）が含まれる。

（Ｈ）ヘビ、スズメバチなどによって天然に産生される昆虫特異的毒液、例えば、サソリ昆虫毒（insectotoxic）ペプチド（Pang, 1992 Gene 116:165）。

（Ｉ）モノテルペン、セスキテルペン、ステロイド、ヒドロキサム酸、フェニルプロパノイド誘導体または殺虫剤活性を有する別の非タンパク質分子の過剰蓄積を担う酵素。

（Ｊ）天然のものであれ合成であれ、生物学的に活性な分子の翻訳後修飾を含む改変に関与する酵素；例えば、解糖酵素、タンパク質分解酵素、脂肪分解酵素、ヌクレアーゼ、シクラーゼ、トランスアミナーゼ、エステラーゼ、ヒドロラーゼ、ホスファターゼ、キナーゼ、ホスホリラーゼ、ポリメラーゼ、エラスターゼ、キチナーゼおよびグルカナーゼ。かかる遺伝子の例には、ｃａｌｌａｓ遺伝子（ＰＣＴ出願公開ＷＯ９３／０２１９７）、キチナーゼコード配列（これは、例えば、受入番号３９９９６３７および６７１５２の下でＡＴＣＣから取得され得る）、タバコ鉤虫キチナーゼ（Kramer et al., 1993 Insect Molec. Biol. 23:691）、およびパセリｕｂｉ４−２ポリユビキチン遺伝子（Kawalleck et al., 1993 Plant Molec. Biol. 21:673）が含まれる。

（Ｋ）シグナル伝達を刺激する分子。かかる分子の例には、リョクトウカルモジュリンｃＤＮＡクローンのヌクレオチド配列（Botella et al., 1994 Plant Molec. Biol. 24:757）およびダイズカルモジュリンｃＤＮＡクローンのヌクレオチド配列（Griess et al., 1994 Plant Physiol. 104:1467）が含まれる。

（Ｌ）疎水性モーメントペプチド。米国特許第５，６５９，０２６号および同第５，６０７，９１４号を参照のこと；後者は、疾患抵抗性を付与する合成抗菌ペプチドを教示している。

（Ｍ）膜パーミアーゼ、チャネル形成因子またはチャネルブロッカー、例えば、トランスジェニックタバコ植物をシュードモナス・ソラナセアラム（Pseudomonas solanacearum）に対して抵抗性にする、セクロピン−β溶解ペプチドアナログ（Jaynes et al., 1993 Plant Sci. 89:43）。

（Ｎ）ウイルス侵襲性タンパク質またはそれに由来する複合毒素。例えば、形質転換された植物細胞におけるウイルスコートタンパク質の蓄積は、そのコートタンパク質遺伝子が由来するウイルスならびに関連ウイルスによってもたらされる、ウイルス感染および／または疾患発症に対する抵抗性を与える。アルファルファモザイクウイルス、キュウリモザイクウイルス、タバコ条斑病ウイルス、ジャガイモウイルスＸ、ジャガイモウイルスＹ、タバコエッチ病ウイルス、タバコ茎えそウイルス（tobacco rattle virus）およびタバコモザイクウイルスに対する、コートタンパク質媒介性の抵抗性が、形質転換された植物に付与されている。例えば、Beachy et al. (1990) Ann. Rev. Phytopathol. 28:451を参照のこと。

（Ｏ）昆虫特異的抗体またはそれ由来の免疫毒素。したがって、昆虫の腸における重要な代謝機能に対して標的化された抗体は、影響される酵素を不活性化させて、昆虫を死滅させる。例えば、Taylor et al. (1994) Abstract #497, Seventh Int'l. Symposium on Molecular Plant-Microbe Interactionsは、単鎖抗体断片の産生を介した、トランスジェニックタバコにおける酵素不活性化を示す。

（Ｐ）ウイルス特異的抗体。例えば、組換え抗体遺伝子を発現するトランスジェニック植物がウイルス攻撃から保護されることを示す、Tavladoraki et al. (1993) Nature 266:469を参照のこと。

（Ｑ）病原体または寄生生物によって天然に産生される発育抑制（developmental-arrestive）タンパク質。したがって、真菌エンドα−１，４−Ｄポリガラクツロナーゼは、植物細胞壁ホモ−α−１，４−Ｄ−ガラクツロナーゼを可溶化させることによって、真菌コロニー形成および植物栄養素放出を促進する(Lamb et al., 1992) Bio/Technology 10:1436。マメエンドポリガラクツロナーゼ阻害タンパク質をコードする遺伝子のクローニングおよび特徴付けは、Toubart et al. (1992 Plant J. 2:367)によって記載されている。

（Ｒ）植物によって天然に産生される発育抑制タンパク質、例えば、真菌疾患に対する増加した抵抗性を提供するオオムギリボソーム不活性化遺伝子(Longemann et al., 1992). Bio/Technology 10:3305。

（Ｓ）ＲＮＡ分子が標的遺伝子の発現を阻害するために使用される、ＲＮＡ干渉。一例では、ＲＮＡ分子は、部分的にまたは完全に二本鎖であり、サイレンシング応答を誘発し、低分子干渉ＲＮＡへのｄｓＲＮＡの切断を生じ、次いで、これらの低分子干渉ＲＮＡは、相同なｍＲＮＡを破壊する標的化複合体中に取り込まれる。例えば、Ｆｉｒｅら、米国特許第６，５０６，５５９号；Ｇｒａｈａｍら、米国特許第６，５７３，０９９号を参照のこと。

２．除草剤に対する抵抗性を付与する遺伝子
（Ａ）成長点（growing point）または成長点（meristem）を阻害する除草剤、例えば、イミダザリノン（imidazalinone）、スルホンアニリド（sulfonanilide）またはスルホニルウレア除草剤に対する抵抗性または耐性をコードする遺伝子。このカテゴリー中の例示的な遺伝子は、アセトヒドロキシ酸シンターゼ（ＡＨＡＳ）酵素（Miki et al., 1990 Theor. Appl. Genet. 80:449）としても公知の、変異体アセト乳酸シンターゼ（ＡＬＳ）（Lee et al., 1988 EMBOJ. 7:1241）をコードする。

（Ｂ）変異体ＥＰＳＰシンターゼおよびａｒｏＡ遺伝子によって、またはＤＧＴ−２８、２ｍＥＰＳＰＳ、ＧＡＴ（グリホサートアセチルトランスフェラーゼ）またはＧＯＸ（グリホサートオキシダーゼ）などの遺伝子による代謝不活性化を介して与えられる、グリホサートに対する抵抗性もしくは耐性、ならびに他のホスホノ化合物、例えば、グルホシネート（ｐａｔ、ｂａｒおよびｄｓｍ−２遺伝子）、およびアリールオキシフェノキシプロピオン酸およびシクロヘキサンジオン（ＡＣＣａｓｅ阻害剤コード遺伝子）に対する抵抗性もしくは耐性をコードする、１または複数のさらなる遺伝子。例えば、グリホサート抵抗性を付与し得るＥＰＳＰの一形態のヌクレオチド配列を開示する、米国特許第４，９４０，８３５号を参照のこと。変異体ａｒｏＡ遺伝子をコードするＤＮＡ分子は、ＡＴＣＣ受入番号３９２５６の下で取得され得、この変異体遺伝子のヌクレオチド配列は、米国特許第４，７６９，０６１号に開示されている。欧州特許出願第０３３３０３３号および米国特許第４，９７５，３７４号は、Ｌ−ホスフィノトリシンなどの除草剤に対する抵抗性を付与するグルタミンシンテターゼ遺伝子のヌクレオチド配列を開示している。ホスフィノトリシンアセチルトランスフェラーゼ遺伝子のヌクレオチド配列は、欧州特許出願第０２４２２４６号に提供されている。De Greef et al. (1989) Bio/Technology 7:61は、ホスフィノトリシンアセチルトランスフェラーゼ活性をコードするキメラｂａｒ遺伝子を発現するトランスジェニック植物の産生を記載している。アリールオキシフェノキシプロピオン酸およびシクロヘキサンジオン、例えば、セトキシジムおよびハロキシホップに対する抵抗性を付与する遺伝子の例示は、Marshall et al. (1992) Theor. Appl. Genet. 83:435によって記載されるＡｃｃｌ−Ｓ１、Ａｃｃｌ−Ｓ２およびＡｃｃｌ−Ｓ３遺伝子である。

（Ｃ）光合成を阻害する除草剤、例えば、トリアジン（ｐｓｂＡおよびｇｓ＋遺伝子）およびベンゾニトリル（ニトリラーゼ遺伝子）に対する抵抗性または耐性をコードする遺伝子。Przibilla et al. (1991) Plant Cell 3:169は、クラミドモナス属（Chlamydomonas）を形質転換するための、変異体ｐｓｂＡ遺伝子をコードするプラスミドの使用を記載している。ニトリラーゼ遺伝子のヌクレオチド配列は、米国特許第４，８１０，６４８号に開示されており、これらの遺伝子を含むＤＮＡ分子は、ＡＴＣＣ受入番号５３４３５、６７４４１および６７４４２の下で入手可能である。グルタチオンＳ−トランスフェラーゼをコードするＤＮＡのクローニングおよび発現は、Hayes et al. (1992) Biochem. J. 285:173によって記載されている。

（Ｄ）パラ−ヒドロキシフェニルピルベート（ＨＰＰ）がホモゲンチセート（homogentisate）へと変形される反応を触媒する酵素、ヒドロキシフェニルピルビン酸ジオキシゲナーゼ（ＨＰＰＤ）に結合する除草剤に対する抵抗性または耐性をコードする遺伝子。これには、除草剤、例えば、イソキサゾール（ＥＰ４１８１７５、ＥＰ４７０８５６、ＥＰ４８７３５２、ＥＰ５２７０３６、ＥＰ５６０４８２、ＥＰ６８２６５９、米国特許第５，４２４，２７６号）、特に、ダイズに対する選択的除草剤であるイソキサフルトール、ジケトニトリル（ＥＰ４９６６３０、ＥＰ４９６６３１）、特に、２−シアノ−３−シクロプロピル−１−（２−ＳＯ２ＣＨ３−４−ＣＦ３フェニル）プロパン−１，３−ジオンおよび２−シアノ−３−シクロプロピル−１−（２−ＳＯ２ＣＨ３−４−２，３Ｃｌ２フェニル）プロパン−１，３−ジオン、トリケトン（ＥＰ６２５５０５、ＥＰ６２５５０８、米国特許第５，５０６，１９５号）、特に、スルコトリオン、およびピラゾリネート（pyrazolinate）が含まれる。例えば、米国特許第６，２６８，５４９号および同第６，２４５，９６８号ならびに米国特許出願公開第２００３００６６１０２号に記載される遺伝子を含む、植物においてＨＰＰＤの過多を生じる遺伝子は、かかる除草剤に対する耐性または抵抗性を提供し得る。

（Ｅ）フェノキシオーキシン除草剤、例えば、２，４−ジクロロフェノキシ酢酸（２，４−Ｄ）に対する抵抗性または耐性をコードし、アリールオキシフェノキシプロピオネート（ＡＯＰＰ）除草剤に対する抵抗性または耐性もまた付与し得る、遺伝子。かかる遺伝子の例には、米国特許第７，８３８，７３３号に記載される、α−ケトグルタル酸依存性ジオキシゲナーゼ酵素（ａａｄ−１）遺伝子が含まれる。

（Ｆ）フェノキシオーキシン除草剤、例えば、２，４−ジクロロフェノキシ酢酸（２，４−Ｄ）に対する抵抗性または耐性をコードし、ピリジルオキシオーキシン除草剤、例えば、フルロキシピルまたはトリクロピルに対する抵抗性または耐性もまた付与し得る、遺伝子。かかる遺伝子の例には、ＷＯ２００７／０５３４８２Ａ２に記載される、α−ケトグルタル酸依存性ジオキシゲナーゼ酵素遺伝子（ａａｄ−１２）が含まれる。

（Ｇ）ジカンバに対する抵抗性または耐性をコードする遺伝子（例えば、米国特許出願公開第２００３０１３５８７９号を参照のこと）。

（Ｈ）プロトポルフィリノーゲンオキシダーゼ（ＰＰＯ）を阻害する除草剤に対する抵抗性または耐性を提供する遺伝子（米国特許第５，７６７，３７３号を参照のこと）。

（Ｉ）光化学系ＩＩ反応中心（ＰＳＩＩ）のコアタンパク質に結合するトリアジン除草剤（例えば、アトラジン）および尿素誘導体（例えば、ジウロン）除草剤に対する抵抗性または耐性を提供する遺伝子（Brussian et al., (1989) EMBO J. 1989, 8(4): 1237-1245を参照のこと。

３．付加価値形質を付与するまたはそれに寄与する遺伝子
（Ａ）例えば、植物のステアリン酸含量を増加させるためにアンチセンス遺伝子またはステアロイル−ＡＣＰデサチュラーゼでダイズまたはアブラナ属（Brassica）を形質転換することによって改変された脂肪酸代謝(Knultzon et al., 1992) Proc. Nat. Acad. Sci. USA 89:2624。

（Ｂ）減少したフィテート（phytate）含量
（１）フィターゼコード遺伝子、例えば、クロコウジカビ（Aspergillus niger）フィターゼ遺伝子（Van Hartingsveldt et al., 1993 Gene 127:87）の導入は、フィテート（phytate）の分解を増強し、形質転換された植物により多くの遊離ホスフェート（phosphate）を追加する。

（２）フィテート（phytate）含量を低減させる遺伝子が導入され得る。双子葉では、これは、例えば、低レベルのフィチン酸を特徴とするダイズ変異体の原因となる単一の対立遺伝子に関連するＤＮＡをクローニングし、次いで再導入することによって、達成され得る（Raboy et al., 1990 Maydica 35:383）。

（Ｃ）例えば、デンプンの分岐パターンを変更する酵素をコードする遺伝子で植物を形質転換することによってもたらされる、改変された炭水化物組成。かかる酵素の例には、ストレプトコッカス・ミューカス（Streptococcus mucus）フルクトシルトランスフェラーゼ遺伝子(Shiroza et al., 1988) J. Bacteriol. 170:810、枯草菌（Bacillus subtilis）レバンスクラーゼ遺伝子（Steinmetz et al., 1985 Mol. Gen. Genel. 200:220）、バチルス・リケニフォルミス（Bacillus licheniformis）α−アミラーゼ（Pen et al., 1992 Bio/Technology 10:292）、トマトインベルターゼ遺伝子（Elliot et al., 1993）、オオムギアミラーゼ遺伝子（Sogaard et al., 1993 J. Biol. Chem. 268:22480）およびダイズ胚乳デンプン分岐酵素ＩＩ（Fisher et al., 1993 Plant Physiol. 102:10450）が含まれる。

ＩＩＩ．組換え構築物
本明細書に開示するように、本開示は、少なくとも１Ｋｂの最適な非遺伝子ダイズゲノム配列および目的のＤＮＡを含む組換えゲノム配列を提供し、ここで、この挿入された目的のＤＮＡは、前記非遺伝子配列中に挿入されている。一実施形態では、目的のＤＮＡは、分析ドメイン、有害生物または疾患に対する抵抗性を付与する遺伝子もしくはコード配列（例えば、ｉＲＮＡ）、除草剤に対する抵抗性を付与する遺伝子、または付加価値形質を付与するもしくはそれに寄与する遺伝子であり、この最適な非遺伝子ダイズゲノム配列は、以下の１、２、３、４、５、６、７または８の特徴を含む：
ａ．この非遺伝子配列は、約１Ｋｂ長〜約５．７Ｋｂ長であり、メチル化されたポリヌクレオチドを含まない；
ｂ．この非遺伝子配列は、ダイズ植物などの双子葉植物のゲノム内で、０．０１５７４〜８３．５２ｃＭ／Ｍｂの比率の組換えを示す；
ｃ．この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示す；
ｄ．この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有する；
ｅ．この非遺伝子配列は、ダイズ染色体中心などの双子葉染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有する；
ｆ．この非遺伝子配列は、１４．４〜４５．９％のグアニン／シトシンパーセント含量範囲を有する；
ｇ．この非遺伝子配列は、ネイティブ非遺伝子配列を含む連続するゲノムＤＮＡの４０Ｋｂ以内で、ダイズコード配列などの既知または予測された双子葉コード配列を含む遺伝子配列の近位に位置する；および
ｈ．この非遺伝子配列は、第２の非遺伝子配列を少なくとも含むゲノム配列などの双子葉ゲノム配列の１Ｍｂ領域中に位置する。

一実施形態では、この最適な非遺伝子ダイズゲノム配列は、ネイティブ非遺伝子配列を含む連続するゲノムＤＮＡの４０Ｋｂ以内に、１〜１８の既知または予測されたダイズコード配列を含む遺伝子領域を有するとして、さらに特徴付けられる。一実施形態では、この最適な非遺伝子ダイズ遺伝子座は、クラスター１、２、３、４、５、６、７、８、９、１０、１１、２、３、４、５、６、７、８、９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１または３２の遺伝子座から選択される。

ＩＶ．トランスジェニック植物
組換えの最適な非遺伝子ダイズ遺伝子座を含むトランスジェニック植物もまた、本開示の一実施形態に従って提供される。かかるトランスジェニック植物は、当業者に公知の技術を使用して調製され得る。

形質転換された双子葉細胞、カルス、組織または植物（即ち、ダイズ細胞、カルス、組織または植物）は、形質転換性ＤＮＡ上に存在するマーカー遺伝子によってコードされる形質について操作された植物材料を選択またはスクリーニングすることによって、同定および単離され得る。例えば、選択は、形質転換性遺伝子構築物がそれに対する抵抗性を付与する抗生物質または除草剤の阻害量を含む培地上で、操作された植物材料を増殖させることによって、実施され得る。さらに、形質転換された細胞は、組換え核酸構築物上に存在し得る任意の可視的マーカー遺伝子（例えば、黄色蛍光タンパク質、緑色蛍光タンパク質、赤色蛍光タンパク質、ベータ−グルクロニダーゼ、ルシフェラーゼ、ＢまたはＣ１遺伝子）の活性についてスクリーニングすることによっても、同定され得る。かかる選択およびスクリーニング方法論は、当業者に周知である。

物理的方法および生化学的方法もまた、挿入された遺伝子構築物を含む植物または植物細胞形質転換体を同定するために使用され得る。これらの方法には、以下が含まれるがこれらに限定されない：１）組換えＤＮＡ挿入物の構造を検出および決定するためのサザン分析またはＰＣＲ増幅；２）遺伝子構築物のＲＮＡ転写物を検出および試験するための、ノザンブロット、Ｓ１ＲＮａｓｅ保護、プライマー伸長または逆転写ＰＣＲ増幅；３）かかる遺伝子産物が遺伝子構築物によってコードされる場合、酵素またはリボザイム活性を検出するための酵素アッセイ；４）遺伝子構築物産物がタンパク質である場合、タンパク質ゲル電気泳動、ウエスタンブロット技術、免疫沈降または酵素結合イムノアッセイ（ＥＬＩＳＡ）。ｉｎｓｉｔｕハイブリダイゼーション、酵素染色および免疫染色などのさらなる技術もまた、特定の植物器官および組織における組換え構築物の存在または発現を検出するために使用され得る。全てのこれらのアッセイを実施するための方法は、当業者に周知である。

本明細書に開示される方法を使用した遺伝子操作の効果は、例えば、目的の組織から単離されたＲＮＡ（例えば、ｍＲＮＡ）のノザンブロットによって観察され得る。典型的には、ｍＲＮＡが存在する場合またはｍＲＮＡの量が増加した場合、対応する導入遺伝子が発現されていると想定できる。遺伝子および／またはコードされたポリペプチド活性を測定する他の方法が使用され得る。異なる型の酵素アッセイが、使用される基質、および反応産物または副産物の増加または減少を検出する方法に依存して、使用され得る。さらに、発現されたポリペプチドのレベルは、免疫化学的に、即ち、例えば、電気泳動的検出アッセイ（染色またはウエスタンブロッティングのいずれかを用いる）によって、ＥＬＩＳＡ、ＲＩＡ、ＥＩＡおよび当業者に周知の他の抗体ベースのアッセイによって、測定され得る。１つの非限定的な例として、ＥＬＩＳＡアッセイを使用したＡＡＤ−１２（アリールオキシアルカノエートジオキシゲナーゼ；ＷＯ２０１１／０６６３６０を参照のこと）およびＰＡＴ（ホスフィノトリシン−Ｎ−アセチル−トランスフェラーゼ（ＰＡＴ））タンパク質の検出は、その全体が参照により本明細書に組み込まれる米国特許出願公開第２００９００９３３６６号に記載されている。導入遺伝子は、植物の一部の組織においてもしくは一部の発生段階において選択的に発現され得、または導入遺伝子は、実質的にその生活環全体に沿って、実質的に全ての植物組織において発現され得る。しかし、任意の組合せ的発現様式もまた適用可能である。

当業者は、外因性ポリヌクレオチドドナー配列がトランスジェニック植物中に安定に取り込まれ、作動可能であることが確認された後に、それが性的交配によって他の植物中に導入され得ることを認識する。いくつかの標準的な育種技術のいずれかが、交配される種に依存して使用され得る。

本開示は、上記トランスジェニック植物の種子もまた包含し、この種子は、導入遺伝子または遺伝子構築物を有する。本開示はさらに、上記トランスジェニック植物の後代、クローン、細胞株または細胞を包含し、この後代、クローン、細胞株または細胞は、最適な遺伝子座に挿入された導入遺伝子または遺伝子構築物を有する。

上記形質転換技術のいずれかによって産生される形質転換された植物細胞は、形質転換された遺伝子型を有し、したがって所望の表現型を有する植物全体を再生するために、培養され得る。かかる再生技術は、組織培養増殖培地中の特定の植物ホルモンの操作に依存し、典型的には、所望のヌクレオチド配列と一緒に導入された殺生物剤および／または除草剤マーカーに依存する。培養されたプロトプラストからの植物再生は、Evans, et al., "Protoplasts Isolation and Culture" in Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983;およびBinding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985に記載されている。再生は、植物カルス、外植片、器官、花粉、胚またはそれらの部分からも得られ得る。かかる再生技術は、Klee et al. (1987) Ann. Rev. of Plant Phys. 38:467-486中に一般に記載されている。

ポリペプチドをコードするヌクレオチド配列を含むトランスジェニック植物または植物材料は、一部の実施形態では、以下の特徴のうち１または複数を示し得る：植物の細胞におけるポリペプチドの発現；植物の細胞の色素体におけるポリペプチドの部分の発現；植物の細胞のサイトゾルから細胞の色素体中へのポリペプチドのインポート；植物の細胞におけるポリペプチドの色素体特異的発現；および／または植物の細胞におけるポリペプチドの局在化。かかる植物は、コードされたポリペプチドの発現以外の１または複数の望ましい形質をさらに有し得る。かかる形質には、例えば以下が含まれ得る：昆虫、他の有害生物および疾患原因因子に対する抵抗性；除草剤に対する耐性；増強された安定性、収量または保存期間；環境耐性；医薬品製造；工業製品製造；および栄養増強。

一実施形態によれば、組換えの最適な非遺伝子ダイズ遺伝子座を含むトランスジェニック双子葉プロトプラスト（即ち、ダイズプロトプラスト）が提供される。より具体的には、双子葉プロトプラスト（即ち、ダイズプロトプラスト）の最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のＤＮＡを含むダイズプロトプラストなどの双子葉プロトプラストが提供され、前記非遺伝子ダイズゲノム遺伝子座は、約１Ｋｂ長〜約５．７Ｋｂ長であり、いずれのメチル化されたヌクレオチドも欠く。一実施形態では、このトランスジェニック双子葉プロトプラスト（即ち、トランスジェニックダイズプロトプラスト）は、最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のＤＮＡを含み、目的のＤＮＡは、分析ドメインおよび／またはオープンリーディングフレームを含む。一実施形態では、この挿入された目的のＤＮＡは、ペプチドをコードし、さらなる一実施形態では、目的のＤＮＡは、導入遺伝子を含む少なくとも１つの遺伝子発現カセットを含む。

一実施形態によれば、組換えの最適な非遺伝子ダイズ遺伝子座を含む、トランスジェニック双子葉植物、双子葉植物部分または双子葉植物細胞（即ち、トランスジェニックダイズ植物、ダイズ植物部分またはダイズ植物細胞）が提供される。より具体的には、双子葉植物、双子葉植物部分または双子葉植物細胞（即ち、ダイズ植物、ダイズ植物部分またはダイズ植物細胞）の最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のＤＮＡを含む、双子葉植物、双子葉植物部分または双子葉植物細胞（即ち、ダイズ植物、ダイズ植物部分またはダイズ植物細胞）が提供され、前記非遺伝子ダイズゲノム遺伝子座は、約１Ｋｂ長〜約５．７Ｋｂ長であり、いずれのメチル化されたヌクレオチドも欠く。一実施形態では、このトランスジェニック双子葉植物、双子葉植物部分または双子葉植物細胞（即ち、トランスジェニックダイズ植物、ダイズ植物部分またはダイズ植物細胞）は、最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のＤＮＡを含み、目的のＤＮＡは、分析ドメインおよび／またはオープンリーディングフレームを含む。一実施形態では、この挿入された目的のＤＮＡは、ペプチドをコードし、さらなる一実施形態では、目的のＤＮＡは、導入遺伝子を含む少なくとも１つの遺伝子発現カセットを含む。

実施形態１によれば、低メチル化され、標的化可能であり、ダイズゲノム内の遺伝子領域の近位に位置し、組換えの証拠を示す、少なくとも１Ｋｂの非遺伝子ダイズゲノム配列が、非遺伝子配列中に挿入された目的のＤＮＡをさらに含む、組換え配列が提供される。実施形態２によれば、実施形態１の組換え配列は、以下の特徴：
ａ．前記非遺伝子配列のメチル化のレベルは、１％以下であること；
ｂ．前記非遺伝子配列は、前記ダイズゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有すること；
ｃ．前記非遺伝子配列は、既知または予測された発現性ダイズコード配列の４０Ｋｂ領域以内に位置すること；および
ｄ．前記非遺伝子配列は、０．０１５７４ｃＭ／Ｍｂよりも高い、前記ダイズゲノム内での組換え頻度を示すことを有する。実施形態３によれば、前記非遺伝子配列が、５．７３Ｋｂの最大長さを含む、実施形態１または２の組換え配列が提供される。実施形態４によれば、前記非遺伝子配列が、１％以下のヌクレオチドメチル化を含む、実施形態１〜３のいずれかの組換え配列が提供される。実施形態５によれば、前記非遺伝子配列が、１Ｋｂ〜５．７３Ｋｂの長さであり、メチル化されたシトシン残基を含まない、実施形態１〜４のいずれかの組換え配列が提供される。実施形態６によれば、前記非遺伝子配列が、前記ダイズゲノム内の任意の他の配列と、４０％よりも高い配列同一性ではアラインしない、実施形態１〜５のいずれかの組換え配列が提供される。

実施形態７によれば、前記非遺伝子配列が、０．０１５７４ｃＭ／Ｍｂよりも高い組換え頻度で組換えの証拠を示す、請求項１〜６のいずれかの組換え配列が提供される。実施形態８によれば、前記非遺伝子配列を含むネイティブダイズゲノムの４０Ｋｂ領域が、少なくとも１つの既知もしくは予測されたダイズコード配列、または既知のダイズ遺伝子の２Ｋｂ上流および／もしくは１Ｋｂ下流の配列を含む配列も含む、請求項１〜７のいずれかの組換え配列が提供される。実施形態９によれば、前記既知または予測されたダイズコード配列が、ダイズタンパク質を発現する、請求項１〜８のいずれかの組換え配列が提供される。実施形態１０によれば、前記非遺伝子配列が、メチル化されたポリヌクレオチドを含まない、請求項１〜９のいずれかの組換え配列が提供される。実施形態１１によれば、前記非遺伝子配列の一方の末端が、発現された内因性遺伝子の４０Ｋｂ以内に存在する、請求項１〜１０のいずれかの組換え配列が提供される。実施形態１２によれば、前記目的のＤＮＡが、分析ドメインを含む、請求項１〜１１のいずれかの組換え配列が提供される。実施形態１３によれば、前記目的のＤＮＡが、ペプチドをコードしない、請求項１〜１２のいずれかの組換え配列が提供される。実施形態１４によれば、前記目的のＤＮＡが、ペプチドをコードし、殺虫剤抵抗性遺伝子、除草剤耐性遺伝子、窒素使用効率遺伝子、水利用効率遺伝子、栄養品質遺伝子、ＤＮＡ結合遺伝子または選択可能なマーカー遺伝子を任意選択でコードする、請求項１〜１２のいずれかの組換え配列が提供される。実施形態１６によれば、以下の特徴：
ａ．前記非遺伝子配列は、１％未満のＤＮＡメチル化を含むこと；
ｂ．前記非遺伝子配列は、前記ダイズゲノム内で、０．０１５７４〜８３．５２ｃＭ／Ｍｂの組換え頻度を示すこと；
ｃ．前記非遺伝子配列は、ダイズゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示すこと；
ｄ．前記非遺伝子配列は、ダイズゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有すること；
ｅ．前記非遺伝子配列は、ダイズ染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有すること；
ｆ．前記非遺伝子配列は、１４．３６〜４５．９％のグアニン／シトシンパーセント含量範囲を有すること；
ｇ．前記非遺伝子配列は、遺伝子配列の近位に位置すること；および
ｈ．前記非遺伝子配列は、１または複数のさらなる非遺伝子配列を含むダイズゲノム配列の１Ｍｂ領域中に位置すること
を含む、請求項１〜１４のいずれかの組換え配列が提供される。

実施形態１７によれば、実施形態１〜１４および１６のいずれか１つの組換え配列を含む、ダイズ植物、ダイズ植物部分またはダイズ植物細胞である。実施形態１８によれば、前記既知または予測されたダイズコード配列が、０．０００４１５〜８７２．７１９８の範囲のレベルで発現する、実施形態１７のダイズ植物、ダイズ植物部分またはダイズ植物細胞が提供される。実施形態１９によれば、前記目的のＤＮＡおよび／または前記非遺伝子配列が、前記非遺伝子配列中への前記目的のＤＮＡの挿入の間に改変される、請求項１〜１４、１６または１７のいずれかの組換え配列が提供される。

実施形態２０によれば、１つの非遺伝子ダイズゲノム配列に標的化された目的のＤＮＡを含むトランスジェニック植物細胞を作製する方法が提供され、この方法は、以下を含む：
ａ．最適な非遺伝子ダイズゲノム遺伝子座を選択するステップ；
ｂ．前記非遺伝子ダイズゲノム配列を切断する部位特異的ヌクレアーゼを、植物細胞中に導入するステップ；
ｃ．前記目的のＤＮＡを前記植物細胞中に導入するステップ；
ｄ．前記目的のＤＮＡを前記非遺伝子遺伝子座中に標的化するステップであって、前記非遺伝子配列の切断は、前記非遺伝子遺伝子座中へのポリヌクレオチド配列の組込みを促進する、ステップ；および
ｅ．前記非遺伝子遺伝子座に標的化された前記目的のＤＮＡを含むトランスジェニック植物細胞を選択するステップ。

［実施例１］
ダイズにおける標的化可能なゲノム遺伝子座の同定
ダイズゲノムを、具体的基準を使用するバイオインフォマティクスアプローチを用いてスクリーニングして、ポリヌクレオチドドナーを標的化するための最適なゲノム遺伝子座を選択した。ゲノム遺伝子座を選択するために使用した具体的基準は、植物ゲノム内の導入遺伝子の最適な発現についての検討、部位特異的ＤＮＡ結合タンパク質によるゲノムＤＮＡの最適な結合についての検討、およびトランスジェニック植物製品の開発要求を使用して開発した。ゲノム遺伝子座を同定および選択するために、ダイズゲノムのゲノムおよびエピゲノムデータセットを、バイオインフォマティクスアプローチを使用してスキャンした。ゲノムおよびエピゲノムデータセットのスクリーニングは、以下の基準を満たした選択された遺伝子座を生じた：１）低メチル化され、１Ｋｂ長よりも大きい；２）ポリヌクレオチドドナーの部位特異的ヌクレアーゼ媒介性組込みを介して標的化可能；３）農学的に中立または非遺伝子；４）組み込まれた導入遺伝子がそこから発現され得る領域；および５）遺伝子座内／遺伝子座の周囲の組換えを有する領域。したがって、合計７，０１８のゲノム遺伝子座（配列番号１〜配列番号７，０１８）を、これらの具体的基準を使用して同定した。これらの具体的基準はさらに、以下に詳細に記載されている。

低メチル化
ダイズゲノムをスキャンして、ＤＮＡが低メチル化された１Ｋｂよりも大きい最適なゲノム遺伝子座を選択した。ダイズ（Glycine max）ｃｕｌｔｉｖａｒＷｉｌｌｉａｍｓ８２から単離した根組織および苗条組織のＤＮＡメチル化プロファイルを、ハイスループット全ゲノム配列決定アプローチを使用して構築した。抽出したＤＮＡを、メチル化されていないシトシンをウラシルに変換するが、メチル化されたシトシンには影響を与えないバイサルファイト処理に供し、次いで、ＩｌｌｕｍｉｎａＨｉＳｅｑテクノロジーを使用して配列決定した（Krueger, F. et al. DNA methylome analysis using short bisulfite sequencing data. Nature Methods 9, 145-151 (2012)）。生配列決定読み取りを、Krueger F, Andrews SR (2011) Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics 27: 1571-1572）に記載されるＢｉｓｍａｒｋ（商標）マッピングソフトウェアを使用して収集し、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２参照ゲノムに対してマッピングした。

バイサルファイト変換プロセスの間に、メチル化されるＤＮＡ配列中のシトシンは、ウラシルに変換されないので、配列決定データにおけるシトシン塩基の存在は、ＤＮＡメチル化の存在を示す。参照配列にマッピングされる読み取りを分析して、ＤＮＡメチル化を支持するシトシン残基のゲノム位置を同定した。ゲノム中の各シトシン塩基についてのメチル化レベルを、その位置にマッピングされる読み取りの総数に対する、特定のシトシン塩基位置にマッピングされたメチル化される読み取りの数の百分率として計算した。以下の仮説は、メチル化レベルを、ダイズゲノム内の各塩基について如何にして計算したかを説明している。例えば、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２参照配列の第１染色体中の１００位においてシトシン塩基が存在することを考慮する。１００位におけるシトシン塩基にマッピングされた合計２０の読み取りが存在し、これらの読み取りのうち１０がメチル化されている場合、第１染色体中の１００位におけるシトシン塩基についてのメチル化レベルは、５０％と推定される。それに応じて、ダイズの根組織および苗条組織から取得したゲノムＤＮＡ塩基対の全てについてのメチル化レベルのプロファイルを計算した。ダイズゲノム中の独自の位置に正確にマッピングできなかった読み取りは、ダイズゲノム中に広がった反復性配列と一致し、優勢にメチル化されることが当該分野で公知である。

上記プロトコールを使用して、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノムのメチル化レベルを測定した。このように、メチル化された読み取りを含むダイズゲノムの領域は、ダイズゲノムのこれらの領域がメチル化されたことを示した。逆に、メチル化された読み取りが存在しなかったダイズゲノムの領域は、ダイズゲノムのこれらの領域がメチル化されなかったことを示した。メチル化されておらず、いずれのメチル化された読み取りも含まなかった苗条組織および根組織由来のダイズゲノムの領域は、「低メチル化された」領域とみなされる。可視化のために利用可能な根および苗条のメチル化プロファイルを作製するために、ウィグル（wiggle）プロット（ｈｔｔｐ：／／ｕｓｅａｓｔ．ｅｎｓｅｍｂｌ．ｏｒｇ／ｉｎｆｏ／ｗｅｂｓｉｔｅ／ｕｐｌｏａｄ／ｗｉｇ．ｈｔｍｌ）を、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２染色体の各々について生成した。

上記のように、根組織および苗条組織において単一塩基対の解像度でＤＮＡメチル化レベルを取得した後、ダイズゲノムを、１００ｂｐウインドウを使用してスクリーニングして、メチル化されるゲノム領域を同定した。ゲノム中のスクリーニングした各ウインドウについて、ＤＮＡメチル化レベルを、そのウインドウ中の全てのシトシン塩基におけるメチル化の平均レベルを計算することによって取得した。１％よりも高いＤＮＡメチル化レベルを有するゲノムウインドウを、メチル化されたゲノム領域と呼んだ。根プロファイルおよび苗条プロファイル中の同定されたメチル化されたウインドウを組み合わせて、コンセンサスメチル化プロファイルを創出した。逆に、これらの基準を満たさず、コンセンサスプロファイルにおいてメチル化された領域として同定されなかったゲノム中の領域を、低メチル化された領域と呼んだ。表１は、同定された低メチル化された領域をまとめる。

ダイズｃ．ｖ．ＷＩＬＬＩＡＭＳ８２ゲノムのこれらの低メチル化された領域を、さらに特徴付けて、これらの領域の無メチル化情況がオープンクロマチンの存在を示した場合に、特異的ゲノム遺伝子座を同定および選択した。このように、全ての引き続く分析を、同定された低メチル化された領域に対して実施した。

標的化可能性
ダイズｃ．ｖ．ＷＩＬＬＩＡＭＳ８２において同定された低メチル化された部位をさらに分析して、どの部位がポリヌクレオチドドナーの部位特異的ヌクレアーゼ媒介性組込みを介して標的化可能であるかを決定した。ダイズ（Glycine max）は、そのゲノムの歴史においてゲノム重複を受けた古倍数体（paleopolyploid）作物であることが公知である（Jackson et al Genome sequence of the palaeopolyploid soybean, Nature 463, 178-183 (2010)）。ダイズゲノムは、メチル化され、高いレベルの配列重複を有する高度に反復性のＤＮＡの長いストレッチを含むことが、当該分野で公知である。ダイズゲノム中の既知の反復性領域の注釈付け情報を、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅ（ｗｗｗ．ｓｏｙｂａｓｅ．ｏｒｇ、Shoemaker, R.C. et al. SoyBase, the USDA-ARS soybean genetics and genomics database. Nucleic Acids Res. 2010 Jan;38(Database issue):D843-6.）から収集した。

したがって、上で同定された低メチル化された部位をスクリーニングして、ダイズゲノム上の注釈付きの既知の反復性領域とアラインした任意の部位を除去した。この第１のスクリーニングを通過した残りの低メチル化された部位を、デフォルトパラメーター設定を使用するＮＣＢＩＢＬＡＳＴ（商標）＋ソフトウェア（バージョン２．２．２５）実行を介したダイズゲノムデータベースのＢＬＡＳＴ（商標）ベースの相同性検索を使用して、引き続いてスクリーニングした（Stephen F. Altschul et al (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25:3389-3402）。ＢＬＡＳＴ（商標）スクリーニングの結果として、４０％を超える配列アラインメントカバー度で、ゲノム中の他の場所で顕著な一致を有した任意の低メチル化された部位を、さらなる分析から除去した。

農学的に中立または非遺伝子
ダイズｃ．ｖ．Ｗｉｌｌｉａｍ８２において同定された低メチル化された部位をさらに分析して、どの部位が農学的に中立または非遺伝子であったかを決定した。このように、上記低メチル化された部位をスクリーニングして、任意の既知または予測された内因性ダイズｃ．ｖ．Ｗｉｌｌｉａｍ８２コード配列とオーバーラップしたまたは含んだ任意の部位を除去した。この目的のために、既知の遺伝子の注釈付けデータおよび発現配列タグ（ＥＳＴ）データのマッピング情報を、ＳｏｙｂｅａｎＧｅｎｏｍｉｃＤａｔａｂａｓｅ（ｗｗｗ．ｓｏｙｂａｓｅ．ｏｒｇ−バージョン１．１遺伝子モデルを使用した、Jackson et al Genome sequence of the palaeopolyploid soybean Nature 463, 178-183 (2010)）から収集した。オープンリーディングフレームに対してすぐ２Ｋｂ上流および１Ｋｂ下流の任意のゲノム領域もまた検討した。これらの上流領域および下流領域は、遺伝子機能に重要な既知または未知の保存された調節エレメントを含み得る。上に以前に記載した低メチル化された部位を、既知の遺伝子（２Ｋｂ上流および１Ｋｂ下流の領域を含む）およびＥＳＴの存在について分析した。既知の遺伝子（２Ｋｂ上流および１Ｋｂ下流の領域を含む）またはＥＳＴとアラインしたまたはオーバーラップした任意の低メチル化された部位を、下流の分析から除去した。

発現
ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２において同定された低メチル化された部位をさらに分析して、どの部位が発現されたダイズ遺伝子の近位内に存在したかを決定した。ダイズ遺伝子の転写物レベルでの発現を、Mortazavi et al., Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008;5(7):621-628およびShoemaker RC et al., RNA-Seq Atlas of Glycine max: a guide to the soybean Transcriptome. BMC Plant Biol. 2010 Aug 5;10:160に記載されるように、ＲＮＡｓｅｑ（商標）テクノロジーを使用して、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２の根組織および苗条組織から生成したトランスクリプトームプロファイリングデータを分析することによって測定した。各低メチル化された部位について、分析を完了して、低メチル化された部位の近位にある４０Ｋｂ領域内に存在する任意の注釈付きの遺伝子、および低メチル化された部位の近位に位置する注釈付きの遺伝子の平均発現レベルを同定した。ゼロでない平均発現レベルを有する注釈付きの遺伝子から４０Ｋｂよりも遠くに位置した低メチル化された部位は、発現されたダイズ遺伝子の近位でないことが決定され、さらなる分析から除去した。

組換え
ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２において同定された低メチル化された部位をさらに分析して、どの部位が組換えの証拠を有し、従来の育種を介した他の系統のダイズ中への最適なゲノム遺伝子座の浸透性交雑を促進できたかを決定した。多様なダイズ遺伝子型は、農学的に目的の形質を含む新たな改善されたダイズ系統を開発するために、従来の育種の間に慣用的に交配される。このように、導入遺伝子の植物媒介性の形質転換を介してダイズ系統内の最適なゲノム遺伝子座中に浸透性交雑される農学的形質は、従来の植物育種の間の減数分裂組換えを介して、他のダイズ系統、特に精鋭の系統中にさらに浸透性交雑されることが可能であるはずである。上記低メチル化された部位をスクリーニングして、あるレベルの減数分裂組換えを有した部位を同定および選択した。組換え「コールドスポット」として特徴付けられた染色体領域内に存在する任意の低メチル化された部位を、同定および除去した。ダイズでは、これらのコールドスポットを、組換え近交系マッピング集団（Ｗｉｌｌｉａｍｓ８２×ＰＩ４７９７５２）から生成されたマーカーデータセットを使用して規定した。このデータセットは、ダイズ（Glycine max）参照ゲノム配列に物理的にマッピングされ得る約１６，６００のＳＮＰマーカーからなった。

染色体にわたるダイズゲノムマーカーの任意の対の間での減数分裂組換え頻度を、マーカー間の遺伝的距離（センチモルガン（ｃＭ））の、マーカー間の物理的距離（メガベース（Ｍｂ））に対する比率に基づいて計算した。例えば、マーカーの対の間の遺伝的距離が１ｃＭであり、マーカーの同じ対の間の物理的距離が２Ｍｂであった場合、計算された組換え頻度は、０．５ｃＭ／Ｍｂであると決定された。上で同定された各低メチル化された部位について、少なくとも１Ｍｂ離れたマーカーの対を選択し、組換え頻度を計算した。この方法の配備を使用して、低メチル化された部位の組換え頻度を計算した。０ｃＭ／Ｍｂの組換え頻度を有する任意の低メチル化された部位を同定し、さらなる分析から除去した。０ｃＭ／Ｍｂよりも高い組換え頻度を含む残りの低メチル化された領域を、さらなる分析のために選択した。

最適なゲノム遺伝子座の同定
上記選択基準の適用は、ダイズゲノムからの、合計９０，３２５の最適なゲノム遺伝子座の同定を生じた。表２は、同定された最適なゲノム遺伝子座の長さをまとめる。これらの最適なゲノム遺伝子座は、以下の特徴を有する：１）１Ｋｂ長よりも大きい低メチル化されたゲノム遺伝子座；２）ポリヌクレオチドドナーの部位特異的ヌクレアーゼ媒介性組込みを介して標的化可能なゲノム遺伝子座；３）農学的に中立または非遺伝子のゲノム遺伝子座；４）導入遺伝子がそこから発現され得るゲノム遺伝子座；および５）ゲノム遺伝子座内の組換えの証拠。表２に記載される全ての最適なゲノム遺伝子座のうち、１Ｋｂよりも大きい最適なゲノム遺伝子座だけをさらに分析し、ドナーポリヌクレオチド配列の標的化のために利用した。これらの最適なゲノム遺伝子座の配列は、配列番号１〜配列番号７，０１８として開示される。集合的に、これらの最適なゲノム遺伝子座は、本明細書の以下にさらに実証されるように、ドナーポリヌクレオチド配列で標的化され得るダイズゲノム内の位置である。

［実施例２］
ダイズ由来の最適なゲノム遺伝子座をクラスター化するためのＦ分布および主成分分析
７，０１８の同定された最適なゲノム遺伝子座（配列番号１〜配列番号７，０１８）を、Ｆ分布および主成分分析統計方法を使用してさらに分析して、最適なゲノム遺伝子座のグループ分けのための代表的な集団およびクラスターを規定した。

Ｆ分布分析
同定された７，０１８の最適なゲノム遺伝子座を、連続確率分布統計分析を使用して統計的に分析した。連続確率分布統計分析の一実施形態として、Ｆ分布検定を完了して、代表的な数の最適なゲノム遺伝子座を決定した。Ｆ分布検定分析を、当業者に公知の方程式および方法を使用して完了した。さらなるガイダンスについて、参照によって本明細書に組み込まれるK.M Remund, D. Dixon, DL. Wright and LR. Holden. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101-119に記載されるＦ分布検定分析は、Ｆ分布検定の非限定的な一例である。このＦ分布検定は、最適なゲノム遺伝子座のランダムサンプリングを仮定し、その結果、任意の非妥当遺伝子座は、７，０１８の最適なゲノム遺伝子座にわたって均等に分布し、サンプリングされた最適なゲノム遺伝子座の数は、７，０１８の最適なゲノム遺伝子座の総集団の１０％以下である。

このＦ分布分析は、７，０１８の最適なゲノム遺伝子座のうち３２が、９５％信頼レベルで、７，０１８の最適なゲノム遺伝子座のうちの代表的な数を提供したことを示した。したがって、このＦ分布分析は、３２の最適なゲノム遺伝子座が試験され、全てがドナーポリヌクレオチド配列で標的化可能な場合に、これらの結果が、７，０１８の最適なゲノム遺伝子座のうち９１以上が９５％信頼レベルで陽性であることを示すことを示した。７，０１８の最適なゲノム遺伝子座の合計百分率を検証する最良の推定は、３２の試験した最適なゲノム遺伝子座の１００％が標的化可能であった場合である。したがって、９１％は、実際には、９５％信頼レベルにおいて検証された真のパーセントの下限である。この下限は、９５％信頼レベルについて、Ｆ分布の０．９５分位点に基づく（Remund K, Dixon D, Wright D, and Holden L. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101-119）。

主成分分析
次に、主成分分析（ＰＣＡ）統計方法を完了して、７，０１８の同定された最適なゲノム遺伝子座を含むデータセットの類似性および差異をさらに評価および可視化して、標的化検証のための多様な遺伝子座のサンプリングを可能にした。ＰＣＡには、より大きな数の相関変数を主成分と呼ばれるより少ない数の無相関な変数へと変形する数学的アルゴリズムが関与する。

このＰＣＡを、７，０１８の同定された最適なゲノム遺伝子座を説明するために使用され得る計算可能な特徴または属性のセットを生成することによって、７，０１８の同定された最適なゲノム遺伝子座に対して完了した。各特徴は、数的に計算可能であり、７，０１８の同定された最適なゲノム遺伝子座のゲノムおよびエピゲノム情況を捕捉するために具体的に規定される。各ダイズの最適なゲノム遺伝子座についての１０の特徴のセットを同定し、以下にさらに詳述する。

１．最適なゲノム遺伝子座の長さ
ａ．このデータセット中の最適なゲノム遺伝子座の長さは、最小１，０００Ｂｐ〜最大５，７１３Ｂｐの範囲であった。

２．最適なゲノム遺伝子座の周囲の１ＭＢ領域における組換え頻度
ａ．ダイズでは、染色体位置についての組換え頻度を、複数のマッピング集団から生成された内部高解像度マーカーデータセットを使用して規定した。
ｂ．染色体にわたるマーカーの任意の対の間での組換え頻度を、マーカー間の遺伝的距離（センチモルガン（ｃＭ））の、マーカー間の物理的距離（Ｍｂ）に対する比率に基づいて計算した。例えば、マーカーの対の間の遺伝的距離が１ｃＭであり、マーカーの同じ対の間の物理的距離が２Ｍｂである場合、計算された組換え頻度は、０．５ｃＭ／Ｍｂである。各最適なゲノム遺伝子座について、少なくとも１Ｍｂ離れたマーカーの対を選択し、この様式で組換え頻度を計算した。これらの組換え値は、最小０．０１５７４ｃＭ／Ｍｂ〜最大８３．５２ｃＭ／Ｍｂの範囲であった。

３．最適なゲノム遺伝子座の配列独自性のレベル
ａ．各最適なゲノム遺伝子座について、最適なゲノム遺伝子座のヌクレオチド配列を、デフォルトパラメーター設定を使用するＮＣＢＩＢＬＡＳＴ（商標）＋ソフトウェア（バージョン２．２．２５）実行を使用するＢＬＡＳＴ（商標）ベースの相同性検索を使用して、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノムに対してスキャンした（Stephen F. Altschul et al (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402）。これらの最適なゲノム遺伝子座配列は、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノムから同定されるので、この検索を介して同定された第１のＢＬＡＳＴ（商標）ヒットは、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２配列自体を示す。各最適なゲノム遺伝子座配列についての第２のＢＬＡＳＴ（商標）ヒットを同定し、このヒットのアラインメントカバー度（ＢＬＡＳＴ（商標）ヒットによってカバーされる最適なゲノム遺伝子座のパーセントとして示される）を、ダイズゲノム内の最適なゲノム遺伝子座配列の独自性の尺度として使用した。第２のＢＬＡＳＴ（商標）ヒットについてのこれらのアラインメントカバー度値は、最小０％〜最大３９．９７％の配列同一性の範囲であった。より高いレベルの配列同一性においてアラインしたいずれの配列も、考慮しなかった。

４．最適なゲノム遺伝子座からその近隣における最も近い遺伝子までの距離
ａ．ダイズゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅ（ｗｗｗ．ｓｏｙｂａｓｅ．ｏｒｇにおいて入手可能−バージョン１．１遺伝子モデルを使用した、Jackson et al Genome sequence of the palaeopolyploid soybean, Nature 463, 178-183 (2010)）から抽出した。各最適なゲノム遺伝子座について、上流位置および下流位置の両方を考慮して最も近い注釈付きの遺伝子を同定し、最適なゲノム遺伝子座配列とこの遺伝子との間の距離を測定した（Ｂｐ）。例えば、最適なゲノム遺伝子座が染色体Ｇｍ０１中の２，５００位から３，５００位までに位置し、この最適なゲノム遺伝子座に対して最も近い遺伝子が染色体Ｇｍ０１中の５，０００位から６，０００位までに位置する場合、最適なゲノム遺伝子座からこの最も近い遺伝子までの距離は、１５００Ｂｐであると計算される。７，０１８全ての最適なゲノム遺伝子座データセットについてのこれらの値は、最小１，００１Ｂｐ〜最大３９，４８２Ｂｐの範囲であった。

５．最適なゲノム遺伝子座配列中のＧＣ％
ａ．各最適なゲノム遺伝子座について、ヌクレオチド配列を分析して、存在するグアニン塩基およびシトシン塩基の数を推定した。この計数は、各最適なゲノム遺伝子座の配列長さの百分率として示され、ＧＣ％についての尺度を提供する。ダイズの最適なゲノム遺伝子座データセットについてのこれらのＧＣ％値は、１４．４％〜４５．９％の範囲である。

６．最適なゲノム遺伝子座配列の周囲の４０Ｋｂ近隣における遺伝子の数
ａ．ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅから抽出した。７，０１８の最適なゲノム遺伝子座配列の各々について、最適なゲノム遺伝子座配列の周囲の４０Ｋｂウインドウを規定し、このウインドウとオーバーラップする位置を有する注釈付きの遺伝子の数を計数した。これらの値は、４０Ｋｂ近隣内に最小１遺伝子〜最大１８遺伝子の範囲であった。

７．最適なゲノム遺伝子座の周囲の４０Ｋｂ近隣における平均遺伝子発現
ａ．ダイズ遺伝子の転写物レベルでの発現を、ＲＮＡｓｅｑ（商標）テクノロジーを使用して、ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２の根組織および苗条組織から生成した利用可能なトランスクリプトームプロファイリングデータを分析することによって測定した。ダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅから抽出した。各最適なゲノム遺伝子座について、最適なゲノム遺伝子座の周囲の４０Ｋｂ近隣に存在したダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２ゲノム内の注釈付きの遺伝子を同定した。遺伝子の各々についての発現レベルを、上述の引用に記載されたトランスクリプトームプロファイルから抽出し、平均遺伝子発現レベルを計算した。ダイズのゲノム内の全ての遺伝子の発現値は大きく変動する。７，０１８の最適なゲノム遺伝子座データセットの全てについての平均発現値は、最小０．０００４１５〜最大８７２．７１９８の範囲であった。

８．最適なゲノム遺伝子座の周囲のヌクレオソーム占有率のレベル
ａ．特定のヌクレオチド配列についてのヌクレオソーム占有率のレベルを理解することで、染色体機能および配列のゲノム情況についての情報が提供される。ＮｕＰｏＰ（商標）統計パッケージを使用して、任意のサイズのゲノム配列について、ヌクレオソーム占有率および最も確からしいヌクレオソームポジショニングマップを予測した（Xi, L., Fondufe-Mittendor, Y., Xia, L., Flatow, J., Widom, J. and Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-346.）。７，０１８の最適なゲノム遺伝子座の各々について、ヌクレオチド配列を、ＮｕＰｏＰ（商標）ソフトウェアを用いた分析に供し、ヌクレオソーム占有率スコアを計算した。ダイズの最適なゲノム遺伝子座データセットについてのこれらのヌクレオソーム占有率スコアは、最小０〜最大０．４９４の範囲であった。

９．染色体内の相対的位置（セントロメアの近位）
ａ．セントロメアは、２つの姉妹染色分体を接続する、染色体上の領域である。セントロメアのいずれかの側の染色体の部分は、染色体アームとして公知である。２０全てのダイズ染色体上のセントロメアのゲノム位置を、公開されたダイズｃ．ｖ．Ｗｉｌｌｉａｍｓ８２参照配列において同定した（Jackson et al Genome sequence of the palaeopolyploid soybean Nature 463, 178-183 (2010)）。ダイズ染色体の各々におけるセントロメアの位置および染色体アームの長さに関する情報を、ＳｏｙｂｅａｎＧｅｎｏｍｅＤａｔａｂａｓｅから抽出した。各最適なゲノム遺伝子座について、最適なゲノム遺伝子座配列からそれが位置する染色体のセントロメアまでのゲノム距離が測定される（Ｂｐ）。染色体内の最適なゲノム遺伝子座の相対的位置は、それが存在する特定の染色体アームの長さに対する、セントロメアまでのそのゲノム距離の比率として示される。ダイズの最適なゲノム遺伝子座データセットについてのこれらの相対的位置値は、最小０〜最大０．９９６８２のゲノム距離の比率の範囲であった。

１０．１Ｍｂ領域中の最適なゲノム遺伝子座の数
ａ．各最適なゲノム遺伝子座について、最適なゲノム遺伝子座位置の周囲の１Ｍｂゲノムウインドウを規定し、考慮した最適なゲノム遺伝子座を含む、この領域内に存在するまたはこの領域とオーバーラップする他のさらなる最適なゲノム遺伝子座の数を計算した。１Ｍｂ中の最適なゲノム遺伝子座の数は、最小１〜最大４９の範囲であった。

７，０１８全ての最適なゲノム遺伝子座を、上記特徴および属性を使用して分析した。各最適なゲノム遺伝子座の特徴および属性のスコアについての結果または値は、表３（別々の電子出願として参照によって本明細書に組み込まれる）にさらに記載される。得られたデータセットを、ＰＣＡ統計方法において使用して、７，０１８の同定された最適なゲノム遺伝子座をクラスターへとクラスター化した。このクラスター化プロセスの間に、最適なゲノム遺伝子座の「ｐ」個の主成分の推定後に、３２のクラスターのうちの１つへの最適なゲノム遺伝子座の割り当てが、「ｐ」次元ユークリッド空間において進行した。「ｐ」個の軸の各々を、「ｋ」個の区間に分割した。同じ区間に割り当てられた最適なゲノム遺伝子座を、クラスターを形成するように一緒にグループ分けした。この分析を使用して、各ＰＣＡ軸を、２つの区間に分割し、これを、実験的検証に必要とされるクラスターの数に関する先験的情報に基づいて選択した。得られたクラスターの全ての分析および可視化を、ＣｈｅｍｉｃａｌＣｏｍｐｕｔｉｎｇＧｒｏｕｐＩｎｃ．（Ｍｏｎｔｒｅａｌ、Ｑｕｅｂｅｃ、Ｃａｎａｄａ）のＭｏｌｅｃｕｌａｒＯｐｅｒａｔｉｎｇＥｎｖｉｒｏｎｍｅｎｔ（商標）（ＭＯＥ）ソフトウェアを用いて実施した。

このＰＣＡアプローチを使用して、上記、それらの特徴値に基づいて、３２の別個のクラスターへと、７，０１８の同定された最適なダイズゲノム遺伝子座のセットをクラスター化した。このＰＣＡプロセスの間に、５つの主成分（ＰＣ）が生成され、上位３つのＰＣは、データセット中の総変動の約９０％を含む（表４）。これら３つのＰＣＡを使用して、三次元プロット中に３２のクラスターをグラフ的に表示した（図１）。クラスター化プロセスを完了した後、１つの代表的な最適なゲノム遺伝子座を、各クラスターから選択した。これを、そのクラスターの重心に最も近かった、各クラスター内の選択された最適なゲノム遺伝子座を選択することによって、実施した（表４）。３２の代表的な最適なゲノム遺伝子座の染色体位置は、図２に示すように、２０のダイズ染色体の中に均一に分布し、任意の特定のゲノム位置への偏りはない。

ポリヌクレオチドドナーポリヌクレオチド配列の標的化のためのゲノム遺伝子座の最終的選択
合計３２のゲノム遺伝子座を、３２の別個のクラスター内にクラスター化された７，０１８のゲノム遺伝子座から、ドナーポリヌクレオチド配列による標的化のために同定および選択した。３２のクラスターの各々について、代表的ゲノム遺伝子座（表４中に上記したようにクラスターの重心に最も近い）または標的化系統との相同性を有するさらなる遺伝子座を選択した。これらのさらなる最適なゲノム遺伝子座を、ダイズ（Glycine max）ｃ．ｖ．Ｍａｖｅｒｉｃｋ（形質転換および標的化スクリーニング系統）およびダイズ（Glycine max）ｃ．ｖ．Ｗｉｌｌｉａｍｓ８２（参照系統）の両方についてのゲノムＤＮＡ配列データからなる全ゲノムデータベースに対して、７，０１８全ての選択された最適なゲノム配列を最初にスクリーニングすることによって選択して、両方の系統由来のゲノムにおけるカバー度（どのくらいの最適なゲノム遺伝子座が両方のゲノム中に存在したか）および配列同一性の百分率を決定した。Ｗｉｌｌｉａｍｓ８２ゲノムデータベース中の１００％カバー度（両方のゲノム間でアラインされた最適な遺伝子座の配列全体長さ）および１００％同一性を有する最適なゲノム遺伝子座を、標的化検証のために選択した。他の基準、例えば、最適なゲノム遺伝子座のゲノム遺伝子座サイズ、独自性の程度、ＧＣ％含量および染色体分布もまた、さらなる最適なゲノム遺伝子座を選択する際に考慮に入れた。３２の選択された最適なゲノム遺伝子座の染色体位置および各ダイズの最適なゲノム遺伝子座の特定のゲノム立体配置は、それぞれ図３および表５に示される。

７，０１８のゲノム位置の大きい一そろいが、正確なゲノム操作テクノロジーを使用してドナーポリヌクレオチド配列を用いて標的化するための最適なゲノム遺伝子座として、ダイズゲノムにおいて同定されている。統計分析アプローチを配備して、類似のゲノム情況を有する３２のクラスターへと７，０１８の選択されたゲノム遺伝子座をグループ化し、７，０１８の選択されたゲノム遺伝子座のセットを代表する３２の選択されたゲノム遺伝子座のサブセットを同定した。これらの３２の代表的遺伝子座を、ドナーポリヌクレオチド配列による標的化を介して、最適なゲノム遺伝子座として検証した。上記特徴または属性の１０のセットについて生成した数値についてＰＣＡ統計分析を実施することによって、これらの１０の特徴または属性を、より少ない次元のＰＣＡ成分へと計算した。このように、ＰＣＡ成分を、上記１０の特徴または属性を代表する５つの次元へと削減した（表６）。各ＰＣＡ成分は、上記１０の特徴または属性の組合せと等価である。ＰＣＡ統計分析を使用して計算した５つの次元を構成するこれらのＰＣＡ成分から、３２のクラスターを決定した。

［実施例３］
ダイズ中のゲノム遺伝子座を結合するジンクフィンガーの設計
代表的ゲノム遺伝子座の同定されたＤＮＡ配列に対するジンクフィンガータンパク質を、以前に記載されたように設計した。例えば、Urnov et al., (2005) Nature 435:646-551を参照のこと。例示的な標的配列および認識らせんは、表７（認識らせん領域設計）および表８（標的部位）に示される。表８では、ＺＦＰ認識らせんによって接触される標的部位中のヌクレオチドは、大文字で示され、非接触ヌクレオチドは小文字で示される。ジンクフィンガーヌクレアーゼ（ＺＦＮ）標的部位を、以前に記載した３２の選択された最適なゲノム遺伝子座の全てについて設計した。多数のＺＦＰ設計を開発し、試験して、上記のようにダイズにおいて同定および選択された３２の異なる代表的ゲノム遺伝子座標的部位と、最も高いレベルの効率で結合したフィンガーを同定した。最も高いレベルの効率でジンクフィンガー認識配列と結合した特異的ＺＦＰ認識らせん（表７）を、ダイズゲノム内のドナー配列の標的化および組込みに使用した。

これらのダイズの代表的ゲノム遺伝子座ジンクフィンガー設計を、ＣＣＨＣ構造を有する少なくとも１つのフィンガーを有するタンパク質をコードするジンクフィンガー発現ベクター中に取り込んだ。米国特許出願公開第２００８／０１８２３３２号を参照のこと。特に、各タンパク質中の最後のフィンガーは、認識らせんとしてＣＣＨＣ骨格を有した。非正準ジンクフィンガーコード配列を、４アミノ酸ＺＣリンカー、およびジンクフィンガーヌクレアーゼ（ＺＦＮ）を形成するようにダイズのために最適化されたｏｐａｑｕｅ−２核局在化シグナルを介して、ＩＩＳ型制限酵素ＦｏｋＩのヌクレアーゼドメイン（Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569の配列のアミノ酸３８４〜５７９）に融合させた。米国特許第７，８８８，１２１号を参照のこと。種々の機能的ドメインのためのジンクフィンガーを、ｉｎｖｉｖｏでの使用のために選択した。設計し、産生し、推定ゲノム標的部位への結合するかどうか試験した多数のＺＦＮのうち、上の表８に記載されるＺＦＮは、ｉｎｖｉｖｏ活性を有するとして同定され、植物内で独自のダイズゲノムポリヌクレオチド標的部位を効率的に結合および切断することが可能であるとして特徴付けられた。

ＺＦＮ構築物アセンブリ
ＺＦＮ遺伝子発現構築物を含むプラスミドベクターを、当該分野で一般に公知の技能および技術を使用して、設計および完了した（例えば、AusubelまたはManiatisを参照のこと）。各ＺＦＮコード配列を、ジンクフィンガーヌクレアーゼの上流に位置付けたｏｐａｑｕｅ−２核局在化シグナルをコードする配列（Maddaloni et al., (1989) Nuc. Acids Res. 17:7532）に融合させた。非正準ジンクフィンガーコード配列を、ＩＩＳ型制限酵素ＦｏｋＩのヌクレアーゼドメイン（Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569の配列のアミノ酸３８４〜５７９）に融合させた。この融合タンパク質の発現を、キャッサバ葉脈モザイクウイルス由来の強い構成的プロモーターによって駆動した。発現カセットは、アグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）ＯＲＦ２３由来の３’ＵＴＲもまた含む。トセア・アシグナ（Thosea asigna）ウイルス由来のヌクレオチド配列をコードする自己加水分解性２Ａ（Szymczak et al., (2004) Nat Biotechnol. 22:760-760）を、構築物中にクローニングされた２つのジンクフィンガーヌクレアーゼ融合タンパク質間に付加した。

これらのプラスミドベクターを、ＩＮ−ＦＵＳＩＯＮ（商標）ＡｄｖａｎｔａｇｅＴｅｃｈｎｏｌｏｇｙ（Ｃｌｏｎｔｅｃｈ、ＭｏｕｎｔａｉｎＶｉｅｗ、ＣＡ）を使用してアセンブルした。制限エンドヌクレアーゼは、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ（Ｉｐｓｗｉｃｈ、ＭＡ）から取得し、Ｔ４ＤＮＡリガーゼ（Ｉｎｖｉｔｒｏｇｅｎ、Ｃａｒｌｓｂａｄ、ＣＡ）をＤＮＡライゲーションに使用した。プラスミド調製を、供給業者の指示に従ってＮＵＣＬＥＯＳＰＩＮ（登録商標）ＰｌａｓｍｉｄＫｉｔ（Ｍａｃｈｅｒｅｙ−ＮａｇｅｌＩｎｃ．、Ｂｅｔｈｌｅｈｅｍ、ＰＡ）またはＰｌａｓｍｉｄＭｉｄｉＫｉｔ（Ｑｉａｇｅｎ）を使用して実施した。ＤＮＡ断片を、アガローストリス酢酸塩ゲル電気泳動後にＱＩＡＱＵＩＣＫＧＥＬＥＸＴＲＡＣＴＩＯＮＫＩＴ（商標）（Ｑｉａｇｅｎ）を使用して単離した。全てのライゲーション反応のコロニーを、ミニプレップＤＮＡの制限消化によって最初にスクリーニングした。選択されたクローンのプラスミドＤＮＡを、商業的配列決定ベンダー（ＥｕｒｏｆｉｎｓＭＷＧＯｐｅｒｏｎ、Ｈｕｎｔｓｖｉｌｌｅ、ＡＬ）が配列決定した。配列データを、ＳＥＱＵＥＮＣＨＥＲ（商標）ソフトウェア（ＧｅｎｅＣｏｄｅｓＣｏｒｐ．、ＡｎｎＡｒｂｏｒ、ＭＩ）を使用してアセンブルおよび分析した。プラスミドを、制限酵素消化を介して構築し、ＤＮＡ配列決定を介して確認した。

自動化ワークフローを介したジンクフィンガークローニング
ジンクフィンガーヌクレアーゼベクターのサブセットを、自動化ＤＮＡ構築パイプラインを介してクローニングした。全体として、自動化パイプラインは、以前に記載したのと同一のＺＦＮ構造を有するベクター構築を生じた。ＺＦＮのＤＮＡ結合特異性を付与する各ジンクフィンガーモノマーを、ＫＰＦアミノ酸モチーフにおいて２〜３の独自の配列へと分割した。ＺＦＮ断片の５’末端および３’末端の両方を、ＢｓａＩ認識部位（ＧＧＴＣＴＣＮ）および誘導されたオーバーハングを含めることで改変した。オーバーハングを、６〜８部のアセンブリのみが所望の全長発現クローンを生じるように、分布させた。改変されたＤＮＡ断片を、ｄｅｎｏｖｏ合成した（ＳｙｎｔｈｅｔｉｃＧｅｎｏｍｉｃｓＩｎｃｏｒｐｏｒａｔｅｄ、ＬａＪｏｌｌａ、ＣＡ）。単一の双子葉骨格ｐＤＡＢ１１８７９６を、ダイズＺＦＮ構築の全てにおいて使用した。これは、キャッサバモザイクウイルスプロモーターおよびＯｐａｑｕｅ２ＮＬＳならびにＦｏｋＩドメインおよびアグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）由来のＯｒｆ２３３’ＵＴＲを含んだ。枯草菌（Bacillus subtilis）由来のＢｓａＩ隣接ＳａｃＢ遺伝子を、Ｏｐａｑｕｅ２ＮＬＳとＦｏｋＩドメインとの間にクローニングした。推定ライゲーション事象を、スクロース含有培地上にプレートした場合、このＳａｃＢカセットは、ベクター骨格の夾雑を低減または排除する陰性選択因子として作用する。全ての構築において反復して利用した第２の部分は、ｐＤＡＢ１１７４４３であった。このベクターは、全てＢｓａＩ部位が隣接した、第１のモノマーＦｏｋ１ドメイン、Ｔ２Ａスタッター配列および第２のモノマーＯｐａｑｕｅ２ＮＬＳを含む。

これらの材料をＺＦＮＤＮＡ部分ライブラリーとして使用して、ＦｒｅｅｄｏｍＥｖｏ１５０（登録商標）（ＴＥＣＡＮ、Ｍａｎｎｅｄｏｒｆ、Ｓｗｉｔｚｅｒｌａｎｄ）は、２Ｄバーコード化チューブからＰＣＲプレート（ＴｈｅｒｍｏＦｉｓｈｅｒ、Ｗａｌｔｈａｍ、ＭＡ）中への、７５〜１００ｎｇの各ＤＮＡプラスミドまたは合成された断片の添加を操作した。ウシ血清アルブミンタンパク質（ＮＥＢ、Ｉｐｓｗｉｃｈ、ＭＡ）およびＴ４ＤＮＡリガーゼ緩衝液（ＮＥＢ、Ｉｐｓｗｉｃｈ、ＭＡ）を補充したＢｓａＩ（ＮＥＢ、Ｉｐｓｗｉｃｈ、ＭＡ）およびＴ４ＤＮＡリガーゼ（ＮＥＢ、Ｉｐｓｗｉｃｈ、ＭＡ）を、反応に添加した。反応を、Ｃ１０００ＴｏｕｃｈＴｈｅｒｍｏＣｙｃｌｅｒ（登録商標）（ＢｉｏＲａｄ、ＨｅｒｃｕｌｅｓＣＡ）で、３７℃で３分間および１６℃で４分間のインキュベーションでサイクルした（２５回）。ライゲーションした材料を、手で、またはＱｐｉｘ４６０コロニーピッカーおよびＬａｂＣｈｉｐＧＸ（登録商標）（ＰｅｒｋｉｎＥｌｍｅｒ、Ｗａｌｔｈａｍ、ＭＡ）を使用して、Ｔｏｐ１０ｃｅｌｌｓ（登録商標）（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＣａｒｌｓｂａｄ、ＣＡ）において形質転換およびスクリーニングした。植物形質転換に提供された正確に消化するコロニーの配列を確認した。

普遍的ドナー構築物アセンブリ
大きい数の遺伝子座の迅速な試験を支持するために、新規のフレキシブルな普遍的ドナー系配列を設計し、構築した。この普遍的ドナーポリヌクレオチド配列は、ハイスループットベクター構築方法論および分析と適合性であった。この普遍的ドナー系は、少なくとも３つのモジュラードメイン：可変ＺＦＮ結合ドメイン、非可変分析およびユーザーが規定した特徴ドメイン、ならびにベクタースケールアップのための単純なプラスミド骨格から構成された。この非可変普遍的ドナーポリヌクレオチド配列は、全てのドナーに共通し、全てのダイズ標的部位にわたって使用され得るアッセイの有限のセットの設計を可能にし、したがって、標的化の評価における均一性を提供し、分析サイクル回数を低減させた。これらのドメインのモジュラー的性質は、ハイスループットなドナーアセンブリを可能にした。さらに、この普遍的ドナーポリヌクレオチド配列は、下流の分析を単純化し、結果の解釈を向上させることを目的とした他の独自の特徴を有する。これは、診断的に予測されたサイズへのＰＣＲ産物の消化を可能にする非対称制限部位配列を含んだ。ＰＣＲ増幅において問題となることが予測される二次構造を含む配列を除去した。この普遍的ドナーポリヌクレオチド配列は、サイズが小さかった（３．０Ｋｂ未満）。最後に、この普遍的ドナーポリヌクレオチド配列を、時宜を得た様式で大量の試験ＤＮＡの嵩を増やす高コピーｐＵＣ１９骨格上に構築した。

一実施形態として、普遍的ドナーポリヌクレオチド配列を含む一例のプラスミドは、ｐＤＡＢ１２４２８０として提供される（配列番号７５６１および図７）。さらなる一実施形態では、普遍的ドナーポリヌクレオチド配列は、以下として提供される：ｐＤＡＢ１２４２８１、配列番号７５６２、図８；ｐＤＡＢ１２１２７８、配列番号７５６３、図９；ｐＤＡＢ１２３８１２、配列番号７５６４、図１０；ｐＤＡＢ１２１９３７、配列番号７５６５、図１１；ｐＤＡＢ１２３８１１、配列番号７５６６、図１２；およびｐＤＡＢ１２４８６４配列番号７５６７、図１３。別の一実施形態では、機能的に発現するコード配列または非機能的（プロモーターなし）発現コード配列と共に普遍的ドナーポリヌクレオチド配列を含むさらなる配列が、構築され得る（表１１）。

この普遍的ドナーポリヌクレオチド配列は、プラスミドとして送達される小さい２〜３Ｋｂのモジュラードナー系であった。これは、１、２、３、４、５、６、７、８、９またはそれ超のＺＦＮ結合部位、制限部位を有する「ＤＮＡＸ」または「ＵＺＩ配列」（配列番号７５６８）と称される短い１００〜１５０ｂｐの鋳型領域、およびプライマー設計またはコード配列のためのＤＮＡ配列、ならびに単純なプラスミド骨格を含む最小ドナーであった（図４）。このプラスミド全体を、適切なＺＦＮ結合部位におけるＤＮＡ二本鎖破断後にＮＨＥＪを介して挿入した；これらのＺＦＮ結合部位は、タンデムに組み込まれ得る。普遍的ドナーポリヌクレオチド配列のこの実施形態は、標的部位およびＺＦＮの迅速なスクリーニングのために最も適切であり、ドナー中の増幅が困難であった配列を最小化した。「ＵＺＩ」配列を有さないが１または複数のＺＦＮ部位を有する普遍的ドナーもまた、生成されている。

さらなる一実施形態では、この普遍的ドナーポリヌクレオチド配列は、少なくとも４つのモジュールから構成され、ちょうどおよそ１００ｂｐの分析片またはコード配列のいずれかと共に、ＺＦＮ結合部位、相同性アーム、ＤＮＡＸを有する。普遍的ドナーポリヌクレオチド配列のこの実施形態は、いくつかのＺＦＮを用いて、種々の標的部位においてＨＤＲ媒介性の遺伝子挿入を調べるために適切であった（図５）。

この普遍的ドナーポリヌクレオチド配列は、２つの様式の標的化されたドナー挿入（ＮＨＥＪ／ＨＤＲ）を用いて、規定されたＤＮＡ結合ドメインを有する全ての標的化分子と共に使用され得る。このように、普遍的ドナーポリヌクレオチド配列を適切なＺＦＮ発現構築物と共送達した場合、ドナーベクターおよびダイズゲノムは、特定のＺＦＮの結合によって指示される１つの特異的位置において切断された。一旦線状化されると、このドナーは、ＮＨＥＪまたはＨＤＲによってゲノム中に取り込まれ得る。次いで、ベクター設計における異なる分析的考慮が、標的化された組込みの効率的な送達を最大化するジンクフィンガーを決定するために利用され得る。

［実施例４］
ダイズ形質転換手順
ダイズ（Glycine max）ｃ．ｖ．Ｍａｖｅｒｉｃｋプロトプラストへの送達の前に、各ＺＦＮ構築物のためのプラスミドＤＮＡを、供給業者の指示に従ってＰＵＲＥＹＩＥＬＤＰＬＡＳＭＩＤＭＡＸＩＰＲＥＰＳＹＳＴＥＭ（登録商標）（ＰｒｏｍｅｇａＣｏｒｐｏｒａｔｉｏｎ、Ｍａｄｉｓｏｎ、ＷＩ）またはＰＬＡＳＭＩＤＭＡＸＩＫＩＴ（登録商標）（Ｑｉａｇｅｎ、Ｖａｌｅｎｃｉａ、ＣＡ）を使用して、大腸菌（E. coli）の培養物から調製した。

プロトプラスト単離
プロトプラストを、葉外植片から生成したカルスから誘導されたＭａｖｅｒｉｃｋ懸濁培養物から単離した。懸濁物を、３％（ｗ／ｖ）スクロース、０．５ｍｇ／Ｌの２，４−Ｄおよび７ｇのバクトアガー（bactoagar）、ｐＨ５．７を含む新鮮なＬＳ培地（Linsmaier and Skoog 1965）中で７日毎に継代した。単離のために、継代の７日後の３０ミリリットルのＭａｖｅｒｉｃｋ懸濁培養物を、５０ｍｌコニカルチューブに移し、２００ｇで３分間遠心分離して、１チューブ当たり約１０ｍｌの定着細胞体積（ＳＣＶ）を得た。上清を除去し、２０ミリリットルの酵素溶液（ＭＭＧ溶液（４ｍＭＭＥＳ、０．６Ｍマンニトール、１５ｍＭＭｇＣｌ_２、ｐＨ６．０）中０．３％ペクトリアーゼ（３２０９５２；ＭＰＢｉｏｍｅｄｉｃａｌｓ）、３％セルラーゼ（「Ｏｎｏｚｕｋａ」Ｒ１０（商標）；ＹａｋｕｌｔＰｈａｒｍａｃｅｕｔｉｃａｌｓ、Ｊａｐａｎ））を、４ＳＣＶの懸濁細胞毎に添加し、チューブをＰａｒａｆｉｌｍ（商標）で包んだ。これらのチューブを、プラットホームロッカー上に一晩（約１６〜１８時間）置き、消化された細胞のアリコートを、顕微鏡的に評価して、細胞壁の消化が十分であったことを確実にした。

プロトプラスト精製
ダイズ（ダイズ（Glycine max）ｃ．ｖ．Ｍａｖｅｒｉｃｋ）プロトプラストベースの形質転換方法を開発し、ダイズプロトプラスト形質転換に使用した。プロトプラストを、葉外植片から生成したカルスから誘導されたＭａｖｅｒｉｃｋ懸濁培養物から単離した。以下に提供される技術がこの方法を説明する。ダイズ細胞懸濁物を、３％（ｗ／ｖ）スクロース、０．５ｍｇ／Ｌの２，４−Ｄおよび７ｇのバクトアガー、ｐＨ５．７を含む新鮮なＬＳ培地（Linsmaier and Skoog 1965）中で７日毎に１：５希釈で継代した。全ての実験を、以下に記載されるプロトコールに基づいて、継代の７日後に開始して実施した。

プロトプラスト単離
継代の７日後の３０ミリリットルのダイズｃ．ｖ．Ｍａｖｅｒｉｃｋ懸濁培養物を、５０ｍｌコニカル遠心分離チューブに移し、２００ｇで３分間遠心分離して、１チューブ当たり約１０ｍｌの定着細胞体積（ＳＣＶ）を得た。細胞ペレットを破壊することなく上清を除去した。２０ミリリットルの酵素溶液（ＭＭＧ溶液（４ｍＭＭＥＳ、０．６Ｍマンニトール、１５ｍＭＭｇＣｌ_２、ｐＨ６．０）中の０．３％ペクトリアーゼ（３２０９５２；ＭＰＢｉｏｍｅｄｉｃａｌｓ）、３％セルラーゼ（「Ｏｎｏｚｕｋａ」Ｒ１０（商標）；ＹａｋｕｌｔＰｈａｒｍａｃｅｕｔｉｃａｌｓ、Ｊａｐａｎ））を、４ＳＣＶの懸濁細胞毎に添加し、チューブをＰａｒａｆｉｌｍ（商標）で包んだ。これらのチューブを、プラットホームロッカー上に一晩（約１６〜１８時間）置いた。次の朝、消化された細胞のアリコートを、顕微鏡的に評価して、細胞壁の消化が十分であったことを確実にした。

プロトプラスト精製
細胞／酵素溶液を、１００μＭ細胞ストレーナーを介して緩徐に濾過した。この細胞ストレーナーを、１０ｍｌのＷ５＋培地（１．８２ｍＭＭＥＳ、１９２ｍＭＮａＣｌ、１５４ｍＭＣａＣｌ_２、４．７ｍＭＫＣｌ、ｐＨ６．０）で濯いだ。濾過ステップを、７０μＭのスクリーンを使用して反復した。最終体積を、１０ｍｌのＷ５＋培地を添加することによって４０ｍｌにした。これらの細胞を、チューブを反転させることによって混合した。これらのプロトプラストを、細胞を含む５０ｍｌコニカル遠心分離チューブの底にクッション溶液を添加することによって、８ｍｌのスクロースクッション溶液（５００ｍＭスクロース、１ｍＭＣａＣｌ_２、５ｍＭＭＥＳ−ＫＯＨ、ｐＨ６．０）上に緩徐に層状化した。これらのチューブを、スイングバケットローター中で３５０×ｇで１５分間遠心分離した。５ｍｌのピペットチップを使用して、プロトプラストバンド（約７〜８ｍｌ）を緩徐に取り出した。次いで、これらのプロトプラストを、５０ｍｌコニカルチューブに移し、２５ｍｌのＷ５＋洗浄を添加した。これらのチューブを緩徐に反転させ、２００ｇで１０分間遠心分離した。上清を除去し、１０ｍｌのＭＭＧ溶液を添加し、チューブを緩徐に反転させて、プロトプラストを再懸濁した。プロトプラスト密度を、血球計算器またはフローサイトメーターを使用して決定した。典型的には、４ＰＣＶの細胞懸濁物は、約２００万のプロトプラストを生じる。

ＰＥＧを使用したプロトプラストの形質転換
プロトプラスト濃度を、ＭＭＧで１６０万／ｍｌに調整した。３００μｌのプロトプラストアリコート（約５００，０００のプロトプラスト）を、２ｍｌ無菌チューブ中に移した。このプロトプラスト懸濁物を、チューブ中にプロトプラストを移す間に、定期的に混合した。プラスミドＤＮＡを、実験設計に従ってプロトプラストアリコートに添加した。プロトプラストのチューブを含むラックを、各々１分間３回緩徐に反転させて、ＤＮＡおよびプロトプラストを混合した。これらのプロトプラストを、室温で５分間インキュベートした。３００マイクロリットルのポリエチレングリコール（ＰＥＧ４０００）溶液（４０％エチレングリコール（８１２４０−ＳｉｇｍａＡｌｄｒｉｃｈ）、０．３Ｍマンニトール、０．４ＭＣａＣｌ_２）を、これらのプロトプラストに添加し、チューブのラックを、１分間混合し、インキュベーションの間に穏やかに２回反転させて、５分間インキュベートした。１ミリリットルのＷ５＋を、チューブに緩徐に添加し、チューブのラックを、１５〜２０回反転させた。次いで、これらのチューブを、３５０ｇで５分間遠心分離し、ペレットを破壊することなく上清を除去した。１ミリリットルのＷＩ培地（４ｍＭＭＥＳ０．６Ｍマンニトール、２０ｍＭＫＣｌ、ｐＨ６．０）を、各チューブに添加し、ラックを穏やかに反転させてペレットを再懸濁させた。ラックを、アルミホイルで覆い、横倒しにして、２３℃で一晩インキュベートした。

形質転換頻度を測定し、プロトプラストを回収する
プロトプラストおよび形質転換効率の定量化を、ＱｕａｎｔａＦｌｏｗＣｙｔｏｍｅｔｅｒ（商標）（Ｂｅｃｋｍａｎ−ＣｏｕｌｔｅｒＩｎｃ）を使用して測定した。形質転換のおよそ１６〜１８時間後、各再現からの１００μｌをサンプリングし、９６ウェルプレート中に置き、ＷＩ溶液で１：１希釈した。これらの再現を、３回再懸濁し、１００μｌを、フローサイトメトリーを使用して定量化した。サンプルを分析に供する前に、これらのサンプルを、２００ｇで５分間遠心分離し、上清を除去し、サンプルを、液体窒素中で急速冷凍した。次いで、これらのサンプルを、分子分析のための処理まで、−８０℃の冷凍庫中に置いた。

ＺＦＮおよびドナーの形質転換
表５の選択されたゲノム遺伝子座の各々について、ダイズプロトプラストを、緑色蛍光タンパク質（ｇｆｐ）遺伝子発現対照、ＺＦＮ単独、ドナー単独、ならびに１：１０の比率（重量で）でのＺＦＮおよびドナーＤＮＡの混合物を含む構築物でトランスフェクトした。５０万のプロトプラストのトランスフェクションのためのＤＮＡの総量は、８０μｇであった。全ての処理を、３つの再現で実施した。使用したｇｆｐ遺伝子発現対照は、キャッサバ静脈モザイクウイルスプロモーター−緑色蛍光タンパク質コード配列−アグロバクテリウム・ツメファシエンス（Agrobacterium tumefaciens）ＯＲＦ２４３’ＵＴＲ遺伝子発現カセットを含むｐＤＡＢ７２２１（図１４、配列番号７５６９）であった。トランスフェクション当たり一貫した量の総ＤＮＡを提供するために、サケ精子、またはｇｆｐ遺伝子含有プラスミドのいずれかを、必要に応じてフィラーとして使用した。典型的な標的化実験では、４μｇのＺＦＮを、単独でまたは３６μｇのドナープラスミドと共にトランスフェクトし、適切な量のサケ精子またはｐＵＣ１９プラスミドＤＮＡを添加して、ＤＮＡの全体量を８０μｇの最終量にした。フィラーとしてｇｆｐ遺伝子発現プラスミドを含めると、複数の遺伝子座および再現処理にわたるトランスフェクション品質の評価が可能になる。

［実施例５］
ジンクフィンガーヌクレアーゼを介したダイズ中のゲノム遺伝子座の切断
選択されたゲノム遺伝子座における標的化を、プロトプラストベースの迅速標的化系（ＲＴＡ）を使用する、ＺＦＮ誘導性のＤＮＡ切断およびドナー挿入によって実証した。各ダイズの選択された遺伝子座について、最大６つのＺＦＮ設計を生成し、単独でまたは普遍的ドナーポリヌクレオチドと共にのいずれかでプロトプラスト中に形質転換し、ＺＦＮ媒介性の切断および挿入を、それぞれ次世代配列決定（ＮＧＳ）またはジャンクショナル（junctional）（イン−アウト（in-out））ＰＣＲを使用して測定した。

ＺＦＮトランスフェクトしたダイズプロトプラストを、２ｍｌＥＰＰＥＮＤＯＲＦ（商標）チューブ中で１６００ｒｐｍでの遠心分離によって、トランスフェクションの２４時間後に回収し、上清を完全に除去した。ゲノムＤＮＡを、ＱＩＡＧＥＮＰＬＡＮＴＤＮＡＥＸＴＲＡＣＴＩＯＮＫＩＴ（商標）（Ｑｉａｇｅｎ、Ｖａｌｅｎｃｉａ、ＣＡ）を使用して、プロトプラストペレットから抽出した。この単離されたＤＮＡを、５０μＬの水中に再懸濁し、濃度をＮＡＮＯＤＲＯＰ（登録商標）（Ｉｎｖｉｔｒｏｇｅｎ、ＧｒａｎｄＩｓｌａｎｄ、ＮＹ）によって決定した。ＤＮＡの完全性を、０．８％アガロースゲル電気泳動でサンプルを泳動することによって推定した。全てのサンプルを、ＰＣＲ増幅のために標準化して（２０〜２５ｎｇ／μＬ）、配列決定（Ｉｌｌｕｍｉｎａ，Ｉｎｃ．、ＳａｎＤｉｅｇｏ、ＣＡ）のためのアンプリコンを生成した。処理したサンプルおよび対照サンプル由来の各試験ＺＦＮ認識配列を包含する領域を増幅するためのバーコード化ＰＣＲプライマーを設計し、ＩＤＴ（Ｃｏｒａｌｖｉｌｌｅ、ＩＡ、ＨＰＬＣ精製した）から購入した。最適な増幅条件を、２３．５μＬの反応中で０．２μＭの適切なバーコード化プライマー、ＡＣＣＵＰＲＩＭＥＰＦＸＳＵＰＥＲＭＩＸ（商標）（Ｉｎｖｉｔｒｏｇｅｎ、Ｃａｒｌｓｂａｄ、ＣＡ）および１００ｎｇの鋳型ゲノムＤＮＡを使用する勾配ＰＣＲによって同定した。サイクリングパラメーターは、９５℃での最初の変性（５分間）、その後の、変性（９５℃、１５秒間）、アニーリング（５５〜７２℃、３０秒間）、伸長（６８℃、１分間）の３５サイクル、および最終伸長（６８℃、７分間）であった。増幅産物を、３．５％ＴＡＥアガロースゲル上で分析し、各プライマーの組合せに適切なアニーリング温度を決定し、上記のように対照サンプルおよびＺＦＮ処理サンプルからアンプリコンを増幅するために使用した。全てのアンプリコンを、３．５％アガロースゲル上で精製し、水中に溶出させ、ＮＡＮＯＤＲＯＰ（商標）によって濃度を決定した。次世代配列決定のために、ＺＦＮ処理したおよび対応する未処理の対照由来の１００ｎｇのＰＣＲアンプリコンを一緒にプールし、ｌｌｕｍｉｎａ次世代配列決定（ＮＧＳ）を使用して配列決定した。

各ダイズの最適なゲノム遺伝子座における適切なＺＦＮの切断活性をアッセイした。ＺＦＮ切断部位を包含する短いアンプリコンを、ゲノムＤＮＡから増幅し、ＺＦＮ処理したプロトプラストおよび対照プロトプラストからＩｌｌｕｍｉｎａＮＧＳに供した。ＺＦＮ誘導性の切断またはＤＮＡ二本鎖破断を、切断部位におけるヌクレオチドの挿入または欠失（インデル）による細胞ＮＨＥＪ修復経路によって解消し、したがって、切断部位におけるインデルの存在は、ＺＦＮ活性の尺度であり、ＮＧＳによって決定した。標的特異的ＺＦＮの切断活性を、ＮＧＳ分析ソフトウェア（特許公開２０１２−０１７３，１５３、ＤＮＡ配列のデータ分析）を使用して、１００万の高品質配列当たりのインデルを有する配列の数として推定した。活性を、ダイズの選択されたゲノム遺伝子座標的について観察し、各ＺＦＮ切断部位においてインデルの多様なフットプリントを示す配列アラインメントによってさらに確認した。このデータは、ダイズの選択されたゲノム遺伝子座がＺＦＮによる切断に従順であることを示唆している。各標的における示差的活性は、そのクロマチン状態および切断に対する従順さ、ならびに各ＺＦＮの発現の効率を反映していた。

［実施例６］
ポリヌクレオチドドナーの組込みの迅速標的化分析
非相同末端結合（ＮＨＥＪ）媒介性のドナー挿入を介した、ダイズの選択されたゲノム遺伝子座標的内の普遍的ドナーポリヌクレオチド配列の標的化の検証を、セミスループット（semi-throughput）プロトプラストベースの迅速標的化分析方法を使用して実施した。各ダイズの選択されたゲノム遺伝子座標的について、およそ３〜６のＺＦＮ設計を試験し、標的化を、次世代配列決定方法によってＺＦＮ媒介性の切断を測定し、ジャンクショナルイン−アウトＰＣＲによってドナー挿入を測定することによって、評価した（図６）。両方のアッセイにおいて陽性であったダイズの選択されたゲノム遺伝子座を、標的化可能な遺伝子座として同定した。

ＺＦＮドナー挿入の迅速標的化分析
ダイズの選択されたゲノム遺伝子座標的がドナー挿入のために標的化され得るか否かを決定するために、ＺＦＮ構築物および普遍的ドナーポリヌクレオチド構築物を、ゲノムＤＮＡを分析のために抽出する前に２４時間にわたってインキュベートしたダイズプロトプラストに共送達した。発現されたＺＦＮが、ダイズの選択されたゲノム遺伝子座標的においておよびドナー中での両方で、標的結合部位を切断することができた場合、線状化したドナーを、非相同末端結合（ＮＨＥＪ）経路を介して、ダイズゲノム中の切断された標的部位中に挿入する。ダイズの選択されたゲノム遺伝子座標的における標的化された組込みの確認を、「イン−アウト」ＰＣＲ戦略に基づいて完了し、この戦略では、「イン」プライマーは、ネイティブの最適なゲノム遺伝子座における配列を認識し、「アウト」プライマーは、ドナーＤＮＡ内の配列に結合する。これらのプライマーは、ドナーＤＮＡがダイズの選択されたゲノム遺伝子座標的において挿入された場合にだけ、ＰＣＲアッセイが予測されたサイズを有する増幅産物を産生するように、設計した。このイン−アウトＰＣＲアッセイを、挿入接合部の５’末端および３’末端の両方において実施した。組み込まれたポリヌクレオチドドナー配列の分析に使用したプライマーを、表９に提供する。

ネステッド「イン−アウト」ＰＣＲを使用した標的遺伝子座におけるＺＦＮドナー挿入
全てのＰＣＲ増幅を、ＴＡＫＡＲＡＥＸＴＡＱＨＳ（商標）キット（Ｃｌｏｎｅｔｅｃｈ、ＭｏｕｎｔａｉｎＶｉｅｗ、ＣＡ）を使用して実施した。第１のイン−アウトＰＣＲを、１×ＴＡＫＡＲＡＥＸＴＡＱＨＳ（商標）緩衝液、０．２ｍＭのｄＮＴＰｓ、０．２μＭの「アウト」プライマー、０．０５μＭの「イン」プライマー（上記普遍的ドナーカセットから設計した）、０．７５単位のＴＡＫＡＲＡＥＸＴＡＱＨＳ（商標）ポリメラーゼおよび６ｎｇの抽出されたダイズプロトプラストＤＮＡを含む２５μＬの最終反応体積において実施した。次いで、この反応を、９４℃で３分間、９８℃で１２秒間、および６０℃で３０秒間、および７２℃で１分間の１４サイクル、その後７２℃で１０分間からなるＰＣＲプログラムを使用して完了し、４℃で維持した。最終ＰＣＲ産物を、可視化のために、１ＫＢＰＬＵＳＤＮＡＬＡＤＤＥＲ（商標）（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、ＧｒａｎｄＩｓｌａｎｄ、ＮＹ）と共に、アガロースゲル上で泳動した。

ネステッドイン−アウトＰＣＲを、１×ＴＡＫＡＲＡＥＸＴＡＱＨＳ（商標）緩衝液、０．２ｍＭのｄＮＴＰｓ、０．２μＭの「アウト」プライマー（表９）、０．１μＭの「イン」プライマー（上記普遍的ドナーカセットから設計した、表１０）、０．７５単位のＴＡＫＡＲＡＥＸＴＡＱＨＳ（商標）ポリメラーゼおよび１μＬの第１のＰＣＲ産物を含む２５μＬの最終反応体積において実施した。次いで、この反応を、９４℃で３分間、９８℃で１２秒間、６０℃で３０秒間および７２℃で４５秒間の３０サイクル、その後７２℃で１０分間からなるＰＣＲプログラムを使用して完了し、４℃で維持した。最終ＰＣＲ産物を、可視化のために、１ＫＢＰＬＵＳＤＮＡＬＡＤＤＥＲ（商標）（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、ＧｒａｎｄＩｓｌａｎｄ、ＮＹ）と共に、アガロースゲル上で泳動した。

プロトプラスト標的化系におけるイン−アウトＰＣＲアッセイの配備は、特に困難であったが、それは、大量のプラスミドＤＮＡがトランスフェクションに使用され、大量のＤＮＡがプロトプラスト標的化系中に残留し、細胞ゲノムＤＮＡと共に引き続いて抽出されたからである。余剰のプラスミドＤＮＡは、ゲノムＤＮＡの相対的濃度を希釈し得、検出の全体的感度を低減させ得、非特異的な異常なＰＣＲ反応の顕著な原因でもあり得る。ＺＦＮ誘導性のＮＨＥＪベースのドナー挿入は、典型的には、フォワード配向またはリバース配向のいずれかで生じる。フォワード配向挿入についてのＤＮＡのイン−アウトＰＣＲ分析は、増幅プロセスの間に組み込まれていないドナーＤＮＡのプライミングおよび伸長を生じ得る標的およびドナー中のＺＦＮ結合部位の周囲の相同性の共有された領域におそらくは起因して、偽陽性バンドを示す場合が多かった。偽陽性は、リバース配向挿入産物について探索した分析では見られず、したがって、全ての標的化されたドナー組込み分析を実施して、ＲＴＡにおいてリバースドナー挿入を調べた。さらに特異性を増加させ背景を低減させるために、ネステッドＰＣＲ戦略もまた使用した。このネステッドＰＣＲ戦略は、第１のＰＣＲ反応の第１の増幅産物内のより短い領域を増幅する第２のＰＣＲ増幅反応を使用した。非対称な量の「イン」プライマーおよび「アウト」プライマーの使用は、選択されたゲノム遺伝子座における迅速標的化分析のためにさらにジャンクショナルＰＣＲを最適化した。

このイン−アウトＰＣＲ分析結果を、アガロースゲル上で可視化した。表１２の全てのダイズの選択されたゲノム遺伝子座について、「ＺＦＮ＋ドナー処理」は、５’末端および３’末端において、ほぼ予測されたサイズのバンドを生じた。対照ＺＦＮまたはドナー単独処理は、ＰＣＲにおいて陰性であり、これは、この方法が、最適な非遺伝子ダイズゲノム遺伝子座のうち少なくとも３２の標的部位におけるドナー組込みについて特異的にスコアリングしていたことを示唆している。全ての処理を、３〜６の再現で実施し、複数の再現（両方の末端において≧２）における予期されたＰＣＲ産物の存在を使用して、標的化を確認した。ＮＨＥＪを介したドナー挿入は、標的部位および／またはドナーＺＦＮ部位における線状化された末端のプロセシングに起因して生成されたより低い強度の副産物を生じる場合が多い。さらに、異なるＺＦＮが、標的化された組込みについて異なるレベルの効率を生じ、ＺＦＮの一部は一貫して高レベルのドナー組込みを生じ、一部のＺＦＮはあまり一貫していないレベルのドナー組込みを生じ、他のＺＦＮは組込みを生じなかったことが観察された。全体として、試験したダイズの選択されたゲノム遺伝子座標的の各々について、標的化された組込みを、１または複数のＺＦＮによって、ダイズの代表的ゲノム遺伝子座標的内で実証して、これらの遺伝子座の各々が標的化可能であったことを確認する。さらに、ダイズの選択されたゲノム遺伝子座標的の各々は、正確な遺伝子形質転換に適切であった。これらのダイズの選択されたゲノム遺伝子座標的の検証を、類似の結果で複数回反復し、こうして、プラスミド設計および構築物、プロトプラスト形質転換、サンプルプロセシング、サンプル分析を含む検証プロセスの再現性を確認した。

結論
このドナープラスミド、およびダイズの選択されたゲノム遺伝子座標的を特異的に切断するように設計された１つのＺＦＮを、ダイズプロトプラスト中にトランスフェクトし、細胞を２４時間後に収集した。イン−アウトジャンクショナルＰＣＲによる、対照、ＺＦＮ処理されたおよびドナーと共にＺＦＮ処理されたプロトプラストから単離されたゲノムＤＮＡの分析は、ＺＦＮによるゲノムＤＮＡ切断の結果として、普遍的ドナーポリヌクレオチドの標的化された挿入を示した（表１２）。これらの研究は、この普遍的ドナーポリヌクレオチド系が、内因性部位における標的化を評価するため、および候補ＺＦＮをスクリーニングするために使用され得ることを示している。最後に、プロトプラストベースの迅速標的化分析および新規の普遍的ドナーポリヌクレオチド配列系は、ゲノム標的をスクリーニングするための迅速な手段および植物における正確なゲノム操作の試みのためのＺＦＮを提供する。これらの方法は、ＤＮＡの二本鎖破断または一本鎖破断を導入する任意のヌクレアーゼを使用して任意の目的の系においてゲノム標的における部位特異的切断およびドナー挿入を評価するために拡張され得る。

７，０１８を超える選択されたゲノム遺伝子座を、上で詳述した種々の基準によって同定した。選択されたゲノム遺伝子座を、これらの選択されたゲノム遺伝子座を規定するために使用した１０のパラメーターに基づいて主成分分析を使用してクラスター化した。一部の他の目的の遺伝子座に加えて、このクラスターの代表は、標的化可能であることが実証された。

Claims

低メチル化され、標的化可能であり、ダイズゲノム内の遺伝子領域の近位に位置し、組換えの証拠を示す、少なくとも１Ｋｂの非遺伝子ダイズゲノム配列；および
前記非遺伝子配列中に挿入されている、目的のＤＮＡ
を含む、組換え配列。
前記非遺伝子配列が、以下の特徴：
ａ．前記非遺伝子配列のメチル化のレベルは、１％以下であること；
ｂ．前記非遺伝子配列は、前記ダイズゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有すること；
ｃ．前記非遺伝子配列は、既知または予測された発現性ダイズコード配列の４０Ｋｂ領域以内に位置すること；および
ｄ．前記非遺伝子配列は、０．０１５７４ｃＭ／Ｍｂよりも高い、前記ダイズゲノム内での組換え頻度を示すこと
を含む、請求項１に記載の組換え配列。
前記非遺伝子配列が、５．７３Ｋｂの最大長さを含む、請求項１に記載の組換え配列。
前記非遺伝子配列が、１％以下のヌクレオチドメチル化を含む、請求項１に記載の組換え配列。
前記非遺伝子配列が、１Ｋｂ〜５．７３Ｋｂの長さであり、メチル化されたシトシン残基を含まない、請求項４に記載の組換え配列。
前記非遺伝子配列が、前記ダイズゲノム内の任意の他の配列と、４０％よりも高い配列同一性ではアラインしない、請求項５に記載の組換え配列。
前記非遺伝子配列が、０．０１５７４ｃＭ／Ｍｂよりも高い組換え頻度で組換えの証拠を示す、請求項５に記載の組換え配列。
前記非遺伝子配列を含むネイティブダイズゲノムの４０Ｋｂ領域が、少なくとも１つの既知もしくは予測されたダイズコード配列、または既知のダイズ遺伝子の２Ｋｂ上流および／もしくは１Ｋｂ下流の配列を含む配列も含む、請求項５に記載の組換え配列。
前記既知または予測されたダイズコード配列が、ダイズタンパク質を発現する、請求項８に記載の組換え配列。
前記非遺伝子配列が、メチル化されたポリヌクレオチドを含まない、請求項１に記載の組換え配列。
前記非遺伝子配列の一方の末端が、発現された内因性遺伝子の４０Ｋｂ以内に存在する、請求項１に記載の組換え配列。
前記目的のＤＮＡが、分析ドメインを含む、請求項１に記載の組換え配列。
前記目的のＤＮＡが、ペプチドをコードしない、請求項１に記載の組換え配列。
前記目的のＤＮＡが、ペプチドをコードする、請求項１に記載の組換え配列。
前記目的のＤＮＡが、殺虫剤抵抗性遺伝子、除草剤耐性遺伝子、窒素使用効率遺伝子、水利用効率遺伝子、栄養品質遺伝子、ＤＮＡ結合遺伝子および選択可能なマーカー遺伝子を含む遺伝子発現カセットを含む、請求項１４に記載の組換え配列。
以下の特徴：
ａ．前記非遺伝子配列は、１％未満のＤＮＡメチル化を含むこと；
ｂ．前記非遺伝子配列は、前記ダイズゲノム内で、０．０１５７４〜８３．５２ｃＭ／Ｍｂの組換え頻度を示すこと；
ｃ．前記非遺伝子配列は、前記ダイズゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示すこと；
ｄ．前記非遺伝子配列は、前記ダイズゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有すること；
ｅ．前記非遺伝子配列は、ダイズ染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有すること；
ｆ．前記非遺伝子配列は、１４．３６〜４５．９％のグアニン／シトシンパーセント含量範囲を有すること；
ｇ．前記非遺伝子配列は、遺伝子配列の近位に位置すること；および
ｈ．前記非遺伝子配列は、１または複数のさらなる非遺伝子配列を含むダイズゲノム配列の１Ｍｂ領域中に位置すること
を含む、請求項１に記載の組換え配列。
請求項１から１６のいずれか一項に記載の組換え配列を含む、ダイズ植物、ダイズ植物部分またはダイズ植物細胞。
前記既知または予測されたダイズコード配列が、０．０００４１５〜８７２．７１９８の範囲のレベルで発現する、請求項１７に記載のダイズ植物、ダイズ植物部分またはダイズ植物細胞。
前記目的のＤＮＡおよび／または前記非遺伝子配列が、前記非遺伝子配列中への前記目的のＤＮＡの挿入の間に改変される、請求項１に記載の組換え配列。
１つの非遺伝子ダイズゲノム配列に標的化された目的のＤＮＡを含むトランスジェニック植物細胞を作製する方法であって、
ａ．最適な非遺伝子ダイズゲノム遺伝子座を選択するステップ；
ｂ．前記非遺伝子ダイズゲノム配列を切断する部位特異的ヌクレアーゼを、植物細胞中に導入するステップ；
ｃ．前記目的のＤＮＡを前記植物細胞中に導入するステップ；
ｄ．前記目的のＤＮＡを前記非遺伝子遺伝子座中に標的化するステップであって、前記非遺伝子配列の切断は、前記非遺伝子遺伝子座中へのポリヌクレオチド配列の組込みを促進する、ステップ；および
ｅ．前記非遺伝子遺伝子座に標的化された前記目的のＤＮＡを含むトランスジェニック植物細胞を選択するステップ
を含む、方法。
前記目的のＤＮＡが、分析ドメインを含む、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
前記目的のＤＮＡが、ペプチドをコードしない、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
前記目的のＤＮＡが、ペプチドをコードする、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
前記目的のＤＮＡが、導入遺伝子を含む遺伝子発現カセットを含む、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
前記部位特異的ヌクレアーゼが、ジンクフィンガーヌクレアーゼ、ＣＲＩＳＰＲヌクレアーゼ、ＴＡＬＥＮ、ホーミングエンドヌクレアーゼまたはメガヌクレアーゼからなる群から選択される、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
前記目的のＤＮＡが、相同組換え修復組込み方法を介して、前記非遺伝子遺伝子座内に組み込まれる、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
前記目的のＤＮＡが、非相同末端結合組込み方法を介して、前記非遺伝子遺伝子座内に組み込まれる、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
選択された前記非遺伝子遺伝子座が、以下の特徴：
ａ．前記非遺伝子遺伝子座は、前記配列内に１％未満のＤＮＡメチル化を有すること；
ｂ．前記非遺伝子遺伝子座は、前記ダイズゲノム内で、０．００１５７４〜８３．５２ｃＭ／Ｍｂの比率の組換えを示すこと；
ｃ．前記非遺伝子遺伝子座は、前記ダイズゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示すこと；
ｄ．前記非遺伝子遺伝子座は、前記ダイズゲノム中に含まれる任意の他の１Ｋｂ配列と、４０％未満の配列同一性を共有すること；
ｅ．前記非遺伝子遺伝子座は、ダイズ染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有すること；
ｆ．前記非遺伝子遺伝子座は、１４．３６〜４５．９％のグアニン／シトシンパーセント含量範囲を有すること；
ｇ．前記非遺伝子遺伝子座は、遺伝子配列の近位に位置すること；および
ｈ．前記非遺伝子遺伝子座を含むダイズゲノム配列の１Ｍｂ領域は、少なくとも１つの第２の非遺伝子配列を含むこと
を含む、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
前記非遺伝子遺伝子座が、少なくとも１Ｋｂの長さである、請求項２８に記載のトランスジェニック植物細胞を作製する方法。
既知もしくは予測されたダイズコード配列、または既知の遺伝子の２Ｋｂ上流および１Ｋｂ下流の領域を含む配列が、前記非遺伝子遺伝子座の４０Ｋｂ以内に位置する、請求項２９に記載のトランスジェニック植物細胞を作製する方法。
前記目的のＤＮＡおよび／または前記非遺伝子遺伝子座が、ステップ（ｄ）の前記非遺伝子遺伝子座中への前記ポリヌクレオチド配列の前記組込みの間に改変される、請求項２０に記載のトランスジェニック植物細胞を作製する方法。
組換えの標的化可能な非遺伝子ダイズゲノム配列であって、
クラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２からなる群から選択される少なくとも１Ｋｂの非遺伝子配列またはクラスター１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２からなる群から選択される配列と９９％の配列同一性を共有する配列、およびそれらのそれぞれの相補体であって、前記クラスターは、表６に規定されるＰＣＡ値を含むＰＣＡ統計アルゴリズムから生成される、配列；ならびに
前記非遺伝子配列中に挿入された目的のＤＮＡ
を含む、組換えの標的化可能な非遺伝子ダイズゲノム配列。
前記目的のＤＮＡが、分析ドメインを含む、請求項３２に記載の標的化可能な非遺伝子ダイズゲノム配列。
前記目的のＤＮＡが、ペプチドをコードする、請求項３２に記載の標的化可能な非遺伝子ダイズゲノム配列。
前記目的のＤＮＡが、導入遺伝子を含む遺伝子発現カセットを含む、請求項３２に記載の標的化可能な非遺伝子ダイズゲノム配列。
前記目的のＤＮＡが、部位特異的切断部位を含む、請求項３２に記載の標的化可能な非遺伝子ダイズゲノム配列。
前記部位特異的切断部位が、ヌクレアーゼによって切断される、請求項３６に記載の標的化可能な非遺伝子ダイズゲノム配列。
前記ヌクレアーゼが、ジンクフィンガーヌクレアーゼ、ＣＲＩＳＰＲヌクレアーゼ、ＴＡＬＥＮ、ホーミングエンドヌクレアーゼまたはメガヌクレアーゼからなる群から選択される、請求項３７に記載の標的化可能な非遺伝子ダイズゲノム配列。
前記非遺伝子配列中への前記目的のＤＮＡの前記挿入が、前記目的のＤＮＡおよび前記非遺伝子配列の改変を生じる、請求項３２に記載の標的化可能な非遺伝子ダイズゲノム配列。
低メチル化され、標的化可能であり、ダイズゲノム内の遺伝子領域の近位に位置し、組換えの証拠を示す、少なくとも１Ｋｂの精製された非遺伝子ダイズゲノム配列。
前記非遺伝子配列が、以下の特徴：
ａ．前記非遺伝子配列のメチル化のレベルは、１％以下であること；
ｂ．前記非遺伝子配列は、前記ダイズゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有すること；
ｃ．前記非遺伝子配列は、既知または予測された発現性ダイズコード配列の４０Ｋｂ領域以内に位置すること；および
ｄ．前記非遺伝子配列は、０．０１５７４ｃＭ／Ｍｂよりも高い、前記ダイズゲノム内での組換え頻度を示すこと
を含む、請求項４０に記載の精製された配列。
前記非遺伝子配列が、５．７３Ｋｂの最大長さを含む、請求項４０に記載の精製された配列。
前記配列が、以下の特徴：
ａ．前記非遺伝子配列は、そのネイティブ位置において、１％未満のＤＮＡメチル化を含むこと；
ｂ．前記非遺伝子配列は、そのネイティブ位置において、前記ダイズゲノム内で、０．０１５７４〜８３．５２ｃＭ／Ｍｂの組換え頻度を示すこと；
ｃ．前記非遺伝子配列は、そのネイティブ位置において、前記ダイズゲノムの、０〜０．４９４レベルのヌクレオソーム占有率を示すこと；
ｄ．前記非遺伝子配列は、前記ダイズゲノム中に含まれる任意の他の配列と、４０％未満の配列同一性を共有すること；
ｅ．前記非遺伝子配列は、そのネイティブ位置において、ダイズ染色体セントロメアから０〜０．９９６８２のゲノム距離の比率の相対的位置値を有すること；
ｆ．前記非遺伝子配列は、１４．３６〜４５．９％のグアニン／シトシンパーセント含量範囲を有すること；
ｇ．前記非遺伝子配列は、そのネイティブ位置において、既知もしくは予測されたダイズコード配列、または既知の遺伝子の２Ｋｂ上流および１Ｋｂ下流の領域を含む配列の、４０Ｋｂ以内に位置すること；ならびに
ｈ．前記非遺伝子配列は、そのネイティブ位置において、１または複数のさらなる非遺伝子配列を含むダイズゲノム配列の１Ｍｂ領域中に位置すること
を含む、請求項４０に記載の精製された配列。