定義
本発明を説明および特許請求する際に、以下の用語法が、以下に示す定義に従って使用される。
用語「約」は、本明細書で使用する場合、述べられた値または値の範囲よりも10パーセント大きいまたは小さいことを意味するが、任意の値または値の範囲をこのより広い定義のみに指定することは意図しない。用語「約」が先行する各値または値の範囲は、述べられた絶対値または絶対値の範囲の実施形態を包含することも意図する。
本明細書で使用する場合、用語「植物」は、植物全体および植物の任意の子孫、細胞、組織または部分を含む。用語「植物部分」は、例えば以下が含まれるがこれらに限定されない、植物の任意の部分を含む:種子(成熟種子および未成熟種子を含む);植物挿し木;植物細胞;植物細胞培養物;植物器官(例えば、花粉、胚、花、果実、苗条、葉、根、茎および外植片)。植物組織または植物器官は、種子、カルス、または構造的もしくは機能的単位へと組織化される植物細胞の任意の他の群であり得る。植物細胞または組織培養物は、その細胞または組織が取得された植物の生理学的特徴および形態学的特徴を有する植物を再生することが可能であり得、その植物と実質的に同じ遺伝子型を有する植物を再生することが可能であり得る。対照的に、一部の植物細胞は、植物を産生するために再生することが不可能である。植物細胞または組織培養物中の再生可能な細胞は、胚、プロトプラスト、成長点細胞、カルス、花粉、葉、葯、根、根端、トウモロコシの毛(silk)、花、穀粒、穂、トウモロコシの穂軸、トウモロコシの皮(husk)またはトウモロコシの軸(stalk)であり得る。
植物部分には、収穫可能な部分および後代植物の繁殖に有用な部分が含まれる。繁殖に有用な植物部分には、例えば以下が含まれるがこれらに限定されない:種子;果実;挿し木;実生;塊茎;および台木。植物の収穫可能な部分は、例えば以下が含まれるがこれらに限定されない、植物の任意の有用な部分であり得る:花;花粉;実生;塊茎;葉;茎;果実;種子;および根。
植物細胞は、植物の構造的および生理学的単位である。植物細胞には、本明細書で使用する場合、プロトプラストおよび細胞壁を有するプロトプラストが含まれる。植物細胞は、単離された単一の細胞、または細胞の凝集物(例えば、脆弱なカルスおよび培養された細胞)の形態であり得、より高次の組織化された単位(例えば、植物組織、植物器官および植物)の部分であり得る。したがって、植物細胞は、植物全体へと再生できる、プロトプラスト、配偶子産生細胞、または細胞もしくは細胞の収集物であり得る。このように、複数の植物細胞を含み、植物全体へと再生することが可能な種子は、本明細書の実施形態では、「植物部分」とみなされる。
用語「プロトプラスト」とは、本明細書で使用する場合、その細胞壁が完全にまたは部分的に除去され、その脂質二重膜がむき出しになった植物細胞を指す。典型的には、プロトプラストは、細胞培養物または植物全体への再生の潜在力を有する、細胞壁のない単離された植物細胞である。
本明細書で使用する場合、用語「ネイティブ」または「天然の」は、天然に見出される状態を規定する。「ネイティブDNA配列」は、天然の手段または伝統的な育種技術によって産生されたが、遺伝子操作によって(例えば、分子生物学/形質転換技術を使用して)生成されたわけではない、天然に存在するDNA配列である。
本明細書で使用する場合、「内因性配列」は、生物中または生物のゲノム中のその天然の位置における、ネイティブ形態のポリヌクレオチド、遺伝子またはポリペプチドを規定する。
用語「単離された」は、本明細書で使用する場合、その天然の環境から取り出されていることを意味する。
用語「精製された」は、本明細書で使用する場合、ネイティブまたは天然の環境においてその分子または化合物と通常関連する夾雑物を実質的に含まない形態での分子または化合物の単離に関し、元の組成物の他の成分から分離された結果として純度が増加していることを意味する。用語「精製された核酸」は、ポリペプチド、脂質および炭水化物が含まれるがこれらに限定されない他の化合物から分離された核酸配列を説明するために、本明細書で使用される。
用語「ポリペプチド」、「ペプチド」および「タンパク質」は、アミノ酸残基のポリマーを指すために、相互交換可能に使用される。この用語は、1または複数のアミノ酸が、対応する天然に存在するアミノ酸の化学的アナログまたは改変された誘導体である、アミノ酸ポリマーにも適用される。
本明細書で使用する場合、「最適な双子葉ゲノム遺伝子座」、「最適な非遺伝子双子葉遺伝子座」、「最適な非遺伝子遺伝子座」または「最適なゲノム遺伝子座(OGL)」は、以下の特性:非遺伝子、低メチル化された、標的化可能な、および遺伝子領域の近位の位置にある、を有する、双子葉植物の核ゲノムにおいて見出されるネイティブDNA配列であり、この最適な双子葉ゲノム遺伝子座の周囲のゲノム領域は、組換えの証拠を示す。
本明細書で使用する場合、用語「最適なダイズゲノム遺伝子座」、「最適な非遺伝子ダイズ遺伝子座」、「最適な非遺伝子遺伝子座」または「最適なゲノム遺伝子座(OGL)」は、以下の特性:非遺伝子、低メチル化された、標的化可能な、および遺伝子領域の近位の位置にある、を有する、双子葉植物の核ゲノムにおいて見出されるネイティブDNA配列を指定するために、相互交換可能に使用され、この最適な双子葉ゲノム遺伝子座の周囲のゲノム領域は、組換えの証拠を示す。
本明細書で使用する場合、用語「非遺伝子双子葉配列」または「非遺伝子双子葉ゲノム配列」は、少なくとも1Kbの長さを有し、オープンリーディングフレーム、遺伝子配列または遺伝子調節配列をいずれも欠く、双子葉植物の核ゲノムにおいて見出されるネイティブDNA配列を指定するために、相互交換可能に使用される。さらに、この非遺伝子双子葉配列は、いずれのイントロン配列も含まない(即ち、イントロンは、非遺伝子の定義から排除される)。この非遺伝子配列は、転写もタンパク質へと翻訳もされ得ない。多くの植物ゲノムは、非遺伝子領域を含む。ゲノムの95%もが、非遺伝子であり得、これらの領域は、主に反復性DNAから構成され得る。
本明細書で使用する場合、用語「非遺伝子ダイズ配列」または「非遺伝子ダイズゲノム配列」は、少なくとも1Kbの長さを有し、オープンリーディングフレーム、遺伝子配列または遺伝子調節配列をいずれも欠く、ダイズ植物の核ゲノムにおいて見出されるネイティブDNA配列を指定するために、相互交換可能に使用される。さらに、この非遺伝子ダイズ配列は、いずれのイントロン配列も含まない(即ち、イントロンは、非遺伝子の定義から排除される)。この非遺伝子配列は、転写もタンパク質へと翻訳もされ得ない。多くの植物ゲノムは、非遺伝子領域を含む。ゲノムの95%もが、非遺伝子であり得、これらの領域は、主に反復性DNAから構成され得る。
本明細書で使用する場合、「遺伝子領域」は、RNAおよび/またはポリペプチドをコードするオープンリーディングフレームを含むポリヌクレオチド配列として定義される。この遺伝子領域は、コード領域の最大約2Kb上流かつコード領域の1Kb下流であるが、場合によりさらに上流または下流の、オープンリーディングフレームの発現の調節に関与する任意の同定可能な隣接する5’および3’の非コードヌクレオチド配列もまた包含し得る。遺伝子領域は、この遺伝子領域中に存在し得る任意のイントロンをさらに含む。さらに、この遺伝子領域は、単一の遺伝子配列、または短いスパン(1Kb未満)の非遺伝子配列がちりばめられた複数の遺伝子配列を含み得る。
本明細書で使用する場合、「目的の核酸」、「目的のDNA」または「ドナー」は、ダイズゲノムなどの双子葉ゲノム中への部位特異的な標的化された挿入のために選択された核酸/DNA配列として定義される。目的の核酸は、任意の長さのもの、例えば、2ヌクレオチド長と50,000ヌクレオチド長との間(または、それらの間またはそれらを上回る任意の整数値)、好ましくは約1,000ヌクレオチド長と5,000ヌクレオチド長の間(またはそれらの間の任意の整数値)のものであり得る。目的の核酸は、活発に転写されたおよび/または翻訳された遺伝子配列をさらに含む1または複数の遺伝子発現カセットを含み得る。逆に、この目的の核酸は、機能的遺伝子発現カセットも遺伝子全体も含まないポリヌクレオチド配列を含み得る(例えば、プロモーターなどの調節配列を単に含み得る)か、または任意の同定可能な遺伝子発現エレメントもしくは任意の活発に転写された遺伝子配列を含まない可能性がある。この目的の核酸は、任意選択で分析ドメインを含み得る。例えばダイズの双子葉ゲノム中への目的の核酸の挿入に際し、挿入された配列は、「挿入された目的のDNA」と呼ばれる。さらに、この目的の核酸は、DNAまたはRNAであり得、線状または環状であり得、一本鎖または二本鎖であり得る。この目的の核酸は、ネイキッド核酸として、1もしくは複数の送達剤(例えば、リポソーム、ポロキサマー、タンパク質でカプセル化されたT鎖など)との複合体として、あるいは細菌またはウイルス送達ビヒクル、例えば、それぞれ、アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)またはアデノウイルスもしくはアデノ随伴ウイルス(AAV)などの中に含まれて、細胞に送達され得る。
本明細書で使用する場合、用語「分析ドメイン」は、核酸配列の標的化された挿入を補助する機能的エレメントを含む核酸配列を規定する。例えば、分析ドメインは、特に設計された制限酵素部位、ジンクフィンガー結合部位、操作されたランディングパッド(landing pad)または操作された導入遺伝子組込みプラットホームを含み得、遺伝子調節エレメントまたはオープンリーディングフレームを含んでも含まなくてもよい。例えば、その全体が参照により本明細書に組み込まれる、米国特許出願公開第20110191899号を参照のこと。
本明細書で使用する場合、用語「選択された双子葉配列」は、この配列が最適な非遺伝子双子葉ゲノム遺伝子座として適格であるか否かを決定するための分析のために選択された双子葉植物のネイティブゲノムDNA配列を規定する。
本明細書で使用する場合、用語「選択されたダイズ配列」は、この配列が最適な非遺伝子双子葉ゲノム遺伝子座として適格であるか否かを決定するための分析のために選択されたダイズ植物のネイティブゲノムDNA配列を規定する。
本明細書で使用する場合、DNA配列に関して、用語「低メチル化」または「低メチル化された」は、DNAの所与の配列中のメチル化されたDNAヌクレオチド残基の低減された状態を規定する。典型的には、減少したメチル化は、ダイズ植物などの双子葉植物のゲノム中に存在する非遺伝子配列において見出されるメチル化の平均レベルと比較した、メチル化されたアデニン残基またはシトシン残基の数に関する。
本明細書で使用する場合、「標的化可能な配列」は、1つの特定の配列中への目的の核酸の部位特異的な標的化された挿入を可能にするために、核ゲノムにおいて十分に独自である、ポリヌクレオチド配列である。
本明細書で使用する場合、用語「非反復的」配列は、ダイズなどの双子葉植物のゲノム内の任意の他の配列と40%未満の同一性を共有する、長さが少なくとも1Kbの配列として定義される。配列同一性の計算は、例えば、デフォルトパラメーター設定を使用するNCBI BLAST(商標)+ソフトウェア(バージョン2.2.25)実行を使用するBLAST(商標)ベースの相同性検索を使用して、双子葉ゲノム、例えば、ダイズc.v.Williams82ゲノムに対して、選択されたゲノム配列をスキャンすることを含む、当業者に公知の任意の標準的な技術を使用して決定され得る(Stephen F. Altschul et al (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402)。例えば、選択されたダイズ配列(ダイズ(Glycine max)c.v.Williams82ゲノム由来)を分析した場合、かかる検索から同定された第1のBLAST(商標)ヒットは、双子葉配列、例えば、ダイズc.v.Williams82配列自体を示す。各選択されたダイズ配列についての第2のBLAST(商標)ヒットを同定し、このヒットのアラインメントカバー度(BLAST(商標)ヒットによってカバーされた選択されたダイズ配列のパーセントとして示される)を、ダイズなどの双子葉植物のゲノム内の選択されたダイズ配列の独自性の尺度として使用した。第2のBLAST(商標)ヒットについてのこれらのアラインメントカバー度値は、最小0%〜最大39.97%までの配列同一性の範囲であった。より高いレベルの配列同一性でアラインしたいずれの配列も、考慮しなかった。
用語「遺伝子領域の近位の位置に」は、非遺伝子配列に関して使用する場合、遺伝子領域に対する非遺伝子配列の相対的位置を規定する。具体的には、40Kb近隣以内(即ち、選択された最適なダイズゲノム遺伝子座配列のいずれかの末端の40Kb以内)の遺伝子領域の数が分析される。この分析を、Soybean Genome Databaseなどの単子葉ゲノムデータベースから抽出された、ダイズなどの既知の双子葉のゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置をアッセイすることによって、完了した。最適な非遺伝子ダイズゲノム遺伝子座の各々、例えば、7,018の最適な非遺伝子ダイズゲノム遺伝子座について、最適なゲノム遺伝子座配列の周囲の40Kbウインドウを規定し、このウインドウとオーバーラップする位置を有する注釈付きの遺伝子の数を計数した。遺伝子領域の数は、40Kb近隣以内に、最小1遺伝子〜最大18遺伝子までの範囲であった。
用語「既知のダイズコード配列」は、本明細書で使用する場合、オープンリーディングフレームを含み、適切な遺伝子調節エレメントの制御下に配置した場合に、イントロン配列のプロセシングの前または後のいずれかに、mRNAへと転写され、任意選択でタンパク質配列へと翻訳される、Soybean Genomic Database(www.soybase.org、Shoemaker, R.C. et al. SoyBase, the USDA-ARS soybean genetics and genomics database. Nucleic Acids Res. 2010 Jan;38(Database issue):D843-6.)を含む任意の双子葉ゲノムデータベースから同定された任意のポリヌクレオチド配列に関する。この既知のダイズコード配列は、cDNA配列またはゲノム配列であり得る。一部の例では、この既知のダイズコード配列は、機能的タンパク質として注釈が付けられ得る。他の例では、この既知のダイズコード配列は、注釈付きでなくてもよい。
用語「予測された双子葉コード配列」は、本明細書で使用する場合、Soybean Genomic Databaseなどの双子葉ゲノムデータベース中に記載される任意の発現配列タグ(EST)ポリヌクレオチド配列に関する。ESTは、逆転写酵素による第1鎖合成を指向するためにオリゴ(dT)プライマーを使用して構築されたcDNAライブラリーから同定される。得られたESTは、cDNA挿入物の5’末端または3’末端のいずれかから取得された500bp未満の単一パス配列決定読み取りである。複数のESTが、単一のコンティグへとアラインされ得る。同定されたEST配列は、Soybean Genomic Databaseなどの双子葉ゲノムデータベース中にアップロードされ、適切な遺伝子調節エレメントの制御下に配置した場合にmRNAへと転写され、任意選択でタンパク質配列へと翻訳されるコード配列を含む対応するゲノムポリヌクレオチド配列を予測するために、バイオインフォマティクス方法を介して検索され得る。
用語「予測されたダイズコード配列」は、本明細書で使用する場合、Soybean Genomic Databaseなどのダイズゲノムデータベース中に記載される任意の発現配列タグ(EST)ポリヌクレオチド配列に関する。ESTは、逆転写酵素による第1鎖合成を指向するためにオリゴ(dT)プライマーを使用して構築されたcDNAライブラリーから同定される。得られたESTは、cDNA挿入物の5’末端または3’末端のいずれかから取得された500bp未満の単一パス配列決定読み取りである。複数のESTが、単一のコンティグへとアラインされ得る。同定されたEST配列は、Soybean Genomic Databaseなどのダイズゲノムデータベース中にアップロードされ、適切な遺伝子調節エレメントの制御下に配置した場合にmRNAへと転写され、任意選択でタンパク質配列へと翻訳されるコード配列を含む対応するゲノムポリヌクレオチド配列を予測するために、バイオインフォマティクス方法を介して検索され得る。
用語「組換えの証拠」は、本明細書で使用する場合、選択されたダイズ配列を含む染色体領域にわたる、ダイズゲノムマーカーなどの双子葉ゲノムマーカーの任意の対の間での減数分裂組換え頻度に関する。この組換え頻度は、マーカー間の遺伝的距離(センチモルガン(cM))の、マーカー間の物理的距離(メガベース(Mb))に対する比率に基づいて計算された。組換えの証拠を有する選択されたダイズ配列について、この選択されたダイズ配列は、複数のマッピング集団から生成された高解像度マーカーデータセットを使用して検出されるように、選択されたダイズ配列に隣接する2つのマーカー間に少なくとも1つの組換え事象を含まなくてはならない。
本明細書で使用する場合、用語「相対的位置値」は、その対応する染色体セントロメアからのゲノム遺伝子座の距離を規定する、計算された値である。各選択されたダイズ配列について、それが位置する染色体のセントロメアまでの、選択されたダイズ配列のネイティブ位置からのゲノム距離は、(Bpで)測定される。染色体内の選択されたダイズ配列の相対的位置は、それが存在する特定の染色体アームの長さ(Bpで測定される)に対する、セントロメアまでのそのゲノム距離の比率として、表される。最適な非遺伝子ダイズゲノム遺伝子座についてのこれらの相対的位置値は、異なる双子葉植物について生成され得、ダイズデータセットについての相対的位置値は、最小0〜最大0.99682のゲノム距離の比率の範囲であった。
用語「外因性DNA配列」は、本明細書で使用する場合、そのネイティブ位置から取り出され、移動された核酸配列に隣接する配列を変更する新たな位置中に挿入された、任意の核酸配列である。例えば、外因性DNA配列は、別の種由来の配列を含み得る。
「結合」とは、高分子間(例えば、タンパク質と核酸との間)の配列特異的相互作用を指す。その相互作用が全体として配列特異的である限り、結合相互作用の全ての成分が配列特異的である必要はない(例えば、DNA骨格中のリン酸残基との接触)。かかる相互作用は、一般に、解離定数(Kd)によって特徴付けられる。「親和性」とは、結合の強度を指す:増加した結合親和性は、より低い結合定数(Kd)と相関する。
「結合タンパク質」は、別の分子に結合することができるタンパク質である。結合タンパク質は、例えば、DNA分子(DNA結合タンパク質)、RNA分子(RNA結合タンパク質)および/またはタンパク質分子(タンパク質結合タンパク質)に結合し得る。タンパク質結合タンパク質の場合、これは、(ホモダイマー、ホモトリマーなどを形成するために)それ自体に結合し得、および/または異なるタンパク質(単数もしくは複数)の1もしくは複数の分子に結合し得る。結合タンパク質は、1よりも多い型の結合活性を有し得る。例えば、ジンクフィンガータンパク質は、DNA結合活性、RNA結合活性およびタンパク質結合活性を有する。
本明細書で使用する場合、用語「ジンクフィンガー」は、その構造が亜鉛イオンの配位を介して安定化される、DNA結合タンパク質の結合ドメイン内のアミノ酸配列の領域を規定する。
「ジンクフィンガーDNA結合タンパク質」(または結合ドメイン)は、その構造が亜鉛イオンの配位を介して安定化される、結合ドメイン内のアミノ酸配列の領域である1または複数のジンクフィンガーを介して、配列特異的様式でDNAを結合する、タンパク質、またはより大きいタンパク質内のドメインである。用語、ジンクフィンガーDNA結合タンパク質は、ジンクフィンガータンパク質またはZFPと略される場合が多い。ジンクフィンガー結合ドメインは、所定のヌクレオチド配列に結合するように「操作され」得る。ジンクフィンガータンパク質を操作するための方法の非限定的な例は、設計および選択である。設計されたジンクフィンガータンパク質は、その設計/組成が合理的基準から主に生じる、天然に存在しないタンパク質である。設計のための合理的基準には、既存のZFPの設計および結合データの情報を保存するデータベース中の情報を処理するための置換ルールおよびコンピューターアルゴリズムの適用が含まれる。例えば、米国特許第6,140,081号;同第6,453,242号;同第6,534,261号および同第6,794,136号を参照のこと;WO98/53058;WO98/53059;WO98/53060;WO02/016536およびWO03/016496もまた参照のこと。
「TALE DNA結合ドメイン」または「TALE」は、1または複数のTALE反復ドメイン/単位を含むポリペプチドである。これらの反復ドメインは、その同族標的DNA配列へのTALEの結合に関与する。単一の「反復単位」(「反復」とも呼ばれる)は、典型的には、33〜35アミノ酸長であり、天然に存在するTALEタンパク質内の他のTALE反復配列と少なくとも幾分かの配列相同性を示す。例えば、その全体が参照により本明細書に組み込まれる米国特許出願公開第20110301073号を参照のこと。
CRISPR(クラスター化して規則的な配置の短い回文配列リピート)/Cas(CRISPR関連)ヌクレアーゼ系。簡潔に述べると、「CRISPR DNA結合ドメイン」は、ゲノムDNAを選択的に認識、結合および切断し得るCAS酵素と協調する短鎖RNA分子である。このCRISPR/Cas系は、ゲノム中の所望の標的において二本鎖破断(DSB)を創出するように操作され得、DSBの修復は、エラープローン修復における増加を引き起こす修復阻害剤の使用によって影響され得る。例えば、Jinek et al (2012) Science 337, p. 816-821, Jinek et al, (2013), eLife 2:e00471およびDavid Segal, (2013) eLife 2:e00563)を参照のこと。
ジンクフィンガー、CRISPRおよびTALE結合ドメインは、例えば、天然に存在するジンクフィンガーの認識らせん領域の操作(1または複数のアミノ酸を変更する)を介して、所定のヌクレオチド配列に結合するように「操作され」得る。同様に、TALEは、例えば、DNA結合に関与するアミノ酸(反復可変二残基またはRVD領域)の操作によって、所定のヌクレオチド配列に結合するように「操作され」得る。したがって、操作されたDNA結合タンパク質(ジンクフィンガーまたはTALE)は、天然に存在しないタンパク質である。DNA結合タンパク質を操作するための方法の非限定的な例は、設計および選択である。設計されたDNA結合タンパク質は、その設計/組成が合理的基準から主に生じる、天然に存在しないタンパク質である。設計のための合理的基準には、既存のZFPおよび/またはTALEの設計および結合データの情報を保存するデータベース中の情報を処理するための置換ルールおよびコンピューターアルゴリズムの適用が含まれる。例えば、米国特許第6,140,081号;同第6,453,242号;および同第6,534,261号を参照のこと;WO98/53058;WO98/53059;WO98/53060;WO02/016536およびWO03/016496ならびに米国特許出願公開第20110301073号、同第20110239315号および同第20119145940号もまた参照のこと。
「選択された」ジンクフィンガータンパク質、CRISPRまたはTALEは、その産生が、ファージディスプレイ、相互作用トラップまたはハイブリッド選択などの経験的プロセスから主に生じる、天然に見出されないタンパク質である。例えば、米国特許第5,789,538号;米国特許第5,925,523号;米国特許第6,007,988号;米国特許第6,013,453号;米国特許第6,200,759号;WO95/19431;WO96/06166;WO98/53057;WO98/54311;WO00/27878;WO01/60970;WO01/88197およびWO02/099084ならびに米国特許出願公開第20110301073号、同第20110239315号および同第20119145940号を参照のこと。
「組換え」とは、非相同末端結合(NHEJ)および相同組換えによるドナー捕捉が含まれるがこれに限定されない、2つのポリヌクレオチド間の遺伝情報の交換のプロセスを指す。本開示の目的のために、「相同組換え(HR)」とは、例えば、相同組換え修復機構を介した細胞中の二本鎖破断の修復の間に起こる、特定化された形態のかかる交換を指す。このプロセスは、ヌクレオチド配列の相同性を必要とし、「標的」分子(即ち、二本鎖破断を経たヌクレオチド配列)の鋳型修復のために「ドナー」分子を使用し、「非クロスオーバー遺伝子変換」または「ショートトラクト(short tract)遺伝子変換」として種々に公知であるが、それは、このプロセスが、ドナーから標的への遺伝情報の移入をもたらすからである。任意の特定の理論に束縛されることは望まないが、かかる移入には、中断された標的とドナーとの間で形成するヘテロ二重鎖DNAのミスマッチ補正、および/または標的の一部となる遺伝情報を再合成するためにドナーが使用される「合成依存的鎖アニーリング」、および/または関連プロセスが関与し得る。かかる特定化されたHRは、標的分子の配列の変更を生じる場合が多く、その結果、ドナーポリヌクレオチドの配列の一部または全てが、標的ポリヌクレオチド中に取り込まれる。HR指向性組込みについて、ドナー分子は、少なくとも50〜100塩基対長の、ゲノムに対する相同性の少なくとも2つの領域(「相同性アーム」)を含む。例えば、米国特許出願公開第20110281361号を参照のこと。
本開示の方法では、本明細書に記載される1または複数の標的化されたヌクレアーゼは、所定の部位において標的配列(例えば、細胞クロマチン)中に二本鎖破断を創出し、HR媒介性の組込みのための中断の領域中のヌクレオチド配列に対する相同性を有する、またはNHEJ媒介性の組込みのための中断の領域中のヌクレオチド配列に対する相同性を有さない「ドナー」ポリヌクレオチドが、細胞中に導入され得る。二本鎖破断の存在は、ドナー配列の組込みを促進することが示されている。このドナー配列は、物理的に組み込まれ得、またはあるいは、このドナーポリヌクレオチドは、相同組換えを介した中断の修復のための鋳型として使用され、細胞クロマチン中への、ドナー中のものと同様のヌクレオチド配列の全てまたは一部の導入を生じる。したがって、細胞クロマチン中の第1の配列が変更され得、特定の実施形態では、ドナーポリヌクレオチド中に存在する配列へと変換され得る。したがって、用語「置き換える」または「置き換え」の使用は、別のヌクレオチド配列による1つのヌクレオチド配列の置き換え(即ち、情報的意味での配列の置き換え)を示すと理解され得、別のポリヌクレオチドによる1つのポリヌクレオチドの物理的または化学的置き換えを必ずしも必要としない。
本明細書に記載される方法のいずれかにおいて、ジンクフィンガータンパク質、CRISPRSまたはTALENのさらなる対が、細胞内のさらなる標的部位のさらなる二本鎖切断のために使用され得る。
本明細書に記載される方法のいずれかが、目的の遺伝子の発現を破壊するドナー配列の標的化された組込みによる、細胞における任意のサイズのドナーの挿入、および/または1もしくは複数の標的配列の部分的もしくは完全な不活性化のために、使用され得る。部分的にまたは完全に不活性化された遺伝子を有する細胞株もまた提供される。
さらに、本明細書に記載される標的化された組込みの方法は、1または複数の外因性配列を組み込むためにも使用され得る。この外因性核酸配列は、例えば、1もしくは複数の遺伝子もしくはcDNA分子、または任意の型のコード配列もしくは非コード配列、ならびに1もしくは複数の制御エレメント(例えば、プロモーター)を含み得る。さらに、この外因性核酸配列(導入遺伝子)は、1または複数のRNA分子(例えば、小ヘアピンRNA(shRNA)、阻害RNA(RNAi)、microRNA(miRNA)など)またはタンパク質を産生し得る。
「切断」は、本明細書で使用する場合、DNA分子のリン酸−糖骨格の中断を規定する。切断は、ホスホジエステル結合の酵素的または化学的加水分解が含まれるがこれらに限定されない種々の方法によって開始され得る。一本鎖切断および二本鎖切断の両方が可能であり、二本鎖切断が、2つの別個の一本鎖切断事象の結果として生じ得る。DNA切断は、平滑末端または付着末端のいずれかの産生を生じ得る。特定の実施形態では、融合ポリペプチドが、標的化された二本鎖DNA切断のために使用される。「切断ドメイン」は、DNA切断のための触媒活性を有する1または複数のポリペプチド配列を含む。切断ドメインは、単一のポリペプチド鎖中に含まれ得、または切断活性は、2つ(またはそれ以上)のポリペプチドの会合から生じ得る。
「切断ハーフドメイン(half-domain)」は、第2のポリペプチド(同一または異なるのいずれか)と合わさって、切断活性(好ましくは二本鎖切断活性)を有する複合体を形成する、ポリペプチド配列である。用語「第1および第2の切断ハーフドメイン」;「+および−の切断ハーフドメイン」ならびに「右および左の切断ハーフドメイン」は、ダイマー化する切断ハーフドメインの対を指すために、相互交換可能に使用される。
「操作された切断ハーフドメイン」は、別の切断ハーフドメイン(例えば、別の操作された切断ハーフドメイン)との義務的ヘテロダイマーを形成するように改変された切断ハーフドメインである。それらの全体が参照によって本明細書に組み込まれる、米国特許出願公開第2005/0064474号、同第20070218528号、同第2008/0131962号および同第2011/0201055号もまた参照のこと。
「標的部位」または「標的配列」とは、結合が存在するのに十分な条件のときに、結合分子が結合する核酸の一部分を指す。
核酸は、DNAおよびRNAを含み、一本鎖または二本鎖であり得;線状、分岐鎖または環状であり得;任意の長さのものであり得る。核酸には、二重鎖を形成することが可能な核酸、ならびに三重鎖形成核酸が含まれる。例えば、米国特許第5,176,996号および同第5,422,251号を参照のこと。タンパク質には、DNA結合タンパク質、転写因子、クロマチンリモデリング因子、メチル化DNA結合タンパク質、ポリメラーゼ、メチラーゼ、デメチラーゼ、アセチラーゼ、デアセチラーゼ、キナーゼ、ホスファターゼ、インテグラーゼ、リコンビナーゼ、リガーゼ、トポイソメラーゼ、ジャイレースおよびヘリカーゼが含まれるがこれらに限定されない。
「外因性核酸の産物」には、ポリヌクレオチド産物およびポリペプチド産物の両方、例えば、転写産物(RNAなどのポリヌクレオチド)および翻訳産物(ポリペプチド)が含まれる。
「融合」分子は、2以上のサブユニット分子が例えば共有結合により連結された分子である。これらのサブユニット分子は、同じ化学的型の分子であり得、または異なる化学的型の分子であり得る。第1の型の融合分子の例には、融合タンパク質(例えば、ZFP DNA結合ドメインと切断ドメインとの間の融合物)および融合核酸(例えば、上記融合タンパク質をコードする核酸)が含まれるがこれらに限定されない。第2の型の融合分子の例には、三重鎖形成核酸とポリペプチドとの間の融合物、および副溝結合剤と核酸との間の融合物が含まれるがこれらに限定されない。細胞における融合タンパク質の発現は、細胞への融合タンパク質の送達から、または細胞への融合タンパク質をコードするポリヌクレオチドの送達によって生じ得、そこで、このポリヌクレオチドが転写され、転写物が翻訳されて、融合タンパク質を生成する。トランススプライシング、ポリペプチド切断およびポリペプチドライゲーションもまた、細胞におけるタンパク質の発現に関与し得る。細胞へのポリヌクレオチド送達およびポリペプチド送達のための方法は、本開示の他の場所に提示される。
本開示の目的のために、「遺伝子」は、遺伝子産物をコードするDNA領域(以下を参照のこと)、ならびにそのような調節配列がコード配列および/または転写された配列に隣接しているか否かまたは作動可能に連結されているか否かに関わらず、遺伝子産物の産生を調節する全てのDNA領域を含む。したがって、遺伝子には、プロモーター配列、ターミネーター、翻訳調節配列、例えば、リボソーム結合部位および内部リボソーム進入部位、エンハンサー、サイレンサー、インスレーター、境界エレメント、複製起点、マトリックス結合部位および遺伝子座制御領域が含まれるが、必ずしもこれらに限定されない。
「遺伝子発現」とは、遺伝子中に含まれる情報の、遺伝子産物への変換を指す。遺伝子産物は、遺伝子の直接的転写産物(例えば、mRNA、tRNA、rRNA、アンチセンスRNA、干渉RNA、リボザイム、構造的RNAもしくは任意の他の型のRNA)またはmRNAの翻訳によって産生されるタンパク質であり得る。遺伝子産物には、キャッピング、ポリアデニル化、メチル化および編集などのプロセスによって改変されたRNA、ならびに例えば、メチル化、アセチル化、リン酸化、ユビキチン化、ADP−リボシル化、ミリスチル化およびグリコシル化によって改変されたタンパク質もまた含まれる。
配列同一性:用語「配列同一性」または「同一性」とは、2つの核酸配列またはポリペプチド配列の文脈において本明細書で使用する場合、特定化された比較ウインドウにわたって最大の対応を求めてアラインさせた場合に同じである、2つの配列中の残基を指す。
本明細書で使用する場合、用語「配列同一性の百分率」とは、比較ウインドウにわたって2つの最適にアラインされた配列(例えば、核酸配列およびアミノ酸配列)を比較することによって決定される値を指し、ここで、比較ウインドウ中の配列の部分は、2つの配列の最適なアラインメントのために、参照配列(これは、付加も欠失も含まない)と比較して、付加または欠失(即ち、ギャップ)を含み得る。この百分率は、同一のヌクレオチドまたはアミノ酸残基が両方の配列中に存在する位置の数を決定して一致した位置の数を得、一致した位置の数を比較ウインドウ中の位置の総数によって除算し、その結果に100を乗算して配列同一性の百分率を得ることによって、計算される。
比較のために配列をアラインするための方法は、当該分野で周知である。種々のプログラムおよびアラインメントアルゴリズムが、例えば以下に記載されている:Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman and Wunsch (1970) J. Mol. Biol. 48:443; Pearson and Lipman (1988) Proc. Natl. Acad. Sci. U.S.A. 85:2444; Higgins and Sharp (1988) Gene 73:237-44; Higgins and Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50。配列アラインメント方法および相同性計算の詳細な考察は、例えば、Altschul et al. (1990) J. Mol. Biol. 215:403-10中に見出され得る。National Center for Biotechnology Information(NCBI)Basic Local Alignment Search Tool(BLAST(商標);Altschul et al. (1990))は、いくつかの配列分析プログラムと関連した使用のために、National Center for Biotechnology Information(Bethesda、MD)およびインターネット上を含むいくつかの供給源から入手可能である。このプログラムを使用して配列同一性を如何にして決定するかの記載は、BLAST(商標)について、「ヘルプ」セクションの下に、インターネット上で入手可能である。核酸配列の比較のために、BLAST(商標)(Blastn)プログラムの「Blast 2 sequences」関数が、デフォルトパラメーターを使用して用いられ得る。参照配列に対してさらに大きい類似性を有する核酸配列は、この方法によって評価した場合に、増加する百分率同一性を示す。
特異的にハイブリダイズ可能な/特異的に相補的な:本明細書で使用する場合、用語「特異的にハイブリダイズ可能な」および「特異的に相補的な」は、安定かつ特異的な結合が核酸分子と標的核酸分子との間で生じるような、十分な程度の相補性を示す用語である。2つの核酸分子間のハイブリダイゼーションには、2つの核酸分子の核酸配列間のアンチパラレルアラインメントの形成が関与する。次いで、これら2つの分子は、十分に安定な場合には当該分野で周知の方法を使用して検出可能である二重鎖分子を形成するために、反対の鎖上の対応する塩基と、水素結合を形成することができる。核酸分子は、特異的にハイブリダイズ可能であるために、その標的配列に対して100%相補的である必要はない。しかし、ハイブリダイゼーションが特異的であるために存在すべき配列相補性の量は、使用されるハイブリダイゼーション条件の関数である。
特定の程度のストリンジェンシーを生じるハイブリダイゼーション条件は、選択されたハイブリダイゼーション方法の性質ならびにハイブリダイズする核酸配列の組成および長さに依存して変動する。一般に、ハイブリダイゼーションの温度およびハイブリダイゼーション緩衝液のイオン強度(特に、Na+および/またはMg++濃度)は、ハイブリダイゼーションのストリンジェンシーを決定するが、洗浄回数もまた、ストリンジェンシーに影響する。特定の程度のストリンジェンシーを得るために必要とされるハイブリダイゼーション条件に関する計算は、当業者に公知であり、例えば、Sambrook et al. (ed.) Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, chapters 9 and 11;およびHames and Higgins (eds.) Nucleic Acid Hybridization, IRL Press, Oxford, 1985において議論されている。核酸のハイブリダイゼーションに関するさらに詳細な指導およびガイダンスは、例えば、Tijssen, “Overview of principles of hybridization and the strategy of nucleic acid probe assays,” in Laboratory Techniques in Biochemistry and Molecular Biology- Hybridization with Nucleic Acid Probes, Part I, Chapter 2, Elsevier, NY, 1993;およびAusubel et al., Eds., Current Protocols in Molecular Biology, Chapter 2, Greene Publishing and Wiley-Interscience, NY, 1995中に見出され得る。
本明細書で使用する場合、「ストリンジェントな条件」は、ハイブリダイゼーション分子と標的核酸分子内の配列との間の20%未満のミスマッチが存在する場合にのみハイブリダイゼーションが生じる条件を包含する。「ストリンジェントな条件」は、さらなる特定のレベルのストリンジェンシーを含む。したがって、本明細書で使用する場合、「中程度のストリンジェンシー」の条件は、20%よりも多い配列ミスマッチを有する分子がハイブリダイズしない条件である;「高いストリンジェンシー」の条件は、10%よりも多いミスマッチを有する配列がハイブリダイズしない条件である;「非常に高いストリンジェンシー」の条件は、5%よりも多いミスマッチを有する配列がハイブリダイズしない条件である。以下は、代表的な非限定的なハイブリダイゼーション条件である。
高いストリンジェンシーの条件(少なくとも90%の配列同一性を共有する配列を検出する):65℃で16時間の5×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中でのハイブリダイゼーション;室温で各々15分間の2×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中での2回の洗浄;ならびに65℃で各々20分間の0.5×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中での2回の洗浄。
中程度のストリンジェンシーの条件(少なくとも80%の配列同一性を共有する配列を検出する):65〜70℃で16〜20時間の5×〜6×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中でのハイブリダイゼーション;室温で各々5〜20分間の2×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中での2回の洗浄;ならびに55〜70℃で各々30分間の1×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中での2回の洗浄。
非ストリンジェントな対照条件(少なくとも50%の配列同一性を共有する配列がハイブリダイズする):室温〜55℃で16〜20時間の6×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中でのハイブリダイゼーション;室温〜55℃で各々20〜30分間の2×〜3×SSC緩衝液(ここで、このSSC緩衝液は、SDSなどの界面活性剤、およびサケ精子DNA、EDTAなどのさらなる試薬などを含む)中での少なくとも2回の洗浄。
本明細書で使用する場合、連続する核酸配列に関して、用語「実質的に相同な」または「実質的な相同性」とは、ストリンジェントな条件下で参照核酸配列とハイブリダイズする、連続するヌクレオチド配列を指す。例えば、参照核酸配列と実質的に相同である核酸配列は、ストリンジェントな条件(例えば、上に示された中程度のストリンジェンシーの条件)下で参照核酸配列とハイブリダイズする、核酸配列である。実質的に相同な配列は、少なくとも80%の配列同一性を有し得る。例えば、実質的に相同な配列は、約80%〜100%の配列同一性、例えば、約81%;約82%;約83%;約84%;約85%;約86%;約87%;約88%;約89%;約90%;約91%;約92%;約93%;約94%;約95%;約96%;約97%;約98%;約98.5%;約99%;約99.5%および約100%の配列同一性を有し得る。実質的な相同性の特性は、特異的ハイブリダイゼーションと密接に関連する。例えば、核酸分子は、特異的結合が望まれる条件下、例えば、ストリンジェントなハイブリダイゼーション条件下での非標的配列への核酸の非特異的結合を回避するために十分な程度の相補性が存在する場合、特異的にハイブリダイズ可能である。
一部の例では、「相同な」は、共通の先祖DNA配列からの系統による、第1の遺伝子と第2の遺伝子との関連性を指すために使用され得る。かかる場合には、用語ホモログは、種分化の事象によって分離された遺伝子間の関連性(オルソログを参照のこと)または遺伝子重複の事象によって分離された遺伝子間の関連性(パラログを参照のこと)を示す。他の例では、「相同な」は、1または複数のポリヌクレオチド配列間の配列同一性のレベルを指すために使用され得、かかる場合には、この1または複数のポリヌクレオチド配列は、共通の先祖DNA配列に必ずしも由来しない。当業者は、用語「相同な」の相互交換可能性を承知しており、この用語の適切な適用を理解している。
本明細書で使用する場合、用語「オルソログ」(または「オルソロガスな」)とは、共通の先祖ヌクレオチド配列から進化した、2以上の種において同じ機能を保持し得る、2以上の種における遺伝子を指す。
本明細書で使用する場合、用語「パラロガスな」とは、ゲノム内の重複によって関連する遺伝子を指す。オルソログは、進化の過程において同じ機能を保持するが、パラログは、新たな機能が元の遺伝子機能と無関係である場合であっても、それら新たな機能を進化させる。
本明細書で使用する場合、2つの核酸配列分子は、5’から3’方向で読み取られた配列の全てのヌクレオチドが、3’から5’方向で読み取られた場合の他の配列の全てのヌクレオチドと相補的である場合、「完全な相補性」を示すと言われる。参照ヌクレオチド配列と相補的なヌクレオチド配列は、参照ヌクレオチド配列の逆相補体配列と同一な配列を示す。これらの用語および記載は、当該分野で十分に定義されており、当業者に容易に理解される。
アミノ酸配列間の配列同一性の百分率を決定する場合、アラインメントによって提供される所与の位置におけるアミノ酸の同一性は、アラインされた配列を含むポリペプチドの所望の特性に影響を与えることなく異なり得ることが、当業者に周知である。これらの場合、パーセント配列同一性は、保存的に置換されたアミノ酸間の類似性を説明するために、調整され得る。これらの調整は、周知であり、当業者に一般に使用される。例えば、Myers and Miller (1988) Computer Applications in Biosciences 4:11-7を参照のこと。統計的方法は、当該分野で公知であり、同定された7,018の最適なゲノム遺伝子座の分析において使用され得る。
一実施形態として、7,018の個々の最適なゲノム遺伝子座配列を含む同定された最適なゲノム遺伝子座は、F分布検定を介して分析され得る。確率論および統計学では、F分布は、連続確率分布である。F分布検定は、F分布を有する統計的有意性検定であり、ベストフィットするモデルを同定するために、データセットにフィットされた統計モデルを比較する場合に使用される。F分布は、連続確率分布であり、SnedecorのF分布またはFisher−Snedecor分布としても公知である。F分布は、最も顕著には分散分析において、試験統計量の帰無分布として頻繁に生じる。F分布は、右の裾野が長い分布である。F分布は、0の最小値を有するが最大値は有さない、非対称分布である。この曲線は、0の右から遠くない場所でピークに達し、次いで、徐々に水平軸に近づくにつれ、F値は大きくなる。F分布は、水平軸に近づくが、決して触れることはない。他の実施形態では、この方程式に対するバリエーションまたは実際に異なる方程式が、当業者によって導出および使用され得、7,018の個々の最適なゲノム遺伝子座配列の分析のために適用可能であることが理解される。
作動可能に連結される:第1のヌクレオチド配列が第2のヌクレオチド配列と機能的関連性がある場合、第1のヌクレオチド配列は、第2のヌクレオチド配列と「作動可能に連結される」。例えば、プロモーターがコード配列の転写または発現に影響を与える場合、このプロモーターは、コード配列に作動可能に連結されている。組換え産生される場合、作動可能に連結されたヌクレオチド配列は、一般には連続しており、必要に応じて、2つのタンパク質コード領域を同じリーディングフレームで接続する。しかし、ヌクレオチド配列は、作動可能に連結されるように連続している必要はない。
用語「作動可能に連結される」は、調節配列およびコード配列に関して使用する場合、調節配列が、連結されたコード配列の発現に影響を与えることを意味する。「調節配列」、「調節エレメント」または「制御エレメント」とは、転写、RNAのプロセシングもしくは安定性、または関連するコード配列の翻訳のタイミングおよびレベル/量に影響を与える、ヌクレオチド配列を指す。調節配列には、プロモーター;翻訳リーダー配列;イントロン;エンハンサー;ステム−ループ構造;リプレッサー結合配列;終結配列;ポリアデニル化認識配列などが含まれ得る。特定の調節配列は、それに作動可能に連結されるコード配列の上流および/または下流に位置し得る。また、コード配列に作動可能に連結される特定の調節配列は、二本鎖核酸分子の関連する相補鎖上に位置し得る。
2以上のアミノ酸配列に関して使用する場合、用語「作動可能に連結される」は、第1のアミノ酸配列が、さらなるアミノ酸配列の少なくとも1つと機能的関連性があることを意味する。
開示された方法および組成物は、DNA結合ドメイン(例えば、ZFP)に作動可能に連結された切断ドメインを含む融合タンパク質を含み、このDNA結合ドメインは、ダイズの最適なゲノム遺伝子座中の配列への結合により、この配列の近傍に切断ドメインの活性を指向させ、したがって、最適なゲノム遺伝子座において二本鎖破断を誘導する。本開示の別の場所に示すように、ジンクフィンガードメインは、事実上任意の所望の配列に結合するように操作され得る。したがって、1または複数のDNA結合ドメインは、最適なゲノム遺伝子座中の1または複数の配列に結合するように操作され得る。細胞におけるDNA結合ドメインおよび切断ドメインを含む融合タンパク質の発現は、標的部位またはその近傍において、切断をもたらす。
実施形態
ダイズ植物などの双子葉植物のゲノム中の特定の位置に導入遺伝子および導入遺伝子スタックを標的化することは、トランスジェニック事象の品質を改善し、トランスジェニック事象の産生に関連する費用を低減させ、トランスジェニック植物製品を作製するための新たな方法、例えば逐次的遺伝子スタッキングを提供する。全体として、特定のゲノム部位への導入遺伝子の標的化は、商業的に有益である可能性が高い。大幅な進歩が、植物および他のゲノム中の予め選択された部位へのドナーポリヌクレオチドの付加を促進し得る、ZFN、CRISPRおよびTALENなどの部位特異的ヌクレアーゼの開発に向かって、ここ数年間になされてきた。しかし、標的化のために適切なゲノム部位の属性については、それほど知られていない。歴史的に、ゲノム中の非必須遺伝子および病原体(ウイルス)組込み部位が、標的化のための遺伝子座として使用されてきた。ゲノム中のかかる部位の数は、かなり限定的であり、したがって、ドナーポリヌクレオチド配列の標的化のために使用され得る最適なゲノム遺伝子座の同定および特徴付けが必要とされている。標的化に従順なことに加えて、最適なゲノム遺伝子座は、導入遺伝子発現および育種適用を支持し得る中立部位であると予測される。
本出願人らは、さらなる基準が、挿入部位について望ましいことを認識しており、外因性配列の挿入のために、ダイズゲノムなどの双子葉ゲノム中の最適な部位を同定および選択するためにこれらの基準を組み合わせている。標的化の目的のために、選択された挿入の部位は、独自であり、ダイズ植物などの双子葉植物のゲノムの非反復性領域中に存在する必要がある。同様に、挿入のための最適なゲノム部位は、最小の望ましくない表現型効果を有するべきであり、伝統的な育種技術を使用した農学的に精鋭の系統中への浸透性交雑を促進するために、組換え事象に対して感受性であるべきである。列挙した基準を満たすゲノム遺伝子座を同定するために、ダイズ植物のゲノムを、ポリヌクレオチドドナー配列の組込みおよび挿入されたコード配列の引き続く発現に有利な特徴を有する新規ゲノム遺伝子座を同定するために、カスタマイズされたバイオインフォマティクスアプローチおよびゲノム規模のデータセットを使用してスキャンした。
I.非遺伝子ダイズゲノム遺伝子座の同定
一実施形態によれば、外因性配列の挿入のために最適な非遺伝子ダイズゲノム配列を同定するための方法が提供される。この方法は、低メチル化された、少なくとも1Kb長のダイズゲノム配列を最初に同定するステップを含む。一実施形態では、この低メチル化されたゲノム配列は、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、10、11、12、13、14、15、16または17Kb長である。一実施形態では、この低メチル化されたゲノム配列は、約1〜約5.7Kb長であり、さらなる一実施形態では、約2Kb長である。配列は、その配列内に1%未満のDNAメチル化を有する場合、低メチル化されたとみなされる。一実施形態では、このメチル化状態は、正常な対照DNAサンプル内の対応するCpGジヌクレオチド、CHGまたはCHHトリヌクレオチドにおいて見出される総シトシンの量と比較した、選択されたダイズ配列内の1または複数のCpGジヌクレオチド、CHGまたはCHHトリヌクレオチドにおける5−メチルシトシンの存在に基づいて測定される。CHHメチル化は、グアニンでなくてもよい2つのヌクレオチドが後に続く5−メチルシトシンを示し、CHGメチル化とは、グアニンが後に続くアデニン、チミンまたはシトシン塩基に先行する5−メチルシトシンを指す。より具体的には、一実施形態では、この選択されたダイズ配列は、500ヌクレオチドの選択されたダイズ配列当たり、1未満、2未満または3未満のメチル化されたヌクレオチドを有する。一実施形態では、この選択されたダイズ配列は、500ヌクレオチドの選択されたダイズ配列当たり、CpGジヌクレオチドにおいて、1未満、2未満または3未満の5−メチルシトシンを有する。一実施形態では、この選択されたダイズ配列は、1〜4Kb長であり、5−メチルシトシンを欠く1Kb配列を含む。一実施形態では、この選択されたダイズ配列は、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5または6Kb長であり、その全長中に1または0のメチル化されたヌクレオチドを含む。一実施形態では、この選択されたダイズ配列は、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5または6Kb長であり、その全長内にCpGジヌクレオチドにおける5−メチルシトシンを含まない。一実施形態によれば、選択されたダイズ配列のメチル化は、供給源組織に基づいて変動し得る。かかる実施形態では、配列が低メチル化されているか否かを決定するために使用されるメチル化レベルは、2以上の組織から(例えば、根および苗条から)単離された配列中のメチル化の平均量を示す。
最適なゲノム部位が低メチル化されるべきという要求に加えて、選択されたダイズ配列はまた、非遺伝子でなければならない。したがって、全ての低メチル化されたゲノム配列は、遺伝子領域を含む低メチル化された配列を排除するために、さらにスクリーニングされる。これは、転写物がタンパク質をコードするか否かに関わらず、任意のオープンリーディングフレームを含む。オープンリーディングフレームの発現の調節に関与する任意の同定可能な隣接する5’および3’非コードヌクレオチド配列ならびに遺伝子領域中に存在し得る任意のイントロンを含む遺伝子領域を含む低メチル化されたゲノム配列は、本開示の最適な非遺伝子ダイズゲノム遺伝子座から排除される。
最適な非遺伝子ダイズゲノム遺伝子座はまた、組換えの証拠を実証した配列でなければならない。一実施形態では、この選択されたダイズ配列は、複数のマッピング集団から生成された高解像度マーカーデータセットを使用して検出されるように、選択されたダイズ配列に隣接する2つのマーカー間に少なくとも1つの組換え事象が検出されたダイズ配列でなければならない。一実施形態では、選択されたダイズ配列を含む、0.5、1、1.5Mbの双子葉ゲノム配列、例えばダイズゲノム配列に隣接するマーカーの対は、選択されたダイズ配列について組換え頻度を計算するために使用される。マーカーの各対の間での組換え頻度(マーカー間のゲノム物理的距離(Mb)に対するセンチモルガン(cM))で測定される)は、0.0157cM/Mbよりも大きくなければならない。一実施形態では、選択されたダイズ配列を含む1Mbのダイズゲノム配列についてのこの組換え頻度は、約0.01574cM/Mb〜約83.52cM/Mbの範囲である。一実施形態では、最適なゲノム遺伝子座は、組換え事象が選択されたダイズ配列内で検出されたゲノム遺伝子座である。
最適な非遺伝子ダイズゲノム遺伝子座はまた、標的化可能な配列、即ち、ダイズゲノム中の比較的独自の配列であり、その結果、選択されたダイズ配列に標的化された遺伝子は、ダイズゲノムの1つの位置のみにおいて挿入する。一実施形態では、最適なゲノム配列の全長は、ダイズゲノム中に含まれる類似の長さの別の配列と、30%未満、35%未満または40%未満の配列同一性を共有する。したがって、一実施形態では、この選択されたダイズ配列は、ダイズゲノム中に含まれる別の1Kb配列と、25%超、30%超、35%超または40%超の配列同一性を共有する1Kb配列を、含み得ない。さらなる一実施形態では、この選択されたダイズ配列は、ダイズゲノム中に含まれる別の500bp配列と、30%超、35%超または40%超の配列同一性を共有する500bp配列を、含み得ない。一実施形態では、この選択されたダイズ配列は、ダイズ植物などの双子葉植物のゲノム中に含まれる別の1Kb配列と、40%超の配列同一性を共有する1Kb配列を、含み得ない。
最適な非遺伝子ダイズゲノム遺伝子座はまた、遺伝子領域の近位である。より具体的には、選択されたダイズ配列は、遺伝子領域の近傍に位置しなければならない(例えば、遺伝子領域は、ネイティブゲノム中に見出されるような選択されたダイズのいずれかの末端と隣接し連続するゲノム配列の40Kb以内に位置しなければならない)。一実施形態では、遺伝子領域は、ネイティブダイズゲノム中に見出されるような選択されたダイズ配列のいずれかの末端に位置する連続するゲノム配列の10、20、30または40Kb以内に位置する。一実施形態では、2以上の遺伝子領域が、選択されたダイズ配列の2つの末端に隣接する連続するゲノム配列の10、20、30または40Kb以内に位置する。一実施形態では、1〜18の遺伝子領域が、選択されたダイズ配列の2つの末端に隣接する連続するゲノム配列の10、20、30または40Kb以内に位置する。一実施形態では、2以上の遺伝子領域が、選択されたダイズ配列を含む20、30または40Kbのゲノム配列内に位置する。一実施形態では、1〜18の遺伝子領域が、選択されたダイズ配列を含む40Kbのゲノム配列内に位置する。一実施形態では、選択されたダイズ配列に隣接する連続するゲノム配列の10、20、30または40Kb以内に位置する遺伝子領域は、ダイズ植物などの双子葉植物のゲノム中の既知の遺伝子を含む。
一実施形態によれば、改変された非遺伝子ダイズゲノム遺伝子座が提供され、この遺伝子座は、少なくとも1Kb長であり、非遺伝子であり、メチル化されたシトシン残基を含まず、ダイズゲノム遺伝子座を包含する1Mbのゲノム領域にわたって0.01574cM/Mbよりも高い組換え頻度を有し、ダイズゲノム遺伝子座の1Kb配列は、双子葉ゲノム中に含まれる任意の他の1Kb配列と40%未満の配列同一性を共有し、この非遺伝子ダイズゲノム遺伝子座は、非遺伝子ダイズゲノム遺伝子座中への目的のDNAの挿入によって改変される。
一実施形態によれば、例えばダイズゲノム遺伝子座を含む最適な非遺伝子双子葉ゲノム遺伝子座を同定するための方法が提供される。一部の実施形態では、この方法は、1Kbの最小長さを有し低メチル化された選択されたダイズ配列の第1のプールを創出するために双子葉ゲノムをスクリーニングするステップを最初に含み、任意選択で、このゲノム配列は、1%未満のメチル化を有し、任意選択で、このゲノム配列は、いずれのメチル化されたシトシン残基をも欠く。選択されたダイズ配列のこの第1のプールは、最適な非遺伝子ダイズゲノム遺伝子座についての要求を満たさない遺伝子座を排除するために、さらにスクリーニングされ得る。ダイズから取得されたものなどの、双子葉転写物をコードする双子葉ゲノム配列は、類似の長さの別の配列と、40%超またはそれより高い配列同一性を共有し、組換えの証拠を示さず、選択されたダイズ配列の40Kb以内に既知のオープンリーディングフレームを有さず、最適な非遺伝子ダイズ遺伝子座としての資格がある第2のプールの配列を残して、第1のプールの配列から排除される。一実施形態では、既知の双子葉遺伝子(即ち、ダイズ遺伝子)を有さない任意の選択されたダイズ配列、または前記非遺伝子配列の一方の末端の40Kb以内の、既知の双子葉遺伝子の2Kb上流および/もしくは1Kb下流の領域を含む配列は、第1のプールの配列から排除される。一実施形態では、選択されたダイズ配列の40Kb以内にタンパク質を発現する既知の遺伝子を含まない任意の選択されたダイズ配列は、排除される。一実施形態では、0.01574cM/Mbよりも大きい組換え頻度を有さない任意の選択されたダイズ配列は、排除される。
これらの選択基準を使用して、本出願人らは、最適な非遺伝子ダイズゲノム遺伝子座として機能する、ダイズなどの双子葉の選択された最適なゲノム遺伝子座を同定しており、それらの配列は、配列番号1〜配列番号7,018として開示される。本開示は、同定された最適な非遺伝子ダイズゲノム遺伝子座の天然のバリアントまたは改変された誘導体もまた包含し、このバリアントまたは誘導体遺伝子座は、配列番号1〜配列番号7,018のいずれかの配列とは、1、2、3、4、5、6、7、8、9または10ヌクレオチド異なる配列を含む。一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、配列番号1〜配列番号7,018から選択される配列、または配列番号1〜配列番号7,018から選択される配列と、90%、91%、92%、93%、94%、95%、96%、97%、98%もしくは99%の配列同一性を共有する配列、を含む。
別の一実施形態では、本開示に従う使用のための双子葉植物は、ダイズ植物、キャノーラ植物、ナタネ植物、アブラナ属(Brassica)植物、ワタ植物およびヒマワリ植物からなる群から選択される任意の植物を含む。使用され得る双子葉植物の例には、キャノーラ、ワタ、ジャガイモ、キノア、アマランス、ソバ、ベニバナ、ダイズ、サトウダイコン、ヒマワリ、キャノーラ、ナタネ、タバコ、シロイヌナズナ属(Arabidopsis)、アブラナ属(Brassica)およびワタが含まれるがこれらに限定されない。
別の一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、ダイズ植物から選択される配列を含む。さらなる一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、ダイズ(Glycine max)近交系から選択される配列を含む。したがって、ダイズ(Glycine max)近交系は、その農学的に精鋭の変種を含む。引き続く一実施形態では、本開示に従う使用のための最適な非遺伝子ダイズゲノム遺伝子座は、形質転換可能なダイズ系統から選択される配列を含む。一実施形態では、代表的な形質転換可能なダイズ系統には、以下が含まれる;Maverick、Williams82、Merrill JackPeking、Suzuyutaka、Fayette、Enrei、Mikawashima、WaseMidori、Jack、Leculus、Morocco、Serena、Maple prest、Thorne、Bert、Jungery、A3237、Williams、Williams79、AC Colibri、Hefeng 25、Dongnong 42、Hienong 37、Jilin 39、Jiyu 58、A3237、Kentucky Wonder、Minidokaおよびそれらの誘導体。当業者は、系統発生学的分岐の結果として、種々の型のダイズ系統が、同一のゲノムDNA配列を含まないこと、および多型または対立遺伝子バリエーションが、ゲノム配列内に存在し得ることを理解する。一実施形態では、本開示は、同定された最適な非遺伝子ダイズゲノム遺伝子座のかかる多型または対立遺伝子バリエーションを包含し、これらの多型または対立遺伝子バリエーションは、配列番号1〜配列番号7,018を有するいずれかの配列とは、1、2、3、4、5、6、7、8、9または10ヌクレオチド異なる配列を含む。さらなる一実施形態では、本開示は、同定された最適な非遺伝子ダイズゲノム遺伝子座のかかる多型または対立遺伝子バリエーションを包含し、これらの多型または対立遺伝子バリエーションを含む配列は、配列番号1〜配列番号7,018のいずれかの配列と、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%の配列同一性を共有する。
7,018の個々の配列を含む同定された最適なゲノム遺伝子座は、多変量分析方法を使用したさらなる分析によって、種々の下位群にカテゴリー分けされ得る。任意の多変量分析の統計プログラムの適用が、変数のセットの潜在的構造(次元)を見出すために使用される。いくつかの異なる型の多変量アルゴリズムが使用され得、例えば、データセットは、重回帰分析、ロジスティック回帰分析、判別分析、多変量分散分析(MANOVA)、因子分析(共通因子分析および主成分分析の両方を含む)、クラスター分析、多次元尺度構成法、対応分析、コンジョイント分析、正準分析、正準相関および構造方程式モデリングを使用して分析され得る。
一実施形態によれば、最適な非遺伝子ダイズゲノム遺伝子座は、主成分分析(PCA)などの多変量データ分析を使用して、さらに分析される。本明細書では、簡潔な説明のみが与えられ、より多くの情報は、H. Martens, T. Naes, Multivariate Calibration, Wiley, N.Y., 1989において見出され得る。PCAは、データの根底にある次元性(潜在的変数)を評価し、そのデータにおける支配的なパターンおよび主要な傾向の概要を与える。一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、主成分分析(PCA)統計方法を介してクラスターへとソートされ得る。PCAは、主成分と呼ばれる線状に無相関な変数の値のセットへと、おそらく相関する変数の観察のセットを変換するために、直交変形を使用する数学的手順である。主成分の数は、元の変数の数よりも少ないかまたは等しい。この変形は、第1の主成分が最も大きい可能な分散を有し(即ち、可能な限り多くの、データにおける変動性を説明する)、各後続成分が次に、先行する成分に対して直交する(即ち、先行する成分と無相関である)という制約の下で可能な最も高い分散を有するような方法で、規定される。主成分は、データセットが合同で正規分布する場合、独立であることが保証される。PCAは、元の変数の相対的スケーリングに対して感受性である。実体の特徴に基づいて実体のセットをクラスター化するためのPCAの使用の例には、以下が含まれる;Ciampitti, I. et al., (2012) Crop Science, 52(6); 2728-2742, Chemometrics: A Practical Guide, Kenneth R. Beebe, Randy J. Pell, and Mary Beth Seasholtz, Wiley-Interscience, 1 edition, 1998、米国特許第8,385,662号および欧州特許第2,340,975号。
一実施形態によれば、主成分分析(PCA)を、各同定された最適なダイズゲノム遺伝子座について、以下の10の特徴を使用して、7,018の最適なダイズゲノム遺伝子座に対して実施した:
1.最適なダイズゲノム遺伝子座(OGL)の周囲の低メチル化された領域の長さ
a.ダイズ(Glycine Max)cultivar Williams82などの双子葉植物から単離された根組織および苗条組織のDNAメチル化プロファイルを、ハイスループット全ゲノム配列決定アプローチを使用して構築した。抽出されたDNAを、メチル化されていないシトシンをウラシルに変換するが、メチル化されたシトシンには影響を与えないバイサルファイト処理に供し、次いで、Illumina HiSeqテクノロジーを使用して配列決定した(Krueger, F. et al. DNA methylome analysis using short bisulfite sequencing data. Nature Methods 9, 145-151 (2012))。生配列決定読み取りを、Bismark(商標)マッピングソフトウェア(Krueger F, Andrews SR (2011) Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. (Bioinformatics 27: 1571-1572)に記載されるとおり)を使用して、双子葉参照配列、例えば、ダイズ(Glycine max)参照配列に対してマッピングした。OGLの各々の周囲の低メチル化された領域の長さを、記載されたメチル化プロファイルを使用して計算した。
2.OGLの周囲の1MB領域における組換えの比率
a.各OGLについて、1Mbウインドウ内のOGLのいずれかの側上のマーカーの対を、同定した。染色体にわたるマーカーの各対の間での組換え頻度を、マーカー間の遺伝的距離(センチモルガン(cM))の、マーカー間のゲノム物理的距離(Mb)に対する比率に基づいて計算した。
3.OGLの配列独自性のレベル
a.各OGLについて、OGLのヌクレオチド配列を、BLASTベースの相同性検索を使用して、双子葉植物のゲノム、例えば、ダイズc.v.Williams82ゲノムに対してスキャンした。これらのOGL配列は、双子葉植物のゲノム、例えば、ダイズc.v.Williams82ゲノムから同定されるので、この検索を介して同定された第1のBLASTヒットは、OGL配列自体を示す。各OGLについての第2のBLASTヒットを同定し、このヒットのアラインメントカバー度を、ダイズゲノムなどの双子葉ゲノム内のOGL配列の独自性の尺度として使用した。
4.その近隣における最も近い遺伝子までのOGLからの距離
a.双子葉ゲノム、例えば、ダイズc.v.Williams82ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、公知の双子葉ゲノムデータベース、例えば、Soybean Genome Database(www.soybase.org)から抽出した。各OGLについて、その上流近隣または下流近隣における最も近い注釈付きの遺伝子を同定し、OGL配列とこの遺伝子との間の距離を(bpで)測定した。
5.OGL近隣におけるGC%
a.各OGLについて、ヌクレオチド配列を分析して、存在するグアニン塩基およびシトシン塩基の数を推定した。この計数を、各OGLの配列長の百分率として示し、GC%についての尺度を提供する。
6.OGLの周囲の40Kb近隣中の遺伝子の数
a.双子葉ゲノム、例えば、ダイズc.v.Williams82ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、公知の双子葉ゲノムデータベース、例えば、Soybean Genome Database(www.soybase.org)から抽出した。各OGLについて、OGLの周囲の40Kbウインドウを規定し、このウインドウとオーバーラップする位置を有する注釈付きの遺伝子の数を計数した。
7.OGLの周囲の40Kb近隣における平均遺伝子発現。
a.ダイズ遺伝子などの双子葉遺伝子の転写物レベルでの発現を、RNAseqテクノロジーを使用して、双子葉植物組織、例えば、ダイズc.v.Williams82の根組織および苗条組織から生成したトランスクリプトームプロファイリングデータを分析することによって測定した。各OGLについて、OGLの周囲の40Kb近隣中に存在する双子葉ゲノム、ダイズc.v.Williams82ゲノム内の注釈付きの遺伝子を、同定した。ウインドウ中の遺伝子の各々についての発現レベルを、トランスクリプトームプロファイルから抽出し、平均遺伝子発現レベルを計算した。
8.OGLの周囲のヌクレオソーム占有率のレベル
a.特定のヌクレオチド配列についてヌクレオソーム占有率のレベルを識別することで、染色体機能および配列のゲノム情況についての情報が提供される。NuPoP(商標)統計パッケージは、任意のサイズのゲノム配列についてのヌクレオソーム占有率および最も確からしいヌクレオソームポジショニングマップを予測するためのユーザーフレンドリーなソフトウェアツールを提供する(Xi, L., Fondufe-Mittendor, Y., Xia, L., Flatow, J., Widom, J. and Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-346)。各OGLについて、ヌクレオチド配列を、NuPoP(商標)ソフトウェアに供し、ヌクレオソーム占有率スコアを計算した。
9.染色体内の相対的位置(セントロメアの近位)
a.ダイズ染色体などの双子葉染色体の各々におけるセントロメアの位置、および染色体アームの長さに関する情報を、双子葉ゲノムデータベース、例えば、Soybean Genome Database(www.soybase.org)から抽出した。各OGLについて、OGL配列からそれが位置する染色体のセントロメアまでのゲノム距離が(bpで)測定される。染色体内のOGLの相対的位置は、それが存在する特定の染色体アームの長さに対する、セントロメアまでのそのゲノム距離の比率として示される。
10.OGLの周囲の1Mb領域中のOGLの数
a.各OGLについて、OGL位置の周囲の1Mbゲノムウインドウが規定され、そのゲノム位置がこのウインドウとオーバーラップする、双子葉1Kb OGLデータセット中のOGLの数が、集計される。
各最適な非遺伝子ダイズゲノム遺伝子座の特徴および属性のスコアについての結果または値は、実施例2の表3にさらに記載される。得られたデータセットを、PCA統計方法において使用して、7,018の同定された最適な非遺伝子ダイズゲノム遺伝子座をクラスターへとクラスター化した。クラスター化プロセスの間に、最適なゲノム遺伝子座の「p」個の主成分の推定後に、32のクラスターのうちの1つへの最適なゲノム遺伝子座の割り当てが、「p」次元ユークリッド空間において進行した。「p」個の軸の各々を、「k」個の区間に分割した。同じ区間に割り当てられた最適なゲノム遺伝子座を、クラスターを形成するように一緒にグループ分けした。この分析を使用して、各PCA軸を、2つの区間に分割し、これを、実験的検証に必要とされるクラスターの数に関する先験的情報に基づいて選択した。得られたクラスターの全ての分析および可視化を、Chemical Computing Group Inc.(Montreal、Quebec、Canada)のMolecular Operating Environment(商標)(MOE)ソフトウェアを用いて実施した。このPCAアプローチを使用して、上記、それらの特徴値に基づいて、32の別個のクラスターへと7,018の最適なダイズゲノム遺伝子座のセットをクラスター化した。
このPCAプロセスの間に、5つの主成分(PC)が生成され、上位3つのPCは、データセット中の総変動の約90%を含む(表4)。これら3つのPCを使用して、三次元プロット中に32のクラスターをグラフ的に表示した(図1を参照のこと)。クラスター化プロセスを完了した後、1つの代表的な最適なゲノム遺伝子座を、各クラスターから選択した。これを、計算的方法によって、そのクラスターの重心に最も近かった、各クラスター内の選択された最適なゲノム遺伝子座を選択することによって、実施した(表4)。32の代表的な最適なゲノム遺伝子座の染色体位置は、図2に示すように、ダイズ染色体の中に均一に分布している。
一実施形態では、実施例2の表6に記載される任意のクラスターから選択される、単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列が提供される。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター1から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター2から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター3から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター4から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター5から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター6から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター7から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター8から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター9から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター10から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター11から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター12から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター13から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター14から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター15から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター16から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター17から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター18から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター19から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター20から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター21から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター22から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター23から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター24から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター25から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター26から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター27から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター28から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター29から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター30から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター31から選択されるゲノム配列である。一実施形態では、この単離または精製された最適な非遺伝子ダイズゲノム遺伝子座配列は、クラスター32から選択されるゲノム配列である。
一実施形態によれば、改変された最適な非遺伝子ダイズゲノム遺伝子座が提供され、この最適な非遺伝子ダイズゲノム遺伝子座は、改変されており、1または複数のヌクレオチド置換、欠失または挿入を含む。一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、ゲノム遺伝子座配列のさらなるヌクレオチド重複、欠失または逆位が任意選択で付随する、目的のDNAの挿入によって改変される。
一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、実施例2の表6に記載される任意のクラスターから選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター2から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター3から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター4から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター5から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター6から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター7から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター8から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター9から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター10から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター11から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター12から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター13から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター14から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター15から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター16から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター17から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター18から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター19から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター20から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター21から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター22から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター23から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター24から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター25から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター26から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター27から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター28から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター29から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター30から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター31から選択されるゲノム配列である。一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター32から選択されるゲノム配列である。
さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30または31から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28または29から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27または28から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26または27から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25または26から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23または24から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22または23から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21または22から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20または21から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18または19から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17または18から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16または17から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15または16から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14または15から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13または14から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12または13から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11または12から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10または11から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9または10から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8または9から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7または8から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6または7から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5または6から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4または5から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3または4から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2または3から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1または2から選択されるゲノム配列である。
さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30または32から選択されるゲノム配列である。
さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または32から選択されるゲノム配列である。
さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28または32から選択されるゲノム配列である。
さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26または27から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、9、10、11、12、18、19、20、21、22、23、24、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、15、16、17、18、25、26、27、28、29、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、21、22、23、24、30、31または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター2、4、6、8、10、12、14、16、18、20、22、24、26、28、30または32から選択されるゲノム配列である。さらなる一実施形態では、改変される最適な非遺伝子ダイズゲノム遺伝子座は、クラスター1、3、5、7、9、11、13、15、17、19、21、23、25、27、29または31から選択されるゲノム配列である。
一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、soy_ogl_2474(配列番号1)、soy_ogl_768(配列番号506)、soy_ogl_2063(配列番号2063)、soy_ogl_1906(配列番号1029)、soy_ogl_1112(配列番号1112)、soy_ogl_3574(配列番号1452)、soy_ogl_2581(配列番号1662)、soy_ogl_3481(配列番号1869)、soy_ogl_1016(配列番号2071)、soy_ogl_937(配列番号2481)、soy_ogl_6684(配列番号2614)、soy_ogl_6801(配列番号2874)、soy_ogl_6636(配列番号2970)、soy_ogl_4665(配列番号3508)、soy_ogl_3399(配列番号3676)、soy_ogl_4222(配列番号3993)、soy_ogl_2543(配列番号4050)、soy_ogl_275(配列番号4106)、soy_ogl_598(配列番号4496)、soy_ogl_1894(配列番号4622)、soy_ogl_5454(配列番号4875)、soy_ogl_6838(配列番号4888)、soy_ogl_4779(配列番号5063)、soy_ogl_3333(配列番号5122)、soy_ogl_2546(配列番号5520)、soy_ogl_796(配列番号5687)、soy_ogl_873(配列番号6087)、soy_ogl_5475(配列番号6321)、soy_ogl_2115(配列番号6520)、soy_ogl_2518(配列番号6574)、soy_ogl_5551(配列番号6775)およびsoy_ogl_4563(配列番号6859)のゲノム配列から選択される。
一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、soy_ogl_308(配列番号43)、soy_ogl_307(配列番号566)、soy_ogl_2063(配列番号748)、soy_ogl_1906(配列番号1029)、soy_ogl_262(配列番号1376)、soy_ogl_5227(配列番号1461)、soy_ogl_4074(配列番号1867)、soy_ogl_3481(配列番号1869)、soy_ogl_1016(配列番号2071)、soy_ogl_937(配列番号2481)、soy_ogl_5109(配列番号2639)、soy_ogl_6801(配列番号2874)、soy_ogl_6636(配列番号2970)、soy_ogl_4665(配列番号3508)、soy_ogl_6189(配列番号3682)、soy_ogl_4222(配列番号3993)、soy_ogl_2543(配列番号4050)、soy_ogl_310(配列番号4326)、soy_ogl_2353(配列番号4593)、soy_ogl_1894(配列番号4622)、soy_ogl_3669(配列番号4879)、soy_ogl_3218(配列番号4932)、soy_ogl_5689(配列番号5102)、soy_ogl_3333(配列番号5122)、soy_ogl_2546(配列番号5520)、soy_ogl_1208(配列番号5698)、soy_ogl_873(配列番号6087)、soy_ogl_5957(配列番号6515)、soy_ogl_4846(配列番号6571)、soy_ogl_3818(配列番号6586)、soy_ogl_5551(配列番号6775)、soy_ogl_7(配列番号6935)、soy_OGL_684(配列番号47)、soy_OGL_682(配列番号2101)、soy_OGL_685(配列番号48)、soy_OGL_1423(配列番号639)、soy_OGL_1434(配列番号137)、soy_OGL_4625(配列番号76)およびsoy_OGL_6362(配列番号440)のゲノム配列から選択される。
一実施形態では、この最適な非遺伝子ダイズゲノム遺伝子座は、目的のDNAで標的化され、目的のDNAは、ジンクフィンガーヌクレアーゼ標的部位内またはその近位で組み込まれる。一実施形態によれば、最適なトウモロコシの選択されたゲノム遺伝子座の例示的なジンクフィンガー標的部位は、表8に提供される。一実施形態によれば、目的のDNAの組込みは、以下の例示的な標的部位内またはその近位で生じる:配列番号7363および配列番号7364、配列番号7365および配列番号7366、配列番号7367および配列番号7368、配列番号7369および配列番号7370、配列番号7371および配列番号7372、配列番号7373および配列番号7374、配列番号7375および配列番号7376、配列番号7377および配列番号7378、配列番号7379および配列番号7380、配列番号7381および配列番号7382、配列番号7383および配列番号7384、配列番号7385および配列番号7386、配列番号7387および配列番号7388、配列番号7389および配列番号7390、配列番号7391および配列番号7392、配列番号7393および配列番号7394、配列番号7395および配列番号7396、配列番号7397および配列番号7398、配列番号7399および配列番号7400、配列番号7401および配列番号7402、配列番号7403および配列番号7404、配列番号7405および配列番号7406、配列番号7407および配列番号7408、配列番号7409および配列番号7410、配列番号7411および配列番号7412、配列番号7413および配列番号7414、配列番号7415および配列番号7416、配列番号7417および配列番号7418、配列番号7419および配列番号7420、配列番号7421および配列番号7422、配列番号7423および配列番号7424、配列番号7425および配列番号7426。
一実施形態によれば、このジンクフィンガーヌクレアーゼは、ジンクフィンガー標的部位に結合し、独自のダイズゲノムポリヌクレオチド標的部位を切断し、目的のDNAは、ダイズゲノムポリヌクレオチド標的部位内またはその近位に組み込まれる。一実施形態では、ジンクフィンガー標的部位内の目的のDNAの組込みは、再編成によって生じ得る。一実施形態によれば、これらの再編成は、欠失、挿入、逆位および反復を含み得る。一実施形態では、目的のDNAの組込みは、ジンクフィンガー標的部位の近位で生じる。この実施形態の一態様によれば、DNAの組込みは、ジンクフィンガー標的部位の近位であり、ジンクフィンガー標的部位に対して2Kb、1.75Kb、1.5Kb、1.25Kb、1.0Kb、0.75Kb、0.5Kbまたは0.25Kb以内に組み込まれ得る。ジンクフィンガー標的部位の近位のゲノム領域内の挿入は、当該分野で公知であり、米国特許出願公開第2010/0257638A1(その全体が参照により本明細書に組み込まれる)を参照のこと。
一実施形態によれば、この選択された非遺伝子配列は、以下の特徴を含む:
a)この非遺伝子配列は、配列内に1%よりも多いDNAメチル化を含まない;
b)この非遺伝子配列は、ダイズ染色体セントロメアから0.211〜0.976のゲノム距離の比率の相対的位置値を有する;
c)この非遺伝子配列は、25.62〜43.76%のグアニン/シトシンパーセント含量範囲を有する;および
d)この非遺伝子配列は、約1Kb長〜約4.4Kb長である。
II.同定された最適な非遺伝子ダイズゲノム遺伝子座の組換え誘導体
一実施形態によれば、ポリヌクレオチドドナー配列を挿入するための高度に望ましい位置として、ダイズ植物などの双子葉植物のゲノム遺伝子座を同定した後で、1または複数の目的の核酸が、同定されたゲノム遺伝子座中に挿入され得る。一実施形態では、この目的の核酸は、外因性遺伝子配列または他の望ましいポリヌクレオチドドナー配列を含む。別の一実施形態では、ポリヌクレオチドドナー配列を挿入するための高度に望ましい位置として、ダイズ植物などの双子葉植物のゲノム遺伝子座を同定した後で、最適な非遺伝子ダイズゲノム遺伝子座の1または複数の目的の核酸が、任意選択で、同定されたゲノム遺伝子座中への目的のDNAの引き続く組込みと共に、欠失、切除または除去され得る。一実施形態では、最適な非遺伝子ダイズゲノム遺伝子座中への目的の核酸の挿入は、外因性遺伝子配列または他の望ましいポリヌクレオチドドナー配列の除去、欠失または切除を含む。
本開示は、ZFNおよびポリヌクレオチドドナー構築物を使用した、選択されたダイズゲノム遺伝子座中への標的化された組込みのための方法および組成物にさらに関する。最適な非遺伝子ダイズゲノム遺伝子座中に目的の核酸配列を挿入するための方法は、特記しない限り、分子生物学、生化学、クロマチン構造および分析、細胞培養、組換えDNAならびに当業者の技術範囲内の関連の分野における従来の技術を使用する。これらの技術は、文献中に完全に説明されている。例えば、Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolfe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P. M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999;およびMETHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P. B. Becker, ed.) Humana Press, Totowa, 1999を参照のこと。
ダイズゲノム中への核酸挿入のための方法
宿主細胞中にDNA構築物としてポリヌクレオチドドナー配列およびヌクレアーゼ配列を導入するための周知の手順のいずれかが、本開示に従って使用され得る。これらには、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、PEG、エレクトロポレーション、超音波的方法(例えば、ソノポレーション)、リポソーム、マイクロインジェクション、ネイキッドDNA、プラスミドベクター、ウイルスベクター、エピソームおよび組込みの両方、ならびにクローニングされたゲノムDNA、cDNA、合成DNAまたは他の外来遺伝子材料を宿主細胞中に導入するための他の周知の方法のいずれかの使用が含まれる(例えば、Sambrook et al.、上記を参照のこと)。使用される特定の核酸挿入手順は、選択されたタンパク質を発現することが可能な宿主細胞中に少なくとも1つの遺伝子を首尾よく導入することが可能であることだけが必要である。
上述のように、DNA構築物は、種々の従来の技術によって、所望の植物種のゲノム中に導入され得る。かかる技術の総説については、例えば、Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463;およびGrierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9を参照のこと。DNA構築物は、植物細胞プロトプラスのエレクトロポレーションおよびマイクロインジェクションなどの技術を使用して、シリコンカーバイド繊維による撹拌によって(例えば、米国特許第5,302,523号および同第5,464,765号を参照のこと)、植物細胞のゲノムDNA中に直接導入され得、またはDNA構築物は、DNA粒子衝突(particle bombardment)などのバイオリスティクス(biolistic)方法を使用して、植物組織に直接導入され得る(例えば、Klein et al. (1987) Nature 327:70-73を参照のこと)。あるいは、DNA構築物は、ナノ粒子形質転換を介して植物細胞中に導入され得る(例えば、その全体が参照により本明細書に組み込まれる米国特許出願公開第20090104700号を参照のこと)。あるいは、DNA構築物は、適切なT−DNA境界/隣接領域と組み合わされ得、従来のアグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)宿主ベクター中に導入され得る。バイナリーベクターの安全化および使用を含む、アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)媒介性の形質転換技術は、科学文献中に十分に記載されている。例えば、Horsch et al. (1984) Science 233:496-498およびFraley et al. (1983) Proc. Nat'l. Acad. Sci. USA 80:4803を参照のこと。
さらに、遺伝子移入は、非アグロバクテリウム属(Agrobacterium)細菌またはウイルス、例えば、根粒菌属(Rhizobium)種NGR234、アルファルファ根粒菌(Sinorhizobium meliloti)、メソリゾビウム・ロティ(Mesorhizobium loti)、ジャガイモウイルスX、カリフラワーモザイクウイルスおよびキャッサバ葉脈モザイクウイルスおよび/またはタバコモザイクウイルスを使用して達成され得る。例えば、Chung et al. (2006) Trends Plant Sci. 11(1):1-4を参照のこと。アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)宿主の病原性機能は、バイナリーT DNAベクター(Bevan (1984) Nuc. Acid Res. 12:8711-8721)または共存培養手順(Horsch et al. (1985) Science 227:1229-1231)を使用して細胞に細菌を感染させる場合、植物細胞DNA中への、この構築物および隣接するマーカーを含むT鎖の挿入を指向させる。一般に、アグロバクテリウム属(Agrobacterium)形質転換系は、双子葉類植物を操作するために使用される(Bevan et al. (1982) Ann. Rev. Genet. 16:357-384; Rogers et al. (1986) Methods Enzymol. 118:627-641)。アグロバクテリウム属(Agrobacterium)形質転換系は、単子葉類植物および植物細胞を形質転換するため、ならびに単子葉類植物および植物細胞にDNAを移入させるためにも使用され得る。米国特許第5,591,616号;Hernalsteen et al. (1984) EMBO J. 3:3039-3041; Hooykass-Van Slogteren et al. (1984) Nature 311:763-764; Grimsley et al. (1987) Nature 325:1677-179; Boulton et al. (1989) Plant Mol. Biol. 12:31-40;およびGould et al. (1991) Plant Physiol. 95:426-434を参照のこと。
代替的な遺伝子移入および形質転換の方法には、ネイキッドDNAのカルシウム媒介性、ポリエチレングリコール(PEG)媒介性またはエレクトロポレーション媒介性の取り込みを介したプロトプラスト形質転換(Paszkowski et al. (1984) EMBO J. 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82:5824-5828; およびShimamoto (1989) Nature 338:274-276を参照のこと)および植物組織のエレクトロポレーション(D'Halluin et al. (1992) Plant Cell 4:1495-1505)が含まれるがこれらに限定されない。植物細胞形質転換のためのさらなる方法には、マイクロインジェクション、シリコンカーバイド媒介性のDNA取り込み(Kaeppler et al. (1990) Plant Cell Reporter 9:415-418)および微粒子銃(microprojectile bombardment)(Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85:4305-4309;およびGordon-Kamm et al. (1990) Plant Cell 2:603-618を参照のこと)が含まれる。
一実施形態では、ゲノム中への標的化された挿入のために宿主細胞中に導入される目的の核酸は、標的化された目的の核酸の一方または両方の末端上に相同な隣接配列を含む。かかる一実施形態では、この相同な隣接配列は、この相同な隣接配列とそれが相同性を有するゲノム配列との間の相同組換えを支持するために、ダイズ由来のゲノム配列などの双子葉ゲノム配列に対して十分なレベルの配列同一性を含む。ドナーとゲノム配列との間での、およそ25、50、100、200、500、750、1000、1500もしくは2000ヌクレオチドまたはそれ超の、70%〜100%の範囲の配列同一性(または10ヌクレオチドと200ヌクレオチドとの間の任意の整数値、もしくはそれ超)が、それらの間での相同組換えを支持する。
別の一実施形態では、この標的化された目的の核酸は、相同な隣接配列を欠き、この標的化された目的の核酸は、ゲノム配列と、低い〜非常に低いレベルの配列同一性を共有する。
細胞クロマチン中の目的の領域中の配列の標的化された組換えおよび/または置き換えおよび/または変更の他の実施形態では、染色体配列は、外因性「ドナー」ヌクレオチド配列との相同組換えによって変更される。かかる相同組換えは、中断の領域と相同な配列が存在する場合、細胞クロマチン中の二本鎖破断の存在によって刺激される。細胞クロマチン中の二本鎖破断は、非相同末端結合の細胞機構を刺激することもできる。本明細書に記載される方法のいずれかにおいて、第1のヌクレオチド配列(「ドナー配列」)は、目的の領域中のゲノム配列と相同であるが同一ではない配列を含み得、それによって、目的の領域において非同一配列を挿入するための相同組換えを刺激する。したがって、特定の実施形態では、目的の領域中の配列と相同なドナー配列の部分は、置き換えられるゲノム配列に対して、約80、85、90、95、97.5〜99%の間(またはそれらの間の任意の整数)の配列同一性を示す。他の実施形態では、ドナー配列とゲノム配列との間の相同性は、例えば、1ヌクレオチドのみが100個を超えて連続する塩基対のドナー配列とゲノム配列との間で異なる場合、99%よりも高い。
特定の場合には、ドナー配列の非相同部分は、目的の領域中に存在しない配列を含み得、その結果、新たな配列が、目的の領域中に導入される。これらの場合、この非相同配列には、一般に、目的の領域中の配列と相同または同一である、50〜2,000塩基対(もしくはそれらの間の任意の整数値)、または2,000よりも多い任意の数の塩基対の配列が、隣接する。他の実施形態では、このドナー配列は、目的の領域と非相同であり、非相同組換え機構によってゲノム中に挿入される。
一実施形態によれば、ジンクフィンガーヌクレアーゼ(ZFN)が、目的の核酸の挿入を促進するために、標的化されたゲノム遺伝子座中に二本鎖破断を導入するために使用される。ジンクフィンガードメインによる結合のための選択されたゲノム遺伝子座内の標的部位の選択は、例えば、選択された配列に結合するジンクフィンガータンパク質(ZFP)を設計するための方法もまた開示する、その開示が本明細書に組み込まれる米国特許第6,453,242号に開示される方法に従って、達成され得る。ヌクレオチド配列の単純な目視検査もまた、標的部位の選択のために使用され得ることは、当業者に明らかである。したがって、標的部位選択のための任意の手段が、本明細書に記載される方法において使用され得る。
ZFP DNA結合ドメインについて、標的部位は一般に、複数の隣接する標的サブサイトから構成される。標的サブサイトとは、個々のジンクフィンガーによって結合される隣接する四つ組と、1ヌクレオチドがオーバーラップし得る、通常はヌクレオチド三つ組またはヌクレオチド四つ組のいずれかの、配列を指す。例えば、その開示が本明細書に組み込まれるWO02/077227を参照のこと。標的部位は、一般に、少なくとも9ヌクレオチドの長さを有し、したがって、少なくとも3つのジンクフィンガーを含むジンクフィンガー結合ドメインによって結合される。しかし、例えば、12ヌクレオチドの標的部位に対する4フィンガー結合ドメインの結合、15ヌクレオチドの標的部位に対する5フィンガー結合ドメインの結合、または18ヌクレオチドの標的部位に対する6フィンガー結合ドメインの結合もまた、可能である。明らかなように、より長い標的部位に対するより大きい結合ドメイン(例えば、7、8、9フィンガーおよびそれ超)の結合もまた、本開示と一致する。
一実施形態によれば、標的部位は、複数の3ヌクレオチドである必要はない。交差鎖相互作用が生じる場合(例えば、米国特許第6,453,242号およびWO02/077227を参照のこと)、多フィンガー結合ドメインの個々のジンクフィンガーの1または複数は、オーバーラップする四つ組サブサイトに結合し得る。結果として、3フィンガータンパク質は、10ヌクレオチド配列を結合し得、このとき、10番目のヌクレオチドは、終端フィンガーによって結合される四つ組の一部であり、4フィンガータンパク質は、13ヌクレオチド配列を結合し得、このとき、13番目のヌクレオチドは、終端フィンガーによって結合される四つ組の一部である、など。
多フィンガー結合ドメイン中の個々のジンクフィンガー間のアミノ酸リンカー配列の長さおよび性質もまた、標的配列への結合に影響を与える。例えば、多フィンガー結合ドメイン中の隣接するジンクフィンガー間のいわゆる「非正準リンカー」、「長いリンカー」または「構造化リンカー」の存在により、これらのフィンガーは、直接隣接しないサブサイトを結合することができる。かかるリンカーの非限定的な例は、例えば、米国特許第6,479,626号およびWO01/53480に記載されている。したがって、ジンクフィンガー結合ドメインに対する標的部位中の1または複数のサブサイトは、1、2、3、4、5またはそれ超のヌクレオチド、互いに分離され得る。1つの非限定的な例は、配列中に、2つの連続する3ヌクレオチドサブサイト、1つの介在ヌクレオチド、および2つの連続する三つ組サブサイトを含む13ヌクレオチドの標的部位に結合する4フィンガー結合ドメインである。
天然に存在するタンパク質から同定されたDNA結合ポリペプチドは、典型的には、別々のヌクレオチド配列またはモチーフ(例えば、コンセンサス認識配列)に結合するが、異なるヌクレオチド配列またはモチーフを認識するように多数のかかるDNA結合ポリペプチドを改変するための方法が存在し、当該分野で公知である。DNA結合ポリペプチドには、例えば以下が含まれるがこれらに限定されない:ジンクフィンガーDNA結合ドメイン;ロイシンジッパー;UPA DNA結合ドメイン;GAL4;TAL;LexA;Tetリプレッサー;LacR;およびステロイドホルモン受容体。
一部の例では、DNA結合ポリペプチドは、ジンクフィンガーである。個々のジンクフィンガーモチーフは、DNA部位の大きい範囲のいずれかを標的化し、それに特異的に結合するように設計され得る。正準Cys2His2(ならびに非正準Cys3His)ジンクフィンガーポリペプチドは、標的DNA二重らせんの主溝中にα−らせんを挿入することによって、DNAを結合する。ジンクフィンガーによるDNAの認識は、モジュール式である;各フィンガーは、標的中の3つの保存的塩基対と主に接触し、このポリペプチド中の数個の重要な残基が認識を媒介する。標的化エンドヌクレアーゼ中に複数のジンクフィンガーDNA結合ドメインを含めることによって、この標的化エンドヌクレアーゼのDNA結合特異性は、さらに増加され得る(および、したがって、それによって付与される任意の遺伝子調節効果の特異性もまた増加され得る)。例えば、Urnov et al. (2005) Nature 435:646-51を参照のこと。したがって、1または複数のジンクフィンガーDNA結合ポリペプチドが、操作および利用され得、その結果、宿主細胞中に導入された標的化エンドヌクレアーゼは、宿主細胞のゲノム内の独自のDNA配列と相互作用する。好ましくは、このジンクフィンガータンパク質は、選択された標的部位に結合するように操作されているという点で、天然に存在しない。例えば、それらの全体が参照によって本明細書に全て組み込まれる、Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; 米国特許第6,453,242号;同第6,534,261号;同第6,599,692号;同第6,503,717号;同第6,689,558号;同第7,030,215号;同第6,794,136号;同第7,067,317号;同第7,262,054号;同第7,070,934号;同第7,361,635号;同第7,253,273号;および米国特許出願公開第2005/0064474号;同第2007/0218528号;同第2005/0267061号を参照のこと。
操作されたジンクフィンガー結合ドメインは、天然に存在するジンクフィンガータンパク質と比較して、新規の結合特異性を有し得る。操作方法には、合理的設計および種々の型の選択が含まれるがこれらに限定されない。合理的設計には、例えば、三つ組(または四つ組)ヌクレオチド配列および個々のジンクフィンガーアミノ酸配列を含むデータベースを使用することが含まれ、このとき、各三つ組または四つ組ヌクレオチド配列は、特定の三つ組または四つ組配列を結合するジンクフィンガーの1または複数のアミノ酸配列と関連する。例えば、それらの全体が参照により本明細書に組み込まれる、共有に係る米国特許第6,453,242号および同第6,534,261号を参照のこと。
あるいは、このDNA結合ドメインは、ヌクレアーゼから誘導され得る。例えば、ホーミングエンドヌクレアーゼおよびメガヌクレアーゼ、例えば、I−SceI、I−CeuI、PI−PspI、PI−Sce、I−SceIV、I−CsmI、I−PanI、I−SceII、I−PpoI、I−SceIII、I−CreI、I−TevI、I−TevIIおよびI−TevIIIの認識配列は、公知である。米国特許第5,420,032号;米国特許第6,833,252号;Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353およびNew England Biolabs catalogueもまた参照のこと。さらに、ホーミングエンドヌクレアーゼおよびメガヌクレアーゼのDNA結合特異性は、非天然の標的部位を結合するように操作され得る。例えば、Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 米国特許出願公開第20070117128号を参照のこと。
別の代替法として、このDNA結合ドメインは、ロイシンジッパータンパク質から誘導され得る。ロイシンジッパーは、遺伝子発現と関連する重要な転写因子である多くの真核生物調節タンパク質中の、タンパク質−タンパク質相互作用に関与するタンパク質のクラスである。ロイシンジッパーとは、動物、植物、酵母などを含むいくつかの界にわたってこれらの転写因子中で共有される共通の構造的モチーフを指す。このロイシンジッパーは、2つのポリペプチドのロイシン残基がそのらせんの同じ面になるように、ロイシン残基がα−らせん中に等間隔に置かれるような様式で、特異的DNA配列に結合する2つのポリペプチド(ホモダイマーまたはヘテロダイマー)によって形成される。ロイシンジッパーのDNA結合特異性は、本明細書に開示されるDNA結合ドメインにおいて利用され得る。
一部の実施形態では、このDNA結合ドメインは、植物病原体キサントモナス属(Xanthomonas)から誘導されるTALエフェクター由来の操作されたドメインである(Miller et al. (2011) Nature Biotechnology 29(2):143-8; Boch et al, (2009) Science 29 Oct 2009 (10.1126/science.117881) およびMoscou and Bogdanove, (2009) Science 29 Oct 2009 (10.1126/science.1178817;ならびに米国特許出願公開第20110239315号、同第20110145940号および同第20110301073号を参照のこと)。
CRISPR(クラスター化して規則的な配置の短い回文配列リピート)/Cas(CRISPR関連)ヌクレアーゼ系は、ゲノム操作のために使用され得る細菌系に基づいて最近操作されたヌクレアーゼ系である。これは、多くの細菌および古細菌の適応免疫応答の一部に基づく。ウイルスまたはプラスミドが細菌に侵入する場合、侵入者のDNAのセグメントは、この「免疫」応答によってCRISPR RNA(crRNA)に変換される。次いで、このcrRNAは、部分的相補性の領域を介して、tracrRNAと呼ばれる別の型のRNAと会合して、「プロトスペーサー」と呼ばれる標的DNA中のcrRNAと相同な領域へと、Cas9ヌクレアーゼをガイドする。Cas9は、DNAを切断して、crRNA転写物内に含まれる20ヌクレオチドのガイド配列によって特定化される部位におけるDSBにおいて平滑末端を生成する。Cas9は、部位特異的なDNAの認識および切断のために、crRNAおよびtracrRNAの両方を必要とする。ここで、この系は、crRNAおよびtracrRNAが1つの分子(「単一ガイドRNA」)へと組み合わされ得るように操作されており、この単一ガイドRNAのcrRNA相当部分は、任意の所望の配列を標的化するようにCas9ヌクレアーゼをガイドするように操作され得る(Jinek et al (2012) Science 337, p. 816-821, Jinek et al, (2013), eLife 2:e00471およびDavid Segal, (2013) eLife 2:e00563を参照のこと)。したがって、CRISPR/Cas系は、ゲノム中の所望の標的において二本鎖破断(DSB)を創出するように操作され得、DSBの修復は、エラープローン修復における増加を引き起こす修復阻害剤の使用によって影響され得る。
特定の実施形態では、Casタンパク質は、天然に存在するCasタンパク質の「機能的誘導体」であり得る。ネイティブ配列ポリペプチドの「機能的誘導体」は、ネイティブ配列ポリペプチドと共通する質的な生物学的特性を有する化合物である。「機能的誘導体」には、それらが対応するネイティブ配列ポリペプチドと共通する生物学的活性を有することを条件として、ネイティブ配列の断片、ならびにネイティブ配列ポリペプチドおよびその断片の誘導体が含まれるがこれらに限定されない。本明細書で企図される生物学的活性は、機能的誘導体がDNA基質を断片へと加水分解する能力である。用語「誘導体」は、ポリペプチドのアミノ酸配列バリアント、共有結合的改変、およびそれらの融合物の両方を包含する。Casポリペプチドまたはその断片の適切な誘導体には、Casタンパク質またはその断片の変異体、融合物、共有結合的改変が含まれるがこれらに限定されない。Casタンパク質またはその断片を含むCasタンパク質、ならびにCasタンパク質またはその断片の誘導体は、細胞から取得可能であり得、または化学的に合成され得、またはこれら2つの手順の組合せによって取得可能であり得る。この細胞は、Casタンパク質を天然に産生する細胞、またはCasタンパク質を天然に産生し、かつより高い発現レベルで内因性Casタンパク質を産生しもしくは外因的に導入された核酸からCasタンパク質を産生するように遺伝子操作された細胞であり得、この核酸は、内因性Casと同じまたは異なるCasをコードする。一部の場合、この細胞は、Casタンパク質を天然には産生せず、Casタンパク質を産生するように遺伝子操作される。このCasタンパク質は、CasヌクレアーゼをガイドRNAと共に共発現させることによって、哺乳動物細胞中(および推定上植物細胞内)に配備される。2つの形態のガイドRNAが、Le Cong, F., et al., (2013) Science 339(6121):819-823に開示されるように、Cas媒介性のゲノム切断を促進するために使用され得る。
他の実施形態では、このDNA結合ドメインは、切断(ヌクレアーゼ)ドメインと関連され得る。例えば、ホーミングエンドヌクレアーゼは、ヌクレアーゼ機能を保持しつつ、それらのDNA結合特異性が改変され得る。さらに、ジンクフィンガータンパク質もまた、ジンクフィンガーヌクレアーゼ(ZFN)を形成するために、切断ドメインと融合され得る。本明細書に開示される融合タンパク質の切断ドメイン部分は、任意のエンドヌクレアーゼまたはエキソヌクレアーゼから取得され得る。切断ドメインが誘導され得る例示的なエンドヌクレアーゼには、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼが含まれるがこれらに限定されない。例えば、2002-2003 Catalogue, New England Biolabs, Beverly, MA;およびBelfort et al. (1997) Nucleic Acids Res. 25:3379-3388を参照のこと。DNAを切断するさらなる酵素が公知である(例えば、S1ヌクレアーゼ;リョクトウヌクレアーゼ;膵臓DNase I;小球菌ヌクレアーゼ;酵母HOエンドヌクレアーゼ;Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993もまた参照のこと)。ホーミングエンドヌクレアーゼおよびメガヌクレアーゼの非限定的な例には、I−SceI、I−CeuI、PI−PspI、PI−Sce、I−SceIV、I−CsmI、I−PanI、I−SceII、I−PpoI、I−SceIII、I−CreI、I−TevI、I−TevIIおよびI−TevIIIが含まれ、公知である。米国特許第5,420,032号;米国特許第6,833,252号; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353およびNew England Biolabs catalogueもまた参照のこと。これらの酵素(またはそれらの機能的断片)の1または複数が、切断ドメインおよび切断ハーフドメインの供給源として使用され得る。
制限エンドヌクレアーゼ(制限酵素)は、多くの種に存在し、(認識部位において)DNAに配列特異的に結合することが可能であり、結合の部位またはその近傍においてDNAを切断することが可能である。特定の制限酵素(例えば、IIS型)は、認識部位から外れた部位においてDNAを切断し、分離可能な結合ドメインおよび切断ドメインを有する。例えば、IIS型酵素FokIは、一方の鎖上のその認識部位から9ヌクレオチドの位置においてDNAの二本鎖切断を触媒し、他方の鎖上のその認識部位から13ヌクレオチドの位置においてDNAの二本鎖切断を触媒する。例えば、米国特許第5,356,802号;同第5,436,150号および同第5,487,994号;ならびにLi et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982を参照のこと。したがって、一実施形態では、融合タンパク質は、操作されていてもいなくてもよい、少なくとも1つのIIS型制限酵素由来の切断ドメイン(または切断ハーフドメイン)および1または複数のジンクフィンガー結合ドメインを含む。
その切断ドメインが結合ドメインから分離可能な例示的なIIS型制限酵素は、FokIである。この特定の酵素は、ダイマーとして活性である。Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575。したがって、本開示の目的のために、開示された融合タンパク質において使用されるFokI酵素の部分は、切断ハーフドメインとみなされる。したがって、ジンクフィンガー−FokI融合物を使用する細胞配列の標的化された二本鎖切断および/または標的化された置き換えのために、各々がFokI切断ハーフドメインを含む2つの融合タンパク質が、触媒的に活性な切断ドメインを再構成するために使用され得る。あるいは、1つのジンクフィンガー結合ドメインおよび2つのFokI切断ハーフドメインを含む単一ポリペプチド分子もまた使用され得る。ジンクフィンガー−FokI融合物を使用する標的化された切断および標的化された配列変更のためのパラメーターは、本開示の別の箇所に提供される。
切断ドメインまたは切断ハーフドメインは、切断活性を保持するか、または重合(例えばダイマー化)して機能的切断ドメインを形成する能力を保持する、タンパク質の任意の部分であり得る。例示的なIIS型制限酵素は、その全体が参照により本明細書に組み込まれる国際公開WO2007/014275に記載されている。
切断特異性を増強するために、切断ドメインはまた、改変され得る。特定の実施形態では、切断ハーフドメインのバリアントが使用され、これらのバリアントは、切断ハーフドメインのホモダイマー化を最小化または防止する。かかる改変された切断ハーフドメインの非限定的な例は、その全体が参照により本明細書に組み込まれるWO2007/014275に詳細に記載されている。特定の実施形態では、この切断ドメインは、ホモダイマー化を最小化または防止する操作された切断ハーフドメイン(ダイマー化ドメイン変異体とも呼ばれる)を含む。かかる実施形態は、当業者に公知であり、例えば、それらの全ての開示が、それらの全体が本明細書で参照により組み込まれる、米国特許出願公開第20050064474号;同第20060188987号;同第20070305346号および同第20080131962号に記載されている。FokIの446位、447位、479位、483位、484位、486位、487位、490位、491位、496位、498位、499位、500位、531位、534位、537位および538位におけるアミノ酸残基は、全て、FokI切断ハーフドメインのダイマー化に影響するための標的である。
義務的ヘテロダイマーを形成するFokIのさらなる操作された切断ハーフドメインは、本明細書に記載されるZFNにおいても使用され得る。義務的ヘテロダイマーを形成するFokIの例示的な操作された切断ハーフドメインには、第1の切断ハーフドメインがFokIの490位および538位におけるアミノ酸残基において変異を含み、第2の切断ハーフドメインがアミノ酸残基486および499において変異を含む、対が含まれる。一実施形態では、490における変異は、Glu(E)をLys(K)で置き換え;538における変異は、Iso(I)をLys(K)で置き換え;486における変異は、Gln(Q)をGlu(E)で置き換え;499位における変異は、Iso(I)をLys(K)で置き換える。具体的には、本明細書に記載される操作された切断ハーフドメインは、一方の切断ハーフドメインにおいて490位(E→K)および538位(I→K)を変異させて「E490K:I538K」と称される操作された切断ハーフドメインを産生し、もう一方の切断ハーフドメインにおいて486位(Q→E)および499位(I→L)を変異させて「Q486E:I499L」と称される操作された切断ハーフドメインを産生することによって、調製した。本明細書に記載される操作された切断ハーフドメインは、異常な切断が最小化または無効化される義務的ヘテロダイマー変異体である。例えば、その開示が全ての目的のためにその全体が参照により組み込まれる米国特許出願公開第2008/0131962号を参照のこと。特定の実施形態では、この操作された切断ハーフドメインは、486位、499位および496位(野生型FokIに対して番号付けした)における変異、例えば、486位の野生型Gln(Q)残基をGlu(E)残基で置き換える変異、499位の野生型Iso(I)残基をLeu(L)残基で置き換える変異、および496位の野生型Asn(N)残基をAsp(D)またはGlu(E)残基で置き換える変異(それぞれ、「ELD」ドメインおよび「ELE」ドメインとも呼ばれる)を含む。他の実施形態では、この操作された切断ハーフドメインは、490位、538位および537位(野生型FokIに対して番号付けした)における変異、例えば、490位の野生型Glu(E)残基をLys(K)残基で置き換える変異、538位の野生型Iso(I)残基をLys(K)残基で置き換える変異、および537位の野生型His(H)残基をLys(K)残基またはArg(R)残基で置き換える変異(それぞれ、「KKK」ドメインおよび「KKR」ドメインとも呼ばれる)を含む。他の実施形態では、この操作された切断ハーフドメインは、490位および537位(野生型FokIに対して番号付けした)における変異、例えば、490位の野生型Glu(E)残基をLys(K)残基で置き換える変異、および537位の野生型His(H)残基をLys(K)残基またはArg(R)残基で置き換える変異(それぞれ、「KIK」ドメインおよび「KIR」ドメインとも呼ばれる)を含む。(米国特許出願公開第20110201055号を参照のこと)。他の実施形態では、この操作された切断ハーフドメインは、「Sharkey」および/または「Sharkey’」変異を含む(Guo et al, (2010) J. Mol. Biol. 400(1):96-107を参照のこと)。
本明細書に記載される操作された切断ハーフドメインは、任意の適切な方法を使用して、例えば、米国特許出願公開第20050064474号;同第20080131962号;および同第20110201055号に記載されるような、野生型切断ハーフドメイン(FokI)の部位特異的変異誘発によって、調製され得る。あるいは、ヌクレアーゼは、いわゆる「開裂酵素(split-enzyme)」テクノロジーを使用して、核酸標的部位においてin vivoでアセンブルされ得る(例えば、米国特許出願公開第20090068164号を参照のこと)。かかる開裂酵素の成分は、別々の発現構築物のいずれか上で発現され得、または個々の成分が、例えば自己切断性2AペプチドまたはIRES配列によって分離されて、1つのオープンリーディングフレームで連結され得る。成分は、個々のジンクフィンガー結合ドメイン、またはメガヌクレアーゼ核酸結合ドメインのドメインであり得る。
ヌクレアーゼは、例えば、WO2009/042163およびWO20090068164に記載されるような酵母ベースの染色体系における使用の前に、活性についてスクリーニングされ得る。ヌクレアーゼ発現構築物は、当該分野で公知の方法を使用して容易に設計され得る。例えば、米国特許出願公開第20030232410号;同第20050208489号;同第20050026157号;同第20050064474号;同第20060188987号;同第20060063231号;および国際公開WO07/014275を参照のこと。ヌクレアーゼの発現は、構成的プロモーターまたは誘導性プロモーター、例えば、ラフィノースおよび/またはガラクトースの存在下で活性化(抑制解除)され、グルコースの存在下で抑制される、ガラクトキナーゼプロモーター、の制御下にあり得る。
標的部位間の距離とは、互いに最も近い配列の端から測定される、2つの標的部位間に介在するヌクレオチドまたはヌクレオチド対の数を指す。切断が、別々の標的部位への2つのジンクフィンガードメイン/切断ハーフドメイン融合分子の結合に依存する特定の実施形態では、これら2つの標的部位は、反対のDNA鎖上に存在し得る。他の実施形態では、両方の標的部位が、同じDNA鎖上に存在する。最適なゲノム遺伝子座中への標的化された組込みのために、1または複数のZFPが、所定の切断部位またはその近傍で標的部位を結合するように操作され、操作されたDNA結合ドメインおよび切断ドメインを含む融合タンパク質が、細胞において発現される。融合タンパク質のジンクフィンガー部分の標的部位への結合に際して、DNAは、好ましくは二本鎖破断を介して、切断ドメインによって、標的部位近傍で切断される。
最適なゲノム遺伝子座における二本鎖破断の存在は、相同組換えを介した外因性配列の組込みを促進する。したがって、一実施形態では、標的化されたゲノム遺伝子座中に挿入される目的の核酸配列を含むポリヌクレオチドは、相同組換えを促進するために、標的化されたゲノム遺伝子座と相同性の1または複数の領域を含む。
本明細書に記載される融合分子に加えて、選択されたゲノム配列の標的化された置き換えには、ドナー配列の導入もまた関与する。このポリヌクレオチドドナー配列は、融合タンパク質の発現の前に、それと同時に、またはそれに引き続いて、細胞中に導入され得る。一実施形態では、このドナーポリヌクレオチドは、このドナーポリヌクレオチドと、それが相同性を有する最適なゲノム遺伝子座ゲノム配列との間の相同組換えを支持するために、最適なゲノム遺伝子座との十分な相同性を含む。ドナーとゲノム配列との間のおよそ25、50、100、200、500、750、1,000、1,500、2,000ヌクレオチドもしくはそれ超の配列相同性、または10ヌクレオチドと2,000ヌクレオチドもしくはそれ超との間の任意の整数値が、相同組換えを支持する。特定の実施形態では、相同性アームは、1,000塩基対長未満である。他の実施形態では、この相同性アームは、750塩基対長未満である。一実施形態では、このドナーポリヌクレオチド配列は、細胞クロマチン中の目的の領域と相同ではない配列を含むベクター分子を含み得る。ドナーポリヌクレオチド分子は、細胞クロマチンと相同性のいくつかの非連続領域を含み得る。例えば、目的の領域中に通常は存在しない配列の標的化された挿入のために、前記配列は、ドナー核酸分子中に存在し得、目的の領域中の配列と相同性の領域が隣接し得る。このドナーポリヌクレオチドは、DNAまたはRNA、一本鎖または二本鎖であり得、線状形態または環状形態で細胞中に導入され得る。例えば、米国特許出願公開第20100047805号、同第20110281361号、同第20110207221号および米国特許出願第13/889,162号を参照のこと。線状形態で導入される場合、ドナー配列の末端は、当該分野で公知の方法によって、(例えば、エキソ核酸分解的分解から)保護され得る。例えば、1または複数のダイデオキシヌクレオチド残基が、線状分子の3’末端に付加され、および/または自己相補的オリゴヌクレオチドが、一方または両方の末端にライゲーションされる。例えば、Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889を参照のこと。分解から外因性ポリヌクレオチドを保護するためのさらなる方法には、末端アミノ基の付加、ならびに例えば、ホスホロチオエート、ホスホロアミデート(phosphoramidate)、およびO−メチルリボースまたはデオキシリボース残基などの、改変されたヌクレオチド間連結の使用が含まれるがこれらに限定されない。
一実施形態によれば、ダイズ植物などのトランスジェニック双子葉植物を調製する方法が提供され、目的のDNAは、最適な非遺伝子ダイズゲノム遺伝子座中に挿入されている。この方法は、以下のステップを含む:
a.目的の核酸の挿入のための標的として、最適な非遺伝子ダイズ遺伝子座を選択するステップ;
b.部位特異的ヌクレアーゼをダイズ植物細胞などの双子葉植物細胞中に導入するステップであって、この部位特異的ヌクレアーゼは、非遺伝子配列を切断する、ステップ;
c.目的のDNAをこの植物細胞中に導入するステップ;および
d.前記非遺伝子配列に標的化された目的のDNAを含むトランスジェニック植物細胞を選択するステップ。
一実施形態によれば、ダイズプロトプラスト細胞などのトランスジェニック双子葉プロトプラスト細胞を調製する方法が提供され、目的のDNAは、最適な非遺伝子ダイズゲノム遺伝子座中に挿入されている。この方法は以下のステップを含む:
a.目的の核酸の挿入のための標的として、最適な非遺伝子ダイズ遺伝子座を選択するステップ;
b.部位特異的ヌクレアーゼをダイズプロトプラスト細胞などの双子葉プロトプラスト細胞中に導入するステップであって、この部位特異的ヌクレアーゼは、非遺伝子配列を切断する、ステップ;
c.目的のDNAをダイズプロトプラスト細胞などの双子葉プロトプラスト細胞中に導入するステップ;および
d.前記非遺伝子配列に標的化された目的のDNAを含むダイズプロトプラスト細胞などのトランスジェニック双子葉プロトプラスト細胞を選択するステップ。
一実施形態では、この部位特異的ヌクレアーゼは、ジンクフィンガーヌクレアーゼ、CRISPRヌクレアーゼ、TALENヌクレアーゼまたはメガヌクレアーゼからなる群から選択され、より具体的には、一実施形態では、この部位特異的ヌクレアーゼは、ジンクフィンガーヌクレアーゼである。一実施形態によれば、目的のDNAは、相同組換え修復組込み方法を介してこの非遺伝子配列内に組み込まれる。あるいは、一部の実施形態では、目的のDNAは、非相同末端結合組込み方法を介して前記非遺伝子配列内に組み込まれる。さらなる実施形態では、目的のDNAは、以前に記載されていない組込み方法を介して前記非遺伝子配列内に組み込まれる。一実施形態では、この方法は、以下の2、3、4、5、6、7または8の特徴を有する、目的のDNAの標的化された挿入のために最適な非遺伝子ダイズゲノム遺伝子座を選択するステップを含む:
a.この非遺伝子配列は、少なくとも1Kb長であり、配列内に1%よりも多いDNAメチル化を含まない;
b.この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノム内で、0.01574〜83.52cM/Mbの比率の組換えを示す;
c.この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノムの、0〜0.494レベルのヌクレオソーム占有率を示す;
d.この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノム中に含まれる任意の他の配列と、40%未満の配列同一性を共有する;
e.この非遺伝子配列は、ダイズなどの双子葉染色体セントロメアから0〜0.99682のゲノム距離の比率の相対的位置値を有する;
f.非遺伝子配列は、14.4〜45.9%のグアニン/シトシンパーセント含量範囲を有する;
g.この非遺伝子配列は、遺伝子配列の近位に位置する;および
h.前記非遺伝子配列を含む、ダイズゲノム配列などの双子葉ゲノム配列の1Mb領域は、1または複数のさらなる非遺伝子配列を含む。一実施形態では、この最適な非遺伝子ダイズ遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、2、3、4、5、6、7、8、9、20、21、22、23、24、25、26、27、28、29、30、31または32の遺伝子座から選択される。
送達
本明細書に開示されるドナー分子は、標的化された相同性非依存的方法および/または相同性依存的方法を介して、細胞のゲノム中に組み込まれる。かかる標的化された組込みのために、このゲノムは、ヌクレアーゼ、例えば、DNA結合ドメイン(例えば、ジンクフィンガー結合ドメイン、CRISPRまたはTALエフェクタードメインが、所定の切断部位またはその近傍において標的部位を結合するように操作される)とヌクレアーゼドメイン(例えば、切断ドメインまたは切断ハーフドメイン)との間での融合物を使用して、所望の位置(単数または複数)において切断される。特定の実施形態では、各々がDNA結合ドメインおよび切断ハーフドメインを含む2つの融合タンパク質が、細胞中で発現され、機能的切断ドメインが再構成されDNAが標的部位の近傍で切断されるような方法で、並置された標的部位に結合する。一実施形態では、切断は、2つのDNA結合ドメインの標的部位間で生じる。これらのDNA結合ドメインの一方または両方が、操作され得る。米国特許第7,888,121号;米国特許出願公開第20050064474号ならびに国際特許公開WO05/084190、WO05/014791およびWO03/080809もまた参照のこと。
本明細書に記載されるヌクレアーゼは、ポリペプチドおよび/またはポリヌクレオチドとして導入され得る。例えば、各々が上記ポリペプチドの1つをコードする配列を含む2つのポリヌクレオチドが、細胞中に導入され得、それらのポリペプチドが発現され、各々がその標的配列に結合するときに、標的配列またはその近傍において切断が生じる。あるいは、両方の融合ポリペプチドをコードする配列を含む単一のポリヌクレオチドが、細胞中に導入される。ポリヌクレオチドは、DNA、RNAまたは任意の改変された形態もしくはアナログまたはDNAおよび/もしくはRNAであり得る。
目的の領域における二本鎖破断の導入後に、導入遺伝子が、本明細書に記載される二本鎖ドナー分子の線状化後に、非相同性依存的方法(例えば、非相同末端結合(NHEJ))を介して、標的化された様式で目的の領域中に組み込まれる。この二本鎖ドナーは、好ましくは、ヌクレアーゼ、例えば、ゲノム中に二本鎖破断を導入するために使用される同じまたは異なるヌクレアーゼの1または複数を用いて、in vivoで線状化される。細胞における染色体およびドナーの同期化された切断は、(細胞中への導入の前のドナー分子の線状化と比較して)ドナーのDNA分解を制限し得る。ドナーの線状化に使用されるヌクレアーゼ標的部位は、好ましくは、導入遺伝子配列を破壊しない。
この導入遺伝子は、ヌクレアーゼオーバーハングの単純なライゲーションによって予測される方向(「フォワード」または「AB」配向と称される)で、または代替的方向(「リバース」または「BA」配向と称される)で、ゲノム中に組み込まれ得る。特定の実施形態では、この導入遺伝子は、ドナーオーバーハングおよび染色体オーバーハングの正確なライゲーション後に組み込まれる。他の実施形態では、BA配向またはAB配向のいずれかでの導入遺伝子の組込みは、いくつかのヌクレオチドの欠失を生じる。
これらのような技術の適用を介して、事実上任意の種の細胞が、安定に形質転換され得る。一部の実施形態では、形質転換性DNAは、宿主細胞のゲノム中に組み込まれる。多細胞種の場合、トランスジェニック細胞は、トランスジェニック生物へと再生され得る。これらの技術のいずれかが、例えば、トランスジェニック植物のゲノム中に1または複数のドナーポリヌクレオチド配列を含むトランスジェニック植物を産生するために使用され得る。
核酸の送達は、DNA、RNA、ペプチドおよび/もしくはタンパク質または核酸およびペプチドの組合せを植物細胞中に送達するための方法において、例えば以下が含まれるがこれらに限定されない、当業者に公知の任意の方法によって、本発明の実施形態において植物細胞中に導入され得る:プロトプラストの形質転換によって(例えば、米国特許第5,508,184号を参照のこと);乾燥/阻害媒介性のDNA取り込みによって(例えば、Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8を参照のこと);エレクトロポレーションによって(例えば、米国特許第5,384,253号を参照のこと);シリコンカーバイド繊維による撹拌によって(例えば、米国特許第5,302,523号および同第5,464,765号を参照のこと);アグロバクテリウム属(Agrobacterium)媒介性の形質転換によって(例えば、米国特許第5,563,055号、同第5,591,616号、同第5,693,512号、同第5,824,877号、同第5,981,840号および6,384,301号を参照のこと);DNA被覆粒子の加速によって(例えば、米国特許第5,015,580号、同第5,550,318号、同第5,538,880号、同第6,160,208号、同第6,399,861号および同第6,403,865号を参照のこと)、ならびにナノ粒子、ナノキャリアおよび細胞透過性ペプチドによって(WO201126644A2;WO2009046384A1;WO2008148223A1)。
植物中に発現ベクターを導入するために最も広く利用される方法は、アグロバクテリウム属(Agrobacterium)の天然の形質転換系に基づく。アグロバクテリウム・ツメファシエンス(A. tumefaciens)およびアグロバクテリウム・リゾゲネス(A. rhizogenes)は、植物細胞を遺伝的に形質転換する植物病原性土壌細菌である。それぞれアグロバクテリウム・ツメファシエンス(A. tumefaciens)およびアグロバクテリウム・リゾゲネス(A. rhizogenes)のTiプラスミドおよびRiプラスミドは、植物の遺伝的形質転換を担う遺伝子を有する。Ti(腫瘍誘導性)プラスミドは、形質転換された植物に移入される、T−DNAとして公知の大きいセグメントを含む。Tiプラスミドの別のセグメントvir領域は、T−DNAの移入を担う。このT−DNA領域には、末端反復ヌクレオチド配列から各々が構成される左側および右側の境界が境を接する。一部の改変されたバイナリーベクターでは、腫瘍誘導性遺伝子は欠失されており、vir領域の機能が、T−DNA境界配列が境を接する外来DNAを移入させるために利用される。このT領域は、例えば、トランスジェニック植物および細胞の効率的な回収のための選択可能なマーカー、ならびに本発明の融合タンパク質をコードする核酸などを移入させるために配列を挿入するためのマルチクローニング部位もまた、含み得る。
したがって、一部の実施形態では、植物形質転換ベクターは、アグロバクテリウム・ツメファシエンス(A. tumefaciens)のTiプラスミド(例えば、米国特許第4,536,475号、同第4,693,977号、同第4,886,937号および同第5,501,967号;ならびに欧州特許EP0122791を参照のこと)またはアグロバクテリウム・リゾゲネス(A. rhizogenes)のRiプラスミドから誘導される。さらなる植物形質転換ベクターには、例えば、Herrera-Estrella et al. (1983) Nature 303:209-13; Bevan et al. (1983), 上記; Klee et al. (1985) Bio/Technol. 3:637-42によって記載されたもの;および欧州特許EP0120516に記載されたもの、ならびに上述のいずれかから誘導されるものが含まれるがこれらに限定されない。植物と天然に相互作用する他の細菌、例えば、シノリゾビウム属(Sinorhizobium)、根粒菌属(Rhizobium)およびメソリゾビウム属(Mesorhizobium)は、いくつかの多様な植物への遺伝子移入を媒介するように改変され得る。これらの植物関連共生細菌は、安全化されたTiプラスミドおよび適切なバイナリーベクターの両方の獲得によって、遺伝子移入について競合するようにされ得る。
目的の核酸
ダイズ植物などの双子葉植物のゲノム遺伝子座中への標的化された挿入のためのポリヌクレオチドドナー配列は、典型的には、長さが約10〜約5,000ヌクレオチドの範囲である。しかし、約5、6、7、8、9、10、11および12Kb長の配列を含む、最大で20,000ヌクレオチドの実質的により長いヌクレオチドが、使用され得る。さらに、ドナー配列は、置き換えられた領域と相同ではない配列を含むベクター分子を含み得る。一実施形態では、この目的の核酸は、標的化されたゲノム遺伝子座と相同性を共有する1または複数の領域を含む。一般に、目的の核酸配列の相同な領域は、組換えが望まれるゲノム配列と少なくとも50%の配列同一性を有する。特定の実施形態では、目的の核酸の相同な領域は、標的化されたゲノム遺伝子座中に位置する配列と、60%、70%、80%、90%、95%、98%、99%または99.9%の配列同一性を共有する。しかし、1%と100%との間の任意の値の配列同一性が、目的の核酸の長さに依存して存在し得る。
目的の核酸は、細胞クロマチンと比較的高い配列同一性を共有する配列のいくつかの非連続領域を含み得る。例えば、標的化されたゲノム遺伝子座中に通常は存在しない配列の標的化された挿入のために、独自の配列がドナー核酸分子中に存在し得、標的化されたゲノム遺伝子座中に存在する配列と比較的高い配列同一性を共有する配列の領域がそれに隣接し得る。
目的の核酸はまた、後の使用のためのレザバとして機能するように、標的化されたゲノム遺伝子座中に挿入され得る。例えば、ダイズ植物などの双子葉植物のゲノムの非遺伝子領域と相同な配列を含むが、目的の核酸(任意選択で、誘導性プロモーターの制御下にZFNをコードする)を含む第1の核酸配列が、標的化されたゲノム遺伝子座において挿入され得る。次に、第2の核酸配列が、ダイズ植物などの双子葉植物の最適な非遺伝子ゲノム遺伝子座中への目的のDNAの挿入を誘導するために、細胞中に導入される。第1の核酸配列が最適な非遺伝子ダイズゲノム遺伝子座に対して特異的なZFNを含み、第2の核酸配列が目的のDNA配列を含むか、その逆であるかのいずれかである。一実施形態では、このZFNは、最適な非遺伝子ダイズゲノム遺伝子座および目的の核酸の両方を切断する。次いで、ゲノム中の得られた二本鎖破断は、最適なゲノム遺伝子座から放出される目的の核酸のための組込み部位になり得る。あるいは、ゲノム中に既に位置するZFNの発現は、導入された目的の核酸のための組込み部位に次いでなり得るゲノム中の二本鎖破断を誘導するために、目的のDNAの導入後に誘導され得る。この方法で、任意の目的の領域における目的のDNAの標的化された組込みの効率が改善され得るが、それは、この方法が、ZFNをコードする核酸および目的のDNAの両方の同時取り込みに依存しないからである。
目的の核酸はまた、引き続く挿入のための標的部位として機能するように、最適な非遺伝子ダイズゲノム遺伝子座中に挿入され得る。例えば、さらなるZFN設計のための認識部位を含むDNA配列から構成される目的の核酸が、この遺伝子座中に挿入され得る。引き続いて、さらなるZFN設計が、細胞において生成および発現され得、その結果、元の目的の核酸が切断され、修復または相同組換えによって改変される。この方法で、目的の核酸の反復する組込みが、ダイズ植物などの双子葉植物の最適な非遺伝子ゲノム遺伝子座において生じ得る。
最適な非遺伝子ダイズゲノム遺伝子座中に挿入され得る例示的な外因性配列には、任意のポリペプチドコード配列(例えば、cDNA)、プロモーター、エンハンサーおよび他の調節配列(例えば、干渉RNA配列、shRNA発現カセット、エピトープタグ、マーカー遺伝子、切断酵素認識部位および種々の型の発現構築物が含まれるがこれらに限定されない。かかる配列は、標準的な分子生物学的技術(クローニング、合成など)を使用して容易に取得され得、および/または市販されている。
ZFNを発現させるために、融合タンパク質をコードする配列は、典型的には、転写を指向させるためのプロモーターを含む発現ベクター中にサブクローニングされる。適切な原核生物および真核生物プロモーターは、当該分野で周知であり、例えば、Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3.sup.rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990);およびCurrent Protocols in Molecular Biology (Ausubel et al., 上記)に記載されている。ZFNを発現するための細菌発現系は、例えば、大腸菌(E. coli)、バチルス属(Bacillus)種およびサルモネラ属(Salmonella)において入手可能である(Palva et al., Gene 22:229-235 (1983))。かかる発現系のためのキットは市販されている。哺乳動物細胞、酵母および昆虫細胞についての真核生物発現系は、当業者に周知であり、市販もされている。
遺伝子材料を細胞中に輸送するために使用される特定の発現ベクターは、融合タンパク質の意図した使用、例えば、植物、動物、細菌、真菌、原生動物などにおける発現に関して、選択される(以下に記載する発現ベクターを参照のこと)。標準的な細菌および動物の発現ベクターは、当該分野で公知であり、例えば、米国特許出願公開第20050064474号A1ならびに国際特許公開WO05/084190、WO05/014791およびWO03/080809に詳細に記載されている。
標準的なトランスフェクション方法は、標準的な技術を使用して次いで精製され得る大量のタンパク質を発現する細菌、哺乳動物、酵母または昆虫細胞株を産生するために使用され得る(例えば、Colley et al., J. Biol. Chem. 264:17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)を参照のこと)。真核生物細胞および原核生物細胞の形質転換は、標準的な技術に従って実施される(例えば、Morrison, J. Bact. 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds., 1983)を参照のこと。
開示された方法および組成物は、最適な非遺伝子ダイズゲノム遺伝子座の1つなどの所定の位置中にポリヌクレオチドドナー配列を挿入するために使用され得る。ダイズゲノム中に導入された導入遺伝子の発現はその組込み部位に決定的に依存するので、これは有用である。したがって、除草剤耐性、昆虫抵抗性、栄養素、抗生物質または治療分子をコードする遺伝子は、標的化された組換えによって挿入され得る。
一実施形態では、この目的の核酸は、グリホサートもしくは別の除草剤に対するさらなる抵抗性もしくは耐性を提供する遺伝子コード配列と、組み合わされるもしくは「スタックされ」、ならびに/あるいは選択された昆虫もしくは疾患に対する抵抗性および/または栄養増強および/または改善された農学的特徴および/または飼料、食品、工業、医薬もしくは他の使用において有用なタンパク質もしくは他の産物を提供する。植物ゲノム内の2以上の目的の核酸配列の「スタッキング」は、例えば、2以上の事象を使用する従来の植物育種、目的の配列を含む構築物による植物の形質転換、トランスジェニック植物の再形質転換、または相同組換えを介した標的化された組込みによる新たな形質の追加を介して、達成され得る。
目的のかかるポリヌクレオチドドナーヌクレオチド配列には、以下に提供される例が含まれるがこれらに限定されない:
1.有害生物または疾患に対する抵抗性を付与する遺伝子またはコード配列(例えば、iRNA)
(A)植物疾患抵抗性遺伝子。植物防御は、植物における疾患抵抗性遺伝子(R)の産物と病原体における対応する非病原性(Avr)遺伝子の産物との間の特異的相互作用によって活性化される場合が多い。植物変種は、特定の病原体株に対して抵抗性である植物を操作するために、クローニングされた抵抗性遺伝子で形質転換され得る。かかる遺伝子の例には、クラドスポリウム・フルブム(Cladosporium fulvum)に対する抵抗性に関するトマトCf−9遺伝子(Jones et al., 1994 Science 266:789)、シュードモナス・シリンガエ(Pseudomonas syringae)pv.tomatoに対する抵抗性に関するタンパク質キナーゼをコードするトマトPto遺伝子(Martin et al., 1993 Science 262:1432)、およびシュードモナス・シリンガエ(Pseudomonas syringae)に対する抵抗性に関するシロイヌナズナ属(Arabidopsis)RSSP2遺伝子(Mindrinos et al., 1994 Cell 78:1089)が含まれる。
(B)バチルス・チューリンゲンシス(Bacillus thuringiensis)タンパク質、その誘導体またはそれらに基づいてモデル化した合成ポリペプチド、例えば、Bt δ−エンドトキシン遺伝子(Geiser et al., 1986 Gene 48:109)および植物殺虫剤(vegetative insecticidal)(VIP)遺伝子(例えば、Estruch et al. (1996) Proc. Natl. Acad. Sci. 93:5389-94を参照のこと)のヌクレオチド配列。さらに、δ−エンドトキシン遺伝子をコードするDNA分子は、ATCC受入番号40098、67136、31995および31998の下で、American Type Culture Collection(Rockville、Md.)から購入され得る。
(C)レクチン、例えば、いくつかのクリビア・ミニアータ(Clivia miniata)マンノース結合レクチン遺伝子のヌクレオチド配列(Van Damme et al., 1994 Plant Molec. Biol. 24:825)。
(D)ビタミン結合タンパク質、例えば、害虫に対する幼虫駆除剤(larvicide)として有用なアビジンおよびアビジンホモログ。米国特許第5,659,026号を参照のこと。
(E)酵素阻害剤、例えば、プロテアーゼ阻害剤またはアミラーゼ阻害剤。かかる遺伝子の例には、イネシステインプロテイナーゼ阻害剤(Abe et al., 1987 J. Biol. Chem. 262:16793)、タバコプロテイナーゼ阻害剤I(Huub et al., 1993 Plant Molec. Biol. 21:985)およびα−アミラーゼ阻害剤(Sumitani et al., 1993 Biosci. Biotech. Biochem. 57:1243)が含まれる。
(F)昆虫特異的ホルモンまたはフェロモン、例えば、エクジステロイドおよび幼若ホルモン そのバリアント、それらに基づく模倣物、またはそれらのアンタゴニストもしくはアゴニスト、例えば、クローニングされた幼若ホルモンエステラーゼ、幼若ホルモンの不活性化因子のバキュロウイルス発現(Hammock et al., 1990 Nature 344:458)。
(G)発現の際に、影響される有害生物の生理機能を破壊する、昆虫特異的ペプチドまたは神経ペプチド(J. Biol. Chem. 269:9)。かかる遺伝子の例には、昆虫利尿ホルモン受容体(Regan, 1994)、ディプロプテラ・プンクタータ(Diploptera punctata)において同定されたアロスタチン(allostatin)(Pratt, 1989)および昆虫特異的麻痺性神経毒(米国特許第5,266,361号)が含まれる。
(H)ヘビ、スズメバチなどによって天然に産生される昆虫特異的毒液、例えば、サソリ昆虫毒(insectotoxic)ペプチド(Pang, 1992 Gene 116:165)。
(I)モノテルペン、セスキテルペン、ステロイド、ヒドロキサム酸、フェニルプロパノイド誘導体または殺虫剤活性を有する別の非タンパク質分子の過剰蓄積を担う酵素。
(J)天然のものであれ合成であれ、生物学的に活性な分子の翻訳後修飾を含む改変に関与する酵素;例えば、解糖酵素、タンパク質分解酵素、脂肪分解酵素、ヌクレアーゼ、シクラーゼ、トランスアミナーゼ、エステラーゼ、ヒドロラーゼ、ホスファターゼ、キナーゼ、ホスホリラーゼ、ポリメラーゼ、エラスターゼ、キチナーゼおよびグルカナーゼ。かかる遺伝子の例には、callas遺伝子(PCT出願公開WO93/02197)、キチナーゼコード配列(これは、例えば、受入番号3999637および67152の下でATCCから取得され得る)、タバコ鉤虫キチナーゼ(Kramer et al., 1993 Insect Molec. Biol. 23:691)、およびパセリubi4−2ポリユビキチン遺伝子(Kawalleck et al., 1993 Plant Molec. Biol. 21:673)が含まれる。
(K)シグナル伝達を刺激する分子。かかる分子の例には、リョクトウカルモジュリンcDNAクローンのヌクレオチド配列(Botella et al., 1994 Plant Molec. Biol. 24:757)およびダイズカルモジュリンcDNAクローンのヌクレオチド配列(Griess et al., 1994 Plant Physiol. 104:1467)が含まれる。
(L)疎水性モーメントペプチド。米国特許第5,659,026号および同第5,607,914号を参照のこと;後者は、疾患抵抗性を付与する合成抗菌ペプチドを教示している。
(M)膜パーミアーゼ、チャネル形成因子またはチャネルブロッカー、例えば、トランスジェニックタバコ植物をシュードモナス・ソラナセアラム(Pseudomonas solanacearum)に対して抵抗性にする、セクロピン−β溶解ペプチドアナログ(Jaynes et al., 1993 Plant Sci. 89:43)。
(N)ウイルス侵襲性タンパク質またはそれに由来する複合毒素。例えば、形質転換された植物細胞におけるウイルスコートタンパク質の蓄積は、そのコートタンパク質遺伝子が由来するウイルスならびに関連ウイルスによってもたらされる、ウイルス感染および/または疾患発症に対する抵抗性を与える。アルファルファモザイクウイルス、キュウリモザイクウイルス、タバコ条斑病ウイルス、ジャガイモウイルスX、ジャガイモウイルスY、タバコエッチ病ウイルス、タバコ茎えそウイルス(tobacco rattle virus)およびタバコモザイクウイルスに対する、コートタンパク質媒介性の抵抗性が、形質転換された植物に付与されている。例えば、Beachy et al. (1990) Ann. Rev. Phytopathol. 28:451を参照のこと。
(O)昆虫特異的抗体またはそれ由来の免疫毒素。したがって、昆虫の腸における重要な代謝機能に対して標的化された抗体は、影響される酵素を不活性化させて、昆虫を死滅させる。例えば、Taylor et al. (1994) Abstract #497, Seventh Int'l. Symposium on Molecular Plant-Microbe Interactionsは、単鎖抗体断片の産生を介した、トランスジェニックタバコにおける酵素不活性化を示す。
(P)ウイルス特異的抗体。例えば、組換え抗体遺伝子を発現するトランスジェニック植物がウイルス攻撃から保護されることを示す、Tavladoraki et al. (1993) Nature 266:469を参照のこと。
(Q)病原体または寄生生物によって天然に産生される発育抑制(developmental-arrestive)タンパク質。したがって、真菌エンドα−1,4−Dポリガラクツロナーゼは、植物細胞壁ホモ−α−1,4−D−ガラクツロナーゼを可溶化させることによって、真菌コロニー形成および植物栄養素放出を促進する(Lamb et al., 1992) Bio/Technology 10:1436。マメエンドポリガラクツロナーゼ阻害タンパク質をコードする遺伝子のクローニングおよび特徴付けは、Toubart et al. (1992 Plant J. 2:367)によって記載されている。
(R)植物によって天然に産生される発育抑制タンパク質、例えば、真菌疾患に対する増加した抵抗性を提供するオオムギリボソーム不活性化遺伝子(Longemann et al., 1992). Bio/Technology 10:3305。
(S)RNA分子が標的遺伝子の発現を阻害するために使用される、RNA干渉。一例では、RNA分子は、部分的にまたは完全に二本鎖であり、サイレンシング応答を誘発し、低分子干渉RNAへのdsRNAの切断を生じ、次いで、これらの低分子干渉RNAは、相同なmRNAを破壊する標的化複合体中に取り込まれる。例えば、Fireら、米国特許第6,506,559号;Grahamら、米国特許第6,573,099号を参照のこと。
2.除草剤に対する抵抗性を付与する遺伝子
(A)成長点(growing point)または成長点(meristem)を阻害する除草剤、例えば、イミダザリノン(imidazalinone)、スルホンアニリド(sulfonanilide)またはスルホニルウレア除草剤に対する抵抗性または耐性をコードする遺伝子。このカテゴリー中の例示的な遺伝子は、アセトヒドロキシ酸シンターゼ(AHAS)酵素(Miki et al., 1990 Theor. Appl. Genet. 80:449)としても公知の、変異体アセト乳酸シンターゼ(ALS)(Lee et al., 1988 EMBOJ. 7:1241)をコードする。
(B)変異体EPSPシンターゼおよびaroA遺伝子によって、またはDGT−28、2mEPSPS、GAT(グリホサートアセチルトランスフェラーゼ)またはGOX(グリホサートオキシダーゼ)などの遺伝子による代謝不活性化を介して与えられる、グリホサートに対する抵抗性もしくは耐性、ならびに他のホスホノ化合物、例えば、グルホシネート(pat、barおよびdsm−2遺伝子)、およびアリールオキシフェノキシプロピオン酸およびシクロヘキサンジオン(ACCase阻害剤コード遺伝子)に対する抵抗性もしくは耐性をコードする、1または複数のさらなる遺伝子。例えば、グリホサート抵抗性を付与し得るEPSPの一形態のヌクレオチド配列を開示する、米国特許第4,940,835号を参照のこと。変異体aroA遺伝子をコードするDNA分子は、ATCC受入番号39256の下で取得され得、この変異体遺伝子のヌクレオチド配列は、米国特許第4,769,061号に開示されている。欧州特許出願第0333033号および米国特許第4,975,374号は、L−ホスフィノトリシンなどの除草剤に対する抵抗性を付与するグルタミンシンテターゼ遺伝子のヌクレオチド配列を開示している。ホスフィノトリシンアセチルトランスフェラーゼ遺伝子のヌクレオチド配列は、欧州特許出願第0242246号に提供されている。De Greef et al. (1989) Bio/Technology 7:61は、ホスフィノトリシンアセチルトランスフェラーゼ活性をコードするキメラbar遺伝子を発現するトランスジェニック植物の産生を記載している。アリールオキシフェノキシプロピオン酸およびシクロヘキサンジオン、例えば、セトキシジムおよびハロキシホップに対する抵抗性を付与する遺伝子の例示は、Marshall et al. (1992) Theor. Appl. Genet. 83:435によって記載されるAccl−S1、Accl−S2およびAccl−S3遺伝子である。
(C)光合成を阻害する除草剤、例えば、トリアジン(psbAおよびgs+遺伝子)およびベンゾニトリル(ニトリラーゼ遺伝子)に対する抵抗性または耐性をコードする遺伝子。Przibilla et al. (1991) Plant Cell 3:169は、クラミドモナス属(Chlamydomonas)を形質転換するための、変異体psbA遺伝子をコードするプラスミドの使用を記載している。ニトリラーゼ遺伝子のヌクレオチド配列は、米国特許第4,810,648号に開示されており、これらの遺伝子を含むDNA分子は、ATCC受入番号53435、67441および67442の下で入手可能である。グルタチオンS−トランスフェラーゼをコードするDNAのクローニングおよび発現は、Hayes et al. (1992) Biochem. J. 285:173によって記載されている。
(D)パラ−ヒドロキシフェニルピルベート(HPP)がホモゲンチセート(homogentisate)へと変形される反応を触媒する酵素、ヒドロキシフェニルピルビン酸ジオキシゲナーゼ(HPPD)に結合する除草剤に対する抵抗性または耐性をコードする遺伝子。これには、除草剤、例えば、イソキサゾール(EP418175、EP470856、EP487352、EP527036、EP560482、EP682659、米国特許第5,424,276号)、特に、ダイズに対する選択的除草剤であるイソキサフルトール、ジケトニトリル(EP496630、EP496631)、特に、2−シアノ−3−シクロプロピル−1−(2−SO2CH3−4−CF3フェニル)プロパン−1,3−ジオンおよび2−シアノ−3−シクロプロピル−1−(2−SO2CH3−4−2,3Cl2フェニル)プロパン−1,3−ジオン、トリケトン(EP625505、EP625508、米国特許第5,506,195号)、特に、スルコトリオン、およびピラゾリネート(pyrazolinate)が含まれる。例えば、米国特許第6,268,549号および同第6,245,968号ならびに米国特許出願公開第20030066102号に記載される遺伝子を含む、植物においてHPPDの過多を生じる遺伝子は、かかる除草剤に対する耐性または抵抗性を提供し得る。
(E)フェノキシオーキシン除草剤、例えば、2,4−ジクロロフェノキシ酢酸(2,4−D)に対する抵抗性または耐性をコードし、アリールオキシフェノキシプロピオネート(AOPP)除草剤に対する抵抗性または耐性もまた付与し得る、遺伝子。かかる遺伝子の例には、米国特許第7,838,733号に記載される、α−ケトグルタル酸依存性ジオキシゲナーゼ酵素(aad−1)遺伝子が含まれる。
(F)フェノキシオーキシン除草剤、例えば、2,4−ジクロロフェノキシ酢酸(2,4−D)に対する抵抗性または耐性をコードし、ピリジルオキシオーキシン除草剤、例えば、フルロキシピルまたはトリクロピルに対する抵抗性または耐性もまた付与し得る、遺伝子。かかる遺伝子の例には、WO2007/053482A2に記載される、α−ケトグルタル酸依存性ジオキシゲナーゼ酵素遺伝子(aad−12)が含まれる。
(G)ジカンバに対する抵抗性または耐性をコードする遺伝子(例えば、米国特許出願公開第20030135879号を参照のこと)。
(H)プロトポルフィリノーゲンオキシダーゼ(PPO)を阻害する除草剤に対する抵抗性または耐性を提供する遺伝子(米国特許第5,767,373号を参照のこと)。
(I)光化学系II反応中心(PS II)のコアタンパク質に結合するトリアジン除草剤(例えば、アトラジン)および尿素誘導体(例えば、ジウロン)除草剤に対する抵抗性または耐性を提供する遺伝子(Brussian et al., (1989) EMBO J. 1989, 8(4): 1237-1245を参照のこと。
3.付加価値形質を付与するまたはそれに寄与する遺伝子
(A)例えば、植物のステアリン酸含量を増加させるためにアンチセンス遺伝子またはステアロイル−ACPデサチュラーゼでダイズまたはアブラナ属(Brassica)を形質転換することによって改変された脂肪酸代謝(Knultzon et al., 1992) Proc. Nat. Acad. Sci. USA 89:2624。
(B)減少したフィテート(phytate)含量
(1)フィターゼコード遺伝子、例えば、クロコウジカビ(Aspergillus niger)フィターゼ遺伝子(Van Hartingsveldt et al., 1993 Gene 127:87)の導入は、フィテート(phytate)の分解を増強し、形質転換された植物により多くの遊離ホスフェート(phosphate)を追加する。
(2)フィテート(phytate)含量を低減させる遺伝子が導入され得る。双子葉では、これは、例えば、低レベルのフィチン酸を特徴とするダイズ変異体の原因となる単一の対立遺伝子に関連するDNAをクローニングし、次いで再導入することによって、達成され得る(Raboy et al., 1990 Maydica 35:383)。
(C)例えば、デンプンの分岐パターンを変更する酵素をコードする遺伝子で植物を形質転換することによってもたらされる、改変された炭水化物組成。かかる酵素の例には、ストレプトコッカス・ミューカス(Streptococcus mucus)フルクトシルトランスフェラーゼ遺伝子(Shiroza et al., 1988) J. Bacteriol. 170:810、枯草菌(Bacillus subtilis)レバンスクラーゼ遺伝子(Steinmetz et al., 1985 Mol. Gen. Genel. 200:220)、バチルス・リケニフォルミス(Bacillus licheniformis)α−アミラーゼ(Pen et al., 1992 Bio/Technology 10:292)、トマトインベルターゼ遺伝子(Elliot et al., 1993)、オオムギアミラーゼ遺伝子(Sogaard et al., 1993 J. Biol. Chem. 268:22480)およびダイズ胚乳デンプン分岐酵素II(Fisher et al., 1993 Plant Physiol. 102:10450)が含まれる。
III.組換え構築物
本明細書に開示するように、本開示は、少なくとも1Kbの最適な非遺伝子ダイズゲノム配列および目的のDNAを含む組換えゲノム配列を提供し、ここで、この挿入された目的のDNAは、前記非遺伝子配列中に挿入されている。一実施形態では、目的のDNAは、分析ドメイン、有害生物または疾患に対する抵抗性を付与する遺伝子もしくはコード配列(例えば、iRNA)、除草剤に対する抵抗性を付与する遺伝子、または付加価値形質を付与するもしくはそれに寄与する遺伝子であり、この最適な非遺伝子ダイズゲノム配列は、以下の1、2、3、4、5、6、7または8の特徴を含む:
a.この非遺伝子配列は、約1Kb長〜約5.7Kb長であり、メチル化されたポリヌクレオチドを含まない;
b.この非遺伝子配列は、ダイズ植物などの双子葉植物のゲノム内で、0.01574〜83.52cM/Mbの比率の組換えを示す;
c.この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノムの、0〜0.494レベルのヌクレオソーム占有率を示す;
d.この非遺伝子配列は、ダイズゲノムなどの双子葉ゲノム中に含まれる任意の他の配列と、40%未満の配列同一性を共有する;
e.この非遺伝子配列は、ダイズ染色体中心などの双子葉染色体セントロメアから0〜0.99682のゲノム距離の比率の相対的位置値を有する;
f.この非遺伝子配列は、14.4〜45.9%のグアニン/シトシンパーセント含量範囲を有する;
g.この非遺伝子配列は、ネイティブ非遺伝子配列を含む連続するゲノムDNAの40Kb以内で、ダイズコード配列などの既知または予測された双子葉コード配列を含む遺伝子配列の近位に位置する;および
h.この非遺伝子配列は、第2の非遺伝子配列を少なくとも含むゲノム配列などの双子葉ゲノム配列の1Mb領域中に位置する。
一実施形態では、この最適な非遺伝子ダイズゲノム配列は、ネイティブ非遺伝子配列を含む連続するゲノムDNAの40Kb以内に、1〜18の既知または予測されたダイズコード配列を含む遺伝子領域を有するとして、さらに特徴付けられる。一実施形態では、この最適な非遺伝子ダイズ遺伝子座は、クラスター1、2、3、4、5、6、7、8、9、10、11、2、3、4、5、6、7、8、9、20、21、22、23、24、25、26、27、28、29、30、31または32の遺伝子座から選択される。
IV.トランスジェニック植物
組換えの最適な非遺伝子ダイズ遺伝子座を含むトランスジェニック植物もまた、本開示の一実施形態に従って提供される。かかるトランスジェニック植物は、当業者に公知の技術を使用して調製され得る。
形質転換された双子葉細胞、カルス、組織または植物(即ち、ダイズ細胞、カルス、組織または植物)は、形質転換性DNA上に存在するマーカー遺伝子によってコードされる形質について操作された植物材料を選択またはスクリーニングすることによって、同定および単離され得る。例えば、選択は、形質転換性遺伝子構築物がそれに対する抵抗性を付与する抗生物質または除草剤の阻害量を含む培地上で、操作された植物材料を増殖させることによって、実施され得る。さらに、形質転換された細胞は、組換え核酸構築物上に存在し得る任意の可視的マーカー遺伝子(例えば、黄色蛍光タンパク質、緑色蛍光タンパク質、赤色蛍光タンパク質、ベータ−グルクロニダーゼ、ルシフェラーゼ、BまたはC1遺伝子)の活性についてスクリーニングすることによっても、同定され得る。かかる選択およびスクリーニング方法論は、当業者に周知である。
物理的方法および生化学的方法もまた、挿入された遺伝子構築物を含む植物または植物細胞形質転換体を同定するために使用され得る。これらの方法には、以下が含まれるがこれらに限定されない:1)組換えDNA挿入物の構造を検出および決定するためのサザン分析またはPCR増幅;2)遺伝子構築物のRNA転写物を検出および試験するための、ノザンブロット、S1 RNase保護、プライマー伸長または逆転写PCR増幅;3)かかる遺伝子産物が遺伝子構築物によってコードされる場合、酵素またはリボザイム活性を検出するための酵素アッセイ;4)遺伝子構築物産物がタンパク質である場合、タンパク質ゲル電気泳動、ウエスタンブロット技術、免疫沈降または酵素結合イムノアッセイ(ELISA)。in situハイブリダイゼーション、酵素染色および免疫染色などのさらなる技術もまた、特定の植物器官および組織における組換え構築物の存在または発現を検出するために使用され得る。全てのこれらのアッセイを実施するための方法は、当業者に周知である。
本明細書に開示される方法を使用した遺伝子操作の効果は、例えば、目的の組織から単離されたRNA(例えば、mRNA)のノザンブロットによって観察され得る。典型的には、mRNAが存在する場合またはmRNAの量が増加した場合、対応する導入遺伝子が発現されていると想定できる。遺伝子および/またはコードされたポリペプチド活性を測定する他の方法が使用され得る。異なる型の酵素アッセイが、使用される基質、および反応産物または副産物の増加または減少を検出する方法に依存して、使用され得る。さらに、発現されたポリペプチドのレベルは、免疫化学的に、即ち、例えば、電気泳動的検出アッセイ(染色またはウエスタンブロッティングのいずれかを用いる)によって、ELISA、RIA、EIAおよび当業者に周知の他の抗体ベースのアッセイによって、測定され得る。1つの非限定的な例として、ELISAアッセイを使用したAAD−12(アリールオキシアルカノエートジオキシゲナーゼ;WO2011/066360を参照のこと)およびPAT(ホスフィノトリシン−N−アセチル−トランスフェラーゼ(PAT))タンパク質の検出は、その全体が参照により本明細書に組み込まれる米国特許出願公開第20090093366号に記載されている。導入遺伝子は、植物の一部の組織においてもしくは一部の発生段階において選択的に発現され得、または導入遺伝子は、実質的にその生活環全体に沿って、実質的に全ての植物組織において発現され得る。しかし、任意の組合せ的発現様式もまた適用可能である。
当業者は、外因性ポリヌクレオチドドナー配列がトランスジェニック植物中に安定に取り込まれ、作動可能であることが確認された後に、それが性的交配によって他の植物中に導入され得ることを認識する。いくつかの標準的な育種技術のいずれかが、交配される種に依存して使用され得る。
本開示は、上記トランスジェニック植物の種子もまた包含し、この種子は、導入遺伝子または遺伝子構築物を有する。本開示はさらに、上記トランスジェニック植物の後代、クローン、細胞株または細胞を包含し、この後代、クローン、細胞株または細胞は、最適な遺伝子座に挿入された導入遺伝子または遺伝子構築物を有する。
上記形質転換技術のいずれかによって産生される形質転換された植物細胞は、形質転換された遺伝子型を有し、したがって所望の表現型を有する植物全体を再生するために、培養され得る。かかる再生技術は、組織培養増殖培地中の特定の植物ホルモンの操作に依存し、典型的には、所望のヌクレオチド配列と一緒に導入された殺生物剤および/または除草剤マーカーに依存する。培養されたプロトプラストからの植物再生は、Evans, et al., "Protoplasts Isolation and Culture" in Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983;およびBinding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985に記載されている。再生は、植物カルス、外植片、器官、花粉、胚またはそれらの部分からも得られ得る。かかる再生技術は、Klee et al. (1987) Ann. Rev. of Plant Phys. 38:467-486中に一般に記載されている。
ポリペプチドをコードするヌクレオチド配列を含むトランスジェニック植物または植物材料は、一部の実施形態では、以下の特徴のうち1または複数を示し得る:植物の細胞におけるポリペプチドの発現;植物の細胞の色素体におけるポリペプチドの部分の発現;植物の細胞のサイトゾルから細胞の色素体中へのポリペプチドのインポート;植物の細胞におけるポリペプチドの色素体特異的発現;および/または植物の細胞におけるポリペプチドの局在化。かかる植物は、コードされたポリペプチドの発現以外の1または複数の望ましい形質をさらに有し得る。かかる形質には、例えば以下が含まれ得る:昆虫、他の有害生物および疾患原因因子に対する抵抗性;除草剤に対する耐性;増強された安定性、収量または保存期間;環境耐性;医薬品製造;工業製品製造;および栄養増強。
一実施形態によれば、組換えの最適な非遺伝子ダイズ遺伝子座を含むトランスジェニック双子葉プロトプラスト(即ち、ダイズプロトプラスト)が提供される。より具体的には、双子葉プロトプラスト(即ち、ダイズプロトプラスト)の最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のDNAを含むダイズプロトプラストなどの双子葉プロトプラストが提供され、前記非遺伝子ダイズゲノム遺伝子座は、約1Kb長〜約5.7Kb長であり、いずれのメチル化されたヌクレオチドも欠く。一実施形態では、このトランスジェニック双子葉プロトプラスト(即ち、トランスジェニックダイズプロトプラスト)は、最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のDNAを含み、目的のDNAは、分析ドメインおよび/またはオープンリーディングフレームを含む。一実施形態では、この挿入された目的のDNAは、ペプチドをコードし、さらなる一実施形態では、目的のDNAは、導入遺伝子を含む少なくとも1つの遺伝子発現カセットを含む。
一実施形態によれば、組換えの最適な非遺伝子ダイズ遺伝子座を含む、トランスジェニック双子葉植物、双子葉植物部分または双子葉植物細胞(即ち、トランスジェニックダイズ植物、ダイズ植物部分またはダイズ植物細胞)が提供される。より具体的には、双子葉植物、双子葉植物部分または双子葉植物細胞(即ち、ダイズ植物、ダイズ植物部分またはダイズ植物細胞)の最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のDNAを含む、双子葉植物、双子葉植物部分または双子葉植物細胞(即ち、ダイズ植物、ダイズ植物部分またはダイズ植物細胞)が提供され、前記非遺伝子ダイズゲノム遺伝子座は、約1Kb長〜約5.7Kb長であり、いずれのメチル化されたヌクレオチドも欠く。一実施形態では、このトランスジェニック双子葉植物、双子葉植物部分または双子葉植物細胞(即ち、トランスジェニックダイズ植物、ダイズ植物部分またはダイズ植物細胞)は、最適な非遺伝子ダイズゲノム遺伝子座中に挿入された目的のDNAを含み、目的のDNAは、分析ドメインおよび/またはオープンリーディングフレームを含む。一実施形態では、この挿入された目的のDNAは、ペプチドをコードし、さらなる一実施形態では、目的のDNAは、導入遺伝子を含む少なくとも1つの遺伝子発現カセットを含む。
実施形態1によれば、低メチル化され、標的化可能であり、ダイズゲノム内の遺伝子領域の近位に位置し、組換えの証拠を示す、少なくとも1Kbの非遺伝子ダイズゲノム配列が、非遺伝子配列中に挿入された目的のDNAをさらに含む、組換え配列が提供される。実施形態2によれば、実施形態1の組換え配列は、以下の特徴:
a.前記非遺伝子配列のメチル化のレベルは、1%以下であること;
b.前記非遺伝子配列は、前記ダイズゲノム中に含まれる任意の他の配列と、40%未満の配列同一性を共有すること;
c.前記非遺伝子配列は、既知または予測された発現性ダイズコード配列の40Kb領域以内に位置すること;および
d.前記非遺伝子配列は、0.01574cM/Mbよりも高い、前記ダイズゲノム内での組換え頻度を示すことを有する。実施形態3によれば、前記非遺伝子配列が、5.73Kbの最大長さを含む、実施形態1または2の組換え配列が提供される。実施形態4によれば、前記非遺伝子配列が、1%以下のヌクレオチドメチル化を含む、実施形態1〜3のいずれかの組換え配列が提供される。実施形態5によれば、前記非遺伝子配列が、1Kb〜5.73Kbの長さであり、メチル化されたシトシン残基を含まない、実施形態1〜4のいずれかの組換え配列が提供される。実施形態6によれば、前記非遺伝子配列が、前記ダイズゲノム内の任意の他の配列と、40%よりも高い配列同一性ではアラインしない、実施形態1〜5のいずれかの組換え配列が提供される。
実施形態7によれば、前記非遺伝子配列が、0.01574cM/Mbよりも高い組換え頻度で組換えの証拠を示す、請求項1〜6のいずれかの組換え配列が提供される。実施形態8によれば、前記非遺伝子配列を含むネイティブダイズゲノムの40Kb領域が、少なくとも1つの既知もしくは予測されたダイズコード配列、または既知のダイズ遺伝子の2Kb上流および/もしくは1Kb下流の配列を含む配列も含む、請求項1〜7のいずれかの組換え配列が提供される。実施形態9によれば、前記既知または予測されたダイズコード配列が、ダイズタンパク質を発現する、請求項1〜8のいずれかの組換え配列が提供される。実施形態10によれば、前記非遺伝子配列が、メチル化されたポリヌクレオチドを含まない、請求項1〜9のいずれかの組換え配列が提供される。実施形態11によれば、前記非遺伝子配列の一方の末端が、発現された内因性遺伝子の40Kb以内に存在する、請求項1〜10のいずれかの組換え配列が提供される。実施形態12によれば、前記目的のDNAが、分析ドメインを含む、請求項1〜11のいずれかの組換え配列が提供される。実施形態13によれば、前記目的のDNAが、ペプチドをコードしない、請求項1〜12のいずれかの組換え配列が提供される。実施形態14によれば、前記目的のDNAが、ペプチドをコードし、殺虫剤抵抗性遺伝子、除草剤耐性遺伝子、窒素使用効率遺伝子、水利用効率遺伝子、栄養品質遺伝子、DNA結合遺伝子または選択可能なマーカー遺伝子を任意選択でコードする、請求項1〜12のいずれかの組換え配列が提供される。実施形態16によれば、以下の特徴:
a.前記非遺伝子配列は、1%未満のDNAメチル化を含むこと;
b.前記非遺伝子配列は、前記ダイズゲノム内で、0.01574〜83.52cM/Mbの組換え頻度を示すこと;
c.前記非遺伝子配列は、ダイズゲノムの、0〜0.494レベルのヌクレオソーム占有率を示すこと;
d.前記非遺伝子配列は、ダイズゲノム中に含まれる任意の他の配列と、40%未満の配列同一性を共有すること;
e.前記非遺伝子配列は、ダイズ染色体セントロメアから0〜0.99682のゲノム距離の比率の相対的位置値を有すること;
f.前記非遺伝子配列は、14.36〜45.9%のグアニン/シトシンパーセント含量範囲を有すること;
g.前記非遺伝子配列は、遺伝子配列の近位に位置すること;および
h.前記非遺伝子配列は、1または複数のさらなる非遺伝子配列を含むダイズゲノム配列の1Mb領域中に位置すること
を含む、請求項1〜14のいずれかの組換え配列が提供される。
実施形態17によれば、実施形態1〜14および16のいずれか1つの組換え配列を含む、ダイズ植物、ダイズ植物部分またはダイズ植物細胞である。実施形態18によれば、前記既知または予測されたダイズコード配列が、0.000415〜872.7198の範囲のレベルで発現する、実施形態17のダイズ植物、ダイズ植物部分またはダイズ植物細胞が提供される。実施形態19によれば、前記目的のDNAおよび/または前記非遺伝子配列が、前記非遺伝子配列中への前記目的のDNAの挿入の間に改変される、請求項1〜14、16または17のいずれかの組換え配列が提供される。
実施形態20によれば、1つの非遺伝子ダイズゲノム配列に標的化された目的のDNAを含むトランスジェニック植物細胞を作製する方法が提供され、この方法は、以下を含む:
a.最適な非遺伝子ダイズゲノム遺伝子座を選択するステップ;
b.前記非遺伝子ダイズゲノム配列を切断する部位特異的ヌクレアーゼを、植物細胞中に導入するステップ;
c.前記目的のDNAを前記植物細胞中に導入するステップ;
d.前記目的のDNAを前記非遺伝子遺伝子座中に標的化するステップであって、前記非遺伝子配列の切断は、前記非遺伝子遺伝子座中へのポリヌクレオチド配列の組込みを促進する、ステップ;および
e.前記非遺伝子遺伝子座に標的化された前記目的のDNAを含むトランスジェニック植物細胞を選択するステップ。
[実施例1]
ダイズにおける標的化可能なゲノム遺伝子座の同定
ダイズゲノムを、具体的基準を使用するバイオインフォマティクスアプローチを用いてスクリーニングして、ポリヌクレオチドドナーを標的化するための最適なゲノム遺伝子座を選択した。ゲノム遺伝子座を選択するために使用した具体的基準は、植物ゲノム内の導入遺伝子の最適な発現についての検討、部位特異的DNA結合タンパク質によるゲノムDNAの最適な結合についての検討、およびトランスジェニック植物製品の開発要求を使用して開発した。ゲノム遺伝子座を同定および選択するために、ダイズゲノムのゲノムおよびエピゲノムデータセットを、バイオインフォマティクスアプローチを使用してスキャンした。ゲノムおよびエピゲノムデータセットのスクリーニングは、以下の基準を満たした選択された遺伝子座を生じた:1)低メチル化され、1Kb長よりも大きい;2)ポリヌクレオチドドナーの部位特異的ヌクレアーゼ媒介性組込みを介して標的化可能;3)農学的に中立または非遺伝子;4)組み込まれた導入遺伝子がそこから発現され得る領域;および5)遺伝子座内/遺伝子座の周囲の組換えを有する領域。したがって、合計7,018のゲノム遺伝子座(配列番号1〜配列番号7,018)を、これらの具体的基準を使用して同定した。これらの具体的基準はさらに、以下に詳細に記載されている。
低メチル化
ダイズゲノムをスキャンして、DNAが低メチル化された1Kbよりも大きい最適なゲノム遺伝子座を選択した。ダイズ(Glycine max)cultivar Williams82から単離した根組織および苗条組織のDNAメチル化プロファイルを、ハイスループット全ゲノム配列決定アプローチを使用して構築した。抽出したDNAを、メチル化されていないシトシンをウラシルに変換するが、メチル化されたシトシンには影響を与えないバイサルファイト処理に供し、次いで、Illumina HiSeqテクノロジーを使用して配列決定した(Krueger, F. et al. DNA methylome analysis using short bisulfite sequencing data. Nature Methods 9, 145-151 (2012))。生配列決定読み取りを、Krueger F, Andrews SR (2011) Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics 27: 1571-1572)に記載されるBismark(商標)マッピングソフトウェアを使用して収集し、ダイズc.v.Williams82参照ゲノムに対してマッピングした。
バイサルファイト変換プロセスの間に、メチル化されるDNA配列中のシトシンは、ウラシルに変換されないので、配列決定データにおけるシトシン塩基の存在は、DNAメチル化の存在を示す。参照配列にマッピングされる読み取りを分析して、DNAメチル化を支持するシトシン残基のゲノム位置を同定した。ゲノム中の各シトシン塩基についてのメチル化レベルを、その位置にマッピングされる読み取りの総数に対する、特定のシトシン塩基位置にマッピングされたメチル化される読み取りの数の百分率として計算した。以下の仮説は、メチル化レベルを、ダイズゲノム内の各塩基について如何にして計算したかを説明している。例えば、ダイズc.v.Williams82参照配列の第1染色体中の100位においてシトシン塩基が存在することを考慮する。100位におけるシトシン塩基にマッピングされた合計20の読み取りが存在し、これらの読み取りのうち10がメチル化されている場合、第1染色体中の100位におけるシトシン塩基についてのメチル化レベルは、50%と推定される。それに応じて、ダイズの根組織および苗条組織から取得したゲノムDNA塩基対の全てについてのメチル化レベルのプロファイルを計算した。ダイズゲノム中の独自の位置に正確にマッピングできなかった読み取りは、ダイズゲノム中に広がった反復性配列と一致し、優勢にメチル化されることが当該分野で公知である。
上記プロトコールを使用して、ダイズc.v.Williams82ゲノムのメチル化レベルを測定した。このように、メチル化された読み取りを含むダイズゲノムの領域は、ダイズゲノムのこれらの領域がメチル化されたことを示した。逆に、メチル化された読み取りが存在しなかったダイズゲノムの領域は、ダイズゲノムのこれらの領域がメチル化されなかったことを示した。メチル化されておらず、いずれのメチル化された読み取りも含まなかった苗条組織および根組織由来のダイズゲノムの領域は、「低メチル化された」領域とみなされる。可視化のために利用可能な根および苗条のメチル化プロファイルを作製するために、ウィグル(wiggle)プロット(http://useast.ensembl.org/info/website/upload/wig.html)を、ダイズc.v.Williams82染色体の各々について生成した。
上記のように、根組織および苗条組織において単一塩基対の解像度でDNAメチル化レベルを取得した後、ダイズゲノムを、100bpウインドウを使用してスクリーニングして、メチル化されるゲノム領域を同定した。ゲノム中のスクリーニングした各ウインドウについて、DNAメチル化レベルを、そのウインドウ中の全てのシトシン塩基におけるメチル化の平均レベルを計算することによって取得した。1%よりも高いDNAメチル化レベルを有するゲノムウインドウを、メチル化されたゲノム領域と呼んだ。根プロファイルおよび苗条プロファイル中の同定されたメチル化されたウインドウを組み合わせて、コンセンサスメチル化プロファイルを創出した。逆に、これらの基準を満たさず、コンセンサスプロファイルにおいてメチル化された領域として同定されなかったゲノム中の領域を、低メチル化された領域と呼んだ。表1は、同定された低メチル化された領域をまとめる。
ダイズc.v.WILLIAMS82ゲノムのこれらの低メチル化された領域を、さらに特徴付けて、これらの領域の無メチル化情況がオープンクロマチンの存在を示した場合に、特異的ゲノム遺伝子座を同定および選択した。このように、全ての引き続く分析を、同定された低メチル化された領域に対して実施した。
標的化可能性
ダイズc.v.WILLIAMS82において同定された低メチル化された部位をさらに分析して、どの部位がポリヌクレオチドドナーの部位特異的ヌクレアーゼ媒介性組込みを介して標的化可能であるかを決定した。ダイズ(Glycine max)は、そのゲノムの歴史においてゲノム重複を受けた古倍数体(paleopolyploid)作物であることが公知である(Jackson et al Genome sequence of the palaeopolyploid soybean, Nature 463, 178-183 (2010))。ダイズゲノムは、メチル化され、高いレベルの配列重複を有する高度に反復性のDNAの長いストレッチを含むことが、当該分野で公知である。ダイズゲノム中の既知の反復性領域の注釈付け情報を、Soybean Genome Database(www.soybase.org、Shoemaker, R.C. et al. SoyBase, the USDA-ARS soybean genetics and genomics database. Nucleic Acids Res. 2010 Jan;38(Database issue):D843-6.)から収集した。
したがって、上で同定された低メチル化された部位をスクリーニングして、ダイズゲノム上の注釈付きの既知の反復性領域とアラインした任意の部位を除去した。この第1のスクリーニングを通過した残りの低メチル化された部位を、デフォルトパラメーター設定を使用するNCBI BLAST(商標)+ソフトウェア(バージョン2.2.25)実行を介したダイズゲノムデータベースのBLAST(商標)ベースの相同性検索を使用して、引き続いてスクリーニングした(Stephen F. Altschul et al (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25:3389-3402)。BLAST(商標)スクリーニングの結果として、40%を超える配列アラインメントカバー度で、ゲノム中の他の場所で顕著な一致を有した任意の低メチル化された部位を、さらなる分析から除去した。
農学的に中立または非遺伝子
ダイズc.v.William82において同定された低メチル化された部位をさらに分析して、どの部位が農学的に中立または非遺伝子であったかを決定した。このように、上記低メチル化された部位をスクリーニングして、任意の既知または予測された内因性ダイズc.v.William82コード配列とオーバーラップしたまたは含んだ任意の部位を除去した。この目的のために、既知の遺伝子の注釈付けデータおよび発現配列タグ(EST)データのマッピング情報を、Soybean Genomic Database(www.soybase.org−バージョン1.1遺伝子モデルを使用した、Jackson et al Genome sequence of the palaeopolyploid soybean Nature 463, 178-183 (2010))から収集した。オープンリーディングフレームに対してすぐ2Kb上流および1Kb下流の任意のゲノム領域もまた検討した。これらの上流領域および下流領域は、遺伝子機能に重要な既知または未知の保存された調節エレメントを含み得る。上に以前に記載した低メチル化された部位を、既知の遺伝子(2Kb上流および1Kb下流の領域を含む)およびESTの存在について分析した。既知の遺伝子(2Kb上流および1Kb下流の領域を含む)またはESTとアラインしたまたはオーバーラップした任意の低メチル化された部位を、下流の分析から除去した。
発現
ダイズc.v.Williams82において同定された低メチル化された部位をさらに分析して、どの部位が発現されたダイズ遺伝子の近位内に存在したかを決定した。ダイズ遺伝子の転写物レベルでの発現を、Mortazavi et al., Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008;5(7):621-628およびShoemaker RC et al., RNA-Seq Atlas of Glycine max: a guide to the soybean Transcriptome. BMC Plant Biol. 2010 Aug 5;10:160に記載されるように、RNAseq(商標)テクノロジーを使用して、ダイズc.v.Williams82の根組織および苗条組織から生成したトランスクリプトームプロファイリングデータを分析することによって測定した。各低メチル化された部位について、分析を完了して、低メチル化された部位の近位にある40Kb領域内に存在する任意の注釈付きの遺伝子、および低メチル化された部位の近位に位置する注釈付きの遺伝子の平均発現レベルを同定した。ゼロでない平均発現レベルを有する注釈付きの遺伝子から40Kbよりも遠くに位置した低メチル化された部位は、発現されたダイズ遺伝子の近位でないことが決定され、さらなる分析から除去した。
組換え
ダイズc.v.Williams82において同定された低メチル化された部位をさらに分析して、どの部位が組換えの証拠を有し、従来の育種を介した他の系統のダイズ中への最適なゲノム遺伝子座の浸透性交雑を促進できたかを決定した。多様なダイズ遺伝子型は、農学的に目的の形質を含む新たな改善されたダイズ系統を開発するために、従来の育種の間に慣用的に交配される。このように、導入遺伝子の植物媒介性の形質転換を介してダイズ系統内の最適なゲノム遺伝子座中に浸透性交雑される農学的形質は、従来の植物育種の間の減数分裂組換えを介して、他のダイズ系統、特に精鋭の系統中にさらに浸透性交雑されることが可能であるはずである。上記低メチル化された部位をスクリーニングして、あるレベルの減数分裂組換えを有した部位を同定および選択した。組換え「コールドスポット」として特徴付けられた染色体領域内に存在する任意の低メチル化された部位を、同定および除去した。ダイズでは、これらのコールドスポットを、組換え近交系マッピング集団(Williams 82×PI479752)から生成されたマーカーデータセットを使用して規定した。このデータセットは、ダイズ(Glycine max)参照ゲノム配列に物理的にマッピングされ得る約16,600のSNPマーカーからなった。
染色体にわたるダイズゲノムマーカーの任意の対の間での減数分裂組換え頻度を、マーカー間の遺伝的距離(センチモルガン(cM))の、マーカー間の物理的距離(メガベース(Mb))に対する比率に基づいて計算した。例えば、マーカーの対の間の遺伝的距離が1cMであり、マーカーの同じ対の間の物理的距離が2Mbであった場合、計算された組換え頻度は、0.5cM/Mbであると決定された。上で同定された各低メチル化された部位について、少なくとも1Mb離れたマーカーの対を選択し、組換え頻度を計算した。この方法の配備を使用して、低メチル化された部位の組換え頻度を計算した。0cM/Mbの組換え頻度を有する任意の低メチル化された部位を同定し、さらなる分析から除去した。0cM/Mbよりも高い組換え頻度を含む残りの低メチル化された領域を、さらなる分析のために選択した。
最適なゲノム遺伝子座の同定
上記選択基準の適用は、ダイズゲノムからの、合計90,325の最適なゲノム遺伝子座の同定を生じた。表2は、同定された最適なゲノム遺伝子座の長さをまとめる。これらの最適なゲノム遺伝子座は、以下の特徴を有する:1)1Kb長よりも大きい低メチル化されたゲノム遺伝子座;2)ポリヌクレオチドドナーの部位特異的ヌクレアーゼ媒介性組込みを介して標的化可能なゲノム遺伝子座;3)農学的に中立または非遺伝子のゲノム遺伝子座;4)導入遺伝子がそこから発現され得るゲノム遺伝子座;および5)ゲノム遺伝子座内の組換えの証拠。表2に記載される全ての最適なゲノム遺伝子座のうち、1Kbよりも大きい最適なゲノム遺伝子座だけをさらに分析し、ドナーポリヌクレオチド配列の標的化のために利用した。これらの最適なゲノム遺伝子座の配列は、配列番号1〜配列番号7,018として開示される。集合的に、これらの最適なゲノム遺伝子座は、本明細書の以下にさらに実証されるように、ドナーポリヌクレオチド配列で標的化され得るダイズゲノム内の位置である。
[実施例2]
ダイズ由来の最適なゲノム遺伝子座をクラスター化するためのF分布および主成分分析
7,018の同定された最適なゲノム遺伝子座(配列番号1〜配列番号7,018)を、F分布および主成分分析統計方法を使用してさらに分析して、最適なゲノム遺伝子座のグループ分けのための代表的な集団およびクラスターを規定した。
F分布分析
同定された7,018の最適なゲノム遺伝子座を、連続確率分布統計分析を使用して統計的に分析した。連続確率分布統計分析の一実施形態として、F分布検定を完了して、代表的な数の最適なゲノム遺伝子座を決定した。F分布検定分析を、当業者に公知の方程式および方法を使用して完了した。さらなるガイダンスについて、参照によって本明細書に組み込まれるK.M Remund, D. Dixon, DL. Wright and LR. Holden. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101-119に記載されるF分布検定分析は、F分布検定の非限定的な一例である。このF分布検定は、最適なゲノム遺伝子座のランダムサンプリングを仮定し、その結果、任意の非妥当遺伝子座は、7,018の最適なゲノム遺伝子座にわたって均等に分布し、サンプリングされた最適なゲノム遺伝子座の数は、7,018の最適なゲノム遺伝子座の総集団の10%以下である。
このF分布分析は、7,018の最適なゲノム遺伝子座のうち32が、95%信頼レベルで、7,018の最適なゲノム遺伝子座のうちの代表的な数を提供したことを示した。したがって、このF分布分析は、32の最適なゲノム遺伝子座が試験され、全てがドナーポリヌクレオチド配列で標的化可能な場合に、これらの結果が、7,018の最適なゲノム遺伝子座のうち91以上が95%信頼レベルで陽性であることを示すことを示した。7,018の最適なゲノム遺伝子座の合計百分率を検証する最良の推定は、32の試験した最適なゲノム遺伝子座の100%が標的化可能であった場合である。したがって、91%は、実際には、95%信頼レベルにおいて検証された真のパーセントの下限である。この下限は、95%信頼レベルについて、F分布の0.95分位点に基づく(Remund K, Dixon D, Wright D, and Holden L. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101-119)。
主成分分析
次に、主成分分析(PCA)統計方法を完了して、7,018の同定された最適なゲノム遺伝子座を含むデータセットの類似性および差異をさらに評価および可視化して、標的化検証のための多様な遺伝子座のサンプリングを可能にした。PCAには、より大きな数の相関変数を主成分と呼ばれるより少ない数の無相関な変数へと変形する数学的アルゴリズムが関与する。
このPCAを、7,018の同定された最適なゲノム遺伝子座を説明するために使用され得る計算可能な特徴または属性のセットを生成することによって、7,018の同定された最適なゲノム遺伝子座に対して完了した。各特徴は、数的に計算可能であり、7,018の同定された最適なゲノム遺伝子座のゲノムおよびエピゲノム情況を捕捉するために具体的に規定される。各ダイズの最適なゲノム遺伝子座についての10の特徴のセットを同定し、以下にさらに詳述する。
1.最適なゲノム遺伝子座の長さ
a.このデータセット中の最適なゲノム遺伝子座の長さは、最小1,000Bp〜最大5,713Bpの範囲であった。
2.最適なゲノム遺伝子座の周囲の1MB領域における組換え頻度
a.ダイズでは、染色体位置についての組換え頻度を、複数のマッピング集団から生成された内部高解像度マーカーデータセットを使用して規定した。
b.染色体にわたるマーカーの任意の対の間での組換え頻度を、マーカー間の遺伝的距離(センチモルガン(cM))の、マーカー間の物理的距離(Mb)に対する比率に基づいて計算した。例えば、マーカーの対の間の遺伝的距離が1cMであり、マーカーの同じ対の間の物理的距離が2Mbである場合、計算された組換え頻度は、0.5cM/Mbである。各最適なゲノム遺伝子座について、少なくとも1Mb離れたマーカーの対を選択し、この様式で組換え頻度を計算した。これらの組換え値は、最小0.01574cM/Mb〜最大83.52cM/Mbの範囲であった。
3.最適なゲノム遺伝子座の配列独自性のレベル
a.各最適なゲノム遺伝子座について、最適なゲノム遺伝子座のヌクレオチド配列を、デフォルトパラメーター設定を使用するNCBI BLAST(商標)+ソフトウェア(バージョン2.2.25)実行を使用するBLAST(商標)ベースの相同性検索を使用して、ダイズc.v.Williams82ゲノムに対してスキャンした(Stephen F. Altschul et al (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402)。これらの最適なゲノム遺伝子座配列は、ダイズc.v.Williams82ゲノムから同定されるので、この検索を介して同定された第1のBLAST(商標)ヒットは、ダイズc.v.Williams82配列自体を示す。各最適なゲノム遺伝子座配列についての第2のBLAST(商標)ヒットを同定し、このヒットのアラインメントカバー度(BLAST(商標)ヒットによってカバーされる最適なゲノム遺伝子座のパーセントとして示される)を、ダイズゲノム内の最適なゲノム遺伝子座配列の独自性の尺度として使用した。第2のBLAST(商標)ヒットについてのこれらのアラインメントカバー度値は、最小0%〜最大39.97%の配列同一性の範囲であった。より高いレベルの配列同一性においてアラインしたいずれの配列も、考慮しなかった。
4.最適なゲノム遺伝子座からその近隣における最も近い遺伝子までの距離
a.ダイズゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、Soybean Genome Database(www.soybase.orgにおいて入手可能−バージョン1.1遺伝子モデルを使用した、Jackson et al Genome sequence of the palaeopolyploid soybean, Nature 463, 178-183 (2010))から抽出した。各最適なゲノム遺伝子座について、上流位置および下流位置の両方を考慮して最も近い注釈付きの遺伝子を同定し、最適なゲノム遺伝子座配列とこの遺伝子との間の距離を測定した(Bp)。例えば、最適なゲノム遺伝子座が染色体Gm01中の2,500位から3,500位までに位置し、この最適なゲノム遺伝子座に対して最も近い遺伝子が染色体Gm01中の5,000位から6,000位までに位置する場合、最適なゲノム遺伝子座からこの最も近い遺伝子までの距離は、1500Bpであると計算される。7,018全ての最適なゲノム遺伝子座データセットについてのこれらの値は、最小1,001Bp〜最大39,482Bpの範囲であった。
5.最適なゲノム遺伝子座配列中のGC%
a.各最適なゲノム遺伝子座について、ヌクレオチド配列を分析して、存在するグアニン塩基およびシトシン塩基の数を推定した。この計数は、各最適なゲノム遺伝子座の配列長さの百分率として示され、GC%についての尺度を提供する。ダイズの最適なゲノム遺伝子座データセットについてのこれらのGC%値は、14.4%〜45.9%の範囲である。
6.最適なゲノム遺伝子座配列の周囲の40Kb近隣における遺伝子の数
a.ダイズc.v.Williams82ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、Soybean Genome Databaseから抽出した。7,018の最適なゲノム遺伝子座配列の各々について、最適なゲノム遺伝子座配列の周囲の40Kbウインドウを規定し、このウインドウとオーバーラップする位置を有する注釈付きの遺伝子の数を計数した。これらの値は、40Kb近隣内に最小1遺伝子〜最大18遺伝子の範囲であった。
7.最適なゲノム遺伝子座の周囲の40Kb近隣における平均遺伝子発現
a.ダイズ遺伝子の転写物レベルでの発現を、RNAseq(商標)テクノロジーを使用して、ダイズc.v.Williams82の根組織および苗条組織から生成した利用可能なトランスクリプトームプロファイリングデータを分析することによって測定した。ダイズc.v.Williams82ゲノム中の既知の遺伝子の遺伝子注釈付け情報および位置を、Soybean Genome Databaseから抽出した。各最適なゲノム遺伝子座について、最適なゲノム遺伝子座の周囲の40Kb近隣に存在したダイズc.v.Williams82ゲノム内の注釈付きの遺伝子を同定した。遺伝子の各々についての発現レベルを、上述の引用に記載されたトランスクリプトームプロファイルから抽出し、平均遺伝子発現レベルを計算した。ダイズのゲノム内の全ての遺伝子の発現値は大きく変動する。7,018の最適なゲノム遺伝子座データセットの全てについての平均発現値は、最小0.000415〜最大872.7198の範囲であった。
8.最適なゲノム遺伝子座の周囲のヌクレオソーム占有率のレベル
a.特定のヌクレオチド配列についてのヌクレオソーム占有率のレベルを理解することで、染色体機能および配列のゲノム情況についての情報が提供される。NuPoP(商標)統計パッケージを使用して、任意のサイズのゲノム配列について、ヌクレオソーム占有率および最も確からしいヌクレオソームポジショニングマップを予測した(Xi, L., Fondufe-Mittendor, Y., Xia, L., Flatow, J., Widom, J. and Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-346.)。7,018の最適なゲノム遺伝子座の各々について、ヌクレオチド配列を、NuPoP(商標)ソフトウェアを用いた分析に供し、ヌクレオソーム占有率スコアを計算した。ダイズの最適なゲノム遺伝子座データセットについてのこれらのヌクレオソーム占有率スコアは、最小0〜最大0.494の範囲であった。
9.染色体内の相対的位置(セントロメアの近位)
a.セントロメアは、2つの姉妹染色分体を接続する、染色体上の領域である。セントロメアのいずれかの側の染色体の部分は、染色体アームとして公知である。20全てのダイズ染色体上のセントロメアのゲノム位置を、公開されたダイズc.v.Williams82参照配列において同定した(Jackson et al Genome sequence of the palaeopolyploid soybean Nature 463, 178-183 (2010))。ダイズ染色体の各々におけるセントロメアの位置および染色体アームの長さに関する情報を、Soybean Genome Databaseから抽出した。各最適なゲノム遺伝子座について、最適なゲノム遺伝子座配列からそれが位置する染色体のセントロメアまでのゲノム距離が測定される(Bp)。染色体内の最適なゲノム遺伝子座の相対的位置は、それが存在する特定の染色体アームの長さに対する、セントロメアまでのそのゲノム距離の比率として示される。ダイズの最適なゲノム遺伝子座データセットについてのこれらの相対的位置値は、最小0〜最大0.99682のゲノム距離の比率の範囲であった。
10.1Mb領域中の最適なゲノム遺伝子座の数
a.各最適なゲノム遺伝子座について、最適なゲノム遺伝子座位置の周囲の1Mbゲノムウインドウを規定し、考慮した最適なゲノム遺伝子座を含む、この領域内に存在するまたはこの領域とオーバーラップする他のさらなる最適なゲノム遺伝子座の数を計算した。1Mb中の最適なゲノム遺伝子座の数は、最小1〜最大49の範囲であった。
7,018全ての最適なゲノム遺伝子座を、上記特徴および属性を使用して分析した。各最適なゲノム遺伝子座の特徴および属性のスコアについての結果または値は、表3(別々の電子出願として参照によって本明細書に組み込まれる)にさらに記載される。得られたデータセットを、PCA統計方法において使用して、7,018の同定された最適なゲノム遺伝子座をクラスターへとクラスター化した。このクラスター化プロセスの間に、最適なゲノム遺伝子座の「p」個の主成分の推定後に、32のクラスターのうちの1つへの最適なゲノム遺伝子座の割り当てが、「p」次元ユークリッド空間において進行した。「p」個の軸の各々を、「k」個の区間に分割した。同じ区間に割り当てられた最適なゲノム遺伝子座を、クラスターを形成するように一緒にグループ分けした。この分析を使用して、各PCA軸を、2つの区間に分割し、これを、実験的検証に必要とされるクラスターの数に関する先験的情報に基づいて選択した。得られたクラスターの全ての分析および可視化を、Chemical Computing Group Inc.(Montreal、Quebec、Canada)のMolecular Operating Environment(商標)(MOE)ソフトウェアを用いて実施した。
このPCAアプローチを使用して、上記、それらの特徴値に基づいて、32の別個のクラスターへと、7,018の同定された最適なダイズゲノム遺伝子座のセットをクラスター化した。このPCAプロセスの間に、5つの主成分(PC)が生成され、上位3つのPCは、データセット中の総変動の約90%を含む(表4)。これら3つのPCAを使用して、三次元プロット中に32のクラスターをグラフ的に表示した(図1)。クラスター化プロセスを完了した後、1つの代表的な最適なゲノム遺伝子座を、各クラスターから選択した。これを、そのクラスターの重心に最も近かった、各クラスター内の選択された最適なゲノム遺伝子座を選択することによって、実施した(表4)。32の代表的な最適なゲノム遺伝子座の染色体位置は、図2に示すように、20のダイズ染色体の中に均一に分布し、任意の特定のゲノム位置への偏りはない。
ポリヌクレオチドドナーポリヌクレオチド配列の標的化のためのゲノム遺伝子座の最終的選択
合計32のゲノム遺伝子座を、32の別個のクラスター内にクラスター化された7,018のゲノム遺伝子座から、ドナーポリヌクレオチド配列による標的化のために同定および選択した。32のクラスターの各々について、代表的ゲノム遺伝子座(表4中に上記したようにクラスターの重心に最も近い)または標的化系統との相同性を有するさらなる遺伝子座を選択した。これらのさらなる最適なゲノム遺伝子座を、ダイズ(Glycine max)c.v.Maverick(形質転換および標的化スクリーニング系統)およびダイズ(Glycine max)c.v.Williams82(参照系統)の両方についてのゲノムDNA配列データからなる全ゲノムデータベースに対して、7,018全ての選択された最適なゲノム配列を最初にスクリーニングすることによって選択して、両方の系統由来のゲノムにおけるカバー度(どのくらいの最適なゲノム遺伝子座が両方のゲノム中に存在したか)および配列同一性の百分率を決定した。Williams82ゲノムデータベース中の100%カバー度(両方のゲノム間でアラインされた最適な遺伝子座の配列全体長さ)および100%同一性を有する最適なゲノム遺伝子座を、標的化検証のために選択した。他の基準、例えば、最適なゲノム遺伝子座のゲノム遺伝子座サイズ、独自性の程度、GC%含量および染色体分布もまた、さらなる最適なゲノム遺伝子座を選択する際に考慮に入れた。32の選択された最適なゲノム遺伝子座の染色体位置および各ダイズの最適なゲノム遺伝子座の特定のゲノム立体配置は、それぞれ図3および表5に示される。
7,018のゲノム位置の大きい一そろいが、正確なゲノム操作テクノロジーを使用してドナーポリヌクレオチド配列を用いて標的化するための最適なゲノム遺伝子座として、ダイズゲノムにおいて同定されている。統計分析アプローチを配備して、類似のゲノム情況を有する32のクラスターへと7,018の選択されたゲノム遺伝子座をグループ化し、7,018の選択されたゲノム遺伝子座のセットを代表する32の選択されたゲノム遺伝子座のサブセットを同定した。これらの32の代表的遺伝子座を、ドナーポリヌクレオチド配列による標的化を介して、最適なゲノム遺伝子座として検証した。上記特徴または属性の10のセットについて生成した数値についてPCA統計分析を実施することによって、これらの10の特徴または属性を、より少ない次元のPCA成分へと計算した。このように、PCA成分を、上記10の特徴または属性を代表する5つの次元へと削減した(表6)。各PCA成分は、上記10の特徴または属性の組合せと等価である。PCA統計分析を使用して計算した5つの次元を構成するこれらのPCA成分から、32のクラスターを決定した。
[実施例3]
ダイズ中のゲノム遺伝子座を結合するジンクフィンガーの設計
代表的ゲノム遺伝子座の同定されたDNA配列に対するジンクフィンガータンパク質を、以前に記載されたように設計した。例えば、Urnov et al., (2005) Nature 435:646-551を参照のこと。例示的な標的配列および認識らせんは、表7(認識らせん領域設計)および表8(標的部位)に示される。表8では、ZFP認識らせんによって接触される標的部位中のヌクレオチドは、大文字で示され、非接触ヌクレオチドは小文字で示される。ジンクフィンガーヌクレアーゼ(ZFN)標的部位を、以前に記載した32の選択された最適なゲノム遺伝子座の全てについて設計した。多数のZFP設計を開発し、試験して、上記のようにダイズにおいて同定および選択された32の異なる代表的ゲノム遺伝子座標的部位と、最も高いレベルの効率で結合したフィンガーを同定した。最も高いレベルの効率でジンクフィンガー認識配列と結合した特異的ZFP認識らせん(表7)を、ダイズゲノム内のドナー配列の標的化および組込みに使用した。
これらのダイズの代表的ゲノム遺伝子座ジンクフィンガー設計を、CCHC構造を有する少なくとも1つのフィンガーを有するタンパク質をコードするジンクフィンガー発現ベクター中に取り込んだ。米国特許出願公開第2008/0182332号を参照のこと。特に、各タンパク質中の最後のフィンガーは、認識らせんとしてCCHC骨格を有した。非正準ジンクフィンガーコード配列を、4アミノ酸ZCリンカー、およびジンクフィンガーヌクレアーゼ(ZFN)を形成するようにダイズのために最適化されたopaque−2核局在化シグナルを介して、IIS型制限酵素FokIのヌクレアーゼドメイン(Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569の配列のアミノ酸384〜579)に融合させた。米国特許第7,888,121号を参照のこと。種々の機能的ドメインのためのジンクフィンガーを、in vivoでの使用のために選択した。設計し、産生し、推定ゲノム標的部位への結合するかどうか試験した多数のZFNのうち、上の表8に記載されるZFNは、in vivo活性を有するとして同定され、植物内で独自のダイズゲノムポリヌクレオチド標的部位を効率的に結合および切断することが可能であるとして特徴付けられた。
ZFN構築物アセンブリ
ZFN遺伝子発現構築物を含むプラスミドベクターを、当該分野で一般に公知の技能および技術を使用して、設計および完了した(例えば、AusubelまたはManiatisを参照のこと)。各ZFNコード配列を、ジンクフィンガーヌクレアーゼの上流に位置付けたopaque−2核局在化シグナルをコードする配列(Maddaloni et al., (1989) Nuc. Acids Res. 17:7532)に融合させた。非正準ジンクフィンガーコード配列を、IIS型制限酵素FokIのヌクレアーゼドメイン(Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569の配列のアミノ酸384〜579)に融合させた。この融合タンパク質の発現を、キャッサバ葉脈モザイクウイルス由来の強い構成的プロモーターによって駆動した。発現カセットは、アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)ORF23由来の3’UTRもまた含む。トセア・アシグナ(Thosea asigna)ウイルス由来のヌクレオチド配列をコードする自己加水分解性2A(Szymczak et al., (2004) Nat Biotechnol. 22:760-760)を、構築物中にクローニングされた2つのジンクフィンガーヌクレアーゼ融合タンパク質間に付加した。
これらのプラスミドベクターを、IN−FUSION(商標)Advantage Technology(Clontech、Mountain View、CA)を使用してアセンブルした。制限エンドヌクレアーゼは、New England BioLabs(Ipswich、MA)から取得し、T4 DNAリガーゼ(Invitrogen、Carlsbad、CA)をDNAライゲーションに使用した。プラスミド調製を、供給業者の指示に従ってNUCLEOSPIN(登録商標)Plasmid Kit(Macherey−Nagel Inc.、Bethlehem、PA)またはPlasmid Midi Kit(Qiagen)を使用して実施した。DNA断片を、アガローストリス酢酸塩ゲル電気泳動後にQIAQUICK GEL EXTRACTION KIT(商標)(Qiagen)を使用して単離した。全てのライゲーション反応のコロニーを、ミニプレップDNAの制限消化によって最初にスクリーニングした。選択されたクローンのプラスミドDNAを、商業的配列決定ベンダー(Eurofins MWG Operon、Huntsville、AL)が配列決定した。配列データを、SEQUENCHER(商標)ソフトウェア(Gene Codes Corp.、Ann Arbor、MI)を使用してアセンブルおよび分析した。プラスミドを、制限酵素消化を介して構築し、DNA配列決定を介して確認した。
自動化ワークフローを介したジンクフィンガークローニング
ジンクフィンガーヌクレアーゼベクターのサブセットを、自動化DNA構築パイプラインを介してクローニングした。全体として、自動化パイプラインは、以前に記載したのと同一のZFN構造を有するベクター構築を生じた。ZFNのDNA結合特異性を付与する各ジンクフィンガーモノマーを、KPFアミノ酸モチーフにおいて2〜3の独自の配列へと分割した。ZFN断片の5’末端および3’末端の両方を、BsaI認識部位(GGTCTCN)および誘導されたオーバーハングを含めることで改変した。オーバーハングを、6〜8部のアセンブリのみが所望の全長発現クローンを生じるように、分布させた。改変されたDNA断片を、de novo合成した(Synthetic Genomics Incorporated、La Jolla、CA)。単一の双子葉骨格pDAB118796を、ダイズZFN構築の全てにおいて使用した。これは、キャッサバモザイクウイルスプロモーターおよびOpaque2 NLSならびにFokIドメインおよびアグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)由来のOrf23 3’UTRを含んだ。枯草菌(Bacillus subtilis)由来のBsaI隣接SacB遺伝子を、Opaque2 NLSとFokIドメインとの間にクローニングした。推定ライゲーション事象を、スクロース含有培地上にプレートした場合、このSacBカセットは、ベクター骨格の夾雑を低減または排除する陰性選択因子として作用する。全ての構築において反復して利用した第2の部分は、pDAB117443であった。このベクターは、全てBsaI部位が隣接した、第1のモノマーFok1ドメイン、T2Aスタッター配列および第2のモノマーOpaque2 NLSを含む。
これらの材料をZFN DNA部分ライブラリーとして使用して、Freedom Evo 150(登録商標)(TECAN、Mannedorf、Switzerland)は、2Dバーコード化チューブからPCRプレート(ThermoFisher、Waltham、MA)中への、75〜100ngの各DNAプラスミドまたは合成された断片の添加を操作した。ウシ血清アルブミンタンパク質(NEB、Ipswich、MA)およびT4 DNAリガーゼ緩衝液(NEB、Ipswich、MA)を補充したBsaI(NEB、Ipswich、MA)およびT4 DNAリガーゼ(NEB、Ipswich、MA)を、反応に添加した。反応を、C1000 Touch Thermo Cycler(登録商標)(BioRad、Hercules CA)で、37℃で3分間および16℃で4分間のインキュベーションでサイクルした(25回)。ライゲーションした材料を、手で、またはQpix460コロニーピッカーおよびLabChip GX(登録商標)(Perkin Elmer、Waltham、MA)を使用して、Top10 cells(登録商標)(Life Technologies Carlsbad、CA)において形質転換およびスクリーニングした。植物形質転換に提供された正確に消化するコロニーの配列を確認した。
普遍的ドナー構築物アセンブリ
大きい数の遺伝子座の迅速な試験を支持するために、新規のフレキシブルな普遍的ドナー系配列を設計し、構築した。この普遍的ドナーポリヌクレオチド配列は、ハイスループットベクター構築方法論および分析と適合性であった。この普遍的ドナー系は、少なくとも3つのモジュラードメイン:可変ZFN結合ドメイン、非可変分析およびユーザーが規定した特徴ドメイン、ならびにベクタースケールアップのための単純なプラスミド骨格から構成された。この非可変普遍的ドナーポリヌクレオチド配列は、全てのドナーに共通し、全てのダイズ標的部位にわたって使用され得るアッセイの有限のセットの設計を可能にし、したがって、標的化の評価における均一性を提供し、分析サイクル回数を低減させた。これらのドメインのモジュラー的性質は、ハイスループットなドナーアセンブリを可能にした。さらに、この普遍的ドナーポリヌクレオチド配列は、下流の分析を単純化し、結果の解釈を向上させることを目的とした他の独自の特徴を有する。これは、診断的に予測されたサイズへのPCR産物の消化を可能にする非対称制限部位配列を含んだ。PCR増幅において問題となることが予測される二次構造を含む配列を除去した。この普遍的ドナーポリヌクレオチド配列は、サイズが小さかった(3.0Kb未満)。最後に、この普遍的ドナーポリヌクレオチド配列を、時宜を得た様式で大量の試験DNAの嵩を増やす高コピーpUC19骨格上に構築した。
一実施形態として、普遍的ドナーポリヌクレオチド配列を含む一例のプラスミドは、pDAB124280として提供される(配列番号7561および図7)。さらなる一実施形態では、普遍的ドナーポリヌクレオチド配列は、以下として提供される:pDAB124281、配列番号7562、図8;pDAB121278、配列番号7563、図9;pDAB123812、配列番号7564、図10;pDAB121937、配列番号7565、図11;pDAB123811、配列番号7566、図12;およびpDAB124864 配列番号7567、図13。別の一実施形態では、機能的に発現するコード配列または非機能的(プロモーターなし)発現コード配列と共に普遍的ドナーポリヌクレオチド配列を含むさらなる配列が、構築され得る(表11)。
この普遍的ドナーポリヌクレオチド配列は、プラスミドとして送達される小さい2〜3Kbのモジュラードナー系であった。これは、1、2、3、4、5、6、7、8、9またはそれ超のZFN結合部位、制限部位を有する「DNA X」または「UZI配列」(配列番号7568)と称される短い100〜150bpの鋳型領域、およびプライマー設計またはコード配列のためのDNA配列、ならびに単純なプラスミド骨格を含む最小ドナーであった(図4)。このプラスミド全体を、適切なZFN結合部位におけるDNA二本鎖破断後にNHEJを介して挿入した;これらのZFN結合部位は、タンデムに組み込まれ得る。普遍的ドナーポリヌクレオチド配列のこの実施形態は、標的部位およびZFNの迅速なスクリーニングのために最も適切であり、ドナー中の増幅が困難であった配列を最小化した。「UZI」配列を有さないが1または複数のZFN部位を有する普遍的ドナーもまた、生成されている。
さらなる一実施形態では、この普遍的ドナーポリヌクレオチド配列は、少なくとも4つのモジュールから構成され、ちょうどおよそ100bpの分析片またはコード配列のいずれかと共に、ZFN結合部位、相同性アーム、DNA Xを有する。普遍的ドナーポリヌクレオチド配列のこの実施形態は、いくつかのZFNを用いて、種々の標的部位においてHDR媒介性の遺伝子挿入を調べるために適切であった(図5)。
この普遍的ドナーポリヌクレオチド配列は、2つの様式の標的化されたドナー挿入(NHEJ/HDR)を用いて、規定されたDNA結合ドメインを有する全ての標的化分子と共に使用され得る。このように、普遍的ドナーポリヌクレオチド配列を適切なZFN発現構築物と共送達した場合、ドナーベクターおよびダイズゲノムは、特定のZFNの結合によって指示される1つの特異的位置において切断された。一旦線状化されると、このドナーは、NHEJまたはHDRによってゲノム中に取り込まれ得る。次いで、ベクター設計における異なる分析的考慮が、標的化された組込みの効率的な送達を最大化するジンクフィンガーを決定するために利用され得る。
[実施例4]
ダイズ形質転換手順
ダイズ(Glycine max)c.v.Maverickプロトプラストへの送達の前に、各ZFN構築物のためのプラスミドDNAを、供給業者の指示に従ってPURE YIELD PLASMID MAXIPREP SYSTEM(登録商標)(Promega Corporation、Madison、WI)またはPLASMID MAXI KIT(登録商標)(Qiagen、Valencia、CA)を使用して、大腸菌(E. coli)の培養物から調製した。
プロトプラスト単離
プロトプラストを、葉外植片から生成したカルスから誘導されたMaverick懸濁培養物から単離した。懸濁物を、3%(w/v)スクロース、0.5mg/Lの2,4−Dおよび7gのバクトアガー(bactoagar)、pH5.7を含む新鮮なLS培地(Linsmaier and Skoog 1965)中で7日毎に継代した。単離のために、継代の7日後の30ミリリットルのMaverick懸濁培養物を、50mlコニカルチューブに移し、200gで3分間遠心分離して、1チューブ当たり約10mlの定着細胞体積(SCV)を得た。上清を除去し、20ミリリットルの酵素溶液(MMG溶液(4mM MES、0.6Mマンニトール、15mM MgCl2、pH6.0)中0.3%ペクトリアーゼ(320952;MP Biomedicals)、3%セルラーゼ(「Onozuka」R10(商標);Yakult Pharmaceuticals、Japan))を、4SCVの懸濁細胞毎に添加し、チューブをParafilm(商標)で包んだ。これらのチューブを、プラットホームロッカー上に一晩(約16〜18時間)置き、消化された細胞のアリコートを、顕微鏡的に評価して、細胞壁の消化が十分であったことを確実にした。
プロトプラスト精製
ダイズ(ダイズ(Glycine max)c.v.Maverick)プロトプラストベースの形質転換方法を開発し、ダイズプロトプラスト形質転換に使用した。プロトプラストを、葉外植片から生成したカルスから誘導されたMaverick懸濁培養物から単離した。以下に提供される技術がこの方法を説明する。ダイズ細胞懸濁物を、3%(w/v)スクロース、0.5mg/Lの2,4−Dおよび7gのバクトアガー、pH5.7を含む新鮮なLS培地(Linsmaier and Skoog 1965)中で7日毎に1:5希釈で継代した。全ての実験を、以下に記載されるプロトコールに基づいて、継代の7日後に開始して実施した。
プロトプラスト単離
継代の7日後の30ミリリットルのダイズc.v.Maverick懸濁培養物を、50mlコニカル遠心分離チューブに移し、200gで3分間遠心分離して、1チューブ当たり約10mlの定着細胞体積(SCV)を得た。細胞ペレットを破壊することなく上清を除去した。20ミリリットルの酵素溶液(MMG溶液(4mM MES、0.6Mマンニトール、15mM MgCl2、pH6.0)中の0.3%ペクトリアーゼ(320952;MP Biomedicals)、3%セルラーゼ(「Onozuka」R10(商標);Yakult Pharmaceuticals、Japan))を、4SCVの懸濁細胞毎に添加し、チューブをParafilm(商標)で包んだ。これらのチューブを、プラットホームロッカー上に一晩(約16〜18時間)置いた。次の朝、消化された細胞のアリコートを、顕微鏡的に評価して、細胞壁の消化が十分であったことを確実にした。
プロトプラスト精製
細胞/酵素溶液を、100μM細胞ストレーナーを介して緩徐に濾過した。この細胞ストレーナーを、10mlのW5+培地(1.82mM MES、192mM NaCl、154mM CaCl2、4.7mM KCl、pH6.0)で濯いだ。濾過ステップを、70μMのスクリーンを使用して反復した。最終体積を、10mlのW5+培地を添加することによって40mlにした。これらの細胞を、チューブを反転させることによって混合した。これらのプロトプラストを、細胞を含む50mlコニカル遠心分離チューブの底にクッション溶液を添加することによって、8mlのスクロースクッション溶液(500mMスクロース、1mM CaCl2、5mM MES−KOH、pH6.0)上に緩徐に層状化した。これらのチューブを、スイングバケットローター中で350×gで15分間遠心分離した。5mlのピペットチップを使用して、プロトプラストバンド(約7〜8ml)を緩徐に取り出した。次いで、これらのプロトプラストを、50mlコニカルチューブに移し、25mlのW5+洗浄を添加した。これらのチューブを緩徐に反転させ、200gで10分間遠心分離した。上清を除去し、10mlのMMG溶液を添加し、チューブを緩徐に反転させて、プロトプラストを再懸濁した。プロトプラスト密度を、血球計算器またはフローサイトメーターを使用して決定した。典型的には、4PCVの細胞懸濁物は、約200万のプロトプラストを生じる。
PEGを使用したプロトプラストの形質転換
プロトプラスト濃度を、MMGで160万/mlに調整した。300μlのプロトプラストアリコート(約500,000のプロトプラスト)を、2ml無菌チューブ中に移した。このプロトプラスト懸濁物を、チューブ中にプロトプラストを移す間に、定期的に混合した。プラスミドDNAを、実験設計に従ってプロトプラストアリコートに添加した。プロトプラストのチューブを含むラックを、各々1分間3回緩徐に反転させて、DNAおよびプロトプラストを混合した。これらのプロトプラストを、室温で5分間インキュベートした。300マイクロリットルのポリエチレングリコール(PEG 4000)溶液(40%エチレングリコール(81240−Sigma Aldrich)、0.3Mマンニトール、0.4M CaCl2)を、これらのプロトプラストに添加し、チューブのラックを、1分間混合し、インキュベーションの間に穏やかに2回反転させて、5分間インキュベートした。1ミリリットルのW5+を、チューブに緩徐に添加し、チューブのラックを、15〜20回反転させた。次いで、これらのチューブを、350gで5分間遠心分離し、ペレットを破壊することなく上清を除去した。1ミリリットルのWI培地(4mM MES 0.6Mマンニトール、20mM KCl、pH6.0)を、各チューブに添加し、ラックを穏やかに反転させてペレットを再懸濁させた。ラックを、アルミホイルで覆い、横倒しにして、23℃で一晩インキュベートした。
形質転換頻度を測定し、プロトプラストを回収する
プロトプラストおよび形質転換効率の定量化を、Quanta Flow Cytometer(商標)(Beckman−Coulter Inc)を使用して測定した。形質転換のおよそ16〜18時間後、各再現からの100μlをサンプリングし、96ウェルプレート中に置き、WI溶液で1:1希釈した。これらの再現を、3回再懸濁し、100μlを、フローサイトメトリーを使用して定量化した。サンプルを分析に供する前に、これらのサンプルを、200gで5分間遠心分離し、上清を除去し、サンプルを、液体窒素中で急速冷凍した。次いで、これらのサンプルを、分子分析のための処理まで、−80℃の冷凍庫中に置いた。
ZFNおよびドナーの形質転換
表5の選択されたゲノム遺伝子座の各々について、ダイズプロトプラストを、緑色蛍光タンパク質(gfp)遺伝子発現対照、ZFN単独、ドナー単独、ならびに1:10の比率(重量で)でのZFNおよびドナーDNAの混合物を含む構築物でトランスフェクトした。50万のプロトプラストのトランスフェクションのためのDNAの総量は、80μgであった。全ての処理を、3つの再現で実施した。使用したgfp遺伝子発現対照は、キャッサバ静脈モザイクウイルスプロモーター−緑色蛍光タンパク質コード配列−アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)ORF24 3’UTR遺伝子発現カセットを含むpDAB7221(図14、配列番号7569)であった。トランスフェクション当たり一貫した量の総DNAを提供するために、サケ精子、またはgfp遺伝子含有プラスミドのいずれかを、必要に応じてフィラーとして使用した。典型的な標的化実験では、4μgのZFNを、単独でまたは36μgのドナープラスミドと共にトランスフェクトし、適切な量のサケ精子またはpUC19プラスミドDNAを添加して、DNAの全体量を80μgの最終量にした。フィラーとしてgfp遺伝子発現プラスミドを含めると、複数の遺伝子座および再現処理にわたるトランスフェクション品質の評価が可能になる。
[実施例5]
ジンクフィンガーヌクレアーゼを介したダイズ中のゲノム遺伝子座の切断
選択されたゲノム遺伝子座における標的化を、プロトプラストベースの迅速標的化系(RTA)を使用する、ZFN誘導性のDNA切断およびドナー挿入によって実証した。各ダイズの選択された遺伝子座について、最大6つのZFN設計を生成し、単独でまたは普遍的ドナーポリヌクレオチドと共にのいずれかでプロトプラスト中に形質転換し、ZFN媒介性の切断および挿入を、それぞれ次世代配列決定(NGS)またはジャンクショナル(junctional)(イン−アウト(in-out))PCRを使用して測定した。
ZFNトランスフェクトしたダイズプロトプラストを、2ml EPPENDORF(商標)チューブ中で1600rpmでの遠心分離によって、トランスフェクションの24時間後に回収し、上清を完全に除去した。ゲノムDNAを、QIAGEN PLANT DNA EXTRACTION KIT(商標)(Qiagen、Valencia、CA)を使用して、プロトプラストペレットから抽出した。この単離されたDNAを、50μLの水中に再懸濁し、濃度をNANODROP(登録商標)(Invitrogen、Grand Island、NY)によって決定した。DNAの完全性を、0.8%アガロースゲル電気泳動でサンプルを泳動することによって推定した。全てのサンプルを、PCR増幅のために標準化して(20〜25ng/μL)、配列決定(Illumina,Inc.、SanDiego、CA)のためのアンプリコンを生成した。処理したサンプルおよび対照サンプル由来の各試験ZFN認識配列を包含する領域を増幅するためのバーコード化PCRプライマーを設計し、IDT(Coralville、IA、HPLC精製した)から購入した。最適な増幅条件を、23.5μLの反応中で0.2μMの適切なバーコード化プライマー、ACCUPRIME PFX SUPERMIX(商標)(Invitrogen、Carlsbad、CA)および100ngの鋳型ゲノムDNAを使用する勾配PCRによって同定した。サイクリングパラメーターは、95℃での最初の変性(5分間)、その後の、変性(95℃、15秒間)、アニーリング(55〜72℃、30秒間)、伸長(68℃、1分間)の35サイクル、および最終伸長(68℃、7分間)であった。増幅産物を、3.5%TAEアガロースゲル上で分析し、各プライマーの組合せに適切なアニーリング温度を決定し、上記のように対照サンプルおよびZFN処理サンプルからアンプリコンを増幅するために使用した。全てのアンプリコンを、3.5%アガロースゲル上で精製し、水中に溶出させ、NANODROP(商標)によって濃度を決定した。次世代配列決定のために、ZFN処理したおよび対応する未処理の対照由来の100ngのPCRアンプリコンを一緒にプールし、llumina次世代配列決定(NGS)を使用して配列決定した。
各ダイズの最適なゲノム遺伝子座における適切なZFNの切断活性をアッセイした。ZFN切断部位を包含する短いアンプリコンを、ゲノムDNAから増幅し、ZFN処理したプロトプラストおよび対照プロトプラストからIllumina NGSに供した。ZFN誘導性の切断またはDNA二本鎖破断を、切断部位におけるヌクレオチドの挿入または欠失(インデル)による細胞NHEJ修復経路によって解消し、したがって、切断部位におけるインデルの存在は、ZFN活性の尺度であり、NGSによって決定した。標的特異的ZFNの切断活性を、NGS分析ソフトウェア(特許公開2012−0173,153、DNA配列のデータ分析)を使用して、100万の高品質配列当たりのインデルを有する配列の数として推定した。活性を、ダイズの選択されたゲノム遺伝子座標的について観察し、各ZFN切断部位においてインデルの多様なフットプリントを示す配列アラインメントによってさらに確認した。このデータは、ダイズの選択されたゲノム遺伝子座がZFNによる切断に従順であることを示唆している。各標的における示差的活性は、そのクロマチン状態および切断に対する従順さ、ならびに各ZFNの発現の効率を反映していた。
[実施例6]
ポリヌクレオチドドナーの組込みの迅速標的化分析
非相同末端結合(NHEJ)媒介性のドナー挿入を介した、ダイズの選択されたゲノム遺伝子座標的内の普遍的ドナーポリヌクレオチド配列の標的化の検証を、セミスループット(semi-throughput)プロトプラストベースの迅速標的化分析方法を使用して実施した。各ダイズの選択されたゲノム遺伝子座標的について、およそ3〜6のZFN設計を試験し、標的化を、次世代配列決定方法によってZFN媒介性の切断を測定し、ジャンクショナルイン−アウトPCRによってドナー挿入を測定することによって、評価した(図6)。両方のアッセイにおいて陽性であったダイズの選択されたゲノム遺伝子座を、標的化可能な遺伝子座として同定した。
ZFNドナー挿入の迅速標的化分析
ダイズの選択されたゲノム遺伝子座標的がドナー挿入のために標的化され得るか否かを決定するために、ZFN構築物および普遍的ドナーポリヌクレオチド構築物を、ゲノムDNAを分析のために抽出する前に24時間にわたってインキュベートしたダイズプロトプラストに共送達した。発現されたZFNが、ダイズの選択されたゲノム遺伝子座標的においておよびドナー中での両方で、標的結合部位を切断することができた場合、線状化したドナーを、非相同末端結合(NHEJ)経路を介して、ダイズゲノム中の切断された標的部位中に挿入する。ダイズの選択されたゲノム遺伝子座標的における標的化された組込みの確認を、「イン−アウト」PCR戦略に基づいて完了し、この戦略では、「イン」プライマーは、ネイティブの最適なゲノム遺伝子座における配列を認識し、「アウト」プライマーは、ドナーDNA内の配列に結合する。これらのプライマーは、ドナーDNAがダイズの選択されたゲノム遺伝子座標的において挿入された場合にだけ、PCRアッセイが予測されたサイズを有する増幅産物を産生するように、設計した。このイン−アウトPCRアッセイを、挿入接合部の5’末端および3’末端の両方において実施した。組み込まれたポリヌクレオチドドナー配列の分析に使用したプライマーを、表9に提供する。
ネステッド「イン−アウト」PCRを使用した標的遺伝子座におけるZFNドナー挿入
全てのPCR増幅を、TAKARA EX TAQ HS(商標)キット(Clonetech、Mountain View、CA)を使用して実施した。第1のイン−アウトPCRを、1×TAKARA EX TAQ HS(商標)緩衝液、0.2mMのdNTPs、0.2μMの「アウト」プライマー、0.05μMの「イン」プライマー(上記普遍的ドナーカセットから設計した)、0.75単位のTAKARA EX TAQ HS(商標)ポリメラーゼおよび6ngの抽出されたダイズプロトプラストDNAを含む25μLの最終反応体積において実施した。次いで、この反応を、94℃で3分間、98℃で12秒間、および60℃で30秒間、および72℃で1分間の14サイクル、その後72℃で10分間からなるPCRプログラムを使用して完了し、4℃で維持した。最終PCR産物を、可視化のために、1KB PLUS DNA LADDER(商標)(Life Technologies、Grand Island、NY)と共に、アガロースゲル上で泳動した。
ネステッドイン−アウトPCRを、1×TAKARA EX TAQ HS(商標)緩衝液、0.2mMのdNTPs、0.2μMの「アウト」プライマー(表9)、0.1μMの「イン」プライマー(上記普遍的ドナーカセットから設計した、表10)、0.75単位のTAKARA EX TAQ HS(商標)ポリメラーゼおよび1μLの第1のPCR産物を含む25μLの最終反応体積において実施した。次いで、この反応を、94℃で3分間、98℃で12秒間、60℃で30秒間および72℃で45秒間の30サイクル、その後72℃で10分間からなるPCRプログラムを使用して完了し、4℃で維持した。最終PCR産物を、可視化のために、1KB PLUS DNA LADDER(商標)(Life Technologies、Grand Island、NY)と共に、アガロースゲル上で泳動した。
プロトプラスト標的化系におけるイン−アウトPCRアッセイの配備は、特に困難であったが、それは、大量のプラスミドDNAがトランスフェクションに使用され、大量のDNAがプロトプラスト標的化系中に残留し、細胞ゲノムDNAと共に引き続いて抽出されたからである。余剰のプラスミドDNAは、ゲノムDNAの相対的濃度を希釈し得、検出の全体的感度を低減させ得、非特異的な異常なPCR反応の顕著な原因でもあり得る。ZFN誘導性のNHEJベースのドナー挿入は、典型的には、フォワード配向またはリバース配向のいずれかで生じる。フォワード配向挿入についてのDNAのイン−アウトPCR分析は、増幅プロセスの間に組み込まれていないドナーDNAのプライミングおよび伸長を生じ得る標的およびドナー中のZFN結合部位の周囲の相同性の共有された領域におそらくは起因して、偽陽性バンドを示す場合が多かった。偽陽性は、リバース配向挿入産物について探索した分析では見られず、したがって、全ての標的化されたドナー組込み分析を実施して、RTAにおいてリバースドナー挿入を調べた。さらに特異性を増加させ背景を低減させるために、ネステッドPCR戦略もまた使用した。このネステッドPCR戦略は、第1のPCR反応の第1の増幅産物内のより短い領域を増幅する第2のPCR増幅反応を使用した。非対称な量の「イン」プライマーおよび「アウト」プライマーの使用は、選択されたゲノム遺伝子座における迅速標的化分析のためにさらにジャンクショナルPCRを最適化した。
このイン−アウトPCR分析結果を、アガロースゲル上で可視化した。表12の全てのダイズの選択されたゲノム遺伝子座について、「ZFN+ドナー処理」は、5’末端および3’末端において、ほぼ予測されたサイズのバンドを生じた。対照ZFNまたはドナー単独処理は、PCRにおいて陰性であり、これは、この方法が、最適な非遺伝子ダイズゲノム遺伝子座のうち少なくとも32の標的部位におけるドナー組込みについて特異的にスコアリングしていたことを示唆している。全ての処理を、3〜6の再現で実施し、複数の再現(両方の末端において≧2)における予期されたPCR産物の存在を使用して、標的化を確認した。NHEJを介したドナー挿入は、標的部位および/またはドナーZFN部位における線状化された末端のプロセシングに起因して生成されたより低い強度の副産物を生じる場合が多い。さらに、異なるZFNが、標的化された組込みについて異なるレベルの効率を生じ、ZFNの一部は一貫して高レベルのドナー組込みを生じ、一部のZFNはあまり一貫していないレベルのドナー組込みを生じ、他のZFNは組込みを生じなかったことが観察された。全体として、試験したダイズの選択されたゲノム遺伝子座標的の各々について、標的化された組込みを、1または複数のZFNによって、ダイズの代表的ゲノム遺伝子座標的内で実証して、これらの遺伝子座の各々が標的化可能であったことを確認する。さらに、ダイズの選択されたゲノム遺伝子座標的の各々は、正確な遺伝子形質転換に適切であった。これらのダイズの選択されたゲノム遺伝子座標的の検証を、類似の結果で複数回反復し、こうして、プラスミド設計および構築物、プロトプラスト形質転換、サンプルプロセシング、サンプル分析を含む検証プロセスの再現性を確認した。
結論
このドナープラスミド、およびダイズの選択されたゲノム遺伝子座標的を特異的に切断するように設計された1つのZFNを、ダイズプロトプラスト中にトランスフェクトし、細胞を24時間後に収集した。イン−アウトジャンクショナルPCRによる、対照、ZFN処理されたおよびドナーと共にZFN処理されたプロトプラストから単離されたゲノムDNAの分析は、ZFNによるゲノムDNA切断の結果として、普遍的ドナーポリヌクレオチドの標的化された挿入を示した(表12)。これらの研究は、この普遍的ドナーポリヌクレオチド系が、内因性部位における標的化を評価するため、および候補ZFNをスクリーニングするために使用され得ることを示している。最後に、プロトプラストベースの迅速標的化分析および新規の普遍的ドナーポリヌクレオチド配列系は、ゲノム標的をスクリーニングするための迅速な手段および植物における正確なゲノム操作の試みのためのZFNを提供する。これらの方法は、DNAの二本鎖破断または一本鎖破断を導入する任意のヌクレアーゼを使用して任意の目的の系においてゲノム標的における部位特異的切断およびドナー挿入を評価するために拡張され得る。
7,018を超える選択されたゲノム遺伝子座を、上で詳述した種々の基準によって同定した。選択されたゲノム遺伝子座を、これらの選択されたゲノム遺伝子座を規定するために使用した10のパラメーターに基づいて主成分分析を使用してクラスター化した。一部の他の目的の遺伝子座に加えて、このクラスターの代表は、標的化可能であることが実証された。