JP2023548301A

JP2023548301A - ダイズにおけるレグヘモグリン

Info

Publication number: JP2023548301A
Application number: JP2023525960A
Authority: JP
Inventors: チョ，ヒョン－ジェ; ディーエバールド，ジョン; ジェイキニー，アンソニー; リウ，ツァン－ビン; メイヤー，クヌット; ジーパッターソン，トーマス; ジーリップ，ケビン; シェン，ボ
Original assignee: パイオニアハイ－ブレッドインターナショナル，インコーポレイテッド
Priority date: 2020-10-28
Filing date: 2021-10-22
Publication date: 2023-11-16
Also published as: WO2022094532A1; CN116507728A; EP4236682A1; CA3198652A1; US11965168B2; AU2021369580A1; US20220127632A1; AR123928A1; US20220127631A1; US20220340923A1; US11359206B2; US20230380373A1

Abstract

レグヘモグロビンを含むダイズ種子を生産するダイズ植物が、ダイズ植物のゲノムを改変することによって生産される。レグヘモグロビンを含むダイズ植物、ダイズ種子及びダイズタンパク質組成物が提供される。レグヘモグロビンと、更に高オレイン酸、低リノレン酸、高タンパク質、低スタキオース、低ラフィノース及び低プロテアーゼインヒビターのうちの１つ以上と、を含む、ダイズ植物、ダイズ種子及びダイズタンパク質組成物が提供される。ダイズ単離物及び濃縮物などのレグヘモグロビンを含むタンパク質組成物が、ダイズ種子から作製され得る。更に、レグヘモグロビンを含む植物、種子及びタンパク質組成物を生成並びに使用するための方法が開示される。

Description

電子的に提出された配列表の参照
配列表の正式な写しは、２０２０年１０月２８日に作成されたファイル名８４２９－ＵＳ－ＰＳＰ＿ＳｅｑｕｅｎｃｅＬｉｓｔｉｎｇ＿ＳＴ２５．ｔｘｔの、９４キロバイトのサイズを有するＡＳＣＩＩフォーマットの配列表としてＥＦＳ－Ｗｅｂを介して電子的に提出され、本明細書と同時に提出される。このＡＳＣＩＩフォーマット文書に含まれる配列表は、本明細書の一部であり、参照により全体として本明細書に組み込まれる。

植物ベースのタンパク質を用いた動物ベースの肉代替品は、食品用途における産業のトレンドになりつつある。ダイズマメヘモグロビン、又はレグヘモグロビンは、マメ科植物の窒素固定根粒に見出されるグロビンタンパク質である。それは鉄含有分子であるヘムを担持し、ニトロゲナーゼ酵素を酸素不活性から保護し、窒素固定細菌への酸素の流れを容易にするように機能する。レグヘモグロビンは、操作された酵母から発酵させることができ、肉中のヘモグロビンによってもたらされる風味を模倣することによって、肉代替品において使用される。ダイズにおいて、レグヘモグロビンを発現させるための組成物及び方法が提供される。

ダイズゲノムに組み込まれたレグヘモグロビンコード配列を含む組換え構築物からレグヘモグロビンを発現させることなく、ダイズ種子中の総タンパク質の少なくとも０．５％の量でレグヘモグロビンタンパク質を含有するダイズ種子が提供される。レグヘモグロビンコード配列を含有する組換え構築物を含まないダイズ種子ゲノムは、コード配列若しくは調節配列などの天然レグヘモグロビン遺伝子に挿入、欠失、若しくは置換を導入するように改変され得るか、又は種子貯蔵タンパク質のコード配列の全部又は一部をレグヘモグロビンコード配列で置き換えるように改変され得る。

ダイズ種子ゲノムが、天然レグヘモグロビン遺伝子に挿入、欠失、若しくは置換を導入するように改変されているか、又は種子貯蔵タンパク質のコード配列の全部又は一部をレグヘモグロビンコード配列で置き換えるように改変されているダイズ種子が提供される。

いくつかの実施形態では、輸送ペプチドなどの標的化配列は、レグヘモグロビンを色素体などの細胞内区画に向かせるために、レグヘモグロビンコード配列に作動可能に連結されている。

いくつかの実施形態では、レグヘモグロビンタンパク質が種子の横断面において、ダイズ種子にピンク色を付与するのに十分な量で、又は総種子タンパク質の少なくとも０．１％の量でダイズ種子中で発現される、ゲノム改変を含むダイズ種子が提供される。

いくつかの実施形態では、ダイズは、種子色素体中で特異的にレグヘモグロビンを直接発現するように改変される。

いくつかの実施形態では、天然レグヘモグロビン遺伝子における改変、核ゲノム中の異なる天然プロモーターの制御下でのレグヘモグロビン遺伝子の挿入、又は色素体ゲノム中のレグヘモグロビン配列の封入のうちの１つ以上を有するダイズ種子は、そのゲノム中に組み込まれたレグヘモグロビンコード配列を含む組換え構築物を更に含む。

いくつかの実施形態では、ダイズ種子は、グルタミルｔＲＮＡレダクターゼ、フェロケタラーゼ（ｆｅｒｒｏｃｈｅｔａｌａｓｅ）、グルタミルｔＲＮＡレダクターゼ結合タンパク質、及びアミノレブリン酸シンターゼをコードする１つ以上の遺伝子へのヌクレオチド挿入、欠失、又は置換などの更なる改変を含有する。いくつかの実施形態では、ダイズ種子は、グルタミルｔＲＮＡレダクターゼ、フェロケタラーゼ、グルタミルｔＲＮＡレダクターゼ結合タンパク質、及び／又はアミノレブリン酸シンターゼのコード配列を含有する１つ以上の組換え構築物を含有する。

総種子タンパク質の少なくとも０．５％の量でレグヘモグロビンタンパク質を含有し、以下の特徴：（ｉ）総種子脂肪酸の少なくとも５０％のオレイン酸含有量；（ｉｉ）総種子脂肪酸の３％未満のリノレン酸含有量；（ｉｉｉ）１３％の水分で測定されるか、又は１３％の水分に調整されたダイズの総重量の少なくとも３７％のタンパク質含有量；（ｉｖ）対照の非改変ダイズの活性の５％未満のクニッツトリプシンプロテアーゼインヒビター活性；（ｖ）対照の非改変ダイズの５％未満のボーマン・バークプロテアーゼインヒビター活性；（ｖｉ）１３％の水分での１重量％未満のスタキオース含有量；及び（ｖｉｉ）１３％の水分での０．５重量％未満のラフィノース含有量のうちの１つ以上を有するダイズ種子が提供される。

いくつかの実施形態では、配列番号２と少なくとも９５％の同一性を有するレグヘモグロビンタンパク質をコードするポリヌクレオチドを含む組換え構築物を含有し、その構築物がタンパク質貯蔵小胞標的化配列を含まない、トランスジェニックダイズ種子が提供され、ダイズは、（ｉ）グルタミルｔＲＮＡレダクターゼをコードする配列、又は短縮型部分を含む組換え構築物、（ｉｉ）フェロケタラーゼをコードする配列を含む組換え構築物、（ｉｉｉ）グルタミルｔＲＮＡレダクターゼ結合タンパク質を含む組換え構築物、及び（ｉｖ）アミノレブリン酸シンターゼを含む組換え構築物を含有せず、ダイズ種子は、総種子タンパク質の少なくとも０．５％の量で種子中にレグヘモグロビンを含む。

いくつかの実施形態では、総タンパク質の少なくとも０．５％の量で、レグヘモグロビンタンパク質を含有するダイズ種子は、（ｉ）その挿入が非ダイズゲノム配列を除外するダイズゲノム配列の核酸挿入、（ｉｉ）１つ以上の核酸置換、（ｉｉｉ）１つ以上の核酸欠失、及び（ｉｖ）それらの任意の組合せのうちの少なくとも１つを含むゲノム改変を有し、そのゲノム改変が、（ａ）天然レグヘモグロビン遺伝子に対してなされた改変、又は（ｂ）天然レグヘモグロビン遺伝子の少なくとも一部を含む挿入を含む。

いくつかの実施形態では、ダイズはレグヘモグロビンを発現し、グリシニン又はコングリシニンなどの１つ以上の種子貯蔵コード配列の発現を低減又は防止するための異なる改変を更に含む。

いくつかの実施形態では、ダイズはレグヘモグロビンを発現し、高オレイン酸、低リノレン酸、１３％の水分での少なくとも３７％の総種子タンパク質のうちの１つ以上を更に含む。

いくつかの実施形態では、レグヘモグロビンを含有する改変されたダイズ種子から成長させた植物及び植物部分が提供される。

いくつかの実施形態では、レグヘモグロビンを発現する改変されたダイズ種子から抽出されたダイズミールを処理するための方法が提供され、この中でミールは、セルラーゼ、ヘミセルラーゼ、及びペクチナーゼのうちの少なくとも１つと、ミール中の多糖類を分解するのに十分な条件下で接触され、透過液（ｐｅｒｍｅａｎｔ）が残渣から濾過される。総タンパク質の重量で、少なくとも０．１％、０．２％、０．３％、０．４％、又は０．５％のレグヘモグロビンを含有する改変されたダイズ種子から抽出されたミールが提供される。

いくつかの実施形態では、総タンパク質の重量で少なくとも０．２％のレグヘモグロビンを含み、レグヘモグロビンの少なくとも約５０％が鉄基でヘム化されているダイズ単離物が提供され、これはレグヘモグロビンを発現する改変された種子から生成される。

いくつかの実施形態では、レグヘモグロビンを含む改変されたダイズ種子及び高オレイン酸を含むダイズ種子からダイズミール又は単離物を生成するための方法が提供され、この中で豆が高オレイン酸及びレグヘモグロビンの少なくとも約５０％が鉄基でヘム化されているヘモグロビンを含む、ミール又は単離物を生成するように処理される。

本開示は、本出願の一部を形成する下記の詳細な説明並びに本明細書に付随する図面及び配列表から、より十分に理解することができよう。

異なるタンパク質標的化配列を含むか、又は含まないダイズレグヘモグロビンの発現のための構築物デザインを示すチャートである。ポルフィリン経路操作によるダイズレグヘモグロビン発現レベルの改善のための構築物デザインを示すチャートである。ＣＲ１／ＣＲ２ｇＲＮＡ対による天然ダイズグリシニン遺伝子座へのレグヘモグロビン遺伝子のゲノム操作を示す概略図である。ＣＲ１／ＣＲ３ｇＲＮＡ対による天然ダイズグリシニン遺伝子座へのレグヘモグロビン遺伝子のゲノム操作を示す概略図である。コングリシニン遺伝子のクラスター遺伝子座のための遺伝子ドロップアウト戦略を示す概略図である。コングリシニンＧｍ１０遺伝子クラスタードロップアウト多様体の種子タンパク質プロファイルを示すタンパク質ゲルの写真である。コングリシニンＧｍ２０遺伝子クラスタードロップアウト多様体の種子タンパク質プロファイルを示すタンパク質ゲルの写真である。実験１における５つの独立したイベントの種子断面の写真である。実験１における１６ＫＤのレグヘモグロビンタンパク質の存在を示す（矢印）クマシー染色されたタンパク質ゲルの写真である。実験５における４つの独立したイベントの種子断面の写真である。実験５における１６ＫＤのレグヘモグロビンタンパク質の存在を示すクマシー染色されたタンパク質ゲルの写真である。酵素的ダイズ処理（Ｅ－ＳＯＹ）プロセスのための一般化されたプロセスの一例を示す概略的フローチャートである。Ｔ－ＤＮＡ内のダイズ核形質転換バイナリーベクターを示す概略図である。ダイズ葉緑体形質転換ベクターの概略図である。

配列記述（表１）は、参照により本明細書に組み込まれる本明細書に添付の配列表を要約する。配列表は、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ１３：３０２１－３０３０（１９８５）及びＢｉｏｃｈｅｍｉｃａｌＪｏｕｒｎａｌ２１９（２）：３４５－３７３（１９８４）に記載されるＩＵＰＡＣ－ＩＵＢ標準で定義される通りの、ヌクレオチド配列特性に関する１文字コード、並びにアミノ酸に関する１文字及び３文字コードを含む。

本開示は、レグヘモグロビンタンパク質、レグヘモグロビン複合体、又はその組合せを発現する改変されたダイズ種子を記載する。レグヘモグロビンは、窒素固定細菌によるコロニー形成の際にダイズ根粒中で合成されるタンパク質である。本明細書で使用される場合、「レグヘモグロビンタンパク質」又は「レグヘモグロビン」は、モノマー中に折り畳まれていないか、又は折り畳まれているかに関わらず、グロブリンタンパク質又はポリペプチドを指し、それはヘム基（鉄に結合したポルフィリン）と会合していてもしていなくてもよい。本明細書で使用される場合、「レグヘモグロビン複合体」又は「レグヘモグロビンタンパク質複合体」は、特に、ヘム基（鉄に結合したポルフィリン）と会合したレグヘモグロビンタンパク質を含む複合体を指す。そのような複合体は、十分な量で存在するとき、例えば、レグヘモグロビン複合体を発現するダイズ種子の横断面において、目で検出可能な、その複合体を含有する細胞又は組織に赤色若しくはピンク色を付与することができる。横断面におけるダイズの色に関連して本明細書で使用される場合、ピンク色は、ピンク又は赤のあらゆる色合いを意味する。

ダイズ種子は、レグヘモグロビンの発現をタンパク質貯蔵小胞、又は他の標的化された細胞区画に標的化する必要なしに、ヘム複合体を形成するレグヘモグロビンの発現を増加させるように改変することができる。

いくつかの実施形態では、ヘム基を含まないレグヘモグロビン、レグヘモグロビン複合体、又は両方の形態の組合せは、総種子タンパク質の少なくとも０．０１％、０．０５％、０．５％、１％、１．５％、２％、２．５％、３％、４％、５％、６％、７％、８％、９％、１０％以上、且つ７５％、５０％、２５％、２０％、１５％、１０％、５％、４％、又は３％未満でダイズ種子中に存在することができる。

好適には、総レグヘモグロビンの少なくとも５、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０又は９５パーセント、且つ１００、９９．９、９５、９０、８５、８０、７０、６０又は５０パーセント未満は、ダイズ種子中でヘム基との複合体を形成する。

本明細書に開示されるダイズ種子、並びに植物部分、植物細胞、組織培養物及びそれらから成長させた植物が提供される。

ある特定の実施形態では、ダイズ種子には、ダイズ種子細胞中で機能するプロモーターに作動可能に連結されたレグヘモグロビンコード配列を含む組換え構築物が導入されている。本明細書で使用される場合、組換え構築物は、ポリペプチドをコードするポリヌクレオチドに作動可能に連結されたプロモーター配列、及び任意選択で他の調節配列を含む構築物であり、組換え構築物は、植物、植物細胞、又は種子に対して外因性である。本明細書で使用される場合、核酸に関する「外因性」という用語は、核酸がその天然のゲノム位置にはないことを示す。そのような組換え構築物を含有する植物は、トランスジェニック植物と称される。調節該列は、ポリペプチドコード配列の転写又は終止を促進する遺伝子内又は遺伝子の周りにある配列であり得る。

組換えＤＮＡ構築物の非限定的な例としては、「調節エレメント」とも称される異種配列に作動可能に連結された着目したポリヌクレオチドが含まれ、これは、着目した配列の発現、自己複製、及び／又はゲノム挿入における助けとなる。そのような調節エレメントとしては、例えば、プロモーター、終止配列、エンハンサーなど、又は発現カセットの任意の成分；プラスミド、コスミド、ウイルス、自律複製配列、ファージ、又は直線状若しくは環状の一本鎖若しくは二本鎖ＤＮＡ又はＲＮＡヌクレオチド配列；並びに／又は異種ポリペプチドをコードする配列が挙げられる。

提供される組換えＤＮＡ構築物又は組換え構築物は、ゲノム中に組み込まれるとき、ダイズゲノム中のその天然の位置には存在しないか、又は別の種のゲノムに由来する少なくとも１つの調節エレメントを含む。ある特定の実施形態では、組換えＤＮＡ構築物の少なくとも１つの調節エレメントは、プロモーター、好ましくはグリシニン又はコングリシニンプロモーターなどの種子中のレグヘモグロビンの発現を駆動する異種プロモーターを含む。

ある実施形態では、レグヘモグロビンコード配列を含む組換え構築物を含有するダイズ種子は、以下のうちの１つ以上又は全てを含有しない：（ｉ）グルタミルｔＲＮＡレダクターゼをコードする配列、又はその短縮型部分を含む組換え構築物、（ｉｉ）フェロケタラーゼをコードする配列を含む組換え構築物、（ｉｉｉ）グルタミルｔＲＮＡレダクターゼ結合タンパク質を含む組換え構築物、及び（ｉｖ）アミノレブリン酸シンターゼを含む組換え構築物。短縮型コード配列は、コード配列のＮ’又はＣ’末端、若しくはその両方が除去され、それによって天然の非切断型ポリペプチドよりも短く、Ｃ’末端又はＮ’末端、若しくは両方でのアミノ酸の数を欠くコード配列からポリペプチドが合成されるようにした配列である。本発明者らは、これらの追加の組換え構築物を用いて発現を増強する必要なく、且つレグヘモグロビンの、タンパク質貯蔵小胞などの特定の細胞区画に向かわせる標的化配列を含む必要なく、ピンク色を付与することを通して、目によって検出可能な量で高レベルのレグヘモグロビン及びレグヘモグロビン複合体が発現され得ることを発見した。

いくつかの実施形態では、天然レグヘモグロビン遺伝子が改変される。レグヘモグロビン遺伝子のゲノム配列は、配列番号４３で提供されており、改変は、この配列の全て若しくは一部を含むようになされてもよく、又は本明細書で同定される特定の領域を含む、ダイズゲノム中の配列番号４３に対応する配列に対してなされてもよい。配列番号４３に関して、プロモーター及び５’ＵＴＲを含む調節領域は、ヌクレオチドの１位～２０５８位に由来し、エクソン１は２０５９位～２１５６位に由来し、イントロン１は２１５７位～２２７５位に由来し、エクソン２は２２７６位～２３８４位に由来し、イントロン２は２３８５位～２５７４位に由来し、エクソン３は２５７５位～２６７９位に由来し、イントロン３は２６８０位～２８７６位に由来し、エクソン４は２８７７位～３００２位に由来し、３’ＵＴＲを含むターミネーターは３００３位～５２１４位に由来する。

いくつかの実施形態では、改変は、配列番号４３の１位～２０５８位で、配列番号４３の１００位～２０５８位で、配列番号４３の２００位～２０５８位で、配列番号４３の３００位～２０５８位で、配列番号４３の４００位～２０５８位で、配列番号４３の５００位～２０５８位で、配列番号４３の６００位～２０５８位で、配列番号４３の７００位～２０５８位で、配列番号４３の８００位～２０５８位で、配列番号４３の９００位～２０５８位で、配列番号４３の１０００位～２０５８位で、配列番号４３の１１００位～２０５８位で、配列番号４３の１２００位～２０５８位で、配列番号４３の１３００位～２０５８位で、配列番号４３の１４００位～２０５８位で、配列番号４３の１５００位～２０５８位で、配列番号４３の１６００位～２０５８位で、配列番号４３の１７００位～２０５８位で、配列番号４３の１８００位～２０５８位で、又は配列番号４３の１９００位～２０５８位で行われる。

いくつかの実施形態では、ダイズ種子の色素体ゲノムは、レグヘモグロビンタンパク質をコードする配列が色素体ゲノム中に挿入され、それによりレグヘモグロビンポリペプチドが、輸送ペプチドを必要とすることなく、種子色素体中で直接発現される改変を含む。種子特異的色素体形質転換は、配列番号４４などのＤｉｃｉｓＧＧ配列に接続されたレグヘモグロビンコード配列を含む構築物を挿入することによって達成することができる。植物は、ＰＰＲタンパク質、例えば、配列番号４６又は４８などのＰＰＲ１０タンパク質を発現するために、種子中で活性であり、且つ種子特異的であるプロモーター、例えばグリシニン又はコングリシニンなどの種子貯蔵タンパク質のプロモーターの活性の制御下で、ＰＰＲタンパク質をコードする配列と共に同時形質転換される。異なる種子特異的プロモーターは、ＰＰＲタンパク質の発現の量を調整するように選択することができる。或いは、ＰＰＲタンパク質の発現は、例えば、種子貯蔵タンパク質の遺伝子座において、種子特異的様式で発現される天然配列の全部又は一部を置き換えるためのゲノム編集を通して達成することができる。ＰＰＲタンパク質は、根、茎、葉、及び花などの非種子の植物部分において生じる発現なしに、又はその少ない若しくは最小限の発現で種子色素体中のレグヘモグロビンの直接発現を容易にするために、ＤｉｃｉｓＧＧ配列に対して種子中のトリガーとして作用する。

レグヘモグロビンの色素体発現は、核ゲノム供給源からのレグヘモグロビンの発現と組み合わせることができ、１つ以上のヌクレオチドを天然レグヘモグロビン遺伝子中に挿入、欠失、若しくは置換することによって、又はレグヘモグロビンが種子貯蔵タンパク質の代わりに発現されるように、種子貯蔵タンパク質のコード配列の全部又は一部を置き換えるために、種子貯蔵タンパク質遺伝子中にレグヘモグロビン配列を挿入させることによるなど、ダイズ種子中で高度に発現される遺伝子のゲノム編集によるものなど、例えば、核ゲノムのトランスジェニック構築物による形質転換によって、又は天然核遺伝子のゲノム編集によって組み合わせることができる。レグヘモグロビンの色素体発現は、本明細書に開示されるものなどのヘム生合成経路の制御をコードするか又は寄与する他の遺伝子の増加した又は減少した発現と組み合わせることができる。

いくつかの実施形態では、色素体標的化配列などの細胞内標的化配列又は輸送配列が含まれ、レグヘモグロビンをコードする配列に作動可能に連結され、例えば、レグヘモグロビンをコードする配列のＮ’末端の直前に配置され、それにより細胞内標的化配列は、レグヘモグロビンの発現をタンパク質貯蔵小胞又は色素体などの細胞内区画へ標的化させる。例えば、配列番号３１又は配列番号３２をコードするポリヌクレオチドで生じる標的化配列及び作動可能に連結されたレグヘモグロビン配列は、組換え構築物中の調節配列に作動可能に連結され、ダイズを形質転換するために使用することができる。標的化配列は、例えば、配列番号３１、又は配列番号３２をコードする配列で生じるレグヘモグロビン配列に作動可能に連結することができ、グリシニン又はコングリシニンなどの種子貯蔵タンパク質のコード配列の全部又は一部を置き換えるために、ゲノム編集を通して挿入されることができ、それによって、レグヘモグロビンタンパク質が輸送ペプチドと共に発現され、細胞内区画を標的化するように、種子貯蔵タンパク質の天然調節エレメントは、標的化配列及びレグヘモグロビンコード配列の発現に向かせる。標的化配列は、任意選択で他の挿入、又は欠失又は置換を伴って、天然レグヘモグロビン遺伝子中に挿入されることができ、それにより、レグヘモグロビンが輸送ペプチドと共にその天然遺伝子座からダイズ種子中で発現され、細胞内区画を標的化する。一実施形態では、色素体標的化配列がコード配列又は着目したポリペプチドのＮ’末端で含まれる。色素体標的化配列の一例は、配列番号３１の１位～１６５位のヌクレオチド配列によってコードされ、配列番号３２の１位～５５位での対応するペプチド標的化配列を伴うものなどの、ＲｕｂｉｓｃｏＳＳＵＳＰ色素体標的化配列である。レグヘモグロビンコード配列は、配列番号３１の１６６位～６０３位に由来し、対応するペプチドは、配列番号３２の５６位～２００位に由来する。

いくつかの実施形態では、ダイズ種子が提供され、このダイズ種子は、（ｉ）ゲノムに挿入された組換え構築物、（ｉｉ）レグヘモグロビンコード配列が、本明細書に記載されるような種子貯蔵タンパク質コード配列の全部又は一部に置き換わるゲノム改変、（ｉｉｉ）天然レグヘモグロビン遺伝子が、レグヘモグロビン遺伝子の調節領域又はコード配列中などへの挿入、欠失、又は置換のうちの１つ以上を含むように改変されるゲノム改変、並びに（ｉｖ）色素体ゲノムがレグヘモグロビンコード配列を発現するように改変されている色素体ゲノム改変のうちの２つ以上に由来するなどの、２つ以上の供給源、構築物又はゲノム位置に由来するレグヘモグロビンを発現する。いくつかの実施形態では、２つ以上の供給源は、レグヘモグロビンコード配列が、本明細書に記載されるような色素体標的化配列などの細胞内標的化配列に作動可能に連結されている少なくとも１つの供給源、及びレグヘモグロビンコード配列が細胞内標的化配列に作動可能に連結されていない別の供給源を含む。

ある特定の実施形態では、レグヘモグロビン及び任意選択で本明細書に記載されるような他の改変を含むダイズ種子は、ダイズ種子中のレグヘモグロビン複合体の量を増加させるための改変を更に含むことができる。レグヘモグロビン複合体を増加させるための改変は、グルタミル－ｔＲＮＡレダクターゼ、グルタメート－１－セミアルデヒド２，１－アミノムターゼ、アミノレブリン酸デヒドラターゼ（ＨＥＭＢ１）、ヒドロキシメチルビランシンターゼ（ＨＥＭＣ）、ウロホルフィリノーゲンＩＩＩシンターゼ、ウロホルフィリノーゲンデカルボキシラーゼ、コポルフィリノーゲンＩＩＩオキシダーゼ（ＨＥＭＦ、ＣＰＯＸ）、プロトポルフィリノーゲンオキシダーゼ（ＰＰＯＸ）、及び／又はフェロケラターゼ（ｆｅｒｒｏｃｈｅｌａｔａｓｅ）のうちの１つ以上の改変された発現を含むことができる。改変は、組換え構築物の植物のゲノム中への導入を含むことができ、又は改変は遺伝子編集改変、例えば、これらの遺伝子のコード配列の転写を増強させるために、これらのペプチドが発現される遺伝子への挿入、欠失、及び／又は置換などを含むことができる。

いくつかの実施形態では、ダイズ植物、細胞及び種子は、ヘム生成又はレグヘモグロビンのヘム化に寄与するホウ素の酵素の発現又は活性を調整する調節タンパク質をコードする遺伝子中の改変を含む。例えば、グルタミル－ｔＲＮＡレダクターゼ活性を調節するタンパク質をコードするダイズ遺伝子は、グルタミル－ｔＲＮＡレダクターゼ結合タンパク質（Ｇｌｙｍａ．０８Ｇ２２２６００）、葉緑体シグナル粒子４３（Ｇｌｙｍａ．１１Ｇ０９７２００）並びにＦＬＵＯＲＥＳＣＥＮＴＩＮＢＬＵＥＬＩＧＨＴ（Ｇｌｙｍａ．１６Ｇ０１０２００及びＧｌｙｍａ．０７Ｇ０４１７００）を含み、ダイズ中のヘム及び／又はレグヘモグロビン複合体の形成を増加若しくは増強させるために、例えば、挿入、欠失、又は置換によって改変され得る。

ある特定の実施形態では、ダイズ種子は、種子貯蔵タンパク質をコードする天然遺伝子中に挿入され、天然種子貯蔵コード配列の全部又は一部に置き換わるレグヘモグロビンコード配列を含有するように編集される。ゲノム中のその天然位置において、天然プロモーターに作動可能に連結された外因性核酸コード配列を含むそのような編集された構築物は、組換え構築物とは見なされず、なぜならプロモーター及び他の調節エレメントがそれらの天然環境に対して外因性ではないためである。例えば、編集されたゲノムでは、遺伝子構造はほぼ変更されないままであることができ、天然種子貯蔵タンパク質コード配列は、異なるコード配列によって、例えば、レグヘモグロビンなどのグロブリンタンパク質で置き換えられている状態である。そのような植物、種子及び細胞は、改変若しくは編集された植物、種子又は細胞と称されてもよい。

１つ以上の好適な貯蔵タンパク質コード配列は、例えば、グリシニン、コングリシニン、２Ｓアルブミン、クニッツトリプシンインヒビター（ＫＴＩ）、ボーマン・バークインヒビター（ＢＢＩ）、又はそれらの組合せをコードする配列を含むレグヘモグロビンコード配列などのグロブリンコード配列で、本明細書に記載される方法を使用して置き換えることができる。

クニッツトリプシンインヒビター（ＫＴＩ）及びボーマン・バークインヒビター（ＢＢＩ）活性は、クニッツトリプシンインヒビター（ＫＴＩ）又はボーマン・バークインヒビター（ＢＢＩ）コード配列の発現を低減若しくは防止するための改変を有していない野生型、ヌル又は対照のダイズ中で見出される活性の５０％、４０％、３０％、２０％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％、０．５％、０．４％、０．３％、０．２％、又は０．１％未満まで低減され得る。

本明細書で使用される場合、特定の核酸に関する「コードする」、「コードされた」などは、特定のタンパク質への翻訳に関する情報を含むことを意味する。タンパク質をコードする核酸は、核酸の翻訳領域内に非翻訳配列（例えば、イントロン）を含んでもよく、或いはそのような介在非翻訳配列を含まなくてもよい（例えば、ｃＤＮＡにおけるように）。タンパク質がコードされる情報は、コドンの使用によって特定される。典型的には、アミノ酸配列は、「普遍的」遺伝子コードを使用して核酸によってコードされる。しかしながら、一部の植物、動物及び真菌のミトコンドリア、細菌のマイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）（Ｙａｍａｏ，ｅｔａｌ．，（１９８５）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８２：２３０６－９）又は繊毛虫の大核中に存在するような、普遍的コードの多様体が、核酸がこれらの生物体を用いて発現される場合に使用されてもよい。

核酸が合成的に調製又は変更される場合、核酸が発現されることになる意図された宿主の既知のコドン選好をうまく利用することができる。例えば、本明細書に開示される核酸配列は、単子葉植物種及び双子葉植物種の両方で発現され得るが、配列は、単子葉植物又は双子葉植物の特定のコドン選好及びＧＣ含量選好を考慮して改変することができ、これは、これらの選好が異なることが示されているためである（Ｍｕｒｒａｙ，ｅｔａｌ．，（１９８９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１７：４７７－９８）。

本明細書で使用される場合、「ポリヌクレオチド」には、デオキシリボポリヌクレオチド、リボポリヌクレオチド、又はそれらがストリンジェントなハイブリダイゼーション条件下で、天然に存在するヌクレオチドと実質的に同じヌクレオチド配列にハイブリダイズし、及び／又は天然に存在するヌクレオチドと同じアミノ酸への翻訳を可能にするという点で、天然リボヌクレオチドの本質的な性質を有するそれらの類似体への言及が含まれる。ポリヌクレオチドは、構造遺伝子又は調節遺伝子の完全長若しくは部分配列であり得る。別段の指示がない限り、本用語には、特定の配列並びにその相補的配列への言及が含まれる。したがって、安定性のために、又は他の理由で改変された骨格を有するＤＮＡ又はＲＮＡは、用語が本明細書で意図しているような、「ポリヌクレオチド」である。更に、ほんの２つの例を挙げると、イノシンなどの通常ではない塩基、又はトリチル化塩基などの改変された塩基を含むＤＮＡ又はＲＮＡは、用語が本明細書で使用されているようなポリヌクレオチドである。当業者に既知の多くの有用な目的を果たす様々な改変が、ＤＮＡ及びＲＮＡになされていることが理解されよう。本明細書で使用されるポリヌクレオチドという用語は、ポリヌクレオチドの化学的、酵素的、又は代謝的に改変された形態、並びにとりわけ単純な細胞及び複雑な細胞を含む、ウイルス及び細胞に特徴的なＤＮＡ及びＲＮＡの化学的形態を包含する。

用語「ポリペプチド」、「ペプチド」及び「タンパク質」は、本明細書では互換的に使用され、アミノ酸残基からなるポリマーを指す。この用語は、１つ以上のアミノ酸残基が対応する天然アミノ酸の人工的な化学的類似物であるアミノ酸ポリマー、及び天然のアミノ酸ポリマーに適用される。

本明細書で使用される場合、２つの核酸又はポリペプチド配列と関連する「配列同一性」又は「同一性」は、特定の比較ウィンドウに最大の対応でアラインしたときに同じである２つの配列の残基への言及を含む。配列同一性のパーセンテージをタンパク質に関して使用する場合、同一でない残基位置が、しばしば保存的アミノ酸置換により異なることが認識される。ここで、アミノ酸残基は、類似の化学特性（例えば、電荷又は疎水性）を有する他のアミノ酸残基で置換され、それゆえ、分子の機能特性が変化しない。配列が保存的置換で異なる場合、同一性のパーセントが使用され得る。そのような保存的置換により異なる配列は、「配列類似性」又は「類似性」を有するといわれる。この調整を行う手段は、当業者にはよく知られている。一般的には、これには、保存的置換を、完全ミスマッチとしてではなく部分的ミスマッチとして採点し、それにより、配列同一性パーセントを高める方法が含まれる。したがって、例えば、同一のアミノ酸に１点を与え、非保存的置換に０点を与える場合、保存的置換に０～１点を与える。保存的置換の採点が、例えば、ＭｅｙｅｒｓａｎｄＭｉｌｌｅｒ，（１９８８）ＣｏｍｐｕｔｅｒＡｐｐｌｉｃ．Ｂｉｏｌ．Ｓｃｉ．４：１１－１７のアルゴリズムに従って、例えば、プログラムＰＣ／ＧＥＮＥ（Ｉｎｔｅｌｌｉｇｅｎｅｔｉｃｓ，ＭｏｕｎｔａｉｎＶｉｅｗ，Ｃａｌｉｆｏｒｎｉａ，ＵＳＡ）において実施されるように計算される。

本明細書で使用される場合、「配列同一性のパーセンテージ」は、比較ウィンドウに最適にアラインされた２つの配列を比較することにより決定される値を意味し、ここで、比較ウィンドウにおけるポリヌクレオチド配列の部分は、２つの配列の最適なアライメントについて、参照配列（これは、付加も欠失も含まない）と比較した場合に、付加又は欠失（すなわち、ギャップ）を含み得る。パーセンテージは、双方の配列内で同一の核酸塩基又はアミノ酸残基が生じる位置の数を求めて、マッチした位置の数を得て、マッチした位置の数を、比較ウィンドウ内の位置の総数で除して、その結果に１００を乗じて配列同一性のパーセンテージを得ることによって、算出される。

配列番号１～４８のいずれか１つのポリペプチド及びポリヌクレオチドに対して、又は本明細書に開示されるような配列番号１～４８のいずれか１つの定義された位置内で指定された配列に対して、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％、９９．６％、９９．７％、９９．８％、若しくは９９．９％、又は少なくとも約５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％、９９．６％、９９．７％、９９．８％、若しくは９９．９％、且つ１００％、９９％、９５％、又は９０％未満の同一性を有するポリヌクレオチド及びポリペプチド配列が提供される。

本明細書で使用される場合、「参照配列」は、配列比較の基準として使用される規定の配列である。参照配列は、特定の配列のサブセット又はその全体、例えば、全長ｃＤＮＡ又は遺伝子配列の断片、或いは完全なｃＤＮＡ又は遺伝子配列であり得る。

本明細書で使用される場合、「比較ウィンドウ」は、ポリヌクレオチド配列の連続した特定の断片をいい、ここで、ポリペプチド配列は参照配列と比較することができ、比較ウィンドウにおけるポリヌクレオチド配列の一部は、２つの配列の最適なアライメントのために、参照配列（これは付加も欠失も含まない）と比較して、付加又は欠失（すなわち、ギャップ）を含み得る。一般に、比較ウィンドウは、少なくとも２０の連続したヌクレオチド長であり、必要に応じて、３０、４０、５０、１００又はそれ以上であり得る。当業者であれば、ポリヌクレオチド配列にギャップを含むことによって、参照配列に対し高い類似性を有することを避けるために、通常、ギャップペナルティが導入され、マッチ数から差し引かれることを理解している。

比較のためのヌクレオチド及びアミノ酸配列のアライメント方法は、当該技術分野においてよく知られている。ＳｍｉｔｈａｎｄＷａｔｅｒｍａｎ，（１９８１）Ａｄｖ．Ａｐｐｌ．Ｍａｔｈ２：４８２のローカルホモロジーアルゴリズム（ＢＳＴＦＩＴ）を、ＮｅｅｄｌｅｍａｎａｎｄＷｕｎｓｃｈ，（１９７０）Ｊ．Ｍｏｌ．Ｂｉｏｌ．４８：４４３－５３のホモロジーアライメントアルゴリズム（ＧＡＰ）によって；ＰｅａｒｓｏｎａｎｄＬｉｐｍａｎ，（１９８８）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８５：２４４４の類似性検索法（Ｔｆａｓｔａ及びＦａｓｔａ）によって；限定されないが：Ｉｎｔｅｌｌｉｇｅｎｅｔｉｃｓ，ＭｏｕｎｔａｉｎＶｉｅｗ，ＣａｌｉｆｏｒｎｉａによるＰＣ／ＧｅｎｅプログラムにおけるＣＬＵＳＴＡＬ、ＷｉｓｃｏｎｓｉｎＧｅｎｅｔｉｃｓＳｏｆｔｗａｒｅＰａｃｋａｇｅ（登録商標），Ｖｅｒｓｉｏｎ８におけるＧＡＰ、ＢＥＳＴＦＩＴ、ＢＬＡＳＴ、ＦＡＳＴＡ及びＴＦＡＳＴＡ（ＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐから入手可能（ＧＣＧ（登録商標）プログラム（Ａｃｃｅｌｒｙｓ，Ｉｎｃ．，ＳａｎＤｉｅｇｏ，ＣＡ））が挙げられるこれらのアルゴリズムのコンピュータによる実行によって、比較のための配列の最適なアライメントを実行することができる。ＣＬＵＳＴＡＬプログラムは、ＨｉｇｇｉｎｓａｎｄＳｈａｒｐ，（１９８８）Ｇｅｎｅ７３：２３７４４、ＨｉｇｇｉｎｓａｎｄＳｈａｒｐ，（１９８９）ＣＡＢＩＯＳ５：１５１３、Ｃｏｒｐｅｔ，ｅｔａｌ．，（１９８８）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１６：１０８８１－９０、Ｈｕａｎｇ，ｅｔａｌ．，（１９９２）ＣｏｍｐｕｔｅｒＡｐｐｌｉｃａｔｉｏｎｓｉｎｔｈｅＢｉｏｓｃｉｅｎｃｅｓ８：１５５－６５、及びＰｅａｒｓｏｎ，ｅｔａｌ．，（１９９４）Ｍｅｔｈ．Ｍｏｌ．Ｂｉｏｌ．２４：３０７－３１によって十分に説明されている。複数の配列の最適なグローバルアライメントで使用するための好ましいプログラムは、ＰｉｌｅＵｐである（ＦｅｎｇａｎｄＤｏｏｌｉｔｔｌｅ，（１９８７）Ｊ．Ｍｏｌ．Ｅｖｏｌ．，２５：３５１－６０、これはＨｉｇｇｉｎｓａｎｄＳｈａｒｐ，（１９８９）ＣＡＢＩＯＳ５：１５１－５３によって記載された方法と同様であり、参照により本明細書に組み込まれる）。データベースの類似性検索のために使用することができるプログラムのＢＬＡＳＴファミリーには：ヌクレオチドデータベース配列に対するヌクレオチドクエリー配列のためのＢＬＡＳＴＮ；タンパク質データベース配列に対するヌクレオチドクエリー配列のためのＢＬＡＳＴＸ；タンパク質データベース配列に対するタンパク質クエリー配列のためのＢＬＡＳＴＰ；ヌクレオチドデータベース配列に対するタンパク質クエリー配列のためのＴＢＬＡＳＴＮ；及びヌクレオチドデータベース配列に対するヌクレオチドクエリー配列のためのＴＢＬＡＳＴＸが挙げられる。ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，Ｃｈａｐｔｅｒ１９，Ａｕｓｕｂｅｌ，ｅｔａｌ．，ｅｄｓ．，ＧｒｅｅｎｅＰｕｂｌｉｓｈｉｎｇａｎｄＷｉｌｅｙ－Ｉｎｔｅｒｓｃｉｅｎｃｅ，ＮｅｗＹｏｒｋ（１９９５）を参照されたい。

ＧＡＰは、Ｎｅｅｄｌｅｍａｎ及びＷｕｎｓｃｈのアルゴリズム（前出）を使用して、マッチ数を最大化しギャップ数を最小化する２つの完全な配列のアライメントを見出す。ＧＡＰは全ての可能なアライメントを考慮し、マッチした塩基の最大数と最小のギャップ数を有するアライメント作製する。これにより、マッチした塩基の単位におけるギャップクリエーションペナルティ及びギャップ伸長ペナルティの提示が可能になる。ＧＡＰは、挿入される各ギャップにマッチするギャップクリエーションペナルティ数を得る必要がある。ゼロより大きいギャップ伸長ペナルティを選択するなら、ＧＡＰは更に、挿入される各ギャップに対し、ギャップ伸長ペナルティのギャップ倍長の長さを得る必要がある。ＷｉｓｃｏｎｓｉｎＧｅｎｅｔｉｃｓＳｏｆｔｗａｒｅＰａｃｋａｇｅ（登録商標）のＶｅｒｓｉｏｎ１０におけるデフォルトのギャップクリエーションペナルティ値及びギャップ伸長ペナルティ値は、それぞれ８及び２である。ギャップクリエーションペナルティ及びギャップ伸長ペナルティは、０～１００からなる整数の群から選択される整数で表すことができる。したがって、例えば、ギャップクリエーションペナルティ及びギャップ伸長ペナルティは、０、１、２、３、４、５、６、７、８、９、１０、１５、２０、３０、４０、５０又はそれ以上であり得る。

ＧＡＰは、最良のアライメントファミリーの１メンバーを示す。このファミリーには多くのメンバーが存在し得るが、より良好なクオリティを有するメンバーは他に存在しない。ＧＡＰは、アライメントのための４つの性能指数を表示する：クオリティ、率（Ｒａｔｉｏ）、同一性及び類似性。クオリティは、配列をアラインするために最大化された量である。率（Ｒａｔｉｏ）は、クオリティを短い断片中の塩基数で除したものである。パーセント同一性は、実際に一致している記号のパーセントである。類似性パーセントは、類似している記号のパーセントである。ギャップに向かい合っている記号は無視する。１対の記号のスコアリングマトリクス値が類似性閾値の０．５０より大きいか又は等しいとき、類似性のスコアが付けられる。ＷｉｓｃｏｎｓｉｎＧｅｎｅｔｉｃｓＳｏｆｔｗａｒｅＰａｃｋａｇｅ（登録商標）のＶｅｒｓｉｏｎ１０において使用されるスコアリングマトリクスは、ＢＬＯＳＵＭ６２である（ＨｅｎｉｋｏｆｆａｎｄＨｅｎｉｋｏｆｆ，（１９８９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８９：１０９１５を参照されたい）。

特に明記しない限り、本明細書で提供される配列同一性／類似性値は、デフォルトパラメータを使用するＢＬＡＳＴ２．０プログラムのスウィートを使用して得られる値を指す（Ａｌｔｓｃｈｕｌ，ｅｔａｌ．，（１９９７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５：３３８９－４０２）。

本明細書に記載されるレグヘモグロビン配列及び組換え構築物は、着目した植物又は着目した生物における発現のために提供され得る。カセットは、レグヘモグロビンポリヌクレオチド又は改変されたレグヘモグロビンポリヌクレオチドに作動可能に連結された５’及び３’調節配列を含み得る。「作動可能に連結された」は、２つ以上のエレメント間の機能的連結を意味するように意図する。例えば、着目したポリヌクレオチドと調節配列（例えば、プロモーター）との間の作動可能な連結は、着目したポリヌクレオチドの発現を可能にする機能的連結である。作動可能に連結したエレメントは、隣接していても隣接していなくてもよい。２つのタンパク質コード領域の連結を指すために使用する場合、作動可能に連結されるとは、コード領域が同じリーディングフレームにあることが意図されている。カセットは、加えて、生物に同時形質転換しようとする少なくとも１つの追加的な遺伝子を含有し得る。或いは、追加の遺伝子を、複数の発現カセットに供してもよい。そのような発現カセットには、調節領域の転写調節下に改変されたグリシニンポリヌクレオチドを挿入するための複数の制限部位、及び／又は認識部位が提供される。発現カセットは、選択マーカー遺伝子を含有することができる。

発現カセットは、転写の５’－３’方向に、植物内で機能する、転写及び翻訳開始領域（例えば、プロモーター）、本明細書に記載される改変されたレグヘモグロビンポリヌクレオチド、並びに転写及び翻訳終止領域（例えば、終止領域）を含むことができる。調節領域（例えば、プロモーター、転写調節領域、及び翻訳終止領域）、及び／又は改変されたレグヘモグロビンポリヌクレオチドは、宿主細胞に対し、又は相互に天然／類似であり得る。或いは、調節領域及び／又は改変されたレグヘモグロビンポリヌクレオチドは、宿主細胞に対し、又は相互に異種であり得る。

本明細書で使用される場合、配列に関連した「異種の」は、外来種を起源とする配列であるか、又は同一種からのものであれば、組成及び／又はゲノム遺伝子座が意図的な人的介入によって天然の形態から変化した配列である。例えば、異種ポリヌクレオチドに作動に可能に連結したプロモーターは、そのポリヌクレオチドが由来する種と異なる種からのものであるか、又は、同一／類似種からのものであれば、一方若しくは両方が元の形態及び／若しくはゲノム遺伝子座から実質的に改変されており、或いは、プロモーターが、作動可能に連結されているポリヌクレオチドに対し天然のプロモーターではない。

終止領域は、転写開始領域と、植物宿主と天然であってもよく、又はプロモーター、改変されたグリシニンポリヌクレオチド、植物宿主、又はそれらの任意の組合せとは別の供給源に由来してもよい（すなわち、外来性又は異種）。

発現カセットは更に、５’リーダー配列を含むことができる。そのようなリーダー配列は、翻訳を強化するように働き得る。翻訳リーダーは、当該技術分野で知られており、ウイルス翻訳リーダー配列が挙げられる。

発現カセットの調製には、各種ＤＮＡ断片が、適当な配向で、必要ならば、適当なリーディングフレームにおけるＤＮＡ配列を提供するように操作され得る。この終わり近くに、アダプター又はリンカーがＤＮＡ断片の結合に使用され得、或いは、適当な制限酵素認識部位、不要なＤＮＡの除去、制限酵素認識部位の除去などを提供するための他の操作が行われ得る。この目的のために、インビトロの変異誘発、プライマー修復、制限、アニーリング、再置換、例えば、移行及びトランスバージョンを関与させてもよい。

本明細書で使用される「プロモーター」は、転写開始点の上流のＤＮＡ領域を指し、ＲＮＡポリメラーゼ、及び転写を開始する他のタンパク質の認識及び結合に関与している。「植物プロモーター」は、植物細胞において転写を開始することができるプロモーターである。植物プロモーターの例としては、限定はされないが、植物、植物ウイルス、並びにアグロバクテリウム属（Ａｇｒｏｂａｃｔｅｒｉｕｍ）又はリゾビウム属（Ｒｈｉｚｏｂｉｕｍ）のような植物細胞で発現する遺伝子を含む細菌から得られるものが挙げられる。ある特定のタイプのプロモーターは、葉、根、種子、繊維、木部導管、仮道管又は厚壁組織などのある特定の組織において、転写を優先して開始させる。そのようなプロモーターは「組織優先的」と呼ばれる。「細胞型」特異的プロモーターは、１種以上の器官の特定の細胞型、例えば根又は葉の血管細胞における発現を主に駆動する。「誘導性」又は「調節可能な」プロモーターは、環境制御下にあるプロモーターである。誘導性プロモーターによる転写に影響を及ぼし得る環境条件の例として、嫌気的条件、又は光の存在が挙げられる。別のタイプのプロモーターは、発現制御されたプロモーターであり、例えば、花粉の発育中に発現を駆動するプロモーターである。組織優先的プロモーター、細胞型特異的プロモーター、発現制御されたプロモーター、及び誘導性プロモーターは、「非構成的」プロモーター類を構成する。「構成的」プロモーターは、ほとんどの環境条件下で活性を有するプロモーターである。構成的プロモーターとしては、例えば、Ｒｓｙｎ７プロモーターのコアプロモーター、並びに国際公開第９９／４３８３８号パンフレット及び米国特許第６，０７２，０５０号明細書に開示の他の構成的プロモーター；コアＣａＭＶ３５Ｓプロモーター（Ｏｄｅｌｌｅｔａｌ．（１９８５）Ｎａｔｕｒｅ３１３：８１０－８１２）；コメアクチン（ＭｃＥｌｒｏｙｅｔａｌ．（１９９０）ＰｌａｎｔＣｅｌｌ２：１６３－１７１）；ユビキチン（Ｃｈｒｉｓｔｅｎｓｅｎｅｔａｌ．（１９８９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．１２：６１９－６３２及びＣｈｒｉｓｔｅｎｓｅｎｅｔａｌ．（１９９２）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．１８：６７５－６８９）；ｐＥＭＵ（Ｌａｓｔｅｔａｌ．（１９９１）Ｔｈｅｏｒ．Ａｐｐｌ．Ｇｅｎｅｔ．８１：５８１－５８８）；ＭＡＳ（Ｖｅｌｔｅｎｅｔａｌ．（１９８４）ＥＭＢＯＪ．３：２７２３－２７３０）；ＡＬＳプロモーター（米国特許第５，６５９，０２６号明細書）などが挙げられる。他の構成プロモーターには、例えば、米国特許第５，６０８，１４９号明細書、同第５，６０８，１４４号明細書、同第５，６０４，１２１号明細書、同第５，５６９，５９７号明細書、同第５，４６６，７８５号明細書、同第５，３９９，６８０号明細書、同第５，２６８，４６３号明細書、同第５，６０８，１４２号明細書及び同第６，１７７，６１１号明細書が挙げられる。

１つ以上の異種調節エレメントの組合せを含む合成プロモーターも企図される。

プロモーターは、当該技術分野において既知の任意のタイプ又は部類のプロモーターであることができ、それによって着目したポリヌクレオチド配列の天然プロモーターを含む多数のプロモーターのいずれか１つを使用して、本明細書に開示される様々な改変されたレグヘモグロビン配列を発現させることができる。本明細書に開示される組換えＤＮＡ構築物で使用するためのプロモーターは、望んでいる結果に基づいて選択することができる。

ある特定の実施形態では、本明細書に記載される組換えＤＮＡ構築物は、植物又は種子中で発現される。ある特定の実施形態では、植物又は種子は、ダイズ植物又はダイズ種子である。本明細書で使用される場合、用語「縮物」は、植物プロトプラスト、そこから植物が再生できる植物細胞組織培養物、植物カルス、植物塊、及び植物又は植物部分の中で損傷を受けていない、胚、花粉、胚珠、種子、葉、花、枝、果実、穀粒、穂、穂軸、莢、柄、根、根端、葯などの植物細胞が含まれる。穀粒は、それらの種の栽培又は繁殖と異なる目的で栽培業者が生産する成熟種子を意味するものである。再生植物の子孫、多様体及び変異体もまた、それらの一部が導入遺伝子を含むなら、本開示に含まれる。

ある特定の実施形態では、ダイズ植物又はダイズ種子は、対照種子（例えば、少なくとも１つの改変を含まない種子）と比較して、種子中の総プロテインを増加させる少なくとも１つの追加の改変を更に含む。ある特定の実施形態では、少なくとも１つの改変を含むダイズ種子は、対照種子と比較して、少なくとも約１％、１．５％、２％、２．５％、３％、３．５％、４％、５％、１０％、又は１５％、且つ２０％、１５％、１０％、９％、８％、７％、６％、又は５％未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加を含む。

ある特定の実施形態では、ダイズ植物又はダイズ種子は、種子中のラフィノースファミリーオリゴ糖（ＲＦＯ）含量を減少させる少なくとも１つの追加の改変を更に含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼの発現及び／又は活性における減少を含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼ２（ＲＳ２）且つ／又はラフィノースシンターゼ４（ＲＳ４）の発現、及び／又は活性における減少を含む。ある特定の実施形態では、ダイズ種子は、対照種子と比較して、少なくとも３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、又は９９％のＲＳ２、ＲＳ４、又はＲＳ２及びＲＳ４の発現における減少を含む。ある特定の実施形態では、種子は、乾燥重量に基づいて、約６％、５．５％、５％、４．５％、４％、３．５％、３％、２．５％、２％、１．５％、１％、又は０．５％未満のＲＦＯ含有量を含む。ある特定の実施形態では、導入された改変は、対照種子と比較して、ＲＦＯ含有量を、少なくとも約１％、１．５％、２％、２．５％、３％、３．５％、４％、５％、１０％、又は１５％、且つ２０％、１５％、１０％、９％、８％、７％、６％、又は５％未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加だけ減少させる。

ある特定の実施形態では、ダイズ植物又はダイズ種子は、種子中のオレイン酸の量を増加させる、種子中のリノレン酸の量を減少させる、種子タンパク質の量を増加させる、又はそれらの組合せの少なくとも１つの追加の改変を更に含む。例えば、改変は、ＦＡＤ２－１Ａ、ＦＡＤ２－１Ｂ、ＦＡＤ３ａ、ＦＡＤ３ｂ遺伝子内にあり得る。

ある特定の実施形態では、ダイズ植物又はダイズ種子は、総タンパク質の量を増加させる少なくとも１つの追加の改変を更に含み、これは、例えば、（ｉ）ＣＣＴドメイン含有タンパク質、（ｉｉ）レティキュロン、（ｉｉｉ）トレハロースリン酸シンターゼ、（ｉｖ）ＨＥＣＴユビキチンリガーゼ（ＨＥＬ又はＵＰＬ３）、（ｖ）ＭＦＴ（ｍｏｔｈｅｒｏｆｆｌｏｗｅｒｉｎｇ）ポリペプチド、（ｖｉ）米国特許第５，７１０，３６５号明細書、同第８７２８７２６号明細書、及び同第１０，０８１，８１４号明細書（これらの各々は、その全体が参照により本明細書に組み込まれる）に開示されるような、ラフィノースシンターゼＲＳ２、ＲＳ３、又はＲＳ４、若しくは（ｖｉｉ）これらの任意の組合せをコードする遺伝子のうちの１つ以上の改変による。

例えば、レグヘモグロビンを本明細書に開示される量で含み、処理されて油及びミールを生成することができるダイズ種子、及びこれから生成される油が提供され、このダイズ及び／又は油は、総脂肪酸の少なくとも５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、若しくは９０重量パーセント、又は少なくとも約５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、若しくは９０重量パーセントのオレイン（Ｃ１８：１）酸、且つ総脂肪酸の１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７６、７５、７４、７３、７２、７１、若しくは７０重量パーセント未満、又は約１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７６、７５、７４、７３、７２、７１、若しくは７０重量パーセント未満のオレイン酸を有する。

例えば、レグヘモグロビンを本明細書に開示される量で（本明細書に開示される量で）含み、処理されて油を生成することができるダイズ種子、及びこれから生成される油が提供され、このダイズ及び／又は油は、総脂肪酸の少なくとも０．１、０．２、０．３、０．４、０．５、０．６、０．７、０．８、０．９、１．０、１．１、１．２、１．３、１．４、１．５、１．６、１．７、１．８、１．９、２．０、２．１、２．２、２．３、２．４、２．５、２．６、２．７、２．８、２．９、若しくは３．０重量パーセント、又は少なくとも約０．１、０．２、０．３、０．４、０．５、０．６、０．７、０．８、０．９、１．０、１．１、１．２、１．３、１．４、１．５、１．６、１．７、１．８、１．９、２．０、２．１、２．２、２．３、２．４、２．５、２．６、２．７、２．８、２．９、若しくは３．０重量パーセントのリノレン（Ｃ１８：３）酸、且つ総脂肪酸の６、５．５、５、４．５、４、３．９、３．８、３．７、３．６、３．５、３．４、３．３、３．２、３．１、３．０、２．９、２．８、２．７、２．６、２．５、２．４、２．３、２．２、２．１、若しくは２．０重量パーセント未満、又は約６、５．５、５、４．５、４、３．９、３．８、３．７、３．６、３．５、３．４、３．３、３．２、３．１、３．０、２．９、２．８、２．７、２．６、２．５、２．４、２．３、２．２、２．１、若しくは２．０重量パーセント未満のリノレン酸を有する。

例えば、レグヘモグロビンを本明細書に開示される量で含み、１３％の水分で測定されるか、又は１３％の水分に調整される場合、総種子重量の少なくとも３５％、３６％、３７％、３８％、３９％、４０％、４１％、４２％、４３％、４４％、４５％、４６％、４７％、４８％、４９％、５０％、５１％、５２％、５３％、５４％、若しくは５５％、又は少なくとも約３５％、３６％、３７％、３８％、３９％、４０％、４１％、４２％、４３％、４４％、４５％、４６％、４７％、４８％、４９％、５０％、５１％、５２％、５３％、５４％、若しくは５５％、且つ総種子重量の６５％、６０％、５９％、５８％、５７％、５６％、５５％、５４％、５３％、５２％、５１％、若しくは５０％未満、又は約６５％、６０％、５９％、５８％、５７％、５６％、５５％、５４％、５３％、５２％、５１％、若しくは５０％未満のタンパク質含有量を有するダイズ種子が提供される。

例えば、レグヘモグロビンを本明細書に開示される量で含み、１３％の水分で測定されるか、又は１３％の水分に調整される場合、総種子重量の４％、３．５％、３％、２．５％、２％、１．５％、１％、０．５％、０．４％、０．３％、０．２％、若しくは０．１％未満、又は約４％、３．５％、３％、２．５％、２％、１．５％、１％、０．５％、０．４％、０．３％、０．２％、若しくは０．１％未満、且つ総種子重量の少なくとも０％、０．０１％、０．０５％、０．０６％、０．０７％、０．０８％、若しくは０．０９％、又は少なくとも約０％、０．０１％、０．０５％、０．０６％、０．０７％、０．０８％、若しくは０．０９％のスタキオース含有量を有するダイズ種子が提供される。

例えば、レグヘモグロビンを本明細書に開示される量で含み、１３％の水分で測定されるか、又は１３％の水分に調整される場合、総種子重量の２％、１．５％、１．４％、１．３％、１．２％、１．１％、１％、０．９％、０．８％、０．７％、０．６％、０．５％、０．４％、０．３％、０．２％、若しくは０．１％未満、又は約２％、１．５％、１．４％、１．３％、１．２％、１．１％、１％、０．９％、０．８％、０．７％、０．６％、０．５％、０．４％、０．３％、０．２％、若しくは０．１％未満、且つ総種子重量の少なくとも０％、０．０１％、０．０５％、０．０６％、０．０７％、０．０８％、若しくは０．０９％、又は少なくとも約０％、０．０１％、０．０５％、０．０６％、０．０７％、０．０８％、若しくは０．０９％のラフィノース含有量を有するダイズ種子が提供される。

本明細書で使用される場合、「ダイズタンパク質組成物」は、ダイズタンパク質を含有するヒト又は動物用の食物成分を指す。ある特定の実施形態では、組成物は、ヒト食物組成物である。ある特定の実施形態では、ヒト食物組成物は、ダイズミール、ダイズ粉、脱脂ダイズ粉、豆乳、スプレードライ豆乳、ダイズタンパク質濃縮物、組織化されたダイズタンパク質濃縮物、加水分解ダイズタンパク質、ダイズタンパク質単離物、高野豆腐、ダイズミートアナログ、ダイズチーズアナログ、及びダイズコーヒー用クリームからなる群から選択される組成物である。

いくつかの実施形態では、総タンパク質の重量で少なくとも０．１％、０．２％、０．３％、０．４％、０．５％、１％、２％、３％、４％、５％、６％、７％、８％、９％若しくは１０％且つ２５％、２０％、１５％、１０％、９％、８％、７％、６％、５％、４％、３％、２％若しくは１％未満のレグヘモグロビンを含むダイズ単離物又はダイズタンパク質が提供され、レグヘモグロビンの少なくとも約２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、８０％、８５％、９０％若しくは９５％且つ９９．９％、９９％、９８％、９７％、９６％、９５％、９０％、８５％、８０％、若しくは７５％未満が、鉄基でヘム化されている。

ある特定の実施形態では、本明細書に記載されるようなレグヘモグロビンを含む種子を生産する植物は、対照種子と比較して、少なくとも約１０％、１５％、２０％、２５％、３０％、３５％、４０％、５０％、６０％、７０％、８０％、９０％、１００％、若しくは５００％且つ約１０００％、５００％、１００％、９０％、８０％、７０％、６０％、若しくは５０％の１つ以上の必須アミノ酸の量における増加を含む。

本明細書で使用される場合、「パーセント増加」は、対照値の割合で表された変化又は差を指し、例えば、｛［改変された／トランスジェニック／試験値（％）－対照値（％）］／対照値（％）｝×１００％＝パーセント変化であるか、又は｛［第１の場所で得られた値（％）－第２の場所で得られた値（％）］／第２の場所で得られた値（％）｝×１００＝パーセント変化である。

ある特定の実施形態では、１つ以上の必須アミノ酸は、メチオニン、シスチン、トリプトファン、スレオニン、及びリジンのうちの１つ以上、又はそれらの組合せである。

ある特定の実施形態では、対照種子（例えば、少なくとも１つの改変を含まない種子）と比較して、種子中の総タンパク質を増加させる少なくとも１つの追加の改変を更に含む方法、植物及び種子が提供される。ある特定の実施形態では、導入された改変は、対照種子と比較して、レグヘモグロビンを含むダイズ種子中のタンパク質含有量を、少なくとも約１％、１．５％、２％、２．５％、３％、３．５％、４％、５％、１０％、若しくは１５％且つ２０％、１５％、１０％、９％、８％、７％、６％、若しくは５％未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加まで増加させる。

ある特定の実施形態では、方法は、種子中のラフィノースファミリーオリゴ糖（ＲＦＯ）含有量を減少させる少なくとも１つの改変を導入することを更に含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼの発現及び／又は活性における減少を含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼ２（ＲＳ２）且つ／又はラフィノースシンターゼ４（ＲＳ４）の発現、及び／又は活性における減少を含む。ある特定の実施形態では、ダイズ種子は、対照種子と比較して、少なくとも３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、又は９９％のＲＳ２、ＲＳ４、又はＲＳ２及びＲＳ４の発現における減少を含む。ある特定の実施形態では、種子は、乾燥重量に基づいて、約６％、５．５％、５％、４．５％、４％、３．５％、３％、２．５％、２％、１．５％、１％、又は０．５％未満のＲＦＯ含有量を含む。ある特定の実施形態では、導入された改変は、対照種子と比較して、ＲＦＯ含有量を、少なくとも約１％、１．５％、２％、２．５％、３％、３．５％、４％、５％、１０％、若しくは１５％且つ２０％、１５％、１０％、９％、８％、７％、６％、若しくは５％未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加まで減少させる。

ある特定の実施形態では、本方法は：（ａ）ガイドＲＮＡ、少なくとも１つのポリヌクレオチド改変テンプレート、及び少なくとも１つのＣａｓエンドヌクレアーゼを植物細胞に提供することであって、少なくとも１つのＣａｓエンドヌクレアーゼが、植物細胞中で改変されることになるエンドヌクレアーゼ遺伝子において二本鎖切断を導入し、ポリヌクレオチド改変テンプレートが、本明細書に記載されるポリぺプチドのいずれかをコードする改変遺伝子を生成する、提供することと、（ｂ）植物細胞から植物を得ることと、（ｃ）子孫植物を生成することと、を含む。

天然に存在するポリヌクレオチド又は調節エレメント、コード配列、及び非コード配列を含む組み込まれたトランスジェニック配列を改変するための方法及び組成物が本明細書に提供される。これらの方法及び組成物はまた、核酸をゲノム中の予め操作された標的認識配列に標的化させるのに有用である。ポリヌクレオチドの改変は、例えば、一本鎖切断又は二本鎖切断をＤＮＡ分子に導入することによって達成されてもよい。

ポリヌクレオチド鎖内のホスホジエステル結合を切断するエンドヌクレアーゼなどの二本鎖切断誘導剤によって誘導された二本鎖切断は、非相同末端結合経路、及び相同組換えを含むＤＮＡ修復機構の誘導をもたらし得る。エンドヌクレアーゼは、制限エンドヌクレアーゼ（例えば、Ｒｏｂｅｒｔｓｅｔａｌ．，（２００３）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ１：４１８－２０）、Ｒｏｂｅｒｔｓｅｔａｌ．，（２００３）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３１：１８０５－１２、及びＢｅｌｆｏｒｔｅｔａｌ．，（２００２）ｉｎＭｏｂｉｌｅＤＮＡＩＩ，ｐｐ．７６１－７８３，Ｅｄｓ．Ｃｒａｉｇｉｅｅｔａｌ．，（ＡＳＭＰｒｅｓｓ，Ｗａｓｈｉｎｇｔｏｎ，ＤＣ）を参照されたい）、メガヌクレアーゼ（例えば、国際公開第２００９／１１４３２１号パンフレット；Ｇａｏｅｔａｌ．（２０１０）ＰｌａｎｔＪｏｕｒｎａｌ１：１７６－１８７を参照されたい）、ＴＡＬエフェクターヌクレアーゼ又はＴＡＬＥＮ（例えば、米国特許出願公開第２０１１０１４５９４０号パンフレット、Ｃｈｒｉｓｔｉａｎ，Ｍ．，Ｔ．Ｃｅｒｍａｋ，ｅｔａｌ．２０１０．ＴａｒｇｅｔｉｎｇＤＮＡｄｏｕｂｌｅ－ｓｔｒａｎｄｂｒｅａｋｓｗｉｔｈＴＡＬｅｆｆｅｃｔｏｒｎｕｃｌｅａｓｅｓ．Ｇｅｎｅｔｉｃｓ１８６（２）：７５７－６１及びＢｏｃｈｅｔａｌ．，（２００９），Ｓｃｉｅｎｃｅ３２６（５９５９）：１５０９－１２を参照されたい）、ジンクフィンガーヌクレアーゼ（例えば、Ｋｉｍ，Ｙ．Ｇ．，Ｊ．Ｃｈａ，ｅｔａｌ．（１９９６）．“Ｈｙｂｒｉｄｒｅｓｔｒｉｃｔｉｏｎｅｎｚｙｍｅｓ：ｚｉｎｃｆｉｎｇｅｒｆｕｓｉｏｎｓｔｏＦｏｋＩｃｌｅａｖａｇｅ”を参照されたい）、並びにＣＲＩＳＰＲ－Ｃａｓエンドヌクレアーゼ（例えば、２００７年３月１日公開の国際公開第２００７／０２５０９７号パンフレットの出願を参照されたい）を含む様々な範囲の酵素を含む。

二本鎖切断がゲノム内に導入されると、細胞のＤＮＡ修復機構は、切断を修復するように活性化される。２つのＤＮＡ修復経路がある。一方は、非相同末端結合（ＮＨＥＪ）経路と称されるものであり（Ｂｌｅｕｙａｒｄｅｔａｌ．，（２００６）ＤＮＡＲｅｐａｉｒ５：１－１２）、他方は、相同組換え修復（ＨＤＲ）である。染色体の構造的完全性は、典型的には、ＮＨＥＪにより維持されるが、欠失、挿入又は他の再配列（染色体転座など）もあり得る（ＳｉｅｂｅｒｔａｎｄＰｕｃｈｔａ，２００２，ＰｌａｎｔＣｅｌｌ１４：１１２１－３１；Ｐａｃｈｅｒｅｔａｌ．，２００７，Ｇｅｎｅｔｉｃｓ１７５：２１－９）。ＨＤＲ経路は、二本鎖ＤＮＡ切断を修復するための別の細胞の機構であり、相同組換え（ＨＲ）及び一本鎖アニーリング（ＳＳＡ）を含む（Ｌｉｅｂｅｒ．２０１０Ａｎｎｕ．Ｒｅｖ．Ｂｉｏｃｈｅｍ．７９：１８１－２１１）。

二本鎖切断誘導剤に加えて、部位特異的塩基変換もまた、ゲノム中への本明細書に記載される１つ以上の改変を作製するために、１つ以上のヌクレオチド変化を操作することを達成することができる。これらには、例えば、Ｃ・ＧからＴ・Ａへの、又はＡ・ＴからＧ・Ｃへの塩基編集デアミナーゼ酵素によって媒介される部位特異的塩基編集が含まれる（Ｇａｕｄｅｌｌｉｅｔａｌ．，ＰｒｏｇｒａｍｍａｂｌｅｂａｓｅｅｄｉｔｉｎｇｏｆＡ・ＴｔｏＧ・ＣｉｎｇｅｎｏｍｉｃＤＮＡｗｉｔｈｏｕｔＤＮＡｃｌｅａｖａｇｅ．”Ｎａｔｕｒｅ（２０１７）；Ｎｉｓｈｉｄａｅｔａｌ．“Ｔａｒｇｅｔｅｄｎｕｃｌｅｏｔｉｄｅｅｄｉｔｉｎｇｕｓｉｎｇｈｙｂｒｉｄｐｒｏｋａｒｙｏｔｉｃａｎｄｖｅｒｔｅｂｒａｔｅａｄａｐｔｉｖｅｉｍｍｕｎｅｓｙｓｔｅｍｓ．”Ｓｃｉｅｎｃｅ３５３（６３０５）（２０１６）；Ｋｏｍｏｒｅｔａｌ．“ＰｒｏｇｒａｍｍａｂｌｅｅｄｉｔｉｎｇｏｆａｔａｒｇｅｔｂａｓｅｉｎｇｅｎｏｍｉｃＤＮＡｗｉｔｈｏｕｔｄｏｕｂｌｅ－ｓｔｒａｎｄｅｄＤＮＡｃｌｅａｖａｇｅ．”Ｎａｔｕｒｅ５３３（７６０３）（２０１６）：４２０－４。

本明細書に記載される方法では、内因性遺伝子は、ＣＲＩＳＰＲ関連（Ｃａｓ）エンドヌクレアーゼ、Ｚｎ－フィンガーヌクレアーゼ媒介系、メガヌクレアーゼ媒介系、オリゴヌクレオベース媒介系、又は当業者に既知のあらゆる遺伝子改変系によって改変され得る。

ある特定の実施形態では、内因性遺伝子は、ＣＲＩＳＰＲ関連（Ｃａｓ）エンドヌクレアーゼによって改変される。

クラスＩＣａｓエンドヌクレアーゼは、マルチサブユニットエフェクター複合体（タイプＩ、ＩＩＩ、及びＩＶ）を含み、一方、クラス２系は、単一のタンパク質エフェクター（ＩＩ、Ｖ、及びＶＩ）を含む（Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５；Ｚｅｔｓｃｈｅｅｔａｌ．，２０１５，Ｃｅｌｌ１６３，１－１３；Ｓｈｍａｋｏｖｅｔａｌ．，２０１５，ＭｏｌｅｃｕｌａｒＣｅｌｌ６０，１－１３；Ｈａｆｔｅｔａｌ．，２００５，ＣｏｍｐｕｔａｔｉｏｎａｌＢｉｏｌｏｇｙ，ＰＬｏＳＣｏｍｐｕｔＢｉｏｌ１（６）：ｅ６０；及びＫｏｏｎｉｎｅｔａｌ．２０１７，ＣｕｒｒＯｐｉｎｉｏｎＭｉｃｒｏｂｉｏｌｏｇｙ３７：６７－７８）。クラス２タイプＩＩ系では、Ｃａｓエンドヌクレアーゼはガイドポリヌクレオチドとの複合体で作用する。

したがって、本明細書に記載される方法のある特定の実施形態では、Ｃａｓエンドヌクレアーゼは、ガイドポリヌクレオチドとの複合体（例えば、ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体）を形成する。

本明細書で使用される場合、用語「ガイドポリヌクレオチド」は、Ｃａｓエンドヌクレアーゼ、例えば、本明細書に記載のＣａｓエンドヌクレアーゼと複合体を形成することができ、ＣａｓエンドヌクレアーゼがＤＮＡ標的部位を認識し、任意選択により結合し、且つ任意選択により切断することを可能にするポリヌクレオチド配列を指す。ガイドポリヌクレオチド配列は、ＲＮＡ配列、ＤＮＡ配列、又はこれらの組合せ（ＲＮＡ－ＤＮＡ組合せ配列）であってよい。ガイドポリヌクレオチドは、限定されないが、ロックド核酸（ＬＮＡ）、５－メチルｄＣ、２，６－ジアミノプリン、２’－フルオロＡ、２’－フルオロＵ、２’－Ｏ－メチルＲＮＡ、ホスホロチオエート結合、コレステロール分子への連結、ポリエチレングリコール分子への連結、スペーサー１８（ヘキサエチレングリコール鎖）分子への連結、又は環化をもたらす５’から３’への共有結合的連結などの化学的に改変された塩基を更に含んでもよい。

ある特定の実施形態では、ＣａｓエンドヌクレアーゼがＤＮＡ標的を切断し、Ｃａｓエンドヌクレアーゼによる標的認識、結合及び切断を可能にするようにＣａｓエンドヌクレアーゼを向けさせるガイドポリヌクレオチド（例えば、ｇＲＮＡ）との複合体を形成する。ガイドポリヌクレオチド（例えば、ｇＲＮＡ）は、Ｃａｓエンドヌクレアーゼと相互作用するＣａｓエンドヌクレアーゼ認識（ＣＥＲ）ドメイン、及び標的ＤＮＡ中のヌクレオチド配列にハイブリダイズする可変標的化（ＶＴ）ドメインを含み得る。ある特定の実施形態では、ガイドポリヌクレオチド（例えば、ｇＲＮＡ）は、ＣＲＩＳＰＲヌクレオチド（ｃｒヌクレオチド；例えば、ｃｒＲＮＡ）及びトランス活性化型ＣＲＩＳＰＲヌクレオチド（ｔｒａｃｒヌクレオチド；例えば、ｔｒａｃｒＲＮＡ）を含み、ＣａｓエンドヌクレアーゼをそのＤＮＡ標的にガイドする。ガイドポリヌクレオチド（例えば、ｇＲＮＡ）は、二本鎖ＤＮＡ標的の一本の鎖に相補的なスペーサー領域、及びｔｒａｃｒヌクレオチド（例えば、ｔｒａｃｒＲＮＡ）と塩基対を形成し、ヌクレオチド二本鎖（例えば、ＲＮＡ二本鎖）を形成する領域を含む。

ある特定の実施形態では、ｇＲＮＡは、ｃｒＲＮＡとｔｒａｃｒＲＮＡとの合成誘導体を含む「シングルガイドＲＮＡ」（ｓｇＲＮＡ）である。多くの系では、Ｃａｓエンドヌクレアーゼ－ガイドポリヌクレオチド複合体は、「プロトスペーサー隣接モチーフ」（ＰＡＭ）と呼ばれる標的配列（プロトスペーサー）に隣接する短いヌクレオチド配列を認識する。

用語「シングルガイドＲＮＡ」及び「ｓｇＲＮＡ」は、本明細書では互換的に使用され、ｔｒａｃｒＲＮＡ（トランス活性化ＣＲＩＳＰＲＲＮＡ）に融合した（ｔｒａｃｒＲＮＡにハイブリダイズするｔｒａｃｒメイト配列に結合した）可変標的化ドメインを含むｃｒＲＮＡ（ＣＲＩＳＰＲＲＮＡ）である、２つのＲＮＡ分子の合成融合に関する。シングルガイドＲＮＡは、ＩＩ型Ｃａｓエンドヌクレアーゼと複合体を形成することができるＩＩ型ＣＲＩＳＰＲ／ＣａｓシステムのｃｒＲＮＡ又はｃｒＲＮＡ断片及びｔｒａｃｒＲＮＡ又はｔｒａｃｒＲＮＡ断片を含み得、前記ガイドＲＮＡ／Ｃａｓエンドヌクレアーゼ複合体は、ＣａｓエンドヌクレアーゼをＤＮＡ標的部位に誘導することができ、ＣａｓエンドヌクレアーゼがそのＤＮＡ標的部位を認識し、任意選択により結合し、且つ任意選択により切れ目を入れるか又は切断（一本鎖又は二本鎖切断を導入）するのを可能にする。

一本鎖ガイドポリヌクレオチドのｃｒヌクレオチドとｔｒａｃｒヌクレオチドとを連結するヌクレオチド配列は、ＲＮＡ配列、ＤＮＡ配列又はＲＮＡ－ＤＮＡ組合せ配列を含むことができる。一実施形態では、シングルガイドポリヌクレオチドのｃｒヌクレオチドとｔｒａｃｒヌクレオチドとを連結するヌクレオチド配列の長さは、少なくとも３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、又は１００ヌクレオチド長であり得る。一実施形態では、シングルガイドポリヌクレオチドのｃｒヌクレオチドとｔｒａｃｒヌクレオチドとを連結するヌクレオチド配列は、限定されないがＧＡＡＡテトラループ配列等のテトラループ配列を含むことができる。

用語「可変標的化ドメイン」若しくは「ＶＴドメイン」は、本明細書では互換的に使用され、二本鎖ＤＮＡ標的部位の１本の鎖（ヌクレオチド配列）にハイブリダイズできる（相補的である）ヌクレオチド配列を含む。いくつかの実施形態では、可変標的ドメインは１２～３０ヌクレオチドの連続するストレッチを含む。可変標的ドメインは、ＤＮＡ配列、ＲＮＡ配列、改変ＤＮＡ配列、改変ＲＮＡ配列、又はこれらの任意の組合せで構成され得る。

（ガイドポリヌクレオチドの）「Ｃａｓエンドヌクレアーゼ認識ドメイン」又は「ＣＥＲドメイン」という用語は、本明細書中で互換的に使用され、Ｃａｓエンドヌクレアーゼポリペプチドと相互作用するヌクレオチド配列を含む。ＣＥＲドメインは、（トランス作用）ｔｒａｃｒヌクレオチドメイト配列に続いてｔｒａｃｒヌクレオチド配列を含む。ＣＥＲドメインは、ＤＮＡ配列、ＲＮＡ配列、改変ＤＮＡ配列、改変ＲＮＡ配列（例えば、２０１５年２月２６日に公開された米国特許出願公開第２０１５００５９０１０Ａ１号明細書を参照されたい）又はこれらの任意の組合せで構成され得る。

本明細書で使用される「プロトスペーサー隣接モチーフ」（ＰＡＭ）は、本明細書に記載したガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ系によって認識（標的化）される標的配列（プロトスペーサー）に隣接する短鎖ヌクレオチド配列を意味する。ある特定の実施形態では、Ｃａｓエンドヌクレアーゼは、標的ＤＮＡ配列がＰＡＭ配列に隣接していないか、又はその近くにない場合は、標的ＤＮＡ配列を正しく認識することはできない。ある特定の実施形態では、ＰＡＭは、標的配列（例えば、Ｃａｓ１２ａ）に先行する。ある特定の実施形態では、ＰＡＭは、標的配列（例えば、化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）Ｃａｓ９）に続く。本明細書におけるＰＡＭの配列及び長さは、用いるＣａｓタンパク質、又はＣａｓタンパク質複合体に応じて異なり得る。ＰＡＭ配列は任意の長さであり得るが、一般には、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９又は２０ヌクレオチド長である。

本明細書で使用される場合、用語「ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体」、「ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼシステム」、「ガイドポリヌクレオチド／Ｃａｓ複合体」、「ガイドポリヌクレオチド／Ｃａｓシステム」、「誘導型Ｃａｓシステム」、「ポリヌクレオチド誘導型エンドヌクレアーゼ」、及び「ＰＧＥＮ」は、本明細書では互換的に使用され、複合体を形成することができる少なくとも１つのガイドポリヌクレオチド及び少なくとも１つのＣａｓエンドヌクレアーゼを指し、ここで前記ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体は、ＣａｓエンドヌクレアーゼをＤＮＡ標的部位に誘導することができ、ＣａｓエンドヌクレアーゼがＤＮＡ標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断する（一本鎖又は二本鎖切断を導入する）ことを可能にする。本明細書におけるガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体は、既知のＣＲＩＳＰＲシステム（ＨｏｒｖａｔｈａｎｄＢａｒｒａｎｇｏｕ，２０１０，Ｓｃｉｅｎｃｅ３２７：１６７－１７０；Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５；Ｚｅｔｓｃｈｅｅｔａｌ．，２０１５，Ｃｅｌｌ１６３，１－１３；Ｓｈｍａｋｏｖｅｔａｌ．，２０１５，ＭｏｌｅｃｕｌａｒＣｅｌｌ６０，１－１３）のいずれかのＣａｓタンパク質及び好適なポリヌクレオチド成分を含み得る。ある特定の実施形態では、ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体はリボヌクレオタンパク質（ＲＮＰ）として提供され、ここではＣａｓエンドヌクレアーゼ成分はタンパク質として提供され、ガイドポリヌクレオチド成分はリボヌクレオチドとして提供される。

本明細書に記載される方法で使用するためのＣａｓエンドヌクレアーゼの例としては、Ｃａｓ９及びＣｐｆ１が挙げられるが、これらに限定されない。Ｃａｓ９（以前は、Ｃａｓ５、Ｃｓｎ１、又はＣｓｘ１２と称されていた）は、クラス２タイプＩＩＣａｓエンドヌクレアーゼである（Ｍａｋａｒｏｖａｅｔａｌ．２０１５，ＮａｔｕｒｅＲｅｖｉｅｗｓＭｉｃｒｏｂｉｏｌｏｇｙＶｏｌ．１３：１－１５）。Ｃａｓ９－ｇＲＮＡ複合体は、標的部位において、３’ＰＡＭ配列（化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）Ｃａｓ９のためのＮＧＧ）を認識し、ガイドＲＮＡのスペーサーが二本鎖ＤＮＡ標的に侵入することを可能にし、そして、スペーサーとプロトスペーサーとの間の十分な相同性が存在する場合、二本鎖切断の開裂を生成する。Ｃａｓ９エンドヌクレアーゼは、二本鎖切断を一緒に生成するＲｕｖＣ及びＨＮＨドメインを含み、別々に一本鎖切断を生成することができる。化膿性連鎖球菌（Ｓ．ｐｙｏｇｅｎｅｓ）Ｃａｓ９エンドヌクレアーゼについては、二本鎖切断により平滑末端が残る。Ｃｐｆ１は、クラス２タイプＶＣａｓエンドヌクレアーゼであり、ヌクレアーゼＲｕｖＣドメインを含むが、ＨＮＨドメインを欠く（Ｙａｍａｎｅｅｔａｌ．，２０１６，Ｃｅｌｌ１６５：９４９－９６２）。Ｃｐｆ１エンドヌクレアーゼは、「粘着性の」オーバーハング末端を作り出す。

ゲノム標的部位におけるＣａｓ９－ｇＲＮＡ系のためのいくつかの使用には、標的部位での１つ以上のヌクレオチドの挿入、欠失、置換、又は改変；目的のヌクレオチド配列（調節エレメントなど）の改変又は置換；目的のポリヌクレオチドの挿入；遺伝子ノックアウト；遺伝子ノックイン；スプライシング部位の改変及び／又は代替スプライシング部位の導入；目的タンパク質をコードするヌクレオチド配列の改変；アミノ酸及び／又はタンパク質の融合；並びに目的遺伝子中に逆方向リピートを発現することによる遺伝子サイレンシングが挙げられるが、これらに限定されない。

用語「標的部位」、「標的配列」、「標的部位配列」、「標的ＤＮＡ」、「標的遺伝子座」、「ゲノム標的部位」、「ゲノム標的配列」、「ゲノム標的遺伝子座」及び「プロトスペーサー」は、本明細書中で互換的に使用され、以下に限定はされないが、ガイドポリヌクレオチド／Ｃａｓエンドヌクレアーゼ複合体が認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断をすることができる、細胞の、染色体、エピソーム、遺伝子座又はゲノム中の他の任意のＤＮＡ分子（例えば、染色体ＤＮＡ、葉緑体ＤＮＡ、ミトコンドリアＤＮＡ、プラスミドＤＮＡ）上のヌクレオチド配列などのポリヌクレオチド配列を指す。標的部位は、細胞のゲノム中の内在性部位であり得るか、又は代わりに、標的部位は、細胞に対して異種であり得、そのため、細胞のゲノム中に天然には存在し得るか、若しくは標的部位は、天然で生じる場所に対して異種のゲノム位置に見出され得る。本明細書で使用される場合、用語「内在性標的配列」及び「天然標的配列」は、本明細書中で互換的に使用され、細胞のゲノムに内在するか又は天然のものであり、細胞のゲノム中のその標的配列の内在性又は天然の位置に存在する標的配列を指す。「人工標的部位」又は「人工標的配列」は、本明細書中で互換的に使用され、細胞のゲノムに導入される標的配列を指す。このような人工標的配列は、細胞のゲノム中の内在性標的配列又は天然標的配列と配列は、同一であるが、細胞のゲノム中の異なる位置（すなわち非内在位置又は非発生位置）に位置し得る。「変更標的部位」、「変更標的配列」、「改変標的部位」、「改変標的配列」は、本明細書中で互換的に使用され、非変更標的配列と比較して少なくとも１つの変更を含む、本明細書に開示の標的配列を指す。そのような「変更」としては、例えば、（ｉ）少なくとも１つのヌクレオチドの置換、（ｉｉ）少なくとも１つのヌクレオチドの欠失、（ｉｉｉ）少なくとも１つのヌクレオチドの挿入、又は（ｉｖ）（ｉ）～（ｉｉｉ）の任意の組合せが挙げられる。

編集対象のヌクレオチド配列と比較するとき、少なくとも１つのヌクレオチド改変を含む「ポリヌクレオチド改変テンプレート」も提供される。例えば、コードされるポリペプチド中でアミノ置換を誘導するための、配列番号１に対応する内因性遺伝子中の改変である。ヌクレオチド改変は、少なくとも１つのヌクレオチド置換、付加、欠失、又は化学的変更であり得る。場合により、ポリヌクレオチド改変テンプレートは、更に、少なくとも１つのヌクレオチド改変にフランキングする相同ヌクレオチド配列を含み得、そのフランキング相同ヌクレオチド配列は、編集されるべき所望のヌクレオチド配列に十分な相同性を提供する。

本明細書に開示される方法のある特定の実施形態では、目的のポリヌクレオチドは、標的部位で挿入され、「ドナーＤＮＡ」分子の一部として提供される。本明細書で使用される場合、「ドナーＤＮＡ」は、Ｃａｓエンドヌクレアーゼの標的部位内に挿入される目的のポリヌクレオチドを含むＤＮＡコンストラクトである。ドナーＤＮＡコンストラクトは、目的のポリヌクレオチドに隣接する第１及び第２の相同領域を更に含む。ドナーＤＮＡの第１及び第２の相同領域は、細胞又は生物のゲノムの標的部位中に存在する又はこの標的部位に隣接する第１及び第２のゲノム領域に対し相同性をそれぞれ有する。ドナーＤＮＡは、ガイドポリヌクレオチドに結合させることができる。繋留されたドナーＤＮＡは、ゲノムの編集、遺伝子の挿入及び標的ゲノムの調節に有用な標的及びドナーＤＮＡの共局在化を可能にする場合があり、また、内在性のＨＲ機構の機能が大きく低下していると考えられる分裂終了細胞の標的化に有用であり得る（Ｍａｌｉｅｔａｌ．，２０１３，ＮａｔｕｒｅＭｅｔｈｏｄｓＶｏｌ．１０：９５７－９６３）。標的ポリヌクレオチドとドナーポリヌクレオチドによって共有される相同性又は配列同一性の量は変動する場合があり、全長及び／又は領域を含む。

改変テンプレートを用いて、Ｃａｓ９－ｇＲＮＡ二本鎖切断部位においてゲノム配列を編集するためのプロセスは、一般的に：宿主細胞のゲノム中の標的配列を認識し、ゲノム配列中の二本鎖切断を誘導することができるＣａｓ９－ｇＲＮＡ複合体、及び編集されるヌクレオチド配列と比較したときに、少なくとも１つのヌクレオチド変更を含む少なくとも１つのポリヌクレオチド改変テンプレートを、宿主細胞に提供することを含む。ポリヌクレオチド改変テンプレートは、更に、少なくとも１つのヌクレオチド変更部にフランキングするヌクレオチド配列を含み得る。そのフランキング配列は、二本鎖切断にフランキングする染色体領域に実質的に相同である。二本鎖切断誘導剤、例えばＣａｓ９－ｇＲＮＡ複合体を使用するゲノム編集は、例えば、２０１５年３月１９日に公開された米国特許出願公開第２０１５００８２４７８号明細書、２０１５年２月２６日に公開された国際公開第２０１５０２６８８６号パンフレット、２０１６年１月１４日に公開された国際公開第２０１６００７３４７号パンフレット及び２０１６年２月１８日に公開された国際公開第２０１６０２５１３１号パンフレットに記載されている。

真核細胞についての最適な発現及び核局在化を容易にするために、Ｃａｓエンドヌクレアーゼを含む遺伝子は、２０１６年１１月２４日に公開の国際公開第２０１６１８６９５３号パンフレットに記載される通りに最適化され、続いて当技術分野で知られる方法によってＤＮＡ発現カセットとして細胞に送達され得る。ある特定の実施形態では、Ｃａｓエンドヌクレアーゼは、ポリペプチドとして提供される。ある特定の実施形態では、Ｃａｓエンドヌクレアーゼは、ポリペプチドをコードするポリヌクレオチドとして提供される。ある特定の実施形態では、ガイドＲＮＡは、１つ以上のＲＮＡ分子をコードするＤＮＡ分子として提供される。ある特定の実施形態では、ガイドＲＮＡは、ＲＮＡ又は化学的に改変されたＲＮＡとして提供される。ある特定の実施形態では、Ｃａｓエンドヌクレアーゼタンパク質及びガイドＲＮＡは、リボヌクレオタンパク質複合体（ＲＮＰ）として提供される。

ある特定の実施形態では、ジンクフィンガー媒介ゲノム編集プロセスによって内因性を改変するための方法が提供される。染色体配列を編集するためのジンクフィンガー媒介ゲノム編集プロセスは、例えば：（ａ）染色体配列中の標的配列を認識し、染色体配列中の部位を切断することができるジンクフィンガーヌクレアーゼをコードする少なくとも１つの核酸、及び任意選択で、（ｉ）切断部位のいずれかの側と同一である実質的な配列を示す、上流配列及び下流配列によってフランキングされた組込みのための配列を含む少なくとも１つのドナーポリヌクレオチド、又は（ｉｉ）切断部位において、染色体配列の一部と実質的に同一である配列を含み、少なくとも１つのヌクレオチド変更を更に含む配列を含む少なくとも１つの交換ポリヌクレオチドを細胞中に導入することと、（ｂ）細胞を培養し、ジンクフィンガーヌクレアーゼが染色体配列中に二本鎖切断を導入するように、ジンクフィンガーヌクレアーゼの発現を可能にすることと、を含み、二本鎖切断が、（ｉ）不活性化突然変異が接触体配列中に導入されるような、非相同末端結合修復プロセスによって、又は（ｉｉ）ドナーポリヌクレオチド中の配列が染色体配列中に組み込まれるか、又は交換ポリヌクレオチド中の配列が染色体配列の一部と交換されるような、相同組換え修復プロセスによって修復される。

ジンクフィンガーヌクレアーゼは、ＤＮＡ結合ドメイン（すなわち、ジンクフィンガー）及び切断ドメイン（すなわち、ヌクレアーゼ）を含む。ジンクフィンガーヌクレアーゼをコードする核酸は、ＤＮＡ又はＲＮＡを含み得る。ジンクフィンガー結合ドメインは、選択のいずれかの核酸配列を認識し、それに結合するように操作され得る。例えば、Ｂｅｅｒｌｉｅｔａｌ．（２００２）Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．２０：１３５－１４１；Ｐａｂｏｅｔａｌ．（２００１）Ａｎｎ．Ｒｅｖ．Ｂｉｏｃｈｅｍ．７０：３１３－３４０；Ｃｈｏｏｅｔａｌ．（２０００）Ｃｕｒｒ．Ｏｐｉｎ．Ｓｔｒｕｃｔ．Ｂｉｏｌ．１０：４１１－４１６；及びＤｏｙｏｎｅｔａｌ．（２００８）Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．２６：７０２－７０８；Ｓａｎｔｉａｇｏｅｔａｌ．（２００８）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１０５：５８０９－５８１４；Ｕｒｎｏｖ，ｅｔａｌ．，（２０１０）ＮａｔＲｅｖＧｅｎｅｔ．１１（９）：６３６－４６；及びＳｈｕｋｌａ，ｅｔａｌ．，（２００９）Ｎａｔｕｒｅ４５９（７２４５）：４３７－４１を参照されたい。操作されたジンクフィンガー結合ドメインは、天然に存在するジンクフィンガータンパク質と比較して、新規の結合特異性を有し得る。例として、米国特許第６，４５３，２４２号明細書に記載されるアルゴリズムを使用して、予め選択された配列を標的化するジンクフィンガー結合ドメインを設計することができる。非退化認識コード表（Ｎｏｎｄｅｇｅｎｅｒａｔｅｒｅｃｏｇｎｉｔｉｏｎｃｏｄｅｔａｂｌｅ）を用いて、特定の配列を標的化するために、ジンクフィンガー結合ドメインを設計することもできる（Ｓｅｒａｅｔａｌ．（２００２）Ｂｉｏｃｈｅｍｉｓｔｒｙ４１：７０７４－７０８１）。ＤＮＡ配列中の潜在的な標的部位を特定し、ジンクフィンガー結合ドメインを設計するためのツールを使用してもよい（Ｍａｎｄｅｌｌｅｔａｌ．（２００６）Ｎｕｃ．ＡｃｉｄＲｅｓ．３４：Ｗ５１６－Ｗ５２３；Ｓａｎｄｅｒｅｔａｌ．（２００７）Ｎｕｃ．ＡｃｉｄＲｅｓ．３５：Ｗ５９９－Ｗ６０５）。

例示的なジンクフィンガーＤＮＡ結合ドメインは、所望の標的配列と少なくとも約８０％の配列同一性を有する配列を認識し、それに結合する。他の実施形態では、配列同一性は、約８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、又は１００％であってもよい。

ジンクフィンガーヌクレアーゼは、切断ドメインも含む。ジンクフィンガーヌクレアーゼの切断ドメイン部分は、任意のエンドヌクレアーゼ又はエキソヌクレアーゼから得ることができる。切断ドメインが誘導され得るエンドヌクレアーゼの非限定的な例としては、制限エンドヌクレアーゼ及びホーミングエンドヌクレアーゼが挙げられるが、これらに限定されない。例えば、２０１０－２０１１Ｃａｔａｌｏｇ，ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ，Ｂｅｖｅｒｌｙ，Ｍａｓｓ．；及びＢｅｌｆｏｒｔｅｔａｌ．（１９９７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５：３３７９－３３８８を参照されたい。ＤＮＡを切断する追加の酵素は知られている（例えば、Ｓ１ヌクレアーゼ；マングビーンヌクレアーゼ；膵臓ＤＮａｓｅＩ；ミクロコッカスヌクレアーゼ；酵母ＨＯエンドヌクレアーゼ）。これらの酵素のうちの１つ以上（又はその機能断片）は、切断ドメインの供給源として使用されてもよい。

本明細書に記載される方法のある特定の実施形態では、内因性遺伝子は、植物ゲノムを改変するために生成された「特注の」メガヌクレアーゼを使用することによって改変される（例えば、国際公開第２００９／１１４３２１号パンフレット；Ｇａｏｅｔａｌ．（２０１０）ＰｌａｎｔＪｏｕｒｎａｌ１：１７６－１８７を参照されたい）。用語「メガヌクレアーゼ」は、一般に、１２塩基対よりも大きく、対応するイントロン導入部位を包含する認識配列における二本鎖ＤＮＡに結合する天然に存在するホーミングエンドヌクレアーゼを指す。天然に存在するメガヌクレアーゼは、単量体（例えば、Ｉ－ＳｃｅＩ）又は二量体（例えば、Ｉ－ＣｒｅＩ）であり得る。用語メガヌクレアーゼは、本明細書で使用される場合、単量体メガヌクレアーゼ、二量体メガヌクレアーゼを指すか、又は会合して二量体メガヌクレアーゼを形成する単量体を指すように使用され得る。

例えば、ＬＡＧＬＩＤＡＤＧファミリーからの天然に存在するメガヌクレアーゼは、植物、酵母、ショウジョウバエ、哺乳動物細胞及びマウスにおいて部位特異的ゲノム改変を効果的に促進するために使用されている。Ｚｅａｍａｙｓ（トウモロコシ）のゲノムで見出された２２の塩基対のＤＮＡ配列を認識し、切断する、例えば、ＬＩＧ－３４メガヌクレアーゼなどの操作されたメガヌクレアーゼが知られている（例えば、米国特許出願公開第２０１１０１１３５０９号パンフレットを参照されたい）。

本明細書に記載される方法の特定の実施形態では、内因性遺伝子は、ＴＡＬエンドヌクレアーゼ（ＴＡＬＥＮ）を使用することによって改変される。植物病原菌ザントモナス属（Ｘａｎｔｈｏｍｏｎａｓ）に由来するＴＡＬ（転写活性化因子様）エフェクターは、植物細胞核中で転写活性化因子として作用する重要な病原性因子であり、ここでは、それらはタンデムリピートのセントラルドメインを介してＤＮＡに直接結合する。転写活性化因子様（ＴＡＬ）エフェクター－ＤＮＡ改変酵素（ＴＡＬＥ又はＴＡＬＥＮ）もまた、遺伝子変化を操作するために使用される。例えば、米国特許出願公開第２０１１０１４５９４０号パンフレット、Ｂｏｃｈｅｔａｌ．，（２００９），Ｓｃｉｅｎｃｅ３２６（５９５９）：１５０９－１２を参照されたい。ＴＡＬエフェクターのＦｏｋＩヌクレアーゼへの融合は、特定の位置でのＤＮＡに結合し、それを切断するＴＡＬＥＮを提供する。標的特異性は、ＴＡＬエフェクター中のカスタマイズされたアミノ酸リピートを開発することによって決定される。

本明細書に記載される方法のある特定の実施形態では、内因性遺伝子は、オリゴヌクレオベース媒介系などの塩基編集を使用することによって改変される。二本鎖切断誘導剤に加えて、部位特異的塩基変換もまた、１つ以上のヌクレオチド変化を操作して、本明細書に記載される１つ以上のＥＭＥをゲノム中に作製することを達成できる。これらには、例えば、Ｃ・ＧからＴ・Ａにすることによって媒介される部位特異的塩基編集、又はＡ・ＴからＧ・Ｃへの塩基編集デアミナーゼ酵素が挙げられる（Ｇａｕｄｅｌｌｉｅｔａｌ．，ＰｒｏｇｒａｍｍａｂｌｅｂａｓｅｅｄｉｔｉｎｇｏｆＡ・ＴｔｏＧ・ＣｉｎｇｅｎｏｍｉｃＤＮＡｗｉｔｈｏｕｔＤＮＡｃｌｅａｖａｇｅ．”Ｎａｔｕｒｅ（２０１７）；Ｎｉｓｈｉｄａｅｔａｌ．“Ｔａｒｇｅｔｅｄｎｕｃｌｅｏｔｉｄｅｅｄｉｔｉｎｇｕｓｉｎｇｈｙｂｒｉｄｐｒｏｋａｒｙｏｔｉｃａｎｄｖｅｒｔｅｂｒａｔｅａｄａｐｔｉｖｅｉｍｍｕｎｅｓｙｓｔｅｍｓ．”Ｓｃｉｅｎｃｅ３５３（６３０５）（２０１６）；Ｋｏｍｏｒｅｔａｌ．“ＰｒｏｇｒａｍｍａｂｌｅｅｄｉｔｉｎｇｏｆａｔａｒｇｅｔｂａｓｅｉｎｇｅｎｏｍｉｃＤＮＡｗｉｔｈｏｕｔｄｏｕｂｌｅ－ｓｔｒａｎｄｅｄＤＮＡｃｌｅａｖａｇｅ．”Ｎａｔｕｒｅ５３３（７６０３）（２０１６）：４２０－４。シスチジンデアミナーゼに融合された触媒的に死んだｄＣａｓ９又はアデニンデアミナーゼタンパク質は、ＤＮＡ切断を誘導することなくＤＮＡ塩基を変更することができる特異的塩基エディターになる。塩基エディターは、Ｃ－＞Ｔ（又は反対の鎖上でＧ－＞Ａ）に変換し、又はアデニンをイノシンに変換するアデニン塩基エディターは、ｇＲＮＡによって特定される編集ウィンドウ内のＡ－＞Ｇ変化をもたらす。

植物育種の方法であって、本明細書に記載されるダイズ植物のいずれかを第２の植物と交配して、本明細書に記載される少なくとも１つの改変を含む子孫種子を生産することを含む方法が更に提供される。ある特定の実施形態では、植物は、子孫種子から生産される。

以下は、本発明のいくつかの態様の特定の実施形態の例である。実施例は、説明の目的のためにのみ提供されるものであり、決して本発明の範囲を限定することを意図するものではない。

実施例１：ダイズ種子中のダイズレグヘモグロビンタンパク質の発現
ダイズレグヘモグロビン遺伝子（Ｇｌｙｍａ．２０ｇ１９１２００）を、ダイズゲノム中で同定した。この遺伝子は、４つのエクソンと共にレグヘモグロビンペプチド（配列番号２）をコードするそのＣＤＳ（配列番号１）を含有する。図１に示すように、ダイズレグヘモグロビンを、ダイズ種子中でシグナルペプチドを用いずに発現させた。加えて、数個のタンパク質標的化シグナル配列を用いて、レグヘモグロビンをダイズ種子中のタンパク質貯蔵小胞中へ標的化させた（表２）。ベータ－コングリシニンアルファ’ＳＰＰは、配列番号３の１位から１９５位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号４の１位から６５位によって定義された。レクチンＳＰは、配列番号５の１位から１０５位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号６の１位から３５位によって定義される。ＧＹ１ＳＰは、配列番号７の１位から６６位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号８の１位から２２位によって定義される。強力な種子特異的プロモーター、例えば、ベータ－コングリシニンプロモーター（配列番号９）又はグリシニンプロモーター（配列番号１０）を使用して、レグヘモグロビンの発現を駆動させた。Ｒｕｂｉｓｃｏ小サブユニット（ＲｕｂｉｓｃｏＳＳＵ）色素体標的化配列も用いて、レグヘモグロビンタンパク質を色素体に標的化させた。ＲｕｂｉｓｃｏＳＳＵＳＰ色素体標的化配列は、配列番号３１の１位から１６５位までのヌクレオチド配列によってコードされ、対応するペプチド標的化配列は、配列番号３２の１位から５５位でコードされる。レグヘモグロビンコード配列は、配列番号３１の１６６位～６０３位に由来し、対応するペプチドは、配列番号３２の５６位～２００位に由来する。オクロバクテリウム属（Ｏｃｈｒｏｂａｃｔｒｕｍ）媒介又はアグロバクテリア属（Ａｇｒｏｂａｃｔｅｒｉａ）媒介ダイズ胚軸形質転換によってダイズ種子中に導入され、前者は、米国特許公開第２０１８／０２１６１２３号パンフレットに記載されている。結果を実施例７に記載する。

実施例２：グルタミル－ｔＲＮＡレダクターゼ及びフェロケラターゼを操作するポルフィリン経路によるダイズレグヘモグロビン発現レベルの改善
種子中のダイズレグヘモグロビン発現を改善するために、ポルフィリン経路操作アプローチを使用した。ヘム生合成をもたらすポルフィリン経路には、少なくとも９つの酵素ステップがある。その中で、図２に示すように、グルタミル－ｔＲＮＡレダクターゼ（ｇｌｙｍａ．０４ｇ０８９８００）及びフェロケラターゼ（ｇｌｙｍａ．０４ｇ０５０４００）を、ダイズ種子中のより高いレグヘモグロビン蓄積及びヘム充填量を促進するためのヘム産生の増加について試験した。この目的のために、４つの追加のダイズベクターを作製し、それらの各々は、実施例１のレグヘモグロビン発現カセットに加えて、グルタミル－ｔＲＮＡレダクターゼ（配列番号１１、１２）及びフェロケラターゼ（配列番号１３、１４）の発現を含有した。２つの生合成遺伝子は、インゲンマメ（Ｐｈａｓｅｏｌｕｓｖｕｌｇａｒｉｓ）ファゼオリンプロモーター（配列番号１５）、又はナタネ（Ｂｒａｓｓｉｃａｎａｐｕｓ）ナピンプロモーター（配列番号１６）などの強力な種子特異的プロモーターによって駆動された。これらの４つのベクターにおいて、これらの２つの生合成遺伝子の発現カセットは、異なるシグナルペプチド標的化配列を含むか、又は含まないレグヘモグロビンの４つの発現カセットを用いて、分子的に積み重ねられた。これらの発現ベクターは、米国特許公開第２０１８／０２１６１２３号パンフレットに記載されるように、オクロバクテリウム属（Ｏｃｈｒｏｂａｃｔｒｕｍ）媒介ダイズ胚軸形質転換によって、ダイズ植物中に導入された。結果を実施例７に記載する。

実施例３：ポルフィリン酵素改変又は発現によるダイズレグヘモグロビン発現レベルの改善
実施例２に記載された方法と同様の技術的アプローチを用いて、グルタメート－１－セミアルデヒド２，１－アミノムターゼ、アミノレブリン酸デヒドラターゼ、ヒドロキシメチルビランシンターゼ、ウロホルフィリノーゲンＩＩＩシンターゼ、ウロホルフィリノーゲンデカルボキシラーゼ、コポルフィリノーゲンＩＩＩオキシダーゼ、及びプロトポルフィリノーゲンオキシダーゼなどのポルフィリン経路についての他の酵素ステップを調節する。使用されるポルフィリン経路のためのダイズ遺伝子の例を、表３に列挙する。ダイズ種子中のこれらの天然代謝酵素遺伝子の過剰発現は、ダイズ種子中の発現を提供する調節配列に作動可能に連結されたこれらのポリペプチドのためのコード配列を含む、組換え構築物によるダイズの形質転換によって達成される。第２に、これらの酵素の増加された発現は、遺伝子編集を通して達成される。これらの酵素のフィードバック感受性調節ドメインを同定し、遺伝子編集短縮化、欠失、置換又は挿入によって除去若しくは不活性化する。増加したレグヘモグロビンタンパク質複合体を産生するように改変された、ダイズ種子中で産生されるレグヘモグロビンタンパク質のヘム含有量の増強が達成されることが予想される。フィードバックに感受性ではないように、又は酵素発現、安定性若しくは活性を増強させるように、他の方法で改変若しくは編集されているヘム生合成酵素がダイズ種子中で発現され、ヘム産生を更に増加させ、これがダイズ種子中のより高いレグヘモグロビン蓄積及びヘム充填を可能にする。具体的には、グルタミル－ｔＲＮＡレダクターゼ（ＧＴＲ）酵素活性は、タンパク質ＦＬＵＯＲＥＳＣＥＮＴＩＮＢＬＵＥＬＩＧＨＴ（ＦＬＵ）、グルタミル－ｔＲＮＡレダクターゼ結合タンパク質（ＧＢＰ）、葉緑体シグナル粒子４３（ＳＲＰ４３）によって媒介される組合せ翻訳後制御下にある（表４）。遺伝子編集、種子優先的過剰発現又はＲＮＡ干渉によって達成される単一の、又はこれらの３つのタンパク質の任意の組合せの変更された発現は、発育する種子においてヘム生合成活性を増加させることによって、より高いレベルのヘム含有レグヘモグロビンを達成すると予想される。

実施例４：レグヘモグロビン遺伝子の天然ダイズグリシニン遺伝子座へのゲノム操作
ＣＲＩＳＰＲ／Ｃａｓ９系を用いて、本発明者らは、グリシニン１（ＧＹ１）遺伝子（ｇｌｙｍａ．０３ｇ１６３５００、ヌクレオチド配列については配列番号２０、ペプチド配列については配列番号２１）を標的化するために、特定のｇＲＮＡを設計した（ＧＭ－ＧＹ－ＣＲ１、配列番号１７；ＧＭ－ＧＹ－ＣＲ２、配列番号１８；及びＧＭ－ＧＹ－ＣＲ３、配列番号１９）。ＧＭ－ＧＹ１－ＣＲ１を、プロ－グリシニン１タンパク質のエクソン１の開始部の近くの部位を標的化するように設計した。ＧＭ－ＧＹ１－ＣＲ２を、プロ－グリシニン１の酸性サブユニット（配列番号２１中のアミノ酸＃１～＃３１０）と、塩基性サブユニット（配列番号２１中のアミノ酸＃３１１～＃４９５）との間の接合部を標的化するように設計した。ＧＭ－ＧＹ１－ＣＲ３を、グリシニン１遺伝子の３’ＵＴＲの開始部を標的化するように設計した。図３及び４に示すように、バイナリーベクターは、ＣＲ１／ＣＲ２又はＣＲ１／ＣＲ３ｇＲＮＡ組合せのいずれか、及びそれらの対応するドナーＤＮＡテンプレート（配列番号２２及び配列番号２３）を含有した。相同組換え（ＨＲ）断片を使用して、レグヘモグロビン／ＧＹ１配列をフランキングし、相同媒介組換えプロセスを容易にした。ＣＲ１又はＣＲ２又はＣＲ３ｇＲＮＡ標的部位も使用してドナーＤＮＡをフランキングし、二本鎖切断修復プロセスのために、バイナリーベクターからそれらを切除できるようにした。これらの配列は、表５に明示される。

アグロバクテリウム属（Ａｇｒｏｂａｃｔｅｒｉｕｍ）媒介ダイズ胚軸形質転換によって、バイナリーベクターをダイズ植物中に導入した。相同媒介二本鎖切断ＤＮＡ修復プロセスによるドナーＤＮＡの部位特異的組込みを用いて、（ｉ）天然グリシニン１遺伝子座における酸性サブユニットをコードするゲノム配列を置き換えることによって、又は（ｉｉ）天然グリシニン１遺伝子座において、グリシニン１タンパク質全体をコードするゲノム配列を置き換えることによって、ダイズレグヘモグロビンを有するグリシニン１のゲノム編集多様体を作製した。グリシニン１遺伝子全体を、天然グリシニン１遺伝子座にてレグヘモグロビンコード配列で置き換えるために、合計で１４５２個のＴ０植物をＣＲ１／ＣＲ３デザインについて生成した（図３）。本発明者らは、２種のＰＣＲ分析を用いて完全な遺伝子組込みイベントを特定し、１種はグリシニン１遺伝子座の５’領域でＰＣＲ分析、別のものは３’領域でのＰＣＲ分析であった。１４５２個のＴ０植物について、１０個の潜在的な２×ＨＤＲ完全組込みイベントをＴ０植物において同定した。ＰＣＲ産物の強度に基づいて、本発明者らはそれらを３つのカテゴリー：強い（４つのイベント）、中間（３つのイベント）及び弱い（３つのイベント）に分類した。これらの１０個のイベントで、本発明者らはＰＣＲ産物の配列決定分析を実施し、１０個のイベントのうち２つ（１つは強い、及び１つは弱いイベント）が二本鎖切断修復プロセスからのＳＮＰ変異を有していたため、本発明者らはこれらの２つのイベントを更に進めなかった。Ｔ１種子を、全ての残りの８つの陽性イベントから収穫した。我々のＴ０植物分析に基づいて、トップの６つのイベントからＴ１種子のレグヘモグロビン定量化を進め（３つの強いイベント：１９８Ａ、３１５Ａ、９５６Ａ、及び３つの中間イベント：４０７Ａ、４１９Ａ、及び６２８Ａ）、３１５Ａイベントが、Ｔ１種子中で最も高いグロビン蓄積を与えた（乾燥重量ベースで、種子の１．１６％の総タンパク質）。

本発明者らは、同じ６つのイベントからのＴ１種子を播種氏、同じＰＣＲ分子分析をそれらのＴ１植物で実施した。これらの分析において、２×ＨＤＲ完全組込みＴ１植物は、分析された６つのイベントのうちの３つにおいてだけ（１９８Ａ、３１５Ａ、６２８Ａ）一貫して確認することができた。９５６Ａイベントについては、わずか１つの２×ＨＤＲ植物を、スクリーニングされた３７個のＴ１植物から検出することができた。他の２つのイベント（４０７Ａ及び４１９Ａ）については、本発明者らは、いかなる２×ＨＤＲＰＣＲ産物も検出することができず、それらのＴ０植物分析からの２×ＨＤＲシグナルは、Ｔ１プラントは伝達されなかったことを示し、これは、おそらく、形質転換プロセスにおけるキメラ性に起因する。これらの２つのイベントは、Ｔ１植物でのランダムに組み込まれたトランスジェニックイベント賭して再分類された。Ｔ２種子は、２×ＨＤＲの完全な組み込まれたイベントに対して、並びにランダムに組み込まれたトランスジェニックイベントに対して収穫される。レグヘモグロビンレベルを全てのホモ接合型Ｔ２種子において分析され、グリシニン１天然遺伝子座におけるレグヘモグロビン発現レベルをランダムトランスジェニック遺伝子座と比較する。レグヘモグロビンレベルは、Ｔ１種子におけるレグヘモグロビンレベルと比較して、完全な組み込まれたイベントにおいて２倍になり、乾燥重量ベースで総種子タンパク質の訳２．３％以上に達すると予想される。

実施例５：レグヘモグロビン遺伝子の他の天然ダイズ種子貯蔵タンパク質遺伝子座へのゲノム操作
他のグリシニンタンパク質又はコングリシニンタンパク質などの他の種子貯蔵タンパク質を、表６及び７に示す。これらの貯蔵タンパク質をコードする遺伝子を、この実施例に記載されるようにダイズ種子中のダイズレグヘモグロビン過剰発現のための遺伝子編集ターゲットとして使用する。

実施例４におけるプロトコルに従って、これらの遺伝子に対する特定のｇＲＮＡを設計する。各遺伝子標的に対するバイナリーベクターを、アグロバクテリウム属（Ａｇｒｏｂａｃｔｅｒｉｕｍ）媒介ダイズ胚軸形質転換によって、ダイズ植物中に導入する。相同媒介二本鎖切断ＤＮＡ修復プロセスによるドナーＤＮＡの部位特異的組込みを用いることによって、コード配列に置き換わるダイズレグヘモグロビンによる種子貯蔵タンパク質遺伝子のゲノム編集多様体が、各種子貯蔵タンパク質遺伝子に対して、単独で、又はＧＬＹ１若しくは他の種子貯蔵タンパク質遺伝子と組み合わせて作製される。植物を温室で生育させる。本発明者らは、収穫されたＴ_１種子が総種子タンパク質の少なくとも１％又はそれよりも高い量のレグヘモグロビンを含有すると予想する。

実施例６：タンパク質リバランシングによるダイズ種子中のダイズレグヘモグロビン発現レベルの改善
グリシニン及びコングリシニンは、ダイズ種子中の２つの主要な部類の種子貯蔵タンパク質である。ダイズ種子において、豊富な７Ｓグロブリン貯蔵タンパク質であるβ－コングリシニン、及びグリシニンは、それぞれ総タンパク質含有量の訳２１％及び３３％を構成する。総ダイズタンパク質含有量は、ＲＮＡｉによるβ－コングリシニンのα及びα’サブユニットのサイレンス後に変化しなかった。得られる操作された種子は、総種子タンパク質の５０％超を占めるより多くのグリシニンを蓄積し、操作された種子中の欠如しているβ－コングリシニンを補った。β－コングリシニンは、３つのアイソフォーム、α、α’及びβからなる。必要に応じて、β－コングリシニン遺伝子ファミリー（アルファ’、アルファ及びベータサブユニットに対して、６～７個の遺伝子）は、ＣＲＩＳＰＲ／Ｃａｓ編集による遺伝子クラスタードロップアウト又はフレームシフトノックアウト突然変異を用いて排除し、次いで、より多くのタンパク質合成資源を、ダイズ種子中のレグヘモグロビン産生に振り向けることができる。

一例として、ｇＲＮＡは、Ｃａｓ９／ｇＲＮＡ編集によって６つの想定されるβ－コングリシニンアイソフォームをノックアウトし、プロテオームをグリシニンにリバランスするように設計された。３α、２α’及び２βアイソフォームを含む７つのβ－コングリシニン候補物質を同定した。Ｇｌｙｍａ．１０ｇ２４６４００（α）及びＧｌｙｍａ．２０ｇ１４６２００（β）を除いて、全ての他のアイソフォームは、ダイズ種子中で開化後（ＤＡＦ）３０日又は５０日で比較的高い発現レベルを示す（表７）。

４つのｇＲＮＡを用いて、７つのβ－コングリシニンアイソフォームのうち６つを欠失させた。図５に示すように、ＧＭ－ＣＯＮＧ－ｇＲＮＡ１（配列番号２４）及びＧＭ－ＣＯＮＧ－ｇＲＮＡ２（配列番号２５）は、染色体２０上のコングリシニンクラスター（Ｇｍ２０）をドロップアウトするのに使用し；ＧＭ－ＣＯＮＧ－ｇＲＮＡ３（配列番号２６）及びＧＭ－ＣＯＮＧ－ｇＲＮＡ４（配列番号２７）は、染色体１０上のコングリシニンクラスター（Ｇｍ１０）をドロップアウトするのに用いた。

コングリシニンＧｍ１０遺伝子座ドロップアウト実験からのＴ２ホモ接合型種子を生成した。種子タンパク質の分析を、ＳＤＳ－ＰＡＧＥクマシーブルーゲル染色分析によって実施した（図６）。コングリシニンタンパク質のアルファ’サブユニットは、Ｇｍ１０遺伝子座ドロップアウト多様体からのそれらのＴ２ホモ接合型種子では検出されず、これはダイズゲノムからのそれらの遺伝子の完全な除去と一致する、ダイズ種子中のコングリシニンアルファ’サブユニットタンパク質の完全な除去を実証している。これらのＴ２種子の総タンパク質含有量は、野生型と比較して変化しておらず、他のダイズタンパク質がこれらの編集多様体中のコングリシニンアルファ’サブユニットタンパク質の喪失を補っていることを示している。第２の編集実験については、Ｇｍ２０遺伝子座ドロップアウトからのＴ２種子をタンパク質ゲル分析によって分析した（図７）。この結果は、コングリシニンアルファサブユニットタンパク質がホモ接合型ドロップアウト植物のダイズ種子において完全に除去されていることを示した。データはまた、コングリシニンベータサブユニットタンパク質も、Ｇｌｙｍａ．２０ｇ１４８２００遺伝子の除去のためにこのドロップアウト多様体中で低減されることを示した。しかしながら、ベータサブユニットの一部は依然として検出される場合があり、これはドロップアウトデザインが適度に発現されたＧｌｙｍａ．２０ｇ１４６２００遺伝子を含まなかったためである。これらのアルファ’及びアルファ／ベータドロップアウト遺伝子座は互いに遺伝子的に交雑され、完全なコングリシニンノックアウトダイズ種子を作り出すであろう。

別の編集実験において、３つのｇＲＮＡ（配列番号２８、２９、３０）を、５つの高度に発現されたコングリシニン遺伝子（ｇｌｙｍａ．２０ｇ１４８２００、ｇｌｙｍａ．２０ｇ１４８３００、ｇｌｙｍａ．２０ｇ１４８４００、ｇｌｙｍａ．１０ｇ２４６３００、及びｇｌｙｍａ．１０ｇ２４６５００）並びに１つの適切なレベルで発現されたｇｌｙｍａ．２０ｇ１４６２００を、多重フレームシフトノックアウトアプローチでフレームシフトノックアウトを行うように設計した。ホモ接合型Ｔ２種子を、タンパク質プロファイル変化及びアミノ酸組成改善について分析する。

レグヘモグロビン過剰発現アプローチ及びコングリシニンノックアウトアプローチを、いずれかの遺伝子交雑によって、又はレグヘモグロビン過剰発現ダイズ系統において遺伝子編集を実施することによって、又はレグヘモグロビン過剰発現カセットをコングリシニンノックアウトダイズ系統中に再形質転換することによって組み合わされる。これらのダイズ種子中のコングリシニンタンパク質が存在しないことで、グリシニン又は他のダイズタンパク質の含有量は、タンパク質リバランシングによってコングリシニンタンパク質の喪失を補うように増加することが予想される。ダイズレグヘモグロビン過剰発現とコングリシニンドロップアウトアプローチを組み合わせることによって、ダイズ種子中のレグヘモグロビンレベルが増加すると予想される。

実施例７：ダイズ種子中のダイズレグヘモグロビン発現の特性評価
実施例１及び２に記載された８つのトランスジェニック構築物について、Ｔ１種子を生成した。結果は非常に驚くべきものであった。ＧＹ１－ＳＰ／ＧＹ１塩基性サブユニット標的化デザインを有する２つの構築物（図１及び２の実験４及び８）において、蓄積されたレグヘモグロビンはほとんどなかった。レクチンＳＰ標的化デザインを有する２つの構築物（図１及び２の実験３及び７）において、非常に低いレベルのレグヘモグロビン蓄積があり（総種子タンパク質の約０．１％）、ダイズは黄色に見えた。最良の発現デザインは、レグヘモグロビンに対するシグナルペプチドを有さない２つの構築物（図１及び２に示された実験１及び５）からのものであった。図８及び１０に示すように、「赤」（すなわち、横断面がピンク色に染まった）色の種子は、これらの２つの実験では目で容易に識別可能であって、レグヘモグロビン発現レベルが高く、タンパク質が鉄中心モルフィリン（ヘム）を含有するレグヘモグロビンタンパク質複合体として効率的に組み立てられたことを示している。実験１デザイン（シグナルペプチドなし）からの５つのイベント及び実験５デザイン（シグナルペプチドがないことに加えて２つのヘム経路遺伝子がない）からの４つのイベントを生じさせ、９つのイベント全てが「赤い」種子表現型を有していた。種子中のレグヘモグロビンの存在を、種子タンパク質抽出、ＳＤＳＰＡＧＥゲル、及びクマシーブルー染色を実施することによって更に確認した。１６ＫＤのレグヘモグロビンは、クマシーブルーによって容易に見ることができる（図９及び１１の矢印）。図９において、レーン１、２、３、５、６、７、９、１０、１１は、実験１デザインにおける３つの独立したイベントからの「赤い」ピンク色のレグヘモグロビン陽性種子からのタンパク質サンプルであり、レーン４、８、１２は、同じ３つのイベントからの黄色のｎｕｌｌ隔離種子からのタンパク質サンプルである。同様に、図１１において、＃１４レーンは黄色のｎｕｌｌ隔離種子からのものであり、＃１１、＃２１、＃３３、＃４３は実験５デザインからの３つの独立したイベントからの「赤い」（ピンク色の）レグヘモグロビン陽性種子に由来するタンパク質サンプルである。

単一の種子分析のためのサンプル調製
個々の隔離したＴ_０植物から収穫した単一のＴ_１赤色及び黄色ダイズを、キャップ付きのＳｐｅｘＣｅｒｔｉｐｒｅｐ１／２×２’’ポリカーボネートバイアル（ｃａｔ＃３１１６ＰＣ）内に配置した。３／８’’ステンレススチールボールベアリングを添加した。ＳｐｅｘＣｅｒｔｉｐｒｅｐ２０００Ｇｅｎｏ／Ｇｒｉｎｄｅｒ内で１５００ストローク／分にて、各サイクル間で３０秒の間隔及び１分の休止での３サイクルの粉砕を実施した。

或いは、ダイズを予め冷却した乳鉢内で、液体窒素の存在下で、ダイズを乳棒で粉砕した。次いで、粉末を４８時間凍結乾燥させ、処理するまでデシケーター内で－２０℃にて保管した。

含水量の測定を、以下のように米国油脂化学協会（ＡＯＣＳ公定法Ｂａ２ａ－３８（少量サンプル用に改変））に従って実施した。

粉末状サンプル材料を秤量し（およそ１００ｍｇ；０．１ｍｇの精度で）、予め秤量し（及び記録した）、１３×１００ｍｍのガラスチューブＶＷＲ（５３２８３－８００）に入れて再び秤量する。

サンプルを、１３０℃に余熱した強制空気オーブン内に配置する。

材料を２時間乾燥させる。

チューブを取り出し、デシケーターキャビネットに入れ、室温に戻し、その後再び秤量する。

チューブにキャップをして、残留乾燥材料をその後のタンパク質の燃焼分析（以下を参照）のために保存する。

更なる分析のためにデシケーター内で保管する。

総タンパク質分析。
上記のオーブン乾燥をさせるか、又は凍結乾燥させた粉末の燃焼分析によってタンパク質含有量を推定した。分析を、Ｎ－タンパク質モードで運転するＦｌａｓｈ１１１２ＥＡ燃焼分析装置（Ｔｈｅｒｍｏから市販されている）で、アスパラギン酸を標準として使用して、製造元の指示に従って実施した。Ｍｅｔｔｌｅｒ－ＴｏｌｅｄｏＭＸ５微量天秤上で、０．００１ｍｇの精度で秤量した３０～４０ｍｇの粉末状サンプルを分析用に使用した。タンパク質含有量を、分析装置によって決定された％Ｎに６．２５を掛けることによって算出した。最終的タンパク質含有量は、オーブン乾燥させた材料についての乾燥ベースで、及び凍結乾燥された材料について測定されたものを基準として想定された。

含水量の計算。組織のそのままの含水量を、以下の式を使用してオーブン乾燥させた後に決定した：

ＬＣ－ＭＳ－ＭＳによるグロビンタンパク質の定量化。
グロビンタンパク質のアミノ酸配列（表１；配列番号２）を、潜在的なトリプシン消化部位及び定量的質量分析に対する結果として生じるペプチドの適合性についてインシリコで評価した。以下の基準を適用した；
ペプチドは、６～２０個のアミノ酸の長さであった
ペプチド内のアミノ酸は、二次改変を受ける可能性は低かった。
硫黄含有アミノ酸の非存在
溶解度及び等電点。

これらの基準を使用して、３つの見込みのあるペプチドを同定した。これらを、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃからｔｈｅｒｍｏｆｉｓｈｅｒ．ｃｏｍ／ｕｓ／ｅｎ／ｈｏｍｅ／ｌｉｆｅ－ｓｃｉｅｎｃｅ／ｐｒｏｔｅｉｎ－ｂｉｏｌｏｇｙ／ｐｅｐｔｉｄｅｓ－ｐｒｏｔｅｉｎｓ／ｃｕｓｔｏｍ－ｐｅｐｔｉｄｅ－ｓｙｎｔｈｅｓｉｓ－ｓｅｒｖｉｃｅｓ／ｐｅｐｔｉｄｅ－ａｎａｌｙｚｉｎｇ－ｔｏｏｌ．ｈｔｍｌで入手可能なオンラインアプリケーションを使用して更に分析した。このアプリケーションの出力に基づいて、２つのペプチドを選択した。これらのペプチドの配列を、ＮＣＢＩタンパク質ＢＬＡＳＴ（タンパク質－タンパク質）プログラムｂｌａｓｔ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／Ｂｌａｓｔ．ｃｇｉ？ＰＲＯＧＲＡＭ＝ｂｌａｓｔｐ＆ＰＡＧＥ＿ＴＹＰＥ＝ＢｌａｓｔＳｅａｒｃｈ＆ＬＩＮＫ＿ＬＯＣ＝ｂｌａｓｔｈｏｍｅを使用して、ＢＬＡＳＴ検索にかけ、ダイズ（Ｇｌｙｃｉｎｅｍａｘ）ゲノム内のダイズグロビン配列に特徴的であることを決定した。ペプチドを、以下のように合成した：
ペプチド１：Ｋ．ＡＮＧＴＶＶＡＤＡＡＬＧＳＩＨＡＱＫ．Ａ［配列番号２の７８位～９５位］配列番号３３
ペプチド２：Ｋ．ＡＩＴＤＰＱＦＶＶＶＫ．Ｅ［９６位～１０６位］配列番号３４

「．」は酵素消化部位を示し、括弧内の値は成熟グロビンタンパク質のＮ末端に対するアミノ酸残基位置を示す。

５００ｐｐｍの濃度でのペプチドストックを調製し、－８０℃で一定分量として保存した。これらのストックを、ペプチドの定量分析に対する適合性を更に評価するために用いた。ペプチドストックを、質量分析計（ＳＣＩＥＸ５５００Ｑｔｒａｐ；ＳＣＩＥＸＬＬＣ，ＲｅｄｗｏｏｄＣｉｔｙ，ＣＡＵＳＡ）に注入し、検出用のパラメータを最適化した。分析の結果、ペプチドＡＩＴＤＰＱＦＶＶＶＫ（ペプチド２）が、親イオンの＋２電荷状態（６０８．９ｍ／ｚ）を伴って、最良の候補物質であることが判明した。衝突セル内での断片化の最適化後に、最も高い存在量のサロゲート娘イオン（８１６．６ｍ／ｚ）を選択し、それに対して定量化した。第２の確認イオン（４４４．３ｍ／ｚ）も選択した。

サンプルの調製
約１０～２０ｍｇの粉末サンプル（秤量し、０．１ｍｇの精度で記録した）を、１．２ｍｌのマイクロタイターチューブ（Ｆｉｓｈｅｒブランド０２－６８１－３７６）内に置いた。抽出バッファー、８ｍＭの（３－［（３－コールアミドプロピル）ジメチルアンモニオ］－１－プロパンスルホネート水和物、（ＣＨＡＰＳ）；０．１％のＴｒｉｔｏｎＸ－１００、ｐＨ８．４を２５の組織重量対体積比で添加した。１つの小さな鋼球を各バイアルに添加し、栓をした後に、サンプルをＧｅｎｏ／Ｇｒｉｎｄｅｒ内；毎分１１５０振動数にて３０秒間抽出した。鋼球を除去した均質化チューブの内容物を、清浄な１．５ｍｌの微量遠心管に定量的に移し、サンプルを微量遠心機内；１０，６７０×ｇで１０分間清澄化させた。上清を、清浄な１．５ｍｌの微量遠心管に移し、サンプルを１０，６７０×ｇで５分間再度遠心分離した。上清の総可溶性タンパク質濃度を、ブラッドフォードアッセイを使用して決定し、結果を用いてサンプルを正規化して、トリプシン消化バッファー（１００ｍＭの重炭酸アンモニウム；０．０５％のＴｗｅｅｎ－２０；ｐＨ８．３）で希釈することによって、１ｍｌ当たり１ｍｇの可溶性タンパク質にした。５０ｕｌのタンパク質正規化抽出物を、１００ｕｌのトリプシン消化バッファー、６ｕｌの０．２５ＭＤＴＴ（ジチオスレイトール；消化バッファー中）に添加し、それらを９５℃で２０分間インキュベートすることによってトリプシン消化のためのサンプルを調製した。ヨードアセトアミドの３００ｍＭストック６ｕｌを各サンプルに添加し、それらを暗所で室温にて１時間インキュベートした。トリプシン（Ｐｉｅｒｃｅ，ＭＳＧｒａｄｅ；ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）の０．１ｕｇ／ｕｌストックの１０ｕｌを各サンプルに添加し、それらを静的インキュベーター内で３７℃にて一晩インキュベートした。１０％のギ酸１０ｕｌを添加することによって、トリプシン消化を停止させた。次いで、サンプルをＵＨＰＬＣ－ＭＳ－ＭＳ分析を使用して分析した。

ＬＣ／ＭＳ／ＭＳ法
トリプシン消化の定量分析を、陽イオンモードで動作する、ＳＣＩＥＸ５５００Ｑｔｒａｐ検出器を備えたＵＨＰＬＣ（Ａｇｉｌｅｎｔ１２９０）で実施した。サンプル及び標準物質（１０ｕｌの注入量）を、４０℃で維持したＷａｔｅｒｓＣｏｒｔｅｘＣ１８、２．７ｕｍ（２．１×１００ｍｍ）逆相カラム上で分離させた。溶媒流量は、９０％の溶媒Ａ（９９．９％のＭＳグレード水；０．１％のギ酸）－１０％の溶媒Ａ（９９．９％のアセトニトリル、０．１％のギ酸）の開始条件で、３００ｕｌ／分であった。条件を、６０％の溶媒Ａ－４０％の溶媒Ｂに７分間にわたって高め、続いて１０％の溶媒Ａ－９０％の溶媒Ｂに０．５分間にわたって高めた。次いで、溶媒を開始条件に３分間にわたって戻し、カラムを開始条件下で更に３分間平衡化させて、その後次の注入を行った。エレクトロスプレーイオン化（ＥＳＩ）ソースを用いて、サンプルをＭＳに導入した。ソースパラメータは、以下の通りであった：デクラスタリングポテンシャル１３５（Ｖ）、温度３５０℃、及びイオンスプレー電圧３５０Ｖ。ＭＲＭ（多重反応モニタリング）検出技術を、親＋２分子（ｍ／ｚ６０８．９）を断片化するために３５（ｅＶ）の衝突セルエネルギーを使用して、プロダクトイオン（ｍ／ｚ：８１６．６）を同定し定量化するために用いた。別のプロダクトイオン（ｍ／ｚ：４４４．３）を用いて、同一性を確認した（存在又は非存在に基づいて）。上述したサンプル調製ステップの全てを通して採取されたペプチドの標準曲線に対して定量化を実施した。

表８は、黄色（ＷＴ）及び標的化配列を含まないレグヘモグロビン構築物（実験１からの材料）を発現する隔離Ｔ_０植物から収穫した赤色ダイズの定量的質量分析を示す。可溶性タンパク質を分析された抽出物中で測定し、燃焼分析によって決定されるように、マメ粉の総タンパク質含有量に対する％として表される。レグヘモグロビンタンパク質を、ＵＨＰＬＣ－ＭＳ－ＭＳによって定量化し、可溶性タンパク質又は総タンパク質ベースの重量％で表される。

出発物質の総タンパク質含有量に対する％としての抽出されたサンプルの可溶性タンパク質の発現は、抽出の効率が２７．７～８１．３％の範囲であり、平均で６１．３％であることを示した（表８）。これは、単位当たりの可溶性タンパク質ベース又は単位当たりの総タンパク質ベースで表されるとき、グロビンタンパク質含有量％で実質的な差をもたらした。黄色の野生型のマメ（ＧＭＺ３Ａ９．１．３０ＷＴ及びＧＭＺ３Ａ９．１．２０；ＷＴ）は、それらの中に検出可能なグロビンタンパク質を有さなかった（表８）。赤色のマメは、可溶性タンパク質ベースで表されるとき、０．３４～１．９３重量％のグロビンタンパク質を有しており、総タンパク質ベースで表されるとき、最大０．８重量％のグロビンタンパク質を有していた。

抽出効率を改善しサンプル調製をより均一にするために、サンプル調製を以下のように改変した；１０＋／－０．５ｍｇの粉末サンプル（秤量し、０．１ｍｇの精度で記録した）を１．２ｍｌのマイクロタイターチューブ（Ｆｉｓｈｅｒブランド０２－６８１－３７６）中に置いた。抽出バッファー、８ｍＭの（３－［（３－コールアミドプロピル）ジメチルアンモニオ］－１－プロパンスルホネート水和物、（ＣＨＡＰＳ）；０．１％のＴｒｉｔｏｎＸ－１００、ｐＨ８．４を５０の組織重量対体積比で添加した。１つの小さな鋼球を各バイアルに添加し、栓をした後に、サンプルをＧｅｎｏ／Ｇｒｉｎｄｅｒ内；毎分１１５０振動数にて３０秒間抽出し、次いで回転（ｅｎｄｏｖｅｒｅｎｄ）ローターを１０分間行い、次いでジェノグライディングステップを繰り返した。鋼球を除去した均質化チューブの内容物を、清浄な１．５ｍｌの微量遠心管に定量的に移し、サンプルを微量遠心機内；１０，６７０×ｇで１０分間清澄化させた。上清を、清浄な１．５ｍｌの微量遠心管に移し、サンプルを１０，６７０×ｇで５分間再度遠心分離した。上清の総可溶性タンパク質濃度を、ブラッドフォードアッセイを使用して決定し、結果を用いてサンプルを正規化して、トリプシン消化バッファー（１００ｍＭの重炭酸アンモニウム；０．０５％のＴｗｅｅｎ－２０；ｐＨ８．３）で希釈することによって、１ｍｌ当たり１ｍｇの可溶性タンパク質にした。２５ｕｌのタンパク質正規化抽出物を、１２５ｕｌのトリプシン消化バッファー、６ｕｌの０．２５ＭＤＴＴ（ジチオスレイトール；消化バッファー中）に添加し、それらを９５℃で２０分間インキュベートすることによってトリプシン消化のためのサンプルを調製した。ヨードアセトアミドの３００ｍＭストック６ｕｌを各サンプルに添加し、それらを暗所で室温にて１時間インキュベートした。トリプシン（Ｐｉｅｒｃｅ，ＭＳＧｒａｄｅ；ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）の０．１ｕｇ／ｕｌストックの１０ｕｌを各サンプルに添加し、それらを静的インキュベーター内で３７℃にて一晩インキュベートした。１０％のギ酸１０ｕｌを添加することによって、トリプシン消化を停止させた。次いで、サンプルをＵＨＰＬＣ－ＭＳ－ＭＳ分析を使用して分析した。

改変された抽出法は、平均で９７％（９５．５～１００％の範囲）の第１の抽出で抽出される可溶性タンパク質をもたらした。これは、抽出される材料の総タンパク質含有量の平均で７１％（６２～７８％の範囲）に相当した。この方法を用いて、レグヘモグロビンのみが発現された場合（実験１）のイベントからの黄色及び赤色ダイズを、レグヘモグロビンタンパク質が２つのヘム経路遺伝子と併せて発現された場合（シグナルペプチドなし）（実験５）のイベントからの黄色及び赤色ダイズと比較した。結果を表９に示す。表９は、レグヘモグロビン構築物のみ（標的化配列なし）を発現する実験１又は２つのヘム経路遺伝子と併せてレグヘモグロビン構築物（標的化配列なし）を発現する（実験５）隔離Ｔ_０植物から収穫された黄色（ＷＴ）及び赤色ダイズの定量的質量分析である。可溶性タンパク質を分析された抽出物中で測定し、燃焼分析によって決定されるように、マメ粉の総タンパク質含有量に対する％として表される。レグヘモグロビンタンパク質を、ＵＨＰＬＣ－ＭＳ－ＭＳによって定量化し、可溶性タンパク質又は総タンパク質ベースの重量％で表す。

データは、レグヘモグロビンタンパク質の量が両方の実験で同様なレベルに達したことを示しており、ヘム経路のアップレギュレーションが最大レベルを有するこれらのイベントにおけるレグヘモグロビンタンパク質のレベルに正又は負の影響も及ぼさなかったことを示し、総タンパク質ベースで表されるとき、レグヘモグロビンプラスヘム経路遺伝子（実験５）では０．８２％に達し、レグヘモグロビンタンパク質のみの材料（実験１）では０．８０％に達した。

視覚的には、各実験の豆の赤色における明らかな強度の差はなく、これは２つの実験から豆に含まれるレグヘモグロビンタンパク質複合体の量に差がないことを示していると解釈された。実験１及び５からの種子を、次の世代で分析した。

表９Ａのデータは、ホモ接合型種子が同じイベントからのＴ１種子よりもより高い量のレグヘモグロビンを有することを示している。例えば、イベントＧＭＺ３Ａ９．００１．２４ａからのＴ２種子では、総タンパク質の１．３８％（乾燥ベースで）がレグヘモグロビンであることが決定され、これはＴ１種子における０．６５重量％と比較して２倍の増加であった。同様に、イベントＧＭ９ＲＤＶ．００１．５ａからのＴ２種子では、総タンパク質の１．８４重量％（乾燥ベースで）がレグヘモグロビンであることが決定され、これは０．７１重量％のＴ１種子の値（３つの種子の平均）と比較して、２．６倍の増加であった。データは、種子がホモ接合型であるとき、レグヘモグロビンレベルが２倍になることを示している。

実施例８：高オレイン酸系統によるダイズレグヘモグロビン系統のスタッキング
上述したトランスジェニックレグヘモグロビンイベントを、総脂肪酸に対して少なくとも５０％、７０％、又は７５％のオレイン酸を含有するような高オレイン酸系統と遺伝的に交雑させる。同様に、上述したレグヘモグロビン遺伝子編集多様体を、総脂肪酸に対して少なくとも５０％、７０％、又は７５％のオレイン酸を含有するような高オレイン酸系統と遺伝的に交雑させる。或いは、レグヘモグロビン遺伝子編集を高オレイン酸系統において直接実施する。更に、両方のレグヘモグロビン遺伝子編集及びＦＡＤ２／ＦＡＤ３編集を一緒に実施して、遺伝子編集アプローチを通して、高オレイン酸形質を有するレグヘモグロビン形質を排他的に積み重ねる。結果として得られたダイズ種子は増加した栄養価を有し、ダイズタンパク質、ダイズ単離物、又はダイズ濃縮物に改善された風味を提供する。

実施例９：ダイズからのレグヘモグロビン複合体の抽出
レグヘモグロビン複合化タンパク質が下流製品として使用されるためには、ダイズが処理される必要がある。典型的には、これには、油のテンパリング、クラッキング、脱皮（ｄｅｈｕｌｌｉｎｇ）、溶媒除去、及び残留溶媒を除去して、プロテアーゼインヒビターなどのタンパク質性抗栄養因子を不活性化するためのトースティングを伴う。これらの処理ステップから得られるミール又は穀粉（典型的には、４７．５％超のタンパク質）を、可溶性糖類を除去することによってタンパク質画分を濃縮するために更に精製され、ダイズタンパク質濃縮物（典型的には、６５％超のタンパク質）を形成することができる。ダイズタンパク質濃縮物を作製するために使用される３つのプロセスがあり、いわゆるアルコール洗浄、酸洗浄、熱水抽出である（Ｄｅａｋ，Ｎ．Ａ．，Ｊｏｈｎｓｔｏｎ，Ｌ．Ａ．，Ｌｕｓａｓ，Ｅ．Ｗ．，ａｎｄＲｈｅｅ，Ｋ．Ｃ．，２００８．Ｓｏｙｂｅａｎｓ：Ｃｈｅｍｉｓｔｒｙ，Ｐｒｏｄｕｃｔｉｏｎ，Ｐｒｏｃｅｓｓｉｎｇ，ａｎｄｕｔｉｌｉｚａｔｉｏｎ．Ｊｏｈｎｓｔｏｎ，Ｌ．Ａ．，Ｗｈｉｔｅ，Ｐ．Ｊ．，ａｎｄＧａｌｌｏｗａｙ，Ｒ．ｅｄｓＡＯＣＳＰｒｅｓｓ）。これらのプロセスは全て、レグヘモグロビン複合体を実質的に脱ヘム化し、回収及びその後の使用には不向きなものにすることが予想される。

或いは、ダイズはダイズタンパク質単離物（典型的には、９０％超のタンパク質）の形態に処理され得る。これは、不溶性炭水化物（繊維）画分のバルクを除去するための遠心分離の前に、軽くトーストされた白色フレーク（脱脂ミール）のタンパク質画分の可溶化によって達成される。次いで、ｐＨを調節することによってタンパク質を沈殿させ、洗浄して残っている可溶性炭水化物を除去する。精製されたタンパク質画分を、粉末を乾燥させる前に、残留プロテアーゼインヒビター活性及び微生物汚染物質を不活性化するために低温殺菌する。ダイズ単離物生産プロセスにおけるこれらの最終的ステップもまた、レグヘモグロビン複合体を実質的に脱ヘム化し、それらを回収及び後続の使用のために不向きなものにすることが予想される。

ダイズからのレグヘモグロビンタンパク質の溶解性／抽出性を調べるために、以下の実験を実施した。赤色レグヘモグロビン発現ダイズからのダイズ粉末サンプル（１０＋／－０．５ｍｇ；秤量し、０．１ｍｇの精度で記録した）を、１．２ｍｌのマイクロタイターチューブ（Ｆｉｓｈｅｒブランド０２－６８１－３７６）に配置した。抽出バッファー、８ｍＭの（３－［（３－コールアミドプロピル）ジメチルアンモニオ］－１－プロパンスルホネート水和物、（ＣＨＡＰＳ）；０．１％のＴｒｉｔｏｎＸ－１００、ｐＨ８．４を５０の組織重量対体積比で添加した。１つの小さな鋼球を各バイアルに添加し、栓をした後に、サンプルをＧｅｎｏ／Ｇｒｉｎｄｅｒ内；毎分１１５０振動数にて３０秒間抽出し、次いで回転（ｅｎｄｏｖｅｒｅｎｄ）ローターを１０分間行い、次いでジェノグライディングステップを繰り返した。鋼球を除去した均質化チューブの内容物を、清浄な１．５ｍｌの微量遠心管に定量的に移し、サンプルを微量遠心機内；１０，６７０×ｇで１０分間清澄化させた。上清を清浄な１．５ｍｌの微量遠心管に移した。このステップからの残留ペレットを、記載したように更に２回抽出した。第１、第２及び第３の上清からのアリコートを、実施例７に記載されるように、可溶性タンパク質及びレグヘモグロビンについて分析した。結果を表１０に示す。

データは、レグヘモグロビンタンパク質の全てが第１の抽出で回収されたことを示す。

実施例１０：レグヘモグロビンダイズに対する酵素的ダイズ処理（Ｅ－ＳＯＹ）
タンパク質をダイズミールから単離するための課題は、物理的に処理され得るスラリーを得るための高い水：固形物比を必要とすることである。これはプロセスにおける大量の水につながり、このことが抽出されたタンパク質の濃縮、不溶化ミール残留物の乾燥、及び最終的に廃水処理に関連する処理コストを増大させる。ミール中の不溶性又は粘性多糖類材料を、可溶化された短鎖多糖類に変換するための食品グレードの多糖類分解酵素を使用する脱脂ダイズミールからタンパク質を単離するための新規なアプローチは、タンパク質抽出及び単離に必要とされる大量の水を大幅に削減する。より伝統的なダイズタンパク質濃縮物及び単離物を単離するために使用されるこのプロセスは、無傷のレグヘモグロビン複合体を維持しながら、レグヘモグロビンの単離を容易にすることが予想される。一般化された酵素ダイズ（Ｅ－ＳＯＹ）プロセスを、以下に概説する。

プロセスフローチャート
図１２は、Ｅ－ＳＯＹプロセスについての一般化されたプロセスフローチャートの一例を示す。実験室で脱脂された全ダイズミール（典型的には、実験室プロセスでは４０ｇのアリコート）を、ビーカー内で余熱した水と３：１の液体：固形物の比で混合した。インキュベーション時間後、ビーカーを調節された水浴（典型的には、５０℃に維持された）上に置いた。低剪断インペラを装備したオーバーヘッドスターラー（ＬｉｇｈｔｎｉｎＭｉｘｅｒ）を用いて、ミールドウを撹拌した。混合物の粘度は、２００ｒｐｍでドウを撹拌するのに必要なスターラー出力（ワット）によって推定された。撹拌しながら５ＮＨＣｌのアリコートをドウに滴加し（典型的には、４～５ｍＬ）、スラリーのｐＨをｐＨ３．８～４．５の範囲に低下させた。異なる原料のｐＨを低下させるのに必要な酸の抽出量を、大量の水中に懸濁させた原料を使用して別々に決定した。市販の酵素のアリコート（典型的には、２００μＬのセルラーゼ、ヘミセルラーゼ、及びペクチナーゼ、液体ペクチナーゼについては１０μＬ）であった。次いで、ドウを撹拌して、様々な時間で酵素と反応させたが、日常的には３時間を使用した。オーバーヘッドミキサーの出力読み取り値を記録し、オーバーヘッドミキサーの出力読み取り値を、ドウスラリーの粘度を監視するために間隔をおいて記録した。

溶液の粘度が、自由流動スラリーを形成するのに十分なほど低減したときに、混合物を５００ｕＭメッシュのポリプロピレンスクリーンが装備されているブフナー漏斗に定量的に移し、真空濾過した。フィルターケーキを、６０ｍＬの水で洗浄した。濾液を、１０５ｕｍメッシュのポリプロピレンスクリーンを装備した第２のブフナー漏斗上を通過させて、洗浄ボトルからの脱イオン水で濯いだ。５００ｕｍ及び１０５ｕｍの濾過からのフィルターケーキを、準備した容器に定量的に移し、６５℃の真空オーブン内で少なくとも４８時間乾燥させた。合わせたフィルターケーキの乾燥重量を決定し、残渣（ミール残渣）をコーヒーミルで粉砕して、その後更に分析した。

１０５ｕｍ濾過からの濾液スラリーを、２ＮＮａＯＨでｐＨ６．５～７に調節したが、レグヘモグロビン単離のためには、７～１１のｐＨを使用するであろう。撹拌後に、溶液を遠心分離ボトルに移し、固定角ローター内で７０００ｒｐｍで１０分間遠心分離した。上清溶液を、真空下の濾過のための使い捨て０．４５ｕｍ－１Ｌフィルター装置に注意深く注いだ。遠心分離機の固形物（濃縮沈殿タンパク質濃縮物、又はＣＰＰＣ）を脱イオン水中に懸濁させ、準備したフラスコに定量的に移し、シェル凍結し、凍結乾燥させた。回収されたＣＰＰＣの乾燥重量を、凍結乾燥後に決定した。

０．４５ｕｍ濾過された可溶性タンパク質溶液（ＳＰＳ）の上清を、ＰＥＳ膜モジュール（Ｖｉｖａｆｌｏｗ２００、実験に応じて可変ＭＷＣＯ）を装備した限外濾過装置に移した。ＳＰＳを約５０ｍＬの容量まで濃縮し、次いで、脱イオン水（実験に応じて、１００～３００ｍＬ）で透析濾過した。ＵＦ／ＤＦ透過液を、更なる処理のためにフラスコ内に収集した。ＵＦ／ＤＦステップが完了したら、保持溶液を遠心分離ボトルに定量的に移し、７０００ｒｐｍで１０分間遠心分離し、ＵＦ／ＤＦプロセス中に形成されたあらゆる沈殿物を除去した。上清を、準備したフラスコにデカンテーションし、シェル凍結及び凍結乾燥させた。回収した固形物（濃縮可溶性タンパク質単離物、又はＣＳＰＩ）を秤量し、更なる研究のために保管した。遠心分離ステップから何らかの固形物が回収される場合（可溶性タンパク質溶液沈殿物、又はＳＰＳ－ｐｐｔ）、それを別の準備したフラスコに定量的に移し、凍結し、凍結乾燥し、分析した。

ＵＦ／ＤＦプロセスの一部の変更において、一連の減少するＭＷＣＯポロシティを使用するシーケンシャル方式ＵＦ／ＤＦを検討した。このプロセスは、最も高いＭＷＣＯステップからの透過物が次に低いＭＷＣＯ膜を連続して通過し、保持物が個々の準備されたフラスコに移され、凍結及び凍結乾燥される以外は本質的に同じである。

最終的限外濾過透過液をロータリーエバポレーター上で濃縮し、準備した丸底フラスコ内で乾燥させた。フラスコを真空オーブンに移し、６５℃で少なくとも４８時間更に乾燥させた。固形物の乾燥重量を決定し、材料をフラスコ壁から擦り取り、容器に移して保管した。

タンパク質を、燃焼分析装置（ＣＥＥｌａｎｔｅｃｈ，ＦｌａｓｈＥＡ１１１２シリーズ）を使用して、総窒素含有量として決定した。総窒素含有量を、％Ｎに６．２５を掛けることによって総タンパク質に変換した。

市販のダイズミールからのタンパク質の回収を、表１１に示す。

ダイズタンパク質の異なる溶解度、及びそれらのｐＨ６未満での低い溶解度のために、抽出されたダイズミールのミール残渣（ＭＲ）画分は、６６．３％のタンパク質純度で開始タンパク質の６５％を保持した。これは、実際には、元々の５０．９％のタンパク質含有量からのダイズミールの濃縮に相当し、＞６５％のタンパク質濃度の基準を満たす。初期タンパク質のはるかに低い割合が濃縮物及び単離物の画分で回収され、これらの生成物の初期タンパク質でわずか１５％しか回収されなかった。濃縮物画分は、実際には、ミール残渣よりもタンパク質含有量が低かった（６２．２％対６６．３％）。単離物画分の純度は、１０２．５％と優れており、比較的低いレベルのタンパク質が、ＵＦ透過液で見出された。総タンパク質の回収は、フィルタースクリーンからミール残渣を分離することの物理的な難しさによって損なわれた。固形分の割合が高いことを考えると、消化されたミールスラリーの溶解したタンパク質からの固形物の異なる物理的分離を利用する方が効率的であり得る。

予想外の発見は、タンパク質単離物がタンパク質画分の分子量に基づいて予測されたよりもはるかに高いＭＷＣＯ限外濾過膜を使用して回収できることであった。予期せぬ溶液中の凝集挙動のために、はるかに高いＭＷＣＯ膜を効率的に使用することができた。同様な回収が、レグヘモグロビン含有ダイズから生成された単離物に対して達成されると予想される。プロセスにおいてハイフラックス膜を使用することは、必要とされる総表面積を低減させ、それによって資本コストを節約する。

プロセスの初期段階中に高度に可溶性のレグヘモグロビンタンパク質を上清に優先的に抽出させ、限外濾過ステップ中での差次的精製を可能にするステップが実行される。これは、下流製品の配合に使用することができる高価値の共産物を生み出すであろう。

プロセスはテストされており、一般に的に表１２に列挙した脂肪種子原料に適用可能である。

追加のタンパク質収量の改善は、脱脂及び脱溶媒化プロセスを最適化して、ミールマトリックス内のタンパク質及びレグヘモグロビン複合体の不可逆的な変性を最小限に抑えることによって実現される。更に、Ｅ－Ｓｏｙ処理スキームは、プロテオームリバランシングによって作り出されたダイズ（実施例６に示されたような）に対して最適化され、ミールからのタンパク質の潜在的な回収を更に増強させることができる。レグヘモグロビンタンパク質を発現するように操作された高オレイン酸油ダイズ（実施例８に示すような）に由来のミールのタンパク質抽出を最適化するためのＥ－Ｓｏｙプロセスの更なる改変はまた、改善された感覚特性及び処理特性にもなおつながることが予想される。例えば、原料として使用される好適なダイズ単離物の例及び高オレイン酸ダイズと関連する利点については、参照により本明細書に組み込まれる米国特許第９，９１８，４８５号明細書を参照されたい。

実施例１１：低減された抗栄養因子及び／又は増加されたタンパク質含有量と組み合わせてレグヘモグロビンを発現するダイズ種子
その後続の食品への組込みのためにダイズタンパク質を濃縮する多くの収穫後処理ステップは、タンパク質ベースの因子（例えば、プロテアーゼインヒビター）及び炭水化物ベースの因子（例えば、ラフィノ－オリゴ糖）などの抗栄養因子を除去又は不活性化する。そのようなステップは、レグヘモグロビン複合化タンパク質を脱ヘム化して、それを下流の使用に適さないものにする。

ゲノム編集技法は、クニッツトリプシンプロテアーゼインヒビター及びボーマン・バークプロテアーゼインヒビターのうちの１つ以上の発現を低減若しくはノックアウトさせ、及び／又はラフィノース及びスタキオースのうちの１つ以上の合成を阻害するために使用される。これらのダイズ種子はまた、以前の実施例に記載されたように、増加されたレグヘモグロビン又は複合体化レグヘモグロビンを発現するように編集される。或いは、増加されたレグヘモグロビン又は複合体化レグヘモグロビンを発現する編集されたダイズは、クニッツトリプシンプロテアーゼインヒビター及びボーマン・バークプロテアーゼインヒビターの発現を低減若しくはノックアウトさせ、及び／又はラフィノース及びスタキオースの合成を阻害するように編集されたダイズと交配させて、編集された遺伝子の育種スタックを作り出す。ゲノム編集を用いて、ＲＳ２、ＲＳ３、ＲＳ４などのラフィノースシンターゼ遺伝子のノックアウトによって、ラフィノース及びスタキオースなどの不溶性炭水化物を低減させる。操作アプローチの有効性を決定するためのアッセイは、米国油脂化学協会の公定法Ｂａ１２－７５を使用して、残留トリプシンインヒビター活性を測定するであろう。可溶性炭水化物プロファイルにおける変化は、参照により本明細書に組み込まれる、米国特許出願公開第２０１９０３８３７３３号明細書に概説されるような方法を使用して決定されるであろう。

ゲノム編集は、重要な調節遺伝子のノックアウト又は改変によって種子中の総タンパク質含有量を増加させるためにも用いられ、例えば、参照により本明細書に組み込まれる、ＰＣＴ／米国特許出願公開第２０１９／０５８７４７号明細書に開示されるような、ＣＣＴドメイン含有タンパク質、レティキュロン、トレハロースリン酸シンターゼ、ＨＥＣＴユビキチンリガーゼ（ＨＥＬ又はＵＰＬ３）、ＭＦＴ（ｍｏｔｈｅｒｏｆｆｌｏｗｅｒｉｎｇｔｉｍｅ）突然変異若しくは改変された植物及び趣旨である。この実施例に記載されるような、それらの加工可能性を最適化するように操作されたダイズ中のレグヘモグロビンの発現は、そのようなダイズの価値及び有用性を高めるであろう。

収穫後加工を最小限に抑えるようにダイズを操作することは、無傷のレグヘモグロビン複合体のより大きな収量をもたらすと予想される。そのようなダイズは、ダイズ加工に通常使用される油を除去するための溶媒の使用又はトースティングステップの必要なく処理される。そのようなダイズ種子は、冷間プレス、押出成形又は超臨界流体抽出（（ＦｒｉｅｄｒｉｃｈＪ．Ｐ．，ＬｉｓｔＧ．Ｒ．，ａｎｄＨｅａｋｉｎＡ．Ｊ．，１９８２．ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＯｉｌＣｈｅｍｉｓｔｓＳｏｃｉｅｔｙ．５９（７）；２８８－２９２）のうちの１つ以上を使用して処理される。

実施例１２．ＰＰＲ１０多様体の種子特異的発現のための核ゲノムの形質転換
Ｄｉｅｔａｌ．（（１９９６）ＰｌａｎｔＣｅｌｌＲｅｐ１５：７４６－７５０）の記載のように、１２ＮＨＣｌ３．５ｍＬと１００ｍＬの市販漂白剤（５．２５％次亜塩素酸ナトリウム）を混合して製造した塩素ガスを使用して、ダイズ株の成熟した乾燥種子の表面を１６時間殺菌する。消毒した種子を、滅菌蒸留水中に、室温で１６時間浸漬させ（２５×１００ｍｍのペトリ皿中１００個の種子）、５ｇ／ｌのスクロース及び６ｇ／ｌの寒天を含有する半固体培地上に、暗所中室温で浸した。終夜のインキュベーション後、暗所で更に３～４時間、室温で種子を蒸留水に浸漬させる。無傷の胚軸を浸した種子から単離する。アグロバクテリウム（Ａｇｒｏｂａｃｔｅｒｉｕｍ）媒介ＥＡ形質転換を以下に記載される通りに実行する。

ｐＨ５．４の１／１０×ＧａｍｂｏｒｇＢ５塩基性培地、３０ｇ／Ｌのスクロース、２０ｍＭのＭＥＳ、０．２５ｍｇ／ＬのＧＡ３、１．６７ｍｇ／ＬのＢＡＰ、２００μＭのアセトシリンゴン及び１ｍＭのジチオスレイトールから構成される感染培地中の１５ｍＬの容量の、ダイズ核形質転換バイナリーベクター（図１）を担持するアグロバクテリウム・ツメファシエンス（Ａ．ｔｕｍｅｆａｃｉｅｎｓ）ＬＢＡ４４０４又はＡＧＬ－１懸濁液（６００ｎｍでＯＤ０．５）を約２００～３００個のＥＡに添加し、それらを２５×１００ｍｍの深型ペトリ皿に置く。パラフィルム（カタログ番号５２８５８、「ＰａｒａｆｉｌｍＭ」ＶＷＲ）でプレートに封をし、その後、３０秒間超音波（Ｓｏｎｉｃａｔｏｒ－ＶＷＲｍｏｄｅｌ５０Ｔ）処理を行う。超音波処理後、ＥＡを室温で２時間インキュベートする。摂種後、過剰の細菌懸濁液を除去し、約２００～３００個のＥＡを、２５×１００ｍｍのペトリ皿内のオートクレーブ処理した滅菌濾紙（カタログ番号２８３２０－０２０、ＶＷＲ）の単一層に移す。この皿を、Ｍｉｃｒｏｐｏｒｅテープ（カタログ番号１５３０－０、３Ｍ、Ｓｔ．Ｐａｕｌ，ＭＮ，ＵＳＡ）で密閉し、３日にわたり２１℃で、１６時間にわたる弱い光（１～２μＥ／ｍ^２／ｓ）、冷白色蛍光ランプ下でインキュベートした。共培養後、各胚軸の基部を、ｐＨ５．７で３０ｇ／Ｌのスクロース、６ｇ／Ｌの寒天、及び２５ｍｇ／Ｌの選択可能剤としてのスペクチノマイシン（Ｓ７４２、ＰｈｙｔｏＴｅｃｈＬａｂｓ）並びに３００ｍｇ／Ｌのセフォタキシム（ＧｏｌｄＢｉｏ，ＳＴＬｏｕｉｓ，ＭＯ，ＵＳＡ）を含有するシュート誘導培地（Ｒ７１００、ＰｈｙｔｏＴｅｃｈＬａｂｓ）中に埋め込む。１６時間にわたる光周期及び６０～１００μＥ／ｍ^２／ｓの光強度にて、２６℃でＰｅｒｃｉｖａｌＢｉｏｌｏｇｉｃａｌＩｎｃｕｂａｔｏｒ（ＰｅｒｃｉｖａｌＳｃｉｅｎｔｉｆｉｃ，Ｐｅｒｒｙ，ＩＡ，ＵＳＡ）又は生育室において、シュートの誘導を実行した。選択培地中で４～６週間後、スペクチノマイシン耐性シュートを切断し、更なるシュート及び根の伸長のための１５ｇ／Ｌのスクロース、寒天６ｇ／Ｌ、１０ｍｇ／Ｌのスペクチノマイシン及び２５０ｍｇ／Ｌのセフォタキシムを含有する１／２強度のＭＳ発根培地（Ｍ４０４、ＰｈｙｔｏＴｅｃｈＬａｂｓ）に移す。形質転換効率を、ＥＡの総数で割った陽性トランスジェニックダイズＴ０植物の数に基づいて算出する。

スペクチノマイシンマーカー遺伝子を含まないＴ０イベントを作り出すためのダイズのヒートショック処理については、スペクチノマイシンを含まない発根培地上、１００×２５ｍｍのペトリ皿又はマジェンタボックス内の２～４ｃｍの根のついたＴ０小植物を、Ｐｅｒｃｉｖａｌインキュベーター（ＰｅｒｃｉｖａｌＳｃｉｅｎｔｉｆｉｃ，Ｐｅｒｒｙ，ＩＡ，ＵＳＡ）、４５℃、７０％の湿度に移し、暗所に２時間置いた。ヒートショック処理されていないＴ０小植物を、対照として使用する。ヒートショック処理後、Ｔ０小植物を湿らせたＢｅｒｇｅｒＢＭ２土壌（Ｂｅｒｇｅｒ，Ｓａｉｎｔ－Ｍｏｄｅｓｔｅ，ＱＣ，Ｃａｎａｄａ）に移し、２５０～３５０μＥ／ｍ^２／ｓでの光周期で、Ｐｅｒｃｉｖａｌインキュベーター内で２６℃にて１６時間透明なプラスチックトレイボックス内に閉じ込められた状態で保管した。Ｔ０イベント順化後２週間で、新しく生育したものからの２～４個のリーフパンチサンプルを、ｑＰＣＲ及びＳｂＳ分析用に採集する。

図１３は、Ｔ－ＤＮＡ内のダイズ核形質転換バイナリーベクターを示す概略図である。図１３では、ＲＢ及びＬＢは、それぞれＴ－ＤＮＡの右側ボーダー及び左側ボーダーにあり、ＧＭ－ＧＹ１Ｐｒｏはダイズグリシニン種子特異的プロモーターであり、ＡｔＵＢＱ１０Ｐｒｏはシロイヌナズナ（Ａｒａｂｉｄｏｐｓｉｓ）ユビキチン１０プロモーターであり、ＰＰＲ１０ＧＧはトウモロコシ又はダイズＲＮＡ結合タンパク質ＰＰＲ１０多様体であり、ＵＢＱ１０ＴＥＲＭはシロイヌナズナ（Ａｒａｂｉｄｏｐｓｉｓ）ユビキチン１０ターミネーターであり、ＬｏｘＰはｌｏｘ組換え部位であり、Ｇｍ－ＨＳＰ１７．３ＢＰｒｏはダイズヒートショックｈｓ６８７１プロモーターであり、ＭｏＣｒｅはＣｒｅリコンビナーゼであり、ＳＢ－ＧＫＡＦＴｅｒｍはソルガム（Ｓｏｒｇｈｕｍｂｉｃｏｌｏｒ）ガンマカフィリン貯蔵タンパク質ターミネーターであり、Ａｔ－ＵＢＱ１０Ｐｒｏはシロイヌナズナ（Ａｒａｂｉｄｏｐｓｉｓ）ユビキチン１０プロモーターであり、ＳｐｃＮはストレプトマイセス・スペクタビリス（Ｓｔｒｅｐｔｏｍｙｃｅｓｓｐｅｃｔａｂｉｌｉｓ）Ｇｅｎｅｂａｎｋタンパク質ＩＤＡＡＤ５０４５５からのダイズコドン最適化スペクチノマイシン耐性遺伝子であり、そしてＵＢＱ１４Ｔｅｒｍはシロイヌナズナ（Ａｒａｂｉｄｏｐｓｉｓ）ユビキチン１４ターミネーターである。

実施例１３．トランスプラストミックダイズ植物における種子特異的レグヘモグロビン発現：遺伝子銃媒介ダイズ葉緑体形質転換
ＧＭ－ＧＹ１Ｐｒｏ：ＰＰＲ１０ＧＧ：ＳＢ－ＧＡＫＦＴＥＲＭ発現カセットを担持するマーカーフリーのＴ１ホモ接合型株を、葉緑体形質転換のためのドナー材料として使用する。未成熟の莢を、ダイズマーカーフリーのＴ１－２ホモ接合型株から採集し、莢を開けて約２～８ｍｍの長さの未成熟な種子を取り出す。未成熟な種子を採集し、５０ｍＬの１０％の漂白剤、０．０２％のＴｗｅｅｎ－２０溶液を含有する５０ｍＬのスクリューキャップチューブ中で、軽く１５分撹拌しながら表面を滅菌し、次いで、合計で５００ｍＬの滅菌蒸留水で１０回濯ぐ。表面滅菌した種子を、顕微鏡下又は拡大鏡下で切断して開く。典型的には、各未成熟種子の胚軸を切り取り、２つの子葉片を取り外す。未成熟子葉を採集し、液体Ｓ３０培地を含有するフラスコに移す（表１３）。

未成熟子葉を、Ｓ３０培地中で１０日間前培養し、直接的遺伝子銃媒介ＤＮＡ形質転換の標的に定める。前培養の１０日後、２０個の未成熟子葉を遺伝子銃のために小ペトリプレート（６０×１５ｍｍ）の中心に、４０ｍｇ／Ｌの２，４－Ｄを補充したＭ２固体培地の表面に置く。未成熟子葉に０．６μｍの金粒子／プラスミドＤＮＡ（図２）混合物を、３０ピコグラム／塩基対／ショットの濃度で６５０ｐｓｉにて、２８ｍｍＨｇの遺伝子銃（ＰＤＳ１０００／Ｈｅ、Ｂｉｏ－Ｒａｄ）を用いて衝突させる。Ｍ２固体培地中での共培養の２日後に、衝突させた未成熟子葉を、３００ｍｇ／Ｌのスペクチノマイシンを含有する液体Ｓ３０培地に移す。３００ｍｇ／Ｌのスペクチノマイシンを含有する新鮮なＳ３０培地を、２週間ごとに交換する。選択の８～１２週後に、スペクチノマイシン耐性の黄緑色から緑色のカルスが外植片の表面から出現する。推定される形質転換された緑色のカルスを顕微鏡下で単離し、Ｍ７寒天培地に重なる滅菌濾紙を含むペトリプレートに植え付ける。ペトリプレートを、ＭｉｃｒｏｐｏｒｅＴＭ外科用テープ（３ＭＨｅａｌｔｈＣａｒｅ，Ｓｔ．Ｐａｕｌ，ＭＮ，ＵＳＡ）で密閉し、３５～６０μＥ／ｍ２／ｓの光強度で１８時間の光周期を用いて２６℃でインキュベートする。Ｍ７培地上での３～４週間の成熟後、成熟体細胞胚を滅菌ペトリ皿内に配置し、体細胞胚の乾燥のためにＭｉｃｒｏｐｏｒｅＴＭ外科用テープで密閉するか、又はプラスチックボックス内に密閉せずに室温で４～７日間配置する。４～７日後に、乾燥された胚を、１０μｇ／Ｌのスペクチノマイシンを補充したＭ８培地上に植え付け、３５～６０μＥ／ｍ２／ｓの光強度で１８時間の光周期を用いて２６℃で発芽させた。Ｍ８発芽培地上で４～６週間後に、小植物を湿らせたＢｅｒｇｅｒＢＭ２土壌（ＢｅｒｇｅｒＰｅａｔＭｏｓｓ，Ｓａｉｎｔ－Ｍｏｄｅｓｔｅ，Ｃａｎａｄａ）を含有する３インチのポットに移し、透明なプラスチックトレイボックスに閉じ込められた状態で保管し、その後９０～１５０μＥ／ｍ２／ｓ及び２６℃日中温度／２４℃夜間温度で１６時間の光周期を用いて、培養室内で順化させた。順化後、硬くなった小植物を、湿らせたＢｅｒｇｅｒＭＢ１（ＢｅｒｇｅｒＰｅａｔＭｏｓｓ，Ｓａｉｎｔ－Ｍｏｄｅｓｔｅ，Ｃａｎａｄａ）を含有する２ガロンのポットに植え付け、温室内で種子を付ける成熟状態まで生育させる。

図１４は、ダイズ葉緑体形質転換ベクターの概略図である。ＧＭ－ＴＲＮＶはダイズ色素体ＴＲＮＶ相同領域であり、ＮＴ－ＰＳＢＡＰｒｏはタバコＰＳＢＡ色素体プロモーターであり、ＡＡＤＡはスペクチノマイシンアデニリルトランスフェラーゼ遺伝子であり、ＮＴ－ＰＳＢＡ３ＵＴＲはタバコＰＳＢＡ３ＵＴＲであり、ＤｉｃｉｓＧＧはジシストロニックなオペロンの遺伝子間領域（配列番号４４）へのＧＧ結合部位であり、レグヘモグロビン（Ｌｅｇｈｅｍｏｇｌｏｂｉｎ）はダイズレグヘモグロビンコード配列（Ｇｌｙｍａ．２０ｇ１９１２００）であり、ＧＭ－ＲＰＳはダイズ色素体ＲＰＳ相同領域である。

ダイズ種子は、根、茎、葉、及び花などの植物の非種子部分における最小のレグヘモグロビンの発現、又はレグヘモグロビンの発現なしに、種子の色素体中でレグヘモグロビンを発現すると予想される。

実施例１４．トランスプラストミックダイズ植物における種子特異的レグヘモグロビン発現：核形質転換後の色素体形質転換
開始ドナー材料が、ｎｕｌｌ又は非形質転換ダイズであることを除いて、実施例１３の方法論に従う。次いで、得られた形質転換色素体を含有するダイズ種子及び植物を、実施例１２に記載される方法に従って形質転換する。ダイズ種子は、根、茎、葉、及び花などの植物の非種子部分における最小のレグヘモグロビンの発現、又はレグヘモグロビンの発現なしに、種子の色素体中でレグヘモグロビンを発現すると予想される。

本明細書における全ての刊行物及び特許出願は、本発明が属する技術分野の当業者の水準を示すものである。全て刊行物及び特許出願は、あたかも個々の刊行物又は特許出願が、明確に且つ個々に参照により指示されているのと同程度に、参照により本明細書に組み込まれる。

特に定義しない限り、本明細書で用いられる全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。特に明記しない限り、本明細書で採用されるか、又は企図される技法は、当業者に周知の標準的な方法である。材料、方法及び実施例は、例示のためのものに過ぎず、限定するものではない。

本明細書で記載されている本発明の多くの変更及び他の実施形態は、これらの発明が関連する技術分野の当業者であって、前述の説明及び添付の図面に提示された教示を利用できる者であれば、思い付くであろう。したがって、本発明が、本明細書に開示した特定の実施形態に限定されるべきではなく、また、変更やその他の実施形態が添付の請求項の範囲に含まれることを意図していることは理解されるべきである。本明細書中には特定の用語が使用されるが、それらは、一般的且つ記述的意味でのみ使用されものであって、限定を目的として使用されるものではない。

単位、接頭語及び記号は、それらのＳＩが承認した形態で表記され得る。他に特に指示しない限り、それぞれ、核酸は５’から３’への方向で左から右へと記載され、アミノ酸配列はアミノからカルボキシへの方向で左から右へと記載される。数値範囲は、範囲を定義する数字を含む。アミノ酸は、本明細書では、一般に知られている３文字の記号、又はＩＵＰＡＣ－ＩＵＢ生化学命名委員会が推奨する１文字の記号のいずれかで称されてもよい。同様に、ヌクレオチドは、それらの一般的に認められた１文字コードによって称されてもよい。

Claims

ダイズ種子であって、前記ダイズ種子中の総タンパク質の少なくとも０．５％の量でレグヘモグロビンタンパク質を含み、前記ダイズ種子が、そのゲノムに組み込まれたレグヘモグロビンコード配列を含む組換え構築物を含有しない、ダイズ種子。
前記ダイズ種子ゲノムが、天然レグヘモグロビン遺伝子中に挿入、欠失、又は置換を導入するように改変されている、請求項１に記載のダイズ種子。
前記ダイズ種子ゲノムが、（ｉ）挿入であって、前記挿入が調節エンハンサー若しくはプロモーター配列を含む、挿入、又は（ｉｉ）置換であって、前記置換が調節エンハンサー若しくはプロモーター配列を作製又は増強する、置換を導入するように改変されている、請求項１又は２に記載のダイズ種子。
前記ダイズ種子ゲノムが、挿入を導入するように改変されており、前記挿入が、前記レグヘモグロビン遺伝子のレグヘモグロビンコード配列に作動可能に連結された標的化配列を含み、前記標的化配列が前記レグヘモグロビンを細胞内区画に標的化する、請求項１又は２に記載のダイズ種子。
前記標的化配列が、前記レグヘモグロビンを色素体に標的化させる、請求項４に記載のダイズ種子。
前記標的化配列が、配列番号３２と少なくとも９５％の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項５に記載のダイズ種子。
前記ダイズ種子ゲノムが、種子貯蔵タンパク質のコード配列の全部又は一部をレグヘモグロビンコード配列で置き換えるように改変されている、請求項１に記載のダイズ種子。
前記ダイズ種子ゲノムが、挿入を導入するように改変されており、前記挿入が前記ヘモグロビンを細胞内区画に標的化させる前記レグヘモグロビンコード配列に作動可能に連結された標的化配列を含む、請求項７に記載のダイズ種子。
前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項８に記載のダイズ種子。
前記標的化配列が、配列番号３２と少なくとも９５％の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項９に記載のダイズ種子。
ゲノム改変を含むダイズ種子であって、前記ゲノム改変がレグヘモグロビンコード配列の天然種子貯蔵タンパク質遺伝子への挿入を含み、それによって前記レグヘモグロビンコード配列が、前記天然貯蔵タンパク質遺伝子コード配列の全部又は一部に置き換わり、前記レグヘモグロビンタンパク質が前記種子の断面において、前記ダイズ種子にピンク色を付与するのに十分な量で前記ダイズ種子中で発現される、ダイズ種子。
前記レグヘモグロビンタンパク質が、前記総種子タンパク質の少なくとも０．１％の量で発現される、請求項１１に記載のダイズ種子。
前記天然種子貯蔵タンパク質遺伝子が、グリシニン又はコングリシニンをコードする、請求項１１又は１２に記載のダイズ種子。
前記レグヘモグロビンコード配列が、配列番号２と少なくとも９５％の同一性を有するポリペプチドをコードする、請求項１１～１３のいずれか一項に記載のダイズ種子。
前記レグヘモグロビンコード配列が、配列番号１と少なくとも９５％の同一性を有する、請求項１４に記載のダイズ種子。
前記挿入が、前記レグヘモグロビンを細胞内区画に標的化させる前記レグヘモグロビンコード配列に作動可能に連結された標的化配列を更に含む、請求項１１～１５のいずれか一項に記載のダイズ種子。
前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項１６に記載のダイズ種子。
前記標的化配列が、配列番号３２と少なくとも９５％の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項１７に記載のダイズ種子。
前記ダイズ種子が、そのゲノムに組み込まれた組換え構築物を更に含み、前記組換え構築物がレグヘモグロビンコード配列を含む、請求項１１～１８のいずれか一項に記載のダイズ種子。
前記組換え構築物が、前記組換え構築物の前記レグヘモグロビンコード配列に作動可能に連結された輸送配列を含み、前記輸送配列が前記組換え構築物から産生された前記レグヘモグロビンを細胞内区画に標的化させる、請求項１９に記載のダイズ種子。
前記輸送配列が、前記組換え構築物から産生された前記レグヘモグロビンを前記色素体に標的化させる、請求項２０に記載のダイズ種子。
前記ダイズ種子が、（ｉ）グルタミルｔＲＮＡレダクターゼ、（ｉｉ）フェロケタラーゼ、（ｉｉｉ）グルタミルｔＲＮＡレダクターゼ結合タンパク質、及び（ｉｖ）アミノレブリン酸シンターゼをコードする遺伝子中への１つ以上のヌクレオチド挿入、欠失、又は置換を有するように改変されている、請求項１１～１８のいずれか一項に記載のダイズ種子。
前記挿入、欠失、又は置換が、前記遺伝子の調節ドメインで行われる、請求項２２に記載のダイズ。
前記挿入、欠失、又は置換が、前記遺伝子のコード配列で行われる、請求項２２に記載のトランスジェニックダイズ。
改変されたレグヘモグロビン遺伝子を含むダイズ種子であって、前記改変されたレグヘモグロビン遺伝子が、天然ヘモグロビン遺伝子への少なくとも１つの欠失、挿入、又は置換を含み、前記レグヘモグロビンタンパク質が、横断面又は前記種子において前記ダイズ種子にピンク色を付与するのに十分な量で前記ダイズ種子中で発現される、ダイズ種子。
前記レグヘモグロビンタンパク質が、前記総種子タンパク質の少なくとも０．５％の量で発現される、請求項２５に記載のダイズ種子。
前記改変されたレグヘモグロビン遺伝子が、プロモーター又は調節増強配列の挿入を含む、請求項２５又は２６に記載のダイズ種子。
前記改変されたレグヘモグロビン遺伝子が、前記レグヘモグロビン遺伝子のレグヘモグロビンコード配列に作動可能に連結された標的化配列の挿入を含み、前記標的化配列が前記レグヘモグロビンを細胞内区画に標的化させる、請求項２５～２７のいずれか一項に記載のダイズ種子。
前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項２８に記載のダイズ種子。
前記標的化配列が、配列番号３２と少なくとも９５％の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項２９に記載のダイズ種子。
前記ダイズ種子が、そのゲノムに組み込まれた組換え構築物を更に含み、前記組換え構築物がレグヘモグロビンコード配列を含む、請求項２５～３０のいずれか一項に記載のダイズ種子。
前記組換え構築物が、前記組換え構築物の前記レグヘモグロビンコード配列に作動可能に連結された輸送配列を含み、前記輸送配列が前記組換え構築物から産生された前記レグヘモグロビンを細胞内区画に標的化させる、請求項３１に記載のダイズ種子。
前記輸送配列が、前記組換え構築物から産生された前記レグヘモグロビンを前記色素体に標的化させる、請求項３２に記載のダイズ種子。
前記ダイズ種子が、天然種子貯蔵タンパク質遺伝子へのレグヘモグロビンコード配列の挿入を更に含み、それによって前記レグヘモグロビンコード配列が、前記天然貯蔵タンパク質遺伝子コード配列の全部又は一部に置き換わる、請求項２５～３３のいずれか一項に記載のダイズ種子。
レグヘモグロビンタンパク質をダイズ種子中の総タンパク質の少なくとも０．５％の量で含むダイズ種子であって、前記ダイズが以下の特性：（ｉ）前記種子の総脂肪酸の少なくとも５０％のオレイン酸含有量；（ｉｉ）前記種子の総脂肪酸の３％未満のリノレン酸含有量；（ｉｉｉ）１３％の水分で測定されるか、又は１３％の水分に調整された前記ダイズの総重量の少なくとも３７％のタンパク質含有量；（ｉｖ）対照の非改変ダイズの活性の５％未満のクニッツトリプシンプロテアーゼインヒビター活性；（ｖ）対照の非改変ダイズの５％未満のボーマン・バークプロテアーゼインヒビター活性；（ｖｉ）１３％の水分での１重量％未満のスタキオース含有量；及び（ｖｉｉ）１３％の水分での０．５重量％未満のラフィノース含有量のうちの１つ以上を更に含む、ダイズ種子。
前記ダイズ種子が、前記ダイズゲノム中の前記天然レグヘモグロビン遺伝子への少なくとも１つの欠失、挿入、又は置換を含む、請求項３５に記載のダイズ種子。
前記レグヘモグロビンコード配列が、配列番号１と少なくとも９５％の同一性を有する、請求項３５又は３６に記載のダイズ種子。
前記ダイズ種子が、レグヘモグロビンコード配列に作動可能に連結された調節配列を含む組換え構築物を含む、請求項３５に記載のダイズ種子。
前記ダイズ種子が、天然種子貯蔵タンパク質遺伝子へのレグヘモグロビンコード配列の挿入を含むゲノム改変を含み、それによって前記レグヘモグロビンコード配列が、前記天然貯蔵タンパク質遺伝子コード配列の全部又は一部に置き換わる、請求項３５に記載のダイズ種子。
改変されたレグヘモグロビン遺伝子を含むダイズ種子であって、前記改変されたレグヘモグロビン遺伝子が、前記天然レグヘモグロビン遺伝子調節配列への少なくとも１つの欠失、挿入、又は置換を含み、前記ダイズ種子が総種子タンパク質の０．５％の量でレグヘモグロビンタンパク質を発現する、ダイズ種子。
挿入が天然レグヘモグロビン遺伝子調節配列中で行われ、前記挿入がプロモーター又は調節増強配列を含む、請求項４０に記載のダイズ種子。
配列番号２と少なくとも９５％の同一性を有するレグヘモグロビンタンパク質をコードするポリヌクレオチドを含む組換え構築物を含むトランスジェニックダイズ種子であって、前記構築物がタンパク質貯蔵小胞標的化配列を含まず、前記ダイズが、（ｉ）グルタミルｔＲＮＡレダクターゼをコードする配列、又はその短縮型部分を含む組換え構築物、（ｉｉ）フェロケタラーゼをコードする配列を含む組換え構築物、（ｉｉｉ）グルタミルｔＲＮＡレダクターゼ結合タンパク質を含む組換え構築物、及び（ｉｖ）アミノレブリン酸シンターゼを含む組換え構築物を含有せず、前記ダイズ種子が総種子タンパク質の少なくとも０．５％の量でレグヘモグロビンを前記種子に含む、トランスジェニックダイズ種子。
前記ダイズ種子が、（ｉ）グルタミルｔＲＮＡレダクターゼ、（ｉｉ）フェロケタラーゼ、（ｉｉｉ）グルタミルｔＲＮＡレダクターゼ結合タンパク質、及び（ｉｖ）アミノレブリン酸シンターゼをコードする遺伝子への１つ以上のヌクレオチド挿入、欠失、又は置換を有するように改変されている、請求項４２に記載のトランスジェニックダイズ種子。
前記挿入、欠失、又は置換が前記遺伝子の調節ドメインにおいて行われる、請求項４３に記載のトランスジェニックダイズ。
前記挿入、欠失、又は置換が、前記遺伝子のコード配列で行われる、請求項４３に記載のトランスジェニックダイズ。
ダイズの色素体のゲノムに組み込まれたレグヘモグロビンタンパク質をコードするポリヌクレオチドを含む、ダイズ種子。
前記ダイズ種子が、種子貯蔵プロモーターに動作可能に接続されたＰＰＲタンパク質コード配列を含むゲノム改変を更に含む、請求項４６に記載のダイズ種子。
種子貯蔵プロモーターに作動可能に接続された前記ＰＰＲタンパク質コード配列が、組換え構築物中で生じる、請求項４７に記載のダイズ種子。
前記ＰＰＲタンパク質コード配列が、天然種子貯蔵コード配列の天然プロモーターに作動可能に接続されており、前記ＰＰＲタンパク質コード配列が、前記天然種子貯蔵タンパク質コード配列の全部又は一部に置き換わる、請求項４７に記載のダイズ種子。
前記ダイズ種子が、そのゲノムに組み込まれた組換え構築物を更に含み、前記組換え構築物がレグヘモグロビンコード配列を含む、請求項４６～４９のいずれか一項に記載のダイズ種子。
前記ダイズ種子が、前記天然レグヘモグロビン遺伝子のゲノム改変を更に含む、請求項４６～５０のいずれか一項に記載のダイズ種子。
前記ダイズ種子が、種子貯蔵タンパク質のコード配列の全部又は一部がレグヘモグロビンコード配列で置き換えられるゲノム改変を更に含む、請求項４６～５２のいずれか一項に記載のダイズ種子。
前記ダイズ種子が、（ｉ）グルタミルｔＲＮＡレダクターゼ、（ｉｉ）フェロケタラーゼ、（ｉｉｉ）グルタミルｔＲＮＡレダクターゼ結合タンパク質、及び（ｉｖ）アミノレブリン酸シンターゼをコードする遺伝子中への１つ以上のヌクレオチド挿入、欠失、又は置換を有するように改変されている、請求項４６～５２のいずれか一項に記載のダイズ種子。
レグヘモグロビンタンパク質をダイズ種子中の総タンパク質の少なくとも０．５％の量で含むダイズ種子であって、前記ダイズ種子が、（ｉ）その挿入が非ダイズゲノム配列を除外するダイズゲノム配列の核酸挿入、（ｉｉ）１つ以上の核酸置換、（ｉｉｉ）１つ以上の核酸欠失、及び（ｉｖ）それらの任意の組合せのうちの少なくとも１つを含むゲノム改変を含み、前記ゲノム改変が、（ａ）天然レグヘモグロビン遺伝子に対して行われた改変、又は（ｂ）前記天然レグヘモグロビン遺伝子の少なくとも一部を含む挿入を含む、ダイズ種子。
前記ゲノム改変が前記天然レグヘモグロビン遺伝子への挿入、欠失、又は置換を含む、請求項５４に記載のダイズ種子。
前記ゲノム改変が、（ｉ）挿入であって、調節エンハンサー又はプロモーター配列を含む、挿入、又は（ｉｉ）置換であって、調節エンハンサー又はプロモーター配列を作製若しくは増強する置換を含む、請求項５４又は５５に記載の方法。
前記ゲノム改変が前記挿入を含み、前記挿入が前記レグヘモグロビン遺伝子のレグヘモグロビンコード配列に作動可能に連結された標的化配列を含み、前記標的化配列が前記レグヘモグロビンを細胞内区画に標的化させる、請求項５４又は５５に記載のダイズ種子。
前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項５７に記載のダイズ種子。
前記標的化配列が、配列番号３２と少なくとも９５％の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項５８に記載のダイズ種子。
前記ゲノム改変が、レグヘモグロビンコード配列による種子貯蔵タンパク質のコード配列の全部又は一部の前記置き換えを含む、請求項５４に記載のダイズ種子。
前記レグヘモグロビンコード配列が標的化配列に作動可能に連結されており、前記標的化配列が、前記レグヘモグロビンを細胞内区画に標的化させる、請求項６０に記載のダイズ種子。
前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項６２に記載のダイズ種子。
前記標的化配列が、配列番号３２と少なくとも９５％の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項６２に記載のダイズ種子。
前記天然レグヘモグロビン遺伝子が、配列番号４３に相当する配列である、請求項５４～６３のいずれか一項に記載のダイズ種子。
前記レグヘモグロビンタンパク質の少なくとも５０％が、複合体中でヘムと結合している、請求項１～６４のいずれか一項に記載のダイズ種子。
前記種子が、前記種子の横断面でピンク色を有する、請求項１～１０及び３２～６４のいずれか一項に記載のダイズ種子。
前記ダイズが、１つ以上の異なる種子貯蔵コード配列の発現を低減又は防止するための異なる改変を更に含み、前記レグヘモグロビンタンパク質の前記発現が、レグヘモグロビンを発現するが前記異なる改変を欠如する同等のダイズ種子と比較して増加されている、請求項１～６４のいずれか一項に記載のダイズ。
前記異なる改変が、（ｉ）グリシニンポリペプチド配列、（ｉｉ）コングリシニンポリペプチド配列、又は（ｉｉｉ）それらの組合せの含有量を減少させる、請求項６７に記載のダイズ種子。
前記ダイズが、少なくとも５０％のオレイン酸を含む、請求項１～６８のいずれか一項に記載のダイズ種子。
前記ダイズが、３％未満のリノレン酸を含む、請求項１～６９のいずれか一項に記載のダイズ種子。
前記ダイズが、天然ＦＡＤ２コード配列の発現をダウンレギュレートする導入遺伝子とＦＡＤ３遺伝子中の突然変異とを含む、請求項６９又は７０に記載のダイズ種子。
前記ダイズが１３％の水分で測定されるか、又は１３％の水分に調整されるとき、重量で少なくとも３７％のタンパク質を含む、請求項１～７１のいずれか一項に記載のダイズ種子。
前記ダイズ種子が種子タンパク質含有量を向上させるための改変を含み、前記改変が。（ｉ）ＣＣＴドメイン含有タンパク質、（ｉｉ）レティキュロン、（ｉｉｉ）トレハロースリン酸センターゼ、（ｉｖ）ＨＥＣＴユビキチンリガーゼ、（ｖ）ＭＦＴ（ｍｏｔｈｅｒｏｆｆｌｏｗｅｒｉｎｇ）ポリペプチド、及び（ｖｉ）ラフィノースシンターゼのうちの少なくとも１つをコードする遺伝子内にある、請求項７２に記載のダイズ種子。
請求項１～７３のいずれか一項に記載のダイズ種子から生育させた、植物。
請求項１～７３のいずれか一項に記載のダイズ種子から抽出したダイズミールを処理するための方法であって、前記ミールが多糖類を含み、前記方法が、前記ミールをセルラーゼ、ヘミセルラーゼ、及びペクチナーゼのうちの少なくとも１つと、前記ミール中の前記多糖類を分解させるのに十分な条件下で接触させることと、残渣から透過液を濾過することと、を含む、方法。
請求項１～７３のいずれか一項に記載の種子から生成されるダイズ単離物であって、前記単離物が総タンパク質の重量で少なくとも０．２％のレグヘモグロビンを含み、前記レグヘモグロビンの少なくとも約５０％が、鉄基でヘム化されている、ダイズ単離物。
請求項１～７３のいずれか一項に記載のダイズ種子から抽出されるミールであって、前記ミールが総タンパク質の重量で少なくとも０．１％のレグヘモグロビンを含む、ミール。
ダイズミール又は単離物を生産するための方法であって、前記方法が、レグヘモグロビンを含むダイズ種子を高オレイン酸を含むダイズ種子と組み合わせることと、前記種子を処理して前記ミール又は前記単離物を生産することと、を含み、前記ミール又は前記単離物がレグヘモグロビン及び高オレイン酸を含み、前記レグヘモグロビンの少なくとも約５０％が、鉄基でヘム化されている、方法。
レグヘモグロビンを生産するための方法であって、前記方法が、請求項７８に記載の方法によって生産されたミールからレグヘモグロビンを抽出することを含む、方法。