JP2013529083A

JP2013529083A - 新規のｄｎａ結合タンパク質及びその使用

Info

Publication number: JP2013529083A
Application number: JP2013511148A
Authority: JP
Inventors: ディー．グレゴリーフィリップ; シー．ミラージェフリー; パッションデイビッド; ジェイ．レバーエドワード; タンシュアン; ウルノフフョードル; チャンレイ
Original assignee: Sangamo Therapeutics Inc
Current assignee: Sangamo Therapeutics Inc
Priority date: 2010-05-17
Filing date: 2011-05-17
Publication date: 2013-07-18
Anticipated expiration: 2031-05-17
Also published as: US20190169640A1; US8586526B2; US9322005B2; US20170016030A1; US20140134741A1; IL222961B; US9783827B2; AU2011256838A1; IL222961A0; WO2011146121A1; CN103025344A; AU2011256838B2; CN103025344B; EP2571512B1; US11661612B2; JP6208580B2; US20220356493A1; US10253333B2; CA2798988C; CA2798988A1

Abstract

ＴＡＬＥＤＮＡ結合ドメインを含む新規のＤＮＡ結合ドメインを含む、ポリペプチド、それらをコードするポリヌクレオチド、細胞、及び生物が本明細書に開示される。内因性細胞配列の遺伝子発現及び／又はゲノム編集の調節のために、これらの新規のＤＮＡ結合ドメインを使用する方法も開示される。

Description

関連出願の相互参照
本出願は、２０１０年５月１７日出願の米国仮出願第６１／３９５，８３６号、２０１０年８月１２日出願の同第６１／４０１，４２９号、２０１０年１０月１３日出願の同第６１／４５５，１２１号、２０１０年１２月２０日出願の同第６１／４５９，８９１号、２０１１年２月２日出願の同第６１／４６２，４８２号、２０１１年３月２４日出願の同第６１／４６５，８６９号の利益を主張し、それらの開示は、参照によりその全体が本明細書に組み込まれる。

連邦政府支援の研究下でなされた発明に対する権利の声明文
該当なし

技術分野
本発明は、遺伝子操作されたＤＮＡ結合タンパク質を使用した内在性遺伝子及び他のゲノム遺伝子座の発現状態の遺伝的修飾及び制御のための方法を提供する。

発明の背景
多くの、恐らくほとんどの生理学的及び病態生理学的プロセスを、遺伝子発現の選択的上方又は下方制御によって制御することができる。選択的制御によって制御することができる病理学の例として、数例を挙げると、リウマチ性関節炎における炎症性サイトカインの不適切な発現、高コレステロール血症における肝臓ＬＤＬ受容体の過小発現、血管新生促進因子の過剰発現、及び固形腫瘍成長における抗血管新生因子の過小発現が挙げられる。加えて、ウイルス、細菌、真菌、及び原虫等の病原体を、それらの宿主細胞の遺伝子発現を変更することによって制御することができる。したがって、簡単に有益な遺伝子を上方制御し、かつ病原遺伝子を下方制御することができる治療的アプローチへの明らかに満たされていない必要性が存在する。

加えて、選択された遺伝子の選択的過剰及び過小発現を可能にする簡単な方法は、科学界にとって大変有用であろう。細胞モデル系、トランスジェニック動物、及びトランスジェニック植物における遺伝子の制御を可能にする方法は、学術研究所、製薬会社、ゲノミクス会社、及びバイオテクノロジー産業における広範な使用を見出すであろう。

遺伝子発現は、通常、転写因子と呼ばれる配列特異的ＤＮＡ結合タンパク質の機能の変更を介して制御される。それらは、プロモーターでの転写開始複合体の形成又は機能の効率に影響を与えるように作用する。転写因子は、正の様式（活性化）又は負の様式（抑制）で作用し得る。

転写因子の機能は、構成的（常に「オン」）又は条件付きであり得る。条件付きの機能は、様々な手段によって転写因子に与えられ得るが、これらの制御機構の大部分は、細胞質における因子の隔離及び誘導性放出、並びにそれに続く核転座、ＤＮＡ結合及び活性化（又は抑制）に依存する。この様式で機能する転写因子の例には、プロゲステロン受容体、ステロール応答要素結合タンパク質（ＳＲＥＢＰ）及びＮＦ−カッパＢが挙げられる。リン酸化に応答する転写因子又はそれらの同族ＤＮＡ認識配列に結合するそれらの能力を変更することによる小分子リガンドの例が存在する（Ｈｏｕｅｔａｌ．，Ｓｃｉｅｎｃｅ２５６：１７０１（１９９４）、Ｇｏｓｓｅｎ＆Ｂｕｊａｒｄ，Ｐｒｏｃ．Ｎａｔ’ｌＡｃａｄＳｃｉ８９：５５４７（１９９２）、Ｏｌｉｇｉｎｏｅｔａｌ．，ＧｅｎｅＴｈｅｒ．５：４９１−４９６（１９９８）、Ｗａｎｇｅｔａｌ．，ＧｅｎｅＴｈｅｒ．４：４３２−４４１（１９９７）、Ｎｅｅｒｉｎｇｅｔａｌ．，Ｂｌｏｏｄ８８：１１４７−１１５５（１９９６）、及びＲｅｎｄａｈｌｅｔａｌ．，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．１６：７５７−７６１（１９９８））。

亜鉛フィンガータンパク質（「ＺＦＰ」）由来のＤＮＡ結合ドメインを含む組換え転写因子は、内在性遺伝子の遺伝子発現を制御する能力を有する（例えば、米国特許第６，５３４，２６１号、同第６，５９９，６９２号、同第６，５０３，７１７号、同第６，６８９，５５８号、同第７，０６７，３１７号、同第７，２６２，０５４号を参照のこと）。亜鉛フィンガータンパク質を含有するこれらの遺伝子操作された転写因子を使用する臨床試験は、これらの新規の転写因子が種々の状態を治療することができることを示している（例えば、Ｙｕｅｔａｌ．（２００６）ＦＡＳＥＢＪ．２０：４７９−４８１を参照のこと）。

ゲノム生物学における別の目的とする主要分野は、特にいくつかのゲノムの完全なヌクレオチド配列の決定の観点から、ゲノム配列の標的化変更である。そのような標的化切断事象を、例えば、標的化変異誘発を誘導するために、細胞ＤＮＡ配列の標的化欠失を誘導するために、かつ所定の染色体遺伝子座で標的化組換えを促進するために使用することができる。例えば、米国特許公開第２００３０２３２４１０号、同第２００５０２０８４８９号、同第２００５００２６１５７号、同第２００５００６４４７４号、同第２００６０１８８９８７号、同第２００８０１５９９６号、及び国際公開第ＷＯ２００７／０１４２７５号を参照されたく、それらの開示は、全ての目的のために参照によりそれらの全体が組み込まれる。Ｓａｎｔｉａｇｏｅｔａｌ．（２００８）ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１０５：５８０９−５８１４、Ｐｅｒｅｚｅｔａｌ．（２００８）ＮａｔＢｉｏｔｅｃｈｎｏｌ２６：８０８−８１６（２００８）も参照されたい。

ヌクレアーゼの切断ドメインを設計されたＤＮＡ結合タンパク質（例えば、ＦｏｋＩ等由来のヌクレアーゼ切断ドメインに結合される亜鉛フィンガータンパク質（ＺＦＰ））に結合させる人工ヌクレアーゼは、真核細胞において標的化切断のために使用されている。例えば、亜鉛フィンガーヌクレアーゼ媒介性ゲノム編集は、（１）所望の修飾のための特に標的部位における生細胞のゲノム内での二本鎖切断（ＤＳＢ）の作成によって、かつ（２）ＤＮＡ修復の自然機構にこの切断を「修復」させることによって、特定の位置でヒトゲノムの配列を修飾することが示されている。

特異性を増大させるために、切断事象は、ＤＮＡ結合時に二量体化して、触媒的に活性なヌクレアーゼ複合体を形成する特注設計された亜鉛フィンガーヌクレアーゼの１つ以上の対を使用して誘導される。加えて、特異性は、ヘテロ二量体の形成時にのみ二本鎖ＤＮＡを切断する遺伝子操作された切断半ドメインを含む亜鉛フィンガーヌクレアーゼの１つ以上の対を使用することによってさらに増大されている。例えば、参照によりその全体が本明細書に組み込まれる、米国特許公開第２００８０１３１９６２号を参照されたい。

人工ヌクレアーゼによって作成される二本鎖切断（ＤＳＢ）は、例えば、標的化変異誘発を誘導するために、細胞ＤＮＡ配列の標的化欠失を誘導するために、かつ所定の染色体遺伝子座で標的化組換えを促進するために使用されている。例えば、米国特許公開第２００３０２３２４１０号、同第２００５０２０８４８９号、同第２００５００２６１５７号、同第２００５００６４４７４号、同第２００６０１８８９８７号、同第２００６００６３２３１号、同第２００７０２１８５２８号、同第２００７０１３４７９６号、同第２００８００１５１６４号、並びに国際公開第ＷＯ０７／０１４２７５号及び同第ＷＯ２００７／１３９９８２号を参照されたく、それらの開示は、全ての目的のために参照によりそれらの全体が組み込まれる。したがって、標的ゲノム位置でＤＳＢを生成する能力は、任意のゲノムのゲノム編集を可能にする。

ＤＳＢを修復する２つの主要なはっきりと異なる経路、相同組換え及び非相同末端結合（ＮＨＥＪ）が存在する。相同組換えは、細胞修復プロセスを誘導するために、テンプレート（「ドナー」として既知である）として相同配列の存在を必要とし、修復の結果は、エラーがなく、予測可能である。相同組換えのためのテンプレート（又は「ドナー」）配列の不在下で、細胞は、典型的には、エラーを起こしやすいＮＨＥＪプロセスを介してＤＳＢを修復しようと試みる。

キサントモナス属の植物病原菌は、重要な作物において多くの病害を引き起こすことで知られている。キサントモナスの病原性は、２５個を超える異なるエフェクタータンパク質を植物細胞に注入する保存されたＩＩＩ型分泌（Ｔ３Ｓ）系に依存する。これらの注入されるタンパク質の中には、植物転写活性化因子を模倣し、かつ植物トランスクリプトームを操作する転写活性化因子様のエフェクター「ＴＡＬＥ」又は「ＴＡＬ−エフェクター」）がある（Ｋａｙｅｔａｌ（２００７）Ｓｃｉｅｎｃｅ３１８：６４８−６５１を参照のこと）。これらのタンパク質は、ＤＮＡ結合ドメイン及び転写活性化ドメインを含有する。最もよく特性化されたＴＡＬＥのうちの１つは、トウガラシ斑点細菌病（Ｘａｎｔｈｏｍｏｎａｓｃａｍｐｅｓｔｒｉｓｐｖ．Ｖｅｓｉｃａｔｏｒｉａ）由来のＡｖｒＢｓ３である（Ｂｏｎａｓｅｔａｌ（１９８９）ＭｏｌＧｅｎＧｅｎｅｔ２１８：１２７−１３６及び国際公開第ＷＯ２０１００７９４３０号を参照のこと）。ＴＡＬＥは、ＤＮＡ認識を媒介する集中型反復ドメインを含有し、約３３〜３５個のアミノ酸を含有するそれぞれの反復単位は、１つの標的塩基を特定する。ＴＡＬＥは、核局在化配列及びいくつかの酸性転写活性化ドメインも含有する（総説については、ＳｃｈｏｒｎａｃｋＳ，ｅｔａｌ（２００６）ＪＰｌａｎｔＰｈｙｓｉｏｌ１６３（３）：２５６−２７２を参照のこと）。加えて、植物病原菌ラルストニア・ソラナセラムにおいて、ラルストニア・ソラナセラム次亜種１株ＧＭＩ１０００及び次亜種４株ＲＳ１０００におけるキサントモナスのＡｖｒＢｓ３ファミリーに相同のｂｒｇ１１及びｈｐｘ１７と指定される２つの遺伝子が見出されている（Ｈｅｕｅｒｅｔａｌ（２００７）ＡｐｐｌａｎｄＥｎｖｉｒＭｉｃｒｏ７３（１３）：４３７９−４３８４を参照のこと）。これらの遺伝子は、ヌクレオチド配列において相互に９８．９％同一であるが、ｈｐｘ１７の反復ドメインにおいて１，５７５ｂｐの欠失分だけ異なる。しかしながら、両方の遺伝子産物は、キサントモナスのＡｖｒＢｓ３ファミリータンパク質と４０％未満の配列同一性を有する。

これらのＴＡＬＥのＤＮＡ結合特異性は、タンデムＴＡＬＥ反復単位において見出される配列に依存する。反復配列は、約３３〜３５個のアミノ酸を含み、反復は、典型的には、相互に９１〜１００％相同である（Ｂｏｎａｓら、同書）。１２及び１３位の超可変ジ残基（ｈｙｐｅｒｖａｒｉａｂｌｅｄｉｒｅｓｉｄｕｅ）の同一性とＴＡＬＥの標的配列における隣接ヌクレオチドの同一性との間に一対一対応があるように見受けられる（ＭｏｓｃｏｕａｎｄＢｏｇｄａｎｏｖｅ（２００９）Ｓｃｉｅｎｃｅ３２６：１５０１及びＢｏｃｈｅｔａｌ（２００９）Ｓｃｉｅｎｃｅ３２６：１５０９−１５１２を参照のこと）。これらの２つの隣接アミノ酸は、反復可変ジ残基（ＲｅｐｅａｔＶａｒｉａｂｌｅＤｉｒｅｓｉｄｕｅ）（ＲＶＤ）と称される。実験的に、１２位及び１３位のＨＤ配列がシトシン（Ｃ）への結合につながり、ＮＧがＴに、ＮＩがＡに結合し、ＮＮがＧ又はＡに結合し、かつＮＧがＴに結合するように、これらのＴＡＬＥのＤＮＡ認識のための天然コードが決定されている。これらの特異性決定ＴＡＬＥ反復単位は、変異体ＴＡＬＥタンパク質を作製するために、天然ＴＡＬＥ反復単位と変更された数の反復との新たな組み合わせを伴ってタンパク質に組み立てられている。それらの天然構造にあるとき、これらの変異体は、新しい配列と相互作用し、かつ植物細胞におけるレポーター遺伝子の発現を活性化することができる（Ｂｏｃｈら、同書）。しかしながら、これらのタンパク質は、天然（全長）ＴＡＬＥタンパク質構造を維持し、構築物内のＴＡＬＥ反復単位の数及び同一性のみが変化した。全て又はほぼ全てのＴＡＬＥタンパク質はまた、ＴＡＬＥヌクレアーゼ融合タンパク質（「ＴＡＬＥＮ」）を作成するために、ＦｏｋＩタンパク質由来のヌクレアーゼドメインに融合しており、これらのＴＡＬＥＮが酵母細胞においてエピソームレポーター遺伝子を切断することが示されている（Ｃｈｒｉｓｔｉａｎｅｔａｌ．（２０１０）Ｇｅｎｅｔｉｃｓ１８６（２）：７５７−６１；Ｌｉｅｔａｌ．（２０１１ａ）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３９（１）：３５９−３７２）。そのような構築物はまた、適切な配列増幅スキームが採用されるとき、酵母細胞中の内在性遺伝子を定量化可能なレベルまで修飾することができ、哺乳類及び植物細胞中の内在性遺伝子を、検出可能であるが定量化不可能なレベルまで修飾することができる。Ｌｉｅｔａｌ．（２０１１ｂ）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．ｅｐｕｂｄｏｉ：１０．１０９３／ｎａｒ／ｇｋｒ１８８、Ｃｅｒｍａｋｅｔａｌ．（２０１１）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．ｅｐｕｂｄｏｉ：１０．１０９３／ｎａｒ／ｇｋｒ２１８を参照されたい。二段階濃縮スキームが植物及び動物細胞における活性を検出するために必要とされたという事実は、ほぼ全てのＴＡＬＥタンパク質とＦｏｋＩタンパク質由来のヌクレアーゼドメインとの間の融合物が植物及び動物細胞中の内在性遺伝子を効率的に修飾しないことを示す。言い換えると、ＴＡＬＥ反復配列をＦｏｋＩ切断ドメインに結合させるためのこれらの研究において使用されるペプチドは、高等真核生物における内在性遺伝子のＦｏｋＩドメインによる効率的な切断を許容しない。したがって、これらの研究は、内因性の真核性環境における高度に活性な切断を可能にするであろう、ＴＡＬＥ配列をヌクレアーゼドメインに結合させるために使用することができる組成物を開発する必要性を強調する。

様々な細胞型における内在性遺伝子の制御のための遺伝子操作された転写因子、並びに多数のモデル、診断及び治療体系、並びにあらゆる種類のゲノム遺伝子操作及び編集用途においても同様に使用することができる遺伝子操作されたヌクレアーゼを含む、様々な用途のためにこれらの結合タンパク質の範囲、特異性、及び有用性を増加させる遺伝子操作されたＤＮＡ結合ドメインの必要性が未だ存在する。

したがって、本発明は、内因性遺伝子座の発現状態又は配列の標的化操作の方法を提供する。本発明のいくつかの実施形態において、本発明の方法は、遺伝子操作された転写因子、遺伝子操作されたヌクレアーゼ（「ＴＡＬＥＮ」）、リコンビナーゼ、トランスポザーゼ、インテグラーゼ、メチラーゼ、酵素ドメイン、及びレポーターを形成するために、機能タンパク質ドメイン（集合的に「ＴＡＬＥ融合物」）に融合した１つ以上のＴＡＬＥ反復単位を含むＤＮＡ結合タンパク質を使用する。いくつかの態様において、ポリペプチドは、内因性標的ＤＮＡでの効率的かつ特異的な機能のために、さらなるＴＡＬＥタンパク質配列に結合される少なくとも１つのＴＡＬＥ反復単位を含む。ＴＡＬＥ反復ドメインのＮ末端及び任意でＣ末端に結合されるこれらのさらなる配列は、「Ｎキャップ」及び「Ｃキャップ」配列とも称される。したがって、本発明は、１つ以上（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０個以上）のＴＡＬＥ反復及び／又は半反復単位を含むポリペプチドを提供する。

したがって、一態様において、少なくとも１つのＴＡＬＥ反復単位（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個以上の反復単位（複数を含む））を含むＤＮＡ結合ポリペプチドが本明細書で提供される。ポリペプチドは、典型的には、ＴＡＬＥ反復（複数を含む）のＤＮＡ結合機能又はＴＡＬＥ融合タンパク質の機能活性を支援する任意の長さのＮキャップ配列（ポリペプチド）を含む。任意で、ポリペプチドは、Ｃキャップ配列（ポリペプチド）、例えば、約２５０個未満のアミノ酸のＣキャップ配列（Ｃ＋２３０Ｃキャップ、残基Ｃ−２０から残基Ｃ＋２３０まで）も含み得る。加えて、ある特定の実施形態において、本明細書に記載のＴＡＬＥポリペプチドのＴＡＬＥ反復単位のうちの少なくとも１つは、非定型の反復可変ジ残基（ＲＶＤ）領域を含む。ＴＡＬＥ反復単位は、キサントモナス、ラルストニア、又は別の関連細菌から単離された野生型ドメインであり得、かつ／又はいくつかの様式で遺伝子操作され得る（例えば、非自然発生であり得る）。ある特定の実施形態において、少なくとも１つのＴＡＬＥ反復単位は、遺伝子操作される（例えば、非自然発生、非定型、コドン最適化、それらの組み合わせ等）。ある特定の実施形態において、ＴＡＬＥ反復ドメイン内の１つ以上のアミノ酸（例えば、ＴＡＬＥ反復のうちの１つ内のＲＶＤ）は、ドメインが選択された標的配列（典型的には、自然発生ＴＡＬＥＤＮＡ結合ドメインによって結合される標的配列とは異なる）に結合するように変更される。他の実施形態では、少なくとも１つのＴＡＬＥ反復単位は、ＴＡＬＥ反復単位の４、１１、１２、１３、若しくは３２位のアミノ酸のうちのいくつか又は全てにおいて修飾される。いくつかの実施形態において、少なくとも１つのＴＡＬＥ反復単位は、１つのＴＡＬＥ反復単位の２、３、４、１１、１２、１３、２１、２３、２４、２５、２６、２７、２８、３０、３１、３２、３３、３４、若しくは３５位のアミノ酸のうちの１つ以上において修飾される。他の実施形態では、ＴＡＬＥ反復をコードする核酸は、ＤＮＡ配列が変更されるが、アミノ酸配列は変更されないように修飾される。いくつかの実施形態において、ＤＮＡ修飾は、コドン最適化のためである。さらなる実施形態において、少なくとも１つのＴＡＬＥ反復単位は、上述の修飾の組み合わせによって変更される。いくつかの実施形態において、いくつかの修飾されたＴＡＬＥ反復単位を含むＴＡＬＥタンパク質が提供される。自然発生及び非自然発生ＴＡＬＥ反復単位の組み合わせも提供される。好ましい実施形態では、（野生型又は遺伝子操作された）ＴＡＬＥタンパク質は、内因性標的ＤＮＡで効率的かつ特異的に機能するために、Ｎキャップ配列及び任意でＣキャップ配列をさらに含む。いくつかの実施形態において、Ｎキャップは、残基Ｎ＋１〜Ｎ＋１３６（残基番号付けスキームの説明については図１Ｂを参照のこと）、又はそれらの任意のフラグメントを含む。他の実施形態では、Ｃキャップは、残基Ｃ−２０〜Ｃ＋２８、Ｃ−２０〜Ｃ＋３９、Ｃ−２０〜Ｃ＋５５、若しくはＣ−２０〜Ｃ＋６３、又はそれらの任意の全長ＴＡＬＥＣ末端のフラグメントを含む。ある特定の実施形態において、ＴＡＬＥ反復ドメイン、並びにＮキャップ配列及び任意でＣキャップ配列を含むポリペプチドは、制御ドメイン又は機能ドメイン、例えば、転写活性化因子、転写抑制因子、ヌクレアーゼ、リコンビナーゼ、トランスポザーゼ、インテグラーゼ、メチラーゼ等をさらに含む。

これらのタンパク質をコードするポリヌクレオチドも薬学的組成物として提供される。加えて、本発明は、これらのタンパク質／ポリヌクレオチドを含み、かつ／又はこれらのタンパク質によって修飾（例えば、子孫に受け継がれるゲノム修飾）される宿主細胞、細胞株、及びトランスジェニック生物（例えば、植物、真菌、動物）を含む。例示的な細胞及び細胞株には、動物細胞（例えば、ヒトを含む哺乳類、幹細胞等の細胞）、植物細胞、細菌細胞、原虫細胞、魚細胞、又は真菌細胞が挙げられる。別の実施形態では、細胞は、哺乳類細胞である。これらのタンパク質及び／又はポリヌクレオチドを作成かつ使用する方法も提供される。

一態様において、１つ以上の異種ポリペプチドドメイン、例えば、機能（制御）ドメインに動作可能に結合される１つ以上の遺伝子操作されたＴＡＬＥ反復単位、Ｎキャップ配列、及び任意でＣキャップ配列を含む融合タンパク質が本明細書において提供される。遺伝子操作されたＴＡＬＥ反復を目的とする機能タンパク質ドメインに結合させるための任意の構造化リンカー又は可撓性リンカーとして、ＴＡＬＥ反復のモジュールを含むライブラリが提供される。機能タンパク質ドメイン（例えば、転写活性化因子、抑制因子、又はヌクレアーゼ）は、融合タンパク質のＣ末端若しくはＮ末端で位置付けされ得る。本明細書に記載の融合タンパク質を作製する方法も提供される。

本発明は、遺伝子操作されたＴＡＬＥ融合タンパク質に好適な標的配列（部位）を同定するための方法も提供する。いくつかの実施形態において、同定された標的部位は、天然ＴＡＬＥ標的配列と比較して、増加したグアニンヌクレオチド（「Ｇ」）数を有する。他の実施形態では、標的は、自然発生ＴＡＬＥタンパク質において典型的な隣接チミジンヌクレオチド（「Ｔ」）を必要としない。いくつかの実施形態において、遺伝子操作されたＴＡＬＥタンパク質での使用のために選択されるＲＶＤは、標的配列におけるＧヌクレオチドの認識のために、１つ以上のＮＫ（アスパラギン−リジン）ＲＶＤを含有する。自然に見出されるものとは異なる、ヌクレオチド塩基を認識することができる新規の（非自然発生）ＲＶＤが、本発明においてさらに提供される。非定型又は非自然発生ＲＶＤ（ＴＡＬＥ反復単位の１２位及び１３位のアミノ酸配列）の非限定的な例には、表３０Ａに示されるＲＶＤが挙げられ、例えば、Ｔを認識するＶＧ及びＩＡ、Ａ及びＴを認識するＲＧ、並びにＡ、Ｃ、及びＴを認識するＡＡが提供される。全てのヌクレオチド塩基（例えば、Ａ、Ｃ、Ｔ、及びＧ）と同等に相互作用することができるＲＶＤも提供される。本明細書に記載の組成物及び方法において有用なさらなるＲＶＤが、表２７に示される。

ユーザの選択によって、ＴＡＬＥヌクレアーゼ（「ＴＡＬＥＮ」）ヘテロ二量体による修飾の影響下にある核酸上の２つの標的部位の間の距離又はギャップ間隔を制約するか、又は制約しない方法も、本発明によって提供される。いくつかの実施形態において、ギャップ間隔が、１２〜１３個の塩基対に制約される一方で、他の実施形態では、遺伝子操作されたＴＡＬＥＮは、１２〜２１個の塩基対のギャップ間隔を含むＤＮＡ標的を切断するように設計される。いくつかの実施形態において、ＴＡＬＥＮヘテロ二量体は、それぞれの単量体結合部位の間に１〜３４個のヌクレオチドのギャップを含む配列を切断するように設計される。さらにさらなる実施形態では、ＴＡＬＥＮは、＋２８Ｃ末端切断（Ｃ＋２８Ｃキャップ）を含むＴＡＬＥＮ構造を利用することによって、１２又は１３個の塩基対ギャップを有する標的を切断するよう制約される。他の実施形態では、設計されたＴＡＬＥＮは、＋６３Ｃ末端切断を含むＴＡＬＥＮ構造を使用して、１２〜２１個の塩基対ギャップ間隔を含む標的核酸を切断するよう作製され、ギャップ間隔の要件の柔軟性のため、好適なＴＡＬＥＮ標的部位を同定することができる可能性を増加させる。いくつかの実施形態において、ＴＡＬＥＮは、Ｒ１／２反復がＴ以外のヌクレオチド塩基を標的とすることができるように、遺伝子操作されたＲ１／２反復を有する。

別の態様では、本発明は、遺伝子操作されたＴＡＬＥＤＮＡ結合ドメイン融合物のためのベクターを提供し、ベクターは、ＴＡＬＥ反復配列に隣接するＴＡＬＥＮキャップ及びＣキャップ配列並びに位置を含み、複数のＴＡＬＥ反復単位、リンカー配列、プロモーター、選択可能なマーカー、ポリアデニル化シグナル部位、機能タンパク質ドメイン等のクローニングを可能にする。特定のＴＡＬＥＤＮＡ結合ドメイン及びそれらのドメイン（例えば、ＴＡＬＥＮ）を含む融合タンパク質を即時に組み立てることができるように、（例えば、遺伝子操作された）少なくとも１つのＴＡＬＥ反復単位を含むモジュールアーカイブライブラリの構築方法も本発明によって本明細書で提供される。

さらに別の態様では、本発明は、細胞内の内因性細胞遺伝子の発現を調節する方法を提供し、本方法は、内因性細胞遺伝子内の第１の標的部位を、機能ドメイン（例えば、転写調節ドメイン）に融合した第１の遺伝子操作されたＴＡＬＥに接触させ、それによって、内因性細胞遺伝子の発現を調節する工程を含む。別の態様では、本発明は、細胞中の内因性細胞遺伝子の発現を調節する方法を提供し、本方法は、内因性細胞遺伝子内の標的部位を融合ＴＡＬＥタンパク質に接触させる工程を含み、ＴＡＬＥは、遺伝子操作されたＴＡＬＥ反復ドメインを含み、したがって、ＴＡＬＥが所望の配列に対して特異性を有する。いくつかの実施形態において、調節作用は、内在性遺伝子の発現を活性化することである。いくつかの実施形態において、内在性遺伝子の発現は阻害される。さらに別の実施形態では、内在性遺伝子の活性化又は抑制は、ＴＡＬＥ融合タンパク質の結合によって調節され、したがって、内因性活性化因子又は抑制因子が、目的とする遺伝子の制御領域に結合することができない。

一実施形態において、接触工程は、内因性細胞遺伝子内の第２の標的部位を、第２の遺伝子操作されたＴＡＬＥ融合タンパク質に接触させる工程をさらに含み、それによって、第２の内因性細胞遺伝子の発現を調節する。別の実施形態では、第１及び第２の標的部位は、隣接している。ある特定の実施形態において、第１及び第２の標的部位は、例えば、ＴＡＬＥ転写因子を使用して２つ以上の遺伝子の発現を調節するように、異なる遺伝子内に存在する。他の実施形態では、第１及び第２の標的部位は、例えば、同一の遺伝子内で切断するために１対のＴＡＬＥＮ融合タンパク質が使用されるとき、同一の遺伝子内に存在する。第１及び第２の標的部位は、塩基対（「ギャップ寸法」）、例えば、１〜２０個（又はその間の任意の数）又はさらにそれ以上の塩基対のうちのいずれかによって分離される。別の実施形態では、接触工程は、３つ以上の標的部位を接触させる工程をさらに含む。ある特定の実施形態において、２組の標的部位は、２対のＴＡＬＥＮによって接触され、２組の標的における特異的欠失又は挿入を作成するために使用される。別の実施形態では、第１のＴＡＬＥタンパク質は、制御又は機能ドメインを含む融合タンパク質である。別の実施形態では、第１のＴＡＬＥタンパク質は、少なくとも２つの制御又は機能ドメインを含む融合タンパク質である。別の実施形態では、第１及び第２のＴＡＬＥタンパク質は、それぞれ制御ドメインを含む融合タンパク質である。別の実施形態では、第１及び第２のＴＡＬＥタンパク質は、それぞれ少なくとも２つの制御ドメインを含む融合タンパク質である。１つ以上の機能ドメインは、ＴＡＬＥタンパク質の末端のいずれか（又は両方）に融合することができる。ＴＡＬＥ融合タンパク質のうちのいずれかは、これらのタンパク質をコードするポリヌクレオチドとして提供され得る。

さらに別の態様では、本発明は、ヌクレアーゼドメインを本明細書に記載のＴＡＬＥ反復ドメインに結合させるＣキャップのための組成物を提供し、結果として生じる融合タンパク質は、高度に活性なヌクレアーゼ機能を呈する。いくつかの実施形態において、Ｃキャップは、天然ＴＡＬＥＣ末端隣接配列由来のペプチド配列を含む。他の実施形態では、Ｃキャップは、ＴＡＬＥ反復ドメイン由来のペプチド配列を含む。さらに別の実施形態では、Ｃキャップは、ＴＡＬＥタンパク質に由来しない配列を含む。Ｃキャップは、キメラ構造も呈し得、例えば、天然ＴＡＬＥＣ末端隣接配列由来のペプチド配列及び／又はＴＡＬＥ反復ドメイン及び／又は非ＴＡＬＥポリペプチドを含む。

本明細書に記載の組成物又は方法のうちのいずれかにおいて、制御又は機能ドメインは、転写抑制因子、転写活性化因子、ヌクレアーゼドメイン、ＤＮＡメチルトランスフェラーゼ、タンパク質アセチルトランスフェラーゼ、タンパク質デアセチラーゼ、タンパク質メチルトランスフェラーゼ、タンパク質デアミナーゼ、タンパク質キナーゼ、及びタンパク質ホスファターゼからなる群から選択され得る。いくつかの態様において、機能ドメインは、後成的制御因子である。植物において、そのようなＴＡＬＥ融合物を、標準の技法を使用して異種交配させることによって除去することができる。そのような実施形態では、融合タンパク質は、非限定的な例として、ヒストンメチルトランスフェラーゼ、ＤＮＡメチルトランスフェラーゼ、又はヒストンデアセチラーゼ等の後成的制御因子を含むであろう。例えば、共同所有の米国特許第７，７８５，７９２号を参照されたい。

したがって、いくつかの態様において、ＴＡＬＥ融合タンパク質は、ヌクレアーゼドメイン（「ＴＡＬＥＮ」）に融合したＴＡＬＥ反復ドメインを含む。上述のように、いくつかの実施形態において、ＴＡＬＥ反復ドメインは、Ｎキャップ配列及び任意でＣキャップ配列にさらに融合する。他の実施形態では、ヌクレアーゼドメインは、ヌクレアーゼドメインの効率的な触媒機能を提供するリンカーペプチド配列を介して、Ｎキャップのアミノ末端又はＣキャップのカルボキシ末端のいずれかに結合される。ヌクレアーゼドメインは、自然発生し得るか、遺伝子操作され得るか、又は非自然発生し得る。いくつかの実施形態において、ヌクレアーゼドメインは、ＩＩＳ型ヌクレアーゼ（例えば、ＦｏｋＩ）に由来する。他の実施形態では、ＴＡＬＥＤＮＡ結合ドメインは、ＢｆｉＩヌクレアーゼドメインに動作可能に結合される。いくつかの実施形態において、ＦｏｋＩドメインは、２つの切断半ドメインを含む一本鎖ヌクレアーゼドメインであり、他の実施形態では、ＦｏｋＩ切断半ドメインである。本発明のいくつかの態様において、単一のＴＡＬＥＮタンパク質が、標的ＤＮＡにおいて二本鎖切断を誘導するために単独で使用される一方で、他の実施形態では、ＴＡＬＥＮは、１対のヌクレアーゼの一部として使用される。いくつかの実施形態において、対が、ＦｏｋＩ半ドメインを含む２つのＴＡＬＥＮを含み、ＤＮＡ切断を達成するためにＦｏｋＩ半ドメインの対形成が必要とされる一方で、他の場合においては、ＴＡＬＥＮタンパク質は、亜鉛フィンガーヌクレアーゼと組み合わせて使用され、ＤＮＡ切断を達成するために２つのＦｏｋＩ切断ドメインの対形成が必要とされる。いくつかの実施形態において、ＴＡＬＥＤＮＡ結合ドメインは、亜鉛フィンガーに融合して、亜鉛フィンガー／ＴＡＬＥハイブリッドＤＮＡ結合ドメインを作製する。いくつかの事例において、ハイブリッドＤＮＡ結合ドメインは、ＤＮＡ標的結合部位内でのＤＮＡ塩基の内部ストレッチとの相互作用を省略することができる。いくつかの実施形態において、ＦｏｋＩドメインは、ホモ二量体を形成することができ、他の事例において、ＴＡＬＥＮ対のそれぞれのメンバー由来の２つの同一でないＦｏｋＩ切断ドメインのヘテロ二量体化が、標的化切断活性に必要とされる。これらのヘテロ二量体のＴＡＬＥＮ対において、同一の種類の２つのＦｏｋＩドメインは、生産的にホモ二量体化することができない。他の実施形態では、ＴＡＬＥＮ対が使用され、１つのＦｏｋＩ切断ドメインは、対形成が生じ得るように不活性であるが、標的ＤＮＡは、両方の鎖を切断するというよりはむしろ、ＤＮＡ分子の一方の鎖上に切れ目を作成するように切れ目が入れられる。

本明細書に記載の組成物又は方法のうちのいずれかにおいて、ＴＡＬＥ融合タンパク質は、ＴＡＬＥ融合タンパク質核酸によってコードされ得る。ある特定の実施形態において、ＴＡＬＥ融合タンパク質をコードする配列は、プロモーターに動作可能に結合される。したがって、ある特定の実施形態において、内在性遺伝子発現又はゲノム修飾を調節する方法は、細胞にＴＡＬＥタンパク質をコードする核酸を最初に投与する工程をさらに含む。ＴＡＬＥ融合タンパク質は、レトロウイルス発現ベクター、アデノウイルス発現ベクター、ＤＮＡプラスミド発現ベクター、又はＡＡＶ発現ベクター等の発現ベクターから発現され得る。いくつかの実施形態において、発現ベクターは、レンチウイルスベクターであり、これらの実施形態のうちのいずれかでは、レンチウイルスベクターは、インテグラーゼを欠いている。

任意の細胞型の任意の所望の標的遺伝子座（例えば、内在性遺伝子）に特異的なＴＡＬＥＮ（例えば、ＴＡＬＥＮ対）も、本発明において提供される。非限定的な例には、ＮＴＦ３、ＶＥＧＦ、ＣＣＲ５、ＩＬ２Ｒγ、ＢＡＸ、ＢＡＫ、ＦＵＴ８、ＧＲ、ＤＨＦＲ、ＣＸＣＲ４、ＧＳ、Ｒｏｓａ２６、ＡＡＶＳ１（ＰＰＰ１Ｒ１２Ｃ）、ＭＨＣ遺伝子、ＰＩＴＸ３、ｂｅｎ−１、Ｐｏｕ５Ｆ１（ＯＣＴ４）、Ｃ１、ＲＰＤ１等に特異的なＴＡＬＥＮが挙げられる。

本明細書に記載のＴＡＬＥ反復ドメインは、内因性細胞遺伝子の転写開始部位の上流、又はそれに隣接した標的部位に結合し得る。あるいは、標的部位は、内因性細胞遺伝子の転写開始部位の下流のＲＮＡポリメラーゼ休止部位に隣接し得る。さらにさらなる実施形態では、ＴＡＬＥ融合タンパク質（例えば、ＴＡＬＥＮ）は、遺伝子のコード配列内の部位、又は例えば、リーダー配列、トレーラー配列、若しくはイントロン等の遺伝子内若しくは遺伝子に隣接した非コード配列内の部位、又はコード領域の上流若しくは下流のいずれかの非転写領域内の部位に結合する。

別の態様では、細胞内の１つ以上の目的とする遺伝子を切断するための方法が本明細書に記載されており、本方法は、（ａ）ＴＡＬＥＮタンパク質（複数を含む）が発現されて、１つ以上の遺伝子が切断されるような条件下で、細胞に、１つ以上の遺伝子内の標的部位に結合する１つ以上のＴＡＬＥＮタンパク質（複数を含む）（又はＴＡＬＥＮをコードするポリヌクレオチド）を導入することを含む。２つ以上のＴＡＬＥＮタンパク質が導入される実施形態において、１つ、いくつか、若しくは全てをポリヌクレオチド又はポリペプチドとして導入してもよい。いくつかの態様において、該遺伝子切断は、標的化遺伝子の機能的破壊をもたらす。標的化ＤＮＡの切断は、ＮＨＥＪの後に続き得、わずかな挿入又は欠失（インデル）が切断部位で挿入される。次いで、これらのインデルは、切断位置での非特異的変異の導入を介して機能的破壊を引き起こす。

さらに別の態様では、細胞のゲノムに外因性配列を導入するための方法が本明細書に記載されており、本方法は、（ａ）ＴＡＬＥＮタンパク質（複数を含む）が発現され、遺伝子内の１つ以上の標的部位が切断されるような条件下で、細胞に、標的遺伝子内の標的部位に結合する１つ以上のＴＡＬＥＮタンパク質（複数を含む）（又はＴＡＬＥＮタンパク質（複数を含む）をコードするポリヌクレオチド）を導入する工程、及び（ｂ）細胞を外因性ポリヌクレオチドに接触させる工程を含み、したがって、ＤＮＡ標的部位（複数を含む）の切断が相同組換えによる外因性ポリヌクレオチドのゲノムへの組込みを刺激する。ある特定の実施形態において、外因性ポリヌクレオチドは、ゲノムに物理的に組み込まれる。他の実施形態では、外因性ポリヌクレオチドは、二本鎖切断の相同指向修復（ＨＤＲ）に関連付けられる特殊化された核酸複製プロセスを介する宿主細胞ゲノムへの外因性配列のコピーによってゲノムに組み込まれる。さらに他の実施形態では、ゲノムへの組込みは、非相同依存性標的組込み（例えば「末端捕捉」）を介して生じる。いくつかの実施形態において、外因性ポリヌクレオチドは、同族リコンビナーゼ（例えば、それぞれ、Ｃｒｅ又はＦＲＴ）による認識のために、リコンビナーゼ認識部位（例えば、ｌｏｘＰ又はＦＬＰ）を含む。ある特定の実施形態において、外因性配列は、小動物（例えば、ウサギ、又はマウス、ラット等の齧歯類）のゲノムに組み込まれる。一実施形態において、ＴＡＬＥ融合タンパク質は、トランスポザーゼ、リコンビナーゼ、又はインテグラーゼを含み、ＴＡＬＥ反復ドメインは、特異的に所望される標的配列を認識するために遺伝子操作されている。いくつかの実施形態において、ＴＡＬＥポリペプチドが使用される。いくつかの態様において、ＴＡＬＥ融合タンパク質は、トランスポザーゼ又はインテグラーゼを含み、ＣＨＯ細胞特異的トランスポザーゼ／インテグラーゼ系の開発のために使用される。

いくつかの実施形態において、ＴＡＬＥ融合タンパク質は、メチルトランスフェラーゼを含み、ＴＡＬＥ反復ドメインは、特異的に所望される標的配列を認識するために遺伝子操作されている。いくつかの実施形態において、ＴＡＬＥ反復ドメインは、ゲノム又はクロマチンの後成的修飾に作用する機能を果たすタンパク質複合体のサブユニットに融合する。

さらにさらなる実施形態において、そのＴＡＬＥ融合は、レポーター又は選択マーカーをさらに含み、ＴＡＬＥ反復ドメインは、特異的に所望される標的配列を認識するために遺伝子操作されている。いくつかの態様において、レポーターが蛍光マーカーである一方で、他の態様では、レポーターは、酵素である。

別の態様では、ＴＡＬＥ融合タンパク質のうちの１つ以上を含む組成物が本明細書に記載される。ある特定の実施形態において、組成物は、薬学的に許容される賦形剤との組み合わせで１つ以上のＴＡＬＥ融合タンパク質を含む。いくつかの実施形態において、組成物は、ＴＡＬＥ融合タンパク質をコードするポリヌクレオチドを含む。いくつかの実施形態は、ＴＡＬＥＮをコードするＤＮＡ分子を含む組成物を含む。他の実施形態では、組成物は、ＴＡＬＥＮをコードするＲＮＡ分子を含む。いくつかの組成物は、核酸ドナー分子をさらに含む。

別の態様では、本明細書に記載の１つ以上のＴＡＬＥ融合タンパク質をコードするポリヌクレオチドが本明細書に記載される。ポリヌクレオチドは、例えば、ｍＲＮＡであり得る。

別の態様では、プロモーター（例えば、構成的、誘導的、組織特異的等）に動作可能に結合される本明細書に記載の１つ以上のＴＡＬＥ融合タンパク質をコードするポリヌクレオチドを含むＴＡＬＥ融合タンパク質発現ベクターが本明細書に記載される。

別の態様では、１つ以上のＴＡＬＥ融合タンパク質及び／又は１つ以上のポリヌクレオチド（例えば、本明細書に記載のＴＡＬＥ融合タンパク質をコードする発現ベクター）を含む宿主細胞が本明細書に記載される。ある特定の実施形態において、宿主細胞は、１つ以上の亜鉛フィンガータンパク質及び／又はベクターをコードするＺＦＰをさらに含む。宿主細胞は、これらのタンパク質発現ベクターのうちの１つ以上で安定的に形質転換され得るか、又は一時的にトランスフェクトされ得るか、又はそれらの組み合わせであり得る。他の実施形態では、１つ以上のタンパク質発現ベクターは、宿主細胞において１つ以上の融合タンパク質を発現する。別の実施形態では、宿主細胞は、外因性ポリヌクレオチドドナー配列をさらに含む。細菌、植物、魚、酵母、藻、昆虫、寄生虫、又は哺乳類細胞を含むが、それらに限定されない任意の原核又は真核宿主細胞を採用することができる。いくつかの実施形態において、宿主細胞は、植物細胞である。他の態様では、宿主細胞は、植物の栄養部分、貯蔵器官、果実、花及び／又は種子組織等の植物組織の一部である。さらなる実施形態において、宿主細胞は、藻細胞である。他の実施形態では、宿主細胞は、線維芽細胞である。本明細書に記載の実施形態のうちのいずれかにおいて、宿主細胞は、幹細胞、例えば、胚幹細胞を含み得る。幹細胞は、哺乳類幹細胞、例えば、造血幹細胞、間葉幹細胞、胚幹細胞、神経幹細胞、筋肉幹細胞、肝幹細胞、皮膚幹細胞、誘導性多能性幹細胞、及び／又はそれらの組み合わせであり得る。ある特定の実施形態において、幹細胞は、ヒト誘導性多能性幹細胞（ｈｉＰＳＣ）又はヒト胚幹細胞（ｈＥＳＣ）である。本明細書に記載の実施形態のうちのいずれかにおいて、宿主細胞は、胚細胞、例えば、マウス、ラット、ウサギ、又は他の哺乳動物細胞の１つ以上の胚を含み得る。いくつかの態様において、幹細胞又は胚細胞は、例えば、変異が遺伝的であるように生殖系列に組み込まれるＴＡＬＥ媒介性ゲノム修飾を有する動物を含むトランスジェニック動物の開発において使用される。さらなる態様では、これらのトランスジェニック動物、すなわち、マウス、ラット、ウサギが、研究目的で使用される一方で、他の態様では、トランスジェニック動物は、家畜動物、すなわち、ウシ、ニワトリ、ブタ、ヒツジ等である。さらにさらなる態様では、トランスジェニック動物、すなわち、ヤギ、ウシ、ニワトリ、ブタは、治療目的のために使用される動物であり、他の態様では、トランスジェニック動物は、ペット、すなわち、ネコ、イヌ、ウマ、鳥、又は魚である。

本発明によって提供される別の態様は、ＴＡＬＥ結合に好適な核酸標的を同定するための方法である。いくつかの実施形態において、典型的な自然発生ＴＡＬＥタンパク質によって使用される標的は、標的部位へのその類似性に基づいて選択される。他の実施形態では、遺伝子操作されたＴＡＬＥタンパク質が、非定型の標的配列と相互作用できるようにするように変更されているため、典型的な自然発生ＴＡＬＥタンパク質によって利用されない標的が選択される。いくつかの実施形態において、この変更は、非定型の（非自然発生又は稀な）ＲＶＤ配列の選択を伴う。さらなる実施形態において、使用される非定型のＲＶＤは、所望の標的配列におけるＧ残基の認識のための「ＮＫ」ＲＶＤである。他の実施形態では、遺伝子操作されたＴＡＬＥタンパク質が、核酸塩基の非天然比率と相互作用できるようにするように変更されているため、核酸塩基の非天然比率を含有する標的が選択される。いくつかの実施形態において、所望の標的配列における塩基の比率は、異常な数のＧ残基を含む。他の実施形態では、所望の標的配列における塩基の比率は、異常な数の非定型のジヌクレオチド、トリヌクレオチド、又はテトラヌクレオチドを含む。ＴＡＬＥ−ＤＮＡ結合相互作用に最も最適な標的を同定するための設計ルールがさらに提供される。これらのルールは、最適なジヌクレオチド及びトリヌクレオチド対を含む標的部位配列の選択の指針を提供する。加えて、これらのルールは、当業者が、所望の場合、これらの配列を回避し得るように、より最適性の低いジヌクレオチド及びトリヌクレオチド対の指針も提供する。標的配列の選択の際にユーザにより高い柔軟性を提供するために、全てのヌクレオチドと相互作用することができるＲＶＤも提供される。

一態様において、本発明は、インビボでのゲノム操作のための組成物及び方法を提供する。ある特定の実施形態において、ＴＡＬＥＮをコードするｍＲＮＡは、所望の場合、特定のＤＳＢを導入するために、生殖腺、卵子、又は胚に注入され得る。いくつかの実施形態において、ドナーヌクレオチドは、生物における特定の標的組込みを引き起こすために、ＴＡＬＥＮｍＲＮＡとともに共送達される。

さらにさらなる態様では、本発明のＴＡＬＥドメインタンパク質（及びこれらのＴＡＬＥ反復タンパク質を含む融合タンパク質）を含むキットが本明細書において提供される。これらのキットは、ユーザによるゲノム操作を促進するために使用され得るため、例えば、ゲノム内の所望の標的又はセーフハーバー遺伝子座を切断するＴＡＬＥＮを提供することができる。ＴＡＬＥＮを、核酸（例えば、ＤＮＡ若しくはＲＮＡ）又はタンパク質のいずれかとして提供することができる。いくつかの事例において、タンパク質を、安定性を増加させるように製剤化することができるか、又は乾燥形態で提供することができる。いくつかの事例において、キットは、診断目的のために使用される。いくつかの事例において、キットに含まれるＴＡＬＥ融合物は、転写制御因子である。いくつかの事例において、ＴＡＬＥ融合物は、レポーターを含む。

パネルＡは、ＴＡＬＥタンパク質を示す。図１Ａは、ＴＡＬＥタンパク質のドメイン構造の概略図を示す（原寸に比例して描写されていない）。「Ｎ」及び「Ｃ」は、それぞれ、アミノ末端及びカルボキシ末端を示す。ＴＡＬＥ反復ドメイン、Ｎキャップ、及びＣキャップが表示され、このタンパク質におけるＮキャップ及びＣキャップの残基番号付けスキームが示される。「Ｒ０」は、ＴＡＬＥ反復単位といくつかの構造的相同性を共有することができ、かつＤＮＡ標的配列においてチミンを特定することができる第１のタンデムＴＡＬＥ反復に先行する３４個のアミノ酸を表す。「Ｒ_1/2」は、典型的なＴＡＬＥ反復の最初の２０個の残基との相同性を有する、（残基がＣ−２０からＣ−１まで番号付けされた）２０個の残基のペプチド配列であるＣ末端ＴＡＬＥ「半反復」を意味する。ＮＬＳは、核局在化配列である。ＡＤは、酸性活性化ドメインである。

パネルＢは、ＴＡＬＥタンパク質を示す。図１Ｂ（配列番号１３５）は、１〜１５２個のＮ末端アミノ酸残基を欠失させるように設計されたクローニングスキームで単離された、クローニングされた天然ＴＡＬＥタンパク質（以下、「ＴＡＬＥ１３」と称される）の一次配列を示す。Ｎキャップ及びＣキャップは、配列の下に黒色の太線によって示され、Ｎキャップにおける位置Ｎ＋１及びＮ＋１３６並びにＣキャップにおける位置Ｃ＋１及びＣ＋２７８が示される。半反復は、Ｃキャップの最初の２０個の残基であり、「Ｃ＋１」で示される位置の直前で終わる。ＴＡＬＥ反復及び半反復における下線を引いた残基は、標的結合中の反復によって接触されるＤＮＡヌクレオチドを特定するアミノ酸（ＲＶＤ）を示す。

パネルＡ及びＢは、ＴＡＬＥ１３（ＴＲ１３）の予測標的とともに使用するためのレポーター構築物を示す。図２Ａ（配列番号１３６）は、１〜４個のＴＲ１３標的をベクターに挿入するために使用されるクローニング部位を示すレポーターベクターの概略図を示す。斜字体の領域は、ルシフェラーゼ遺伝子のプロモーター領域である。図２Ｂ（配列番号１３７）は、２個のＴＲ１３標的を含有する、使用されたリンカー配列を示す。

パネルＡ及びＢは、０〜４個のＴＲ１３標的を含有するレポーター構築物の概略図（図３Ａ）、及びそれぞれ、Ｒ１３ｘ１〜Ｒ１３ｘ４で示される、１〜４個のＴＲ１３標的を含有するルシフェラーゼレポーター構築物上でのＴＡＬＥ１３−ＶＰ１６融合タンパク質（ＴＲ１３−ＶＰ１６、ＶＰ１６由来の活性化ドメインに結合されるＴＡＬＥ１３）による相乗的なレポーター遺伝子活性化（図３Ｂ）を示す。ｐＧＬ３は、任意のＴＲ１３標的要素を欠如している対照レポーターベクターである。

パネルＡ及びＢは、ＴＡＬＥＶＰ１６融合タンパク質によるレポーター遺伝子活性化を示す。図４Ａは、ＶＰ１６ドメイン並びに本研究において使用したレポーター構築物の付加を有するか、又は有さないＴＡＬＥタンパク質の概略図である。Ｒ１３×２が、ＴＡＬＥ１３（ＴＲ１３）標的のうちの２つが挿入される構築物を示す一方で、Ｒ１５×２は、ＴＡＬＥ１５（ＴＲ１５）標的のうちの２つが挿入される構築物を示す。図４Ｂは、ＴＡＬＥタンパク質単独ではなく、ＶＰ１６融合を有するＴＡＬＥタンパク質によるレポーター遺伝子活性化を示す。したがって、ＴＡＬＥタンパク質中に存在する天然転写活性化ドメインは、このアッセイでは、哺乳類細胞において機能的ではなかった。さらに、観察された転写活性は、正しい標的がそれらの対応するＴＡＬＥＶＰ１６融合物と一致するときのみ、レポーター遺伝子活性化が生じるため、特異的であった。クローニングされたＴＡＬＥ１３及びＴＡＬＥ１５は、それぞれ、ＴＲ１３及びＴＲ１５で示される。ＴＲ１３−ＶＰ１６及びＴＲ１５−ＶＰ１６は、それらのＣ末端に融合したさらなるＶＰ１６活性化ドメインを有するＴＲ１３及びＴＲ１５に類似している。

パネルＡ及びＢは、プロモーターに対する標的配列配置の位置効果を示す。図５Ａは、標的配列がＳＶ４０プロモーターに対して近位（Ｒ１３×４）又は遠位（Ｒ１３×４Ｄ）のいずれかで配置されるレポーター構築物の概略図を示す。図５Ｂは、示されるＴＡＬＥによるレポーター遺伝子活性化を示す。「ｎＲ１３Ｖ−ｄ１４５Ｃ」が、ＳＶ４０核局在化配列、１４５個のアミノ酸残基がＣ末端から欠失したＴＲ１３配列（Ｃ＋１３３Ｃキャップを産出する）、及びＶＰ１６活性化ドメインを含有する発現構築物を指す一方で、「Ｒ１３−ＶＰ１６」は、ＴＡＬＥ１３配列及びＶＰ１６活性化ドメインを含有する発現構築物を指す。示されるように、（ｉ）全長ＴＡＬＥの１４５個のＣ末端アミノ酸は、レポーター遺伝子活性化に必要とされず、（ｉｉ）標的配列がプロモーター配列の近位に配置されるとき、レポーター遺伝子活性化が最も高い。

パネルＡ及びＢは、ＴＡＬＥ融合物を用いたレポーター遺伝子（ルシフェラーゼ）活性化を示すグラフである。図６Ａは、遺伝子操作されたＴＡＬＥ１８タンパク質（ここではＲ２３５７０、後の図ではＮＴ−Ｌと称される）を含む融合タンパク質を用いたレポーター遺伝子の活性化を示す。レポーター構築物は、ルシフェラーゼ遺伝子の上流で遺伝子操作されたＴＡＬＥ１８標的の２つのコピーを含有する。このレポーターの活性化は、１７．５個の遺伝子操作された反復配列（１７個の全ＴＡＬＥ反復及び１個の半反復）、ＴＲ１３のタンデムＴＡＬＥ反復に隣接するＮ及びＣ末端配列（Ｎキャップ及びＣキャップ）、並びにＶＰ１６活性化ドメインを含有するＲ２３５７０Ｖでのみ観察される。Ｎ末端隣接配列及びＣ末端隣接配列（Ｎキャップ及びＣキャップ）の両方の欠失は、活性を無効にする（ｎＲ２３５７０Ｓ−ｄＮＣを偽構築物と比較する）。ｎＲ２３５７０Ｓ−ｄＮＣは、ＳＶ４０ＮＬＳ（ｎ）、単一のｐ６５活性化ドメイン（Ｓ）に融合した１７．５個の遺伝子操作されたＴＡＬＥ反復配列を含有するが、ＴＡＬＥ由来のＮ末端配列及びＣ末端配列（Ｎキャップ及びＣキャップ）を欠如している（ｄＮＣ）。ｎＲ２３５７０ＳＳ−ｄＮＣは、２つのｐ６５ドメインを有することを除いて、ｎＲ２３５７０Ｓ−ｄＮＣと同一である。Ｒ０−ＶＰ１６構築物は、Ｒ２３５７０と同一であるが、タンデムＴＡＬＥ反復を欠如している。「偽」は、発現構築物を欠如した実験の結果を示す。図６Ｂは、遺伝子操作された（非自然発生）ＴＡＬＥ１８ドメインを含む融合タンパク質による、その染色体環境における内在性遺伝子の活性化を示す。ＮＴＦ３遺伝子を標的とするように設計された遺伝子操作されたＴＡＬＥ１８（Ｒ２３５７０Ｖ）は、内因性ＮＴＦ３ｍＲＮＡレベルの実質的な増加をもたらし得る。同一の条件下において、ＮＴＦ３ｍＲＮＡの発現は、Ｒ０−ＶＰ１６又はＧＦＰのいずれによっても影響を及ぼされない。Ｒ２３５７０Ｖ及びＲ０−ＶＰ１６は、上述のように説明される。

パネルＡ〜Ｄは、さらなる例示的なＮＴＦ３特異的ＴＡＬＥ転写因子融合物を示す。図７Ａは、ＮＴＦ３プロモーター（配列番号１３８）における例示的なタンパク質及びそれらの標的の図解を示す。２つのＴＡＬＥ転写因子変異体は、ＶＰ１６活性化ドメインに結合され、ＨＥＫ２９３細胞中で発現された。下の配列は、ヒトＮＴＦ３のプロモーター近位領域を示す。下線を引いた塩基は、ＮＴ−ＬＴＡＬＥ反復ドメインの標的部位を示す。鉤状矢印は、ＮＴＦ３転写の開始部位を示す。図７Ｂは、図７Ａに描かれた上のタンパク質又は下のタンパク質のいずれかを発現するＨＥＫ２９３細胞における相対ＮＴＦ３ｍＲＮＡレベルを示す。「ｅＧＦＰ」は、強化されたＧＦＰを発現する対照プラスミドでトランスフェクトされた細胞を示す。測定を４重に行い、エラーバーは、標準偏差を示す。図７Ｃは、図７Ａに描かれた上のタンパク質又は下のタンパク質のいずれかを発現するＨＥＫ２９３細胞から分泌されるＮＴＦ３タンパク質のレベルを示す。ＥＬＩＳＡアッセイを用いて測定を２重に行い、エラーバーは、標準偏差を示す。「負」は、空ベクター対照でトランスフェクトされた細胞を示す。図７Ｄは、ＲＶＤ（文字の一番上の列）、予想される結合部位（文字の２番目の列）、及びＮＴ−ＬのＳＥＬＥＸ由来の塩基頻度マトリックス（一番下のグラフ）を示す。マトリックスの１番目及び５番目の位置を除いて、最も頻繁に選択された塩基は、標的遺伝子座配列と一致する。

パネルＡ及びＢは、ＥＬＩＳＡによってアッセイされた、種々の遺伝子操作されたＴＡＬＥＤＮＡ結合ドメインの一連のＮ末端及びＣ末端切断物のＤＮＡ結合能力を示すグラフである。図８Ａは、９．５個のＴＡＬＥ反復を含むＮＴ３特異的ＴＡＬＥＤＮＡ結合ドメインのデータを示し、図８Ｂは、９．５個のＴＡＬＥ反復を含むＶＥＧＦ特異的ＴＡＬＥＤＮＡ結合ドメインのデータを示す。両方の組のデータについて、Ｎ末端切断が行われたとき、Ｃ末端は、Ｃ＋９５位で維持された一方で、Ｃ末端切断では、Ｎ末端は、Ｎ＋１３７位で維持された（これらの構築物は、Ｎ＋１３６Ｎキャップ残基に付加されるメチオニン残基を有する）。見られるように、両方のタンパク質は、タンパク質がＮ＋１３４位よりも離れたＮ末端で切断されたときに、このアッセイの条件下で、相対ＤＮＡ結合親和性の明らかな減少を示した。さらに、両方のタンパク質は、Ｃ末端がアミノ酸Ｃ＋５４を超えて切断されたときに、このアッセイの条件下で、相対ＤＮＡ結合親和性の明らかな減少を示した。

パネルＡ及びＢは、ＥＬＩＳＡによってアッセイされた、上述の一連のＮ末端及びＣ末端切断物のＤＮＡ結合活性を示す。図９Ａにおいて、ＮＴＦ３特異的ＴＡＬＥＤＮＡ結合ドメインについてのデータが示されるが、この場合、Ｎ末端切断を試験したとき、Ｃ末端は、Ｃ＋５４位で維持された。Ｃ末端切断について、Ｎ末端アミノ酸は、Ｎ＋１３４位であった。図９Ｂにおいて、ＶＥＧＦ特異的ＴＡＬＥＤＮＡ結合ドメインについてのデータが示される。示されるように、Ｎ末端及びＣ末端は、図９Ａについて上で説明されるように維持された。

活性に関与するＴＡＬＥ機能ドメインの解離を示す。表１６において説明されるように示される構築物によるレポーター遺伝子活性化の活性を調査した。結果は、（ｉ）Ｎ末端１５２個のアミノ酸及びＣ末端１８３個のアミノ酸が、このアッセイにおいて、強力な機能に必要ではないこと、かつ（ｉｉ）Ｒ０領域及びロイシン豊富なドメインを含むタンデムＴＡＬＥ反復に隣接する配列が、このアッセイにおいて、細胞における機能活性を回復することを示す。第１のＴＡＬＥ反復に先行するＮ末端配列又は最後の反復に続くＣ末端配列のいずれかの欠失は、このアッセイにおいて、機能活性を無効にする。Ｒ１３Ｖ−ｄ１４５Ｃは、Ｃ＋１３３Ｃキャップを有し、Ｒ１３Ｖ−ｄ１８２Ｃは、Ｃ＋９５Ｃキャップを有し、Ｒ１３Ｖ−ｄＣは、Ｃ＋２２Ｃキャップを有し、ｎＲ１３Ｖ−ｄＮは、Ｎ＋８Ｎキャップを有し、ｎＲ１３Ｖ−ｄ２２３Ｎは、Ｎ＋５２Ｎキャップを有し、ｎＲ１３Ｖ−ｄ２４０は、Ｎ＋３４Ｎキャップを有する。

パネルＡ及びＢは、Ｋ５６２細胞におけるＦｏｋＩドメインの２つのコピーに結合されたＴＡＬＥ１３のヌクレアーゼ活性を示す。図１１Ａは、哺乳類細胞におけるヌクレアーゼ活性を検出するための一本鎖アニーリングに基づくレポーターアッセイ（ＳＳＡ）の概略図を示す。このアッセイにおけるレポーター構築物（ＳＳＡ−Ｒ１３）は、ＴＡＬＥ１３標的を含有し、ＧＦＰコード配列のＮ末端部分（ＧＦ）とＣ末端部分（ＦＰ）との間に挟まれている。プラスミドＳＳＡ−Ｒ１３は、ＧＦＰ発現を単独で駆動することができないが、Ｒ１３標的の切断は、ＧＦＰのＮ末端（ＧＦ）部分とＣ末端（ＦＰ）部分との間の相同組換えを促進して、機能的ＧＦＰを形成する。したがって、ＴＡＬＥＮタンパク質のヌクレアーゼ活性を、ＧＦＰ陽性細胞の割合を分析することによって評価した。図１１Ｂは、ＴＡＬＥＮタンパク質によるヌクレアーゼ活性を実証する。ＴＡＬＥＮ（Ｒ１３ｄ１８２Ｃ−ｓｃＦｏｋＩ、Ｃ＋９５Ｃキャップ）を用いてＳＳＡ−Ｒ１３レポーター構築物から生成されたＧＦＰ陽性細胞は、ヌクレアーゼプラスミドを欠如する対照実験（偽）と比較して、著しく増加した。Ｒ１３ｄ１８２Ｃ−ｓｃＦｏｋＩは、ＦｏｋＩドメインの間のＧＧＧＧＳ配列の１２個のコピーによって結合されるＦｏｋＩドメインの２つのコピーが、ＶＰ１６活性化ドメインを置換するために使用されることを除いて、上述のＲ１３Ｖ−ｄ１８２Ｃと同一である。

インビトロでのＴＡＬＥ１３エフェクタードメイン−ＦｏｋＩ切断半ドメイン融合物のヌクレアーゼ活性を示す臭化エチジウムゲルを示す。列は、４つのＴＡＬＥドメインヌクレアーゼ切断タンパク質：Ｌ２又はＬ８リンカーのいずれかを用いたＮ＋１３７、Ｃ＋２８配置を有するヌクレアーゼ融合物（実施例７を参照のこと）、Ｌ２リンカーを用いたＮ＋１３７、Ｃ＋３９配置を有するヌクレアーゼ融合物を示し、Ｌ２リンカーでのＮ＋１３７、Ｃ＋６３融合物についてのデータを示す。２つの標的部位の間のギャップ間隔は、ウェルの真下に示され、数字は、標的間のｂｐの数を示す。「Ｓ」は、対の半分のみの単一の標的部位を示す。「ＰｍｌＩ」は、標準の制限酵素での切断を示し、空は、ヌクレアーゼをコードするプラスミドなしで実験を行ったときの結果を示す。

示されるＴＡＬＥ１３−ＦｏｋＩ切断半ドメイン融合物によって得られたＤＮＡ切断を示すグラフである。「二量体ギャップ」は、２つの標的部位間のｂｐの数を示し、「パーセントＤＮＡ切断」は、どれだけのＤＮＡが反応において切断されたかを示す。結果は、事実上１００パーセントのＤＮＡ切断が、４つのヌクレアーゼのうちの３つを試験したこれらの反応条件において達成可能であることを示す。

ＴＡＬＥドメイン−ＦｏｋＩ半切断ドメイン融合物のヌクレアーゼ活性を示す、臭化エチジウム染色ゲルを示す。この実験において、Ｎ末端は、Ｃ末端がＣ＋６３配置で維持された間、変化した。Ｐｍｌ１及び空対照は、図１２と同一である。この実験で試験されたＮ末端切断物は、Ｎ＋１３７、Ｎ＋１３４、Ｎ＋１３０、及びＮ＋１１９であった。異なるＤＮＡ標的部位は、標識が、同族のレーンを下回るのではなく上回ることを除いて、図１２にあるように示される。ヌクレアーゼの活性は、Ｎ末端が約＋１３４〜＋１３７よりも短いときに減少する。５ｂｐのギャップ標的及び８ｂｐのギャップ標的についてそれぞれのレーンに装填されたＤＮＡの量が不均等であったため、これらのレーンにおける下方のバンドがＤＮＡ切断産物を表すのか、又は逆方向反復での非効率的なＰＣＲによるバックグラウンドなのかを決定することは困難である。

パネルＡ及びＢは、Ｋ５６２細胞におけるＴＡＬＥＮ活性を示す。図１５Ａ（配列番号３４２）は、１対のＣＣＲ５特異的ＺＦＮ（８２６７／８１９６）の結合部位も含むＴＡＬＥ対を標的とするＮＴＦ３のためにレポータープラスミドにおいて使用された標的配列を示す。図１５Ｂは、ＳＳＡヌクレアーゼアッセイの結果を示すグラフであり、（−）ＮＴ３Ｒ１８Ｃ２８Ｌ８（薄灰色バー、Ｃ＋２８Ｃキャップ、Ｌ８リンカー）が、ＮＴＦ３特異的対の一方のメンバーが存在するときにのみ観察されたデータを示し、（＋）ＮＴ３Ｒ１８Ｃ２８Ｌ８（濃灰色バー）は、対の両方のメンバーが存在したときの結果を示す。「８２６７ＥＬ８１９６ＫＫ」は、ＣＣＲ５特異的ＺＦＮ対を用いた結果を示す。

ＮＴＦ３標的ＴＡＬＥＮの種々の対で処理された細胞上でのＣｅｌ−ＩＳｕｒｖｅｙｏｒ（商標）ミスマッチアッセイ（Ｔｒａｎｓｇｅｎｏｍｉｃｓ、「Ｃｅｌ−Ｉアッセイ」）の結果を示す。１〜３０で番号付けされた試料は、本文において記載されるものである。（＋）は、Ｃｅｌ−Ｉ酵素の添加を意味し、（−）は、少しの酵素も添加しないアッセイを意味する。約２２６ｂｐのバンドは、試料の大部分において明らかであり、ヌクレアーゼによる内因性ＮＴＦ３標的の切断によって誘導されたミスマッチを示し、野生型配列とのミスマッチの領域を導入する非相同末端結合が続く。「ｇｆｐ」は、細胞が、ＧＦＰをコードするプラスミドのみをトランスフェクトした対照を示す。ゲル上で定量化されたＮＨＥＪ活性の割合は、Ｃｅｌ−Ｉ酵素を含有するそれぞれの試料において示される。ゲルは、対が、哺乳類細胞中のこの内因性遺伝子座において、いくつかの試料中の全体の対立遺伝子の最大８．６６％で標的化された遺伝子座の破壊を誘導したことを実証する。

パネルＡ〜Ｃは、Ｋ５６２細胞におけるＮＴＦ３特異的ＴＡＬＥＮの活性を示す。図１７Ａは、ＮＴ−ＬＴＡＬＥＮ融合のために作製された遺伝子操作されたパートナーであるＮＴ−Ｒと指定される遺伝子操作されたＴＡＬＥＮタンパク質についてのＳＥＬＥＸ特異性データを示す。予想される塩基及び対応するＲＶＤが、プロットの上に示される。＋６３Ｃ末端隣接領域を、このＳＥＬＥＸ実験に使用した。図１７Ｂは、Ｋ５６２細胞における４つのＮＴＦ３特異的ＴＡＬＥＮ対を使用したＣｅｌ−Ｉアッセイの結果のゲルを示し、培養条件は、３０℃又は３７℃のいずれかであった。示されるデータから見られるように、最も活性を示した対は、３７℃で３％、かつ低温ショック条件下（３０℃）では９％の遺伝子修飾レベルを実証した（２０１０年１２月５日に電子公開されたＤｏｙｏｎｅｔａｌ．（２０１０）ＮａｔＭｅｔｈｏｄｓ８（１）：７４−９、及び米国出願第１２／８００，５９９号）。その後、低温ショック研究からのＰＣＲプール由来の８４個の増幅産物を配列決定し、図１７Ｃに示される７個の変異対立遺伝子を同定した（配列番号３４３〜３５０）。見られるように、わずかのインデルが観察された。

パネルＡ及びＢは、ＴＡＬＥＮを使用したＫ５６２細胞におけるＮＴＦ３遺伝子座の内因性切断後に観察された配列決定の結果を示す。図１８Ａは、染色体の配列（配列番号１３９〜１４０）を示し、囲みは、２つのＴＡＬＥＮの結合部位を描写する。図１８Ｂは、野生型（「ｗｔ」）配列（配列番号１４１〜１７５）と整列した、実施例８において説明される異なるＮＴＦ３ＴＡＬＥＮ対で処理された細胞からのＮＴＦ３遺伝子座の配列決定の結果の集録を示す。

ＮＴＦ３特異的ＴＡＬＥＮによって誘導されたＤＳＢを介しての内在性遺伝子における標的組込み事象の結果を示す。ＤＳＢにおける捕捉のためのオリゴヌクレオチドを、ＴＡＬＥＮ結合部位間の間隙内の全ての可能性のある配列に対応するオーバーハングを含有するように合成した。挿入されたオリゴヌクレオチド及び推定上の切断部位の外側領域からプライムする一組のプライマーを使用してＰＣＲを行った。ＮＴＦ３特異的ＴＡＬＥＮの８つの異なる対を試験し、対は、Ａ〜Ｈでラベル表示されている。説明文は、レーンがどのように読み出されるかを実証するゲルの部分を示す。

パネルＡ〜Ｄは、ＴＡＬＥＮ対によって内因性染色体遺伝子座で誘導されたＤＳＢ後の、ＮＨＥＪによって媒介されるその遺伝子座でのオリゴヌクレオチド二本鎖の捕捉を示す。図２０Ａは、ＮＴＦ３標的遺伝子座の一部（上の二本鎖、配列番号３５１）、及びこの研究に使用したオリゴヌクレオチド二本鎖のうちの１つ（下の二本鎖、配列番号３５２）を示す。ＮＴ−Ｌ＋２８及びＮＴ−Ｒ＋６３の結合部位は、上の配列の下線の箇所である。二本鎖（５’ＣＴＧＧ）を最も効率的に捕捉する切断オーバーハングも強調表示されている。図２０Ｂは、ＮＴＦ３標的遺伝子座の一部（上の二本鎖、配列番号３５３）、及びこの研究に使用した第２のオリゴヌクレオチド二本鎖（下の配列、配列番号３５４）を示す。ＮＴ−Ｌ＋２８及びＮＴ−Ｒ＋６３の結合部位は、上の配列の下線の箇所である。この第２の二本鎖（５’ＴＧＧＴ）を最も効率的に捕捉する切断オーバーハングも示されている。図２０Ｃ（配列番号３５５〜３５７）は、図２０Ａに示されるオリゴヌクレオチド二本鎖の存在下でのＫ５６２細胞におけるＮＴ−Ｌ＋２８及びＮＴ−Ｒ＋６３の発現後の結果を示す。その後、うまく組み込まれた二本鎖とゲノムＤＮＡとの間の接合部を、二本鎖内でアニールする１つのプライマー及び天然ＮＴＦ３遺伝子座にアニールする１つのプライマーを用いて増幅した。結果として生じる増幅産物をクローニング及び配列決定した。上の「予想される」配列は、切断された遺伝子座へのオリゴヌクレオチド二本鎖の完全な連結に起因する配列を示す。囲みは、接合配列における二本鎖オーバーハングの位置を強調表示している。下の２つの列は、この研究から得られた接合配列を提供する。示されるように、１１個の接合配列が、切断オーバーハングへの二本鎖の完全な連結に起因した一方で、１つの接合配列は、ＮＨＥＪによる修復前の切除と一致した短い欠失（１２ｂｐ）を呈した。図２０Ｄ（配列番号３５８〜３６２）は、図２０Ａに示される二本鎖と比較して、１つの塩基によってシフトする４ｂｐのオーバーハングを有する図２０Ｂに示されるオリゴヌクレオチド二本鎖が使用されたことを除いて、図２０Ｃに示される実験の結果を示す。一番下の４つの列は、この研究から得られた接合配列を提供する。示されるように、４つのはっきりと異なる配列が同定され、それぞれ、ＮＨＥＪ媒介修復前の切除に一致した短い欠失を呈する。

テンプレートの効率的な増幅を破壊し得るＰＣＲ増幅中に天然ＴＡＬＥ反復ドメインにおいて形成されることが予測される可能性のある二次ＤＮＡ構造のうちのいくつかを示す。Ｍｆｏｌｄを使用して、ＴＡＬＥ反復タンパク質のＤＮＡ配列の分析を行った（Ｍ．Ｚｕｋｅｒ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３１（１３）：３４０６−１５，（２００３））。第１の全ＴＡＬＥ反復配列をコードする核酸の５’末端で開始する核酸配列の８００個の塩基対を分析した。分析した配列は、約７．５個の反復を含有した。分析は、いくつかの非常に安定した二次構造を明らかにした。

３４個のアミノ酸反復単位におけるそれぞれの位置で保存アミノ酸を示すキサントモナス細菌由来の１９６３個のＴＡＬＥ反復のインシリコ分析の図式的結果を示す。文字の寸法は、任意の所与の位置で観察される多様性に反比例しており、より大きな文字は、多様性への耐性の低さを示し、より小さい文字は、所与の位置で観察することができる代替アミノ酸を示す。異なる色の濃さは、異なる化学的分類のアミノ酸を表す。１９６３個のＴＡＬＥ反復のこの試料において、最も頻度の高いＲＶＤは、２８．８％のＨＤ、２０．６％のＮＩ、１５．１％のＮＮ、１３．２％のＮＧ、８．５％のＮＳ、５．５％のＨＧ、及び５．５％のＮＧ＊であった（星印は、ＲＶＤが、より典型的な３４残基の反復の代わりに３３残基のＴＡＬＥ反復において観察されたことを示す）。１５個の他のＲＶＤ配列がこの試料において観察されたが、これらは全て、１％未満の頻度を有した。

選択されたＴＡＬＥ反復モジュールのＰＣＲ増幅産物にタンデムに結合し、かつそれらをベクター骨格に連結させて、所望のＴＡＬＥ融合タンパク質を作成するために使用される方法の概略図を示す。特異的プライマーが、実施例１１に列記される。組み立てられたＴＡＬＥ融合物がクローニングされるベクター骨格も示される。融合パートナードメインは、ＴＡＬＥＮ対の一方のメンバーの産生を可能にするＦｏｋＩヌクレアーゼ触媒ドメインである。

パネルＡ及びＢは、ＲＦＬＰをコードする異種構造の短いセグメントの内因性ＣＣＲ５遺伝子座への相同性に基づく導入を駆動するためのＴＡＬＥＮの使用を示す。図２４Ａは、アッセイ概略図を示し、使用したＰＣＲプライマーの位置及びＢｇｌＩ部位を示す。図２４Ｂは、ＣＣＲ５特異的ＴＡＬＥＮ対によって導入されたＤＳＢへの４６ｂｐのドナー配列の挿入を示すゲルを示す。ドナー配列が特有のＢｇｌＩ制限部位を含有するため、標的部位のＰＣＲ増幅時、その後のＢｇｌＩでのＰＣＲ産物の消化時に、ＴＡＬＥＮ対によって切断され、かつ４６ｂｐのドナー配列を挿入した配列は、図に示されるように、２つのＢｇｌＩ切断産物を有する。

パネルＡ及びＢは、標的ギャップ間隔と比較した、ＴＡＬＥＮの切断有効性を示すグラフである。図２５Ａは、＋２８／＋２８対形成を有するＣＣＲ５特異的ＴＡＬＥＮ対（両方のＴＡＬＥＮ上にＣ＋２８Ｃキャップ）のパネルの活性を示し、図２５Ｂは、＋６３／＋６３対形成を含むＣＣＲ５特異的ＴＡＬＥＮ対（両方のＴＡＬＥＮ上にＣ＋６３Ｃキャップ）のパネルの活性を示す。見られるように、＋２８／＋２８対の活性は、２つの標的配列間の１２又は１３ｂｐのギャップ間隔により密に制約される一方で、＋６３／＋６３対は、１２〜２３ｂｐの範囲のギャップ間隔にわたって活性を呈する。

異なる長さのＣキャップ配列、又は別の言い方をすると、全ＴＡＬＥ反復の配列をヌクレアーゼドメインに結合する異なる配列を有するＣＣＲ５特異的ＴＡＬＥＮ対の内因性活性を示すグラフである。Ｃ−２からＣ＋２７８までのＣキャップを産出するために、Ｃ末端切断をＣ末端配列にわたって行った。これらの構築物を、細胞が３７℃（薄色の正方形）又は低温ショック条件（３０℃、濃色のダイヤモンド）のいずれかでインキュベートされた１８ｂｐのギャップ間隔を有する内因性標的に対して、Ｋ５６２細胞におけるＴＡＬＥＮ活性について試験した。活性は、全ＴＡＬＥ反復の配列をＦｏｋＩ切断ドメインに結合させるために使用した配列の同一性に大いに依存した。我々のＣキャップ表記法がＣ＋０を含まないため、Ｃ−１Ｃキャップ値をＸ＝０としてプロットし、Ｃ−２をＸ＝−１としてプロットしたことに留意する。Ｃ＋５、Ｃ＋２８等をＸ＝５、Ｘ＝２８等としてプロットした。ピーク活性が、Ｃ＋６３Ｃキャップ配列について観察された。

ＲＶＤ分析のために選択された例示的なＴＡＬＥＮの特異性を示す。ＴＡＬＥＮは、１１個の塩基標的配列、５’−ＴＴＧＡＣＡＡＴＣＣＴ−３’（配列番号１７８）に結合するように設計された。５〜７位での標的の同一性が、ＣＡＡ（設計された標的）、ＣＧＡ、ＴＣＧ、又はＴＴＧのいずれかであるように、この標的が６位で変更されるときにＥＬＩＳＡ分析によって決定されるＤＮＡ結合結果が示される。

試験した全てのＲＶＤにおいて測定されたＥＬＩＳＡ親和性のグラフ表示である。データが、２０×２０のグリッドに示され、ＲＶＤの第１のアミノ酸（１２位）がグリッドの左側に垂直に示され、ＲＶＤの第２のアミノ酸（１３位）がグリッドの上に水平に示される。それぞれのグリッドにおける文字Ａ、Ｃ、Ｇ、及びＴの寸法は、それぞれ、ＣＡＡ部位、ＣＣＡ部位、ＣＧＡ部位、及びＣＴＡ部位に対して標準化されたＥＬＩＳＡシグナルの平方根に基づいて寸法決定されている。多くのＲＶＤは、自然発生ＨＤ、ＮＩ、ＮＧ、ＮＳ、ＮＮ、ＩＧ、ＨＧ、及びＮＫＲＶＤと比較して、ＤＮＡ結合特性を改善した。最も頻繁に自然に見出される４つのＲＶＤ（ＨＤ、ＮＧ、ＮＩ、及びＮＮ）は、参考のために囲まれている。これらの４つのＲＶＤについて、ＥＬＩＳＡによる好ましい塩基は、予想される好ましい塩基に一致した。

Ｃ末端半反復がＴ以外のヌクレオチド塩基との相互作用を許容するためにＲＶＤで変更した、ＴＡＬＥＮの活性の測定結果を示すゲルである。上述のＣｅｌ−Ｉアッセイによって決定されたＴＡＬＥＮ活性が示される。矢印は、インデルでのＣｅｌ−Ｉ切断の結果であるバンドを示す。レーン割り当ては、実施例１６の表３２に列記されるものである。これらの結果は、ＴＡＬＥＮＣ末端半反復を、所望の場合、それぞれのヌクレオチド塩基に結合するよう遺伝子操作することができることを実証する。

完全に非定型のＲＶＤ（完全置換）、１つのタイプ若しくは特異性の全ての反復単位（例えば、「Ｔ」を特定するＲＶＤを有する全ての反復単位等）が非定型のＲＶＤで置換された反復ドメイン（タイプ置換）、又は配列を有する１つの反復単位のみが非定型のＲＶＤを含む反復単位で置換されたＴＡＬＥＮ（単独置換）のいずれかを含むＴＡＬＥ反復単位を有するＴＡＬＥＮを使用した、ＴＡＬＥＮ活性の測定を示すゲルである。３７度又は低温ショック条件下（３０度）のいずれかで活性アッセイを行い、任意の測定可能なＮＨＥＪ活性の定量化がレーン上に示される。

ラット胚のＴＡＬＥＮ処理後に生まれたラットの子におけるＮＨＥＪ事象の存在を示す一連のゲルである。ゲノムＤＮＡをラットの子から単離し、ヌクレアーゼ標的部位周囲の領域上でＰＣＲを行った。その後、Ｔ７エンドヌクレアーゼを使用して、産物を、ＮＨＥＪによって誘導されたミスマッチについて試験した。矢印は、ミスマッチの存在からもたらされるバンドを示す。試験した６６匹のラットの子のうち７匹（１１％）が、ＮＨＥＪ事象に対して陽性であった。

発明の詳細な説明
導入
本出願は、ＴＡＬＥ反復ドメインを遺伝子操作して、所望の内因性ＤＮＡ配列を認識することができること、及び機能ドメインのそのような遺伝子操作されたＴＡＬＥ反復ドメインへの融合を用いて、機能状態、又は遺伝子を含むその天然のクロマチン環境に存在する内因性細胞遺伝子座の実際のゲノムＤＮＡ配列を修飾することができることを実証する。したがって、本発明は、遺伝子を含む内因性細胞遺伝子座を高い有効性で特異的に認識するように遺伝子操作されたＴＡＬＥ融合ＤＮＡ結合タンパク質を提供する。結果として、本発明のＴＡＬＥ融合物を、内在性遺伝子転写の活性化及び抑制の両方を介して、内在性遺伝子発現を制御するために使用することができる。ＴＡＬＥ融合物を、他の制御又は機能ドメイン、例えば、ヌクレアーゼ、トランスポザーゼ、又はメチラーゼに結合して、内因性染色体の配列を修飾することもできる。

本明細書に記載の方法及び組成物は、新規のヒト及び哺乳類の治療適用、例えば、遺伝的疾患、癌、真菌、原虫、細菌、及びウイルス感染、虚血、血管疾患、関節炎、免疫学的障害等の治療、並びに機能ゲノムアッセイの提供、並びに研究及び薬物スクリーニングのための遺伝子操作された細胞株の発生、及び耐病性の増加を含むが、それに限定されない、変更された表現型を有する植物を開発するための手段、並びに果実熟成特性、糖及び油組成物、収率、並びに色の変更を可能にする。

本明細書に記載されるように、２つ以上のＴＡＬＥ融合物を、任意の細胞に投与することができ、同一の標的内因性細胞遺伝子又は異なる標的内因性細胞遺伝子のいずれかを認識する。

別の実施形態では、ＴＡＬＥ融合タンパク質は、以下に記載される少なくとも１つ以上の制御ドメインに結合される。制御又は機能ドメインの非限定的な例には、ＫＲＡＢ及びＶＰ１６等の転写因子抑制因子、又は活性化因子ドメイン、共抑制因子及び共活性化因子ドメイン、ＤＮＡメチルトランスフェラーゼ、ヒストンアセチルトランスフェラーゼ、ヒストンデアセチラーゼ、並びにエンドヌクレアーゼＦｏｋＩ由来の切断ドメイン等のＤＮＡ切断ドメインが挙げられる。

ゲノム編集（例えば、遺伝子の切断、例えば、外因性配列の切断に続く挿入（物理的挿入若しくは相同指向修復を介しての挿入）及び／又は切断に続くＮＨＥＪによる遺伝子の変更；１つ以上の遺伝子の部分的若しくは完全な不活性化；内在性遺伝子の変更された機能状態を有する対立遺伝子の生成；制御要素の挿入等）並びに生殖系列に運び込まれるゲノムの変更に有用なヌクレアーゼドメインに融合した１つ以上のＴＡＬＥ反復単位、Ｎキャップ、及び任意でＣキャップを含む融合タンパク質を含む組成物及び方法も本明細書に記載されている。例えば、標的細胞中の１つ以上の遺伝子を編集（変更）するために、これらの組成物（試薬）を作製及び使用する方法も開示される。したがって、本明細書に記載の方法及び組成物は、１つ以上の遺伝子の標的化された遺伝子変更（例えば、ノックイン）及び／若しくは（部分的又は完全な）ノックアウト、並びに／又は任意の標的対立遺伝子の配列のランダム化変異のための極めて効率的な方法を提供し、したがって、ヒト疾患の動物モデルの生成を可能にする。

ヌクレアーゼドメインを、高度に活性なヌクレアーゼ機能を提供するＴＡＬＥ反復配列に結合させるための組成物（Ｃキャップ）も本明細書に開示される。いくつかの実施形態において、Ｃキャップは、天然ＴＡＬＥＣ末端隣接配列由来のペプチド配列を含む。他の実施形態では、Ｃキャップは、ＴＡＬＥ反復ドメイン由来のペプチド配列を含む。さらに別の実施形態では、Ｃキャップは、非ＴＡＬＥ配列を含む。Ｃキャップは、天然ＴＡＬＥＣ末端隣接配列由来のペプチド配列及び／若しくはＴＡＬＥ反復ドメインを含有し、かつ／又はこれらの供給源のうちのいずれも含有しないキメラ構造も呈し得る。

ＴＡＬＥＮを、目的とするドナーのＡＡＶＳ１（共同所有の米国特許公開第２００８０２９９５８０号を参照のこと）又はＣＣＲ５（共同所有の米国特許公開第２００８０１５９９９６号を参照のこと）等のセーフハーバー遺伝子座への挿入を可能にするように遺伝子操作することもできる。ドナーは、目的とする遺伝子を含み得るか、又はｓｈＲＮＡ、ＲＮＡｉ、若しくはｍｉＲＮＡ等の目的とするＲＮＡをコードし得る。

遺伝子操作されたＴＡＬＥ融合タンパク質（例えば、転写活性化因子、転写抑制因子、及びヌクレアーゼ）の発現を、ｔｅｔ−制御系に代表される系及びＲＵ−４８６系によって制御することもできる（例えば、Ｇｏｓｓｅｎ＆Ｂｕｊａｒｄ，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉ８９：５５４７（１９９２）、Ｏｌｉｇｉｎｏｅｔａｌ．，ＧｅｎｅＴｈｅｒ．５：４９１−４９６（１９９８）、Ｗａｎｇｅｔａｌ．，ＧｅｎｅＴｈｅｒ．４：４３２−４４１（１９９７）、Ｎｅｅｒｉｎｇｅｔａｌ，Ｂｌｏｏｄ８８：１１４７−１１５５（１９９６）、及びＲｅｎｄａｈｌｅｔａｌ．，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．１６：７５７−７６１（１９９８）を参照のこと）。これらは、小分子にＴＡＬＥ融合活性化因子及び抑制因子の発現における制御を与え、ひいては、小分子に目的とする標的遺伝子（複数を含む）における制御を与える。この有益な特徴を、細胞培養モデル、遺伝子治療、並びにトランスジェニック動物及び植物において用いることができる。

概論
本方法の実践、並びに本明細書に開示の組成物の調製及び使用は、別途示されない限り、当技術分野の技術の範囲内の分子生物学、生化学、クロマチン構造及び分析、計算化学、細胞培養、組換えＤＮＡ、並びに関連分野における従来の技法を採用する。これらの技法は、文献において十分に説明されている。例えば、Ｓａｍｂｒｏｏｋｅｔａｌ．ＭＯＬＥＣＵＬＡＲＣＬＯＮＩＮＧ：ＡＬＡＢＯＲＡＴＯＲＹＭＡＮＵＡＬ，Ｓｅｃｏｎｄｅｄｉｔｉｏｎ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，１９８９ａｎｄＴｈｉｒｄｅｄｉｔｉｏｎ，２００１、Ａｕｓｕｂｅｌｅｔａｌ．，ＣＵＲＲＥＮＴＰＲＯＴＯＣＯＬＳＩＮＭＯＬＥＣＵＬＡＲＢＩＯＬＯＧＹ，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ，１９８７及び定期的に更新されたもの、ＭＥＴＨＯＤＳＩＮＥＮＺＹＭＯＬＯＧＹシリーズ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＳａｎＤｉｅｇｏ、Ｗｏｌｆｆｅ，ＣＨＲＯＭＡＴＩＮＳＴＲＵＣＴＵＲＥＡＮＤＦＵＮＣＴＩＯＮ，Ｔｈｉｒｄｅｄｉｔｉｏｎ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＳａｎＤｉｅｇｏ，１９９８、ＭＥＴＨＯＤＳＩＮＥＮＺＹＭＯＬＯＧＹ，Ｖｏｌ．３０４，“Ｃｈｒｏｍａｔｉｎ”（Ｐ．Ｍ．ＷａｓｓａｒｍａｎａｎｄＡ．Ｐ．Ｗｏｌｆｆｅ，ｅｄｓ．），ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＳａｎＤｉｅｇｏ，１９９９、並びにＭＥＴＨＯＤＳＩＮＭＯＬＥＣＵＬＡＲＢＩＯＬＯＧＹ，Ｖｏｌ．１１９，“ＣｈｒｏｍａｔｉｎＰｒｏｔｏｃｏｌｓ”（Ｐ．Ｂ．Ｂｅｃｋｅｒ，ｅｄ．）ＨｕｍａｎａＰｒｅｓｓ，Ｔｏｔｏｗａ，１９９９を参照されたい。

定義
「核酸」、「ポリヌクレオチド」、及び「オリゴヌクレオチド」という用語は、同義に使用され、線状若しくは環状立体配座、かつ一本鎖形態若しくは二本鎖形態のいずれかのデオキシリボヌクレオチド又はリボヌクレオチドポリマーを指す。本開示の目的において、これらの用語は、ポリマーの長さを限定すると解釈されるべきではない。本用語は、天然ヌクレオチドの既知の類似体、並びに塩基、糖、及び／又はリン酸塩部分（例えば、ホスホロチオエートバックボーン）で修飾されるヌクレオチドを網羅し得る。概して、特定のヌクレオチドの類似体は、同一の塩基対形成特異性を有し、すなわち、Ａの類似体は、Ｔと塩基対を形成する。

「ポリペプチド」、「ペプチド」、及び「タンパク質」という用語は、アミノ酸残基のポリマーを指すよう同義に使用される。本用語は、１つ以上のアミノ酸が、対応する自然発生アミノ酸の化学的類似体又は修飾された誘導体であるアミノ酸ポリマーにも適用する。

「結合」は、巨大分子間（例えば、タンパク質と核酸との間）の配列特異的な非共有相互作用を指す。相互作用が全体として配列特異的である限り、結合相互作用の全ての構成要素が配列特異的である必要はない（例えば、ＤＮＡバックボーンにおけるリン酸塩残基との接触）。そのような相互作用は、概して、１０^-6Ｍ以下の解離定数（Ｋ_d）を特徴とする。「親和性」は、結合の強さを指し、高い結合親和性は、低いＫ_dと相関している。

「結合タンパク質」は、別の分子に非共有的に結合することができるタンパク質である。結合タンパク質は、例えば、ＤＮＡ分子（ＤＮＡ結合タンパク質）、ＲＮＡ分子（ＲＮＡ結合タンパク質）、及び／又はタンパク質分子（タンパク質結合タンパク質）に結合することができる。タンパク質結合タンパク質の場合、それは、それ自体に結合することができ（ホモ二量体、ホモ三量体等を形成するために）、かつ／又は異なるタンパク質（単数若しくは複数）の１つ以上の分子に結合することができる。結合タンパク質は、２つ以上の種類の結合活性を有し得る。例えば、亜鉛フィンガータンパク質は、ＤＮＡ結合、ＲＮＡ結合、及びタンパク質結合活性を有する。

「ＴＡＬＥ反復ドメイン」（「反復配列」でもある）は、ＴＡＬＥのその同族標的ＤＮＡ配列への結合に関与し、かつ１つ以上のＴＡＬＥ「反復単位」を含む配列である。単一の「反復単位」（「反復」とも称される）は、典型的には、３３〜３５アミノ酸長であり、自然発生ＴＡＬＥタンパク質内で他のＴＡＬＥ反復配列と少なくともいくらかの配列相同性を呈する。本明細書に記載のＴＡＬＥ反復単位は、概して、（Ｘ）^1~11−（Ｘ^RVD）₂−（Ｘ）_20~22（配列番号３９９）の形態であり、Ｘ^RVD（１２位及び１３位）は、自然発生ＴＡＬＥタンパク質において超可変性を呈する。１２位及び１３位のアミノ酸の同一性を変更することによって、反復単位が相互作用するものとのＤＮＡヌクレオチド（又は二本鎖ＤＮＡにおける相補的ヌクレオチド対）の同一性の選好を変更することができる。「非定型」ＲＶＤは、例えば、５％未満の自然発生ＴＡＬＥタンパク質、好ましくは、２％未満の自然発生ＴＡＬＥタンパク質、及びさらにより好ましくは、１％未満の自然発生ＴＡＬＥタンパク質における、自然にまれに生じるか、又は決して生じないＲＶＤ配列（１２位及び１３位）である。非定型のＲＶＤは、非自然発生であり得る。

「Ｎキャップ」ポリペプチド及び「Ｎ末端配列」という用語は、ＴＡＬＥ反復ドメインのＮ末端部分に隣接するアミノ酸配列（ポリペプチド）を指すために使用される。Ｎキャップ配列は、ＴＡＬＥ反復ドメイン（複数を含む）がＤＮＡに結合するよう機能する限り、任意の長さ（アミノ酸を含まない）であり得る。したがって、Ｎキャップ配列は、ＴＡＬＥ反復ドメインへの適切な構造的安定化の提供、及び／又はＤＮＡとの非特異的接触に関与し得る。Ｎキャップ配列は、自然発生であり得るか、又は非自然発生であり得、例えば、任意の全長ＴＡＬＥタンパク質のＮ末端領域に由来し得る。Ｎキャップ配列は、好ましくは、全長ＴＡＬＥタンパク質において見出されるポリペプチドのフラグメント（切断物）、例えば、ＴＡＬＥ反復ドメインのＤＮＡ結合機能を支援するか、又はＴＡＬＥ融合タンパク質活性に支援を提供するのに十分な自然発生ＴＡＬＥタンパク質におけるＴＡＬＥ反復ドメインに隣接するＮ末端領域の任意の切断物である。それぞれのＴＡＬＥ反復単位が典型的なＲＶＤを含み、かつ／又はＣキャップがＴＡＬＥタンパク質の全長自然発生Ｃ末端領域を含むとき、Ｎキャップ配列は、自然発生ＴＡＬＥタンパク質の全長Ｎ末端領域を含まない。したがって、上述のように、この配列は、必ずしもＤＮＡ認識に関与しないが、内因性標的ＤＮＡでの効率的かつ特異的な機能又はＴＡＬＥ融合タンパク質の効率的な活性を強化し得る。ＴＡＬＥ反復ドメインのＮ末端部分に最も近いＮキャップ配列の部分は、ＴＡＬＥ反復単位に対していくらかの相同性を有し得、「Ｒ０反復」と称される。典型的には、標的部位のすぐ５’側の位置の好ましいヌクレオチドは、チミジン（Ｔ）である。ＮキャップのＲ０反復部分は、ＴＡＬＥ反復によって特定される標的配列に隣接するＴ（又は二本鎖ＤＮＡにおいてＴに塩基対形成されるＡ）と相互作用することを好み得る。Ｒ０配列の一例が以下に示される：ＬＤＴＧＱＬＬＫＩＡＫＲＧＧＶＴＡＶＥＡＶＨＡＷＲＮＡＬＴＧＡＰＬＮ（配列番号１）。

「Ｃキャップ」又は「Ｃ末端領域」という用語は、ＴＡＬＥ反復ドメインのＣ末端部分に隣接し得る、任意で存在するアミノ酸配列（ポリペプチド）を指す。Ｃキャップは、０個の残基を含む末端のＣ末端ＴＡＬＥ反復の任意の部分、ＴＡＬＥ反復又は全ＴＡＬＥ反復の切断物も含み得る。Ｃ末端領域の最初の２０個の残基は、典型的には、ＴＡＬＥ反復単位の最初の２０個の残基と相同であり、ＴＡＬＥ反復ドメインによって特定されるＤＮＡ配列の３’のヌクレオチドの選好を特定することができるＲＶＤ配列を含有し得る。存在するとき、ＴＡＬＥ反復の最初の２０個の残基と相同のＣ末端領域のこの部分は、「半反復」とも称される。Ｃ末端領域内の残基の番号付けスキームは、この典型的な部分的相同性を反映する。番号付けスキームは、Ｃ−２０で始まり、Ｃ−１９、Ｃ−１８、Ｃ−１７、Ｃ−１６、Ｃ−１５、Ｃ−１４、Ｃ−１３、Ｃ−１２、Ｃ−１１、Ｃ−１０、Ｃ−９、Ｃ−８、Ｃ−７、Ｃ−６、Ｃ−５、Ｃ−４、Ｃ−３、Ｃ−２、Ｃ−１に増加し、Ｃ＋１に増加し、その後、ポリペプチドのＣ末端に向かってＣ＋２、Ｃ＋３等に増加する。Ｃ＋２８Ｃキャップは、残基Ｃ−２０から残基Ｃ＋２８（包括的）までの配列を指し、したがって、４８個の残基の長さを有する。Ｃキャップ配列は、自然発生（例えば、自然発生タンパク質のフラグメント）若しくは非自然発生（例えば、１つ以上のアミノ酸欠失、置換、及び／若しくは付加を含む自然発生タンパク質のフラグメント）、又はＣキャップの役割を果たす能力を有する任意の他の自然又は非自然配列であり得る。Ｃ末端領域は、ＴＡＬＥ反復ドメイン（複数を含む）のＤＮＡ結合機能に絶対に必要というわけではないが、いくつかの実施形態において、Ｃキャップは、ＤＮＡと相互作用することができ、例えば、ＴＡＬＥ反復ドメインのＣ末端でヌクレアーゼを含む融合タンパク質において、機能ドメインの活性を強化することもできる。

「亜鉛フィンガーＤＮＡ結合タンパク質」（又は結合ドメイン）は、亜鉛イオンの配位を介して安定化される構造を有する結合ドメイン内のアミノ酸配列の領域である、１つ以上の亜鉛フィンガーを介して配列特異的様式でＤＮＡに結合するタンパク質、又はより大きいタンパク質内のドメインである。亜鉛フィンガーＤＮＡ結合タンパク質という用語は、多くの場合、亜鉛フィンガータンパク質又はＺＦＰと略される。

「選択された」亜鉛フィンガータンパク質又はＴＡＬＥ反復ドメインを含むタンパク質は、その産生が、ファージディスプレイ、相互作用トラップ、又はハイブリッド選択等の経験的プロセスに主に由来するタンパク質である。例えば、米国特許第５，７８９，５３８号、米国特許第５，９２５，５２３号、米国特許第６，００７，９８８号、米国特許第６，０１３，４５３号、米国特許第６，２００，７５９号明細書、国際公開第ＷＯ９５／１９４３１号、国際公開第ＷＯ９６／０６１６６号、国際公開第ＷＯ９８／５３０５７号、国際公開第ＷＯ９８／５４３１１号、国際公開第ＷＯ００／２７８７８号、国際公開第ＷＯ０１／６０９７０号、国際公開第ＷＯ０１／８８１９７号、及び国際公開第ＷＯ０２／０９９０８４を参照されたい。

「配列」という用語は、ＤＮＡ又はＲＮＡであり得、線状、環状、又は分岐であり得、かつ一本鎖又は二本鎖のいずれかであり得る、任意の長さのヌクレオチド配列を指す。「ドナー配列」という用語は、ゲノムに挿入されるヌクレオチド配列を指す。ドナー配列は、任意の長さ、例えば、２〜１０，０００（又はそれらの間若しくはそれらを超える任意の整数）長のヌクレオチド、好ましくは、約１００〜１，０００（又はそれらの間の任意の整数）長のヌクレオチド、より好ましくは、約２００〜５００長のヌクレオチドであり得る。

「相同非同一配列」は、第２の配列とある程度の配列同一性を共有するが、第２の配列の配列とは同一ではない第１の配列を指す。例えば、変異体遺伝子の野生型配列を含むポリヌクレオチドは、変異体遺伝子の配列と相同であり、非同一である。ある特定の実施形態において、２つの配列の間の相同の程度は、通常の細胞機構を利用して、それらの間の相同組換えを許容するのに十分な程度である。２つの相同非同一配列は、任意の長さであってもよく、それらの非相同の程度は、（例えば、標的化された相同組換えによるゲノム点変異の修正のために）単一のヌクレオチドと同程度に小さくてもよく、又は（例えば、染色体における所定の異所的部位での遺伝子の挿入のために）１０キロベース以上と同程度に大きくてもよい。相同非同一配列を含む２つのポリヌクレオチドは、同一の長さである必要はない。例えば、２０〜１０，０００個のヌクレオチド又はヌクレオチド対の外因性ポリヌクレオチド（すなわち、ドナーポリヌクレオチド）を使用することができる。

核酸及びアミノ酸配列同一性を決定するための技法は、当技術分野において既知である。典型的には、そのような技法は、遺伝子のｍＲＮＡのヌクレオチド配列を決定すること、及び／又はそれによってコードされるアミノ酸配列を決定すること、並びにこれらの配列を第２のヌクレオチド若しくはアミノ酸配列と比較することを含む。ゲノム配列を、この様式で決定及び比較することもできる。概して、同一性は、それぞれ、２つのポリヌクレオチド又はポリペプチド配列の正確なヌクレオチドとヌクレオチド又はアミノ酸とアミノ酸の一致を指す。２つ以上の配列（ポリヌクレオチド又はアミノ酸）を、それらのパーセント同一性を決定することによって比較することができる。２つの配列のパーセント同一性は、核酸又はアミノ酸配列にかかわらず、短い方の配列の長さで割って１００を乗じた、２つの整列した配列の間での正確な一致の数である。

あるいは、ポリヌクレオチド間の配列類似性の程度を、相同領域間での安定した二本鎖の形成と、その後の一本鎖特異的ヌクレアーゼ（複数を含む）での消化と、消化されたフラグメントの寸法決定とを許容する条件下における、ポリヌクレオチドのハイブリダイゼーションによって決定することができる。２つの核酸、又は２つのポリペプチド配列は、配列が、上述の方法を使用して決定されるように、分子の定義された長さにわたって、少なくとも約７０％〜７５％、好ましくは８０％〜８２％、より好ましくは８５％〜９０％、さらにより好ましくは９２％、さらにより好ましくは９５％、及び最も好ましくは９８％の配列同一性を呈するとき、相互に実質的に相同である。本明細書で使用されるとき、実質的に相同とは、特定のＤＮＡ又はポリペプチド配列に対して完全同一性を示す配列も指す。実質的に相同であるＤＮＡ配列を、その特定の系について定義されるように、例えば、ストリンジェントな条件下でのサザンハイブリダイゼーション実験において同定することができる。適切なハイブリダイゼーション条件を定義することは、当技術分野の技術の範囲内である。例えば、上記のＳａｍｂｒｏｏｋｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄＨｙｂｒｉｄｉｚａｔｉｏｎ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ，ｅｄｉｔｏｒｓＢ．Ｄ．ＨａｍｅｓａｎｄＳ．Ｊ．Ｈｉｇｇｉｎｓ，（１９８５）Ｏｘｆｏｒｄ；Ｗａｓｈｉｎｇｔｏｎ，ＤＣ；ＩＲＬＰｒｅｓｓ）を参照されたい。

「組換え」は、２つのポリヌクレオチド間の遺伝情報交換のプロセスを指す。本開示の目的において、「相同組換え（ＨＲ）」は、例えば、相同指向修復機構を介する細胞内の二本鎖切断の修復中に行われるそのような交換の特殊化形態を指す。このプロセスは、ヌクレオチド配列相同性を必要とし、「ドナー」分子を「標的」分子（すなわち、二本鎖切断を経験する分子）のテンプレート修復に使用し、かつそれがドナーから標的への遺伝情報の導入につながるという理由から「非交差型遺伝子変換」又は「短経路遺伝子変換」として広く既知である。任意の特定の理論によって束縛されることを望むことなく、そのような導入は、切断された標的とドナーとの間に形成されるヘテロ二本鎖ＤＮＡのミスマッチ修正、及び／又は標的の一部になる遺伝情報を再合成するためにドナーが使用される「合成依存性鎖アニーリング」、及び／又は関連プロセスを伴い得る。そのような特殊化されたＨＲは、ドナーポリヌクレオチドの配列の一部又は全てが、標的ポリヌクレオチドに組み込まれるように、多くの場合、標的分子の配列の変更をもたらす。

本開示の方法において、本明細書に記載の１つ以上の標的化されたヌクレアーゼは、所定の部位で、標的配列（例えば、細胞クロマチン）内に二本鎖切断を作成し、切断領域内のヌクレオチド配列に対して相同性を有する「ドナー」ポリヌクレオチドを、細胞に導入することができる。二本鎖切断（ＤＳＢ）の存在が、ドナー配列の組込みを促進することが示されている。ドナー配列は、物理的に組み込まれ得るか、又はドナーポリヌクレオチドは、相同組換えを介する切断の修復のためのテンプレートとして使用され、ドナーと同様に細胞クロマチンへのヌクレオチド配列の全て若しくは一部の導入をもたらす。したがって、細胞クロマチン内の第１の配列を変更することができ、ある特定の実施形態において、ドナーポリヌクレオチドに存在する配列に変換することができる。したがって、「置換する」又は「置換」という用語の使用は、１つのヌクレオチド配列と別のヌクレオチド配列との置換（すなわち、情報的な意味では、配列の置換）を表すものとして理解することができ、１つのポリヌクレオチドと別のポリヌクレオチドとの物理的又は化学的置換を必ずしも必要としない。いくつかの実施形態において、２つのＤＳＢは、本明細書に記載の標的化されたヌクレアーゼによって導入され、ＤＳＢ間のＤＮＡの欠失をもたらす。いくつかの実施形態において、「ドナー」ポリヌクレオチドは、これらの２つのＤＳＢ間に挿入される。

したがって、ある特定の実施形態において、目的とする領域内の配列と相同のドナー配列の部分は、置換されるゲノム配列に対して、約８０〜９９％（又はそれらの間の任意の整数）の配列同一性を呈する。他の実施形態では、例えば、１００個を超える連続塩基対のうちの１個のヌクレオチドのみがドナー配列とゲノム配列の間で異なる場合、ドナー配列とゲノム配列との間の相同性は、９９％より高い。ある特定の場合において、ドナー配列の非相同部分は、新しい配列が目的とする領域に導入されるように、目的とする領域内に存在しない配列を含有し得る。これらの事例において、非相同配列は、概して、目的とする領域内の配列と相同又は同一の５０〜１，０００個の塩基対（若しくはそれらの間の任意の整数値）又は１，０００よりも大きい任意の数の塩基対の配列によって隣接される。他の実施形態では、ドナー配列は、第１の配列と非相同であり、非相同組換え機構によってゲノムに挿入される。

本明細書に記載の方法のうちのいずれかにおいて、ヌクレアーゼドメインに融合したさらなるＴＡＬＥ融合タンパク質、並びにＴＡＬＥ（又は亜鉛フィンガー）ヌクレアーゼのさらなる対を、細胞内のさらなる標的部位のさらなる二本鎖切断のために使用することができる。

本明細書に記載の方法のうちのいずれかを、目的とする遺伝子（複数を含む）の発現を破壊するドナー配列の標的化組込みによる細胞内の１つ以上の標的配列の部分的又は完全な不活性化のために使用することができる。部分的又は完全に不活性化された遺伝子を有する細胞株も提供される。

さらに、１つ以上の外因性配列を組み込むために、本明細書に記載の標的組込みの方法も使用することができる。外因性核酸配列は、例えば、１つ以上の遺伝子若しくはｃＤＮＡ分子、又は任意の種類のコード配列若しくは非コード配列、並びに１つ以上の制御要素（例えば、プロモーター）を含み得る。加えて、外因性核酸配列は、１つ以上のＲＮＡ分子（例えば、ショートヘアピンＲＮＡ（ｓｈＲＮＡ）、阻害性ＲＮＡ（ＲＮＡｉ）、マイクロＲＮＡ（ｍｉＲＮＡ）等）を生成し得る。

「切断」は、ＤＮＡ分子の共有結合バックボーン切断を指す。切断を、リン酸ジエステル結合の酵素又は化学的加水分解を含むが、それらに限定されない様々な方法によって開始することができる。一本鎖切断及び二本鎖切断の両方が可能であり、二本鎖切断は、２つのはっきりと異なる一本鎖切断事象の結果として生じ得る。ＤＮＡ切断は、平滑末端又は付着末端のいずれかの生成をもたらし得る。ある特定の実施形態において、融合ポリペプチドは、標的化された二本鎖ＤＮＡ切断のために使用される。

「切断半ドメイン」は、第２のポリペプチド（同一のポリペプチド又は異なるポリペプチドのいずれか）とともに、切断活性（好ましくは、二本鎖切断活性）を有する複合体を形成するポリペプチド配列である。「第１及び第２の切断半ドメイン」、「＋及び−切断半ドメイン」、並びに「右及び左切断半ドメイン」という用語は、二量体化する切断半ドメインの対を指すために同義に使用される。

「遺伝子操作された切断半ドメイン」は、別の切断半ドメイン（例えば、別の遺伝子操作された切断半ドメイン）で偏性ヘテロ二量体を形成するように修飾された切断半ドメインである。参照によりそれらの全体が本明細書に組み込まれる、米国特許公開第２００５／００６４４７４号、同第２００７／０２１８５２８号、及び同第２００８／０１３１９６２号も参照されたい。

「クロマチン」は、細胞ゲノムを含む核タンパク質構造である。細胞クロマチンは、核酸、主にＤＮＡ、並びにヒストン及び非ヒストン染色体タンパク質を含むタンパク質を含む。真核細胞クロマチンの大部分は、ヌクレオソームの形態で存在し、ヌクレオソームコアは、それぞれ２つのヒストンＨ２Ａ、Ｈ２Ｂ、Ｈ３、及びＨ４を含む八量体と会合した約１５０個の塩基対のＤＮＡを含み、（生物に応じて変化する長さの）リンカーＤＮＡは、ヌクレオソームコアの間に延在する。ヒストンＨ１の分子は、概して、リンカーＤＮＡと会合している。本開示の目的において、「クロマチン」という用語は、原核性及び真核性の両方の全ての種類の細胞核タンパク質を網羅するよう意図されている。細胞クロマチンは、染色体及びエピソームクロマチンの両方を含む。

「染色体」は、細胞のゲノムの全て又は一部を含むクロマチン複合体である。細胞のゲノムは、多くの場合、細胞のゲノムを含む全ての染色体の集合であるその核型を特徴とする。細胞のゲノムは、１つ以上の染色体を含み得る。

「エピソーム」は、複製核酸、核タンパク質複合体、又は細胞の染色体核型の一部ではない核酸を含む他の構造である。
エピソームの例には、プラスミド及びある特定のウイルスゲノムが挙げられる。

「標的部位」又は「標的配列」は、結合するのに十分な条件が存在する場合、結合分子が結合する核酸の一部を定義する核酸配列である。例えば、配列５’−ＧＡＡＴＴＣ−３’は、ＥｃｏＲＩ制限エンドヌクレアーゼの標的部位である。

「植物」細胞は、単子葉（単子葉植物）又は双子葉（双子葉植物）植物の細胞を含むが、それらに限定されない。単子葉植物の非限定的な例には、トウモロコシ、コメ、大麦、オート麦、小麦、ソルガム、ライ麦、サトウキビ、パイナップル、タマネギ、バナナ、及びココナツ等の穀物用植物が挙げられる。双子葉植物の非限定的な例には、タバコ、トマト、ヒマワリ、綿、テンサイ、ジャガイモ、レタス、メロン、大豆、キャノーラ（菜種）、及びムラサキウマゴヤシが挙げられる。植物細胞は、植物の任意の部分及び／又は植物発育の任意の段階由来である。

「外因性」分子は、通常細胞中に存在しないが、１つ以上の遺伝子方法、生化学的方法、又は他の方法によって細胞に導入することができる分子である。「細胞中に普通に存在する」かは、細胞の特定の発育段階及び環境条件に関して決定される。したがって、例えば、筋肉の胚発育中にのみ存在する分子は、成人筋肉細胞に対して外因性の分子である。同様に、熱ショックによって誘導される分子は、熱ショックを受けていない細胞に対して外因性の分子である。外因性分子は、例えば、機能不全の内因性分子の機能バージョン又は通常に機能する内因性分子の機能不全バージョンを含み得る。外因性分子はまた、通常別の種、例えば、動物のゲノムに導入されるヒト配列において見出される分子であり得る。

外因性分子は、とりわけ、コンビナトリアルケミストリープロセスによって生成される分子等の小分子であり得るか、又はタンパク質、核酸、炭水化物、脂質、糖タンパク質、リポタンパク質、多糖類、上述の分子の任意の修飾された誘導体、若しくは上述の分子のうちの１つ以上を含む任意の複合体等の巨大分子であり得る。核酸は、ＤＮＡ及びＲＮＡを含み、一本鎖又は二本鎖であり得、線状、分岐、又は環状であり得、かつ任意の長さであり得る。核酸は、二本鎖を形成することができる核酸、並びに三本鎖形成核酸を含む。例えば、米国特許第５，１７６，９９６号及び同第５，４２２，２５１号を参照されたい。タンパク質は、ＤＮＡ結合タンパク質、転写因子、クロマチンリモデリング因子、メチル化ＤＮＡ結合タンパク質、ポリメラーゼ、メチラーゼ、デメチラーゼ、アセチラーゼ、デアセチラーゼ、キナーゼ、ホスファターゼ、インテグラーゼ、リコンビナーゼ、リガーゼ、トポイソメラーゼ、ジャイレース、及びヘリカーゼを含むが、それらに限定されない。

外因性分子は、内因性分子と同一の種類の分子、例えば、外因性タンパク質又は核酸であり得る。例えば、外因性核酸は、細胞に導入される感染ウイルスゲノム、プラスミド、若しくはエピソーム、又は細胞中に通常存在しない染色体を含み得る。細胞中に外因性分子を導入するための方法が当業者に既知であり、脂質媒介導入（すなわち、中性及びカチオン性脂質を含むリポソーム）、電気穿孔、直接注入、細胞融合、粒子銃、リン酸カルシウム共沈、ＤＥＡＥ−デキストラン媒介導入、及びウイルスベクター媒介導入を含むが、これらに限定されない。

対称的に、「内因性」分子は、特定の環境条件下において特定の発育段階の特定の細胞内に通常存在する分子である。例えば、内因性核酸は、染色体、ミトコンドリアのゲノム、葉緑体のゲノム、若しくは他の小器官のゲノム、又は自然発生エピソーム核酸を含み得る。さらなる内在性分子は、タンパク質、例えば、転写因子及び酵素を含み得る。

「融合」分子は、２つ以上のサブユニット分子が、好ましくは共有結合的に結合される分子である。サブユニット分子は、分子の同一の化学的種類であり得るか、又は分子の異なる化学的種類であり得る。第１の種類の融合分子の例には、融合タンパク質（例えば、ＴＡＬＥ反復ドメインと切断ドメインとの間の融合物）、及び融合核酸（例えば、上述の融合タンパク質をコードする核酸）が挙げられるが、それらに限定されない。第２の種類の融合分子の例には、三本鎖形成核酸とポリペプチドとの間の融合物、及び副溝結合剤と核酸との間の融合物が挙げられるが、これらに限定されない。

細胞における融合タンパク質の発現は、細胞への融合タンパク質の送達、又は細胞への融合タンパク質をコードするポリヌクレオチドの送達に起因し得、ポリヌクレオチドが転写され、転写物が翻訳されて、融合タンパク質を生成する。トランススプライシング、ポリペプチド切断、及びポリペプチド連結も、細胞におけるタンパク質の発現に関与し得る。細胞へのポリヌクレオチド及びポリペプチドの送達の方法が本開示の他の箇所で提示されている。

本開示の目的において、「遺伝子」は、遺伝子産物（以下を参照のこと）をコードするＤＮＡ領域、並びに遺伝子産物の産生を制御する全てのＤＮＡ領域（そのような制御配列がコード配列及び／又は転写配列に隣接するか否かにかかわらず）を含む。したがって、遺伝子は、プロモーター配列、ターミネータ、リポソーム結合部位及び内部リポソーム進入部位等の翻訳制御配列、エンハンサー、サイレンサー、インスレーター、境界要素、複製起点、マトリックス付着部位、並びに遺伝子座制御領域を含むが、これらに限定されない。

「遺伝子発現」は、遺伝子に含有される情報の遺伝子産物への変換を指す。遺伝子産物は、遺伝子の直接転写産物（例えば、ｍＲＮＡ、ｔＲＮＡ、ｒＲＮＡ、アンチセンスＲＮＡ、リボザイム、構造的ＲＮＡ、ｓｈＲＮＡ、ＲＮＡｉ、ｍｉＲＮＡ、若しくは任意の他の種類のＲＮＡ）、又はｍＲＮＡの翻訳によって産生されるタンパク質であり得る。遺伝子産物は、キャッピング、ポリアデニル化、メチル化、及び編集等のプロセスによって修飾されるＲＮＡ、並びに例えば、メチル化、アセチル化、リン酸化、ユビキチン化、ＡＤＰリボシル化、ミリスチリル化、及びグリコシル化によって修飾されるタンパク質も含む。

「ギャップ寸法」は、核酸標的上の２つのＴＡＬＥ標的部位の間のヌクレオチドを指す。ギャップは、１〜１００個の塩基対又は５〜３０個の塩基対、好ましくは、１０〜２５個の塩基対、及びより好ましくは、１２〜２１個の塩基対を含むが、それらに限定されない、任意の寸法であり得る。したがって、好ましいギャップ寸法は、１２、１３、１４、１５、１６、１７、１８、１９、２０、又は２１個の塩基対であり得る。

遺伝子発現の「調節」は、遺伝子の活性の変化を指す。発現の調節は、遺伝子活性化及び遺伝子抑制を含み得るが、それらに限定されない。ゲノム編集（例えば、切断、変更、不活性化、ドナー組込み、ランダム変異）を用いて、発現を調節することができる。遺伝子不活性化は、本明細書に記載の修飾因子を含まない細胞と比較した、遺伝子発現の任意の減少を指す。したがって、遺伝子不活性化は、部分的又は全体的であり得る。

「目的とする領域」は、例えば、遺伝子、又は遺伝子内若しくは遺伝子に隣接する非コード配列等の細胞クロマチンの任意の領域であり、その中で、外因性分子に結合することが所望される。結合は、標的化されたＤＮＡ切断及び／又は標的化組換えのためであり得る。目的とする領域は、例えば、染色体、エピソーム、小器官ゲノム（例えば、ミトコンドリア、葉緑体）、又は感染ウイルスゲノムに存在し得る。目的とする領域は、遺伝子のコード領域内、例えば、リーダー配列、トレーラー配列、若しくはイントロン等の転写非コード領域内、又はコード領域の上流又は下流のいずれかの非転写領域内であり得る。目的とする領域は、最小で単一のヌクレオチド対長、若しくは最大２，０００のヌクレオチド対長、又は任意の整数値のヌクレオチド対であり得る。

「動作可能結合」及び「動作可能に（ｏｐｅｒａｔｉｖｅｌｙ）結合される」（又は「動作可能に（ｏｐｅｒａｂｌｙ）結合される」）という用語は、２つ以上の構成要素（配列要素等）の並置に関連して同義に使用され、両方の構成要素が正常に機能し、かつ構成要素のうちの少なくとも１つが他の構成要素のうちの少なくとも１つにおいて発揮される機能を媒介し得る可能性を許容するように構成要素が配列される。例として、プロモーター等の転写制御配列は、転写制御配列が、１つ以上の転写制御因子の存在又は不在に応じてコード配列の転写レベルを制御するときに、コード配列に動作可能に結合される。転写制御配列は、概して、シスでコード配列と動作可能に結合されるが、それに直接隣接する必要はない。例えば、エンハンサーは、それらが隣接していない場合でも、コード配列に動作可能に結合される転写制御配列である。

融合ポリペプチドに関して、「動作可能に結合される」という用語は、構成要素のそれぞれが、動作可能に結合されない場合に実行するであろう機能と同一の機能を他の構成要素への結合において実行するという事実を指し得る。例えば、ＴＡＬＥ反復ドメインが切断ドメインに融合する融合ポリペプチドに関して、ＴＡＬＥ反復ドメイン及び切断ドメインは、融合ポリペプチドにおいて、ＴＡＬＥ反復ドメイン部分が、その標的部位及び／又はその結合部位に結合することができる一方で、切断ドメインが、標的部位の近くでＤＮＡを切断することができる場合、動作可能結合状態にある。

タンパク質、ポリペプチド、若しくは核酸の「機能フラグメント」は、その配列が、全長タンパク質、ポリペプチド、若しくは核酸と同一ではないが、全長タンパク質、ポリペプチド、若しくは核酸と同一の機能を保持するか、又は全長タンパク質、ポリペプチド、若しくは核酸と比較して、強化された機能を有する、タンパク質、ポリペプチド、若しくは核酸である。さらに、機能フラグメントは、全長タンパク質、ポリペプチド、若しくは核酸よりも少ない機能を有し得るが、依然としてユーザによって定義される十分な機能を有する。機能フラグメントは、対応する天然の分子よりも多い残基、少ない残基、若しくは対応する天然の分子と同一の数の残基を有し得、かつ／又は１つ以上のアミノ酸若しくはヌクレオチド置換を含有し得る。核酸の機能（例えば、コーディング機能、別の核酸にハイブリダイズする能力）を決定するための方法は、当技術分野において周知である。同様に、タンパク質の機能を決定するための方法が周知である。例えば、ポリペプチドのＤＮＡ結合機能を、例えば、フィルタ結合、電気泳動移動度シフト、又は免疫沈降アッセイによって決定することができる。ＤＮＡ切断を、ゲル電気泳動によってアッセイすることができる。上記のＡｕｓｕｂｅｌｅｔａｌ．を参照されたい。別のタンパク質と相互作用するタンパク質の能力を、例えば、免疫共沈降、２ハイブリッドアッセイ、又は相補（遺伝的及び生化学的の両方）によって決定することができる。例えば、Ｆｉｅｌｄｓｅｔａｌ．（１９８９）Ｎａｔｕｒｅ３４０：２４５−２４６、米国特許第５，５８５，２４５号及びＰＣＴＷＯ９８／４４３５０号を参照されたい。

ＴＡＬＥ反復ドメインを、例えば、超可変ジ残基領域、例えば、ＴＡＬＥタンパク質内の反復単位の１２位及び／又は１３位の遺伝子操作（１つ以上のアミノ酸の変更）を介して、所定のヌクレオチド配列に結合するために「遺伝子操作する」ことができる。いくつかの実施形態において、４、１１、及び３２位のアミノ酸を遺伝子操作することができる。他の実施形態では、非定型のＲＶＤを、遺伝子操作されたＴＡＬＥタンパク質で使用するために選択することができ、より広範囲の非天然標的部位の特定を可能にする。例えば、ＮＫＲＶＤを、標的配列におけるＧヌクレオチドの認識に使用するために選択することができる。他の実施形態では、反復単位のアミノ酸を変更して、反復単位の特性（すなわち、安定性又は二次的構造）を変化させることができる。したがって、遺伝子操作されたＴＡＬＥタンパク質は、非自然発生のタンパク質である。いくつかの実施形態において、ＴＡＬＥ反復ドメインをコードする遺伝子は、ＴＡＬＥ反復アミノ酸を特定するコドンは変更されるが、特定されたアミノ酸は変更されないように（例えば、コドン最適化の既知の技法を介して）、ＤＮＡレベルで遺伝子操作される。遺伝子操作されたＴＡＬＥタンパク質の非限定的な例としては、設計及び／又は選択によって得られるものである。設計されたＴＡＬＥタンパク質は、その設計／組成が主に合理的基準に由来する、自然に生じないタンパク質である。設計についての合理的基準には、置換ルール、並びに既存のＴＡＬＥ設計及び結合データの情報を格納するデータベース内の情報を処理するためのコンピュータアルゴリズムの適用が含まれる。「選択された」ＴＡＬＥ反復ドメインは、その産生が、主に、ファージディスプレイ、相互作用トラップ、又はハイブリッド選択等の経験的プロセスに由来する、非自然発生又は非定型のドメインである。

「多量体化ドメイン」は、ＴＡＬＥ融合タンパク質のアミノ末端領域、カルボキシ末端領域、又はアミノ及びカルボキシ末端領域で組み込まれるドメインである。それらのドメインは、複数のＴＡＬＥ融合タンパク質単位の多量体化を可能にする。多量体化ドメインの例には、ロイシンジッパーが挙げられる。多量体化ドメインを小分子によって制御することもでき、多量体化ドメインは、小分子又は外部リガンドの存在下においてのみ別の多量体化ドメインとの相互作用を可能にするために適切な立体配座を想定する。このようにして、外因性リガンドを用いて、それらのドメインの活性を制御することができる。

上述の方法において有用な標的部位は、他の基準による評価の影響下にあり得るか、又はそのような部位に特異的なＴＡＬＥ融合タンパク質の設計若しくは選択（必要に応じて）及び産生のために直接使用され得る。潜在的な標的部位を評価するためのさらなる基準は、遺伝子内の特定の領域へのそれらの近接性である。制御配列等の標的遺伝子を有する実証可能な生物学的有意性のあるセグメントを必ずしも含まないか、又は重複しない標的部位を選択することができる。標的セグメントをさらに評価するための他の基準は、そのようなセグメント若しくは関連セグメントに結合するＴＡＬＥ融合タンパク質の先行する可用性、及び／又は所定の標的セグメントに結合するように新しいＴＡＬＥ融合タンパク質を設計する容易性を含む。

標的セグメントが選択された後、セグメントに結合するＴＡＬＥ融合タンパク質は、様々なアプローチによって提供され得る。いったんＴＡＬＥ融合タンパク質が、選択、設計、又はさもなければ所定の標的セグメントに提供されると、ＴＡＬＥ融合タンパク質又はそれをコードするＤＮＡが合成される。ＴＡＬＥ反復ドメインを含有するタンパク質をコードするＤＮＡを合成及び発現する例示的な方法が、以下に記載される。その後、ＴＡＬＥ融合タンパク質又はそれをコードするポリヌクレオチドを、ＴＡＬＥ融合タンパク質が結合する標的部位を含有する標的遺伝子の発現の調節又は分析のために使用することができる。

ＴＡＬＥＤＮＡ結合ドメイン
本明細書に記載のポリペプチドは、１つ以上（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個以上）のＴＡＬＥ反復単位を含む。複数のＴＡＬＥ反復単位を含むＴＡＬＥＤＮＡ結合ドメインが、特異性に関与する配列を決定するために研究されている。１つの生物内で、ＴＡＬＥ反復は、典型的には、高度に保存される（ＲＶＤを除く）が、異なる種にわたってはよく保存されない場合もある。

本明細書に記載のポリペプチドにおいて見出されるＴＡＬＥ反復単位は、概して、Ｘ¹−Ｘ²−Ｘ³−Ｘ⁴−Ｘ⁵−Ｘ⁶−Ｘ⁷−Ｘ⁸−Ｘ⁹−Ｘ¹⁰−Ｘ¹¹−（Ｘ^RVD）₂−（Ｘ）_20~22（配列番号３９９）の形態であり、Ｘは、任意のアミノ酸であり、Ｘ^RVD（１２位及び１３位）は、ＤＮＡ結合に関与している。そのようなドメインの非限定的な例示的な実施形態には、Ｘ¹がロイシン（Ｌ）又はメチオニン（Ｍ）残基を含む実施形態、Ｘ¹⁰がアラニン（Ａ）残基又はバリン（Ｖ）残基を含む実施形態、（Ｘ）_20~22が配列（Ｇｌｙ又はＳｅｒ）−（Ｘ）_19~21(配列番号４００）を含む実施形態、（Ｘ）_20~22が配列（Ｘ）_3~4−（Ａｌａ又はＴｈｒ）−（Ｘ）_16~17（配列番号４０１）を含む実施形態、（Ｘ）_20~22が配列（Ｘ）_4~5−（Ｌｅｕ又はＶａｌ）−（Ｘ）_15~16（配列番号４０２）を含む実施形態、及び上述の実施形態のうちのいずれかの組み合わせ（例えば、Ｘ¹がロイシン（Ｌ）又はメチオニン（Ｍ）残基を含み、Ｘ¹⁰がアラニン（Ａ）残基を含み、Ｘ¹がＬ又はＭを含み、（Ｘ）_20~22が配列Ｇｌｙ／Ｓｅｒ−（Ｘ）_19~21を含み、（Ｘ）_20~22が配列Ｇｌｙ／Ｓｅｒ−（Ｘ）_2~3−Ａｌａ／Ｔｈｒ−（Ｘ）_16~17を含み、Ｘ¹⁰がアラニン（Ａ）又はバリン（Ｖ）残基を含み、かつ（Ｘ）_20~22が配列Ｇｌｙ／Ｓｅｒ−（Ｘ）_19~21を含む等）が含まれる。

本明細書に記載の組成物のＴＡＬＥ反復単位及び本明細書に記載の方法は、任意の好適なＴＡＬＥタンパク質に由来し得る。ＴＡＬＥタンパク質の非限定的な例には、ラルストニア種又はキサントモナス種に由来するＴＡＬＥタンパク質が挙げられる。したがって、いくつかの実施形態において、ＤＮＡ結合ドメインは、植物病原菌キサントモナスに由来する１つ以上の自然発生及び／又は遺伝子操作されたＴＡＬＥ反復単位を含む（Ｂｏｃｈｅｔａｌ，（２００９）Ｓｃｉｅｎｃｅ３２６：１５０９−１５１２、及びＭｏｓｃｏｕａｎｄＢｏｇｄａｎｏｖｅ，（２００９）Ｓｃｉｅｎｃｅ３２６：１５０１を参照のこと）。他の実施形態では、ＤＮＡ結合ドメインは、植物病原菌ラルストニア・ソラナセラムに由来する１つ以上の自然発生及び／又は遺伝子操作されたＴＡＬＥ反復単位、又はＴＡＬＥタンパク質ファミリー由来の他のＴＡＬＥＤＮＡ結合ドメインを含む。本明細書に記載のＴＡＬＥＤＮＡ結合ドメイン（少なくとも１つのＴＡＬＥ反復単位を含む）は、（ｉ）自然に見出されない１つ以上のＴＡＬＥ反復単位、（ｉｉ）１つ以上の自然発生ＴＡＬＥ反復単位、（ｉｉｉ）非定型のＲＶＤを有する１つ以上のＴＡＬＥ反復単位、並びに（ｉ）、（ｉｉ）、及び／又は（ｉｉｉ）の組み合わせを含み得る。いくつかの実施形態において、本発明のＴＡＬＥＤＮＡ結合ドメインは、完全に非自然発生又は非定型の反復単位からなる。さらに、２つ以上のＴＡＬＥ反復単位を含む本明細書に記載のポリペプチドにおいて、（自然発生又は遺伝子操作された）ＴＡＬＥ反復単位は、同一の種に由来し得るか、又はあるいは、異なる種に由来し得る。

表１は、２つのＴＡＬＥタンパク質内の例示的な反復単位のアライメントを示す。それぞれのＴＡＬＥ反復が、別々のライン上に示され、列は、反復の種類、その反復の開始位置、反復の名称、超可変位置における残基、及び全体の反復配列を示す。

ＡＡＢ００６７５．１（１３．５個のＴＡＬＥ反復）、ＡＡＢ６９８６５．１（１３．５個の反復）、ＡＡＣ４３５８７．１（１７．５個の反復）、ＡＡＤ０１４９４．１（１２．５個の反復）、ＡＡＦ９８３４３．１（２５．５個の反復）、ＡＡＧ０２０７９．２（２５．５個の反復）、ＡＡＮ０１３５７．１（８．５個の反復）、ＡＡＯ７２０９８（１７．５個の反復）、ＡＡＱ７９７７３．２（５．５個の反復）、ＡＡＳ４６０２７．１（２８．５個の反復）、ＡＡＳ５８１２７．２（１３．５個の反復）、ＡＡＳ５８１２８．２（１７．５個の反復）、ＡＡＳ５８１２９．３（１８．５個の反復）、ＡＡＳ５８１３０．３（９．５個の反復）、ＡＡＴ４６１２３．１（２２．５個の反復）、ＡＡＴ４６１２４．１（２６．５個の反復）、ＡＡＷ５９４９１．１（５．５個の反復）、ＡＡＷ５９４９２．１（１６．５個の反復）、ＡＡＷ５９４９３．１（１９．５個の反復）、ＡＡＷ７７５１０．１（５．５個の反復）、ＡＡＹ４３３５８（２１．５個の反復）、ＡＡＹ４３３５９．１（１１．５個の反復）、ＡＡＹ４３３６０．１（１４．５個の反復）、ＡＡＹ５４１６６．１（１９．５個の反復）、ＡＡＹ５４１６８．１（１６．５個の反復）、ＡＡＹ５４１６９．１（１２．５個の反復）、ＡＡＹ５４１７０．１（２３．５個の反復）、ＡＢＢ７０１２９．１（２１．５個の反復）、ＡＢＢ７０１８３．１（２２．５個の反復）、ＡＢＯ７７７７９．１（１７．５個の反復）等を含む、いくつかのＴＡＬＥＤＮＡ結合タンパク質が同定されており、標準のＧｅｎＢａｎｋ検索において見出すことができる。

ＴＡＬＥ型のタンパク質も細菌ラルストニア・ソラナセラムにおいて見出されており、表２は、これらのＤＮＡ結合ドメインの２つの例の類似の比較を列記する。

ラルストニア由来のＴＡＬＥ型のタンパク質のさらなる例には、ＡＢＯ２７０６９．１（１０．５個の反復）、ＡＢＯ２７０７０．１（１１．５個の反復）、ＡＢＯ２７０７１．１（７．５個の反復）、ＡＢＯ２７０７２．１（３．５個の反復）等が挙げられる。

本明細書に記載のＴＡＬＥ反復ドメインを含むＤＮＡ結合ポリペプチドは、さらなるＴＡＬＥポリペプチド配列、例えば、Ｎ末端（Ｎキャップ）配列、及び任意で反復ドメインに隣接するＣ末端（Ｃキャップ）配列も含み得る。Ｎキャップ配列は、ＤＮＡ結合ポリペプチド及びこれらのＴＡＬＥ反復ドメインを含有するＤＮＡ結合ポリペプチドを含む融合タンパク質の機能（例えば、ＤＮＡ結合、切断、活性化等）を支援するのに十分な任意の長さの自然又は非自然発生配列であり得る。ある特定の実施形態において、タンパク質は、反復ドメインのＴＡＬＥタンパク質Ｎ末端の領域のフラグメント（切断物）を含むＮキャップ配列（例えば、反復ドメインのＴＡＬＥポリペプチドのＮ末端の少なくとも１３０〜１４０個の残基（例えば、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、又は１４０個の残基）を含むＮキャップ配列）を含む。他の実施形態では、本明細書に記載のＴＡＬＥ反復ドメインポリペプチドにおいて、タンパク質は、反復ドメインのＴＡＬＥタンパク質Ｃ末端のフラグメント（切断された）領域を含むＣキャップ配列（例えば、Ｃ−２０〜Ｃ＋２８、Ｃ−２０〜Ｃ＋５５、又はＣ−２０〜Ｃ＋６３を含むＣキャップ配列）を含む。ある特定の実施形態において、Ｃキャップ配列は、半反復（Ｃ−２０〜Ｃ−１）を含む。本明細書に記載のＴＡＬＥＤＮＡ結合ポリペプチドは、Ｎキャップ配列、Ｃキャップ配列、又はＮキャップ配列及びＣキャップ配列の両方を含む。

表１及び表２に示されるＴＡＬＥ反復の完全なタンパク質配列（ＴＡＬＥ反復ドメイン、並びにＮ末端及びＣ末端配列を含む）が、以下の表３に示される。表１及び表２のＴＡＬＥ反復配列は、太字で示される。

天然又は遺伝子操作されたＴＡＬＥ反復単位を使用して、新規の配列に結合する人工ＴＡＬＥタンパク質及びＴＡＬＥ融合タンパク質を産生することができる（同書のＢｏｃｈｅｔａｌ、及びＭｏｒｂｉｔｚｅｒｅｔａｌ，（２０１０）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１０７（５０）：２１６１７−２１６２２を参照のこと）。例えば、国際公開第ＷＯ２０１０／０７９４３０号も参照されたい。この新規の標的配列を植物細胞中のレポーター遺伝子の上流に挿入したとき、研究者は、レポーター遺伝子の活性化を実証することができた。ＦｏｋＩ切断ドメインを含む人工ＴＡＬＥ融合物は、生細胞内のＤＮＡを切断することもできる（同書のＣｈｒｉｓｔｉｎｅｔａｌ、同書のＬｉｅｔａｌ（２０１１ａ）及び（２０１１ｂ）、Ｃｅｒｎａｋｅｔａｌ（２０１１）Ｎｕｃｌ．Ａｃｉｄ．Ｒｅｓ．ｅｐｕｂｄｏｉ：１０．１０９３／ｎａｒ／ｇｃｒ２１８を参照のこと）。

遺伝子操作されたＴＡＬＥタンパク質及びＴＡＬＥ融合タンパク質は、自然発生ＴＡＬＥタンパク質と比較して、新規の結合特異性を有し得る。遺伝子操作方法は、合理的設計及び種々の種類の選択を含むが、それらに限定されない。合理的設計は、例えば、単一又は複数のＴＡＬＥ反復のためのモジュールのヌクレオチド配列を含むデータベースの使用を含む。ファージディスプレイ及び２ハイブリッド系を含む例示的な選択方法は、米国特許第５，７８９，５３８号、同第５，９２５，５２３号、同第６，００７，９８８号、同第６，０１３，４５３号、同第６，４１０，２４８号、同第６，１４０，４６６号、同第６，２００，７５９号、及び同第６，２４２，５６８号、並びに国際公開第ＷＯ９８／３７１８６号、同第ＷＯ９８／５３０５７号、同第ＷＯ００／２７８７８号、同第ＷＯ０１／８８１９７号、及び英国特許第２，３３８，２３７号に開示されている。自然発生ＴＡＬＥタンパク質において、可能性のあるジペプチドモチーフの限定されたレパートリーのみが、典型的に採用される。したがって、本明細書に記載されるように、全ての可能性のあるモノ及びジペプチド配列を含有するＴＡＬＥ関連ドメインが構築され、候補ＴＡＬＥタンパク質に組み立てられている。したがって、ある特定の実施形態において、ＤＮＡ結合タンパク質の１つ以上のＴＡＬＥ反復単位は、非定型のＲＶＤを含む。

さらに、同一の種の自然発生ＴＡＬＥタンパク質において、反復単位は、多くの場合、フレームワーク配列内で可変性をほとんど示さない（すなわち、残基（複数を含む）は、直接ＤＮＡ接触に関与しない（ＲＶＤ残基ではない））。この可変性の欠如は、個々のＴＡＬＥ反復単位間の進化的関係、及び隣接反復間でのタンパク質折り畳みの要件を含む、いくつかの要因に起因し得る。しかしながら、異なる植物病原性細菌種間において、フレームワーク配列は異なり得る。例えば、トウガラシ斑点細菌病（Ｘａｎｔｈｏｍｏｎａｓｃａｍｐｅｓｔｒｉｓｐｖ．Ｖｅｓｉｃａｔｏｒｉａ）におけるＴＡＬＥ反復配列において、タンパク質ＡｖｒＢｓ３は、ラルストニア・ソラナセラム由来のｂｒｇ１１及びｈｐｘ１７反復単位と４０％未満の相同性を有する（Ｈｅｕｅｒｅｔａｌ（２００７）ＡｐｐｌＥｎｖｉｒｏｎＭｉｃｒｏ７３（１３）：４３７９−４３８４を参照のこと）。ＴＡＬＥ反復は、それぞれの細菌の天然環境におけるストリンジェントな機能選択下にあり、例えば、ＴＡＬＥが制御する宿主植物中の遺伝子の配列由来であり得る。したがって、本明細書に記載されるように、ＴＡＬＥフレームワーク内の変異体（例えば、Ｎキャップ及びＣキャップ配列等の反復単位の外側のＴＡＬＥ反復単位又は配列内）を、当技術分野において既知の種々の方法によって、標的化又はランダム変異誘発により導入することができ、結果として得られるＴＡＬＥ融合タンパク質を、最適な活性についてスクリーニングすることができる。

多ＴＡＬＥ反復モジュールはまた、上述のＤＮＡ結合ドメインの組み立て（少なくとも１つのＴＡＬＥ反復単位を含む）のみならず、小さいＴＡＬＥ多量体（すなわち、三量体、四量体、五量体等）の組み立てにも有用であり得、小さいＴＡＬＥＤＮＡ結合ドメイン間でキャッピング領域としても機能するスパニングリンカーは、塩基のスキッピングを可能にし、より高いＤＮＡ結合特異性をもたらし得る。結合された小さいＴＡＬＥＤＮＡ結合ドメインの使用は、個々のＴＡＬＥ反復のレベルで厳密な機能モジュール性の要件を緩和し、より複雑かつ／又は特定のＤＮＡ認識スキームの開発を可能にし、所与のモジュール内の隣接モチーフ由来のアミノ酸は、所望のＤＮＡ標的配列の共同認識のために相互に自由に相互作用し得る。小さいＴＡＬＥＤＮＡ結合ドメインを、ランダム化ジペプチドモチーフ（又は任意の他の同定された重要な位置）を有する好適な選択系（すなわち、ファージディスプレイ）を用いて結合及び発現することができ、それらの核酸結合特性に基づいて選択することができる。あるいは、任意の特定の所望のＴＡＬＥ融合タンパク質の迅速な構築を可能にするために、多ＴＡＬＥ反復モジュールを使用して、反復モジュールのアーカイブを作成することができる。

融合タンパク質（及び融合タンパク質をコードするポリヌクレオチド）の設計及び構築のための標的部位の選択及び方法は、当業者に既知であり、参照によりそれらの全体が本明細書に組み込まれる、米国特許出願公開第２００５００６４４７４号及び同第２００６０１８８９８７号に詳細に記載されている。

亜鉛フィンガーＤＮＡ結合ドメインに対するＴＡＬＥＤＮＡ結合ドメインを結合する人工融合タンパク質を産生することもできる。これらの融合物を、所望の機能ドメインにさらに結合することもできる。

加えて、これら及び他の参考文献に開示されるように、キャッピング配列（Ｎキャップ及びＣキャップ配列）として機能することができる配列が、ＴＡＬＥ反復ドメインとリンカーとの間の界面で必要とされるが、ＴＡＬＥＤＮＡ結合ドメイン及び／又は亜鉛フィンガードメインを、例えば、５以上のアミノ酸長のリンカー（例えば、ＴＧＥＫＰ（配列番号４８）、ＴＧＧＱＲＰ（配列番号４９）、ＴＧＱＫＰ（配列番号５０）、及び／又はＴＧＳＱＫＰ（配列番号５１））を含む、任意の好適なリンカー配列を使用して、ともに結合することができる。したがって、リンカーが使用されるとき、ＴＡＬＥＤＮＡ結合ドメインを所望の融合パートナードメインに結合させるために、５つ以上のアミノ酸のリンカーを、キャップ配列とともに使用することができる。６以上のアミノ酸長の例示的なリンカー配列については、米国特許第６，４７９，６２６号、同第６，９０３，１８５号、及び同第７，１５３，９４９号も参照されたい。加えて、ＴＡＬＥ反復ドメインと融合した機能タンパク質ドメインとの間のリンカーを、最も効率的なゲノム修飾を可能にするために、柔軟であるか、又は位置的に制約されるかのいずれかになるよう構築することができる。異なる長さのリンカー及び組成物を試験することができる。

融合タンパク質
本明細書に記載のＤＮＡ結合タンパク質を含む融合タンパク質（例えば、ＴＡＬＥ融合タンパク質）及び異種制御若しくは機能ドメイン（又はその機能フラグメント）も提供される。一般的なドメインには、例えば、転写因子ドメイン（活性化因子、抑制因子、共活性化因子、共抑制因子）、ヌクレアーゼドメイン、サイレンサードメイン、癌遺伝子ドメイン（例えば、ｍｙｃ、ｊｕｎ、ｆｏｓ、ｍｙｂ、ｍａｘ、ｍａｄ、ｒｅｌ、ｅｔｓ、ｂｃｌ、ｍｙｂ、ｍｏｓファミリーメンバー等）；ＤＮＡ修復酵素並びにそれらの関連因子及び修飾因子；ＤＮＡ転位酵素並びにそれらの関連因子及び修飾因子；クロマチン関連タンパク質並びにそれらの修飾因子（例えば、キナーゼ、アセチラーゼ、及びデアセチラーゼ）；並びにＤＮＡ修飾酵素（例えば、メチルトランスフェラーゼ、トポイソメラーゼ、ヘリカーゼ、リガーゼ、キナーゼ、ホスファターゼ、ポリメラーゼ、エンドヌクレアーゼ）、ＤＮＡ標的酵素、例えば、トランスポゾン、インテグラーゼ、リコンビナーゼ、及びリゾルバーゼ、並びにそれらの関連因子及び修飾因子、核ホルモン受容体、ヌクレアーゼ（切断ドメイン又は半ドメイン）、及びリガンド結合ドメインが含まれる。他の融合タンパク質は、レポーター又は選択マーカーを含み得る。レポータードメインの例には、ＧＦＰ、ＧＵＳ等が挙げられる。植物細胞において特定の有用性を有するレポーターは、ＧＵＳを含む。

活性化の達成に好適なドメインには、ＨＳＶＶＰ１６活性化ドメイン（例えば、Ｈａｇｍａｎｎｅｔａｌ．，Ｊ．Ｖｉｒｏｌ．７１、５９５２−５９６２（１９９７）を参照のこと）、核ホルモン受容体（例えば、Ｔｏｒｃｈｉａｅｔａｌ．，Ｃｕｒｒ．Ｏｐｉｎ．ＣｅｌｌＢｉｏｌ．１０：３７３−３８３（１９９８）を参照のこと）、核因子カッパＢのｐ６５サブユニット（Ｂｉｔｋｏ＆Ｂａｒｉｋ，Ｊ．Ｖｉｒｏｌ．７２：５６１０−５６１８（１９９８）及びＤｏｙｌｅ＆Ｈｕｎｔ，Ｎｅｕｒｏｒｅｐｏｒｔ８：２９３７−２９４２（１９９７））、Ｌｉｕｅｔａｌ．，ＣａｎｃｅｒＧｅｎｅＴｈｅｒ．５：３−２８（１９９８））、又はＶＰ６４等の人工キメラ機能ドメイン（Ｂｅｅｒｌｉｅｔａｌ．，（１９９８）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９５：１４６２３−３３）、及びデグロン（Ｍｏｌｉｎａｒｉｅｔａｌ．，（１９９９）ＥＭＢＯＪ．１８，６４３９−６４４７）が含まれる。さらなる例示的な活性化ドメインには、Ｏｃｔ−１、Ｏｃｔ−２Ａ、Ｓｐ１、ＡＰ−２、及びＣＴＦ１（Ｓｅｉｐｅｌｅｔａｌ．，ＥＭＢＯＪ．１１，４９６１−４９６８（１９９２）、並びにｐ３００、ＣＢＰ、ＰＣＡＦ、ＳＲＣ１ＰｖＡＬＦ、ＡｔＨＤ２Ａ、及びＥＲＦ−２が含まれる。例えば、Ｒｏｂｙｒｅｔａｌ．（２０００）Ｍｏｌ．Ｅｎｄｏｃｒｉｎｏｌ．１４：３２９−３４７、Ｃｏｌｌｉｎｇｗｏｏｄｅｔａｌ．（１９９９）Ｊ．Ｍｏｌ．Ｅｎｄｏｃｒｉｎｏｌ．２３：２５５−２７５、Ｌｅｏｅｔａｌ．（２０００）Ｇｅｎｅ２４５：１−１１、Ｍａｎｔｅｕｆｆｅｌ−Ｃｙｍｂｏｒｏｗｓｋａ（１９９９）ＡｃｔａＢｉｏｃｈｉｍ．Ｐｏｌ．４６：７７−８９、ＭｃＫｅｎｎａｅｔａｌ．（１９９９）Ｊ．ＳｔｅｒｏｉｄＢｉｏｃｈｅｍ．Ｍｏｌ．Ｂｉｏｌ．６９：３−１２、Ｍａｌｉｋｅｔａｌ．（２０００）ＴｒｅｎｄｓＢｉｏｃｈｅｍ．Ｓｃｉ．２５：２７７−２８３、及びＬｅｍｏｎｅｔａｌ．（１９９９）Ｃｕｒｒ．Ｏｐｉｎ．Ｇｅｎｅｔ．Ｄｅｖ．９：４９９−５０４を参照されたい。さらなる例示的な活性化ドメインには、ＯｓＧＡＩ、ＨＡＬＦ−１、Ｃ１、ＡＰ１、ＡＲＦ−５、−６、−７、及び−８、ＣＰＲＦ１、ＣＰＲＦ４、ＭＹＣ−ＲＰ／ＧＰ、並びにＴＲＡＢ１が含まれるが、それらに限定されない。例えば、Ｏｇａｗａｅｔａｌ．（２０００）Ｇｅｎｅ２４５：２１−２９、Ｏｋａｎａｍｉｅｔａｌ．（１９９６）ＧｅｎｅｓＣｅｌｌｓ１：８７−９９、Ｇｏｆｆｅｔａｌ．（１９９１）ＧｅｎｅｓＤｅｖ．５：２９８−３０９、Ｃｈｏｅｔａｌ．（１９９９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．４０：４１９−４２９、Ｕｌｍａｓｏｎｅｔａｌ．（１９９９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９６：５８４４−５８４９、Ｓｐｒｅｎｇｅｒ−Ｈａｕｓｓｅｌｓｅｔａｌ．（２０００）ＰｌａｎｔＪ．２２：１−８、Ｇｏｎｇｅｔａｌ．（１９９９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．４１：３３−４４、及びＨｏｂｏｅｔａｌ．（１９９９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９６：１５，３４８−１５，３５３を参照されたい。

本明細書に記載のＤＮＡ結合ドメインと機能ドメインとの間の融合タンパク質（又は融合タンパク質をコードする核酸）の形成において、活性化ドメイン又は活性化ドメインと相互作用する分子のいずれかが機能ドメインとして好適であることは、当業者には明らかである。本質的には、活性化複合体を補充することができ、かつ／又は標的遺伝子に対する活性（例えば、ヒストンアセチル化等）を活性化することができる任意の分子が、融合タンパク質の活性化ドメインとして有用である。融合分子において機能ドメインとしての使用に好適なＩＳＷＩ含有ドメイン及び／又はメチル結合ドメインタンパク質等の絶縁体ドメイン、局在化ドメイン、並びにクロマチンリモデリングタンパク質が、例えば、共同所有の米国特許出願第２００２／０１１５２１５号及び同第２００３／００８２５５２号並びに共同所有の国際公開第ＷＯ０２／４４３７６号に記載されている。

例示的な抑制ドメインは、ＫＲＡＢＡ／Ｂ、ＫＯＸ、ＴＧＦベータ誘導性初期遺伝子（ＴＩＥＧ）、ｖ−ｅｒｂＡ、ＳＩＤ、ＭＢＤ２、ＭＢＤ３、ＤＮＭＴファミリーのメンバー（例えば、ＤＮＭＴ１、ＤＮＭＴ３Ａ、ＤＮＭＴ３Ｂ）、Ｒｂ、及びＭｅＣＰ２を含むが、それらに限定されない。例えば、Ｂｉｒｄｅｔａｌ．（１９９９）Ｃｅｌｌ９９：４５１−４５４、Ｔｙｌｅｒｅｔａｌ．（１９９９）Ｃｅｌｌ９９：４４３−４４６、Ｋｎｏｅｐｆｌｅｒｅｔａｌ．（１９９９）Ｃｅｌｌ９９：４４７−４５０、及びＲｏｂｅｒｔｓｏｎｅｔａｌ．（２０００）ＮａｔｕｒｅＧｅｎｅｔ．２５：３３８−３４２を参照されたい。さらなる例示的な抑制ドメインは、ＲＯＭ２及びＡｔＨＤ２Ａを含むが、それらに限定されない。例えば、Ｃｈｅｍｅｔａｌ．（１９９６）ＰｌａｎｔＣｅｌｌ８：３０５−３２１、及びＷｕｅｔａｌ．（２０００）ＰｌａｎｔＪ．２２：１９−２７を参照されたい。

ある特定の実施形態において、ＴＡＬＥ融合タンパク質によって結合される標的部位は、細胞クロマチンのアクセス可能な領域に存在する。アクセス可能な領域を、例えば、共同所有の国際公開第ＷＯ０１／８３７３２号に記載されるように決定することができる。標的部位が細胞クロマチンのアクセス可能な領域に存在しない場合、１つ以上のアクセス可能な領域を、共同所有の国際公開第ＷＯ０１／８３７９３号に記載されるように生成することができる。さらなる実施形態において、融合分子のＤＮＡ結合ドメインは、その標的部位がアクセス可能な領域にあるか否かにかかわらず、細胞クロマチンに結合することができる。例えば、そのようなＤＮＡ結合ドメインは、リンカーＤＮＡ及び／又はヌクレオソームＤＮＡに結合することができる。この種類の「パイオニア」ＤＮＡ結合ドメインの例は、ある特定のステロイド受容体及び肝細胞核因子３（ＨＮＦ３）において見出される。Ｃｏｒｄｉｎｇｌｅｙｅｔａｌ．（１９８７）Ｃｅｌｌ４８：２６１−２７０、Ｐｉｎａｅｔａｌ．（１９９０）Ｃｅｌｌ６０：７１９−７３１、及びＣｉｒｉｌｌｏｅｔａｌ．（１９９８）ＥＭＢＯＪ．１７：２４４−２５４。

融合分子を、当業者に既知のように、薬学的に許容される担体で製剤化することができる。例えば、Ｒｅｍｉｎｇｔｏｎ’ｓＰｈａｒｍａｃｅｕｔｉｃａｌＳｃｉｅｎｃｅｓ，１７ｔｈｅｄ．，１９８５、及び共同所有の国際公開第ＷＯ００／４２２１９号を参照されたい。

いったん融合分子がそのＤＮＡ結合ドメインを介して標的配列に結合すると、融合分子の機能構成要素／ドメインを、遺伝子の転写に影響を与えることができる様々な異なる構成要素のうちのいずれかから選択することができる。したがって、機能的成分は、活性化因子、抑制因子、共活性化因子、共抑制因子、及びサイレンサー等の多様な転写因子ドメインを含み得るが、これらに限定されない。

さらなる例示的な機能ドメインが、例えば、共同所有の米国特許第６，５３４，２６１号及び米国特許出願公開第２００２／０１６０９４０号において開示されている。

外因性小分子又はリガンドによって制御される機能ドメインを選択することもできる。例えば、ＲｈｅｏＳｗｉｔｃｈ（登録商標）技術を採用することができ、機能ドメインは、外部のＲｈｅｏＣｈｅｍ（商標）リガンドの存在下で、その活性立体配座のみを想定する（例えば、米国特許第２００９０１３６４６５号を参照のこと）。したがって、ＴＡＬＥ融合タンパク質を、制御可能な機能ドメインに動作可能に結合することができ、結果として得られるＴＡＬＥ融合タンパク質の活性は、外部リガンドによって制御される。

ある特定の実施形態において、ＴＡＬＥＤＮＡ結合タンパク質、又はそのフラグメントは、ＴＡＬＥＤＮＡ結合ドメインの少なくとも１つのヌクレアーゼ（切断ドメイン、切断半ドメイン）への融合（ＴＡＬＥ反復ドメイン、Ｎキャップ配列、並びに／又はＣキャップ配列のＮ末端及び／若しくはＣ末端）を介して、ヌクレアーゼとして使用される。本明細書に開示の融合タンパク質の切断ドメイン部分を、任意のエンドヌクレアーゼ又はエキソヌクレアーゼから得ることができる。切断ドメインが由来し得る例示的なエンドヌクレアーゼには、制限エンドヌクレアーゼ及びホーミングエンドヌクレアーゼが含まれるが、それらに限定されない。例えば、２００２−２００３Ｃａｔａｌｏｇｕｅ，ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ，Ｂｅｖｅｒｌｙ，ＭＡ、及びＢｅｌｆｏｒｔｅｔａｌ．（１９９７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５：３３７９−３３８８を参照されたい。ＤＮＡを切断するさらなる酵素が既知である（例えば、Ｓ１ヌクレアーゼ、マングビーンヌクレアーゼ、膵臓ＤＮａｓｅＩ、ミクロコッカスヌクレアーゼ、酵母ＨＯエンドヌクレアーゼ、Ｌｉｎｎｅｔａｌ．（ｅｄｓ．）Ｎｕｃｌｅａｓｅｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，１９９３も参照のこと）。これらの酵素（又はその機能フラグメント）のうちの１つ以上を、切断ドメイン及び切断半ドメインの源として使用することができる。

同様に、切断半ドメインは、上で説明されるように、切断活性に二量体化を必要とする任意のヌクレアーゼ又はその部分に由来し得る。概して、融合タンパク質が切断半ドメインを含む場合、２つの融合タンパク質が切断に必要とされる。あるいは、２つの切断半ドメインを含む単一のタンパク質を使用することができる。２つの切断半ドメインは、同一のエンドヌクレアーゼ（又はその機能フラグメント）に由来し得るか、又はそれぞれの切断半ドメインは、異なるエンドヌクレアーゼ（又はその機能フラグメント）に由来し得る。加えて、２つの融合タンパク質の標的部位は、好ましくは、相互に対して配置され、したがって、２つの融合タンパク質のそれらのそれぞれの標的部位への結合は、例えば、二量体化によって、切断半ドメインが機能切断ドメインを形成することを可能にする相互に空間的配向に、切断半ドメインを配置する。したがって、ある特定の実施形態において、標的部位の近端は、５〜８個のヌクレオチド又は１５〜１８個のヌクレオチドによって分離される。しかしながら、任意の整数のヌクレオチド又はヌクレオチド対が、２つの標的部位の間に介在し得る（例えば、２〜５０個以上のヌクレオチド対）。概して、切断部位は、標的部位の間にある。

制限エンドヌクレアーゼ（制限酵素）は、多くの種において存在し、ＤＮＡに配列特異的に結合することができ（認識部位で）、結合部位で、又は結合部位の近くで、ＤＮＡを切断することができる。ある特定の制限酵素（例えば、ＩＩＳ型）は、認識部位から除去された部位でＤＮＡを切断し、分離可能な結合及び切断ドメインを有する。例えば、ＩＩＳ型酵素ＦｏｋＩは、一方の鎖上のその認識部位から９番目のヌクレオチドで、かつ他方の鎖上のその認識部位から１３番目のヌクレオチドで、ＤＮＡの二本鎖切断を触媒する。例えば、米国特許第５，３５６，８０２号、同第５，４３６，１５０号、及び同第５，４８７，９９４号、並びにＬｉｅｔａｌ．（１９９２）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８９：４２７５−４２７９、Ｌｉｅｔａｌ．（１９９３）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９０：２７６４−２７６８、Ｋｉｍｅｔａｌ．（１９９４ａ）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９１：８８３−８８７、Ｋｉｍｅｔａｌ．（１９９４ｂ）Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２６９：３１，９７８−３１，９８２を参照されたい。したがって、一実施形態において、融合タンパク質は、少なくとも１つのＩＩＳ型制限酵素由来の切断ドメイン（若しくは切断半ドメイン）及び１つ以上のＴＡＬＥＤＮＡ結合ドメインを含み、遺伝子操作され得るか、又は遺伝子操作され得ない。

その切断ドメインが結合ドメインから分離可能である例示的なＩＩＳ型制限酵素には、ＦｏｋＩ及びＢｆｉＩが含まれる（Ｚａｒｅｍｂａｅｔａｌ，（２００４）ＪＭｏｌＢｉｏｌ．３３６（１）：８１−９２を参照のこと）。Ｆｏｋ酵素は、二量体として活性である（Ｂｉｔｉｎａｉｔｅｅｔａｌ．（１９９８）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９５：１０，５７０−１０，５７５を参照のこと）。ＴＡＬＥ反復ドメイン−ＦｏｋＩ融合物（又はＣキャップ及びＮキャップをさらに含むその変異体）を使用した細胞配列の標的化二本鎖切断及び／又は標的化置換のために、それぞれＦｏｋＩ切断半ドメインを含む２つの融合タンパク質を使用して、触媒的に活性な切断ドメインを再構成することができる。あるいは、ＴＡＬＥ反復ドメイン及び２つのＦｏｋＩ切断半ドメインを含有する単一のポリペプチド分子を使用することもできる。別の好ましいＩＩＳ型制限酵素は、ＢｆｉＩである（Ｚａｒｅｍｂａｅｔａｌ，（２００４）ＪＭｏｌＢｉｏｌ．３３６（１）：８１−９２を参照のこと）。この酵素の切断ドメインを、そのＤＮＡ結合ドメインから分離することができ、ＴＡＬＥＤＮＡ結合ドメインに動作可能に結合して、ＴＡＬＥＮを作成することができる。

切断ドメイン又は切断半ドメインは、切断活性を保持するか、又は機能切断ドメインを形成するために多量体化（例えば、二量体化）する能力を保持するタンパク質の任意の部分であり得る。

例示的なＩＩＳ型制限酵素が、その全体が本明細書に組み込まれる国際公開第ＷＯ０７／０１４２７５号に記載されている。さらなる制限酵素は、分離可能な結合及び切断ドメインも含有し、これらは、本開示によって熟慮される。例えば、Ｒｏｂｅｒｔｓｅｔａｌ．（２００３）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３１：４１８−４２０を参照されたい。

切断特異性を強化するために、ある特定の実施形態において、切断ドメインは、例えば、それら全ての開示が、参照によりそれらの全体が本明細書組み込まれる、米国特許公開第２００５００６４４７４号、同第２００６０１８８９８７号、同第２００８０１３１９６２号、同第２００９０３１１７８７号、同第２００９０３０５３４６号、同第２０１１００１４６１６号、及び米国特許出願第１２／９３１，６６０号に記載されるように、ホモ二量体化を最小限に抑えるか、又は阻止する、１つ以上の遺伝子操作された切断半ドメイン（二量体化ドメイン変異体とも称される）を含む。ＦｏｋＩの４４６、４４７、４７９、４８３、４８４、４８６、４８７、４９０、４９１、４９６、４９８、４９９、５００、５３１、５３４、５３７、及び５３８位のアミノ酸残基は全て、ＦｏｋＩ切断半ドメインの二量体化に影響を与えるための標的である。

偏性ヘテロ二量体を形成するＦｏｋＩの例示的な遺伝子操作された切断半ドメインは、第１の切断半ドメインがＦｏｋＩの４９０及び５３８位のアミノ酸残基での変異を含み、かつ第２の切断半ドメインが４８６及び４９９位のアミノ酸残基での変異を含む対を含む。

偏性ヘテロ二量体を形成するＦｏｋＩのさらなる遺伝子操作された切断半ドメインを、本明細書に記載の融合タンパク質において使用することができる。第１の切断半ドメインは、ＦｏｋＩの４９０及び５３８位のアミノ酸残基での変異を含み、第２の切断半ドメインは、４８６及び４９９位のアミノ酸残基での変異を含む。

したがって、一実施形態において、４９０位での変異は、Ｇｌｕ（Ｅ）をＬｙｓ（Ｋ）に置換し、５３８位での変異は、Ｉｓｏ（Ｉ）をＬｙｓ（Ｋ）に置換し、４８６位での変異は、Ｇｌｎ（Ｑ）をＧｌｕ（Ｅ）に置換し、４９９位での変異は、Ｉｓｏ（Ｉ）をＬｙｓ（Ｋ）に置換する。具体的には、本明細書に記載の遺伝子操作された切断半ドメインは、１つの切断半ドメインにおいて４９０位（Ｅ→Ｋ）及び５３８位（Ｉ→Ｋ）を変異させて、「Ｅ４９０Ｋ：Ｉ５３８Ｋ」と指定される遺伝子操作された切断半ドメインを産生することによって、かつ別の切断半ドメインにおいて４８６位（Ｑ→Ｅ）及び４９９位（Ｉ→Ｌ）を変異させて、「Ｑ４８６Ｅ：Ｉ４９９Ｌ」と指定される遺伝子操作された切断半ドメインを産生することによって調製される。本明細書に記載の遺伝子操作された切断半ドメインは、異常な切断が最小限に抑えられるか、又は無効にされる、偏性ヘテロ二量体変異体である。例えば、その開示が全ての目的のために参照によりその全体が組み込まれる、米国特許公開第２００８／０１３１９６２号の実施例１を参照されたい。

本明細書に記載の遺伝子操作された切断半ドメインは、異常な切断が最小限に抑えられるか、又は無効にされる、偏性ヘテロ二量体変異体である。例えば、国際公開第ＷＯ０７／１３９８９８号の実施例１を参照されたい。ある特定の実施形態において、遺伝子操作された切断半ドメインは、４８６位、４９９位、及び４９６位（野生型ＦｏｋＩに対して番号付けされた）での変異、例えば、４８６位の野生型Ｇｌｎ（Ｑ）残基をＧｌｕ（Ｅ）残基に置換し、４９９位の野生型Ｉｓｏ（Ｉ）残基をＬｅｕ（Ｌ）残基に置換し、かつ４９６位の野生型Ａｓｎ（Ｎ）残基をＡｓｐ（Ｄ）又はＧｌｕ（Ｅ）残基（それぞれ、「ＥＬＤ」及び「ＥＬＥ」ドメインとも称される）に置換する変異を含む。他の実施形態では、遺伝子操作された切断半ドメインは、４９０位、５３８位、及び５３７位（野生型ＦｏｋＩに対して番号付けされた）での変異、例えば、４９０位の野生型Ｇｌｕ（Ｅ）残基をＬｙｓ（Ｋ）残基に置換し、５３８位の野生型Ｉｓｏ（Ｉ）残基をＬｙｓ（Ｋ）残基に置換し、かつ５３７位の野生型Ｈｉｓ（Ｈ）残基をＬｙｓ（Ｋ）残基又はＡｒｇ（Ｒ）残基（それぞれ、「ＫＫＫ」及び「ＫＫＲ」ドメインとも称される）に置換する変異を含む。他の実施形態では、遺伝子操作された切断半ドメインは、４９０位及び５３７位（野生型ＦｏｋＩに対して番号付けされた）での変異、例えば、４９０位の野生型Ｇｌｕ（Ｅ）残基をＬｙｓ（Ｋ）残基に置換し、かつ５３７位の野生型Ｈｉｓ（Ｈ）残基をＬｙｓ（Ｋ）残基又はＡｒｇ（Ｒ）残基（それぞれ、「ＫＩＫ」及び「ＫＩＲ」ドメインとも称される）に置換する変異を含む（２０１０年２月８日出願の米国仮出願第６１／３３７，７６９号及び２０１０年９月２３日出願の米国仮出願第６１／４０３，９１６号を参照のこと）。加えて、「シャーキー（Ｓｈａｒｋｅｙ）」又は「シャーキー（シャーキープライム（Ｓｈａｒｋｅｙｐｒｉｍｅ））」変異として既知の変異を含むＦｏｋＩヌクレアーゼドメイン変異体を使用することができる（Ｇｕｏｅｔａｌ，（２０１０）Ｊ．Ｍｏｌ．Ｂｉｏｌ．ｄｏｉ：１０．１０１６／ｊ．ｊｍｂ．２０１０．０４．０６０を参照のこと）。

本明細書に記載の遺伝子操作された切断半ドメインを、任意の好適な方法を使用して、例えば、米国特許公開第２００５００６４４７４号、同第２００７０１３４７９６号、同第２００８０１３１９６２号に記載の野生型切断半ドメイン（ＦｏｋＩ）の部位指向性変異誘発によって調製することができる。

ＴＡＬＥ融合ポリペプチド及び核酸を、組換え遺伝学の分野における慣用的な技法を使用して作製することができる。本発明で使用される一般的な方法を開示する基本的な文書には、Ｓａｍｂｒｏｏｋｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ，ＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（２ｎｄｅｄ．１９８９）、Ｋｒｉｅｇｌｅｒ，ＧｅｎｅＴｒａｎｓｆｅｒａｎｄＥｘｐｒｅｓｓｉｏｎ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（１９９０）、及びＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（Ａｕｓｕｂｅｌｅｔａｌ．，ｅｄｓ．，１９９４））が含まれる。加えて、本質的には、任意の核酸を、様々な商業的供給源のうちのいずれかから特注することができる。同様に、ペプチド及び抗体を、様々な商業的供給源のうちのいずれかから特注することができる。

２つの代替の方法は、典型的には、新しく設計されたＤＮＡ結合ペプチドを発現するために必要とされるコード配列を作成するために使用される。１つのプロトコルは、重複したオリゴヌクレオチドを利用するＰＣＲに基づく組み立て手順である。これらのオリゴヌクレオチドは、それらを異なるＤＮＡ結合ドメインのそれぞれに特異的にする反復ドメインの１２位及び１３位に主に置換を含有するが、それらに限定されない。さらに、アミノ酸置換を、４、１１、及び３２位で作製することができる。アミノ酸置換を、１つの反復単位内の２、３、４、２１、２３、２４、２５、２７、３０、３１、３３、３４、及び／又は３５位で作製することもできる。いくつかの実施形態において、反復単位は、１つの位置での置換を含有し、他の実施形態では、反復単位は、２〜１８個のアミノ酸置換を含有する。いくつかの実施形態において、アミノ酸配列を変更することなく、反復単位のヌクレオチド配列を変更することができる。

当業者に既知のタンパク質精製の任意の好適な方法を使用して、本発明のＴＡＬＥ融合タンパク質を精製することができる（上記のＡｕｓｕｂｅｌ、上記のＳａｍｂｒｏｏｋを参照のこと）。加えて、任意の好適な宿主、例えば、細菌細胞、昆虫細胞、酵母細胞、哺乳類細胞等を使用することができる。

したがって、融合分子は、当業者に周知のクローニング及び生化学的接合の方法によって構築される。融合分子は、ＤＮＡ結合ドメイン及び機能ドメイン（例えば、転写活性化又は抑制ドメイン）を含む。融合分子は、任意で、核局在化シグナル（例えば、ＳＶ４０媒体Ｔ抗原からのシグナル等）並びにエピトープ標識（例えば、ＦＬＡＧ及び血球凝集素等）も含む。融合タンパク質（及びそれらをコードする核酸）は、翻訳リーディングフレームが融合の構成要素の間に保存されるように設計される。本明細書に記載の融合タンパク質は、本明細書に記載のＤＮＡ結合ポリペプチドのＮ末端及び／又はＣ末端で１つ以上の機能ドメインを含み得る。

一方で機能ドメイン（又はその機能フラグメント）のポリペプチド構成要素と、他方で非タンパク質ＤＮＡ結合ドメイン（例えば、抗生物質、挿入剤、副溝結合剤、核酸）との間の融合物は、当業者に既知の生化学的接合の方法によって構築される。例えば、ＰｉｅｒｃｅＣｈｅｍｉｃａｌＣｏｍｐａｎｙ（Ｒｏｃｋｆｏｒｄ，ＩＬ）の目録を参照されたい。副溝結合剤とポリペプチドとの間の融合物を作成するための方法及び組成物が記載されている。Ｍａｐｐｅｔａｌ．（２０００）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９７：３９３０−３９３５。

標的化切断のためのさらなる方法
任意の所望の遺伝子（複数を含む）中に標的部位を含む任意のヌクレアーゼを、本明細書に開示の方法において使用することができる。例えば、ホーミングエンドヌクレアーゼ及びメガヌクレアーゼは、非常に長い認識配列を有し、それらのうちのいくつかは、統計的基礎に従って、ヒト大のゲノムに一度存在する可能性が高い。所望の遺伝子中に標的部位を有する任意のそのようなヌクレアーゼを、標的化切断のために、例えば、亜鉛フィンガーヌクレアーゼ及び／若しくはメガヌクレアーゼを含むＴＡＬＥ反復ドメインヌクレアーゼ融合物の代わりに、又はそれに加えて使用することができる。

ある特定の実施形態において、ヌクレアーゼは、メガヌクレアーゼ（ホーミングエンドヌクレアーゼ）である。自然発生メガヌクレアーゼは、１５〜４０個の塩基対切断部位を認識し、通常、４つのファミリー：ＬＡＧＬＩＤＡＤＧファミリー、ＧＩＹ−ＹＩＧファミリー、Ｈｉｓ−Ｃｙｓｔボックスファミリー、及びＨＮＨファミリーに分類される。例示的なホーミングエンドヌクレアーゼには、Ｉ−ＳｃｅＩ、Ｉ−ＣｅｕＩ、ＰＩ−ＰｓｐＩ、ＰＩ−Ｓｃｅ、Ｉ−ＳｃｅＩＶ、Ｉ−ＣｓｍＩ、Ｉ−ＰａｎＩ、Ｉ−ＳｃｅＩＩ、Ｉ−ＰｐｏＩ、Ｉ−ＳｃｅＩＩＩ、Ｉ−ＣｒｅＩ、Ｉ−ＴｅｖＩ、Ｉ−ＴｅｖＩＩ、及びＩ−ＴｅｖＩＩＩが含まれる。それらの認識配列が既知である。米国特許第５，４２０，０３２号、米国特許第６，８３３，２５２号、Ｂｅｌｆｏｒｔｅｔａｌ．（１９９７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５：３３７９-３３８８、Ｄｕｊｏｎｅｔａｌ．（１９８９）Ｇｅｎｅ８２：１１５-１１８、Ｐｅｒｌｅｒｅｔａｌ．（１９９４）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２２，１１２５-１１２７、Ｊａｓｉｎ（１９９６）ＴｒｅｎｄｓＧｅｎｅｔ．１２：２２４-２２８、Ｇｉｍｂｌｅｅｔａｌ．（１９９６）Ｊ．Ｍｏｌ．Ｂｉｏｌ．２６３：１６３-１８０、Ａｒｇａｓｔｅｔａｌ．（１９９８）Ｊ．Ｍｏｌ．Ｂｉｏｌ．２８０：３４５-３５３、及びＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓの目録も参照されたい。

主にＬＡＧＬＩＤＡＤＧファミリー由来の自然発生メガヌクレアーゼ由来のＤＮＡ結合ドメインは、植物、酵母、ショウジョウバエ、哺乳類細胞、及びマウスにおいて部位特異的ゲノム修飾を促進するために使用されているが、このアプローチは、メガヌクレアーゼ認識配列を保存する相同遺伝子（Ｍｏｎｅｔｅｔａｌ．（１９９９），Ｂｉｏｃｈｅｍ．Ｂｉｏｐｈｙｓｉｃｓ．Ｒｅｓ．Ｃｏｍｍｏｎ．２５５：８８−９３）、又は認識配列が導入された事前に遺伝子操作されたゲノム（Ｒｏｕｔｅｅｔａｌ．（１９９４），Ｍｏｌ．ＣｅｌｌＢｉｏｌ．１４：８０９６−１０６、Ｃｈｉｌｔｏｎｅｔａｌ．（２００３），ＰｌａｎｔＰｈｙｓｉｏｌｏｇｙ．１３３：９５６−６５、Ｐｕｃｈｔａｅｔａｌ．（１９９６），Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９３：５０５５−６０、Ｒｏｎｇｅｔａｌ．（２００２），ＧｅｎｅｓＤｅｖ．１６：１５６８−８１、Ｇｏｕｂｌｅｅｔａｌ．（２００６），Ｊ．ＧｅｎｅＭｅｄ．８（５）：６１６−６２２）のいずれかの修飾に限定されている。したがって、医学的又は生物工学的関連部位で新規の結合特異性を呈するために、メガヌクレアーゼを遺伝子操作する試みが行われている（Ｐｏｒｔｅｕｓｅｔａｌ．（２００５），Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．２３：９６７−７３、Ｓｕｓｓｍａｎｅｔａｌ．（２００４），Ｊ．Ｍｏｌ．Ｂｉｏｌ．３４２：３１−４１、Ｅｐｉｎａｔｅｔａｌ．（２００３），ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３１：２９５２−６２、Ｃｈｅｖａｌｉｅｒｅｔａｌ．（２００２）Ｍｏｌｅｃ．Ｃｅｌｌ１０：８９５−９０５、Ｅｐｉｎａｔｅｔａｌ．（２００３）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３１：２９５２−２９６２、Ａｓｈｗｏｒｔｈｅｔａｌ．（２００６）Ｎａｔｕｒｅ４４１：６５６−６５９、Ｐａｑｕｅｓｅｔａｌ．（２００７）ＣｕｒｒｅｎｔＧｅｎｅＴｈｅｒａｐｙ７：４９−６６、米国特許公開第２００７０１１７１２８号、同第２００６０２０６９４９号、同第２００６０１５３８２６号、同第２００６００７８５５２号、及び同第２００４０００２０９２号）。

送達
ＴＡＬＥ融合タンパク質、ＴＡＬＥ融合タンパク質をコードするポリヌクレオチド、並びに本明細書に記載のタンパク質及び／又はポリヌクレオチドを含む組成物を、例えば、ＴＡＬ融合タンパク質をコードするｍＲＮＡの注入を含む、任意の好適な手段によって、標的細胞に送達することができる。Ｈａｍｍｅｒｓｃｈｍｉｄｔｅｔａｌ．（１９９９）ＭｅｔｈｏｄｓＣｅｌｌＢｉｏｌ．５９：８７−１１５を参照されたい。

遺伝子操作された転写因子を含むタンパク質の送達方法は、例えば、米国特許第６，４５３，２４２号、同第６，５０３，７１７号、同第６，５３４，２６１号、同第６，５９９，６９２号、同第６，６０７，８８２号、同第６，６８９，５５８号、同第６，８２４，９７８号、同第６，９３３，１１３号、同第６，９７９，５３９号、同第７，０１３，２１９号、及び同第７，１６３，８２４号において記載されており、それらの全ての開示は、参照によりそれらの全体が本明細書に組み込まれる。

本明細書に記載のＴＡＬＥタンパク質融合物を、ＴＡＬＥタンパク質融合物のうちの１つ以上をコードする配列を含有するベクターを使用して送達することもできる。プラスミドベクター、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、ポックスウイルスベクター、ヘルペスウイルスベクター、及びアデノ関連ウイルスベクター等を含むが、それらに限定されない任意のベクター系を使用することができる。参照によりそれらの全体が本明細書に組み込まれる、米国特許第６，５３４，２６１号、同第６，６０７，８８２号、同第６，８２４，９７８号、同第６，９３３，１１３号、同第６，９７９，５３９号、同第７，０１３，２１９号、及び同第７，１６３，８２４号も参照されたい。さらに、これらのベクターのうちのいずれかが、配列をコードする１つ以上のＴＡＬＥタンパク質融合物を含み得ることは明らかである。したがって、１つ以上のＴＡＬＥタンパク質融合物（例えば、ＴＡＬＥＮの対）が細胞に導入されるとき、ＴＡＬＥタンパク質融合物を、同一のベクター又は異なるベクターで輸送することができる。複数のベクターが使用される場合、それぞれのベクターは、配列をコードする１つ又は複数のＴＡＬＥタンパク質融合物を含み得る。

従来のウイルス及び非ウイルスに基づく遺伝子導入方法を使用して、細胞（例えば、哺乳類細胞）、全生物、又は標的組織において遺伝子操作されたＴＡＬＥタンパク質融合物をコードする核酸を導入することができる。そのような方法を使用して、細胞に、ＴＡＬＥタンパク質融合物をコードする核酸をインビトロで投与することができる。ある特定の実施形態において、ＴＡＬＥタンパク質融合物をコードする核酸は、インビボ又はエクスビボ使用のために投与される。非ウイルスベクター送達系は、ＤＮＡプラスミド、ネイキッド核酸、及びリポソーム又はポロキサマー等の送達ビヒクルと錯体形成された核酸を含む。ウイルスベクター送達系は、細胞への送達後にエピソームゲノム又は組込みゲノムのいずれかを有するＤＮＡ及びＲＮＡウイルスを含む。遺伝子操作されたＤＮＡ結合タンパク質及びこれらの結合タンパク質を含む融合タンパク質のインビボ送達の総説については、例えば、Ｒｅｂａｒ（２００４）ＥｘｐｅｒｔＯｐｉｎｉｏｎＩｎｖｅｓｔ．Ｄｒｕｇｓ１３（７）：８２９−８３９、Ｒｏｓｓｉｅｔａｌ．（２００７）ＮａｔｕｒｅＢｉｏｔｅｃｈ．２５（１２）：１４４４−１４５４、並びにＡｎｄｅｒｓｏｎ，Ｓｃｉｅｎｃｅ２５６：８０８−８１３（１９９２）、Ｎａｂｅｌ＆Ｆｅｌｇｎｅｒ，ＴＩＢＴＥＣＨ１１：２１１−２１７（１９９３）、Ｍｉｔａｎｉ＆Ｃａｓｋｅｙ，ＴＩＢＴＥＣＨ１１：１６２−１６６（１９９３）、Ｄｉｌｌｏｎ，ＴＩＢＴＥＣＨ１１：１６７−１７５（１９９３）、Ｍｉｌｌｅｒ，Ｎａｔｕｒｅ３５７：４５５−４６０（１９９２）、ＶａｎＢｒｕｎｔ，Ｂｉｏｔｅｃｈｎｏｌｏｇｙ６（１０）：１１４９−１１５４（１９８８）、Ｖｉｇｎｅ，ＲｅｓｔｏｒａｔｉｖｅＮｅｕｒｏｌｏｇｙａｎｄＮｅｕｒｏｓｃｉｅｎｃｅ８：３５−３６（１９９５）、Ｋｒｅｍｅｒ＆Ｐｅｒｒｉｃａｕｄｅｔ，ＢｒｉｔｉｓｈＭｅｄｉｃａｌＢｕｌｌｅｔｉｎ５１（１）：３１−４４（１９９５）、Ｈａｄｄａｄａｅｔａｌ．，ｉｎＣｕｒｒｅｎｔＴｏｐｉｃｓｉｎＭｉｃｒｏｂｉｏｌｏｇｙａｎｄＩｍｍｕｎｏｌｏｇｙＤｏｅｒｆｌｅｒａｎｄＢoｈｍ（ｅｄｓ．）（１９９５）、及びＹｕｅｔａｌ．，Ｇｅｎｅｔｈｅｒａｐｙ１：１３−２６（１９９４）等の一般的な遺伝子送達の参考文献を参照されたい。

非ウイルスベクター送達系は、電気穿孔、リポフェクション、微量注入、微粒子銃、ビロゾーム、リポソーム、免疫リポソーム、ポリカチオン又は脂質：核酸接合体、ネイキッドＤＮＡ、人工ビリオン、及び薬剤で強化されたＤＮＡの取込みを含む。例えば、Ｓｏｎｉｔｒｏｎ２０００システム（Ｒｉｃｈ−Ｍａｒ）を使用したソノポレーションを、核酸の送達に使用することもできる。ウイルスベクター送達系は、細胞への送達後にエピソームゲノム又は組込みゲノムのいずれかを有するＤＮＡ及びＲＮＡウイルスを含む。さらなる例示的な核酸送達系は、ＡｍａｘａＢｉｏｓｙｓｔｅｍ（Ｃｏｌｏｇｎｅ，Ｇｅｒｍａｎｙ）、Ｍａｘｃｙｔｅ，Ｉｎｃ．（Ｒｏｃｋｖｉｌｌｅ，Ｍａｒｙｌａｎｄ）、ＢＴＸＭｏｌｅｃｕｌａｒＤｅｌｉｖｅｒｙＳｙｓｔｅｍｓ（Ｈｏｌｌｉｓｔｏｎ，ＭＡ）、及びＣｏｐｅｒｎｉｃｕｓＴｈｅｒａｐｅｕｔｉｃｓＩｎｃによって提供されるものを含む（例えば、米国特許第６００８３３６号を参照のこと）。リポフェクションは、例えば、米国特許第５，０４９，３８６号、米国特許第４，９４６，７８７号、及び米国特許第４，８９７，３５５号に記載されており、リポフェクション試薬が市販されている（例えば、Ｔｒａｎｓｆｅｃｔａｍ（商標）及びＬｉｐｏｆｅｃｔｉｎ（商標））。ポリヌクレオチドの効率的な受容体認識リポフェクションに好適なカチオン性及び中性脂質は、Ｆｅｌｇｎｅｒの国際公開第ＷＯ９１／１７４２４号、国際公開第ＷＯ９１／１６０２４号に記載のものを含む。細胞（エクスビボ投与）又は標的組織（インビボ投与）に送達することができる。

免疫脂質複合体等の標的化されたリポソームを含む脂質：核酸複合体の調製は、当業者に周知である（例えば、Ｃｒｙｓｔａｌ，Ｓｃｉｅｎｃｅ２７０：４０４−４１０（１９９５）、Ｂｌａｅｓｅｅｔａｌ．，ＣａｎｃｅｒＧｅｎｅＴｈｅｒ．２：２９１−２９７（１９９５）、Ｂｅｈｒｅｔａｌ．，ＢｉｏｃｏｎｊｕｇａｔｅＣｈｅｍ．５：３８２−３８９（１９９４）、Ｒｅｍｙｅｔａｌ．，ＢｉｏｃｏｎｊｕｇａｔｅＣｈｅｍ．５：６４７−６５４（１９９４）、Ｇａｏｅｔａｌ．，ＧｅｎｅＴｈｅｒａｐｙ２：７１０−７２２（１９９５）、Ａｈｍａｄｅｔａｌ．，ＣａｎｃｅｒＲｅｓ．５２：４８１７−４８２０（１９９２）、米国特許第４，１８６，１８３号、同第４，２１７，３４４号、同第４，２３５，８７１号、同第４，２６１，９７５号、同第４，４８５，０５４号、同第４，５０１，７２８号、同第４，７７４，０８５号、同第４，８３７，０２８号、及び同第４，９４６，７８７号を参照のこと）。

送達のさらなる方法は、ＥｎＧｅｎｅＩＣの送達ビヒクル（ＥＤＶ）に送達される核酸のパッケージングの使用を含む。これらのＥＤＶは、抗体の一方のアームが標的組織に対する特異性を有し、かつ他方のアームがＥＤＶに対する特異性を有する二重特異性抗体を使用して、標的組織に特異的に送達される。抗体は、ＥＤＶを標的細胞の表面に運び、その後、ＥＤＶは、エンドサイトーシスによって細胞に運び込まれる。いったん細胞に入ると、内容物が放出される（ＭａｃＤｉａｒｍｉｄｅｔａｌ（２００９）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙｖｏｌ２７（７）ｐ．６４３を参照のこと）。

好適な細胞には、真核及び原核細胞並びに／又は細胞株が含まれるが、それらに限定されない。そのような細胞から生成されるそのような細胞又は細胞株の非限定的な例には、ＣＯＳ、ＣＨＯ（例えば、ＣＨＯ−Ｓ、ＣＨＯ−Ｋ１、ＣＨＯ−ＤＧ４４、ＣＨＯ−ＤＵＸＢ１１、ＣＨＯ−ＤＵＫＸ、ＣＨＯＫ１ＳＶ）、ＶＥＲＯ、ＭＤＣＫ、ＷＩ３８、Ｖ７９、Ｂ１４ＡＦ２８−Ｇ３、ＢＨＫ、ＨａＫ、ＮＳ０、ＳＰ２／０−Ａｇ１４、ＨｅＬａ、ＨＥＫ２９３（例えば、ＨＥＫ２９３−Ｆ、ＨＥＫ２９３−Ｈ、ＨＥＫ２９３−Ｔ）、及びｐｅｒＣ６細胞、並びにスポドプテラ・フルギペルダ（Ｓｆ）等の昆虫細胞、又はサッカロミセス、ピチア、及びシゾサッカロミセス等の真菌細胞が挙げられる。ある特定の実施形態において、細胞株は、ＣＨＯ−Ｋ１、ＭＤＣＫ、又はＨＥＫ２９３細胞株である。さらに、ＴＡＬＥ融合物での治療後に治療される対象への再導入のために、初代細胞を単離して、エクスビボで使用することができる。好適な初代細胞には、末梢血単核細胞（ＰＢＭＣ）、及びＣＤ４＋Ｔ細胞又はＣＤ８＋Ｔ細胞等であるが、それらに限定されない他の血球サブセットが含まれる。好適な細胞には、一例として、胚幹細胞、誘導性多能性幹細胞、造血幹細胞、神経幹細胞、間葉幹細胞、筋肉幹細胞、及び皮膚幹細胞等の幹細胞も含まれる。

修飾された幹細胞を、いくつかの実施形態において使用することもできる。例えば、アポトーシスへの耐性を持たされた幹細胞を、治療的組成物として使用することができ、幹細胞は、本発明のＴＡＬＥ融合タンパク質も含有する。アポトーシスへの耐性は、例えば、幹細胞中のＢＡＸ若しくはＢＡＫ特異的ＴＡＬＥＮを使用してＢＡＸ及び／若しくはＢＡＫをノックアウトすること、又はこの場合もやはり、例えば、カスパーゼ−６特異的ＴＡＬＥＮを使用して、カスパーゼ内で破壊されるものをノックアウトすることによって発生し得る。

造血幹細胞へのＤＮＡの導入方法が、例えば、米国特許第５，９２８，６３８号に開示されている。造血幹細胞、例えば、ＣＤ３４⁺細胞への導入遺伝子の導入に有用なベクターには、アデノウイルス３５型が含まれる。

本明細書に記載のポリヌクレオチドの導入に好適なベクターには、非組込みレンチウイルスベクター（ＩＤＬＶ）が含まれる。例えば、Ｏｒｙｅｔａｌ．（１９９６）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９３：１１３８２−１１３８８、Ｄｕｌｌｅｔａｌ．（１９９８）Ｊ．Ｖｉｒｏｌ．７２：８４６３−８４７１、Ｚｕｆｆｅｒｙｅｔａｌ．（１９９８）Ｊ．Ｖｉｒｏｌ．７２：９８７３−９８８０、Ｆｏｌｌｅｎｚｉｅｔａｌ．（２０００）ＮａｔｕｒｅＧｅｎｅｔｉｃｓ２５：２１７−２２２、米国特許公開第２００９／０５４９８５号を参照されたい。上述のように、開示の方法及び組成物を、任意の種類の細胞において使用することができる。動物細胞の子孫、変異体、及び誘導体を使用することもできる。

ＤＮＡ構築物を、様々な従来の技法によって所望の植物宿主に（例えば、そのゲノムに）導入することができる。そのような技法の概説については、例えば、Ｗｅｉｓｓｂａｃｈ＆ＷｅｉｓｓｂａｃｈＭｅｔｈｏｄｓｆｏｒＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（１９８８，ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｎ．Ｙ．）ＳｅｃｔｉｏｎＶＩＩＩ，ｐｐ．４２１−４６３、及びＧｒｉｅｒｓｏｎ＆Ｃｏｒｅｙ，ＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（１９８８，２ｄＥｄ．），Ｂｌａｃｋｉｅ，Ｌｏｎｄｏｎ，Ｃｈ．７−９を参照されたい。

例えば、ＤＮＡ構築物を、植物細胞プロトプラストの電気穿孔及び微量注入等の技法を用いて植物細胞のゲノムＤＮＡに直接導入することができるか、又はＤＮＡ構築物を、ＤＮＡ粒子銃等の微粒子銃法を用いて植物組織に直接導入することができる（例えば、Ｋｌｅｉｎｅｔａｌ（１９８７）Ｎａｔｕｒｅ３２７：７０−７３を参照のこと）。あるいは、ＤＮＡ構築物を、好適なＴ−ＤＮＡ隣接領域と合わせて、従来のアグロバクテリウム・ツメファシエンス宿主ベクターに導入することができる。武装解除及びバイナリーベクターの使用を含むアグロバクテリウム・ツメファシエンス媒介型形質転換技法が、科学文献において十分に説明されている。例えば、Ｈｏｒｓｃｈｅｔａｌ（１９８４）Ｓｃｉｅｎｃｅ２３３：４９６−４９８、及びＦｒａｌｅｙｅｔａｌ（１９８３）Ｐｒｏｃ．Ｎａｔ’ｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８０：４８０３を参照されたい。

加えて、非アグロバクテリウム細菌、又はリゾビウム種ＮＧＲ２３４、シノリゾビウム・メリロティ、メソリゾビウム・ロティ、ジャガイモウイルスＸ、カリフラワーモザイクウイルス、及びキャッサバベインモザイクウイルス、並びに／若しくはタバコモザイクウイルス等のウイルスを使用して、遺伝子導入を達成することができる。例えば、Ｃｈｕｎｇｅｔａｌ．（２００６）ＴｒｅｎｄｓＰｌａｎｔＳｃｉ．１１（１）：１−４を参照されたい。

アグロバクテリウム・ツメファシエンス宿主の毒性機能は、バイナリーＴ−ＤＮＡベクター（Ｂｅｖａｎ（１９８４）Ｎｕｃ．ＡｃｉｄＲｅｓ．１２：８７１１−８７２１）又は共培養手順（Ｈｏｒｓｃｈｅｔａｌ（１９８５）Ｓｃｉｅｎｃｅ２２７：１２２９−１２３１）を用いて、細胞が細菌に感染するときに、植物細胞ＤＮＡへの構築物及び隣接マーカーの挿入を誘導する。概して、アグロバクテリウム形質転換系を使用して、双子葉植物を遺伝子操作する（Ｂｅｖａｎｅｔａｌ（１９８２）Ａｎｎ．Ｒｅｖ．Ｇｅｎｅｔ１６：３５７−３８４、Ｒｏｇｅｒｓｅｔａｌ（１９８６）ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ．１１８：６２７−６４１）。アグロバクテリウム形質転換系を使用して、ＤＮＡを単子葉植物及び植物細胞に形質転換、並びに導入することもできる。米国特許第５，５９１，６１６号、Ｈｅｒｎａｌｓｔｅｅｎｅｔａｌ（１９８４）ＥＭＢＯＪ３：３０３９−３０４１、Ｈｏｏｙｋａｓｓ−ＶａｎＳｌｏｇｔｅｒｅｎｅｔａｌ（１９８４）Ｎａｔｕｒｅ３１１：７６３−７６４、Ｇｒｉｍｓｌｅｙｅｔａｌ（１９８７）Ｎａｔｕｒｅ３２５：１６７７−１７９、Ｂｏｕｌｔｏｎｅｔａｌ（１９８９）ＰｌａｎｔＭｏｌ．Ｂｉｏｌ．１２：３１−４０、及びＧｏｕｌｄｅｔａｌ（１９９１）ＰｌａｎｔＰｈｙｓｉｏｌ．９５：４２６−４３４を参照されたい。

代替の遺伝子導入及び形質転換方法は、ネイキッドＤＮＡのカルシウム、ポリエチレングリコール（ＰＥＧ）、又は電気穿孔媒介型取込みを介するプロトプラスト形質転換（Ｐａｓｚｋｏｗｓｋｉｅｔａｌ．（１９８４）ＥＭＢＯＪ３：２７１７−２７２２、Ｐｏｔｒｙｋｕｓｅｔａｌ．（１９８５）Ｍｏｌｅｃ．Ｇｅｎ．Ｇｅｎｅｔ．１９９：１６９−１７７、Ｆｒｏｍｍｅｔａｌ．（１９８５）Ｐｒｏｃ．Ｎａｔ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８２：５８２４−５８２８、及びＳｈｉｍａｍｏｔｏ（１９８９）Ｎａｔｕｒｅ３３８：２７４−２７６を参照のこと）、並びに植物組織の電気穿孔（Ｄ’Ｈａｌｌｕｉｎｅｔａｌ．（１９９２）ＰｌａｎｔＣｅｌｌ４：１４９５−１５０５）を含むが、それらに限定されない。植物細胞形質転換のためのさらなる方法は、微量注入、炭化ケイ素媒介型ＤＮＡ取込み（Ｋａｅｐｐｌｅｒｅｔａｌ．（１９９０）ＰｌａｎｔＣｅｌｌＲｅｐｏｒｔｅｒ９：４１５−４１８）、並びに微小発射銃（ｍｉｃｒｏｐｒｏｊｅｃｔｉｌｅｂｏｍｂａｒｄｍｅｎｔ）（Ｋｌｅｉｎｅｔａｌ．（１９８８）Ｐｒｏｃ．Ｎａｔ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８５：４３０５−４３０９、及びＧｏｒｄｏｎ−Ｋａｍｍｅｔａｌ．（１９９０）ＰｌａｎｔＣｅｌｌ２：６０３−６１８を参照のこと）を含む。

生物
本明細書に記載の方法及び組成物は、植物、動物（例えば、マウス、ラット、霊長類、家畜、ウサギ等の哺乳動物）、魚等の真核生物を含むが、それらに限定されない、遺伝子発現を制御し、かつ／又はゲノム修飾を介して生物を変更することが所望される任意の生物に適用できる。真核（例えば、酵母、植物、真菌、魚、並びに猫、犬、マウス、ウシ、羊、及びブタ等の哺乳類細胞）細胞を使用することができる。本明細書に記載の１つ以上のホモ接合ＫＯ遺伝子座又は他の遺伝的修飾を含有する生物由来の細胞も使用することができる。

例示的な哺乳類細胞には、目的とする生物の任意の細胞又は細胞株、例えば、卵母細胞、Ｋ５６２細胞、ＣＨＯ（チャイニーズハムスター卵巣）細胞、ＨＥＰ−Ｇ２細胞、ＢａＦ−３細胞、シュナイダー細胞、ＣＯＳ細胞（ＳＶ４０Ｔ抗原を発現するサル腎臓細胞）、ＣＶ−１細胞、ＨｕＴｕ８０細胞、ＮＴＥＲＡ２細胞、ＮＢ４細胞、ＨＬ−６０細胞、及びＨｅＬ細胞、２９３細胞（例えば、Ｇｒａｈａｍｅｔａｌ．（１９７７）Ｊ．Ｇｅｎ．Ｖｉｒｏｌ．３６：５９を参照のこと）、並びにＳＰ２又はＮＳ０等の骨髄腫細胞（例えば、ＧａｌｆｒｅａｎｄＭｉｌｓｔｅｉｎ（１９８１）Ｍｅｔｈ．Ｅｎｚｙｍｏｌ．７３（Ｂ）：３４６を参照のこと）が挙げられる。胚及び成人幹細胞を使用することができるように、末梢血単核球（ＰＢＭＣ）又はＴ細胞も使用することができる。例えば、使用することができる幹細胞には、胚幹細胞（ＥＳ）、誘導性多能性幹細胞（ｉＰＳＣ）、間葉幹細胞、造血幹細胞、肝幹細胞、皮膚幹細胞、及び神経幹細胞が含まれる。

例示的な標的植物及び植物細胞には、穀類作物（例えば、小麦、トウモロコシ、コメ、キビ、大麦）、果実作物（例えば、トマト、リンゴ、ナシ、イチゴ、オレンジ）、飼料作物（例えば、ムラサキウマゴヤシ）、根菜作物（例えば、ニンジン、ジャガイモ、テンサイ、ヤムイモ）、葉菜作物（例えば、レタス、ほうれん草）、消費用の植物性作物（例えば、大豆及び他のマメ類、カボチャ、ピーマン、ナス、セロリ等）、顕花植物（例えば、ペチュニア、バラ、キク）、針葉樹及び松の木（例えば、松、モミ、トウヒ）、ポプラの木（例えば、ヤマナラシ×ウラジロハコヤナギ）、繊維作物（綿、ジュート、亜麻、竹）、ファイトレメディエーションにおいて使用される植物（例えば、重金属集積植物）、油料作物（例えば、ヒマワリ、菜種）、並びに実験的目的に使用される植物（例えば、シロイヌナズナ）を含む作物等の単子葉及び双子葉植物が挙げられるが、それらに限定されない。したがって、開示の方法及び組成物は、アスパラガス属、カラスムギ属、アブラナ属、ミカン属、スイカ属、トウガラシ属、カボチャ属、ニンジン属、ムカシヨモギ属、ダイズ属、ワタ属、オオムギ属、アキノノゲシ属、ドクムギ属、トマト属、リンゴ属、キャッサバ属、タバコ属、ショカツサイ属、イネ属、ワニナシ属、インゲンマメ属、エンドウ属、ナシ属、サクラ属、ダイコン属、ライムギ属、ナス属、モロコシ属、コムギ属、ブドウ属、ササゲ属、及びトウモロコシ属由来の種を含むが、それらに限定されない様々な種類の植物にわたる用途を有する。植物細胞という用語は、単離された植物細胞、並びに全植物、又は種子、カルス、葉、根等の全植物の一部を含む。本開示は、上述の植物の種子も網羅し、種子は、導入遺伝子若しくは遺伝子構築物を有し、かつ／又は本明細書に記載の組成物及び／若しくは方法を使用して修飾されている。本開示は、上述のトランスジェニック植物の子孫、クローン、細胞株、又は細胞をさらに網羅し、該子孫、クローン、細胞株、又は細胞は、導入遺伝子若しくは遺伝子構築物を有する。

藻は、目的とする化合物、すなわち、生物燃料、プラスチック、炭化水素等を製造するためにますます利用されている。例示的な藻種には、珪藻及び藍色細菌を含む微細藻類、並びにボトリオコッカス・ブラウニー、クロレラ、ドナリエラ・テルチオレクタ、グラシラリア、プリュウロクリシス・カルテラエ、サルガッサム、及びアルバが含まれる。

ＴＡＬＥ融合タンパク質による遺伝子発現の制御を決定するためのアッセイ
様々なアッセイを使用して、ＴＡＬＥ融合タンパク質による遺伝子発現制御のレベルを決定することができる。特定のＴＡＬＥ融合タンパク質の活性を、様々なインビトロ及びインビボアッセイを使用して、例えば、タンパク質又はｍＲＮＡレベル、産物レベル、酵素活性、腫瘍成長の測定によって、レポーター遺伝子の転写活性化又は抑制によって、第２のメッセンジャーレベル（例えば、ｃＧＭＰ、ｃＡＭＰ、ＩＰ３、ＤＡＧ、Ｃａ．ｓｕｐ．２＋）によって、サイトカイン及びホルモン産生レベルによって、並びに例えば、免疫アッセイ（例えば、抗体を用いたＥＬＩＳＡ及び免疫組織化学的アッセイ）、ハイブリダイゼーションアッセイ（例えば、ＲＮａｓｅ保護、ノーザンブロット、ｉｎｓｉｔｕハイブリダイゼーション、オリゴヌクレオチド配列研究）、比色アッセイ、増幅アッセイ、酵素活性アッセイ、腫瘍成長アッセイ、表現型アッセイ等を用いた新血管形成によって評価することができる。

ＴＡＬＥ融合タンパク質は、典型的には、培養細胞、例えば、２９３細胞、ＣＨＯ細胞、ＶＥＲＯ細胞、ＢＨＫ細胞、ＨｅＬａ細胞、ＣＯＳ細胞、植物細胞株、植物カルス培養物等を使用して、インビトロでの活性について最初に試験される。好ましくは、ヒト細胞が使用される。ＴＡＬＥ融合タンパク質は、多くの場合、レポーター遺伝子を有する一時的発現系を使用して最初に試験され、その後、標的内在性遺伝子の制御が、インビボ及びエクスビボの両方で細胞及び動物において試験される。ＴＡＬＥ融合タンパク質は、細胞中で組換え的に発現するか、動物若しくは植物に移植された細胞中で組換え的に発現するか、又はトランスジェニック動物又は植物中で組換え的に発現することができ、かつ本明細書に記載の送達ビヒクルを使用して、タンパク質として、動物、植物、若しくは細胞に投与することができる。本細胞を、固定するか、溶液に入れるか、動物に注入するか、又はトランスジェニック若しくは非トランスジェニック動物において自然発生させることができる。

遺伝子発現の調節は、本明細書に記載のインビトロ又はインビボアッセイのうちの１つを使用して試験される。試料又はアッセイは、調節の程度を試験するために、ＴＡＬＥ融合タンパク質で処理され、かつ試験化合物を有しない対照試料と比較される。

ＴＡＬＥ融合タンパク質の効果を、上述のパラメータのうちのいずれかを試験することによって測定することができる。任意の好適な遺伝子発現、表現型、又は生理学的変化を用いて、ＴＡＬＥ融合タンパク質の影響を評価することができる。機能的結果が無傷の細胞又は動物を使用して決定されるとき、腫瘍成長、新血管形成、ホルモン放出、両方の既知の遺伝子マーカー及び特性化されていない遺伝子マーカーの両方に対する転写変化（例えば、ノーザンブロット又はオリゴヌクレオチド配列研究）、細胞成長又はｐＨ変化等の細胞代謝の変化、並びにｃＧＭＰ等の細胞内の第２のメッセンジャーの変化等の様々な影響を測定することもできる。

内在性遺伝子発現のＴＡＬＥ融合タンパク質媒介制御のための好ましいアッセイを、インビトロで行うことができる。１つの好ましいインビトロアッセイ形式において、培養細胞中の内在性遺伝子発現のＴＡＬＥ融合タンパク質媒介制御は、ＥＬＩＳＡアッセイを使用してタンパク質産生を試験することによって測定される。試験試料は、空ベクター又は別の遺伝子に標的化される非関連ＴＡＬＥ融合タンパク質で処理された対照細胞と比較される。

別の実施形態では、内在性遺伝子発現のＴＡＬＥ融合タンパク質媒介制御は、標的遺伝子ｍＲＮＡの発現レベルを測定することによってインビトロで決定される。遺伝子発現のレベルは、増幅を使用して、例えば、ＰＣＲ、ＬＣＲ、又はハイブリダイゼーションアッセイ、例えば、ノーザンハイブリダイゼーション、ＲＮａｓｅ保護、ドットブロット法を使用して測定される。ＲＮａｓｅ保護が一実施形態において使用される。タンパク質又はｍＲＮＡのレベルは、直接標識又は間接標識検出剤、例えば、本明細書に記載の蛍光標識又は放射活性標識核酸、放射活性標識又は酵素標識抗体等を使用して検出される。

あるいは、レポーター遺伝子系を、ルシフェラーゼ、緑色蛍光タンパク質、ＣＡＴ、又はベータガラクトシダーゼ等のレポーター遺伝子に動作可能に結合される標的遺伝子プロモーターを使用して考案することができる。レポーター構築物は、典型的には、培養細胞に共トランスフェクトされる。最適なＴＡＬＥ融合タンパク質での処理後、レポーター遺伝子の転写、翻訳、又は活性の量は、当業者に既知の標準の技法に従って測定される。

内在性遺伝子発現のＴＡＬＥ融合タンパク質媒介制御の監視に有用な好ましいアッセイ形式の別の実施例が、インビボで行われる。このアッセイは、新血管形成（例えば、ＶＥＧＦ）等の腫瘍支持に関与する遺伝子である腫瘍促進遺伝子の発現を阻害するか、又はｐ５３等の腫瘍抑制遺伝子を活性化するＴＡＬＥ融合物の試験に特に有用である。このアッセイにおいて、最適なＴＡＬＥ融合物を発現する培養腫瘍細胞は、無胸腺マウス、放射線照射マウス、又はＳＣＩＤマウス等の免疫不全マウスに皮下注入される。好適な期間、好ましくは、４〜８週間後に、腫瘍成長は、例えば、容積又はその２つの最大寸法で測定され、対照と比較される。統計的に有意な減少を有する腫瘍（例えば、スチューデントＴ検定を用いて）は、成長阻害を有すると考えられる。あるいは、腫瘍の新血管形成の程度を測定することもできる。腫瘍の血管新生及び腫瘍の血管の数について、内皮細胞特異的抗体を使用した免疫アッセイを使用して染色する。血管の数の統計的に有意な減少を有する腫瘍（例えば、スチューデントＴ検定を用いて）は、新血管形成阻害を有すると考えられる。

上述のトランスジェニック及び非トランスジェニック植物又は動物は、インビボでの内在性遺伝子発現の制御の試験に好ましい実施形態としても使用される。トランスジェニック生物は、典型的には、最適なＴＡＬＥ融合物を発現する。あるいは、最適なＴＡＬＥ融合物を一時的に発現する生物、送達ビヒクル中のＴＡＬＥ融合タンパク質が投与された生物を使用することができる。内在性遺伝子発現の制御は、本明細書に記載のアッセイのうちのいずれか１つを使用して試験される。

ＴＡＬＥ融合タンパク質をコードする核酸
従来のウイルス及び非ウイルスに基づく遺伝子導入方法を使用して、全生物又は標的組織中の哺乳類細胞において遺伝子操作されたＴＡＬＥドメイン融合物をコードする核酸を導入することができる。そのような方法を使用して、インビトロで、ＴＡＬＥドメイン融合物をコードする核酸を細胞に投与することができる。好ましくは、ＴＡＬＥドメイン融合物をコードする核酸は、インビボ又はエクスビボ使用のために投与される。非ウイルスベクター送達系は、ＤＮＡプラスミド、ネイキッド核酸、及びリポソーム等の送達ビヒクルと錯体形成された核酸を含む。ウイルスベクター送達系は、細胞への送達後にエピソームゲノム又は組込みゲノムのいずれかを有するＤＮＡ及びＲＮＡウイルスを含む。遺伝子治療手順の総説については、Ａｎｄｅｒｓｏｎ，Ｓｃｉｅｎｃｅ２５６：８０８−８１３（１９９２）、Ｎａｂｅｌ＆Ｆｅｌｇｎｅｒ，ＴＩＢＴＥＣＨ１１：２１１−２１７（１９９３）、Ｍｉｔａｎｉ＆Ｃａｓｋｅｙ，ＴＩＢＴＥＣＨ１１：１６２−１６６（１９９３）、Ｄｉｌｌｏｎ，ＴＩＢＴＥＣＨ１１：１６７−１７５（１９９３）、Ｍｉｌｌｅｒ，Ｎａｔｕｒｅ３５７：４５５−４６０（１９９２）、ＶａｎＢｒｕｎｔ，Ｂｉｏｔｈｅｃｈｎｏｌｏｇｙ６（１０）：１１４９−１１５４（１９８８）；Ｖｉｇｎｅ，ＲｅｓｔｏｒａｔｉｖｅＮｅｕｒｏｌｏｇｙａｎｄＮｅｕｒｏｓｃｉｅｎｃｅ８：３５−３６（１９９５）、Ｋｒｅｍｅｒ＆Ｐｅｒｒｉｃａｕｄｅｔ，ＢｒｉｔｉｓｈＭｅｄｉｃａｌＢｕｌｌｅｔｉｎ５１（１）：３１−４４（１９９５）、Ｈａｄｄａｄａｅｔａｌ．，ｉｎＣｕｒｒｅｎｔＴｏｐｉｃｓｉｎＭｉｃｒｏｂｉｏｌｏｇｙａｎｄＩｍｍｕｎｏｌｏｇｙＤｏｅｒｆｌｅｒａｎｄＢｏｈｍ（ｅｄｓ）（１９９５）、及びＹｕｅｔａｌ．，ＧｅｎｅＴｈｅｒａｐｙ１：１３−２６（１９９４）を参照されたい。

遺伝子操作されたＴＡＬＥドメイン融合物をコードする核酸の送達のためのＲＮＡ又はＤＮＡウイルスに基づく系の使用は、体内の特定の細胞にウイルスを標的化し、かつウイルスペイロードを核に輸送するための高度に進化したプロセスを利用する。ウイルスベクターを、（インビボで）患者に直接投与することができるか、又はそれらを使用して、インビトロで細胞を治療することができ、修飾された細胞は、（エクスビボで）患者に投与される。ＴＡＬＥドメイン融合物の送達のための従来のウイルスに基づく系は、遺伝子導入のために、レトロウイルス、レンチウイルス、アデノウイルス、アデノ関連ウイルス、及びヘルペスシンプレックスウイルスベクターを含み得る。ウイルスベクターは、現在、標的細胞及び組織における遺伝子導入の最も効率的かつ汎用的方法である。宿主ゲノムにおける組込みは、レトロウイルス、レンチウイルス、及びアデノ関連ウイルス遺伝子導入方法を伴って可能となり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。さらに、高い導入効率が、多くの異なる細胞型及び標的組織において観察されている。

レトロウイルスの内性を、外来のエンベロープタンパク質を組み込むことによって変更することができ、標的細胞の潜在的標的集団を拡大する。レンチウイルスベクターは、非分裂細胞形質導入するか、又は感染させ、かつ典型的には、高いウイルス力価を産生することができるレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入系の選択は、標的組織に依存するであろう。レトロウイルスベクターは、最大６〜１０ｋｂの外来配列のパッケージング能力を有するシス作用の長い末端反復から成る。最小限にシス作用したＬＴＲは、ベクターの複製及びパッケージングに十分であり、その後、治療遺伝子を標的細胞に組み込んで、恒久的な導入遺伝子発現を提供するために使用される。広く使用されているレトロウイルスベクターは、マウス白血病ウイルス（ＭｕＬＶ）、テナガザル白血病ウイルス（ＧａＬＶ）、サル免疫不全ウイルス（ＳＩＶ）、ヒト免疫不全ウイルス（ＨＩＶ）、及びそれらの組み合わせに基づくベクターを含む（例えば、Ｂｕｃｈｓｃｈｅｒｅｔａｌ．，Ｊ．Ｖｉｒｏｌ．６６：２７３１−２７３９（１９９２）、Ｊｏｈａｎｎｅｔａｌ．，ＪＶｉｒｏｌ．６６：１６３５−１６４０（１９９２）、Ｓｏｍｍｅｒｆｅｌｔｅｔａｌ，Ｖｉｒｏｌ．１７６：５８−５９（１９９０）、Ｗｉｌｓｏｎｅｔａｌ．，Ｊ．Ｖｉｒｏｌ．６３：２３７４−２３７８（１９８９）、Ｍｉｌｌｅｒｅｔａｌ．，Ｊ．Ｖｉｒｏｌ．６５：２２２０−２２２４（１９９１）；ＰＣＴ／ＵＳ９４／０５７００を参照のこと）。

ＴＡＬＥドメイン融合物の一時的発現が好ましい適用において、アデノウイルスに基づく系が典型的に使用される。アデノウイルスに基づくベクターは、多くの細胞型において非常に高い形質導入効率の能力があり、細胞分裂を必要としない。そのようなベクターを用いて、高い力価及びレベルの発現が得られている。このベクターを、比較的簡単な系において大量に産生することができる。アデノ関連ウイルス（「ＡＡＶ」）ベクターを、例えば、核酸及びペプチドのインビトロ産生において、並びにインビボ及びエクスビボでの遺伝子治療手順のために、標的核酸を用いて細胞を形質導入するために使用することもできる（例えば、Ｗｅｓｔｅｔａｌ．，Ｖｉｒｏｌｏｇｙ１６０：３８−４７（１９８７）、米国特許第４，７９７，３６８号、国際公開第ＷＯ９３／２４６４１号、Ｋｏｔｉｎ，ＨｕｍａｎＧｅｎｅＴｈｅｒａｐｙ５：７９３−８０１（１９９４）、Ｍｕｚｙｃｚｋａ，Ｊ．Ｃｌｉｎ．Ｉｎｖｅｓｔ．９４：１３５１（１９９４）を参照のこと）。組換えＡＡＶベクターの構築は、米国特許第５，１７３，４１４号、Ｔｒａｔｃｈｉｎｅｔａｌ．，Ｍｏｌ．ＣｅｌｌＢｉｏｌ．５：３２５１−３２６０（１９８５）、Ｔａｔｃｈｉｎ，ｅｔａｌ．，ＭｏｌＣｅｌｌＢｉｏｌ．４：２０７２−２０８１（１９８４）、Ｈｅｒｍｏｎａｔ＆Ｍｕｚｙｃｚｋａ，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ８１：６４６６−６４７０（１９８４）、及びＳａｍｕｌｓｋｉｅｔａｌ．，Ｊ．Ｖｉｒｏｌ．６３：０３８２２−３８２８（１９８９）を含むいくつかの出版物に記載されている。

具体的には、少なくとも６つのウイルスベクターアプローチが、現在、臨床試験における遺伝子導入に利用可能であり、レトロウイルスベクターが、群を抜いて最も頻繁に使用される系である。これらのウイルスベクターの全ては、形質導入剤を生成するためにヘルパー細胞株に挿入される遺伝子によって欠陥ベクターの相補性を伴うアプローチを利用する。

ｐＬＡＳＮ及びＭＦＧ−Ｓは、臨床試験において使用されているレトロウイルスベクターの例である（Ｄｕｎｂａｒｅｔａｌ．，Ｂｌｏｏｄ８５：３０４８−３０５（１９９５）、Ｋｏｈｎｅｔａｌ．，Ｎａｔ．Ｍｅｄ．１：１０１７−１０２（１９９５）、Ｍａｌｅｃｈｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ９４：２２１２１３３−１２１３８（１９９７））。ＰＡ３１７／ｐＬＡＳＮは、遺伝子治療試験において使用された最初の治療ベクターである（Ｂｌａｅｓｅｅｔａｌ．，Ｓｃｉｅｎｃｅ２７０：４７５４８０（１９９５））。５０％以上の形質導入効率が、ＭＦＧ−Ｓパッケージングベクターにおいて観察されている（Ｅｌｌｅｍｅｔａｌ．，ＩｍｍｕｎｏｌＩｍｍｕｎｏｔｈｅｒ．４４（１）：１０−２０（１９９７）、Ｄｒａｎｏｆｆｅｔａｌ．，Ｈｕｍ．ＧｅｎｅＴｈｅｒ．１：１１１−２（１９９７））。

組換えアデノ関連ウイルスベクター（ｒＡＡＶ）は、欠陥性及び非病原性のパルボウイルスアデノ関連２型ウイルスに基づく遺伝子送達系の有望な代替案である。全てのベクターは、導入遺伝子発現カセットに隣接するＡＡＶの１４５ｂｐの逆方向末端反復のみを保持するプラスミドに由来する。形質導入細胞のゲノムへの組込みによる効率的な遺伝子導入及び安定した導入遺伝子送達は、このベクター系の重要な特徴である（Ｗａｇｎｅｒｅｔａｌ．，Ｌａｎｃｅｔ３５１：９１１７１７０２−３（１９９８）、Ｋｅａｒｎｓｅｔａｌ．，ＧｅｎｅＴｈｅｒ．９：７４８−５５（１９９６））。

複製欠陥性組換えアデノウイルスベクター（Ａｄ）は、高力価で産生され、かついくつかの異なる細胞型を容易に感染させることができるため、主に、結腸癌の遺伝子治療のために使用される。ほとんどのアデノウイルスベクターは、導入遺伝子がＡｄＥ１ａ、Ｅ１ｂ、及びＥ３遺伝子を置換し、その後、複製欠陥ベクターが、トランス内で欠失した遺伝子機能を供給するヒト２９３細胞において増殖するように遺伝子操作される。Ａｄベクターは、肝臓、腎臓、及び筋肉系組織において見出される細胞等の非分裂の分化した細胞を含む、複数の種類の組織をインビボで形質導入することができる。従来のＡｄベクターは、高い運搬能力を有する。臨床試験におけるＡｄベクターの使用の例には、筋肉内注入での抗腫瘍免疫のためのポリヌクレオチド治療が含まれた（Ｓｔｅｒｍａｎｅｔａｌ．，Ｈｕｍ．ＧｅｎｅＴｈｅｒ．７：１０８３−９（１９９８））。遺伝子導入のためのアデノウイルスベクターの使用のさらなる例には、Ｒｏｓｅｎｅｃｋｅｒｅｔａｌ，Ｉｎｆｅｃｔｉｏｎ２４：１５−１０（１９９６）、Ｓｔｅｒｍａｎｅｔａｌ．，Ｈｕｍ．ＧｅｎｅＴｈｅｒ．９：７１０８３−１０８９（１９９８）、Ｗｅｌｓｈｅｔａｌ．，Ｈｕｍ．ＧｅｎｅＴｈｅｒ．２：２０５−１８（１９９５）、Ａｌｖａｒｅｚｅｔａｌ．，Ｈｕｍ．ＧｅｎｅＴｈｅｒ．５：５９７−６１３（１９９７）、Ｔｏｐｆｅｔａｌ．，ＧｅｎｅＴｈｅｒ．５：５０７−５１３（１９９８）、Ｓｔｅｒｍａｎｅｔａｌ．，Ｈｕｍ．ＧｅｎｅＴｈｅｒ．７：１０８３−１０８９（１９９８）、米国特許公開第２００８／０１５９９９６号が挙げられる。

パッケージング細胞は、宿主細胞を感染させることができるウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする２９３細胞、及びレトロウイルスをパッケージングするｐｓｉ２細胞又はＰＡ３１７細胞が含まれる。遺伝子治療において使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする産生細胞株によって生成される。ベクターは、典型的には、パッケージング、及びそれに続く宿主への組込みに必要な最小限のウイルス配列、タンパク質を発現させるために発現カセットによって置換される他のウイルス配列を含有する。欠損したウイルス機能は、パッケージング細胞株によってトランス内で供給される。例えば、遺伝子治療において使用されるＡＡＶベクターは、典型的には、パッケージング及び宿主ゲノムへの組込みに必要とされるＡＡＶゲノム由来のＩＴＲ配列のみを有する。他のＡＡＶ遺伝子、すなわち、ｒｅｐ及びｃａｐをコードするが、ＩＴＲ配列を欠如するヘルパープラスミドを含有するウイルスＤＮＡは、細胞株中にパッケージングされる。細胞株は、ヘルパーとしてのアデノウイルスにも感染する。ヘルパーウイルスは、ＡＡＶベクターの複製及びヘルパープラスミド由来のＡＡＶ遺伝子の発現を促進する。ヘルパープラスミドは、ＩＴＲ配列の欠如のため、大量にパッケージングされない。アデノウイルスでの汚染を、例えば、ＡＡＶよりもアデノウイルスの方が反応しやすい熱処理によって減少させることができる。

多くの遺伝子治療用途において、遺伝子治療ベクターを高度の特異性で特定の組織型に送達することが望ましい。ウイルスベクターは、典型的には、ウイルスの外面にウイルス被覆タンパク質を有する融合タンパク質としてリガンドを発現することによって、所定の細胞型に対する特異性を有するように修飾される。リガンドは、目的とする細胞型上に存在することで既知の受容体に対する親和性を有するように選択される。例えば、Ｈａｎｅｔａｌ．，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ９２：９７４７−９７５１（１９９５）は、モロニーマウス白血病ウイルスを、ｇｐ７０に融合するヒトヘレグリンを発現するように修飾することができ、かつ組換えウイルスが、ヒト上皮成長因子受容体を発現するある特定のヒト乳癌細胞を感染させることを報告した。この原理を、リガンド融合タンパク質を発現するウイルスの他の対、及び受容体を発現する標的細胞にまで拡大することができる。例えば、繊維状ファージを、事実上任意の選択される細胞受容体に対して特異的結合親和性を有する抗体フラグメント（例えば、ＦＡＢ又はＦｖ）を示すように遺伝子操作することができる。上述の説明は、主に、ウイルスベクターに適用されるが、同一の原理を非ウイルスベクターにも適用することができる。そのようなベクターを、特定の標的細胞による取込みを好むと考えられる特定の取込み配列を含有するように遺伝子操作することができる。

遺伝子治療ベクターを、以下に記載されるように、個々の患者への投与によって、典型的には、全身投与（例えば、静脈内、腹腔内、筋肉内、皮下、若しくは頭蓋内注入）、又は局所適用によって、インビボで送達することができる。あるいは、ベクターを、個々の患者から外植される細胞（例えば、リンパ球、骨髄穿刺液、組織生検）、又は万能ドナー造血幹細胞等の細胞にエクスビボで送達することができ、通常、ベクターを組み込んだ細胞の選択後に、患者への細胞の再移植が続く。

診断、研究、又は遺伝子治療のためのエクスビボ細胞トランスフェクション（例えば、宿主生物へのトランスフェクトされた細胞の再注入を介する）が、当業者に周知である。好ましい実施形態では、細胞は、ＴＡＬＥ融合核酸（遺伝子又はｃＤＮＡ）でトランスフェクトされた対象の生物から単離され、対象の生物（例えば、患者）に戻して再注入される。エクスビボトランスフェクションに好適な種々の細胞型が、当業者に周知である（例えば、Ｆｒｅｓｈｎｅｙｅｔａｌ．，ＣｕｌｔｕｒｅｏｆＡｎｉｍａｌＣｅｌｌｓ，ＭａｎｕａｌｏｆＢａｓｉｃＴｅｃｈｎｉｑｕｅ（３ｒｄｅｄ．１９９４）、並びに患者からの細胞の単離及び培養方法に関する議論について引用される参考文献を参照のこと）。

一実施形態において、幹細胞は、細胞トランスフェクション及び遺伝子治療のために、エクスビボ処置において使用される。幹細胞を使用する利点は、それらを、インビトロで他の細胞型に分化することができるか、又はそれらが骨髄に移植する哺乳動物（細胞のドナー等）に導入することができることである。ＧＭ−ＣＳＦ、ＩＦＮ−ガンマ、及びＴＮＦ−アルファ等のサイトカインを使用して、臨床的に重要な免疫細胞型にＣＤ３４＋細胞をインビトロで分化するための方法が既知である（Ｉｎａｂａｅｔａｌ．，Ｊ．Ｅｘｐ．Ｍｅｄ．１７６：１６９３−１７０２（１９９２）を参照のこと）。

幹細胞は、既知の方法を使用して、形質導入及び分化のために単離される。例えば、幹細胞は、ＣＤ４＋及びＣＤ８＋（Ｔ細胞）、ＣＤ４５＋（ｐａｎｂ細胞）、ＧＲ−１（顆粒球）、並びにＩａｄ（分化した抗原提示細胞）等の望ましくない細胞に結合する抗体で骨髄細胞をパニングすることによって、骨髄細胞から単離される（Ｉｎａｂａｅｔａｌ．，Ｊ．Ｅｘｐ．Ｍｅｄ．１７６：１６９３−１７０２（１９９２）を参照のこと）。例示的な幹細胞には、ヒト胚幹細胞（ｈＥＳ）、誘導性多能性幹細胞（ｉＰＳＣ）、造血幹細胞、間葉幹細胞、神経幹細胞、及び筋肉幹細胞が含まれる。

治療的ＴＡＬＥドメイン融合核酸を含有するベクター（例えば、レトロウイルス、アデノウイルス、リポソーム等）を、インビボでの細胞の形質導入のために、生物に直接投与することもできる。あるいは、ネイキッドＤＮＡを投与することができる。投与は、分子を導入して、血液又は組織細胞と最終的に接触させるために通常使用される経路のうちのいずれかによる。そのような核酸の投与に好適な方法が利用可能かつ当業者に周知であり、２つ以上の経路を使用して、特定の組成物を投与することができるが、特定の経路は、多くの場合、別の経路よりも迅速かつ効果的な反応を提供することができる。

薬学的に許容される担体は、投与される特定の組成物、並びに組成物の投与に使用される特定の方法によってある程度決定される。したがって、以下に記載されるように、本発明の薬学的組成物の多種多様の好適な製剤が存在する（例えば、Ｒｅｍｉｎｇｔｏｎ’ｓＰｈａｒｍａｃｅｕｔｉｃａｌＳｃｉｅｎｃｅｓ，１７ｔｈｅｄ．，１９８９を参照のこと）。

薬学的組成物及び投与
ＴＡＬＥ融合物及びＴＡＬＥ融合物をコードする発現ベクターを、遺伝子発現の調節のため、かつ治療的又は予防的用途、例えば、癌、虚血、糖尿病性網膜症、黄斑変性、リウマチ性関節炎、乾癬、ＨＩＶ感染、鎌状赤血球貧血、アルツハイマー病、筋ジストロフィー、神経変性疾患、血管疾患、嚢胞性線維症、脳卒中等のために、患者に直接投与することができる。ＴＡＬＥ融合タンパク質遺伝子治療によって阻害することができる微生物の例には、病原菌、例えば、クラミジア、リケッチア細菌、マイコバクテリア、ブドウ球菌、連鎖球菌、肺炎球菌、髄膜炎菌及び淋菌、クレブシエラ菌、プロテウス菌、セラチア菌、シュードモナス菌、レジオネラ菌、ジフテリア、サルモネラ菌、桿菌、コレラ菌、破傷風、ボツリヌス中毒症、炭疽菌、ペスト、レプトスピラ症、及びライム病原因菌；感染性真菌、例えば、アスペルギルス属、カンジダ種；胞子虫類（例えば、マラリア原虫）、根足虫（例えば、エントアメーバ属）、及び鞭毛虫（トリパノソーマ属、リーシュマニア属、トリコモナス属、ジアルジア属等）等の原虫；ウイルス疾患、例えば、肝炎（Ａ型、Ｂ型、又はＣ型）、ヘルペスウイルス（例えば、ＶＺＶ、ＨＳＶ−１、ＨＳＶ−６、ＨＳＶ−ＩＩ、ＣＭＶ、及びＥＢＶ）、ＨＩＶ、エボラ、アデノウイルス、インフルエンザウイルス、フラビウイルス、エコーウイルス、ライノウイルス、コクサッキーウイルス、コモウイルス、呼吸器合胞体ウイルス、ムンプスウイルス、ロタウイルス、麻疹ウイルス、風疹ウイルス、パルボウイルス、ワクチニアウイルス、ＨＴＬＶウイルス、デング熱ウイルス、乳頭腫ウイルス、ポリオウイルス、狂犬病ウイルス、及びアルボウイルス、脳炎ウイルス等が挙げられる。

治療的に有効な量の投与は、治療される組織との最終接触部にＴＡＬＥ融合物を導入するために通常使用される経路のうちのいずれかによる。ＴＡＬＥ融合物は、任意の好適な様式で、好ましくは、薬学的に許容される担体を用いて投与される。そのような調節剤の投与に好適な方法が利用可能かつ当業者に周知であり、２つ以上の経路を使用して、特定の組成物を投与することができるが、特定の経路は、多くの場合、別の経路よりも迅速かつ効果的な反応を提供することができる。

例えば、静脈内、筋肉内、皮内、及び皮下経路等による非経口投与に好適な製剤には、抗酸化物質、緩衝液、静菌剤、及び製剤を対象とするレシピエントの血液で等張にする溶質を含有し得る水性及び非水の等張滅菌溶液、並びに懸濁化剤、可溶化剤、増粘剤、安定化剤、及び防腐剤を含み得る水性及び非水の滅菌懸濁液が含まれる。本発明の実践において、組成物を、例えば、静脈内注入によって、経口で、局所的に、腹腔内に、膀胱内に、又は髄腔内に投与することができる。化合物の製剤は、アンプル及びバイアル等の単位用量又は多用量の密封容器で提示され得る。注入溶液及び懸濁液を、前述の滅菌粉末、顆粒、及び錠剤から調製することができる。

植物における遺伝子発現の制御
ＴＡＬＥ融合物を使用して、病害抵抗性の増加、構造及び貯蔵多糖類、風味、タンパク質、及び脂肪酸の修飾、果実の熟成、収率、色、栄養学的特徴、貯蔵能力の向上、渇水又は冠水／浸水耐性等の形質のために、植物を遺伝子操作することができる。具体的には、油産生の強化のための作物種の遺伝子操作、例えば、油料種子において産生される脂肪酸の修飾を目的とする。例えば、米国特許第７，２６２，０５４号、並びに米国特許公開第２００８／０１８２３３２号及び同第２００９０２０５０８３号を参照されたい。

種油は、主に、脂肪酸のグリセロールエステルであるトリアシルグリセロール（ＴＡＧ）から成る。これらの植物油の商業生産は、主に、６つの主要な油料作物（大豆、油やし、菜種、ヒマワリ、綿実、及びピーナッツ）によって説明される。植物油は、マーガリン、ショートニング、サラダ油、及びフライ油として、ヒトの消費に主に（９０％）使用される。残りの１０％は、潤滑油、油脂化学物質、生物燃料、洗剤、及び他の工業用途等の非食品用途に使用される。

これらの用途のそれぞれにおいて使用される油の所望の特性は、特に、ＴＡＧを構成する脂肪酸中に存在する鎖長及び二重結合の数において大きく異なる。これらの特性は、膜流動性及び温度感度を制御するために、植物によって操作される。ＴＡＬＥドメイン融合物を使用して同一の特性を制御し、食品用途及び工業用途のために改良された特性を有する油を産生することができる。

油料種子作物のＴＡＧ中の主要な脂肪酸は、１６〜１８個の炭素長であり、０〜３個の二重結合を含有する。パルミチン酸（１６：０［１６個の炭素：０個の二重結合］）、オレイン酸（１８：１）、リノール酸（１８：２）、及びリノレン酸（１８：３）が優勢である。二重結合の数、又は飽和の程度は、結果として生じる油の融解温度、反応性、料理における性能、及び健康属性を決定する。

リノール酸（１８：２）へのオレイン酸（１８：１）の変換に関与する（その後、１８：３の構成の前駆体になる）酵素は、オメガ−６デサチュラーゼとも称される、デルタ１２−オレイン酸デサチュラーゼである。脂肪酸脱飽和経路におけるこの工程でのブロックは、ポリ不飽和油脂を犠牲にしてオレイン酸の蓄積をもたらすはずである。

一実施形態において、ＴＡＬＥドメイン（複数を含む）を含有するタンパク質は、大豆におけるＦＡＤ２−１遺伝子の発現を制御するために使用される。ミクロソームデルタ６デサチュラーゼをコードする２つの遺伝子が、近年、大豆からクローニングされており、ＦＡＤ２−１及びＦＡＤ２−２と称される（Ｈｅｐｐａｒｄｅｔａｌ．，ＰｌａｎｔＰｈｙｓｉｏｌ．１１０：３１１−３１９（１９９６））。ＦＡＤ２−１（デルタ１２デサチュラーゼ）は、大豆種子におけるオレイン酸脱飽和の大部分を制御するようである。したがって、ＴＡＬＥ融合物を使用して、植物におけるＦＡＤ２−１の遺伝子発現を調節することができる。具体的には、油料種子中のオレイン酸（１８：１）の蓄積を増加させるために、ＴＡＬＥドメイン融合物を使用して、大豆におけるＦＡＤ２−１遺伝子の発現を阻害することができる。さらに、ＴＡＬＥ融合物を使用して、デルタ−９デサチュラーゼ、他の植物由来のデルタ−１２デサチュラーゼ、デルタ−１５デサチュラーゼ、アセチル−ＣｏＡカルボキシラーゼ、アシル−ＡＣＰ−チオエステラーゼ、ＡＤＰ−グルコースピロホスホリラーゼ、デンプンシンターゼ、セルロースシンターゼ、スクロースシンターゼ、老化関連遺伝子、重金属キレート剤、脂肪酸ヒドロペルオキシドリアーゼ、ポリガラクツロナーゼ、ＥＰＳＰシンターゼ、植物ウイルス遺伝子、植物真菌病原遺伝子、及び植物細菌病原遺伝子等の任意の他の植物遺伝子の発現を調節することができる。

機能ゲノムアッセイ
ＴＡＬＥ融合物は、遺伝子発現の表現型結果及び機能を決定するアッセイのための用途を有する。分析技法における近年の進歩は、集中的な大量の配列決定の試みと相まって、以前に利用可能であった分子標的よりもはるかに多くの分子標的を同定及び特性化する機会をもたらしている。遺伝子及びそれらの機能についてのこの新しい情報は、基本的な生物学的理解を加速し、治療的介入のために多くの新しい標的を提示する。いくつかの場合において、分析ツールは、新しいデータの生成に追いついていない。全体的な差次的遺伝子発現の測定における近年の進歩による例が提供される。遺伝子発現マイクロアレイ、差次的ｃＤＮＡクローニング頻度、減算的ハイブリダイゼーション、及びディファレンシャルディスプレイ法に代表されるこれらの方法は、異なる組織内で、又は特定の刺激物に応答して、上方若しくは下方制御される遺伝子を非常に迅速に同定することができる。そのような方法は、形質転換、腫瘍進行、炎症応答、神経障害等の生物学的プロセスを調査するためにますます使用されている。当業者は、現在、所与の生理学的現象と相関する差次的発現遺伝子の長いリストを非常に容易に生成することができるが、個々の差次的発現遺伝子と現象との間の因果関係を実証するのは困難である。現在のところ、機能を差次的発現遺伝子に割り当てるための簡単な方法は、差次的遺伝子発現を監視する能力に追いついていない。

従来の分子アプローチを使用して、全長ｃＤＮＡをクローニングし、それを哺乳類発現ベクターにサブクローニングし、かつ組換えベクターを適切な宿主細胞にトランスフェクトすることよって、候補遺伝子の過剰発現を達成することができる。このアプローチは、特に最初の候補遺伝子が単純な発現配列標識（ＥＳＴ）によって表されるとき、容易であるが労働集約的である。「従来の」方法による候補遺伝子の過小発現は、さらにより厄介である。アンチセンス方法及び標的化リボザイムに依存する方法は信用できず、選択された標的のほんの一部分のみにおいて成功を収めている。相同組換えによる遺伝子ノックアウトは、組換え誘導の幹細胞においてかなり有効に働くが、体細胞由来の細胞株においては非常に非効率的に働く。いずれの場合においても、同系ゲノムＤＮＡの大きいクローン（約１０ｋｂ）は、効率的に働くために、組換えのために単離されるはずである。

ＴＡＬＥ融合技術を使用して、差次的遺伝子発現研究を迅速に分析することができる。遺伝子操作されたＴＡＬＥドメイン融合物を、任意の内因性標的遺伝子を上方又は下方制御するために、手軽に使用することができる。遺伝子特異的ＤＮＡ結合ドメインを作成するために、非常にわずかの配列情報が必要とされる。これは、ＴＡＬＥドメイン融合技術を、不十分に特性化された差次的発現遺伝子の長いリストの分析に理想的なものにする。当業者は、それぞれの候補遺伝子についてのＴＡＬＥに基づくＤＮＡ結合ドメインを簡単に作製し、人工転写因子を上方及び下方制御するキメラを作成し、かつモデル系において候補遺伝子を１つずつオン又はオフに切り替えることによって、研究中の表現型上での上方又は下方制御の結果（形質転換、サイトカイン等への応答）を試験することができる。

遺伝子操作されたＴＡＬＥドメイン融合物を使用して機能情報をゲノムデータに追加するこの特定の例は、単に実例にすぎない。１つの遺伝子又は複数の遺伝子の特定の上方若しくは下方制御から恩恵を受けることができる任意の実験的状況は、遺伝子操作されたＴＡＬＥ融合物の信頼度及び使い易さから恩恵を受けることができる。

さらに、より従来の方法によって達成することができる実験的制御よりも大きい実験的制御が、ＴＡＬＥドメイン融合物によって付与され得る。これは、遺伝子操作されたＴＡＬＥ融合物の産生及び／又は機能を、小分子制御下に配置することができるためである。このアプローチの例は、Ｔｅｔ−Ｏｎ系、エクジソン制御系、及び変異体プロゲステロン受容体を含むキメラ因子を組み込む系によって提供される。これらの系は全て、小分子制御下にＺＦＰ制御因子の機能及び／又は発現を配置することによって、小分子制御を任意の内在性遺伝子又は任意の導入遺伝子に間接的に与えることができる。

トランスジェニック生物
ＴＡＬＥ融合技術のさらなる適用は、遺伝子発現を操作し、かつ／又はゲノムを変更して、トランスジェニック動物又は植物を産生する。細胞株と同様に、内在性遺伝子の過剰発現又はトランスジェニックマウス等のトランスジェニック動物への異種遺伝子の導入は、極めて容易なプロセスである。同様に、トランスジェニック植物の産生は周知である。本明細書に記載のＴＡＬＥドメイン融合技術を使用して、トランスジェニック動物及び植物を容易に生成することができる。

遺伝子発現を操作するために遺伝子操作されたＴＡＬＥドメイン融合物を使用することは、前節に記載の小分子制御系を用いる成体動物に限定され得る。ＴＡＬＥドメインに基づく抑制因子の発現及び／又は機能を、開発中にオフに切り替え、成体動物において意のままにオンに切り替えることができる。このアプローチは、モジュールを発現するＴＡＬＥ融合物の添加に依存し、相同組換えは必要とされない。ＴＡＬＥドメイン融合抑制因子がトランスドミナントであるため、生殖系列伝達又はホモ接合性の心配はない。これらの問題は、不十分に特性化された遺伝子候補（ｃＤＮＡ又はＥＳＴクローン）からマウスモデルにするのに必要とされる時間及び労働に劇的な影響を及ぼす。この能力を使用して、治療的介入のために遺伝子標的を迅速に同定及び／又は検証し、新規のモデル系を生成し、かつ複雑な生理学的現象（発生、造血、形質転換、神経機能等）の分析を可能にすることができる。キメラ標的化マウスを、Ｈｏｇａｎｅｔａｌ．，ＭａｎｉｐｕｌａｔｉｎｇｔｈｅＭｏｕｓｅＥｍｂｒｙｏ：ＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，（１９８８）、ＴｅｒａｔｏｃａｒｃｉｎｏｍａｓａｎｄＥｍｂｒｙｏｎｉｃＳｔｅｍＣｅｌｌｓ：ＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ，Ｒｏｂｅｒｔｓｏｎ，ｅｄ．，（１９８７）、及びＣａｐｅｃｃｈｉｅｔａｌ．，Ｓｃｉｅｎｃｅ２４４：１２８８（１９８９）に従って誘導することができる。

ＴＡＬＥ融合物をコードする核酸を細胞又は胚に送達することによって、遺伝子修飾動物を生成することができる。典型的には、胚は、受精した一細胞段階の胚である。核酸の送達を、胚の核又は細胞質への微量注入を含む当技術分野において既知の方法のうちのいずれかによって行うことができる。ＴＡＬＥ融合物をコードする核酸を、所望の場合、ドナー核酸と共送達することができる。その後、胚は、遺伝子修飾動物を開発するために当技術分野において既知のように培養される。

本発明の一態様において、目的とする遺伝子又は遺伝子座をコードする少なくとも１つの染色体の配列が編集された遺伝子修飾動物が提供される。例えば、編集された遺伝子は、転写されないか、又は適切に翻訳されないように不活性化し得る。あるいは、配列を、遺伝子の代替の形態が発現されるように編集することができる（例えば、発現タンパク質における１つ以上のアミノ酸の挿入（ノックイン）又は欠失（ノックアウト））。加えて、目的とする遺伝子は、制御領域等の挿入配列を含み得る。遺伝子修飾動物は、編集された配列に対してホモ接合性であり得るか、又はヘテロ接合性であり得る。いくつかの実施形態において、遺伝子修飾動物は、Ｒｏｓａ２６、ＨＰＲＴ、ＣＣＲ５、又はＡＡＶＳ１（ＰＰＰ１Ｒ１２Ｃ）遺伝子座等の「セーフハーバー」遺伝子座に配列挿入（ノックイン）したかもしれない。これらのノックイン動物を、他の染色体遺伝子座でさらに編集することができる。いくつかの実施形態において、目的とする配列が、任意の選択マーカーなしで、かつ／又はプロモーターなしでセーフハーバーに挿入されるため、発現を駆動する内因性プロモーターに依存する。いくつかの態様において、宿主種動物に特異的なある特定の遺伝子がヒト相同体に置換されるように、遺伝子修飾動物を「ヒト化」することができる。このようにして、遺伝子修飾動物は、ヒト遺伝子（例えば、第ＩＸ因子）を発現させることによって産生され、ヒト遺伝子、タンパク質、又は疾患を研究するための動物モデル系の開発を可能にする。いくつかの実施形態において、目的とする遺伝子は、それぞれ、同族リコンビナーゼＣｒｅ及びＦＬＰの認識のために、ｌｏｘＰ又はＦＲＴ等のリコンビナーゼ認識部位をさらに含んでもよく、目的とする挿入遺伝子（複数を含む）に隣接し得る。遺伝子修飾動物と、同族リコンビナーゼ（例えば、Ｃｒｅ）を発現する別の遺伝子修飾動物との交配が、挿入遺伝子を欠如する子孫をもたらすように、ヌクレアーゼ部位を含有する遺伝子を挿入することができる。

用途
開示の方法及び組成物を使用して、所望の遺伝子座で遺伝子制御を制御することができる。最適な遺伝子を、ＴＡＬＥ反復ドメインに融合する転写制御ドメインに応じて、活性化するか、又は抑制することができる。ＴＡＬＥ活性化因子を、分化した細胞からｉＰＳＣを産生するという目標のために、多能性誘導遺伝子に標的化することができる。これは、特定の病状のためのインビトロ及びインビボモデル開発に、かつｉＰＳＣに由来する細胞治療薬の開発に役立ち得る。

ＴＡＬＥ融合物は、それ自体、治療薬として、特に脳又は眼等の免疫特権組織において有用であり得る。例えば、設計された活性化因子は、適切な機能（例えば、ＶＥＧＦ）のため、過剰発現される場合に毒性である遺伝子のために、天然スプライス変異体比を必要とする遺伝子産物の用量を増加させるのに特に有用である。設計されたＴＡＬＥ制御因子への一時的な曝露は、後成的変化を強要する機能ドメインの使用を介して、遺伝子発現状態の恒久的な切り替えも可能にする。この技術は、幹細胞を生成し、かつそれらの分化経路を制御するために、さらなる有用性を提供し得る。さらに、ＴＡＬＥ融合物は、免疫抑制患者において役立ち得る。

開示の方法及び組成物を、任意の１つの遺伝子又は複数の遺伝子のゲノム編集のために使用することもできる。ある特定の適用において、方法及び組成物を、ゲノム配列の不活性化のために使用することができる。現在に至るまで、トウモロコシ及びラット等の経済的に重要な種を含む少なくとも９つの高等真核生物のゲノムへの修飾を標的とするための切断に基づく方法が使用されており、そのような機能は、以前は利用不可能であった。他の適用では、本方法及び組成物は、編集されていない遺伝子と比較して、異なる発現若しくは生物学的特性を有する遺伝子の新規の対立遺伝子形態の生成を含む、ランダム変異の生成、又はヒト化遺伝子の組込みを可能にし、次いで、細胞又は動物モデルの生成を可能にする。他の適用では、本方法及び組成物を、それらの遺伝子の新規の対立遺伝子形態を保有する動物の同定又は選択を可能にする遺伝子の定義された位置でのランダム変異を作成するために使用することができる。他の適用では、本方法及び組成物は、ゲノムの任意の選択された領域への外因性（ドナー）配列の標的化組込みを可能にする。制御配列（例えば、プロモーター）を、標的化様式で、目的とする部位において組み込むことができる。「組込み」とは、物理的挿入（例えば、宿主細胞のゲノムへ）、加えて、相同指向ＤＮＡ修復中に生じる特殊化された核酸情報交換プロセスを介するドナー配列のコピーによる宿主細胞ゲノムへの組込みの両方を意味する。

ドナー配列は、ｓｈＲＮＡ、ｍｉＲＮＡ等の核酸も含むことができる。これらの小さい核酸ドナーを使用して、目的とする遺伝子へのゲノム内でのそれらの影響を研究することができる。動物遺伝子のゲノム編集（例えば、不活性化、組込み、及び／又は標的若しくはランダム変異）を、例えば、単一切断事象によって、切断後の非相同末端結合によって、切断後の相同指向修復機構によって、切断後のドナー配列の物理的組込みによって、２つの部位での切断後の２つの切断部位の間の配列を欠失させるための結合によって、コード領域へのミスセンス若しくはナンセンスコドンの標的化組換えによって、遺伝子又は制御領域を破壊するための遺伝子若しくはその制御領域への無関連配列（すなわち、「スタッファー」配列）の標的化組換えによって、又は転写物のミススプライシングを引き起こすためのイントロンへのスプライスアクセプター配列の標的化組換えによって達成することができる。いくつかの適用において、特定の位置でＴＡＬＥＮ誘導ＤＳＢを使用して、目的とする導入遺伝子を、哺乳類又は植物ゲノム内のセーフハーバー遺伝子座に組み込むことができる。米国特許公開第２００３０２３２４１０号、同第２００５０２０８４８９号、同第２００５００２６１５７号、同第２００５００６４４７４号、同第２００６０１８８９８７号、同第２００６００６３２３１号、及び国際公開第ＷＯ０７／０１４２７５号を参照されたく、それらの開示は、全ての目的のために、参照によりそれらの全体が組み込まれる。これらのＴＡＬＥＮを、標的化遺伝子操作のために、キットの構成要素として供給することもできる。

任意で新規又は非定型のＲＶＤを有し、さらに任意でＮキャップ及び／若しくはＣキャップ残基に取り付けられるＴＡＬＥ反復ドメインは、リコンビナーゼ、トランスポザーゼ、リゾルバーゼ、又はインテグラーゼ等のＤＮＡを操作する酵素に融合することもできる。したがって、それらのドメインを使用して、標的化トランスポゾン等のような手段及び／又は治療薬の開発を可能にするであろう標的化融合タンパク質を作製することができる。さらに、任意でＮキャップ及びＣキャップ残基に取り付けられるＴＡＬＥ反復ドメインは、ヌクレアーゼドメインに融合して、デザイナー制限酵素を作成することができる。例えば、任意でＮキャップ及びＣキャップ残基に取り付けられるＴＡＬＥ反復ドメインは、ヌクレアーゼ融合でのＤＮＡ調製物の処理が、ちょうど所望の位置で切断を生じさせ得るように、一本鎖ＦｏｋＩドメイン（最適なリンカーを使用して、２つのＦｏｋＩ切断半ドメインがともに結合される場所）に融合することができる。この技術は、標準の制限酵素では容易には着手されないＤＮＡ配列のクローニング及び操作に有用であろう。そのような系は、製造中に使用される特殊化された細胞系においても有用であろう。例えば、ＣＨＯ由来の細胞株は、内因的に活性なトランスポザーゼ／インテグラーゼ系を有しない。ＴＡＬＥトランスポザーゼ／インテグラーゼ系を、ＣＨＯ細胞における特異的標的化のために開発することができ、かつＴＡＬＥＤＮＡ結合ドメインの高度な特異性のため、ノックアウト／ノックイン、ゲノム編集等に有用であり得る。

ＴＡＬＥ融合タンパク質を使用して、所定の遺伝子座への特定のＤＮＡ結合タンパク質の結合を阻止することができる。例えば、遺伝子操作されたＴＡＬＥタンパク質が宿主細胞中で発現され、それがＤＮＡ上の部位を占有するというだけの理由で、天然制御タンパク質を、プロモーターにおけるその天然標的への結合からブロックすることができ、したがって、対照タンパク質による制御を阻止する。

ＴＡＬＥ融合タンパク質を、ＲＮＡに結合するように遺伝子操作することができる。このようにして、例えば、スプライスドナー及び／又はスプライスアクセプター部位を被覆することができ、ｍＲＮＡにおける特定の位置でのスプライシングを阻止するであろう。他の態様では、ＴＡＬＥを、例えば、ｓｈＲＮＡ、ｍｉＲＮＡ、又はＲＮＡｉ等の特定の機能的ＲＮＡに結合するように遺伝子操作することができる。

ＴＡＬＥ融合タンパク質は、診断法において有用であり得る。例えば、本タンパク質を、ゲノム中のある特定の配列を認識するように遺伝子操作し、特定の疾患に関連することが既知の対立遺伝子を同定することができる。例えば、これらの疾患のうちの１つに罹患する可能性を決定するか、又は症状の重症度を予知するために、特定の数のＴＡＬＥ反復単位を有するＴＡＬＥ融合物を、トリヌクレオチド反復障害（例えば、ハンチントン病）を有する可能性を有する患者におけるトリヌクレオチド反復の数を測定するある種の「ヤード尺」として利用することができる。これらの融合タンパク質を、診断キットの構成要素として供給することもでき、目的とするゲノムマーカーの迅速な同定を可能にする。さらに、これらのタンパク質を、細胞から精製し、かつ目的とする遺伝子の対立遺伝子の種類の分析、ｍＲＮＡ発現レベルの測定等に用いる診断キットにおいて、又は診断試薬のために使用することができる。ＴＡＬＥ融合物を、多チャンネル又は微小流体分析のために、シリコンチップ又はビーズに取り付けてもよい。

ＴＡＬＥ融合物は、製造環境において有用であり得る。ＴＡＬＥ転写因子融合物又はＴＡＬＥＮを、目的とする細胞株（例えば、ＣＨＯ細胞）又は藻（例えば、生物燃料の産生のため）において使用することができる。

遺伝子又はゲノム遺伝子座のＴＡＬＥ融合タンパク質媒介ゲノム編集についての様々な適用が存在する。本明細書に記載の方法及び組成物は、ヒト疾患のモデルの生成及び所望の特性を有する植物作物を可能にする。

本明細書において引用される全ての出版物及び特許出願は、それぞれの個々の出版物又は特許出願が、参照により組み込まれることを具体的かつ個別に示唆されるかのように、参照により本明細書に組み込まれる。

前述の発明は、理解の明瞭さのために、実例及び例証としてある程度詳細に記載されているが、本発明の教示の観点から、添付の特許請求の範囲の精神又は範囲から逸脱することなく、本発明に対してある特定の変更及び修正を行うことができることは当業者には容易に明らかであろう。

実施例１：キサントモナス・アクソノポディスからの天然ＴＡＬＥのクローニング
初期の設計フレームワークとしての機能を果たし得る天然ＴＡＬＥタンパク質を同定するために、高度の特異性、並びに哺乳類細胞における標的配列結合の証拠の両方を呈する基準の天然ＴＡＬＥを同定した。具体的には、１２．５個のＴＡＬＥ反復（ＴＡＬＥ１３と称される、１２個の全反復及び１個の半反復）を含有するＴＡＬＥタンパク質を、以下のプライマー対：ｐｔｈＡｄ１５２ＮＥｃｏＲ、ＡＣＧＴＧＧＡＴＴＣＡＴＧＧＴＧＧＡＴＣＴＡＣＧＣＡＣＧＣＴＣ（配列番号５２）及びｐｔｈＡＳａｃ２Ｒｅｖ、ＴＡＣＧＴＣＣＧＣＧＧＴＣＣＴＧＡＧＧＣＡＡＴＡＧＣＴＣＣＡＴＣＡ（配列番号５３）を使用して、ＰＣＲ増幅によって、キサントモナス・アクソノポディスからクローニングした。プライマー対を、最初は、Ｎ末端の１５２個のアミノ酸を切断したＡｖｒＢｓ３遺伝子を増幅するように設計した。これらの配列は、植物細胞への輸送に必要であるが、さもなければ機能にとっては不必要であることが以前に示されている（Ｓｚｕｒｅｋｅｔａｌ（２００２）Ｍｏｌ．Ｍｉｃｒｏ４６（１）ｐ．１３−２３を参照のこと）。中心タンデム反復の数の変化を有する高度に保存された配列を特徴とするいくつかのＴＡＬＥタンパク質を、これらのプライマー対を用いてＰＣＲによって単離した。ｈｓｓＢ３．０として報告されたＴＡＬＥ１５を除いて（Ｓｈｉｏｔａｎｉｅｔａｌ（２００７）Ｊ．Ｂａｃｔｅｒｉｏｌ１８９（８）：３２７１−９）、単離した他のＴＡＬＥタンパク質は、公開文献において報告されていないため、新規のタンパク質のようである。これらには、それぞれ、１３、９、及び１６個のＴＡＬＥ反復を有する、ＴＡＬＥ１３、ＴＡＬＥ９、及びＴＡＬＥ１６が含まれる。

（Ｎキャップの長さが推測された）ＴＡＬＥ１３のドメインマップが図１Ａに示され、ドメインを示す配列及びタンパク質が相互作用するＤＮＡ配列を決定するアミノ酸は、この作業で使用した位置番号付けシステムの指標とともに、図１Ｂに示される。

実施例２：ＴＡＬＥ１３及び他のＴＡＬＥの切断並びにＤＮＡ結合への影響
最大活性を提供するキャッピング配列の範囲の初期の調査として、いくつかのＴＡＬＥ切断を行った。これらの切断が、以下の表４に示される。

切断の領域を、以下のように番号付けする：Ｎ末端において、終点は、最初の真のＴＡＬＥ反復の最初の塩基からＮ末端方向にアミノ酸残基の数え上げる数として表される（図１Ｂを参照のこと）。例えば、Ｎ＋９１の標識は、最初の真の反復のＮ末端からＮ末端方向に９１個のアミノ酸をそのままの状態で残すＮ末端での切断を説明する。Ｃ末端において、終点は、最後の全ＴＡＬＥ反復の最後のアミノ酸からＣ末端方向のアミノ酸の数によって表される。ＴＡＬＥ１３、クローン番号１と命名した切断番号１は、全長ＴＡＬＥタンパク質のＮ末端の１５２個のアミノ酸を除去させ、単一のメチオニン残基を結果として生じるＮ末端に付加させ、したがって、Ｎ＋１３７終点（Ｎキャップ）を有し、このクローンを約２．５ｋｂの長さにする。切断番号２も、全長ＴＡＬＥタンパク質のＮ末端の１５２個のアミノ酸を除去させ、単一のメチオニン残基を結果として生じるＮ末端に付加させ、したがって、Ｎ＋１３７終点、並びにＮＬＳの５’端のＣ末端配列下流を有し、このクローンを約２．０ｋｂの長さにする。切断番号３は、ロイシン豊富な領域を欠失させる（ロイシン豊富な領域は、半反復のＣ末端であり、ＣキャップのＣ＋５２にまで及ぶ）ことを除いて、クローン番号２に類似しており、このクローンを約１．６ｋｂの長さにする。切断番号４は、Ｎ末端で、Ｒ０反復配列を含むそれ以下まで欠失されたことを除いて、クローン番号２に類似しており、このクローンを約１．６ｋｂの長さにする。切断番号５は、Ｃ末端側でのその欠失がロイシン豊富な配列（クローン番号２に類似）を含むことを除いて、クローン番号４に類似しており、このクローン約１．４ｋｂの長さにする。このタンパク質のために同定された内因性標的部位が依然として存在していないが、全長ＴＡＬＥ１３タンパク質の推定標的配列は、ＴＡＴＡＡＡＴＡＣＣＴＴＣＴ（配列番号５４）である。切断番号６は、１５２個のアミノ酸をＮ末端から欠失させ、Ｃ末端領域において、４３個のさらなるアミノ酸が欠失されたことを除いて、クローン番号２に類似している。切断番号７は、１６５個のアミノ酸をＮ末端から欠失させ、クローン番号６と同一のＣ末端欠失を有する。切断番号６及び番号７が以下で議論される。

標準のＳＥＬＥＸアッセイを切断されたＴＡＬＥタンパク質上で実行し、これらのタンパク質が結合するＤＮＡ配列を同定し（ＳＥＬＥＸ方法論については、Ｐｅｒｅｚ，Ｅ．Ｅ．ｅｔａｌ．ＮａｔｕｒｅＢｉｏｔｅｃｈ．２６，８０８-８１６（２００８）を参照のこと）、結果が、表５及び表６に示される。表５に示される実験を、標的ライブラリＮ１８ＴＡを用いて行った。Ｎ１８ＴＡライブラリは、以下の配列：
Ｎ１８ＴＡ：５’ＣＡＧＧＧＡＴＣＣＡＴＧＣＡＣＴＧＴＡＣＧＴＴＴＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＡＡＡＣＣＡＣＴＴＧＡＣＴＧＣＧＧＡＴＣＣＴＧＧ３’（配列番号５５）を有するＤＮＡ二本鎖を含み、Ｎは、４つ全ての塩基の混合物を示す。さらなるライブラリ（示されるような）は、以下の配列を含む：
Ｎ２２ＡＴ：５’ＣＡＧＧＧＡＴＣＣＡＴＧＣＡＣＴＧＴＡＣＧＡＡＡＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＴＴＴＣＣＡＣＴＴＧＡＣＴＧＣＧＧＡＴＣＣＴＧＧ３’（配列番号５９）
Ｎ２１ＴＡ：５’ＣＡＧＧＧＡＴＣＣＡＴＧＣＡＣＴＧＴＡＣＧＴＴＴＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＡＡＡＣＣＡＣＴＴＧＡＣＴＧＣＧＧＡＴＣＣＴＧＧ３’（配列番号６０）
Ｎ２３ＴＡ：５’ＣＡＧＧＧＡＴＣＣＡＴＧＣＡＣＴＧＴＡＣＧＴＴＴＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＡＡＡＣＣＡＣＴＴＧＡＣＴＧＣＧＧＡＴＣＣＴＧＧ３’（配列番号６１）
Ｎ２６：５’ＣＡＧＧＧＡＴＣＣＡＴＧＣＡＣＴＧＴＡＣＧＴＴＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＡＡＣＣＡＣＴＴＧＡＣＴＧＣＧＧＡＴＣＣＴＧＧ３’
Ｎ３０ＣＧ：
５’ＣＡＧＧＧＡＴＣＣＡＴＧＣＡＣＴＧＴＡＣＧＣＣＣＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＮＧＧＧＣＣＡＣＴＴＧＡＣＴＧＣＧＧＡＴＣＣＴＧＧ３’（配列番号６２）

データは、塩基頻度マトリックスとして、以下の表５に示される。これらのマトリックスにおけるそれぞれの位置で、囲みは、予想されるＲＶＤ標的塩基を示し、数は、それぞれの回収した塩基の種類の相対的な頻度を示しており、１．０は、１００％を示した。

ＴＡＬＥ１３、クローン番号１のタンパク質は、Ｎ末端の１５２個のアミノ酸を欠如しているにもかかわらず、その結合において高度に選択的であるように見える。ＴＡＬＥ１３、クローン番号２についてのＳＥＬＥＸデータが、表６に示される。この図において、ＳＥＬＥＸは、標的配列の２つの異なるライブラリで繰り返され、両方のライブラリと類似の結果をもたらした。

クローン番号３、４、及び５を、ＳＥＬＥＸ手順に供し、コンセンサス配列は検出されなかった。したがって、ＴＡＬＥ結合ドメインは、このアッセイにおいてコンセンサス配列を産生するために、クローン番号２からのクローンに含まれるＮ末端及びＣ末端キャップ配列を必要とするようである。Ｂａｒｔｓｅｖｉｃｈｅｔａｌ．，ＳｔｅｍＣｅｌｌｓ２００３；２１：６３２−７に記載されるように、本質的にＤＮＡ結合ＥＬＩＳＡアッセイを使用して、活性についてさらなる切断を実行及び試験した。切断が以下の表７に示され、ＥＬＩＳＡ結果も含まれている。これらの切断における開始Ｎ末端は、アミノ酸１５２であり、上述の番号１、番号２、及び番号３の切断におけるＮ末端と同一である。この詳細な切断シリーズにおいて、終点は、以下の通りである。

これらのデータは、このインビトロアッセイにおける効率的なＴＡＬＥ結合が、Ｎ＋１２２〜Ｎ＋１３７、さらにＣ＋５３〜Ｃ＋９５の残基を必要とすることを示唆する（Ｎ＋１２１を含むそれ以下のＮキャップ残基は、強力な結合に十分ではなく、Ｃ＋５２を含むそれ以下のＣキャップ残基は、強力な結合に十分ではなかった）。

予備的なマッピング研究は、最適な結合活性を達成するために、キサントモナスＴＡＬＥの最小のＮキャップ及びＣキャップ配列の推定を可能にした。Ｎ末端キャップについて、第１の真の反復の開始より前のＮ＋１２２〜Ｎ＋１３７のいくつかの数のアミノ酸を含む配列が、ＤＮＡ結合活性に必要とされるようである。ラルストニアキャップの類似のキャップ例を、キサントモナスＴＡＬＥに対する構造的相同性に基づいて作製することができる（以下の表８を参照のこと）。Ｃ末端キャップにおいて、太字のアミノ酸は、ＲＶＤを示す。

実施例３：天然ＴＡＬＥタンパク質９及び１６の結合特異性
２つのさらなる天然ＴＡＬＥタンパク質を、ＳＥＬＥＸ手順に供して、これらのタンパク質が結合する標的ＤＮＡ配列を同定した。ＴＡＬＥ９が、以下のＤＮＡ標的：ＴＡＮＡＡＡＣＣＴＴ（配列番号５６）を特定する８．５個のＴＡＬＥ反復を有する一方で、ＴＡＬＥ１６は、以下の標的：ＴＡＣＡＣＡＴＣＴＴＴＡＡＣＡＣＴ（配列番号５７）を予測する１５．５個のＴＡＬＥ反復を有する。データは、表９及び１０に示される。表９において、クローン番号２の構造のＴＡＬＥ９タンパク質が使用されており、結果が示されている。ＴＡＬＥ１３、クローン番号２と同様に、この実験は、第２の部分的にランダム化されたＤＮＡライブラリで繰り返され、第１のライブラリと類似のデータをもたらした。ＴＡＬＥ１３について上で記載したように、ＴＡＬＥ９は、その標的配列に高度に特異的である。

表１０は、Ｎ１８ＴＡライブラリを有するＴＡＬＥ１６タンパク質についてのＳＥＬＥＸデータを示し、この場合もやはり、同定された標的の高度の配列特異性を実証する。

効率的なＤＮＡ結合のための条件をさらに調査するために、さらなる切断をＴＡＬＥタンパク質において行った。上の表４は、これらの切断を示す。ＴＡＬＥ９をクローン番号６の切断において試験したとき（表１１）、ＤＮＡ結合特異性が維持された（表１１を表９と比較）。

実施例４：哺乳類細胞におけるＴＡＬＥ融合タンパク質によるレポーター遺伝子活性化
哺乳類細胞におけるＴＡＬＥドメイン融合物の機能活性を調査するために、遺伝子操作されたレポーター構築物を以下のように作製した。クローニングされたＴＡＬＥ１３又はＴＡＬＥ１５の標的配列の１つ以上のコピーを、ＮｈｅＩ部位とＢｇｌＩＩ部位との間のレポーター構築物に挿入し、それによって、標的を、ｐＧＬ３プラスミド（Ｐｒｏｍｅｇａ）中の最小のＳＶ４０プロモーターによって駆動されるホタルルシフェラーゼ発現単位から上流に配置する（図２を参照のこと）。ｐＧＬ３プラスミドのプロモーター領域が図２Ａに示され、ＴＡＬＥ１３の２つの予測標的部位を含有する配列が、図２Ｂに示される。図３に示される実験において、ＴＡＬＥタンパク質構築物（２つの標的を含有するレポータープラスミドとともに）（図３Ａ）、及び内部対照としてレニラルシフェラーゼ（Ｐｒｏｍｅｇａ）を含有する発現構築物を、ヒト２９３細胞に共トランスフェクトした。その後、それぞれのＴＡＬＥタンパク質によって誘導されたホタルルシフェラーゼ活性を、トランスフェクションの２日後に分析した。複数の標的に応じて、ＴＡＬＥＶＰ１６融合物は、哺乳類細胞におけるレポーター遺伝子発現を相乗的に活性化することができる（図３）。さらに、図４Ｂに示されるように、ＶＰ１６活性化ドメイン（ＴＲ１３−ＶＰ１６及びＴＲ１５−ＶＰ１６）を付加したＴＡＬＥタンパク質は、ルシフェラーゼレポーター遺伝子を活性化する。ＶＰ１６ドメインを有しない天然ＴＡＬＥタンパク質の発現は、ルシフェラーゼを活性化しない（ＴＲ１３及びＴＲ１５）。したがって、レポーター遺伝子活性化は、正しい標的がそれらの対応するＴＡＬＥ融合物と一致する場合にのみ観察され、転写活性化が標的化ＤＮＡ結合に起因することを示唆する。

次に、ＴＡＬＥ標的配列を、標的化プロモーターに対して遠位の位置及び近位の位置の両方に挿入した。この実験において、図５Ａに示されるように、ＴＡＬＥ１３標的を使用し、４つの標的配列をプロモーターの上流（例えば「Ｒ１３×４」）又は下流（「Ｒ１３×４Ｄ」）のいずれかに挿入した。図５Ｂに示される結果は、ＴＡＬＥ１３結合部位を目的とするプロモーターに近接近して上流に配置したときに、最適活性化が見られることを実証する。

実施例５：人工ＴＡＬＥ転写因子の構築
ＴＡＬＥタンパク質を転写制御ドメインに結合して、哺乳類細胞におけるレポーター遺伝子発現を調節することができることを実証した後、所望の標的特異性を有するＴＡＬＥ転写因子を遺伝子操作するための実験を行った。ＴＲ１３ＶＰ１６のサイレント変異（すなわち、アミノ酸配列の変更を伴わないヌクレオチド配列の変更）を導入して、それぞれ、最初のタンデム反復の開始部及び最後のタンデム反復の最後部に、２つの特有の制限部位、ＡｐａＩ及びＨｐａＩを作成した。その後、これらのＡｐａＩ及びＨｐａＩ部位を、合成タンデム反復をＴＲ１３ＶＰ１６骨格にクローニングするために使用し、タンデム反復に隣接する完全なＮ末端及びＣ末端配列、並びにＶＰ１６活性化ドメインを有する遺伝子操作されたＴＡＬＥを生成した。

標的化配列は、ＮＴ３プロモーター配列内に配置されるＧＧＡＧＣＣＡＴＣＴＧＧＣＣＧＧＧＴ（配列番号５８）であった。以前に、この配列を標的とするＺＦＰＴＦ２３５７０は、内因性ＮＴＦ３遺伝子発現を活性化することを示した（共同所有の米国特許仮出願第６１／２０６，７７０号を参照のこと）。遺伝子操作されたＴＡＬＥ１８アミノ酸配列のタンデム反復を変更して、目的とする標的ヌクレオチドを特定するように、ＴＡＬＥＡｖｒＢｓ３由来の１７．５個のタンデム反復を、骨格として使用して、ＴＡＬＥ１８（「ＮＴ−Ｌ」とも命名された）を遺伝子操作した。遺伝子操作されたＴＡＬＥ１８由来のＤＮＡ結合ドメインのアミノ酸配列は、以下の表１２に示されており、ＲＶＤは、太字の囲みで示されている。

先の遺伝子操作の試みにおいて使用した４つのＲＶＤ（それぞれ、Ａ、Ｃ、Ｇ及びＴを標的とする、ＮＩ、ＨＤ、ＮＮ、及びＮＧ）に加えて、我々は、２つの自然発生タンパク質において同族標的部位グアニンで観察されたように、ＤＮＡ標的部位におけるＧヌクレオチドに対応する位置で、ＴＡＬＥ反復のサブセットにＮＫＲＶＤも組み込んだ（同書のＭｏｓｃｏｕｅｔａｌを参照のこと）。先の実験的研究（同書のＢｏｃｈｅｔａｌを参照のこと）に一致して、我々は、平均して、ＮＩ、ＨＤ、ＮＧが、それぞれ、アデニン、シトシン、及びチミンへの強い選好を示し、かつＮＮが、グアニンへの選好を示したが、アデニンに結合することもできることを見出した。対照的に、ＮＫＲＶＤは、グアニンへの強い選好を示し、少なくとも１つのグアニンを含む部位を標的とする遺伝子操作されたＴＡＬＥタンパク質の改善の可能性を表す。

その後、遺伝子操作されたＴＡＬＥ１８の１７．５個のタンデム反復をコードするＤＮＡ配列を、以下のように、アミノ酸配列から誘導し、それぞれ約４０ヌクレオチド長である８４個の重複オリゴで合成した。最初に、全１．８ｋｂＤＮＡ配列を１１個のブロックに分け、それぞれのブロックを被覆する重複オリゴをＰＣＲに基づく方法によって組み立て、その後、ＰＣＲをオーバーラップさせることによって、１１個のブロックをともに融合させて４個のより大きいブロックにし、最後に、最も外側のプライマー対を用いてＰＣＲをオーバーラップさせることによって、４個のブロックを組み立てて全長にした。その後、合成されたタンデム反復を配列確認し、上述のように、ＴＲ１３−ＶＰ１６のＡｐａＩ及びＨｐａＩ部位にクローニングして、ＮＴ−３プロモーター（Ｒ２３５７０Ｖ）を標的とする遺伝子操作されたＴＡＬＥ１８（ＮＴ−Ｌ）の発現構築物を生成した。

その後、この遺伝子操作されたタンパク質（ＮＴ−Ｌと命名した）の特異性をＳＥＬＥＸによって決定し、結果は、以下の表１３に示される。見られるように、データは、所望の配列に結合する完全に新規のＴＡＬＥタンパク質を遺伝子操作することが可能であることを実証する。以下の表１３にも示されるように、ＳＥＬＥＸ選択を、クローン番号６の切断（上を参照のこと）においてＮＴ−Ｌでも行い、ＴＡＬＥ９と同様に、ＮＴ−Ｌの特異性がこの切断内で維持されることを実証する。ＳＥＬＥＸ実験を、クローン番号７の切断においてＮＴ−Ｌでも行い、ＤＮＡ結合特異性が維持されたことを示した。

次に、遺伝子操作されたＮＴ−Ｌタンパク質の転写活性を、標的配列の２つのコピーを含有するルシフェラーゼレポーター構築物に対して分析した。以下の表１４及び図６Ａに示されるように、遺伝子操作された１７．５個のタンデム反復を含有するが、その他の点ではＴＲ１３−ＶＰ１６と同一である、遺伝子操作されたＮＴ−Ｌ融合タンパク質（Ｒ２３５７０Ｖ）が、強力なレポーター遺伝子活性化を駆動することができる一方で、タンデム反復（Ｒ０−ＶＰ１６）を有しない類似の構築物は、ルシフェラーゼを活性化しない。反復に隣接するＮ末端又はＣ末端配列（それぞれ、ｎＲ２３５７０Ｓ−ｄＮＣ及びｎＲ２３５７０Ｓ−ｄＮＣ）のいずれかの欠失が、転写活性を無効にしたため、全長タンデム反復（Ｎキャップ及びＣキャップ）に隣接するＴＡＬＥ配列は、レポーター遺伝子活性化に必要とされる。ｎＲ２３５７０Ｓ−ｄＮＣと命名された構築物は、ＳＶ４０核局在化シグナル（ｎ）を含有し、遺伝子操作されたＮＴ−Ｌ反復（Ｒ２３５７０）は、単一のｐ６５活性化ドメイン（Ｓ）に融合した。この構築物は、反復のみを含有し、ＴＡＬＥ由来のＮ末端又はＣ末端配列（ｄＮＣ）は含有しなかった。構築されたｎＲ２３５７０ＳＳ−ｄＮＣは、２つのｐ６５活性化ドメインを有したことを除いて、ｎＲ２３５７０Ｓ−ｄＮＣについて記載したことと同一であった。

表１４に見られるように、最も高いレベルのレポーターの活性化が、Ｒ２３５７０Ｖ構築物で見出された。ＮＴ−Ｌ反復をＮ末端及びＣ末端キャッピング領域の不在下で使用したときに、バックグラウンドを超える活性化がこのアッセイにおいて観察されなかったことに留意する（ｎＲ２３５７０Ｓ−ｄＮＣを偽構築物と比較）。

次に、遺伝子操作された融合タンパク質が、哺乳類細胞中のその染色体遺伝子座において内在性遺伝子を活性化することができるかを確かめるために、構築物を用いて、内因性ＮＴＦ３遺伝子を標的化した。図６Ｂの実験において、遺伝子操作されたＮＴ−Ｌ（Ｒ２３５７０Ｖ）、並びに対照構築物（Ｒ０−ＶＰ１６、ＧＦＰ）を、ヒト２９３細胞に一時的にトランスフェクトした。トランスフェクションの２日後、ＮＴ−３発現レベルをＴａｑｍａｎ分析によって分析した。図６Ｂに示されるように、遺伝子操作されたＮＴ−Ｌ（Ｒ２３５７０Ｖ）の発現が、ヒト２９３細胞におけるＮＴＦ３ｍＲＮＡ発現の実質的な増加につながる一方で、対照タンパク質（Ｒ０−ＶＰ１６又はＧＦＰ）の発現は、ＮＴＦ３発現レベルに影響を与えなかった。内在性遺伝子の発現を活性化するために、特異的に遺伝子操作されたＴＡＬＥドメイン融合タンパク質を哺乳類細胞において使用したのはこれが初めてである。

さらなる例示的な構築物を作製して、ＴＡＬＥ反復ドメインに隣接するＣ末端領域の２７８個全ての残基が活性に必要とされるかを決定した。このさらなる構築物（＋９５）は、ＴＡＬＥ反復ドメインとＶＰ１６活性化ドメイン（すなわち、Ｃ＋９５Ｃキャップ）との間にＣ末端領域の最初の９５個の残基のみを含有した。図７は、これらの２つの構築物（＋２７８構築物は、図６においてＲ２３５７０Ｖと称されている）の図解、及びｍＲＮＡ及びタンパク質レベルでのこれらのタンパク質のＮＴＦ３活性化への影響を示す。これらの構築物のうちのより長い方の構築物（＋２７８Ｃ末端（又は全長）ドメインを含有する）のＳＥＬＥＸ結果も示される。図で見られるように、両方のＴＡＬＥ転写因子構築物は、ｍＲＮＡ及びタンパク質レベルの両方でＮＴＦ３発現を上方制御することができる。

ＶＥＧＦ、ＣＣＲ５、及びＰＥＤＦ遺伝子中の領域における結合に特異的な構築物も生成した。上述のように、反復ドメインを、上述の方法論を用いて、これらの標的に結合するように遺伝子操作した。これらのタンパク質の標的部位が、以下の実施例７に示される。タンパク質は、１０反復ＤＮＡ結合ドメイン又は１８反復ＤＮＡ結合ドメインのいずれかを含有した。

さらに、９．５反復ＮＴＦ３特異的及び９．５反復ＶＥＧＦ特異的ＴＡＬＥＤＮＡ結合ドメインにおいて一連の切断を行った。切断は、ＴＮＴＣｏｕｐｌｅｄＲｅｔｉｃｕｌｏｃｙｔｅＬｙｓａｔｅ系（Ｐｒｏｍｅｇａ）において発現され、以下のように、ＤＮＡフラグメントに結合するために溶解物を使用した。２５０ナノグラムのヌクレアーゼ融合クローンプラスミドを含有する５μＬの水を２０μＬの溶解物に添加し、かつ３０℃で９０分間インキュベートすることによって、タンパク質が発現された。結合アッセイを上述のように行った。標準の方法論を使用したウエスタンブロット法は、発現したタンパク質が全て同等に発現されたことを確認した。結合アッセイの結果が図８に示される。これらの実験において、Ｎ末端の切断のために、Ｃ末端アミノ酸をＣ＋９５で保持し、一方で、Ｃ末端切断のために、Ｎ末端をＮ＋１３７構造で維持した。図から見られるように、このアッセイにおいて、タンパク質が、最初の真の反復のＮ末端側に少なくとも１３４個のアミノ酸、及び半反復のＣ末端側に少なくとも５４個のアミノ酸を含有したときに、最大の結合が観察され、興味深いことに、これは、ＮＴＦ３配列に標的化されたＴＡＬＥＤＮＡ結合ドメイン及びＶＥＧＦ配列に標的化されたＴＡＬＥＤＮＡ結合ドメインの両方ともに当てはまった（パネルＡとパネルＢを比較）。Ｃ末端を（上で記載されるようにＣ＋９５ではなく）＋５４まで切断する場合に、タンパク質を使用して重要なＮ末端１３４位の周囲の切断を繰り返し、Ｎ末端を（Ｎ＋１３７ではなく）＋１３４位まで切断する場合に、Ｃ末端切断を繰り返した。データが図９に示され、先の実験において観察されたように、Ｃ末端を＋５４を超えて切断したとき、かつ／又はＮ末端を＋１３４を超えて切断したときに、類似したＤＮＡ結合の減少を示す。これらのデータは、このインビトロ親和性アッセイにおける最適な結合のための最小のキャップが、Ｎ＋１３４位及びＣ＋５４位にまで及ぶことを示す。

実施例６：哺乳類細胞におけるＤＮＡ標的化に関与するＴＡＬＥ機能ドメインの解離
この実施例では、以下の表１５に示されるように、ＴＡＬＥ１３タンパク質Ｎ末端又はＣ末端での種々の欠失を生成した。

全ての構築物を、ＶＰ１６活性化ドメイン（ＶＰ１６を有する構築物は「Ｒ１３Ｖ」と指定される）及び核局在化シグナル（ＮＬＳを有する構築物は「ｎＲ１３」と指定される）に結合させ、予測したＴＡＬＥ１３標的の２つのコピーを含有するレポーター構築物由来のレポーター遺伝子活性化について試験した（図１０、上のパネル）。

図１０に示されるように、この組の構築物（表１５を参照のこと）において強力なレポーター活性化活性を保持する最小の領域は、そのＮ末端で１５２個のアミノ酸及びそのＣ末端で１８３個のアミノ酸を欠如するＲ１３Ｖ−ｄ１８２Ｃである。結果は、最初のタンデム反復及び最後の反復に続くロイシン豊富な領域に先行するＲ０領域が、このアッセイにおいて最適な結合を提供する一方で、核局在化シグナル及びそのＣ末端で天然の活性化ドメインを含有する領域は、哺乳類細胞におけるＤＮＡ標的に不必要であることを確認する。

実施例７：ヌクレアーゼドメインに結合されるＴＡＬＥのヌクレアーゼ切断活性の実証
次に、人工ＴＡＬＥヌクレアーゼ（ＴＡＬＥＮ）に関連したＴＡＬＥのＤＮＡ標的化能力を評価した。ＦｏｋＩドメイン間でＧＧＧＳ配列の１２個のコピーによって結合されるＦｏｋＩヌクレアーゼドメインの２つのコピーが、ＶＰ１６活性化ドメインを置換するために使用されたことを除いて、上述のＲ１３Ｖ−ｄ１８２Ｃと同一であるＲ１３ｄ１８２Ｃ−ｓｃＦｏｋＩと称される構築物を生成するために、実施例６で定義されるＴＡＬＥ１３のＤＮＡ標的ドメインを、ヌクレアーゼドメインに結合させた。次に、ＴＡＬＥＮ構築物を、一本鎖アニーリング（ＳＳＡ）に基づくレポーターアッセイにおけるヌクレアーゼ活性について試験した（共同所有の米国特許公開第２０１１００１４６１６号を参照のこと）。

このアッセイにおいて使用したレポーター構築物（図１１Ａ、ＳＳＡ−Ｒ１３）は、ＧＦＰコード配列のＮ末端部分（ＧＦ）とＣ末端部分（ＦＰ）との間に挟まれた予測ＴＡＬＥ１３標的を含有する。レポーターＳＳＡ−Ｒ１３は単独で、ＧＦＰ発現を駆動することはできないが、ＴＡＬＥ１３標的での切断は、ＧＦＰのＮ末端部分及びＣ末端部分の間で相同組換え（ＨＲ）を促進して、機能的なＧＦＰ導入遺伝子を形成する。結果が図１１Ｂに示される実験において、（偽）ＴＡＬＥＮ構築物を有するか、又は有しないＳＳＡ−Ｒ１３レポーター構築物を、先に記載されるように、Ｋ５６２細胞に一時的にヌクレオフェクトした。

ヌクレオフェクションの２日後、ＧＦＰ陽性細胞の割合をフローサイトメトリーによって分析した。図１１Ｂに示されるように、約７％のＧＦＰ陽性細胞を、ＴＡＬＥＮ融合によってＳＳＡ−Ｒ１３レポータープラスミドから生成し（Ｒ１３ｄ１８２Ｃ−ｓｃＦｏｋＩ）、約１．４％のＴＡＬＥプラスミドを欠如する対照実験（偽）と比較して、ＳＳＡ−Ｒ１３レポーター中のＴＡＬＥ１３標的における切断の著しい増加を表す。

これらのデータは、ＴＡＬＥＤＮＡ結合ドメインを使用して、哺乳類細胞中のＤＮＡの部位特異的切断の機能的ＴＡＬＥＮを生成することができることを実証する。

ＴＡＬＥドメイン融合物はまた、ＦｏｋＩ切断半ドメインを使用して構築された。これらの実施例のために、野生型ＦｏｋＩ半切断ドメインを使用し、したがって、ヌクレアーゼ活性のために、ホモ二量体が、融合物のうちの２つから形成されるはずである。これらの融合物について、ＴＡＬＥ１３ＤＮＡ結合ドメインは、ＴＡＬＥＤＮＡ結合ドメインを、ＦｏｋＩを特定する配列に隣接するプラスミドにクローニングすることによって、それぞれのＦｏｋＩ半ドメインに融合した。加えて、種々のリンカーを、ＤＮＡ結合ドメインとヌクレアーゼドメインとの間での使用について試験した。以下のようなリンカーＬ２及びＬ８を使用した：Ｌ２＝ＧＳ（配列番号７１）及びＬ８＝ＧＧＳＧＧＳＧＳ（配列番号７２）。それら２つが相互から２〜２２ｂｐだけ分離されるようにそれぞれの標的結合部位の間のギャップ間隔を変化させて、標的部位を、ＴＯＰＯ２．１標的ベクター（Ｉｎｖｉｔｒｏｇｅｎ）にクローニングした。標的ＤＮＡを生成するために、標的ベクターの約１ｋｂの領域のＰＣＲ増幅を行った。ＴＡＬＥＤＮＡ結合ドメインはまた、上述のように切断され、上の実施例２及び６で説明された命名法と同一の命名法を使用して説明される。ＴＡＬＥドメインヌクレアーゼ融合クローンを、２５０ナノグラムのヌクレアーゼ融合クローンプラスミドを含有する５μＬの水を２０μＬの溶解物に添加し、かつ３０℃で９０分間インキュベートすることによって、ＴＮＴウサギ網状赤血球溶解物系において発現させた。

次に、溶解物を使用して、以下のように標的ＤＮＡを切断した。２．５μＬの溶解物を、５０ナノグラムのＰＣＲで増幅された標的ＤＮＡ及び１倍の濃度の最終緩衝液２（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を含有する５０μＬの反応物に添加した。切断反応は、３７℃で１時間であり、６５℃で２０分間の熱不活性化段階が続いた。その後、反応物を高速で遠心分離して、標的ＤＮＡを溶解物から分離し、溶解物を反応ウェル中のペレットに凝縮させた。ＤＮＡを含有する上清を、ピペットで吸い上げ、臭化エチジウム染色アガロースゲル（Ｉｎｖｉｔｒｏｇｅｎ）上に流し、別々の無傷の標的ＤＮＡを切断された標的ＤＮＡから分離した。その後、アガロースゲルを、アルファＥａｓｅＦＣ（ＡｌｐｈａＩｎｎｏｔｅｃｈ）ソフトウェアを使用して分析し、切断されていない大きいＤＮＡバンド及び標的ＤＮＡの単一の切断事象に由来する２つの小さいＤＮＡバンド中に存在する標的ＤＮＡの量を測定した。ゲルに装填された標的ＤＮＡの総量のうち切断されたＤＮＡの割合は、それぞれの反応における切断率を表す。

我々は、融合物を効率的な結合に必要とされる特定の領域にまで減らす目的で、ＴＡＬＥタンパク質の隣接領域を最小限に抑えることを所望し、余分なペプチド配列をトリミングすることは、ＦｏｋＩ切断ドメインのより制約された付着を提供するであろうと推論し、ＴＡＬＥＮの触媒活性を改善し得る。ＴＡＬＥＤＮＡ結合ドメインのＮ末端及びＣ末端（配列番号７３及び配列番号３６９）での切断を、以下に示されるように行い、切断部位は、アミノ酸配列の上に示され、予測される二次構造（Ｃ＝ランダムコイル、Ｈ＝ヘリックス）は、配列の下に示される。

Ｃ末端欠失研究の結果が、図１２及び図１３に示される。図１２は、臭化エチジウム染色アガロースゲル上で切断産物を視覚化することによる、標的配列の切断を示す。図１２において、Ｌ２又はＬ８は、使用されたリンカーを示しており、それぞれのレーンの下の番号は、二量体の２つの標的ＤＮＡ結合部位間のｂｐの差を示した。「Ｓ」は、活性ヌクレアーゼホモ二量体がＤＮＡを形成することができないような１つのみの標的ＤＮＡ結合部位の存在を示す。「Ｐｍｌｌ」は、ＴＡＬＥ結合部位の隣のクローニングされたＤＮＡ標的配列内に配置される特有の制限部位の市販の制限酵素（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を使用した、切断の正の制御反応を示す。ＰｍｌＩ部位での切断は、クローニングされた標的部位がＰＣＲで増幅された標的ＤＮＡ中に存在することを示し、切断されたＤＮＡのおおよその予想寸法も示す。空は、ＴＡＬＥＮが産生されないようにプラスミドをコードするＴＡＬＥＮを有しない負の制御ＴＮＴ反応を示す。データは、図１３にグラフ形式で示され、タンパク質の切断活性が、少なくとも９個の塩基の長さのスペーサー用のＣ＋２８及びＣ＋３９Ｃキャップを伴って著しく増加することを示す。これらの実験を続け、さらなるＣキャップ（Ｃ−２、Ｃ＋５、Ｃ＋１１、Ｃ＋１７、Ｃ＋２２、Ｃ＋２５、Ｃ＋２８、及びＣ＋６３）を構築した。結果が、以下の表１６に要約される。「スペーサー」は、標的部位間の塩基対の数を示し、「ＳＣ」は、標的中に１つのみの結合部位を含有する試料を示す。

上に示されるデータに見られるように、このアッセイにおいて、融合ヌクレアーゼのように、Ｃ末端が約Ｃ＋５を超えて切断されるとき、タンパク質の活性が低くなるようである。

示されるスペーサーで標的が提示されるときのさらなるＣ末端切断点を伴うＴＡＬＥ１３ヌクレアーゼの切断活性も評価し、結果は、以下の表１７に示される。「Ｓ」は、切断標的が、ＴＡＬＥ１３への単一の結合部位を含有したことを示す。

ＴＡＬＥタンパク質のＣ末端領域で行われた作業と同様に、欠失は、Ｎ末端においても作製された。データが図１４に示され、切断がＮ＋１３７位に比較的接近して導入されるとき、Ｎ末端欠失を有するタンパク質の活性が減少することは明らかである。この図において、それぞれの列は、対応するＮ末端切断及び使用した別々のクローンの数で表示される。「Ｓ」は、標的において単一のみの結合部位が存在したことを示す。これらの結果の合計は、ＴＡＬＥＮがＦｏｋＩ半ドメイン又は一本鎖構造と相互作用することができる２つの半ドメインのいずれかに結合するときに、活性がかなり高くなり得るが、Ｎキャップ及びＣキャップの長さは、結果として生じるＴＡＬＥＮのＤＮＡ切断特性に影響を与えることを示す。

ＴＡＬＥＮを、哺乳類細胞中で内因性標的に結合するように構築した。１０反復のＮＴＦ３結合ドメインを、上述のＦｏｋＩ半ドメインに結合した。加えて、ＮＴＦ３特異的パートナー（ｒＮＴＦ３）を、標準の重複オリゴヌクレオチド構築技術を用いて商業的に構築した。合成ＮＴＦ３パートナーを、Ｃ末端：Ｃ＋６３、Ｃ＋３９、及びＣ＋２８で３つの変異体を用いて作製し、ＴＡＬＥＤＮＡ結合ドメインを、エピトープ標識及び核局在化シグナルをＣ末端に、かつ野生型ＦｏｋＩ切断ドメインをＣ末端に付加する標準のＺＦＮベクターにクローニングした。これらの実験で使用した構築物の完全なアミノ酸配列が、実施例２３に示される。

９．５反復のＮＴＦ３−Ｆｏｋ１融合物、及び１８反復のＮＴＦ３特異的ＮＴ−Ｌタンパク質に加えて、ＴＡＬＥＮもまた、ＶＥＧＦ遺伝子に特異的な部位を標的とするように作製した。この融合タンパク質は、９．５個の反復単位を含有し、上述のように構築した。１８反復のＮＴ−Ｌ及びＶＥＧＦ特異的ＴＡＬＥＮもまた、＋２８、＋３９、又は＋６３のいずれかのＣ末端切断で作製した。次に、これらの合成融合ヌクレアーゼを、種々の組み合わせで、上述のヌクレアーゼアッセイにおいてインビトロで使用した。基質配列が以下に示され、大文字は、種々の融合物の標的結合部位を示す。

これらの研究の結果は、以下の表１８及び表１９に示される。

表１８が、それぞれのＴＡＬＥＮ対の二重試験を示すことに留意する。例えば、試料１及び１６は、ＴＡＬＥＮ単量体の同一の組み合わせである。

「ＮＮ」は、左（ＮＴ−Ｌ）及び右（ＮＴ−Ｒ）のＮＴＦ３ＴＡＬＥＮの両方に結合する内因性ＮＴＦ３標的の関連部分を指す。番号１又は番号２は、同一の構築物の異なるクローンを指す。

したがって、これらのタンパク質は、ヌクレアーゼとしてインビトロにおいて活性である。

これらのタンパク質を、上述のＳＳＡレポーター系を使用した哺乳類細胞におけるエンドヌクレアーゼ活性のアッセイにおいても使用した。ＮＴＦ３部位での切断を受けての切除が、発現能力のある完全なＧＦＰレポーターをもたらすように、標的基質（図１５Ａに示される、配列番号４５２）を、分離されたＧＦＰレポーター間にクローニングした。この基質は、ＮＴＦ３標的配列及びＣＣＲ５遺伝子標的に特異的な標的配列の両方を含有する。図１５Ｂは、ＮＴＦ３特異的ＴＡＬＥタンパク質の選択を使用したこの実験の結果を示す。この実験において、以下のＮＴＦ３特異的ＴＡＬＥＮ融合物を使用した。ＴＡＬＥ１３Ｃ２８Ｌ２は、Ｃ＋２８切断及びＬ２リンカーを有する上述のＴＡＬＥ１３誘導体である。ｒＮＴ３Ｒ１７Ｃ２８Ｌ２は、Ｃ＋２８切断及びＬ２リンカーを有する、（ＮＴ３遺伝子のコード鎖に対して逆のＤＮＡ鎖を標的とする）１７．５反復のＮＴ３特異的タンパク質である。ｒＮＴ３Ｒ１７Ｃ３９Ｌ２は、Ｃ＋３９Ｃ末端を有する類似の構築物であり、ｒＮＴ３Ｒ１７Ｃ６３Ｌ２は、Ｃ＋６３Ｃ末端を有する。このｒＮＴ３Ｒ１７ＤＮＡ結合ドメインは、ＮＴ−Ｒとも称される。８２６７ＥＬ／８１９６ｚＫＫは、１対のＣＣＲ５特異的亜鉛フィンガーヌクレアーゼを用いた対照である。「−ＮＴ３Ｒ１８Ｃ２８Ｌ８」で表示されるデータが、（ＮＴＦ３遺伝子のコード鎖に対して前方のＤＮＡ鎖を標的とする）ＮＴＦ３特異的パートナーの不在下での結果を示す一方で、「＋ＮＴ３Ｒ１８Ｃ２８Ｌ８」で表示されるデータは、パートナーの存在下での結果を示す。この場合、パートナーは、１７．５個の反復を有し、Ｃ２８位で切断され、かつＬ８リンカーを含有するＮＴＦ３特異的タンパク質である。図に見られるように、ＴＡＬＥＮの正しい対形成は、レポーター遺伝子の効率的な切断、したがって、レポーター遺伝子発現につながる。

実施例８：哺乳類細胞中の内因性遺伝子座を切断するための遺伝子操作されたＴＡＬＥＮの使用
上述の二量体対を、ＮＴＦ３遺伝子座に標的化し（表１８を参照のこと）、その後、哺乳類細胞中の内因性遺伝子座で試験した。示される二量体対を、製造業者によって提供される標準の方法を用いて、ＡｍａｘａＢｉｏｓｙｓｔｅｍｓデバイス（Ｃｏｌｏｇｎｅ，Ｇｅｒｍａｎｙ）を使用してＫ５６２細胞にヌクレオフェクトし、トランスフェクション後に一過性の低温ショック成長条件に供した（米国出願第１２／８００，５９９号を参照のこと）。

細胞を３０℃で３日間インキュベートし、その後、ＤＮＡを単離して、Ｃｅｌ−Ｉ分析に使用した。このアッセイは、野生型配列と比較して、試料におけるミスマッチを検出するように設計される。ミスマッチは、ＴＡＬＥＮによる切断に起因した、ＤＮＡにおける二本鎖切断の結果であり、非相同末端結合（ＮＨＥＪ）のエラーを起こしやすいプロセスによって修復される。ＮＨＥＪは、多くの場合、小さい付加又は欠失を導入し、Ｃｅｌ−Ｉアッセイは、それらの変化を検出するように設計される。アッセイを、以下のプライマー：ＬＺＮＴ３−Ｆ４：５’−ＧＡＡＧＧＧＧＴＴＡＡＧＧＣＧＣＴＧＡＧ−３’（配列番号８０）及びＬＺＮＴ３−１０７７Ｒ：５’−ＡＧＧＧＡＣＧＴＣＧＡＣＡＴＧＡＡＧＡＧ−３’（配列番号８１）で増幅された産物を使用して、例えば、米国特許公開第２００８００１５１６４号、同第２００８０１３１９６２号、及び同第２００８０１５９９９６号に記載されるように行った。これらのプライマーは、内因性配列から２７２ｂｐの増幅産物を増幅し、Ｃｅｌ−Ｉアッセイによる切断は、約２２６ｂｐ及び４６ｂｐの産物を産生する。２２６ｂｐの産物が可視的である一方で、４６ｂｐの産物は、それらの寸法の理由から、ゲル上で見るのは困難である。結果が図１６に示され、観察されたゲノム修飾の割合は、Ｃｅｌ−Ｉ酵素を含むレーンに示される。図から明らかであるように、これらの試料中で生じるヌクレアーゼ誘導変異が存在し、試料が二重に再産生可能である（例えば、レーン７とレーン２２、又はレーン１２とレーン２７を比較）。

研究を、トランスフェクション後に３７℃又は３０℃のいずれかでインキュベートした細胞を使用して、対１５、１３、１２、及び１０（表１８を参照のこと）で繰り返し、結果が図１７に示される。最初に、ＮＴ−ＲＴＡＬＥＤＮＡ結合ドメインを、上述のＳＥＬＥＸアッセイにおいて試験し、結果が図１７Ａに示される。Ｋ５６２細胞中で発現されるとき、これらのタンパク質は、Ｃｅｌ−Ｉアッセイによって明らかにされる強力な遺伝子修飾をもたらし、３７℃及び３０℃で試験した最も活性の高いヘテロ二量体（対１２）の推定レベルは、３％及び９％であった（図１７Ｂを参照のこと）。さらに、サンガー配列決定は、３０℃の試料で分析した８４個のうち７個の変異対立遺伝子を同定し、非相同末端結合（ＮＨＥＪ）を介したエラーを起こしやすい切断修復に一致した変異スペクトル（少量の欠失）も明らかにした（図１７Ｃ）。

これらの研究は、本明細書に記載のＴＡＬＥＮ構造が、内因性遺伝子座で、かつ哺乳類細胞中で、効率的なＮＨＥＪ媒介遺伝子修飾を駆動することができることを示す。

これらの研究は、ヌクレアーゼドメインを、高度に活性なヌクレアーゼ機能を提供するＴＡＬＥ反復配列に結合させるために使用され得る組成物も明らかにする。試料を、ＮＴＦ３遺伝子座で大規模シークエンシング（ｄｅｅｐｓｅｑｕｅｎｃｉｎｇ）にも供した。試料を４ｂｐの配列でバーコード付けし、５０ｂｐの読み取り長を、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒ機器（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，ＣＡ）において使用した。配列を、カスタムｐｙｔｈｏｎスクリプトで処理した。ヌクレアーゼ活性によって誘導される二本鎖切断の結果としての非相同末端結合（ＮＨＥＪ）活性の特徴として、配列を、付加又は欠失（「インデル」）の存在について分析した。結果が図１８に示される。内因性遺伝子座において、これらの２つのタンパク質によって認識される標的配列の間に１２個の塩基対ギャップが存在する（図１８Ａを参照のこと）。図１８Ｂに示されるように、哺乳類細胞中の内因性ＮＴＦ３遺伝子座に対する活性を実証する多数のインデルが存在する。図１８Ｂにおいて、内因性遺伝子座における野生型配列は、「ｗｔ」で示される。

実施例９：ＴＡＬＥＮ切断後の内因性遺伝子座への標的組込み
ＮＴＦ３でのＴＡＬＥ媒介標的組込みは、ＨＤＲＤＮＡ修復経路を介して、又はＮＨＥＪ経路を介して起こり得る。我々は、ＮＨＥＪによる小さい二本鎖オリゴヌクレオチドの捕捉に基づいてＮＴＦ３でのＴＡＬＥ媒介標的組込みをアッセイする実験を設計した。我々は、先に、ＺＦＮ誘導ＤＮＡ二本鎖切断（ＤＳＢ）の部位でのオリゴヌクレオチドの捕捉を示した。この種の標的組込みは、ＺＦＮ対のＦｏｋＩ部分によって作成されるものに相補的な５’オーバーハングの存在によって強化された（が、絶対に必要ではなかった）。ＦｏｋＩは、４ｂｐの５’オーバーハングを自然に作成し、ＺＦＮとの関連で、ＦｏｋＩヌクレアーゼドメインは、４ｂｐ又は５ｂｐのいずれかの５’オーバーハングを作成する。ＮＴＦ３ＴＡＬＥＮによって残されるオーバーハングの位置及び組成が未知であるため、我々は、ＮＴＦ３ＴＡＬＥＮ結合部位（ＮＴ３−１Ｆ〜ＮＴ３−９Ｒ）の間の１２ｂｐのスペーサー領域における全ての可能性のある４ｂｐの５’オーバーハングで９個の二本鎖オリゴヌクレオチドドナーを設計した（表２０を参照のこと）。

これらのドナーは、２つの５’末端ホスホロチオエート結合を含有し、５’リン酸塩を欠如し、プライマー内部Ｆ．相補的オリゴヌクレオチド（ＮＴ３−１ＦとＮＴ３−１Ｒ、例えば）に対する結合部位を、９５℃まで加熱し、かつ０．１℃／分で室温まで冷却することによって、１０ｍＭのＴｒｉｓ（ｐＨ８．０）、１ｍＭのＥＤＴＡ、５０ｍＭのＮａＣｌ中でアニールした。ドナーオリゴヌクレオチド（５μＬの４０μＭのアニールされたオリゴヌクレオチド）を、ＦＦ−１２０をプログラミングするよう設定されたＡｍａｘａＮｕｃｌｅｏｆｅｃｔｏｒ（Ｌｏｎｚａ）を使用して、かつＳＦ溶液を使用して、２０μＬのトランスフェクション混合物中で、８個の異なるＴＡＬＥＮ対（Ａ〜Ｈ、それぞれ４００ｎｇのプラスミド、表２１を参照のこと）のそれぞれで、２００，０００個のＫ５６２細胞に個別にトランスフェクトした。

細胞を、トランスフェクションの３日後に採取し、５０μＬのＱｕｉｃｋＥｘｔｒａｃｔ溶液（Ｅｐｉｃｅｎｔｒｅ）中で溶解させた。１マイクロリットルの粗溶解物を、以下に記載されるＰＣＲ分析に使用した。

我々は、内部Ｆ及びＧＪＣ２７３Ｒプライマーを使用して、オリゴヌクレオチド及び染色体によって作成される接合部のＰＣＲ増幅によるＮＴＦ３ＴＡＬＥＮによって作成されるＤＳＢへのオリゴヌクレオチドドナーの標的組込みをアッセイした。オリゴヌクレオチドドナーの完全な連結に基づくＰＣＲ増幅産物の予想寸法は、染色体における切断の位置によって変化する。図１９に見られるように、ドナーの組込みを、ＴＡＬＥＮ及びドナーオーバーハングの多くの組み合わせで検出した。最大のシグナルは、１２ｂｐのスペーサー領域の中心に近いＣＴＧＧ及びＴＧＧＴオーバーハングで見られた。ＮＨＥＪによって捕捉されるドナーを含有する内因性染色体遺伝子座を配列決定し、図２０に示す。ＮＴＦ３標的遺伝子座（上の二本鎖）及びこの研究のために使用されたオリゴヌクレオチド二本鎖のうちの１つ（下の二本鎖）が示され、ＮＴ−Ｌ＋２８及びＮＴ−Ｒ＋６３に対する結合部位は、上の配列中の下線の箇所である。二本鎖（５’ＣＴＧＧ）を最も効率的に捕捉する切断オーバーハングも強調表示されている。また、図２０Ｂに示されるのは、この研究のために使用された第２のオリゴヌクレオチド二本鎖である。ＮＴ−Ｌ＋２８及びＮＴ−Ｒ＋６３に対する結合部位は、上の配列中の下線の箇所である。この第２の二本鎖（５’ＴＧＧＴ）を最も効率的に捕捉する切断オーバーハングも示される。次に、ＴＡＬＥＮＮＴ−Ｌ＋２８及びＮＴ−Ｒ＋６３を、図２０Ａに示されるオリゴヌクレオチド二本鎖の存在下でＫ５６２細胞中に発現させた。次に、うまく組み込まれた二本鎖とゲノムＤＮＡとの間の接合部を、二本鎖内でアニールする１つのプライマー及び天然のＮＴＦ３遺伝子座にアニールする１つのプライマーを使用して増幅した。結果として生じる増幅産物を、クローニング及び配列決定した。図２０Ｃの「予想される」配列は、切断された遺伝子座へのオリゴヌクレオチド二本鎖の完全な連結に起因するであろう配列を示す。囲みは、接合配列中の二本鎖オーバーハングの位置を強調表示する。下の２つのラインは、この研究から得られた接合配列を提供する。示されるように、１１個の接合配列が、切断オーバーハングへの二本鎖の完全な連結に起因した一方で、１つの接合配列は、ＮＨＥＪによる修復前の切除に一致した短い欠失（１２ｂｐ）を呈した。図２０Ｄは、図２０Ａに示される二本鎖と比較して、１つの塩基によって変化する４ｂｐのオーバーハングを有する、図２０Ｂに示されるオリゴヌクレオチド二本鎖を使用したことを除いて、図２０Ｃに示される実験の結果を示す。下の４つのラインは、この研究から得られた接合配列を提供する。示されるように、それぞれがＮＨＥＪ媒介修復前の切除に一致した短い欠失を呈する、４つのはっきりと異なる配列が同定された。

実施例１０：新規のＴＡＬＥタンパク質をコードする遺伝子の効率的な組み立て
天然タンパク質において見出されるＴＡＬＥ反復をコードするＤＮＡ配列は、それらの対応するアミノ酸配列と同程度に繰り返される。天然ＴＡＬＥは、典型的には、それぞれの反復の配列間に数個のみの塩基対分の相違を有する。反復ＤＮＡ配列は、所望の全長ＤＮＡ増幅産物を効率的に増幅することを困難にし得る。これは、天然ＴＡＬＥを含有するタンパク質のためにＤＮＡを増幅することを試みるときに示されている。Ｍｆｏｌｄ（Ｍ．Ｚｕｋｅｒ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３１（１３）：３４０６−１５，（２００３））を使用した上のＴＡＬＥ反復タンパク質のＤＮＡ配列のさらなる分析は、それらが、効率的な増幅を破壊する反復配列を有するのみならず、非常に安定した二次構造も含有することを明らかにした。この分析において、第１の全反復配列をコードする核酸の５’末端で開始する配列の８００個の塩基対を分析した。したがって、分析した核酸配列は、約７．５反復の配列を含有した。これらの二次構造のうちのいくつかが、図２１に示される。

これらの構造は、ＴＡＬＥ反復のうちのいずれかの間、又は隣接していない反復間で生じる。ＴＡＬＥ反復を含有するＤＮＡ配列の効率的な増幅を提供するために、この二次構造を破壊し、かつ全長増幅産物に向けて反応にバイアスをかけるためのサイレント変異の導入を、二次構造を安定化させる働きをするＴＡＬＥ反復の領域において行った。その後、プライマーを、目的とするＴＡＬＥ配列の効率的な増幅を可能にするように作製する。次に、ＰＣＲ増幅産物を、検証のために配列決定し、融合タンパク質において使用するためにクローニングした。加えて、サイレント変異を、哺乳類細胞におけるコドン最適化のためにＴＡＬＥヌクレオチド配列中に作製した。類似のコドン最適化を、他の宿主細胞系（例えば、植物、真菌等）における最適発現のために使用することができる。

実施例１１：ＴＡＬＥ融合タンパク質をコードする遺伝子の迅速な構築方法
様々なＴＡＬＥ融合タンパク質の迅速な組み立てを可能にするために、ともに結合することができる反復モジュールのアーカイブを作成して、ほぼ任意の選択される標的ＤＮＡ配列に特異的なＴＡＬＥＤＮＡ結合ドメインを作成する方法を開発した。所望の標的ＤＮＡ配列に基づいて、１つ以上のモジュールを選択し、ＰＣＲに基づくアプローチを介して取り出す。モジュールを、タンデムに結合し、最適な融合パートナードメインを含有するベクター骨格の中に連結する。

４つのＴＡＬＥ反復単位を含有するモジュールを、２５６個の可能性のあるＤＮＡテトラヌクレオチド配列（例えば、１つのモジュールがＡＡＡＡ標的のため、１つのモジュールがＡＡＡＴ標的のため等）のそれぞれに対して特異性を有するように構築した。加えて、モジュールを、全ての６４個の可能性のあるＤＮＡトリヌクレオチド標的、全ての可能性のある６４個のジヌクレオチドＤＮＡ標的、並びに４個の単一ヌクレオチド標的のためにも作成した。ジペプチド認識領域（ＲＶＤ反復可変ジペプチドとも称される）について、以下のコードを使用した：アデニンの認識について、ＲＶＤは、ＮＩ（アスパラギン−イソロイシン）であり、シトシンについて、ＲＶＤは、ＨＤ（ヒスチジン−アスパラギン酸塩）であり、チミンについて、ＲＶＤは、ＮＧ（アスパラギン−グリシン）であり、Ｒ（グアニン又はアデニンへの同程度の特異性）について、ＲＶＤは、ＮＮ（アスパラギン−アスパラギン）であった。加えて、いくつかのタンパク質においてＮＮよりもＧに対して高い特異性をもたらすように見えたため、いくつかの遺伝子操作されたＴＡＬＥにおいて、ＲＶＤＮＫ（アスパラギン−リジン）を、Ｇの認識について選択した。さらに、ＲＶＤのＮ末端の最後から２番目の位置（反復単位の１１位）は、Ｎ又はアスパラギンであった（典型的には、この位置は、Ｓ又はセリンである）。このモジュールアーカイブを、任意の他のＲＶＤを使用して拡大することができる。

完全な配列反復を有するＤＮＡのＰＣＲ特異性、クローニング、及び操作は、厄介である。したがって、アーカイブを構築するために、多くの天然ＴＡＬＥ反復配列を分析して、ＤＮＡレベルで反復配列を多様化する目的で、アミノ酸配列のどの部分の可変性が許容され得るかを確認した。結果が図２２に示されており、文字の寸法は、所与の位置で観察された多様性に反比例し、大きい文字が、多様性への耐性が低いことを示す一方で、小さい文字は、他のアミノ酸が時々観察される位置を示す。例えば、１位で、反復単位の第１のアミノ酸であるＬ、すなわちロイシンは、本質的かつ不変的に観察される。しかしながら、４位で、３つの異なるアミノ酸：Ｅ、すなわちグルタミン酸、Ａ、すなわちアラニン、又はＤ、すなわちアスパラギン酸が時々見出される。加えて、反復単位をコードするＤＮＡ鎖が別の反復単位とは異なる配列を有することを可能にするように、特定のアミノ酸をコードするコドンを交換することができるが、アミノ酸配列は同一のままであるように、遺伝子コードにおける重複性を活用して種々の反復モジュールをコードするヌクレオチド配列も変更した。これらの技法の全てを、ＤＮＡ結合ドメインの内部が任意の所望の標的を認識し得る、遺伝子操作されたＴＡＬＥＤＮＡ結合ドメインを構築するために使用することができるモジュールのプールに対して利用した。

設計者がモジュールの位置を特定することを可能にするために、そのＤＮＡ標的部位の３’末端で切断するＩＩＳ型制限酵素、ＢｓａＩを使用した。ＢｓａＩは、以下に示される配列を認識する。酵素切断後に残される切断されたＤＮＡの「付着末端」（配列番号１０２〜１０５）も説明される。

当業者によって理解されるように、付着末端の配列は、制限認識部位の３’側のＤＮＡの配列に依存する。したがって、相互へのそれらの付着末端の連結は、正しい配列が存在する場合にのみ生じる。これを活用して、ＰＣＲ増幅産物がＢｓａＩで切断された時点で付着末端を認識するであろう所望のモジュールを増幅するＰＣＲプライマーを開発した。次に、ＰＣＲ産物をＢｓａＩ切断後に合わせて、ユーザによって特定される順序でのみ産物をともに連結することを可能にした。１〜１６個の全ＴＡＬＥ反復からなる最大４つのモジュールを連結する組み立てスキームが、図２３に示される。使用したプライマーは、以下の通りであり、番号付けは、図に示される番号付けに対応する。列記されるプライマーを使用して、最大４つのモジュールを連結するよう意図されているが、同一の概念を用いることによって、より多くのプライマーを添加して、４つを超えるモジュールを連結することができる。
プライマー：
Ｔ１Ｆ−ＢｓａＧＧＡＴＣＣＧＧＡＴＧＧＴＣＴＣＡＡＣＣＴＧＡＣＣＣＣＡＧＡＣＣＡＧ（配列番号１０６）
Ｔ１Ｒ−ＢｓａＧＡＧＧＧＡＴＧＣＧＧＧＴＣＴＣＴＧＡＧＴＣＣＡＴＧＡＴＣＣＴＧＧＣＡＣＡＧＴ（配列番号１０７）
Ｔ２Ｆ−ＢｓａＧＧＡＴＣＣＧＧＡＴＧＧＧＴＣＴＣＡＡＣＴＣＡＣＣＣＣＡＧＡＣＣＡＧＧＴＡ（配列番号１０８）
Ｔ２Ｒ−ＢｓａＧＡＧＧＧＡＴＧＣＧＧＧＴＣＴＣＴＣＡＧＣＣＣＡＴＧＡＴＣＣＴＧＧＣＡＣＡＧＴ（配列番号１０９）
Ｔ３Ｆ−ＢｓａＧＧＡＴＣＣＧＧＡＴＧＧＧＴＣＴＣＡＧＣＴＧＡＣＣＣＣＡＧＡＣＣＡＧ（配列番号１１０）
Ｔ３Ｒ−ＢｓａＧＡＧＧＧＡＴＧＣＧＧＧＴＣＴＣＴＣＡＡＡＣＣＡＴＧＡＴＣＣＴＧＧＣＡＣＡＧＴ（配列番号１１１）
Ｔ４Ｆ−ＢｓａＧＧＡＴＣＣＧＧＡＴＧＧＧＴＣＴＣＡＴＴＴＧＡＣＣＣＣＡＧＡＣＣＡＧＧＴＡ（配列番号１１２）
Ｔ４Ｒ−ＢｓａＣＴＣＧＡＧＧＧＡＴＧＧＴＣＴＣＣＴＧＴＣＡＧＧＣＣＡＴＧＡＴＣＣ（配列番号１１３）

この方法を使用するとき、ＢｓａＩで切断されたＰＣＲ増幅産物の連結は、「Ａ」モジュールの３’末端が「Ｂ」モジュールの５’末端に連結し、かつ「Ｂ」モジュールの３’末端が「Ｃ」モジュールの５’末端にのみ連結することができる場合等にのみ生じ得る。加えて、連結されたモジュールがクローニングされるベクター骨格は、「Ａ」モジュールの５’末端のみ、かつ「Ｄ」モジュールの３’末端のみが連結して、ベクターの環を完了するように、特定のＢｓａＩで切断された付着末端も含有する。したがって、遺伝子操作されたＴＡＬＥＤＮＡ結合ドメイン内のそれぞれのモジュールの位置は、ユーザによって選択されるＰＣＲプライマーによって決定される。

現時点で、ＴＡＬＥＤＮＡ結合ドメインのＤＮＡ標的部位は、典型的には、標的の５’末端（Ｒ０反復によって認識される）及び標的の３’末端（Ｒ１／２反復によって認識される）のＴヌクレオチドによって隣接される。したがって、ベクター骨格は、特定のモジュールを含有する連結されたＰＣＲ増幅産物が、ベクター内のＲ０配列とＲ１／２配列との間のフレームにクローニングされるように設計されている。加えて、ベクターは、融合パートナーのために、ＴＡＬＥタンパク質及び最適な外因性ドメインのユーザ指定のＣ末端ドメイン型（切断されているか、又は切断されていない）を含有する。図２３に示される設計において、外因性ドメインは、ＴＡＬＥヌクレアーゼの産生を可能にするＦｏｋＩドメインである。ベクターは、ＣＭＶプロモーター、核局在化シグナル、発現を監視するための標識、及びポリＡ部位等の融合タンパク質の発現に必要な配列をさらに含有する。ここで、このベクターを、ユーザの選択した細胞にトランスフェクトすることができる。加えて、異なる細胞系に所望され、かつ／又は必要とされる選択マーカー、ドメイン、又は他の遺伝子を含有するように、ベクターをさらに修飾することができる。

実施例１２：特定の内因性ＴＡＬＥＮの設計及び特性化
ＴＡＬＥＮ設計方法を評価するために、我々は、ヒトＣＣＲ５遺伝子内のデルタ３２変異（以下に太字下線で示される）の位置付近でのＴＡＬＥＮ媒介遺伝子修飾の実証に努めた（ＳｔｅｐｈｅｎｓＪＣｅｔａｌ，（１９９８）ＡｍＪＨｕｍＧｅｎ６２（６）：１５０７−１５を参照のこと）。この研究のために、我々は、１６個の二量体標的（配列番号１１４〜１２２）のパネルを定義した、デルタ３２の位置で４つの「左」及び４つの「右」結合部位（以下を参照のこと）のクラスターを指定した。

このパネル内で、個々の標的を、５〜２７ｂｐの範囲のギャップ寸法で分離した。記載される全てのタンパク質において（特に注記されない限り）、「Ｔ」を特定するＲＶＤがＮＧであり、「Ａ」を特定するＲＶＤがＮＩであり、「Ｃ」を特定するＲＶＤがＨＤであり、かつ「Ｇ」を特定するＲＶＤがＮＮであるように、ＴＡＬＥＮタンパク質を、実施例１１に記載の方法を使用して組み立てた。次に、２つの代替のタンパク質を、それぞれの標的のために生成し、４８個又は８３個のいずれかの残基のＣ末端セグメントを有した。最後に、「左」及び「右」のタンパク質の全ての一対組み合わせ（８×８＝合計６４）を、Ｋ５６２細胞中で発現させ、内因性遺伝子座の修飾についてアッセイした。以下の表２２を参照されたい（３日目及び１０日目）。

標的部位が様々なギャップ寸法を含有したため、最も高い活性を示すヌクレアーゼに関するデータを、２つの標的部位の間の距離について分析することもできる。標的部位のギャップ寸法を示すことを除いて上の表２２のパネルに類似したパネルが、以下の表２３に示される。

したがって、表２２及び表２３のデータを比較して、これらの対が最も高い活性を示すギャップ寸法の範囲が、１２〜２１ｂｐを含むが、１１ｂｐ未満又は２３ｂｐを超えるギャップを除外するかを決定することができる。

我々のＴＡＬＥＮ構造が、他の主要な細胞ＤＮＡ修復経路：相同指向性修復（ＨＤＲ）を介して遺伝子編集を誘導できることを実証するために、従前の研究において導入遺伝子組込みのための可能性のあるセーフハーバーとして有望であることが示された（Ｌｏｍｂａｒｄｏｅｔａｌ（２００７）ＮａｔＢｉｏｔｅｃｈｎｏｌ２５：１２９８−１３０６を参照のこと）ＣＣＲ５内の第２の遺伝子座（遺伝子座１６２と命名した）を標的とした。４つの「左」及び４つの「右」の結合部位を指定し（以下の配列番号１２３〜１３１を参照のこと）、２つの代替のＴＡＬＥＮをそれぞれのために構築し（＋２８及び＋６３変異体）、Ｃｅｌ−Ｉアッセイ（配列番号３７０〜３７９）を使用して、＋２８／＋２８及び＋６３／＋６３対形成をＮＨＥＪ媒介遺伝子修飾についてスクリーニングした。

以下の表２４に示されるように、試験した２４個の対のうち１６個の対が、最大２１％のレベルの検出可能な修飾をもたらした。

次に、ＢｇｌＩＩ制限部位を有する４６ｂｐの挿入を標的化された遺伝子座に導入するように設計されたドナーＤＮＡフラグメントを用いて、２つの活性の最も高い対（Ｌ１７２＋２８／Ｒ１８５＋２８及びＬ１６１＋６３／Ｒ１７７＋６３）をＫ５６２細胞に導入した。使用したドナー配列は、実施例２３に示される。

挿入後、組み込まれた標識ドナー配列は、５’−５’ＴＣＡＴＣＴＴＴＧＧＴＴＴＴＧＴＧＧＧＣＡＡＣＡＴＧＣＴＧＧＴＣＡＴＣＣＴＣＡＴＣＴＡＧＡＴＣＡＧＴＧＡＧＴＡＴＧＣＣＣＴＧＡＴＧＧＣＧＴＣＴＧＧＡＣＴＧＧＡＴＧＣＣＴＣＧＴＣＴＡＧＡＡＡＡＣＴＧＣＡＡＡＡＧＧＣＴＧＡＡＧＡＧＣＡＴＧＡＣＴＧＡＣＡＴＣＴＡＣＣＴＧＣＴＣＡＡＣ−３’（配列番号１７７）であり、特有のＢｇｌＩ制限部位に下線を引いた。

ドナー挿入がＨＤＲを介して生じる場合、挿入部位を含有する領域をＰＣＲ増幅し、その後、ＢｇｌＩ消化に供することができ、以下に示されるように、上の鎖が、標的部位の配列（配列番号１３３）を示し、下の鎖（配列番号１３４）が、標識ドナーを挿入させる標的の配列を示す。上の鎖の下線を引いた配列がＴＡＬＥＮ結合部位を示す一方で、下の鎖の下線を引いた配列は、ＢｇｌＩ制限部位（配列番号４４５〜４５０）を示す。

図２４に示されるように、挿入を含有するクローンのＰＣＲ産物は、ＢｇｌＩ消化後に２つのフラグメントを有した。ＰＣＲ及びＢｇｌＩ消化スキームが図２４Ａに示される一方で、結果が図２４Ｂに示され、極めて効率的な編集を明らかにした。したがって、我々のＴＡＬＥＮ構造は、内因性遺伝子座でＨＤＲを介して効率的な遺伝子修飾を誘導した。

実施例１３：選択されたＴＡＬＥＮ構造のギャップ間隔選好の試験
２つの好ましいＴＡＬＥＮ構造（Ｃ＋２８Ｃキャップ又はＣ＋６３Ｃキャップ対）のギャップ間隔選好を試験するために、ギャップ間隔に従って、Ｃ＋２８／Ｃ＋２８又はＣ＋６３／Ｃ＋６３の対形成を含有する全てのＴＡＬＥＮ対を活性について分類した。結果が図２５に示され、小さい方のＴＡＬＥＮタンパク質、Ｃ＋２８／Ｃ＋２８対が、より制約されたギャップ間隔選好を有し、標的配列が１２個又は１３個の塩基対のギャップで分離される標的において最も高い活性を示すことを実証する。逆に、図２５Ｂに示される大きい方のＴＡＬＥＮタンパク質、Ｃ＋６３／Ｃ＋６３対は、１２〜２３個の塩基対のギャップ間隔を含有する標的において活性を示す。

実施例１４：ヌクレアーゼドメインを高度に活性なヌクレアーゼ機能を提供するＴＡＬＥ反復配列に結合させるために使用することができる組成物の体系的マッピング
ヌクレアーゼドメインを高度に活性なヌクレアーゼ機能を提供するＴＡＬＥ反復配列に結合させるために使用することができる組成物の体系的マッピング。最初に、１つのＴＡＬＥＮ対を、２つの結合ドメイン間の定義されたギャップ間隔を有する単一の標的に対して選択した。選択したＴＡＬＥＮ対は、ＣＣＲ５遺伝子に特異的であり、かつ１８個の塩基対ギャップ間隔を有する、Ｌ５３８／Ｒ５５７対として実施例１２に記載されるものであった。一連の切断がＣ−２〜Ｃ＋２７８のＣキャップをもたらすように、欠失を上述のように行った。

次に、Ｃｅｌ−Ｉミスマッチアッセイを用いてＫ５６２細胞におけるヌクレアーゼ活性を分析するために、これらの切断を使用した。結果（％ＮＨＥＪ）は、以下の表２５及び図２６に示される。

データは、Ｃキャップが約Ｃ＋６３であるとき、言い換えると、ペプチドＬＴＰＥＱＶＶＡＩＡＳＮＧＧＧＲＰＡＬＥＳＩＶＡＱＬＳＲＰＤＰＡＬＡＡＬＴＮＤＨＬＶＡＬＡＣＬＧＧＲＰＡＬＤＡＶＫＫＧＬＰＨＡＰＡＬＩＫＲＴＮＲＲＩＰＥＲＴＳＨＲＶＡ（配列番号４５１）を使用して、結合全長ＴＡＬＥ反復の配列をＦｏｋＩ切断ドメインに結合させるときに、この内因性標的に対するこのヌクレアーゼ対のピーク活性が生じることを実証する。この実験において、ヌクレアーゼを前述のようにＫ６５２細胞中で試験し、細胞を３０℃又は３７℃のいずれかでインキュベートした。Ｃ＋６３Ｃキャップの活性比のおおよその推定は、Ｃ＋２７８と比較して、３７℃でのインキュベーションでは２０倍を超え、３０℃のインキュベーションでは６倍を超えた。

ヌクレアーゼドメインを内因性遺伝子座での高度に活性なヌクレアーゼ機能を可能にする全長ＴＡＬＥ反復の配列に結合させるために使用することができる組成物をより細かく特性化するために、さらなる切断を構築した。３０個のＣキャップ：Ｃ−４１、Ｃ−３５、Ｃ−２８、Ｃ−２１、Ｃ−１６、Ｃ−８、Ｃ−２、Ｃ−１、Ｃ＋５、Ｃ＋１１、Ｃ＋１７、Ｃ＋２２、Ｃ＋２８、Ｃ＋３４、Ｃ＋３９、Ｃ＋４７、Ｃ＋５５、Ｃ＋６３、Ｃ＋７２、Ｃ＋７９、Ｃ＋８７、Ｃ＋９５、Ｃ＋１０９、Ｃ＋１２３、Ｃ＋１３８、Ｃ＋１５３、Ｃ＋１８３、Ｃ＋２１３、Ｃ＋２３１、及びＣ＋２７８を含む、一連の微細な切断を組み立てた。我々のＣキャップ表記法が残基−２０で開始することに留意する。したがって、Ｃ−４１、Ｃ−３５、Ｃ−２８、及びＣ−２１は、Ｃキャップを完全に欠如し、かつ２０、１４、７、又は０個の残基を最後の３４個の残基の全ＴＡＬＥ反復のＣ末端から除去した構築物を示す。構築物の対を、標的部位の間に以下のギャップ間隔：０、２、４、７、１０、１４、１８、２３、２８、及び３４個の塩基対を用いて、適切な標的部位に対して試験した。対を、ＳＳＡアッセイにおいてレポーター遺伝子に対して、並びに哺乳類細胞において内因性遺伝子座に対して試験した。Ｃキャップが以下に説明されており、説明図は、ＴＡＬＥＤＮＡ結合ドメインの最後の全反復で開始し、かつＣ末端に向かう点を示す。

実験のための標的部位が以下に示され、７ｂｐのギャップ間隔を有する対を説明する。−Ｃ−１６、Ｃ−２１、Ｃ−２８、Ｃ−３５、及びＣ−４１Ｃキャップ構築物が、対中のそれぞれのＴＡＬＥＮの半反復においてＲＶＤを除去し、かつそのような構築物が、同一の標的ＤＮＡ配列に対して９ｂｐのギャップ間隔を効果的に有することに留意する。試験した全ての他のギャップ間隔の標的部位を、試験されるギャップ間隔に応じて、標的間の塩基対を除去するか、又はさらなる塩基対を挿入するかのいずれかによって構築した。

ＴＡＬＥＮタンパク質をコードする遺伝子を、実施例１１及び１２に記載されるように組み立て、Ｃｅｌ−Ｉアッセイによって評価した。データは、以下の表２６Ａに示される。示されるように、本明細書に記載のＴＡＬＥタンパク質は、全長ＴＡＬＥタンパク質と比較して、内因性遺伝子座に対する機能性の完全な喪失なく、それ自体が半反復及びＴＡＬＥ反復ドメインに及ぶ切断を含む、Ｃ末端切断に耐えることができる。

加えて、Ｃ末端切断を、以下の実施例１９に記載されるように、ＤＬＳＳＡアッセイにおいて、レポーター遺伝子に対して試験した。これらの実験において、ＣＣＲ５特異的ＴＡＬＥＮの４つの対を、これらの対の標的部位がＤＬＳＳＡレポータープラスミドに組み込まれたレポーター系において使用した。４つのＴＡＬＥＮの結合部位が上に示されており、ＴＡＬＥＮを、４つの対、Ｌ５４３＋Ｒ５５１（対１）、Ｌ５３８＋Ｒ５５１（対２）、Ｌ５４３＋Ｒ５５７（対３）Ｌ５３８＋Ｒ５５７（対４）として使用した。ギャップ間隔は、対の結合部位間のヌクレオチドの挿入又は欠失によって変化した。データは、以下の表２６Ｂ〜Ｅに示され、数値は、ＤＬＳＳＡアッセイによって検出された相対的な蛍光強度、ひいては切断の程度を示す。全ての試料を、その結合部位がＤＬＳＳＡ挿入においても存在する対照ＴＡＬＥＮ対に対して標準化した（正の対照）。負の対照は、ＴＡＬＥＮの不在下で行われたアッセイである。レポーター番号４は、正確なＤＮＡ結合配列及び内因性配列と同一のギャップ配列を有し、したがって、内因性遺伝子座におけるＣｅｌ−Ｉデータと比較することができる。レポーター番号４からの４つのＴＡＬＥＮ対のＤＬＳＳＡデータは、表２６Ａに示される。これらのデータは、レポーター系を用いて見出された結果の間の一般的な相関関係を説明しており、内因性標的において観察された結果は近似しており、したがって、レポーター系は、任意の内因性アッセイにおいて試験する候補ヌクレアーゼのためのスクリーニング手段として有用である。これは、系において貴重なモデル細胞を用いて作業する場合、あるいは標的細胞型が利用不可能であるか、又はスクリーニング目的での使用が困難であるかのいずれかの場合に有用な手段である。これはまた、標的配列が内因性ゲノム内で利用不可能である場合に、ＴＡＬＥＮ技術基盤を開発かつ最適化するのに有用な手段である。活性ヌクレアーゼをＤＬＳＳＡによって同定し、その後、最終評価のために内因性系に入れることができる。

したがって、Ｃｅｌ−Ｉ及びＤＬＳＳＡ結果は、適切なＣキャップが使用され、かつＮキャップが存在するときに、これらのタンパク質が、実質的かつ強力な活性を有することを示す。さらに、ギャップ間隔は、より大きいギャップ間隔と比較して、Ｃ末端切断のより小さいサブセットを伴って活性を示すより小さいギャップ間隔で観察される最大活性に影響を与え得る。我々は、相対的なＤＬＳＳＡ活性が、同一の温度（３７℃）で得られた同一のＴＡＬＥＮに対して、内因性活性と直線的に関連するようには見えないことにも留意する。レポーターの結果は、Ｃ＋１５３、Ｃ＋１８３、Ｃ＋２１３、Ｃ＋２３１、及びＣ＋２７８Ｃキャップを有する構築物に対して、ヒト細胞の天然の内因性遺伝子座において観察された活性よりも著しく高度の相対的な活性をもたらす。したがって、レポーター系、さらには哺乳類細胞中のレポーター系における活性は、哺乳類細胞中の天然の内因性遺伝子座における活性を必ずしも予測しない。

実施例１５：新規の（非定型）ＲＶＤ
代替の（非定型）ＲＶＤを調査して、ＤＮＡ結合特異性を決定する位置の他のアミノ酸を変更することができるかを決定した。その結合活性は、ＳＥＬＥＸ及びＥＬＩＳＡによって中央位置でのミスマッチに敏感であると示されたＴＡＬＥ結合ドメインを構築した。このタンパク質は、配列５’−ＴＴＧＡＣＡＡＴＣＣＴ−３’（配列番号１７８）に結合し、配列５’−ＴＴＧＡＣＣＡＴＣＣＴ−３’（配列番号１７９）、５’−ＴＴＧＡＣＧＡＴＣＣＴ−３’（配列番号１８０）、又は５’−ＴＴＧＡＣＴＡＴＣＣＴ−３’（配列番号１８１）に対してわずかな結合活性示した（図２７に示されるＥＬＩＳＡデータ）。これらの標的は、中間の三重核酸を意味するＣＸＡ標的と称され、Ｘは、Ａ、Ｃ、Ｔ、又はＧのいずれかである。

その後、このＴＡＬＥ骨格を使用して、６位の塩基を標的とするＴＡＬＥ反復に対する代替のＲＶＤ（アミノ酸１２及び１３）のＤＮＡ結合特異性を特性化した。このＲＶＤをコードする２つのコドンをランダム化し、クローンを配列決定することによってスクリーニングして、完全な反復単位が存在することを確実にした。次に、正しいクローンを、標的配列４つのバージョンに対するＤＮＡ結合ＥＬＩＳＡで分析し、それぞれの配列は、新規の（すなわち、非定型）ＲＶＤが相互作用するであろう位置（すなわち、ＴＴＧＡＣＡＡＴＣＣＴ（配列番号１７８）、ＴＴＧＡＣＣＡＴＣＣＴ（配列番号１８２）、ＴＴＧＡＣＴＡＴＣＣＴ（配列番号１８３）又はＴＴＧＡＣＧＡＴＣＣＴ（配列番号１８４））において、Ａ、Ｃ、Ｔ、又はＧのいずれかを有した。これらの研究の結果は、以下の表２７Ａに示されており、このアッセイが、ＲＶＤＶＧがＴと特異的に相互作用することができ、ＲＧがＴと相互作用することができ、ＴＡがＴと相互作用することができＡＡがＡ、Ｃ、及びＴと相互作用することができることを同定したことを実証する。

これらの最初の研究後に、全ての可能性のあるＲＶＤ組み合わせで分析を行い、高い活性及び特異性を有するいくつかのＲＶＤ組み合わせを同定した。加えて、試験した全ての塩基に同等にうまく結合するＲＶＤを同定した。データが、数値形式で以下の表２７Ｂに示され、図２８にも示される。以下に示されるデータにおいて、全てのデータを、バックグラウンドＥＬＩＳＡシグナルを差し引くことによってバックグラウンド修正し、その後、ＣＡＡ部位を有するＮＩ、ＣＣＡ部位を有するＨＤ、ＣＧＡ部位を有するＮＮ、及びＣＴＡ部位を有するＮＧの平均値に標準化した。

このデータは、データが２０×２０のグリッドで示される図２８にも示されている。ＲＶＤの第１のアミノ酸（１２位）は、グリッドの左に示され、ＲＶＤの第２のアミノ酸（１３位）は、グリッドの上に示される。それぞれのグリッド中の文字Ａ、Ｃ、Ｇ、及びＴの寸法は、それぞれ、ＣＡＡ部位、ＣＣＡ部位、ＣＧＡ部位、及びＣＴＡ部位に対して標準化されたＥＬＩＳＡシグナルの平方根に基づいて寸法決定されている。囲まれたＲＶＤは、キサントモナスによってコードされるＴＡＬＥタンパク質において見出される頻繁に生じる天然ＲＶＤを示す。多くのＲＶＤは、自然発生ＨＤ、ＮＩ、ＮＧ、ＮＳ、ＮＮ、ＩＧ、ＨＧ、及びＮＫＲＶＤに対して、ＤＮＡ結合特性を改善した。例示的な新規のＲＶＤ及びそれらの同族ヌクレオチド塩基は、Ｎが全ての塩基との正の相互作用を表す部分を含む。
Ａ：ＲＩ、ＫＩ、ＨＩ
Ｃ：ＮＤ、ＫＤ、ＡＤ
Ｇ：ＤＨ、ＳＮ、ＡＫ、ＡＮ、ＤＫ、ＨＮ
Ｔ：ＶＧ、ＩＡ、ＩＰ、ＴＰ、ＱＡ、ＹＧ、ＬＡ、ＳＧ、ＨＡ、ＮＡ、ＧＧ、ＫＧ、ＱＧ
Ｎ：ＫＳ、ＡＴ、ＫＴ、ＲＡ

既知のＲＶＤの分析を介してＲＶＤ配列を候補となる新規の結合剤であると仮定される特定の配列に意図的に変更する研究にも着手した。したがって、以下のＲＶＤを試験した。

オリゴヌクレオチドを、上述のＴＡＬＥ構築物の特定の変更を可能にするように作製した。その後、これらの特定のオリゴヌクレオチドを発現ベクターにクローニングし、実施例１１に記載されるように組み立て、結果として得られるタンパク質抽出物を、ＤＮＡ結合ＥＬＩＳＡ及びＳＥＬＥＸで分析して、ＲＶＤの結合特性を決定する。

非定型のＲＶＤを含むこれらのＴＡＬＥＤＮＡ結合ドメインのうちの１２個を、上述のＳＥＬＥＸ分析に供した。ＳＥＬＥＸ分析の結果が、以下の表２８に示される。表において、天然ＲＶＤについてのデータ（縦列の「ＲＶＤ」中の太字）は、例示的な新規のＲＶＤとともに示されており、多くの場合において、新規のＲＶＤが、天然ＲＶＤと比較して、同等又はより高い標的化された塩基に対する選好を実証することを示す。

次に、これらのＲＶＤを、全長ＴＡＬＥＮに関連した活性について試験した。実施例１２に記載のＣＣＲ５特異的ＴＡＬＥＮとの比較のために、ＣＣＲ５特異的１８反復ＴＡＬＥＮを、全ての新規のＲＶＤを用いて産生した。このＴＡＬＥＮ対の標的部位が、以下に再び示される。１０１０４１ＴＡＬＥＮ単量体が修飾されたパートナーであった一方で、１０１０４７パートナーには全ての天然ＲＶＤが残された。

加えて、典型的なＲＶＤ及び新規の（非定型）ＲＶＤの両方を含むＣＣＲ５特異的ＴＡＬＥＮも、新規のＲＶＤが全て１つの種類に置換された、例えば、全てのＲＶＤが「Ｔ」又は「Ａ」を認識するＣＣＲ５特異的ＴＡＬＥＮにおいて構築した。典型的なＲＶＤについて先の実施例１１及び１２に記載されるコード、すなわち、Ａ＝ＮＩ、Ｃ＝ＨＤ、Ｇ＝ＮＮ、Ｔ＝ＮＧを使用した。新規のＲＶＤについて、この初期分析において、以下を試験した：Ａ＝ＨＩ、ＮＩ、又はＫＩ、Ｃ＝ＮＤ、ＫＤ、ｃＮＤ、Ｇ＝ＳＮ、ＡＫ、ＤＨ、ｃＨＮ、ＫＮ、Ｔ＝ＴＰ、ＩＡ、ＶＧ、ＳＧｇｓ、又はＩＰ。小文字が使用されるとき、これらは、ＲＶＤ位置に隣接した位置の変更を示し、例えば「ｃＮＤ」は、反復単位中の１１位、１２位、及び１３位が変更されたことを示す。これらの研究のために、候補ＲＶＤを、表２７Ｂに示されるデータによって選択し、主要タンパク質の証拠を作成するために使用した。さらなるＴＡＬＥタンパク質を、全一式からの代替の非定型のＲＶＤを用いて構築することができる。加えて、非定型のＲＶＤを、塩基を特定するＲＶＤの混合物を作成することができるように選択することができる（例えば、１つのＴＡＬＥＮタンパク質を、ＴＰ及びＩＡＲＶＤの両方を用いて構築して、異なる位置で「Ｔ」を特定することができる）。

反復単位のＲＶＤ配列が以下の表２９Ａ〜２９Ｃに示されており、全ての変異した位置が太字フォントで示される。

その後、これらの新規のＴＡＬＥＮを、３０℃及び３７℃での内因性ＣＣＲ５遺伝子座に対する切断活性について試験し、前述のＣｅｌ−Ｉアッセイで分析し、ＮＨＥＪの誘導に活性であることを示した（例えば、図３０を参照のこと）。表示されていないレーンは、フレームシフト変異を伴う非機能ＴＡＬＥＮ構築物を表すことに留意する。

結果は、新規の（非定型）ＲＶＤが、それぞれのＴＡＬＥ反復単位が新規のＲＶＤを含むＴＡＬＥＮタンパク質、並びにタイプ置換されたか、又は単独に置換されたＴＡＬＥＮにおいて使用されるときに、ＤＮＡを切断することができることを示す。

実施例１６：新規のＴＡＬＥＣ末端半反復
天然ＴＡＬＥの大部分は、Ｔヌクレオチド塩基との相互作用を特定するために、Ｃ末端半反復中のＮＧＲＶＤを使用する。したがって、新規のＣ末端半反復の生成を調査して、ＴＡＬＥ標的の拡大を可能にした。Ｐｏｕ５Ｆ１及びＰＩＴＸ３遺伝子を標的とするＴＡＬＥＮを、バックボーンとして使用し、Ｃ末端半反復内のＲＶＤ（Ｃキャップアミノ酸Ｃ−９及びＣ−８）を変更して、代替の核酸を特定した。これらの変異体中に、Ａを認識するためにＮＩＲＶＤを、Ｃを認識するためにＨＤを、Ｇを認識するためにＮＫを挿入し、対照は、Ｔを認識するためのＮＧであった。使用したＴＡＬＥＮは、１５〜１８個のＲＶＤを含有し、これらの２つの遺伝子中の様々な標的配列を標的とした。

結果が図２９に示され、Ｃ末端半反復中のＲＶＤ位置を、Ｔのみ以外のヌクレオチド塩基と相互作用するように遺伝子操作することができるか、又は全ての塩基を同等に認識するように設計することができることを実証する。レーン割り当て、標的配列、及びこのＣｅｌ−Ｉアッセイにおいて測定されたＮＨＥＪの％が、以下の表３０に示される。

このデータは、新規の半反復を有するＴＡＬＥＮが、それらのそれぞれの標的を切断することができることを実証する。

実施例１７：最適な標的配列の同定
最適な標的配列、ひいては最適なＴＡＬＥＮタンパク質設計を決定するために、複数のＳＥＬＥＸアッセイからの結果を使用してインシリコ分析を行い、ｉ）Ｒ１反復（Ｎ末端反復）単位の最良の標的、かつｉｉ）二量体及び三量体環境において、それらの隣接する反復単位と関連して、特定のＲＶＤ反復がどのように挙動するかを決定した。これらの研究において、Ａを認識するためにＮＩＲＶＤを、Ｃを認識するためにＨＤを、Ｇを認識するためにＮＮを、Ｔを認識するためにＮＧを使用した。

結果は、表３１、３２及び３３に要約されている。表３１中の値は、標的塩基の観察された頻度と偶然に予想したその塩基の頻度（すなわち、０．２５）との間の比率の対数（４進法）として計算されたログオッズスコアである。１．０のスコアは、標的塩基が１００％の確率で観察された（すなわち、偶然予想した頻度よりも４倍頻度が高い）ことを示し、０．０のスコアは、標的塩基が２５％の確率で観察されたことを示し、負のスコアは、標的塩基が２５％未満の確率で観察されたことを示す。表３１の値は、６２個の別々のＴＡＬＥタンパク質からのＳＥＬＥＸデータから成るデータセットの適切な位置の平均の塩基頻度から計算された。「Ｒ１ＲＶＤ」で表示される値は、Ｎ末端ＴＡＬＥ反復（及びそれぞれの結合部位における同族位置）を指す。「Ｒ２＋ＲＶＤ」で表示される値は、全ての他のＲＶＤ（及びそれぞれの結合部位における同族位置）を指す。このデータは、全ての他の位置に対するＮ末端位置における、ＨＤ、ＮＮ、及びＮＧＲＶＤを有するＴＡＬＥ反復の特異性の劇的な差異を示す。

表３２及び３３に示される値は、二量体（表３２）又は三量体（表３３）のいずれかの環境におけるスコアに対する、それぞれの塩基について独立して決定されたそれらのログオッズスコアの変化を表し、６７個の別々のＴＡＬＥタンパク質についてのＳＥＬＥＸデータから決定した。したがって、ＨＤＲＶＤに隣接したＮＮＲＶＤ（ＮＮＲＶＤが構築物のＮ末端により近く、ＨＤＲＶＤが構築物のＣ末端により近い）の−０．１２値は、これらの２つのＲＶＤが相互に独立して挙動する場合、二量体における両方の位置のログオッズスコアの合計が、予想よりも０．１２低いことを示す。同様に、表３３Ｃの−０．３４値は、第２のＮＮＲＶＤ付近のＮ末端側に隣接され、かつＨＤＲＶＤ付近のＣ末端側に隣接されるＮＮＲＶＤが、目的とするＮＮＲＶＤが全てのＮＮＲＶＤの平均値よりも０．３４低いログオッズスコアを有することを示すことを表す。表３２、３３Ａ、３３Ｂ、３３Ｃ、及び３３Ｄの負の値は、相互から完全に独立している場合よりも不十分に機能する隣接ＲＶＤの組み合わせを示す。

注記：表３３Ａ〜３３Ｄにおいて、斜字体は、データセットにおける３つ未満の値を示し、全ての他の数は、確率変化を決定するために使用される少なくとも３つの値を含有する。

これらの結果は、最適な反復単位結合への文脈依存が存在することを実証し、最適なタンパク質設計／標的同定のために、反復単位は完全にはモジュール式ではないこと示す。概して、これらのデータを使用して、特定のＴＡＬＥの標的選択及び最適なＴＡＬＥＮの設計の両方を最適化する設計ルールを提案することができる。例えば、ＮＩは、文脈依存の最も低いＲＶＤであり、Ｒ１位置での最良のＲＶＤは、ＮＩであるように見受けられる（例えば、理想的には、標的部位は、Ｒ０及びＲ１−ＮＩを収容するためにＴＡで開始すべきである）。ＡＣ、ＡＴ、ＣＣ、ＣＡ、ＴＡ、ＡＡが、標的とするのに最善の二量体である一方で、ＧＧ、ＧＣ、ＡＧ、ＴＴ、ＣＧ、ＧＴ、及びＴＣは、最悪の二量体であるように見受けられる。三量体に関して、ＡＡＣ、ＡＴＧ、ＧＣＡ、ＡＴＡ、ＡＣＧ、及びＡＴＣが、標的とするのに非常に良好な三量体である一方で、ＧＧＣ、ＡＧＣ、ＴＧＣ、ＴＴＴ、ＧＧＡ、ＡＧＴ、ＧＧＴ、ＧＧＧ、ＴＣＴ、ＧＴＣ、ＣＴＴ、及びＡＧＧは、最悪の三量体であるように見受けられる。したがって、これらの設計ルールを合わせて、最適に結合するＴＡＬＥＮを作成することができる。同様に、表２８中のＮＫ、ＡＫ、及びＤＫＲＶＤでのＳＥＬＥＸ研究、並びにＮＫＲＶＤでのさらなるＳＥＬＥＸ研究（図１７Ａ）は、１３位でリジン（Ｋ）を有するＲＶＤが、ＮＫ、ＡＫ、又はＤＫＲＶＤに対して隣接するＮＩＲＶＤＣ末端に、ＡではなくＧを特定させる傾向があることを示す。したがって、典型的なＲＶＤ及びＮＫＲＶＤのために決定される設計ルールは、１３位で同一の残基を有する非定型のＲＶＤにも適用されるべきである。

実施例１８：ヒト幹細胞におけるＴＡＬＥＮによって駆動された標的組込みの実証
ＴＡＬＥＮ系の多用途性を実証するために、ＴＡＬＥＮを用いて、ヒト胚幹細胞（ＥＳＣ）及び誘導性多能性幹細胞（ｉＰＳＣ）における標的組込みを駆動した。ヒトＥＳＣ及びｉＰＳＣを、ピューロマイシンマーカーの発現がＡＡＶＳ１プロモーターによって駆動されるＡＡＶＳ１遺伝子座への制限部位をさらに含むピューロマイシンドナー核酸の標的組込みために使用した。ドナー及び従った方法は、共同所有の国際公開第ＷＯ２０１０１１７４６４号において以前に説明されているドナー及び方法であった（Ｈｏｃｋｅｍｅｙｅｒｅｔａｌ（２００９）ＮａｔＢｉｏｔｅｃｈｎｏｌ２７（９）：８５１−８５７も参照されたく、その中で、我々は、ＡＡＶＳ１遺伝子座へのそのような構築物の標的組込みの自発的頻度が、我々のアッセイの検出の限界より低いことを実証した）。使用したヌクレアーゼは、実施例１１に記載のＡＡＶＳ１遺伝子座に特異的なＴＡＬＥＮであり、標的結合部位は、以下に示される：

最初に、この遺伝子座を、正しい標的事象後にのみピューロマイシン耐性遺伝子（ＰＵＲＯ）を内因性ＰＰＰ１Ｒ１２Ｃプロモーターの制御下で発現した遺伝子トラップアプローチを用いて標的化した。次に、ＰＰＰ１Ｒ１２Ｃ遺伝子座を、ホスホグリセリン酸キナーゼ（ＰＧＫ）プロモーターからピューロマイシン耐性遺伝子ＰＵＲＯを発現した自律的選択カセットを使用して標的化した。ピューロマイシン耐性細胞のクローンを生育し、標準の方法を使用して、制限ＤＮＡに対してサザンブロットでスクリーニングした。この実験で使用したプローブは、ＰＰＰ１Ｒ１２Ｃ／ＡＡＶＳ１遺伝子座に対し、かつ組み込まれたドナーを用いて、ＤＮＡの小さい制限フラグメントである（したがって、より高い移動性を有した）配列を認識した。標的化の効率は、使用したドナーから高度に独立しており、単離クローンの約５０％が、ヘテロ接合性又はホモ接合性のいずれかの正しく標的化された事象を有し、かつ所望の遺伝子座でのみ導入遺伝子を担持した。この効率は、ＺＦＮを用いて先に観察された効率と比較できる。ＰＰＰ１Ｒ１２Ｃ遺伝子座を標的とすることで、導入された導入遺伝子の発現をもたらした。構成的なｅＧＦＰ発現カセットをさらに担持するＳＡ−ＰＵＲＯドナープラスミドを用いて標的化されたときに、強化された緑色蛍光タンパク質（ｅＧＦＰ）の均一発現が、ｈＥＳＣ及びｉＰＳＣにおいて観察された。重要なことに、ＴＡＬＥＮを使用して遺伝子操作されたｈＥＳＣは、多能性マーカーＯＣＴ４、ＮＡＮＯＧ、ＳＳＥＡ４、Ｔｒａ−１−８１、及びＴｒａ−１−６０のそれらの発現によって示されるように多能性のままであった。

ヒトＯＣＴ４遺伝子の第１のイントロンに対するＴＡＬＥＮ（ＯＣＴ４−Ｉｎｔ１−ＴＡＬＥＮ）も設計し、標的配列が、３つの異なるドナープラスミドと組み合わせて以下に示される：
１０１１２５：ＧＡＣＣＣＴＧＣＣＴＧＣＴＣＣＴ（配列番号３２９）
１０１２２５：ＣＡＣＣＴＧＣＡＧＣＴＧＣＣＣＡＧ（配列番号３３０）
ＴＡＬＥＮは、＋６３Ｃキャップを利用し、典型的なＲＶＤ（それぞれ、Ａ、Ｃ、Ｇ、及びＴを標的とする、ＮＩ、ＨＤ、ＮＮ、及びＮＧ）を使用した。１０１１２５は、１５．５個のＴＡＬＥ反復を含み、１０１２２５は、１６．５個のＴＡＬＥ反復を含んだ。１０１２２５は、その標的部位における３’Ｇを認識するために、ＮＮＲＶＤを有する半反復を利用した。

正しい標的化事象は、内因性ＯＣＴ４プロモーターの制御下でのピューロマイシン及びＯＣＴ４エクソン１−ｅＧＦＰ融合タンパク質の両方の発現を特徴とする。最初の２つのドナープラスミドを、ＯＣＴ４の第１のイントロンにスプライスアクセプターｅＧＦＰ−２Ａ−自己切断型ペプチド（２Ａ）−ピューロマイシンカセットを組み込むように設計し、単に相同アームの設計の点で異なり、第３のドナーを、ＧＦＰ−２Ａ−ピューロマイシンカセットのリーディングフレームへのエクソン１の直接融合を発生させるように遺伝子操作した。両方の戦略は、サザンブロット分析及び単細胞由来のクローンのＤＮＡ配列決定によって決定されたようにＯＣＴ４遺伝子座への正しい標的化遺伝子付加をもたらした。標的化の効率は、ｈＥＳＣ及びｉＰＳＣの両方において６７％〜１００％に及んだ。

ＴＡＬＥＮを使用して、ｈＥＳＣ中で発現しない遺伝子座を遺伝子操作することができるかを試験するために、ＴＡＬＥＮを、ＰＩＴＸ３遺伝子の第１のコーディングエクソン内で切断するよう遺伝子操作した（同一の設計並びに１０１１２５及び１０１２２５で使用した組み立て手順を使用して）。標的配列は、以下に示される：
１０１１４８：ＧＧＣＣＣＴＴＧＣＡＧＣＣＧＴ（配列番号３３１）
１０１１４６：ＣＡＧＡＣＧＣＴＧＧＣＡＣＴ（配列番号３３２）

電気穿孔後、標的化事象を、外部の５’及び内部の３’プローブを使用して、サザンブロット分析によって評価した。ドナー指定のｅＧＦＰ導入遺伝子をＰＩＴＸ３において単独で担持する単細胞由来のクローンを、平均して６％の確率で得た。注目すべきは、分析した９６個のｈＥＳＣクローンのうちの１つが、ＰＩＴＸ３エクソン１（ＷＩ番号３）ｈＥＳＣの両方の対立遺伝子に導入遺伝子を担持しており、第一段階における非発現遺伝子の両方の対立遺伝子の功を奏する遺伝的修飾を実証する。

これらの結果は、幹細胞のゲノムへの標的組込みを駆動するためにＴＡＬＥＮを使用する能力を実証する。

実施例１９：インビボにおけるＴＡＬＥＮ媒介遺伝子編集の例
カエノラブディティス・エレガンスにおけるＴＡＬＥＮゲノム編集。インビボ遺伝子編集のためにＴＡＬＥＮを動物において使用することができることを実証するために、以下の実験を行った。カエノラブディティス・エレガンスｂｅｎ−１変異に特異的なＴＡＬＥＮ対を、ＲＮＡとして送達し、Ｄｒｉｓｃｏｌｌｅｔａｌ（（１９８９）Ｊ．Ｃｅｌｌ．Ｂｉｏｌ．１０９：２９９３−３００３）に記載されるベノミル耐性についてスクリーニングした。ｂｅｎ−１変異体表現型は優性であり、通常の解剖顕微鏡下で子孫の１００％において可視的である。簡潔に、野生型カエノラブディティス・エレガンス雌雄同体を、ｂｅｎ−１を標的とするＴＡＬＥＮをコードするｍＲＮＡの注入前に、通常のＮＧＭ寒天プレート上で栽培した。

ＴＡＬＥＮをコードする核酸を、標準の制限クローニング手順を使用して、ＳＰ６インビトロ転写ベクター（ＩＶＴ）に挿入した。ＩＣＴベクター骨格は、ｐＪＫ３７０に由来しており、生殖細胞系翻訳を支援するために、先に示された５’及び３’ＵＴＲ配列を含有する（ＭａｒｉｎａｎｄＥｖａｎｓ（２００３）Ｄｅｖｅｌｏｐｍｅｎｔ１３０：２６２３−２６３２を参照のこと）。ｍＭｅｓｓａｇｅｍＭａｃｈｉｎｅ（登録商標）（Ａｍｂｉｏｎ）及びポリＡテーリングキット（Ａｍｂｉｏｎ）を使用して、５’キャップ構造及びポリＡを含有するｍＲＮＡの産生をインビトロで行い、ＮａｎｏＤｒｏｐ分光光度計（Ｔｈｅｒｍｏｓｃｉｅｎｔｉｆｉｃ）を用いて定量化する前に、ＡｍｂｉｏｎＭＥＧＡＣｌｅａｒ（商標）カラム上で精製した。ＺｅｉｓｓＡｘｉｏｖｅｒｔ顕微鏡下で、ＮａｒｉｓｈｉｇｅＩＭ３００注入器を使用してｍＲＮＡ注入を行った。以下の相違点を有する標準のカエノラブディティス・エレガンスＤＮＡ注入プロトコル（Ｓｔｉｎｃｈｃｏｍｂｅｔａｌ．（１９８５）ＭｏｌＣｅｌｌＢｉｏｌ５：３４８４−３４９６を参照のこと）に従って、ｍＲＮＡの注入を行った：制御装置を、窒素ガスタンクからの圧力が６０ｐｓｉとなるように調整した。Ｐ_注入及びＰ_バランス測定を、それぞれ、１５ｐｓｉ及び２ｐｓｉに調整した。これらの圧力値は、線虫生殖腺への流体のより穏やかな放出を可能にするために、ＤＮＡ注入に典型的に使用される圧力値よりも低い。全てのｍＲＮＡを５００ｎｇ／μＬで注入し、ＴＡＬＥＮをコードする全てのｍＲＮＡを対として注入し、したがって、針における全体のｍＲＮＡ濃度は１０００ｎｇ／μＬであった。

ｍＲＮＡ注入後、動物を、７μＭのベノミルを含有するプレートに移した。Ｆ１自己子孫を、若年成人として、動物の腹側に触れることによってスクリーニングした。ヘテロ接合性変異体動物が、複数の正弦曲線様の動作を用いて反転して応答する一方で、野生型動物は麻痺しており、この能力を欠如する。麻痺していないＦ１動物を、（上述の）標的部位のＰＣＲ／Ｃｅｌ−Ｉ分析のために個別に溶解するか、又は新たなベノミルプレートに個別に移すかのいずれかを行い、ホモ接合体を標的部位上で配列決定することによって、麻痺していないＦ２から単離した。１０１３１８／１０１３２１と指定される１つのＴＡＬＥＮ対は、ｂｅｎ−１変異表現型の復帰を引き起こし、Ｆ１子孫がベノミルに耐性を示すことが見出された。ベノミル耐性動物の配列分析は、標的位置における２つの異なる正真正銘のインデルを明らかにした。このＴＡＬＥＮ対の標的部位における遺伝子座が以下に示され、それらの配列が実施例２３に示される。

これらのデータは、ＴＡＬＥＮがインビボでゲノム編集することができることを実証する。

ラットにおけるＴＡＬＥＮゲノム編集。次に、ＴＡＬＥＮを使用して、ラットゲノムを編集した。内因性ラットＩｇＭ遺伝子におけるエクソン２を標的とするラットＩｇＭ特異的ＴＡＬＥＮ対１０１１８７／１０１１８８を、上の実施例１１及び１２に記載されるように構築した。ラットゲノム中の標的配列が以下に示され、太字及び大文字は、ＴＡＬＥＤＮＡ結合ドメインの標的部位を示し、小文字は、ギャップ又はスペーサー領域を示す。

次に、これらのＴＡＬＥＮ対をコードする核酸を、Ｍｅｎｏｒｅｔｅｔａｌ（２０１０）ＥｕｒＪＩｍｍｕｎｏｌ．Ｏｃｔ；４０（１０）：２９３２−４１に記載されるようにラット胚に注入した。ＴＡＬＥＮをコードする核酸を、以下の表３５に示される用量で、前核（ＰＮＩ、ＤＮＡ）又は細胞質内（ＩＣ、ＲＮＡ）注入のいずれかで注入した。

＊注記：全ての妊娠した母親が出産したわけではなく、ＮＤは「決定されず」である。

ある割合の注入した胚を偽妊娠した雌ラットに移植し、結果として得られる新生児をゲノム編集についてアッセイした。ＤＮＡを、前核ＤＮＡ注入に起因するラットの子から単離し、Ｋｉｍｅｔａｌ（２００９）ＧｅｎｏｍｅＲｅｓ．１９（７）：１２７９−１２８８に記載のＴ７ミスマッチ分析に供した。簡潔に、３７１ｂｐのＰＣＲ産物を作成するために、プライマーセットＧＪＣ１５３Ｆ〜１５４Ｒを使用してＰＣＲを行った。プライマー対が以下に示される：
ＧＪＣ１５３Ｆプライマー：５’ｇｇａｇｇｃａａｇａａｇａｔｇｇａｔｔｃ（配列番号４５３）
ＧＪＣ１５４Ｒプライマー：５’ｇａａｔｃｇｇｃａｃａｔｇｃａｇａｔｃｔ（配列番号４５４）

この分析のために、標準的技法によって単離された１００ｎｇのテーリングｇＤＮＡを使用した。以下のように、５ｕＬのＰＣＲ産物を使用して、可能性のあるヘテロ二本鎖を形成することを可能にした：９５℃／９５℃〜８５℃（−２℃／秒）／８５℃〜２５℃（−０．１℃／秒）／４℃で２’。その後、これを、以下の条件下で、Ｔ７エンドヌクレアーゼＩ（ＮＥＢｉｏｌａｂｓ照会：Ｍ０３０２Ｌ）で消化した：５ｕＬのＰＣＲヘテロ二本鎖＋１ｕＬの１０×ＮＥＢ２＋０．５ｕＬのＴ７エンド＋３．５ｕＬのＨ２Ｏ／２０’（３７℃）。消化後、反応物を、０．５×ＴＡＥ中の１．２％のアガロースゲルで電気泳動させた。分析した６６匹中７匹のラットの子は、Ｔ７アッセイによるＮＨＥＪ活性に対して陽性であり（図３１に示される）、配列決定は、ＮＨＥＪ関連インデルの存在を明らかにした（例えば、ラット３．３における１ｂｐの欠失及びラット３．４における９０ｂｐの欠失）。

トランスジェニック動物を生成するために、目的とする核酸を有するＴＡＬＥＮ対を、ラット細胞への標的組込みのために使用する。ＴＡＬＥＮ対によって標的化されるラット細胞は、ラット胚幹細胞、１つ以上の細胞を持つＧＦＰを含有するラット胚、又は誘導性多能性幹（ｉＰＳ）細胞に変換できる任意のラット細胞型である。ＴＡＬＥＮ対は、細胞に送達され、ＣＡＧプロモーターを最適に含有するプラスミドＤＮＡ、５’キャップ構造及び３’ポリ−アデノシンテールを最適に有するｍＲＮＡ、ＴＡＬＥＮオープンリーディングフレームをコードする核酸を含有する精製タンパク質又はウイルス粒子であり得る。ドナーＤＮＡは、切断部位の両側に５０〜１０００ｂｐの相同性を含有する一本鎖若しくは二本鎖環状プラスミドＤＮＡ、又は切断部位の両側に５０〜１０００ｂｐの相同性を含有する一本鎖若しくは二本鎖環状プラスミドＤＮＡであり得る。ＴＡＬＥＮ及びドナーは、ラット細胞若しくは胚の微量注入、電気穿孔を介してのラット細胞のトランスフェクション、脂質に基づく膜融合、リン酸カルシウム沈殿、ＰＥＩ等、精製ヌクレアーゼタンパク質とのインキュベーション（例えば、細胞透過性ペプチドに融合する場合）、又はラット細胞若しくは胚のウイルス感染によって送達される。これらの方法は、当技術分野において既知である。注入又はトランスフェクトした細胞又は胚から改変ラットを生成する手段は、選択される送達方法に依存する。胚について、胚を偽妊娠したラットの子宮に移植し、前述のように出産予定日に到達させる。修飾された細胞について、３つの方法が実行可能である：ａ）ラット細胞が胚幹細胞である場合、ラット胚盤胞は、修飾されたラット幹細胞を注入されるべきであり、胚盤胞を偽妊娠したラットの子宮に移植し、出産予定日に到達させるか、ｂ）細胞（又はその核）は、除核卵母細胞（体細胞核移植）に微量注入されるべきであり、結果として得られる胚を偽妊娠したラットの子宮に移植し、出産予定日に到達させるか、又はｃ）細胞は、ｉＰＳ細胞に変換されるべきであり、ラット胚盤胞に注入されるべきである。胚盤胞を偽妊娠したラットの子宮に移植し、出産予定日に到達させる。その後、ラットの子を、ＰＣＲ又は当技術分野において既知の任意の他の手段を用いて、導入遺伝子の存在についてアッセイする。

植物におけるＴＡＬＥＮゲノム編集。トウモロコシＲＰＤ１及びＣ１遺伝子に特異的なＴＡＬＥＮ対を、上の実施例１１に記載されるように構築し、それらの標的配列が、ＲＰＤ１遺伝子座と比較して、以下に示される（配列番号３８２〜３８７）：

Ｃ１遺伝子座に対して作製されたＴＡＬＥＮ対が、同様に以下に示される（配列番号３８８〜３９０）：

さらなるＴＡＬＥＮ対を、以下のように、Ｃ１遺伝子座に対して作製した（配列番号３９１〜３９８）：

植物特異的ＴＡＬＥＮ対を、二重ルシフェラーゼ一本鎖アニーリングアッセイ（ＤＬＳＳＡ）を使用して、活性について哺乳類Ｎｅｕｒｏ２Ａ細胞において分析した。これは、一時的にトランスフェクトされた細胞においてＺＦＮ又はＴＡＬＥＮ活性を定量化するために使用される新規の系であり、かつＰｒｏｍｅｇａのＤｕａｌ−ＬｕｃｉｆｅｒａｓｅＲｅｐｏｒｔｅｒ（登録商標）ＡｓｓａｙＳｙｓｔｅｍに基づいている。実施例１３を参照されたい。系は、単一の管（ウェル）内で、２つの個々のレポーター酵素、ホタル及びレニラルシフェラーゼの連続測定を可能にする。ホタル及びレニラルシフェラーゼレポーターの両方を、再び遺伝子操作し、アッセイ条件を最適化する。ホタルルシフェラーゼレポーター構築物は、ＺＦＮ又はＴＡＬＥＮのいずれかのためにＤＮＡ結合部位によって分離されるホタルコード領域の２つの不完全なコピーを含有する。この研究において、５’コピーは、ホタル遺伝子のＮ末端部分の約３分の２に由来し、３’コピーは、ホタル遺伝子のＣ末端部分の約３分の２に由来する。２つの不完全なコピーは、約６００ｂｐの相同アームを含有する。分離されたホタルフラグメントは、ルシフェラーゼ活性を示さない。ＺＦＮ又はＴＡＬＥＮ対によって引き起こされるＤＮＡ二本鎖切断は、一本鎖アニーリング経路によって隣接反復間の組換えを刺激し、その後、ホタルルシフェラーゼ機能を回復する。共トランスフェクトされたレニラルシフェラーゼプラスミドは、内部対照を提供する。それぞれのレポーターの発光活性は、ルミノメーター上で読み取られる。実験的レポーター（ホタル）の活性を内部対照（レニラ）の活性に標準化することは、細胞生存及び／又はトランスフェクション効率の差異によって引き起こされる実験的可変性を最小限に抑える。標準化された値を、所与のＺＦＮ又はＴＡＬＥＮ対の活性を決定するために使用する。これは、系において貴重なモデル細胞を用いて作業する場合、又は目的とする標的細胞型が利用不可能であるか、あるいはスクリーニング目的での使用が困難である場合に有用な手段である。これは、標的配列が内因性ゲノムにおいて利用不可能である場合に、ＴＡＬＥＮ技術の基盤を開発及び最適化するのにも有用な手段である。活性ヌクレアーゼをＤＬＳＳＡによって同定し、その後、最終評価のために内因性系に入れることができる。植物標的上の活性ＴＡＬＥＮ対は、以下の表３５Ａに示される。

次に、標準の方法を使用して、ＴＡＬＥＮ対を、トウモロコシＨｉＩＩ胚に金粒子銃を介して送達した（Ｆｒａｍｅｅｔａｌ，（２０００）Ｉｎｖｉｔｒｏｃｅｌｌｕｌａｒ＆ｄｅｖｅｌｏｐｍｅｎｔａｌｂｉｏｌｏｇｙ．３６（１）：２１−２９）。１つのＴＡＬＥＮ対につき合計で約９０個の授粉したトウモロコシ胚を形質転換し、ゲノムＤＮＡ抽出のために液体窒素中でプールし、かつ凍結させる前に、カルス開始培地上で約７日間成長させた。ゲノムＤＮＡを、ＤＮｅａｓｙＰｌａｎｔＭｉｎｉｐｒｅｐキット（Ｑｉａｇｅｎ）を使用して、銃を照射したプレート１枚につき４〜６個の凍結した胚から単離した。その後、それぞれのＴＡＬＥＮ標的を、３つの生物学的三重反復からなるプールしたゲノムＤＮＡから、Ｈｉｇｈ−ＦｉｄｅｌｉｔｙＰｈｕｓｉｏｎＨｏｔＳｔａｒｔＩＩＰｏｌｙｍｅｒａｓｅ（ＮＥＢ）を使用する二段階ＰＣＲによって増幅した。第１ラウンドにおいて、それぞれの部位を、４００ｎｇのゲノムＤＮＡ及び表３５Ｂに列記されるプライマーを使用して、２０サイクルのＰＣＲで増幅した。第２ラウンドにおいて、第１ラウンドのＰＣＲ由来の１ｕＬの産物並びにプライマーＳＯＬＥＸＡ−ＯＵＴ−Ｆ１及びＳＯＬＥＸＡ−ＯＵＴ−Ｒ１を使用して、さらに２０サイクルを行い、完全なＩｌｌｕｍｉｎａ配列決定増幅産物を生成した。その後、結果として生じるＰＣＲ産物を、ＱｉａｑｕｉｃｋＰＣＲＰｕｒｉｆｉｃａｔｉｏｎカラム（Ｑｉａｇｅｎ）で精製し、それぞれ５０ｎＭに標準化し、合計８個の部位が単一のＩｌｌｕｍｉｎａレーンにおいて配列決定されるように同等の容積中で合わせた。未処理のゲノムＤＮＡ由来の対照増幅産物を、別々のレーンにおいて提示した。Ｉｌｌｕｍｉｎａ単一読み取り１００ｂｐ配列決定を、ＥＬＩＭＢｉｏｐｈａｒｍａｃｅｕｔｉｃａｌｓ（Ｈａｙｗａｒｄ，ＣＡ）で行った。

配列決定は、以下の表３６に示されるように、ＴＡＬＥＮ処理された胚由来の細胞プールにおいて多数のインデルの存在を明らかにした。配列分析の詳細は、以下の通りである：ＴＡＬＥＮ処理されたトウモロコシ胚に由来するバーコード化された配列をともにプールし、１００ｂｐの読み取り長の配列決定のために、ＩｌｌｕｍｉｎａＧＡ２シーケンサー上に提示した。偽処理されたトウモロコシ胚に由来するバーコード化された配列をともにプールし、１００ｂｐの読み取り長の配列決定のために、同一のＩｌｌｕｍｉｎａＧＡ２シーケンサーの別々のレーン上に提示した。それぞれの結果として得られるデータファイル中の配列をバーコードで分類し、修飾されていないゲノム配列に対して整列させた。胚のわずかの部分は、胚の大部分と比較して、Ｃ１遺伝子において３ｂｐの挿入を含有した。予想したＴＡＬＥＮ切断部位に集中した１０ｂｐのウィンドウ内の少なくとも２つの隣接する挿入された塩基又は欠失した塩基からなるインデルを、可能性のあるＮＨＥＪ事象と見なし、さらに処理した。所与のＴＡＬＥＮ処理された試料及び同族の偽処理された試料の両方において同様の頻度で生じたインデルを配列決定人工物と見なし、廃棄した。

表３７は、上に示される８個の試料において最も観察されたインデルを示し、ＴＡＬＥＮが、遺伝子標的及びヌクレアーゼの全ての対の両方でＮＨＥＪを誘導することができたことを実証する。それぞれの試料について、変更されていないゲノム配列は、下線を引いた２つのＴＡＬＥＮ結合部位の間のギャップで示される。欠失した塩基は、コロンによって示され、挿入した塩基は、波括弧によって示され、「｛」は、挿入した配列の始まりを示し、「｝」は、挿入した配列の終わりを示す。

インデル頻度は、全ての試料において類似した（０．００８７％〜０．０１８５％又は約１１，０００個の事象中１個の事象〜５，４００個の事象中１個の事象）。これは、制限要素が、ＴＡＬＥＮ活性ではなくトウモロコシ胚への微粒子銃送達であることを暗示する。ＴＡＬＥＮ処理されたトウモロコシ胚に由来するバーコード化された配列をともにプールし、１００ｂｐの読み取り長の配列決定のために、ＩｌｌｕｍｉｎａＧＡ２シーケンサー上に提示した。

次に、これらのＴＡＬＥＮを用いて、任意の所望の目的とするＤＮＡのＴＡＬＥＮによって作成されるＤＳＢへの標的組込み（ＴＩ）を駆動する。ＴＩを、当技術分野において既知の方法を用いて、単子葉植物又は双子葉植物において達成することができる（例えば、Ｓｈｕｋｌａｅｔａｌ（２００９）Ｎａｔｕｒｅ４５９：４３７、及びＣａｉｅｔａｌ（２００９）ＰｌａｎｔＭｏｌＢｉｏｌ６９：６９９を参照のこと）。所望の場合、選択されたＴＡＬＥＮのトランスジェニックの新規の植物種を安定的に生成することもでき、変異が所望される別の株へのＴＡＬＥＮ株の交雑を可能にし、いくつかの子孫が所望の変異のみを含有し、かつＴＡＬＥＮ導入遺伝子が分離されるように子孫の分離が続く。

したがって、これらの実施例は、本発明の新規のＴＡＬＥＮが、植物及び動物系において、インビボでゲノム編集することができることを実証する。

実施例２１：ＴＡＬＥ反復単位の変更
ＴＡＬＥ反復単位における変更を調査するために、キサントモナス及びラルストニアの両方からの配列を比較した。ラルストニア由来の５２個の特有の反復単位を試験して、それぞれの位置における残基頻度を観察し、その後、これらの値を編集した。データが以下の表３８に示され、アミノ酸は、左から右に１文字のコードで示され、反復単位の位置は、上から下に示され、ＲＶＤ位置は、太字で示される。

次に、これらの反復単位を、キサントモナス由来の反復単位と合わせて、特有の反復単位を作成することができる。ラルストニア反復において見出される残基とキサントモナス残基において見出される残基との組み合わせの反復配列は、増加したＤＮＡ結合親和性、増加したＤＮＡ結合特異性、又は低下した酸化に対する感受性等の改善された特性を有するタンパク質を産出することができる。そのような反復単位の組み合わせの例には、以下のものが挙げられ、変更された残基が太字及びより大きいフォントサイズで示されている：

この可能性を調査するために、以下の表３９に示される反復単位を構築した。表は、第１のラインに典型的なラルストニア反復単位を示し、第２のラインにキサントモナス反復単位を示す。ラルストニア由来の残基及びＴＡＬＥ反復の配列要件の両方を探索するように設計された他の変形の両方を含有する新規の反復が、それに続くライン上に示されている。第２のライン上の典型的なキサントモナス反復単位との違いの全てに下線が引かれている。次に、列３〜２７中の太字の位置を変更することによって、反復単位を遺伝子操作した。その後、これらの新規の遺伝子操作された反復単位を、実施例１５及び図２７に示される新規のＲＶＤを試験するように設計された系に置換し、結果として得られる構築物をインビトロで翻訳し、ＥＬＩＳＡで使用した。ＥＬＩＳＡで使用した標的配列は、Ｃと相互作用するために、全てのこれらの新規のフレームワーク変異体中のＲＶＤがＨＤで一定に保持される、実施例１５に記載の「Ｃ」変異体（例えば、ＴＴＧＡＣＣＡＴＣＣ、配列番号１８２）であった。ＥＬＩＳＡ結果（３つの異なる実験の平均）が表３９に示されており、全て標準の配列反復単位配列に標準化された。

ＥＬＩＳＡ結果から見られるように、２、３、４、６、７、８、９、１０、又は１１位における変異を有する遺伝子操作された（例えば、新規の）フレームワークを含むＴＡＬＥＤＮＡ結合ドメインの活性が減少した（２、３、４、７、及び１１位における変異が、結合に最も著しく影響した）。対照的に、２０、２１、２４、２５、２６、及び２７位における置換の多くは、ＤＮＡ結合に最小の影響を与えたか、又は実際にＤＮＡ結合を増大させたかのいずれかであった。最大の結合増大は、ラルストニア反復における２１〜２７位のうちの１つ以上の残基が、キサントモナス反復に置換されたときに生じた。

ハイブリッド反復単位を直列に合わせて、任意の所望のタンパク質を認識することができる新規のＴＡＬＥタンパク質を作成する。これらの新規のＴＡＬＥＤＮＡ結合ドメインは、ヌクレアーゼドメイン、転写制御ドメイン、又は任意の他の活性タンパク質ドメインにも結合され、ＤＮＡ相互作用後の測定可能な結果を引き起こす。

実施例２１：ＴＡＬＥ亜鉛フィンガーＤＮＡ結合ドメインハイブリッドの構築
亜鉛フィンガーをＴＡＬＥＤＮＡ結合ドメインに融合させて、ハイブリッドＤＮＡ結合ドメインを作成し、その後、ヌクレアーゼに結合させた。標的ＤＮＡ配列が以下に示され、ＣＣＲ５遺伝子内に遺伝子座を取り囲む領域を含む。結合部位の上及び下に示されるのは、ＴＡＬＥＤＮＡ結合ドメインの標的結合部位であり、亜鉛フィンガー結合部位は、標的配列上に太字下線で示される。太字／下線の「ＴＡＧ」配列が、ＣＣＲ５特異的ＺＦＮＳＢＳ番号８２６７の第４のフィンガーの結合部位である一方で、太字／下線の「ＡＡＡＣＴＧ」配列は、ＣＣＲ５特異的ＺＦＮＳＢＳ番号８１９６の第３及び第４のフィンガーの結合部位である（米国特許出願第１１／８０５，７０７号を参照のこと）。以下の配列は、亜鉛フィンガーＤＮＡ標的が、ＤＮＡ鎖上のＴＡＬＥＤＮＡ結合ドメイン標的と隣接せず、「内部ギャップ」を作成することを示す。したがって、この種の融合は、実践者が、所望の場合、内部ギャップ領域内でＤＮＡ領域を飛ばすことを可能にする。

以下の表４０は、研究の結果を示す。これらの研究において、１つのヌクレアーゼパートナーは、７、１０、又は１３個のいずれかの塩基分の内部ギャップと一定に保持される。次に、クレアーゼパートナーは、４〜１６個の塩基分の内部ギャップを含むタンパク質と対合する。表に示されるように、ＴＡＬＥ／亜鉛フィンガーハイブリッドＤＮＡ結合ドメインは、内部ギャップが４〜１６個の塩基に及ぶ場合に、活性ヌクレアーゼ対を形成することができる。

実施例２２：ＴＡＬＥインテグラーゼ融合タンパク質の構築
ある特定のホットスポットへの選好が存在するが、レトロウイルスのライフサイクルの間、ウイルスゲノムＲＮＡを逆転写し、かつ多くの異なる部位で宿主ゲノムに組み込む。レトロウイルスベクターを利用する適用、特に遺伝子治療において、癌遺伝子座付近での遺伝子操作されたウイルスゲノムのランダム組込みによるレトロウイルスベクターの考えられる発癌性は、潜在的な危険因子を示す。そのような潜在的な問題を打開するために、特定のＴＡＬＥＤＮＡ結合ドメインを利用することによって、ウイルスインテグラーゼの特異性を既定の部位に再指向する。融合物を、全体若しくは切断されたインテグラーゼ、及び全体若しくは切断されたインテグラーゼ結合タンパク質で作製する（例えば、ＨＩＶインテグラーゼのＬＥＤＧＦ）。さらに、対の１つのメンバーが１つのタンパク質（例えば、タンパク質１）に融合する組込み体であり、第２の対がＴＡＬＥＤＮＡ結合ドメインの別のタンパク質（例えば、タンパク質２）との融合物である融合対を作製し、タンパク質１及びタンパク質２は相互に結合する。対が目的とする細胞中で発現されるように、融合対を発現ベクターにクローニングする。哺乳類ゲノム標的について、融合対は、発現哺乳類発現ベクターを使用して発現される。ＴＡＬＥＮ誘導性ＤＮＡ融合後にドナーが切断部位に組み込まれるように、ＴＡＬＥＮ融合物の発現の間、ドナーＤＮＡを供給する。

実施例２３：種々のＴＡＬＥ構築物の配列
ＤＮＡ及びタンパク質配列

コード配列に下線を引いた、完全なＴＡＬＥＮ構築物配列（配列番号２１７）：
GACTCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACTTAAGCTGATCCACTAGTCCAGTGTGGTGGAATTCGCCATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGAGGTTCTGGCGGCAGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCTTGATAACTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTCGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATAGCACGTGCTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGGCTTTTGCTGGCCTTTTGCTCACATGTTCTT

ＮＴＦ３修飾及びインビトロ切断研究において使用したそれぞれのＴＡＬＥＮの完全なタンパク質及びコード配列
それぞれの発現構築物の配列を再生成するために、上述の構築物の下線を引いた領域を以下に示されるそれぞれのＣＤＳに置換する。
＞ＮＴＬ＋２８（配列番号２１８）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAAVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGGSGGSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＮＴＬ＋２８（配列番号２１９）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGAGGTTCTGGCGGCAGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＮＴＬ＋６３（配列番号２２０）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＮＴＬ＋６３（配列番号２２１）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＮＴＲ＋２８（配列番号２２２）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＮＴＲ＋２８（配列番号２２３）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAATCTTACTCCAGAGCAGGTCGTCGCAATCGCGTCGAATAACGGGGGAAAGCAAGCACTGGAAACCGTGCAGAGGTTGTTGCCGGTCTTGTGTCAGGCTCACGGCTTGACACCTGCCCAAGTGGTGGCCATTGCGTCGAACATCGGGGGAAAACAGGCACTTGAAACAGTCCAGAGACTTTTGCCCGTCCTCTGCCAGGCGCACGGCCTCACGCCGGATCAGGTGGTAGCCATCGCGTCAAACATCGGAGGGAAGCAGGCTCTGGAAACGGTGCAGCGGCTTTTGCCGGTACTTTGCCAAGCTCATGGGCTCACGCCAGCCCAAGTGGTAGCTATCGCATCGCACGACGGAGGGAAGCAGGCCTTGGAGACAGTGCAACGGCTCCTCCCCGTGTTGTGCCAGGCACATGGGTTGACTCCAGAGCAGGTCGTAGCAATCGCCTCCAATATCGGGGGAAAGCAAGCGTTGGAGACAGTGCAGCGACTGCTGCCTGTGCTTTGCCAGGCTCATGGCCTGACGCCCGATCAGGTAGTGGCAATCGCGTCAAACAAAGGTGGAAAGCAGGCACTCGAAACGGTACAGCGCTTGCTGCCCGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTAGTCGCGATTGCGTCGAACATCGGGGGAAAGCAAGCGTTGGAAACGGTACAACGCCTGCTCCCGGTGCTCTGCCAGGCTCATGGACTTACACCCGAGCAGGTGGTCGCCATCGCGTCAAACATCGGAGGCAAACAGGCATTGGAGACAGTGCAGCGCCTTCTCCCAGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTCGTCGCGATTGCATCGAATGGAGGTGGGAAACAGGCCCTTGAGACAGTACAGAGGCTTTTGCCCGTGTTGTGCCAGGCCCACGGACTCACACCCGAACAAGTCGTCGCCATTGCCAGCCATGATGGAGGTAAACAGGCACTTGAGACTGTCCAGCGCCTCCTGCCGGTGCTGTGCCAAGCACATGGGCTGACCCCGCAGCAAGTCGTAGCGATCGCCTCGAATGGTGGAGGAAAACAAGCGCTTGAAACCGTCCAGAGGTTGCTCCCGGTGCTGTGCCAGGCACATGGCCTTACGCCTGAACAAGTAGTCGCGATTGCCAGCAACAAAGGCGGAAAACAGGCTCTCGAAACGGTCCAGCGGTTGCTGCCGGTGTTGTGCCAGGCGCACGGTCTTACACCGGACCAGGTGGTGGCGATTGCCTCCCACGATGGGGGTAAACAGGCACTGGAAACCGTGCAGAGATTGCTCCCAGTACTTTGTCAGGCACATGGTCTGACTCCTGCTCAAGTGGTCGCGATCGCCTCGAACAATGGCGGAAAGCAGGCGCTCGAAACGGTACAGCGGCTCCTTCCGGTGCTCTGCCAAGCCCACGGATTGACGCCAGAACAGGTCGTGGCAATTGCGTCACACGACGGTGGAAAGCAGGCGCTCGAAACTGTGCAAAGACTCCTGCCCGTACTCTGCCAGGCACACGGTTTGACTCCCCAGCAGGTAGTGGCCATCGCGAGCAATAAGGGAGGAAAGCAGGCGCTTGAAACGGTGCAGAGACTTCTGCCCGTGCTTTGTCAAGCCCACGGGCTGACTCCGGAGCAGGTAGTGGCCATCGCCTCAAACAACGGAGGAAAGCAAGCTCTCGAAACCGTACAGAGGCTTCTCCCCGTGCTCTGTCAGGCCCACGGGTTGACCCCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＮＴＲ＋６３（ｒＮＴ３Ｃ＋６３とも称される）（配列番号２２４）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＮＴＲ＋６３（配列番号２２５）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAATCTTACTCCAGAGCAGGTCGTCGCAATCGCGTCGAATAACGGGGGAAAGCAAGCACTGGAAACCGTGCAGAGGTTGTTGCCGGTCTTGTGTCAGGCTCACGGCTTGACACCTGCCCAAGTGGTGGCCATTGCGTCGAACATCGGGGGAAAACAGGCACTTGAAACAGTCCAGAGACTTTTGCCCGTCCTCTGCCAGGCGCACGGCCTCACGCCGGATCAGGTGGTAGCCATCGCGTCAAACATCGGAGGGAAGCAGGCTCTGGAAACGGTGCAGCGGCTTTTGCCGGTACTTTGCCAAGCTCATGGGCTCACGCCAGCCCAAGTGGTAGCTATCGCATCGCACGACGGAGGGAAGCAGGCCTTGGAGACAGTGCAACGGCTCCTCCCCGTGTTGTGCCAGGCACATGGGTTGACTCCAGAGCAGGTCGTAGCAATCGCCTCCAATATCGGGGGAAAGCAAGCGTTGGAGACAGTGCAGCGACTGCTGCCTGTGCTTTGCCAGGCTCATGGCCTGACGCCCGATCAGGTAGTGGCAATCGCGTCAAACAAAGGTGGAAAGCAGGCACTCGAAACGGTACAGCGCTTGCTGCCCGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTAGTCGCGATTGCGTCGAACATCGGGGGAAAGCAAGCGTTGGAAACGGTACAACGCCTGCTCCCGGTGCTCTGCCAGGCTCATGGACTTACACCCGAGCAGGTGGTCGCCATCGCGTCAAACATCGGAGGCAAACAGGCATTGGAGACAGTGCAGCGCCTTCTCCCAGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTCGTCGCGATTGCATCGAATGGAGGTGGGAAACAGGCCCTTGAGACAGTACAGAGGCTTTTGCCCGTGTTGTGCCAGGCCCACGGACTCACACCCGAACAAGTCGTCGCCATTGCCAGCCATGATGGAGGTAAACAGGCACTTGAGACTGTCCAGCGCCTCCTGCCGGTGCTGTGCCAAGCACATGGGCTGACCCCGCAGCAAGTCGTAGCGATCGCCTCGAATGGTGGAGGAAAACAAGCGCTTGAAACCGTCCAGAGGTTGCTCCCGGTGCTGTGCCAGGCACATGGCCTTACGCCTGAACAAGTAGTCGCGATTGCCAGCAACAAAGGCGGAAAACAGGCTCTCGAAACGGTCCAGCGGTTGCTGCCGGTGTTGTGCCAGGCGCACGGTCTTACACCGGACCAGGTGGTGGCGATTGCCTCCCACGATGGGGGTAAACAGGCACTGGAAACCGTGCAGAGATTGCTCCCAGTACTTTGTCAGGCACATGGTCTGACTCCTGCTCAAGTGGTCGCGATCGCCTCGAACAATGGCGGAAAGCAGGCGCTCGAAACGGTACAGCGGCTCCTTCCGGTGCTCTGCCAAGCCCACGGATTGACGCCAGAACAGGTCGTGGCAATTGCGTCACACGACGGTGGAAAGCAGGCGCTCGAAACTGTGCAAAGACTCCTGCCCGTACTCTGCCAGGCACACGGTTTGACTCCCCAGCAGGTAGTGGCCATCGCGAGCAATAAGGGAGGAAAGCAGGCGCTTGAAACGGTGCAGAGACTTCTGCCCGTGCTTTGTCAAGCCCACGGGCTGACTCCGGAGCAGGTAGTGGCCATCGCCTCAAACAACGGAGGAAAGCAAGCTCTCGAAACCGTACAGAGGCTTCTCCCCGTGCTCTGTCAGGCCCACGGGTTGACCCCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＴＡＬＥ１３＋２８（ｒＮＴ番号Ｃ＋２８とも称される）（配列番号２２６）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＴＡＬＥ１３＋２８（配列番号２２７）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＴＡＬＥ１３＋３９（ｒＮＴ３、Ｃ＋３９とも称される）（配列番号２２８）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＴＡＬＥ１３＋３９（配列番号２２９）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGAGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＴＡＬＥ１３＋５０（配列番号２３０）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＴＡＬＥ１３＋５０（配列番号２３１）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＴＡＬＥ１３＋６３（配列番号２３２）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＴＡＬＥ１３＋６３（配列番号２３３）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＴＡＬＥ１３＋７９（配列番号２３４）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＴＡＬＥ１３＋７９（配列番号２３５）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＴＡＬＥ１３＋９５（配列番号２３６）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＴＡＬＥ１３＋９５（配列番号２３７）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

２．ＣＣＲ５研究に使用したＴＡＬＥＮ構築物及びタンパク質配列
コード配列に下線を引いた、完全なＴＡＬＥＮ構築物配列（配列番号２３８）：
GACTCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGAGCCAAGCTGACTAGCGTTTAAACTTAAGCTGATCCACTAGTCCAGTGTGGTGGAATTCGCCATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCTTGATAACTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTCGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATAGCACGTGCTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGGCTTTTGCTGGCCTTTTGCTCACATGTTCTT

それぞれのＣＣＲ−５で標的化されたＴＡＬＥＮの完全なタンパク質及びコード配列：
それぞれの発現構築物の配列を再生成するために、上述の構築物の下線を引いた領域を以下に示されるそれぞれのＣＤＳに置換する。
＞ＣＣＲ５Ｌ１６１（＋２８）（配列番号２３９）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１６１（＋２８）（配列番号２４０）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ１６１（＋６３）（配列番号２４１）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１６１（＋６３）（配列番号２４２）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ１６４（＋２８）（配列番号２４３）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１６４（＋２８）（配列番号２４４）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGACCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ１６４（＋６３）（配列番号２４５）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１６４（＋６３）（配列番号２４６）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ１６７（＋２８）（配列番号２４７）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１６７（＋２８）（配列番号２４８）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAGGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ１６７（＋６３）（配列番号２４９）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１６７（＋６３）（配列番号２５０）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAGGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ１７２（＋２８）（配列番号２５１）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１７２（＋２８）（配列番号２５２）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCTAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ１７２（＋６３）（配列番号２５３）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ１７２（＋６３）（配列番号２５４）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCTAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１７５（＋２８）（配列番号２５５）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１７５（＋２８）（配列番号２５６）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１７５（＋６３）（配列番号２５７）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１７５（＋６３）（配列番号２５８）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCTTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１７７（＋２８）（配列番号２５９）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１７７（＋２８）（配列番号２６０）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１７７（＋６３）（配列番号２６１）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１７７（＋６３）（配列番号２６２）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１７８（＋２８）（配列番号２６３）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１７８（＋２８）（配列番号２６４）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１７８（＋６３）（配列番号２６５）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１７８（＋６３）（配列番号２６６）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１８５（＋２８）（配列番号２６７）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１８５（＋２８）（配列番号２６８）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ１８５（＋６３）（配列番号２６９）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ１８５（＋６３）（配列番号２７０）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５３２（＋２８）（配列番号２７１）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５３２（＋２８）（配列番号２７２）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５３２（＋６３）（配列番号２７３）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５３２（＋６３）（配列番号２７４）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５３８（＋２８）（配列番号２７５）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５３８（＋２８）（配列番号２７６）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGACCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５３８（＋６３）（配列番号２７７）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５３８（＋６３）（配列番号２７８）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５４０（＋２８）（配列番号２７９）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５４０（＋２８）（配列番号２８０）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５４０（＋６３）（配列番号２８１）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５４０（＋６３）（配列番号２８２）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５４３（＋２８）（配列番号２８３）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５４３（＋２８）（配列番号２８４）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｌ５４３（＋６３）（配列番号２８５）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｌ５４３（＋６３）（配列番号２８６）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５４９（＋２８）（配列番号２８７）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５４９（＋２８）（配列番号２８８）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５４９（＋６３）（配列番号２８９）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５４９（＋６３）（配列番号２９０）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５５１（＋２８）（配列番号２９１）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQTLETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５５１（＋２８）（配列番号２９２）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAACATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５５１（＋６３）（配列番号２９３）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５５１（＋６３）（配列番号２９４）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５５７（＋２８）（配列番号２９５）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５５７（＋２８）（配列番号２９６）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５５７（＋６３）（配列番号２９７）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５５７（＋６３）（配列番号２９８）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５６０（＋２８）（配列番号２９９）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５６０（＋２８）（配列番号３００）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

＞ＣＣＲ５Ｒ５６０（＋６３）（配列番号３０１）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

＞ＣＣＲ５Ｒ５６０（＋６３）（配列番号３０２）
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT

ＣＣＲ５ドナー配列：
5’AGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAAGCTCAGAATTAACCCTCACTAAAGGGACTAGTCCTGCAGGTTTAAACGAATTCGCCCTTGATACTTATTAACCATACCTTGGAGGGGAAATCACACATGAAAAGTGTCATTTCTTTACTAATCATATTCATGTCTTTTCTCCCCATAGCAAGACAAAGACCTGTTTTAAACACATTTACAACCTATATGTTGCCTTGTACTAGGTAAAAAGTTGTACATTTCTGAAATAATTTTGGTATTTCTGTTCAGATCACTAAACTCAAGAATCAGCAATTCTCTGAGGCTTTCTTTTAAATATACATAAGGAACTTTCGGAGTGAAGGGAGAGTTTGTCAATAACTTGATGCATGTGAAGGGGAGATAAAAAGGTTGCTATTTTTCATCAACATATTTTGATTTGGCTTTCTATAATTGATGGGCTTAAAAGATCTAATCTACTTTAAACAGATGCCAAATAAATGGATGAATCTTAGACCCTCTATAACAGTAACTTCCTTTTAAAAAAGACCTCTCCCACCCCACCCCCAGCCCAGGCTGTGTATGAAAACTAAGCCATGTGCACAACTCTGACTGGGTCACCAGCCCACTTGAGTCCGTGTCACAAGCCCACAGATATTTCCTGCTCCCCAGTGGATCGGGTGTAAACTGAGCTTGCTCGCTCGGGAGCCTCTTGCTGGAAAATAGAACAGCATTTGCAGAAGCGTTTGGCAATGTGCTTTTGGAAGAAGACTAAGAGGTAGTTTCTGAACTTCTCCCCGACAAAGGCATAGATGATGGGGTTGATGCAGCAGTGCGTCATCCCAAGAGTCTCTGTCACCTGCATAGCTTGGTCCAACCTGTTAGAGCTACTGCAATTATTCAGGCCAAAGAATTCCTGGAAGGTGTTCAGGAGAAGGACAATGTTGTAGGGAGCCCAGAAGAGAAAATAAACAATCATGATGGTGAAGATAAGCCTCACAGCCCTGTGCCTCTTCTTCTCATTTCGACACCGAAGCAGAGTTTTTAGGATTCCCGAGTAGCAGATGACCATGACAAGCAGCGGCAGGACCAGCCCCAAGATGACTATCTTTAATGTCTGGAAATTCTTCCAGAATTGATACTGACTGTATGGAAAATGAGAGCTGCAGGTGTAATGAAGACCTTCTTTTTGAGATCTGGTAAAGATGATTCCTGGGAGAGACGCAAACACAGCCACCACCCAAGTGATCACACTTGTCACCACCCCAAAGGTGACCGTCCTGGCTTTTAAAGCAAACACAGCATGGACGACAGCCAGGTACCTATCGATTGTCAGGAGGATGATGAAGAAGATTCCAGAGAAGAAGCCTATAAAATAGAGCCCTGTCAAGAGTTGACACATTGTATTTCCAAAGTCCCACTGGGCGGCAGCATAGTGAGCCCAGAAGGGGACAGTAAGAAGGAAAAACAGGTCAGAGATGGCCAGGTTGAGCAGGTAGATGTCAGTCATGCTCTTCAGCCTTTTGCAGTTTTCTAGACGAGGCATCCAGTCCAGACGCCATCAGGGCATACTCACTGATCTAGATGAGGATGACCAGCATGTTGCCCACAAAACCAAAGATGAACACCAGTGAGTAGAGCGGAGGCAGGAGGCGGGCTGCGATTTGCTTCACATTGATTTTTTGGCAGGGCTCCGATGTATAATAATTGATGTCATAGATTGGACTTGACACTTGATAATCCATCTTGTTCCACCCTGTGCATAAATAAAAAGTGATCTTTTATAAAGTCCTAGAATGTATTTAGTTGCCCTCCATGAATGCAAACTGTTTTATACATCAATAGGTTTTTAATTGCCTACATAGATGTCTACATTGAATTAACTCTCTTTTTGGCCAAGCAATGAAGTTTTGTAGTGAAGGGAAGGTTTGCTGCTAGCTTCCCTGTCCACTAGATGGAGAGCTTGGCTCTGTTGGGGGAATTCATGAAAGCACCATCTCACCAAATAAAATCTTGTGCTCTATAGCACCATGGAGTGAATGAAGCTTTGACAACAATTAAGGGCGAATTCGCGGCCGCTAAATTCAATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTATACGTACGGCAGTTTAAGGTTTACACCTATAAAAGAGAGAGCCGTTATCGTCTGTTTGTGGATGTACAGAGTGATATTATTGACACGCCGGGGCGACGGATGGTGATCCCCCTGGCCAGTGCACGTCTGCTGTCAGATAAAGTCTCCCGTGAACTTTACCCGGTGGTGCATATCGGGGATGAAAGCTGGCGCATGATGACCACCGATATGGCCAGTGTGCCGGTCTCCGTTATCGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCAAAAACGCCATTAACCTGATGTTCTGGGGAATATAAATGTCAGGCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTCACGTAGAAAGCCAGTCCGCAGAAACGGTGCTGACCCCGGATGAATGTCAGCTACTGGGCTATCTGGACAAGGGAAAACGCAAGCGCAAAGAGAAAGCAGGTAGCTTGCAGTGGGCTTACATGGCGATAGCTAGACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTTGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAG3’(配列番号１７６）

３．遺伝子活性化研究に使用したＴＡＬＥ構築物及びタンパク質配列
コード配列に下線を引いた、完全なＴＡＬＥ構築物配列（配列番号３０３）：
TAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCTTAAGCTGATCCACTAGTCCAGTGTGGTGGAATTCGCTAGCGCCACCATGGCCCCCAAGAAGAAGAGGAAGGTGGGAATCGATGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAGTAAGCTTCTCGAGTCTAGCTAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCATCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGGGGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAATTCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAGGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGCGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAGCGGGACTCTGGGGTTCGAAATGACCGACCAAGCGACGCCCAACCTGCCATCACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAAT

遺伝子活性化研究に使用したそれぞれのＴＡＬＥの完全なタンパク質及びコード配列：
それぞれの発現構築物の配列を再生成するために、上述の構築物の下線を引いた領域を以下に示されるそれぞれのＣＤＳに置換する。

ＮＴ−Ｌ＋９５タンパク質が、ＳＶ４０由来の核局在化配列（ＮＬＳ）を含む一方で、ＮＴ−Ｌ＋２７８の核内輸送が、ＴＡＬＥＣ末端隣接領域³に存在する内因性局在化配列に依存することに留意する。

＞ＮＴ−Ｌ＋２７８ＶＰ１６（配列番号３０４）
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPGTPTAADLAASSTVMREQDEDPFAGAADDFPAFNEEELAWLMELLPQDRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK

＞ＮＴ−Ｌ＋２７８ＶＰ１６（配列番号３０５）
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG

＞ＮＴ−Ｌ＋９５ＶＰ１６（配列番号３０６）
MAPKKKRKVGIDGVPAAVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSGSRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK

＞ＮＴ−Ｌ＋９５ＶＰ１６（配列番号３０７）
ATGGCCCCCAAGAAGAAGAGGAAGGTGGGAATCGATGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCGGATCCCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG

＞ＴＡＬＥ１３＋２７８ＶＰ１６（配列番号３０８）
MAPKKKRKVGIDGVPAAVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPGTPTAADLAASSTVMREQDEDPFAGAADDFPAFNEEELAWLMELLPQDRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK

＞ＴＡＬＥ１３＋２７８ＶＰ１６（配列番号３０９）
ATGGCCCCCAAGAAGAAGAGGAAGGTGGGAATCGATGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG

＞ＴＡＬＥ１３＋１３３ＶＰ１６（配列番号３１０）
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGGSGHRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK

＞ＴＡＬＥ１３＋１３３ＶＰ１６（配列番号３１１）
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGTGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTGACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCGGGGGGATCCGGCCACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG

＞ＴＡＬＥ１３＋９５ＶＰ１６（配列番号３１２）
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSGSRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK

＞ＴＡＬＥ１３＋９５ＶＰ１６（配列番号３１３）
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCGGATCCCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG

＞ＴＡＬＥ１３＋２３ＶＰ１６（配列番号３１４）
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVAGSRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK

＞ＴＡＬＥ１３＋２３ＶＰ１６（配列番号３１５）
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCGGATCCCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG

＞ＴＡＬＥ１３△１−１３ＶＰ１６（配列番号３１６）
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPGTPTAADLAASSTVMREQDEDPFAGAADDFPAFNEEELAWLMELLPQDRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK

＞ＴＡＬＥ１３△１−１３ＶＰ１６（配列番号３１７）
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG

４．種々のＤＮＡ配列
図３７に説明される実験のために使用したドナー（配列番号３１８）
AGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAAGCTCAGAATTAACCCTCACTAAAGGGACTAGTCCTGCAGGTTTAAACGAATTCGCCCTTGATACTTATTAACCATACCTTGGAGGGGAAATCACACATGAAAAGTGTCATTTCTTTACTAATCATATTCATGTCTTTTCTCCCCATAGCAAGACAAAGACCTGTTTTAAACACATTTACAACCTATATGTTGCCTTGTACTAGGTAAAAAGTTGTACATTTCTGAAATAATTTTGGTATTTCTGTTCAGATCACTAAACTCAAGAATCAGCAATTCTCTGAGGCTTTCTTTTAAATATACATAAGGAACTTTCGGAGTGAAGGGAGAGTTTGTCAATAACTTGATGCATGTGAAGGGGAGATAAAAAGGTTGCTATTTTTCATCAACATATTTTGATTTGGCTTTCTATAATTGATGGGCTTAAAAGATCTAATCTACTTTAAACAGATGCCAAATAAATGGATGAATCTTAGACCCTCTATAACAGTAACTTCCTTTTAAAAAAGACCTCTCCCACCCCACCCCCAGCCCAGGCTGTGTATGAAAACTAAGCCATGTGCACAACTCTGACTGGGTCACCAGCCCACTTGAGTCCGTGTCACAAGCCCACAGATATTTCCTGCTCCCCAGTGGATCGGGTGTAAACTGAGCTTGCTCGCTCGGGAGCCTCTTGCTGGAAAATAGAACAGCATTTGCAGAAGCGTTTGGCAATGTGCTTTTGGAAGAAGACTAAGAGGTAGTTTCTGAACTTCTCCCCGACAAAGGCATAGATGATGGGGTTGATGCAGCAGTGCGTCATCCCAAGAGTCTCTGTCACCTGCATAGCTTGGTCCAACCTGTTAGAGCTACTGCAATTATTCAGGCCAAAGAATTCCTGGAAGGTGTTCAGGAGAAGGACAATGTTGTAGGGAGCCCAGAAGAGAAAATAAACAATCATGATGGTGAAGATAAGCCTCACAGCCCTGTGCCTCTTCTTCTCATTTCGACACCGAAGCAGAGTTTTTAGGATTCCCGAGTAGCAGATGACCATGACAAGCAGCGGCAGGACCAGCCCCAAGATGACTATCTTTAATGTCTGGAAATTCTTCCAGAATTGATACTGACTGTATGGAAAATGAGAGCTGCAGGTGTAATGAAGACCTTCTTTTTGAGATCTGGTAAAGATGATTCCTGGGAGAGACGCAAACACAGCCACCACCCAAGTGATCACACTTGTCACCACCCCAAAGGTGACCGTCCTGGCTTTTAAAGCAAACACAGCATGGACGACAGCCAGGTACCTATCGATTGTCAGGAGGATGATGAAGAAGATTCCAGAGAAGAAGCCTATAAAATAGAGCCCTGTCAAGAGTTGACACATTGTATTTCCAAAGTCCCACTGGGCGGCAGCATAGTGAGCCCAGAAGGGGACAGTAAGAAGGAAAAACAGGTCAGAGATGGCCAGGTTGAGCAGGTAGATGTCAGTCATGCTCTTCAGCCTTTTGCAGTTTTCTAGACGAGGCATCCAGTCCAGACGCCATCAGGGCATACTCACTGATCTAGATGAGGATGACCAGCATGTTGCCCACAAAACCAAAGATGAACACCAGTGAGTAGAGCGGAGGCAGGAGGCGGGCTGCGATTTGCTTCACATTGATTTTTTGGCAGGGCTCCGATGTATAATAATTGATGTCATAGATTGGACTTGACACTTGATAATCCATCTTGTTCCACCCTGTGCATAAATAAAAAGTGATCTTTTATAAAGTCCTAGAATGTATTTAGTTGCCCTCCATGAATGCAAACTGTTTTATACATCAATAGGTTTTTAATTGCCTACATAGATGTCTACATTGAATTAACTCTCTTTTTGGCCAAGCAATGAAGTTTTGTAGTGAAGGGAAGGTTTGCTGCTAGCTTCCCTGTCCACTAGATGGAGAGCTTGGCTCTGTTGGGGGAATTCATGAAAGCACCATCTCACCAAATAAAATCTTGTGCTCTATAGCACCATGGAGTGAATGAAGCTTTGACAACAATTAAGGGCGAATTCGCGGCCGCTAAATTCAATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTATACGTACGGCAGTTTAAGGTTTACACCTATAAAAGAGAGAGCCGTTATCGTCTGTTTGTGGATGTACAGAGTGATATTATTGACACGCCGGGGCGACGGATGGTGATCCCCCTGGCCAGTGCACGTCTGCTGTCAGATAAAGTCTCCCGTGAACTTTACCCGGTGGTGCATATCGGGGATGAAAGCTGGCGCATGATGACCACCGATATGGCCAGTGTGCCGGTCTCCGTTATCGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCAAAAACGCCATTAACCTGATGTTCTGGGGAATATAAATGTCAGGCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTCACGTAGAAAGCCAGTCCGCAGAAACGGTGCTGACCCCGGATGAATGTCAGCTACTGGGCTATCTGGACAAGGGAAAACGCAAGCGCAAAGAGAAAGCAGGTAGCTTGCAGTGGGCTTACATGGCGATAGCTAGACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTTGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAG

ＴＡＬＥ１３レポーター構築物（下線部分はＴＡＬＥ１３結合部位及びＳＶ４０プロモーター）（配列番号３１９）：
GGTACCGAGCTCTTACGCGTGCTAGTATAAATACCTTCTGCCTTACTAGTATAAATACCTTCTGCCTTGCTAGCTCGAGATCTGCGATCTGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATCGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTTGGCATTCCGGTACTGTTGGTAAAGCCACCATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAATTCTAGAGTCGGGGCGGCCGGCCGCTTCGAGCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTAAAATCGATAAGGATCCGTCGACCGATGCCCTTGAGAGCCTTCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCCGCACTTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCCCAAGCTACCATGATAAGTAAGTAATATTAAGGTACGGGAGGTACTTGGAGCGGCCGCAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGAATCGATAGTACTAACATACGCTCTCCATCAAAACAAAACGAAACAAAACAAACTAGCAAAATAGGCTGTCCCCAGTGCAAGTGCAGGTGCCAGAACATTTCTCTATCGATA

ＴＡＬＥ１３のＤＮＡ配列（配列番号３２０）：
GTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGTGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTGACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAG

ＴＡＬＥＶＥＧＦ−１及びＣＣＲ５−１のタンパク質及び遺伝子配列
＞ＶＥＧＦ−１（配列番号３２１）
VDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMS

＞ＶＥＧＦ−１（配列番号３２２）
GTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACGGAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCACATGATGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACGGTGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGC

＞ＣＣＲ５−１（配列番号３２３）
VDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNKGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMS

＞ＣＣＲ５−１（配列番号３２４）
GTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTAATAAAGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACGGAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCAACGGCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACGGTGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGC

ＡＡＶＳ１特異的ＴＡＬＥＮの遺伝子配列
１０１０７７ＯＲＦ（下線部分はＴＡＬＥ領域）（配列番号３２５）：
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

１０１０７９ＯＲＦ（下線部分はＴＡＬＥ領域）（配列番号３２６）：
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

ｂｅｎ−１特異的ＴＡＬＥＮＯＲＦの配列：
１０１３１８（配列番号３２７）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

１０１３２１（配列番号３２８）
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS

ｐＺＭｔ−１０１３８０（配列番号４４４）
ctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatacgcgtaccgctagccaggaagagtttgtagaaacgcaaaaaggccatccgtcaggatggccttctgcttagtttgatgcctggcagtttatggcgggcgtcctgcccgccaccctccgggccgttgcttcacaacgttcaaatccgctcccggcggatttgtcctactcaggagagcgttcaccgacaaacaacagataaaacgaaaggcccagtcttccgactgagcctttcgttttatttgatgcctggcagttccctactctcgcgttaacgctagcatggatgttttcccagtcacgacgttgtaaaacgacggccagtcttaagctcgggccccaaataatgattttattttgactgatagtgacctgttcgttgcaacaaattgatgagcaatgcttttttataatgccaactttgtacaaaaaagcaggctccgaattcgcccttttaattaatgcagtgcagcgtgacccggtcgtgcccctctctagagataatgagcattgcatgtctaagttataaaaaattaccacatattttttttgtcacacttgtttgaagtgcagtttatctatctttatacatatatttaaactttactctacgaataatataatctatagtactacaataatatcagtgttttagagaatcatataaatgaacagttagacatggtctaaaggacaattgagtattttgacaacaggactctacagttttatctttttagtgtgcatgtgttctcctttttttttgcaaatagcttcacctatataatacttcatccattttattagtacatccatttagggtttagggttaatggtttttatagactaatttttttagtacatctattttattctattttagcctctaaattaagaaaactaaaactctattttagtttttttatttaataatttagatataaaatagaataaaataaagtgactaaaaattaaacaaataccctttaagaaattaaaaaaactaaggaaacatttttcttgtttcgagtagataatgccagcctgttaaacgccgtcgacgagtctaacggacaccaaccagcgaaccagcagcgtcgcgtcgggccaagcgaagcagacggcacggcatctctgtcgctgcctctggacccctctcgagagttccgctccaccgttggacttgctccgctgtcggcatccagaaattgcgtggcggagcggcagacgtgagccggcacggcaggcggcctcctcctcctctcacggcaccggcagctacgggggattcctttcccaccgctccttcgctttcccttcctcgcccgccgtaataaatagacaccccctccacaccctctttccccaacctcgtgttgttcggagcgcacacacacacaaccagatctcccccaaatccacccgtcggcacctccgcttcaaggtacgccgctcgtcctccccccccccccctctctaccttctctagatcggcgttccggtccatggttagggcccggtagttctacttctgttcatgtttgtgttagatccgtgtttgtgttagatccgtgctgctagcgttcgtacacggatgcgacctgtacgtcagacacgttctgattgctaacttgccagtgtttctctttggggaatcctgggatggctctagccgttccgcagacgggatcgatttcatgattttttttgtttcgttgcatagggtttggtttgcccttttcctttatttcaatatatgccgtgcacttgtttgtcgggtcatcttttcatgcttttttttgtcttggttgtgatgatgtggtctggttgggcggtcgttctagatcggagtagaattctgtttcaaactacctggtggatttattaattttggatctgtatgtgtgtgccatacatattcatagttacgaattgaagatgatggatggaaatatcgatctaggataggtatacatgttgatgcgggttttactgatgcatatacagagatgctttttgttcgcttggttgtgatgatgtggtgtggttgggcggtcgttcattcgttctagatcggagtagaatactgtttcaaactacctggtgtatttattaattttggaactgtatgtgtgtgtcatacatcttcatagttacgagtttaagatggatggaaatatcgatctaggataggtatacatgttgatgtgggttttactgatgcatatacatgatggcatatgcagcatctattcatatgctctaaccttgagtacctatctattataataaacaagtatgttttataattattttgatcttgatatacttggatgatggcatatgcagcagctatatgtggatttttttagccctgccttcatacgctatttatttgcttggtactgtttcttttgtcgatgctcaccctgttgtttggtgttacttctgcaggactagtccagtgtggtggaattcgccatggactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaagatggcccccaagaagaagaggaaggtgggcattcacggggtacctatggtggacttgaggacactcggttattcgcaacagcaacaggagaaaatcaagcctaaggtcaggagcaccgtcgcgcaacaccacgaggcgcttgtggggcatggcttcactcatgcgcatattgtcgcgctttcacagcaccctgcggcgcttgggacggtggctgtcaaataccaagatatgattgcggccctgcccgaagccacgcacgaggcaattgtaggggtcggtaaacagtggtcgggagcgcgagcacttgaggcgctgctgactgtggcgggtgagcttagggggcctccgctccagctcgacaccgggcagctgctgaagatcgcgaagagagggggagtaacagcggtagaggcagtgcacgcctggcgcaatgcgctcaccggggcccccttgaacctgaccccagaccaggtagtcgcaatcgcgtcgcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggagcaagtcgtggccattgcatcacatgacggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgagcaatgggggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgcctccaatattggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatggactcaccccagaccaggtagtcgcaatcgcgtcgcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggatcaagtcgtggccattgcaaataataacggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgagcaacatcggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgcctcccacgacggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatgggctgaccccagaccaggtagtcgcaatcgccaacaataacgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggagcaagtcgtggccattgcatcaaatatcggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgaataacaatggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgccaacaacaacggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatggtttgaccccagaccaggtagtcgcaatcgcgtcgaacattgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggatcaagtcgtggccattgcaaataataacggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgaataacaatggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgcctccaatattggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatggcctgacacccgaacaggtggtcgccattgctagcaacgggggaggacggccagccttggagtccatcgtagcccaattgtccaggcccgatcccgcgttggctgcgttaacgaatgaccatctggtggcgttggcatgtcttggtggacgacccgcgctcgatgcagtcaaaaagggtctgcctcatgctcccgcattgatcaaaagaaccaaccggcggattcccgagagaacttcccatcgagtcgcgggatcccagctggttaaatcagaactcgaagaaaaaaagagcgagctgcggcataaactcaaatatgtccctcatgagtacatagaactgattgaaatcgcccgcaattccacccaggatcggattcttgaaatgaaagtgatggaattttttatgaaagtttacggctatcgcgggaagcaccttggggggtcgcggaagccggacggtgctatttacactgtcggttccccgatcgattatggcgtaattgttgacacgaaagcatattcgggtgggtataatcttcctattggtcaggctgatgagatgcagcggtacgttgaagagaatcagacgcggaacaagcatattaacccaaatgagtggtggaaggtgtatccatcatcggtcaccgaatttaagttcttgtttgtgtcgggccactttaaggggaactacaaggcccaacttaccaggttgaatcacataaccaactgtaacggagctgttctgtcagtagaagagctgttgataggcggggaaatgattaaagcaggtacattaacgttggaggaagtacgccgcaagtttaataacggcgagattaactttagatctgagacctgataaacaaacacacggtctcctcgagctcgcagatcgttcaacatctggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatccgataagcttaagggcgaattcgacccagctttcttgtacaaagttggcattataaaaaataattgctcatcaatttgttgcaacgaacaggtcactatcagtcaaaataaaatcattatttgccatccagctgatatcccctatagtgagtcgtattacatggtcatagctgtttcctggcagctctggcccgtgtctcaaaatctctgatgttacattgcacaagataaaaatatatcatcatgcctcctctagaccagccaggacagaaatgcctcgacttcgctgctgcccaaggttgccgggtgacgcacaccgtggaaacggatgaaggcacgaacccagtggacataagcctgttcggttcgtaagctgtaatgcaagtagcgtatgcgctcacgcaactggtccagaaccttgaccgaacgcagcggtggtaacggcgcagtggcggttttcatggcttgttatgactgtttttttggggtacagtctatgcctcgggcatccaagcagcaagcgcgttacgccgtgggtcgatgtttgatgttatggagcagcaacgatgttacgcagcagggcagtcgccctaaaacaaagttaaacatcatgagggaagcggtgatcgccgaagtatcgactcaactatcagaggtagttggcgtcatcgagcgccatctcgaaccgacgttgctggccgtacatttgtacggctccgcagtggatggcggcctgaagccacacagtgatattgatttgctggttacggtgaccgtaaggcttgatgaaacaacgcggcgagctttgatcaacgaccttttggaaacttcggcttcccctggagagagcgagattctccgcgctgtagaagtcaccattgttgtgcacgacgacatcattccgtggcgttatccagctaagcgcgaactgcaatttggagaatggcagcgcaatgacattcttgcaggtatcttcgagccagccacgatcgacattgatctggctatcttgctgacaaaagcaagagaacatagcgttgccttggtaggtccagcggcggaggaactctttgatccggttcctgaacaggatctatttgaggcgctaaatgaaaccttaacgctatggaactcgccgcccgactgggctggcgatgagcgaaatgtagtgcttacgttgtcccgcatttggtacagcgcagtaaccggcaaaatcgcgccgaaggatgtcgctgccgactgggcaatggagcgcctgccggcccagtatcagcccgtcatacttgaagctagacaggcttatcttggacaagaagaagatcgcttggcctcgcgcgcagatcagttggaagaatttgtccactacgtgaaaggcgagatcaccaaggtagtcggcaaataaccctcgagccacccatgaccaaaatcccttaacgtgagttacgcgtcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgtt

Claims

単離された非自然発生ＤＮＡ結合ポリペプチドであって、
少なくとも１つのＴＡＬＥ反復単位；
Ｎキャップポリペプチド；及び
Ｃキャップポリペプチド
を含み、前記Ｃキャップポリペプチドは、ＴＡＬＥタンパク質のフラグメントを含む、ポリペプチド。
少なくとも１つのＴＡＬＥ反復単位は、非定型の反復可変ジ残基（ｒｅｐｅａｔｖａｒｉａｂｌｅｄｉ−ｒｅｓｉｄｕｅ）（ＲＶＤ）を含む、請求項１に記載の単離されたポリペプチド。
前記タンパク質は、表２７に示される非定型のＲＶＤを含む、請求項２に記載のポリペプチド。
前記Ｃキャップポリペプチドは、約２３０アミノ酸長未満である、請求項１〜３のいずれかに記載のポリペプチド。
前記Ｃキャップは、ＴＡＬＥ反復ドメインを含む、請求項１〜５のいずれかに記載のポリペプチド。
請求項１〜５のいずれかに記載のポリペプチドと、少なくとも１つの機能ドメインと、を含む、融合タンパク質。
前記機能ドメインは、転写活性化因子又は転写抑制因子である、請求項６に記載の融合タンパク質。
前記機能ドメインは、ヌクレアーゼを含む、請求項７に記載の融合タンパク質。
前記ヌクレアーゼは、ＩＩＳ型エンドヌクレアーゼからの少なくとも１つの切断ドメイン又は切断半ドメインを含む、請求項８に記載の融合タンパク質。
請求項１〜５のいずれかに記載のポリペプチド又は請求項６〜９のいずれかに記載の融合タンパク質をコードする、ポリヌクレオチド。
請求項１〜５のいずれかに記載のポリペプチド、請求項６〜９のいずれかに記載の融合タンパク質、又は請求項１０に記載のポリヌクレオチドを含む、宿主細胞。
請求項１〜５のいずれかに記載のポリペプチド、請求項６〜９のいずれかに記載の融合タンパク質、又は請求項１０に記載のポリヌクレオチドを含む、薬学的組成物。
細胞内の内在性遺伝子の発現を調節する方法であって、
前記細胞内に、請求項６〜９のいずれかに記載の融合タンパク質又は前記融合タンパク質をコードするポリヌクレオチドを導入することを含み、前記融合タンパク質は、前記内在性遺伝子内の標的部位に結合するＴＡＬＥ反復ドメインを含み、さらに前記内在性遺伝子の発現が調節される、方法。
前記調節は、遺伝子活性化を含む、請求項１３に記載の方法。
前記調節は、遺伝子抑制又は不活性化を含む、請求項１３に記載の方法。
前記融合タンパク質は、切断ドメイン又は切断半ドメインを含み、前記内在性遺伝子は、切断によって不活性化される、請求項１５に記載の方法。
不活性化は、非相同末端結合（ＮＨＥＪ）を介して生じる、請求項１６に記載の方法。
細胞のゲノム内の目的とする領域を修飾する方法であって、
前記細胞に、請求項８若しくは９に記載の少なくとも１つの融合タンパク質又は前記融合タンパク質をコードするポリヌクレオチドを導入することを含み、前記融合タンパク質は、前記細胞のゲノム内で標的部位に結合するＴＡＬＥ反復ドメインを含み、前記融合タンパク質は、前記目的とする領域内で前記ゲノムを切断する、方法。
前記修飾することは、前記目的とする領域に欠失を導入することを含む、請求項１８に記載の方法。
前記修飾することは、外因性核酸を前記目的とする領域に導入することを含み、前記方法は、前記外因性核酸を前記細胞に導入することをさらに含み、前記外因性核酸は、相同組換え又はＮＨＥＪ媒介末端捕捉によって前記目的とする領域に組み込まれる、請求項１８に記載の方法。
前記細胞は、植物細胞、動物細胞、魚細胞、及び酵母細胞からなる群から選択される真核細胞である、請求項１３〜２０のいずれかに記載の方法。