JP2023018093A

JP2023018093A - 標的核酸の改変のための改善された方法

Info

Publication number: JP2023018093A
Application number: JP2022187824A
Authority: JP
Inventors: ダブリュノイテボーム，レーンデルト; W Neuteboom Leendert; エーマクエルバー，ジョン; A Mcelver John; ピノバロッコ，ローサデ; Rosa De Pinho Barroco; ワイルド，クリスデ; De Wilde Chris; ファビアンフェレ，マックス; Fabian FELLE Max
Original assignee: BASF Plant Science Co GmbH
Current assignee: BASF Plant Science Co GmbH
Priority date: 2016-04-29
Filing date: 2022-11-24
Publication date: 2023-02-07
Also published as: EP4166661A1; JP7184648B2; DK3448990T3; KR20220032126A; KR102370675B1; CN109072207A; AU2022100158A4; EP3448990B1; EP3868880A1; KR20230038804A; EP4166660A1; KR102506185B1; MX2021009235A; IL262409A; US20230024869A1; BR112018068934A2; CL2018003074A1; AU2017256517B2; US20230183686A1; EP4166662A1

Abstract

【課題】標的核酸を改変するための方法を提供する。
【解決手段】細胞中の標的核酸(標的NA)分子を改変するための方法であって、a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び、b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び、c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び、d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって、e.相同組換えが起きた1つ以上の細胞を単離する工程を含み、fuNAはRNAからなる、方法を提供する。
【選択図】図１

Description

本発明は、標的核酸の改変のための改善された方法に関する。

CRISPR(クラスター化され、規則的に間隔を置いて配置された短いパリンドローム反復配列)システムは、当初、連鎖球菌属(Streptococcus)に属する細菌の適応防御機構として同定された(WO2007/025097)。これらの細菌性CRISPRシステムは、侵入ウイルスのDNA内に存在する相補的配列の分解を指向する切断タンパク質と複合したガイドRNA(gRNA)に依存する。CRISPR/Casシステムの最初に同定されたタンパク質であるCas9は、2つの非コードRNA:crRNA及びトランス活性化crRNA(tracrRNA)の複合体によってPAM(プロトスペーサー隣接モチーフ)配列モチーフに隣接するDNA標的配列にガイドされる大きなモノマーDNAヌクレアーゼである。その後、crRNAをtracrRNAと融合させて作製した合成RNAキメラ(単一ガイドRNA又はgRNA)が同様に機能的であることが示された(Jinekら、2012)。

いくつかの研究グループが、CRISPR切断特性は、これまでにない容易さで、ほとんど全ての生物のゲノム中の遺伝子を破壊するために使用することができることを見出している(Mali Pら(2013) Science 339(6121):819～823頁; Cong Lら(2013) Science 339(6121))。最近、CRISPRを強力な遺伝子編集ツールに変換して、ほぼ任意の部位においてほとんど任意の所望の配列でゲノム編集を可能にする修復のためのテンプレートが得られることが明らかになった(WO2014/150624、WO2014/204728)。

遺伝子標的化とは、相同組換え(HR)による核酸の欠失、挿入又は置き換えによる部位特異的遺伝子改変を指す。標的化効率は、ゲノム標的中の二本鎖切断(DSB)によって高く促進される。また、染色体DNAのDSB後の相同性の直接的な存在は、相同組換えに有利な非相同末端結合(NHEJ)修復をほぼ排除するようである。

本発明は、核酸改変ポリペプチド(少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む融合核酸(fuNA)分子)と相互作用するHR修復のための適切なドナーに融合されたガイド核酸を提供する。ヌクレアーゼ切断部位に隣接する標的DNAに対する相同性を有するドナー核酸の送達を改善するために、ドナー核酸(doNA)がCRISPR成分に共有結合により連結される遺伝子標的化戦略が提示される。このように、遺伝子編集複合体は、必要な認識及び切断ツールだけでなく、改変のための鋳型も含む。ガイド核酸(gNA)によって認識されると、ヌクレアーゼは標的領域を切断し、入ってくるドナーの即時かつ同時の存在はすると、HRプロセスを促進し、そのことにより遺伝子修復効力が増加する。

多くの微生物系は、効率的なNHEJシステムを欠いている[Standage-Beier K、Zhang Q、Wang X (2015) Targeted Large-Scale Deletion of Bacterial Genomes Using CRISPR-Nickases. ACS Synth Biol. 4(11): 1217～1225頁]。例えば、バイオエネルギー研究にとって重要なクロストリジウム・セルロリティクム(Clostridium cellulolyticum)は、CRISPR/Cas9を用いて容易に工学的に操作することができず[Xu T、Li Y、Shi Z、Hemme CL、Li Y、Zhu Y、Van Nostrand JD、He Z、Zhou J (2015) Efficient Genome Editing in Clostridium cellulolyticum via CRISPR-Cas9 Nickase. Appl Environ Microbiol. 81(13):4423～31頁]、DSBを導入して遺伝子をノックアウトする試みは細胞死をもたらす。別の例は、DSB修復についての相同組換え(HR)にも依存する大腸菌(Escherichia coli)である。このような生物におけるゲノム編集についての現在の技術は、CRISPR/Cas9-ベースのニッカーゼの使用と、それに続く非融合核酸ドナーを介した非効率的な修復、ヌクレアーゼ作用と協調するCRISPR/Casの誘導発現、及びカスタムDNA配列に対応する柔軟性をもたない核酸ドナー又はリコンビナーゼの導入に焦点を合わせている。

fuNA分子を含むCRISPR/Cas又はCRISPR/Cas様システムの提供及び/又は適用であるFusionCRISPR技術の適用により、以前はハイスループット標的化を受けにくかった多種多様な微生物種におけるノックアウトの作製が単純化される。二本鎖切断(DSB)の誘導時に迅速にドナー核酸を提供することにより、HR修復機構は、切断を付随する鋳型に首尾よくライゲーションすることになる。FusionCRISPRの導入は、ニッキングバージョンのCRISPR/Cas9、リコンビナーゼ又は任意の他の目的の(トランス)遺伝子の導入のために他の方法で使用される一般的な技術を用いて行われる。これらの技術には、プラスミドのエレクトロポレーション/熱ショック、ウイルス形質導入及びコンジュゲーションが含まれるが、これらに限定されない。

効率的なNHEJを有する生物中の遺伝子は、CRISPR/Cas9を導入することによってノックアウトすることができる(ここでガイドRNAは、(1)標的遺伝子とマッチするスペーサー(2)～99ヌクレオチドの典型的な長さを有する正しいガイドRNAフォールディングのための必須配列(tracrRNA:単一のガイドRNA(sgRNA)に共通して組み合わされたcrRNA)からなる)一方で、DSB感受性微生物におけるノックアウトは、以下の組成:(1)スペーサー(2)正しい二次構造のための必須配列(3)標的とマッチする少なくとも15ヌクレオチド(4)第1の標的とマッチする第一の少なくとも15ヌクレオチドから1つ以上の塩基下流の標的とマッチする少なくとも15ヌクレオチド、をもたらすRNAの単純な適応によって達成することができる。ノックアウトFusionCRISPRカセットを表す2つの相補的なssDNAオリゴヌクレオチドは、任意のオリゴ合成会社から商業的に容易に購入することができる。或いは、それはdsDNAとして合成することができる。FusionCRISPRノックアウトカセットのクローニングは、タイプIIS制限酵素を有する通常のCRISPRカセット中の意図した標的のための20ヌクレオチドスペーサーのクローニングのための最も一般的な方法と同じように進めることができる。したがって、FusionCRISPRによる制御された遺伝子ノックアウトのアクセス、柔軟性及び使い易さは、通常のCRISPR/Cas9に匹敵し、本発明は、ハイスループットノックアウトをNHEJが非効率的又は存在しない標的種にまで拡張する。

FusionCRISPRは、任意の生物のノックインにも使用できる。標準導入技術及び標準発現ビヒクル、例えば単純なプラスミドをを用いて、選択マーカーをノックインすることができる。これは、選択の容易さを提供しながらも、内因性遺伝子を遮断しノックアウトすることができる。

ヒト及び他の細胞におけるゲノム規模のノックアウトは、疾患、薬物応答及び正常な生物学的プロセスに関与する遺伝子の発見及び疾患モデルの作製を可能にする[Shalem O、Sanjana NE、Hartenian E、Shi X、Scott DA、Mikkelsen TS、Heckl D、Ebert BL、Root DE、Doench JG、Zhang F (2014) Genome-scale CRISPR-Cas9 knockout screening in human cells. Science; 343(6166):84～7頁]。ノックアウトは、典型的には、特定の標的のためのCRISPR/Cas9の導入及びNHEJに依存して問題の遺伝子について「ヌル」を作製することによって生成される。3つの主要な問題がこの方法において生じる:(1)NHEJ修復がフレームシフトをもたらさない(又は別の下流の開始コドンが使用されて切断された遺伝子産物が生じる)ため、ノックアウトがしばしば作製されない、(2)結果、すなわち正確な一次DNA配列が知られておらず、各DNA改変「事象」について決定する必要があり、費用と時間がかかる、(3)二倍体又は倍数体生物において、各染色体上のNHEJ修復は別々に起き、最初に全ての利用可能な「基質」がうまく標的化を達成したとしても、複雑な分子分析及び/又は一倍体モデルシステムへの強制的な切り替えを招く[Wade M (2015) High-throughput silencing using the CRISPR-Cas9 system:A review of the benefits and challenges. Journal of Biomolecular Screening、第20巻(8):1027～39頁]。FusionCRISPRは、上記のように欠失の制御が可能であり、予測可能な結果をもたらす。二倍体及び倍数体細胞系では、各染色体上に導入された任意の改変の大部分は同一である。欠失は、別の転写の可能性が低くなるように十分に大きく設計することができ、欠失を3で割ることができない数の塩基からなるように設計することにより、単に短いストレッチのアミノ酸を欠損した機能的なタンパク質がなお作製される危険を排除することとなる。

任意の細胞システムにおけるノックアウトを制御するために設計されたFusionCRISPR構成の導入方法は、ノックアウトの作製のためのCRISPR/Cas9の導入とそれに続くNHEJ修復に使用される方法と同一である。これには、昆虫細胞のバキュロウイルス発現システムに対するヒト細胞のためのAAV及びレンチウイルスベクターの使用が含まれるが、これに限定されない。現在の方法へのさらなる適応は、上記のようなガイドRNAの短い伸長以外には、必要ではない。

ゲノム編集は、様々な遺伝的障害を治療するために使用することができる。多くの遺伝的障害は、必要な補正を含有する補正核酸鋳型と共に部位特異的ヌクレアーゼを提供することによって潜在的に補正され得る点突然変異を含む。1つの例は、β-グロビン遺伝子の6番目のコドンにおける単一のDNA塩基変異(A>T)から生じる鎌状赤血球疾患である[Li C、Ding L、Sun CW、Wu LC、Zhou D、Pawlik KM、Khodadadi-Jamayran A、Westin E、Goldman FD、Townes TM(2016)Novel HDAd/EBV Reprogramming Vector and Highly Efficient Ad/CRISPR-Cas Sickle Cell Disease Gene Correction. Sci Rep. 6:30422]。ヌクレアーゼ及び補正鋳型を別々に提供することによる細胞の変異の補正は、しばしば、非協調的な最初のDNA切断及びHDR修復のための補正鋳型の局所的な到達をもたらす。時間的/空間的強調の欠如を補うために、ヌクレアーゼ及び補正鋳型の濃度を比較的高くする必要がある。より高いヌクレアーゼ濃度は、否定的結果(患者のリスクがより高い、及び/又は分子分析におけるコストがより高い)を伴うより高いオフターゲット切断をもたらす可能性がある。FusionCRISPRははるかに低い濃度で正しい遺伝子補正を達成する。FusionCRISPRを適用する方法は、当技術分野における現在の標準と同一であり[Maeder ML、Gersbach CA (2016) Genome-editing Technologies for Gene and Cell Therapy. Mol Ther. 24(3):430～46頁]、唯一の相違点は所望の補正を含むわずかに長いsgRNAである。

FusionCRISPRは、種々の異なる生物における種々の酵素の基質又は生成物の特異性を変えるために使用することができる。例えば、単一のアミノ酸は、トリテルペンシンターゼ基質及び種々の植物種における産物特異性の主要な決定因子であることが見出されている[Salmon M、Thimmappa RB、Minto RE、Melton RE、Hughes RK、O'Maille PE、Hemmings AM、Osbourn A (2016) A conserved amino acid residue critical for product and substrate specificity in plant triterpene synthases. Proc Natl Acad Sci U S A. 113(30):E4407-14]。トリテルペンは、薬学及びバイオテクノロジーにおける用途を有する天然産物の多様な群であり、産物の特異性に影響を及ぼす能力は、目的の植物における新規の生体分子又はより多量の生体分子の合成への扉を開く。FusionCRISPRは、特異性に影響する酵素の基質ポケット又は他のドメインにおける重要なアミノ酸の改変を可能にする。所望のアミノ酸は、ゲノム中で置き換える必要のあるコドンに隣接する配列と相同性を有するヌクレオチド配列が隣接する融合鋳型に対応するコドンを含めることによって導入される。FusionCRISPR構築物の導入の一例は、T-DNAが選択マーカーを含むアグロバクテリウム媒介T-DNA形質転換による、(1)RNAポリメラーゼIIIプロモーター、(2)意図した標的コドン又はそれに隣接する配列にマッチするスペーサー(最も近いPAMを見つける)、(3)ガイドの正しい二次構造のための必須配列、(4)切断に隣接する一つの領域に一致するホモロジーアーム、(5)酵素の特異性に影響を及ぼすアミノ酸にマッチする新規コドン、(6)切断の反対側のホモロジーアーム、及び(7)ターミネーターのそれぞれからなる強力なプロモーター及びFusionCRISPR構築物によって駆動されるCas9である。カットされる場所によって、ドナーにPAM配列が有ることを避けるためにサイレント突然変異を含ませなければならないかもしれない。ホモロジーアーム、意図された変化及び意図された変化の間の配列は、ドナーの継ぎ目のない取り込みのために連続している。選択可能なマーカーは、安定して組み込まれたT-DNAを有する植物細胞を得るために使用される。これらの細胞では、形質転換植物の維持及び再生を通して、FusionCRISPR成分は、意図された標的でゲノムを変更する機会を有する。これらの変更によって生殖細胞系へと進むことができ、T-DNAの新規な内因性配列及び分離について次の世代の実生をスクリーニングすることができる。

FusionCRISPRにより、任意の生物においてエピトープ又は他のタグを内因性遺伝子に挿入することが可能となる。タグは、細胞レベル及び細胞内レベルでの内因性遺伝子産物の追跡、タンパク質-タンパク質相互作用の同定、ChIP及び他の分子相互作用並びにタンパク質精製のために使用することができる。ほとんどの応用は、経路の発見と薬物標的の同定となる。FusionCRISPR構築物は、置換の導入のため、上記と同様な相同性のストレッチ間のペイロードとしてタグをコードする核酸を有することになる。DNAとしての又は一時的なFusionCRISPRの導入は、目的の生物における通常のCRISPR/Cas9に現在使用されているものと同じプロトコールに従う。

本発明者らの酵母実験は、FusionCRISPRのペイロードがヌクレアーゼの完全な機能に影響を与えずに少なくとも731ヌクレオチドであり得ることを示した。この配列又は潜在的により大きいサイズの配列は、強力なプロモーター又は天然プロモーターと比較して異なる組織又は環境キュー（cue）特異的活性を有するプロモーターを含むことができる。FusionCRISPRは、内因性プロモーターに潜在的にとって代わることができ、上方調節を含む遺伝子調節の代替法が可能となる。

WO2007/025097

Jinekら、2012 Mali Pら(2013) Science 339(6121):819～823頁 Cong Lら(2013) Science 339(6121) Standage-Beier K、Zhang Q、Wang X (2015) ACS Synth Biol. 4(11): 1217～1225頁 Xu T、Li Y、Shi Z、Hemme CL、Li Y、Zhu Y、Van Nostrand JD、He Z、Zhou J (2015) Appl Environ Microbiol. 81(13):4423～31頁 Shalem O、Sanjana NE、Hartenian E、Shi X、Scott DA、Mikkelsen TS、Heckl D、Ebert BL、Root DE、Doench JG、Zhang F (2014) Science; 343(6166):84～7頁 Wade M (2015) Journal of Biomolecular Screening、第20巻(8):1027～39頁 Li C、Ding L、Sun CW、Wu LC、Zhou D、Pawlik KM、Khodadadi-Jamayran A、Westin E、Goldman FD、Townes TM(2016) Sci Rep. 6:30422 Maeder ML、Gersbach CA (2016) Mol Ther. 24(3):430～46頁 Salmon M、Thimmappa RB、Minto RE、Melton RE、Hughes RK、O'Maille PE、Hemmings AM、Osbourn A (2016) Proc Natl Acad Sci U S A. 113(30):E4407-14

本発明の1つの目的は、CRISPR/Cas DNA修復システム又はCRISPR/Cas様DNA修復システムの適用を単純化することである。

本発明のさらなる目的は、DNA切断修復中の標的核酸における相同組換えの効率を高めることである。

驚くべきことに、これは、ドナー核酸分子及びガイド核酸分子を共有結合させることにより達成され、後者はCRISPR/Cas DNA修復システム又はCRISPR/Cas様DNA修復システムの要素として部位特異的核酸改変ポリペプチドと相互作用する。

本発明の一実施形態は、細胞又は組成物中の標的核酸(標的NA)分子を改変するための方法であって、以下の工程
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞又は組成物に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞又は組成物に導入する工程、及び
d.前記1つ以上の細胞又は組成物を、前記1つ以上の細胞又は組成物において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起こった1つ以上の細胞を単離する工程を含む方法である。

本発明による融合核酸分子の様々な好ましい構造を図1～12に示す。最も好ましい構造を図1に示す。

標的核酸は、導入される核酸分子が標的核酸に対して異種である核酸分子を標的核酸に導入することによって改変され得る。ドナー核酸分子のホモロジーアーム1とホモロジーアーム2との間の配列は、この場合、標的核酸に導入されることが想定され、ホモロジーアームに相補的である標的核酸内の領域の間には存在しない核酸分子を含む。

標的核酸はまた、標的核酸から少なくとも1塩基を欠失させることによって改変させてもよい。この場合、ドナー核酸分子のホモロジーアーム1とホモロジーアーム2との間の配列は、標的核酸と比較して少なくとも1塩基を欠く標的核酸分子に相補的な配列を含む。

標的核酸は、標的核酸の少なくとも1塩基を標的核酸と異種の1つ以上の塩基で置換することによってさらに改変されてもよい。この場合、ドナー核酸のホモロジーアーム1と2との間の配列は、標的核酸中の相補領域と比較して少なくとも1つのミスマッチを含む。

標的核酸は、正しい標的部位の同定及び結合のためにいくつかの部位特異的核酸改変ポリペプチドに必要となる、標的核酸分子中の標的配列に隣接する「プロトスペーサー隣接モチーフ」(PAM)配列を含んでもよい。PAMの配列は、種々の部位特異的核酸改変ポリペプチドに特異的であり(Doudna及びCharpentier、2014、Science 346(6213):1258096)、当業者に公知である。

本発明の方法は、好ましくは、生存細胞における標的核酸改変に適用されるが、インビトロシステムで適用されてもよい。

標的核酸分子は、RNA又はDNAであってもよく、一本鎖又は二本鎖であってもよい。好ましくは、標的核酸分子はDNAであり、より好ましくは、標的核酸分子は二本鎖DNAである。

部位特異的核酸改変ポリペプチドは、ポリペプチドとして細胞又は組成物に導入されるか、又は前記部位特異的核酸改変ポリペプチドをコードするRNA分子の導入によるか又は前記部位特異的核酸改変ポリペプチドを発現する発現構築物の導入によって導入されてもよく、ここで、発現構築物は、前記部位特異的核酸改変ポリペプチドをコードする遺伝子に機能的に連結されたそれぞれの細胞又は組成物において機能的なプロモーターを含む。このような部位特異的核酸改変ポリペプチドの例を表1に示す。さらに、そのような部位特異的核酸改変ポリペプチドの機能的等価物を本発明の方法に用いることができる。

部位特異的核酸改変ポリペプチドは、二本鎖核酸切断機能を有していてもよく、又は二本鎖核酸分子の一本鎖のみをカットするニッカーゼ機能を有していてもよい。部位特異的核酸改変ポリペプチドの核酸制限又はニッカーゼ能力もまた不活性化されてもよく、組換え部位特異的核酸改変ポリペプチドは、FokIのDNA制限領域又はホーミングエンドヌクレアーゼのような他の官能基に連結されてもよい。そのような組換え部位特異的核酸改変ポリペプチドは、例えばTsaiら(2014;Nat Biotechnol. 2014 32(6):569～76頁)又はGuilingerら(2014;Nat Biotechnol. 2014 32(6):577-82頁)に記載されている。

gNA分子は、標的NA分子に対して100%相補的な少なくとも12塩基を含むスペーサー核酸(スペーサーNA)分子を含む。好ましくは、標的NA分子に相補的な少なくとも13塩基、少なくとも14塩基又は少なくとも15塩基を含む。より好ましくは、標的NA分子に相補的な少なくとも16塩基、少なくとも17塩基又は少なくとも18塩基を含む。さらにより好ましくは、標的NAに相補的な少なくとも19塩基又は少なくとも20塩基を含む。

gNA分子は、スキャフォールド核酸(スキャフォールドNA)分子をさらに含む。

スキャフォールドNAは、互いに相補的であり、ハイブリダイズしてヘアピン構造を形成することができる少なくとも8塩基を各々含む2つの領域を含む、1つの核酸分子からなり得る。スキャフォールドNAは、ハイブリダイズして二本鎖構造を形成することができる、互いに相補的な少なくとも8塩基の少なくとも1つの領域を各々含む、2つの核酸分子からなり得る。前記領域が8個を超える相補的塩基を含む場合、各領域は、他の領域の少なくとも8塩基に相補的な少なくとも8塩基を含む。

好ましくは、スキャフォールドNAは1分子からなる。

スキャフォールドNA分子は、スペーサーNA分子に共有結合により連結している。その場合、スキャフォールドNA分子は2つの独立した分子からなり、スキャフォールドNAのこれらの分子の少なくとも1つはスペーサーNA分子に共有結合により連結している。

互いに相補的である少なくとも8塩基を含む2つの領域に加えて、スキャフォールドNA分子は、少なくとも1つのヘアピン、好ましくは少なくとも2つのヘアピンを含む二次構造を形成するさらなる領域を含む。

ドナーNA分子は、2つのホモロジーアームを含む。ドナーNA分子の各々のホモロジーアームは、少なくとも15塩基を含み、ホモロジーアームを隔てる付加的なNA領域のサイズの少なくとも5%、好ましくは少なくとも10%、より好ましくは少なくとも15%、最も好ましくは少なくとも20%である。ホモロジーアーム1及び2は、同じ長さ又は異なる長さを有していてもよい。

ホモロジーアームはそれぞれ、標的NA分子中の同じ数の連続する塩基と100%相補的である少なくとも15塩基を含む。ホモロジーアームが15塩基より大きい場合、ホモロジーアームは、標的NA分子に対して、好ましくは少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75%、より好ましくは80%、より好ましくは少なくとも85%、より好ましくは少なくとも90%、さらにより好ましくは少なくとも95%、さらにより好ましくは少なくとも98%、さらにより好ましくは少なくとも99%相補的である。最も好ましくは、各々のホモロジーアームは、標的NA分子に対して100%相補的である。

本発明の方法は、標的NA分子を含む細胞又は組成物に適用してもよい。好ましくは、この方法は、細胞が微生物、動物、ヒト又は植物細胞である細胞に適用され、より好ましくは、この方法は酵母又は植物細胞に適用される。

本発明の方法は、任意の植物細胞、例えば裸子植物又は被子植物、好ましくは被子植物、例えば双子葉植物又は単子葉植物細胞に適用してもよい。好ましい単子葉植物細胞は、例えば、トウモロコシ、コムギ、イネ、オオムギ、ソルガム、ムサ(musa)、サトウキビ、ススキ(miscanthus)及びヤマカモジグサ(brachypodium)であり、特に好ましい単子葉植物細胞はトウモロコシ、コムギ及びイネである。好ましい双子葉植物細胞は、例えばダイズ、ナタネ、キャノーラ、アマニ、ワタ、ジャガイモ、サトウダイコン、タゲテス(tagetes)及びシロイヌナズナ(Arabidopsis)であり、特に好ましい双子葉植物細胞はダイズ、ナタネ、キャノーラ及びジャガイモである。

本発明の方法はまた、任意の微生物に適用することができる。微生物は細菌であってもよく、細菌細胞は任意のグラム陽性細菌又はグラム陰性細菌であってもよい。グラム陽性細菌には、バチルス(Bacillus)、ブレビバクテリウム(Brevibacterium)、コリネバクテリウム(Corynebacterium)、連鎖状球菌(Streptococcus)、ストレプトマイセス(Streptomyces)、ブドウ球菌(Staphylococcus)、腸球菌(Enterococcus)、ラクトバチルス(Lactobacillus)、乳酸球菌(Lactococcus)、クロストリジウム(Clostridium)、ジオバチルス(Geobacillus)及びオセアノバチルス(Oceanobacillus)が含まれるが、これらに限定されない。

グラム陰性細菌には、大腸菌、シュードモナス(Pseudomonas)、サルモネラ(Salmonella)、カンピロバクター(Campylobacter)、ヘリコバクター(Helicobacter)、酢酸金(Acetobacter)、フラボバクテリウム(Flavobacterium)、フソバクテリウム(Fusobacterium)、グルコノバクター(Gluconobacter)が含まれるが、これらに限定されない。好ましくは、グラム陰性細胞は大腸菌細胞である。

本発明の方法において、細菌細胞は、任意のバチルス細胞であり得る。本発明の実施に有用なバチルス細胞には、バチルス・アルカロフィルス(Bacillus alkalophilus)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)、バチルス・ブレビス(Bacillus brevis)、バチルス・シルクランス(Bacillus circulans)、バチルス・クラウシイ(Bacillus clausii)、バチルス・コアグランス(Bacillus coagulans)、バチルス・フィルムス(Bacillus firmus)、バチルス・ラウトゥス(Bacillus lautus)、バチルス・レントゥス(Bacillus lentus)、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・メガテリウム(Bacillus megaterium)、バチルス・プミルス(Bacillus pumilus)、バチルス・ステアロテルモフィルス(Bacillus stearothermophilus)、枯草菌(Bacillus subtilis)及びバチルス・チューリンギエンシス(Bacillus thuringiensis)細胞が挙げられるが、これらに限定されない。好ましい態様において、細菌細胞は、バチルス・アミロリケファシエンス、バチルス・レントゥス、バチルス・リケニフォルミス、バチルス・ステアロテルモフィルス又は枯草菌細胞である。より好ましい態様において、細菌細胞はバチルス・リケニフォルミス細胞又は枯草菌細胞、好ましくは枯草菌細胞である。

本発明の方法においては、細菌宿主細胞は、ラクトバチルス・アシドフィルス(Lactobacillus acidophilus)、ラクトバチルス・プランタルム(Lactobacillus plantarum)、ラクトバチルス・ガセリ(Lactobacillus gasseri)、ラクトバチルス・ブルガリクス(Lactobacillus bulgaricusk)、ラクトバチルス・レウテリ(Lactobacillus reuteri)、黄色ブドウ球菌(Staphylococcus aureus)、コリネバクテリウム(Corynebacterium)、特にコリネバクテリウム・グルタミクム(Corynebacterium glutamicum)、コリネバクテリウム・アセトグルタミクム(Corynebacterium acetoglutamicum)、コリネバクテリウム・アセトアシドフィルム(Corynebacterium acetoacidophilum)、コリネバクテリウム・カルナエ(Corynebacterium callunae)、コリネバクテリウム・アンモニアゲネス(Corynebacterium ammoniagenes)、コリネバクテリウム・テルモアミノゲネス(Corynebacterium thermoaminogenes)、コリネバクテリウム・メラセコラ(Corynebacterium melassecola)及びコリネバクテリウム・エフィジエンス(Corynebacterium effiziens)の種、コリネバクテリウム・エフィシエンス(Corynebacterium efficiens)、コリネバクテリウム・デセルティ(Corynebacterium deserti)、ブレビバクテリウム・フラブム(Brevibacterium flavum)、ブレビバクテリウム・ラクトフェルメントゥム(Brevibacterium lactofermentum)、ブレビバクテリウム・ディバリカトゥム(Brevibacterium divarecatum)、シュードモナス・プティダ(Pseudomonas putida)、シュードモナス・シリンガエ(Pseudomonas syringae)、ストレプトマイセス、特にストレプトマイセス・コエリコロル(Streptomyces coelicolor)、ストレプトマイセス・リビダンス(Streptomyces lividans)、ストレプトマイセス・アルブス(Streptomyces albus)、ストレプトマイセス・アベルミティリス(Streptomyces avermitilis)の種、グルコノバクター・オキシダンス(Gluconobacter oxydans)、グルコノバクター・モルビフェル(Gluconobacter morbifer)、グルコノバクター・タイランディクス(Gluconobacter thailandicus)、アセトバクター・アセティ(Acetobacter aceti)、クロストリジウム・アセトブチリクム(Clostridium acetobutylicum)、クロストリジウム・サッカロブチリクム(Clostridium saccharobutylicum)、クロストリジウム・ベイジェリンキイ(Clostridium beijerinckii)、ストレプトコッカス・エキシミリス(Streptococcus equisimilis)、化膿連鎖球菌(Streptococcus pyogenes)、ストレプトコッカス・ウベリス(Streptococcus uberis)、及び腺疫菌(Streptococcus equi subsp. Zooepidemicus)であってよい。別の好ましい細菌はバスフィア・スクシニシプロドゥセン(Basfia succiniciproducens)である。

微生物は、真核細胞であってもよい。適切な真核細胞としては、酵母細胞、例えばサッカロマイセス・セレビシアエ(Saccharomyces cerevisiae)のようなサッカロマイセス属種、ハンゼヌラ酵母(Hansenula polymorpha)のようなハンゼヌラ属種、分裂酵母(Schizosaccharomyces pombe)のようなシゾサッカロマイセス属種、クルイベロマイセス・ラクティス(Kluyveromyces lactis)及びクルイベロマイセス・マルクシアヌス(Kluyveromyces marxianus)のようなクルイベロマイセス属種、ヤロウィア・リポリティカ(Yarrowia lipolytica)のようなヤロウィア属種、ピキア・メタノリカ(Pichia methanolica)、ピキア・スティピテス(Pichia stipites)及びピキア・パストリス(Pichia pastoris)のようなピキア属種、チゴサッカロマイセス・ロウクシイ(Zygosaccharomyces rouxii)及びチゴサッカロマイセス・バイリー(Zygosaccharomyces bailii)のようなチゴサッカロマイセス属種、カンジダ・ボイディニイ(Candida boidinii)、カンジダ・ウティリス(Candida utilis)、カンジダ・フレイシュッシイ(Candida freyschussii)、カンジダ・グラブラタ(Candida glabrata)のようなカンジダ属種、シュワニオミセス・オッキデンタリス(Schwanniomyces occidentalis)のようなシュワニオミセス属種、アルクスラ・アデニニボランス(Arxula adeninivorans)のようなアルクスラ属種、オガタエア・ミヌタ(Ogataea minuta)のようなオガタエア属種、クレブシエラ肺炎桿菌(Klebsiella pneumonia)のようなクレブシエラ属種などが挙げられる。

標的核酸分子は、細胞に対して内因性であってもよく、又は例えばトランスジーン若しくはウイルス核酸分子のように細胞に対して異種であってもよい。

doNA分子及びgNA分子は、互いに共有結合して、融合核酸(融合NA)分子を形成する。ドナーNA分子は、gNA分子のスペーサーNA部分又はgNA分子のスキャフォールドNA部分に共有結合していてもよい。好ましい実施形態において、ドナーNAは、gNA分子のスキャフォールドNA部分に共有結合により連結している。

最も好ましくは、融合NA分子は、全ての要素(gNA、スキャフォールドNA及びdoNA)が共有結合により連結している、1つの分子、好ましくは1つの連続したRNA分子である。

doNA分子及びガイドNA分子は、RNA、DNA、PNAからなってもよい。好ましくは、それらはRNA又はDNAからなる。より好ましくは、doNA分子はDNAからなり、ガイドNA分子はRNAからなる。

最も好ましい実施形態では、ガイド及びドナーNAの両方がRNAからなり、少なくともdoNA及びgNAが互いに共有結合により連結して、融合リボ核酸分子(fuRNA)を形成する。

fuRNA分子は、RNA分子として、又は前記fuRNA分子をコードする1つ以上の発現構築物として、標的NA分子を含む細胞又は組成物に導入してもよい。

別の実施形態において、doNA分子及びgNA分子は、DNAからなってもよく、ここで、doNA及びgNAは、互いに共有結合により連結して、融合デオキシリボ核酸分子(fuDNA)を形成する。

fuDNA分子は、例えばトランスフェクション、遺伝子銃、エレクトロポレーション、フォトポレーション、ウィスカー(whiskers)、超音波処理、ナノボディ又はマイクロ流体のような様々な方法によってDNA分子として標的NA分子を含む細胞又は組成物に導入することができる。これは、T-DNA分子を細胞に移すことができるが前記T-DNA分子の標的細胞のゲノムDNAへの組込みを媒介することができないビヒクルとしてアグロバクテリウムを用いて導入することもできる。T-DNAは、fuDNA分子を含むか又はそれからなるだろう。

本発明のさらなる実施形態は、gNA分子に共有結合により連結したdoNA分子を含む組換えfuNA分子、例えばfuRNA又はfuDNA分子である。

本発明の別の実施形態は、本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含むベクターである。

本発明のさらなる実施形態は、本発明のfuNA分子及び核酸改変ポリペプチドを含む細胞である。

本発明のさらなる実施形態は、
a.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードする第2のベクター、及び場合により
c.スキャフォールドNA分子の一部分をコードする第3のベクターを含むベクターシステムである。

好ましい実施形態では、a.におけるベクターは、スペーサーNA、スキャフォールドNA及びdoNAを含むfuNA分子をコードする発現構築物を含む。

スキャフォールドNAが2つの分子からなり、aにおけるベクターがスキャフォールドNA分子の1分子のみを含む融合NA分子をコードし、スキャフォールドNA分子の第2分子をコードしない場合には、cにおけるベクターが必要であり、本発明のベクターシステムの一部となる。

細胞内の標的NAを改変するためのシステムであって、
A.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
B.部位特異的核酸改変ポリペプチドをコードする第2のベクター及び
C.標的NA分子を含む細胞、及び場合により
D.スキャフォールドNA分子の一部分をコードする第3のベクターを含む、システムが本発明の別の実施形態である。好ましい実施形態では、Aにおけるベクターは、スペーサーNA、スキャフォールドNA及びdoNAを含むfuNA分子をコードする発現構築物を含む。スキャフォールドNAが2つの分子からなり、AにおけるベクターがスキャフォールドNA分子の1つの分子のみを含む融合NA分子をコードし、かつスキャフォールドNA分子の第2の分子をコードしていない場合は、Dにおけるベクターが必要であり、本発明のシステムの一部である。

本発明の別の実施形態は、
a.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードする第2のベクター、及び
c.標的NA分子を含む細胞、及び場合によって、
d.スキャフォールドNA分子の一部分をコードする第3のベクターを含む、組成物である。

好ましい実施形態では、aにおけるベクターは、スペーサーNA、スキャフォールドNA及びdoNAを含むfuNA分子をコードする発現構築物を含む。スキャフォールドNAが2つの分子からなり、aにおけるベクターがスキャフォールドNA分子の1分子のみを含む融合NA分子をコードし、スキャフォールドNA分子の第2分子をコードしない場合、dにおけるベクターが必要となり、本発明の組成物の一部となる。

細胞又は組成物中の標的NA分子を改変するための、本発明のベクター、本発明のベクターシステム、本発明のシステム及び/又は本発明の組成物の使用もまた本発明の実施形態である。

定義
本発明は、特定の方法又はプロトコールに限定されないことを理解されたい。本明細書で使用する用語は、特定の実施形態を単に説明するためのものあり、添付の特許請求の範囲によってのみ限定される本発明の範囲を限定するものではないことも理解されたい。本明細書及び添付の特許請求の範囲で使用される単数形「1つの(a)」、「及び(and)」及び「その(the)」は、文脈において他に明確に指示されない場合に複数形を含むことに留意されたい。したがって、例えば、「ベクター」への言及は、1つ以上のベクターへの言及であり、当業者に公知であるその等価物を含む、などである。「約(about)」という用語は、本明細書では、およそ(approximately)、おおよそ(roughly)、～辺り(around)、又はその領域にある(in the region of)ことを意味するために使用される。「約」という用語が数値範囲と共に使用される場合、その数値範囲の上及び下の境界を拡げることによってその範囲を改変させる。一般に、「約」という用語は、20%、好ましくは10%の上下(より高い又はより低い)の分散によって示された値の上下の数値を改変させるために本明細書で使用される。本明細書で使用する「又は(or)」という語は、特定のリストの任意の1つのメンバーを意味し、またそのリストのメンバーの任意の組み合わせを含む。本明細書及び下記の特許請求の範囲で使用される場合、「含む(comprise)」、「含むこと(comprising)」、「含む(include)」、「含むこと(including)」、「含む(includes)」という語は、1つ以上の記載された特徴、整数、成分、又は工程の存在を特定することを意図しており、1つ以上の他の特徴、整数、構成要素、工程又はそれらのグループの存在又は追加を排除するものではない。明確化のために、本明細書で使用される特定の用語は、以下のように定義され、使用される:

ドナーNA:「ドナーNA」又は「doNA」という用語は、標的NAの少なくとも15連続塩基の2つの異なるエリアに相補的な少なくとも15塩基をそれぞれ含む2つのホモロジーアームを含む核酸を意味し、前記2つのホモロジーアームは互いに隣接しているか、又は1つ以上の追加の塩基によって分離されている。

ホモロジーアームが相補的である標的NAの2つの異なるエリアは、互いに直接隣接していてもよく、又は20kbまで、好ましくは10kbまで、好ましくは5kbまで、より好ましくは3kbまで、より好ましくは2.5kbまで、より好ましくは2kbまでの追加の塩基により分離されていてもよい。

ホモロジーアームが15を超える塩基を含む場合、標的NAに対して100%相補的であるか、又は少なくとも75%相補的であるか、好ましくは少なくとも80%相補的であるか、より好ましくは少なくとも85%相補的であるか、より好ましくは少なくとも90%相補的であるか、より好ましくは少なくとも95%相補的であるか、より好ましくは少なくとも98%標的NAに対して相補的であってもよく、ここで、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも15塩基の少なくとも1つのストレッチを含み、好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも18塩基の少なくとも1つのストレッチを含み、より好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも20塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも25塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも50塩基の少なくとも1つのストレッチを含む。

ホモロジーアームは、標的NAに対して同じ長さ及び/若しくは同程度の相補性を有してもよく、又は標的NAに対して異なる長さ及び/若しくは異なる程度の相補性を有してもよい。

ホモロジーアームは、互いに直接隣接していてもよく、ホモロジーアームに相補的な標的核酸中の領域の間に存在しない少なくとも1塩基を含む核酸分子によって分離されていてもよい。

スペーサーNA:用語「スペーサー核酸」又は「スペーサーNA」は、標的NAに対して100%相補的な少なくとも12塩基を含む核酸を意味する。

スペーサーNAが12を超える塩基を含む場合、それは標的NAに対して少なくとも75%相補的であるか、好ましくは少なくとも80%相補的であるか、より好ましくは少なくとも85%相補的であるか、より好ましくは少なくとも90%相補的であるか、より好ましくは少なくとも95%相補的であるか、より好ましくは少なくとも98%相補的であるか、最も好ましくは、それは標的NAに対して100%相補的であり、ここで、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも12塩基の少なくとも1つのストレッチを含み、好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも15塩基の少なくとも1つのストレッチを含み、好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも18塩基の少なくとも1つのストレッチを含み、より好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも20塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも25塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも50塩基の少なくとも1つのストレッチを含む。

スペーサーNAはスキャフォールドNAに共有結合により連結している。スキャフォールドNAが2つの核酸分子からなる場合、スペーサーはスキャフォールドNAの1つの分子に共有結合により連結する。

スキャフォールドNA:スキャフォールド核酸又はスキャフォールドNAは、部位特異的核酸改変ポリペプチドによって結合される少なくとも1つのヘアピン、好ましくは少なくとも2つのヘアピン及び/又は配列を含む二次構造を形成する核酸を含む。そのような部位特異的核酸改変ポリペプチドは、当該技術分野において、例えばWO2014/150624;WO2014/204728において知られている。スキャフォールドNAは、それぞれが互いに相補的である少なくとも8塩基を含む2つの領域をさらに含み、したがって二本鎖構造を形成するようにハイブリダイズすることができる。互いに相補的な少なくとも8塩基の前記領域が8を超える塩基を含む場合、各領域は他の領域の少なくとも8塩基に相補的な少なくとも8塩基を含む。

スキャフォールドNAの2つの相補的領域は、ヘアピン構造を形成するリンカー分子を介して互いに共有結合により連結していてもよく、又は2つの独立した核酸分子からなっていてもよい。

ガイドNA:ガイド核酸又はガイドNA又はgNAは、スペーサー核酸及びスキャフォールド核酸を含み、ここで、スペーサーNA及びスキャフォールドNAは互いに共有結合により連結している。スキャフォールドNAが2つの分子からなる場合、スペーサーNAはスキャフォールドNAの1つの分子に共有結合により連結しているのに対して、スキャフォールドNA分子の他の分子は第1のスキャフォールドNA分子にハイブリダイズする。したがって、ガイドNA分子は、1つの核酸分子からなっていてもよく、又は2つの核酸分子からなっていてもよい。好ましくは、ガイドNAは1分子からなる。

融合NA:融合核酸は、ドナーNA及びガイドNAを含み、ここで、ガイドNA及びドナーNAは、互いに共有結合により連結している。

部位特異的核酸改変ポリペプチド:「部位特異的核酸改変ポリペプチド」「核酸結合部位特異的核酸改変ポリペプチド」又は「部位特異的ポリペプチド」とは、核酸に結合し、特異的核酸配列に標的化されるポリペプチドのことを意味する。本明細書に記載の部位特異的核酸改変ポリペプチドは、ポリペプチドに固有の機構又は好ましくはそれが結合する核酸分子のいずれかによって標的核酸中の特定の核酸配列に標的化される。ポリペプチドによって結合された核酸分子は、標的核酸内の標的配列に相補的な配列を含み、したがって、結合したポリペプチドを標的核酸(標的配列)内の特定の位置に標的化する。

ほとんどの部位特異的核酸改変ポリペプチドはdsDNA切断を導入するが、ニッキング活性のみを有するように改変されてもよく、又はヌクレアーゼ活性が不活性化されてもよい。部位特異的核酸改変ポリペプチドは、蛍光又はFokIポリペプチドのヌクレアーゼ活性又はI-SceIのようなホーミングエンドヌクレアーゼポリペプチドのようなヌクレアーゼ活性などの活性を有するさらなるポリペプチドに結合されてもよい。

コード領域：本発明で使用する用語「コード領域」は、構造遺伝子を言及して用いる場合、mRNA分子の翻訳の結果として新生ポリペプチドに見出されるアミノ酸をコードするヌクレオチド配列を意味する。コード領域は、真核生物においては、5'側にヌクレオチドトリプレット「ATG」（イニシエーターのメチオニンをコードする）と結合し、原核生物は、開始コドンとしてトリプレット「GTG」及び「TTG」も利用する。3'側に、終止コドンを表す3つのトリプレット（すなわち、TAA、TAG、TGA）の1つが結合されている。さらに、遺伝子はまた、RNA転写物に存在する配列の5'と3'末端の両方に位置する配列も含みうる。これらの配列は、「隣接（flanking）」配列又は領域と呼ばれる（これらの隣接する領域はmRNA転写物に存在する非翻訳配列に対して5'若しくは3'に位置する）。5'隣接領域は、調節配列、例えば、遺伝子の転写を制御又は影響するプロモーター及びエンハンサーを含有しうる。3'隣接領域は、転写の終結、転写後の切断及びポリアデニル化を指令する配列を含有しうる。

相補性：「相補的」又は「相補性」は、アンチパラレルなヌクレオチド配列の相補的塩基残基間で水素結合が形成されると（塩基対合規則により）お互いに対合することができるアンチパラレルなヌクレオチド配列を含むものである、2つのヌクレオチド配列を意味する。例えば、配列 5'-AGT-3'は配列 5'-ACT-3'と相補的である。相補性は「部分的」であっても又は「全体」であってもよい。「部分的」相補性は、１以上の核酸塩基が塩基対合規則によってマッチしない場合である。核酸分子間の「全体」又は「完全」相補性は、それぞれ及び全ての核酸塩基が他の塩基と、塩基対合規則のもとでマッチする場合である。核酸分子鎖間の相補性の程度は、核酸分子鎖間のハイブリダイゼーションの効率と強度に有意な影響を及ぼす。本明細書で使用する核酸配列の「相補体」は、その核酸分子が核酸配列の核酸分子に対して全体相補性を示すヌクレオチド配列を意味する。

内因性：「内因性」ヌクレオチド配列は、野生型微生物のゲノム中に存在するヌクレオチド配列を意味する。

発現の増強：微生物中の核酸分子の発現の「増強」又は「増大」を本明細書では同じ意味で使用し、微生物における核酸分子の発現のレベルが、参照微生物、例えば野生型と比較して高いことを意味する。本明細書で使用する用語「増強」又は「増大」は、ここでは発現される核酸分子のより高い、好ましくは有意に高い発現を意味する。本明細書で使用する、作用物質、例えばタンパク質、mRNA又はRNAのレベルの「増強」又は「増大」は、実質的に同一条件のもとで増殖させた実質的に同一の微生物と比較して、そのレベルが増大したことを意味する。本明細書で使用する、標的遺伝子により発現された作用物質、例えばpreRNA、mRNA、rRNA、tRNAなど及び／又はそれがコードするタンパク質産物のレベルの「増強」又は「増大」は、そのレベルが好適な参照微生物と比較して、50％以上、例えば100％以上、好ましくは200％以上、より好ましくは5倍以上、さらにより好ましくは10倍以上、最も好ましくは20倍以上、例えば50倍増大することを意味する。その増強又は増大は、当業者が精通する方法により測定することができる。従って、核酸又はタンパク質の量の増強又は増大はタンパク質の免疫学的検出により測定することができる。さらに、タンパク質アッセイ、蛍光、ノーザンハイブリダイゼーション、ゲルにおける核酸濃度の濃度測定、ヌクレアーゼ保護アッセイ、逆転写（定量RT-PCR）、ELISA（酵素結合免疫吸着アッセイ）、ウェスタンブロット、ラジオイムノアッセイ（RIA）又は他のイムノアッセイ及び蛍光活性化細胞分析（FACS）などの技法を使って微生物中の特定のタンパク質又はRNAを測定することができる。誘導されるタンパク質産物の種類に応じて、微生物の表現型に与えるその活性又は効果を測定してもよい。タンパク質の量を測定する方法は当業者に公知である。記載しうる例には次のものがある：マイクロ-ビウレット法（Goa J (1953) Scand J Clin Lab Invest 5：218-222）、フォーリン-チオカルト法（Lowry OH ら (1951) J Biol Chem 193：265-275）又は CBB G-250の吸収を測定する方法（Bradford MM (1976) Analyt Biochem 72：248-254）。

発現：「発現」は、細胞における、遺伝子産物の生合成、好ましくは、ヌクレオチド配列、例えば、内因性遺伝子又は異種遺伝子の転写及び／又は翻訳を意味する。例えば、構造遺伝子の場合には、発現は構造遺伝子のmRNAへの転写及び、場合によっては、引き続いてmRNAの１以上のポリペプチドへの翻訳を含む。他の場合では、発現はRNA分子を保持するDNAの転写だけに関わりうる。

外来：用語「外来」は、細胞中に実験操作により導入された任意の核酸分子（例えば、遺伝子配列）を意味し、導入された配列がいくつかの改変（例えば、点突然変異、選択マーカー遺伝子の存在など）を含み、したがって天然の配列とは異なる限り、その細胞中に見出される配列を含み得る。

機能的断片：用語「機能的断片」は、本発明の全長核酸及び／又は全長ポリペプチドの一部のみを含むが、依然として同じ機能、すなわち、アクリロイルCoA及びブタノールからn-BA及びCoAへの反応を触媒するAAT酵素の機能をもたらす任意の核酸及び／又はタンパク質を指す。好ましくは、断片はそれが由来する配列の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%を含む。好ましくは、機能的断片は、機能的断片が由来する核酸及び／又はタンパク質の連続した核酸又はアミノ酸を含む。タンパク質をコードする核酸分子の機能的断片は、タンパク質の機能的断片をコードする核酸分子の断片を意味する。

機能的連結：用語「機能的連結（functional linkage）」又は「機能的に連結した（functionally linked）」は、用語「機能可能な連結（operable linkage）」又は「機能可能に連結した（operably linked）」と同等であり、調節エレメント（例えば、プロモーター）の発現対象の核酸配列との、及び、適宜、さらなる調節エレメント（例えば、ターミネーターなど）との配列の配置であって、それぞれの調節エレメントがその意図する機能を完遂して前記核酸配列の発現を可能にし、改変し、促進し又はさもなくば影響を与え得る前記配列の配置を意味すると理解される。同義語として、表現「機能可能な連結」又は「機能可能に連結した」を使用してもよい。発現は、核酸配列のセンス又はアンチセンスRNAと関係した配置に依存してもたらされうる。この目的にとって、化学的意味の直接連結は必ずしも必要でない。例えば、エンハンサー配列などの遺伝子制御配列は、さらに離れた位置から、又は他のDNA分子からでも、標的配列に対するその機能を果たしうる。好ましい配置は、発現対象の核酸配列が組換えによってプロモーターとして作用する配列の後方に位置し、2つの配列が互いに共有結合で連結される配置である。好ましい実施形態においては、転写開始が本発明のキメラRNAの所望の開始と同一であるように、転写される核酸配列をプロモーターの後ろに配置する。機能的連結、及び発現構築物は、記載された通例の組換え及びクローニング技法を用いて作製することができる（例えば、Sambrook J, Fritsch EF and Maniatis T (1989)；Silhavy et al. (1984) Expeiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor (NY)；Ausubel et al., (1987) Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience；Gelvin et al., (Eds) (1990) Plant Molecular Biology Manual; Kluwer Academic Publisher, Dordrecht, The Netherlands）。しかし、例えば、制限酵素に対する特異的切断部位をもつリンカーとして、又はシグナルペプチドとして作用するさらなる配列も2つの配列の間に配置することができる。配列の挿入はまた、融合タンパク質の発現をもたらしうる。好ましくは、調節領域、例えばプロモーター及び発現対象の核酸配列の連結から成る発現構築物をベクターに組込まれた形で存在させてもよく、又は例えば、形質転換によりゲノム中に挿入することができる。

遺伝子：用語「遺伝子」は、遺伝子産物（例えば、ポリペプチド又は機能性RNA）の発現をいくつかの方式で調節することができる適当な調節配列と機能可能に連結された領域を意味する。遺伝子は、コード領域（オープンリーディングフレーム、ORF）に先行する（上流の）及び後続する（下流の）DNAの非翻訳調節領域（例えば、プロモーター、エンハンサー、リプレッサーなど）を含む。本明細書で使用する用語「構造遺伝子」は、mRNAに転写され、次いで特定のポリペプチドの特徴であるアミノ酸の配列に翻訳されるDNA配列を意味することを意図している。

ゲノムとゲノムDNA：用語「ゲノム」又は「ゲノムDNA」は、宿主生物の遺伝性の遺伝子情報を意味する。前記ゲノムDNAは核様体のDNAを含むが、自己複製プラスミドのDNAも含む。

異種：核酸分子又はDNAに関する用語「異種」は、天然では機能可能に連結されてない又は天然では異なる位置で機能可能に連結された第2の核酸分子と、機能可能に連結された、又は機能可能に連結されるように遺伝子操作された核酸分子を意味する。核酸分子及びそれと連結された1以上の調節核酸分子（プロモーター又は転写終結シグナルなど）を含む異種発現構築物は、例えば、実験遺伝子操作に由来する構築物であって、(a)前記核酸分子、又は(b)前記調節核酸分子、又は(c）両方（すなわち(a)と(b)）がその天然（生来）の遺伝環境に位置しないか、又は、実験遺伝子操作により改変されている（改変の例は１以上のヌクレオチド残基の置換、付加、欠失、逆位又は挿入である）前記構築物である。天然の遺伝環境は、起源の生物における天然のゲノム遺伝子座、又はゲノムライブラリー中の存在を意味する。ゲノムライブラリーの場合、核酸分子の配列の天然の遺伝環境は好ましくは、少なくとも部分において保持される。前記環境は核酸配列に少なくとも1つの側において隣接し、そして少なくとも50bp、好ましくは少なくとも500bp、とりわけ好ましくは少なくとも1,000bp、非常にとりわけ好ましくは少なくとも5,000bpの長さの配列を有する。天然の発現構築物（例えば、プロモーターと対応する遺伝子との天然の組み合わせ）は、非天然、合成の「人工的」方法、例えば変異誘発により改変されると、トランスジェニック発現構築物になる。かかる方法は記載されている（米国特許第5,565,350号；WO 00/15815号）。例えば、この分子の生来のものでないプロモーターと機能可能に連結されたタンパク質をコードする核酸分子は、プロモーターについて異種であるとみなされる。好ましくは、異種DNAは、それを導入した細胞に対して内因性でないか又は天然で関連しないが、他の細胞から得られたか又は合成されたものである。異種DNAはまた、いくつかの改変、非天然、多コピーの内因性DNA配列、又はそれに物理的に連結された他のDNA配列と天然で関連しないDNA配列を含む内因性DNA配列を含む。一般に、必ずではないが、異種DNAはそれが発現される細胞により通常産生されないRNA又はタンパク質をコードする。

ハイブリダイゼーション：本明細書で使用する用語「ハイブリダイゼーション」は「核酸分子の1つの鎖が塩基対合を介して相補鎖に参加する任意のプロセス」を含む（J. Coombs (1994） Dictionary of Biotechnology, Stockton Press, New York）。ハイブリダイゼーション及びハイブリダイゼーションの強度（すなわち、核酸分子間の会合の強度）は、核酸分子間の相補性の程度、関わる条件のストリンジェンシー、形成されるハイブリッドのTm、及び核酸分子内のG：C比などの因子の影響を受ける。本明細書で使用する用語「Tm」は「融点」の意味で使用される。融点は二本鎖の核酸分子の集団が半分に解離して一本鎖になる温度である。核酸分子のTmを計算する式は当技術分野において周知である。標準の参考文献に示されるように、核酸分子が1M NaClの水溶液中に含まれる場合、Tm値の単純な計算は式：Tm=81.5+0.41(％ G+C)により計算することができる［例えば、Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985）を参照］。他の参考文献は、構造並びに配列の特徴を考慮に入れてTmを計算するさらに複雑な計算を含む。ストリンジェントな条件は、当業者に公知であり、Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6に記載されている。

好適なハイブリダイゼーション条件は、例えば、配列の相補体の少なくとも50、好ましくは少なくとも100、より好ましくは少なくとも150、よりさらに好ましくは少なくとも200、最も好ましくは少なくとも250個の連続するヌクレオチドを含む核酸分子に対して、50℃における7％ドデシル硫酸ナトリウム（SDS）、0.5M NaPO4、1mM EDTA中でのハイブリダイゼーションと50℃における2X SSC、0.1％SDS中での洗浄に等しい条件下でハイブリダイズするもの（低ストリンジェンシー）である。他の好適なハイブリダイゼーション条件は、配列の相補体の少なくとも50、好ましくは少なくとも100、より好ましくは少なくとも150、よりさらに好ましくは少なくとも200、最も好ましくは少なくとも250個の連続するヌクレオチドを含む核酸分子に対して、50℃における7％ドデシル硫酸ナトリウム（SDS）、0.5M NaPO4、1mM EDTA中でのハイブリダイゼーションと50℃（中程度ストリンジェンシー）又は65℃（高ストリンジェンシー）における1X SSC、0.1％SDS中での洗浄である。他の好適なハイブリダイゼーション条件は、配列の相補体の少なくとも50、好ましくは少なくとも100、より好ましくは少なくとも150、よりさらに好ましくは少なくとも200、最も好ましくは少なくとも250個の連続するヌクレオチドを含む核酸分子に対して、50℃における7％ドデシル硫酸ナトリウム（SDS）、0.5M NaPO4、1mM EDTA中でのハイブリダイゼーションと65℃における0.1X SSC、0.1％SDS中での洗浄である（非常に高度なストリンジェンシー）。

「同一性」：「同一性」は、2以上の核酸又はアミノ酸分子の比較について使用する場合、前記分子の配列がある特定の程度の配列類似性を共有し、配列が部分的に同一であることを意味する。

2以上のアミノ酸又は2以上のヌクレオチド配列のパーセント同一性を確認するために、いくつかのコンピューターソフトウエアプログラムが開発されている。2以上の配列の同一性は、例えば、ソフトウエアfastaを用いて計算することができ、これは現在バージョンfasta 3が使用されている（W. R. Pearson and D. J. Lipman, PNAS 85, 2444(1988)；W. R. Pearson, Methods in Enzymology 183, 63 (1990)；W. R. Pearson and D. J. Lipman, PNAS 85, 2444 (1988)；W. R. Pearson, Enzymology 183, 63 (1990））。異なる配列の同一性を計算する他の有用なプログラムは標準blastプログラムであって、これはBiomax pedantソフトウエアに含まれている（Biomax、Munich、Federal Republic of Germany）。このソフトウエアは残念ながら、 blastが主題及びクエリの完全な配列を常に含まないので、最適性の劣る結果をもたらすことがある。それにも関わらず、このプログラムは非常に効率的であるので、膨大な数の配列を比較するために用いることができる。以下の設定は、配列のかかる比較のための典型的に使用されるものである。

-p プログラム名 [文字列]； -d データベース [文字列]；デフォルト = nr； -i クエリーファイル[File In]；デフォルト = stdin； -e 期待値（E） [実数]；デフォルト = 10.0； -m アラインメントビューオプション： 0 = ペアワイズ； 1 = 同一性を示すクエリー-アンカー； 2 = 同一性を示さないクエリー-アンカー； 3 = フラットクエリー-アンカー、同一性を示す； 4 = フラットクエリー-アンカー、同一性を示さない； 5 = フラットクエリー-アンカー、同一性を示さない、かつ平滑末端； 6 = フラットクエリー-アンカー、同一性を示さない、かつ平滑末端； 7 = XML Blast出力； 8 = 表形式； 9 コメントラインを含む表形式[整数]；デフォルト = 0； -o BLASTリポート出力ファイル[File Out] オプション；デフォルト = stdout； -F フィルタークエリー配列（blastnを用いるDUST、他を用いるSEG） [文字列]；デフォルト = T； -G ギャップを開くためのコスト（0はデフォルト行動を引き起こす） [整数]；デフォルト = 0； -E ギャップを拡張するためのコスト（0はデフォルト行動を引き起こす） [整数]；デフォルト = 0； -X ギャップ付加されたアラインメントに関するX下落値（ビット）（0はデフォルト行動を引き起こす）； blastn 30、megablast 20、tblastx 0、他の全部15 [整数]；デフォルト = 0； -I デフラインにGIを示す[T/F]；デフォルト = F； -q ヌクレオチド不一致に関するペナルティ（blastnのみ） [整数]；デフォルト = -3； -r ヌクレオチド一致に関する報酬（blastnのみ） [整数]；デフォルト = 1； -v （V）に関する1行記述を示すデータベース配列の数 [整数]；デフォルト = 500； -b （B）に関するアラインメントを示すデータベース配列の数 [整数]；デフォルト = 250； -f 拡張ヒットに関する閾値、デフォルト 0の場合； blastp 11、blastn 0、blastx 12、tblastn 13； tblastx 13、megablast 0 [整数]；デフォルト = 0； -g ギャップ付加アラインメントを実行（tblastxでは利用不可） [T/F]；デフォルト = T； -Q 使用するクエリー遺伝子コード[整数]；デフォルト = 1； -D DB遺伝子コード（tblast[nx]についてのみ） [整数]；デフォルト = 1； -a 使用するプロセッサーの数[整数]；デフォルト = 1； -O SeqAlignファイル[File Out] オプション； -J クエリーデフラインを信じる[T/F]；デフォルト = F； -M マトリックス[文字列]；デフォルト = BLOSUM62； -W ワードサイズ、デフォルト 0の場合（blastn 11、megablast 28、他の全部 3） [整数]；デフォルト = 0； -z データベースの有効長さ（実際のサイズについては0を使用する） [実数]；デフォルト = 0； -K 保持する領域から得られる最良のヒットの数（デフォルトにより除去、使用する場合、100の値が推奨される） [整数]；デフォルト = 0； -P 複数ヒットについては0、単一ヒットについては1[整数]；デフォルト = 0； -Y 検索スペースの有効長さ（実際のサイズについては0を使用する） [実数]；デフォルト = 0； -S データベースに対して検索するためのクエリー・ストランド（blast[nx]、及びtblastxについて）； 3は両方、1は上、2は下である[整数]；デフォルト = 3； -T HTML出力を作製 [T/F]；デフォルト = F； -l GIの一覧に対するデータベースの限定的検索 [文字列] オプション； -U FASTA配列のフィルタリングには小文字を使用する [T/F] オプション；デフォルト = F； -y ビットで示される非ギャップ付加拡張のためのX下落値（0.0はデフォルト行動を引き起こす）； blastn 20、megablast 10、他の全部 7 [実数]；デフォルト = 0.0； -Z ビットで示される最終的なギャップ付加アラインメントに関するX下落値（0.0はデフォルト行動を引き起こす）； blastn/megablast 50、tblastx 0、他の全部 25 [整数]；デフォルト = 0； -R PSI-TBLASTN チェックポイントファイル[File In] オプション； -n MegaBlast検索 [T/F]；デフォルト = F； -L クエリー配列上の位置[文字列] オプション； -A 複数ヒットウィンドウサイズ、デフォルト 0の場合（blastn/megablast 0、他の全部 40 [整数]；デフォルト = 0； -w フレームシフトペナルティ（blastxに関するOOFアルゴリズム） [整数]；デフォルト = 0； -t HSPsを連結するためにtblastnにおいて許容される最大のイントロンの長さ（0は連結不可） [整数]；デフォルト = 0。

Needleman及びWunsch、又はSmith及びWatermanのアルゴリズムを用いることにより、高品質の結果が達成される。従って、前記アルゴリズムに基づくプログラムが好ましい。有利には、配列の比較を、プログラムPileUp（J. Mol. Evolution., 25, 351 (1987）、Higgins et al., CABIOS 5, 151 (1989））又は、好ましくは、プログラム「Gap」及び「BestFit」（両方とも、Needleman及びWunsch（J. Mol. Biol. 48; 443-453 (1970)のアルゴリズムに基づく）並びに「BestFit」（Smith及びWaterman（Adv. Appl. Math. 2; 482-489 (1981)）のアルゴリズムに基づく）を用いて行うことができる。「Gap」及び「Needle」はGCGソフトウェアパッケージ [Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, USA 53711 (1991); Altschul ら(1997) Nucleic Acids Res. 25:3389 (1997）]の一部であり、「Needle」はThe European Molecular Biology Open Software Suite (EMBOSS）(Trends in Genetics 16 (6）, 276 (2000））の一部である。従って、好ましくは、配列同一性のパーセントを決定する計算を、配列の全範囲にわたりプログラム「Gap」又は「Needle」を用いて行う。核酸配列の比較のための以下の標準的な調整を「Needle」について用いた: マトリックス: EDNAFULL, ギャップ_ペナルティ: 10.0、拡張_ペナルティ: 0.5。核酸配列の比較のための以下の標準的な調整を「Gap」について用いた：ギャップウエイト：50、長さウエイト：3、平均マッチ：10.000、平均ミスマッチ：0.000。

例えば、核酸レベルで配列番号1の配列と80％同一性を有するといわれる配列は、配列番号1により表される配列と上記プログラム「Needle」により上記パラメーターセットを用いて比較すると80％同一性を有する配列を意味すると理解される。好ましくは、同一性はクエリー配列、例えば配列番号1の全長に基づいて計算する。

単離された：本明細書で使用する用語「単離された」は、材料が人手により取り出されていて、その元来の、生来の環境から離れて存在し、それ故に天然の産物でないことを意味する。単離された材料又は分子（DNA分子又は酵素など）は精製された形態で存在しうるし又は例えば、トランスジェニック宿主細胞などの非生来の環境で存在しうる。例えば、生細胞中に存在する天然の核酸分子又はポリペプチドは単離されてないが、天然の系で共存する材料のいくつか又は全てから分離された同じ核酸分子又はポリペプチドは単離されている。かかる核酸分子はベクターの一部でありうるし及び／又はかかる核酸分子若しくはポリペプチドは組成物の一部でありうるのであって、かかるベクター若しくは組成物が元来の環境の部分でないという点では単離されているであろう。好ましくは、核酸分子に関係して、「単離された核酸配列」のように使用される場合の「単離された」は、同定され、天然源で元来関連している少なくとも１つの夾雑核酸分子から分離された核酸配列を意味する。単離された核酸分子は、天然で見出されるのとは異なる形態又は設定で存在する核酸分子である。対照的に、単離されてない核酸分子は、それらが天然で存在する状態で見出されたDNA及びRNAなどの核酸分子である。例えば、所与のDNA配列（例えば、遺伝子）は宿主細胞染色体において、隣接する遺伝子の近位で見出され；RNA配列、例えば、特定のタンパク質をコードする特定のmRNA配列は細胞において、多数のタンパク質をコードする数多くの他のmRNAとの混合物として見出される。しかし、例えば配列番号1を含む単離された核酸配列は、例として挙げれば、配列番号1を通常含有する細胞中のかかる核酸配列であって、その核酸配列が天然の細胞とは異なるゲノム若しくはプラスミドの位置にあるか、又は、さもなくば、天然に見出されるのとは異なる核酸配列が隣接する前記核酸配列を含むものである。単離された核酸配列は一本鎖又は二本鎖の形態で存在しうる。単離された核酸配列をタンパク質を発現するために利用する場合、その核酸配列は最小限、少なくともセンス又はコード鎖の部分を含有してもよい（すなわち、核酸配列は一本鎖であってもよい）。あるいは、センスとアンチセンス鎖の両方を含有してもよい（すなわち、核酸配列は二本鎖であってもよい）。

非コード：用語「非コード」は、発現されるタンパク質の一部若しくは全てをコードしない核酸分子の配列を意味する。非コード配列は、限定されるものでないが、エンハンサー、プロモーター領域、3'非翻訳領域、及び5'非翻訳領域を含む。

核酸及びヌクレオチド：用語「核酸」及び「ヌクレオチド」は天然又は合成又は人工の核酸又はヌクレオチドを意味する。用語「核酸」及び「ヌクレオチド」はデオキシリボヌクレオチド又はリボヌクレオチド又は任意のヌクレオチド類似体及びポリマー又はそれらのハイブリッドを、一本鎖若しくは二本鎖のセンス又はアンチセンス型で含む。特に断らない限り、特定の核酸配列はまた、暗示的に保存的に改変されたそれらの変異体（例えば、縮重コドン置換）及び相補配列、並びに明確に示した配列を包含する。用語「核酸」は、「遺伝子」、「cDNA」、「mRNA」、「オリゴヌクレオチド」、「核酸分子」と本明細書では互換的に使用される。ヌクレオチド類似体は、塩基、糖及び／又はリン酸塩の化学構造に改変を有するヌクレオチドを含み、前記改変には、限定されるものでないが、5-位置ピリミジン改変、8-位置プリン改変、シトシン環外アミン類における改変、5-ブロモ-ウラシルの置換など；及び限定されるものでないが、2'-位置糖改変（2'-OHがH、OR、R、ハロ、SH、SR、NH2、NHR、NR2、又はCNから選択される基により置換された糖改変を含む）されたリボヌクレオチドが含まれる。ショートヘアピンRNA（shRNA）はまた、非天然エレメント、例えば、非天然塩基、例えばイオノシン及びキサンチン、非天然糖、例えば2'-メトキシリボース、又は非天然リン酸ジエステル結合、例えばメチルホスホネート、ホスホロチオアート及びペプチドを含みうる。

核酸配列：表現「核酸配列」は、5'から3'末端へ読まれたデオキシリボヌクレオチド又はリボヌクレオチド塩基の一本鎖又は二本鎖のポリマーを意味する。核酸配列は染色体のDNA、自己複製プラスミド、DNA又はRNAの感染性ポリマー及び主に構造的役割を果たすDNA又はRNAを含む。「核酸配列」はまた、ヌクレオチドを表す略語、文字、記号又は言語の継続的列挙を意味する。一実施形態において、核酸は長さが通常100ヌクレオチド未満の比較的短い核酸である「プローブ」であってもよい。核酸プローブは長さが約50ヌクレオチド～長さが約10ヌクレオチドであることが多い。核酸の「標的領域」は目的のものであると同定された核酸の一部分である。核酸の「コード領域」は、適当な調節配列の制御下に置かれると、配列特異的な方式で転写されかつ翻訳され、特別なポリペプチド又はタンパク質を産生する核酸の部分である。コード領域はかかるポリペプチド又はタンパク質をコードすると言われる。

オリゴヌクレオチド：用語「オリゴヌクレオチド」はリボ核酸（RNA）又はデオキシリボ核酸（DNA）又はそれらの模倣体のオリゴマー又はポリマー、並びに同様に機能する非天然部分を有するオリゴヌクレオチドを意味する。かかる改変された又は置換されたオリゴヌクレオチドは、所望の特性、例えば、細胞取込みの増強、核酸標的に対する親和性の増強及びヌクレアーゼの存在のもとでの安定性の増強故に、しばしば、生来の形態よりも好ましい。オリゴヌクレオチドは、好ましくは、結合（例えば、リン酸ジエステル）又は代わる結合により互いに共役結合された2以上のヌクレオモノマーを含む。

オーバーハング：「オーバーハング」は、二本鎖のオリゴヌクレオチド分子の5'-又は3'-ヒドロキシル末端の比較的短い一本鎖ヌクレオチド配列である（「伸長」「突出末端」又は「粘着性末端」とも呼ばれる）。

ポリペプチド: 用語「ポリペプチド」、「ペプチド」、「オリゴペプチド」、「ポリペプチド」、「遺伝子産物」、「発現産物」及び「タンパク質」は本明細書では互換的に使用されていて、連続するアミノ酸残基のポリマー又はオリゴマーを意味する。

プロモーター:用語「プロモーター」又は「プロモーター配列」は等価であり、本明細書で使用する場合、目的のヌクレオチド配列に機能可能に連結されると目的のヌクレオチド配列のRNAへの転写を制御することができるDNA配列を意味する。プロモーターは、目的のヌクレオチド配列（mRNAへのその転写を制御する）の転写開始部位の5'（すなわち、上流）の近位に位置し、そして転写開始のためのRNAポリメラーゼ及び他の転写因子による特異的結合のための部位を提供する。プロモーターはコード領域又は5'非翻訳領域を含まない。プロモーターはそれぞれの細胞に対して異種又は相同性であってもよい。核酸分子配列は、もし外来種に由来するか、又はもし同じ種由来であってその元来の形態から改変されていれば、生物又は第2の核酸分子配列に対して「異種」である。例えば、異種コード配列と機能可能に連結されたプロモーターという場合、そのコード配列は、そのプロモーターが由来する種と異なる種由来のコード配列、又は、もし同じ種由来であれば、そのプロモーターに天然では関連しないコード配列（例えば、遺伝子操作で作られたコード配列又は異なるエコタイプ若しくは変種からの対立遺伝子）を意味する。好適なプロモーターは、発現が起こるべき宿主細胞の遺伝子から又は宿主に対する病原体から誘導することができる。

精製された：本明細書で使用する用語「精製された」は、その天然環境から取り出され、単離され又は分離された分子、核酸若しくはアミノ酸配列を意味する。「実質的に精製された」分子は、それが天然で関連する他成分の少なくとも60％を含有しない、好ましくは少なくとも75％を含有しない、そしてより好ましくは少なくとも90％を含有しない。精製された核酸配列は単離された核酸配列であってもよい。

有意な増大：測定技法に固有の誤差限界より大きい、例えば酵素活性、遺伝子発現、特定の産物の生産性又は収量の増大、好ましくは、対照細胞における対照酵素の活性、発現、生産性若しくは収量又は発現、対照細胞の生産性若しくは収量の約10％又は25％、好ましくは50％又は75％、より好ましくは2倍若しくは5倍又はそれ以上の増大、より好ましくは、約10倍以上の増大を意味する。

有意な低減：測定技法に固有の誤差限界より大きい、例えば酵素活性、遺伝子発現、特定の産物の生産性又は収量の低減、好ましくは、少なくとも5％又は10％、好ましくは少なくとも20％又は25％、より好ましくは少なくとも約50％又は75％、よりさらに好ましくは少なくとも約80％又は85％、最も好ましくは少なくとも約90％、95％、97％、98％又は99％の低減を意味する。

実質的に相補的な：その最も広い意味で、用語「実質的に相補的な」は、参照又は標的ヌクレオチド配列と比較してヌクレオチド配列について本明細書で使用する場合、前記参照又は標的ヌクレオチド配列の実質的に相補的なヌクレオチド配列と正確に相補的な配列の間のパーセント同一性は少なくとも60％、より望ましくは少なくとも70％、より望ましくは少なくとも80％又は85％、好ましくは少なくとも90％、より好ましくは少なくとも93％、さらにより好ましくは少なくとも95％又は96％、なおさらにより好ましくは少なくとも97％又は98％、またさらにより好ましくは少なくとも99％又は最も好ましくは100％（最後の場合、この文脈では用語「同一」と等しい）であるヌクレオチド配列を意味する。（以下で特に断らなければ）好ましくは、同一性を核酸配列の少なくとも19ヌクレオチド、好ましくは少なくとも50ヌクレオチド、より好ましくは全長にわたり前記参照配列に対して評価する。配列比較は、デフォールトGAP分析を用いて、GAPのSEQWEBアプリケーション（University of Wisconsin GCG）により、Needleman及びWunsch（Needleman and Wunsch (1970) J Mol. Biol. 48: 443-453；先に定義した通り）のアルゴリズムに基づいて実施する。参照ヌクレオチド配列に「実質的に相補的な」ヌクレオチド配列は参照ヌクレオチド配列と低度ストリンジェンシー条件、好ましくは中程度ストリンジェンシー条件、最も好ましくは高度ストリンジェンシー条件（先に定義した通り）のもとでハイブリダイズする。

トランスジーン：本明細書で使用する用語「トランスジーン」は、実験遺伝子操作により細胞のゲノム中に導入される任意の核酸配列を意味する。トランスジーンは「内因性DNA配列」又は「異種DNA配列」（すなわち「外来のDNA」）であってもよい。用語「内因性DNA配列」は、天然の配列に関係して何らかの改変（例えば、点突然変異、選択マーカー遺伝子の存在など）のない限り、導入される細胞において天然で見出されるヌクレオチド配列を意味する。

トランスジェニック：生物に言及する場合、用語「トランスジェニック」は、少なくとも1つの組換え核酸分子によって、形質転換された、好ましくは安定して形質転換されたことを意味する。

ベクター：本明細書で使用する用語「ベクター」は、連結されている他の核酸分子を輸送することができる核酸分子を意味する。ベクターの1つのタイプはゲノム組み込み型ベクター、すなわち、宿主細胞のゲノムDNA中に組み込むことができる「組み込みベクター」である。ベクターの他のタイプはエピソームベクター、すなわち、染色体外複製の能力があるプラスミド又は核酸分子である。機能可能に連結された遺伝子の発現を指令する能力のあるベクターを本明細書では「発現ベクター」と呼ぶ。本明細書においては、文脈からそうでないことが明らかでない限り、「プラスミド」と「ベクター」を互換的に使用する。

野生型：用語「野生型」、「天然の」又は「天然の起源」は、生物に関する場合、その生物が人為的に改変、変異又はさもなくば操作が行われていないことを意味する。ポリペプチド又は核酸配列に関する場合、そのポリペプチド又は核酸配列が天然であるか、又は人為的に改変、変異若しくはさもなくば操作が行われていない少なくとも1つの天然の生物において入手できるものを意味する。

微生物の野生型とは、ある遺伝子の遺伝的改変を導入する前の場合と同様の状況でゲノムが存在する微生物を指す。遺伝的改変は、例えば、遺伝子若しくはその一部の欠失、又は点変異、又は遺伝子の導入とすることができる。

「生産」又は「生産性」の用語は当技術分野で認識され、所定時間内に所定の発酵体積で形成された発酵産物（例えばdsRNA）の濃度（例えば産物kg/時/L）が含まれる。「生産の効率」という用語には、特定のレベルの生産が達成されるのに必要な時間（例えば、細胞がファインケミカルの出力の特定の速度を獲得するために要する時間）が含まれる。

「収量」又は「産物／炭素収量」の用語は当技術分野で認識され、産物（すなわちファインケミカル）への炭素源の変換の効率が含まれる。これは一般的に、例えば炭素源1kg当たりの産物kgとして記載される。化合物の収量又は生産を増大させることにより、所定の時間量における所定の培養量における化合物の回収される分子又は有用な回収分子の量が増大する。

「組換え微生物」という用語には、それが由来する野生型微生物と比較して改変された又は異なる遺伝子型及び／又は表現型を示すように遺伝的に改変された微生物（例えば、遺伝的改変が微生物のコード核酸配列に影響を及ぼす場合）が含まれる。組換え微生物は、少なくとも1つの組換え核酸分子を含む。

核酸分子に関する用語「組換え体」は、組換え核酸技法を使用して人為的に作製された核酸分子を指す。この用語は、それ自体は天然には存在しないか、核酸分子が由来する生物に存在しないが、人為的に改変、変化、変異又は操作された核酸分子を含む。好ましくは、「組換え核酸分子」は、少なくとも1つの核酸によって天然に存在する核酸分子と配列が異なる、非天然の核酸分子である。「組換え核酸分子」は、好ましくは機能可能に連結させた、その順序で天然に存在しない核酸分子の配列を含む「組換え構築物」を含むこともできる。前記組換え核酸分子を作製する好ましい方法は、クローニング技法、定方向若しくは非定方向変異誘発、遺伝子合成又は組換え技法を含むことができる。

そのような組換え核酸分子の例は、異種DNA配列が挿入されたプラスミド、あるいはその組換え核酸分子が由来する遺伝子又はプロモーターと比較して変異されている遺伝子又はプロモーターである。変異は、当技術分野で公知の定方向変異誘発技法により、又はランダム変異誘発技術（例えば、化学剤、UV光若しくはx線変異誘発により）、あるいは定方向進化技法によって導入することができる。

用語「定方向進化」は、本明細書において用語「代謝進化」と同義に用いられ、目的の形質を有する突然変異体の増殖を選択する選択圧をかけることを含む。選択圧は、種々の培養条件、ATP及び増殖連結選択、並びに酸化還元関連選択に基づき得る。選択圧は、連続移動接種を行うバッチ発酵又は同じ圧での連続培養を用いて実施することができる。

用語「発現」又は「遺伝子発現」は、特定の遺伝子（複数可）又は特定の遺伝子ベクター構築物の転写を意味する。用語「発現」又は「遺伝子発現」は、特に、遺伝子（複数可）又は遺伝子ベクター構築物のmRNAへの転写を意味する。このプロセスは、DNAの転写を含み、生じたRNA産物のプロセシングを含み得る。用語「発現」又は「遺伝子発現」は、mRNAの翻訳及びそれとともにコードされるタンパク質の合成、すなわちタンパク質発現を含むこともできる。
本発明はまた、以下に関する。
［項目１］
細胞中の標的核酸(標的NA)分子を改変するための方法であって、
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び
d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起きた1つ以上の細胞を単離する工程
を含み、
fuNAはRNAからなる、方法。
［項目２］
gNA分子が、標的NA分子の同数の連続する塩基と相補的な少なくとも12塩基を含むスペーサー核酸(スペーサーNA)分子を含む、項目1に記載の方法。
［項目３］
gNA分子がスキャフォールド核酸(スキャフォールドNA)分子をさらに含む、項目2に記載の方法。
［項目４］
スキャフォールドNA分子がgNA分子に共有結合している、項目3に記載の方法。
［項目５］
細胞が、微生物、動物、ヒト又は植物細胞である、項目1～4のいずれか一項に記載の方法。
［項目６］
部位特異的核酸改変ポリペプチドが、核酸にガイドされた核酸改変ポリペプチド又はその機能的等価物である、項目1～5のいずれか一項に記載の方法。
［項目７］
fuNA分子が、前記fuNA分子をコードする1つ以上の発現構築物として導入される、項目1～6のいずれか一項に記載の方法。
［項目８］
gNA分子に共有結合により連結したdoNA分子を含む組換えfuNA分子であって、fuNAがRNAからなる、fuNA分子。
［項目９］
項目8に記載のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含むベクター。
［項目１０］
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び場合により
c.スキャフォールドNA分子をコードするベクター
を含む、ベクターシステム。
［項目１１］
細胞内の標的NAを改変するためのシステムであって、
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、及び場合により
d.スキャフォールドNA分子をコードするベクター
を含む、システム。
［項目１２］
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、並びに場合により
d.スキャフォールドNA分子をコードするベクター
を含む、組成物。
［項目１３］
細胞内の標的NA分子を改変するための、項目9に記載のベクター、項目10に記載のベクターシステム、項目11に記載のシステム又は項目12に記載の組成物の使用。

図１～１２は、本発明の融合核酸分子の好ましい構造を示す。部位特異的核酸改変ポリペプチドは、ドナーNAに融合されたガイドNA（共にfuNA分子を形成する）によって標的二本鎖核酸内の標的配列に向けられる。

5'から3'にかけて:ガイドNA(スペーサーに続いてスキャフォールド)、場合によってさらなる核酸領域により分離されるホモロジーアーム1及び2を含む、融合NA分子を示す図である。 5'から3'にかけて:場合によってさらなる核酸領域により分離されるホモロジーアーム2及び1、並びにガイドNA(スキャフォールドに続いてスペーサー)を含む、融合NA分子を示す図である。 5'から3'にかけて:ガイドNA(スペーサーに続いてスキャフォールド)、場合によってさらなる核酸領域により分離されるホモロジーアーム2及び1を含む、融合NA分子を示す図である。 5'から3'にかけて:場合によってさらなる核酸領域により分離されるホモロジーアーム1及び2、並びにガイドNA(スキャフォールドに続いてスペーサー)を含む、融合NA分子を示す図である。 5'から3'にかけて:場合によってさらなる核酸領域により分離されるホモロジーアーム1及び2、並びにガイドNA(スペーサーに続いてスキャフォールド)を含む、融合NA分子を示す図である。 5'から3'にかけて:ガイドNA(スキャフォールドに続いてスペーサー)、場合によってさらなる核酸領域により分離されるホモロジーアーム1及び2を含む、融合NA分子を示す図である。 5'から3'にかけて:場合によってさらなる核酸領域により分離されるホモロジーアーム2及び1、並びにガイドNA(スペーサーに続いてスキャフォールド)を含む、融合NA分子を示す図である。 5'から3'にかけて:ガイドNA(スキャフォールドに続いてスペーサー)、場合によってさらなる核酸領域により分離されるホモロジーアーム2及び1を含む、融合NA分子を示す図である。 5'から3'にかけて:ガイドNA(スペーサー及び第1のスキャフォールド分子を含む)、場合によってさらなる核酸領域により分離されるホモロジーアーム1及び2を含む、融合NA分子を示す図である。第2のスキャフォールド分子は、第1のスキャフォールド分子にハイブリダイズしている。 5'から3'にかけて:場合によってさらなる核酸領域により分離されるホモロジーアーム1及び2、並びにガイドNA(第1のスキャフォールド分子及びスペーサーを含む)を含む、融合NA分子を示す図である。第2のスキャフォールド分子は、第1のスキャフォールド分子にハイブリダイズしている。 5'から3'にかけて:ガイドNA(スペーサー及び第1のスキャフォールド分子を含む)、場合によってさらなる核酸領域により分離されるホモロジーアーム2及び1を含む、融合NA分子を示す図である。第2のスキャフォールド分子は、第1のスキャフォールド分子にハイブリダイズしている。 5'から3'にかけて:場合によってさらなる核酸領域により分離されるホモロジーアーム2及び1、並びにガイドNA(第1のスキャフォールド分子、スペーサー及び第1のスキャフォールド分子にハイブリダイズする第2のスキャフォールド分子を含む)を含む、融合NA分子を示す図である。ベクターRWL121を示す図である。ベクターCas003を示す図である。ベクターCas018を示す図である。ベクターCas006を示す図である。ベクターRWL137を示す図である。ベクターCas019を示す図である。ベクターRLW138を示す図である。ベクターCas020を示す図である。ベクターRLW139を示す図である。示されるようにホモロジー領域HomA及びHomBの位置と共に枯草菌ATCC6051株(A)のアミラーゼamyE遺伝子座を示す図である。amyE遺伝子内のプロトスペーサー配列PSの位置は(A)で示され、PSの配列を強調する(白文字を有する黒色、B)。 pCC004プラスミド(amyEプロトスペーサー及びamyE遺伝子に隣接する領域の相同領域HomA及びHomBを保有するpJOE8999プラスミドの誘導体)のベクターマップを示す図である。PS =プロトスペーサー;PvanP* =半合成プロモーター;'gRNA =ガイドRNA;ラムダT0ターミネーター;PmanP = manP遺伝子枯草菌のプロモーター;Cas9 = S. pyrogenes由来のエンドヌクレアーゼ;KanR =カナマイシン耐性遺伝子;E. coliにおける複製のためのpUCの起点、バチルスにおける複製のためのpE194の起点。 (プラスミドpCC004を用いて図2に例示される)この研究で使用された種々のプラスミドのEcoRI / XbaI断片の模式図を示す図である。Cas9エンドヌクレアーゼ、PmanPプロモーター及びpUC複製起点を有するベクター骨格、pE194複製起点、カナマイシン耐性遺伝子は示されていない。下流の遺伝子エレメントの転写を促進するプロモーター(Pro)が示される。PS =プロトスペーサー; gRNA = crRNA-ループ-tracrRNAからなるガイドRNA、T =ラムダT0ターミネーター;相同性領域A及び相同性領域Bは、amyE遺伝子の向きを示す矢印として描かれている。J. Altenbuchnerによるプラスミド遺伝子エレメントの詳細な説明(Altenbuchner J. 2016. Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421～5頁)。 pCC004と比較した各遺伝子欠損構築物(pJOE8999、pCC005-pCC008)のアミラーゼ遺伝子について例示した遺伝子ノックアウト効率を、示した欠失構築物に対してプロットした図である。示されたプラスミドpCC004、pCC005、pCC006、pCC007、pCC008との遺伝子欠失反応からの13個の個々のクローンのゲノムDNA上のオリゴヌクレオチド配列番号60及び61とのPCR反応の0.8%アガロースゲルを示す。1.4kbのDNA断片の増幅は組換えによる遺伝子ノックアウトを示し、3.4kbのDNA断片はむしろSOS修復機構によるアミラーゼ遺伝子の不活性化を示す。WTについての3.4kbバンドは、枯草菌WT ATCC6051の野生型アミラーゼ遺伝子座を示す。CはゲノムDNAを添加していない水対照を示す。Mは、3つのバンド(1.0kb、1.5kb、4.0kb)のサイズを有するDNAラダー「Perfect plus 1kb DNA ladder」(roboklon)を示す。

化学薬品及び一般的な方法
他に示されない限り、制限消化、アガロースゲル電気泳動、核酸の精製、核酸のライゲーション、形質転換、細菌細胞の選択及び培養を含む本発明の目的のために行われるクローニング手順は、記載されるように実施される(Sambrook J、Fritsch EF及びManiatis T(1989))。Sanger技術(Sangerら、1977)を用いて、レーザー蛍光DNAシーケンサー(Applied Biosystems、Foster City、CA、USA)を用いて、組換えDNAの配列分析を行う。他に記載がない限り、化学薬品及び試薬はSigma Aldrich(Sigma Aldrich、St. Louis、USA)から、Promega(Madison、WI、USA)、Duchefa(Haarlem、Netherland)又はInvitrogen(Carlsbad、CA、USA)から得られる。制限エンドヌクレアーゼは、New England Biolabs(Ipswich、MA、USA)又はRoche Diagnostics GmbH(Penzberg、Germany)からである。オリゴヌクレオチドは、Eurofins MWG Operon(Ebersberg、Germany)によって合成される。

実験手順の導入
C末端SV40核局在化シグナルを有するCas9タンパク質の酵母コドン最適化バージョン(配列番号1)を合成し、酵母発現ベクターにクローニングした。同ベクターは、サッカロマイセス・セレビシエSNR52ポリメラーゼIIIプロモーターから発現された1つ以上のガイドRNA(gRNA)を含んでいた。

Cas9は、正しいプロトスペーサー-隣接モチーフ(PAM)が3'末端に存在する場合にのみ、gRNAによる標的配列の認識の際にDNAに結合し、両方の鎖を切断する。理論的には、GN20GG型の任意の配列を標的とすることができる。そこで、設計されたCRISPRシステムによって標的とされるレポーターシステム(GAL4-UAS(配列番号7))の酵母における同時発現のために第2のベクターを構築した。いくつかの非機能的Gal4標的(配列番号9～15)を標的化及び修復するために、gRNAドナー融合体(融合NA)を使用した。

Gal4(配列番号8)は、N末端に位置するDNA結合ドメイン及びC末端での転写活性化のための領域の2成分からなる酵母転写活性化因子である。Gal4は、酵母ゲノム中のマーカー遺伝子の特異的認識配列UAS(upstream activating sequence;上流活性化配列)に結合し、それらの転写を活性化する。MaV203酵母株は、酵母ゲノム中の異なる遺伝子座に安定に組み込まれた3つのレポーター遺伝子(HIS3、URA3及びlacZ)のそれぞれの単一のコピーを含有する。URA3、HIS3及びlacZのプロモーター領域は無関係である(GAL4結合部位の存在を除いて)。

いくつかの非機能的(欠失及び/又は停止コドン挿入することによる破壊)バージョンのGal4を合成し(配列番号9～15)、同時発現させたCRISPR機構によって標的化及び修復することができるように、酵母細胞に形質転換した。CRISPR成分を備えた適切な修復ドナー配列を用いた相同組換え(HR)による完全長Gal4の修復は、lacZ及びHIS3レポーター遺伝子の活性化をもたらす。Gal4遺伝子の修復及びそれに伴う転写活性化は、ヒスチジンを欠くプレート上での細胞増殖によってモニターすることができるが、X-gal(5-ブロモ-4-クロロ-3-インドリル-β- D-ガラクトピラノシド)を用いてアッセイするとlacZ遺伝子の誘導により青色となる。

使用される酵母株は、両方の発現構築物の選択を可能にするために、2つのさらなる栄養要求性突然変異(leu2及びtrp1)を含有する。

本明細書に開示される融合システムの修復効率の増加を検証するために、全ての実験を、ドナー及びガイドRNAが別々に転写される非融合カセットと並行して行った。

酵母株、培地及び培養条件
記載された実施例において使用されるサッカロマイセス・セレビシエ株は、MaV203(MATα、leu2～3,112、trp1-901、his3Δ200、ade2-101、gal4Δ、gal80Δ、SPAL10::URA3、GAL1::lacZ、HIS3UAS GAL1::HIS3@LYS2、can1R、cyh2R)であり、Life Technologiesによって市販されている。酵母は、2%グルコースを補充し、適切な栄養要求性化合物(ForMedium、英国)を欠く酵母窒素原ベースに基づく合成最小培地(SD Media)で増殖させた。培養は30℃で、振とう器又はインキュベーションオーブンのいずれかで行った。

大腸菌は、本発明者らの実験で使用された全てのプラスミドのための増殖微生物として、並びに改変された標的のさらなる増殖及び維持のために使用された。大腸菌を、標準的な微生物学的手法(Molecular Cloning:A Laboratory Manual、第3版、1,2及び3巻 J.F. Sambrook及びD.W. Russell編、Cold Spring Harbor Laboratory Press、2001)に従って増殖させた。Cas9、ガイドRNA及びドナーNAを含有するプラスミドは、大腸菌における複製及び維持のためのpUCベースの複製起点及びアンピシリン耐性遺伝子を含んでいた。一方、GAL4標的プラスミドはゲンタマイシン耐性遺伝子(Gmr)を含有した。

[実施例1]
プラスミドの構築
Cas9遺伝子は、真核細胞の発現のために元来構築されたストレプトコッカス・パイオゲネスCas9の酵母コドン最適化バージョンであった(SpCas9; WO2007/025097)(Maliら(2013)Science 339(6121); Congら(2013)Science 339(6121))。このCas9遺伝子は、両端においてSV40核局在化シグナルでタグ付けされ、合成された。また、gRNA及びインビボRNA合成のためのSNR52プロモーターを含有するドナー発現カセットを合成した。

pDEST22(Life Technologies)のGAL4-ADコード配列を、シームレスクローニング(Life Technologies)を介して合成Cas9に置き換えた。このベクターは、酵母における発現のための酵母アルコールデヒドロゲナーゼ遺伝子(ADH1)の構成的中強度プロモーター及び転写ターミネーター並びにトリプトファンを欠く培地上の酵母における選択のためのTRP1遺伝子を含有する。

同ベクターは、設計されたgRNA及びドナー発現カセット(融合又は二重分子として)を、Gatewayクローニング(ライフテクノロジーズ)を介して同じ発現ベクターに導入することを可能にする、クロラムフェニコール耐性遺伝子(Cmr)及びccdB遺伝子に隣接するattR1及びattR2の2つの組換え部位を含有する。LR組換え反応の後、Cmr及びccdB遺伝子を融合NAカセット又は非融合ドナー及びガイド発現カセットにより置換した。

酵母におけるCRISPR修復の標的として使用される改変GAL4コード配列を合成した。酵母における発現のためのpDEST32プラスミド(Life Technologies)をHindIII及びSacIIでカットし、ADH1プロモーター及びターミネーターを含有するバックボーンをゲル精製した。GAL4合成インサートを、シームレスクローニングを用いてベクターに組み入れた。このベクターは、酵母においてトリプトファンを欠く培地上で選択するためのLEU2遺伝子を含んでいた。

GAL4配列中のCas9による認識のための標的部位は、GAL4遺伝子内の潜在的なPAM(NGG)配列に先行する20mer領域を選択することによって経験的に選択された(Sternbergら(2014);Nature 507(7490))。

Cas9の結合及びRループの形成を容易にするために、Jinekら((2012) Science、337(6096))によって最初に設計されたように、ダングリングスペーサー、伸長ヘアピン領域及び長い3'末端を含有する二次構造を有する単一のガイドRNAデザインを選択した。

[実施例2]
酵母形質転換
CRISPR編集ツール(Cas9酵素及び融合NA発現カセット)及びGAL4標的プラスミドの同時形質転換を、製造元のプロトコール(Life Technologies)に記載されているように熱ショックにより行い、導入したプラスミドによって補完される栄養要求性化合物(ロイシン及びトリプトファン)を欠く適切な合成完全(SC)培地中で増殖させた。形質転換された細胞を一晩増殖させ、100mMの3-アミノ-1,2,4-トリアゾール(3-AT; ForMedium、UK)を有するヒスチジンを欠く合成完全(SC)培地を含有する固体プレートに等量の形質転換体(OD測定による)を移した。HIS3の発現(ヒスチジンを含まない培地中で酵母を増殖させるため)はGAL4依存性であり、したがって形質転換体はGAL4修復が起こった場合にのみ増殖することができる。さらに3-ATはHIS3遺伝子産物の競合阻害剤であり、HIS3に依存してヒスチジンを産生する酵母形質転換体に3-ATを適用することにより、酵母細胞が生き残るためにHIS3発現のレベルの増大が必要となる。

さらに、使用した酵母株はGAL4の制御下にlacZマーカー遺伝子を含有し、GAL4修復形質転換体のブルー/ホワイト選択が可能となる。lacZ遺伝子が誘導されると、X-gal(5-ブロモ-4-クロロ-3-インドリル-β-D-ガラクトピラノシド)でアッセイした場合に青色となる。

[実施例3]
X-galアッセイ
ヒスチジンを欠くプレートで増殖する形質転換体を、YPAD培地(ペプトン、酵母エキス及びグルコースの均一混合物を含有する複合酵母培地;ForMedium、英国)を有するプレートの表面に置かれたニトロセルロース膜(Hybond、GE Healthcare)の上にレプリカプレーティングした。膜を含有するYPADプレートの18～24時間のインキュベーション後にアッセイを行った。各膜については、5mgのX-galを50μlのDMFに溶解し、30μlの2-メルカプトエタノール及び5mlのZ緩衝液と混合した。この溶液を用いて、15cmのペトリ皿中の2つの丸い濾紙(Whatman 541)を飽和させた。鉗子を用いて、膜をYPADプレートの表面から注意深く除去し、約20秒間液体窒素に完全に浸漬した。浸したWhatmanフィルターの上に凍結膜を置いた(コロニー側を上にして)。プレートをしっかりと覆い、37℃でインキュベートする。青色の外観を24時間後にモニターした。

[実施例4]
標的(CRISPR修復)プラスミドの配列決定
4つの各実験、少なくとも8つのGAL4修復陽性形質転換体(ヒスチジンを含まない培地で増殖可能なコロニー)を液体培地で一晩、継代培養し、GAL4含有プラスミドを単離した(Zymoprep Yeast Plasmid Miniprep II、Zymo Researchを使用)。単離したプラスミドをさらなる増殖及び商業的配列決定のために大腸菌に導入した。GAL4配列決定により、ドナー分子による配列修復及びアセンブリの確認が可能となった。

陽性クローン中のGal4遺伝子のサンガー配列決定は、この標的化プロセスの配列特異性をさらに検証し、融合NAで形質転換された細胞がHRイベントではるかに高い成功数を示したとしても、融合体又は非融合体としてのドナー及びgRNAを発現する細胞の修復において違いを示さなかった。

[実施例5]
15bpのホモロジーアームを用いた1ntの欠失
ガイドRNAにドナー(ドナー1;配列番号26)を融合すると、修復された形質転換体(ヒスチジンを欠く培地で増殖することができる)をもたらしたが、非融合ガイド及びドナーRNAを用いた形質転換体については、増殖は観察されなかった。遺伝子修復の効率の低さは、相同組換えのために利用可能な配列オーバーラップの減少と一致している。

[実施例6]
50bpのホモロジーアームを用いた1ntの欠失
ドナー(ドナー2;配列番号27)をガイドRNAに融合すると、非融合ドナー及びガイドNAよりも少なくとも50倍多くの形質転換体が得られた。

陽性クローン中のGal4遺伝子の配列決定は、HRからのみ、又はほとんどHRから修復結果を示した(全ての配列決定されたクローンについてNHEJの証拠がない)。

[実施例7]
50/26bpのホモロジーアームを用いた20ntの挿入
上記と同じ融合NAを使用して、20ntが除去された同様の標的(標的3;配列番号11)を修復し、結果として1つのホモロジーアームが減少した。融合により、非融合ドナー及びガイドNAよりも約5倍の形質転換体が得られた。陽性クローン中のGal4遺伝子の配列決定により、相同組換えのみからの修復結果が示された。

[実施例8]
(3nt離れた2つの標的配列を試験する間の)50bpのホモロジーアームを用いた失われた400bpの挿入
互いに近接して位置する(2つの20nt標的の間が3ntギャップ)2つの配列(スペーサー2及びスペーサー3;配列番号20及び21)を、独立及び一緒に(多重標的化)、同時標的化することについて試験した。多重融合カセットは、2つのgRNA及び修復鋳型で構成される単一の分子の産生をもたらす、2つのタンデム融合NA配列が続くプロモーターからなっていた。本発明者らの実験は、融合NAが2つの配列を同時に標的とすることもできることを明確に示した。

両方の標的について、ドナーガイド融合の存在下での修復は非融合バージョンよりもはるかに効率的であった(スペース2での標的化については最大10倍以上、スペーサー3については5倍以上)。

[実施例9]
120bpのホモロジーアームを用いたHR末端を除く完全GAL4遺伝子(960bp)の挿入
融合CRISPRが全長コード配列の導入に有効であるかどうかを試験するために、全長GAL4遺伝子(配列番号7)の導入を試験した。例として、本発明者らは、実施例4において既に有効であることが判明しているドナー/ホモロジーアームの長さの比率を維持するように、120bpのホモロジーアームを選択した。完全長GAL4遺伝子の挿入は、融合構築物で約4倍有効である。

本発明者らの結果は、修復ドナー配列がgRNAに融合された場合、標的化された編集が少なくとも50倍効率的であることを示す。行われた実験は、単一塩基除去から完全な遺伝子挿入までの幅広い融合関連の有効性を改善させることを示す。報告された実施例は、このCRISPR融合システムが、ガイドRNAに融合された比較的大きなドナー分子を運ぶことに適していることを示している。

[実施例10a]
イネにおける発現のための構築物
アグロバクテリウム媒介植物形質転換にCRISPR/Casシステムを適合させるために、GatewayバイナリーT-DNAベクターをCas9ヌクレアーゼ及びガイドRNAドナー発現カセット(単一又は二重RNA分子のいずれかとして)の共発現のために設計した。両端のSV40核局在化シグナル(NLS)(配列番号6)に結合したイネ(Oryza sativa)における発現のためにコドン最適化されたストレプトコッカス・パイオゲネスCas9(SpCas9)のバージョンを合成した。合成されたカセットは、Cas9の上流に位置する構成的発現のためのトウモロコシポリユビキチン(Ubi)プロモーター(配列番号32)、及び3'末端にノパリン合成酵素(nos)ターミネーター(配列番号33)を含む。この遺伝子カセットは、Seamlessを介してベクターにクローニングされており、T-DNA境界内に機能的要素として:植物選択マーカー;スクリーニング可能なマーカー発現カセット;及びエントリークローン中のgRNA-ドナー発現カセットとのLR組換えを意図したGatewayカセットを含有していた。

選択された標的部位でゲノム二本鎖切断をもたらす、イネプロトポルフィリノーゲンオキシダーゼ(PPO)遺伝子(WO2015/092706;WO2015/022640(配列番号35))を標的化した3つのgRNAが設計された(スペーサー8、スペーサー9及びスペーサー10(配列番号36、37及び38))。修飾は、以前にサフルフェナシル生存の潜在的なホットスポットとして同定された2つのアミノ酸置換(L419F、F442V;単一部位突然変異及び二重部位突然変異)を目的とする。

融合又は非融合NAのいずれかを含有するRNA発現カセット(PPO遺伝子の選択された位置のための遺伝子特異的スペーサー配列を含む)を合成し、エントリーベクターにクローニングし、CAS9発現カセットを含有する目的ベクターに(Gatewayを介して)クローニングした。gRNAとドナーのRNA発現は、U3 snRNAのpol III型プロモーターによって駆動される。

LR組換え工程の後、得られた発現ベクターを、当技術分野で周知の方法に従ってアグロバクテリウム株LBA4044に形質転換する。

[実施例10b]
イネにおける発現のための構築
SV40に由来するNLSを、N末端で植物核局在化シグナル(NLS)(MSERKRREKL、配列番号71)及びC末端でインポーチン(importin) NLS(KRPAATKKAGQAKKKK 配列番号:72)で置換した以外は、実施例10aに記載したものと同一のベクターを合成し、gRNA及びドナーのRNA発現を促進するプロモーターはU3 snRNA(配列番号:73)のイネpol III型プロモーターであった。

融合又は非融合NAのいずれかを含有するRNA発現カセット(PPO遺伝子内の選択された位置の遺伝子特異的スペーサー配列を含む)を合成し、エントリーベクターにクローニングし、CAS9発現カセットを含有する目的ベクターに(Gatewayを介して)クローニングした。

非融合対照として使用したベクターには、PRO0231::U3 RNA pol IIIプロモーター::スペーサー::sgRNAスキャフォールド::TTTTTTTTターミネーター::U3 RNA pol IIIプロモーター::テンプレート::TTTTTTTTターミネーターが含有される。

[実施例11]
イネ形質転換及び除草剤耐性カルスの選択
発現ベクターを含有するアグロバクテリウムは、インディカイネ(Oryza sativa L.)の胚盤由来カルスを形質転換するために使用される。成熟種子の滅菌は、70%エタノール中で1分間インキュベートし、続いて6%次亜塩素酸ナトリウム中で40分間インキュベートし、続いて滅菌MQ水で3～5回洗浄することによって行った。その後、滅菌した種子を2,4-D(カルス誘導培地)を含有する培地上で発芽させる。光の中で6日間インキュベートした後、胚盤由来のカルスを細菌溶液(OD₆₀₀=0,1)中で90秒間インキュベートし、排水し、滅菌濾紙上で乾燥させ、次いで細菌と共に3日間、暗所において25℃で共培養する。共培養したカルスを、32℃の光の中で4週間、G418を含有する選択培地に移す。抗生物質耐性カルス片を、32℃の光の中で2週間、25又は50μMのサフルフェナシル(saflufenacil;Kixor(商標))を含有する選択培地に移す。これらの除草剤選択条件は、サフルフェナシルを用いた殺傷曲線における組織生存の分析によって確立されている。除草剤耐性材料を再生培地に移し、光でインキュベーションした後、胚形成可能性が解放され、次の4～5週間でシュートが発達する。シュートをカルスから切除し、シュートが土壌への移行のためによく根づくまで、オーキシン含有培地で2～3週間インキュベートする。硬化したシュートは、温室内で高湿度及び短日間栽培される。

[実施例12]
除草剤耐性形質転換体の分子的特徴づけ
個々の植物形質転換体から回収された葉組織は、PPO遺伝子配列変異のコピー数分析及び分子的特徴づけのために使用される。ゲノムDNAを、Wizard 96マグネチックDNA植物システムキット(Promega、米国特許第6,027,945号及び6,368,800号)を製造業者の指示通りに用いて抽出する。単離されたDNAを、フォワード及びリバースプライマーと共に適切なプローブを用いてPCR増幅した。T-DNAインサートのコピー数を確認するためのこの定量的PCR分析の後、選択薬剤に対する耐性を示す低コピートランスジェニック植物のみをT1種子の収穫のために保持する。その後、種子は移植後3～5ヶ月で収穫される。

PPOゲノム配列のPCR増幅は、以下のようにサーモサイクリングプログラムを使用して、Fusion Taq DNAポリメラーゼ(Thermo Scientific)を用いて行う:96℃で15分、続いて35サイクル(96℃、30秒; 58℃、30秒; 72℃、3分及び30秒)、72℃で10分。PCR産物を、アガロースゲル電気泳動によって濃度及び断片サイズについて検証し、PCRプライマーを用いた配列決定に送る。シーケンス分析は、代表的なクロマトグラムトレースファイル及び対応するAlignXアライメントを初期の設定で実行し、二次ピークを呼び出すように編集する。

配列情報に基づいて、いくつかの個体で同定された突然変異は、NAのCRISPR成分への融合を含む本発明に記載の技術が植物生物に適用可能であることを示す。提供されたドナーとの相同組換え修復は、サフルフェナシルに対する耐性を付与する(単一部位突然変異及び複数部位突然変異)。

[実施例13]
大腸菌における制御された遺伝子ノックアウト
この実施例において、FusionCRISPRは、大腸菌K-12株の亜株MG1655の標的遺伝子RecAをノックアウトするために使用されている。細菌株を100ml三角フラスコ中の10mlのSOBに接種し、37℃で一晩増殖する(SOB:2%バクト-トリプトン、0.5%酵母エキス、10mM NaCl、2.5mM KCl、10mM MgCl₂、10mM MgSO₄)。3mlの一晩培養液を1リットル三角フラスコ中の250mlのSOBに希釈し、OD_660nmが0.6になるまで激しく振とう(200～250rpm)しながら18℃で増殖する。続いて、培養物を予め冷却した50mlチューブに移し、5000rpmで4℃、5分間遠心分離する。ペレットを元の容量の1/3の氷冷TB(TB:250mM KCl、10mM PIPES遊離酸、15mM CaCl₂・2H₂O、55mM MnCl₂・2H₂O)に再懸濁し、氷上で10分間インキュベートした。細胞を5000 rpmにて5分間4℃で遠心分離し、ペレットを元の容量の1/12の氷冷TBに再懸濁する。DMSOを、7%の最終濃度まで穏やかに混合しながら添加する。コンピテント細胞を200μlずつのアリコートに分け、液体窒素中で凍結する。コンピテント細胞の1つのアリコートを、pCas9に存在するクロラムフェニコール選択マーカー及びCas9発現カセット[Jiang W、Bikard D、Cox D、Zhang F、Marraffini L(2013)RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol]並びに以下のFusionCRISPR配列及びRecAスペーサーを有する融合RNA発現のためのカセット[Zhao D、Yuan S、Xiong B、Sun H、Ye L、Li J、Zhang X、Bi C.(2016)Development of a fast and easy method for Escherichia coli genome editing with CRISPR/Cas9. Microb Cell Fact. 15(1):205]を含有する0.1～0.5μgのプラスミドと共に加える:

ここで、RecAを認識するスペーサーが強調表示され、sgRNAについての必須配列は下線でない大文字であり、RecAを有するホモロジーアーム1は二重下線であり、RecAを有するホモロジーアーム2は一重下線である。FusionCRISPR構築物及びCas9のプロモーター及びターミネーターは、http://parts.igem.org/Promoters/Catalog/Constitutive及びhttp://parts.igem.org/Terminators/Catalogから選択することができる。標的化RecA遺伝子は以下の配列を有する:

ここで、PAM配列はイタリック体であり、ホモロジーアーム1は二重下線であり、ホモロジーアーム2は一重下線であり、プロトスペーサーは強調されている。DNA及び細胞は、42℃で90秒間の熱ショックの前に30分間氷上に保持する。細胞及びDNAを氷に移し、1分後、1mlのLBを加える(LB:1%トリプトン、1%NaCl、0.5%酵母エキス、pH 7.0)。細胞を37℃で1時間回復させる。回復期は、FusionCRISPR構成要素がより多くの時間で大腸菌ゲノムを編集することが可能となるように、16時間まで延長することができる。プラスミドの損失を防ぐために、25μg/mlのクロラムフェニコールは1時間後に添加するべきである。細胞を25μg/mlのクロラムフェニコールを含むLB培地上にプレーティングし、37℃で1日間インキュベートする。単一のコロニーをプレートから選択し、クロラムフェニコール入りのLB中に37℃で一晩増殖させ、その後ゲノムDNAを抽出する[He、F.(2011)E. coli Genomic DNA Extraction. Bio-protocol Bio101:e97]。第1のホモロジーアームの上流のフォワードプライマー(ATGGCTATCGACGAAAACAAA)(配列番号44)及び第2のホモロジーアームの下流のリバースプライマー(CGTCAGCGTGGTTTTACCGGA)(配列番号45)を用いたPCRを実行し、RecA配列(配列番号43)において太字で示されている11ヌクレオチドがFusionCRISPR鋳型での相同組換え修復のためにもはや存在しないコロニーを同定する。PCR断片は、標準ゲル電気泳動後に遺伝子座の改変を確認するために、配列決定されるか(予想されるサイズ220bp)又は、この場合、AgeI切断(PAM周囲の欠失配列はAgeI認識部位ACCGGTを含有する)に供され得る。11ヌクレオチドの欠失は、オープンリーディングフレームの破壊を確実にする。

[実施例14]
ヒト誘導性多能性幹細胞(hiPSCs)及びHEK293細胞におけるPRDM9遺伝子の制御されたノックアウト
hiPSCs及びHEK293細胞における細胞培養維持、プラスミド構築、トランスフェクション方法及びゲノム編集の分子分析は、Yang L、Yang JL、Byrne S、Pan J、Church G(2014)CRISPR/Cas9-directed genome editing of cultured cells. Current Protocols in Molecular Biology 31.1.1～31.1.17に詳細に記載されている。PRDM9遺伝子のノックアウトについては、gRNAプラスミド設計のわずかな変更のみで、全ての工程をその文献に記載されるのに従う。合成されたgRNAは、以下の配列を有するべきである:

ここでU6プロモーターがイタリック体で示され、PRDM9エクソンENSE00001804383を認識するスペーサーが強調表示され、sgRNAに必須の配列は下線でもイタリック体でもない大文字であり、PRDM9とのホモロジーアーム1は二重下線であり、PRDM9とのホモロジーアーム2は一重下線であり、ターミネーターは小文字である。標的化されたPRDM9エクソンENSE00001804383は、以下の配列を有する:

ここで、PAM配列はイタリック体であり、ホモロジーアーム1は二重下線であり、ホモロジーアーム2は一重下線であり、プロトスペーサーが強調されている。太字で示されるヌクレオチドは、ゲノムDNAからそれぞれのゲノム領域を増幅するPCR及び結果として生じるPCR産物のシーケンシングを用いて示されるように、FusionCRISPR構築物との相同組換えの際に欠失され、フレームシフトを生じる。

[実施例15]
イネにおけるシクロヘキサンジオン(DIM)及び/又はアリルオキシフェノキシプロピオネート(FOP)をもたらすイネ植物における点突然変異の導入。
プラスチドアセチルコエンザイムAカルボキシラーゼ(ACCase)の突然変異I1781L及びG2096Sは、DIM及びFOP除草剤に対する耐性を付与することが知られている。これらの突然変異は、以下のベクターを用いて内因性ACCase遺伝子座に導入することができる。

ベクターRLW137配列番号66
このベクターの骨格は、gatewayが可能となる構築物RLW121配列番号62である。

RLW137のENTRベクターは、ベクターCC003配列番号63(入ってくるT-DNAに対する選択マーカー)、CC018配列番号64(G2096に対応するDNAの上流をカットした後にG2096Sを標的とし導入するFusionCRISPR構築物を産生する)及びCC006配列番号65(Cas9を提供する)である。

CC018(CRISPRCas018の短縮形)は、入ってくるヌクレオチドに隣接する～300ntのホモロジーアーム(この場合、G2096Sをコードする)を含有する。さらなる突然変異は、T-DNA(突然変異したPAM、代替的に又は加えて、スペーサーには、存在する場合にはエクソンに対応しており、イントロン/エクソンの境界に影響を与えない部分において好ましくはサイレントである多くの突然変異を含むことができる)の自己切断及びホモロジーアーム又は入ってくるヌクレオチドのいずれかに存在するTの長いストレッチでの転写の早期終了を回避するために同時導入される。

ドナー分子がガイドRNAに連結されていない別個の分子として発現される以外は同一である対照ベクターが合成される。

ベクターRLW137及び対照ベクターは、上記のプロトコールを用いてイネに形質転換される。初期選択は、ZmAHAS A122T S553Nマーカーの存在について選択する。形質転換された植物の分析は、実施例12に記載したように実施する。

RLW137について上述した手順と同様に、RLW138は同じ変異を導入するが、今回は代替的な下流のプロトスペーサー部位を使用する。RLW138は、CC003、CC019(配列番号67)及びCC006を有するRLW121バックボーンからなる。

変異I1781Lは、RLW121、CC003、CC020(配列番号69)及びCC006からなるRLW139(配列番号70)によって導入される。

[実施例16]
バチルスにおける融合CRISPRの適用
エレクトロコンピテント枯草菌細胞及びエレクトロポレーション
枯草菌ATCC 6051へのDNAの形質転換は、エレクトロポレーションによって行う。エレクトロコンピテント枯草菌ATCC 6051細胞の調製及びDNAの形質転換は、以下の改変と共に、Xueら(Xue、G.-P.、1999、Journal of Microbiological Methods 34、183～191頁)によって、本質的に記載されるよう行われる:DNAの形質転換において、細胞を1mlのLBSPG緩衝液中に回収し、37℃で60分間インキュベートし(Vehmaanpera J., 1989, FEMS Microbio. Lett., 61:165～170頁)、その後、選択的LB-寒天プレート上にプレーティングする。温度感受性pE194複製起点を含有するプラスミドについては、細胞を33℃で3時間回収する。

プラスミドの単離
プラスミドDNAは、(Sambrook、J.及びRussell、D.W. Molecular Cloning. A laboratory manual、第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、NY. 2001年)に記載の標準的な分子生物学的方法又はアルカリ溶解法(Birnboim、H. C.、Doly、J.(1979)、Nucleic Acids Res 7(6):1513～1523頁)によってバチルス及び大腸菌細胞から単離した。バチルス細胞は、細胞溶解前に37℃で30分間、10mg/mlのリゾチームで処理した大腸菌と比較した。

オリゴヌクレオチド二重鎖を形成するためのオリゴヌクレオチドのアニーリング。
オリゴヌクレオチドを水中で100μMの濃度に調整した。5μlのフォワード及び5μlの対応するリバースオリゴヌクレオチドを90μlの30mM Hepes緩衝液(pH 7.8)に添加した。反応混合液を95℃で5分間加熱し、続いて、反応温度を95℃から4℃まで0.1℃/secずつ下げる勾配によりアニーリングした(Cobb、R.E.、Wang、Y.、及びZhao, H. (2015). High-Efficiency Multiplex Genome Editing of Streptomyces Species Using an Engineered CRISPR/Cas System. ACS Synthetic Biology, 4(6), 723～728頁)。

分子生物学の方法と技術
プラスミドpJOE8999:
Altenbuchner J. 2016.Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421～5頁。

プラスミドpCC001
標準的な大腸菌クローニングベクター(pUC誘導体)に提供されたpJOE8999及び合成遺伝子断片配列番号048をAvrII及びXbaIでカットし、その後、pJOE8999プラスミド骨格及び配列番号049のより小さいAvrII/XbaI断片を単離する。T4-DNAリガーゼ(NEB)を用いて2つの断片を連結し、その後、大腸菌XL1-Blueコンピテント細胞(Stratagene)へ形質転換する。正しいプラスミドが回収され、pCC001と命名された。

プラスミドpCC002
標準的な大腸菌クローニングベクター(pUC誘導体)に提供されたpJOE8999及び合成遺伝子断片配列番号049をAvrII及びXbaIでカットし、その後、pJOE8999プラスミド骨格及び配列番号049のより小さいAvrII/XbaI断片を単離する。T4-DNAリガーゼ(NEB)を用いて2つの断片を連結し、その後、大腸菌XL1-Blueコンピテント細胞(Stratagene)へ形質転換する。正しいプラスミドが回収され、pCC002と命名された。

プラスミドpCC003
5'リン酸化を有するオリゴヌクレオチド配列番号050及び配列番号051をアニールして、枯草菌ATCC6051のアミラーゼ遺伝子amyEを標的とするプロトスペーサー配列をコードするオリゴヌクレオチド二本鎖を形成させる。プラスミドpJOE8999をBsaIでカットして、その後、プラスミドpCC003を回収するためにオリゴヌクレオチド二本鎖をライゲーションする。

プラスミドpCC004
枯草菌ATCC6051のアミラーゼamyE遺伝子に隣接する5'ホモロジー領域(HomAとも呼ばれる)及び3'相同性領域(HomBとも呼ばれる)を、それぞれオリゴヌクレオチド配列番号52、配列番号53及び配列番号54、配列番号55を用いて単離ゲノムDNA上でPCR増幅した。2つの相同性領域HomA及びHomBを、オリゴヌクレオチド配列番号52及び配列番号55とのオーバーラップPCRを用いて融合し、増幅して、amyE遺伝子の相同領域のHomAB PCR断片を回収した。プラスミドpCC003及びHomAB-amyE PCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomABを含有する正しいプラスミドを回収し、pCC004と命名した(図23)。

プラスミドpCC005
プラスミドpCC001をBsaIでカットし、その後、pCC003について記載したように、amyEプロトスペーサーオリゴヌクレオチド二本鎖(配列番号050/配列番号051)のクローニングを行った。得られたプラスミド及びpCC004の構築において記載したamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomABを含有する正しいプラスミドを回収し、pCC005と命名した。

プラスミドpCC006
枯草菌ATCC6051のアミラーゼamyE遺伝子に隣接する5'相同性領域(HomAとも呼ばれる)及び3'相同性領域(HomBとも呼ばれる)を、それぞれオリゴヌクレオチド配列番号56、配列番号57及び配列番号58、配列番号59を用いて単離されたゲノムDNA上でPCR増幅した。2つの相同性領域HomA及びHomBを、オリゴヌクレオチド配列番号56及び配列番号59とのオーバーラップPCRを用いて融合し、増幅して、amyE遺伝子の相同領域のHomAB PCR断片を回収した。pCC003について記載したように、プラスミドpCC001をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomAB(pCC005と比較して逆方向の)を含有する正しいプラスミドを回収し、pCC006と命名した。

プラスミドpCC007
pCC003について記載したように、プラスミドpCC002をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びpCC004の構築において記載したamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyE遺伝子のHomAB及びamyEプロトスペーサーを含有する正しいプラスミドを回収し、pCC007と命名した。

プラスミドpCC008
pCC003について記載したように、プラスミドpCC002をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びpCC006について記載したような配列番号56及び配列番号59のオリゴヌクレオチドを用いて増幅したamyEの相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。pCC007及びamyEプロトスペーサーと比較して逆向きのamyEのHomABを含有する正しいプラスミドを回収し、pCC008と命名した。

Fusion-CRISPRを用いた遺伝子欠失。
エレクトロコンピテント枯草菌ATCC6051細胞を、下記の改変と共に、本質的にXueら(Xue, G.-P.、1999、Journal of Microbiological Methods 34、183～191頁)によって記載されるように、プラスミドpJOE8999、pCC004、pCC005、pCC006、pCC007、pCC008各々1μgを用いて形質転換した:DNAの形質転換時に、細胞を1mlのLBSPG緩衝液中に回収し、33℃で3時間インキュベートし(Vehmaanpera J.、1989、FEMS Microbio. Lett.、61:165～170頁)、その後、Cas9誘導のために20μg/mlのカナマイシン及び0.2%のD-マンノースを補充したLB-Lennoxプレート上にプレーティングした。各々のプラスミド形質転換から10クローンまでを採取し、新鮮な予熱したLB-Lennoxプレート上に移し、50℃で18時間インキュベートした。大きく増殖した各コロニーから、細胞を採取し、新鮮なLB-Lennoxプレート上で3ストロークを行い、45℃で7～8時間のインキュベーション後に単一のコロニーを得た。LB-Lennoxプレート及び20μg/mlカナマイシンを補充したLB-Lennoxプレート上に単一コロニーを移植し、30℃で16～18時間インキュベートした。プラスミド損失を示すカナマイシン感受性クローンを、1%可溶性デンプンを補充したLB-Lennoxプレート上にプレーティングし、30℃で20時間インキュベーションした。アミラーゼamyE遺伝子の不活性化は、プレートをヨウ素含有Lugols溶液で覆うことによって視覚化し、明るいハローの存在又は非存在について分析し、後者は、不活性化が成功したことを示す。

表2は、プラスミド治癒(plasmid curing)後の全クローンの量、不活性化アミラーゼを有するクローンの量、全クローンに対する不活性化アミラーゼを有するクローンの百分率、及びpCC004に対する示されたプラスミドによる相対的ノックアウト効率を要約する(図25)。

SEQUENCE LISTING

<110> BASF Plant Science Company GmbH

<120> Improved methods for modification of target nucleic acids

<130> PA22-600

<150> EP16167773.7
<151> 2016-04-29

<150> EP16167774.5
<151> 2016-04-29

<150> EP17156018.8
<151> 2017-02-14

<160> 73

<170> BiSSAP 1.3

<210> 1
<211> 4140
<212> DNA
<213> Artificial Sequence

<220>
<223> Cas9 yeast

<400> 1
atggataaaa aatattctat tggtttggat attggtacta attctgttgg ttgggctgtt 60

attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120

cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180

gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240

tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300

ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360

aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420

aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480

atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540

gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600

attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660

agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720

ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780

gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840

caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900

ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960

atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020

caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080

ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140

gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200

aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260

gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320

gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380

agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440

gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500

aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560

tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620

tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680

gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740

tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800

attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860

ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920

catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980

agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040

gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100

tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160

catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220

gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280

attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340

atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400

gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460

gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatcat 2520

attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580

gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640

aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700

actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760

ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820

actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880

aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940

tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000

tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060

atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120

aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180

ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240

gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300

caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360

gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420

tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480

aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540

tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600

tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660

caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720

cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780

caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840

attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900

ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960

ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020

gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080

gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140

<210> 2
<211> 1379
<212> PRT
<213> Artificial Sequence

<220>
<223> Cas9 yeast protein

<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val

<210> 3
<211> 4140
<212> DNA
<213> Artificial Sequence

<220>
<223> Cas9 D10A H840A inactive

<400> 3
atggataaaa aatattctat tggtttggct attggtacta attctgttgg ttgggctgtt 60

attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120

cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180

gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240

tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300

ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360

aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420

aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480

atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540

gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600

attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660

agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720

ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780

gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840

caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900

ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960

atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020

caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080

ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140

gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200

aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260

gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320

gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380

agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440

gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500

aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560

tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620

tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680

gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740

tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800

attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860

ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920

catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980

agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040

gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100

tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160

catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220

gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280

attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340

atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400

gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460

gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatgct 2520

attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580

gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640

aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700

actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760

ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820

actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880

aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940

tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000

tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060

atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120

aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180

ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240

gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300

caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360

gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420

tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480

aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540

tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600

tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660

caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720

cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780

caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840

attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900

ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960

ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020

gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080

gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140

<210> 4
<211> 1379
<212> PRT
<213> Artificial Sequence

<220>
<223> Cas9 D10A H840A inactive protein

<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val

<210> 5
<211> 4155
<212> DNA
<213> Artificial Sequence

<220>
<223> Cas9 rice

<400> 5
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60

atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120

cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180

gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240

tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300

ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360

aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420

aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480

atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540

gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600

attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660

cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720

ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780

gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840

caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900

ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960

atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020

cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080

ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140

gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200

aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260

gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320

gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380

agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440

gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500

aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560

tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620

agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680

gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740

agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800

attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860

ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920

catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980

aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040

gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100

tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160

cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220

gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280

attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340

atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400

gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460

gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520

atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580

gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640

aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700

actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760

ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820

acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880

aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940

tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000

tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060

atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120

aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180

ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240

gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300

cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360

gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420

tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480

aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540

tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600

tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660

cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720

cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780

caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840

atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900

cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960

cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020

gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080

gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140

aagaagaaga agtag 4155

<210> 6
<211> 24
<212> DNA
<213> Artificial Sequence

<220>
<223> SV40 Nuclear Localizaion Signal

<400> 6
cccaagaaga agcggaaggt ctcg 24

<210> 7
<211> 957
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4

<400> 7
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120

tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180

ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240

ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300

aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360

acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420

caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480

atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540

ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600

ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660

ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720

tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780

agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840

gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900

tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957

<210> 8
<211> 318
<212> PRT
<213> Artificial Sequence

<220>
<223> GAL4 protein

<400> 8
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile
65 70 75 80
Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu
85 90 95
Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala
100 105 110
Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser
115 120 125
Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu
130 135 140
Thr Val Ser Pro Glu Phe Val Ile Arg Leu Thr Ile Gly Arg Ala Ala
145 150 155 160
Ile Met Glu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu His Met Ala
165 170 175
Met Glu Ala Glu Phe Met Asp Lys Ala Glu Leu Ile Pro Glu Pro Pro
180 185 190
Lys Lys Lys Arg Lys Val Glu Leu Gly Thr Ala Ala Asn Phe Asn Gln
195 200 205
Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr Phe Thr Asn Ser
210 215 220
Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn Ser Gln Ala Leu
225 230 235 240
Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn Phe Met Asn Asn
245 250 255
Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn Ser Lys Pro Leu
260 265 270
Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala Phe Gly Ile Thr
275 280 285
Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val Tyr Asn Tyr Leu
290 295 300
Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys Glu Ile
305 310 315

<210> 9
<211> 958
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4 target 1

<400> 9
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactggg agtgtcgcta 120

ctctcccaaa accaaaaggt ctccgctgac tagggcacat ctgacagaag tggaatcaag 180

gctagaaaga ctggaacagc tatttctact gatttttcct cgagaagacc ttgacatgat 240

tttgaaaatg gattctttac aggatataaa agcattgtta acaggattat ttgtacaaga 300

taatgtgaat aaagatgccg tcacagatag attggcttca gtggagactg atatgcctct 360

aacattgaga cagcatagaa taagtgcgac atcatcatcg gaagagagta gtaacaaagg 420

tcaaagacag ttgactgtat cgccggaatt tgtaatacga ctcactatag ggcgagccgc 480

catcatggag gagcagaagc tgatctcaga ggaggacctg catatggcca tggaggccga 540

attcatggat aaagcggaat taattcccga gcctccaaaa aagaagagaa aggtcgaatt 600

gggtaccgcc gccaatttta atcaaagtgg gaatattgct gatagctcat tgtccttcac 660

tttcactaac agtagcaacg gtccgaacct cataacaact caaacaaatt ctcaagcgct 720

ttcacaacca attgcctcct ctaacgttca tgataacttc atgaataatg aaatcacggc 780

tagtaaaatt gatgatggta ataattcaaa accactgtca cctggttgga cggaccaaac 840

tgcgtataac gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt 900

atataactat ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 958

<210> 10
<211> 938
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4 target 2

<400> 10
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga accaaaaggt 120

ctccgctgac tagggcacat ctgacagaag tggaatcaag gctagaaaga ctggaacagc 180

tatttctact gatttttcct cgagaagacc ttgacatgat tttgaaaatg gattctttac 240

aggatataaa agcattgtta acaggattat ttgtacaaga taatgtgaat aaagatgccg 300

tcacagatag attggcttca gtggagactg atatgcctct aacattgaga cagcatagaa 360

taagtgcgac atcatcatcg gaagagagta gtaacaaagg tcaaagacag ttgactgtat 420

cgccggaatt tgtaatacga ctcactatag ggcgagccgc catcatggag gagcagaagc 480

tgatctcaga ggaggacctg catatggcca tggaggccga attcatggat aaagcggaat 540

taattcccga gcctccaaaa aagaagagaa aggtcgaatt gggtaccgcc gccaatttta 600

atcaaagtgg gaatattgct gatagctcat tgtccttcac tttcactaac agtagcaacg 660

gtccgaacct cataacaact caaacaaatt ctcaagcgct ttcacaacca attgcctcct 720

ctaacgttca tgataacttc atgaataatg aaatcacggc tagtaaaatt gatgatggta 780

ataattcaaa accactgtca cctggttgga cggaccaaac tgcgtataac gcgtttggaa 840

tcactacagg gatgtttaat accactacaa tggatgatgt atataactat ctattcgatg 900

atgaagatac cccaccaaac ccaaaaaaag agatttaa 938

<210> 11
<211> 920
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4 target 3

<400> 11
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaacaagtg tctgaagaac taactggaag gtctccgctg actagggcac 120

atctgacaga agtggaatca aggctagaaa gactggaaca gctatttcta ctgatttttc 180

ctcgagaaga ccttgacatg attttgaaaa tggattcttt acaggatata aaagcattgt 240

taacaggatt atttgtacaa gataatgtga ataaagatgc cgtcacagat agattggctt 300

cagtggagac tgatatgcct ctaacattga gacagcatag aataagtgcg acatcatcat 360

cggaagagag tagtaacaaa ggtcaaagac agttgactgt atcgccggaa tttgtaatac 420

gactcactat agggcgagcc gccatcatgg aggagcagaa gctgatctca gaggaggacc 480

tgcatatggc catggaggcc gaattcatgg ataaagcgga attaattccc gagcctccaa 540

aaaagaagag aaaggtcgaa ttgggtaccg ccgccaattt taatcaaagt gggaatattg 600

ctgatagctc attgtccttc actttcacta acagtagcaa cggtccgaac ctcataacaa 660

ctcaaacaaa ttctcaagcg ctttcacaac caattgcctc ctctaacgtt catgataact 720

tcatgaataa tgaaatcacg gctagtaaaa ttgatgatgg taataattca aaaccactgt 780

cacctggttg gacggaccaa actgcgtata acgcgtttgg aatcactaca gggatgttta 840

ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 900

acccaaaaaa agagatttaa 920

<210> 12
<211> 560
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4 target 4

<400> 12
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120

tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180

ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240

ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300

aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360

acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420

caaagacagt tgactgtata acgccggaac gcgtttggaa tcacttaaca gggatgttta 480

ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 540

acccaaaaaa agagatttaa 560

<210> 13
<211> 708
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4 target 5

<400> 13
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120

tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180

ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240

ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300

aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360

acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420

caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480

atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540

ttcatgtgat aaagcggaat taattcccca cctggttgga cggaccaaac tgcgtataac 600

gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt atataactat 660

ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 708

<210> 14
<211> 240
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4 target 6

<400> 14
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga ctgcgtccaa 120

actgcgtata acgcgtttgg aatcactaca gggatgttta ataccactac aatggatgat 180

gtatataact atctattcga tgatgaagat accccaccaa acccaaaaaa agagatttaa 240

<210> 15
<211> 356
<212> DNA
<213> Artificial Sequence

<220>
<223> GAL4 target 7

<400> 15
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120

tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180

ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgactgattt 240

tgtataacgc gtttggaatc actacaggga tgtttaatac cactacaatg gatgatgtat 300

ataactatct attcgatgat gaagataccc caccaaaccc aaaaaaagag atttaa 356

<210> 16
<211> 268
<212> DNA
<213> Saccharomyces cerevisiae

<220>
<223> SNR52 promoter

<400> 16
ctttgaaaag ataatgtatg attatgcttt cactcatatt tatacagaaa cttgatgttt 60

tctttcgagt atatacaagg tgattacatg tacgtttgaa gtacaactct agattttgta 120

gtgccctctt gggctagcgg taaaggtgcg cattttttca caccctacaa tgttctgttc 180

aaaagatttt ggtcaaacgc tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa 240

acttctccgc agtgaaagat aaatgatc 268

<210> 17
<211> 20
<212> DNA
<213> Saccharomyces cerevisiae

<220>
<223> SUP4 terminator

<400> 17
tttttttgtt ttttatgtct 20

<210> 18
<211> 75
<212> DNA
<213> Artificial Sequence

<220>
<223> scaffold guide RNA Cas9

<400> 18
ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 60

gcaccgagtc ggtgc 75

<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 1

<400> 19
caagtgtctg aagaactaac 20

<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 2

<400> 20
gacagttgac tgtataacgc 20

<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 3

<400> 21
gcgtttggaa tcacttaaca 20

<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 4

<400> 22
gcatatggcc atggaggccg 20

<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 5

<400> 23
acgcgtttgg aatcactaca 20

<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 6

<400> 24
atggtctcaa aacccttggt 20

<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 7

<400> 25
acacgcttac tgcctgacta 20

<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 1

<400> 26
cctcgagaag accttgacat gattttgaaa atggattctt taca 44

<210> 27
<211> 108
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 2

<400> 27
aaagactgga acagctattt ctactgattt ttcctcgaga agaccttgac atgattttga 60

aaatggattc tttacaggat ataaaagcat tgttaacagg attatttg 108

<210> 28
<211> 520
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 3

<400> 28
tcatcatcgg aagagagtag taacaaaggt caaagacagt tgactgtatc gccggaattt 60

gtaatacgac tcactatagg gcgagccgcc atcatggagg agcagaagct gatctcagag 120

gaggacctgc atatggccat ggaggccgaa ttcatggata aagcggaatt aattcccgag 180

cctccaaaaa agaagagaaa ggtcgaattg ggtaccgccg ccaattttaa tcaaagtggg 240

aatattgctg atagctcatt gtccttcact ttcactaaca gtagcaacgg tccgaacctc 300

ataacaactc aaacaaattc tcaagcgctt tcacaaccaa ttgcctcctc taacgttcat 360

gataacttca tgaataatga aatcacggct agtaaaattg atgatggtaa taattcaaaa 420

ccactgtcac ctggttggac ggaccaaact gcgtataacg cgtttggaat cactacaggg 480

atgtttaata ccactacaat ggatgatgta tataactatc 520

<210> 29
<211> 635
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 4

<400> 29
cagatagatt ggcttcagtg gagactgata tgcctctaac attgagacag catagaataa 60

gtgcgacatc atcatcggaa gagagtagta acaaaggtca aagacagttg actgtatcgc 120

cggaatttgt aatacgactc actatagggc gagccgccat catggaggag cagaagctga 180

tctcagagga ggacctgcat atggccatgg aggccgaatt catggataaa gcggaattaa 240

ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc aattttaatc 300

aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt agcaacggtc 360

cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt gcctcctcta 420

acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat gatggtaata 480

attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg tttggaatca 540

ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta ttcgatgatg 600

aagatacccc accaaaccca aaaaaagaga tttaa 635

<210> 30
<211> 957
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 5

<400> 30
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60

tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120

tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180

ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240

ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300

aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360

acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420

caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480

atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540

ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600

ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660

ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720

tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780

agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840

gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900

tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957

<210> 31
<211> 4155
<212> DNA
<213> Artificial Sequence

<220>
<223> Cas9 rice codon-optimized

<400> 31
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60

atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120

cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180

gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240

tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300

ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360

aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420

aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480

atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540

gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600

attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660

cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720

ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780

gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840

caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900

ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960

atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020

cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080

ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140

gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200

aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260

gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320

gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380

agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440

gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500

aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560

tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620

agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680

gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740

agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800

attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860

ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920

catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980

aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040

gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100

tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160

cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220

gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280

attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340

atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400

gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460

gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520

atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580

gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640

aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700

actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760

ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820

acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880

aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940

tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000

tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060

atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120

aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180

ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240

gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300

cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360

gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420

tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480

aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540

tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600

tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660

cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720

cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780

caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840

atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900

cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960

cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020

gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080

gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140

aagaagaaga agtag 4155

<210> 32
<211> 1995
<212> DNA
<213> Zea mays

<220>
<223> maize Ubi promoter containing MubG1 intron

<400> 32
tgcagtgcag cgtgacccgg tcgtgcccct ctctagagat aatgagcatt gcatgtctaa 60

gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca gtttatctat 120

ctttatacat atatttaaac tttactctac gaataatata atctatagta ctacaataat 180

atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag gacaattgag 240

tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt ctcctttttt 300

tttgcaaata gcttcaccta tataatactt catccatttt attagtacat ccatttaggg 360

tttagggtta atggttttta tagactaatt tttttagtac atctatttta ttctatttta 420

gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata gtttagatat 480

aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga aattaaaaaa 540

actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa cgccgtcgac 600

gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag cgaagcagac 660

ggcacggcat ctctgtcgct gcctctggac ccctctcgag agttccgctc caccgttgga 720

cttgctccgc tgtcggcatc cagaaattgc gtggcggagc ggcagacgtg agccggcacg 780

gcaggcggcc tcctcctcct ctcacggcac cggcagctac gggggattcc tttcccaccg 840

ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900

tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960

ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc cccctctcta 1020

ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 1080

gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 1140

acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 1200

gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 1260

atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 1320

tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 1380

tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 1440

tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 1500

ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 1560

ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 1620

tagagtactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 1680

atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 1740

atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 1800

gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 1860

cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 1920

ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 1980

gtgttacttc tgcag 1995

<210> 33
<211> 294
<212> DNA
<213> Agrobacterium tumefaciens

<220>
<223> nopaline synthase terminator (tnos)

<400> 33
agcggccgcc cggctgcaga tcgttcaaac atttggcaat aaagtttctt aagattgaat 60

cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta 120

ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 180

caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 240

tcgcgcgcgg tgtcatctat gttactagat ccgatgataa gctgtcaaac atga 294

<210> 34
<211> 377
<212> DNA
<213> Oryza sativa

<220>
<223> RNA pol III promoter promoter from the rice U3 small nucle ar RNA
gene (OsU3)

<400> 34
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60

tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120

ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180

aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240

agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300

agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360

tgcagatgat ccgtggc 377

<210> 35
<211> 7787
<212> DNA
<213> Oryza sativa

<220>
<223> rice Protoporphyrinogen Oxidase (PPO2)

<400> 35
atgctctctc ctgccaccac cttctcctcc tcctcctcct cctcgtcgcc gtcgcgcgcc 60

cacgctcgcg ctcccacccg cttcgcggtc gcagcatccg cgcgcgccgc acggttccgc 120

cccgcgcgcg ccatggccgc ctccgacgac ccccgcggcg ggaggtccgt cgccgtcgtc 180

ggcgccggcg tcaggtgggt ggggagccgc gcgcgctctc cgtgggttca gttctgccct 240

aggtttgggg tgccgtgtgc gtgtgagtgg ggaggttgtt ttttttgatg attgatgaaa 300

tggttgcctc tctgcagtgg gctcgcggcg gcgtacaggc tgaggaagcg cggcgtgcag 360

gtgacggtgt tcgaggcggc cgacagggcg ggtgggaaga tacggaccaa ctccgagggc 420

gggttcatct gggacgaagg ggccaacacc atggtgagcg cgctttggtg tgcctcgctg 480

cttctgtttg atcacaatct cgggctgtgt tggtctgcat tgctgcaaat gctgcttctg 540

tatgttttgg attgtggcgc actggcgctg ctgcggctat ttgagggctg gagcacacta 600

gcgagtagtg ctccttggtg cgcaggctga ggaaacttgt gtttgtgaac gaaatgcaag 660

ctgctcacta atgcagacag ttgttcctgc aaatggagaa gtgttttctt ctgcattcgt 720

atcccacaac agacgtgaac cctttctgct atgagcatca ttgaacaccg ttatgtaact 780

tatcatagcc tgattcgatt tcattcacca tgatctataa ctattatact taccatatta 840

gttactttgt actactctta gtaaaataaa taaattattt taatactcca ctgacaaaat 900

aggttaagat tgtttcattg cttgggcaca tgtgcaatac tagtcgcatt ttttttacct 960

gcgtgcaaat cttatcatgc ctgcttgatt caatttgccg ttctctctgt aatttaatta 1020

ttttgcctcc agacagagag tgaattggag gcaagcaggc ttattgacga tcttggccta 1080

caaggcaaac agcagtatgt atgtgctaat gttatctgtg atggttaact gctttgaatg 1140

tcttctgttt cataatttac actgatatgt ttaatatttc gatatccttt agcctaactc 1200

acaacacaag cgttacattg tcaaagatgg agcaccaaca ctggtaaata gacttttcat 1260

gatatgatgc attttgtttt gttcttccta tagtatgcct cacttttgaa tatatttttt 1320

tgtcacataa gattccctca gatcccattg cgctcatgaa aagcactgtt ctttctacaa 1380

aatcaaaggt atgtaagtta ttgagtgcta attgctacaa catatcatga cctcctgacc 1440

tatttgcaac aagttgcttg ttgtttccac ttgtcactga tggattaaaa ttcactagtg 1500

tagaaacaat catattaaac tgatcaccgt gacttgattt acttgttttc agttcactat 1560

tacaaatttg tacatttcct gatctttcgt gttcaagctg tgtgatcgac tgattgcaac 1620

cgtcatatta tattactgta ttgagtttag taaaacatgg tcttatcttt gcagctcaag 1680

ctatttctgg aaccatttct ctatgagaaa tctagcagaa ggacctcggg aaaagtgtct 1740

gatgaacatt taagtgagag gtgagccttc atactgatgt tattttgagt tgttgtaaac 1800

ttgaaccact gataatatag ttatatgttt ttttcctgtg ttcttccttc attctcatgc 1860

ccttgtgaaa tacaaatata tacttcatat cacacactcc ctttggtcat ttttcatgtc 1920

aaacttttaa aactttgtac ataaaatcag ttcaatattt agattgaacg catgagaaag 1980

tattttcata atattatgat tttaccattt ttttcatata cgttgcaaca gaatttagtg 2040

gtcaaagcta cactttgaag accttattga tgtcaaaaac agcatgtttt ctgaccagag 2100

agaatacatt tgcagtgtga tttttctgtg tatatgtaga gataatcagg tttctctttt 2160

gcagtgttgc aagtttcttt gaacgccact ttggaaaaga ggcaagttca tttttaatga 2220

agaaatttat ggattgttaa gtgaatacaa tcaacacttt gcaacttaca tgcccattat 2280

aatcagtaga gggtaagaat ttataacttt attacaggtt gttgattatc ttattgatcc 2340

atttgtggct ggaacaagcg gaggagatcc tgagtcatta tcagtaagtt attataacat 2400

gtctcactat ttgcattttc catatcagca cctttgcatt tctacagtaa attgtagtca 2460

taattatttt tatgtaaatt gtgcgtataa acaacatatg tgcttgactt tgtgatgtgt 2520

tcttggggat gataactgat acggctagaa cttttggggg ctaatctcct tgagccgtat 2580

cagtaagtca taacaattct cattcataat gatcaaaaca tatcaccttc ttgtgtagaa 2640

ctgttctggt tttgagtaat attttcttct gtgcagattc gtcatgcatt tccagcatta 2700

tggaatttgg agaataagta agtttgtagt agtttgtttg gagaataagt aagtttgtag 2760

tttgtgcatt gatgttcatt caagatttac cttatcaata attcacttgt ccacgtccat 2820

atgctcgtgc tatatcctgt ccattcaaat gtcaacaccg ccatgtgaat ttactgcata 2880

gtgcatttta atgatttcat ttatccttgt tgcttgcatc tcttttttgg gctcctgctg 2940

ttagcttgtt tttggttcct gctgttacct atttcttttc tatcattttt tcattggaca 3000

gatggtgctc tcagtcctta ctgcttatta tttgttaacc tgatatgcac ctacttgaag 3060

ttaatgttat gatttttagt attttatagt catggtatca ttaatactta tttttggcaa 3120

tcgaaattaa aaaaacatga tgtcaaaata aaaaatcatg gcagttgaat gcagtgggta 3180

tatgtatcaa gaatttaaga tcttgaacat aagtccaatt gctatatgtt caattcgttg 3240

gagcataaca tgatctaatt tgtaagttaa atttatctga taaacgatgg aaggaaattc 3300

tggtaccact catgcaacta tacaagcttc aaaggcttct tacatgtgga ccattggacc 3360

tagaatagaa tctaaattta ttcataagta tataattttt tttccttcat gggccatgat 3420

agttaactat atgagcttgt agagtcaaaa taggcataat tgcttctttg ggtttccact 3480

taatttaccc tacaacactt ctattgcaat aaatatggtc aacaacattt ctttacggtc 3540

cgtttggttg gagggagttt ttaggaggga ttgggagttt agagggatgg agctattaac 3600

tgttttgttt ggttgggaga gatgggaatt ttggtgggat ggagatgggg aattgaggaa 3660

ggaactccct ccttttcaat acctgggtag ggggtggtaa ttgggaggga attcctcctt 3720

tactttgcct aaacaaatct cagccatccg ttttcattaa tgacctaatc tccaactaaa 3780

cttcctgtca atttccacca cctctgccaa acaagatatt gggattaaaa atcaaattcc 3840

catcttaatc tcaccatcaa ttccctcgtg taaactccca atccccttcc ctcaagttgc 3900

caaacaagcc attagtgccc agttatgttc tttggtcatc ttcttcataa tttgttgctc 3960

catgcacttt caatgctcac aggtatggct ctgtcattgc tggtgccatc ttgtccaaac 4020

tatccactaa gggtgattca gtgaagacag gaggtgcttc gccagggaaa ggaaggaata 4080

aacgtgtgtc attttcattt catggtggaa tgcaggtact ccacagatgt cctgtagttt 4140

cttttgtcag tgtcaaagat atcaaagaca gtgataaacc ctgaacttta gtttgagcaa 4200

ttctacatgc cactaaaaaa tgccgaattc atatgttgtg aattgaagac ctgttatttt 4260

cctgcaacta ggacatatgt ttagtcggtg aaacttcatt gctgctttaa gaagtcttac 4320

aggccagaga aaactgtctt gttttttttt tttttgattt gatgtcctgc tttatattta 4380

tgatccagcc aagcttatcc atccatctgc accctgatcc tgccataatc atttttttta 4440

tcagcctgac atgagcttat tatgttgcat aagttaggtt gaagctagat cgaacaaaaa 4500

actcaaagct actgataagt acaggatatg caacagaagt atcacacgag ccaaatctgc 4560

tataagaata aaacatacca agagccttag acaccactaa atagtgtgaa tggtagtgat 4620

agcgaataat ctcagaagat gacattttgg gaaatattat cgtgtagtat actttattaa 4680

ttgggagttg cgatacttgc cctgcacgct aaacatgctg aaaagtttca cagttatact 4740

acataacatc tgggtgtgta aaggttttat gttgttcatt gcttttcagt cactaataga 4800

tgcacttcac aatgaagttg gagatggtaa cgtgaagctt ggtacagaag tgttgtcatt 4860

ggcatgttgc tgtgatggag tctcttcttc tggtggttgg tcaatttctg ttgattcaaa 4920

agatgctaaa gggaaagatc tcagaaagaa ccaatctttc gatgctgtta taatgactgt 4980

aagaaaaaaa ttatctgtat tcatctcttt agaagcttga tcatttgaca gccacaaatt 5040

aaaatatttt accgtgtttt tctttttgcc cctttaggct ccattgtcta atgtccagag 5100

gatgaagttt acaaaaggtg gagttccctt tgtgctagac tttcttccta aggtcaggtt 5160

agaatcactc ttttagattt aacaaatgca gtgttgcact agcatgttct tgagaaattt 5220

gtgctggggg aaattcctct taatccttca aattgcattt aatttcatcc attaggtcga 5280

tggatccatg tcacagaaaa tattttgttt atcttctaga tttctattat atatgtaaga 5340

ctgtctctta gtttgtgaat ttacaggagt caatcatcac tcccttgaat ctgagcatat 5400

cagcagttca tcagcaatat ggtttatttg agaaggcaac ggaaactatt gtttccaaag 5460

gccacttgtt tgaaactttc accactgttt tgaacagtgt attaaagtaa cagtcatttg 5520

tatagcagca cctggtgatt tttaagtaaa ttttccattc ccaatcaaaa caagtaacat 5580

tatatgttga acatgtactg aattgaatat ggaactttat gctggagatg ccagacttta 5640

ttttactggc atgaatacac aattattgta acaatggtat tattgcttgg ttacttctcc 5700

gctgtgaaga catacctttc gtcacctttt cttgtttccc atattctgca ccttatggga 5760

ttgtcttcca catgttaaga tgccttgtag taccagttcc cctattattt gaatgtgttc 5820

ttccttagat atatgtgcat ttggaacgtg attggaaata caacagcaaa ctggtattgt 5880

tagctgcttg cctgccacag cctacatatg ctgccatatt acagaattat gagataggtg 5940

gactttgatt tctgtcataa tgattaacta acttgatata ctcaaactat gcagctccta 6000

gctggtatcc ttagaattta tcgagtatgc atagaagtct actcttaatc catatctatt 6060

tgatgtactc aaacttgaaa ctatgcagct cctagctggg ctccttagaa ttatcaagta 6120

tgcatagaaa tcttaatcca tatttattta ttatatgcag gtcgattatc taccactatc 6180

tctcatggta acagctttta agaaggaaga tgtcaaaaaa ccattggaag gatttggtgc 6240

cttgataccc tataaggaac agcaaaagca tggtctcaaa acccttggta ggttaattca 6300

gctttacact tatattttat ccagcttgta gctgcttata ttttgatttg cgaattaaaa 6360

attattaaaa cagccttgaa agaagaaacc atgttcgctg tggagactag aaattcccac 6420

attaattggg gaaagagaaa tatttacacc ctatgatttt ggcaagtgca agttttaatg 6480

gttgagattg atggattgaa tatatatcat atttggactc agtatgaaca aataccagat 6540

acataaatag atagtactaa ttcaacatgg atctgaactg ttgatcagac caattgagca 6600

cttggttgta attgctcgcg gactacacgc ttactgcctg actagggttc catgatgata 6660

aggttcgatt ttctaaaata ctattacaac aagatgacta tttaataaaa tttaaagaga 6720

ataacgtata taaaaattta gataaatttg gtgcaccgcg caattgcgca ggtcaccctg 6780

ctagctgtat tgaactcaat atacaaatca accttgctac attgctctac tttttctcag 6840

gtcttattta ctctgatttc tatttattct aatctataca tgtcgtcttg tacagggacc 6900

ctcttctcct cgatgatgtt tccagatcga gctcctaatg atcaatatct atatacatct 6960

ttcattgggg ggagccataa tagagacctc gctggggctc caacgtatac ttccatatta 7020

tgatcattta tgttttggtt gttttttctt ttcttgctag atttttctga tatatatact 7080

tatgtagggc tattctgaaa caacttgtga cctctgacct aagaaagctc ttgggtgttg 7140

agggacaacc tacttttgtg aagtaagtga taagaaacta ctgccatggt ttagagtatc 7200

tatatgtttt ctcttgttgt gcttgtgtta tggttttcca tcactatgga gttttgagga 7260

ttcattcagg tttttgcact accacttgcg aattcaatat gatgttcttt tacacaggca 7320

tgtacattgg agaaatgctt ttcctttata tggccagaat tatgatctgg tactggaagc 7380

tatagcaaaa atggagaaca atcttccagg gttcttttac gcaggcaagt caatgaaggc 7440

acccctattg tacaaaagaa atcttagata tttgaaacat attcctgttg attgagtacg 7500

tgaataattt gctgtttcta gtaagtcaat ttggtatttc tcatgcaact tatggggctc 7560

cttgatttgc tgagaatgat gagtttccta gagcaagcca ggaactgtaa tcccagcatg 7620

taatacttta ccttgaaatt aacttcaaaa aaataattga agctttttct gtatctgtag 7680

gaaataacaa ggatgggttg gctgttggaa atgttatagc ttcaggaagc aaggctgctg 7740

accttgtgat ctcttatctt gaatcttgca cagatcagga caattag 7787

<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 8

<400> 36
atggtctcaa aacccttggt 20

<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 9

<400> 37
acacgcttac tgcctgacta 20

<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> spacer 10

<400> 38
tatatacatc tttcattggg 20

<210> 39
<211> 120
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 6

<400> 39
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60

ggtagattaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120

<210> 40
<211> 794
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 7

<400> 40
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60

ggtaggttaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120

tttgcgaatt aaaaattatt aaaacagcct tgaaagaaga aaccatgttc gctgtggaga 180

ctagaaattc ccacattaat tggggaaaga gaaatattta caccctatga ttttggcaag 240

tgcaagtttt aatggttgag attgatggat tgaatatata tcatatttgg actcagtatg 300

aacaaatacc agatacataa atagatagta ctaattcaac atggatctga actgttgatc 360

agaccaattg agcacttggt tgtaattgct cgcggactac acgcttactg cctgactagc 420

gttccatgat gataaggttc gattttctaa aatactatta caacaagatg actatttaat 480

aaaatttaaa gagaataacg tatataaaaa tttagataaa tttggtgcac cgcgcaattg 540

cgcaggtcac cctgctagct gtattgaact caatatacaa atcaaccttg ctacattgct 600

ctactttttc tcaggtctta tttactctga tttctattta ttctaatcta tacatgtcgt 660

cttgtacagg gaccctcttc tcctcgatga tgtttccaga tcgagctcct aatgatcaat 720

atctatatac atctgtaatt ggggggagcc ataatagaga cctcgctggg gctccaacgt 780

atacttccat atta 794

<210> 41
<211> 800
<212> DNA
<213> Artificial Sequence

<220>
<223> donor 8

<400> 41
atggatctga actgttgatc agaccaattg agcacttggt tgtaattgct cgcggactac 60

acgcttactg cctgactagg gttccatgat gataaggttc gattttctaa aatactatta 120

caacaagatg actatttaat aaaatttaaa gagaataacg tatataaaaa tttagataaa 180

tttggtgcac cgcgcaattg cgcaggtcac cctgctagct gtattgaact caatatacaa 240

atcaaccttg ctacattgct ctactttttc tcaggtctta tttactctga tttctattta 300

ttctaatcta tacatgtcgt cttgtacagg gaccttcttc tcctcgatga tgtttccaga 360

tcgagctcct aatgatcaat atctatatac atctgtaatt ggcggcagcc ataatagaga 420

cctcgctggg gctccaacgt atacttccat attatgatca tttatgtttt ggttgttttt 480

tcttttcttg ctagattttt ctgatatata tacttatgta gggctattct gaaacaactt 540

gtgacctctg acctaagaaa gctcttgggt gttgagggac aacctacttt tgtgaagtaa 600

gtgataagaa actactgcca tggtttagag tatctatatg ttttctcttg ttgtgcttgt 660

gttatggttt tccatcacta tggagttttg aggattcatt caggtttttg cactaccact 720

tgcgaattca atatgatgtt cttttacaca ggcatgtaca ttggagaaat gcttttcctt 780

tatatggcca gaattatgat 800

<210> 42
<211> 138
<212> DNA
<213> Artificial Sequence

<220>
<223> RecA FusionCRISPR

<400> 42
gatgtggaaa ccatctctac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttc catggatgtg gaaaccatcg 120

ctttcactgg atatcgcg 138

<210> 43
<211> 1062
<212> DNA
<213> Escherichia coli

<220>
<223> RecA

<400> 43
atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60

caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120

atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180

cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240

atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300

gacccaatct acgcacgtaa actgggcgtc gatatcgaca acctgctgtg ctcccagccg 360

gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420

gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480

ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540

ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600

ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660

tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720

agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780

ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840

aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900

cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960

gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020

gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062

<210> 44
<211> 21
<212> DNA
<213> Artificial Sequence

<220>
<223> Primer

<400> 44
atggctatcg acgaaaacaa a 21

<210> 45
<211> 21
<212> DNA
<213> Artificial Sequence

<220>
<223> Primer

<400> 45
cgtcagcgtg gttttaccgg a 21

<210> 46
<211> 461
<212> DNA
<213> Artificial Sequence

<220>
<223> Expression Cassette

<400> 46
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60

gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120

gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180

tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240

gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300

tggaaaggac gaaacaccgg catccctcag gctgggctgt tttagagcta gaaatagcaa 360

gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctggcca 420

tcaggcatcc ctcagtatgg aatgaggcat ctgatttttt t 461

<210> 47
<211> 275
<212> DNA
<213> Homo sapiens

<220>
<223> PRDM9 exon ENSE00001804383

<400> 47
attgtgagat gtgtcagaac ttcttcattg acagctgtgc tgcccatggg ccccctacat 60

ttgtaaagga cagtgcagtg gacaaggggc accccaaccg ttcagccctc agtctgcccc 120

cagggctgag aattgggcca tcaggcatcc ctcaggctgg gcttggagta tggaatgagg 180

catctgatct gccgctgggt ctgcactttg gcccttatga gggccgaatt acagaagacg 240

aagaggcagc caacaatgga tactcctggc tgtgg 275

<210> 48
<211> 783
<212> DNA
<213> Artificial Sequence

<220>
<223> Gene Fragment

<400> 48
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60

ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120

aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180

acctacgcga gacctcattc gccattcagg ctacgcaact gttgggaagg gcgatcggtg 240

cgggcctctt cgctattacg ccatgaggcg aaagggggat gtgctgcaag gcgattaagt 300

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag actattcgta 360

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 420

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 480

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctcgatta 540

atgaatcggt ctcagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 600

caacttgaaa aagtggcacc gagtcggtgc tggccaacga ggcccgggcc aataaggcct 660

tttttactcc atctggattt gttcagaacg ctcggttgcc gccgggcgtt ttttatctaa 720

agcttaggcc cagtcgaaag actgggcctt tttaatacga ctcactatag ggtcgactct 780

aga 783

<210> 49
<211> 784
<212> DNA
<213> Artificial Sequence

<220>
<223> Gene Fragment

<400> 49
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60

ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120

aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180

acctacggcc aacgaggccc gggccaataa ggcctacgcg agacctcatt cgccattcag 240

gctacgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccatgaggc 300

gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg 360

acgttgtaaa acgacggcca gactattcgt aatcatggtc atagctgttt cctgtgtgaa 420

attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 480

ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 540

agtcgggaaa cctgtcgtgc cagctcgatt aatgaatcgg tctcagtttt agagctagaa 600

atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 660

ctttttactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttatcta 720

aagcttaggc ccagtcgaaa gactgggcct ttttaatacg actcactata gggtcgactc 780

taga 784

<210> 50
<211> 24
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 50
tacgtgaaga tcaggctatc actg 24

<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 51
aaaccagtga tagcctgatc ttca 24

<210> 52
<211> 52
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 52
gatcggccaa cgaggccgcg gcattatgtt tgaatttccg tttaaagaat gg 52

<210> 53
<211> 76
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 53
gatggtttct ttcggtaagt cccgtctagc cttgccctca tcttgacact ccttatttga 60

ttttttgaag acttac 76

<210> 54
<211> 40
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 54
tgagggcaag gctagacggg acttaccgaa agaaaccatc 40

<210> 55
<211> 56
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 55
gatcaggcct tattggcctt ggcaggccgc tgaatttcca tgttgcgtaa gtcagg 56

<210> 56
<211> 52
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 56
gatcggccaa cgaggccttg gcaggccgct gaatttccat gttgcgtaag tc 52

<210> 57
<211> 76
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 57
cgaagtaagt cttcaaaaaa tcaaataagg agtgtcaaga tgagggcaag gctagacggg 60

acttaccgaa agaaac 76

<210> 58
<211> 40
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 58
tcttgacact ccttatttga ttttttgaag acttacttcg 40

<210> 59
<211> 57
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 59
gatcggcctt attggccgcg gcattatgtt tgaatttccg tttaaagaat ggtctgc 57

<210> 60
<211> 19
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 60
gactttcagg cgtgaatgg 19

<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Oligonucleotide

<400> 61
cgtgctctcc gataatatgc 20

<210> 62
<211> 6588
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector RLW121

<400> 62
ccgtttaaac ttagttacta atcagtgatc agattgtcgt ttcccgcctt cactttaaac 60

tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 120

ataatcggat atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtcaat 180

attggggggg ggggaaagcc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 240

taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 300

tgttcgccac catgagccat atccagcgtg aaacctcgtg ctcccgcccg cgcctcaatt 360

ccaatatgga tgccgacctt tatggctaca agtgggcgcg cgacaacgtc ggccagtcgg 420

gcgcgaccat ttatcggctt tatggcaaac ccgatgcccc ggaactgttc ctgaagcacg 480

gcaaaggcag cgtcgcaaac gatgtcaccg atgagatggt ccgcctgaac tggcttaccg 540

agttcatgcc gctgccgacg attaagcatt tcatccgtac cccggacgat gcctggctct 600

tgaccacggc cattccgggc aaaacggcct ttcaggtcct tgaagagtac ccggactccg 660

gtgagaatat cgtggacgcc ctcgcggtct tcctccgccg tttgcatagc atccccgtgt 720

gcaactgccc cttcaactcg gaccgggttt tccgcctggc acaggcccag tcgcgcatga 780

ataacggcct cgttgacgcg agcgatttcg acgatgaacg gaatggctgg ccggtggaac 840

aggtttggaa ggaaatgcac aaactgcttc cgttctcgcc ggattcggtg gtcacgcatg 900

gtgatttttc cctggataat ctgatctttg acgagggcaa gctgatcggc tgcatcgacg 960

tgggtcgcgt cggtatcgcc gaccgctatc aggacctggc gatcttgtgg aattgcctcg 1020

gcgagttctc gccctcgctc cagaagcgcc tgttccagaa gtacggcatc gacaacccgg 1080

atatgaacaa gctccagttc cacctcatgc tggacgaatt tttttgaaca gaattggtta 1140

attggttgta acactggcag agcattacgc tgacttgacg ggacggcggc tttgttgaat 1200

aaatcgaact tttgctgagt tgaaggatcg atgagttgaa ggaccccgta gaaaagatca 1260

aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1320

caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1380

taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 1440

gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1500

cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1560

taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1620

agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1680

ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1740

gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1800

acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1860

acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 1920

tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 1980

ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 2040

agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcataggcc 2100

gcgataggcc gacgcgaagc ggcggggcgt agggagcgca gcgaccgaag ggtaggcgct 2160

ttttgcagct cttcggctgt gcgctggcca gacagttatg cacaggccag gcgggtttta 2220

agagttttaa taagttttaa agagttttag gcggaaaaat cgcctttttt ctcttttata 2280

tcagtcactt acatgtgtga ccggttccca atgtacggct ttgggttccc aatgtacggg 2340

ttccggttcc caatgtacgg ctttgggttc ccaatgtacg tgctatccac aggaaagaga 2400

ccttttcgac ctttttcccc tgctagggca atttgcccta gcatctgctc cgtacattag 2460

gaaccggcgg atgcttcgcc ctcgatcagg ttgcggtagc gcatgactag gatcgggcca 2520

gcctgccccg cctcctcctt caaatcgtac tccggcaggt catttgaccc gatcagcttg 2580

cgcacggtga aacagaactt cttgaactct ccggcgctgc cactgcgttc gtagatcgtc 2640

ttgaacaacc atctggcttc tgccttgcct gcggcgcggc gtgccaggcg gtagagaaaa 2700

cggccgatgc cggggtcgat caaaaagtaa tcggggtgaa ccgtcagcac gtccgggttc 2760

ttgccttctg tgatctcgcg gtacatccaa tcagcaagct cgatctcgat gtactccggc 2820

cgcccggttt cgctctttac gatcttgtag cggctaatca aggcttcacc ctcggatacc 2880

gtcaccaggc ggccgttctt ggccttcttg gtacgctgca tggcaacgtg cgtggtgttt 2940

aaccgaatgc aggtttctac caggtcgtct ttctgctttc cgccatcggc tcgccggcag 3000

aacttgagta cgtccgcaac gtgtggacgg aacacgcggc cgggcttgtc tcccttccct 3060

tcccggtatc ggttcatgga ttcggttaga tgggaaaccg ccatcagtac caggtcgtaa 3120

tcccacacac tggccatgcc ggcggggcct gcggaaacct ctacgtgccc gtctggaagc 3180

tcgtagcgga tcacctcgcc agctcgtcgg tcacgcttcg acagacggaa aacggccacg 3240

tccatgatgc tgcgactatc gcgggtgccc acgtcataga gcatcggaac gaaaaaatct 3300

ggttgctcgt cgcccttggg cggcttccta atcgacggcg caccggctgc cggcggttgc 3360

cgggattctt tgcggattcg atcagcggcc ccttgccacg attcaccggg gcgtgcttct 3420

gcctcgatgc gttgccgctg ggcggcctgc gcggccttca acttctccac caggtcatca 3480

cccagcgccg cgccgatttg taccgggccg gatggtttgc gaccgctcac gccgattcct 3540

cgggcttggg ggttccagtg ccattgcagg gccggcagac aacccagccg cttacgcctg 3600

gccaaccgcc cgttcctcca cacatggggc attccacggc gtcggtgcct ggttgttctt 3660

gattttccat gccgcctcct ttagccgcta aaattcatct actcatttat tcatttgctc 3720

atttactctg gtagctgcgc gatgtattca gatagcagct cggtaatggt cttgccttgg 3780

cgtaccgcgt acatcttcag cttggtgtga tcctccgccg gcaactgaaa gttgacccgc 3840

ttcatggctg gcgtgtctgc caggctggcc aacgttgcag ccttgctgct gcgtgcgctc 3900

ggacggccgg cacttagcgt gtttgtgctt ttgctcattt tctctttacc tcattaactc 3960

aaatgagttt tgatttaatt tcagcggcca gcgcctggac ctcgcgggca gcgtcgccct 4020

cgggttctga ttcaagaacg gttgtgccgg cggcggcagt gcctgggtag ctcacgcgct 4080

gcgtgatacg ggactcaaga atgggcagct cgtacccggc cagcgcctcg gcaacctcac 4140

cgccgatgcg cgtgcctttg atcgcccgcg acacgacaaa ggccgcttgt agccttccat 4200

ccgtgacctc aatgcgctgc ttaaccagct ccaccaggtc ggcggtggcc caaatgtcgt 4260

aagggcttgg ctgcaccgga atcagcacga agtcggctgc cttgatcgcg gacacagcca 4320

agtccgccgc ctggggcgct ccgtcgatca ctacgaagtc gcgccggccg atggccttca 4380

cgtcgcggtc aatcgtcggg cggtcgatgc cgacaacggt tagcggttga tcttcccgca 4440

cggccgccca atcgcgggca ctgccctggg gatcggaatc gactaacaga acatcggccc 4500

cggcgagttg cagggcgcgg gctagatggg ttgcgatggt cgtcttgcct gacccgcctt 4560

tctggttaag tacagcgata accttcatgc gttccccttg cgtatttgtt tatttactca 4620

tcgcatcata tacgcagcga ccgcatgacg caagctgttt tactcaaata cacatcacct 4680

ttttagatga tcagtgattt tgtgccgagc tgccggtcgg ggagctgttg gctggctggt 4740

ggcaggatat attgtggtgt aaacaaattg acgcttagac aacttaataa cacattgcgg 4800

acgtctttaa tgtactgaat ttagttactg atcactgatt aagtactgat aaatttaatt 4860

aacagatctc aactttgtat agaaaagttg aacgagaaac gtaaaatgat ataaatatca 4920

atatattaaa ttagattttg cataaaaaac agactacata atactgtaaa acacaacata 4980

tccagtcact atggtcgacc tgcagactgg ctgtgtataa gggagcctga catttatatt 5040

ccccagaaca tcaggttaat ggcgtttttg atgtcatttt cgcggtggct gagatcagcc 5100

acttcttccc cgataacgga gaccggcaca ctggccatat cggtggtcat catgcgccag 5160

ctttcatccc cgatatgcac caccgggtaa agttcacggg ggactttatc tgacagcaga 5220

cgtgcactgg ccagggggat caccatccgt cgcccgggcg tgtcaataat atcactctgt 5280

acatccacaa acagacgata acggctctct cttttatagg tgtaaacctt aaactgcatt 5340

tcaccagccc ctgttctcgt cggcaaaaga gccgttcatt tcaatgaacc gggcgacctc 5400

agccatccct tcctgatttt ccgctttcca gcgttcggca cgcagacgac gggcttcatt 5460

ctgcatggtt gtgcttaccg aaccggagat attgacatca tatatgcctt gagcaactga 5520

tagctgtcgc tgtcaactgt cactgtaata cgctgcttca tagcatacct ctttttgaca 5580

tacttcgggt atacatatca gtatatattc ttataccgca aaaatcagcg cgcaaatacg 5640

catactgtta tctggctttt agtaagccgg atcctctaga ttacgccccg cctgccactc 5700

atcgcagtac tgttgtaatt cattaagcat tctgccgaca tggaagccat cacaaacggc 5760

atgatgaacc tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc 5820

catggtgaaa acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt 5880

gaaactcacc cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa 5940

ataggccagg ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg 6000

gaaatcgtcg tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac 6060

ggtgtaacaa gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg 6120

gaattccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 6180

gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 6240

ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 6300

tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 6360

aaatctcgac ggatcctaac tcaaaatcca catattatac gagccggaag cataaagtgt 6420

aaagcctggg gtgcctaatg cggccgccat agtgactgga tatgttgtgt tttacagtat 6480

tatgtagtct gttttttatg caaaatctaa tttaatatat tgatatttat atcattttac 6540

gtttctcgtt caactttatt atacatagtt gataattcac tgggccgg 6588

<210> 63
<211> 7443
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector CC003

<400> 63
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60

attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120

gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180

gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240

gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300

acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360

aggccgcata aataatgatt ttattttgac tgatagtgac ctgttcgttg caacaaattg 420

ataagcaatg cttttttata atgccaactt tgtatagaaa agttgattta aatgaattca 480

agcttttaat taacttagcc actgcaacaa gttcttgaac cttagcacaa tcatattgtg 540

catgcacttg tttattgcaa agaatggtgc gtagggaaca cgcatgattt ttgaattgct 600

ggcacataat tttatcatta gaaactggaa tgcaacatgt accctttgtc atggtttctt 660

tccgagacat tgcactgttt tttttaatcc tatcattatc ataatgccaa gaactggtca 720

ccaaccagca ttttgcatca tggttagttg agctgtcccc atgtatcaat aggtgcattg 780

tattggtcca aaatataaat gcagtggatg caacctatct catggccgtc aacaaaagaa 840

atcaaaaggg aaatgcacca tcttatatct ccagtttata tgaacagatt ggataagatc 900

ataagatcaa gtggtttata ttattttgag gaatataaca tggattcatc ctaatcactc 960

gtctaggcag tatgtgtatt catgatggat atggtactat actacggagt tttttcttca 1020

caaaataacc tgttattttg acctccaacc aaacacgaat tataccaaaa attgggttat 1080

ttcatctata gtacaactct attataaaca tgcagtaaat tatcctacac atataccaaa 1140

attcaagtgt aataatccta atacacagac ttaaaaaaca aactatttcc tttttaagaa 1200

aaggaaaacc atttttttaa cggaaggaaa acaaattcgg gtcaaggcgg aagccagcgc 1260

gccaccccac gtcagcgaat acggaggcgc ggggttgacg gcgtcacccg gtcctaacgg 1320

cgaccaacaa accagccaga agaaattaca gtaaaaaaaa gtaaattgca ctttgatcca 1380

ccttttatta cccaagtttc aatttggacc acccttaaac ctatcttttc aaattgggcc 1440

gggttgtggt ttggactacc atgaacaact tttcgtcatg tctaacttcc ctttcggcaa 1500

acatatgaac catatataga ggagatcggc cgtatactag agctgatgtg tttaaggtcg 1560

ttgattgcac gagaaaaaaa aaatccaaat cgcaacaata gcaaatttat ctagttcaaa 1620

gtgaaaagat atgtttaaag gtagtccaaa gtaaaactta ggggctgttt ggttcccagc 1680

catactttac cattacttgc caacaaaagt tgccacacct tgtctaaggt gaggtgatca 1740

aattgttagc cacaacttac taagcctaag ggaatcttgc cacacttttt tgagccattg 1800

acacgtggga cttaatttgt tagagggaaa tcttgccaca actgtggcta caaccaaaca 1860

cctgtcaaat ttgcctaacc ttaggcgtgg caaactgtgg caaagtgtgg cttacaacca 1920

aacacaccct tagataataa aatgtggtcc aaagcgtaat tcactaaaaa aaaatcaacg 1980

agacgtgtac caaacggaga caaacggcat cttctcgaaa tttcccaacc gctcgctcgc 2040

ccgcctcgtc ttcccggaaa ccgcggtggt ttcagcgtgg cggattctcc aagcagacgg 2100

agacgtcacg gcacgggact cctcccacca cccaaccgcc ataaatacca gccccctcat 2160

ctcctctcct cgcatcagct ccacccccga aaaatttctc cccaatctcg cgaggctctc 2220

gtcgtcgaat cgaatcctct cgcgtcctca agcttggcat ccaggtacgg atccgcgtcc 2280

catctccctc accccccgtg ttcttcgtgc ctgcttctgg gtcagatctg ggtggattcg 2340

cggttgttgg atgtgggggg ctgtgtttat ttgtcggtgg atctggttgt ctggatctgc 2400

gttttctctg tcgtagttag cggatctgat gaaatgttta gtgttcgtgt atactggtat 2460

ggtggatctg gtcctaggat gcgtggaatg gatatatgta ggcgaattgg aggatttatt 2520

ttgtgaattt tgctgaaatg atagttctaa acactggatc tgacctcggg atgctgttaa 2580

atgtggaaat catggtcgat gctgtcatga acatggtgtt cttatggtag atctgagcaa 2640

tgtatgtttc aaaattgttt gtcacatgga aatgctatgg ttctagatgc aatagaatga 2700

tacatgccga gatcccctct agttgatatg atagatcatg atgttttaca gctatgtcat 2760

atgaatatgt tcatttgtta ccgatgtatt tggatctact taacatttcc aaagcacgcc 2820

gcgttctaat tctagatctg gtagtcatgt ttgtacacgt cacccaccta atacaaatac 2880

atatgtctag tgtttggtga cactgcccgt cagatctgtt ttttccagat ctgtggaaca 2940

aatactccac gcatgtatgg tagttttgaa acgatcttgt atcttccatt gttgtagtaa 3000

caactaaata aagtacaatt gttcaattat tgggaatcgt attttctgta gtgccgatgt 3060

acagcatatt catagatgtc tatttaggaa ctcaaatttt aaattgagga ctagttattt 3120

attgtgggtc agtcttttga attgtgttat cttgctgtac tggcgcgcca ccatggccac 3180

cgccgccgcc gcgtctaccg cgctcactgg cgccactacc gctgcgccca aggcgaggcg 3240

ccgggcgcac ctcctggcca cccgccgcgc cctcgccgcg cccatcaggt gctcagcggc 3300

gtcacccgcc atgccgatgg ctcccccggc caccccgctc cggccgtggg gccccaccga 3360

tccccgcaag ggcgccgaca tcctcgtcga gtccctcgag cgctgcggcg tccgcgacgt 3420

cttcgcctac cccggcggca cgtccatgga gatccaccag gcactcaccc gctcccccgt 3480

catcgccaac cacctcttcc gccacgagca aggggaggcc tttgcggcct ccggctacgc 3540

gcgctcctcg ggccgcgtcg gcgtctgcat cgccacctcc ggccccggcg ccaccaacct 3600

tgtctccgcg ctcgccgacg cgctgctcga ttccgtcccc atggtcgcca tcacgggaca 3660

ggtgccgcga cgcatgattg gcaccgacgc cttccaggag acgcccatcg tcgaggtcac 3720

ccgctccatc accaagcaca actacctggt cctcgacgtc gacgacatcc cccgcgtcgt 3780

gcaggaggct ttcttcctcg cctcctctgg tcgaccgggg ccggtgcttg tcgacatccc 3840

caaggacatc cagcagcaga tggcggtgcc tgtctgggac aagcccatga gtctgcctgg 3900

gtacattgcg cgccttccca agccccctgc gactgagttg cttgagcagg tgctgcgtct 3960

tgttggtgaa tcccggcgcc ctgttcttta tgttggcggt ggctgcgcag catctggtga 4020

ggagttgcga cgctttgtgg agctgactgg aatcccggtc acaactactc ttatgggcct 4080

cggcaacttc cccagcgacg acccactgtc tctgcgcatg ctaggtatgc atggcacggt 4140

gtatgcaaat tatgcagtgg ataaggccga tctgttgctt gcacttggtg tgcggtttga 4200

tgatcgtgtg acagggaaga ttgaggcttt tgcaagcagg gctaagattg tgcacgttga 4260

tattgatccg gctgagattg gcaagaacaa gcagccacat gtgtccatct gtgcagatgt 4320

taagcttgct ttgcagggca tgaatgctct tcttgaagga agcacatcaa agaagagctt 4380

tgactttggc tcatggaacg atgagttgga tcagcagaag agggaattcc cccttgggta 4440

taaaacatct aatgaggaga tccagccaca atatgctatt caggttcttg atgagctgac 4500

gaaaggcgag gccatcatcg gcacaggtgt tgggcagcac cagatgtggg cggcacagta 4560

ctacacttac aagcggccaa ggcagtggtt gtcttcagct ggtcttgggg ctatgggatt 4620

tggtttgccg gctgctgctg gtgcttctgt ggccaaccca ggtgttactg ttgttgacat 4680

cgatggagat ggtagctttc tcatgaacgt tcaggagcta gctatgatcc gaattgagaa 4740

cctcccggtg aaggtctttg tgctaaacaa ccagcacctg gggatggtgg tgcagtggga 4800

ggacaggttc tataaggcca acagagcgca cacatacttg ggaaacccag agaatgaaag 4860

tgagatatat ccagatttcg tgacgatcgc caaagggttc aacattccag cggtccgtgt 4920

gacaaagaag aacgaagtcc gcgcagcgat aaagaagatg ctcgagactc cagggccgta 4980

cctcttggat ataatcgtcc cacaccagga gcatgtgttg cctatgatcc ctaatggtgg 5040

ggctttcaag gatatgatcc tggatggtga tggcaggact gtgtactagc ctgcaggcct 5100

aggatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 5160

cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 5220

gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 5280

acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 5340

ctatgttact agatcggccg gccgtttaaa cagcctgctt ttttgtacaa agttggcatt 5400

ataaaaaagc attgctcatc aatttgttgc aacgaacagg tcactatcag tcaaaataaa 5460

atcattattt gctgggcctc atgggccttc cgctcactgc ccgctttcca gtcgggaaac 5520

ctgtcgtgcc agctgcatta acatggtcat agctgtttcc ttgcgtattg ggcgctctcc 5580

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggg taaagcctgg ggtgcctaat 5640

gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 5700

ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 5760

acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5820

ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5880

cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5940

tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 6000

gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 6060

ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 6120

acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 6180

gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 6240

ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 6300

tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 6360

gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 6420

tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 6480

ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 6540

taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagaac 6600

cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 6660

gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 6720

gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6780

tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6840

gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6900

ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6960

ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 7020

cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 7080

ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 7140

gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 7200

ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 7260

ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 7320

tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 7380

ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 7440

cac 7443

<210> 64
<211> 3734
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector CC018

<400> 64
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60

gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120

agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180

tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240

gcttgtgtgc attgagtgct atgctgaggt tttagagcta gaaatagcaa gttaaaataa 300

ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360

gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420

gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480

atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540

atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600

tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagaga actgcaaaat 660

ccaatgttct ggaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720

attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780

ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840

agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900

tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960

tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020

ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080

attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140

tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200

cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260

gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320

ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380

aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440

tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500

ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560

cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620

ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680

ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740

gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800

agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860

cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920

aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040

ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100

aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280

cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460

cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760

ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000

acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120

tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180

ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240

atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300

ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420

ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480

ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540

agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600

tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660

ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720

gccggtaccg cgat 3734

<210> 65
<211> 9506
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector CC006

<400> 65
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60

attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120

gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180

gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240

gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300

acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360

aggccgcatc aaataatgat tttattttga ctgatagtga cctgttcgtt gcaacaaatt 420

gataagcaat gctttcttat aatgccaact ttgtacaaga aagctgggta tttaaatgaa 480

ttcaagcttt taattaatgc agtgcagcgt gacccggtcg tgcccctctc tagagataat 540

gagcattgca tgtctaagtt ataaaaaatt accacatatt ttttttgtca cacttgtttg 600

aagtgcagtt tatctatctt tatacatata tttaaacttt actctacgaa taatataatc 660

tatagtacta caataatatc agtgttttag agaatcatat aaatgaacag ttagacatgg 720

tctaaaggac aattgagtat tttgacaaca ggactctaca gttttatctt tttagtgtgc 780

atgtgttctc cttttttttt gcaaatagct tcacctatat aatacttcat ccattttatt 840

agtacatcca tttagggttt agggttaatg gtttttatag actaattttt ttagtacatc 900

tattttattc tattttagcc tctaaattaa gaaaactaaa actctatttt agttttttta 960

tttaatagtt tagatataaa atagaataaa ataaagtgac taaaaattaa acaaataccc 1020

tttaagaaat taaaaaaact aaggaaacat ttttcttgtt tcgagtagat aatgccagcc 1080

tgttaaacgc cgtcgacgag tctaacggac accaaccagc gaaccagcag cgtcgcgtcg 1140

ggccaagcga agcagacggc acggcatctc tgtcgctgcc tctggacccc tctcgagagt 1200

tccgctccac cgttggactt gctccgctgt cggcatccag aaattgcgtg gcggagcggc 1260

agacgtgagc cggcacggca ggcggcctcc tcctcctctc acggcaccgg cagctacggg 1320

ggattccttt cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat aaatagacac 1380

cccctccaca ccctctttcc ccaacctcgt gttgttcgga gcgcacacac acacaaccag 1440

atctccccca aatccacccg tcggcacctc cgcttcaagg tacgccgctc gtcctccccc 1500

cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag 1560

ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg 1620

ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt 1680

ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt 1740

ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt 1800

gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt 1860

ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt 1920

attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat 1980

ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 2040

acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat 2100

tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga 2160

actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga 2220

tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg 2280

cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt 2340

ttataattat ttcgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga 2400

tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg 2460

ctcaccctgt tgtttggtgt tacttctgca gggcgcgcca ccatggctcc taagaagaag 2520

cggaaggttg gtattcacgg ggtgcctgcg gctgacaaga agtactccat cggcctcgac 2580

atcggcacca acagcgtcgg ctgggcggtg atcaccgacg agtacaaggt cccgtccaag 2640

aagttcaagg tcctgggcaa caccgaccgc cactccatca agaagaacct catcggcgcc 2700

ctcctcttcg actccggcga gacggcggag gcgacccgcc tcaagcgcac cgcccgccgc 2760

cgctacaccc gccgcaagaa ccgcatctgc tacctccagg agatcttctc caacgagatg 2820

gcgaaggtcg acgactcctt cttccaccgc ctcgaggagt ccttcctcgt ggaggaggac 2880

aagaagcacg agcgccaccc catcttcggc aacatcgtcg acgaggtcgc ctaccacgag 2940

aagtacccca ctatctacca ccttcgtaag aagcttgttg actctactga taaggctgat 3000

cttcgtctca tctaccttgc tctcgctcac atgatcaagt tccgtggtca cttccttatc 3060

gagggtgacc ttaaccctga taactccgac gtggacaagc tcttcatcca gctcgtccag 3120

acctacaacc agctcttcga ggagaaccct atcaacgctt ccggtgtcga cgctaaggcg 3180

atcctttccg ctaggctctc caagtccagg cgtctcgaga acctcatcgc ccagctccct 3240

ggtgagaaga agaacggtct tttcggtaac ctcatcgctc tctccctcgg tctgacccct 3300

aacttcaagt ccaacttcga cctcgctgag gacgctaagc ttcagctctc caaggatacc 3360

tacgacgatg atctcgacaa cctcctcgct cagattggag atcagtacgc tgatctcttc 3420

cttgctgcta agaacctctc cgatgctatc ctcctttcgg atatccttag ggttaacact 3480

gagatcacta aggctcctct ttctgcttcc atgatcaagc gctacgacga gcaccaccag 3540

gacctcaccc tcctcaaggc tcttgttcgt cagcagctcc ccgagaagta caaggagatc 3600

ttcttcgacc agtccaagaa cggctacgcc ggttacattg acggtggagc tagccaggag 3660

gagttctaca agttcatcaa gccaatcctt gagaagatgg atggtactga ggagcttctc 3720

gttaagctta accgtgagga cctccttagg aagcagagga ctttcgataa cggctctatc 3780

cctcaccaga tccaccttgg tgagcttcac gccatccttc gtaggcagga ggacttctac 3840

cctttcctca aggacaaccg tgagaagatc gagaagatcc ttactttccg tattccttac 3900

tacgttggtc ctcttgctcg tggtaactcc cgtttcgctt ggatgactag gaagtccgag 3960

gagactatca ccccttggaa cttcgaggag gttgttgaca agggtgcttc cgcccagtcc 4020

ttcatcgagc gcatgaccaa cttcgacaag aacctcccca acgagaaggt cctccccaag 4080

cactccctcc tctacgagta cttcacggtc tacaacgagc tcaccaaggt caagtacgtc 4140

accgagggta tgcgcaagcc tgccttcctc tccggcgagc agaagaaggc tatcgttgac 4200

ctcctcttca agaccaaccg caaggtcacc gtcaagcagc tcaaggagga ctacttcaag 4260

aagatcgagt gcttcgactc cgtcgagatc agcggcgttg aggaccgttt caacgcttct 4320

ctcggcacct accacgatct cctcaagatc atcaaggaca aggacttcct cgacaacgag 4380

gagaacgagg acatcctcga ggacatcgtc ctcactctta ctctcttcga ggatagggag 4440

atgatcgagg agaggctcaa gacttacgct catctcttcg atgacaaggt tatgaagcag 4500

ctcaagcgtc gccgttacac cggttggggt aggctctccc gcaagctcat caacggtatc 4560

agggataagc agagcggcaa gactatcctc gacttcctca agtctgatgg tttcgctaac 4620

aggaacttca tgcagctcat ccacgatgac tctcttacct tcaaggagga tattcagaag 4680

gctcaggtgt ccggtcaggg cgactctctc cacgagcaca ttgctaacct tgctggttcc 4740

cctgctatca agaagggcat ccttcagact gttaaggttg tcgatgagct tgtcaaggtt 4800

atgggtcgtc acaagcctga gaacatcgtc atcgagatgg ctcgtgagaa ccagactacc 4860

cagaagggtc agaagaactc gagggagcgc atgaagagga ttgaggaggg tatcaaggag 4920

cttggttctc agatccttaa ggagcaccct gtcgagaaca cccagctcca gaacgagaag 4980

ctctacctct actacctcca gaacggtagg gatatgtacg ttgaccagga gctcgacatc 5040

aacaggcttt ctgactacga cgtcgaccac attgttcctc agtctttcct taaggatgac 5100

tccatcgaca acaaggtcct cacgaggtcc gacaagaaca ggggtaagtc ggacaacgtc 5160

ccttccgagg aggttgtcaa gaagatgaag aactactgga ggcagcttct caacgctaag 5220

ctcattaccc agaggaagtt cgacaacctc acgaaggctg agaggggtgg cctttccgag 5280

cttgacaagg ctggtttcat caagaggcag cttgttgaga cgaggcagat taccaagcac 5340

gttgctcaga tcctcgattc taggatgaac accaagtacg acgagaacga caagctcatc 5400

cgcgaggtca aggtgatcac cctcaagtcc aagctcgtct ccgacttccg caaggacttc 5460

cagttctaca aggtccgcga gatcaacaac taccaccacg ctcacgatgc ttaccttaac 5520

gctgtcgttg gcaccgctct tatcaagaag taccctaagc ttgagtccga gttcgtctac 5580

ggtgactaca aggtctacga cgttcgtaag atgatcgcca agtccgagca ggagatcggc 5640

aaggccaccg ccaagtactt cttctactcc aacatcatga acttcttcaa gaccgagatc 5700

accctcgcca acggcgagat ccgcaagcgc cctcttatcg agacgaacgg tgagactggt 5760

gagatcgttt gggacaaggg tcgcgacttc gctactgttc gcaaggtcct ttctatgcct 5820

caggttaaca tcgtcaagaa gaccgaggtc cagaccggtg gcttctccaa ggagtctatc 5880

cttccaaaga gaaactcgga caagctcatc gctaggaaga aggattggga ccctaagaag 5940

tacggtggtt tcgactcccc tactgtcgcc tactccgtcc tcgtggtcgc caaggtggag 6000

aagggtaagt cgaagaagct caagtccgtc aaggagctcc tcggcatcac catcatggag 6060

cgctcctcct tcgagaagaa cccgatcgac ttcctcgagg ccaagggcta caaggaggtc 6120

aagaaggacc tcatcatcaa gctccccaag tactctcttt tcgagctcga gaacggtcgt 6180

aagaggatgc tggcttccgc tggtgagctc cagaagggta acgagcttgc tcttccttcc 6240

aagtacgtga acttcctcta cctcgcctcc cactacgaga agctcaaggg ttcccctgag 6300

gataacgagc agaagcagct cttcgtggag cagcacaagc actacctcga cgagatcatc 6360

gagcagatct ccgagttctc caagcgcgtc atcctcgctg acgctaacct cgacaaggtc 6420

ctctccgcct acaacaagca ccgcgacaag cccatccgcg agcaggccga gaacatcatc 6480

cacctcttca cgctcacgaa cctcggcgcc cctgctgctt tcaagtactt cgacaccacc 6540

atcgacagga agcgttacac gtccaccaag gaggttctcg acgctactct catccaccag 6600

tccatcaccg gtctttacga gactcgtatc gacctttccc agcttggtgg tgataagcgt 6660

cctgctgcca ccaaaaaggc cggacaggct aagaaaaaga agtagcctgc aggtcctgct 6720

ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 6780

cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 6840

aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 6900

tgattgtacc ctactactta tatgtacaat attaaaatga aaacaatata ttgtgctgaa 6960

taggtttata gcgacatcta tgatagagcg ccacaataac aaacaattgc gttttattat 7020

tacaaatcca attttaaaaa aagcggcaga accggtcaaa cctaaaagac tgattacata 7080

aatcttattc aaatttcaaa agtgccccag gggctagtat ctacgacaca ccgagcggcg 7140

aactaataac gctcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc 7200

cttgaagttg agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt 7260

ccagcacggc ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt 7320

gtatgtgggc cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc 7380

gggtccaggg cgaattttgc gacaacatgt cgaggctcag caggccggcc gtttaaacca 7440

actttattat acaaagttgg cattataaaa aagcattgct tatcaatttg ttgcaacgaa 7500

caggtcacta tcagtcaaaa taaaatcatt atttctgggc ctcatgggcc ttccgctcac 7560

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 7620

tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 7680

gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 7740

ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 7800

acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 7860

tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 7920

ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7980

ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8040

ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8100

actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8160

gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8220

tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8280

caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8340

atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8400

acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 8460

ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8520

ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8580

tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8640

tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 8700

gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 8760

tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 8820

tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 8880

ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 8940

tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9000

ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9060

gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9120

ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9180

cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9240

ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9300

ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9360

gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9420

ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9480

gcgcacattt ccccgaaaag tgccac 9506

<210> 66
<211> 17930
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector RLW137

<400> 66
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60

agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120

taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180

gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240

tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300

gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360

aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420

agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480

ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540

atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600

tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660

ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720

tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780

tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840

acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900

cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960

acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020

aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080

tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140

tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200

tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260

atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320

gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380

atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440

atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500

ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560

gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620

cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680

tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740

cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800

ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860

gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920

tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980

ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040

gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100

atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160

agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220

gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280

gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340

atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400

ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460

atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520

ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580

tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640

ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700

gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760

tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820

tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880

cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940

gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000

ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060

aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120

tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180

gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240

tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300

acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360

atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420

ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480

gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540

gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600

gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660

attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720

aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780

gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840

tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900

aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960

ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020

gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080

cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140

cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200

acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260

ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320

agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380

ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440

cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500

gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560

ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620

gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680

caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740

tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800

acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860

atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920

atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980

cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040

gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100

ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160

gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220

tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280

ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340

agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400

tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460

ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520

caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580

tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640

tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700

ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760

acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820

ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880

ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940

cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000

atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060

tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120

tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180

aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240

ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300

ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360

tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420

aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480

caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540

tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600

taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660

tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720

tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780

atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840

gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900

cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960

attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020

tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080

ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140

gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200

ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260

tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320

acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380

cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440

ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500

ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560

gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620

cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680

gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740

caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800

gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860

cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920

cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980

ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040

cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100

cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160

catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220

catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280

gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340

catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400

gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460

cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520

tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580

tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640

tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700

gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760

catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820

atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880

attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940

tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000

gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060

tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120

tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180

gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240

ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300

cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360

tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420

gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480

gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540

ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600

ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660

taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720

aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780

cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840

tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900

taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960

tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020

ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080

gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140

cgcgctgtcg cttgtgtgca ttgagtgcta tgctgaggtt ttagagctag aaatagcaag 10200

ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260

ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320

acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380

gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440

ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500

cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagaa 10560

ctgcaaaatc caatgttctg gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620

aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680

aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740

gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800

atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860

cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920

cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980

atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040

agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100

tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160

tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220

gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280

ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340

gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400

agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460

taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520

aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580

cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640

cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700

acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760

ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820

gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880

ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940

cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000

ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060

gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120

acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180

gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240

atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300

tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360

tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420

tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480

ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540

ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600

tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660

atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720

atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780

gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840

cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900

ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960

gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020

acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080

tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140

gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200

gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260

agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320

ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380

accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440

accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500

ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560

ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620

tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680

tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740

gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800

tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860

acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920

tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980

ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040

aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100

agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160

tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220

aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280

ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340

accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400

ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460

ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520

ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580

agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640

agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700

accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760

actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820

atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880

tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940

tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000

acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060

gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120

tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180

agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240

gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300

ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360

actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420

ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480

tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540

acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600

tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660

tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720

agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780

tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840

attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900

tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960

gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020

ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080

acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140

acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200

agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260

agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320

agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380

cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440

cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500

agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560

agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620

tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680

ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740

tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800

agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860

tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920

agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980

cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040

acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100

acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160

aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220

gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280

agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340

gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400

cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460

tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520

aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580

caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640

tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700

ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760

gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820

tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880

ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930

<210> 67
<211> 3734
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector CC019

<400> 67
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60

gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120

agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180

tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240

gcttgtgtga ctgcaaaagg caatgttcgt tttagagcta gaaatagcaa gttaaaataa 300

ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360

gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420

gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480

atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540

atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600

tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagagg actgcaaaat 660

ccaatgttct cgaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720

attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780

ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840

agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900

tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960

tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020

ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080

attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140

tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200

cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260

gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320

ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380

aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440

tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500

ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560

cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620

ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680

ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740

gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800

agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860

cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920

aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040

ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100

aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280

cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460

cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760

ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000

acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120

tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180

ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240

atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300

ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420

ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480

ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540

agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600

tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660

ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720

gccggtaccg cgat 3734

<210> 68
<211> 17930
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector RLW138

<400> 68
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60

agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120

taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180

gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240

tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300

gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360

aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420

agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480

ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540

atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600

tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660

ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720

tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780

tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840

acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900

cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960

acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020

aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080

tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140

tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200

tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260

atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320

gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380

atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440

atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500

ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560

gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620

cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680

tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740

cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800

ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860

gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920

tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980

ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040

gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100

atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160

agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220

gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280

gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340

atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400

ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460

atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520

ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580

tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640

ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700

gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760

tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820

tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880

cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940

gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000

ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060

aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120

tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180

gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240

tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300

acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360

atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420

ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480

gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540

gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600

gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660

attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720

aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780

gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840

tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900

aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960

ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020

gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080

cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140

cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200

acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260

ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320

agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380

ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440

cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500

gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560

ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620

gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680

caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740

tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800

acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860

atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920

atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980

cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040

gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100

ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160

gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220

tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280

ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340

agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400

tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460

ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520

caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580

tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640

tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700

ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760

acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820

ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880

ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940

cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000

atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060

tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120

tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180

aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240

ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300

ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360

tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420

aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480

caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540

tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600

taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660

tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720

tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780

atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840

gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900

cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960

attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020

tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080

ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140

gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200

ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260

tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320

acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380

cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440

ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500

ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560

gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620

cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680

gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740

caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800

gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860

cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920

cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980

ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040

cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100

cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160

catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220

catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280

gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340

catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400

gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460

cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520

tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580

tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640

tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700

gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760

catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820

atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880

attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940

tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000

gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060

tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120

tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180

gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240

ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300

cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360

tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420

gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480

gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540

ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600

ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660

taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720

aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780

cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840

tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900

taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960

tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020

ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080

gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140

cgcgctgtcg cttgtgtgac tgcaaaaggc aatgttcgtt ttagagctag aaatagcaag 10200

ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260

ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320

acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380

gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440

ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500

cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagga 10560

ctgcaaaatc caatgttctc gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620

aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680

aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740

gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800

atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860

cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920

cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980

atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040

agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100

tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160

tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220

gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280

ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340

gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400

agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460

taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520

aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580

cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640

cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700

acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760

ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820

gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880

ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940

cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000

ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060

gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120

acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180

gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240

atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300

tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360

tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420

tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480

ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540

ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600

tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660

atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720

atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780

gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840

cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900

ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960

gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020

acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080

tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140

gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200

gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260

agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320

ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380

accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440

accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500

ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560

ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620

tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680

tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740

gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800

tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860

acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920

tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980

ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040

aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100

agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160

tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220

aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280

ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340

accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400

ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460

ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520

ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580

agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640

agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700

accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760

actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820

atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880

tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940

tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000

acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060

gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120

tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180

agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240

gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300

ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360

actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420

ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480

tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540

acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600

tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660

tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720

agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780

tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840

attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900

tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960

gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020

ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080

acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140

acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200

agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260

agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320

agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380

cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440

cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500

agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560

agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620

tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680

ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740

tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800

agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860

tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920

agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980

cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040

acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100

acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160

aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220

gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280

agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340

gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400

cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460

tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520

aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580

caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640

tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700

ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760

gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820

tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880

ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930

<210> 69
<211> 3755
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector CC020

<400> 69
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60

gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120

agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180

tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240

gcttgtgtgt gggttattga ttctgttggt tttagagcta gaaatagcaa gttaaaataa 300

ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgcattacg ttcagagctg 360

gatcatttgg cccaagggaa gatgcattct ttgaagctgt taccaaccta gcctgtgaga 420

agaaacttcc tcttatttat ttggcagcaa attctggtgc tcgaattggc atagcagatg 480

aagtgaaatc ttgcttccgt gttgggtggt ctgatgatgg cagccctgaa cgtgggtttc 540

agtacattta tctaagcgaa gaagactatg ctcgtattgg cacttctgtc atagcacata 600

agatgcagct agacagtggt gaaattaggt gggttattga ttctgttgtc ggcaaggaag 660

atggacttgg tgtggagaat ctccatggaa gtgctgctat tgccagtgct tattctaggg 720

catataagga gacatttaca cttacatttg tgactggaag aactgttgga ataggagctt 780

atcttgctcg acttggcatc cggtgcatac agcgtcttga ccagcctatt attcttacag 840

gctattctgc actgaacaag cttcttgggc gggaagtgta cagctcccac atgcagttgg 900

gtggtcccaa aatcatggca actaatggtg ttgtccatct tactgtttca gatgaccttg 960

aaggcgtttc taatatattg aggttttttt tgcggccgcc ccgggcctgc aggggatccc 1020

gatcgggccg gccgtttaaa cccactttgt acaagaaagt tgaacgagaa acgtaaaatg 1080

atataaatat caatatatta aattagattt tgcataaaaa acagactaca taatactgta 1140

aaacacaaca tatgcagtca ctatgaacca actacttaga tggtattagt gacctgtact 1200

gggcctcatg ggccttccgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 1260

tgcattaaca tggtcatagc tgtttccttg cgtattgggc gctctccgct tcctcgctca 1320

ctgactcgct gcgctcggtc gttcgggtaa agcctggggt gcctaatgag caaaaggcca 1380

gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1440

ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1500

ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1560

gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1620

ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1680

cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1740

cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1800

gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1860

aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1920

tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 1980

gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2040

tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2100

gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2160

tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2220

ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2280

ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagaaccac gctcaccggc 2340

tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2400

aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 2460

gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 2520

gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 2580

ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 2640

gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 2700

gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 2760

gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 2820

tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 2880

gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 2940

agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3000

aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3060

ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3120

gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctaaattgta 3180

agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 3240

caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 3300

agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt gggaagggcg 3360

tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 3420

gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 3480

agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca aggccgcatt 3540

acaggtcact aataccatct aagtagttgg ttcatagtga ctgcatatgt tgtgttttac 3600

agtattatgt agtctgtttt ttatgcaaaa tctaatttaa tatattgata tttatatcat 3660

tttacgtttc tcgttcaact tttttgtaca aacttgattt aaatgaattc aagcttttaa 3720

ttaagcatgc gagctcggcg cgccggtacc gcgat 3755

<210> 70
<211> 17951
<212> DNA
<213> Artificial Sequence

<220>
<223> Vector RLW139

<400> 70
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60

agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120

taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180

gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240

tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300

gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360

aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420

agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480

ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540

atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600

tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660

ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720

tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780

tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840

acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900

cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960

acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020

aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080

tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140

tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200

tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260

atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320

gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380

atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440

atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500

ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560

gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620

cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680

tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740

cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800

ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860

gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920

tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980

ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040

gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100

atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160

agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220

gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280

gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340

atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400

ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460

atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520

ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580

tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640

ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700

gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760

tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820

tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880

cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940

gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000

ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060

aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120

tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180

gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240

tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300

acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360

atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420

ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480

gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540

gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600

gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660

attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720

aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780

gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840

tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900

aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960

ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020

gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080

cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140

cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200

acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260

ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320

agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380

ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440

cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500

gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560

ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620

gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680

caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740

tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800

acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860

atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920

atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980

cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040

gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100

ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160

gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220

tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280

ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340

agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400

tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460

ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520

caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580

tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640

tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700

ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760

acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820

ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880

ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940

cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000

atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060

tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120

tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180

aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240

ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300

ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360

tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420

aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480

caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540

tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600

taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660

tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720

tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780

atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840

gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900

cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960

attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020

tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080

ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140

gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200

ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260

tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320

acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380

cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440

ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500

ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560

gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620

cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680

gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740

caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800

gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860

cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920

cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980

ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040

cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100

cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160

catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220

catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280

gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340

catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400

gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460

cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520

tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580

tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640

tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700

gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760

catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820

atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880

attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940

tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000

gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060

tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120

tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180

gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240

ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300

cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360

tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420

gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480

gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540

ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600

ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660

taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720

aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780

cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840

tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900

taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960

tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020

ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080

gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140

cgcgctgtcg cttgtgtgtg ggttattgat tctgttggtt ttagagctag aaatagcaag 10200

ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcattacgt 10260

tcagagctgg atcatttggc ccaagggaag atgcattctt tgaagctgtt accaacctag 10320

cctgtgagaa gaaacttcct cttatttatt tggcagcaaa ttctggtgct cgaattggca 10380

tagcagatga agtgaaatct tgcttccgtg ttgggtggtc tgatgatggc agccctgaac 10440

gtgggtttca gtacatttat ctaagcgaag aagactatgc tcgtattggc acttctgtca 10500

tagcacataa gatgcagcta gacagtggtg aaattaggtg ggttattgat tctgttgtcg 10560

gcaaggaaga tggacttggt gtggagaatc tccatggaag tgctgctatt gccagtgctt 10620

attctagggc atataaggag acatttacac ttacatttgt gactggaaga actgttggaa 10680

taggagctta tcttgctcga cttggcatcc ggtgcataca gcgtcttgac cagcctatta 10740

ttcttacagg ctattctgca ctgaacaagc ttcttgggcg ggaagtgtac agctcccaca 10800

tgcagttggg tggtcccaaa atcatggcaa ctaatggtgt tgtccatctt actgtttcag 10860

atgaccttga aggcgtttct aatatattga ggtttttttt gcggccgccc cgggcctgca 10920

ggggatcccg atcgggccgg ccgtttaaac ccactttgta caagaaagct gggtatttaa 10980

atgaattcaa gcttttaatt aatgcagtgc agcgtgaccc ggtcgtgccc ctctctagag 11040

ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt tgtcacactt 11100

gtttgaagtg cagtttatct atctttatac atatatttaa actttactct acgaataata 11160

taatctatag tactacaata atatcagtgt tttagagaat catataaatg aacagttaga 11220

catggtctaa aggacaattg agtattttga caacaggact ctacagtttt atctttttag 11280

tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac ttcatccatt 11340

ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa tttttttagt 11400

acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct attttagttt 11460

ttttatttaa tagtttagat ataaaataga ataaaataaa gtgactaaaa attaaacaaa 11520

taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag tagataatgc 11580

cagcctgtta aacgccgtcg acgagtctaa cggacaccaa ccagcgaacc agcagcgtcg 11640

cgtcgggcca agcgaagcag acggcacggc atctctgtcg ctgcctctgg acccctctcg 11700

agagttccgc tccaccgttg gacttgctcc gctgtcggca tccagaaatt gcgtggcgga 11760

gcggcagacg tgagccggca cggcaggcgg cctcctcctc ctctcacggc accggcagct 11820

acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc gtaataaata 11880

gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca cacacacaca 11940

accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc cgctcgtcct 12000

cccccccccc ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc 12060

ggtagttcta cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc 12120

tagcgttcgt acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag 12180

tgtttctctt tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca 12240

tgattttttt tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat 12300

gccgtgcact tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat 12360

gtggtctggt tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg 12420

gatttattaa ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag 12480

atgatggatg gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg 12540

catatacaga gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg 12600

ttcattcgtt ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt 12660

ttggaactgt atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat 12720

atcgatctag gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc 12780

atatgcagca tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt 12840

atgttttata attatttcga tcttgatata cttggatgat ggcatatgca gcagctatat 12900

gtggattttt ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt 12960

cgatgctcac cctgttgttt ggtgttactt ctgcagggcg cgccaccatg gctcctaaga 13020

agaagcggaa ggttggtatt cacggggtgc ctgcggctga caagaagtac tccatcggcc 13080

tcgacatcgg caccaacagc gtcggctggg cggtgatcac cgacgagtac aaggtcccgt 13140

ccaagaagtt caaggtcctg ggcaacaccg accgccactc catcaagaag aacctcatcg 13200

gcgccctcct cttcgactcc ggcgagacgg cggaggcgac ccgcctcaag cgcaccgccc 13260

gccgccgcta cacccgccgc aagaaccgca tctgctacct ccaggagatc ttctccaacg 13320

agatggcgaa ggtcgacgac tccttcttcc accgcctcga ggagtccttc ctcgtggagg 13380

aggacaagaa gcacgagcgc caccccatct tcggcaacat cgtcgacgag gtcgcctacc 13440

acgagaagta ccccactatc taccaccttc gtaagaagct tgttgactct actgataagg 13500

ctgatcttcg tctcatctac cttgctctcg ctcacatgat caagttccgt ggtcacttcc 13560

ttatcgaggg tgaccttaac cctgataact ccgacgtgga caagctcttc atccagctcg 13620

tccagaccta caaccagctc ttcgaggaga accctatcaa cgcttccggt gtcgacgcta 13680

aggcgatcct ttccgctagg ctctccaagt ccaggcgtct cgagaacctc atcgcccagc 13740

tccctggtga gaagaagaac ggtcttttcg gtaacctcat cgctctctcc ctcggtctga 13800

cccctaactt caagtccaac ttcgacctcg ctgaggacgc taagcttcag ctctccaagg 13860

atacctacga cgatgatctc gacaacctcc tcgctcagat tggagatcag tacgctgatc 13920

tcttccttgc tgctaagaac ctctccgatg ctatcctcct ttcggatatc cttagggtta 13980

acactgagat cactaaggct cctctttctg cttccatgat caagcgctac gacgagcacc 14040

accaggacct caccctcctc aaggctcttg ttcgtcagca gctccccgag aagtacaagg 14100

agatcttctt cgaccagtcc aagaacggct acgccggtta cattgacggt ggagctagcc 14160

aggaggagtt ctacaagttc atcaagccaa tccttgagaa gatggatggt actgaggagc 14220

ttctcgttaa gcttaaccgt gaggacctcc ttaggaagca gaggactttc gataacggct 14280

ctatccctca ccagatccac cttggtgagc ttcacgccat ccttcgtagg caggaggact 14340

tctacccttt cctcaaggac aaccgtgaga agatcgagaa gatccttact ttccgtattc 14400

cttactacgt tggtcctctt gctcgtggta actcccgttt cgcttggatg actaggaagt 14460

ccgaggagac tatcacccct tggaacttcg aggaggttgt tgacaagggt gcttccgccc 14520

agtccttcat cgagcgcatg accaacttcg acaagaacct ccccaacgag aaggtcctcc 14580

ccaagcactc cctcctctac gagtacttca cggtctacaa cgagctcacc aaggtcaagt 14640

acgtcaccga gggtatgcgc aagcctgcct tcctctccgg cgagcagaag aaggctatcg 14700

ttgacctcct cttcaagacc aaccgcaagg tcaccgtcaa gcagctcaag gaggactact 14760

tcaagaagat cgagtgcttc gactccgtcg agatcagcgg cgttgaggac cgtttcaacg 14820

cttctctcgg cacctaccac gatctcctca agatcatcaa ggacaaggac ttcctcgaca 14880

acgaggagaa cgaggacatc ctcgaggaca tcgtcctcac tcttactctc ttcgaggata 14940

gggagatgat cgaggagagg ctcaagactt acgctcatct cttcgatgac aaggttatga 15000

agcagctcaa gcgtcgccgt tacaccggtt ggggtaggct ctcccgcaag ctcatcaacg 15060

gtatcaggga taagcagagc ggcaagacta tcctcgactt cctcaagtct gatggtttcg 15120

ctaacaggaa cttcatgcag ctcatccacg atgactctct taccttcaag gaggatattc 15180

agaaggctca ggtgtccggt cagggcgact ctctccacga gcacattgct aaccttgctg 15240

gttcccctgc tatcaagaag ggcatccttc agactgttaa ggttgtcgat gagcttgtca 15300

aggttatggg tcgtcacaag cctgagaaca tcgtcatcga gatggctcgt gagaaccaga 15360

ctacccagaa gggtcagaag aactcgaggg agcgcatgaa gaggattgag gagggtatca 15420

aggagcttgg ttctcagatc cttaaggagc accctgtcga gaacacccag ctccagaacg 15480

agaagctcta cctctactac ctccagaacg gtagggatat gtacgttgac caggagctcg 15540

acatcaacag gctttctgac tacgacgtcg accacattgt tcctcagtct ttccttaagg 15600

atgactccat cgacaacaag gtcctcacga ggtccgacaa gaacaggggt aagtcggaca 15660

acgtcccttc cgaggaggtt gtcaagaaga tgaagaacta ctggaggcag cttctcaacg 15720

ctaagctcat tacccagagg aagttcgaca acctcacgaa ggctgagagg ggtggccttt 15780

ccgagcttga caaggctggt ttcatcaaga ggcagcttgt tgagacgagg cagattacca 15840

agcacgttgc tcagatcctc gattctagga tgaacaccaa gtacgacgag aacgacaagc 15900

tcatccgcga ggtcaaggtg atcaccctca agtccaagct cgtctccgac ttccgcaagg 15960

acttccagtt ctacaaggtc cgcgagatca acaactacca ccacgctcac gatgcttacc 16020

ttaacgctgt cgttggcacc gctcttatca agaagtaccc taagcttgag tccgagttcg 16080

tctacggtga ctacaaggtc tacgacgttc gtaagatgat cgccaagtcc gagcaggaga 16140

tcggcaaggc caccgccaag tacttcttct actccaacat catgaacttc ttcaagaccg 16200

agatcaccct cgccaacggc gagatccgca agcgccctct tatcgagacg aacggtgaga 16260

ctggtgagat cgtttgggac aagggtcgcg acttcgctac tgttcgcaag gtcctttcta 16320

tgcctcaggt taacatcgtc aagaagaccg aggtccagac cggtggcttc tccaaggagt 16380

ctatccttcc aaagagaaac tcggacaagc tcatcgctag gaagaaggat tgggacccta 16440

agaagtacgg tggtttcgac tcccctactg tcgcctactc cgtcctcgtg gtcgccaagg 16500

tggagaaggg taagtcgaag aagctcaagt ccgtcaagga gctcctcggc atcaccatca 16560

tggagcgctc ctccttcgag aagaacccga tcgacttcct cgaggccaag ggctacaagg 16620

aggtcaagaa ggacctcatc atcaagctcc ccaagtactc tcttttcgag ctcgagaacg 16680

gtcgtaagag gatgctggct tccgctggtg agctccagaa gggtaacgag cttgctcttc 16740

cttccaagta cgtgaacttc ctctacctcg cctcccacta cgagaagctc aagggttccc 16800

ctgaggataa cgagcagaag cagctcttcg tggagcagca caagcactac ctcgacgaga 16860

tcatcgagca gatctccgag ttctccaagc gcgtcatcct cgctgacgct aacctcgaca 16920

aggtcctctc cgcctacaac aagcaccgcg acaagcccat ccgcgagcag gccgagaaca 16980

tcatccacct cttcacgctc acgaacctcg gcgcccctgc tgctttcaag tacttcgaca 17040

ccaccatcga caggaagcgt tacacgtcca ccaaggaggt tctcgacgct actctcatcc 17100

accagtccat caccggtctt tacgagactc gtatcgacct ttcccagctt ggtggtgata 17160

agcgtcctgc tgccaccaaa aaggccggac aggctaagaa aaagaagtag cctgcaggtc 17220

ctgctttaat gagatatgcg agacgcctat gatcgcatga tatttgcttt caattctgtt 17280

gtgcacgttg taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc 17340

attctaatga atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa 17400

tttactgatt gtaccctact acttatatgt acaatattaa aatgaaaaca atatattgtg 17460

ctgaataggt ttatagcgac atctatgata gagcgccaca ataacaaaca attgcgtttt 17520

attattacaa atccaatttt aaaaaaagcg gcagaaccgg tcaaacctaa aagactgatt 17580

acataaatct tattcaaatt tcaaaagtgc cccaggggct agtatctacg acacaccgag 17640

cggcgaacta ataacgctca ctgaagggaa ctccggttcc ccgccggcgc gcatgggtga 17700

gattccttga agttgagtat tggccgtccg ctctaccgaa agttacgggc accattcaac 17760

ccggtccagc acggcggccg ggtaaccgac ttgctgcccc gagaattatg cagcattttt 17820

ttggtgtatg tgggccccaa atgaagtgca ggtcaaacct tgacagtgac gacaaatcgt 17880

tgggcgggtc cagggcgaat tttgcgacaa catgtcgagg ctcagcaggc cggccgttta 17940

aaccaacttt a 17951

<210> 71
<211> 10
<212> PRT
<213> Artificial Sequence

<220>
<223> Nuclear Localization Signal

<400> 71
Met Ser Glu Arg Lys Arg Arg Glu Lys Leu
1 5 10

<210> 72
<211> 16
<212> PRT
<213> Artificial Sequence

<220>
<223> Nuclear Localization Signal

<400> 72
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15

<210> 73
<211> 377
<212> DNA
<213> Oryza sativa

<220>
<223> U3 snRNA promoter

<400> 73
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60

tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120

ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180

aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240

agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300

agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360

tgcagatgat ccgtggc 377

Claims

細胞中の標的核酸(標的NA)分子を改変するための方法であって、
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び
d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起きた1つ以上の細胞を単離する工程
を含み、
fuNAはRNAからなる、方法。
gNA分子が、標的NA分子の同数の連続する塩基と相補的な少なくとも12塩基を含むスペーサー核酸(スペーサーNA)分子を含む、請求項1に記載の方法。
gNA分子がスキャフォールド核酸(スキャフォールドNA)分子をさらに含む、請求項2に記載の方法。
スキャフォールドNA分子がgNA分子に共有結合している、請求項3に記載の方法。
細胞が、微生物、動物、ヒト又は植物細胞である、請求項1～4のいずれか一項に記載の方法。
部位特異的核酸改変ポリペプチドが、核酸にガイドされた核酸改変ポリペプチド又はその機能的等価物である、請求項1～5のいずれか一項に記載の方法。
fuNA分子が、前記fuNA分子をコードする1つ以上の発現構築物として導入される、請求項1～6のいずれか一項に記載の方法。
gNA分子に共有結合により連結したdoNA分子を含み組換えfuNA分子であって、fuNAがRNAからなる、fuNA分子。
請求項8に記載のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含むベクター。
a.請求項9に記載のベクター及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び場合により
c.スキャフォールドNA分子をコードするベクター
を含む、ベクターシステム。
細胞内の標的NAを改変するためのシステムであって、
a.請求項9に記載のベクター及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、及び場合により
d.スキャフォールドNA分子をコードするベクター
を含む、システム。
a.請求項9に記載のベクター及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、並びに場合により
d.スキャフォールドNA分子をコードするベクター
を含む、組成物。
細胞内の標的NA分子を改変するための、請求項9に記載のベクター、請求項10に記載のベクターシステム、請求項11に記載のシステム又は請求項12に記載の組成物の使用。