【発明の詳細な説明】
植物U14核酸配列及びその誘導体
本発明は、U14配列並びにそのフラグメント及び誘導体、並びに前記配列の真
核細胞における使用に関する。
真核生物の小さな核RNAの2種の主要クラスは、プレメッセンジャーRNAスプラ
イシングに関与するスプライセオリームsnRNA並びにプレリボソームRNA(pre-rRN
A)転写体のプロセッシング及びリボソーム形成に関与する小さな仁(nuclealor
)RNA(snoRNA)である。少なくとも12個のsnoRNAが酵母において同定されてお
り(Fournier & Maxwell,1993により論評されている)、そしてそれらの仁局在
化、rRNA転写体との塩基の対合の傾向及び仁タンパク質とのそれらの関係のため
にプレ−rRNAプロセッシング又はリボソーム形成に関与することができる。
最も特徴化された動物snoRNAはU3,U8,U13及びU14である。それらのsn
oRNAの性質及び特にU3のプレ−rRNAプロセッシングにおけるその役割が最近、
論評されている(Filipowicz & Kiss,1993)。
U14 snoRNAは正常な成長表現型のために、及び酵母におけるプレ−rRNA転写
体のプロセッシングのために必要とされる(Jarmolowskiなど.,1990)。U14は保
存されたBoxC及びD配列を含み、このBoxCは仁タンパク質、すなわちフィブリ
ラリンの結合のために必要とされ(Basergaなど.,1991)、そして多くの仁snoRNA
に見出され、そして2種の保存された配列要素は18S rRNAに相補的である(Trin
h-Rolik及びMaxwell,1986;Li及びFournier,1992)。動物U14のゲノム構成は
、マウス、ラット、アフリカツメガエル及び
ヒトにおいて、U14の3つのコピーが構造的に発現された同起源のhsc70熱ショ
ック遺伝子のイントロン5,6及び8に位置することにおいて特に有意なもので
ある(Liu & Maxwell,1990)。hsc70イントロンのコード鎖におけるU14配列の配
向、典型的なUsn RNAプロモーター配列の欠乏、及び5’端でのキャップ構造体
の欠乏は、それらのU14配列がhsc70プレ−mRNAの一部として転写され、そして
それらを含むイントロン配列からプロセッシングされることを示唆する。
最近、多くの他のsnoRNAが、大部分、仁タンパク質のイントロン内にコードさ
れることが示されている。U15、すなわち単一コピーの遺伝子は、ヒトにおける
S3リボソームタンパク質遺伝子の最初のイントロンに見出され(Tycowskiなど.
,1993)、そしてU16及びU18はアフリカツメガエル種及びヒトのL1リボソー
ムタンパク質遺伝子のイントロンに見出された(Fragapaneなど.,1993;Prislei
など.,1993)。2つのU17遺伝子はヒト細胞周期調節タンパク質遺伝子、RCCIの
イントロン1及び2に存在する。リボソーム又は仁タンパク質遺伝子のイントロ
ンにコードされているように見え又はそこにたぶんコードされている他のsnoRNA
、すなわちU19−U21,Y,E2及びE3の例が、最近論評されている(Filipo
wicz & Kiss、前記)。
異なった動物種間でのU14ゲノム機構の進化的な保存及びイントロン−コード
されたsnoRNA遺伝子の現在の広範な発生は、この種の遺伝子配置が仁又はリボソ
ーム成分の発現の調整を確保するよう機能することができることを示している。
酵母においては、U14 snoRNAはイントロン−コードされていないが、しかし
U14及び第2の仁snKNA、すなわちsnR190の両者を含む前駆体からたぶんプロセ
ッシングされたらしい(Zagorskiなど.,
1988;Balakinなど.,1994)。
酵母及び哺乳類U14の末端並びに多くの他のイントロン−コードされたsnoRNA
の共通する特徴、及びアフリカツメガエル核におけるマウスhsc70イントロン5
の転写体からのU14の好結果をもたらすプロセッシングは、プロセッシング機構
の保存を示唆する。この機構は解明されているが、ヒトインビトロ抽出物におけ
るU15及びU17のプロセッシングは、5’及び3’端プロセッシングがお互い独
立しており、そして検出される別々の生成物が境界の配列のエキソヌクレアーゼ
分解性消化のために、特に3’端での成熟を伴っての初期のエンドヌクレアーゼ
分解段階の表示であることを示唆した(Kiss & Filipowicz,1993;Tyckowskiな
ど.,1993)。
酵母と後生動物(meta zoan)との間のU14ゲノム機構の差異、及びショウジョ
ウバエ及びサッカロミセス・ポンベ(Saccharomyces pombe)RCCI類似体のイン
トロンにおけるU17の欠乏は、そのような遺伝子配置が高等真核生物及び脊椎動
物においてのみ見出されるか否かの問題を提供した。
現在までのところ、植物snoRNA遺伝子に基づいて入手できる唯一の情報は、U
3(Kiss & Solymosy,1990;Marshallsayなど.,1990,1992;Kissなど.,1991)
及びMRP/7−2 snRNA(Kissなど.,1992)に関する。植物U14遺伝子に関するデ
ータは入手できない。本発明下にある技術的問題は、U14遺伝子が植物に存在す
るか否かを同定し、そしてそうであれば、それらの構造及び機能を解明すること
であった。
本発明者は、PCRアプローチを用いての植物U14の特徴化に成功した。彼らは
、トウモロコシ及びジャガイモのゲノムクローンを単離し、そしてそれらのゲノ
ム機構を分析した。2つのゲノムクローン、すなわちトウモロコシからのクロー
ン及びジャガイモからのク
ローンは単一のU14遺伝子を含み、そして第2のトウモロコシのゲノムクローン
は4つの密接して連結されたU14配列の集団を含んだ。植物U14遺伝子のクラス
ター化は、トウモロコシ、大麦及びジャガイモDNAによる遺伝子間PCRにより確認
され、そしてトウモロコシ及びジャガイモRNAに基づく遺伝子間RT−PCRはポリシ
ストロン性U14転写体の発現を示した。真核性RNAポリメラーゼII又はIIIプロモ
ーター要素は認識できず、そして中間のフランキング配列がAUに富んでおり、す
なわち植物U14がイントロンコードされ得ることを示唆する植物イントロンの特
性(Goodall & Filipowicz,1989)に富んでいる。データベースにおける配列と
前記フランキング配列との相同性の欠乏は宿主遺伝子の同定を可能にしなかった
。さらに、この新規のゲノム機構、すなわち既知のプロモーター要素の不在及び
RT−PCRによるポリシストロン性転写体の検出は、遺伝子の同時転写及び個々の
U14を開放するプロセッシングを示す。
本発明は、下記式:
〔Fa−Ub−Fc〕n
〔式中、a+b+c≧1であり、そしてn≧1であり;そしてUは翻訳されない
配列として植物ゲノムに存在する配列、すなわち“U14”を表わし、ここで前記
翻訳されない配列は:
i)少なくとも1つの次の計統発生的に保存された配列(ここでNはヌクレオ
チドA,C,G又はTのいづれか1つを表わす):
あるいは配列I,II又はIIIの1つと少なくとも90%の相同性を有する配列、及
び
ii)少なくとも1つの植物−特異的領域、及び
iii)一対の逆方向反復体、を含んで成り、そしてFは、植物ゲノムにおいて
、前記“U14”配列に直接的に隣接する翻訳されていない“フランキング”配列
を表わす〕を含んで成るか又はそれから成る核酸配列又は分子に関する。上記の
保存された配列Iにおいて、6番目の位置におけるA及びTの表示はA又はTの
いづれかの存在を意味する。
本発明において、“計統発生的に保存された領域”とは、少なくとも6個のヌ
クレオチドの長さを有し、そして真核生物、たとえば酵母のU14配列において、
全く同じに存在するか又は少なくとも90%の相同性及び好ましくは少なくとも95
%の相同性で存在する核酸配列を意味する。
本発明において、“翻訳されていない”とは、ゲノム及び転写されたRNAには
存在するが、しかしタンパク質配列に翻訳されていない配列を意味する。U14遺
伝子コード配列はRNA前駆体からプロセッシングされ、そして安定した分子とし
て仁に向けられる。
本発明において、%相同性は、2つの配列の整合においての同一の塩基の数を
、示された境界間の長さにより除した数値として計算される。その示された境界
間で、2つの配列が同じ長さのものでない場合、%相同性は、配列における同一
の塩基の数を最長の配列の長さで除した数値である。
従って、本発明はまず第1に、植物核ゲノム及び転写されたRNAにおいて天然
に存在するU14遺伝子(小さな仁RNA)及び/又はU14遺伝子のフランキング遺伝
子間配列と同じ配列及び構造を有する単離された核酸配列に関する。第2に、本
発明は、それらのゲノム配列の誘導体及びフラグメントに関する。
第1の態様によれば、図面に示される配列を包含する、本発明の配列は、上記
計統発生的に保存された配列I,II又はIII、好ましく
はII及びIII、又はそれらの一部、又はそれらの配列と約90%、たとえば95%の
相同性を有する配列を、核酸増幅反応、たとえばポリメラーゼ鎖反応(PCR)、好
ましくはSimpsonなど.,1992により記載されるような逆転写酵素PCRにおけるプ
ライマーとして用いて、植物の全体のRNA調製物から単離され得る(下記例を参
照のこと)。たとえば、RT−PCRが、種々の植物組織からのRNAに基づいて、プラ
イマーとして転換された配列II及びIIIを用いて実施される。これは通常、U14
をコードする配列の内部フラグメントに対応する約70〜100個の塩基対の生成物
を付与する。次に、プライマーが、密接に連結されたU14遺伝子間での増幅(遺
伝子間PCR又はIgPCR)を可能にするためにRT−PCRの生成物から生成される。これ
は通常、150〜300個のbpサイズ範囲での生成物を付与する。他方、転換された領
域、又は密接して連結された遺伝子間で増幅された領域に対応するハイブリダイ
ゼーションプローブが、ゲノム植物DNAライブラリーをスクリーンするために使
用され得る。それらのフランキング配列を伴って又は伴わないでのU14遺伝子の
この単離方法はまた、本発明の一部を形成する。
本発明のU14配列(また、“U14コード配列”としても言及される)は、それ
らが少なくとも1つの及び通常すべての3つの上記転換された配列を含み、そし
て一対の逆方向反復体により個々の末端で境界を付与されているので、増幅生成
物において容易に同定できる。それらはまた、既知の真核プロモーターの存在に
より及び仁・タンパク質フィブリラリンを結合するそれらの可能性により特徴づ
けられる。
逆方向反復体を包含する本発明のU14配列の合計の長さは、それが起因する植
物種に従って及び特定のU14遺伝子に従って変化するが、しかし一般的には、50
〜150個の間のヌクレオチドの長さであ
る。典型的な長さは、100〜150個のヌクレオチドである。逆方向反復体は通常、
4〜20個のヌクレオチドの長さである。
上記で定義された、転換された配列Iはまた、BoxCとしても知られており、
そして最とも通常にはTGATGAであるが、しかしまた、TGATGTでもあり得る。それ
は、2又は3個のヌクレオチドにより5’逆方向反復体配列から分離されるU14
配列の5’端で生じる。
転換された配列IIは、U14配列のほぼ中央に存在し、そして18−S rRNAに対
して相補的な普遍的18−SA要素CATTCGCATNNC(Li及びFournier,1992)を含む。
転換された配列IIIは、U14配列の3’端で存在し、“BoxD”要素、すなわち
現在までに同定されたすべてのU14配列において普遍的な要素を含む。転換され
た配列IIIはまた、推定上の18−SB要素CCTTCCTの部分も含む(Li及びFournier,
1992)。
本発明のU14配列は、上記に定義された計統発生的に保存された配列の他に、
1又は複数の植物特異的領域も含む。本発明において、“植物特異的”とは、そ
の領域が他の真核生物、特に後生動物及び酵母からのU14配列と40%以下及び好
ましくは30%又は20%以下の相同性を有することを意味する。これまでに同定さ
れた植物特異的領域は、いづれの既知のU14配列に相同の相対物(counterpant
)を有さない。それらは、その種に依存して、約5又は6個のヌクレオチドから
200個以上のヌクレオチドの長さで変化できる。被子植物においては、典型的な
長さは20〜60個、たとえば30〜35又は40個のヌクレオチドである。下等植物、た
とえばシダはより一層、長い植物特異的領域、たとえば100〜160個のヌクレオチ
ドを有することが示されている。
U14配列は典型的には、2つの植物特異的領域を含み、すなわち1つの主要領
域は3’配列と中央の転換された配列との間に位置す
る約35〜200個のヌクレオチド(被子植物のためには約35個)の長さを有し、
そしてマイナーな領域はBoxC転換された配列の3’側に隣接して7〜8個のヌ
クレオチドを有する。植物界内で、それらの配列は一般的に、少なくとも70%の
相同性を伴って保存される。主要及びマイナーの植物特異的領域はしばしば、そ
れぞれ次の配列:GCCNNGCCAGGCTNGAGAGNTNNTGGTGNNNNAT及びYRNARNN(ここで、
NはヌクレオチドA,C,G,Tのいづれか1つを表わし、Yはピリミジン(T
,C)であり、そしてRはプリン(G,A)である)を有する。それらの両配列
において、挿入は、特に、“N”により示される位置に続いて示されるいづれか
2つの連続的なヌクレオチド間で生じることができる。前記挿入は、1又は複数
の塩基を含んで成り、そして50〜150個又はそれ以上もの長さの塩基であり得る
(図11を参照のこと)。より短い挿入がマイナーな植物特異的配列においてより
予想され、そしてより長い挿入が主要な配列において生じる。
主要な植物特異的配列の例は、GCCNYGCCAGGCTYGAGAGNTNRTGCTGYNNNATである。
マイナーな植物特異的領域の例は、TANANYT(ここで、Y,R及びNは前記で
定義された通りである)である。
従って、主要及びマイナーな植物特異的領域は、それぞれ次の配列:GCCNTGCC
AGGCTTGAGAGNTNNTGCTGNNNAAT及びTGAAGTTを有し、又は他方、それらは、それら
の配列の1つと少なくとも70%、そして好ましくは80%又は90%の相同性を有す
る配列を有する。種内で、植物特異的領域の相同性は80%,90%又は95%ほどに
高い。マイナーな植物特異的配列は酵母及び脊椎動物のU14遺伝子に相対物を有
さない。主要な保存された配列は、植物及び酵母におけるそれらの2つの領域間
の相同性の程度はひじょうに低いけれども、相対物を
有する。脊椎動物において、この領域は完全に不在である。
主要な植物特異的領域はまた、脊椎動物及び酵母の両者のU14遺伝子における
対応する配列に対していくらかの類似性を有する、約10個のヌクレオチドを有す
る比較的保存された領域により分離される2つの小さな植物特異的サブ領域を含
んで成るものとして見なされる(図15−植物−特異的サブ領域P2及びP3を
参照のこと)。P2はしばしば、上記タイプの挿入を伴って又は伴わないで、配
列GCCNNGCCAGGCを有する。P3はしばしば、配列TGCTGNNNNATを有する。従って
、本発明の配列は、2つの植物特異的サブ領域P2及びP3の1つ、又は少なく
とも6個のヌクレオチド及び好ましくは、少なくとも8個のヌクレオチドを有す
るそのフラグメントを含んで成り又はそれから成ることができる。主要な植物特
異的領域についてと同じ手段において、挿入はP2及びP3のための上記配列に
示されるいづれか2つの連続的な塩基間で生じ得る。前記挿入は、1〜数+の塩
基の長さ、たとえば1〜150又は1〜50又は60個の塩基の長さであり得、そして
次の位置において生じ:
ここで、Xは少なくとも1つのヌクレオチドの挿入を表わす。
本発明のU14配列はさらに、コード配列の末端で、4〜20個、たとえば6〜12
個の長さのヌクレオチドを通常有し、そして塩基対合によりステムの形成を可能
にするためにお互いに対して相補的である、一対の逆方向反復体を含む。そのス
テム構造は、RNaseによる消化からU14遺伝子を保護すると思われている。その
ような逆方向反復体の例は下記のものである:
WTGCCN(ここで、W=T又はG、及びその補体であり、N=T,G,C又はA
である)、
TXYZTTGC(ここで、X=G又はC、Y=C又はTであり、Z=A又はTである
)、及びその補体、
GCCZTGTT(ここで、ZはA又はT)、及びその補体である。
上記配列において、XYZはしばしば、GCA(大麦及びトウモロコシにおけるよう
に)又はCTT(ジャガイモにおけるように)であり、そしてNはしばしば、C,
A又はTである。
典型的な植物U14配列の構造は図1,2及び15に示される。
本発明の配列は、U14配列の他に、又はU14配列の代わりに、U14配列に直接
的に隣接する翻訳されていないフランキング領域に植物ゲノムにおいて対応する
配列“F”を含んで成る。
配列Fはまた、それが1つのU14遺伝子を次のものから分離するので、ポリシ
ストロン性(集団化された)U14遺伝子の場合、遺伝子間領域としても言及され
る。植物U14遺伝子がコードされたイントロンである場合、配列Fは隣接するエ
キソンからU14配列を分離するであろう。従って、通常、個々のU14遺伝子は、
5’及び3’側上に、フランキング配列を直接的に有する。それらの5’及び3
’側の“F”配列は、お互い同一であっても又は異なっていても良い。
本発明の配列がゲノムDNAの増幅又は、全体の植物RNAのRT−PCRにより得られ
る場合、配列“F”は、U14配列の5’及び3’側のすぐ近くそれらの位置によ
り、より特定には、U14配列の範囲を定める逆方向反復体の5’及び3’側のす
ぐ近くそれらの位置により、増幅生成物間で容易に同定され得る。“F”配列は
、ポリシストロン性機構の場合、逆方向反復体から隣接するU14配列まで、及び
潜在的には、隣接するエキソンまで及び、ここでそれらは同じゲ
ノム配列のmRNA又はcDNA,U14及びmRNAに存在しないフランキング配列との比較
により、又は逆PCRにより同定され得る。
フランキング配列“F”は、ポリシストロン性U14遺伝子の場合、約20〜140
個のヌクレオチド、典型的には20〜50個のヌクレオチドの長さで変化し、そして
モノシストロン性U14遺伝子の場合、20〜500個又はそれ以上のヌクレオチドの
長さで変化する。
植物U14遺伝子がたぶんイントロンに存在する場合、遺伝子間配列Fは通常、
AUに富んでいる。フランキング領域の配列は種間でひじょうに異なるけれども、
いくつかの保存領域は同定されている。たとえば、次の配列は、これまで試験さ
れたすべての種のU14遺伝子のフランキング領域に存在する種間コンセンサス配
列であると思われる:
TTCT(T)GYYY(ここで、(T)は存在しても又は存在しなくても良く、Y=ピリ
ミジン(T又はC)である)。Yは最ともしばしばTである。
この配列は、ポリシストロン性遺伝子の場合、3’側の逆方向反復体から下流
の約5〜30個のヌクレオチドの遺伝子間領域に存在し、そしてモノシストロン性
遺伝子の場合、3’側の逆方向反復体から下流の約50〜60個の塩基の遺伝子間領
域に存在する。
種内で、特にポリシストロン性U14遺伝子に関して、たとえば70%又はそれ以
上の高い程度の相同性がフランキング配列間で示されたことが本発明者によりま
た、示されている。たとえば、トウモロコシにおいて、次の2種の配列が多くの
U14フランキング配列に存在する:
ジャガイモにおいて、特にポリシストロン性遺伝子の遺伝子間領域においては
、次の配列が存在する:
大麦においては、遺伝子間領域はしばしば、次の配列を含む:
それらの種間及び種特異的コンセンサスフランキング配列はまた、本発明の一
部を形成する。それらの保存されたフランキング配列は個々のU14の開放を可能
にするポリシストロンU14の遺伝子間領域の認識又は切断のために重要であると
思われる。
本発明の配列は、U14配列のみ、遺伝子間又はフランキング配列“F”のみ、
又はU14及びF配列の組合せから構成され得る。特に好ましい配列は、構造体〔
Fa−Ub−Fc〕n(ここで、a,b及びcはそれぞれ値1を有し、そしてnは1
〜200、好ましくは1〜10、たとえば3,4又は5である〕を有する。このタイ
プの構造体は植物ゲノムにおいて天然で存在するポリシストロン性ゲノム機構に
対応する。U配列のみが存在し、すなわちb≧1であり、そしてa及びcの両者
が0である変異体、又は1つのF配列のみが存在し、すなわち上記一般式におけ
るa又はcが0である変異体もまた好ましい。
従って、好ましい態様によれば、本発明の配列は、
i)少なくとも1つの上記で定義されたような計統発生的に保存された領域I
,II又はIII、又は配列I,II又はIIIの1つと少なくとも90%の相同性を有する
配列;及び
ii)次のP1,P2及びP3から選択された少なくとも1つの植物特異的領域
:
(ここで、Y,R及びNは上記で定義された通りであり、(X)は
存在しても又は存在しなくても良く、そして1〜150個の塩基の挿入を示し);
及び
iii)それぞれ4〜20個のヌクレオチドを有し、そしてステム構造を形成する
ためにお互いとハイブリダイズすることができる一対の逆方向反復体を含んで成
るU14配列を含んで成り、そして前記配列FはTTCT(T)GYYYを含む。この変異体
は、任意に配列(i)及び/又は配列(iii)と共に、少なくとも配列(ii)及
び/又はFを含んで成る上記配列の誘導体又はフラグメントを包含する。
本発明のU14配列の典型的な例は、次のトウモロコシU14配列:
又はこの配列と少なくとも70%の相同性、好ましくは少なくとも80%の相同性を
示す配列である。他の例は、特にジャガイモ及びシダに関して、図に示されてい
る。単子葉類及び双子葉類植物、たとえば穀類、たとえばトウモロコシ、小麦、
大麦、カラス麦、ライ麦、等のU14配列、及びソラナセア(Solanacea )(たと
えばジャガイモ)、クルシフェラエ(Cruciferae)及びククルビタセア(Cucurb itacea
)のU14配列が特に好ましい。
上記で定義されたU14及び“F”配列の他に、本発明の配列はまた、F又はU
14配列以外の配列、たとえばベクター配列、リンカー、アダプター、制限酵素部
位、等、又はU14の5’又は3’端に付加されたいづれかの構築配列(たとえば
プロモーター/ターミネーター配列)を包含する。
好ましい態様において、本発明はまた、F及びU14配列のいづれか又は両者の
フラグメント、又はF又はU14配列と少なくとも70%及び好ましくは、少なくと
も80%又は85%の相同性を示す配列のフ
ラグメントを含んで成る、上記に定義されるゲノムタイプ配列の誘導体にも関す
る。前記フラグメントは、他のタイプの核酸配列と組み合され得る。好都合には
、前記フラグメントは、6個〜5kbまでのヌクレオチド、好ましくは6〜1000個
、たとえば10〜500個、又は10〜200個、たとえば10〜40個の長さのヌクレオチド
を有する。
好ましい変異体によれば、U14誘導体は、上記で定義されたようなU14配列の
植物特異的領域、又は少なくとも6個、及び主要な植物特異的領域のフラグメン
トの場合、特に少なくとも10又は20個のこの領域の連続的なヌクレオチドを含ん
で成るフラグメントを含んで成り、又はそれらから成る。好ましくは、植物特異
的フラグメントは、6〜25個、たとえば6〜10個のヌクレオチドの長さを有する
。
たとえば、この変異体によれば、植物特異的フラグメントは次の配列の1つの
少なくとも6個の連続的なヌクレオチドを含んで成り、そして好ましくは、前記
フラグメントが6個の長さのヌクレオチドの長さを有する場合、それは複数の連
続した“N”を含まず:
(ここで、Nはいづれかのヌクレオチドを表わし、Yはピリミジンを表わし、そ
してRはプリンを表わす)、又は前記フラグメントは、前記それらの配列の1つ
と少なくとも70%及び好ましくは少なくとも80%の相同性を示す配列、又は好ま
しくは約1〜150個のヌクレオチドの長さを有する、上記で定義されたような2
つの連続した塩基間に挿入する前記それらの2つの配列の1つに対応する配列を
含んで成る。植物特異的フラグメントはまた、上記で定義されたような挿入を伴
って又は伴わないで、サブ領域P2及びP3を含んで成り又はそれらから成る。
U14配列の誘導体はまた、上記のように、植物ゲノムにおいてU14配列の5’
及び3’端で見出される逆方向反復体の1つ又は両者を含んで成るか又はそれら
から成る配列でもあり得る。特に、前記誘導体は次の配列の1つを含んで成り又
はそれから成る:
WTGCCN(ここで、W=T又はG、N=T,G,C又はAである)、及びその補
体、
TATGGC及びGCCATA、
TXYZTTGC(ここで、X=G又はC、C又はTであり、Z=A又はTである)、
及びその補体、
TTGGGGGATT及びAATCCCCCAA、
GCCZTGTT(ここで、ZはA又はTである)及びその補体。
この変異体によれば、逆方向反復体フラグメントの長さは、植物ゲノムにおい
て、天然に存在するフラグメント、たとえば4〜20個のヌクレオチドのフラグメ
ントに対応し、又はヌクレオチドの付加又は欠失により長くされ得たり又は短く
され得る。その逆方向反復体がヌクレオチドの付加により長くされる場合、その
反復体の2の半分間での塩基対合が保存されるべきである。
U14配列誘導体はまた、少なくとも6個及び好ましくは少なくとも10又は20個
の配列Fの連続したヌクレオチドを含んで成るか又はそれらから成るフランキン
グ又は遺伝子間配列“F”のフラグメント、又は植物ゲノムにおいて存在する前
記F配列と少なくとも70%及び好ましくは少なくとも80%の相同性を有する配列
のフラグメントでもあり得る。たとえば、F配列フラグメントは、次の配列の1
つの少なくとも6個及び好ましくは少なくとも8個の連続したヌクレオチドを含
んで成り又はそれらから成ることができる:
TTCT(T)GYYY、ここで(T)は存在しても又は存在しなくても良く、そしてY
はピリミジン(T又はC)である。このタイプの配列
の例は次のものである:
フランキング配列フラグメントのもう1つの例は次のものである:
最とも好ましい態様によれば、本発明の配列は、上記で定義されたようなフラ
グメントの結合体を含むか又はそれから成る核酸配列、すなわち上記で定義され
たような、F−U14配列に由来する配列(植物特異的領域、逆方向反復体、フラ
ンキング配列及び誘導体)の2つを含むか又はそれから成る核酸配列を含んで成
る。本発明の2つの態様の例は、逆方向反復体又は逆方向反復体を有する、フラ
ンキング又は遺伝子間配列のフラグメントと共に、植物特異的配列又はそのフラ
グメントを包含する。この場合、逆方向反復体は、植物U14遺伝子に天然におい
て存在する逆方向反復体に対応し、又は他方、塩基−対合されたステムを形成す
ることができるいづれかの逆方向反復体であり得る。
本発明のフラグメントの結合体を含んで成るか又はそれから成る配列はまた、
計統発生的に乾燥された領域のすべて又は一部と共に、上記で定義されたような
1又は複数の配列誘導体も含むことができる。“計統発生的に転換された領域の
一部”とは、それらの領域の少なくとも4個、及び好ましくは少なくとも6個、
たとえば少なくとも8又は10個の連続したヌクレオチドのフラグメントを意味す
る。この後者の変異体によれば、特に好ましい結合体は、逆方向反復体又はフラ
ンキング配列フラグメントと共に、BoxC及びBoxD領域を含む。もう1つの好ま
しいキメラ構造は、BoxC及びBoxD
要素及びフランキング配列、たとえば上記に示されるコンセンサス領域の一部と
一緒に、逆方向反復体を含む。もう1つの例は、逆方向反復体及び任意に、フラ
ンキング配列の一部と共に、18−SA又は18−SB領域を含むものである。本発明の
もう1つの変異体によれば、キメラ構造は、U14遺伝子又は配列の発現を駆動す
るためのプロモーター、スプライス部位を有するイントロン、及びイントロンに
固定されたU14配列又はフラグメント、又はそれらの誘導体を含んで成る。
異なった植物に起因するフラグメント、たとえばトウモロコシからの逆方向反
復体と、大麦又は他の穀類、等からの植物特異的配列とを1つの配列に連結し、
U14遺伝子及びフラグメントをハイブリダイズし、又はさらに、異なった界又は
種類の生物に起因するハイブリッド、たとえば植物/ヒト又は植物/酵母を創造
することが、本発明の態様に従って可能である。この後者の変異体によれば、前
記ハイブリッドは好ましくは、植物以外の真核生物からのUI4配列、そのフラグ
メント又は誘導体と共に、上記に定義された植物特異的領域の少なくとも一部、
又はその相補的配列、及び/又は植物U14逆方向反復体を含む。
本発明はまた、上記配列、誘導体及びフラグメントのいづれかに対して相補的
である配列にも関する。“相補的”とは、標準の技法(Sambrookなど.,1989)に
よる緊縮条件下での配列のその補体へのハイブリダイゼーションを可能にするた
めに、十分に高い、たとえば少なくとも80又は90%の程度の相補性を意味する。
たとえば、
−20mlのハイブリダイゼーション溶液(5×SSPE,0.5%のSDS,5×Denhardt'
s,20μg/mlの音波処理されたサケ精子DNA)におけるナイロン膜フィルター上
でのハイブリダイゼーション、
−65℃での1時間のプレ−ハイブリダイゼーションに続く、65℃
での12〜16時間のハイブリダイゼーション(ラベルされたプローブを含む溶液)
が存在する。前記フィルターは次の通りに洗浄される:
* 65℃で2×SSC,0.5%SDS溶液での30分間の1回の洗浄;
* 65℃で2×SSC,0.1%SDS溶液での20分間の1回の洗浄;
* 45℃で0.5×SSC,0.1%SDS溶液での10分間の1回の洗浄。
最とも好ましくは、配列は、たぶん、多くても3又は4個のミスマッチを伴っ
て、100%相補的である。
本発明のこの態様は、植物の完全なU14遺伝子及びフランキング又は遺伝子間
配列に対するアンチセンス配列、並びに上記に定義された誘導体及びフラグメン
トのすべてに対するアンチセンスを包含する。
また、ハイブリダイズするアームが上記に定義されるようなU14配列及び誘導
体に対して相補的である、ハンマーヘッド又はヘアーピンタイプのリボザイム、
及びExternal Guide Sequence技法を用いてのRNasePタイプのリボザイムが、本
発明のこの態様に包含される。ハンマーヘッド及びヘアーピンリボザイムの詳細
のためには、それぞれヨーロッパ及び国際特許出願EP−A−321201及びWO−A−
9119789を参照のこと。リボザイムは好ましくは、U14コード配列又は遺伝子間
領域を切断することができる。
本発明の配列は、RNA又はDNA、又はそれらの2種の混合物のいづれかであり得
る。
本発明の配列は、多くの適用及び用途を有する。脊椎動物及び酵母U14配列と
の相同性の領域を示すU14配列の存在の、本発明者による同定は、いづれか真核
生物起源のU14配列及びそのフラグメント及び誘導体が植物、たとえば形質転換
に使用され得ることを示す。さらに、上記に定義されるような植物U14配列及び
そのフラグメ
ント及び誘導体は、他の真核生物、たとえば酵母又は哺乳類において、特に形質
転換において使用され得る。
上記配列、誘導体及びフラグメントのいづれかが、使用され得、場合によって
は、植物U14配列を検出するためのプローブとして、又は植物U14ゲノム内の及
びそれに隣接する配列の増幅のための核酸増幅反応におけるプライマーとして、
検出可能なマーカーによりラベルされ得る。ラベルとしては、すべての従来のシ
ステム、たとえば放射性ラベリング、酵素ラベリング、フルオレセイン及びビオ
チン等が使用され得る。
U14遺伝子及びフランキング配列の一定の部分の特定の機能が使用され得、た
とえば逆方向反復体がRNaseによる消化から異種RNAを保護するための安定剤とし
て使用され得る。
本発明のアンチセンス及びリボザイム変異体は、それらがそれぞれU14遺伝子
及びフランキング配列を不活性化し、又は切断することができるので、プレ−rR
NA転写体のプロセッシング及びリボソーム形成の調節において有用である。実際
、U14の欠陥は、18S rRNA生成の欠陥及び23SrRNAの蓄積をもたらすことが、酵
母において示されている(Filipowicz及びKiss,1993により論説されている)。
従って、リボザイムによるU14遺伝子の不活性化又は切断は、それらの必須の機
能の欠陥のために細胞の死をもたらす。本発明のこの変異体によれば、アンチセ
ンス及びリボザイム構造体は、組織特異的切除を指図するために、たとえば雄−
不妊性を創造するために組織特異的プロモーターにより結合され得る。
本発明はさらに、植物細胞を安定して形質転換するために適切な、本発明の配
列のいづれかを含む形質転換ベクター、及びこのようにして得られて、形質転換
された細胞に関する。転写開始及び終結、等のためのすべての明らかに必要なシ
グナルが存在すべきである
。従来の形質転換技法が適用される。形質転換された細胞の再生により得られる
トランスジェニック植物、特に、上記で論ぜられたU14アンチセンス及びリボザ
イム配列を生成できる植物は、本発明の範囲内にある。本発明の配列により形質
転換され得る植物の例としては、単子葉植物及び双子葉植物、たとえば穀類、た
とえば小麦、トウモロコシ、大麦、米、等;ブラシカエ(Brassicane)、たとえ
ばナタネ脂肪種子、キャベツ、ブロッコリー、等;キューカンビタセアエ(Cucu rbitacea
)、たとえばメロン、キュウリ、及びまたヒマワリ、大豆、等が言及さ
れ得る。
本発明はまた、植物U14配列及び誘導体、特に上記で定義された。キメラフラ
グメント結合体を含む、植物細胞以外の真核細胞、特に哺乳類及び酵母細胞に関
する。前記細胞は、U14及び誘導体化された配列により安定して形質転換され得
る。
本発明の種々の観点が図面に示されている:
図1は、マウス、酵母及び植物U14 snoRNAの異なった領域の概略図である。
黒くぬりつぶされたボックスは、ボックスC及びDのように、保存された領域を
示す。
図2は、酵母、マウス、トウモロコシ(MU14.1a→MU14.4)及びジャガイモ(
PU14.1)の一直線に並べられたU14コード配列を示し、そして配列の保存された
及び特異的領域が例示される。コンセンサス配列I,II及びIIIが示される。保
存された領域IIは、示されるように5’及び3’方向の両者に延長され得る。推
定上の18S−A及び18−SB領域がまた、次のように示されている:PL.SP=植物
特異的、X=植物と酵母間に高く保存されているが、しかし脊椎動物においては
不在である領域。BoxCの3’側のマイナーな植物特異的領域はこれまで試験さ
れた他のすべてのクラスの生物において不在であり、そして植物種間で約60%の
相同性を示す。主要な植物特
異的領域は、種間で少なくとも70%の相同性及び種内で約90〜95%の相同性を伴
って保存される。計統発生的に保存された領域II及びIIIは、生物クラス間で少
なくとも70%の相同性(しばしば、領域IIIの場合、少なくとも90%の相同性)
を有する。大文字は、すべての位置における塩基の存在を示し;小文字は、すべ
てにおいてではあるが、しかし1つの位置においての塩基の存在を示す。
図3は植物からのU14 snRNA遺伝子をクローニングするための手段を示す。第
1段階においては、動物及び酵母U14における保存された配列に対して特異的な
プライマー1及び2が植物RNAとのRT−PCR反応に使用された。生成された生成物
の配列(約90bp)が、段階2において合計の植物DNAを用いて、密接して連結さ
れた遺伝子間での増幅のためのプライマーを構築するために使用された。
図4は、植物(PL)、酵母(YST)及び脊椎動物(VERT)のU14snoRNAコンセン
サス配列を示す。
図5は、一直線に並べられた植物(MU=トウモロコシ、PU=ジャガイモ)、酵
母及び脊椎動物のU14 snoRNA配列、並びにコンセンサス配列を示す。
図6は、単離されたゲノムクローンのフラグメントの配列決定により得られる
ような、フランキング遺伝子間配列及び逆方向反復体を包含するポリシストロン
性トウモロコシU14.1配列を示す。この転写体は、4つの完全なU14配列、MU14
.1a,MU14.1b,MU14.1c及びMU14.1dを含む。逆方向反復体及びBoxC及びD
要素は印を付けられている。
図7は、単離されたゲノムクローンのフラグメントの配列決定により得られる
ような、フランキング遺伝子間配列を包含する、トウモロコシの単一のU14配列
U14.4を示す。逆方向反復体及びBoxC及びD要素は印を付けられている。
図8は、単離されたゲノムクローンのフラグメントの配列決定により得られる
ような、フランキング遺伝子間配列を包含する、ジャガイモの単一のU14配列PU
14.1を示す。逆方向反復体及びBoxC及びD要素は印を付けられている。
図9は、アラビドプシス タリアナ(Arabidopsis thaliana)からのU14遺伝
子の3’端の約80個のヌクレオチドを示す。BoxD要素は印を付けられている。
図10は、トウモロコシ(Zm)及びジャガイモ(St)からのU14 IgPCR生成物の
一直線に並べられた配列を示す。それぞれ、上流の遺伝子の3’端での及び下流
の遺伝子の5’端での保存されたBoxC及びDが示されている。トウモロコシプ
ライマーIII及びIV(及びその対応するジャガイモプライマーV及びVI)の位置
が矢印により示される。一部の酵母及びマウスU14コード配列が示される。
図11は、トウモロコシU14.4の配列と共に、シダ(A.ニダンス(A .nidans)
)U14配列を示す。そのシダの配列は、全体のシダRNAに基づくプライマーI及
びIIを用いて、RT−PCRにより得られた。
図12及び13は、大麦DNAに基づくトウモロコシプライマーIII及びIVを用いて、
遺伝子間PCRにより得られた大麦U14遺伝子間配列を示す。BoxC及びD並びに推
定上の逆方向反復体は下線が引かれている。
図14は、コード領域(黒くぬりつぶされたBox)の位置を示すジャガイモ及び
トウモロコシU14ゲノムクローンの領域、及び2種のトウモロコシゲノムクロー
ン(斜線のBox)の5’フランキング領域間での配列相同性の3つのブロックの位
置を示す。
図15は、マウス及び酵母U14コード領域と共に、一直線に並べられた植物U14
ゲノム配列を示す。遺伝子の5’及び3’端での逆方
向反復体が示され、BoxC及びDが太字で示され、一本鎖の遺伝子MU14.4及びFU1
4.1の100bpの5’及び3’フランキング配列、及びMU14.1のU14遺伝子集団を
端に有する配列、並びに遺伝子1a,1b及び1cの下流の配列が示され、そしてMU14
.1遺伝子集団における隣接する下流のU14コード領域が括弧で示されている。mU
14.1bの下流の遺伝子フラグメントは薄く書かれている。18S rRNA(18S−A及
びI8S−B)に対して相補的な領域は星印により示され、そして保存された領域
2(文献22)は下線が引かれ、そしてこの相同領域の可能な延長部は点線により
示される。3つの植物特異的配列(P1−P3)が括弧により示され、そしてPU
I4.1における推定上の延長された逆方向反復体は太線により下線を引かれている
。
実施例
方法の詳細:
ジャガイモ“Cara”及びトウモロコシ“Kelvedon Glory”の全体のRNA調製物
を、標準方法により調製した。逆転写酵素−ポリメラーゼ鎖反応(RT−PCR)のた
めに、RNA調製物を、RQI RNase−フリーDNaseにより広範にDNase処理し、その後
、第1の鎖cDNAを、マクス(位置65〜82)及び酵母U14(位置107〜124)の3’端
での保存された領域に対して相補的なプライマーII、すなわち5’−TCAGACATCC
AAGGAAGG−3’により合成した。PCR反応を、マウス(位置24〜41)及び酵母U1
4(位置31〜46)に対して相同の第2のオリゴヌクレオチドプライマーI、すな
わち5’−CCATTCGNNGTTTCCAC−3’の付加に続いて行なった。RT−PCR反応を標
準の方法により実施した(Simpsonなど.,1992)。増幅された生成物を、アガロー
スゲル電気泳動に続いて単離し、pGEM 3zf(+)(Promega)中にサブクローン化
し、そして配列決定した。
プライマーIII 5’−CCCGGGAGCTCAGGCTTGAGAGCTAGTGC−3’、及び
プライマーIV 5’−GAATTCTGCAGCANGGCGAAAGCTCTTAG−3’(又はIII及びIV
に対応するが、しかし最初の10個の5’側ヌクレオチドを欠いているプライマー
)を、トウモロコシRT−PCR増幅された配列に基づいて構築し、そしてPCR及びRT
−PCT反応の両者において隣接する、密接して連結されるU14遺伝子間での遺伝
子間配列を増幅するために使用した(図3)。
ジャガイモに関しては、プライマーV 5’−CCCGGGAGCTCAGGCTTGAGAGCATATG
C−3’、及びVI 5’−GAATTCTGCAGCGAAGGCGAAAGCACTTAG−3’をまた、隣接
する、密接して連結されるU14遺伝子間での遺伝子間配列と増幅するために構築
し、そしてこれを、ジャガイモDNA及びRNAとのPCR及びRT−PCR反応に用いた。
シダに関しては、プライマーII及び植物U14配列に対して企画されたプライマ
ー、すなわちプライマーVII 5’−CGGAAGCTTNNAAGGCTTGTTTCTC−3’を、シダ
RNAに基づいてRT−PCRに使用した。
材料:
制限酵素及びT4 DNAリガーゼも、Boehringer(Mannheim),Pharmacia and Prom
agaから購入した。T7 RNAポリメラーゼ及びRNaseインヒビターはPharmaciaから
であった。放射性ヌクレオチド、T4ポリヌクレオチドキナーゼ及びHybond N+
フィルターを、Amershamから得た。RNase A,RNase T1及びtaq DNAポリメラー
ゼをBoehringer−Mannheimから購入した。MMLV逆転写酵素及びRNaseフリーのDNa
se RQIを、Gibco−BRIから及びSequenaseをUnited States Biochemicalsから得
た。
RNA及びDNA延長:
RNAを、ジャガイモ(ソラナム・ツベロサム L.(Solanum tu
berosum L.
))栽培品種Cara及びDesireeの葉、茎及び塊茎組織から、及びトウ
モロコシ(ゼア マイス L.(Zea mays L.))品種Kelvedon Gloryの葉、胚珠
及びトウモロコシの毛から単離した。DNAをCara及びKelvedon Gloryの葉組織か
ら抽出した。ノザン分析のために、全RNAを、トウモロコシ、小麦、大麦、アス
パラガス、ジャガイモ、豆、キュウリ及び鳥の巣のシダ(アスプレニウム ニダ ンス
(Asplenium nidans))の葉組織から単離した。すべての技法は標準技法で
あった(Sambrookなど.,1989)。
プライマー延長:
プライマー延長によるU14転写体の5’端のマッピングを、下記〔32P〕−端
ラベルされたオリゴヌクレオチドプライマーを用いて、DNase−処理された全RNA
調製物に対して実施した:
前記2種のトウモロコシプライマーは、クローン化されたトウモロコシU14遺
伝子に見出される配列の変動を示すために単一のヌクレオチドにおいて異なった
。
プライマーをポリヌクレオチドキナーゼにより末端ラベル化し、そしてゲル精
製した。プライマー延長を標準方法により実施し(Sambrookなど.,1989)、そし
て生成物をDNA配列決定ゲル上で分離した。
RNase A/T1護分析:
トウモロコシ及びジャガイモU14遺伝子に対して相補的な〔32P〕−ラベルさ
れたRNA転写物の調製物を、前記のようにして線状化されたプラスミドから調製
した(Waughなど.,1991)。RNase A/T1保護分析を、Goodall及びFilipowicz,
1989により記載される
ようにして5μgの全RNAに対して行ない、そして生成物をDNA配列決定ゲル上で
分離した。
植物組織におけるU14 snRNAの仁局在化:
ジゴキシゲニン−UTPを組込むトウモロコシ及びジャガイモU14コード/フラ
ンキング配列に対応するアンチセンスU14プローブを、トウモロコシU14.1a及
びジャガイモU14.1ゲノム配列を含む線状化されたプラスミドのインビトロ転写
により生成し、そしてHighettなど.,1993により記載のようにしてエンドウの根
細胞に基づく現場プローブとして使用した。これは核質又は細胞質の残りのほと
んど又はまったくのラベリングを伴わないで仁への明白な局在化を示し、従って
、この配列が仁snRNAであることを確証した。対照の現場ハイブリダイゼーショ
ンが、植物U1 snRNA及びU3 snoRNA配列に対して相補的なオリゴヌクレオ
チドを用いて実施され、そしてそれぞれ核質及び仁に対して特異的ラベリングを
示した。
結果:
トウモロコシ、ジャガイモ、大麦及びシダからのU14配列のPCRによる単離:
発現された植物U14配列を、マウス及び酵母U14の高く保存された領域に対し
て相補的なプライマー(上記プライマーI及びII)を用いて、トウモロコシ及び
ジャガイモの全RNA調製物からのRT−PCRにより増幅した。約80bpの予測されるサ
イズの増幅された生成物をサブクローン化し、そして配列決定した。4種のトウ
モロコシ配列及び2種のジャガイモ配列は、マウス及び酵母配列に対する相同性
を示し、これは推定上の植物U14配列が生成されたことを示した。この増幅をま
た、シダ(A.ニダンス(A .nidans))からの生RNA調製物に対して、プライマー
II及びVIIを用いて実施した(図11)。
U14コード配列からのU14配列を5’及び3’方向にさらに増幅するために、
2種の追加のプライマー(トウモロコシのためにはプライマーIII及びIV、及び
ジャガイモのためにはプライマーV及びVI)を、上記植物RT−PCR配列を用いて
構築した。ジャガイモ及びトウモロコシの両者のDNAによるPCR反応が、隣接する
、密接して連結される遺伝子間での配列の増幅を示す、わずか50〜350bp(特に1
50〜350)の増幅されたDNA生成物を生成した。PCR生成物をサブクローン化し、そ
して4種のトウモロコシ及び4種のジャガイモクローンの配列を得た(図10)。
個々のクローンは、下流遺伝子の3’端の約45〜50bp(プライマーIII又はV配
列を含む)及び下流U14遺伝子の5’端の約70bp(プライマーIV又はVI配列を含
む)を含んだ。PCR反応は、初期のプライマー対の存在及びマウス及び酵母U14
に対する類似性を確認するそれらのプライマーを含む領域を通して増幅した。
4種のトウモロコシ配列の遺伝子間領域は、53bp〜140bpとサイズにおいて変
化し(距離は上流の遺伝子のboxDと下流の遺伝子のboxCとの間で測定された)
、そしてジャガイモクローンの遺伝子間領域は124〜156bpの範囲であった(図10
)。いくらかの相同性が同じ種からの遺伝子間配列の間で明らかであった。たと
えば、ZmTgPCR3及び4は、後者において16bpの挿入により異なった。さらに、
すべての4種のジャガイモクローンは、隣接する下流の遺伝子において、boxD
配列の41〜44bp下流及びboxCの約75〜100bp上流に配列GTTCTTG(C/T)TTGATGATGA
ATA(興味あることには、boxC配列を含む)を含んだが、しかしながら、この配列
はジャガイモゲノムクローンにはまったく存在しなかった。
トウモロコシからのプライマーIII及びIVをまた、大麦DNAに基づく遺伝子間PC
R反応に使用した。60〜200bpの生成物を生成した(
図12及び13)。
トウモロコシ及びジャガイモU14ゲノムクローンの単離:
RT−PCRにより生成されるトウモロコシU14及びジャガイモU14プローブによ
るトウモロコシ及びジャガイモゲノムライブラリーのスクリーニングは多くの陽
性クローンを同定した。2種のトウモロコシ及び1種のジャガイモゲノムクロー
ンを精製し、そしてハイブリダイズするフラグメントをpUC19中にサブクローン
化した。トウモロコシU14.1は、ひじょうに強いハイブリダイズするシグナルを
付与し、そして配列決定された1.1,1.0,0.7及び0.065kbの4種の連続的なPst I
フラグメントに基づいてサブクローン化された。4種の完全なU14コード配列
及び5番目のコード配列のフラグメントを760bp領域に同定した。前記4種の明
らかに損なわれていない遺伝子をMzU14.1a−dと称した。遺伝子特異的クロー
ンを単離するために、サブフラグメントをpGEM3zf+中にサブクローン化した。
i)遺伝子(a)を432bpのRsa Iフラグメント(pgMU14.1a)としてクローン
化し、そして276bpの上流のフランキング配列を含み;
ii)遺伝子(b)を266bpのRsa Iフラグメント(pgMU14.1b)として単離し、
そしてU14.1bコード配列及び35bpの上流の及び101bpの下流のフラグメント配
列を含み;
iii)遺伝子(d)の全体、遺伝子(c)の3’側の2/3のほとんど及び327
bpの下流のフランキング配列を、581bpのTaq I/BglIIフラグメント(pgMU14.1d
)に基づいて単離した。
2番目のトウモロコシゲノムクローンMzU14.4を、2.2kbのEcoR Iフラグメン
トとしてサブクローン化した。このクローンは、750bpのPst I/EcoRIフラグメ
ント及び254bpのNsi I/BfrIフラグ
メントとしてサブクローン化された単一のU14コード配列を含んだ。同様に、ジ
ャガイモゲノムクローンStU14.1は、873bpのEcoR I/PstIフラグメント及び438
bpのEcoR I/HindIIIフラグメントとしてサブクローン化された単一のU14コー
ド配列を含んだ。すべてのゲノムU14遺伝子のコード配列及び広範なフランキン
グ配列を標準の方法により生成した。
推定上の植物U14ゲノム配列は、脊椎動物及び酵母U14との相同
性の領域を示す:
遺伝子間PCR(IgPCR)により生成されたトウモロコシU14及びジャガイモU14
プローブによるトウモロコシ及びジャガイモゲノムライブラリーのスクリーニン
グは、多くの陽性クローンを同定した。2種のトウモロコシ及び1種のジャガイ
モゲノムクローンを精製し、そしてU14含有フラグメントをサブクローン化し、
そして配列決定した(図15)。トウモロコシU14.1はひじょうに強いハイブリダ
イズシグナルを付与し、そして4種の明らかに損なわれていないU14コード配列
(MU14.1a−d)及び5番目のU14配列のフラグメントを含み、それらすべては
761bp領域内に含まれた(図14及び15)。MU14.4及びStU14.1はそれぞれ、単一
のU14コード配列を含んだ。
トウモロコシU14.1の4種の明らかに完全な長さのU14コード領域の配列、及
びトウモロコシU14.4及びジャガイモU14.1の単一の遺伝子を、酵母及びマウス
U14配列と共に一直線に並べた(図2及び15)。その推定上のコード領域は、Bo
xC及びBoxD配列に隣接する逆方向反復体により定義されている。すべての6種
の植物配列は、お互いに対して同一性の広範な領域と高い相同性を示す。酵母及
びマウスU14と比較される場合、配列の相同性は、53〜63%及び68〜76%の範囲
であった(それぞれ、酵母及びマウスU14配列の%
として表わされる)。配列の変動は植物、酵母及び動物U14配列間で存在したが
、次の高い相同性の領域が存在する:BoxDを含み、そして3’逆方向反復体の
直接的な上流に存在する、BoxC配列及びI9nt領域。それらの2つの領域を、酵
母及びマウスU14と比較して領域1及び3と称し(Li及びFournier,1992)、そ
して後者は植物において高く保存される18S rRNAに対して相補的な配列(18S−
B)を含む。さらに、広範な類似性の領域が、その分子の5’側半分に同定され
、そして18S rRNAに対する相同性を有する配列18S−Aを再び有する、Li及びFo
urnier,1992の領域2を含む。しかしながら、植物U14配列の情報は、すべての
配列のために3’の方向に領域2を拡張するマウスU14中央領域の再整合を可能
にする。領域2はまた、植物及び配列と比較すれば、5’方向に拡張される。こ
の新規の整合は、マウス及び植物の両者のU14において、機能的に必須の酵母特
異的配列1(Li及びFournier,1992)相対物を付与し、そして必須の酵母特異的
領域2はマウスにおいてはまだ不在であるが、しかし3種の植物特異的配列の1
つとオーバーラップする。さらに、植物配列は、植物U14においてのみ見出され
る、5’側の拡張された領域2配列とBoxCとの間に追加の7又は8個のヌクレ
オチドを含む。マウスU14において不在である、より長い中央の酵母特異的領域
は、植物U14において相対物を有するが、しかしその植物配列は短かく、そして
酵母配列に対してほとんど相同性を示さない。植物遺伝子における逆方向反復体
の配列及び長さは変化し、そして5’IRとBoxC配列との間に2−3ntが存在し
、そして3’IRは通常、BoxD配列に直接的に隣接する。植物U14の予測される
サイズは、マウスと酵母との大きさの中間であり、そしてトウモロコシ及びジャ
ガイモU14は約117〜120ntの長さである。
ゲノムクローンMU14.1,MU14.4及びStU14.1のうち、2872bp,12
80bp及び873bpをそれぞれ配列決定した。特に、MU14.1c及び1d遺伝子の連結部
を通しての配列は、IgPCRにより生成される配列(Zm U14 IgPCR1−図10)の1
つと同一であり、そしてZm UI4 IgPCR2の配列はMU14.1及び1b又は1b及び遺伝子
1cの下流の遺伝子フラグメントのいづれか間の連結部に対応した。これらの後者
の配列は、それらが遺伝子集団において大きな直接的な反復体内に含まれるので
、お互いに対して高い相同性を有する。U14フランキング領域を、潜在的なタン
パク質をコードするエキソン配列を同定する試みにおいて、読み取り枠(ORF)及
びAU/GC含有量について分析した。核酸相同性の3つの領域が2つのトウモロコ
シゲノムクローンの5’フランキング領域に観察されたけれども(図14)、それ
らの領域は類似するORFをコードしておらず、そして従って、エキソン配列に対
応するとは思われなかった。ORF(>50のアミノ酸)及びフランキングDNA配列によ
るデータベース調査は、既知の遺伝子との有意な相同性を同定するのに失敗した
。さらに、典型的な植物遺伝子プロモーター要素は、U14遺伝子のフランキング
又はコード領域において同定されなかった。トウモロコシU14コード領域に関す
る調査は、アラビドプシス(Arabidopsis)発現の配列標識の80bp領域に対して90
%以上の相同性を同定した。
U14転写体の5’端のノザン分析及びプライマー延長地図:
配列整合から、植物U14 snoRNAは、酵母及びマウスU14間の中間のサイズで
あると予測された。トウモロコシ、ジャガイモ及び多くの他の植物U14のサイズ
が、トウモロコシU14.1b遺伝子を含むpgMU14.1bの316bpのEcoRI/HindIII
フラグメントによりハイブリダイズされる全RNAのノザン分析から見積られた。
植物種のすべては、配列データと一致する約120ntのハイブリダイズRNAバンドを
示したが、但し、約240〜320ntの相当に大きなU14ハイブリダイ
ズバンドを示すアスプレニウム ニダシス(Asplenium nidans)シダを除く。プ
ロセッシングされていない又は一部プロセッシングされたU14前駆体RNAを示す
大きなハイブリダイズ種のノザン分析から証拠は存在しなかった。
トウモロコシ及びジャガイモ配列に対して相補的なプライマーによる全トウモ
ロコシ胚珠RNAのプライマー延長分析は多くの主要生成物を生ぜしめた。2種の
トウモロコシプライマー(単一のヌクレオチドにより異なる)が、U14.1b,c
及びd(プライマーMz Pex1)とU14.1a及びU14.4(プライマーMz Pex2)と
の間で単一のヌクレオチド差異を考慮するために使用された。Mz Pex1プライマ
ーは、56ntの生成物が最とも強い54〜59ntのサイズ範囲で多くのプライマー延長
生成物を生成した。すべての生成物は5’逆方向反復体内に位置した。Mz Pex2
プライマーは、56ntのバンドが再び最とも強い狭い範囲の生成物(54〜57nt)を
付与し、そしてすべては5’IRに位置した。プライマーPot Rex1を用いてのジ
ャガイモの葉からの全RNAによるプライマー延長は、5’IRに再び位置する56〜6
0ntの範囲の生成物を付与した。上記の主要なプライマー延長生成物の他に、約8
0〜350ntのサイズ範囲の他の生成物が観察され、そしてそれは少なくともいくら
かのU14転写体への5’延長の表示である。対照的に、全トウモロコシ胚珠RNA
及びトウモロコシU5 snRNAに対して相補的なプライマーとの対照のプライマ
ー延長反応は、予測されるサイズの単一のプライマー延長生成物を付与した。主
要生成物の強度に対する比較によれば、延長された生成物は全RNA調製物におけ
る発生量においては低かった。それらは、同じRNA調製物が、PCR対照がDNA由来
の生成物を付与しないRT−PCR反応分析に使用されるので、残留DNAに由来しなか
った(下記参照のこと)。
RT −PCRによるポリシストロン性U14転写体の検出:
MzUI4.1の遺伝子間PCR及び遺伝子配置は、いくらかのU14遺伝子が、それら
のU14遺伝がポリシストロン性転写体として一緒に転写されそして個々のU14
snoRNAにプロセッシングされる可能性を高めるジャガイモ及びトウモロコシの両
者において集団化されることを示した。初期cDNA生成のためのプライマーIII及
びPCR反応におけるプライマーIII及びIVを用いてのトウモロコシRNAに基づくRT
−PCRは、135,152,180,261,266及び272ntの多くのラベルされた生成物を生
成した。プライマーV及びVIを用いての3種の異なったジャガイモ器官からのジ
ャガイモRNA調製物との類似する反応は、82,118,258,277,278及び約360ntの
生成物を付与した。逆転写酵素を伴わないでの対照反応は、RNA調製物において
残留DNAを示さない生成物を付与せず、そしてこれは、レーン1〜4におけるRT
−PCR生成物がRNAに由来したことを確証する。それらのIg RT−PCR反応からの
いくらかの生成物のクローニング及び配列決定は、遺伝子間配列により分割され
る隣接する遺伝子の3’及び5’フラグメントの存在を確証した。プライマーの
位置から、RT−PCR生成物は、トウモロコシに関して15〜150ntの範囲で及びジャ
ガイモに関して140〜240ntの範囲で遺伝子間領域を残して2つの隣接する遺伝子
からの約120ntのコード領域を含むであろう。小さなRT−PCR生成物の正体は未知
であるが、しかしポリシストロン性U14転写体の一部として転写される再配置さ
れたU14遺伝子フラグメントから生じ得る。いくらかのIg RT−PCR生成物のク
ローニング及び配列決定は、IgPCRによりすでに得られたように、遺伝子間配列
により分離される隣接する遺伝子の3’及び5’フラグメントの存在を確証した
(図10)。4つの配列決定されたクローンはSt IgPCR4の配列と実質的に同一で
あり(図10)、2つはSt IgPCR2に同一で
あり、そして1つはZm IgPCR1に同一であった(図10)。2種の追加のトウモロ
コシ由来のクローンは、IgPCRクローンにおいても又はMU14.2遺伝子集団におい
ても相当物を有さなかった、わずか17及び18bpにより分離される隣接する遺伝子
の3’及び5’フラグメントを含んだ。従って、RT−PCRは隣接するU14遺伝子
を含む多くの転写体を検出し、これはゲノムMU14.1クローンに見出されるような
U14遺伝子集団が単一のポリシストロン性転写体として転写される傾向があるこ
とを示唆し、そして個々のU14がプロセッシングにより放されることを推定せし
める。
RNase A/T1保護マッピング:
MU14.1a,MU14.1b,MU14.1d,MU14.4及びMU14.1に対して特異的なアンチセ
ンスRNAプローブを用いてのRNase A/T1保護マッピングは、全RNAにおけるそ
れらの遺伝子(又はRNase A/T1技法の制限内でそれらに対して実質的に同一
である遺伝子)からの成熟U14転写体の存在を示す118〜126ntの十分な長さの生
成物を検出した。ポリシストロン性U14転写体の検出と一緒に取られるMU14.1遺
伝子集団におけるそれらの遺伝子からの十分な長さの生成物の生成は、個々のU
14がそれらの大きなRNA前駆体からプロセッシングされることを示唆する。
配列分析に矛盾しないジャガイモU14生成物は、トウモロコシのそれらの生成
物よりもわずかに大きかった。その生成物のサイズの範囲は、プライマー延長に
よりすでに観察されたように、U14及び/又は異なった5’末端において配列の
変動を示す。最とも低い強度の大きな生成物がRNase A/T1ゲルにおいて高く
観察され、そして前駆体U14転写体を表わすが、しかしそれらの同一性はさらに
調査されなかった。StU14.1プローブによるマッピングは、このジャガイモU14
遺伝子を端に有する10bpのGCに富む逆方向反復体を含
む末端ステムの形成のために、特に安定した前駆体を示す134〜135ntの保護され
たフラグメントを示した。すべてのプローブは、他のU14遺伝子変異体からの転
写体に対してのプローブのハイブリダイゼーションから生じる小さな保護された
フラグメントを示した。添加された植物RNAを伴わないでの対照反応は、保護さ
れたフラグメントを示さなかった。一緒に取られる場合、プライマー延長により
マッピングされた5’端の位置及びRNase A/T1の十分な長さの生成物の長さ
は、U14転写体の3’端が3’逆方向反復体に位置し、又はそれに直接的に隣接
して存在することを示す。
要約すれば、植物U14遺伝子のいくらかの密接した連鎖が、IgPCR及びトウモ
ロコシU14遺伝子の集団の構成により示された。多くの場合、遺伝子間距離は、
既知の植物プロモーター要素を適合するには短か過ぎた。たとえば、植物snRNA
プロモーターは、転写の開始から80個の塩基対内に通常存在する、2種の要素、
すなわちUpstream Seguence Element(USE)及びTATA-boxを必要とする。図6,
10,12及び13に示されるように、本発明の遺伝子間配列はしばしば、80個よりも
少ない塩基の長さを有する。それらのシグナル及び他の植物遺伝子プロモーター
要素の不在は、U14遺伝子が新規のプロモーター配列から又は大きな前駆体RNA
分子の一部として転写されたことを示した。少なくとも2種のU14コード配列を
含む転写体のRT−PCRによる検出及びMU14.1集団の一部の配列によるRNA由来のRT
−PCR生成物の同定は、U14遺伝子の集団が、個々のU14がプロセッシングされ
るポリシストロン性転写体として転写されることをさらに示唆する。フランキン
グ配列に基づけば、それらの植物U14遺伝子配列がイントロン−コードされるこ
とを確認することは、現在不可能である。動物システムにおいては、単一のsnoR
NA遺伝子のみがいづれか1つのイントロンに含まれた。トウモロコシU14集
団においては、明白な3’及び5’スプライス部位は、遺伝子間領域に観察され
ず、これは、それらの遺伝子がイントロン−コードされる場合、それらが同じイ
ントロン内にすべて含まれることを示唆する。従って、遺伝子集団が単一の上流
のプロモーターから、すなわち短い遺伝子間又はコード配列内に含まれる新規の
プロモーター要素から、特殊化されたU14転写体として、又はプレ−mRNA転写体
の一部として転写されることは可能である。
プレ−rRNAプロセッシング又はリボソームアセンブリーに包含されるタンパク
質をコードする遺伝子のイントロンにおけるsnoRNAの位置は、それらの発現が宿
主遺伝子の活性的な又は連続的な発現を利用することによって達成され、そして
調節されることを示唆する(文献3,24)。さらに、イントロン−コードされた
snoRNAの相対的発生量が遺伝子のコピー数において影響され、その結果、脊椎動
物のU14及びアフリカツメガエルのU17及びU18配列に関して観察されるような
複数のコピー(但し、イントロン当たりわずか1つのコピー)が、高レベルのsn
oRNA転写体の達成の意味を示すことが仮定される(文献24)。植物における新規
のポリシストロン性U14遺伝子配置はまた、前駆体がイントロン性であるか又は
新規のプロモーターから転写されるかどうかにかかわらず、高レベルのU14転写
体を確証することができる。U16及びU18 snoRNA−含有イントロン転写体のス
プライシング及びプロセッシングの分析は、エンドヌクレアーゼ分解が、エンド
−又はエキソヌクレアーゼ分解活性のいづれかにより続いて急速に除去される末
端延長部を有するsnoRNAを生成する2つの段階のプロセッシング経路を示した(
文献9,18,25−27)。しかしながら、ヒトU17及びU19 snoRNAのプロセッシ
ングの最近のインビボ及びインビトロ分析は、プロセッシングがイントロンのス
プライシングを必要として、そして枝切りされたイン
トロン捕獲物(lariat)からのフランキング領域のエキソヌクレアーゼ分解性消
化により進行することを示した。いくらかの植物U14遺伝子の強い集団化は、植
物において、初期のエンドヌクレアーゼ分解が個々のU14の生成に関与されるこ
とを示す。プライマー延長及びRNase A/T1マッピングにおける可能性あるU1
4前駆体転写体の低い発生量はインビボでの植物U14前駆体の急速なプロセッシ
ングを示すであろう。プロセッシングされた成熟の脊椎動物のsnoRNA及びプロセ
ッシング反応の一定の中間体の安定性は、それらの分子が成熟したsnoRNAを生成
するために必要とされるエキソヌクレアーゼ分解活性から保護されることを示唆
する(文献28,8,10)。これはたとえばU14−U16 snoRNAの5’及び3’末
端間での安定したステムの形成及びタンパク質、たとえばフィブリラリンの結合
のためであるが(文献9,21,28,8,18)、いくらかのプロセッシングされた
snoRNA(U17及びU18)は、逆方向反復体又はboxC又はD配列を含まず、そし
て従って、保護が他のタンパク質因子の結合に関与できる(文献27)。
Detailed Description of the Invention
Plant U14 nucleic acid sequence and its derivatives
The present invention relates to the U14 sequence and fragments and derivatives thereof, as well as the
For use in nuclear cells.
Two major classes of eukaryotic small nuclear RNAs are the premessenger RNA splices.
Splicing ome snRNA and preribosomal RNA (pre-rRN)
A) Small nuclealor involved in transcript processing and ribosome formation
) RNA (snoRNA). At least 12 snoRNAs have been identified in yeast
(Reviewed by Fournier & Maxwell, 1993), and their localization
Because of the tendency to base pairing with rRNA transcripts and their association with ren proteins
And can be involved in pre-rRNA processing or ribosome formation.
The best characterized animal snoRNAs are U3, U8, U13 and U14. Those sn
The nature of oRNA and its role in pre-rRNA processing of U3 in particular have recently been
Commentary (Filipowicz & Kiss, 1993).
U14 snoRNA is a pre-rRNA transcript for the normal growth phenotype and in yeast.
It is needed for body processing (Jarmolowski et al., 1990). U14 is protected
Contains the existing Box C and D sequences, where Box C is a nucleoprotein, or fibrin.
Is required for the binding of larin (Baserga et al., 1991), and many nucleolar snoRNAs
And two conserved sequence elements are complementary to 18S rRNA (Trin
h-Rolik and Maxwell, 1986; Li and Fournier, 1992). The genome composition of animal U14
, Mouse, rat, Xenopus and
In humans, three copies of U14 were constitutively expressed and cognatehsc70Hot show
In the introns 5, 6 and 8 of the
Yes (Liu & Maxwell, 1990).hsc70Arrangement of the U14 sequence in the coding strand of the intron
Orientation, lack of typical Usn RNA promoter sequences, and cap structure at the 5'end
Deficiency is due to their U14 sequencehsc70Transcribed as part of pre-mRNA, and
It is suggested that they are processed from intron sequences containing them.
Recently, many other snoRNAs were mostly encoded within the intron of the nucleoprotein.
It is shown that U15, a single copy gene,
Found in the first intron of the S3 ribosomal protein gene (Tycowski et al.
, 1993), and U16 and U18 are L1 ribosomes of Xenopus species and humans.
Found in the intron of the mu protein gene (Fragapane et al., 1993; Prislei
Et al., 1993). The two U17 genes are from the human cell cycle regulatory protein gene, RCCI.
Present in introns 1 and 2. Ribosome or nucleoprotein gene intro
Other snoRNAs that appear to be or are likely encoded by
, Ie U19-U21, Y, E2 and E3, have recently been reviewed (Filipo
wicz & Kiss, supra).
Evolutionary conservation and intron-coding of the U14 genomic machinery among different animal species
The current widespread occurrence of snoRNA genes has been attributed to this type of gene arrangement.
It has been shown that it can function to ensure the regulation of expression of genomic components.
In yeast, U14 snoRNA is not intron-encoded, but
Probably from a precursor containing both U14 and the second kernel snKNA, ie snR190.
Apparently smashed (Zagorski et al.,
1988; Balakin et al., 1994).
The ends of yeast and mammalian U14 and many other intron-encoded snoRNAs
Common features of Xenopus and mice in Xenopus nucleihsc70Intron 5
The successful processing of U14 from transcripts of
Suggests preservation. Although this mechanism has been elucidated, it was found in human in vitro extracts.
For U15 and U17 processing, the 5'and 3'end processing are independent of each other.
Standing and detected separate products are border sequence exonucleases
Early endonucleases for degradative digestion, especially with maturation at the 3'end
Suggested that it is a decomposition stage indication (Kiss & Filipowicz, 1993; Tyckowski et al.
Etc., 1993).
Differences in U14 genomic organization between yeast and meta zoan, and Shojo
Insects of the fruit fly and Saccharomyces pombe RCCI analogs
Deficiency of U17 in Tron is due to such genetic arrangements in higher eukaryotes and spinal motion.
Provided the question of whether or not to be found only in things.
To date, the only information available based on the plant snoRNA gene is U
3 (Kiss & Solymosy, 1990; Marshallsay et al., 1990, 1992; Kiss et al., 1991)
And MRP / 7-2 snRNA (Kiss et al., 1992). Data on plant U14 gene
Data is not available. The technical problem underlying the present invention is that the U14 gene is present in plants.
Whether or not and, if so, to elucidate their structure and function
Met.
The inventors have successfully characterized the plant U14 using the PCR approach. They are
, Maize and potato genomic clones were isolated and their genomic
The mechanics were analyzed. Two genomic clones, a claw from maize
From potatoes and potatoes
Lone contains a single U14 gene, and a second maize genomic clone
Contained a population of four closely linked U14 sequences. Plant U14 gene class
Tarification is confirmed by intergenic PCR using corn, barley and potato DNA
And maize and potato RNA-based intergenic RT-PCR
Expression of the strontious U14 transcript was shown. Eukaryotic RNA polymerase II or III promoter
, The intermediate elements flanking sequences are rich in AU,
In other words, the characteristics of the plant intron suggesting that the plant U14 may be encoded by the intron.
(Goodall & Filipowicz, 1989). Sequences in the database
Lack of homology with the flanking sequences did not allow identification of host genes
. Furthermore, this novel genomic mechanism, namely the absence of known promoter elements and
Detection of polycistronic transcripts by RT-PCR involves the simultaneous transcription of genes and
Shows the processing to open U14.
The present invention has the following formula:
[Fa-Ub-Fc]n
[Wherein a + b + c ≧ 1 and n ≧ 1; and U is not translated
Represents a sequence existing in the plant genome as a sequence, that is, "U14", wherein
The untranslated sequences are:
i) at least one of the following genetically conserved sequences, where N is a nucleo
Represents one of tides A, C, G or T):
Or a sequence having at least 90% homology with one of sequences I, II or III, and
And
ii) at least one plant-specific region, and
iii) comprising a pair of inverted repeats, and F in the plant genome
An untranslated "flanking" sequence immediately adjacent to said "U14" sequence
For a nucleic acid sequence or molecule comprising or consisting of above
In the conserved sequence I, the representation of A and T at the 6th position is A or T
It means any one of them.
In the present invention, "a region conservatively stored conservatively" means at least 6 regions.
In the U14 sequence of eukaryotes, such as yeast, having a length of cleotide,
Exactly the same or at least 90% homologous and preferably at least 95%
It refers to nucleic acid sequences that are present in% homology.
In the present invention, "untranslated" refers to genomic and transcribed RNA.
By a sequence that is present, but not translated into a protein sequence. U14 remains
The gene coding sequence is processed from the RNA precursor and is a stable molecule.
Directed to Jin.
In the present invention,% homology refers to the number of identical bases in a match of two sequences.
, Is calculated as a number divided by the length between the boundaries shown. Its indicated boundaries
Between two sequences, if the two sequences are not of the same length,% homology is the same in the sequences.
Is the number of bases divided by the length of the longest sequence.
Thus, the present invention is first of all a natural feature in plant nuclear genomes and transcribed RNA.
Inheritance of U14 gene (small RNA) and / or flanking U14 gene
It relates to an isolated nucleic acid sequence having the same sequence and structure as the intergenic sequence. Second, the book
The invention relates to derivatives and fragments of their genomic sequences.
According to a first aspect, the sequences of the invention, including the sequences shown in the figures, are:
Genetically conserved sequences I, II or III, preferably
Is about 90%, for example 95%, with II and III, or parts thereof, or their sequences.
Sequences with homology should be linked to nucleic acid amplification reactions such as the polymerase chain reaction (PCR),
More preferably, the method for reverse transcriptase PCR as described by Simpson et al., 1992.
It can be used as a lymer and isolated from whole plant RNA preparations (see example below).
See). For example, RT-PCR is based on RNA from various plant tissues,
Performed with sequences II and III converted as immers. This is usually U14
A product of approximately 70-100 base pairs corresponding to an internal fragment of the sequence encoding
Is given. Secondly, primers were used to amplify between closely linked U14 genes (see
Generated from the products of RT-PCR to allow intergeneric PCR or IgPCR). this
Usually gives products in the 150-300 bp size range. On the other hand, the converted area
Region or a region corresponding to a region amplified between closely linked genes
The zation probe is used to screen the genomic plant DNA library.
Can be used. Of U14 genes with or without their flanking sequences
This isolation method also forms part of the invention.
The U14 sequences of the present invention (also referred to as "U14 coding sequences") are
Including at least one and usually all three of the above converted sequences, and
Bounded at each end by a pair of inverted repeats
It can be easily identified on the product. They also depend on the presence of known eukaryotic promoters.
And characterized by their ability to bind the nucleolar protein fibrillarin
Be killed.
The total length of the U14 sequences of the invention, including the inverted repeats, is the
Varies according to species and according to the particular U14 gene, but generally 50
Between ~ 150 nucleotides in length
You. A typical length is 100-150 nucleotides. Inverted repeats are usually
It is 4 to 20 nucleotides in length.
The transformed sequence I, defined above, is also known as Box C,
And most usually it is TGATGA, but it can also be TGATGT. That
U14 separated from the 5'inverted repeat sequence by 2 or 3 nucleotides
It occurs at the 5'end of the sequence.
The converted sequence II is located approximately in the middle of the U14 sequence and is paired with the 18-S rRNA.
And the complementary universal 18-SA element CATTCGCATNNC (Li and Fournier, 1992).
The converted sequence III is present at the 3'end of the U14 sequence and is a "Box D" element, ie
Contains universal elements in all U14 sequences identified to date. Converted
Sequence III also contains a portion of the putative 18-SB element CCTTCCT (Li and Fournier,
1992).
The U14 sequence of the present invention, in addition to the above-mentioned stochastically conserved sequence defined above,
It also includes one or more plant-specific regions. In the present invention, "plant-specific" means that
Region of U14 with less than 40% and preferred U14 sequences from other eukaryotes, especially metazoans and yeast.
More preferably, it means having a homology of 30% or 20% or less. Ever identified
The plant-specific region is a counterpant homologous to any known U14 sequence.
) Does not have. They consist of about 5 or 6 nucleotides, depending on the species.
It can vary in length over 200 nucleotides. In angiosperms, typical
The length is 20-60, for example 30-35 or 40 nucleotides. Lower plants
For example, ferns are much longer in plant-specific areas, for example 100-160 nucleotids.
It is shown to have a code.
U14 sequences typically contain two plant-specific regions, ie, one major region.
The region is located between the 3'sequence and the central transposed sequence.
Has a length of about 35-200 nucleotides (about 35 for angiosperms),
The minor region is adjacent to the 3'side of the Box C-converted sequence and contains 7 to 8 nucleotides.
With nucleotides. Within the plant kingdom, their sequences generally account for at least 70%.
Conserved with homology. The major and minor plant-specific regions are often
Each of the following sequences: GCCNNGCCAGGCTNGAGAGNTNNTGGTGNNNNAT and YRNARNN (where:
N represents any one of nucleotides A, C, G and T, and Y represents pyrimidine (T
, C), and R is a purine (G, A)). Both arrays of them
In particular, is the insertion either following the position indicated by the "N"?
It can occur between two consecutive nucleotides. The insertion is one or more
Of bases and can be 50 to 150 or more bases in length
(See Figure 11). Shorter insertions than in minor plant-specific sequences
Expected and longer insertions occur in the major sequence.
An example of a major plant-specific sequence is GCCNYGCCAGGCTYGAGAGNTNRTGCTGYNNNAT.
Examples of minor plant-specific regions are TANANYT (where Y, R and N are as described above).
It is as defined).
Thus, the major and minor plant-specific regions have the following sequences, respectively: GCCNTGCC
AGGCTTGAGAGNTNNTGCTGNNNAAT and TGAAGTT, or on the other hand, they are
Has at least 70%, and preferably 80% or 90% homology to one of the sequences
Has an array. Within the species, the homology of the plant-specific region is 80%, 90% or 95%
high. Minor plant-specific sequences have counterparts in the yeast and vertebrate U14 genes.
Not. The major conserved sequences are those between the two regions in plants and yeast.
Although the degree of homology of is very low,
Have. In vertebrates, this area is completely absent.
The major plant-specific region is also in the U14 gene of both vertebrates and yeast.
Has about 10 nucleotides with some similarity to the corresponding sequences
Containing two small plant-specific subregions separated by a relatively conserved region
(Fig. 15-plant-specific subregions P2 and P3
See). P2 is often distributed with or without the above types of insertions.
It has the column GCCNNGCCAGGC. P3 often has the sequence TGCTGNNNNAT. Therefore
, The sequence of the invention has one or less of the two plant-specific subregions P2 and P3.
Together with 6 nucleotides and preferably at least 8 nucleotides
Or a fragment thereof. Main plant characteristics
In the same way as for the different regions, the insertions were made in the above sequences for P2 and P3
It can occur between any two consecutive bases shown. The insertion is 1 to a few + salt
The length of the groups may be, for example, 1 to 150 or 1 to 50 or 60 bases in length, and
Occurs at the following locations:
Where X represents the insertion of at least one nucleotide.
The U14 sequences of the present invention further include 4-20, eg 6-12, at the end of the coding sequence.
Usually has nucleotides of length 4 and allows base pairing to form a stem
To include a pair of inverted repeats that are complementary to each other. That
The thyme structure is believed to protect the U14 gene from digestion with RNase. That
Examples of such inverted repeats are:
WTGCCN (where W = T or G and its complement, N = T, G, C or A
),
TXYZTTGC (where X = G or C, Y = C or T, and Z = A or T
), And its complement,
GCCZTGTT (where Z is A or T), and its complement.
In the above sequence, XYZ is often the GCA (as in barley and maize
Or CTT (as in potatoes) and N is often C,
A or T.
The structure of a typical plant U14 sequence is shown in FIGS.
The sequences of the present invention may be directly attached to the U14 sequence in addition to or instead of the U14 sequence.
Corresponding to a non-translated flanking region in a plant genome in the plant genome
It comprises the sequence "F".
Sequence F also has a policy because it separates one U14 gene from the next.
In the case of strontious (populated) U14 genes, also referred to as the intergenic region
You. If the plant U14 gene is an encoded intron, the sequence F will be contiguous.
It will separate the U14 sequence from the exon. Therefore, usually each U14 gene
It has flanking sequences directly on the 5'and 3'sides. Their 5'and 3
The'F 'sequences may be the same or different from each other.
The sequence of the present invention is obtained by amplification of genomic DNA or RT-PCR of total plant RNA.
If the sequence "F" is located near the 5'and 3'sides of the U14 sequence, those positions are
And, more specifically, the 5'and 3'sides of the inverted repeats delimiting the U14 sequence.
Their close proximity allows easy identification between amplification products. The "F" array is
, In the case of polycistronic machinery, from inverted repeats to adjacent U14 sequences, and
Potentially extends to adjacent exons, where they are the same
Comparison of nom sequences with flanking sequences not present in mRNA or cDNA, U14 and mRNA
Or by inverse PCR.
The flanking sequence "F" is about 20-140 in the case of polycistronic U14 gene.
Nucleotides, typically varying in length from 20 to 50 nucleotides, and
In the case of the monocistronic U14 gene, 20 to 500 or more nucleotides
Varies with length.
If the plant U14 gene is probably present in the intron, the intergenic sequence F is usually
It is rich in AU. Although the flanking region sequences vary greatly among species,
Several conserved regions have been identified. For example, the following sequence has been tested so far:
Of consensus among species present in the flanking regions of U14 gene of all
Seems to be a column:
TTCT (T) GYYY (where (T) may or may not be present, Y = pyr
It is a midine (T or C)). Y is most often T.
In the case of a polycistronic gene, this sequence is located downstream from the 3'inverted repeat.
Exists in the intergenic region of about 5 to 30 nucleotides of
In the case of a gene, an intergenic region of about 50 to 60 bases downstream from the inverted repeat on the 3'side
Exists in the area.
Within a species, especially with respect to the polycistronic U14 gene, for example 70% or more
It was determined by the present inventors that the above high degree of homology was shown between flanking sequences.
Is shown. For example, in maize, the following two sequences
Present in the U14 flanking sequence:
In potato, especially in the intergenic region of the polycistronic gene
, The following arrays exist:
In barley, the intergenic region often contains the following sequences:
Those interspecies and species-specific consensus flanking sequences are also an aspect of the invention.
Form a part. Their conserved flanking sequences allow the opening of individual U14
Is important for recognition or cleavage of the intergenic region of polycistron U14
Seem.
The sequences of the present invention are U14 sequences only, intergenic or flanking sequences "F" only,
Alternatively, it may be composed of a combination of U14 and F sequences. A particularly preferred sequence is the structure [
Fa-Ub-Fc]n(Where a, b and c each have the value 1 and n is 1
To 200, preferably 1 to 10, such as 3, 4 or 5]. This Thailand
Structure is responsible for the naturally occurring polycistronic genomic machinery in the plant genome.
Correspond. Only U sequences are present, ie b ≧ 1, and both a and c
Is 0, or only one F sequence is present, ie in the general formula above
Variants in which a or c is 0 are also preferred.
Therefore, according to a preferred embodiment, the sequences of the invention are
i) at least one statistically conserved region I as defined above
, II or III, or at least 90% homology with one of sequences I, II or III
Sequence; and
ii) at least one plant-specific region selected from the following P1, P2 and P3
:
(Where Y, R and N are as defined above and (X) is
May or may not be present and indicates insertion of 1 to 150 bases);
as well as
iii) each have 4 to 20 nucleotides and form a stem structure
In order to contain a pair of inverted repeats that can hybridize with each other.
The sequence F comprises TTCT (T) GYYY. This mutant
Optionally at least the sequence (ii) and / or the sequence (iii) together with the sequence (ii) and / or the sequence (iii).
And / or F, including derivatives or fragments of the above sequences.
Typical examples of U14 sequences of the invention are the following maize U14 sequences:
Or at least 70% homologous to this sequence, preferably at least 80% homologous.
It is the array shown. Other examples are shown in the figure, especially for potatoes and ferns.
You. Monocotyledonous and dicotyledonous plants, such as cereals, such as corn, wheat,
U14 sequences of barley, oats, rye, etc., andSolanacea(Solanacea )(Tato
For example potato),Cruciferae(Cruciferae)as well asCucurbitacea(Cucurb itacea
The U14 sequence of 1) is particularly preferred.
In addition to the U14 and "F" sequences defined above, the sequences of the present invention also include F or U
Sequences other than 14 sequences, such as vector sequences, linkers, adapters, restriction enzyme parts
Position, etc., or any constructed sequence added to the 5'or 3'end of U14 (eg,
Promoter / terminator sequence).
In a preferred embodiment, the invention also relates to either or both of the F and U14 sequences.
At least 70% and preferably at least 70% with a fragment or F or U14 sequence
Sequence of 80% or 85% homology.
It also relates to a derivative of a genomic type sequence as defined above, which comprises a lagment
You. The fragments may be combined with other types of nucleic acid sequences. Conveniently
, Said fragment is between 6 and 5 kb, preferably between 6 and 1000 nucleotides
, For example 10-500, or 10-200, for example 10-40 nucleotides in length
Having.
According to a preferred variant, the U14 derivative is of the U14 sequence as defined above.
Plant-specific regions, or at least 6 and major plant-specific region fragments
Especially if it contains at least 10 or 20 consecutive nucleotides in this region.
Comprising or consisting of a fragment consisting of Preferably plant specific
Fragments have a length of 6 to 25, for example 6 to 10 nucleotides.
.
For example, according to this variant, the plant-specific fragment is one of the following sequences:
Comprising at least 6 consecutive nucleotides, and preferably said
If the fragment has a length of 6 nucleotides, it is concatenated into multiple sequences.
Does not include the trailing "N":
(Where N represents any nucleotide, Y represents pyrimidine, and
And R represents a purine), or said fragment is one of those sequences
A sequence showing at least 70% and preferably at least 80% homology with or,
Preferably 2 as defined above, having a length of about 1 to 150 nucleotides.
Insert a sequence corresponding to one of those two sequences inserted between two consecutive bases
Comprising. Plant-specific fragments also include insertions as defined above.
With or without sub-regions P2 and P3.
Derivatives of the U14 sequence are also 5'of the U14 sequence in the plant genome, as described above.
And one or both of the inverted repeats found at the 3'end or
Can also be an array consisting of In particular, said derivative comprises one of the following sequences:
Consists of:
WTGCCN (where W = T or G, N = T, G, C or A), and its complement
body,
TATGGC and GCCATA,
TXYZTTGC (where X = G or C, C or T, Z = A or T),
And its complement,
TTGGGGGATT and AATCCCCCAA,
GCCZTGTT (where Z is A or T) and its complement.
According to this variant, the length of the inverted repeat fragment was
A naturally occurring fragment, for example a fragment of 4 to 20 nucleotides.
Corresponding to an entity or can be lengthened or shortened by the addition or deletion of nucleotides
Can be done. If the inverted repeat is lengthened by the addition of nucleotides, the
The base pairing in the second half of the repeat should be preserved.
The U14 sequence derivative is also at least 6 and preferably at least 10 or 20
Frankin comprising or consisting of contiguous nucleotides of sequence F of
Or a fragment of the intergenic sequence "F", or before present in the plant genome
Sequences having at least 70% and preferably at least 80% homology with the F sequences
Can also be a fragment of For example, the F sequence fragment is one of the following sequences:
At least 6 and preferably at least 8 consecutive nucleotides
Can consist of or consist of:
TTCT (T) GYYY, where (T) may or may not be present, and Y
Is pyrimidine (T or C). An array of this type
An example of is:
Another example of a flanking sequence fragment is:
According to the most preferred embodiment, the sequences of the present invention have a fragment as defined above.
Nucleic acid sequence comprising or consisting of a conjugate of
Sequences derived from the F-U14 sequence, such as plant-specific regions, inverted repeats,
And a nucleic acid sequence comprising or consisting of
You. An example of two aspects of the invention is an inverted repeat or a fragment having an inverted repeat.
Plant-specific sequences or their fragments, as well as fragments of coding or intergenic sequences.
Inclusive In this case, the inverted repeat has a natural odor in the plant U14 gene.
Corresponding inverted repeats, or on the other hand, form a base-paired stem
Can be any of the inverted repeats.
A sequence comprising or consisting of a conjugate of a fragment of the invention also comprises
As defined above, with all or part of a strategically arid area
One or more sequence derivatives can also be included. "Of the territorially transformed areas
"Partial" means at least 4 and preferably at least 6 of those regions,
Means, for example, a fragment of at least 8 or 10 consecutive nucleotides
You. According to this latter variant, particularly preferred binders are inverted repeats or fragments.
It contains the Box C and Box D regions along with the sequencing sequence fragment. Another favorite
New chimeric structures are Box C and Box D
Elements and flanking sequences, such as part of the consensus region shown above.
Together, the inverted repeats are included. Another example is an inverted repeat and optionally a fragment.
It includes an 18-SA or 18-SB region together with a part of the sequencing sequence. Of the present invention
According to another variant, the chimeric structure drives the expression of the U14 gene or sequence.
For promoter, intron having splice site, and intron
It comprises an immobilized U14 sequence or fragment, or a derivative thereof.
Fragments originating from different plants, such as backwards reciprocal from corn
Linking the restorer and a plant-specific sequence from barley or other cereals, etc. into a single sequence,
U14 gene and fragment hybridize, or,
Create hybrids originating from different organisms, eg plants / humans or plants / yeast
Is possible in accordance with aspects of the invention. According to this latter variant,
The hybrid is preferably a UI4 sequence from a eukaryote other than plants, its flag
Mention or derivative, together with at least part of the plant-specific region defined above,
Or a complementary sequence thereof, and / or a plant U14 inverted repeat.
The invention also provides complementary to any of the above sequences, derivatives and fragments.
Is also related to the sequence. "Complementary" refers to standard techniques (Sambrook et al., 1989).
To allow hybridization of the sequence to its complement under stringent conditions.
Therefore, a sufficiently high degree of complementarity is meant, eg, at least 80 or 90%.
For example,
-20 ml hybridization solution (5 x SSPE, 0.5% SDS, 5 x Denhardt's
s, 20 μg / ml sonicated salmon sperm DNA) on nylon membrane filter
Hybridization at
1 hour pre-hybridization at -65 ° C, followed by 65 ° C
Hybridization for 12 to 16 hours (solution containing labeled probe)
Exists. The filter is washed as follows:
* 2x SSC at 65 ° C, one wash with 0.5% SDS solution for 30 minutes;
* One wash for 20 minutes with 2x SSC, 0.1% SDS solution at 65 ° C;
* One wash for 10 minutes with 0.5 x SSC, 0.1% SDS solution at 45 ° C.
Most preferably, the sequence is probably associated with at most 3 or 4 mismatches.
And are 100% complementary.
This aspect of the invention is directed to the complete U14 gene of plants and flanking or intergenic
Antisense sequences to the sequences, as well as the derivatives and fragments defined above.
Includes antisense to all
Also, the hybridizing arm has a U14 sequence and a derivative as defined above.
A hammerhead or hairpin type ribozyme, which is complementary to the body,
And the RNase P type ribozyme using the
Included in this aspect of the invention. The details of hammer head and hairpin ribozyme
For European and international patent applications EP-A-321201 and WO-A-, respectively.
See 9119789. Ribozymes are preferably U14 coding sequences or intergenic
The area can be cut.
The sequences of the present invention may be either RNA or DNA, or a mixture of the two.
You.
The arrangement of the present invention has many applications and uses. Vertebrate and yeast U14 sequences and
Identification of the presence of the U14 sequence representing a region of homology in
U14 sequences of biological origin and fragments and derivatives thereof are used in plants, for example in transformation.
It can be used for. Furthermore, a plant U14 sequence as defined above and
That fragment
And derivatives are particularly phenotypic in other eukaryotes, such as yeast or mammals.
It can be used in conversion.
Any of the above sequences, derivatives and fragments may be used, optionally
As a probe for detecting plant U14 sequences or within the plant U14 genome.
And as a primer in a nucleic acid amplification reaction for the amplification of sequences flanking it,
It can be labeled with a detectable marker. As a label, all conventional labels
Stems such as radioactive labeling, enzyme labeling, fluorescein and bio
Chin and the like may be used.
Specific functions of the U14 gene and certain parts of the flanking sequences could be used,
For example, inverted repeats serve as stabilizers to protect heterologous RNA from RNase digestion.
Can be used.
The antisense and ribozyme mutants of the present invention have the U14 gene
And flanking sequences can be inactivated or cleaved, thus pre-rR
It is useful in processing NA transcripts and in regulating ribosome formation. In fact
, U14 deficiency leads to defective 18S rRNA production and accumulation of 23S rRNA.
Shown in Mother (discussed by Filipowicz and Kiss, 1993).
Therefore, inactivation or cleavage of the U14 gene by ribozymes is their essential mechanism.
It results in cell death due to a defect in function. According to this variant of the invention, antisense
And ribozyme structures are used, for example, to direct tissue-specific excision.
It can be linked by a tissue-specific promoter to create infertility.
The present invention further provides a plant of the invention, which is suitable for stably transforming plant cells.
A transformation vector containing any of the rows, and the transformation vector thus obtained.
Related cells. All obvious necessary sequences for transcription initiation and termination, etc.
There should be gnaru
. Conventional transformation techniques are applied. Obtained by regenerating transformed cells
Transgenic plants, in particular the U14 antisense and ribozymes discussed above
Plants capable of producing the im sequences are within the scope of the invention. Traits with the sequences of the invention
Examples of plants that can be transformed are monocots and dicots, such as cereals,
For example wheat, corn, barley, rice, etc .;Brush flies(Brassicane),for example
Rapeseed oil seeds, cabbage, broccoli, etc;Cucumber Bitaseae(Cucu rbitacea
), For example melon, cucumber, and also sunflower, soybean, etc.
Can be
The invention is also defined in the plant U14 sequences and derivatives, especially above. Chimera hula
Non-plant eukaryotic cells, especially mammalian and yeast cells, containing
I do. The cells can be stably transformed with U14 and a derivatized sequence.
You.
Various aspects of the invention are illustrated in the drawings:
FIG. 1 is a schematic of different regions of mouse, yeast and plant U14 snoRNA.
Boxes that are filled with black indicate the saved area, like Boxes C and D.
Show.
FIG. 2 shows yeast, mouse, corn (MU14.1a → MU14.4) and potato (
PU14.1) shows the aligned U14 coding sequence and the conserved sequence
And specific regions are exemplified. Consensus sequences I, II and III are indicated. Protection
The retained region II can be extended in both the 5'and 3'directions as shown. Push
The constant 18S-A and 18-SB regions are also shown as: PL.SP = plant
Specific, X = highly conserved between plant and yeast, but in vertebrates
Areas that are absent. A minor plant-specific region on the 3'side of Box C has been tested so far.
Absent in all other classes of organisms, and between plant species
It shows homology. Main plant characteristics
A heterologous region has at least 70% homology between species and about 90-95% homology within species.
Will be saved. Strategically conserved regions II and III are less abundant among biological classes.
At least 70% homology (often at least 90% homology in Region III)
Having. Uppercase letters indicate the presence of bases at all positions; lowercase letters indicate all
However, it shows the presence of the base at one position.
Figure 3 shows the means for cloning the U14 snRNA gene from plants. No.
In one step, specific for conserved sequences in animal and yeast U14
Primers 1 and 2 were used in the RT-PCR reaction with plant RNA. Product produced
Sequence (about 90 bp) was closely ligated in step 2 with total plant DNA.
It was used to construct primers for amplification between the selected genes.
Figure 4 shows plant (PL), yeast (YST) and vertebrate (VERT) U14 snoRNA consensus.
Shows the suspension array.
Figure 5 shows the plants (MU = maize, PU = potato) arranged in a line, fermentation
The U14 snoRNA sequences of mother and vertebrates, and consensus sequences are shown.
Figure 6 is obtained by sequencing fragments of isolated genomic clones.
, Including flanking intergenic sequences and inverted repeats
The sex maize U14.1 sequence is shown. This transcript contains four complete U14 sequences, MU14
.1a, MU14.1b, MU14.1c and MU14.1d are included. Inverted repeats and Box C and D
Elements are marked.
Figure 7: Obtained by sequencing fragments of isolated genomic clones
A single U14 sequence in maize, including flanking intergenic sequences, such as
Indicates U14.4. The inverted repeats and Box C and D elements are marked.
Figure 8: Obtained by sequencing fragments of isolated genomic clones
A single potato U14 sequence PU containing flanking intergenic sequences such as
Shows 14.1. The inverted repeats and Box C and D elements are marked.
Figure 9Arabidopsis thaliana(Arabidopsis thaliana) From U14
About 80 nucleotides at the 3'end of the offspring are shown. BoxD elements are marked.
Figure 10 shows U14 IgPCR products from maize (Zm) and potato (St)
Shows aligned arrays. At the 3'end of the upstream gene and downstream, respectively
The conserved Boxes C and D at the 5'end of the gene are shown. Corn
Location of limers III and IV (and their corresponding potato primers V and VI)
Is indicated by an arrow. Some yeast and mouse U14 coding sequences are shown.
Figure 11 shows the fern (with the sequence of corn U14.4).A. Needance(A . nidans)
) U14 sequence is shown. The fern sequence is based on total fern RNA based primer I and
And II were obtained by RT-PCR.
Figures 12 and 13 show that using corn primers III and IV based on barley DNA,
The barley U14 intergenic sequence obtained by intergenic PCR is shown. Box C and D and
The regular inverted repeats are underlined.
Figure 14 shows the potatoes showing the position of the code area (Box filled with black) and
Region of maize U14 genomic clone and two maize genomic clones
Position of the three blocks of sequence homology between the 5'flanking regions of the
Indicates the location.
Figure 15 shows plant U14 aligned with mouse and yeast U14 coding regions.
The genomic sequence is shown. Reverse at the 5'and 3'ends of the gene
The inverted repeats are shown, Boxes C and D are shown in bold, single-stranded genes MU14.4 and FU1.
4.1 100 bp 5'and 3'flanking sequences, and MU14.1 U14 gene population
Sequences at the ends and sequences downstream of genes 1a, 1b and 1c are shown, and MU14
.1 adjacent downstream U14 coding regions in the gene cluster are indicated in parentheses. mU
The gene fragment downstream of 14.1b is lightly written. 18S rRNA (18S-A and
And the region complementary to I8S-B) is indicated by an asterisk and is a conserved region.
2 [22] is underlined, and the possible extensions of this region of homology are indicated by dotted lines.
Is shown. Three plant-specific sequences (P1-P3) are indicated by brackets and PU
The putative extended inverted repeat in I4.1 is underlined by the bold line
.
Example
Method details:
Whole RNA preparations of potato "Cara" and maize "Kelvedon Glory"
Was prepared by standard methods. Reverse transcriptase-polymerase chain reaction (RT-PCR)
For this purpose, RNA preparations were extensively DNase treated with RQI RNase-free DNase and then
, The first-strand cDNA at the 3'end of Max (positions 65-82) and yeast U14 (positions 107-124).
Primer II complementary to the conserved region of 5'-TCAGACATCC
Synthesized by AAGGAAGG-3 '. PCR reactions were performed on mouse (positions 24-41) and yeast U1.
A second oligonucleotide primer I homologous to 4 (positions 31-46),
This was followed by the addition of 5'-CCATTCGNNGTTTCCAC-3 '. RT-PCR reaction
It was carried out by a quasi method (Simpson et al., 1992). The amplified product is
Isolates following gel electrophoresis and subcloned into pGEM 3zf (+) (Promega)
And sequenced.
Primer III 5'-CCCGGGAGCTCAGGCTTGAGAGCTAGTGC-3 ', and
Primer IV 5'-GAATTCTGCAGCANGGCGAAAGCTCTTAG-3 '(or III and IV
Corresponding to, but lacking the first 10 5'nucleotides
) Was constructed based on the maize RT-PCR amplified sequence, and PCR and RT
-Inheritance between closely linked U14 genes in both PCT reactions
It was used to amplify the intergenic sequence (Fig. 3).
For potatoes, primer V 5'-CCCGGGAGCTCAGGCTTGAGAGCATATG
C-3 'and VI 5'-GAATTCTGCAGCGAAGGCGAAAGCACTTAG-3' are also adjacent to each other.
Constructed for amplification with intergenic sequences between closely linked U14 genes
And was used in PCR and RT-PCR reactions with potato DNA and RNA.
For ferns, primers designed against primer II and plant U14 sequences
-Ie, primer VII 5'-CGGAAGCTTNNAAGGCTTGTTTCTC-3 ',
Used for RT-PCR based on RNA.
material:
Restriction enzymes and T4 DNA ligase are also described by Boehringer (Mannheim), Pharmacia and Prom.
I bought it from aga. T7 RNA polymerase and RNase inhibitor from Pharmacia
Met. Radionucleotide, T4 polynucleotide kinase and Hybond N+
Filters were obtained from Amersham. RNase A, RNase T1as well astaqDNA Polymerer
Ze was purchased from Boehringer-Mannheim. MMLV reverse transcriptase and RNase free DNa
se RQI from Gibco-BRI and Sequenase from United States Biochemicals
Was.
RNA and DNA extensions:
RNA, potato (Solanum tuberosum L.(Solanum tu
berosum L.
)) From cultivars Cara and Desiree leaves, stem and tuber tissue, and tow
Sorghum (There My L.(Zea mays L.)) Varieties Kelvedon Glory leaves, ovules
And corn hair. Is DNA a leaf tissue of Cara and Kelvedon Glory?
Extracted from. Total RNA was isolated from corn, wheat, barley and ashes for Northern analysis.
Paragus, potatoes, beans, cucumbers and bird nest ferns (Asprenium Nida Sense
(Asplenium nidans)) Isolated from leaf tissue. All techniques are standard
(Sambrook et al., 1989).
Primer extension:
Mapping of the 5'end of the U14 transcript by primer extension is described below [32P] -end
DNase-treated total RNA using labeled oligonucleotide primers
Performed on the preparation:
The two maize primers are cloned maize U14
Differing in a single nucleotide to indicate the sequence variation found in the gene
.
Primers were end-labeled with polynucleotide kinase and gel purified.
Made. Primer extension was performed by standard methods (Sambrook et al., 1989), and
The products were separated on a DNA sequencing gel.
RNase A / T1Protection analysis:
Complementary to the maize and potato U14 genes [32P] -labeled
Prepared RNA transcript preparation from linearized plasmid as described above
(Waugh et al., 1991). RNase A / T1Conservation analysis, Goodall and Filipowicz,
Described by 1989
Do this for 5 μg of total RNA and run the product on a DNA sequencing gel.
separated.
Renal localization of U14 snRNA in plant tissues:
Corn and Potato U14 Code / Hula Incorporating Digoxigenin-UTP
Antisense U14 probe corresponding to the
In vitro transcription of a linearized plasmid containing potato and U14.1 genomic sequences
And pea roots as described by Highett et al., 1993.
Used as a cell-based field probe. This is the rest of the nucleoplasm or cytoplasm
Shows clear localization to the kernels with no or no labeling, thus
, Confirmed that this sequence is a ren snRNA. Control field hybridization
Are complementary to the plant U1 snRNA and U3 snoRNA sequences.
Was performed with tide and specific labeling was performed for nucleoplasm and kernel, respectively.
Indicated.
result:
PCR isolation of U14 sequences from corn, potato, barley and fern:
Expressed plant U14 sequences against highly conserved regions of mouse and yeast U14
And complementary primers (primers I and II above)
Amplified by RT-PCR from potato total RNA preparations. Approximately 80 bp predicted service
The Izu amplified product was subcloned and sequenced. Four tows
The sorghum sequence and the two potato sequences are homologous to the mouse and yeast sequences.
Which indicated that the putative plant U14 sequence was generated. This amplification
Fern (A. Needance(A . nidans)) To the raw RNA preparation from
Performed using II and VII (FIG. 11).
To further amplify the U14 sequence from the U14 coding sequence in the 5'and 3'directions,
Two additional primers (primers III and IV for corn, and
For potatoes, primers V and VI) were used using the plant RT-PCR sequence above.
It was constructed. PCR reactions with both potato and maize DNA flank
, Showing amplification of sequences between closely linked genes, only 50-350 bp (especially 1
50-350) amplified DNA products were produced. The PCR product is subcloned and
The sequences of 4 maize and 4 potato clones were obtained (Fig. 10).
Individual clones contain approximately 45 to 50 bp (primer III or V sequence) at the 3'end of the downstream gene.
Column) and about 70 bp at the 5'end of the downstream U14 gene (including primer IV or VI sequence).
Included). The PCR reaction depends on the presence of the initial primer pair and mouse and yeast U14.
Was amplified through the region containing those primers confirming similarity to
The intergenic regions of the four maize sequences vary in size from 53 bp to 140 bp.
(Distance was measured between boxD of upstream gene and boxC of downstream gene)
, And the intergenic region of the potato clone ranged from 124 to 156 bp (Fig. 10).
). Some homology was evident between the intergenic sequences from the same species. Tato
For example, ZmTgPCR 3 and 4 differed in the latter with a 16 bp insertion. further,
All four potato clones had boxD in flanking downstream genes.
The sequence GTTCTTG (C / T) TTGATGATGA 41-44 bp downstream of the sequence and approximately 75-100 bp upstream of boxC.
ATA (including the boxC array, which is of interest), but this array
Was completely absent from the potato genomic clone.
Primers III and IV from maize were also used as an intergenic PC based on barley DNA.
Used for R reaction. A product of 60-200 bp was produced (
Figures 12 and 13).
Isolation of maize and potato U14 genomic clones:
Corn U14 and potato U14 probes produced by RT-PCR
The screening of maize and potato genomic libraries for
Sex clones were identified. 2 corns and 1 potato genomic claw
Purified and hybridized fragments were subcloned into pUC19.
Turned into Corn U14.1 has a very strong hybridizing signal.
Four consecutive 1.1, 1.0, 0.7 and 0.065 kb sequences assigned and sequencedPST I
Subcloned based on the fragment. 4 complete U14 coding sequences
And a fragment of the 5th coding sequence was identified in the 760 bp region. 4 kinds of light
The gene that was not slightly impaired was designated MzU14.1a-d. Gene-specific claw
The subfragment was subcloned into pGEM3zf + to isolate the clone.
i) Gene (a) of 432 bpRsa IClone as a fragment (pgMU14.1a)
And contains a 276 bp upstream flanking sequence;
ii) Gene (b) of 266 bpRsa IIsolated as a fragment (pgMU14.1b),
And the U14.1b coding sequence and the fragment sequence upstream of 35 bp and downstream of 101 bp.
Including rows;
iii) The entire gene (d), most of the 2/3 of the 3'side of the gene (c) and 327
The flanking sequence downstream of bp wasTaq I / BglIIFragment (pgMU14.1d
).
The second maize genomic clone, MzU14.4, of 2.2 kbEcoR IFragmen
Subcloned as This clone is 750bpPST I / EcoRIFragment
And 254 bpNsi I / BfrIflag
Included a single U14 coding sequence that was subcloned as a fragment. Similarly,
The potato genomic clone StU14.1 has an 873 bpEcoR I / PstIFragment and 438
bpEcoR I / HindIIISingle U14 code subcloned as a fragment
Including the array. Coding sequences for all genomic U14 genes and extensive frankins
Sequence was generated by standard methods.
The putative plant U14 genomic sequence is homologous to vertebrate and yeast U14.
Show areas of sex:
Maize U14 and potato U14 produced by intergenic PCR (IgPCR)
Screening of maize and potato genomic libraries with probes
Identified many positive clones. 2 corns and 1 potato
Purifying the genomic clone and subcloning the U14 containing fragment,
Then sequenced (Figure 15). Corn U 14.1 is a very strong hybrida
The U14 coding sequence which imparts an is signal and is clearly intact.
(MU14.1a-d) and the fifth fragment of the U14 sequence, all of which
It was contained within the 761 bp region (Figures 14 and 15). MU14.4 and StU14.1 are each single
U14 coding sequence.
Sequences of four apparently full length U14 coding regions of maize U14.1.
Yeast and mouse U14.4 and potato U14.1 single genes
Aligned with the U14 sequence (Figures 2 and 15). The putative code region is Bo
It is defined by the inverted repeats flanking the xC and BoxD arrays. All 6 species
Plant sequences show high homology with broad regions of identity to each other. Yeast and
And mouse U14, the sequence homology ranges from 53-63% and 68-76%.
(% Of yeast and mouse U14 sequences, respectively)
Represented as). Sequence variations existed between plant, yeast and animal U14 sequences,
, There is a region of high homology: contains Box D and contains 3'inverted repeats.
Box C sequence and I9nt region, which exist directly upstream. Ferment these two areas
Regions 1 and 3 compared to mother and mouse U14 (Li and Fournier, 1992),
Then, the latter is a sequence complementary to 18S rRNA which is highly conserved in plants (18S-
B) is included. In addition, a region of broad similarity was identified in the 5'half of the molecule.
, And again having the sequence 18S-A with homology to 18S rRNA, Li and Fo
Area 2 of urnier, 1992. However, the plant U14 sequence information is
Allows realignment of mouse U14 central region which extends region 2 in the 3'direction due to alignment
To Region 2 is also expanded in the 5'direction when compared to plants and sequences. This
The novel alignment of E. coli is a functionally essential yeast feature in both mouse and plant U14.
Heterologous sequence 1 (Li and Fournier, 1992) confer relatives and are essential yeast-specific
Region 2 is still absent in mouse, but one of three plant-specific sequences
Overlaps with one. Furthermore, the plant sequence is found only in plant U14.
An additional 7 or 8 nucleotides between the 5'extended region 2 sequence and Box C.
Including otide. Longer central yeast-specific region absent in mouse U14
Has a counterpart in plant U14, but its plant sequence is short, and
Shows little homology to yeast sequences. Inverted repeats in plant genes
Sequence and length vary, and there are 2-3 nt between the 5'IR and Box C sequences.
, And the 3'IR is usually immediately adjacent to the BoxD array. Predicted plant U14
The size is between that of mouse and yeast, and corn and jare.
The potato U14 is about 117-120 nt long.
Of the genomic clones MU14.1, MU14.4 and StU14.1, 2872bp, 12
80 bp and 873 bp were sequenced respectively. In particular, the junction of the MU14.1c and 1d genes
The sequence through is 1 of the sequence generated by IgPCR (Zm U14 IgPCR1-Figure 10).
And the sequence of Zm UI4 IgPCR2 is MU14.1 and 1b or 1b and gene
It corresponds to the junction between any of the gene fragments downstream of 1c. These latter
Sequences, because they are contained within large direct repeats in the gene population.
, Have high homology to each other. U14 flanking area
In an attempt to identify exon sequences that encode proteins, open reading frames (ORF) and
And AU / GC content were analyzed. Three regions of nucleic acid homology have two maize
Although observed in the 5'flanking region of the cygenomic clone (Figure 14), it
These regions do not encode similar ORFs and, therefore, do not map to exon sequences.
I didn't think I would respond. By ORF (> 50 amino acids) and flanking DNA sequences
Database search failed to identify significant homology to known genes
. Furthermore, typical plant gene promoter elements are flanking U14 genes.
Or was not identified in the coding region. Corn U14 coding region
SurveyArabidopsis(Arabidopsis)90 to 80 bp region of sequence marker for expression
Over% homology was identified.
Northern analysis of the 5'end of the U14 transcript and primer extension map:
From sequence alignments, plant U14 snoRNAs show intermediate size between yeast and mouse U14.
It was predicted to be. Size of corn, potatoes and many other plants U14
316 bp EcoRI / HindIII of pgMU14.1b containing the maize U14.1b gene
Estimated from Northern analysis of total RNA hybridized by the fragment.
All plant species have a hybridizing RNA band of approximately 120 nt that is consistent with the sequence data.
Although shown, the size of the U14 hybrid is about 240 to 320nt.
Showing the bandAsprenium Nidasis(Asplenium nidans) Excludes ferns. Step
Shows unprocessed or partially processed U14 precursor RNA
There was no evidence from Northern analysis of large hybridizing species.
Whole peaches with primers complementary to maize and potato sequences
Primer extension analysis of sorghum ovule RNA yielded many major products. Two kinds
Corn primer (depending on a single nucleotide) is U14.1b, c
And d (primer Mz Pex1) and U14.1a and U14.4 (primer Mz Pex2)
Was used to account for single nucleotide differences between. Mz Pex1 primer
-56nt product is the strongest, with many primer extensions in the 54-59nt size range
A product was produced. All products were located within the 5'inverted repeats. Mz Pex2
The primers again gave a narrow range of products (54-57nt) with the 56nt band again being the strongest.
Given and all were located at the 5'IR. Di using primer Pot Rex 1
Primer extension with total RNA from potato leaves relocated to 5'IR 56-6
Products in the 0 nt range were applied. In addition to the major primer extension products listed above, approximately 8
Other products in the size range 0-350 nt were observed, and at least some
5'extension to the U14 transcript. In contrast, total maize ovule RNA
And control primers with primers complementary to maize U5 snRNA
-The extension reaction gave a single primer extension product of the expected size. main
By comparison to the strength of the required product, the extended product was found in the total RNA preparation.
It was low. They are from the same RNA preparation but DNA from the PCR control
Since it is used for RT-PCR reaction analysis that does not give the product of
(See below).
RT -Detection of polycistronic U14 transcripts by PCR:
Intergenic PCR and gene placement of MzUI4.1 showed that some U14 genes
U14 genes are transcribed together as polycistronic transcripts and
Both potatoes and maize increase the likelihood of being processed by snoRNA
It was shown to be grouped in the person. Primer III for early cDNA generation
RNA-based RT using primers III and IV in PCR and PCR reactions
-PCR produces many labeled products of 135, 152, 180, 261, 266 and 272 nt.
I made it. Dimers from three different potato organs using primers V and VI
Similar reactions with potato RNA preparations were performed at 82, 118, 258, 277, 278 and about 360 nt.
The product was applied. A control reaction without reverse transcriptase was performed in RNA preparations.
It gave no product showing no residual DNA, and this was the RT in lanes 1-4.
-Verify that the PCR product was derived from RNA. From those Ig RT-PCR reactions
Cloning and sequencing of some products are divided by intergenic sequences.
The presence of 3'and 5'fragments of adjacent flanking genes was confirmed. Of the primer
From the position, the RT-PCR products ranged from 15 to 150 nt and jar for maize.
Two adjacent genes, leaving an intergenic region in the range of 140 to 240 nt for potato
It will contain approximately 120 nt coding region from The identity of the small RT-PCR product is unknown
But rearranged to be transcribed as part of a polycistronic U14 transcript.
Resulting U14 gene fragment. Some Ig RT-PCR product
Rowing and sequencing was performed using the intergenic sequence, as previously obtained by IgPCR.
Confirmed the presence of 3'and 5'fragments of flanking genes separated by
(Figure 10). The four sequenced clones were virtually identical to the St IgPCR4 sequence.
Yes (Figure 10), two are identical to St IgPCR2
Yes, and one was identical to Zm IgPCR1 (FIG. 10). Two additional tomorrows
Koshi-derived clones were found in IgPCR clones or in the MU14.2 gene cluster.
Flanking genes separated by as little as 17 and 18 bp with no equivalent
3'and 5'fragments. Therefore, RT-PCR is based on the adjacent U14 gene.
And many transcripts, including those found in the genomic MU14.1 clone.
The U14 gene population tends to be transcribed as a single polycistronic transcript
And presume that each U14 is released by processing.
Confuse.
RNase A / T 1 protection mapping:
Specific anti-sense for MU14.1a, MU14.1b, MU14.1d, MU14.4 and MU14.1
RNase A / T using RNA probe1Conservation mapping is based on total RNA
These genes (or RNase A / T1Substantially identical to them within the limits of the technique
Of a full length of 118-126 nt indicating the presence of a mature U14 transcript from the gene
The product was detected. MU14.1 remains taken with detection of polycistronic U14 transcripts
The production of full-length products from those genes in the gene population is dependent on the individual U
It is suggested that 14 is processed from their large RNA precursors.
Potato U14 products consistent with sequence analysis are those products of maize
It was slightly larger than the thing. The size range of the product depends on the primer extension.
As has already been observed, U14 and / or the sequence at the different 5'end
Shows variability. RNase A / T is the product with the lowest intensity1High in gel
Observed and representing the precursor U14 transcripts, but their identity is further
Not investigated. The mapping with StU14.1 probe shows this potato U14
Includes a 10 bp GC-rich inverted repeat flanking the gene
Due to the formation of the terminal stem, 134-135 nt is protected, which represents a particularly stable precursor.
Showed the fragment. All probes were transferred from other U14 gene variants.
Small protected resulting from hybridization of the probe to the image
The fragment was shown. Control reactions without added plant RNA were protected.
No fragment was shown. When taken together, due to primer extension
Position of 5'end mapped and RNase A / T1Full length product length
Is located at or directly adjacent to the 3'inverted repeat at the 3'end of the U14 transcript.
To indicate that it exists.
In summary, some tight linkages of the plant U14 gene were found in IgPCR and peaches.
It was shown by the composition of the population of the Rokoshi U14 gene. In most cases, the intergenic distance is
It was too short to fit a known plant promoter element. For example, plant snRNA
Promoters are two elements that normally occur within 80 base pairs from the start of transcription,
That is, Upstream Seguence Element (USE) and TATA-box are required. Figure 6,
As shown in 10, 12, and 13, the intergenic sequences of the invention are often more than 80
Has a small base length. Their signals and other plant gene promoters
The absence of the element indicates that the U14 gene is either a novel promoter sequence or a large precursor RNA.
It was shown to be transcribed as part of the molecule. At least two U14 coding sequences
Detection of transcripts containing RT-PCR and RNA-derived RT by partial sequence of MU14.1 population
-Identification of PCR products is based on the determination of the U14 gene population by processing individual U14
It is further suggested that it is transcribed as a polycistronic transcript. Frankin
The plant U14 gene sequences are intron-encoded based on the coding sequence.
It is currently impossible to confirm that. In animal systems, a single snoR
Only the NA gene was included in either intron. Collection of corn U14
In clusters, obvious 3'and 5'splice sites were observed in the intergenic region.
This is because they are the same if the genes are intron-encoded.
Suggests that it is contained entirely within the tron. Therefore, the gene cluster has a single upstream
From a promoter, that is, a novel gene contained within a short intergenic or coding sequence.
From the promoter element, as a specialized U14 transcript or as a pre-mRNA transcript
Can be transcribed as part of the.
Proteins involved in pre-rRNA processing or ribosome assembly
The location of the snoRNAs in the introns of the quality-encoding gene is dependent on their expression.
Achieved by utilizing active or continuous expression of the main gene, and
It is suggested that it is regulated (References 3, 24). In addition, intron-coded
The relative abundance of snoRNA is affected in gene copy number, resulting in spinal motion.
As observed for the U14 and U17 and U18 sequences of Xenopus laevis
Multiple copies (but only one copy per intron) are high level sn
It is hypothesized to show the implications of oRNA transcripts (24). New in plants
The polycistronic U14 gene arrangement of is also based on whether the precursor is intronic or
High levels of U14 transcription, whether transcribed from a novel promoter
You can corroborate your body. U16 and U18 snoRNA-containing intron transcripts
Pricing and processing analyzes show that endonuclease degradation
-Or a powder that is subsequently rapidly removed by either exonuclease-degrading activity
A two-step processing pathway that produces snoRNAs with extended ends is shown (
References 9, 18, 25-27). However, the process of human U17 and U19 snoRNA
Recent in vivo and in vitro analyzes of S.
Needs pricing, and debranched in
Exonucleolytic digestion of flanking regions from thoron catch (lariat)
It was shown that it progresses with Strong clustering of some plant U14 genes
, The initial endonuclease degradation is involved in the production of individual U14.
And Primer extension and RNase A / T1Possible U1 in mapping
Low abundance of 4 precursor transcripts results in a rapid process of plant U14 precursors in vivo.
Will indicate Processed mature vertebrate snoRNAs and processes
Stability of certain intermediates in the Shhing reaction makes their molecules produce mature snoRNAs
Suggested to be protected from the exonuclease-degrading activity required to
(Reference 28, 8, 10). This is, for example, the 5'and 3'ends of U14-U16 snoRNA.
Stable end-to-end stem formation and binding of proteins such as fibrillarin
For some reason (references 9, 21, 28, 8, 18), but with some processing
snoRNAs (U17 and U18) contain no inverted repeats or box C or D sequences, and
Therefore, protection can be involved in the binding of other protein factors (Reference 27).
─────────────────────────────────────────────────────
フロントページの続き
(51)Int.Cl.6 識別記号 庁内整理番号 FI
9282−4B C12N 5/00 B
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FR,GB,GR,IE,IT,LU,M
C,NL,PT,SE),AU,JP,NZ,RU,U
S
(72)発明者 リーダー,デビット ジョン
イギリス国,ダンディー ディーディー1
5ピーピー,ローズフィールド ストリ
ート2,フラット 6
(72)発明者 ワウ,ロビー
イギリス国,バイ ダンディー ディーデ
ィー4 0アールジー,ヒルサイド オブ
プリーストン,プリーストン ファー
ム,コッター ハウス(番地なし)─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI 9282-4B C12N 5/00 B (81) Designated country EP (AT, BE, CH, DE, DK, ES, FR) , GB, GR, IE, IT, LU, MC, NL, PT, SE), AU, JP, NZ, RU, US (72) Inventor Leader, David John England, Dundee Dee Dee Dee 15 Peep, Rosefield Street 2, Flat 6 (72) Inventor Wow, Lobby United Kingdom, By Dundee Diedy 40 Earl Gee, Hillside of Pleaston, Pleaston Farm, Cotter House (no house number)