【発明の詳細な説明】
新規のヒト第16染色体遺伝子、組成物、それを作製および使用する方法
発明の背景
隣接したクローニングゲノム試薬の組み立ては、位置的クローニングアプロー
チを使用した疾患遺伝子同定のプロセスにおける必要な工程である。多型性の単
純な配列反復に基づく高密度遺伝子地図の急速な開発は、配列タグ化部位(STS
)含有量マッピングを用いたコンティグ組み立てを容易にしている。ほとんどの
コンティグ構築努力は、酵母人工染色体(YAC)に依存する。なぜなら、それら
の大きな挿入物サイズが細菌宿主系より有利に現行のSTS地図密度を使用するか
らである。このアプローチは複数のヒト染色体について実証され、多くの染色体
に対して65〜95%の範囲のYAC適用範囲および11〜36Mbのコンティグが記載され
ている(Chumakovら、Nature 377(補遺):175-297,1995;Doggettら、Nature 37
7(補遺):335-365,1995b;Gemmillら、Nature 377(補遺):299-319,1995;Kraut
erら、Nature 377(補遺):321-333,1995;Shimizuら、Cytogenet.Cell Genet.70
:147-182,1995;van-Heyningenら、Cytogenet.Cell Genet.69:127-158,1995)
。
多くの成功にもかかわらず、YACクローニング系は、キメラクローン(Greenら
、Genomics 11:658-669,1991;Bcllanne-Chantelotら、Cell 70:1059-1068,19
92;Nagarajaら、Nuc.Acids Res.22:3406-3411,1994)、ならびに再配列される
か、欠失されるか、または不安定なクローン(Neilら、Nuc.Acids Res.18:1421-
1428,1990;Wadaら、Am.J.Hum.Genet.46:95-106,1990;Zuoら、Hum.Mol.Genet.
1:149-159,1992;Szepetowskiら、Cytogenet.Cell Genet.69:101-107,1995)
の実質的な割合をもたらす本質的な制限のために複雑な生物の全ゲノムをクロー
ニングのための万能薬ではない。これらのクローニング人工物の少なくともいく
つかは、哺乳動物DNAにおける種々の型の反復エレメントに作用する酵母の組換
え機構の産物である(Neilら、前出、1990;Greenら、前出、1991;Schlessinge
rら、Genomics 11:783-793,1991;Lingら、Nuc.Acids Res.21:6045-6046,1993
;Kou
prinaら、Genomics 21:7-17,1994;Larionovら、Nuc.Acids Res.22:4154-4162,
1994)。
従って、代替のクローニング系が、局在化YACクローニング欠損を補うために
、物理的地図の解像度を増強するために、そして全ゲノムのDNA配列決定のため
の配列準備供給源を提供するために、YACに基づくアプローチと協力して使用さ
れなければならない。いくつかのエキソントラッピング方法論およびベクターは
、ゲノムDNA由来のコード領域の迅速かつ効率的な単離のために記載されている
(Auchら、Nuc.Acids Res.18:6743-6744,1990;Duykら、Proc.Natl.Acad.Sci.,
USA 87:8995-8999,1990;Bucklerら、Proc.Natl.Acad.Sci.,USA 88:4005-4009
,1991;Churchら、Nature Genet.6:98-105,1994)。エキソントラッピングの
主な利点は、クローニングされたゲノムDNA(コスミド、P1,またはYAC)の発現
が、組織培養細胞において異種プロモーターにより駆動されることである。これ
は、コード配列がそれらの発現の組織分布または発生段階の前もった知識なく、
同定されることを可能にする。エキソントラッピングの第2の利点は、エキソン
トラッピングが、目的のクローニングされるテンプレートのみに由来するコード
配列の同定を可能にし、これは重複遺伝子座由来の高度に保存された転写物を特
徴づける危険性を排除することである。これは、cDNA選択の場合でも直接的ライ
ブラリースクリーニングの場合でもない。
エキソントラッピングは、ハンチントン病遺伝子座(Ambroseら、Hum.Mol.Gen
et.1:697-703,1992;Taylorら、Nature Genet.2:223-227,1992;Duyaoら、Hu
m.Mol.Genet.2:673-676,1993)およびBRCA1遺伝子座(Brodyら、Genomics 25:2
38-247,1995;Brownら、Proc.Natl.Acad.Sci.,USA 92:4362-4366,1995)にお
ける転写配列を同定するために首尾良く使用されてきた。さらに、ハンチントン
病の遺伝子(The Huntington's Disease Collaborative Research Group,Cell
72:971-983,1993)、2型神経線維腫症(Trofatterら、Cell 72:791-800,1993
)、メンケズ病(Vulpeら、Nature Genet.3:7-13,1993)、バッテン病(The In
ternational Batten Disease Consortium,Cell 82:949-957,1995)、および大
多数の長期QT(Long-QT)症候群症例の原因である遺伝子(Wangら、Nature Genet.
12:17-23,1996)を含む、多数の疾患を引き起こす遺伝子が、エキソントラッ
ピングを用いて同定されている。
バンド16p13.3における700kbのCpGリッチ領域は、常染色体優性腎多嚢胞病(P
KD1)の約90%の症例の疾患遺伝子(Germinoら、Genomics 13:144-151,1992;S
omloら、Genomics 13:152-158,1992;The European Polycystic Kidney Diseas
e Consortium,Cell 77:881-894,1994)、ならびに結節硬化症の1形態の原因
であるチューブリン遺伝子(TSC2)(The European Chromosome 16 Tuberous Sc
lerosis Consortium,Cell 75:1305-1315,1993)を含むことが示されている。
推定された20個の遺伝子は、第16染色体のこの領域に存在する(Germinoら、Kid
ney Int.Supp.39:S20-S25,1993)。しかし、16p13.3におけるPKD1遺伝子周囲の
領域の特徴付けは、16p13.1でのより近位のゲノム間隔の部分の重複により複雑
にされてきた(The European Polycystic Kidney Disease Consortium,前出,19
94)。
この染色体セグメントは、GCリッチ等容曲線(isochore)(Sacconeら、Proc.N
atl.Acad.Sci.,USA 89:4913-4917,1992)に、CpG島(Harrisら、Gcnomics 7:195
-206,1990;Germinoら、前出、1992)、遺伝子(Germinoら、前出、1993)、お
よびAlu反復配列(Korenbergら、Cell 53:391-400,1988)を豊富に有して存在
するので、E.coliおよび酵母における大きな挿入物クローニング系についてのや
りがいのある試験として役立つ。第16染色体はまた、他の染色体より低コピーの
反復を含み、蛍光インサイチュハイブリダイゼーション(FISH)(Okumuraら、C
ytogenet.Cell.Genet.67:61-67,1994)により分析された場合に、そのコスミド
コンティグのほぼ25%が1つより多い染色体位置にハイブリダイズする。これら
の型の反復および配列重複は、ゲノムDNAの同定のために広く使用される「染色
体歩行」技術を妨げ、そしてコンティグ構築のハイブリダイゼーションに基づく
方法に対する課題を提示する。これは、これらの技術がゲノムDNAの重複フラグ
メントを含むクローンを同定するためのハイブリダイゼーションに依存するから
であり;従って、真正の遺伝子に由来するクローンの代わりに相同物に由来する
クローンへの「歩行」の高い可能性がある。同様の様式で、配列重複および第16
染色体特異的反復はまた、対応するタンパク質をコードする完全なcDNA配列の明
白な決定を妨げる。さらに、低コピー反復は、細菌、酵母、および高等真核生物
におけるこの間隔の不安定性を導き得る。
従って、第16染色体の高度に反復した部分に存在する真正の遺伝子、ならびに
他の染色体に同様に位置する遺伝子に対応するゲノム配列およびcDNA配列の正確
な同定を可能にする方法および組成物についての当該分野における必要性がある
。本発明はこの必要性を満たし、そして関連する利点もまた提供する。
発明の要旨
本発明によれば、ヒトネトリン、ヒトATP結合カセット輸送体、ヒトリボソー
ムL3サブタイプ、および肝臓再生のヒト増大剤(augmenter)をコードする、単
離された核酸が提供される。
本発明は、ヒトネトリン遺伝子、ヒトATP結合カセット輸送体遺伝子、ヒトリ
ボソームL3遺伝子、および肝臓再生のヒト増大剤遺伝子によりコードされる、単
離されたタンパク質産物をさらに提供する。
従って、本発明は、本発明の核酸ならびに第16染色体に位置する独特の遺伝子
配列を含む単離された核酸にハイブリダイズする、核酸プローブを提供する。
本発明の核酸を含むベクターならびに本発明のベクターで形質転換された宿主
細胞がさらに提供される。
本発明のポリペプチドを発現するトランスジェニック非ヒト哺乳動物が本発明
により提供される。
本発明は、アンチセンスオリゴヌクレオチド、抗体、およびそれを含む組成物
を含む。
さらに、本発明は、本発明のポリペプチドに結合する化合物を同定するための
方法を提供する。このような化合物は、本発明のポリペプチドの活性を調節する
のに有用である。
図面の簡単な説明
図1は、P1コンティグおよびトラップされたエキソンの模式図を示す。
図2Aおよび2Bは、データベースにおける配列との選択されたエキソントラップ
のアラインメントを示す。
図3A〜3Cは、P1クローン53.8B由来の6803bpのhNETゲノム配列(配列番号19)
を示す。
図4Aおよび4Bは、ニワトリネトリン遺伝子のヒト相同物をコードする、1743bp
のhNET cDNAおよび推定アミノ酸配列(配列番号20および21)を示す。
図4Cおよび4Dは、5'および3'両方のUTRを含む1.9kb hNET cDNAのヌクレオチド
配列(配列番号78)を示す。
図5は、ニワトリネトリン-1(配列番号22)、ニワトリネトリン-2(配列番号
23)、およびhNET(配列番号21)間のアミノ酸比較を示す。陰をつけた囲みは同
一の相同性の領域を示す。ラミニンドメインVおよびVIならびにC末端ドメイン
(C)は矢印により示され、ドメインVは3つの亜成分(V-1〜V-3)に分けられ
る。星印は、接着/シグナリングレセプターのモチーフを同定する。
図6は、ニワトリネトリン-1、ニワトリネトリン-2、およびhNETのドメイン間
の相同性のグラフ表示を示す。
図7は、ABCgt.1クローン由来のエキソントラップ、RT-PCR産物、およびcDNA
を示す。エキソントラップは先に記載されている。ABCgt.1 DNAは、エキソント
ラップの下に示され、Genetrapper選択(S)および修復(R)オリゴヌクレオ
チドの位置が示されている。RT-PCRクローンの位置はcDNAの下に示される。
図8A〜8Gは、ABCgt.1クローンをコードする5.8kbのcDNAおよび推定アミノ酸配
列(配列番号24および25)を示す。
図9A〜9Dは、クローンABCgt.1(配列番号25)と共にマウスABC1(配列番号26
)およびABC2(配列番号27)のアミノ酸アラインメントを示す。ハイフンはギャ
ップを示す;星印は同一の残基を示し、一方ピリオドは保存的置換を示す。ATP
結合カセットの位置は、囲んだ領域により示される。右の数字は、タンパク質の
相対位置を示す。
図10は、P1クローン49.10D、109.8C、および47.2Hが単離された、PKD1遺伝子
座の転写マップの領域を示す。白色の囲みはトラップされたエキソンを示し、そ
れらの相対位置はRPL3L(SEM L3)遺伝子の下に示される。c、r、およびhは、
それぞれ、捕捉オリゴヌクレオチド、修復オリゴヌクレオチド、およびハイブリ
ダイゼーションオリゴヌクレオチドの位置を示す。
図11A〜11Bは、ここでRPL3Lと呼ばれるSEM L3 cDNAのヌクレオチドおよび推定
アミノ酸配列(配列番号28および29)を示す。5'上流のインフレーム停止コドン
には下線が付され、そして矢印は、2つのより短いcDNAクローン(これらもまた
単離された)のポリA域(tract)の部位を示す。
図12は、ヒト(配列番号30)、ウシ(配列番号31)、マウス(配列番号32)、
およびRPL3L(SEML3)(配列番号29)遺伝子由来の推定アミノ酸配列の比較を示
す。ダッシュは、ヒトL3遺伝子に対する配列同一性を示す。N末端の核標的化配
列には陰を付し、そして2部に別れたモチーフは箱で囲まれる。
図13は、hALR cDNAのヌクレオチドおよび推定アミノ酸配列(配列番号33およ
び34)を示す。
図14は、それぞれ、ラットALRおよびヒトALR由来の推定アミノ酸配列(配列番
号35および34)の比較を示す。
図15A〜15Jは、完全長hABC3 cDNAのヌクレオチドおよび推定アミノ酸配列(配
列番号74および75)を示す。
図16は、hABC3遺伝子を含む領域の物理的地図を示す。
図17Aは、マウスABC1(配列番号26)およびABC2(配列番号27)配列(LUCiani
ら、Genomics 21:150-159,1994)ならびにC.elegansコスミドC.48B4.4によりコ
ードされると予測される配列(配列番号77)(Wilsonら、Nature 368.32-38,199
4)に対して整列された、hABC3の推定アミノ酸配列(配列番号75)を示す。配列
同一性は文字で示され、ミスマッチはピリオドで示される。アラインメント間に
挿入されるギャップもまた示される(=)。ABC1、ABC2、およびC.48B4.4につい
て、第1のATP結合ドメインに含まれ、そしてそれに対してC末端側の配列のみ
が示される。囲みは、ATP結合カセット(IおよびIII)ならびにHH1ドメイン(I
I)を示す。
図17Bは、膜貫通(TM)ドメイン、ATP結合カセット(ABC)ドメイン、リンカ
ーおよびHH1ドメインを示すABC3タンパク質の模式図を示す。
図18は、ヒトネトリン遺伝子周囲のゲノム間隔の地図を示す。
図19Aは、53.8B P1由来の6.8kbゲノム配列におけるコード配列のGRAIL2分析を
示す。
図19Bは、ゲノム配列をニワトリネトリン-2と比較した、Pustell DNA/タンパ
ク質マトリクスの結果を示す。
図20Aは、ヒトネトリンとニワトリネトリン-1、ニワトリネトリン-2、およびU
NC-6(配列番号79)とのアラインメントを示す。
図20Bは、ゲノム配列の模式図を示し、囲みはエキソンを示し、そして線はイ
ントロンを示す。非翻訳領域は黒で示され、開始コドンの位置は矢印で示される
。ヒトネトリンタンパク質のドメイン構造は、遺伝子構造の下に示される。Dros
ophilaネトリン遺伝子におけるイントロンの位置は矢印で示され、非保存的イン
トロンは白抜き矢印で示される。
発明の詳細な説明
本願で引用される全ての特許出願、特許、および文献参考は、それらの全体が
本明細書中に参考として援用される。コンフリクトまたは不一致の場合、定義を
含む本発明の説明は調整する。
定義:
1.「相補的DNA(cDNA)」は、真正の遺伝子に由来し、そしてその配列また
はその相補物がタンパク質をコードする、1本鎖または2本鎖のイントロンのな
いDNA分子と本明細書中で定義される。
2.本明細書中で言及する「コンティグ」は、DNAまたはDNA配列の連続したス
トレッチであり、これは複数の重複するクローンまたは配列により示され得る。
3.本明細書中で言及する「コスミド」は、細菌細胞において複製し得、そし
て長さが約30〜約51kbの大きなDNA挿入物を収容し得る、DNAプラスミドである。
4.用語「P1クローン」は、P1ファージ複製機構に基づくベクターにクローニ
ングされたゲノムDNAをいう。これらのベクターは、一般的に、約70〜約105kbの
挿入物を収容する(Pierceら、Proc.Natl.Acad.Sci.,USA,89:2056-2060,1992
)。
5.本明細書中で使用する用語「エキソントラッピング」は、RNAプロセシン
グのためのドナーおよびアタセプタースプライス部位に隣接される、ゲノムDNA
配列を単離するための方法をいう。
6.本明細書中で使用するDNAの「増幅」は、混合物またはDNA配列内の特定の
DNA配列の濃度を増大させるために働く反応を示す。増幅は、ポリメラーゼ連鎖
反応(PCR)(Saikiら、Science,239:487,1988)、リガーゼ連鎖反応(LCR)
、核酸に特異的に基づく増幅(NSBA)、または当該分野で公知の任意の方法を用
いて行われ得る。
7.本明細書中で使用する「RT-PCR」は、共役した逆転写およびポリメラーゼ
連鎖反応をいう。この増幅方法は、特定のオリゴヌクレオチド、オリゴdT、また
はランダムプライマーの混合物を用いて、RNAから1本鎖cDNAへの逆転写をプラ
イムする最初の工程を使用し;次いで、このcDNAは、標準的な増幅技術(例えば
、PCR)を用いて増幅される。
PKD1およびTSC2遺伝子周囲の約700kbのDNAを含むP1コンティグは、3ゲノム等
価P1ライブラリー(Shepherdら、Proc.Natl.Acad.Sci.,USA 91:2629-2633,1994
)を15の異なるプローブでスクリーニングすることにより得られた、12の独特の
第16染色体に由来するP1クローンのセットから組み立てられた。エキソントラッ
ピングは、16p13.3におけるこの領域に由来する転写配列を同定するために使用
された。
この間隔における最低18の遺伝子に由来する配列を含む96の新規のエキソント
ラップが得られた。この18の同定された遺伝子は、この間隔に由来する5つの以
前に報告された遺伝子、およびその位置が未知であった以前に特徴付けられた遺
伝子を含む(表I)。さらなるエキソントラップが、cDNA、PT-PCR産物における
それらの存在、またはノーザンブロット上での異なるmRNA種へのそれらのハイブ
リダイゼーションに基づいて遺伝子にマップされた。 エキソントラッピングは、改善されたトラッピングベクター(Burnら、Gene 1
61:183-187,1995)を用いて行われ、得られたエキソントラップはDNA配列分析
により特徴付けられた。エキソントラッピング手順の相対的な効率を決定するた
めに、エキソントラップは、PKD1遺伝子周囲の間隔にあることが知られている遺
伝子のcDNA配列と比較された(図1)。単一のエキソントラップは、ERV1(Liso
wskyら、Genomics 29:690-697,1995)およびATP6Cプロトンポンプ遺伝子(Gill
espieら、Proc.Natl.Acad.Sci.,USA 88:4289-4293,1991)のヒト相同物から得
られた。図1の上部の水平線は、目盛りの付いた(キロベース)関連DNAマーカ
ーの位置を示す。NotI部位の位置は、水平線の下に示される。既知の遺伝子の位
置および方向は矢印で示され、各遺伝子から得られたエキソントラップの数は括
弧内に示される。この報告に記載される転写単位(AからM)の位置は、既知遺
伝子の下に示される。対応するエキソントラップのGenbank受託番号は、各転写
単位の下に示される。P1クローンは重複線により示され、クローンの名称はこの
線の上に示される。特徴付けられた転写物にマップしないトラップされたエキソ
ンの位置は、P1コンティグの下に示される。垂直線は、ハイブリダイゼーション
研究においてエキソントラップにより検出されたP1クローン(単数または複数)
内の間隔を示す。
対照的に、8つの個々のエキソントラップがTSC2遺伝子から単離され、10の個
々のエキソントラップがCCNF遺伝子から単離された(The European Chromosome
16 Tuberous Sclerosis Consortium,前出、1993;Krausら、Genomics 24:27-33
,1994)。PKD1遺伝子に存在するエキソンのうちの3つからトラップされた配列
が得られた(The American PKD1 Consortium,Hum.Mol.Genet.4:575-582,1995
;The International Polycystic Kidney Disease Consortium,Cell 81:289-29
8,1995;Hughesら、Nature Genet.10.151-160,1995)。109.8Cおよび47.2H P1
クローンから16のさらなるエキソントラップもまた得られた。
96.4Bと64.12C P1クローンとの間の重複領域に局在する、2つのエキソントラ
ップ(Genbank受託番号L75926およびL75927)に存在する配列は、S期優勢なDNA
/RNA結合タンパク質(Schmidtら、Biochim.Biophys.Acta 1216:317-320,1993)
をコードする、マウスRNPS1遺伝子(Genbank受託番号L37368)に対する以前に記
載されたヒト相同物由来の配列を含むことが示された。dbESTデータベースに対
するこれらのエキソントラップの比較は、それらがまたI.M.A.G.E.Consortium(
Lennonら、Genomics 33:151-152,1996)からのcDNA 52161に含まれることを示し
た。これらのデータに基づいて、hRNPS1遺伝子は、DNAマーカーD16S291近くの16
p13.3にマップされ得る(図1の転写物G)。
1.8F P1クローン由来の2つのエキソントラップは、ジンクフィンガー含有転
写因子をコードする以前に記載されたマウスΦAP3(Fognaniら、EMBO J.12:4985
-4992,1993)に対して、高レベルの相同性を有することが見出された。ジンク
フィンガー含有転写因子であるmΦAP3タンパク質は、細胞周期の阻害を担うタン
パク質をコードする遺伝子に対する負のレギュレーターとして機能すると信じら
れている(Fognaniら、前出)。2つのエキソントラップはPCRにより連結され、
得られた1.2kbのPCR産物は、マウスΦAP3cDNAに対してヌクレオチドレベルで85
%同一であった。ΦAP3様エキソントラップのドットブロットされたP1コンティ
グに対するハイブリダイゼーションは、この遺伝子株がDNAマーカーKLH7とGGG12
との間の1.8F P1の非重複領域にあることを示した(図1の転写物H)。
有意な相同性はまた、97.10G P1および小胞輸送の調節に関与するras関連GTP
結合タンパク質をコードするラットRab26遺伝子(Nuofferら、Ann.Rev.Biochem.
63:949-990,1994;Wagnerら、Biochem.Biophys.Res.Comm.207:950-956,1995)
から得られた2つのエキソントラップ間で観察された。Rab26様エキソントラッ
プは、RT-PCTにより連結され(図1の転写物J)、コード配列はRab26に対して
タンパク質レベルで94%(83/88)同一であった。例えば、以下の選択されたエ
キソントラップとデータベースにおける配列とのアラインメントを示す図2を参
照のこと。エキソントラップL48741によりコードされる配列(配列番号1)なら
びにC.Elegans(配列番号2)、E.coli(配列番号3)、およびHaemophilus(配
列番号4)に由来するN-アセチルグルコサミン-6-リン酸デアセチラーゼのアラ
インメント。翻訳されたネトリン様エキソントラップの1つ(Genbank受託番号L
75917)(配列番号5)に対して整列された、ネトリン-1(配列番号7)、ネト
リン-2(配列番号6)、およびUNC-6(配列番号8)に由来するEGF反復が示され
る。第2のネトリン様エキソントラップ(Genbank受託番号L75916)(配列番号
9)、ネトリン-1(配列番号11)、およびネトリン-2(配列番号10)に由来する
配列のアラインメントが示される。翻訳されるRab26様RT-PCR産物(Genbank受託
番号L48770-L48771)(配列番号12)およびラットRab26(配列番号13)のアライ
ンメント。Neisseria gonorrhoeae由来のpilB転写リプレッサー由来の配列(配
列番号15)、C.elegans由来のコスミドF44E2.6によりコードされるコンピュータ
ー分析により予測された配列(配列番号17)、酵母由来のYCL33C遺伝子産物(Ge
nbank受託番号P25566)(配列番号16)、およびHaemophilus由来の転写リプレッ
サー(配列番号18)に対して整列された、エキソントラップL48792によりコード
される配列(配列番号14)が示される。ピリオドは、ギャップがアラインメント
を維持するためにタンパク質配列に挿入された位置を示す。
エキソントラップと個々の転写物とを相関させるために、cDNAライブラリース
クリーニングおよびPCRに基づくアプローチを使用して、選択されたエキソント
ラップを含む転写配列をクローニングした。RT-PCRを使用して、2つのエキソン
トラップがデータベースにおける類似した配列に対して相同性を有する場合に、
個々のエキソントラップを共に連結させた。単一のエキソントラップのみが利用
可能な場合、3'RACEまたはcDNAライブラリースクリーニングを使用して、さらな
る配列を得た。エキソントラップおよびクローニング産物由来の配列を使用して
、対応する転写単位の位置、および可能であればその方向をマップした。
少なくとも8つのエキソン由来の配列を含む6つの独特のエキソントラップは
、最も動原体性のP1クローン、94.10Hにおいて転写単位に由来することが示され
た(図1の転写物A)。6つのエキソントラップを連結する2kbのcDNAは単離さ
れ、そして8kbの転写物にハイブリダイズすることが示された。さらなるハイブ
リダイゼーション研究は、この遺伝子が動原体からテロメアに指向され、少なく
とも6kbの転写物がP1コンティグの動原体側の配列に由来することを示した。広
範な相同性は、翻訳されたcDNAと種々のタンパク質キナーゼとの間に観察された
;しかし、エキソントラップL48734においてコードされる保存HRDLKPENモチーフ
(配列番号71)ならびに部分的cDNAの存在は、それがセリン/スレオニンキナー
ゼをコードすることを示唆する(van-der-Geerら、Ann.Rev.Cell Bio.10:251-33
7,1994)。
cDNAは、異なる94.10Hエキソントラップ(Genbank受託番号L48738)に由来す
る配列を用いて単離され、そして対応する転写単位の位置および方向が決定され
た。2つのcDNA種は、プローブとしてエキソントラップL48738を用いて得られ、
2つの種間の相同性は、エキソントラップに含まれる109の塩基から生じるもの
のみであった。オリゴヌクレオチドプローブを用いて、転写単位は、テロメア方
向から動原体方向へ26-6DIS DNAマーカー近くの位置にマップされた;しかし、c
DNA種のうち1つしかP1コンティグにマップされなかった(図1の転写物B)。
これらのデータに基づいて、第2のcDNA種は、P1コンティグの外側の領域、恐ら
く16p13.3のさらに動原体側に位置する重複26-6PROXマーカーに由来したようで
ある(Gillespieら、Nuc.Acids Res.18:7071-7075,1990)。
110.1F P1クローンは、ATP6C遺伝子に加えて少なくとも2つの遺伝子を含む。
タンパク質データベースを調べるためにBLASTXを用いて、有意な相同性が、エキ
ソントラップL48741によりコードされる配列と、C.elegans(Wilsonら、前出、19
94)、E.coli(Plumbridge,Mol.Microbiol.3:505-515,1989)、およびHaemophilu
s(Flelschmannら、Science 269:496-512,1995)に由来するN-アセチルグルコサ
ミン-6-リン酸デアセチラーゼ(nagA)タンパク質との間で観察された。nagAタン
パタ質の翻訳されるエキソントラップに対するアラインメントは、複数の保存さ
れる領域の存在を明らかにし(図2)、これはエキソントラップがヒトnagA遺伝
子由来の配列を含むことを示唆する。nagA様転写物由来の付加的配列は3'RACEを
用いてクローニングされ、そして転写単位は、図1のNotI部位2と3との間の領
域にマップされた。この遺伝子はテロメアから動原体に配向され、NotI部位2は
RACEクローンの3'UTRに存在する(図1の転写物C)。
110.1F P1クローンと53.8B P1クローン(図1の転写物D)との間の重複領域
にマップする、2つのさらなるエキソントラップ(Genbank受託番号L75916およ
びL75917)は、ニワトリネトリン(Kennedyら、Cell 78:425-435,1994;Serafi
niら、Cell 78:409-424,1994)およびC.elegans UNC-6タンパク質(IShiiら、N
euron 9:873-881,1992)と相同性を有することが示された(図2および20A)。
エキソントラップL75917によりコードされる配列は、ネトリンおよびUNC-6タ
ンパク質に見出されるC末端のほとんどの上皮増殖因子(EGF)反復と有意な相
同性を有することが示された(図2および20A)。エキソントラップL75917は、
ニワトリネトリン-2の第3の上皮増殖因子(EGF)反復に由来する配列と98%同
一の配列、およびネトリン-1の同じ領域に由来する配列と90%同一の配列をコー
ドする。ネトリン様トラップL75916は、ネトリン-1およびネトリン-2のC末端ド
メインに含まれる配列と43%同一の、ネトリンのより分岐したC末端ドメインに
由来する配列をコードする(図2および20A)。この領域は、UNC-6とネトリンと
の間で最も保存されておらず、配列はネトリン-1とネトリン-2との間で63%保存
され、そしてネトリン-2とUNC-6との間で29%保存される(Serafiniら、前出)
。
ネトリンは、軸索誘導において中心的な役割を果たすことが示されている化学
屈性因子ファミリーを定義する。軸索成長円錐は、細胞外マトリクスまたは細胞
表面に存在する局所的キュー(cue)、ならびに拡散性の化学誘因物質および化学
忌避物質の形態における長期のキューの両方によりそれらの標的に誘導される(
GoodmanおよびShatz、Cell 72:77-98,1993;KeynesおよびCook、Curr.Opin.Neu
robiol.5:75-82,1995)。
ニワトリネトリン-1およびネトリン-2は、脊髄交連軸索を発達させるための化
学誘因物質として機能し(Serafiniら、Cell 78:409-424,1994;Kennedyら、Ce
ll 78.425-435,1994)、ネトリン-1はまた滑車運動性軸索に対する化学忌避物
質として作用する(ColamarinoおよびTessier-Lavigne,Cell 81:621-629,1995
)ことが示されている。比較分析は、ニワトリネトリンと、環状(circumferenti
al)細胞遊走および軸索誘導に必要とされるC.elegans UNC-6タンパク質との間の
広範な相同性の存在を明らかにした(Hedgecockら、Neuron 4:61-85,1990;Ish
iiら、Neuron 9:873-881,1992)。より最近では、2つのDrosophilaネトリン、
NETAおよびNETBが記載され、そして滑車軸索誘導ならびに運動性ニューロンのそ
れらの標的筋肉への誘導に必要とされることが示されている(Harrisら、Cell 1
7:217-228,1996;Mitchellら、Cell 17:203-215,1996)。これらの研究は、化
学誘因性および化学忌避性タンパク質のネトリンファミリーが無脊椎動物と脊椎
動物との間で保存されることを示す。
ネトリン様エキソントラップを含むゲノム間隔は、この遺伝子からのさらなる
配列情報を得、そしてエキソントラップが偽遺伝子に由来する可能性を除外する
ために配列決定された。53.8BゲノムP1クローンを用いた予備研究において、ネ
トリン様エキソントラップは、6kbのXhoIフラグメントにマップされた。例えば
、関連DNAマーカーが水平線の上に示され、NotI部位(N)がこの線の下に示さ
れる、図18を参照のこと。ATP6C、CCNF、およびnagA転写単位の位置および方向
は、以前に記載され(Gillespieら、Proc.Natl.Acad.Sci.,USA 88:4289-4293,1
991;Krausら、Genomics 24:27-33,1994;Burnら、Genome Research 6:525-537
,1996)、そしてゲノム間隔の下に示される。ネトリン遺伝子を含む2つのP1ク
ローンは、この間隔の模式図の下に示される。6.8kbのゲノム配列の位置は、P1
クローンの下で拡大される。6.8kbのゲノム配列における2つのエキソントラッ
プの位置もまた示される。
6kbフラグメントおよび隣接する3.5kbのXhoIフラグメントはサブクローニン
グされ、そしてこれを使用して、53.8B P1クローンからランダムショットガンラ
イブラリーをスクリーニングした。ハイブリダイゼーションにより陽性であった
サブクローンは、正および逆ベクタープライマーを用いて配列決定された。計88
のサブクローンがこの様式で配列決定された。
さらなる配列が、内部プライマーならびに親XhoIフラグメント由来の末端配列
を用いて得られた。7倍の全重複性を有する計6.8kbのゲノム配列が配列決定さ
れた。配列決定された領域のGC含有量は68.9%であると見出され、これは350kb
さらにテロメア側に位置する、PKD1遺伝子に由来する53kbのゲノム配列について
観察された62.8%よりわずかに高い(The American PKD1 Consortium,1995,前
出;Burnら、1996、前出)。
コンピューター分析は、推定エキソンを同定するために行われた。GRAIL2分析
は、データベース分析を用いて6.8kbのゲノム配列内に6つのエキソンを予測し
、1つのエキソン(エキソン1)以外の全てが、ニワトリネトリンに対して相同
性を有する配列をコードすることを示した。図19Aは、53.8B P1に由来する6.8kb
のゲノム配列におけるコード配列のGRAIL2分析を示し、灰色の目盛りはGC含有量
を示し(白から薄い灰色はGCリッチであり、そして灰色から黒はATリッチである
)、垂直の囲みは予測されたエキソンの相対的な質(quality)を示す。推定され
たエキソンの図は垂直の囲みの上に示され、薄く着色した囲みは「優秀」(>80
%の
確率)のスコアを有するエキソンを示し、そして濃く着色した囲みは「良」(>
60%の確率)のスコアを有するエキソンを示す。エキソントラップL75917および
L75916(それぞれ、左から右)の位置は、GRAIL2予測エキソンの上に示される。R
T-PCR産物およびゲノム配列の比較に基づく遺伝子の構造は上段に示され、ゲノ
ム配列におけるエキソンの位置は、エキソンの上の数により示される。5'および
3'非翻訳領域もまた示される。
さらに、6.8kbのゲノム配列は、Pustell DNA/タンパク質マトリクスを用いて
ニワトリネトリンのタンパク質配列と比較された。ゲノム配列(6つ全てのフレ
ームに翻訳される)は、最小相同性が50%にセットされ、そしてウインドウ(win
dow)が20にセットされた、RAM250マトリクスを用いて図19Bのニワトリネトリン-
2と比較された。相同性領域は太い斜線により示される。5つのエキソンはこの
分析により予測され、第1のGRAIL2予測エキソンのみが真実であると思われなか
った。2つのエキソントラップ由来の配列もまたGRAIL2により予測された;しか
し、注目すべき差異があった(図19Aを比較のこと)。エキソントラップL75917
に存在する配列の予測において、GRAIL2は、エキソンの5'末端に付加的55bpを含
んだ。エキソントラップL75916に存在する2つのエキソンのうち第1のエキソン
はGRAIL2により予測されなかったが、一方GRAIL2は、このエキソントラップに存
在する第2のエキソンの5'および3'末端に付加的塩基を付加した。
発現配列タグ(Expressed Sequence Tag)(EST)データベースの検索は、ヒトネ
トリン遺伝子に由来するいずれのESTの存在も明らかにしなかった。ヒトネトリ
ンメッセージもまた、50を超える異なる成人および胎児組織由来のmRNAを用いた
ノーザンおよび/またはRNAドットブロット分析により検出されなかった。これ
はhNETが極端に制限された発現パターンを有し、発現する場合、低い発生量で存
在することを示唆する。しかし、hNETに対して有意な相同性を有する2つのマウ
スESTが、脳ライブラリーおよび全胎児ライブラリー(それぞれ、Genbank受託番
号W59766およびAA048205)から同定された。このマウスESTは、計477bpの隣接配
列が示される重複配列を含む。この477bpの隣接配列は、ヒトネトリンcDNAの5'
末端に整列し、そして47bpの5'UTRおよびN末端143アミノ酸をコードする配列を
含む。推定ヒトおよびマウスタンパク質配列の比較は、2つのタンパク質が89.
5%(128/143)同一であることを示した。
ヒトネトリン転写物の特徴づけ
ネトリン遺伝子の構造を確認するために、RT-PCRは、予測されたエキソンから
設計されたプライマーを用いて行われた。予測されたヒトネトリンはネトリン-1
よりネトリン-2に対してわずかにより相同性であると思われ(それぞれ、57%対
54%)、そしてネトリン-2はニワトリの脊髄において発現されるので、成人ヒト
脊髄ポリA+RNAはテンプレートとして利用された。RT-PCR産物は、プライマー対
の一部のみで得られた;しかし、これでさえもネスティドプライマーおよび2回
のPCRの使用を必要とし、低い収率は、ハイブリダイゼーションおよび産物を視
覚化するための放射性標識プローブを使用することを必要とした。いくつかの場
合におけるRT-PCR産物の低い収率および欠如は、産物の高GC含有量(70〜80%)
に起因した。PCT反応物中最終濃度2.5Mまでのベタインの添加は、劇的にRT-PCR
産物の収率および純度を改善することが見出された(国際公開第WO 96/12041;R
eevesら、(1994)Am.J.Hum.Genet.55:A238;Baskaranら、(1996)Genome Rese
arch 6:633-638)。
RT-PCR産物の組み立ては、提案された開始メチオニンの上流にインフレームの
停止コドンを有する1743bpのオープンリーディングフレーム(ORF)を明らかに
した。開始コドンおよび停止コドンの確認において、209bpの5'UTRおよび22bpの
3'UTRがクローニングされた。しかし、それぞれのUTR由来の付加的配列はクロー
ニングされなかった。なぜならRT-PCR実験の目的は、予測されたタンパク質配列
を確認することだけであり、そして完全長cDNAを組み立てることではないからで
ある。イントロン-エキソン境界の位置は、ゲノム配列およびRT-PCRクローンの
比較に基づいて決定された(図19A)。
1.9kbのcDNAであるhNETは、テンプレートとして脊髄cDNAおよびベタインを加
えた標準的PCR条件を用いたネスティッドPCRを行うことによりクローニングされ
た。ヒトネトリンタンパク質は、サイズが580アミノ酸であると予測され、ネト
リンファミリーの共通のドメイン構造は保存されていた。図20Aにおいて、ニワ
トリネトリンおよびUNC-6配列がヒト配列とマッチする位置はピリオドにより示
され、一方アラインメント間に導入されるギャップはハイフンにより示される。
配列アラインメント上の矢印は、記載されたような(Serafiniら、Cell 78:409-
424,1994)ラミニンVIおよびVドメインならびにC末端領域(C)の境界を示
す。シグナル配列(S)もまた示される。V-1、V-2、およびV-3は、ドメインV
を構成するEGFドメインのそれぞれを表す。hNETコード配列およびその予測され
たタンパク質産物は、図4Aおよび4Bに示される。図4Cおよび4Dは、5'および3'UT
R配列を含む完全長hNET cDNAを示す。
いくつかの方面の証拠は、本明細書中に記載されるヒトネトリン遺伝子が偽遺
伝子である可能性に対して不利な決定を下す。第1に、コード領域におけるいず
れのエキソンも停止コドンを含まない。第2に、記載された全遺伝子構造は、ネ
トリン/UNC-6ファミリーの他のメンバーと比較した場合に、高度に保存されて
いる。第3に、ノーザンおよびRNAブロット分析におけるシグナルの欠如にもか
かわらず、成熟転写物はRT-PCRにより単離された。最後に、高度に保存される、
マウスESTデータベースにおける配列が同定されている。ひとまとめにして考え
ると、これらのデータは、制限された発現パターンを有する新規のヒトネトリン
遺伝子が同定されたことを示す。
ヒトネトリンは、神経再生において著しい役割を有し得る。ネトリンはそれ自
体で軸索成長を促進しないが、それらは軸索成長の方向付けにおいて役割を果た
す。成長促進活性と軸索誘導キューとの組み合わせは、指向された神経再生に必
要な要件である。
このような制限された発現パターンを有する遺伝子をクローニングする能力は
、ネトリン遺伝子がcDNA選択または直接的ライブラリースクリーニングを用いて
同定されるようではないので、エクソントラッピング手順の長所のうちの1つを
示す。これらの結果は、大きなゲノムコンティグ由来の配列を同定し、そしてク
ローニングするために、種々のアプローチを使用する必要性を強調する。
エキソントラッピング結果は、動原体からテロメア方向でLCNIとD16S291マー
カーとの間に位置する、PKD1遺伝子座における新規のATP結合カセット(ABC)輸
送体が存在することをさらに示す。エキソントラップ配列を用いたデータベース
検索は、マウスABC1およびABC2遺伝子に対する相同性を示す(Lucianiら、前出
、
1994)。マウスABC1およびABC2のヒト相同体はクローニングされ、そしてヒト第
9染色体にマップされた(Lucianiら、前出、1994)。cDNA選択およびSAmple SE
quencing(SASE)からの配列と共に、トラップされたエキソンに由来する配列を使
用して、重複部分的cDNAクローンを回収した。
ABC輸送体に対する相同性を有する7つのエキソントラップは、P1クローン30.
1F、64.12C、および96.4Bから単離された。ABC3遺伝子によりコードされる付加
的配列は、エキソントラップから設計されたカスタムプライマー(表IIおよびII
I)を用いて、RT-PCR(胎盤および脳RNAをテンプレートとして)ならびにライブ
ラリーPCR(市販の肺cDNAライブラリーをテンプレートとして用いて)により得
られた。3つのエキソントラップ(L48758、L48759、およびL48760)は、30.1F
、64.12C、および96.4BのP1クローン間の重複領域から得(転写物F、図1)、
一方第4のエキソン(L48753)は、排他的に、79.2A P1クローンにマップする(
図1の転写物E)。 転写物FによりコードされるhABC3輸送体に由来するエキソントラップは、マ
ウスABC1およびABC2遺伝子のRドメインに対する相同性を有する配列をコードす
る。Rドメインは、CFTRにおける保存領域に対する比較に基づいて調節的な役割
を果たすと考えられる。現在までのところ、ABC1、ABC2、およびCFTRのみが、R
ドメインを含むことが示されている(Lucianiら、前出、1994)。
さらに、転写物F由来の3つのエキソントラップを連結する1.1kbのRT-PCR産
物(このRT-PCR産物はノーザンブロットにおいて7kbメッセージを検出する)が
得られた。dbESTデータベースの検索に基づいて、この領域に由来するcDNAが得
られ、エキソントラップL75924およびL75925に由来する配列はI.M.A.G.E.Conso
rtium(Lennonら、前出)からのcDNA 49233に含まれた。同じ転写単位における
両方のクローニング試薬の存在は、RT-PCRを用いて確認された。
ATP結合カセット(ABC)輸送体または輸送ATPは、原核生物および真核生物両
方の細胞における、広範な種々の基質の細胞膜を横切った輸送を担う100を超え
るタンパク質ファミリーを含む(Higgins,C.F.,Annu.Rev.Cell.Biol.8:67-113
,1992;Higgins,C.F.Cell 82:693-696,1995)。ABC輸送体スーパーファミリ
ーに属するタンパク質は、強力な構造類似性により連結される。代表的には、AB
C輸送体は、4つの保存ドメイン、基質特異性を与え得る2つの疎水性ドメイン
(Payneら、Mol.Gen.Genet.200:493-496,1985;Footcら、Naturc 345:255-258
,1990;Andersonら、Science 253:202-205,1991;Shustikら、Br.J.Haematol.
79:50-56,1991;Covitzら、EMBO J.13:1752-1759,1994)、ならびにATP結合お
よび加水分解に関連する2つの高度に保存されたドメイン(Higgins、前出、199
2)を有する。ABC輸送体は、細胞内外へのおよび亜細胞性膜を通した分子の一方
向性輸送を支配する(Higgins、前出、1992)。それらの基質は、重金属(Ouell
etteら、Res.Microbiol.142:737-746 1991)からペプチドおよび完全サイズのタ
ンパク質(Gartnerら、Nature Genet.16-23 1992)に及ぶ。
真核生物細胞において、ABC輸送体は、4つ全てのドメインを含む単一の大き
な対称的タンパク質、または疎水性およびATP結合ドメインをそれぞれ含む2つ
のより小さなポリペプチドの会合から生じたダイマーのいずれかとして存在する
。このマルチマー構造形態の例は、ヒトTAPタンパク質(Kellyら、Nature 355:6
41
-644,1992)および機能的PMP70タンパク質(Kamijoら、J.Biol.Chem.265:4534-
40 1990)である。このマルチマー構造はまた、非常に多くの原核生物ABC輸送体
において見出される。疎水性領域は、6つまでの膜貫通にわたるセグメントから
なる。各ATP結合ドメインは独立して操作し、そして機能的に等価であってもな
くてもよい(Keremら、Science 245:1073-80 1989;Mimmackら、Proc.Natl.Acad
.Sci.,USA 86:8257-61 1989;Cuttingら、Nature 346:366-369 1990;Kerppola
ら、J.Biol.Chem.266:9857-65,1991)。
現在までにヒトにおいて同定されたABC輸送体のいくつかは、臨床的に重要で
あることが示された。例えば、P-糖タンパク質の過剰発現は、腫瘍における複数
の薬物耐性の原因である(Gottesmanら、Ann.Rev.Biochem.62:385-427 1993)。
古典的な嚢胞性線維症(CF)ならびに精管の両側性先天的疾患(CBAVD)の大き
な割合の症例は、嚢胞性線維症膜貫通コンダクタンスレギュレーター(CFTR)、
ABC輸送体における変異により引き起こされる(Keremら、前出;Cuttingら、前
出)。ABC輸送体における欠損はまた、ツエルヴェーガー症候群(Gartnerら、前
出)および副腎脳灰白質ジストロフィー(Mosserら、Nature 361:726-730 1993
)に関与した。
新規のABC輸送体サブグループの2つのメンバー(マウスABC1およびABC2)は
、CFTRの調節Rドメインに類似したドメインを含むことが示された(Lucianiら
、前出、1994)。機能的に、マウスABC1タンパク質は、アポトーシス細胞のマク
ロファージの飲み込みにおいて役割を果たすことが示されたが(Lucianiら、EMB
O J.16:226-235,1996)、一方ABC2の機能は未知のままである。3つ全てのタン
パク質は、いくつかの潜在的なリン酸化部位を含む大きな荷電領域を含む(Kere
mら、前出;Lucianiら、前出、1994)。この領域内の荷電アミノ酸残基は、正お
よび負の電荷を交替させたブロックにおいて連続的に配置される。
これらの特定のABC輸送体(hABC3を含む)の共通の特性は、2つのATP結合カ
セット間の大きなリンカードメインの存在である。リンカードメインにおける非
常に多くの極性残基および潜在的なリン酸化部位の存在は、この領域がCFTRのR
ドメインのものに恐らく類似した調節的役割を果たし得ることを示唆する(Kerem
ら、前出)。さらに、この4つのタンパク質はまた、保存リンカードメイン内
に疎水性領域であるHH1ドメイン(Lucianiら、前出、1994)を含む。hABC3およ
びマウスABCのHH1ドメイン間での配列レベルの相同性はほとんどないが、それら
は構造的に保存されていると思われ、各ドメインがβシートコンホメーションを
有すると予測される。これらのタンパク質の類似性は、それらが全て、最初にAB
C1およびABC2により定義された同じABCサブファミリーに属することを示唆する
(Lucianiら、前出、1994)。ABC1およびABC2のヒト相同物をコードする遺伝子
は、それぞれ、q22〜q31およびq34でヒト第9染色体にマップされた(Lucianiら
、前出、1994)。
同じサブファミリーのメンバーであるにもかかわらず、ABC1、ABC2、およびhA
BC3は異なる機能的役割を有するようである。ABC1、ABC2、およびhABC3の膜貫通
およびリンカードメインに存在する差異は、独特の基質特異性をそれぞれ与え得
る。例えば、原核生物および真核生物両方のABC輸送体の膜貫通ドメインにおけ
る変化および変異は、基質特異性を変えることが示された(Payneら、前出;Foo
teら、前出;Covitzら、前出)、一方CFTRのRドメインに対する変化はそのイオ
ン選択性を変えることが示された(Andersonら、前出;Richら、Science 253:20
5-207 1991)。ABC1、ABC2、およびhABC3の発現パターンにおける差異はまた、
これらのタンパク質が機能的に異なり得ることを示唆する。マウスABC1およびAB
C2は、広範な種々の成体および胚の組織において種々のレベルで発現されること
が示され、ABC1発現の最も高いレベルは妊娠した子宮および単球細胞に富んだ領
域において示されたが、一方ABC2発現の最も高いレベルは脳において示された(
Lucianiら、前出、1994;Lucianiら、前出、1996)。対照的に、hABC3は、肺に
おいて優先的に発現され、著しく低いレベルの発現が脳、心臓、および膵臓にお
いて示される。
ABC1、ABC2、およびhABC3間の構造的差異を除けば、3つのタンパク質が異な
る細胞集団において類似した機能的役割を果たすことは常に可能である。現在ま
でに、マウスABC2についての機能は提案されていない。しかし、最近のデータは
、ABC1がアポトーシスを受ける細胞の飲み込みに必要とされることを示すが、AB
C1機能の基礎となる分子機構は知られていない(Lucianiら、前出、1996)。hAB
C3がABC1に類似した様式で機能する場合、宿主防御に関与する肺性マクロファー
ジ
により発現され得る。
ABC輸送体は、小さなイオンから大きな多糖およびタンパク質に及ぶ基質につ
いて記載された。肺における高レベルの発現に基づいて、hABC3の基質は、肺機
能(イオンまたは多糖輸送を含む)において絶対必要な役割を果たし得る。さら
なる手がかりは、肺におけるhABC3発現のより精密な試験により提供され得る。
これらの研究は、hABC3発現を担う肺細胞の同定ならびにhABC3の亜細胞性局在の
決定を含む。hABC3 cDNAの同定およびクローニングは、それが潜在的なRドメイ
ンを含みそして肺において最も高いレベルで発現されるので、嚢胞性線維症につ
いての関与を有し得る。hABC3が肺機能において絶対必要な役割を果たすのであ
れば、hABC3基質特異性の調節または変化は、CFに対する著しい治療的関与を有
し得る。
いくつかのcDNAは、GeneTrapper直接選択システムおよびABC1に対して相同性
を有する最も5'側のトラップされたエキソンコード配列(トラップされたエキソ
ンL48747)から設計されたオリゴを用いてクローニングされた。最も5'側のエキ
ソントラップから設計されたカスタムオリゴヌクレオチドを用いて、正常ヒト肺
cDNAライブラリーからGeneTrapperシステムで単離された最も長いクローンは、
長さが5719bpであった(ABCgt.1)。さらなるcDNAクローン(ABC.5)は、プロー
ブとして放射性標識された1.1kbのRT-PCR産物(ABC3-12)を用いて単離された(
図15)。ABC3 cDNAの5'末端は5'RACEを用いてさらに特徴付けられ、いくつかのR
ACE産物は、開始メチオニンの上流に複数のインフレーム停止コドンを含んだ。
従って、本発明は、マウスABC1およびABC2遺伝子に対して相同性を有する新規
のヒトABC遺伝子、ならびにC.elegansに由来するコスミドC48B4.4(Wilsonら、
前出)によりコードされると予測される配列を提供する。6.4kbのcDNAは、hABC3
輸送体について組み立てられた。組み立てられたcDNAは、1705アミノ酸をコード
する5116ヌクレオチド長オープンリーディングフレームを含み、予測されたタン
パク質は191kDaの分子量を有した。提案された開始メチオニンは、クローンABCg
t.1の5'末端の50bp上流である。
P1クローン109.8Cおよび47.2Hに由来する5つのトラップされたエキソンは、
ヒトリボソームタンパク質L3 cDNAに対する相同性を有する配列を含むことが示
され、ハイブリダイゼーション研究は、L3様遺伝子が動原体からテロメアに指向
されることを示した(図1の転写物L)。リボソームL3遺伝子産物は、大リボソ
ームサブユニットにおけるペプチジルトランスフェラーゼ活性に必須の5つのタ
ンパク質のうちの1つである(SchulzeおよびNierhaus、EMBO J.1:609-613,198
2)。驚くべきことではないが、L3アミノ酸配列は、種間で高度に保存されてい
る。約98%のタンパク質配列同一性を示す哺乳動物L3遺伝子は、ヒト(Genbank
受託番号X73460)、マウス(Peckhamら、Genes Dev.3:2062-2071,1989)、ラッ
ト(KuwanoおよびWool、Biochim.Biophys.Res.Comm.187:58-64,1992)、および
ウシ(Simonicら、Biochem.Biophys.Acta 1219:706-710,1994)から特徴付けら
れた。トラップされたエキソンと報告されたヒトリボソームタンパク質L3 cDNA
との間の累積パーセント同一性は、ヌクレオチドレベルで74%(537/724)であっ
た。
新規のリボソームL3タンパク質サブタイプ、SEM L3をコードする完全長cDNAが
単離および配列決定された(図11)。この遺伝子は現在RPL3Lと呼ばれ、そしてG
enbank受託番号U65581と指定されている。推定タンパク質配列は407アミノ酸長
であり、そしてこれら自体が高度に保存されている、他の公知の哺乳動物L3タン
パク質に対して77%の同一性を示す。ヒトゲノムDNAのハイブリダイゼーション
分析は、この新規の遺伝子が単一コピーであり、そして組織特異的発現パターン
を有することを示唆する。
以前に同定されたヒトL3遺伝子および新規のヒトRPL3Lの発現パターンは、複
数の組織ノーザンブロットを用いて決定された。ヒトL3遺伝子は、膵臓における
最も高い発現と共に全ての組織において偏在的な発現パターンを示した。対照的
に、本明細書中に記載される新規の遺伝子は、膵臓における低い発現レベルと共
に、骨格筋および心臓組織において強力に発現される。この新規の遺伝子RPL3L
(リボソームタンパク質L3様)は、染色体16p13.3上のPKD1およびTSC2遺伝子近
くの遺伝子が豊富な領域に位置する。
RPL3Lタンパク質は、以前に記載された核コードミトコンドリアタンパク質よ
り上記の細胞質性リボソームタンパク質に密接に関連する(Graackら、Eur.J.Bio
chem.206:373-380,1992)。RPL3Lにおける高度に保存された核局在配列の存在は
、
これが新規の細胞質性L3リボソームタンパク質サブタイプを示し、そして核コー
ドミトコンドリアタンパク質を示さないという仮説をさらに支持する。
さらに、L3様遺伝子のテロメア側に位置する遺伝子由来のエキソントラップ(
Genbank受託番号L48792)が得られた(図1の転写物M)。転写物Mによりコー
ドされる配列は、Neisseria gonorrhoeaeに由来するpilB(Tahaら、EMBO J.7:43
67-4378,1988)、ならびにコンピューターにより予測された、C.elegansに由来
するコスミドF44E2.6によりコードされる17.2kDaタンパク質(Wilsonら、前出)
に対して相同性を有することが示された。
エキソントラップL48792由来の配列を用いて、600bpの部分的cDNAが単離され
、そして対応遺伝子が動原体からテロメアへ指向されることが決定された。1.3k
bのメッセージは、ノーザンブロットにおいてこのcDNAにより検出された。部分
的cDNAと仮定17.2kDaタンパク質との間に保存される配列はまた、Neisseria gon
orrhoeaeに由来するpilBタンパク質(Tahaら、前出)、酵母に由来する仮定的19.
3kDaタンパク質(Genbank受託番号P25566)、およびHaemophilusに由来する線毛
転写調節リプレッサー(Fleischmannら、Science 269:496-512 1995)において
保存された(図2)。pilBタンパク質は、ヒスチジンキナーゼセンサーに対して
相同性を有し、そしてNeisseria gonorrhoeaeにおけるピリン産生の抑制におい
て役割を果たすことが示された(Tahaら、前出、1988;Tahaら、Mol.Microbiol.
5:137-148,1991)。しかし、pilB、転写物M、ならびにC.elangans、酵母、お
よびHaemophilusの配列間で保存される残基は、pilBに由来する保存ヒスチジン
キナーゼドメインを含まない(Tahaら、前出、1991)。これらの知見は、転写物
Mにおける保存領域がpilBの提案されたヒスチジンキナーゼセンサー活性と独立
した機能を有することを示唆する。
109.8Cクローンと47.2H P1クローンとの間の重複領域に由来するさらなるエキ
ソントラップは、ヒトLLRep3配列(Slynnら、Nuc.Acids Res.18:681,1990)を
含むことが示された。ハイブリダイゼーション研究は、LLRep3配列(図1の転写
物K)がsazDとL3様遺伝子との間に位置することを示した。最も高い遺伝子密度
の領域は、このクローニングされた間隔のテロメア末端、特に、TSC2とD16S84と
の間の領域にあるようであり、最低5つの遺伝子(転写単位K、L、およびM、
sazDおよびhERV1)がこの領域にマップする。
以前に記載された肝臓再生のラット増大剤(Hagiyaら、Proc.Natl.Acad.Sci.,
USA 91:8142-8146,1994)に対してヌクレオチドレベルで86%の同一である(17
0/197)エキソントラップもまた、この領域にマップされた。ALRは、損傷した肝
臓組織の増殖を増大させるが、休止している肝臓に対して効果がない増殖因子で
ある。研究は、ラットALRが肝切除後に肝細胞再生を増大させ得ることを実証し
た。
このALR様エキソントラップはまた、最近記載されたhERV1遺伝子(これは、酵
母ERV1(Lisowskyら、前出)に対する機能的相同物をコードする)に由来する配列
を含むことが示された。
468bpのcDNAであるhALRは、ヒトALR遺伝子から得られている(図13)。ALR配
列は、ラットALRタンパク質に対して84.8%同一であり、そして94.1%類似する
、119アミノ酸のタンパク質をコードする(図14)。
ヒトALRのクローニングは、変性性肝臓疾患の処置に著しく関与する。例えば
、生物学的に活性なラットALRは、ラットALR cDNAを発現するCOS-7細胞から産生
されている(Hagiyaら、前出)。従って、組換えhALRは、損傷した肝臓の処置に
使用され得た。さらに、hALRを発現する構築物は、慢性肝臓疾患を処置するため
の遺伝子治療において使用され得る。
43のトラップされたエキソンは、タンパク質またはDNAデータベースにおける
配列に対して有意な相同性を有さず、dbESTにおいて観察されたエキソントラッ
プに由来する配列を含むEST(発現配列タグ)でもなかった。これらの新規のエ
キソントラップに由来する配列を含むESTが存在しないことは、さらなる分析の
ためのエキソントラップを選択するための基準のうちの1つがこのデータベース
におけるESTの存在であったので、驚くべきことではない。これらのトラップさ
れたエキソンは、真実の産物を示すようである。なぜなら、多くの場合、それら
は、異なるP1クローンからおよび隣接エキソンとの組み合わせにおいて複数回ト
ラップされたからである。
本発明は、第16染色体に由来する独特のエキソン配列を含む単離された核酸で
ある新規のヒト遺伝子を含む。本明細書中に記載された配列は、転写マッピング
のための価値のある資源を提供し、そして少なくとも2つの遺伝性疾患の原因で
ある遺伝子に富む間隔についての配列準備テンプレートのセットを作成する。
従って、本発明は、ヒトネトリン(hNET)、ヒトATP結合カセット輸送体(hABC3)
、ヒトリボソームL3(RPL3L)、および肝臓再生のヒト増大剤(hALR)ポリペプチ
ドをコードする、単離された核酸を提供する。本発明は、第16染色体に由来する
独特のエキソン配列を含む単離された核酸をさらに提供する。用語「核酸」(ポ
リヌクレオチドとも呼ばれる)は、RNAならびに1本鎖および2本鎖DNA、cDNAな
らびにオリゴヌクレオチドを含む。本明細書中で使用する、句「単離された」は
、天然に生じない形態のポリヌクレオチドを意味する。
本発明のポリペプチドをコードするポリヌクレオチドを単離するという1つの
意味は、当該分野で周知の方法を用いてヒト組織特異的ライブラリーを天然また
は人工的に設計されたDNAプローブでプローブすることである。ヒトネトリン遺
伝子(hNET)、ヒトABC輸送体遺伝子(hABC3)、ヒトリボソームタンパク質L3遺
伝子(RPL3L)、または肝臓再生のヒト増大剤遺伝子(hALR)に由来するDNAプロ
ーブは、特にこの目的に有用である。本発明のポリペプチドをコードするDNAお
よびcDNA分子を使用して、以下により詳細に記載される方法により、ヒト、哺乳
動物、または他の動物供給源に由来する相補的ゲノムDNA、cDNA、またはRNAを得
るか、あるいはcDNAまたはゲノムライブラリーのスクリーニングにより関連する
cDNAクローンまたはゲノムクローンを単離し得る。
本発明は、図3、4、8、11および15に示される配列に由来する単離された核
酸配列(センスおよびアンチセンスオリゴヌクレオチド配列を含む)を含む。hN
ET、hABC3、PRL3L(SEM L3)、およびhALRに由来する配列はまた、異種配列(プロ
モーター、エンハンサー、応答エレメント、シグナル配列、ポリアデニル化配列
などを含む)と結合され得る。さらに、核酸は、安定性、可溶性、結合親和性、
および特異性を変えるように改変され得る。例えば、本発明に由来する配列は、
ヌクレアーゼ耐性ホスホロチオエート、ホスホロアミデートおよびメチルホスホ
ネート誘導体、ならびにNielsenら、Science,254:1497,1991に記載されるよう
に塩基をアミノ酸骨格に共役させることにより形成される「タンパク質核酸(PNA
)」をさらに含み得る。核酸は、α-アノマーヌクレオチドの連結によるか、あ
るいはメチルホスホトリエステルもしくはエチルホスホトリエステルまたはアル
キルホスホールデート連結の形成により誘導体化され得る。さらに、本発明の核
酸配列はまた、検出可能なシグナルを直接的または間接的のいずれかで提供し得
る標識で改変され得る。例示的な標識は、放射性同位体、蛍光分子、ビオチンな
どを含む。
一般的に、本発明による核酸操作は、例えば、Sambrookら、Molecular Clonin
g,A Laboratory Manual第2版(Cold Spring Harbor,NY,1989)またはAusubel
ら、Current Protocols in Molecular Biology(Greene Assoc.,Wiley Interscie
nce,NY,NY,1992)に開示されるような当該分野で周知の方法を使用する。
核酸の例は、ヒトネトリン、ヒトABC輸送体、ヒトリボソームL3サブタイプ、
または肝臓再生のヒト増大剤ポリペプチドをコードするRNA、cDNA、またはゲノ
ムDNAである。このような核酸は、それぞれ図3、4、8、11および15に示され
るコード配列と実質的に同じコード配列を有し得る。
本発明は、hNET、hABC3、PRL3L(以前はSEM L3)、hALR遺伝子内の、またはそれ
ぞれのcDNA内の配列に対応する単離されたオリゴヌクレオチドをさらに提供し、
これらは単独でまたは共に、真正の発現遺伝子と相同物または他の反復配列とを
区別するために使用され得る。これらのオリゴヌクレオチドは、長さが約12〜約
60ヌクレオチド、好ましくは約18ヌクレオチドであり得、1本鎖または2本鎖で
あり得、そして以下に記載のように標識または改変され得る。
本発明はまた、図3、4、8、11および15に示される核酸と異なるが、同じ表
現型を有する(すなわち、それぞれ図3、4、8、11および15に示される同じア
ミノ酸配列を実質的にコードする)核酸を含む。表現型的に類似した核酸はまた
、「機能的に等価な核酸」と呼ばれる。本明細書中で使用する句「機能的に等価
な核酸」は、本明細書中に開示される核酸と同じタンパク質産物(単数または複
数)を生成する実質的に同じ様式で機能する、わずかでかつ重大でない配列変異
により特徴付けられる核酸を含む。特に、機能的に等価な核酸は、本明細書中に
開示されるかまたは保存的アミノ酸変異を有するタンパク質と同じタンパク質を
コードする。例えば、保存的変異は、非極性残基の別の非極性残基での置換、ま
たは荷電残基の類似した荷電残基での置換を含む。これらの変異は、タンパク質
の3次構造を実質的に変えない変異として当業者により認識される変異を含む。
遺伝コードの縮重により特定のハイブリダイゼーション条件下で本発明の核酸
に必ずしもハイブリダイズしない、ヒトネトリン、ヒトABC3輸送体、ヒトリボソ
ームL3サブタイプ、および肝臓再生のヒト増大剤ポリペプチドをコードする核酸
がさらに提供される。本発明のポリペプチドをコードする好ましい核酸は、図4
、8、11および15に示される実質的に同じアミノ酸配列をコードするヌクレオチ
ドからなる。あるいは、本発明のポリペプチド(単数または複数)をコードする
好ましい核酸は、高いストリンジェンシー条件下で、図3、4、8、11および15
にそれぞれ示される核酸配列の実質的に完全な配列または実質的な部分(すなわ
ち、代表的には、少なくとも12〜60ヌクレオチド)にハイブリダイズする。
本明細書中で使用するハイブリダイゼーションのストリンジェンシーは、ポリ
ヌクレオチドハイブリッドが安定な条件をいう。当業者には公知なように、ハイ
ブリッドの安定性は、ナトリウムイオン濃度および温度の関数である(例えば、
Sambrookら、前出を参照のこと)。
本発明は、RNA転写のプロモーターならびに他の調節配列に作動可能に連結さ
れた単離されたポリヌクレオチドを提供する。本明細書中で使用する句「作動可
能に連結された」は、ポリヌクレオチドとヌクレオチドの調節およびエフェクタ
ー配列(例えば、プロモーター、エンハンサー、転写および翻訳停止部位、なら
びに他のシグナル配列)との機能的関係をいう。例えば、ポリヌクレオチドのプ
ロモーターへの作動的連結は、DNA転写がプロモーターを特異的に認識および結
合するRNAポリメラーゼによりプロモーターから開始され、そしてここでプロモ
ーターがポリヌクレオチドからのRNAの転写を指向するような、ポリヌクレオチ
ドとプロモーターとの間の物理的および機能的関係をいう。
プロモーター領域は、RNAポリメラーゼ認識、結合、および転写開始に十分な
特定の配列を含む。さらに、プロモーター領域は、RNAポリメラーゼの認識、結
合、および転写開始活性を調節する配列を含む。このような配列は、シス作用し
得るか、またはトランス作用因子に対して応答性であり得る。調節の性質に依存
して、プロモーターは、構成的であり得か、または調節され得る。プロモーター
の例は、SP6、T4、T7、SV40初期プロモーター、サイトメガロウイルス(CMV)プロ
モーター、マウス乳房腫瘍ウイルス(MMTV)ステロイド誘導性プロモーター、モ
ロニーマウス白血病ウイルス(MMLV)プロモーターなどである。
ポリヌクレオチドが作動可能に連結され得る、プロモーターおよびクローニン
グ部位の両方を含むベクターは、当該分野で周知である。このようなベクターは
、インビトロおよびインビボでRNAを転写し得、そしてStratagene(La Jolla,CA
)およびPromega Biotech(Madison,WI)のような供給源から市販されている。発
現および/またはインビトロ転写を最適化するために、余分な、潜在的な、不適
切な、代替の翻訳開始コドンまたは転写または翻訳レベルのいずれかで発現を妨
害もしくは低減し得る他の配列を排除するために、クローンの5'および/または
3'非翻訳部分を除去するか、付加するか、または変えることは必要であり得る。
あるいは、コンセンサスリボソーム結合部位は、発現を増強するために開始コド
ンのすぐ5'側に挿入され得る。同様に、同じアミノ酸をコードする代替コドンは
、転写を増強するために、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サ
ブタイプ、または肝臓再生のヒト増大剤ポリペプチドのコード配列の代わりに置
換される(例えば、宿主細胞のコドン優先が採用され得、G-Cリッチドメインの
存在が低減され得るなどである)。
ベクターの例は、種々の真核生物および原核生物宿主における発現のために記
載され、そして遺伝子治療ならびに単純なタンパク質発現のために使用され得る
、当該分野で代表的に使用される、ウイルス(例えば、バキュロウイルスおよび
レトロウイルス)、バクテリオファージ、コスミド、プラスミド、真菌ベクター
、および他の組換えビヒクルである。
ポリヌクレオチドは、当該分野で周知の方法を用いてベクターゲノムに挿入さ
れる。例えば、挿入物およびベクターDNAは、互いに対形成し、そしてリガーゼ
を用いて共に接合され得る、各分子上の相補的末端を作成するために、適切な条
件下で制限酵素と接触され得る。あるいは、合成核酸リンカーは、制限酵素処理
されたポリヌクレオチド末端に連結され得る。これらの合成リンカーは、ベクタ
ーDNA中の特定の制限部位に対応する核酸配列を含む。さらに、終止コドンおよ
び適切な制限部位を含むオリゴヌクレオチドは、挿入のために、例えば以下のい
くつかまたは全てを含むベクターに連結され得る:選択マーカー遺伝子(例えば
、
哺乳動物細胞における安定または一過性トランスフェクタントの選択のためのネ
オマイシン遺伝子);高レベル転写のためのヒトCMVの即時初期遺伝子に由来す
るエンハンサー配列/プロモーター配列;mRNA安定性のためのSV40に由来する転
写終結およびRNAプロセシングシグナル;適切なエピソーム複製のためのSV40ポ
リオーマ複製起点およびColE1;多方面のマルチクローニングサイト;ならびに
センスおよびアンチセンスRNAのインビトロ転写のためのT7およびSP6 RNAプロモ
ーター。他の手段は周知であり、そして当該分野で利用可能である。
細菌細胞、酵母細胞、両生類細胞、昆虫細胞、哺乳動物細胞、および他の動物
細胞における発現用に適合した、ヒトネトリン、ヒトABC3輸送体、ヒトリボソー
ムL3サブタイプ、および肝臓再生のヒト増大剤ポリペプチドをコードするポリヌ
クレオチドを含むベクターもまた提供される。ベクターは、その発現を可能にす
るように、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、また
は肝臓再生のヒト増大剤ポリペプチドをコードするポリヌクレオチドに関して位
置する、細菌、酵母、両生類、哺乳動物、または動物細胞におけるポリヌクレオ
チドの発現に必要な調節エレメントをさらに含む。本明細書中で使用する「発現
」は、ポリヌクレオチドがmRNAに転写され、そしてペプチド、ポリペプチド、ま
たはタンパク質に翻訳されるプロセスをいう。ポリヌクレオチドがゲノムDNAに
由来する場合、発現は、適切な真核生物宿主が選択されるのであれば、mRNAのス
プライシングを含み得る。発現に必要とされる調節エレメントは、RNAポリメラ
ーゼを結合するプロモーター配列およびリボソーム結合のための転写開始配列を
含む。例えば、細菌性発現ベクターは、lacプロモーターのようなプロモーター
および転写開始のためのシャイン-ダルガノ配列および開始コドンAUGを含む(Sa
mbrookら、前出)。同様に、真核生物発現ベクターは、RNAポリメラーゼIIの異
種または同種プロモーター、下流ポリアデニル化シグナル、開始コドンAUG、お
よびリボソームの分離のための終止コドンを含む。このようなベクターは、商業
的に得られるか、または当該分野で周知の方法(例えば、一般的なベクターを構
築するための上記の方法)において記載される配列により組み立てられ得る。発
現ベクターは、本発明のレセプターを発現する細胞を生成するのに有用である。
本発明は、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、ま
たは肝臓再生のヒト増大剤ポリペプチドを組換え的に発現する、形質転換宿主細
胞を提供する。本発明の宿主細胞は、ヒトネトリン、ヒトABC3輸送体、ヒトリボ
ソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチドをコードするポ
リヌクレオチドで形質転換されている。例は、哺乳動物細胞における発現用に適
合したプラスミドを含む哺乳動物細胞である。プラスミドは、ヒトネトリン、ヒ
トABC3輸送体、ヒトリボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリ
ペプチドをコードするポリヌクレオチド、および本発明のタンパク質の発現に必
要な調節エレメントを含む。
適切な宿主細胞は、細菌、古細菌、真菌、特に酵母、植物細胞、昆虫細胞、お
よび動物細胞、特に哺乳動物細胞を含む。E.coli、B.Subtilis、Saccharomyces
cerevisiae、SF9細胞、C129細胞、293細胞、Neurospora、およびCHO細胞、COS細
胞、HeLa細胞、ならびに不死化哺乳動物骨髄性およびリンパ性細胞株が特に興味
深い。好ましい複製系は、M13、ColE1、SV40、バキュロウイルス、λ、アデノウ
イルス、人工染色体などを含む。多数の転写開始および終結調節領域が単離され
、そして種々の宿主における異種タンパク質の転写および翻訳に効果的であるこ
とが示されている。これらの領域、単離方法、操作様式などの例は当該分野で公
知である。適切な発現条件下で、宿主細胞は、組換え生成されるhNET、hABC3、R
PL 3L(以前はSEM L3)、および/またはhALRの供給源として使用され得る。
本発明のポリペプチドをコードする核酸(ポリヌクレオチド)はまた、組換え
事象によりレシピエント細胞のゲノムに取り込まれ得る。例えば、このような配
列は細胞にマイクロインジェクションされ、それによりhNET、hABC3、RPL3L(以
前はSEM L3)、および/またはhALRをコードする内因性遺伝子、そのアナログま
たは偽遺伝子、あるいはhNET、hABC3、RPL3L(SEM L3)、またはhALRコード遺伝
子に対して実質的な同一性を有する配列の部位での相同組換えをもたらし得る。
他の組換えに基づく方法(例えば、非相同的組換え)または特に、多能性細胞に
おける相同組換えによる内因性遺伝子の欠失もまた使用され得る。
本発明は、本発明の核酸によりコードされる単離されたペプチド、ポリペプチ
ド(単数または複数)、および/またはタンパク質(単数または複数)を提供す
る。本発明はまた、hNET、hABC3、RPL3L(SEM L3)、およびhALR遺伝子によりコ
ードされる配列を有する単離されたポリペプチド、ならびにそれらに由来する6
以上のアミノ酸のペプチドを含む。ポリペプチド(単数または複数)は、生検ま
たは剖検により得られたヒト組織から単離され得るか、または本明細書中に記載
される組換えDNA方法により異種細胞において産生され得る。
本明細書中で使用する用語「単離された」は、細胞成分および/または天然の
インビボ臭境と通常関連する夾雑物を含まないタンパク質分子を意味する。本発
明のポリペプチドおよび/またはタンパク質は、任意の天然に生じる対立遺伝子
変異体ならびにその組換え形態を含む。本発明のポリペプチドは、当業者に周知
の種々の方法を用いて単離され得る。
本発明のタンパク質の単離および精製に利用可能な方法は、沈殿、ゲル濾過、
およびクロマトグラフィー方法(分子ふるい、イオン交換、および例えば、hNET
、hABC3、RPL3L(SEM L3)、および/またはhALR特異的抗体もしくはリガンドを
用いたアフィニティクロマトグラフィーを含む)を含む。他の周知の方法は、De
utscherら、Guide to Protein Purification:Methods in Enzymology第182巻(A
cademic Press,1990)に記載される。精製される本発明のポリペプチドが組換
え系において生成される場合、組換え発現ベクターは、付加的アミノ末端または
カルボキシ末端アミノ酸をコードする付加的配列を含み得;これらの余分なアミ
ノ酸は、固定化抗体を用いたイムノアフィニティー精製または固定化リガンドを
用いたアフィニティー精製のための「タグ」として働く。
hNET、hABC3、RPL3L(SEM L3)、またはhALR特異的配列を含むペプチドは、タ
ンパク質分解切断を用いた(例えば、当該分野で周知のトリプシンのようなプロ
テアーゼおよび臭化シアンのような化学的処理により)、上記の単離された大き
なhNET、hABC3、RPL3L(SEM L3)、またはhALRポリペプチドに由来し得る。ある
いは、長さが60残基までのペプチドは、市販のペプチド合成機を用いてミリグラ
ム量で日常的に合成され得る。
本発明のポリペプチド(単数または複数)を調製するための手段の例は、当該
分野で周知の方法を用いて適切な宿主細胞(例えば、細菌細胞、酵母細胞、両生
類細胞(すなわち、卵母細胞)、昆虫細胞(すなわち、Drosophila)、または哺
乳動物細胞)において、hNET、hABC3、RPL3L(SEM L3)、および/またはhALRを
コードするポリヌクレオチドを発現し、そして周知の方法を再度用いて発現され
たポリペプチドを回収することである。本発明のポリペプチドは、以下に詳細に
記載される発現ベクターで形質転換された細胞から直接単離され得る。本発明の
ポリペプチド、生物学的に活性なフラグメント、およびその機能的等価物はまた
、化学合成により生成され得る。本明細書中で使用する「生物学的に活性なフラ
グメント」は、活性タンパク質に組み立て得る、図4、8、11、および15におけ
るアミノ酸配列により示されるポリペプチドの任意の部分をいう。合成ポリペプ
チドは、製造者により提供される化学を使用するApplied Biosystems,Inc.モデ
ル430Aまたは431A自動ペプチド合成機(Foster City,CA)を用いて生成され得
る。
以下の句:「組換え的に発現された/生成された」、「単離された」、または
「実質的に純粋な」を有する、本発明の核酸、ポリヌクレオチド、ポリペプチド
、ペプチド、またはタンパク質の改変は、人の手によりこのような形態に生成さ
れ、従ってそれらの天然のインビボ細胞環境から分離されている、核酸、ポリヌ
クレオチド、ポリペプチド、ペプチド、またはタンパク質を含む。この人の介入
の結果として、本発明の組換え核酸、ポリヌクレオチド、ポリペプチド、ペプチ
ド、およびタンパク質は、対応する天然に生じる分子が選択性薬物または化合物
の同定のように有用でない点で有用である。
「実質的な配列相同性」を有する配列は、本発明の核酸と少なくとも約90%の
同一性を共有するヌクレオチド配列;および本発明のポリペプチドと少なくとも
約95%のアミノ酸同一性を代表的に共有するアミノ酸配列、をいうことが意図さ
れる。しかし、スプライス変異体として生じる上記のレベル未満の相同性を含む
か、または保存的アミノ酸置換により、もしくは縮重コドンの置換により改変さ
れるポリペプチドまたは核酸もまた、本発明の範囲内に含まれることが認識され
る。
本発明は、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、ま
たは肝臓再生のヒト増大剤ポリペプチドをコードする核酸配列内に含まれる配列
(例えば、図3、4、8、11、および15にそれぞれ示されるヌクレオチド配列内
に含まれるコード配列)と特異的にハイブリダイズし得るポリヌクレオチドを含
む核酸プローブを提供する。
本明細書中で使用する「核酸プローブ」は、図3、4、8、11、および15に示
される約12〜約60の隣接塩基、好ましくは約18ヌクレオチドを含み、1本鎖また
は2本鎖であり得、そして本明細書中に記載されるように標識または改変され得
るヌクレオチド配列であり得る。構築プローブが由来する好ましい領域は、5'お
よび/または3'コード配列、膜貫通ドメインをコードすると予測される配列、細
胞質ループをコードすると予測される配列、シグナル配列、リガンド結合部位な
どを含む。
cDNAクローンの完全長またはフラグメントはまた、関連遺伝子の検出および単
離のためのプローブとして使用され得る。フラグメントがプローブとして使用さ
れる場合、好ましくはcDNA配列は、cDNAのカルボキシ末端コード部分に由来し、
最も好ましくはcDNA配列の予測された膜貫通ドメインコード部分を含む。膜貫通
ドメイン領域は、例えば、KyteおよびDoolittle(J.Mol.Biol.157:105,1982)の
方法を用いた推定アミノ酸配列の疎水性親水性指標分析に基づいて予測され得る
。
本明細書中で使用する句「特異的にハイブリダイズする」は、ポリヌクレオチ
ドが、それに相補的な核酸配列を認識し、そして相補的塩基対間の水素結合を介
して二重らせんセグメントを形成する能力を含む。核酸プローブ技術は、当業者
に周知であり、そして当業者は、このようなプローブが長さにおいて非常に変化
し得、そしてプローブの検出を容易にするために検出可能な薬剤(例えば、放射
性同位体、蛍光色素など)で標識され得ることを容易に認識する。本発明のプロ
ーブは、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、または
肝臓再生のヒト増大剤ポリペプチドをコードする核酸の存在を検出するのに有用
である。例えば、プローブは、本発明の遺伝子が発現される生物学的組織を位置
付けるためのインサイチュハイブリダイゼーションのために使用され得る。さら
に、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、または肝臓
再生のヒト増大剤ポリペプチドをコードするポリヌクレオチドの核酸に相補的な
合成されたオリゴヌクレオチドは、本発明の遺伝子、それらの関連するmRNAを検
出するための、またはゲノムもしくはcDNAライブラリーの相同性スクリーニング
を用いた関連遺伝子の単離のための、または当業者に周知の増幅技術を用いるこ
とによるプローブとして有用である。
ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、または肝臓再
生のヒト増大剤ポリペプチドをコードするmRNAの任意の部分と特異的に結合して
、mRNAの翻訳を妨げ得る配列を有するアンチセンスオリゴヌクレオチドもまた提
供される。アンチセンスオリゴヌクレオチドは、ヒトネトリン、ヒトABC3輸送体
、ヒトリボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチドをコ
ードするcDNA配列の任意の部分と特異的に結合し得る配列を有し得る。本明細書
中で使用する句「特異的に結合する」は、核酸配列が相補的核酸配列を認識し、
そして相補的塩基対間で水素結合を介してそれと二重らせんセグメントを形成す
る能力を含む。アンチセンスオリゴヌクレオチドの例は、ヌクレオチドの化学的
アナログを含むアンチ七ンスオリゴヌクレオチド(すなわち、合成アンチセンス
オリゴヌクレオチド、SAO)である。
細胞膜を通過させ、そしてヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3
サブタイプ、または肝臓再生のヒト増大剤ポリペプチドをコードするmRNAと特異
的に結合させて、その翻訳および細胞膜を通過し得る受容可能な疎水性キャリア
を妨げることにより、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタ
イプ、またはヒト増大剤ポリペプチドの発現を低減させるのに有効な、アンチセ
ンスオリゴヌクレオチド(SAOC)の量を含む組成物もまた、本明細書中で提供さ
れる。細胞膜を通過し得る受容可能な疎水性キャリアはまた、選択された細胞型
に特異的なレセプターに結合し、そしてそれにより選択された細胞型の細胞によ
り吸収される構造を含み得る。この構造は、細胞型特異的レセプターに結合する
ことが知られているタンパク質の一部であり得る。
本発明は、これらのポリペプチドをコードするmRNAの翻訳を阻害する、合成ア
ンチセンスオリゴヌクレオチド組成物(SAOC)の使用により本発明のポリペプチ
ドの発現レベルを調節する手段を提供する。mRNAを認識し、そして特異的に結合
するように設計された、合成オリゴヌクレオチドまたは他のアンチセンス化学構
造は、DNA、RNA、または化学的に改変された人工核酸の、図3、4、8、11、お
よび15に示されるヌクレオチド配列の部分に相補的であるように構築される。SA
OCは、注射による被験体への投与のために血流において、または研究室での細胞
培養条件において安定であるように設計される。SAOCは、細胞膜を通過させ得る
SAOCの物理的および化学的特性により(例えば、小さな疎水性SAOC化学構造を設
計することにより)、またはSAOCを認識しこれを細胞に輸送する細胞の特異的輸
送系により、細胞膜を通過して、細胞の細胞質に進入し得るように設計される。
さらに、SAOCは、選択された細胞集団内のみでSAOCを結合および吸収する特異
的細胞取り込み機構により認識されるようにSAOCを標的化することにより、特定
の選択された細胞集団のみへの投与のために設計され得る。例えば、SAOCは、前
出で議論されるような特定の細胞型のみに見出されるレセプターに結合するよう
に設計され得る。SAOCはまた、標的mRNA配列を認識し、そして選択的に結合する
ように設計され、これは図3、4、8、11および15に示される配列内に含まれる
配列に対応し得る。SAOCは、標的mRNAに結合し、mRNAの分解(例えば、RNaseI消
化により)を誘導するか、あるいは翻訳調節因子もしくはリボソームの結合の妨
害、または標的mRNAを分解もしくは化学的に修飾するかのいずれかの他の化学構
造(例えば、リボザイム配列もしくは反応性化学基)の含有によりmRNA標的の翻
訳を阻害するかのいずれかにより標的mRNA配列を不活化するように設計される。
SAOCは、mRNA標的に対して指向される場合、このような特性が可能であることが
示されている(Cohenら、TIPS,10:435,1989およびWeintraub,Sci.American,
January 40頁、1990を参照のこと)。
本発明は、受容可能なキャリアならびに単離された精製ヒトネトリン、ヒトAB
C3輸送体、ヒトリボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプ
チド、その活性フラグメント、または精製された成熟タンパク質およびその活性
フラグメント、単独または互いの組み合わせを含む組成物をさらに提供する。こ
れらのポリペプチドまたはタンパク質は、組換え的に得られるか、化学的に合成
されるか、または天然供給源から精製され得る。本明細書中で使用する用語「受
容可能なキャリア」は、標準的な薬学的キャリア(例えば、リン酸緩衝化生理食
塩水溶液、水、およびエマルジョン(例えば、油/水または水/油エマルジョン
)、および種々の型の湿潤剤)のいずれかを含む。
本発明のヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、また
は肝臓再生のヒト増大剤ポリペプチドと特異的反応性を有する抗体もまた提供さ
れる。抗体の活性フラグメントは、「抗体」の定義内に含まれる。本発明の抗体
は、抗原として本発明のタンパク質またはその部分を用いて当該分野で公知の方
法により生成され得る。例えば、ポリクローナルおよびモノクローナル抗体は、
例えば、HarlowおよびLane、Antibodies:A Laboratory Manual(Cold Spring Har
bor Laboratory 1988)に記載されるように、当該分野で周知の方法により生成さ
れ得る。
本発明のポリペプチドは、このような抗体の作製における免疫原として使用さ
れ得る。あるいは、合成ペプチドは(市販の合成機を用いて)調製され、そして
免疫原として使用され得る。天然または合成のhNET、hABC3、RPL3L(SEM L3)、お
よび/またはhALRに由来するペプチドを使用して、hNET、hABC3、RPL3L(SEM L3)
、および/またはhALR特異的免疫応答を誘導する場合、このペプチドは適切なキ
ャリア(例えば、KLH)に簡便に結合され、そして適切なアジュバント(例えば
、フロイントのアジュバント)において投与され得る。好ましくは、選択された
ペプチドは、Tam,Proc.Natl.Acad.Sci,USA.85:5409-5413,1988の方法に実質
的に従ってリジンコアキャリアに結合される。得られた抗体は、一価形態(例え
ば、Fab、Fab2、FAB'、FV)に改変され得る。抗イディオタイプ抗体もまた、公
知の方法を用いて調製され得る。
1つの実施態様において、正常または変異hNET、hABC3、RPL3L(SEM L3)、また
はhALRポリペプチドは、マウスを免疫し、この後それらの脾臓を取り出し、そし
て脾細胞を使用して、当該分野で標準的な技術に従ってミエローマ細胞との細胞
ハイブリッドを形成し、そして抗体分泌細胞のクローンを得るために使用される
。得られたモノクローナル抗体は、hNET、hABC3、RPL3L(SEM L3)、および/また
はhALRタンパク質あるいはhNET、hABC3、RPL3L(SEM L3)、および/またはhALR関
連ペプチドへの特異的な結合についてスクリーニングされる。
別の実施態様において、抗体は、正常または変異hNET、hABC3、RPL3L(SEM L3)
、またはhALR配列への選択的な結合についてスクリーニングされる。hNET、hABC
3、RPL3L(SEM L3)、またはhALRの正常形態と変異形態とを区別する抗体は、ELIS
A、EMIT、CEDIA、SLIFAなどを使用する診断試験(以下を参照のこと)において
使用され得る。抗hNET、hABC3、RPL3L(SEM L3)、またはhALR抗体はまた、亜細胞
および組織化学的局在研究を行うために使用され得る。最後に、抗体は、正常ま
たは
変異のいずれでも、hNET、hABC3、RPL3L(SEM L3)、および/またはhALRポリペプ
チドの機能をブロックするか、あるいは合理的薬物設計研究を行って、(例えば
、抗イディオタイプ抗体アプローチを用いて)インヒビター機能を同定および試
験するために使用され得る。
アミノ酸配列は、それらが対応するポリペプチドの疎水性または親水性ドメイ
ンをコードするか否かを決定するために当該分野で周知の方法により分析され得
る。変化された抗体(例えば、キメラ、ヒト化、CDR接合、または二機能性抗体
)もまた、当該分野で周知の方法により生成され得る。このような抗体はまた、
例えば、Sambrookら、前出ならびにHarlowおよびLane、前出に記載されるハイブ
リドーマ、化学合成、または組換え法により生成され得る。抗ペプチドおよび抗
融合タンパク質抗体の両方が使用され得る(例えば、Bahouthら、Trends Pharma
col.Sci.12:338,1991;Ausubelら、前出を参照のこと)。
本発明の抗体は、本発明のポリペプチドを単離するために使用され得る。従っ
て、抗体は、本発明のポリペプチドの存在の検出、ならびにポリペプチドの局在
、組成、および機能ドメインの構造の分析に有用である。ヒトネトリン、ヒトAB
C3輸送体、ヒトリボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプ
チドの存在を検出するための方法は、抗体のポリペプチドへの結合を可能にする
条件下で細胞とポリペプチドに特異的に結合する抗体とを接触させる工程、細胞
に結合した抗体の存在を検出する工程、およびそれにより細胞における本発明の
ポリペプチドの存在を検出する工程を包含する。このようなポリペプチドの検出
に関して、抗体は、インビトロ診断またはインビボ画像化方法に使用され得る。
サンプル中の標的ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイ
プ、または肝臓再生のヒト増大剤ポリペプチドのインビトロ検出に有用な免疫学
的手順は、検出可能な抗体を使用するイムノアッセイを含む。このようなイムノ
アッセイは、当該分野で周知の、例えば、ELISA、Pandex微量蛍光測定アッセイ
、凝集アッセイ、フローサイトメトリー、血清診断アッセイ、および免疫組織化
学的染色手順を含む。抗体は、当該分野で周知の種々の手段により検出可能にさ
れ得る。例えば、検出可能なマーカーは、抗体に直接的または間接的に結合され
得る。有用なマーカーは、例えば、放射性核種、酵素、蛍光原(fluorogen)、色
素
原、および化学発光標識を含む。
インビボ画像化方法について、検出可能な抗体は被験体に投与され得、そして
抗体の本発明のポリペプチドへの結合は、当該分野で周知の画像化技術により検
出され得る。適切な画像化剤は公知であり、そして例えば、米国特許第4,647,44
7号に記載される、γ線放射放射性核種(例えば、111In、99mTc、51Crなど)な
らびに常磁性金属イオンを含む。放射性核種は、γ線シンチレーション光度測定
、陽電子放射断層撮影法、単一光子放射型コンピューター断層撮影法、およびγ
線カメラ全身画像化により組織画像化を可能にするが、一方常磁性金属イオンは
磁気共鳴画像化による視覚化を可能にする。
本発明は、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、ま
たは肝臓再生のヒト増大剤ポリペプチドをコードする核酸を発現し得るトランス
ジェニック非ヒト哺乳動物を提供する。正常活性が不可能である(すなわち、天
然タンパク質を発現しない)ように変異された、ヒトネトリン、ヒトABC3輸送体
、ヒトリボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチドをコ
ードする核酸を発現し得るトランスジェニック非ヒト哺乳動物もまた提供される
。
本発明はまた、ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ
、または肝臓再生のヒト増大剤ポリペプチドをコードするmRNAに相補的なアンチ
センスmRNA(これは、mRNAにハイブリダイズし、それによりその翻訳を低減する
)に転写されるように配置された、ヒトネトリン、ヒトABC3輸送体、ヒトリボソ
ームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチドをコードする核酸
に相補的なアンチセンス核酸を含むゲノムを有するトランスジェニック非ヒト哺
乳動物を提供する。ポリヌクレオチドは、発現が誘導されるか、または特定の細
胞型に制限され得るように、誘導性プロモーターおよび/または組織特異的調節
エレメントをさらに含み得る。ポリヌクレオチドの例は、図3、4、8、11、お
よび15に示されるコード配列と実質的に同じコード配列を有するDNAまたはcDNA
である。非ヒトトランスジェニック哺乳動物の例は、トランスジェニックウシ、
ヒツジ、ヤギ、ブタ、ウサギ、ラット、およびマウスである。組織特異性決定エ
レメントの例は、メタロチオネインプロモーターおよびT7プロモーターである。
本発明のポリペプチドの生理学的および行動的役割を解明する動物モデル系は
、
ポリペプチド発現が種々の技術を用いて変えられるトランスジェニック動物の作
成により作製される。このような技術の例は、トランスジェニック動物を作製す
るための、マイクロインジェクション、レトロウイルス感染、または当業者に周
知の他の手段による、適切な受精胚へのヒトネトリン、ヒトABC3輸送体、ヒトリ
ボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチドをコードする
核酸の正常または変異バージョンの挿入を含む。例えば、Carverら、Bio/Techno
logy 11:1263-1270,1993;Carvcrら、Cytotechnology 9:77-84,1992;Clarkら
、Bio/Technology 7:487-492,1989;Simonsら、Bio/Technology 6:179-183,19
88;Swanson,Bio/Technology 10:557-559,1992;Velanderら、Proc.Natl.Acad
.Sci.,USA 89:12003-12007,1992;Hammerら、Nature 315:680-683,1985;Krim
penfortら、Bio/Technology 9:844-847,1991;Ebertら、Bio/Technology 9:835
-838,1991;Simonsら、Nature 328:530-532,1987;Pittiusら、Proc.Natl.Aca
d.Sci.,USA 85:5874-5878,1988;Greenbergら、Proc.Natl.Acad.Sci.,USA 88:8
327-8331,1991;Whitelawら、Transg.Res.1:3-13,1991;Gordonら、Bio/Techn
ology 5:1183-1187,1987;Grosveldら、Cell 51:975-985,1987;Brinsterら、
Proc.Natl.Acad.Sci.,USA 88:478-482.1991;Brinsterら、Proc.Natl.Acad.Sci
.,USA 85:836-840,1988;Brinstcrら、Proc.Natl.Acad.Sci.,USA 82:4438-4442
,1985;A1-Shawiら、Mol.Cell.Biol.10(3):1192-1198,1990;Van Der Putten
ら、Proc.Natl.Acad.Sci.,USA 82:6148-6152,1985;Thompsonら、Cell 56:313-
321,1989;Gordonら、Science 214:1244-1246,1981;およびHoganら、Manipul
ating the Mouce Embryo:A Laboratry Manual(Cold Spring Harbor Laboratory
,1986)を参照のこと。
別の技術、トランスジェニック動物においてこれらの遺伝子の変異または正常
バージョンと天然の遺伝子座との相同組換えは、本発明のポリペプチドの発現調
節または構造を変えるために使用され得る(Capecchiら、Science244:1288,198
9;Zimmerら、Nature 338:150,1989を参照のこと)。相同組換え技術は、当該
分野で周知である。相同組換えは、天然(内因性)遺伝子を組換え遺伝子または
変異遺伝子と置換して、天然(内因性)タンパク質を発現し得ないが、例えば、
ヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタイプ、または肝臓再生
のヒト増大剤ポリペプチドの変化した発現を生じる変異タンパク質を発現し得る
動物を作製する。
相同組換えとは対照的に、マイクロインジェクションは、宿主遺伝子を除去す
ることなく宿主ゲノムに遺伝子を付加する。マイクロインジェクションは、内因
性および外因性両方のヒトネトリン、ヒトABC3輸送体、ヒトリボソームL3サブタ
イプ、または肝臓再生のヒト増大剤ポリペプチドを発現し得るトランスジェニッ
ク動物を作製し得る。誘導性プロモーターは、トランスジーンの発現を調節する
ための手段を提供するために核酸のコード領域に連結され得る。組織特異的調節
エレメントは、トランスジーンの組織特異的発現を可能にするためにコード領域
に連結され得る。トランスジェニック動物モデル系は、ポリペプチド応答を活性
化または阻害するリガンド(すなわち、アゴニストおよびアンタゴニスト)の同
定のための化合物のインビボスクリーニングに有用である。
本発明の核酸、オリゴヌクレオチド(アンチセンスを含む)、それを含むベク
ター、形質転換宿主細胞、ポリペプチド、ならびに抗体は、インビトロで化合物
をスクリーニングして、化合物が本発明のタンパク質に対する潜在的なアゴニス
トまたはアンタゴニストとして機能するか否かを決定するために使用され得る。
これらのインビトロスクリーニングアッセイは、本発明のタンパク質の機能およ
び活性に関する情報を提供し、これは本発明のタンパク質との特異的な相互作用
が可能な化合物の同定および設計を導き得る。
本発明のさらに別の実施態様によれば、ヒトネトリン、ヒトABC3輸送体、ヒト
リボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチドに結合する
化合物を同定するための方法が提供される。本発明のタンパク質は、競合的結合
アッセイにおいて使用され得る。このようなアッセイは、多数の化合物の迅速な
スクリーニングに適合し、どの化合物が本発明のポリペプチドに結合し得るかを
、いくらかでもあれば、決定し得る。その後、より詳細なアッセイは、このよう
な化合物が本発明のポリペプチドのモジュレーター、アゴニスト、またはアンタ
ゴニストとして作用するか否かをさらに決定するために、結合することが見出さ
れたそれらの化合物を用いて行われ得る。
本発明の別の実施態様によれば、本発明のポリペプチドを組換え的に発現する
形質転換宿主細胞は試験化合物と接触され得、次いで、その調節効果は、試験化
合物の存在下および非存在下でのヒトネトリン、ヒトABC3輸送体、ヒトリボソー
ムL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチド媒介応答を比較する
ことにより、あるいは試験細胞またはコントロール細胞(すなわち、本発明のポ
リペプチドを発現しない細胞)の化合物の存在に対する応答を比較することによ
り評価され得る。
本明細書中で使用する、本発明のポリペプチドの「活性を調節する」化合物ま
たはシグナルは、本発明のポリペプチドの活性が化合物またはシグナルの非存在
下より化合物またはシグナルの存在下で異なるように、ヒトネトリン、ヒトABC3
輸送体、ヒトリボソームL3サブタイプ、または肝臓再生のヒト増大剤ポリペプチ
ドの活性を変える化合物またはシグナルをいう。特に、このような化合物または
シグナルは、アゴニストおよびアンタゴニストを含む。アゴニストは、ポリペプ
チド機能を活性化する化合物またはシグナルを含む。あるいは、アンタゴニスト
は、ポリペプチド機能を妨げる化合物またはシグナルを含む。代表的には、アン
タゴニストの効果は、アゴニスト誘導タンパク質活性化のブロッキングとして観
察される。アンタゴニストは、競合的および非競合的アンタゴニストを含む。競
合的アンタゴニスト(または競合的ブロッカー)は、アゴニスト結合に特異的な
部位でまたはその近くで相互作用する。非競合的アンタゴニストまたはブロッカ
ーは、アゴニスト相互作用部位以外の部位で相互作用することにより、ポリペプ
チドの機能を不活化する。
以下の実施例は、本発明の範囲を制限することなく本発明を例示することが意
図される。
実施例I:コンティグ組み立て
A.コスミド
複数のコスミドを、YACおよびP1ライブラリーにおける歩行を開始するための
試薬として使用した。クローン16-166N(D16S277)、16-191N(D16S279)、16-198
N(D16S280)、および16-140N(D16S276)を、コスミドライブラリーから以前に単離
した(Lernerら、Mamm.Genome 3:92-100,1992)。コスミドcCMM65(D16S84)、c2
91(D16S291)、cAJ42(ATP6C)、およびcKG8を、プローブとしてクローニング挿入
物(CMM65)または配列特異的オリゴヌクレオチドのいずれかで用いて、総ヒト
コスミドライブラリー(社内で作られたかまたはStratagene,La Jolla,CAによ
る)から回収した。c326コスミドコンティグおよびクローン413C12は、フロー選
別(flow-sorted)第16染色体ライブラリーから生じた(Stallingsら、Genomics
13(4):1031-1039,1992)。c326コンティグは、クローン2H2、77E8、325A11、
および325B10からなった。
B.YAC
コスミド特異的IRSプローブでのグリッド化(gridded)散在性反復配列(Mark
I、Mark II、およびMega-YACライブラリー由来のIRSプール)のスクリーニングは
、以前に記載された(Liuら、Genomics 26:178-191,1995)とおりであった。IR
Sプローブをコスミド16-166N、16-191N、cAJ42、16-198N、325A11、cCMM65、お
よび16-140Nから作った。ビオチン化YACプローブを、各YACに由来するIRS産物の
ニック翻訳(nick-translating)複合体混合物により作製した。十分な複雑度の混
合物は、種々のAluプライマーを用いた全酵母DNAの独立したDNA増幅を行い(Lic
hterら、Proc.Natl.Acad.Sci.,USA 87:6634-6638,1990)、次いで最も多様な産
物を含む適切な反応物を組み合せることにより達成した。
C.P1
染色体歩行実験を、グリッド化P1ライブラリープールを含む単一セットのメン
ブレンを用いて行った(Shepherdら、前出、1994)。グリッド化フィルターは、
Dr.Mark Leppertおよびユタ大学the Utah Center for Human Genome Researchの
the Technology Access Sectionにより親切に提供された。P1グリッド化メンブ
レンを、1セットの第16染色体コスミド(上記を参照のこと)およびそれらが同
定されたようなP1クローンに由来する末端プローブを用いてスクリーニングした
。RNA転写物およびバブル-PCR産物の両方を、末端プローブとして利用した。
D.プローブ
放射性標識転写物を、ファージRNAポリメラーゼT3、T7、およびSP6に対するテ
ンプレートとして制限酵素消化コスミドまたはP1(AluI、HaeIII、RsaI、TaqI)
を用いて作製した。T3およびT7プロモーターエレメントは、コスミド由来テンプ
レートに存在したが、一方T7およびSP6プロモーター配列は、P1に基づくテンプ
レートに含まれた。転写反応を、[αP32]-ATP(Amersham,Arlington Heights,I
L)の存在下で製造者(Stratagene,La Jolla,CA)により推奨されるように行っ
た。
バブル-PCR産物を、制限酵素消化P1(AluI、HaeIII、RsaI、TaqI)から合成した
。適切な突出およびリン酸化5'末端を有するバブルアダプターを、本質的にYAC
について記載されるように(Rileyら、Nuc.Acids Res.18:2887-2890,1990)、
消化P1 DNAに連結した。バブルアダプター配列に由来するユニバーサルベクトレ
ット(vectorette)プライマーの配列は、5'-GTTCGTACGAGAATCGCT-3'(配列番号67
)であり、そして12のより少ない5'ヌクレオチドを有するRileyおよび協力者の
ものとは異なった。短縮されたベクトレットプライマーのTmは、ベクターに由来
するプロモーター配列(SP6、T7)に由来する対形成アンプリマー(amplimer)の
それとより密接にマッチした。所望のバブル-PCR産物を、放射性標識前にゲル精
製した(Feinbergら、Anal.Biochem.132:6-13,1983;FeinbergおよびVogelstei
n、Anal.Biochem.137:266-267,1984)。
全ての末端プローブの特異性を、単一セットのグリッド化P1フィルター配列上
でのそれらの使用前に決定した。放射性標識プローブを、推奨されるように(Li
fe Tcchnologies Inc.,Gaithersburg,MD)Cot1 DNAに予めアニールし、次いで1
0〜20ngの以下の各DNA:プローブを作成するために使用されたクローニングされ
たゲノムテンプレート;1つ以上の非関連のクローニングされたゲノムDNA;ク
ローニングされたベクター(挿入物なし);およびヒトゲノムDNAが結合した、
ナイロンメンブレンの小片にハイブリダイズさせた。
ハイブリダイゼーションを、CAK溶液(5×SSPE、1%SDS、5×デンハルト溶
液、100mg/mLのトルラRNA)中で65℃で一晩行った。個々の末端プローブは、5
×105cpm/mLの濃度で存在した。ハイブリダイズされたメンブレンを、0.1×SSC/
0.1%SDSの最終ストリンジェンシーまで65℃で洗浄した。ハイブリダイゼーショ
ン結果は、オートラジオグラフィーにより視覚化された。それらのそれぞれのク
ローニングされたテンプレートに強固にハイブリダイズされたが、一方非関連の
クローニングされたDNA、ベクターDNA、またはゲノムDNAにハイブリダイズしな
いプローブを同定し、そしてこれを使用してグリッド化P1フィルターをスクリー
ニングした。
配列されたP1プールに対するハイブリダイセーションを、複数のプローブが同
時に使用されたことを除いて、ナイロンメンブレン小片について記載(上記)さ
れたように行った。陽性クローンを同定し、100mmプレート(LB+25mg/mLカナマ
イシン)あたり200〜500cfuの密度でプレートし、82mm HATFメンブレン(Millipo
re,Bedford,MA)に釣り上げ、ハイブリダイゼーションのために処理し(Sambro
okら、前出)、次いで複合体プローブ混合物で再スクリーニングした。
各プール由来の単一の陽性クローンを選択し、そしてマスタープレートに再度
プレートした。コロニー精製されたゲノムP1クローンおよびその対応するプロー
ブを同定するために、複数のP1 DNAドットブロットを調製し、そして個々の放射
性標識プローブにそれぞれハイブリダイズさせた。全てのハイブリダイゼーショ
ンは、染色体16p13.3参照プローブ(例えば、cAJ42)ならびに独自に標識された
P1 DNAプローブを含んだ。
実施例II:エキソントラッピング
ゲノムP1クローンを、PstIでの消化、BamHI/BglIIでの二重消化、または限定
量のSau3AIでの部分的消化によりエキソントラッピング実験のために調製した。
消化されたP1DNAをBamHI切断し、そして脱リン酸化したベクター、pSPL3Bに連結
したが、一方PstI消化P1 DNAをPstI切断した脱リン酸化ベクター、pSPL3Bにサブ
クローニングした。
連結を、50ngのベクターDNAおよび消化P1 DNAの1、3、または6質量等価物
を用いて3連で行った。形質転換を、一晩の16℃でのインキュベーション後に行
い、形質転換物の1/10および1/2をLB(アンピシリン)プレートにプレートした
。37℃で一晩の増殖後、コロニーを、最も高い形質転換効率(「挿入物なし」連
結コントロールとの比較に基づいて)を有するプレートをこそぎ、そしてアルカ
リ溶解法を用いてミニプレップした。挿入物を含むpSPL3Bの比率を調べるために
、ミニプレップの小部分をHindIII(これはマルチクローニングサイトの各側でp
SpL3Bを切断する)で消化した。
実施例III:RNA調製
約10μgの残存ミニプレップDNAをエタノール沈殿し、100μlの滅菌PBSに再懸
濁し、そしてBioRad GenePulserエレクトロポレーターを用いて約2×106個のCO
S-7細胞(0.7mlの氷冷PBS中)にエレクトロポレーションした(1.2kV、25μFお
よび200Ω)。エレクトロポレーションされた細胞を、氷上で10分間インキュベ
ートした後、10mlの予め暖めた完全DMEMを含む100mm組織培養ディッシュへそれ
らを添加した。
細胞質RNAを、トランスフェクションの48時間後に単離した。トランスフェク
トされたCOS-7細胞を、0.25%トリプシン/1mM EDTA(Life Technologies Inc.,G
aithersburg,MD)を用いて組織培養ディッシュから取り出した。トリプシン処理
細胞をDMEM/10%FCSで洗浄し、そして1μlのRNAsin(Promega,Madison,WI)を
補充した400μlの氷冷TKM(10mM Tris-HCl(pH7.5)、10mM KCl、1mM MgCl2)に
再懸濁した。20μlの10%Triton X-100を添加した後、細胞を氷上で5分間イン
キュベートした。核を、4℃で5分間l200rpmでの遠心分離により除去した。30
マイクロリットルの5%SDSを上清に添加し、細胞質RNAをフェノール/クロロホ
ルム/イソアミルアルコール(24:24:1)を用いた3回の抽出によりさらに精製し
た。細胞質RNAをエタノール沈殿させ、そして50μlのH2Oに再懸濁した。
逆転写およびPCRを、市販のエキソントラッピングオリゴヌクレオチド(LifeT
echnologies Inc.,Gaithersburg,MD)を用いて記載されたように(Churchら、
前出、1994)、上記で調製した細胞質RNAで行った。得られたCUA尾部化(tailed)
産物を、製造者(Life Technologies Inc.,)により推奨されるようにpAMP10に
ショットガンサブクローニングした。各連結由来のランダムクローンを、2次PC
Rプライマー(Life Technologies Inc.,)を用いたコロニーPCRにより分析した
。
pAMP10/エキソントラップを含むミニプレップDNAを、製造者の説明書に従って
EasyPrep集合体またはQIAwell8システム(それぞれ、Pharmacia,Pistcataway
,NJおよびQiagen Inc.,Chatsworth,CA)を用いたアルカリ溶解により一晩培養
物から調製した。トラップされたエキソンを含むDNA産物を、177bpの「ベクター
のみ」のDNA産物との比較に基づいて、配列決定のために選択した。
実施例IV:配列決定
DNA配列決定を、Pharmacia ALFおよびApplied Biosystems 377PRISM自動化DNA
シーケンサー(Piscataway,NJおよびFoster City,CA)を用いて行った。DNA配
列をSequencher DNA分析ソフトウェア(Genecodes,Ann Arbor,MI)を用いて整
列した。DNAおよびタンパク質データベース検索を、BLASTN(Altschulら、J.Mol.
Biol.215:403-410,1990)およびBLASTX(Altschulら、前出、1990;Gishら、Nat.
Genet.3266-272,1993)プログラムを用いて行った。SASE配列を、BLAST(Alts ch
ulら、前出、1990;Gishら、前出、1993)およびFASTA(Lipmanら、Science 227:1
435-1441,1985)検索を処理することにより分析した。タンパク質配列を、MacVe
ctor(Oxford Molecular Group,Cambell,CA)、BCM Launcher(Smithら、Genome
Research 6:454-462,1996)、ClustalW(Thompsonら、Nucleic Acids Res.22:467
3-4680,1994)、およびPSORT(Nakniら、Genomics 14:897-911,1992)を用いて分
析した。
実施例V:RT-PCR、RACE、SASE、およびcDNA単離
(上記で)決定された配列に基づいて、2つのオリゴヌクレオチドプライマー
(表II)を、Oligo4.0(National Bioscienccs Inc.,Plymouth,MN)を用いて各エ
キソントラップのために設計した。
どの組織特異的ライブラリーを転写物またはcDNAについてスクリーニングすべ
きか決定するために、RT-PCR反応および/またはPCR反応を、各エキソントラッ
プのために設計されたオリゴヌクレオチドプライマー(上記)を用いて、異なる
組織由来RNAおよび/またはcDNAライブラリーをそれぞれテンプレートとして用
いて行った。
次いで、エキソンから設計したオリゴヌクレオチド(表II)を、1つ以上の以
下の陽性選択フォーマットにおいて使用して、対応する組織特異的cDNAライブラ
リーをスクリーニングした。
RT-PCR実験について、第1のオリゴヌクレオチドをセンスプライマーとして使
用し、そして第2のオリゴヌクレオチドをアンチセンスプライマーとして使用し
た。RT-PCRを、成人脳および胎盤由来のポリA+RNAを用いて記載されたように(K
awasaki、In PCR Protocols:A Guide to Methods and Applications,Innisら編
、Academic Press,San Diego,CA,21-27頁、1990)行った。全てのPCR産物を、
製造者(Promega,Madison,WI)により記載されるようにpGEM-Tベクターを用いて
クローニングした。
配列を選択されたエキソントラップの3'側にクローニングするために、cDNA末
端の迅速な増幅(RACE)を、記載されるように(Frohman,PCR Met.Appl.4:S40-
S58,1994)行った。3'RACE実験において、第1のオリゴヌクレオチドを、外部
プライマーとして使用し、そして第2のオリゴヌクレオチドを内部プライマーと
して使用した。
Genetrapper cDNA陽性選択システムのために、第1のオリゴヌクレオチドプラ
イマーをビオチン化し、そして直接選択に使用し、一方第2のオリゴヌクレオチ
ドは修復に使用した。
エキソントラッピングに加えて、クローニングコンティグもまた、この間隔に
由来するゲノムP1クローン(Dackowskiら、Genome Res.6:515-524,1996)を用
いて、本質的に記載されるような(Parimooら、Anal.Biochem.228:1-17 1995)c
DNA選択を用いてスクリーニングした。他のコーディング配列を、SAmple SEquen
cing(SASE)により得た。
SASEを、遺伝子同定のための機能的ゲノム方法として行った。簡単には、個々
のP1に由来するDNAをSau3Aで部分的に消化し、そして3kbフラグメントをpBluesc
riptKS+プラスミド(Stratagene,La Jolla,CA)にサブクローニングした。サ
ブクローンを両端から配列決定して、P1クローンに半分ランダムに由来する配列
を作製した。
実施例VI:ヌクレオチド配列分析
hNET:ランダムショットガンライブラリーを、本質的に記載されるように(Ande
rssonら、(1994)Anal.Biochem.218:300-308)、ランダムに剪断したP1 DNAをpAM
P10ベクター(Life Technologies Inc.,Gaithersburg,MD)にサブクローニング
することにより、53.8B P1クローン(図18)から調製した。P1 DNAを、噴霧器
(Hudson RCI,Temecula,CA)を用いてランダムに剪断した。ライブラリーを6
kbのXhoIフラグメント(これは、ネトリンコードエキソントラップを含むことが
示された(図18))で最初にスクリーニングした。その後、ライブラリーを、配
列決定のためのさらなるクローンを得るために、隣接3.5kbのXhoIフラグメント
でスクリーニングした。陽性クローンを、以前に記載されたように(The Americ
an PKD1 Consortium(1995)Hum.Mol.Genet.4:575-582)、正および逆ベクタープ
ライマーを用いて配列決定した。
ゲノム配列を、Sequencher(GeneCodes,Ann Arbor,MI)を用いて編集し、そし
て組み立てた。コード領域を、ゲノム配列(全てのリーディングフレームにおい
て翻訳される)とニワトリネトリンとを比較する、GRAIL2プログラム(Uberbach
erおよびMural(1991)Proc.Natl.Acad.Sci.,USA 88:11261-11265;Xuら、(1994
)Genet.Eng.N.Y.16:241-253)のワールドワイドウェブバージョンおよびMacVec
tor(Oxford Molecular Group,Cambell,CA)Pustell DNA/タンパク質マトリクス
分析を用いて予測した。データベース検索を、BLASTN(Altschulら(1990)J.Mol.B
iol.215:403-410)およびBLASTX(Altschulら、1990、前出;GishおよびStates(19
93)Nat.Genet.3:266-272)を用いて行った。
RT-PCR:成人(脳、心臓、腎臓、白血球、肝臓、肺、リンパ芽球腫細胞株、胎
盤、脾臓、および精巣)および胎児(腎臓および脳)の両方のcDNAライブラリー
を、記載されたように(Van Raayら、1996、前出)、PCRによりネトリンcDNAの
存在について予めスクリーニングした。ネスティッドRT-PCRを利用して、ネトリ
ン遺伝子に由来する転写配列をクローニングした。簡単には、脊髄ポリA+RNA(C
lontech,Palo Alto,CA)を、記載されたように(Kawasaki,1990「PCR Protoc
ols:A Guide to Methods and Appllcations」(M.A.Innis、D.H.Gelfand、J.J.Sn
insky、およびT.J.White編)、21-27頁、Academic Press,Inc.,San Diego)ラン
ダムプライマーを用いて逆転写した。
PCRのためのプライマー(表IV)を、ゲノム配列分析から予測されたエキソン
に基づいて設計し、そしてこれを用いて脊髄RNAを増幅した。なぜなら脊髄は、
低レベルのニワトリネトリンを発現することが以前に示されているからである(
Serafiniら、前出)。ネスティッドPCRは、ヒト脊髄RNAからRT-PCR産物を検出
することが必要とされた。脊髄RNAをランダムプライマーを用いて逆転写し、そ
して1次PCRを、遺伝子モデルから設計されたプライマー(表IV)を用いて、2.5
Mベタイン(Sigma Chemical Co.,St.Louis,MO)の存在下で行った。次いで、1
次PCR反応物をI:20に希釈し、そして2次PCRを、再度ベタインの存在下でネステ
ィッドプライマー(これも遺伝子モデルから設計された)を用いて、1μLの希
釈1次反応物で行った。PCR反応物における最終濃度2.5Mのベタインの含有は、
ヒトネトリンRT-PCR産物の純度および収率を劇的に増大させた(例えば、国際公
開WO 96/12041;Reevesら、(1994)Am.J.Hum.Genet.55.A238;Baskaranら、(1
996)Genome Rcsearch 6:633-638を参照のこと)。
RT-PCR産物を、製造者により推奨されるようにpGEM-T(Promega,Madison,WI)
を用いてサブクローニングした。得られたRT-PCRクローンを、ABIダイターミネ
ーター化学(Perkin Elmer,Foster City,CA)およびABI 377自動化シーケンサ
ー(Perkin Elmer,Foster City,CA)を用いてベクタープライマーおよび内部
プライマーを用いて配列決定した。複数の配列アラインメントを、ClustalW(Tho
mpsonら、(1994)Nucleic Acids Res.22:4673-4680)を用いて行った。
RT-PCR産物の配列分析は、hNETが少なくとも6つのエキソンを含むことを示し
た。RT-PCRデータは、4番目の予測されたエキソンがヒトネトリン遺伝子におい
てイントロンにより実際に裂かれ、そして2つのエキソンとして存在することを
示す。RT-PCRエキソンのうち3つは、最初のエキソントラップと同一であること
が示された。余分なエキソンを除いて、この遺伝子モデルは、RT-PCR産物とほぼ
同一である。cDNAコード配列、推定タンパク質産物、および完全長配列は、それ
ぞれ、図4A〜4Cに示される。
ノーザンブロット分析:ゲノムおよびRT-PCRプローブを放射性標識し(Feinbe
rgおよびVogelstein,Anal.Biochem.132:6-13,1983)、そしてこれを使用して
、脊髄を含む異なる神経組織由来のRNAの一団を含む、種々の成人組織由来のRNA
を含むノーザンブロット(Clontech,Palo Alto,CA)をプローブした。さらに
、50の異なる成人および胎児組織に由来するRNAを含むヒトRNA Master Blot(Cl
ontech,Palo Alto,CA)を、製造者により推奨されるようにスクリーニングし
た。
hABC3:ヒト肺cDNAライブラリー(LTI,Gaithersburg,MD)を、マウスABC1に対
して相同性を有する最も5'側のトラップされたエキソンであるトラップされたエ
キソンL48757から設計された、捕獲および修復オリゴヌクレオチド(それぞれ、
5'-CATTGCCCGTGCTGTCGTG-3'(配列番号52)および5'-CATCGCCGCCTCCTTCATG-3'(配
列番号53))を用いて、GeneTrapperシステム(LTI,Gaithersburg,MD)でスク
リーニングした。直接的cDNAライブラリースクリーニングもまた、プローブとし
てRT-PCRクローンを用いて行った。5'RACE(Frohman,M.A.in Methods Enzymol
.(J.N.AbelsonおよびM.I.Simon編)340-356頁,Academic Press,San Diego,CA
1993)を使用して、ABC3転写物からさらなる5'配列を単離した。
ノーザンブロット分析:ABC3 cDNAの3'非翻訳領域(UTR)に由来する679bpフ
ラグメントを、ランダムプライミング(Feinbergら、前出、1983)により放射性
標識し、そしてこれを用いて、製造者により推奨される条件下で複数の組織ノー
ザンブロット(Clontech,Palo Alto,CA)をプローブした。
新規のABC輸送体のコード配列の同定:ABC3と呼ばれる、新規のATP結合カセッ
ト(ABC)輸送体の遺伝子は、16番染色体上のPKDI遺伝子座にマップされた(Bur
nら、Genome Res.6:525-537,1996)。hABC3遺伝子に由来する8つのエキソンを
、エキソントラッピングを用いて30.1F、64.12C、および96.4B P1クローンから
得た。これは、図16を参照のこと。上部にhABC3遺伝子周辺のゲノム間隔を示し
、NotI部位、DNAマーカー、およびキロベース(kb)での距離また示す。hABC3遺
伝子由来の配列を含む間隔に由来するゲノムP1クローンを、ゲノムマップの下に
示す。hABC3 cDNAの相対位置をP1クローンの下に提供し、選択されたcDNA、トラ
ップされたエキソン、RT-PCRクローン、およびcDNAを示す。付加的hABC3配列の
単離に使用されるトラップされたエキソンおよびRT-PCRクローンを標識した。ク
ローンABCgt.1の列における不連続性は、別にスプライシングされるエキソンの
不在を示す。
これらのトラップされたエキソンのうち7つは、BLASTX解析(Altschulら、前
出、1990;Gishら、前出、1993)に基づいてマウスABC1およびABC2に対して相同
性を有する配列をコードし、トラップされたエキソンL48758、L48759、およびL4
8760に由来する配列が最も高い相同性を有した。トラップされたエキソンL48760
によりコードされる配列はまた、ゲノム配列から予測されるCaenorhabditis ele
gans ABC輸送体に対して相同性を有した(Wilsonら、前出)。
cDNA選択は、ABC3遺伝子の5'末端近くにマップされる単一の261bp cDNAクロー
ンを生じた。L48760と同様に、このクローンは、仮定C.elegansABC輸送体に対し
て相同性を有する配列をコードした。30.1F P1クローンからのSASE結果の最初の
分析は、164反応物のうち4つがABC1およびABC2に対して相同性を有する配列を
コードすることを示した。SASEデータと最後のhABC3cDNAとの後の比較は、さら
なる7つの配列決定反応物がABC3遺伝子に由来するコード配列を含むことを示し
た。計1.6kbのABC3コード配列を、SASEデータと整列させた。hABC3遺伝子の5'末
端由来の3.5kbのみのコード配列が30.1F P1クローンにマップする点で、これはS
ASE分析の45%適用範囲レベルを示す。
新規のABC輸送体のcDNAの組み立ておよび分析:2つの相補的アプローチを使
用して、完全長hABC3 cDNAを組み立てた。第1に、RT-PCRを利用して、トラップ
されたエキソン、選択されたcDNA、およびSASEデータを連結した。第2に、cDNA
ライブラリースクリーニングを、直接選択ならびに放射性標識されたプローブを
用いて行った。
トラップされたエキソンL48757、L48758、L48760、およびL75924から設計され
たプライマーを用いて、3.3kbのコード配列を含む3つのRT-PCR産物をクローニ
ングした(表Iおよび図16)。さらなるRT-PCRプライマーを、選択されたcDNAと
SASEデータとの間の同一性領域から設計した(表I)。900bpのRT-PCRクローンを
、トラップされたエキソンに由来するプライマーと共に後者のプライマーを用い
て得た。全部で、4.2kbのコード配列を、RT-PCRを用いて得た。
いくつかのcDNAを、GeneTrapper直接選択システムおよびABC1に対して相同性
を有する配列をコードする最も5'側のトラップされたエキソン(トラップされた
エキソンL48747)から設計されたオリゴを用いてクローニングした。GeneTrappe
rシステムで単離された最も長いクローンは長さが5719bpであった(ABCgt.1)(
図8)。このcDNAは、コンセンサスポリアデニル化−ポリA尾部の20bp上流に切
断部位を有する792bpの3'非翻訳領域を含む。さらなるcDNAクローン(ABC.5)を
、放射性標識された1.1kbのRT-PCR産物(ABC3-12)をプローブとして用いて単離
した(図16)。ABC3 cDNAの5'末端を5'RACEを用いてさらに特徴付け、いくつ
かのRACE産物は、開始メチオニンの上流に複数のインフレーム停止コドンを含ん
だ。
配列分析は、クローンABCgt.1がRT-PCRクローンおよびcDNAクローンABC.5にお
いて見出される147bpの配列を欠くことを示した。付加的な147bpセグメントは、
これがオープンリーディングフレームを中断しない点で、別のスプライシングの
結果のようである。両方の転写集団の存在は、別のスプライシングされるエキソ
ンに隣接するプライマーを用いたPCRにより確認された。
6.4kbのcDNAは、hABC3輸送体について組み立てられた。組み立てられたcDNAは
、1705アミノ酸をコードする5116ヌクレオチド長のオープンリーディングフレー
ムを含み、予測されたタンパク質は191kDaの分子量を有する。提案された開始メ
チオニンは、クローンABCgt.1の5'末端の50bp上流である。開始メチオニン周囲
の配列は10位置のうち6位置のみでKozak配列とマッチするが(Kozak,J.Cell Bi
ol.115:887-903,1991)、機能に重要であることが示されている2つの位置(-3
のAおよび+4のG)は、hABC3において保存される。hABC3 cDNAは、コンセンサ
スポリアデニル化/ポリA域の20bp上流の切断部位を有する792bpの3'UTRを含む
。
6.8kbの転写物をノーザンブロットにおいて3'UTR cDNAプローブにより検出し
、最も高レベルの発現が肺において、より少ない量が脳、心臓、および膵臓にお
いて検出される。有意に低いレベルの発現が、より長い暴露時間後に胎盤および
骨格筋において観察された。ABC3転写物は、肝臓でも腎臓でも検出されなかった
。
RPL3L(SEM L3):最も長いcDNAは、長さが1548ヌクレオチドである(図11)。3
つ全てのcDNAは、48ヌクレオチドの5'非翻訳領域を含む最も長いcDNAを有する12
24ヌクレオチドのオープンリーディングフレーム(ORF)を有する。7位のイン
フレーム停止コドンの後に、Kozak開始配列CCACCATGT(配列番号68)(Kozak,前
出)が続く。3つのcDNAの各3'UTRは長さが異なり、そしてコンセンサスポリアデ
ニル化切断部位を欠く。
最も長いcDNAを、ヒト、ウシ、およびマウスリボソームL3遺伝子と比較した。
ヌクレオチドレベルで、RPL3L(SEM L3)cDNAとこれらの他のリボソームL3 cDNA由
来のコンセンサスとの間で74%しか同一性がない。これは、ヒト、ウシ、および
マウスL3ヌクレオチド配列間で共有される98%の同一性とははっきりと対照的で
ある。ここで単離されたcDNAの3'UTRと他のL3遺伝子との間で類似性はない。
hALR:配列を、エキソントラップから設計されたプライマー(例えば、外部5'-T
GGCCCAGTTCATACATTTA-3'(配列番号69)および内部5'-TTACCCCTGTGAGGAGTGTG-3'
(配列番号70))を用いて3'RACEによってヒトALR遺伝子からクローニングした
。計468bpがヒトALR遺伝子から得られた(図13)。
実施例VII:アミノ酸配列分析
hNET:hNET cDNAは、少なくとも210bpの5'非翻訳配列、5'開始メチオニンコドン
、3'停止コドン(TGA)を有し、そして長さが580アミノ酸であると予測され(図
4)、ネトリンファミリーの共通ドメイン構造が保存されている(図20A)。全
体的にみて、ヒトネトリンは、ネトリン-1よりニワトリネトリン-2に対してより
高い相同性を有することが見出された(すなわち、56.3%対53.9%)。ネトリン
ファミリーの他のメンバーにあるように、最も大きな保存領域は3つのEGF反復
を含むが、一方C末端ドメインはあまり良く保存されない(図20A)。EGF反復は
、ヒトネトリンならびにニワトリネトリン-1およびネトリン-2間で、それぞれ78
.7%および82.2%同一であり、そしてUNC-6と比較した場合66.3%同一である。
ヒトネトリンならびにニワトリネトリン-1および-2のC末端ドメインは、それぞ
れ41.9%および42.5%同一であり、UNC-6の同じドメインはヒトネトリンに対し
て29.4%しか同一でなかった。全体的にみて、ヒトネトリンは、NETBがVIおよび
V-1ドメインにおいて付加的配列を含む場合、NETAがCドメインにおいて広がり
を含むので(Harrisら、1996、前出;Mitchellら、1996、前出)、Drosophila N
ETAおよびNETBよりニワトリネトリンおよびUNC-6とより密接に似ている。ネトリン遺伝子の構造はDrosophilaとヒトとの間で保存されている
ヒト遺伝子におけるイントロンの位置を、ネトリン/UNC-6ファミリーの全体の
遺伝子構造が保存されているかどうかを決定するためにコードタンパク質と比較
した(図20B)。この分析は、Drosophilaネトリン遺伝子とヒトネトリン遺伝子
との間の著しい類似性を明らかにした。ヒト遺伝子において、エキソン1は、シ
グナルペプチド、ドメインVI、および第1のEGFドメイン(ドメインV-1)を含む
が、一方エキソン2および3はそれぞれ、EGF反復、ドメインV-2およびV-3を
それぞれ含む。エキソン4、5、および6は、Cドメイン部分を含む。Cドメイ
ンにおける付加的イントロンを除いて、このモチーフ/エキソン配置は、Drosop
hilaネトリン遺伝子において保存されている。2つのDrosophilaネトリン遺伝子
のコード領域は高度に保存されていることが示され、各々が相同部位で生じる6
つのイントロンにより分裂される(Harrisら、1996、前出)。6つのDrosophila
イントロンのうち5つの位置は、ヒト遺伝子において保存されることが見出され
た(図20B)。UNC-6遺伝子はコード領域において12のイントロンを含み(Ishii
ら、1992、前出)、これらの5つの位置はヒト遺伝子におけるイントロンの位置
と相関する。興味深いことに、6番目のDrosophilaイントロンは、ヒト遺伝子に
おいて対応物を有さず、そしてUNC-6遺伝子において保存されないDrosophila由
来の唯一のイントロンである。
hABC3:データベース検索は、ABC3ならびにマウスABC1およびABC2間の相同性を
明らかにした(Lucianiら、前出、1994)。マウスABC1およびABC2タンパク質に
加えて、ABC3タンパク質もまた、C48B4.4のコスミド配列によりコードされる推
定C.elegansタンパク質(Wilsonら、前出)に対して相同性を示す。全体的にみ
て、ABC3、ABC1、ABC2、およびC.elegansコスミドC48B4.4によりコードされる配
列は、ATP結合カセット周囲の領域において最も高い相同性を有する(図17)。
しかし、リンカードメイン(Lucianiら、前出、1994)と呼ばれる、第1のATP結
合カセットと第2の膜貫通ドメインとの間の配列を比較する場合、ABC3は、上記
に列挙されたこれらの同じ3つのタンパク質に対して非常に低い相同性を共有す
る(図17のABC3におけるアミノ酸765〜1044)。ABC3のリンカードメインは、ABC
1およびABC2に存在するリンカードメインより短い約200残基である。結果的に、
最適タンパク質アラインメントは、ABC3の917〜959位に位置する、保存HH1疎水
性ドメイン(Lucianiら、前出、1994)のすぐC末端側のABC3配列にギャップを
配置する(図17)。さらなる比較は、ABC3リンカードメインがC.elegansコスミ
ドC48B4.4によりコードされるリンカードメインに対してサイズにおいてほぼ同
一であることを示す。ABC1およびABC2にあるように、ABC3のリンカードメインは
、非常に多くの極性残基およびいくつかの潜在的なリン酸化部位を含む。
推定ABC3タンパク質配列のさらなる分析は、ABC1/ABC2サブファミリーに対す
るさらなる類似性を明らかにした。PSORT分析(Nakaiら、前出)に基づいて、AB
C3タンパク質は、N末端シグナル配列を含まないようであり、そしてIII型膜タ
ンパク質(Singer,Annu.Rev.Cell Biol.6:247-296 1990)のようであり、第1
の膜貫通ドメインの配列N末端は細胞質に位置する(図17)。同様の形態がABC1
について記載され(Lucianiら、前出、1994)、そして輸送される全ての他のABC
が記載されている(Higgins、前出、1992)。上記のように、マウスABC1およびA
BC2は、保存リンカードメイン内に新規の疎水性領域であるHH1を含むことが示さ
れた。HH1ドメインはABC3においてアミノ酸レベルであまり保存されないが、HH1
ドメインは、親水性分析に基づいてリンカー領域内に存在するようである。同様
のHH1ドメインもまた、C.elegans由来のコスミドC48B4.4によりコードされる配
列において見出される。全てのこれらの場合において、HH1ドメインは、βシー
トコンホメーションを有すると予測される。
RPL3L(SEM L3):RPL3L(SEM L3)cDNAオープンリーディングフレームは、46.3kDa
の407アミノ酸ポリペプチドを予測する(図11)。RPL3L(SEM L3)cDNAのインビト
ロ転写−翻訳は、46.3kDの予測量と密接に一致した、46kDの見かけの分子量を有
するタンパク質産物をもたらした。
2つの核標的化配列(これは、ヒト、マウス、およびウシの間で100%保存さ
れる)は、RPL3L(SEM L3)アミノ酸配列においてわずかに分岐した。第1の標的
化部位は21アミノ酸のN末端オリゴペプチドである。ヒト、ウシ、およびマウス
L3の13および19位にそれぞれ存在するセリンおよびアルギニンは、RPL3L(SEM L3
)のヒスチジンで置換される(図12)。第2の潜在的核標的化部位は、2部に分
かれたモチーフである。ここでヒト、ウシ、およびマウスタンパク質は、341〜3
58位でKKR-(aa)12-KRRを有するが、一方SEM L3遺伝子は341〜358位でKKR-(aa)10
-HHSRQを有する。この2部に分かれたモチーフの第2の半分は、塩基性のままで
あったが、他の核標的化モチーフに見出されるものとマッチしない(Simonicら
、前出、1994)。全体的にみて、RPL3L(SEM L3)と他の哺乳動物L3リボソーム遺
伝子由来のコンセンサスとの間で77.2%アミノ酸同一性があり、RPL3L(SEM L3)
とヒトL3との間のヌクレオチド差異の56%がサイレントである。
hALR:hALRcDNA配列は、ラットALRタンパク質に対して84.8%同一および94.1%
類似している119アミノ酸配列タンパク質をコードする(図13および14を参照の
こと)。
本発明は開示された実施態様に対する参考として記載されたが、種々の改変は
本発明の精神から逸脱することなくなされ得ることが理解されるべきである。従
って、本発明は、配列表に続く請求項によりのみ限定される。 DETAILED DESCRIPTION OF THE INVENTION
Novel human chromosome 16 genes, compositions, and methods of making and using the same
Background of the Invention
Assembly of adjacent cloning genomic reagents requires a positional cloning approach.
This is a necessary step in the process of identifying a disease gene using H. Polymorphism simply
The rapid development of high-density genetic maps based on pure sequence repeats has led to the development of sequence tagging sites (STS
) Facilitating contig assembly using content mapping. Most
Contig construction efforts rely on the yeast artificial chromosome (YAC). Because those
Large Insert Sizes Use Current STS Map Density Over Bacterial Host Systems?
It is. This approach has been demonstrated for multiple human chromosomes,
YAC coverage in the range of 65-95% and contigs of 11-36Mb are described
(Chumakov et al., Nature 377 (Supplement): 175-297, 1995; Doggett et al., Nature 37).
7 (Supplement): 335-365, 1995b; Gemmill et al., Nature 377 (Supplement): 299-319, 1995; Kraut.
er et al., Nature 377 (supplement): 321-333, 1995; Shimizu et al., Cytogenet. Cell Genet. 70.
: 147-182, 1995; van-Heyningen et al., Cytogenet. Cell Genet. 69: 127-158, 1995).
.
Despite many successes, the YAC cloning system uses chimeric clones (Green et al.).
Genomics 11: 658-669, 1991; Bcllanne-Chantelot et al., Cell 70: 1059-1068,19.
92; Nagaraja et al., Nuc. Acids Res. 22: 3406-3411, 1994), and rearranged.
Or deleted or unstable clones (Neil et al., Nuc. Acids Res. 18: 1421-
1428, 1990; Wada et al., Am. J. Hum. Genet. 46: 95-106, 1990; Zuo et al., Hum. Mol. Genet.
1: 149-159, 1992; Szepetowski et al., Cytogenet. Cell Genet. 69: 101-107, 1995).
Clones the entire genome of complex organisms due to intrinsic limitations that result in a substantial proportion of
Not a panacea for ning. At least some of these cloning artifacts
In some cases, yeast recombination acts on various types of repetitive elements in mammalian DNA.
(Neil et al., Supra, 1990; Green et al., Supra, 1991; Schlessinge
r et al., Genomics 11: 783-793, 1991; Ling et al., Nuc. Acids Res. 21: 6045-6046, 1993.
; Kou
prina et al., Genomics 21: 7-17, 1994; Larionov et al., Nuc. Acids Res. 22: 4154-4162,
1994).
Therefore, alternative cloning systems may be needed to compensate for the localized YAC cloning deficiency.
To increase the resolution of physical maps, and for whole-genome DNA sequencing
Used in conjunction with a YAC-based approach to provide a source of array preparation
Must be done. Some exon trapping methodologies and vectors are
Described for rapid and efficient isolation of coding regions from genomic DNA
(Auch et al., Nuc. Acids Res. 18: 6743-6744, 1990; Duyk et al., Proc. Natl. Acad. Sci.,
USA 87: 8995-8999, 1990; Buckler et al., Proc. Natl. Acad. Sci., USA 88: 4005-4009.
1991; Church et al., Nature Genet. 6: 98-105, 1994). Exon trapping
The main advantage is the expression of cloned genomic DNA (cosmid, P1, or YAC)
Is driven by a heterologous promoter in tissue culture cells. this
Means that the coding sequences have no prior knowledge of the tissue distribution or developmental stage of their expression,
Allow to be identified. The second advantage of exon trapping is that
Code where the trapping is only from the desired cloned template
Sequence identification, which identifies highly conserved transcripts from overlapping loci.
The elimination of the danger that it does. This is a direct line even for cDNA selection.
Not even in the case of Bally screening.
Exon trapping is performed at the Huntington's disease locus (Ambrose et al., Hum. Mol. Gen.
et. 1: 697-703, 1992; Taylor et al., Nature Genet. 2: 223-227, 1992; Duyao et al., Hu.
m.Mol.Genet. 2: 673-676, 1993) and the BRCA1 locus (Brody et al., Genomics 25: 2).
38-247, 1995; Brown et al., Proc. Natl. Acad. Sci., USA 92: 4362-4366, 1995).
Has been successfully used to identify transcribed sequences in Huntington
Disease genes (The Huntington's Disease Collaborative Research Group, Cell
72: 971-983, 1993) Neurofibromatosis type 2 (Trofatter et al., Cell 72: 791-800, 1993).
), Menkes disease (Vulpe et al., Nature Genet. 3: 7-13, 1993), Batten disease (The In
ternational Batten Disease Consortium, Cell 82: 949-957, 1995), and
Genes responsible for a number of long-term QT (Long-QT) syndrome cases (Wang et al., Nature Genet.
12: 17-23, 1996).
Ping has been identified.
The 700 kb CpG-rich region in band 16p13.3 shows autosomal dominant polycystic kidney disease (P
Disease gene (Germino et al., Genomics 13: 144-151, 1992; S)
omlo et al., Genomics 13: 152-158, 1992; The European Polycystic Kidney Diseas
e Consortium, Cell 77: 881-894, 1994), and one cause of tuberous sclerosis
Tubulin gene (TSC2) (The European Chromosome 16 Tuberous Sc
lerosis Consortium, Cell 75: 1305-1315, 1993).
The estimated 20 genes are located in this region of chromosome 16 (Germino et al., Kid
ney Int. Supp. 39: S20-S25, 1993). However, around 16p13.3 the PKD1 gene
Region characterization is complicated by overlap of parts of the more proximal genomic interval at 16p13.1
(The European Polycystic Kidney Disease Consortium, supra, 19
94).
This chromosome segment is represented by a GC-rich isochore (Saccone et al., Proc. N
atl.Acad.Sci., USA 89: 4913-4917, 1992), CpG islands (Harris et al., Gcnomics 7: 195).
-206, 1990; Germino et al., Supra, 1992), genes (Germino et al., Supra, 1993), and
And rich in Alu repeats (Korenberg et al., Cell 53: 391-400, 1988)
Therefore, there is a need for a large insert cloning system in E. coli and yeast.
Useful as a rewarding test. Chromosome 16 also has a lower copy
Fluorescence in situ hybridization (FISH), including repetition (Okumura et al., C
ytogenet.Cell.Genet.67: 61-67, 1994), the cosmid
Approximately 25% of contigs hybridize to more than one chromosomal location. these
Types of repeats and sequence duplication are commonly used for the identification of genomic DNA
Prevents 'walking' technology and is based on hybridization of contig constructs
Present challenges for the method. This is because these technologies are used to flag genomic DNA duplication.
Because it depends on hybridization to identify clones containing the
Therefore, from the homologue instead of the clone from the authentic gene
There is a high likelihood of "walking" to the clone. In a similar manner, the sequence duplication and 16th
Chromosome-specific repeats also reveal the complete cDNA sequence encoding the corresponding protein.
Prevent white decisions. In addition, low copy repeats are used in bacteria, yeast, and higher eukaryotes.
May lead to the instability of this interval at.
Thus, a genuine gene present in a highly repeated portion of chromosome 16, and
Exact genomic and cDNA sequences corresponding to genes similarly located on other chromosomes
There is a need in the art for methods and compositions that enable accurate identification
. The present invention fulfills this need, and also provides related advantages.
Summary of the Invention
According to the present invention, human netrin, human ATP binding cassette transporter, human ribosomal
Encoding the human L3 subtype and a human augmenter of liver regeneration
An isolated nucleic acid is provided.
The present invention relates to a human netrin gene, a human ATP binding cassette transporter gene,
The ribosome L3 gene and the human enhancer gene for liver regeneration
Further providing an isolated protein product.
Thus, the present invention provides nucleic acids of the invention as well as unique genes located on chromosome 16.
A nucleic acid probe is provided that hybridizes to an isolated nucleic acid comprising a sequence.
Vector containing nucleic acid of the present invention and host transformed with vector of the present invention
Cells are further provided.
The transgenic non-human mammal expressing the polypeptide of the present invention is
Provided by
The present invention relates to antisense oligonucleotides, antibodies, and compositions containing the same.
including.
Further, the present invention provides a method for identifying a compound that binds to the polypeptide of the present invention.
Provide a way. Such compounds modulate the activity of the polypeptide of the invention
Useful for
BRIEF DESCRIPTION OF THE FIGURES
FIG. 1 shows a schematic diagram of the P1 contig and the trapped exons.
Figures 2A and 2B show selected exon traps with sequences in the database
FIG.
3A-3C show the 6803 bp hNET genomic sequence from P1 clone 53.8B (SEQ ID NO: 19).
Is shown.
FIGS.4A and 4B show the 1743 bp encoding the human homolog of the chicken netrin gene.
1 shows the hNET cDNA and the deduced amino acid sequence (SEQ ID NOs: 20 and 21).
4C and 4D show nucleotides of a 1.9 kb hNET cDNA containing both 5 ′ and 3 ′ UTRs.
Shows the sequence (SEQ ID NO: 78).
FIG. 5 shows chicken netrin-1 (SEQ ID NO: 22) and chicken netrin-2 (SEQ ID NO:
23) and amino acid comparison between hNET (SEQ ID NO: 21). The shaded box is the same
One region of homology is shown. Laminin domains V and VI and C-terminal domain
(C) is indicated by an arrow, and domain V is divided into three subcomponents (V-1 to V-3).
You. The asterisk identifies the adhesion / signaling receptor motif.
Figure 6 shows the interdomain between chicken netrin-1, chicken netrin-2 and hNET
2 shows a graphical representation of the homology of.
FIG. 7 shows exon traps, RT-PCR products, and cDNAs derived from ABCgt.1 clones.
Is shown. Exon traps have been described previously. ABCgt.1 DNA is an exont
Shown below the wrap, Genetrapper selection (S) and repair (R) oligonucleotides
The position of the tide is indicated. The location of the RT-PCR clone is shown below the cDNA.
8A-8G show a 5.8 kb cDNA encoding the ABCgt.1 clone and the predicted amino acid sequence.
The columns (SEQ ID NOs: 24 and 25) are shown.
9A-9D show mouse ABC1 (SEQ ID NO: 26) along with clone ABCgt.1 (SEQ ID NO: 25).
7) and Amino acid alignment of ABC2 (SEQ ID NO: 27). Hyphen is a gya
Asterisks indicate identical residues, while periods indicate conservative substitutions. ATP
The location of the binding cassette is indicated by the enclosed area. The number on the right is
Indicates the relative position.
FIG. 10 shows the PKD1 gene from which the P1 clones 49.10D, 109.8C, and 47.2H were isolated.
2 shows the region of the locus transcription map. White boxes indicate trapped exons,
Their relative positions are shown below the RPL3L (SEM L3) gene. c, r, and h are
The capture oligonucleotide, repair oligonucleotide, and hybrid
Shows the position of the hybridization oligonucleotide.
FIGS.11A-11B show the nucleotides and deduced nucleotides of the SEM L3 cDNA, referred to herein as RPL3L.
The amino acid sequence (SEQ ID NO: 28 and 29) is shown. 5 'upstream in-frame stop codon
Are underlined, and the arrows point to two shorter cDNA clones (also
(Isolated) shows the site of the poly A tract.
FIG. 12 shows human (SEQ ID NO: 30), bovine (SEQ ID NO: 31), mouse (SEQ ID NO: 32),
2 shows a comparison of deduced amino acid sequences derived from RPL3L (SEML3) (SEQ ID NO: 29) gene
You. Dashes indicate sequence identity to the human L3 gene. N-terminal nuclear targeting arrangement
Rows are shaded, and motifs divided into two parts are boxed.
FIG. 13 shows the nucleotide and deduced amino acid sequence of the hALR cDNA (SEQ ID NO: 33 and SEQ ID NO: 33).
And 34).
FIG. 14 shows the deduced amino acid sequences (SEQ ID NO :) derived from rat ALR and human ALR, respectively.
No. 35 and 34) are shown.
FIGS. 15A-15J show the nucleotide and deduced amino acid sequences of the full-length hABC3 cDNA
Column numbers 74 and 75).
FIG. 16 shows a physical map of the region containing the hABC3 gene.
FIG. 17A shows the mouse ABC1 (SEQ ID NO: 26) and ABC2 (SEQ ID NO: 27) sequences (LUCiani
Et al., Genomics 21: 150-159, 1994) and C. elegans cosmid C.48B4.4.
Sequence (SEQ ID NO: 77) (Wilson et al., Nature 368.32-38, 199)
4 shows the predicted amino acid sequence of hABC3 (SEQ ID NO: 75), aligned to 4). Array
Identity is indicated by letters and mismatches are indicated by periods. Between alignments
The gap to be inserted is also indicated (=). ABC1, ABC2, and C.48B4.4
And contained only in the first ATP-binding domain, and only the sequence at the C-terminal side thereof.
Is shown. Boxes indicate ATP binding cassettes (I and III) and HH1 domain (I
I) is shown.
Figure 17B shows transmembrane (TM) domain, ATP binding cassette (ABC) domain, linker
1 shows a schematic diagram of an ABC3 protein showing the H- and HH1 domains.
FIG. 18 shows a map of the genomic interval around the human netrin gene.
FIG.19A shows a GRAIL2 analysis of the coding sequence in the 6.8 kb genomic sequence from 53.8B P1.
Show.
FIG.19B shows Pustell DNA / protein comparison of genomic sequence to chicken netrin-2.
The results of the quality matrix are shown.
FIG.20A shows human netrin and chicken netrin-1, chicken netrin-2, and U
Fig. 7 shows an alignment with NC-6 (SEQ ID NO: 79).
FIG.20B shows a schematic of the genomic sequence, boxes indicate exons, and lines indicate
Intron. The untranslated region is shown in black and the position of the start codon is shown by an arrow
. The domain structure of the human netrin protein is shown below the gene structure. Dros
The positions of the introns in the ophila netrin gene are indicated by arrows, and the non-conserved
Tron is indicated by an open arrow.
DETAILED DESCRIPTION OF THE INVENTION
All patent applications, patents, and literature references cited in this application are incorporated by reference in their entirety.
It is incorporated herein by reference. In case of conflict or mismatch, define
The description of the present invention, including that it is tailored.
Definition:
1. “Complementary DNA (cDNA)” is derived from a genuine gene and has the sequence or
Is a single- or double-stranded intron whose complement encodes a protein.
DNA molecules are defined herein.
2. A "contig" as referred to herein is a contiguous stream of DNA or DNA sequences.
Tretch, which can be represented by multiple overlapping clones or sequences.
3. "Cosmids" as referred to herein are capable of replicating in bacterial cells and
A DNA plasmid capable of accommodating a large DNA insert of about 30 to about 51 kb in length.
4. The term "P1 clone" refers to a clone based on a P1 phage replication machinery-based vector.
Genomic DNA. These vectors generally have a size of about 70 to about 105 kb.
House insert (Pierce et al., Proc. Natl. Acad. Sci., USA, 89: 2056-2060, 1992).
).
5. As used herein, the term “exon trapping” refers to RNA processing
Genomic DNA flanked by donor and ataseceptor splice sites for
Refers to a method for isolating a sequence.
6. As used herein, "amplification" of DNA refers to a particular mixture or mixture of DNA sequences.
Figure 3 shows a reaction that works to increase the concentration of a DNA sequence. Amplification is the polymerase chain
Reaction (PCR) (Saiki et al., Science, 239: 487, 1988), ligase chain reaction (LCR)
Using nucleic acid specific amplification (NSBA) or any method known in the art
Can be performed.
7. As used herein, “RT-PCR” refers to coupled reverse transcription and polymerase
Refers to the chain reaction. This amplification method is specific oligonucleotide, oligo dT, or
Implements reverse transcription of RNA into single-stranded cDNA using a mixture of random primers.
The cDNA is then used in standard amplification techniques (eg,
, PCR).
P1 contig containing about 700 kb DNA around PKD1 and TSC2 genes
P1 library (Shepherd et al., Proc. Natl. Acad. Sci., USA 91: 2629-2633, 1994).
) With 15 different probes, resulting in 12 unique
It was assembled from a set of P1 clones derived from chromosome 16. Exon truck
Ping used to identify transcribed sequences from this region in 16p13.3
Was done.
96 new exons containing sequences from at least 18 genes in this interval
Wrap was obtained. The 18 identified genes account for less than 5 genes from this interval.
Previously reported genes and previously characterized remains whose location was unknown
Including genes (Table I). Additional exon traps in cDNA, PT-PCR products
Their presence, or their hive to different mRNA species on Northern blots
Genes were mapped on the basis of redidation. Exon trapping is an improved trapping vector (Burn et al., Gene 1
61: 183-187, 1995), and the obtained exon trap was used for DNA sequence analysis.
Was characterized by: Determine the relative efficiency of the exon trapping procedure
For example, exon traps are known to be located around the PKD1 gene.
It was compared with the cDNA sequence of the gene (FIG. 1). A single exon trap, ERV1 (Liso
wsky et al., Genomics 29: 690-697, 1995) and the ATP6C proton pump gene (Gill
espie et al., Proc. Natl. Acad. Sci., USA 88: 4289-4293, 1991).
Was done. The horizontal line at the top of Figure 1 is a graduated (kilobase) related DNA marker
Indicates the position of the key. The location of the NotI site is indicated below the horizontal line. Known gene positions
The positions and directions are indicated by arrows, and the number of exon traps obtained from each gene is rounded.
Shown in an arc. The locations of the transcription units (AM) described in this report are known
Shown below the gene. The corresponding exon trap Genbank accession number is
Shown below the unit. P1 clones are indicated by overlapping lines, and the name of the clone is
Shown above the line. Trapped exo does not map to characterized transcripts
Position is indicated below the P1 contig. Vertical line shows hybridization
P1 clone (s) detected by exon trap in study
Indicates the interval within
In contrast, eight individual exon traps were isolated from the TSC2 gene and 10
Exon traps were isolated from the CCNF gene (The European Chromosome
16 Tuberous Sclerosis Consortium, supra, 1993; Kraus et al., Genomics 24: 27-33.
, 1994). Sequences trapped from three of the exons present in the PKD1 gene
(The American PKD1 Consortium, Hum. Mol. Genet. 4: 575-582, 1995
; The International Polycystic Kidney Disease Consortium, Cell 81: 289-29
8, 1995; Hughes et al., Nature Genet.10.151-160, 1995). 109.8C and 47.2H P1
Sixteen additional exon traps were also obtained from the clone.
Two exon tigers located in the overlap region between the 96.4B and 64.12C P1 clones
Sequence (Genbank Accession Nos. L75926 and L75927) contains S-phase predominant DNA
/ RNA binding protein (Schmidt et al., Biochim. Biophys. Acta 1216: 317-320, 1993)
Previously described for the mouse RNPS1 gene (Genbank accession number L37368)
It was shown to contain sequences from the listed human homologs. For dbEST database
Comparison of these exon traps shows that they are also I.M.A.G.E. Consortium (
Lennon et al., Genomics 33: 151-152, 1996).
Was. Based on these data, the hRNPS1 gene was expressed in 16 cells near the DNA marker D16S291.
p13.3 (transcript G in FIG. 1).
The two exon traps from the 1.8F P1 clone are
A previously described mouse ΦAP3 encoding a transcription factor (Fognani et al., EMBO J. 12: 4985).
-4992, 1993) with a high level of homology. Zinc
MΦAP3 protein, a finger-containing transcription factor, is a protein responsible for cell cycle inhibition.
Believed to function as a negative regulator for the gene encoding protein
(Fognani et al., Supra). The two exon traps are linked by PCR,
The resulting 1.2 kb PCR product is 85 nucleotides at the nucleotide level relative to the mouse ΦAP3 cDNA.
% Identical. Dot blotted P1 conti of ΦAP3-like exon trap
Hybridization to DNA was performed using this gene strain as DNA markers KLH7 and GGG12.
And in the non-overlapping region of 1.8 F P1 (transcript H in FIG. 1).
Significant homology is also associated with 97.10GP1 and ras-related GTP involved in regulation of vesicle trafficking
Rat Rab26 gene encoding the binding protein (Nuoffer et al., Ann. Rev. Biochem.
63: 949-990, 1994; Wagner et al., Biochem. Biophys. Res. Comm. 207: 950-956, 1995).
Was observed between the two exon traps obtained from E. Exon truck like Rab26
Are linked by RT-PCT (transcript J in FIG. 1) and the coding sequence is relative to Rab26.
94% (83/88) identical at the protein level. For example, the following selected
See FIG. 2, which shows the alignment of the exon trap with the sequence in the database.
Teru. For the sequence encoded by exon trap L48741 (SEQ ID NO: 1)
C. Elegans (SEQ ID NO: 2), E. coli (SEQ ID NO: 3), and Haemophilus (SEQ ID NO: 3)
N-acetylglucosamine-6-phosphate deacetylase derived from column No. 4)
Intention. One of the translated netrin-like exon traps (Genbank accession number L
75917), netrin-1 (SEQ ID NO: 7), neto aligned to (SEQ ID NO: 5)
EGF repeats from phosphorus-2 (SEQ ID NO: 6) and UNC-6 (SEQ ID NO: 8) are shown
You. Second netrin-like exon trap (Genbank accession number L75916) (SEQ ID NO:
9), derived from netrin-1 (SEQ ID NO: 11), and netrin-2 (SEQ ID NO: 10)
The sequence alignment is shown. Translated Rab26-like RT-PCR products (Genbank contract)
Nos. L48770-L48771) (SEQ ID NO: 12) and rat Rab26 (SEQ ID NO: 13)
Statement. Neisseria gonorrhoeae-derived pilB transcription repressor-derived sequence
Column no. 15), computer encoded by cosmid F44E2.6 from C. elegans
-Sequence predicted by analysis (SEQ ID NO: 17), YCL33C gene product from yeast (Ge
nbank accession number P25566) (SEQ ID NO: 16), and transcriptional repress from Haemophilus
Coded by exon trap L48792, aligned against sir (SEQ ID NO: 18)
(SEQ ID NO: 14) is shown. Period is gap aligned
Indicates the position inserted into the protein sequence to maintain.
CDNA libraries to correlate exon traps with individual transcripts
Selected exons using a cleaning and PCR-based approach
The transcribed sequence containing the wrap was cloned. Two exons using RT-PCR
If the trap has homology to a similar sequence in the database,
Individual exon traps were connected together. Only a single exon trap is used
If possible, use 3'RACE or cDNA library screening to further
Sequence was obtained. Using sequences from exon traps and cloning products
, The location of the corresponding transcription unit and, if possible, its direction.
Six unique exon traps containing sequences from at least eight exons
Shown to be derived from the transcription unit in the most centromeric P1 clone, 94.10H
(Transcript A in FIG. 1). A 2 kb cDNA linking the six exon traps was isolated.
And was shown to hybridize to an 8 kb transcript. More hive
Redidation studies have shown that this gene is directed from centromeres to telomeres and
Both showed that the 6 kb transcript was derived from the centromere sequence of the P1 contig. Wide
Extensive homology was observed between the translated cDNA and various protein kinases
However, the conserved HRDLKPEN motif encoded in exon trap L48734
(SEQ ID NO: 71) as well as the presence of the partial cDNA indicates that it is a serine / threonine kinase.
(Van-der-Geer et al., Ann. Rev. Cell Bio. 10: 251-33).
7, 1994).
The cDNA is derived from a different 94.10H exon trap (Genbank accession number L48738)
And the position and orientation of the corresponding transcription unit are determined.
Was. Two cDNA species were obtained using exon trap L48738 as a probe,
The homology between the two species arises from 109 bases in the exon trap
Was only. Using an oligonucleotide probe, the transcription unit is telomeric
Mapped to a position near the 26-6DIS DNA marker in the eccentric to centromeric direction; however, c
Only one of the DNA species mapped to the P1 contig (transcript B in FIG. 1).
Based on these data, the second cDNA species was identified as a region outside the P1 contig, presumably
It seems to be derived from the overlapping 26-6PROX marker located further on the centromere side of 16p13.3
(Gillespie et al., Nuc. Acids Res. 18: 7071-7075, 1990).
The 110.1F P1 clone contains at least two genes in addition to the ATP6C gene.
Using BLASTX to search the protein database, significant homology
The sequence encoded by Sontrap L48741 and C. elegans (Wilson et al., Supra, 19
94), E. coli (Plumbridge, Mol. Microbiol. 3: 505-515, 1989), and Haemophilu
N-acetylglucosa from s (Flelschmann et al., Science 269: 496-512, 1995).
It was observed between the min-6-phosphate deacetylase (nagA) protein. nagA tongue
Alignments to puta translated exon traps can be
(Figure 2), which indicates that exon traps
It suggests that it contains sequences from offspring. Additional sequences from nagA-like transcripts have 3'RACE
And the transcription unit is located in the region between NotI sites 2 and 3 in FIG.
Mapped to the area. This gene is oriented from telomere to centromere and NotI site 2
Present in the 3'UTR of the RACE clone (transcript C in FIG. 1).
Overlap region between 110.1F P1 clone and 53.8B P1 clone (transcript D in FIG. 1)
Two additional exon traps (Genbank accession number L75916 and
And L75917) are from chicken netrin (Kennedy et al., Cell 78: 425-435, 1994; Serafi).
ni et al., Cell 78: 409-424, 1994) and C. elegans UNC-6 protein (IShii et al., N
euron 9: 873-881, 1992) (FIGS. 2 and 20A).
The sequence encoded by exon trap L75917 contains netrin and UNC-6
Significant phase with most C-terminal epidermal growth factor (EGF) repeats found in proteins
It was shown to be homosexual (FIGS. 2 and 20A). Exon trap L75917 is
98% identical to the sequence from the third epidermal growth factor (EGF) repeat of chicken netrin-2
One sequence and a sequence 90% identical to a sequence from the same region of netrin-1.
Do. Netrin-like trap L75916 is the C-terminal domain of netrin-1 and netrin-2.
To the more branched C-terminal domain of netrin, 43% identical to the sequence contained in the main
Encodes the derived sequence (FIGS. 2 and 20A). This area contains UNC-6 and netrin
Is the least conserved between the two, and the sequence is 63% conserved between netrin-1 and netrin-2
And is 29% conserved between netrin-2 and UNC-6 (Serafini et al., Supra).
.
Netrin has been shown to play a central role in axonal guidance
Define the tropism factor family. The axonal growth cone is the extracellular matrix or cell
Local cues present on surfaces, as well as diffusible chemoattractants and chemistries
Both long-term cues in the form of repellents are directed to their targets (
Goodman and Shatz, Cell 72: 77-98, 1993; Keynes and Cook, Curr. Opin. Neu
robiol. 5: 75-82, 1995).
Chicken Netrin-1 and Netrin-2 Are Modified to Develop Spinal Commissural Axons
Functions as an academic inducer (Serafini et al., Cell 78: 409-424, 1994; Kennedy et al., Ce)
ll 78.425-435, 1994), netrin-1 is also a chemical repellent for trochlear axons
Acts as a quality (Colamarino and Tessier-Lavigne, Cell 81: 621-629, 1995
) Is shown. Comparative analysis was performed with chicken netrin and a circular (circumferenti
al) between C. elegans UNC-6 protein required for cell migration and axon guidance
Revealed the existence of extensive homology (Hedgecock et al., Neuron 4: 61-85, 1990; Ish
ii et al., Neuron 9: 873-881, 1992). More recently, two Drosophila netrins,
NETA and NETB have been described, and pulley axon guidance and motor neuron
It has been shown to be required for induction into these target muscles (Harris et al., Cell 1
7: 217-228, 1996; Mitchell et al., Cell 17: 203-215, 1996). These studies are
Netrin family of aspiratory and chemo-repellent proteins invertebrates and vertebrae
Indicates that it is preserved between animals.
Genomic intervals that include netrin-like exon traps may
Obtain sequence information and rule out the possibility that exon traps are derived from pseudogenes
Was sequenced for. In a preliminary study using the 53.8B genomic P1 clone,
The Trin-like exon trap mapped to a 6 kb XhoI fragment. For example
, The relevant DNA marker is shown above the horizontal line and the NotI site (N) is shown below this line
See FIG. Location and orientation of ATP6C, CCNF, and nagA transcription units
Has been described previously (Gillespie et al., Proc. Natl. Acad. Sci., USA 88: 4289-4293, 1).
991; Kraus et al., Genomics 24: 27-33, 1994; Burn et al., Genome Research 6: 525-537.
, 1996), and shown below the genome interval. Two P1 cells containing the netrin gene
The loan is shown below the schematic of this interval. The position of the 6.8 kb genome sequence is P1
Expanded below the clone. Two exon tracks in a 6.8 kb genomic sequence
The position of the loop is also indicated.
The 6 kb fragment and the adjacent 3.5 kb XhoI fragment were subcloninin
And use this to create random shotgun shots from the 53.8B P1 clone.
The library was screened. Positive by hybridization
Subclones were sequenced using forward and reverse vector primers. Total 88
Subclones were sequenced in this manner.
Additional sequences are internal primers as well as terminal sequences from the parent XhoI fragment.
Obtained using A total 6.8 kb genomic sequence with 7-fold total redundancy was sequenced.
Was. The GC content of the sequenced region was found to be 68.9%, which is 350 kb
Further about the genomic sequence of 53 kb derived from the PKD1 gene located on the telomere side
Slightly higher than the observed 62.8% (The American PKD1 Consortium, 1995, before
(Burn et al., 1996, supra).
Computer analysis was performed to identify putative exons. GRAIL2 analysis
Predicts six exons within a 6.8 kb genomic sequence using database analysis.
All but one exon (exon 1) are homologous to chicken netrin
It encodes a sequence that has sex properties. Figure 19A shows 6.8 kb from 53.8B P1.
Shows the GRAIL2 analysis of the coding sequence in the genomic sequence of, the gray scale is the GC content
(White to light gray is GC rich, and gray to black is AT rich
), The vertical box indicates the relative quality of the predicted exon. Estimated
The exon figure is shown above the vertical box, and the lightly colored box is "excellent" (> 80
%of
Exons with a score of (probability), and the dark colored box is "good" (>
Exon with a score of 60% probability). Exon trap L75917 and
The position of L75916 (respectively from left to right) is shown above the GRAIL2 predicted exon. R
The structure of the gene based on the comparison of the T-PCR product and the genomic sequence is shown at the top,
The position of the exon in the sequence is indicated by the number above the exon. 5 'and
The 3 'untranslated region is also shown.
Furthermore, a 6.8 kb genomic sequence can be obtained using Pustell DNA / protein matrix.
The protein sequence of chicken netrin was compared. Genome sequence (all six frames
Translated into a homolog), the minimum homology is set to 50% and the window (win
dow) was set to 20, using a RAM250 matrix chicken chicken netrin-FIG.
Compared to 2. The regions of homology are indicated by heavy diagonal lines. The five exons are
Analytical predicted that only the first GRAIL2 predicted exon appears to be true
Was. Sequences from two exon traps were also predicted by GRAIL2;
However, there were notable differences (compare FIG. 19A). Exon trap L75917
GRAIL2 contains an additional 55 bp at the 5 'end of the exon in predicting the sequence present in
I do. First exon of two exons present in exon trap L75916
Was not predicted by GRAIL2, while GRAIL2 was not present in this exon trap.
Additional bases were added to the 5 'and 3' ends of the existing second exon.
Searching the Expressed Sequence Tag (EST) database
It did not reveal the presence of any ESTs derived from the Trin gene. Human netori
Also used mRNA from over 50 different adult and fetal tissues.
Not detected by Northern and / or RNA dot blot analysis. this
HNETs have extremely restricted expression patterns and, when expressed, are present at low abundance.
Implies that However, two mice with significant homology to hNET
The EST is a brain library and a whole fetal library (Genbank accession numbers, respectively).
Nos. W59766 and AA048205). This mouse EST has a total of 477 bp
The column contains the indicated duplicate sequence. This 477 bp flanking sequence is 5 ′ of the human netrin cDNA.
Aligned to the ends and the sequence encoding the 47 bp 5 'UTR and the N-terminal 143 amino acids
Including. A comparison of the deduced human and mouse protein sequences shows that the two proteins are 89.
5% (128/143) showed the same.
Characterization of human netrin transcript
To confirm the structure of the netrin gene, RT-PCR was performed from the predicted exon
This was performed using the designed primers. Predicted human netrin is netrin-1
Appear to be slightly more homologous to netrin-2 (57% vs. respectively)
54%), and since netrin-2 is expressed in the chick spinal cord,
Spinal cord poly A + RNA was used as a template. RT-PCR product is a primer pair
Of nested primers and even twice
Requires the use of PCR and low yields
It required the use of a radiolabeled probe to visualize. Some places
Low yield and lack of RT-PCR product in the assay is due to high GC content of the product (70-80%)
Due to. Addition of betaine to a final concentration of 2.5 M in the PCT reaction dramatically increases RT-PCR
It has been found to improve the yield and purity of the product (WO 96/12041; R
eeves et al., (1994) Am. J. Hum. Genet. 55: A238; Baskaran et al., (1996) Genome Rese.
arch 6: 633-638).
Assembly of the RT-PCR product is performed in-frame upstream of the proposed starting methionine.
Reveals 1743bp open reading frame (ORF) with stop codon
did. Confirmation of start and stop codons resulted in a 209 bp 5 'UTR and a 22 bp
The 3'UTR has been cloned. However, additional sequences from each UTR
It was not done. Because the purpose of RT-PCR experiments is to
Because it's just to make sure, and not to assemble a full-length cDNA.
is there. The location of the intron-exon boundary is determined by the genomic sequence and RT-PCR clones.
Determined based on comparison (FIG. 19A).
HNET, a 1.9 kb cDNA, adds spinal cord cDNA and betaine as templates.
Cloned by nested PCR using standard PCR conditions
Was. The human netrin protein is predicted to be 580 amino acids in size,
The common domain structure of the phosphorus family was conserved. In FIG.
Positions where the trinetrin and UNC-6 sequences match the human sequence are indicated by periods.
While gaps introduced between alignments are indicated by hyphens.
Arrows on the sequence alignment are as described (Serafini et al., Cell 78: 409-
424, 1994) shows the boundaries of the laminin VI and V domains and the C-terminal region (C).
You. The signal sequence (S) is also shown. V-1, V-2, and V-3 are domains V
Represents each of the EGF domains. hNET code sequence and its predicted
The resulting protein products are shown in FIGS. 4A and 4B. Figures 4C and 4D show the 5 'and 3'UT
3 shows the full-length hNET cDNA including the R sequence.
Several lines of evidence suggest that the human netrin gene described herein is fake.
Make an adverse decision on the possibility of being a child. First, in the code area
These exons also do not contain a stop codon. Second, the entire gene structure described is
Highly conserved when compared to other members of the Trin / UNC-6 family
I have. Third, lack of signal in Northern and RNA blot analyses.
Nevertheless, the mature transcript was isolated by RT-PCR. Finally, it is highly stored,
Sequences in the mouse EST database have been identified. Think together
Thus, these data provide a novel human netrin with restricted expression pattern.
Indicates that the gene was identified.
Human netrin may have a significant role in nerve regeneration. Netrin is itself
Does not promote axonal growth in the body, but they play a role in directing axonal growth
You. The combination of growth-promoting activity with axon guidance cues is essential for directed nerve regeneration.
It is a necessary requirement.
The ability to clone genes with such restricted expression patterns is
The netrin gene can be cloned using cDNA selection or direct library screening.
Since it does not seem to be identified, one of the advantages of the exon trapping procedure is
Show. These results identify sequences from large genomic contigs and
It emphasizes the need to use various approaches to roam.
Exon-trapping results show LCNI and D16S291 markers in centromeric to telomere direction.
A new ATP binding cassette (ABC) at the PKD1 locus
Further indicates that the sender is present. Database using exon trap sequences
Searches show homology to mouse ABC1 and ABC2 genes (Luciani et al., Supra.
,
1994). The human homologs of mouse ABC1 and ABC2 have been cloned and
Mapped to 9 chromosomes (Luciani et al., Supra, 1994). cDNA selection and SAmple SE
Use the sequence from the trapped exon along with the sequence from quencing (SASE).
Was used to recover overlapping partial cDNA clones.
Seven exon traps with homology to the ABC transporter are found in P1 clone 30.
Isolated from 1F, 64.12C, and 96.4B. Addition encoded by ABC3 gene
The specific sequence was determined using custom primers designed from exon traps (Tables II and II).
I) using RT-PCR (placental and brain RNA as template) and live
Rally PCR (using commercially available lung cDNA library as template)
Was done. Three exon traps (L48758, L48759 and L48760) are 30.1F
, 64.12C, and 96.4B from the overlapping region between the P1 clones (transcript F, FIG. 1);
On the other hand, the fourth exon (L48753) maps exclusively to the 79.2A P1 clone (
Transcript E of FIG. 1). Exon traps derived from the hABC3 transporter encoded by transcript F
Encodes a sequence having homology to the R domain of the mouse ABC1 and ABC2 genes
You. R domain plays a regulatory role based on comparison to conserved regions in CFTR
It is thought to fulfill. To date, only ABC1, ABC2, and CFTR have R
It has been shown to contain domains (Luciani et al., Supra, 1994).
In addition, linking three exon traps from transcript F 1. 1kb RT-PCR production
(This RT-PCR product detects a 7kb message in the Northern blot)
Obtained. Based on a search of the dbEST database, cDNA derived from this region was obtained.
The sequences from exon traps L75924 and L75925 are M. A. G. E. Conso
contained in cDNA 49233 from rtium (Lennon et al., supra). In the same transcription unit
The presence of both cloning reagents was confirmed using RT-PCR.
The ATP binding cassette (ABC) transporter or transport ATP is available in both prokaryotic and eukaryotic organisms.
> 100 responsible for transport of a wide variety of substrates across cell membranes in other cells
Protein family (Higgins, C. F. , Annu. Rev. Cell. Biol. 8: 67-113
, 1992; Higgins, C. F. Cell 82: 693-696, 1995). ABC Carrier Super Family
Proteins are linked by strong structural similarity. Typically, AB
The C transporter has four conserved domains, two hydrophobic domains that can confer substrate specificity
(Payne et al., Mol. Gen. Genet. 200: 493-496, 1985; Footc et al., Naturalc 345: 255-258.
, 1990; Anderson et al., Science 253: 202-205, 1991; Shustik et al., Br. J. Haematol.
79: 50-56, 1991; Covitz et al., EMBO J. 13: 1752-1759, 1994), and ATP binding and
And two highly conserved domains involved in hydrolysis (Higgins, supra, 199).
2) having. ABC transporters are one of the molecules that enter and exit the cell and across subcellular membranes.
Dominates directional transport (Higgins, supra, 1992). Their substrates are heavy metals (Ouell
ette et al., Res. Microbiol. 142: 737-746 1991) from peptide and full size
Protein (Gartner et al., Nature Genet. 16-23 1992).
In eukaryotic cells, the ABC transporter is a single size containing all four domains.
Symmetric proteins or two each containing hydrophobic and ATP binding domains
Exists as any of the dimers resulting from the association of smaller polypeptides
. An example of this multimeric structural form is the human TAP protein (Kelly et al., Nature 355: 6).
41
-644, 1992) and a functional PMP70 protein (Kamijo et al., J. Mol. Biol. Chem. 265: 4534-
40 1990). This multimeric structure also results in numerous prokaryotic ABC transporters
Found in The hydrophobic region consists of up to six transmembrane segments
Become. Each ATP binding domain operates independently and may not be functionally equivalent.
(Kerem et al., Science 245: 1073-80 1989; Mimmack et al., Proc. Natl. Acad
. Sci. , USA 86: 8257-61 1989; Cutting et al., Nature 346: 366-369 1990; Kerppola.
J. Biol. Chem. 266: 9857-65, 1991).
To date, some of the ABC transporters identified in humans are clinically important.
It was shown that there is. For example, overexpression of P-glycoprotein is
Cause drug resistance (Gottesman et al., Ann. Rev. Biochem. 62: 385-427 1993).
Classic cystic fibrosis (CF) and bilateral congenital vas deferens disease (CBAVD)
A large percentage of cases are cystic fibrosis transmembrane conductance regulators (CFTR),
Caused by mutations in the ABC transporter (Kerem et al., Supra; Cutting et al., Supra)
Out). Deficiencies in the ABC transporter are also associated with Zuerweger syndrome (Gartner et al., Supra).
Ex) and adrenal brain gray matter dystrophy (Mosser et al., Nature 361: 726-730 1993)
) Involved.
Two members of the new ABC transporter subgroup (mouse ABC1 and ABC2)
Contain a domain similar to the regulatory R domain of CFTR (Luciani et al.
Supra, 1994). Functionally, mouse ABC1 protein is a macromolecule of apoptotic cells.
Have been shown to play a role in the swallowing of lophages (Luciani et al., EMB
O J. 16: 226-235, 1996), while the function of ABC2 remains unknown. All three tongues
The protein contains a large charged region that contains several potential phosphorylation sites (Kere
m et al., supra; Luciani et al., supra, 1994). Charged amino acid residues in this region
And in the block where the negative charges are alternated.
A common property of these particular ABC transporters (including hABC3) is that
There is a large linker domain between the sets. Non-linker domain
The presence of always many polar residues and potential phosphorylation sites suggests that this region
Suggests that it may play a regulatory role probably similar to that of the domain (Kerem
Et al., Supra). In addition, the four proteins are also in a conserved linker domain
Contains an HH1 domain, which is a hydrophobic region (Luciani et al., Supra, 1994). hABC3 and
Sequence-level homology between the HH1 domains of
Appear to be structurally conserved, and each domain has a β-sheet conformation.
Expected to have. The similarity of these proteins indicates that they all
Suggests belonging to the same ABC subfamily defined by C1 and ABC2
(Luciani et al., Supra, 1994). Genes encoding human homologs of ABC1 and ABC2
Mapped to human chromosome 9 at q22-q31 and q34, respectively (Luciani et al.
Supra, 1994).
ABC1, ABC2, and hA despite being members of the same subfamily
BC3 appears to have a different functional role. ABC1, ABC2, and hABC3 transmembrane
And the differences present in the linker domains can confer unique substrate specificities, respectively.
You. For example, in the transmembrane domain of both prokaryotic and eukaryotic ABC transporters
Changes and mutations have been shown to alter substrate specificity (Payne et al., Supra; Foo
te et al., supra; Covitz et al., supra), while changes to the R domain of CFTR are
(See Anderson et al., Supra; Rich et al., Science 253: 20.)
5-207 1991). Differences in the expression patterns of ABC1, ABC2, and hABC3 also
It suggests that these proteins can be functionally different. Mouse ABC1 and AB
C2 is expressed at various levels in a wide variety of adult and embryonic tissues
The highest levels of ABC1 expression were found in pregnant uterus and in monocyte-rich areas.
Area, while the highest levels of ABC2 expression were shown in the brain (
Luciani et al., Supra, 1994; Luciani et al., Supra, 1996). In contrast, hABC3 is
In the brain, heart, and pancreas.
Is shown.
Except for the structural differences between ABC1, ABC2, and hABC3, the three proteins differ
It is always possible to perform similar functional roles in different cell populations. Until now
No function has been proposed for mouse ABC2. However, recent data
Shows that ABC1 is required for swallowing cells undergoing apoptosis, but AB
The molecular mechanism underlying C1 function is unknown (Luciani et al., Supra, 1996). hAB
When C3 functions in a manner similar to ABC1, pulmonary macrophages involved in host defense
The
Can be expressed by
ABC transporters cover substrates ranging from small ions to large polysaccharides and proteins.
It was described. Based on high levels of expression in the lung, substrates for hABC3
Function (including ion or polysaccharide transport). Further
Some clues can be provided by more precise testing of hABC3 expression in the lung.
These studies identify the lung cells responsible for hABC3 expression and identify the subcellular localization of hABC3.
Including decisions. The identification and cloning of hABC3 cDNA is based on the potential R domain
Cystic fibrosis because it contains cancer and is expressed at the highest level in the lungs.
May be involved. hABC3 plays an essential role in lung function
Modulation or alteration of hABC3 substrate specificity has significant therapeutic implications for CF
I can do it.
Some cDNAs are homologous to the GeneTrapper direct selection system and ABC1
The most 5 'trapped exon coding sequence (with trapped exo
L48747). The most 5 'side
Normal human lung using custom oligonucleotides designed from Sontrap
The longest clone isolated from the cDNA library with the GeneTrapper system is
The length was 5719 bp (ABCgt. 1). Additional cDNA clones (ABC. 5) The pro
Radioactively labeled as It was isolated using a 1 kb RT-PCR product (ABC3-12).
(Figure 15). The 5 'end of the ABC3 cDNA was further characterized using 5' RACE and several R
The ACE product contained multiple in-frame stop codons upstream of the initiation methionine.
Therefore, the present invention provides a novel homology to mouse ABC1 and ABC2 genes.
Human ABC gene, as well as C. Cosmid C48B4 derived from elegans. 4 (Wilson et al.,
Provided are sequences predicted to be encoded by supra). 6. 4 kb cDNA is hABC3
Assembled for transport. The assembled cDNA encodes 1705 amino acids
Contains the 5116 nucleotide long open reading frame
The protein had a molecular weight of 191 kDa. The proposed starting methionine was cloned ABCg
t. It is 50 bp upstream of the 5 'end of 1.
P1 clone 109. 8C and 47. The five trapped exons from 2H are
Shown to contain sequences with homology to human ribosomal protein L3 cDNA
Hybridization studies point to L3-like genes from centromeres to telomeres
(Transcript L in FIG. 1). The ribosomal L3 gene product is
Five essential proteins for peptidyltransferase activity in the
One of the proteins (Schulze and Nierhaus, EMBO J. 1: 609-613,198
2). Not surprisingly, the L3 amino acid sequence is highly conserved among species.
You. The mammalian L3 gene showing about 98% protein sequence identity is human (Genbank)
Accession number X73460), mouse (Peckham et al., Genes Dev. 3: 2062-2071, 1989)
(Kuwano and Wool, Biochim. Biophys. Res. Comm. 187: 58-64, 1992), and
Cattle (Simonic et al., Biochem. Biophys. Acta 1219: 706-710, 1994)
Was. Human ribosomal protein L3 cDNA reported as trapped exons
Is 74% (537/724) at the nucleotide level.
Was.
Full-length cDNA encoding a novel ribosomal L3 protein subtype, SEM L3
It was isolated and sequenced (FIG. 11). This gene is now called RPL3L, and G
Designated as enbank accession number U65581. Putative protein sequence is 407 amino acids long
And are themselves highly conserved, other known mammalian L3 proteins.
Shows 77% identity to protein. Hybridization of human genomic DNA
Analysis showed that this new gene was a single copy, and that tissue-specific expression patterns
Is suggested.
The expression patterns of the previously identified human L3 gene and the novel human RPL3L
Numbers of tissue were determined using Northern blots. The human L3 gene is found in the pancreas
A ubiquitous expression pattern was shown in all tissues with the highest expression. Contrast
In addition, the novel genes described herein are associated with lower expression levels in the pancreas.
In addition, it is strongly expressed in skeletal muscle and heart tissue. This new gene RPL3L
(Like ribosomal protein L3), chromosome 16p13. Near PKD1 and TSC2 genes on 3
Are located in regions rich in many genes.
The RPL3L protein is different from the previously described nuclear-encoded mitochondrial protein.
Closely related to the aforementioned cytosolic ribosomal proteins (Graack et al., Eur. J. Bio
chem. 206: 373-380, 1992). The existence of highly conserved nuclear localization sequences in RPL3L
,
This represents a novel cytoplasmic L3 ribosomal protein subtype, and
We further support the hypothesis that we do not show domitochondrial proteins.
Furthermore, an exon trap derived from a gene located on the telomere side of the L3-like gene (
Genbank accession number L48792) was obtained (transcript M in FIG. 1). Copy by transcript M
The sequence to be read is pilB from Neisseria gonorrhoeae (Taha et al., EMBO J. 7:43
67-4378, 1988), as well as C.I. from elegans
Cosmid F44E2. 17.Coded by 6. 2kDa protein (Wilson et al., Supra)
Has been shown to be homologous to
Using the sequence from exon trap L48792, a 600 bp partial cDNA was isolated.
And it was determined that the corresponding gene was directed from the centromere to the telomere. 1. 3k
The message in b was detected by this cDNA in a Northern blot. part
Assuming a target cDNA 17. The sequence conserved between the 2 kDa protein and the Neisseria gon
pilB protein from orrhoeae (Taha et al., supra), hypothetical from yeast 19.
3 kDa protein (Genbank accession number P25566), and pili from Haemophilus
In the transcriptional regulatory repressor (Fleischmann et al., Science 269: 496-512 1995)
Saved (Figure 2). The pilB protein binds to the histidine kinase sensor
Has homology and is responsible for inhibiting pilin production in Neisseria gonorrhoeae
(Taha et al., Supra, 1988; Taha et al., Mol. Microbiol.
5: 137-148, 1991). However, pilB, transcript M, and C. elangans, yeast, and
And the conserved residues between the Haemophilus sequences are conserved histidines from pilB
It does not contain a kinase domain (Taha et al., Supra, 1991). These findings are
The conserved region in M is independent of pilB's proposed histidine kinase sensor activity
It suggests that it has the function.
109. 8C clone and 47. Additional exhaustion from the overlapping region with the 2H P1 clone
Sontrap traps the human LLRep3 sequence (Slynn et al., Nuc. Acids Res. 18: 681, 1990)
It was shown to include. Hybridization studies were performed using the LLRep3 sequence (transcription of Figure 1).
Object K) was located between sazD and the L3-like gene. Highest gene density
The region of the telomere end of this cloned interval, in particular, TSC2 and D16S84
And at least five genes (transcription units K, L, and M,
sazD and hERV1) map to this area.
Rat enhancers of liver regeneration previously described (Hagiya et al., Proc. Natl. Acad. Sci. ,
USA 91: 8142-8146, 1994) and is 86% identical at the nucleotide level (17
0/197) Exon traps have also been mapped to this area. ALR is a damaged liver
A growth factor that increases the growth of visceral tissue but has no effect on resting liver
is there. Studies have demonstrated that rat ALR can increase hepatocyte regeneration after hepatectomy
Was.
This ALR-like exon trap also supports the recently described hERV1 gene (which
Sequence from the mother ERV1 (encoding a functional homologue to Lisowsky et al., Supra)
It was shown to contain.
HALR, a 468 bp cDNA, is obtained from the human ALR gene (FIG. 13). ALR distribution
Column is 84. for rat ALR protein. 8% identical, and 94. 1% similar
Encodes a protein of 119 amino acids (FIG. 14).
The cloning of human ALR is significantly involved in the treatment of degenerative liver disease. For example
Biologically active rat ALR is produced from COS-7 cells expressing rat ALR cDNA
(Hagiya et al., Supra). Therefore, recombinant hALR is useful for treating damaged liver.
Could be used. Furthermore, constructs expressing hALR may be used to treat chronic liver disease.
Used in gene therapy.
43 trapped exons are found in protein or DNA databases
It has no significant homology to the sequence and the exon traps observed in dbEST
It was also not an EST (expressed sequence tag) containing a sequence derived from the template. These new d
The absence of an EST containing sequences from the xon trap is a further analysis.
One of the criteria for selecting exon traps for
Not surprising, as was the presence of the EST in. These traps
Exons appear to represent a true product. Because often they
Multiple times from different P1 clones and in combination with adjacent exons
Because it was wrapped.
The present invention relates to an isolated nucleic acid comprising a unique exon sequence derived from chromosome 16.
Includes a novel human gene. The sequences described herein may be used for transcription mapping.
Providing valuable resources for and at least two causes of genetic disorders
Create a set of sequence preparation templates for a gene-rich interval.
Accordingly, the present invention provides human netrin (hNET), human ATP binding cassette transporter (hABC3)
, Human ribosome L3 (RPL3L), and human enhancer of liver regeneration (hALR) polypeptide
Provided is an isolated nucleic acid that encodes a nucleic acid. The present invention is derived from chromosome 16
Further provided is an isolated nucleic acid comprising a unique exon sequence. The term "nucleic acid" (Po
RNA) and single- and double-stranded DNA, cDNA, etc.
Also includes oligonucleotides. As used herein, the phrase "isolated"
, A non-naturally occurring form of a polynucleotide.
One method for isolating a polynucleotide encoding a polypeptide of the present invention is described below.
This means that human tissue-specific libraries can be natively or naturally-occurring using methods well known in the art.
Is to probe with an artificially designed DNA probe. Human Netrin
Gene (hNET), human ABC transporter gene (hABC3), human ribosomal protein L3
Gene derived from the gene (RPL3L) or the human enhancer gene for liver regeneration (hALR)
Probes are particularly useful for this purpose. DNA encoding the polypeptide of the present invention and
And cDNA molecules using the methods described in more detail below,
Obtain complementary genomic DNA, cDNA, or RNA from animals or other animal sources
Or more relevant by screening cDNA or genomic libraries
cDNA or genomic clones can be isolated.
The present invention relates to isolated nuclei derived from the sequences shown in FIGS. 3, 4, 8, 11 and 15.
Acid sequences (including sense and antisense oligonucleotide sequences). hN
Sequences from ET, hABC3, PRL3L (SEM L3), and hALR also contain heterologous sequences (pro
Motor, enhancer, response element, signal sequence, polyadenylation sequence
Etc.). Further, nucleic acids are stable, soluble, binding affinity,
And can be modified to alter specificity. For example, a sequence derived from the present invention is:
Nuclease resistant phosphorothioates, phosphoramidates and methylphospho
Nate derivatives, and as described in Nielsen et al., Science, 254: 1497, 1991.
The protein nucleic acid (PNA) is formed by coupling a base to the amino acid backbone.
) ". Nucleic acids may be derived from ligation of α-anomeric nucleotides or
Or methyl phosphotriester or ethyl phosphotriester or
It can be derivatized by formation of a kilphosphordate linkage. Further, the core of the present invention
The acid sequence may also provide a detectable signal, either directly or indirectly.
Label. Exemplary labels include radioisotopes, fluorescent molecules, biotin
Including
In general, nucleic acid manipulation according to the present invention is described, for example, in Sambrook et al., Molecular Clonin.
g, A Laboratory Manual 2nd edition (Cold Spring Harbor, NY, 1989) or Ausubel
Et al., Current Protocols in Molecular Biology (Greene Assoc. , Wiley Interscie
nce, NY, NY, 1992) using methods well known in the art.
Examples of nucleic acids include human netrin, human ABC transporter, human ribosomal L3 subtype,
Or RNA, cDNA, or genomic encoding a human enhancer polypeptide for liver regeneration.
Is DNA. Such nucleic acids are shown in FIGS. 3, 4, 8, 11 and 15, respectively.
May have substantially the same coding sequence as the coding sequence.
The present invention relates to hNET, hABC3, PRL3L (formerly SEM L3), hALR gene or
Further providing an isolated oligonucleotide corresponding to the sequence in each cDNA,
These, alone or together, combine a genuine expressed gene with a homolog or other repetitive sequence.
Can be used to distinguish. These oligonucleotides can be from about 12 to about
It can be 60 nucleotides, preferably about 18 nucleotides, single or double stranded
Yes, and can be labeled or modified as described below.
The present invention also differs from the nucleic acids shown in FIGS. 3, 4, 8, 11 and 15 but in the same table.
Have the same type (ie, the same as shown in FIGS. 3, 4, 8, 11 and 15 respectively)
Nucleic acids that substantially encode the amino acid sequence). Phenotypically similar nucleic acids also
, "Functionally equivalent nucleic acids". As used herein, the phrase "functionally equivalent
"Unique nucleic acid" refers to the same protein product (one or more) as the nucleic acid disclosed herein.
) That function in substantially the same manner to produce
And nucleic acids characterized by: In particular, functionally equivalent nucleic acids are referred to herein.
The same protein as that disclosed or having conservative amino acid mutations.
Code. For example, a conservative mutation may involve the replacement of a non-polar residue with another non-polar residue, or
Or the replacement of a charged residue with a similarly charged residue. These mutations are
And mutations recognized by those skilled in the art as mutations that do not substantially alter the tertiary structure of
The nucleic acids of the invention under specific hybridization conditions due to the degeneracy of the genetic code
Not necessarily hybridize to human netrin, human ABC3 transporter, human ribosomal
Encoding L3 subtype and human enhancer polypeptide for liver regeneration
Are further provided. A preferred nucleic acid encoding a polypeptide of the invention is shown in FIG.
Encoding substantially the same amino acid sequence shown in 8, 11, and 15
Consisting of Alternatively, encodes the polypeptide (s) of the invention
Preferred nucleic acids are shown in FIGS. 3, 4, 8, 11 and 15 under high stringency conditions.
The substantially complete sequence or a substantial portion of the nucleic acid sequence shown in
That is, typically, at least 12 to 60 nucleotides).
As used herein, the stringency of hybridization is poly
This refers to conditions under which the nucleotide hybrid is stable. As known to those skilled in the art,
Brid stability is a function of sodium ion concentration and temperature (eg,
See Sambrook et al., Supra).
The present invention provides for operably linked promoters for RNA transcription as well as other regulatory sequences.
Provided isolated polynucleotides. As used herein, the phrase “operable
"Functionally linked" refers to the regulation and effector of polynucleotides and nucleotides
-Sequences (eg, promoters, enhancers, transcription and translation termination sites,
And other signal sequences). For example, polynucleotide
An operable linkage to the promoter is such that DNA transcription specifically recognizes and binds to the promoter.
Is initiated from the promoter by a matching RNA polymerase, and
Polynucleotide that directs transcription of RNA from the polynucleotide.
Refers to the physical and functional relationship between the promoter and the promoter.
The promoter region is sufficient for RNA polymerase recognition, binding, and transcription initiation.
Contains a specific sequence. In addition, the promoter region recognizes and binds RNA polymerase.
And sequences that regulate transcription initiation activity. Such an arrangement may act cis
Or be responsive to trans-acting factors. Depends on the nature of the regulation
Thus, a promoter can be constitutive or regulated. promoter
Examples include SP6, T4, T7, SV40 early promoter, cytomegalovirus (CMV)
Motor, mouse mammary tumor virus (MMTV) steroid-inducible promoter,
Ronnie mouse leukemia virus (MMLV) promoter and the like.
A promoter and clonin to which a polynucleotide can be operably linked
Vectors that contain both coding sites are well known in the art. Such a vector
Can transcribe RNA in vitro, in vivo and in vivo, and
) And Promega Biotech (Madison, WI). Departure
Extra, potential, and unsuitable for optimizing current and / or in vitro transcription
Expression, either at the critical or alternative translation initiation codon or at the transcription or translation level.
5 ′ of the clone and / or to eliminate other sequences that may be harmed or reduced
It may be necessary to remove, add or change the 3 'untranslated portion.
Alternatively, the consensus ribosome binding site is used to enhance the expression
Can be inserted just 5 'to the Similarly, alternative codons encoding the same amino acid are
To enhance transcription, human netrin, human ABC3 transporter, human ribosomal L3
Genotype, or in place of the coding sequence of a human enhancer polypeptide for liver regeneration.
(Eg, the host cell's codon preference can be adopted, and the G-C rich domain
And the like can be reduced).
Examples of vectors are described for expression in various eukaryotic and prokaryotic hosts.
And can be used for gene therapy as well as simple protein expression
Viruses typically used in the art (eg, baculovirus and
Retrovirus), bacteriophage, cosmid, plasmid, fungal vector
, And other recombinant vehicles.
The polynucleotide is inserted into the vector genome using methods well known in the art.
It is. For example, the insert and the vector DNA pair with each other and ligase
Appropriate conditions to create complementary ends on each molecule that can be joined together using
Under certain conditions. Alternatively, the synthetic nucleic acid linker is treated with a restriction enzyme.
Can be ligated to the terminated polynucleotide. These synthetic linkers are
-Contains the nucleic acid sequence corresponding to a particular restriction site in DNA. In addition, stop codons and
Oligonucleotides containing appropriate restriction sites are provided for insertion, for example,
It can be linked to a vector containing some or all: a selectable marker gene (eg,
,
Neural networks for the selection of stable or transient transfectants in mammalian cells
Omycin gene); derived from the immediate early gene of human CMV for high-level transcription
Enhancer / promoter sequence; SV40-derived promoter for mRNA stability
Transcription termination and RNA processing signals; SV40 plasmid for proper episomal replication
Rioma origin of replication and ColE1; diversified multicloning sites; and
T7 and SP6 RNA promoters for in vitro transcription of sense and antisense RNA
Data. Other means are well known and available in the art.
Bacterial cells, yeast cells, amphibian cells, insect cells, mammalian cells, and other animals
Human netrin, human ABC3 transporter, human ribosomal, adapted for expression in cells
L3 subtype and a polynucleic acid encoding a human enhancer polypeptide for liver regeneration
Also provided are vectors containing the nucleotides. Vectors enable their expression
As such, human netrin, human ABC3 transporter, human ribosomal L3 subtype,
Is position relative to a polynucleotide encoding a human enhancer polypeptide for liver regeneration
Polynucleotides in bacteria, yeast, amphibians, mammals, or animal cells
It further contains regulatory elements required for expression of the tide. As used herein, `` expression
'' Means that the polynucleotide is transcribed into mRNA and that the peptide, polypeptide, or
Or the process of being translated into protein. Polynucleotides become genomic DNA
If derived, expression is controlled by mRNA mRNA if an appropriate eukaryotic host is selected.
May include pricing. The regulatory elements required for expression are RNA polymerase
A promoter sequence that binds to the enzyme and a transcription initiation sequence for ribosome binding.
Including. For example, bacterial expression vectors contain a promoter such as the lac promoter.
And a Shine-Dalgarno sequence for transcription initiation and the start codon AUG (Sa
mbrook et al., supra). Similarly, eukaryotic expression vectors contain variants for RNA polymerase II.
Species or homologous promoter, downstream polyadenylation signal, start codon AUG,
And a stop codon for ribosome isolation. Such vectors are commercially available
Obtained by the method or a method well known in the art (for example, constructing a general vector).
(Methods for building above). Departure
Current vectors are useful for generating cells that express the receptor of the present invention.
The present invention relates to human netrin, human ABC3 transporter, human ribosomal L3 subtype, or
Or a transformed host cell that recombinantly expresses a human enhancer polypeptide for liver regeneration.
Provide vesicles. The host cell of the present invention comprises human netrin, human ABC3 transporter, human ribosome.
A polypeptide encoding a somatic L3 subtype or a human enhancer polypeptide for liver regeneration
It has been transformed with a nucleotide. Examples are suitable for expression in mammalian cells.
A mammalian cell containing the combined plasmid. Plasmids are human netrin, human
ABC3 transporter, human ribosomal L3 subtype or human enhancer poly for liver regeneration
Necessary for the expression of the polynucleotide encoding the peptide and the protein of the present invention.
Includes essential regulatory elements.
Suitable host cells are bacteria, archaebacteria, fungi, especially yeast, plant cells, insect cells, and others.
And animal cells, especially mammalian cells. E. coli, B. Subtilis, Saccharomyces
cerevisiae, SF9 cells, C129 cells, 293 cells, Neurospora, and CHO cells, COS cells
Vesicles, HeLa cells, and immortalized mammalian myeloid and lymphoid cell lines are of particular interest
deep. Preferred replication systems include M13, ColE1, SV40, baculovirus, λ, adenovirus
Includes ills, artificial chromosomes, etc. Numerous transcription initiation and termination regulatory regions have been isolated
And is effective at transcribing and translating heterologous proteins in various hosts.
Are shown. Examples of these regions, isolation methods, modes of operation, etc. are publicly available in the art.
Is knowledge. Under appropriate expression conditions, the host cell may contain the recombinantly produced hNET, hABC3, R
PL 3L (formerly SEM L3), and / or can be used as a source of hALR.
Nucleic acids (polynucleotides) encoding the polypeptides of the invention may also be recombinant.
Events can be incorporated into the genome of the recipient cell. For example, such a distribution
Rows are microinjected into cells, which results in hNET, hABC3, RPL3L (hereinafter
Previously SEM L3), and / or the endogenous gene encoding hALR,
Or pseudogene, or hNET, hABC3, RPL3L (SEM L3), or hALR-encoded genes
It may result in homologous recombination at the site of the sequence having substantial identity to the offspring.
Other recombination-based methods (eg, heterologous recombination) or, in particular,
Endogenous gene deletion by homologous recombination in can also be used.
The present invention relates to isolated peptides, polypeptides encoded by the nucleic acids of the invention.
Provide the drug (s) and / or protein (s)
You. The invention also relates to the hNET, hABC3, RPL3L (SEM L3) and hALR genes.
Polypeptide having the sequence to be encoded, and 6 polypeptides derived therefrom.
Includes peptides of the above amino acids. The polypeptide (s) will be
Or can be isolated from human tissue obtained by autopsy or described herein.
Can be produced in heterologous cells by the following recombinant DNA method.
As used herein, the term "isolated" refers to cellular components and / or natural
A protein molecule that is free of contaminants normally associated with in vivo smells. Departure
The clear polypeptide and / or protein may be any naturally occurring allele.
Includes variants as well as recombinant forms thereof. Polypeptides of the invention are well known to those of skill in the art.
Can be isolated using various methods.
Methods available for isolating and purifying the proteins of the invention include precipitation, gel filtration,
And chromatographic methods (molecular sieving, ion exchange, and, for example, hNET
, HABC3, RPL3L (SEM L3), and / or hALR-specific antibodies or ligands
(Including the affinity chromatography used). Another well-known method is De
utscher et al., Guide to Protein Purification: Methods in Enzymology Volume 182 (A
cademic Press, 1990). Recombinant polypeptide of the invention to be purified
When produced in a recombinant system, the recombinant expression vector may have an additional amino terminus or
These sequences may include additional sequences that encode the carboxy terminal amino acids;
Noic acid can be purified by immunoaffinity purification using immobilized antibodies or immobilized ligands.
Serves as a "tag" for the affinity purification used.
Peptides containing hNET, hABC3, RPL3L (SEM L3), or hALR specific sequences are
Proteolytic cleavage was used (e.g., using a proteic such as trypsin well known in the art).
Isolated by the chemical treatments such as the thease and cyanogen bromide).
HNET, hABC3, RPL3L (SEM L3), or hALR polypeptide. is there
Alternatively, peptides up to 60 residues in length can be milled using a commercially available peptide synthesizer.
It can be synthesized on a daily basis in the desired amount.
Examples of means for preparing the polypeptide (s) of the invention include
Suitable host cells (eg, bacterial cells, yeast cells, amphibians) can be prepared using methods well known in the art.
Cells (ie, oocytes), insect cells (ie, Drosophila), or
In mammalian cells), hNET, hABC3, RPL3L (SEM L3), and / or hALR
Express the encoding polynucleotide and express it again using well-known methods.
To recover the recovered polypeptide. The polypeptide of the present invention is described in detail below.
It can be isolated directly from cells transformed with the described expression vectors. Of the present invention
Polypeptides, biologically active fragments, and functional equivalents thereof also
, Can be produced by chemical synthesis. As used herein, the term "biologically active
In FIGS. 4, 8, 11, and 15 that can be assembled into active proteins.
Any part of the polypeptide represented by the amino acid sequence. Synthetic polypep
Pide was purchased from Applied Biosystems, Inc. using chemistry provided by the manufacturer. Model
430A or 431A automated peptide synthesizer (Foster City, CA)
You.
The following phrases: "recombinantly expressed / produced", "isolated", or
Nucleic acids, polynucleotides, polypeptides of the invention having "substantially pure"
, Peptides, or protein modifications can be produced by humans in such forms.
Nucleic acids, polynucleotides that have been isolated from their natural in vivo cellular environment.
Includes nucleotides, polypeptides, peptides, or proteins. This person's intervention
As a result of the recombinant nucleic acids, polynucleotides, polypeptides, peptides
And proteins, where the corresponding naturally occurring molecule is a selective drug or compound.
It is useful in that it is not as useful as the identification of
Sequences having "substantial sequence homology" have at least about 90% of the nucleic acids of the invention.
A nucleotide sequence that shares identity; and at least with a polypeptide of the present invention.
Intended to refer to an amino acid sequence that typically shares about 95% amino acid identity.
It is. However, it contains less than the above level of homology that occurs as a splice variant
Or modified by conservative amino acid substitutions or by substitution of degenerate codons
It is recognized that polypeptides or nucleic acids that are also included within the scope of the present invention.
You.
The present invention relates to human netrin, human ABC3 transporter, human ribosomal L3 subtype, or
Or nucleic acid sequence encoding a human enhancer polypeptide for liver regeneration
(Eg, within the nucleotide sequences shown in FIGS. 3, 4, 8, 11, and 15, respectively)
And a polynucleotide that can specifically hybridize with the
A nucleic acid probe.
As used herein, a "nucleic acid probe" is shown in FIGS. 3, 4, 8, 11, and 15.
About 12 to about 60 contiguous bases, preferably about 18 nucleotides, comprising a single strand or
Can be double-stranded and can be labeled or modified as described herein.
Nucleotide sequence. The preferred region from which the construction probe is derived is 5 'or
And / or 3 'coding sequences, sequences predicted to encode transmembrane domains,
Sequences predicted to encode the cytoplasmic loop, signal sequence, ligand binding site
Including
The full length or fragment of the cDNA clone can also be used to detect and
Can be used as a probe for release. Fragments used as probes
If preferred, the cDNA sequence is derived from the carboxy-terminal coding portion of the cDNA,
Most preferably it comprises the predicted transmembrane domain coding portion of the cDNA sequence. Transmembrane
Domain regions are described, for example, in Kyte and Doolittle (J. Mol. Biol. 157: 105, 1982)
Can be predicted based on the hydropathic index analysis of the deduced amino acid sequence using the method
.
As used herein, the phrase “specifically hybridizes” refers to a polynucleotide.
Recognizes the nucleic acid sequence complementary to it and via hydrogen bonding between complementary base pairs.
And the ability to form double helix segments. Nucleic acid probe technology is
And those skilled in the art will recognize that such probes can vary greatly in length.
And a detectable agent (eg, radioactive
(A sex isotope, a fluorescent dye, etc.). Professional of the present invention
Can be a human netrin, a human ABC3 transporter, a human ribosomal L3 subtype, or
Useful for detecting the presence of nucleic acids encoding human enhancer polypeptides for liver regeneration
It is. For example, a probe may locate a biological tissue in which a gene of the invention is expressed.
It can be used for in situ hybridization to attach. Further
Human netrin, human ABC3 transporter, human ribosomal L3 subtype, or liver
Complementary to the nucleic acid of a polynucleotide encoding a human enhancer of regeneration polypeptide
The synthesized oligonucleotides were tested for the genes of the invention and their associated mRNAs.
Homology screening for genomic or cDNA libraries
For isolation of related genes using PCR or using amplification techniques well known to those skilled in the art.
And is useful as a probe.
Human netrin, human ABC3 transporter, human ribosomal L3 subtype, or liver
Specific binding to any part of the mRNA encoding the raw human enhancer polypeptide
Antisense oligonucleotides with sequences that can interfere with the translation of mRNA are also provided.
Provided. Antisense oligonucleotides include human netrin, human ABC3 transporter
, Human ribosome L3 subtype, or human enhancer polypeptide for liver regeneration
May have a sequence that can specifically bind to any part of the cDNA sequence to be loaded. This specification
As used in the phrase "specifically binds," the nucleic acid sequence recognizes a complementary nucleic acid sequence,
And form double helical segments with complementary base pairs via hydrogen bonding between them
Including the ability to Examples of antisense oligonucleotides are the chemical
Anti-sense oligonucleotides containing analogs (ie, synthetic antisense
Oligonucleotide, SAO).
Passes through the cell membrane and human netrin, human ABC3 transporter, human ribosomal L3
Specific for mRNA encoding subtype or human enhancer polypeptide for liver regeneration
Acceptable hydrophobic carrier capable of binding to its translation and crossing cell membranes
Prevent human netrin, human ABC3 transporter, human ribosomal L3 subtype
Or antisense agents effective to reduce expression of the human enhancer polypeptide.
A composition comprising an amount of a sense oligonucleotide (SAOC) is also provided herein.
It is. Acceptable hydrophobic carriers that can cross cell membranes can also be selected cell types.
That bind to specific receptors for
May include structures that are absorbed. This structure binds to cell type specific receptors
May be part of a known protein.
The present invention provides synthetic antigens that inhibit the translation of mRNAs encoding these polypeptides.
Of the present invention by using antisense oligonucleotide composition (SAOC)
To provide a means of regulating the expression level of the peptide. Recognizes and specifically binds mRNA
Synthetic oligonucleotides or other antisense chemical structures designed to
The construction of DNA, RNA, or chemically modified artificial nucleic acids is shown in Figures 3, 4, 8, 11, and
And are constructed to be complementary to portions of the nucleotide sequence shown in FIGS. SA
OC can be used in the bloodstream for administration to a subject by injection, or in the laboratory.
Designed to be stable under culture conditions. SAOC can cross cell membranes
Depending on the physical and chemical properties of the SAOC (for example, creating a small hydrophobic SAOC chemical structure)
Specific transport of cells that recognizes SAOC and transports it to cells)
The delivery system is designed to be able to cross the cell membrane and enter the cytoplasm of the cell.
In addition, SAOCs are specific for binding and absorbing SAOCs only within selected cell populations.
By targeting SAOCs as recognized by a specific cell uptake mechanism
Can be designed for administration to only a selected population of cells. For example, SAOC
Binds to receptors found only on certain cell types as discussed in
Can be designed. SAOC also recognizes and selectively binds target mRNA sequences
Which are included in the sequences shown in FIGS. 3, 4, 8, 11 and 15.
Can correspond to an array. SAOC binds to target mRNA and degrades mRNA (eg, RNase I
) Or prevent the binding of translational regulators or ribosomes.
Harm, or other chemical structure that either degrades or chemically modifies the target mRNA.
(Eg, ribozyme sequences or reactive chemical groups) to convert mRNA targets.
It is designed to inactivate the target mRNA sequence either by inhibiting translation.
SAOC may be capable of such properties when directed against mRNA targets.
(Cohen et al., TIPS, 10: 435, 1989 and Weintraub, Sci. American,
January 40, 1990).
The present invention relates to an acceptable carrier as well as isolated purified human netrin, human AB
C3 transporter, human ribosomal L3 subtype, or polypep, a human enhancer of liver regeneration
Pide, its active fragment, or purified mature protein and its activity
Further provided are compositions comprising fragments, alone or in combination with each other. This
These polypeptides or proteins can be obtained recombinantly or chemically synthesized
Or purified from natural sources. As used herein, the term
An "acceptable carrier" is a standard pharmaceutical carrier (eg, a phosphate buffered saline diet).
Aqueous salt solutions, water, and emulsions (eg, oil / water or water / oil emulsions)
), And any of various types of wetting agents).
The human netrin, human ABC3 transporter, human ribosomal L3 subtype of the present invention, or
Also provides antibodies that have specific reactivity with human enhancer polypeptides for liver regeneration
It is. Active fragments of an antibody are included within the definition of “antibody”. Antibodies of the invention
Are those known in the art using the protein of the present invention or a portion thereof as an antigen.
Method. For example, polyclonal and monoclonal antibodies
For example, Harlow and Lane, Antibodies: A Laboratory Manual (Cold Spring Har
bor Laboratory 1988), by methods well known in the art.
Can be
The polypeptides of the present invention are used as immunogens in the production of such antibodies.
Can be Alternatively, the synthetic peptide is prepared (using a commercially available synthesizer) and
It can be used as an immunogen. Natural or synthetic hNET, hABC3, RPL3L (SEM L3),
And / or using peptides derived from hALR, hNET, hABC3, RPL3L (SEM L3)
And / or induces a hALR-specific immune response, this peptide is a suitable key
Carrier (eg, KLH) and a suitable adjuvant (eg,
, Freund's adjuvant). Preferably selected
The peptide was obtained from Tam, Proc. Natl. Acad. Sci, USA. 85: 5409-5413, 1988
It is bound to the lysine core carrier according to the target. The resulting antibody is in a monovalent form (eg,
For example, Fab, FabTwo, FAB ', FV). Anti-idiotype antibodies are also public
It can be prepared using known methods.
In one embodiment, normal or mutant hNET, hABC3, RPL3L (SEM L3), and
HALR polypeptide immunizes mice, after which their spleens are removed and
Using splenocytes and cells with myeloma cells according to standard techniques in the art
Used to form hybrids and obtain clones of antibody-secreting cells
. The resulting monoclonal antibodies include hNET, hABC3, RPL3L (SEM L3), and / or
Is the hALR protein or hNET, hABC3, RPL3L (SEM L3), and / or
Screened for specific binding to the ream peptide.
In another embodiment, the antibody is normal or mutant hNET, hABC3, RPL3L (SEM L3)
, Or for selective binding to the hALR sequence. hNET, hABC
3, antibodies that distinguish between normal and mutant forms of RPL3L (SEM L3) or hALR are ELIS
In diagnostic tests (see below) using A, EMIT, CEDIA, SLIFA, etc.
Can be used. Anti-hNET, hABC3, RPL3L (SEM L3), or hALR antibodies also
And can be used to perform histochemical localization studies. Finally, antibodies are normal
Or
HNET, hABC3, RPL3L (SEM L3), and / or hALR polypep
Blocking the function of the tide or conducting rational drug design studies (eg,
Identify and test inhibitor function (using an anti-idiotypic antibody approach)
Can be used to test.
The amino acid sequence is the hydrophobic or hydrophilic domain of the polypeptide to which they correspond.
Can be analyzed by methods well known in the art to determine whether to code
You. Altered antibodies (eg, chimeric, humanized, CDR-conjugated, or bifunctional antibodies)
) Can also be produced by methods well known in the art. Such antibodies also
See, for example, the hive described in Sambrook et al., Supra and Harlow and Lane, supra.
It can be produced by lidoma, chemical synthesis, or recombinant methods. Anti-peptide and anti-
Both fusion protein antibodies can be used (eg, Bahouth et al., Trends Pharma).
col. Sci. 12: 338, 1991; see Ausubel et al., supra).
The antibodies of the invention can be used to isolate a polypeptide of the invention. Follow
Antibodies may be used to detect the presence of a polypeptide of the invention, as well as localize the polypeptide.
, Composition, and structure of functional domains. Human netrin, human AB
C3 transporter, human ribosomal L3 subtype, or polypep, a human enhancer of liver regeneration
Methods for detecting the presence of a tide allow binding of an antibody to a polypeptide
Contacting the cell with an antibody that specifically binds to the polypeptide under conditions,
Detecting the presence of the antibody bound to the
Detecting the presence of the polypeptide. Detection of such polypeptides
For, the antibodies can be used in in vitro diagnostic or in vivo imaging methods.
Target human netrin, human ABC3 transporter, human ribosomal L3 subtype in sample
Or immunology useful for in vitro detection of human enhancer polypeptides for liver regeneration
Typical procedures include immunoassays using detectable antibodies. Such an immuno
Assays are well known in the art, for example, ELISAs, Pandex microfluorometric assays
, Agglutination assays, flow cytometry, serodiagnostic assays, and immunoorganization
Biological staining procedure. Antibodies can be made detectable by various means well known in the art.
Can be For example, a detectable marker can be directly or indirectly linked to the antibody.
obtain. Useful markers include, for example, radionuclides, enzymes, fluorogens, colors
Elementary
And chemiluminescent labels.
For in vivo imaging methods, a detectable antibody can be administered to a subject, and
Binding of the antibody to the polypeptide of the invention is detected by imaging techniques well known in the art.
Can be issued. Suitable imaging agents are known and are described, for example, in U.S. Pat.
No. 7, γ-ray radionuclide (for example,111In,99mTc,51Cr etc.)
In addition to paramagnetic metal ions. Radionuclide, gamma-ray scintillation photometry
Positron emission tomography, single photon emission computed tomography, and gamma
X-ray camera enables tissue imaging with whole-body imaging, while paramagnetic metal ions
Enables visualization by magnetic resonance imaging.
The present invention relates to human netrin, human ABC3 transporter, human ribosomal L3 subtype, or
Or a transgene capable of expressing a nucleic acid encoding a human enhancer polypeptide for liver regeneration
A genic non-human mammal is provided. Normal activity is not possible (ie,
Human netrin, human ABC3 transporter mutated to
, Human ribosome L3 subtype, or human enhancer polypeptide for liver regeneration
A transgenic non-human mammal capable of expressing the nucleic acid to be loaded is also provided.
.
The present invention also relates to human netrin, human ABC3 transporter, human ribosomal L3 subtype
Or an antibody complementary to mRNA encoding a human enhancer polypeptide for liver regeneration
Sense mRNA (which hybridizes to the mRNA and thereby reduces its translation
), Human netrin, human ABC3 transporter, human ribosomal
Nucleic acid encoding a human L3 subtype, or a human enhancer polypeptide for liver regeneration
Transgenic non-human female having a genome containing an antisense nucleic acid complementary to
Provide dairy animals. The polynucleotide may be one whose expression is induced or
Inducible promoter and / or tissue specific regulation so that it can be restricted to the vesicle type
Elements may further be included. Examples of polynucleotides are shown in FIGS.
Or cDNA having a coding sequence substantially the same as the coding sequence shown in SEQ ID NOs: 15 and 15
It is. Examples of non-human transgenic mammals include transgenic bovine,
Sheep, goats, pigs, rabbits, rats, and mice. Tissue specificity determination
Examples of elements are the metallothionein promoter and the T7 promoter.
Animal model systems to elucidate the physiological and behavioral roles of the polypeptides of the invention
,
Production of transgenic animals in which polypeptide expression is altered using various techniques
It is produced by forming. An example of such a technique is to produce transgenic animals.
Microinjection, retroviral infection, or
Human netrin, human ABC3 transporter, human
Encodes a ribosome L3 subtype or a human enhancer polypeptide for liver regeneration
Includes the insertion of a normal or mutated version of the nucleic acid. For example, Carver et al., Bio / Techno
logy 11: 1263-1270, 1993; Carvcr et al., Cytotechnology 9: 77-84, 1992; Clark et al.
Bio / Technology 7: 487-492, 1989; Simons et al., Bio / Technology 6: 179-183,19.
88; Swanson, Bio / Technology 10: 557-559, 1992; Velander et al., Proc. Natl. Acad.
.Sci., USA 89: 12003-12007, 1992; Hammer et al., Nature 315: 680-683, 1985; Krim.
penfort et al., Bio / Technology 9: 844-847, 1991; Ebert et al., Bio / Technology 9: 835.
-838, 1991; Simons et al., Nature 328: 530-532, 1987; Pittius et al., Proc. Natl. Aca
d.Sci., USA 85: 5874-5878, 1988; Greenberg et al., Proc. Natl. Acad. Sci., USA 88: 8.
327-8331, 1991; Whitelaw et al., Transg. Res. 1: 3-13, 1991; Gordon et al., Bio / Techn.
ology 5: 1183-1187, 1987; Grosveld et al., Cell 51: 975-985, 1987; Brinster et al.
Proc. Natl. Acad. Sci., USA 88: 478-482.1991; Brinster et al., Proc. Natl. Acad. Sci.
., USA 85: 836-840, 1988; Brinstcr et al., Proc. Natl. Acad. Sci., USA 82: 4438-4442.
A1-Shawi et al., Mol. Cell. Biol. 10 (3): 1192-1198, 1990; Van Der Putten.
Acad. Sci., USA 82: 6148-6152, 1985; Thompson et al., Cell 56: 313-.
321, 1989; Gordon et al., Science 214: 1244-1246, 1981; and Hogan et al., Manipul.
ating the Mouce Embryo: A Laboratry Manual (Cold Spring Harbor Laboratory
, 1986).
Another technique, mutation or normality of these genes in transgenic animals
Homologous recombination between the version and the native locus will result in expression regulation of the polypeptide of the invention.
Can be used to alter a node or structure (Capecchi et al., Science 244: 1288, 198)
9; see Zimmer et al., Nature 338: 150, 1989). Homologous recombination technology
Well known in the art. Homologous recombination replaces a natural (endogenous) gene with a recombinant gene or
It cannot replace the mutated gene to express the native (endogenous) protein.
Human netrin, human ABC3 transporter, human ribosomal L3 subtype, or liver regeneration
Can express mutant proteins that result in altered expression of human enhancer polypeptides
Make animals.
In contrast to homologous recombination, microinjection eliminates host genes.
Add genes to the host genome without the need. Microinjection is intrinsic
Both exogenous and exogenous human netrin, human ABC3 transporter, human ribosomal L3 subtype
Or a transgene capable of expressing a human enhancer polypeptide for liver regeneration.
Animal. Inducible promoter regulates transgene expression
To the coding region of the nucleic acid to provide a means for Tissue-specific regulation
Elements are coding regions to allow tissue-specific expression of the transgene
Can be connected. Transgenic animal model system activates polypeptide response
Ligands (ie, agonists and antagonists)
It is useful for in vivo screening of compounds for determination.
Nucleic acids, oligonucleotides (including antisense) of the present invention, and vectors containing the same
, Transformed host cells, polypeptides, and antibodies
To determine if the compound is a potential agonist for the protein of the invention.
Can be used to determine whether it functions as a host or antagonist.
These in vitro screening assays are based on the function and function of the proteins of the invention.
Information on the specific interaction with the protein of the invention.
Can lead to the identification and design of possible compounds.
According to yet another embodiment of the present invention, human netrin, human ABC3 transporter, human
Binds ribosomal L3 subtype or human enhancer polypeptide for liver regeneration
Methods are provided for identifying compounds. The protein of the present invention has competitive binding
Can be used in assays. Such an assay provides a rapid method for large numbers of compounds.
Compatible with screening to determine which compounds can bind to a polypeptide of the invention.
, If any, can be decided. Then, a more detailed assay, such as
Is a modulator, agonist, or antagonist of a polypeptide of the invention.
Found to bind to further determine whether it acts as a gonist
Can be performed with those compounds used.
According to another embodiment of the present invention, the polypeptide of the present invention is expressed recombinantly.
The transformed host cell can be contacted with a test compound, and then its modulating effect is tested.
Human netrin, human ABC3 transporter, human ribosomes in the presence and absence of the compound
To compare human L3 subtypes or human enhancer polypeptide-mediated responses of liver regeneration
Or test cells or control cells (ie,
By comparing the response to the presence of the compound
Can be evaluated.
As used herein, compounds that “modulate activity” of a polypeptide of the invention
Or the activity of the polypeptide of the invention is determined by the absence of the compound or signal.
Differently in the presence of compound or signal from below, human netrin, human ABC3
Transporter, human ribosomal L3 subtype, or human enhancer polypeptide, liver regeneration
A compound or signal that alters the activity of the compound. In particular, such compounds or
Signals include agonists and antagonists. Agonists are polypep
Includes compounds or signals that activate tid function. Alternatively, an antagonist
Include compounds or signals that interfere with polypeptide function. Typically, Ann
The effects of the agonists are viewed as blocking agonist-induced protein activation.
Be guessed. Antagonists include competitive and non-competitive antagonists. Competition
Synergistic antagonists (or competitive blockers) are specific for agonist binding
Interact at or near the site. Non-competitive antagonist or blocker
Interact with a site other than the agonist interaction site,
Inactivates the function of the tide.
The following examples are intended to illustrate the invention without limiting the scope of the invention.
Illustrated.
Example I: Contig assembly
A. Cosmid
Multiple cosmids to initiate walking in YAC and P1 libraries
Used as reagent. Clone 16-166N (D16S277), 16-191N (D16S279), 16-198
N (D16S280), and 16-140N (D16S276) were previously isolated from a cosmid library
(Lerner et al., Mamm. Genome 3: 92-100, 1992). Cosmid cCMM65 (D16S84), c2
Cloning insert 91 (D16S291), cAJ42 (ATP6C), and cKG8 as probes
Products (CMM65) or sequence-specific oligonucleotides
Cosmid library (built in house or by Stratagene, La Jolla, CA)
). c326 cosmid contig and clone 413C12
Generated from a flow-sorted chromosome 16 library (Stallings et al., Genomics)
13 (4): 1031-1039, 1992). c326 contig was clone 2H2, 77E8, 325A11,
And 325B10.
B. YAC
Gridded interspersed repeats with cosmid-specific IRS probes (Mark
IRS, Mark II, and IRS pools from the Mega-YAC library)
As described previously (Liu et al., Genomics 26: 178-191, 1995). IR
S probe was used for cosmids 16-166N, 16-191N, cAJ42, 16-198N, 325A11, cCMM65,
And made from 16-140N. The biotinylated YAC probe was used to identify the IRS products from each YAC.
A nick-translating complex mixture was made. Blend of sufficient complexity
The mixture was subjected to independent DNA amplification of whole yeast DNA using various Alu primers (Lic
Hter et al., Proc. Natl. Acad. Sci., USA 87: 6634-6638, 1990), followed by the most diverse
This was achieved by combining the appropriate reactants, including
C. P1
Chromosome walking experiments were performed using a single set of members containing a gridded P1 library pool.
This was performed using brene (Shepherd et al., Supra, 1994). The grid filter is
Dr. Mark Leppert and the Utah Center for Human Genome Research
Kindly provided by the Technology Access Section. P1 gridded membrane
Ren is treated with a set of chromosome 16 cosmids (see above) and
Screened using a terminal probe from the P1 clone as defined
. Both RNA transcripts and bubble-PCR products were utilized as end probes.
D. probe
Radiolabeled transcripts were tested against phage RNA polymerases T3, T7, and SP6.
Restriction enzyme digested cosmid or P1 (AluI, HaeIII, RsaI, TaqI)
It was produced using. T3 and T7 promoter elements are cosmid-derived
T7 and SP6 promoter sequences, while the P1-based template
Included in the rate. The transcription reaction is [αP32] -ATP (Amersham, Arlington Heights, I
L) as recommended by the manufacturer (Stratagene, La Jolla, CA) in the presence of
Was.
Bubble-PCR products were synthesized from restriction digested P1 (AluI, HaeIII, RsaI, TaqI)
. A bubble adapter with appropriate overhangs and phosphorylated 5 'ends
(Riley et al., Nuc. Acids Res. 18: 2887-2890, 1990).
Ligated to digested P1 DNA. Universal vector derived from bubble adapter sequence
The sequence of the vectorette primer is 5'-GTTCGTACGAGAATCGCT-3 '(SEQ ID NO: 67).
) And of Riley and his collaborators with 12 fewer 5 'nucleotides
Different from the ones. Tm of shortened vectorette primer is derived from vector
Of a paired amplimer derived from the promoter sequence (SP6, T7)
It matched it more closely. The desired bubble-PCR product is gel purified before radiolabeling.
(Feinberg et al., Anal. Biochem. 132: 6-13, 1983; Feinberg and Vogelstei).
n, Anal. Biochem. 137: 266-267, 1984).
Specificity of all end probes on a single set of gridded P1 filter arrays
Determined before their use in. Radiolabeled probe as recommended (Li
fe Tcchnologies Inc., Gaithersburg, MD) previously annealed to Cot1 DNA, then
0-20 ng of each of the following DNA: Cloned used to create the probe
One or more unrelated cloned genomic DNAs;
A cloned vector (without insert); and human genomic DNA ligated,
Hybridized to small pieces of nylon membrane.
Hybridization was performed with CAK solution (5x SSPE, 1% SDS, 5x Denhardt's
Solution, 100 mg / mL Torula RNA) at 65 ° C. overnight. Each end probe has 5
× 10FivePresent at a concentration of cpm / mL. The hybridized membrane is added to 0.1 × SSC /
Washed at 65 ° C. to a final stringency of 0.1% SDS. Hybridization
The results were visualized by autoradiography. Each of them
Strongly hybridized to the roned template, while unrelated
Do not hybridize to cloned, vector, or genomic DNA
New probe and use it to screen the gridded P1 filter.
I did it.
Hybridization to the sequenced P1 pool
Except for occasional use, describe nylon membrane pieces (above).
I went as if. Positive clones were identified and 100 mm plates (LB + 25 mg / mL
Plate at a density of 200-500 cfu per isin) and use an 82 mm HATF membrane (Millipo
re, Bedford, MA) and processed for hybridization (Sambro
ok et al., supra) and then rescreened with the complex probe mixture.
Select a single positive clone from each pool and re-add to the master plate
Plated. Colony-purified genomic P1 clone and its corresponding probe
Multiple P1 DNA dot blots were prepared to identify
Each was hybridized to a sex-labeled probe. All hybridizations
Chromosome 16p13.3 reference probe (eg, cAJ42) as well as a uniquely labeled
Included P1 DNA probe.
Example II: Exon Trapping
Genomic P1 clones are digested with PstI, double digested with BamHI / BglII, or restricted
Prepared for exon trapping experiments by partial digestion with an amount of Sau3AI.
BamHI digested digested P1 DNA and ligated to pSPL3B, a dephosphorylated vector
On the other hand, PstI digested P1 DNA
Cloned.
The ligation was performed with 1, 3, or 6 mass equivalents of 50 ng of vector DNA and digested P1 DNA.
Was performed in triplicate. Transformations are performed after overnight incubation at 16 ° C.
1/10 and 1/2 of the transformants were plated on LB (ampicillin) plates
. After overnight growth at 37 ° C, colonies were selected for the highest transformation efficiency ("no insert" series).
Scrape the plate with (based on comparison with the knot control)
Miniprep was performed using the re-dissolution method. To determine the ratio of pSPL3B containing insert
, A small portion of the miniprep was replaced with HindIII (this is the p
SpL3B).
Example III: RNA preparation
Approximately 10 μg of residual miniprep DNA is ethanol precipitated and resuspended in 100 μl of sterile PBS.
Turbid and 約 2 × 10 5 using BioRad GenePulser electroporator6Pieces of CO
S-7 cells (in 0.7 ml ice-cold PBS) were electroporated (1.2 kV, 25 μF
And 200Ω). Incubate the electroporated cells on ice for 10 minutes.
After plating, transfer to a 100 mm tissue culture dish containing 10 ml of pre-warmed complete DMEM.
Were added.
Cytoplasmic RNA was isolated 48 hours after transfection. Transfect
The isolated COS-7 cells were purified with 0.25% trypsin / 1 mM EDTA (Life Technologies Inc., G.
aithersburg, MD). Trypsin treatment
Wash cells with DMEM / 10% FCS and add 1 μl RNAsin (Promega, Madison, WI)
400 μl of replenished ice-cold TKM (10 mM Tris-HCl (pH 7.5), 10 mM KCl, 1 mM MgClTwo)
Resuspended. After adding 20 μl of 10% Triton X-100, the cells were incubated on ice for 5 minutes.
Cubbed. Nuclei were removed by centrifugation at 1200 rpm for 5 minutes at 4 ° C. 30
Add microliters of 5% SDS to the supernatant and remove cytoplasmic RNA from phenol / chlorophore.
Further purification by three extractions with lume / isoamyl alcohol (24: 24: 1)
Was. The cytoplasmic RNA is ethanol precipitated and 50 μl of HTwoResuspended in O.
Reverse transcription and PCR were performed using commercially available exon-trapping oligonucleotides (LifeT
echnologies Inc., Gaithersburg, MD) (Church et al.
Supra, 1994), with the cytoplasmic RNA prepared above. The resulting CUA tailed
The product is added to pAMP10 as recommended by the manufacturer (Life Technologies Inc.,)
Shotgun subcloning. Random clones derived from each ligation
Analyzed by colony PCR using R primer (Life Technologies Inc.)
.
Miniprep DNA containing pAMP10 / exon trap was prepared according to the manufacturer's instructions.
EasyPrep assembly or QIAwell8 system (Pharmacia, Pistcataway, respectively)
, NJ and Qiagen Inc., Chatsworth, CA) by alkaline lysis overnight
Prepared from The DNA product containing the trapped exon was converted to a 177 bp
Selected for sequencing based on comparison with "only" DNA product.
Example IV: Sequencing
DNA sequencing was performed using Pharmacia ALF and Applied Biosystems 377PRISM automated DNA
This was performed using a sequencer (Piscataway, NJ and Foster City, CA). DNA distribution
The columns were aligned using Sequencher DNA analysis software (Genecodes, Ann Arbor, MI).
Lined up. DNA and protein database searches were performed using BLASTN (Altschul et al., J. Mol.
Biol. 215: 403-410, 1990) and BLASTX (Altschul et al., Supra, 1990; Gish et al., Nat.
Genet. 3266-272, 1993). Replace the SASE sequence with BLAST (Alts ch
ul et al., supra, 1990; Gish et al., supra, 1993) and FASTA (Lipman et al., Science 227: 1).
435-1441, 1985) Analyzed by processing the search. Protein sequence, MacVe
ctor (Oxford Molecular Group, Cambell, CA), BCM Launcher (Smith et al., Genome
Research 6: 454-462, 1996), ClustalW (Thompson et al., Nucleic Acids Res. 22: 467).
3-4680, 1994), and PSORT (Nakni et al., Genomics 14: 897-911, 1992).
Was analyzed.
Example V: RT-PCR, RACE, SASE, and cDNA isolation
Two oligonucleotide primers based on the determined sequence (above)
(Table II) using Oligo 4.0 (National Bioscienccs Inc., Plymouth, MN).
Designed for Kixon trap.
Which tissue-specific libraries should be screened for transcripts or cDNA
The RT-PCR reaction and / or PCR reaction should be performed on each exon trap to determine
Using oligonucleotide primers designed for
Using tissue-derived RNA and / or cDNA libraries as templates
I went there.
The exon-designed oligonucleotides (Table II) are then used for one or more of the following:
Use the corresponding tissue-specific cDNA library to use in the positive selection format below.
Lee was screened.
For RT-PCR experiments, the first oligonucleotide was used as the sense primer.
And using the second oligonucleotide as an antisense primer
Was. RT-PCR for poly A from adult brain and placenta+As described using RNA (K
awasaki, In PCR Protocols: A Guide to Methods and Applications, Innis et al.
Academic Press, San Diego, CA, pp. 21-27, 1990). All PCR products
Using the pGEM-T vector as described by the manufacturer (Promega, Madison, WI)
Cloned.
To clone the sequence 3 'of the selected exon trap,
End rapid amplification (RACE) was performed as described (Frohman, PCR Met. Appl. 4: S40-
S58, 1994). In the 3′RACE experiment, the first oligonucleotide was
Used as a primer and a second oligonucleotide with an internal primer
Used.
A first oligonucleotide primer for the Genetrapper cDNA positive selection system
The immer is biotinylated and used for direct selection while the second oligonucleotide
Was used for restoration.
In addition to exon trapping, cloning contigs also
Genomic P1 clone (Dackowski et al., Genome Res. 6: 515-524, 1996)
And essentially as described (Parimoo et al., Anal. Biochem. 228: 1-17 1995) c
Screened using DNA selection. Other coding sequences, SAmple SEquen
Obtained by cing (SASE).
SASE was performed as a functional genomic method for gene identification. Easy going, individual
DNA from P1 was partially digested with Sau3A and the 3 kb fragment was digested with pBluesc
riptKS+It was subcloned into a plasmid (Stratagene, La Jolla, CA). Sa
The clones were sequenced from both ends, and a half-random sequence from the P1 clone
Was prepared.
Example VI: Nucleotide sequence analysis
hNET: Random shotgun library essentially as described (Ande
rsson et al., (1994) Anal. Biochem. 218: 300-308).
Subcloning into P10 vector (Life Technologies Inc., Gaithersburg, MD)
As a result, a 53.8B P1 clone (FIG. 18) was prepared. P1 DNA is sprayed
(Hudson RCI, Temecula, CA). 6 libraries
kb XhoI fragment (which may contain a netrin-encoded exon trap)
(Figure 18)). After that, distribute the library
Flanking 3.5 kb XhoI fragment to obtain additional clones for row determination
Was screened. Positive clones were isolated as previously described (The Americ
an PKD1 Consortium (1995) Hum. Mol. Genet. 4: 575-582), forward and reverse vector vectors.
It was sequenced using a primer.
The genome sequence is edited using Sequencher (GeneCodes, Ann Arbor, MI) and
Assembled. Copy the coding region to the genomic sequence (in all reading frames
GRAIL2 program (Uberbach) comparing chicken netrin with
er and Mural (1991) Proc. Natl. Acad. Sci., USA 88: 11261-11265; Xu et al., (1994
) Genet.Eng.N.Y.16: 241-253) World Wide Web version and MacVec
tor (Oxford Molecular Group, Cambell, CA) Pustell DNA / protein matrix
Predicted using analysis. Database searches were performed using BLASTN (Altschul et al. (1990) J. Mol.
iol. 215: 403-410) and BLASTX (Altschul et al., 1990, supra; Gish and States (19
93) Nat. Genet. 3: 266-272).
RT-PCR: Adults (brain, heart, kidney, leukocyte, liver, lung, lymphoblastoma cell line, embryo
CDNA libraries for both disc, spleen, and testis) and fetal (kidney and brain)
Was purified by PCR as described (Van Raay et al., 1996, supra).
Prescreened for presence. Using nested RT-PCR,
The transcribed sequence derived from the gene was cloned. Briefly, spinal poly A+RNA (C
lontech, Palo Alto, CA) as described (Kawasaki, 1990 "PCR Protoc
ols: A Guide to Methods and Appllcations '' (M.A.Innis, D.H.Gelfand, J.J.Sn
insky and T.J.White, Ed.), pp. 21-27, Academic Press, Inc., San Diego) Run
Reverse transcription was performed using dumb primers.
Primers for PCR (Table IV) were replaced with exons predicted from genomic sequence analysis.
And was used to amplify spinal cord RNA. Because the spinal cord
Because it has previously been shown to express low levels of chicken netrin (
Serafini et al., Supra). Nested PCR detects RT-PCR products from human spinal cord RNA
It was needed to be. Reverse transcription of spinal cord RNA using random primers
And the primary PCR was performed using primers designed from the genetic model (Table IV).
Performed in the presence of M betaine (Sigma Chemical Co., St. Louis, MO). Then 1
The secondary PCR reaction was diluted 1:20 and the secondary PCR was performed again in the presence of betaine
Using primers (also designed from the gene model), 1 μL
The reaction was performed with the primary reaction. The inclusion of betaine at a final concentration of 2.5 M in the PCR reaction was
Dramatically increased the purity and yield of human netrin RT-PCR products (eg,
Open WO 96/12041; Reeves et al., (1994) Am. J. Hum. Genet. 55.A238; Baskaran et al., (1
996) Genome Rcsearch 6: 633-638).
RT-PCR products were analyzed using pGEM-T (Promega, Madison, WI) as recommended by the manufacturer.
Was used for subcloning. The obtained RT-PCR clone is
Data Chemistry (Perkin Elmer, Foster City, CA) and ABI 377 automated sequencer
-(Perkin Elmer, Foster City, CA)
The sequence was determined using the primers. Multiple sequence alignments can be performed using ClustalW (Tho
mpson et al., (1994) Nucleic Acids Res. 22: 4673-4680).
Sequence analysis of the RT-PCR product shows that hNET contains at least 6 exons
Was. RT-PCR data show that the fourth predicted exon is in the human netrin gene.
Actually being split by introns and existing as two exons
Show. Three of the RT-PCR exons must be identical to the first exon trap
It has been shown. With the exception of extra exons, this genetic model is almost identical to the RT-PCR product.
Are identical. The cDNA coding sequence, putative protein product, and full-length sequence
4A to 4C, respectively.
Northern blot analysis: Radiolabel the genome and RT-PCR probe (Feinbe
rg and Vogelstein, Anal. Biochem. 132: 6-13, 1983) and use this
RNA from various adult tissues, including a panel of RNAs from different neural tissues, including the spinal cord
Northern blots (Clontech, Palo Alto, CA) were probed. further
, A human RNA Master Blot containing RNA from 50 different adult and fetal tissues (Cl
ontech, Palo Alto, CA) were screened as recommended by the manufacturer.
Was.
hABC3: A human lung cDNA library (LTI, Gaithersburg, MD) was added to mouse ABC1.
The most 5 'trapped exon with homology
Capture and repair oligonucleotides designed from exon L48757 (each,
5'-CATTGCCCGTGCTGTCGTG-3 '(SEQ ID NO: 52) and 5'-CATCGCCGCCTCCTTCATG-3' (
Column No. 53)) and use GeneTrapper system (LTI, Gaithersburg, MD)
I was leaning. Direct cDNA library screening has also been used as a probe.
Using a RT-PCR clone. 5'RACE (Frohman, M.A. in Methods Enzymol
. (Edited by J.N. Abelson and M.I.Simon) pp. 340-356, Academic Press, San Diego, CA
1993) was used to isolate additional 5 'sequences from ABC3 transcripts.
Northern blot analysis: 679 bp fragment derived from the 3 'untranslated region (UTR) of ABC3 cDNA
Fragmentation is radioactive by random priming (Feinberg et al., Supra, 1983).
Label and use it to label multiple tissue nodes under conditions recommended by the manufacturer.
Xan blots (Clontech, Palo Alto, CA) were probed.
Identification of coding sequences for novel ABC transporters: A new ATP binding cassette called ABC3
(ABC) transporter gene was mapped to the PKDI locus on chromosome 16 (Bur
n et al., Genome Res. 6: 525-537, 1996). 8 exons derived from hABC3 gene
From 30.1F, 64.12C, and 96.4B P1 clones using exon trapping
Obtained. This is shown in FIG. The upper part shows the genome spacing around the hABC3 gene
, NotI sites, DNA markers, and distances in kilobases (kb) are also shown. hABC3 remains
Genomic P1 clones derived from intervals containing gene-derived sequences are listed below the genome map.
Show. The relative position of the hABC3 cDNA is provided below the P1 clone and the selected cDNA,
Shown are the exons, RT-PCR clones, and cDNAs that were skipped. Additional hABC3 sequence
Trapped exons and RT-PCR clones used for isolation were labeled. K
The discontinuity in the row of loan ABCgt.1 is due to the exon being spliced separately.
Indicates absence.
Seven of these trapped exons were analyzed by BLASTX analysis (Altschul et al., Supra).
Homology to mouse ABC1 and ABC2 based on Gish et al., Supra, 1993).
Exons L48758, L48759, and L4, which encode sequences with
The sequence from 8760 had the highest homology. Exon L48760 Trapped
The sequence encoded by Caenorhabditis ele
gans ABC transporter (Wilson et al., supra).
cDNA selection involves a single 261 bp cDNA clone mapped near the 5 'end of the ABC3 gene.
Occurred. As with L48760, this clone is directed against the hypothetical C. elegans ABC transporter.
And encoded sequences with homology. First of SASE results from 30.1F P1 clone
The analysis showed that four of the 164 reactions showed sequences with homology to ABC1 and ABC2.
Code to show. Subsequent comparisons between the SASE data and the final hABC3 cDNA
Shows that the seven sequencing reactions contained a coding sequence derived from the ABC3 gene.
Was. A total of 1.6 kb of the ABC3 coding sequence was aligned with the SASE data. 5 'end of hABC3 gene
This is because the 3.5 kb-only coding sequence from the end maps to the 30.1 F P1 clone.
Shows the 45% coverage level of the ASE analysis.
Assembly and analysis of a novel ABC transporter cDNA: Using two complementary approaches
Was used to assemble full-length hABC3 cDNA. First, trap using RT-PCR
Exons, selected cDNA, and SASE data were ligated. Second, cDNA
Library screening, direct selection and radiolabeled probes
It was performed using.
Designed from trapped exons L48757, L48758, L48760, and L75924
3 RT-PCR products containing the 3.3 kb coding sequence were cloned using the primers
(Table I and FIG. 16). Add additional RT-PCR primers with the selected cDNA
It was designed from the area of identity with the SASE data (Table I). 900bp RT-PCR clone
Using the latter primer together with a primer derived from the trapped exon
I got it. In total, a 4.2 kb coding sequence was obtained using RT-PCR.
Some cDNAs are homologous to the GeneTrapper direct selection system and ABC1
The 5'-most trapped exon encoding a sequence with
It was cloned using an oligo designed from exon L48747). GeneTrappe
The longest clone isolated in the r system was 5719 bp in length (ABCgt.1) (
(FIG. 8). This cDNA was cut 20 bp upstream of the consensus sporiadenylation-polyA tail.
Includes a 792 bp 3 'untranslated region with a cleavage site. Additional cDNA clones (ABC.5)
Isolated using a radiolabeled 1.1kb RT-PCR product (ABC3-12) as a probe
(Fig. 16). The 5 'end of ABC3 cDNA was further characterized using 5' RACE and several
Some RACE products contain multiple in-frame stop codons upstream of the initiation methionine.
It is.
Sequence analysis showed that clone ABCgt.1 was cloned into RT-PCR clone and cDNA clone ABC.5.
Lacking the 147 bp sequence found. The additional 147 bp segment
In that this does not interrupt the open reading frame, another splicing
It looks like the result. The presence of both transcript populations is another spliced exo
Was confirmed by PCR using primers adjacent to the primers.
A 6.4 kb cDNA was assembled for the hABC3 transporter. The assembled cDNA is
, A 5116 nucleotide long open reading frame encoding 1705 amino acids
The predicted protein has a molecular weight of 191 kDa. Suggested start
Thionine is 50 bp upstream of the 5 'end of clone ABCgt.1. Around the starting methionine
Sequence matches the Kozak sequence at only 6 of the 10 positions (Kozak, J. Cell Bi
ol. 115: 887-903, 1991), two positions that have been shown to be important for function (-3
A and +4 G) are conserved in hABC3. hABC3 cDNA is a consensus
Includes a 792 bp 3 'UTR with a cleavage site 20 bp upstream of the sporadenylated / poly A region
.
A 6.8 kb transcript was detected on a Northern blot with a 3'UTR cDNA probe.
, The highest levels of expression are in the lungs and the lower levels are in the brain,
Detected. Significantly lower levels of expression were observed in placenta and
Observed in skeletal muscle. ABC3 transcript was not detected in liver or kidney
.
RPL3L (SEM L3): The longest cDNA is 1548 nucleotides in length (Figure 11). 3
All cDNAs have the longest cDNA containing a 48 nucleotide 5 'untranslated region.
It has a 24 nucleotide open reading frame (ORF). 7th Inn
After the frame stop codon, the Kozak start sequence CCACCATGT (SEQ ID NO: 68) (Kozak,
Out) continues. Each 3'UTR of the three cDNAs differs in length, and
Lacks the Nylation cleavage site.
The longest cDNA was compared to the human, bovine, and mouse ribosomal L3 genes.
At the nucleotide level, RPL3L (SEM L3) cDNA and these other ribosomal L3 cDNA
There is only 74% identity with the upcoming consensus. This includes humans, cows, and
In sharp contrast to the 98% identity shared between mouse L3 nucleotide sequences
is there. There is no similarity between the 3'UTR of the cDNA isolated here and other L3 genes.
hALR: A sequence is prepared using primers designed from exon traps (eg, external 5'-T
GGCCCAGTTCATACATTTA-3 '(SEQ ID NO: 69) and internal 5'-TTACCCCTGTGAGGAGTGTG-3'
(SEQ ID NO: 70)) and cloned from the human ALR gene by 3'RACE
. A total of 468 bp were obtained from the human ALR gene (FIG. 13).
Example VII: Amino acid sequence analysis
hNET: hNET cDNA is at least 210 bp of 5 'untranslated sequence, 5' initiation methionine codon
Has a 3 'stop codon (TGA) and is predicted to be 580 amino acids in length (FIG.
4), the conserved common domain structure of the netrin family (FIG. 20A). all
Physically, human netrin is more effective against chicken netrin-2 than netrin-1
It was found to have high homology (ie, 56.3% vs. 53.9%). Netrin
As in other members of the family, the largest conserved region is the three EGF repeats
, While the C-terminal domain is not very well conserved (FIG. 20A). EGF repeats
, Between human netrin and chicken netrin-1 and netrin-2, 78
.7% and 82.2% identical and 66.3% identical when compared to UNC-6.
The C-terminal domains of human netrin and chicken netrin-1 and -2 are respectively
Are 41.9% and 42.5% identical, and the same domain of UNC-6 is similar to human netrin.
Only 29.4% were identical. Overall, human netrin is NETB VI and
NETA spreads in C domain when additional sequence is included in V-1 domain
(Harris et al., 1996, supra; Mitchell et al., 1996, supra);
More closely resembles chicken netrin and UNC-6 than ETA and NETB.The structure of the netrin gene is conserved between Drosophila and humans
The position of the intron in the human gene is determined by the entire netrin / UNC-6 family.
Compare to encoded protein to determine if gene structure is preserved
(Fig. 20B). This analysis shows that the Drosophila netrin gene and the human netrin gene
Revealed a striking similarity between In human genes, exon 1
Contains the Gnal peptide, domain VI, and the first EGF domain (domain V-1)
While exons 2 and 3 contain EGF repeats, domains V-2 and V-3, respectively.
Include each. Exons 4, 5, and 6 contain a C domain portion. C Domain
This motif / exon arrangement, except for additional introns in the
Conserved in the hila netrin gene. Two Drosophila netrin genes
Are shown to be highly conserved, each of which occurs at a homologous site.
Split by two introns (Harris et al., 1996, supra). Six Drosophila
Five of the intron positions were found to be conserved in the human gene
(FIG. 20B). The UNC-6 gene contains 12 introns in the coding region (Ishii
Et al., 1992, supra), these five positions are the positions of the introns in the human gene.
Correlates with Interestingly, the sixth Drosophila intron is located in the human gene
Has no counterpart in Drosophila and is not conserved in the UNC-6 gene
The only intron coming.
hABC3: Database search for homology between ABC3 and mouse ABC1 and ABC2
(Luciani et al., Supra, 1994). Mouse ABC1 and ABC2 proteins
In addition, the ABC3 protein is also predicted to be encoded by the cosmid sequence of C48B4.4.
Shows homology to constant C. elegans protein (Wilson et al., Supra). Overall
And the genes encoded by ABC3, ABC1, ABC2, and C. elegans cosmid C48B4.4.
Rows have the highest homology in the region around the ATP binding cassette (FIG. 17).
However, the first ATP bond, called the linker domain (Luciani et al., Supra, 1994),
When comparing sequences between the fusion cassette and the second transmembrane domain, ABC3
Shares very low homology to these same three proteins listed in
(Amino acids 765-1044 in ABC3 in FIG. 17). ABC3 linker domain is ABC
1 and about 200 residues shorter than the linker domain present in ABC2. as a result,
Optimal protein alignment is conserved HH1 hydrophobic, located at positions 917-959 of ABC3
Gap in the ABC3 sequence immediately C-terminal to the sex domain (Luciani et al., Supra, 1994)
Place it (Fig. 17). For further comparison, the ABC3 linker domain was
About the size of the linker domain encoded by C48B4.4
Indicates that it is one. As in ABC1 and ABC2, the linker domain of ABC3 is
Contains numerous polar residues and several potential phosphorylation sites.
Further analysis of the putative ABC3 protein sequence is directed at the ABC1 / ABC2 subfamily.
Revealed further similarities. Based on PSORT analysis (Nakai et al., Supra), AB
The C3 protein does not appear to contain an N-terminal signal sequence and
Protein (Singer, Annu. Rev. Cell Biol. 6: 247-296 1990).
The N-terminus of the transmembrane domain sequence is located in the cytoplasm (FIG. 17). A similar form is ABC1
(Luciani et al., Supra, 1994) and all other ABCs transported
(Higgins, supra, 1992). As described above, mice ABC1 and A
BC2 is shown to contain a novel hydrophobic region, HH1, within the conserved linker domain
Was. The HH1 domain is less conserved at the amino acid level in ABC3,
The domain appears to be in the linker region based on hydrophilicity analysis. As well
The HH1 domain of the C. elegans derived cosmid C48B4.4
Found in the column. In all these cases, the HH1 domain
Predicted to have a conformation.
RPL3L (SEM L3): The RPL3L (SEM L3) cDNA open reading frame is 46.3 kDa
Is predicted (FIG. 11). RPL3L (SEM L3) cDNA in vivo
Transcription-translation has an apparent molecular weight of 46 kD, which closely matches the predicted amount of 46.3 kD.
Resulting in a protein product.
Two nuclear targeting sequences, which are 100% conserved between human, mouse and bovine
) Diverged slightly in the RPL3L (SEM L3) amino acid sequence. First target
The cleavage site is a 21 amino acid N-terminal oligopeptide. Human, cow, and mouse
Serine and arginine at positions 13 and 19 of L3, respectively, are RPL3L (SEM L3
) Is replaced by histidine (FIG. 12). The second potential nuclear targeting site is divided into two parts
It is a motif. Here, human, bovine, and mouse proteins are 341-3
KKR- (aa) at position 5812-KRR, while the SEM L3 gene is KKR- (aa) at positions 341-358Ten
-Has HHSRQ. The second half of this two-part motif remains basic
Did not match those found in other nuclear targeting motifs (Simonic et al.)
Supra, 1994). Overall, RPL3L (SEM L3) and other mammalian L3 ribosomes
77.2% amino acid identity with consensus derived from the gene; RPL3L (SEM L3)
56% of the nucleotide differences between and L3 are silent.
hALR: hALR cDNA sequence is 84.8% identical and 94.1% to rat ALR protein
Encodes a similar 119 amino acid sequence protein (see FIGS. 13 and 14)
thing).
Although the invention has been described by reference to the disclosed embodiments, various modifications may be made.
It should be understood that this can be done without departing from the spirit of the invention. Obedience
Accordingly, the invention is limited only by the claims that follow the sequence listing.
─────────────────────────────────────────────────────
フロントページの続き
(51)Int.Cl.7 識別記号 FI テーマコート゛(参考)
C12N 1/21 C12P 21/02 C
5/10 G01N 33/53 D
C12P 21/02 C12N 15/00 ZNAA
G01N 33/53 5/00 A
(31)優先権主張番号 08/762,500
(32)優先日 平成8年12月9日(1996.12.9)
(33)優先権主張国 米国(US)
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FI,FR,GB,GR,IE,IT,L
U,MC,NL,PT,SE),AU,CA,JP
(72)発明者 コナーズ,ティモシー ディー.
アメリカ合衆国 マサチューセッツ
01748,ホプキントン,ヘイデン ロウ
ストリート 304
(72)発明者 ダクコウスキー,ウィリアム アール.
アメリカ合衆国 マサチューセッツ
01748,ホプキントン,バレンタイン ロ
ード 4
(72)発明者 バン ライ,テレンス ジェイ.
アメリカ合衆国 マサチューセッツ
01749,ハドソン,ウォーセスター アベ
ニュー 43
(72)発明者 キリンジャー,キャサリン ダブリュー.
アメリカ合衆国 マサチューセッツ
01776,サドブリー,ボウディッチ ロー
ド 54──────────────────────────────────────────────────の Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) C12N 1/21 C12P 21/02 C 5/10 G01N 33/53 D C12P 21/02 C12N 15/00 ZNAA G01N 33/53 5/00 A (31) Priority claim number 08 / 762,500 (32) Priority date December 9, 1996 (12.9 1996) (33) Priority claiming country United States (US) ( 81) Designated countries EP (AT, BE, CH, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE), AU, CA, JP (72) Inventors Connors, Timothy Dee. 304 United States Massachusetts 01748, Hopkinton, Hayden Row Street 304 (72) Inventors Duckowski, William R. A. United States of America, Massachusetts 01748, Hopkinton, Valentine Road 4 (72) Inventor Ban Rai, Terrence Jay. United States of America Massachusetts 01749, Hudson, Worcester Avenue 43 (72) Inventor Kiringer, Catherine Double. Massachusetts, USA 01776, Sudbury, Bowditch Load 54