JP2004229652A - New protein and dna encoding the same - Google Patents

New protein and dna encoding the same Download PDF

Info

Publication number
JP2004229652A
JP2004229652A JP2003127109A JP2003127109A JP2004229652A JP 2004229652 A JP2004229652 A JP 2004229652A JP 2003127109 A JP2003127109 A JP 2003127109A JP 2003127109 A JP2003127109 A JP 2003127109A JP 2004229652 A JP2004229652 A JP 2004229652A
Authority
JP
Japan
Prior art keywords
protein
dna
seq
amino acid
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003127109A
Other languages
Japanese (ja)
Inventor
Yoshihide Hayashizaki
良英 林崎
Mamoru Kamiya
守 神谷
Hideo Kubodera
英夫 久保寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Chemical Corp
Dnaform KK
RIKEN Institute of Physical and Chemical Research
Original Assignee
Mitsubishi Chemical Corp
Dnaform KK
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Chemical Corp, Dnaform KK, RIKEN Institute of Physical and Chemical Research filed Critical Mitsubishi Chemical Corp
Priority to JP2003127109A priority Critical patent/JP2004229652A/en
Publication of JP2004229652A publication Critical patent/JP2004229652A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a protein based on a physiological activity by analyzing base sequences of cDNA clones contained in a catalogued full-length cDNA library and specifying the physiological activity of the protein encoded with the cDNA clones for those having new sequences and to provide a method for utilizing the DNA encoding the protein. <P>SOLUTION: The protein is (a) a protein comprising specific 9 kinds of amino acid sequences or (b) a protein comprising an amino acid sequence in which one or several amino acids are deleted, substituted and/or added in the amino acid sequence described in any of the amino acid sequences and having an enzymic activity or a protein interacting activity. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、及び該タンパク質に特異的に結合する抗体等に関する。
【0002】
【従来の技術】
cDNAの取得及びその塩基配列解析は、生体内に発現するタンパク質の生理活性を解析し、その活性に基づくタンパク質の利用方法を開発するうえで不可欠である。さらに、全遺伝子種に対応する完全長cDNAをカタログ化したライブラリーの作製は、ヒトゲノムプロジェクトの重要な課題の一つである。カタログ化したライブラリーとは、ライブラリーに含まれるcDNAに重複がないという意味であり、各cDNAが1種類ずつ含まれているライブラリーのことである。
【0003】
完全長cDNAクローニング法については、特開平9−248187号公報及び特開平10−127291号公報に記載されている。この方法は、mRNAの5’キャップサイトに存在するジオール構造にタグになる分子を結合させる工程、前記タグ分子を結合させたmRNAを鋳型とし、oligo dTをプライマーとして逆転写によりRNA−DNA複合体を作製し、この複合体の内、mRNAの完全長に対応するDNAを有するものをタグ分子の機能を利用して分離する工程を含むことを特徴とする方法である。
【0004】
また効率のよい逆転写法として、鋳型が高次構造を形成しないような高温で行うための方法も開発されている(特開平10−84961号公報)。さらに、合成された完全長cDNAライブラリーに含まれるDNA断片についてその鎖長に関わらず一律にクローニングすることができるクローニングベクターも開発されている(特開平11−9273号公報)。
【0005】
このような技術により作製された完全長cDNAライブラリーは、ライブラリーの個々の要素として全て均等に異なるものが含まれている訳ではなく、存在割合の高いクローンや逆に極微量にしか存在しないクローンもある。この極微量にしか存在しないクローンは新規である可能性が高いため、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法も開発されている(特開2000−325080号公報;Carninci, P. et al.,Genomics, 37, 327−336(1996))。
かくして得られるカタログ化された完全長cDNAライブラリーの各クローンについて、公知の方法により塩基配列の解析を行えば、その塩基配列は同定されるが、該cDNAがコードするタンパク質の生理活性は依然不明のままである。
【0006】
【発明が解決しようとする課題】
本発明は、カタログ化された完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
【0007】
【課題を解決するための手段】
本発明者らは、マウス完全長cDNAライブラリー中のcDNAクローンが有する塩基配列を解析し、該配列の相同性に基づきデータベースを検索したところ、該配列に酵素活性またはタンパク質相互作用活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質が酵素活性またはタンパク質相互作用活性を有すると同定した。また、(i)これらのcDNAの各組織における発現量を解析し、(ii)該cDNAがコードするタンパク質を発現させて他のタンパク質との相互作用を解析し、(iii)該cDNAがコードするタンパク質の発現を阻害した個体の表現型の変化を解析し、これら(i)〜(iii)の解析結果から該cDNAがコードするタンパク質の有する機能を総合的に解析した。本発明は、これらの知見に基づいて成し遂げられたものである。
【0008】
すなわち本発明によれば、以下の(1)〜(25)に記載の発明が提供される。
(1) 以下の (a) または (b) のタンパク質。
(a)配列番号14〜17のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号14〜17のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつ酵素活性を有するタンパク質。
【0009】
(2) (1)に記載のタンパク質をコードするDNA。
(3) (1)に記載のタンパク質をコードする完全長cDNA。
(4) 以下の (a) 、 (b)又は(c) のいずれかのDNA。
(a)配列番号5〜8のいずれかに記載の塩基配列を有するDNA。
(b)配列番号5〜8のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつ酵素活性を有するタンパク質をコードするDNA。
(c)配列番号5〜8のいずれかに記載の塩基配列あるいはその相補配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつ酵素活性を有するタンパク質をコードするDNA。
【0010】
(5) 以下の (a) または (b) のタンパク質。
(a)配列番号10〜13または18のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号10〜13または18のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつタンパク質相互作用活性を有するタンパク質。
【0011】
(6) (5)に記載のタンパク質をコードするDNA。
(7) (5)に記載のタンパク質をコードする完全長cDNA。
(8) 以下の (a) 、 (b)または(c)のいずれかのDNA。
(a)配列番号1〜4または9のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜4または9のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつタンパク質相互作用活性を有するタンパク質をコードするDNA。
(c)配列番号1〜4または9のいずれかに記載の塩基配列あるいはその相補配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつタンパク質相互作用活性を有するタンパク質をコードするDNA。
【0012】
(9) (2)〜(4)のいずれかに記載のDNAを含む組換えベクター。
(10) (2)〜(4)のいずれかに記載のDNAまたは(9)に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
(11) (10)に記載の細胞により産生される、(1)に記載のタンパク質。
【0013】
(12) (6)〜(8)のいずれかに記載のDNAを含む組換えベクター。
(13) (6)〜(8)のいずれかに記載のDNAまたは(12)に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
(14) (13)に記載の細胞により産生される、(5)に記載のタンパク質。
【0014】
(15) (2)〜(4)または(6)〜(8)のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
【0015】
(16) (1)または(11)に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
(17) 抗体がモノクローナル抗体である(16)に記載の抗体。
(18) モノクローナル抗体が(1)または(11)に記載のタンパク質の酵素活性を中和する作用を有することを特徴とする(17)に記載の抗体。
【0016】
(19) (5)または(14)に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
(20) 抗体がモノクローナル抗体である(19)に記載の抗体。
(21) モノクローナル抗体が(5)または(14)に記載のタンパク質のタンパク質相互作用活性を中和する作用を有することを特徴とする(20)に記載の抗体。
【0017】
(22) (1)、(5)、(11)または(14)のいずれかに記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
(23) (10)または(13)に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
(24) (1)もしくは(5)に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報、および/または(2)〜(4)もしくは(6)〜(8)のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
(25) (1)もしくは(5)に記載のタンパク質、および/または(2)〜(4)もしくは(6)〜(8)のいずれかに記載のDNAを結合させた担体。
【0018】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
(1)完全長cDNAの取得及び塩基配列の解析
本発明のDNAは、配列番号10〜18に記載のアミノ酸配列からなるタンパク質、またはアミノ酸配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば20個以下、好ましくは15個以下、より好ましくは10個以下、さらに好ましくは5個以下を意味する)のアミノ酸残基の置換、欠失、挿入、付加、若しくは逆位を含むアミノ酸配列からなり、かつ酵素活性またはタンパク質相互作用活性を有するタンパク質をコードし得るものであれば如何なるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのcDNAの全長を含むものでもよい。
【0019】
具体的には、cDNAの全長を含むDNAとしては、例えば、配列番号1〜9に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号146〜1624、配列番号2の塩基番号159〜2249、配列番号3の塩基番号474〜1010、配列番号4の塩基番号535〜1440、配列番号5の塩基番号50〜1657、配列番号6の塩基番号869〜1174、配列番号7の塩基番号549〜1022、配列番号8の塩基番号1045〜1518、配列番号9の塩基番号169〜2760に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’及び/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
【0020】
本発明のDNAは、これを取得できる方法であれば如何なる方法により取得したものでもよいが、具体的には、例えば下述の方法により取得することができる。まず、適当な動物、好ましくは哺乳動物の組織等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてcDNAを合成するが、このとき完全長のcDNAを合成するために5’キャップ(7MepppN)サイトに特異的なジオール構造にタグになる分子を化学結合させ、このmRNAを鋳型としてoligo dTをプライマーとして逆転写した後に、タグ分子の機能を利用して完全長のcDNAのみを分離する方法(特開平9−248187号公報、特開平10−127291号公報)を用いることが好ましい。また、逆転写の際には、鋳型が高次構造を形成して逆転写の効率が低下することを阻止するために、トレハロース等の存在下で、耐熱性逆転写酵素を用いて高温下で逆転写を行う方法(特開平10−84961号公報)を用いるのが好ましい。ここで、高温下とは40〜80℃を意味する。
【0021】
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、様々な鎖長のDNAを一律にクローニングすることが可能な、クローニングサイトの両末端にリコンビナーゼ認識配列を有し、感染以外の方法で宿主に挿入される直鎖状のベクター(特開平11−9273号公報)が好ましく用いられる。かくして得られるcDNAライブラリーは、全てのクローンが均一に存在している(以下、これを「カタログ化されている」と称することがある)訳ではなく、このライブラリー中に極微量にしか存在しないクローンこそ新規である確率が高い。そこで、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法(特開2000−325080号公報、Carninci, P. et al.,Genomics, 37, 327−336(1996))を用いることが好ましい。
【0022】
カタログ化されたcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、cDNA全長の場合にはその末端100ベースの配列について得られた塩基配列を、BLAST(http://www.ncbi.nlm.nih.gov/BLAST/;National Center of Biotechnology Information)を用いて、NCBIのGenbank、EMBL、DDBJ等のデータベースについて検索し、最も高い相同性を示す配列でも一致度が30%以下であるものを新規として以下の解析に供することとした。
【0023】
このような完全長cDNAの塩基配列を有するDNAとしては、例えば、配列番号1〜9に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号146〜1624、配列番号2の塩基番号159〜2249、配列番号3の塩基番号474〜1010、配列番号4の塩基番号535〜1440、配列番号5の塩基番号50〜1657、配列番号6の塩基番号869〜1174、配列番号7の塩基番号549〜1022、配列番号8の塩基番号1045〜1518、配列番号9の塩基番号169〜2760に示される配列を有するものが挙げられる。
【0024】
かくして取得された新規な塩基配列を、BLAST(Basic local alignment search tool;Altschul, S.F., et al.,J. Mol. Biol., 215, 403−410(1990)) による相同性検索 (homology search)や、HMMER(隠れMarkovモデルによる配列解析手法; Eddy, S. R., Bioinformatics 14, 755−763 (1998)) の機能群のひとつである HMMPFAM(http://pfam.wustl.edu)による蛋白質特徴検索 (profile search)等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【0025】
BLASTによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されているアミノ酸配列の触媒ドメイン部分または機能ドメイン部分と本発明のDNAのコードするアミノ酸配列のこれに対応する部分との一致度がe−valueとして10−4以下のものか、あるいは30%以上のものを示す。
【0026】
例えば、上位にヒットした触媒ドメイン配列または機能ドメイン配列の多くが酵素またはタンパク質相互作用活性を有するタンパク質としての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、即ち、酵素活性またはタンパク質相互作用活性を持つであろうという予測が成り立つ。
【0027】
HMMPFAMでは、Pfamという蛋白質プロファイルを集積したデータベース中にあるエントリーが有するアミノ酸配列の特徴を、解析対象であるアミノ酸配列が有するかどうかを洗い出す方法による解析が行われる。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し、機能予測ができる。かくして行われるタンパク質の機能予測の具体的な例として以下に説明する。
【0028】
配列番号1に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号AK074067とe−value:5×10−148、310アミノ酸残基に亘り84%の一致度で、またデータベース登録記号BC007206とe−value:5×10−49、286アミノ酸残基に亘り39%の一致度で、さらにデータベース登録記号AL390078とe−value:5×10−44、286アミノ酸残基に亘り37%の一致度でヒットする。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号10のアミノ酸番号393−469にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)が見出される。
これらのことから、配列番号1に示す塩基配列がコードするタンパク質はチロシンリン酸化タンパク質との相互作用に関わる機能を有するタンパク質であると推測される。
【0029】
配列番号2に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号AK027856とe−value:0.0、470アミノ酸残基に亘り80%の一致度で、またデータベース登録記号Z18529とe−value:1×10−84、536アミノ酸残基に亘り38%の一致度で、さらにデータベース登録記号Q04205、Tensinとe−value:1×10−84、536アミノ酸残基に亘り38%の一致度でヒットする。
また、配列番号2に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号11のアミノ酸番号429−521にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)が見出される。
これらのことから、配列番号2に示す塩基配列がコードするタンパク質はチロシンリン酸化タンパク質との相互作用に関わる機能を有するタンパク質であると推測される。
【0030】
配列番号3に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号BC025237、hematopoietic SH2 proteinとe−value:2×10−15、138アミノ酸残基に亘り38%の一致度で、またデータベース登録記号Q9QXK9、SH2 domain protein 2A、Lad, an adapter protein interacting with the SH2 domain of p56lck(T cell 分化に関与)とe−value:2×10−10、105アミノ酸残基に亘り37%の一致度で、さらにデータベース登録記号Q9NP31、SH2 domain protein 2Aとe−value:7×10−08、100アミノ酸残基に亘り36%の一致度でヒットする。
また、配列番号3に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号12のアミノ酸番号72−147にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)が見出される。
これらのことから、配列番号3に示す塩基配列がコードするタンパク質はチロシンリン酸化タンパク質との相互作用に関わる機能を有するアダプタータンパク質であると推測される。
【0031】
配列番号4に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号P29353、SHC transforming protein(HUMAN)(細胞の癌化に関与することが知られている(Cell 1992 Jul 10;70(1):93−104))とe−value:1×10−55、317アミノ酸残基に亘り44%の一致度で、またデータベース登録記号P98083、SHC transforming protein(MOUSE)(細胞の癌化に関与することが知られている(J Biol Chem 1994 Dec 23;269(51):32031−4))とe−value:2×10−54、314アミノ酸残基に亘り44%の一致度で、さらにデータベース登録記号P98077、Protein SCK(HUMAN)とe−value:2×10−44、305アミノ酸残基に亘り39%の一致度でヒットする。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号13のアミノ酸番号198−268にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)が見出される。
これらのことから、配列番号4に示す塩基配列がコードするタンパク質はチロシンリン酸化タンパク質との相互作用に関わる機能を有するタンパク質であり、癌化と関与すると推測される。
【0032】
配列番号5に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号P46681、Actin interacting protein 2とe−value:5×10−136、488アミノ酸残基に亘り52%の一致度で、またデータベース登録記号AE005999、FAD−binding oxidoreductaseとe−value:1×10−64、437アミノ酸残基に亘り34%の一致度で、さらにデータベース登録記号P32891、D−lactate dehydrogenase(YEAST)とe−value:2×10−38、433アミノ酸残基に亘り27%の一致度でヒットする。
これらの結果より、配列番号14に示したアミノ酸配列からなるタンパク質は酵素であることが推測される。
また、配列番号5に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号14のアミノ酸番号82− 275にFADと結合する特徴を示す配列(PfamにFAD_binding_4としてエントリーされるアミノ酸配列)が見出される。
これらのことから、配列番号5に示す塩基配列がコードするタンパク質はFADとの結合機能を有する酵素であることが推測される。
【0033】
配列番号6に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号P42436、Assimilatory nitrite reductaseとe−value:3×10−05、78アミノ酸残基に亘り34%の一致度で、またデータベース登録記号AE006738、toluene−4−monooxygenase system proteinとe−value:0.009、78アミノ酸残基に亘り32%の一致度でヒットする。
これらの結果より、配列番号15に示したアミノ酸配列からなるタンパク質は酵素であることが推測される。
また、配列番号6に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号15のアミノ酸番号16−101にFeと結合する特徴を示す配列(PfamにRieskeとしてエントリーされるアミノ酸配列)が見出される。
これらのことから配列番号6に示す塩基配列がコードするタンパク質はFeを介した酸化還元酵素であることが推測される。
【0034】
配列番号7に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号P42436、Assimilatory nitrite reductaseとe−value:2×10−05、81アミノ酸残基に亘り34%の一致度で、またデータベース登録記号AE006738、toluene−4−monooxygenase system proteinとe−value:8×10−05、114アミノ酸残基に亘り31%の一致度で、さらにデータベース登録記号AP003000、nitrate reductase small subunitとe−value:0.005、79アミノ酸残基に亘り30%の一致度でヒットする。
これらの結果より、配列番号16に示したアミノ酸配列からなるタンパク質は酵素であると推測される。
また、配列番号7に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号16のアミノ酸番号16−134にFeと結合する特徴を示す配列(PfamにRieskeとしてエントリーされるアミノ酸配列)が見出される。
これらのことから、配列番号7に示す塩基配列がコードするタンパク質は酸化的リン酸化の機能を有する還元酵素であると推測される。
【0035】
配列番号8に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号P42436、Assimilatory nitrite reductaseとe−value:1×10−05、81アミノ酸残基に亘り35%の一致度で、またデータベース登録記号AE006738、toluene−4−monooxygenase system proteinとe−value:1×10−04、114アミノ酸残基に亘り31%の一致度で、さらにデータベース登録記号AP003000、nitrate reductase small subunitとe−value:0.005、79アミノ酸残基に亘り30%の一致度でヒットする。
これらの結果より、配列番号17に示したアミノ酸配列からなるタンパク質は酵素であると推測される。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号17のアミノ酸番号16−134にFeと結合する特徴を示す配列(PfamにRieskeとしてエントリーされるアミノ酸配列)が見出される。
これらのことから、配列番号8に示す塩基配列がコードするタンパク質は酸化的リン酸化の機能を有する還元酵素であると推測される。
【0036】
配列番号9に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、データベース登録記号AF479747、 PYRIN−containing APAF1−like protein 4とe−value:0.0、868アミノ酸残基に亘り42%の一致度で、またデータベース登録記号AF482706、ribonuclease inhibitor 2 (RNH2)とe−value:5×10−167、780アミノ酸残基に亘り41%の一致度で、さらにデータベース登録記号AF298547、nucleotide−binding site protein 1とe−value:2×10−97、911アミノ酸残基に亘り29%の一致度でヒットする。
これらのことから、配列番号9に示す塩基配列がコードするタンパク質はタンパク質−タンパク質相互作用に関わる機能を有するタンパク質であると推測される。
【0037】
本発明のDNAは、翻訳配列中に塩基の欠失もしくは挿入を有した状態で取得されることがあるが、上記のような相同性検索やたんぱく質特徴検索を行った結果、該DNAの塩基配列中の欠失もしくは挿入が推測された場合には、当業者において通常用いられているライブラリースクリーニングやPCRクローニング等の方法を用いて塩基の欠失もしくは挿入の無い完全長cDNAを取得することができる。かくして得られる完全長cDNAを用いて本発明のタンパク質を発現させ、これを機能解析に用いることができる。
【0038】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜9に記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば60個以下、好ましくは30個以下、より好ましくは20個以下、さらに好ましくは10個以下、特に好ましくは5個以下を意味する。)の塩基が欠失、置換及び/または付加された塩基配列を有し、かつ酵素活性またはタンパク質相互作用活性を有するタンパク質をコードするDNA、並びに、これらとストリンジェントな条件下でハイブリダイズし、かつ酵素活性またはタンパク質相互作用活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号10〜18に記載のタンパク質のアミノ酸配列において1若しくは数個のアミノ酸配列が欠失、置換及び/または付加されたアミノ酸配列からなり、かつ酵素活性またはタンパク質相互作用活性を有するタンパク質をコードするものも含まれる。
ここで、ストリンジェントな条件でハイブリダイズするDNAとは、配列番号1〜9に記載の塩基配列とBLAST解析で80%以上、好ましくは90%以上、さらに好ましくは95%以上の相同性を有する塩基配列を含むDNA等が挙げられる。また、ストリンジェントな条件下のハイブリダイゼーションとは、通常のハイブリダイゼーション緩衝液中で、温度が40〜70℃、好ましくは60〜65℃等で反応を行い、塩濃度が15mM〜300mM、好ましくは15mM〜60mM等の洗浄液中で洗浄を行う方法に従って行うことができる。
【0039】
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテッドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
【0040】
また、配列番号1〜9に記載の塩基配列は、マウスを由来とするものであるが、上記したcDNAライブラリーの作製法に従ってヒトのcDNAライブラリーを作製し、該ライブラリーに対して配列番号1〜9の塩基配列を有するDNA断片をプローブとしたハイブリダイゼーションを行うことにより、配列番号1〜9に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするDNA(以下、これを「ヒトホモログDNA」と称することがある)を取得することもできる。本発明の配列番号1〜9に記載の塩基配列またはその相補配列を有するDNAとストリンジェントな条件でハイブリダイズするDNAには、このようなヒトホモログDNAや下述するヒトのオルソログDNAも含まれる。
【0041】
また、インフォマティックスを利用して、ヒトホモログDNAが有する塩基配列を予測し、該塩基配列を基に上記のヒトcDNAライブラリーなどからヒトホモログDNAを取得することもできる。
一般的に、インフォマティックスを利用して目的とするタンパク質のホモログタンパク質をコードする塩基配列を予測する方法としては、例えば、(i)目的とするcDNAの塩基配列をクエリーとして、ヒト等のcDNAデータベース(インフォマティックスにより予測されるcDNAデータベースを含む)に対しBLASTなどを用いて相同性検索を行う方法や、(ii)目的とするcDNAの塩基配列をクエリーとして、ヒト等のESTデータベースに対しBLASTなどを用いて相同性検索を行い、ヒットしたESTが有する配列を目的とするcDNAの塩基配列を参照して連結する方法、さらに(iii)目的とするcDNAの塩基配列をクエリーとして、ヒトなどのゲノムデータベースに対しBLASTなどを用いて相同性検索を行い、目的とするcDNAの遺伝子が存在するゲノム上の位置を特定し、そのゲノム領域に対してGenscan(http:// genes. mit.edu/GENSCAN.html)やSim4(Genome Res., 8: 976−74 (1998))等を用いて、該ゲノム中の遺伝子部分の塩基配列を予測する方法等が挙げられる。
【0042】
マウス由来のcDNAのヒトホモログDNAの塩基配列を予測する場合、上記の方法のいずれも用いることができるが、本発明の配列番号1〜9に記載の塩基配列を有するcDNAはいずれも新規であり、上記(i)の方法では、ヒトホモログDNAの塩基配列を取得できないと考えられるため、(ii)あるいは(iii)に記載の方法などが好ましく用いられる。
【0043】
かくして予測されたヒトホモログDNAの塩基配列を基に、上記のヒトcDNAライブラリーから、配列番号1〜9に記載の塩基配列を有するDNAに対するヒトホモログDNAを取得することもできる。具体的な取得方法としては、例えば、予測されたヒトホモログDNAの5’端、および3’端の塩基配列に相補的な塩基配列を有するプライマーを用いて、上記ヒトcDNAライブラリーを鋳型としてPCRを行う方法や、予測されたヒトホモログDNAの一部の配列をプローブとして、上記ヒトcDNAライブラリーに対してハイブリダイゼーションを行う方法等が挙げられる。
【0044】
一般的に、目的遺伝子が有する塩基配列とホモロジーの高い塩基配列を有する類似遺伝子を「ホモログ」と呼び、上記の方法においてもヒトホモログDNAの取得を目的としているが、遺伝子の機能解析においては、塩基配列が類似していることだけではなく、ホモログとして取得された遺伝子が、目的遺伝子のファミリーメンバーであることを確認することが重要である。2種類の生物間で「ホモログ」として取得された遺伝子は、共通の祖先遺伝子から進化した同一の遺伝子である「オルソログ」である可能性と、また、共通の祖先遺伝子からの重複によって生じた異なる遺伝子である「パラログ」である可能性がある。
【0045】
つまり、上記でホモログとして取得されたヒト由来のDNAは、これを、本発明のタンパク質と同一の機能を有すると解するには、また、該ヒト由来のDNAがコードするタンパク質の機能を、本発明のタンパク質のマウスにおける同一の機能として推定検証するには、上記ヒトホモログが本発明のマウス遺伝子の近縁種のオルソログであることを確認することが好ましい。
【0046】
オルソログであることの確認方法は、例えば、以下の方法などが用いられる。(i)まず、本発明のcDNAの塩基配列と、取得されたヒトホモログDNAの塩基配列について相同性を解析する。次に、本発明のcDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるヒト塩基配列について相同性検索を行い、取得されたヒトホモログDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列の一致度より高いことを確認する。さらに、(ii)取得されたヒトホモログDNAの塩基配列と、対応する本発明のcDNAの塩基配列について相同性を解析する。次に、取得されたヒトホモログDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるマウス塩基配列について相同性検索を行い、本発明のcDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列との一致度より高いことを確認する。上記(i)および(ii)を確認することにより、取得されたヒトホモログDNAが、本発明のcDNAに対応するヒトオルソログDNAであると同定することができる。上記(i)および(ii)に記載した相同性の解析はアミノ酸配列の比較を用いても良く、また、分子進化系統樹を描いて検討することもできる。また、上記(i)および(ii)に記載した相同性解析による一致度は、クエリーの全長にわたる一致度として解析することが好ましい。
【0047】
かくして取得されたヒトホモログDNA、あるいはオルソログDNAの塩基配列を、BLASTによる相同性検索やHMMPFAMによる蛋白質特徴検索等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
さらに、取得されたヒトホモログDNAまたはヒトオルソログDNAの完全長cDNAを用いて本発明のタンパク質を発現させ、これを活性の確認および機能解析等に用いることができる。
【0048】
(2)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明の翻訳領域としてそのアミノ酸配列を決めること等ができる。このようなアミノ酸配列として例えば、配列番号10〜18に記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1若しくは数個のアミノ酸が置換、欠失、及び/または付加されたアミノ酸配列からなり、かつ酵素活性またはタンパク質相互作用活性を有するものも含まれる。
【0049】
本発明のタンパク質の取得方法としては、上記(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【0050】
かくして得られるタンパク質が遊離体で得られた場合には、公知の方法あるいはそれに準じる方法によって塩に変換することができ、逆に塩で得られた場合には遊離体、又は他の塩に変換することができる。この様な本発明のタンパク質の塩も本発明のタンパク質に含まれる。また、上記形質転換体が産生するタンパク質を、精製前、又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記した酵素活性またはタンパク質相互作用活性を有するものであれば本発明の範囲に含まれる。
【0051】
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
【0052】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物、または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
【0053】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【0054】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック法(J. Mol.Biol.,53,154, (1970))、リン酸カルシウム法(Science,221,551, (1983))、DEAEデキストラン法(Science,215,166,(1982))、インビトロパッケージング法(Proc.Natl.Acad. Sci.USA,72,581,(1975))、ウィルスベクター法(Cell,37,1053,(1984))、および電気パルス法(Chu.et al.,Nuc.Acids Res.,15,1331(1987))等が挙げられる。
【0055】
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J. Biol. Chem., 263, 7406, (1988))とその宿主であるSf−9細胞(J.Biol.Chem.,263,7406,(1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J.Viol.,26,291,(1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc.Natl.Acad. Sci. USA,77,4216, (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7細胞(ATCC CRL1651:アメリカンタイプカルチャーコレクション保存細胞)、ヒト胎児腎臓由来HEK293細胞(ATCC CRL1573)またはヒト子宮頸部癌HeLa細胞(ATCC CCL−2)が用いられる。
【0056】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(A.A.Vertes et al.,Biosci.Biotechnol. Biochem.,57,2036,(1993))、あるいはトランスポゾンや挿入配列(A.A. Vertes et al. , Molecular Microbiol.,11,739, (1994))等を用いてDNA導入体を作製することもできる。
【0057】
得られた培養物は細胞、あるいは菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられ、特に好ましい具体例としては、ウサギ網状赤血球、小麦胚芽、大腸菌からの抽出液(大腸菌S30抽出液)に基づいて調製された転写翻訳系が挙げられる。
【0058】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【0059】
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、酵素活性またはタンパク質相互作用活性を有するものであれば、本発明のタンパク質に含まれる。
かくして得られたタンパク質は、他のタンパク質、DNAとの相互作用等を解析することにより、生体内における多面的な機能を知ることができる。上記相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。
【0060】
(3)オリゴヌクレオチドの調製及び該オリゴヌクレオチドを用いる機能解析
上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。
【0061】
該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜9のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
【0062】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine−modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等をあげることができる。
【0063】
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製し、被導入体へ導入し、標的遺伝子の発現を阻害するRNAインターフェアレンス法(以下、これを「RNAi法」と称することがある)に用いることができる。RNAインターフェアレンス法については、例えば、(Elbashir, S., et al., Nature, 411, 494−498(2001))に記載の方法等を用いることができる。また、上記2本鎖RNAは必ずしも全てがRNAである必要はなく、例えば、WO02/10374号公報に記載のもの等も用いることができる。
【0064】
ここで、標的遺伝子としては、本発明のDNAであれば、如何なるものであってもよい。これらDNAの少なくとも一部の塩基配列と実質的に同一な配列からなる2本鎖RNA(以下、これを「2本鎖ポリヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい15bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。ヌクレオチドの鎖長は15bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までの如何なる長さでもよいが、15〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞おいては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5, 115−180(1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA−responsive protein kinase:Bass, B.L., Nature, 411, 428−429(2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’、5’oligoadenylate synthetase(Bass, B.L., Nature, 411, 428−429(2001))を介してRnase Lの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物、または該動物由来の細胞、あるいは組織を被導入体として用いる場合には15〜30bp、好ましくは19〜24bp、より好ましくは21bpの2本鎖ポリヌクレオチドを用いることが好ましい。2本鎖ポリヌクレオチドはその全体が2本鎖である必要はなく、5’、または3’末端が一部突出したものも含むが、3’末端が一部突出したものを用いることが好ましい。2本鎖ポリヌクレオチドは相補性を有する2本鎖のポリヌクレオチドを意味するが、自己相補性を有する1本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【0065】
2本鎖ポリヌクレオチドの調製方法としては、特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は、相補性を有する1本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法として具体的には、例えば、合成した1本鎖ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【0066】
このようにして調製した2本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであれば如何なるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業で使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【0067】
被導入体は、細胞、組織、あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞及び内分泌腺または外分泌腺の細胞が含まれる。
【0068】
被導入体への2本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィルス感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口(皮下、筋肉内及び静脈内投与を含む)、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【0069】
導入する2本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも1コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により2本鎖ポリヌクレオチドを導入する場合、0.1〜1000nMが好ましい。
RNAインターフェアレンスによる本発明の遺伝子の導入体内での発現抑制により、本発明の遺伝子がコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【0070】
(4)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。
【0071】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【0072】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【0073】
免疫後、適宜試験的に採血を行って固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、遠析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【0074】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein,et al.,Nature,256, 495(1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【0075】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体の何れから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(U. Zimmer− mann. et al., Naturwissenschaften,68, 577(1981))によっても行うことができる。
【0076】
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【0077】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al. Nature, 335, 256−259 (1988); Duchosal, M. A., et al., Nature, 355, 258−262( 1992))。
【0078】
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一価性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
【0079】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有する酵素活性またはタンパク質相互作用活性を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(2)で作製したDNA導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【0080】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0081】
(5)本発明のタンパク質が有する活性の確認および機能の解析
本発明のタンパク質は、これを上記(2)に記載のとおり組み換えタンパク質として作製し、これを解析することにより上記(1)で推測した活性を有していることを確認することができる。さらに上記(4)のとおりに作製した抗体等との組み合わせにより解析することもできる。
【0082】
本発明のタンパク質が、酵素活性を有することは、それ自体既知の通常用いられる活性測定方法により解析することができる。例えば、酸化還元酵素の場合は、プロトン受容体、供与体としてNADHを用いるものが多数存在するので、NADH量を測定すればよい。具体的には、NADHは340nmに吸収を有しNADは有さないので、酸化還元反応で生じた、あるいは減少したNADH量を340nmの吸光度変化を指標にして測定することができる。
【0083】
また、本発明のタンパク質が、タンパク質相互作用を有することは、それ自体既知の通常用いられる活性測定方法により解析することができる。
具体的には、タンパク質−タンパク質結合活性を測定すればよい。タンパク質−タンパク質結合活性の確認は、例えばin vitro translation と蛋白質−蛋白質結合アッセイによって次の通り行うことができる (Journal of Biological Chemistry 275, 7894−7901 (2000))。
結合活性を測定しようとする該蛋白質をAとし、その相手をBとする。Aの完全長cDNAとBの完全長cDNAを含むプラスミドpGEM−AとプラスミドpGST−B (Trends Biochem. Sci. 21, 208−214 (1996)) を、Promega社TNT SP6 polymerase−coupled reticulocyte lysate systemによるin vitro transcriptionとtranslationに用いる。そのとき、[35S]methionine (Amersham社) 40μCiを全容量50μlに加えることにより、放射性物質標識することができる。
翻訳産物はin vitro蛋白質−蛋白質結合に供する。In vitro結合に関しては、例えば、50μlの[35S]methionineラベルした蛋白質Aを、GSTとBの融合蛋白質GST−B 4−5μgを含むグルタチオン樹脂でインキュベートする。
反応は、binding buffer (150 mM NaCl,0.1% Nonidet P−40,50 mM Hepes (pH 7.5))、1 mM PMSF、蛋白質分解酵素阻害剤を用いて、4 ℃、4時間、緩やかに揺することで行うことができる。
樹脂表面に形成された蛋白質−蛋白質複合体は、4 ℃で、14,000 rpm 1分間超遠心分離し、樹脂は4 ℃で1 mlのcold binding bufferで5回洗浄する。樹脂に結合したGST融合蛋白質Bと結合した蛋白質Aは、SDS−12% polyacrylamide gel上で分離され,gelを乾燥した後、autoradiographyを実施することにより、蛋白質AとBの結合活性を検討することができる。
【0084】
本発明のタンパク質である酵素またはタンパク質相互作用活性を有するタンパク質が有する活性は、上記の通り確認することができるが、これらの方法に限定されるものではない。また、これらの活性測定系は、後述する本発明のタンパク質の機能賦活物質(アゴニストなど)や機能阻害物質(アンタゴニストなど)のスクリーニングや本発明のタンパク質の発現調節物質のスクリーニングにも用いることができる。
【0085】
また、本発明のタンパク質の機能解析の方法として一般的には、例えば、(i)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(ii)他のタンパク質、DNAとの相互作用を解析する方法、(iii)適当な細胞あるいは個体へ導入して表現型の変化を解析する方法、(iv)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。また、このような方法によれば、対象タンパク質に特異的な活性を多面的に解析することができる。
【0086】
(i)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, D. G., Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ELISA法、ウェスタンブロット法などが挙げられる。ここで、解析の対象タンパク質に公知のバリアントが存在する場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象cDNAと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141−145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【0087】
(ii)の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質に公知のバリアントが存在する場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【0088】
(iii)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(2)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、対象タンパク質に公知のバリアントが存在する場合には、公知のものも同様に細胞へ導入し、比較解析することにより、対象タンパク質が関連する表現型を同定することができる。また、本発明のタンパク質は酵素活性またはタンパク質相互作用活性を有するものであることがわかっているので、これらの酵素またはタンパク質相互作用活性を有するタンパク質が関連する疾患に見られる表現型等に注目して解析することも好ましい。
【0089】
(iv)の方法では、上記(3)に記載したオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質に、公知のバリアントが存在する場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【0090】
(6)本発明のタンパク質が有する活性を調節する物質のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
【0091】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、且つ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であれば如何なるものであってもよい。例えば、まず本発明のタンパク質と被検物質とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する機能、即ち酵素活性またはタンパク質相互作用活性の変化を指標として被検物質を選抜する方法を用いることができる。
【0092】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質との相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(4)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。
【0093】
酵素活性またはタンパク質相互作用活性の変化の解析は、各種の酵素またはタンパク質相互作用活性を有するタンパク質の性質に基づいて、それ自体既知の通常用いられる方法により行うことができる。
【0094】
酵素の酵素活性を調節する物質を解析する場合には、本発明のタンパク質の性質に基づいて、それ自体既知の通常用いられる方法により行うことができる。具体的には、上記(5)に記載の方法等を用いて行うことができる。
前記の通り、本発明のタンパク質は、諸種の生理機能に関与する酵素としてとして重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、上記スクリーニング方法により得られた酵素活性の調節物質は、諸種の疾患の治療剤、例えば、抗癌剤(抗腫瘍剤)、抗炎症剤、神経変性疾患、高血圧などの循環器系疾患、代謝性疾患、免疫性疾患、血液凝固系疾患などの治療剤として用いることができる。
【0095】
また、タンパク質相互作用活性を調節する物質を解析する場合には、本発明のタンパク質の性質に基づいて、それ自体既知の通常用いられる方法により行うことができる。具体的には、上記(5)に記載の方法等を用いて行うことができる。
前記の通り、本発明のタンパク質は、諸種の生理機能に関与するタンパク質相互作用活性を有するタンパク質として重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、上記スクリーニング方法により得られたタンパク質相互作用活性の調節物質は、諸種の疾患の治療剤、例えば、癌、炎症性疾患、免疫性疾患、動脈硬化などの循環器系疾患、精神・神経疾患、代謝性疾患、気管支喘息等の呼吸器系疾患等の治療薬として用いることができる。
【0096】
ここで、医薬活性成分のスクリーニングを目的とするため、用いる本発明のDNA、あるいは組み換えタンパク質については、上記したヒトのホモログDNAあるいはヒトホモログタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、これらの生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。
【0097】
かかる酵素活性またはタンパク質相互作用活性の調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0098】
(7)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、上記(2)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
【0099】
被検物質としては、上記(6)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
【0100】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0101】
(8)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より、具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の子宮に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【0102】
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【0103】
(9)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜9のいずれかに記載の塩基配列を有するDNA及びその部分断片は、それらを基盤上に結合させた担体として用いられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。
【0104】
ここで、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
【0105】
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。このDNAの塩基配列には、対応するRNAの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD−R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
【0106】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
実施例1 cDNAライブラリーの調製
(1)mRNAの調製
mRNA調製マウス(C57BL/6)各器官または組織0.5〜1gを10mlの懸濁液でホモジェナイズし、pH4.0 の2M 酢酸ナトリウム1ml と、同量のフェノール/クロロホルム(体積比5:1)混液を加え抽出した。抽出後水層に同量のイソプロパノールを加えると、RNAが水相から分離沈澱した。この試料を氷の上で1時間インキュベーションした後、15分間4,000rpmで冷却遠心機にかけ、沈澱物を回収した。この検体を70%エタノールで洗い、8mlの水に溶解後2mlの5M NaCl、1 % CTAB(cetyltrimethy− lammonium bromide)、4M尿素、50mM Trisを含むpH7.0 の水溶液16mlを加えることでRNAを沈澱させ、ポリサッカライドを除いた(CTAB沈澱)。
【0107】
続いて室温で4,000rpm、15分間遠心機にかけ、RNAを4mlの7Mグアニジン−Clに溶解した。そして2倍量のエタノールを加えた後、氷上で1時間インキュベーションし、4,000rpm、15分間遠心機にかけ、生じた沈澱物を70%エタノールで洗いRNAを回収した、これを再度水に溶解し、RNAの純度をOD比260/280(>1.8)と230/260(<0.45)を読むことによって計測した。
【0108】
(2)第1鎖cDNAの調製
上記(1)で調製したmRNA 15μgを使って逆転写酵素3,000unit により、最終容量165μlの反応液中で、5−メチル−dCTP、dATP、dTTP、dGTPを各々0.54mM、0.6Mトレハロース、50mM Tris−HCl(pH8.3)、75mM KCl、3mM MgCl2、10mM DTT、52ng/μl BSA、RNaseインヒビター5unitの条件下で逆転写反応を行った。制限酵素XhoIの認識配列を含むオリゴヌクレオチド(配列番号19)(配列中、VはA,G又はCを示し、NはA,G,C又はTを示す)12.6μlをプライマーとして用いた。
【0109】
この反応を始める際、反応液の1/4を採取し、それに1.5μlの[α−32P]−dGTP(3000Ci/mmol、10μCi/μl;Amersham社製)を加えるこことにより、第1鎖cDNAの合成効率を測定した。RI標識した反応液の0.5μlをDE−81ペーパー上にスポットし、0.5Mリン酸ナトリウム緩衝液(pH7.0)で3回洗った前後のRI活性を測定し、計算した。その後、RI標識した反応液と非標識の反応液を混合し、0.5M EDTA 8μl、10% SDS 2μl、プロテイナーゼ(Proteinase)K 20μgを加え、45℃で15分間加熱した。フェノール/クロロホルムによる抽出、エタノール沈澱後、沈澱をRNaseフリーに処理してある水(以下RNaseフリー水とする)47μlに溶解した。
【0110】
(3)5’キャップ構造及び3’末端へのビオチン付加
RNAジオールのビオチン化RNAのジオール部位(Cap構造のある5’末端と、ポリA鎖のある3’末端のリボースの双方に存在)にビオチンを結合させるために、2段階の反応を行った。それらは、ジオール基の酸化とそれに続くビオチンヒドラジドと酸化RNA体のカップリング反応である。まず、逆転写反応で得られたRNA−第1鎖cDNA複合体15μgを、6.6mM酢酸ナトリウム緩衝液(pH4.5)と、酸化剤として過ヨウ素酸ナトリウムを用いて50μlの反応液中で処理した。この酸化反応は遮光条件の下、氷上で45分間行った。
【0111】
続いて、5M塩化ナトリウム11μl、10% SDS 0.5μl、そして同量のイソプロパノールを加え、60分間氷上に放置した後、4℃で15分間15,000rpm遠心し沈澱を取得した。沈澱物は70%エタノールで洗い、RNaseフリー水50μlに再溶解させた。その試料に1M酢酸ナトリウム(pH6.1)5μl、10% SDS 5μl、10mMビオチンヒドラジド(Sigma社製)150μlを加え、室温(22〜26℃)で終夜反応させた。最後に、5μlの5M NaCl、1M酢酸ナトリウム(pH6.1)75μl、及び2.5倍量のエタノールを加え、1時間の氷上冷却後、4℃において15分間遠心し、ビオチン化した。反応後、反応液を15分間遠心し、再度RNA−DNA複合体を沈澱させた。沈澱物は70%エタノールで1回、更に80%エタノールで1回洗い、RNaseフリー水70μlに溶解した。
【0112】
(4)RNase Iによる完全長cDNAの選択
上記(3)で取得したビオチン化RNA−DNA複合体について、1本鎖RNAを消化するRNase Iで処理することにより、逆転写反応時に完全なcDNAの伸長が得られなかったmRNA、およびmRNAの3’末端に標識されたビオチン残基を取り除いた。具体的には、上記(3)で得られた試料70μlに10×RNase Iバッファー(100mM Tris−HCl(pH7.5)、50mM EDTA、2M NaOAc)10μl、RNase I(RNase OneTM;Promega社製)200unitを加えて、37℃で15分間1本鎖RNAを消化した。
【0113】
(5)完全長cDNAの採取
ストレプトアビジンコートしたマグネティックビーズにcDNAが非特異的吸着するのを防止するため、100μgの酵母tRNA(DNase I処理したもの)を5mg(500μl)のマグネティックビーズ(magnetic porous glass(MPG)particles coated with streptavidin(CPG,NJ))に加え、1時間氷上に放置した後、50mM EDTA、2M NaClの溶液にて洗った。
このビーズを50mM EDTA、2M NaClの溶液500μl中に懸濁し、(4)で取得したRNase I処理を施されたcDNAを加えた。室温にて30分間撹拌することで、マグネティックビーズと完全長cDNAを結合させた。完全長cDNAを捕獲したビーズを50mM EDTA、2M NaClの溶液で4回、0.4% SDS、50μg/μl酵母tRNAで1回、10mMNaCl、0.2mM EDTA、10mMTris−HCl(pH7.5)、20% グリセロールで1回、50μg/μl酵母tRNA水溶液で1回、RNase H バッファー(20mMTris−HCl(pH7.5)、10mM MgCl、 20mM KCl、0.1mM EDTA、0.1mM ジチオスレイトール(DTT)で1回洗浄した後、RNase H用バッファー100μlに懸濁し、RNase H 3unitを加え、37℃下30分間加温した。その後、10% SDS 1μl、0.5M EDTA 2μlを加えて、10分間、65℃に曝し、その上清を回収した。
このようにして回収された1本鎖完全長cDNAはフェノール/クロロホルムで抽出され、スピードバッグにて液量を100μl以下に減じてからG25/G100Sephadexクロマトグラフィーに付した。RI活性を持った分画はシリコン処理したマイクロチューブに収集するとともに、グリコーゲン2μg を加え、エタノール沈澱にて得られた沈澱物を30μlの超純水に溶解した。
【0114】
(6)1本鎖cDNAへのオリゴdG付加
上記(5)で回収された1本鎖cDNA30μlは、最終容量50μlの反応液中で、200mMカコジル酸ナトリウム(pH6.9)、1mM MgCl、1mM CoCl、1mM 2−メルカプトエタノール、100μM dGTPの条件のもと、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TaKaRa社製)32unitを用いて37℃で30分間のオリゴdG付加反応に付した。反応終了時にEDTAを50mMとなるように加え、一連のフェノール/クロロホルムによる抽出、エタノール沈澱を経て、31μlの超純水に溶解した。
【0115】
(7)第2鎖cDNA合成
第1鎖cDNAを鋳型にした第2鎖cDNAの合成は以下のように行った。最終容量60μlの反応系で、第2鎖低バッファー(200mM Tris−HCl(pH8.75)、100mM KCl、100mM(NHSO、20mM MgSO、1%Triton X−100、1mg/μlBSA)3μl、第2鎖高バッファー(200mM Tris−HCl(pH9.2)、600mM KCl、20mM MgCl)3μl、dCTP、dATP、dTTP、dGTP各々0.25mM、β−NADH 6μl、オリゴdG付加された第1鎖cDNA31μl、第2鎖プライマー−アダプター(配列番号20)600ng を加え、Ex Taq DNAポリメラーゼ(TaKaRa Ex Taq;TaKaRa社製)15unit、耐熱性DNAリガーゼ(Ampligase;Epicentre社製)150unit、耐熱性RNase H(Hybridase;Epicentre社製)3unitによって第2鎖cDNAを合成した。
【0116】
0.5M EDTAを1μl加えることで反応を停止させ、更に蛋白成分を溶解するために、10% SDS 1μl、プロテイナーゼ(Proteinase) K 10μgの存在下に45℃で15分間加熱し、最終的にフェノール/クロロホルムによる抽出、エタノール沈澱にて精製した2本鎖完全長cDNAを得た。
【0117】
(8)ライブラリーの調製
以上の方法により得られた二本鎖完全長cDNAは、λZAPIIIベクターに挿入し、ライブラリーとして回収した。λZAPIIIベクターはλZAPII(STRATAGENE社製)ベクターのマルチクローニングサイトの一部の配列(配列番号21)を配列番号22に改変し、二つのSfiIサイトを新たに導入したものである。
【0118】
さらにλPS(RIKEN)ベクターを作製し、cDNAを挿入した。λPS(RIKEN)(λ−FLC−1と命名(FLCとはFULL−LENGTH cDNAを意味する))とは、MoBiTec社(ドイツ)のλPSベクターをcDNA用に改変したものである。即ち10kbp stufferの両側に存在するクローニングサイトにcDNA挿入に便利なBamHIならびにSalIを各々導入するとともに、0.5kbから13kb程度までのcDNAがクローニングできるようにXbaIサイトに6kbのDNA断片を挿入したものである(特開2000−325080号公報)。このλ−FLC−1を用いると、例えば肺臓cDNAライブラリーの場合には、インサートの平均鎖長は2.57kbとなり、実際に0.5kbから12kbまでのインサートをクローニングすることが出来た。従来法のλZAPの場合には、インサートの平均鎖長は0.97kbであったことから、λ−FLC−1を用いることによって、サイズの大きなcDNAもλZAPに比べて効率よくクローニングできることがわかる。
【0119】
実施例2 完全長cDNAライブラリーのノーマライゼーション/サブトラクション
(1)ドライバーの調製
実施例1(1)で作製したmRNA(以下、これを「(a)RNAドライバー」と称することがある)、及びin vitro転写反応で作成したRNAをドライバーとして用いた。後者のRNAはさらに2種類(以下、これを「(b)RNAドライバー、及び「(c)RNAドライバー」と称する)に分けられる。1つはノーマライゼーションにより除かれたRNA−cDNAからcDNAを回収し、ファージベクターにクローニングしたものである。大腸菌に感染後1つの出発材料あたり1000から2000プラークを混ぜ合わせて1つのライブラリー(ミニライブラリー)とし、常法によりプラスミドDNAに変換する(ファージをヘルパーファージとともに再度大腸菌に感染させ、ファージミドとし、さらにもう一度感染させてプラスミドDNAを得る)。
【0120】
得られたDNAについてin vitro転写反応(T3RNAポリメラーゼまたはT7RNAポリメラーゼを用いる)を行い、DNase I(RQ1−RNase free;Promega社製)、ProteinaseK処理後、フェノール/クロロホルム抽出をしてRNA(b)RNAドライバーを得た。この際、通常出発材料としては9種類(すい臓、肝臓、肺、腎臓、脳、脾臓、睾丸、小腸、胃)の組織からそれぞれミニライブラリーを作成して、9種類のミニライブラリーを混合してRNAを得る。もう一つのRNAはすでに重複のないクローンとして保存されているライブラリー(クローン数約2万個)を培養し、得られたDNAについて(b)RNAドライバーと同様にin vitro転写反応を行い(c)RNAドライバーとした。
【0121】
これら3種のRNAは、Label−IT Biotin LabelingKit(Mirus Corporation製)を用いてビオチン化標識を行ったあと、1:1:1の割合でテスターcDNAに添加し、Rot10での反応(42℃)を行い、ストレプトアビジンビーズ(CPG)処理を行って回収した上清について、第2鎖の合成を行った。
【0122】
実施例完全長cDNAクローンの塩基配列決定
(1)クローンのrearray
各クラスタからひとつの代表クローンを選んだ。代表クローンはQ−bot(GENETIX LIMITED製)で選択し、384穴プレートにarray化した。その際、大腸菌は30℃で18〜24時間、50μlのLB培地で培養した。このとき、cDNAライブラリーがPSベクターに導入され大腸菌DH10Bを形質転換している場合には100mg/mlのアンピシリン及び50mg/mlのカナマイシンを添加し、Zapベクターに導入し、SOLRシステムに導入している場合には100mg/mlのアンピシリン及び25mg/mlのストレプトアビジンを添加して行った。
【0123】
(2)プラスミドの抽出とInsSizing
上記(1)で培養した各クローンは、さらに100mg/mlのアンピシリンを含む1.3mlのHT液中で培養され、遠心分離により菌体を回収した後、QIAprep 96 Turbo(QIAGEN社製)を用いてプラスミドDNAを回収、精製した。取得されたプラスミド中に挿入されているcDNAの鎖長を調べるために、上記で取得したプラスミドDNAの1/30を制限酵素PyuIIで消化し、1%のagaroseゲル電気泳動を行った。
【0124】
(3)配列決定
かくして取得されたプラスミド中に挿入された完全長cDNAの全長の塩基配列解析には、3種類のシークエンサを用いた。また、プラスミドは挿入配列の長さが2.5kbより短いものと長いものの2つのカテゴリに分けた。このうち2.5kbより短い挿入配列を有するクローンについては両端から塩基配列を解析した。その際、プラスミドはベクターがPSの場合には配列番号23(センス鎖)、及び24(アンチセンス鎖)に記載のプライマーを用いて、またベクターがZapの場合には配列番号25(センス鎖)、及び26(アンチセンス鎖)に記載のプライマーを用いてThermosequenase Primer Cycle Sequencing Kit(Amersham Pharmacia Biotech社製)で反応し、Licor DNA4200(long read sequencer)を用いて解析した。
【0125】
上記塩基配列解析により解析ができなかったギャップは、プライマウォーキング法により決定した。その際、ABI Prism377及び/またはABI Prism3700(Applied Biosystems Inc.製)とBigDye terminator kitとCycle Sequencing FS ready Reaction Kit(Applied Biosystems Inc.製)を用いた。
【0126】
また、挿入されているcDNAが2.5kbより長いクローンの配列決定は、ショットガン法によった。その際、Shimadzu RISA 384とDYEnamic ET terminator cycle sequencing kit(Amersham Pharmacia Biotech社製)を用いた。ショットガンライブラリを作製するために、48の独立な代表クローンからPCRで増殖した48のDNAフラグメントを用いた。増幅されたDNA断片の末端をT4 DNAポリメラーゼによって平滑化した。
このDNA断片を、pUC18ベクターへ挿入し、更に該組み換えベクターにより大腸菌DH10Bを形質転換した。この大腸菌から上記(2)と同様にしてプラスミドを調製した。
【0127】
それらの代表クローンについては、両末端からの塩基配列解析によって塩基配列を決定し、該塩基配列をコンピューター上で連結した後、Double Stroke Shearing Device(Fiore Inc.製)によるshearingを行った。ショットガン法による塩基配列決定は、12〜15クローンの重複をもって行った。この塩基配列決定により配列が決定できなかったギャップは、上記と同様にプライマウォーキングによって決定した。
【0128】
実施例4 各完全長cDNAクローンの塩基配列の解析
実施例3で決定した完全長cDNAクローンの全塩基配列について、BLASTによる相同性検索や、HMMPFAMによるタンパク質特徴検索を行い、各完全長cDNAクローンがコードするタンパク質の機能を推定した。
【0129】
(1)dnaform34219(配列番号1、10)
dnaform34219は、配列番号1に示すように、2617塩基から成り、そのうち塩基番号146から1624までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、492アミノ酸残基から成る (配列番号10)。配列番号1がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AK074067が、e−value:5×10−148で、また310アミノ酸残基に亘り84%の一致度で、また(ii)データベース登録記号BC007206が、e−value:5×10−49で、286アミノ酸残基に亘り39%の一致度で、さらに(iii)データベース登録記号AL390078が、e−value:5×10−44で、286アミノ酸残基に亘り37%の一致度でヒットした。(ii)および(iii)のヒットは、SH2 domain−containing transforming proteinに似たタンパク質であった。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号10のアミノ酸番号393−469にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号1に示す塩基配列がコードするタンパク質はチロシンリン酸化タンパク質との相互作用に関わる機能を有するタンパク質であることが推測された。
【0130】
(2)dnaform51548(配列番号2、11)
dnaform51548は、配列番号2に示すように、4755塩基から成り、そのうち塩基番号159から2249までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、696アミノ酸残基から成る (配列番号11)。配列番号2がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AK027856が、e−value:0.0で、また470アミノ酸残基に亘り80%の一致度で、また(ii)データベース登録記号Z18529が、e−value:1×10−84で、536アミノ酸残基に亘り38%の一致度で、さらに(iii)データベース登録記号Q04205、Tensinが、e−value:1×10−84で、536アミノ酸残基に亘り38%の一致度でヒットした。このtensinは、SH2 domainを持つ(Science, 252: 712−5 (1991))。
また、配列番号2に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号11のアミノ酸番号429−521にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号2に示す塩基配列がコードするタンパク質はチロシンリン酸化タンパク質との相互作用に関わる機能を有するタンパク質であることが推測された。
【0131】
(3)dnaform46811(配列番号3、12)
dnaform46811は、配列番号3に示すように、3089塩基から成り、そのうち塩基番号474から1010までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、178アミノ酸残基から成る (配列番号12)。配列番号3がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号BC025237、hematopoietic SH2 proteinが、e−value:2×10−15で、また138アミノ酸残基に亘り38%の一致度で、また(ii)データベース登録記号Q9QXK9、SH2 domain protein 2A、Lad, an adapter protein interacting with the SH2 domain of p56lck(T cell 分化に関与)が、e−value:2×10−10で、105アミノ酸残基に亘り37%の一致度で、さらに(iii)データベース登録記号Q9NP31、SH2 domain protein 2Aが、e−value:7×10−08で、100アミノ酸残基に亘り36%の一致度でヒットした。
また、配列番号3に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号12のアミノ酸番号72−147にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号3に示す塩基配列がコードするタンパク質はチロシンリン酸化タンパク質との相互作用に関わる機能を有するアダプタータンパク質であることが推測された。
【0132】
(4)dnaform27114(配列番号4、13)
dnaform27114は、配列番号4に示すように、1990塩基から成り、そのうち塩基番号535から1440までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、301アミノ酸残基から成る (配列番号13)。配列番号4がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号P29353、SHC transforming protein(HUMAN)(細胞の癌化に関与することが知られている(Cell 1992 Jul 10;70(1):93−104))が、e−value:1×10−55で、また317アミノ酸残基に亘り44%の一致度で、また(ii)データベース登録記号P98083、SHC transforming protein(MOUSE)(細胞の癌化に関与することが知られている(J Biol Chem 1994 Dec 23;269(51):32031−4))が、e−value:2×10−54で、314アミノ酸残基に亘り44%の一致度で、さらに(iii)データベース登録記号P98077、Protein SCK(HUMAN)が、e−value:2×10−44で、305アミノ酸残基に亘り39%の一致度でヒットした。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号13のアミノ酸番号198−268にシグナル伝達因子との結合に必要なモジュール構造の特徴を示す配列(PfamにSH2としてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号4に示す塩基配列がコードするタンパク質は、チロシンリン酸化タンパク質との相互作用に関わる機能を有するタンパク質であり、癌化と関与することが推測され、該タンパク質または該タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、動脈硬化、などの治療薬として開発できる可能性がある。
【0133】
(5)dnaform31796(配列番号5、14)
dnaform31796は、配列番号5に示すように、3004塩基から成り、そのうち塩基番号50から1657までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、535アミノ酸残基から成る (配列番号14)。配列番号5がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号P46681、Actin interacting protein 2が、e−value:5×10−136で、また488アミノ酸残基に亘り52%の一致度で、また(ii)データベース登録記号AE005999、FAD−binding oxidoreductaseが、e−value:1×10−64で、437アミノ酸残基に亘り34%の一致度で、さらに(iii)データベース登録記号P32891、D−lactate dehydrogenase(YEAST)が、e−value:2×10−38で、433アミノ酸残基に亘り27%の一致度でヒットした。これらの結果より配列番号14に示したアミノ酸配列からなるタンパク質は酵素であることが推測された。
また、配列番号5に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号14のアミノ酸番号82− 275にFADと結合する特徴を示す配列(PfamにFAD_binding_4としてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号5に示す塩基配列がコードするタンパク質はFADとの結合機能を有する酵素であることが推測された。
【0134】
(6)dnaform25173(配列番号6、15)
dnaform25173は、配列番号6に示すように、1395塩基から成り、そのうち塩基番号869から1174までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、101アミノ酸残基から成る (配列番号15)。配列番号6がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号P42436、Assimilatory nitrite reductase が、e−value:3×10−05で、また78アミノ酸残基に亘り34%の一致度で、また(ii)データベース登録記号AE006738、toluene−4−monooxygenase system proteinが、e−value:0.009で、78アミノ酸残基に亘り32%の一致度でヒットした。これらの結果より配列番号15に示したアミノ酸配列からなるタンパク質は酵素であることが推測された。
また、配列番号6に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号15のアミノ酸番号16−101にFeと結合する特徴を示す配列(PfamにRieskeとしてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号6に示す塩基配列がコードするタンパク質はFeを介した酸化還元酵素であると推測され、したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、高血圧、免疫性疾患、炎症性疾患、などの治療薬として開発できる可能性がある。
【0135】
(7)dnaform45474(配列番号7、16)
dnaform45474は、配列番号7に示すように、1327塩基から成り、そのうち塩基番号549から1022までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、157アミノ酸残基から成る (配列番号16)。配列番号7がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号P42436、Assimilatory nitrite reductaseが、e−value:2×10−05で、また81アミノ酸残基に亘り34%の一致度で、また(ii)データベース登録記号AE006738、toluene−4−monooxygenase system proteinが、e−value:8×10−05で、114アミノ酸残基に亘り31%の一致度で、さらに(iii)データベース登録記号AP003000、nitrate reductase small subunitが、e−value:0.005で、79アミノ酸残基に亘り30%の一致度でヒットした。これらの結果より配列番号16に示したアミノ酸配列からなるタンパク質は酵素であることが推測された。
また、配列番号7に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号16のアミノ酸番号16−134にFeと結合する特徴を示す配列(PfamにRieskeとしてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号7に示す塩基配列がコードするタンパク質は酸化的リン酸化の機能を有する還元酵素であることが推測された。したがって、該タンパク質または該タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、高血圧、免疫性疾患、炎症性疾患、などの治療薬として開発できる可能性がある。
【0136】
(8)dnaform56923(配列番号8、17)
dnaform56923は、配列番号8に示すように、2808塩基から成り、そのうち塩基番号1045から1518までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、157アミノ酸残基から成る (配列番号17)。配列番号8がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号P42436、Assimilatory nitrite reductaseが、e−value:1×10−05で、また81アミノ酸残基に亘り35%の一致度で、また(ii)データベース登録記号AE006738、toluene−4−monooxygenase system proteinが、e−value:1×10−04で、114アミノ酸残基に亘り31%の一致度で、さらに(iii)データベース登録記号AP003000、nitrate reductase small subunitが、e−value:0.005で、79アミノ酸残基に亘り30%の一致度でヒットした。これらの結果より配列番号17に示したアミノ酸配列からなるタンパク質は酵素であることが推測された。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号17のアミノ酸番号16−134にFeと結合する特徴を示す配列(PfamにRieskeとしてエントリーされるアミノ酸配列)を見出した。
これらのことから配列番号8に示す塩基配列がコードするタンパク質は酸化的リン酸化の機能を有する還元酵素であることが推測された。したがって、該タンパク質または該タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、高血圧、免疫性疾患、炎症性疾患、などの治療薬として開発できる可能性がある。
【0137】
(9)dnaform48770(配列番号9、18)
dnaform48770は、配列番号9に示すように、3275塩基から成り、そのうち塩基番号169から2760までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、863アミノ酸残基から成る (配列番号18)。配列番号9がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF479747、 PYRIN−containing APAF1−like protein 4が、e−value:0.0で、また868アミノ酸残基に亘り42%の一致度で、また(ii)データベース登録記号AF482706、ribonuclease inhibitor 2 (RNH2)が、e−value:5×10−167で、780アミノ酸残基に亘り41%の一致度で、さらに(iii)データベース登録記号AF298547、nucleotide−binding site protein 1が、e−value:2×10−97で、911アミノ酸残基に亘り29%の一致度でヒットした。
これらのことから配列番号9に示す塩基配列がコードするタンパク質はタンパク質−タンパク質相互作用に関わる機能を有するタンパク質であることが推測された。
【0138】
実施例5 タンパク質−タンパク質相互作用解析
哺乳動物細胞におけるtwo−hybrid法(Suzuki, H., et al., Genome Research, 11, 1758−1765 (2001))を用いて、2種類のマウス全長cDNAの塩基配列(dnaform31796、dnaform46811)のタンパク質コード配列がコードするタンパク質のタンパク質−タンパク質相互作用を網羅的に解析した。
【0139】
(1)PCR法を用いた迅速なサンプル調製
哺乳動物細胞でのtwo−hybrid実験は、CheckMate mammalian two−hybrid system(Promega社)を利用した。タンパク質−タンパク質相互解析用のサンプルは、CMVプロモーターの下流にGal4遺伝子のDNA結合領域を挿入したプラスミドベクターpBIND、CMVプロモーターの下流にVP16遺伝子の転写活性化領域を挿入したプラスミドベクターpACT,および5個のGal4結合領域とTATAボックスの下流にレポーターであるルシフェラーゼ遺伝子を挿入したプラスミドベクターpG5lucを鋳型として調製した。Gal4遺伝子と2種類のマウス全長cDNAの塩基配列(dnaform31796、dnaform46811)のタンパク質コード配列との融合遺伝子、並びにVP16遺伝子とマウスcDNAライブラリーFANTOM( HYPERLINK http://fantom.gsc.riken.go.jp/ http://fantom.gsc.riken.go.jp/)の各クローンが有する完全長cDNAのタンパク質コード配列との融合遺伝子は、基本的にPromega社のプロトコールに従い共通配列部分を用いた連結と2段階PCR法を組み合わせて作成した。(Suzuki, H., et al., Genome Research, 11, 1758−1765 (2001)の図1参照)。マウスcDNAのタンパク質コード配列を、5’側に共通配列をもち3’側に遺伝子特異的な配列をもつフォワードプライマーおよびM13ユニバーサルプライマーとを用いてPCR増幅した後、上記増幅産物とpBINDまたはpACTのPCR増幅産物(3’側に共通配列を付加した)とを混和し、それぞれネスティドプライマーを用いて第2段のPCR増幅を行い、Gal4とマウスタンパク質の融合タンパク質を発現させるベクター(BINDサンプル)またはVP16とマウスタンパク質の融合タンパク質を発現させるベクター(ACTサンプル)を構築した。
【0140】
(2)ハイスループットな哺乳動物細胞でのtwo−hybrid実験
PCR法で調製したBINDおよびACTサンプルは、それ以上の精製を行わずに直接使用した。BINDサンプルおよびACTサンプルのそれぞれ0.25μl、30ngのpG5luc、および9.5μlのOpti−MEM培地(Lifetech社)を384ウェルプレートに分注した。Opti−MEM培地にて32倍希釈したLF2000トランスフェクション試薬(Lifetech社)10μlをウェルに加えて混和し20分間インキュベーション後、F12培地にて1,300細胞/μlに懸濁したCHO−K1チャイニーズハムスター細胞液20μlを加えて良く懸濁した。アッセイサンプルをCOインキュベーター内で20時間培養後、ルシフェラーゼ活性はSteady−Glo Luciferase Assay System(Promega社)を用いて測定し、相互作用を確認した。
【0141】
(3)解析結果
上記(2)の結果を表1に示すが、2種類のマウス全長cDNAの塩基配列(dnaform31796、dnaform46811)がコードするタンパク質は、マウスcDNAライブラリーFANTOM( HYPERLINK http://fantom.gsc.riken.go.jp/ http://fantom.gsc.riken.go.jp/)の特定のクローンが有するcDNAの塩基配列がコードするタンパク質との相互作用を下記のように有していることが明らかとなった。
【0142】
実施例4より、dnaform46811のオープンリーディングフレームから予測されるアミノ酸配列(配列番号12)を有するタンパク質(以下、これを「本タンパク質」と称する)は、チロシンリン酸化タンパク質との相互作用に関わる機能を有するタンパク質であることが推測されている。チロシンリン酸化タンパク質は、シグナル伝達において重要な機能を持つものが多数知られている。表1から明らかな通り、本タンパク質は、(i) neural precursor cell expressed, developmentally down−regulated gene 9 (Nedd9)がコードするタンパク質、(ii)hypothetical outer arm dynein light chain 1 structure containing protein 、(iii)melanoma antigen/family D、(iv)nuclear factor NF−kappaB p105、(v)OVARC1000148 PROTEIN homolog hypothetical protein FLJ10911 [Homo sapiens]と相互作用することが解った。
【0143】
Nedd9は、細胞骨格または核に存在し、CRK癌遺伝子に相互作用することによって細胞増殖・細胞接着に関与することが知られている(http://www.informatics.jax.org/searches/accession_report.cgi?id=MGI:97302)。
hypothetical outer arm dynein light chain 1 structure containing protein は、モーター蛋白質として細胞骨格に位置し、細胞質ダイニンとしては、膜小胞などの輸送や細胞分裂などに関連することが知られている。また、beta−Adrenergic receptor の アゴニスト刺激が、気道上皮細胞においてOuter arm dynein のリン酸化をもたらすことが知られており(J. Allergy Clin Immunol 2002 110(6Suppl):S275−81)、本タンパク質がouter arm dyneinと相互作用することから、本タンパク質は気管の繊毛運動等を介した気管支喘息等の呼吸器疾患と関連していることが推測された。
Melanoma antigen/family Dは、cell adhesion protein trophinin と相同性があり、細胞接着および癌との関連が推測されている(Cancer Res, 59: 4100−3
(1999))。
nuclear factor NF−kappaB p105は、様々な遺伝子の発現を調節する転写調節因子である(Exp Hematol, 30: 285−96 (2002))。
OVARC1000148 PROTEIN homolog hypothetical protein FLJ10911 [Homo sapiens]は、RNA結合ドメインをもち、卵巣癌のcDNAライブラリーから取得されたクローンであることから癌との関連が推測される。
【0144】
以上のことから、本タンパク質は、細胞骨格および核に位置して、細胞増殖、細胞接着に関与し、癌化や細胞のアポトーシス、気管支喘息等の呼吸器疾患と関連することが推測された。
【0145】
【表1】

Figure 2004229652
【0146】
実施例6 PCR法を用いた組織発現解析
本発明のタンパク質をコードするmRNA(dnaform31796)の正常マウスおよび疾患マウスでの組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
【0147】
(1)cDNA合成
以下のマウス(森脇和郎、外1名編、Molecular Medicine別冊、Vol. 36「自然発症疾患モデル動物 」、中山書店、1999年)の19組織からトータルRNAを抽出し、オリゴdTをプライマーとして逆転写酵素を用いてcDNA合成を行った。
(a)正常マウスの組織および糖尿病モデルマウスの組織
▲1▼ 対照マウスC57BL/KsJ − +m/+m Jcl(メス、8週齢)の全脳、視床、肺、腎臓、骨髄、膵臓、脂肪細胞、肝臓、眼
▲2▼ 糖尿病モデルマウスC57BL/KsJ − db/db Jcl(メス、8週齢)の膵臓、脂肪細胞、肝臓、眼
(b)老化促進マウスの組織
▲1▼ 正常老化マウス SAM R1/TA Slc(オス、13週齢)の海馬、前頭葉皮質
▲2▼ 老化促進マウス SAM P8/Ta Slc(オス、15週齢)の海馬、前頭葉皮質
(c) 癌転移モデルマウスの組織
▲1▼ 対照マウスBalb/c(メス、5週齢)の正常結腸
▲2▼ 癌転移モデルマウスBalb/c(メス、6週齢)結腸癌(マウス腹腔に結腸癌細胞Colon26を移植し、2週間後に結腸癌を摘出)
【0148】
(2)PCR法による定量
本発明のタンパク質をコードしているmRNA(dnaform31796)の発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
5’側プライマー:ACCTTGTGATCGACCTACGC(配列番号27)
3’側プライマー:CTCAGCTGTCCAGGCATACA(配列番号28)
定量結果はGlyceraldehyde 3−phosphate dehydrogenase (GAPDH) を内部標準として補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)を GAPDHの発現量(コピー数/μl)で除し、定数(1×10)を乗して表示した。 その結果を表2に示す。
【0149】
【表2】
Figure 2004229652
【0150】
表2から明らかな通り、dnaform31796は全身で強く発現発現したが、結腸癌で発現が減少した。dnaform31796のcDNAおよび該cDNAによってコードされるタンパク質は、癌などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0151】
実施例7 ハエホモログDNAを用いたRNAi法による機能解析
(1)マウスcDNAのハエホモログDNAの解析および取得
上記で得られたマウス全長cDNAの塩基配列(クローン名:dnaform31796)に対するハエ遺伝子のホモログDNAを以下に示す配列解析により予測した。配列解析は、ORFから翻訳されるタンパク質を考え、アミノ酸配列レベルで行った。マウスクローンdnaform31796として、配列番号14に示すアミノ酸配列を含むマウス全長cDNAクローン(配列番号5)とハエクローン(Berkeley Drosophila Genome Project(BDGP) Drosophila Genomic Sequence Release 3.0)との間においてペアワイズな配列比較をNCBI BLASTP 2.2.2 (Altschul et al., Nucleic Acids Res. 25, 3389−3402 (1997))により行い、2種のクローン間において互いに最も良いE−valueの値を示した関係にあるハエの遺伝子を、予測されたホモログDNAとして同定した(Tatusov, Koonin & Lipman, Science 278, 631 (1997))。結果として、マウスcDNA(dnaform31796)に対するハエホモログDNAを見つけることができた。ハエホモログDNAの遺伝子番号は、マウス:dnaform31796に対してハエ:CG3835(トランスクリプト番号:pp−CT42118)であった。
【0152】
(2)ハエ系統の樹立
(i)逆向き反復配列(inverted repeat)ベクターの作製
上記ハエcDNA(CG3835)のORF、5’側約500bpの断片(以下これを「目的のcDNA」と称することがある)を、ハエのcDNAライブラリー(Berkeley Drosophila Genome Project( http://www.fruitfly.org)で同定されたunigeneset; Invitrogen社)を鋳型としたPCRによって増幅した。PCRプライマーは、CpoIA7(配列番号29:AAATTTCGGACCGの3’末端に、目的のcDNAの5’末端の21ベースの塩基配列を結合させたもの)とSfiIA3(配列番号30:AAATTTGGCCATATAGGCCの3’末端に、目的のcDNAの3’末端の21ベースの塩基配列を結合させたもの)のセット、およびSfiIB7(配列番号31:AAATTTGGCCTACATGGCCに記載の塩基配列の3’末端に、目的のcDNAの5’末端の21ベースの塩基配列を結合させたもの)とCpoIB3(配列番号32:塩基配列:AAATTTCGGTCCGの3’末端に、目的のcDNAの3’末端の21ベースの塩基配列を結合させたもの)のセットを用いた。
【0153】
上記の各セットのプライマーを用いてPCR増幅した約500bpのDNA断片をSfiIで消化し、この消化断片をハエクローニング用ベクター(pUASTCS1:上田龍他、細胞工学、vol21, No.8, 923−932(2002))をSfiIで消化したサイト間に挿入しクローニングした。さらに、このベクターをCpoIで消化したサイト間に、上記PCRで増幅したDNA断片をCpoI消化したDNA断片を挿入しクローニングした。この2回のサブクローニングにより、ハエcDNAのORFの約500bpの断片が、UAS配列(GAL上流活性化配列)の下流に隣接したヒートショックプロテイン70のベーシックプロモーターの制御下に、逆向きで2カ所挿入されたベクター(inverted repeat ベクター)が取得された。
上記で用いたハエトランスフォーメション用ベクターであるpUASTベクターはトランスポゾンP因子を利用したベクターで、UAS配列とヒートショックプロテイン70のベーシックプロモーターを利用して、転写促進タンパク質GAL4がUAS配列に結合することによりUAS配列の下流に挿入した逆向き反復配列の転写を誘導できるベクターである。
【0154】
(ii)ハエの形質転換
通常のP因子形質転換法である、上田龍他、細胞工学、vol21, No.8, 923−932(2002)に記載の方法に則って、上記(i)で調製したinverted repeat ベクターDNAをW1118系統のハエ(Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform)の初期胚にマイクロマニュピレーターを用いて微量注入した。これを培養して孵化させ、成虫とした後に、上記文献記載の手順に準じて交配を行った。この交配で、ダブルバランサーとしてW1118系統のSp/SM1、Cy:Pr/TM3、Sb Serを用いた。この交配により、上記inverted repeatベクターが挿入した染色体を、ホモ接合に持ったハエ(以下、これを「IR系統」と称する)が作製された。
【0155】
(3)RNAi効果の誘導
(i)GAL4ドライバーとの交配による変異誘導
上記(2)で得られたIR系統のハエをAct5C−GAL4系統のハエ(Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform)と交配した(図1)。Act5C−GAL4は、全身の細胞で発現する細胞性アクチン遺伝子(Act5C)のプロモーターに酵母GAL4遺伝子をつないだfusion geneを遺伝子導入した系統である。従って、このAct5C−GAL4導入遺伝子を持ったハエでは全ての細胞で、GAL4タンパク質が発現している。
IR系統のハエと、Act5C−GAL4系統のハエを交配した子孫(F1世代、以下これを「RNAi個体」と称する)では、図1にあるように2種類の導入遺伝子が存在する。従って、全ての細胞でGAL4タンパク質が発現し、IRベクターを強制転写するため、dsRNAが細胞に出現し、RNAi効果を発揮し、ターゲットmRNAが発現した場合にこれを分解する。従って、その個体の全ての細胞でターゲット遺伝子の機能阻害が起こる。ターゲットmRNAが発現していない細胞では何の効果ももたらさない。
【0156】
(4)表現型の解析および結果
上記(3)で誘導されたRNAi効果で、マウスcDNA(dnaform31796)のハエホモログDNA(CG3835)がコードするタンパク質の機能が阻害されたことによるハエ個体の表現型の変化を観察した。その結果、CG3835のRNAi個体は半致死、すなわち蛹にはなるが脱皮して成虫となる個体は5%以下であることが判明した。
RNAi技術を用いて上記ハエ遺伝子の発現抑制を行い機能阻害することにより、ハエ個体が半致死となったことから、該遺伝子は発生あるいは個体の生存・機能維持に重要な役割を果たしていることが分かった。前記の通り、dnaform31796(配列番号5)がコードするタンパク質(配列番号14)は、FADとの結合能を有する酵素であることが推測されており、マウスの全身で強く発現し癌組織では発現が減少していることから、RNAi個体中において、ハエホモログDNAがコードするFADとの結合能を有する酵素の活性が阻害されたことにより、個体の発生・分化の過程で細胞増殖が正常に進行せず、個体は半致死となったものと考えられる。
上記の通り、dnaform31796がコードするタンパク質はFADとの結合能を有する酵素の活性を有しており、発生・分化・生理的機能あるいは病態との関連で重要な役割を果たしていることが推察される。
【0157】
実施例8 完全長cDNAがコードするタンパク質の総合的機能解析
上記実施例4の塩基配列の解析結果ならびに実施例5〜7の組織発現および機能解析結果から、本発明のタンパク質は、次の性質を有することが明らかとなった。
【0158】
(1)dnaform46811(配列番号3、12)
dnaform46811のオープンリーディングフレームから予測されるアミノ酸配列(配列番号12)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4よりチロシンリン酸化タンパク質との相互作用に関わる機能を有するアダプター蛋白質であり、血球系細胞の分化に関わる可能性が推測された。また、本タンパク質は、実施例5より、細胞骨格および核に位置して、細胞増殖、細胞接着に関与し、癌化や細胞のアポトーシス、と関連することが推測された。したがって、本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、炎症性疾患、免疫性疾患、気管支喘息等の呼吸器系疾患やの治療薬として開発できる可能性がある。
【0159】
(2)dnaform31796(配列番号5、14)
dnaform31796のオープンリーディングフレームから予測されるアミノ酸配列(配列番号14)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4よりFADとの結合機能を有する酵素であると推測された。また、本タンパク質は、実施例6より、全身で強く発現発現したが、結腸癌で発現が減少し、さらに実施例7より、ハエホモログDNAによるRNAi効果は半致死であったことから、癌との関連性があり、発生・分化等において重要な役割を果たす機能的に重要なFADを利用した反応を触媒する酵素であることが推測された。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、代謝性疾患、免疫性疾患、炎症性疾患、などの治療薬として開発できる可能性がある。
【0160】
【発明の効果】
本発明のタンパク質およびそれをコードするDNAは酵素活性またはタンパク質相互作用活性等を有することから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
本出願は、2002年5月2日付けの日本特許出願(特願2002−130918)および2002年12月4日付けの日本特許出願(特願2002−352786)に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。
【0161】
【配列表】
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652

【図面の簡単な説明】
【図1】図1は、RNAi個体中の導入遺伝子の誘導方法を示す概念図である。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a novel protein, a DNA encoding the protein, a full-length cDNA encoding the protein, a recombinant vector having the DNA, an oligonucleotide comprising a partial sequence of the DNA, and a transgenic cell into which the DNA has been introduced. And antibodies that specifically bind to the protein.
[0002]
[Prior art]
Obtaining cDNA and analyzing its base sequence are indispensable for analyzing the physiological activity of a protein expressed in a living body and developing a method for utilizing the protein based on the activity. Furthermore, creating a library in which full-length cDNAs corresponding to all gene types are cataloged is one of the important issues of the human genome project. The cataloged library means that there is no duplication in the cDNAs contained in the library, and refers to a library containing one type of each cDNA.
[0003]
The full-length cDNA cloning method is described in JP-A-9-248187 and JP-A-10-127291. This method comprises the steps of binding a molecule serving as a tag to a diol structure present at the 5 'cap site of mRNA, using the mRNA bound with the tag molecule as a template, oligo dT as a primer, and reverse transcription to an RNA-DNA complex. And separating the complex having a DNA corresponding to the full length of the mRNA using the function of the tag molecule.
[0004]
As an efficient reverse transcription method, a method for performing the transcription at a high temperature such that the template does not form a higher-order structure has been developed (Japanese Patent Laid-Open No. Hei 10-84661). Furthermore, a cloning vector has been developed which can uniformly clone a DNA fragment contained in a synthesized full-length cDNA library regardless of its chain length (Japanese Patent Application Laid-Open No. H11-9273).
[0005]
A full-length cDNA library produced by such a technique does not necessarily include all the elements that are different evenly as individual elements of the library, and is present only in clones with a high abundance ratio or, conversely, in very small amounts. There are clones. Since a clone existing only in such a trace amount is highly likely to be novel, a subtraction method and a normalization method for enriching such a clone have also been developed (Japanese Patent Application Laid-Open No. 2000-325080; Carnini, P. et al. et al., Genomics, 37, 327-336 (1996)).
The nucleotide sequence of each clone of the cataloged full-length cDNA library thus obtained can be identified by a known method, but the nucleotide sequence is identified, but the physiological activity of the protein encoded by the cDNA is still unknown. Remains.
[0006]
[Problems to be solved by the invention]
The present invention analyzes the nucleotide sequence of a cDNA clone contained in a cataloged full-length cDNA library, and among those having a novel sequence, identifies the biological activity of the protein encoded by the cDNA sequence and determines the biological activity. It is an object of the present invention to propose a method of using a protein based thereon and DNA encoding the same.
[0007]
[Means for Solving the Problems]
The present inventors analyzed the nucleotide sequence of a cDNA clone in a mouse full-length cDNA library and searched a database based on the homology of the sequence, and found that a protein having an enzymatic activity or protein Were identified, and the proteins encoded by these cDNAs were identified as having enzyme activity or protein interaction activity. In addition, (i) the expression level of these cDNAs in each tissue is analyzed, (ii) the protein encoded by the cDNA is expressed and the interaction with other proteins is analyzed, and (iii) the cDNA encodes The phenotypic change of the individual whose protein expression was inhibited was analyzed, and the functions of the protein encoded by the cDNA were comprehensively analyzed from the results of these (i) to (iii). The present invention has been achieved based on these findings.
[0008]
That is, according to the present invention, the following inventions (1) to (25) are provided.
(1) The following protein of (a) or (b):
(A) a protein consisting of the amino acid sequence of any one of SEQ ID NOs: 14 to 17;
(B) a protein comprising an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any of SEQ ID NOs: 14 to 17, and which has an enzymatic activity.
[0009]
(2) A DNA encoding the protein of (1).
(3) A full-length cDNA encoding the protein according to (1).
(4) The DNA of any one of the following (a), (b) or (c):
(A) DNA having the nucleotide sequence of any one of SEQ ID NOs: 5 to 8.
(B) encoding a protein having an enzymatic activity, having a base sequence in which one or several bases are deleted, substituted and / or added in the base sequence set forth in any one of SEQ ID NOs: 5 to 8; DNA.
(C) encoding a protein having a base sequence capable of hybridizing under stringent conditions to a DNA having the base sequence of any of SEQ ID NOs: 5 to 8 or a sequence complementary thereto, and having an enzymatic activity DNA.
[0010]
(5) The following protein (a) or (b):
(A) a protein comprising the amino acid sequence of any one of SEQ ID NOs: 10 to 13 or 18;
(B) a protein consisting of an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any of SEQ ID NOs: 10 to 13 or 18, and which has a protein interaction activity.
[0011]
(6) A DNA encoding the protein of (5).
(7) A full-length cDNA encoding the protein according to (5).
(8) The DNA of any of the following (a), (b) or (c):
(A) a DNA having the nucleotide sequence of any one of SEQ ID NOs: 1 to 4 or 9;
(B) in the nucleotide sequence of any one of SEQ ID NOs: 1 to 4 or 9, which has a nucleotide sequence in which one or several bases are deleted, substituted and / or added, and has a protein interaction activity DNA encoding a protein.
(C) having a base sequence capable of hybridizing under stringent conditions to DNA having the base sequence of any of SEQ ID NOs: 1 to 4 or 9 or a sequence complementary thereto, and having a protein interaction activity; DNA encoding a protein having the same.
[0012]
(9) A recombinant vector containing the DNA according to any one of (2) to (4).
(10) A gene-transfected cell into which the DNA according to any one of (2) to (4) or the recombinant vector according to (9) has been introduced, or an individual comprising the cell.
(11) The protein according to (1), which is produced by the cell according to (10).
[0013]
(12) A recombinant vector containing the DNA according to any one of (6) to (8).
(13) A gene-transfected cell into which the DNA according to any one of (6) to (8) or the recombinant vector according to (12) has been introduced, or an individual comprising the cell.
(14) The protein according to (5), which is produced by the cell according to (13).
[0014]
(15) A sense oligonucleotide having the same sequence as 5 to 100 consecutive nucleotides in the base sequence of the DNA according to any of (2) to (4) or (6) to (8), An oligonucleotide selected from the group consisting of an antisense oligonucleotide having a complementary sequence, and an oligonucleotide derivative of the sense or antisense oligonucleotide.
[0015]
(16) An antibody or a partial fragment thereof that specifically binds to the protein according to (1) or (11).
(17) The antibody according to (16), wherein the antibody is a monoclonal antibody.
(18) The antibody according to (17), wherein the monoclonal antibody has an action of neutralizing the enzyme activity of the protein according to (1) or (11).
[0016]
(19) An antibody or a partial fragment thereof that specifically binds to the protein according to (5) or (14).
(20) The antibody according to (19), wherein the antibody is a monoclonal antibody.
(21) The antibody according to (20), wherein the monoclonal antibody has an action of neutralizing the protein interaction activity of the protein according to (5) or (14).
[0017]
(22) Contacting the protein according to any one of (1), (5), (11) and (14) with a test substance and measuring a change in the activity of the protein caused by the test substance. A method for screening for a substance that modulates the activity of the protein.
(23) Expression of the gene, wherein the test substance is brought into contact with the gene-transfected cell according to (10) or (13), and a change in the expression level of the DNA introduced into the cell is detected. A method for screening for a modulator.
(24) At least one or more amino acid sequence information selected from the amino acid sequence of the protein according to (1) or (5), and / or any of (2) to (4) or (6) to (8) A computer-readable recording medium storing at least one or more nucleotide sequence information selected from the nucleotide sequence of the DNA described in 1.
(25) A carrier to which the protein according to (1) or (5) and / or the DNA according to any of (2) to (4) or (6) to (8) is bound.
[0018]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be described in more detail.
(1) Acquisition of full-length cDNA and analysis of nucleotide sequence
The DNA of the present invention may be a protein consisting of the amino acid sequences of SEQ ID NOs: 10 to 18, or one or several in the amino acid sequence (the number is not particularly limited; Means 15 or less, more preferably 10 or less, and still more preferably 5 or less) amino acid residue substitution, deletion, insertion, addition, or inversion, and Any substance can be used as long as it can encode a protein having protein interaction activity. Specifically, it may be only the translation region encoding the amino acid sequence or may include the full length of the cDNA.
[0019]
Specifically, as the DNA containing the full length of the cDNA, for example, a DNA having the nucleotide sequence of SEQ ID NOS: 1 to 9 is exemplified. In addition, as the translation region, nucleotide numbers 146 to 1624 of SEQ ID NO: 1, nucleotide numbers 159 to 2249 of SEQ ID NO: 2, nucleotide numbers 474 to 1010 of SEQ ID NO: 3, nucleotide numbers 535 to 1440 of SEQ ID NO: 4, SEQ ID NO: 4 Nucleotide numbers 50 to 1657 of SEQ ID NO: 5, 869 to 1174 of SEQ ID NO: 6, 549 to 1022 of SEQ ID NO: 7, 1045 to 1518 of SEQ ID NO: 8, and 169 to 2760 of SEQ ID NO: 9 And those having a sequence. Further, the DNA of the present invention includes not only the full length of the above-mentioned cDNA but also those containing the above-mentioned translation region and a portion adjacent to the 3 'and / or 5' end thereof, which is the minimum necessary for the expression of the translation region. .
[0020]
The DNA of the present invention may be obtained by any method as long as it can be obtained, but specifically, for example, can be obtained by the method described below. First, mRNA is prepared from a suitable animal, preferably a mammalian tissue or the like by a method known per se and generally used. Next, cDNA is synthesized using this mRNA as a template. At this time, a 5 ′ cap (7MeGpppN) A molecule serving as a tag is chemically bonded to a diol structure specific to a site, and reverse transcription is performed using this mRNA as a template and oligo dT as a primer. Then, only the full-length cDNA is separated using the function of the tag molecule. It is preferable to use the method (JP-A-9-248187, JP-A-10-127291). In addition, in the case of reverse transcription, in order to prevent the template from forming a higher-order structure and lowering the efficiency of reverse transcription, in the presence of trehalose or the like, use a thermostable reverse transcriptase at a high temperature. It is preferable to use a method of performing reverse transfer (Japanese Patent Laid-Open No. 10-84661). Here, high temperature means 40-80 degreeC.
[0021]
The thus obtained cDNA is cloned by inserting it into an appropriate cloning vector. The vector used herein has a recombination recognition sequence at both ends of a cloning site capable of uniformly cloning DNAs of various chain lengths, and is a linear vector inserted into a host by a method other than infection. (JP-A-11-9273) is preferably used. In the cDNA library thus obtained, not all clones exist uniformly (hereinafter, this may be referred to as "cataloged"), but only a very small amount exists in this library. A clone that does not have a high probability of being new. Therefore, it is preferable to use a subtraction method or a normalization method for enriching such clones (Japanese Patent Laid-Open No. 2000-325080, Carinci, P. et al., Genomics, 37, 327-336 (1996)).
[0022]
The nucleotide sequence of the cataloged cDNA library is analyzed by a commonly used method known per se. In the case of the DNA of the present invention, in the case of full-length cDNA, the base sequence obtained from the sequence based on the terminal 100 is obtained by converting BLAST (http://www.ncbi.nlm.nih.gov/BLAST/; National Center of Biotechnology Information). ), NCBI databases such as Genbank, EMBL, and DDBJ were searched, and even the sequence showing the highest homology was found to have a similarity of 30% or less as a new sequence for the following analysis.
[0023]
Examples of the DNA having such a full-length cDNA base sequence include DNAs having the base sequences of SEQ ID NOS: 1 to 9. In addition, as the translation region, nucleotide numbers 146 to 1624 of SEQ ID NO: 1, nucleotide numbers 159 to 2249 of SEQ ID NO: 2, nucleotide numbers 474 to 1010 of SEQ ID NO: 3, nucleotide numbers 535 to 1440 of SEQ ID NO: 4, SEQ ID NO: 4 Nucleotide numbers 50 to 1657 of SEQ ID NO: 5, 869 to 1174 of SEQ ID NO: 6, 549 to 1022 of SEQ ID NO: 7, 1045 to 1518 of SEQ ID NO: 8, and 169 to 2760 of SEQ ID NO: 9 And those having a sequence.
[0024]
The thus obtained novel nucleotide sequence was subjected to homology search by BLAST (Basic local alignment search tool; Altschul, SF, et al., J. Mol. Biol., 215, 403-410 (1990)). HMMPFAM (http://pfam.edust.edu.edu), which is one of the functional groups of Homology search and HMMER (sequence analysis method using a hidden Markov model; Eddy, SR, Bioinformatics 14, 755-763 (1998)). ), The function of the protein encoded by the nucleotide sequence can be estimated.
[0025]
In the homology search by BLAST, the function of the clone to be analyzed can be estimated from various kinds of annotation information associated with hit sequences having sufficiently significant homology obtained as a result of the search. Here, a sufficiently significant hit sequence means that the degree of coincidence between the catalytic domain portion or functional domain portion of the registered amino acid sequence and the corresponding portion of the amino acid sequence encoded by the DNA of the present invention is e-value. 10-4Show the following or 30% or more.
[0026]
For example, if many of the top-ranked catalytic domain sequences or functional domain sequences have been confirmed to function as proteins having an enzyme or protein interaction activity, the clones to be analyzed that are similar in sequence to those are also the same. The prediction holds that it will have a function, ie, enzymatic activity or protein interaction activity.
[0027]
In the HMMPFAM, an analysis is performed by a method of checking whether the amino acid sequence to be analyzed has the characteristics of the amino acid sequence of an entry in a database in which a protein profile called Pfam is accumulated. Profiles are extracted from a series of proteins with the same characteristics, and even if a function cannot be clarified by comparing the full length of one sequence to one sequence, if there is a characteristic region in the sequence, it can be found and its function can be predicted. . A specific example of the function prediction of the protein thus performed will be described below.
[0028]
The amino acid sequence encoded by the nucleotide sequence of SEQ ID NO: 1 was determined by BLAST search to have the database registration symbols AK074067 and e-value: 5 × 10-148, With 84% concordance over 310 amino acid residues and with the database entry symbols BC007206 and e-value: 5 × 10−49With a 39% identity over 286 amino acid residues, and with database entry symbols AL390078 and e-value: 5 × 10−44Hits with 37% identity over 286 amino acid residues.
In addition, when a protein characteristic search by the HMMPFAM was performed on the amino acid sequence encoded by the base sequence represented by SEQ ID NO: 1, a sequence showing amino acid numbers 393 to 469 of SEQ ID NO: 10 exhibiting characteristics of a module structure required for binding to a signal transduction factor. (An amino acid sequence that is entered in Pfam as SH2).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 1 is a protein having a function relating to the interaction with the tyrosine phosphorylated protein.
[0029]
The amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 2 was identified by BLAST search with a database registration code of AK027856 and e-value: 0.0, with an 80% identity over 470 amino acid residues, and a database registration code of Z18529. And e-value: 1 × 10-84With a 38% identity over 536 amino acid residues, plus database entry number Q04205, Tensin and e-value: 1 × 10-84Hits with 38% identity over 536 amino acid residues.
In addition, when a protein characteristic search by the HMMPFAM was performed on the amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 2, a sequence showing amino acid numbers 429-521 of SEQ ID NO: 11 exhibiting the characteristics of a module structure required for binding to a signal transduction factor. (An amino acid sequence that is entered in Pfam as SH2).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 2 is a protein having a function related to the interaction with the tyrosine phosphorylated protein.
[0030]
The amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 3 was obtained by BLAST search using the database registration code BC025237, hematopoietic SH2 protein, and e-value: 2 × 10-15With 38% identity over 138 amino acid residues and with database registration symbols Q9QXK9, SH2 domain protein 2A, Lad, an adapter protein interacting with the SH2 domain of p56lck (T cell-e2 and T cell e-cell differentiation) × 10-10, 105 amino acid residues, 37% identity, and database entry symbols Q9NP31, SH2 domain protein 2A and e-value: 7 × 10−08, With a 36% match over 100 amino acid residues.
When a protein characteristic search was performed on the amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 3 by HMMPFAM, amino acid numbers 72 to 147 in SEQ ID NO: 12 showed the characteristics of a module structure required for binding to a signal transduction factor. (An amino acid sequence that is entered in Pfam as SH2).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 3 is an adapter protein having a function relating to the interaction with the tyrosine phosphorylated protein.
[0031]
The amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 4 is obtained by BLAST search using database registration code P29353, SHC transforming protein (HUMAN) (known to be involved in canceration of cells (Cell 1992 Jul 10; 70 (1): 93-104)) and e-value: 1 × 10-55, With a 44% identity over 317 amino acid residues, and with the database entry symbol P98083, SHC transforming protein (MOUSE) (known to be involved in cell carcinogenesis (J Biol Chem 1994 Dec 23; 269 ( 51): 32031-4)) and e-value: 2 × 10−54With a 44% degree of identity over 314 amino acid residues, and further with database registration symbols P98077, Protein SCK (HUMAN) and e-value: 2 × 10−44, 305 amino acid residues with a 39% match.
In addition, when a protein characteristic search was performed on the amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 4 by HMMPFAM, a sequence showing amino acid numbers 198 to 268 of SEQ ID NO: 13 showing the characteristics of a module structure necessary for binding to a signal transduction factor was found. (An amino acid sequence that is entered in Pfam as SH2).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 4 is a protein having a function relating to the interaction with the tyrosine phosphorylated protein and is involved in canceration.
[0032]
The amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 5 was obtained by BLAST search using database registration symbol P46681, Actin interacting protein 2 and e-value: 5 × 10-136, With 52% identity over 488 amino acid residues, and with database entry symbols AE005999, FAD-binding oxidoreductase and e-value: 1 × 10−64, With a 34% identity over 437 amino acid residues, and with database registration symbol P32891, D-lactate dehydrogenase (YEAST) and e-value: 2 × 10−38Hits with 27% identity over 433 amino acid residues.
From these results, it is presumed that the protein consisting of the amino acid sequence shown in SEQ ID NO: 14 is an enzyme.
When a protein characteristic search by HMMPAM is performed on the amino acid sequence encoded by the nucleotide sequence represented by SEQ ID NO: 5, a sequence exhibiting a characteristic of binding to FAD at amino acid numbers 82 to 275 of SEQ ID NO: 14 (entry as PAD_binding_4 in Pfam) Amino acid sequence).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 5 is an enzyme having a function of binding to FAD.
[0033]
The amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 6 was identified by BLAST search under the database registration symbol P42436, Assimilation nitrite reductase and e-value: 3 × 10−05, E-value: 0.009, 32% match over 78 amino acid residues, with 34% identity over 78 amino acid residues, and database entry symbol AE006738, toluene-4-monooxygenase system protein. .
From these results, it is presumed that the protein having the amino acid sequence shown in SEQ ID NO: 15 is an enzyme.
In addition, when a protein characteristic search by the HMMPFAM is performed on the amino acid sequence encoded by the base sequence represented by SEQ ID NO: 6, a sequence exhibiting the characteristic of binding to Fe at amino acid numbers 16 to 101 of SEQ ID NO: 15 (entry as Pries to Rieske) Amino acid sequence).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 6 is a Fe-mediated oxidoreductase.
[0034]
The amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 7 was obtained by BLAST search, using database registration code P42436, Assimilation nitrite reductase, and e-value: 2 × 10−05, AE006738, toluene-4-monooxygenase system protein and e-value: 8 × 10−05, 114 amino acid residues, a hit with a database registration symbol AP003000, nitrate reduce small subunit and e-value: 0.005, and a 30% match over 79 amino acid residues.
From these results, it is assumed that the protein having the amino acid sequence shown in SEQ ID NO: 16 is an enzyme.
In addition, when a protein characteristic search by the HMMPFAM is performed on the amino acid sequence encoded by the base sequence represented by SEQ ID NO: 7, a sequence exhibiting a characteristic of binding to Fe at amino acid numbers 16 to 134 of SEQ ID NO: 16 (entry as Rieske in Pfam) Amino acid sequence).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 7 is a reductase having a function of oxidative phosphorylation.
[0035]
The amino acid sequence encoded by the nucleotide sequence of SEQ ID NO: 8 was obtained by BLAST search under the database registration code P42436, Assimilation nitrite reductase and e-value: 1 × 10−05, With 35% identity over 81 amino acid residues and with database entry symbols AE006738, toluene-4-monooxygenase system protein and e-value: 1 × 10−04, 114 amino acid residues, a hit with a database registration symbol AP003000, nitrate reduce small subunit and e-value: 0.005, and a 30% match over 79 amino acid residues.
From these results, it is assumed that the protein having the amino acid sequence shown in SEQ ID NO: 17 is an enzyme.
In addition, when a protein characteristic search by the HMMPFAM is performed on the amino acid sequence encoded by the base sequence represented by SEQ ID NO: 8, a sequence exhibiting a characteristic of binding to Fe at amino acids 16 to 134 of SEQ ID NO: 17 (entry as Rieske in Pfam) Amino acid sequence).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 8 is a reductase having a function of oxidative phosphorylation.
[0036]
The amino acid sequence encoded by the nucleotide sequence of SEQ ID NO: 9 was determined by BLAST search to have the database registration symbol AF479747, PYRIN-containing APAF1-like protein 4 and e-value: 0.0, 42% over 868 amino acid residues. The degree of coincidence, and the database registration symbol AF482706, ribonuclease inhibitor 2 (RNH2) and e-value: 5 × 10-167, 780 amino acid residues, 41% identity, and the database registration symbol AF29847, nucleotide-binding site protein 1 and e-value: 2 × 10−97, 911 amino acid residues with a 29% match.
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 9 is a protein having a function related to protein-protein interaction.
[0037]
The DNA of the present invention may be obtained in a state in which a base sequence is deleted or inserted in the translated sequence. As a result of the homology search or the protein feature search as described above, the base sequence of the DNA is determined. If a deletion or insertion in the DNA is estimated, it is possible to obtain a full-length cDNA having no base deletion or insertion by using a method commonly used in the art such as library screening or PCR cloning. it can. The protein of the present invention is expressed using the full-length cDNA thus obtained, and can be used for functional analysis.
[0038]
The DNA of the present invention thus obtained, whose nucleotide sequence is determined, and whose function is presumed, includes only those having the nucleotide sequence shown in SEQ ID NOS: 1 to 9 or the nucleotide sequence shown above as its translation region. In these base sequences, one or several (the number is not particularly limited, but is, for example, 60 or less, preferably 30 or less, more preferably 20 or less, and still more preferably 10 The following, particularly preferably 5 or less.) DNA having a base sequence in which bases are deleted, substituted and / or added, and encoding a protein having an enzyme activity or a protein interaction activity; DNA encoding a protein that hybridizes with these under stringent conditions and has an enzymatic activity or a protein interaction activity It is also included. As described above, these DNAs comprise an amino acid sequence in which one or several amino acid sequences have been deleted, substituted and / or added in the amino acid sequence of the protein represented by SEQ ID NOS: 10 to 18, and have an enzymatic activity or protein interaction. Also includes those encoding a protein having an active activity.
Here, a DNA that hybridizes under stringent conditions has a homology of 80% or more, preferably 90% or more, and more preferably 95% or more with the base sequence described in SEQ ID NOS: 1 to 9 by BLAST analysis. DNAs containing a base sequence are exemplified. Further, the hybridization under stringent conditions means that the reaction is carried out in a normal hybridization buffer at a temperature of 40 to 70 ° C, preferably 60 to 65 ° C, and a salt concentration of 15 mM to 300 mM, preferably The washing can be performed according to a method of washing in a washing solution of 15 mM to 60 mM or the like.
[0039]
Further, the DNA of the present invention may be obtained by the above-described method or may be synthesized. The DNA base sequence can be easily replaced with a commercially available kit such as a site-directed mutagenesis kit (Takara Shuzo) or a quick change site-directed mutagenesis kit (Stratagene).
[0040]
The nucleotide sequences of SEQ ID NOS: 1 to 9 are derived from mouse. A human cDNA library was prepared according to the above-described method for preparing a cDNA library, and the library was subjected to SEQ ID NO: By performing hybridization using a DNA fragment having the nucleotide sequence of 1 to 9 as a probe, a DNA encoding a human homolog protein of the protein encoded by the nucleotide sequence of SEQ ID NOs: 1 to 9 (hereinafter referred to as " May be referred to as "human homolog DNA"). Such a DNA that hybridizes under stringent conditions to a DNA having the nucleotide sequence of SEQ ID NOS: 1 to 9 or a sequence complementary thereto includes such a human homologous DNA and a human orthologous DNA described below.
[0041]
Further, it is also possible to predict the base sequence of the human homolog DNA by using informatics, and to obtain the human homolog DNA from the above-mentioned human cDNA library or the like based on the base sequence.
In general, as a method for predicting a base sequence encoding a homolog protein of a target protein using informatics, for example, (i) using a base sequence of a target cDNA as a query, Database (including cDNA database predicted by informatics), a method of performing homology search using BLAST or the like, and (ii) using a base sequence of the target cDNA as a query, A method in which a homology search is performed using BLAST or the like, and the sequence of the hit EST is linked with reference to the base sequence of the target cDNA, and (iii) the base sequence of the target cDNA is used as a query, and Homology search using BLAST etc. against the genome database of Then, the position on the genome where the gene of the cDNA of interest is located is specified, and Genscan (http://genes.mit.edu/GENSCAN.html) or Sim4 (Genome Res., 8: 977-74 (1998)) and the like, and a method of predicting the nucleotide sequence of a gene portion in the genome.
[0042]
When predicting the nucleotide sequence of human homolog DNA of mouse-derived cDNA, any of the above methods can be used, but any of the cDNAs having the nucleotide sequences of SEQ ID NOs: 1 to 9 of the present invention is novel, In the above method (i), it is considered that the nucleotide sequence of the human homolog DNA cannot be obtained, so the method described in (ii) or (iii) is preferably used.
[0043]
Based on the predicted nucleotide sequence of the human homolog DNA, a human homolog DNA corresponding to the DNA having the nucleotide sequence of SEQ ID NOS: 1 to 9 can be obtained from the above human cDNA library. As a specific acquisition method, for example, using a primer having a nucleotide sequence complementary to the nucleotide sequence at the 5 ′ end and 3 ′ end of the predicted human homolog DNA, PCR is performed using the above human cDNA library as a template. And a method of performing hybridization with the above human cDNA library using a partial sequence of the predicted human homolog DNA as a probe.
[0044]
In general, a similar gene having a nucleotide sequence having a high homology to the nucleotide sequence of the target gene is referred to as a “homolog”, and the above-described method also aims to obtain a human homolog DNA. It is important to confirm not only that the sequences are similar but also that the gene obtained as a homolog is a family member of the target gene. Genes acquired as "homologs" between two species of organisms are likely to be "orthologs", the same gene evolved from a common ancestral gene, and differ from each other caused by duplication from a common ancestral gene It may be a "paralog" that is a gene.
[0045]
That is, in order for the human-derived DNA obtained as a homologue to have the same function as the protein of the present invention, the function of the protein encoded by the human-derived DNA must be In order to estimate and verify the same function of the protein of the present invention in mice, it is preferable to confirm that the human homolog is an ortholog of a closely related species of the mouse gene of the present invention.
[0046]
For example, the following method is used as a method for confirming the ortholog. (I) First, homology is analyzed between the nucleotide sequence of the cDNA of the present invention and the nucleotide sequence of the obtained human homolog DNA. Next, using the base sequence of the cDNA of the present invention as a query, a homology search was performed for human base sequences contained in international base sequence databases such as DDBJ, EMBL, and GenBank, and patent databases. Confirm that the degree of matching of the base sequence is higher than the degree of matching between the base sequence obtained from the database and the base sequence of the query. Further, (ii) homology is analyzed between the nucleotide sequence of the obtained human homolog DNA and the corresponding nucleotide sequence of the cDNA of the present invention. Next, using the base sequence of the obtained human homolog DNA as a query, a homology search was performed for the mouse base sequence contained in the international base sequence database such as DDBJ, EMBL, and GenBank, and in the patent database. Confirm that the degree of matching of the base sequence is higher than the degree of matching between the base sequence obtained from the database and the base sequence of the query. By confirming the above (i) and (ii), the obtained human homolog DNA can be identified as a human ortholog DNA corresponding to the cDNA of the present invention. The homology analysis described in (i) and (ii) above may be performed by comparing amino acid sequences, or by drawing a molecular evolutionary phylogenetic tree and examining it. In addition, it is preferable that the degree of coincidence by the homology analysis described in the above (i) and (ii) be analyzed as the degree of coincidence over the entire length of the query.
[0047]
By performing a homology search by BLAST or a protein feature search by HMMPFAM on the nucleotide sequence of the thus obtained human homologous DNA or orthologous DNA, the function of the protein encoded by the nucleotide sequence can be estimated.
Furthermore, the protein of the present invention is expressed using the obtained full-length cDNA of human homolog DNA or human ortholog DNA, and can be used for confirmation of activity, functional analysis, and the like.
[0048]
(2) Protein encoded by the novel cDNA
The translation region of the protein encoded by the DNA of the present invention is, for example, a base sequence of the DNA which is converted into amino acids by three types of reading frames, and the range encoding the longest polypeptide is defined as the translation region of the present invention. The amino acid sequence can be determined. Such amino acid sequences include, for example, those described in SEQ ID NOs: 10 to 18. Further, the protein of the present invention is not limited to the above amino acid sequence, but comprises an amino acid sequence in which one or several amino acids have been substituted, deleted, and / or added in the amino acid sequence, and has an enzymatic activity or Those having protein interaction activity are also included.
[0049]
As a method for obtaining the protein of the present invention, the method of transcription / translation of the DNA of the present invention described in the above (1) by an appropriate method is preferably used. Specifically, a recombinant vector inserted into a suitable expression vector or a suitable vector together with a suitable promoter is prepared, and this recombinant vector is used to transform a suitable host microorganism or introduced into a suitable cultured cell. Thus, it can be obtained by purifying this.
[0050]
When the protein thus obtained is obtained in a free form, it can be converted to a salt by a known method or a method analogous thereto, and conversely, when the protein is obtained in a salt form, it can be converted to a free form or another salt. can do. Such salts of the protein of the present invention are also included in the protein of the present invention. Further, a protein produced by the transformant may be modified before or after purification by applying an appropriate protein modifying enzyme to modify the protein arbitrarily or partially removing the polypeptide. Can be. These modified proteins are also included in the scope of the present invention as long as they have the above-mentioned enzyme activity or protein interaction activity.
[0051]
When producing the protein of the present invention, the vector used for the production of the recombinant vector containing the DNA of the present invention is not particularly limited as long as the DNA is expressed in the transformant. Any of vectors may be used. Of these, usually, a commercially available protein expression vector into which an expression control region DNA such as a promoter suitable for a host into which the DNA is introduced has already been inserted is used. Specific examples of such a protein expression vector include pET3 and pET11 (manufactured by Stratagene) and pGEX (manufactured by Amersham Pharmacia Biotech) when the host is Escherichia coli, and pESP- when the host is yeast. I expression vector (Stratagene) and the like. In the case of insect cells, BacPAK6 (Clontech) and the like are used. When the host is an animal cell, ZAP Express (manufactured by Stratagene), pSVK3 (manufactured by Amersham Pharmacia Biotech) and the like can be mentioned.
[0052]
When using a vector into which the expression control region has not been inserted, it is necessary to insert at least a promoter as the expression control region. Here, as the promoter, a promoter contained in a host microorganism or a cultured cell can be used. However, the promoter is not limited thereto. For example, when the host is Escherichia coli, T3, T7, tac, A lac promoter or the like can be used. In the case of yeast, an nmt1 promoter, a Gal1 promoter, or the like can be used. When the host is an animal cell, SV40 promoter, CMV promoter and the like are preferably used.
[0053]
When a host capable of functioning with a mammalian-derived promoter is used, a promoter specific to the gene of the present invention can also be used. Insertion of the DNA of the present invention into these vectors may be performed by linking the DNA or a DNA fragment containing the DNA to the amino acid sequence of the protein encoded by the gene DNA downstream of the promoter in the vector.
[0054]
The recombinant vector thus prepared can be used to transform a host described below by a method known per se to prepare a DNA transductant. As a method for introducing the vector into a host, specifically, a heat shock method (J. Mol. Biol., 53, 154 (1970)), a calcium phosphate method (Science, 221, 551, (1983)), DEAE Dextran method (Science, 215, 166, (1982)), in vitro packaging method (Proc. Natl. Acad. Sci. USA, 72, 581, (1975)), virus vector method (Cell, 37, 1053, (1984)). )), And the electric pulse method (Chu. Et al., Nuc. Acids Res., 15, 1331 (1987)).
[0055]
The host for preparing the DNA transfectant is not particularly limited as long as the DNA of the present invention is expressed in the body. For example, Escherichia coli, yeast, baculovirus (arthropod polyhedrosis virus) -insect cells, or Animal cells and the like can be mentioned. Specifically, BL21, XL-2Blue (manufactured by Stratagene) and the like for Escherichia coli, SP-Q01 (manufactured by Stratagene) and the like for yeast, and AcNPV (J. Biol. Chem., 263, 7406, (Baculovirus) for baculovirus) 1988)) and its host, Sf-9 cells (J. Biol. Chem., 263, 7406, (1988)). Examples of animal cells include mouse fibroblast C127 (J. Viol., 26, 291, (1978)) and Chinese hamster ovary cell CHO cells (Proc. Natl. Acad. Sci. USA, 77, 4216, (1980)). Among them, COS-7 cells derived from African green monkey kidney (ATCC CRL1651: American Type Culture Collection preserved cells), HEK293 cells derived from human fetal kidney (ATCC CRL1573) or human cervix are preferred from the viewpoint of expression level and simplicity of screening. HeLa cells (ATCC CCL-2) are used.
[0056]
In addition to the above-described expression method using a protein expression vector, a homologous recombination technique (AA Vertes et al., Biosci) in which a DNA fragment of the present invention linked to a promoter is directly inserted into a chromosome of a host microorganism. Biotechnol. Biochem., 57, 2036 (1993)) or a transposon or an insertion sequence (AA Vertes et al., Molecular Microbiol., 11, 739, (1994)). It can also be made.
[0057]
The obtained culture is obtained by collecting cells or cells by a method such as centrifugation, suspending the cells or the like in a suitable buffer, and sonicating, lysozyme, and / or freezing and thawing. After the disruption, a crude protein solution is obtained by centrifugation, filtration, or the like, and further purified by a combination of appropriate purification methods. Thus, the protein of the present invention is obtained. In addition to the above-described expression method using the protein expression recombinant vector, protein expression is induced by subjecting the DNA of the present invention obtained in (1) to a cell-free transcription / translation system to obtain the protein of the present invention. be able to. The cell-free transcription / translation system used in the present invention is a system containing all the elements necessary for transcription from DNA to mRNA and translation from mRNA to protein. Refers to any system in which the protein being synthesized is synthesized. Specific examples of the cell-free transcription / translation system include a transcription / translation system prepared based on an eukaryotic cell and a bacterial cell, or an extract from a part thereof. A transcription / translation system prepared based on an extract from Erythrocytes, wheat germ and Escherichia coli (Escherichia coli S30 extract) may be mentioned.
[0058]
Separation and purification of the protein of the present invention from the obtained transcription / translation product of the cell-free transcription / translation system can be carried out by a commonly used method known per se. Specifically, for example, a DNA region encoding an epitope peptide, a polyhistidine peptide, glutathione-S-transferase (GST), a maltose binding protein, or the like is introduced into the DNA to be transcribed and translated, and expressed as described above. The protein can be purified by utilizing the affinity of the protein with a substance having affinity.
[0059]
The expression of the target protein is separated by SDS-polyacrylamide gel electrophoresis or the like, and stained with Coomassie Brilliant Blue (manufactured by Sigma) or detected by an antibody that specifically binds to the protein of the present invention described later. It can be confirmed by the method of performing. In general, it is known that an expressed protein is cleaved (processed) by a proteolytic enzyme present in a living body. The protein of the present invention is, of course, included in the protein of the present invention as long as it has an enzymatic activity or a protein interaction activity, even if it is a partial fragment of the truncated amino acid sequence.
By analyzing the interaction between the thus obtained protein and other proteins and DNA, it is possible to know the multifaceted functions in the living body. As a method for analyzing the interaction, a conventional method known per se can be used. Specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon method, phage display method, ribosomal method Display method and the like can be mentioned.
[0060]
(3) Preparation of oligonucleotide and functional analysis using the oligonucleotide
Using the DNA of the present invention or a fragment thereof obtained by the method described in (1) above, an antisense oligonucleotide having a partial sequence of the DNA of the present invention, a sense -An oligonucleotide such as an oligonucleotide can be prepared.
[0061]
Examples of the oligonucleotide include a DNA having the same sequence as 5 to 100 consecutive bases in the base sequence of the DNA or a DNA having a sequence complementary to the DNA. Specific examples include DNA having the same sequence as 5 to 100 consecutive nucleotides in the base sequence represented by any of SEQ ID NOS: 1 to 9, or DNA having a sequence complementary to the DNA. When used as a sense primer and an antisense primer, the above-mentioned oligonucleotides in which the melting temperature (Tm) and the number of bases of both do not extremely change are preferable. The length of the sequence is generally 5 to 100 bases, preferably 10 to 60 bases, and more preferably 15 to 50 bases.
[0062]
In addition, derivatives of these oligonucleotides can also be used as the oligonucleotide of the present invention. Examples of the oligonucleotide derivative include an oligonucleotide derivative in which a phosphoric diester bond in an oligonucleotide is converted to a phosphorothioate bond, and an oligonucleotide in which a phosphoric diester bond in an oligonucleotide is converted to an N3′-P5 ′ phosphoramidate bond. Nucleotide derivative, oligonucleotide derivative in which ribose and phosphodiester bond in oligonucleotide are converted to peptide nucleic acid bond, oligonucleotide derivative in which uracil in oligonucleotide is substituted with C-5 propynyluracil, uracil in oligonucleotide is Oligonucleotide derivatives substituted with C-5 thiazole uracil, oligonucleotide derivatives substituted with cytosine in the oligonucleotide with C-5 propynylcytosine, oligonucleotides Is an oligonucleotide derivative in which cytosine is substituted by phenoxazine-modified cytosine, an oligonucleotide derivative in which ribose in the oligonucleotide is substituted by 2′-O-propyl ribose, or ribose in the oligonucleotide is 2 Oligonucleotide derivatives substituted with '-methoxyethoxyribose can be mentioned.
[0063]
In addition, the oligonucleotide of the present invention is prepared as a double-stranded RNA, introduced into a recipient, and inhibited by the RNA interference method for inhibiting the expression of a target gene (hereinafter referred to as the “RNAi method”). There is). As the RNA interference method, for example, a method described in (Elbashir, S., et al., Nature, 411, 494-498 (2001)) can be used. The double-stranded RNA does not necessarily have to be all RNA, and for example, those described in WO 02/10374 can be used.
[0064]
Here, the target gene may be any DNA as long as it is the DNA of the present invention. A double-stranded RNA consisting of a sequence substantially identical to at least a part of the base sequence of these DNAs (hereinafter sometimes referred to as “double-stranded polynucleotide”) is defined as a part of the base sequence of the target gene. And a sequence substantially the same as a sequence of 15 bp or more, which may be any part. Here, “substantially the same” means that it has 80% or more homology with the sequence of the target gene. The nucleotide length of the nucleotide may be any length from 15 bp to the entire length of the open reading frame (ORF) of the target gene, but a length of about 15 to 500 bp is preferably used. However, it is known that mammalian-derived cells have a signal transduction system activated in response to a long double-stranded RNA of 30 bp or more. This is called an interferon reaction (Mareus, PI, et al., Interferon, 5, 115-180 (1983)), and when the double-stranded RNA enters a cell, PKR (dsRNA-responsive) is obtained. Protein kinase: Non-specifically inhibits the initiation of translation of many genes via Bass, BL, Nature, 411, 428-429 (2001)), and at the same time, 2 ', 5' oligoadenylate synthetase (Bass, B.L., Nature, 411, 428-429 (2001)), activation of Rnase L occurs, and nonspecific degradation of intracellular RNA is induced. These non-specific reactions mask the specific response of the target gene. Therefore, when a mammal, or a cell or tissue derived from the animal is used as a recipient, a double-stranded polynucleotide of 15 to 30 bp, preferably 19 to 24 bp, more preferably 21 bp is used. The double-stranded polynucleotide does not need to be entirely double-stranded, and includes those in which the 5 'or 3' end is partially protruded, but those in which the 3 'end is partially protruded are preferably used. The double-stranded polynucleotide means a double-stranded polynucleotide having complementarity, but may be a self-annealed single-stranded polynucleotide having self-complementarity. The single-stranded polynucleotide having self-complementarity includes, for example, one having an inverted repeat sequence.
[0065]
The method for preparing the double-stranded polynucleotide is not particularly limited, but a known chemical synthesis method is preferably used. In chemical synthesis, a single-stranded polynucleotide having complementarity can be separately synthesized, and can be converted into a double-stranded strand by associating them by an appropriate method. Specific examples of the method of association include a method in which the synthesized single-stranded polynucleotide is mixed, heated to a temperature at which the double-strand is dissociated, and then gradually cooled. The associated double-stranded polynucleotide is confirmed using an agarose gel or the like, and the remaining single-stranded polynucleotide is removed by, for example, decomposing it with an appropriate enzyme.
[0066]
The transfectant into which the double-stranded polynucleotide thus prepared is introduced may be any as long as the target gene can be transcribed into RNA or translated into protein in the cell. Specific examples include those belonging to plant, animal, protozoan, virus, bacterial, or fungal species. The plant may be a monocotyledonous, dicotyledonous or gymnosperm, and the animal may be a vertebrate or invertebrate. Preferred microorganisms are those used in agriculture or industry, and those that are pathogenic for plants or animals. Fungi include organisms in both mold and yeast forms. Examples of vertebrates include mammals, including fish, cows, goats, pigs, sheep, hamsters, mice, rats, and humans, and invertebrates include nematodes and other reptiles, Drosophila melanogaster ( Drosophila), and other insects. Preferably, the cells are vertebrate cells.
[0067]
The transductant means a cell, tissue, or individual. Here, the cell may be from germline or somatic, totipotent, or pluripotent, split or undivided, parenchymal tissue or epithelium, immortalized or transformed, and the like. The cells may be gametes or embryos, in the case of embryos, single-cell or constitutive cells, or cells from multi-cell embryos, including fetal tissue. Furthermore, they may be undifferentiated cells, such as stem cells, or differentiated cells, such as from cells of an organ or tissue, including fetal tissue, or any other cells present in an organism. Differentiating cell types include adipocytes, fibroblasts, muscle cells, cardiomyocytes, endothelial cells, nerve cells, glial, blood cells, megakaryocytes, lymphocytes, macrophages, neutrophils, eosinophils, eosinophils, Includes basophils, mast cells, leukocytes, granulocytes, keratinocytes, chondrocytes, osteoblasts, osteoclasts, hepatocytes and cells of the endocrine or exocrine glands.
[0068]
As a method for introducing a double-stranded polynucleotide into a transfectant, when the transfectant is a cell or tissue, calcium phosphate method, electroporation method, lipofection method, virus infection, double-stranded polynucleotide solution Immersion, transformation, or the like. Examples of the method for introducing the gene into an embryo include microinjection, electroporation, and virus infection. When the recipient is a plant, a method of injecting or perfusing the plant into a body cavity or stromal cells, or spraying is used. In the case of an individual animal, it is introduced systemically by oral, topical, parenteral (including subcutaneous, intramuscular and intravenous administration), vaginal, rectal, nasal, ocular and intraperitoneal administration. A method, an electroporation method, a virus infection, or the like is used. For methods for oral introduction, the double-stranded polynucleotide can be mixed directly with the food of the organism. Furthermore, when introduced into an individual, it can be administered, for example, by administration as an implanted long-term release preparation or the like, or by ingesting an introduced body into which a double-stranded polynucleotide has been introduced.
[0069]
The amount of the double-stranded polynucleotide to be introduced can be appropriately selected depending on the introduced substance and the target gene, but it is preferable to introduce an amount sufficient to introduce at least one copy per cell. Specifically, for example, when the transfectant is a human cultured cell and the double-stranded polynucleotide is introduced by the calcium phosphate method, 0.1 to 1000 nM is preferable.
By suppressing the expression of the gene of the present invention in the transfectant by RNA interference, the function of the protein encoded by the gene of the present invention can be confirmed, or a new function can be analyzed.
[0070]
(4) Antibodies that specifically bind to the protein of the present invention
As a method for preparing an antibody that specifically binds to the protein of the present invention, a commonly used known method can be used. For a polypeptide used as an antigen, an epitope (antigen determination An appropriate sequence can be selected and used as the group. As a method for selecting an epitope, commercially available software such as Epitope Adviser (manufactured by Fujitsu Kyushu System Engineering Co., Ltd.) can be used.
[0071]
As the polypeptide used as the above antigen, a synthetic peptide synthesized according to a known method or the protein of the present invention itself can be used. The polypeptide serving as an antigen may be prepared in an appropriate solution or the like according to a known method and immunized to a mammal, for example, a rabbit, a mouse, a rat, or the like. It is preferable to use an antigen peptide as a conjugate with a suitable carrier protein or to add an adjuvant or the like for immunization.
[0072]
The route of administration of the antigen upon immunization is not particularly limited, and any route such as subcutaneous, intraperitoneal, intravenous, or intramuscular may be used. Specifically, for example, a method of inoculating BALB / c mice several times every several days to several weeks with an antigen polypeptide is used. The amount of the antigen to be taken is preferably about 0.3 to 0.5 mg / time when the antigen is a polypeptide, but is appropriately adjusted depending on the type of the polypeptide and the animal species to be immunized.
[0073]
After immunization, blood is appropriately collected as a test, and an increase in the antibody titer is confirmed by a method such as enzyme-linked immunosorbent assay (hereinafter sometimes referred to as “ELISA”) or Western blotting. Blood is collected from animals with increased titers. A polyclonal antibody can be obtained by subjecting this to an appropriate treatment used for antibody preparation. Specifically, for example, there is a method of obtaining a purified antibody obtained by purifying an antibody component from serum according to a known method. For purification of the antibody component, methods such as centrifugation, ion exchange chromatography, and affinity chromatography can be used.
[0074]
In addition, a monoclonal antibody can be prepared by using a hybridoma fused with spleen cells and myeloma cells of the animal according to a known method (Milstein, et al., Nature, 256, 495 (1975)). . The monoclonal antibody can be obtained, for example, by the following method.
[0075]
First, antibody-producing cells are obtained from an animal whose antibody titer has increased due to immunization with the above-described antigen. The antibody-producing cells are plasma cells and lymphocytes which are precursor cells thereof, which may be obtained from any of the individuals, but is preferably obtained from the spleen, lymph nodes, peripheral blood and the like. As a myeloma to be fused with these cells, generally, a cell line obtained from a mouse, for example, a P3X63-Ag8.653 (ATCC: CRL) which is an 8-azaguanine-resistant mouse (derived from BALB / c) myeloma cell line is used. -1580), P3-NS1 / 1Ag4.1 (RIKEN cell bank: RCB0095) and the like are preferably used. For cell fusion, antibody-producing cells and myeloma cells are mixed at an appropriate ratio, and 50% polyethylene is added to an appropriate cell fusion medium such as RPMI1640 or Iskov's modified Dulbecco's medium (IMDM) or Dulbecco's modified Eagle's medium (DMEM). It can be carried out by using a solution in which glycol (PEG) is dissolved. It can also be carried out by the electrofusion method (U. Zimmer-mann. Et al., Naturewissenschaften, 68, 577 (1981)).
[0076]
Hybridomas were prepared using a myeloma cell line that was resistant to 8-azaguanine, using 5% CO2 in a normal medium (HAT medium) containing an appropriate amount of hypoxanthine / aminopterin / thymidine (HAT) solution.2At 37 ° C. for an appropriate time. This selection method can be appropriately selected and used depending on the myeloma cell line to be used. The antibody titer of the antibody produced by the selected hybridoma is analyzed by the above-described method, the hybridoma producing the antibody having a high antibody titer is separated by a limiting dilution method or the like, and the separated fused cells are cultured in an appropriate medium. The monoclonal supernatant can be obtained by purifying the resulting culture supernatant by an appropriate method such as ammonium sulfate fractionation and affinity chromatography. For purification, a commercially available monoclonal antibody purification kit can also be used. Furthermore, ascites containing a large amount of the monoclonal antibody of the present invention can be obtained by growing the antibody-producing hybridoma obtained above in the abdominal cavity of an animal of the same strain as the immunized animal or a nude mouse.
[0077]
When a human-derived protein is obtained as the protein of the present invention, the above-described method is applied to a Severe combined immunodeficiency (SCID) mouse transplanted with human peripheral blood lymphocytes using the polypeptide or a partial peptide thereof as an antigen. A humanized antibody can also be prepared by immunization in the same manner as described above and preparing a hybridoma of the antibody-producing cells of the immunized animal and human myeloma cells (Mosier, DE, et al. Nature, 335, 256-259 (1988); Duchosal, MA, et al., Nature, 355, 258-262 (1992)).
[0078]
Further, RNA is extracted from the obtained hybridoma producing the human antibody, a gene encoding the target human antibody is cloned, this gene is inserted into an appropriate vector, and this is introduced into an appropriate host. By expression, human antibodies can be produced in larger quantities. Here, an antibody with low binding to an antigen can be obtained as an antibody with even higher binding by using an evolutionary engineering technique known per se. A partial fragment such as a monovalent antibody can be prepared by cleaving the Fab and Fc portions using, for example, papain or the like, and collecting the Fab portion using an affinity column or the like.
[0079]
The antibody that specifically binds to the protein of the present invention thus obtained can also be used as a neutralizing antibody that specifically binds to the protein of the present invention and thereby inhibits the enzyme activity or protein interaction activity of the protein. . There is no particular limitation on the method of selecting a substance that inhibits the activity of the protein. For example, it is possible to contact an antibody with the DNA transfectant prepared in (2) above and determine whether the function of the target protein in the transfectant is inhibited. And a method of analyzing the above.
[0080]
Such a neutralizing antibody may be used alone when the clinical application is performed, or may be used as a pharmaceutical composition by mixing with a pharmaceutically acceptable carrier. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight. Such drugs can be administered in various forms, such as tablets, capsules, granules, powders, orally administered by syrup or the like, or injections, drops, liposomes, Parenteral administration with suppositories and the like can be mentioned. In addition, the dose can be appropriately selected depending on symptoms, age, body weight, and the like.
[0081]
(5) Confirmation of activity and analysis of function of the protein of the present invention
The protein of the present invention is prepared as a recombinant protein as described in the above (2), and by analyzing this, it can be confirmed that it has the activity estimated in the above (1). Furthermore, analysis can also be performed by combining the antibody and the like prepared as described in (4) above.
[0082]
The fact that the protein of the present invention has enzymatic activity can be analyzed by a commonly used activity measurement method known per se. For example, in the case of an oxidoreductase, since there are many proton acceptors and donors using NADH, the amount of NADH may be measured. Specifically, NADH has an absorption at 340 nm and NAD+, The amount of NADH generated or reduced by the oxidation-reduction reaction can be measured using the change in absorbance at 340 nm as an index.
[0083]
Further, the fact that the protein of the present invention has a protein interaction can be analyzed by a commonly used activity measurement method known per se.
Specifically, the protein-protein binding activity may be measured. The protein-protein binding activity can be confirmed by, for example, in vitro translation and protein-protein binding assay as follows (Journal of Biological Chemistry 275, 7894-7901 (2000)).
The protein whose binding activity is to be measured is A, and its partner is B. Plasmid pGEM-A containing the full-length cDNA of A and B, and plasmid pGST-B (Trends Biochem. Sci. 21, 208-214 (1996)) were obtained by using Promega's TNT SP6 polymerase-coupled erythrolysis system. Used for in vitro transcription and translation. then,[35S] methionine (Amersham) A radioactive substance can be labeled by adding 40 μCi to a total volume of 50 μl.
The translation product is subjected to in vitro protein-protein binding. For in vitro binding, for example, 50 μl of [35[S] methionine-labeled protein A is incubated with a glutathione resin containing 4-5 μg of GST-B fusion protein GST-B.
The reaction was performed slowly at 4 ° C. for 4 hours using binding buffer (150 mM NaCl, 0.1% Nonidet P-40, 50 mM Hepes (pH 7.5)), 1 mM PMSF, and a protease inhibitor. This can be done by shaking.
The protein-protein complex formed on the resin surface is ultracentrifuged at 14,000 rpm for 1 minute at 4 ° C., and the resin is washed five times with 1 ml of cold binding buffer at 4 ° C. The protein A bound to the GST fusion protein B bound to the resin is separated on an SDS-12% polyacrylamide gel, and after drying the gel, autoradiography is performed to examine the binding activity between the proteins A and B. Can be.
[0084]
The activity of the enzyme of the present invention or the protein having the protein interaction activity can be confirmed as described above, but is not limited to these methods. In addition, these activity measuring systems can also be used for screening for a function activator (such as an agonist) or a function inhibitor (such as an antagonist) of the protein of the present invention and a screening for a protein expression regulator of the present invention, which will be described later. .
[0085]
In general, the method for analyzing the function of the protein of the present invention includes, for example, (i) a method for comparing and analyzing the expression state in each tissue, disease or developmental stage, and (ii) a method for analyzing the interaction with other proteins and DNA. (Iii) a method of analyzing phenotypic changes by introducing into appropriate cells or individuals, and (iv) analyzing phenotypic changes by inhibiting the expression of the protein in appropriate cells or individuals. And the like. Moreover, according to such a method, the activity specific to the target protein can be analyzed from many aspects.
[0086]
In the method (i), the expression of the protein of the present invention can be analyzed at the mRNA level or the protein level. When the expression level is analyzed at the mRNA level, for example, an in situ hybridization method (In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harry, N. ed. 1990)), a hybridization method using a DNA chip, a quantitative PCR method, and the like. When the analysis is performed at the protein level, a tissue staining method using an antibody that specifically binds to the protein of the present invention described later, an ELISA method, a Western blot method, and the like can be mentioned. Here, when a known variant is present in the protein to be analyzed, it is preferable to use a probe that is present only in the cDNA encoding the protein to be analyzed and does not hybridize with the cDNA encoding the known variant. In the case of the quantitative PCR method, a method of selecting primers capable of producing amplified fragments having different lengths between the target cDNA and the known variant (Wong, Y., Neuroscience Let., 320: 141-145 (2002)) and the like Is mentioned. Also, when analyzing at the protein level, it is preferable to use an antibody that reacts only with the target protein and does not react with a known variant.
[0087]
In the method (ii), the function of the protein of the present invention can be analyzed by examining the presence or absence of interaction between the protein of the present invention and a known protein. As a method for analyzing the interaction, a conventional method known per se can be used, and specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon method, phage display method, ribosomal display And the like. Also in this method, when a known variant exists in the protein to be analyzed, it is preferable to analyze the interacting substance of the known variant in the same manner to identify a substance that specifically interacts with the target protein.
[0088]
In the method (iii), the cells into which the cDNA of the present invention is introduced are not particularly limited, but human cultured cells and the like are particularly preferably used. Methods for introducing DNA into cells include those described in (2) above. In addition, the phenotype of the introduced cells can be observed with a microscope, such as cell viability, cell growth rate, cell differentiation, neurite outgrowth when cells are neurons, localization and migration of intracellular proteins, etc. And those that can be analyzed by biochemical experiments, such as changes in the expression of specific proteins in cells. When a known variant of the target protein is present, these phenotypes are similarly introduced into cells, and the phenotype associated with the target protein can be identified by comparative analysis. Further, since it is known that the protein of the present invention has enzyme activity or protein interaction activity, attention should be paid to phenotypes and the like found in diseases associated with these enzymes or proteins having protein interaction activity. It is also preferable to perform analysis.
[0089]
The method (iv) can be efficiently performed by the method using the oligonucleotide described in the above (3) or the RNA interference method. In this method, when a known variant is present in the target protein to be analyzed, a similar analysis is performed for the known variant and other variants, and a target protein-specific function is identified by comparative analysis. be able to.
[0090]
(6) Screening for a substance that regulates the activity of the protein of the present invention
By screening for a substance that specifically binds to the protein of the present invention and has an action of inhibiting, antagonizing, or enhancing the function (activity) of the protein of the present invention, a function modulator of the protein of the present invention (hereinafter, referred to as (Sometimes referred to as "modulators").
[0091]
This method of screening for a regulatory substance may be any method as long as it can obtain a substance that specifically binds to the protein of the present invention and has an activity of inhibiting, antagonizing or enhancing the activity of the protein. For example, first, the protein of the present invention is brought into contact with a test substance, and selection is performed using the binding property of the protein as an index, and then the function of the protein of the present invention, that is, a change in enzyme activity or protein interaction activity is used as an index. A method for selecting a test substance can be used.
[0092]
The test substance may be any substance as long as it interacts with the protein of the present invention and may affect the activity of the protein. , Proteins, non-peptidic compounds, low molecular weight compounds, synthetic compounds, fermentation products, cell extracts, animal tissue extracts and the like. These substances may be novel substances or known substances. As a method for analyzing the interaction between the test substance and the protein of the present invention, a conventional method known per se can be used. Specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon Method, a phage display method, a ribosomal display method, or a competition analysis method with the antibody described in the above (4). A substance found to bind to the protein of the present invention by such a method is then analyzed by analyzing how the activity of the protein of the present invention is affected in the presence of the substance. Whether it is used as a modulator is identified.
[0093]
The analysis of the change in the enzyme activity or the protein interaction activity can be performed by a commonly used method known per se, based on the properties of proteins having various enzyme or protein interaction activities.
[0094]
When analyzing a substance that regulates the enzymatic activity of an enzyme, it can be carried out by a commonly used method known per se, based on the properties of the protein of the present invention. Specifically, it can be performed using the method described in (5) above.
As described above, the protein of the present invention has an important function as an enzyme involved in various physiological functions, and the abnormality of the protein in a living body causes various diseases. Therefore, the modulator of enzyme activity obtained by the above screening method can be used as a therapeutic agent for various diseases, for example, anticancer agents (antitumor agents), antiinflammatory agents, neurodegenerative diseases, cardiovascular diseases such as hypertension, metabolic It can be used as a therapeutic agent for diseases, immune diseases, blood coagulation diseases and the like.
[0095]
In addition, when a substance that regulates protein interaction activity is analyzed, the analysis can be performed by a method known per se and generally used, based on the properties of the protein of the present invention. Specifically, it can be performed using the method described in (5) above.
As described above, the protein of the present invention has an important function as a protein having a protein interaction activity involved in various physiological functions, and the abnormality of the protein in vivo causes various diseases. Therefore, the modulator of protein interaction activity obtained by the above screening method can be used as a therapeutic agent for various diseases, for example, cancer, inflammatory disease, immune disease, cardiovascular disease such as arteriosclerosis, psychiatric / neurological disease. , Metabolic diseases, respiratory diseases such as bronchial asthma and the like.
[0096]
Here, for the purpose of screening a pharmaceutically active ingredient, it is preferable to use the above-mentioned human homolog DNA or human homolog protein for the DNA of the present invention or the recombinant protein to be used. Furthermore, the substances screened by the above method may be selected as drug candidates by screening in vivo.
[0097]
Such a modulator of enzyme activity or protein interaction activity may be used alone when the clinical application is applied, but it may be used as a pharmaceutical composition in combination with a pharmaceutically acceptable carrier. Can also. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight. Such drugs can be administered in various forms, such as tablets, capsules, granules, powders, orally administered by syrup or the like, or injections, drops, liposomes, Parenteral administration with suppositories and the like can be mentioned. In addition, the dose can be appropriately selected depending on symptoms, age, body weight, and the like.
[0098]
(7) Screening of the DNA expression regulator of the present invention
Examples of the screening method include a method of analyzing the expression level of the protein of the present invention or the mRNA encoding the same in the presence of a test substance. Specifically, for example, cells expressing the protein of the present invention described in (2) above are cultured in an appropriate medium containing a test substance, and the amount of the protein of the present invention expressed in the cells is determined by ELISA. And the like, or by analyzing the amount of mRNA encoding the protein of the present invention in the cells by quantitative reverse transcription PCR, Northern blotting, or the like.
[0099]
As the test substance, those described in the above (6) can be used. According to this analysis, if the amount of the protein or mRNA expressed in the cells cultured in the absence of the test substance increases as compared with the amount of the test substance, the substance functions as a substance for promoting the expression of the DNA of the present invention. If it is possible and, on the contrary, decreases, it can be determined that the substance can be used as a substance inhibiting the expression of the DNA of the present invention.
[0100]
The above-mentioned active ingredient can be used alone for clinical application, but can also be used as a pharmaceutical composition by blending it with a pharmaceutically acceptable carrier. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight. Such drugs can be administered in various forms, such as tablets, capsules, granules, powders, orally administered by syrup or the like, or injections, drops, liposomes, Parenteral administration with suppositories and the like can be mentioned. In addition, the dose can be appropriately selected depending on symptoms, age, body weight, and the like.
[0101]
(8) The DNA-introduced animal of the present invention
The transfected DNA containing the DNA of the present invention described in the above (1) is constructed, introduced into a fertilized egg of a mammal other than a human, and this is transplanted into a female individual uterus to generate the DNA. A non-human mammal into which DNA has been introduced can be produced. More specifically, for example, after superovulation of a female individual by hormone administration, it is mated with a male, a fertilized egg is extracted from an oviduct on the first day after mating, and the introduced DNA is microinjected into the fertilized egg. And so on. Thereafter, after culturing by an appropriate method, the surviving fertilized eggs are transplanted into the uterus of a pseudopregnant female individual (foster parent) to give birth. Whether or not the target DNA has been introduced into the newborn can be identified by performing Southern blot analysis on DNA extracted from cells of the individual. Examples of mammals other than humans include mice, rats, guinea pigs, hamsters, rabbits, goats, pigs, dogs, cats, and the like.
[0102]
The thus-obtained DNA-introduced animal of the present invention obtains its offspring by crossing this individual and subculturing it in a normal breeding environment while confirming that the introduced DNA is stably retained. be able to. In addition, the offspring can be obtained by repeating in vitro fertilization, and the strain can be maintained.
The non-human mammal into which the DNA of the present invention has been introduced can be used as an analysis of the function of the DNA of the present invention in a living body, or as a screening system for a substance regulating the function.
[0103]
(9) Other uses of the protein of the present invention and DNA containing a nucleotide sequence encoding the same
The protein of the present invention can be used as a carrier having it bound on a substrate. In addition, a nucleotide sequence encoding the protein of the present invention, for example, a DNA having the nucleotide sequence of any one of SEQ ID NOs: 1 to 9 and a partial fragment thereof can be used as a carrier on which they are bound. These may be hereinafter referred to as “protein chips”, “DNA chips” or “DNA arrays” (DNA microarrays and DNA macroarrays). These protein chips or DNA chips or arrays may contain other proteins and DNAs in addition to the proteins and DNAs of the present invention.
[0104]
Here, a resin substrate such as a nylon film or a polypropylene film, a nitrocellulose film, a glass plate, a silicon plate, or the like is used as a substrate for binding proteins and DNA. When using a fluorescent substance or the like, a glass plate or a silicon plate containing no fluorescent substance is preferably used. The binding of the protein or DNA to the base can be easily carried out by a commonly used method known per se. These protein chips, DNA chips, or DNA arrays are also included in the scope of the present invention.
[0105]
In addition, the amino acid sequence of the protein of the present invention and the nucleotide sequence of DNA can also be used as sequence information. The base sequence of this DNA includes the base sequence of the corresponding RNA. That is, a database of amino acid sequences and nucleotide sequences can be constructed by storing the obtained amino acid sequences and nucleotide sequences in an appropriate recording medium in a computer-readable predetermined format. This database may contain the base sequences of other types of proteins and DNAs encoding them. Further, in the present invention, the database also means a computer system that writes the above-mentioned sequence on an appropriate recording medium and performs a search according to a predetermined program. Suitable recording media include, for example, magnetic media such as flexible disks, hard disks, and magnetic tapes; optical disks such as CD-ROM, MO, CD-R, CD-RW, DVD-R, and DVD-RAM; and semiconductor memories. And the like.
[0106]
【Example】
Hereinafter, the present invention will be described in detail with reference to examples, but the scope of the present invention is not limited to these examples.
Example 1  Preparation of cDNA library
(1) Preparation of mRNA
mRNA-prepared mouse (C57BL / 6) 0.5 to 1 g of each organ or tissue is homogenized with 10 ml of a suspension, and 1 ml of 2 M sodium acetate at pH 4.0 and the same amount of phenol / chloroform (5: 1 by volume). The mixture was added and extracted. When the same amount of isopropanol was added to the aqueous layer after the extraction, RNA separated and precipitated from the aqueous phase. After incubating the sample on ice for 1 hour, the precipitate was collected in a refrigerated centrifuge at 4,000 rpm for 15 minutes. The specimen was washed with 70% ethanol, dissolved in 8 ml of water, and precipitated by adding 16 ml of a pH 7.0 aqueous solution containing 2 ml of 5M NaCl, 1% CTAB (cetyltrimethy-lammonium bromide), 4M urea and 50 mM Tris. To remove the polysaccharide (CTAB precipitation).
[0107]
Subsequently, the RNA was dissolved in 4 ml of 7M guanidine-Cl at 4,000 rpm for 15 minutes at room temperature. After adding twice the volume of ethanol, the mixture was incubated on ice for 1 hour, centrifuged at 4,000 rpm for 15 minutes, and the resulting precipitate was washed with 70% ethanol to collect RNA, which was dissolved again in water. RNA purity was measured by reading the OD ratios 260/280 (> 1.8) and 230/260 (<0.45).
[0108]
(2) Preparation of first strand cDNA
Using 15 μg of the mRNA prepared in (1) above, 5-methyl-dCTP, dATP, dTTP, and dGTP were converted to 0.54 mM and 0.6 M trehalose in a final volume of 165 μl using reverse transcriptase 3,000 units. The reverse transcription reaction was performed under the following conditions: 50 mM Tris-HCl (pH 8.3), 75 mM KCl, 3 mM MgCl 2, 10 mM DTT, 52 ng / μl BSA, and RNase inhibitor 5 units. 12.6 μl of an oligonucleotide (SEQ ID NO: 19) containing a recognition sequence of the restriction enzyme XhoI (wherein V represents A, G or C and N represents A, G, C or T) was used as a primer.
[0109]
At the start of the reaction, 1/4 of the reaction solution is collected and 1.5 μl of [α-32By adding P] -dGTP (3000 Ci / mmol, 10 μCi / μl; manufactured by Amersham), the synthesis efficiency of the first strand cDNA was measured. 0.5 μl of the RI-labeled reaction solution was spotted on DE-81 paper, and the RI activity before and after washing three times with 0.5 M sodium phosphate buffer (pH 7.0) was measured and calculated. Thereafter, the RI-labeled reaction solution and the non-labeled reaction solution were mixed, 8 μl of 0.5 M EDTA, 2 μl of 10% SDS and 20 μg of proteinase K were added, and the mixture was heated at 45 ° C. for 15 minutes. After extraction with phenol / chloroform and ethanol precipitation, the precipitate was dissolved in 47 μl of RNase-free water (hereinafter referred to as RNase-free water).
[0110]
(3) 5 'cap structure and addition of biotin to 3' end
Biotinylated RNA Diol In order to bind biotin to the diol site (present at both the 5 'end of the Cap structure and the ribose at the 3' end of the poly A chain), a two-step reaction was performed. They are the oxidation of a diol group followed by the coupling reaction of biotin hydrazide with an oxidized RNA. First, 15 μg of the RNA-first strand cDNA complex obtained by the reverse transcription reaction was placed in a 50 μl reaction mixture using a 6.6 mM sodium acetate buffer (pH 4.5) and sodium periodate as an oxidizing agent. Processed. This oxidation reaction was performed on ice under light-shielding conditions for 45 minutes.
[0111]
Subsequently, 11 μl of 5 M sodium chloride, 0.5 μl of 10% SDS, and the same amount of isopropanol were added, left on ice for 60 minutes, and centrifuged at 4 ° C. for 15 minutes at 15,000 rpm to obtain a precipitate. The precipitate was washed with 70% ethanol and redissolved in 50 μl of RNase-free water. 5 μl of 1 M sodium acetate (pH 6.1), 5 μl of 10% SDS, and 150 μl of 10 mM biotin hydrazide (manufactured by Sigma) were added to the sample, and reacted overnight at room temperature (22 to 26 ° C.). Finally, 5 μl of 5 M NaCl, 75 μl of 1 M sodium acetate (pH 6.1) and 2.5 volumes of ethanol were added, and the mixture was cooled on ice for 1 hour, centrifuged at 4 ° C. for 15 minutes, and biotinylated. After the reaction, the reaction solution was centrifuged for 15 minutes to precipitate the RNA-DNA complex again. The precipitate was washed once with 70% ethanol and once with 80% ethanol, and dissolved in 70 μl of RNase-free water.
[0112]
(4) Selection of full-length cDNA by RNase I
By treating the biotinylated RNA-DNA complex obtained in the above (3) with RNase I that digests single-stranded RNA, mRNA whose mRNA was not completely elongated during the reverse transcription reaction, and mRNA of mRNA The biotin residue labeled at the 3 'end was removed. Specifically, 10 μl of 10 × RNase I buffer (100 mM Tris-HCl (pH 7.5), 50 mM EDTA, 2 M NaOAc) was added to 70 μl of the sample obtained in (3), and RNase I (RNase One).TM200 units (Promega), and the single-stranded RNA was digested at 37 ° C. for 15 minutes.
[0113]
(5) Collection of full-length cDNA
In order to prevent non-specific adsorption of cDNA to magnetic beads coated with streptavidin, 5 μg (500 μl) of 100 μg of yeast tRNA (treated with DNase I) was used as magnetic beads (MPG) particles coated with streptomyvit. (CPG, NJ)) and left on ice for 1 hour, followed by washing with a solution of 50 mM EDTA and 2 M NaCl.
These beads were suspended in 500 μl of a solution of 50 mM EDTA and 2 M NaCl, and the RNase I-treated cDNA obtained in (4) was added. By stirring for 30 minutes at room temperature, the magnetic beads and the full-length cDNA were bound. The beads capturing the full-length cDNA were subjected to 50 mM EDTA, 2 M NaCl solution four times, 0.4% SDS, 50 μg / μl yeast tRNA once, 10 mM NaCl, 0.2 mM EDTA, 10 mM Tris-HCl (pH 7.5), Once with 20% glycerol, once with 50 μg / μl aqueous yeast tRNA, RNase H buffer (20 mM Tris-HCl (pH 7.5), 10 mM MgCl 22After washing once with 20 mM KCl, 0.1 mM EDTA, and 0.1 mM dithiothreitol (DTT), the cells were suspended in RNase H buffer (100 μl), RNase H (3 units) was added, and the mixture was heated at 37 ° C. for 30 minutes. Thereafter, 1 μl of 10% SDS and 2 μl of 0.5 M EDTA were added, the mixture was exposed to 65 ° C. for 10 minutes, and the supernatant was collected.
The thus recovered single-stranded full-length cDNA was extracted with phenol / chloroform, and the volume of the solution was reduced to 100 μl or less using a speed bag, and then subjected to G25 / G100 Sephadex chromatography. The fraction having RI activity was collected in a silicon-treated microtube, and 2 μg of glycogen was added. The precipitate obtained by ethanol precipitation was dissolved in 30 μl of ultrapure water.
[0114]
(6) Addition of oligo dG to single-stranded cDNA
30 μl of the single-stranded cDNA recovered in the above (5) was mixed with 200 mM sodium cacodylate (pH 6.9), 1 mM MgCl 2 in a final volume of 50 μl of the reaction solution.2, 1 mM CoCl2Under the conditions of 1 mM 2-mercaptoethanol and 100 μM dGTP, oligo dG addition reaction was carried out at 37 ° C. for 30 minutes using 32 units of terminal deoxynucleotidyl transferase (TaKaRa). At the end of the reaction, EDTA was added to 50 mM and dissolved in 31 μl of ultrapure water through a series of extractions with phenol / chloroform and ethanol precipitation.
[0115]
(7) Second strand cDNA synthesis
The synthesis of the second-strand cDNA using the first-strand cDNA as a template was performed as follows. In a reaction system having a final volume of 60 μl, a second strand low buffer (200 mM Tris-HCl (pH 8.75), 100 mM KCl, 100 mM (NH4)2SO4, 20 mM MgSO43% of 1% Triton X-100, 1 mg / μl BSA, second strand high buffer (200 mM Tris-HCl (pH 9.2), 600 mM KCl, 20 mM MgCl2) 3 μl, 0.25 mM each of dCTP, dATP, dTTP, and dGTP, 6 μl of β-NADH, 31 μl of first-strand cDNA to which oligo dG was added, 600 ng of second-strand primer-adapter (SEQ ID NO: 20), and Ex Taq DNA polymerase ( Second-strand cDNA was synthesized using 15 units of TaKaRa Ex Taq (TaKaRa), 150 units of thermostable DNA ligase (Ampligase; Epicentre), and 3 units of heat-resistant RNase H (Hybridase; Epicentre).
[0116]
The reaction was stopped by adding 1 μl of 0.5 M EDTA and further heating at 45 ° C. for 15 minutes in the presence of 1 μl of 10% SDS and 10 μg of proteinase K to dissolve the protein component. A double-stranded full-length cDNA purified by extraction with ethanol / chloroform and ethanol precipitation was obtained.
[0117]
(8) Preparation of library
The double-stranded full-length cDNA obtained by the above method was inserted into a λZAPIII vector and recovered as a library. The λZAPIII vector is a λZAPII (manufactured by STRATAGENE) vector obtained by modifying a part of the sequence (SEQ ID NO: 21) of the multiple cloning site into SEQ ID NO: 22 and newly introducing two SfiI sites.
[0118]
Further, a λPS (RIKEN) vector was prepared, and cDNA was inserted. λPS (RIKEN) (named λ-FLC-1 (FLC means FULL-LENGTH cDNA)) is a λPS vector of MoBiTec (Germany) modified for cDNA. That is, BamHI and SalI convenient for cDNA insertion are respectively introduced into cloning sites existing on both sides of a 10 kbp stuffer, and a 6 kb DNA fragment is inserted into an XbaI site so that a cDNA of about 0.5 kb to about 13 kb can be cloned. (JP-A-2000-325080). Using this λ-FLC-1, for example, in the case of a lung cDNA library, the average chain length of the insert was 2.57 kb, and it was possible to actually clone an insert of 0.5 kb to 12 kb. In the case of the conventional method λZAP, the average chain length of the insert was 0.97 kb, indicating that the use of λ-FLC-1 enables the cloning of a large-sized cDNA more efficiently than λZAP.
[0119]
Example 2  Normalization / subtraction of full-length cDNA library
(1) Preparation of driver
The mRNA prepared in Example 1 (1) (hereinafter sometimes referred to as “(a) RNA driver”) and the RNA prepared by in vitro transcription reaction were used as drivers. The latter RNA is further divided into two types (hereinafter referred to as “(b) RNA driver” and “(c) RNA driver”). One is obtained by recovering cDNA from RNA-cDNA removed by normalization and cloning into a phage vector. After infection with Escherichia coli, 1000 to 2000 plaques per starting material are mixed to form one library (mini-library), which is converted into plasmid DNA by a conventional method (the phage is infected again with Escherichia coli together with helper phage to form a phagemid). , And another infection to obtain plasmid DNA).
[0120]
The obtained DNA was subjected to an in vitro transcription reaction (using T3 RNA polymerase or T7 RNA polymerase), treated with DNase I (RQ1-RNase free; manufactured by Promega) and ProteinaseK, and then extracted with phenol / chloroform to obtain RNA (b) RNA. Got a driver. At this time, as a starting material, a mini-library is prepared from each of nine types of tissues (pancreas, liver, lung, kidney, brain, spleen, testes, small intestine, stomach), and the nine types of mini-libraries are mixed. To obtain RNA. As another RNA, a library (about 20,000 clones) already stored as a non-overlapping clone is cultured, and the obtained DNA is subjected to in vitro transcription reaction in the same manner as (b) RNA driver (c). ) RNA driver.
[0121]
These three kinds of RNAs were labeled with biotin using Label-IT Biotin Labeling Kit (manufactured by Mirus Corporation), added to tester cDNA at a ratio of 1: 1: 1, and reacted with Rot10 (42 ° C.). The second strand was synthesized with respect to the supernatant collected after the treatment with streptavidin beads (CPG).
[0122]
Example3Nucleotide sequencing of full-length cDNA clones
(1) clone rearray
One representative clone was selected from each cluster. Representative clones were selected with Q-bot (GENETIX LIMITED) and arrayed on a 384-well plate. At that time, E. coli was cultured in 50 μl of LB medium at 30 ° C. for 18 to 24 hours. At this time, when the cDNA library was introduced into the PS vector and transformed Escherichia coli DH10B, 100 mg / ml ampicillin and 50 mg / ml kanamycin were added, introduced into the Zap vector, and introduced into the SOLR system. If so, 100 mg / ml ampicillin and 25 mg / ml streptavidin were added.
[0123]
(2) Extraction of plasmid and InsSizing
Each of the clones cultured in the above (1) is further cultured in 1.3 ml of an HT solution containing 100 mg / ml of ampicillin, and the cells are collected by centrifugation. Then, QIAprep 96 Turbo (manufactured by QIAGEN) is used. To recover and purify the plasmid DNA. In order to examine the chain length of the cDNA inserted in the obtained plasmid, 1/30 of the plasmid DNA obtained above was digested with the restriction enzyme PyuII and subjected to 1% agarose gel electrophoresis.
[0124]
(3) Sequencing
Three types of sequencers were used to analyze the full-length nucleotide sequence of the full-length cDNA inserted into the thus obtained plasmid. In addition, plasmids were divided into two categories: those having insertion sequences shorter than 2.5 kb and those having longer insertion sequences. Among these, the nucleotide sequence of the clone having an insertion sequence shorter than 2.5 kb was analyzed from both ends. At this time, the plasmid was prepared using the primers described in SEQ ID NOS: 23 (sense strand) and 24 (antisense strand) when the vector was PS, and SEQ ID NO: 25 (sense strand) when the vector was Zap. , And 26 (antisense strand), and reacted with a Thermosequenase Primer Cycle Sequencing Kit (manufactured by Amersham Pharmacia Biotech), and analyzed using a Licor DNA4200 (long read sequencer).
[0125]
Gaps that could not be analyzed by the above nucleotide sequence analysis were determined by the primer walking method. At this time, ABI Prism 377 and / or ABI Prism 3700 (manufactured by Applied Biosystems Inc.), BigDye terminator kit and Cycle Sequencing FS Ready Reaction Kit (Applied Systems, Inc.) were used.
[0126]
In addition, the sequence of a clone in which the inserted cDNA was longer than 2.5 kb was determined by the shotgun method. At that time, Shimadzu RISA 384 and DYEnamic ET terminator cycle sequencing kit (manufactured by Amersham Pharmacia Biotech) were used. To generate a shotgun library, 48 DNA fragments grown by PCR from 48 independent representative clones were used. The ends of the amplified DNA fragment were blunt-ended with T4 DNA polymerase.
This DNA fragment was inserted into a pUC18 vector, and Escherichia coli DH10B was transformed with the recombinant vector. A plasmid was prepared from this E. coli in the same manner as in the above (2).
[0127]
About those representative clones, the base sequence was determined by base sequence analysis from both ends, and the base sequences were ligated on a computer, and then subjected to sharing using Double Stroke Sharing Device (manufactured by Fire Inc.). Nucleotide sequence determination by the shotgun method was performed with duplication of 12 to 15 clones. The gaps whose sequence could not be determined by this nucleotide sequence determination were determined by primer walking in the same manner as described above.
[0128]
Example 4  Analysis of nucleotide sequence of each full-length cDNA clone
For the entire base sequence of the full-length cDNA clone determined in Example 3, homology search by BLAST and protein characteristic search by HMMPFAM were performed to estimate the function of the protein encoded by each full-length cDNA clone.
[0129]
(1) dnaform 34219 (SEQ ID NOs: 1 and 10)
As shown in SEQ ID NO: 1, dnaform 34219 was composed of 2,617 bases, of which base numbers 146 to 1624 were open reading frames (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 492 amino acid residues (SEQ ID NO: 10). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 1 using BLAST, and the result was that (i) a database registration symbol was found in the SPTR protein database (integrated SWISS-PROT protein sequence database and TrEMBL nucleic acid translation database). AK074067 is e-value: 5 × 10-148And 84% identity over 310 amino acid residues, and (ii) the database registration code BC007206 has an e-value of 5 × 10−49And (iii) the database registration code AL390078 was changed to e-value: 5 × 10−44, With a 37% match over 286 amino acid residues. The hits in (ii) and (iii) were proteins similar to SH2 domain-containing transforming protein.
The amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 1 was subjected to a protein characteristic search using HMMPFAM. As a result, amino acid numbers 393 to 469 in SEQ ID NO: 10 show characteristics of a module structure required for binding to a signal transduction factor. A sequence (an amino acid sequence entered as SH2 in Pfam) was found.
From these facts, it was presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 1 was a protein having a function related to the interaction with the tyrosine phosphorylated protein.
[0130]
(2) dnaform 51548 (SEQ ID NOs: 2, 11)
As shown in SEQ ID NO: 2, dnaform 51548 was composed of 4755 bases, of which base numbers 159 to 2249 were open reading frames (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 696 amino acid residues (SEQ ID NO: 11). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 2 using BLAST. As a result, (i) a database registration symbol was found in the SPTR protein database (integrating the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database). AK027856 has an e-value of 0.0 and 80% identity over 470 amino acid residues, and (ii) database entry Z18529 has an e-value of 1 × 10-84(38) The database registration symbol Q04205 and Tensin are e-value: 1 × 10 with a 38% identity over 536 amino acid residues.-84, With 38% identity over 536 amino acid residues. This tensin has SH2 domain (Science, 252: 712-5 (1991)).
The amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 2 was subjected to a protein characteristic search using HMMPFAM. As a result, amino acid numbers 429 to 521 in SEQ ID NO: 11 show characteristics of a module structure required for binding to a signal transduction factor. A sequence (an amino acid sequence entered as SH2 in Pfam) was found.
From these facts, it was presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 2 was a protein having a function relating to the interaction with the tyrosine phosphorylated protein.
[0131]
(3) dnaform 46811 (SEQ ID NOs: 3, 12)
As shown in SEQ ID NO: 3, dnform 46811 consists of 3089 bases, of which base numbers 474 to 1010 constitute an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 178 amino acid residues (SEQ ID NO: 12). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 3 using BLAST. As a result, (i) a database registration symbol was found in the SPTR protein database (integrating the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database). BC025237, hematopoietic SH2 protein, e-value: 2 × 10-15And (ii) the database registration symbols Q9QXK9, SH2 domain protein 2A, Lad, an adapter protein interacting with the SH2 domain of T. , E-value: 2 × 10-10And (iii) database registration symbols Q9NP31 and SH2 domain protein 2A with e-value: 7 × 10−08, A hit was obtained with a 36% identity over 100 amino acid residues.
The amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 3 was subjected to a protein characteristic search using HMMPFAM. As a result, amino acid numbers 72 to 147 in SEQ ID NO: 12 show characteristics of a module structure required for binding to a signal transduction factor. A sequence (an amino acid sequence entered as SH2 in Pfam) was found.
From these facts, it was presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 3 was an adapter protein having a function relating to the interaction with the tyrosine phosphorylated protein.
[0132]
(4) dnaform27114 (SEQ ID NOs: 4, 13)
As shown in SEQ ID NO: 4, dnaform 27114 was composed of 1990 bases, of which base numbers 535 to 1440 were open reading frames (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 301 amino acid residues (SEQ ID NO: 13). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 4 using BLAST, and the result was that (i) a database registration symbol was found in the SPTR protein database (integrated SWISS-PROT protein sequence database and TrEMBL nucleic acid translation database). P29353, SHC transforming protein (HUMAN) (known to be involved in carcinogenesis of cells (Cell 1992 Jul 10; 70 (1): 93-104)), but e-value: 1 × 10-55And with a 44% identity over 317 amino acid residues, and (ii) database registration number P98083, SHC transforming protein (MOUSE) (known to be involved in cell carcinogenesis (J Biol Chem 1994). Dec 23; 269 (51): 32031-4)), e-value: 2 × 10−54And (iii) the database registration symbol P98077 and Protein SCK (HUMAN) were e-value: 2 × 10−44In, a hit was obtained with 39% coincidence over 305 amino acid residues.
The amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 4 was subjected to protein characteristic search using HMMPFAM. As a result, amino acid numbers 198 to 268 in SEQ ID NO: 13 show characteristics of a module structure required for binding to a signal transduction factor. A sequence (an amino acid sequence entered as SH2 in Pfam) was found.
From these facts, the protein encoded by the nucleotide sequence shown in SEQ ID NO: 4 is a protein having a function related to the interaction with the tyrosine phosphorylated protein, and is presumed to be involved in canceration. There is a possibility that an expression control substance, a function activator, or a function inhibitor can be developed as a therapeutic agent for cancer, arteriosclerosis, and the like.
[0133]
(5) dnaform 31796 (SEQ ID NOS: 5, 14)
As shown in SEQ ID NO: 5, dnaform 31796 was composed of 3004 bases, of which base numbers 50 to 1657 were open reading frames (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 535 amino acid residues (SEQ ID NO: 14). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 5 using BLAST. The homology search was performed in the SPTR protein database (integrating the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database) into (i) a database registration symbol. P46681, Actin interacting protein 2 has e-value: 5 × 10-136And (ii) the database registration symbol AE005999, FAD-binding oxidoreductase, e-value: 1 × 10−64And (iii) database registration symbol P32891, D-lactate dehydrogenase (YEAST), e-value: 2 × 10−38, With a 27% match over 433 amino acid residues. From these results, it was inferred that the protein consisting of the amino acid sequence shown in SEQ ID NO: 14 was an enzyme.
The amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 5 was subjected to protein characteristic search by HMMPFAM. As a result, a sequence exhibiting a characteristic of binding to FAD at amino acid numbers 82 to 275 of SEQ ID NO: 14 (entry as FAD_binding_4 in Pfam) Amino acid sequence).
From these facts, it was inferred that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 5 was an enzyme having a function of binding to FAD.
[0134]
(6) dnaform 25173 (SEQ ID NOs: 6, 15)
As shown in SEQ ID NO: 6, dnform 25173 consists of 1395 bases, of which base numbers 869 to 1174 constitute an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 101 amino acid residues (SEQ ID NO: 15). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 6 using BLAST. As a result, (i) a database registration symbol was found in the SPTR protein database (integrated SWISS-PROT protein sequence database and TrEMBL nucleic acid translation database). P42436, Assimilation nitrite reducease, e-value: 3 × 10−05And (ii) the database registration symbol AE006738, toluene-4-monooxygenase system protein with e-value: 0.009 and 32 over 78 amino acid residues. Hits with% match. From these results, it was inferred that the protein having the amino acid sequence shown in SEQ ID NO: 15 was an enzyme.
The amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 6 was subjected to a protein characteristic search using HMMPFAM. As a result, a sequence exhibiting a characteristic of binding to Fe at amino acid numbers 16 to 101 in SEQ ID NO: 15 (Riseke was entered in Pfam Amino acid sequence).
From these facts, it is presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 6 is a Fe-mediated oxidoreductase. , Cancer, hypertension, immune diseases, inflammatory diseases, etc.
[0135]
(7) dnaform 45474 (SEQ ID NOs: 7, 16)
As shown in SEQ ID NO: 7, dnform 45474 was composed of 1327 bases, of which base numbers 549 to 1022 were open reading frames (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 157 amino acid residues (SEQ ID NO: 16). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 7 using BLAST. As a result, (i) a database registration symbol was found in the SPTR protein database (integrating the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database). P42436, Assimilation nitrite reducease, e-value: 2 × 10−05And (ii) the database registration symbol AE006738, toluene-4-monooxygenase system protein has an e-value of 8 × 10−05And (iii) the database registration code AP003000, nitrate reduce small subunit, e-value: 0.005, and 30% coincidence over 79 amino acid residues. Hit. From these results, it was inferred that the protein having the amino acid sequence shown in SEQ ID NO: 16 was an enzyme.
The amino acid sequence encoded by the nucleotide sequence represented by SEQ ID NO: 7 was subjected to a protein characteristic search using HMMPFAM. Amino acid sequence).
From these facts, it was inferred that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 7 was a reductase having a function of oxidative phosphorylation. Therefore, there is a possibility that the protein or an expression control substance, a function activator, or a function inhibitor of the protein can be developed as a therapeutic agent for cancer, hypertension, immune disease, inflammatory disease, and the like.
[0136]
(8) dnaform 56923 (SEQ ID NOs: 8, 17)
As shown in SEQ ID NO: 8, dnform 56923 was composed of 2808 bases, of which base numbers 1045 to 1518 were open reading frames (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 157 amino acid residues (SEQ ID NO: 17). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 8 using BLAST, and it was found that (i) a database registration symbol was obtained in the SPTR protein database (integrating the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database). P42436, Assimilation nitrite reducease, e-value: 1 × 10−05And (ii) the database registration code AE006738, toluene-4-monooxygenase system protein, e-value: 1 × 10−04And (iii) the database registration code AP003000, nitrate reduce small subunit, e-value: 0.005, and 30% coincidence over 79 amino acid residues. Hit. From these results, it was inferred that the protein consisting of the amino acid sequence shown in SEQ ID NO: 17 was an enzyme.
The amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 8 was subjected to a protein feature search using HMMPFAM. Amino acid sequence).
From these facts, it was presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 8 was a reductase having a function of oxidative phosphorylation. Therefore, there is a possibility that the protein or an expression control substance, a function activator, or a function inhibitor of the protein can be developed as a therapeutic agent for cancer, hypertension, immune disease, inflammatory disease, and the like.
[0137]
(9) dnaform 48770 (SEQ ID NOs: 9 and 18)
As shown in SEQ ID NO: 9, dnform 48770 was composed of 3275 bases, of which base numbers 169 to 2760 were open reading frames (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 863 amino acid residues (SEQ ID NO: 18). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 9 using BLAST. As a result, the SPTR protein database (a combination of the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database) contained (i) a database registration symbol. AF479747, PYRIN-containing APAF1-like protein 4 had an e-value of 0.0, a 42% identity over 868 amino acid residues, and (ii) database registration symbols AF482706, ribonuclease inhibitor 2 (RNH2) But e-value: 5 × 10-167In addition, (iii) the database registration symbol AF29847, nucleotide-binding site protein 1 has an e-value of 2 × 10 with a degree of identity of 41% over 780 amino acid residues.−97In, a hit was obtained with 29% identity over 911 amino acid residues.
From these facts, it was presumed that the protein encoded by the nucleotide sequence shown in SEQ ID NO: 9 was a protein having a function related to protein-protein interaction.
[0138]
Example 5  Protein-protein interaction analysis
Using the two-hybrid method in mammalian cells (Suzuki, H., et al., Genome Research, 11, 1758-1765 (2001)), the proteins of the nucleotide sequences of two types of mouse full-length cDNAs (dnaform31796, dnaform46811). The protein-protein interaction of the protein encoded by the coding sequence was comprehensively analyzed.
[0139]
(1) Rapid sample preparation using PCR method
The CheckMate mammarian two-hybrid system (Promega) was used for the two-hybrid experiments on mammalian cells. Samples for protein-protein interaction analysis were a plasmid vector pBIND having a Gal4 gene DNA binding region inserted downstream of a CMV promoter, a plasmid vector pACT having a VP16 gene transcription activation region inserted downstream of a CMV promoter, and 5 Was prepared using a plasmid vector pG5luc in which a reporter luciferase gene was inserted downstream of the Gal4 binding region and the TATA box. A fusion gene of the Gal4 gene and the protein coding sequence of the nucleotide sequence (dnaform 31796, dnaform 46811) of the two kinds of mouse full-length cDNAs, and the VP16 gene and the mouse cDNA library FANTOM (HYPERLINK http://fantom.gsc.liken.go.jp. The fusion gene with the protein coding sequence of the full-length cDNA possessed by each clone of //http://fantom.gsc.liken.go.jp/) is basically ligated using a common sequence according to the protocol of Promega. It was prepared by combining two-step PCR methods. (See FIG. 1 of Suzuki, H., et al., Genome Research, 11, 1758-1765 (2001)). The protein coding sequence of the mouse cDNA was PCR-amplified using a forward primer having a common sequence on the 5 ′ side and a gene-specific sequence on the 3 ′ side and an M13 universal primer, and then the above amplification product and pBIND or pACT were amplified. A PCR amplification product (with a common sequence added to the 3 ′ side) is mixed, and a second-stage PCR amplification is performed using nested primers to express a fusion protein of Gal4 and mouse protein (BIND sample) Alternatively, a vector (ACT sample) for expressing a fusion protein of VP16 and mouse protein was constructed.
[0140]
(2) Two-hybrid experiments on high-throughput mammalian cells
BIND and ACT samples prepared by the PCR method were used directly without further purification. 0.25 μl each of the BIND sample and the ACT sample, 30 ng pG5luc, and 9.5 μl Opti-MEM medium (Lifetech) were dispensed into a 384-well plate. 10 μl of LF2000 transfection reagent (Lifetech) diluted 32 times in Opti-MEM medium was added to the wells, mixed, incubated for 20 minutes, and then suspended in F12 medium at 1,300 cells / μl in CHO-K1 Chinese hamster. 20 μl of the cell solution was added and well suspended. The assay sample is2After culturing for 20 hours in an incubator, luciferase activity was measured using Steady-Glo Luciferase Assay System (Promega) to confirm the interaction.
[0141]
(3) Analysis results
The results of the above (2) are shown in Table 1. As shown in Table 1, the proteins encoded by the nucleotide sequences (dnaform 31796, dnaform 46811) of the two types of mouse full-length cDNAs were obtained from the mouse cDNA library FANTOM (HYPERLINK http: //fantom.gsc. go.jp/http: // fantom. gsc. liken. go. jp /) Has the following interaction with the protein encoded by the cDNA base sequence of the specific clone.
[0142]
According to Example 4, a protein having an amino acid sequence (SEQ ID NO: 12) predicted from the open reading frame of dnaform 46811 (hereinafter referred to as “the present protein”) has a function related to the interaction with the tyrosine phosphorylated protein. It is estimated that the protein has Many tyrosine phosphorylated proteins are known that have important functions in signal transduction. As is evident from Table 1, the present protein is a protein encoded by (i) neural precursor cell expressed, developmentally down-regulated gene 9 (Nedd9), and (ii) hypothetical outer radiation system. melanoma antigen / family D, (iv) nuclear factor NF-kappaB p105, (v) OVARC1001008 PROTEIN homolog hypothetical protein FLJ10911 interacts with FLJ10911. Was Tsu.
[0143]
Nedd9 is present in the cytoskeleton or nucleus and is known to be involved in cell proliferation and cell adhesion by interacting with the CRK oncogene (http://www.informatics.jax.org/searches/accession_report). .Cgi? Id = MGI: 97302).
Hypothetical outer arm dynein light chain 1 structure containing protein is located in the cytoskeleton as a motor protein, and cytoplasmic dynein is known to be involved in transport of membrane vesicles and the like, cell division and the like. It is also known that agonist stimulation of beta-Adrenergic receptor causes phosphorylation of Outer arm dynein in airway epithelial cells (J. Allergy Clin Immunol 2002 110 (6Suppl): S275-81), and this protein is outer. From the interaction with arm dynein, it was inferred that this protein is related to respiratory diseases such as bronchial asthma via ciliary movement of the trachea.
Melanoma antigen / family D is homologous to cell adhesion protein trophinin, and is presumed to be associated with cell adhesion and cancer (Cancer Res, 59: 4100-3).
(1999)).
Nuclear factor NF-kappaB p105 is a transcriptional regulator that regulates the expression of various genes (Exp Hematol, 30: 285-96 (2002)).
OVARC10000148 PROTEIN homologous therapeutic protein FLJ10911 [Homo sapiens] has an RNA-binding domain and is a clone obtained from a cDNA library of ovarian cancer.
[0144]
From the above, it was speculated that this protein is located in the cytoskeleton and nucleus, is involved in cell proliferation and cell adhesion, and is associated with respiratory diseases such as canceration, cell apoptosis, and bronchial asthma.
[0145]
[Table 1]
Figure 2004229652
[0146]
Example 6  Tissue expression analysis using PCR method
In order to examine the change in tissue expression of mRNA (dnaform 31796) encoding the protein of the present invention in normal mice and diseased mice, a standard method (Higuchi R, et al., Biotechnology, 11: 1026-30 (1993)) was used. Tissue expression analysis using the PCR method was performed.
[0147]
(1) cDNA synthesis
Total RNA was extracted from 19 tissues of the following mice (Kazuo Moriwaki, one other edition, Molecular Medicine, separate volume, Vol. 36, “Spontaneous Disease Model Animals”, Nakayama Shoten, 1999), and reverse transcription was performed using oligo dT as a primer. CDNA synthesis was performed using the enzyme.
(A) Tissue of normal mouse and tissue of diabetic model mouse
{Circle around (1)} Control mouse C57BL / KsJ − + m / + m Jcl (female, 8 weeks old) whole brain, thalamus, lung, kidney, bone marrow, pancreas, fat cells, liver, eyes
(2) Diabetes model mouse C57BL / KsJ-db / db Jcl (female, 8 weeks old) pancreas, fat cells, liver, eyes
(B) Tissue of senescence accelerating mouse
(1) Normally aged mouse SAM R1 / TA Slc (male, 13 weeks old) hippocampus, frontal cortex
(2) Senescence-accelerated mouse SAM P8 / Ta Slc (male, 15 weeks old) hippocampus, frontal cortex
(C) Tissue of cancer metastasis model mouse
(1) Normal colon of control mouse Balb / c (female, 5 weeks old)
{Circle around (2)} Cancer metastasis model mouse Balb / c (female, 6 weeks old) colon cancer (colon cancer cells Colon 26 are transplanted into the mouse abdominal cavity, and colon cancer is removed 2 weeks later)
[0148]
(2) Quantification by PCR method
The expression of the mRNA encoding the protein of the present invention (dnaform 31796) was measured using a LightCycler quantitative PCR device (Roche Diagnostics) and a LightCycler-FastStart DNA master SYBR Green I reagent, which was attached to the product. Quantification was performed according to the protocol. The synthetic DNA sequences used for quantitative PCR are shown below.
5'-side primer: ACCTTGTGATCGACCTACGC (SEQ ID NO: 27)
3'-side primer: CTCAGCTGTCCAGGCATACA (SEQ ID NO: 28)
Quantitative results were corrected using Glyceraldehyde 3-phosphate dehydrogenase (GAPDH) as an internal standard. That is, the expression amount (copy number / μl) of the target gene in each tissue was divided by the expression amount of GAPDH (copy number / μl) to obtain a constant (1 × 106) Is displayed. Table 2 shows the results.
[0149]
[Table 2]
Figure 2004229652
[0150]
As is clear from Table 2, dnaform 31796 was strongly expressed and expressed in the whole body, but decreased in colon cancer. The cDNA of dnaform 31796 and the protein encoded by the cDNA can be applied to the treatment and diagnosis of cancer and the like. Further, the protein encoded by the cDNA may be involved in a disease relating to a tissue in which the expression of mRNA is fluctuated as described above or a tissue having a high mRNA expression level.
[0151]
Example 7  Functional analysis by RNAi method using fly homolog DNA
(1) Analysis and acquisition of fly homolog DNA of mouse cDNA
The homolog DNA of the fly gene with respect to the nucleotide sequence of the full-length mouse cDNA obtained above (clone name: dnaform 31796) was predicted by the following sequence analysis. The sequence analysis was performed at the amino acid sequence level considering the protein translated from the ORF. As mouse clone dnaform31796, a mouse full-length cDNA clone containing the amino acid sequence shown in SEQ ID NO: 14 (SEQ ID NO: 5) and a fly clone (Berkeley Drosophila Genome Project (BDGP) Drosophila Genomic Sequence). Was performed by NCBI BLASTP 2.2.2 (Altschul et al., Nucleic Acids Res. 25, 3389-3402 (1997)), and the two clones had a relationship showing the best E-value to each other. The fly gene was identified as the predicted homologous DNA (Tatusov, Koonin & Lipman, Science 278, 631 (1997)). As a result, a fly homolog DNA for mouse cDNA (dnaform 31796) was found. The gene number of the fly homolog DNA was mouse: dnaform 31796, and fly: CG3835 (transcript number: pp-CT42118).
[0152]
(2) Establishment of fly strain
(I) Construction of inverted repeat vector
An ORF of the above fly cDNA (CG3835), a fragment of about 500 bp on the 5 ′ side (hereinafter, this may be referred to as “target cDNA”) was converted into a fly cDNA library (Berkeley Drosophila Genome Project (http: // www. (fruitfly.org) (invitrogen) as a template. The PCR primers were CpoIA7 (SEQ ID NO: 29: the 3 ′ end of AAAATTCGGGACCG linked to the 21 ′ base sequence of the 5 ′ end of the cDNA of interest) and SfiIA3 (SEQ ID NO: 30: 3 ′ end of AAAATTTGGCCATATAGGCC, A set of 3'-terminal 21 'base sequence of the target cDNA and SfiIB7 (SEQ ID NO: 31: 3'-end of the base sequence described in AAAATTTGGCCTACATGGCC; 5'-terminal 21' of the target cDNA) A set of CpoIB3 (SEQ ID NO: 32: base sequence: AAATTTCGGTCCG attached to the 3 ′ end of the 3 ′ end of the cDNA of interest 21 base base sequence) and CpoIB3 (SEQ ID NO: 32) Was.
[0153]
A DNA fragment of about 500 bp which was PCR-amplified using the primers of each of the above sets was digested with SfiI, and this digested fragment was used as a fly cloning vector (pUASTCS1: Ryu Ueda et al., Cell Engineering, vol 21, No. 8, 923-932). (2002)) was inserted between the sites digested with SfiI and cloned. Further, a DNA fragment obtained by digesting the DNA fragment amplified by the above PCR with CpoI was inserted between sites where this vector was digested with CpoI, and cloned. By this two subclonings, an approximately 500 bp fragment of the fly cDNA ORF was inserted at two locations in the reverse direction under the control of the basic promoter of heat shock protein 70 adjacent to the downstream of the UAS sequence (GAL upstream activation sequence). The obtained vector (inverted repeat vector) was obtained.
The fly transformation vector pUAST vector used above is a vector using a transposon P factor, and the transcription promoting protein GAL4 is bound to the UAS sequence using the UAS sequence and the basic promoter of heat shock protein 70. Is a vector capable of inducing transcription of an inverted repeat sequence inserted downstream of a UAS sequence.
[0154]
(Ii) Transformation of fly
Ryu Ueda et al., Cell Engineering, vol. 8, 923-932 (2002), and the inverted repeat vector DNA prepared in (i) above is converted to W1118A micromanipulator was used to microinject the early embryos of the strain fly (Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform). This was cultured and hatched to obtain an adult, and then crossed according to the procedure described in the above-mentioned literature. In this cross, W as a double balancer1118The strains Sp / SM1, Cy: Pr / TM3, and Sb Ser were used. By this crossing, a fly having a homozygous chromosome into which the inverted repeat vector was inserted (hereinafter referred to as “IR strain”) was produced.
[0155]
(3) Induction of RNAi effect
(I) Mutation induction by crossing with GAL4 driver
The fly of the IR strain obtained in the above (2) was crossed with a fly of the Act5C-GAL4 strain (Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform) (FIG. 1). Act5C-GAL4 is a strain in which fusion gene in which the yeast GAL4 gene is linked to the promoter of the cellular actin gene (Act5C) expressed in cells of the whole body is introduced. Therefore, the GAL4 protein is expressed in all cells in the fly having the Act5C-GAL4 transgene.
As shown in FIG. 1, two types of transgenes are present in progeny (F1 generation, hereinafter referred to as “RNAi individuals”) in which an IR fly and an Act5C-GAL4 fly are crossed. Therefore, since the GAL4 protein is expressed in all cells and the IR vector is forcibly transcribed, dsRNA appears in the cells, exerts an RNAi effect, and degrades when the target mRNA is expressed. Therefore, the function of the target gene is inhibited in all cells of the individual. It has no effect on cells in which the target mRNA is not expressed.
[0156]
(4) Phenotype analysis and results
With the RNAi effect induced in the above (3), a change in the phenotype of a fly individual due to the inhibition of the function of the protein encoded by the fly homolog DNA (CG3835) of the mouse cDNA (dnaform 31796) was observed. As a result, it was found that CG3835 RNAi individuals were semilethal, that is, 5% or less of the individuals became pupae but molted and became adults.
By inhibiting the expression of the fly gene using RNAi technology and inhibiting its function, the fly individual became semi-lethal. Therefore, the gene may play an important role in development or in maintaining the survival and function of the individual. Do you get it. As described above, the protein (SEQ ID NO: 14) encoded by dnaform 31796 (SEQ ID NO: 5) is estimated to be an enzyme capable of binding to FAD, and is strongly expressed in the whole body of mice and is expressed in cancer tissues. Since the activity of an enzyme capable of binding to FAD encoded by fly homolog DNA was inhibited in RNAi individuals, cell proliferation did not normally progress during the development and differentiation of the individual. It is considered that the individual became semi-lethal.
As described above, the protein encoded by dnaform 31796 has the activity of an enzyme capable of binding to FAD, and is presumed to play an important role in relation to development, differentiation, physiological functions, or pathological conditions. .
[0157]
Example 8  Comprehensive functional analysis of protein encoded by full-length cDNA
From the results of the analysis of the base sequence in Example 4 and the results of tissue expression and function analysis in Examples 5 to 7, it was revealed that the protein of the present invention has the following properties.
[0158]
(1) dnaform 46811 (SEQ ID NOs: 3 and 12)
A protein having an amino acid sequence (SEQ ID NO: 12) predicted from the open reading frame of dnaform 46811 (hereinafter referred to as “the present protein”) is an adapter protein having a function relating to the interaction with tyrosine phosphorylated protein from Example 4. It was speculated that it might be involved in the differentiation of blood cells. In addition, it was inferred from Example 5 that the present protein is located in the cytoskeleton and nucleus, is involved in cell proliferation and cell adhesion, and is associated with canceration and cell apoptosis. Therefore, there is a possibility that the expression control substance, function activator, or function inhibitor of the present protein can be developed as a remedy for respiratory diseases such as cancer, inflammatory diseases, immune diseases, and bronchial asthma.
[0159]
(2) dnaform 31796 (SEQ ID NOS: 5, 14)
From Example 4, it was inferred from Example 4 that a protein having an amino acid sequence (SEQ ID NO: 14) predicted from the open reading frame of dnaform 31796 was an enzyme having a function of binding to FAD. In addition, the present protein was strongly expressed and expressed in the whole body as in Example 6, but the expression was reduced in colon cancer. Further, from Example 7, the RNAi effect of the fly homolog DNA was semi-lethal. It is presumed that the enzyme is related and catalyzes a reaction utilizing FAD, which is functionally important and plays an important role in development and differentiation. Therefore, there is a possibility that the present protein or an expression regulator, a function activator, or a function inhibitor of the present protein can be developed as a therapeutic agent for cancer, metabolic disease, immune disease, inflammatory disease, and the like.
[0160]
【The invention's effect】
Since the protein of the present invention and the DNA encoding the same have enzymatic activity or protein interaction activity, the protein or the DNA encoding the protein can be used to screen for a substance that regulates the activity. Is useful for the development of a medicament that can act on diseases and the like related to.
This application is based on a Japanese patent application filed on May 2, 2002 (Japanese Patent Application No. 2002-130918) and a Japanese patent application filed on December 4, 2002 (Japanese Patent Application No. 2002-352786). Here incorporated by reference. The contents of the documents cited in the present specification are also incorporated herein by reference.
[0161]
[Sequence list]
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652
Figure 2004229652

[Brief description of the drawings]
FIG. 1 is a conceptual diagram showing a method for inducing a transgene in an RNAi individual.

Claims (25)

以下の (a) または (b) のタンパク質。
(a)配列番号14〜17のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号14〜17のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつ酵素活性を有するタンパク質。
The following protein (a) or (b):
(A) a protein consisting of the amino acid sequence of any one of SEQ ID NOs: 14 to 17;
(B) a protein comprising an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any of SEQ ID NOs: 14 to 17, and which has an enzymatic activity.
請求項1に記載のタンパク質をコードするDNA。A DNA encoding the protein according to claim 1. 請求項1に記載のタンパク質をコードする完全長cDNA。A full-length cDNA encoding the protein according to claim 1. 以下の (a) 、 (b)又は(c) のいずれかのDNA。
(a)配列番号5〜8のいずれかに記載の塩基配列を有するDNA。
(b)配列番号5〜8のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつ酵素活性を有するタンパク質をコードするDNA。
(c)配列番号5〜8のいずれかに記載の塩基配列あるいはその相補配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつ酵素活性を有するタンパク質をコードするDNA。
The DNA according to any one of the following (a), (b) or (c):
(A) DNA having the nucleotide sequence of any one of SEQ ID NOs: 5 to 8.
(B) encoding a protein having an enzymatic activity, having a base sequence in which one or several bases are deleted, substituted and / or added in the base sequence set forth in any one of SEQ ID NOs: 5 to 8; DNA.
(C) encoding a protein having a base sequence capable of hybridizing under stringent conditions to a DNA having the base sequence of any of SEQ ID NOs: 5 to 8 or a sequence complementary thereto, and having an enzymatic activity DNA.
以下の (a) または (b) のタンパク質。
(a)配列番号10〜13または18のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号10〜13または18のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつタンパク質相互作用活性を有するタンパク質。
The following protein (a) or (b):
(A) a protein comprising the amino acid sequence of any one of SEQ ID NOs: 10 to 13 or 18;
(B) a protein consisting of an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any of SEQ ID NOs: 10 to 13 or 18, and which has a protein interaction activity.
請求項5に記載のタンパク質をコードするDNA。A DNA encoding the protein according to claim 5. 請求項5に記載のタンパク質をコードする完全長cDNA。A full-length cDNA encoding the protein according to claim 5. 以下の (a) 、 (b)または(c)のいずれかのDNA。
(a)配列番号1〜4または9のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜4または9のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつタンパク質相互作用活性を有するタンパク質をコードするDNA。
(c)配列番号1〜4または9のいずれかに記載の塩基配列あるいはその相補配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつタンパク質相互作用活性を有するタンパク質をコードするDNA。
DNA of any of the following (a), (b) or (c):
(A) a DNA having the nucleotide sequence of any one of SEQ ID NOs: 1 to 4 or 9;
(B) in the nucleotide sequence of any one of SEQ ID NOs: 1 to 4 or 9, which has a nucleotide sequence in which one or several bases are deleted, substituted and / or added, and has a protein interaction activity DNA encoding a protein.
(C) having a base sequence capable of hybridizing under stringent conditions to DNA having the base sequence of any of SEQ ID NOs: 1 to 4 or 9 or a sequence complementary thereto, and having a protein interaction activity; DNA encoding a protein having the same.
請求項2〜4のいずれかに記載のDNAを含む組換えベクター。A recombinant vector comprising the DNA according to claim 2. 請求項2〜4のいずれかに記載のDNAまたは請求項9に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。A transgenic cell into which the DNA according to any one of claims 2 to 4 or the recombinant vector according to claim 9 has been introduced, or an individual comprising the cell. 請求項10に記載の細胞により産生される、請求項1に記載のタンパク質。A protein according to claim 1, which is produced by the cell according to claim 10. 請求項6〜8のいずれかに記載のDNAを含む組換えベクター。A recombinant vector comprising the DNA according to claim 6. 請求項6〜8のいずれかに記載のDNAまたは請求項12に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。A transgenic cell into which the DNA according to any one of claims 6 to 8 or the recombinant vector according to claim 12 has been introduced, or an individual comprising the cell. 請求項13に記載の細胞により産生される、請求項5に記載のタンパク質。A protein according to claim 5, which is produced by the cell according to claim 13. 請求項2〜4または6〜8のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。A sense oligonucleotide having the same sequence as 5 to 100 consecutive nucleotides in the base sequence of the DNA according to any one of claims 2 to 4 or 6 to 8, and an antisense oligonucleotide having a sequence complementary to the sense oligonucleotide. An oligonucleotide selected from the group consisting of a nucleotide and an oligonucleotide derivative of the sense or antisense oligonucleotide. 請求項1または11に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。An antibody or a partial fragment thereof that specifically binds to the protein according to claim 1. 抗体がモノクローナル抗体である請求項16に記載の抗体。17. The antibody according to claim 16, wherein the antibody is a monoclonal antibody. モノクローナル抗体が請求項1または11に記載のタンパク質の酵素活性を中和する作用を有することを特徴とする請求項17に記載の抗体。18. The antibody according to claim 17, wherein the monoclonal antibody has an action of neutralizing the enzyme activity of the protein according to claim 1 or 11. 請求項5または14に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。An antibody or a partial fragment thereof that specifically binds to the protein according to claim 5. 抗体がモノクローナル抗体である請求項19に記載の抗体。The antibody according to claim 19, wherein the antibody is a monoclonal antibody. モノクローナル抗体が請求項5または14に記載のタンパク質のタンパク質相互作用活性を中和する作用を有することを特徴とする請求項20に記載の抗体。21. The antibody according to claim 20, wherein the monoclonal antibody has an action of neutralizing the protein interaction activity of the protein according to claim 5 or 14. 請求項1、5、11または14に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。A method for screening a modulator of the activity of a protein, comprising bringing the protein according to claim 1, 5, 11, or 14 into contact with a test substance, and measuring a change in the activity of the protein caused by the test substance. Method. 請求項10または13に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。14. A method for screening a substance regulating the expression of DNA, comprising bringing the test substance into contact with the gene-transfected cell according to claim 10 or 13, and detecting a change in the expression level of the DNA introduced into the cell. . 請求項1もしくは5に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報、および/または請求項2〜4もしくは6〜8のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。At least one or more amino acid sequence information selected from the amino acid sequence of the protein according to claim 1 or 5, and / or selected from the DNA base sequence according to any of claims 2 to 4 or 6 to 8. A computer-readable recording medium storing at least one or more base sequence information. 請求項1もしくは5に記載のタンパク質、および/または請求項2〜4もしくは6〜8のいずれかに記載のDNAを結合させた担体。A carrier to which the protein according to claim 1 or 5 and / or the DNA according to any one of claims 2 to 4 or 6 to 8 is bound.
JP2003127109A 2002-05-02 2003-05-02 New protein and dna encoding the same Pending JP2004229652A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003127109A JP2004229652A (en) 2002-05-02 2003-05-02 New protein and dna encoding the same

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002130918 2002-05-02
JP2002352786 2002-12-04
JP2003127109A JP2004229652A (en) 2002-05-02 2003-05-02 New protein and dna encoding the same

Publications (1)

Publication Number Publication Date
JP2004229652A true JP2004229652A (en) 2004-08-19

Family

ID=32966238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003127109A Pending JP2004229652A (en) 2002-05-02 2003-05-02 New protein and dna encoding the same

Country Status (1)

Country Link
JP (1) JP2004229652A (en)

Similar Documents

Publication Publication Date Title
US8071293B2 (en) PRRG4-associated compositions and methods of use thereof in methods of tumor diagnosis
US7767881B2 (en) Utilization of histamine receptor h3 gene participating in body weight or food intake control
AU744157B2 (en) Novel gene encoding a DNA repair endonuclease and methods of use thereof
JP2004229652A (en) New protein and dna encoding the same
JP2004229649A (en) New protein and dna encoding the same
JP2004041181A (en) New protein and dna encoding the same
JP2004041180A (en) New protein and dna encoding the same
JP2004229650A (en) New protein and dna encoding the same
JP2004229644A (en) New protein and dna encoding the same
JP2004000201A (en) New protein and dna encoding the same
JP2004229648A (en) New protein and dna encoding the same
JP2004229651A (en) New protein and dna encoding the same
JP2004229646A (en) New protein and dna encoding the same
JP2004041178A (en) New protein and dna encoding the same
JP2004041179A (en) New protein and dna encoding the same
JP2004229640A (en) New protein and dna encoding the same
JP2004229653A (en) New protein and dna encoding the same
JP2004024249A (en) New protein and dna which codes the same
JP2004229645A (en) New protein and dna encoding the same
US20220316008A1 (en) Compositions comprising rare genetic sequence variants associated with pulmonary function and methods of use thereof for diagnosis and treatment of asthma in african american patients
JP2004229641A (en) New protein and dna encoding the same
JP2004229647A (en) New protein and dna encoding the same
JP2004229643A (en) Protein and dna encoding the same
JP2004229642A (en) Protein and dna encoding the same
JP2006288387A (en) Method of ameliorating disease symptom caused by mood disturbance or related disturbance