JP2006174701A - New protein and dna encoding the same - Google Patents

New protein and dna encoding the same Download PDF

Info

Publication number
JP2006174701A
JP2006174701A JP2003046606A JP2003046606A JP2006174701A JP 2006174701 A JP2006174701 A JP 2006174701A JP 2003046606 A JP2003046606 A JP 2003046606A JP 2003046606 A JP2003046606 A JP 2003046606A JP 2006174701 A JP2006174701 A JP 2006174701A
Authority
JP
Japan
Prior art keywords
protein
dna
amino acid
sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003046606A
Other languages
Japanese (ja)
Inventor
Takao Isogai
隆夫 磯貝
Tomoyasu Sugiyama
友康 杉山
Ai Wakamatsu
愛 若松
Ryotaro Irie
亮太郎 入江
Shizuko Ishii
静子 石井
Kunji Kawai
勲二 河合
Atsushi Kondo
淳 近藤
Midori Nakajima
みどり 中島
Naoko Miyama
尚子 見山
Toshimitsu Kishimoto
利光 岸本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Association for Biotechnology
Molecuence Corp
Original Assignee
Research Association for Biotechnology
Molecuence Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Association for Biotechnology, Molecuence Corp filed Critical Research Association for Biotechnology
Priority to JP2003046606A priority Critical patent/JP2006174701A/en
Priority to PCT/JP2004/002133 priority patent/WO2004074485A1/en
Publication of JP2006174701A publication Critical patent/JP2006174701A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/48Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase
    • C12Q1/485Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase involving kinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)

Abstract

<P>PROBLEM TO BE SOLVED: To obtain a protein based on physiological activity by analyzing the base sequence of cDNA clones contained in a full-length cDNA library, specifying the physiological activity of a protein encoded by such a cDNA which has a new full-length sequence and to provide a method for using a DNA encoding the same. <P>SOLUTION: The protein is (a) a protein having a specific amino acid sequence or (b) a protein obtained by deleting, substituting and/or adding one or several amino acids from, with and/or to the specific amino acid sequence and has a kinase activity. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、および該タンパク質に特異的に結合する抗体等に関する。
【0002】
【従来の技術】
現在、世界的なレベルで様々な生物のゲノム配列の解明とその解析が進められている。既に約100の原核微生物、下等真核生物の出芽酵母、多細胞性真核生物である線虫で、その全ゲノム配列が決定された。30億塩基対といわれるヒトのゲノムについてはすでにその塩基配列のドラフトが発表されており、また完全配列も明らかにされようとしている。ゲノム配列を明らかにする目的は、全ての遺伝子の機能や制御、あるいは遺伝子間、タンパク質間、細胞間さらには個体間における相互作用のネットワークとして複雑な生命現象を理解するところにある。種々の生物種のゲノム情報から生命現象を解明していくことは、単に学術分野における研究課題として重要であるのみならず、そこで得られる研究成果をいかに産業上の応用へと発展させていくかという点で、その社会的な意義も大きい。
【0003】
ところが単にゲノム配列を決定しただけでは、全ての遺伝子の機能を明らかにできるわけではない。例えば酵母では、ゲノム配列から推定された約6,000の遺伝子の約半数しか、その機能を推定できなかった。一方、ヒトには約10万種類のタンパク質が存在するといわれる。そこで、ゲノム配列から明らかにされてくる膨大な量の新しい遺伝子の機能を、迅速かつ効率的に解明していくための「ハイスループット遺伝子機能解析システム」の確立が、強く望まれている。
【0004】
真核生物のゲノム配列では、多くの場合、一つの遺伝子がイントロンによって複数のエクソンに分断されている。そのため、ゲノム配列情報だけからそこにコードされるタンパク質の構造を正確に予測するには、多くの問題がある。一方、イントロンが除かれたmRNAから作製されるcDNAでは、タンパク質のアミノ酸配列の情報が一つの連続した配列情報として得られるため、容易にその一次構造を明らかにすることが可能である。ヒトのcDNAの研究では、これまでに数百万のEST(Expressed Sequence Tags)データが公共データベースに公開されており、それらはヒトの全遺伝子の80%以上をカバーしているものと推定されている。
【0005】
これらの情報は、ヒト遺伝子構造の解明やゲノム配列におけるエクソン領域の予測、あるいはその発現プロファイルの推定など、様々な角度から利用されている。ところが、これらのヒトEST情報の多くはcDNAの3’末端側近傍に集中しているため、特にmRNAの5’末端近傍の情報が極端に不足している状況にある。また、これらのヒトcDNAの中でコードされているタンパク質の配列が予測されているmRNAは約7,000種類程度であり、更にそのうち全長cDNAクローンとして取得されているものはわずか5,500種類程度に過ぎないのが現状である。ESTとして登録されているものを含めても、全長クローンとしてこれまでに取得されているヒトcDNAは、ヒト全遺伝子のわずかに10%〜15%程度であると推定されている。
【0006】
完全長cDNAを取得できれば、その5’末端配列からゲノム配列上でのmRNA転写開始点が推定できる上、その配列の中に含まれるmRNAの安定性や翻訳段階での発現制御に関わる因子の解析が可能である。また、翻訳開始点であるatgを5’側に含むことから、正しいフレームでタンパク質への翻訳を行うことができる。したがって、適当な遺伝子発現系を適用することで、そのcDNAがコードするタンパク質を大量に生産したり、タンパク質を発現させてその生物学的活性を解析することも可能になる。このように、完全長cDNAの解析からはゲノム配列解析を相補する重要な情報が得られる。また、発現可能な全長cDNAクローンは、その遺伝子の機能の実証的な解析や産業分野での応用への展開において、その重要性はきわめて高い。
【0007】
また、同一のゲノムにコードされたタンパク質であっても、それをコードするmRNAが転写される際、ゲノム中一部のエクソンが挿入・欠失して結合する異性体(以下、これを「スプライシングバリアントmRNA」と称することがある)がある。実際、これらのmRNAが翻訳されて生成される、複数種の類似のタンパク質(以下、これらを「スプライシングバリアント」と称することがある)が生体内において確認されている。スプライシングバリアントは、組織特異的、発生段階特異的、あるいは疾患特異的に発現し、それぞれ異なる機能を有していると考えられている。
【0008】
例えば、チロシンキナーゼであるJAK3遺伝子は、S型、B型、M型の3種類のスプライシングバリアントが存在し、S型は造血細胞で発現しているのに対し、B型とM型は造血細胞と上皮細胞で発現している。S型とM型が抗体によって共沈し、同じ細胞で発現していることから、複数のスプライシングバリアントが共に機能し、細胞内におけるサイトカインのシグナル伝達反応の複雑性をより高めていると推測されている (例えば、非特許文献1を参照)。
【0009】
このようなスプライシングバリアントのmRNAあるいはcDNAも、従来のcDNAライブラリーやESTからは取得されにくく、転写開始点を含む完全長cDNAライブラリーにより取得される可能性の高いクローンである(例えば、特許文献1を参照)。
【0010】
特に、プロテインキナーゼは、基質であるタンパク質びセリン、スレオニンあるいはチロシン残基をリン酸化する酵素であり、極めて多くのファミリーが知られている。また、一般にプロテインキナーゼはタンパク質リン酸化を介する細胞内シグナル伝達系を調節することにより、種々の生命現象の制御に関わっていることが知られており、疾患との関係が解明されている遺伝子が多い(例えば、非特許文献2を参照)。しかし、ヒトの遺伝子の約3〜4%はプロテインキナーゼの遺伝子であると言われ、ヒトの体内には約千種もの異なるプロテインキナーゼが存在すると推定されており、まだ多くのプロテインキナーゼ遺伝子がクローニングされないままに残されている。したがって、ヒトにおいて分離が進んでいないスプライシングバリアントを含む新規なプロテインキナーゼの全長cDNAを提供する意義は大きい。また、プロテインキナーゼは、治療のための標的分子として、またタンパク質自身に医薬品としての有用性を期待できる。したがって、これらのタンパク質をコードするcDNAの全長を明らかにすることには大きな意義がある。
【0011】
【特許文献1】
WO98/22507号公報(SEQ ID NO.1およびNO.2)
【非特許文献1】
Lai K. S. et al., J. Biol. Chem., 270: 25028-25036 (1995)
【非特許文献2】
Hunter, T., Cell, 50: 823-829 (1987)
【0012】
【発明が解決しようとする課題】
本発明は、完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうちスプライシングバリアントを含む全長として配列が新規なcDNAについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
【0013】
【課題を解決するための手段】
本発明者らは、オリゴキャップ法 (Maruyama, K., et al., Gene, 138: 171-174(1994); Suzuki, Y. et al., Gene, 200: 149-156 (1997))を用いて取得されたスプライシングバリアントを含む配列が新規なcDNAについて、該cDNAクローンの塩基配列の相同性に基づきデータベースを検索したところ、該配列にキナーゼ活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質がプロテインキナーゼであると同定した。本発明は、これらの知見に基づいて成し遂げられたものである。
【0014】
すなわち本発明によれば、以下の1〜15に記載の発明が提供される。
1.以下の(a)または(b)のタンパク質;
(a)配列番号13〜24のいずれかに記載のアミノ酸配列からなるタンパク質、
(b)配列番号13〜24のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸が欠失、置換および/または付加されたアミノ酸配列からなり、かつキナーゼ活性を有するタンパク質。
2.前項1に記載のタンパク質をコードするDNA。
3.前項1に記載のタンパク質をコードする完全長cDNA。
4.以下の(a)または(b)のいずれかのDNA;
(a)配列番号1〜12のいずれかに記載の塩基配列を有するDNA、
(b)配列番号1〜12のいずれかに記載の塩基配列において、1もしくは数個の塩基が欠失、置換および/または付加された塩基配列を有し、かつキナーゼ活性を有するタンパク質をコードするDNA。
5.前項2〜4のいずれかに記載のDNAを含む組換えベクター。
6.前項2〜4のいずれかに記載のDNAまたは前項5に記載の組換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
7.前項6に記載の細胞により産生される、前項1に記載の組換えタンパク質。
8.前項2〜4のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、および、当該センスまたはアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
9.前項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
10.抗体がモノクローナル抗体である前項9に記載の抗体。
11.モノクローナル抗体が前項1または7に記載のタンパク質のキナーゼ活性を中和する作用を有することを特徴とする前項10に記載の抗体。
12.前項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
13.前項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
14.前項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ配列情報および/または前項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
15.前項1に記載のタンパク質および/または前項2〜4のいずれかに記載のDNAを結合させた担体。
【0015】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
(1)完全長cDNAの取得および塩基配列の解析
本発明のDNAは、配列番号13〜24のいずれかに記載のアミノ酸配列からなるタンパク質、または配列番号13〜24のいずれかに記載のアミノ酸配列において1もしくは数個(ここで、数個とは、例えば5個以下、好ましく3個以下、より好ましくは2個以下を意味する)のアミノ酸残基の置換、欠失および/または付加を含むアミノ酸配列からなり、かつキナーゼ活性を有するタンパク質をコードし得るものであればいかなるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのcDNAの全長を含むものでもよい。
【0016】
具体的には、cDNAの全長を含むDNAとしては、例えば配列番号1〜12のいずれかに記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号39〜2159、配列番号2の塩基番号36〜1454、配列番号3の塩基番号401〜1960、配列番号4の塩基番号42〜1733、配列番号5の塩基番号371〜3874、配列番号6の塩基番号81〜2720、配列番号7の塩基番号1744〜2685、配列番号8の塩基番号254〜2554、配列番号9の塩基番号32〜3898、配列番号10の塩基番号146〜3406、配列番号11の塩基番号55〜1287、配列番号12の塩基番号407〜1690に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’および/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
【0017】
本発明のDNAは、これを取得できる方法であればいかなる方法により取得したものでもよいが、具体的には例えば下述の方法により取得することができる。まず、ヒトの組織あるいは培養細胞等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてオリゴキャップ法(Maruyama, K., et al., Gene, 138: 171-174 (1994))によりcDNAを取得する。具体的には、取得したmRNAについて酸性ピロフォスファターゼにより5’キャップをはずし、その後露出した5’末端のリン酸基を標的に、合成オリゴヌクレオチドをRNAライゲースを用いて連結する。ここで、キャップ構造を5’末端に有していないRNA分子について、上記オリゴヌクレオチドが結合しないように、予め5’末端に存在するリン酸基を、5’キャップは外さないが5’端のリン酸基のみ外す活性を有するフォスファターゼ等を用いて外しておくことは有効である。このRNA分子を鋳型として、3’側のプライマーとしてオリゴdTプライマーを用いて逆転写酵素により逆転写を行った後、RNA鎖を分解除去する。
【0018】
さらに取得された1本鎖DNAを鋳型として、上記合成オリゴヌクレオチドに相補的な配列を有するポリヌクレオチドを5’プライマーとし、3’末端に特異的なプライマー(オリゴdT等)を用いてポリメラーゼチェインリアクション(PCR)を行うことにより完全長cDNAライブラリーを作製することができる。ここで、5’プライマーおよび3’プライマーは、上記合成オリゴヌクレオチドおよび逆転写プライマーの全長に対して相補的なものではなく、3’側に3〜10bずらした配列を用いることが好ましい。プライマーの鎖長としては、通常15〜100塩基、好ましくは15〜30塩基が挙げられるが、増幅するcDNAの鎖長が長い場合には25〜35塩基の長さとすることが好ましく、また、Long and Accurate PCR(LA PCR:林健志、実験医学別冊・PCRの最新技術、羊土社;Cheng, S. et al., Nature 369: 684-685 (1994))を用いることが好ましい。
【0019】
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、取得されたcDNAクローンを細胞に導入して該cDNAがコードするタンパク質を発現できるようなタンパク質発現用ベクターが好ましく用いられる。具体的には例えば、宿主が哺乳動物細胞等の場合にはpME18SFL3(Genbank AB009864)等が好ましく、また大腸菌の場合では、pET3、pET11(ストラタジーン社製)、pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
【0020】
かくして取得されるcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、取得されたcDNAの5’末端あるいは3’末端の塩基配列を解析し、これをNCBI(National Center of Biotechnology Information;http://www.ncbi.nlm.nih.gov/)で運用しているGenbank、EMBL、DDBJ、PDB、dbEST等のデータベースをBLAST(Basic local alignment search tool; Altschul, S.F., et al., J. Mol. Biol., 215, 403-410(1990))を用いて検索し、その全長について完全に一致する配列が見出されない場合は新規として以下の解析に供することとした。
【0021】
このような完全長cDNAの塩基配列を有するDNAとしては、例えば、配列番号1〜12に記載の塩基配列を有するものが挙げられる。また、その翻訳領域としては、配列番号1の塩基番号39〜2159、配列番号2の塩基番号36〜1454、配列番号3の塩基番号401〜1960、配列番号4の塩基番号42〜1733、配列番号5の塩基番号371〜3874、配列番号6の塩基番号81〜2720、配列番号7の塩基番号1744〜2685、配列番号8の塩基番号254〜2554、配列番号9の塩基番号32〜3898、配列番号10の塩基番号146〜3406、配列番号11の塩基番号55〜1287、配列番号12の塩基番号407〜1690に示される配列を有するものが挙げられる。
【0022】
かくして取得されたcDNAの全長として新規な塩基配列を、BLASTによる相同性検索(homology search)や、HMMER(隠れMarkovモデルによる配列解析手法;Eddy, S. R., Bioinformatics 14: 755-763(1998))の機能群のひとつであるHMMPFAMによるタンパク質特徴検索(profile search:http://pfam.wustl.edu)等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【0023】
BLASTによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されている配列の触媒ドメイン部分と本発明のDNAのこれに対応する部分との一致度(identity)がE-value(問い合わせ配列がデータベース中に偶然存在する期待値)として10-4以下のものか、あるいは30%以上のものを示す。
【0024】
例えば、上位にヒットした触媒ドメイン配列の多くがキナーゼとしての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、すなわち、キナーゼ活性を持つであろうという予測が成り立つ。
【0025】
HMMPFAMでは、Pfamというタンパク質プロファイルを集積したデータベース中にあるエントリーが有するアミノ酸配列の特徴を、解析対象である塩基配列のコードするアミノ酸配列が有するかどうかを洗い出す方法による解析である。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し機能予測ができる。このように、それがコードするタンパク質がキナーゼ活性を有すると予測されるcDNAは、後述する生化学的実験によりそのキナーゼ活性を確認することができる。
【0026】
上記でcDNAの全長として新規であるとされたクローンとして具体的には、配列番号1〜12のいずれかに示す塩基配列を有するものが挙げられる。また、これらの塩基配列がコードするアミノ酸配列は配列番号13〜24のいずれかに示すものが挙げられる。
【0027】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜12のいずれかに記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1もしくは数個(ここで、言う数個とは、例えば15個以下、好ましく9個以下、より好ましくは6個以下を意味する)の塩基が欠失、置換および/または付加された塩基配列を有し、かつキナーゼ活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号13〜24のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸配列が欠失、置換および/または付加されたアミノ酸配列からなり、かつキナーゼ活性を有するタンパク質をコードするものが含まれる。
【0028】
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
【0029】
(2)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明のタンパク質の翻訳領域としてそのアミノ酸配列を決定することができる。このようなアミノ酸配列として例えば、配列番号13〜24のいずれかに記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1もしくは数個のアミノ酸が置換、欠失、および/または付加されたアミノ酸配列からなり、かつキナーゼ活性を有するものも含まれる。
【0030】
本発明のタンパク質の取得方法としては、(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクターもしくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【0031】
また、そのN末端またはC末端に適当なタグが融合するように設計されたベクターなどに挿入してタグを付加したタンパク質も本発明のタンパク質に含まれる。タグとして具体的には、グルタチオン−S−トランスフェラーゼ、ポリヒスチジン、Flagなどが挙げられる。
【0032】
上記形質転換体が産生するタンパク質には、タンパク質合成時に重原子などで置換・修飾したアミノ酸を取り込ませることにより修飾することができる。また、タンパク質を、精製の前又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。例えば、N末端アセチル化、C末端アミド化などの末端修飾、糖鎖付加、脂質付加、アシル化、メチル化、スルホン化、カルボキシル化、水酸化、リン酸化、ADP−リボシル化などであるが、必ずしもこれらに限定されない。これらの修飾タンパク質も上記したキナーゼ活性を有するものであれば本発明の範囲に含まれる。
【0033】
また、上記形質転換体が産生するタンパク質を、精製の前又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記したキナーゼ活性を有するものであれば本発明の範囲に含まれる。
【0034】
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)、pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)が挙げられ、宿主が哺乳動物細胞等の場合にはpME18SFL3(Genbank AB009864)等が好ましい。
【0035】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。昆虫細胞の場合には、ポリヘドリンプロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
【0036】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【0037】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック(J. Mol. Biol., 53: 154 (1970))、リン酸カルシウム法(Science, 221: 551 (1983))、DEAEデキストラン法(Science, 215: 166 (1982))、インビトロパッケージング法(Proc. Natl. Acad. Sci. USA, 72: 581 (1975))、ウィルスベクター法(Cell, 37: 1053 (1984))、および電気パルス法(Chu. et al., Nuc. Acids Res., 15: 1331 (1987))等が挙げられる。
【0038】
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J. Biol. Chem., 263: 7406 (1988))とその宿主であるSf−9(J. Biol. Chem., 263: 7406 (1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J. Viol., 26: 291 (1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc. Natl. Acad. Sci. USA, 77: 4216 (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7(ATCC CRL1651:アメリカン タイプ カルチャー
コレクション保存細胞)が用いられる。
【0039】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(Vertes, A. A. et al., Biosci. Biotechnol. Biochem., 57: 2036 (1993))、あるいはトランスポゾンや挿入配列(Vertes, A. A. et al., Molecular Microbiol., 11: 739 (1994))等を用いてDNA導入体を作製することもできる。
【0040】
上記で得られた培養物は細胞または菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。
【0041】
かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられる。無細胞タンパク質合成系として具体的には、大腸菌、植物種子の胚芽、ウサギ網状赤血球等の細胞抽出液等の既知のものが用いられる。これらは市販のものを用いることもできるし、それ自体既知の方法、具体的には大腸菌抽出液は、Pratt, J. M. et al., Transcription and Translation, Hames, 179-209, B.D.& Higgins, S. J., eds, IRL Press, Oxford (1984)に記載の方法等に準じて調製することもできる。市販の無細胞タンパク質合成系、または細胞抽出液としては、大腸菌由来のものは、E. coli S30 extract system(Promega社製)とRTS500 Rapid Translation System(Roche社製)等が挙げられ、ウサギ網状赤血球由来のものはRabbit Reticulocyte Lysate System(Promega社製)等、さらにコムギ胚芽由来のものはPROTEIOSTM(TOYOBO社製)等が挙げられる。
【0042】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【0043】
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、キナーゼ活性を有するものであれば、本発明のタンパク質に含まれる。
【0044】
(3)本発明のタンパク質が有する活性の確認
本発明のタンパク質は、これを上記(2)に記載のとおり組換えタンパク質として作製し、これを解析することにより(1)で推測した活性を有していることを確認することができる。さらに下記(4)に記載の抗体等との組み合わせにより解析することもできる。
【0045】
本発明のタンパク質が、キナーゼ活性を有することは、それ自体既知の常法を用いて確認することができる。具体的な方法の例として、基質を該組換えタンパク質に接触させ、該組換えタンパク質のキナーゼ活性により基質がリン酸化される際に消費されるATP量、生成物の量を測定する方法等を以下に説明する。
【0046】
反応液としては、基質のリン酸化部位がセリン/スレオニンである、セリン/スレオニンプロテインキナーゼの活性を測定する場合は、マグネシウムイオン、例えば5〜100mMの塩化マグネシウムあるいは酢酸マグネシウム、および還元剤として1〜100mMの2−メルカプトエタノール或いは1〜10mMのジチオスレイトールを含む、リン酸イオンの存在しない、中性から弱塩基性緩衝液、例えば50mMのトリス−塩酸あるいはHEPES緩衝液(pH7.0〜8.0)を用い、また、基質のリン酸化部位がチロシンであるチロシン特異的プロテインキナーゼの活性を測定する場合は、塩化マンガン、塩化亜鉛、NaVO3、ジチオスレイトールを含むトリス−塩酸あるいはHEPES緩衝液(pH7.0〜8.0)を用いることができる。
【0047】
この反応液に、ATPおよびそれぞれに適した基質を加えた後、精製した本発明のタンパク質を添加し、室温〜37℃で24時間程度反応後、該タンパク質が有するキナーゼ反応により消費したATP量、或いは該タンパク質により行われるキナーゼ反応による生成物を測定する。ここで、受容体型キナーゼと予想されるタンパク質のキナーゼ活性を測定する場合には、該タンパク質の細胞内部分、あるいはキナーゼ活性中心部分のみを組換えタンパク質として発現させて上記の反応に用いることが好ましい。
【0048】
キナーゼ反応に関して、セリン/スレオニンプロテインキナーゼである環状ヌクレオチド依存性プロテインキナーゼの場合、各キナーゼに対応する環状ヌクレオチドを反応液中に添加することが必要である。例えば、A−キナーゼの場合は環状AMP(cAMP)を、G−キナーゼの場合は環状GMP(cGMP)を添加し、基質としてヒストンを用いる。
【0049】
リン脂質依存性プロテインキナーゼの場合は、リン脂質を反応液中に添加する。例えば、C−キナーゼの場合、ホスファチジルセリンを添加し、基質としてヒストンを用いる。カルシウム依存性プロテインキナーゼの場合には、カルモジュリンを反応液に添加し、基質としてミオシンL鎖を用いる。ここには、ミオシンL鎖キナーゼ、カルモジュリンキナーゼが含まれる。チロシン特異的プロテインキナーゼの場合は、基質としてチューブリン、ヒストン、カゼイン、ミオシンL鎖、ガストリン、アンギオテンシン、チロシン−グルタミン酸(1:4)重合物等を用いる。
【0050】
キナーゼ活性測定において、基質へのリン酸基の転移に先立ち、キナーゼによるATPのADPへの加水分解反応が起こる。ここで加水分解されたATP量を測定することで、キナーゼ活性を定義づけることも可能である。この場合、基質非存在下で行った反応液中のATP量を測定し、消費ATP量をキナーゼ活性とする。
【0051】
キナーゼ反応により消費したATP量を測定する場合、上記キナーゼ反応液にルシフェリン、ルシフェラーゼを加え、一定時間反応後、添加したルシフェリン特有の蛍光波長で蛍光強度を測定し、残存ATPによる蛍光量とする。プロテインキナーゼおよび基質非存在下で測定した、反応液中に存在する全ATP蛍光強度から上記蛍光強度を差し引いた値を、キナーゼ活性により消費したATP量とし、酵素のキナーゼ活性とする。
【0052】
キナーゼ反応による生成物を測定する場合は、反応液に添加するATPとして放射性同位元素である32PをATPのγ位に含んだ[γ−32P]ATPを用いる。キナーゼ反応終了後、反応液をSDS−ポリアクリルアミドゲル電気泳動により分離し、泳動後のゲルをX線フィルムによりオートラジオグラフィーを行い32Pの取り込まれたタンパク質バンドを検出する。また、反応液に10%トリクロロ酢酸、或いは終濃度90%となるようにエタノールまたはアセトンを加え、タンパク質を沈殿させる。その後遠心或いはフィルター濾過により上清を除き、さらに同溶液で数回洗浄した後乾燥し、液体シンチレーションカウンターで32P量を測定する。放射性同位元素を用いない方法としては、キナーゼ反応終了後の反応液を、クロマトグラフィーにより分離し、リン酸化された基質の溶出位置の変化および変化量で活性を測定することも可能である。この場合、クロマトグラフィーとしては、イオン交換クロマトグラフィー、逆相クロマトグラフィーを用いることができる。また、基質のリン酸化による質量変化を質量分析装置で測定することにより、活性測定することも可能である。この場合、前述のクロマトグラフィー分離と併用することで、測定精度がさらに上昇する。
【0053】
このようなキナーゼ活性の解析系は、本発明のキナーゼ活性を有するタンパク質のアゴニストやアンタゴニストの評価にも用いることができる。なお、本発明のタンパク質が有する活性の確認は、上記した方法に限定されるものではない。
【0054】
(4)本発明のタンパク質の機能解析
かくして得られたスプライシングバリアントとして同定されたものを含む新規タンパク質であって、かつキナーゼ活性を有する本発明のタンパク質は、上記(3)で確認されたキナーゼ活性以外の機能を解析することによりその新規の利用法が提供される(このキナーゼ活性以外の機能をさらに解析する対象となるタンパク質を、以下「解析対象タンパク質」と称することがある)。特に、本発明のタンパク質には、公知のタンパク質のスプライシングバリアントが含まれるため、このバリアントが公知のバリアントとどのような異なる機能があるかを同定することは重要である。
【0055】
具体的な機能の解析方法としては、例えば、(i)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(ii)他のタンパク質、DNAとの相互作用を解析する方法、(iii)適当な細胞へ導入し、導入細胞の表現型の変化を解析する方法、(iv)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。
【0056】
(i)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, D. G., Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法などが挙げられる。ここで、解析の対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象バリアントと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141-145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【0057】
(ii)の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質が公知のバリアントが存在するスプライシングバリアントの場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【0058】
(iii)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(2)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、公知のバリアントが存在するスプライシングバリアントの場合には、公知のものも同様に細胞へ導入し、比較解析することにより解析対象バリアントに関連する表現型を同定することができる。また、本発明のタンパク質はキナーゼ活性を有するものであることがわかっているので、キナーゼが関連する疾患に見られる表現型等に注目して解析することも好ましい。
【0059】
(iv)の方法では、後述するオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【0060】
(5)オリゴヌクレオチドの調製および該オリゴヌクレオチドを用いる機能解析上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜12のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。ここで、対象タンパク質が、公知のバリアントDNAが存在するスプライシングバリアントの場合には、公知のバリアントと異なる部分の塩基配列を選択することが好ましい。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
【0061】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine-modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等をあげることができる。
【0062】
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製することにより、RNAインターフェアレンス法に適用することができる。2本鎖RNAの作製方法、及びRNAインターフェアレンス法については、例えば、(Elbashir, S., et al., Nature, 411: 494-498 (2001))に記載の方法等を用いることができる。上記2本鎖RNAは、そのすべてがRNAである必要はない。具体的には、その一部がDNAであるものとして、WO02/10374号公報に記載のものを用いることができる。
【0063】
このRNAインターフェアランス法において標的となる遺伝子(以下これを「標的遺伝子」と称することがある)は、本発明のDNAであれば、いかなるものであってもよい。これらのDNAの少なくとも一部の塩基配列と実質的に同一な配列を有するRNAからなる2本鎖ポリヌクレオチド(以下、これを「2本鎖ポリヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい20bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。
【0064】
また、解析対象タンパク質が公知タンパク質と比較して、挿入型あるいは置換型バリアントである場合は、2本鎖ポリヌクレオチド配列は挿入あるいは置換部位に設定することができる。また、解析対象タンパク質が公知タンパク質の欠失型バリアントである場合は、欠失部を跨ぐ配列を2本鎖ポリヌクレオチド配列とすることにより、該タンパク質特異的に効果のある配列を選定することができる。さらに、解析対象タンパク質と公知タンパク質のそれぞれをコードするDNAの塩基配列と比較して、解析対象タンパク質をコードするDNAに特異的な塩基配列を選定することによれば、解析対象タンパク質特異的にその発現を阻害することができる。
【0065】
ヌクレオチドの鎖長は20bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までのいかなる長さでもよいが、20〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞においては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5: 115-180 (1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA-responsive protein kinase: Bass, B. L., Nature, 411: 428-429 (2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’-5’oligoadenylate synthetase(Bass, B. L., Nature, 411: 428-429(2001))を介してRNaseLの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物または該動物由来の細胞あるいは組織を被導入体として用いる場合には20〜30bpの2本鎖ポリヌクレオチドを用いることが好ましい。2本鎖ポリヌクレオチドはその全体が2本鎖である必要はなく、5’または3’末端が一部突出したものも含む。2本鎖ポリヌクレオチドは相補性を有する2本鎖のポリヌクレオチドを意味するが、自己相補正を有する1本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【0066】
2本鎖ポリヌクレオチドの調製方法としては特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は相補性を有する1本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法としては上記ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【0067】
このようにして調製した2本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであればいかなるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業において使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【0068】
被導入体は、細胞、組織あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞および内分泌線または外分泌腺の細胞が含まれる。
【0069】
被導入体への2本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィスル感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、(皮下、筋肉内及び静脈内投与を含む)非経口、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【0070】
導入する2本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも1コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により2本鎖ポリヌクレオチドを導入する場合、0.1〜1000nMが好ましい。
【0071】
RNAインターフェアレンスによる本発明のDNAの導入体内での発現抑制により、本発明のDNAがコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【0072】
(6)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。また、対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、対象タンパク質にのみ反応し、公知の、またはそれ以外のバリアントには反応しない抗体を用いることにより、対象タンパク質に特異的な機能を同定することができる。このような抗体のエピトープとしては、例えば、対象タンパク質が公知のバリアントと比較して欠失しているアミノ酸配列がある場合、欠失部分の前後のアミノ酸配列(ジャンクション部分)等が好ましい。また、対象タンパク質が公知のバリアントのN末またはC末が添加されているアミノ酸配列を有する場合、添加されているアミノ酸配列をエピトープとすることも好ましい。上記以外の方法として、対象タンパク質に対して取得したポリクローナル抗体から、公知の、またはそれ以外のバリアントに反応する抗体を除去することにより、対象タンパク質にのみ反応する抗体を取得することができる。除去する方法としては、公知の、またはそれ以外のバリアントをリガンドとして固定したアフィニティークロマトグラフィー、あるいは、公知の、またはそれ以外のバリアントによる免疫沈降法等が用いられる。
【0073】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【0074】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【0075】
免疫後、適宜試験的に採血を行ってオクタローニー法、固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、塩析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【0076】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein, et al., Nature, 256: 495 (1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【0077】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体のいずれから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(Zimmermann, U. et al., Naturwissenschaften, 68: 577 (1981))によっても行うことができる。
【0078】
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO2、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【0079】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al., Nature, 335: 256-259 (1988); Duchosal, M. A., et al., Nature, 355: 258-262 (1992))。
【0080】
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一過性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
【0081】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有するキナーゼ活性等を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(2)で作製したDNA導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【0082】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0083】
(7)本発明のタンパク質が有する活性を調節する分子のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
【0084】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、かつ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であればいかなるものであってもよい。例えば、まずはじめに本発明のタンパク質とスクリーニングに供する物質(以下、これを「被検物質」と称することがある)とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する活性の変化を指標として被検物質を選抜する方法を用いることができる。
【0085】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であればいかなるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質の相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(6)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。ここで、対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、対象タンパク質にのみ結合し、公知のまたは他のバリアントには結合しない物質についてその影響を解析するか、または公知のあるいは他のバリアントにおいても同様に結合するか否かを同定し、結合した場合にはその影響の相違を解析することによって、対象タンパク質に対する該物質の影響を解析することができる。また、該物質の個体内での分布を検討することにより、対象タンパク質や公知のまたは他のバリアントに対する影響を解析することができる。
【0086】
具体的な解析方法としては、例えば、キナーゼ活性を調節する物質を解析する場合には、(2)に記載したDNA導入体に基質となるタンパク質も同様の方法で導入する。この導入体について選択された物質の存在下/または非存在下で基質となるタンパク質のリン酸化をそれ自体既知の通常用いられる方法により解析する。具体的には、上記(3)に記載の方法等を用いて行うことができる。基質となるタンパク質のリン酸化が、物質の非存在下の場合と比べて増加した場合には、該物質はキナーゼ活性化物質として機能する可能性があり、また低下、または阻害された場合には物質はキナーゼ阻害物質として機能する可能性があると同定できる。
【0087】
ここで、医薬活性成分の取得を目的として調節物質をスクリーニングするために用いる本発明のDNA、あるいは組換えタンパク質を用いる場合は、上記したヒトのホモログを用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、さらに生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。なお、本発明のタンパク質の機能調節物質の評価は、上記した方法に限定されるものではない。
【0088】
本発明のタンパク質が有するキナーゼ活性としては、例えば、癌に関連するパスウェイ上のシグナル伝達機能、心筋発達に関連するパスウェイ上のシグナル伝達機能、精子の運動性を制御するパスウェイ上のシグナル伝達機能、生殖細胞分化を制御するパスウェイ上のシグナル伝達機能、細胞分化を制御するパスウェイ上のシグナル伝達機能、精子の分化を制御するパスウェイ上のシグナル伝達機能、アルツハイマー病発症を制御するパスウェイ上のシグナル伝達機能、グリセロール3リン酸を生成する機能、脳皮質発達、神経細胞等遊走を制御するパスウェイ上のシグナル伝達機能、脂肪酸やステロールの合成に関連する機能、細胞死に関連するパスウェイ上のシグナル伝達機能、インシュリンシグナル伝達等である。そこで、本スクリーニング方法により同定できる化合物は、制癌剤、心疾患治療剤、不妊治療剤、再生組織誘導剤、アルツハイマー病治療剤、神経変性疾患治療剤、糖尿病治療剤として用いられ得るものである。
【0089】
また、本発明のタンパク質をコードするDNAは、副腎、子宮、精巣、脳(全脳、尾状核、扁桃核、視床、小脳)等の組織または器官由来のRNAから構築されたcDNAライブラリーよりクローニングされており、取得された本発明のタンパク質は、上記組織または器官等において特有の機能を有している可能性があるので、本発明のタンパク質の機能調節物質は該組織または器官に特有の疾患の治療剤として用いられ得るものである。
【0090】
かかる調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0091】
(8)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、(2)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
【0092】
被検物質としては、(7)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、この被検物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、この被検物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
【0093】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0094】
(9)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の子宮に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【0095】
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
【0096】
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【0097】
(10)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜12のいずれかに記載の塩基配列を有するDNA及びその部分断片は、それらを基板上に結合させた担体として用いられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。ここで、対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合、上記プロテインチップには対象タンパク質特異的なアミノ酸配列部分断片を用いることもできるが、他バリアントと異なる立体構造を有している可能性もあるためその全長を用いることもできる。また、DNAアレイには、対象タンパク質をコードするDNA配列のうち、他のバリアントDNAと異なる配列を選択することが好ましい。
【0098】
また、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
【0099】
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD―R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
【0100】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。なお、取得された各cDNAクローンについて以下の実験を行った結果は、実施例5に纏めて記載した。
【0101】
実施例1 オリゴキャップ法によるcDNAライブラリーの作製
ヒト各組織より全RNAとして抽出された市販の各mRNA(クロンテック社製:副腎(#64016−1)、子宮(#64029−1)、精巣(#64027−1)、小脳(#64035−1)、全脳(#64020−1))から、およびヒト各組織よりポリ(A)+RNAとして抽出・精製された市販の各mRNA(クロンテック社製:尾状核(#6575−1)、扁桃核(#6574−1)、視床(#6582−1))に全脳の全RNAらポリ(A)+RNAをオリゴdTセルロースで除くことにより調製したポリ(A)-RNAをそれぞれ混ぜたRNAから、オリゴキャップ法(Maruyama, K., et al., Gene, 138: 171-174 (1994))によりcDNAライブラリーをそれぞれ作製した。
【0102】
まず、上記RNAをBAP(Bacterial Alkaline Phosphatase)およびTAP(Tobacco Acid Pyrophosphatase)で処理した後に、オリゴキャップリンカー(配列番号25)をRNAライゲースを用いて連結した。このRNA鎖を鋳型としてオリゴdTプライマー(配列番号26)用いた逆転写反応により第1鎖cDNAを合成し、続いてRNA鎖を分解除去した(鈴木ら、タンパク質 核酸 酵素、41: 603-607 (1996);Suzuki, Y. et al., Gene, 200: 149-156 (1997))。次いで、5’のPCRプライマー(配列番号27)と3’のPCRプライマー(配列番号28)を用いPCR(polymerase chain reaction)により2本鎖cDNAを増幅し、増幅されたDNA鎖をSfiIにより切断した。
【0103】
次いで、発現用ベクターであるpME18SFL3(GenBank AB009864)のDraIIIサイトに上記で取得したSfiI切断断片をクローニングし、cDNAライブラリーを作成した。上記で用いたpME18SFL3ベクターは、クローニング部位の上流にSRαプロモーターとSV40 small tイントロンが組み込まれており、またその下流にはSV40ポリ(A)付加シグナル配列が挿入されている。pME18SFL3のクローン化部位は非対称性のDraIIIサイトとなっており、cDNA断片の末端にはこれと相補的なSfiI部位を付加しているので、クローン化したcDNA断片はSRαプロモーターの下流に一方向性に挿入される。したがって、全長cDNAを含むクローンでは、得られたプラスミドをそのままCOS細胞に導入することにより、一過的に遺伝子を発現させることが可能である。すなわち、非常に容易に、遺伝子産物であるタンパク質として、あるいはそれらの生物学的活性として実験的に解析することが可能となっている。
【0104】
これらより得たクローンのプラスミドDNAについて、cDNAの5’端または3’端の塩基配列をDNAシーケンシング試薬(Dye Terminator Cycle Sequencing FS Ready Reaction Kit, dRhodamine Terminator Cycle Sequencing FS Ready Reaction KitまたはBigDye Terminator Cycle Sequencing FS Ready Reaction Kit:PE Biosystems社製)を用い、マニュアルに従ってシーケンシング反応後、DNAシーケンサー(ABI PRISM 3700:PE Biosystems社製)でDNA塩基配列を解析した。
【0105】
実施例2 オリゴキャップ法で作製したcDNAライブラリーからのクローンの5’末端の全長性の評価
実施例1で作製したヒトcDNAライブラリーの5’末端の塩基配列は、これを公共データベース中のヒト既知mRNAの配列と比較し、5’末端配列が一致する全クローンについて、公共データベース中の既知mRNA配列より長く5’末端が伸びている場合、または5’末端は短いが翻訳開始コドンは有している場合を「全長」と判断し、翻訳開始コドンを含んでいない場合を「非全長」と判断した。
【0106】
次に、ESTiMateFLによるクローンの評価を行った。ESTiMateFLは、公共データベース中のESTの5’末端配列や3’末端配列との比較によって全長cDNAの可能性の高いクローンを選択するために、ヘリックス研究所の西川・太田らにより開発された方法である。実施例1で解析したcDNAクローンの5’末端や3’末端配列をESTデータベースに登録されている塩基配列と比較し、取得されたcDNAクローンの配列よりも、5’側または3’側へ伸長しているESTが存在する場合には、そのクローンは「全長ではない可能性が高い」と判断した。公共データベース中のEST配列より5’末端が伸長している場合、あるいは5’末端が短いクローンでも、その差が50塩基以内の場合を便宜的に全長とし、それ以上短い場合を非全長とした。
【0107】
実施例3 cDNAクローンの塩基配列、アミノ酸配列の解析
実施例2で解析したcDNAクローンの全塩基配列について、BLAST(Basic local alignment search tool; Altschul, S. F., et al., J. Mol. Biol., 215: 403-410 (1990))による相同性検索(homology search)や、HMMER(隠れMarkovモデルによる配列解析手法;Eddy, S. R., Bioinformatics, 14: 755-763 (1998))の機能群のひとつであるHMMPFAMによるタンパク質特徴検索(profile search:http://pfam.wustl.edu)を行い、各cDNAクローンがコードするタンパク質の機能を推定した。また、その塩基配列の一部が完全に一致する公知のクローンが存在するスプライシングバリアントと推定されるクローンについては、そのゲノム配列が解析可能であればどのエクソンが欠失してスプライシングしたものであるかを解析した。
【0108】
実施例4 キナーゼ活性の測定
(1)タンパク質の調製
実施例3でキナーゼ活性を有すると推定されたcDNAクローンについて、これがコードするタンパク質を無細胞タンパク質合成系を用いて合成し、該タンパク質がキナーゼ活性を有するか否かを以下の生化学的実験により解析した。
【0109】
実施例3でキナーゼ活性を有すると推定されたcDNAクローンのORF断片を、5’側のプライマーとして各クローンに特異的な下記プライマー、3’側のプライマーとして下記の共通プライマーを使用したPCR法によって取得した。
【0110】
5’側のプライマー
(a)c−testi2053667:ATGGTGTTTCCAAACTATCATATTTATCCTC(配列番号29)
(b)c−brcan2018240:ATGGCCTTCATGGAGAAGCC(配列番号30)
(c)c−brace3038687:ATGTCGTCGTCCTTCTTCAAC(配列番号31)
(d)c−brace3050764:ATGGAGCCCATGTATCAAGATCG(配列番号32)
(e)c−bramy3018357:ATGAGCCCTGAGGGCC(配列番号33)
(f)c−brawh3022866:ATGAGCAGCAATGATATTCAGTACC(配列番号34)
(g)c−brawh3043827:ATGCTCGAGGCCCGG(配列番号35)
(h)c−brtha2034874:ATGGCGGCTCCGAGC(配列番号36)
(i)c−testi4052197:ATGTTCACCTTGGGATACCATGG(配列番号37)
3’側の共通プライマー
GGAGAAAGGCGGACAGGTAT(配列番号38)
【0111】
これを、SP6プロモーターを含む翻訳制御領域−グルタチオン−S−トランスフェラーゼ遺伝子−PreScission Protease(アマシャムファルマシアバイオテク社製)切断サイト−DNAクローニングサイト(SmaI, SfiI)−ポリ(A)シグナル配列を有するベクター(pEU−SS4)のクローニングサイトに挿入した。
【0112】
上記で調製されたプラスミドDNAを鋳型として、SP6 RNAポリメラーゼ(Promega社製)を用いて転写を行い、得られたRNAをフェノール/クロロホルム抽出、エタノール沈殿の後、Nick Column(Amersham Pharmacia Biotech社製)によって精製した。
【0113】
透析法によるコムギ胚芽抽出液を用いた無細胞タンパク質合成の方法は既報(Endo, Y. et al., J. Biotech., 25: 221-230 (1992))の方法に従った。反応溶液は、容量の24%のコムギ胚芽抽出液を含み、上記Ericksonらの方法に準じた以下の成分組成である。20mM HEPES−KOH、pH7.6、80mM酢酸カリウム、1.6mM酢酸マグネシウム、0.4mMスペルミジン、2mMジチオスレイトール、20種類のL-アミノ酸(各 0.24mM)、1.2mM ATP、0.26mM GTP、16mMクレアチンリン酸、0.4mg/mlクレアチンキナーゼ、1000 units/ml ribonuclease inhibitor(RNasinTM)に、上述したmRNA (1mg/ml反応容量) を添加して用いた。上記反応溶液をフロータ・ライザー(Spectra/Float-A-Lyzer(Biotech RC)、分画分子量:10kDa、 容量:1ml)に入れ、反応液の40倍容量の透析外液(30mM HEPES−KOH、pH7.6、100mM酢酸カリウム、2.7mM酢酸マグネシウム、0.4mMスペルミジン、2.5mMジチオスレイトール、20 種類のL−アミノ酸(各 0.3mM)、1.2mM ATP、0.25mM GTP、16mMクレアチンリン酸)に対しての透析系で、反応は26℃で、48時間行った。
【0114】
反応終了後、透析内液を16,000rpmで5分間遠心分離し、上清を分離した。この上清を、150mM塩化ナトリウム、10mMジチオスレイトールを含む50mMトリス・塩酸緩衝液(pH8.5)で5倍希釈し、同緩衝液で平衡化したアフィニティ樹脂であるグルタチオンセファロース・4B(アマシャムバイオサイエンス社製)を充填したアフィニティカラムに室温で添加し、目的タンパク質を吸着した。ここで、上記カラムには、取得した遠心上清の1/2量のアフィニティ樹脂を用いた。
【0115】
さらに、上記で用いたアフィニティ樹脂の10倍容量の同緩衝液にてカラムを洗浄した後、2units/μl濃度のPreScission protease(アマシャムバイオサイエンス社製)の同緩衝液による25倍希釈液を、アフィニティ樹脂と等容量添加し、4℃で40時間切断反応を行った後、上記緩衝液にて目的タンパク質を溶出した。
【0116】
(2)目的タンパク質のATP消費量を指標とするキナーゼ活性の測定
上記(1)で単離した目的タンパク質は、ウシ血清アルブミンを標準として定量した。0.1μgの目的タンパク質を、0.2mg/mlウシ血清アルブミン、8mM塩化マグネシウムを含む50mMトリス・塩酸緩衝液(pH7.4)中で、終濃度1〜10mMとなるようにジチオスレイトールを添加後、1μMのATPと室温で24時間インキュベートした後、ルシフェラーゼ・ルシフェリンキット(和光純薬工業社製)100μlを加え、室温で24時間反応した後、560nmの蛍光強度を測定した。目的タンパク質を添加していない反応系をコントロールとして、同様に560nmの蛍光強度を測定した。このコントロールの値と目的タンパク質を添加した系の値の差を目的タンパク質が消費したATP量として、目的タンパク質1molあたりが24時間に消費するATP量(mol)を目的タンパク質のキナーゼ活性として同定した。
【0117】
(3)目的タンパク質によるポリペプチドのリン酸化を指標としたキナーゼ活性の測定
上記(1)で単離した目的タンパク質は、ウシ血清アルブミンを標準として定量した。0.1μgの目的タンパク質を、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2:Promega社、MLCKS、CaMKII:Sigma社、Syntide2:BACHEM FEINCHEMIKALIEN AG)0.2μgとともに、0.2mg/mlウシ血清アルブミン、1〜10mMジチオスレイトール、8mM塩化マグネシウムを含む50mMトリス・塩酸緩衝液(pH7.4)、1μM ATPと室温で2時間インキュベートした。反応終了後、反応液を、20%アセトニトリルを含む0.1%トリフルオロ酢酸で平衡化したBakerbond C18(J. T. Baker社製:0.46×25cm)カラムに添加し、0.1%トリフルオロ酢酸の存在下で、20〜80%のアセトニトリルの60分間の直線濃度勾配により流速1ml/分でペプチドを分離した。ペプチドの溶出は、215nmの吸光度により測定した。コントロールとして目的タンパク質を添加しない反応液についても同様に分離し215nmの吸光度を測定した(図21)。ここで、目的タンパク質を添加することによってピークの減少および溶出位置の変動が検出されるポリペプチドについては、目的タンパク質の有するキナーゼ活性の基質となると判断することができる。
【0118】
実施例5 各cDNAクローンの解析結果
(1)c−adrgl2001554(配列番号1、13)
c−adrgl2001554(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号1に示すように、2168塩基から成り、そのうち塩基番号39番から2159番までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、706アミノ酸残基から成る (配列番号13)。配列番号13のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、(i)データベース登録記号AX040998およびWO00/65040号公報に記載されているアミノ酸配列がヒットしていた。その内容として、AX040998およびWO00/65040号公報に記載されているアミノ酸配列は626アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号17〜616番が、配列番号13に記載のアミノ酸配列のアミノ酸番号25〜661番と、E-value(問い合わせ配列がデータベース中に偶然存在する期待値):3×10-82かつ655アミノ酸残基にわたり32%の一致度(identity)をもつことが認められた。また(ii)データベース登録記号P50528、Serine/threonine-protein kinase plol(Fission yeast)がヒットしていた。その内容として、P50528は683アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号47〜674番が、配列番号13に記載のアミノ酸配列のアミノ酸番号45〜695番と、E-value:6×10-75かつ670アミノ酸残基にわたり32%の一致度をもつことが認められた。さらに(iii)データベース登録記号、Q9R011、Cytokine-inducible Serine/threonine-protein kinase(ラット)がヒットしていた。その内容として、Q9R011は615アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号31〜558番が、配列番号13に記載のアミノ酸配列のアミノ酸番号39〜645番と、E-value:7×10-71かつ613アミノ酸残基にわたり30%の一致度をもつことが認められた。これらの結果より配列番号13に示したアミノ酸配列からなるタンパク質は新規のセリン/スレオニンプロテインキナーゼであることが推測された。上記(ii)のタンパク質は、データベース中の文献情報(Genes Dev., 9: 1059-1073 (1995))からG1、G2期の細胞における隔壁の形成に関わることが、さらに上記(iii)のタンパク質は、データベース中の文献情報(EMBO J., 18: 5528-5539 (1999))からシナプス形成を調節するシグナル伝達に関わることがそれぞれ明らかとなった。いずれも細胞周期への関与を示すものであり、後者では神経機能への関わりもあると考えられる。
【0119】
また、配列番号13のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ配列番号13のアミノ酸番号39〜297番に示されるアミノ酸配列にプロテインキナーゼドメインの特徴を示す配列(Pfamにpkinaseとしてエントリーされるアミノ酸配列)を見出した。タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE(Nucleic Acid Res., 30: 235-8 (2002))によれば、このプロテインキナーゼドメインのうち、アミノ酸番号45〜69番はATP region(ATP結合部位)、アミノ酸番号158〜171番はST region(基質のセリン/スレオニンをリン酸化する部位)であり、セリン/スレオニンプロテインキナーゼの機能的に重要な部位を保持しているため、キナーゼ活性を有すると考えられる。またHMMPFAMによる検索では、アミノ酸番号511〜585番に示されるアミノ酸配列にPOLO box duplicated regionの特徴を示す配列(PfamにPOLO_boxとしてエントリーされるアミノ酸配列)も見出された。POLO boxは細胞周期、特にM期やサイトカインのはたらきに関わるセリン/スレオニンプロテインキナーゼのサブグループであることが知られている。更にタンパク質の細胞内局在の予測プログラムであるPSORTII(Trends Biochem. Sci., 24: 34-6 (1999))による解析を行ったところ、本タンパク質の細胞内での局在の確率はそれぞれ細胞質は43.5%、核は26.1%、ミトコンドリアは17.4%、液胞は4.3%、原形質膜4.3%、ペルオキシゾーム4.3%であることがわかった。よって本タンパク質は細胞質に存在する確率が最も高いことがわかった。
【0120】
一方、ゲノム情報を得るため、ヒトcDNAをヒトゲノム配列へ写像するソフトウエアsim4(Genome Res., 8: 976-74 (1998))を用い、本DNAのゲノムへの写像を試みたが、ヒト染色体のいずれにも写像されなかった。これは本DNAがヒトゲノムのドラフト配列中には存在せず、存在の予測もできないことを意味する。しかし我々は検討を重ねることにより、今回初めて本DNAをクローニングすることに成功した。以上より本タンパク質は細胞周期や神経機能などに関わる機能を有する新規セリン/スレオニンプロテインキナーゼであることが推測された。また本DNAは、副腎よりクローニングされており、本タンパク質は該組織・細胞特有の発生、分化、また機能や疾患に関連する可能性が推測された。
【0121】
(2)c−testi2053667(配列番号2、14)
c−testi2053667(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号2に示すように、2135塩基から成り、そのうち塩基番号36番から1454番までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、472アミノ酸残基から成る (配列番号14)。配列番号14のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、(i)データベース登録記号AY061183、LD14901p (fluit fly)がヒットしていた。その内容として、AY061183は790アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号325〜788番が、配列番号14に記載のアミノ酸配列のアミノ酸番号7〜468番と、E-value:5×10-135かつ471アミノ酸残基にわたり52%の一致度をもつことが認められた。また(ii)データベース登録記号P36102、PAB-dependent poly(A)-specific ribonuclease subunit PAN3(Yeast)がヒットしていた。その内容として、P36102は679アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号231〜677番が、配列番号14に記載のアミノ酸配列のアミノ酸番号6〜464番と、E-value:1×10-47かつ482アミノ酸残基にわたり26%の一致度をもつことが認められた。さらに(iii)データベース登録記号AB062450、NEK7(Human)がヒットしていた。その内容として、AB062450は302アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号35〜182番が、配列番号14に記載のアミノ酸配列のアミノ酸番号78〜246番と、E-value:4×10-7でかつ173アミノ酸残基にわたり24%の一致度をもつことが認められた。これらの結果より配列番号14に示したアミノ酸配列からなるタンパク質はセリン/スレオニンプロテインキナーゼであることが推測された。上記(ii)のタンパク質は、データベース中の文献情報(Mol. Cell. Biol., 16: 5744-5753 (1996))から生体内でmRNAのポリAを短化する機能に関わることが、さらに上記(iii)のタンパク質は、データベース中の文献情報(Genomics, 68: 187-196 (2000))から有糸分裂の調節に関わることがそれぞれ明らかとなった。いずれも細胞周期への関与を示すものである。
【0122】
また、配列番号14のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ配列番号14のアミノ酸番号87〜334に示されるアミノ酸配列にプロテインキナーゼドメインの特徴を示す配列(Pfamにpkinaseとしてエントリーされるアミノ酸配列)を見出した。更にタンパク質の細胞内局在の予測プログラムであるPSORTII(Trends Biochem. Sci., 24: 34-6 (1999))よる解析を行ったところ、本タンパク質の細胞内での局在の確率はそれぞれ細胞質は43.5%、核は30.4%、ミトコンドリアは17.4%、ゴルジ体は4.3%、小胞体は4.3%であることがわかった。よって本タンパク質は細胞質に存在する確率が最も高いことがわかった。これらのことから本タンパク質は細胞周期に関わる機能を有する新規セリン/スレオニンプロテインキナーゼであることが推定された。
【0123】
本タンパク質を実施例4(1)の無細胞タンパク質合成系で発現させたところ、実施例4(2)に記載の方法でATP消費活性(24unit/day)が認められたことから本タンパク質がキナーゼであることが示された。
【0124】
また本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics, 4: 332-3 (1993))に対してBLAST検索を行い、E-value≦10-50でヒットしたヒトESTが存在する組織を抽出したところ、正常な乳腺・免疫系・腸、癌化した子宮・精巣であった。更に本DNAは精巣由来のcDNAライブラリーからクローニングされた。本蛋白質はこれらの組織や細胞に特有の機能や疾患、例えば乳癌、悪性リンパ腫、白血病、大腸癌、子宮癌、精巣癌などの癌や、炎症性疾患、免疫系疾患、アレルギー疾患、不妊などに関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての有用性が見込まれる。
【0125】
(3)c−uteru2008019(配列番号3、15)
c−uteru2008019(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号3に示すように、3165塩基からなり、そのうち塩基番号401番から1960番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、519アミノ酸残基からなる(配列番号15)。配列番号15のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中の、データベース登録記号BC010640、serine/threonine kinase 3(Ste20、yeast homolog)(Human)がE-value:0.0、かつ483アミノ酸残基にわたり100%の一致度でヒットした。BC010640は491アミノ酸残基からなり、そのアミノ酸配列中のアミノ酸番号9〜491番が、配列番号15に記載のアミノ酸配列のアミノ酸番号37〜519番と一致した。両者の配列の違いは、本タンパク質のN末端36残基とBC010640のN末端8残基である(図1)。
【0126】
図1に示すように、配列番号15のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号55〜306番に示されるアミノ酸配列にプロテインキナーゼドメインの特徴を示す配列(Pfamにpkinaseとしてエントリーされるアミノ酸配列)を見出した。タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE(Nucleic Acids Res., 30: 235-8. (2002))によれば、このプロテインキナーゼドメインのうち、アミノ酸番号61〜85番はATP region(ATPの結合部位)である。
【0127】
本DNAとBC010640cDNAとのエクソン使用状況を比較するためにsim4(Genome Res., 8: 967-74 (1998))を用いてゲノム配列へのアライメントを行った(図2)。その結果、本DNAはヒト第8番染色体上の13個のエクソンにマッピングされ、BC010640はその第4〜13エクソンを共有するが、別の第3’エクソンをもつ。本DNAとBC010640は翻訳開始点を含むエクソンを異にするために、両タンパク質のN末アミノ酸配列に違いを生じていることが判明した。この違いが酵素活性や、他のタンパク質との結合・相互作用、発現組織に差異をもたらす可能性が考えられる。以上から、本タンパク質はBC010640、serine/threonine kinase 3(Ste20、 yeast homolog)(Human)のスプライシングバリアントである。
【0128】
タンパク質の細胞内局在の予測プログラムPSORTII(Trends Biochem. Sci., 24: 34-6 (1999))による解析を行ったところ、本タンパク質の細胞内での局在確率は、核69.6%、細胞質17.4%、ペルオキシソーム13.0%であることがわかった。BC010640は、出芽酵母Ste20のホモログであるヒトSte20様キナーゼ(MST)のメンバーであるが、MSTはカスパーゼの基質であり、アポトーシス感受性を増加させること(J. Biol. Chem., 276: 19276-19285 (2001))が知られている。以上から、本タンパク質はアポトーシスに関わるSte20様のセリン/スレオニンプロテインキナーゼと考えられる。
【0129】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser(http://www.ensembl.org/Homo_sapiens/diseaseview)によると、写像された本DNAの第8番染色体上の位置(q22.2)を含むq22−q23にコーエン症候群、q22.2にクリッペル‐フェイル症候群(喉頭部の奇形を伴う)の原因遺伝子座が存在することがわかり、本DNAがこれらの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断薬に応用できる可能性が推測された。本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics, 4: 332-3 (1993))に対してBLAST検索を行い、E-value≦10-50でヒットしたヒトESTが5個以上ある組織を抽出したところ、正常な骨髄・腎臓・前立腺・胎盤・全脳、癌化した子宮という結果を得た。また、本DNAは子宮由来ライブラリーからクローニングされた。本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば子宮癌・前立腺癌・脳腫瘍・骨髄腫・白血病・悪性リンパ腫などの癌、アルツハイマー病・パーキンソン病・ハンチントン舞踏病などの神経変性疾患、うつ病・精神分裂病などの中枢疾患、自己免疫性疾患、炎症性疾患、アレルギー疾患、糸球体腎炎・ネフローゼ症候群・腎不全などの腎疾患、ゴーシェ病などの骨髄疾患、等の疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0130】
(4)c−brcan2018240(配列番号4、16)
c−brcan2018240(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号4に示すように、2817塩基からなり、そのうち塩基番号42番から1733番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、563アミノ酸残基からなる(配列番号16)。配列番号16のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中のデータベース登録記号AX405737(unnamed ORF)およびWO02/22660号公報に記載されているアミノ酸配列が、E-value=0.0、かつ514アミノ酸残基にわたり95%の一致度でヒットした。BLAST検索のアライメントから本タンパク質は、AX405737のアミノ酸番号35〜51番の17残基、489番の1残基に該当するアミノ酸を欠失しており、AX405737のアミノ酸番号510番、511番、512番、513番に該当するアミノ酸にそれぞれグリシン/アラニン、イソロイシン/アラニン、セリン/ロイシン、アラニン/グリシンの置換が存在することがわかった(図3)。また本DNAは、AX405737の塩基番号209〜259番の51塩基、塩基番号1569〜1571番の3塩基に該当する塩基を欠失し、AX405737の塩基番号1634/1635番に該当する位置に34塩基が挿入されている。この挿入によってフレームがシフトし、本タンパク質のC末端の67残基、AX405737のC末端の64残基に違いが生じている。
【0131】
配列番号16のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号132〜379番に示されるアミノ酸配列にプロテインキナーゼドメインの特徴を示す配列(Pfamにpkinaseとしてエントリーされるアミノ酸配列)を見出した。また配列番号16のアミノ酸番号6〜105番に示されるアミノ酸配列にPXドメインの特徴を示す配列(PfamにPXとしてエントリーされるアミノ酸配列)を見出した。PXドメインはphosphoinositide結合ドメインであり、細胞内シグナル伝達に関与することが知られている。本タンパク質はAX405737と比較してPXドメインの一部を欠失しているため、AX405737とは異なる相互作用を有することが考えられる。
【0132】
cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res., 8: 967-74 (1998))を用い、本DNAとAX405737のcDNA配列をゲノム配列にマッピングしたところ、データベース登録記号AC135507、ヒト第3番染色体のクローンRP11−802023上に、本DNAは18個のエクソンに、AX405737は19個のエクソンにアラインされた(図4)。本DNAの第2から第16エクソンに該当するエクソンはAX405737にも存在するが、本DNAは第1エクソンと第2エクソンの間にエクソンを1つ欠失している。また本DNAの第17エクソンはAX405737では欠失しているが、この領域は34塩基からなるためフレームがシフトし、両者のC末端のアミノ酸配列に違いが生じている。
【0133】
実施例4(1)に記載の無細胞タンパク質合成系で発現させた本タンパク質を機能評価したところ、実施例4(2)に示した方法で本タンパク質のATP消費活性(73unit/day)が検出できた。さらに、実施例4(3)に記すように合成ペプチドを基質としたリン酸基転移活性を逆相HPLCで分析した結果(図22。矢印は変化した溶出位置を示す。)、Syntide2のリン酸化活性(201.1unit/day)を確認し、本タンパク質はキナーゼであることが明確となった。以上から、配列番号4の本DNAはAX405737およびWO02/22660号公報に記載されている塩基配列のスプライシングバリアントであり、キナーゼをコードしていることがわかった。両者はN末部C末部のアミノ酸配列が異なることから、他のタンパク質との結合や相互作用、発現組織などが異なる可能性がある。
【0134】
タンパク質の細胞内局在の予測プログラムであるPSORTII(Trends Biochem. Sci., 24: 34-6 (1999))による解析を行ったところ、本タンパク質の細胞内での局在の確率は、核78.3%、細胞質8.7%、ミトコンドリア8.7%であり、核への局在確率が高いため、本タンパク質は細胞の増殖や分化、細胞周期、転写因子の制御などに関わる可能性がある。
【0135】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser(http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第3番染色体上の位置(p14.3)を含むp21−p14に常染色体劣性難聴の原因遺伝子座が存在することがわかり、本DNAがこれらの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異が該疾患の診断薬に応用できる可能性が予想された。本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics, 4: 332-3 (1993))に対してBLAST検索を行い、E-value≦10-50でヒットしたヒトESTが5個以上ある組織を抽出したところ、正常な免疫系・リンパ系・骨格筋・脳、癌化した免疫系・精巣という結果を得た。また本DNAは脳の尾状核由来cDNAライブラリーからクローニングされた。本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えばリンパ腫・白血病・脳腫瘍・精巣癌などの癌や、筋ジストロフィー・ミオパチー・テタニー・重症筋無力症などの骨格筋疾患、免疫系疾患、不妊症、常染色体劣性難聴などに関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての有用性が見込まれる。
【0136】
(5)c−brace3003920(配列番号5、17)
c−brace3003920(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号5に示すように、5342塩基からなり、そのうち塩基番号371番から3874番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、1167アミノ酸残基からなる(配列番号17)。配列番号17のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中のデータベース登録記号AX262516(unnamed ORF)およびWO01/73050号公報に記載されているアミノ酸配列が、E-value:0.0、かつ1160アミノ酸残基にわたり99%の一致度でヒットした。このBLAST検索のアライメントから本タンパク質は、AX262516のアミノ酸番号309番、456番、557番に該当するアミノ酸にそれぞれスレオニン/イソロイシン、スレオニン/アラニン、リジン/アスパラギンの置換が存在し、また本タンパク質のN末端3残基とAX262516のN末端72残基が異なり、本タンパク質のC末端4残基とAX262516のC末端12残基が異なることがわかった(図5)。また本DNAは、AX262516の塩基番号386〜533番の148塩基に該当する塩基を欠失している。
【0137】
配列番号17のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号1〜212番に示されるアミノ酸配列にプロテインキナーゼドメインの特徴を示す配列(Pfamにpkinaseとしてエントリーされるアミノ酸配列)を見出した。タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE(Nucleic Acids Res., 30: 235-8 (2002))によれば、AX262516のプロテインキナーゼドメインのうち、アミノ酸番号27〜51はATP region(ATP結合部位)であった。この領域はAX262516の第3’エクソンに該当し、本DNAでは欠失している。
【0138】
cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res., 8: 967-74 (1998))を用い、本DNAおよびAX262516のcDNA配列をゲノム配列にマッピングしたところ、本DNA、AX262516はともにヒト第15番染色体上に15個のエクソンがアラインされた(図6)。本DNAは、第3と第4エクソンの間にAX262516が有するエクソン部を1個欠失しており、AX262516は本DNAの第1エクソンに該当するエクソンをもたない。本DNAは第3エクソンの3’末端寄りから翻訳領域が開始しているが、AX262516は本DNAの第3エクソンの中央付近から開始しており、両者のN末部の読み枠が異なる。AX262516は第3エクソン相当部の直後に本DNAには存在しない148塩基からなる挿入を有するため、フレームシフトを生じ、第4エクソン相当部分以降の翻訳フレームは両者で一致する。また、AX262516の翻訳終止コドンの直ぐ上流に位置する塩基番号4006番と4007番の間に該当する本DNAの位置(塩基番号3855)に1塩基(シトシン)が挿入されたためにフレームシフトが生じた結果、本タンパク質のC末部4アミノ酸残基と、AX262516タンパク質のC末部12アミノ酸残基が異なっている。ゲノム配列中には本挿入は見られないが、EST配列中には本挿入のあるクローンと、無いクローンの両方が登録されていることから、この違いは個体差と思われる。以上から、本タンパク質はAX262516およびWO01/73050号公報に記載されているアミノ酸配列のバリアントであり、プロテインキナーゼであるか、またはプロテインキナーゼの内在性の阻害物質であることが推定された。
【0139】
タンパク質の細胞内局在の予測プログラムであるPSORTII(Trends Biochem. Sci., 24: 34-6 (1999))による解析を行ったところ、本タンパク質の細胞内での局在の確率は、核91.3%、細胞質4.3%、ペルオキシソーム4.3%であり、AX262516の細胞内での局在確率は、核69.6%、細胞質17.4%、細胞骨格4.3%、ミトコンドリア4.3%、ペルオキシソーム4.3%であった。本タンパク質はAX262516と比較して核への分布の確率が増加することから、本タンパク質は核内で細胞増殖・分化、細胞周期、転写因子のリン酸化制御などに関与することが考えられるが、AX262516とは異なる機能を有することが予測される。
【0140】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser(http://www.ensembl.org/Homo_sapiens/diseaseview)により、本DNAが写像された第15番染色体上の位置(q15.2)を包含するq15.1−q21.1に筋萎縮性側索硬化症(ALS5)、q15.1−q15.3に先天性赤血球異形成貧血の原因遺伝子座が存在することがわかり、これらの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断薬に応用できる可能性が予想された。本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics, 4: 332-3 (1993))に対してBLAST検索を行い、E-value≦10-50でヒットしたヒトESTが5個以上ある組織を抽出したところ、正常な免疫系・リンパ系組織、癌化した肺という結果を得た。また本DNAは小脳よりクローニングされた。よって本タンパク質はこれらの組織や細胞に特有の機能や疾患、たとえばリンパ腫・白血病・骨髄腫・肺癌・脳腫瘍などの癌や、脊髄小脳変性症、炎症性疾患、アレルギー疾患、自己免疫疾患、筋萎縮性側索硬化症、先天性赤血球異形成貧血などに関わる可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての有用性が見込まれる。
【0141】
(6)c−brace3038687(配列番号6、18)
c−brace3038687(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号6に示すように、4938塩基から成り、そのうち塩基番号81番から2720番までがオープンリーディングフレーム(終止コドンを含む)で879アミノ酸残基(配列番号18)のタンパク質をコードすると推測される。配列番号18のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)および特許データベースGENESEQ(アミノ酸配列)中の、WO98/22507号公報にSEQ ID NO.11として記載されているHuman receptor tyrosine kinase LMR1_hがヒットした。Human LMR1_hは1383アミノ酸からなる受容体型チロシンプロテインキナーゼであり、そのアミノ酸配列中のアミノ酸番号10〜905番が、配列番号18に記載のアミノ酸配列のアミノ酸番号1〜860番と、E-value:0で897アミノ酸残基にわたり94%の一致度をもつことが認められた。
【0142】
WO98/22507号公報にSEQ ID NO.2として記載されているヒトLMR1_hの遺伝子(GENESEQデータベース塩基配列登録記号AAV32449)は5267塩基からなりその塩基番号515〜4138番のオープンリーディングフレームが1207アミノ酸のタンパク質(LMR1_h)をコードしうる。しかし該公報に記載されているアミノ酸配列(GENESEQデータベースアミノ酸配列登録記号AAW48842)では、ラットの上流配列176アミノ酸を連結したタンパク質配列を仮想合成し1383アミノ酸からなるタンパク質を開示している(これをLMR1_r+hとよぶ)(図7)。これはヒト配列とラット配列の比較から、ヒト配列がN末端に達していないとの推測に立っており、完全長のヒトLMRタンパク質はまだ報告されていない。一方、WO98/22507号公報にSEQ ID NO.1として記載されているラットLMR1_r遺伝子(AAV32448)は2572塩基からなり最大のオープンリーディングフレームをとると塩基番号13〜2571番で終止コドンがなく、この部分のアミノ酸残基数は853である。しかし公報にはこの塩基配列の塩基番号13〜2556番に由来する848アミノ酸からなるタンパク質(LMR1_r)を記載している(AAW48841)。ラットのLMR1_r(AAW48841)はC末端が短いが、これは終止コドンが不明のためで不完全長であることを示している。以上のように既報のLMRタンパク質は、ヒトLMR1_hはN末端が不完全で、ラットLMR1_rはC末端が不完全であり、LMR1_r+hでその全長を推測しているに過ぎない。
【0143】
配列番号18のアミノ酸配列はLMR1_r+hのアミノ酸配列と比較して以下の点が異なる。
(a)本タンパク質にはLMR1_r+hのN末端9アミノ酸を欠くが、この領域の配列の差異はヒトとラットの種差を反映したと考えられる。なお、後述のゲノムマッピングから、本cDNAの翻訳開始近傍の配列はヒトゲノム配列と一致している。
(b)本タンパク質のアミノ酸番号467番、468番の間にLMR1_r+hのアミノ酸番号477〜511番に相当する36アミノ酸の欠失がある。これはエクソン内スプライシングの結果である。
(c)本タンパク質のアミノ酸番号860番以降(LMR1_r+hのアミノ酸番号906番以降)の配列が異なる。
LMR1は細胞外ドメインをほとんど持たない膜受容体型チロシンキナーゼである。本タンパク質を膜貫通領域予測ソフトウエアTMpred(Biol. Chem. Hoppe-Seyler, 374: 166 (1993))で解析すると、アミノ酸番号32〜53番にLAVVAVSFSG LFAVIVLMLA CLからなる膜貫通領域がヒットした。また、HMMPFAM検索を行うと、本タンパク質のアミノ酸番号125〜395番にE-value=3.3×10-47でプロテインキナーゼドメインがヒットした。本タンパク質とLMR1_hは、細胞内プロテインキナーゼドメインよりもC末端側に違いが存在することから、本タンパク質はLMR1_hと異なるシグナル伝達に関与する可能性が有る。
【0144】
本DNA配列のゲノム上の位置をNRNEE塩基配列データベース(EMBL、GenBank、およびDDBJから作成されたESTを除く重複のない塩基配列データベース)で検索すると、ヒト第17番染色体に由来するRPCI-13 Human Female BAC(データベース登録記号AC129919)などにマップされた。そこでゲノム配列であるAC129919の配列上で、sim4(Genome Res., 8: 967-74 (1998))を用いて、本DNAと、LMR1_hをコードするDNA(WO98/22507号公報)とを比較した(図8)。その結果、本DNAはエクソン16個からなり、LMR1_hは本DNAの第11、第12、第13エクソンを含む長いエクソンをもっていた。すなわち、本DNAは第11と第12エクソンの間のスプライシング(塩基番号1481/1482番)により108塩基36アミノ酸の欠失を、第12と第13エクソンの間の263塩基のスプライシング(塩基番号2660/2661番)により88アミノ酸の欠失とフレームシフトを生じ、スプライシング後の第13エクソン(塩基番号2661〜3444番)で19アミノ酸を付加して翻訳を終了する。一方、LMR1_hは翻訳が継続しC末端の長いタンパク質を生じる。また、LMR1_hの5’端は本DNAよりも100塩基分短いため、本DNAのATG翻訳開始コドンを有さず、LMR1_h自身でオープンリーディングフレームを予測すると、下流の第5エクソンから翻訳開始することになる(図8)。以上から、ヒトLMR1_hはN末端の不完全クローンであるが、本タンパク質はこのバリアントであり完全長であると考えられる。
【0145】
本タンパク質を実施例4(1)の小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4(2)によってATP消費活性が認められ、実施例4(3)ではSyntide2を基質としてリン酸基転移によるHPLCのバンドシフトが認められたことからキナーゼであることが証明された(図23)。
【0146】
本DNAの特徴である第11、第12、第13エクソンをプローブにしてdbEST(Nature Genetics, 4: 332-3 (1993))に対して検索すると、成人のメラノーマ由来AL120847が本DNA配列の塩基番号1084〜1482番(第10、第11、第12エクソンに相当)にヒットした。また、視床下部由来ABI600711が本DNAの1130〜1805番(第10、第11、第12エクソンに相当)にヒットした。このことは第11、第12エクソンの間をスプライスアウトする分子がメラノーマや視床下部に存在することを示している。WO98/22507号公報によるとLMR1は神経細胞に発現が限局されている。本DNAは小脳由来cDNAライブラリーから単離され細胞内ドメインに異なる配列をもつ完全長LMR1である。このことから本タンパク質は脳腫瘍・神経芽腫・黒色腫などの癌、アルツハイマー病・パーキンソン病・脊髄小脳変性症などの神経変性疾患、うつ病・不安症・精神分裂病などの中枢疾患、糖尿病などの内分泌疾患、炎症などに関与する可能性があり、これらの疾患の診断薬や治療薬のターゲットしての利用が考えられる。
【0147】
(7)c−brace3050764(配列番号7、19)
c−brace3050764(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号7に示すように、3346塩基からなり、そのうち塩基番号1744番から2685番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、313アミノ酸残基からなる(配列番号19)。配列番号19のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中の、データベース登録記号Q1513に登録されているcell division kinase10/PISSLRE(cdk10、Human)がE-value =5×10 -179 で306アミノ酸にわたり99%の一致度でヒットした(図9)。cdk10タンパク質は360アミノ酸残基からなりアミノ酸番号39〜323番にプロテインキナーゼドメインをもつcyclin dependent kinaseである。そのアミノ酸番号80〜86番に増殖抑制因子が結合するPISSLRE配列がある。cdk10のアミノ酸配列番号55〜360番が本タンパク質のアミノ酸番号8〜313番に一致するため、本タンパク質はcdk10とN末端が異なるバリアントと考えられた。
【0148】
配列番号19のアミノ酸配列に対してHMMPFAM検索を行うとアミノ酸番号8〜276番にプロテインキナーゼドメインが見出された。これはcdk10のプロテインキナーゼドメイン(アミノ酸番号39〜323番)と比較するとN末端側が短い。
【0149】
cdk10をコードするゲノム配列が既知(AJ010341)であるので、そのCDS部分と本DNAをヒト第16番染色体由来の配列AC103888の上でsim4(Genome Res., 8: 967-74 (1998))を用いて比較しエクソンの違いを調べた(図10)。その結果、本DNAはエクソン12個からなり、cdk10のCDSはその第2〜12エクソンを共有し、第1と第2エクソンの間に別のエクソン2個(第1'と第1媒エクソン)をもっていた。本DNAの翻訳開始は第1エクソンにあり、cdk10は第1'エクソンから翻訳開始する。このように両タンパク質のN末アミノ酸配列の違いはそれをコードするエクソンが異なることによる。本DNAはcdk10のスプライシングバリアントである。
【0150】
本タンパク質を実施例4(1)の小麦胚芽無細胞タンパク質合成系で発現させたところ、実施例4(2)の方法でATP消費活性があること(39unit/day)、実施例4(3)の方法でsyntide2を基質としてリン酸基転移によるHPLCのバンドシフトが認められた(図24)(159unit/day)ことから本タンパク質はキナーゼであることが示された。本タンパク質とcdk10はプロテインキナーゼドメインのN末端部に違いがあることから基質特異性や活性が異なる可能性がある。
【0151】
cdk10タンパク質は細胞周期のG2からMへの進展(progression)に関与し、過剰発現により生育が抑制されることが報告されている(Cancer Res., 55: 3992-3995 (1995))。そのタンパク質は成人組織でユビキタスに発現しているが、特に最終分化を遂げた細胞で高いため、癌抑制因子ではないかと予想されたが、乳癌での変異は認められておらず(Genomics, 56: 90-97 (1999))、その機能の詳細は不明である。しかし、本タンパク質はcdk10と異なるN末端配列をもっており、異なる発現制御を受けている可能性があることから、細胞増殖、分化、発癌、癌抑制機能への関与、免疫・炎症、神経変性疾患などの診断薬や治療薬のターゲットとしての利用が考えられる。
【0152】
(8)c−bramy3018357(配列番号8、20)
c−bramy3018357(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号8に示すように、3576塩基からなり、そのうち塩基番号254番から2554番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、766アミノ酸残基からなる(配列番号20)。配列番号20のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中のデータベース登録記号AX327993およびWO01/81588号公報にSEQ ID NO.2として記載されているunnamed ORFがE-value=0で660アミノ酸にわたって94%の一致度でヒットした。この配列は674アミノ酸からなり、そのアミノ酸番号31〜646が本タンパク質のアミノ酸番号77〜692番と一致した。本タンパク質はAX327993とN末端、C末端を異にするバリアントと思われた(図11)。
【0153】
配列番号20のアミノ酸配列をHMMPFAMによって検索を行うと、アミノ酸番号77〜316番にプロテインキナーゼドメインが検出され、PROSITE(Nucleic Acids Res., 30: 235-8 (2002))検索によりアミノ酸番号183〜196番にセリン/スレオニンプロテインキナーゼに特有の配列が見出された。他方、AX327993をHMMPFAMによってプロテインキナーゼドメインを検索すると、アミノ酸番号19〜270番に存在することが予想された。すなわちプロテインキナーゼドメインは両者のN末端配列の異なる領域にかかっており、基質特異性や活性が異なることが推測される。
【0154】
本DNAをNRNEE塩基配列データベース(EMBL、GenBank、およびDDBJから作成されたESTを除く重複のない塩基配列データベース)に対して検索するとAC116022に登録されるヒト第11番染色体ゲノム配列に由来するクローンCTD−2583L21がヒットした。そこで第11番染色体上でsim4(Genome Res., 8: 967-74 (1998))を用い本DNAとblast top hitであるAX327993をアライメントしエクソン構造を比較した(図12)。本DNAはエクソン21個からなっていたが、AX327993は
(a)本DNAの第2〜20エクソンを共有し、
(b)本DNAの第1エクソンより5'側に別の第1'エクソンをもち
(c)本DNAの第18と第19エクソンの間に別の第18'エクソンを有し、
(d)本DNAの第21エクソンに相当する領域を欠く。
本DNAに由来するORFは第1〜20エクソンに存在し、AX327993のORFは第1'、第2〜18、第18'エクソンに存在する。すなわち、両者のN末端の違いは異なるエクソンから翻訳開始することに起因し、C末端の違いは本DNAが第18'エクソンをスキップして第19エクソン以降下流まで翻訳が続くのに対し、AX327993では第18'エクソンで翻訳が終了することによる。以上から、本DNAとAX327993は同一遺伝子からのスプライシングバリアントであることが判明した。
【0155】
本タンパク質を実施例4(1)の無細胞タンパク質合成系で発現させたところ、実施例4(2)に記載の方法でATP消費活性(69unit/day)が認められ、実施例4(3)に記載の方法でsyntide2を基質としてリン酸基の転移によるバンドシフトが認められた(図25)(432unit/day)ことから本タンパク質がキナーゼであることが示された。
【0156】
本DNAは脳の扁桃から単離されたがその発現分布を調べるためヒトdbEST(Nature Genetics, 4: 332-3 (1993))に対して相同性検索を行うと、正常組織ではE=10-100以下に眼由来の3クローンと胎児脳由来の1クローンがヒットした。以上の事から本DNAおよび本タンパク質は脳の発生分化における機能、不安症、うつ病、精神分裂病、神経変性疾患、癌、炎症、糖尿病などの診断薬や治療薬、あるいは眼科領域(緑内障、白内障、網膜症など)の診断薬や治療薬のターゲットとしての利用が考えられる。
【0157】
(9)c−brawh3022866(配列番号9、21)
c−brawh3022866(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号9に示すように、4547塩基からなり、そのうち塩基番号32番から3898番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、1288アミノ酸残基からなる(配列番号21)。配列番号21のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、ヒト配列の中ではNRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中および特許データベースGENESEQ(アミノ酸配列)中に、WO01/38503号公報にSEQID NO.54として記載されているヒトプロテインキナーゼ(SGK040、909アミノ酸)がE-value=0、945アミノ酸にわたって88%の一致度でヒットした。配列番号21のアミノ酸配列とSGK040のアミノ酸配列を比較すると、本タンパク質のアミノ酸番号310〜407番、408〜521番、571〜683番、684〜1192番が、SGK040のアミノ酸番号20〜117番、130〜243番、244〜356番、401〜909番とそれぞれ一致する(図13)。すなわち本タンパク質は
(a)SGK040のアミノ酸番号118〜129番に相当する12アミノ酸を欠失し、
(b)SGK040のアミノ酸番号243番と244番の間に49アミノ酸の挿入をもち
(c)SGK040のアミノ酸番号357〜400番の44アミノ酸を欠失し、
(d)N末端のアミノ酸配列309アミノ酸は異なっており、
(e)C末端に関しては本タンパク質が96アミノ酸長い。
【0158】
配列番号21のアミノ酸配列をHMMPFAM検索した結果、アミノ酸番号684〜926番にプロテインキナーゼドメインが、アミノ酸番号684〜705番にATP binding regionが予想された。SGK040にはプロテインキナーゼドメインの上流に隣接して44アミノ酸の挿入がある。このことから本タンパク質はSGK040と基質特異性あるいは活性に違いがある可能性がある。また、本タンパク質のアミノ酸番号360〜388番にはロイシンが7アミノ酸ごとに5回繰り返されるロイシンジッパー構造があり、タンパク質相互作用あるいは本タンパク質が2量体を形成する可能性が有る。
【0159】
両DNAのエクソン構造を明らかにするためにsim4(Genome Res., 8: 967-74 (1998))による写像をおこなった(図14)。その結果 本DNAの塩基番号16〜4547がヒト第12番染色体上にアラインされ23個のエクソンからなることがわかった。一方SGK040は塩基番号52〜2730番がアラインされ、エクソン18個からなっていた。SGK040は
(a)本DNAの第7と第8エクソンの間に別の第7'エクソンをもち、
(b)本DNAの第10エクソンを欠失し
(c)本DNAの第12と第13エクソンの間に別の第12'エクソンをもち
(d)本DNAの第22エクソンに続いてゲノム上にストップコドンTAAが出現し翻訳域が終了する。一方、本DNAでは第23エクソンで翻訳が終了する。
(e)両者の5'配列はこのゲノム配列の中では位置が確定できないが、本DNAの塩基番号1〜951番、SGK040の塩基番号1〜58番に共通配列がないことから両者は別のエクソンに由来すると推定される。
このゲノム構造からタンパク質の構造の違いを説明すると、以下のようになる。
(a)本DNAは第7'エクソンをスキップすることでアミノ酸12個の欠失を,
(b)第10エクソンを有することでアミノ酸49個の挿入を、
(c)第12'エクソンをスキップすることでアミノ酸44個の欠失を、
(d)第23エクソンを持つことでC末端に96アミノ酸長い配列をもつ。
(e)また、相異なる5'エクソンを持つことでN末端アミノ酸配列が異なる。
以上から、本DNAとSGK040は同一遺伝子からのスプライシングバリアントであることが判明した。
【0160】
本タンパク質を、実施例4(1)の無細胞タンパク質合成系で発現させたところ、実施例4(2)によりATP消費活性(217unit/day)が認められ、実施例4(3)によりsyntide2を基質としてリン酸基転移によるHPLCでのバンドシフトが認められた(図26)(458unit/day)ことからキナーゼであることが確認された。
【0161】
本DNAは脳に由来するが、dbEST(Nature Genetics, 4: 332-3 (1993))に対するBLAST検索では免疫系、皮膚、腎臓、脳、副腎などで全域にわたってヒットクローンが散見される。PSORTII(Trends Biochem. Sci., 24: 34-6 (1999))による細胞内局在予測によると、本タンパク質には核移行シグナル候補配列が5箇所あり、RCC(regulator of chromosome condensation signature)であるIGTGGGHILLLがアミノ酸番号1225〜1235番に見出されることから、本タンパク質は核に存在し染色体の凝集への関与が予想される。したがって細胞分裂にかかわる疾患たとえば癌などの診断治療、また、その発現組織情報から免疫炎症(たとえば自己免疫疾患、腎炎など)、高血圧、神経変性疾患などの診断薬や治療薬のターゲットとしての利用が考えられる。
【0162】
(10)c−brawh3043827(配列番号10、22)
c−brawh3043827(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号10に示すように、4222塩基からなり、そのうち塩基番号146番から3406番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、1086アミノ酸残基からなる(配列番号22)。配列番号22のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中の、データベース登録記号L13738に登録されている1036アミノ酸のHomo sapiens activated p21cdc42Hs kinase(ACK1)がE-value=0、1053アミノ酸にわたり95%の一致度でヒットした。本タンパク質は、
(a)アミノ酸番号64〜577番がACK1のアミノ酸番号1〜513番と一致、
(b)アミノ酸番号578〜592番に15アミノ酸の挿入を持ち、
(c)アミノ酸番号593〜1042番がACK1のアミノ酸番号514〜962番に相当し、
(d)アミノ酸番号1042/1043番の間に30アミノ酸の欠失をもち、
(e)アミノ酸番号1043〜1086番がACK1のアミノ酸番号993〜1036番と一致する(図15)。
【0163】
すなわち本タンパク質は、
(a)ACK1よりN末端が63アミノ酸長く、
(b)ACK1のアミノ酸番号513と514の間に15アミノ酸の挿入(本タンパク質のアミノ酸番号578〜592番)をもち、
(c)アミノ酸番号1042番と1043番の間に30アミノ酸の欠失(ACK1のアミノ酸番号963〜992番)をもつバリアントである。
【0164】
スプライシングバリアントであることを塩基配列からあきらかにするために、本DNAとACK1をコードするcDNA(L13738)のゲノム上での位置についてsim4(Genome Res., 8: 967-74 (1998))で解析を行った(図16)。その結果、本DNAの塩基番号311〜4222番はヒト第3番染色体に由来するゲノム配列AC112775上にアラインされ、この領域に関しては14個のエクソンにより規定されていた。
(a)本DNAはACK1にない第11エクソンをもつことで15アミノ酸の挿入をもつ。
(b)ACK1は本DNAの第12と第13エクソンの間に別の第12' エクソンの挿入をもつ。これは本タンパク質にとって30アミノ酸の欠失である。
(c)両者とも5'末端がゲノムにアラインされないためN末端に相当する配列をコードするエクソンの使用状況が不明であるが、本DNAの塩基番号1〜310番、ACK1の塩基番号1〜597番に共通部分がないことから両者は別のエクソンに規定されていると考えられる。本DNAのオープンリーディングフレームはアラインされていない上流のエクソンから開始しておりACK1よりN末端が63アミノ酸長い。また、ACK1のcDNA(L13738)をマッピングすると第12エクソンに3塩基欠失による1アミノ酸欠失、および近傍の2個所合計3塩基の欠失によるアミノ酸置換と1アミノ酸の欠失が存在するが、本DNAはゲノムを反映する配列となっていた(図16)。
【0165】
ACK1にはN末端からチロシンプロテインキナーゼドメイン、SH3ドメイン、cdc42 binding domain、clathrin binding domainがある。一方、配列番号22のアミノ酸配列をHMMPFAM検索した結果、プロテインキナーゼドメインがアミノ酸番号180〜450番に、SH3ドメインがアミノ酸番号454〜509番に、また論文情報(Nature, 363: 365-367 (1993))との比較からcdc42 binding regionがアミノ酸番号509〜552番に、Clathrin binding regionがアミノ酸番号639〜723番に見出された。
【0166】
本タンパク質を、実施例4(1)の無細胞タンパク質合成系で発現させたところ、実施例4(2)により217units/dayのATP消費活性が認められ、実施例4(3)によりsyntide2を基質としてリン酸基転移活性458.4units/dayが認められた(図27)ことから、本タンパク質はキナーゼであることが確認された。
【0167】
ACK1はactivated p21cdc42Hs kinaseで、活性化型低分子Gタンパク質をリン酸化しその不活性化型への変換を阻害しGタンパク質を活性化型に保つ。低分子量Gタンパク質(GTP binding protein p21)のRho familyにはRACI、Rho、Cdc42Hsが知られている。これらの分子には活性型(GTP結合型)と不活性型(GDP結合型)が存在し、自身のGTPase活性により不活性型を生じる際GAP(GTPase activationg protein)が関与し、不活性型から活性型への変換にはGEF(guanine nucleotide exchange factor)が関与する。ACK1はこれらのうち活性型Cdc42Hsと結合しそのGTPase活性を阻害するチロシンキナーゼであり、細胞骨格、細胞分化、細胞増殖などに関わる。また、ACK1はGEFであるDblをリン酸化し活性型低分子Gタンパク質(cdc42Hs)を蓄積し細胞骨格であるアクチン繊維を誘導する。ACK1にはC末端の短いバリアントACK2が知られておりEGF(epidermal growth factor)やブラジキニンによってリン酸化されることが報告されており、細胞外からのシグナルを受けて細胞骨格形成を調節する。
【0168】
さらにACK1はクラスリン(clathrin)とも結合しclathrin-coated vehicleによるreceptor mediated endocytosisに関与することが報告されている。クラスリンは受容体がクラスターを形成するcoated vehicle, coated pitとよばれるオルガネラの裏打ちタンパク質で、受容体など高分子のエンドサイトーシスに関与する。受容体の細胞内へのエンドサイトーシスは、HIV受容体としても機能するケモカイン受容体、アドレナリン受容体、インスリン受容体、LDL受容体など多くの受容体で知られている。リガンドの結合した受容体のとりこみにより細胞外からのシグナル伝達の調節あるいは受容体のリサイクルが行われる。本タンパク質はcdc42 binding regionとclathrin binding regionの間に15アミノ酸の挿入を持つタンパク質であり、cdc42やクラスリンなどとの結合や相互作用がACK1と異なる可能性がある。以上より、本タンパク質は、癌、動脈硬化、糖尿病、HIV、炎症、受容体の細胞内取りこみにかかわる疾患、神経伝達異常に関わる疾患、アルツハイマー病などの痴呆症、高血圧、緑内障などの診断薬・治療薬のターゲットとしての利用が考えられる。
【0169】
(11)c−brtha2034874(配列番号11、23)
c−brtha2034874(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号11に示すように、3857塩基からなり、そのうち塩基番号55番から1287番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、410アミノ酸残基からなる(配列番号23)。配列番号23のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中の、データベース登録記号P45985に登録されているDual specificity mitogen-activated protein kinase kinase 4、MAP kinase kinase 4(MAPKK4)、JNK activating kinase 1、c-JunN-terminal kinase kinase 1(JNKK)、SAPK/ERK kinase 1(SEK1))がE-value=0、410アミノ酸にわたり97%の一致度でヒットした。MAPKK4は全長399アミノ酸からなる。本タンパク質はMAPKK4のアミノ酸番号39番と40番の間に11アミノ酸の挿入(本タンパク質のアミノ酸番号40〜50)をもつバリアントである(図17)。
【0170】
配列番号23のアミノ酸配列をHMMPFAM検索するとアミノ酸番号113〜378番にプロテインキナーゼドメインが、PROSITE(Nucleic Acids Res., 30: 235-8 (2002))検索するとアミノ酸番号236〜249番にST region(セリン/スレオニンプロテインキナーゼの特徴配列)が、アミノ酸番号119〜143番にATP region(プロテインキナーゼのATP binding site)が検出された。
【0171】
本タンパク質の11アミノ酸の挿入がスプライシングによるかを塩基配列上で比較した(図18)。本DNAとMAPKK4をコードするL36870cDNAとをsim4(Genome Res., 8: 967-74 (1998))を用いてゲノムにマッピングしたところ、本DNAはヒト第17番染色体上にエクソン12個をもつが、MAPKK4はその第2エクソン(本DNAの塩基番号170〜203番、11アミノ酸に相当)を欠失していた。このことは本DNAがエクソンを付加することにより本タンパク質がMAPKK4にない11アミノ酸を新規に有することを示している。この特異的なエクソン部分とホモロジーを持つcDNA(ESTを含む)の塩基配列を検索したが見出されなかった。このことはこのエクソンを有する分子種が稀であり、本DNAが新規分子であることを示している。
【0172】
本タンパク質を実施例4(1)の無細胞タンパク質合成系で発現させたところ、実施例4(2)の方法でATP消費活性(33unit/day)が検出され、実施例4(3)でsyntide2を基質としてリン酸基転移によるHPLCのバンドシフト(237.8unit/day)が認められた(図28)ことから、本タンパク質はキナーゼであることが示された。
【0173】
MAPKK4はセリン/スレオニンプロテインキナーゼに属するdual specificity protein kinaseである。増殖あるいはストレスなどの外界シグナルに反応してMAPKKKに相当するMAPK3/MEKKなどによってMAPKK4のセリン/スレオニンがリン酸化されて活性化し、MAPKに相当するJNK1(MAPK8)、JNK2(MAPK9)、JNK3をp38(MAPK14)と同様に活性化する。さらにその下流の転写因子が活性化され、アポトーシスにかかわる遺伝子などが発現する。MAPKK4ノックアウトマウスの解析からT細胞の分化や、生存シグナルや肝臓の器官形成に関与することが示されている。MAPKK4は骨格筋で発現が多いがその他の組織でも発現が認められている。またMAPKK4は、受容体のinternalization(GPCRの脱感作にかかわる)に関与するタンパク質であるβ−arrestin2と会合しそれに結合するJNK3をリン酸化する。これによりGPCRのシグナル伝達とMAPKシグナル伝達カスケードはクロストークする。本タンパク質は、免疫、肝臓、脳などのストレスに対するアポトーシス、細胞増殖、癌、GPCRによるシグナル伝達異常、神経細胞の突起伸長、痴呆、肝再生、糖尿病、血圧調節、筋萎縮性側索硬化症、あるいは自己免疫疾患、アレルギーをはじめとする免疫炎症疾患などへの関与が推測され、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0174】
(12)c−testi4052197(配列番号12、24)
c−testi4052197(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号12に示すように、3105塩基からなり、そのうち塩基番号407番から1690番までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、427アミノ酸残基からなる(配列番号24)。本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)中の、データベース登録記号X07767に登録されているHuman cAMP-dependent protein kinase catalytic subunit type alpha(PKACα)がE-value=0、336アミノ酸にわたり99%の一致度でヒットした。この配列は351アミノ酸からなり、そのアミノ酸番号16〜351番が本タンパク質のアミノ酸番号92〜427番に相当することから本タンパク質はPKA CαのN末端バリアントであると考えられる(図19)。他にPKACαのアミノ酸番号309番アルギニン(AGG)が本タンパク質では385番グリシン(GGG)となっている。
【0175】
配列番号24のアミノ酸配列をHMMPFAM検索した結果、アミノ酸番号120〜374番にプロテインキナーゼドメインが見出された。この領域はPKACαと共通部分である。
【0176】
本DNAとPKACαのcDNAのエクソン使用状況を比較するためsim4(Genome Res., 8: 967-74 (1998))を用いてゲノムへのアライメントを行った(図20)。その結果、本DNAはエクソン10個からなり、PKACαはその第2〜10エクソンを共有するが、別の第1'エクソンがあった。両者は翻訳開始部位を含む最初のエクソンを異にすることにより、両タンパク質のN末端アミノ酸配列の違いを生じている。本タンパク質はPKACαのスプライシングバリアントである。
【0177】
本タンパク質を実施例4(1)の無細胞タンパク質合成系により発現させたところ、実施例4(1)でATP消費活性があり、実施例4(2)でSyntide2およびPKA基質に対してリン酸基転移によるHPLCでのバンドシフトが認められた(図29)ことからキナーゼ活性を有することが確認された。
【0178】
PKAはreguratory subunit(R)2個、catalytic subunit(C)2個からなるセリン/スレオニンプロイテンキナーゼで、テトラマー(R2C2)は不活性型として細胞質に存在するが、Gs-coupled Recepterからのシグナルが入るとadenylyl cyclaseが活性化しATPからcAMPを生じ、これがPKAのReguratory subunit(R)に結合してcatalytic subunit(C)を遊離し活性化する。RとCの相互作用にかかわるCのアミノ酸はプロテインキナーゼドメイン内にある190番リジン、195番アルギニン、197番トリプトファン、214番リジンである(PRS2ドメイン)。Rは細胞質にとどまるタンパク質でCを細胞質にアンカーリングする。CはRから離れると、別の領域(PRS1ドメイン;134番アルギニン、204番グルタミン酸、236番チロシン)を介してPKI(protein kinase inhibitor)と相互作用し細胞質にアンカーされる。Rサブユニットについては細胞増殖に関与するRIタイプ(RIα、RIβ)、分化に関与するRIIタイプ(RIIα、RIIβ)が知られており、CサブユニットについてはCα、Cβ、Cγが知られている。文献情報によると、CがRによって細胞質にアンカーされるのをRIαのアンチセンスオリゴヌクレオチドによって阻害するとCαが核に移行することが報告されている(Oncogene, 20: 8019-24 (2001))。また、インスリン分泌培養細胞TC6をグルコースあるいはGLP−1(glucagon-like polypeptide-1)で刺激するとCαが核へ、Cβが細胞膜と核へ移行し、Cγは細胞内局在が変わらないことが報告されている(Biochem. J., 368: 397-404 (2002))。このようにPKAの活性本体であるcatalytic subunitの細胞内局在あるいは活性はさまざまな分子によって調節されている。
【0179】
PKAの基質としてはGPK(Glycogen phosphorylase kinase)、CREB(cAMP responisible element binding protein)などが挙げられる。グリコーゲンはGlycogen phosphorylaseにより加水分解されるが、この酵素はPKAによってリン酸化されて活性化され、グリコーゲンの分解が進む。また、CREBは2分子でcAMP responsible elementに結合しPKAなどのプロテインキナーゼにより133番セリンがリン酸化されてソマトスタチン、SF−1(steroid genic factor-1)などの遺伝子を転写活性化する。PKA catalytic subunitαのノックアウトマウスの解析によると、新生仔は大部分致死であるが、生き残ったものは肝臓でのIGF1の発現や、腎臓由来の尿中タンパク質が低下し生育が著しく阻害され、オスでは精子の成熟ができないことが認められた。
【0180】
本タンパク質はそのアミノ酸番号1〜91番が新規配列である。この領域に特有に結合するタンパク質によって、あるいは特有の発現調節をうけることにより、本来のPKA catalytic subunit αと異なる機能を有する可能性がある。また本DNAは精巣から単離され、また、PKA catalytic subunitαのノックアウトマウスの実験から本タンパク質は精子成熟、肝臓、腎臓タンパク質の発現調節にかかわると推定されること、グリコーゲン合成の調節、IGFの分泌不全などのかかわりから、たとえば肝癌・腎臓癌・精巣癌などの癌、肝炎、肝硬変、腎炎、糖尿病、炎症性疾患、不妊、GPCRのシグナル伝達にかかわる疾患などの診断治療などのターゲットとしての利用が考えられる。
【0181】
【発明の効果】
本発明のタンパク質およびそれをコードするDNAはキナーゼ活性等を有することから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
【0182】
【配列表】

Figure 2006174701
【0183】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0184】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0185】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0186】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0187】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0188】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0189】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0190】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0191】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0192】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0193】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0194】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0195】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0196】
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0197】
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0198】
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0199】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0200】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0201】
Figure 2006174701
Figure 2006174701
【0202】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0203】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0204】
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0205】
Figure 2006174701
Figure 2006174701
【0206】
Figure 2006174701
Figure 2006174701
Figure 2006174701
【0207】
Figure 2006174701
【0208】
Figure 2006174701
【0209】
Figure 2006174701
【0210】
Figure 2006174701
【0211】
Figure 2006174701
【0212】
Figure 2006174701
【0213】
Figure 2006174701
【0214】
Figure 2006174701
【0215】
Figure 2006174701
【0216】
Figure 2006174701
【0217】
Figure 2006174701
【0218】
Figure 2006174701
【0219】
Figure 2006174701
【0220】
Figure 2006174701

【図面の簡単な説明】
【図1】図1は、配列番号15のアミノ酸配列を有するタンパク質の構造と既知タンパク質BC010640の構造を比較した図である。
【図2】図2は、配列番号3の塩基配列を有するDNAと既知タンパク質BC010640をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図3】図3は、配列番号16のアミノ酸配列を有するタンパク質の構造と既知タンパク質AX405737の構造を比較した図である。
【図4】図4は、配列番号4の塩基配列を有するDNAと既知タンパク質AX405737をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図5】図5は、配列番号17のアミノ酸配列を有するタンパク質の構造と既知タンパク質AX262516の構造を比較した図である。
【図6】図6は、配列番号5の塩基配列を有するDNAと既知タンパク質AX262516をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図7】図7は、配列番号18のアミノ酸配列を有するタンパク質の構造と既知タンパク質AAV32449、AAW48841、AAW48842の構造を比較した図である。
【図8】図8は、配列番号6の塩基配列を有するDNAと既知タンパク質AAV32449をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図9】図9は、配列番号19のアミノ酸配列を有するタンパク質の構造と既知タンパク質cdk10の構造を比較した図である。
【図10】図10は、配列番号7の塩基配列を有するDNAと既知タンパク質cdk10をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図11】図11は、配列番号20のアミノ酸配列を有するタンパク質の構造と既知タンパク質AX327993の構造を比較した図である。
【図12】図12は、配列番号8の塩基配列を有するDNAと既知タンパク質AX327993をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図13】図13は、配列番号21のアミノ酸配列を有するタンパク質の構造と既知タンパク質SGK040の構造を比較した図である。
【図14】図14は、配列番号9の塩基配列を有するDNAと既知タンパク質SGK040をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である(a)。さらに、エクソン構造から見た両タンパク質の構造を比較した図も示す(b)。
【図15】図15は、配列番号22のアミノ酸配列を有するタンパク質の構造と既知タンパク質ACK1の構造を比較した図である。
【図16】図16は、配列番号10の塩基配列を有するDNAと既知タンパク質ACK1をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図17】図17は、配列番号23のアミノ酸配列を有するタンパク質の構造と既知タンパク質MAPKK4の構造を比較した図である。
【図18】図18は、配列番号11の塩基配列を有するDNAと既知タンパク質MAPKK4をコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図19】図19は、配列番号24のアミノ酸配列を有するタンパク質の構造と既知タンパク質PKACαの構造を比較した図である。
【図20】図20は、配列番号12の塩基配列を有するDNAと既知タンパク質PKACαをコードするcDNAをそれぞれヒトゲノム配列にマッピングして解析したエクソン構造を比較した図である。
【図21】図21は、逆相HPLC上で測定した、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)のピークを示す。
【図22】図22は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号4のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。
【図23】図23は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号6のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。
【図24】図24は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号7のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。
【図25】図25は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号8のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。
【図26】図26は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号9のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。
【図27】図27は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号10のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。
【図28】図28は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号11のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。
【図29】図29は、基質としての標準ポリペプチド(Cdc2、Arg2−OH、PKA、PKC、DNA−PK、PTK1、PTK2、MLCKS、CaMKII、Syntide2)に配列番号12のアミノ酸配列を有するタンパク質を添加して反応させた後、逆相HPLC上でピークを測定した結果を示す。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a novel protein, a DNA encoding the protein, a full-length cDNA encoding the protein, a recombinant vector having the DNA, an oligonucleotide consisting of a partial sequence of the DNA, and a gene-transferred cell into which the DNA has been introduced , And an antibody that specifically binds to the protein.
[0002]
[Prior art]
Currently, the elucidation and analysis of genome sequences of various organisms are underway on a global level. Already about 100 prokaryotic microorganisms, lower eukaryotic budding yeast, and multicellular eukaryotic nematodes, the entire genome sequence has been determined. A draft of the base sequence of the human genome, which is said to have 3 billion base pairs, has already been published, and the complete sequence is being revealed. The purpose of elucidating the genome sequence is to understand the complex life phenomenon as a network of interactions and functions of all genes or between genes, proteins, cells and even individuals. Elucidating biological phenomena from genome information of various species is not only important as a research subject in the academic field, but also how to develop the research results obtained there for industrial application In that sense, its social significance is also great.
[0003]
However, simply determining the genome sequence does not reveal the functions of all genes. For example, in yeast, only about half of the approximately 6,000 genes deduced from the genome sequence could estimate their functions. On the other hand, it is said that there are about 100,000 kinds of proteins in humans. Therefore, establishment of a “high-throughput gene function analysis system” for rapidly and efficiently elucidating the functions of a huge amount of new genes revealed from genome sequences is strongly desired.
[0004]
In eukaryotic genome sequences, a single gene is often divided into multiple exons by introns. Therefore, there are many problems in accurately predicting the structure of the protein encoded there from only the genomic sequence information. On the other hand, in cDNA prepared from mRNA from which introns have been removed, the information on the amino acid sequence of the protein can be obtained as a single piece of continuous sequence information, so that the primary structure can be easily clarified. In human cDNA research, millions of EST (Expressed Sequence Tags) data have been published in public databases, and it is estimated that they cover more than 80% of all human genes. Yes.
[0005]
Such information is utilized from various angles such as elucidation of human gene structure, prediction of exon region in genome sequence, and estimation of its expression profile. However, since most of these human EST information is concentrated in the vicinity of the 3 ′ end of the cDNA, the information in the vicinity of the 5 ′ end of the mRNA is particularly insufficient. In addition, about 7,000 kinds of mRNAs in which the sequences of proteins encoded in these human cDNAs are predicted are about 7,000, and only about 5,500 of them are obtained as full-length cDNA clones. It is only the present situation. Even including those registered as ESTs, it is estimated that human cDNAs obtained so far as full-length clones are only about 10% to 15% of all human genes.
[0006]
If full-length cDNA can be obtained, the mRNA transcription start point on the genome sequence can be estimated from the 5 ′ end sequence, and the factors involved in the stability of mRNA contained in the sequence and the expression control at the translation stage can be analyzed. Is possible. In addition, since atg, which is the translation start point, is included on the 5 'side, the protein can be translated into the correct frame. Therefore, by applying an appropriate gene expression system, it is possible to produce a large amount of the protein encoded by the cDNA or to analyze the biological activity by expressing the protein. Thus, analysis of full-length cDNA provides important information that complements genomic sequence analysis. In addition, a full-length cDNA clone that can be expressed is extremely important for empirical analysis of the function of the gene and for application to industrial applications.
[0007]
In addition, even in the case of a protein encoded by the same genome, when the mRNA encoding the same is transcribed, an isomer (hereinafter referred to as “splicing”) in which a part of the exons in the genome is inserted and deleted and combined. Sometimes referred to as "variant mRNA"). In fact, a plurality of types of similar proteins (hereinafter sometimes referred to as “splicing variants”) produced by translating these mRNAs have been confirmed in vivo. Splicing variants are expressed in a tissue-specific, developmental stage-specific or disease-specific manner and are considered to have different functions.
[0008]
For example, the tyrosine kinase JAK3 gene has three types of splicing variants, S-type, B-type, and M-type, and S-type is expressed in hematopoietic cells, whereas B-type and M-type are hematopoietic cells. And is expressed in epithelial cells. Since S-type and M-type are co-precipitated by the antibody and expressed in the same cell, it is speculated that multiple splicing variants function together, increasing the complexity of cytokine signaling in the cell. (For example, refer nonpatent literature 1).
[0009]
Such splicing variant mRNA or cDNA is also a clone that is difficult to obtain from a conventional cDNA library or EST, and is likely to be obtained from a full-length cDNA library including a transcription initiation site (for example, patent documents). 1).
[0010]
In particular, protein kinases are enzymes that phosphorylate serine, threonine, or tyrosine residues, which are substrates of proteins, and so many families are known. In addition, protein kinases are generally known to be involved in the control of various biological phenomena by regulating intracellular signal transduction systems through protein phosphorylation. There are many (for example, refer nonpatent literature 2). However, about 3 to 4% of human genes are said to be protein kinase genes, and it is estimated that there are about 1,000 different protein kinases in the human body, and many protein kinase genes have not yet been cloned. It is left behind. Therefore, it is significant to provide a novel protein kinase full-length cDNA containing a splicing variant that has not been separated in humans. In addition, protein kinases can be expected to be useful as therapeutic target molecules and to the proteins themselves as pharmaceuticals. Therefore, it is significant to clarify the full length of cDNA encoding these proteins.
[0011]
[Patent Document 1]
WO98 / 22507 (SEQ ID NO. 1 and NO. 2)
[Non-Patent Document 1]
Lai K. S. et al., J. Biol. Chem., 270: 25028-25036 (1995)
[Non-Patent Document 2]
Hunter, T., Cell, 50: 823-829 (1987)
[0012]
[Problems to be solved by the invention]
The present invention analyzes the nucleotide sequence of a cDNA clone contained in a full-length cDNA library, and among these, for a cDNA having a novel sequence as a full length including a splicing variant, the physiological activity of the protein encoded by this is identified. The purpose is to propose a protein based on activity and a method of using the DNA encoding the protein.
[0013]
[Means for Solving the Problems]
The present inventors have used an oligo-cap method (Maruyama, K., et al., Gene, 138: 171-174 (1994); Suzuki, Y. et al., Gene, 200: 149-156 (1997)). When a database was searched based on the homology of the base sequence of the cDNA clone for a cDNA having a sequence containing a splicing variant obtained by using the cDNA, a sequence specific to a protein having kinase activity was found in the sequence. The protein encoded by the cDNA was identified as a protein kinase. The present invention has been accomplished based on these findings.
[0014]
That is, according to the present invention, the following inventions 1 to 15 are provided.
1. The following protein (a) or (b):
(A) a protein comprising the amino acid sequence of any one of SEQ ID NOs: 13 to 24,
(B) A protein comprising an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any one of SEQ ID NOs: 13 to 24 and having kinase activity.
2. A DNA encoding the protein according to item 1.
3. A full-length cDNA encoding the protein according to item 1.
4). DNA of any of the following (a) or (b);
(A) DNA having the base sequence described in any one of SEQ ID NOs: 1 to 12,
(B) The base sequence described in any one of SEQ ID NOs: 1 to 12 has a base sequence in which one or several bases are deleted, substituted and / or added, and encodes a protein having kinase activity DNA.
5. 5. A recombinant vector comprising the DNA according to any one of 2 to 4 above.
6). 7. A gene-transferred cell into which the DNA according to any one of 2 to 4 or the recombinant vector according to 5 above is introduced, or an individual comprising the cell.
7). The recombinant protein according to item 1, which is produced by the cell according to item 6.
8). A sense oligonucleotide having the same sequence as 5 to 100 consecutive bases in the base sequence of the DNA according to any one of 2 to 4 above, an antisense oligonucleotide having a sequence complementary to the sense oligonucleotide, and the An oligonucleotide selected from the group consisting of oligonucleotide derivatives of sense or antisense oligonucleotides.
9. 8. An antibody or a partial fragment thereof that specifically binds to the protein according to item 1 or 7.
10. 10. The antibody according to 9 above, wherein the antibody is a monoclonal antibody.
11. 11. The antibody according to item 10 above, wherein the monoclonal antibody has an action of neutralizing the kinase activity of the protein according to item 1 or 7.
12 8. A screening method for a substance that regulates the activity of the protein, which comprises contacting the test substance with the protein according to item 1 or 7, and measuring a change in activity of the protein by the test substance.
13. 7. A screening method for a substance that regulates the expression of DNA, comprising contacting the test cell with the gene-transferred cell according to item 6 and detecting a change in the expression level of the DNA introduced into the cell.
14 Preserving at least one or more amino acid sequence information selected from the amino acid sequence of the protein according to item 1 and / or at least one or more nucleotide sequence information selected from the DNA nucleotide sequence according to any one of items 2 to 4 above Computer readable recording medium.
15. A carrier on which the protein according to item 1 and / or the DNA according to any one of items 2 to 4 are bound.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in more detail.
(1) Acquisition of full-length cDNA and analysis of nucleotide sequence
The DNA of the present invention is a protein comprising the amino acid sequence described in any of SEQ ID NOs: 13 to 24, or one or several amino acids in the amino acid sequence described in SEQ ID NOs: 13 to 24 (here, several (For example, meaning 5 or less, preferably 3 or less, more preferably 2 or less) encoding a protein having an amino acid sequence including substitution, deletion and / or addition of amino acid residues and having kinase activity Any one can be obtained. Specifically, it may be only the translation region encoding the amino acid sequence, or may include the full length of the cDNA.
[0016]
Specifically, as the DNA containing the full length of cDNA, for example, DNA comprising the base sequence described in any of SEQ ID NOs: 1 to 12 can be mentioned. The translation region includes base numbers 39 to 2159 of SEQ ID NO: 1, base numbers 36 to 1454 of SEQ ID NO: 2, base numbers 401 to 1960 of SEQ ID NO: 3, base numbers 42 to 1733 of SEQ ID NO: 4, and SEQ ID NO: 5 base numbers 371 to 3874, SEQ ID NO: 6 base numbers 81 to 2720, SEQ ID NO: 7 base numbers 1744 to 2685, SEQ ID NO: 8 base numbers 254 to 2554, SEQ ID NO: 9 base numbers 32 to 3898, SEQ ID NO: Examples include those having the sequences shown in Base Nos. 146 to 3406 of No. 10, Base Nos. 55 to 1287 of SEQ ID No. 11, and Base Nos. 407 to 1690 of SEQ ID No. 12. Furthermore, the DNA of the present invention includes not only the full length of the cDNA described above, but also those containing the translation region and the 3 ′ and / or 5 ′ end adjacent to the translation region at least necessary for expression. .
[0017]
The DNA of the present invention may be obtained by any method as long as it can be obtained. Specifically, for example, it can be obtained by the method described below. First, mRNA is prepared from human tissue or cultured cells by a commonly used method known per se. Next, cDNA is obtained by the oligo cap method (Maruyama, K., et al., Gene, 138: 171-174 (1994)) using this mRNA as a template. Specifically, 5 'cap is removed from the obtained mRNA with acid pyrophosphatase, and then the synthetic oligonucleotide is ligated using RNA ligase to the exposed 5'-terminal phosphate group as a target. Here, for RNA molecules that do not have a cap structure at the 5 ′ end, in order to prevent the oligonucleotide from binding, the phosphate group present at the 5 ′ end in advance is not removed from the 5 ′ cap but at the 5 ′ end. It is effective to remove the phosphoric acid group using phosphatase having the activity of removing only the phosphate group. Using this RNA molecule as a template, reverse transcription is performed with reverse transcriptase using an oligo dT primer as a 3'-side primer, and then the RNA strand is decomposed and removed.
[0018]
Furthermore, using the obtained single-stranded DNA as a template, a polynucleotide having a sequence complementary to the synthetic oligonucleotide is a 5 ′ primer, and a primer specific to the 3 ′ end (such as oligo dT) is used for the polymerase chain reaction. By performing (PCR), a full-length cDNA library can be prepared. Here, the 5 'primer and the 3' primer are not complementary to the total length of the synthetic oligonucleotide and the reverse transcription primer, and it is preferable to use sequences shifted by 3 to 10b on the 3 'side. The primer chain length is usually 15 to 100 bases, preferably 15 to 30 bases. When the cDNA to be amplified has a long chain length, the length is preferably 25 to 35 bases. and Accurate PCR (LA PCR: Kenji Hayashi, experimental medicine separate volume, latest technology of PCR, Yodosha; Cheng, S. et al., Nature 369: 684-685 (1994)) is preferably used.
[0019]
The cDNA thus obtained is cloned by inserting it into an appropriate cloning vector. As the vector used here, a protein expression vector which can introduce the obtained cDNA clone into a cell and express the protein encoded by the cDNA is preferably used. Specifically, for example, when the host is a mammalian cell or the like, pME18SFL3 (Genbank AB009864) or the like is preferable, and when E. coli is used, pET3, pET11 (Stratagene), pGEX (Amersham Pharmacia Biotech), etc. In the case of yeast, pESP-I expression vector (Stratagene) is used, and in the case of insect cells, BacPAK6 (Clontech) is used. When the host is an animal cell, examples include ZAP Express (manufactured by Stratagene), pSVK3 (manufactured by Amersham Pharmacia Biotech), and the like.
[0020]
The cDNA library thus obtained is subjected to base sequence analysis by a commonly used method known per se. The DNA of the present invention is obtained by analyzing the nucleotide sequence of the 5′-end or 3′-end of the obtained cDNA, and this is analyzed by NCBI (National Center of Biotechnology Information; http://www.ncbi.nlm.nih.gov/). BLAST (Basic local alignment search tool; Altschul, SF, et al., J. Mol. Biol., 215, 403-410 (1990)) database such as Genbank, EMBL, DDBJ, PDB, dbEST When a sequence that completely matches the entire length was not found, it was decided to be used for the following analysis as new.
[0021]
Examples of the DNA having such a full-length cDNA base sequence include those having the base sequences described in SEQ ID NOs: 1-12. The translation region includes base numbers 39 to 2159 of SEQ ID NO: 1, base numbers 36 to 1454 of SEQ ID NO: 2, base numbers 401 to 1960 of SEQ ID NO: 3, base numbers 42 to 1733 of SEQ ID NO: 4, and SEQ ID NO: 5 base numbers 371 to 3874, SEQ ID NO: 6 base numbers 81 to 2720, SEQ ID NO: 7 base numbers 1744 to 2685, SEQ ID NO: 8 base numbers 254 to 2554, SEQ ID NO: 9 base numbers 32 to 3898, SEQ ID NO: Examples include those having the sequences shown in Base Nos. 146 to 3406 of No. 10, Base Nos. 55 to 1287 of SEQ ID No. 11, and Base Nos. 407 to 1690 of SEQ ID No. 12.
[0022]
A novel nucleotide sequence as the full length of the cDNA thus obtained is obtained by homology search by BLAST and HMMER (sequence analysis method using hidden Markov model; Eddy, SR, Bioinformatics 14: 755-763 (1998)). By performing a protein feature search (profile search: http://pfam.wustl.edu) by HMMPFAM, which is one of the functional groups, the function of the protein encoded by the base sequence can be estimated.
[0023]
In the homology search by BLAST, the function of the clone to be analyzed can be estimated from various annotation information attached to hit sequences with sufficiently significant homology obtained as a result of the search. Here, a sufficiently significant hit sequence means that the identity between the catalytic domain portion of the registered sequence and the corresponding portion of the DNA of the present invention is E-value (the query sequence is accidentally found in the database). 10 as the expected value)-FourThe following are shown, or 30% or more.
[0024]
For example, if many of the top hit catalytic domain sequences have been confirmed to function as kinases, the analyzed clones that are similar in sequence will also have the same function, ie, kinase activity. Prediction is valid.
[0025]
In HMMPFAM, the analysis is based on a method for determining whether the amino acid sequence encoded by the base sequence to be analyzed has the characteristics of the amino acid sequence of the entry in the database in which the protein profiles called Pfam are accumulated. Profiles are extracted from a series of proteins having the same characteristics, and even if the function cannot be clarified by comparison over the entire length of one sequence to one sequence, if the characteristic region is present in the sequence, this can be found and the function can be predicted. As described above, the cDNA predicted to have the kinase activity of the protein encoded by the protein can be confirmed by the biochemical experiment described below.
[0026]
Specific examples of the clones that are novel as the full length cDNA described above include those having the base sequence shown in any one of SEQ ID NOs: 1-12. Examples of the amino acid sequences encoded by these base sequences include those shown in any of SEQ ID NOs: 13 to 24.
[0027]
The DNA of the present invention thus obtained, whose nucleotide sequence is determined, and whose function is presumed, has the nucleotide sequence described in any of SEQ ID NOs: 1 to 12, or the nucleotide sequence shown above as its translation region. Not only those but also one or several bases in these base sequences (herein, several means, for example, 15 or less, preferably 9 or less, more preferably 6 or less) are deleted. In addition, a DNA having a substituted and / or added base sequence and encoding a protein having kinase activity is also included. As described above, these DNAs are composed of amino acid sequences in which one or several amino acid sequences are deleted, substituted and / or added in the amino acid sequences of SEQ ID NOs: 13 to 24, and have kinase activity. Includes those that encode proteins.
[0028]
Furthermore, the DNA of the present invention may be obtained by the above-described method or may be synthesized. The substitution of the DNA base sequence can be easily performed with a commercially available kit such as a site-directed mutagenesis kit (Takara Shuzo) or a quick change site-directed mutagenesis kit (Stratagene).
[0029]
(2) Protein encoded by novel cDNA
The translation region of the protein encoded by the DNA of the present invention is, for example, converted into an amino acid using three types of reading frames for the base sequence of the DNA, and the range encoding the longest polypeptide is translated into the protein of the present invention. The amino acid sequence can be determined as a region. Examples of such amino acid sequences include those described in any of SEQ ID NOs: 13 to 24. In addition, the protein of the present invention is not limited to the amino acid sequence described above, and is composed of an amino acid sequence in which one or several amino acids are substituted, deleted, and / or added in the amino acid sequence, and has kinase activity. What has is also included.
[0030]
As a method for obtaining the protein of the present invention, the method of transcription / translation of the DNA of the present invention described in (1) by an appropriate method is preferably used. Specifically, an appropriate expression vector or a recombinant vector inserted into an appropriate vector together with an appropriate promoter is prepared, and an appropriate host microorganism is transformed with this recombinant vector or introduced into an appropriate cultured cell. And can be obtained by purifying it.
[0031]
In addition, the protein of the present invention includes a protein added with a tag inserted into a vector designed so that an appropriate tag is fused to the N-terminus or C-terminus. Specific examples of the tag include glutathione-S-transferase, polyhistidine, and Flag.
[0032]
The protein produced by the transformant can be modified by incorporating amino acids substituted or modified with heavy atoms during protein synthesis. In addition, the protein can be made into a modified protein by applying an appropriate protein-modifying enzyme before or after purification, by arbitrarily modifying the protein, or by partially removing the polypeptide. For example, terminal modification such as N-terminal acetylation, C-terminal amidation, glycosylation, lipid addition, acylation, methylation, sulfonation, carboxylation, hydroxylation, phosphorylation, ADP-ribosylation, etc. It is not necessarily limited to these. These modified proteins are also included in the scope of the present invention as long as they have the above kinase activity.
[0033]
In addition, the protein produced by the transformant may be modified as desired by applying an appropriate protein-modifying enzyme before or after purification, or by partially removing the polypeptide. Can do. These modified proteins are also included in the scope of the present invention as long as they have the above kinase activity.
[0034]
When the protein of the present invention is produced, the vector used for the production of the recombinant vector containing the DNA of the present invention is not particularly limited as long as the DNA is expressed in the transformant. Plasmid vector, phage Any of vectors may be used. Of these, usually a commercially available protein expression vector into which an expression control region DNA such as a promoter suitable for a host into which the DNA is introduced has already been inserted is used. Specific examples of such a protein expression vector include pET3, pET11 (manufactured by Stratagene), pGEX (manufactured by Amersham Pharmacia Biotech) when the host is Escherichia coli, and pESP when yeast is used. -I expression vector (manufactured by Stratagene) and the like, and in the case of insect cells, BacPAK6 (manufactured by Clontech) and the like are used. When the host is an animal cell, ZAP Express (Stratagene) or pSVK3 (Amersham Pharmacia Biotech) can be used. When the host is a mammalian cell, pME18SFL3 (Genbank AB009864) is preferred.
[0035]
When using a vector into which an expression control region is not inserted, it is necessary to insert at least a promoter as an expression control region. Here, the promoter possessed by the host microorganism or the cultured cell can be used as the promoter, but is not limited to this. Specifically, for example, when the host is Escherichia coli, T3, T7, tac, lac A promoter or the like can be used, and in the case of yeast, nmt1 promoter, Gal1 promoter and the like can be used. In the case of insect cells, a polyhedrin promoter or the like can be used. When the host is an animal cell, SV40 promoter, CMV promoter, etc. are preferably used.
[0036]
In addition, when a host capable of functioning a promoter derived from a mammal is used, a promoter specific to the gene of the present invention can also be used. Insertion of the DNA of the present invention into these vectors may be carried out by linking the DNA or a DNA fragment containing the DNA with the amino acid sequence of the protein encoded by the gene DNA downstream of the promoter in the vector.
[0037]
The recombinant vector thus prepared can be transformed into a host to be described later by a method known per se to prepare a DNA transductant. Specific examples of methods for introducing the vector into the host include heat shock (J. Mol. Biol., 53: 154 (1970)), calcium phosphate method (Science, 221: 551 (1983)), DEAE dextran method ( Science, 215: 166 (1982)), in vitro packaging method (Proc. Natl. Acad. Sci. USA, 72: 581 (1975)), viral vector method (Cell, 37: 1053 (1984)), and electric pulse (Chu. Et al., Nuc. Acids Res., 15: 1331 (1987)) and the like.
[0038]
The host for preparing the DNA transductant is not particularly limited as long as the DNA of the present invention is expressed in the body. For example, Escherichia coli, yeast, baculovirus (arthropod polyhedrosis virus) -insect cell, or Examples include animal cells. Specifically, BL21, XL-2Blue (manufactured by Stratagene) etc. are used in E. coli, SP-Q01 (manufactured by Stratagene), etc. in yeast, and AcNPV (J. Biol. Chem., 263: 7406 (1988) in baculovirus. )) And its host, Sf-9 (J. Biol. Chem., 263: 7406 (1988)). Examples of animal cells include mouse fibroblast C127 (J. Viol., 26: 291 (1978)) and Chinese hamster ovary cell CHO cells (Proc. Natl. Acad. Sci. USA, 77: 4216 (1980)). Among them, COS-7 derived from African green monkey kidney (ATCC CRL1651: American Type Culture)
Collection preserved cells) are used.
[0039]
In addition to the expression method using the protein expression vector as described above, a homologous recombination technique (Vertes, AA et al., Biosci. Biotechnol) that directly inserts the DNA fragment of the present invention linked to a promoter into the chromosome of the host microorganism Biochem., 57: 2036 (1993)), or a transposon or an insertion sequence (Vertes, AA et al., Molecular Microbiol., 11: 739 (1994)) or the like can be used to prepare a DNA transductant.
[0040]
The culture obtained above is obtained by collecting cells or cells by a method such as centrifugation, suspending the cells or cells in an appropriate buffer, and using a suitable known per se method such as ultrasound, lysozyme, and / or freeze-thawing. After disruption by the method, a crude protein purification solution can be obtained by centrifugation, filtration or the like, and further purified by combining appropriate purification methods.
[0041]
Thus, the protein of the present invention is obtained. In addition to the expression method using the protein expression recombinant vector described above, the protein of the present invention is obtained by inducing protein expression by subjecting the DNA of the present invention obtained in (1) above to a cell-free transcription translation system. be able to. The cell-free transcription / translation system used in the present invention is a system including all elements necessary for transcription from DNA to mRNA and translation from mRNA to protein, and the DNA is encoded by adding DNA thereto. It refers to any system in which the protein being synthesized is synthesized. Specific examples of the cell-free transcription / translation system include transcription / translation systems prepared on the basis of extracts from eukaryotic cells and bacterial cells, or a part thereof. Specific examples of the cell-free protein synthesis system include known cell extracts such as Escherichia coli, plant seed germs, and rabbit reticulocytes. These may be commercially available, and methods known per se, specifically, Escherichia coli extracts may be obtained from Pratt, JM et al., Transcription and Translation, Hames, 179-209, BD & Higgins, SJ, It can also be prepared according to the method described in eds, IRL Press, Oxford (1984). Examples of commercially available cell-free protein synthesis systems or cell extracts include E. coli S30 extract system (manufactured by Promega) and RTS500 Rapid Translation System (manufactured by Roche). Those derived from Rabbit Reticulocyte Lysate System (Promega) etc., and those derived from wheat germ are PROTEIOSTM(Manufactured by TOYOBO).
[0042]
Separation and purification of the protein of the present invention from the transcription-translation product of the obtained cell-free transcription / translation system can be performed by a commonly used method known per se. Specifically, for example, a DNA region encoding an epitope peptide, polyhistidine peptide, glutathione-S-transferase (GST), maltose binding protein, etc. is introduced into the DNA to be transcribed and translated as described above. The protein can be purified by utilizing affinity with a substance having affinity for the protein.
[0043]
Expression of the target protein is detected by SDS-polyacrylamide gel electrophoresis or the like, and stained with Coomassie Brilliant Blue (manufactured by Sigma) or detected by an antibody that specifically binds to the protein of the present invention described later. It can be confirmed by the method to do. In general, it is known that the expressed protein is cleaved (processing) by a proteolytic enzyme present in the living body. The protein of the present invention is also included in the protein of the present invention as long as it has kinase activity even if it is a partial fragment of an amino acid sequence cleaved.
[0044]
(3) Confirmation of the activity of the protein of the present invention
It can be confirmed that the protein of the present invention is produced as a recombinant protein as described in (2) above, and has the activity estimated in (1) by analyzing it. Furthermore, it can also analyze by the combination with the antibody etc. as described in the following (4).
[0045]
It can be confirmed that the protein of the present invention has kinase activity using a conventional method known per se. As an example of a specific method, there is a method of contacting a substrate with the recombinant protein and measuring the amount of ATP consumed when the substrate is phosphorylated by the kinase activity of the recombinant protein, the amount of product, etc. This will be described below.
[0046]
As a reaction solution, when measuring the activity of serine / threonine protein kinase whose substrate phosphorylation site is serine / threonine, magnesium ion, for example, 5 to 100 mM magnesium chloride or magnesium acetate, and 1 to 1 as a reducing agent. Neutral to weakly basic buffer containing 100 mM 2-mercaptoethanol or 1-10 mM dithiothreitol, for example, 50 mM Tris-HCl or HEPES buffer (pH 7.0-8. 0) and when measuring the activity of a tyrosine-specific protein kinase whose substrate phosphorylation site is tyrosine, manganese chloride, zinc chloride, NaVOThreeTris-hydrochloric acid containing dithiothreitol or HEPES buffer (pH 7.0 to 8.0) can be used.
[0047]
After adding ATP and a substrate suitable for each to this reaction solution, the purified protein of the present invention is added, and after reacting at room temperature to 37 ° C. for about 24 hours, the amount of ATP consumed by the kinase reaction possessed by the protein, Alternatively, the product of the kinase reaction performed by the protein is measured. Here, when measuring the kinase activity of a protein that is expected to be a receptor-type kinase, it is preferable that only the intracellular portion of the protein or the kinase active center portion is expressed as a recombinant protein and used in the above reaction. .
[0048]
Regarding the kinase reaction, in the case of a cyclic nucleotide-dependent protein kinase which is a serine / threonine protein kinase, it is necessary to add a cyclic nucleotide corresponding to each kinase into the reaction solution. For example, cyclic AMP (cAMP) is added in the case of A-kinase, cyclic GMP (cGMP) is added in the case of G-kinase, and histone is used as a substrate.
[0049]
In the case of phospholipid-dependent protein kinase, phospholipid is added to the reaction solution. For example, in the case of C-kinase, phosphatidylserine is added and histone is used as a substrate. In the case of calcium-dependent protein kinase, calmodulin is added to the reaction solution, and myosin light chain is used as a substrate. Here, myosin light chain kinase and calmodulin kinase are included. In the case of tyrosine-specific protein kinase, tubulin, histone, casein, myosin light chain, gastrin, angiotensin, tyrosine-glutamic acid (1: 4) polymer, etc. are used as substrates.
[0050]
In the kinase activity measurement, hydrolysis of ATP to ADP occurs by the kinase prior to transfer of the phosphate group to the substrate. Here, the kinase activity can be defined by measuring the amount of ATP hydrolyzed. In this case, the amount of ATP in the reaction solution performed in the absence of the substrate is measured, and the amount of ATP consumed is defined as the kinase activity.
[0051]
When measuring the amount of ATP consumed by the kinase reaction, luciferin and luciferase are added to the kinase reaction solution, and after reaction for a certain period of time, the fluorescence intensity is measured at the fluorescence wavelength peculiar to the added luciferin to obtain the fluorescence amount by the remaining ATP. The value obtained by subtracting the fluorescence intensity from the total ATP fluorescence intensity present in the reaction solution, measured in the absence of protein kinase and substrate, is defined as the amount of ATP consumed by the kinase activity, and the enzyme kinase activity.
[0052]
When measuring the product of the kinase reaction, it is a radioisotope as ATP added to the reaction solution.32P was included in the γ position of ATP [γ-32P] ATP is used. After completion of the kinase reaction, the reaction solution is separated by SDS-polyacrylamide gel electrophoresis, and the gel after electrophoresis is subjected to autoradiography using an X-ray film.32A protein band incorporating P is detected. Further, 10% trichloroacetic acid or ethanol or acetone is added to the reaction solution so that the final concentration becomes 90% to precipitate the protein. Thereafter, the supernatant is removed by centrifugation or filter filtration, further washed several times with the same solution, dried and then washed with a liquid scintillation counter.32Measure P amount. As a method that does not use a radioisotope, the reaction solution after completion of the kinase reaction can be separated by chromatography, and the activity can be measured by changing the elution position and the amount of change of the phosphorylated substrate. In this case, ion exchange chromatography or reverse phase chromatography can be used as the chromatography. It is also possible to measure activity by measuring a mass change due to phosphorylation of a substrate with a mass spectrometer. In this case, the measurement accuracy is further increased by using in combination with the aforementioned chromatographic separation.
[0053]
Such a kinase activity analysis system can also be used to evaluate agonists and antagonists of the protein having the kinase activity of the present invention. The confirmation of the activity of the protein of the present invention is not limited to the method described above.
[0054]
(4) Functional analysis of the protein of the present invention
The protein of the present invention having a kinase activity and including a protein identified as a splicing variant thus obtained is analyzed by analyzing functions other than the kinase activity confirmed in (3) above. (Proteins to be further analyzed for functions other than the kinase activity may be hereinafter referred to as “analyzed proteins”). In particular, since the protein of the present invention includes a known protein splicing variant, it is important to identify how this variant functions differently from the known variant.
[0055]
Specific functional analysis methods include, for example, (i) a method for comparative analysis of expression states at each tissue, disease, or developmental stage, (ii) a method for analyzing interactions with other proteins and DNA, ( iii) Introducing into appropriate cells and analyzing phenotypic changes of the introduced cells, (iv) Inhibiting expression of the protein in appropriate cells or individuals and analyzing phenotypic changes .
[0056]
In the method (i), the expression of the protein of the present invention can be analyzed at the mRNA level or the protein level. When analyzing the expression level at the mRNA level, for example, in situ hybridization (Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, DG, Cambridge University Press (1990)) A hybridization method using a DNA chip, a quantitative PCR method, or the like is used. When analyzing at the protein level, a tissue staining method using an antibody that specifically binds to the protein of the present invention, which will be described later, may be mentioned. If the target protein to be analyzed is a splicing variant with a known variant, use a probe that is present only in the cDNA encoding the target protein and does not hybridize with the cDNA encoding the known variant. Is preferred. In the case of the quantitative PCR method, a method of selecting primers capable of producing amplified fragments of different lengths between the target variant and the known variants (Wong, Y., Neuroscience Let., 320: 141-145 (2002)), etc. Is mentioned. Also, when analyzing at the protein level, it is preferable to use an antibody that reacts only with the target protein and does not react with a known variant.
[0057]
In the method (ii), the function of the protein of the present invention can be analyzed by examining the presence or absence of interaction between the protein of the present invention and a known protein. As an analysis method of the interaction, a conventional method known per se can be used. Specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon method, phage display method, ribosomal display Law. Also in this method, when the protein to be analyzed is a splicing variant in which a known variant exists, a substance that interacts with the known variant in the same manner is analyzed, and a substance that specifically interacts with the target protein is identified. Is preferred.
[0058]
In the method (iii), the cells into which the cDNA of the present invention is introduced are not particularly limited, but human cultured cells and the like are particularly preferably used. Examples of the method for introducing DNA into cells include those described in (2) above. Furthermore, the phenotype of the introduced cell can be observed with a microscope, such as cell viability, cell growth rate, neurite elongation, and intracellular protein localization when the cell is a neuron, It includes those that can be analyzed by biochemical experiments such as changes in the expression of specific proteins. In the case of a splicing variant in which a known variant exists, these phenotypes can be similarly introduced into a cell, and a phenotype related to the analysis target variant can be identified by comparative analysis. Moreover, since it is known that the protein of the present invention has kinase activity, it is also preferable to analyze by paying attention to phenotypes and the like found in diseases associated with kinases.
[0059]
The method (iv) can be efficiently performed by a method using an oligonucleotide described later or an RNA interference method. Also in this method, when the target protein to be analyzed is a splicing variant in which a known variant exists, the same analysis is performed on the known variant and other variants, and the target protein-specific is obtained by performing comparative analysis. Function can be identified.
[0060]
(5) Preparation of oligonucleotide and functional analysis using the oligonucleotide Using the DNA of the present invention obtained by the method described in the above (1) or a fragment thereof, by a conventional method using a DNA synthesizer or the like, Oligonucleotides such as antisense oligonucleotides and sense oligonucleotides having a partial sequence of DNA can be prepared. Examples of the oligonucleotide include DNA having the same sequence as 5 to 100 consecutive bases in the base sequence of the DNA or DNA having a sequence complementary to the DNA. Specific examples thereof include DNA having the same sequence as 5 to 100 consecutive bases in the base sequence represented by any of SEQ ID NOs: 1 to 12, or DNA having a sequence complementary to the DNA. Here, when the target protein is a splicing variant in which a known variant DNA exists, it is preferable to select a base sequence of a portion different from the known variant. When used as a sense primer and an antisense primer, the above oligonucleotides in which the melting temperature (Tm) and the number of bases of both do not change extremely are preferable. The length of the sequence is generally 5 to 100 bases, preferably 10 to 60 bases, and more preferably 15 to 50 bases.
[0061]
In addition, derivatives of these oligonucleotides can also be used as the oligonucleotide of the present invention. The oligonucleotide derivative includes an oligonucleotide derivative in which a phosphodiester bond in an oligonucleotide is converted to a phosphorothioate bond, and an oligonucleotide in which a phosphodiester bond in an oligonucleotide is converted to an N3′-P5 ′ phosphoramidate bond. Nucleotide derivatives, oligonucleotide derivatives in which ribose and phosphodiester bonds in oligonucleotides are converted to peptide nucleic acid bonds, oligonucleotide derivatives in which uracil in oligonucleotides is substituted with C-5 propynyl uracil, uracil in oligonucleotides Oligonucleotide derivative substituted with C-5 thiazole uracil, oligonucleotide derivative substituted with cytosine in oligonucleotide with C-5 propynylcytosine, oligonucleotide Oligonucleotide derivatives in which the cytosine is substituted with phenoxazine-modified cytosine, the oligonucleotide derivative in which the ribose in the oligonucleotide is substituted with 2′-O-propylribose, or the ribose in the oligonucleotide is 2 Examples thereof include oligonucleotide derivatives substituted with '-methoxyethoxyribose.
[0062]
Moreover, the oligonucleotide of the present invention can be applied to the RNA interference method by preparing it as a double-stranded RNA. For example, the method described in (Elbashir, S., et al., Nature, 411: 494-498 (2001)) can be used for the production method of double-stranded RNA and the RNA interference method. . The double-stranded RNAs need not all be RNA. Specifically, those described in WO 02/10374 can be used as a part of which is DNA.
[0063]
The target gene in this RNA interference method (hereinafter sometimes referred to as “target gene”) may be any DNA as long as it is the DNA of the present invention. A double-stranded polynucleotide comprising RNA having a sequence substantially the same as at least a part of the base sequence of these DNAs (hereinafter sometimes referred to as “double-stranded polynucleotide”) refers to a target gene Among these base sequences, the sequence consists of a sequence that is substantially the same as a sequence of 20 bp or more, which may be any part. Here, “substantially identical” means having a homology of 80% or more with the sequence of the target gene.
[0064]
Further, when the protein to be analyzed is an insertion type or substitution type variant as compared with a known protein, the double-stranded polynucleotide sequence can be set at the insertion or substitution site. In addition, when the protein to be analyzed is a deletion variant of a known protein, it is possible to select a sequence that is specifically effective for the protein by setting the sequence across the deletion to a double-stranded polynucleotide sequence. it can. Furthermore, by comparing the base sequence of the DNA encoding each of the protein to be analyzed and the known protein, by selecting a base sequence specific to the DNA encoding the protein to be analyzed, Expression can be inhibited.
[0065]
The nucleotide chain length may be any length from 20 bp to the entire length of the open reading frame (ORF) of the target gene, but preferably about 20 to 500 bp. However, in cells derived from mammals, the existence of a signal transduction system that is activated in response to a long double-stranded RNA of 30 bp or more is known. This is called an interferon reaction (Mareus, PI, et al., Interferon, 5: 115-180 (1983)). When the double-stranded RNA enters the cell, PKR (dsRNA-responsive protein kinase: Bass, BL, Nature, 411: 428-429 (2001)), the translation initiation of many genes was non-specifically inhibited, and at the same time 2'-5'oligoadenylate synthetase (Bass, BL, Nature, 411: 428-429 (2001)), activation of RNaseL occurs, and nonspecific degradation of intracellular RNA is induced. These non-specific reactions mask the specific reaction of the target gene. Therefore, when a mammal or cells or tissue derived from the animal is used as the recipient, it is preferable to use a 20 to 30 bp double-stranded polynucleotide. Double-stranded polynucleotides need not be entirely double-stranded, but also include those in which the 5 'or 3' end is partially protruding. The double-stranded polynucleotide means a double-stranded polynucleotide having complementarity, but may be a self-annealed single-stranded polynucleotide having self-phase correction. Examples of the single-stranded polynucleotide having self-complementarity include those having an inverted repeat sequence.
[0066]
Although there is no restriction | limiting in particular as a preparation method of double stranded polynucleotide, It is preferable to use the chemical synthesis method known per se. In chemical synthesis, single-stranded polynucleotides having complementarity can be synthesized separately and associated with each other by an appropriate method to be double-stranded. Examples of the association method include a method in which the polynucleotide is mixed, heated to a temperature at which the double strands dissociate, and then gradually cooled. The associated double-stranded polynucleotide is confirmed using an agarose gel or the like, and the remaining single-stranded polynucleotide is removed by, for example, decomposing with an appropriate enzyme.
[0067]
The recipient to which the double-stranded polynucleotide thus prepared is introduced may be any recipient as long as the target gene can be transcribed into RNA or translated into protein in the cell. Specific examples include those belonging to plant, animal, protozoan, virus, bacteria, or fungal species. The plant may be monocotyledonous, dicotyledonous or gymnosperm, and the animal may be a vertebrate or invertebrate. Preferred microorganisms are those used in agriculture or industry and are pathogenic to plants or animals. Fungi include organisms in both mold and yeast forms. Examples of vertebrates include mammals including fish, cows, goats, pigs, sheep, hamsters, mice, rats and humans, and invertebrates include nematodes and other reptiles, Drosophila Drosophila), and other insects. Preferably, the cell is a vertebrate cell.
[0068]
An introducer means a cell, tissue or individual. Here, the cells may be germline or somatic, totipotent or multipotent, divided or undivided, parenchyma or epithelium, immortalized or transformed, and the like. The cell may be a gamete or embryo, and in the case of an embryo, it is a single-cell embryo or constitutive cell, or a cell from a multi-cell embryo and includes fetal tissue. Furthermore, it may be an undifferentiated cell such as a stem cell, or a differentiated cell such as from a cell of an organ or tissue including fetal tissue, or any other cell present in an organism. Differentiated cell types include adipocytes, fibroblasts, muscle cells, cardiomyocytes, endothelial cells, neurons, glia, blood cells, megakaryocytes, lymphocytes, macrophages, neutrophils, eosinophils, Examples include basophils, mast cells, leukocytes, granulocytes, keratinocytes, chondrocytes, osteoblasts, osteoclasts, hepatocytes and cells of endocrine or exocrine glands.
[0069]
As a method for introducing a double-stranded polynucleotide into a recipient, when the recipient is a cell or tissue, a calcium phosphate method, an electroporation method, a lipofection method, a virus infection, a double-stranded polynucleotide solution Soaking or transformation method is used. Examples of the method for introduction into the embryo include microinjection, electroporation, and virus infection. When the recipient is a plant, a method by injection or perfusion into the body cavity or stromal cells of the plant or spraying is used. In the case of an animal individual, it is introduced systemically by oral, topical, parenteral (including subcutaneous, intramuscular and intravenous administration), vaginal, rectal, nasal, ophthalmic, intraperitoneal administration, etc. The method, electroporation method, virus infection or the like is used. For methods for oral introduction, double-stranded polynucleotides can be mixed directly with the food of the organism. Furthermore, when introduced into an individual, it can be administered, for example, as an implanted long-term release preparation or by ingesting an introduced body into which a double-stranded polynucleotide has been introduced.
[0070]
The amount of the double-stranded polynucleotide to be introduced can be appropriately selected depending on the introduced body and the target gene, but it is preferable to introduce an amount sufficient to introduce at least one copy per cell. Specifically, for example, when the recipient is a cultured human cell and a double-stranded polynucleotide is introduced by the calcium phosphate method, 0.1 to 1000 nM is preferable.
[0071]
By suppressing the expression of the DNA of the present invention in the introduced body by RNA interference, the function of the protein encoded by the DNA of the present invention can be confirmed, or a new function can be analyzed.
[0072]
(6) An antibody that specifically binds to the protein of the present invention
As a method for preparing an antibody that specifically binds to the protein of the present invention, a commonly used known method can be used. A polypeptide used as an antigen also has a high antigenicity according to a known method and has an epitope (antigen determination). A sequence suitable as the group) can be selected and used. As an epitope selection method, for example, commercially available software such as Epitope Adviser (Fujitsu Kyushu System Engineering Co., Ltd.) can be used. In addition, when the target protein is a splicing variant in which a known variant exists, it is specific to the target protein by using an antibody that reacts only with the target protein and does not react with a known or other variant. Function can be identified. As an epitope of such an antibody, for example, when there is an amino acid sequence in which the target protein is deleted compared to a known variant, an amino acid sequence (junction part) before and after the deleted part is preferable. In addition, when the target protein has an amino acid sequence to which a known variant N-terminal or C-terminal is added, it is also preferable to use the added amino acid sequence as an epitope. As a method other than the above, an antibody that reacts only with the target protein can be obtained by removing an antibody that reacts with a known or other variant from the polyclonal antibody obtained against the target protein. As a method for removal, affinity chromatography in which a known or other variant is immobilized as a ligand, or an immunoprecipitation method using a known or other variant is used.
[0073]
The polypeptide used as the antigen may be a synthetic peptide synthesized according to a known method, or the protein of the present invention itself. Polypeptides that serve as antigens can be prepared in an appropriate solution according to known methods and immunized to mammals such as rabbits, mice, rats, etc. In order to perform stable immunization or increase antibody titers It is preferable to immunize by using an antigen peptide as a conjugate with an appropriate carrier protein or adding an adjuvant or the like.
[0074]
There are no particular limitations on the route of administration of the antigen during immunization, and any route such as subcutaneous, intraperitoneal, intravenous, or intramuscular may be used. Specifically, for example, a method of inoculating BALB / c mice several times every several days to several weeks is used. The antigen intake is preferably about 0.3 to 0.5 mg / dose when the antigen is a polypeptide, but is appropriately adjusted depending on the type of polypeptide and the animal species to be immunized.
[0075]
After immunization, blood is collected on a trial basis as appropriate, and an increase in antibody titer is confirmed by a method such as octaloney method, solid phase enzyme immunoassay (hereinafter sometimes referred to as “ELISA method”) or Western blotting. Blood is collected from an animal with a sufficiently increased antibody titer. A polyclonal antibody can be obtained by performing an appropriate treatment used for preparing the antibody. Specific examples include a method of obtaining a purified antibody obtained by purifying antibody components from serum according to a known method. For purification of antibody components, methods such as salting out, ion exchange chromatography, affinity chromatography and the like can be used.
[0076]
A monoclonal antibody can also be produced by using a hybridoma fused with the spleen cells and myeloma cells of the animal according to a known method (Milstein, et al., Nature, 256: 495 (1975)). . A monoclonal antibody can be obtained, for example, by the following method.
[0077]
First, antibody-producing cells are obtained from an animal having an increased antibody titer by immunization with the antigen described above. The antibody-producing cells are plasma cells and lymphocytes that are precursor cells thereof, and these may be obtained from any individual, but are preferably obtained from spleen, lymph nodes, peripheral blood, and the like. The myeloma to be fused with these cells is generally a cell line obtained from a mouse, for example, an 8-azaguanine resistant mouse (BALB / c-derived etc.) myeloma cell line P3X63-Ag8.653 (ATCC: CRL). -1580), P3-NS1 / 1Ag4.1 (RIKEN Cell Bank: RCB0095) and the like are preferably used. For cell fusion, antibody-producing cells and myeloma cells are mixed at an appropriate ratio, and 50% polyethylene is added to an appropriate cell fusion medium such as RPMI 1640, Iskov modified Dulbecco medium (IMDM), Dulbecco modified Eagle medium (DMEM), or the like. It can be performed by using a solution in which glycol (PEG) is dissolved. It can also be carried out by electrofusion (Zimmermann, U. et al., Naturwissenschaften, 68: 577 (1981)).
[0078]
The hybridoma was prepared by using 5% CO 2 in a normal medium (HAT medium) containing an appropriate amount of hypoxanthine / aminopterin / thymidine (HAT) solution using the fact that the myeloma cell line used was an 8-azaguanine resistant strain.2It can be selected by culturing at 37 ° C. for an appropriate time. This selection method can be appropriately selected depending on the myeloma cell line used. The antibody titer of the antibody produced by the selected hybridoma is analyzed by the method described above, the hybridoma producing the antibody having a high antibody titer is separated by a limiting dilution method, etc., and the isolated fused cells are cultured in an appropriate medium. A monoclonal antibody can be obtained by purifying the resulting culture supernatant by an appropriate method such as ammonium sulfate fractionation or affinity chromatography. For purification, a commercially available monoclonal antibody purification kit can also be used. Furthermore, ascites containing a large amount of the monoclonal antibody of the present invention can be obtained by growing the antibody-producing hybridoma obtained above in the abdominal cavity of an animal of the same strain as the immunized animal or a nude mouse.
[0079]
In addition, when a human-derived protein is obtained as the protein of the present invention, the above-described method is applied to severe combined immune deficiency (SCID) mice transplanted with human peripheral blood lymphocytes using such a polypeptide or a partial peptide thereof as an antigen. The human-type antibody can also be produced by immunizing in the same manner as described above and producing a hybridoma between the antibody-producing cells of the immunized animal and human myeloma cells (Mosier, DE, et al., Nature, 335: 256-259 (1988); Duchosal, MA, et al., Nature, 355: 258-262 (1992)).
[0080]
In addition, RNA is extracted from the obtained hybridoma producing the human antibody, the gene encoding the desired human antibody is cloned, this gene is inserted into an appropriate vector, and this is introduced into an appropriate host. By expressing it, it is possible to produce a human antibody in a larger amount. Here, an antibody having a low binding property to an antigen can also be obtained as an antibody having a higher binding property by using a known evolutionary engineering technique. A partial fragment such as a transient antibody can be prepared by cleaving the Fab portion and the Fc portion using, for example, papain, and collecting the Fab portion using an affinity column or the like.
[0081]
The antibody that specifically binds to the protein of the present invention thus obtained can also be used as a neutralizing antibody that inhibits the kinase activity or the like of the protein by specifically binding to the protein of the present invention. There is no particular limitation on the method for selecting the protein that inhibits the activity of the protein. For example, whether or not the function of the target protein in the introduced body is inhibited by contacting the antibody with the DNA introduced body prepared in (2) above. And a method for analyzing the above.
[0082]
Such a neutralizing antibody can be used alone in the clinical application, but can also be used as a pharmaceutical composition by blending with a pharmaceutically acceptable carrier. The ratio of the active ingredient to the carrier at this time can vary between 1 and 90% by weight. In addition, such drugs can be administered in various forms, such as tablets, capsules, granules, powders, syrups or the like, or injections, drops, liposomes, Parenteral administration with a suppository or the like can be mentioned. Further, the dose can be appropriately selected depending on symptoms, age, body weight and the like.
[0083]
(7) Screening for molecules that modulate the activity of the protein of the present invention
By screening for a substance that specifically binds to the protein of the present invention and has an action of inhibiting, antagonizing or enhancing the function (activity) of the protein of the present invention, the function regulator of the protein of the present invention (hereinafter referred to as this) (Sometimes referred to as “regulators”).
[0084]
Any method may be used for this modulator screening method as long as it is capable of obtaining a substance that specifically binds to the protein of the present invention and has an action of inhibiting, antagonizing or enhancing the activity of the protein. For example, first, the protein of the present invention is contacted with a substance to be screened (hereinafter sometimes referred to as “test substance”) and selected with the binding property to the protein as an index. A method of selecting a test substance using the change in activity of the protein as an index can be used.
[0085]
The test substance may be any substance that can interact with the protein of the present invention and affect the activity of the protein. Specifically, for example, a peptide , Proteins, non-peptidic compounds, low molecular weight compounds, synthetic compounds, fermentation products, cell extracts, animal tissue extracts and the like. These substances may be novel substances or known substances. As a method for analyzing the interaction between the test substance and the protein of the present invention, a conventional method known per se can be used. Specifically, for example, the yeast two-hybrid method, the fluorescence depolarization method, the surface plasmon method , Phage display method, ribosomal display method, competition analysis method with the antibody described in (6) above, and the like. By such a method, a substance found to bind to the protein of the present invention is then analyzed by analyzing how the activity of the protein of the present invention is affected in the presence of the substance. Whether it is used as a modulator is identified. Here, when the target protein is a splicing variant in which a known variant exists, the effect is analyzed on a substance that binds only to the target protein and does not bind to a known or other variant, or a known Alternatively, the effect of the substance on the target protein can be analyzed by identifying whether or not other variants bind in the same manner, and analyzing the difference in the effects when binding. Further, by examining the distribution of the substance in an individual, the influence on the target protein and known or other variants can be analyzed.
[0086]
As a specific analysis method, for example, when analyzing a substance that regulates kinase activity, a protein serving as a substrate is also introduced into the DNA transductant described in (2) by the same method. The phosphorylation of the protein serving as a substrate in the presence / absence of the substance selected for this transductant is analyzed by a commonly used method known per se. Specifically, it can be performed using the method described in (3) above. If the phosphorylation of the substrate protein is increased compared to that in the absence of the substance, the substance may function as a kinase activator, and if it is reduced or inhibited The substance can be identified as having the potential to function as a kinase inhibitor.
[0087]
Here, when using the DNA or recombinant protein of the present invention used for screening a regulatory substance for the purpose of obtaining a pharmaceutically active ingredient, it is preferable to use the human homolog described above. Furthermore, the substance screened by the above method may be further selected as a pharmaceutical candidate by in vivo screening. The evaluation of the protein function regulator of the present invention is not limited to the method described above.
[0088]
The kinase activity of the protein of the present invention includes, for example, a signal transduction function on a pathway associated with cancer, a signal transduction function on a pathway associated with myocardial development, a signal transduction function on a pathway that controls sperm motility, Signaling function on pathway controlling germ cell differentiation, Signaling function on pathway controlling cell differentiation, Signaling function on pathway controlling sperm differentiation, Signaling function on pathway controlling onset of Alzheimer's disease , Function to produce glycerol triphosphate, brain cortex development, signaling function on pathways that control migration such as neurons, functions related to fatty acid and sterol synthesis, signaling functions on pathways related to cell death, insulin Signal transduction and the like. Therefore, compounds that can be identified by this screening method can be used as anticancer agents, heart disease treatment agents, infertility treatment agents, regenerative tissue inducers, Alzheimer's disease treatment agents, neurodegenerative disease treatment agents, and diabetes treatment agents.
[0089]
The DNA encoding the protein of the present invention is derived from a cDNA library constructed from RNA derived from tissues or organs such as adrenal gland, uterus, testis, and brain (whole brain, caudate nucleus, amygdala, thalamus, cerebellum). Since the protein of the present invention that has been cloned and obtained may have a specific function in the tissue or organ, etc., the function regulator of the protein of the present invention is unique to the tissue or organ. It can be used as a therapeutic agent for diseases.
[0090]
Such a modulator can be used alone in the clinical application, but can also be used as a pharmaceutical composition by blending with a pharmaceutically acceptable carrier. The ratio of the active ingredient to the carrier at this time can vary between 1 and 90% by weight. In addition, such drugs can be administered in various forms, such as tablets, capsules, granules, powders, syrups or the like, or injections, drops, liposomes, Parenteral administration with a suppository or the like can be mentioned. Further, the dose can be appropriately selected depending on symptoms, age, body weight and the like.
[0091]
(8) Screening for DNA expression regulators of the present invention
Examples of the screening method include a method of analyzing the expression level of the protein of the present invention or mRNA encoding the same in the presence of a test substance. Specifically, for example, cells expressing the protein of the present invention described in (2) are cultured in an appropriate medium containing a test substance, and the amount of the protein of the present invention expressed in the cells is determined by ELISA or the like. Or the amount of mRNA encoding the protein of the present invention in the cells can be analyzed by quantitative reverse transcription PCR, Northern blotting, or the like.
[0092]
As the test substance, those described in (7) can be used. If this analysis shows that the amount of protein or mRNA expressed in the cells cultured in the absence of the test substance increases compared to the amount of the test substance, the test substance becomes a substance that promotes the expression of the DNA of the present invention. In the case of decrease, it can be determined that this test substance can be used as a DNA expression inhibitor of the present invention.
[0093]
Such an expression regulating substance can be used alone in the clinical application, but can also be used as a pharmaceutical composition by blending with a pharmaceutically acceptable carrier. The ratio of the active ingredient to the carrier at this time can vary between 1 and 90% by weight. In addition, such drugs can be administered in various forms, such as tablets, capsules, granules, powders, syrups or the like, or injections, drops, liposomes, Parenteral administration with a suppository or the like can be mentioned. Further, the dose can be appropriately selected depending on symptoms, age, body weight and the like.
[0094]
(9) DNA-introduced animal of the present invention
The introduction DNA containing the DNA of the present invention described in (1) above is constructed, introduced into a fertilized egg of a mammal other than a human, and transplanted into a female individual uterus to generate it. Non-human mammals into which DNA has been introduced can be produced. More specifically, for example, after a female individual is over-ovulated by hormone administration, mated with a male, a fertilized egg is extracted from the oviduct on the first day after mating, and the introduced DNA is microinjected into the fertilized egg. It introduces by the method of. Thereafter, after culturing by an appropriate method, the surviving fertilized eggs are transplanted into the uterus of a pseudo-pregnant female individual (temporary parent) to give birth. Whether or not the target DNA has been introduced into the newborn can be identified by performing Southern blot analysis of DNA extracted from the cells of the individual. Examples of mammals other than humans include mice, rats, guinea pigs, hamsters, rabbits, goats, pigs, dogs, cats and the like.
[0095]
The thus-obtained DNA-introduced animal of the present invention is mated and obtained offspring by subculture in a normal breeding environment while confirming that the introduced DNA is stably retained. be able to. Moreover, the offspring can be obtained by repeating in vitro fertilization and a line can be maintained.
[0096]
The non-human mammal into which the DNA of the present invention has been introduced can be used as an analysis of the function of the DNA of the present invention in vivo, or as a screening system for substances that regulate it.
[0097]
(10) Other uses of the protein of the present invention and DNA containing the base sequence encoding it
The protein of the present invention can be used as a carrier on which the protein is bound. Moreover, the base sequence encoding the protein of the present invention, for example, the DNA having the base sequence described in any one of SEQ ID NOs: 1 to 12 and partial fragments thereof can be used as a carrier on which they are bound on a substrate. Hereinafter, these may be referred to as “protein chip”, “DNA chip” or “DNA array” (DNA microarray and DNA macroarray). These protein chips, or DNA chips or arrays, may contain other proteins and DNAs in addition to the proteins and DNAs of the present invention. Here, when the target protein is a splicing variant in which a known variant exists, an amino acid sequence partial fragment specific to the target protein can be used for the protein chip, but has a three-dimensional structure different from other variants. Since there is a possibility, the full length can also be used. For the DNA array, it is preferable to select a sequence different from other variant DNAs among the DNA sequences encoding the target protein.
[0098]
In addition, as a substrate for binding proteins and DNA, a resin substrate such as a nylon membrane or a polypropylene membrane, a nitrocellulose membrane, a glass plate, a silicon plate, or the like is used. When performing using a substance etc., the glass plate, silicon plate, etc. which do not contain a fluorescent substance are used suitably. The protein or DNA can be easily bound to the substrate by a commonly used method known per se. These protein chips, DNA chips, or DNA arrays are also included in the scope of the present invention.
[0099]
The amino acid sequence of the protein of the present invention and the base sequence of DNA can also be used as sequence information. That is, an amino acid sequence or base sequence database can be constructed by storing the obtained amino acid sequence or base sequence in an appropriate recording medium in a predetermined format readable by a computer. This database may include base sequences of other types of proteins and DNAs encoding the same. In the present invention, the database also means a computer system in which the above array is written on an appropriate recording medium and a search is performed according to a predetermined program. Examples of suitable recording media include magnetic media such as flexible disks, hard disks, and magnetic tapes, optical disks such as CD-ROM, MO, CD-R, CD-RW, DVD-R, and DVD-RAM, and semiconductor memory. Etc.
[0100]
【Example】
EXAMPLES Hereinafter, although an Example is given and this invention is demonstrated in detail, the scope of the present invention is not limited by these Examples. In addition, the result of having performed the following experiment about each acquired cDNA clone was put together in Example 5, and was described.
[0101]
Example 1 Preparation of cDNA library by oligo cap method
Commercially available mRNA extracted as total RNA from human tissues (Clontech: adrenal gland (# 64016-1), uterus (# 64029-1), testis (# 64027-1), cerebellum (# 64035-1)) Poly (A) from the whole brain (# 64020-1)) and from human tissues+Total RNAs of whole brain were extracted from each commercially available mRNA extracted and purified as RNA (Clontech: caudate nucleus (# 6575-1), amygdaloid nucleus (# 6574-1), thalamus (# 6582-1)). Poly (A)+Poly (A) prepared by removing RNA with oligo dT cellulose-From each RNA mixed with RNA, cDNA libraries were prepared by the oligo cap method (Maruyama, K., et al., Gene, 138: 171-174 (1994)).
[0102]
First, the RNA was treated with BAP (Bacterial Alkaline Phosphatase) and TAP (Tobacco Acid Pyrophosphatase), and then an oligocap linker (SEQ ID NO: 25) was ligated using RNA ligase. The first strand cDNA was synthesized by reverse transcription using this RNA strand as a template and an oligo dT primer (SEQ ID NO: 26), followed by degradation and removal of the RNA strand (Suzuki et al., Protein Nucleic Acid Enzyme, 41: 603-607 ( 1996); Suzuki, Y. et al., Gene, 200: 149-156 (1997)). Next, double-stranded cDNA was amplified by PCR (polymerase chain reaction) using 5 ′ PCR primer (SEQ ID NO: 27) and 3 ′ PCR primer (SEQ ID NO: 28), and the amplified DNA strand was cleaved with SfiI. .
[0103]
Next, the SfiI digested fragment obtained above was cloned into the DraIII site of pME18SFL3 (GenBank AB009864), which is an expression vector, to prepare a cDNA library. In the pME18SFL3 vector used above, the SRα promoter and the SV40 small t intron are incorporated upstream of the cloning site, and the SV40 poly (A) addition signal sequence is inserted downstream thereof. Since the cloning site of pME18SFL3 is an asymmetric DraIII site and a complementary SfiI site is added to the end of the cDNA fragment, the cloned cDNA fragment is unidirectional downstream of the SRα promoter. Inserted into. Therefore, in a clone containing a full-length cDNA, it is possible to express a gene transiently by directly introducing the obtained plasmid into a COS cell. That is, it can be analyzed very easily as a protein that is a gene product or as an experimental analysis of their biological activity.
[0104]
For the plasmid DNA of the clones obtained from these, the nucleotide sequence at the 5 'end or 3' end of the cDNA was converted into a DNA sequencing reagent (Dye Terminator Cycle Sequencing FS Ready Reaction Kit, dRhodamine Using the Terminator Cycle Sequencing FS Ready Reaction Kit or BigDye Terminator Cycle Sequencing FS Ready Reaction Kit (manufactured by PE Biosystems), the DNA base sequence is analyzed with a DNA sequencer (ABI PRISM 3700: PE Biosystems) after sequencing according to the manual. did.
[0105]
Example 2 Evaluation of full length of 5 'end of clone from cDNA library prepared by oligocap method
The base sequence of the 5 ′ end of the human cDNA library prepared in Example 1 is compared with the sequence of known human mRNA in the public database, and all clones having the same 5 ′ end sequence are known in the public database. When the 5 ′ end extends longer than the mRNA sequence, or when the 5 ′ end is short but has a translation initiation codon, it is determined as “full length”, and when the translation initiation codon is not included, “non-full length” It was judged.
[0106]
Next, clones were evaluated using ESTiMateFL. ESTiMateFL is a method developed by Nishikawa and Ota et al. Of Helix Laboratories in order to select clones with high possibility of full-length cDNA by comparing with EST 5 'and 3' end sequences in public databases. is there. The 5 ′ end or 3 ′ end sequence of the cDNA clone analyzed in Example 1 is compared with the base sequence registered in the EST database, and extends to the 5 ′ side or 3 ′ side of the obtained cDNA clone sequence. When the EST was present, it was judged that the clone was “possibly not full length”. When the 5 'end is extended from the EST sequence in the public database, or even if the 5' end is short, the difference is within 50 bases for the sake of convenience, and when it is shorter than that, the non-full length is assumed. .
[0107]
Example 3 Analysis of nucleotide sequence and amino acid sequence of cDNA clone
Homology search for all nucleotide sequences of cDNA clones analyzed in Example 2 using BLAST (Basic local alignment search tool; Altschul, SF, et al., J. Mol. Biol., 215: 403-410 (1990)) (Homology search) and HMMER (Hidden Markov Model Sequence Analysis Method; Eddy, SR, Bioinformatics, 14: 755-763 (1998)). /pfam.wustl.edu) and the function of the protein encoded by each cDNA clone was estimated. In addition, with regard to a clone presumed to be a splicing variant in which there is a known clone in which a part of the base sequence is completely identical, any exon deleted and spliced if the genome sequence can be analyzed It was analyzed.
[0108]
Example 4 Measurement of kinase activity
(1) Preparation of protein
A cDNA clone presumed to have kinase activity in Example 3 was synthesized using a cell-free protein synthesis system, and whether or not the protein had kinase activity was determined by the following biochemical experiment. Analyzed.
[0109]
The ORF fragment of the cDNA clone presumed to have kinase activity in Example 3 was obtained by PCR using the following primers specific to each clone as 5′-side primers and the following common primers as 3′-side primers: I got it.
[0110]
5 'primer
(A) c-testi2053667: ATGGTGTTTCCAAACTATCATATTTATCCTC (SEQ ID NO: 29)
(B) c-brcan2018240: ATGGCCTTCATGGAGAAGCC (SEQ ID NO: 30)
(C) c-brace 3038687: ATGTCGTCGTCCTTCTTCAAC (SEQ ID NO: 31)
(D) c-brace 3050764: ATGGAGCCCATGTATCAAGATCG (SEQ ID NO: 32)
(E) c-bramy 3018357: ATGAGCCCTGAGGGCC (SEQ ID NO: 33)
(F) c-brawh 30228866: ATGAGCAGCAATGATATTCAGTACC (SEQ ID NO: 34)
(G) c-brough 3043827: ATGCTCGAGGCCCGG (SEQ ID NO: 35)
(H) c-brtha2034874: ATGGCGGCTCCGAGC (SEQ ID NO: 36)
(I) c-testi4052197: ATGTTCACCTTGGGATACCATGG (SEQ ID NO: 37)
3 'common primer
GGAGAAAGGCGGACAGGTAT (SEQ ID NO: 38)
[0111]
A translation control region containing SP6 promoter-glutathione-S-transferase gene-PreScission Protease (manufactured by Amersham Pharmacia Biotech) -cleavage site-DNA cloning site (SmaI, SfiI) -poly (A) signal sequence vector (pEU) -Inserted into the cloning site of SS4).
[0112]
Using the plasmid DNA prepared above as a template, transcription was performed using SP6 RNA polymerase (Promega), and the resulting RNA was extracted with phenol / chloroform and precipitated with ethanol, followed by Nick Column (Amersham Pharmacia Biotech). Purified by
[0113]
The method of cell-free protein synthesis using the wheat germ extract by dialysis was according to the method of a previous report (Endo, Y. et al., J. Biotech., 25: 221-230 (1992)). The reaction solution contains 24% of wheat germ extract, and has the following composition according to the method of Erickson et al. 20 mM HEPES-KOH, pH 7.6, 80 mM potassium acetate, 1.6 mM magnesium acetate, 0.4 mM spermidine, 2 mM dithiothreitol, 20 L-amino acids (each 0.24 mM), 1.2 mM ATP, 0.26 mM GTP, 16 mM creatine phosphate, 0.4 mg / ml creatine kinase, 1000 units / ml ribonuclease inhibitor (RNasinTM) Was added with the above-mentioned mRNA (1 mg / ml reaction volume). The reaction solution was placed in a floater riser (Spectra / Float-A-Lyzer (Biotech RC), molecular weight cut-off: 10 kDa, volume: 1 ml), and 40 times the volume of the reaction solution was dialyzed externally (30 mM HEPES-KOH, pH 7). .6, 100 mM potassium acetate, 2.7 mM magnesium acetate, 0.4 mM spermidine, 2.5 mM dithiothreitol, 20 L-amino acids (0.3 mM each), 1.2 mM ATP, 0.25 mM GTP, 16 mM creatine The reaction was carried out at 26 ° C. for 48 hours in a dialysis system against phosphoric acid).
[0114]
After completion of the reaction, the dialyzed solution was centrifuged at 16,000 rpm for 5 minutes, and the supernatant was separated. This supernatant was diluted 5-fold with 50 mM Tris / HCl buffer (pH 8.5) containing 150 mM sodium chloride and 10 mM dithiothreitol, and glutathione sepharose 4B (Amersham Bio), an affinity resin equilibrated with the same buffer. The product was added to an affinity column packed with Science) at room temperature to adsorb the target protein. Here, 1/2 column of affinity resin of the obtained centrifugal supernatant was used for the column.
[0115]
Further, after washing the column with 10 times the same volume of the affinity resin used above, a 25-fold dilution of 2 units / μl PreScission protease (Amersham Biosciences) in the same buffer was used. After adding an equal volume to the resin and performing a cleavage reaction at 4 ° C. for 40 hours, the target protein was eluted with the buffer solution.
[0116]
(2) Kinase activity measurement using ATP consumption of target protein as an index
The target protein isolated in (1) above was quantified using bovine serum albumin as a standard. Dithiothreitol was added to 0.1 μg of the target protein in a final concentration of 1 to 10 mM in 50 mM Tris / HCl buffer (pH 7.4) containing 0.2 mg / ml bovine serum albumin and 8 mM magnesium chloride. After incubating with 1 μM ATP for 24 hours at room temperature, 100 μl of luciferase luciferin kit (manufactured by Wako Pure Chemical Industries, Ltd.) was added and reacted at room temperature for 24 hours, and then the fluorescence intensity at 560 nm was measured. Fluorescence intensity at 560 nm was measured in the same manner using the reaction system to which the target protein was not added as a control. The difference between the value of this control and the value of the system to which the target protein was added was defined as the amount of ATP consumed by the target protein, and the amount of ATP (mol) consumed per mol of the target protein for 24 hours was identified as the kinase activity of the target protein.
[0117]
(3) Measurement of kinase activity using polypeptide phosphorylation by the target protein as an index
The target protein isolated in (1) above was quantified using bovine serum albumin as a standard. 0.1 μg of the target protein was converted into a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2: Promega, MLCKS, CaMKII: Sigma, Syntide 2: BACHEM FEINCHEMIKALIEN AG) as a substrate. 0.2 μg / ml bovine serum albumin, 1 to 10 mM dithiothreitol, 50 mM Tris / HCl buffer (pH 7.4) containing 8 mM magnesium chloride, and 1 μM ATP were incubated for 2 hours at room temperature. After completion of the reaction, the reaction solution was added to a Bakerbond C18 (JT Baker: 0.46 × 25 cm) column equilibrated with 0.1% trifluoroacetic acid containing 20% acetonitrile, and 0.1% trifluoroacetic acid was added. The peptides were separated at a flow rate of 1 ml / min with a linear gradient of 60-80% acetonitrile in 60 minutes in the presence of. Peptide elution was measured by absorbance at 215 nm. As a control, the reaction solution to which the target protein was not added was separated in the same manner and the absorbance at 215 nm was measured (FIG. 21). Here, it is possible to determine that a polypeptide in which a decrease in peak and a change in elution position are detected by adding a target protein serves as a substrate for the kinase activity of the target protein.
[0118]
Example 5 Analysis results of each cDNA clone
(1) c-adrgl2001554 (SEQ ID NOS: 1, 13)
c-adrgl2001554 (hereinafter referred to as “the present DNA” and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 1, consists of 2168 bases, of which base number 39 From 1 to 2159 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 706 amino acid residues (SEQ ID NO: 13). When a homology search was performed on the amino acid sequence of SEQ ID NO: 13 using BLAST, an NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) ( i) The amino acid sequences described in the database registration symbols AX0409998 and WO00 / 65040 were hit. As its contents, the amino acid sequence described in AX040998 and WO00 / 65040 consists of 626 amino acids, and amino acid numbers 17 to 616 in the amino acid sequence are amino acid numbers 25 to 25 of the amino acid sequence described in SEQ ID NO: 13. No. 661, E-value (expected value in which the query sequence accidentally exists in the database): 3 × 10-82And it was found to have 32% identity across 655 amino acid residues. In addition, (ii) database registration symbol P50528, Serine / threonine-protein kinase plol (Fission yeast) was hit. As its contents, P50528 is composed of 683 amino acids, and amino acid numbers 47 to 674 in the amino acid sequence are amino acid numbers 45 to 695 of the amino acid sequence described in SEQ ID NO: 13, and E-value: 6 × 10 6-75And it was found to have 32% agreement over 670 amino acid residues. Furthermore, (iii) database registration symbol, Q9R011, Cytokine-inducible Serine / threonine-protein kinase (rat) was hit. As its contents, Q9R011 consists of 615 amino acids, and amino acid numbers 31 to 558 in the amino acid sequence are amino acid numbers 39 to 645 of the amino acid sequence described in SEQ ID NO: 13, and E-value: 7 × 10-71It was also found that there was a 30% agreement over 613 amino acid residues. From these results, it was speculated that the protein consisting of the amino acid sequence shown in SEQ ID NO: 13 was a novel serine / threonine protein kinase. The protein (ii) is related to the formation of septum in G1 and G2 cells from the literature information (Genes Dev., 9: 1059-1073 (1995)) in the database. Was found to be involved in signal transduction that regulates synapse formation from literature information in the database (EMBO J., 18: 5528-5539 (1999)). All of them show involvement in the cell cycle, and the latter is thought to have a role in nerve function.
[0119]
In addition, when the amino acid sequence of SEQ ID NO: 13 was subjected to a protein feature search by HMMPFAM, the amino acid sequence shown by amino acid numbers 39 to 297 of SEQ ID NO: 13 was a sequence showing the characteristics of the protein kinase domain (Pkinase was entered as pkinase). Amino acid sequence). According to PROSITE (Nucleic Acid Res., 30: 235-8 (2002)), which is a database of amino acid patterns that classifies domain structures and families based on similarity in protein function and can search for functionally important sites In this protein kinase domain, amino acid numbers 45 to 69 are ATP regions (ATP binding sites), and amino acid numbers 158 to 171 are ST regions (sites that phosphorylate serine / threonine of the substrate). Serine / threonine Since it retains a functionally important site of protein kinase, it is considered to have kinase activity. Further, in the search by HMMPFAM, a sequence showing the characteristics of the POLO box duplicated region (amino acid sequence entered as PLO_box in Pfam) was also found in the amino acid sequence shown in amino acid numbers 511 to 585. POLO boxes are known to be a subgroup of serine / threonine protein kinases that are involved in the cell cycle, particularly in the M phase and cytokine functions. Furthermore, analysis by PSORT II (Trends Biochem. Sci., 24: 34-6 (1999)), a program for predicting the intracellular localization of the protein, revealed that the probability of localization of this protein in the cell is different from the cytoplasm. 43.5%, nucleus 26.1%, mitochondria 17.4%, vacuole 4.3%, plasma membrane 4.3%, peroxisome 4.3%. Therefore, it was found that this protein has the highest probability of being present in the cytoplasm.
[0120]
On the other hand, in order to obtain genomic information, software sim4 (Genome Res., 8: 976-74 (1998)) that maps human cDNA to the human genome sequence was used. None of them were mapped. This means that this DNA is not present in the draft sequence of the human genome and cannot be predicted. However, we have succeeded in cloning this DNA for the first time through repeated studies. From the above, it was speculated that this protein is a novel serine / threonine protein kinase having functions related to the cell cycle and nerve function. In addition, this DNA has been cloned from the adrenal gland, and it has been speculated that this protein may be related to development, differentiation, function and disease peculiar to the tissues and cells.
[0121]
(2) c-testi2053667 (SEQ ID NOs: 2, 14)
c-testi2053667 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) is composed of 2135 bases as shown in SEQ ID NO: 2, of which the base number is 36th. To 1454 are open reading frames (including stop codon). The amino acid sequence predicted from the open reading frame consists of 472 amino acid residues (SEQ ID NO: 14). When a homology search was performed on the amino acid sequence of SEQ ID NO: 14 using BLAST, an NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) ( i) Database registration symbols AY061183 and LD14901p (fluit fly) were hit. As its contents, AY061183 consists of 790 amino acids, and amino acid numbers 325 to 788 in the amino acid sequence are the amino acid numbers 7 to 468 of the amino acid sequence described in SEQ ID NO: 14, and E-value: 5 × 10-135And it was found that there was a 52% agreement over 471 amino acid residues. In addition, (ii) database registration symbol P36102, PAB-dependent poly (A) -specific ribonuclease subunit PAN3 (Yeast) was hit. As its contents, P36102 consists of 679 amino acids, and amino acid numbers 231 to 677 in the amino acid sequence are amino acid numbers 6 to 464 of the amino acid sequence described in SEQ ID NO: 14, and E-value: 1 × 10-47It was also found that there was a 26% identity across 482 amino acid residues. Furthermore, (iii) database registration symbols AB062450 and NEK7 (Human) were hit. As its contents, AB062450 consists of 302 amino acids, and amino acid numbers 35 to 182 in the amino acid sequence are amino acid numbers 78 to 246 of the amino acid sequence described in SEQ ID NO: 14, and E-value: 4 × 10 4-7And 24% identity over 173 amino acid residues. From these results, it was speculated that the protein consisting of the amino acid sequence shown in SEQ ID NO: 14 was serine / threonine protein kinase. The above-mentioned protein (ii) is further related to the function of shortening poly A of mRNA in vivo from literature information (Mol. Cell. Biol., 16: 5744-5753 (1996)) in the database. It has been clarified that the protein (iii) is involved in the regulation of mitosis from literature information in the database (Genomics, 68: 187-196 (2000)). Both show involvement in the cell cycle.
[0122]
In addition, when the protein feature search by HMMPFAM was performed for the amino acid sequence of SEQ ID NO: 14, the amino acid sequence shown by amino acid Nos. 87 to 334 of SEQ ID NO: 14 is a sequence showing the characteristics of the protein kinase domain (Pkinase is entered as Pkinase) Amino acid sequence). Furthermore, analysis by PSORT II (Trends Biochem. Sci., 24: 34-6 (1999)), which is a program for predicting the intracellular localization of the protein, revealed that the probability of localization of this protein in the cell is the cytoplasm. Was 43.5%, nucleus was 30.4%, mitochondria was 17.4%, Golgi apparatus was 4.3%, and endoplasmic reticulum was 4.3%. Therefore, it was found that this protein has the highest probability of being present in the cytoplasm. From these facts, this protein was presumed to be a novel serine / threonine protein kinase having a function related to the cell cycle.
[0123]
When this protein was expressed in the cell-free protein synthesis system of Example 4 (1), the ATP consumption activity (24 units / day) was observed by the method described in Example 4 (2). It was shown that.
[0124]
In addition, in order to examine the expression tissue of this DNA, a BLAST search is performed on dbEST (Nature Genetics, 4: 332-3 (1993)) using this DNA as a query, and E-value ≦ 10-50When the tissue containing the human EST hit in (1) was extracted, the normal mammary gland, immune system / intestine, and cancerous uterus / testis were found. Furthermore, this DNA was cloned from a testis-derived cDNA library. This protein has functions and diseases peculiar to these tissues and cells, such as cancers such as breast cancer, malignant lymphoma, leukemia, colon cancer, uterine cancer, testicular cancer, inflammatory diseases, immune system diseases, allergic diseases, infertility, etc. The possibility of being related can be inferred, and the usefulness as a target of a diagnostic or therapeutic agent for these diseases is expected.
[0125]
(3) c-uteru2008019 (SEQ ID NO: 3, 15)
c-uteru2008019 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 3, consists of 3165 bases, of which base number 401 To 1960 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 519 amino acid residues (SEQ ID NO: 15). When homology search was performed for the amino acid sequence of SEQ ID NO: 15 using BLAST, a database in the NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) The registration symbol BC010640, serine / threonine kinase 3 (Ste20, yeast homolog) (Human) hit with an E-value of 0.0 and 100% consistency over 483 amino acid residues. BC010640 is composed of 491 amino acid residues, and amino acid numbers 9 to 491 in the amino acid sequence matched amino acid numbers 37 to 519 of the amino acid sequence described in SEQ ID NO: 15. The difference in both sequences is the N-terminal 36 residues of this protein and the BC010640 N-terminal 8 residues (FIG. 1).
[0126]
As shown in FIG. 1, the protein feature search by HMMPFAM was performed on the amino acid sequence of SEQ ID NO: 15. As a result, the amino acid sequence shown by amino acid Nos. 55-306 showed the characteristic of the protein kinase domain (Pkin as pkinase). The amino acid sequence to be entered was found. A database of amino acid patterns that classifies domain structures and families based on the similarity of protein functions, according to PROSITE (Nucleic Acids Res., 30: 235-8. (2002)) that can search functionally important sites For example, in this protein kinase domain, amino acid numbers 61 to 85 are ATP regions (ATP binding sites).
[0127]
In order to compare the exon usage situation of this DNA and BC010640 cDNA, alignment to the genome sequence was performed using sim4 (Genome Res., 8: 967-74 (1998)) (FIG. 2). As a result, this DNA is mapped to 13 exons on human chromosome 8, BC010640 shares its 4th to 13th exons, but has another 3 'exon. Since this DNA and BC010640 differ in exons including the translation start point, it was found that the N-terminal amino acid sequences of both proteins differed. This difference may lead to differences in enzyme activity, binding / interaction with other proteins, and expression tissues. From the above, this protein is a splicing variant of BC010640, serine / threonine kinase 3 (Ste20, yeast homolog) (Human).
[0128]
Analysis by the protein localization prediction program PSORT II (Trends Biochem. Sci., 24: 34-6 (1999)) revealed that the localization probability of this protein in the cell was 69.6% of the nucleus. The cytoplasm was found to be 17.4% and peroxisome 13.0%. BC010640 is a member of human Ste20-like kinase (MST), a homologue of budding yeast Ste20, but MST is a substrate for caspases and increases apoptosis sensitivity (J. Biol. Chem., 276: 19276-19285). (2001)) is known. From the above, this protein is considered to be a Ste20-like serine / threonine protein kinase involved in apoptosis.
[0129]
According to the Disease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview) in the annotation information database Ensembl of the eukaryotic genome, the position (q22.2) of this mapped DNA on chromosome 8 is Including q22-q23, there is a cause gene locus for Cohen syndrome, q22.2 is Klippel-Fail syndrome (with a malformation of the larynx), and this DNA may be a causative gene for these diseases, It was speculated that the mutation of this DNA containing splicing variants could be applied to diagnostic agents for these diseases. In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics, 4: 332-3 (1993)) using this DNA as a query, and E-value ≦ 10-50When the tissues with 5 or more human ESTs hit in the above were extracted, normal bone marrow, kidney, prostate, placenta, whole brain, cancerous uterus were obtained. This DNA was cloned from a uterus-derived library. This protein has functions and diseases peculiar to these tissues and cells, such as cancers such as uterine cancer, prostate cancer, brain tumor, myeloma, leukemia, and malignant lymphoma, neurodegenerative diseases such as Alzheimer's disease, Parkinson's disease, and Huntington's chorea. Diagnostic agents for diseases such as central diseases such as depression and schizophrenia, autoimmune diseases, inflammatory diseases, allergic diseases, kidney diseases such as glomerulonephritis, nephrotic syndrome and renal failure, and bone marrow diseases such as Gaucher disease It can be used as a target for drugs and drugs.
[0130]
(4) c-brcan2018240 (SEQ ID NOs: 4 and 16)
c-brcan2018240 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) is composed of 2817 bases as shown in SEQ ID NO: 4, of which base number 42 To 1733 are open reading frames (including stop codon). The amino acid sequence predicted from the open reading frame consists of 563 amino acid residues (SEQ ID NO: 16). When homology search was performed on the amino acid sequence of SEQ ID NO: 16 using BLAST, database registration in the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) The amino acid sequences described in the symbols AX405737 (unnamed ORF) and WO02 / 22660 hit with 95% identity over E-value = 0.0 and 514 amino acid residues. From the alignment of BLAST search, this protein has deleted amino acids corresponding to 17 residues of amino acid numbers 35 to 51 of AX405737 and 1 residue of 489, and amino acid numbers 510, 511, 512 of AX405737. It was found that the amino acids corresponding to Nos. 513 and 513 contained glycine / alanine, isoleucine / alanine, serine / leucine, and alanine / glycine substitution, respectively (FIG. 3). In addition, this DNA has deleted bases corresponding to bases 209 to 259 of AX405737, 3 bases of bases 1569 to 1571, and 34 bases in positions corresponding to bases 1634 and 1635 of AX405737. Has been inserted. This insertion shifts the frame, resulting in a difference between the C-terminal 67 residues of this protein and the AX405737 C-terminal 64 residues.
[0131]
When the protein feature search by HMMPFAM was performed for the amino acid sequence of SEQ ID NO: 16, the amino acid sequence shown by amino acid numbers 132 to 379 was the sequence showing the characteristics of the protein kinase domain (amino acid sequence entered as pkinase in Pfam). I found it. In addition, a sequence showing the characteristics of the PX domain (amino acid sequence entered as PX in Pfam) was found in the amino acid sequence shown in amino acid numbers 6 to 105 of SEQ ID NO: 16. The PX domain is a phosphoinositide binding domain and is known to be involved in intracellular signal transduction. Since this protein lacks a part of the PX domain as compared with AX405737, it may have an interaction different from that of AX405737.
[0132]
Using the software sim4 (Genome Res., 8: 967-74 (1998)) that maps the cDNA sequence to the genome sequence, the present DNA and the AX405737 cDNA sequence were mapped to the genome sequence. On the chromosome 3 clone RP11-802023, this DNA was aligned with 18 exons and AX405737 was aligned with 19 exons (FIG. 4). Exons corresponding to the second to sixteenth exons of this DNA are also present in AX405737, but this DNA lacks one exon between the first and second exons. The 17th exon of this DNA is deleted in AX405737, but since this region consists of 34 bases, the frame is shifted, resulting in a difference in the amino acid sequences at the C-terminal of both.
[0133]
When this protein expressed in the cell-free protein synthesis system described in Example 4 (1) was functionally evaluated, the ATP consumption activity (73 units / day) of this protein was detected by the method shown in Example 4 (2). did it. Furthermore, as described in Example 4 (3), the result of analyzing the transphosphorylation activity using a synthetic peptide as a substrate by reversed-phase HPLC (FIG. 22. Arrow indicates the changed elution position), the phosphorylation of Syntide2 The activity (201.1 unit / day) was confirmed, and it became clear that this protein is a kinase. From the above, it was found that this DNA of SEQ ID NO: 4 is a splicing variant of the base sequence described in AX405737 and WO02 / 22660 and encodes a kinase. Since both have different amino acid sequences at the N-terminal part and C-terminal part, binding and interaction with other proteins, expression tissues, and the like may be different.
[0134]
Analysis by PSORT II (Trends Biochem. Sci., 24: 34-6 (1999)), which is a program for predicting the intracellular localization of the protein, revealed that the probability of localization of this protein in the cell was 78 .3%, cytoplasm 8.7%, mitochondria 8.7%, and high localization probability in the nucleus, this protein may be involved in cell proliferation and differentiation, cell cycle, transcription factor control, etc. is there.
[0135]
According to Disease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview) in the annotation information database Ensembl of the eukaryotic genome, the position (p14.3) on the 3rd chromosome where this DNA is mapped P21-p14 contains a locus responsible for autosomal recessive deafness, the possibility that this DNA is a causative gene for these diseases, and mutations in this DNA containing splicing variants are diagnostic agents for the disease It was expected that it could be applied. In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics, 4: 332-3 (1993)) using this DNA as a query, and E-value ≦ 10-50When tissues with 5 or more hit human ESTs were extracted, normal immune system / lymph system / skeletal muscle / brain, cancerous immune system / testis were obtained. This DNA was cloned from a cDNA library derived from the caudate nucleus of the brain. This protein has functions and diseases peculiar to these tissues and cells, such as cancers such as lymphoma, leukemia, brain tumor, testicular cancer, skeletal muscle diseases such as muscular dystrophy, myopathy, tetany, myasthenia gravis, immune system diseases, infertility Possibility that it is related to symptom, autosomal recessive deafness, etc. can be inferred, and it is expected to be useful as a target for diagnostic and therapeutic agents for these diseases.
[0136]
(5) c-brace 3003920 (SEQ ID NO: 5, 17)
c-brace 3003920 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) is composed of 5342 bases as shown in SEQ ID NO: 5, of which the base number is 371. To 3874 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 1167 amino acid residues (SEQ ID NO: 17). When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 17, database registration in the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) The amino acid sequences described in the symbols AX262516 (unnamed ORF) and WO 01/73050 hit with 99% identity over E-value: 0.0 and 1160 amino acid residues. From this BLAST search alignment, this protein has threonine / isoleucine, threonine / alanine, and lysine / asparagine substitutions in amino acids corresponding to amino acid numbers 309, 456, and 557 of AX262516. It was found that the terminal 3 residues were different from the N-terminal 72 residues of AX262516, and the C-terminal 4 residues of this protein were different from the C-terminal 12 residues of AX262516 (FIG. 5). Further, this DNA lacks a base corresponding to 148 bases of base numbers 386 to 533 of AX262516.
[0137]
When the protein characteristic search by HMMPFAM was performed for the amino acid sequence of SEQ ID NO: 17, the amino acid sequence shown by amino acid Nos. 1-212 showed the sequence showing the characteristics of the protein kinase domain (amino acid sequence entered as Pkinase in Pfam). I found it. According to PROSITE (Nucleic Acids Res., 30: 235-8 (2002)), which is a database of amino acid patterns classified into domain structures and families based on the similarity of protein functions and capable of searching for functionally important sites In the protein kinase domain of AX262516, amino acid numbers 27 to 51 were ATP regions (ATP binding sites). This region corresponds to the 3 'exon of AX262516 and is deleted in this DNA.
[0138]
Using the software sim4 (Genome Res., 8: 967-74 (1998)) that maps the cDNA sequence to the genomic sequence, the present DNA and the AX262516 cDNA sequence were mapped to the genomic sequence. As a result, both the present DNA and AX262516 were human. Fifteen exons were aligned on chromosome 15 (FIG. 6). In this DNA, one exon part of AX262516 is deleted between the third and fourth exons, and AX262516 does not have an exon corresponding to the first exon of this DNA. In this DNA, the translation region starts from the 3 'end of the third exon, but AX262516 starts from the vicinity of the center of the third exon of the present DNA, and the reading frames at the N-terminal part of both are different. Since AX262516 has an insertion consisting of 148 bases not present in this DNA immediately after the third exon equivalent part, a frame shift occurs, and the translation frames after the fourth exon equivalent part match in both. In addition, a frame shift occurred because one base (cytosine) was inserted at the position (base number 3855) of the corresponding DNA between base numbers 4006 and 4007 located immediately upstream of the translation stop codon of AX262516. As a result, the C-terminal 4 amino acid residues of this protein are different from the C-terminal 12 amino acid residues of the AX262516 protein. Although this insertion is not found in the genome sequence, this difference seems to be an individual difference since both clones with and without this insertion are registered in the EST sequence. From the above, it was presumed that this protein is a variant of the amino acid sequence described in AX262516 and WO01 / 73050, and is a protein kinase or an endogenous inhibitor of protein kinase.
[0139]
Analysis by PSORT II (Trends Biochem. Sci., 24: 34-6 (1999)), which is a program for predicting intracellular localization of the protein, revealed that the probability of localization of this protein in the cell was 91 3%, cytoplasm 4.3%, peroxisome 4.3%, and the localization probability of AX262516 in the cell is 69.6% nucleus, 17.4% cytoplasm, 4.3% cytoskeleton, mitochondria 4 3% and peroxisomes 4.3%. Since this protein has an increased probability of distribution to the nucleus compared to AX262516, this protein may be involved in cell proliferation / differentiation, cell cycle, transcription factor phosphorylation control, etc. in the nucleus, It is expected to have a different function from AX262516.
[0140]
Includes the position (q15.2) on chromosome 15 to which this DNA is mapped by the Disease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview) in the annotation information database Ensembl of the eukaryotic genome Q15.1-q21.1 is found to have the amyotrophic lateral sclerosis (ALS5), and q15.1-q15.3 has the congenital locus of congenital erythropoietic anemia. The possibility of being a gene and the possibility that a mutation of this DNA containing a splicing variant could be applied to a diagnostic agent for these diseases was expected. In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics, 4: 332-3 (1993)) using this DNA as a query, and E-value ≦ 10-50When a tissue having 5 or more human ESTs hit in the above was extracted, normal immune system / lymphoid tissue and cancerous lung were obtained. This DNA was cloned from the cerebellum. Therefore, this protein has functions and diseases peculiar to these tissues and cells, such as cancers such as lymphoma, leukemia, myeloma, lung cancer and brain tumor, spinocerebellar degeneration, inflammatory diseases, allergic diseases, autoimmune diseases, muscle atrophy The possibility of being involved in lateral sclerosis, congenital erythrocytic dysplasia, etc. can be presumed, and it is expected to be useful as a diagnostic or therapeutic target for these diseases.
[0141]
(6) c-brace 3038687 (SEQ ID NO: 6, 18)
c-brace 3038687 (hereinafter referred to as “the present DNA” and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 6, consists of 4938 bases, of which the base number is 81 No. 2720 are predicted to encode a protein of 879 amino acid residues (SEQ ID NO: 18) in an open reading frame (including the stop codon). When the homology search was performed on the amino acid sequence of SEQ ID NO: 18 using BLAST, an NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) and a patent database GENESEQ (Amino acid sequence), WO 98/22507 discloses SEQ ID NO. Human receptor tyrosine kinase LMR1_h described as 11 was hit. Human LMR1_h is a receptor tyrosine protein kinase consisting of 1383 amino acids, and amino acid numbers 10 to 905 in the amino acid sequence are amino acid numbers 1 to 860 of the amino acid sequence shown in SEQ ID NO: 18, and E-value: 0 With 94% identity over 897 amino acid residues.
[0142]
In WO98 / 22507, SEQ ID NO. The gene of human LMR1_h described as 2 (GENESEQ database nucleotide sequence registration symbol AAV32449) can encode a protein (LMR1_h) having 5267 bases and an open reading frame of base numbers 515 to 4138 having 1207 amino acids. However, the amino acid sequence described in the publication (GENESEQ database amino acid sequence registration symbol AAW48842) discloses a protein composed of 1383 amino acids by virtually synthesizing a protein sequence in which 176 amino acids of the rat upstream sequence are linked (this is expressed as LMR1_r + h). (Fig. 7). This is based on the assumption that the human sequence has not reached the N-terminus based on a comparison between the human sequence and the rat sequence, and a full-length human LMR protein has not yet been reported. On the other hand, SEQ ID NO. The rat LMR1_r gene (AAV32448) described as 1 has 2572 bases and takes the largest open reading frame, and has no stop codon at base numbers 13 to 2571. The number of amino acid residues in this part is 853. However, the publication describes a protein (LMR1_r) consisting of 848 amino acids derived from base numbers 13 to 2556 of this base sequence (AAW48841). Rat LMR1_r (AAW48841) has a short C-terminus, indicating that the stop codon is unknown and is incomplete. As described above, in the previously reported LMR protein, human LMR1_h has an incomplete N-terminus, rat LMR1_r has an incomplete C-terminus, and LMR1_r + h merely estimates its full length.
[0143]
The amino acid sequence of SEQ ID NO: 18 differs from the amino acid sequence of LMR1_r + h in the following points.
(A) Although this protein lacks the N-terminal 9 amino acids of LMR1_r + h, the sequence differences in this region are thought to reflect species differences between humans and rats. From the genome mapping described later, the sequence in the vicinity of the translation start of this cDNA matches the human genome sequence.
(B) Between amino acid numbers 467 and 468 of this protein, there is a deletion of 36 amino acids corresponding to amino acid numbers 477 to 511 of LMR1_r + h. This is a result of intra-exon splicing.
(C) The sequence of amino acids 860 and later (amino acids 906 and later of LMR1_r + h) of this protein is different.
LMR1 is a membrane receptor tyrosine kinase that has almost no extracellular domain. When this protein was analyzed with a transmembrane region prediction software TMpred (Biol. Chem. Hoppe-Seyler, 374: 166 (1993)), a transmembrane region consisting of LAVVASFSF LFAVIVLMLA CL was hit at amino acid numbers 32-53. Moreover, when HMMPFAM search is performed, E-value = 3.3 × 10 is set to amino acid numbers 125 to 395 of this protein.-47The protein kinase domain was hit. Since there is a difference between the present protein and LMR1_h on the C-terminal side from the intracellular protein kinase domain, this protein may be involved in signal transduction different from that of LMR1_h.
[0144]
When the position of this DNA sequence on the genome is searched in the NRNEE base sequence database (base sequence database without duplication excluding EST created from EMBL, GenBank, and DDBJ), RPCI-13 Human derived from human chromosome 17 It mapped to Female BAC (database registration symbol AC129919). Therefore, on the sequence of the AC129999 genomic sequence, this DNA was compared with the DNA encoding LMR1_h (WO98 / 22507) using sim4 (Genome Res., 8: 967-74 (1998)). (FIG. 8). As a result, the DNA was composed of 16 exons, and LMR1_h had long exons including the 11th, 12th and 13th exons of the DNA. That is, the present DNA has a deletion of 108 bases and 36 amino acids due to splicing between the 11th and 12th exons (base numbers 1481/1482), and 263 base splicing between the 12th and 13th exons (base number 2660). / 2661) causes a deletion of 88 amino acids and a frame shift, and 19 amino acids are added at the 13th exon after splicing (base numbers 2661 to 3444) to complete the translation. On the other hand, LMR1_h continues to translate and produces a long C-terminal protein. In addition, since the 5 ′ end of LMR1_h is 100 bases shorter than the present DNA, it does not have an ATG translation initiation codon of the present DNA, and when LMR1_h itself predicts an open reading frame, translation will start from the fifth exon downstream. (FIG. 8). From the above, human LMR1_h is an N-terminal incomplete clone, but this protein is considered to be this variant and full length.
[0145]
When this protein was expressed using the wheat germ cell-free protein synthesis system of Example 4 (1), ATP consumption activity was observed in Example 4 (2). In Example 4 (3), Syntide2 was used as a substrate. It was proved to be a kinase from the fact that the HPLC band shift due to the phosphoryl group transfer was observed (FIG. 23).
[0146]
When searching for dbEST (Nature Genetics, 4: 332-3 (1993)) using the 11th, 12th, and 13th exons, which are characteristic of this DNA, as a probe, adult melanoma-derived AL120847 is the base of this DNA sequence. No. 1084 to 1482 (corresponding to the 10th, 11th and 12th exons) was hit. In addition, ABI 600711 derived from the hypothalamus hit 1100 to 1805 (corresponding to the 10th, 11th and 12th exons) of this DNA. This indicates that molecules that splice out between the 11th and 12th exons exist in the melanoma and the hypothalamus. According to WO98 / 22507, expression of LMR1 is restricted to nerve cells. This DNA is a full-length LMR1 isolated from a cerebellum-derived cDNA library and having a different sequence in the intracellular domain. This indicates that this protein is a brain tumor, neuroblastoma, melanoma, and other cancers, neurodegenerative diseases such as Alzheimer's disease, Parkinson's disease, spinocerebellar degeneration, central diseases such as depression, anxiety, schizophrenia, diabetes, etc. It may be involved in endocrine diseases, inflammation, etc., and it can be considered to be used as a diagnostic or therapeutic target for these diseases.
[0147]
(7) c-brace 3050764 (SEQ ID NOs: 7, 19)
c-brace 3050764 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) is composed of 3346 bases as shown in SEQ ID NO: 7, of which the base number is 1744. To No. 2685 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 313 amino acid residues (SEQ ID NO: 19). When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 19, a database in the NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) The cell division kinase 10 / PISSLRE (cdk10, Human) registered under the registration symbol Q1513 is E-value = 5 × 10-179Hit with 99% agreement over 306 amino acids (FIG. 9). The cdk10 protein is a cyclin dependent kinase consisting of 360 amino acid residues and having a protein kinase domain at amino acid numbers 39 to 323. There is a PISSLRE sequence to which a growth inhibitory factor binds at amino acid numbers 80 to 86. Since amino acid sequence numbers 55 to 360 of cdk10 correspond to amino acid numbers 8 to 313 of this protein, this protein was considered to be a variant having a different N-terminus from cdk10.
[0148]
When a HMMPFAM search was performed on the amino acid sequence of SEQ ID NO: 19, a protein kinase domain was found at amino acid numbers 8 to 276. This is shorter on the N-terminal side than the protein kinase domain of cdk10 (amino acid numbers 39 to 323).
[0149]
Since the genomic sequence encoding cdk10 is already known (AJ010341), sim4 (Genome Res., 8: 967-74 (1998)) is obtained from the CDS portion and this DNA on the sequence AC103888 derived from human chromosome 16. The differences in exons were examined by using them (FIG. 10). As a result, the present DNA consists of 12 exons, the CDS of cdk10 shares the 2nd to 12th exons, and two other exons between the first and second exons (first 'and first medium exons). I had. The translation start of this DNA is in the first exon, and cdk10 starts translation from the first 'exon. Thus, the difference in the N-terminal amino acid sequences of both proteins is due to the different exons that encode them. This DNA is a splicing variant of cdk10.
[0150]
When this protein was expressed in the wheat germ cell-free protein synthesis system of Example 4 (1), it had ATP consumption activity by the method of Example 4 (2) (39 units / day), and Example 4 (3). In this method, HPLC band shift due to phosphate transfer was observed using syntide2 as a substrate (FIG. 24) (159 unit / day), indicating that this protein is a kinase. Since the present protein and cdk10 are different in the N-terminal part of the protein kinase domain, the substrate specificity and activity may be different.
[0151]
It has been reported that the cdk10 protein is involved in the progression of the cell cycle from G2 to M and that growth is suppressed by overexpression (Cancer Res., 55: 3992-3995 (1995)). Although the protein is ubiquitously expressed in adult tissues, it is expected to be a tumor suppressor because it is particularly high in cells that have undergone terminal differentiation, but no mutation has been observed in breast cancer (Genomics, 56 : 90-97 (1999)), details of its function are unknown. However, since this protein has an N-terminal sequence different from cdk10 and may be under different expression control, cell proliferation, differentiation, carcinogenesis, involvement in cancer suppressor functions, immunity / inflammation, neurodegenerative diseases, etc. It can be used as a target for diagnostic and therapeutic drugs.
[0152]
(8) c-bramy 3018357 (SEQ ID NO: 8, 20)
c-bramy 3018357 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 8, consists of 3576 bases, of which the base number is 254. To 2554 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 766 amino acid residues (SEQ ID NO: 20). When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 20, database registration in the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) The symbol AX327993 and WO01 / 81588 disclose SEQ ID NO. The unnamed ORF described as 2 hit with 94% agreement over 660 amino acids with E-value = 0. This sequence consists of 674 amino acids, and the amino acid numbers 31 to 646 coincided with the amino acid numbers 77 to 692 of this protein. This protein appeared to be a variant that differs from AX327993 in the N-terminus and C-terminus (FIG. 11).
[0153]
When the amino acid sequence of SEQ ID NO: 20 is searched by HMMPFAM, a protein kinase domain is detected at amino acid numbers 77 to 316, and amino acid numbers 183 to 183 are searched by PROSITE (Nucleic Acids Res., 30: 235-8 (2002)) search. In 196, a sequence unique to serine / threonine protein kinase was found. On the other hand, when the protein kinase domain of AX327993 was searched by HMMPFAM, it was predicted to exist at amino acid numbers 19 to 270. That is, it is assumed that the protein kinase domain covers different regions of the N-terminal sequences of both, and that the substrate specificity and activity are different.
[0154]
When this DNA is searched against the NRNEE base sequence database (base sequence database without duplication excluding EST created from EMBL, GenBank, and DDBJ), clone CTD derived from human chromosome 11 genomic sequence registered in AC116022 -2583L21 was hit. Therefore, sim327 (Genome Res., 8: 967-74 (1998)) was used on chromosome 11 to align this DNA and AX327999, which was a blast top hit, and compared the exon structure (FIG. 12). This DNA consisted of 21 exons, but AX327993
(A) sharing the 2nd to 20th exons of this DNA;
(B) This DNA has a different first 1 'exon 5' from the first exon.
(C) having another 18 'exon between the 18th and 19th exons of the DNA;
(D) The region corresponding to exon 21 of this DNA is lacking.
The ORF derived from this DNA is present in the 1st to 20th exons, and the ORF of AX327993 is present in the 1 ', 2nd to 18th, and 18th exons. That is, the difference between the N terminus of the two stems from starting translation from a different exon, and the difference at the C terminus is that the present DNA skips the 18 'exon and continues to translation from the 19th exon to the downstream, whereas AX327993 Then, the translation ends at the 18th exon. From the above, it was found that this DNA and AX327993 are splicing variants from the same gene.
[0155]
When this protein was expressed in the cell-free protein synthesis system of Example 4 (1), ATP consumption activity (69 units / day) was observed by the method described in Example 4 (2), and Example 4 (3) In the method described in (1), a band shift due to transfer of a phosphate group was observed using syntide2 as a substrate (FIG. 25) (432 units / day), indicating that this protein is a kinase.
[0156]
Although this DNA was isolated from tonsils of the brain, a homology search was performed on human dbEST (Nature Genetics, 4: 332-3 (1993)) to examine its expression distribution.-100Below, 3 clones derived from the eye and 1 clone derived from the fetal brain were hit. From the above, this DNA and this protein are functions in brain development and differentiation, anxiety, depression, schizophrenia, neurodegenerative diseases, cancer, inflammation, diabetes and other diagnostic and therapeutic agents, or ophthalmology (glaucoma, It can be used as a target for diagnostic and therapeutic agents for cataract, retinopathy, etc.).
[0157]
(9) c-brawh3022866 (SEQ ID NOs: 9, 21)
c-brawh3022866 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) is composed of 4547 bases as shown in SEQ ID NO: 9, of which the base number is 32. To 3898 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 1288 amino acid residues (SEQ ID NO: 21). A homology search was performed on the amino acid sequence of SEQ ID NO: 21 using BLAST. Among human sequences, an NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) ) And in the patent database GENESEQ (amino acid sequence), WO 01/38503 discloses SEQ ID NO. Human protein kinase described as 54 (SGK040, 909 amino acids) hit 88% identity over E-value = 0,945 amino acids. When comparing the amino acid sequence of SEQ ID NO: 21 with the amino acid sequence of SGK040, the amino acid numbers 310 to 407, 408 to 521, 571 to 683, and 684 to 1192 of this protein are the amino acid numbers 20 to 117 of SGK040, The numbers 130 to 243, 244 to 356, and 401 to 909 respectively match (FIG. 13). That is, this protein
(A) 12 amino acids corresponding to amino acid numbers 118 to 129 of SGK040 are deleted,
(B) It has a 49 amino acid insertion between amino acid numbers 243 and 244 of SGK040.
(C) deleting 44 amino acids of amino acid numbers 357 to 400 of SGK040,
(D) the N-terminal amino acid sequence 309 amino acids are different;
(E) This protein is 96 amino acids long with respect to the C-terminus.
[0158]
As a result of HMMPFAM search of the amino acid sequence of SEQ ID NO: 21, a protein kinase domain was predicted at amino acid numbers 684 to 926, and an ATP binding region was predicted at amino acid numbers 684 to 705. SGK040 has a 44 amino acid insertion adjacent upstream of the protein kinase domain. From this, this protein may have a difference in substrate specificity or activity from SGK040. In addition, amino acid numbers 360 to 388 of this protein have a leucine zipper structure in which leucine is repeated 5 times every 7 amino acids, and there is a possibility that the protein interacts or the protein forms a dimer.
[0159]
In order to clarify the exon structure of both DNAs, mapping by sim4 (Genome Res., 8: 967-74 (1998)) was performed (FIG. 14). As a result, it was found that base numbers 16 to 4547 of this DNA were aligned on human chromosome 12 and consisted of 23 exons. On the other hand, SGK040 was aligned with base numbers 52 to 2730 and consisted of 18 exons. SGK040 is
(A) having another 7 'exon between the 7th and 8th exons of the DNA;
(B) The 10th exon of this DNA is deleted
(C) Having another 12 'exon between the 12th and 13th exons of this DNA.
(D) The stop codon TAA appears on the genome following the 22nd exon of the present DNA, and the translation region ends. On the other hand, in this DNA, translation is completed at the 23rd exon.
(E) Although the positions of both 5 ′ sequences cannot be determined in this genome sequence, both are different because there are no common sequences in base numbers 1 to 951 of this DNA and base numbers 1 to 58 of SGK040. Presumed to be derived from exons.
The difference in protein structure from this genome structure can be explained as follows.
(A) This DNA has a deletion of 12 amino acids by skipping the 7 ′ exon,
(B) insertion of 49 amino acids by having the 10th exon,
(C) deletion of 44 amino acids by skipping the 12th exon,
(D) Having a 23rd exon has a 96 amino acid long sequence at the C-terminus.
(E) In addition, the N-terminal amino acid sequence is different by having different 5 ′ exons.
From the above, it was found that this DNA and SGK040 are splicing variants from the same gene.
[0160]
When this protein was expressed in the cell-free protein synthesis system of Example 4 (1), ATP consumption activity (217 units / day) was observed in Example 4 (2), and syntide2 was expressed in Example 4 (3). As a substrate, a band shift in HPLC due to transfer of a phosphate group was observed (FIG. 26) (458 units / day), confirming that it was a kinase.
[0161]
Although this DNA is derived from the brain, in the BLAST search against dbEST (Nature Genetics, 4: 332-3 (1993)), hit clones are found throughout the immune system, skin, kidney, brain, adrenal gland, etc. According to the prediction of subcellular localization by PSORT II (Trends Biochem. Sci., 24: 34-6 (1999)), this protein has 5 nuclear transfer signal candidate sequences and is a RCC (regulator of chromosome condensation signature). Since IGTGGGHILLL is found at amino acid numbers 1225 to 1235, this protein is present in the nucleus and is expected to be involved in chromosome aggregation. Therefore, it can be used as a target for diagnostics and therapeutics for diseases related to cell division, such as cancer, and immunological inflammation (eg, autoimmune diseases, nephritis), hypertension, neurodegenerative diseases, etc. Conceivable.
[0162]
(10) c-browh 3043827 (SEQ ID NO: 10, 22)
c-brawh 3043827 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) is composed of 4222 bases as shown in SEQ ID NO: 10, of which the base number is 146. To 3406 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 1086 amino acid residues (SEQ ID NO: 22). When homology search was performed for the amino acid sequence of SEQ ID NO: 22 using BLAST, a database in the NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) The 1036 amino acid Homo sapiens activated p21cdc42Hs kinase (ACK1) registered under the registration symbol L13738 was hit with E-value = 0, 953 amino acids with 95% agreement. This protein
(A) amino acid numbers 64-577 coincide with amino acid numbers 1-513 of ACK1,
(B) having an insertion of 15 amino acids at amino acid numbers 578-592;
(C) amino acid numbers 593 to 1042 correspond to amino acid numbers 514 to 962 of ACK1,
(D) a deletion of 30 amino acids between amino acid numbers 1042/1043;
(E) Amino acid numbers 1043 to 1086 correspond to amino acid numbers 993 to 1036 of ACK1 (FIG. 15).
[0163]
That is, this protein
(A) N-terminal is 63 amino acids longer than ACK1,
(B) having an insertion of 15 amino acids between amino acids 513 and 514 of ACK1 (amino acids 578 to 592 of this protein),
(C) A variant having a deletion of 30 amino acids (amino acids 963 to 992 of ACK1) between amino acid numbers 1042 and 1043.
[0164]
In order to clarify that it is a splicing variant from the nucleotide sequence, the position on the genome of this DNA and cDNA encoding ACK1 (L13738) was analyzed by sim4 (Genome Res., 8: 967-74 (1998)). (Figure 16). As a result, base numbers 311 to 4222 of this DNA were aligned on the genomic sequence AC112775 derived from human chromosome 3, and this region was defined by 14 exons.
(A) This DNA has an 11th exon not present in ACK1 and thus has an insertion of 15 amino acids.
(B) ACK1 has another 12 'exon insertion between the 12th and 13th exons of this DNA. This is a 30 amino acid deletion for the protein.
(C) In both cases, since the 5 ′ end is not aligned with the genome, the usage status of exons encoding the sequence corresponding to the N-terminus is unknown, but the base numbers 1 to 310 of this DNA and the base numbers 1 to 597 of ACK1 are unknown. Since there is no common part in the numbers, both are considered to be specified in different exons. The open reading frame of this DNA starts from an unaligned upstream exon, and its N-terminus is 63 amino acids longer than ACK1. In addition, when the cDNA of ACK1 (L13738) is mapped, there is an amino acid substitution and a deletion of 1 amino acid due to a deletion of 3 bases in the vicinity of 2 amino acids in exon 12 and a total of 3 bases in the vicinity. This DNA was a sequence reflecting the genome (FIG. 16).
[0165]
ACK1 has a tyrosine protein kinase domain, SH3 domain, cdc42 binding domain, and clathrin binding domain from the N-terminus. On the other hand, as a result of HMMPFAM search of the amino acid sequence of SEQ ID NO: 22, the protein kinase domain was amino acid numbers 180-450, the SH3 domain was amino acid numbers 454-509, and paper information (Nature, 363: 365-367 (1993) )), Cdc42 binding region was found at amino acid numbers 509 to 552, and Clathrin binding region was found at amino acid numbers 639 to 723.
[0166]
When this protein was expressed in the cell-free protein synthesis system of Example 4 (1), ATP consumption activity of 217 units / day was observed in Example 4 (2), and syntide2 was used as a substrate in Example 4 (3). As shown in FIG. 27, phosphoryl group transfer activity of 458.4 units / day was confirmed (FIG. 27), confirming that this protein is a kinase.
[0167]
ACK1 is activated p21cdc42Hs kinase, which phosphorylates activated low molecular weight G protein, inhibits its conversion to an inactivated form, and keeps the G protein in an activated form. RACI, Rho, and Cdc42Hs are known in the Rho family of low molecular weight G protein (GTP binding protein p21). There are active (GTP-binding) and inactive (GDP-binding) types of these molecules. GAP (GTPase activationg protein) is involved in the generation of an inactive form due to its own GTPase activity. Conversion to the active form involves GEF (guanine nucleotide exchange factor). Of these, ACK1 is a tyrosine kinase that binds to active Cdc42Hs and inhibits its GTPase activity, and is involved in cytoskeleton, cell differentiation, cell proliferation and the like. ACK1 phosphorylates Dbl which is GEF, accumulates active low molecular weight G protein (cdc42Hs), and induces actin fibers which are cytoskeleton. ACK1 is known to have a short C-terminal variant ACK2, which is reported to be phosphorylated by EGF (epidermal growth factor) or bradykinin, and regulates cytoskeleton formation in response to signals from outside the cell.
[0168]
Furthermore, it has been reported that ACK1 binds to clathrin and is involved in receptor mediated endocytosis by clathrin-coated vehicle. Clathrin is an organelle lining protein called coated vehicle, coated pit, in which receptors form clusters, and is involved in the endocytosis of macromolecules such as receptors. Endocytosis of receptors into cells is known for many receptors such as chemokine receptors, adrenergic receptors, insulin receptors, LDL receptors that also function as HIV receptors. Incorporation of a ligand-bound receptor regulates signal transduction from the outside of the cell or recycles the receptor. This protein is a protein having an insertion of 15 amino acids between the cdc42 binding region and the clathrin binding region, and there is a possibility that the binding and interaction with cdc42, clathrin and the like are different from ACK1. Based on the above, this protein is a diagnostic agent for cancer, arteriosclerosis, diabetes, HIV, inflammation, diseases related to intracellular uptake of receptors, diseases related to abnormal neurotransmission, dementia such as Alzheimer's disease, hypertension, glaucoma, etc. It can be used as a target for therapeutic drugs.
[0169]
(11) c-brtha2034874 (SEQ ID NOS: 11 and 23)
c-brtha2034874 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 11, consists of 3857 bases, of which base number 55 To 1287 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 410 amino acid residues (SEQ ID NO: 23). When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 23, the database in the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) Dual specificity mitogen-activated protein kinase kinase 4, MAP kinase kinase 4 (MAPKK4), JNK activating kinase 1, c-JunN-terminal kinase kinase 1 (JNKK), SAPK / ERK kinase 1 (SEK1) )) Hit with 97% agreement over E-value = 0, 410 amino acids. MAPKK4 consists of a total length of 399 amino acids. This protein is a variant having an insertion of 11 amino acids between amino acid numbers 39 and 40 of MAPKK4 (amino acid numbers 40 to 50 of this protein) (FIG. 17).
[0170]
When the amino acid sequence of SEQ ID NO: 23 is searched by HMMPFAM, a protein kinase domain is searched at amino acid numbers 113 to 378, and when PROSITE (Nucleic Acids Res., 30: 235-8 (2002)) is searched, ST region ( ATP region (ATP binding site of protein kinase) was detected at amino acid numbers 119 to 143 of serine / threonine protein kinase (characteristic sequence).
[0171]
Whether the insertion of 11 amino acids of this protein was due to splicing was compared on the base sequence (FIG. 18). When this DNA and L36870 cDNA encoding MAPKK4 were mapped to the genome using sim4 (Genome Res., 8: 967-74 (1998)), this DNA has 12 exons on human chromosome 17. , MAPKK4 lacked its second exon (base numbers 170 to 203 of this DNA, corresponding to 11 amino acids). This shows that the present protein newly has 11 amino acids not present in MAPKK4 by adding exons. The nucleotide sequence of cDNA (including EST) having homology with this specific exon portion was searched but not found. This indicates that the molecular species having this exon is rare and this DNA is a novel molecule.
[0172]
When this protein was expressed in the cell-free protein synthesis system of Example 4 (1), ATP consumption activity (33 units / day) was detected by the method of Example 4 (2), and syntide 2 was detected in Example 4 (3). As a substrate, a HPLC band shift (237.8 unit / day) due to transfer of phosphate group was observed (FIG. 28), indicating that this protein is a kinase.
[0173]
MAPKK4 is a dual specificity protein kinase belonging to serine / threonine protein kinase. In response to external signals such as proliferation or stress, serine / threonine of MAPKK4 is phosphorylated and activated by MAPK3 / MEKK corresponding to MAPKKK, and JNK1 (MAPK8), JNK2 (MAPK9) and JNK3 corresponding to MAPK are p38 It is activated in the same manner as (MAPK14). Furthermore, a transcription factor downstream of the gene is activated, and genes involved in apoptosis are expressed. Analysis of MAPKK4 knockout mice has been shown to be involved in T cell differentiation, survival signals and liver organogenesis. MAPKK4 is highly expressed in skeletal muscle, but is also expressed in other tissues. MAPKK4 also associates with β-arrestin2, which is a protein involved in receptor internalization (related to GPCR desensitization), and phosphorylates JNK3 bound thereto. This causes crosstalk between GPCR signaling and the MAPK signaling cascade. This protein is immune, apoptosis against stress such as liver, brain, cell proliferation, cancer, abnormal signal transduction by GPCR, neuronal process extension, dementia, liver regeneration, diabetes, blood pressure regulation, amyotrophic lateral sclerosis, Alternatively, it is presumed to be involved in autoimmune diseases, immune inflammatory diseases such as allergies, and the like, and it can be used as a target for diagnostic and therapeutic agents for these diseases.
[0174]
(12) c-testi4052197 (SEQ ID NOs: 12, 24)
c-testi4052197 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) consists of 3105 bases as shown in SEQ ID NO: 12, of which the base number is 407. To 1690 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 427 amino acid residues (SEQ ID NO: 24). When homology search was performed for this protein using BLAST, the database registration symbol X07767 in the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) was found. A registered human cAMP-dependent protein kinase catalytic subunit type alpha (PKACα) was hit with 99% agreement over E-value = 0, 336 amino acids. This sequence consists of 351 amino acids, and since the amino acid numbers 16 to 351 correspond to the amino acid numbers 92 to 427 of this protein, this protein is considered to be an N-terminal variant of PKA Cα (FIG. 19). In addition, amino acid number 309 arginine (AGG) of PKACα is 385th glycine (GGG) in this protein.
[0175]
As a result of HMMPFAM search of the amino acid sequence of SEQ ID NO: 24, a protein kinase domain was found at amino acid numbers 120 to 374. This region is in common with PKACα.
[0176]
Alignment to the genome was performed using sim4 (Genome Res., 8: 967-74 (1998)) in order to compare the exon usage situation of this DNA and PKACα cDNA (FIG. 20). As a result, this DNA consisted of 10 exons, and PKACα shared its second to ten exons, but had another first 1 'exon. Both differ in the N-terminal amino acid sequence of both proteins by making the first exons including the translation initiation site different. This protein is a splicing variant of PKACα.
[0177]
When this protein was expressed by the cell-free protein synthesis system of Example 4 (1), it had ATP consumption activity in Example 4 (1), and phosphoric acid against Syntide2 and PKA substrate in Example 4 (2). A band shift in HPLC due to group transfer was observed (FIG. 29), confirming that it has kinase activity.
[0178]
PKA is a serine / threonine pleuten kinase consisting of two regulatory subunits (R) and two catalytic subunits (C). Tetramer (R2C2) is present in the cytoplasm as an inactive form, but the signal from Gs-coupled Recepter is present. Upon entering, adenylyl cyclase is activated to produce cAMP from ATP, which binds to PKA's Regulatory subunit (R) to release and activate catalytic subunit (C). The C amino acids involved in the interaction between R and C are the 190th lysine, the 195th arginine, the 197th tryptophan, and the 214th lysine in the protein kinase domain (PRS2 domain). R is a protein that remains in the cytoplasm and anchors C to the cytoplasm. When C leaves R, it interacts with PKI (protein kinase inhibitor) via another region (PRS1 domain; 134th arginine, 204th glutamic acid, 236th tyrosine) and is anchored in the cytoplasm. As for the R subunit, the RI type (RIα, RIβ) involved in cell growth and the RII type (RIIα, RIIβ) involved in differentiation are known, and as the C subunit, Cα, Cβ, Cγ are known. . According to literature information, it has been reported that when C is anchored in the cytoplasm by R by the antisense oligonucleotide of RIα, Cα is transferred to the nucleus (Oncogene, 20: 8019-24 (2001)). Moreover, when insulin-secreting cultured cell TC6 is stimulated with glucose or GLP-1 (glucagon-like polypeptide-1), Cα is transferred to the nucleus, Cβ is transferred to the cell membrane and nucleus, and Cγ is reported to have no change in intracellular localization. (Biochem. J., 368: 397-404 (2002)). Thus, the intracellular localization or activity of the catalytic subunit which is the active body of PKA is regulated by various molecules.
[0179]
Examples of PKA substrates include GPK (Glycogen phosphorylase kinase) and CREB (cAMP responisible element binding protein). Glycogen is hydrolyzed by Glycogen phosphorylase. This enzyme is phosphorylated by PKA and activated, and glycogen degradation proceeds. CREB binds to cAMP responsible element with two molecules, and serine 133 is phosphorylated by protein kinase such as PKA to activate transcription of genes such as somatostatin and SF-1 (steroid genic factor-1). According to the analysis of knockout mice of PKA catalytic subunitα, the newborns are mostly lethal, but those that survived have markedly inhibited growth due to decreased IGF1 expression in the liver and urinary protein from the kidney, It was found that sperm cannot mature.
[0180]
In this protein, amino acid numbers 1 to 91 are novel sequences. It may have a function different from the original PKA catalytic subunit α by a protein that specifically binds to this region or by undergoing a specific expression regulation. The DNA is isolated from the testis, and the PKA catalytic subunit alpha knockout mouse experiment suggests that the protein is involved in sperm maturation, regulation of liver and kidney protein expression, regulation of glycogen synthesis, and secretion of IGF. It is used as a target for diagnosis and treatment of cancers such as liver cancer, kidney cancer and testicular cancer, hepatitis, liver cirrhosis, nephritis, diabetes, inflammatory diseases, infertility, diseases related to GPCR signaling, etc. Conceivable.
[0181]
【The invention's effect】
Since the protein of the present invention and the DNA encoding the same have kinase activity or the like, it is possible to screen for a substance that regulates the activity using the protein or the DNA encoding the protein, diseases associated with the protein, etc. It is useful for the development of a medicine that can act on the skin.
[0182]
[Sequence Listing]
Figure 2006174701
[0183]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0184]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0185]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0186]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0187]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0188]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0189]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0190]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0191]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0192]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0193]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0194]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0195]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0196]
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0197]
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0198]
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0199]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0200]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0201]
Figure 2006174701
Figure 2006174701
[0202]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0203]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0204]
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0205]
Figure 2006174701
Figure 2006174701
[0206]
Figure 2006174701
Figure 2006174701
Figure 2006174701
[0207]
Figure 2006174701
[0208]
Figure 2006174701
[0209]
Figure 2006174701
[0210]
Figure 2006174701
[0211]
Figure 2006174701
[0212]
Figure 2006174701
[0213]
Figure 2006174701
[0214]
Figure 2006174701
[0215]
Figure 2006174701
[0216]
Figure 2006174701
[0217]
Figure 2006174701
[0218]
Figure 2006174701
[0219]
Figure 2006174701
[0220]
Figure 2006174701

[Brief description of the drawings]
FIG. 1 is a diagram comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 15 with the structure of a known protein BC010640.
FIG. 2 is a diagram comparing exon structures analyzed by mapping DNA having the base sequence of SEQ ID NO: 3 and cDNA encoding the known protein BC010640 to human genome sequences, respectively.
FIG. 3 is a diagram comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 16 with the structure of a known protein AX405737.
FIG. 4 is a diagram comparing exon structures obtained by mapping and analyzing DNA having the base sequence of SEQ ID NO: 4 and cDNA encoding the known protein AX405737 onto human genome sequences, respectively.
FIG. 5 is a diagram comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 17 with the structure of a known protein AX262516.
FIG. 6 is a diagram comparing exon structures obtained by mapping and analyzing DNA having the base sequence of SEQ ID NO: 5 and cDNA encoding the known protein AX262516 on human genome sequences, respectively.
FIG. 7 is a diagram comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 18 with the structures of known proteins AAV32449, AAW48841 and AAW48842.
FIG. 8 is a diagram comparing exon structures analyzed by mapping DNA having the nucleotide sequence of SEQ ID NO: 6 and cDNA encoding the known protein AAV32449 to human genome sequences, respectively.
FIG. 9 is a view comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 19 with the structure of a known protein cdk10.
FIG. 10 is a diagram comparing exon structures analyzed by mapping DNA having the base sequence of SEQ ID NO: 7 and cDNA encoding the known protein cdk10 to human genome sequences, respectively.
FIG. 11 is a diagram comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 20 and the structure of a known protein AX327993.
FIG. 12 is a diagram comparing exon structures in which DNA having the nucleotide sequence of SEQ ID NO: 8 and cDNA encoding the known protein AX327993 are each mapped to a human genome sequence and analyzed.
FIG. 13 is a view comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 21 with the structure of a known protein SGK040.
FIG. 14 is a diagram comparing exon structures in which DNA having the nucleotide sequence of SEQ ID NO: 9 and cDNA encoding the known protein SGK040 are each mapped to a human genome sequence and analyzed (a). Furthermore, the figure which compared the structure of both proteins seen from the exon structure is also shown (b).
FIG. 15 is a diagram comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 22 with the structure of a known protein ACK1.
FIG. 16 is a diagram comparing exon structures obtained by mapping and analyzing DNA having the nucleotide sequence of SEQ ID NO: 10 and cDNA encoding the known protein ACK1 to human genome sequences, respectively.
FIG. 17 is a view comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 23 with the structure of a known protein MAPKK4.
FIG. 18 is a diagram comparing exon structures analyzed by mapping DNA having the nucleotide sequence of SEQ ID NO: 11 and cDNA encoding the known protein MAPKK4 to human genome sequences, respectively.
FIG. 19 is a diagram comparing the structure of a protein having the amino acid sequence of SEQ ID NO: 24 with the structure of a known protein PKACα.
FIG. 20 is a diagram comparing exon structures obtained by mapping and analyzing DNA having the base sequence of SEQ ID NO: 12 and cDNA encoding the known protein PKACα to human genome sequences, respectively.
FIG. 21 shows the peaks of standard polypeptides (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as substrates, measured on reverse phase HPLC. Show.
FIG. 22 shows a protein having the amino acid sequence of SEQ ID NO: 4 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.
FIG. 23 shows a protein having the amino acid sequence of SEQ ID NO: 6 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.
FIG. 24 shows a protein having the amino acid sequence of SEQ ID NO: 7 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.
FIG. 25 shows a protein having the amino acid sequence of SEQ ID NO: 8 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.
FIG. 26 shows a protein having the amino acid sequence of SEQ ID NO: 9 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.
FIG. 27 shows a protein having the amino acid sequence of SEQ ID NO: 10 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.
FIG. 28 shows a protein having the amino acid sequence of SEQ ID NO: 11 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.
FIG. 29 shows a protein having the amino acid sequence of SEQ ID NO: 12 in a standard polypeptide (Cdc2, Arg2-OH, PKA, PKC, DNA-PK, PTK1, PTK2, MLCKS, CaMKII, Syntide2) as a substrate. The result of having measured the peak on reverse phase HPLC after adding and making it react is shown.

Claims (15)

以下の(a)または(b)のタンパク質;
(a)配列番号13〜24のいずれかに記載のアミノ酸配列からなるタンパク質、
(b)配列番号13〜24のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸が欠失、置換および/または付加されたアミノ酸配列からなり、かつキナーゼ活性を有するタンパク質。
The following protein (a) or (b):
(A) a protein comprising the amino acid sequence of any one of SEQ ID NOs: 13 to 24,
(B) A protein comprising an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any one of SEQ ID NOs: 13 to 24 and having kinase activity.
請求項1に記載のタンパク質をコードするDNA。  DNA encoding the protein according to claim 1. 請求項1に記載のタンパク質をコードする完全長cDNA。  A full-length cDNA encoding the protein of claim 1. 以下の(a)または(b)のいずれかのDNA;
(a)配列番号1〜12のいずれかに記載の塩基配列を有するDNA、
(b)配列番号1〜12のいずれかに記載の塩基配列において、1もしくは数個の塩基が欠失、置換および/または付加された塩基配列を有し、かつキナーゼ活性を有するタンパク質をコードするDNA。
DNA of any of the following (a) or (b);
(A) DNA having the base sequence described in any one of SEQ ID NOs: 1 to 12,
(B) The base sequence described in any one of SEQ ID NOs: 1 to 12 has a base sequence in which one or several bases are deleted, substituted and / or added, and encodes a protein having kinase activity DNA.
請求項2〜4のいずれかに記載のDNAを含む組換えベクター。  A recombinant vector comprising the DNA according to any one of claims 2 to 4. 請求項2〜4のいずれかに記載のDNAまたは請求項5に記載の組換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。  A gene-transferred cell into which the DNA according to any one of claims 2 to 4 or the recombinant vector according to claim 5 has been introduced, or an individual comprising the cell. 請求項6に記載の細胞により産生される、請求項1に記載の組換えタンパク質。  The recombinant protein according to claim 1, which is produced by the cell according to claim 6. 請求項2〜4のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、および、当該センスまたはアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。  A sense oligonucleotide having the same sequence as 5 to 100 consecutive bases in the base sequence of the DNA according to any one of claims 2 to 4, an antisense oligonucleotide having a sequence complementary to the sense oligonucleotide, and An oligonucleotide selected from the group consisting of oligonucleotide derivatives of the sense or antisense oligonucleotide. 請求項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。  An antibody or a partial fragment thereof that specifically binds to the protein according to claim 1 or 7. 抗体がモノクローナル抗体である請求項9に記載の抗体。  The antibody according to claim 9, wherein the antibody is a monoclonal antibody. モノクローナル抗体が請求項1または7に記載のタンパク質のキナーゼ活性を中和する作用を有することを特徴とする請求項10に記載の抗体。  The antibody according to claim 10, wherein the monoclonal antibody has an action of neutralizing the kinase activity of the protein according to claim 1 or 7. 請求項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。  A screening method for a substance that regulates the activity of the protein, comprising contacting the test substance with the protein according to claim 1 or 7, and measuring a change in activity of the protein by the test substance. 請求項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。  A screening method for a substance that regulates the expression of DNA, wherein the gene-transfected cell according to claim 6 is brought into contact with a test substance, and a change in the expression level of the DNA introduced into the cell is detected. 請求項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報および/または請求項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。  Information on at least one amino acid sequence selected from the amino acid sequence of the protein according to claim 1 and / or information on at least one base sequence selected from the base sequence of the DNA according to any one of claims 2 to 4. A computer-readable recording medium storing the data. 請求項1に記載のタンパク質および/または請求項2〜4のいずれかに記載のDNAを結合させた担体。  A carrier to which the protein according to claim 1 and / or the DNA according to any one of claims 2 to 4 are bound.
JP2003046606A 2003-02-24 2003-02-24 New protein and dna encoding the same Pending JP2006174701A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003046606A JP2006174701A (en) 2003-02-24 2003-02-24 New protein and dna encoding the same
PCT/JP2004/002133 WO2004074485A1 (en) 2003-02-24 2004-02-24 Novel proteins and dnas encoding the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003046606A JP2006174701A (en) 2003-02-24 2003-02-24 New protein and dna encoding the same

Publications (1)

Publication Number Publication Date
JP2006174701A true JP2006174701A (en) 2006-07-06

Family

ID=32905588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003046606A Pending JP2006174701A (en) 2003-02-24 2003-02-24 New protein and dna encoding the same

Country Status (2)

Country Link
JP (1) JP2006174701A (en)
WO (1) WO2004074485A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008066498A1 (en) * 2006-12-01 2008-06-05 Agency For Science, Technology And Research Cancer-related protein kinases
GB0706709D0 (en) * 2007-04-05 2007-05-16 Medical Res Council Methods
US8206942B2 (en) 2007-04-05 2012-06-26 Medical Research Council Methods of identifying LRRK2 inhibitors

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0967990A1 (en) * 1997-10-03 2000-01-05 Smithkline Beecham UDP-N-ACETYLMURAMOYL-L-AIANINE:D-GLUTAMATE LIGASE (murD) OF STAPHYLOCOCCUS AUREUS
WO2000065040A2 (en) * 1999-04-22 2000-11-02 Pioneer Hi-Bred International, Inc. Cell cycle genes from plants and methods of use

Also Published As

Publication number Publication date
WO2004074485A1 (en) 2004-09-02

Similar Documents

Publication Publication Date Title
WO2004009622A2 (en) Protein complexes of cellular networks underlying the development of cancer and other diseases
US20040167066A1 (en) Cleavage and polyadenylation complex of precursor mrna
JP2002524049A (en) CHP polypeptide, ligand of PAK65
CN1720442A (en) CIZI replication protein
CA2270911A1 (en) Mammalian chk1 effector cell-cycle checkpoint protein kinase materials and methods
JP2001510684A (en) Assays, methods of treatment and therapeutic means
US20020098511A1 (en) Protein-protein interactions
JP2006174701A (en) New protein and dna encoding the same
US6511825B1 (en) Cell signaling polypeptides and nucleic acids
CN1268954A (en) method and compositions for treating abnormal cell growth relating to unwanted guanine nucleotide exchange factor activity
JP2004526429A (en) Human genes and gene expression products isolated from human prostate
JPWO2004024913A1 (en) Novel protein and DNA encoding the same
US20020164647A1 (en) Protein-protein interactions
JP2005245274A (en) Cell proliferation promoter
US20020098514A1 (en) Protein-protein interactions
WO2004099408A1 (en) Novel protein and dna coding for the same
WO1999058669A1 (en) Rhoh genes and their uses
WO2003100064A1 (en) Novel ubiquitin ligase
US20020102606A1 (en) Protein-protein interactions
JP2001503994A (en) Tyrosine phosphorylation cleavage groove-related protein (PSTPIP)
US20030054385A1 (en) Human ubiquitin-conjugating enzymes
JP2001224380A (en) F-box proteins of ubiquitin ligase scf complex that ubiquitinates and degrades cyclin e
US20020164615A1 (en) Protein-protein interactions
US20020197626A1 (en) Protein-protein interactions
JP2004229643A (en) Protein and dna encoding the same