JP2005021093A - New protein and dna encoding the same - Google Patents

New protein and dna encoding the same Download PDF

Info

Publication number
JP2005021093A
JP2005021093A JP2003191215A JP2003191215A JP2005021093A JP 2005021093 A JP2005021093 A JP 2005021093A JP 2003191215 A JP2003191215 A JP 2003191215A JP 2003191215 A JP2003191215 A JP 2003191215A JP 2005021093 A JP2005021093 A JP 2005021093A
Authority
JP
Japan
Prior art keywords
protein
dna
seq
sequence
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003191215A
Other languages
Japanese (ja)
Inventor
Takao Isogai
隆夫 磯貝
Tomoyasu Sugiyama
友康 杉山
Ai Wakamatsu
愛 若松
Ryotaro Irie
亮太郎 入江
Shizuko Ishii
静子 石井
Daichi Naka
大地 仲
Kunji Kawai
勲二 河合
Naoko Miyama
尚子 見山
Wakako Watabe
和加子 渡部
Atsushi Kondo
淳 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Association for Biotechnology
Molecuence Corp
Original Assignee
Research Association for Biotechnology
Molecuence Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Association for Biotechnology, Molecuence Corp filed Critical Research Association for Biotechnology
Priority to JP2003191215A priority Critical patent/JP2005021093A/en
Publication of JP2005021093A publication Critical patent/JP2005021093A/en
Pending legal-status Critical Current

Links

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method for utilizing a protein based on the physiological activity mentioned below and a DNA encoding the same through analyzing the base sequence of a cDNA clone included in a full-length cDNA library, and for a cDNA with new sequence as a whole length, specifying the physiological activity of a protein encoded by the cDNA. <P>SOLUTION: The protein is provided, being (a) a protein comprising a specific amino acid sequence, or (b) a protein comprising an amino acid sequence where one or several amino acids is(are) deleted, substituted and/or added in the above-mentioned specific amino acid sequence and having transcription-regulatory activity. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、および該タンパク質に特異的に結合する抗体等に関する。
【0002】
【従来の技術】
現在、世界的なレベルで様々な生物のゲノム配列の解明とその解析が進められている。既に約百数十の原核微生物、下等真核生物の出芽酵母、多細胞性真核生物である線虫で、その全ゲノム配列が決定された。30億塩基対といわれるヒトのゲノムについては2001年2月にその塩基配列のドラフトが発表されていたが、2003年4月に完全配列が解読され公表された。ゲノム配列を明らかにする目的は、全ての遺伝子の機能や制御、あるいは遺伝子間、タンパク質間、細胞間さらには個体間における相互作用のネットワークとして複雑な生命現象を理解するところにある。種々の生物種のゲノム情報から生命現象を解明していくことは、単に学術分野における研究課題として重要であるのみならず、そこで得られる研究成果をいかに産業上の応用へと発展させていくかという点で、その社会的な意義も大きい。
【0003】
ところが単にゲノム配列を決定しただけでは、全ての遺伝子の機能を明らかにできるわけではない。例えば酵母では、ゲノム配列から推定された約6,000の遺伝子の約半数しか、その機能を推定できなかった。一方、ヒトには約10万種類のタンパク質が存在するといわれる。そこで、ゲノム配列から明らかにされてくる膨大な量の新しい遺伝子の機能を、迅速かつ効率的に解明していくための「ハイスループット遺伝子機能解析システム」の確立が、強く望まれている。
【0004】
真核生物のゲノム配列では、多くの場合、一つの遺伝子がイントロンによって複数のエクソンに分断されている。そのため、ゲノム配列情報だけからそこにコードされるタンパク質の構造を正確に予測するには、多くの問題がある。一方、イントロンが除かれたmRNAから作製されるcDNAでは、タンパク質のアミノ酸配列の情報が一つの連続した配列情報として得られるため、容易にその一次構造を明らかにすることが可能である。ヒトのcDNAの研究では、これまでに500万以上のEST (Expressed Sequence Tag) データが公共データベースに公開されている。
【0005】
これらの情報は、ヒト遺伝子構造の解明やゲノム配列におけるエクソン領域の予測、あるいはその発現プロファイルの推定など、様々な角度から利用されている。ところが、これらのヒトEST情報の多くはcDNAの3’末端側近傍に集中しているため、特にmRNAの5’末端近傍の情報が極端に不足している状況にある。また、世界の研究機関 (ヘリックス研究所、かずさDNA研究所、東大医科学研究所、ドイツ癌研究センター、MGCプロジェクトなど) で行われている解析の結果明らかにされているcDNAは4万数千に上り、数的には3万数千と言われる遺伝子座の大半をカバーしていると思われるが、全長クローンとして取得されているcDNAの割合は80%程度であることや、重複やスプライスバリアントが含まれていることを考慮すると、まだ取得されていないcDNAは多数存在していると考えられる。
【0006】
完全長cDNAを取得できれば、その5’末端配列からゲノム配列上でのmRNA転写開始点が推定できる上、その配列の中に含まれるmRNAの安定性や翻訳段階での発現制御に関わる因子の解析が可能である。また、翻訳開始点であるatgを5’側に含むことから、正しいフレームでタンパク質への翻訳を行うことができる。したがって、適当な遺伝子発現系を適用することで、そのcDNAがコードするタンパク質を大量に生産したり、タンパク質を発現させてその生物学的活性を解析することも可能になる。このように、完全長cDNAの解析からはゲノム配列解析を相補する重要な情報が得られる。また、発現可能な全長cDNAクローンは、その遺伝子の機能の実証的な解析や産業分野での応用への展開において、その重要性はきわめて高い。
【0007】
また、同一のゲノムにコードされたタンパク質であっても、それをコードするmRNAが転写される際、ゲノム中一部のエクソンが挿入・欠失して結合する異性体(以下、これを「スプライシングバリアントmRNA」と称することがある)がある。実際、これらのmRNAが翻訳されて生成される、複数種の類似のタンパク質(以下、これらを「スプライシングバリアント」と称することがある)が生体内において確認されている。スプライシングバリアントは、組織特異的、発生段階特異的、あるいは疾患特異的に発現し、それぞれ異なる機能を有していると考えられている。
【0008】
例えば、Estrogen receptor βは、10種類のエクソン欠失スプライスバリアントmRNAが様々なヒト組織より同定されている。このうち9種類が正常乳房組織で発現しているが、その中で、5番と6番のエクソンを欠いたmRNAの発現が、大部分の癌組織で有意に減少することが明らかにされている。また、5番のエクソンを欠いたmRNAは、癌の進行度に応じて、有意にその発現量が変動することが明らかにされている(例えば、非特許文献1を参照。)。このようにスプライスバリアントの発現量が病態と有意な相関を示すことがある。
【0009】
このようなスプライシングバリアントのmRNAあるいはcDNAも、従来のcDNAライブラリーやESTからは取得されにくく、転写開始点を含む完全長cDNAライブラリーにより取得される可能性の高いクローンである。
【0010】
特に、転写因子は、転写反応または遺伝子発現と呼ばれるDNAからmRNAを合成する段階に関与する、DNAに親和性を有するタンパク質であり、極めて多くの因子が知られている。転写反応は、遺伝子産物であるタンパク質の合成量を調節する重要な反応であり、細胞の機能、構造にかかわるタンパク質量を制御していることになる。この転写反応は一群の転写因子によって引き起こされ、例えばRNAポリメラーゼは、TATAボックスや転写開始部位から構成されるプロモーターと呼ばれる転写制御領域の特定の塩基配列を有するDNAに結合し、RNAポリメラーゼを組込んで種々の転写因子が集合した転写複合体を形成してmRNAの合成を開始する。プロモーターに依存する転写反応は遺伝子特異性がなく基本転写と呼ばれ、RNAポリメラーゼおよびRNAポリメラーゼと転写複合体を形成してRNAポリメラーゼに近い部分で働く転写因子は、基本転写因子と呼ばれている。この基本転写とは別に、細胞は生理的環境の変化や外界からの刺激に対し、基本転写のレベルを上下させたり、時期もしくは組織特異的な発現を調節する機構を有している。このような基本転写の調節をつかさどる転写調節領域の特定の塩基配列を有するDNAはエンハンサーもしくはサイレンサーとも呼ばれ、通常はプロモーターの上流に存在し、この領域に結合する転写調節因子(遺伝子特異的転写調節因子、遺伝子発現調節因子もしくは遺伝子発現調節タンパク質とも呼ばれる)が直接もしくは別の転写調節補因子(メディエーター、コファクターもしくは介在因子とも呼ばれる)を介して基本転写因子と相互作用することにより基本転写の調節を行っている(以下、このような基本転写の調節活性を「転写調節活性」と称し、また転写調節因子と転写調節補因子を併せて「転写調節因子」と称することがある)。すなわち、転写因子は、基本転写因子と転写調節因子の2つのカテゴリーに分類される。基本転写因子は遺伝子特異性がなく数も少ないが、転写調節因子は非常に多くのものが知られており、その数は類似因子やファミリーを含めると1000のオーダーに達すると考えられているし、その結合部位も多様である。
【0011】
細胞内または細胞間刺激に対する応答において転写反応を調節することは、例えば、そのような調節が生物の発達に必要な場合に、または生物環境の変化に対する生物の生存に必要な場合にしばしば所望される。しかし、転写反応が不適切に作動または停止することにより、疾患が引き起こされることがある。例えば、エストロゲン介在性遺伝子発現がいくつかの種類の乳癌または卵巣癌に関与することを示唆する証拠が報告されている。また、白血病に伴う染色体転座部位からさまざまな転写調節因子遺伝子が発見されており、この中に転写調節因子同士の融合キメラ分子をコードするものが多数存在することから、転写調節因子の活性の異常が白血病に深く関与する可能性が示唆されている(例えば、非特許文献2を参照。)。このように、転写調節因子の中には、疾患に関与する種々の遺伝子の転写を調節する転写調節因子(以下、これを「疾患関連転写調節因子」と称することがある)が存在する。例えば、疾患関連転写調節因子として、PPAR、p53、NFκB、AP−1、HIF−1、CREB等が知られている。
【0012】
また、プロテインキナーゼはタンパク質リン酸化を介する細胞内シグナル伝達系(リン酸化カスケード)を調節することにより、種々の生命現象の制御に関わっていることが知られており、疾患との関係が解明されている遺伝子が多い(例えば、非特許文献3を参照。)が、このリン酸化カスケードにおいてリン酸化されて活性化される一群の転写調節因子が関与することも知られており、これらの転写調節因子もプロテインキナーゼと同様に疾患に関与する可能性が示唆されている(例えば、非特許文献4を参照。)。
【0013】
しかし、ヒトの体内には約千種もの異なる転写調節因子が存在すると推定されており、まだ多くの転写調節因子遺伝子がクローニングされないままに残されている。したがって、ヒトにおいて分離が進んでいないスプライシングバリアントを含む新規な転写調節因子の全長cDNAを提供する意義は大きい。また、転写調節因子は、治療のための標的分子として、またタンパク質自身に医薬品としての有用性を期待できる。したがって、これらのタンパク質をコードするcDNAの全長を明らかにすることには大きな意義がある。
【0014】
【非特許文献1】Poola I et al., J. Steroid Biochem. Mol. Biol., 82: 169−179 (2002).
【非特許文献2】Look, A. T., Science, 278: 1059−1064 (1997)
【非特許文献3】Hunter, T., Cell, 50: 823−829 (1987)
【非特許文献4】Ninomiya−Tsuji, J. et al., Nature 398: 252−256 (1999)
【0015】
【発明が解決しようとする課題】
本発明は、完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうちスプライシングバリアントを含む全長として配列が新規なcDNAについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
【0016】
【課題を解決するための手段】
本発明者らは、オリゴキャップ法 (Maruyama, K., et al., Gene, 138: 171−174(1994); Suzuki, Y. et al., Gene, 200: 149−156 (1997))を用いて取得されたスプライシングバリアントを含む配列が新規なcDNAについて、該cDNAクローンの塩基配列の相同性に基づきデータベースを検索したところ、該配列に転写調節活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質が転写調節因子であると同定した。本発明は、これらの知見に基づいて成し遂げられたものである。
【0017】
すなわち本発明によれば、以下の1〜15に記載の発明が提供される。
1.以下の(a)または(b)のタンパク質;
(a)配列番号11〜20のいずれかに記載のアミノ酸配列からなるタンパク質、
(b)配列番号11〜20のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸が欠失、置換および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するタンパク質。
2.前項1に記載のタンパク質をコードするDNA。
3.前項1に記載のタンパク質をコードする完全長cDNA。
4.以下の(a)または(b)のいずれかのDNA;
(a)配列番号1〜10のいずれかに記載の塩基配列を有するDNA、
(b)配列番号1〜10のいずれかに記載の塩基配列において、1もしくは数個の塩基が欠失、置換および/または付加された塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA。
5.前項2〜4のいずれかに記載のDNAを含む組換えベクター。
6.前項2〜4のいずれかに記載のDNAまたは前項5に記載の組換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
7.前項6に記載の細胞により産生される、前項1に記載のタンパク質。
8.前項2〜4のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、および、当該センスまたはアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
9.前項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
10.抗体がモノクローナル抗体である前項9に記載の抗体。
11.モノクローナル抗体が前項1または7に記載のタンパク質の転写調節活性を中和する作用を有することを特徴とする前項10に記載の抗体。
12.前項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
13.前項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
14.前項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ配列情報および/または前項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
15.前項1に記載のタンパク質および/または前項2〜4のいずれかに記載のDNAを結合させた担体。
【0018】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
(1)完全長cDNAの取得および塩基配列の解析
本発明のDNAは、配列番号11〜20のいずれかに記載のアミノ酸配列からなるタンパク質、または配列番号11〜20のいずれかに記載のアミノ酸配列において1もしくは数個(ここで、数個とは、例えば5個以下、好ましくは3個以下、より好ましくは2個以下を意味する)のアミノ酸残基の置換、欠失および/または付加を含むアミノ酸配列からなり、かつ転写調節活性を有するタンパク質をコードし得るものであればいかなるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのcDNAの全長を含むものでもよい。
【0019】
具体的には、cDNAの全長を含むDNAとしては、例えば配列番号1〜10のいずれかに記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号227〜2245、配列番号2の塩基番号214〜1947、配列番号3の塩基番号281〜2284、配列番号4の塩基番号138〜1019、配列番号5の塩基番号1582〜2685、配列番号6の塩基番号352〜2271、配列番号7の塩基番号2097〜3881、配列番号8の塩基番号1038〜1937、配列番号9の塩基番号1140〜3506、配列番号10の塩基番号469〜1437に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’および/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
【0020】
本発明のDNAは、これを取得できる方法であればいかなる方法により取得したものでもよいが、具体的には例えば下述の方法により取得することができる。まず、ヒトの組織あるいは培養細胞等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてオリゴキャップ法(Maruyama, K., et al., Gene, 138: 171−174 (1994))によりcDNAを取得する。具体的には、取得したmRNAについて酸性ピロフォスファターゼにより5’キャップをはずし、その後露出した5’末端のリン酸基を標的に、合成オリゴヌクレオチドをRNAライゲースを用いて連結する。ここで、キャップ構造を5’末端に有していないRNA分子について、上記オリゴヌクレオチドが結合しないように、予め5’末端に存在するリン酸基を、5’キャップは外さないが5’端のリン酸基のみ外す活性を有するフォスファターゼ等を用いて外しておくことは有効である。このRNA分子を鋳型として、3’側のプライマーとしてオリゴdTプライマーを用いて逆転写酵素により逆転写を行った後、RNA鎖を分解除去する。
【0021】
さらに取得された1本鎖DNAを鋳型として、上記合成オリゴヌクレオチドに相補的な配列を有するポリヌクレオチドを5’プライマーとし、3’末端に特異的なプライマー(オリゴdT等)を用いてポリメラーゼチェインリアクション(PCR)を行うことにより完全長cDNAライブラリーを作製することができる。ここで、5’プライマーおよび3’プライマーは、上記合成オリゴヌクレオチドおよび逆転写プライマーの全長に対して相補的なものではなく、3’側に3〜10bずらした配列を用いることが好ましい。プライマーの鎖長としては、通常15〜100塩基、好ましくは15〜30塩基が挙げられるが、増幅するcDNAの鎖長が長い場合には25〜35塩基の長さとすることが好ましく、また、Long and Accurate PCR(LA PCR:林健志、実験医学別冊・PCRの最新技術、羊土社;Cheng, S. et al., Nature 369: 684−685 (1994))を用いることが好ましい。
【0022】
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、取得されたcDNAクローンを細胞に導入して該cDNAがコードするタンパク質を発現できるようなタンパク質発現用ベクターが好ましく用いられる。具体的には例えば、宿主が哺乳動物細胞等の場合にはpME18SFL3(Genbank AB009864)等が好ましく、また大腸菌の場合では、pET3、pET11(ストラタジーン社製)、pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
【0023】
かくして取得されるcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、取得されたcDNAの5’末端あるいは3’末端の塩基配列を解析し、これをNCBI(National Center of Biotechnology Information;http://www.ncbi.nlm.nih.gov/)で運用しているGenbank、EMBL、DDBJ、dbEST等のデータベースをBLAST(Basic local alignment search tool; Altschul, S.F., et al., J. Mol. Biol., 215, 403−410(1990))を用いて検索し、その全長について完全に一致する配列が見出されない場合は新規として以下の解析に供することとした。
【0024】
このような完全長cDNAの塩基配列を有するDNAとしては、例えば、配列番号1〜10に記載の塩基配列を有するものが挙げられる。また、その翻訳領域としては、配列番号1の塩基番号227〜2245、配列番号2の塩基番号214〜1947、配列番号3の塩基番号281〜2284、配列番号4の塩基番号138〜1019、配列番号5の塩基番号1582〜2685、配列番号6の塩基番号352〜2271、配列番号7の塩基番号2097〜3881、配列番号8の塩基番号1038〜1937、配列番号9の塩基番号1140〜3506、配列番号10の塩基番号469〜1437に示される配列を有するものが挙げられる。
【0025】
かくして取得されたcDNAの全長として新規な塩基配列を、BLASTによる相同性検索(homology search)や、HMMER(隠れMarkovモデルによる配列解析手法;Eddy, S. R., Bioinformatics 14: 755−763(1998))の機能群のひとつであるHMMPFAMによるタンパク質特徴検索(profile search:http://pfam.wustl.edu)等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【0026】
BLASTによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されている配列の機能ドメイン部分と本発明のDNAのこれに対応する部分との一致度(identity)がe−value(問い合わせ配列がデータベース中に偶然存在する期待値)として10−4以下のものか、あるいは30%以上のものを示す。
【0027】
例えば、上位にヒットした機能ドメイン配列の多くが転写調節因子としての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、すなわち、転写調節活性を持つであろうという予測が成り立つ。
【0028】
HMMPFAMでは、Pfamというタンパク質プロファイルを集積したデータベース中にあるエントリーが有するアミノ酸配列の特徴を、解析対象である塩基配列のコードするアミノ酸配列が有するかどうかを洗い出す方法による解析が行われる。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し機能予測ができる。このように、それがコードするタンパク質が転写調節活性を有すると予測されるcDNAは、後述する生化学的実験によりその転写調節活性を確認することができる。
【0029】
上記でcDNAの全長として新規であるとされたクローンとして具体的には、配列番号1〜10のいずれかに示す塩基配列を有するものが挙げられる。また、これらの塩基配列がコードするアミノ酸配列は配列番号11〜20のいずれかに示すものが挙げられる。
【0030】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜10のいずれかに記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1もしくは数個(ここで、言う数個とは、例えば15個以下、好ましく9個以下、より好ましくは6個以下を意味する)の塩基が欠失、置換および/または付加された塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号11〜20のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸配列が欠失、置換および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するタンパク質をコードするものが含まれる。
【0031】
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
【0032】
(2)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明のタンパク質の翻訳領域としてそのアミノ酸配列を推定することができる。このようなアミノ酸配列として例えば、配列番号11〜20のいずれかに記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1もしくは数個のアミノ酸が置換、欠失、および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するものも含まれる。
【0033】
本発明のタンパク質の取得方法としては、(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクターもしくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【0034】
また、そのN末端またはC末端に適当なタグが融合するように設計されたベクターなどに挿入してタグを付加したタンパク質も本発明のタンパク質に含まれる。タグとして具体的には、グルタチオン−S−トランスフェラーゼ、ポリヒスチジン、Flagなどが挙げられる。
【0035】
上記形質転換体が産生するタンパク質には、タンパク質合成時に重原子などで置換・修飾したアミノ酸を取り込ませることにより修飾することができる。また、タンパク質を、精製の前又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。例えば、N末端アセチル化、C末端アミド化などの末端修飾、糖鎖付加、脂質付加、アシル化、メチル化、スルホン化、カルボキシル化、水酸化、リン酸化、ADP−リボシル化などであるが、必ずしもこれらに限定されない。これらの修飾タンパク質も上記した転写調節活性を有するものであれば本発明の範囲に含まれる。
【0036】
また、上記形質転換体が産生するタンパク質を、精製の前又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記した転写調節活性を有するものであれば本発明の範囲に含まれる。
【0037】
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)、pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)が挙げられ、宿主が哺乳動物細胞等の場合にはpME18SFL3(Genbank AB009864)等が好ましい。
【0038】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。昆虫細胞の場合には、ポリヘドリンプロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
【0039】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【0040】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック(J. Mol. Biol., 53: 154 (1970))、リン酸カルシウム法(Science, 221: 551 (1983))、DEAEデキストラン法(Science, 215: 166 (1982))、インビトロパッケージング法(Proc. Natl. Acad. Sci. USA, 72: 581 (1975))、ウィルスベクター法(Cell, 37: 1053 (1984))、および電気パルス法(Chu. et al., Nuc. Acids Res., 15: 1331 (1987))等が挙げられる。
【0041】
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J. Biol. Chem., 263: 7406 (1988))とその宿主であるSf−9細胞(J. Biol. Chem., 263: 7406 (1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J. Viol., 26: 291 (1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc. Natl. Acad. Sci. USA, 77: 4216 (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7細胞(ATCC CRL1651:アメリカンタイプカルチャーコレクション保存細胞)、ヒト胎児腎臓由来HEK293細胞(ATCC CRL1573)またはヒト子宮頸部癌HeLa細胞(ATCC CCL−2)が用いられる。
【0042】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(Vertes, A. A. et al., Biosci. Biotechnol. Biochem., 57: 2036 (1993))、あるいはトランスポゾンや挿入配列(Vertes, A. A. et al., Molecular Microbiol., 11: 739 (1994))等を用いてDNA導入体を作製することもできる。
【0043】
上記で得られた培養物は細胞または菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。
【0044】
かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられる。無細胞タンパク質合成系として具体的には、大腸菌、植物種子の胚芽、ウサギ網状赤血球等の細胞抽出液等の既知のものが用いられる。これらは市販のものを用いることもできるし、それ自体既知の方法、具体的には大腸菌抽出液は、Pratt, J. M. et al., Transcription and Translation, Hames, 179−209, B.D.& Higgins, S. J., eds, IRL Press, Oxford (1984)に記載の方法等に準じて調製することもできる。市販の無細胞タンパク質合成系、または細胞抽出液としては、大腸菌由来のものは、E. coli S30 extract system(Promega社製)とRTS500 Rapid Translation System(Roche社製)等が挙げられ、ウサギ網状赤血球由来のものはRabbit Reticulocyte Lysate System(Promega社製)等、さらにコムギ胚芽由来のものはPROTEIOSTM(TOYOBO社製)等が挙げられる。
【0045】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【0046】
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、転写調節活性を有するものであれば、本発明のタンパク質に含まれる。
【0047】
(3)本発明のタンパク質が有する活性の確認
本発明のタンパク質は、これを上記(2)に記載のとおり組換えタンパク質として作製し、これを解析することにより(1)で推測した活性を有していることを確認することができる。さらに下記(4)に記載の抗体等との組み合わせにより解析することもできる。
【0048】
本発明のタンパク質が有する転写調節活性としては、例えば、DNA構造に変化を与えて遺伝子発現を調節する機能が挙げられる。本発明のタンパク質が、転写調節活性を有することは、それ自体既知の常法を用いて確認することができる。例えば、転写調節活性の解析方法の一つとして、他のタンパク質やDNAとの相互作用を解析する方法が知られている。相互作用の解析には、それ自体既知の常法を用いることができるが、具体的には、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。
【0049】
より具体的には、本発明のタンパク質の有するDNAとの相互作用活性の一つであるDNA結合活性の場合、例えば、適当な二本鎖DNAを該組み換えタンパク質に接触させ、該組み換えタンパク質の該DNA鎖への結合性を測定することにより確認することができる。具体的な方法としては、以下に説明する方法等が挙げられる。
【0050】
反応液としては、60mM塩化カリウム、1mMジチオトレイトール、10%グリセロール、1μg poly(dI−dC)を含む中性から弱塩基性緩衝液、例えば20mMトリス−塩酸或いはHEPES緩衝液(pH7〜8)を用い、適当な長さの二本鎖DNAと本発明の組み換えタンパク質を加えることにより反応を開始する。一定条件下で反応後、該組み換えタンパク質とDNAの結合物を検出することによりタンパク質の二本鎖DNA結合活性を判断する。
【0051】
組み換えタンパク質とDNAの結合は、分子の大きさとして検出する方法、電荷の差異として検出する方法、両者の親和性を測定する方法等を用いて検出することが可能である。
分子の大きさを検出する方法としては、分子ふるいクロマトグラフィーによる測定が挙げられる。上記反応液を、生理食塩水或いは0.1Mリン酸緩衝液(pH7.4)、0.1M HEPES(pH7.5)で平衡化した分子ふるいクロマトグラフィー用カラムに添加し、同溶液にて展開する。組み換えタンパク質、DNAそれぞれの溶出位置と比較して、より高分子量側に両者の結合物が溶出される。
【0052】
電荷の差として検出する方法としては、イオン交換クロマトグラフィー、ゲル電気泳動法、キャピラリー電気泳動法を含む電気泳動法が挙げられる。ゲル電気泳動法は、電荷の差と分子の大きさの差が移動度の差として現れる。上記反応液を、ポリアクリルアミドゲル中で電気泳動し、泳動後のゲルを銀染色、クマーシーブリリアントブルー染色、或いは蛍光染色し、組み換えタンパク質単独の場合と比較して、結合物は移動度の異なるバンドとして確認される。この2法の場合、DNAの一方の末端を蛍光ラベルしておくことによって、DNAの溶出位置、移動度の差として、より高感度で検出することも可能である。
【0053】
両者の親和性を測定する方法としては、アフィニティークロマトグラフィー、表面プラズモン共鳴法等が挙げられる。これらの方法では、DNAを担体に固定しておき、そこに組み換えタンパク質を接触させ、その結合量を測定し活性の強さとする。アフィニティークロマトグラフィーでは、結合した組み換えタンパク質を高濃度の塩溶液、変性剤、遊離のDNA等で溶出し、溶出したタンパク質量を測定する。表面プラズモン共鳴法では、固定化DNAに結合したタンパク質量を、表面プラズモン共鳴で測定し、結合したタンパク質濃度で親和性の強さを測定することができる。
【0054】
また、転写調節因子の場合、既知の転写調節因子が認識し標的とするプロモーターやエンハンサー等の遺伝子転写調節領域(以下、これを「標的転写調節領域」と称することがある)のDNAまたはその部分断片に対する結合能を測定することにより生物学的活性を解析する方法が知られている(特開2001−314190号公報)。解析に使用する標的転写調節領域のDNAまたはその部分断片として、既知の標的転写調節領域の塩基配列(以下、これを「標的配列」と称することがある)を有するものだけでなく、既知の標的転写調節領域の塩基配列をデーターベース解析し分類してそれぞれ設計した、転写調節因子が共通して認識する標的転写調節領域の共通塩基配列(以下、これを「コンセンサス標的配列」と称することがある)を有するものを使用してもよい。
【0055】
既知の転写調節因子としては、例えば、v−jun、c−jun、junB、junD、dJRA、c−fos、fosB1、fosB2、Fra−1、LRF−1、v−maf、mafG、NF−E2 p45、aNF−E2、fNF−E2、Nrf short form、GCN4、yAP−1、CREB−2、ATF−3、CRE−BP1、CRE−BP3、ATF−a、CREB−341、CREB−327、CREM、dCREB2、dCREB2−b、dCREB2−c、dCREB2−d、dCREB2−q、dCREB2−r、dCREB2−s、C/EBPα、C/EBPβ、p34C/EBPβ、CHOP−10、VBP、Hlf、CPRF−2、EmBP−1b、EmBP−1b、GBF1、GBF2、GBF3、CPRF−1、TAF−1、HBP−1a、GBF9、GBF1、GBF12、CPRF−3、TGA1a、TGA1b、O2、STE4、OPI1、E2A、E47、ITF−2/SEF2−1B、SEF−1A、MyoD、p42Tal−1、HEN−1、AhR、Arnt、USF、NF−1A1、NF−1A1.1、NF−1A6、NF−1B1、NF−1B1、NF−1B2、NF−1C2/CTF−2、CTF−4、CTF−6、RF−X1、AP2αA/AP−2α1、AP2α2、AP2α3、AP2α4、AP2αB、AP2β、AP2γ、GR、AR、ER、RXR−α、PPARα、PPARγ、COUP−TF1、HNF−4α1、HNF−4α2、CF1、GATA−1、GATA−2、GATA−3、GATA−4、AREA/NIT−2、Sp1、YY1、Egr−1、Egr−2、Egr−3、Snail、CF2−II、Evi−1、Ikaros、MZF−1、Tramtrack69K、HOX9、CDP、HNF−1A、Nkx−2.2、Nkx−2.5、TTF−1、Oct−1A、Oct−1B、Oct−1C、Oct−2、Oct−2.1/Oct−2B、Pax−3、Pax−6、Pax−1、HSF1(short)、HSF2、dHSF、fungalHSF、c−Myb、A−Myb、v−Myb、P(long)、P(short)、C1(long)、C1(short)、c−Ets−1_p54、Ets−1_δiV/VII、Ets−2、Elk−1、SAP−1、SAP−1b、Erg−1、p55erg、Fli−1b、E4TF1−60/GABP−α、E74A、IRF−1、IRF−2、p50、NF−ATc、NF−Atp、p91、p84、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6、p53、MEF−2A、SRF、E2、TBP、SRY、Sox−5、Sox−9、mat−Mc、CP1A、CP1B、CBF−C、AML1a、等が知られており、これらの転写調節因子の標的転写調節領域の塩基配列もそれぞれ報告されている(田村隆明、外2名編、「Bio Science 実験医学別冊 新用語ライブラリー 転写因子」、第2版、株式会社羊土社、1999年12月)。
【0056】
転写調節因子と標的転写調節領域のDNAまたはその部分断片の結合は、自体公知の測定系を使用して検出することができる。例えば、標的転写調節領域のDNAまたはその部分断片を固定化したプレートに転写調節因子を含む被検試料を添加し、両者の直接的な結合をSPR(Surface Plasmon Resonance, 表面プラズモン共鳴)法を用いて検出することができる。その場合には、前記したような転写調節因子が認識する標的転写調節領域のDNAまたはその部分断片をセンサーチップに固定化する。DNAまたはその部分断片は、アニーリングさせたものを固定化する。また、転写調節因子または標的転写調節領域のDNAまたはその部分断片を蛍光標識したものを用いて、両者の結合を検出することもできる。
【0057】
本発明のDNAがコードするタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。
【0058】
本発明のDNAがコードするタンパク質(配列番号11〜20)は、既知の標的転写調節領域の塩基配列をデーターベース解析して設計した標的配列またはコンセンサス標的配列(配列番号34〜配列番号86)を有する少なくとも一つのDNAまたはその部分断片に対して結合活性を有していた。
【0059】
さらに転写調節因子の場合、前述のように、PPAR、p53、NFκB、AP−1、HIF−1、CREB等の疾患関連転写調節因子への作用を解析することにより、その転写調節因子が特定の疾患に直接的または間接的に関与しているかを解析することが可能である。
【0060】
PPARとは、ステロイドホルモン受容体ファミリーであるペルオキシソーム増殖因子活性化受容体(peroxisome proliferator−activated receptor)であり、生活習慣病発症、例えば糖尿病や肥満等と関連する内分泌・糖・脂質代謝、さらには血管機能や炎症などの循環器系や発がん機構に関与する種々の標的遺伝子の発現を調節している疾患関連転写調節因子として知られており、これらの疾患の治療薬のターゲット分子として注目されている。このPPARは複数のサブタイプ遺伝子が見いだされ、哺乳動物においてはα、γ、およびδ(ヒトではNUC I、マウスではFAAR(fatty acid−activated receptor)、カエルではPPARβとも呼ばれる)の主に3種類のサブタイプ が明らかとなっている。α型は主として肝臓、腎臓、褐色脂肪細胞などの脂肪消費臓器、その他心筋や消化管に発現が認められ、脂肪酸酸化、ケトン体生成、アポリポタンパクの生成などに関与する。β型は脳に、δ型は組織特異性がみられず普遍的に発現しているが大腸ガン細胞での発現が顕著であり、発ガンとの関係が注目されている。またγ型はγ1型とγ2型などの数種のアイソホームが知られており、γ1型は脂肪組織や免疫系臓器、副腎、小腸で発現し、γ2型は脂肪細胞で特異的な発現がみられ、脂肪細胞の分化誘導や脂肪合成に重要な役割を担っていると考えられている。これらのPPARは別の転写調節因子であるRXR(レチノイドX受容体)などとヘテロダイマーを形成し、標的遺伝子上流にある応答配列PPRE(PPAR response element)に結合し、転写を制御することが知られている。
【0061】
p53はRB遺伝子に引き続いて、1989年に2番目に同定された癌抑制遺伝子である。p53遺伝子は染色体の17p13.1に存在し、その遺伝子産物は分子量53kDの核内タンパク質である。最初、p53遺伝子はmycに似た癌遺伝子であると考えられていたが、その後、p53蛋白には野性型と変異型があり、野性型は細胞の増殖機能を制御する機能をもち、RB遺伝子と良く似た働きをもつ癌抑制遺伝子であることが明らかになった。p53蛋白は、転写調節因子としていくつかの遺伝子を制御している。そのうちでもっとも重要なものはサイクリン/Cdk複合体の機能を阻害するp21遺伝子の発現制御であると考えられている。p53の機能自体はリン酸化によって制御されている。癌化の抑制という観点からは、p53の機能として以下の2つが重要である。第1はプログラムされた細胞死であるアポトーシスを起こすシグナル伝達経路上にあることである。第2は細胞がDNA修復を行う間、細胞周期を停止させる働きである。このような機能を通じてp53は放射線や薬剤などによって障害を受けた細胞の細胞周期を停めたり、アポトーシスを引き起こして除去し、遺伝子変化を生じた細胞が癌細胞として増殖していくことを防止していることから、例えば、癌等の治療薬のターゲット分子として注目されている。
【0062】
NFκBは、サイトカイン(例えば、IL−1、IL−2、IL−6、IL−8、GM−CSF、TNFなど)やケモカイン、インターフェロン、MHC分子、増殖因子、細胞接着分子などの遺伝子発現を制御し、特に免疫系に重要な働きを持つ疾患関連転写調節因子として知られており、例えば、関節リウマチや変形性関節炎などの免疫性疾患や炎症性疾患および癌等の治療薬のターゲット分子として注目されている。
【0063】
AP−1は、転写調節因子のFosとJunファミリーからなる複合体で、細胞増殖,分化,特に細胞ガン化や炎症性疾患に関与していることが知られており、例えば、炎症性疾患や癌等の治療薬のターゲット分子として注目されている。
【0064】
HIF−1は、低酸素状況において活性化される遺伝子転写調節因子であり、血管内皮増殖因子などの遺伝子発現制御を通じて血管新生の制御に密接に関わることが示されており、例えば、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等の治療薬のターゲット分子として注目されている。
【0065】
CREB(Cyclic AMP Respones Element Binding protein)は、細胞増殖,分化,学習や記憶プロセス,薬物常用に対する神経系順応、インスリンとグルカゴンなどによるグルコネオジェネシスなどの代謝経路制御などに重要な働きを持つ疾患関連転写調節因子として知られており、例えば、記憶障害などの中枢系疾患、循環器系疾患、糖尿病等の治療薬のターゲット分子として注目されている。
【0066】
具体的には、各疾患関連転写調節因子が認識する遺伝子部位の塩基配列を固相に固定化する。特に疾患関連転写調節因子が認識する標的転写調節領域のDNAまたはその部分断片が、好適に用いられる。固定化するDNAまたはその部分断片の配列の例示として、PPARγ解析用として配列番号87及び配列番号88、p53解析用として配列番号89及び配列番号90、NFκB解析用として配列番号91及び配列番号92、AP−1解析用として配列番号93及び配列番号94、HIF−1解析用として配列番号95及び配列番号96、CREB解析用として配列番号97及び配列番号98をあげたが、これらに限定されるものではない。DNAまたはその部分断片は、アニーリングさせたものを固定化する。固相は、例えばウェルプレートが使われ、直接或は例えばストレプトアビジン処理プレート、ニュートラアビジン処理プレート等に固定化される。DNAまたはその部分断片は、またビオチン標識したものを用いることはより好適な結果をもたらす。DNAまたはその部分断片の添加量は、好ましくは、1〜100nM/100μl/ウェルである。反応は、10〜30℃(室温)で、約30分〜2時間処理で行うことが好ましい。反応完了後、未反応物を除去し、より好ましくはタンパク質によるブロッキング操作を行う。
【0067】
このようにして調製されたウェルプレートに、転写調節因子を含む被検試料を各疾患関連転写調節因子と共に適宜添加し、被検試料に含まれる転写調節因子の作用を解析する。被検試料に含まれる転写調節因子が、疾患関連転写調節因子と結合し、固定化DNAとの親和性を高めるものであれば、反応洗浄後も疾患関連転写調節因子と転写調節因子の結合体が固定化DNAと結合した状態でウェル中に残り、例えば吸光度で測定すればコントロールに比較してOD値が上がり、転写調節因子が疾患関連転写調節因子と固定化DNAとの親和性に正に作用すると推定できる。一方、被検試料に含まれる転写調節因子が、疾患関連転写調節因子と結合し或は結合せずに、疾患関連転写調節因子と固定化DNAとの親和性を低めるものであれば、反応洗浄後は疾患関連転写調節因子と転写調節因子の結合体はウェル中から除去され、例えば吸光度で測定すればコントロールに比較してOD値が下がり、転写調節因子が疾患関連転写調節因子と固定化DNAとの親和性に負に作用すると推定できる。
【0068】
本発明のクローンがコードするタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。
【0069】
疾患関連転写調節因子は、該疾患関連転写調節因子が含まれている細胞抽出液または細胞核抽出液から取得することができる。また、前述のように、疾患関連転写調節因子をコードするDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、疾患関連転写調節因子をコードするcDNAを使用し、その全長または一部を適当な発現ベクターに挿入し、これを大腸菌などの微生物、昆虫細胞、酵母、動物細胞または動物に導入し、疾患関連転写調節因子が発現したこれらの遺伝子導入細胞の培養上清または細胞内、組織、体液より、組換えタンパク質である疾患関連転写調節因子を取得することができる。
【0070】
c−nt2ri3007878、c−brssn2017530、c−hchon2000473、c−beast2001444の4クローンによりコードされるタンパク質は、PPARが有する作用を増強または抑制する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測された。
【0071】
c−nt2ri3007878、c−brssn2017530、c−testi4004626の3クローンによりコードされるタンパク質は、p53が有する作用を増強または抑制する活性を有し、癌等に関連することが推測された。
【0072】
c−testi4004626、c−trach3014316、c−beast2001444の3クローンによりコードされるタンパク質は、NFκBが有する作用を増強または抑制する活性を有し、関節リウマチや変形性関節炎などの免疫性疾患、炎症性疾患、癌等に関連することが推測された。
【0073】
c−nt2ri3007878、c−hchon2000473、c−testi4004626、c−trach3014316の4クローンによりコードされるタンパク質は、AP−1が有する作用を増強または抑制する活性を有し、炎症性疾患や癌等に関連することが推測された。
【0074】
c−brssn2017530、c−testi4004626、c−trach3014316の3クローンによりコードされるタンパク質は、HIF−1が有する作用を増強または抑制する活性を有し、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等に関連することが推測された。
【0075】
c−testi4004626、c−trach3014316の2クローンによりコードされるタンパク質は、CREBが有する作用を増強または抑制する活性を有し、記憶障害などの中枢系疾患、循環器系疾患、糖尿病等に関連することが推測された。
【0076】
このような転写調節活性の解析系は、本発明の転写調節活性を有するタンパク質のアゴニストやアンタゴニストの評価にも用いることができる。なお、本発明のタンパク質が有する活性の確認は、上記した方法に限定されるものではない。
【0077】
(4)本発明のタンパク質の機能解析
かくして得られたスプライシングバリアントとして同定されたものを含む新規タンパク質であって、かつ転写調節活性を有する本発明のタンパク質は、上記(3)で確認された転写調節活性以外の機能を解析することによりその新規の利用法が提供される(この転写調節活性以外の機能をさらに解析する対象となるタンパク質を、以下「解析対象タンパク質」と称することがある)。特に、本発明のタンパク質には、公知のタンパク質のスプライシングバリアントが含まれるため、このバリアントが公知のバリアントとどのような異なる機能があるかを同定することは重要である。
【0078】
具体的な機能の解析方法としては、例えば、(i)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(ii)他のタンパク質、DNAとの相互作用を解析する方法、(iii)適当な細胞あるいは個体へ導入し、表現型の変化を解析する方法、(iv)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。
【0079】
(i)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, D. G., Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ELISA、ウェスタンブロット法などが挙げられる。ここで、解析の対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象バリアントと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141−145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【0080】
(ii)の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質が公知のバリアントが存在するスプライシングバリアントの場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【0081】
(iii)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(2)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、公知のバリアントが存在するスプライシングバリアントの場合には、本DNAまたは公知のバリアントをコードするDNAを同様に細胞へ導入し、比較解析することにより解析対象バリアントに関連する表現型を同定することができる。また、本発明のタンパク質は転写調節活性を有するものであることがわかっているので、キナーゼが関連する疾患に見られる表現型等に注目して解析することも好ましい。
【0082】
(iv)の方法では、後述するオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【0083】
(5)オリゴヌクレオチドの調製および該オリゴヌクレオチドを用いる機能解析上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜10のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。ここで、対象タンパク質が、公知のバリアントDNAが存在するスプライシングバリアントの場合には、公知のバリアントと異なる部分の塩基配列を選択することが好ましい。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
【0084】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine−modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等をあげることができる。
【0085】
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製することにより、RNAインターフェアレンス法に適用することができる。2本鎖RNAの作製方法、及びRNAインターフェアレンス法については、例えば、(Elbashir, S., et al., Nature, 411: 494−498 (2001))に記載の方法等を用いることができる。上記2本鎖RNAは、そのすべてがRNAである必要はない。具体的には、その一部がDNAであるものとして、WO02/10374号公報に記載のものを用いることができる。
【0086】
このRNAインターフェアランス法において標的となる遺伝子(以下これを「標的遺伝子」と称することがある)は、本発明のDNAであれば、いかなるものであってもよい。これらのDNAの少なくとも一部の塩基配列と実質的に同一な配列を有するRNAからなる2本鎖ポリヌクレオチド(以下、これを「2本鎖ポリヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい15bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。
【0087】
また、解析対象タンパク質が公知タンパク質と比較して、挿入型あるいは置換型バリアントである場合は、2本鎖ポリヌクレオチド配列は挿入あるいは置換部位に設定することができる。また、解析対象タンパク質が公知タンパク質の欠失型バリアントである場合は、欠失部を跨ぐ配列を2本鎖ポリヌクレオチド配列とすることにより、該タンパク質特異的に効果のある配列を選定することができる。さらに、解析対象タンパク質と公知タンパク質のそれぞれをコードするDNAの塩基配列と比較して、解析対象タンパク質をコードするDNAに特異的な塩基配列を選定することによれば、解析対象タンパク質特異的にその発現を阻害することができる。
【0088】
ヌクレオチドの鎖長は15bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までのいかなる長さでもよいが、15〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞においては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5: 115−180 (1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA−responsive protein kinase: Bass, B. L., Nature, 411: 428−429 (2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’−5’oligoadenylate synthetase(Bass, B. L., Nature, 411: 428−429(2001))を介してRNase Lの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物または該動物由来の細胞あるいは組織を被導入体として用いる場合には15〜30bp、好ましくは19〜24bp、さらに好ましくは21bpの2本鎖ポリヌクレオチドを用いることが好ましい。2本鎖ポリヌクレオチドはその全体が2本鎖である必要はなく、5’または3’末端が一部突出したものも含むが、3’末端が2塩基突出したものを用いることが好ましい。2本鎖ポリヌクレオチドは相補性を有する2本鎖のポリヌクレオチドを意味するが、自己相補性を有する1本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【0089】
2本鎖ポリヌクレオチドの調製方法としては特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は相補性を有する1本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法としては上記ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【0090】
このようにして調製した2本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであればいかなるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業において使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【0091】
被導入体は、細胞、組織あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞および内分泌腺または外分泌腺の細胞が含まれる。
【0092】
被導入体への2本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィスル感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口(皮下、筋肉内及び静脈内投与を含む)、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【0093】
導入する2本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも1コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により2本鎖ポリヌクレオチドを導入する場合、0.1〜1000nMが好ましい。
【0094】
RNAインターフェアレンスによる本発明のDNAの導入体内での発現抑制により、本発明のDNAがコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【0095】
(6)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。また、対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、対象タンパク質にのみ反応し、公知の、またはそれ以外のバリアントには反応しない抗体を用いることにより、対象タンパク質に特異的な機能を同定することができる。このような抗体のエピトープとしては、例えば、対象タンパク質が公知のバリアントと比較して欠失しているアミノ酸配列がある場合、欠失部分の前後のアミノ酸配列(ジャンクション部分)等が好ましい。また、対象タンパク質が公知のバリアントのN末またはC末が添加されているアミノ酸配列を有する場合、添加されているアミノ酸配列をエピトープとすることも好ましい。上記以外の方法として、対象タンパク質に対して取得したポリクローナル抗体から、公知の、またはそれ以外のバリアントに反応する抗体を除去することにより、対象タンパク質にのみ反応する抗体を取得することができる。除去する方法としては、公知の、またはそれ以外のバリアントをリガンドとして固定したアフィニティークロマトグラフィー、あるいは、公知の、またはそれ以外のバリアントによる免疫沈降法等が用いられる。
【0096】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【0097】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【0098】
免疫後、適宜試験的に採血を行ってオクタロニー法、固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、塩析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【0099】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein, et al., Nature, 256: 495 (1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【0100】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体のいずれから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(Zimmermann, U. et al., Naturwissenschaften, 68: 577 (1981))によっても行うことができる。
【0101】
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【0102】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al., Nature, 335: 256−259 (1988); Duchosal, M. A., et al., Nature, 355: 258−262 (1992))。
【0103】
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一過性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
【0104】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有する転写調節活性等を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(2)で作製したDNA導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【0105】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0106】
(7)本発明のタンパク質が有する活性を調節する分子のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
【0107】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、かつ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であればいかなるものであってもよい。例えば、まずはじめに本発明のタンパク質とスクリーニングに供する物質(以下、これを「被検物質」と称することがある)とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する活性の変化を指標として被検物質を選抜する方法を用いることができる。
【0108】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であればいかなるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質の相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(6)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。ここで、対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、対象タンパク質にのみ結合し、公知のまたは他のバリアントには結合しない物質についてその影響を解析するか、または公知のあるいは他のバリアントにおいても同様に結合するか否かを同定し、結合した場合にはその影響の相違を解析することによって、対象タンパク質に対する該物質の影響を解析することができる。また、該物質の個体内での分布を検討することにより、対象タンパク質や公知のまたは他のバリアントに対する影響を解析することができる。
【0109】
具体的な解析方法としては、例えば、転写調節活性を調節する物質を解析する場合には、(2)に記載したDNA導入体に基質となるタンパク質も同様の方法で導入する。この導入体について選択された物質の存在下/または非存在下で基質となるタンパク質のリン酸化をそれ自体既知の通常用いられる方法により解析する。具体的には、上記(3)に記載の方法等を用いて行うことができる。転写調節活性が、物質の非存在下の場合と比べて増加した場合には、該物質は転写調節因子の活性化物質として機能する可能性があり、また低下、または阻害された場合には物質は転写調節因子の阻害物質として機能する可能性があると同定できる。
【0110】
ここで、医薬活性成分の取得を目的として調節物質をスクリーニングするために用いる本発明のDNA、あるいは組換えタンパク質を用いる場合は、上記したヒトのホモログタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、さらに生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。なお、本発明のタンパク質の機能調節物質の評価は、上記した方法に限定されるものではない。
【0111】
転写調節因子は、癌に関連するパスウェイ上のシグナル伝達機能、心筋発達に関連するパスウェイ上のシグナル伝達機能、精子の分化・運動性を制御するパスウェイ上のシグナル伝達機能、生殖細胞分化を制御するパスウェイ上のシグナル伝達機能、細胞分化を制御するパスウェイ上のシグナル伝達機能、グリセロール三リン酸を生成する機能、神経細胞の発生・分化・増殖・生存維持を制御するパスウェイ上のシグナル伝達機能、アルツハイマー病発症を制御するパスウェイ上のシグナル伝達機能他、各種細胞の発生、分化、成長、増殖、生存、再生、および、細胞機能等を制御するパスウェイのシグナル伝達機能等、各種シグナル伝達において最終的にDNAに結合して遺伝子の発現制御に関わる。従って、これらシグナル伝達に関わる各種疾患治療剤のスクリーニングの標的とすることができる。本スクリーニング方法により同定できる化合物は、抗ガン剤、糖尿病治療剤、抗炎症剤、神経変性疾患治療剤、心疾患治療剤、不妊治療剤、再生組織誘導剤、アルツハイマー病治療剤、肥満治療剤、糖尿病治療剤、心臓血管疾患治療剤、代謝異常治療剤、食欲不振、過食症などの治療剤等として用いられ得るものである。
【0112】
また、本発明のタンパク質をコードするDNAは、脳(扁桃核、海馬、黒質、胎児脳)、精巣、気管、成人乳房、軟骨細胞、未分化の神経前駆細胞を含む神経系細胞等の組織、器官または細胞由来のRNAから構築されたcDNAライブラリーよりクローニングされており、取得された本発明のタンパク質は、上記組織または器官等において特有の機能を有している可能性があるので、本発明のタンパク質の機能調節物質は該組織または器官に特有の疾患の治療剤として用いられ得るものである。
【0113】
かかる調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0114】
(8)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、(2)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
【0115】
被検物質としては、(7)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、この被検物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、この被検物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
【0116】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0117】
(9)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の子宮に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【0118】
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
【0119】
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【0120】
(10)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜10のいずれかに記載の塩基配列を有するDNAまたはその部分断片は、それらを基板上に結合させた担体として用いられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。ここで、対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合、上記プロテインチップには対象タンパク質特異的なアミノ酸配列部分断片を用いることもできるが、他バリアントと異なる立体構造を有している可能性もあるためその全長を用いることもできる。また、DNAアレイには、対象タンパク質をコードするDNA配列のうち、他のバリアントDNAと異なる配列を選択することが好ましい。
【0121】
また、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
【0122】
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。このDNAの塩基配列には、対応するRNAの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD―R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
【0123】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。なお、取得された各cDNAクローンについて以下の実験を行った結果は、実施例7に纏めて記載した。
【0124】
実施例1 オリゴキャップ法によるcDNAライブラリーの作製
ヒト培養細胞(ヒト正常軟骨初代培養細胞であるHC細胞、東洋紡製:#T402K−05)、およびヒト培養細胞(ヒト胎児精巣由来のテラトカルシノーマ細胞でレチノイン酸処理により神経細胞に分化可能な神経前駆細胞であるNT2細胞、ストラタジーン社製:#204101)をレチノイン酸処理により分化誘導して5週間培養後にさらに生育阻害剤処理して2週間培養した細胞より、文献(Sambrook, J. et al., Molecular Cloning 2nd ed., Cold Spring Harbor Laboratory Press, (1989))の記載の方法によりmRNAを抽出し、さらに、オリゴdTセルロースでポリ(A)RNAを精製した。
【0125】
上記で取得したポリ(A)RNA、ヒト各組織より全RNAとして抽出された市販の各mRNA(クロンテック社製:精巣(#64027−1)、胎児脳(#64019−1)、気管(#64091−1)、ストラタジーン社製:成人乳房(#735044))、およびヒト各組織よりポリ(A)RNAとして抽出・精製された市販の各mRNA(クロンテック社製:扁桃核(#6574−1)、黒質(#6580−1)、海馬(#6578−1))に全脳の全RNAからポリ(A)RNAをオリゴdTセルロースで除くことにより調製したポリ(A)RNAをそれぞれ混ぜたRNAから、オリゴキャップ法(Maruyama, K., et al., Gene, 138: 171−174 (1994))によりcDNAライブラリーをそれぞれ作製した。以下に、ライブラリー名とその由来の関係を示す。
c−beast:成人乳房
c−bramy:扁桃核
c−brhip:海馬
c−brssn:黒質
c−febra:胎児脳
c−hchon:正常軟骨初代培養細胞(HC細胞)
c−nt2ri:神経前駆細胞(NT2細胞)をレチノイン酸処理で神経細胞様に分化させた細胞
c−testi:精巣
c−trach:気管
【0126】
まず、上記RNAをBAP(Bacterial Alkaline Phosphatase)およびTAP(Tobacco Acid Pyrophosphatase)で処理した後に、オリゴキャップリンカー(配列番号21)をRNAライゲースを用いて連結した。このRNA鎖を鋳型としてオリゴdTプライマー(配列番号22)用いた逆転写反応により第1鎖cDNAを合成し、続いてRNA鎖を分解除去した(鈴木ら、タンパク質 核酸 酵素、41: 603−607 (1996);Suzuki, Y. et al., Gene, 200: 149−156 (1997))。次いで、5’のPCRプライマー(配列番号23)と3’のPCRプライマー(配列番号24)を用いPCR(polymerase chain reaction)により2本鎖cDNAを増幅し、増幅されたDNA鎖をSfiIにより切断した。
【0127】
次いで、発現用ベクターであるpME18SFL3(GenBank AB009864)のDraIIIサイトに上記で取得したSfiI切断断片をクローニングし、cDNAライブラリーを作成した。上記で用いたpME18SFL3ベクターは、クローニング部位の上流にSRαプロモーターとSV40 small tイントロンが組み込まれており、またその下流にはSV40ポリ(A)付加シグナル配列が挿入されている。pME18SFL3のクローン化部位は非対称性のDraIIIサイトとなっており、cDNA断片の末端にはこれと相補的なSfiI部位を付加しているので、クローン化したcDNA断片はSRαプロモーターの下流に一方向性に挿入される。したがって、全長cDNAを含むクローンでは、得られたプラスミドをそのままCOS細胞に導入することにより、一過的に遺伝子を発現させることが可能である。すなわち、非常に容易に、遺伝子産物であるタンパク質として、あるいはそれらの生物学的活性として実験的に解析することが可能となっている。
【0128】
これらより得たクローンのプラスミドDNAについて、cDNAの5’端または3’端の塩基配列をDNAシーケンシング試薬(Dye Terminator Cycle Sequencing FS Ready Reaction Kit, dRhodamine Terminator Cycle Sequencing FS Ready Reaction KitまたはBigDye Terminator Cycle Sequencing FS Ready Reaction Kit:PE Biosystems社製)を用い、マニュアルに従ってシーケンシング反応後、DNAシーケンサー(ABI PRISM 3700:PE Biosystems社製)でDNA塩基配列を解析した。
【0129】
実施例2 オリゴキャップ法で作製したcDNAライブラリーからのクローンの5’末端の全長性の評価
実施例1で作製したヒトcDNAライブラリーの5’末端の塩基配列は、これを公共データベース中のヒト既知mRNAの配列と比較し、5’末端配列が一致する全クローンについて、公共データベース中の既知mRNA配列より長く5’末端が伸びている場合、または5’末端は短いが翻訳開始コドンは有している場合を「全長」と判断し、翻訳開始コドンを含んでいない場合を「非全長」と判断した。
【0130】
次に、ESTiMateFLによるクローンの評価を行った。ESTiMateFLは、公共データベース中のESTの5’末端配列や3’末端配列との比較によって全長cDNAの可能性の高いクローンを選択するために、ヘリックス研究所の西川・太田らにより開発された方法である。実施例1で解析したcDNAクローンの5’末端や3’末端配列をESTデータベースに登録されている塩基配列と比較し、取得されたcDNAクローンの配列よりも、5’側または3’側へ伸長しているESTが存在する場合には、そのクローンは「全長ではない可能性が高い」と判断した。公共データベース中のEST配列より5’末端が伸長している場合、あるいは5’末端が短いクローンでも、その差が50塩基以内の場合を便宜的に全長とし、それ以上短い場合を非全長とした。
【0131】
実施例3 cDNAクローンの塩基配列、アミノ酸配列の解析
実施例2で解析したcDNAクローンの全塩基配列について、BLAST(Basic local alignment search tool; Altschul, S. F., et al., J. Mol. Biol., 215: 403−410 (1990))による相同性検索(homology search)や、HMMER(隠れMarkovモデルによる配列解析手法;Eddy, S. R., Bioinformatics, 14: 755−763 (1998))の機能群のひとつであるHMMPFAMによるタンパク質特徴検索(profile search:http://pfam.wustl.edu)を行い、各cDNAクローンがコードするタンパク質の機能を推定した。また、その塩基配列の一部が完全に一致する公知のクローンが存在するスプライシングバリアントと推定されるクローンについては、そのゲノム配列が解析可能であればどのエクソンが欠失してスプライシングしたものであるかを解析した。
【0132】
実施例4 転写調節活性の測定(標的転写調節領域に対する結合活性の解析)
(1)無細胞タンパク質合成系を用いた本発明のタンパク質の調製
実施例3で転写調節活性を有すると推定されたcDNAクローンについて、これがコードするタンパク質を無細胞タンパク質合成系を用いて合成し、該タンパク質が転写調節活性を有するか否かを以下の生化学的実験により解析した。
【0133】
実施例3で転写調節活性を有すると推定されたcDNAクローンのORF断片を、5’側のプライマーとして各クローンに特異的な下記プライマー、3’側のプライマーとして下記の共通プライマーを使用したPCR法によって取得した。
【0134】
5’側のプライマー
(a)c−nt2ri3007878:ATGATCCAGTCACAGATATCATTTGAG(配列番号25)
(b)c−bramy2043103:ATGCGCGCATGCGC(配列番号26)
(c)c−brssn2013753:ATGCCAACCATCATCAGACAC(配列番号27)
(d)c−brssn2017530:ATGGTCCAGAATTATGAGAACCTGG(配列番号28)
(e)c−hchon2000473:ATGACACCAGCATCTGCATC(配列番号29)
(f)c−testi4004626:ATGATTTATCTCAGTGTGCATGGTTG(配列番号30)
(g)c−trach3014316:ATGTCAGGTGGTGAGAACAGG(配列番号31)
(h)c−beast2001444:ATGTCCGACGAGGCCG(配列番号32)
3’側の共通プライマー
GGCCCTTATGGCCGGAGAAAGGCGGACAGGTAT(配列番号33)
【0135】
これを、SP6プロモーターを含む翻訳制御領域−グルタチオン−S−トランスフェラーゼ遺伝子−PreScission Protease(アマシャムファルマシアバイオテク社製)切断サイト−DNAクローニングサイト(SmaI, SfiI)−ポリ(A)シグナル配列を有するベクター(pEU−SS4)のクローニングサイトに挿入した。
【0136】
上記で調製されたプラスミドDNAを鋳型として、SP6 RNAポリメラーゼ(Promega社製)を用いて転写を行い、得られたmRNAをフェノール/クロロホルム抽出、エタノール沈殿の後、Nick Column(Amersham Pharmacia Biotech社製)によって精製した。
【0137】
上記で精製されたmRNAを用いたタンパク合成は、特開2002−204689号公報、およびProc.Natl.Acad.Sci.USA,99:14652−14657(2002)に準じた重層法による無細胞タンパク質合成系を用いて行った。重層法無細胞タンパク質合成系にて使用する翻訳溶液(25μl)には、Proc.Natl.Acad.Sci.USA,97:559−564(2000)に従って調製された6μlの小麦胚芽抽出液および上述したmRNA(0.02nmol)を添加して用い、その組成は24mM Hepes/KOH(pH7.8)、1.2mM ATP、0.25mM GTP、16mM creatine phosphate、10μg creatine kinase、ribonuclease inhibitor(20units)、2mM DTT、0.4mM spermidine、0.3mM L型アミノ酸(20種)、2.7mM magnesium acetate、100mM potassium acetate、5μg小麦胚芽由来tRNA、0.05% Nonidet P−40および0.005% NaNから成る。また翻訳用緩衝液は31.3mM HEPES/KOH(pH7.8)、2.67mMMg(OAc)、93mM KOAc、1.2mM ATP、0.257mM GTP、16mM creatine phosphate、2.1mM DTT、0.41mM spermidine、0.3mML型アミノ酸(20種)、1μM E−64、0.005% NaN、0.05% NP−40から成る。重層法による無細胞タンパク質合成は、まず96穴プレートに翻訳用緩衝液を125μlずつ加えて、この翻訳用緩衝液が入ったそれぞれの穴に底からゆっくりと翻訳溶液を重層し、このプレートを26℃インキュベーターで保温して16時間反応させることにより行った。
【0138】
(2)標的配列またはコンセンサス標的配列を有するDNAを固定化したセンサーチップを用いたSPR測定方法
BIAapplications handbook, chapter4.4の記載に従い、センサーチップ表面にビオチン化した以下の53種類の二重鎖DNAを別々に固定化した。センサーチップはSAタイプ(ビアコア社製)を用い、SPR測定および解析は、BIACORE3000(ビアコア社製)を用いた。
【0139】
既知の転写調節因子と設計した標的配列またはコンセンサス標的配列の関係、およびこれらの転写調節因子の機能は、次の通りである。
[1]v−jun、c−jun、junB、junD、dJRA、c−fos、fosB1、fosB2、Fra−1、LRF−1、v−maf、mafG、NF−E2 p45、aNF−E2、fNF−E2、Nrf short form、GCN4、yAP−1、CREB−2、ATF−3、CRE−BP1、CRE−BP3、ATF−a、CREB−341、CREB−327、CREM、dCREB2、dCREB2−b、dCREB2−c、dCREB2−d、dCREB2−q、dCREB2−r、dCREB2−sのコンセンサス標的配列:TGATGACGT(配列番号34)
[2]C/EBPα、C/EBPβ、p34C/EBPβ、CHOP−10のコンセンサス標的配列:AAGTGGCGAAAGAGACA(配列番号35)
上記の転写調節因子は、例えば、インシュリン抵抗性糖尿病、断続的ケトン尿症、多剤耐性の誘導に関与していることが知られている。
[3]VBP、Hlf、CPRF−2、EmBP−1b、EmBP−1b、GBF1、GBF2、GBF3、CPRF−1、TAF−1、HBP−1a、GBF9、GBF1、GBF12、CPRF−3、TGA1a、TGA1b、O2、STE4のコンセンサス標的配列:AGAAGCACGTGG(配列番号36)
[4]OPI1、E2A、E47、ITF−2/SEF2−1B、SEF−1A、MyoD、p42Tal−1のコンセンサス標的配列:AACAGATGGT(配列番号37)
[5]HEN−1の標的配列:GGGGCGCAGCTGCGGCCC(配列番号38)
[6]AhR、Arntのコンセンサス標的配列:GGGGATTGCGTG(配列番号39)
上記の転写調節因子は、成体ではほとんどの細胞や組織において普遍的に発現が認められ、例えば、ダイオキシンによる薬物代謝酵素の誘導に関与していることが知られている。
[7]USFの標的配列:GTCACGTGGT(配列番号40)
[8]NF−1A1、NF−1A1.1、NF−1A6、NF−1B1、NF−1B1、NF−1B2、NF−1C2/CTF−2、CTF−4、CTF−6のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号41)
上記の転写調節因子は、ハウスキーピング遺伝子の転写に関与するだけではなく、例えば、TGF−βによる転写の活性化、インスリンによるグルコーストランスポーター遺伝子の発現抑制など、多くの細胞特異的な遺伝子の転写の促進や抑制に関与していることが示されている。また、癌遺伝子の機能と相互作用している可能性も示唆されている。
[9]RF−X1の標的配列:GGTAACATAGCAAC(配列番号42)
[10]AP2αA/AP−2α1、AP2α2、AP2α3、AP2α4、AP2αB、AP2β、AP2γのコンセンサス標的配列:CGCCCCCCGGCG(配列番号43)
【0140】
[11]GRの標的配列:GGTACAAAATGTTCT(配列番号44)
上記の転写調節因子は、例えば、Glucocorticoidの放出の促進、ストレス応答、
胎児におけるGlucocorticoid 要求性、肺形成不全、血管新生に関連する癌、妊娠初期の子宮の不適応症、成長ホルモン欠損症、胎児の子宮内成長遅滞、子宮低酸素症、骨形成関連疾患、vitamin Dの誘導等に関与していることが知られている。
[12]ARの標的配列:AACATTATGTTCT(配列番号45)
[13]ERの標的配列:AAGGGAAAATGACCCCC(配列番号46)
[14]RXR−αの標的配列:GGTCATAGGGGT(配列番号47)
上記の転写調節因子は、若年発症糖尿病、肥満、肝臓における薬物代謝、癌、低HDL・低アポ蛋白、アテローム硬化症、下痢、消化不良、栄養失調、多発性硬化症、RA、SLE、インシュリン依存性糖尿病、クローン病、喘息、高HDL、低βリポ蛋白症、高αリポ蛋白症、アミロイド症、動脈硬化等循環器疾患の誘導等に関与していることが知られている。
[15]PPARαの標的配列:CTAGGGCAAAGGTCA(配列番号48)
前述のように、上記の転写調節因子は、主として肝臓、腎臓、褐色脂肪細胞などの脂肪消費臓、その他心筋や消化管に発現が認められ、脂肪酸酸化、ケトン体生成、アポリポタンパクの生成などに関与し、生活習慣病発症、例えば糖尿病や肥満等と関連する内分泌・糖・脂質代謝、さらには血管機能や炎症などの循環器系や発がん機構に関与する種々の標的遺伝子の発現を調節している疾患関連転写調節因子として知られている
[16]PPARγの標的配列:GGTCAAAGGTCA(配列番号49)
前述のように、上記の転写調節因子は、脂肪細胞、脂肪組織、免疫系臓器、副腎、小腸で発現し、脂肪細胞の分化誘導や脂肪合成に重要な役割を担っていると考えられている。
[17]COUP−TF1、HNF−4α1、HNF−4α2の標的配列:TGAACTTTGA(配列番号50)
[18]CF1の標的配列:GGGGTCACC(配列番号51)
[19]GATA−1、GATA−2、GATA−3、GATA−4のコンセンサス標的配列:CCAGATAAGG(配列番号52)
上記の転写調節因子は、血球系細胞、神経系、心臓および腸管などの内臓に発現しており、血球系細胞の分化、形成、維持、増殖およびアポトーシス、白血病、精子形成、神経系細胞の分化および形成、臓器形成、等に関与していることが示されている。
[20]AREA/NIT−2の標的配列:TATCTC(配列番号53)
【0141】
[21]Sp1の標的配列:GGGGGGGGGG(配列番号54)
上記の転写調節因子は、ハウスキーピング遺伝子の転写だけでなく、癌遺伝子やウイルス遺伝子の転写にも関与していることが示されている
[22]YY1の標的配列:CGGCCATCTTGGCT(配列番号55)
[23]Egr−1、Egr−2、Egr−3のコンセンサス標的配列:TGCGTGGGCG(配列番号56)
[24]Snailの標的配列:CACCTGTTTTCA(配列番号57)
[25]CF2−IIの標的配列:GTATATATA(配列番号58)
[26]Evi−1の標的配列:AGATAAGATAA(配列番号59)
[27]Ikaros、MZF−1のコンセンサス標的配列:TTGGGAGG(配列番号60)
[28]Tramtrack69Kの標的配列:GGACCTGC(配列番号61)
[29]HOX9の標的配列:TGACAGTTTAACGA(配列番号62)
[30]CDPの標的配列:CCAATAATCGAT(配列番号63)
【0142】
[31]HNF−1Aの標的配列:GGTTAATGATTAACCAC(配列番号64)
[32]Nkx−2.2、Nkx−2.5、TTF−1のコンセンサス標的配列:TTAAGTGGTT(配列番号65)
[33]Oct−1A、Oct−1B、Oct−1Cのコンセンサス標的配列:ATGCAAAT(配列番号66)
[34]Oct−2、Oct−2.1/Oct−2Bのコンセンサス標的配列:TATTTGCAT(配列番号67)
[35]Pax−3、Pax−6のコンセンサス標的配列:CGTCACGCTTGA(配列番号68)
[36]Pax−1の標的配列:CCGTTCCGCTCTAGATAT(配列番号69)
[37]HSF1(short)、HSF2、dHSF、fungal HSFのコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号70)
上記の転写調節因子は、ほとんどの細胞や組織において普遍的に発現が認められ、例えば、熱ショック応答に関与していることが知られている。
[38]c−Myb、A−Myb、v−Myb、P(long)、P(short)、C1(long)、C1(short)のコンセンサス標的配列:AACGGGCCC(配列番号71)
[39]c−Ets−1_p54、Ets−1_δiV/VII、Ets−2、Elk−1、SAP−1、SAP−1b、Erg−1、p55erg、Fli−1b、E4TF1−60/GABP−α、E74Aのコンセンサス標的配列:GACAGGAAGTG(配列番号72)
上記の転写調節因子は、癌、サーカディアンリズム関連疾患の誘導等に関与していることが知られている。
[40]IRF−1、IRF−2のコンセンサス標的配列:GAAAAGCGAAACC(配列番号73)
【0143】
[41]p50の標的配列:GGGGACTTTCC(配列番号74)
[42]NF−ATc、NF−Atpのコンセンサス標的配列:AGGAAAA(配列番号75)
[43]p91(STAT1)、p84のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号76)
上記の転写調節因子は、各種インターフェロンにより刺激、活性化され、ウイルスや細菌感染の防御に関与していることが知られている。
[44]STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号77)
上記の転写調節因子は、各種インターフェロンや各種インターロイキンなどのサイトカインにより刺激、活性化され、癌、自己免疫疾患、炎症に関与していることが知られている。
[45]p53の標的配列:GGACATGCCCGGGCATGTC(配列番号78)
前述のように、上記の転写調節因子は、癌抑制遺伝子であることが知られており、アポトーシスを起こすシグナル伝達に関与していることと、細胞がDNA修復を行う間、細胞周期を停止させる機能を有することから、癌等の治療薬のターゲット分子として注目されている。
[46]MEF−2Aの標的配列:CTCTAAAAATA(配列番号79)
[47]SRFの標的配列:CCATATATGGACAT(配列番号80)
[48]E2の標的配列:AACCAAAAACGGTAA(配列番号81)
[49]TBPの標的配列:TATAAAA(配列番号82)
[50]SRY、Sox−5、Sox−9のコンセンサス標的配列:AAAAAACAATAGGG(配列番号83)
上記の転写調節因子は、神経系の発生・分化、軟骨形成、性分化などの発生・分化に関与していることが知られている。
[51]mat−Mcの標的配列:TCATTGTT(配列番号84)
[52]CP1A、CP1B、CBF−Cのコンセンサス標的配列:CTGATTGGCTACC(配列番号85)
[53]AML1aの標的配列:TGTGGT(配列番号86)
【0144】
まず、上記53種類の標的配列またはコンセンサス標的配列(配列番号34〜配列番号86)を有するDNAに関し、それぞれの5’側にビオチンが付加したDNAとその相補な塩基配列を有するDNAを定法により個別にアニーリングさせ、合計53種類の二本鎖化したDNAを調製した。一方、解析に用いるセンサーチップは、1枚に付きフローセルが4分割されている。フローセル1は何も固定化せずコントロール区として用い、フローセル2、3および4はそれぞれ上記で調製した二本鎖DNAを3種類づつ固定化した。センサーチップのDNAの固定化密度を一定にするため、DNA固定化によるSPR応答値の上昇(ΔRU−DNA)をDNA分子量(MW)で割った値(D)が各フローセルで一定になるようにΔRU−DNAを調節した。同様の要領で、残りのDNAについても固定化を行った。
【0145】
以上のようにセンサーチップの作製ができた後、クローンのcDNAがコードする本発明のタンパク質との結合活性解析を行った。SPR法によるDNAとタンパク質間の結合活性解析は既に多数報告がある。本実施例では、Molecular Microbiology, 36(3), 557−569(2000)の測定条件を参考にして行った。まず、フローセル1−2−3−4が直列につながった流路に設定しておく。そこにランニングバッファーを一定流量(5μL/min)で流しておき、SPR測定値を安定させた後、各フローセルのベースライン値(SPR−baseline)を測定する。次に、タンパク質溶液を同流量で流し、タンパク質分子とDNA鎖との間で特異的結合を形成させる。一定時間注入後、各フローセルのSPR応答値(SPR−bound)を測定した。
【0146】
(4)SPR法により得られた測定結果の解析方法
SPR応答値からベースライン値を差し引き([SPR−bound]−[SPR−baseline])することにより、真の結合量(B)を求め、さらに、標準化した値(nB)を求めた。
測定結果より、本発明のクローンによりコードされるタンパク質(配列番号11〜20)は、前記[1]〜[53]の計53種類の標的配列またはコンセンサス標的配列(配列番号34〜配列番号86)を有するDNAの少なくとも一つに対して結合活性を有していることがわかった(表1)。表1で、AはnBが100以上、BはnBが50以上100未満、CはnBが5以上50未満、DはnBが0から5未満、であることを示す。
【0147】
【表1】

Figure 2005021093
【0148】
表1より、c−nt2ri3007878によりコードされるタンパク質は、TBPの標的配列:TATAAAA(配列番号82)、SRY等のコンセンサス標的配列:AAAAAACAATAGGG(配列番号83)、mat−Mcの標的配列:TCATTGTT(配列番号84)に非常に高い親和性を示した。このことから、該タンパク質はDNA結合性を有し、神経系の発生・分化、軟骨形成、性分化などの異常に起因する疾患と関連する転写調節因子である可能性がある。また、該タンパク質は、Oct−2等のコンセンサス標的配列:TATTTGCAT(配列番号67)、HSF1(short)等のコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号70)に高い親和性を示し、USFの標的配列:GTCACGTGGT(配列番号40)、GRの標的配列:GGTACAAAATGTTCT(配列番号44)、RXR−αの標的配列:GGTCATAGGGGT(配列番号47)、PPARαの標的配列:CTAGGGCAAAGGTCA(配列番号48)、c−Myb等のコンセンサス標的配列:AACGGGCCC(配列番号71)、c−Ets−1_p54等のコンセンサス標的配列:GACAGGAAGTG(配列番号72)、IRF−1等のコンセンサス標的配列(配列番号73)、p50の標的配列:GGGGACTTTCC(配列番号74)、CP1A等のコンセンサス標的配列:CTGATTGGCTACC(配列番号85)に親和性を示した。
【0149】
c−bramy2043103によりコードされるタンパク質は、ERの標的配列:AAGGGAAAATGACCCCC(配列番号46)、RXR−αの標的配列:GGTCATAGGGGT(配列番号47)、PPAR−α:CTAGGGCAAAGGTCA(配列番号48)、Pax−3等のコンセンサス標的配列:CGTCACGCTTGA(配列番号68)、Pax−1の標的配列:CCGTTCCGCTCTAGATAT(配列番号69)およびHSF1等のコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号70)に親和性を示した。このことから該タンパク質はDNA結合性を有し、脂質代謝や薬物代謝、筋肉形成などの異常に起因する疾患、例えば生活習慣病などの疾患と関連する転写調節因子である可能性がある。
【0150】
c−brssn2013753によりコードされるタンパク質はGATA−1等のコンセンサス標的配列:CCAGATAAGG(配列番号52)、およびAREA/NIT−2の標的配列:TATCTC(配列番号53)に非常に高い親和性を示した。このことから該タンパク質はDNA結合性を有し、造血幹細胞の分化、血球系細胞、神経系細胞、循環器、アポトーシス制御などの異常に起因する疾患と関連する転写調節因子である可能性がある。また、該タンパク質は、HNF−1Aの標的配列:GGTTAATGATTAACCAC(配列番号64)に高い親和性を示し、PPARγの標的配列:GGTCAAAGGTCA(配列番号49)、CF2−IIの標的配列:GTATATATA(配列番号58)、Evi−1の標的配列:AGATAAGATAA(配列番号59)、Nkx−2.2等のコンセンサス標的配列:TTAAGTGGTT(配列番号65)、Oct−1A等のコンセンサス標的配列:ATGCAAAT(配列番号66)、IRF−1等のコンセンサス標的配列:GAAAAGCGAAACC(配列番号73)、p50の標的配列:GGGGACTTTCC(配列番号74)、TBPの標的配列:TATAAAA(配列番号82)、SRY等のコンセンサス標的配列:AAAAAACAATAGGG(配列番号83)、AML1aの標的配列:TGTGGT(配列番号86)に親和性を示した。
【0151】
c−brssn2017530によりコードされるタンパク質はSp1の標的配列:GGGGGGGGGG(配列番号54)、Tramtrack69Kの標的配列:GGACCTGC(配列番号61)、HOX9の標的配列:TGACAGTTTAACGA(配列番号62)およびCDPの標的配列:CCAATAATCGAT(配列番号63)に高い親和性を示した。このことから該タンパク質はDNA結合性を有し、造血幹細胞の分化、アポトーシス制御、サイトカイン産生などの異常に起因する疾患、ウイルス性疾患、細菌性疾患、癌などの疾患と関連する転写調節因子である可能性がある。また、該タンパク質は、OPI1等のコンセンサス標的配列:AACAGATGGT(配列番号37)、HEN−1の標的配列:GGGGCGCAGCTGCGGCCC(配列番号38)、AhR等のコンセンサス標的配列:GGGGATTGCGTG(配列番号39)、p91(STAT1)等のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号76)、STAT2等のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号77)、p53の標的配列:GGACATGCCCGGGCATGTC(配列番号78)に親和性を示した。
【0152】
c−hchon2000473によりコードされるタンパク質はHEN−1の標的配列:GGGGCGCAGCTGCGGCCC(配列番号38)、AhR等のコンセンサス標的配列:GGGGATTGCGTG(配列番号39)、USFの標的配列:GTCACGTGGT(配列番号40)、NF−1A1等のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号41)、RF−X1の標的配列:GGTAACATAGCAAC(配列番号42)、Sp1の標的配列:GGGGGGGGGG(配列番号54)、Egr−1等のコンセンサス標的配列:TGCGTGGGCG(配列番号56)、p50の標的配列:GGGGACTTTCC(配列番号74)、NF−ATcの標的配列:AGGAAAA(配列番号75)、p91等のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号76)、STAT2等のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号77)およびp53の標的配列:GGACATGCCCGGGCATGTC(配列番号78)に非常に高い親和性を示した。このことから該タンパク質はDNA結合性を有し、細胞周期、炎症、アポトーシス制御、免疫反応、薬物代謝、サイトカイン産生などの異常に起因する疾患、ウイルス性疾患、癌などの疾患と関連する転写調節因子である可能性がある。また、該タンパク質は、AREA/NIT−2の標的配列:TATCTC(配列番号53)に高い親和性を、C/EBPα等のコンセンサス標的配列:AAGTGGCGAAAGAGACA(配列番号35)、IRF−1等のコンセンサス標的配列:GAAAAGCGAAACC(配列番号73)に親和性を示した。
【0153】
c−testi4004626によりコードされるタンパク質はYY1の標的配列:CGGCCATCTTGGCT(配列番号55)、Egr−1等のコンセンサス標的配列:TGCGTGGGCG(配列番号56)、Snailの標的配列:CACCTGTTTTCA(配列番号57)、CF2−IIの標的配列:GTATATATA(配列番号58)、IRF−1,IRF−2のコンセンサス標的配列:GAAAAGCGAAACC(配列番号73)、NF−ATc等のコンセンサス標的配列:AGGAAAA(配列番号75)、およびp91等のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号76)に親和性を示した。このことから該タンパク質はDNA結合性を有し、免疫反応、サイトカイン産生などの異常に起因する疾患と関連する転写調節因子である可能性がある。
【0154】
c−trach3014316によりコードされるタンパク質はGATA−1等のコンセンサス標的配列:CCAGATAAGG(配列番号52)、Nkx−2.2等のコンセンサス標的配列:TTAAGTGGTT(配列番号65)およびOct−1A等のコンセンサス標的配列:ATGCAAAT(配列番号66)に高い親和性を示した。このことから該タンパク質はDNA結合性を有し、造血幹細胞の分化、血球系細胞、神経系細胞、循環器、アポトーシス制御などの異常に起因する疾患と関連する転写調節因子である可能性がある。また、該タンパク質は、VBP等のコンセンサス標的配列:AGAAGCACGTGG(配列番号36)、USFの標的配列:GTCACGTGGT(配列番号40),NF−1A1等のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号41)、PPARαの標的配列:CTAGGGCAAAGGTCA(配列番号48)、PPARγの標的配列:GGTCAAAGGTCA(配列番号49)、Snailの標的配列:CACCTGTTTTCA(配列番号57)、CDPの標的配列:CCAATAATCGAT(配列番号63)、HSF1(short)等のコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号70)、c−Ets−1_p54等のコンセンサス標的配列:GACAGGAAGTG(配列番号72)、IRF−1等のコンセンサス標的配列:GAAAAGCGAAACC(配列番号73)、p91(STAT1)等のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号76)、STAT2等のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号77)、SRFの標的配列:CCATATATGGACAT(配列番号80),E2の標的配列:AACCAAAAACGGTAA(配列番号81)に親和性を示した。
【0155】
c−beast2001444によりコードされるタンパク質はNF−1A1等のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号41)、RF−X1の標的配列:GGTAACATAGCAAC(配列番号42)、YY1の標的配列:CGGCCATCTTGGCT(配列番号55)、Snailの標的配列:CACCTGTTTTCA(配列番号57)、Evi−1の標的配列:AGATAAGATAA(配列番号59)、Ikaros等のコンセンサス標的配列:TTGGGAGG(配列番号60)、HNF−1Aの標的配列:GGTTAATGATTAACCAC(配列番号64)、Nkx−2.2等のコンセンサス標的配列:TTAAGTGGTT(配列番号65)、Oct−1Aの等のコンセンサス標的配列:ATGCAAAT(配列番号66)、Oct−2等のコンセンサス標的配列:TATTTGCAT(配列番号67)、Pax−3等のコンセンサス標的配列:CGTCACGCTTGA(配列番号68)、Pax−1の標的配列:CCGTTCCGCTCTAGATAT(配列番号69)、NF−ATc等のコンセンサス標的配列:AGGAAAA(配列番号75)、MEF−2Aの標的配列:CTCTAAAAATA(配列番号79)、SRFの標的配列:CCATATATGGACAT(配列番号80)およびE2の標的配列:AACCAAAAACGGTAA(配列番号81)に親和性を示した。このことから該タンパク質はDNA結合性を有し、造血細胞や肝細胞の増殖、免疫系細胞の発生・分化、脂質代謝、筋肉形成などの異常に起因する疾患、例えば生活習慣病などの疾患と関連する転写調節因子である可能性がある。
【0156】
実施例5 転写調節活性の測定(疾患関連転写調節因子に対する調節作用活性の解析)
(1)無細胞タンパク質合成系を用いた本発明のタンパク質の調製
本発明のcDNAがコードするタンパク質につき、さらに疾患関連転写調節因子に対する調節作用活性を解析した。各クローンのcDNAがコードするタンパク質は、実施例4(1)の方法に準じて調製した。
【0157】
(2)解析用プレートの調製
転写調節因子の疾患関連転写調節因子に対する調節作用活性の測定系に用いるDNAは、疾患関連転写調節因子が結合する塩基配列を有することを特徴とし、5’側にビオチン(Bioと表記する)が付加した一本鎖DNA(oligo−Aと記載する)とその相補的配列を有する一本鎖DNA(oligo−B)と記載するをアニーリングさせることにより、二本鎖化したDNAを用いた。以下に用いたDNA配列を記載する。
【0158】
疾患関連転写調節因子PPARγが認識する配列として、配列番号87と配列番号88を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo−A;5’− Bio−GGAACTAGGTCAAAGGTCATCCCCT−3’(配列番号87)
oligo−B;3’−CCTTGATCCAGTTTCCAGTAGGGGA−5’(配列番号88)
【0159】
疾患関連転写調節因子p53が認識する配列として、配列番号89と配列番号90を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo−A;5’−Bio−CTTGGACATGCCCGGGCATGTCCCTC−3’(配列番号89)
oligo−B;3’−GAACCTGTACGGGCCCGTACAGGGAG−5’(配列番号90)
【0160】
疾患関連転写調節因子NFκBが認識する配列として、配列番号91と配列番号92を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo−A;5’−Bio−AGTTGAGGGGACTTTCCCAGGC−3’(配列番号91)
oligo−B;3’−TCAACTCCCCTGAAAGGGTCCG−5’(配列番号92)
【0161】
疾患関連転写調節因子AP−1が認識する配列として、配列番号93と配列番号94を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo−A;5’−Bio−CGCTTGATGAGTCAGCCGGAA−3’(配列番号93)
oligo−B;3’−GCGAACTACTCAGTCGGCCTT−5’(配列番号94)
【0162】
疾患関連転写調節因子HIF−1が認識する配列として、配列番号95と配列番号96を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo−A;5’−Bio−GATCGCCCTACGTGCTGTCTCAGATC−3’(配列番号95)
oligo−B;3’−CTAGCGGGATGCACGACAGAGTCTAG−5’(配列番号96)
【0163】
疾患関連転写調節因子CREBが認識する配列として、配列番号97と配列番号98を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo−A;5’−Bio−AGAGATTGCCTGACGTCAGAGAGCTAG−3’(配列番号97)
oligo−B;3’−TCTCTAACGGACTGCAGTCTCTCGATC−5’(配列番号98)
【0164】
上記によって作成した二本鎖DNAを固定する固相担体として、BioTechniques ,32:1168−1177(2002)の方法に準じてストレプトアビジンをコートした96ウェルプレート{ビオチン結合能20ng/ウェル(80 pmol/ウェル)、ストレプトアビジンコートエリア300μl}またはTransAMキット(ACTIVE MOTIF社)もしくはBD Mercury TransFactorキットに添付のプレートを適宜使用した。
【0165】
(3)PPARγに対する調節作用活性の解析
解析試料としてはPPARγを含むPMA処理THP−1細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを9μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl,20% glycerol、0.1mM EDTA、10mM NaF、10μM NaMoO、1mM NaVO、10mM pNPP、10mM b−glycerophosphate、1mM DTT}と混合後、35μlの反応溶液{10mM Hepes(pH7.5)、4% glycerol、50mM NaCl、0.5mM EDTA、1mM MgCl、10μg/ml Herring sperm}および実施例5(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはPMA処理THP−1細胞核抽出溶液1μl,9μl希釈溶液,35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては10μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては10μl希釈溶液および40μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例5(2)によって作成した、PPARγが認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。
【0166】
この後洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、10mg/ml BSA}に溶解した抗PPARヤギ抗体(0.2μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。この後、洗浄用緩衝液によって充分な洗浄を行ない、抗体希釈液によって1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗ヤギIgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液によって充分な洗浄を行なった後、発色用基質(TMB)を含む1%DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm,リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表2の「PPARγ評価」のカラムに示す。表2で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
【0167】
【表2】
Figure 2005021093
【0168】
c−nt2ri3007878、c−brssn2017530、c−hchon2000473、c−beast2001444の4クローンによりコードされるタンパク質は、PPARが有する作用を増強または抑制する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測された。
【0169】
(4)p53に対する調節作用活性の解析
解析試料としては活性化p53を含むH処理MCF−7細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを9μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl、20% glycerol、0.1mM EDTA、10mM NaF、10μM NaMoO、1mM NaVO、10mM pNPP、10mM b−glycerophosphate、1mM DTT}と混合後、35μlの反応溶液{20mM Hepes(pH7.5)、10% glycerol、5mM KCl、0.5mM EDTA、5mM MgCl、1mM DTT、0.17μg/ml poly[d(I−C)]}および実施例5(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはH処理MCF−7細胞核抽出溶液1μl、9μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては10μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては10μl希釈溶液および40μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例5(2)によって作成した、p53が認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。この後、洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、10mg/ml BSA}に溶解した抗p53ウサギ抗体(0.2μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。
【0170】
この後洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液で1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗ウサギIgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1%DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm、リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表2の「p53評価」のカラムに示す。表2で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
【0171】
c−nt2ri3007878、c−brssn2017530、c−testi4004626の3クローンによりコードされるタンパク質は、p53が有する作用を増強または抑制する活性を有し、癌等に関連することが推測された。
【0172】
(5)NFκBに対する調節作用活性の解析
解析試料としてはNFκBを含むTNF−α処理HeLa細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを19μlの希釈溶液{20mM Hepes(pH7.5)、350mM NaCl、20% glycerol、1% Igepal−CA630、1mM MgCl, 0.5mM EDTA、0.1mM EGTA、5mM DTT}と混合後、25μlの反応溶液{4mM Hepes(pH7.5)、8% glycerol、120mM KCl、1% BSA、2mM DTT、10μg/ml Herring sperm}および実施例5(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはTNF−α処理HeLa細胞核抽出溶液1μl,19μl希釈溶液,25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては20μl希釈溶液,25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては20μl希釈溶液および30μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例5(2)によって作成した、NFκBが認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。
【0173】
この後洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1%Tween 20}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween20}に溶解した抗NFκB抗体(0.2μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。この後、洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液1000倍で希釈したHRP(西洋わさびペルオキシターゼ)標識抗IgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1%DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm,リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表2の「NFκB評価」のカラムに示す。表2で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
【0174】
c−testi4004626、c−trach3014316、c−beast2001444の3クローンによりコードされるタンパク質は、NFκBが有する作用を増強または抑制する活性を有し、関節リウマチや変形性関節炎などの免疫性疾患、炎症性疾患、癌等に関連することが推測された。
【0175】
(6)疾患関連転写調節因子AP−1に対する調節作用活性の解析
解析試料としては活性化AP−1を含むPMAおよびInomycin処理WI−38細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを19μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl、20% glycerol、0.1mM EDTA、10mM NaF、10μM NaMoO、1mM NaVO、10mM pNPP、10mM b−glycerophosphate,1mM DTT}と混合後、25μlの反応溶液{10mM Hepes(pH7.5)、 12% glycerol、8mM NaCl、0.2mM EDTA, 0.1% BSA、1mM DTT、0.17μg/ml poly[d(I−C)]}および実施例5(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としては活性化AP−1を含むPMAおよびInomycin処理WI−38細胞核抽出溶液1μl、19μl希釈溶液、25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては20μl希釈溶液、25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては20μl希釈溶液および30μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例5(2)によって作成した、AP−1が認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。この後洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、1% BSA}に溶解した抗リン酸化−c−Jun抗体(0.4μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。
【0176】
この後、洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液で1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗IgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1% DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm,リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表2の「AP−1評価」のカラムに示す。表2で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
【0177】
c−nt2ri3007878、c−hchon2000473、c−testi4004626、c−trach3014316の4クローンによりコードされるタンパク質は、AP−1が有する作用を増強または抑制する活性を有し、炎症性疾患や癌等に関連することが推測された。
【0178】
(7)疾患関連転写調節因子HIF−1に対する調節作用活性の解析
解析試料としてはHIF−1を含むCoCl処理Cos−7細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを9μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl、20% glycerol、0.1mM EDTA、10mM NaF、10μM NaMoO、1mMNaVO、10mM pNPP、10mM b−glycerophosphate、1mM DTT}と混合後、35μlの反応溶液{10mM Hepes(pH7.5)、5% glycerol、50mM NaCl、1mM EDTA、10mg/ml BSA, 1mM DTT}および実施例5(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはHIF−1を含むCoCl処理Cos−7細胞核抽出溶液1μl、9μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては10μl希釈溶液,35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの,測定ブランク用試料としては10μl希釈溶液および40μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例5(2)によって作成した、HIF−1が認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。この後、洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、10mg/ml BSA}に溶解した抗HIF−1マウス抗体(0.25μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。
【0179】
この後、洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液で1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗マウスIgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1% DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm、リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表2の「HIF−1評価」のカラムに示す。表2で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
【0180】
c−brssn2017530、c−testi4004626、c−trach3014316の3クローンによりコードされるタンパク質は、HIF−1が有する作用を増強または抑制する活性を有し、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等に関連することが推測された。
【0181】
(8)疾患関連転写調節因子CREBに対する調節作用活性の解析
解析試料としてはCREBを含むForskolin処理WI−38細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを19μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl、20% glycerol、0.1mM EDTA、10mM NaF、10μM NaMoO、1mM NaVO、10mM pNPP、10mM b−glycerophosphate、1mM DTT)と混合後、25μlの反応溶液(10mMHepes(pH7.5)、4% glycerol、50mM NaCl、0.5mM EDTA、1mM MgCl、1% BSA、1mM DTT、10μg/ml Herring sperm)および実施例5(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはForskolin処理WI−38細胞核抽出溶液1μl,19μl希釈溶液,25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては20μl希釈溶液,25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては20μl希釈溶液および30μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例5(2)によって作成した、CREBが認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で3時間反応させた。
【0182】
この後、洗浄用緩衝液{10mM phosphate buffer(pH7.5)、151mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、151mM NaCl、 2.7mM KCl、1% BSA}に溶解した抗CREB抗体(0.2μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。この後、洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液で1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗IgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1% DMSO溶液を100μlずつウェルに添加し室温で反応させて発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm、リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表2の「CREB評価」のカラムに示す。表2で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
【0183】
c−testi4004626、c−trach3014316の2クローンによりコードされるタンパク質は、CREBが有する作用を増強または抑制する活性を有し、記憶障害などの中枢系疾患、循環器系疾患、糖尿病等に関連することが推測された。
【0184】
実施例6 ヒト組織発現解析
本発明のヒトタンパク質をコードするmRNAの正常ヒトおよび疾患患者での組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
【0185】
(1)cDNA合成
ヒトの9組織より抽出・精製された市販の各mRNA(バイオチェイン社製:正常脳(#510005)、正常海馬(#510068)、正常視床(#510077)、正常腎臓(#510030)、正常肝臓(#510031)、正常膵臓(#510038)、正常骨格筋(#510047)、正常脂肪(#510018)、正常脾臓(#510049)、およびヒト正常末梢血白血球の市販の全RNA(ユニーテック社製)より精製されたmRNAから、オリゴdTをプライマーとした逆転写反応を行いそれぞれのcDNAを合成した。また、ヒトの10組織より調製された市販の各cDNA(クロンテック社製:正常乳房および乳癌(#HP102B)、正常結腸および結腸癌(#HP102C)、正常肺および肺癌(#HP104L)、正常胃および胃癌(#HP101S)、バイオチェイン社製:正常前頭葉(#510068)、アルツハイマー病前頭葉(#550901)を使用した。
【0186】
(2)PCR法による定量
本発明のヒトタンパク質をコードしているmRNA(c−nt2ri3007878、c−febra2001620)の発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
c−nt2ri3007878
5’側プライマー:GAAGTCGACTGCCAAAGAGG(配列番号99)
3’側プライマー:ATTTCCCGTCAAAGGAGGTT(配列番号100)
c−febra2001620
5’側プライマー:GCATCCATGTTGTTTTAATTAAGTG(配列番号101)
3’側プライマー:GTGCAAAGGTGGAACTCTCA(配列番号102)
【0187】
定量結果は、Glyceraldehyde 3−phosphate dehydrogenase(GAPDH)を内部標準として、補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)をGAPDHの発現量(コピー数/μl)で除し、定数(1×10)を乗して表示した。その結果を表3に示す。
【0188】
【表3】
Figure 2005021093
【0189】
表3から明らかな通り、c−nt2ri3007878のmRNAは膵臓で強く発現し、脾臓、肝臓、および脳で発現し、アルツハイマー病患者前頭葉(AD前頭葉)で発現が増加した。
c−febra2001620のmRNAは膵臓、脾臓、および肝臓で発現し、乳癌、肺癌で発現が増加した。
この結果より、上記クローンのcDNAおよび該cDNAによってコードされるタンパク質は、癌やアルツハイマー病などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0190】
実施例7 各cDNAクローンの解析結果
(1)c−nt2ri3007878(配列番号1、11)
c−nt2ri3007878(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号1に示すように、6156塩基から成り、そのうち塩基番号227から2245までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、672アミノ酸残基から成る(配列番号11)。
【0191】
配列番号1がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、(i)データベース登録記号X60156、zinc finger protein(ZF7)(Human)がヒットした。その内容として、X60156は738アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号3〜705が、配列番号11に記載のアミノ酸配列のアミノ酸番号1〜670と、e−value:0.0、かつ703アミノ酸残基に亘り58%の一致度でヒットした。また、(ii)データベース登録記号Q14587、zinc finger protein 268 (human) がヒットした。その内容として、Q14587は947アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号81〜774が、配列番号11に記載のアミノ酸配列のアミノ酸番号6〜670と、e−value:0.0、かつ698アミノ酸残基に亘り54%の一致度でヒットした。さらに(iii)データベース登録記号B32891,finger protein 2, placental (Human)がヒットしていた。その内容として、B32891は651アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号2〜618が、配列番号11に記載のアミノ酸配列のアミノ酸番号85〜670とe−value:0.0、かつ617アミノ酸残基に亘り58%の一致度でヒットした。これらの結果より配列番号11に示したアミノ酸配列からなるタンパク質は、KRAB zinc finger proteinであることが推測された。
上記(i)のタンパク質は、データベース中の文献情報Nucleic Acid Res. 19(20):5661−7から、finger preceding box(FPB;KRABと同義)をもつzinc finger proteinであることが、また上記(ii)のタンパク質は、DNA Cell Biol.14(2):125−36から、単球の分化・増殖の調節を行うことが、それぞれ明らかになった。
【0192】
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、配列番号11のアミノ酸番号200〜222、228〜250、256〜278、284〜306、312〜334、340〜362、368〜390、396〜418、424〜446、452〜474、480〜502、508〜530、536〜558、564〜586、592〜614、620〜642、648〜670に示されるアミノ酸配列にC2H2 zinc fingerの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。
C2H2 type zinc fingerは、保存された2つのCysと2つの Hisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くのDNA結合タンパク質に見られる。
また、アミノ酸番号6〜46に示されるアミノ酸配列にKruppel−associated boxの特徴を示す配列(PfamにKRABとしてエントリーされるアミノ酸配列)も見出された。Kruppel−associated box(KRAB)は、C2H2タイプのZnフィンガータンパク質のおよそ1/3に見られ、N末端部分に存在し、転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られている。
【0193】
さらに、タンパク質の細胞内局在の予測プログラムであるPSORTII(Trends Biochem.Mol.Biol. 58 (4): 417−424 (1996)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、核に100.0%であることがわかった。よって本タンパク質は、核に局在することが予測された。
【0194】
ゲノム情報を得るため、ヒトcDNAをヒトゲノム配列へ写像するソフトウエアsim4(Genome Res.8, 967−974 (1998))を用い、本DNAのゲノムへの写像を試みたところ、第12番染色体上に5個のエクソンがマッピングされた。
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によって、写像された第12番染色体上の位置(q24.3)を含むq24にヌーナン症候群、q24に脊髄性筋萎縮症の原因遺伝子座が存在することがわかった。これらによって本DNAがこれらの疾患の原因遺伝子である可能性や本DNAの変異がこれらの診断に応用できる可能性が推測された。
【0195】
以上より配列番号11に示すタンパク質はヒトの器官・組織などの発生・分化・形成、細胞周期や細胞増殖などに関わる機能を有する新規Znフィンガータンパク質であることが予測された。
【0196】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、TBPの標的配列:TATAAAA(配列番号82)、SRY,Sox−5,Sox−9のコンセンサス標的配列:AAAAAACAATAGGG(配列番号83)、mat−Mcの標的配列:TCATTGTT(配列番号84)に非常に高い親和性を示した。このことから本タンパク質はDNA結合能を有し、神経系の発生・分化、軟骨形成、性分化などの異常に起因する疾患との関連が考えられる。また、実施例5によって、PPARが有する作用を増強する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測された。また、p53が有する作用を抑制する活性を有し、癌等に関連することが推測された。さらに、AP−1が有する作用を抑制する活性を有し、炎症性疾患や癌等に関連することが推測された。
【0197】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−10でヒットしたヒトESTが5個以上ある器官名または組織名を抽出したところ、ヒトの正常な眼、子宮、胎盤、腸、免疫系、胎児肝臓、胎児脾臓、癌化した皮膚、眼であった。尚、本DNAは未分化のNT2細胞を含む神経系細胞由来のcDNAライブラリーからクローニングされた。
DNA Cell Biol.14(2):125−36では、冒頭のBLASTヒットの(ii)のタンパク質(zinc finger protein 268)は、単芽球で発現することが述べられている。さらにDNA 8(6): 377−87 (1989) からは、上記(iii)のタンパク質(finger protein 2)は胎盤由来のcDNAライブラリーからクローニングされたことがわかっている。
また、本タンパク質は、実施例6より、膵臓で強く発現し、脾臓、肝臓、および脳で発現し、アルツハイマー病患者前頭葉で発現が増加することが示された。
【0198】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えばメラノ−マ・リンパ腫・白血病・神経膠腫・神経芽細胞腫・子宮癌・大腸癌・小腸癌・皮膚癌・肝臓癌などの癌、アルツハイマー病・パーキンソン病・舞踏病などの神経変性疾患、肝炎・皮膚炎・骨軟骨炎・変形性関節炎などの炎症性疾患、免疫系疾患、糖尿病、肥満、循環器系疾患、アレルギー疾患、脾臓疾患、不妊、ヌーナン症候群、脊髄性筋萎縮症などに関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0199】
(2)c−febra2001620(配列番号2、12)
c−febra2001620(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号2に示すように、2146塩基から成り、そのうち塩基番号214から1947までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、577アミノ酸残基から成る (配列番号12)。
【0200】
配列番号2がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、(i)データベース登録記号AF325191、KRAB zinc finger protein HZF26 (Human) がヒットした。その内容として、AF325191は470アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号2〜468が、配列番号12に記載のアミノ酸配列のアミノ酸番号17〜483と、e−value:0.0かつ467アミノ酸残基に亘り84%の一致度でヒットした。また(ii)データベース登録記号AB075849、KIAA1969 protein (Human)がヒットした。その内容として、AB075849は595アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号51〜583が、配列番号12に記載のアミノ酸配列のアミノ酸番号16〜548と、e−value:0.0かつ533アミノ酸残基に亘り69%の一致度でヒットした。さらに(iii)データベース登録記号、Q03923、zinc finger protein 85 (Zinc finger protein HPF4 ; Human)がヒットした。その内容として、Q03923は595アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号2〜568が、配列番号12に記載のアミノ酸配列のアミノ酸番号17〜555と、e−value:0.0かつ568アミノ酸残基に亘り65%の一致度でヒットした。
【0201】
また、配列番号12に示すアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ配列番号12のアミノ酸番号188〜210、216〜243、244〜266、272〜294、300〜322、328〜350、356〜378、384〜406、440〜462、468〜490、496〜518、524〜546に示されるアミノ酸配列にzinc finger,C2H2 type regionの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。 このドメインは、保存された2つのCysと2つのHisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くの DNA結合タンパク質に見られる。
さらに配列番号12のアミノ酸番号19〜59に示されるアミノ酸配列にKRAB box regionの特徴を示す配列(PfamにKRABとしてエントリーされるアミノ酸配列)を見出した。Kruppel−associated box(KRAB)はC2H2タイプのZnフィンガータンパク質の約1/3に見られ、N末端部分に存在し、DNAとの結合の際には転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られている。
前述のBLASTでヒットした(i)のタンパク質は、データベース中の文献情報(DNA Cell. Biol. 142(2):125−136(1995))から単球の分化・増殖の調節に関わることが、上記(ii)のタンパク質は、データベース中の文献情報(DNA Res. 8(6):319−327(2001))から細胞のシグナル伝達、細胞骨格や細胞の運動性の機能が予測されることが、さらに上記(iii)のタンパク質は、データベース中の文献情報(DNA Cell. Biol. 17(11):931−943(1998))からKRABドメインが、転写を抑制するコファクターを構成するいくつかの核内タンパク質とin vitroで結合することがそれぞれ明らかとなった。
【0202】
更にタンパク質の細胞内局在の予測プログラムであるPSORTII(Trends Biochem.Mol.Biol. 58,(4) 417−424 (1996))による解析を行ったところ、本タンパク質の細胞内での局在の確率は核に100.0%であり、本タンパク質は核に存在することが予測された。この結果は本タンパク質が細胞核内でDNAと結合し、細胞の分化・増殖、細胞周期などに関与する遺伝子の転写を調節するタンパク質であることを示唆するものである。
【0203】
一方、ゲノム情報を得るため、ヒトcDNAをヒトゲノム配列へ写像するソフトウエアsim4(Genome Res.8, 967−974 (1998))を用い、本DNAのゲノムへの写像を試みたところ、第19番染色体上に6個のエクソンがマッピングされた。真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によれば、写像された第19番染色体上の位置(p13.11)を含むp(短腕)に外骨腫症、p13に急性骨髄性白血病の原因遺伝子座が存在し、更に外胚葉性異形成症、高バリン血症、高ロイシン−イソロイシン血症の原因遺伝子座は第19番染色体上に存在するが、その詳細位置は同定されていないことがわかった。これらによって本DNAがこれらの疾患の原因遺伝子である可能性や本DNAの変異がこれらの診断に応用できる可能性が推測された。
【0204】
以上より配列番号12に示すタンパク質はヒトの器官・組織の発生・分化・形成、細胞周期や細胞増殖に関わる機能を有する新規Znフィンガータンパク質であることが予測された。
【0205】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−50でヒットしたヒトESTが5個以上ある器官名または組織名を抽出したところ、正常な精巣・眼・脳・胃、癌化した精巣・子宮・脳・肺であった。尚、本DNAは胎児脳組織由来のcDNAライブラリーからクローニングされた。
更にBLASTのヒット上位3位について発現組織に関する文献情報を調べたところ、DNA Cell. Biol. 142(2):125−136(1995)に、KRAB zinc finger protein HZF26 (Human)はヒト単芽球において発現することが、DNA Res. 8(6):319−327(2001)に、KIAA1969 protein (Human)が脳・脊髄・胎児脳・胎児肝臓などで発現することが、さらにDNA Cell. Biol. 17(11):931−943(1998)に、zinc finger protein 85(Human)は精巣上皮腫組織に高発現することが、それぞれ述べられていた。
また、本タンパク質は、実施例6より、膵臓、脾臓、および肝臓で発現し、乳癌、肺癌で発現が増加することが示された。
【0206】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば精巣癌・メラノーマ・脳腫瘍・神経膠腫・神経芽細胞腫・胃癌・子宮癌・肺癌・肝臓癌・乳癌などの癌、アルツハイマー病・パーキンソン病・舞踏病などの神経変性疾患、肺炎・肝炎などの炎症性疾患、免疫系疾患、アレルギー疾患、不妊、高バリン血症、高ロイシン−イソロイシン血症、外胚葉性異形成症、外骨腫症などに関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0207】
(3)c−bramy2043103(配列番号3、13)
c−bramy2043103(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号3に示すように、3049塩基から成り、そのうち塩基番号281から2284までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、667アミノ酸残基からなる (配列番号13)。
【0208】
配列番号13のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号Q9UJW8、Zinc finger protein 180 (Human)がヒットした。その内容としてQ9UJW8は692アミノ酸から成り、そのアミノ酸配列中の1〜692が、配列番号13に記載のアミノ酸配列のアミノ酸番号1〜667と、e−value:0.0、かつ692アミノ酸残基に亙り96%の一致度でヒットした。
BLAST検索のアライメントから本タンパク質は、Q9UJW8のアミノ酸番号45〜69の25残基に該当するアミノ酸を欠失しており、更に本DNAはQ9UJW8に該当する塩基配列AF192913の塩基番号398〜472に該当する75塩基(本DNAの塩基番号412と413の間)を欠失していることもわかった。
【0209】
また配列番号13のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号328〜350、356〜378、384〜406、412〜434、440〜462、468〜490、496〜518、524〜546、552〜574、580〜602、608〜630、636〜658に示されるアミノ酸配列にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。このドメインは、保存された2つのCysと2つのHisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くの DNA結合タンパク質に見られる。
さらに配列番号13のアミノ酸番号47〜87に示されるアミノ酸配列にKRAB box regionの特徴を示す配列(PfamにKRABとしてエントリーされるアミノ酸配列)を見出した。Kruppel−associated box(KRAB)はC2H2タイプのZnフィンガータンパク質の約1/3に見られ、N末端部分に存在し、DNAとの結合の際には転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られている。
【0210】
HMMPFAMによるタンパク質特徴検索では更に本タンパク質のアミノ酸番号25〜80はRemorin_N region(Remorin,N−terminal region)であり、この領域はQ9UJW8では見られない。C末端側でcoiled−coilが形成されるとき、このドメインはN末端側のプロリンに富んだ領域として存在し、DNAのような高分子と相互作用すると考えられている。Pfamで、C末端側でDNA結合能を示すZnフィンガードメインが検出されているが、この領域がQ9UJW8とは異なるDNA結合能や相互作用、転写活性の調節を示す可能性が考えられる。
【0211】
本DNAおよびAF192913cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒト第19番染色体上の4個のエクソンにマッピングされ、AF192913配列は5個のエクソンにマッピングされることがわかった。本DNAの第1、第2、第3、第4エクソンはAF192913と一致するが、本DNAはAF192913の第3エクソンを1個欠失している。この違いは前述のBLAST検索により本DNAの欠失部分(AF192913の塩基番号398〜472)に由来する。
これらの違いにより、DNAとの結合や相互作用、発現組織・発現量などに違いが生じる可能性がある。以上から、配列番号13のタンパク質はQ9UJW8、Zinc finger protein 180 (Human)のスプライシングバリアントである。
【0212】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は核95.7%、ミトコンドリア4.3%であった。核への局在の確率が高いことから、本タンパク質は細胞核内でDNAと結合し、細胞の分化・増殖、細胞周期などに関与する遺伝子の転写を調節するタンパク質であることが考えられる。
【0213】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第19番染色体上の位置(q13.31)を包含するq13.2−13.3に進行性遺伝性心ブロック、3−methylglutaconicaciduriaの原因遺伝子座が、q13に常染色体優性難聴、ダイアモンド‐ブラックファン貧血、口蓋裂の原因遺伝子座が、qに遺伝性小児痙攣の原因遺伝子座が存在することがわかり、更に外胚葉性異形成症、高バリン血症、高ロイシン‐イソロイシン血症が第19番染色体上に存在するが、その詳細位置は同定されていないことが明らかになった。以上より、本DNAがこれらの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断に応用できる可能性が予想された。
【0214】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、ERの標的配列:AAGGGAAAATGACCCCC(配列番号46)、RXR−αの標的配列:GGTCATAGGGGT(配列番号47)、PPAR−α:CTAGGGCAAAGGTCA(配列番号48)、Pax−3等のコンセンサス標的配列:CGTCACGCTTGA(配列番号68)、Pax−1の標的配列:CCGTTCCGCTCTAGATAT(配列番号69)およびHSF1等のコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号70)に親和性を示した。このことから本タンパク質はDNAとの結合能を有し、脂質代謝や薬物代謝、筋肉形成などの異常に起因する疾患、例えば生活習慣病などの疾患との関連が考えられる。
【0215】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−10でヒットしたヒトESTで、4個以上のヒットが見られる器官名または組織名を抽出したところ、ヒトの正常な肺・腸・脾臓、癌化した免疫系・リンパ系・子宮・眼・皮膚であった。尚、本DNAは扁桃核由来のcDNAライブラリーからクローニングされた。
【0216】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば肺癌・大腸癌・小腸癌・白血病・リンパ腫・子宮癌などの癌、うつ病、不安神経症、統合失調症などの中枢疾患、肺炎などの炎症性疾患、免疫系疾患、アレルギー疾患、高脂血症、動脈硬化、脾腫、口蓋裂、進行性遺伝性心ブロック、3−methylglutaconicaciduria、難聴、貧血、小児痙攣、高バリン血症、高ロイシン‐イソロイシン血症、筋形成不全に関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0217】
(4)c−brssn2013753(配列番号4、14)
c−brssn2013753(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号4に示すように、2312塩基から成り、そのうち塩基番号138から1019までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、293アミノ酸残基からなる (配列番号14)。
【0218】
配列番号14のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、(i)データベース登録記号Q62981、Zinc finger protein OZF(Rat)がヒットした。その内容として、Q62981は407アミノ酸から成り、そのアミノ酸配列中の116〜407が、配列番号14に記載のアミノ酸配列のアミノ酸番号1〜293と、e−value:5×10−176かつ293アミノ酸残基に亙り95%の一致度でヒットした。
また(ii)データベース登録記号Q62513、Zinc finger protein OZF(Mouse)がヒットした。その内容として、Q62981は407アミノ酸から成り、そのアミノ酸配列中の116〜407が、配列番号14に記載のアミノ酸配列のアミノ酸番号1〜293と、e−value:5×10−176かつ293アミノ酸残基に亙り95%の一致度でヒットした。
更に(iii)データベース登録記号Q15072、Zinc finger protein OZF(Human)がヒットした。その内容として、Q15072は292アミノ酸から成り、そのアミノ酸配列中の4〜292が、配列番号14に記載のアミノ酸配列のアミノ酸番号5〜293と、e−value:5×10−151かつ289アミノ酸残基に亙り81%の一致度でヒットした。
【0219】
また配列番号14のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号17〜39、45〜67、73〜95、101〜123、129〜151、157〜179、185〜207、213〜235、241〜263、269〜291に示されるアミノ酸配列にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。このドメインは、保存された2つのCysと2つのHisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くのDNA結合タンパク質に見られる。
またアミノ酸番号154〜194からXPA protein N−terminalの特徴を示す配列(PfamにXPA_Nとしてエントリーされるアミノ酸配列)を抽出した。XPA proteinは紫外線によって皮膚癌を高率に誘発する常染色体劣性遺伝病の色素性強皮症(XP)のパスウェイに関与するタンパク質であり、損傷したDNAへの結合能をもち、DNAの除去修復の機能を担っている。
XPA protein N−terminalドメインは本タンパク質には存在するが、上記ヒット配列のうちヒトの配列であるQ15072には見られない。よって本タンパク質はQ15072が持たないDNA修復に関する機能を有する可能性が推測できる。
【0220】
本DNAおよびヒトのヒット配列であるAJ011806(Q15072に該当するDNA配列)cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒト第19番染色体上の1個のエクソンにマッピングされ、AJ011806配列は1個のエクソンにマッピングされることがわかった。尚、両者のマッピング位置は重複する部分は全く無い。
また本DNAはヒト由来のクローンであるが、本タンパク質ともっとも相同性の高い配列がラットの配列である。よって配列番号14のタンパク質はラットやマウスのZinc finger protein OZFのオーソログであり、新規のヒトcDNAである可能性が高い。
【0221】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は核95.7%、ミトコンドリア4.3%であった。核への局在の確率が高いことから、本タンパク質は細胞核内でDNAと結合し、細胞の分化・増殖、細胞周期などに関与する遺伝子の転写を調節するタンパク質であることが考えられる。
【0222】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第19番染色体上の位置(q13.12)を包含するq13.1にシスチン尿症、嚢胞性骨形成異常、先天性ネフローゼ、q13に常染色体優性難聴、ダイアモンド‐ブラックファン貧血、口蓋裂の原因遺伝子座が、qに遺伝性小児痙攣の原因遺伝子座が存在することがわかった。更に外胚葉性異形成症、高バリン血症・高ロイシン‐イソロイシン血症が第19番染色体上に存在するが、その詳細位置は同定されていないことが明らかになった。
以上より、本DNAがこれらの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断に応用できる可能性が予想された。
【0223】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、GATA−1等のコンセンサス標的配列:CCAGATAAGG(配列番号52)、およびAREA/NIT−2の標的配列:TATCTC(配列番号53)に非常に高い親和性を示した。このことから本タンパク質はDNA結合能を有し、造血幹細胞の分化、血球系細胞、神経系細胞、循環器、アポトーシス制御などの異常に起因する疾患との関連が考えられる。
【0224】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−10でヒットしたヒトESTで、4個以上のヒットが見られる器官名または組織名を抽出したところ、ヒトの正常な眼・脳・腸・肺・胎盤、癌化した精巣・子宮・眼・皮膚であった。尚、本DNAは黒質由来のcDNAライブラリーからクローニングされた。
Eur.J.Biochem.236(3):991−5(1996)によれば、ヒトのOZFは乳腺上皮細胞で発現しており、腫瘍細胞で過剰発現が見られ、またInt.J.Cancer 80(3):369−72(1999)では、膵臓癌で高レベルに発現しており、発癌や腫瘍の発達への関与が推測される。
【0225】
以上より、本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えばメラノーマ・脳腫瘍・大腸癌・小腸癌・肺癌・子宮癌・皮膚癌・精巣癌などの癌、パーキンソン病・舞踏病などの神経変性疾患、統合失調症などの中枢疾患、肺炎・皮膚炎などの炎症性疾患、免疫系疾患、アレルギー疾患、不妊症、シスチン尿症、嚢胞性骨形成異常、難聴、貧血、造血障害、口蓋裂、小児痙攣に関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0226】
(5)c−brssn2017530(配列番号5、15)
c−brssn2011192(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号5に示すように、3839塩基から成り、そのうち塩基番号1582から2685までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、367アミノ酸残基からなる (配列番号15)。
【0227】
配列番号15のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号AF326206、ZNF140 − like transcription factor (Human)がヒットした。その内容としてAF326206は399アミノ酸から成り、そのアミノ酸配列中の33〜399が、配列番号15に記載のアミノ酸配列のアミノ酸番号1〜367が、e−value:0.0かつ367アミノ酸残基に亙り99%の一致度でヒットした。
BLAST検索のアライメントから本タンパク質はAF326206よりN末端が32残基短く、AF326206のアミノ酸番号136(本タンパク質のアミノ酸番号104に該当)にグルタミン酸からグリシンの1残基置換が存在することがわかった。また本DNAはAF326206と5’末端が1490塩基異なるが、翻訳開始点が塩基番号1582のため、AF326206との違いはAF326206の翻訳開始点の塩基番号338から433までになり、これがアミノ酸のN末端の違いに反映している。またAF326206の塩基番号743に該当する塩基(本DNAの塩基番号1891)がアデニンからグアニンに置換しており、これがアミノ酸の置換の由来である。
【0228】
また配列番号15のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号169〜191、197〜219、225〜247、253〜275、281〜303、309〜331、337〜359に示されるアミノ酸配列にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。このドメインは、保存された2つのCysと2つのHisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くのDNA結合タンパク質に見られる。
またAF326206にはアミノ酸番号4〜44にKRAB box regionが存在するが、本タンパク質には見られない。このドメインはDNAとの結合の際には転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られているので、本タンパク質はAF326206とは異なる転写活性を示し、細胞分化に何らかの影響を及ぼすことが予測される。
【0229】
本DNAおよびAF326206cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒト第19番染色体上の3個のエクソンにマッピングされ、AF326206配列は5個のエクソン(poly Aを除く)にマッピングされることがわかった。本DNAの第2、第3エクソンはAF192913の第4、第5エクソンとそれぞれほぼ一致するが、本DNAの第1エクソンはAF192913の第3エクソンより上流側に長い。また本DNAにはAF192913の第1、第2エクソンは存在しない。AF192913の翻訳開始位置は塩基番号337であることから、両者は翻訳開始位置が異なり、これがアミノ酸配列上のN末端の違いの原因になっている。
これらの違いにより、DNAとの結合や相互作用、発現組織・発現量などに違いが生じる可能性がある。以上から、配列番号15のタンパク質はAF326206、Zinc finger protein 140−like transcription factor (Human)のスプライシングバリアントである。
【0230】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は核に100.0%であった。よって本タンパク質は細胞核内でDNAと結合し、細胞の分化・増殖、細胞周期などに関与する遺伝子の転写を調節するタンパク質であることが考えられる。
【0231】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第19番染色体上の位置(q13.11)を包含するq13.1にシスチン尿症、先天性ネフローゼ、嚢胞性骨形成異常の原因遺伝子座が、q13に常染色体優性難聴、ダイアモンド‐ブラックファン貧血、口蓋裂の原因遺伝子座が、qに遺伝性小児痙攣の原因遺伝子座が存在することがわかり、更に外胚葉性異形成症、高バリン血症、高ロイシン‐イソロイシン血症が第19番染色体上に存在するが、その詳細位置は同定されていないことが明らかになった。以上より、本DNAがこれらの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断に応用できる可能性が予想された。
【0232】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、Sp1の標的配列:GGGGGGGGGG(配列番号54)、Tramtrack69Kの標的配列:GGACCTGC(配列番号61)、HOX9の標的配列:TGACAGTTTAACGA(配列番号62)およびCDPの標的配列:CCAATAATCGAT(配列番号63)に高い親和性を示した。このことから本タンパク質はDNA結合能を有し、造血幹細胞の分化、アポトーシス制御、サイトカイン産生などの異常に起因する疾患、ウイルス性疾患、細菌性疾患、癌などの疾患との関連が考えられる。また、実施例5によって、PPARが有する作用を強く抑制する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測された。また、p53が有する作用を抑制する活性を有し、癌等に関連することが推測された。さらに、HIF−1が有する作用を増強する活性を有し、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等に関連することが推測された。
【0233】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−50でヒットしたヒトESTで、5個以上のヒットが見られる器官名または組織名を抽出したところ、ヒトの正常な脳・眼・腎臓・胎盤、癌化した子宮・皮膚・眼・精巣であった。尚、本DNAは黒質由来のcDNAライブラリーからクローニングされた。
【0234】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば脳腫瘍・メラノーマ・腎臓癌・子宮癌・皮膚癌・精巣癌・白血病などの癌、パーキンソン病・舞踏病などの神経変性疾患、統合失調症などの中枢疾患、腎炎・皮膚炎などの炎症性疾患、免疫系疾患、アレルギー疾患、糖尿病、肥満、虚血性疾患、循環器系疾患、低酸素症、糖尿病性網膜症、シスチン尿症、ネフローゼ、難聴、貧血、口蓋裂、小児痙攣、外胚葉性異形成症、高バリン血症、高ロイシン‐イソロイシン血症に関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0235】
(6)c−hchon2000473(配列番号6、16)
c−hchon2000473(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号6に示すように、3588塩基から成り、そのうち塩基番号352から2271までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、639アミノ酸残基からなる (配列番号16)。
【0236】
配列番号16のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)ではゲノム配列以外に高いスコアを示すもは見当たらなかった。しかし商用の遺伝子配列特許データベースであるGENESEQ(Derwent社製)中の、アミノ酸配列データベースaageneseqでは登録記号AAU15940およびWO01/55322号公報にSeq ID 893として記載のアミノ酸配列、Human novel secreted proteinがヒットした。その内容としてAAU15940は361アミノ酸から成り、そのアミノ酸配列中の4〜361が、配列番号16に記載のアミノ酸配列のアミノ酸番号282〜639と、e−value:0.0かつ358アミノ酸残基に亙り100.0%の一致度でヒットした。
BLAST検索のアライメントから本タンパク質はAAU15940とN末端が281残基異なることがわかる。AAU15940は本タンパク質とは3残基異なっている。また本DNAではAAS25927(AAU15940に該当するDNA配列データベースnageneseq中のDNA配列)と5’末端が1193塩基異なり、またAAS25927は本DNAと8塩基異なり、これらがアミノ酸配列のN末端の違いの原因になっている。
【0237】
また配列番号16のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号234〜256、262〜284、290〜312、318〜340、346〜368、374〜396、402〜424、430〜452、458〜480、486〜508、514〜536、542〜564、570〜592、598〜620に示されるアミノ酸配列にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。このドメインは、保存された2つのCysと2つのHisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くの DNA結合タンパク質に見られる。
さらに配列番号16のアミノ酸番号27〜67に示されるアミノ酸配列にKRAB box regionの特徴を示す配列(PfamにKRABとしてエントリーされるアミノ酸配列)を見出した。Kruppel−associated box(KRAB)はC2H2タイプのZnフィンガータンパク質の約1/3に見られ、N末端部分に存在し、DNAとの結合の際には転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られている。
KRAB box regionは本タンパク質には存在するが、AAU15940には見られない。よって本タンパク質はAAU15940とは異なる転写活性を示し、細胞分化に何らかの影響を及ぼすことが考えられる。
【0238】
本DNAおよびAAS25927cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒトX染色体上の7個のエクソンにマッピングされ、AAS25927配列は1個のエクソン(poly Aを除く)にマッピングされることがわかった。本DNAの第7エクソンはAAS25927の1エクソンより長く、これを包含するが、本DNAの第1から第6エクソンはAAS25927には存在しない。この中でも第5、第6エクソンはKRABドメインに該当するため、AAU15940はKRABドメインを欠くというHMMPFAMの結果と一致する。これらの違いにより、DNAとの結合や相互作用、発現組織・発現量などに違いが生じる可能性がある。以上から、配列番号16のタンパク質は、WO01/55322号公報にSeq ID 893として記載のアミノ酸配列、Human novel secreted proteinのスプライシングバリアントである。
【0239】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は核に95.7%、ミトコンドリア4.3%であった。よって本タンパク質は細胞核内でDNAと結合し、細胞の分化・増殖、細胞周期などに関与する遺伝子の転写を調節するタンパク質であることが考えられる。
【0240】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像されたX染色体上の位置(p11.23)を包含するp11−23に精神遅滞、p11.4−11.2に脆弱X症候群、p11.3−11.2に関節拘縮症(脊髄性筋萎縮症)、p11.4−11.23にアルビノ(眼)、p11.4−11.21に弱視、p11.23に夜盲症、p11.2に乳頭状腎細胞癌、p11にインスリン依存性糖尿病、pに先天性白内障の原因遺伝子座が存在することがわかった。以上より、本DNAがこれらの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断に応用できる可能性が予想された。
【0241】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、HEN−1の標的配列:GGGGCGCAGCTGCGGCCC(配列番号38)、AhR等のコンセンサス標的配列:GGGGATTGCGTG(配列番号39)、USFの標的配列:GTCACGTGGT(配列番号40)、NF−1A1等のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号41)、RF−X1の標的配列:GGTAACATAGCAAC(配列番号42)、Sp1の標的配列:GGGGGGGGGG(配列番号54)、Egr−1の標的配列:TGCGTGGGCG(配列番号56)、p50の標的配列:GGGGACTTTCC(配列番号74)、NF−ATc等のコンセンサス標的配列:AGGAAAA(配列番号75)、p91等のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号76)、STAT2等のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号77)およびp53の標的配列:GGACATGCCCGGGCATGTC(配列番号78)に非常に高い親和性を示した。このことから本タンパク質はDNA結合能を有し、細胞周期、炎症、アポトーシス制御、免疫反応、薬物代謝、サイトカイン産生などの異常に起因する疾患、ウイルス性疾患、癌などの疾患との関連が考えられる。また、実施例5によって、PPARが有する作用を増強する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測された。また、AP−1が有する作用を抑制する活性を有し、炎症性疾患や癌等に関連することが推測された。
【0242】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−10でヒットしたヒトESTで、5個以上のヒットが見られる器官名または組織名を抽出したところ、ヒトの正常な脳・胎盤・胃・乳腺、癌化した眼・皮膚・肺・子宮であった。尚、本DNAは正常軟骨初代培養細胞由来のcDNAライブラリーからクローニングされた。
【0243】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば、白血病・リンパ腫・脳腫瘍・胃癌・乳癌・メラノーマ・皮膚癌・肺癌・子宮癌などの癌、肺炎・皮膚炎などの炎症性疾患、免疫系疾患、アレルギー疾患、肥満、循環器系疾患、不妊症、精神遅滞、脆弱X症候群、関節拘縮症、アルビノ、弱視、夜盲症、腎癌、糖尿病、変形関節症に関連する可能性が推測でき、本タンパク質はこれらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0244】
(7)c−testi4004626(配列番号7、17)
c−testi4004626(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号7に示すように、4053塩基から成り、そのうち塩基番号2097から3881までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、594アミノ酸残基からなる (配列番号17)。
【0245】
配列番号17のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)のデータベース登録記号P52736、Zinc finger protein 133 (Human)がヒットした。
その内容としてP52736は654アミノ酸から成り、そのアミノ酸配列中の73〜654が、配列番号17に記載のアミノ酸配列のアミノ酸番号13〜594と、e−value:0.0かつ584アミノ酸残基に亙り99%の一致度でヒットした。
BLAST検索のアライメントから本タンパク質はP52736とN末端が12残基異なり、P52736は本タンパク質とN末端が72残基異なることがわかる。また本タンパク質のアミノ酸番号121、428(P52736のアミノ酸番号181、488に該当)においてはロイシンからフェニルアラニン、ヒスチジンからアルギニンの置換がそれぞれ存在する。また本DNAではアライメント上ではU09366(P52736に該当する塩基配列)と5’末端が2131塩基異なるが、翻訳開始点は本DNAは塩基番号2097なので、5’末端の違いは35塩基であり、これがアミノ酸配列のN末端の違いの原因になっている。また本DNAの塩基番号2282、2457(U09366の塩基番号811、986に該当)にアデニンからグアニン、シトシンからチミンへの1塩基置換がそれぞれ存在しており、これがアミノ酸置換の原因になっている。
【0246】
また配列番号17のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号154〜176、182〜204、210〜232、238〜260、266〜288、294〜316、322〜344、350〜372、378〜400、406〜428、434〜456、462〜484、490〜512、518〜540、546〜571に示されるアミノ酸配列にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。このドメインは、保存された2つのCysと2つのHisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くのDNA結合タンパク質に見られる。
尚、P52736にはアミノ酸番号1〜41にKRAB box regionが存在するが本タンパク質には見当たらない。
よって本タンパク質はP52736とは異なる転写活性を示し、細胞分化に何らかの影響を及ぼす可能性が考えられる。
【0247】
本DNAおよびU09366cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒト第20番染色体上の2個のエクソンにマッピングされ、U09366配列は6個のエクソン(poly Aを除く)にマッピングされることがわかった。本DNAの第2エクソンはU09366の第6エクソンとほぼ一致するが、本DNAの第1エクソンはU09366には存在せず、位置としてはU09366の第5と第6エクソンの間に存在する。U09366の第4、第5エクソンはKRABドメインに該当し、FEBS Lett. 369(2−3):153−7にもZinc finger 133はKRAB boxのAとBの両方のサブドメインをもっていることが述べられているので、両DNAは構造上の違いのみならず、機能的にも差異が生じることが考えられる。
これらの違いにより、DNAとの結合や相互作用、発現組織・発現量などに違いが生じる可能性がある。以上から、配列番号17のタンパク質は、P52736、Zinc finger protein 133 (Human)のスプライシングバリアントである。
【0248】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は核に100.0%であった。よって本タンパク質は細胞核内でDNAと結合し、細胞の分化・増殖、細胞周期などに関与する遺伝子の転写を調節するタンパク質であることが考えられる。
【0249】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第20番染色体上の位置(p11.23)を包含するp11.2に遺伝性角膜ジストロフィーの原因遺伝子座が存在することがわかった。以上より、本DNAがこの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断薬に応用できる可能性が予想された。
【0250】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、YY1の標的配列:CGGCCATCTTGGCT(配列番号55)、Egr−1の標的配列:TGCGTGGGCG(配列番号56)、Snailの標的配列:CACCTGTTTTCA(配列番号57)、CF2−IIの標的配列:GTATATATA(配列番号58)、IRF−1,IRF−2のコンセンサス標的配列:GAAAAGCGAAACC(配列番号73)、NF−ATc等のコンセンサス標的配列:AGGAAAA(配列番号75)、およびp91等のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号76)に親和性を示した。このことから本タンパク質はDNAとの結合能を有し、免疫反応、サイトカイン産生などの異常に起因する疾患との関連が考えられる。また、実施例5によって、p53が有する作用を抑制する活性を有し、癌等に関連することが推測された。また、NFκBが有する作用を抑制する活性を有し、関節リウマチや変形性関節炎などの免疫性疾患、炎症性疾患、癌等に関連することが推測された。また、AP−1が有する作用を抑制する活性を有し、炎症性疾患や癌等に関連することが推測された。また、HIF−1が有する作用を増強する活性を有し、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等に関連することが推測された。さらに、CREBが有する作用をやや強く増強する活性を有し、記憶障害などの中枢系疾患、循環器系疾患、糖尿病等に関連することが推測された。
【0251】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−50でヒットしたヒトESTで、4個以上のヒットが見られる器官名または組織名を抽出したところ、ヒトの正常な骨・肝臓・膵臓・胎児心臓・脳・眼・胎児肝臓、癌化した乳腺・前立腺であった。尚、本DNAは精巣由来のcDNAライブラリーからクローニングされた。
【0252】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば、骨髄腫・肝臓癌・膵臓癌・脳腫瘍・メラノーマ・乳癌・前立腺癌・精巣癌などの癌、肺炎・膵炎・肝炎・変形性関節炎などの炎症性疾患、関節リウマチなどの免疫系疾患、アレルギー疾患、記憶障害などの中枢系疾患、糖尿病、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、不妊症、角膜ジストロフィーに関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0253】
(8)c−trach3014316(配列番号8、18)
c−trach3014316(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号8に示すように、4455塩基から成り、そのうち塩基番号1038から1937までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、299アミノ酸残基からなる (配列番号18)。
【0254】
配列番号18のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)のデータベース登録記号AK074116、FLJ00187 protein (Human)がヒットした。
その内容としてAK074116は563アミノ酸から成り、そのアミノ酸配列中の267〜563が、配列番号18に記載のアミノ酸配列のアミノ酸番号3〜299と、e−value:5×10−179かつ297アミノ酸残基に亙り100.0%の一致度でヒットした。
BLAST検索のアライメントから本タンパク質はAK074116とN末端が2残基異なり、AK074116は本タンパク質とN末端が266残基異なることがわかる。また本DNAではアライメント上ではAK074116と5’末端が1043塩基異なるが、翻訳開始点は本DNAは塩基番号1038なので、5’末端の違いは6塩基であり、これがアミノ酸配列のN末端の違いの原因になっている。AK074116では5’末端は999塩基異なるが、翻訳開始点は塩基番号202であり、これらによってアミノ酸配列のN末端の違いが生じている。
【0255】
また配列番号18のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号113〜135、141〜163、169〜191、197〜219、225〜247、253〜275に示されるアミノ酸配列にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。このドメインは、保存された2つのCysと2つのHisが亜鉛イオンに配位する構造モチーフをもっており、転写因子等多くのDNA結合タンパク質に見られる。
尚、AK074116はアミノ酸番号50〜143からSCAN domain(PfamにSCANとしてエントリーされるアミノ酸配列)を、アミノ酸番号227〜267からKRAB box region(PfamにKRABとしてエントリーされるアミノ酸配列)をそれぞれ抽出したが、これらのドメインは本タンパク質には存在しない。
SCAN domainは一部のC2H2タイプのZnフィンガータンパク質のN末端に見られる保存されたモチーフで、オリゴマー形成の調節と転写制御の役割をもつことが知られている。またKruppel−associated box(KRAB)はC2H2タイプのZnフィンガータンパク質の約1/3に見られ、N末端部分に存在し、DNAとの結合の際には転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られている。
よって本タンパク質はAK074116とは異なる転写活性を示して細胞分化に影響したり、オリゴマー形成において異なる作用を有する可能性が考えられる。
【0256】
本DNAおよびAK074116cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒト第7番染色体上の1個のエクソンにマッピングされ、AK074116配列は6個のエクソンにマッピングされることがわかった。本DNAの1エクソンはAK074116の第6エクソンを包含し、これより長い。本DNAには存在しないAK074116の第1から第5エクソンのうち、第4、第5エクソンはKRABドメインに該当するため、両者の構造上の違いのみならず、機能的にも差異が生じることが考えられる。
これらの違いにより、DNAとの結合や相互作用、発現組織・発現量などに違いが生じる可能性がある。以上から、配列番号18のタンパク質は、AK074116、FLJ00187 protein (Human)のスプライシングバリアントである。
【0257】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は核に95.7%、ミトコンドリア4.3%であった。よって本タンパク質は細胞核内でDNAと結合し、細胞の分化・増殖、細胞周期などに関与する遺伝子の転写を調節するタンパク質であることが考えられる。
【0258】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第7番染色体上の位置(q22.1)を包含するq22−31.1に先天性下痢症、大腸癌、q21.3−22に出血性素因、血栓形成傾向の原因遺伝子座が、q21−22に悪性高熱症感受性、qに自閉症感受性の遺伝子座がそれぞれ存在することがわかった。以上より、本DNAがこの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断薬に応用できる可能性が予想された。
【0259】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、GATA−1等のコンセンサス標的配列:CCAGATAAGG(配列番号52)、Nkx−2.2等のコンセンサス標的配列:TTAAGTG配列番号65)およびOct−1A等のコンセンサス標的配列:ATGCAAAT(配列番号66)に高い親和性を示した。このことから本タンパク質はDNAとの結合能を有し、造血幹細胞の分化、血球系細胞、神経系細胞、循環器、アポトーシス制御などの異常に起因する疾患との関連が考えられる。また、実施例5によって、NFκBが有する作用を増強する活性を有し、関節リウマチや変形性関節炎などの免疫性疾患、炎症性疾患、癌等に関連することが推測された。また、AP−1が有する作用を抑制する活性を有し、炎症性疾患や癌等に関連することが推測された。また、HIF−1が有する作用をやや強く増強する活性を有し、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等に関連することが推測された。さらに、CREBが有する作用を増強する活性を有し、記憶障害などの中枢系疾患、循環器系疾患、糖尿病等に関連することが推測された。
【0260】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−65でヒットしたヒトESTで、5個以上のヒットが見られる器官名または組織名を抽出したところ、ヒトの正常な骨・骨格筋・眼・膵臓・肺・腸・腎臓・血液・脳・胎盤・肝臓・胎児脳・胎児脾臓、癌化した皮膚・眼・肺・腸・乳腺・子宮・脳・膵臓・精巣であった。尚、本DNAは気管由来のcDNAライブラリーからクローニングされた。
【0261】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば、骨髄腫・肺癌・大腸癌・小腸癌・腎臓癌・白血病・リンパ腫・脳腫瘍・肝臓癌・皮膚癌・メラノ−マ・乳癌子宮癌・膵臓癌・精巣癌などの癌、肺炎・膵炎・腎炎・肝炎・気管支炎・変形性関節炎などの炎症性疾患、関節リウマチなどの免疫系疾患、気管支喘息などのアレルギー疾患、糖尿病、虚血性疾患、貧血、低酸素症、循環器系疾患、記憶障害などの中枢系疾患、筋ジストロフィー・多発性筋炎などの骨格筋疾患、不妊症、脾臓疾患、先天性下痢症、出血性素因、血栓形成傾向、悪性高熱症、自閉症に関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0262】
(9)c−brhip3009181(配列番号9、19)
c−brhip3009181(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号9に示すように、4010塩基から成り、そのうち塩基番号1140から3506までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、788アミノ酸残基からなる (配列番号19)。
【0263】
配列番号19のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)のデータベース登録記号P19838、Nuclear factor NFκB p105 subunit (Human)がヒットした。
その内容としてP19838は968アミノ酸から成り、そのアミノ酸配列中の190〜968が、配列番号19に記載のアミノ酸配列のアミノ酸番号10〜788と、e−value:0.0、かつ779アミノ酸残基に亙り100%の一致度でヒットした。
NFκBは発癌や炎症、アポトーシスなどに関与する遺伝子発現を調節する疾患関連転写調節因子の1つとして知られている。
BLAST検索のアライメントから本タンパク質はP19838とN末端が9残基異なり、P19838は本タンパク質と189残基異なる。また本DNAではアライメント上ではM58603(P19838に該当するDNA配列)と5’末端が1165塩基異なり、M58603は本DNAと963塩基異なる。本DNAは塩基番号1140が、M58603は塩基番号398が、それぞれ翻訳開始点であり、これらのことにより、アミノ酸配列のN末端の違いが生じている。
【0264】
配列番号19のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号70〜170に示されるアミノ酸配列にIPT/TIG domainの特徴を示す配列(PfamにTIGとしてエントリーされるアミノ酸配列)を見出した。このドメインは、イムノグロブリン様のフォールドをもち、DNA結合能をもった細胞内の転写因子だけでなく、細胞表面の受容体にも見られる。
またアミノ酸番号637〜712にDeath domain(Pfamにdeathとしてエントリーされるアミノ酸配列)を見出した。このドメインは、C末端に存在し、FASやTNFなどの細胞表面の受容体の多量体形成を調節して受容体の細胞質部分と相互作用し、アポトーシスを誘導するシグナルを伝達することが知られている。
更にアミノ酸番号362〜394、401〜433、434〜466、470〜502、504〜537、538〜570にAnkyrin repeat(Pfamにankとしてエントリーされるアミノ酸配列)を見出した。これは、タンパク質−タンパク質相互作用ドメインとしての機能をもち、Ankyrinのアイソフォームには、C末端にDeath domainをもつスプライスバリアントが存在することが知られている。
更に本タンパク質のアミノ酸番号2〜62にRel homology domain region(PfamにRHDとしてエントリーされるアミノ酸配列)の存在が認められた。このドメインは構造的に異なるドメインから成り、N末端側のドメインはp53にも類似の構造が見出されるドメインであり、C末端側のドメインはDNAに結合するイムノグロブリン様のフォールドをもつ。
このRel homology domainについてはP19838のアミノ酸番号41〜242にも存在するが、比較すると本タンパク質のドメインのほうが短く、Rel homology domainのN末端側が欠損しているのがわかる。
NFκBは通常細胞質でIκBと複合体を形成して不活性だが、炎症などにより生じた活性酸素によりIκBが遊離し、NFκBは核に移行して遺伝子の転写を誘導する。また細胞外からのTNFやIL−1からの刺激はプロテインキナーゼカスケードによってNFκB・IκB複合体に伝えられ、複合体をリン酸化して活性化することが知られている。
本タンパク質はその配列の特徴より、以上のNuclear factor NFκBのパスウェイにおいてP19838とは異なる転写活性や機能を示す可能性が考えられる。
【0265】
本DNAおよびM58603cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒト第4番染色体上の17個のエクソンにマッピングされ、M58603配列は24個のエクソンにマッピングされることがわかった。本DNAの全てのエクソンはM58603の第8から第24エクソンとほぼ一致するが、M58603の第1から第7エクソンは本DNAには存在しない。
これらの違いにより、DNAとの結合や相互作用、発現組織・発現量などに違いが生じる可能性がある。以上から、配列番号19のタンパク質はP19838、Nuclear factor NFκB p105 subunit (Human)のスプライシングバリアントである。
【0266】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は核39.1%、ミトコンドリア21.7%、細胞質17.4%、ペルオキシソーム8.7%、空胞4.3%、分泌系小胞4.3%、小胞体4.3%であった。
NFκBは細胞質から核へ移行して種々の転写を活性化するため、この分布は本タンパク質がNFκBのスプライシングバリアントである可能性を示唆するものである。
【0267】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第4番染色体上の位置(q24)を包含するqに乾癬、象牙質異形成症の原因遺伝子座がそれぞれ存在することが、更に位置は特定されていないが、新生児好中球減少症の原因遺伝子座も第4番染色体上に存在することがわかった。以上より、本DNAがこの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断に応用できる可能性が予想された。
【0268】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−50でヒットしたヒトESTで、5個以上のヒットが見られる組織を抽出したところ、ヒトの正常な胎盤・肺・腸・骨・免疫系・リンパ系・脾臓・胎児肝臓・胎児眼、癌化した免疫系・腸・肺であった。尚、本DNAは海馬由来のcDNAライブラリーからクローニングされた。またPigment Cell Res.14(6):456−65 (2001) には、p105はヒトの正常なメラニン細胞よりも転移性メラノーマ細胞中のほうが高度に発現していることが述べられている。
【0269】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば、肺癌・大腸癌・小腸癌・骨髄腫・白血病・リンパ腫・肝臓癌・メラノ−マなどの癌、アルツハイマー病・パーキンソン病・舞踏病などの神経変性疾患、記憶障害、肺炎・肝炎などの炎症性疾患、免疫系疾患、アレルギー疾患、脾臓疾患、不妊症、乾癬、象牙質異形成症、好中球減少症に関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0270】
(10)c−beast2001444(配列番号10、20)
c−beast2001444(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号10に示すように、2709塩基から成り、そのうち塩基番号469から1437までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、322アミノ酸残基からなる (配列番号20)。
【0271】
配列番号20のアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)のデータベース登録記号AJ009936、Nuclear hormone receptor PRR1−C(Human)がヒットした。
その内容としてAJ009936は379アミノ酸から成り、そのアミノ酸配列中の58〜379が、配列番号20に記載のアミノ酸配列のアミノ酸番号1〜322と、e−value:0.0、かつ322アミノ酸残基に亙り100%の一致度でヒットした。
Pregnane X receptor(PXR)はRetinoid Xreceptor(RXR)とヘテロ二量体を作り、薬物代謝に関わるCYP2、CYP3などのチトクロームP450、その他生体異物の代謝に関わるトランスポーターの発現を誘導することが知られている。チトクロームP450は多くの医薬品の代謝のみならず薬効や副作用の原因となる薬物相互作用にも関与するため、PXRの転写活性の変化をみることは重要である。またCYP3Aはステロイドホルモンや胆汁酸の代謝にも関わっており、PXRが発現を調節するチトクロームP450が生体異物の代謝に広く関わっていることがうかがえる。
BLAST検索のアライメントから本タンパク質はAJ009936よりN末端が57残基短い。また本DNAはアライメント上ではAJ009936と5’末端が463塩基異なり、AJ009936は本DNAと2170塩基異なる。本DNAは塩基番号469が、M58603は塩基番号1771が、それぞれ翻訳開始点であり、これらのことにより、アミノ酸配列のN末端の違いが生じている。
【0272】
配列番号20のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号136〜317に示されるアミノ酸配列にLigand−binding domain of nuclear hormoneの特徴を示す配列(Pfamにhormone_recとしてエントリーされるアミノ酸配列)を見出した。このドメインは、核内受容体中でαへリックス構造の疎水性のポケットを形成して、ステロイドホルモンなどのリガンドと高親和的に結合することが知られており、この結合により標的遺伝子の転写活性が活性化または抑制され、発現量が調節される。
またAJ009936からはこの他アミノ酸番号62〜138に、Zinc finger, C4 type(two domains) (Pfamにzf−C4としてエントリーされるアミノ酸配列)も抽出された。このドメインは、保存されたシステインに富むDNA結合領域をもち、真核細胞のステロイドホルモン、活性型ビタミンD、レチノイン酸、甲状腺ホルモンなどの核内受容体ファミリーに見られる。
【0273】
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE(Nucleic Acids Res. 30, (1) 235−8. (2002))によれば、AJ009936のアミノ酸番号64〜91にはSTEROID_FINGER regionも存在する。この部分は核内のホルモン受容体のDNA結合領域である。
これら2つのドメインや領域は本タンパク質には存在しないため、本タンパク質はAJ009936とは核内でのホルモンとの結合やDNAへの結合の状態が異なったり、そのために転写活性も変化してCYP3の発現が抑制される可能性が考えられる。
【0274】
本DNAおよびAJ009936cDNAのエクソン構造を明らかにするために、cDNA配列をゲノム配列へ写像するソフトウエアsim4(Genome Res. 8, 967−74 (1998))を用い、ゲノム配列へのアライメントを行ったところ、本DNA配列はヒト第3番染色体上の6個のエクソンにマッピングされ、AJ009936配列は10個のエクソンにマッピングされることがわかった。本DNAの全てのエクソンはAJ009936の第4から第9エクソンとほぼ一致するが、AJ009936の第1から第3、第10エクソンは本DNAには存在しない。
これらの違いにより、DNAとの結合や相互作用、発現組織・発現量などに違いが生じる可能性がある。以上から、配列番号20のタンパク質はAJ009936、Nuclear hormone receptor PRR1−C(Human)のスプライシングバリアントである。
【0275】
タンパク質の細胞内局在の予測プログラムであるPSORT II (Trends Biochem. Sci. 24, (1) 34−6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は細胞質56.5%、核30.4%、ミトコンドリア8.7%、ゴルジ体4.3%であった。AJ009936の局在の確率は核82.6%、細胞質8.7%、ミトコンドリア8.7%で、本タンパク質は細胞質への局在の確率が高い。よって本タンパク質はAJ009936とは局在が異なる可能性がある。
【0276】
真核生物ゲノムのアノテーション情報データベースEnsembl中のDisease Browser (http://www.ensembl.org/Homo_sapiens/diseaseview)によると、本DNAが写像された第3番染色体上の位置(q13.31)を包含するq13−21にChrcot−Marie−Tooth病、q13に家族性副甲状腺機能低下症、家族性振戦、qに筋強直性ジストロフィーの原因遺伝子座がそれぞれ存在することがわかった。以上より、本DNAがこの疾患の原因遺伝子である可能性や、スプライシングバリアントを含む本DNAの変異がこれらの疾患の診断に応用できる可能性が予想された。
【0277】
本タンパク質を小麦胚芽無細胞タンパク質合成系を用いて発現させたところ、実施例4においては、NF−1A1等のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号41)、RF−X1の標的配列:GGTAACATAGCAAC(配列番号42)、YY1の標的配列:CGGCCATCTTGGCT(配列番号55)、Snailの標的配列:CACCTGTTTTCA(配列番号57)、Evi−1の標的配列:AGATAAGATAA(配列番号59)、Ikaros等のコンセンサス標的配列:TTGGGAGG(配列番号60)、HNF−1Aの標的配列:GGTTAATGATTAACCAC(配列番号64)、Nkx−2.2等のコンセンサス標的配列:TTAAGTGGTT(配列番号65)、Oct−1Aの等のコンセンサス標的配列:ATGCAAAT(配列番号66)、Oct−2等のコンセンサス標的配列:TATTTGCAT(配列番号67)、Pax−3等のコンセンサス標的配列:CGTCACGCTTGA(配列番号68)、Pax−1の標的配列:CCGTTCCGCTCTAGATAT(配列番号69)、NF−ATc等のコンセンサス標的配列:AGGAAAA(配列番号75)、MEF−2Aの標的配列:CTCTAAAAATA(配列番号79)、SRFの標的配列:CCATATATGGACAT(配列番号80)およびE2の標的配列:AACCAAAAACGGTAA(配列番号81)に親和性を示した。このことから本タンパク質はDNA結合能を有し、造血細胞や肝細胞の増殖、免疫系細胞の発生・分化、脂質代謝、筋肉形成などの異常に起因する疾患、例えば生活習慣病などの疾患との関連が考えられる。また、実施例5によって、PPARが有する作用をやや強く抑制する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測された。また、NFκBが有する作用を抑制する活性を有し、関節リウマチや変形性関節炎などの免疫性疾患、炎症性疾患、癌等に関連することが推測された。
【0278】
本DNAの発現組織を検討するため、本DNAをクエリーとしてdbEST(Nature Genetics 4, (4) 332−3 (1993))に対してBLAST検索を行い、e−value≦10−04でヒットしたヒトESTで、ヒットが存在する組織を抽出したところ、ヒトの正常な胎児肝臓・胎児脾臓・肝臓・胃・腸、癌化した免疫系であった。尚、本DNAは乳房由来のcDNAライブラリーからクローニングされた。
【0279】
本タンパク質はこれらの組織や細胞に特有の機能や疾患、例えば、肝臓癌・胃癌・大腸癌・小腸癌・白血病・リンパ腫などの癌、変形性関節炎などの炎症性疾患、関節リウマチなどの免疫系疾患、アレルギー疾患、糖尿病、肥満、循環器系疾患、脾臓疾患、不妊症、家族性副甲状腺機能低下症、家族性振戦、筋強直性ジストロフィーに関連する可能性が推測でき、これらの疾患の診断薬や治療薬のターゲットとしての利用が考えられる。
【0280】
【発明の効果】
本発明のタンパク質およびそれをコードするDNAは転写調節活性等を有することから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
【0281】
【配列表】
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a novel protein, a DNA encoding the protein, a full-length cDNA encoding the protein, a recombinant vector having the DNA, an oligonucleotide consisting of a partial sequence of the DNA, and a gene-transferred cell into which the DNA has been introduced , And an antibody that specifically binds to the protein.
[0002]
[Prior art]
Currently, the elucidation and analysis of genome sequences of various organisms are underway on a global level. The entire genome sequence has already been determined in about hundreds of prokaryotic microorganisms, lower eukaryotic budding yeast, and nematodes that are multicellular eukaryotes. The human genome, which is said to have 3 billion base pairs, was published in February 2001 as a draft of its base sequence. In April 2003, the complete sequence was decoded and published. The purpose of elucidating the genome sequence is to understand the complex life phenomenon as a network of interactions and functions of all genes or between genes, proteins, cells and even individuals. Elucidating biological phenomena from genome information of various species is not only important as a research subject in the academic field, but also how to develop the research results obtained there for industrial application In that sense, its social significance is also great.
[0003]
However, simply determining the genome sequence does not reveal the functions of all genes. For example, in yeast, only about half of the approximately 6,000 genes deduced from the genome sequence could estimate their functions. On the other hand, it is said that there are about 100,000 kinds of proteins in humans. Therefore, establishment of a “high-throughput gene function analysis system” for rapidly and efficiently elucidating the functions of a huge amount of new genes revealed from genome sequences is strongly desired.
[0004]
In eukaryotic genome sequences, a single gene is often divided into multiple exons by introns. Therefore, there are many problems in accurately predicting the structure of the protein encoded there from only the genomic sequence information. On the other hand, in cDNA prepared from mRNA from which introns have been removed, the information on the amino acid sequence of the protein can be obtained as a single piece of continuous sequence information, so that the primary structure can be easily clarified. In human cDNA research, more than 5 million EST (Expressed Sequence Tag) data has been published in public databases.
[0005]
Such information is utilized from various angles such as elucidation of human gene structure, prediction of exon region in genome sequence, and estimation of its expression profile. However, since most of these human EST information is concentrated in the vicinity of the 3 ′ end of the cDNA, the information in the vicinity of the 5 ′ end of the mRNA is particularly insufficient. In addition, more than 40,000 cDNAs have been revealed as a result of analysis conducted at research institutions around the world (Helix Research Institute, Kazusa DNA Research Institute, University of Tokyo Medical Research Institute, German Cancer Research Center, MGC Project, etc.). It seems that it covers the majority of gene loci, which are said to be several thousand in number, but the percentage of cDNA obtained as a full-length clone is about 80%, duplication and splicing Considering that the variants are included, it is considered that there are many cDNAs that have not yet been obtained.
[0006]
If full-length cDNA can be obtained, the mRNA transcription start point on the genome sequence can be estimated from the 5 ′ end sequence, and the factors involved in the stability of mRNA contained in the sequence and the expression control at the translation stage can be analyzed. Is possible. In addition, since atg, which is the translation start point, is included on the 5 'side, the protein can be translated into the correct frame. Therefore, by applying an appropriate gene expression system, it is possible to produce a large amount of the protein encoded by the cDNA or to analyze the biological activity by expressing the protein. Thus, analysis of full-length cDNA provides important information that complements genomic sequence analysis. In addition, a full-length cDNA clone that can be expressed is extremely important for empirical analysis of the function of the gene and for application to industrial applications.
[0007]
In addition, even in the case of a protein encoded by the same genome, when the mRNA encoding the same is transcribed, an isomer (hereinafter referred to as “splicing”) in which a part of the exons in the genome is inserted and deleted and combined. Sometimes referred to as "variant mRNA"). In fact, a plurality of types of similar proteins (hereinafter sometimes referred to as “splicing variants”) produced by translating these mRNAs have been confirmed in vivo. Splicing variants are expressed in a tissue-specific, developmental stage-specific or disease-specific manner and are considered to have different functions.
[0008]
For example, 10 types of exon-deleted splice variant mRNAs have been identified from various human tissues in Estrogen receptor β. Nine of them are expressed in normal breast tissue, and among them, the expression of mRNA lacking exons of Nos. 5 and 6 has been shown to be significantly reduced in most cancer tissues. Yes. In addition, it has been clarified that mRNA lacking the exon No. 5 significantly changes its expression level according to the degree of cancer progression (see, for example, Non-Patent Document 1). Thus, the expression level of the splice variant may show a significant correlation with the disease state.
[0009]
Such splicing variant mRNA or cDNA is also a clone that is difficult to obtain from a conventional cDNA library or EST and is highly likely to be obtained from a full-length cDNA library including a transcription start site.
[0010]
In particular, a transcription factor is a protein having affinity for DNA involved in a step of synthesizing mRNA from DNA called transcription reaction or gene expression, and a large number of factors are known. The transcription reaction is an important reaction that regulates the synthesis amount of a protein that is a gene product, and controls the amount of protein involved in cell function and structure. This transcription reaction is caused by a group of transcription factors. For example, RNA polymerase binds to DNA having a specific base sequence of a transcription control region called a promoter composed of a TATA box and a transcription initiation site, and incorporates RNA polymerase. In this way, a transcription complex in which various transcription factors are assembled is formed and mRNA synthesis is started. A transcription reaction that depends on the promoter has no gene specificity and is called basic transcription, and a transcription factor that forms a transcription complex with RNA polymerase and RNA polymerase and works near the RNA polymerase is called a basic transcription factor. . Apart from this basic transcription, cells have a mechanism for raising and lowering the level of basic transcription and regulating time-specific or tissue-specific expression in response to changes in the physiological environment and external stimuli. Such a DNA having a specific base sequence of a transcriptional regulatory region that controls the basic transcription is also called an enhancer or a silencer, and usually exists upstream of the promoter and binds to this region (gene-specific transcription). Regulators, also called gene expression regulators or gene expression regulator proteins) interact with basic transcription factors either directly or through another transcriptional regulatory cofactor (also called mediator, cofactor or mediator) Regulation is performed (hereinafter, such basic transcriptional regulatory activity is referred to as “transcriptional regulatory activity”, and transcriptional regulatory factors and transcriptional regulatory cofactors may be collectively referred to as “transcriptional regulatory factors”). That is, transcription factors are classified into two categories: basic transcription factors and transcription regulatory factors. Basic transcription factors are not gene-specific and few in number, but a great many transcriptional regulators are known, and the number is expected to reach the order of 1000 when similar factors and families are included. The binding sites are also diverse.
[0011]
Modulating transcriptional responses in response to intracellular or intercellular stimuli is often desirable, for example, when such regulation is necessary for the development of an organism or for the survival of an organism against changes in the biological environment. The However, diseases can be caused by inappropriate activation or termination of transcription reactions. For example, evidence has been reported suggesting that estrogen-mediated gene expression is involved in several types of breast or ovarian cancer. In addition, various transcriptional regulatory factor genes have been discovered from the chromosomal translocation site associated with leukemia, and many of them encode fusion chimeric molecules of transcriptional regulatory factors. It has been suggested that the abnormality may be deeply involved in leukemia (see, for example, Non-Patent Document 2). Thus, among the transcriptional regulatory factors, there are transcriptional regulatory factors that regulate the transcription of various genes involved in diseases (hereinafter sometimes referred to as “disease-related transcriptional regulatory factors”). For example, PPAR, p53, NFκB, AP-1, HIF-1, CREB and the like are known as disease-related transcriptional regulatory factors.
[0012]
In addition, protein kinases are known to be involved in the control of various biological phenomena by regulating intracellular signal transduction systems (phosphorylation cascades) through protein phosphorylation, and their relationship with diseases has been elucidated. Although many genes are present (see, for example, Non-Patent Document 3), it is also known that a group of transcriptional regulatory factors that are phosphorylated and activated in this phosphorylation cascade are involved. It has been suggested that factors may be involved in diseases as well as protein kinases (see, for example, Non-Patent Document 4).
[0013]
However, it is estimated that there are about 1,000 different transcriptional regulators in the human body, and many transcriptional regulator genes are still left uncloned. Therefore, it is significant to provide a novel full-length cDNA of a transcriptional regulatory factor containing a splicing variant that has not been separated in humans. In addition, transcriptional regulatory factors can be expected to be useful as target molecules for treatment and to the proteins themselves as pharmaceuticals. Therefore, it is significant to clarify the full length of cDNA encoding these proteins.
[0014]
[Non-Patent Document 1] Poola I et al. , J. et al. Steroid Biochem. Mol. Biol. 82: 169-179 (2002).
[Non Patent Literature 2] Look, A .; T.A. , Science, 278: 1059-1064 (1997).
[Non-Patent Document 3] Hunter, T .; Cell, 50: 823-829 (1987).
[Non-Patent Document 4] Ninomiya-Tsuji, J. et al. et al. , Nature 398: 252-256 (1999)
[0015]
[Problems to be solved by the invention]
The present invention analyzes the nucleotide sequence of a cDNA clone contained in a full-length cDNA library, and among these, for a cDNA having a novel sequence as a full length including a splicing variant, the physiological activity of the protein encoded by this is identified. The purpose is to propose a protein based on activity and a method of using the DNA encoding the protein.
[0016]
[Means for Solving the Problems]
The inventors have used the oligo-capping method (Maruyama, K., et al., Gene, 138: 171-174 (1994); Suzuki, Y. et al., Gene, 200: 149-156 (1997)). When a database was searched based on the homology of the base sequence of the cDNA clone for a cDNA having a novel sequence containing a splicing variant obtained by using the sequence, a sequence specific to a protein having transcriptional regulatory activity was found in the sequence, The proteins encoded by these cDNAs were identified as transcriptional regulators. The present invention has been accomplished based on these findings.
[0017]
That is, according to the present invention, the following inventions 1 to 15 are provided.
1. The following protein (a) or (b):
(A) a protein comprising the amino acid sequence of any one of SEQ ID NOS: 11 to 20,
(B) A protein comprising an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any one of SEQ ID NOs: 11 to 20, and having transcriptional regulatory activity.
2. A DNA encoding the protein according to item 1.
3. A full-length cDNA encoding the protein according to item 1.
4). DNA of any of the following (a) or (b);
(A) DNA having the base sequence according to any one of SEQ ID NOs: 1 to 10,
(B) a protein having a base sequence in which one or several bases are deleted, substituted and / or added in the base sequence described in any of SEQ ID NOs: 1 to 10 and having transcriptional regulatory activity DNA to do.
5. 5. A recombinant vector comprising the DNA according to any one of 2 to 4 above.
6). 7. A gene-transferred cell into which the DNA according to any one of 2 to 4 or the recombinant vector according to 5 above is introduced, or an individual comprising the cell.
7). The protein according to item 1, which is produced by the cell according to item 6.
8). A sense oligonucleotide having the same sequence as 5 to 100 consecutive bases in the base sequence of the DNA according to any one of 2 to 4 above, an antisense oligonucleotide having a sequence complementary to the sense oligonucleotide, and the An oligonucleotide selected from the group consisting of oligonucleotide derivatives of sense or antisense oligonucleotides.
9. 8. An antibody or a partial fragment thereof that specifically binds to the protein according to item 1 or 7.
10. 10. The antibody according to 9 above, wherein the antibody is a monoclonal antibody.
11. 11. The antibody according to item 10 above, wherein the monoclonal antibody has an action of neutralizing the transcriptional regulatory activity of the protein according to item 1 or 7.
12 8. A screening method for a substance that regulates the activity of the protein, which comprises contacting the test substance with the protein according to item 1 or 7, and measuring a change in activity of the protein by the test substance.
13. 7. A screening method for a substance that regulates the expression of DNA, comprising contacting the test cell with the gene-transferred cell according to item 6 and detecting a change in the expression level of the DNA introduced into the cell.
14 Preserving at least one or more amino acid sequence information selected from the amino acid sequence of the protein according to item 1 and / or at least one or more nucleotide sequence information selected from the DNA nucleotide sequence according to any one of items 2 to 4 above Computer readable recording medium.
15. A carrier on which the protein according to item 1 and / or the DNA according to any one of items 2 to 4 are bound.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in more detail.
(1) Acquisition of full-length cDNA and analysis of nucleotide sequence
The DNA of the present invention is a protein comprising the amino acid sequence described in any of SEQ ID NOs: 11 to 20, or one or several amino acids in the amino acid sequence described in SEQ ID NOs: 11 to 20 (here, several A protein having an amino acid sequence containing substitution, deletion and / or addition of amino acid residues and having transcriptional regulatory activity (for example, 5 or less, preferably 3 or less, more preferably 2 or less) Any code can be used as long as it can be coded. Specifically, it may be only the translation region encoding the amino acid sequence, or may include the full length of the cDNA.
[0019]
Specifically, examples of the DNA containing the full length of cDNA include DNA comprising the base sequence described in any one of SEQ ID NOs: 1 to 10. The translation region includes base numbers 227 to 2245 of SEQ ID NO: 1, base numbers 214 to 1947 of SEQ ID NO: 2, base numbers 281 to 2284 of SEQ ID NO: 3, base numbers 138 to 1019 of SEQ ID NO: 4, and SEQ ID NO: 5 base numbers 1582 to 2685, base numbers 352 to 2271 of SEQ ID NO: 6, base numbers 2097 to 3881 of SEQ ID NO: 7, base numbers 1038 to 1937 of SEQ ID NO: 8, base numbers 1140 to 3506 of SEQ ID NO: 9, The thing which has a sequence shown by 10 base numbers 469-1437 is mentioned. Furthermore, the DNA of the present invention includes not only the full length of the cDNA described above, but also those containing the translation region and the 3 ′ and / or 5 ′ end adjacent to the translation region at least necessary for expression. .
[0020]
The DNA of the present invention may be obtained by any method as long as it can be obtained. Specifically, for example, it can be obtained by the method described below. First, mRNA is prepared from human tissue or cultured cells by a commonly used method known per se. Next, cDNA is obtained by the oligo cap method (Maruyama, K., et al., Gene, 138: 171-174 (1994)) using this mRNA as a template. Specifically, 5 'cap is removed from the obtained mRNA with acid pyrophosphatase, and then the synthetic oligonucleotide is ligated using RNA ligase to the exposed 5'-terminal phosphate group as a target. Here, for RNA molecules that do not have a cap structure at the 5 ′ end, in order to prevent the oligonucleotide from binding, the phosphate group present at the 5 ′ end in advance is not removed from the 5 ′ cap but at the 5 ′ end. It is effective to remove the phosphoric acid group using phosphatase having the activity of removing only the phosphate group. Using this RNA molecule as a template, reverse transcription is performed with reverse transcriptase using an oligo dT primer as a 3'-side primer, and then the RNA strand is decomposed and removed.
[0021]
Furthermore, using the obtained single-stranded DNA as a template, a polynucleotide having a sequence complementary to the synthetic oligonucleotide is a 5 ′ primer, and a primer specific to the 3 ′ end (such as oligo dT) is used for the polymerase chain reaction. By performing (PCR), a full-length cDNA library can be prepared. Here, the 5 'primer and the 3' primer are not complementary to the total length of the synthetic oligonucleotide and the reverse transcription primer, and it is preferable to use sequences shifted by 3 to 10b on the 3 'side. The primer chain length is usually 15 to 100 bases, preferably 15 to 30 bases. However, when the length of the cDNA to be amplified is long, the length is preferably 25 to 35 bases. and Accurate PCR (LA PCR: Kenji Hayashi, experimental medicine separate volume, latest technology of PCR, Yodosha; Cheng, S. et al., Nature 369: 684-685 (1994)) is preferably used.
[0022]
The cDNA thus obtained is cloned by inserting it into an appropriate cloning vector. As the vector used here, a protein expression vector which can introduce the obtained cDNA clone into a cell and express the protein encoded by the cDNA is preferably used. Specifically, for example, when the host is a mammalian cell or the like, pME18SFL3 (Genbank AB009864) or the like is preferable, and when E. coli is used, pET3, pET11 (Stratagene), pGEX (Amersham Pharmacia Biotech), etc. In the case of yeast, pESP-I expression vector (Stratagene) is used, and in the case of insect cells, BacPAK6 (Clontech) is used. When the host is an animal cell, examples include ZAP Express (Stratagene), pSVK3 (Amersham Pharmacia Biotech), and the like.
[0023]
The cDNA library thus obtained is subjected to base sequence analysis by a commonly used method known per se. The DNA of the present invention is analyzed for the nucleotide sequence of the 5 ′ end or 3 ′ end of the obtained cDNA, and this is analyzed by NCBI (National Center of Biotechnology Information; http://www.ncbi.nlm.nih.gov/). Databases such as Genbank, EMBL, DDBJ, dbEST, etc. operated by BLAST (Basic local alignment search tool; Altschul, SF, et al., J. Mol. Biol., 215, 403-410 (1990) ) Was used, and when a completely identical sequence was not found for the entire length, it was decided to be subjected to the following analysis as new.
[0024]
Examples of the DNA having such a full-length cDNA base sequence include those having the base sequences described in SEQ ID NOs: 1 to 10. The translation region includes base numbers 227 to 2245 of SEQ ID NO: 1, base numbers 214 to 1947 of SEQ ID NO: 2, base numbers 281 to 2284 of SEQ ID NO: 3, base numbers 138 to 1019 of SEQ ID NO: 4, and SEQ ID NO: 5 base numbers 1582 to 2685, base numbers 352 to 2271 of SEQ ID NO: 6, base numbers 2097 to 3881 of SEQ ID NO: 7, base numbers 1038 to 1937 of SEQ ID NO: 8, base numbers 1140 to 3506 of SEQ ID NO: 9, The thing which has a sequence shown by 10 base numbers 469-1437 is mentioned.
[0025]
A novel nucleotide sequence as a full length of the cDNA thus obtained is obtained by using BLAST homology search (homology search) and HMMER (sequence analysis method using hidden Markov model; Eddy, SR, Bioinformatics 14: 755-763 (1998). The function of the protein encoded by the base sequence can be estimated by performing a protein feature search (profile search: http://pfam.wustl.edu) or the like using HMMPFAM, which is one of the functional groups of ()).
[0026]
In the homology search by BLAST, the function of the clone to be analyzed can be estimated from various annotation information attached to hit sequences with sufficiently significant homology obtained as a result of the search. Here, a sufficiently significant hit sequence means that the identity between the functional domain portion of the registered sequence and the corresponding portion of the DNA of the present invention is e-value (the query sequence is accidentally found in the database). 10 as the expected value)-4The following are shown, or 30% or more.
[0027]
For example, if many of the top functional domain sequences have been confirmed to function as a transcriptional regulator, the clone to be analyzed that is similar in sequence also has the same function, that is, transcriptional regulatory activity. The prediction that it will be.
[0028]
In HMMPFAM, analysis is performed by a method for identifying whether the amino acid sequence encoded by the base sequence to be analyzed has the characteristics of the amino acid sequence of an entry in a database in which protein profiles called Pfam are accumulated. Profiles are extracted from a series of proteins having the same characteristics, and even if the function cannot be clarified by comparison over the entire length of one sequence to one sequence, if the characteristic region is present in the sequence, this can be found and the function can be predicted. In this way, the cDNA predicted that the protein encoded by it has transcriptional regulatory activity can be confirmed for its transcriptional regulatory activity by biochemical experiments described below.
[0029]
Specific examples of clones that are novel as full-length cDNAs described above include those having the base sequence shown in any one of SEQ ID NOs: 1 to 10. Moreover, the amino acid sequences encoded by these base sequences include those shown in any of SEQ ID NOS: 11 to 20.
[0030]
The DNA of the present invention thus obtained, whose base sequence is determined, and whose function is estimated has the base sequence described in any of SEQ ID NOs: 1 to 10 above, or the base sequence shown above as its translation region Not only those but also one or several bases in these base sequences (here, “several” means, for example, 15 or less, preferably 9 or less, more preferably 6 or less) are deleted. In addition, DNA encoding a protein having a substituted and / or added base sequence and having transcriptional regulatory activity is also included. As described above, these DNAs comprise an amino acid sequence in which one or several amino acid sequences are deleted, substituted and / or added in the amino acid sequence of SEQ ID NO: 11 to 20, and have transcriptional regulatory activity. Those that code for proteins are included.
[0031]
Furthermore, the DNA of the present invention may be obtained by the above-described method or may be synthesized. The substitution of the DNA base sequence can be easily performed with a commercially available kit such as a site-directed mutagenesis kit (Takara Shuzo) or a quick change site-directed mutagenesis kit (Stratagene).
[0032]
(2) Protein encoded by novel cDNA
The translation region of the protein encoded by the DNA of the present invention is, for example, converted into an amino acid using three types of reading frames for the base sequence of the DNA, and the range encoding the longest polypeptide is translated into the protein of the present invention. The amino acid sequence can be deduced as a region. Examples of such an amino acid sequence include those described in any of SEQ ID NOs: 11 to 20. In addition, the protein of the present invention is not limited to the amino acid sequence described above, and is composed of an amino acid sequence in which one or several amino acids are substituted, deleted, and / or added in the amino acid sequence, and has transcriptional regulatory activity. The thing which has is included.
[0033]
As a method for obtaining the protein of the present invention, the method of transcription / translation of the DNA of the present invention described in (1) by an appropriate method is preferably used. Specifically, an appropriate expression vector or a recombinant vector inserted into an appropriate vector together with an appropriate promoter is prepared, and an appropriate host microorganism is transformed with this recombinant vector or introduced into an appropriate cultured cell. And can be obtained by purifying it.
[0034]
In addition, the protein of the present invention includes a protein added with a tag inserted into a vector designed so that an appropriate tag is fused to the N-terminus or C-terminus. Specific examples of the tag include glutathione-S-transferase, polyhistidine, and Flag.
[0035]
The protein produced by the transformant can be modified by incorporating amino acids substituted or modified with heavy atoms during protein synthesis. In addition, the protein can be made into a modified protein by applying an appropriate protein-modifying enzyme before or after purification, by arbitrarily modifying the protein, or by partially removing the polypeptide. For example, terminal modification such as N-terminal acetylation, C-terminal amidation, glycosylation, lipid addition, acylation, methylation, sulfonation, carboxylation, hydroxylation, phosphorylation, ADP-ribosylation, etc. It is not necessarily limited to these. These modified proteins are also included in the scope of the present invention as long as they have the transcriptional regulatory activity described above.
[0036]
In addition, the protein produced by the transformant may be modified as desired by applying an appropriate protein-modifying enzyme before or after purification, or by partially removing the polypeptide. Can do. These modified proteins are also included in the scope of the present invention as long as they have the transcriptional regulatory activity described above.
[0037]
When the protein of the present invention is produced, the vector used for the production of the recombinant vector containing the DNA of the present invention is not particularly limited as long as the DNA is expressed in the transformant. Plasmid vector, phage Any of vectors may be used. Of these, usually a commercially available protein expression vector into which an expression control region DNA such as a promoter suitable for a host into which the DNA is introduced has already been inserted is used. Specific examples of such a protein expression vector include pET3, pET11 (manufactured by Stratagene), pGEX (manufactured by Amersham Pharmacia Biotech) when the host is Escherichia coli, and pESP when yeast is used. -I expression vector (Stratagene) and the like, and in the case of insect cells, BacPAK6 (Clontech) and the like are used. When the host is an animal cell, ZAP Express (Stratagene) or pSVK3 (Amersham Pharmacia Biotech) can be used. When the host is a mammalian cell, pME18SFL3 (Genbank AB009864) is preferred.
[0038]
When using a vector into which an expression control region is not inserted, it is necessary to insert at least a promoter as the expression control region. Here, the promoter possessed by the host microorganism or the cultured cell can be used as the promoter, but is not limited to this. Specifically, for example, when the host is Escherichia coli, T3, T7, tac, lac A promoter or the like can be used, and in the case of yeast, nmt1 promoter, Gal1 promoter and the like can be used. In the case of insect cells, a polyhedrin promoter or the like can be used. When the host is an animal cell, SV40 promoter, CMV promoter, etc. are preferably used.
[0039]
In addition, when a host capable of functioning a promoter derived from a mammal is used, a promoter specific to the gene of the present invention can also be used. Insertion of the DNA of the present invention into these vectors may be carried out by linking the DNA or a DNA fragment containing the DNA with the amino acid sequence of the protein encoded by the gene DNA downstream of the promoter in the vector.
[0040]
The recombinant vector thus prepared can be transformed into a host to be described later by a method known per se to prepare a DNA transductant. Specific examples of methods for introducing the vector into the host include heat shock (J. Mol. Biol., 53: 154 (1970)), calcium phosphate method (Science, 221: 551 (1983)), DEAE dextran method ( Science, 215: 166 (1982)), in vitro packaging method (Proc. Natl. Acad. Sci. USA, 72: 581 (1975)), viral vector method (Cell, 37: 1053 (1984)), and electric pulse (Chu. Et al., Nuc. Acids Res., 15: 1331 (1987)) and the like.
[0041]
The host for preparing the DNA transductant is not particularly limited as long as the DNA of the present invention is expressed in the body. For example, Escherichia coli, yeast, baculovirus (arthropod polyhedrosis virus) -insect cell, or Examples include animal cells. Specifically, BL21, XL-2Blue (manufactured by Stratagene) etc. are used in Escherichia coli, SP-Q01 (manufactured by Stratagene), etc. in yeast, and AcNPV (J. Biol. Chem., 263: 7406 (1988) in baculovirus. )) And its host, Sf-9 cells (J. Biol. Chem., 263: 7406 (1988)) and the like. Examples of animal cells include mouse fibroblast C127 (J. Viol., 26: 291 (1978)) and Chinese hamster ovary cell CHO cells (Proc. Natl. Acad. Sci. USA, 77: 4216 (1980)). Among them, from the expression level and ease of screening, COS-7 cells derived from African green monkey kidney (ATCC CRL1651: American type culture collection preservation cells), HEK293 cells derived from human fetal kidney (ATCC CRL1573) or human cervical cancer HeLa cells (ATCC CCL-2) are used.
[0042]
In addition to the expression method using the protein expression vector as described above, a homologous recombination technique (Vertes, A. A. et al., Which directly inserts the DNA fragment of the present invention linked with a promoter into the chromosome of the host microorganism. Biosci. Biotechnol. Biochem., 57: 2036 (1993)), or transposon and insertion sequence (Vertes, AA et al., Molecular Microbiol., 11: 739 (1994)) etc. It can also be produced.
[0043]
The culture obtained above is obtained by collecting cells or cells by a method such as centrifugation, suspending the cells or cells in an appropriate buffer, and using a suitable known per se method such as ultrasound, lysozyme, and / or freeze-thawing. After disruption by the method, a crude protein purification solution can be obtained by centrifugation, filtration or the like, and further purified by combining appropriate purification methods.
[0044]
Thus, the protein of the present invention is obtained. In addition to the expression method using the protein expression recombinant vector described above, the protein of the present invention is obtained by inducing protein expression by subjecting the DNA of the present invention obtained in (1) above to a cell-free transcription translation system. be able to. The cell-free transcription / translation system used in the present invention is a system including all elements necessary for transcription from DNA to mRNA and translation from mRNA to protein, and the DNA is encoded by adding DNA thereto. It refers to any system in which the protein being synthesized is synthesized. Specific examples of the cell-free transcription / translation system include transcription / translation systems prepared on the basis of extracts from eukaryotic cells and bacterial cells, or a part thereof. Specific examples of the cell-free protein synthesis system include known cell extracts such as Escherichia coli, plant seed germs, and rabbit reticulocytes. These may be commercially available, or a method known per se, specifically, Escherichia coli extract can be obtained from Pratt, J. et al. M.M. et al. Transcription and Translation, Hames, 179-209, B .; D. & Higgins, S .; J. et al. , Eds, IRL Press, Oxford (1984). Examples of commercially available cell-free protein synthesis systems or cell extracts include those derived from E. coli. E. coli S30 extract system (manufactured by Promega) and RTS500 Rapid Translation System (manufactured by Roche) and the like are those derived from rabbit reticulocytes.TM(Manufactured by TOYOBO).
[0045]
Separation and purification of the protein of the present invention from the transcription-translation product of the obtained cell-free transcription / translation system can be performed by a commonly used method known per se. Specifically, for example, a DNA region encoding an epitope peptide, polyhistidine peptide, glutathione-S-transferase (GST), maltose binding protein, etc. is introduced into the DNA to be transcribed and translated as described above. The protein can be purified by utilizing affinity with a substance having affinity for the protein.
[0046]
Expression of the target protein is detected by SDS-polyacrylamide gel electrophoresis or the like, and stained with Coomassie Brilliant Blue (manufactured by Sigma) or detected by an antibody that specifically binds to the protein of the present invention described later. It can be confirmed by the method to do. In general, it is known that the expressed protein is cleaved (processing) by a proteolytic enzyme present in the living body. Of course, even if the protein of the present invention is a partial fragment of an amino acid sequence that has been cleaved, it may be included in the protein of the present invention as long as it has transcriptional regulatory activity.
[0047]
(3) Confirmation of the activity of the protein of the present invention
It can be confirmed that the protein of the present invention is produced as a recombinant protein as described in (2) above, and has the activity estimated in (1) by analyzing it. Furthermore, it can also analyze by the combination with the antibody etc. as described in the following (4).
[0048]
Examples of the transcriptional regulatory activity of the protein of the present invention include a function of regulating gene expression by changing the DNA structure. It can be confirmed that the protein of the present invention has transcriptional regulatory activity using a conventional method known per se. For example, as one method for analyzing transcriptional regulatory activity, a method for analyzing an interaction with another protein or DNA is known. For the analysis of the interaction, a conventional method known per se can be used. Specific examples include a yeast two-hybrid method, a fluorescence depolarization method, a surface plasmon method, a phage display method, and a ribosomal display method. Can be mentioned.
[0049]
More specifically, in the case of DNA binding activity which is one of the interaction activities with the DNA of the protein of the present invention, for example, an appropriate double-stranded DNA is contacted with the recombinant protein, and the recombinant protein This can be confirmed by measuring the binding property to the DNA strand. Specific methods include the methods described below.
[0050]
As the reaction solution, neutral to weakly basic buffer solution containing 60 mM potassium chloride, 1 mM dithiothreitol, 10% glycerol, 1 μg poly (dI-dC), for example, 20 mM Tris-HCl or HEPES buffer (pH 7-8) The reaction is started by adding double-stranded DNA of an appropriate length and the recombinant protein of the present invention. After the reaction under a certain condition, the double-stranded DNA binding activity of the protein is judged by detecting the conjugate of the recombinant protein and DNA.
[0051]
The binding between the recombinant protein and DNA can be detected using a method for detecting the size of the molecule, a method for detecting the difference in charge, a method for measuring the affinity between the two, and the like.
Examples of the method for detecting the size of the molecule include measurement by molecular sieve chromatography. The above reaction solution is added to a column for molecular sieve chromatography equilibrated with physiological saline, 0.1 M phosphate buffer (pH 7.4) or 0.1 M HEPES (pH 7.5), and developed in the same solution. To do. Compared with the elution position of each of the recombinant protein and DNA, the binding substance of both is eluted on the higher molecular weight side.
[0052]
Examples of the method for detecting the difference in charge include electrophoresis methods including ion exchange chromatography, gel electrophoresis, and capillary electrophoresis. In gel electrophoresis, a difference in charge and a difference in molecular size appear as a difference in mobility. The reaction mixture is electrophoresed in a polyacrylamide gel, and the gel after the electrophoresis is stained with silver, Coomassie brilliant blue, or fluorescently stained, and the conjugate has a different mobility compared to the recombinant protein alone. Confirmed as a band. In the case of these two methods, it is possible to detect with higher sensitivity as a difference in the elution position and mobility of DNA by fluorescently labeling one end of DNA.
[0053]
Examples of methods for measuring the affinity between the two include affinity chromatography and surface plasmon resonance. In these methods, DNA is immobilized on a carrier, a recombinant protein is brought into contact therewith, and the amount of binding is measured to determine the strength of activity. In affinity chromatography, the bound recombinant protein is eluted with a high-concentration salt solution, a denaturing agent, free DNA, etc., and the amount of the eluted protein is measured. In the surface plasmon resonance method, the amount of protein bound to immobilized DNA can be measured by surface plasmon resonance, and the strength of affinity can be measured at the bound protein concentration.
[0054]
In the case of a transcriptional regulatory factor, DNA of a gene transcriptional regulatory region such as a promoter or enhancer that is recognized and targeted by a known transcriptional regulatory factor (hereinafter sometimes referred to as “target transcriptional regulatory region”) or a portion thereof A method for analyzing biological activity by measuring the binding ability to fragments is known (Japanese Patent Application Laid-Open No. 2001-314190). The target transcriptional regulatory region DNA or a partial fragment thereof used for the analysis includes not only those having a known target transcriptional regulatory region base sequence (hereinafter sometimes referred to as “target sequence”) but also known targets. The base sequence of the transcriptional regulatory region was designed by database analysis and classification, and the common base sequence of the target transcriptional regulatory region recognized by transcriptional regulatory factors in common (hereinafter this may be referred to as the “consensus target sequence”) ) May be used.
[0055]
Known transcriptional regulatory factors include, for example, v-jun, c-jun, junB, junD, dJRA, c-fos, fosB1, fosB2, Fra-1, LRF-1, v-maf, mafG, NF-E2 p45. , ANF-E2, fNF-E2, Nrf short form, GCN4, yAP-1, CREB-2, ATF-3, CRE-BP1, CRE-BP3, ATF-a, CREB-341, CREB-327, CREM, dCREB2 , DCREB2-b, dCREB2-c, dCREB2-d, dCREB2-q, dCREB2-r, dCREB2-s, C / EBPα, C / EBPβ, p34C / EBPβ, CHOP-10, VBP, Hlf, CPRF-2, EmBP -1b, EmBP-1b, GBF1, GBF2, GBF3, CP F-1, TAF-1, HBP-1a, GBF9, GBF1, GBF12, CPRF-3, TGA1a, TGA1b, O2, STE4, OPI1, E2A, E47, ITF-2 / SEF2-1B, SEF-1A, MyoD, p42Tal-1, HEN-1, AhR, Arnt, USF, NF-1A1, NF-1A1.1, NF-1A6, NF-1B1, NF-1B1, NF-1B2, NF-1C2 / CTF-2, CTF- 4, CTF-6, RF-X1, AP2αA / AP-2α1, AP2α2, AP2α3, AP2α4, AP2αB, AP2β, AP2γ, GR, AR, ER, RXR-α, PPARα, PPARγ, COUP-TF1, HNF-4α1, HNF-4α2, CF1, GATA-1, GATA-2, GATA-3, GATA-4, AREA / NIT-2, Sp1, YY1, Egr-1, Egr-2, Egr-3, Snail, CF2-II, Evi-1, Ikaros, MZF-1, Tramtrack69K, HOX9, CDP, HNF-1A, Nkx-2 .2, Nkx-2.5, TTF-1, Oct-1A, Oct-1B, Oct-1C, Oct-2, Oct-2.1 / Oct-2B, Pax-3, Pax-6, Pax-1 , HSF1 (short), HSF2, dHSF, fungalHSF, c-Myb, A-Myb, v-Myb, P (long), P (short), C1 (long), C1 (short), c-Ets-1_p54, Ets-1_δiV / VII, Ets-2, Elk-1, SAP-1, SAP-1b, Erg-1, p55erg, Fli-1b, 4TF1-60 / GABP-α, E74A, IRF-1, IRF-2, p50, NF-ATc, NF-Atp, p91, p84, STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6, p53, MEF-2A, SRF, E2, TBP, SRY, Sox-5, Sox-9, mat-Mc, CP1A, CP1B, CBF-C, AML1a, etc. are known, and the nucleotide sequences of the target transcriptional regulatory regions of these transcriptional regulatory factors (Takaaki Tamura, 2 others, “Bio Science Experimental Medicine Separate Volume New Term Library Transcription Factor”, 2nd edition, Yodosha Co., Ltd., December 1999).
[0056]
The binding between the transcriptional regulatory factor and the target transcriptional regulatory region DNA or a partial fragment thereof can be detected using a measurement system known per se. For example, a test sample containing a transcriptional regulatory factor is added to a plate on which DNA of a target transcriptional regulatory region or a partial fragment thereof is immobilized, and the direct binding of both is performed using the SPR (Surface Plasmon Resonance, Surface Plasmon Resonance) method. Can be detected. In that case, DNA of a target transcriptional regulatory region recognized by the transcriptional regulatory factor as described above or a partial fragment thereof is immobilized on a sensor chip. The annealed DNA or its partial fragment is immobilized. Alternatively, the binding of both can be detected using a transcriptional regulatory factor or a target transcriptional regulatory region DNA or a fragment thereof fluorescently labeled.
[0057]
The test sample for analysis containing the protein encoded by the DNA of the present invention can be prepared by a method for transcription / translation of the DNA of the present invention by an appropriate method as described above. Specifically, for example, the protein of the present invention can be obtained by inducing protein expression by subjecting the DNA of the present invention to a cell-free transcription / translation system.
[0058]
The protein encoded by the DNA of the present invention (SEQ ID NO: 11 to 20) is a target sequence or consensus target sequence (SEQ ID NO: 34 to SEQ ID NO: 86) designed by database analysis of the base sequence of a known target transcriptional regulatory region. It had binding activity to at least one DNA or partial fragment thereof.
[0059]
Furthermore, in the case of a transcriptional regulatory factor, as described above, the transcriptional regulatory factor is identified by analyzing the action on a disease-related transcriptional regulatory factor such as PPAR, p53, NFκB, AP-1, HIF-1, and CREB. It is possible to analyze whether the disease is directly or indirectly involved.
[0060]
PPAR is a peroxisome proliferator-activated receptor that is a family of steroid hormone receptors, and includes endocrine / sugar / lipid metabolism associated with development of lifestyle-related diseases such as diabetes and obesity, It is known as a disease-related transcriptional regulator that regulates the expression of various target genes involved in the circulatory system such as vascular function and inflammation and carcinogenic mechanisms, and has been attracting attention as a target molecule for therapeutic agents for these diseases Yes. In this PPAR, a plurality of subtype genes are found, and there are mainly three types of α, γ, and δ (also called NUC I in humans, FAAR (fat acid-activated receptor) in mice, and PPARβ in frogs) in mammals. The subtype of is clear. α-form is mainly expressed in fat consuming organs such as liver, kidney and brown adipocytes, as well as in the myocardium and gastrointestinal tract, and is involved in fatty acid oxidation, ketone body formation, and apolipoprotein production. The β type is expressed in the brain, and the δ type is universally expressed with no tissue specificity, but its expression in colon cancer cells is remarkable, and its relationship with carcinogenesis has attracted attention. Several types of isoforms, such as γ1 type and γ2 type, are known as γ type, γ1 type is expressed in adipose tissue, immune system organs, adrenal gland, and small intestine, and γ2 type is specifically expressed in adipocytes It is considered that it plays an important role in the induction of adipocyte differentiation and fat synthesis. These PPARs form heterodimers with another transcriptional regulator, such as RXR (retinoid X receptor), and are known to bind to the response element PPRE (PPAR response element) upstream of the target gene to control transcription. It has been.
[0061]
p53 is the second tumor suppressor gene identified in 1989 following the RB gene. The p53 gene is present on chromosome 17p13.1 and its gene product is a nuclear protein with a molecular weight of 53 kD. At first, the p53 gene was thought to be an oncogene similar to myc. After that, the p53 protein has a wild type and a mutant type, and the wild type has a function of controlling the cell proliferation function. It became clear that it is a tumor suppressor gene with a similar function. The p53 protein controls several genes as transcriptional regulators. Among them, the most important one is considered to be the expression control of the p21 gene that inhibits the function of the cyclin / Cdk complex. The function of p53 itself is controlled by phosphorylation. From the viewpoint of suppression of canceration, the following two functions are important as the function of p53. The first is on the signaling pathway that causes apoptosis, a programmed cell death. The second function is to stop the cell cycle while the cell performs DNA repair. Through such functions, p53 stops the cell cycle of cells damaged by radiation or drugs, or removes them by causing apoptosis to prevent the cells that have undergone genetic changes from growing as cancer cells. Therefore, it has been attracting attention as a target molecule for therapeutic agents such as cancer.
[0062]
NFκB regulates gene expression of cytokines (eg, IL-1, IL-2, IL-6, IL-8, GM-CSF, TNF, etc.), chemokines, interferons, MHC molecules, growth factors, cell adhesion molecules, etc. In particular, it is known as a disease-related transcriptional regulator that plays an important role in the immune system. For example, it has attracted attention as a target molecule for therapeutic agents for immune diseases such as rheumatoid arthritis and osteoarthritis, inflammatory diseases, and cancer. Has been.
[0063]
AP-1 is a complex composed of Fos and Jun family of transcriptional regulators, and is known to be involved in cell proliferation and differentiation, particularly cell canceration and inflammatory diseases. It is attracting attention as a target molecule for therapeutic drugs such as cancer.
[0064]
HIF-1 is a gene transcriptional regulator that is activated in a hypoxic situation, and has been shown to be closely involved in the control of angiogenesis through the control of gene expression of vascular endothelial growth factor, such as abnormal angiogenesis. It is attracting attention as a target molecule for therapeutic agents for ischemic diseases, anemia, hypoxia, diabetic retinopathy, cardiovascular diseases, cancer, and the like caused by oxidative abnormalities and intracellular oxidation.
[0065]
CREB (Cyclic AMP Responses Element Binding Protein) is a disease-related disease that plays an important role in cell growth, differentiation, learning and memory processes, nervous system adaptation to drug addiction, and metabolic pathway control such as gluconeogenesis by insulin and glucagon. It is known as a transcriptional regulatory factor, and has attracted attention as a target molecule for therapeutic agents for central system diseases such as memory impairment, cardiovascular diseases, and diabetes.
[0066]
Specifically, the base sequence of the gene site recognized by each disease-related transcriptional regulatory factor is immobilized on a solid phase. In particular, DNA of a target transcriptional regulatory region recognized by a disease-related transcriptional regulatory factor or a partial fragment thereof is preferably used. Examples of the sequence of DNA to be immobilized or a partial fragment thereof include SEQ ID NO: 87 and SEQ ID NO: 88 for PPARγ analysis, SEQ ID NO: 89 and SEQ ID NO: 90 for p53 analysis, SEQ ID NO: 91 and SEQ ID NO: 92 for NFκB analysis, SEQ ID NO: 93 and SEQ ID NO: 94 are used for AP-1 analysis, SEQ ID NO: 95 and SEQ ID NO: 96 are used for HIF-1 analysis, and SEQ ID NO: 97 and SEQ ID NO: 98 are used for CREB analysis. is not. The annealed DNA or its partial fragment is immobilized. For example, a well plate is used as the solid phase, and it is immobilized directly or on, for example, a streptavidin-treated plate or a neutravidin-treated plate. It is more preferable to use biotin-labeled DNA or a partial fragment thereof. The addition amount of DNA or a partial fragment thereof is preferably 1 to 100 nM / 100 μl / well. The reaction is preferably carried out at 10 to 30 ° C. (room temperature) for about 30 minutes to 2 hours. After the completion of the reaction, unreacted substances are removed, and more preferably a protein blocking operation is performed.
[0067]
A test sample containing a transcriptional regulatory factor is added to the well plate prepared as described above together with each disease-related transcriptional regulatory factor, and the action of the transcriptional regulatory factor contained in the test sample is analyzed. If the transcriptional regulatory factor contained in the test sample binds to the disease-related transcriptional regulatory factor and enhances the affinity with the immobilized DNA, the conjugate of the disease-related transcriptional regulatory factor and the transcriptional regulatory factor even after reaction washing Remains in the well in a state of being bound to the immobilized DNA. For example, when measured by absorbance, the OD value is increased compared to the control, and the transcriptional regulatory factor is positive for the affinity between the disease-related transcriptional regulatory factor and the immobilized DNA. It can be estimated that it works. On the other hand, if the transcriptional regulatory factor contained in the test sample binds or does not bind to the disease-related transcriptional regulatory factor and reduces the affinity between the disease-related transcriptional regulatory factor and the immobilized DNA, reaction washing After that, the conjugate of the disease-related transcription regulatory factor and the transcriptional regulatory factor is removed from the well. For example, if measured by absorbance, the OD value is decreased compared to the control, and the transcriptional regulatory factor is the disease-related transcriptional regulatory factor and the immobilized DNA. It can be estimated that it negatively affects the affinity with.
[0068]
The test sample for analysis containing the protein encoded by the clone of the present invention can be prepared by a method for transcription / translation of the DNA of the present invention by an appropriate method as described above. Specifically, for example, the protein of the present invention can be obtained by inducing protein expression by subjecting the DNA of the present invention to a cell-free transcription / translation system.
[0069]
The disease-related transcriptional regulatory factor can be obtained from a cell extract or a cell nucleus extract containing the disease-related transcriptional regulatory factor. Further, as described above, it can be prepared by a method of transcription / translation of DNA encoding a disease-related transcriptional regulatory factor by an appropriate method. Specifically, for example, a cDNA encoding a disease-related transcriptional regulatory factor is used, and the full length or a part thereof is inserted into an appropriate expression vector, and this is inserted into a microorganism such as E. coli, insect cells, yeast, animal cells or animals. The disease-related transcriptional regulator, which is a recombinant protein, can be obtained from the culture supernatant or intracellular, tissue, or body fluid of these gene-introduced cells in which the disease-related transcriptional regulatory factor is expressed.
[0070]
The protein encoded by 4 clones of c-nt2ri3007878, c-brsn2017530, c-hchon20000473, and c-best2001444 has an activity to enhance or suppress the action of PPAR, and it may cause diabetes caused by abnormal endocrine / sugar / lipid metabolism, etc. It was speculated that it is related to lifestyle-related diseases such as obesity, circulatory system diseases due to abnormal vascular function, inflammation, cancer and the like.
[0071]
It was speculated that the protein encoded by the three clones c-nt2ri3007878, c-brsn2017530, and c-testi4004626 has an activity to enhance or suppress the action of p53 and is related to cancer and the like.
[0072]
Proteins encoded by the three clones c-testi 4004626, c-trach 3014316, and c-best 2001444 have an activity to enhance or suppress the action of NFκB, and are immune diseases such as rheumatoid arthritis and osteoarthritis, inflammatory diseases It was speculated to be related to cancer and the like.
[0073]
A protein encoded by 4 clones of c-nt2ri3007878, c-hchon20000473, c-testi4004626, c-trac3014316 has an activity to enhance or suppress the action of AP-1, and is related to inflammatory diseases and cancer It was speculated.
[0074]
The protein encoded by the three clones c-brssn2017530, c-testi4004626, c-trac3014316 has an activity to enhance or suppress the action of HIF-1, resulting from abnormal angiogenesis, abnormal intracellular oxidation, etc. It was speculated that it is related to ischemic disease, anemia, hypoxia, diabetic retinopathy, cardiovascular disease, cancer and the like.
[0075]
The protein encoded by two clones of c-testi 4004626 and c-trac 3014316 has an activity to enhance or suppress the action of CREB and is related to central diseases such as memory impairment, cardiovascular diseases, diabetes, etc. Was guessed.
[0076]
Such a system for analyzing transcriptional regulatory activity can also be used for evaluating agonists and antagonists of proteins having transcriptional regulatory activity of the present invention. The confirmation of the activity of the protein of the present invention is not limited to the method described above.
[0077]
(4) Functional analysis of the protein of the present invention
The proteins of the present invention having novel transcriptional activity including those identified as splicing variants thus obtained are analyzed by analyzing functions other than the transcriptional regulatory activity confirmed in (3) above. The novel utilization method is provided (a protein to be further analyzed for functions other than the transcriptional regulatory activity may be hereinafter referred to as “analyzed protein”). In particular, since the protein of the present invention includes a known protein splicing variant, it is important to identify how this variant functions differently from the known variant.
[0078]
Specific functional analysis methods include, for example, (i) a method for comparative analysis of expression states in each tissue, disease, or developmental stage, (ii) a method for analyzing interactions with other proteins and DNA, ( iii) a method of introducing into a suitable cell or individual and analyzing the phenotypic change; and (iv) a method of analyzing the phenotypic change by inhibiting the expression of the protein in a suitable cell or individual.
[0079]
In the method (i), the expression of the protein of the present invention can be analyzed at the mRNA level or the protein level. In the case of analyzing the expression level at the mRNA level, for example, in situ hybridization (Application to Developmental Biology & Medicine, Ed. by Harris, N. and Wilkins, U.S. 1990)), a hybridization method using a DNA chip, a quantitative PCR method and the like are used. Moreover, when analyzing at a protein level, the tissue staining method using the antibody specifically couple | bonded with the protein of this invention mentioned later, ELISA, a Western blot method etc. are mentioned. If the target protein to be analyzed is a splicing variant with a known variant, use a probe that is present only in the cDNA encoding the target protein and does not hybridize with the cDNA encoding the known variant. Is preferred. In the case of the quantitative PCR method, a method of selecting primers capable of producing amplified fragments having different lengths between the target variant and the known variants (Wong, Y., Neuroscience Let., 320: 141-145 (2002)), etc. Is mentioned. Also, when analyzing at the protein level, it is preferable to use an antibody that reacts only with the target protein and does not react with a known variant.
[0080]
In the method (ii), the function of the protein of the present invention can be analyzed by examining the presence or absence of interaction between the protein of the present invention and a known protein. As an analysis method of the interaction, a conventional method known per se can be used. Specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon method, phage display method, ribosomal display Law. Also in this method, when the protein to be analyzed is a splicing variant in which a known variant exists, a substance that interacts with the known variant in the same manner is analyzed, and a substance that specifically interacts with the target protein is identified. Is preferred.
[0081]
In the method (iii), the cells into which the cDNA of the present invention is introduced are not particularly limited, but human cultured cells and the like are particularly preferably used. Examples of the method for introducing DNA into cells include those described in (2) above. In addition, the phenotype of the introduced cell can be observed with a microscope, such as cell viability, cell growth rate, cell differentiation, neurite elongation when cells are nerve cells, and localization and migration of intracellular proteins. And those that can be analyzed by biochemical experiments such as changes in expression of specific proteins in cells. In the case of a splicing variant in which a known variant is present, these phenotypes are similarly introduced into the cell by the present DNA or a DNA encoding the known variant, and subjected to comparative analysis to obtain a phenotype related to the analysis target variant. Can be identified. Moreover, since it is known that the protein of the present invention has transcriptional regulatory activity, it is also preferable to analyze by paying attention to phenotypes and the like found in diseases associated with kinases.
[0082]
The method (iv) can be carried out efficiently by a method using an oligonucleotide described later or an RNA interference method. Also in this method, when the target protein to be analyzed is a splicing variant in which a known variant exists, the same analysis is performed on the known variant and other variants, and the target protein-specific is obtained by performing comparative analysis. Function can be identified.
[0083]
(5) Preparation of oligonucleotide and functional analysis using the oligonucleotide Using the DNA of the present invention obtained by the method described in the above (1) or a fragment thereof, by a conventional method using a DNA synthesizer or the like, Oligonucleotides such as antisense oligonucleotides and sense oligonucleotides having a partial sequence of DNA can be prepared. Examples of the oligonucleotide include DNA having the same sequence as 5 to 100 consecutive bases in the base sequence of the DNA or DNA having a sequence complementary to the DNA. Specific examples thereof include DNA having the same sequence as 5 to 100 consecutive bases in the base sequence represented by any of SEQ ID NOs: 1 to 10, or DNA having a sequence complementary to the DNA. Here, when the target protein is a splicing variant in which a known variant DNA exists, it is preferable to select a base sequence of a portion different from the known variant. When used as a sense primer and an antisense primer, the above oligonucleotides in which the melting temperature (Tm) and the number of bases of both do not change extremely are preferable. The length of the sequence is generally 5 to 100 bases, preferably 10 to 60 bases, and more preferably 15 to 50 bases.
[0084]
In addition, derivatives of these oligonucleotides can also be used as the oligonucleotide of the present invention. The oligonucleotide derivative includes an oligonucleotide derivative in which a phosphodiester bond in an oligonucleotide is converted to a phosphorothioate bond, and an oligonucleotide in which a phosphodiester bond in an oligonucleotide is converted to an N3′-P5 ′ phosphoramidate bond. Nucleotide derivatives, oligonucleotide derivatives in which ribose and phosphodiester bonds in oligonucleotides are converted to peptide nucleic acid bonds, oligonucleotide derivatives in which uracil in oligonucleotides is substituted with C-5 propynyl uracil, uracil in oligonucleotides Oligonucleotide derivative substituted with C-5 thiazole uracil, oligonucleotide derivative substituted with cytosine in oligonucleotide with C-5 propynylcytosine, oligonucleotide An oligonucleotide derivative in which the cytosine is replaced with a phenoxazine-modified cytosine, an oligonucleotide derivative in which the ribose in the oligonucleotide is replaced with 2′-O-propylribose, or 2 in the oligonucleotide Examples thereof include oligonucleotide derivatives substituted with '-methoxyethoxyribose.
[0085]
Moreover, the oligonucleotide of the present invention can be applied to the RNA interference method by preparing it as a double-stranded RNA. For example, the method described in (Elbashir, S., et al., Nature, 411: 494-498 (2001)) can be used for the production method of double-stranded RNA and the RNA interference method. . The double-stranded RNAs need not all be RNA. Specifically, those described in WO 02/10374 can be used as a part of which is DNA.
[0086]
The target gene in this RNA interference method (hereinafter sometimes referred to as “target gene”) may be any DNA as long as it is the DNA of the present invention. A double-stranded polynucleotide comprising RNA having a sequence substantially the same as at least a part of the base sequence of these DNAs (hereinafter sometimes referred to as “double-stranded polynucleotide”) refers to a target gene Among these nucleotide sequences, the nucleotide sequence is substantially the same as a sequence of 15 bp or more which may be any part. Here, “substantially identical” means having a homology of 80% or more with the sequence of the target gene.
[0087]
Further, when the protein to be analyzed is an insertion type or substitution type variant as compared with a known protein, the double-stranded polynucleotide sequence can be set at the insertion or substitution site. In addition, when the protein to be analyzed is a deletion variant of a known protein, it is possible to select a sequence that is specifically effective for the protein by setting the sequence across the deletion to a double-stranded polynucleotide sequence. it can. Furthermore, by comparing the base sequence of the DNA encoding each of the protein to be analyzed and the known protein, by selecting a base sequence specific to the DNA encoding the protein to be analyzed, Expression can be inhibited.
[0088]
The nucleotide chain length may be any length from 15 bp to the entire length of the open reading frame (ORF) of the target gene, but a length of about 15 to 500 bp is preferably used. However, in cells derived from mammals, the existence of a signal transduction system that is activated in response to a long double-stranded RNA of 30 bp or more is known. This is called an interferon reaction (Mareus, PI, et al., Interferon, 5: 115-180 (1983)). When the double-stranded RNA enters the cell, PKR (dsRNA-responsive) protein kinase: Bass, B. L., Nature, 411: 428-429 (2001)), the initiation of translation of many genes is non-specifically inhibited, and at the same time, 2′-5 ′ oligoadenylate synthetase (Bass, B. L., Nature, 411: 428-429 (2001)), activation of RNase L occurs, causing non-specific degradation of intracellular RNA. These non-specific reactions mask the specific reaction of the target gene. Therefore, when a mammal or a cell or tissue derived from the animal is used as the recipient, it is preferable to use a double-stranded polynucleotide of 15 to 30 bp, preferably 19 to 24 bp, more preferably 21 bp. The double-stranded polynucleotide need not be entirely double-stranded, and includes those in which the 5 'or 3' end partially protrudes. However, it is preferable to use a polynucleotide in which the 3 'end protrudes 2 bases. The double-stranded polynucleotide means a double-stranded polynucleotide having complementarity, but may be a self-annealed single-stranded polynucleotide having self-complementarity. Examples of the single-stranded polynucleotide having self-complementarity include those having an inverted repeat sequence.
[0089]
Although there is no restriction | limiting in particular as a preparation method of double stranded polynucleotide, It is preferable to use the chemical synthesis method known per se. In chemical synthesis, single-stranded polynucleotides having complementarity can be synthesized separately and associated with each other by an appropriate method to be double-stranded. Examples of the association method include a method in which the polynucleotide is mixed, heated to a temperature at which the double strands dissociate, and then gradually cooled. The associated double-stranded polynucleotide is confirmed using an agarose gel or the like, and the remaining single-stranded polynucleotide is removed by, for example, decomposing with an appropriate enzyme.
[0090]
The recipient to which the double-stranded polynucleotide thus prepared is introduced may be any recipient as long as the target gene can be transcribed into RNA or translated into protein in the cell. Specific examples include those belonging to plant, animal, protozoan, virus, bacteria, or fungal species. The plant may be monocotyledonous, dicotyledonous or gymnosperm, and the animal may be a vertebrate or invertebrate. Preferred microorganisms are those used in agriculture or industry and are pathogenic to plants or animals. Fungi include organisms in both mold and yeast forms. Examples of vertebrates include mammals including fish, cows, goats, pigs, sheep, hamsters, mice, rats, and humans, and invertebrates include nematodes and other reptiles, Drosophila melanogaster ( Drosophila), and other insects. Preferably, the cell is a vertebrate cell.
[0091]
An introducer means a cell, tissue or individual. Here, the cells may be germline or somatic, totipotent or multipotent, divided or undivided, parenchyma or epithelium, immortalized or transformed, and the like. The cell may be a gamete or embryo, and in the case of an embryo, it is a single-cell embryo or constitutive cell, or a cell from a multi-cell embryo and includes fetal tissue. Furthermore, it may be an undifferentiated cell such as a stem cell, or a differentiated cell such as from a cell of an organ or tissue including fetal tissue, or any other cell present in an organism. Differentiated cell types include adipocytes, fibroblasts, muscle cells, cardiomyocytes, endothelial cells, neurons, glia, blood cells, megakaryocytes, lymphocytes, macrophages, neutrophils, eosinophils, Examples include basophils, mast cells, leukocytes, granulocytes, keratinocytes, chondrocytes, osteoblasts, osteoclasts, hepatocytes and cells of endocrine or exocrine glands.
[0092]
As a method for introducing a double-stranded polynucleotide into a recipient, when the recipient is a cell or tissue, a calcium phosphate method, an electroporation method, a lipofection method, a virus infection, a double-stranded polynucleotide solution Soaking or transformation method is used. Examples of the method for introduction into the embryo include microinjection, electroporation, and virus infection. When the recipient is a plant, a method by injection or perfusion into the body cavity or stromal cells of the plant or spraying is used. In the case of an animal individual, it is introduced systemically by oral, topical, parenteral (including subcutaneous, intramuscular and intravenous administration), vaginal, rectal, nasal, ophthalmic, intraperitoneal administration, etc. The method, electroporation method, virus infection or the like is used. For methods for oral introduction, double-stranded polynucleotides can be mixed directly with the food of the organism. Furthermore, when introduced into an individual, it can be administered, for example, as an implanted long-term release preparation or by ingesting an introduced body into which a double-stranded polynucleotide has been introduced.
[0093]
The amount of the double-stranded polynucleotide to be introduced can be appropriately selected depending on the introduced body and the target gene, but it is preferable to introduce an amount sufficient to introduce at least one copy per cell. Specifically, for example, when the recipient is a cultured human cell and a double-stranded polynucleotide is introduced by the calcium phosphate method, 0.1 to 1000 nM is preferable.
[0094]
By suppressing the expression of the DNA of the present invention in the introduced body by RNA interference, the function of the protein encoded by the DNA of the present invention can be confirmed, or a new function can be analyzed.
[0095]
(6) An antibody that specifically binds to the protein of the present invention
As a method for preparing an antibody that specifically binds to the protein of the present invention, a commonly used known method can be used. A polypeptide used as an antigen also has a high antigenicity according to a known method and has an epitope (antigen determination). A sequence suitable as the group) can be selected and used. As an epitope selection method, for example, commercially available software such as Epitope Advisor (manufactured by Fujitsu Kyushu System Engineering Co., Ltd.) can be used. In addition, when the target protein is a splicing variant in which a known variant exists, it is specific to the target protein by using an antibody that reacts only with the target protein and does not react with a known or other variant. Function can be identified. As an epitope of such an antibody, for example, when there is an amino acid sequence in which the target protein is deleted compared to a known variant, an amino acid sequence (junction part) before and after the deleted part is preferable. In addition, when the target protein has an amino acid sequence to which a known variant N-terminal or C-terminal is added, it is also preferable to use the added amino acid sequence as an epitope. As a method other than the above, an antibody that reacts only with the target protein can be obtained by removing an antibody that reacts with a known or other variant from the polyclonal antibody obtained against the target protein. As a method for removal, affinity chromatography in which a known or other variant is immobilized as a ligand, or an immunoprecipitation method using a known or other variant is used.
[0096]
The polypeptide used as the antigen may be a synthetic peptide synthesized according to a known method, or the protein of the present invention itself. Polypeptides that serve as antigens can be prepared in an appropriate solution according to known methods and immunized to mammals such as rabbits, mice, rats, etc. In order to perform stable immunization or increase antibody titers It is preferable to immunize by using an antigen peptide as a conjugate with an appropriate carrier protein or adding an adjuvant or the like.
[0097]
There are no particular limitations on the route of administration of the antigen during immunization, and any route such as subcutaneous, intraperitoneal, intravenous, or intramuscular may be used. Specifically, for example, a method of inoculating BALB / c mice several times every several days to several weeks is used. The antigen intake is preferably about 0.3 to 0.5 mg / dose when the antigen is a polypeptide, but is appropriately adjusted depending on the type of polypeptide and the animal species to be immunized.
[0098]
After immunization, blood is collected on a trial basis as appropriate, and an increase in antibody titer is confirmed by a method such as octalony method, solid phase enzyme immunoassay (hereinafter sometimes referred to as “ELISA method”) or Western blotting, Blood is collected from animals with sufficiently elevated antibody titers. A polyclonal antibody can be obtained by performing an appropriate treatment used for preparing the antibody. Specific examples include a method of obtaining a purified antibody obtained by purifying antibody components from serum according to a known method. For purification of antibody components, methods such as salting out, ion exchange chromatography, affinity chromatography and the like can be used.
[0099]
A monoclonal antibody can also be produced by using a hybridoma fused with the spleen cells and myeloma cells of the animal according to a known method (Milstein, et al., Nature, 256: 495 (1975)). . A monoclonal antibody can be obtained, for example, by the following method.
[0100]
First, antibody-producing cells are obtained from an animal having an increased antibody titer by immunization with the antigen described above. The antibody-producing cells are plasma cells and lymphocytes that are precursor cells thereof, and these may be obtained from any individual, but are preferably obtained from spleen, lymph nodes, peripheral blood, and the like. The myeloma to be fused with these cells is generally a cell line obtained from a mouse, for example, an 8-azaguanine resistant mouse (BALB / c-derived etc.) myeloma cell line P3X63-Ag8.653 (ATCC: CRL). -1580), P3-NS1 / 1Ag4.1 (RIKEN Cell Bank: RCB0095) and the like are preferably used. For cell fusion, antibody-producing cells and myeloma cells are mixed at an appropriate ratio, and 50% polyethylene is added to an appropriate cell fusion medium such as RPMI 1640, Iskov modified Dulbecco medium (IMDM), Dulbecco modified Eagle medium (DMEM), or the like. It can be performed by using a solution in which glycol (PEG) is dissolved. It can also be carried out by the electrofusion method (Zimmermann, U. et al., Naturewissenschafften, 68: 577 (1981)).
[0101]
The hybridoma was prepared by using 5% CO 2 in a normal medium (HAT medium) containing an appropriate amount of hypoxanthine / aminopterin / thymidine (HAT) solution using the fact that the myeloma cell line used was an 8-azaguanine resistant strain.2It can be selected by culturing at 37 ° C. for an appropriate time. This selection method can be appropriately selected depending on the myeloma cell line used. The antibody titer of the antibody produced by the selected hybridoma is analyzed by the method described above, the hybridoma producing the antibody having a high antibody titer is separated by a limiting dilution method, etc., and the isolated fused cells are cultured in an appropriate medium. A monoclonal antibody can be obtained by purifying the resulting culture supernatant by an appropriate method such as ammonium sulfate fractionation or affinity chromatography. For purification, a commercially available monoclonal antibody purification kit can also be used. Furthermore, ascites containing a large amount of the monoclonal antibody of the present invention can be obtained by growing the antibody-producing hybridoma obtained above in the abdominal cavity of an animal of the same strain as the immunized animal or a nude mouse.
[0102]
In addition, when a protein derived from human is obtained as the protein of the present invention, the above-described method is applied to a Severe combined immunology (SCID) mouse transplanted with human peripheral blood lymphocytes using such a polypeptide or a partial peptide thereof as an antigen. The human-type antibody can also be prepared by immunizing in the same manner as described above and preparing a hybridoma between the antibody-producing cells of the immunized animal and human myeloma cells (Mosier, D. E., et al., Nature). 335: 256-259 (1988); Duchosal, M. A., et al., Nature, 355: 258-262 (1992)).
[0103]
In addition, RNA is extracted from the obtained hybridoma producing the human antibody, the gene encoding the desired human antibody is cloned, this gene is inserted into an appropriate vector, and this is introduced into an appropriate host. By expressing it, it is possible to produce a human antibody in a larger amount. Here, an antibody having a low binding property to an antigen can also be obtained as an antibody having a higher binding property by using a known evolutionary engineering technique. A partial fragment such as a transient antibody can be prepared by cleaving the Fab portion and the Fc portion using, for example, papain, and collecting the Fab portion using an affinity column or the like.
[0104]
The antibody that specifically binds to the protein of the present invention thus obtained can also be used as a neutralizing antibody that inhibits the transcriptional regulatory activity and the like of the protein by specifically binding to the protein of the present invention. There is no particular limitation on the method for selecting the protein that inhibits the activity of the protein. For example, whether or not the function of the target protein in the introduced body is inhibited by bringing the antibody into contact with the DNA introduced body prepared in (2) above. And a method for analyzing the above.
[0105]
Such a neutralizing antibody can be used alone in the clinical application, but can also be used as a pharmaceutical composition by blending with a pharmaceutically acceptable carrier. The ratio of the active ingredient to the carrier at this time can vary between 1 and 90% by weight. In addition, such drugs can be administered in various forms, such as tablets, capsules, granules, powders, syrups or the like, or injections, drops, liposomes, Parenteral administration with a suppository or the like can be mentioned. Further, the dose can be appropriately selected depending on symptoms, age, body weight and the like.
[0106]
(7) Screening for molecules that modulate the activity of the protein of the present invention
By screening for a substance that specifically binds to the protein of the present invention and has an action of inhibiting, antagonizing or enhancing the function (activity) of the protein of the present invention, (Sometimes referred to as “regulators”).
[0107]
Any method may be used for this modulator screening method as long as it is capable of obtaining a substance that specifically binds to the protein of the present invention and has an action of inhibiting, antagonizing or enhancing the activity of the protein. For example, first, the protein of the present invention is contacted with a substance to be screened (hereinafter sometimes referred to as “test substance”) and selected with the binding property to the protein as an index. A method of selecting a test substance using the change in activity of the protein as an index can be used.
[0108]
The test substance may be any substance that can interact with the protein of the present invention and affect the activity of the protein. Specifically, for example, a peptide , Proteins, non-peptidic compounds, low molecular weight compounds, synthetic compounds, fermentation products, cell extracts, animal tissue extracts and the like. These substances may be novel substances or known substances. As a method for analyzing the interaction between the test substance and the protein of the present invention, a conventional method known per se can be used. Specifically, for example, the yeast two-hybrid method, the fluorescence depolarization method, the surface plasmon method , Phage display method, ribosomal display method, competition analysis method with the antibody described in (6) above, and the like. By such a method, a substance found to bind to the protein of the present invention is then analyzed by analyzing how the activity of the protein of the present invention is affected in the presence of the substance. Whether it is used as a modulator is identified. Here, when the target protein is a splicing variant in which a known variant exists, the effect is analyzed on a substance that binds only to the target protein and does not bind to a known or other variant, or a known Alternatively, the effect of the substance on the target protein can be analyzed by identifying whether or not other variants bind in the same manner, and analyzing the difference in the effects when binding. Further, by examining the distribution of the substance in an individual, the influence on the target protein and known or other variants can be analyzed.
[0109]
As a specific analysis method, for example, when analyzing a substance that regulates transcriptional regulatory activity, a protein serving as a substrate is also introduced into the DNA transductant described in (2) by the same method. The phosphorylation of the protein serving as a substrate in the presence / absence of the substance selected for this transductant is analyzed by a commonly used method known per se. Specifically, it can be performed using the method described in (3) above. If the transcriptional regulatory activity is increased compared to that in the absence of the substance, the substance may function as an activator of the transcriptional regulator, and if it is reduced or inhibited, the substance Can be identified as having the potential to function as inhibitors of transcriptional regulators.
[0110]
Here, when using the DNA or recombinant protein of the present invention used for screening a regulatory substance for the purpose of obtaining a pharmaceutically active ingredient, it is preferable to use the human homologous protein described above. Furthermore, the substance screened by the above method may be further selected as a pharmaceutical candidate by in vivo screening. The evaluation of the protein function regulator of the present invention is not limited to the method described above.
[0111]
Transcriptional regulators control pathway signaling related to cancer, signaling related to myocardial development, signaling to control sperm differentiation and motility, and control germline differentiation Signal transduction function on the pathway, signal transduction function on the pathway that controls cell differentiation, function to produce glycerol triphosphate, signal transduction function on the pathway that controls the development, differentiation, proliferation and survival of neurons, Alzheimer In the signal transmission function on the pathway that controls the pathogenesis of the disease, the signal transmission function of the pathway that controls the generation, differentiation, growth, proliferation, survival, regeneration, and cell function of various cells, etc. It is related to the regulation of gene expression by binding to DNA. Therefore, it can be a target for screening for therapeutic agents for various diseases related to these signal transductions. Compounds that can be identified by this screening method include anticancer agents, diabetes treatment agents, anti-inflammatory agents, neurodegenerative disease treatment agents, cardiac disease treatment agents, infertility treatment agents, regenerative tissue inducers, Alzheimer's disease treatment agents, obesity treatment agents, It can be used as a therapeutic agent for diabetes, cardiovascular disease, metabolic disorder, anorexia, bulimia and the like.
[0112]
The DNA encoding the protein of the present invention is a tissue such as brain (amygdala, hippocampus, substantia nigra, fetal brain), testis, trachea, adult breast, chondrocyte, nervous system cell including undifferentiated neural progenitor cells, etc. The protein of the present invention, which has been cloned from a cDNA library constructed from organ or cell-derived RNA, may have a specific function in the above tissues or organs. The protein function-regulating substance of the invention can be used as a therapeutic agent for diseases peculiar to the tissue or organ.
[0113]
In the clinical application, the above-mentioned active ingredient can be used alone for clinical application, but it can also be used as a pharmaceutical composition by blending with a pharmaceutically acceptable carrier. The ratio of the active ingredient to the carrier at this time can vary between 1 and 90% by weight. In addition, such drugs can be administered in various forms, such as tablets, capsules, granules, powders, syrups or the like, or injections, drops, liposomes, Parenteral administration with a suppository or the like can be mentioned. Further, the dose can be appropriately selected depending on symptoms, age, body weight and the like.
[0114]
(8) Screening for DNA expression regulators of the present invention
Examples of the screening method include a method of analyzing the expression level of the protein of the present invention or mRNA encoding the same in the presence of a test substance. Specifically, for example, cells expressing the protein of the present invention described in (2) are cultured in an appropriate medium containing a test substance, and the amount of the protein of the present invention expressed in the cells is determined by ELISA or the like. Or the amount of mRNA encoding the protein of the present invention in the cells can be analyzed by quantitative reverse transcription PCR, Northern blotting, or the like.
[0115]
As the test substance, those described in (7) can be used. If this analysis shows that the amount of protein or mRNA expressed in the cells cultured in the absence of the test substance increases compared to the amount of the test substance, the test substance becomes a substance that promotes the expression of the DNA of the present invention. In the case of decrease, it can be determined that this test substance can be used as a DNA expression inhibitor of the present invention.
[0116]
Such an expression regulating substance can be used alone in the clinical application, but can also be used as a pharmaceutical composition by blending with a pharmaceutically acceptable carrier. The ratio of the active ingredient to the carrier at this time can vary between 1 and 90% by weight. In addition, such drugs can be administered in various forms, such as tablets, capsules, granules, powders, syrups or the like, or injections, drops, liposomes, Parenteral administration with a suppository or the like can be mentioned. Further, the dose can be appropriately selected depending on symptoms, age, body weight and the like.
[0117]
(9) DNA-introduced animal of the present invention
The introduction DNA containing the DNA of the present invention described in (1) above is constructed, introduced into a fertilized egg of a mammal other than a human, and transplanted into a female individual uterus to generate it. Non-human mammals into which DNA has been introduced can be produced. More specifically, for example, a female individual is over-ovulated by hormone administration, then mated with a male, a fertilized egg is extracted from the oviduct on the first day after mating, and the introduced DNA is microinjected into the fertilized egg, etc. It introduces by the method of. Thereafter, after culturing by an appropriate method, the surviving fertilized eggs are transplanted into the uterus of a pseudo-pregnant female individual (temporary parent) to give birth. Whether or not the target DNA has been introduced into the newborn can be identified by performing Southern blot analysis of DNA extracted from the cells of the individual. Examples of mammals other than humans include mice, rats, guinea pigs, hamsters, rabbits, goats, pigs, dogs, cats and the like.
[0118]
The thus-obtained DNA-introduced animal of the present invention is mated and obtained offspring by subculture in a normal breeding environment while confirming that the introduced DNA is stably retained. be able to. Moreover, the offspring can be obtained by repeating in vitro fertilization and a line can be maintained.
[0119]
The non-human mammal into which the DNA of the present invention has been introduced can be used as an analysis of the function of the DNA of the present invention in vivo, or as a screening system for substances that regulate it.
[0120]
(10) Other uses of the protein of the present invention and DNA containing the base sequence encoding it
The protein of the present invention can be used as a carrier on which the protein is bound. Moreover, the base sequence encoding the protein of the present invention, for example, the DNA having the base sequence set forth in any of SEQ ID NOs: 1 to 10 or a partial fragment thereof can be used as a carrier on which they are bound on a substrate. Hereinafter, these may be referred to as “protein chip”, “DNA chip” or “DNA array” (DNA microarray and DNA macroarray). These protein chips, or DNA chips or arrays, may contain other proteins and DNAs in addition to the proteins and DNAs of the present invention. Here, when the target protein is a splicing variant in which a known variant exists, an amino acid sequence partial fragment specific to the target protein can be used for the protein chip, but has a three-dimensional structure different from other variants. Since there is a possibility, the full length can also be used. For the DNA array, it is preferable to select a sequence different from other variant DNAs among the DNA sequences encoding the target protein.
[0121]
In addition, as a substrate for binding proteins and DNA, a resin substrate such as a nylon membrane or a polypropylene membrane, a nitrocellulose membrane, a glass plate, a silicon plate, or the like is used. When performing using a substance etc., the glass plate, silicon plate, etc. which do not contain a fluorescent substance are used suitably. The protein or DNA can be easily bound to the substrate by a commonly used method known per se. These protein chips, DNA chips, or DNA arrays are also included in the scope of the present invention.
[0122]
The amino acid sequence of the protein of the present invention and the base sequence of DNA can also be used as sequence information. The base sequence of this DNA includes the base sequence of the corresponding RNA. That is, an amino acid sequence or base sequence database can be constructed by storing the obtained amino acid sequence or base sequence in an appropriate recording medium in a predetermined format readable by a computer. This database may include base sequences of other types of proteins and DNAs encoding the same. In the present invention, the database also means a computer system in which the above array is written on an appropriate recording medium and a search is performed according to a predetermined program. Examples of suitable recording media include magnetic media such as flexible disks, hard disks, and magnetic tapes, optical disks such as CD-ROM, MO, CD-R, CD-RW, DVD-R, and DVD-RAM, and semiconductor memory. Etc.
[0123]
【Example】
EXAMPLES Hereinafter, although an Example is given and this invention is demonstrated in detail, the scope of the present invention is not limited by these Examples. In addition, the result of having performed the following experiment about each acquired cDNA clone was put together in Example 7, and was described.
[0124]
Example 1 Preparation of cDNA library by oligo cap method
Human cultured cells (HC cells that are primary human cartilage primary cultured cells, manufactured by Toyobo: # T402K-05) and human cultured cells (teratocarcinoma cells derived from human fetal testis, nerves that can be differentiated into neurons by retinoic acid treatment NT2 cells, which are progenitor cells, manufactured by Stratagene: # 204101) were induced by retinoic acid treatment, cultured for 5 weeks, further treated with a growth inhibitor, and cultured for 2 weeks (Sambrook, J. et al). , Molecular Cloning 2nd ed., Cold Spring Harbor Laboratory Press, (1989)), and mRNA is extracted with oligo dT cellulose.+RNA was purified.
[0125]
Poly (A) obtained above+RNA, commercially available mRNA extracted as total RNA from human tissues (Clontech: testis (# 64027-1), fetal brain (# 64019-1), trachea (# 64091-1), made by Stratagene) : Adult breast (# 7335044)) and poly (A) from human tissues+Polynucleotides from total RNA in the whole brain are extracted into each commercially available mRNA extracted and purified as RNA (Clontech: amygdala (# 6574-1), substantia nigra (# 6580-1), hippocampus (# 65778-1)). (A)+Poly (A) prepared by removing RNA with oligo dT celluloseFrom each RNA mixed with RNA, cDNA libraries were prepared by the oligo cap method (Maruyama, K., et al., Gene, 138: 171-174 (1994)). The relationship between the library name and its origin is shown below.
c-best: adult breast
c-bramy: amygdala
c-brhip: Hippocampus
c-brassn: Black quality
c-febra: fetal brain
c-hchon: Normal cartilage primary cultured cells (HC cells)
c-nt2ri: cells obtained by differentiating neural progenitor cells (NT2 cells) into neuron-like cells by retinoic acid treatment
c-testi: testis
c-trach: trachea
[0126]
First, the RNA was treated with BAP (Bacterial Alkaline Phosphatase) and TAP (Tobacco Acid Pyrophosphatase), and then an oligocap linker (SEQ ID NO: 21) was ligated using RNA ligase. First strand cDNA was synthesized by reverse transcription reaction using this RNA strand as a template and oligo dT primer (SEQ ID NO: 22), and then RNA strand was decomposed and removed (Suzuki et al., Protein Nucleic Acid Enzyme, 41: 603-607 ( 1996); Suzuki, Y. et al., Gene, 200: 149-156 (1997)). Subsequently, double-stranded cDNA was amplified by PCR (polymerase chain reaction) using the 5 ′ PCR primer (SEQ ID NO: 23) and the 3 ′ PCR primer (SEQ ID NO: 24), and the amplified DNA strand was cleaved with SfiI. .
[0127]
Next, the SfiI digested fragment obtained above was cloned into the DraIII site of pME18SFL3 (GenBank AB009864), which is an expression vector, to prepare a cDNA library. In the pME18SFL3 vector used above, the SRα promoter and the SV40 small t intron are incorporated upstream of the cloning site, and the SV40 poly (A) addition signal sequence is inserted downstream thereof. Since the cloning site of pME18SFL3 is an asymmetric DraIII site and a complementary SfiI site is added to the end of the cDNA fragment, the cloned cDNA fragment is unidirectional downstream of the SRα promoter. Inserted into. Therefore, in a clone containing a full-length cDNA, it is possible to express a gene transiently by directly introducing the obtained plasmid into a COS cell. That is, it can be analyzed very easily as a protein that is a gene product or as an experimental analysis of their biological activity.
[0128]
With respect to the plasmid DNA of the clones obtained from these, the nucleotide sequence at the 5 'end or 3' end of the cDNA was converted into a DNA sequencing reagent (Dye Terminator Cycle Sequencing FS Ready Reaction Kit, dRhodamine). Terminator Cycle Sequencing FS Ready Reaction Kit or BigDye Terminator Cycle Sequencing FS Ready Reaction Kit: Bios, sequenced by M did.
[0129]
Example 2 Evaluation of full length of 5 'end of clone from cDNA library prepared by oligocap method
The base sequence of the 5 ′ end of the human cDNA library prepared in Example 1 is compared with the sequence of known human mRNA in the public database, and all clones having the same 5 ′ end sequence are known in the public database. When the 5 ′ end extends longer than the mRNA sequence, or when the 5 ′ end is short but has a translation initiation codon, it is determined as “full length”, and when the translation initiation codon is not included, “non-full length” It was judged.
[0130]
Next, clones were evaluated using ESTiMateFL. ESTiMateFL is a method developed by Nishikawa and Ota et al. Of Helix Laboratories in order to select clones with high possibility of full-length cDNA by comparing with EST 5 'and 3' end sequences in public databases. is there. The 5 ′ end or 3 ′ end sequence of the cDNA clone analyzed in Example 1 is compared with the base sequence registered in the EST database, and extends to the 5 ′ side or 3 ′ side of the obtained cDNA clone sequence. When the EST was present, it was judged that the clone was “possibly not full length”. When the 5 'end is extended from the EST sequence in the public database, or even if the 5' end is short, the difference is within 50 bases for the sake of convenience, and when it is shorter than that, the non-full length is assumed. .
[0131]
Example 3 Analysis of nucleotide sequence and amino acid sequence of cDNA clone
According to BLAST (Basic local alignment search tool; Altschul, SF, et al., J. Mol. Biol., 215: 403-410 (1990)) for the entire nucleotide sequence of the cDNA clone analyzed in Example 2. Protein feature search by HMMPFAM which is one of the functional groups of homology search (homology search) and HMMER (sequence analysis method by hidden Markov model; Eddy, SR, Bioinformatics, 14: 755-763 (1998)) profile search: http://pfam.ustl.edu), and the function of the protein encoded by each cDNA clone was estimated. In addition, with regard to a clone presumed to be a splicing variant in which there is a known clone in which a part of the base sequence is completely identical, any exon deleted and spliced if the genome sequence can be analyzed It was analyzed.
[0132]
Example 4 Measurement of transcriptional regulatory activity (analysis of binding activity to target transcriptional regulatory region)
(1) Preparation of the protein of the present invention using a cell-free protein synthesis system
The cDNA clone presumed to have transcriptional regulatory activity in Example 3 was synthesized using a cell-free protein synthesis system, and whether or not the protein had transcriptional regulatory activity was determined by the following biochemical method. It was analyzed by experiment.
[0133]
PCR method using the ORF fragment of the cDNA clone presumed to have transcriptional regulatory activity in Example 3 using the following primers specific for each clone as 5'-side primers and the following common primers as 3'-side primers Obtained by.
[0134]
5 'primer
(A) c-nt2ri3007878: ATGATCCCAGTCACAGATACATCATTGAG (SEQ ID NO: 25)
(B) c-bramy2043103: ATGCCGCGCATGCGC (SEQ ID NO: 26)
(C) c-brsn2013753: ATGCCAACCATCATCAGACAC (SEQ ID NO: 27)
(D) c-brsn2017530: ATGGTCCCAAATTATGAGAACCCTGG (SEQ ID NO: 28)
(E) c-hcho20000473: ATGACACCAGCATCTGCCATC (SEQ ID NO: 29)
(F) c-testi 4004626: ATGATTTATCTCAGTGTGCATGGGTTG (SEQ ID NO: 30)
(G) c-trach 3014316: AGTTCAGGTGGGTGAGAACAGGG (SEQ ID NO: 31)
(H) c-best2001444: ATGTCCGACGGAGCCG (SEQ ID NO: 32)
3 'common primer
GGCCCTTATGGCCGGAGAAAAGGCGGACAGGTAT (SEQ ID NO: 33)
[0135]
A translation control region containing SP6 promoter-glutathione-S-transferase gene-PreScission Protease (manufactured by Amersham Pharmacia Biotech) -cleavage site-DNA cloning site (SmaI, SfiI) -poly (A) signal sequence vector (pEU) -Inserted into the cloning site of SS4).
[0136]
Using the plasmid DNA prepared above as a template, transcription was performed using SP6 RNA polymerase (Promega), and the resulting mRNA was extracted with phenol / chloroform and precipitated with ethanol, followed by Nick Column (Amersham Pharmacia Biotech). Purified by
[0137]
Protein synthesis using the mRNA purified as described above is described in JP-A No. 2002-204689 and Proc. Natl. Acad. Sci. USA, 99: 14652-14657 (2002). The translation solution (25 μl) used in the layered cell-free protein synthesis system includes Proc. Natl. Acad. Sci. USA, 97: 559-564 (2000), 6 μl of wheat germ extract and the above-mentioned mRNA (0.02 nmol) were added and used, the composition being 24 mM Hepes / KOH (pH 7.8), 1. 2 mM ATP, 0.25 mM GTP, 16 mM creatine phosphate, 10 μg creatine kinase, ribonuclease inhibitor (20 units), 2 mM DTT, 0.4 mM spermidine, 0.3 mM sac um sac met 5 μg wheat germ derived tRNA, 0.05% Nonidet P-40 and 0.005% NaN3Consists of. The translation buffer was 31.3 mM HEPES / KOH (pH 7.8), 2.67 mM Mg (OAc).2, 93 mM KOAc, 1.2 mM ATP, 0.257 mM GTP, 16 mM creatine phosphate, 2.1 mM DTT, 0.41 mM spermidine, 0.3 mM L-type amino acid (20 species), 1 μM E-64, 0.005% NaN30.05% NP-40. In cell-free protein synthesis by the multilayer method, 125 μl of translation buffer was first added to a 96-well plate, and the translation solution was slowly layered from the bottom into each hole containing the translation buffer. This was carried out by incubating for 16 hours while keeping the temperature in a incubator.
[0138]
(2) SPR measurement method using a sensor chip on which DNA having a target sequence or a consensus target sequence is immobilized
According to the description of BIAapplications handbook, chapter 4.4, the following 53 types of double-stranded DNA biotinylated were immobilized separately on the surface of the sensor chip. The sensor chip used was SA type (manufactured by Biacore), and BIACORE 3000 (manufactured by Biacore) was used for SPR measurement and analysis.
[0139]
The relationship between known transcriptional regulators and designed or consensus target sequences and the functions of these transcriptional regulators are as follows.
[1] v-jun, c-jun, junB, junD, dJRA, c-fos, fosB1, fosB2, Fra-1, LRF-1, v-maf, mafG, NF-E2 p45, aNF-E2, fNF- E2, Nrf short form, GCN4, yAP-1, CREB-2, ATF-3, CRE-BP1, CRE-BP3, ATF-a, CREB-341, CREB-327, CREM, dCREB2, dCREB2-b, dCREB2- consensus target sequence of c, dCREB2-d, dCREB2-q, dCREB2-r, dCREB2-s: TGATGACGT (SEQ ID NO: 34)
[2] Consensus target sequence of C / EBPα, C / EBPβ, p34C / EBPβ, and CHOP-10: AAGTGGCGAAAGAGACA (SEQ ID NO: 35)
The above transcriptional regulatory factors are known to be involved in, for example, induction of insulin resistant diabetes, intermittent ketonuria, and multidrug resistance.
[3] VBP, Hlf, CPRF-2, EmBP-1b, EmBP-1b, GBF1, GBF2, GBF3, CPRF-1, TAF-1, HBP-1a, GBF9, GBF1, GBF12, CPRF-3, TGA1a, TGA1b , O2, STE4 consensus target sequence: AGAAGCACGTGGG (SEQ ID NO: 36)
[4] Consensus target sequence of OPI1, E2A, E47, ITF-2 / SEF2-1B, SEF-1A, MyoD, p42Tal-1: AACAGATGGGT (SEQ ID NO: 37)
[5] Target sequence of HEN-1: GGGGCGCAGCTGGCGCCC (SEQ ID NO: 38)
[6] AhR, Arnt consensus target sequence: GGGGATTGCCGTG (SEQ ID NO: 39)
The above transcriptional regulatory factors are universally expressed in most cells and tissues in adults, and are known to be involved in, for example, induction of drug metabolizing enzymes by dioxins.
[7] USF target sequence: GTCACGTGGT (SEQ ID NO: 40)
[8] Consensus target sequence of NF-1A1, NF-1A1.1, NF-1A6, NF-1B1, NF-1B1, NF-1B2, NF-1C2 / CTF-2, CTF-4, CTF-6: CTGTGGGGGTTTGGCACGGGGCCCA (SEQ ID NO: 41)
The above transcriptional regulators are not only involved in transcription of housekeeping genes, but also include transcription of many cell-specific genes such as activation of transcription by TGF-β and suppression of glucose transporter gene expression by insulin. It has been shown to be involved in the promotion and suppression of It is also suggested that it may interact with oncogene function.
[9] RF-X1 target sequence: GGTAACATAGCAAC (SEQ ID NO: 42)
[10] Consensus target sequence of AP2αA / AP-2α1, AP2α2, AP2α3, AP2α4, AP2αB, AP2β, AP2γ: CGCCCCCCGGCG (SEQ ID NO: 43)
[0140]
[11] Target sequence of GR: GGTACAAAATGTTCT (SEQ ID NO: 44)
The above transcriptional regulatory factors include, for example, promotion of Glucocorticoid release, stress response,
Glucocorticoid requirement in fetus, pulmonary hypoplasia, angiogenesis related cancer, uterine maladaptation in early pregnancy, growth hormone deficiency, fetal intrauterine growth retardation, uterine hypoxia, osteogenesis related disease, vitamin D It is known to be involved in the induction of
[12] AR target sequence: AACATTAGTTTCT (SEQ ID NO: 45)
[13] Target sequence of ER: AAGGGGAAAATGACCCC (SEQ ID NO: 46)
[14] RXR-α target sequence: GGTCATAGGGGT (SEQ ID NO: 47)
The above transcriptional regulators include juvenile-onset diabetes, obesity, drug metabolism in the liver, cancer, low HDL / low apoprotein, atherosclerosis, diarrhea, dyspepsia, malnutrition, multiple sclerosis, RA, SLE, insulin dependence It is known to be involved in the induction of cardiovascular diseases such as diabetes mellitus, Crohn's disease, asthma, high HDL, low β lipoproteinosis, high α lipoproteinosis, amyloidosis, arteriosclerosis and the like.
[15] Target sequence of PPARα: CTAGGGCAAAGGTCA (SEQ ID NO: 48)
As mentioned above, the above transcriptional regulators are mainly expressed in fat consuming organs such as liver, kidney, brown adipocytes, and other myocardium and gastrointestinal tract, and are used for fatty acid oxidation, ketone body production, apolipoprotein production, etc. It regulates the expression of various target genes involved in cardiovascular and carcinogenic mechanisms such as endocrine, sugar and lipid metabolism related to the onset of lifestyle-related diseases such as diabetes and obesity, as well as vascular function and inflammation. Known as a disease-related transcriptional regulator
[16] Target sequence of PPARγ: GGTCAAAGGTCA (SEQ ID NO: 49)
As described above, the above transcriptional regulators are expressed in adipocytes, adipose tissue, immune system organs, adrenal glands, and small intestine, and are thought to play an important role in adipocyte differentiation induction and fat synthesis. .
[17] COUP-TF1, HNF-4α1, HNF-4α2 target sequences: TGAACTTTGA (SEQ ID NO: 50)
[18] Target sequence of CF1: GGGGTCACC (SEQ ID NO: 51)
[19] GATA-1, GATA-2, GATA-3, GATA-4 consensus target sequence: CCAGATAAGG (SEQ ID NO: 52)
The above transcriptional regulators are expressed in internal organs such as blood cells, nervous system, heart and intestine, and differentiation, formation, maintenance, proliferation and apoptosis of blood cells, leukemia, spermatogenesis, differentiation of nervous system cells And has been shown to be involved in formation, organogenesis, and the like.
[20] AREA / NIT-2 target sequence: TATCTC (SEQ ID NO: 53)
[0141]
[21] Sp1 target sequence: GGGGGGGGGG (SEQ ID NO: 54)
The above transcriptional regulators have been shown to be involved in transcription of oncogenes and viral genes as well as transcription of housekeeping genes
[22] YY1 target sequence: CGGCCCATCTGGCT (SEQ ID NO: 55)
[23] Consensus target sequence of Egr-1, Egr-2, Egr-3: TGCGTGGGCG (SEQ ID NO: 56)
[24] Target sequence of Snail: CACCTGTTTTCA (SEQ ID NO: 57)
[25] Target sequence of CF2-II: GTATATATA (SEQ ID NO: 58)
[26] Target sequence of Evi-1: AGATA AGATAA (SEQ ID NO: 59)
[27] Ikaros, MZF-1 consensus target sequence: TTGGGAGG (SEQ ID NO: 60)
[28] Target sequence of Tramtrack69K: GGACCTGC (SEQ ID NO: 61)
[29] Target sequence of HOX9: TGACAGTTTAACGA (SEQ ID NO: 62)
[30] CDP target sequence: CCAATAATCGAT (SEQ ID NO: 63)
[0142]
[31] Target sequence of HNF-1A: GGTTAATGATTAACCAC (SEQ ID NO: 64)
[32] Consensus target sequence of Nkx-2.2, Nkx-2.5, TTF-1: TTAAGTGTT (SEQ ID NO: 65)
[33] Consensus target sequence of Oct-1A, Oct-1B, Oct-1C: ATGCAAAT (SEQ ID NO: 66)
[34] Consensus target sequence of Oct-2, Oct-2.1 / Oct-2B: TATTTGCAT (SEQ ID NO: 67)
[35] Consensus target sequence of Pax-3, Pax-6: CGTCACGCTTTGA (SEQ ID NO: 68)
[36] Target sequence of Pax-1: CCGTTCCGCTCTAGATAT (SEQ ID NO: 69)
[37] Consensus target sequence of HSF1 (short), HSF2, dHSF, fungal HSF: AGAAAGAAAAAGAAA (SEQ ID NO: 70)
The above transcription regulatory factors are universally expressed in most cells and tissues, and are known to be involved in, for example, the heat shock response.
[38] Consensus target sequence of c-Myb, A-Myb, v-Myb, P (long), P (short), C1 (long), C1 (short): AACGGGCCC (SEQ ID NO: 71)
[39] c-Ets-1_p54, Ets-1_δiV / VII, Ets-2, Elk-1, SAP-1, SAP-1b, Erg-1, p55erg, Fli-1b, E4TF1-60 / GABP-α, E74A Consensus target sequence: GACAGGAAGTG (SEQ ID NO: 72)
The above transcriptional regulatory factors are known to be involved in the induction of cancer, circadian rhythm-related diseases and the like.
[40] IRF-1, IRF-2 consensus target sequence: GAAAAGCGAAACC (SEQ ID NO: 73)
[0143]
[41] p50 target sequence: GGGGATTTTCC (SEQ ID NO: 74)
[42] NF-ATc, NF-Atp consensus target sequence: AGGAAAA (SEQ ID NO: 75)
[43] p91 (STAT1), p84 consensus target sequence: GAATTCCGGGAAATG (SEQ ID NO: 76)
It is known that the above transcriptional regulatory factors are stimulated and activated by various interferons and are involved in protection against viral and bacterial infections.
[44] Consensus target sequence of STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6: TTTCCCGGGAAATG (SEQ ID NO: 77)
The above transcription regulatory factors are known to be stimulated and activated by cytokines such as various interferons and various interleukins, and are involved in cancer, autoimmune diseases and inflammation.
[45] Target sequence of p53: GGACATGCCCGGGGCATGTC (SEQ ID NO: 78)
As mentioned above, the above transcriptional regulators are known to be tumor suppressor genes, are involved in signal transduction that causes apoptosis, and stop the cell cycle while cells perform DNA repair. Because of its function, it has attracted attention as a target molecule for therapeutic agents such as cancer.
[46] Target sequence of MEF-2A: CTCTAAAAAATA (SEQ ID NO: 79)
[47] SRF target sequence: CCATATATGGACAT (SEQ ID NO: 80)
[48] E2 target sequence: AACCAAAAACGGTAA (SEQ ID NO: 81)
[49] TBP target sequence: TATAAA (SEQ ID NO: 82)
[50] Consensus target sequence of SRY, Sox-5, Sox-9: AAAAAACAATAGGGG (SEQ ID NO: 83)
The above transcriptional regulatory factors are known to be involved in the development / differentiation of nervous system development / differentiation, cartilage formation, sex differentiation and the like.
[51] mat-Mc target sequence: TCATTGTT (SEQ ID NO: 84)
[52] CP1A, CP1B, CBF-C consensus target sequence: CTGATGTGCACC (SEQ ID NO: 85)
[53] Target sequence of AML1a: TGTGGT (SEQ ID NO: 86)
[0144]
First, regarding the DNAs having the 53 types of target sequences or consensus target sequences (SEQ ID NO: 34 to SEQ ID NO: 86), DNAs having biotin added to the 5 ′ side and DNAs having complementary base sequences thereof are individually separated by a conventional method. In total, 53 types of double-stranded DNA were prepared. On the other hand, the sensor cell used for the analysis has one flow cell divided into four. The flow cell 1 was used as a control section without immobilizing anything, and the flow cells 2, 3 and 4 were each immobilized with three types of the double-stranded DNA prepared above. In order to make the DNA immobilization density of the sensor chip constant, the value (D) obtained by dividing the increase in SPR response value (ΔRU-DNA) by DNA immobilization by the DNA molecular weight (MW) is constant in each flow cell. ΔRU-DNA was regulated. The remaining DNA was immobilized in the same manner.
[0145]
After the sensor chip was prepared as described above, the binding activity analysis with the protein of the present invention encoded by the clone cDNA was performed. There have already been many reports on the binding activity analysis between DNA and protein by the SPR method. In this example, the measurement was performed with reference to the measurement conditions of Molecular Microbiology, 36 (3), 557-569 (2000). First, the flow cell 1-2-3-4 is set to a flow path connected in series. The running buffer is allowed to flow at a constant flow rate (5 μL / min) to stabilize the SPR measurement value, and then the baseline value (SPR-baseline) of each flow cell is measured. Next, the protein solution is flowed at the same flow rate to form a specific bond between the protein molecule and the DNA strand. After injecting for a certain time, the SPR response value (SPR-bound) of each flow cell was measured.
[0146]
(4) Analysis method of measurement results obtained by SPR method
By subtracting the baseline value from the SPR response value ([SPR-bound]-[SPR-baseline]), the true binding amount (B) was determined, and further, the standardized value (nB) was determined.
From the measurement results, the protein (SEQ ID NO: 11 to 20) encoded by the clone of the present invention is a total of 53 types of target sequences or consensus target sequences (SEQ ID NO: 34 to SEQ ID NO: 86) of [1] to [53]. It was found to have a binding activity for at least one of the DNAs having (Table 1). In Table 1, A indicates that nB is 100 or more, B indicates that nB is 50 or more and less than 100, C indicates that nB is 5 or more and less than 50, and D indicates that nB is 0 to less than 5.
[0147]
[Table 1]
Figure 2005021093
[0148]
From Table 1, the protein encoded by c-nt2ri3007878 is the target sequence of TBP: TATAAA (SEQ ID NO: 82), consensus target sequence such as SRY: AAAAAACAATAGGG (SEQ ID NO: 83), mat-Mc target sequence: TCATTGTT (sequence) No. 84) showed a very high affinity. This indicates that the protein has DNA binding properties and may be a transcriptional regulator associated with diseases caused by abnormalities such as development / differentiation of the nervous system, cartilage formation, and sex differentiation. In addition, the protein exhibits high affinity for consensus target sequences such as Oct-2: TATTTGCAT (SEQ ID NO: 67), consensus target sequences such as HSF1 (short): AGAAAGAAAAAAAAA (SEQ ID NO: 70), and USF target sequence: GTCACGTGGT (SEQ ID NO: 40), GR target sequence: GGTACAAAATGTTCT (SEQ ID NO: 44), RXR-α target sequence: GGTCATAGGGGT (SEQ ID NO: 47), PPARα target sequence: CTAGGGCAAAGGTCA (SEQ ID NO: 48), c-Myb, etc. Consensus target sequences: AACGGGCCC (SEQ ID NO: 71), consensus target sequences such as c-Ets-1_p54: GACAGGAAGTG (SEQ ID NO: 72), consensus target sequences such as IRF-1 (SEQ ID NO: 7) 3) The p50 target sequence: GGGGATTTTCC (SEQ ID NO: 74), CP1A and other consensus target sequences: CTGATTGGCTACC (SEQ ID NO: 85) showed affinity.
[0149]
The proteins encoded by c-bramy2043103 are ER target sequence: AAGGGGAAAATGACCCC (SEQ ID NO: 46), RXR-α target sequence: GGTCATAGGGGT (SEQ ID NO: 47), PPAR-α: CTAGGGCAAAGGTCA (SEQ ID NO: 48), Pax-3 Consensus target sequences such as: CGTCACGCTTTGA (SEQ ID NO: 68), Pax-1 target sequence: CCGTCCCCTCTTAGATAT (SEQ ID NO: 69) and HSF1 and other consensus target sequences: AGAAAGAAAAAAAAA (SEQ ID NO: 70). This indicates that the protein has DNA-binding properties and may be a transcriptional regulator associated with diseases caused by abnormalities such as lipid metabolism, drug metabolism, and muscle formation, such as diseases such as lifestyle-related diseases.
[0150]
The protein encoded by c-brassn2013753 showed very high affinity to consensus target sequences such as GATA-1: CCAGATAAGG (SEQ ID NO: 52), and AREA / NIT-2 target sequence: TATCTC (SEQ ID NO: 53) . This indicates that the protein has DNA-binding properties and may be a transcriptional regulator associated with diseases caused by abnormalities such as hematopoietic stem cell differentiation, hematopoietic cells, neural cells, circulatory organs, and apoptosis control. . In addition, the protein shows high affinity for the target sequence of HNF-1A: GGTTAATGATTACCACC (SEQ ID NO: 64), the target sequence of PPARγ: GGTCAAAGGTCCA (SEQ ID NO: 49), and the target sequence of CF2-II: GTATATATA (SEQ ID NO: 58 ), Evi-1 target sequence: AGATAGATAAA (SEQ ID NO: 59), consensus target sequence such as Nkx-2.2: TTAAGTGGTT (SEQ ID NO: 65), consensus target sequence such as Oct-1A: ATGCAAAT (SEQ ID NO: 66), Consensus target sequences such as IRF-1: GAAAAGCGGAAACC (SEQ ID NO: 73), p50 target sequence: GGGACTTTCC (SEQ ID NO: 74), TBP target sequences: TATAAA (SEQ ID NO: 82), SRY, etc. Column: AAAAAACAATAGGG (SEQ ID NO: 83), the target sequence of AML1a: showed affinity TGTGGT (SEQ ID NO: 86).
[0151]
The protein encoded by c-brassn2017530 is Sp1 target sequence: GGGGGGGGGG (SEQ ID NO: 54), Tramtrack69K target sequence: GGACCCTGC (SEQ ID NO: 61), HOX9 target sequence: TGACAGTTTAACGA (SEQ ID NO: 62) and CDP target sequence: It showed high affinity for CCAATAATCGAT (SEQ ID NO: 63). This indicates that the protein has DNA-binding properties and is a transcriptional regulator associated with diseases such as hematopoietic stem cell differentiation, apoptosis control, cytokine production, and other diseases such as viral diseases, bacterial diseases, and cancers. There is a possibility. In addition, the protein includes consensus target sequences such as OPI1: AACAGATGGGT (SEQ ID NO: 37), HEN-1 target sequence: GGGGCGGCAGCTGCGGCCCC (SEQ ID NO: 38), AhR and other consensus target sequences: GGGGATTGCCGTG (SEQ ID NO: 39), p91 ( Consensus target sequences such as STAT1): GAATTCCGGGAAATG (SEQ ID NO: 76), consensus target sequences such as STAT2: TTTCCCGGGAAATG (SEQ ID NO: 77), and p53 target sequence: GGACATGCCCGGGGCATGGTC (SEQ ID NO: 78).
[0152]
The proteins encoded by c-hcho20000473 are HEN-1 target sequence: GGGGCGGCGCTGCGGCCC (SEQ ID NO: 38), consensus target sequence such as AhR: GGGGATTGCCGTG (SEQ ID NO: 39), USF target sequence: GTCACGTGGT (SEQ ID NO: 40), NF Consensus target sequences such as -1A1: CGTTGGGGTTTGGCACGGGGCCA (SEQ ID NO: 41), RF-X1 target sequence: GGTAACATAGGCAAC (SEQ ID NO: 42), Sp1 target sequences: GGGGGGGGGGGG (SEQ ID NO: 54), Egr-1 consensus target sequences: TGCGTGGGCG (SEQ ID NO: 56), p50 target sequence: GGGGATTTTCC (SEQ ID NO: 74), NF-ATc target sequence: AGGAAAA (sequence) No. 75), consensus target sequence such as p91: GAATTCCGGGAAATG (SEQ ID NO: 76), consensus target sequence such as STAT2: TTTCCCGGGAAATG (SEQ ID NO: 77) and p53 target sequence: GGACATGCCCGGGGCATGTTC (SEQ ID NO: 78) Indicated. This indicates that the protein has DNA-binding properties, and transcriptional regulation associated with diseases such as cell cycle, inflammation, apoptosis control, immune reaction, drug metabolism, cytokine production, diseases such as viral diseases, cancer, etc. It may be a factor. In addition, the protein has a high affinity for the target sequence of AREA / NIT-2: TATCTC (SEQ ID NO: 53), a consensus target sequence such as C / EBPα: AAGTGGCGAAAGAGACA (SEQ ID NO: 35), and a consensus target such as IRF-1. The sequence: Affinity was shown for GAAAAGCGAAACC (SEQ ID NO: 73).
[0153]
Proteins encoded by c-testi4004626 are YY1 target sequence: CGGCCCATCTTGCT (SEQ ID NO: 55), consensus target sequences such as Egr-1: TGCGTGGGCG (SEQ ID NO: 56), Snail target sequence: CACCTGTTTTCA (SEQ ID NO: 57), CF2 -II target sequences: GTATATATA (SEQ ID NO: 58), IRF-1, IRF-2 consensus target sequences: GAAAAGCGAAACC (SEQ ID NO: 73), NF-ATc and other consensus target sequences: AGGAAAA (SEQ ID NO: 75), and p91 The consensus target sequence such as: GAATTCCGGGAAATG (SEQ ID NO: 76) showed affinity. This indicates that the protein has DNA-binding properties and may be a transcriptional regulator associated with diseases caused by abnormalities such as immune responses and cytokine production.
[0154]
The protein encoded by c-trach 3014316 is a consensus target sequence such as GATA-1: consensus target sequence such as CCATATAAGG (SEQ ID NO: 52), Nkx-2.2, etc .: TTAAGTGGTT (SEQ ID NO: 65) and Oct-1A The sequence: ATGCAAAT (SEQ ID NO: 66) showed high affinity. This indicates that the protein has DNA-binding properties and may be a transcriptional regulator associated with diseases caused by abnormalities such as hematopoietic stem cell differentiation, hematopoietic cells, neural cells, circulatory organs, and apoptosis control. . Further, the protein includes consensus target sequences such as VBP: AGAAGCACGTGGG (SEQ ID NO: 36), USF target sequence: GTCACGTGGT (SEQ ID NO: 40), NF-1A1 and other consensus target sequences: CGTTGGGGTTTGGCACGGGGCCA (SEQ ID NO: 41), PPARα. Target sequence: CTAGGGCAAAGGTCA (SEQ ID NO: 48), PPARγ target sequence: GGTCAAAGGTCA (SEQ ID NO: 49), Snail target sequence: CACCTGTTTTCA (SEQ ID NO: 57), CDP target sequences: CCAATAATCGAT (SEQ ID NO: 63), HSF1 (short) Consensus target sequences such as: AGAAAGAAAAAGAAA (SEQ ID NO: 70), c-Ets-1_p54 and other consensus target sequences: GACAGG AAGTG (SEQ ID NO: 72), consensus target sequences such as IRF-1: GAAAAGCGGAAACC (SEQ ID NO: 73), consensus target sequences such as p91 (STAT1): GAATTCCGGGAAATG (SEQ ID NO: 76), consensus target sequences such as STAT2: TTTCCCGGGAAATG (sequence) No. 77), SRF target sequence: CCATATATGGACAT (SEQ ID NO: 80), E2 target sequence: AACCAAAAACGGTAA (SEQ ID NO: 81).
[0155]
The proteins encoded by c-best2001444 are NF-1A1 and other consensus target sequences: CTGTGGGGTTTGGCACGGGGCCA (SEQ ID NO: 41), RF-X1 target sequences: GGTAACATAGCAAC (SEQ ID NO: 42), YY1 target sequence: CGCCCCATCTTGGC (SEQ ID NO: 55) Snail target sequence: CACCTGTTTTCA (SEQ ID NO: 57), Evi-1 target sequence: AGATAGATATA (SEQ ID NO: 59), Ikaros et al. Consensus target sequence: TTGGGAGG (SEQ ID NO: 60), HNF-1A target sequence: GGTTAATGATTATAACCAC ( SEQ ID NO: 64), consensus target sequences such as Nkx-2.2: consensus such as TTAAGTGTT (SEQ ID NO: 65), Oct-1A Consensus target sequence: ATGCAAAT (SEQ ID NO: 66), consensus target sequence such as Oct-2: TATTTGCAT (SEQ ID NO: 67), consensus target sequence such as Pax-3: CGTCACGCTTTGA (SEQ ID NO: 68), Pax-1 target sequence: CCGTCCCGCTCTAGATAT (SEQ ID NO: 69), consensus target sequences such as NF-ATc: AGGAAAA (SEQ ID NO: 75), MEF-2A target sequence: CCTAAAAATA (SEQ ID NO: 79), SRF target sequences: CCATATATGGACAT (SEQ ID NO: 80) and E2 The target sequence of: AACCAAAAACGGTAA (SEQ ID NO: 81) showed affinity. Therefore, the protein has DNA binding properties, and is caused by diseases such as proliferation of hematopoietic cells and hepatocytes, generation / differentiation of immune system cells, lipid metabolism, muscle formation, such as diseases such as lifestyle-related diseases. It may be an associated transcriptional regulator.
[0156]
Example 5 Measurement of transcriptional regulatory activity (analysis of regulatory activity on disease-related transcriptional regulatory factor)
(1) Preparation of the protein of the present invention using a cell-free protein synthesis system
The regulatory activity of the protein encoded by the cDNA of the present invention was further analyzed for disease-related transcriptional regulatory factors. The protein encoded by the cDNA of each clone was prepared according to the method of Example 4 (1).
[0157]
(2) Preparation of analysis plate
The DNA used in the measurement system for the regulatory action activity of a transcriptional regulatory factor on a disease-related transcriptional regulatory factor has a base sequence to which the disease-related transcriptional regulatory factor binds, and biotin (denoted as Bio) is present on the 5 ′ side. Double-stranded DNA was used by annealing the added single-stranded DNA (denoted as oligo-A) and the single-stranded DNA having its complementary sequence (oligo-B) as described. The DNA sequence used is described below.
[0158]
Double-stranded DNA obtained by annealing biotinylated DNA containing SEQ ID NO: 87 and SEQ ID NO: 88 as a sequence recognized by the disease-related transcription regulator PPARγ
oligo-A; 5'-Bio-GGAACTAGGTCAAAGGTCATCCCCCT-3 '(SEQ ID NO: 87)
oligo-B; 3'-CCTTGATCCAGTTTCCAGTAGGGGA-5 '(SEQ ID NO: 88)
[0159]
Double-stranded DNA obtained by annealing biotinylated DNA containing SEQ ID NO: 89 and SEQ ID NO: 90 as a sequence recognized by the disease-related transcription regulatory factor p53
oligo-A; 5'-Bio-CTTGGACATGCCCGGGGCATGTCCCTC-3 '(SEQ ID NO: 89)
oligo-B; 3'-GAACCTGTACGGGGCCCGTACAGGGAG-5 '(SEQ ID NO: 90)
[0160]
Double-stranded DNA obtained by annealing biotinylated DNA containing SEQ ID NO: 91 and SEQ ID NO: 92 as a sequence recognized by the disease-related transcriptional regulatory factor NFκB
oligo-A; 5'-Bio-AGTTGAGGGGACTTTCCCAGC-3 '(SEQ ID NO: 91)
oligo-B; 3'-TCAACTCCCCCTGAAAGGGTCCG-5 '(SEQ ID NO: 92)
[0161]
Double-stranded DNA obtained by annealing biotinylated DNA containing SEQ ID NO: 93 and SEQ ID NO: 94 as a sequence recognized by the disease-related transcription regulatory factor AP-1
oligo-A; 5'-Bio-CGCTTGATGAGGTCAGCCCGGAA-3 '(SEQ ID NO: 93)
oligo-B; 3'-GCGAACTACTCAGGTCGCCCTT-5 '(SEQ ID NO: 94)
[0162]
Double-stranded DNA obtained by annealing biotinylated DNA containing SEQ ID NO: 95 and SEQ ID NO: 96 as a sequence recognized by the disease-related transcriptional regulatory factor HIF-1
oligo-A; 5'-Bio-GATCCGCCCTACGTGCTGTCTCGAGATC-3 '(SEQ ID NO: 95)
oligo-B; 3'-CTAGCGGGATGCACGACAGAGCTCAG-5 '(SEQ ID NO: 96)
[0163]
Double-stranded DNA obtained by annealing biotinylated DNA containing SEQ ID NO: 97 and SEQ ID NO: 98 as a sequence recognized by the disease-related transcriptional regulatory factor CREB
oligo-A; 5'-Bio-AGAGATTGCCCGACGTCAGAGAGCTAG-3 '(SEQ ID NO: 97)
oligo-B; 3'-TCTCTAACGGGACTGCAGTCTCTCGATC-5 '(SEQ ID NO: 98)
[0164]
A 96-well plate coated with streptavidin according to the method of BioTechniques, 32: 1168-1177 (2002) {biotin binding capacity 20 ng / well (80 pmol / well) Well), streptavidin-coated area 300 μl} or a plate attached to TransAM kit (ACTIVE MOTIF) or BD Mercury TransFactor kit was used as appropriate.
[0165]
(3) Analysis of regulatory activity against PPARγ
As an analysis sample, 1 μl of PMA-treated THP-1 cell nuclear extract solution (2.5 mg / ml ACTIVE MOTIF) containing PPARγ is diluted with 9 μl of a diluted solution {20 mM Hepes (pH 7.5), 400 mM NaCl, 20% glycerol, 0.1 mM. EDTA, 10 mM NaF, 10 μM Na2MoO41 mM NaVO3After mixing with 10 mM pNPP, 10 mM b-glycerophosphate, 1 mM DTT}, 35 μl of reaction solution {10 mM Hepes (pH 7.5), 4% glycerol, 50 mM NaCl, 0.5 mM EDTA, 1 mM MgCl210 μg / ml Herring sperm} and 5 μl of a cofactor solution containing the protein of the present invention prepared by the method of Example 5 (1) were used. As a positive sample, a mixture of 1 μl of PMA-treated THP-1 cell nucleus extraction solution, 9 μl diluted solution, 35 μl reaction solution and 5 μl of cofactor solution not containing the protein of the present invention was used. Further, as a negative sample, a 10 μl diluted solution, a 35 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention were mixed, and as a measurement blank sample, a 10 μl diluted solution and a 40 μl reaction solution were mixed. Each sample was reacted at room temperature for 30 minutes after mixing. Next, 50 μl of the above sample was added per well to the 96-well plate prepared in Example 5 (2) to which double-stranded DNA recognized by PPARγ was bound, and reacted at room temperature for 1 hour.
[0166]
Thereafter, the well is thoroughly washed with a washing buffer solution {10 mM phosphate buffer (pH 7.5), 50 mM NaCl, 0.1% Tween 20, 2.7 mM KCl}, and an antibody diluent {10 mM phosphate buffer ( 100 μl of an anti-PPAR goat antibody (0.2 μg / ml) dissolved in pH 7.5), 50 mM NaCl, 2.7 mM KCl, 10 mg / ml BSA} was added to each well, and further reacted at room temperature for 1 hour. Thereafter, the plate was thoroughly washed with a washing buffer, and 100 μl of HRP (horseradish peroxidase) -labeled anti-goat IgG antibody diluted 1000-fold with an antibody diluent was added to each well, followed by further reaction at room temperature for 1 hour. . After sufficient washing with a washing buffer, 100 μl of 1% DMSO solution containing a coloring substrate (TMB) was added to each well and reacted at room temperature for color development. Thereafter, the reaction was stopped by adding 100 μl of 0.5 M sulfuric acid solution to each well, and measurement was performed at a measurement wavelength of 450 nm and a reference wavelength of 655 nm. As the analysis result, the ratio of the difference between the measured value of the analyzed sample and the measured value of the positive sample with respect to the difference between the measured value of the positive sample and the negative sample was displayed as a percentage (%). That is, {(analysis sample value−positive sample value) / (positive sample value−negative sample value)} × 100. The results are shown in the “PPARγ evaluation” column of Table 2. In Table 2, -A is less than -50%, -B is -50% or more and less than -30%, -C is -30% or more and less than -10%, +/- D is -10% or more and 10% or more. Less than, + C is 10% or more and less than 30%, + B is 30% or more and less than 50%, and + A is 50% or more.
[0167]
[Table 2]
Figure 2005021093
[0168]
The protein encoded by 4 clones of c-nt2ri3007878, c-brsn2017530, c-hchon20000473, and c-best2001444 has an activity to enhance or suppress the action of PPAR, and it may cause diabetes caused by abnormal endocrine / sugar / lipid metabolism, etc. It was speculated that it is related to lifestyle-related diseases such as obesity, circulatory system diseases due to abnormal vascular function, inflammation, cancer and the like.
[0169]
(4) Analysis of regulatory activity against p53
As an analysis sample, H containing activated p532O21 μl of treated MCF-7 cell nucleus extraction solution (2.5 mg / ml ACTIVE MOTIF) in 9 μl diluted solution {20 mM Hepes (pH 7.5), 400 mM NaCl, 20% glycerol, 0.1 mM EDTA, 10 mM NaF, 10 μM Na2MoO41 mM NaVO3After mixing with 10 mM pNPP, 10 mM b-glycerophosphate, 1 mM DTT}, 35 μl of reaction solution {20 mM Hepes (pH 7.5), 10% glycerol, 5 mM KCl, 0.5 mM EDTA, 5 mM MgCl2A mixture of 1 mM DTT, 0.17 μg / ml poly [d (IC)]} and 5 μl of a cofactor solution containing the protein of the present invention prepared by the method of Example 5 (1) was used. H as a positive sample2O2A mixture of 1 μl of a treated MCF-7 cell nucleus extraction solution, 9 μl diluted solution, 35 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention was used. Further, as a negative sample, a 10 μl diluted solution, a 35 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention were mixed, and as a measurement blank sample, a 10 μl diluted solution and a 40 μl reaction solution were mixed. Each sample was reacted at room temperature for 30 minutes after mixing. Next, 50 μl of the above sample was added per well to the 96-well plate prepared in Example 5 (2) to which double-stranded DNA recognized by p53 was bound, and reacted at room temperature for 1 hour. Thereafter, the well is sufficiently washed with a washing buffer solution {10 mM phosphate buffer (pH 7.5), 50 mM NaCl, 0.1% Tween 20, 2.7 mM KCl}, and an antibody diluent {10 mM phosphate buffer 100 μl of anti-p53 rabbit antibody (0.2 μg / ml) dissolved in (pH 7.5), 50 mM NaCl, 2.7 mM KCl, 10 mg / ml BSA} was added to each well and further reacted at room temperature for 1 hour.
[0170]
Thereafter, the plate was thoroughly washed with a washing buffer solution, 100 μl of HRP (horseradish peroxidase) -labeled anti-rabbit IgG antibody diluted 1000 times with an antibody diluent was added to each well, and further reacted at room temperature for 1 hour. After thorough washing with a washing buffer, 100 μl of 1% DMSO solution containing a coloring substrate (TMB) was added to each well and reacted at room temperature for color development. Thereafter, 100 μl of 0.5 M sulfuric acid solution was added to each well to stop the reaction, and measurement was performed at a measurement wavelength of 450 nm and a reference wavelength of 655 nm. As the analysis result, the ratio of the difference between the measured value of the analyzed sample and the measured value of the positive sample with respect to the difference between the measured value of the positive sample and the negative sample was displayed as a percentage (%). That is, {(analysis sample value−positive sample value) / (positive sample value−negative sample value)} × 100. The results are shown in the “p53 evaluation” column of Table 2. In Table 2, -A is less than -50%, -B is -50% or more and less than -30%, -C is -30% or more and less than -10%, +/- D is -10% or more and 10% or more. Less than, + C is 10% or more and less than 30%, + B is 30% or more and less than 50%, and + A is 50% or more.
[0171]
It was speculated that the protein encoded by the three clones c-nt2ri3007878, c-brsn2017530, and c-testi4004626 has an activity to enhance or suppress the action of p53 and is related to cancer and the like.
[0172]
(5) Analysis of regulatory activity against NFκB
As an analysis sample, 1 μl of a TNF-α-treated HeLa cell nucleus extraction solution (2.5 mg / ml ACTIVE MOTIF) containing NFκB was added to 19 μl of a diluted solution {20 mM Hepes (pH 7.5), 350 mM NaCl, 20% glycerol, 1% Igepal. -CA630, 1 mM MgCl2, 0.5 mM EDTA, 0.1 mM EGTA, 5 mM DTT} followed by 25 μl of reaction solution {4 mM Hepes (pH 7.5), 8% glycerol, 120 mM KCl, 1% BSA, 2 mM DTT, 10 μg / ml Herring sperm } And 5 μl of a cofactor solution containing the protein of the present invention prepared by the method of Example 5 (1) was used. As a positive sample, a mixture of 1 μl of a TNF-α-treated HeLa cell nucleus extraction solution, a 19 μl diluted solution, a 25 μl reaction solution, and 5 μl of a cofactor solution not containing the protein of the present invention was used. A negative sample was prepared by mixing a 20 μl diluted solution, a 25 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention, and a measurement blank sample was prepared by mixing a 20 μl diluted solution and a 30 μl reaction solution. Each sample was reacted at room temperature for 30 minutes after mixing. Next, 50 μl of the above sample was added per well to the 96-well plate prepared in Example 5 (2) to which the double-stranded DNA recognized by NFκB was bound, and reacted at room temperature for 1 hour.
[0173]
Thereafter, the wells are sufficiently washed with a washing buffer solution {10 mM phosphate buffer (pH 7.5), 50 mM NaCl, 0.1% Tween 20}, and an antibody diluent {10 mM phosphate buffer (pH 7.5), 100 μl of anti-NFκB antibody (0.2 μg / ml) dissolved in 50 mM NaCl, 0.1% Tween 20} was added to each well and allowed to react at room temperature for 1 hour. Thereafter, the plate was sufficiently washed with a washing buffer solution, 100 μl of HRP (horseradish peroxidase) -labeled anti-IgG antibody diluted with an antibody dilution solution 1000 times was added to each well, and further reacted at room temperature for 1 hour. After thorough washing with a washing buffer, 100 μl of 1% DMSO solution containing a coloring substrate (TMB) was added to each well and reacted at room temperature for color development. Thereafter, the reaction was stopped by adding 100 μl of 0.5 M sulfuric acid solution to each well, and measurement was performed at a measurement wavelength of 450 nm and a reference wavelength of 655 nm. As the analysis result, the ratio of the difference between the measured value of the analyzed sample and the measured value of the positive sample with respect to the difference between the measured value of the positive sample and the negative sample was displayed as a percentage (%). That is, {(analysis sample value−positive sample value) / (positive sample value−negative sample value)} × 100. The results are shown in the column of “NFκB evaluation” in Table 2. In Table 2, -A is less than -50%, -B is -50% or more and less than -30%, -C is -30% or more and less than -10%, +/- D is -10% or more and 10% or more. Less than, + C is 10% or more and less than 30%, + B is 30% or more and less than 50%, and + A is 50% or more.
[0174]
Proteins encoded by the three clones c-testi 4004626, c-trach 3014316, and c-best 2001444 have an activity to enhance or suppress the action of NFκB, and are immune diseases such as rheumatoid arthritis and osteoarthritis, inflammatory diseases It was speculated to be related to cancer and the like.
[0175]
(6) Analysis of regulatory activity against disease-related transcriptional regulator AP-1
As analysis samples, 1 μl of PMA containing activated AP-1 and Inmycin-treated WI-38 cell nuclear extract (2.5 mg / ml ACTIVE MOTIF) was diluted with 19 μl of a diluted solution {20 mM Hepes (pH 7.5), 400 mM NaCl, 20 % Glycerol, 0.1 mM EDTA, 10 mM NaF, 10 μM Na2MoO41 mM NaVO3After mixing with 10 mM pNPP, 10 mM b-glycophosphate, 1 mM DTT}, 25 μl reaction solution {10 mM Hepes (pH 7.5), 12% glycerol, 8 mM NaCl, 0.2 mM EDTA, 0.1% BSA, 1 mM DTT, A mixture of 0.17 μg / ml poly [d (IC)]} and 5 μl of a cofactor solution containing the protein of the present invention prepared by the method of Example 5 (1) was used. As a positive sample, PMA containing activated AP-1 and 1 μl of Inmycin-treated WI-38 cell nuclear extract solution, 19 μl diluted solution, 25 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention were used. As a negative sample, a 20 μl diluted solution, a 25 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention were mixed, and as a measurement blank sample, a 20 μl diluted solution and a 30 μl reaction solution were mixed. Each sample was reacted at room temperature for 30 minutes after mixing. Next, 50 μl of the above sample was added per well to the 96-well plate prepared in Example 5 (2) to which the double-stranded DNA recognized by AP-1 was bound, and reacted at room temperature for 1 hour. Thereafter, the well is thoroughly washed with a washing buffer solution {10 mM phosphate buffer (pH 7.5), 50 mM NaCl, 0.1% Tween 20, 2.7 mM KCl}, and an antibody diluent {10 mM phosphate buffer ( 100 μl of anti-phosphorylated-c-Jun antibody (0.4 μg / ml) dissolved in pH 7.5), 50 mM NaCl, 2.7 mM KCl, 1% BSA} was added to each well and allowed to react at room temperature for 1 hour. It was.
[0176]
Thereafter, the plate was thoroughly washed with a washing buffer solution, 100 μl of HRP (horseradish peroxidase) -labeled anti-IgG antibody diluted 1000 times with an antibody diluent was added to each well, and further reacted at room temperature for 1 hour. After thorough washing with a washing buffer, 100 μl of 1% DMSO solution containing a coloring substrate (TMB) was added to each well and reacted at room temperature for color development. Thereafter, the reaction was stopped by adding 100 μl of 0.5 M sulfuric acid solution to each well, and measurement was performed at a measurement wavelength of 450 nm and a reference wavelength of 655 nm. As the analysis result, the ratio of the difference between the measured value of the analyzed sample and the measured value of the positive sample with respect to the difference between the measured value of the positive sample and the negative sample was displayed as a percentage (%). That is, {(analysis sample value−positive sample value) / (positive sample value−negative sample value)} × 100. The result is shown in the column of “AP-1 evaluation” in Table 2. In Table 2, -A is less than -50%, -B is -50% or more and less than -30%, -C is -30% or more and less than -10%, +/- D is -10% or more and 10% or more. Less than, + C is 10% or more and less than 30%, + B is 30% or more and less than 50%, and + A is 50% or more.
[0177]
A protein encoded by 4 clones of c-nt2ri3007878, c-hchon20000473, c-testi4004626, c-trac3014316 has an activity to enhance or suppress the action of AP-1, and is related to inflammatory diseases and cancer It was speculated.
[0178]
(7) Analysis of regulatory activity against disease-related transcriptional regulatory factor HIF-1
CoCl containing HIF-1 as analysis sample21 μl of treated Cos-7 cell nuclear extraction solution (2.5 mg / ml ACTIVE MOTIF) 9 μl of diluted solution {20 mM Hepes (pH 7.5), 400 mM NaCl, 20% glycerol, 0.1 mM EDTA, 10 mM NaF, 10 μM Na2MoO41 mM NaVO3After mixing with 10 mM pNPP, 10 mM b-glycophosphate, 1 mM DTT}, 35 μl of reaction solution {10 mM Hepes (pH 7.5), 5% glycerol, 50 mM NaCl, 1 mM EDTA, 10 mg / ml BSA, 1 mM DTT} and Examples A mixture of 5 μl of a cofactor solution containing the protein of the present invention prepared by the method of 5 (1) was used. As a positive sample, CoCl containing HIF-12A mixture of 1 μl of treated Cos-7 cell nucleus extraction solution, 9 μl diluted solution, 35 μl reaction solution and 5 μl of cofactor solution not containing the protein of the present invention was used. As a negative sample, a 10 μl diluted solution, a 35 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention were mixed, and as a measurement blank sample, a 10 μl diluted solution and a 40 μl reaction solution were mixed. Each sample was reacted at room temperature for 30 minutes after mixing. Next, 50 μl of the above sample was added per well to the 96-well plate prepared in Example 5 (2) and bound with the double-stranded DNA recognized by HIF-1, and reacted at room temperature for 1 hour. Thereafter, the well is sufficiently washed with a washing buffer solution {10 mM phosphate buffer (pH 7.5), 50 mM NaCl, 0.1% Tween 20, 2.7 mM KCl}, and an antibody diluent {10 mM phosphate buffer 100 μl of anti-HIF-1 mouse antibody (0.25 μg / ml) dissolved in (pH 7.5), 50 mM NaCl, 2.7 mM KCl, 10 mg / ml BSA} was added to each well and allowed to react at room temperature for 1 hour. It was.
[0179]
Thereafter, the plate was thoroughly washed with a washing buffer, and 100 μl of HRP (horseradish peroxidase) -labeled anti-mouse IgG antibody diluted 1000-fold with an antibody dilution solution was added to each well and further reacted at room temperature for 1 hour. . After thorough washing with a washing buffer, 100 μl of 1% DMSO solution containing a coloring substrate (TMB) was added to each well and reacted at room temperature for color development. Thereafter, 100 μl of 0.5 M sulfuric acid solution was added to each well to stop the reaction, and measurement was performed at a measurement wavelength of 450 nm and a reference wavelength of 655 nm. As the analysis result, the ratio of the difference between the measured value of the analyzed sample and the measured value of the positive sample with respect to the difference between the measured value of the positive sample and the negative sample was displayed as a percentage (%). That is, {(analysis sample value−positive sample value) / (positive sample value−negative sample value)} × 100. The results are shown in the column of “HIF-1 evaluation” in Table 2. In Table 2, -A is less than -50%, -B is -50% or more and less than -30%, -C is -30% or more and less than -10%, +/- D is -10% or more and 10% or more. Less than, + C is 10% or more and less than 30%, + B is 30% or more and less than 50%, and + A is 50% or more.
[0180]
The protein encoded by the three clones c-brssn2017530, c-testi4004626, c-trac3014316 has an activity to enhance or suppress the action of HIF-1, resulting from abnormal angiogenesis, abnormal intracellular oxidation, etc. It was speculated that it is related to ischemic disease, anemia, hypoxia, diabetic retinopathy, cardiovascular disease, cancer and the like.
[0181]
(8) Analysis of regulatory activity on the disease-related transcriptional regulatory factor CREB
As an analysis sample, 1 μl of Forskolin-treated WI-38 cell nuclear extract solution (2.5 mg / ml ACTIVE MOTIF) containing CREB was added to 19 μl of a diluted solution {20 mM Hepes (pH 7.5), 400 mM NaCl, 20% glycerol, 0.1 mM. EDTA, 10 mM NaF, 10 μM Na2MoO41 mM NaVO3After mixing with 10 mM pNPP, 10 mM b-glycophosphate, 1 mM DTT, 25 μl reaction solution (10 mM Hepes (pH 7.5), 4% glycerol, 50 mM NaCl, 0.5 mM EDTA, 1 mM MgCl21% BSA, 1 mM DTT, 10 μg / ml Herring sperm) and 5 μl of a cofactor solution containing the protein of the present invention prepared by the method of Example 5 (1) were used. As a positive sample, a mixture of 1 μl of Forskolin-treated WI-38 cell nucleus extraction solution, 19 μl diluted solution, 25 μl reaction solution and 5 μl of cofactor solution not containing the protein of the present invention was used. A negative sample was prepared by mixing a 20 μl diluted solution, a 25 μl reaction solution and 5 μl of a cofactor solution not containing the protein of the present invention, and a measurement blank sample was prepared by mixing a 20 μl diluted solution and a 30 μl reaction solution. Each sample was reacted at room temperature for 30 minutes after mixing. Next, 50 μl of the above sample was added per well to the 96-well plate prepared in Example 5 (2) to which the double-stranded DNA recognized by CREB was bound, and reacted at room temperature for 3 hours.
[0182]
Thereafter, the well is sufficiently washed with a washing buffer solution {10 mM phosphate buffer (pH 7.5), 151 mM NaCl, 0.1% Tween 20, 2.7 mM KCl}, and an antibody diluent {10 mM phosphate buffer is added. 100 μl of anti-CREB antibody (0.2 μg / ml) dissolved in (pH 7.5), 151 mM NaCl, 2.7 mM KCl, 1% BSA} was added to each well and further reacted at room temperature for 1 hour. Thereafter, the plate was thoroughly washed with a washing buffer solution, 100 μl of HRP (horseradish peroxidase) -labeled anti-IgG antibody diluted 1000 times with an antibody diluent was added to each well, and further reacted at room temperature for 1 hour. After thorough washing with a washing buffer, 100 μl of 1% DMSO solution containing a coloring substrate (TMB) was added to each well and reacted at room temperature for color development. Thereafter, 100 μl of 0.5 M sulfuric acid solution was added to each well to stop the reaction, and measurement was performed at a measurement wavelength of 450 nm and a reference wavelength of 655 nm. As the analysis result, the ratio of the difference between the measured value of the analyzed sample and the measured value of the positive sample with respect to the difference between the measured value of the positive sample and the negative sample was displayed as a percentage (%). That is, {(analysis sample value−positive sample value) / (positive sample value−negative sample value)} × 100. The result is shown in the column of “CREB evaluation” in Table 2. In Table 2, -A is less than -50%, -B is -50% or more and less than -30%, -C is -30% or more and less than -10%, +/- D is -10% or more and 10% or more. Less than, + C is 10% or more and less than 30%, + B is 30% or more and less than 50%, and + A is 50% or more.
[0183]
The protein encoded by two clones of c-testi 4004626 and c-trac 3014316 has an activity to enhance or suppress the action of CREB and is related to central diseases such as memory impairment, cardiovascular diseases, diabetes, etc. Was guessed.
[0184]
Example 6 Human tissue expression analysis
In order to examine the tissue expression variation of mRNA encoding the human protein of the present invention in normal humans and diseased patients, the PCR method was performed according to a conventional method (Higuchi R, et al., Biotechnology, 11: 1026-30 (1993)). Tissue expression analysis using was performed.
[0185]
(1) cDNA synthesis
Commercially available mRNAs extracted and purified from 9 human tissues (Biochain: normal brain (# 510005), normal hippocampus (# 510068), normal thalamus (# 510077), normal kidney (# 510030), normal liver (# 510031), normal pancreas (# 510038), normal skeletal muscle (# 510047), normal fat (# 510018), normal spleen (# 510049), and human normal peripheral blood leukocytes commercially available total RNA (manufactured by Unitech) From the purified mRNA, reverse cDNA was synthesized by reverse transcription using oligo dT as a primer, and each cDNA was synthesized from 10 human tissues (manufactured by Clontech: normal breast and breast cancer ( # HP102B), normal colon and colon cancer (# HP102C), normal lung and lung cancer (# HP104L) , Normal stomach and gastric cancer (# HP101S), Bio-Chain Co., Ltd. normal frontal lobe (# 510068), using the Alzheimer's disease frontal lobe (# 550901).
[0186]
(2) Quantification by PCR method
Expression of mRNA encoding the human protein of the present invention (c-nt2ri3007878, c-febra2001620) was performed using a light cycler quantitative PCR apparatus (Roche Diagnostics) and a LightCycler-FastStart DNA master SYBR Green I reagent. Quantified according to the protocol attached to the product. The synthetic DNA sequence used for quantitative PCR is shown below.
c-nt2ri3007878
5'-side primer: GAAGTCGAACTGCCCAAAGGG (SEQ ID NO: 99)
3 'primer: ATTCCCCGTCAAAGGAGGT (SEQ ID NO: 100)
c-febra2001620
5 'primer: GCATCCATGTTGTTTAATTAAGTG (SEQ ID NO: 101)
3'-side primer: GTGCAAAGGGTGACTACTCA (SEQ ID NO: 102)
[0187]
The quantification results were corrected using Glyceraldehyde 3-phosphate dehydrogenase (GAPDH) as an internal standard. That is, the expression level (copy number / μl) of the target gene in each tissue is divided by the expression level (copy number / μl) of GAPDH, and a constant (1 × 105). The results are shown in Table 3.
[0188]
[Table 3]
Figure 2005021093
[0189]
As is apparent from Table 3, c-nt2ri3007878 mRNA was strongly expressed in the pancreas, expressed in the spleen, liver, and brain, and increased in the frontal lobe of Alzheimer's disease patients (AD frontal lobe).
c-febra2001620 mRNA was expressed in pancreas, spleen, and liver, and increased in breast cancer and lung cancer.
From this result, the cDNA of the clone and the protein encoded by the cDNA can be applied to the treatment and diagnosis of cancer, Alzheimer's disease and the like. In addition, the protein encoded by the cDNA may be involved in a disease relating to a tissue in which a change in mRNA expression is observed or a tissue having a high mRNA expression level as described above.
[0190]
Example 7 Analysis results of each cDNA clone
(1) c-nt2ri3007878 (SEQ ID NOS: 1 and 11)
c-nt2ri3007878 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 1, consists of 6156 bases, of which from base number 227 Up to 2245 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 672 amino acid residues (SEQ ID NO: 11).
[0191]
When the homology search was performed using BLAST for the amino acid sequence encoded by SEQ ID NO: 1, an NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) , (I) Database registration symbol X60156, zinc finger protein (ZF7) (Human) was hit. As its contents, X60156 consists of 738 amino acids, and amino acid numbers 3 to 705 in the amino acid sequence are amino acid numbers 1 to 670 of the amino acid sequence described in SEQ ID NO: 11, e-value: 0.0, and 703 amino acids. Hits were made with 58% identity across the residues. In addition, (ii) database registration symbol Q14587 and zinc finger protein 268 (human) were hit. As its contents, Q14587 consists of 947 amino acids, and amino acid numbers 81 to 774 in the amino acid sequence are amino acid numbers 6 to 670 of the amino acid sequence described in SEQ ID NO: 11, e-value: 0.0, and 698 amino acids. Hits were made with 54% identity across the residues. Furthermore, (iii) database registration symbol B32891, finger protein 2, president (Human) was hit. As its contents, B32891 consists of 651 amino acids, and amino acid numbers 2 to 618 in the amino acid sequence are amino acid numbers 85 to 670 of the amino acid sequence described in SEQ ID NO: 11, e-value: 0.0, and 617 amino acid residues. It was a hit with 58% agreement over the group. From these results, it was speculated that the protein consisting of the amino acid sequence shown in SEQ ID NO: 11 was KRAB zinc finger protein.
The protein of (i) above is described in the literature information Nucleic Acid Res. 19 (20): 5661-7, it is a zinc finger protein having a finger preceding box (FPB; synonymous with KRAB), and the protein of (ii) above is DNA Cell Biol. 14 (2): 125-36, it was clarified that monocyte differentiation / proliferation is regulated.
[0192]
Further, protein characteristics search by HMMPFAM was performed on the amino acid sequence encoded by the base sequence shown in SEQ ID NO: 1, and as a result, amino acid numbers 200 to 222, 228 to 250, 256 to 278, 284 to 306, 312 to 3 of SEQ ID NO: 11 were performed. 334, 340-362, 368-390, 396-418, 424-446, 452-474, 480-502, 508-530, 536-558, 564-586, 592-614, 620-642, 648-670 A sequence showing the characteristics of C2H2 zinc finger (amino acid sequence entered as Pfam as zf-C2H2) was found in the amino acid sequence shown.
C2H2 type zinc finger has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
In addition, a sequence showing the characteristics of a Kruppel-associated box in the amino acid sequence shown by amino acid numbers 6 to 46 (amino acid sequence entered as PRAm as KRAB) was also found. Kruppel-associated box (KRAB) is found in approximately 1/3 of the C2H2-type Zn finger protein, exists in the N-terminal part, acts to repress transcription, and is involved in cell differentiation and development together with the Zn finger domain. Are known.
[0193]
Furthermore, analysis by PSORT II (Trends Biochem. Mol. Biol. 58 (4): 417-424 (1996)), which is a program for predicting the intracellular localization of the protein, revealed that the protein was localized in the cell. The probability of was found to be 100.0% in the nucleus. Therefore, this protein was predicted to be localized in the nucleus.
[0194]
In order to obtain genome information, using software sim4 (Genome Res. 8, 967-974 (1998)) that maps human cDNA to the human genome sequence, mapping of this DNA to the genome was attempted. Five exons were mapped to
Noun in q24 including the position (q24.3) on chromosome 12 mapped by Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome It was found that the causal locus of spinal muscular atrophy exists in the syndrome, q24. From these, it was speculated that the present DNA may be a causative gene of these diseases and that the mutation of the present DNA can be applied to these diagnoses.
[0195]
From the above, the protein shown in SEQ ID NO: 11 was predicted to be a novel Zn finger protein having functions related to development, differentiation and formation of human organs and tissues, cell cycle and cell proliferation.
[0196]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, TBP target sequences: TATAAA (SEQ ID NO: 82), SRY, Sox-5, and Sox-9 consensus target sequences: It showed very high affinity for AAAAAACAATAGGGG (SEQ ID NO: 83), mat-Mc target sequence: TCATTGTT (SEQ ID NO: 84). This indicates that this protein has DNA binding ability and is associated with diseases caused by abnormalities such as development / differentiation of the nervous system, cartilage formation, and sex differentiation. Further, Example 5 has an activity to enhance the action of PPAR, lifestyle diseases such as diabetes and obesity due to abnormal endocrine / sugar / lipid metabolism, etc., circulatory system diseases due to abnormal vascular function, inflammation, cancer, etc. Etc. Moreover, it has the activity which suppresses the effect | action which p53 has, and it was estimated that it is related to cancer etc. Furthermore, it has the activity which suppresses the effect | action which AP-1 has, and it was estimated that it is related to an inflammatory disease, cancer, etc.
[0197]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-10The names of organs or tissues with 5 or more human ESTs that were hit in the above were extracted, and they were normal human eyes, uterus, placenta, intestine, immune system, fetal liver, fetal spleen, cancerous skin, and eyes . This DNA was cloned from a cDNA library derived from nervous system cells including undifferentiated NT2 cells.
DNA Cell Biol. 14 (2): 125-36 states that the BLAST hit (ii) protein (zinc finger protein protein 268) is expressed in monoblasts. Furthermore, DNA 8 (6): 377-87 (1989) shows that the protein of (iii) (finger protein 2) was cloned from a placenta-derived cDNA library.
In addition, it was shown from Example 6 that this protein is strongly expressed in the pancreas, expressed in the spleen, liver and brain, and increased in the frontal lobe of Alzheimer's disease patients.
[0198]
This protein has functions and diseases peculiar to these tissues and cells, such as melanoma, lymphoma, leukemia, glioma, neuroblastoma, uterine cancer, colon cancer, small intestine cancer, skin cancer, liver cancer, etc. Neurodegenerative diseases such as Alzheimer's disease, Parkinson's disease, chorea, inflammatory diseases such as hepatitis, dermatitis, osteochondritis, osteoarthritis, immune system diseases, diabetes, obesity, cardiovascular diseases, allergic diseases, spleen The possibility of relating to diseases, infertility, Noonan syndrome, spinal muscular atrophy, etc. can be inferred, and it can be used as a diagnostic or therapeutic target for these diseases.
[0199]
(2) c-febra2001620 (SEQ ID NO: 2, 12)
c-febra2001620 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 2, consists of 2146 bases, of which base number 214 Up to 1947 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 777 amino acid residues (SEQ ID NO: 12).
[0200]
When the homology search was performed using BLAST for the amino acid sequence encoded by SEQ ID NO: 2, a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) (I) Database registration symbol AF325191, KRAB zinc finger protein HZF26 (Human) was hit. As its contents, AF325191 is composed of 470 amino acids, and amino acid numbers 2 to 468 in the amino acid sequence are amino acid numbers 17 to 483 of the amino acid sequence described in SEQ ID NO: 12, and e-value: 0.0 and 467 amino acid residues. It was a hit with 84% agreement over the group. (Ii) Database registration symbols AB075849 and KIAA1969 protein (Human) were hit. As its contents, AB075849 consists of 595 amino acids, and amino acid numbers 51 to 583 in the amino acid sequence are amino acid numbers 16 to 548 of the amino acid sequence described in SEQ ID NO: 12, e-value: 0.0 and 533 amino acid residues. It was a hit with 69% agreement over the group. Furthermore, (iii) database registration symbol, Q03923, zinc finger protein protein 85 (Zinc finger protein HPF4; Human) was hit. As its contents, Q03923 is composed of 595 amino acids, and amino acid numbers 2 to 568 in the amino acid sequence are amino acid numbers 17 to 555 of the amino acid sequence described in SEQ ID NO: 12, and e-value: 0.0 and 568 amino acid residues. It was a hit with 65% agreement over the group.
[0201]
In addition, when the protein feature search by HMMPFAM was performed for the amino acid sequence shown in SEQ ID NO: 12, amino acid numbers 188 to 210, 216 to 243, 244 to 266, 272 to 294, 300 to 322, 328 to 350 of SEQ ID NO: 12, 356 to 378, 384 to 406, 440 to 462, 468 to 490, 496 to 518, 524 to 546, an amino acid sequence represented by a zinc finger, C2H2 type region (characterized as Pfam as zf-C2H2) Amino acid sequence). This domain has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
Furthermore, a sequence (amino acid sequence entered as KRAB in Pfam) showing the characteristics of KRAB box region in the amino acid sequence shown in amino acid numbers 19 to 59 of SEQ ID NO: 12 was found. Kruppel-associated box (KRAB) is found in about 1/3 of the C2H2-type Zn finger protein, is present in the N-terminal part, acts upon repression of transcription when binding to DNA, and cell differentiation together with the Zn finger domain・ It is known to be involved in the outbreak.
The protein of (i) hit by BLAST is related to the regulation of monocyte differentiation / proliferation from literature information (DNA Cell. Biol. 142 (2): 125-136 (1995)) in the database, The protein of (ii) is predicted to have functions of cell signal transduction, cytoskeleton and cell motility from literature information (DNA Res. 8 (6): 319-327 (2001)) in the database. In addition, the protein of (iii) above has some of the KRAB domains constituting cofactors that repress transcription from literature information in the database (DNA Cell. Biol. 17 (11): 931-943 (1998)). It was clarified that it binds to a nuclear protein in vitro.
[0202]
Furthermore, analysis by PSORT II (Trends Biochem. Mol. Biol. 58, (4) 417-424 (1996)), which is a program for predicting the intracellular localization of the protein, revealed that the localization of the protein in the cell was detected. The probability is 100.0% in the nucleus, and the protein was predicted to be present in the nucleus. This result suggests that this protein binds to DNA in the cell nucleus and regulates the transcription of genes involved in cell differentiation / proliferation, cell cycle and the like.
[0203]
On the other hand, in order to obtain genome information, using software sim4 (Genome Res. 8, 967-974 (1998)) for mapping human cDNA to human genome sequence, we attempted to map this DNA to the genome. Six exons were mapped on the chromosome. P. (Short arm) has an exostosis and p13 has a causal locus for acute myeloid leukemia. Furthermore, the causal locus for ectodermal dysplasia, hypervaline and hyperleucine-isoleucine is No. 19. It was found on the chromosome, but its detailed position has not been identified. From these, it was speculated that the present DNA may be a causative gene of these diseases and that the mutation of the present DNA can be applied to these diagnoses.
[0204]
Based on the above, the protein shown in SEQ ID NO: 12 was predicted to be a novel Zn finger protein having functions related to the development, differentiation and formation of human organs and tissues, cell cycle and cell proliferation.
[0205]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-50The names of organs or tissues with 5 or more human ESTs hit in the above were extracted, and they were normal testis / eye / brain / stomach, cancerized testis / uterus / brain / lung. This DNA was cloned from a cDNA library derived from fetal brain tissue.
Further, when the literature information on the expression tissue was examined for the top 3 hits of BLAST, DNA Cell. Biol. 142 (2): 125-136 (1995), KRAB zinc finger protein HZF26 (Human) is expressed in human monoblasts by DNA Res. 8 (6): 319-327 (2001), that KIAA1969 protein (Human) is expressed in the brain, spinal cord, fetal brain, fetal liver, etc. Biol. 17 (11): 931-943 (1998) described that zinc finger protein protein 85 (Human) is highly expressed in testicular epithelioma tissue, respectively.
Moreover, it was shown from Example 6 that this protein is expressed in pancreas, spleen, and liver, and the expression increases in breast cancer and lung cancer.
[0206]
This protein has functions and diseases peculiar to these tissues and cells such as testicular cancer, melanoma, brain tumor, glioma, neuroblastoma, gastric cancer, uterine cancer, lung cancer, liver cancer, breast cancer, Alzheimer's disease, Neurodegenerative diseases such as Parkinson's disease and chorea, inflammatory diseases such as pneumonia and hepatitis, immune system diseases, allergic diseases, infertility, hypervalinemia, hyperleucine-isoleucine, ectodermal dysplasia, exostosis Possibility that it is related to symptom etc. can be presumed, and the use as a target of a diagnostic or therapeutic agent for these diseases is considered.
[0207]
(3) c-bramy 2043103 (SEQ ID NOs: 3, 13)
c-bramy2043103 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 3, consists of 3049 bases, of which from base number 281 Up to 2284 are open reading frames (including stop codon). The amino acid sequence predicted from the open reading frame consists of 667 amino acid residues (SEQ ID NO: 13).
[0208]
When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 13, the database in the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) Registration code Q9UJW8, Zinc finger protein 180 (Human) was a hit. As its contents, Q9UJW8 consists of 692 amino acids, and 1 to 692 in the amino acid sequence are amino acid numbers 1 to 667 of the amino acid sequence described in SEQ ID NO: 13, e-value: 0.0, and 692 amino acid residues. It hit with a score of 96% match.
From the alignment of BLAST search, this protein has deleted amino acids corresponding to 25 residues of amino acid numbers 45 to 69 of Q9UJW8, and this DNA also corresponds to base numbers 398 to 472 of base sequence AF192913 corresponding to Q9UJW8. It was also found that 75 bases (between base numbers 412 and 413 of this DNA) were deleted.
[0209]
Moreover, when the protein characteristic search by HMMPFAM was performed about the amino acid sequence of sequence number 13, amino acid numbers 328-350, 356-378, 384-406, 412-434, 440-462, 468-490, 496-518, 524 -546, 552-574, 580-602, 608-630, 636-658 amino acid sequence shown in Zinc Finger, C2H2 type domain characteristic sequence (amino acid sequence entered as Pfam as zf-C2H2) It was. This domain has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
Furthermore, the amino acid sequence shown in amino acid numbers 47 to 87 of SEQ ID NO: 13 was found to show the characteristics of KRAB box region (amino acid sequence entered as PRAm as KRAB). Kruppel-associated box (KRAB) is found in about 1/3 of the C2H2-type Zn finger protein, is present in the N-terminal part, acts upon repression of transcription when binding to DNA, and cell differentiation together with the Zn finger domain・ It is known to be involved in the outbreak.
[0210]
In protein feature search by HMMPFAM, amino acid numbers 25 to 80 of this protein are Remorin_N region (Remorin, N-terminal region), and this region is not found in Q9UJW8. When coiled-coil is formed on the C-terminal side, this domain exists as a proline-rich region on the N-terminal side and is thought to interact with macromolecules such as DNA. In Pfam, a Zn finger domain showing DNA binding ability was detected on the C-terminal side, but this region may have a DNA binding ability, interaction, and regulation of transcriptional activity different from Q9UJW8.
[0211]
In order to clarify the exon structure of this DNA and AF192913 cDNA, software sim4 (Genome Res. 8, 967-74 (1998)) for mapping the cDNA sequence to the genomic sequence was used to align the genomic sequence. This DNA sequence was mapped to 4 exons on human chromosome 19 and the AF192913 sequence was mapped to 5 exons. The first, second, third, and fourth exons of this DNA correspond to AF192913, but this DNA lacks one third exon of AF192913. This difference is derived from the deletion portion (base numbers 398 to 472 of AF192913) of the present DNA by the BLAST search described above.
These differences may cause differences in binding and interaction with DNA, expression tissues, expression levels, and the like. From the above, the protein of SEQ ID NO: 13 is a splicing variant of Q9UJW8, Zinc finger protein 180 (Human).
[0212]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is The nucleus was 95.7% and the mitochondria was 4.3%. Since the probability of localization to the nucleus is high, this protein is considered to be a protein that binds to DNA in the cell nucleus and regulates transcription of genes involved in cell differentiation / proliferation, cell cycle, and the like.
[0213]
According to the Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome, the position (q13.31) on the 19th chromosome where this DNA is mapped is shown. Q13.2-13.3 includes progressive hereditary heart block, 3-methylglutaconic acidia causal locus, q13 autosomal dominant hearing loss, diamond-black fan anemia, palate causal locus inherited in q The causative locus for pediatric convulsions is present, and ectodermal dysplasia, hypervalineemia, and hyperleucine-isoleucine are present on chromosome 19, but their detailed location has been identified. Obviously not became. From the above, the possibility that this DNA is a causative gene of these diseases and the possibility that mutations of this DNA containing splicing variants can be applied to the diagnosis of these diseases were expected.
[0214]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, the target sequence of ER: AAGGGGAAAATGACCCC (SEQ ID NO: 46), the target sequence of RXR-α: GGTCATAGGGGT (SEQ ID NO: 47), PPAR-α: CTAGGGCAAAGGTCA (SEQ ID NO: 48), consensus target sequence such as Pax-3: CGTCAGCCTTTGA (SEQ ID NO: 68), Pax-1 target sequence: CCGTTCCCCTCTTAGATAT (SEQ ID NO: 69) and HSF1 and other consensus target sequences: AGAAAAAGAAAAAAA SEQ ID NO: 70) showed affinity. This indicates that this protein has the ability to bind to DNA, and is associated with diseases caused by abnormalities such as lipid metabolism, drug metabolism, and muscle formation, such as lifestyle-related diseases.
[0215]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-10In the human ESTs that were hit in, the names of organs or tissues in which 4 or more hits were found were extracted. In human normal lung, intestine, spleen, cancerous immune system / lymph system / uterus / eye / skin there were. This DNA was cloned from a cDNA library derived from the amygdala.
[0216]
This protein has functions and diseases peculiar to these tissues and cells, such as cancers such as lung cancer, colon cancer, small intestine cancer, leukemia, lymphoma, uterine cancer, central diseases such as depression, anxiety, schizophrenia, pneumonia Inflammatory diseases such as immune system diseases, allergic diseases, hyperlipidemia, arteriosclerosis, splenomegaly, cleft palate, progressive hereditary heart block, 3-methylglutaconic acidia, hearing loss, anemia, pediatric convulsions, hypervalineemia, high The possibility of leucine-isoleucinemia and myogenic dysgenesis can be estimated, and it can be used as a target for diagnostics and therapeutics for these diseases.
[0217]
(4) c-brassn2013753 (SEQ ID NOs: 4, 14)
c-brsn2013753 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 4, consists of 2312 bases, of which base number 138 Up to 1019 are open reading frames (including stop codon). The amino acid sequence predicted from the open reading frame consists of 293 amino acid residues (SEQ ID NO: 14).
[0218]
When a homology search was performed on the amino acid sequence of SEQ ID NO: 14 using BLAST, an NRDB protein database (a database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) ( i) Database registration symbol Q62981, Zinc finger protein OZF (Rat) was hit. As its contents, Q62981 is composed of 407 amino acids, and 116 to 407 in the amino acid sequence are amino acid numbers 1 to 293 of the amino acid sequence described in SEQ ID NO: 14, and e-value: 5 × 10 5-176And it hit with 95% agreement over 293 amino acid residues.
(Ii) Database registration symbol Q62513, Zinc finger protein OZF (Mouse) was hit. As its contents, Q62981 is composed of 407 amino acids, and 116 to 407 in the amino acid sequence are amino acid numbers 1 to 293 of the amino acid sequence described in SEQ ID NO: 14, and e-value: 5 × 10 5-176And it hit with 95% agreement over 293 amino acid residues.
Furthermore, (iii) Database registration symbol Q15072 and Zinc finger protein OZF (Human) were hit. As its contents, Q15072 consists of 292 amino acids, and 4 to 292 in the amino acid sequence is amino acid numbers 5 to 293 of the amino acid sequence described in SEQ ID NO: 14, and e-value: 5 × 10 5-151And it was hit with 81% agreement over 289 amino acid residues.
[0219]
Moreover, when the protein characteristic search by HMMPFAM was performed about the amino acid sequence of sequence number 14, amino acid numbers 17-39, 45-67, 73-95, 101-123, 129-151, 157-179, 185-207, 213 A sequence showing the characteristics of Zinc Finger, C2H2 type domain (amino acid sequence entered as zf-C2H2 in Pfam) was found in the amino acid sequences shown in ˜235, 241-263, 269-291. This domain has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
Further, a sequence showing the characteristics of XPA protein N-terminal (amino acid sequence entered as XPA_N in Pfam) was extracted from amino acid numbers 154 to 194. XPA protein is a protein involved in the pathogenesis of pigmented scleroderma (XP), an autosomal recessive disease that induces skin cancer at a high rate by ultraviolet rays, has the ability to bind to damaged DNA, and removes and repairs DNA Responsible for the function.
The XPA protein N-terminal domain is present in this protein, but is not found in Q15072 which is a human sequence among the hit sequences. Therefore, it can be inferred that this protein has a function related to DNA repair that Q15072 does not have.
[0220]
In order to clarify the exon structure of this DNA and human hit sequence AJ011806 (DNA sequence corresponding to Q15072) cDNA, software sim4 (Genome Res. 8, 967-74) that maps the cDNA sequence to the genomic sequence. 1998)), the DNA sequence was mapped to one exon on human chromosome 19 and the AJ011806 sequence was mapped to one exon. . There is no overlap between the mapping positions of the two.
Moreover, although this DNA is a human clone, the sequence having the highest homology with this protein is the rat sequence. Therefore, the protein of SEQ ID NO: 14 is an ortholog of rat and mouse Zinc finger protein OZF, and is likely to be a novel human cDNA.
[0221]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is The nucleus was 95.7% and the mitochondria was 4.3%. Since the probability of localization to the nucleus is high, this protein is considered to be a protein that binds to DNA in the cell nucleus and regulates transcription of genes involved in cell differentiation / proliferation, cell cycle, and the like.
[0222]
According to the Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome, the position (q13.12) on the 19th chromosome where the present DNA is mapped is shown. Q13.1 includes cystinuria, cystic bone dysplasia, congenital nephrosis, q13 is autosomal dominant hearing loss, diamond-blackfan anemia, cleft palate locus, q is the gene causing hereditary childhood spasm I found out that the seat exists. Furthermore, it was revealed that ectodermal dysplasia, hypervalineemia / hyperleucine-isoleucineemia are present on chromosome 19, but their detailed positions have not been identified.
From the above, the possibility that this DNA is a causative gene of these diseases and the possibility that mutations of this DNA containing splicing variants can be applied to the diagnosis of these diseases were expected.
[0223]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, a consensus target sequence such as GATA-1: CCAGATAAGG (SEQ ID NO: 52), and a target sequence of AREA / NIT-2: It showed a very high affinity for TATCTC (SEQ ID NO: 53). This indicates that this protein has DNA binding ability and may be associated with diseases caused by abnormalities such as differentiation of hematopoietic stem cells, hematopoietic cells, neural cells, circulatory organs, and apoptosis control.
[0224]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-10Extracted organ names or tissue names with 4 or more hits in human ESTs hit in, and in normal human eyes / brain / intestine / lung / placenta, cancerous testis / uterus / eye / skin there were. This DNA was cloned from a substantia nigra derived cDNA library.
Eur. J. et al. Biochem. 236 (3): 991-5 (1996), human OZF is expressed in mammary epithelial cells, over-expressed in tumor cells, and Int. J. et al. Cancer 80 (3): 369-72 (1999) is highly expressed in pancreatic cancer, and is assumed to be involved in carcinogenesis and tumor development.
[0225]
Based on the above, this protein has functions and diseases peculiar to these tissues and cells, such as cancers such as melanoma, brain tumor, colon cancer, small intestine cancer, lung cancer, uterine cancer, skin cancer, testicular cancer, Parkinson's disease, chorea, etc. Neurodegenerative diseases, central diseases such as schizophrenia, inflammatory diseases such as pneumonia and dermatitis, immune system diseases, allergic diseases, infertility, cystinuria, cystic bone dysplasia, hearing loss, anemia, hematopoietic disorders, palate It can be estimated that it may be related to fissure and infantile spasm, and it can be used as a diagnostic or therapeutic target for these diseases.
[0226]
(5) c-brsn2017530 (SEQ ID NOS: 5 and 15)
c-brssn2011192 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 5, consists of 3839 bases, of which from base number 1582 Up to 2685 are open reading frames (including stop codon). The amino acid sequence predicted from the open reading frame consists of 367 amino acid residues (SEQ ID NO: 15).
[0227]
When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 15, the database in the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) The registration symbols AF326206 and ZNF140-like transcription factor (Human) were hit. As its contents, AF326206 is composed of 399 amino acids, 33 to 399 in the amino acid sequence, amino acid numbers 1 to 367 of the amino acid sequence shown in SEQ ID NO: 15 are e-value: 0.0 and 367 amino acid residues. Hit with 99% agreement.
From the alignment of the BLAST search, it was found that the N-terminal of this protein is 32 residues shorter than AF326206, and that one residue substitution of glutamic acid to glycine exists at amino acid number 136 (corresponding to amino acid number 104 of this protein) of AF326206. This DNA differs from AF326206 by 1490 bases at the 5 ′ end, but since the translation start point is base number 1582, the difference from AF326206 is from base numbers 338 to 433 of the translation start point of AF326206, which is the N-terminal of the amino acid. This is reflected in the difference. A base corresponding to base number 743 of AF326206 (base number 1891 of this DNA) is substituted from adenine to guanine, which is the origin of amino acid substitution.
[0228]
Further, protein feature search by HMMPFAM was performed on the amino acid sequence of SEQ ID NO: 15, and the results were shown in amino acid numbers 169-191, 197-219, 225-247, 253-275, 281-303, 309-331, 337-359. A sequence showing the characteristics of Zinc Finger, C2H2 type domain (amino acid sequence entered as Pfam as zf-C2H2) was found. This domain has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
AF326206 has KRAB box region at amino acid numbers 4 to 44 but is not found in this protein. Since this domain is known to act as a transcriptional repressor upon binding to DNA and to participate in cell differentiation and development together with the Zn finger domain, this protein exhibits a transcriptional activity different from that of AF326206. Is expected to have some effect on
[0229]
In order to clarify the exon structure of the present DNA and AF326206 cDNA, software sim4 (Genome Res. 8, 967-74 (1998)) that maps the cDNA sequence to the genome sequence was used to align the genome sequence. This DNA sequence was mapped to 3 exons on human chromosome 19, and the AF326206 sequence was mapped to 5 exons (except poly A). The second and third exons of this DNA are almost identical to the fourth and fifth exons of AF192913, respectively, but the first exon of this DNA is longer upstream than the third exon of AF192913. In addition, the first and second exons of AF192913 do not exist in this DNA. Since the translation start position of AF192913 is base number 337, both have different translation start positions, and this causes the difference in the N-terminus on the amino acid sequence.
These differences may cause differences in binding and interaction with DNA, expression tissues, expression levels, and the like. From the above, the protein of SEQ ID NO: 15 is a splicing variant of AF326206, Zinc finger protein 140-like transcription factor (Human).
[0230]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is It was 100.0% in the nucleus. Therefore, this protein is considered to be a protein that binds to DNA in the cell nucleus and regulates transcription of genes involved in cell differentiation / proliferation, cell cycle, and the like.
[0231]
According to the Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome, the position (q13.11) on the 19th chromosome where this DNA is mapped is shown. Q13.1 includes cystinuria, congenital nephrosis, cystic bone dysgenesis locus, q13 is autosomal dominant hearing loss, diamond-blackfan anemia, cleft palate locus, and q is hereditary There is a causal locus for pediatric convulsions, and ectodermal dysplasia, hypervalineemia, and hyperleucine-isoleucine are present on chromosome 19, but their precise positions have not been identified. It became clear that there was no. From the above, the possibility that this DNA is a causative gene of these diseases and the possibility that mutations of this DNA containing splicing variants can be applied to the diagnosis of these diseases were expected.
[0232]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, the target sequence of Sp1: GGGGGGGGGG (SEQ ID NO: 54), the target sequence of Tramtrack69K: GGACCCTGC (SEQ ID NO: 61), and HOX9 High affinity was shown for target sequence: TGACAGTTTAACGA (SEQ ID NO: 62) and CDP target sequence: CCAATAATCGAT (SEQ ID NO: 63). Therefore, this protein has a DNA binding ability and is considered to be related to diseases such as diseases caused by abnormalities such as hematopoietic stem cell differentiation, apoptosis control, cytokine production, viral diseases, bacterial diseases, and cancer. Further, according to Example 5, it has an activity of strongly suppressing the action of PPAR, lifestyle diseases such as diabetes and obesity due to abnormal endocrine / sugar / lipid metabolism, circulatory system diseases due to abnormal vascular function, inflammation, etc. It was speculated that it was related to cancer. Moreover, it has the activity which suppresses the effect | action which p53 has, and it was estimated that it is related to cancer etc. Furthermore, it has an activity that enhances the action of HIF-1, and is caused by abnormal angiogenesis, abnormal intracellular oxidation, etc., ischemic disease, anemia, hypoxia, diabetic retinopathy, cardiovascular disease, cancer Etc.
[0233]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-50The names of organs or tissues in which 5 or more hits were found were extracted from human ESTs that were hit in, and found to be normal human brain / eye / kidney / placenta, cancerous uterus / skin / eye / testis . This DNA was cloned from a substantia nigra derived cDNA library.
[0234]
This protein has functions and diseases peculiar to these tissues and cells, such as cancers such as brain tumors, melanoma, kidney cancer, uterine cancer, skin cancer, testicular cancer, leukemia, neurodegenerative diseases such as Parkinson's disease and chorea, schizophrenia Central diseases such as infectious diseases, inflammatory diseases such as nephritis / dermatitis, immune system diseases, allergic diseases, diabetes, obesity, ischemic diseases, cardiovascular diseases, hypoxia, diabetic retinopathy, cystinuria, nephrosis As a target for diagnostics and therapeutics for these diseases, such as hearing loss, anemia, cleft palate, pediatric convulsions, ectodermal dysplasia, hypervalineemia, and hyperleucine-isoleucineemia Can be used.
[0235]
(6) c-hcho20000473 (SEQ ID NOs: 6, 16)
c-hcho20000473 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 6, consists of 3588 bases, of which base number 352 Up to 2271 are open reading frames (including stop codon). The amino acid sequence predicted from the open reading frame consists of 639 amino acid residues (SEQ ID NO: 16).
[0236]
A homology search was performed on the amino acid sequence of SEQ ID NO: 16 using BLAST. In the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB), other than genomic sequences I did not find anything showing a high score. However, in the amino acid sequence database aageneseq in GENESEQ (manufactured by Derwent), which is a commercial gene sequence patent database, the amino acid sequence described as Seq ID 893 in the registration code AAU15940 and WO01 / 55322 was hit, and Human novel secreted protein. As its contents, AAU15940 is composed of 361 amino acids, and 4 to 361 in the amino acid sequence ranges from amino acid numbers 282 to 639 of the amino acid sequence described in SEQ ID NO: 16 and e-value: 0.0 and 358 amino acid residues. It was a hit with a match of 100.0%.
The BLAST search alignment shows that this protein differs from AAU15940 by 281 residues at the N-terminus. AAU15940 differs from this protein by 3 residues. In addition, this DNA differs from AAS25927 (DNA sequence in DNA sequence database nageneseq corresponding to AAU15940) at the 5 ′ end by 1193 bases, and AAS25927 differs from this DNA by 8 bases, which causes the difference in the N-terminal amino acid sequence. It has become.
[0237]
Moreover, when the protein feature search by HMMPFAM was performed about the amino acid sequence of sequence number 16, amino acid numbers 234-256, 262-284, 290-312, 318-340, 346-368, 374-396, 402-424, 430 ˜452, 458 to 480, 486 to 508, 514 to 536, 542 to 564, 570 to 592, 598 to 620, the sequence showing the characteristics of Zinc Finger, C2H2 type domain (Pfam as zf-C2H2) The amino acid sequence to be entered was found. This domain has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
Furthermore, a sequence (amino acid sequence entered as PRAm as KRAB) showing the characteristics of KRAB box region was found in the amino acid sequence represented by amino acid numbers 27 to 67 of SEQ ID NO: 16. Kruppel-associated box (KRAB) is found in about 1/3 of the C2H2-type Zn finger protein, is present in the N-terminal part, acts upon repression of transcription when binding to DNA, and cell differentiation together with the Zn finger domain・ It is known to be involved in the outbreak.
KRAB box region is present in this protein but not in AAU15940. Therefore, this protein exhibits a transcriptional activity different from that of AAU15940 and may have some influence on cell differentiation.
[0238]
In order to clarify the exon structure of the present DNA and AAS25927 cDNA, software sim4 (Genome Res. 8, 967-74 (1998)) for mapping the cDNA sequence to the genome sequence was used, and alignment to the genome sequence was performed. This DNA sequence was mapped to 7 exons on the human X chromosome, and the AAS25927 sequence was mapped to 1 exon (except poly A). The seventh exon of this DNA is longer than and includes one exon of AAS25927, but the first to sixth exons of this DNA are not present in AAS25927. Among these, since the fifth and sixth exons correspond to the KRAB domain, AAU15940 is consistent with the result of HMMPFAM that lacks the KRAB domain. These differences may cause differences in binding and interaction with DNA, expression tissues, expression levels, and the like. Based on the above, the protein of SEQ ID NO: 16 is a splicing variant of the human novel secreted protein, the amino acid sequence described as Seq ID 893 in WO01 / 55322.
[0239]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is It was 95.7% in the nucleus and 4.3% in mitochondria. Therefore, this protein is considered to be a protein that binds to DNA in the cell nucleus and regulates transcription of genes involved in cell differentiation / proliferation, cell cycle, and the like.
[0240]
According to Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome, it includes the position (p11.23) on the X chromosome to which this DNA is mapped Mental retardation at p11-23, Fragile X syndrome at p11.4-11.2, Joint contractures (spinal muscular atrophy) at p11.3-11.2, Albino (eye) at p11.4-11.23 ), P11.4-11.21 with amblyopia, p11.23 with night blindness, p11.2 with papillary renal cell carcinoma, p11 with insulin-dependent diabetes, and p with congenital cataract locus It was. From the above, the possibility that this DNA is a causative gene of these diseases and the possibility that mutations of this DNA containing splicing variants can be applied to the diagnosis of these diseases were expected.
[0241]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, consensus target sequences such as HEN-1 target sequence: GGGGCGCAGCTGGCGCCC (SEQ ID NO: 38), AhR, etc .: GGGGATTGCCGTG (SEQ ID NO: 39) ), USF target sequence: GTCACGTGGT (SEQ ID NO: 40), consensus target sequence such as NF-1A1: CGTTGGGGTTTGGCACGGGGCCA (SEQ ID NO: 41), RF-X1 target sequence: GGTAACATAGGCAAC (SEQ ID NO: 42), Sp1 target sequence: GGGGG (SEQ ID NO: 54), Egr-1 target sequence: TGCGTGGGCG (SEQ ID NO: 56), p50 target sequence: GGGGATTTTCC (SEQ ID NO: 74), consensus such as NF-ATc Target sequence: AGGAAAA (SEQ ID NO: 75), consensus target sequence such as p91: GAATTCCGGGAAATG (SEQ ID NO: 76), consensus target sequence such as STAT2: TTTCCCGGGAAATG (SEQ ID NO: 77), and p53 target sequence: GGACATGCCCGGGGCATGTC (SEQ ID NO: 78) It showed very high affinity. This indicates that this protein has DNA-binding ability and may be associated with diseases such as cell cycle, inflammation, apoptosis control, immune response, drug metabolism, cytokine production, diseases such as viral diseases, and cancer. It is done. Further, Example 5 has an activity to enhance the action of PPAR, lifestyle diseases such as diabetes and obesity due to abnormal endocrine / sugar / lipid metabolism, etc., circulatory system diseases due to abnormal vascular function, inflammation, cancer, etc. Etc. Moreover, it has the activity which suppresses the effect | action which AP-1 has, and it was estimated that it is related to an inflammatory disease, cancer, etc.
[0242]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-10The names of organs or tissues in which 5 or more hits were found were extracted from human ESTs that were hit in, and found to be normal human brain, placenta, stomach, and mammary gland, and cancerous eyes, skin, lungs, and uterus. . This DNA was cloned from a cDNA library derived from normal cartilage primary cultured cells.
[0243]
This protein has functions and diseases peculiar to these tissues and cells, such as leukemia, lymphoma, brain tumor, stomach cancer, breast cancer, melanoma, skin cancer, lung cancer, uterine cancer, inflammatory diseases such as pneumonia and dermatitis, Presumed to be related to immune system disease, allergic disease, obesity, cardiovascular disease, infertility, mental retardation, fragile X syndrome, joint contracture, albino, amblyopia, night blindness, renal cancer, diabetes, osteoarthritis This protein can be used as a target for diagnostics and therapeutics for these diseases.
[0244]
(7) c-testi4004626 (SEQ ID NO: 7, 17)
c-testi 4004626 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) comprises 4053 bases as shown in SEQ ID NO: 7, of which base number 2097 Up to 3881 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 594 amino acid residues (SEQ ID NO: 17).
[0245]
When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 17, database registration symbol of NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) P52736, Zinc finger protein 133 (Human) was a hit.
As its contents, P52736 consists of 654 amino acids, and 73-654 in the amino acid sequence spans amino acid numbers 13-594 of the amino acid sequence described in SEQ ID NO: 17, and e-value: 0.0 and 584 amino acid residues. Hit with 99% agreement.
The BLAST search alignment shows that this protein differs from P52736 by 12 residues at the N-terminus, and P52736 differs from this protein by 72 residues at the N-terminus. In addition, at amino acid numbers 121 and 428 (corresponding to amino acid numbers 181 and 488 of P52736) of this protein, there are substitutions of leucine to phenylalanine and histidine to arginine, respectively. In this DNA, the 5 ′ end differs from U09366 (base sequence corresponding to P52736) on the alignment by 2131 bases, but since the translation start point is base number 2097, the difference at the 5 ′ end is 35 bases. It is the cause of the difference at the N-terminus of the amino acid sequence. In addition, there are single-base substitutions from adenine to guanine and cytosine to thymine at base numbers 2282 and 2457 (corresponding to base numbers 811 and 986 of U09366), respectively, which cause amino acid substitution.
[0246]
Moreover, when the protein characteristic search by HMMPFAM was performed about the amino acid sequence of sequence number 17, amino acid numbers 154-176, 182-204, 210-232, 238-260, 266-288, 294-316, 322-344, 350 -372, 378-400, 406-428, 434-456, 462-484, 490-512, 518-540, 546-571, a sequence showing the characteristics of Zinc Finger, C2H2 type domain (in Pfam) The amino acid sequence entered as zf-C2H2) was found. This domain has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
P52736 has KRAB box region at amino acid numbers 1 to 41, but is not found in this protein.
Therefore, this protein shows a transcriptional activity different from that of P52736, and may have some influence on cell differentiation.
[0247]
In order to clarify the exon structure of this DNA and U09366 cDNA, software sim4 (Genome Res. 8, 967-74 (1998)) for mapping the cDNA sequence to the genomic sequence was used to align the genomic sequence. The DNA sequence was mapped to 2 exons on human chromosome 20, and the U09366 sequence was mapped to 6 exons (except poly A). The second exon of the present DNA is almost identical to the sixth exon of U09366, but the first exon of the present DNA is not present in U09366, and is located between the fifth and sixth exons of U09366. The fourth and fifth exons of U09366 correspond to the KRAB domain, and FEBS Lett. 369 (2-3): 153-7 also states that Zinc finger 133 has both A and B subdomains of KRAB box, so that both DNAs are functional as well as structural differences. It is also possible that there will be differences.
These differences may cause differences in binding and interaction with DNA, expression tissues, expression levels, and the like. From the above, the protein of SEQ ID NO: 17 is a splicing variant of P52736, Zinc finger protein 133 (Human).
[0248]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is It was 100.0% in the nucleus. Therefore, this protein is considered to be a protein that binds to DNA in the cell nucleus and regulates transcription of genes involved in cell differentiation / proliferation, cell cycle, and the like.
[0249]
According to the Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome, the position (p11.23) on the chromosome 20 where this DNA is mapped It was found that the causal locus of hereditary corneal dystrophy exists in the included p11.2. From the above, the possibility that this DNA is a causative gene of this disease and the possibility that mutations of this DNA containing splicing variants can be applied to diagnostic agents for these diseases were expected.
[0250]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, the target sequence of YY1: CGGCCCATCTGGCT (SEQ ID NO: 55), the target sequence of Egr-1: TGCGTGGGCG (SEQ ID NO: 56), Snail target sequence: CACCTGTTTTCA (SEQ ID NO: 57), CF2-II target sequence: GTATATATA (SEQ ID NO: 58), IRF-1, IRF-2 consensus target sequences: GAAAAGCGAAAA (SEQ ID NO: 73), NF-ATc, etc. The consensus target sequence: AGGAAAA (SEQ ID NO: 75) and the consensus target sequence such as p91: GAATTCCGGGAAATG (SEQ ID NO: 76) showed affinity. From this, this protein has the ability to bind to DNA and is considered to be associated with diseases caused by abnormalities such as immune reaction and cytokine production. Moreover, it was estimated by Example 5 that it has the activity which suppresses the effect | action which p53 has, and it is related to cancer etc. Moreover, it has the activity which suppresses the effect | action which NF (kappa) B has, and it was estimated that it is related to immune diseases, inflammatory diseases, cancer, etc., such as rheumatoid arthritis and osteoarthritis. Moreover, it has the activity which suppresses the effect | action which AP-1 has, and it was estimated that it is related to an inflammatory disease, cancer, etc. In addition, it has an activity that enhances the action of HIF-1 and is caused by abnormal angiogenesis, abnormal intracellular oxidation, etc., ischemic disease, anemia, hypoxia, diabetic retinopathy, cardiovascular disease, cancer Etc. Furthermore, it has an activity that slightly enhances the action of CREB, and it was speculated that it is related to central diseases such as memory impairment, cardiovascular diseases, diabetes and the like.
[0251]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-50Extracted organ names or tissue names with 4 or more hits in human ESTs hit in, normal human bone, liver, pancreas, fetal heart, brain, eye, fetal liver, cancerous mammary gland It was the prostate. This DNA was cloned from a testis-derived cDNA library.
[0252]
This protein has functions and diseases peculiar to these tissues and cells, such as myeloma, liver cancer, pancreatic cancer, brain tumor, melanoma, breast cancer, prostate cancer, testicular cancer, pneumonia, pancreatitis, hepatitis, osteoarthritis Inflammatory diseases such as rheumatoid arthritis, allergic diseases, central diseases such as memory disorders, diabetes, ischemic diseases, anemia, hypoxia, diabetic retinopathy, cardiovascular diseases, infertility, Possibility that it is related to corneal dystrophy can be inferred, and its use as a target of a diagnostic or therapeutic agent for these diseases can be considered.
[0253]
(8) c-tach 3014316 (SEQ ID NOs: 8, 18)
c-trach 3014316 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 8, consists of 4455 bases, of which base number 1038 Up to 1937 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 299 amino acid residues (SEQ ID NO: 18).
[0254]
When homology search was performed on the amino acid sequence of SEQ ID NO: 18 using BLAST, the database registration symbol of the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) AK0711616, FLJ00187 protein (Human) was a hit.
As its contents, AK074116 consists of 563 amino acids, and 267 to 563 in the amino acid sequence is the amino acid number 3 to 299 of the amino acid sequence described in SEQ ID NO: 18, and e-value: 5 × 10 5-179And it hit with 100.0% agreement over 297 amino acid residues.
From the BLAST search alignment, it can be seen that this protein differs from AK074116 by 2 residues at the N-terminus, and AK074116 differs from this protein by 266 residues at the N-terminus. In this DNA, the 5 ′ end differs from AK074116 on the alignment by 1043 bases. However, since the translation start point is the base number 1038, the difference at the 5 ′ end is 6 bases. It is the cause. In AK074116, the 5 'end differs by 999 bases, but the translation start point is base number 202, which causes a difference in the N-terminal of the amino acid sequence.
[0255]
Moreover, when the protein feature search by HMMPFAM was performed about the amino acid sequence of SEQ ID NO: 18, the amino acid sequences represented by amino acid numbers 113 to 135, 141 to 163, 169 to 191, 197 to 219, 225 to 247, and 253 to 275 were obtained. A sequence showing the characteristics of Zinc Finger, C2H2 type domain (amino acid sequence entered as Pfam as zf-C2H2) was found. This domain has a structural motif in which two conserved Cys and two His are coordinated to zinc ions, and is found in many DNA-binding proteins such as transcription factors.
In addition, AK071166 extracted SCAN domain (amino acid sequence entered as PCAN in Pfam) from amino acid numbers 50 to 143, and KRAB box region (amino acid sequence entered as PRAm in KFAB) from amino acid numbers 227 to 267, respectively. These domains are not present in this protein.
SCAN domain is a conserved motif found at the N-terminus of some C2H2-type Zn finger proteins and is known to play a role in the regulation of oligomer formation and transcriptional control. Kruppel-associated box (KRAB) is found in about 1/3 of the C2H2-type Zn finger protein, and is present in the N-terminal part. When it binds to DNA, it acts as a transcriptional repressor. It is known to be involved in differentiation and development.
Therefore, this protein may exhibit a transcriptional activity different from that of AK074116 and affect cell differentiation, or may have a different action in oligomer formation.
[0256]
In order to clarify the exon structure of this DNA and AK074116 cDNA, software sim4 (Genome Res. 8, 967-74 (1998)) for mapping the cDNA sequence to the genome sequence was used to align the genome sequence. This DNA sequence was mapped to one exon on human chromosome 7, and the AK0741116 sequence was found to map to 6 exons. One exon of this DNA includes the sixth exon of AK074116 and is longer. Of the first to fifth exons of AK074116 that do not exist in this DNA, the fourth and fifth exons correspond to the KRAB domain, so that not only structural differences between them but also functional differences may occur. Conceivable.
These differences may cause differences in binding and interaction with DNA, expression tissues, expression levels, and the like. From the above, the protein of SEQ ID NO: 18 is a splicing variant of AK074116, FLJ00187 protein (Human).
[0257]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is It was 95.7% in the nucleus and 4.3% in mitochondria. Therefore, this protein is considered to be a protein that binds to DNA in the cell nucleus and regulates transcription of genes involved in cell differentiation / proliferation, cell cycle, and the like.
[0258]
According to Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome, the position (q22.1) on chromosome 7 where this DNA is mapped Q22-31.1 includes congenital diarrhea, colorectal cancer, q21.3-22 has a hemorrhagic predisposition, and the causal locus of thrombus formation tendency, q21-22 has susceptibility to malignant hyperthermia, and q has autism susceptibility These loci were found to exist. From the above, the possibility that this DNA is a causative gene of this disease and the possibility that mutations of this DNA containing splicing variants can be applied to diagnostic agents for these diseases were expected.
[0259]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, consensus target sequences such as GATA-1: consensus target sequences such as CCATAGATAGG (SEQ ID NO: 52) and Nkx-2.2 : TTAAGTG SEQ ID NO: 65) and consensus target sequences such as Oct-1A: ATGCAAAT (SEQ ID NO: 66) showed high affinity. From this, this protein has the ability to bind to DNA and is considered to be associated with diseases caused by abnormalities such as differentiation of hematopoietic stem cells, blood cells, neural cells, circulatory organs, and apoptosis control. Moreover, it was estimated by Example 5 that it has the activity which enhances the effect | action which NF (kappa) B has, and is related to immune diseases, inflammatory diseases, cancer, etc., such as rheumatoid arthritis and osteoarthritis. Moreover, it has the activity which suppresses the effect | action which AP-1 has, and it was estimated that it is related to an inflammatory disease, cancer, etc. Moreover, it has an activity that enhances the action of HIF-1 slightly strongly, and ischemic disease, anemia, hypoxia, diabetic retinopathy, cardiovascular disease caused by abnormal angiogenesis, abnormal intracellular oxidation, etc. It was speculated to be related to cancer and the like. Furthermore, it has an activity that enhances the action of CREB, and it was speculated that it is related to central diseases such as memory impairment, cardiovascular diseases, diabetes and the like.
[0260]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-65When we extracted the names of organs or tissues in which 5 or more hits were found in human ESTs hit in, normal human bones, skeletal muscles, eyes, pancreas, lungs, intestines, kidneys, blood, brain, placenta, The liver, fetal brain, fetal spleen, cancerous skin, eye, lung, intestine, mammary gland, uterus, brain, pancreas, and testis. This DNA was cloned from a tracheal-derived cDNA library.
[0261]
This protein has functions and diseases peculiar to these tissues and cells, such as myeloma, lung cancer, colon cancer, small intestine cancer, kidney cancer, leukemia, lymphoma, brain tumor, liver cancer, skin cancer, melanoma, breast cancer uterine cancer・ Cancers such as pancreatic cancer and testicular cancer, inflammatory diseases such as pneumonia, pancreatitis, nephritis, hepatitis, bronchitis, osteoarthritis, immune system diseases such as rheumatoid arthritis, allergic diseases such as bronchial asthma, diabetes, ischemic diseases , Anemia, hypoxia, cardiovascular diseases, central diseases such as memory impairment, skeletal muscle diseases such as muscular dystrophy / polymyositis, infertility, spleen disease, congenital diarrhea, hemorrhagic predisposition, thrombus formation tendency, The possibility of relating to malignant hyperthermia and autism can be estimated, and it can be used as a target for diagnostics and therapeutics for these diseases.
[0262]
(9) c-brhip 3009181 (SEQ ID NOs: 9 and 19)
c-brhip 3009181 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”) comprises 4010 bases as shown in SEQ ID NO: 9, of which base number 1140 Up to 3506 are open reading frames (including stop codon). The amino acid sequence predicted from the open reading frame consists of 788 amino acid residues (SEQ ID NO: 19).
[0263]
When homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 19, database registration symbol of NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) P19838, Nuclear factor NFκB p105 subunit (Human) was a hit.
As its contents, P19838 consists of 968 amino acids, and 190-968 in the amino acid sequence is amino acid numbers 10-788 of the amino acid sequence described in SEQ ID NO: 19, e-value: 0.0, and 779 amino acid residues. It hit with 100% match.
NFκB is known as one of disease-related transcriptional regulators that regulate the expression of genes involved in carcinogenesis, inflammation, and apoptosis.
From the alignment of BLAST search, this protein differs from P19838 by 9 residues at the N-terminus, and P19838 differs from this protein by 189 residues. Further, in this DNA, on alignment, M58603 (DNA sequence corresponding to P19838) differs from the 5 'end by 1165 bases, and M58603 differs from this DNA by 963 bases. This DNA has base number 1140, and M58603 has base number 398, which are the translation start points, and this causes a difference in the N-terminus of the amino acid sequence.
[0264]
When the protein feature search by HMMPFAM was performed on the amino acid sequence of SEQ ID NO: 19, the amino acid sequence shown in amino acid numbers 70 to 170 showed the sequence showing the characteristics of IPT / TIG domain (amino acid sequence entered as TIG in Pfam). I found it. This domain has an immunoglobulin-like fold and is found not only in intracellular transcription factors with DNA-binding ability, but also in cell surface receptors.
Also, Death domain (amino acid sequence entered as death in Pfam) was found at amino acid numbers 637 to 712. This domain exists at the C-terminus, and is known to interact with the cytoplasmic portion of the receptor by regulating multimer formation of cell surface receptors such as FAS and TNF, and to transmit signals that induce apoptosis. ing.
Furthermore, Ankyrin repeat (amino acid sequence entered as an ank in Pfam) was found at amino acid numbers 362 to 394, 401 to 433, 434 to 466, 470 to 502, 504 to 537, and 538 to 570. This has a function as a protein-protein interaction domain, and it is known that an ankyrin isoform has a splice variant having Death domain at the C-terminus.
Furthermore, the presence of Rel homology domain region (amino acid sequence entered as RHD in Pfam) was observed at amino acid numbers 2 to 62 of this protein. This domain consists of structurally different domains. The N-terminal domain is a domain in which a similar structure is found in p53, and the C-terminal domain has an immunoglobulin-like fold that binds to DNA.
This Rel homology domain is also present at amino acid numbers 41 to 242 of P19838, but by comparison, it can be seen that the domain of this protein is shorter and the N-terminal side of Rel homology domain is missing.
NFκB is normally inactive by forming a complex with IκB in the cytoplasm, but IκB is released by active oxygen generated by inflammation or the like, and NFκB moves to the nucleus to induce gene transcription. In addition, it is known that stimulation from extracellular TNF or IL-1 is transmitted to the NFκB / IκB complex by the protein kinase cascade, and the complex is phosphorylated and activated.
Based on the characteristics of the sequence, this protein may have a transcriptional activity and a function different from those of P19838 in the above-described pathway of Nuclear factor NFκB.
[0265]
In order to clarify the exon structure of this DNA and M58603 cDNA, software sim4 (Genome Res. 8, 967-74 (1998)) for mapping the cDNA sequence to the genomic sequence was used to align the genomic sequence. The DNA sequence was mapped to 17 exons on human chromosome 4, and the M58603 sequence was mapped to 24 exons. All exons of this DNA are almost identical to the 8th to 24th exons of M58603, but the 1st to 7th exons of M58603 are not present in this DNA.
These differences may cause differences in binding and interaction with DNA, expression tissues, expression levels, and the like. From the above, the protein of SEQ ID NO: 19 is a splicing variant of P19838, Nuclear factor NFκB p105 subunit (Human).
[0266]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is The nucleus was 39.1%, mitochondria 21.7%, cytoplasm 17.4%, peroxisome 8.7%, vacuole 4.3%, secretory vesicle 4.3%, and endoplasmic reticulum 4.3%.
Since NFκB moves from the cytoplasm to the nucleus and activates various transcriptions, this distribution suggests that this protein may be a splicing variant of NFκB.
[0267]
According to Disease Browser (http://www.ensembl.org/Homo_sapiens/disseaseview) in the annotation information database Ensembl of the eukaryotic genome, it includes the position (q24) on the 4th chromosome where this DNA is mapped. The cause loci for psoriasis and dentinal dysplasia are present in q, and the location is not specified, but the cause locus for neonatal neutropenia may also be present on chromosome 4. all right. From the above, the possibility that this DNA is a causative gene of this disease and the possibility that mutations of this DNA containing splicing variants can be applied to the diagnosis of these diseases were expected.
[0268]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-50Extracting tissues with 5 or more hits in human ESTs hit in, normal human placenta, lungs, intestines, bones, immune system, lymphatic system, spleen, fetal liver, fetal eye, cancerous The immune system, intestines, and lungs. This DNA was cloned from a hippocampal cDNA library. Pigment Cell Res. 14 (6): 456-65 (2001) states that p105 is more highly expressed in metastatic melanoma cells than in normal human melanocytes.
[0269]
This protein has functions and diseases peculiar to these tissues and cells, such as lung cancer, colon cancer, small intestine cancer, myeloma, leukemia, lymphoma, liver cancer, melanoma, Alzheimer's disease, Parkinson's disease, chorea May be related to neurodegenerative diseases such as memory impairment, inflammatory diseases such as pneumonia / hepatitis, immune system diseases, allergic diseases, spleen diseases, infertility, psoriasis, dentin dysplasia, neutropenia It can be guessed, and it can be used as a target for diagnostics and therapeutics for these diseases.
[0270]
(10) c-best 2001444 (SEQ ID NOs: 10 and 20)
c-best 2001444 (hereinafter referred to as “the present DNA”, and the protein encoded by the DNA is referred to as “the present protein”), as shown in SEQ ID NO: 10, consists of 2709 bases, of which base number 469 Up to 1437 is an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 322 amino acid residues (SEQ ID NO: 20).
[0271]
When homology search was performed on the amino acid sequence of SEQ ID NO: 20 using BLAST, the database registration symbol of the NRDB protein database (database of non-overlapping amino acid sequences created from SWISS-PROT, PIR, TREMBLE, GENPEPT, PDB) AJ009936, Nuclear hornone receptor PRR1-C (Human) was a hit.
As its contents, AJ009936 consists of 379 amino acids, and 58 to 379 in the amino acid sequence are amino acid numbers 1 to 322 of the amino acid sequence shown in SEQ ID NO: 20, e-value: 0.0, and 322 amino acid residues. It hit with 100% match.
Pregnane X receptor (PXR) is known to form a heterodimer with Retinoid X receptor (RXR), and to induce expression of cytochrome P450 such as CYP2 and CYP3 involved in drug metabolism, and other transporters involved in xenobiotic metabolism. ing. Since cytochrome P450 is involved not only in the metabolism of many pharmaceuticals but also in drug interactions that cause drug efficacy and side effects, it is important to observe changes in the transcriptional activity of PXR. CYP3A is also involved in the metabolism of steroid hormones and bile acids, indicating that cytochrome P450, whose expression is regulated by PXR, is widely involved in xenobiotic metabolism.
From the alignment of the BLAST search, this protein is 57 residues shorter than the AJ009936 at the N-terminus. In addition, this DNA differs from AJ009936 in the 5 ′ end by 463 bases on alignment, and AJ009936 differs from this DNA by 2170 bases. This DNA has base number 469, and M58603 has base number 1771, which is the translation start point, and this causes a difference in the N-terminus of the amino acid sequence.
[0272]
When the protein feature search of the amino acid sequence of SEQ ID NO: 20 was performed by HMMPFAM, the amino acid sequence shown in amino acid numbers 136 to 317 showed a characteristic of Ligand-binding domain of nuclear homone (amino acid entered in Pfam as harmonie_rec) Sequence). This domain is known to form a hydrophobic pocket of α-helix structure in the nuclear receptor and bind to ligands such as steroid hormones with high affinity. The activity is activated or suppressed, and the expression level is regulated.
In addition, Zinc fingers, C4 type (two domains) (amino acid sequence entered as Pfam as zf-C4) was also extracted from AJ009936 at amino acid numbers 62 to 138. This domain has a conserved cysteine-rich DNA-binding region and is a eukaryotic steroid hormone, active vitamin D.3It is found in the nuclear receptor family such as retinoic acid and thyroid hormone.
[0273]
PROSITE (Nucleic Acids Res. 30, (1) 235-8. (2002)), which is a database of amino acid patterns in which domain structures and families are classified based on similarity of protein functions and can search for functionally important sites According to AJ009936, the amino acid numbers 64 to 91 also have a STEROID_FINGER region. This part is the DNA binding region of the hormone receptor in the nucleus.
Since these two domains and regions do not exist in this protein, this protein differs from AJ009936 in the state of binding to hormones and binding to DNA in the nucleus, and as a result, the transcription activity also changes and CYP3 There is a possibility that the expression is suppressed.
[0274]
In order to clarify the exon structure of this DNA and AJ009936 cDNA, software sim4 (Genome Res. 8, 967-74 (1998)) that maps the cDNA sequence to the genomic sequence was used to align the genomic sequence. This DNA sequence was mapped to 6 exons on human chromosome 3, and the AJ009936 sequence was mapped to 10 exons. All exons of this DNA are almost identical to the 4th to 9th exons of AJ009936, but the 1st to 3rd and 10th exons of AJ009936 are not present in this DNA.
These differences may cause differences in binding and interaction with DNA, expression tissues, expression levels, and the like. From the above, the protein of SEQ ID NO: 20 is a splicing variant of AJ009936, Nuclear harmone receptor PRR1-C (Human).
[0275]
Analysis by PSORT II (Trends Biochem. Sci. 24, (1) 34-6 (1999)), which is a program for predicting intracellular localization of the protein, reveals that the probability of localization of this protein in the cell is The cytoplasm was 56.5%, the nucleus was 30.4%, the mitochondria was 8.7%, and the Golgi body was 4.3%. The probability of localization of AJ009936 is 82.6% in the nucleus, 8.7% in the cytoplasm, and 8.7% in the mitochondria, and this protein has a high probability of localization in the cytoplasm. Therefore, this protein may have a different localization from AJ009936.
[0276]
According to the Disease Browser (http://www.ensembl.org/Homo_sapiens/diseseview) in the annotation information database Ensembl of the eukaryotic genome, the position (q13.31) on the third chromosome where this DNA is mapped is shown. It was found that Chlocot-Marie-Tooth disease included in q13-21, familial hypoparathyroidism and familial tremor in q13, and the causal locus of myotonic dystrophy in q. From the above, the possibility that this DNA is a causative gene of this disease and the possibility that mutations of this DNA containing splicing variants can be applied to the diagnosis of these diseases were expected.
[0277]
When this protein was expressed using a wheat germ cell-free protein synthesis system, in Example 4, a consensus target sequence such as NF-1A1: CGTTGGGGTTTGGCACGGGGCCA (SEQ ID NO: 41), a target sequence of RF-X1: GGTAACATAGCAAC (sequence) No. 42), YY1 target sequence: CGGCCATCTTGGGCT (SEQ ID NO: 55), Snail target sequence: CACCGTTTTTCA (SEQ ID NO: 57), Evi-1 target sequence: AGATAGATATAA (SEQ ID NO: 59), Ikaros and other consensus target sequences: TTGGGAGG (SEQ ID NO: 60), HNF-1A target sequence: GGTTAATGATTACACCAC (SEQ ID NO: 64), Nkx-2.2 and other consensus target sequences: TTAAGTGGTTT (SEQ ID NO: 65), consensus target sequences such as Oct-1A: ATGCAAAT (SEQ ID NO: 66), consensus target sequences such as Oct-2: TATTTGCAT (SEQ ID NO: 67), consensus target sequences such as Pax-3: CGTCACGCTTTGA (SEQ ID NO: 68) ), Pax-1 target sequence: CCGTTCCCGCTCTAGATAT (SEQ ID NO: 69), consensus target sequences such as NF-ATc: AGGAAAA (SEQ ID NO: 75), MEF-2A target sequence: CCTAAAAATA (SEQ ID NO: 79), SRF target sequence : CCATATATGGACAT (SEQ ID NO: 80) and E2 target sequence: AACCAAAAACGGTAA (SEQ ID NO: 81). Therefore, this protein has DNA binding ability, and is caused by abnormalities such as proliferation of hematopoietic cells and hepatocytes, generation and differentiation of immune system cells, lipid metabolism, muscle formation, such as diseases such as lifestyle-related diseases. The relation of is considered. Further, according to Example 5, the activity of PPAR is slightly strongly suppressed, lifestyle diseases such as diabetes and obesity due to abnormal endocrine / sugar / lipid metabolism, etc., circulatory system diseases due to abnormal vascular function, inflammation, etc. It was speculated to be related to cancer and the like. Moreover, it has the activity which suppresses the effect | action which NF (kappa) B has, and it was estimated that it is related to immune diseases, inflammatory diseases, cancer, etc., such as rheumatoid arthritis and osteoarthritis.
[0278]
In order to examine the expression tissue of this DNA, BLAST search is performed on dbEST (Nature Genetics 4, (4) 332-3 (1993)) using this DNA as a query, and e-value ≦ 10-04When the tissue in which the hit was found was extracted with the human EST that was hit in, the human normal fetal liver, fetal spleen, liver, stomach, intestine, and cancerous immune system were found. This DNA was cloned from a breast-derived cDNA library.
[0279]
This protein has functions and diseases peculiar to these tissues and cells, for example, cancers such as liver cancer, gastric cancer, colon cancer, small intestine cancer, leukemia and lymphoma, inflammatory diseases such as osteoarthritis, and immune systems such as rheumatoid arthritis Can be related to diseases, allergic diseases, diabetes, obesity, cardiovascular diseases, spleen diseases, infertility, familial hypoparathyroidism, familial tremor, myotonic dystrophy It can be used as a target for diagnostics and therapeutics.
[0280]
【The invention's effect】
Since the protein of the present invention and the DNA encoding the same have transcriptional regulatory activity and the like, the protein or a DNA encoding the same can be used to screen for a substance that modulates the activity, and the disease associated with the protein It is useful for the development of a medicine that can act on the like.
[0281]
[Sequence Listing]
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093
Figure 2005021093

Claims (15)

以下の(a)または(b)のタンパク質;
(a)配列番号11〜20のいずれかに記載のアミノ酸配列からなるタンパク質、
(b)配列番号11〜20のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸が欠失、置換および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するタンパク質。
The following protein (a) or (b):
(A) a protein comprising the amino acid sequence of any one of SEQ ID NOS: 11 to 20,
(B) A protein comprising an amino acid sequence in which one or several amino acids are deleted, substituted and / or added in the amino acid sequence of any one of SEQ ID NOs: 11 to 20, and having transcriptional regulatory activity.
請求項1に記載のタンパク質をコードするDNA。DNA encoding the protein according to claim 1. 請求項1に記載のタンパク質をコードする完全長cDNA。A full-length cDNA encoding the protein of claim 1. 以下の(a)または(b)のいずれかのDNA;
(a)配列番号1〜10のいずれかに記載の塩基配列を有するDNA、
(b)配列番号1〜10のいずれかに記載の塩基配列において、1もしくは数個の塩基が欠失、置換および/または付加された塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA。
DNA of any of the following (a) or (b);
(A) DNA having the base sequence according to any one of SEQ ID NOs: 1 to 10,
(B) a protein having a base sequence in which one or several bases are deleted, substituted and / or added in the base sequence described in any of SEQ ID NOs: 1 to 10 and having transcriptional regulatory activity DNA to do.
請求項2〜4のいずれかに記載のDNAを含む組換えベクター。A recombinant vector comprising the DNA according to any one of claims 2 to 4. 請求項2〜4のいずれかに記載のDNAまたは請求項5に記載の組換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。A gene-transferred cell into which the DNA according to any one of claims 2 to 4 or the recombinant vector according to claim 5 has been introduced, or an individual comprising the cell. 請求項6に記載の細胞により産生される、請求項1に記載のタンパク質。The protein of claim 1 produced by the cell of claim 6. 請求項2〜4のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、および、当該センスまたはアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。A sense oligonucleotide having the same sequence as 5 to 100 consecutive bases in the base sequence of the DNA according to any one of claims 2 to 4, an antisense oligonucleotide having a sequence complementary to the sense oligonucleotide, and An oligonucleotide selected from the group consisting of oligonucleotide derivatives of the sense or antisense oligonucleotide. 請求項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。An antibody or a partial fragment thereof that specifically binds to the protein according to claim 1 or 7. 抗体がモノクローナル抗体である請求項9に記載の抗体。The antibody according to claim 9, wherein the antibody is a monoclonal antibody. モノクローナル抗体が請求項1または7に記載のタンパク質の転写調節活性を中和する作用を有することを特徴とする請求項10に記載の抗体。The antibody according to claim 10, wherein the monoclonal antibody has an action of neutralizing the transcriptional regulatory activity of the protein according to claim 1 or 7. 請求項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。A screening method for a substance that regulates the activity of the protein, comprising contacting the test substance with the protein according to claim 1 or 7, and measuring a change in activity of the protein by the test substance. 請求項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。A screening method for a substance that regulates the expression of DNA, comprising contacting the test substance with the gene-transferred cell according to claim 6 and detecting a change in the expression level of the DNA introduced into the cell. 請求項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報および/または請求項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。Information on at least one amino acid sequence selected from the amino acid sequence of the protein according to claim 1 and / or information on at least one base sequence selected from the base sequence of the DNA according to any one of claims 2 to 4. A computer-readable recording medium storing the data. 請求項1に記載のタンパク質および/または請求項2〜4のいずれかに記載のDNAを結合させた担体。A carrier to which the protein according to claim 1 and / or the DNA according to any one of claims 2 to 4 are bound.
JP2003191215A 2003-07-03 2003-07-03 New protein and dna encoding the same Pending JP2005021093A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003191215A JP2005021093A (en) 2003-07-03 2003-07-03 New protein and dna encoding the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003191215A JP2005021093A (en) 2003-07-03 2003-07-03 New protein and dna encoding the same

Publications (1)

Publication Number Publication Date
JP2005021093A true JP2005021093A (en) 2005-01-27

Family

ID=34188899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003191215A Pending JP2005021093A (en) 2003-07-03 2003-07-03 New protein and dna encoding the same

Country Status (1)

Country Link
JP (1) JP2005021093A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009502159A (en) * 2005-07-28 2009-01-29 オンコステム ファルマ ソシエダッド リミタード Staged expression of snails as a marker of cancer growth and disease based on DNA damage

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009502159A (en) * 2005-07-28 2009-01-29 オンコステム ファルマ ソシエダッド リミタード Staged expression of snails as a marker of cancer growth and disease based on DNA damage

Similar Documents

Publication Publication Date Title
Niceta et al. Mutations impairing GSK3-mediated MAF phosphorylation cause cataract, deafness, intellectual disability, seizures, and a down syndrome-like facies
Shenk et al. Expression of Cnox-2, a HOM/HOX homeobox gene in hydra, is correlated with axial pattern formation
US8071293B2 (en) PRRG4-associated compositions and methods of use thereof in methods of tumor diagnosis
Martens et al. Genomic organisation, chromosomal localisation tissue distribution and developmental regulation of the PR61/B′ regulatory subunits of protein phosphatase 2A in mice
JP2005021093A (en) New protein and dna encoding the same
JP2005052101A (en) New protein and dna encoding the same
JP7410480B2 (en) Fusion genes in cancer
Tsutsumi et al. Screening of genes involved in chromosome segregation during meiosis I: in vitro gene transfer to mouse fetal oocytes
JP2004229642A (en) Protein and dna encoding the same
JP2004261179A (en) New protein and dna encoding the same
JP2005237384A5 (en)
WO2003089466A1 (en) Novel proteins and dnas encoding the same
WO2004099408A1 (en) Novel protein and dna coding for the same
JP2006174701A (en) New protein and dna encoding the same
KR20230083828A (en) Genes in chicken blood tissue responding to high temperature stress and uses thereof
JP3824700B2 (en) Human SIM gene
JP2004041179A (en) New protein and dna encoding the same
JPWO2002024903A1 (en) Testing methods for allergic diseases
JP2004229643A (en) Protein and dna encoding the same
JP2004229646A (en) New protein and dna encoding the same
JP2005245274A (en) Cell proliferation promoter
JP2004229650A (en) New protein and dna encoding the same
JP2004041180A (en) New protein and dna encoding the same
US20030108915A1 (en) Glioblastoma multiforme associated protein GliTEN
JP2004229649A (en) New protein and dna encoding the same