JP2004283094A - New polypeptide having immunoglobulin-like repeated domain and sequence rich in proline, and dna encoding the same - Google Patents

New polypeptide having immunoglobulin-like repeated domain and sequence rich in proline, and dna encoding the same Download PDF

Info

Publication number
JP2004283094A
JP2004283094A JP2003079713A JP2003079713A JP2004283094A JP 2004283094 A JP2004283094 A JP 2004283094A JP 2003079713 A JP2003079713 A JP 2003079713A JP 2003079713 A JP2003079713 A JP 2003079713A JP 2004283094 A JP2004283094 A JP 2004283094A
Authority
JP
Japan
Prior art keywords
polypeptide
dna
present
amino acid
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003079713A
Other languages
Japanese (ja)
Inventor
Hisashi Koga
比佐志 古閑
Osamu Obara
收 小原
Akihiko Koseki
明彦 古関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Kazusa DNA Research Institute Foundation
Original Assignee
Japan Science and Technology Agency
Kazusa DNA Research Institute Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency, Kazusa DNA Research Institute Foundation filed Critical Japan Science and Technology Agency
Priority to JP2003079713A priority Critical patent/JP2004283094A/en
Publication of JP2004283094A publication Critical patent/JP2004283094A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a new DNA and a gene containing the DNA, useful for screening or the like of a prophylactic drug, a therapeutic drug or an examination drug concerning general proliferation, differentiation and maintenance of the functions of each kind of internal organs, and concerning the proliferation, differentiation and maintenance of the functions of cells, such as them for cancer, autoimmune disease and allergy; to provide a new polypeptide encoded by the DNA, a recombinant protein containing the polypeptide, and an antibody against the new polypeptide. <P>SOLUTION: The DNA comprises a base sequence encoding a polypeptide of the following (a) or (b): (a) a polypeptide comprising a part or the whole of the same or substantially same amino acid sequence as an amino acid sequence having an immunoglobulin-like repeated domain and an amino acid sequence rich in proline; and (b) a polypeptide comprising an amino acid sequence obtained by deleting, substituting or adding a part of amino acids from, with or to the amino acid sequence represented by (a), and having substantially the same bioactivities as those of the polypeptide of the (a). <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、イムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有し、各種臓器に普遍的に発現が認められる新規DNA及び該DNAを含む遺伝子、該DNAにコードされる新規ポリペプチド及び該ポリペプチドを含む組換え蛋白質、並びに、新規ポリペプチドに対する抗体等に関する。
【0002】
【従来の技術】
近年のヒトゲノムプロジェクト及びヒトcDNAプロジェクトの成功により、多くのヒト疾患関連遺伝子が同定あるいは推定されるにいたった。しかしながらその一方で倫理上の問題からヒト遺伝子を用いた研究には制約があり、新たな研究の方向性が模索されている。このような観点からモデル生物における相同遺伝子を同定することは、研究を進展させる意味できわめて重要なステップと考えられる。特にマウスは最も研究が進んでいるモデル生物で、ゲノム情報や変異種の情報も比較的多く蓄積されているが、蓄積されたゲノム情報はまだ十分なものではない。一方、生体内で発現している遺伝子を解析する手段として、cDNAの配列をランダムに解析する研究がなされ、得られたcDNAの断片配列がExpressed Sequence Tag(EST)としてデータベースに登録、公開がなされた。しかし、多くのESTは100塩基長から500塩基長といった短い塩基配列情報のみであり、その機能を推定することは困難である。
【0003】
各種臓器においては、多くのホルモン、ホルモン様物質、神経伝達物質あるいは生理活性物質による調節のもとで生理的な機能の調節が行なわれている。また、各種臓器における機能の調節には、機能を受け持つ特異的な細胞の増殖あるいは同細胞の活性化が関係している。従って、各種臓器に普遍的に強く発現している新規な遺伝子を取得して、その遺伝子にコードされる各種臓器に普遍的でかつ複雑な機能を調節する蛋白質を得ることは、医薬品開発に有用である。また、得られた蛋白質に対するアゴニスト、アンタゴニストを効率よくスクリーニングし、医薬品を開発するためには、生体内で発現している該蛋白質の遺伝子の機能をホモロジー検索から推定し、その情報を基にして該蛋白質を適当な発現系で発現させて組換え蛋白質を得、更にして該蛋白質に特異的に結合する抗体を得ることが必要であった。
【0004】
長鎖ヒトcDNAプロジェクトにて、ヒト脳由来のヒトKIAA0992遺伝子 (Nagase,T., Ishikawa,K., Suyama,M., Kikuno,R., Hirosawa,M., Miyajima,N., Tanaka,A., Kotani,H., Nomura,N. and Ohara,O., Prediction of the coding sequences of unidentified human genes. XIII. The complete sequences of 100 new cDNA clones from brain which code for large proteins in vitro., DNA Res. 6:63−70 (1999))が報告されているが、その機能については不明であった。ヒトKIAA0992遺伝子は染色体4q32.3に存在し、更に、ヒトKIAA0992遺伝子のSNPsも複数箇所報告されており(http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?CMD=search&DB=snp)、ヒト疾患の大部分が単なる遺伝子の欠失によって引き起こされるのではなくて、アミノ酸置換によって蛋白質の機能や活性が一部分だけ変化することにより引き起こされることを鑑みると、ヒトKIAA0992遺伝子は各種臓器の分化やその機能保全に関わる、あるいは癌、自己免疫疾患、及びアレルギーといった細胞の増殖・分化に関わる疾患に関与している可能性が考えられる。ヒトKIAA0992遺伝子にコードされるポリペプチドにはイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する遺伝子ファミリーに属していることが判明していた。すなわち、ヒトKIAA0992遺伝子がコードするポリペプチドのアミノ酸配列は、N−末端側にプロリンに富む特徴的な配列を、C−末端側に2個のイムノグロブリン様繰り返しドメインを有する772アミノ酸長であった。本出願のmph02462遺伝子がコードするポリペプチドのアミノ酸配列は、1,081アミノ酸長とヒトKIAA0992と比較し長く、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメイン、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する配列という三つの重要な領域が認められ、N−末端付近のイムノグロブリン様繰り返しドメインが存在することになり、それにより補強された強力な機能を推定することが可能となった。
【0005】
【非特許文献1】
1. 宮坂昌之監修、接着分子ハンドブック、秀潤社、2000.11, pp188
第2部 免疫グロブリンス−パーファミリー
【非特許文献2】
2. Parast,MM & Otey CA, 2000, J. Cell Biol., 150:643−655
Characterization of palladin, a novel protein localized to stress fibers
and cell adhesions.
【非特許文献3】
3. Boukhelifa M, Parast MM, Valtschanoff JG, LaMantia AS, Meeker RB, Otey CA.
2001, Mol Biol Cell,. 12:2721−2729.
A role for the cytoskeleton−associated protein palladin in neurite outgrowth.
【非特許文献4】
4. Mykkanen OM, Gronholm M, Ronty M, Lalowski M, Salmikangas P, Suila H,
Carpen O.
2001, Mol Biol Cell., 12:3060−3073.
Characterization of human palladin, a microfilament−associated protein.
【非特許文献5】
5. Reinhard, M, Reinhard M, Giehl K, Abel K, Haffner C, Jarchau T, Hoppe V, Jockusch BM, Walter U., 1995, EMBO J., 14:1583−1589
The proline−rich focal adhesion and microfilament protein VASP is a ligand for profilins.
【非特許文献6】
6. Niebuhr K, Ebel F, Frank R, Reinhard M, Domann E, Carl UD, Walter U, Gertler FB, Wehland J, Chakraborty T., 1997, EMBO J., 16:5433−5444
A novel proline−rich motif present in ActA of Listeria monocytogenes and cytoskeletal proteins is the ligand for the EVH1 domain, a protein module present in the Ena/VASP family.
【0006】
【本発明が解決しようとする課題】
従来、ヒト長鎖cDNAプロジェクトでヒトKIAA0992遺伝子が取得されていたが、遺伝子情報が完全でなく、その機能に関する情報も不完全であった。一方、各種臓器に普遍的にで発現する新規遺伝子を取得し、該遺伝子、該遺伝子がコードする蛋白質あるいはその蛋白質に特異的に結合する抗体を得ることは、細胞内で該蛋白質が他の蛋白質との結合を阻害する化合物を、あるいはシグナル伝達等に影響及ぼす化合物をスクリーニングするのに重要である。
【0007】
従って、ヒトKIAA0992遺伝子に関連する新規遺伝子を取得し、新規モチ−フを取得し、同遺伝子の組織特異的発現パターンを得て、本発明の新規遺伝子がコードする蛋白質の機能に関する情報を得ることは、本発明のポリペプチドの特異的結合蛋白質や、アゴニスト、アンタゴニストを検索する際の非常に重要な手段となる。上記のポリペプチドに対する特異的結合蛋白質が見出されなくても、本発明のポリペプチドの不活化実験(例えばノックアウト動物の作製)からそのポリペプチドの生理作用を解析することにより、本発明のポリペプチドに対するアゴニストまたはアンタゴニストを作製することが可能であり、本発明のポリペプチドに対する特異的結合蛋白質、アゴニストまたはアンタゴニストなどは、各種臓器に関わる疾患の患者の機能不全に関連する疾患の予防あるいは治療薬や診断薬として活用することが可能となる。生体での本発明のポリペプチドの機能の低下または昂進が、各種臓器に関わる疾患の原因となっている場合が考えられる場合がある。この場合には、そのポリペプチド該蛋白質に対するアンタゴニストやアゴニストの投与だけでなく、そのポリペプチドの各種臓器をターゲットとした本発明のポリペプチド投与や、そのポリペプチドをコードする遺伝子に対するアンチセンス核酸の投与、あるいは該遺伝子を用いた遺伝子治療に応用することもできる。この場合には本発明のポリペプチドをコードする塩基配列は、本発明のポリペプチドの各種臓器に関わる疾患の患者の遺伝子欠失や変異の有無を調べるために必要な情報であり、本発明のポリペプチドをコードする遺伝子は、本発明のポリペプチドの機能不全に関与する疾患の予防あるいは治療薬や診断薬に応用することが出来る。
【0008】
【課題を解決するための手段】
本発明者は、鋭意研究を重ねた結果、マウス胎児尾芽由来のcDNAライブラリーから、ヒトKIAA0992遺伝子に高いホモロジーを示す遺伝子(DNA)をクローニングし、その遺伝子がコードするポリペプチドのN−末端側にヒトKIAA0992遺伝子になかった全く新しい配列が付加していること、また、得られた遺伝子が各種臓器に普遍的に発現していることを発見した。更に、得られた遺伝子情報を解析することにより、本発明のその遺伝子がコードするポリペプチドには、ヒトKIAA0992遺伝子と同様にプロリンに富む配列とそれに続く3つのイムノグロブリン様繰り返しドメインが存在すること、それに加えて本発明のポリペプチドのN−末端側に付加された新規配列の中には、2つのイムノグロブリン様繰り返しドメインが存在することを発見し、それらのドメインが細胞内の重要な機能に係わっていることを示し、更にその遺伝子情報をもとに新規ポリペプチドとそれに特異的な抗体を得て、本発明を完成するに至った。
【0009】
即ち、本発明は第一の態様として、以下の(a)又は(b)のポリペプチドをコードする塩基配列から成るDNA:(a)配列番号:1で示されるアミノ酸配列と同一又は実質的に同一のアミノ酸配列の一部(例えば、以下に示すイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する配列の少なくとも一つを有するもの、又は、配列番号1で示されるアミノ酸配列において79番目(メチオニン)〜1,081番目(ロイシン)の1,003個のアミノ酸から成るポリペプチド)又は全部から成るポリペプチド;又は(b)配列番号:1で示されるアミノ酸配列において、一部のアミノ酸が欠失、置換又は付加されたアミノ酸配列から成り、(a)のポリペプチドの一部又は全部と実質的に同質の生物学的活性を有するポリペプチド、に係る。
本発明の第二の態様として、以下の(a)、(b)又は(c)のDNA:(a)配列番号:2で示される塩基配列において、配列番号:1で示されるアミノ酸配列(配列番号:2の塩基対第230〜3,472番目)の一部(例えば、以下に示すイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する配列の少なくとも一つを有するもの、又は、配列番号1で示されるアミノ酸配列において79番目(メチオニン)〜1,081番目(ロイシン)の1,003個のアミノ酸から成るポリペプチド)又は全部をコードするDNA;(b)(a)のDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズするDNA;又は(c)(a)のDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズし、(a)のポリペプチドの一部又は全部と実質的に同質の生物学的活性を有する蛋白質をコードするDNAに係る。以上の本発明の第一及び第二の態様であるDNAをまとめて、以下、「本発明のDNA」ともいう。本発明のDNAは、新規ポリペプチドをコードするものである。又、本発明はこれらDNAを含む哺乳動物由来遺伝子、哺乳動物が齧歯類である齧歯類由来遺伝子、特に齧歯類がマウスであるマウス遺伝子にも係る。特に、マウス遺伝子は「マウスKIAA0992遺伝子」ともいう。
更に、本発明は本発明のDNA又は遺伝子(KIAA0992遺伝子)にコードされるポリペプチド(以下、「本発明のポリペプチド」ともいう。)、例えば、本発明のDNA又は遺伝子を導入した宿主細胞で作製される組換え蛋白質であるポリペプチド(以下、「KIAA0992蛋白質」ともいう)に係る。
また、本発明は、本発明のDNA又は遺伝子を含む組換えベクター、及び、本発明のポリペプチド若しくはその部分ペプチド又は該ポリペプチドを含む組換え蛋白質を又はそれらの塩に特異的に結合する抗体に係る。
【0010】
また、本発明のDNA及び該DNAを含む遺伝子、該DNAにコードされる新規ポリペプチド及び該ポリペプチドを含む組換え蛋白質、該ポリペプチドに対する抗体を用いることによって、該蛋白質の発現量を変化させる化合物、該蛋白質に結合する蛋白質との結合性を変化させる化合物(アンタゴニスト、アゴニスト)のスクリーニング方法、該スクリーニング用キット、該スクリーニング方法などを提供する。更に、本発明ポリペプチド若しくはその部分ペプチド又は該ポリペプチドを含む組換え蛋白質を又はそれらの塩を用いることを特徴とする、それら物質と特異的に結合する物質のスクリーニング方法、並びにスクリーニング用キット等も提供する。
【0011】
更に、本発明は、本発明のDNA、本発明のDNAを含有する組換えベクター又は発現ベクター、該ベクターを保持する形質転換体、該形質転換体を培養し、本発明のポリペプチドの一部あるいは全長のポリペプチドを含む組換え蛋白質を生成、蓄積せしめ、これを採取することを特徴とする、本発明のポリペプチド若しくは該ポリペプチドを含む組換え蛋白質、又はその塩の製造方法、及び、こうして得られる本発明のポリペプチドの一部あるいは全長のポリペプチドを含む組換え蛋白質またはその塩を提供する。又、本発明は、本発明のDNAを含有してなる医薬、本発明のポリペプチド若しくはその部分ペプチド又は該ポリペプチドを含む組換え蛋白質をコードするDNAに実質的に相補的な塩基配列を有するアンチセンスヌクレオチド又はそれらを含有してなる医薬、本発明のポリペプチド若しくはその部分ペプチド又は該ポリペプチドを含む組換え蛋白質を含有してなる医薬を提供する。
更に、本発明は、本発明DNA、本発明ポリペプチド、その部分ポリペプチド若しくは該ポリペプチドを含む組換え蛋白質、又は、本発明のDNA又は遺伝子に対する抗体を網羅的に作成し、それらを集積させて得られる、所謂、DNAチップ(アレイ)、プロテインチップにも係る。
【0012】
【発明の実施の形態】
本発明のDNAは、本発明者により採取されたマウス胎児尾芽由来mRNAを出発材料として、本発明者が調製したcDNAライブラリーから、cDNA断片として単離した後に、塩基配列を決定し同定したものである。即ち、具体的には、小原他の方法(DNA Research,2002,9:47−57)に従って調製したマウス胎児尾芽由来のcDNAライブラリーから、約16,608個の組換え体を選択し、その全ての3’末端DNA配列を決定し、その中から、ヒトKIAA0992遺伝子に高い相同性を有するクローンを選択し全塩基配列の決定を行なった。次に、こうして得られた全塩基配列に基づき、DNA解析プログラム(GCG, Fasta& Blast)を用いてホモロジー検索を行なった
その結果、ヒトKIAA0992遺伝子がコードするアミノ酸配列(772アミノ酸長)のほぼ全長(20−772番目,752アミノ酸長)と本発明の配列番号:1で示されるアミノ酸配列 (1,081アミノ酸長)の330番目から1,081番目までの752アミノ酸長の配列とで、約88.35%という有意な相同性を有する、配列番号:2に示される塩基配列を有するクローンを取得した(クローン名:mph02462)。
【0013】
取得したmph02462にコードされるポリペプチド(本発明のポリペプチド)のアミノ酸配列は1,081アミノ酸であり、ヒトKIAA0992遺伝子(DNA Research,1999,6:63−70: NCBI−GenBank Accession No. AB023209)にコードされている蛋白のアミノ酸配列の772アミノ酸長に比較し相同部分を除外すると、N−末端側に329アミノ酸長長く伸びていた。得られた「本発明のポリペプチド」のアミノ酸配列について、以下の実施例に記載したようにホモロジー検索を行った結果、「本発明のポリペプチド」ではヒトKIAA0992遺伝子にコードされているポリペプチドに比較し、N−末端側の329番目(329アミノ酸)のアミノ酸配列が新規に付加されていることが判明した。
マウスKIAA0992遺伝子にコードされているポリペプチドの全長アミノ酸に対し、公共のデーターベースを用いてホモロジー検索を行った。
その結果、国際公開番号WO200055351−A1(発明の名称: Human colon cancer antigen protein sequence, SEQ ID NO:1004, Applicant: HUMAN GENOME SCI INC., Publication date: 21, Sep. 2000)のHuman colon cancer antigen protein sequence, 544アミノ酸長)の32−544番目のの513アミノ酸長のアミノ酸配列と、本発明のポリペプチド(1,081アミノ酸長)の569番目から1,081番目の513アミノ酸長のアミノ酸配列に対し、比較的高いホモロジーが認められた(約94.3%)。
本発明の1,081アミノ酸配列は、公開されたHuman colon cancer antigen protein sequence, SEQ ID NO:1004 (544アミノ酸長)配列に対し、N−末端側に568アミノ酸長の新規配列が付加されている。WO200055351−A1のHuman colon cancer antigen protein sequence, SEQ ID NO:1004の出願では、単にポリペプチド断片のアミノ酸配列について各種疾病処置用蛋白質として記載しているのみで、その機能については不明である。544アミノ酸長のアミノ酸配列に対し、本発明のポリペプチドの1,081アミノ酸配列は長大であり、後に述べるようにその機能についても推定可能で有用である。
また、国際公開番号WO200058473−A2(発明の名称: Human ORFX ORF2526 polypeptide sequence SEQ ID NO:5052, Applicant: CURAGEN CORP., Publication date:8, Feb. 2001)のHuman ORFX ORF2526 polypeptide sequence SEQ ID, NO:5052, 433アミノ酸長)の7−433番目の427アミノ酸長のアミノ酸配列と、本発明のポリペプチド(1,081アミノ酸長)の655番目から1,081番目の427アミノ酸長のアミノ酸配列に対し、比較的高いホモロジーが認められた(約95.6%)。
さらに、国際公開番号WO200192523−A2(発明の名称: Human ORFX protein sequence SEQ ID NO:14742, Applicant: CURAGEN CORP., Publication date: 6, Dec. 2001)の Human ORFX protein sequence SEQ ID NO:14742, 162アミノ酸長)の2−162番目の配列(161アミノ酸長)と、本発明のポリペプチド(1,081アミノ酸長)の一部のアミノ酸配列55−215(161アミノ酸長)の配列とでやや高いホモロジーが認められた(約90.1%)。
Human ORFX protein sequence SEQ ID NO:14742 (162aa)は、単にポリペプチド断片のアミノ酸配列について各種疾病処置用蛋白質として記載しているが、その機能については不明である。162アミノ酸長のアミノ酸配列に対し、本発明の1,081アミノ酸配列は, N−末端側に54アミノ酸長の付加、及びC−末端側に866アミノ酸長の付加があり長大かつ、機能についても記載可能で有用である。
本発明のポリペプチドアミノ酸配列(1,081アミノ酸長)について、上記に示したように、今までに出願された配列における513アミノ酸長、427アミノ酸長、及び161アミノ酸長について比較的高いホモロジーが認められたが、それらの配列は、本発明のポリペプチドアミノ酸配列 (1,081アミノ酸長) の全長をカバーするものでなく、断片的に関連があるのみで、本発明の長鎖配列の解明により、ようやく新規配列蛋白とその機能を述べること可能となった。
尚、配列番号:2に示される塩基配列を有する本発明のDNAを含むプラスミド(プラスミド表示名: mph02462)は、茨城県つくば市東1丁目1番地1中央第6の独立行政法人産業技術総合研究所特許生物寄託センターに平成15年2月27日付けで寄託され、受託番号FERM P−19238が付されている。
【0014】
ヒトKIAA0992遺伝子の配列は4,347bp(DNA Research,1999,6:63−70, http://www.kazusa.or.jp/huge/gfpage/KIAA0992/)であり、コードされているポリペプチドのアミノ酸配列の長さは772アミノ酸である(DNA Research,1999,6:63−70: NCBI−GenBank Accession No. AB023209)。ヒトKIAA0992遺伝子ホモログを詳細に研究することにより、N−末端側にはさらにポリペプチドがコードされている可能性について検証される可能性がある。本発明のDNAにコードされているポリペプチドのアミノ酸配列の長さは1,081アミノ酸であるが、本発明のDNAに対するホモログについて更に詳細に研究することにより、N−末端側に更に伸張してポリペプチドがコードされていることを見つける可能性がある。
【0015】
尚、当業者であれば、本明細書によって初めて開示された配列番号:2に示した塩基配列に基づいてクローンの5’側に適当なプライマー(例えば、配列番号:2の塩基対第61〜80番目5’− CACCGTAGGCTGCCGGGAGC−3に対応させて合成した配列5’− GCTCCCGGCAGCCTACGGTG−3’ )を調製し、該プライマーと市販されている哺乳動物由来のmRNA、あるいは哺乳動物由来組織から調製した哺乳動物由来のmRNAとハイブリダイゼーションを行なった後に逆転写反応を行なうことにより本発明のDNAの上流側(遺伝子の5’側)の領域を含む新たなcDNA断片を特異的に合成することができる。合成した5’側の領域を含む新たなcDNA断片をプラスミドに挿入した後、配列番号2の一部分をプローブとして、コロニーハイブリダイゼーションのような相同性クローニングによって、本発明のDNAを含む哺乳動物由来KIAA0992遺伝子の全領域を調製することが可能である。あるいは他の方法で、例えば次のような方法を用いても遺伝子の5’側が更に伸張した塩基配列を得ることが出来る。すなわち、本発明のDNAをプローブとして用いれば、コロニーハイブリダイゼーションのような相同性クローニングによって、ヒトを含めた各種哺乳動物由来KIAA0992遺伝子の5’末端領域を調製することができる。更に、本発明のDNA配列及び本発明のポリペプチドのアミノ酸配列が開示されている以上、当業者であれば、これらの情報に基づき、ヒトを含めた各種哺乳動物由来KIAA0992遺伝子の5’末端領域を容易に取得することが出来る。又、短い断片や得られた配列に人工的な間違いが起こらないように十分な注意を払いながら、RACE等のPCR法を使用することによっても、ヒトを含めた各種哺乳動物由来KIAA0992遺伝子の全領域を調製することが可能である。
【0016】
本発明のDNAとしては、前述した本発明のポリペプチドをコードする塩基配列から成るものであればいかなるものであってもよい。各種哺乳動物由来の各種臓器、例えば、脳、心臓、肺、肝臓、脾臓、腎臓、精巣、胸腺、筋肉、骨髄等、あるいは発生の各段階の各種組織・細胞に由来するcDNAライブラリー等から同定・単離されたcDNA、又は、合成DNAのいずれでもよい。ライブラリー作成に使用するベクターは、バクテリオファージ、プラスミド、コスミド、ファージミドなどいずれであってもよい。また、前記した細胞・組織、あるいはそれらの細胞質よりtotalRNA画分またはmRNA画分を調製したものを用いて、直接ReverseTranscriptase Polymerase Chain Reaction(以下、「RT−PCR法」と略称する)によって増幅することもできる。
【0017】
配列番号:1で示されるアミノ酸配列と実質的に同一のアミノ酸配列とは、配列番号:1で示される全アミノ酸配列との相同性の程度が、全体の平均で約60%以上、好ましくは約80%以上、より好ましくは約90%以上であるアミノ酸配列を意味する。従って、本発明の配列番号:1で示されるアミノ酸配列と実質的に同一のアミノ酸配列から成るポリペプチドとしては、例えば、前記の配列番号:1で示されるアミノ酸配列に対して上記の相同性を有し、配列番号:1で示されるアミノ酸配列から成るポリペプチドと実質的に同質の生物学的活性を有するポリペプチドを挙げることが出来る。ここで、実質的に同質とは、それらの活性が性質的に同質であることを示す。又、本発明のポリペプチドには、例えば、配列番号:1で示されるアミノ酸配列中の一部(好ましくは、1〜20個程度、より好ましくは1〜10個程度、さらに好ましくは数個、又は、配列番号1で示されるアミノ酸配列において1〜78番目のアミノ酸)のアミノ酸が欠失、置換又は付加したアミノ酸配列、或いはそれらを組み合わせたアミノ酸配列から成り、配列番号:1で示されるアミノ酸配列から成るポリペプチドと実質的に同質の生物学的活性を有するポリペプチドも含まれる。
【0018】
更に、本発明のDNAは、例えば、配列番号:2で示される塩基配列において、配列番号:1で示されるアミノ酸配列をコードするDNA、又は、該DNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズし、好ましくは更に配列番号:1で示されるアミノ酸配列から成るポリペプチドと同質の生物学的活性を有するポリペプチド(蛋白質)をコードするDNAであればいずれのものでもよい。かかる条件下で、配列番号:2で示される塩基配列において、配列番号:1で示されるアミノ酸配列をコードするDNAと相補的な塩基配列からなるDNAとハイブリダイズできるDNAとしては、例えば、該DNAの全塩基配列との相同性の程度が、全体の平均で、約60%以上、好ましくは約80%以上、より好ましくは約90%以上である塩基配列を含有するDNA等を挙げることが出来る。ハイブリダイゼーションは、Molecular cloning third.ed.(Cold Spring Harbor Lab.Press,2001)に記載の方法等、当業界で公知の方法あるいはそれに準じる方法に従って行なうことができる。また、市販のライブラリーを使用する場合、添付の使用説明書に記載の方法に従って行なうことができる。ここで、「ストリンジェントな条件」とは、例えば、DIG DNA Labeling (ベーリンガー・マンハイム社製Cat No. 1175033)でプローブをラベルした場合に、32℃のDIG Easy Hyb溶液(ベーリンガー・マンハイム社製Cat No. 1603558)中でハイブリダイズさせ、40℃の0.1xSSC溶液(0.1%[w/v]SDSを含む)中でメンブレンを洗浄する条件(1xSSCは0.15MNaCl,0.015Mクエン酸ナトリウムである)でのサザンブロットハイブリダイゼーションで本発明ヒトDNAプローブにハイブリダイズする程度の条件である。
【0019】
本発明のDNAのクローニングの手段としては、本発明のポリペプチドの部分等の適当な塩基配列を有する合成DNAプライマーを用いてPCR法によって増幅するか、または適当なベクターに組み込んだDNAを本発明のポリペプチドの一部あるいは全領域をコードするDNA断片もしくは合成DNAを用いて標識したものとのハイブリダイゼーションによって選別することができる。ハイブリダイゼーションの方法は、例えば、Molecular cloning third.ed.(Cold Spring Harbor Lab.Press,2001)に記載の方法などに従って行なうことができる。また、市販のライブラリーを使用する場合、添付の使用説明書に記載の方法に従って行なうことができる。DNAの塩基配列の変換は、公知のキット、例えば、SuperScript II逆転写酵素キット(ギブコBRL社)等を用いて、Gapped duplex法やKunkel法などの公知の方法あるいはそれらに準じる方法に従って行なうことができる。クローン化されたポリペプチドをコードするDNAは目的によりそのまま、または所望により制限酵素で消化したり、リンカーを付加したりして使用することができる。該DNAはその5’末端側に翻訳開始コドンとしてのATGを有し、また3’末端側には翻訳終止コドンとしてのTAA、TGAまたはTAGを有していてもよい。これらの翻訳開始コドンや翻訳終止コドンは、適当な合成DNAアダプターを用いて付加することもできる。
【0020】
本発明のポリペプチドの発現ベクターは、当該技術分野で公知の方法に従って作成することが出来る。例えば、(1)本発明のDNA又は本発明のDNAを含む哺乳動物由来遺伝子を含有するDNA断片を切り出し、(2)該DNA断片を適当な発現ベクター中のプロモーターの下流に連結することにより製造することができる。発現ベクターとしては、大腸菌由来のプラスミド(例、pBR322,pBR325,pUC18,pUC118)、枯草菌由来のプラスミド(例、pUB110,pTP5,pC194)、酵母由来プラスミド(例、pSH19,pSH15)、λファージなどのバクテリオファージ、あるいはSV40、CMVウイルス、レトロウイルス、ワクシニアウイルス、バキュロウイルス、ウシパピローマウイルスなどの動物ウイルス由来配列を使用した発現ベクター等を利用することが出来る。本発明で用いられるプロモーターとしては、遺伝子の発現に用いる宿主に対応した適切なプロモーターであればいかなるものでもよい。例えば、宿主が大腸菌である場合は、trpプロモーター、lacプロモーター、recAプロモーター、λPLプロモーター、lppプロモーター、T7プロモーター、あるいはそれらプロモーターを組み合わせまたは複合させたプロモーターなどが、宿主が枯草菌である場合は、SPO1プロモーター、SPO2プロモーター、penPプロモーターなど、宿主が酵母である場合は、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーターなどが好ましい。動物細胞を宿主として用いる場合は、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMVプロモーター、HSV−TKプロモーター、HSPプロモーター、メタロチオネインプロモーターなどが挙げられる。
【0021】
発現ベクターには、以上の他に、所望により当該技術分野で公知の、エンハンサー、スプライシングシグナル、ポリA付加シグナル、選択マーカー、SV40複製オリジン(以下、SV40oriと略称する場合がある)等を付加することができる。また、必要に応じて、本発明のDNAにコードされた蛋白質を他の蛋白質(例えば、グルタチオンSトランスフェラーゼ、ヒスチジンタグ、カルモデュリンバインディング蛋白質、及びプロテインA等)との融合蛋白質として発現させることも可能である。このような融合蛋白質は、適当なプロテアーゼを使用して切断し、それぞれの蛋白質に分離することが出来る。
【0022】
宿主細胞としては、例えば、エシェリヒア属菌、バチルス属菌、酵母、昆虫細胞、昆虫、動物細胞などが用いられる。エシェリヒア属菌の具体例としては、エシェリヒア・コリ(Escherichia coli)K12由来のDH1(Proc. Natl. Acad. Sci. USA,60巻,160(1968)),JM103(Nucleic Acids Research,9巻,309(1981)),JA221(Journal of Molecular Biology,120巻,517(1978)),及びHB101(Journal of Molecular Biology,41巻,459(1969))、あるいはエシェリヒア・コリ(Escherichia coli)B株等が用いられる。バチルス属菌としては、例えば、バチルス・サチルス(Bacillus subtilis)MI114(Gene,24巻,255(1983)),207−21〔Journal of Biochemistry,95巻,87(1984)〕等が用いられる。酵母としては、例えば、サッカロマイセス セレビシエ(Saccharomyces cerevisiae)AH22,AH22R−,NA87−11A,DKD−5D,20B−12、シゾサッカロマイセス ポンベ(Schizosaccharomyces pombe)NCYC1913,NCYC2036、ピキア パストリス(Pichia pastoris)等が用いられる。動物細胞としては、例えば、サル腎臓細胞由来COS−1,COS−7,Vero細胞,チャイニーズハムスターCHO細胞(以下、CHO細胞と略記),dhfr遺伝子欠損チャイニーズハムスター細胞CHO(以下、CHO(dhfr−)細胞と略記),マウスL細胞,マウスAtT−20,マウスミエローマ細胞,ラットGH3細胞,ヒトFL細胞、ヒトHela細胞あるいはヒトミエローマ細胞などが用いられる。
【0023】
これら宿主細胞の形質転換は、当該技術分野で公知の方法に従って行うことが出来る。例えば、以下に記載の文献を参照することが出来る。Proc. Natl. Acad. Sci. USA,69巻,2110(1972); Gene,17巻,107(1982);Molecular & General Genetics,168巻,111(1979);Methods in Enzymology,194巻,182−187(1991);Proc. Natl. Acad. Sci. USA),75巻,1929(1978);細胞工学別冊8 新 細胞工学実験プロトコール.263−267(1995)(秀潤社発行);及びVirology,52巻,456(1973)。
【0024】
このようにして得られた、本発明のDNAを含む哺乳動物由来遺伝子を含有する発現ベクターで形質転換された形質転換体は、当該技術分野で公知の方法に従って培養することが出来る。例えば、宿主がエシェリヒア属菌の場合、培養は通常約15〜43℃で約3〜24時間行ない、必要により、通気や撹拌を加えることもできる。宿主がバチルス属菌の場合、培養は通常、約30〜40℃で約6〜24時間行ない、必要により通気や撹拌を加えることもできる。宿主が酵母である形質転換体を培養する際、培養は通常、pH約5〜8に調整された培地を用いて約20〜35℃で約24〜72時間行ない、必要に応じて通気や撹拌を加えることもできる。宿主が動物細胞である形質転換体を培養する際、pHは約6〜8に調整された培地を用いて、通常約30〜40℃で約15〜60時間行ない、必要に応じて通気や撹拌を加えることもできる。
【0025】
上記培養物から本発明のポリペプチドを分離精製するには、例えば、培養後、公知の方法で菌体あるいは細胞を集め、これを適当な緩衝液に懸濁し、超音波、リゾチームおよび/または凍結融解などによって菌体あるいは細胞を破壊したのち、遠心分離やろ過により蛋白質の粗抽出液を得る。緩衝液の中に尿素や塩酸グアニジンなどの蛋白質変性剤や、トリトンX−100TMなどの界面活性剤が含まれていてもよい。培養液中に蛋白質が分泌される場合には、培養終了後、公知の方法で菌体あるいは細胞と上清とを分離し、上清を集める。このようにして得られた培養上清、あるいは抽出液中に含まれる蛋白質の精製は、公知の分離・精製法を適切に組み合わせて行なうことができる。こうして得られた本発明のポリペプチド(蛋白質)は、公知の方法あるいはそれに準じる方法によって塩に変換することができ、逆に塩で得られた場合には公知の方法あるいはそれに準じる方法により、遊離体または他の塩に変換することができる。更に、組換え体が産生する蛋白質を、精製前または精製後に、メチオニンアミノペプチダーゼを用いてN−末端メチオニンを除去したり、ミリストイル転移酵素を用いてN−末端アミノ酸のミリストイル化を行ったり、アセチルトランスフェラーゼを用いてN−末端アミノ酸のアセチル化を行ったり、或いはその他の修飾酵素を用いることにより任意にアミノ酸の修飾を行うことが出来る。又、C−末端を修飾するプロセシングカルボキシルペプチダーゼ、C−末端アミド化酵素等を作用させてC−末端アミノ酸を修飾することも出来る。更に、トリプシン、キモトリプシン、FactorXa、トロンビン、又は、KEX2プロテアーゼのような適当な蛋白限定分解酵素を作用させることにより、ポリペプチドを部分的に除去することもできる。
融合蛋白質として産生させた場合には、適当な蛋白質限定分解酵素を用いて不必要なポリペプチド部分を除去することもできる。
本発明ポリペプチド(蛋白質)又はその塩の存在は、様々な結合アッセイ及び特異抗体を用いたエンザイムイムノアッセイ等により測定することができる。
【0026】
本発明のポリペプチド(蛋白質)は、C−末端が通常カルボキシル基(−COOH)またはカルボキシレート(−COO−)であるが、C−末端がアミド(−CONH)またはエステル(−COOR)であってもよい。ここでエステルにおけるRとしては、例えば、メチル、エチル、n−プロピル、イソプロピルもしくはn−ブチルなどのC1−6アルキル基、例えば、シクロペンチル、シクロヘキシルなどのC3−8シクロアルキル基、例えば、フェニル、α−ナフチルなどのC6−12アリール基、例えば、ベンジル、フェネチルなどのフェニル−C1−2アルキル基もしくはα−ナフチルメチルなどのα−ナフチル−C1−2アルキル基などのC7−14アラルキル基のほか、経口用エステルとして汎用されるピバロイルオキシメチルエステルなどが用いられる。
【0027】
本発明のポリペプチド(その存在状態は蛋白質である)がC−末端以外にカルボキシル基(またはカルボキシレート)を有している場合、カルボキシル基がアミド化またはエステル化されているものも本発明の蛋白質に含まれる。この場合のエステルとしては、例えば上記したC−末端のエステルなどが用いられる。さらに、本発明の蛋白質には、N−末端のメチオニン残基のアミノ基が保護基(例えば、ホルミル基、アセチル基などのC1−6アシル基など)で保護されているもの、生体内で切断されて生成するN−末端のグルタミン酸残基がピログルタミン化したもの、分子内のアミノ酸の側鎖上にある、例えばOH、COOH、NH、SHなどが適当な保護基(例えば、ホルミル基、アセチル基などのC1−6アシル基など)で保護されているもの、あるいは糖鎖が結合したいわゆる糖蛋白質などの複合蛋白質なども含まれる。
【0028】
本発明のポリペプチドの一部からなるペプチドとしては、前記した本発明のポリペプチド(その存在状態は蛋白質である)の部分ペプチドであって、実質的に同質の活性を有するものであればいずれのものでもよい。例えば、本発明のポリペプチド(蛋白質)の構成アミノ酸配列のうち少なくとも20個以上、好ましくは50個以上、さらに好ましくは70個以上、より好ましくは100個以上、最も好ましくは200個以上のアミノ酸配列を有し、例えば、本発明の組換え蛋白質と実質的に同質の生物学的活性を有するするペプチドなどが用いられる。このような部分ペプチドの具体例としては、配列番号:1で示されるアミノ酸配列の中の、プロリンに富む特徴的な配列、及びそれをはさんでN−末端側に2個のイムノグロブリン様繰り返しドメイン、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する配列の少なくとも一つの配列を有するもの、又は、配列番号1で示されるアミノ酸配列において79番目(メチオニン)〜1,081番目(グリシン)の1,003個のアミノ酸から成るポリペプチドを挙げることが出来る。
又、本発明の部分ペプチドはC−末端が通常カルボキシル基(−COOH)またはカルボキシレート(−COO−)であるが、前記した本発明の蛋白質のごとく、C末端がアミド(−CONH )またはエステル(−COOR)であってもよい。さらに、本発明の部分ペプチドには、前記した本発明の蛋白質と同様に、N−末端のメチオニン残基のアミノ基が保護基で保護されているもの、N−末端側が生体内で切断され生成したグルタミル基がピログルタミン酸化したもの、分子内のアミノ酸の側鎖上の置換基が適当な保護基で保護されているもの、あるいは糖鎖が結合したいわゆる糖ペプチドなどの複合ペプチドなども含まれる。
【0029】
本発明のポリペプチド(その存在状態は蛋白質である)又はその一部からなるペプチドの塩としては、とりわけ生理学的に許容される酸付加塩が好ましい。この様な塩としては、例えば、無機酸(例えば、塩酸、リン酸、臭化水素酸、硫酸)との塩、あるいは有機酸(例えば、酢酸、ギ酸、プロピオン酸、フマル酸、マレイン酸、コハク酸、酒石酸、クエン酸、リンゴ酸、蓚酸、安息香酸、メタンスルホン酸、ベンゼンスルホン酸)との塩などが用いられる。
【0030】
本発明のポリペプチド(その存在状態は蛋白質である)、その一部からなるペプチドもしくはそれらの塩またはそれらのアミド体は、当該技術分野で公知の化学合成方法を用いて調製することも出来る。例えば、通常市販されている蛋白質合成用樹脂を用い、α−アミノ基と側鎖官能基を適当に保護したアミノ酸を、目的とする蛋白質の配列通りに、当業界において自体公知の各種縮合方法に従い、樹脂上で縮合させる。反応の最後に樹脂から蛋白質を切り出すと同時に各種保護基を除去し、さらに高希釈溶液中で分子内ジスルフィド結合形成反応を実施し、目的の蛋白質、その部分ペプチドまたはそれらのアミド体を取得する。上記した保護アミノ酸の縮合に関しては、例えば、DCC、N,N’−ジイソプロピルカルボジイミド、及びN−エチル−N’−(3−ジメチルアミノプロリル)カルボジイミドのようなカルボジイミド類に代表される蛋白質合成に使用できる各種活性化試薬を用いることができる。これらによる活性化にはラセミ化抑制添加剤(例えば、HOBt, HOOBt)とともに保護アミノ酸を直接樹脂に添加するかまたは、対照とする酸無水物またはHOBtエステルあるいはHOOBtエステルとしてあらかじめ保護アミノ酸の活性化を行なった後に樹脂に添加することができる。
【0031】
保護アミノ酸の活性化や樹脂との縮合に用いられる溶媒としては、酸アミド類、ハロゲン化炭化水素類、アルコール類、スルオキシド類、及びエーテル類等、当業界において蛋白質縮合反応に使用しうることが知られている溶媒から適宜選択されうる。反応温度は蛋白質結合形成反応に使用され得ることが知られている範囲から適宜選択され、通常約−20〜50℃の範囲から適宜選択される。活性化されたアミノ酸誘導体は通常1.5〜4倍過剰で用いられる。ニンヒドリン反応を用いたテストの結果、縮合が不十分な場合には保護基の脱離を行うことなく縮合反応を繰り返すことにより十分な縮合を行なうことができる。反応を繰り返しても十分な縮合が得られないときには、無水酢酸またはアセチルイミダゾールを用いて未反応アミノ酸をアセチル化して、後の反応に影響を及ぼさないようにすることができる。原料の各アミノ基、カルボキシル基、及びセリン水酸基等の保護基としても、当該技術分野において、通常使用される基を使用することができる。原料の反応に関与すべきでない官能基の保護ならびに保護基、およびその保護基の脱離、反応に関与する官能基の活性化などは公知の基または公知の手段から適宜選択しうる。
【0032】
本発明の一部からなるペプチドまたはそれらの塩は、当該技術分野において自体公知のペプチドの合成法に従って、あるいは本発明の蛋白質を適当な蛋白質限定分解酵素で切断することによって製造することができる。ペプチドの合成法としては、例えば、固相合成法、液相合成法のいずれによっても良い。公知の縮合方法や保護基の脱離としては、例えば、以下の(1)〜(3)に記載された方法が挙げられる。
(1)泉屋信夫他、ペプチド合成の基礎と実験、 丸善(株) (1975年)
(2)矢島治明 および榊原俊平、生化学実験講座1、 蛋白質の化学IV、 205、(1977年)
(3)矢島治明監修、続医薬品の開発 第14巻 ペプチド合成 広川書店。
又は、一部からなるペプチドは、例えば、C−末端から十数残基の配列或いは配列番号:1で示されるアミノ酸配列の任意の場所の十数残基の部分を公知のペプチド合成装置等を用いて合成することが出来る。更に、このような部分ぺプチドは例えば約50から500アミノ酸長までの長さの適当な部位のポリペプチド、または約500アミノ酸長から全長までの長さの適当な場部位のポリペプチドを選択して、組換え蛋白質として前述の遺伝子組換え技術を用いて製造しても良い。
反応後の精製も自体公知の方法、例えば、溶媒抽出・蒸留・カラムクロマトグラフィー・液体クロマトグラフィー・再結晶などを組み合わせて本発明の部分ペプチドを精製単離することができる。上記方法で得られる部分ペプチドが遊離体である場合は、公知の方法によって適当な塩に変換することができるし、逆に塩で得られた場合は、公知の方法によって遊離体に変換することができる。
【0033】
本発明のポリペプチド(その存在状態は蛋白質である)、その一部からなるペプチドまたはそれらの塩と特異的に結合する抗体は、それらを特異的に認識し得るものであれば、ポリクローナル抗体、モノクローナル抗体の何れであってもよい。本発明のポリペプチド(蛋白質)、その部分ペプチドまたはそれらの塩に対する抗体は、本発明のポリペプチド(蛋白質)又はその部分ペプチドを抗原として用い、当業者に公知の抗体または抗血清の製造法に従って製造することができる。
例えば、ポリクローナル抗体の場合には、上記抗原を単独、又は、セルロース、重合アミノ酸、アルブミン等の適当な担体に結合させて、アジュバントの存在又は非存在下で、例えば、ラット、ウサギ、ヒツジ、ヤギ、ウマなどの適当な動物に対して免疫誘導することによって容易に得ることが出来る。ポリクローナル抗体は免疫された動物の血清から公知の様々な方法によって回収及び精製することが出来る。
一方、モノクローナル抗体を製造するためには、例えば、上記の免疫された動物から抗体産生細胞(例えば、脾臓又はリンパ節由来)を回収し、公知の不死化増殖細胞(例えば、P3X63Ag8株等の骨髄腫細胞株)との細胞融合により、ハイブリドーマを作成する。これを更にクローニングし、本発明のポリペプチド等に特異的に認識する抗体を生産しているハイブリドーマのクローンを選別し、該ハイブリドーマの培養液からモノクローナル抗体を回収し精製することによって容易に得ることが出来る。
更に、当業者には公知である様々な遺伝子工学的手法により、こうして得られた抗体の抗原決定基等を含む、ヒト化抗体等の各種キメラ抗体も容易に製造することが出来る。
本発明の抗体は、体液や組織などの被検体中に存在する本発明のポリペプチド(蛋白質)等を検出するために使用することができる。また、これらを精製するために使用する抗体カラムの作製、精製時の各分画中の本発明のポリペプチド(蛋白質)の検出、被検細胞内における本発明のポリペプチド(蛋白質)の挙動の分析などのために使用することができる。
【0034】
更に、本発明の抗体は、公知の方法による被検液中の本発明のポリペプチド(蛋白質)等の定量、特に、モノクローナル抗体を使用したサンドイッチ免疫測定法による定量、及び組織染色等による検出などに使用することができる。それによって、例えば、本発明のポリペプチド(蛋白質)等が関与する疾病の診断を行なうことができる。これらの目的には、抗体分子そのものを用いてもよく、また、抗体分子のF(ab’)2 、Fab’、あるいはFab画分を用いてもよい。本発明の抗体を用いる本発明の蛋白質等の定量法は、特に制限されるべきものではなく、被測定液中の抗原量(例えば、蛋白質量)に対応した抗体、抗原もしくは抗体−抗原複合体の量を化学的または物理的手段により検出し、これを既知量の抗原を含む標準液を用いて作製した標準曲線より算出する測定法であれば、いずれの測定法を用いてもよい。例えば、ネフロメトリー、競合法、イムノメトリック法およびサンドイッチ法が好適に用いられるが、感度、特異性の点で、後述するサンドイッチ法を用いるのが好ましい。標識物質を用いる測定法に用いられる標識剤としては、当該技術分野で公知の、例えば、放射性同位元素、酵素、蛍光物質、発光物質などを用いることが出来る。
【0035】
これらの測定・検出方法に関する一般的な技術手段の詳細については、総説、成書などを参照することができる。例えば、入江 寛編「続ラジオイムノアッセイ」(講談社、昭和54年発行)、石川栄治ら編「酵素免疫測定法」(第3版)(医学書院、昭和62年発行)、「Methods in ENZYMOLOGY」Vol. 70(Immunochemical Techniques(Part A))、 同書Vol. 73(Immunochemical Techniques(PartB))、同書Vol. 74(Immunochemical Techniques(Part C))、 同書Vol. 84(Immunochemical Techniques(Part D:Selected Immunoassays))、 同書Vol. 92(Immunochemical Techniques(Part E:Monoclonal Antibodies and General Immunoassay Methods))、 同書Vol. 121(Immunochemical Techniques(Part I:HybridomaTechnology and Monoclonal Antibodies))(以上、アカデミックプレス社発行)などを参照することができる。
【0036】
本発明のポリペプチド(蛋白質)又はその一部分からなるペプチドをコードするDNAに実質的に相補的な塩基配列を有するアンチセンスDNAとしては、当該DNAの塩基配列に実質的に相補的な塩基配列を有し、該DNAの発現を抑制し得る作用を有するものであれば、いずれのアンチセンスDNAであってもよい。実質的に相補的な塩基配列とは、例えば、本発明のDNAに相補的な塩基配列の全塩基配列または部分塩基配列と約95%以上、最も好ましくは100%の相同性を有する塩基配列などが挙げられる。又、これらアンチセンスDNAと同様の作用を有する核酸配列(RNAまたはDNAの修飾体)も本発明でいうアンチセンスDNAに含まれる。これらのアンチセンスDNAは、公知のDNA合成装置などを用いて製造することができる。
【0037】
更に、本発明のポリペプチド(蛋白質)等は、これら物質の活性を阻害する化合物またはその塩のスクリーニングのための試薬として有用である。すなわち、本発明は、本発明のポリペプチド(蛋白質)、その一部からなるペプチドまたはそれらの塩を用いることを特徴とする、該物質又はそれらの塩の活性を阻害する化合物(以下、「阻害剤」ともいう)のスクリーニング方法、及びその為のスクリーニング用キットを提供する。本発明のスクリーニング方法またはスクリーニング用キットを用いて得られる化合物またはその塩は、上記した試験化合物から選ばれた化合物であり、本発明のポリペプチド(蛋白質)等の生物学的活性を阻害する化合物である。該化合物またはその塩は、本発明の蛋白質等の活性を直接阻害するものであってもよいし、本発明のポリペプチド(蛋白質)等の発現を阻害することによって間接的に本発明のポリペプチド(蛋白質)等の活性を阻害するものであってもよい。該化合物の塩としては、例えば、薬学的に許容可能な塩などが用いられる。例えば、無機塩基との塩、有機塩基との塩、無機酸との塩、有機酸との塩、塩基性または酸性アミノ酸との塩などがあげられる。本発明のポリペプチド(蛋白質)等の生物学的活性を阻害する化合物も上記各種疾病に対する治療・予防剤などの医薬として使用できる可能性がある。
【0038】
本発明のDNA及び該DNAを含む哺乳動物由来遺伝子をプローブとして使用することにより、ヒトにおける本発明のポリペプチド又はその一部分からなるペプチドをコードするDNAまたはmRNAの異常(遺伝子異常)を検出することができるので、例えば、該DNAまたはmRNAの損傷、突然変異あるいは発現低下や、該DNAまたはmRNAの増加あるいは発現過多などの遺伝子診断剤として有用である。本発明のDNAを用いる上記の遺伝子診断は、例えば、公知のノーザンハイブリダイゼーションやPCR−SSCP法(Genomics,第5巻,874〜879頁(1989年)、Proceedings of the National Academy of Sciences of the UnitedStates of America,第86巻,2766〜2770頁(1989年))などにより実施することができる。更に、本発明のKIAA0992遺伝子に異常があったり、欠損している場合あるいは発現量が減少している場合、生体内において正常な機能を発揮できない患者に対しては、公知手段に従って(1)レトロウイルスベクター、アデノウイルスベクター、アデノウイルスアソシエーテッドウイルスベクターなどの適当なベクターをベヒクルとして使用する遺伝子治療によって、本発明のDNA又は哺乳動物由来遺伝子を該患者体内に導入し、発現させるか、又は(2)本発明のポリペプチド(蛋白質)等を該患者に注入すること等によって、該患者において本発明の蛋白質等の機能を発揮させることができるものと考えられる。前者の場合、本発明のDNA又は哺乳動物由来遺伝子を適当なベクターをベヒクルとして使用し、ベクターにのせた形の該DNAを単独、又は、摂取促進のための補助剤とともに、遺伝子銃やハイドロゲルカテーテルのようなカテーテルによって投与することも可能である。
【0039】
本明細書および図面において、塩基やアミノ酸などを略号で表示する場合、IUPAC−IUBCommision on Biochemical Nomenclatureによる略号あるいは当該分野における慣用略号に基づくものであり、またアミノ酸に関し光学異性体があり得る場合は、特に明示しなければL体を示すものとする。
【0040】
本願明細書の配列表の配列番号は、以下の配列を示す。
〔配列番号:1〕本発明のポリペプチドのアミノ酸配列(アミノ酸数:1,081)を示す。
〔配列番号:2〕配列番号:1で示されるアミノ酸配列を有する本発明のポリペプチドをコードするDNAの塩基配列を含む、クローンmph02462の全塩基配列(3,581塩基対)を示す。
【0041】
【実施例】
以下に、実施例により本発明をさらに具体的に説明するが、本発明はそれに限定されるものではない。なお、実施例における各種遺伝子操作は、Molecular cloning third.ed.(Cold Spring Harbor Lab.Press,2001)に記載されている方法に従った。
【0042】
(1)マウス胎児尾芽由来cDNAライブラリーの構築
attB1部位を有するオリゴヌクレオチド:5’−FgcGCACCACTTTGTACAAGAAAGCTGGGCGGCCGC(T)18−3’(F、gおよびcは、それぞれフルオレッセイン基、フォスフォロチオエイト修飾G、フォスフォロチオエイト修飾C残基を表す)をプライマーとして、マウス胎児尾芽(ICRマウス受精11.5日目のS1, S0, S−1, 及びS−2に関わる前体節中胚葉及び体節中胚葉)由来mRNAを鋳型にSuperScriptII逆転写酵素キット(インビトロジェン社製)で2本鎖cDNAを合成した。これにattB1部位を有するアダプターをcDNAにライゲーションした。その後、アガロースゲルで1kb−2kb、2kb−3kb、3kb−4kb、4kb−5kb、と5kb−7kbにcDNAをサイズ分画した。これらを、サイズを小さくしたattP pSPORT−1エントリーベクター(インビトロジェン社製)にBP反応により移し換えた後、大腸菌ElectoroMax DH10B株(インビトロジェン社製)にエレクトロポーレーション法により導入した。プレートに出現した10個以上の形質転換体を集め、液体培地中で、37℃で2−3時間培養した後プラスミドを調製した。スーパーコイルドプラスミドの形でサイズ分画した後、LR反応によりattR pBCデスティネーションベクター(インビトロジェン社製)にcDNAを移し換えた。このプラスミドを精製後、DH10B株にエレクトロポーレーション法により導入し、各分画が期待されるサイズになるまで、上記の分画操作を2−3回繰り返した。最後に各分画ごとにDH10B株にプラスミドを導入した。なお、ここで用いた試験管内での相同組み換え反応を利用したクローニングシステムは小原等の方法 (Nucreic Acids Res., 29, e22 (2001)およびDNA Research Vol.9, 47−57(2002))に従った。
次に、全ての画分に含まれる約16,608個のクローンの末端DNA配列を決定した。この中から、ヒトKIAA0992に相同性が高いクローンのcDNAに関して全塩基配列の決定を行なった。配列決定には、アプライドバイオシステム社製のDNAシークエンサー(ABI PRISM3700)と同社製反応キットを使用した。大部分の配列はショットガンクローンをダイターミネーター法を用いて決定した。一部の塩基配列については、決定した塩基配列を元にしてオリゴヌクレオチドを合成し、プライマーウォーキング法で決定した。
【0043】
(2)ホモロジー検索による本発明DNAを含むクローンの決定
次に、こうして得られた全塩基配列に基づき、DNA解析プログラム(Fasta & Blast)を用いたホモロジー検索を実施したところ、公開されているデータベースの中のヒトKIAA0992遺伝子と高いホモロジーを示す候補クローンmph02462が見出された。更に、別のDNA解析プログラム(BESTFIT)を用いて、このクローンmph02462とヒトKIAA0992のアミノ酸配列と塩基配列について比較したところ、アミノ酸配列のレベルでは、ヒトKIAA0992遺伝子がコードするアミノ酸配列(772アミノ酸長)のほぼ全長(20−772番目,752アミノ酸長)と本発明の配列番号:1で示されるアミノ酸配列 (1,081アミノ酸長)の330番目から1,081番目までの752アミノ酸長の配列について、約88.35%のホモロジーを示を示すことが判明した。
公開されたポリペプチドのアミノ酸配列に関するデータベースを検索すると、その結果、国際公開番号WO200055351−A1(発明の名称: Human colon cancer antigen protein sequence, SEQ ID NO:1004, Applicant: HUMAN GENOME SCI INC., Publication date: 21, Sep. 2000)のHuman colon cancer antigen protein sequence, 544アミノ酸長)の32−544番目のの513アミノ酸長のアミノ酸配列と、本発明のポリペプチド(1,081アミノ酸長)の569番目から1,081番目の513アミノ酸長のアミノ酸配列に対し、比較的高いホモロジーが認められた(約94.3%)。
また、国際公開番号WO200058473−A2(発明の名称: Human ORFX ORF2526 polypeptide sequence SEQ ID NO:5052, Applicant: CURAGEN CORP., Publication date:8, Feb. 2001)のHuman ORFX ORF2526 polypeptide sequence SEQ ID, NO:5052, 433アミノ酸長)の7−433番目の427アミノ酸長のアミノ酸配列と、本発明のポリペプチド(1,081アミノ酸長)の655番目から1,081番目の427アミノ酸長のアミノ酸配列に対し、比較的高いホモロジーが認められた(約95.6%)。
さらに、国際公開番号WO200192523−A2(発明の名称: Human ORFX protein sequence SEQ ID NO:14742, Applicant: CURAGEN CORP., Publication date: 6, Dec. 2001)の Human ORFX protein sequence SEQ ID NO:14742, 162アミノ酸長)の2−162番目の配列(161アミノ酸長)と、本発明のポリペプチド(1,081アミノ酸長)の一部のアミノ酸配列55−215(161アミノ酸長)の配列とでやや高いホモロジーが認められた(約90.1%)
本発明のポリペプチドアミノ酸配列(1,081アミノ酸長)について、上記に示したように、今までに出願された配列における513アミノ酸長、427アミノ酸長、及び161アミノ酸長について比較的高いホモロジーが認められたが、それらの配列は、本発明のポリペプチドアミノ酸配列 (1,081アミノ酸長) の全長をカバーするものでなく、一部のより短い配列に関連があるのみであった。
【0044】
公開された遺伝子の塩基酸配列に関するデーターベースを検索すると、本発明のmph02462塩基配列(3,581塩基長)の一部の配列とホモロジーを有する部分配列について複数の報告があったが、配列全体をカバーする報告はなかった。詳しくには、次に示す公開された塩基配列に対し、本発明の3,581塩基長の塩基配列は長く、新規配列の付加が認められた。
1)国際公開番号WO 200055351−A1 (発明の名称:Human colon cancer antigen protein sequence SEQ ID NO:1004, Applicant: HUMAN GENOME SCI INC., Publication date: 21, Sep. 2000)の Human colon cancer antigen protein sequence SEQ ID NO:1004 (1,823nt)の配列番号12−1,635(全1,624塩基長)と、本発明の塩基配列(3,581塩基長)の一部(配列1,848−3,473、1,626塩基長)とで約88.3%というやや高いホモロジーが認められた。
2)国際公開番号WO200058473−A2: Human ORFX ORF2526 polypeptide sequence SEQ ID NO:5051 (Applicant: NO:5051 (Applicant: CURAGEN CORP., Publication date: 5, Oct.,2001) のSEQ ID NO:5051(全4,125塩基長)の配列番号627−1,804(1,178nt)と本発明の塩基配列(3,581塩基長)の一部(配列番号2,296−3,473、1,178nt)とで、約90.2%という比較的高いホモロジーが認められた。
3)国際公開番号WO200192523−A2: Human ORFX protein sequence SEQ ID NO:14741 (Applicant: CURAGEN CORP., Publication date: 6, Dec. 2001) のSEQ ID NO: 14741(全487塩基長)の配列番号4−482(479塩基長)と本発明の塩基配列(全3,581塩基長)の一部(配列番号392−870、 479塩基長) とで、約85.6%という比較的高いホモロジーが認められた。
1)、2)、及び3)については、mph02462塩基配列(3,581塩基長)とは全長の長さが違うが、部分的に相同配列を含む関係にあり、1)、2)、及び3)の配列と本発明の遺伝子の配列とは、上記に示したように断片的にやや高いホモロジーが認められるものの全く異なる新規な配列と判断される。
【0045】
以上のホモロジー検索の結果から、候補クローンmph02462はヒトKIAA0992遺伝子と高いホモロジーを示し、かつヒトKIAA0992遺伝子に対し新規配列が付加された構成となっていること、また、部分的には類似遺伝子が存在するが全長については既知配列の例がない、全く新規遺伝子であることが判明した。
【0046】
(3)モチ−フ検索
本発明のDNAに関して、PROSITE databaseを検索するための蛋白質解析プログラムであるpftools (Bairoch A, Bucher P, Hofmann K, Nucleic AcidsRes. 1997 Jan 1;25(1):217−21)、及びPfam databaseを検索するための蛋白質解析プログラムhmmer 2.1(Sonnhammer, E. L. L., Eddy, S. R., Birney, E., Bateman, A., and Durbin, R., Nucleic Acids Res 1998; 26, 320−322)を用いてモチ−フ検索を行なった (Suyama et. al. 1999 Nucleic Acids Res. 27: 338−339)。本発明のDNAは、3,581塩基対あり、1,081個のアミノ酸からなるリペプチドをコードしている。本発明のDNAがコードするポリペプチドのアミノ酸配列には、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメイン、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する配列を有することが判明した(図1)。
詳しくは、ProfileScan検索法によると配列番号:1に示されるアミノ酸配列のうちN−末端側から順に1−72番目、138−236番目、699−783番目、833−924番目、及び932−1,022番目にイムノグロブリン様ドメインが、更にHMMPfam検索法によると配列番号:1に示されるアミノ酸配列のうちN−末端側から順に152−220番目、713−775番目、847−908番目、及び946−1,008番目にイムノグロブリン/メジャーヒストコンパティビリティコンプレックスドメインが、及びHMMSmart検索法によっても、配列番号:1に示されるアミノ酸配列のうち6−59番目、144−236番目、705−791番目、839−924番目、及び938−1,024番目にイムノグロブリンサブタイプドメインが、150−225番目、711−780番目、845−913番目、及び944−1,013番目にイムノグロブリンC−2タイプドメインが見出された。
更に、ProfileScan検索法によると配列番号:1に示されるアミノ酸配列のうちN−末端側に2個のイムノグロブリン様繰り返しドメイン、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する配列にはさまれる330−562番目に、プロリンに富む特徴的な配列が見出された。
ヒトKIAA0992に比較的高いホモロジーが認められるマウスPalladin遺伝子(Parast,MM & Otey CA, 2000, J. Cell Biol.,150:643−655)がコードするポリペプチドに含まれるプロリンに富む特徴的な配列には、プロリンに富む特徴的な配列に同伴してセリンに富む配列が認められたが、配列番号:1に示されるアミノ酸配列についても、プロリンに富む特徴的な配列が認められる領域には、プロリンに富む特徴的な配列に同伴してセリンに富む配列が認められた。
【0047】
(4)mRNAレベルでの発現頻度
mRNAレベルでのヒトKIAA0992遺伝子の発現頻度については、脊髄、卵巣で強い発現が、また、心臓、肝臓、肺で比較的強い発現が認められていたが、特徴的な所見はなかった(http://www.kazusa.or.jp/huge/gfpage/KIAA0992/、DNA Research,1999,6:63−70)。そこで、本発明の遺伝子の一つであるマウスKIAA0992遺伝子のmRNAレベルでの発現頻度について、RT−PCR法によりマウスにおける同遺伝子の組織特異的及び発生段階特異的発現を解析した。マウスKIAA0992遺伝子の転写産物をPCR法で増幅して検出するために必要なフォアワードプライマーとリバースプライマーを市販のDNA自動合成機を用いて合成した。フォアワードプライマーの配列を5’−ccctcattatagagccagtca −3’(配列番号:3)、リバースプライマーの配列を5’−ggcagatgtagccatgattat−3’(配列番号:4)とし、それらのプライマーを用いてマウスKIAA0992遺伝子の転写産物をRT−PCR法で増幅すると、約303bpDNA断片が得られる設計にした。マウス各組織から調製されたmRNAを材料とし、リバーストランスクリプターゼ(RT)により1stストランドcDNA まで調製が終了しているClontech社製のMultiple Tissue cDNA Panels (Clontech社Cat. No. #K1423−1, #K1430−1)を用い、Clontech社が示す方法により以下のようにして解析を行った。すなわち、各マウス組織1stストランドcDNAと上記プライマーをそれぞれ混合し、各々についてPCRを行い、マウスKIAA0992遺伝子の転写産物のうち約303bpDNA長のDNA断片の増幅を図った。PCRは、TaqポリメラーゼとしてTaKaRa Ex Taq(宝酒造, #RP001A)を用い、上述のDNA混合液を95°C(2.5分)で加熱した後、95°C(30秒)/60°C(30秒)/72°C(30秒)のサイクルを30回あるいは25回繰り返して行った。コントロールとしてClontech社が提供するG3PDHプライマー(#5406−1)を使用したG3PDH転写産物由来約938bpDNA断片の増幅も同様にして行った。増幅を終えたPCR産物を、サイズマーカーとともに2% agarose gel(Rockland社製、#50070)を用いて電気泳動で分画し、分画したPCR産物の量を半定量的に比較した(図2)。その結果、調べた組織別あるいは発生過程のcDNAパネルの内、30回繰り返し反応では、調べた限りの全臓器すなわち心臓、脳、脾臓、肺、骨格筋、肝臓、腎臓、精巣、骨髄、眼、リンパ節、平滑筋、前立腺、胸腺、子宮に於いて普遍的に、あるいは発生7日目、11日目、15日目、17日目の全ての発生過程に於いて普遍的に、マウスKIAA0992遺伝子に由来する約303bpDNA断片が特異的に増幅され、それぞれ中程度の濃さのバンドとして検出された。この場合、脳でのみ30回繰り返し反応では反応が弱く、濃度が薄いバンドとして検出された。発現頻度の差を大きくとらえるために行った25回繰り返し反応での解析結果では、子宮、心臓、腎臓、肝臓等でやや薄い濃度のバンドとして、またその他の組織で濃度が薄いがバンドが検出された。この場合、脳とリンパ節ではバンドが検出されなかった。
尚、図2において、下段のG3PDHはコントロールとして用いたハウスキーピング遺伝子(G3PDH)の発現パターンを示す。従って、以上の結果から、本発明の遺伝子がコードするポリペプチドは各種臓器に普遍的に発生・分化や機能保全に関わっている可能性が高いといえる。
【0048】
(5)本発明遺伝子の機能推定
本出願のmph02462遺伝子がコードするポリペプチドのアミノ酸配列は、1,081アミノ酸長とヒトKIAA0992(772アミノ酸長)と比較し長く、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメイン、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する配列という三つの重要な領域が認められていた。
N−末端側にプロリンに富む特徴的な配列と、C−末端側に3個のタンデムなC2タイプのイムノグロブリン様繰り返しドメイン(IgC2)を有するマウス遺伝子として、細胞骨格に関係するマウス蛋白質Palladinの報告がある(Parast,MM & Otey CA, 2000, J. Cell Biol., 150:643−655)。マウスPalladinと本発明のマウスKIAA0992蛋白のアミノ酸レベルのホモロジーは高いが(約100%)、Palladinが789アミノ酸長であるのに対し、マウスKIAA0992蛋白は1,081アミノ酸長と長い。Palladinは90−92kDであるが、 90−92kDのPalladin と異なる分子種、すなわち140kDの類似蛋白がトリの発生過程で腎臓、脾臓、腸、筋肉にて検出されている(Parast,MM & Otey CA, 2000, J. Cell Biol., 150:643−655)。マウスPalladinがN−末端側のプロリンに富む特徴的な配列と、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する配列(789アミノ酸長、90−92kD)で構成されているのに対し、マウスKIAA0992蛋白は、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメインと、C−末端側に3個のイムノグロブリン様繰り返しドメイン(IgC2)を有する構成(1,081アミノ酸長)になっている。マウス蛋白質Palladin と、そのヒトホモログであるヒトKIAA0992遺伝子にコードされる蛋白質 (Boukhelifa, M, et al.,2001, Mol. Biol. Cell, 12:2721−2729, Mykkanen, OM, et al., 2001, Mol. Biol. Cell, 12:3060−3073) についての研究により、プロリンに富む特徴的な配列と、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する蛋白質は、アクチン等で構成されるミクロフィラメントと結合し、神経の軸索突起の伸張に関わっていることが知られている。マウスPalladinに認められるプロリンに富む特徴的な配列のなかに含まれる、FPPPPモチーフは、細胞骨格に関係する蛋白質−蛋白質相互作用に関わるモチ−フで、Ena−Vaspホモロジードメイン1(EVH1)ともいわれ、アクチン蛋白の空間的アッセンブリーを制御するEna−Vasodilator−stimulated phosphoprotein (VASP)、及び Wiscott−Aldrich syndrome protein (WASP) ファミリーの蛋白質に認められる(Parast,MM & Otey CA, 2000, J. Cell Biol., 150:643−655, Reinhard, M. et al.,1995, The EMBO J., 14:1583−1589, Niebuhr,K. et al.,1997, The EMBO J., 17:5433−5444)。VASP蛋白質のFPPPPモチーフは、G−actinと複合蛋白質を形成するProfilinという小さな蛋白質と蛋白質−蛋白質相互作用を形成し、フォスファチジルイノシトール4,5リン酸(PIP2)、G−actin、及びProfilin等が複合して関係するを含むマイクロフィラメントシステムにあって重要な働きを受け持っているので、医薬品のターゲットとして可能性があり重要である。
イムノグロブリン様繰り返しドメインを有する配列は、免疫グロブリンスーパーファミリーとしても報告があり、それを構成するドメインは2つのCys残基が分子内ジスルフィド結合を形成することにより安定な折りたたみ構造(Ig−fold)を取っていることで知られている(宮坂昌之監修、接着分子ハンドブック、秀潤社、2000.11, pp188)。本発明のマウスKIAA0992蛋白は、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメインと、C−末端側に3個のイムノグロブリン様繰り返しドメイン(IgC2)を有することに特徴があり、上記の一般的な免疫グロブリンスーパーファミリーがプロリンに富む特徴的な配列を含まないことから従来の免疫グロブリンスーパーファミリーと異なる全く新規な構成の蛋白質といえる。
マウスPalladinあるいはそのホモログであるヒトKIAA0992蛋白質に認められるプロリンに富む特徴的な配列と、C−末端側に3個のイムノグロブリン様繰り返しドメインで報告されたアクチン等で構成されるミクロフィラメントと結合して神経軸索突起等の伸張作用に対し、本発明のマウスmph02462遺伝子コードされるポリペプチドのアミノ酸配列に含まれる、他にみられないN−末端に付加している2個のイムノグロブリン様繰り返しドメインが存在することにより、相乗的な作用によりミクロフィラメント等と結合力をより巧みにコントロールすることによってそれら細胞突起等の伸張作用、細胞接着、細胞の形態変化等について機能を強化していることになり、本発明のポリペプチドは細胞内の重要な機能に係わっていることは明らかである。これらにより、本発明のポリペプチドをコードする遺伝子は、主に細胞内にあってアクチン等で構成されるミクロフィラメントと結合し新たな細胞骨格の形成により、細胞の突起伸張及び細胞の接着とそれらによる機能の発現、あるいは細胞の運動や移動が可能となり、それによる各臓器に於ける細胞分化・増殖に関係していることが容易に推定される。
本発明のイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する新規ポリペプチドをコードする遺伝子は、本発明によるとあらゆる組織においてユビキタスな発現が認められた。本発明の遺伝子配列は、脳においては発現量が比較的低いこと、また、発生の全過程に於いて発現していることが今回初めて見出され、本発明の遺伝子がコードする蛋白質が全組織に於いて細胞の増殖・分化を制御する重要な働きに関わっている可能性が示された。
本発明のmph02462蛋白質は、全組織に置いて強く発現していることを特徴とする新規なイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する蛋白質であり、それら組織に於いて発育、機能保全、あるいは全身の臓器に関わる病態 (例えば癌化・老化) 解明、それによる予防薬、治療薬、検査薬の開発に有用であることが明らかで、それが本発明の優れた点である。
【0049】
これまでに、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメインと、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する構成のポリペプチドについては報告がない。また、これらイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有するアミノ酸配列をコードする本発明の遺伝子配列は、mRNAレベルでの発現頻度解析の結果であらゆる組織において普遍的な発現が認められ、更に、発生の全過程に於いて発現していることが見出され、本発明の遺伝子がコードする蛋白質が全組織に於いて細胞の増殖・分化を制御する重要な働きに関わっている可能性が今回初めて示された。
本発明のポリペプチドにおいて見出された、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメインと、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する構成のポリペプチドは、より細胞骨格形成に関わるドメインと考えられ、本発明のポリペプチドは細胞の増殖・分化を制御する重要な働きに関わる分子と推定される。
イムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する本発明のポリペプチドは、イムノグロブリン様繰り返しドメインに挟まれたプロリンに富む配列が、それらのドメインの相乗的な作用により、ミクロフィラメント等と結合力をより巧みにコントロールすることによってそれら細胞突起等の伸張作用、細胞接着、細胞の形態変化等について機能を強化していることになり、各種臓器における重要機能に係わる生体内の複合蛋白質の中心をなしているといえる。
本発明のポリペプチドは、全組織に置いて強く発現していることを特徴とする新規なイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有するポリペプチドであり、それら組織に於いて発育、機能保全、あるいは全身の臓器に関わる病態 (例えば癌化・老化) 解明、それによる予防薬、治療薬、検査薬の開発に有用であることが明らかで、それが本発明の優れた点である。また、本発明の組換え蛋白質、あるいは組換え蛋白質を発現する組換え体を利用することにより、アゴニスト、アンタゴニストのスクリーニングあるいはドラッグデザイン研究に利用できる点が優れている。
【0050】
ヒトKIAA0992遺伝子のmRNAレベルの発現について調べられ、脊髄、卵巣で強い発現が、また、心臓、肝臓、肺等で比較的強い発現が認められた(DNA Research,1999,6:63−70)。しかし、本発明のmph02462遺伝子は、各種臓器に普遍的に発現量していることから、普遍的に各種臓器において発育、機能保全、あるいは各種臓器における癌・自己免疫疾患・アレルギーのような細胞の増殖に関わる疾患や老化あるいは先天奇形など分化異常を含めたヒト疾患の機序解明及び診断・治療薬、検査薬の開発に有用である。本発明の組換え蛋白質、あるいは組換え蛋白質を発現する組換え体を利用することにより、アゴニスト、アンタゴニストのスクリーニングあるいはドラッグデザイン研究に利用できる。
【0051】
このように細胞の増殖・分化や老化に極めて重要なイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有するポリペプチドをコードする遺伝子は、それ自身も直接疾患原因遺伝子となりうる。例えば、FPPPPモチーフはアクチン蛋白の空間的アッセンブリーを制御するWiscott−Aldrich syndrome protein (WASP) ファミリーの蛋白質に認められ、免疫欠損障害と関係が想定される(Parast,MM & Otey CA, 2000, J. Cell Biol., 150:643−655, Reinhard, M. et al.,1995, The EMBO J., 14:1583−1589, Niebuhr,K. et al.,1997, The EMBO J., 17:5433−5444)。
これらの知見から、本発明のイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有するポリペプチドに関わるDNA及び該DNAを含む遺伝子、該DNAにコードされるポリペプチド及び該ポリペプチドを含む組換え蛋白質については、それらが各種臓器に普遍的に細胞の増殖あるいは分化の調節などに、また、それら臓器の機能保全や老化に関わる病態の解明に関わることが強く示唆される。
【0052】
【発明の効果】
ヒトKIAA0992遺伝子にコードされているポリペプチドは772アミノ酸長と短く、その機能を類推するモチ−フ構造が限られているため、その機能の推定も限られたものであった。今回、本発明者はマウス胎児尾芽由来のcDNAライブラリーから、ヒトKIAA0992遺伝子に高いホモロジーを示す遺伝子(DNA)をクローニングし、N−末端側に新たにDNA配列が付加されている新規DNA配列を取得することに成功した。その新規DNA配列にコードされるポリペプチドは1,081アミノ酸長と長く、また、そのポリペプチドは、プロリンに富む特徴的な配列をはさんで、N−末端側に2個のイムノグロブリン様繰り返しドメインと、C−末端側に3個のイムノグロブリン様繰り返しドメインを有する構成する従来にはない構成で、細胞の突起伸張、細胞の接着と機能の発現、あるいは細胞の運動や移動といった細胞の重要なプロセスに関係すると推定された。更に本発明の遺伝子配列は、脳においては発現量が比較的低いこと、また、発生の全過程に於いて発現していることが今回初めて見出され、本発明の遺伝子がコードする蛋白質が全組織に於いて細胞の増殖・分化を制御する重要な働きに関わっている可能性が示された。
【0053】
これまでに記載したことから、本発明のDNA、本発明のポリペプチドあるいは本発明の抗体は、癌・自己免疫疾患・アレルギーのような細胞の増殖に関わる疾患や先天奇形など分化異常を含めたヒト疾患の機序解明及び診断・治療上、また、各種臓器の機能保全や老化の防止に必要不可欠な役割を果たすと考えられる。また、mRNAレベルでの発現頻度解析のよる各組織及び発生段階での発現のパターン情報は、各種臓器に普遍的に発現していること、及び各発生過程に於いて普遍的に発現していることを明らかとし、本発明の遺伝子が各種臓器の発生・分化やその機能保全また老化において重要性であること明らかにした。
従って、本発明のDNA及び該DNAを含む哺乳動物由来遺伝子、それらがコードするポリペプチドの一部又は全長、該ポリペプチドの一部又は全長に対する抗体、アンチセンスDNA等は、癌や先天奇形を含めたヒト疾患を治療する為のモデル動物であるマウスを用いた各種治療・予防方法開発において、医薬として使用することが可能である。
【0054】
【配列表】

Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094

【図面の簡単な説明】
【図1】本発明のポリペプチドに新規に認められたイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する新規ポリペプチドを示す(aa: アミノ酸配列で数字はアミノ酸数、ボックス:上から、HMMPfam検索法、HMMSmart検索法、またProfileScan検索法、によるそれぞれ異なった検索法にて同定したイムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有するドメインを示す)。
これらの結果から、ProfileScan検索法、HMMPfam検索法、及びHMMSmart検索法により、イムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有するドメインを、それぞれ新たに同定した。
【図2】RT−PCR法によるmph02462(マウスKIAA0992)遺伝子のマウス各組織、及び各発生段階における発現強度の比較。上段の2つの写真はmph02462遺伝子の発現強度、下段はコントロールとして用いたハウスキーピング遺伝子(G3PDH)の発現強度を、アガロース電気泳動で分画した後のエチジウムブロミド染色パターンについての写真で示す。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a novel DNA having an immunoglobulin-like repeating domain and a proline-rich sequence, which is universally expressed in various organs, a gene containing the DNA, a novel polypeptide encoded by the DNA, and the polypeptide And an antibody against the novel polypeptide.
[0002]
[Prior art]
The recent success of the human genome and cDNA projects has led to the identification or estimation of many human disease-related genes. However, on the other hand, research using human genes is limited due to ethical problems, and new research directions are being explored. From such a viewpoint, identification of a homologous gene in a model organism is considered to be a very important step in terms of advancing research. In particular, mice are the most studied model organisms, and relatively large amounts of genomic information and information on mutants are accumulated, but the accumulated genomic information is not yet sufficient. On the other hand, as a means for analyzing a gene expressed in a living body, a study of randomly analyzing a cDNA sequence has been conducted, and a fragment sequence of the obtained cDNA has been registered and published in a database as an Expressed Sequence Tag (EST). Was. However, many ESTs have only short base sequence information such as 100 to 500 bases in length, and it is difficult to estimate their functions.
[0003]
In various organs, physiological functions are regulated under the regulation by many hormones, hormone-like substances, neurotransmitters or physiologically active substances. In addition, the regulation of functions in various organs involves the proliferation or activation of specific cells responsible for the functions. Therefore, obtaining a novel gene that is universally and strongly expressed in various organs and obtaining a protein encoded by the gene that controls universal and complex functions in various organs is useful for drug development. It is. Further, in order to efficiently screen for agonists and antagonists to the obtained protein and to develop a drug, the function of the gene of the protein expressed in the living body is estimated from homology search, and based on the information, It was necessary to express the protein in an appropriate expression system to obtain a recombinant protein, and further to obtain an antibody that specifically binds to the protein.
[0004]
In the long-chain human cDNA project, the human KIAA0992 gene derived from the human brain (Nagase, T., Ishikawa, K., Suyama, M., Kikuno, R., Hirosawa, M., Miyajima, N., Tanaka, A., et al. , Kotani, H., Nomura, N. and Ohara, O., Prediction of the coding sequences of unidentified human genes. XIII. The complete sequences of 100 new cDNA clones from brain which code for large proteins in vitro., DNA Res. 6: 63-70 (1999)). It was unclear. The human KIAA0992 gene is present on chromosome 4q32.3, and several SNPs of the human KIAA0992 gene have also been reported (http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?CMD). = Search & DB = snp), considering that the majority of human diseases are not caused by mere gene deletion but by partial changes in protein function or activity due to amino acid substitution, the human KIAA0992 gene May be involved in the differentiation of various organs and the maintenance of their functions, or may be involved in diseases related to cell proliferation and differentiation, such as cancer, autoimmune diseases, and allergies. It has been found that the polypeptide encoded by the human KIAA0992 gene belongs to a gene family having an immunoglobulin-like repeat domain and a proline-rich sequence. That is, the amino acid sequence of the polypeptide encoded by the human KIAA0992 gene was 772 amino acids in length having a proline-rich characteristic sequence on the N-terminal side and two immunoglobulin-like repeat domains on the C-terminal side. . The amino acid sequence of the polypeptide encoded by the ph02462 gene of the present application is 1,081 amino acids in length, longer than that of human KIAA0992, and two immunoglobulins at the N-terminal side, sandwiching a proline-rich characteristic sequence. Three important regions, a sequence having three immunoglobulin-like repeating domains on the C-terminal side, and an immunoglobulin-like repeating domain near the N-terminus, which enhances It became possible to estimate the powerful functions that were performed.
[0005]
[Non-patent document 1]
1. Masayuki Miyasaka, Handbook of Adhesion Molecules, Shujunsha, 2000.11, pp188
Part 2 Immunoglobulin Superfamily
[Non-patent document 2]
2. Parast, MM & Otey CA, 2000, J. Am. Cell Biol. , 150: 643-655.
Characterization of palladin, a novel protein localized to stress fibers
and cell adhesions.
[Non-Patent Document 3]
3. Bukhelifa M, Parast MM, Valtschoffoff JG, LaMantia AS, Meeker RB, Otay CA.
2001, Mol Biol Cell,. 12: 2721-2729.
A role for the cytoskeleton-associated protein palladin in neural outgrowth.
[Non-patent document 4]
4. Mykkanen OM, Gronholm M, Ronty M, Lawski M, Salmikangas P, Suila H,
Carpen O.
2001, Mol Biol Cell. , 12: 3060-3073.
Characterization of human palladin, a microfilament-associated protein.
[Non-Patent Document 5]
5. Reinhard, M, Reinhard M, Giehl K, Abel K, Haffner C, Jarchau T, Hoppe V, Jockusch BM, Walter U.S. , 1995, EMBO J .; , 14: 1583-1589.
The proline-rich focal adhesion and microfilament protein VASP is a ligand for profilins.
[Non-Patent Document 6]
6. Niebuhr K, Ebel F, Frank R, Reinhard M, Domann E, Carl UD, Walter U, Gertler FB, Wehland J, Chakraborty T. , 1997, EMBO J .; , 16: 5433-5444.
Anovel proline-rich motif present in ActA of Listeria monocytogenes and cytoskeleton proteins is the most of the outline of the outline of the empirical concept.
[0006]
[Problems to be solved by the present invention]
Conventionally, the human KIAA0992 gene has been obtained by the human long-chain cDNA project, but the gene information is not complete and the information on its function is incomplete. On the other hand, obtaining a novel gene that is universally expressed in various organs and obtaining the gene, a protein encoded by the gene, or an antibody that specifically binds to the protein requires that the protein be converted into another protein in a cell. It is important to screen for a compound that inhibits the binding to a compound or a compound that affects signal transduction and the like.
[0007]
Therefore, obtaining a novel gene related to the human KIAA0992 gene, obtaining a novel motif, obtaining a tissue-specific expression pattern of the gene, and obtaining information regarding the function of the protein encoded by the novel gene of the present invention. Is a very important means for searching for a specific binding protein, agonist or antagonist of the polypeptide of the present invention. Even if a specific binding protein to the above-mentioned polypeptide is not found, the polypeptide of the present invention can be analyzed by analyzing the physiological action of the polypeptide from an inactivation experiment of the polypeptide of the present invention (for example, production of a knockout animal). It is possible to prepare an agonist or antagonist for the peptide, and specific binding proteins, agonists or antagonists for the polypeptide of the present invention may be used as preventive or therapeutic agents for diseases related to dysfunction of patients with diseases related to various organs. And can be used as diagnostics. In some cases, a decrease or increase in the function of the polypeptide of the present invention in a living body may cause diseases relating to various organs. In this case, not only administration of an antagonist or agonist to the polypeptide but also administration of the polypeptide of the present invention targeting various organs of the polypeptide, or administration of an antisense nucleic acid to a gene encoding the polypeptide. It can also be applied to administration or gene therapy using the gene. In this case, the nucleotide sequence encoding the polypeptide of the present invention is information necessary for examining the presence or absence of a gene deletion or mutation in a patient with a disease relating to various organs of the polypeptide of the present invention. The gene encoding the polypeptide can be applied to a preventive or therapeutic agent or a diagnostic agent for a disease associated with dysfunction of the polypeptide of the present invention.
[0008]
[Means for Solving the Problems]
As a result of intensive studies, the present inventors have cloned a gene (DNA) exhibiting high homology to the human KIAA0992 gene from a cDNA library derived from mouse fetal tail bud, and obtained the N-terminal of the polypeptide encoded by the gene. It was found that a completely new sequence that was not present in the human KIAA0992 gene was added on the side, and that the obtained gene was universally expressed in various organs. Further, by analyzing the obtained gene information, it was found that the polypeptide encoded by the gene of the present invention has a proline-rich sequence followed by three immunoglobulin-like repeat domains, similar to the human KIAA0992 gene. In addition, the present inventors have discovered that two novel immunoglobulin-like repeat domains are present in the novel sequence added to the N-terminal side of the polypeptide of the present invention, and that these domains have important functions in cells. And obtained a novel polypeptide and an antibody specific thereto based on the genetic information, thereby completing the present invention.
[0009]
That is, as a first aspect, the present invention provides a DNA comprising a base sequence encoding the following polypeptide (a) or (b): (a) identical or substantially identical to the amino acid sequence represented by SEQ ID NO: 1 Part of the same amino acid sequence (for example, one having at least one of the following sequences having an immunoglobulin-like repeating domain and a proline-rich sequence, or the 79th amino acid (methionine) in the amino acid sequence represented by SEQ ID NO: 1 A polypeptide consisting of 1,003 amino acids at positions 〜1,081 (leucine) or a polypeptide consisting of all of them; or (b) a part of amino acids in the amino acid sequence represented by SEQ ID NO: 1; A polypeptide comprising a substituted or added amino acid sequence and having substantially the same biological activity as part or all of the polypeptide of (a). Peptide, according to the.
As a second aspect of the present invention, the following DNA (a), (b) or (c): (a) an amino acid sequence represented by SEQ ID NO: 1 (base sequence represented by SEQ ID NO: 2) A portion having at least one of a sequence having an immunoglobulin-like repeating domain and a proline-rich sequence shown below, or SEQ ID NO: 1 A DNA that encodes a polypeptide consisting of 1,003 amino acids from position 79 (methionine) to position 1,081 (leucine) or all in the amino acid sequence shown; (b) a base complementary to the DNA of (a); A DNA that hybridizes under stringent conditions with a DNA comprising a sequence; or (c) a DNA comprising a base sequence complementary to the DNA of (a) and a stringent DNA. It hybridizes with such conditions, according to the DNA encoding a protein having a part of a polypeptide or all substantially the same biological activity of (a). The above-mentioned DNAs according to the first and second aspects of the present invention are collectively referred to as “DNA of the present invention” hereinafter. The DNA of the present invention encodes a novel polypeptide. The present invention also relates to a gene derived from a mammal containing the DNA, a gene derived from a rodent in which the mammal is a rodent, particularly a mouse gene in which the rodent is a mouse. In particular, the mouse gene is also referred to as “mouse KIAA0992 gene”.
Furthermore, the present invention relates to a polypeptide encoded by the DNA or gene (KIAA0992 gene) of the present invention (hereinafter, also referred to as “the polypeptide of the present invention”), for example, a host cell into which the DNA or gene of the present invention has been introduced. The present invention relates to a polypeptide which is a recombinant protein to be produced (hereinafter, also referred to as “KIAA0992 protein”).
In addition, the present invention provides a recombinant vector containing the DNA or gene of the present invention, and an antibody that specifically binds to the polypeptide of the present invention or a partial peptide thereof, or a recombinant protein containing the polypeptide, or a salt thereof. According to.
[0010]
In addition, the expression level of the protein is changed by using the DNA of the present invention, a gene containing the DNA, a novel polypeptide encoded by the DNA, a recombinant protein containing the polypeptide, and an antibody against the polypeptide. Provided are a compound, a method for screening a compound (antagonist, agonist) that changes the binding property to a protein that binds to the protein, a screening kit, the screening method, and the like. Furthermore, a method of screening for a substance that specifically binds to the polypeptide of the present invention, a partial peptide thereof, or a recombinant protein containing the polypeptide, or a salt thereof, and a screening kit, etc. Also provide.
[0011]
Further, the present invention provides a DNA of the present invention, a recombinant vector or an expression vector containing the DNA of the present invention, a transformant carrying the vector, culturing the transformant, and a portion of the polypeptide of the present invention. Alternatively, a method for producing a polypeptide of the present invention or a recombinant protein containing the polypeptide, or a salt thereof, comprising producing and accumulating a recombinant protein containing the full-length polypeptide, and collecting the same, and The present invention provides a recombinant protein containing a part of the polypeptide of the present invention or a full-length polypeptide or a salt thereof. Further, the present invention provides a medicament comprising the DNA of the present invention, a polypeptide of the present invention or a partial peptide thereof, or a nucleotide sequence substantially complementary to a DNA encoding a recombinant protein containing the polypeptide. Provided are a medicament containing an antisense nucleotide or a medicament containing them, a polypeptide of the present invention or a partial peptide thereof, or a recombinant protein containing the polypeptide.
Furthermore, the present invention comprehensively prepares the DNA of the present invention, the polypeptide of the present invention, a partial polypeptide thereof or a recombinant protein containing the polypeptide, or an antibody against the DNA or gene of the present invention, and accumulates them. The present invention also relates to a so-called DNA chip (array) and protein chip obtained by the above method.
[0012]
BEST MODE FOR CARRYING OUT THE INVENTION
The DNA of the present invention was identified by identifying the nucleotide sequence after isolating it as a cDNA fragment from a cDNA library prepared by the present inventors using mRNA derived from the mouse fetal tail bud collected by the present inventors as a starting material. Things. Specifically, about 16,608 recombinants were selected from a mouse fetal tail bud-derived cDNA library prepared according to the method of Ohara et al. (DNA Research, 2002, 9: 47-57), All the 3 ′ terminal DNA sequences were determined, and a clone having high homology to the human KIAA0992 gene was selected from among them, and the entire nucleotide sequence was determined. Next, a homology search was performed using a DNA analysis program (GCG, Fasta & Blast) based on the entire base sequence thus obtained.
As a result, almost the entire amino acid sequence (772 amino acids in length) encoded by the human KIAA0992 gene (20th to 772th, 752 amino acids in length) and the amino acid sequence (1,081 amino acids in length) of the present invention represented by SEQ ID NO: 1 A clone having the base sequence shown in SEQ ID NO: 2 having a significant homology of about 88.35% with the sequence of the 752 amino acid length from the 330th to the 1,081th was obtained (clone name: mph02462). ).
[0013]
The amino acid sequence of the polypeptide encoded by ph02462 (polypeptide of the present invention) is 1,081 amino acids, and the human KIAA0992 gene (DNA Research, 1999, 6: 63-70: NCBI-GenBank Accession No. AB023209). When the homologous portion was excluded compared to the 772 amino acid length of the amino acid sequence of the protein encoded by, the protein was extended 329 amino acids long to the N-terminal side. The amino acid sequence of the obtained "polypeptide of the present invention" was subjected to homology search as described in the following Examples. As a result, "polypeptide of the present invention" showed that the polypeptide encoded by the human KIAA0992 gene By comparison, it was found that the amino acid sequence at position 329 (329 amino acids) on the N-terminal side was newly added.
Homology search was performed on the full-length amino acids of the polypeptide encoded by the mouse KIAA0992 gene using a public database.
As a result, International Publication No. WO20055351-A1 (Title of Invention: Human colon cancer antigen protein sequence, SEQ ID NO: 1004, Application: HUMAN GENEME SCIENCE INC., Ed. (sequence, 544 amino acids long) relative to the 32-513 amino acid sequence of 513 amino acids in length from the 569 amino acids to 1,081 amino acids of 513 amino acids in length of the polypeptide (1,081 amino acids in length) of the present invention. , Relatively high homology (approximately 94.3%).
In the 1,081 amino acid sequence of the present invention, a novel sequence of 568 amino acids in length is added to the N-terminal side of the published Human colon cancer antigen protein sequence, SEQ ID NO: 1004 (544 amino acids in length). . In the application of Human colon cancer antigen protein sequence of WO200055351-A1, SEQ ID NO: 1004, the amino acid sequence of a polypeptide fragment is merely described as a protein for treating various diseases, and its function is unknown. Compared to an amino acid sequence of 544 amino acids in length, the 1,081 amino acid sequence of the polypeptide of the present invention is long, and its function can be estimated and useful as described later.
In addition, International Publication Number WO20050473-A2 (Title of the Invention: Human ORFX ORF2526 polypeptide sequence SEQ ID NO: 5052, Application: CURAGEN CORP., Publication date: 8, February, October, 2001, October, 2001). The amino acid sequence of 427 amino acids at positions 7-433 of the amino acid sequence (5052,433 amino acids in length) and the amino acid sequence of 427 amino acids in length from 655 to 1,081 of the polypeptide of the present invention (1,081 amino acids in length) Relatively high homology was observed (about 95.6%).
Furthermore, the human ORFX of the international publication number WO20012523-A2 (Title of the invention: Human ORFX protein sequence SEQ ID NO: 14742, Application: CURAGEN CORP., Publication date: 6, Dec. 2001). Slightly higher homology between the 2-162nd sequence (161 amino acids in length) and the sequence of a part of the amino acid sequence 55-215 (161 amino acids in length) of the polypeptide of the present invention (1,081 amino acids in length). Was observed (about 90.1%).
Human ORFX protein sequence SEQ ID NO: 14742 (162aa) simply describes the amino acid sequence of a polypeptide fragment as a protein for treating various diseases, but its function is unknown. The 1,081 amino acid sequence of the present invention has a length of 54 amino acids at the N-terminus and a length of 866 amino acids at the C-terminus, as compared with the amino acid sequence of 162 amino acids. Possible and useful.
As described above, the polypeptide amino acid sequence of the present invention (1,081 amino acids long) has relatively high homology with respect to the 513 amino acids, 427 amino acids, and 161 amino acids in the previously applied sequences. However, these sequences do not cover the full length of the polypeptide amino acid sequence (1,081 amino acids in length) of the present invention, and are only fragmentally related. Finally, it became possible to describe the novel sequence proteins and their functions.
The plasmid containing the DNA of the present invention having the nucleotide sequence shown in SEQ ID NO: 2 (plasmid designation: mph02462) was obtained from the National Institute of Advanced Industrial Science and Technology (AIST), 1-1-1, Higashi, Tsukuba, Ibaraki, Japan. Deposited with the Patent Organism Depositary on February 27, 2003 and given the accession number FERM P-19238.
[0014]
The sequence of the human KIAA0992 gene is 4,347 bp (DNA Research, 1999, 6: 63-70, http://www.kazusa.or.jp/huge/gfpage/KIAA0992/), and is the encoded polypeptide. The length of the amino acid sequence is 772 amino acids (DNA Research, 1999, 6: 63-70: NCBI-GenBank Accession No. AB023209). By studying the human KIAA0992 gene homologue in detail, there is a possibility that the possibility of further encoding the polypeptide at the N-terminal side may be verified. The length of the amino acid sequence of the polypeptide encoded by the DNA of the present invention is 1,081 amino acids. However, by further studying the homologue to the DNA of the present invention, the length of the amino acid sequence was further extended to the N-terminal side. You may find that the polypeptide is encoded.
[0015]
In addition, those skilled in the art will recognize that a suitable primer (for example, base pairs 61 to 61 of SEQ ID NO: 2) can be used on the 5 ′ side of the clone based on the nucleotide sequence shown in SEQ ID NO: 2 first disclosed herein. The 80th 5′-CACCGTAGGCTGCCGGGAGC-3 sequence (5′-GCTCCCGGCAGCCCTACGGTG-3 ′) synthesized corresponding to the primer was prepared, and the primer and a commercially available mammal-derived mRNA or a mammal prepared from a mammal-derived tissue By performing a reverse transcription reaction after performing hybridization with the derived mRNA, a new cDNA fragment containing the upstream region (5 ′ side of the gene) of the DNA of the present invention can be specifically synthesized. After inserting a new cDNA fragment containing the synthesized 5'-side region into a plasmid, a mammalian KIAA0992 containing the DNA of the present invention is subjected to homologous cloning such as colony hybridization using a part of SEQ ID NO: 2 as a probe. It is possible to prepare the entire region of the gene. Alternatively, a nucleotide sequence in which the 5 'side of the gene is further extended can be obtained by another method, for example, by using the following method. That is, if the DNA of the present invention is used as a probe, the 5 ′ terminal region of the KIAA0992 gene derived from various mammals including humans can be prepared by homologous cloning such as colony hybridization. Furthermore, since the DNA sequence of the present invention and the amino acid sequence of the polypeptide of the present invention are disclosed, those skilled in the art can use the information to obtain the 5 ′ terminal region of the KIAA0992 gene derived from various mammals including humans. Can be easily obtained. Also, by using a PCR method such as RACE while paying sufficient attention so that artificial errors do not occur in the short fragments and the obtained sequence, the entire KIAA0992 gene derived from various mammals including humans can be obtained. Regions can be prepared.
[0016]
The DNA of the present invention may be any DNA as long as it comprises a base sequence encoding the polypeptide of the present invention described above. Identification from various organs derived from various mammals such as brain, heart, lung, liver, spleen, kidney, testis, thymus, muscle, bone marrow, etc., or cDNA libraries derived from various tissues and cells at each stage of development -Either isolated cDNA or synthetic DNA may be used. The vector used for the library construction may be any of bacteriophage, plasmid, cosmid, phagemid and the like. In addition, using a total RNA fraction or mRNA fraction prepared from the above-described cells / tissues or their cytoplasms, directly amplifying by Reverse Transcriptase Polymerase Chain Reaction (hereinafter abbreviated as “RT-PCR method”). You can also.
[0017]
An amino acid sequence substantially identical to the amino acid sequence represented by SEQ ID NO: 1 means that the degree of homology with the entire amino acid sequence represented by SEQ ID NO: 1 is about 60% or more on average, preferably about 60% or more. An amino acid sequence that is 80% or more, more preferably about 90% or more. Accordingly, a polypeptide having an amino acid sequence substantially identical to the amino acid sequence represented by SEQ ID NO: 1 of the present invention has, for example, the above-mentioned homology to the amino acid sequence represented by SEQ ID NO: 1. And a polypeptide having substantially the same biological activity as the polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 1. Here, “substantially the same quality” means that their activities are the same in nature. Further, the polypeptide of the present invention includes, for example, a part (preferably about 1 to 20, more preferably about 1 to 10, and still more preferably several in the amino acid sequence represented by SEQ ID NO: 1, Or an amino acid sequence consisting of an amino acid sequence in which amino acids 1 to 78 in the amino acid sequence represented by SEQ ID NO: 1 have been deleted, substituted or added, or an amino acid sequence obtained by combining them; Also included are polypeptides having substantially the same biological activity as a polypeptide consisting of
[0018]
Furthermore, the DNA of the present invention may be, for example, a DNA encoding the amino acid sequence represented by SEQ ID NO: 1 or a DNA comprising a nucleotide sequence complementary to the DNA in the nucleotide sequence represented by SEQ ID NO: 2. Any DNA that encodes a polypeptide (protein) that hybridizes under gentle conditions and preferably has the same biological activity as the polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 1. Good. Under such conditions, the DNA capable of hybridizing with the DNA consisting of the nucleotide sequence complementary to the DNA encoding the amino acid sequence represented by SEQ ID NO: 1 in the nucleotide sequence represented by SEQ ID NO: 2 includes, for example, the DNA DNA having a base sequence having a degree of homology with the entire base sequence of about 60% or more, preferably about 80% or more, more preferably about 90% or more on the average. . Hybridization was performed using Molecular cloning third. ed. (Cold Spring Harbor Lab. Press, 2001), or a method known in the art or a method analogous thereto. When a commercially available library is used, it can be performed according to the method described in the attached instruction manual. Here, “stringent conditions” means, for example, when a probe is labeled with DIG DNA Labeling (Cat No. 1175033 manufactured by Boehringer Mannheim), a DIG Easy Hyb solution at 32 ° C. (Cat manufactured by Boehringer Mannheim) No. 1603558), and washing the membrane in a 0.1 × SSC solution (containing 0.1% [w / v] SDS) at 40 ° C. (1 × SSC is 0.15 M NaCl, 0.015 M citric acid) (Sodium is used for hybridization) to the human DNA probe of the present invention by Southern blot hybridization.
[0019]
As a means for cloning the DNA of the present invention, the DNA of the present invention is amplified by a PCR method using a synthetic DNA primer having an appropriate nucleotide sequence such as a portion of the polypeptide of the present invention, or the DNA of the present invention is incorporated into an appropriate vector. Can be selected by hybridization with a DNA fragment coding for a part or the entire region of the polypeptide or labeled with a synthetic DNA. Hybridization methods are described, for example, in Molecular cloning third. ed. (Cold Spring Harbor Lab. Press, 2001). When a commercially available library is used, it can be performed according to the method described in the attached instruction manual. The DNA base sequence can be converted using a known kit, for example, a SuperScript II reverse transcriptase kit (Gibco BRL) or the like, according to a known method such as the Gapped Duplex method or the Kunkel method, or a method analogous thereto. it can. The DNA encoding the cloned polypeptide can be used as it is depending on the purpose, or can be used after digesting with a restriction enzyme or adding a linker, if desired. The DNA may have ATG as a translation initiation codon at the 5 'end and TAA, TGA or TAG as a translation termination codon at the 3' end. These translation initiation codon and translation termination codon can be added using an appropriate synthetic DNA adapter.
[0020]
The expression vector for the polypeptide of the present invention can be prepared according to a method known in the art. For example, it is produced by (1) cutting out a DNA fragment containing the DNA of the present invention or a gene derived from a mammal containing the DNA of the present invention, and (2) ligating the DNA fragment downstream of a promoter in an appropriate expression vector. can do. Examples of expression vectors include Escherichia coli-derived plasmids (eg, pBR322, pBR325, pUC18, pUC118), Bacillus subtilis-derived plasmids (eg, pUB110, pTP5, pC194), yeast-derived plasmids (eg, pSH19, pSH15), λ phage, etc. Or an expression vector using a sequence derived from an animal virus such as SV40, CMV virus, retrovirus, vaccinia virus, baculovirus, bovine papilloma virus, and the like. As the promoter used in the present invention, any promoter may be used as long as it is an appropriate promoter corresponding to a host used for gene expression. For example, when the host is Escherichia coli, trp promoter, lac promoter, recA promoter, λPL promoter, lpp promoter, T7 promoter, or a promoter obtained by combining or combining these promoters, etc., when the host is Bacillus subtilis, When the host is yeast, such as the SPO1, SPO2, and penP promoters, the PHO5 promoter, PGK promoter, GAP promoter, ADH promoter, and the like are preferable. When animal cells are used as hosts, SRα promoter, SV40 promoter, LTR promoter, CMV promoter, HSV-TK promoter, HSP promoter, metallothionein promoter and the like can be mentioned.
[0021]
In addition to the above, an enhancer, a splicing signal, a polyA addition signal, a selection marker, an SV40 replication origin (hereinafter sometimes abbreviated as SV40 ori) and the like known in the art may be added to the expression vector, if desired. be able to. Further, if necessary, the protein encoded by the DNA of the present invention can be expressed as a fusion protein with another protein (eg, glutathione S-transferase, histidine tag, calmodulin binding protein, protein A, etc.). is there. Such a fusion protein can be cleaved using an appropriate protease and separated into respective proteins.
[0022]
Examples of the host cell include Escherichia, Bacillus, yeast, insect cells, insects, animal cells, and the like. Specific examples of Escherichia bacteria include DH1 derived from Escherichia coli K12 (Proc. Natl. Acad. Sci. USA, 60, 160 (1968)), JM103 (Nucleic Acids Research, 9, 9). (1981)), JA221 (Journal of Molecular Biology, 120, 517 (1978)), and HB101 (Journal of Molecular Biology, 41, 459 (1969)), or Escherichia coli (Escher). Used. As the Bacillus bacterium, for example, Bacillus subtilis MI114 (Gene, 24, 255 (1983)), 207-21 [Journal of Biochemistry, 95, 87 (1984)] and the like are used. Examples of yeast include, for example, Saccharomyces cerevisiae AH22, AH22R-, NA87-11A, DKD-5D, 20B-12, Schizosaccharomyces pombe (Schizosaccharomyces pombiCi, Nippon Caspica, Nippon Caspica, Nippon Caspica, Nippon Cyprus, and others). Can be Examples of animal cells include monkey kidney cell-derived COS-1, COS-7, Vero cells, Chinese hamster CHO cells (hereinafter abbreviated as CHO cells), and dhfr gene-deficient Chinese hamster cells CHO (hereinafter, CHO (dhfr-)). Cells, mouse L cells, mouse AtT-20, mouse myeloma cells, rat GH3 cells, human FL cells, human Hela cells, human myeloma cells, and the like.
[0023]
Transformation of these host cells can be performed according to methods known in the art. For example, the following documents can be referred to. Proc. Natl. Acad. Sci. USA, 69, 2110 (1972); Gene, 17, 107 (1982); Molecular & General Genetics, 168, 111 (1979); Methods in Enzymology, 194, 182-187 (1991); Proc. Natl. Acad. Sci. USA), 75, 1929 (1978); Cell Engineering Annex 8, New Cell Engineering Experiment Protocol. 263-267 (1995) (published by Shujunsha); and Virology, 52, 456 (1973).
[0024]
The thus obtained transformant transformed with the expression vector containing the mammalian gene containing the DNA of the present invention can be cultured according to a method known in the art. For example, when the host is a bacterium belonging to the genus Escherichia, the cultivation is usually carried out at about 15 to 43 ° C. for about 3 to 24 hours, and if necessary, aeration and stirring can be added. When the host is a bacterium belonging to the genus Bacillus, the cultivation is usually performed at about 30 to 40 ° C. for about 6 to 24 hours, and if necessary, aeration and stirring may be added. When culturing a transformant in which the host is yeast, culturing is usually performed at about 20 to 35 ° C. for about 24 to 72 hours using a medium adjusted to a pH of about 5 to 8, and if necessary, aeration and stirring may be performed. Can also be added. When culturing a transformant in which the host is an animal cell, the culture is usually performed at about 30 to 40 ° C. for about 15 to 60 hours using a medium whose pH is adjusted to about 6 to 8, and if necessary, aeration and stirring may be performed. Can also be added.
[0025]
In order to separate and purify the polypeptide of the present invention from the above culture, for example, after culturing, cells or cells are collected by a known method, suspended in a suitable buffer, and subjected to ultrasonic wave, lysozyme and / or freezing. After the cells or cells are destroyed by thawing or the like, a crude protein extract is obtained by centrifugation or filtration. In a buffer, a protein denaturant such as urea or guanidine hydrochloride, or Triton X-100 is used. TM And the like. When the protein is secreted into the culture solution, after the culture is completed, the cells or cells are separated from the supernatant by a known method, and the supernatant is collected. The protein contained in the thus obtained culture supernatant or extract can be purified by appropriately combining known separation and purification methods. The polypeptide (protein) of the present invention thus obtained can be converted to a salt by a known method or a method analogous thereto. Conversely, when the polypeptide (protein) is obtained as a salt, the polypeptide (protein) is released by a known method or a method analogous thereto. Can be converted to body or other salts. Further, the protein produced by the recombinant, before or after purification, methionine aminopeptidase to remove the N-terminal methionine, myristoyl transfer of the N-terminal amino acid using myristoyltransferase, The N-terminal amino acid can be acetylated using transferase, or the amino acid can be arbitrarily modified using other modifying enzymes. Also, the C-terminal amino acid can be modified by the action of a processing carboxyl peptidase or a C-terminal amidating enzyme that modifies the C-terminal. Furthermore, the polypeptide can be partially removed by the action of an appropriate proteolytic enzyme such as trypsin, chymotrypsin, Factor Xa, thrombin, or KEX2 protease.
When produced as a fusion protein, unnecessary polypeptide portions can be removed using an appropriate proteolytic enzyme.
The presence of the polypeptide (protein) of the present invention or a salt thereof can be measured by various binding assays, an enzyme immunoassay using a specific antibody, or the like.
[0026]
In the polypeptide (protein) of the present invention, the C-terminal is usually a carboxyl group (—COOH) or a carboxylate (—COO—), but the C-terminal is an amide (—CONH). 2 ) Or an ester (—COOR). Here, as R in the ester, for example, a C1-6 alkyl group such as methyl, ethyl, n-propyl, isopropyl or n-butyl, for example, a C3-8 cycloalkyl group such as cyclopentyl and cyclohexyl, for example, phenyl, α A C6-12 aralkyl group such as a C6-12 aryl group such as -naphthyl, for example, a phenyl-C1-2 alkyl group such as benzyl or phenethyl or an α-naphthyl-C1-2 alkyl group such as α-naphthylmethyl; Pivaloyloxymethyl ester, which is widely used as an oral ester, is used.
[0027]
When the polypeptide of the present invention (the existence state of which is a protein) has a carboxyl group (or carboxylate) other than the C-terminus, those in which the carboxyl group is amidated or esterified are also included in the present invention. Contained in proteins. As the ester in this case, for example, the above-mentioned C-terminal ester and the like are used. Furthermore, the protein of the present invention includes a protein in which the amino group of the N-terminal methionine residue is protected with a protecting group (for example, a C1-6 acyl group such as a formyl group and an acetyl group), and which is cleaved in vivo. N-terminal glutamic acid residue produced by pyroglutamination, on the side chain of an amino acid in the molecule, for example, OH, COOH, NH 2 , SH, and the like are protected with an appropriate protecting group (for example, a C1-6 acyl group such as a formyl group and an acetyl group), and a complex protein such as a so-called glycoprotein to which a sugar chain is bound.
[0028]
The peptide comprising a part of the polypeptide of the present invention is a partial peptide of the above-described polypeptide of the present invention (the existence state of which is a protein), as long as it has substantially the same activity. It may be. For example, at least 20 or more, preferably 50 or more, more preferably 70 or more, more preferably 100 or more, and most preferably 200 or more amino acid sequences among the constituent amino acid sequences of the polypeptide (protein) of the present invention. For example, a peptide having substantially the same biological activity as the recombinant protein of the present invention is used. Specific examples of such a partial peptide include a characteristic sequence rich in proline in the amino acid sequence represented by SEQ ID NO: 1, and two immunoglobulin-like repeats N-terminal to the characteristic sequence. A domain having at least one sequence of a sequence having three immunoglobulin-like repeating domains on the C-terminal side, or 79th (methionine) to 1,081 (glycine) in the amino acid sequence represented by SEQ ID NO: 1. )), A polypeptide consisting of 1,003 amino acids.
The partial peptide of the present invention usually has a carboxyl group (—COOH) or a carboxylate (—COO—) at the C-terminus, but has an amide (—CONH) 2 ) Or an ester (—COOR). Furthermore, the partial peptide of the present invention has a structure in which the amino group of the N-terminal methionine residue is protected with a protecting group, and the N-terminal side is cleaved in vivo as in the case of the protein of the present invention. Glutamyl groups are pyroglutamine-oxidized, those in which the substituents on the side chains of the amino acids in the molecule are protected with appropriate protecting groups, and those in which sugar chains are bonded, such as so-called glycopeptides, are also included. .
[0029]
As a salt of the polypeptide of the present invention (the existence state of which is a protein) or a peptide composed of a part thereof, a physiologically acceptable acid addition salt is particularly preferable. Such salts include, for example, salts with inorganic acids (eg, hydrochloric acid, phosphoric acid, hydrobromic acid, sulfuric acid) or organic acids (eg, acetic acid, formic acid, propionic acid, fumaric acid, maleic acid, succinic acid) Acid, tartaric acid, citric acid, malic acid, oxalic acid, benzoic acid, methanesulfonic acid, benzenesulfonic acid) and the like are used.
[0030]
The polypeptide of the present invention (the existence state of which is a protein), a peptide composed of a part thereof, a salt thereof, or an amide thereof can also be prepared by a chemical synthesis method known in the art. For example, using a commercially available resin for protein synthesis, an amino acid appropriately protected with an α-amino group and a side chain functional group is subjected to various condensation methods known per se in the art according to the sequence of the target protein. And condensation on the resin. At the end of the reaction, the protein is cleaved from the resin and, at the same time, various protecting groups are removed. Further, an intramolecular disulfide bond formation reaction is carried out in a highly diluted solution to obtain a target protein, its partial peptide or an amide thereof. Regarding the condensation of the protected amino acids described above, for example, protein synthesis represented by carbodiimides such as DCC, N, N′-diisopropylcarbodiimide and N-ethyl-N ′-(3-dimethylaminoprolyl) carbodiimide is useful. Various activating reagents that can be used can be used. For activation by these, the protected amino acid is directly added to the resin together with a racemization inhibitor additive (eg, HOBt, HOOBt), or the protected amino acid is activated in advance as a control acid anhydride or HOBt ester or HOOBt ester. After performing, it can be added to the resin.
[0031]
Solvents used for activation of protected amino acids and condensation with resins include acid amides, halogenated hydrocarbons, alcohols, sulfoxides, and ethers, which can be used in the art for protein condensation reactions. It can be appropriately selected from known solvents. The reaction temperature is appropriately selected from a range known to be usable for a protein bond formation reaction, and is usually appropriately selected from a range of about −20 to 50 ° C. The activated amino acid derivative is usually used in a 1.5 to 4-fold excess. As a result of the test using the ninhydrin reaction, if the condensation is insufficient, sufficient condensation can be performed by repeating the condensation reaction without removing the protecting group. When sufficient condensation cannot be obtained even by repeating the reaction, the unreacted amino acid can be acetylated using acetic anhydride or acetylimidazole so that the subsequent reaction is not affected. As a protecting group such as each amino group, carboxyl group, and serine hydroxyl group of the raw material, a group usually used in the art can be used. The protection of the functional group that should not be involved in the reaction of the raw materials, the protective group, the elimination of the protective group, the activation of the functional group involved in the reaction, and the like can be appropriately selected from known groups or known means.
[0032]
The peptide comprising a part of the present invention or a salt thereof can be produced according to a peptide synthesis method known per se in the art, or by cleaving the protein of the present invention with an appropriate protease. As a method for synthesizing a peptide, for example, any of a solid phase synthesis method and a liquid phase synthesis method may be used. Examples of known condensation methods and elimination of protecting groups include the methods described in the following (1) to (3).
(1) Nobuo Izumiya et al., Basics and Experiments on Peptide Synthesis, Maruzen Co., Ltd. (1975)
(2) Haruaki Yajima and Shunpei Sakakibara, Biochemistry Experiments Course 1, Protein Chemistry IV, 205, (1977)
(3) Supervision of Haruaki Yajima, Development of Continuing Drugs Volume 14 Peptide Synthesis Hirokawa Shoten.
Alternatively, a peptide consisting of a part can be obtained by, for example, using a known peptide synthesizer or the like to obtain a sequence of dozens of residues from the C-terminus or any part of the amino acid sequence represented by SEQ ID NO: 1 at any position. Can be used for synthesis. Further, such partial peptides may be selected, for example, from about 50 to 500 amino acids in length at a suitable site or from about 500 amino acids to full length at a suitable site. Then, the recombinant protein may be produced by using the above-mentioned gene recombination technique.
The partial peptide of the present invention can be purified and isolated by a combination of a method known per se, for example, solvent extraction, distillation, column chromatography, liquid chromatography, recrystallization, etc., after the reaction. When the partial peptide obtained by the above method is a free form, it can be converted to an appropriate salt by a known method, and conversely, when it is obtained by a salt, it can be converted to a free form by a known method. Can be.
[0033]
Antibodies that specifically bind to the polypeptide of the present invention (the existence state of which is a protein), a peptide composed of a part thereof, or a salt thereof are polyclonal antibodies, as long as they can specifically recognize them. Any of monoclonal antibodies may be used. The antibody against the polypeptide (protein) of the present invention, its partial peptide or a salt thereof can be prepared by using the polypeptide (protein) or its partial peptide of the present invention as an antigen according to a method for producing an antibody or antiserum known to those skilled in the art. Can be manufactured.
For example, in the case of a polyclonal antibody, the above antigen is used alone or in the presence or absence of an adjuvant by binding to an appropriate carrier such as cellulose, polymerized amino acid, or albumin, for example, rat, rabbit, sheep, goat, etc. And can be easily obtained by immunizing appropriate animals such as horses. Polyclonal antibodies can be recovered and purified from the serum of the immunized animal by various known methods.
On the other hand, in order to produce a monoclonal antibody, for example, antibody-producing cells (for example, spleen or lymph node-derived) are collected from the above immunized animal, and a known immortalized proliferating cell (for example, bone marrow such as P3X63Ag8 strain) is used. (Hymanoma cell line) to produce a hybridoma. This is further cloned, a clone of a hybridoma producing an antibody that specifically recognizes the polypeptide of the present invention is selected, and the monoclonal antibody is easily obtained by recovering and purifying a monoclonal antibody from a culture solution of the hybridoma. Can be done.
Furthermore, various chimeric antibodies, such as humanized antibodies, containing antigenic determinants and the like of the thus obtained antibodies can be easily produced by various genetic engineering techniques known to those skilled in the art.
The antibody of the present invention can be used for detecting the polypeptide (protein) of the present invention and the like present in a subject such as a body fluid or a tissue. In addition, preparation of an antibody column used for purifying these, detection of the polypeptide (protein) of the present invention in each fraction at the time of purification, and behavior of the polypeptide (protein) of the present invention in the test cells. Can be used for analysis and the like.
[0034]
Further, the antibody of the present invention can be used for quantification of the polypeptide (protein) of the present invention in a test solution by a known method, in particular, quantification by a sandwich immunoassay using a monoclonal antibody, and detection by tissue staining and the like. Can be used for Thereby, for example, a disease involving the polypeptide (protein) of the present invention or the like can be diagnosed. For these purposes, the antibody molecule itself may be used, or F (ab ') 2, Fab', or Fab fraction of the antibody molecule may be used. The method for quantifying the protein or the like of the present invention using the antibody of the present invention is not particularly limited. Any method can be used as long as it is a method for detecting the amount of the compound by chemical or physical means and calculating the amount from a standard curve prepared using a standard solution containing a known amount of the antigen. For example, nephelometry, a competitive method, an immunometric method, and a sandwich method are preferably used, but it is preferable to use a sandwich method described later in terms of sensitivity and specificity. As a labeling agent used in a measurement method using a labeling substance, for example, a radioisotope, an enzyme, a fluorescent substance, a luminescent substance, and the like known in the art can be used.
[0035]
For details of general technical means relating to these measurement / detection methods, a review, a textbook, and the like can be referred to. For example, edited by Hiro Irie, “Sequence Radio Immunoassay” (Kodansha, published in 1979), Eiji Ishikawa et al., “Enzyme Immunoassay” (3rd edition) (Medical Publishing, published in 1987), “Methods in ENZYMOLOGY” Vol. . 70 (Immunochemical Technologies (Part A)), ibid., Vol. 73 (Immunochemical Technologies (Part B)), ibid., Vol. 74 (Immunochemical Technologies (Part C)), ibid., Vol. 84 (Immunochemical Techniques (Part D: Selected Immunoassays)), ibid., Vol. 92 (Immunochemical Techniques (Part E: Monoclonal Antibodies and General Immunoassay Methods)), ibid., Vol. 121 (Immunochemical Techniques (Part I: Hybridoma Technology and Monoclonal Antibodies)) (all published by Academic Press) can be referred to.
[0036]
The antisense DNA having a base sequence substantially complementary to the DNA encoding the polypeptide (protein) of the present invention or a peptide comprising a part thereof may be a base sequence substantially complementary to the base sequence of the DNA. Any antisense DNA may be used as long as it has the effect of suppressing the expression of the DNA. The substantially complementary nucleotide sequence is, for example, a nucleotide sequence having about 95% or more, most preferably 100% homology with the entire nucleotide sequence or a partial nucleotide sequence of the nucleotide sequence complementary to the DNA of the present invention. Is mentioned. Nucleic acid sequences (modified RNA or DNA) having the same action as these antisense DNAs are also included in the antisense DNA of the present invention. These antisense DNAs can be produced using a known DNA synthesizer or the like.
[0037]
Furthermore, the polypeptides (proteins) and the like of the present invention are useful as reagents for screening compounds that inhibit the activity of these substances or salts thereof. That is, the present invention uses a polypeptide (protein) of the present invention, a peptide consisting of a part thereof, or a salt thereof, and a compound that inhibits the activity of the substance or a salt thereof (hereinafter referred to as “inhibition”). Agent), and a screening kit therefor. The compound obtained by using the screening method or the screening kit of the present invention or a salt thereof is a compound selected from the test compounds described above, and a compound that inhibits a biological activity such as the polypeptide (protein) of the present invention. It is. The compound or a salt thereof may directly inhibit the activity of the protein of the present invention, or may indirectly inhibit the expression of the polypeptide (protein) of the present invention by indirectly inhibiting the expression of the polypeptide of the present invention. (Protein) and the like may be inhibited. As the salt of the compound, for example, a pharmaceutically acceptable salt or the like is used. Examples include salts with inorganic bases, salts with organic bases, salts with inorganic acids, salts with organic acids, salts with basic or acidic amino acids, and the like. Compounds that inhibit biological activities such as the polypeptides (proteins) of the present invention may also be used as medicaments such as therapeutic / prophylactic agents for the above various diseases.
[0038]
Using the DNA of the present invention and a gene derived from a mammal containing the DNA as a probe to detect an abnormality in DNA or mRNA (gene abnormality) encoding the polypeptide of the present invention or a peptide comprising a part thereof in humans Therefore, it is useful as a diagnostic agent for a gene, for example, for damage, mutation or decreased expression of the DNA or mRNA, and increased or excessive expression of the DNA or mRNA. The above-described genetic diagnosis using the DNA of the present invention can be performed, for example, by the known Northern hybridization or PCR-SSCP method (Genomics, Vol. 5, pp. 874-879 (1989), Proceedings of the National Academy of Sciences of the United States). of America, Vol. 86, pp. 2766-2770 (1989)). Furthermore, when the KIAA0992 gene of the present invention has an abnormality, is defective, or has a reduced expression level, a patient who cannot exert a normal function in a living body can be treated according to the known means. The DNA of the present invention or a gene derived from a mammal is introduced into a patient by gene therapy using a suitable vector such as a virus vector, an adenovirus vector, an adenovirus associated virus vector as a vehicle, or expressed, or 2) It is considered that the function of the protein or the like of the present invention can be exhibited in the patient by injecting the polypeptide (protein) or the like of the present invention into the patient. In the former case, the DNA of the present invention or a gene derived from a mammal is used as an appropriate vector as a vehicle, and the DNA in a form attached to the vector is used alone or together with an auxiliary for promoting uptake, a gene gun or a hydrogel. It is also possible to administer by catheter, such as a catheter.
[0039]
In the present specification and drawings, when bases, amino acids, and the like are represented by abbreviations, the abbreviations are based on abbreviations by IUPAC-IUBCommission on Biochemical Nomenclature or abbreviations commonly used in the art, and when an amino acid can have an optical isomer, Unless otherwise specified, it indicates the L-form.
[0040]
The sequence numbers in the sequence listing in the present specification indicate the following sequences.
[SEQ ID NO: 1] This shows the amino acid sequence (amino acid number: 1,081) of the polypeptide of the present invention.
[SEQ ID NO: 2] This shows the entire base sequence (3,581 base pairs) of clone mph02462, including the base sequence of DNA encoding the polypeptide of the present invention having the amino acid sequence represented by SEQ ID NO: 1.
[0041]
【Example】
Hereinafter, the present invention will be described more specifically with reference to Examples, but the present invention is not limited thereto. In addition, various genetic operations in Examples are described in Molecular cloning third. ed. (Cold Spring Harbor Lab. Press, 2001).
[0042]
(1) Construction of cDNA library derived from mouse fetal tail bud
Oligonucleotide with attB1 site: 5′-FgcGCACCACTTTTGTACAAGAAAGCTGGGCGGCCGC (T) 18 -3 ′ (F, g and c represent a fluorescein group, a phosphorothioate-modified G and a phosphorothioate-modified C residue, respectively) as a primer and a mouse embryo tail bud (ICR mouse fertilization 11.5). Synthesizing double-stranded cDNA using SuperScript II reverse transcriptase kit (manufactured by Invitrogen) using mRNA derived from pre-segment mesoderm and somite mesoderm related to S1, S0, S-1, and S-2 on day did. An adapter having an attB1 site was ligated to the cDNA. Thereafter, the size of the cDNA was fractionated on an agarose gel into 1 kb-2 kb, 2 kb-3 kb, 3 kb-4 kb, 4 kb-5 kb, and 5 kb-7 kb. These were transferred to a reduced-size attP pSPORT-1 entry vector (manufactured by Invitrogen) by BP reaction, and then introduced into Escherichia coli ElectroMax DH10B (manufactured by Invitrogen) by electroporation. 10 appeared on the plate 6 More than one transformant was collected and cultured in a liquid medium at 37 ° C for 2-3 hours to prepare a plasmid. After size fractionation in the form of a supercoiled plasmid, the cDNA was transferred to an attR pBC destination vector (Invitrogen) by LR reaction. After the plasmid was purified, it was introduced into the DH10B strain by an electroporation method, and the above-described fractionation operation was repeated 2-3 times until each fraction became an expected size. Finally, the plasmid was introduced into the DH10B strain for each fraction. The cloning system using a homologous recombination reaction in a test tube used here is based on the method of Ohara et al. (Nucleic Acids Res., 29, e22 (2001) and DNA Research Vol. 9, 47-57 (2002)). Followed.
Next, the terminal DNA sequences of about 16,608 clones contained in all the fractions were determined. From these, the entire nucleotide sequence of the cDNA of the clone having high homology to human KIAA0992 was determined. For sequencing, a DNA sequencer (ABI PRISM3700) manufactured by Applied Biosystems and a reaction kit manufactured by Applied Biosystems were used. Most sequences were determined from shotgun clones using the dye terminator method. For some base sequences, oligonucleotides were synthesized based on the determined base sequences and determined by the primer walking method.
[0043]
(2) Determination of a clone containing the DNA of the present invention by homology search
Next, a homology search was performed using a DNA analysis program (Fasta & Blast) based on the entire nucleotide sequence thus obtained. As a result, a candidate clone mph02462 showing high homology with the human KIAA0992 gene in a public database was obtained. Was found. Furthermore, using another DNA analysis program (BESTFIT), the clone mph02462 was compared with the amino acid sequence and the base sequence of human KIAA0992. At the amino acid sequence level, the amino acid sequence encoded by the human KIAA0992 gene (772 amino acids long) About the entire length (20-772, 752 amino acids in length) of the amino acid sequence represented by SEQ ID NO: 1 of the present invention (1,081 amino acids in length) from the 330th to 1,081 amino acids, It was found to show a homology of about 88.35%.
Searching the database on the amino acid sequence of the published polypeptide revealed that the result was International Publication No. WO200055351-A1 (Title of Invention: Human colon cancer antigen protein sequence, SEQ ID NO: 1004, Application: HUMAN GENOCI SCIINC. date: 21, Sep. 2000) Human colon cancer antigen protein sequence (544 amino acids long), the 513 amino acid length amino acid sequence at positions 32-544, and the 569th amino acid sequence of the polypeptide of the present invention (1,081 amino acids long). A relatively high homology to the 1,081 amino acid sequence of 513 amino acids (About 94.3%).
In addition, International Publication Number WO20050473-A2 (Title of the Invention: Human ORFX ORF2526 polypeptide sequence SEQ ID NO: 5052, Application: CURAGEN CORP., Publication date: 8, February, October, 2001, October, 2001). The amino acid sequence of 427 amino acids at positions 7-433 of the amino acid sequence (5052,433 amino acids in length) and the amino acid sequence of 427 amino acids in length from 655 to 1,081 of the polypeptide of the present invention (1,081 amino acids in length) Relatively high homology was observed (about 95.6%).
Furthermore, the human ORFX of the international publication number WO200192523-A2 (the title of the invention: Human ORFX protein sequence SEQ ID NO: 14742, Application: CURAGEN CORP., Publication date: 6, Dec. 2001). Slightly higher homology between the 2-162nd sequence (161 amino acids in length) and the sequence of a part of the amino acid sequence 55-215 (161 amino acids in length) of the polypeptide of the present invention (1,081 amino acids in length). Was observed (about 90.1%)
As described above, the polypeptide amino acid sequence of the present invention (1,081 amino acids long) has relatively high homology with respect to the 513 amino acids, 427 amino acids, and 161 amino acids in the previously applied sequences. However, those sequences did not cover the entire length of the polypeptide amino acid sequence (1,081 amino acids in length) of the present invention, but were only related to some shorter sequences.
[0044]
A search of a database on the nucleotide sequence of the published gene revealed that there were several reports of partial sequences having homology with a partial sequence of the mp02462 nucleotide sequence (3,581 nucleotides in length) of the present invention. There were no reports covering. Specifically, the base sequence of the present invention having a length of 3,581 bases was longer than the published base sequence shown below, and addition of a new sequence was observed.
1) International Publication No. WO 200055351-A1 (Title of Invention: Human colon cancer antigen protein sequence SEQ ID NO: 1004, Application: HUMAN GENEME SCIENCE INC., Publication data: 2000). SEQ ID NO: 1004 (1,823 nt) SEQ ID NOS: 12-1 and 635 (all 1,624 bases in length) and part of the base sequence (3,581 bases in length) of the present invention (sequence 1,848-3) , 473, 1,626 base lengths), and a slightly higher homology of about 88.3% was observed.
2) International Publication No. WO20050473-A2: Human ORFX ORF2526 polypeptide sequence SEQ ID NO: 5051 (Applicant: NO: 5051 (Applicant: CURAGEN CORP., Publication date: 50, 2001, ID. SEQ ID NOS: 627-1,804 (1,178 nt) of SEQ ID NOS: 4,125 bases and a part of the nucleotide sequence (3,581 bases) of the present invention (SEQ ID NOs: 2,296-3,473, 1,178 nt) , A relatively high homology of about 90.2% was observed.
3) International Publication No. WO200192523-A2: Human ORFX protein sequence SEQ ID NO: 14741 (Applicant: CURAGEN CORP., Publication date: 6, Dec. 2001) SEQ ID NO: 4741 (all lengths of SEQ ID NO: 14741) A relatively high homology of about 85.6% was observed between -482 (479 bases) and a part of the base sequence of the present invention (3581 bases in total) (SEQ ID NOs: 392-870, 479 bases). Was done.
Regarding 1), 2) and 3), the total length is different from that of the mph02462 base sequence (3,581 base length), but the relationship includes a partially homologous sequence, and 1), 2) and The sequence of 3) and the sequence of the gene of the present invention are judged to be completely different novel sequences, although a little high homology is observed fragmentarily as described above.
[0045]
From the results of the above homology search, the candidate clone mph02462 shows high homology with the human KIAA0992 gene and has a structure in which a new sequence is added to the human KIAA0992 gene. However, it has been found that the gene is a completely novel gene for which there is no known sequence for the full length.
[0046]
(3) Motive search
Regarding the DNA of the present invention, pftools (Bairoch A, Bucher P, Hofmann K, Nucleic Acids Res. 1997 Jan 1; 25 (1): 217-21), and Pfams, which are protein analysis programs for searching for PROSITE database. A protein analysis program hmmer 2.1 for searching (Sonhammer, ELL, Eddy, SR, Birney, E., Bateman, A., and Durbin, R., Nucleic Acids Res 1998; 26; , 320-322) for motif search (Suyama et. Al. 1999 Nucleic Acids Res. 27: 338-339). The DNA of the present invention has 3,581 base pairs and encodes a repeptide consisting of 1,081 amino acids. The amino acid sequence of the polypeptide encoded by the DNA of the present invention includes two immunoglobulin-like repeating domains on the N-terminal side and three immunoglobulin-like domains on the C-terminal side, with a proline-rich characteristic sequence interposed therebetween. It was found to have a sequence having a globulin-like repeating domain (FIG. 1).
More specifically, according to the ProfileScan search method, the amino acid sequence represented by SEQ ID NO: 1 from the N-terminal side in the order of 1-72, 138-236, 699-783, 833-924, and 932-1 The 022-th immunoglobulin-like domain is further identified by the HMMPfam search method from the N-terminal side of the amino acid sequence shown in SEQ ID NO: 1, at positions 152-220, 713-775, 847-908, and 946-. At position 1,008, an immunoglobulin / major histocompatibility complex domain was determined, and also by the HMMSmart search method, the amino acid sequence represented by SEQ ID NO: 1 at positions 6-59, 144-236, 705-791, 839-924 and 938-1,024 Immunoglobulin subtype domains is 150-225 th, 711-780 th, 845-913 th, and 944-1,013 th immunoglobulin C-2 type domain was found.
Furthermore, according to the ProfileScan search method, a sequence having two immunoglobulin-like repeat domains on the N-terminal side and three immunoglobulin-like repeat domains on the C-terminal side of the amino acid sequence shown in SEQ ID NO: 1 At the 330-562 position, a proline-rich characteristic sequence was found.
Characteristic proline-rich sequence contained in the polypeptide encoded by the mouse Paladin gene (Parast, MM & Otey CA, 2000, J. Cell Biol., 150: 643-655), which shows relatively high homology to human KIAA0992. Has a serine-rich sequence associated with the proline-rich characteristic sequence, but also in the amino acid sequence shown in SEQ ID NO: 1, the region where the proline-rich characteristic sequence is found includes A serine-rich sequence was observed along with the proline-rich characteristic sequence.
[0047]
(4) Expression frequency at mRNA level
Regarding the expression frequency of the human KIAA0992 gene at the mRNA level, strong expression was observed in the spinal cord and ovary and relatively strong expression in the heart, liver and lung, but there were no characteristic findings (http: //Www.kazusa.or.jp/huge/gfpage/KIAA0992/, DNA Research, 1999, 6: 63-70). Therefore, regarding the expression frequency of the mouse KIAA0992 gene, which is one of the genes of the present invention, at the mRNA level, the tissue-specific and developmental stage-specific expression of the gene in the mouse was analyzed by RT-PCR. Forward primers and reverse primers necessary for amplifying and detecting the transcript of the mouse KIAA0992 gene by PCR were synthesized using a commercially available automatic DNA synthesizer. The sequence of the forward primer was 5'-ccctcattatagagcccagtca-3 '(SEQ ID NO: 3), the sequence of the reverse primer was 5'-ggcagattgtaggcatgattatat-3' (SEQ ID NO: 4), and the primers of mouse KIAA0992 gene were used. The design was such that when the transcript was amplified by the RT-PCR method, an approximately 303 bp DNA fragment was obtained. Using the mRNA prepared from each mouse tissue as a material, Multiple Tissue cDNA Panels (Clontech Cat. No. # K1432-1, manufactured by Clontech) which has been prepared by reverse transcriptase (RT) up to the first strand cDNA. Using # K1430-1), analysis was performed as follows by the method shown by Clontech. That is, the first strand cDNA of each mouse tissue and the above-mentioned primers were mixed, and PCR was performed for each of them to amplify a DNA fragment having a length of about 303 bp in the transcript of the mouse KIAA0992 gene. PCR was performed by using TaKaRa Ex Taq (Takara Shuzo, # RP001A) as a Taq polymerase, heating the above DNA mixture at 95 ° C (2.5 minutes), and then heating at 95 ° C (30 seconds) / 60 ° C ( A cycle of (30 seconds) / 72 ° C. (30 seconds) was repeated 30 times or 25 times. A G3PDH transcript-derived approximately 938 bp DNA fragment was amplified in the same manner using a G3PDH primer (# 5406-1) provided by Clontech as a control. The amplified PCR product was fractionated by electrophoresis using a 2% agarose gel (manufactured by Rockland, # 50070) together with a size marker, and the amount of the fractionated PCR product was compared semi-quantitatively (FIG. 2). ). As a result, in the examined cDNA panel of each tissue or developmental process, in the repetition of 30 times, all the organs examined, ie, heart, brain, spleen, lung, skeletal muscle, liver, kidney, testis, bone marrow, eye, The mouse KIAA0992 gene is universal in the lymph nodes, smooth muscle, prostate, thymus, uterus, or universally during all developmental days 7, 11, 15, and 17. A DNA fragment of about 303 bp was specifically amplified and detected as a medium band. In this case, the reaction was weak in the reaction repeated 30 times only in the brain, and was detected as a band having a low concentration. Analysis results of 25 repetitive reactions performed to capture the difference in expression frequency showed bands with slightly lower concentration in uterus, heart, kidney, liver, etc., and bands with lower concentration in other tissues. Was. In this case, no band was detected in the brain and lymph nodes.
In FIG. 2, G3PDH at the bottom shows the expression pattern of the housekeeping gene (G3PDH) used as a control. Therefore, from the above results, it can be said that the polypeptide encoded by the gene of the present invention is highly likely to be universally involved in development / differentiation and functional maintenance in various organs.
[0048]
(5) Function estimation of the gene of the present invention
The amino acid sequence of the polypeptide encoded by the ph02462 gene of the present application is 1,081 amino acids long, longer than that of human KIAA0992 (772 amino acids long), and N-terminal to the proline-rich characteristic sequence. Three important regions, two immunoglobulin-like repeat domains and a sequence having three immunoglobulin-like repeat domains on the C-terminal side, were recognized.
As a mouse gene having a proline-rich characteristic sequence on the N-terminal side and three tandem C2-type immunoglobulin-like repetitive domains (IgC2) on the C-terminal side, a mouse protein Palaladin related to the cytoskeleton is used. There is a report (Parast, MM & Otey CA, 2000, J. Cell Biol., 150: 643-655). Although the amino acid level homology between mouse Palladin and the mouse KIAA0992 protein of the present invention is high (about 100%), Palladin is 789 amino acids long, whereas mouse KIAA0992 protein is as long as 1,081 amino acids. Palladin is 90-92 kD, but a molecular species different from 90-92 kD Palladin, that is, a similar protein of 140 kD has been detected in the kidney, spleen, intestine, and muscle during the development of birds (Parast, MM & Otey CA). , 2000, J. Cell Biol., 150: 643-655). In contrast to mouse Palladin, which is composed of a proline-rich characteristic sequence on the N-terminal side and a sequence (789 amino acids long, 90-92 kD) having three immunoglobulin-like repeat domains on the C-terminal side. The mouse KIAA0992 protein has two immunoglobulin-like repeat domains at the N-terminus and three immunoglobulin-like repeat domains (IgC2) at the C-terminus, sandwiching a proline-rich characteristic sequence. (1,081 amino acids long). Mouse protein Palladin and its human homolog, a protein encoded by the human KIAA0992 gene (Bukhelifa, M, et al., 2001, Mol. Biol. Cell, 12: 2721-2729, Mykkanen, OM, et al., 2001. Mol. Biol. Cell, 12: 3060-3073), a protein having a proline-rich characteristic sequence and three immunoglobulin-like repeat domains on the C-terminal side is composed of actin and the like. It is known that it binds to microfilaments and is involved in the extension of nerve neurites. The FPPPP motif contained in the proline-rich characteristic sequence found in mouse Palladin is a motif involved in protein-protein interactions related to the cytoskeleton, and is also referred to as Ena-Vasp homology domain 1 (EVH1). , Ena-Vasodilator-stimulated phosphoprotein (VASP), which controls the spatial assembly of actin proteins, and the Wiscott-Aldrich syndrome protein (WASP) family of proteins (Parast, MM, C.I., and J.O., 2000). , 150: 643-655, Reinhard, M. et al., 1995, The EMBO J., 14: 1583-1589, N. .. Ebuhr, K et al, 1997, The EMBO J., 17: 5433-5444). The FPPPP motif of the VASP protein forms a protein-protein interaction with a small protein called Profilin, which forms a complex protein with G-actin, and forms phosphatidylinositol 4,5-phosphate (PIP2), G-actin, and Profilin. Has important roles in microfilament systems, including complex and related, and is therefore a potential and important target for pharmaceuticals.
A sequence having an immunoglobulin-like repeating domain has also been reported as an immunoglobulin superfamily, and the domain constituting the same is a stable fold (Ig-fold) formed by two Cys residues forming an intramolecular disulfide bond. (Handbook of Adhesion Molecules, Shujunsha, 2000.11, pp. 188), supervised by Masayuki Miyasaka. The mouse KIAA0992 protein of the present invention has two immunoglobulin-like repeat domains on the N-terminal side and three immunoglobulin-like repeat domains (IgC2 ), And since the above-mentioned general immunoglobulin superfamily does not contain a proline-rich characteristic sequence, it can be said that the protein is a completely novel protein different from the conventional immunoglobulin superfamily.
It binds to a proline-rich characteristic sequence found in mouse Palladin or its homologue, human KIAA0992 protein, and a microfilament composed of actin and the like reported in the C-terminal side with three immunoglobulin-like repeat domains. Two immunoglobulin-like repeats added to the N-terminus, which are not otherwise found in the amino acid sequence of the polypeptide encoded by the mouse mph02462 gene of the present invention, against the elongation of neurites and the like. The presence of the domain enhances the functions of elongation of cell projections, cell adhesion, changes in cell morphology, etc. by controlling the binding force with microfilaments and the like by synergistic action. Thus, the polypeptide of the present invention is important for intracellular functions. That divide is clear. As a result, the gene encoding the polypeptide of the present invention mainly binds to microfilaments that are present in cells and is composed of actin, etc. It is possible to express the function or to move or move the cells, and it is easily presumed that it is related to the cell differentiation and proliferation in each organ.
According to the present invention, the gene encoding the novel polypeptide having the immunoglobulin-like repeating domain and the proline-rich sequence of the present invention was ubiquitously expressed in all tissues. It has now been found for the first time that the gene sequence of the present invention has a relatively low expression level in the brain and that it is expressed in all stages of development. May be involved in the important function of controlling cell proliferation and differentiation in the plant.
The ph02462 protein of the present invention is a protein having a novel immunoglobulin-like repeating domain and a proline-rich sequence characterized by being strongly expressed in all tissues. Alternatively, it is clear that the present invention is useful for elucidating pathological conditions (eg, canceration and aging) relating to organs of the whole body and for developing prophylactics, therapeutics, and test drugs, which is an excellent point of the present invention.
[0049]
Heretofore, a polypeptide having two immunoglobulin-like repeating domains on the N-terminal side and three immunoglobulin-like repeating domains on the C-terminal side, sandwiching a proline-rich characteristic sequence Is not reported. In addition, the gene sequence of the present invention encoding the amino acid sequence having these immunoglobulin-like repeating domains and proline-rich sequences has been found to be universally expressed in any tissue as a result of expression frequency analysis at the mRNA level. It was found that it was expressed during the entire process of development, and it is possible that the protein encoded by the gene of the present invention may play an important role in regulating cell growth and differentiation in all tissues. Shown for the first time.
Two immunoglobulin-like repeat domains on the N-terminal side and three immunoglobulin-like repeats on the C-terminal side, sandwiching the proline-rich characteristic sequence found in the polypeptide of the present invention. A polypeptide having a domain-containing structure is considered to be a domain more involved in cytoskeleton formation, and the polypeptide of the present invention is presumed to be a molecule involved in an important function of controlling cell growth and differentiation.
The polypeptide of the present invention having an immunoglobulin-like repeating domain and a proline-rich sequence has a proline-rich sequence sandwiched between immunoglobulin-like repeating domains. Skillfully controlling their functions enhances their functions of elongation of cell projections, cell adhesion, cell morphology changes, etc. It can be said that it does.
The polypeptide of the present invention is a polypeptide having a novel immunoglobulin-like repeat domain and a proline-rich sequence characterized by being strongly expressed in all tissues. It is clear that the present invention is useful for elucidation of pathological conditions (for example, canceration and aging) related to organs of the whole body, and development of preventive drugs, therapeutic drugs, and test drugs therefrom, which is an excellent point of the present invention. In addition, the use of the recombinant protein of the present invention or a recombinant expressing the recombinant protein is excellent in that it can be used for agonist and antagonist screening or drug design research.
[0050]
The expression of the mRNA level of the human KIAA0992 gene was examined, and strong expression was found in the spinal cord and ovary, and relatively strong expression was found in the heart, liver, lung and the like (DNA Research, 1999, 6: 63-70). However, since the mph02462 gene of the present invention is ubiquitously expressed in various organs, it can be universally developed in various organs, preserved its function, or used in various organs for cells such as cancer, autoimmune diseases and allergies. It is useful for elucidating the mechanism of human diseases including diseases related to proliferation and abnormalities of differentiation such as aging or congenital malformation, and developing diagnostic / therapeutic drugs and test drugs. By using the recombinant protein of the present invention or a recombinant expressing the recombinant protein, it can be used for screening of agonists and antagonists or for drug design research.
[0051]
Thus, a gene encoding a polypeptide having an immunoglobulin-like repeating domain and a proline-rich sequence which are extremely important for cell proliferation / differentiation and aging can itself directly become a disease-causing gene. For example, the FPPPP motif is found in the Wiscott-Aldrich syndrome protein (WASP) family of proteins that regulates the spatial assembly of actin proteins and is implicated in immunodeficiency disorders (Parast, MM & Otey CA, 2000, J. Am. Cell Biol., 150: 643-655, Reinhard, M. et al., 1995, The EMBO J., 14: 1583-1589, Niebuhr, K. et al., 1997, The EMBO J., 17: 5433-. 5444).
From these findings, the DNA relating to the polypeptide having the immunoglobulin-like repeating domain and the proline-rich sequence of the present invention, the gene containing the DNA, the polypeptide encoded by the DNA, and the recombinant protein containing the polypeptide It is strongly suggested that they are universally involved in the regulation of cell proliferation or differentiation in various organs, and that they are involved in the elucidation of pathological conditions related to the maintenance of functions and aging of these organs.
[0052]
【The invention's effect】
The polypeptide encoded by the human KIAA0992 gene is as short as 772 amino acids in length, and the motif structure for estimating its function is limited, so that the estimation of its function is also limited. The present inventors have cloned a gene (DNA) exhibiting high homology to the human KIAA0992 gene from a cDNA library derived from mouse embryonic tail buds, and have newly added a new DNA sequence at the N-terminal side. Succeeded in getting. The polypeptide encoded by the novel DNA sequence is as long as 1,081 amino acids long, and the polypeptide has two immunoglobulin-like repeats at the N-terminal side across a proline-rich characteristic sequence. An unconventional configuration comprising a domain and three immunoglobulin-like repeating domains on the C-terminal side, which is important for cell growth such as cell process elongation, cell adhesion and function expression, or cell movement and migration. Presumed to be involved in the process. Furthermore, it has been found for the first time that the gene sequence of the present invention has a relatively low expression level in the brain and that it is expressed in all stages of development. It was suggested that it may be involved in the important function of regulating cell proliferation and differentiation in tissues.
[0053]
From what has been described above, the DNA of the present invention, the polypeptide of the present invention, or the antibody of the present invention include diseases related to cell proliferation such as cancer, autoimmune diseases and allergies, and abnormalities of differentiation such as congenital malformations. It is considered to play an indispensable role in elucidating the mechanism of human diseases and in diagnosing and treating them, and in preserving the functions of various organs and preventing aging. In addition, pattern information of expression at each tissue and developmental stage by expression frequency analysis at the mRNA level is ubiquitously expressed in various organs, and is ubiquitously expressed in each developmental process. The present inventors have clarified that the gene of the present invention is important in the development and differentiation of various organs, the maintenance of their functions, and aging.
Accordingly, the DNA of the present invention and a gene derived from a mammal containing the DNA, a part or the full length of a polypeptide encoded by the DNA, an antibody against the part or the full length of the polypeptide, an antisense DNA, etc. can cause cancer or congenital malformation. It can be used as a medicine in the development of various treatment / prevention methods using mice, which are model animals for treating human diseases, including humans.
[0054]
[Sequence list]
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094
Figure 2004283094

[Brief description of the drawings]
FIG. 1 shows a novel polypeptide having an immunoglobulin-like repeating domain and a proline-rich sequence newly recognized in the polypeptide of the present invention (aa: amino acid sequence, numeral is the number of amino acids, box: HMMPfam search from above) Immunoglobulin-like repeat domains and domains having a proline-rich sequence identified by different search methods, such as the HMMSmart search method and the ProfileScan search method.)
From these results, immunoglobulin-like repeat domains and domains having proline-rich sequences were newly identified by the ProfileScan search method, the HMMPfam search method, and the HMMSmart search method, respectively.
FIG. 2 is a comparison of the expression intensities of the mph02462 (mouse KIAA0992) gene in each mouse tissue and each developmental stage by RT-PCR. The upper two photographs show the expression intensity of the mph02462 gene and the lower photograph shows the ethidium bromide staining pattern after fractionation by agarose electrophoresis of the expression intensity of the housekeeping gene (G3PDH) used as a control.

Claims (9)

以下の(a)又は(b)のポリペプチドをコードする塩基配列から成るDNA:(a)配列番号:1で示されるアミノ酸配列と同一又は実質的に同一のアミノ酸配列の一部又は全部から成るポリペプチド;又は(b)配列番号:1で示されるアミノ酸配列において、一部のアミノ酸が欠失、置換又は付加されたアミノ酸配列から成り、(a)のポリペプチドと実質的に同質の生物学的活性を有するポリペプチド。DNA consisting of the following nucleotide sequence encoding the polypeptide of (a) or (b): (a) consisting of part or all of the same or substantially the same amino acid sequence as the amino acid sequence represented by SEQ ID NO: 1 A polypeptide; or (b) an amino acid sequence represented by SEQ ID NO: 1 in which some amino acids are deleted, substituted or added, and are substantially the same as the polypeptide of (a). A polypeptide having a biological activity. 以下の(a)、(b)又は(c)のDNA:(a)配列番号:2で示される塩基配列において、配列番号:1で示されるアミノ酸配列の一部又は全部をコードするDNA;(b)(a)のDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズするDNA;又は(c)(a)のDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズし、(a)のDNAがコードするポリペプチドと実質的に同質の生物学的活性を有する蛋白質をコードするDNA。DNA of the following (a), (b) or (c): (a) DNA encoding part or all of the amino acid sequence represented by SEQ ID NO: 1 in the nucleotide sequence represented by SEQ ID NO: 2; b) a DNA that hybridizes under stringent conditions with a DNA consisting of a nucleotide sequence complementary to the DNA of (a); or (c) a DNA that is stringent with a DNA consisting of a nucleotide sequence complementary to the DNA of (a). A DNA that hybridizes under the conditions and encodes a protein having substantially the same biological activity as the polypeptide encoded by the DNA of (a). 請求項1又は2記載のDNAを含む哺乳動物由来遺伝子。A mammal-derived gene comprising the DNA according to claim 1. 請求項3記載の哺乳動物が齧歯類である齧歯類由来遺伝子。A gene derived from a rodent, wherein the mammal according to claim 3 is a rodent. 請求項4記載の齧歯類がマウスであるマウス遺伝子。A mouse gene wherein the rodent of claim 4 is a mouse. 以下の(a)又は(b)のポリペプチド:(a)配列番号:1で示されるアミノ酸配列と同一又は実質的に同一のアミノ酸配列の一部または全部から成るポリペプチド;又は(b)配列番号:1で示されるアミノ酸配列において、一部のアミノ酸が欠失、置換又は付加されたアミノ酸配列の一部または全部から成り、(a)のポリペプチドと実質的に同質の生物学的活性を有するポリペプチド。A polypeptide of the following (a) or (b): (a) a polypeptide consisting of part or all of the same or substantially the same amino acid sequence as the amino acid sequence shown in SEQ ID NO: 1; or (b) a sequence In the amino acid sequence represented by No. 1, part or all of the amino acid sequence in which some amino acids have been deleted, substituted or added, has substantially the same biological activity as the polypeptide of (a). Polypeptide. 請求項1若しくは2記載のDNA、又は請求項3ないし5のいずれか一項に記載の遺伝子を導入した宿主細胞で作製される組換え蛋白質である、請求項6記載のポリペプチド。The polypeptide according to claim 6, which is a recombinant protein produced in a host cell into which the DNA according to claim 1 or 2 or the gene according to any one of claims 3 to 5 has been introduced. 請求項1若しくは2記載のDNA、又は請求項3ないし5のいずれか一項に記載の遺伝子を含む組換えベクター。A recombinant vector comprising the DNA according to claim 1 or 2, or the gene according to any one of claims 3 to 5. 請求項6又は7記載のポリペプチドに特異的に結合する抗体。An antibody that specifically binds to the polypeptide of claim 6.
JP2003079713A 2003-03-24 2003-03-24 New polypeptide having immunoglobulin-like repeated domain and sequence rich in proline, and dna encoding the same Pending JP2004283094A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003079713A JP2004283094A (en) 2003-03-24 2003-03-24 New polypeptide having immunoglobulin-like repeated domain and sequence rich in proline, and dna encoding the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003079713A JP2004283094A (en) 2003-03-24 2003-03-24 New polypeptide having immunoglobulin-like repeated domain and sequence rich in proline, and dna encoding the same

Publications (1)

Publication Number Publication Date
JP2004283094A true JP2004283094A (en) 2004-10-14

Family

ID=33293754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003079713A Pending JP2004283094A (en) 2003-03-24 2003-03-24 New polypeptide having immunoglobulin-like repeated domain and sequence rich in proline, and dna encoding the same

Country Status (1)

Country Link
JP (1) JP2004283094A (en)

Similar Documents

Publication Publication Date Title
JP2002112772A (en) New polypeptide and its dna
JP2002522016A (en) Protein similar to neuroendocrine-specific protein and cDNA encoding the same
JP2003533977A (en) Laryngeal cancer-related protein LARCAP-1
WO2002052005A1 (en) Novel genes and proteins encoded thereby
US20040072742A1 (en) Novel gene and use thereof
JP2004283094A (en) New polypeptide having immunoglobulin-like repeated domain and sequence rich in proline, and dna encoding the same
JP2003521894A (en) Novel human G-protein coupled receptor
JP2004073076A (en) NEW POLYPEPTIDE HAVING BTB/POZ DOMAIN AND Kelch RECURRING SEQUENCE AND DNA ENCODING THE SAME
JP2004222680A (en) New polypeptide having fha, ring finger and d111/g-patch domains and dna encoding the same
JP2004337122A (en) New polypeptide having fha domain and membrane anchor region and dna encoding the same
JP4751202B2 (en) Novel Plexin polypeptide, DNA encoding the same, and use thereof
JP2004081204A (en) NEW POLYPEPTIDE HAVING RasGEF MOTIF AND DNA ENCODING THE SAME
JP4508872B2 (en) Gene transcription regulator
JP2005052003A (en) New polypeptide having uba domain and dna encoding the same
JP2004135617A (en) New gene and protein encoded thereby
JP2004187668A (en) New polypeptide having sequence rich in hat (half-a-tubular reabsorption of phosphorus) repeating motif and proline, and dna coding the same
US20040019006A1 (en) Novel genes relating to pain and use of the genes for pharmaceuticals
US20040091960A1 (en) Novel physiologically active peptides and use thereof
JP2002153290A (en) New unc5h4 gene and protein encoded thereby
JP2001258573A (en) New fat3 gene and protein encoded therewith
JP2001029090A (en) Novel polypeptide
JP2001327295A (en) New human dachsous gene and protein encoded by the same
JP2002360254A (en) New membrane-bound-secretory megf8 gene and protein encoded by the same
JP4300008B2 (en) Novel protein and its DNA
JP2001238685A (en) New gene and its use