JP2005500020A - Protein cluster V - Google Patents

Protein cluster V Download PDF

Info

Publication number
JP2005500020A
JP2005500020A JP2002581476A JP2002581476A JP2005500020A JP 2005500020 A JP2005500020 A JP 2005500020A JP 2002581476 A JP2002581476 A JP 2002581476A JP 2002581476 A JP2002581476 A JP 2002581476A JP 2005500020 A JP2005500020 A JP 2005500020A
Authority
JP
Japan
Prior art keywords
nucleic acid
acid molecule
protein
nucleotide sequence
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002581476A
Other languages
Japanese (ja)
Inventor
アツテルサンド,アンネリ
Original Assignee
フアーマシア・アー・ベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フアーマシア・アー・ベー filed Critical フアーマシア・アー・ベー
Publication of JP2005500020A publication Critical patent/JP2005500020A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Toxicology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本発明は、代謝的に関連する組織において発現されるヒト遺伝子ファミリーの同定に関する。前記遺伝子は、“タンパク質クラスターV”と称され、肥満症や糖尿病のような代謝疾患の診断において及び前記疾患の治療に使用される物質の同定において有用であると予想されるポリペプチド群をコードする。The present invention relates to the identification of human gene families that are expressed in metabolically related tissues. The gene is referred to as “protein cluster V” and encodes a group of polypeptides that are expected to be useful in the diagnosis of metabolic diseases such as obesity and diabetes and in the identification of substances used in the treatment of the diseases. To do.

Description

【技術分野】
【0001】
本発明は、代謝的に関連した組織において発現されるヒト遺伝子ファミリーの同定に関する。前記遺伝子は、“タンパク質クラスター”と称され、肥満症や糖尿病のような代謝疾患の診断において及び前記疾患の治療に使用される物質の同定において有用であると予想されるポリペプチド群をコードする。
【背景技術】
【0002】
代謝疾患は、正常な代謝を破壊する疾患または障害と定義される。これらの疾患は栄養不足により、内分泌系、肝臓または腎臓の疾患に関連して、または遺伝子欠陥の結果として生じ得る。代謝疾患は、エネルギーの発生、細胞成分の再生、または前記プロセスから生ずる不必要物質の排除に必須の1つ以上の化学反応における異常に起因する状態である。関与する代謝経路に応じて、1つの欠陥化学反応から1つの身体機能しか関わらない狭い結果または多くの臓器及び系に影響を与える広範囲の結果が生ずる恐れがある。
【0003】
代謝に影響を及ぼす主要ホルモンの1つは、膵臓のランゲルハンス島のβ細胞で合成されるインスリンである。インスリンは主に代謝方向を調節し、多くのプロセスを基質の貯蔵に向かって、基質の分解から遠ざけて進める。インスリンは、グルコースやアミノ酸、及びカリウム、マグネシウムやリンのような主要ミネラルの血液から細胞への輸送を高めるように働く。また、インスリンは、共通する全方向(すなわち、小単位からの大分子の合成)を有する細胞内の各種酵素反応をも調節する。インスリン作用の欠陥(糖尿病)は、(i)グリコーゲンの形でのグルコースの貯蔵及びエネルギーのためのグルコースの酸化、(ii)脂肪酸及びその前駆体からの脂肪の合成及び貯蔵、並びに脂肪酸酸化の完成、(iii)アミノ酸からのタンパク質の合成、において重大な問題を引き起こす。
【0004】
糖尿病には2つの型がある。I型は、インスリン注射を必要とするインスリン依存性糖尿病(IDDM)である。I型は従来若年性糖尿病と呼ばれていた。このI型では、膵臓からインスリンが分泌されないので、注射によりインスリンを摂取しなければならない。II型のインスリン非依存性糖尿病(NIDDM)は食事制限によりコントロールされ得る。II型は膵臓からのインスリン分泌の不足及び分泌インスリンに対する組織耐性に起因し、β細胞によるインスリンの分泌の微妙な変化により悪化する。従来は若年及び成人に分類されていたが、いずれの型も年令に関わらず発症し得る。しかしながら、NIDDMは最も一般的な型であり、全糖尿病患者の90%を占めている。糖尿病の正確な原因は依然不明であるが、NIDDMが遺伝及び肥満に関連していることは明らかである。過体重か肥満となったヒトには明らかにNIDDM糖尿病にかかりやすい遺伝的素因がある。
【0005】
肥満は通常、体重(kg)を身長(m)の二乗で割った値のボディ・マス・インデックス(BMI)で定義されている。体重は十分な精度で管理される。体重は、正常な体重を有する者のみならず、体重が目標とする設定値を越えている多くの肥満者でも管理されると考えられる。肥満の判定は遺伝、環境及び管理に分けられる。
【0006】
最近の知見は、どのように遺伝子が肥満を決定するか、どのように遺伝子が体重の管理に影響を及ぼし得るかを説明するのに役立つ。例えば、ob遺伝子が変異されるとマウスで大肥満が生じた。ob遺伝子をクローン化して、この遺伝子によりコードされるタンパク質であるレプチンが同定された。レプチンは脂肪組織細胞中で生産され、体脂肪をコントロールするように働く。レプチンはエネルギー代謝をコントロールする脳の領域と脂肪組織の間のシグナルとして機能し、体重に影響を及ぼすので、レプチンの存在は体重が管理されるという考えを裏付ける。
【0007】
糖尿病や肥満症のような代謝疾患は臨床的且つ遺伝的に異質の疾患である。分子遺伝学の最近の進歩から、IDDM及び青年の成人発症型糖尿病(MODY)を含めた幾つかのサブタイプのNIDDMに関わる遺伝子が認識された(Velho & Froguel,Diabetes Metab.,23,補遺2:34−37(1997))。しかしながら、幾つかのIDDM感受性遺伝子は未だ同定されておらず、NIDDMの共通する型に関与する遺伝子はほんの少ししか知られていない。候補遺伝子及びIDDMまたはNIDDMの動物モデルにおいてマッピングされる遺伝子の研究、並びに異なる人種から糖尿病ファミリーの全ゲノムスキャンニングにより、多くの糖尿病感受性遺伝子及び新規の有力薬物に対する分子標的が同定されなければならない。代謝疾患に関わる遺伝子が同定されると、新規の予防及び治療方法が開発されるであろう。
【0008】
β3−アドレナリン受容体(AR)は多数の強力な抗肥満薬物標的の1つであり、前記標的に対する選択的アゴニストが開発されている。げっ歯動物では、β3−AR mRNAは白色脂肪組織(WAT)及び褐色脂肪組織(BAT)中に多く存在する。内在性β3−アドレナリン受容体を欠くマウスでは体脂肪が僅かしか増加せず、他の点では正常に見えることが立証されている(V.S,Susulicら,J.Biol.Chem.,270(49):29483−29492(1995))。前記マウスは、脂肪分解及びエネルギー支出を増加させ、インスリン及びレプチンレベルに悪影響を及ぼすことが判明している特定のβ3−アゴニストCL−316,243に対して完全に耐性である。β3−ARを白色及び褐色脂肪組織の両方または褐色脂肪組織のみで異所的に発現させた場合、食欲不振及びインスリン分泌促進効果が白色脂肪組織により媒介されるようであることが最近判明した(D.Grujic,J.Biol.Chem.,272(28):17686−93(1997))。これらの効果がβ3−ARアゴニストにより媒介される機構は依然として十分に理解されていない。
【0009】
いずれも2001年7月31日に発表されたK.D.Lardizabalら,J.Biol.Chem.,276:38862−38869及びS.Casesら,J.Biol.Chem.,276:38870−38876には、本発明の“クラスターV”タンパク質に相当するタンパク質をコードする新規な遺伝子ファミリーが開示されており、この中には真菌、植物及び動物中のメンバーが含まれている。前記タンパク質はアシルCoA:ジアシルグリセロールアシルトランスフェラーゼ(DGAT;EC 2.3.1.20)機能を有することが分かっている。前記遺伝子ファミリーは既に同定されているDGAT(1)ファミリーとは無関係であり、DGAT2と称されていた。DGAT2は肝臓及び白色脂肪組織において高発現レベルを有することが分かっており、このことから哺乳動物トリグリセリド代謝において重大な役割を果たし得ることが示唆される。
【発明の開示】
【0010】
本発明によれば、遺伝子及びコード化相同タンパク質のファミリー(以下、「タンパク質クラスターV」)が同定された。従って、本発明は、(a)配列番号3、5、7、9、11、13、15、17または19に示すヌクレオチド配列を含む核酸分子、(b)(a)に記載の核酸分子のポリペプチドコード領域に相補性のヌクレオチド配列にストリンジェントなハイブリダイゼーション条件下でハイブリダイズし得るヌクレオチド配列を含む核酸分子、及び(c)遺伝コードの結果として(a)または(b)に記載のヌクレオチド配列に縮重する核酸配列を含む核酸分子から選択される単離核酸分子を提供する。
【0011】
本発明の核酸分子には、cDNA、化学合成したDNA、PCRにより単離したDNA、ゲノムDNA及びその組合せが含まれる。DNAから転写したRNAも本発明に包含される。
【0012】
用語「ストリンジェントなハイブリダイゼーション条件」は一般的プロトコル(例えば、上掲のAusubelら)から当業界で公知であり、例えば+65℃で0.5M NaHPO、7% ドデシル硫酸ナトリウム(SDS)、1mM EDTA中でのフィルター結合DNAへのハイブリダイゼーション及び+68℃で0.1×SSC/0.1%SDS中での洗浄として理解され得る。
【0013】
本発明の好ましい実施態様において、前記核酸分子は配列表の配列番号3、5、7、9、11、13、15、17または19と同一のヌクレオチド配列を有する。しかしながら、本発明の核酸分子は配列番号3、5、7、9、11、13、15、17または19に示す配列に厳密に限定されない。むしろ、本発明のタンパク質クラスターVポリペプチドの特徴を実質的に有するタンパク質をコードするならば置換、小さな欠失、挿入または反転のような修飾を有する核酸分子も本発明に包含される。従って、配列表の配列番号3、5、7、9、11、13、15、17または19に示すヌクレオチド配列と少なくとも90%、好ましくは少なくとも95%相同のヌクレオチド配列を有する核酸分子が本発明に包含される。
【0014】
遺伝コードのために配列番号3、5、7、9、11、13、15、17または19に示すヌクレオチド配列に縮重するヌクレオチド配列を有する核酸分子も本発明に包含される。3ヌクレオチドの逐次分類、すなわちコドンはアミノ酸をコードする。64コドン及び20個の天然アミノ酸が存在し得るので、多くのアミノ酸は1つ以上のコドンによりコードされる。遺伝コードの天然の「縮重」または「縮退」は当業界で公知である。よって、配列表に示すヌクレオチド配列はタンパク質クラスターVポリペプチドをコードする配列の大きいが有限の群の中の1例にすぎない。
【0015】
本発明の核酸分子は分子生物学の分野の当業者に公知の技術で多数の用途を有する。これらの技術には、ハイブリダイゼーションプローブとして、染色体及び遺伝子マッピングのため、PCR法、センスまたはアンチセンス核酸の産生、新規の治療用分子のスクリーニング等の分野が含まれる。
【0016】
より具体的には、本発明により提供される配列情報により、当業界で公知の方法を用いてコード化ポリペプチドの大規模発現が可能となる。本発明の核酸分子により、サザン及び/またはノーザンハイブリダイゼーションやPCRを含めた公知の技術を用いて関連ポリペプチド、例えばヒト対立遺伝子変異体及び種同族体をコードする核酸分子を同定、単離することができる。ヒトDNAの配列の知識から、サザンハイブリダイゼーションやPCRを用いてクラスターV中のタンパク質をコードするゲノムDNA配列、プロモーター、オペレーター、エンハンサー、リプレッサー等のような発現制御調節配列の同定も可能となる。本発明の核酸分子は、クラスターV中のタンパク質を発現させる細胞の能力を検出するためのハイブリダイゼーションアッセイにおいても有用である。本発明の核酸分子は疾患または病的状態の原因となる座の遺伝的変化を同定するために使用される診断方法の基礎となり得る。前記情報は診断のため及び治療方法を選択するために使用される。
【0017】
更なる態様として、本発明は上記した核酸分子によりコードされる単離ポリペプチドを提供する。好ましい実施態様では、前記ポリペプチドは配列表の配列番号4、6、8、10、12、14、16、18または20のアミノ酸配列を有する。しかしながら、本発明のポリペプチドは配列表の配列番号4、6、8、10、12、14、16、18または20と同一のアミノ酸配列を有するポリペプチドに厳密に限定されない。むしろ、、タンパク質クラスターCポリペプチドの特徴を実質的に有するならば置換、小さな欠失、挿入または反転のような修飾を有するポリペプチドも本発明に包含される。従って、配列表の配列番号4、6、8、10、12、14、16、18または20に示すアミノ酸配列と少なくとも90%、好ましくは少なくとも95%相同のアミノ酸配列を有するポリペプチドが本発明に包含される。
【0018】
更なる態様として、本発明は上記した核酸分子を含むベクターを提供する。前記ベクターは、例えば本発明のDNA分子を有し、このDNA分子の発現を媒介し得る複製可能な発現ベクターであり得る。本明細書中、「複製可能な」とはベクターが導入された所定型の宿主細胞においてベクターが複製し得ることを意味する。ベクターの例はバクテリオファージのようなウイルス、コスミド、プラスミド及び他の組換えベクターである。核酸分子を当業界で公知の方法によりベクターゲノムに挿入する。
【0019】
本発明のベクターを有する培養宿主細胞も本発明に包含される。前記宿主細胞は原核細胞、単細胞の真核細胞または多細胞生物由来の細胞であり得る。よって、宿主細胞の例は大腸菌のような細菌細胞、サッカロミセスセレビシエ(Saccharomyces cervisiae)またはPichia pastorisのような酵母由来の細胞、または哺乳動物細胞であり得る。宿主細胞にベクターを導入するために使用される方法は組換えDNA方法に通じている当業者には公知の標準方法である。
【0020】
別の態様として、本発明は宿主細胞をポリペプチドを生産する条件下で培養し、生じたポリペプチドを回収することを含むポリペプチドの生産方法を提供する。細胞を増殖するために使用される媒体はその目的に適した慣用の媒体であり得る。好適なベクターは上記したベクターであり、好適な宿主細胞は上記にリストした細胞型であり得る。ベクターを構築し、それを宿主細胞に導入するために使用される方法はその目的のために組換えDNA分野で公知の方法であり得る。細胞により発現させた組換えポリペプチドは細胞の種類及びベクターの組成に応じて分泌され得る。すなわち、細胞膜を介して放出され得る。
【0021】
更なる態様として、本発明は本発明の核酸分子を調節し得る物質の同定方法を提供し、その方法は(i)前記核酸分子を含む細胞を用意し、(ii)前記細胞を候補物質と接触させ、(iii)候補物質の非存在下では存在しない効果について前記細胞をモニターすることを含む。
【0022】
スクリーニング目的で、適当な宿主細胞をリポーター遺伝子を有するベクターを用いて本発明の核酸分子の制御下で形質転換させ得る。リポーター遺伝子の発現を公知の活性を有する物質(すなわち、標準物質)または予想活性を有する物質(すなわち、「試験物質」または「候補物質」)の存在または非存在下で測定し得る。試験物質の存在下でのリポーター遺伝子の発現レベルの変化を標準物質によりもたらされる発現レベルと比較する。このようにして、本アッセイで活性物質が同定され、相対力価が測定される。
【0023】
トランスフェクションアッセイは、有効物質を同定するための特に有用なスクリーニングアッセイであり得る。トランスフェクションアッセイでは、本発明の核酸分子に作動的に結合するレポーター遺伝子のような遺伝子を含む核酸を所望の細胞型にトランスフェクトする。候補物質の存在下でレポーター遺伝子の試験発現レベルを測定し、対照の発現レベルと比較する。有効物質は、リポーター遺伝子の対照発現レベルとは異なる試験発現レベルを生ずる物質として同定される。なお、対照発現レベルは候補物質の非存在下で測定した発現レベルである。細胞のトランスフェクト方法及び各種の有用なリポーター遺伝子は当業界で公知である(例えば、Goeddel編,Methods Enzymol.,Vol.185,サンジェゴに所在のAcademic Press Inc.(1990年)発行を参照。上掲のSambrookも参照されたい)。
【0024】
本明細書中、用語「一般的プロトコル」及び「一般的手順」は分子生物学的技術に関連して使用されているとき、F.Ausubelら編,「分子生物学における現在のプロトコル(Current Protocols in Molecular Biology)」,John Wiley and Sons,Inc.(1994年)発行またはJ.Sambrook,E.F.Fritsch及びT.Maniatis,「分子クローニング:実験マニュアル(Molecular Cloning: A laboratory manual)」,第2版,ニューヨーク州コールドスプリングハーバーに所在のCold Spring Harbor Laboratory Press(1989年)発行のような一般的な実験マニュアルに記載されているプロトコル及び手順と理解されたい。
【実施例1】
【0025】
タンパク質クラスターの同定
Wormpep20データーベースリリース(http://www.sanger.ac.uk/Projects/C_elegans/wormpep/index.shtml)においてすべての土壌線虫(Caenorhabditis elegans)タンパク質を用いる“全部対全部”BLAST手順により、相同タンパク質ファミリー(以下、“タンパク質クラスターV”と呼ぶ)を同定した。Wormpepデーターベースは、英国ケンブリッジに所在のSanger Centre及び米国セントルイスに所在のGenome Sequencing Centerが共同で実施した土壌線虫ゲノム配列決定プロジェクトからの予想タンパク質を含んでいる。18,940個のタンパク質をWormpep20から検索した。これらのタンパク質を、類似のタンパク質を分類するためにSmith−Watermanクラスタリング法(T.F.Smith及びM.S.Waterman,「共通分子サブ配列の同定(Identification of common molecular subsequences)」,J.Mol.Biol.,147(1):195−197(1981);W.R.Pearson,「タンパク質配列ライブラリーの検索:Smith−Waterman及びFASTaアルゴリズムの感度及び選択性の比較(Searching protein sequence libraries: comparison of the sensitivity and selectivity of the Smith-Waterman and FASTA algorithms)」,Genomics,11:635−650(1991);Olsenら,「Smith−Watermanアラインメントの最適化(Optimizing Smith-Waterman alignments)」,Pac.Symp.Biocomput.,302−313(1990))において使用した。完全な注釈付きタンパク質を除き、未知の機能を有する10,130個のタンパク質を1,800クラスターに分類できた。
【0026】
得られた配列クラスターをデーターベースFlybase(Berkeley Drosophila Gemome Project;http://www.fruitfly.org)に含まれているキイロショウジョウバエ(Drosophila melanogaster)タンパク質と比較し、注釈付きタンパク質を除いた。土壌線虫及びキイロショウジョウバエに保存されている未知タンパク質クラスターをworm/flyデーター組に保存し、これをCeleraヒトゲノムデーターベース(http://www.celera.com)に対してBLAST方法(http://www/ncbi.nlm.nih/gov/Education/BLASTinfo/informations3.html)で使用した。重複断片を、ワシントン大学(http://www.genome.washington.edu/UWGC/analysistools/pharp.htm)で開発したPHRAPソフトウェアを用いて完全長タンパク質にできるだけ密接に集めた。未知の機能を有する相同タンパク質群(“タンパク質クラスターV”)を更なる研究のために選択した。
【0027】
EMBL(http://www.embl.org/Services/index.html)より提供されたESTデーターベースを用いて、クラスターV中のヒトタンパク質が発現したかどうかをチェックし、推定擬似遺伝子を同定した。1つの推定擬似遺伝子を同定し、除いた。
【実施例2】
【0028】
タンパク質クラスターVの分析
(a)アラインメント
このタンパク質ファミリーのヒト部分には、配列番号1、3、5、7、9、11、13、15、17及び19に示す核酸配列によりコードされる配列番号2、4、6、8、10、12、14、16、18及び20に示す7つの異なる150〜250残基ポリペプチドが含まれている。配列番号2に示すアミノ酸配列は、遺伝子“WUGSC:H_DJ0747G18.5”(GenBank受託番号AC004876)によりコードされるヒト261aa配列に対応すると同定された。機能は前記遺伝子に関連していなかった。
【0029】
ClustalWマルチプルアラインメントソフトウェア(Thompsonら,Nucleic Acid Research,22:4673−4680(1994))を用いたタンパク質クラスターV中に含まれるヒトポリペプチドのアラインメントを表Iに示す。このアラインメントは、タンパク質の100残基領域(配列番号2中のNo.23〜147に対応)にわたって高度の保存を示し、新規ドメインの存在が暗示される。
【0030】
(b)HMM−Pfam
ヒトファミリーメンバーに対してHMM−Pfam検索を実施した。Pfamはタンパク質ファミリー及びドメインの大型コレクションである。Pfamは前記ファミリーのマルチプルタンパク質アラインメント及びプロファイル−HMM(プロファイル隠れマルコフモデル)を含む。プロファイル−HMMは、配列ファミリーのコンセンサスの統計的説明を用いて感受性データーベース検索をするために使用し得る。PfamはWWW(http://pfam.wustl.edu;http://www.sanger.ac.uk/Software/Pfam;及びhttp://www.cgr.ki.se/Pfam)で入手可能である。Pfamの後者バージョン(4.3)は1815ファミリーを含んでいる。これらのPfamファミリーはSWISS−PROT 37及びTrEMBl 9中のタンパク質の63%に匹敵する。Pfamについては、Batemanら,「Pfamタンパク質ファミリーデーターベース(The Pfam protein families database)」,Nucleic Acids Res.,28:263−266(2000);Sonnhammerら,「Pfam:タンパク質ドメインのマルチプル配列アラインメント及びHMM−プロファイル(Pfam: Multiple Sequence Alignments and HMM-Profiles of Protein Domains)」,Nucleic Acids Research,26:322−325(1998);Sonnhammberら,「Pfam:種子アラインメントに基づくタンパク質ドメインファミリーの包括的データーベース(Pfam: a Comprehensive Database of Protein Domain Families Based on Seed Alignements)」,Proteins,28:405−420(1997)を参照されたい。
【0031】
HMM−Pfam検索から、タンパク質クラスターVには従来公知のドメインは同定できなかったことが分かる。
【0032】
(c)TM−HMM
クラスターV中のヒトタンパク質をTM−HMM道具(例えば、http://www.cbs.dtu.dk/services/TMHMM−1.0で入手可能)を用いて分析した。TM−HMMは貫膜タンパク質におけるα−ヘリックスの位置及び指向をモデリングし、予想する方法である(Sonnhammerら,「タンパク質配列中の貫膜ヘリックスを予想するための隠れマルコフモデル(A hidden Markov model for predicting transmembrane helices in protein sequences)」,ISMN,6:175−182(1998))。上記結果から、ヒトクラスターVは3〜4個の貫膜セグメントを含むことが分かる。
【0033】
(d)非ヒトオルソログの分析
土壌線虫ゲノムは、K07B1.4(GenBank受託番号AF003384)、F59A1.10(GenBank受託番号Z81557)、Y52G8B.2(GenBank受託番号AC006804)及びW01A11.2(GenBank受託番号U64852)と称されるヒトクラスターV遺伝子にオルソログな4つの遺伝子を含んでいる。最も近い祖先(K07B1.4)は10個のヒト遺伝子産物と平均で44%同一である(「ネマトーダ土壌線虫のゲノム配列:生物学研究のためのプラットフォーム;土壌線虫配列決定コンソーシアム(Genome sequence of the nematode C.elegans: a platform for investigating biology; The C.elegans Sequencing Consortium)」,Science,282:2012−2018(1998)も参照されたい。正誤表がScience,283:35,283:2103及び285:1493(1993)に記載されている)。
【0034】
キイロショウジョウバエゲノムは、ヒトクラスターVにオルソログな4つの遺伝子を含んでいる。最も密接に関連している遺伝子はCG1942(GenBank受託番号AE003840_36)及びCG1946(GenBank受託番号AE003840_37)であり、これらはヒト遺伝子産物に対して39%同一であり(Adamsら,「キイロショウジョウバエのゲノム配列(The genome sequence of Drosophila melanogaster)」,Science,287:2185−2195(2000)も参照)、ヒトタンパク質組に対して42%同一である。
【0035】
クラスターV中のヒトタンパク質はサッカロミセス・セレビシエ(S.cerevisiae)SCYOR245C_1(GenBank受託番号Z75153)及びサッカロミセス・ポンベ(S.pombe)SPCC548_1(GenBank受託番号AL359685)の2つの酵母タンパク質に対して27%の同一性を示す。酵母タンパク質は未知の機能を有する。
【実施例3】
【0036】
発現分析
ヒト遺伝子の組織分布をIncyte Lifeseq(登録商標)データーベース(http://www.incyte.com)を用いて研究した。配列番号1、3、5、7、9、11、13、15及び17に示す遺伝子は主に以下の組織で発現されることが分かった:
配列番号1及び3:肝臓,消化器系、
配列番号7及び9:外分泌腺,結合組織,生殖細胞、
配列番号11:女性性器,尿路、
配列番号17:女性性器,神経系、
配列番号13及び15:消化器系、
配列番号5:心血管系。
【0037】
従って、核酸分子及びコード化ポリペプチドは、生物学的サンプル中に存在する組織及び細胞型を鑑別同定するため、遺伝子が発現する組織に関連する疾患及び障害を診断するために使用されると提案される。
【実施例4】
【0038】
クラスターV遺伝子に対するβ3−ARアゴニストの影響
マイクロアレイは、遺伝子発現プロファイリング、比較ゲノム及びゲノタイピングを含めた用途においてDNA及びRNA変異を測定するために使用され得る数千の各種DNA配列の高次マトリックスから構成される(最近の検討のため、例えばHarringtonら,「DNAマイクロアレイを用いる遺伝子発現のモニタリング(Monitoring gene expression using DNA microarrays)」,Curr.Opin.Microbiol.,3(3):285−291(2000);またはDugganら,「cDNAマイクロアレイを用いる発現プロファイリング(Expression profiling using cDNA Microarrays)」,Nature Genetics,補遺21:10−14(1999)参照)。
【0039】
β3−ARアゴニストがインビボで脂肪組織での遺伝子調節に影響を及ぼすメカニズムを調べるために、Affymetrix GeneChipオリゴヌクレオチドアレイを用いてβ3−ARアゴニストCL−316,243で処理したC57BL/6Jマウスまたは食塩液を注射した対照マウス由来の白色脂肪組織中の多数の遺伝子の転写物プロファイルを比較することにより研究を実施した。
【0040】
対照マウス及びβ3−ARアゴニスト処理マウス由来の白色脂肪組織からポリAmRNAを抽出した。前記mRNAをT7タグ付きオリゴ−dTプライマーを用いて転写し、2本鎖cDNAを作成した。次いで、これらのcDNAを増幅し、インビトロトランスクリプション(IVT)を用いてT7 RNAポリメラーゼ及びビオチニル化ヌクレオチドで標識した。IVT後得られたcRNAを精製し、熱により断片化すると、約35〜200塩基のRNA断片サイズの分布が生じた。それぞれ3アレイ(サブA、サブB及びサブC)及び2アレイ(サブA及びサブB)の2組のAffymetrix Mul9K及びMul1K組を(推奨されている緩衝液中で)対照または処理変性サンプルと45℃で一晩ハイブリダイズした。次いで、前記アレイを洗浄し、Affymetrix fluidicsステーションを利用してR−フィコエリトリンストレプトアビジンで染色した。カートリッジをHewlett−Packard共焦点スキャナーを用いて走査し、画像をGeneChip3.1ソフトウェァ(Affymetrix)を用いて分析した。
【0041】
上記結果から、虫遺伝子F59A1.10にオルソログなマウス遺伝子(GenBank受託番号AA275948)はβ3−ARアゴニスト処理によりダウンレギュレートされることが分かる。クラスターC中のヒト遺伝子は代謝的に重要なシグナル経路にも関わることが仮定される。
【実施例5】
【0042】
多重組織ノーザンブロッティング
クラスターV中のタンパク質の発現プロファイルを十分に分析するために多重組織ノーザンブロッティング(MTN)を実施する。多重組織ノーザン(MTNTM)ブロット(http://www/clontech.com/mtn)は各種ヒト、マウスまたはラット組織由来のPreminumポリA+RNAを特徴づける予備作成したノーザンブロットである。MTNブロットを使用すると、各種組織中の転写物のサイズ及び相対存在量を分析することができる。MTNブロットを使用すると、遺伝子ファミリー及び交互スプライス形態を調査し、交差種相同性を評価することができる。
【実施例6】
【0043】
タンパク質クラスターVに結合するポリペプチドの同定
タンパク質クラスターVと相互作用するタンパク質をアッセイするために、2ハイブリッドスクリーニング方法を実施することができる。Field及びSong,Nature,340:245−247(1989)に記載されたのが最初である2ハイブリッド方法は、インビボでタンパク質−タンパク質相互作用を検出するための酵母ベースの遺伝的アッセイである。この方法により、相互作用するタンパク質を同定できるだけでなく、該タンパク質のためにクローン化遺伝子を即座に利用し得る。
【0044】
2ハイブリッド方法は、2つの公知タンパク質(すなわち、対応遺伝子が既にクローン化されているタンパク質)が相互作用するかを調べるために使用することができる。2ハイブリッド方法の別の重要な用途は、2ハイブリッドライブニリーをスクリーニングすることにより標的タンパク質と相互作用する未知のタンパク質を同定することである。参考のために、例えばChienら,「2ハイブリッドシステム:当該タンパク質と相互作用するタンパク質の遺伝子を同定及びクローンする方法(The two-hybrid system: a method to identify and clone genes for proteins that interact with a protein of interest)」,Proc.Natl.Acad.Sci.USA,88:9578−9582(1991);Bartel PL,Fields,「2ハイブリッドシステムを用いるタンパク質−タンパク質相互作用の分析(Analyzing protein-protein interactions using two-hybrid system)」,Methods Enzymol.,254:241−263(1995);またはWallachら,「酵母2ハイブリッドスクリーニング技術及びアポトーシスにおけるタンパク質−タンパク質相互作用の研究でのその使用(The yeast two-hybrid screening technique and its use in the study of protein-protein interactions in apoptosis)」,Curr.Opin.Immunol.,10(2):131−136(1998)を参照されたい。http://www.clontech.com/matchmakerも参照されたい。
【0045】
2ハイブリッド方法は2つのタンパク質の相互作用を示すために転写活性化の回復を使用する。この方法は、多くの真核転写活性化剤が、特定のプロモーター配列に結合するDNA結合ドメイン(DNA−BD)とRNAポリメラーゼII複合体によりDNA結合部位の下流の遺伝子を転写させる活性化ドメイン(AD)の2つの物理的に区別されるモジュレータードメインから構成されるという事実に基づく。DNA−BDベクターはDNA−BDとバイトタンパク質Xを融合させるべく使用され、ADベクターはADと別のタンパク質Yを融合させるべく使用される。バイトタンパク質と相互作用する新規で未知のタンパク質を検索するためにADとのハイブリッドの全ライブラリーも構築され得る。バイトタンパク質Xと候補タンパク質Yの間で相互作用が生ずると、DNA結合及び活性化に関与する2つの機能ドメインが連結され、その結果転写活性が機能的に回復する。2つのハイブリッドを、適当な上流結合部位を含むリポーター遺伝子を有する酵母宿主菌株に同時形質転換させる。この場合、リポーター遺伝子の発現が候補タンパク質と標的タンパク質の相互作用を示す。
【実施例7】
【0046】
クラスターV遺伝子の完全長クローニング
インビボで特定DNAセグメントを酵素増幅するための公知方法であるポリメラーゼ連鎖反応(PCR)を使用して、タンパク質クラスターV遺伝子をクローニングすることができる。組織cDNAをPCRにより増幅し、適当なプラスミドにクローン化し、配列決定され得る。参考のために、例えばHooft van Huijsduijnen,「PCRによるcDNAクローニング:地雷敷設区域のガイド付きツアー(PCR-assisted cDNA cloning: a guided tour of the minefield)」,Biotechniques,24:390−392(1998);Lenstra,「ライフサイエンスにおけるポリメラーゼ連鎖反応の応用(The applications of the polymerase chain reaction in the life sciences)」,Cellular & Molecular Biology,41:603−614(1995);またはRashtchian,「ポリメラーゼ連鎖反応を用いる遺伝子のクローニング及び遺伝子操作のための新規方法(Novel methods for cloning and engineering genes using the polymerase chain reaction)」,Current Opinion in Biotecynology,6:30−36(1995)を参照されたい。PCR産物のクローニングを容易とするために適当な末端を作成するための各種方法は、例えば上掲のAusubelら(セクション15.7)に記載されている。
【0047】
タンパク質クラスターVの完全長タンパク質をコードするcDNAを単離するための別の方法では、配列番号1、3、5、7、9、11、13、15、17または19からなる群から選択されるヌクレオチド配列に対応するDNA断片またはその一部をファージcDNAライブラリーをハイブリダイゼーションスクリーニング用プローブとして使用し得る。DNA断片をポリメラーゼ連鎖反応(PCR)方法により増幅させる。プライマーは好ましくは10〜25ヌクレオチド長であり、当業者に公知の方法により決定される。ラムダファージ−ベクターにクローン化したcDNAを含むラムダファージライブラリーを大腸菌宿主細胞と一緒に寒天プレート上で平板培養し、増殖させる。ファージプラークをナイロン膜上に移し、上記したように作成したDNAファージプラークとハイブリダイズさせる。プレートからポジティブコロニーを単離する。cDNAを含むプラスミドを一般的方法により単離ファージから取り出す。プラスミドDNAをクローンから単離する。プラスミドを適当な制限酵素を用いて消化させることにより、挿入物のサイズを測定する。全挿入物の配列をプラスミドの自動配列決定により調べる。
【実施例8】
【0048】
真核宿主細胞におけるタンパク質の組換え発現
クラスターVのタンパク質を生産するために、ポリペプチドコード化核酸分子を適当な宿主細胞において適当な発現ベクター及び一般的な遺伝子工学技術を用いて発現させる。例えば、ポリペプチドコード化配列を市販されている発現ベクターにサブクローン化し、哺乳動物(例えば、チャイニーズハムスター卵巣(CHO))細胞に一般的なトランスフェクション試薬を用いてトランスフェクトした。タンパク質を安定的に発現する細胞を選択する。場合により、タンパク質を一般的なクロマトグラフィー技術を用いて細胞から精製してもよい。精製を助けるために、アミノ酸配列の一部に相当する1つ以上の合成ペプチド配列に対する抗血清を作成し、この抗血清をタンパク質をアフィニティー精製するために使用する。
【実施例9】
【0049】
遺伝子機能の測定
各遺伝子の生物学的機能または作用モードを解明するための方法は当業界で公知である。例えば、RNA干渉(RNAi)はクローン化遺伝子を特異的に且つ強力に不活化する方法を与え、遺伝子機能を研究するための有力な道具である。参考のために、例えばFire,「RNAトリガー遺伝子のサイレンシング(RNA-triggered gene silencing)」,Trends in Genetics,15:358−363(1999);またはKuwabara及びCoulson,「遺伝子機能を調べるための一般的技術のRNAi−展望(RNAi-prospects fo a general technique for determining gene function)」,Parasitology Today,16:347−349(2000)を参照されたい。内在性mRNAのセンス及びアンチセンス配列に相当する二本鎖RNA(dsRNA)を細胞に導入すると、同族体mRNAは分解し、遺伝子は沈黙する。このタイプの転写後遺伝子サイレンシング(PTGS)は最初土壌線虫で発見された(Fireら,Nature,391:806−811(1998))。最近、RNA干渉は土壌線虫染色体I(Fraserら,Nature,408:325−330(2000))上の推定遺伝子のほぼ90%及び線虫染色体III(Gonczyら,Nature,408:331−336(2000))上の推定遺伝子の96%を標的するために使用されている。
【0050】
【表1】
【Technical field】
[0001]
The present invention relates to the identification of human gene families that are expressed in metabolically related tissues. The genes are referred to as “protein clusters” and encode a group of polypeptides that are expected to be useful in the diagnosis of metabolic diseases such as obesity and diabetes and in the identification of substances used to treat the diseases. .
[Background]
[0002]
A metabolic disease is defined as a disease or disorder that disrupts normal metabolism. These diseases can occur due to undernourishment, in connection with endocrine system, liver or kidney disease, or as a result of genetic defects. A metabolic disorder is a condition resulting from an abnormality in one or more chemical reactions that are essential for the generation of energy, the regeneration of cellular components, or the elimination of unwanted substances resulting from the process. Depending on the metabolic pathway involved, one defective chemical reaction can produce narrow results involving only one body function or a wide range of results affecting many organs and systems.
[0003]
One of the major hormones affecting metabolism is insulin synthesized in the beta cells of the pancreatic islets of Langerhans. Insulin mainly regulates the metabolic direction and proceeds many processes towards substrate storage, away from substrate degradation. Insulin serves to enhance the transport of glucose and amino acids and major minerals such as potassium, magnesium and phosphorus from the blood to the cells. Insulin also regulates various enzymatic reactions in cells that have a common omnidirectional orientation (ie, synthesis of large molecules from small units). Deficiencies in insulin action (diabetes) are: (i) storage of glucose in the form of glycogen and oxidation of glucose for energy, (ii) synthesis and storage of fat from fatty acids and their precursors, and completion of fatty acid oxidation , (Iii) causes serious problems in the synthesis of proteins from amino acids.
[0004]
There are two types of diabetes. Type I is insulin-dependent diabetes mellitus (IDDM) that requires insulin injections. Type I has traditionally been called juvenile diabetes. In this type I, since insulin is not secreted from the pancreas, insulin must be taken by injection. Type II non-insulin dependent diabetes mellitus (NIDDM) can be controlled by dietary restrictions. Type II is caused by a lack of insulin secretion from the pancreas and tissue resistance to secreted insulin and is exacerbated by subtle changes in insulin secretion by β cells. Traditionally classified as young and adult, any type can develop regardless of age. However, NIDDM is the most common type, accounting for 90% of all diabetic patients. Although the exact cause of diabetes remains unknown, it is clear that NIDDM is related to heredity and obesity. People who are overweight or obese have a clear genetic predisposition to being susceptible to NIDDM diabetes.
[0005]
Obesity is usually defined by the body mass index (BMI), which is the weight (kg) divided by the height (m) squared. Body weight is managed with sufficient accuracy. It is considered that the weight is managed not only by a person having a normal weight but also by many obese persons whose weight exceeds a target set value. Obesity determination is divided into heredity, environment and management.
[0006]
Recent findings help explain how genes determine obesity and how genes can affect weight management. For example, when ob gene was mutated, obesity occurred in mice. The ob gene was cloned and leptin, the protein encoded by this gene, was identified. Leptin is produced in adipose tissue cells and serves to control body fat. Since leptin functions as a signal between the brain region that controls energy metabolism and adipose tissue and affects body weight, the presence of leptin supports the idea that body weight is managed.
[0007]
Metabolic diseases such as diabetes and obesity are clinically and genetically heterogeneous diseases. Recent advances in molecular genetics have recognized genes involved in several subtypes of NIDDM, including IDDM and adolescent adult-onset diabetes (MODY) (Velho & Froguel, Diabetes Metab., 23, Addendum 2). : 34-37 (1997)). However, several IDDM susceptibility genes have not yet been identified, and only a few genes are involved in the common type of NIDDM. Study of candidate genes and genes mapped in IDDM or NIDDM animal models, as well as whole genome scanning of diabetic families from different races, molecular targets for many diabetes susceptibility genes and new potential drugs must be identified . Once the genes involved in metabolic diseases are identified, new prevention and treatment methods will be developed.
[0008]
The β3-adrenergic receptor (AR) is one of many powerful anti-obesity drug targets, and selective agonists for these targets have been developed. In rodents, β3-AR mRNA is abundant in white adipose tissue (WAT) and brown adipose tissue (BAT). It has been demonstrated that mice lacking endogenous β3-adrenergic receptors have only a slight increase in body fat and appear normal otherwise (VS, Susulic et al., J. Biol. Chem., 270 ( 49): 29483-29492 (1995)). The mice are completely resistant to certain β3-agonists CL-316,243 that have been shown to increase lipolysis and energy expenditure and to adversely affect insulin and leptin levels. It has recently been found that when β3-AR is ectopically expressed in both white and brown adipose tissue or brown adipose tissue alone, anorexia and insulin secretion-promoting effects appear to be mediated by white adipose tissue ( D. Grujic, J. Biol. Chem., 272 (28): 1766-93 (1997)). The mechanism by which these effects are mediated by β3-AR agonists is still not fully understood.
[0009]
Both of them were announced on July 31, 2001 by K.K. D. Lardizabal et al., J. MoI. Biol. Chem. 276: 38862-38869 and S.A. Cases et al. Biol. Chem. , 276: 38870-38876 discloses a novel family of genes encoding proteins corresponding to the “cluster V” proteins of the present invention, including members in fungi, plants and animals. Yes. The protein has been found to have an acyl CoA: diacylglycerol acyltransferase (DGAT; EC 2.3.1.20) function. The gene family has nothing to do with the DGAT (1) family that has already been identified and was called DGAT2. DGAT2 has been found to have high expression levels in liver and white adipose tissue, suggesting that it may play a critical role in mammalian triglyceride metabolism.
DISCLOSURE OF THE INVENTION
[0010]
According to the present invention, a gene and a family of encoded homologous proteins (hereinafter “protein cluster V”) have been identified. Accordingly, the present invention provides (a) a nucleic acid molecule comprising the nucleotide sequence shown in SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17 or 19, A nucleic acid molecule comprising a nucleotide sequence capable of hybridizing under stringent hybridization conditions to a nucleotide sequence complementary to the peptide coding region, and (c) the nucleotide sequence according to (a) or (b) as a result of the genetic code An isolated nucleic acid molecule is provided that is selected from nucleic acid molecules comprising a nucleic acid sequence that is degenerate.
[0011]
The nucleic acid molecules of the present invention include cDNA, chemically synthesized DNA, DNA isolated by PCR, genomic DNA, and combinations thereof. RNA transcribed from DNA is also encompassed by the present invention.
[0012]
The term “stringent hybridization conditions” is known in the art from general protocols (eg Ausubel et al., Supra), eg 0.5 M NaHPO at + 65 ° C.47% sodium dodecyl sulfate (SDS), hybridization to filter-bound DNA in 1 mM EDTA and washing in 0.1 × SSC / 0.1% SDS at + 68 ° C.
[0013]
In a preferred embodiment of the present invention, the nucleic acid molecule has the same nucleotide sequence as SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17 or 19 in the sequence listing. However, the nucleic acid molecule of the present invention is not strictly limited to the sequence shown in SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17 or 19. Rather, nucleic acid molecules having modifications such as substitutions, minor deletions, insertions or inversions are also encompassed by the present invention if they encode a protein having substantially the characteristics of the protein cluster V polypeptide of the present invention. Accordingly, a nucleic acid molecule having a nucleotide sequence at least 90%, preferably at least 95% homologous to the nucleotide sequence shown in SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, or 19 in the sequence listing is included in the present invention. Is included.
[0014]
Also encompassed by the present invention are nucleic acid molecules having a nucleotide sequence that degenerates to the nucleotide sequence shown in SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, or 19 due to the genetic code. A sequential classification of 3 nucleotides, ie codons, encodes amino acids. Since there may be 64 codons and 20 natural amino acids, many amino acids are encoded by one or more codons. The natural “degenerate” or “degenerate” of the genetic code is known in the art. Thus, the nucleotide sequence shown in the sequence listing is only one example of a large but finite group of sequences encoding protein cluster V polypeptides.
[0015]
The nucleic acid molecules of the present invention have numerous uses with techniques known to those skilled in the field of molecular biology. These techniques include fields such as PCR methods, production of sense or antisense nucleic acids, screening for new therapeutic molecules, for chromosome and gene mapping as hybridization probes.
[0016]
More specifically, the sequence information provided by the present invention enables large-scale expression of the encoded polypeptide using methods known in the art. The nucleic acid molecules of the present invention identify and isolate nucleic acid molecules encoding related polypeptides, such as human allelic variants and species homologs, using known techniques including Southern and / or Northern hybridization and PCR be able to. Knowledge of human DNA sequences enables identification of expression control regulatory sequences such as genomic DNA sequences encoding promoters in cluster V, promoters, operators, enhancers, repressors, etc. using Southern hybridization and PCR . The nucleic acid molecules of the present invention are also useful in hybridization assays for detecting the ability of cells to express proteins in cluster V. The nucleic acid molecules of the present invention can be the basis of diagnostic methods used to identify genetic changes in loci that cause disease or pathological conditions. Said information is used for diagnosis and for selecting treatment methods.
[0017]
In a further aspect, the present invention provides an isolated polypeptide encoded by the nucleic acid molecule described above. In a preferred embodiment, the polypeptide has the amino acid sequence of SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18 or 20 in the sequence listing. However, the polypeptide of the present invention is not strictly limited to a polypeptide having the same amino acid sequence as SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, or 20 in the sequence listing. Rather, polypeptides having modifications such as substitutions, small deletions, insertions or inversions that are substantially characteristic of the protein cluster C polypeptide are also encompassed by the present invention. Accordingly, a polypeptide having an amino acid sequence at least 90%, preferably at least 95% homologous to the amino acid sequence shown in SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, or 20 in the sequence listing is included in the present invention. Is included.
[0018]
As a further aspect, the present invention provides a vector comprising the nucleic acid molecule described above. The vector can be, for example, a replicable expression vector having the DNA molecule of the present invention and capable of mediating expression of the DNA molecule. In the present specification, “replicatable” means that the vector can replicate in a predetermined type of host cell into which the vector has been introduced. Examples of vectors are viruses such as bacteriophages, cosmids, plasmids and other recombinant vectors. The nucleic acid molecule is inserted into the vector genome by methods known in the art.
[0019]
Cultured host cells carrying the vectors of the present invention are also encompassed by the present invention. The host cell can be a prokaryotic cell, a unicellular eukaryotic cell or a cell derived from a multicellular organism. Thus, examples of host cells include bacterial cells such as E. coli, Saccharomyces cerevisiae (Saccharomyces  cervisiaeOrPichia  pastorisYeast-derived cells such as, or mammalian cells. The method used to introduce the vector into the host cell is a standard method known to those skilled in the art familiar with recombinant DNA methods.
[0020]
In another aspect, the present invention provides a method for producing a polypeptide comprising culturing host cells under conditions that produce the polypeptide and recovering the resulting polypeptide. The medium used to grow the cells can be any conventional medium suitable for that purpose. Suitable vectors are those described above and suitable host cells can be the cell types listed above. The methods used to construct the vector and introduce it into the host cell can be methods known in the recombinant DNA art for that purpose. Recombinant polypeptides expressed by cells can be secreted depending on the cell type and vector composition. That is, it can be released through the cell membrane.
[0021]
As a further aspect, the present invention provides a method for identifying a substance capable of modulating the nucleic acid molecule of the present invention, the method comprising (i) preparing a cell containing the nucleic acid molecule, and (ii) using the cell as a candidate substance. And (iii) monitoring the cells for effects that are not present in the absence of the candidate substance.
[0022]
For screening purposes, suitable host cells can be transformed with the vector carrying the reporter gene under the control of the nucleic acid molecule of the invention. The expression of the reporter gene can be measured in the presence or absence of a substance having a known activity (ie, a standard substance) or a substance having a predicted activity (ie, “test substance” or “candidate substance”). The change in the expression level of the reporter gene in the presence of the test substance is compared with the expression level produced by the standard substance. In this way, the active substance is identified and the relative titer is measured in this assay.
[0023]
A transfection assay can be a particularly useful screening assay for identifying active agents. In a transfection assay, a nucleic acid containing a gene such as a reporter gene that is operably linked to a nucleic acid molecule of the invention is transfected into the desired cell type. The test expression level of the reporter gene is measured in the presence of the candidate substance and compared with the expression level of the control. An active substance is identified as a substance that produces a test expression level that is different from the control expression level of the reporter gene. The control expression level is an expression level measured in the absence of the candidate substance. Cell transfection methods and various useful reporter genes are known in the art (see, eg, published by Academic Press Inc., 1990, edited by Goeddel, Methods Enzymol., Vol. 185, San Diego). (See also Sambrook, above).
[0024]
As used herein, the terms “general protocol” and “general procedure” when used in connection with molecular biology techniques are Edited by Ausubel et al., “Current Protocols in Molecular Biology”, John Wiley and Sons, Inc. (1994) or J.I. Sambrook, E .; F. Fritsch and T.W. Maniatis, "Molecular Cloning: A laboratory manual", 2nd edition, published in general laboratory manuals such as Cold Spring Harbor Laboratory Press (1989), Cold Spring Harbor, NY It should be understood that the protocol and procedure are the same.
[Example 1]
[0025]
Protein cluster identification
All soil nematodes in the Wormpep 20 database release (http://www.sanger.ac.uk/Projects/C_elegans/wormp/index.shtml)Caenorhabditis  elegans) A homologous protein family (hereinafter referred to as “protein cluster V”) was identified by the “all-to-all” BLAST procedure using proteins. The Wormpep database contains predicted proteins from a soil nematode genome sequencing project conducted jointly by Sanger Center in Cambridge, UK and Genome Sequencing Center in St. Louis, USA. 18,940 proteins were searched from Wormpep20. These proteins can be identified using the Smith-Waterman clustering method (TF Smith and MS Waterman, “Identification of common molecular subsequences”, J. Mol, to classify similar proteins. Biol., 147 (1): 195-197 (1981); WR Pearson, “Searching protein sequence libraries: comparison of the sensitivity and selectivity of the Smith-Waterman and FASTa algorithms. of the sensitivity and selectivity of the Smith-Waterman and FASTA algorithms), Genomics, 11: 635-650 (1991); Olsen et al., “Optimizing Smith-Waterman alignments”, Pac. . iocomput., it was used in the 302-313 (1990)). Except for fully annotated proteins, 10,130 proteins with unknown functions could be classified into 1,800 clusters.
[0026]
The resulting sequence cluster is used in the Drosophila melanogaster (Berkeley Drosophila Geme Project; http://www.fruitfly.org)Drosophila  melanogaster) Excluded annotated proteins compared to proteins. Unknown protein clusters conserved in soil nematodes and Drosophila melanogaster are stored in the worm / fly data set, which is stored in the BLAST method (http://www.celera.com) against the Celera human genome database (http://www.celera.com). /Www/ncbi.nlm.nih/gov/Education/BLASTinfo/informations.html). Overlapping fragments were collected as closely as possible to the full-length protein using PHRAP software developed at the University of Washington (http://www.genome.washington.edu/UWGC/analysistools/farp.htm). A group of homologous proteins with unknown function (“protein cluster V”) was selected for further study.
[0027]
EST database provided by EMBL (http://www.embl.org/Services/index.html) was used to check whether human proteins in cluster V were expressed and to identify putative pseudogenes . One putative pseudogene was identified and removed.
[Example 2]
[0028]
Analysis of protein cluster V
(A) Alignment
The human portion of this protein family includes SEQ ID NOs: 2, 4, 6, 8, 10, encoded by the nucleic acid sequences shown in SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, and 19. Seven different 150-250 residue polypeptides shown in 12, 14, 16, 18 and 20 are included. The amino acid sequence shown in SEQ ID NO: 2 was identified to correspond to the human 261aa sequence encoded by the gene “WUGSC: H_DJ0747G18.5” (GenBank accession number AC004876). Function was not associated with the gene.
[0029]
Table I shows the alignment of human polypeptides contained in protein cluster V using ClustalW multiple alignment software (Thompson et al., Nucleic Acid Research, 22: 4673-4680 (1994)). This alignment shows a high degree of conservation across the 100 residue region of the protein (corresponding to Nos. 23-147 in SEQ ID NO: 2), implying the presence of a new domain.
[0030]
(B) HMM-Pfam
HMM-Pfam searches were performed on human family members. Pfam is a large collection of protein families and domains. Pfam includes multiple protein alignments of the family and Profile-HMM (Profile Hidden Markov Model). Profile-HMM can be used to do a susceptibility database search with a statistical description of sequence family consensus. Pfam is available on the WWW (http://pfam.wustl.edu; http://www.sanger.ac.uk/Software/Pfam; and http://www.cgr.ki.se/Pfam) . The latter version (4.3) of Pfam contains the 1815 family. These Pfam families are comparable to 63% of the proteins in SWISS-PROT 37 and TrEMBl 9. For Pfam, see Bateman et al., “The Pfam protein families database”, Nucleic Acids Res. 28: 263-266 (2000); Sonnhamer et al., “Pfam: Multiple Sequence Alignments and HMM-Profiles of Protein Domains”, Nucleic Acids Research, 26: 322. 325 (1998); Sonnhamber et al., “Pfam: a Comprehensive Database of Protein Domain Families Based on Seed Alignements”, Proteins, 28: 405-420 (1997). Please refer to.
[0031]
From the HMM-Pfam search, it can be seen that a conventionally known domain could not be identified in protein cluster V.
[0032]
(C) TM-HMM
Human proteins in Cluster V were analyzed using a TM-HMM tool (eg, available at http://www.cbs.dtu.dk/services/TMHMM-1.0). TM-HMM is a method for modeling and predicting the location and orientation of α-helices in transmembrane proteins (Sonhammer et al., “A hidden Markov model for predicting transmembrane helices in protein sequences. predicting transmembrane helices in protein sequences) ”, ISMN, 6: 175-182 (1998)). From the above results, it can be seen that human cluster V contains 3 to 4 transmembrane segments.
[0033]
(D) Analysis of non-human ortholog
The soil nematode genomes are K07B1.4 (GenBank accession number AF003384), F59A1.10 (GenBank accession number Z81557), Y52G8B. It contains four genes that are orthologous to the human cluster V gene called 2 (GenBank accession number AC006804) and W01A11.2 (GenBank accession number U64852). The nearest ancestor (K07B1.4) is on average 44% identical to the 10 human gene products ("Nematoda soil nematode genome sequence: platform for biological research; Soil nematode sequencing consortium (Genome sequence See also The C. elegans Sequencing Consortium), Science, 282: 2012-2018 (1998). The errata are Science, 283: 35, 283: 2103 and 285: 1493 (1993)).
[0034]
The Drosophila melanogaster genome contains four genes orthologous to human cluster V. The most closely related genes are CG1942 (GenBank accession number AE003840_36) and CG1946 (GenBank accession number AE003840_37), which are 39% identical to the human gene product (Adams et al., “Drosophila melanogaster genome sequence). (See also The genome sequence of Drosophila melanogaster), Science, 287: 2185-2195 (2000)), 42% identical to the human protein set.
[0035]
The human protein in cluster V is Saccharomyces cerevisiae (S. cerevisiae) SCYOR245C_1 (GenBank accession number Z75153) and Saccharomyces pombe (S. pombe) Shows 27% identity to two yeast proteins of SPCC548_1 (GenBank accession number AL359658). Yeast proteins have an unknown function.
[Example 3]
[0036]
Expression analysis
The tissue distribution of human genes was studied using the Incyte Lifeseq® database (http://www.incyte.com). It has been found that the genes shown in SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15 and 17 are mainly expressed in the following tissues:
SEQ ID NOs 1 and 3: liver, digestive system,
SEQ ID NOs: 7 and 9: exocrine glands, connective tissue, germ cells,
Sequence number 11: Female genitals, urinary tract,
SEQ ID NO: 17: female genitals, nervous system,
SEQ ID NOs: 13 and 15: digestive system,
SEQ ID NO: 5: cardiovascular system.
[0037]
Thus, nucleic acid molecules and encoded polypeptides are proposed to be used for diagnosing diseases and disorders associated with tissues in which genes are expressed in order to differentially identify tissues and cell types present in biological samples. Is done.
[Example 4]
[0038]
Effect of β3-AR agonist on cluster V gene
Microarrays are composed of thousands of higher order matrices of various DNA sequences that can be used to measure DNA and RNA mutations in applications including gene expression profiling, comparative genomes and genotyping (for recent studies, For example, Harrington et al., “Monitoring gene expression using DNA microarrays”, Curr. Opin. Microbiol., 3 (3): 285-291 (2000); or Duggan et al., “CDNA microarrays. Expression profiling using cDNA Microarrays ", Nature Genetics, Addendum 21: 10-14 (1999)).
[0039]
To investigate the mechanism by which β3-AR agonists affect gene regulation in adipose tissue in vivo, C57BL / 6J mice or saline treated with β3-AR agonist CL-316,243 using an Affymetrix GeneChip oligonucleotide array Studies were performed by comparing the transcript profiles of a number of genes in white adipose tissue from control mice injected with.
[0040]
Poly A from white adipose tissue from control mice and β3-AR agonist treated mice+mRNA was extracted. The mRNA was transcribed using a T7-tagged oligo-dT primer to prepare a double-stranded cDNA. These cDNAs were then amplified and labeled with T7 RNA polymerase and biotinylated nucleotides using in vitro transcription (IVT). When cRNA obtained after IVT was purified and fragmented by heat, an RNA fragment size distribution of about 35 to 200 bases was generated. Two sets of Affymetrix Mul9K and Mul1K in 3 arrays (Sub A, Sub B and Sub C) and 2 arrays (Sub A and Sub B) respectively (in recommended buffer) and 45 Hybridized overnight at ° C. The array was then washed and stained with R-phycoerythrin streptavidin using an Affymetrix fluidics station. The cartridge was scanned using a Hewlett-Packard confocal scanner and the images were analyzed using GeneChip 3.1 software (Affymetrix).
[0041]
From the above results, it can be seen that a mouse gene (GenBank accession number AA275948) orthologous to the insect gene F59A1.10 is down-regulated by β3-AR agonist treatment. It is hypothesized that the human genes in cluster C are also involved in metabolically important signal pathways.
[Example 5]
[0042]
Multiple tissue northern blotting
Multiple tissue northern blotting (MTN) is performed to fully analyze the expression profile of the proteins in cluster V. Multiple tissue Northern (MTNTM) Blot (http: //www/clontech.com/mtn) is a pre-prepared Northern blot that characterizes Premium poly A + RNA from various human, mouse or rat tissues. Using MTN blots, the size and relative abundance of transcripts in various tissues can be analyzed. Using MTN blots, gene families and alternate splice forms can be investigated to assess cross-species homology.
[Example 6]
[0043]
Identification of polypeptides that bind to protein cluster V
To assay for proteins that interact with protein cluster V, a two-hybrid screening method can be performed. The first two hybrid method described in Field and Song, Nature, 340: 245-247 (1989) is a yeast-based genetic assay for detecting protein-protein interactions in vivo. This method not only identifies the interacting protein, but also makes the cloned gene readily available for the protein.
[0044]
The two-hybrid method can be used to examine whether two known proteins interact (ie, proteins whose corresponding genes have already been cloned). Another important application of the two-hybrid method is to identify unknown proteins that interact with the target protein by screening two-hybrid livelines. For reference, see, for example, Chien et al., “The two-hybrid system: a method to identify and clone genes for proteins that interact with a protein. of interest) ", Proc. Natl. Acad. Sci. USA, 88: 9578-9582 (1991); Bartel PL, Fields, “Analyzing protein-protein interactions using two-hybrid system”, Methods Enzymol. 254: 241-263 (1995); or Wallach et al., “The yeast two-hybrid screening technique and its use in the study of protein”. -protein interactions in apoptosis), Curr. Opin. Immunol. 10 (2): 131-136 (1998). http: // www. clontech. See also com / matchmaker.
[0045]
The two-hybrid method uses the restoration of transcriptional activation to show the interaction of two proteins. In this method, many eukaryotic transcriptional activators have an activation domain (DNA-BD) that binds to a specific promoter sequence and an activation domain (RNA-II complex that transcribes a gene downstream of the DNA binding site). AD) based on the fact that it consists of two physically distinct modulator domains. The DNA-BD vector is used to fuse DNA-BD and bite protein X, and the AD vector is used to fuse AD and another protein Y. A full library of hybrids with AD can also be constructed to search for new and unknown proteins that interact with byte proteins. When interaction occurs between bite protein X and candidate protein Y, two functional domains involved in DNA binding and activation are linked, resulting in functional recovery of transcriptional activity. The two hybrids are co-transformed into a yeast host strain with a reporter gene containing the appropriate upstream binding site. In this case, the expression of the reporter gene indicates the interaction between the candidate protein and the target protein.
[Example 7]
[0046]
Full-length cloning of cluster V gene
Protein cluster V genes can be cloned using the polymerase chain reaction (PCR), a known method for enzymatic amplification of specific DNA segments in vivo. Tissue cDNA can be amplified by PCR, cloned into an appropriate plasmid, and sequenced. For reference, for example, Hoof van Huijsduijnen, “PCR-assisted cDNA cloning: guided tour of the minefield”, Biotechniques, 24: 390-392 (1998); Lenstra, “The applications of the polymerase chain reaction in the life sciences”, Cellular & Molecular Biology, 41: 603-614 (1995); or Rushchian, “Genes Using Polymerase Chain Reactions” Novel methods for cloning and engineering genes using the polymerase chain reaction ", Current Opinion in Biotecyn olology, 6: 30-36 (1995). Various methods for creating suitable ends to facilitate cloning of PCR products are described, for example, in Ausubel et al. (Section 15.7), supra.
[0047]
Another method for isolating cDNA encoding the full length protein of protein cluster V is selected from the group consisting of SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17 or 19. A DNA fragment corresponding to the nucleotide sequence or a part thereof can be used as a probe for hybridization screening using a phage cDNA library. DNA fragments are amplified by the polymerase chain reaction (PCR) method. The primer is preferably 10-25 nucleotides in length and is determined by methods known to those skilled in the art. Lambda phage libraries containing cDNA cloned into a lambda phage-vector are plated on agar plates with E. coli host cells and propagated. Phage plaques are transferred onto nylon membranes and hybridized with DNA phage plaques prepared as described above. Isolate positive colonies from the plate. The plasmid containing the cDNA is removed from the isolated phage by conventional methods. Plasmid DNA is isolated from the clone. The size of the insert is determined by digesting the plasmid with the appropriate restriction enzymes. The sequence of all inserts is examined by automated plasmid sequencing.
[Example 8]
[0048]
Recombinant expression of proteins in eukaryotic host cells
To produce the cluster V protein, the polypeptide-encoding nucleic acid molecule is expressed in a suitable host cell using a suitable expression vector and common genetic engineering techniques. For example, polypeptide coding sequences were subcloned into commercially available expression vectors and transfected into mammalian (eg, Chinese hamster ovary (CHO)) cells using common transfection reagents. Select cells that stably express the protein. In some cases, the protein may be purified from the cells using common chromatographic techniques. To aid in purification, an antiserum is generated against one or more synthetic peptide sequences corresponding to a portion of the amino acid sequence and this antiserum is used to affinity purify the protein.
[Example 9]
[0049]
Gene function measurement
Methods for elucidating the biological function or mode of action of each gene are known in the art. For example, RNA interference (RNAi) is a powerful tool for studying gene function, providing a method for specifically and powerfully inactivating cloned genes. For reference, see, for example, Fire, “RNA-triggered gene silencing”, Trends in Genetics, 15: 358-363 (1999); or Kuubara and Coulson, “General for examining gene function. See RNAi-prospects for a general technique for determining gene function, Parasitology Today, 16: 347-349 (2000). When double-stranded RNA (dsRNA) corresponding to the sense and antisense sequences of endogenous mRNA is introduced into the cell, the homologous mRNA is degraded and the gene is silenced. This type of post-transcriptional gene silencing (PTGS) was first discovered in soil nematodes (Fire et al., Nature, 391: 806-811 (1998)). Recently, RNA interference has been observed in nearly 90% of putative genes on soil nematode chromosome I (Fraser et al., Nature, 408: 325-330 (2000)) and nematode chromosome III (Gonczy et al., Nature, 408: 331-336). 2000)) has been used to target 96% of the putative genes.
[0050]
[Table 1]

Claims (8)

(a)配列番号3、5、7、9、11、13、15、17または19に示すヌクレオチド配列を含む核酸分子、
(b)(a)に記載の核酸分子のポリペプチドコード領域に相補性のヌクレオチド配列にストリンジェントなハイブリダイゼーション条件下でハイブリダイズし得るヌクレオチド配列を含む核酸分子、及び
(c)遺伝コードの結果として(a)または(b)に記載のヌクレオチド配列に縮重する核酸配列を含む核酸分子
から選択されることを特徴とする単離核酸分子。
(A) a nucleic acid molecule comprising the nucleotide sequence shown in SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17 or 19,
(B) a nucleic acid molecule comprising a nucleotide sequence capable of hybridizing under stringent hybridization conditions to a nucleotide sequence complementary to the polypeptide coding region of the nucleic acid molecule of (a), and (c) the genetic code result. An isolated nucleic acid molecule characterized in that it is selected from nucleic acid molecules comprising a nucleic acid sequence that is degenerate to the nucleotide sequence described in (a) or (b).
請求の範囲第1項に記載の核酸分子によりコードされることを特徴とする単離ポリペプチド。An isolated polypeptide encoded by the nucleic acid molecule of claim 1. 配列表の配列番号4、6、8、10、12、14、16、18または20に示すアミノ酸配列を有することを特徴とする請求の範囲第2項に記載の単離ポリペプチド。The isolated polypeptide according to claim 2, which has the amino acid sequence shown in SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, or 20 in the sequence listing. 請求の範囲第1項に記載の核酸分子を含むことを特徴とするベクター。A vector comprising the nucleic acid molecule according to claim 1. 請求の範囲第1項に記載のヌクレオチド配列を有し、このヌクレオチド配列の発現を媒介し得ることを特徴とする複製可能な発現ベクター。A replicable expression vector comprising the nucleotide sequence according to claim 1 and capable of mediating expression of the nucleotide sequence. 請求の範囲第4項または第5項に記載のベクターを有することを特徴とする培養宿主細胞。A cultured host cell comprising the vector according to claim 4 or 5. 請求の範囲第6項に記載の宿主細胞をポリペプチドを生産する条件下で培養し、生じたポリペプチドを回収することを含むことを特徴とするポリペプチドの生産方法。A method for producing a polypeptide, comprising culturing the host cell according to claim 6 under conditions for producing the polypeptide, and collecting the resulting polypeptide. 請求の範囲第1項に記載の核酸分子を調節し得る物質の同定方法であって、(i)前記核酸分子を含む細胞を用意し、(ii)前記細胞を候補物質と接触させ、(iii)候補物質の非存在下では存在しない効果について前記細胞をモニターすることを含むことを特徴とする前記方法。A method for identifying a substance capable of regulating a nucleic acid molecule according to claim 1, comprising: (i) preparing a cell containing the nucleic acid molecule, (ii) contacting the cell with a candidate substance, and (iii) ) Monitoring the cells for effects that are not present in the absence of the candidate substance.
JP2002581476A 2001-04-12 2002-04-12 Protein cluster V Pending JP2005500020A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0101317A SE0101317D0 (en) 2001-04-12 2001-04-12 Protein cluster v
PCT/SE2002/000730 WO2002083721A1 (en) 2001-04-12 2002-04-12 Protein cluster v

Publications (1)

Publication Number Publication Date
JP2005500020A true JP2005500020A (en) 2005-01-06

Family

ID=20283777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002581476A Pending JP2005500020A (en) 2001-04-12 2002-04-12 Protein cluster V

Country Status (6)

Country Link
EP (1) EP1377603A1 (en)
JP (1) JP2005500020A (en)
CA (1) CA2440846A1 (en)
NZ (1) NZ527682A (en)
SE (1) SE0101317D0 (en)
WO (1) WO2002083721A1 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000078961A1 (en) * 1999-06-23 2000-12-28 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
WO2000001713A2 (en) * 1998-07-02 2000-01-13 Calgene Llc Diacylglycerol acyl transferase proteins

Also Published As

Publication number Publication date
EP1377603A1 (en) 2004-01-07
WO2002083721A1 (en) 2002-10-24
NZ527682A (en) 2005-04-29
CA2440846A1 (en) 2002-10-24
SE0101317D0 (en) 2001-04-12

Similar Documents

Publication Publication Date Title
Hillier et al. Generation and analysis of 280,000 human expressed sequence tags.
JP4472173B2 (en) Genomic sequence of 5-lipoxygenase activating protein (FLAP), polymorphic marker thereof, and method for detecting asthma
US20040241729A1 (en) Method for the detection of Chagas disease related gene transcripts in blood
US20040241728A1 (en) Method for the detection of lung disease related gene transcripts in blood
US20040241726A1 (en) Method for the detection of allergies related gene transcripts in blood
US20040241727A1 (en) Method for the detection of schizophrenia related gene transcripts in blood
US6835556B2 (en) Protein cluster V
AU6117799A (en) Genes, proteins and biallelic markers related to central nervous system disease
Bennett et al. Characterization of the human secreted phosphoprotein 24 gene (SPP2) and comparison of the protein sequence in nine species
WO2000058510A2 (en) Schizophrenia associated genes, proteins and biallelic markers
US6555316B1 (en) Schizophrenia associated gene, proteins and biallelic markers
Arnould et al. Identifying and characterizing a five‐gene cluster of ATP‐binding cassette transporters mapping to human chromosome 17q24: a new subgroup within the ABCA subfamily
JP2005500020A (en) Protein cluster V
JP2004525614A (en) Voltage-gated ion channel genes and proteins associated with schizophrenia
AU2002233573A1 (en) Schizophrenia-related voltage-gated ion channel gene and protein
US20050096269A1 (en) Protein Cluster II
US20040248169A1 (en) Method for the detection of obesity related gene transcripts in blood
Martínez-Montes et al. Deciphering the regulation of porcine genes influencing growth, fatness and yield-related traits through genetical genomics
AU2002249749A1 (en) Protein cluster V
Vitale et al. Cysteine and tyrosine-rich 1 (CYYR1), a novel unpredicted gene on human chromosome 21 (21q21. 2), encodes a cysteine and tyrosine-rich protein and defines a new family of highly conserved vertebrate-specific genes
JP2004518424A (en) Protein cluster II
US20040265868A1 (en) Method for the detection of depression related gene transcripts in blood
JP2004522425A (en) Gene encoding protein cluster I and encoded protein
US20020165182A1 (en) Gene encoding Protein Cluster I and the encoded protein
US20040248170A1 (en) Method for the detection of hyperlipidemia related gene transcripts in blood

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081118