JP2005500037A - G protein coupled receptor - Google Patents

G protein coupled receptor Download PDF

Info

Publication number
JP2005500037A
JP2005500037A JP2003507246A JP2003507246A JP2005500037A JP 2005500037 A JP2005500037 A JP 2005500037A JP 2003507246 A JP2003507246 A JP 2003507246A JP 2003507246 A JP2003507246 A JP 2003507246A JP 2005500037 A JP2005500037 A JP 2005500037A
Authority
JP
Japan
Prior art keywords
polynucleotide
polypeptide
seq
sequence
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003507246A
Other languages
Japanese (ja)
Inventor
ボーグン、マライア・アール
チョーラ、ナリンダー・ケイ
リチャードソン、トマス・ダブリュ
アイソン、クレイグ・エイチ
ヤング、ジュンミング
エマーリング、ブルック・エム
ソーントン、マイケル
ボロースキー、マーク・エル
ランクマール、ジャヤラクシミ
ユエ、ヘンリー
グラール、リチャード・シー
ハファリア、エープリル、ジェイ・エイ
リュ、デュング・アイナ・エム
リュ、ヤン
カリック、デボラー・エイ
ガンディー、アミーナ・アール
ワレン、ブリジット・エイ
リー、アーンスティーン・エイ
スウォーナカール、アニータ
ウォルシュ、ロドリック・ティー
ヤオ、モニーク・ジー
グリフィン、ジェニファー・エイ
オウ−ヤング、ジャニス・ケイ
カーン、ファラ・エイ
リー、ソー・ユーン
エリオット、ビッキー・エス
Original Assignee
インサイト・ゲノミックス・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インサイト・ゲノミックス・インコーポレイテッド filed Critical インサイト・ゲノミックス・インコーポレイテッド
Publication of JP2005500037A publication Critical patent/JP2005500037A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/04Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/02Drugs for disorders of the nervous system for peripheral neuropathies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/06Immunosuppressants, e.g. drugs for graft rejection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Biomedical Technology (AREA)
  • Pain & Pain Management (AREA)
  • Zoology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Oncology (AREA)
  • Rheumatology (AREA)
  • Communicable Diseases (AREA)
  • Virology (AREA)
  • Transplantation (AREA)
  • Diabetes (AREA)
  • Hematology (AREA)
  • Obesity (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Cardiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本発明の種々の実施態様は、ヒトのGタンパク質共役受容体(GCREC)および、GCRECを同定しコードするポリヌクレオチドを提供する。本発明の実施態様はまた、発現ベクター、宿主細胞、抗体、アゴニストおよびアンタゴニストをも提供する。本発明の別の実施態様はまた、GCRECの異常発現に関連する疾患を、診断、治療または予防する方法をも提供する。Various embodiments of the present invention provide human G protein-coupled receptors (GCREC) and polynucleotides that identify and encode GCREC. Embodiments of the invention also provide expression vectors, host cells, antibodies, agonists and antagonists. Another embodiment of the present invention also provides a method for diagnosing, treating or preventing a disease associated with abnormal expression of GCREC.

Description

【技術分野】
【0001】
本発明は、新規の核酸群、それら核酸がコードするGタンパク質共役受容体群ならびに、これらの核酸とタンパク質とを利用した、嗅覚神経障害、細胞増殖異常、神経疾患、心血管障害、胃腸障害、自己免疫/炎症性障害、代謝障害、およびウイルス感染症の、診断、治療、および予防に関する。本発明はまた、該核酸と、Gタンパク質共役受容体との発現への、外因性化合物の効果のアセスメントに関する。更に本発明は特定のGタンパク質共役受容体の利用に関連するものであり、この利用は、味覚または嗅覚の調節に関与する分子を同定するものである。
【背景技術】
【0002】
G共役タンパク質受容体
シグナル伝達は、それによって細胞が細胞外シグナルに応答する一般的プロセスである。形質膜を越えてのシグナル伝達は、ホルモン、神経伝達物質または成長因子など、シグナル分子が、細胞膜受容体に結合することから開始する。そのようにして活性化された受容体は細胞内の生化学的カスケードを誘発し、このカスケードは転写因子など細胞内標的分子の活性化で終了する。シグナル伝達のこのプロセスは、細胞増殖、分化及び遺伝子転写を含む、全てのタイプの細胞機能を制御する。同定されている遺伝子の最大ファミリーの1つによりコードされるGタンパク質共役受容体(GCREC)は、原形質膜を越えての細胞外シグナルの伝達において中心的役割を果たす。GCRECは、治療標的としての成功の、実証された歴史を持つ。
【0003】
GCRECは、まとまって逆平行アルファ(α)螺旋の束を形成する7つの疎水性膜貫通ドメインの存在により特徴付けられた膜内在タンパク質である。GCRECのサイズは、400以下から1000以上のアミノ酸に及ぶ(Strosberg, A.D. (1991) Eur. J. Biochem. 196:1-10、Coughlin, S.R. (1994) Curr. Opin. Cell Biol. 6:191-197)。GCRECのアミノ末端は細胞外にあり、長さが可変で、多くの場合グリコシル化されている。カルボキシ末端は細胞質内にあり、通常はリン酸化される。細胞外ループ群と細胞内ループ群が交互に現れ、膜貫通ドメイン群を連結している。第2及び第3の細胞外ループを結びつけるシステインジスルフィド架橋は、アゴニスト及びアンタゴニストと相互に作用し得る。GCRECの最も保存されたドメインは、膜貫通ドメイン及び最初の2つの細胞質ループである。膜貫通ドメイン群は、受容体の構造的及び機能的特徴をある程度、明らかにする。大抵の場合、αへリックスの束が、1つのリガンド結合ポケットを形成する。細胞外N末端セグメント、または3つの細胞外ループの内の1つ以上のループも、リガンド結合に関与し得る。リガンド結合は、受容体の細胞内部分における構造変化を誘導することにより受容体を活性化する。次に、この活性化された受容体の大きな第3の細胞内ループが、ヘテロ三量体であるグアニンヌクレオチド結合(G)タンパク質複合体と相互作用し、この複合体は、サイクリックAMP(cAMP)やホスホリパーゼCやイノシトール三リン酸など、二次メッセンジャーの活性化を含む細胞内シグナル伝達作用と、活性化されたGCRECとイオンチャネルタンパク質類との相互作用とを更に仲介する(たとえばWatson, S. および S. Arkinstall (1994) The G-protein Linked Receptor Facts Book, Academic Press, San Diego CA,2-6ページ; Bolander, F.F. (1994) Molecular Endocrinology, Academic Press, San Diego CA,162-176ページ; Baldwin, J.M. (1994) Curr. Opin. Cell Biol. 6:180-190を参照)。
【0004】
GCRECには、感覚性シグナルメディエータ(例えば光及び嗅覚刺激性分子)、アデノシン、γアミノ酪酸(GABA)、肝細胞成長因子、メラノコルチン、ニューロペプチドY、オピオイドペプチド、オプシン、ソマトスタチン、タキキニン、血管作用性腸管ポリペプチドファミリー及びバソプレシン、生体アミン(例えばドーパミン、エピネフリン及びノルエピネフリン、ヒスタミン、グルタミン酸(代謝調節作用)、アセチルコリン(ムスカリン様作用)及びセロトニン)、ケモカイン、炎症の脂質メディエータ(例えばプロスタグランジン及びプロスタノイド、血小板活性化因子及びロイコトリエン)及びペプチドホルモン(例えばボンベシン、ブラジキニン、カルシトニン、C5aアナフィラトキシン、エンドセリン、卵胞刺激ホルモン(FSH)、ゴナドトロピン放出ホルモン(GnRH)、およびニューロキニン及び甲状腺刺激ホルモン放出ホルモン(TRH)及びオキシトシン)に対する受容体類がある。まだ同定されていない刺激の受容体として作用するGCRECは、オーファン受容体として知られている。
【0005】
GCRECファミリーの多様性は、選択的スプライシングによって更に増加する。多くのGCREC遺伝子はイントロンを持ち、スプライス変異体が同定されている受容体は現在30を超えている。変異の数が最も多いのは、このタンパク質のC末端においてである。N末端及び細胞質内ループの変異体もまた高頻度であるのに対して、細胞外ループまたは膜貫通ドメインでの変異体は頻度が低い。変異が発生し得るような部位を2ヶ所以上有する、幾つかの受容体もある。スプライス変異体は、分布、シグナル伝達、共役、調節、及びリガンド結合の特徴において観察される差異に基づき、機能的に異なるようである(Kilpatrick, G.J. 他(1999) Trends Pharmacol. Sci. 20:294-301)。
【0006】
GCRECは、3つの主要なサブファミリーに分類できる。即ちロドプシン様、セクレチン様、及び代謝調節型グルタミン酸受容体サブファミリーである。GCRECサブファミリー群のメンバーは、同様の機能と、特徴的な膜7回貫通構造とを共有するが、アミノ酸配列は互いに異なる。最大のファミリーを構成するロドプシン様GCRECは、ホルモン、神経伝達物質、及び光など、多様な細胞外シグナルを伝送する。ロドプシンは、動物の網膜内に見られる感光性GCRECである。脊椎動物では、ロドプシン分子は、光受容体(杆体)細胞に見られる膜の積層(membranous stacks)に包埋されている。各ロドプシン分子は、原形質膜ナトリウムチャネルの閉鎖を導くcGMPレベルの低下を誘発することにより、光の光子に反応する。この方法で、視覚シグナルが神経インパルスへ変換される。別のロドプシン様GCRECは、神経伝達物質への反応に直接関与する。このようなGCRECとしては、アドレナリンに対する受容体(アドレナリン受容体)、アセチルコリンに対する受容体(ムスカリン性受容体)、アデノシンに対する受容体、ガラニンに対する受容体、及びグルタミン酸に対する受容体(N-メチル-D-アスパラギン酸/NMDA受容体)がある(概説はWatson, S. および S. Arkinstall (1994) The G-protein Linked Receptor Facts Book, Academic Press, San Diego CA,7-9, 19-22, 32-35, 130-131, 214-216, 221-222ページ; Habert-Ortoli, E. 他(1994) Proc. Natl. Acad. Sci. USA 91:9780-9783参照)。
【0007】
ガラニン受容体は、神経内分泌ペプチドであるガラニンの活性を仲介する。ガラニンは、インスリン、アセチルコリン、セロトニン及びノルアドレナリンの分泌を阻害し、また、プロラクチン及び成長ホルモンの放出を刺激する。ガラニン受容体は、疾患、痛覚、抑うつ、及びアルツハイマー病のフィードに関与している(Kask, K. 他(1997) Life Sci. 60:1523-1533)。その他の神経系ロドプシン様GCRECとしては、発達及び神経病理において役割を有するようにみえるリゾホスファチジン酸その他のリゾリン脂質に対する受容体の、増大する1ファミリーを含む(Chun, J.他(1999) Cell Biochem. Biophys. 30:213-242)。
【0008】
GCRECの最大のサブファミリーである嗅覚受容体もまた、ロドプシン様GCRECファミリーのメンバーである。嗅覚受容体は、匂い物質シグナルを伝達することによって機能する。異なる臭気を区別するために、多数の異なる嗅覚受容体が必要である。各嗅覚ニューロンは1種類の嗅覚受容体しか発現せず、別々の受容体を発現するニューロン群が、鼻の経路中の異なる位置を占める。例えば、或るラット脳ライブラリから単離したRA1c受容体は、脳の非常に特有の領域、及び、嗅覚上皮の或る特定の区域のみに発現が限定されることが示されている(Raming, K. 他(1998) Receptors Channels 6:141-151)。しかしながら、嗅覚様受容体の発現は嗅覚組織に限定されない。例えば、典型的なGCREC特性を有する嗅覚様受容体をコードする3種のラット遺伝子は、味覚及び嗅覚組織のみならず、雄生殖組織においても発現パターンを示した(Thomas, M.B. 他(1996) Gene 178:1-5)。
【0009】
セクレチン様GCRECサブファミリーのメンバーは、セクレチン、カルシトニン、グルカゴン、成長ホルモン放出ホルモン、副甲状腺ホルモン、及び血管作用性小腸ペプチドなどのペプチドホルモンを、リガンドとして有する。例えばセクレチン受容体は、膵臓及び小腸で酵素とイオンとの分泌を刺激するペプチドホルモンであるセクレチンに応答する(前出のWatson, 278-283ページ)。セクレチン受容体は、長さが約450アミノ酸であり、胃腸細胞の原形質膜に見られる。セクレチンがその受容体に結合することにより、cAMPの産出が刺激される。
【0010】
炎症及び免疫応答に関連付けられるセクレチン様GCRECの例には、EGFモジュール含有ムチン様ホルモン受容体(Emrl)タンパク質、及びCD97受容体タンパク質がある。これらのGCRECは、最近特徴付けられたEGF-TM7受容体サブファミリーのメンバーである。これら膜7回貫通ホルモン受容体は、in vivoでヘテロ二量体として存在し、3から7の潜在的カルシウム結合EGF様モチーフ群を持つ。CD97は主に白血球で発現し、活性化されたB細胞及びT細胞上で顕著に上方制御される(McKnight, A.J.及びS. Gordon (1998) J. Leukoc. Biol. 63:271-280)。
【0011】
第3GCRECサブファミリーは、代謝調節型グルタミン酸受容体ファミリーである。グルタミン酸は、中枢神経系の主要な興奮性神経伝達物質である。代謝調節型グルタミン酸受容体は細胞内エフェクターの活性を調節し、長期の増強作用に関与する(前出Watson, 130ページ)。Ca2+感知受容体は、カルシウムイオンの細胞外濃度の変化を感知するものであり、カルシウム結合に関与し得る酸性アミノ酸のクラスター群を含む大きな細胞外ドメインを有する。代謝調節型グルタミン酸受容体ファミリーには、フェロモン受容体、GABAB受容体及び味覚受容体もある。
【0012】
別のGCRECのサブファミリーには、線虫(Caenorhabditis elegans及びCaenorhabditis briggsae に見られる化学受容体遺伝子の2つの群があり、これらは哺乳動物の嗅覚受容体遺伝子に遠く関係している。細胞膜上の接合因子への反応に関与する酵母フェロモン受容体STE2及びSTE3は、独自の膜7回貫通シグネチャを有する。細胞性粘菌Dictyostelium discoideumにおいて、個々の細胞の凝集を調整し、多数の発生的に調節される遺伝子群の発現を制御すると考えられているcAMP受容体も、独自シグネチャを同様に有する。
【0013】
GCREC突然変異は、機能または構成的活性化の減少を招き得るものであり、多数のヒト疾患に関係している(前出Coughlin)。例えば網膜色素変性症(色素性網膜炎)は、ロドプシン遺伝子の突然変異から発生し得る。更に、甲状腺刺激ホルモン受容体の体細胞活性化突然変異は、機能亢進甲状腺腫の原因となることが報告されており、構成的活性化に感受性が高い数種のGCRECが、癌原遺伝子のように振舞い得ることを示唆している(Parma, J. 他(1993) Nature 365:649-651)。以下のリガンドに対するGCREC受容体にも、ヒトの疾患に関連する突然変異がある。即ち、黄体形成ホルモン(思春期早発症)、バソプレシンV2(X連鎖の腎性尿崩症)、グルカゴン(糖尿病及び高血圧)、カルシウム(副甲状腺機能亢進症、低カルシウム尿症(hypocalcuria)、高カルシウム血症)、副甲状腺ホルモン(四肢短縮型小人症)、b3-アドレナリン受容体(肥満症、インスリン非依存型糖尿病)、成長ホルモン放出ホルモン(小人症)、及び副腎皮質刺激ホルモン(糖質コルチコイド欠乏症)に対するGCREC受容体である(Wilson, S. 他(1998) Br. J. Pharmocol. 125:1387-1392; Stadel, J.M. 他(1997) Trends Pharmacol. Sci. 18:430-437)。GCRECはまた、抑うつ症、精神分裂病(統合失調症)、不眠症、高血圧、不安、ストレス、腎不全、及び幾つかの心血管障害にも関与している(Horn, F.及びG. Vriend (1998) J. Mol. Med. 76:464-468)。
【0014】
更に、GCRECの活性化または阻害を狙う数百の新薬が、過去20年の内に認知されてきた。これらの薬の治療標的は、癌、骨粗鬆症、子宮内膜症のみならず、心血管障害、胃腸障害、中枢神経系疾患を含めた、幅広い疾病および障害に及ぶ(前出のWilson他、同Stadel他)。例えばドーパミンアゴニストのLドーパはパーキンソン病の治療に用いられ、或るドーパミンアンタゴニストは精神分裂病(統合失調症)及び初期段階のハンチントン病の治療に用いられる。アドレナリン受容体のアゴニスト及びアンタゴニストは、喘息、高血圧その他の心血管障害、及び不安の治療に用いられてきた。ムスカリン性アゴニストは緑内障及び頻脈の治療に用いられ、セロトニン5HT1Dアンタゴニストは片頭痛に対して用いられ、ヒスタミンH1アンタゴニストはアレルギー性及びアナフィラキシー性反応、枯草熱、痒み、及び動揺病に対して用いられる(前出Horn他)。
【0015】
最近の調査では、糖尿病、肥満症、及び骨粗鬆症など、代謝障害の治療において、GCRECを将来的に使用する可能性を示唆している。例えば、腎性尿崩症の原因となる突然変異体V2バソプレシン受容体は、この突然変異を持つ領域にまたがる或るC末端V2受容体ペプチドの同時発現により、in vitroで機能的にレスキューされ得る。この結果は、疾病治療の新規なストラテジーを示唆する(Schoneberg, T. 他(1996) EMBO J. 15:1283-1291)。メラノコルチン4受容体(MC4R)における突然変異は、ヒトの体重調節及び肥満症に関与している。バソプレシンV2受容体の突然変異体と同様、これらMC4R突然変異体は原形質膜への輸送に欠陥があるので(Ho, G及び R.G. MacKenzie (1999) J. Biol. Chem. 274:35816-35822)、従って同様のストラテジーで治療し得る。副甲状腺ホルモン(PTH)のための1型受容体は、血流中のカルシウムホメオスタシスのPTH依存型制御を仲介するGCRECである。PTH/受容体の相互作用の研究は、骨粗鬆症の治療のための新規なPTH受容体リガンドの開発を可能にし得る(Mannstadt, M. 他(1999) Am. J. Physiol. 277:F665-F675)。
【0016】
GCRECのケモカイン受容体グループは、炎症及び感染症の治療に役立つ可能性を持つ(概説は、Locati, M.およびP.M. Murphy (1999) Annu. Rev. Med. 50:425-440を参照)。ケモカインは、白血球動態(leukocyte trafficking)、造血、及び血管形成の制御において、細胞内シグナルとして作用する小ポリペプチドである。マウスにおける種々のケモカイン受容体の標的化された破壊は、これらの受容体が、病理的炎症において、及び多発性硬化症などの自己免疫異常において、役割を果たしていることを示す。ヘルペスウイルス及びヒト免疫不全症ウイルス(HIV-1)などの感染体も、感染を促進するために、ケモカイン受容体を利用する。ケモカイン受容体CCR5はHIV-1によるT細胞の感染に対する補助受容体として作用し、一部が切断されたCCR5はAIDSに対する抵抗力を生じさせ、CCR5のアンタゴニストがAIDSの発症の予防に有用たり得ることを示唆する。
【0017】
味覚と嗅覚における、数種のGCRECの関与が報告されている。多数のヒトと他の真核生物の感覚受容器の完全配列または部分配列が現在知られている(たとえばPilpel, YおよびD. Lancet (1999) Protein Sci.8:969-977;Mombaerts, P. (1999) Annu. Rev. Neurosci. 22:487-509を参照。また例えば特許EP 867508A2、US 5,874,243、WO 92/17585、WO 95/18140、 WO 97/17444、WO 99/67282等も参照)。ヒトゲノムには嗅覚受容体の様々なレパートリーをコ−ドするおよそ1000の遺伝子が含まれることが報告されている (Rouquier, S.他(1998) Nat. Genet. 18:243-250; Trask, B.J. 他(1998) Hum. Mol. Genet. 7:2007-2020)。
【0018】
嗅球の解剖学および生理学
嗅球は脳組織の卵形の前方成長物であり、脳の基部に始まり末端は球状に肥大し、脳腔と鼻腔の上部とを隔てる篩板の上に横たわる。嗅球の下面が受け入れる嗅神経は、鼻の嗅部から篩板を上向きに通過する。嗅覚の受容体細胞すなわち嗅細胞は双極神経細胞であって鼻の嗅膜内に位置し、嗅球内の球状構造である糸球体に接続する。各々の糸球体は、嗅細胞からの約2万5千の軸索の、約25の大きな僧帽細胞からの樹状突起の、また、嗅索を通じて軸索を中枢神経系へ送る約60の小さな房飾細胞の終端である。研究の示唆するところでは、異なる糸球体は異なる匂いに応答する。脳の嗅部に起始する多くの神経線維は嗅索内を逆に進んで嗅球に至り、終端は嗅球の中心にある多数の小さな顆粒細胞である。これらは短い抑制性樹状突起を僧帽細胞と房飾細胞へ届かせる。この抑制フィードバックは、匂いの区別を助けるようである。僧帽細胞と房飾細胞は継続的に活性で背景活性(background activity)を提供し、その活性の上に、種々の匂いが起こすインパルス交通(impulse traffic)が重畳される。こうして嗅覚刺激は嗅覚系でのインパルスの頻度を変調し、嗅覚情報の伝送を生じる。
【0019】
嗅索は、中脳と大脳との接合部で脳に入る。接合部で嗅索は2つの経路に分かれる。1つは内側嗅覚野へ行き、ここで中隔核が視床下部などの辺縁系各部へフィードする。他方の経路がつながる外側嗅覚野は主に梨状葉前皮質、梨状葉皮質、および扁桃核皮質部からなり、ここで信号は辺縁系、特に海馬へ達する。観察される第3の嗅覚経路は視床を通り視床背内側核へ、更に眼窩前頭皮質の外側後部象限(lateroposterior quadrant)へ達する。このように、基本的嗅覚反射を補助する嗅覚系と、食物摂取と食物嫌悪との自動的であるが学習性の制御を提供する第2の系、大抵の他の皮質感覚系に相当し嗅覚の意識的知覚に利用される第3の系があるようである。
【0020】
数種の匂い物質はGタンパク質共役受容体であり、特徴的な膜7回貫通構造を持つ。これら膜7回貫通Gタンパク質共役受容体のN末端は細胞外にあり多くはグリコシル化されるが、C末端は細胞質にあり多くはリン酸化される。3つの細胞外ループ群は3つの細胞内ループ群と交互に現れ、集まって7つの膜貫通疎水性領域を形成する。化学受容体内の感覚伝達は匂い物質が嗅細胞内の受容体分子を活性化して生じ、Gタンパク質であるGOLF(Gタンパク質olf)によって媒介される酵素カスケードを誘起する。これは光受容体内の感覚伝達機序に似ており、ここでは、光を介したロドプシンによる活性化が、Gタンパク質であるトランスデューシンによって媒介される酵素カスケードを誘起する(Keio J. (2001) J. Med. 50:13-19)。
【0021】
味覚系の解剖学および生理学
哺乳類には5種の基本味がある。塩味、酸味、苦味、甘味、旨味(グルタミン酸一ナトリウムの味覚)である。これらの味覚は、味蕾内に群集する味覚受容体細胞(TRC)上の異なる細胞表面受容体が媒介すると思われている。TRCは特化した神経上皮細胞であって電気的に興奮性で、求心性味覚神経線維とのシナプスを形成する。味蕾は約100個のTRCの限局性の集まりで、玉ネギ型構造の中に群を成す。舌の味蕾は、3タイプの舌乳頭の中に見られる。茸状乳頭、葉状乳頭、有郭乳頭であり、それぞれ舌の前部、両側、後部に見られる。味蕾はまた、軟口蓋、口蓋垂、喉頭蓋、咽頭、喉頭、食道にも見られる。
【0022】
味覚伝達は、風味分子が、口腔に露出したTRCの頂端微絨毛内の受容体およびイオンチャネルと相互作用して始まる。この相互作用は、膜コンダクタンスの変化、脱分極、および、味覚求心性ニューロンへの伝達物質放出を導く。味覚刺激は化学構造が広範に異なり、サイズはイオンから複雑な糖質やタンパク質までがある。したがって味覚伝達には多様な機序が必要である。イオン性刺激たとえば塩および酸(塩味および酸味)はイオンチャネルと直接に相互作用しTRCを脱分極する。複雑な刺激たとえば糖質、アルカロイド、タンパク質(甘味、苦味、旨味)はGタンパク質共役受容体(GCREC)を活性化し、GCRECは二次メッセンジャーカスケードを調節する。例えばT1R3というGCRECのT1Rファミリーメンバーはヒトで甘味受容体として機能すると推定され、hT2R4というGCRECのT2R/TRBファミリーメンバーは苦味化合物に応答することが示されている(Gilbertson, T. A. (2000) Curr.Opinion in Neurobiology 10:519-527)。
【0023】
新規の嗅覚受容体およびそれらをコードするポリヌクレオチドの発見により、新規の組成物を提供することで当分野の要望に応えることができる。この新規の組成物は、嗅覚神経障害の診断・予防・治療に有用であり、また、嗅覚受容体の核酸配列及びアミノ酸配列の発現における外因性化合物の効果についての評価にも有用な組成物である。
【0024】
新たなGタンパク質共役受容体及びそれをコードするポリヌクレオチドの発見は、当分野における要望を、新規の組成物を提供することによって満たす。新規組成物は、嗅覚神経障害、細胞増殖異常、神経疾患、心血管障害、胃腸障害、自己免疫/炎症疾患、代謝障害、並びにウイルス感染症の、診断、治療並びに予防において有用であり、また、Gタンパク質共役受容体の核酸配列及びアミノ酸配列の発現における外因性化合物の効果についての算定にも有用な組成物である。
【0025】
発現プロファイル作成
マイクロアレイは、生体分析に用いる分析ツールである。マイクロアレイには複数の分子を空間的に分布させ、固体支持体の表面に固定する。ポリペプチド、ポリヌクレオチド、および/または抗体のマイクロアレイが開発され、その種々の用途には例えば遺伝子配列決定、遺伝子発現モニタリング、遺伝子マッピング、細菌同定、創薬、コンビナトリアルケミストリがある。
【0026】
特にマイクロアレイを用いる領域は遺伝子発現分析である。アレイ技術は、単一の多型遺伝子の発現や、多数の関連遺伝子または無関係の遺伝子の発現プロファイルを探求する、簡単な方法を提供し得る。単一遺伝子の発現を試験するときは、アレイを用いて或る特定遺伝子又はその変異体の発現を検出する。発現プロファイルを試験するときは、アレイは次のような遺伝子を同定するプラットフォームを提供する。即ちどの遺伝子が組織特異的か、毒性アッセイにおいてテストされる物質に影響されるか、シグナル伝達カスケードの一部であるか、ハウスキーピング機能を実行するか、又は、特定の遺伝的素因や、条件、疾患、又は障害に、特異的に関連する遺伝子であるかの同定である。
【0027】
当分野には、嗅覚神経障害、細胞増殖異常、神経疾患、心血管疾患、胃腸障害、自己免疫/炎症疾患、代謝障害、および、ウイルス感染の診断、予防、および治療のための、核酸とタンパク質とを含む新規組成の要望がある。
【発明の開示】
【発明の効果】
【0028】
本発明の種々の実施態様は、総称して「GCREC」、個別にはそれぞれ「GCREC-1」、「GCREC-2」、「GCREC-3」、「GCREC-4」、「GCREC-5」、「GCREC-6」、「GCREC-7」、「GCREC-8」、「GCREC-9」、「GCREC-10」、「GCREC-11」、「GCREC-12」、「GCREC-13」、「GCREC-14」、「GCREC-15」、「GCREC-16」、「GCREC-17」、「GCREC-18」、「GCREC-19」、「GCREC-20」、「GCREC-21」、「GCREC-22」、「GCREC-23」、「GCREC-24」、「GCREC-25」、「GCREC-26」と呼ぶ精製したポリペプチドであるGタンパク質共役受容体を提供し、またこれらタンパク質とそれらをコードするポリヌクレオチドとを用いる、疾患と病状との検出、診断、および治療の方法を提供する。幾つかの実施態様はまた、精製したGタンパク質共役受容体、並びに/またはそれらをコードするポリヌクレオチドを用いて創薬過程を促進する方法、例えば効力、用量、毒性、および薬理の決定の方法を提供する。関連する幾つかの実施態様は、精製したGタンパク質共役受容体、並びに/またはそれらをコードするポリヌクレオチドを用いて疾患と病状との病原を調査する方法を提供する。
【0029】
或る実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を持つ天然アミノ酸配列を有するポリペプチド、(c)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択した単離されたポリペプチドを提供する。別の実施態様は、SEQ ID NO:1-26のアミノ酸配列を持つ単離されたポリペプチドを提供する。
【0030】
また本発明は、嗅覚および/または味覚に関係するGタンパク質共役受容体を提供する。更に本発明は、前記のGタンパク質共役受容体をコ−ドするポリヌクレオチド配列を提供する。
【0031】
また別の実施態様は(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を持つ或る天然アミノ酸配列を有するポリペプチド、(c)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの生物学的活性断片、または(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリヌクレオチドの免疫原性断片、からなる群から選択した或るポリペプチドをコードする、単離されたポリヌクレオチドを提供する。一実施態様では、該ポリヌクレオチドは、SEQ ID NO:1-26からなる群から選択した或るポリペプチドをコードする。別の実施態様では、ポリヌクレオチドはSEQ ID NO:27-52からなる群から選択される。
【0032】
また別の実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を有する或る天然アミノ酸配列を持つポリペプチド、(c)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を有するポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択した或るポリペプチドをコードするポリヌクレオチドと機能的に連結したプロモーター配列を持つ組換えポリヌクレオチドを提供する。別の実施態様は、この組換えポリヌクレオチドを用いて形質転換した細胞を提供する。更に別の実施態様は、この組換えポリヌクレオチドを持つ遺伝形質転換生物を提供する。
【0033】
別の実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドと、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%以上の同一性を有する或る天然アミノ酸配列を持つポリペプチドと、(c)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの生物学的活性断片と、(d)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を持つポリペプチドの免疫原性断片、とからなる群から選択したポリペプチドを製造する一方法を提供する。製造方法は、(a)或る細胞を該ポリペプチドの発現に適した条件下で培養し、この細胞を組換えポリヌクレオチドを用いて形質転換する過程と、(b)そのように発現したポリペプチドを回収する過程からなる。この組換えポリヌクレオチドは、該ポリペプチドをコードするポリヌクレオチドに対し機能的に連結したプロモーター配列を持つ。
【0034】
更に別の実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を有する或る天然アミノ酸配列を持つポリペプチド、(c)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を持つポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択した或るポリペプチドに特異結合する、単離された抗体を提供する。
【0035】
また更に別の実施態様は、(a)SEQ ID NO:27-52からなる群から選択したポリヌクレオチド配列を持つポリヌクレオチド、(b)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列との少なくとも90%の同一性を有する或る天然ポリヌクレオチド配列を持つポリヌクレオチド、(c)(a)に相補的なポリヌクレオチド、(d)(b)に相補的なポリヌクレオチド、および(e)(a)〜(d)のRNA等価物、からなる群から選択した、単離されたポリヌクレオチドを提供する。別の実施態様で該ポリヌクレオチドは、少なくとも約20、30、40、60、80、または100の連続したヌクレオチド群からなる場合がある。
【0036】
また別の実施態様は、サンプル中に標的ポリヌクレオチドを検出する方法であって該標的ポリヌクレオチドが(a)SEQ ID NO:27-52からなる群から選択したポリヌクレオチド配列を持つポリヌクレオチド、(b)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列との少なくとも90%の同一性を有する或る天然ポリヌクレオチド配列を持つポリヌクレオチド、(c)(a)に相補的なポリヌクレオチド、(d)(b)に相補的なポリヌクレオチド、および(e)(a)〜(d)のRNA等価物、からなる群から選択される方法を提供する。検出方法は、(a)サンプル中の上記標的ポリヌクレオチドに相補的な或る配列からなる少なくとも20の連続したヌクレオチド群からなる或るプローブを用いて該サンプルをハイブリダイズする過程と、(b)該ハイブリダイゼーション複合体の有無を検出する過程からなる。該プローブと該標的ポリヌクレオチドあるいはその断片との間でハイブリダイゼーション複合体が形成されるような条件下で、プローブは、該標的ポリヌクレオチドに対し特異的にハイブリダイズする。或る関連した実施態様で本法は、該ハイブリダイゼーション複合体の量の検出を含みうる。また別の実施態様で該プローブは少なくとも約20、30、40、60、80または100の連続したヌクレオチド群からなる場合がある。
【0037】
また更に別の実施態様は、サンプル中に標的ポリヌクレオチドを検出する方法であって該標的ポリヌクレオチドが(a)SEQ ID NO:27-52からなる群から選択したポリヌクレオチド配列を持つポリヌクレオチド、(b)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列との少なくとも90%の同一性を有する或る天然ポリヌクレオチド配列を持つポリヌクレオチド、(c)(a)に相補的なポリヌクレオチド、(d)(b)に相補的なポリヌクレオチド、および(e)(a)〜(d)のRNA等価物、からなる群から選択される方法を提供する。検出方法は、(a)ポリメラーゼ連鎖反応増幅を用いて標的ポリヌクレオチドまたはその断片を増幅する過程と、(b)該増幅した標的ポリヌクレオチドまたはその断片の有無を検出する過程からなる。或る関連した実施態様で本法は、該増幅した標的ポリヌクレオチドまたはその断片の量の検出を含みうる。
【0038】
別の実施態様は、或る有効量のポリペプチドと薬物として許容し得る或る賦形剤とからなる、或る組成物を提供する。有効量のポリペプチドは、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を有する天然のアミノ酸配列を含むポリペプチド、(c)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を含むポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択される。一実施態様で該組成物は、SEQ ID NO:1-26からなる群から選択された或るアミノ酸配列を持つ場合がある。別の実施態様は、機能的GCRECの低下したまたは異常な発現を伴う疾患や症状の治療を要する患者に該組成物を投与する方法を提供する。
【0039】
また別の実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を有する天然アミノ酸配列を持つポリペプチド、(c)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を持つポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択したポリペプチドのアゴニストとしての有効性を確認するために、或る化合物をスクリーニングする方法を提供する。スクリーニング方法は、(a)該ポリペプチドを有するサンプルを或る化合物に曝す過程と、(b)サンプル中のアゴニスト活性を検出する過程からなる。別の実施態様は、この方法で同定したアゴニスト化合物と許容される医薬用賦形剤とを有する、或る組成物を提供する。また別の実施態様は、機能的GCRECの発現の低下を伴う疾患や症状の治療を要する患者への、この組成物の投与方法を提供する。
【0040】
また更に別の実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を有する天然アミノ酸配列を持つポリペプチド、(c)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を持つポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択したポリペプチドのアンタゴニストとしての有効性を確認するために、或る化合物をスクリーニングする方法を提供する。スクリーニング方法は、(a)該ポリペプチドを有するサンプルを或る化合物に曝す過程と、(b)サンプル中のアンタゴニスト活性を検出する過程からなる。別の実施態様は、この方法で同定したアンタゴニスト化合物と許容される医薬用賦形剤とを有する、或る組成物を提供する。また別の実施態様は、機能的GCRECの過剰発現を伴う疾患や症状の治療を要する患者への、該組成物の投与方法を提供する。
【0041】
別の実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列との少なくとも90%の同一性を有する天然アミノ酸配列を持つポリペプチド、(c)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を持つポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択したポリペプチドに特異結合する化合物をスクリーニングする方法を提供する。スクリーニング方法は、(a)該ポリペプチドを少なくとも1つの試験化合物と適切な条件下で混合する過程と、(b)該ポリペプチドと該試験化合物との結合を検出し、該ポリペプチドに特異結合する化合物を同定する過程からなる。
【0042】
また別の実施態様は、(a)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド、(b)SEQ ID NO:1-26 からなる群から選択したアミノ酸配列との少なくとも90%または少なくとも約90%の同一性を有する或る天然アミノ酸配列を持つポリペプチド、(c)SEQ ID NO:1-26 からなる群から選択した或るアミノ酸配列を持つポリペプチドの生物学的活性断片、および(d)SEQ ID NO:1-26 からなる群から選択した或るアミノ酸配列を持つポリペプチドの免疫原性断片、からなる群から選択した或るポリペプチドの活性をモジュレートする或る化合物をスクリーニングする方法を提供する。スクリーニング方法は、(a)該ポリペプチドの活性にとり許容し得る条件下で、該ポリペプチドを少なくとも1つの試験化合物と混合する過程と、(b)該ポリペプチドの活性をこの試験化合物の存在下で算定する過程と、(c)この試験化合物の存在下での該ポリペプチドの活性をこの試験化合物の不存在下での該ポリペプチドの活性と比較する過程からなり、この試験化合物の存在下での該ポリペプチドの活性の変化は、該ポリペプチドの活性をモジュレートする化合物を標示する。
【0043】
さらに本発明は、嗅覚および/または味覚に関連する本発明のGタンパク質共役受容体ポリペプチドのアゴニストまたはアンタゴニスト化合物を同定するために、前記の受容体、生物学的に活性であるその断片(受容体活性を有する物を含む)および、それに対して少なくとも90%の配列同一性を有するアミノ酸配列、を使用する方法を提供する。これらの化合物は、特異的な臭味を調節、遮断および/または模倣するのに有用である。
【0044】
また本発明は、本発明の嗅覚および/または味覚受容体、生物的に活性なその断片(受容体活性を持つ断片を含む)、および其れに対して少なくとも90%の配列同一性を有するポリペプチドを、1つ以上の他の嗅覚および/または味覚受容体ポリペプチドと併用する、或る特異な嗅覚および/または味覚を、調節、模倣、および/または遮断する化合物(群)の同定に関する。
【0045】
また本発明は、本発明の嗅覚または味覚受容体ポリペプチドを発現する細胞、その生物的に活性な断片(受容体活性を持つ断片を含む)、または其れに対して少なくとも90%の配列同一性を有するポリペプチドを発現する細胞に関連し、また特異な嗅覚または味覚を調節、模倣、および/または遮断する分子を同定するために細胞ベースのスクリ−ンにこれらの細胞を使用することに関連する。
【0046】
更に本発明は、本発明の少なくとも1つの嗅覚または味覚Gタンパク質共役受容体ポリペプチドと或るGタンパク質とを同時発現する細胞に、またオプションで1つ以上の他の嗅覚および/または味覚Gタンパク質共役受容体ポリペプチドを同時発現する細胞に関し、またこれらの細胞をスクリーニングに用いた、特異な嗅覚および/または味覚を、調節、模倣、および/または遮断する分子の同定に関する。
【0047】
また更に別の実施態様は、SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列を持つ標的ポリヌクレオチドの発現を改変する効果につき、或る化合物をスクリーニングする一方法を提供する。この方法は、(a)この標的ポリヌクレオチドを有するサンプルを或る化合物に曝露する過程と、(b)この標的ポリヌクレオチドの発現の改変を検出する過程と、(c)可変量のこの化合物の存在下でのこの標的ポリヌクレオチドの発現と、この化合物の不在下での発現とを比較する過程とからなる。
【0048】
別の実施態様は、試験化合物の毒性の算定方法を提供する。この方法には、以下の過程がある。(a)核酸群を有する生体サンプルを試験化合物で処理する過程。(b)処理済み生体サンプルの核酸群をハイブリダイズする過程。この過程には、次のようなプローブを用いる。(i)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列を持つポリヌクレオチド、(ii)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列との少なくとも90%の同一性を有する天然ポリヌクレオチド配列を持つポリヌクレオチド、(iii)(i)に相補的な配列を持つポリヌクレオチド、(iv)(ii)のポリヌクレオチドに相補的なポリヌクレオチド、(v)(i)〜(iv)のRNA等価物、からなる群から選択した或るポリヌクレオチドの少なくとも20の連続したヌクレオチド群からなるプローブである。ハイブリダイゼーションは、上記プローブと生体サンプル中の標的ポリヌクレオチドとの間に特異的ハイブリダイゼーション複合体が形成されるような条件下で生じる。上記標的ポリヌクレオチドは、(i)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列を持つポリヌクレオチド、(ii)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列との少なくとも90%または少なくとも約90%の同一性を有する天然ポリヌクレオチド配列を持つポリヌクレオチド、(iii)(i)のポリヌクレオチドに相補的なポリヌクレオチド、(iv)(ii)のポリヌクレオチドに相補的なポリヌクレオチド、(v)(i)〜(iv)のRNA等価物、からなる群から選択する。あるいは標的ポリヌクレオチドは、上記(i)〜(v)からなる群から選択したポリヌクレオチド配列の断片を持つ場合がある。毒性の算定方法には更に、以下の過程がある。(c)ハイブリダイゼーション複合体の量を定量する過程と、(d)処理済み生体サンプル中のハイブリダイゼーション複合体の量を、非処理の生体サンプル中のハイブリダイゼーション複合体の量と比較する過程である。処理済み生体サンプル中のハイブリダイゼーション複合体の量の差異が、試験化合物の毒性を示す。
【発明を実施するための最良の形態】
【0049】
(本発明の記載について)
本発明のタンパク質、核酸、および方法について説明するが、その前に、説明した特定の装置、材料および方法に本発明の実施態様が限定されるものではなく、修正され得ることを理解されたい。また、ここで使用する専門用語は特定の実施態様を説明する目的で用いたものに過ぎず、本発明の範囲を限定することを意図したものではないことも併せて理解されたい。
【0050】
請求の範囲および明細書中で用いる単数形の「或る」および「その(この)」の表記は、文脈から明らかにそうでないとされる場合を除いて複数のものを指す場合もある。したがって、例えば「或る宿主細胞」と記されている場合にはそのような宿主細胞が複数あることもあり、「或る抗体」と記されている場合には1個以上の抗体、および、当業者に公知の抗体の等価物などについても言及している。
【0051】
本明細書中で用いる全ての技術用語および科学用語は、特に定義されている場合を除き、当業者に一般に理解されている意味と同じ意味を有する。本明細書で説明するものと類似あるいは同等の任意の装置、材料および方法を用いて本発明の実施または試験を行うことができるが、ここでは好適な装置、材料、方法について説明する。本発明で言及する全ての刊行物は、刊行物中で報告されていて且つ本発明の種々の実施態様に関係して用い得る、細胞、プロトコル、試薬およびベクターについて説明および開示する目的で引用しているものである。本明細書のいかなる開示内容も、本発明が先行技術の効力によってこのような開示に対して先行する権利を与えられていないことを認めるものではない。
【0052】
(定義)
「GCREC」は、天然、合成、半合成或いは組換え体などからの、全ての種(特にウシ、ヒツジ、ブタ、ネズミ、ウマ及びヒトを含む哺乳動物)から得た、実質的に精製されたGCRECのアミノ酸配列を指す。
【0053】
用語「アゴニスト」は、GCRECの生物学的活性を強化または模倣する分子を指す。アゴニストとしては、GCRECと直接に相互作用、あるいはGCRECが関与する生物学的経路の各成分に作用してGCRECの活性をモジュレートする、タンパク質、核酸、糖質、小分子、または任意の他の化合物や組成物があり得る。
【0054】
「対立遺伝子変異体」は、GCRECをコードする遺伝子の別の形態である。対立遺伝子変異体群は、核酸配列における少なくとも1つの突然変異から生じ得る他、変容したmRNA群を生じ得る。また、生じ得るポリペプチドの構造または機能は、変容することもしないこともある。或る遺伝子は、その天然型の対立遺伝子変異体を全く持たない場合もあり、1個以上持つこともある。対立遺伝子変異体を生じさせる通常の突然変異性変化は一般に、ヌクレオチドの自然な欠失、付加または置換による。これら各種の変化は、単独であるいは他の変化と共に、或る配列内で1回以上、生じ得る。
【0055】
GCRECをコードする「変容した/改変された(altered)」核酸配列としては、様々なヌクレオチドの欠失、挿入、或いは置換がありながら、GCRECと同じポリペプチド、或いはGCRECの機能特性の少なくとも1つを備えるポリペプチドをもたらす配列もある。この定義には、GCRECをコードするポリヌクレオチドにとり正常な染色体の遺伝子座ではない位置での、対立遺伝子変異体群への不適当或いは予期しないハイブリダイゼーションを含み、また、GCRECをコードするポリヌクレオチドの或る特定オリゴヌクレオチドプローブを用いて容易に検出可能な或いは検出困難な多型性を含む。コードされるタンパク質も「変容する/改変される」ことがあり、また、サイレント変化を生じた結果、機能的に等価なGCRECとなるような、アミノ酸残基の欠失、挿入または置換を持ち得る。意図的なアミノ酸置換は、生物学的或いは免疫学的にGCRECの活性が保持される範囲で、残基の、極性、電荷、溶解度、疎水性、親水性、及び/または両親媒性、についての1つ以上の類似性に基づいて成され得る。例えば、負に帯電したアミノ酸にはアスパラギン酸およびグルタミン酸があり、正に帯電したアミノ酸にはリジンおよびアルギニンがある。親水性値が近似した非荷電極性側鎖を持つアミノ酸には、アスパラギンとグルタミン、セリンとトレオニンがある。親水性値が近似した非荷電側鎖を持つアミノ酸には、ロイシンとイソロイシンとバリン、グリシンとアラニン、フェニルアラニンとチロシンがある。
【0056】
用語「アミノ酸」および「アミノ酸配列」は、オリゴペプチド、ペプチド、ポリペプチド、タンパク質配列、あるいはそれらのいずれかの断片を指し、天然分子または合成分子を指す。「アミノ酸配列」が或る天然タンパク質分子の配列を指す場合、「アミノ酸配列」および類似の用語は、記載したそのタンパク質分子に関連する完全で元のままのアミノ酸配列に限定するものではない。
【0057】
「増幅」は、或る核酸の付加的複製物を作製する行為に関する。増幅には、当業者に公知の、ポリメラーゼ連鎖反応(PCR)技術または他の核酸増幅技術を用いる。
【0058】
用語「アンタゴニスト」は、GCRECの生物学的活性を阻害あるいは減弱する分子を指す。アンタゴニストとしては、GCRECと直接相互作用すること、あるいはGCRECが関与する生物学的経路の各成分に作用することによってGCRECの活性をモジュレートする、抗体などタンパク質、anticalin、核酸、糖質、小分子、または任意の他の化合物や組成物があり得る。
【0059】
用語「抗体」は、エピトープの決定基と結合できる、無傷の免疫グロブリン分子やそれらの断片、例えばFab、F(ab')2 、およびFv断片を指す。GCRECポリペプチドと結合する抗体は、免疫抗原として、無傷のポリペプチド群を用いて、または、当該の小ペプチド群を持つ断片群を用いて作製可能である。マウス、ラット、ウサギなどの動物を免疫化するために用いるポリペプチドまたはオリゴペプチドの由来は、RNAの翻訳の場合や、または化学合成があり得る。また、それらは所望により、キャリアタンパク質に抱合し得る。通常用いられるキャリアであってペプチドと化学結合するキャリアの例は、ウシ血清アルブミン、サイログロブリン、および、スカシガイのヘモシアニン(KLH)などがある。結合したこのペプチドは、前記動物を免疫化するために用いる。
【0060】
用語「抗原決定基」は、特定の抗体と接触する、分子の領域(すなわちエピトープ)を指す。タンパク質またはタンパク質断片を用いて宿主動物を免疫化する場合、タンパク質の多数の領域が、抗原決定基(タンパク質の特定の領域または3次元構造)に特異結合する抗体の産生を誘発し得る。或る抗原決定基は、或る抗体への結合について、無傷抗原(すなわち免疫応答を引き出すために用いられる免疫原)と競合し得る。
【0061】
用語「アプタマー(aptamer)」は、核酸またはオリゴヌクレオチド分子であって、特定の分子ターゲットに結合する分子を指す。アプタマーはin vitroでの進化プロセスに由来する(例えば、SELEX(Systematic Evolution of Ligands by EXponential Enrichmentの略、試験管内選択法)、米国特許第5,270,163号に記述)。これは、大規模な組合せライブラリ群から標的特異的アプタマー配列を選択するプロセスである。アプタマーの構成は二本鎖または一本鎖であり、デオキシリボヌクレオチド、リボヌクレオチド、ヌクレオチド誘導体または他のヌクレオチド様分子を含み得る。アプタマーの各ヌクレオチド成分は修飾された糖基を持つことがあり(例えば、リボヌクレオチドの2'-OH基は2'-Fまたは2'-NH2によって置換され得る)、これは、ヌクレアーゼへの抵抗性または血中でのより長い寿命など、所望の特性を向上し得る。アプタマーを他の分子(例えば高分子量のキャリア)と抱合させることにより、循環系からのこのアプタマーのクリアランスを遅らせ得る。アプタマー類は、例えば或る架橋剤の光活性化によって、それらの同種リガンド群と特異的に架橋させ得る(例えば、Brody, E.N.およびL. Gold(2000)J. Biotechnol. 74:5-13を参照)。
【0062】
用語「イントラマー(intramer)」は、in vivoで発現されるアプタマーを指す。例えば、ワクシニアウイルスに基づく或るRNA発現系を用いて、白血球の細胞質内で特定のRNAアプタマー類が高レベルに発現されている(Blind, M.他(1999) Proc. Natl. Acad. Sci. USA 96:3606-3610)。
【0063】
用語「スピーゲルマー(spiegelmer)」は、アプタマーの内、L-DNA、L-RNAなどの左旋性ヌクレオチド誘導体または左旋性ヌクレオチド様分子などを指す。左旋性のヌクレオチド群を持つアプタマー類は、右旋性ヌクレオチド群を持つ基質に通常は作用する、天然酵素類による分解に対して耐性がある。
【0064】
用語「アンチセンス」は、或る特定核酸配列を持つ或るポリヌクレオチドの「センス」(コーディング)鎖との塩基対を形成し得る任意の組成物を指す。アンチセンス組成物としては、DNAや、RNAや、ペプチド核酸(PNA)や、修飾されたバックボーン連結たとえばホスホロチオ酸、メチルホスホン酸またはベンジルホスホン酸などを有するオリゴヌクレオチドや、修飾された糖基たとえば2'-メトキシエチル糖または2'-メトキシエトキシ糖などを有するオリゴヌクレオチドや、あるいは修飾された塩基たとえば5-メチルシトシン、2-デオキシウラシルまたは7-デアザ-2'-デオキシグアノシンなどを有するオリゴヌクレオチドがあり得る。アンチセンス分子は、化学合成または転写など、任意の方法で製造することができる。相補的アンチセンス分子は、細胞に導入されると、細胞が産生した天然核酸配列との塩基対を形成し二重鎖を形成して転写または翻訳を妨害する。「負」または「マイナス」という表現は或る参考DNA分子のアンチセンス鎖を指すことがあり、「正」または「プラス」という表現は或る参考DNA分子のセンス鎖を意味し得る。
【0065】
用語「生物学的に活性」は、或る天然分子の構造的、調節的、あるいは生化学的な機能を有するタンパク質を指す。同様に、「免疫学的に活性」または「免疫原性」は、天然、組換え体、または合成のGCRECまたはそれらの任意のオリゴペプチドが、適当な動物或いは細胞の特定の免疫応答を誘発して特定の抗体と結合する能力を指す。
【0066】
「相補」は、塩基対合によってアニールする2つの一本鎖核酸配列間の関係を指す。例えば、「5'-AGT-3'」は、その相補配列「3'-TCA-5'」との対を形成する。
【0067】
「〜のポリヌクレオチドを含む(持つ)組成物」または「〜のポリペプチドを含む(持つ)組成物」は、指定のポリヌクレオチド若しくはポリペプチドを持つ、任意の組成物を指す。この組成物には、乾燥製剤または水溶液が含まれ得る。GCRECをコードまたはGCRECの断片群をコードするポリヌクレオチド群を有する組成物類は、ハイブリダイゼーションプローブとして使用し得る。これらプローブは、凍結乾燥形態で貯蔵でき、また、糖質などの安定化剤と結合させ得る。ハイブリダイゼーションにおいては、塩(例えばNaCl)、界面活性剤(例えばドデシル硫酸ナトリウム;SDS)および他の成分(例えばデンハート液、粉乳、サケ精子DNAなど)を有する水溶液中に、プローブを分散させ得る。
【0068】
「コンセンサス配列」は、不要な塩基を除くためにDNA配列解析を繰り返し行い、XL-PCRキット(Applied Biosystems, Foster City CA)を用いて5'および/または3'の方向に伸長され、再度シークエンシングされた核酸配列、またはGELVIEWフラグメント結合システム(GCG, Madison, WI)またはPhrap(University of Washington, Seattle WA)などのフラグメント結合用コンピュータプログラムを用い1つ以上のオーバーラップするcDNAやESTまたはゲノムDNA断片からアセンブリされた核酸配列を指す。伸長とアセンブリの両方によりコンセンサス配列を産生する配列もある。
【0069】
用語「保存的なアミノ酸置換」は、元のタンパク質の特性を殆ど変えないと予測される置換を指す。すなわち、そのタンパク質の構造、特にその機能が保存され、置換によって大きくは変わらない。下表は、タンパク質内で元のアミノ酸と置換され得るアミノ酸であり、保存的アミノ酸置換と認められるアミノ酸を示す。

Figure 2005500037
【0070】
保存的なアミノ酸置換では通常、(a)置換領域におけるポリペプチドのバックボーン構造、例えばβシートやα螺旋構造、(b)置換部位における分子の電荷または疎水性、および/または(c)側鎖の大部分、を保持する。
【0071】
「欠失」は、1個以上のアミノ酸残基が欠如するアミノ酸配列内の変化、あるいは1個以上のヌクレオチドが欠如するヌクレオチド配列内の変化を指す。
【0072】
用語「誘導体」は、化学修飾されたポリヌクレオチドまたはポリペプチドを指す。例えば、アルキル基、アシル基、ヒドロキシル基またはアミノ基による水素の置換は、ポリヌクレオチドの化学修飾に含まれ得る。ポリヌクレオチド誘導体は、天然分子の生物学的または免疫学的機能を少なくとも1つは保持しているポリペプチドをコードする。ポリペプチド誘導体は、次のようなプロセスによって修飾されたポリペプチドである。すなわち、グリコシル化、ポリエチレングリコール化(pegylation)、あるいは任意の同様なプロセスであって、誘導元のポリペプチドの少なくとも1つの生物学的若しくは免疫学的機能を保持するプロセスである。
【0073】
「検出可能な標識」は、測定可能な信号を発生し得る、ポリヌクレオチドやポリペプチドに共有結合あるいは非共有結合するレポーター分子や酵素を指す。
【0074】
「差次的発現」は、少なくとも2例のサンプルを比較して判定する、増加(上方制御)、あるいは減少(下方制御)、または欠損した、遺伝子またはタンパク質の発現を指す。このような比較は例えば、処理済サンプルと不処理サンプル、または病態サンプルと健常サンプルとの間で行われ得る。
【0075】
「エキソンシャッフリング」は、異なるコード領域(エキソン)群の組換えを意味する。或るエキソンは、コードするタンパク質の1つの構造的または機能的ドメインを代表し得るため、安定したサブストラクチャー群の新たな組合せによって新規のタンパク質群をアセンブリすることが可能であり、新たなタンパク質機能の進化を促進できる。
【0076】
「断片」は、GCRECの又はGCRECをコードする或るポリヌクレオチドの固有の部分であって、その親配列(parent sequence)と配列は同一でありうるが親配列より長さが短いものを指す。或る断片は、定義された配列の全長から1ヌクレオチド/アミノ酸残基を差し引いた長さよりも短い長さを有し得る。例えば或る断片は、約5〜約1000の連続したヌクレオチドまたはアミノ酸残基を有し得る。プローブ、プライマー、抗原、治療用分子として、あるいはその他の目的のために用いられる或る断片は、少なくとも長さ5、10、15、20、25、30、40、50、60、75、100、150、250若しくは500の、連続したヌクレオチドあるいはアミノ酸残基であり得る。断片は、或る分子の特定領域から優先的に選択し得る。例えば、或るポリペプチド断片は、定義された或る配列内に見られるような或るポリペプチドの最初の250または500アミノ酸(または最初の25%または50%)から選択した、或る長さの連続したアミノ酸を持ち得る。これらの長さは明らかに例として挙げているものであり、本発明の実施態様では、配列表、表および図面を含む本明細書が支持する任意の長さであり得る。
【0077】
SEQ ID NO:27-52の断片は、例えば、この断片を得たゲノム内の他の配列とは異なる、SEQ ID NO:27-52を特異的に同定する固有のポリヌクレオチド配列の領域を持ちうる。SEQ ID NO:27-52の或る断片を本発明の方法の1つ以上の実施態様、例えばハイブリダイゼーションおよび増幅技術に、またはSEQ ID NO:27-52を関連ポリヌクレオチドから区別する類似の方法に用い得る。SEQ ID NO:27-52の或る断片の正確な長さは、また、その断片が対応するSEQ ID NO:27-52の領域は、その断片に意図した目的に基づき当業者が慣例的に決定し得る。
【0078】
SEQ ID NO:1-26の或る断片は、SEQ ID NO:27-52の或る断片によってコードされる。SEQ ID NO:1-26の或る断片は、SEQ ID NO:1-26を特異的に同定する固有のアミノ酸配列の領域を持ち得る。例えばSEQ ID NO:1-26の或る断片を、SEQ ID NO:1-26を特異的に認識する抗体の開発における免疫原性ペプチドとして用い得る。SEQ ID NO:1-26の或る断片の正確な長さは、また、この断片に対応するSEQ ID NO:1-26の領域は、その断片に意図する目的に基づき、本明細書に記載する、または当分野で既知の1つ以上の分析法で判定し得る。
【0079】
「完全長」ポリヌクレオチドとは、少なくとも1つの翻訳開始コドン(例えばメチオニン)と、それに続く1オープンリーディングフレームおよび翻訳終止コドンを有する配列である。或る「完全長」ポリヌクレオチド配列は、或る「完全長」ポリペプチド配列をコードする。
【0080】
「相同性」の語は、2つ以上のポリヌクレオチド配列または2つ以上のポリペプチド配列の、配列類似性、互換性、または配列同一性を意味する。
【0081】
ポリヌクレオチド配列に適用される「一致率」および「〜%同一」の語は、標準化されたアルゴリズムを用いてアラインメントされた、2つ以上のポリヌクレオチド配列間で一致する残基の割合を意味する。標準化アルゴリズムは、2配列間のアラインメントを最適化するため、標準化された再現性のある方法で比較対象の2配列内にギャップ群を挿入し得るので、2つの配列をより有意に比較できる。
【0082】
ポリヌクレオチド配列間の一致率を判定するには、当分野で既知の、または本明細書に記載の、1つ以上のコンピュータアルゴリズムまたはプログラムを用い得る。例えば一致率を判定するには、MEGALIGN version 3.12e配列アラインメントプログラムに組込まれているようなCLUSTAL Vアルゴリズムの、デフォルトのパラメータ群を用い得る。このプログラムは、LASERGENEソフトウェアパッケージ(一組の分子生物学的分析プログラム)(DNASTAR, Madison WI)の一部である。CLUSTAL Vは、Higgins, D.G.およびP.M. Sharp(1989)CABIOS 5:151-153、Higgins, D.G. 他(1992)CABIOS 8:189-191に記載されている。ポリヌクレオチド配列をペアワイズアラインメントする際のデフォルトパラメータは、Ktuple=2、gap penalty=5、window=4、「diagonals saved」=4と設定される。「weighted」残基重み付け表がデフォルトで選択される。CLUSTAL Vによる一致率の報告は、アラインメントされたポリヌクレオチド配列間の「percent similarity(類似性パーセント)」としてなされる。
【0083】
あるいは、米国国立バイオテクノロジー情報センター(NCBI)のBasic Local Alignment Search Tool(BLAST)が、一般的に用いられ、且つ、無料で利用可能な用い得る配列比較アルゴリズム一式を提供している(Altschul, S.F. 他(1990)J. Mol. Biol. 215:403-410)。BLASTアルゴリズムは、幾つかの情報源から入手可能であり、メリーランド州ベセスダにあるNCBIおよびインターネット(http://www.ncbi.nlm.nih.gov/BLAST/)からも入手可能である。このBLASTソフトウェア一式には、既知のポリヌクレオチド配列と、様々なデータベースの別のポリヌクレオチド配列とのアラインメントに用いる「blastn」を含む、様々な配列分析プログラムが含まれる。「BLAST 2 Sequences」と呼ばれるツールも入手可能であり、これは2つのヌクレオチド配列を直接のペアワイズで比較するために用いられる。「BLAST 2 Sequences」は、http://www.ncbi.nlm.nih.gov/gorf/bl2.htmlにアクセスして、対話形式で利用できる。「BLAST 2 Sequences」ツールは、blastn および blastp(以下に記載)の両方に用い得る。BLASTプログラムは、一般的には、ギャップ(gap)などのパラメータをデフォルト設定にセットして用いる。例えば、2つのヌクレオチド配列を比較するには、デフォルトパラメータに設定した「BLAST 2 Sequences」ツールVersion 2.0.12(2000年4月21日)を用いてblastnを実行し得る。デフォルトパラメータの設定例を以下に示す。
【0084】
Matrix:BLOSUM62
Reward for match: 1
Penalty for mismatch: -2
Open Gap:5 及びExtension Gap:2 penalties
Gap x drop-off: 50
Expect: 10
Word Size: 11
Filter: on
【0085】
一致率は、ある定義された配列の全長(例えば特定のSEQ IDナンバーで定義された配列)について測定し得る。あるいは、より短い長さ、例えば、定義された、より大きな配列から得た断片(例えば少なくとも20、30、40、50、70、100または少なくとも200の連続したヌクレオチドの断片)の長さの一致率も測定し得る。ここに挙げた長さは単なる例示的なものに過ぎず、表、図および配列リストを含めた本明細書に記載された配列が支持する任意の断片長を用いて、一致率を測定し得る或る長さを説明し得ることを理解されたい。
【0086】
高度の同一性を示さない核酸配列が、それにもかかわらず遺伝子コードの縮重が原因で、類似のアミノ酸配列をコードする場合がある。この縮重を利用して核酸配列内で変化を生じさせて、全ての核酸配列が実質上同一のタンパク質をコードするような多数の核酸配列を生成し得ることを理解されたい。
【0087】
ポリペプチド配列に用いられる用語「一致率」または「〜%同一」とは、標準化されたアルゴリズムを用いてアラインメントされる2つ以上のポリペプチド配列間の一致する残基の百分率のことである。ポリペプチド配列アラインメントの方法は公知である。保存的アミノ酸置換を考慮するアラインメント方法もある。既に詳述したこのような保存的置換は通常、置換部位の電荷および疎水性を保存するので、ポリペプチドの構造を(したがって機能も)保存する。
【0088】
ポリペプチド配列間の一致率は、MEGALIGN version 3.12e配列アラインメントプログラムに組込まれているようなCLUSTAL Vアルゴリズムのデフォルトのパラメータ群を用いて判定できる(参照先と共に上述)。CLUSTAL Vを用いてポリペプチド配列をペアワイズアラインメントする際のデフォルトパラメータは、Ktuple=1、gap penalty=3、window=5、「diagonals saved」=5と設定される。PAM250マトリクスが、デフォルトの残基重み付け表として選択される。ポリヌクレオチドのアラインメントと同様に、アラインメントされたポリペプチド配列の対の一致率は、CLUSTAL Vによって「percent similarity(類似性パーセント)」として報告される。
【0089】
あるいは、NCBI BLASTソフトウェア一式を用い得る。例えば、2つのポリペプチド配列をペアワイズで比較する場合、「BLAST 2 Sequences」ツールVersion 2.0.12(2000年4月21日)のblastpをデフォルトパラメータに設定して用い得る。デフォルトパラメータの設定例を以下に示す。
【0090】
Matrix:BLOSUM62
Open Gap:11 及びExtension Gap:1 penalties
Gap x drop-off: 50
Expect: 10
Word Size: 3
Filter: on
【0091】
一致率は、ある定義されたポリペプチド配列の全長(例えば特定のSEQ IDナンバーで定義された配列)について測定し得る。あるいは、より短い長さ、例えば、定義された、より大きなポリペプチド配列から得た断片(例えば少なくとも15、20、30、40、50、70、または少なくとも150の連続した残基の断片)の長さの一致率も測定し得る。ここに挙げた長さは単なる例示的なものに過ぎず、表、図および配列リストを含めた本明細書に記載された配列が支持する任意の断片長を用いて、一致率を測定し得る或る長さを説明し得ることを理解されたい。
【0092】
「ヒト人工染色体(HAC)」は直鎖状の微小染色体であり、約6kb 〜10MbのサイズのDNA配列を持ち得る。また、染色体の複製、分離および維持に必要な、全てのエレメントを持つ。
【0093】
用語「ヒト化抗体」は、もとの結合能力を保持しつつ、よりヒトの抗体に似せるために、非抗原結合領域のアミノ酸配列を改変した抗体分子を指す。
【0094】
「ハイブリダイゼーション」とは、所定のハイブリダイゼーション条件下で、或る一本鎖ポリヌクレオチドが或る相補的な一本鎖と塩基対を形成するアニーリングのプロセスである。特異的ハイブリダイゼーションは、2つの核酸配列が高い相補性を共有することの指標である。特異的ハイブリダイゼーション複合体は許容されるアニーリング条件下で形成され、1回以上の「洗浄」ステップ後もハイブリダイズされたままである。洗浄ステップは、ハイブリダイゼーションプロセスのストリンジェンシーを決定する際に特に重要であり、よりストリンジェントな条件では、非特異結合(すなわち完全には一致しない核酸鎖対間の結合)が減少する。核酸配列のアニーリングに関する許容条件は、当業者が慣例的に決定できる。アニール条件はどのハイブリダイゼーション実験でも一定であり得るが、洗浄条件は、所望のストリンジェンシー、したがってハイブリダイゼーション特異性を得るように、実験ごとに変更し得る。許容的アニーリング条件は、例えば、温度が68℃で、約6×SSC、約1%(w/v)のSDS、並びに約100μg/mlの、せん断して変性したサケ精子DNAの存在下である。
【0095】
一般に、ハイブリダイゼーションのストリンジェンシーは或る程度、洗浄ステップを実行する温度を基準にして表すことができる。このような洗浄温度は通常、所定のイオン強度およびpHにおける特定配列の融点(Tm)より約5〜20℃低くなるように選択する。このTmは、所定のイオン強度およびpHの条件下で、完全一致プローブに標的配列の50%がハイブリダイズする温度である。Tmを計算する式および核酸のハイブリダイゼーション条件はよく知られており、Sambrook, J. 他(1989)Molecular Cloning:A Laboratory Manual, 第2版, 1-3巻, Cold Spring Harbor Press, Plainview NYに記載されており、特に2巻の9章を参照されたい。
【0096】
本発明のポリヌクレオチド間の高ストリンジェンシー条件のハイブリダイゼーションには、約0.2×SSCおよび約0.1%のSDSの存在下、68℃で1時間の洗浄条件を含む。あるいは、温度は約65℃、60℃、55℃、または42℃を用い得る。SSC濃度は、約0.1%のSDS存在下で、約0.1〜2×SSCの範囲で変更し得る。通常は、ブロッキング剤を用いて非特異ハイブリダイゼーションを阻止する。このようなブロッキング剤には、例えば、約100〜200μg/mlの、せん断した変性サケ精子DNAがある。特定条件下で、例えばRNAとDNAのハイブリダイゼーションでは、有機溶剤、例えば約35〜50%v/vの濃度のホルムアミドを用いることもできる。洗浄条件の有用なバリエーションは、当業者には自明であろう。ハイブリダイゼーションは、特に高ストリンジェント条件下では、ヌクレオチド間の進化的な類似性を示唆し得る。進化的類似性は、ヌクレオチド群、およびヌクレオチドがコードするポリペプチド群について、或る同様の役割を強く示唆する。
【0097】
用語「ハイブリダイゼーション複合体」は、相補的な塩基間の水素結合の形成によって形成された、2つの核酸の複合体を指す。ハイブリダイゼーション複合体は、溶解状態で形成し得る(C0tまたはR0t解析など)。あるいは、一方の核酸が溶解状態で存在し、もう一方の核酸が固体支持体(例えば紙、膜、フィルタ、チップ、ピンまたはガラススライド、あるいは他の適切な基板であって細胞若しくはその核酸が固定される基板)に固定されているような2つの核酸間に形成され得る。
【0098】
用語「挿入」あるいは「付加」は、1個以上のアミノ酸残基あるいはヌクレオチドがそれぞれ追加される、アミノ酸配列あるいはポリヌクレオチド配列における変化を指す。
【0099】
「免疫応答」は、炎症、外傷、免疫異常症、伝染性疾患または遺伝性疾患などに関連する症状を指し得る。これらの症状は、細胞および全身の防御系に作用し得る種々の因子、例えばサイトカイン、ケモカイン、その他のシグナル伝達分子の発現によって特徴づけ得る。
【0100】
「免疫原性断片」は、生物(例えば哺乳類)に導入すると免疫応答を引き起こし得る、GCRECのポリペプチド断片またはオリゴペプチド断片を指す。用語「免疫原性断片」はまた、本明細書で開示するまたは当分野で周知のあらゆる抗体生産方法に有用な、GCRECの任意のポリペプチド断片またはオリゴペプチド断片をも指す。
【0101】
用語「マイクロアレイ」は、或る基板上の複数のポリヌクレオチド、ポリペプチド、抗体、または他の化合物の構成を指す。
【0102】
用語「エレメント」または「アレイエレメント」は、マイクロアレイ上に固有の指定された位置を有する、ポリヌクレオチド、ポリペプチド、抗体、または他の化合物を指す。
【0103】
用語「モジュレート」または「活性を調節」は、GCRECの活性を変化させることを指す。例えば、モジュレートによって、GCRECのタンパク質活性の増減が、あるいは、結合特性またはその他の、生物学的特性、機能的特性あるいは免疫学的特性の変化が生じ得る。
【0104】
「核酸」および「核酸配列」の語は、ヌクレオチド、オリゴヌクレオチド、ポリヌクレオチドまたはこれらの断片を指す。「核酸」および「核酸配列」の語はまた、ゲノム起源または合成起源のDNAまたはRNAであって一本鎖または二本鎖であるかあるいはセンス鎖またはアンチセンス鎖を表し得るようなDNAまたはRNAや、ペプチド核酸(PNA)や、任意のDNA様またはRNA様物質を指すこともある。
【0105】
「機能的に連結した」は、第1の核酸配列と第2の核酸配列が機能的な関係にある状態を指す。例えば、或るプロモーターが或るコード配列の転写または発現に影響を及ぼす場合には、そのプロモーターはそのコード配列に機能的に連結している。機能的に連結したDNA配列群は非常に近接するか連続的に隣接することがあり、また、2つのタンパク質コード領域を結合するために必要な場合は同一リーディングフレーム内にあり得る。
【0106】
「ペプチド核酸(PNA)」は、末端がリジンで終わるアミノ酸残基のペプチドのバックボーンに結合した、少なくとも約5ヌクレオチドの長さのオリゴヌクレオチドを持つ、アンチセンス分子または抗遺伝子剤を指す。末端のリジンは、この組成に溶解性を与える。PNAは、相補的一本鎖DNAまたはRNAに優先的に結合して転写の伸長を停止させる。ポリエチレングリコール化することにより、細胞におけるPNAの寿命を延長し得る。
GCRECの「翻訳後修飾」としては、脂質化、グリコシル化、リン酸化、アセチル化、ラセミ化、タンパク質分解切断、及びその他の当分野で既知の修飾を含み得る。これらのプロセスは、合成的或いは生化学的に生じ得る。生化学的修飾は、GCRECの酵素環境に依存し、細胞の種類によって異なることとなる。
【0107】
「プローブ」とは、同一核酸、対立遺伝子核酸、または関連核酸の検出に用いる、GCRECやそれらの相補配列、またはそれらの断片をコードする核酸を指す。プローブは、単離されたオリゴヌクレオチドまたはポリヌクレオチドであって、検出可能な標識またはレポーター分子に接着した配列である。典型的な標識には、放射性アイソトープ、リガンド、化学発光試薬および酵素がある。「プライマー」とは、相補的な塩基対を形成して標的ポリヌクレオチドにアニーリング可能な、通常はDNAオリゴヌクレオチドである短い核酸である。プライマーは次に、DNAポリメラーゼ酵素により、標的DNA鎖に沿って伸長され得る。プライマー対を、例えばポリメラーゼ連鎖反応(PCR)による、核酸の増幅(および同定)に用い得る。
【0108】
本発明に用いるプローブおよびプライマーは通常、既知の配列の、少なくとも15の連続したヌクレオチド群からなる。特異性を高めるため、長めのプローブおよびプライマー、例えば開示した核酸配列の少なくとも20、25、30、40、50、60、70、80、90、100または少なくとも150の連続したヌクレオチドからなるようなプローブおよびプライマーも用い得る。これよりもかなり長いプローブおよびプライマーもある。表、図面および配列リストを含む本明細書が支持する、任意の長さのヌクレオチドを用い得るものと理解されたい。
【0109】
プローブおよびプライマーの調製および使用方法については、Sambrook, J. 他(1989)Molecular Cloning:A Laboratory Manual, 第2版, 1-3巻, Cold Spring Harbor Press, Plainview NY、Ausubel, F.M. 他(1987)Current Protocols in Molecular Biology, Greene Publ. Assoc. & Wiley-Intersciences, New York NY、Innis, M. 他(1990)PCR Protocols, A Guide to Methods and Applications, Academic Press, San Diego CAなどを参照されたい。PCRプライマー対を既知の配列から得るには、例えば、そのためのコンピュータプログラム、例えばPrimer(Version 0.5, 1991, Whitehead Institute for Biomedical Research, Cambridge MA)を用い得る。
【0110】
プライマーとして用いるオリゴヌクレオチドの選択は、そのような目的のために本技術分野で既知のソフトウェアを用いて行う。例えばOLIGO 4.06ソフトウェアは、各100ヌクレオチドまでのPCRプライマー対の選択に有用であり、オリゴヌクレオチドおよび、最大5,000までの大きめのポリヌクレオチドであって32キロベースまでのインプットポリヌクレオチド配列から得た配列を分析するのにも有用である。類似のプライマー選択プログラムには、拡張能力のための追加機能が組込まれている。例えば、PrimOUプライマー選択プログラム(テキサス州ダラスにあるテキサス大学南西部医療センターのゲノムセンターから一般向けに入手可能)は、メガベース配列から特定のプライマーを選択することが可能であり、したがってゲノム全体の範囲でプライマーを設計するのに有用である。Primer3プライマー選択プログラム(Whitehead Institute/MIT Center for Genome Research(マサチューセッツ州ケンブリッジ)より入手可能)を用いれば、プライマー結合部位として避けたい配列を指定できる「非プライミングライブラリ(mispriming library)」を入力できる。Primer3は特に、マイクロアレイのためのオリゴヌクレオチドの選択に有用である(後二者のプライマー選択プログラムのソースコードは、それぞれの情報源から得てユーザー固有のニーズを満たすように修正し得る)。PrimerGenプログラム(英国ケンブリッジ市の英国ヒトゲノムマッピングプロジェクト-リソースセンターから一般向けに入手可能)は、多数の配列アラインメントに基づいてプライマーを設計し、それによって、アラインメントされた核酸配列の最大保存領域または最小保存領域のいずれかとハイブリダイズするようなプライマーの選択を可能にする。したがって、このプログラムは、独自のものであれ保存されたものであれ、オリゴヌクレオチドとポリヌクレオチド断片との同定に有用である。上記選択方法のいずれかによって同定したオリゴヌクレオチドおよびポリヌクレオチド断片は、ハイブリダイゼーション技術において、例えばPCRまたはシークエンシングプライマーとして、マイクロアレイエレメントとして、あるいは核酸のサンプルにおいて完全または部分的相補的ポリヌクレオチドを同定する特異プローブとして有用である。オリゴヌクレオチドの選択方法は、上記の方法に限定されるものではない。
【0111】
「組換え核酸」は、天然核酸ではなく、配列の、2つ以上の離れたセグメントを人工的に組合せた配列を持つ核酸である。この人為的組合せはしばしば化学合成によって達成するが、より一般的には核酸の単離セグメントの人為的操作によって、例えばSambrookの文献(前出)に記載されているような遺伝子工学的手法によって達成する。組換え核酸の語は、単に核酸の一部が付加、置換または欠失により改変された核酸も含む。しばしば組換え核酸には、プロモーター配列に機能的に連結した核酸配列が含まれる。このような組換え核酸は、例えばある細胞を形質転換するために使用されるベクターの一部と成し得る。
【0112】
或いはこのような組換え核酸は、ウイルスベクターの一部と成すことができ、ベクターは例えばワクシニアウイルスに基づくものであり得る。そのようなベクターは哺乳類に接種され、その組換え核酸が発現されて、その哺乳類内で防御免疫応答を誘導するように使用することができる。
【0113】
「調節エレメント」は或る遺伝子の非翻訳領域に通常は由来する核酸配列であり、エンハンサー、プロモーター、イントロンおよび5'および3'の非翻訳領域(UTR)を含む。調節エレメントは、転写、翻訳またはRNA安定性を制御する宿主蛋白質またはウイルス蛋白質と相互作用する。
【0114】
「レポーター分子」は、核酸、アミノ酸または抗体の標識に用いる、化学的または生化学的な成分である。レポーター分子には、放射性核種、酵素、蛍光剤、化学発光剤、発色剤、基質、補助因子、阻害因子、磁気粒子およびその他の当分野で既知の成分がある。
【0115】
或るDNA分子に対する「RNA等価物」は、基準となるDNA分子と同じ直鎖のヌクレオチド配列からなるが、生じる全ての窒素性塩基のチミンがウラシルに置換され、糖鎖のバックボーンがデオキシリボースではなくリボースからなる。
【0116】
用語「サンプル」は、その最も広い意味で用いられている。GCREC、GCRECをコードする核酸群、またはその断片群を含むと推定されるサンプルとしては、体液と、細胞や細胞から単離した染色体や細胞内小器官(オルガネラ)や膜からの抽出物と、細胞と、溶液中に存在するまたは基板に固定されたゲノムDNA、RNA、cDNAと、組織と、組織プリントなどがあり得る。
【0117】
用語「特異結合」および「特異的に結合する」は、タンパク質若しくはペプチドの、アゴニスト、抗体、アンタゴニスト、小分子、若しくは任意の天然若しくは合成の結合組成物との間の相互作用を指す。この相互作用は、タンパク質の特定の構造(例えば抗原決定基すなわちエピトープ)であって結合分子が認識する構造の有無に依存する。例えば、或る抗体がエピトープ「A」に対して特異的である場合、結合していない標識した「A」と抗体とを含む或る反応の中に、エピトープAを持つポリペプチドが、あるいは結合していない無標識の「A」が存在すると、抗体と結合する標識Aの量が減少する。
【0118】
用語「実質的に精製された」は、自然の環境から取り除かれてから、単離あるいは分離された核酸配列あるいはアミノ酸配列であって、自然に結合している組成物が少なくとも約60%除去されたものであり、好ましくは約75%以上除去、最も好ましくは約90%以上除去されたものを指す。
【0119】
「置換」とは、1つ以上のアミノ酸残基またはヌクレオチドを、それぞれ別のアミノ酸残基またはヌクレオチドに置き換えることである。
【0120】
「基板」は、任意の好適な固体あるいは半固体の支持物を指し、膜およびフィルタ、チップ、スライド、ウェハ、ファイバー、磁気または非磁気ビーズ、ゲル、チューブ、プレート、ポリマー、微小粒子、毛細管が含まれる。基板は、ウェル、溝、ピン、チャネル、孔など、様々な表面形態を有することができ、基板表面にはポリヌクレオチドやポリペプチドが結合する。
【0121】
「転写イメージ(transcript image)」または「発現プロファイル」は、所定条件下での所定時間における、或る特定の細胞タイプまたは組織による、遺伝子発現の集合的パターンを指す。
【0122】
「形質転換(transformation)」とは、外因性DNAが、或る受容細胞に導入されるプロセスを言う。形質転換は、本技術分野で知られている種々の方法に従って自然条件または人工条件下で生じ得るものであり、外来性の核酸配列を原核宿主細胞または真核宿主細胞に挿入する、任意の既知の方法を基にし得る。形質転換の方法は、形質転換する宿主細胞の種類によって選択する。限定するものではないが形質転換方法には、ウイルス感染、電気穿孔法(エレクトロポレーション)、熱ショック、リポフェクションおよび微粒子銃を用いる方法がある。「形質転換された細胞」には、導入されたDNAが、自律的に複製するプラスミドとしてあるいは宿主染色体の一部として複製可能である、安定的に形質転換された細胞が含まれる。更に、限られた期間に一過的に導入DNA若しくは導入RNAを発現する細胞も含まれる。
【0123】
ここで用いる「遺伝形質転換生物(transgenic organism)」とは任意の生物体であり、限定するものではないが動植物を含み、生物体の1個以上の細胞が、ヒトの介入によって、例えば本技術分野で公知のトランスジェニック技術によって導入された異種核酸を有するものである。細胞への核酸の導入は、直接または間接的に、細胞の前駆物質に導入することによって行う。これは、計画的な遺伝子操作によって、例えば微量注射法によってあるいは組換えウイルスの導入によって行う。別の実施態様で核酸の導入は、組換えウイルスベクター、例えばレンチウイルスベクターを感染させて成し得る (Lois, C. 他(2002) Science 295:868-872)。遺伝子操作の語は、古典的な交雑育種あるいはin vitro受精を指すものではなく、組換えDNA分子の導入を指す。本発明に基づいて予期される遺伝形質転換生物には、バクテリア、シアノバクテリア、真菌および動植物がある。本発明の単離されたDNAは、本技術分野で知られている方法、例えば感染、形質移入、形質転換またはトランス接合によって宿主に導入することができる。本発明のDNAをこのような生物体に移入する技術はよく知られており、前出のSambrook 他(1989)などの参考文献に記載されている。
【0124】
特定の核酸配列の「変異体」とは、核酸配列1本の或る長さ全体について、該特定核酸配列に対し少なくとも40%の配列同一性を有する核酸配列として決定された配列である。決定には、デフォルトパラメータに設定した「BLAST 2 Sequences」ツールVersion 2.0.9(1999年5月7日)を用いてblastnを実行する。このような核酸対は、所定の長さに対して、例えば少なくとも50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれ以上の配列同一性を示し得る。変異体は、例えば、「対立遺伝子」変異体(上述)または「スプライス」変異体、「種」変異体、「多型」変異体と記述され得る。スプライス変異体は参照分子との顕著な同一性を有し得るが、mRNAプロセッシング中のエキソン群の選択的スプライシングによって通常、より多数またはより少数のヌクレオチドを有することになる。対応するポリペプチドは、追加機能ドメイン群を有するか、あるいは参照分子には存在するドメイン群が欠落していることがある。種変異体は、種によって異なるポリヌクレオチドである。結果的に生じるポリペプチドは通常、相互に有意のアミノ酸同一性を持つ。多型性変異体は、或る種の個体間における、或る特定遺伝子のポリヌクレオチド配列内での変異である。多型変異体にはまた、ポリヌクレオチド配列の1つのヌクレオチド塩基が異なる「1塩基多型性」(SNP)も含み得る。SNPの存在は、例えば特定の個体群、病状または病状性向を示し得る。
【0125】
特定のポリペプチド配列の「変異体」とは、ポリペプチド配列1本の或る長さ全体について、該特定ポリペプチド配列に対し少なくとも40%の配列同一性を有するポリペプチド配列として決定された配列である。決定には、デフォルトパラメータに設定した「BLAST 2 Sequences」ツールVersion 2.0.9(1999年5月7日)を用いてblastpを実行する。このようなポリペプチド対は、そのポリペプチドの一方の所定の長さに対して、例えば少なくとも50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれ以上の配列同一性を示し得る。
【0126】
(発明)
本発明の種々の実施態様には、新規のヒトGタンパク質共役受容体群(GCREC)および、GCRECをコードするポリヌクレオチド群を含む。また、これらの組成物を利用した、嗅覚神経障害、細胞増殖異常、神経疾患、心血管障害、胃腸障害、自己免疫/炎症性障害、代謝障害、およびウイルス感染症の、診断、治療、または予防を含む。
【0127】
表1は、本発明の完全長ポリヌクレオチド実施態様およびポリペプチド実施態様の命名の概略である。各ポリヌクレオチドおよびその対応するポリペプチドは、1つのIncyteプロジェクト識別番号(IncyteプロジェクトID)に相関する。各ポリペプチド配列は、ポリペプチド配列識別番号(ポリペプチドSEQ ID NO:)とIncyteポリペプチド配列番号(IncyteポリペプチドID)によって表示した。各ポリヌクレオチド配列は、ポリヌクレオチド配列識別番号(ポリヌクレオチドSEQ ID NO:)とIncyteポリヌクレオチドコンセンサス配列番号(IncyteポリヌクレオチドID)によって表示した。
【0128】
表2は、GenBankタンパク質(genpept)データベースに対するBLAST分析で同定した、本発明のポリペプチド群に相同な配列群を示す。列1および列2はそれぞれ、本発明の各ポリペプチドに対するポリペプチド配列識別番号(ポリペプチド SEQ ID NO:)と、それに対応するIncyteポリペプチド配列番号(IncyteポリペプチドID)を示す。列3は、最も近いGenBank相同体のGenBank識別番号(GenBank ID NO:)を示す。列4は、各ポリペプチドとその相同体1つ以上との間の一致に関する確率スコアを示す。列5は、該当箇所には適当な引用を示すとともにGenBank相同体群の注釈(アノテーション)を示し、これらはすべて本明細書では参考文献に含まれている。
【0129】
表3は、本発明のポリペプチドの多様な構造的特徴を示す。列1および列2はそれぞれ、本発明の各ポリペプチドのポリペプチド配列識別番号(SEQ ID NO:)およびそれに対応するIncyteポリペプチド配列番号(IncyteポリペプチドID)を示す。列3は、各ポリペプチドのアミノ酸残基数を示す。列4および列5はそれぞれ、GCG配列分析ソフトウェアパッケージのMOTIFSプログラム(Genetics Computer Group, Madison WI)によって決定された、リン酸化およびグリコシル化の可能性のある部位を示す。列6は、シグネチャ配列、ドメイン、およびモチーフを含むアミノ酸残基を示す。列7はタンパク質の構造/機能の分析のための分析方法を示し、該当箇所には更に、分析方法に用いた検索可能なデータベースを示す。
【0130】
表2および表3は共に本発明の各々のポリペプチドの特性を要約しており、それら特性は、請求の範囲に記載されたポリペプチドがGタンパク質共役受容体であることを確立している。例えばSEQ ID NO:1はマウスの嗅覚受容体P2(GenBank ID g7638409)と残基M1から残基M251にかけて45%の同一性を有することがBasic Local Alignment Search Tool (BLAST)によって示された。BLAST確率スコアは2.0e-56であり、これは観察されたポリペプチド配列アラインメントが偶然に得られる確率を示している。SEQ ID NO:1はまた、1つの膜7回貫通受容体(ロドプシンファミリー)を有するが、これは、隠れマルコフモデル(HMM)を基にした保存されたタンパク質ファミリードメイン群のPFAMデータベースにおいて、統計的に有意な一致を検索して決定された (表3参照)。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:1が嗅覚受容体である、更なる確証を提供する。
【0131】
別の例でSEQ ID NO:4は残基M1から残基K315までマウスの嗅覚受容体(GenBank ID g5869916)に86%同一であると、Basic Local Alignment Search Tool (BLAST)で判定された。BLAST確率スコアは3.6e-144であり、これは観察されたポリペプチド配列を偶然に得る確率を示す。SEQ ID NO:4はまた、1つの膜7回貫通受容体(ロドプシンファミリー)ドメインを有するが、これは、隠れマルコフモデル(HMM)を基にした保存されたタンパク質ファミリードメイン群のPFAMデータベースにおいて、統計的に有意な一致を検索して決定された (表3参照)。TMAP、BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:4が嗅覚受容体である、更なる確証を提供する。
【0132】
また別の例でSEQ ID NO:6は残基M1から残基A296までマウスの嗅覚受容体(GenBank ID g5869927)に73%同一であると、Basic Local Alignment Search Tool (BLAST)で判定された。BLAST確率スコアは2.1e-111であり、これは観察されたポリペプチド配列アラインメントが偶然に得られる確率を示している。SEQ ID NO:6はまた、1つの膜7回貫通受容体(ロドプシンファミリー)ドメインを有するが、これは、隠れマルコフモデル(HMM)を基にした保存されたタンパク質ファミリードメイン群のPFAMデータベースにおいて、統計的に有意な一致を検索して決定された (表3参照)。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:6が嗅覚受容体である、更なる確証を提供する。
【0133】
また別の例でSEQ ID NO:10は残基I68から残基P282までヒトの嗅覚受容体(GenBank ID g2921710)に66%同一であると、Basic Local Alignment Search Tool (BLAST)で判定された(表2参照)。BLAST確率スコアは8.3e-78であり、これは観察されたポリペプチド配列を偶然に得る確率を示す。SEQ ID NO:10はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを有するが、これは、隠れマルコフモデル(HMM)を基にした保存されたタンパク質ファミリードメイン群のPFAMデータベースにおいて、統計的に有意な一致を検索して決定された (表3参照)。BLIMPS及びPROFILESCAN解析よりのデータは、SEQ ID NO:10が嗅覚受容体である、更なる確証を提供する。
【0134】
SEQ ID NO:11は残基N5から残基S308までマウスの匂い物質受容体MOR83(GenBank ID g6178006)に50%同一であり、これはBLAST解析で判定され、BLAST確率スコアは1.9e-85である。SEQ ID NO:11はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを持ち、これは保存タンパク質ファミリードメイン群のHMMER-PFAMデータベースにおいて統計的に有意な一致を検索して決定した。BLIMPS解析よりのデータは、SEQ ID NO:11が嗅覚受容体である、更なる確証を提供する。
【0135】
SEQ ID NO:12は残基N13から残基L320までマウスの匂い物質受容体S1(GenBank ID g4680254)に59%同一であり、これはBLAST解析で判定し、BLAST確率スコアは7.4e-93である。SEQ ID NO:12はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを持ち、これは保存タンパク質ファミリードメイン群のHMMER-PFAMデータベースにおいて統計的に有意な一致を検索して決定した。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:12が嗅覚受容体である、更なる確証を提供する。
【0136】
SEQ ID NO:13は残基M1から残基R306までニワトリの嗅覚受容体4 (GenBank ID g1246534)に54%同一であり、これはBLAST解析で判定され、BLAST確率スコアは5.8e-86である。SEQ ID NO:13はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを持ち、これは保存タンパク質ファミリードメイン群のHMMER-PFAMデータベースにおいて統計的に有意な一致を検索して決定した。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:13が嗅覚受容体である、更なる確証を提供する。
【0137】
SEQ ID NO:14は残基E16から残基V325までヒトの嗅覚受容体HsOLF1 (GenBank ID g1336041)に47%同一であるとBLAST解析で判定され、BLAST確率スコアは1.7e-77である。SEQ ID NO:14はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを持ち、これは保存タンパク質ファミリードメイン群のHMMER-PFAMデータベースにおいて統計的に有意な一致を検索して決定した。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:14が嗅覚受容体である、更なる確証を提供する。
【0138】
SEQ ID NO:15は残基M1から残基V309までニワトリの嗅覚受容体4 (GenBank ID g1514480)に49%同一であるとBLAST解析で判定され、BLAST確率スコアは1.9e-78である。SEQ ID NO:15はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを持ち、これは保存タンパク質ファミリードメイン群のHMMER-PFAMデータベースにおいて統計的に有意な一致を検索して決定した。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:15が嗅覚受容体である、更なる確証を提供する。
【0139】
SEQ ID NO:16は49%の同一性を残基N6から残基K314までヒトの嗅覚受容体HOR5'Beta11 (GenBank ID g11908214)に対して持つとBLAST分析で判定されBLAST確率スコアは3.0e-80であり、これは、観察されたポリペプチド配列アラインメントを偶然に得る確率を示す。SEQ ID NO:16はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを持つと、保存されたタンパク質ファミリードメイン群のHMMER-PFAMデータベースにおいて、統計的に有意な一致を検索して決定された。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:16が嗅覚受容体である、更なる確証を提供する。
【0140】
SEQ ID NO:17は残基P12から残基V306までマウスの嗅覚受容体MOR 3'Beta6 (GenBank ID g11908221)に54%同一であるとBLAST解析で判定され、BLAST確率スコアは9.4e-86である。SEQ ID NO:17はまた、1つのロドプシンファミリー膜7回貫通受容体ドメインを持ち、これは保存タンパク質ファミリードメイン群のHMMER-PFAMデータベースにおいて統計的に有意な一致を検索して決定した。BLIMPS解析よりのデータは、SEQ ID NO:17が嗅覚受容体である、更なる確証を提供する。
【0141】
別の例でSEQ ID NO:20は、残基N7から残基L309まで、マウスの匂い物質受容体S1(GenBank ID g4680254)との55%の同一性を有することがBasic Local Alignment Search Tool (BLAST)によって示された(表2参照)。BLAST確率スコアは6.7e-85であり、これは観察されたポリペプチド配列アラインメントが偶然に得られる確率を示している。SEQ ID NO:20はまた、1つの膜7回貫通受容体(ロドプシンファミリー)ドメインを有するが、これは、隠れマルコフモデル(HMM)を基にした保存されたタンパク質ファミリードメイン群のPFAMデータベースにおいて、統計的に有意な一致を検索して決定された(表3参照)。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:20が匂い物質受容体である、更なる確証を提供する。
【0142】
また別の例でSEQ ID NO:26は、残基V61から残基V361まで、マウスの匂い物質受容体MOR18 (GenBank ID g6178008)との64%の同一性を有することがBasic Local Alignment Search Tool (BLAST)によって示された(表2参照)。BLAST確率スコアは9.9e-107であり、これは観察されたポリペプチド配列アラインメントが偶然に得られる確率を示している。SEQ ID NO:26はまた、1つの膜7回貫通受容体(ロドプシンファミリー)ドメインを有するが、これは、隠れマルコフモデル(HMM)を基にした保存されたタンパク質ファミリードメイン群のPFAMデータベースにおいて、統計的に有意な一致を検索して決定された(表3参照)。BLIMPS、MOTIFS、及びPROFILESCAN解析よりのデータは、SEQ ID NO:26が匂い物質受容体である、更なる確証を提供する。SEQ ID NO:2-3、SEQ ID NO:5、SEQ ID NO:7-9、SEQ ID NO:18-19およびSEQ ID NO:21-25は同様の方法で分析し、注釈を付けた。SEQ ID NO:1-26の解析用のアルゴリズム及びパラメータを表7に記載した。
【0143】
表4に示すように、完全長ポリヌクレオチド実施態様は、cDNA配列またはゲノムDNA由来のコード(エキソン)配列を用いて、あるいはこれら2種類の配列を任意に組合せてアセンブリした。列1は本発明の各ポリヌクレオチドに対するポリヌクレオチド配列識別番号(ポリヌクレオチドSEQ ID NO)および対応するIncyteポリヌクレオチドコンセンサス配列番号(Incyte ID)、および塩基対の各ポリヌクレオチド配列の長さを示している。列2は、完全長ポリヌクレオチド実施態様のアセンブリに用いたcDNA配列および/またはゲノム配列の、また、例えばSEQ ID NO:27-52を同定するため、或いはSEQ ID NO:27-52と、関連するポリヌクレオチド群とを区別するためのハイブリダイゼーション技術または増幅技術に有用なポリヌクレオチドの断片の、開始ヌクレオチド(5')位置および終了ヌクレオチド(3')位置を示す。
【0144】
表4の列2に記載したポリヌクレオチド断片は、特に例えば組織特異的cDNAライブラリ群やプールしたcDNAライブラリ群に由来するIncyte cDNA群を指す場合もある。或いは列2に記載のポリヌクレオチド断片は、完全長ポリヌクレオチドのアセンブリに寄与したGenBank cDNAまたはESTを指す場合もある。更に、列2に記載したポリヌクレオチド断片は、ENSEMBL(The Sanger Centre、英国ケンブリッジ)データベースに由来する配列を同定する場合もある(すなわち「ENST」の命名を含む配列)。あるいは、列2に記載したポリヌクレオチド断片は、NCBI RefSeq Nucleotide Sequence Records データベースに由来する場合もあり(すなわち「NM」または「NT」の命名を含む配列)、またNCBI RefSeq Protein Sequence Recordsに由来する場合もある(すなわち「NP」の命名を含む配列)。または列2に記したポリヌクレオチド断片は、「エキソンスティッチング(exon-stitching)」アルゴリズムにより結び合わせたcDNAおよびGenscan予測エキソン群の両方からなるアセンブリ体を指す場合がある。例えば、ポリヌクレオチド配列の内、FL_XXXXXX_N1_N2_YYYYY_N3_N4 として同定される配列は「スティッチされた」配列で、その内、XXXXXXは該アルゴリズムが適用される配列のクラスターの識別番号であり、YYYYYは該アルゴリズムが作成する予測の数であり、N1,2,3...がある場合には、解析中に手動で編集された特定のエキソン群を表す(実施例5参照)。または、列2のポリヌクレオチド断片は「エキソンストレッチング(exon-stretching)」アルゴリズムにより結び合わせたエキソンのアセンブリ体を指す場合もある。例えば、ポリヌクレオチド配列の内、FLXXXXXX_gAAAAA_gBBBBB_1_Nとして同定される配列は「ストレッチ」配列の識別番号である。ここでXXXXXXはIncyteプロジェクト識別番号、gAAAAAは「エキソンストレッチング」アルゴリズムを適用したヒトゲノム配列のGenBank識別番号、gBBBBBは一番近いGenBankタンパク質相同体のGenBank識別番号、またはNCBI RefSeq識別番号、N は特定のエキソンを指す(実施例5を参照)。或るRefSeq配列が「エキソンストレッチング」アルゴリズムのためのタンパク質相同体として使用された場合では、「NM」、「NP」、または「NT」によって表されるRefSeq識別子が、GenBank識別子(すなわち、gBBBBB)の代わりに使用され得る。
【0145】
あるいは、接頭コードは、手動で編集された構成配列、ゲノムDNA配列から予測された構成配列、または組み合わされた配列解析方法に由来する構成配列を同定する。次の表は、構成配列の接頭コードと、接頭コードに対応する配列分析方法の例を列記する(実施例4と5を参照)。
Figure 2005500037
【0146】
場合によっては、最終コンセンサスポリヌクレオチド配列を確認するために、表4に示すような配列カバレッジと重複するIncyte cDNAカバレッジが得られたが、該当するIncyte cDNA識別番号は示さなかった。
【0147】
表5は、Incyte cDNA配列を用いてアセンブリされた完全長ポリヌクレオチドのための代表的なcDNAライブラリを示している。代表的なcDNAライブラリとはIncyte cDNAライブラリであり、これは、最も頻繁にはIncyte cDNA配列群によって代表されるが、これらは、上記ポリヌクレオチド群をアセンブリおよび確認するために用いられた。cDNAライブラリを作製するために用いた組織およびベクターを表5に示し、表6で説明している。
【0148】
本発明には、また、GCRECの変異体をも含む。好適なGCRECの変異体は、GCRECアミノ酸配列に対して、少なくとも約80%、あるいは少なくとも約90%、さらには少なくとも約95%のアミノ酸配列同一性を有し、GCRECの機能的または構造的特徴を少なくとも1つ含む変異体である。
【0149】
種々の実施態様はまた、GCRECをコードするポリヌクレオチドを含む。特定の実施態様において、本発明は、GCRECをコードする、SEQ ID NO:27-52からなる一群から選択された1配列を持つポリヌクレオチド配列を提供する。SEQ ID NO:27-52のポリヌクレオチド配列は、配列表に示されているように等価RNA配列をも含むが、そこでは窒素塩基チミンの出現はウラシルに置換され、糖のバックボーンはデオキシリボースではなくてリボースから構成されている。
【0150】
本発明はまた、GCRECをコードするポリヌクレオチドの変異体群を含む。詳細には、このような変異体ポリヌクレオチドは、GCRECをコードするポリヌクレオチドとの、少なくとも約70%のポリヌクレオチド配列同一性、あるいは少なくとも約85%のポリヌクレオチド配列同一性、更には少なくとも約95%ものポリヌクレオチド配列同一性を持つこととなる。本発明の或る態様では、SEQ ID NO:27-52からなる群から選択されたアミノ酸配列と少なくとも約70%、或いは少なくとも約85%、または少なくとも約95%もの一致率を有するようなSEQ ID NO:27-52からなる群から選択された配列を有するポリヌクレオチドの変異体を含む。上記の任意のポリヌクレオチドの変異体は、GCRECの機能的若しくは構造的特徴を少なくとも1つ有するポリペプチドをコードし得る。
【0151】
更に或いは別法では、本発明の或るポリヌクレオチド変異体は、GCRECをコードするポリヌクレオチドのスプライス変異体である。或るスプライス変異体はGCRECをコードするポリヌクレオチドとの顕著な配列同一性を持つ部分複数を有し得るが、mRNAプロセッシング中のエキソン群の選択的スプライシングによって生ずる、配列の数ブロックの付加または欠失により、通常、より多数またはより少数のポリヌクレオチドを有することになる。或るスプライス変異体には、約70%未満、または約60%未満、あるいは約50%未満のポリヌクレオチド配列同一性が、GCRECをコードするポリヌクレオチドとの間で全長に渡って見られるが、このスプライス変異体の幾つかの部分には、GCRECをコードするポリヌクレオチドの各部との、少なくとも約70%、あるいは少なくとも約85%、または少なくとも約95%、なおまたは100%の、ポリヌクレオチド配列同一性を有することとなる。上記したスプライス変異体は何れも、GCRECの機能的或いは構造的特徴の少なくとも1つを有する或るポリペプチドをコードし得る。
【0152】
遺伝暗号の縮重により、GCRECをコードする種々のポリヌクレオチド配列が作り出され、中には、既知のいかなる天然遺伝子のポリヌクレオチド配列群とも最小の類似性しか有しない配列もあることは、当業者には理解されよう。したがって本発明には、可能コドン選択に基づく組合せの選択によって産出し得るあらゆる可能なポリヌクレオチド配列のバリエーションを網羅し得る。これらの組み合わせは、天然GCRECのポリヌクレオチド配列に適用される標準的なトリプレット遺伝暗号を基に成される。このような全ての変異が明確に開示されていると考慮されたい。
【0153】
GCRECとその変異体とをコードするポリヌクレオチドは一般に、好適に選択されたストリンジェンシー条件下で天然GCRECのポリヌクレオチドとハイブリダイズ可能であるが、非天然コドン群を含めるなどの実質的に異なるコドン使用を有するGCREC或いはその誘導体をコードするポリヌクレオチドを作り出すことは、有益であり得る。宿主が特定コドンを利用する頻度に基づき、特定の真核宿主または原核宿主に発生するペプチドの発現率を高めるようにコドンを選択し得る。コードされるアミノ酸配列群を改変せずに、GCRECとその誘導体群とをコードするヌクレオチド配列を実質的に改変する別の理由の例として、例えば天然配列から作られる転写物より長い半減期など、より好ましい特性を持つRNA転写物群の産生がある。
【0154】
本発明にはまた、GCRECとその誘導体とをコードする、ポリヌクレオチド群またはそれらの断片の、完全に合成化学による作製も含む。作製後、当分野で周知の試薬を用いて、この合成ポリヌクレオチドを任意の様々な入手可能な発現ベクター及び細胞系中に挿入し得る。更に、合成化学を用いてGCRECまたはその任意の断片をコードする或るポリヌクレオチドに突然変異を誘導し得る。
【0155】
本発明の実施態様には、種々のストリンジェンシー条件下で、請求項に記載のポリヌクレオチド、特に、SEQ ID NO:27-52に示す配列を持つポリヌクレオチド、及びそれらの断片群にハイブリダイズ可能なポリヌクレオチド群が含まれる(例えば、Wahl, G.M.およびS.L. Berger(1987)Methods Enzymol.152:399-407、Kimmel, A.R.(1987)Methods Enzymol.152:507-511.) アニーリングおよび洗浄条件を含むハイブリダイゼーションの条件は、「定義」に記載した。
【0156】
DNAシークエンシングの方法は当分野では公知であり、本発明のいずれの実施例も、DNAシークエンシング方法を用い得る。DNAシークエンシング方法には酵素を用い得る。例えばDNAポリメラーゼ1のクレノウ断片、SEQUENASE(US Biochemical, Cleveland OH)、Taqポリメラーゼ(Applied Biosystems)、熱安定性T7ポリメラーゼ(Amersham Biosciences, Piscataway NJ)を用い得る。あるいは、例えばELONGASE増幅システム(Invitrogen, Carlsbad CA)において見られるように、ポリメラーゼと校正エキソヌクレアーゼとを併用し得る。好適には、MICROLAB2200液体転移システム(Hamilton, Reno, NV)、PTC200サーマルサイクラー(MJ Research, Watertown MA)およびABI CATALYST 800サーマルサイクラー(Applied Biosystems)などの装置を用いて配列の準備を自動化する。次に、ABI 373或いは377 DNAシークエンシングシステム(Applied Biosystems)、MEGABACE 1000 DNAシークエンシングシステム(Amersham Biosciences)または当分野で既知の他のシステムを用いてシークエンシングを行う。結果として得た配列を、当分野で周知の種々のアルゴリズムを用いて分析する(例えば、Ausubel, F.M. (1997) Short Protocols in Molecular Biology, John Wiley & Sons, New York NY, 7.7ユニット、Meyers, R.A. (1995) Molecular Biology and Biotechnology, Wiley VCH, New York NY, 856-853ページを参照)。
【0157】
当分野で周知の、PCR法をベースにした種々の方法と、部分的ヌクレオチド配列とを利用して、GCRECをコードする核酸を伸長し、プロモーターや調節エレメントなど、上流にある配列を検出し得る。例えば、使用し得る方法の1つである制限部位PCR法は、ユニバーサルプライマーおよびネステッドプライマーを用いてクローニングベクター内のゲノムDNAからの未知の配列を増幅する方法である(例えばSarkar, G. (1993) PCR Methods Applic. 2:318-322を参照)。別の方法にインバースPCR法があり、これは多岐の方向に伸長するプライマー群を用いて、環状化した鋳型から未知の配列を増幅する方法である。鋳型は、或る既知のゲノム遺伝子座およびその周辺の配列群からなる制限酵素断片群から得る(例えばTriglia, T. 他(1988) Nucleic Acids Res. 16:8186を参照)。第3の方法としてキャプチャPCR法があり、これにはヒトおよび酵母人工染色体DNAの既知の配列群に隣接するDNA断片群をPCR増幅する方法を含む(例えばLagerstrom, M. 他(1991) PCR Methods Applic 1:111-119を参照)。この方法では、PCRを行う前に、複数の制限酵素の消化およびライゲーション反応を用い、未知の配列領域内に組換え二本鎖配列を挿入し得る。未知の配列群を検索するために用い得る、他の複数の方法も当分野で既知である(例えばParker, J.D.他(1991) Nucleic Acids Res. 19:3055-3060を参照)。更に、PCR、ネステッドプライマー類、およびPROMOTERFINDERライブラリ類(Clontech, Palo Alto CA)を用いて、ゲノムDNAをウォーキングし得る。この手順は、ライブラリ類をスクリーニングする必要がなく、イントロン/エキソン接合部の発見に有用である。全てのPCRベースの方法では、市販ソフトウェア、例えばOLIGO 4.06プライマー分析ソフトウェア(National Biosciences, Plymouth MN)或いは別の好適なプログラムを用いて、長さが約22〜30ヌクレオチド、GC含有率が約50%以上で、温度約68℃〜72℃で鋳型に対してアニーリングするように、プライマー群を設計し得る。
【0158】
完全長cDNA群をスクリーニングする際は、より大きなcDNA群を含むようにサイズ選択されたライブラリ群を用いるのが好ましい。更に、ランダムプライマーのライブラリ群は、しばしば遺伝子群の5'領域を有する配列を含み、オリゴd(T)ライブラリが完全長cDNAを作製できない状況に対して好適である。ゲノムライブラリ群は、5'非転写調節領域への、配列の伸長に有用であろう。
【0159】
市販のキャピラリー電気泳動システム群を用いて、シークエンシングまたはPCR産物のサイズを分析し、またはそのヌクレオチド配列を確認し得る。具体的には、キャピラリーシークエンシングは、電気泳動による分離のための流動性ポリマーと、4つの異なるヌクレオチドに特異的であるような、レーザーで活性化される蛍光色素と、発光された波長の検出に利用するCCDカメラとを有し得る。出力/光の強度は、適切なソフトウェア(Applied Biosystems社のGENOTYPER、SEQUENCE NAVIGATORなど)を用いて電気信号に変換し得る。サンプルのロードからコンピュータ分析および電子データ表示までの全プロセスがコンピュータ制御可能である。キャピラリー電気泳動法は、特定のサンプルに少量しか存在しないようなDNA小断片のシークエンシングに特に適している。
【0160】
本発明の別の実施態様では、GCRECをコードするポリヌクレオチドまたはその断片を、GCREC、その断片または機能的等価物を適切な宿主細胞内に発現させる組換えDNA分子にクローニングし得る。遺伝暗号固有の縮重により、実質的に同じ或いは機能的に等価のポリペプチドをコードする別のポリヌクレオチドを産生し、これらの配列をGCRECの発現に利用し得る。
【0161】
種々の目的で、GCRECをコードする配列群を改変するために、当分野で一般的に既知の複数の方法を用いて、本発明のポリヌクレオチド群を組換えることができる。この組換えの多様な目的には、遺伝子産物のクローン化の、あるいはプロセッシングおよび/または発現のモディフィケーションが含まれるが、これらに限定されるものではない。遺伝子断片と合成オリゴヌクレオチドとの、ランダムなフラグメンテーションおよびPCR再アセンブリによるDNAシャッフリングを用い、ヌクレオチド配列を組換え得る。例えば、オリゴヌクレオチドを介した部位特異的変異誘導を利用して、新規な制限部位の作製、グリコシル化パターンの改変、コドン優先の変更、スプライス変異体の生成などを起こす突然変異を導入し得る。
【0162】
本発明のヌクレオチドは、MOLECULARBREEDING (Maxygen Inc., Santa Clara CA; 米国特許第5,837,458号; Chang, C.-C. 他(1999) Nat. Biotechnol. 17:793-797; Christians, F.C. 他(1999) Nat. Biotechnol. 17:259-264; Crameri, A. 他(1996) Nat. Biotechnol. 14:315-319)などのDNAシャッフリング技術の対象となり得る。これにより、生物活性または酵素活性、あるいは他の分子や化合物と結合する能力など、GCRECの生物学的特性を改変あるいは改良し得る。DNAシャッフリングは、PCRを介する遺伝子断片組換えを用いて遺伝子変異体のライブラリを作製するプロセスである。ライブラリはその後、所望の特性を持つ遺伝子変異体群を同定する、選択またはスクリーニングの手順を経る。続いて、これら好適な変異体をプールし、更に反復してDNAシャッフリングおよび選択/スクリーニングを行い得る。かくして、「人工的な」育種および急速な分子の進化によって、多様な遺伝子が作られる。例えば、ランダムポイント突然変異を持つ単一の遺伝子の断片を組換えて、スクリーニングし、その後所望の特性が最適化されるまでシャッフリングし得る。あるいは、所定の遺伝子の断片群を同種または異種のいずれかから得た同一遺伝子ファミリーの相同遺伝子の断片と組換えて、自然に生じる複数遺伝子の遺伝多様性を、定方向の、制御可能な方法で最大化できる。
【0163】
別の実施態様では、GCRECをコードするポリヌクレオチドは、当分野で周知の化学的方法を用いて、全体或いは一部を合成可能である(例えば、Caruthers. M.H.他(1980) Nucleic Acids Symp. Ser. 7:215-223; および Horn, T.他(1980) Nucleic Acids Symp. Ser. 7:225-232を参照)。或いはGCREC自体またはその断片の合成に、当分野で既知の化学的方法を用い得る。例えば種々の液相または固相技術を用いてペプチド合成を行い得る(例えばCreighton, T. (1984) Proteins, Structures and Molecular Properties, WH Freeman, New York NY, 55-60ページ; および Roberge, J.Y.他(1995) Science 269:202-204を参照)。自動合成はABI 431Aペプチドシンセサイザ(Applied Biosystems)を用いて達成し得る。更に、GCRECのアミノ酸配列、または任意のその一部を、直接合成の際に改変することにより、及び/または他のタンパク質からの配列群または任意のその一部と組み合わせることにより、変異体ポリペプチドを作製、または、或る天然ポリペプチドの1配列を有するポリペプチドを作製し得る。
【0164】
このペプチドは分取用高速液体クロマトグラフィーで実質的に精製し得る(例えばChiez, R.M.およびF.Z. Regnier (1990) Methods Enzymol. 182:392-421参照)。この合成ペプチドの組成は、アミノ酸分析またはシークエンシングで確認できる(例えば前出のCreighton, 28-53ページを参照)。
【0165】
生物学的に活性なGCRECを発現させるために、GCRECをコードするポリヌクレオチドまたはその誘導体を好適な発現ベクターに挿入し得る。好適な発現ベクターとは、好適な宿主に挿入されたコーディング配列の転写および翻訳の制御に必要なエレメント群を持つベクターである。必要なエレメントとしては、ベクター内およびGCRECをコードするポリヌクレオチドにおける調節配列(例えばエンハンサー、構成型および発現誘導型のプロモーター、5'および3'の非翻訳領域など)が含まれる。必要なエレメント群は、強度および特異性が様々である。特異的な開始シグナル類を用いて、GCRECをコードするポリヌクレオチド群の、より効率的な翻訳を達成することもできる。開始シグナルの例には、ATG開始コドンと、コザック配列など近傍の配列とが含まれる。GCRECをコードするポリヌクレオチド配列、およびその開始コドンや、上流の調節配列が好適な発現ベクターに挿入された場合は、更なる転写制御シグナルや翻訳制御シグナルは必要ないこともある。しかしながら、コード配列あるいはその断片のみが挿入された場合は、インフレームATG開始コドンなど外来性の翻訳制御シグナルが発現ベクターに含まれるようにすべきである。外因性の翻訳エレメント群および開始コドン群は、様々な天然物および合成物を起源とし得る。用いられる特定の宿主細胞系に好適なエンハンサーを含めることで発現の効率を高めることが可能である(例えばScharf, D. 他(1994) Results Probl.Cell Differ. 20:125-162を参照)。
【0166】
当業者に周知の方法を用いて、GCRECをコードするポリヌクレオチドと、好適な転写および翻訳制御エレメントとを持つ発現ベクターを作製することが可能である。これらの方法としては、in vitro組換えDNA技術、合成技術、およびin vivo遺伝子組換え技術がある(例えばSambrook, J.他(1989) Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, Plainview NY, 4, 8, および 16-17章; Ausubel, F.M.他(1995)Current Protocols in Molecular Biology, John Wiley & Sons, New York NY, 9, 13, および 16章を参照)。
【0167】
種々の発現ベクター/宿主系を利用して、GCRECをコードするポリヌクレオチドの保持および発現が可能である。限定するものではないがこのような発現ベクター/宿主系には、組換えバクテリオファージ、プラスミドまたはコスミドDNA発現ベクターで形質転換させた細菌や、酵母菌発現ベクターで形質転換させた酵母菌など微生物や、ウイルス発現ベクター(例えばバキュロウイルス)に感染した昆虫細胞系や、ウイルス発現ベクター(例えばカリフラワーモザイクウイルス、CaMVまたはタバコモザイクウイルス、TMV)または細菌発現ベクター(例えばTiプラスミドまたはpBR322プラスミド)で形質転換させた植物細胞系、動物細胞系がある(例えば前出Sambrook; 前出Ausubel; Van Heeke, G. および S.M. Schuster (1989) J. Biol. Chem. 264:5503-5509; Engelhard, E.K. 他(1994) Proc. Natl. Acad. Sci. USA 91:3224-3227; Sandig, V.他(1996) Hum.Gene Ther. 7:1937-1945; Takamatsu, N.(1987) EMBO J. 6:307-311;『マグローヒル科学技術年鑑』(The McGraw Hill Yearbook of Science and Technology) (1992) McGraw Hill, New York NY, 191-196ページ; Logan, J. および T. Shenk (1984) Proc. Natl. Acad. Sci. USA 81:3655-3659; および Harrington, J.J. 他(1997) Nat. Genet. 15:345-355を参照)。レトロウイルス、アデノウイルス、ヘルペスウイルスまたはワクシニアウイルス由来の発現ベクター、または種々の細菌性プラスミド由来の発現ベクターを用いて、ポリヌクレオチドを標的器官、組織または細胞集団へ送達することができる(例えばDi Nicola, M.他(1998) Cancer Gen. Ther. 5(6):350-356; Yu, M.他 (1993) Proc. Natl. Acad. Sci. USA 90(13):6340-6344; Buller, R.M.他(1985) Nature 317(6040):813-815; McGregor, D.P.他(1994) Mol. Immunol. 31(3):219-226;並びにVerma, I.M.およびN. Somia (1997) Nature 389:239-242参照)。本発明は使用する宿主細胞によって限定されない。
【0168】
細菌系では、GCRECをコードするポリヌクレオチドの使用目的に応じて多数のクローニングベクターおよび発現ベクターを選択し得る。例えばGCRECをコードするポリヌクレオチドの慣例的なクローニング、サブクローニング、増殖には、PBLUESCRIPT(Stratagene, La Jolla CA)またはPSPORT1プラスミド(Invitrogen)などの多機能の大腸菌ベクターを用いることができる。GCRECをコードするポリヌクレオチドをベクターのマルチクローニング部位にライゲーションするとlacZ遺伝子が破壊され、組換え分子を含む形質転換された細菌の同定のための比色スクリーニング法が可能となる。更にこれらのベクターは、クローニングされた配列におけるin vitro転写、ジデオキシのシークエンシング、ヘルパーファージによる一本鎖のレスキュー、入れ子欠失の生成にも有用であろう(例えば、Van Heeke, G.およびS.M. Schuster(1989)J. Biol. Chem. 264:5503-5509を参照)。例えば抗体類の産生などに多量のGCRECが必要な場合は、GCRECのハイレベル発現を指示するベクター類が使用できる。例えば、強力な誘導SP6バクテリオファージプロモーターまたは誘導T7バクテリオファージプロモーターを持つベクターが使用できる。
【0169】
酵母の発現系を使用してGCRECを産出することもできる。α因子、アルコールオキシダーゼ、PGHプロモーターなど、構成型あるいは誘導型のプロモーターを持つ多数のベクターが、出芽酵母菌(Saccharomyces cerevisiae)またはピキア酵母(Pichia pastoris)内で使用可能である。更に、このようなベクターは、発現したタンパク質の、分泌か細胞内での保持かのどちらかを指示するものであり、安定した増殖のために宿主ゲノムの中に外来ポリヌクレオチド配列群を組み込むことを可能にする(例えば前出のAusubel, 1995; Bitter, G.A. 他(1987) Methods Enzymol.153:516-544; および Scorer, C.A.他(1994) Bio/Technology 12:181-184を参照)。
【0170】
植物系もGCRECの発現に用い得る。GCRECをコードするポリヌクレオチドの転写は、ウイルスプロモーター、例えば単独であるいはTMV由来のオメガリーダー配列と組み合わせて用いられるようなCaMV由来の35Sおよび19Sプロモーターによって促進し得る(Takamatsu, N.(1987)EMBO J 6:307-311)。あるいは、RuBisCOの小サブユニットなどの植物プロモーター、または熱ショックプロモーターを用い得る(例えばCoruzzi, G.他(1984) EMBO J. 3:1671-1680; Broglie, R.他(1984) Science 224:838-843; および Winter, J.他(1991) Results Probl.Cell Differ. 17:85-105を参照)。これらの作製物は、直接DNA形質転換により、または病原体を媒介とする形質移入により、植物細胞内に導入し得る(例えば『マグローヒル科学技術年鑑』(The McGraw Hill Yearbook of Science and Technology)(1992) McGraw Hill New York NY,191-196ページを参照)。
【0171】
哺乳動物細胞においては、多数のウイルスベースの発現系を利用し得る。アデノウイルスが発現ベクターとして用いられる場合、後期プロモーターと3連リーダー配列とからなるアデノウイルス転写/翻訳複合体に、GCRECをコードするポリヌクレオチド群をライゲーションし得る。アデノウイルスゲノムの非必須E1またはE3領域へ挿入することにより、宿主細胞内でGCRECを発現する感染ウイルスを得ることができる(例えばLogan, J.およびT. Shenk(1984)Proc. Natl. Acad. Sci. USA 81:3655-3659を参照)。更に、ラウス肉腫ウイルス(RSV)エンハンサーなどの転写エンハンサーを用いて、哺乳類宿主細胞における発現を増大させ得る。SV40またはEBVをベースにしたベクターを用いてタンパク質を高レベルで発現させることもできる。
【0172】
また、ヒト人工染色体(HAC)類を用いて、或るプラスミドに含まれ得る断片やプラスミドから発現し得る断片より大きなDNAの断片群を送達し得る。治療のために約6kb〜10MbのHACsが作製され、従来の送達方法(リポソーム、ポリカチオンアミノポリマー、またはベシクル)で送達されている(例えばHarrington, J.J.他(1997) Nat. Genet. 15:345-355を参照)。
【0173】
長期にわたり哺乳動物系内で組換えタンパク質を産生するためには、細胞株内の、GCRECの安定発現が望ましい。例えば、GCRECをコードするポリヌクレオチドを細胞株に形質転換するために、発現ベクター類と、同じベクター上の或いは別のベクター上の選択可能マーカー遺伝子とを用い得る。用いる発現ベクターは、ウイルス起源の複製要素、および/または内因性の発現要素を持ち得る。ベクターの導入後、選択培地に移す前に強化培地で約1〜2日間、細胞を増殖させ得る。選択可能マーカーの目的は選択剤への抵抗性を与えることであり、選択可能マーカーの存在により、導入した配列をうまく発現するような細胞の成長および回収が可能となる。安定的に形質転換された細胞の耐性クローンは、その細胞型に適した組織培養技術を用いて増殖できる。
【0174】
任意の数の選択系を用いて、形質転換細胞株を回収できる。限定するものではないがこのような選択系には、tk細胞のために用いられる単純ヘルペスウイルスのチミジンキナーゼ遺伝子と、apr細胞のために用いられる単純ヘルペスウイルスのアデニンホスホリボシルトランスフェラーゼ遺伝子がある(例えばWigler, M.他(1977) Cell 11:223-232; Lowy, I. 他(1980) Cell 22:817-823を参照)。また、選択の基礎として代謝拮抗物質、抗生物質あるいは除草剤への耐性を用いることができる。例えばdhfrはメトトレキセートに対する耐性を与え、neoはアミノグリコシドであるネオマイシンおよびG-418に対する耐性を与え、alsはクロルスルフロンに対する耐性を、patはホスフィノトリシンアセチルトランスフェラーゼに対する耐性を各々与える(例えばWigler, M.他(1980) Proc. Natl. Acad. Sci. USA 77:3567-3570; Colbere-Garapin, F.他(1981) J. Mol. Biol. 150:1-14を参照)。この他の選択可能な遺伝子(例えばtrpBおよびhisD、これらは代謝物のための、細胞の必要条件を改変)も、文献に記載がある(例えばHartman, S.C.およびR.C. Mulligan (1988) Proc. Natl. Acad. Sci. USA 85:8047-8051を参照)。可視マーカー類、例えばアントシアニンや、緑色蛍光タンパク質(GFP;Clontech)、βグルクロニダーゼおよびその基質であるβグルクロニド、またはルシフェラーゼおよびその基質であるルシフェリンを用い得る。これらのマーカーを用いて、トランスフォーマントを同定するだけでなく、特定のベクター系に起因する一過性あるいは安定したタンパク質発現を定量し得る(例えばRhodes, C.A. (1995) Methods Mol. Biol. 55:121-131を参照)。
【0175】
マーカー遺伝子発現の有無によって目的の遺伝子の存在が示唆されても、その遺伝子の存在および発現の確認が必要な場合もある。例えば、GCRECをコードする配列が或るマーカー遺伝子配列の中に挿入された場合、GCRECをコードするポリヌクレオチド群を有する形質転換された細胞群は、マーカー遺伝子機能の欠落により特定できる。または、単一プロモーターの制御下で、或るマーカー遺伝子を、GCRECをコードする1配列とタンデムに配置することもできる。誘導または選択に応答したマーカー遺伝子の発現は通常、タンデム遺伝子の発現も示す。
【0176】
一般に、GCRECをコードするポリヌクレオチドを持ち、GCRECを発現する宿主細胞は、当業者に周知の種々の方法を用いて特定できる。これらの方法には、DNA−DNA或いはDNA−RNAハイブリダイゼーションや、PCR法、核酸或いはタンパク質の検出及び/または数量化のための膜系、溶液ベース、或いはチップベースの技術を含むタンパク質生物学的試験法または免疫学的アッセイが含まれるが、これらに限定されるものではない。
【0177】
特異的ポリクローナル抗体または特異的モノクローナル抗体を用いてGCRECの発現の検出及び計測を行うための免疫学的方法は、当分野で既知である。このような技術の例としては、酵素に結合したイムノソルベントのアッセイ(ELISA)、ラジオイムノアッセイ(RIA)、蛍光活性化細胞選別(FACS)などを含む。GCREC上の2つの非干渉エピトープに反応するモノクローナル抗体群を用いた、2部位のモノクローナルベースイムノアッセイ(two-site, monoclonal-based immunoassay)が好ましいが、競合結合試験を用いることもできる。これらのアッセイおよび他のアッセイは、当分野で周知である(例えばHampton, R.他(1990) Serological Methods, a Laboratory Manual, APS Press, St. Paul MN, Sect.IV; Coligan, J.E.他(1997) Current Protocols in Immunology, Greene Pub.Associates and Wiley-Interscience, New York NY; および Pound, J.D. (1998) Immunochemical Protocols, Humana Press, Totowa NJを参照)。
【0178】
多岐にわたる標識方法および抱合方法が当業者に知られており、様々な核酸アッセイおよびアミノ酸アッセイにこれらの方法を用い得る。GCRECをコードするポリヌクレオチドに関連する配列を検出するための、標識されたハイブリダイゼーションプローブあるいはPCRプローブを生成する手段には、オリゴ標識化、ニックトランスレーション、末端標識化(エンドラベリング)、または標識されたヌクレオチドを用いるPCR増幅が含まれる。或いはGCRECをコードするポリヌクレオチド、またはその任意の断片を、mRNAプローブを生成するためのベクターにクローニングしうる。このようなベクターは、当分野において知られており、市販もされており、T7、T3またはSP6などの好適なRNAポリメラーゼおよび標識されたヌクレオチドを加えて、in vitroでRNAプローブの合成に用いることができる。これらの方法は、例えばAmersham Biosciences、Promega(Madison WI)、U.S. Biochemicalなどの種々の市販キットを用いて実行できる。検出を容易にするために用い得る好適なレポーター分子あるいは標識には、基質、補助因子、インヒビター、磁気粒子のほか、放射性核種、酵素、蛍光剤、化学発光剤、発色剤などがある。
【0179】
GCRECをコードするポリヌクレオチドで形質転換した宿主細胞を、細胞培地での該タンパク質の発現と回収とに好適な条件下で培養しうる。形質転換細胞から製造されたタンパク質が分泌されるか細胞内に留まるかは、使用される配列、ベクター、あるいはその両者に依存する。GCRECをコードするポリヌクレオチド群を持つ発現ベクター類は、原核細胞膜または真核細胞膜を透過してのGCRECの分泌を指示するシグナル配列群を持つように設計できることは、当業者には理解されよう。
【0180】
更に、宿主細胞株の選択は、挿入したポリヌクレオチドの発現をモジュレートする能力、または発現したタンパク質を所望の形に処理する能力によって行い得る。限定するものではないがこのようなポリペプチドの修飾には、アセチル化、カルボキシル化、グリコシル化、リン酸化、脂質化およびアシル化がある。タンパク質の「プレプロ」または「プロ」形を切断する翻訳後のプロセシングを利用して、タンパク質の標的への誘導、折りたたみ、および/または活性を特定することが可能である。翻訳後の活性のための、特定の細胞装置および特徴的な機序を持つ、種々の宿主細胞(例えばCHO、HeLa、MDCK、HEK293、WI38など)は、American Type Culture Collection(ATCC, Manassas, VA)から入手可能であり、外来タンパク質の正しい修飾およびプロセシングを確実にするように選択し得る。
【0181】
本発明の別の実施態様では、GCRECをコードする天然ポリヌクレオチド、修飾ポリヌクレオチド、または組換えポリヌクレオチドを或る異種配列に結合させ、上記した任意の宿主系内で、或る融合タンパク質の翻訳を生じ得る。例えば、市販の抗体によって認識できる異種部分を含むキメラGCRECタンパク質が、GCREC活性のインヒビターに対するペプチドライブラリのスクリーニングを促進し得る。また、異種タンパク質部分および異種ペプチド部分も、市販されている親和性マトリックスを用いて融合タンパク質の精製を促進し得る。限定されるものではないがこのような部分には、グルタチオンSトランスフェラーゼ(GST)、マルトース結合タンパク質(MBP)、チオレドキシン(Trx)、カルモジュリン結合ペプチド(CBP)、6-His、FLAG、c-myc、赤血球凝集素(HA)がある。GSTは固定化グルタチオン上で、MBPはマルトース上で、Trxはフェニルアルシンオキシド上で、CBPはカルモジュリン上で、そして6-Hisは金属キレート樹脂上で、同族の融合タンパク質の精製を可能にする。FLAG、c-mycおよび赤血球凝集素(HA)は、これらのエピトープ標識を特異的に認識する市販のモノクローナル抗体およびポリクローナル抗体を用いた、融合タンパク質の免疫親和性精製を可能にする。また、融合タンパク質が、GCRECをコードする配列と異種タンパク質配列との間にタンパク質分解切断部位を持つように遺伝子操作すると、精製後にGCRECが異種部分から切断され得る。融合タンパク質の発現および精製方法は、前出のAusubel(1995)10章に記載されている。市販されている種々のキットを用いて融合タンパク質の発現および精製を促進することもできる。
【0182】
別の実施態様では、TNTウサギ網状赤血球可溶化液またはコムギ胚芽抽出系(Promega)を用いてin vitroで、放射標識GCRECを合成しうる。これらの系は、T7、T3またはSP6プロモーターに機能的に連結したタンパク質コード配列群の、転写と翻訳とを共役させる。翻訳は、例えば35Sメチオニンのような放射能標識したアミノ酸前駆体の存在下で起こる。
【0183】
GCREC或いはその断片または変異体を用いて、GCRECに特異結合する化合物をスクリーニングすることができる。1つ以上の試験化合物を用いて、GCRECへの特異的な結合をスクリーニングすることが可能である。種々の実施態様で、1、2、3、4、5、10、20、50、100、または200個の試験化合物をGCRECへの特異結合につきスクリーニングできる。試験化合物の例として、抗体、anticalin、オリゴヌクレオチド、タンパク質(例えばリガンドや受容体)、または小分子が挙げられる。
【0184】
関連の実施態様で、GCREC変異体を用いて試験化合物たとえば抗体の、GCRECへの結合や、GCREC変異体へ、または組み合わせたGCRECおよび/または1つ以上のGCREC変異体への結合をスクリーニングできる。或る実施態様で或るGCREC変異体を用いて、GCREC変異体に結合するがSEQ ID NO:1-26の正確な配列を持つGCRECには結合しない化合物をスクリーニングできる。こうしたスクリーニングの実施に用いるGCREC変異体は、約50%〜約99%のGCRECへの配列同一性の範囲を持つ場合があり、種々の実施態様は60%、70%、75%、80%、85%、90%および95%の配列同一性を持ち得る。
【0185】
或る実施態様でGCRECへの特異結合スクリーニングで同定された化合物は、GCRECの天然リガンドに密接に関連する場合があり、例えばリガンドやその断片であり、または天然基質や、構造的または機能的な擬態物質(mimetic)、あるいは自然結合パートナーである(例えばColigan, J.E.他(1991) Current Protocols in Immunology 1(2):5章を参照)。別の実施態様では、こうして同定した化合物は、受容体GCRECの天然リガンドでありうる(例えばHoward, A.D. 他(2001) Trends Pharmacol.Sci.22:132-140; Wise, A. 他(2002) Drug Discovery Today 7:235-246を参照)。
【0186】
別の実施態様でGCRECへの特異結合スクリーニングで同定した化合物は、GCRECが結合する天然受容体に、或いは少なくとも該受容体の或る断片に、または例えばリガンド結合部位や結合ポケットの全体または一部を含む該受容体の或る断片に、密接に関連し得る。例えば該化合物は、シグナルを伝播可能なGCREC受容体の場合や、シグナルを伝播できないGCRECおとり受容体の場合がある(Ashkenazi, A. およびV.M. Divit (1999) Curr. Opin. Cell Biol.11:255-260; Mantovani, A. 他(2001) Trends Immunol. 22:328-336)。該化合物は既知の技術を用いて合理的に設計できる。こうした技術の例としては、化合物エタネルセプト(etanercept)(ENBREL; Immunex Corp., Seattle WA)作製に用いた技術を含む。エタネルセプトは、ヒトのリウマチ様関節炎の治療に有効である。エタネルセプトは遺伝子操作されたp75腫瘍壊死因子(TNF)受容体ダイマーであり、ヒトIgG1 のFc部分に連結されている(Taylor, P.C. 他(2001) Curr. Opin. Immunol. 13:611-616)。
【0187】
1つの実施態様で、2種以上の、同様のまたは或いは異なる特異性を持つ抗体を、GCRECまたはその断片あるいは変異体への特異結合につきスクリーニングできる。こうしてスクリーニングした抗体の結合特異性を選択し、GCRECの特定の断片または変異体を同定できる。1つの実施態様で、GCRECの特定の断片または変異体を優先的に同定できる結合特異性を持つ抗体を選択できる。別の実施態様で、GCREC産生の増加、低下、或いは異常を有する特定の疾患または病状を優先的に診断できる結合特異性を持つ抗体を選択できる。
【0188】
1つの実施態様で、anticalinを、GCRECまたはその断片あるいは変異体への特異結合につきスクリーニングできる。anticalinはリガンド結合タンパクであり、リポカリンの足場を元に構築されている(Weiss, G.A. and H.B. Lowman (2000) Chem. Biol. 7:R177-R184; Skerra, A. (2001) J. Biotechnol. 74:257-275)。リポカリン類のタンパク構造には8本鎖逆平行βストランドを持つ或るβバレルを含むことがあり、このバレルはその開放端で4つのループを支持する。これらのループはリポカリンの天然リガンド結合部位を形成する。この部位をin vitroアミノ酸置換で再操作し、新規な結合特異性を与えうる。アミノ酸置換には当分野で既知のまたは本明細書に記載の方法を利用でき、保存的置換(例えば結合特異性を変えない置換)または、結合特異性を軽度、中等度、または大きく変える置換を含みうる。
【0189】
一実施態様では、GCRECに特異的に結合、もしくは刺激または阻害する化合物のスクリーニングには、分泌タンパク質或いは細胞膜上のタンパク質の何れか一方としてGCRECを発現する適切な細胞の作製が含まれる。好適な細胞には、哺乳類、酵母、ショウジョウバエ、または大腸菌からの細胞が含まれる。GCRECを発現する細胞、またはGCRECを含有する細胞膜断片を試験化合物と接触させて、結合や、GCRECまたは該化合物の何れかの、刺激または活性の阻害を分析する。
【0190】
或るアッセイは、単に試験化合物をポリペプチドに実験的に結合させ、結合を、フルオロフォア、放射性同位体、酵素抱合体またはその他の検出可能な標識により検出することができる。例えば、このアッセイは、少なくとも1つの試験化合物を、溶液中の、あるいは固体支持物に固定されたGCRECと混合するステップと、GCRECとこの化合物との結合を検出するステップを含み得る。別法では、標識された競合物の存在下での試験化合物の結合の検出および測定を行うことができる。更にこのアッセイでは、無細胞再構成標本、化学ライブラリまたは天然産物の混合物を用いて実施することができ、試験化合物は、溶液中で遊離させるか固体支持体に固定させる。
【0191】
アッセイを用いて、或る化合物が、その天然リガンドに結合する能力、および/または、その天然リガンドの、その天然受容体への結合を阻害する能力を評価しうる。こうしたアッセイの例としては、米国特許第5,914,236号および第6,372,724号に記載されたような放射ラベルアッセイを含む。関連した実施態様では、1つ以上のアミノ酸置換が或るポリペプチド化合物(受容体など)に導入され、その天然リガンドに結合する能力を向上または改変しうる(例えばMatthews, D.J. および J.A. Wells. (1994) Chem. Biol. 1:25-30を参照)。別の関連した実施態様では、1つ以上のアミノ酸置換が或るポリペプチド化合物(リガンドなど)に導入され、その天然受容体に結合する能力を向上または改変しうる(例えばCunningham, B.C. および J.A. Wells (1991) Proc. Natl. Acad. Sci. USA 88:3407-3411; Lowman, H.B. 他(1991) J. Biol. Chem. 266:10982-10988を参照)。
【0192】
GCREC或いはその断片または変異体を用いて、GCRECの活性をモジュレートする化合物をスクリーニングしうる。このような化合物としては、アゴニスト、アンタゴニスト、部分的アゴニストまたは逆アゴニストなどが含まれ得る。一実施例では、GCRECの活性が許容される条件下でアッセイを実施し、そのアッセイでは少なくとも1つの試験化合物をGCRECと混合し、試験化合物の存在下でのGCRECの活性を試験化合物不在下でのGCRECの活性と比較する。試験化合物の存在下でのGCRECの活性の変化は、GCRECの活性をモジュレートする化合物の存在を示唆する。別法では、試験化合物を、GCRECの活性に適した条件下で、GCRECを有するin vitro系すなわち無細胞系と混合してアッセイを実施する。これらアッセイの何れにおいても、GCRECの活性をモジュレートする試験化合物は間接的にモジュレートする場合があり、その際は試験化合物と直接接触する必要がない。少なくとも1つ、または複数の試験化合物をスクリーニングすることができる。
【0193】
別の実施例では、胚性幹細胞(ES細胞)における相同組換えを用いて動物モデル系内で、GCRECまたはその哺乳動物相同体をコードするポリヌクレオチドを「ノックアウト」する。このような技術は当技術分野において周知であり、ヒト疾患動物モデルの作製に有用である(米国特許第5,175,383号および第5,767,337号などを参照)。例えば129/SvJ細胞系などのマウスES細胞は初期のマウス胚に由来し、培地で増殖させることができる。このES細胞は、ネオマイシンホスホトランスフェラーゼ遺伝子(neo: Capecchi, M.R.(1989)Science 244:1288-1292)などのマーカー遺伝子で破壊した、目的の遺伝子を持つベクターで形質転換する。このベクターは、相同組換えにより、宿主ゲノムの対応する領域に組込まれる。或いは、Cre-loxP系を用いて相同組換えを行い、組織特異的または発生段階特異的に目的遺伝子をノックアウトする(Marth, J.D. (1996) Clin. Invest. 97:1999-2002; Wagner, K.U.他(1997) Nucleic Acids Res. 25:4323-4330)。形質転換したES細胞を同定し、例えばC57BL/6マウス株などから採取したマウス細胞胚盤胞に微量注入する。これらの胚盤胞を偽妊娠メスに外科的に導入し、得られるキメラ子孫の遺伝形質を特定し、これらを交配させてヘテロ接合性系またはホモ接合性系を作製する。このようにして作製した遺伝子組換え動物は、潜在的な治療薬や毒性薬物で検査されうる。
【0194】
GCRECをコードするポリヌクレオチドをin vitroでヒト胚盤胞由来のES細胞において操作することが可能である。ヒトES細胞は、内胚葉、中胚葉および外胚葉の細胞タイプを含む、少なくとも8つの別々の細胞系統に分化する可能性を有する。これらの細胞系統は、例えば神経細胞、造血系統および心筋細胞に分化する(Thomson, J.A.他(1998) Science 282:1145-1147)。
【0195】
GCRECをコードするポリヌクレオチドを用いて、ヒト疾患をモデルとした「ノックイン」ヒト化動物(ブタ)または遺伝子組換え動物(マウスまたはラット)を作製することが可能である。ノックイン技術を用いて、GCRECをコードするポリヌクレオチドの或る領域を動物ES細胞に注入し、注入した配列を動物細胞ゲノムに組み込ませる。形質転換細胞を胞胚に注入し、胞胚を上記のように移植する。遺伝子組換え子孫または近交系について試験し、潜在的医薬品を用いて処理し、ヒトの疾患の治療に関する情報を得る。別法で例えばGCRECを乳汁中に分泌するなどGCRECを過剰発現する哺乳類近交系は、このタンパク質の簡便な源泉となり得る(Janne, J. 他(1998) Biotechnol. Annu. Rev. 4:55-74)。
【0196】
(治療)
化学的及び構造的類似性、例えば配列及びモチーフとの関連における類似性が、GCRECの領域とGタンパク質共役受容体間に存在する。またGCRECを発現する組織の数例は、表6を見られたい。なおGCRECはまた前頭皮質組織および罹患軟骨組織と密に関連する。従ってGCRECは、嗅覚神経障害、細胞増殖異常、神経疾患、心血管障害、胃腸障害、自己免疫/炎症疾患、代謝障害並びにウイルス感染において或る役割を果たすと考えられる。GCRECの発現若しくは活性の増大に関連する疾患の治療においては、GCRECの発現または活性を低下させることが望ましい。また、GCRECの発現または活性の低下に関連する疾患の治療においては、GCRECの発現または活性を亢進させることが望ましい。
【0197】
従って一実施態様において、GCRECの発現または活性の低下に関連した疾患の治療または予防のために、患者にGCRECまたはその断片や誘導体を投与しうる。限定するものではないが、このような疾患の例には神経性嗅覚喪失があり、これには3つのタイプがある。輸送ロスを生じる病状としては、急性ウイルス性上気道感染、細菌性鼻炎、アレルギー性鼻炎、細菌性副鼻腔炎、および、種々の粘膜分泌異常があり、これらは嗅膜への匂い物質の接近を妨げる。感覚性嗅覚喪失の原因は嗅膜の破壊であり、これはウイルス感染、新生物、毒性化学物質の吸入、薬物、および頭部への放射線療法で起きる。神経性嗅覚喪失は頭部外傷、パーキンソン病、アルツハイマー病、コルサコフ精神病、ビタミンB12欠損、前頭蓋窩の新生物、先天性疾患で生じ、また薬剤たとえばエタノール、アンフェタミン、局所コカイン、アミノグリコシド、テトラサイクリンおよび喫煙による神経毒性の結果として生じる。内分泌障害たとえばクッシング症候群、甲状腺機能低下、および糖尿病は、匂いの知覚に影響しうる。下前頭部の髄膜腫が嗅覚喪失の最頻な腫瘍性の原因であるが、無嗅覚はまた下垂体腺腫、鞍上髄膜腫(suprasellar meningiomas)での転移、および前部ウィリス輪の動脈瘤の結果としても生じる。これらの腫瘍と過誤腫とは、幻嗅を伴う発作を誘発しうる。どの心理物理的方法も感覚性と神経性との嗅覚喪失を区別できず、どの利用可能な治療も感覚神経性嗅覚喪失への効力を実証していない。GCRECの活性または発現の低下に伴う疾患の更なる例には細胞増殖異常、神経疾患、心血管疾患、胃腸疾患、自己免疫/炎症疾患、代謝障害およびウイルス感染が含まれ、細胞増殖異常には日光角化症、アテローム動脈硬化、滑液包炎、硬変、肝炎、混合型結合織病(MCTD)、骨髄線維症、発作性夜間ヘモグロビン尿症、真性多血症、乾癬、原発性血小板血症、並びに、腺癌、白血病、リンパ腫、黒色腫、骨髄腫、肉腫、及び奇形癌、具体的には、副腎、膀胱、骨、骨髄、脳、乳房、頚部、胆嚢、神経節、消化管、心臓、腎臓、肝臓、肺、筋肉、卵巣、膵臓、副甲状腺、陰茎、前立腺、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、子宮の癌がある。神経疾患には、癲癇、虚血性脳血管障害、脳卒中、大脳新生物、アルツハイマー病、ピック病、ハンチントン病、痴呆、パーキソン病及びその他の錐体外路障害、筋萎縮性側索硬化及びその他の運動ニューロン障害、進行性神経性筋萎縮症、色素性網膜炎(網膜色素変性)、遺伝性運動失調、多発性硬化症及び他の脱髄疾患、細菌性及びウイルス性髄膜炎、脳膿瘍、硬膜下蓄膿症、硬膜外膿瘍、化膿性頭蓋内血栓性静脈炎、脊髄炎及び神経根炎、ウイルス性中枢神経系疾患と、クールー及びクロイツフェルト‐ヤコブ病、Gerstmann-Straussler-Scheinker症候群を含むプリオン病と、致死性家族性不眠症、神経系性栄養病及び代謝病、神経線維腫症、結節硬化症、小脳網膜血管芽腫(cerebelloretinal hemangioblastomatosis)、脳3叉神経血管症候群、精神遅滞及び他の中枢神経系発達障害、脳性麻痺、神経骨格異常症、自律神経系障害、脳神経疾患、背髄病、筋ジストロフィなど神経筋障害、末梢神経疾患、皮膚筋炎及び多発性筋炎と、遺伝性、代謝性、内分泌性、及び中毒性ミオパシーと、重症筋無力症、周期性四肢麻痺と、気分性及び不安性の障害、分裂病(統合失調症)性疾患を含む精神障害と、季節性障害(SAD)と、静座不能、健忘症、緊張病、糖尿病性ニューロパシー、遅発性ジスキネジア、ジストニー、パラノイド精神病、帯状疱疹後神経痛、及びトゥーレット病と、進行性核上麻痺、皮質基底核変性、家族性前頭側頭型痴呆がある。心血管疾患には、動静脈瘻、アテローム硬化、高血圧、脈管炎、レイノー病、動脈瘤、動脈解離、静脈瘤、血栓静脈炎及び静脈血栓、血管の腫瘍や、血栓溶解、バルーン血管形成、血管置換および冠動脈バイパス移植術の合併症や、うっ血性心不全、虚血性心疾患、狭心症、心筋梗塞、高血圧性心疾患、変性弁膜性心疾患、石灰化大動脈弁狭窄症、先天性二尖大動脈弁、僧帽弁輪部石灰化、僧帽弁逸脱、リウマチ熱、リウマチ性心疾患、感染性心内膜炎、非細菌性血栓性心内膜炎、全身性エリテマトーデスの心内膜炎、カルチノイド心疾患、心筋症、心筋炎、心膜炎、腫瘍性心疾患、先天性心臓疾患、及び心移植合併症がある。胃腸障害には嚥下障害、消化性食道炎、食道痙攣、食道狭窄、食道癌、消化不良、消化障害、胃炎、胃癌、食欲不振、悪心、嘔吐、胃不全麻痺、洞または幽門の浮腫、腹部アンギナ、胸焼け、胃腸炎、イレウス、腸管感染、消化性潰瘍、胆石症、胆嚢炎、胆汁うっ滞、膵臓炎、膵臓癌、胆道疾患、肝炎、高ビリルビン血症、硬変症、肝臓の受動性うっ血、ヘパトーム、感染性大腸炎、潰瘍性結腸炎、潰瘍性直腸炎、クローン病、ホイップル病、マロリー‐ヴァイス症候群、結腸癌、結腸閉塞、過敏性腸症候群、短小腸症候群、下痢、便秘、胃腸出血、及び後天性免疫不全症候群(AIDS)腸症、黄疸、肝性脳症、肝腎症候群、脂肪肝、血色素症、ウィルソン病、α-1-アンチトリプシン欠損症、ライ症候群、原発性硬化性胆管炎、肝梗塞、門脈循環閉塞及び血栓、小葉中心壊死、肝臓紫斑病、肝静脈血栓、肝静脈閉塞症、静脈閉塞病、子癇前症、子癇、妊娠性急性脂肪肝、妊娠性肝臓内胆汁うっ滞と、結節過形成及び腺腫、癌腫を含む肝癌がある。自己免疫/炎症疾患には後天性免疫不全症候群(AIDS)、アジソン病(慢性原発性副腎機能不全)、成人呼吸窮迫症候群、アレルギー、強直性脊椎炎、アミロイド症、貧血、喘息、アテローム性動脈硬化症、自己免疫性溶血性貧血、自己免疫性甲状腺炎、自己免疫性多腺性内分泌カンジダ症外胚葉ジストロフィ(APECED)、気管支炎、胆嚢炎、接触皮膚炎、クローン病、アトピー性皮膚炎、皮膚筋炎、糖尿病、肺気腫、リンパ球傷害因子性偶発性リンパ球減少、胎児赤芽球症(新生児溶血性疾患)、結節性紅斑、萎縮性胃炎、糸球体腎炎、グッドパスチャー症候群、痛風、グレーブス病、橋本甲状腺炎、過好酸球増加症、過敏性腸症候群、多発性硬化症、重症筋無力症、心筋または心膜炎、骨関節炎、骨粗しょう症、膵炎、多発性筋炎、乾癬、ライター症候群、リウマチ様関節炎、強皮症、シェーグレン症候群、全身性アナフィラキシー、全身性エリテマトーデス、全身性硬化症、血小板減少性紫斑病、潰瘍性大腸炎、ぶどう膜炎、ウェルナー症候群、癌・血液透析・体外循環の合併症、ウイルス感染症、細菌感染症、真菌感染症、寄生虫感染症、原虫感染症、蠕虫感染症、外傷がある。代謝障害には糖尿病、肥満症および骨粗鬆症がある。またウイルス病原体感染症を含み、病原体はアデノウイルス、アレナウイルス、ブンヤウイルス、カリチウイルス、コロナウイルス、フィロウイルス、ヘパドナウイルス、ヘルペスウイルス、フラビウイルス、オルトミクソウイルス、パルボウイルス、パポーバウイルス、パラミクソウイルス、ピコルナウイルス、ポックスウイルス、レオウイルス、レトロウイルス、ラブドウイルス、トガウイルス(tongavirus)に分類される。
【0198】
別の実施例では、GCRECまたはその断片や誘導体を発現し得るベクターを患者に投与して、限定するものではないが上記した疾患を含むGCRECの発現または活性の低下に関連した疾患を治療または予防することも可能である。
【0199】
更に別の実施例では、実質的に精製されたGCRECを含む成分を好適な医薬用キャリアーと共に患者に投与して、限定するものではないが上記した疾患を含むGCRECの発現または活性の低下に関連した疾患を治療または予防することも可能である。
【0200】
更に別の実施例では、GCRECの活性を調節するアゴニストを患者に投与して、限定するものではないが上記した疾患を含むGCRECの発現または活性の低下に関連した疾患を治療または予防することも可能である。
【0201】
更に別の実施例では、患者にGCRECのアンタゴニストを投与して、GCRECの発現または活性の増大に関連した疾患を治療または予防することが可能である。限定するものではないが、このような疾患の例には、上記した嗅覚神経障害、細胞増殖異常、神経疾患、心血管障害、胃腸障害、自己免疫/炎症性疾患、代謝障害、および、ウイルス感染症が含まれる。一態様では、GCRECと特異的に結合する抗体が、アンタゴニストとして直接、或いはGCRECを発現する細胞または組織に薬剤を運ぶターゲッティング機構或いは送達機構として間接的に、用いられ得る。
【0202】
別の実施例では、GCRECをコードするポリヌクレオチドの相補体を発現するベクターを患者に投与して、限定するものではないが上記した疾患を含むGCRECの発現または活性の増大に関連した疾患を治療または予防することも可能である。
【0203】
別の実施態様では、任意のタンパク質、アゴニスト、アンタゴニスト、相補配列、またはベクター実施態様を、別の適切な治療薬と組合せて投与できる。併用療法で用いる好適な治療薬は、当業者が従来の医薬原理に従って選択し得る。治療薬と組合せることにより、上記した種々の疾患の治療または予防に相乗効果をもたらし得る。この方法により、少量の各薬物で医薬効果をあげることが可能となり、それによって副作用の可能性を低減し得る。
【0204】
GCRECのアンタゴニストは、本技術分野で一般的に知られている方法を用いて製造し得る。 具体的には、精製されたGCRECを用いて抗体を作るか、治療薬のライブラリをスクリーニングして、GCRECと特異結合するものを同定することが可能である。GCRECの抗体も、本技術分野で一般的に知られている方法を用いて製造することが可能である。 限定するものではないがこのような抗体には、ポリクローナル抗体、モノクローナル抗体、キメラ抗体、一本鎖抗体、Fab断片及びFab発現ライブラリによって作られた断片が含まれ得る。中和抗体(すなわち二量体の形成を阻害する抗体)は通常、治療用に好適である。一本鎖抗体(例えば由来はラクダまたはラマ)は強力な酵素阻害剤である可能性があり、ペプチド擬態物質の設計において利点を持つようであり、免疫吸着剤とバイオセンサーとの開発においても利点を持つようである(Muyldermans, S. (2001) J. Biotechnol. 74:277-302)。
【0205】
抗体の産生のためには、ヤギ、ウサギ、ラット、マウス、ラクダ、ヒトコブラクダ、ラマ、ヒト及びその他のものを含む種々の宿主が、GCREC または任意の断片、または免疫原性の特性を備えるそのオリゴペプチドの注入によって免疫化され得る。宿主の種に応じて、種々のアジュバントを用いて免疫応答を高めることもできる。限定するものではないがこのようなアジュバントには、フロイントアジュバントと、水酸化アルミニウムなどのミネラルゲルアジュバントと、リゾレシチン、プルロニックポリオル、ポリアニオン、ペプチド、油性乳剤、スカシガイのヘモシアニン(KLH)、ジニトロフェノールなどの界面活性剤とがある。ヒトに用いられるアジュバントの中では、BCG(カルメット‐ゲラン杆菌)およびコリネバクテリウム‐パルバム(Corynebacterium parvum)が特に好ましい。
【0206】
GCRECに対する抗体を誘導するために用いるオリゴペプチド、ペプチドまたは断片は、少なくとも約5のアミノ酸からなり、一般的には少なくとも約10のアミノ酸からなるアミノ酸配列を有するものが好ましい。これらのオリゴペプチド、ペプチドまたは断片はまた、天然のタンパク質のアミノ酸配列の一部と同一であることが望ましい。GCRECアミノ酸の短い伸長部は、別のタンパク質、例えばスカシガイのヘモシニアンの配列と融合し、キメラ分子に対する抗体が産生され得る。
【0207】
GCRECに対するモノクローナル抗体は、抗体分子を産生する任意の技術を用いて、培地内の連続した細胞株によって作製し得る。限定するものではないがこのような技術には、ハイブリドーマ技術、ヒトB細胞ハイブリドーマ技術、およびEBV-ハイブリドーマ技術がある(例えばKohler, G.他(1975) Nature 256:495-497; Kozbor, D.他(1985) J. Immunol. Methods 81:31-42; Cote, R.J.他 (1983) Proc. Natl. Acad. Sci. USA 80:2026-2030; および Cole, S.P.他(1984) Mol.Cell Biol. 62:109-120を参照)。
【0208】
更に、ヒト抗体遺伝子にマウス抗体遺伝子をスプライシングするなどの「キメラ抗体」作製のために開発した技術が、好適な抗原特異性及び生物学的活性を備える分子を得るために用いられる(例えばMorrison, S.L.他(1984) Proc. Natl. Acad. Sci. USA 81:6851-6855; Neuberger, M.S. 他(1984) Nature 312:604-608; および Takeda, S.他(1985) Nature 314:452-454を参照)。別法では、一本鎖抗体の産生のための記載された技術を適用し、当分野で既知の方法を用いて、GCREC特異的一本鎖抗体を産生する。関連した特異性を有するがイディオタイプ組成が異なるような抗体を、ランダムな組合せの免疫グロブリンライブラリ類からチェーンシャッフリングによって産生することもできる(例えばBurton D.R.(1991)Proc. Natl. Acad. Sci. USA 88:10134-10137を参照)。
【0209】
抗体類の産生は、リンパ球集団におけるin vivo産生の誘導によって、或いは文献に開示されているように非常に特異的な結合試薬の免疫グロブリンのライブラリ類またはパネル類のスクリーニングによっても行い得る(例えばOrlandi, R.他(1989) Proc. Natl. Acad. Sci. USA 86:3833-3837; Winter, G.他(1991) Nature 349:293-299を参照)。
【0210】
GCRECに対する特異結合部位を持つ抗体断片をも産生し得る。例えば、限定するものではないが、このような断片には、抗体分子のペプシン消化によって作製されるF(ab')2 断片と、F(ab')2 断片のジスルフィド架橋を還元することによって作製されるFab断片とがある。あるいは、Fab発現ライブラリを作製することによって、所望の特異性を持つモノクローナルFab断片を迅速且つ容易に同定することが可能となる(例えばHuse, W.D.他(1989) Science 246:1275-1281を参照)。
【0211】
種々の免疫学的検定(イムノアッセイ)を用いてスクリーニングすることにより、所望の特異性を有する抗体を同定し得る。確立された特異性を有するポリクローナル抗体またはモノクローナル抗体の何れかを用いる免疫放射定量測定法または競合結合アッセイに対する数々のプロトコルは、本技術分野において公知である。このようなイムノアッセイは通常、GCRECとその特異抗体との間の複合体形成の計測を含む。2つの非干渉性GCRECエピトープに対して反応性を持つモノクローナル抗体群を用いる、2部位モノクローナルベースのイムノアッセイが一般に利用されるが、競合結合試験も利用できる(Pound、前出)。
【0212】
ラジオイムノアッセイ技術と共にScatchard分析などの様々な方法を用いて、GCRECに対する抗体の親和性を評価し得る。親和性を結合定数Kaで表す。Kaの定義は、平衡状態下の、GCREC抗体複合体のモル濃度を、遊離抗体と遊離抗原とのモル濃度で除して得られる値である。ポリクローナル抗体類は多様なGCRECエピトープに対する親和性が不均一であり、或るポリクローナル抗体製剤に関して判定したKaは、GCREC抗体群の平均の親和性または結合活性を表す。モノクローナル抗体は或る特定のGCRECエピトープに対して単一特異的であり、モノクローナル抗体の或る製剤について判定したKaは、親和性の真の測定値を表す。Ka値が10〜1012L/molの高親和性抗体製剤は、GCREC-抗体複合体が激しい操作に耐えなければならないイムノアッセイに用いるのが好ましい。Ka値が10〜10liter/molの低親和性抗体製剤は、GCRECが抗体から最終的に(好ましくは活性化状態で)解離する必要がある免疫精製(immunopurification)および類似の処理に用いるのが好ましい(Catty, D.(1988)Antibodies, Volume I: A Practical Approach, IRL Press, Washington, DC; Liddell, J. E. および Cryer, A.(1991)A Practical Guide to Monoclonal Antibodies, John Wiley & Sons, New York NY)。
【0213】
ポリクローナル抗体製剤の抗体価および結合活性を更に評価して、後に使う或る適用例に対するこのような製剤の品質および適性を決定することができる。例えば、少なくとも1〜2mg/mlの特異的な抗体、好ましくは5〜10mg/mlの特異的な抗体を含むポリクローナル抗体製剤は一般に、GCREC-抗体複合体を沈殿させなければならない処理に用いられる。抗体の特異性、抗体価、結合活性、様々な適用例における抗体の品質や使用に対する指針については、一般に入手可能である(例えば前出のCatty、同Coligan 他を参照)。
【0214】
本発明の別の実施態様では、GCRECをコードするポリヌクレオチド、またはその任意の断片や相補配列を、治療目的で使用できる。或る態様では、GCRECをコードする遺伝子のコーディング領域や調節領域に相補的な配列やアンチセンス分子(DNA、RNA、PNA、または修飾したオリゴヌクレオチド)を設計して遺伝子発現をモディフィケーションし得る。このような技術は当分野では周知であり、アンチセンスオリゴヌクレオチドまたはより大きな断片を、GCRECをコードする配列の制御領域、またはコード領域に沿った、さまざまな位置から設計可能である(例えばAgrawal, S.,編集(1996)Antisense Therapeutics, Humana Press Inc., Totawa NJを参照)。
【0215】
治療に用いる場合、アンチセンス配列を適切な標的細胞に導入するのに好適な、任意の遺伝子送達系を用いることができる。アンチセンス配列は、転写時に標的タンパク質をコードする細胞配列の少なくとも一部に相補的な配列を作製する発現プラスミドの形で、細胞内に送達し得る(例えばSlater, J.E. 他(1998) J. Allergy Clin. Immunol. 102(3):469-475;およびScanlon, K.J.他(1995) 9(13):1288-1296を参照)。アンチセンス配列はまた、例えばレトロウイルスやアデノ随伴ウイルスベクターなどのウイルスベクターを用いて細胞内に導入することもできる(例えばMiller, A.D.(1990)Blood 76:271、前出のAusubel、Uckert, W.およびW. Walther(1994)Pharmacol. Ther. 63(3):323-347を参照)。その他の遺伝子送達機構には、リポソーム系、人工的なウイルスエンベロープおよび当分野で公知のその他のシステムが含まれる(例えばRossi, J.J.(1995)Br. Med. Bull. 51(1):217-225; Boado、R.J.他(1998) J. Pharm. Sci. 87(11):1308-1315、Morris, M.C.他(1997) Nucleic Acids Res. 25(14):2730-2736を参照)。
【0216】
本発明の別の実施態様では、GCRECをコードするポリヌクレオチドを、体細胞若しくは生殖細胞の遺伝子治療に用い得る。遺伝子治療により、(i)遺伝子欠損症を治療し(例えばX染色体連鎖遺伝(Cavazzana-Calvo, M.他(2000) Science 288:669-672)により特徴付けられる重症複合型免疫不全(SCID)-X1病の場合)、先天性アデノシンデアミナーゼ(ADA)欠損症に関連する重症複合型免疫不全症候群(Blaese, R.M. 他(1995) Science 270:475-480; Bordignon, C.他(1995) Science 270:470-475)、嚢胞性繊維症(Zabner, J.他(1993) Cell 75:207-216; Crystal, R.G.他(1995) Hum.Gene Therapy 6:643-666; Crystal, R.G.他(1995) Hum.Gene Therapy 6:667-703)、サラセミア(thalassamia)、家族性高コレステロール血症や、第8因子若しくは第9因子欠損に起因する血友病(Crystal, R.G. (1995) Science 270:404-410、Verma, I.M. および N. Somia (1997) Nature 389:239-242)、(ii)条件的致死性遺伝子産物を発現させ(例えば制御不能な細胞増殖に起因する癌の場合)、(iii)細胞内の寄生生物、例えばヒト免疫不全ウイルス(HIV)(Baltimore, D. (1988) Nature 335:395-396、Poeschla, E.他(1996) Proc. Natl. Acad. Sci. USA. 93:11395-11399)などヒトレトロウイルス、B型若しくはC型肝炎ウイルス(HBV、HCV)、Candida albicansおよびParacoccidioides brasiliensis等の寄生真菌、並びに熱帯熱マラリア原虫およびクルーズトリパノソーマ等の寄生原虫に対する防御機能を有するタンパク質を発現できる。GCRECの発現若しくは調節に必要な遺伝子の欠損が疾患を引き起こす場合、導入した細胞の好適な集団からGCRECを発現させて、遺伝子欠損によって起こる症状の発現を緩和することが可能である。
【0217】
本発明の更なる実施態様では、GCRECの欠損による疾患や障害を、GCRECをコードする哺乳類発現ベクターを作製し、これらのベクターを機械的手段によってGCREC欠損細胞に導入することによって治療する。in vivoあるいはex vitroの細胞に用いる機械的導入技術には、(i)個々の細胞内への直接的なDNA微量注射法、(ii)遺伝子銃、(iii)リポソームを介した形質移入、(iv)受容体を介した遺伝子導入、および(v)DNAトランスポゾンの使用がある(Morgan, R.A. および W.F. Anderson(1993)Annu. Rev. Biochem. 62:191-217、Ivics, Z.(1997)Cell 91:501-510; Boulay, J-L. およびH. Recipon(1998)Curr. Opin. Biotechnol. 9:445-450)。
【0218】
GCRECの発現に有効であり得る発現ベクターの例として、限定するものではないがpcDNA 3.1、EpiTag、pRcCMV2、pREP、pVAX、pCR2-TOPOTAベクター(Invitrogen, Carlsbad CA)、pCMV-Script、pCMV-Tag、PEGSH/PERV(Stratagene, La Jolla CA)およびPTET-OFF、PTET-ON、PTRE2、PTRE2-LUC、PTK-HYG(Clontech, Palo Alto CA)が挙げられる。GCRECを発現させるために、(i)構成的に活性なプロモーター(例えば、サイトメガロウイルス(CMV)、ラウス肉腫ウイルス(RSV)、SV40ウイルス、チミジンキナーゼ(TK)、若しくはβ−アクチンの遺伝子など)、(ii)誘導性プロモーター(例えば、市販されているT-REXプラスミド(Invitrogen)に含まれている、テトラサイクリン調節性プロモーター(Gossen, M. および H. Bujard (1992) Proc. Natl. Acad. Sci. U.S.A. 89:5547-5551; Gossen, M. 他(1995) Science 268:1766-1769; Rossi, F.M.V. および H.M. Blau (1998) Curr. Opin. Biotechnol. 9:451-456)、エクジソン誘導性プロモーター(市販されているプラスミドPVGRXRおよびPINDに含まれている:Invitrogen)、FK506/ラパマイシン誘導性プロモーター、またはRU486/ミフェプリストーン誘導性プロモーター(Rossi, F.M.V. および H.M. Blau, 前出)、または(iii)正常な個体に由来する、GCRECをコードする内因性遺伝子の天然のプロモーター若しくは組織特異的プロモーターを用いることが可能である。
【0219】
市販のリポソーム形質転換キット(例えばInvitrogen社のPerFect Lipid Transfection Kit)を用いれば、当業者は実験の各パラメータを最適化する努力をさほど要さず、ポリヌクレオチド群を、培養中の標的細胞群に送達し得る。別法では、リン酸カルシウム法(Graham. F.L. および A.J. Eb(1973)Virology 52:456-467)若しくは電気穿孔法(Neumann, E. 他(1982) EMBO J. 1:841-845)。初代培養細胞にDNAを導入するためには、標準化された哺乳類の形質移入プロトコルの修正が必要である。
【0220】
本発明の別の実施態様では、GCRECの発現に関連する遺伝子欠損によって起こる疾患や障害を、(i)レトロウイルス末端反復配列(LTR)プロモーター若しくは或る独立プロモーターのコントロール下でGCRECをコードするポリヌクレオチドと、(ii)好適なRNAパッケージングシグナル群と、(iii)追加のレトロウイルス・シス作用性RNA配列と、効率的なベクター増殖に必要なコーディング配列とを伴うRev応答性エレメント(RRE)と、からなるレトロウイルスベクターを作製して治療する。レトロウイルスベクター(例えばPFBおよびPFBNEO)はStratagene社から市販されており、刊行データ(Riviere, I. 他(1995)Proc. Natl. Acad. Sci. USA 92:6733-6737)に基づく。上記データを引用することを以て本明細書の一部とする。このベクターは、好適なベクター産生細胞株(VPCL)において増殖される。VPCLは、各標的細胞上の受容体への親和性を持つエンベロープ遺伝子を、またはVSVgなど汎親和性エンベロープタンパク質を発現する(Armentano, D. 他(1987) J. Virol. 61:1647-1650; Bender, M.A.他 (1987) J. Virol. 61:1639-1646; Adam, M.A. および A.D. Miller (1988) J. Virol. 62:3802-3806; Dull, T.他 (1998) J. Virol. 72:8463-8471; Zufferey, R.他 (1998) J. Virol. 72:9873-9880)。Riggに付与された米国特許第5,910,434号(「Method for obtaining retrovirus packaging cell lines producing high transducing efficiency retroviral supernatant」)にレトロウイルスパッケージング細胞株を得るための方法が開示されており、引用することをもって本明細書の一部とする。レトロウイルスベクター類の繁殖や、細胞集団(例えばCD4+T細胞群)の形質導入、および形質導入した細胞群の患者への戻しは、遺伝子治療分野では当業者に周知の手法であり、多数の文献に記載がある(Ranga, U.他(1997) J. Virol. 71:7020-7029; Bauer, G.他 (1997) Blood 89:2259-2267; Bonyhadi, M.L. (1997) J. Virol. 71:4707-4716; Ranga, U.他 (1998) Proc. Natl. Acad. Sci. USA 95:1201-1206; Su, L. (1997) Blood 89:2283-2290)。
【0221】
或る実施態様では、アデノウイルス系遺伝子治療の送達系を用いて、GCRECの発現に関連する1或いは複数の遺伝子異常を有する細胞にGCRECをコードするポリヌクレオチドを送達する。アデノウイルス系ベクター類の作製およびパッケージングについては、当業者に周知である。複製欠損型アデノウイルスベクター類は、種々の免疫調節タンパク質をコードする遺伝子群を、無損傷の膵島内に導入する目的で多様に利用し得ることが証明された(Csete, M.E.他(1995) Transplantation 27:263-268)。使用できる可能性のあるアデノウイルスベクターは、Armentanoに付与された米国特許第5,707,618号(「Adenovirus vectors for gene therapy」)に記載されており、引用することをもって本明細書の一部とする。アデノウイルスベクター類については、Antinozzi, P.A. 他(1999) Annu. Rev. Nutr. 19:511-544 並びに、Verma, I.M. および N. Somia (1997) Nature 18:389:239-242も参照されたい。両文献は、引用を以て本明細書の一部とする。
【0222】
別の実施態様では、ヘルペス系遺伝子治療の送達系を用いて、GCRECの発現に関連する1つ以上の遺伝子異常を有する標的細胞に、GCRECをコードするポリヌクレオチドを送達する。単純ヘルペスウイルス(HSV)系ベクター類の使用は、HSVが向性を持つ中枢神経細胞にGCRECを導入する際に、特に価値を持ち得る。ヘルペス系ベクター類の作製およびパッケージングは、当業者に公知である。或る複製適格性単純ヘルペスウイルス(HSV)1型系のベクターが、或るレポーター遺伝子の、霊長類の眼への送達に用いられている(Liu, X. 他(1999) Exp.Eye Res. 169:385-395)。HSV-1ウイルスベクターの作製についても、DeLucaに付与された米国特許第5,804,413号(「Herpes simplex virus swains for gene transfer」)に開示されており、該特許の引用をもって本明細書の一部とする。 米国特許第5,804,413号には、ヒト遺伝子治療を含む目的のために好適なプロモーターの制御下において細胞に導入される少なくとも1つの外在性遺伝子を有するゲノムを含む組換えHSV d92についての記載がある。上記特許はまた、ICP4、ICP27、およびICP22を欠失した組換えHSV系統の、作製および使用について開示している。HSVベクター類については、Goins, W.F. 他(1999) J. Virol. 73:519-532 および Xu, H.他 (1994) Dev. Biol. 163:152-161も参照されたい。両文献は、引用を以て本明細書の一部とする。クローン化したヘルペスウイルス配列群の操作、大ヘルペスウイルスゲノム(large herpesvirus genomes)の様々なセグメントを持つ複数のプラスミドを形質移入した後の組換えウイルスの産生、ヘルペスウイルスの成長および増殖、並びに細胞群へのヘルペスウイルスの感染は、当業者に公知の技術である。
【0223】
別の実施態様では、αウイルス(正の一本鎖RNAウイルス)ベクターを用いてGCRECをコードするポリヌクレオチドを標的細胞に送達する。プロトタイプのαウイルスであるセムリキ森林熱ウイルス(Semliki Forest Virus, SFV)の生物学的研究が広範に行われており、遺伝子導入ベクター類はSFVゲノムに基づく(Garoff, H. 及び K.-J. Li (1998) Cun. Opin. Biotech. 9:464-469)。αウイルスRNAの複製中に、ウイルスのカプシドタンパク質群を通常はコードする、サブゲノムRNAが産生される。このサブゲノムRNAは、完全長ゲノムRNAよりも高レベルに複製するので、酵素活性(例えばプロテアーゼおよびポリメラーゼ)を持つウイルスタンパク質に比べてカプシドタンパク質群が過剰産生される。同様に、GCRECのコード配列をαウイルスゲノムのカプシドをコードする領域に導入することによって、ベクター導入細胞において多数のGCRECをコードするRNAが産生され、高いレベルでGCRECが合成される。通常、αウイルスの感染は、数日以内の細胞溶解を伴う。一方、シンドビスウイルス(SIN)の或る変異体を有するハムスター正常腎臓細胞(BHK-21)群が持続的な感染を確立する能力は、αウイルス類の溶解複製を、遺伝子治療に応用し得るように好適に改変可能であることを示唆する(Dryga, S.A.他(1997) Virology 228:74-83)。αウイルスの宿主域は広いので、様々なタイプの細胞にGCRECを導入できることとなる。或る集団における或るサブセットの細胞群の特異的形質導入は、形質導入前に細胞の選別を必要とし得る。αウイルスの感染性cDNAクローンの処置方法、αウイルスのcDNAおよびRNAの形質移入方法およびαウイルスの感染方法は、当業者に公知である。
【0224】
転写開始部位(transcription initiation site)由来のオリゴヌクレオチドを用いて遺伝子発現を阻害することも可能である。この位置は、例えばスタート部位(start site)から数えて約−10と約+10の間である。同様に、三重らせん塩基対の形成方法を用いて阻害が可能となる。三重らせん塩基対形成は、ポリメラーゼ、転写因子または調節分子の結合のために十分に開く、二重らせんの能力を阻害するので有用である。三重らせんDNAを用いる最近の治療の進歩については文献に記載がある(例えばGee, J.E.他(1994) in Huber, B.E. および B.I. Carr, Molecular and Immunologic Approaches, Futura Publishing, Mt. Kisco NY, 163-177ページを参照)。相補配列またはアンチセンス分子もまた、転写物がリボソームに結合するのを阻止することによってmRNAの翻訳を阻止するように設計することができる。
【0225】
リボザイム類は、酵素的RNA分子である。RNAの特異的切断を触媒するためにリボザイムを用い得る。リボザイム作用の機序は、相補的標的RNAへのリボザイム分子の配列特異的ハイブリダイゼーションと、その後に起こる内ヌクレオチド鎖切断に関与している。例えば、人為操作されたハンマーヘッド型リボザイム分子は、GCRECをコードするRNA分子のヌクレオチド鎖切断を、特異的且つ効果的に触媒する可能性がある。
【0226】
任意のRNA標的内の特異的リボザイム切断部位は、GUA、GUU、GUC配列を含めたリボザイム切断部位に対して標的分子をスキャンすることによって先ず同定される。一度同定されると、切断部位を持つ標的遺伝子の領域に対応する15〜20リボヌクレオチドの短いRNA配列が、そのオリゴヌクレオチドを機能不全にするような2次構造の特徴をもっていないかを評価することが可能になる。候補標的の適合性の評価も、リボヌクレアーゼ保護アッセイを用いて相補的オリゴヌクレオチド群とのハイブリダイゼーションへのアクセス可能性をテストすることによって行い得る。
【0227】
相補リボ核酸分子およびリボザイムは、核酸分子合成のための当分野で既知の任意の方法を用いて作製し得る。作製方法には、固相ホスホラミダイト化学合成など、オリゴヌクレオチドを化学的に合成する方法がある。或いは、GCRECをコードするDNA分子のin vitroおよびin vivo転写によってRNA分子を作成し得る。このようなDNA配列は、T7やSP6などの好適なRNAポリメラーゼプロモーターを用いて多様なベクター内に取り込むことが可能である。あるいは、相補的RNAを構成的あるいは誘導的に合成するこれらのcDNA構成物を、細胞株、細胞または組織内に導入できる。
【0228】
細胞内の安定性を高め半減期を延ばすためRNA分子を修飾し得る。限定するものでないが可能な修飾としては、分子の5'末端、3'末端、あるいはその両方において隣接配列群を追加することや、分子の主鎖内においてホスホジエステラーゼ結合ではなくホスホロチオエートまたは2' O-メチルを使用することが含まれる。この概念は、本来はPNA群の産出におけるものであるが、これら全ての分子に拡大することができる。そのためには、内因性エンドヌクレアーゼによって容易には認識されない、アデニン、シチジン、グアニン、チミン、およびウリジンにアセチル−、メチル−、チオ−および同様の修飾をしたものや、非従来型塩基、例えばイノシン、クエオシン(queosine)、ワイブトシン(wybutosine)を加える。
【0229】
本発明の更なる実施態様は、GCRECをコードするポリヌクレオチドの発現の改変に有効な化合物をスクリーニングする方法を含む。限定するものではないが特異ポリヌクレオチドの発現改変を起こすのに有効であり得る化合物には、オリゴヌクレオチド、アンチセンスオリゴヌクレオチド、三重らせん形成オリゴヌクレオチドや、転写因子などのポリペプチド転写制御因子、および、特異ポリヌクレオチド配列と相互作用し得る非高分子化学的実体がある。有効な化合物は、ポリヌクレオチド発現のインヒビターまたはエンハンサーのいずれかとして作用することによりポリヌクレオチド発現を改変し得る。従って、GCRECの発現または活性の増加に関連する疾患の治療においては、GCRECをコードするポリヌクレオチドの発現を特異的に阻害する化合物が治療上有用であり、GCRECの発現または活性の低下に関連する疾患の治療においては、GCRECをコードするポリヌクレオチドの発現を特異的に促進する化合物が治療上有用であり得る。
【0230】
或る特定ポリヌクレオチドの発現を改変する際の有効性について、少なくとも1個、または複数個の試験化合物をスクリーニングし得る。試験化合物を得るには、当分野で公知の任意の方法を用い得る。取得方法としては、以下の場合に有効な既知化合物の化学修飾がある。ポリヌクレオチドの発現を改変する場合と、既存の、市販のまたは私的な、天然または非天然の化合物のライブラリから選択する場合と、標的ポリヌクレオチドの化学的および/または構造的特性に基づく化合物を合理的にデザインする場合と、組合せ的にまたは無作為に生成した化合物のライブラリから選択する場合とである。GCRECをコードするポリヌクレオチドを持つサンプルを、このようにして得た試験化合物の少なくとも1つに曝露する。サンプルは例えば、無傷細胞、透過化処理した細胞、あるいはin vitro 無細胞系すなわち再構成生化学系があり得る。GCRECをコードするポリヌクレオチドの発現における改変は、当分野で周知の任意の方法でアッセイする。通常は、GCRECをコードするポリヌクレオチドの配列に相補的なヌクレオチド配列を有するプローブを用いたハイブリダイゼーションにより、特定のヌクレオチドの発現を検出する。ハイブリダイゼーション量を定量することにより、1つ以上の試験化合物に曝露される、または曝露されないポリヌクレオチドの発現の比較のための基礎を形成し得る。試験化合物に曝露されるポリヌクレオチドの発現における変化の検出は、ポリヌクレオチドの発現を改変する際に試験化合物が有効であることを示す。或る特定ポリヌクレオチドの改変発現に有効な化合物のためのスクリーニングを実行でき、例えば分裂酵母(Schizosaccharomyces pombe)遺伝子発現系(Atkins, D. 他(1999) 米国特許第5,932,435号、Arndt, G.M. 他(2000) Nucleic Acids Res. 28:E15)またはHeLa細胞等のヒト細胞株(Clarke, M.L.他(2000) Biochem. Biophys. Res. Commun. 268:8-13)。本発明の或る特定の実施態様は、或る特定ポリヌクレオチド配列に対するアンチセンス活性について、オリゴヌクレオチド(デオキシリボヌクレオチド、リボヌクレオチド、ペプチド核酸、修飾したオリゴヌクレオチド)の組合せライブラリをスクリーニングする過程に関する(Bruice, T.W. 他(1997) 米国特許第5,686,242号、Bruice, T.W.他(2000) 米国特許第6,022,691号)。
【0231】
ベクターを細胞または組織に導入する多数の方法が利用可能であり、in vivo、in vitroおよびex vivoの使用に対して同程度に適している。ex vivo治療の場合、ベクターを、患者から採取した幹細胞内に導入し、クローニング増殖して同患者に自家移植で戻すことができる。トランスフェクションによる、またはリボソーム注入やポリカチオンアミノポリマーによる送達は、当分野で周知の方法を用いて実行することができる(例えばGoldman, C.K.他(1997) Nat. Biotechnol. 15:462-466を参照)。
【0232】
上記の治療方法はどれも例えば、ヒト、イヌ、ネコ、ウシ、ウマ、ウサギ、サルなどの哺乳類を含めて治療が必要な全ての被験体に適用できる。
【0233】
本発明の更なる実施態様は、薬物として許容できる或る賦形剤と共に製剤される或る活性成分を一般に有する、或る組成物の投与に関する。賦形剤には例えば、糖、でんぷん、セルロース、ゴムおよびタンパク質がある。様々な剤型が広く知られており、詳細はRemi ngton's Pharmaceutical Sciences(Maack Publishing, Easton PA)の最新版に記載されている。このような組成物は、GCREC、GCRECに対する抗体、GCRECの擬態物質、アゴニスト、アンタゴニスト、またはインヒビターから構成し得る。
【0234】
本発明に用いられる組成物は、任意の数の経路によって投与することができ、限定するものではないが経路には、経口、静脈内、筋肉内、動脈内、骨髄内、クモ膜下腔内、心室内、肺、経皮、皮下、腹腔内、鼻腔内、腸内、局所、舌下または直腸がある。
【0235】
肺から投与する組成物は、液状または乾燥粉末状で調製し得る。このような組成物は通常、患者が吸入する直前にエアロゾル化する。小分子(例えば伝統的な低分子量有機薬)の場合には、速効製剤のエアロゾル送達は当分野で公知である。高分子(例えばより大きなペプチドおよびタンパク質)の場合には、当該分野において肺の肺胞領域を介しての肺送達が最近向上したことにより、インスリンなどの薬物を実質的に血液循環へ輸送することを可能にした(Patton, J.S. 他, 米国特許第5,997,848号などを参照)。肺送達は、針注射なしに投与する点で優れており、有毒な可能性のある浸透エンハンサーの必要性をなくす。
【0236】
本発明での使用に適した組成物には、所定の目的を達成するために必要なだけの量の活性成分を含有する組成物が含まれる。有効投与量の決定は、当業者の能力の範囲内で行う。
【0237】
GCRECを有する、またはその断片群を有する高分子群を直接、細胞内に送達すべく、特殊な種々の形状の組成物群が調製され得る。例えば、細胞不透過性高分子を含むリポソーム製剤は、その高分子の細胞融合と細胞内送達とを促進し得る。或いは、GCRECまたはその断片を、HIV Tat-1タンパク質から得た短い陽イオンN末端部に結合し得る。このようにして生成された融合タンパク質類は、或るマウスモデル系の、脳を含む全ての組織の細胞群に形質導入することがわかっている(Schwarze, S.R. 他(1999) Science 285:1569-1572)。
【0238】
任意の化合物に対して、細胞培養アッセイ、例えば新生物性細胞の細胞培養アッセイにおいて、或いは、動物モデル、例えばマウス、ウサギ、イヌまたはブタ等において先ず治療有効投与量を推定することができる。動物モデルはまた、好適な濃度範囲および投与経路を決定するためにも用い得る。このような情報を用いて、次にヒトに対する有益な投与量および投与経路を決定することができる。
【0239】
治療有効量とは、症状や容態を回復させる、たとえばGCRECまたはその断片、GCRECの抗体、GCRECのアゴニストまたはアンタゴニスト、インヒビターなど、活性成分の量を指す。治療有効性及び毒性は、細胞培養または動物実験における標準的な薬剤手法によって、例えばED50(集団の50%の治療有効量)またはLD50(集団の50%の致死量)を測定するなどして決定することができる。毒性効果の、治療効果に対する用量比が治療指数であり、LD50/ED50比として表すことができる。高い治療指数を示すような組成物が望ましい。細胞培養アッセイと動物実験とから得られたデータは、ヒトに用いる投与量の範囲の策定に用いられる。このような組成物に含まれる投与量は、毒性を殆どあるいは全く持たず、ED50を含むような血中濃度の範囲にあることが好ましい。用いられる投与形態、患者の感受性および投与の経路によって、投与量はこの範囲内で様々に変わる。
【0240】
正確な投与量は、治療が必要な被験者に関する要素を考慮して、現場の医者が決定することになる。充分なレベルの活性成分を与え、あるいは所望の効果を維持すべく、用法および用量を調整する。被験者に関する要素としては、疾患の重症度、患者の一般的な健康状態、患者の年齢、体重および性別(ジェンダー)、投与の時間および頻度、薬物の配合、反応感受性および治療に対する応答などを考慮し得る。作用期間が長い組成物は、特定の製剤の半減期及びクリアランス率によって3〜4日毎に1度、1週間に1度、或いは2週間に1度の間隔で投与し得る。
【0241】
通常の投与量は、投与経路にもよるが約0.1〜100,000μgで、合計で約1gまでとする。特定の投与量および送達方法に関するガイダンスは文献に記載されており、現場の医者は通常それを利用できる。当業者は、ヌクレオチドの処方では、タンパク質またはそれらのインヒビター類とは異なる処方を利用することになる。同様に、ポリヌクレオチドまたはポリペプチドの送達は、特定の細胞、症状、部位などに特異的なものとなる。
(診断)
別の実施態様では、GCRECに特異的に結合する抗体を、GCRECの発現によって特徴付けられる疾患の診断に、またはGCRECやGCRECのアゴニストまたはアンタゴニスト、インヒビターで治療を受けている患者をモニターするためのアッセイに用いることがある。診断目的に有用な抗体は、上記の治療の箇所で記載した方法と同じ方法で作成される。GCRECの診断アッセイには、抗体及び標識を用いて、ヒトの体液において、或いは細胞や組織の抽出物において、GCRECを検出する方法が含まれる。この抗体は、修飾して、または修飾せずに使用される。また、レポーター分子との共有結合または非共有結合で標識化できる。レポーター分子としては広く様々な種類が本分野で知られており、また使用可能であるが、そのうちのいくつかは上記で説明されている。
【0242】
GCRECを測定するための様々なプロトコル、例えばELISA、RIA、FACS等が当分野では周知であり、変容した、あるいは異常なレベルのGCRECの発現を診断するための基盤を提供する。正常あるいは標準的なGCRECの発現の値は、複合体の形成に適した条件下で、正常な哺乳動物、例えばヒトなどの被験体から採取した体液または細胞抽出物と、GCRECに対する抗体とを混合させることによって確立する。標準複合体形成量は、種々の方法、例えば測光法で定量できる。被験体、対照、および、生検組織からの疾患サンプルでの、GCREC発現の量を標準値と比較する。標準値と被験体との偏差が、疾患を診断するパラメータを確定する。
【0243】
本発明の別の実施態様では、GCRECをコードするポリヌクレオチドを、診断目的で用い得る。用い得るポリヌクレオチドには、オリゴヌクレオチド、相補的RNAおよびDNA分子、そしてPNAが含まれる。これらのポリヌクレオチドを用いて、GCRECの発現が疾患と相関し得る生検組織における遺伝子発現を検出し定量し得る。この診断アッセイを用いて、GCRECの存在の有無、更には過剰な発現を判定し、治療時のGCRECレベルの調節を監視し得る。
【0244】
一態様では、GCRECまたは近縁の分子をコードする、ゲノム配列などポリヌクレオチドを検出可能なPCRプローブ類とのハイブリダイゼーションを、GCRECをコードする核酸配列の同定に用いうる。プローブが高度に特異的な領域(例えば5'調節領域)から作られている、或いはやや特異性の低い領域(例えば保存されたモチーフ)から作られているかという、そのプローブの特異性と、ハイブリダイゼーション或いは増幅のストリンジェンシーとによって、プローブがGCRECをコードする天然配列のみを同定するかどうか、或いは対立遺伝子や関連配列を同定するかどうかが決まることとなる。
【0245】
プローブはまた、関連する配列の検出に用い得る。また、GCRECをコードする任意の配列との少なくとも50%の配列同一性を有し得る。本発明のハイブリダイゼーションプローブ類はDNAまたはRNAであることがあり、SEQ ID NO:27-52の配列に由来、或いはゲノム配列群、例えばGCREC遺伝子のプロモーター、エンハンサー、イントロンなどに由来し得る。
【0246】
GCRECをコードするポリヌクレオチド群に対して特異的なハイブリダイゼーションプローブ群の作製手段としては、GCRECまたはGCREC誘導体群をコードするポリヌクレオチド群を、mRNAプローブ群の作製のためのベクター類にクローニングする方法を含む。mRNAプローブ作製のためのベクターは、当業者に知られており、市販されており、好適なRNAポリメラーゼ及び好適な標識されたヌクレオチドを加えることによって、in vitroでRNAプローブを合成するために用いられ得る。ハイブリダイゼーションプローブは、種々のレポーターの集団によって標識され得る。レポーター集団の例としては、32Pまたは35S等の放射性核種、或いはアビジン/ビオチン結合系を介してプローブに結合されたアルカリホスファターゼ等の酵素標識などが挙げられる。
【0247】
GCRECをコードするポリヌクレオチドを用いて、GCRECの発現に関連する疾患を診断することが可能である。限定するものではないが、このような疾患の例には神経性嗅覚喪失があり、これには3つのタイプがある。輸送ロスを生じる病状としては、急性ウイルス性上気道感染、細菌性鼻炎、アレルギー性鼻炎、細菌性副鼻腔炎、および、種々の粘膜分泌異常があり、これらは嗅膜への匂い物質の接近を妨げる。感覚性嗅覚喪失の原因は嗅膜の破壊であり、これはウイルス感染、新生物、毒性化学物質の吸入、薬物、および頭部への放射線療法で起きる。神経性嗅覚喪失は頭部外傷、パーキンソン病、アルツハイマー病、コルサコフ精神病、ビタミンB12欠損、前頭蓋窩の新生物、先天性疾患で生じ、また薬剤たとえばエタノール、アンフェタミン、局所コカイン、アミノグリコシド、テトラサイクリンおよび喫煙による神経毒性の結果として生じる。内分泌障害たとえばクッシング症候群、甲状腺機能低下、および糖尿病は、匂いの知覚に影響しうる。下前頭部の髄膜腫が嗅覚喪失の最頻な腫瘍性の原因であるが、無嗅覚はまた下垂体腺腫、鞍上髄膜腫(suprasellar meningiomas)および前部ウィリス環の動脈瘤での転移の結果としても生じる。これらの腫瘍と過誤腫とは、幻嗅を伴う発作を誘発しうる。どの心理物理的方法も感覚性と神経性との嗅覚喪失を区別できず、どの利用可能な治療も感覚神経的嗅覚喪失への効力を実証していない。GCRECの活性または発現の低下に伴う疾患の更なる例には細胞増殖異常、神経疾患、心血管疾患、胃腸疾患、自己免疫/炎症疾患、代謝障害およびウイルス感染が含まれ、細胞増殖異常には日光角化症、アテローム動脈硬化、滑液包炎、硬変、肝炎、混合型結合織病(MCTD)、骨髄線維症、発作性夜間ヘモグロビン尿症、真性多血症、乾癬、原発性血小板血症、並びに、腺癌、白血病、リンパ腫、黒色腫、骨髄腫、肉腫、及び奇形癌、具体的には、副腎、膀胱、骨、骨髄、脳、乳房、頚部、胆嚢、神経節、消化管、心臓、腎臓、肝臓、肺、筋肉、卵巣、膵臓、副甲状腺、陰茎、前立腺、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、子宮の癌がある。神経疾患には、癲癇、虚血性脳血管障害、脳卒中、大脳新生物、アルツハイマー病、ピック病、ハンチントン病、痴呆、パーキソン病及びその他の錐体外路障害、筋萎縮性側索硬化及びその他の運動ニューロン障害、進行性神経性筋萎縮症、色素性網膜炎(網膜色素変性)、遺伝性運動失調、多発性硬化症及び他の脱髄疾患、細菌性及びウイルス性髄膜炎、脳膿瘍、硬膜下蓄膿症、硬膜外膿瘍、化膿性頭蓋内血栓性静脈炎、脊髄炎及び神経根炎、ウイルス性中枢神経系疾患と、クールー及びクロイツフェルト‐ヤコブ病、Gerstmann-Straussler-Scheinker症候群を含むプリオン病と、致死性家族性不眠症、神経系性栄養病及び代謝病、神経線維腫症、結節硬化症、小脳網膜血管芽腫(cerebelloretinal hemangioblastomatosis)、脳3叉神経血管症候群、精神遅滞及び他の中枢神経系発達障害、脳性麻痺、神経骨格異常症、自律神経系障害、脳神経疾患、背髄病、筋ジストロフィなど神経筋障害、末梢神経疾患、皮膚筋炎及び多発性筋炎と、遺伝性、代謝性、内分泌性、及び中毒性ミオパシーと、重症筋無力症、周期性四肢麻痺と、気分性及び不安性の障害、分裂病(統合失調症)性疾患を含む精神障害と、季節性障害(SAD)と、静座不能、健忘症、緊張病、糖尿病性ニューロパシー、遅発性ジスキネジア、ジストニー、パラノイド精神病、帯状疱疹後神経痛、及びトゥーレット病と、進行性核上麻痺、皮質基底核変性、家族性前頭側頭型痴呆がある。心血管疾患には、動静脈瘻、アテローム硬化、高血圧、脈管炎、レイノー病、動脈瘤、動脈解離、静脈瘤、血栓静脈炎及び静脈血栓、血管の腫瘍や、血栓溶解、バルーン血管形成、血管置換および冠動脈バイパス移植術の合併症や、うっ血性心不全、虚血性心疾患、狭心症、心筋梗塞、高血圧性心疾患、変性弁膜性心疾患、石灰化大動脈弁狭窄症、先天性二尖大動脈弁、僧帽弁輪部石灰化、僧帽弁逸脱、リウマチ熱、リウマチ性心疾患、感染性心内膜炎、非細菌性血栓性心内膜炎、全身性エリテマトーデスの心内膜炎、カルチノイド心疾患、心筋症、心筋炎、心膜炎、腫瘍性心疾患、先天性心臓疾患、及び心移植合併症がある。胃腸障害には嚥下障害、消化性食道炎、食道痙攣、食道狭窄、食道癌、消化不良、消化障害、胃炎、胃癌、食欲不振、悪心、嘔吐、胃不全麻痺、洞または幽門の浮腫、腹部アンギナ、胸焼け、胃腸炎、イレウス、腸管感染、消化性潰瘍、胆石症、胆嚢炎、胆汁うっ滞、膵臓炎、膵臓癌、胆道疾患、肝炎、高ビリルビン血症、硬変症、肝臓の受動性うっ血、ヘパトーム、感染性大腸炎、潰瘍性結腸炎、潰瘍性直腸炎、クローン病、ホイップル病、マロリー‐ヴァイス症候群、結腸癌、結腸閉塞、過敏性腸症候群、短小腸症候群、下痢、便秘、胃腸出血、及び後天性免疫不全症候群(AIDS)腸症、黄疸、肝性脳症、肝腎症候群、脂肪肝、血色素症、ウィルソン病、α-1-アンチトリプシン欠損症、ライ症候群、原発性硬化性胆管炎、肝梗塞、門脈循環閉塞及び血栓、小葉中心壊死、肝臓紫斑病、肝静脈血栓、肝静脈閉塞症、静脈閉塞病、子癇前症、子癇、妊娠性急性脂肪肝、妊娠性肝臓内胆汁うっ滞と、結節過形成及び腺腫、癌腫を含む肝癌がある。自己免疫/炎症疾患には後天性免疫不全症候群(AIDS)、アジソン病(慢性原発性副腎機能不全)、成人呼吸窮迫症候群、アレルギー、強直性脊椎炎、アミロイド症、貧血、喘息、アテローム性動脈硬化症、自己免疫性溶血性貧血、自己免疫性甲状腺炎、自己免疫性多腺性内分泌カンジダ症外胚葉ジストロフィ(APECED)、気管支炎、胆嚢炎、接触皮膚炎、クローン病、アトピー性皮膚炎、皮膚筋炎、糖尿病、肺気腫、リンパ球傷害因子性偶発性リンパ球減少、胎児赤芽球症(新生児溶血性疾患)、結節性紅斑、萎縮性胃炎、糸球体腎炎、グッドパスチャー症候群、痛風、グレーブス病、橋本甲状腺炎、過好酸球増加症、過敏性腸症候群、多発性硬化症、重症筋無力症、心筋または心膜炎、骨関節炎、骨粗しょう症、膵炎、多発性筋炎、乾癬、ライター症候群、リウマチ様関節炎、強皮症、シェーグレン症候群、全身性アナフィラキシー、全身性エリテマトーデス、全身性硬化症、血小板減少性紫斑病、潰瘍性大腸炎、ぶどう膜炎、ウェルナー症候群、癌・血液透析・体外循環の合併症、ウイルス感染症、細菌感染症、真菌感染症、寄生虫感染症、原虫感染症、蠕虫感染症、外傷がある。代謝障害には糖尿病、肥満症および骨粗鬆症がある。またウイルス病原体感染症を含み、病原体はアデノウイルス、アレナウイルス、ブンヤウイルス、カリチウイルス、コロナウイルス、フィロウイルス、ヘパドナウイルス、ヘルペスウイルス、フラビウイルス、オルトミクソウイルス、パルボウイルス、パポーバウイルス、パラミクソウイルス、ピコルナウイルス、ポックスウイルス、レオウイルス、レトロウイルス、ラブドウイルス、トガウイルス(tongavirus)に分類される。GCRECをコードするポリヌクレオチドは、サザーン法やノーザン法、ドットブロット法、或いはその他の膜系の技術、PCR法、ディップスティック(dipstick)、ピン(pin)、およびマルチフォーマットのELISA式アッセイ、および、変容したGCREC発現を検出するために患者から採取した体液或いは組織を利用するマイクロアレイに使用可能である。このような定性方法または定量方法は、当分野で公知である。
【0248】
或る特定の態様では、GCRECをコードするヌクレオチド群を、関連する障害、特に上記した障害を検出するアッセイ類に用い得る。GCRECをコードする配列に相補的なポリヌクレオチドを、標準的な方法で標識化し、ハイブリダイゼーション複合体の形成に好適な条件の下、患者から採取した体液或いは組織のサンプルに加えることができる。好適なインキュベーション期間が経過したらサンプルを洗浄し、シグナルを定量して標準値と比較する。患者のサンプルのシグナルの量が対照サンプルに比較して著しく変化している場合は、そのサンプル内のGCRECをコードするポリヌクレオチド群のレベル変化の存在により、関連する疾患の存在が明らかになる。このようなアッセイは、動物実験、臨床試験における特定の治療効果を評価するため、あるいは個々の患者の治療をモニターするために用いることもできる。
【0249】
GCRECの発現に関連する疾患の診断基準を提供するために、発現のための正常あるいは標準プロファイルを確立する。これは、ハイブリダイゼーションあるいは増幅に好適な条件の下、動物あるいはヒトのいずれかの正常な被験体から抽出された体液あるいは細胞と、GCRECをコードする配列あるいはその断片とを混合することにより達成され得る。実質的に精製されたポリヌクレオチドを既知量で用いて行った実験から得た値を正常な被験者から得た値と比較することにより、標準ハイブリダイゼーションを定量することができる。このようにして得た標準値は、疾患の徴候を示す患者から得たサンプルから得た値と比較することができる。標準値からの偏差を用いて疾患の存在を確定する。
【0250】
疾患の存在が確定されて治療プロトコルが開始されると、患者の発現レベルが正常な被検者に観察されるレベルに近づき始めたかどうかを測定するため、ハイブリダイゼーションアッセイを定期的に繰り返し得る。連続アッセイから得られた結果を用いて、数日から数ヶ月の期間にわたる治療の効果を示し得る。
【0251】
癌に関しては、個体からの生体組織における異常な量の転写物(過少発現または過剰発現)の存在は、疾患の発生素質を示したり、実際に臨床的症状が現れる前に疾患を検出する方法を提供し得る。この種のより明確な診断により、医療の専門家が予防方法または積極的な治療法を早くから利用し、それによって癌の発生または更なる進行を防止することが可能となる。
【0252】
GCRECをコードする配列から設計されたオリゴヌクレオチドを追加的に診断上利用することは、PCRの利用に関与し得る。これらのオリゴマーは、化学的に合成するか、酵素により生産するか、あるいはin vitroで産出し得る。オリゴマーは、好ましくはGCRECをコードするポリヌクレオチドの断片、或いはGCRECをコードするポリヌクレオチドに対して相補的なポリヌクレオチドの断片を含み、最適化した条件下で、特定の遺伝子や条件を識別するために利用される。また、オリゴマーは、やや緩いストリンジェンシー条件下で、近縁のDNAあるいはRNA配列の検出、定量、あるいはその両方のため用いることが可能である。
【0253】
或る特定態様で、GCRECをコードするポリヌクレオチド群に由来のオリゴヌクレオチドプライマー類を用い一塩基多型(SNP)を検出し得る。SNPは、多くの場合にヒトの先天性または後天性遺伝病の原因となるような置換、挿入および欠失である。限定するものではないがSNPの検出方法には、SSCP(single-stranded conformation polymorphism)及び蛍光SSCP(fSSCP)がある。SSCPでは、GCRECをコードするポリヌクレオチド群に由来のオリゴヌクレオチドプライマー類とポリメラーゼ連鎖反応法(PCR)を用いDNAを増幅する。このDNAは例えば、病変組織または正常組織、生検サンプル、体液などに由来し得る。DNA内のSNPは、一本鎖形状のPCR生成物の2次及び3次構造に差異を生じさせる。差異は非変性ゲル中でのゲル電気泳動法を用いて検出可能である。fSSCPでは、オリゴヌクレオチドプライマーを蛍光性に標識する。それによってDNAシークエンシング機などの高処理機器でアンプリマー(amplimer)の検出が可能になる。更に、インシリコSNP(in silico SNP, isSNP)と呼ばれる配列データベース分析法は、共通のコンセンサス配列へアセンブリされるような個々のオーバーラップするDNA断片群の配列を比較することにより、多型性を同定し得る。これらのコンピュータベースの方法は、DNAの実験室での調製に、または統計モデルとDNA配列クロマトグラムの自動分析とを用いたシークエンシングのエラーに起因する配列変異を、フィルタリングして除去する。別の態様では、例えば高処理MASSARRAYシステム(Sequenom, Inc., San Diego CA)を用いた質量分析によりSNPを検出し、特徴付ける。
【0254】
SNPを利用して、ヒト疾患の遺伝的基礎を研究しうる。例えば少なくとも16種の一般的SNPが、インスリン非依存型糖尿病と関連している。SNPはまた、単一遺伝子病における疾病転帰における相違を試験するにも有用である。単一遺伝子病としては、嚢胞性線維症、鎌状赤血球貧血、または慢性肉芽腫症がある。例えばマンノース結合レクチンであるMBL2における変異体群は、嚢胞性線維症における有害な肺の転帰との相関が示されている。SNPはまた、薬理ゲノム学においても有用性を持つ。薬理ゲノム学は、患者の薬物への応答(例えば命を脅かす毒性)に影響する遺伝的変異体の同定を行う。例えばNアセチル転移酵素における或る変異は、抗結核薬であるイソニアジドに応答しての末梢ニューロパシーの高い発症率と関連する。一方、ALOX5遺伝子のコアプロモータにおける或る変異の結果、5-リポキシゲナーゼ経路を標的とする或る抗喘息薬での治療に対する臨床応答が低下する。異なる集団群におけるSNPの分布の分析は、遺伝的浮動、突然変異、遺伝子組換え、遺伝子選択の調査に有用であり、集団の起源とその移動との追跡にも有用である(Taylor, J.G. 他(2001) Trends Mol. Med. 7:507-512; Kwok, P.-Y. および Z. Gu (1999) Mol. Med. Today 5:538-543; Nowotny, P. 他(2001) Curr. Opin. Neurobiol. 11:637-641)。
【0255】
GCRECの発現を定量するために用い得る方法には、ヌクレオチドの放射標識またはビオチン標識、対照核酸の共増幅(coamplification)、および標準曲線から得た結果の補間もある(例えばMelby, P.C.他(1993) J. Immunol. Methods 159:235-244; Duplaa, C.他 (1993) Anal. Biochem. 212:229-236を参照)。目的のオリゴマーが種々の希釈液中に存在し、分光光度法または比色反応によって定量が迅速になるような高処理フォーマットのアッセイを行うことによって、複数のサンプルの定量速度を加速することができる。
【0256】
更に別の実施例では、本明細書で記載した任意のポリヌクレオチドに由来のオリゴヌクレオチドまたはより長い断片を、或るマイクロアレイにおけるエレメント群として用いることができる。多数の遺伝子の相対発現レベルを同時にモニターする転写イメージング技術にマイクロアレイを用いることが可能である。これについては、以下に記載する。マイクロアレイはまた、遺伝変異体、突然変異および多型性の同定に用いることができる。この情報を用いることで、遺伝子機能を決定し、疾患の遺伝的根拠を理解し、疾患を診断し、遺伝子発現の機能としての疾病の進行/後退をモニターし、疾病治療における薬物の活性を開発およびモニターすることができる。特に、患者にとって最もふさわしく、有効な治療法を選択するために、この情報を用いて患者の薬理ゲノムプロファイルを開発することができる。例えば、患者の薬理ゲノムプロファイルに基づき、患者に対して高度に効果的で副作用を殆ど示さない治療薬を選択することができる。
【0257】
別の実施例では、GCREC、GCRECの断片、GCRECに特異的な抗体を、マイクロアレイ上のエレメントとして用いることができる。マイクロアレイを用いて、上記のようなタンパク質間相互作用、薬物−標的相互作用および遺伝子発現プロファイルをモニターまたは測定できる。
【0258】
或る実施態様は、或る組織または細胞タイプの転写イメージを作製する、本発明のポリヌクレオチドの使用に関連する。転写イメージは、特定の組織または細胞タイプによる、遺伝子発現の包括的パターンを表す。包括的遺伝子発現パターンは、所与の条件下で所与の時間に発現した遺伝子の数および相対存在量を定量することにより分析し得る(Seilhamer 他の米国特許第5,840,484号 「Comparative Gene Transcript Analysis」を参照。該特許は特に引用することを以って本明細書の一部となす)。したがって、特定の組織または細胞タイプの転写物または逆転写物全体に、本発明のポリヌクレオチドまたはそれらの相補体をハイブリダイズすることにより、転写イメージを作製し得る。或る実施態様では、本発明のポリヌクレオチドまたはそれらの相補体が1マイクロアレイ上に複数エレメントの1サブセットを持つような高処理フォーマットでハイブリダイゼーションを発生させる。結果として得られる転写イメージは、遺伝子活性のプロファイルを提供し得る。
【0259】
転写イメージは、組織、細胞株、生検またはその生体サンプルから単離した転写物を用いて作製し得る。転写イメージはしたがって、組織または生検サンプルの場合にはin vivo、細胞株の場合にはin vitroでの遺伝子発現を反映する。
【0260】
本発明のポリヌクレオチドの発現のプロファイルを作製する転写イメージはまた、in vitroモデル系および薬物の前臨床評価に、あるいは工業的または天然の環境化合物の毒性試験に関連して使用し得る。全ての化合物は、作用および毒性のメカニズムを標示し、しばしば分子フィンガープリントまたは毒性シグネチャ(toxicant signatures)と称される、特徴的な遺伝子発現パターンを惹起する(Nuwaysir, E.F. 他(1999) Mol. Carcinog. 24:153-159; Steiner, S. and N.L. Anderson (2000) Toxicol. Lett. 112-113:467-471)。試験化合物が、既知毒性を有する化合物のシグネチャと同一のシグネチャを有する場合には、毒性特性を共有している可能性がある。フィンガープリントまたはシグネチャは、多数の遺伝子および遺伝子ファミリーからの発現情報を含んでいる場合に、最も有用且つ正確である。理想的には、ゲノム全域にわたる発現の測定が、最高品質のシグネチャを提供する。たとえ、発現が任意の試験された化合物によって変容しない遺伝子があったとしても、それらの発現レベルを残りの発現データをノーマライズすることに使用できるため、それらの遺伝子は重要である。ノーマライズ手順は、種々の化合物で処理した後の発現データの比較に有用である。或る毒性シグネチャのエレメント群に遺伝子機能を割り当てることは毒性機序の解釈に役立つが、毒性の予測につながる、シグネチャ群の統計的マッチングには、遺伝子機能の知識は必要でない(例えば2000年2月29日に米国国立環境健康科学研究所(National Institute of Environmental Health Sciences)より発行されたPress Release 00-02を参照されたい。これについてはhttp://www.niehs.nih.gov/oc/news/toxchip.htmで入手可能である)。したがって、毒性シグネチャを用いる中毒学的スクリーニングの際に、全ての発現した遺伝子配列を含めることは、重要且つ望ましい。
【0261】
或る実施態様では、核酸を有する生体サンプルを試験化合物で処理することにより、この試験化合物の毒性を算定しうる。処理した生体サンプル中で発現した核酸は、本発明のポリヌクレオチドに特異的な1つ以上のプローブでハイブリダイズし、それによって本発明のポリヌクレオチドに対応する転写レベルを定量し得る。処理した生体サンプル中の転写レベルを、未処理生体サンプル中のレベルと比較する。両サンプルの転写レベルの差は、処理済サンプル中で試験化合物が引き起こす毒性反応を標示する。
【0262】
別の実施態様は、本発明で開示するポリペプチド群を用いた、或る組織または細胞タイプのプロテオームの分析に関する。プロテオームの語は、特定の組織または細胞タイプでのタンパク質発現の包括的パターンを指す。プロテオームの各タンパク質成分は、個々に更なる分析の対象とすることができる。プロテオーム発現パターンすなわちプロファイルは、所与の条件下で所与の時間に発現したタンパク質の数および相対存在量を定量することにより分析し得る。したがって、或る細胞のプロテオームのプロファイルは、特定の組織または細胞タイプのポリペプチドを分離および分析することにより作成し得る。或る実施例では、1次元等電点電気泳動によりサンプルからタンパク質を分離し、2次元ドデシル硫酸ナトリウムスラブゲル電気泳動により分子量に応じて分離するような2次元ゲル電気泳動により、分離が達成される(前出のSteiner および Anderson)。タンパク質は、通常はクーマシーブルー、あるいは銀染色液または蛍光染色液などの物質を用いてゲルを染色することにより、分散した、独自の位置にある点としてゲル中で可視化される。各タンパク質スポットの光学密度は、通常、サンプル中のタンパク質レベルに比例する。異なるサンプル、例えば試験化合物または治療薬で処理または未処理のいずれかの生体サンプルからの、同等に位置したタンパク質スポットの光学密度を比較し、処理に関連するタンパク質スポット密度の変化を同定する。スポット内のタンパク質は、例えば化学的または酵素的切断とそれに続く質量分析を用いる標準的な方法を用いて部分的にシークエンシングする。或るスポット内のタンパク質の同一性は、その部分配列を、好適には少なくとも5個の連続するアミノ酸残基を、目的のポリペプチド配列と比較することにより決定し得る。場合によっては、決定的なタンパク質同定のための更なる配列データが得られる。
【0263】
プロテオームのプロファイルは、GCRECに特異的な抗体を用いてGCREC発現レベルを定量することによっても作成し得る。或る実施態様では、マイクロアレイ上のエレメントとしてこれら抗体を用い、マイクロアレイをサンプルに曝して各アレイエレメントへのタンパク質結合レベルを検出することにより、タンパク質発現レベルを定量する(Lueking, A. 他(1999) Anal. Biochem. 270:103-111; Mendoze, L.G.他(1999) Biotechniques 27:778-788)。検出は当分野で既知の様々な方法で行うことができ、例えば、チオール反応性またはアミノ反応性蛍光化合物とサンプル中のタンパク質を反応させ、各アレイエレメントにおける蛍光結合の量を検出し得る。
【0264】
プロテオームレベルでの毒性シグネチャも中毒学的スクリーニングに有用であり、転写物レベルでの毒性シグネチャと並行に分析するべきである。いくつかの組織のいくつかのタンパク質については、転写物の存在量とタンパク質の存在量との相関が乏しいので(Anderson, N.L. および J. Seilhamer(1997)Electrophoresis 18:533-537)、転写イメージにはそれ程影響しないがプロテオームのプロファイルを改変するような化合物の分析において、プロテオーム毒性シグネチャは有用たり得る。更に、体液中の転写物の分析はmRNAの急速な分解のために困難なので、プロテオームのプロファイル作成はこのような場合により信頼し得、情報価値があり得る。
【0265】
別の実施態様では、タンパク質を含有する生体サンプルを試験化合物で処理することにより試験化合物の毒性を算定する。処理された生体サンプル中で発現したタンパク質は、各タンパク質の量を定量し得るように分離する。各タンパク質の量を、未処理生物学的サンプル中の対応するタンパク質の量と比較する。両サンプルのタンパク質の量の差は、処理サンプル中の試験化合物に対する毒性反応を標示する。個々のタンパク質は、個々のタンパク質のアミノ酸残基をシークエンシングし、これら部分配列を本発明のポリペプチドと比較することにより同定する。
【0266】
別の実施態様では、タンパク質を含有する生体サンプルを試験化合物で処理することにより試験化合物の毒性を算定する。生体サンプルから得たタンパク質は、本発明のポリペプチドに特異的な抗体を用いてインキュベートする。抗体により認識されたタンパク質の量を定量する。処理された生物学的サンプル中のタンパク質の量を、未処理生物学的サンプル中のタンパク質の量と比較する。両サンプルのタンパク質の量の差は、処理サンプル中の試験化合物に対する毒性反応を標示する。
【0267】
マイクロアレイは、本技術分野で既知の方法で調製し、使用し、分析する(例えばBrennan, T.M. 他(1995)米国特許第5,474,796号、Schena, M. 他(1996)Proc. Natl. Acad. Sci. USA 93:10614-10619、Baldeschweiler 他(1995)PCT出願第WO95/251116号、Shalon, D.他(1995)PCT出願第WO95/35505号、Heller, R.A. 他(1997)Proc. Natl. Acad. Sci. USA 94:2150-2155、Heller, M.J. 他(1997)米国特許第5,605,662号を参照)。様々なタイプのマイクロアレイが周知であり、詳細は、DNA Microarrays: A Practical Approach, M. Schena, 編集 (1999) Oxford University Press, Londonに記載がある。
【0268】
本発明の別の実施例ではまた、GCRECをコードする核酸配列を用いて、天然のゲノム配列をマッピングするのに有用なハイブリダイゼーションプローブを作製することが可能である。コード配列または非コード配列のいずれかを用いることができ、或る例では、コード配列より非コード配列の方が好ましい。例えば、多重遺伝子族のメンバー内でのコード配列の保存により、染色体マッピング中に望ましくないクロスハイブリダイゼーションが生じる可能性がある。核酸配列は、特定の染色体、染色体の特定領域または人工形成の染色体、例えば、ヒト人工染色体(HAC)、酵母人工染色体(YAC)、細菌人工染色体(BAC)、細菌P1産物、或いは単一染色体cDNAライブラリに対してマッピングされる。(例えばHarrington, J.J.他(1997)Nat. Genet. 15:345-355; Price, C.M.(1993)Blood Rev. 7:127-134; Trask, B.J.(1991)Trends Genet. 7:149-154を参照)。一度マッピングすると、核酸配列群を用いて、例えば或る病状の遺伝を特定染色体領域の遺伝とまたは制限酵素断片長多型(RFLP)と相関させるような遺伝子連鎖地図を開発し得る(例えば、Lander, E.S.およびD. Botstein(1986)Proc. Natl. Acad. Sci. USA 83:7353-7357を参照)。
【0269】
蛍光原位置ハイブリッド形成法(FISH)は、他の物理的および遺伝的地図データと相関し得る(例えばHeinz-Ulrich,他(1995) in Meyers, 前出、965-968ページを参照)。遺伝地図データの例は、種々の科学雑誌あるいはOnline Mendelian Inheritance in Man(OMIM)のウェブサイトに見られる。物理的染色体地図上の、GCRECをコードする遺伝子の位置と、特定の疾患との相関性、あるいは特定の疾患に対する素因との相関性は、この疾患と関連するDNAの領域の決定に役立ち得るため、ポジショナルクローニングの作業を促進し得る。
【0270】
確定した染色体マーカー類を用いた連鎖分析などの物理的マッピング技術、および染色体標本の原位置ハイブリッド形成法を用いて、遺伝地図を拡張することができる。例えばマウスなど別の哺乳類の染色体上に遺伝子を配置することにより、正確な染色体上の遺伝子座が未知でも、関連するマーカー類をしばしば明らかにし得る。この情報は、ポジショナルクローニングなどの遺伝子発見技術を用いて疾患遺伝子を探る研究者にとって価値がある。いったん疾患または症候群に関与する遺伝子(群)が、血管拡張性失調症の11q22-23領域など、特定のゲノム領域への遺伝的連鎖によって、大まかに位置決めがなされると、該領域にマップされる任意の配列は、更なる調査のための関連遺伝子あるいは調節遺伝子を提示している可能性がある(例えばGatti, R.A. 他(1988) Nature 336:577-580を参照)。転座、反転などに起因する、健常者、保有者、罹病者の三者間における染色体位置の相違を検出する場合にも、本発明のヌクレオチド配列を用い得る。
【0271】
本発明の別の実施態様では、GCREC、その触媒作用断片あるいは免疫原性断片またはそのオリゴペプチド群を、種々の任意の薬剤スクリーニング技術における、化合物のライブラリ群のスクリーニングに用い得る。薬物スクリーニングに用いる断片は、溶液中に遊離しているか、固体支持物に固定されるか、細胞表面上に保持されるか、細胞内に位置することができる。GCRECと、検査する薬剤との結合による複合体の形成を、測定しうる。
【0272】
別の薬物スクリーニング方法は、目的のタンパク質に対して好適な結合親和性を有する化合物を高い処理能力でスクリーニングするために用いられる(例えばGeysen, 他(1984)PCT出願第WO84/03564号を参照)。この方法においては、多数の様々な低分子の試験用化合物を固体基板上で合成する。試験用化合物は、GCREC、或いはその断片と反応してから洗浄される。次に、結合したGCRECを本技術分野で周知の方法で検出する。精製したGCRECはまた、上記した薬剤スクリーニング技術に用いるプレート上に直接コーティングできる。別法では、非中和抗体を用いてペプチドを捕捉し、ペプチドを固体支持物に固定することもできる。
【0273】
別の実施例では、GCRECと特異結合可能な中和抗体がGCRECとの結合について試験化合物と競合する、競合的薬剤スクリーニングアッセイを用いることができる。この方法では、抗体を用いて、1つ以上の抗原決定基をGCRECと共有するどのペプチドの存在をも検出できる。
【0274】
別の実施例では、GCRECをコードするヌクレオチド配列を、将来に開発される分子生物学技術であり、現在知られているヌクレオチド配列の特性(限定はされないが、トリプレット遺伝コード、特異的な塩基対相互作用等を含む)に依存する新技術に用い得る。
【0275】
更に詳細説明をしなくとも、当業者であれば以上の説明を以って本発明を最大限に利用できるであろう。したがって、これ以下に記載する実施例は単なる例示目的にすぎず、いかようにも本発明を限定するものではない。
【0276】
前述した、および以下に記載する全ての特許出願、特許、刊行物の開示は、米国特許出願第60/300,494号(森田訳注:原文の06は間違いだとAbigailを通じて確認しました)、同第60/305,326号、同第60/308,165号、同第60/310,115号、同第60/311,413号、および同第60/314,679号も含め、言及することをもって本明細書の一部とする。
【実施例】
【0277】
cDNA ライブラリの作製
Incyte cDNA群の由来は、LIFESEQ GOLDデータベース (Incyte Genomics, Palo Alto CA)に記載されたcDNAライブラリ群である。幾つかの組織はホモジナイズしてグアニジニウムイソチオシアネート溶液に溶解し、他の組織はホモジナイズしてフェノールにまたは変性剤群の好適な混合液に溶解した。混合液の1例であるTRIZOL(Invitrogen)は、フェノールとグアニジンイソチオシアネートとの単相溶液である。結果として得た溶解物は、塩化セシウムのクッション液の上に重層して遠心分離するか、クロロフォルムで抽出した。イソプロパノールか、酢酸ナトリウムとエタノールか、いずれか一方、あるいは別の慣例的方法で、溶解物からRNAを沈殿させた。
【0278】
RNAの純度を高めるため、フェノールによるRNAの抽出および沈殿を、必要な回数繰り返した。場合によっては、DNアーゼでRNAを処理した。殆どのライブラリでは、オリゴd(T)連結常磁性粒子(Promega)、OLIGOTEXラテックス粒子(QIAGEN, Chatsworth CA)またはOLIGOTEX mRNA精製キット(QIAGEN)を用いて、ポリ(A)+RNAを単離した。別法では、別のRNA単離キット、例えばPOLY(A)PURE mRNA精製キット(Ambion, Austin TX)を用いて、組織溶解物からRNAを直接単離した。
【0279】
場合によってはStratagene社にRNAを提供し、同社が、対応するcDNAライブラリ群を作製した。そうでない場合は、UNIZAPベクターシステム(Stratagene)またはSUPERSCRIPTプラスミドシステム(Invitrogen)を用いて本技術分野で既知の推奨方法または類似の方法でcDNAを合成し、cDNAライブラリを作製した(前出のAusubel, 1997, 5.1-6.6ユニットなどを参照)。逆転写は、オリゴd(T)またはランダムプライマーを用いて開始した。合成オリゴヌクレオチドアダプターを二本鎖cDNAに連結反応させ、好適な制限酵素または酵素群でcDNAを消化した。殆どのライブラリに対しcDNAのサイズ選択(300〜1000bp)は、SEPHACRYL S1000、SEPHAROSE CL2BまたはSEPHAROSE CL4Bカラムクロマトグラフィ(Amersham Biosciences)、あるいは分取用アガロースゲル電気泳動法を用いて行った。cDNAは好適なプラスミドのポリリンカーの、適合する制限酵素部位にライゲーションされた。好適なプラスミドは、例えばPBLUESCRIPTプラスミド(Stratagene)、PSPORT1プラスミド(Invitrogen)PCDNA2.1プラスミド(Invitrogen, Carlsbad CA)、PBK-CMVプラスミド(Stratagene)、PCR2−TOPOTAプラスミド(Invitrogen)、PCMV-ICISプラスミド(Stratagene)、pIGEN(Incyte Genomics, Palo Alto CA)、pRARE (Incyte Genomics)、またはplNCY(Incyte Genomics)、またはこれらの誘導体である。組換えプラスミドは、Stratagene社のXL1-Blue、XL1-BIueMRFまたはSOLR、あるいはInvitrogen社のDH5α、DH10BまたはElectroMAX DH10Bなど適格な大腸菌細胞に形質転換した。
【0280】
cDNA クローンの単離
実施例1のようにして得たプラスミドの、宿主細胞からの回収は、UNIZAPベクターシステム(Stratagene)を用いたin vivo切除によって、あるいは細胞溶解によって行った。プラスミドを精製する方法は、MagicまたはWIZARD Minipreps DNA精製システム(Promega)、AGTC Miniprep精製キット(Edge Biosystems, Gaithersburg MD)、QIAGEN社のQIAWELL 8 Plasmid、QIAWELL 8 Plus PlasmidおよびQIAWELL 8 Ultra Plasmid 精製システム、R.E.A.L. Prep 96プラスミド精製キットの中から少なくとも1つを用いた。プラスミドは、沈殿させた後、0.1mlの蒸留水に再懸濁して、凍結乾燥して或いは凍結乾燥しないで4℃で保管した。
【0281】
別法では高処理フォーマットで直接結合PCRを用い、宿主細胞溶解物からプラスミドDNAを増幅した(Rao, V.B.(1994)Anal. Biochem. 216:1-14)。宿主細胞の溶解および熱サイクリング過程は、単一反応混合液中で行った。サンプルを加工し、それを384穴プレート内で保管し、増幅したプラスミドDNAの濃度をPICOGREEN色素(Molecular Probes, Eugene OR)およびFLUOROSKAN II蛍光スキャナ(Labsystems Oy, Helsinki, Finland)を用いて蛍光分析的に定量した。
【0282】
3 シークエンシングおよび分析
実施例2に記載したようにプラスミドから回収したIncyte cDNAを、以下に示すようにシークエンシングした。cDNAのシークエンス反応は、標準的方法あるいは高処理装置、例えばABI CATALYST 800 サーマルサイクラー(Applied Biosystems)またはPTC-200 サーマルサイクラー(MJ Research)を、HYDRAマイクロディスペンサー(Robbins Scientific)またはMICROLAB 2200(Hamilton)液体転移システムと併用して処理した。cDNAのシークエンス反応は、Amersham Biosciences社が提供する試薬、またはABIシークエンシングキット、例えばABI PRISM BIGDYE Terminator cycle sequencing ready reaction kit(Applied Biosystems)の試薬を用いて準備した。cDNAのシークエンス反応の電気泳動的分離と、標識したポリヌクレオチドの検出とには、MEGABACE 1000 DNAシークエンシングシステム(Amersham Biosciences)か、標準ABIプロトコルと塩基呼び出しソフトウェアとを用いるABI PRISM 373または377シークエンシングシステム(Applied Biosystems)か、あるいはその他の本技術分野で既知の配列解析システムを用いた。cDNA配列内のリーディングフレームは、標準的方法(前出のAusubel, 1997, 7.7ユニットに概説)を用いて同定した。いくつかのcDNA配列を選択し、実施例8に開示する技術で配列を伸長させた。
【0283】
Incyte cDNAに由来するポリヌクレオチド配列は、ベクター、リンカーおよびポリ(A)配列を除去し、あいまいな塩基をマスクすることによって有効性を確認した。その際、BLASTと、動的プログラミングと、隣接ジヌクレオチド頻度分析とに基づく、アルゴリズムとプログラムとを用いた。次に、Incyte cDNA配列またはそれらの翻訳の問い合わせを、以下のデータベース群に対して行った。すなわち、選抜した公共のデータベース群(例えばGenBankの霊長類、げっ歯類、哺乳類、脊椎動物、真核生物のデータベースと、BLOCKS、PRINTS、DOMO、PRODOM)と、ヒト、ラット、マウス、線虫(Caenorhabditis elegans)、出芽酵母(Saccharomyces cerevisiae)、分裂酵母(Schizosaccharomyces pombe)およびCandida albicansからの配列群を持つPROTEOMEデータベース群(Incyte Genomics, Palo Alto CA)、および、隠れマルコフモデル(HMM)ベースのタンパク質ファミリーデータベース群、例えばPFAM、INCY、およびTIGRFAM (Haft, D.H. 他(2001) Nucleic Acids Res. 29:41-43); 並びにHMMベースのタンパク質ドメインデータベース例えばSMART (Schultz他(1998) Proc. Natl. Acad. Sci. USA 95:5857-5864; Letunic, I. 他(2002) Nucleic Acids Res. 30:242-244)である(HMMは、遺伝子ファミリーのコンセンサス1次構造を分析する確率的アプローチである。例えばEddy, S.R. (1996) Cuff. Opin. Struct. Biol. 6:361-365等を参照)。問合せは、BLAST、FASTA、BLIMPS、およびHMMERに基づくプログラムを用いて行った。Incyte cDNA配列をアセンブリし、完全長のポリヌクレオチド配列を産出した。あるいは、GenBank cDNA群、GenBank EST群、スティッチされた配列群、ストレッチされた配列群、またはGenscan予測コード配列群(実施例4および5を参照)を用い、Incyte cDNAのアセンブリ体を完全長まで伸長させた。PhredとPhrapとConsedとに基づくプログラムを用いてアセンブリし、GenMarkとBLASTとFASTAとに基づくプログラムを用いて、cDNAのアセンブリ体を、オープンリーディングフレームについてスクリーニングした。完全長ポリヌクレオチド配列を翻訳し、対応する完全長ポリペプチド配列を引き出した。或いはポリペプチドは、完全長翻訳ポリペプチドの任意のメチオニン残基で開始し得る。完全長ポリペプチド配列群の続いての分析としての問い合わせを、GenBankタンパク質データベース群(genpept)、SwissProt、PROTEOMEデータベース群、BLOCKS、PRINTS、DOMO、PRODOMおよびProsite等のデータベースや、PFAM、INCY、およびTIGRFAM等の隠れマルコフモデル(HMM)ベースのタンパク質ファミリーデータベース群、並びにSMART等のHMMベースのタンパク質ドメインデータベース群に対し行った。完全長ポリヌクレオチド配列はまた、MACDNASIS PROソフトウェア(日立ソフトウェアエンジニアリング, South San Francisco CA)およびLASERGENEソフトウェア(DNASTAR)を用いて分析する。ポリヌクレオチドとポリペプチドとの配列アラインメントは、MEGALIGNマルチシークエンスアラインメントプログラム(DNASTAR)に組込まれたCLUSTALアルゴリズムが指定する、デフォルトパラメータを用いて作製する。これは、アラインメントした配列間の一致率も計算する。
【0284】
表7は、Incyte cDNAと完全長配列との分析とアセンブリとに用いたツールとプログラムとアルゴリズムとの概略と、適用可能な説明、参照文献、閾値パラメータを示す。用いたツール、プログラムおよびアルゴリズムを表7の列1に、それらの簡単な説明を列2に示す。列3は好適な参照文献であり、全ての文献は引用を以って全文を本明細書の一部となす。適用可能な場合には、列4は、2つの配列が一致する強さを評価するために用いた、スコア、確率値などのパラメータを示す(スコアが高いほど、または確率値が低いほど、2配列間の同一性が高い)。
【0285】
完全長ポリヌクレオチド配列群とポリペプチド配列群とのアセンブリと分析とに用いた上記プログラム群は、SEQ ID NO:27-52のポリヌクレオチド配列断片群の同定にも用いた。ハイブリダイゼーション技術と増幅技術とに有用な約20〜約4000ヌクレオチドの断片群を、表4の列2に示した。
【0286】
4 ゲノム DNA からのコード配列の同定および編集
推定上のGタンパク質共役受容体類の同定には、先ずGenscan遺伝子同定プログラムを、公共のゲノム配列データベース(例えば、gbpriやgbhtg)に対して実行した。Genscanは汎用遺伝子同定プログラムであり、様々な生物からのゲノムDNA配列を分析する(Burge, C. および S. Karlin(1997)J. Mol. Biol. 268:78-94、Burge, C. および S. Karlin(1998)Curr. Opin. Struct. Biol. 8:346-354参照)。このプログラムは予測されたエキソン群を連結し、メチオニンから終止コドンに及ぶ、アセンブリされたcDNA配列を形成する。Genscanの出力は、ポリヌクレオチドおよびポリペプチド配列のFASTAデータベースである。Genscanが一度に分析する配列の最大範囲は、30kbに設定した。これらのGenscan予測cDNA配列の内、どの配列がGタンパク質共役受容体をコードするかを判定するために、コードされるポリペプチドをPFAMモデル群に対しGタンパク質共役受容体について問合せて分析した。潜在的なGタンパク質共役受容体をも同定した。これは、既にGタンパク質共役受容体として注釈が付けられたIncyte cDNA配列群に対する相同性によって行った。これら選択したGenscan予測配列を、次にBLAST分析により、公共データベースgenpeptおよびgbpriと比較した。必要であれば、genpeptからのトップBLASTヒットと比較することによりGenscan予測配列を編集し、余分なまたは省略されたエキソンなど、Genscanが予測した配列におけるエラーを補正した。BLAST分析はまた、Genscan予測配列の、いかなるIncyte cDNAまたは公共cDNAカバレッジ(coverage)の発見にも用いられ、したがって転写の証拠を提供した。Incyte cDNAカバレッジが利用できた場合には、この情報を用いてGenscan予測配列を補正または確認した。完全長ポリヌクレオチド配列は、実施例3に記載のアセンブリプロセスを用い、Incyte cDNA配列および/または公共cDNA配列でGenscan予測コード配列をアセンブリして得た。あるいは、完全長ポリヌクレオチド配列は、編集後または非編集のGenscan予測コード配列に、完全に由来する。
【0287】
5 ゲノム配列データの cDNA 配列データとのアセンブリ
スティッチ配列( Stitched Sequence
部分cDNA配列群を伸長させるため、実施例4に記載のGenscan遺伝子同定プログラムが予測したエキソン群を用いた。実施例3に記載したようにアセンブリした部分cDNA群を、ゲノムDNAにマッピングし、また、関連するcDNA群と、1つ以上のゲノム配列からGenscan予測されたエキソン群とを有するクラスター群に分解した。cDNAとゲノムとの情報を統合すべく、グラフ理論および動的プログラミングに基づく或るアルゴリズムを用いて各クラスタを分析し、潜在的スプライス変異体群を生成した。配列群を続いて確認、編集または伸長し、完全長配列を創出した。区間の全長が、2つ以上の配列に在るような配列区間群をクラスター内で同定し、そのように同定された区間群は、推移性により、等しいと考えた。例えば、或る区間が、1つのcDNAと2つのゲノム配列とに在る場合、3つの区間は全て等しいと考えた。このプロセスにより、無関係だが連続したゲノム配列群を、cDNA配列で結び合わせて架橋し得る。このようにして同定した区間を、それらの親配列(parent sequences)に沿って現われる順にスティッチアルゴリズムで「縫い合わせ」、可能な限り最長の配列と配列変異体群とを生成した。1種類の親配列に沿って続く区間間の連鎖(cDNA−cDNAまたはゲノム配列−ゲノム配列)は、親の種類を変える連鎖(cDNA−ゲノム配列)より優先した。結果として得たスティッチ配列群を翻訳し、BLAST分析で公共データベースgenpeptおよびgbpriと比較した。Genscanが予測した不正確なエキソン群は、genpeptからのトップBLASTヒットとの比較により補正した。必要な場合、追加cDNA配列群を用いるかゲノムDNAの検査により、配列群を更に伸長させた。
【0288】
ストレッチ配列( Stretched Sequence
部分DNA配列群を、BLAST分析に基づく1アルゴリズムで完全長まで伸長した。先ず、BLASTプログラムを用い、GenBankの霊長類、げっ歯類、哺乳類、脊椎動物および真核生物のデータベースなどの公共データベースに対し、実施例3に記載のようにアセンブリした部分cDNAを問い合わせた。次に、最も近いGenBankタンパク質相同体を、BLAST分析により、Incyte cDNA配列または実施例4に記載のGenScanエキソン予測配列のいずれかと比較した。得られた高スコアリングセグメント対(HSP)を用いてキメラタンパク質を産出し、翻訳した配列をGenBankタンパク質相同体上にマッピングした。元のGenBankタンパク質相同体に対し、キメラタンパク質内では挿入または欠失が起こり得る。GenBankタンパク質相同体、キメラタンパク質またはその両方をプローブとして用い、公共ヒトゲノムデータベースから相同ゲノム配列を検索した。このようにして、部分的なDNA配列を、相同ゲノム配列の付加によりストレッチすなわち伸長した。結果として得られるストレッチ配列を検査し、完全遺伝子を含むか否かを判定した。
【0289】
GCREC をコードするポリヌクレオチドの染色体マッピング
SEQ ID NO:27-52をアセンブリするために用いた配列群を、BLAST他のSmith-Watermanアルゴリズムの実装群を用いて、Incyte LIFESEQデータベースおよび公共ドメインデータベース群の配列と比較した。SEQ ID NO:27-52と一致するこれらのデータベースの配列を、Phrapなどのアセンブリアルゴリズム(表7)を使用して、連続しオーバーラップする配列のクラスタ群にアセンブリした。スタンフォード・ヒトゲノムセンター(SHGC)、ホワイトヘッド・ゲノム研究所(WIGR)、Genethonなどの公的な情報源から入手可能な放射線ハイブリッドおよび遺伝地図データを用いて、いずれかのクラスター化された配列が既にマッピングされているかを判定した。マッピングされた配列が或るクラスターに含まれている場合、そのクラスターの全配列が、個々の配列番号と共に、地図上の位置に割り当てられた。
【0290】
地図上の位置は、ヒト染色体の範囲または区間として表される。或る区間の地図上の位置(センチモルガン単位)は、染色体の短腕(p-arm)の末端に対して測定する(センチモルガン(cM)は、染色体マーカー間の組換え頻度に基づく計測単位である。平均して、1cMは、ヒトDNAの1メガベース(Mb)にほぼ等しい。尤も、この値は、組換えのホットスポットおよびコールドスポットに起因して広範囲に変化する)。cM距離は、各クラスタ内に配列が含まれる放射線ハイブリッドマーカー類に対して境界を提供するGenethonによってマッピングされた遺伝マーカー群に基づく。NCBI「GeneMap'99」(http://www.ncbi.nlm.nih.gov/genemap/)など一般個人が入手可能なヒトゲノム地図などの資源を用いて、既に同定された疾患遺伝子類が、上記の区間内若しくは近傍にマップされているかを判定できる。
【0291】
7 ポリヌクレオチド発現の分析
ノーザン分析は、遺伝子の転写物の存在を検出するために用いられる実験技術であり、特定の細胞種または組織からのRNAが結合している膜への、標識されたヌクレオチド配列のハイブリダイゼーションに関与する(例えば前出のSambrook, 7章、同Ausubel (1995) 4章および16章を参照)。
【0292】
類似の、BLASTを応用したコンピュータ技術を用いて、GenBankやLIFESEQ(Incyte Genomics)などのcDNAデータベースにおいて、同一または関連分子を検索した。ノーザン分析は、幾つかの膜系ハイブリダイゼーションよりも非常に速い。更に、任意の特定の一致を厳密なあるいは相同的なものとして分類するか否かを決定するため、コンピュータ検索の感度を修正できる。検索の基準は積スコアであり、次式で定義する。
【0293】
【数1】
Figure 2005500037
【0294】
積スコアは、2つの配列間の類似度と、配列が一致する長さとの両方を考慮している。積スコアは0〜100のノーマライズされた値であり、次のようにして求める。BLASTスコアにヌクレオチドの配列一致率を乗じ、その積を2つの配列の短い方の長さの5倍で除する。BLASTスコアを計算するには、或る高スコアリングセグメント対(HSP)内の一致する各塩基に+5のスコアを割り当て、各不一致塩基に−4を割り当てる。2つの配列は、2以上のHSPを共有し得る(ギャップにより隔離される)。2以上のHSPがある場合には、最高BLASTスコアのセグメント対を用いて積スコアを計算する。積スコアは、断片的オーバーラップとBLASTアラインメントの質とのバランスを表す。例えば積スコア100は、比較した2つの配列の短い方の長さ全体にわたって100%一致する場合のみ得られる。積スコア70は、一端が100%一致し、70%オーバーラップしているか、他端が88%一致し、100%オーバーラップしているかのいずれかの場合に得られる。積スコア50は、一端が100%一致し、50%オーバーラップしているか、79%一致し、100%オーバーラップしているかのいずれかの場合に得られる。
【0295】
或いは、GCRECをコードするポリヌクレオチドを、由来する組織源について分析する。例えば幾つかの完全長配列は、少なくとも一部は、オーバーラップするIncyte cDNA配列群を用いてアセンブリする(実施例3を参照)。各cDNA配列は、ヒト組織から作製のcDNAライブラリに由来する。各ヒト組織は、以下の臓器/組織カテゴリの1つへ分類される。すなわち心血管系、結合組織、消化器系、胎芽構造、内分泌系、外分泌腺、女性生殖器、男性生殖器、生殖細胞、血液および免疫系、肝、筋骨格系、神経系、膵臓、呼吸器系、感覚器、皮膚、顎口腔系、非分類性/混合性または尿路である。各カテゴリーのライブラリ数を数えて、全カテゴリーの総ライブラリ数で除する。同様に、各ヒト組織は、以下の疾患/条件カテゴリー、すなわち癌、細胞株、発達、炎症、神経性、外傷、心血管、プール、その他の1つに分類される。各カテゴリーのライブラリ数を数えて、全カテゴリーの総ライブラリ数で除する。得られるパーセンテージは、GCRECをコードするcDNAの、組織特異的発現および疾患特異的発現を反映する。cDNA配列およびcDNAライブラリ/組織の情報は、LIFESEQ GOLD データベース(Incyte Genomics, Palo Alto CA)から取得できる。
【0296】
GCREC をコードするポリヌクレオチドの伸長
完全長ポリヌクレオチドを、完全長分子の適切な断片から設計したオリゴヌクレオチドプライマー群を用いて該断片を伸長させ産生する。或るプライマーは既知の断片の5'伸長を開始するべく合成し、別のプライマーは既知の断片の3'伸長を開始するべく合成した。開始プライマー群の設計にはOLIGO 4.06ソフトウェア(National Biosciences)或いは別の適切なプログラムを用い、長さが約22〜30ヌクレオチド、GC含有率が約50%以上となり、約68〜約72℃の温度で標的配列にアニーリングするようにした。ヘアピン構造およびプライマー−プライマー二量体を生ずるようなヌクレオチド群の伸長は、全て回避した。
【0297】
選択したヒトcDNAライブラリ群を用い、配列を伸長した。2段階以上の伸長が必要または望ましい場合には、付加的プライマーあるいはプライマーのネステッドセットを設計した。
【0298】
高忠実度の増幅を、当業者に周知の方法を用いたPCR法で得た。PCRは、PTC-200サーマルサイクラー(MJ Research, Inc.)を用い96穴プレート内で行った。反応混液は、鋳型DNAを有し、また、200 nmolの各プライマーを有する。また、Mg +と(NH4)2SO4と2−メルカプトエタノールとを含有する反応バッファーと、Taq DNAポリメラーゼ(Amersham Biosciences)と、ELONGASE酵素(Invitrogen)と、Pfu DNAポリメラーゼ(Stratagene)とを含有する。プライマー対であるPCI AとPCI Bとに対し、以下のパラメータで増幅した。ステップ1:94℃で3分間。ステップ2:94℃で15秒間。ステップ3:57℃で1分間。ステップ4:68℃で2分間。ステップ5:ステップ2、3および4を20回繰り返す。ステップ6:68℃で5分間。ステップ7:4℃で保存。
【0299】
各ウェルのDNA濃度は、1×TEおよび0.5μlの希釈していないPCR産物に溶解した100μlのPICOGREEN定量試薬(0.25%(v/v) PICOGREEN; Molecular Probes, Eugene OR)を不透明な蛍光光度計プレート(Corning Costar, Acton MA)の各ウェルに分配し、DNAが試薬と結合できるようにして判定した。サンプルの蛍光を計測してDNAの濃度を定量すべく、プレートをFluoroskan II(Labsystems Oy, Helsinki, Finland)でスキャンした。反応混合物のアリコット5〜10μlを1%アガロースゲル上で電気泳動法によって解析し、どの反応が配列の伸長に成功したかを判定した。
【0300】
伸長したヌクレオチドは、脱塩および濃縮して384穴プレートに移し、CviJIコレラウイルスエンドヌクレアーゼ(Molecular Biology Research, Madison WI)を用いて消化し、音波処理またはせん断し、pUC 18ベクター(Amersham Biosciences)への再連結を行った。ショットガン・シークエンシングのために、消化したヌクレオチドを低濃度(0.6〜0.8%)のアガロースゲル上で分離し、断片を切除し、寒天をAgar ACE(Promega)で消化した。伸長させたクローンをT4リガーゼ(New England Biolabs, Beverly MA)を用いてpUC 18ベクター(Amersham Biosciences)に再連結し、Pfu DNAポリメラーゼ(Stratagene)で処理して制限部位のオーバーハングを満たし、適格な大腸菌細胞に形質移入した。形質移入した細胞群の選択を、抗生物質を含む培地で行い、それぞれのコロニーを採取し、LB/2Xカルベニシリン培養液中の384ウェルプレート群に37℃で一晩培養した。
【0301】
細胞を溶解し、Taq DNAポリメラーゼ(Amersham Biosciences)およびPfu DNAポリメラーゼ(Stratagene)を用いて以下のパラメータでDNAをPCR増幅した。ステップ1:94℃で3分間。ステップ2:94℃で15秒間。ステップ3:60℃で1分間。ステップ4:72℃で2分間。ステップ5:ステップ2、3および4を29回繰り返す。ステップ6:72℃で5分間。ステップ7:4℃で保存。DNAの定量化には、上記したようにPICOGREEN試薬(Molecular Probes)を用いた。DNA回収率が低いサンプルは、上記同一条件で再増幅した。サンプルは20%ジメチルスルホキシド(1:2,v/v)で希釈し、DYENAMICエネルギー移動シークエンシングプライマー、およびDYENAMIC DIRECT kit(Amersham Biosciences)またはABI PRISM BIGDYEターミネーターサイクルシークエンシングレディ反応キット(Terminator cycle sequencing ready reaction kit)(Applied Biosystems)を用いてシークエンスした。
【0302】
同様に、上記手順を用いて完全長ポリヌクレオチドを検証した。あるいは、完全長ポリヌクレオチドを用い、上記手順で、そのような伸長のために設計したオリゴヌクレオチド類と、或る適切なゲノムライブラリとを用いて5'調節配列を得た。
【0303】
GCREC をコードするポリヌクレオチドにおける1塩基多型の同定
1塩基多型(SNP)として知られる一般的なDNA配列変異体が、SEQ ID NO:27-52において、LIFESEQデータベース(Incyte Genomics)を用いて同定された。同じ遺伝子からの配列群は共にクラスター化され、実施例3に述べたようにアセンブリされて、その遺伝子における全ての配列変異体の同定を可能にした。一連のフィルタ群を有する或るアルゴリズムを用いて、SNPを他の配列変異体から区別した。前段フィルタ群(preliminary filters)が過半の塩基呼び出し(basecall)エラーの除去を、最少Phred質スコア15を要求することによって行い、また、配列アラインメントエラーと、ベクター配列、キメラ、およびスプライス変異体の不適切なトリミングの結果であるエラーとをも除去した。先進の染色体分析の自動化された手順によって、推定上のSNPの近傍にある、オリジナルのクロマトグラムファイル群を分析した。クローンエラーフィルタ群は、統計的に発生させたアルゴリズムを用いて、実験室でのプロセス中に生じたエラーを同定した。エラーとしては、逆転写酵素、ポリメラーゼ、または常染色体突然変異によって起きたエラーがある。クラスター化エラーフィルタ群は、統計的に発生させたアルゴリズムを用いて、近縁の相同体群または偽遺伝子群のクラスター化の結果であるエラーや、非ヒト配列による汚染が原因のエラーを同定した。最終セットのフィルタ群は、免疫グロブリンまたはT細胞受容体において見られる重複(duplicates)とSNPとを除去した。
【0304】
幾つかのSNPは、更なる特徴付けの為に選択された。選択は高処理MASSARRAYシステム(Sequenom, Inc.)を用いた質量分析によって行い、4群の異なるヒト集団におけるSNP部位での対立遺伝子頻度を分析した。白人集団は92個体(46名の男子、46名の女子)からなり、83名はユタ出身、4名はフランス人、3名はベネズエラ人、2名はアーミッシュの人々である。アフリカ集団は194個体(97名の男子、97名の女子)からなり、全員がアフリカ系アメリカ人である。ヒスパニック集団は324個体(162名の男子、162名の女子)からなり、全員がメキシコのヒスパニックである。アジア集団は126個体(64名の男子、62名の女子)からなり、報告された親の内訳は43%が中国人、31%が日本人、13%がコリアン、5%がベトナム人、8%が他のアジア人である。対立遺伝子頻度の分析は先ず白人集団においてなされ、幾つかの場合、SNPの内、対立遺伝子変異をこの集団において示さなかったSNPは、更に他の3集団においてテストされることは無かった。
【0305】
10 個々のハイブリダイゼーションプローブの標識化および使用
SEQ ID NO:27-52由来のハイブリダイゼーションプローブを用いて、cDNA、mRNA、またはゲノムDNAをスクリーニングする。約20塩基対からなるオリゴヌクレオチドの標識について特に記載するが、より大きなヌクレオチド断片に対しても本質的に同一の手順が用いられる。オリゴヌクレオチドは、OLIGO 4.06ソフトウェア(National Biosciences)等の最新ソフトウェアを用いて設計し、各オリゴマー50pmolと、[γ-32P]アデノシン3リン酸(Amersham Biosciences)250μCiと、T4ポリヌクレオチドキナーゼ(DuPont NEN, Boston MA)とを化合させることにより標識する。標識したオリゴヌクレオチドは、SEPHADEX G-25超細繊分子サイズ排除デキストラン ビーズカラム(Amersham Biosciences)を用いて実質的に精製する。Ase I、Bgl II、Eco RI、Pst I、Xba IまたはPvu II(DuPont NEN)のいずれか1つのエンドヌクレアーゼで消化されたヒトゲノムDNAの、典型的な膜ベースのハイブリダイゼーション解析において、毎分107カウントの標識されたプローブを含むアリコットを用いる。
【0306】
各消化物から得たDNAは、0.7%アガロースゲル上で分画してナイロン膜(Nytran Plus, Schleicher & Schuell, Durham NH)に移す。ハイブリダイゼーションは、40℃で16時間行う。非特異的シグナル群を除去するため、最大で例えば0.1×クエン酸ナトリウム食塩水および0.5%ドデシル硫酸ナトリウムの条件下で、ブロット群を室温で順次洗浄する。オートラジオグラフィーまたはそれに代わるイメージング手段を用いてハイブリダイゼーションパターンを視覚化し、比較する。
【0307】
11 マイクロアレイ
或るマイクロアレイ上でのアレイエレメント群の連接または合成は、フォトリソグラフィ、ピエゾ式印刷(インクジェット印刷、前出のBaldeschweilerなどを参照)、機械的マイクロスポッティング技術およびこれらから派生した技術を用いて達成し得る。上記各技術において基板は、均一な、無孔の表面を持つ固体とすべきである(Schena(1999)前出)。推奨する基板には、シリコン、シリカ、スライドガラス、ガラスチップおよびシリコンウェハがある。あるいは、ドットブロット法またはスロットブロット法に類似した手順を利用し、熱的、紫外線的、化学的または機械的結合手順を用いて基板の表面にエレメントを配置および結合させてもよい。通常のアレイは、利用可能な、当業者に公知の方法と機械とを用いて作製でき、任意の適正数のエレメントを有し得る(例えばSchena, M. 他(1995) Science 270:467-470; Shalon, D.他(1996) Genome Res.6:639-645; Marshall, A. および J. Hodgson (1998) Nat. Biotechnol. 16:27-31を参照)。
【0308】
完全長cDNA、発現配列タグ(EST)、またはそれらの断片またはオリゴマーが、マイクロアレイのエレメントと成り得る。ハイブリダイゼーションに好適な断片またはオリゴマーを、LASERGENEソフトウェア(DNASTAR)など本技術分野で公知のソフトウェアを用いて選択することが可能である。アレイエレメント群を、生体サンプル中のポリヌクレオチド群とハイブリダイズする。生体サンプル中のポリヌクレオチドは、検出を容易にするために蛍光標識などの分子タグに抱合させる。ハイブリダイゼーション後、生体サンプルからのハイブリダイズされていないヌクレオチドを除去し、蛍光スキャナを用いて各アレイエレメントでのハイブリダイゼーションを検出する。あるいは、レーザー脱離および質量スペクトロメトリを用いてもハイブリダイゼーションを検出し得る。マイクロアレイ上の或るエレメントにハイブリダイズする各ポリヌクレオチドの、相補性の度合と相対存在度とを算定し得る。一実施態様におけるマイクロアレイの調製および使用について、以下に詳述する。
【0309】
組織または細胞サンプルの調製
全RNAを組織サンプルから単離するためグアニジニウム チオシアネート法を用い、ポリ(A)+RNAを精製するためオリゴ(dT)セルロース法を用いる。各ポリ(A)+RNAサンプルを逆転写するため、MMLV逆転写酵素を用い、また、0.05pg/μlのオリゴ(dT)プライマー(21mer)、1×第一鎖バッファ、0.03unit/μlのRNアーゼ阻害因子、500μMのdATP、500μMのdGTP、500μMのdTTP、40μMのdCTP、40μMのdCTP-Cy3(BDS)またはdCTP-Cy5(Amersham Biosciences)を用いる。逆転写反応は、GEMBRIGHTキット(Incyte)を用い、200ngのポリ(A)+RNAを含有する体積25mlで行う。特異的対照ポリ(A)+RNA群は、非コード酵母ゲノムDNAからin vitro転写により合成する。37℃で2時間インキュベートした後、各反応サンプル(1つはCy3、もう1つはCy5標識)は、2.5mlの0.5M水酸化ナトリウムで処理し、85℃で20分間インキュベートし、反応を停止させてRNAを分解させる。サンプル群の精製には、2つの連続するCHROMA SPIN 30ゲル濾過スピンカラム(CLONTECH Laboratories, Inc. (CLONTECH), Palo Alto CA)を用いる。混合後、2つの反応サンプルのエタノール沈殿を、1mlのグリコーゲン(1mg/ml)、60mlの酢酸ナトリウム、および300mlの100%エタノールで行う。サンプルは次に、SpeedVAC(Savant Instruments Inc., Holbrook NY)を用いて完全に乾燥させ、14μlの5×SSC/0.2%SDS中で再懸濁する。
【0310】
マイクロアレイの調製
本発明の配列を用いて、アレイエレメントを作製する。各アレイエレメントは、クローン化したcDNAインサート群と、ベクター群とを含有する細菌細胞群から増幅する。PCR増幅は、cDNAインサートに隣接するベクター配列群に相補的なプライマー類を用いる。30サイクルのPCRによって、1〜2ngの初期量から5μgを超える最終量まで、アレイエレメントを増幅する。増幅したアレイエレメントは、SEPHACRYL-400(Amersham Biosciences)を用いて精製する。
【0311】
精製したアレイエレメントは、ポリマーコートされたスライドグラス上に固定する。顕微鏡スライドグラス(Corning)は、0.1%のSDSおよびアセトン中で超音波洗浄し、処理の間および処理後に充分に蒸留水で洗浄する。スライドグラスは、4%フッ化水素酸(VWR Scientific Products Corporation(VWR), West Chester PA)中でエッチングし、充分に蒸留水中で洗浄し、95%エタノール中で0.05%アミノプロピルシラン(Sigma)を用いてコーティングする。コーティングしたスライドは、110℃のオーブンで硬化させる。
【0312】
米国特許第5,807,522号に記載されている手順を用いて、コーティングしたガラス基板にアレイエレメント群を付加する。この特許は、引用を以って本明細書の一部とする。平均濃度100ng/μlのアレイエレメントDNA1μlを、高速ロボット装置(robotic apparatus)により、開放型キャピラリープリンティングエレメント(open capillary printing element)に充填する。装置はここで、スライド毎に約5nlのアレイエレメントサンプルを置く。
【0313】
マイクロアレイをUV架橋するため、STRATALINKER UV架橋剤(Stratagene)を用いる。マイクロアレイの洗浄を、室温において、0.2%SDSで1回、蒸留水で3回行う。非特異結合部位をブロックするため、マイクロアレイのインキュベートをリン酸緩衝生理食塩水(PBS)(Tropix, Inc., Bedford MA)中の0.2%カゼイン中において60℃で30分間行った後、前に行ったように0.2%SDSおよび蒸留水で洗浄する。
【0314】
ハイブリダイゼーション
ハイブリダイゼーション反応に用いる9μlのサンプル混合体には、Cy3またはCy5で標識したcDNA合成産物群の各0.2μgを、5×SSC,0.2%SDSハイブリダイゼーション緩衝液中に含む。サンプル混合体は、65℃まで5分間加熱し、マイクロアレイ表面上へ等分して1.8cm2のカバーガラスで覆う。アレイを、顕微鏡用スライドよりわずかに大きい空洞を有する防水チェンバーに移す。チェンバー内を湿度100%に保つため、140μlの5×SSCをチェンバーの1コーナーに加える。アレイを入れたチェンバーは、60℃で約6.5時間インキュベートする。アレイは、第1洗浄緩衝液中(1×SSC,0.1%SDS)において45℃で10分間洗浄し、第2洗浄緩衝液中(0.1×SSC)において45℃で10分間ずつ3回洗浄し、乾燥させる。
【0315】
検出
レポーター標識したハイブリダイゼーション複合体を検出するには、Cy3の励起のために488nm、Cy5の励起のために632nmでスペクトル線を発生し得るInnova70混合ガス10Wレーザー(Coherent, Inc., Santa Clara CA)を備えた顕微鏡を用いる。励起レーザー光の焦点をアレイ上に置くため、20×顕微鏡対物レンズ(Nikon, Inc., Melville NY)を用いる。アレイを含むスライドを、顕微鏡の、コンピュータ制御のX-Yステージに置き、対物レンズを通してラスタースキャンする。本実施例で用いる1.8cm×1.8cmのアレイは、解像度20μmでスキャンする。
【0316】
異なる2回のスキャンで、混合ガスマルチラインレーザーは2つのフルオロフォアを連続的に励起する。発光された光は、波長に基づき分離され、2つのフルオロフォアに対応する2つの光電子増倍管検出器(PMT R1477, Hamamatsu Photonics Systems, Bridgewater NJ)に送られる。好適なフィルタ群をアレイと光電子増倍管との間に設置して、シグナルをフィルタする。用いるフルオロフォアの最大発光の波長は、Cy3では565nm、Cy5では650nmである。装置は両方のフルオロフォアからのスペクトルを同時に記録し得るが、レーザー源において好適なフィルタを用いて、フルオロフォア1つにつき1度スキャンし、各アレイを通常2度スキャンする。
【0317】
通常、各スキャンの感度を較正するため、cDNA対照種を或る既知濃度でサンプル混合体に添加し、対照種が発生するシグナル強度を用いる。アレイ上の或る特定の位置には或る相補的DNA配列が含まれ、その位置におけるシグナルの強度をハイブリダイゼーション種の重量比1:100,000で相関させる。異なる源泉(例えば代表的な試験細胞および対照細胞など)からの2つのサンプルを、各々異なるフルオロフォアで標識し、異なる発現をする遺伝子群を同定するために単一のアレイにハイブリダイズする場合には、較正するcDNAのサンプルを2種のフルオロフォアで標識し、ハイブリダイゼーション混合液に各々等量を加えることによって較正を行う。
【0318】
光電子増倍管の出力をディジタル化するため、IBMコンパチブルPCコンピュータにインストールした12ビットRTI-835Hアナログディジタル(A/D)変換ボード(Analog Devices, Inc., Norwood MA)を用いる。ディジタル化したデータは、青色(低シグナル)から赤色(高シグナル)までの擬似カラースケールへのリニア20色変換を用いて、シグナル強度がマッピングされたイメージとして表示される。データは、定量的にも分析される。2つの異なるフルオロフォアを同時に励起および測定する場合には、各フルオロフォアの発光スペクトルを用いて、データは先ずフルオロフォア間の光学的クロストーク(発光スペクトルの重なりに起因する)を補正される。
【0319】
グリッドが蛍光シグナルイメージ上に重ねられ、それによって各スポットからのシグナルはグリッドの各エレメントに集められる。各エレメント内の蛍光シグナルは統合され、シグナルの平均強度に応じた数値が得られる。シグナル分析に用いるソフトウェアは、GEMTOOLS遺伝子発現分析プログラム(Incyte)である。少なくとも約2倍の発現変化、2.5以上のSB比、および少なくとも40%のエレメントスポットサイズを示したアレイエレメントが、差次的発現を示したとしてGEMTOOLSプログラム(Incyte Genomics)で同定された。
【0320】
12 相補的ポリヌクレオチド
GCRECをコードする配列に、或いはその任意の一部に対して相補的な配列は、天然GCRECの発現を、検出し、低下させ、または阻害するために用いられる。約15〜30塩基対を含むオリゴヌクレオチドの使用について記すが、これより小さなあるいは大きな配列の断片の場合でも、本質的に同じ手順を用いる。Oligo4.06ソフトウェア(National Biosciences)と、GCRECのコーディング配列を用いて、適切なオリゴヌクレオチドを設計する。転写を阻害するには、最も独特な5'配列から相補的オリゴヌクレオチドを設計し、これを用いて、プロモーターがコーディング配列に結合するのを防止する。翻訳を阻害するには、相補的なオリゴヌクレオチドを設計して、GCRECをコードする転写物にリボソームが結合するのを防ぐ。
【0321】
13 GCREC の発現
GCRECの発現及び精製は、細菌若しくはウイルスを基にした発現系を用いて成される。細菌内でGCRECを発現させるには、抗生物質耐性遺伝子と、cDNAの転写レベルを高める誘導性プロモーターとを持つ、好適なベクターに、cDNAをサブクローニングする。このようなプロモーターとしては、lacオペレーター調節エレメントと併用するT5またはT7バクテリオファージプロモーター、およびtrp-lac(tac)ハイブリッドプロモーターが含まれるが、これらに限定するものではない。組換えベクターを、BL21(DE3)などの好適な細菌宿主に形質転換する。抗生物質耐性細菌は、イソプロピルβ-Dチオガラクトピラノシド(IPTG)で誘導されるとGCRECを発現する。真核細胞でのGCRECの発現は、昆虫細胞株または哺乳動物細胞株に、一般にバキュロウイルスとして知られるAutographica californica核多角体病ウイルス(AcMNPV)の組換え型を感染させて行う。バキュロウイルスの非必須ポリヘドリン遺伝子を、GCRECをコードするcDNAと置換する。置換は、相同組換えによって、或いは、トランスファープラスミドの媒介を伴う、細菌の媒介による遺伝子転移によって行う。ウイルスの感染力は維持され、強力なポリヘドリンプロモーターによって高レベルのcDNA転写が行われる。組換えバキュロウイルスは、多くの場合は夜蛾の1種Spodoptera frugiperda(Sf9)昆虫細胞への感染に用いるが、ヒト肝細胞への感染に用いることもある。後者の感染の場合は、バキュロウイルスへの更なる遺伝的修飾が必要になる(Engelhard, E.K.他(1994) Proc. Natl. Acad. Sci. USA 91:3224-3227; Sandig, V.他(1996) Hum.Gene Ther. 7:1937-1945を参照)。
【0322】
殆どの発現系では、GCRECが、例えばグルタチオンSトランスフェラーゼ(GST)と、またはFLAGや6-Hisなどのペプチドエピトープ標識と合成されて融合タンパク質になり、未精製の細胞溶解物からの組換え融合タンパク質の親和性ベースの精製を、迅速に1ステップで行い得る。GSTは日本住血吸虫からの26kDaの酵素であり、タンパク質の活性および抗原性を維持した状態で、固定化したグルタチオン上での融合タンパク質の精製を可能とする(Amersham Biosciences)。精製後、GST部分を、特異的に操作した諸部位において、GCRECからタンパク分解的に切断できる。FLAGは8アミノ酸のペプチドであり、市販されているモノクローナルおよびポリクローナル抗FLAG抗体(Eastman Kodak)を用いた免疫親和性精製を可能にする。6ヒスチジン残基が連続して伸長した6-Hisは、金属キレート樹脂上での精製を可能にする(QIAGEN)。タンパク質の発現および精製の方法は、前出のAusubel(1995)10章、16章に記載されている。GCRECをこれらの方法で精製し直接用いて、以下の実施例17、18及び19の、適用可能なアッセイを行い得る。
【0323】
14 機能的アッセイ
GCREC機能は、哺乳類細胞培養系において生理学的に高められたレベルでのGCRECをコードする配列の発現によって算定する。cDNAを高いレベルで発現する強いプロモーターを含む哺乳類発現ベクターにcDNAをサブクローニングする。選択されるベクターとしては、PCMV SPORTプラスミド(Invitrogen, Carlsbad CA)およびPCR 3.1プラスミド(Invitrogen)があり、どちらもサイトメガロウイルスプロモーターを持つ。リポソーム製剤あるいは電気穿孔法を用いて、5〜10μgの組換えベクターをヒト細胞株、例えば内皮由来または造血由来の細胞株に、一過的に形質移入する。更に、標識タンパク質をコードする配列を含む1〜2μgのプラスミドを同時に形質移入する。標識タンパク質の発現により、形質移入細胞と非形質移入細胞を区別する手段が与えられる。また、標識タンパク質の発現によって、組換えベクターからのcDNA発現を正確に予想できる。標識タンパク質は、例えば緑色蛍光タンパク質(GFP;Clontech)、CD64またはCD64-GFP融合タンパク質から選択できる。自動化された、レーザー光学に基づく技術であるフローサイトメトリー(FCM)を用いて、GFPまたはCD64-GFPを発現する形質移入された細胞を同定し、それらの細胞のアポトーシス状態や他の細胞特性を評価する。FCMは、細胞死に先行するかあるいは同時に発生する現象を診断する蛍光分子の取込を検出して計量する。このような現象として挙げられるのは、ヨウ化プロピジウムによるDNA染色によって計測される核DNA含量の変化、前方散乱光と90°側方散乱光によって計測される細胞サイズと顆粒性の変化、ブロモデオキシウリジンの取込量の低下によって計測されるDNA合成の下方制御、特異抗体との反応性によって計測される細胞表面および細胞内におけるタンパク質の発現の変容、および、フルオレセイン抱合したアネキシンVタンパク質の細胞表面への結合によって計測される原形質膜組成の変容がある。フローサイトメトリー法については、Ormerod, M.G.(1994)Flow Cytometry, Oxford, New York NYに記述がある。
【0324】
遺伝子発現へのGCRECの影響は、GCRECをコードする配列とCD64またはCD64-GFPのどちらかが形質移入された高度に精製された細胞集団を用いて算定することができる。CD64またはCD64-GFPは、形質移入された細胞表面で発現し、ヒト免疫グロブリンG(IgG)の保存された複数の領域に結合する。形質移入された細胞と形質移入されない細胞とは、ヒトIgGかCD64に対する抗体のどちらかで被覆された磁気ビーズを用いて効率よく分離できる(DYNAL, Lake Success NY)。mRNAは、これら細胞から、当業者に周知の方法で精製できる。GCRECと目的の他の遺伝子群とをコードするmRNAの発現は、ノーザン分析やマイクロアレイ技術で分析できる。
【0325】
15 GCREC 特異抗体の産生
実質的に精製されたGCRECを、ポリアクリルアミドゲル電気泳動法(PAGE;例えば、Harrington, M.G.(1990)Methods Enzymol.182:488-495を参照)または他の精製技術で行い、これを用いて標準的なプロトコルで動物(例えばウサギ、マウスなど)を免疫化して抗体を作り出す。
【0326】
あるいは、LASERGENEソフトウェア(DNASTAR)を用いてGCRECアミノ酸配列を解析し、免疫原性の高い領域を決定する。そして対応するオリゴペプチドを合成し、このオリゴペプチドを用いて当業者によく知られている方法で抗体を生成する。C末端付近あるいは親水性領域などの、適切なエピトープの選択方法については、当分野に記述が多い(前出のAusubel, 1995, 11章などを参照)。
【0327】
通常は、長さ約15残基のオリゴペプチドを、FMOCケミストリを用いるABI 431A ペプチドシンセサイザ(Applied Biosystems)を用いて合成し、N-マレイミドベンゾイル-N-ヒドロキシスクシンイミドエステル(MBS)を用いた反応によってKLH(Sigma-Aldrich, St. Louis MO)に結合させて、免疫原性を高める(例えば前出のAusubel, 1995を参照)。完全フロイントアジュバントにおいて、オリゴペプチド-KLH複合体を用いてウサギを免疫化する。得られた抗血清の抗ペプチド活性および抗GCREC活性を検査するため、例えば、ペプチドまたはGCRECを或る基板に結合し、1%BSAを用いてブロッキング処理し、ウサギ抗血清と反応させて洗浄し、更に、放射性ヨウ素標識したヤギ抗ウサギIgGと反応させる。
【0328】
16 特異抗体を用いた天然 GCREC の精製
天然GCREC或いは組換えGCRECを、GCRECに特異的な抗体を用いるイムノアフィニティークロマトグラフィにより実質的に精製する。イムノアフィニティーカラムは、CNBr-活性化したSEPHAROSE(Amersham Biosciences)のような活性化クロマトグラフィー用レジンと抗GCREC抗体とを共有結合させることにより形成する。結合後に、製造者の使用説明書に従ってこのレジンをブロックし、洗浄する。
【0329】
GCRECを有する培養液をイムノアフィニティーカラムに通し、GCRECを優先的に吸着できる条件で(例えば、界面活性剤の存在下で高イオン強度のバッファーで)そのカラムを洗浄する。そのカラムを、抗体とGCRECとの結合を切るような条件で(例えば、或るpH2〜3のバッファー、あるいは高濃度の、例えば尿素またはチオシアン酸イオンなどのカオトロープで)溶出させ、GCRECを回収する。
【0330】
17 GCREC と相互作用する分子の同定
GCRECと相互作用する分子としては、Gタンパク質など、シグナル伝達に関与する分子や、アゴニスト及びアンタゴニストを含み得る。GCRECまたはその断片を、125Iボルトンハンター試薬で標識する(例えば Bolton A.E.及びW.M. Hunter (1973) Biochem. J. 133:529-539を参照)。GCRECの断片としては例えば、3つの細胞外ループのうち1つ以上のループ、細胞外N末端領域、または第3細胞内ループ、を有する断片がある。マルチウェルプレートの各ウェルに予め配列しておいた候補の分子群を、標識したGCRECと共にインキュベートし、洗浄して、標識したGCREC複合体を有する全てのウェルをアッセイする。GCREC濃度を変えて得たデータを用いて、GCRECの数、候補リガンド分子との親和性および会合の値を計算する。
【0331】
別法では、GCRECと相互作用する分子を、Fields, S.およびO. Song(1989, Nature 340:245-246)に記載の酵母2−ハイブリッドシステム(yeast two-hybrid system)や、MATCHMAKERシステム(Clontech)などの2−ハイブリッドシステムに基づいた市販のキットを用いて分析する。
【0332】
GCRECはまた、ハイスループット型の酵母2ハイブリッドシステムを使用するPATHCALLINGプロセス(CuraGen Corp., New Haven CT)に用いて、遺伝子の2大ライブラリによってコードされるタンパク質間の全ての相互作用を決定し得る(Nandabalan, K. 他(2000) 米国特許第6,057,101号)。
【0333】
潜在的なGCRECのアゴニスト若しくはアンタゴニストを、GCREC受容体作用の活性化または阻害について、実施例18および19で記述したアッセイを用いてテストし得る。候補分子は、既知のGCRECアゴニストまたはアンタゴニスト、ペプチドライブラリ、または組み合わせの化学ライブラリから選択し得る。
【0334】
GCRECと、Gタンパク質など細胞内シグナル伝達分子との相互作用を検出する方法は、オーファンGタンパク質共役膜7回貫通受容体から得た、内部セグメントまたは細胞質ドメインが、既知のGタンパク質共役膜7回貫通受容体の相似ドメインと交換されるという、また、Gタンパク質と、オーファン受容体ドメインに活性化される下流シグナル伝達経路とを同定するために用いられるという前提に基づく(Kobilka, B.K. 他(1988) Science 240:1310-1316)。類似の或る方法においては、オーファン受容体のドメイン群を融合タンパク質の一部としてクローニングし、結合アッセイに用いて、特定のGタンパク質との相互作用を実証し得る。研究によれば、Gタンパク質共役膜7回貫通受容体の第3の細胞内ループが、Gタンパク質相互作用及びシグナル伝達に重要であることが示されてきた(Conklin, B.R. 他(1993) Cell 73:631-641)。例えば、GCRECの第3細胞内ループに対応するDNA断片を、ポリメラーゼ連鎖反応法(PCR)で増幅でき、pGEX(Pharmacia Biotech)などの融合ベクターにサブクローニングし得る。構成物は適切な細菌性宿主へ形質転換され、誘発され、融合タンパク質はグルタチオン-セファロース4B(Pharmacia Biotech)アフィニティークロマトグラフィで細胞溶解産物から精製される。
【0335】
in vitro結合アッセイの場合、Gタンパク質を有する細胞抽出物は、50mM Tris(pH7.8)、1mM EGTA、5mMのMgCl2、20mMのCHAPS、20%グリセロール、各10μgのアプロチニン及びロイペプチンと、20μlの50mMフェニルメチルスルフォニルフッ化物で抽出することにより準備する。ライセートを絶えず撹拌しながら氷上で45分間インキュベートし、23,000g、4℃で15分間遠心分離して上澄みを集める。750μgの細胞抽出物をグルタチオンSトランスフェラーゼ(GST)融合タンパク質ビーズを用いて4℃で2時間インキュベートする。GSTビーズを、リン酸緩衝食塩水で5回洗浄する。結合したGタンパク質サブユニットを、百日咳毒素またはコレラ毒素を用いた[32P]ADPリボシル化により検出する。SDSサンプル緩衝液(4.6%(w/v) SDS、10%(v/v)βメルカプトエタノール、20%(w/v) グリセロール、95.2mM Tris-HCl(pH6.8)、0.01%(w/v) ブロムフェノールブルー)を添加することにより、反応を終了させる。[32P]ADP標識されたタンパク質を、10%SDS-PAGEゲルで分離し、オートラジオグラフを行う。ゲル中で分離したタンパク質をニトロセルロースペーパーに移し、ブロット(blotto)(5%脱脂粉乳、50mMのTris-HCl (pH 8.0)、2mMのCaCl2、80mMのNaCl、0.02%のNaN3 及び0.2%Nonidet P-40)を用いて室温で1時間ブロックした後、Gαサブタイプ選択的抗体(1:500; Calbiochem-Novabiochem)で1.5時間インキュベートする。3回洗浄後に、ブロットをホースラディッシュペルオキシダーゼ(HRP)抱合したヤギ抗ウサギ免疫グロブリン(1:2000, Cappel, Westchester PA)でインキュベートし、化学ルミネセンスベースのECL法(Amersham Corp.)で可視化する。
【0336】
18 GCREC 活性の実証
GCREC活性に対する或るアッセイは、細胞表面におけるGCRECの発現を測定する。GCRECをコードするcDNAを、好適な哺乳動物細胞株に形質移入する。細胞表面タンパク質を、記載されているようにビオチンで標識する(de la Fuente, M. A. 他(1997) Blood 90:2398-2405)。GCREC特異抗体を用いて免疫沈降を行い、ドデシル硫酸ナトリウムポリアクリルアミドゲル電気泳動(SDS-PAGE)および免疫ブロット技術を用いて免疫沈降サンプルを分析する。標識された免疫沈降素と非標識免疫沈降素との比が、細胞表面に発現したGCRECの量に比例する。
【0337】
或いは、GCREC活性の或るアッセイは、リガンド/受容体が媒介する、細胞増殖の変調についての原型のアッセイに基づく。このアッセイは、Swissマウス3T3細胞におけるDNA合成の割合を測定する。GCRECをコードするポリヌクレオチドを持つプラスミドを、当分野で周知のトランスフェクション法を用いて、静止状態の3T3培養細胞に加える。一過的に形質移入した細胞を次に、[3H]チミジン(放射性DNA前駆体分子)の存在下でインキュベートする。可変量のGCRECリガンドを次に、培養細胞に加える。[3H]チミジンの、酸沈殿可能DNA内への取り込みを、ラジオアイソトープカウンターを用いて適当な時間間隔で測定する。取り込まれた量は、新規に合成されたDNAの量に正比例する。少なくとも100倍のGCRECリガンド濃度範囲に対する用量反応曲線がリニアであることは、受容体活性を示唆する。ミリリットルあたりの活性の1ユニットは、50%の応答レベルを産出するGCRECの濃度として定義される。ここで、100%の応答レベルとは、酸−沈殿可能DNAへの、[3H]チミジンの最大の取り込みを表す(McKay, I. および I. Leigh, 編集(1993) Growth Factors: A Practical Approach, Oxford University Press, New York, NY, 73ページ)。
【0338】
あるいはGCREC活性のアッセイは、GCRECファミリ蛋白質が、G蛋白質に活性化される二次メッセンジャーシグナル伝達経路を変調させる能力に基づく(例えばcAMP経路; Gaudin, P. 他(1998) J. Biol. Chem. 273:4990-4996)。或るプラスミド(完全長GCRECをコードするもの)を、或る哺乳類細胞株に形質移入する。細胞株は例えばチャイニーズハムスター卵巣(CHO)またはヒト胎児腎臓(HEK-293)細胞株であり、方法は当分野で周知のものを用いる。形質移入細胞を12穴トレイで培地において48時間、成長させ、次に培地を処分し、付着した細胞をPBSで穏やかに洗浄する。次に細胞のインキュベートを、培地内で、リガンドと共に又はリガンド無しで30分間行い、次に培地を除去し、細胞の溶解を、1 Mの過塩素酸で処理して行う。ライセート内のcAMPレベルの測定を、ラジオイムノアッセイにより、当分野で周知の方法で行う。リガンドに曝された細胞からのライセート内のcAMPのレベルにおける変化(リガンド無しのものと比較)が、形質移入細胞内に存在するGCRECの量に比例する。
【0339】
イノシトールリン酸レベルにおける変化を測定するには、細胞を24穴プレート内で成長させる。プレートには1×105細胞/ウェルを入れ、インキュベートを、イノシトールフリー培地と[3H]ミオイノシトール(2μCi/ウェル)とで48時間行う。培地を除去し、細胞の洗浄を10 mMのLiCl含有バッファで行った後、リガンドを加える。反応を、過塩素酸を加えて停止させる。イノシトールリン酸の抽出と分離とをDowex AG1-X8 (Bio-Rad)アニオン交換樹脂上で行い、標識された総イノシトールリン酸のカウントを液体シンチレーションによって行う。リガンドに曝した細胞からの標識されたイノシトールリン酸のレベルの変化(リガンド無しのものと比較)が、形質移入細胞内に在るGCRECの量に比例する。
【0340】
酵母2ハイブリッド系を用いて或るタンパク質と或る特異的受容体との結合と安定した複合体の形成とを実証でき、ここでは酵母(例えば菌株y190 (MATa gal4 gal80 his3 trp1-901 ade2-101 ura3-52 leu2-3,-112 + URA3:: GAL_lacZ, LYS2:: GAL_HIS3 cyhr)を、酵母抽出物・ペプトン・デキストロース(YPD)、Synthetic Complete (SC)、またはドロップアウト培地(drop-out medium)中で成長させる(Harper, J.W.他(1993) Cell 75:805-816)。アフィニティークロマトグラフィーを用いて生化学的に相互作用を特徴づけ、リガンドの認識と結合とを実証可能であり、これには精製したタンパク質(GSTまたはGST融合)を全細胞タンパク質(例えばHEK293ヒト胎児腎細胞を目的のベクターで形質移入)と混合する。結合したタンパク質の抽出と分画とを10% SDS-PAGE上で行い、次にウェスタンブロッティングで検出する(Tsai, R.Y.L.およびReed, R.R. (1997) J. Neurosci. 17:4159-4169)。
【0341】
神経インパルス活性の直接のアセスには記録ピペットを利用でき、このピペットにフッ化感覚子リンパリンゲル(fluoride-sensillum-lymph Ringer)(SLR)を適用して、毛状感覚子(sensilla trichodea:特化した感覚器)を選抜する。例えば毛状感覚子には雄のカイコガ(Bombyx mori)の感覚毛の開いた先端から到達し、自発神経インパルス活性の変化を測定する。このインパルス活性は直接に受容体細胞(例えばボンビコール、ボンビカール受容体)から記録できる(Laue, M.他(1997) Cell Tissue Res. 288:149-158)。
【0342】
19 GCREC リガンドの同定
GCRECは、CHO(チャイニーズハムスター卵巣)またはHEK(ヒト胎児腎臓)293などの真核細胞株において発現される。これらの細胞株は、GCREC発現過程が良好である。また、発現したGCRECを下流エフェクターに機能的に連結できるような広範囲のGタンパク質群を有する。候補リガンドの存在下で発現した受容体の活性化に対し、形質転換した細胞をアッセイする。活性を、cAMPまたはCa2+など細胞内二次メッセンジャーの変化によって測定する。これらは、当分野で公知の標準的な方法を用いるか、発光タンパク質(例えばホタルルシフェラーゼまたは緑色蛍光タンパク質)が或るプロモーター(活性化した受容体によるタンパク質キナーゼCの刺激に応答)の転写調節下にあるようなレポーター遺伝子アッセイを用いて直接測定しうる(Milligan, G. 他(1996) Trends Pharmacol. Sci. 17:235-237)。アッセイ技術は、これら二次メッセンジャー系の両方に利用可能であり、アデニリルシクラーゼ活性化FlashPlate Assay(NEN Life Sciences Products)などのマルチウェルプレートフォーマットでの、またはFluo-4 AM(Molecular Probes)などの蛍光Ca2+指示薬にFLIPR蛍光定量的プレート読出しシステム(Molecular Devices)を併用しての高処理読出しを可能にする。生理的関連性のある二次メッセンジャー経路が知られていない場合、GCRECは、ホスホリパーゼC及びCa2+動員に関与する経路を介してGCRECのシグナル伝達を通すために、広範囲のGタンパク質と結合することが実証されているようなGタンパク質Gα 15/16と共発現し得る(Offerrnanns, S.及びM.I. Simon (1995) J. Biol. Chem. 270:15175-15180)。或いは、GCRECは内因性GCRECが不足しているような操作された酵母系内に発現されることによって、GCREC活性化スクリーニングについてバックグラウンドが存在しない利点を提供し得る。これらの酵母系は、ヒトGCREC及びGαタンパク質を、内因性酵母フェロモン受容体経路の対応する構成要素の代用とする。シグナルに対する正常な酵母応答を、選択培地上の正の成長に、またはレポーター遺伝子発現に変換するように、下流シグナル伝達経路も変更される(Broach, J.R.およびJ. Thorner (1996) Nature 384 (supp.):14-16)。既知のGCRECリガンド及び他の天然生理活性分子など、推定上のリガンドに対して受容体をスクリーニングする。組織、生体液及び細胞上澄みから抽出した生体抽出物もスクリーニングする。
【0343】
当業者には、本発明の範囲および精神から逸脱しない限りの、記載した本発明の組成物、方法およびシステムの、種々の修正および変更については自明であろう。本発明が、新規かつ有用なタンパク質群およびそれらをコードするポリヌクレオチド群を提供し、これらを創薬過程に利用しうること、また本発明が、これらの組成を用いた、疾患と病態との検出、診断、および治療の方法を提供することは理解されよう。本発明について説明するにあたり幾つかの実施態様に関連して説明を行ったが、本発明の請求の範囲が、そのような特定の実施態様に不当に制限されるべきではないことを理解されたい。このような実施態様の記載は完全であると考慮されるべきでなく、また本発明を開示したとおりの形態に限定するものでもない。更に、1つの実施態様の要素は、他の1つ以上の実施態様の要素と容易に組み換え得る。このような組み合わせにより、本発明の範囲にある多数の実施態様を形成し得る。本発明の範囲は、添付した請求の範囲およびそれらの等価物によって規定されるよう意図される。
【0344】
(表の簡単な説明)
表1は、本発明の完全長ポリヌクレオチド実施態様およびポリペプチド実施態様の命名の概略である。
【0345】
表2は、GenBank識別番号と、本発明のポリペプチド実施態様に最も近いGenBank相同体の注釈とを示す。また、各ポリペプチドとその相同体(1つ以上)が一致する確率スコアも併せて示す。
【0346】
表3は、予測されるモチーフおよびドメインなど、ポリペプチド実施態様の構造的特徴を、該ポリペプチドの分析に用いる方法、アルゴリズムおよび検索可能なデータベースと共に示す。
【0347】
表4は、ポリヌクレオチド実施態様をアセンブリするために用いたcDNA断片および/またはゲノムDNA断片を、該ポリヌクレオチドの選択した断片と共に示す。
表5は、ポリヌクレオチド実施態様の代表的cDNAライブラリを示す。
【0348】
表6は、表5に示したcDNAライブラリの作製に用いた組織およびベクターを説明する付表である。
【0349】
表7は、ポリヌクレオチドとポリペプチドとの分析に用いたツール、プログラム、およびアルゴリズムを、適用可能な説明、参照文献および閾値パラメータと共に示す。
【0350】
【表1】
Figure 2005500037
【0351】
【表2−1】
Figure 2005500037
【0352】
【表2−2】
Figure 2005500037
【0353】
【表2−3】
Figure 2005500037
【0354】
【表3−1】
Figure 2005500037
【0355】
【表3−2】
Figure 2005500037
【0356】
【表3−3】
Figure 2005500037
【0357】
【表3−4】
Figure 2005500037
【0358】
【表3−5】
Figure 2005500037
【0359】
【表3−6】
Figure 2005500037
【0360】
【表3−7】
Figure 2005500037
【0361】
【表3−8】
Figure 2005500037
【0362】
【表3−9】
Figure 2005500037
【0363】
【表3−10】
Figure 2005500037
【0364】
【表3−11】
Figure 2005500037
【0365】
【表3−12】
Figure 2005500037
【0366】
【表3−13】
Figure 2005500037
【0367】
【表3−14】
Figure 2005500037
【0368】
【表3−15】
Figure 2005500037
【0369】
【表3−16】
Figure 2005500037
【0370】
【表3−17】
Figure 2005500037
【0371】
【表3−18】
Figure 2005500037
【0372】
【表3−19】
Figure 2005500037
【0373】
【表3−20】
Figure 2005500037
【0374】
【表3−21】
Figure 2005500037
【0375】
【表3−22】
Figure 2005500037
【0376】
【表3−23】
Figure 2005500037
【0377】
【表3−24】
Figure 2005500037
【0378】
【表3−25】
Figure 2005500037
【0379】
【表3−26】
Figure 2005500037
【0380】
【表3−27】
Figure 2005500037
【0381】
【表3−28】
Figure 2005500037
【0382】
【表3−29】
Figure 2005500037
【0383】
【表4−1】
Figure 2005500037
【0384】
【表4−2】
Figure 2005500037
【0385】
【表4−3】
Figure 2005500037
【0386】
【表5】
Figure 2005500037
【0387】
【表6−1】
Figure 2005500037
【0388】
【表6−2】
Figure 2005500037
【0389】
【表6−3】
Figure 2005500037
【0390】
【表6−4】
Figure 2005500037
【0391】
【表7−1】
Figure 2005500037
【0392】
【表7−2】
Figure 2005500037
【Technical field】
[0001]
The present invention is a novel nucleic acid group, G protein-coupled receptor group encoded by these nucleic acids, and olfactory neuropathy, cell proliferation abnormality, neurological disease, cardiovascular disorder, gastrointestinal disorder, using these nucleic acids and proteins, It relates to the diagnosis, treatment and prevention of autoimmune / inflammatory disorders, metabolic disorders, and viral infections. The invention also relates to the assessment of the effect of exogenous compounds on the expression of the nucleic acid and G protein coupled receptor. Furthermore, the present invention relates to the use of specific G protein coupled receptors, which identify molecules involved in the regulation of taste or olfaction.
[Background]
[0002]
G-coupled protein receptor
Signal transduction is a common process by which cells respond to extracellular signals. Signal transduction across the plasma membrane begins with the binding of a signal molecule, such as a hormone, neurotransmitter or growth factor, to a cell membrane receptor. The receptor thus activated triggers an intracellular biochemical cascade, which is terminated by the activation of intracellular target molecules such as transcription factors. This process of signaling controls all types of cell functions, including cell proliferation, differentiation and gene transcription. G protein-coupled receptors (GCREC), encoded by one of the largest families of genes identified, play a central role in the transmission of extracellular signals across the plasma membrane. GCREC has a proven history of success as a therapeutic target.
[0003]
GCREC is an integral membrane protein characterized by the presence of seven hydrophobic transmembrane domains that together form an antiparallel alpha (α) helical bundle. GCREC sizes range from less than 400 to over 1000 amino acids (Strosberg, AD (1991) Eur. J. Biochem. 196: 1-10, Coughlin, SR (1994) Curr. Opin. Cell Biol. 6: 191- 197). The amino terminus of GCREC is extracellular, variable in length, and often glycosylated. The carboxy terminus is in the cytoplasm and is usually phosphorylated. Extracellular loop groups and intracellular loop groups appear alternately, connecting the transmembrane domains. Cysteine disulfide bridges that link the second and third extracellular loops can interact with agonists and antagonists. The most conserved domains of GCREC are the transmembrane domain and the first two cytoplasmic loops. Transmembrane domains reveal to some extent the structural and functional characteristics of the receptor. In most cases, a bundle of α helices forms one ligand binding pocket. The extracellular N-terminal segment, or one or more of the three extracellular loops, may also be involved in ligand binding. Ligand binding activates the receptor by inducing structural changes in the intracellular portion of the receptor. The activated third large intracellular loop of the receptor then interacts with the heterotrimeric guanine nucleotide binding (G) protein complex, which is a cyclic AMP (cAMP). ), Phospholipase C, inositol triphosphate, and other intracellular signal transduction effects including activation of second messengers and the interaction between activated GCRECs and ion channel proteins (eg, Watson, S And S. Arkinstall (1994)The G-protein Linked Receptor Facts Book, Academic Press, San Diego CA, pp. 2-6; Bolander, F.F. (1994)Molecular Endocrinology, Academic Press, San Diego CA, pp. 162-176; see Baldwin, J.M. (1994) Curr. Opin. Cell Biol. 6: 180-190).
[0004]
GCREC includes sensory signal mediators (eg light and olfactory stimulating molecules), adenosine, γ-aminobutyric acid (GABA), hepatocyte growth factor, melanocortin, neuropeptide Y, opioid peptide, opsin, somatostatin, tachykinin, vasoactive Intestinal polypeptide family and vasopressin, biogenic amines (eg dopamine, epinephrine and norepinephrine, histamine, glutamic acid (metabolic regulation), acetylcholine (muscarinic action) and serotonin), chemokines, lipid mediators of inflammation (eg prostaglandins and prostanoids) Platelet activators and leukotrienes) and peptide hormones (eg bombesin, bradykinin, calcitonin, C5a anaphylatoxin, endothelin, follicle stimulating hormone (FSH), Dotoropin releasing hormone (GnRH), and there receptors such is for neurokinin and thyrotropin releasing hormone (TRH) and oxytocin). GCREC, which acts as a receptor for stimuli not yet identified, is known as an orphan receptor.
[0005]
The diversity of the GCREC family is further increased by alternative splicing. Many GCREC genes have introns, and there are currently over 30 receptors for which splice variants have been identified. The highest number of mutations is at the C-terminus of this protein. N-terminal and intracytoplasmic loop variants are also more frequent, whereas variants in the extracellular loop or transmembrane domain are less frequent. Some receptors have more than one site where mutations can occur. Splice variants appear to be functionally different based on differences observed in distribution, signaling, conjugation, regulation, and ligand binding characteristics (Kilpatrick, GJ et al. (1999) Trends Pharmacol. Sci. 20: 294 -301).
[0006]
GCREC can be divided into three major subfamilies. That is, rhodopsin-like, secretin-like, and metabotropic glutamate receptor subfamilies. Members of the GCREC subfamily group share similar functions and a characteristic seven-transmembrane structure, but differ in amino acid sequence. Rhodopsin-like GCRECs, which constitute the largest family, transmit a variety of extracellular signals such as hormones, neurotransmitters, and light. Rhodopsin is a photosensitive GCREC found in the retina of animals. In vertebrates, rhodopsin molecules are embedded in membranous stacks found in photoreceptor (rod) cells. Each rhodopsin molecule responds to photons of light by inducing a decrease in cGMP levels leading to the closure of plasma membrane sodium channels. In this way, visual signals are converted into nerve impulses. Another rhodopsin-like GCREC is directly involved in the response to neurotransmitters. These GCRECs include receptors for adrenaline (adrenergic receptors), receptors for acetylcholine (muscarinic receptors), receptors for adenosine, receptors for galanin, and receptors for glutamate (N-methyl-D- Aspartate / NMDA receptor) (reviewed by Watson, S. and S. Arkinstall (1994)The G-protein Linked Receptor Facts Book, Academic Press, San Diego CA, 7-9, 19-22, 32-35, 130-131, 214-216, 221-222; Habert-Ortoli, E. et al. (1994) Proc. Natl. Acad. Sci USA 91: 9780-9783).
[0007]
Galanin receptors mediate the activity of galanin, a neuroendocrine peptide. Galanin inhibits the secretion of insulin, acetylcholine, serotonin and noradrenaline and stimulates the release of prolactin and growth hormone. Galanin receptors have been implicated in disease, pain, depression, and Alzheimer's disease feeds (Kask, K. et al. (1997) Life Sci. 60: 1523-1533). Other neuronal rhodopsin-like GCRECs include an increasing family of receptors for lysophosphatidic acid and other lysophospholipids that appear to have roles in development and neuropathology (Chun, J. et al. (1999) Cell Biochem). Biophys. 30: 213-242).
[0008]
Olfactory receptors, the largest subfamily of GCREC, are also members of the rhodopsin-like GCREC family. Olfactory receptors function by transmitting odorant signals. A number of different olfactory receptors are required to distinguish different odors. Each olfactory neuron expresses only one type of olfactory receptor, and a group of neurons expressing different receptors occupy different positions in the nasal pathway. For example, RA1c receptors isolated from a rat brain library have been shown to be restricted to very specific regions of the brain and only certain areas of the olfactory epithelium (Raming, K. et al. (1998) Receptors Channels 6: 141-151). However, the expression of olfactory-like receptors is not limited to olfactory tissues. For example, three rat genes encoding olfactory-like receptors with typical GCREC properties showed expression patterns not only in taste and olfactory tissues but also in male reproductive tissues (Thomas, MB et al. (1996) Gene 178: 1-5).
[0009]
Members of the secretin-like GCREC subfamily have peptide hormones such as secretin, calcitonin, glucagon, growth hormone releasing hormone, parathyroid hormone, and vasoactive intestinal peptide as ligands. For example, the secretin receptor responds to secretin, a peptide hormone that stimulates the secretion of enzymes and ions in the pancreas and small intestine (see Watson, pages 278-283, supra). The secretin receptor is approximately 450 amino acids in length and is found in the plasma membrane of gastrointestinal cells. Secretin binds to its receptor, which stimulates the production of cAMP.
[0010]
Examples of secretin-like GCRECs associated with inflammation and immune responses include EGF module-containing mucin-like hormone receptor (Emrl) protein and CD97 receptor protein. These GCRECs are members of the recently characterized EGF-TM7 receptor subfamily. These seven transmembrane hormone receptors exist as heterodimers in vivo and have 3-7 potential calcium binding EGF-like motifs. CD97 is expressed primarily on leukocytes and is significantly upregulated on activated B and T cells (McKnight, A.J. and S. Gordon (1998) J. Leukoc. Biol. 63: 271-280).
[0011]
The third GCREC subfamily is the metabotropic glutamate receptor family. Glutamate is a major excitatory neurotransmitter in the central nervous system. Metabotropic glutamate receptors regulate the activity of intracellular effectors and are involved in long-term potentiation (see Watson, p. 130). Ca2+Sensing receptors sense changes in the extracellular concentration of calcium ions and have a large extracellular domain containing clusters of acidic amino acids that can participate in calcium binding. The metabotropic glutamate receptor family includes the pheromone receptor, GABABThere are also receptors and taste receptors.
[0012]
Another GCREC subfamily includes nematodes (Caenorhabditis elegansas well asCaenorhabditis briggsae )There are two groups of chemoreceptor genes found in, which are closely related to mammalian olfactory receptor genes. Yeast pheromone receptors STE2 and STE3, which are involved in the response to mating factors on the cell membrane, have a unique membrane 7-pass signature. Cellular slime moldDictyostelium discoideumIn cAMP receptors, which are thought to regulate the aggregation of individual cells and to control the expression of a large number of developmentally regulated genes, have a unique signature as well.
[0013]
GCREC mutations can result in decreased function or constitutive activation and have been implicated in a number of human diseases (supra Coughlin). For example, retinitis pigmentosa (pigmentary retinitis) can arise from mutations in the rhodopsin gene. In addition, somatic activating mutations in the thyroid stimulating hormone receptor have been reported to cause hyperthyroid goiter, and several GCRECs that are sensitive to constitutive activation are considered proto-oncogenes. (Parma, J. et al. (1993) Nature 365: 649-651). GCREC receptors for the following ligands also have mutations associated with human disease. Luteinizing hormone (early puberty), vasopressin V2(X-linked nephrogenic diabetes insipidus), glucagon (diabetes and hypertension), calcium (hyperparathyroidism, hypocalcuria, hypercalcemia), parathyroid hormone (short limb dwarfism) ), BThree-GCREC receptors for adrenergic receptors (obesity, non-insulin dependent diabetes), growth hormone releasing hormone (dwarfism), and corticotropin (glucocorticoid deficiency) (Wilson, S. et al. (1998) Br. J. Pharmocol. 125: 1387-1392; Stadel, JM et al. (1997) Trends Pharmacol. Sci. 18: 430-437). GCREC is also involved in depression, schizophrenia (schizophrenia), insomnia, hypertension, anxiety, stress, renal failure, and some cardiovascular disorders (Horn, F. and G. Vriend (1998) J. Mol. Med. 76: 464-468).
[0014]
In addition, hundreds of new drugs aimed at activating or inhibiting GCREC have been recognized within the last 20 years. Therapeutic targets for these drugs cover a wide range of diseases and disorders, including cancer, osteoporosis, endometriosis as well as cardiovascular disorders, gastrointestinal disorders, and central nervous system disorders (Wilson et al., Stadel, supra). other). For example, the dopamine agonist L-dopa is used to treat Parkinson's disease, and certain dopamine antagonists are used to treat schizophrenia (schizophrenia) and early-stage Huntington's disease. Adrenergic receptor agonists and antagonists have been used to treat asthma, hypertension and other cardiovascular disorders, and anxiety. Muscarinic agonists are used to treat glaucoma and tachycardia, serotonin 5HT1D antagonists are used for migraine, and histamine H1 antagonists are used for allergic and anaphylactic reactions, hay fever, itch, and motion sickness (I mentioned above Horn etc.).
[0015]
Recent research suggests the possibility of using GCREC in the treatment of metabolic disorders such as diabetes, obesity, and osteoporosis in the future. For example, a mutant V2 vasopressin receptor responsible for nephrogenic diabetes insipidus can be functionally rescued in vitro by co-expression of certain C-terminal V2 receptor peptides spanning the region with this mutation. . This result suggests a novel strategy for disease treatment (Schoneberg, T. et al. (1996) EMBO J. 15: 1283-1291). Mutations in the melanocortin 4 receptor (MC4R) have been implicated in human weight regulation and obesity. Like the vasopressin V2 receptor mutants, these MC4R mutants are defective in transport to the plasma membrane (Ho, G and RG MacKenzie (1999) J. Biol. Chem. 274: 35816-35822) Can therefore be treated with similar strategies. A type 1 receptor for parathyroid hormone (PTH) is GCREC, which mediates PTH-dependent control of calcium homeostasis in the bloodstream. Studies of PTH / receptor interactions may enable the development of new PTH receptor ligands for the treatment of osteoporosis (Mannstadt, M. et al. (1999) Am. J. Physiol. 277: F665-F675) .
[0016]
GCREC's chemokine receptor group has potential for the treatment of inflammation and infection (for review, see Locati, M. and P.M. Murphy (1999) Annu. Rev. Med. 50: 425-440). Chemokines are small polypeptides that act as intracellular signals in the control of leukocyte trafficking, hematopoiesis, and angiogenesis. The targeted destruction of various chemokine receptors in mice indicates that these receptors play a role in pathological inflammation and in autoimmune abnormalities such as multiple sclerosis. Infectious agents such as herpes virus and human immunodeficiency virus (HIV-1) also utilize chemokine receptors to promote infection. The chemokine receptor CCR5 acts as a co-receptor for HIV-1 T cell infection, and partially cleaved CCR5 creates resistance to AIDS, and CCR5 antagonists may be useful in preventing the development of AIDS I suggest that.
[0017]
Several GCRECs have been reported to be involved in taste and smell. The complete or partial sequence of a number of human and other eukaryotic sensory receptors is now known (eg Pilpel, Y and D. Lancet (1999) Protein Sci. 8: 969-977; Mombaerts, P. (1999) Annu. Rev. Neurosci. The human genome has been reported to contain approximately 1000 genes that code for various repertoires of olfactory receptors (Rouquier, S. et al. (1998) Nat. Genet. 18: 243-250; Trask, BJ (1998) Hum. Mol. Genet. 7: 2007-2020).
[0018]
Olfactory bulb anatomy and physiology
The olfactory bulb is an egg-shaped forward growth of brain tissue that begins at the base of the brain and bulges in a spherical shape and lies on a sieve plate that separates the brain cavity from the top of the nasal cavity. The olfactory nerve received by the lower surface of the olfactory bulb passes upward through the sieve plate from the olfactory part of the nose. Olfactory receptor cells, or olfactory cells, are bipolar neurons that are located in the nasal olfactory membrane and connect to the glomerulus, which is a spherical structure in the olfactory bulb. Each glomerulus consists of about 25,000 axons from olfactory cells, dendrites from about 25 large mitral cells, and about 60 of the axons that pass through the olfactory cord to the central nervous system. It is the end of a small tufted cell. Studies suggest that different glomeruli respond to different odors. Many nerve fibers that originate in the olfactory part of the brain travel backward in the olfactory tract to the olfactory bulb, with the terminal being a number of small granule cells in the center of the olfactory bulb. They allow short inhibitory dendrites to reach mitral and tufted cells. This suppression feedback appears to help distinguish odors. Mitral cells and tufted cells are continuously active and provide background activity, on which impulse traffic caused by various odors is superimposed. Thus, the olfactory stimulus modulates the frequency of impulses in the olfactory system and causes the transmission of olfactory information.
[0019]
The olfactory cord enters the brain at the junction between the midbrain and the cerebrum. At the junction, the olfactory tract is divided into two paths. One goes to the inner olfactory cortex where the septal nucleus feeds to the limbic system, such as the hypothalamus. The outer olfactory cortex connected with the other pathway mainly consists of the piriform cortex, piriform cortex, and amygdala cortex, where the signal reaches the limbic system, particularly the hippocampus. The third olfactory pathway that is observed passes through the thalamus to the dorsolateral nucleus of the thalamus and further to the lateral posterior quadrant of the orbitofrontal cortex. Thus, the olfactory system that assists in basic olfactory reflexes, the second system that provides automatic but learning control of food intake and food aversion, and is equivalent to most other cortical sensory systems There seems to be a third system that is used for conscious perception.
[0020]
Some odorants are G protein-coupled receptors and have a characteristic seven-membrane penetration structure. The N-terminus of these seven-transmembrane G protein-coupled receptors is extracellular and mostly glycosylated, while the C-terminus is in the cytoplasm and mostly phosphorylated. The three extracellular loop groups appear alternately with the three intracellular loop groups and gather to form seven transmembrane hydrophobic regions. Sensory transmission in chemoreceptors occurs when odorants activate receptor molecules in olfactory cells, inducing an enzyme cascade mediated by the G protein GOLF (G protein olf). This is similar to the sensory transduction mechanism in photoreceptors, where light-mediated activation by rhodopsin induces an enzyme cascade mediated by the G protein transducin (Keio J. (2001 ) J. Med. 50: 13-19).
[0021]
Anatomy and physiology of the taste system
Mammals have five basic tastes. Salty, sour, bitter, sweet, and umami (taste of monosodium glutamate). These tastes are thought to be mediated by different cell surface receptors on taste receptor cells (TRCs) that cluster within the taste buds. TRCs are specialized neuroepithelial cells that are electrically excitable and form synapses with afferent gustatory nerve fibers. Miso is a localized collection of about 100 TRCs, grouped in an onion-type structure. Tongue miso is found in three types of papillae. It is a rod-shaped papilla, foliate papilla, and circumscribed papilla, which are found on the front, both sides, and the back of the tongue, respectively. Miso is also found in the soft palate, uvula, epiglottis, pharynx, larynx, and esophagus.
[0022]
Taste transmission begins with flavor molecules interacting with receptors and ion channels in the apical microvilli of TRC exposed to the oral cavity. This interaction leads to changes in membrane conductance, depolarization, and transmitter release to taste afferent neurons. Taste stimuli vary widely in chemical structure, ranging in size from ions to complex carbohydrates and proteins. Therefore, various mechanisms are necessary for taste transmission. Ionic stimuli such as salts and acids (salty and sour) interact directly with ion channels and depolarize TRC. Complex stimuli such as carbohydrates, alkaloids, proteins (sweet, bitter, umami) activate G protein-coupled receptors (GCREC), which regulates the second messenger cascade. For example, the T1R family member of GCREC, T1R3, is presumed to function as a sweet receptor in humans, and the T2R / TRB family member of GCREC, hT2R4, has been shown to respond to bitter compounds (Gilbertson, TA (2000) Curr. Opinion in Neurobiology 10: 519-527).
[0023]
The discovery of new olfactory receptors and polynucleotides encoding them can meet the needs of the art by providing new compositions. This novel composition is useful for diagnosis, prevention, and treatment of olfactory neuropathy, and also useful for evaluating the effects of exogenous compounds on the expression of nucleic acid and amino acid sequences of olfactory receptors. is there.
[0024]
The discovery of new G protein coupled receptors and polynucleotides encoding them fulfills the need in the art by providing new compositions. The novel compositions are useful in the diagnosis, treatment and prevention of olfactory neuropathy, cell proliferation disorders, neurological diseases, cardiovascular disorders, gastrointestinal disorders, autoimmune / inflammatory diseases, metabolic disorders, and viral infections, and The composition is also useful for calculating the effect of exogenous compounds on the expression of nucleic acid and amino acid sequences of G protein-coupled receptors.
[0025]
Expression profile creation
The microarray is an analysis tool used for biological analysis. In the microarray, a plurality of molecules are spatially distributed and fixed to the surface of the solid support. Polyarrays of polypeptides, polynucleotides, and / or antibodies have been developed and their various uses include, for example, gene sequencing, gene expression monitoring, gene mapping, bacterial identification, drug discovery, combinatorial chemistry.
[0026]
In particular, a region using a microarray is gene expression analysis. Array technology can provide a simple way to explore the expression of a single polymorphic gene or the expression profile of many related or unrelated genes. When testing the expression of a single gene, the array is used to detect the expression of a particular gene or variant thereof. When testing expression profiles, the array provides a platform to identify genes such as: That is, which genes are tissue specific, affected by the substance being tested in the toxicity assay, are part of a signaling cascade, perform housekeeping functions, or have a specific genetic predisposition or condition Identification of genes that are specifically associated with a disease or disorder.
[0027]
The field includes nucleic acids and proteins for diagnosis, prevention, and treatment of olfactory neuropathy, cell proliferation disorders, neurological diseases, cardiovascular diseases, gastrointestinal disorders, autoimmune / inflammatory diseases, metabolic disorders, and viral infections There is a demand for a new composition containing:
DISCLOSURE OF THE INVENTION
【The invention's effect】
[0028]
Various embodiments of the present invention are collectively referred to as "GCREC", individually "GCREC-1", "GCREC-2", "GCREC-3", "GCREC-4", "GCREC-5" GCREC-6, GCREC-7, GCREC-8, GCREC-9, GCREC-10, GCREC-11, GCREC-12, GCREC-13, GCREC -14 "," GCREC-15 "," GCREC-16 "," GCREC-17 "," GCREC-18 "," GCREC-19 "," GCREC-20 "," GCREC-21 "," GCREC-22 " ”,“ GCREC-23 ”,“ GCREC-24 ”,“ GCREC-25 ”,“ GCREC-26 ”, which provide purified G protein-coupled receptors, and encode these proteins and their Methods of detecting, diagnosing, and treating diseases and conditions using polynucleotides are provided. Some embodiments also include methods of promoting drug discovery processes using purified G protein coupled receptors and / or polynucleotides encoding them, such as methods of determining efficacy, dose, toxicity, and pharmacology. provide. Some related embodiments provide methods for investigating the pathogenesis of diseases and pathologies using purified G protein coupled receptors and / or polynucleotides encoding them.
[0029]
Some embodiments include (a) a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, and (b) an amino acid selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a natural amino acid sequence with at least 90% identity to the sequence, (c) a biologically active fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, And (d) an immunogenic fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, and an isolated polypeptide selected from the group consisting of: Another embodiment provides an isolated polypeptide having the amino acid sequence of SEQ ID NO: 1-26.
[0030]
The present invention also provides G protein-coupled receptors related to olfaction and / or taste. The present invention further provides a polynucleotide sequence encoding the G protein-coupled receptor.
[0031]
Yet another embodiment is (a) a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) an amino acid selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a certain natural amino acid sequence with at least 90% identity to the sequence, (c) a biological activity of the polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 A fragment, or (d) an immunogenic fragment of a polynucleotide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, isolated, encoding a certain polypeptide selected from the group consisting of A polynucleotide is provided. In one embodiment, the polynucleotide encodes a polypeptide selected from the group consisting of SEQ ID NO: 1-26. In another embodiment, the polynucleotide is selected from the group consisting of SEQ ID NO: 27-52.
[0032]
Another embodiment is (a) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) a certain selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a certain natural amino acid sequence having at least 90% identity to the amino acid sequence, (c) the biological of a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 An active fragment, and (d) an immunogenic fragment of a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, and a polynucleotide encoding a certain polypeptide selected from the group consisting of: Recombinant polynucleotides having functionally linked promoter sequences are provided. Another embodiment provides cells transformed with the recombinant polynucleotide. Yet another embodiment provides a genetically transformed organism having this recombinant polynucleotide.
[0033]
Another embodiment is (a) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, and (b) a certain selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a certain natural amino acid sequence having at least 90% identity with the amino acid sequence, and (c) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 A method of producing a polypeptide selected from the group consisting of a biologically active fragment and (d) an immunogenic fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 To do. The production method comprises the steps of (a) culturing a cell under conditions suitable for expression of the polypeptide, transforming the cell with a recombinant polynucleotide, and (b) a polypeptide so expressed. The process consists of recovering the peptide. This recombinant polynucleotide has a promoter sequence operably linked to the polynucleotide encoding the polypeptide.
[0034]
Yet another embodiment is (a) a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) a certain selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a certain natural amino acid sequence having at least 90% identity with the amino acid sequence, (c) a biologically active fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 And (d) an immunogenic fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, isolated specifically binding to a polypeptide selected from the group consisting of Antibodies are provided.
[0035]
Yet another embodiment is (a) a polynucleotide having a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52, and (b) one selected from the group consisting of SEQ ID NO: 27-52 A polynucleotide having a natural polynucleotide sequence having at least 90% identity to the polynucleotide sequence, a polynucleotide complementary to (c) (a), a polynucleotide complementary to (d) (b), And (e) an RNA equivalent selected from the group consisting of the RNA equivalents of (a)-(d). In another embodiment, the polynucleotide may consist of at least about 20, 30, 40, 60, 80, or 100 consecutive nucleotide groups.
[0036]
Another embodiment is a method of detecting a target polynucleotide in a sample, wherein the target polynucleotide has (a) a polynucleotide having a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52, b) a polynucleotide having a natural polynucleotide sequence having at least 90% identity with a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52, complementary to (c) (a) A polynucleotide complementary to (d) (b), and (e) an RNA equivalent of (a)-(d). The detection method comprises the steps of: (a) hybridizing the sample with a probe consisting of at least 20 consecutive nucleotide groups consisting of a sequence complementary to the target polynucleotide in the sample; and (b) It consists of a process of detecting the presence or absence of the hybridization complex. The probe specifically hybridizes to the target polynucleotide under conditions such that a hybridization complex is formed between the probe and the target polynucleotide or fragment thereof. In certain related embodiments, the method can include detecting the amount of the hybridization complex. In yet another embodiment, the probe may consist of at least about 20, 30, 40, 60, 80 or 100 consecutive nucleotide groups.
[0037]
Yet another embodiment is a method of detecting a target polynucleotide in a sample, wherein the target polynucleotide has (a) a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52, (b) a polynucleotide having a natural polynucleotide sequence having at least 90% identity with a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52, complementary to (c) (a) A polynucleotide selected from the group consisting of: (d) a polynucleotide complementary to (b), and (e) an RNA equivalent of (a)-(d). The detection method includes (a) a process of amplifying a target polynucleotide or a fragment thereof using polymerase chain reaction amplification, and (b) a process of detecting the presence or absence of the amplified target polynucleotide or a fragment thereof. In certain related embodiments, the method can include detecting the amount of the amplified target polynucleotide or fragment thereof.
[0038]
Another embodiment provides a composition consisting of an effective amount of the polypeptide and a pharmaceutically acceptable excipient. An effective amount of a polypeptide is (a) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) a certain selected from the group consisting of SEQ ID NO: 1-26 A polypeptide comprising a natural amino acid sequence having at least 90% identity to the amino acid sequence, (c) a biological activity of a polypeptide comprising an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 Selected from the group consisting of a fragment and (d) an immunogenic fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26. In one embodiment, the composition may have an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26. Another embodiment provides a method of administering the composition to a patient in need of treatment for a disease or condition associated with reduced or abnormal expression of functional GCREC.
[0039]
Another embodiment is (a) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) a certain selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a natural amino acid sequence having at least 90% identity to the amino acid sequence, (c) a biologically active fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, and (d) an immunogenic fragment of a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, to confirm the effectiveness as an agonist of a polypeptide selected from the group consisting of: Methods for screening certain compounds are provided. The screening method comprises (a) a process of exposing a sample having the polypeptide to a certain compound, and (b) a process of detecting agonist activity in the sample. Another embodiment provides a composition having an agonist compound identified by this method and an acceptable pharmaceutical excipient. Yet another embodiment provides a method of administering this composition to a patient in need of treatment for a disease or condition associated with reduced expression of functional GCREC.
[0040]
Yet another embodiment is (a) a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) selected from the group consisting of SEQ ID NO: 1-26, or (C) a biologically active fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26; And (d) an immunogenic fragment of a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, to confirm the effectiveness as an antagonist of a polypeptide selected from the group consisting of Provides a method for screening certain compounds. The screening method consists of (a) exposing a sample having the polypeptide to a certain compound, and (b) detecting antagonistic activity in the sample. Another embodiment provides a composition having an antagonist compound identified by this method and an acceptable pharmaceutical excipient. Yet another embodiment provides a method of administering the composition to a patient in need of treatment for a disease or condition associated with overexpression of functional GCREC.
[0041]
Another embodiment is: (a) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) a certain amino acid selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a natural amino acid sequence having at least 90% identity to the sequence, (c) a biologically active fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, and ( d) A method for screening for a compound that specifically binds to a polypeptide selected from the group consisting of an immunogenic fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26. The screening method comprises: (a) mixing the polypeptide with at least one test compound under appropriate conditions; (b) detecting binding between the polypeptide and the test compound and specifically binding to the polypeptide It consists of the process of identifying the compound to be.
[0042]
In another embodiment, (a) a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, (b) an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a certain natural amino acid sequence having at least 90% identity or at least about 90% identity with, (c) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 An activity of a polypeptide selected from the group consisting of a biologically active fragment and (d) an immunogenic fragment of a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 Methods are provided for screening for certain compounds that modulate. The screening method comprises: (a) mixing the polypeptide with at least one test compound under conditions acceptable for the activity of the polypeptide; and (b) converting the activity of the polypeptide in the presence of the test compound. And (c) comparing the activity of the polypeptide in the presence of the test compound with the activity of the polypeptide in the absence of the test compound. A change in the activity of the polypeptide at is indicative of a compound that modulates the activity of the polypeptide.
[0043]
Furthermore, the present invention relates to the aforementioned receptor, a biologically active fragment thereof (receptor) to identify an agonist or antagonist compound of the G protein-coupled receptor polypeptide of the invention associated with olfaction and / or taste. And amino acid sequences having at least 90% sequence identity thereto, including those having physical activity). These compounds are useful to modulate, block and / or mimic specific odors.
[0044]
The present invention also provides an olfactory and / or taste receptor of the present invention, a biologically active fragment thereof (including a fragment having receptor activity), and a polynucleotide having at least 90% sequence identity thereto. The peptide is used in combination with one or more other olfactory and / or taste receptor polypeptides to identify the compound (s) that modulate, mimic and / or block certain olfactory and / or taste sensations.
[0045]
The present invention also relates to a cell that expresses the olfactory or taste receptor polypeptide of the present invention, a biologically active fragment thereof (including a fragment having receptor activity), or at least 90% sequence identity thereto. The use of these cells in cell-based screens to identify molecules that are associated with cells that express sexual polypeptides and that modulate, mimic, and / or block specific olfactory or gustatory sensations Related.
[0046]
Furthermore, the present invention relates to cells co-expressing at least one olfactory or taste G protein coupled receptor polypeptide of the present invention and a G protein, and optionally one or more other olfactory and / or taste G proteins. It relates to cells that co-express conjugated receptor polypeptides, and to the identification of molecules that modulate, mimic and / or block specific olfactory and / or gustatory sensations using these cells for screening.
[0047]
Yet another embodiment provides a method of screening a compound for the effect of altering the expression of a target polynucleotide having a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52 . The method comprises: (a) exposing a sample having the target polynucleotide to a compound; (b) detecting alterations in expression of the target polynucleotide; and (c) a variable amount of the compound. The process consists of comparing the expression of the target polynucleotide in the presence to the expression in the absence of the compound.
[0048]
Another embodiment provides a method for calculating the toxicity of a test compound. This method includes the following processes. (a) A process of treating a biological sample having a nucleic acid group with a test compound. (b) A process of hybridizing the nucleic acid group of the treated biological sample. The following probe is used in this process. (i) a polynucleotide having a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52, and (ii) at least a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52 A polynucleotide having a natural polynucleotide sequence with 90% identity, a polynucleotide having a sequence complementary to (iii) (i), a polynucleotide complementary to the polynucleotide of (iv) (ii), (v ) a probe consisting of at least 20 contiguous nucleotide groups of a polynucleotide selected from the group consisting of RNA equivalents of (i) to (iv). Hybridization occurs under conditions such that a specific hybridization complex is formed between the probe and a target polynucleotide in the biological sample. The target polynucleotide is (i) a polynucleotide having a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52, (ii) a certain selected from the group consisting of SEQ ID NO: 27-52 A polynucleotide having a natural polynucleotide sequence with at least 90% or at least about 90% identity to the polynucleotide sequence, (iii) a polynucleotide complementary to the polynucleotide of (i), (iv) of (ii) The polynucleotide is selected from the group consisting of a polynucleotide complementary to the polynucleotide and an RNA equivalent of (v) (i) to (iv). Alternatively, the target polynucleotide may have a fragment of a polynucleotide sequence selected from the group consisting of (i) to (v) above. The toxicity calculation method further includes the following processes. (c) quantifying the amount of hybridization complex, and (d) comparing the amount of hybridization complex in the treated biological sample with the amount of hybridization complex in the untreated biological sample. is there. Differences in the amount of hybridization complexes in the treated biological sample indicate the toxicity of the test compound.
BEST MODE FOR CARRYING OUT THE INVENTION
[0049]
(Description of the present invention)
While the proteins, nucleic acids, and methods of the present invention are described, it should be understood that prior to that, embodiments of the present invention are not limited to the specific devices, materials, and methods described and may be modified. It should also be understood that the terminology used herein is for the purpose of describing particular embodiments only and is not intended to limit the scope of the present invention.
[0050]
The singular forms “a” and “its” in the claims and specification may refer to the plural unless the context clearly dictates otherwise. Thus, for example, when “a certain host cell” is described, there may be a plurality of such host cells, when “a certain antibody” is described, one or more antibodies, and It also refers to antibody equivalents known to those skilled in the art.
[0051]
All technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art unless otherwise defined. Although any devices, materials, and methods similar or equivalent to those described herein can be used to practice or test the present invention, suitable devices, materials, and methods are now described. All publications referred to in this invention are cited for purposes of describing and disclosing cells, protocols, reagents and vectors that have been reported in the publications and may be used in connection with various embodiments of the invention. It is what. No disclosure in this specification is an admission that the invention is not entitled to antedate such disclosure by virtue of prior art.
[0052]
(Definition)
“GCREC” is substantially purified from all species (especially mammals including cattle, sheep, pigs, mice, horses and humans), such as natural, synthetic, semi-synthetic or recombinant. Refers to the amino acid sequence of GCREC.
[0053]
The term “agonist” refers to a molecule that enhances or mimics the biological activity of GCREC. An agonist can be a protein, nucleic acid, carbohydrate, small molecule, or any other molecule that interacts directly with GCREC or acts on each component of the biological pathways involved in GCREC to modulate the activity of GCREC. There can be a compound or composition.
[0054]
An “allelic variant” is another form of the gene encoding GCREC. Allelic variants can result from at least one mutation in the nucleic acid sequence, as well as altered mRNAs. In addition, the structure or function of the polypeptide that may occur may or may not be altered. A gene may not have any naturally occurring allelic variants or may have more than one. The usual mutational changes that give rise to allelic variants are generally due to natural deletions, additions or substitutions of nucleotides. These various changes can occur one or more times within a sequence, either alone or together with other changes.
[0055]
The “transformed / altered” nucleic acid sequence encoding GCREC includes the same polypeptide as GCREC, or at least one of the functional properties of GCREC, with various nucleotide deletions, insertions or substitutions. Some sequences result in polypeptides comprising This definition includes improper or unexpected hybridization to a group of allelic variants at a position that is not a normal chromosomal locus for a GCREC-encoding polynucleotide, and also includes a polynucleotide that encodes a GCREC. It includes polymorphisms that are easily detectable or difficult to detect using certain oligonucleotide probes. The encoded protein may also be “transformed / modified” and may have deletions, insertions or substitutions of amino acid residues such that a silent change results in a functionally equivalent GCREC . Intentional amino acid substitutions are in terms of the polarity, charge, solubility, hydrophobicity, hydrophilicity, and / or amphipathicity of residues to the extent that GCREC activity is retained biologically or immunologically. It can be made based on one or more similarities. For example, negatively charged amino acids include aspartic acid and glutamic acid, and positively charged amino acids include lysine and arginine. Amino acids with uncharged polar side chains with similar hydrophilicity values include asparagine and glutamine, serine and threonine. Amino acids having uncharged side chains with similar hydrophilicity values include leucine, isoleucine and valine, glycine and alanine, and phenylalanine and tyrosine.
[0056]
The terms “amino acid” and “amino acid sequence” refer to oligopeptides, peptides, polypeptides, protein sequences, or fragments of any thereof, and refer to natural or synthetic molecules. When an “amino acid sequence” refers to the sequence of a natural protein molecule, the “amino acid sequence” and similar terms are not limited to the complete and intact amino acid sequence associated with that protein molecule described.
[0057]
“Amplification” refers to the act of creating additional replicas of a nucleic acid. Amplification uses polymerase chain reaction (PCR) techniques or other nucleic acid amplification techniques known to those skilled in the art.
[0058]
The term “antagonist” refers to a molecule that inhibits or attenuates the biological activity of GCREC. Antagonists include antibodies, proteins such as antibodies, nucleic acids, carbohydrates, and small molecules that directly interact with GCREC or modulate the activity of GCREC by acting on each component of the biological pathway in which GCREC is involved. Or any other compound or composition.
[0059]
The term `` antibody '' refers to an intact immunoglobulin molecule or fragment thereof capable of binding to an epitope determinant, such as Fab, F (ab ')2 , And refers to the Fv fragment. An antibody that binds to a GCREC polypeptide can be produced using an intact polypeptide group or a fragment group having the small peptide group as an immunizing antigen. The origin of the polypeptide or oligopeptide used to immunize animals such as mice, rats, rabbits may be in the case of RNA translation or chemical synthesis. They can also be conjugated to a carrier protein if desired. Examples of commonly used carriers that chemically bind to peptides include bovine serum albumin, thyroglobulin, and mussel hemocyanin (KLH). This bound peptide is used to immunize the animal.
[0060]
The term “antigenic determinant” refers to a region of a molecule (ie, an epitope) that makes contact with a particular antibody. When immunizing a host animal with a protein or protein fragment, multiple regions of the protein can trigger the production of antibodies that specifically bind to an antigenic determinant (a specific region or three-dimensional structure of the protein). Certain antigenic determinants can compete with an intact antigen (ie, an immunogen used to elicit an immune response) for binding to certain antibodies.
[0061]
The term “aptamer” refers to a nucleic acid or oligonucleotide molecule that binds to a specific molecular target. Aptamersin vitro(E.g. SELEX (Systematic Evolution of Ligands by EXponential Enrichment), described in US Pat. No. 5,270,163). This is a process of selecting target-specific aptamer sequences from a large group of combinatorial libraries. Aptamer composition is double-stranded or single-stranded and may include deoxyribonucleotides, ribonucleotides, nucleotide derivatives, or other nucleotide-like molecules. Each nucleotide component of an aptamer may have a modified sugar group (for example, the 2'-OH group of ribonucleotides is 2'-F or 2'-NH2This may improve desired properties such as resistance to nucleases or longer life in blood. By conjugating the aptamer with another molecule (eg, a high molecular weight carrier), clearance of this aptamer from the circulatory system can be delayed. Aptamers can be specifically cross-linked with their homologous ligands, for example by photoactivation of certain cross-linking agents (see, for example, Brody, EN and L. Gold (2000) J. Biotechnol. 74: 5-13). reference).
[0062]
The term "intramer"in vivoRefers to an aptamer expressed in For example, certain RNA aptamers are expressed at high levels in the cytoplasm of leukocytes using an RNA expression system based on vaccinia virus (Blind, M. et al. (1999) Proc. Natl. Acad. Sci. USA 96: 3606-3610).
[0063]
The term “spiegelmer” refers to aptamers such as left-handed nucleotide derivatives such as L-DNA and L-RNA or left-handed nucleotide-like molecules. Aptamers with levorotatory nucleotides are resistant to degradation by natural enzymes that normally act on substrates with dextrorotatory nucleotides.
[0064]
The term “antisense” refers to any composition capable of forming base pairs with the “sense” (coding) strand of a polynucleotide having a specific nucleic acid sequence. Antisense compositions include DNA, RNA, peptide nucleic acids (PNA), oligonucleotides with modified backbone linkages such as phosphorothioic acid, methylphosphonic acid or benzylphosphonic acid, modified sugar groups such as 2 ' There are oligonucleotides with 2-methoxyethyl sugar or 2'-methoxyethoxy sugar, or oligonucleotides with modified bases such as 5-methylcytosine, 2-deoxyuracil or 7-deaza-2'-deoxyguanosine obtain. Antisense molecules can be produced by any method, such as chemical synthesis or transcription. When introduced into a cell, a complementary antisense molecule forms a base pair with the natural nucleic acid sequence produced by the cell to form a duplex that interferes with transcription or translation. The expression “negative” or “minus” may refer to the antisense strand of a reference DNA molecule, and the expression “positive” or “plus” may refer to the sense strand of a reference DNA molecule.
[0065]
The term “biologically active” refers to a protein having the structural, regulatory, or biochemical functions of a natural molecule. Similarly, “immunologically active” or “immunogenic” means that natural, recombinant, or synthetic GCREC or any oligopeptide thereof elicits a specific immune response in an appropriate animal or cell. Refers to the ability to bind to a specific antibody.
[0066]
“Complementary” refers to the relationship between two single-stranded nucleic acid sequences that anneal by base pairing. For example, “5′-AGT-3 ′” forms a pair with its complementary sequence “3′-TCA-5 ′”.
[0067]
A “composition comprising (having) a polynucleotide of” or “a composition comprising (having) a polypeptide of” refers to any composition having the designated polynucleotide or polypeptide. The composition can include a dry formulation or an aqueous solution. Compositions having a group of polynucleotides that encode GCREC or a group of fragments of GCREC may be used as hybridization probes. These probes can be stored in lyophilized form and can be conjugated with stabilizers such as carbohydrates. In hybridization, the probe can be dispersed in an aqueous solution having a salt (eg, NaCl), a surfactant (eg, sodium dodecyl sulfate; SDS) and other components (eg, Denhart's solution, milk powder, salmon sperm DNA, etc.).
[0068]
The “consensus sequence” is subjected to repeated DNA sequence analysis to remove unnecessary bases, extended in the 5 ′ and / or 3 ′ direction using an XL-PCR kit (Applied Biosystems, Foster City CA), and sequenced again. One or more overlapping cDNAs or ESTs or genomic DNA using a synthesized nucleic acid sequence or a fragment binding computer program such as GELVIEW fragment binding system (GCG, Madison, WI) or Phrap (University of Washington, Seattle WA) Refers to a nucleic acid sequence assembled from fragments. Some sequences produce consensus sequences by both extension and assembly.
[0069]
The term “conservative amino acid substitution” refers to a substitution that is predicted to change little in the properties of the original protein. That is, the structure of the protein, particularly its function, is preserved and does not change significantly by substitution. The table below shows the amino acids that can be substituted for the original amino acids in the protein and are recognized as conservative amino acid substitutions.
Figure 2005500037
[0070]
Conservative amino acid substitutions usually include (a) the backbone structure of the polypeptide in the substitution region, eg, a β-sheet or α-helical structure, (b) the molecular charge or hydrophobicity at the substitution site, and / or (c) the side chain. Hold the most.
[0071]
A “deletion” refers to a change in an amino acid sequence that lacks one or more amino acid residues, or a change in a nucleotide sequence that lacks one or more nucleotides.
[0072]
The term “derivative” refers to a chemically modified polynucleotide or polypeptide. For example, replacement of hydrogen with an alkyl group, acyl group, hydroxyl group or amino group can be included in chemical modification of the polynucleotide. A polynucleotide derivative encodes a polypeptide that retains at least one biological or immunological function of the natural molecule. A polypeptide derivative is a polypeptide that has been modified by the following process. That is, glycosylation, polyethylene glycolation, or any similar process that retains at least one biological or immunological function of the originating polypeptide.
[0073]
“Detectable label” refers to a reporter molecule or enzyme that is covalently or non-covalently bound to a polynucleotide or polypeptide capable of generating a measurable signal.
[0074]
“Differential expression” refers to expression of a gene or protein that is increased (upregulated), decreased (downregulated), or deleted as determined by comparing at least two samples. Such a comparison can be made, for example, between a treated sample and an untreated sample, or a pathological sample and a healthy sample.
[0075]
“Exon shuffling” means recombination of different coding region (exon) groups. An exon can represent one structural or functional domain of the encoded protein, so it is possible to assemble a new protein group with a new combination of stable substructure groups, and a new protein function Can promote the evolution of
[0076]
A “fragment” refers to a unique portion of a GCREC or a polynucleotide encoding GCREC that may be identical in sequence to the parent sequence but shorter in length than the parent sequence. A fragment may have a length that is less than the total length of the defined sequence minus one nucleotide / amino acid residue. For example, a fragment can have from about 5 to about 1000 contiguous nucleotide or amino acid residues. Some fragments used as probes, primers, antigens, therapeutic molecules or for other purposes are at least 5, 10, 15, 20, 25, 30, 40, 50, 60, 75, 100, It can be 150, 250 or 500 consecutive nucleotide or amino acid residues. Fragments can be preferentially selected from specific regions of a molecule. For example, a polypeptide fragment is a length selected from the first 250 or 500 amino acids (or the first 25% or 50%) of a polypeptide as found within a defined sequence. Can have a continuous amino acid. These lengths are clearly given by way of example, and in embodiments of the invention can be any length supported by this specification including the sequence listing, tables and drawings.
[0077]
A fragment of SEQ ID NO: 27-52 has a region of unique polynucleotide sequence that specifically identifies SEQ ID NO: 27-52, eg, different from other sequences in the genome from which the fragment was obtained. sell. Similar methods of distinguishing certain fragments of SEQ ID NO: 27-52 from one or more embodiments of the methods of the invention, eg, hybridization and amplification techniques, or SEQ ID NO: 27-52 from related polynucleotides Can be used. The exact length of a fragment of SEQ ID NO: 27-52 and the region of SEQ ID NO: 27-52 to which the fragment corresponds is routinely determined by those skilled in the art based on the intended purpose of the fragment. Can be determined.
[0078]
Certain fragments of SEQ ID NO: 1-26 are encoded by certain fragments of SEQ ID NO: 27-52. Certain fragments of SEQ ID NO: 1-26 may have unique amino acid sequence regions that specifically identify SEQ ID NO: 1-26. For example, a fragment of SEQ ID NO: 1-26 can be used as an immunogenic peptide in the development of an antibody that specifically recognizes SEQ ID NO: 1-26. The exact length of a fragment of SEQ ID NO: 1-26, and the region of SEQ ID NO: 1-26 corresponding to this fragment is described herein based on the intended purpose of the fragment. Or may be determined by one or more analytical methods known in the art.
[0079]
A “full length” polynucleotide is a sequence having at least one translation start codon (eg, methionine) followed by an open reading frame and a translation stop codon. A “full length” polynucleotide sequence encodes a “full length” polypeptide sequence.
[0080]
The term “homology” means sequence similarity, compatibility, or sequence identity of two or more polynucleotide sequences or two or more polypeptide sequences.
[0081]
The terms “percent match” and “˜% identical” as applied to a polynucleotide sequence refer to the percentage of residues that match between two or more polynucleotide sequences aligned using a standardized algorithm. . Since the standardization algorithm optimizes the alignment between the two sequences, a gap group can be inserted into the two sequences to be compared in a standardized and reproducible manner, so that the two sequences can be compared more significantly.
[0082]
To determine the percent identity between polynucleotide sequences, one or more computer algorithms or programs known in the art or described herein may be used. For example, to determine the match rate, the default parameters of the CLUSTAL V algorithm as incorporated in the MEGALIGN version 3.12e sequence alignment program can be used. This program is part of the LASERGENE software package (a set of molecular biological analysis programs) (DNASTAR, Madison WI). CLUSTAL V is described in Higgins, D.G. and P.M. Sharp (1989) CABIOS 5: 151-153, Higgins, D.G. et al. (1992) CABIOS 8: 189-191. The default parameters for pairwise alignment of polynucleotide sequences are set as Ktuple = 2, gap penalty = 5, window = 4, “diagonals saved” = 4. A “weighted” residue weight table is selected by default. The percent match reported by CLUSTAL V is made as a “percent similarity” between aligned polynucleotide sequences.
[0083]
Alternatively, the National Local Center for Biotechnology Information (NCBI) Basic Local Alignment Search Tool (BLAST) provides a set of commonly used and freely available sequence comparison algorithms (Altschul, SF (1990) J. Mol. Biol. 215: 403-410). The BLAST algorithm is available from several sources and is also available from NCBI and the Internet (http://www.ncbi.nlm.nih.gov/BLAST/) in Bethesda, Maryland. The BLAST software suite includes a variety of sequence analysis programs, including “blastn” used to align a known polynucleotide sequence with another polynucleotide sequence from various databases. A tool called “BLAST 2 Sequences” is also available, which is used to directly compare two nucleotide sequences. “BLAST 2 Sequences” can be used interactively by accessing http://www.ncbi.nlm.nih.gov/gorf/bl2.html. The “BLAST 2 Sequences” tool can be used for both blastn and blastp (described below). The BLAST program generally uses parameters such as gaps set to default settings. For example, to compare two nucleotide sequences, blastn can be performed using the “BLAST 2 Sequences” tool Version 2.0.12 (April 21, 2000) set to default parameters. An example of setting default parameters is shown below.
[0084]
Matrix: BLOSUM62
Reward for match: 1
Penalty for mismatch: -2
Open Gap: 5 and Extension Gap: 2 penalties
Gap x drop-off: 50
Expect: 10
Word Size: 11
Filter: on
[0085]
The percent identity can be measured for the entire length of a defined sequence (eg, a sequence defined with a particular SEQ ID number). Alternatively, percentage match of shorter lengths, eg, lengths of defined, larger fragments (eg, fragments of at least 20, 30, 40, 50, 70, 100 or at least 200 consecutive nucleotides) Can also be measured. The lengths listed here are merely exemplary, and the percent identity can be measured using any fragment length supported by the sequences described herein, including tables, figures, and sequence listings. It should be understood that a certain length can be described.
[0086]
Nucleic acid sequences that do not show a high degree of identity may nevertheless encode similar amino acid sequences due to the degeneracy of the genetic code. It should be understood that this degeneracy can be used to cause changes in a nucleic acid sequence to produce a large number of nucleic acid sequences in which all nucleic acid sequences encode substantially the same protein.
[0087]
The term “percent match” or “˜% identity” as used for a polypeptide sequence refers to the percentage of matching residues between two or more polypeptide sequences that are aligned using a standardized algorithm. Methods for polypeptide sequence alignment are known. Some alignment methods take into account conservative amino acid substitutions. Such conservative substitutions as detailed above usually conserve the structure of the polypeptide (and therefore also the function) since it preserves the charge and hydrophobicity of the substitution site.
[0088]
The percent identity between polypeptide sequences can be determined using the default parameters of the CLUSTAL V algorithm as incorporated into the MEGALIGN version 3.12e sequence alignment program (described above with reference). Default parameters for pairwise alignment of polypeptide sequences using CLUSTAL V are set as Ktuple = 1, gap penalty = 3, window = 5, “diagonals saved” = 5. The PAM250 matrix is selected as the default residue weight table. As with polynucleotide alignment, the percent identity of aligned polypeptide sequence pairs is reported by CLUSTAL V as “percent similarity”.
[0089]
Alternatively, the NCBI BLAST software suite can be used. For example, when comparing two polypeptide sequences pairwise, blastp of the “BLAST 2 Sequences” tool Version 2.0.12 (April 21, 2000) can be used with default parameters set. An example of setting default parameters is shown below.
[0090]
Matrix: BLOSUM62
Open Gap: 11 and Extension Gap: 1 penalties
Gap x drop-off: 50
Expect: 10
Word Size: 3
Filter: on
[0091]
The percent identity can be measured for the full length of a defined polypeptide sequence (eg, the sequence defined by a particular SEQ ID number). Alternatively, a shorter length, eg, the length of a fragment derived from a defined larger polypeptide sequence (eg, a fragment of at least 15, 20, 30, 40, 50, 70, or at least 150 consecutive residues). The coincidence rate can also be measured. The lengths listed here are merely exemplary, and the percent identity can be measured using any fragment length supported by the sequences described herein, including tables, figures, and sequence listings. It should be understood that a certain length can be described.
[0092]
A “human artificial chromosome (HAC)” is a linear microchromosome and can have a DNA sequence of about 6 kb to 10 Mb in size. It has all the elements necessary for chromosome replication, segregation and maintenance.
[0093]
The term “humanized antibody” refers to an antibody molecule in which the amino acid sequence of the non-antigen binding region has been modified to resemble a more human antibody while retaining its original binding ability.
[0094]
“Hybridization” is an annealing process in which a single-stranded polynucleotide forms a base pair with a complementary single strand under predetermined hybridization conditions. Specific hybridization is an indication that two nucleic acid sequences share high complementarity. Specific hybridization complexes are formed under acceptable annealing conditions and remain hybridized after one or more “washing” steps. The washing step is particularly important in determining the stringency of the hybridization process, and more stringent conditions reduce non-specific binding (ie, binding between nucleic acid strand pairs that are not perfectly matched). Acceptable conditions for annealing nucleic acid sequences can routinely be determined by those skilled in the art. Although the annealing conditions can be constant for any hybridization experiment, the wash conditions can be changed from experiment to experiment to obtain the desired stringency and thus hybridization specificity. Permissive annealing conditions are, for example, at a temperature of 68 ° C., in the presence of about 6 × SSC, about 1% (w / v) SDS, and about 100 μg / ml shear-denatured salmon sperm DNA. .
[0095]
In general, the stringency of hybridization can be expressed to some extent relative to the temperature at which the wash step is performed. Such washing temperature is usually selected to be about 5-20 ° C. below the melting point (Tm) of the specific sequence at a given ionic strength and pH. This Tm is the temperature at which 50% of the target sequence hybridizes to a perfectly matched probe under conditions of a predetermined ionic strength and pH. The formula for calculating Tm and hybridization conditions for nucleic acids are well known, Sambrook, J. et al. (1989)Molecular Cloning: A Laboratory Manual, 2nd edition, 1-3, Cold Spring Harbor Press, Plainview NY, see especially chapter 9 in volume 2.
[0096]
Hybridization under high stringency conditions between polynucleotides of the invention includes wash conditions at 68 ° C. for 1 hour in the presence of about 0.2 × SSC and about 0.1% SDS. Alternatively, the temperature can be about 65 ° C, 60 ° C, 55 ° C, or 42 ° C. The SSC concentration can be varied in the range of about 0.1-2 × SSC in the presence of about 0.1% SDS. Usually, a blocking agent is used to prevent nonspecific hybridization. Such blocking agents include, for example, sheared denatured salmon sperm DNA at about 100-200 μg / ml. For example, in the hybridization of RNA and DNA under specific conditions, an organic solvent such as formamide at a concentration of about 35-50% v / v can also be used. Useful variations of the wash conditions will be apparent to those skilled in the art. Hybridization can indicate evolutionary similarity between nucleotides, particularly under high stringency conditions. Evolutionary similarity strongly suggests a similar role for nucleotide groups and nucleotide-encoded polypeptides.
[0097]
The term “hybridization complex” refers to a complex of two nucleic acids formed by the formation of hydrogen bonds between complementary bases. Hybridization complexes can form in solution (C0t or R0t analysis etc.). Alternatively, one nucleic acid is present in a dissolved state and the other nucleic acid is a solid support (e.g., paper, membrane, filter, chip, pin or glass slide, or other suitable substrate to which the cell or nucleic acid is immobilized Formed between two nucleic acids as fixed to the substrate).
[0098]
The term “insertion” or “addition” refers to a change in an amino acid sequence or polynucleotide sequence to which one or more amino acid residues or nucleotides are added, respectively.
[0099]
"Immune response" can refer to symptoms associated with inflammation, trauma, immune disorders, infectious diseases or genetic diseases and the like. These symptoms can be characterized by the expression of various factors that can affect cellular and systemic defense systems, such as cytokines, chemokines, and other signaling molecules.
[0100]
“Immunogenic fragment” refers to a polypeptide or oligopeptide fragment of GCREC that can elicit an immune response when introduced into an organism (eg, a mammal). The term “immunogenic fragment” also refers to any polypeptide or oligopeptide fragment of GCREC that is useful in any antibody production method disclosed herein or well known in the art.
[0101]
The term “microarray” refers to the organization of multiple polynucleotides, polypeptides, antibodies, or other compounds on a substrate.
[0102]
The term “element” or “array element” refers to a polynucleotide, polypeptide, antibody, or other compound having a specific designated position on a microarray.
[0103]
The term “modulate” or “modulate activity” refers to altering the activity of GCREC. For example, modulation can result in an increase or decrease in protein activity of GCREC, or a change in binding properties or other biological, functional or immunological properties.
[0104]
The terms “nucleic acid” and “nucleic acid sequence” refer to nucleotides, oligonucleotides, polynucleotides or fragments thereof. The terms “nucleic acid” and “nucleic acid sequence” also refer to DNA or RNA of genomic or synthetic origin, such as single-stranded or double-stranded, or may represent the sense or antisense strand It may also refer to peptide nucleic acid (PNA) or any DNA-like or RNA-like substance.
[0105]
“Functionally linked” refers to a state in which a first nucleic acid sequence and a second nucleic acid sequence are in a functional relationship. For example, a promoter is operably linked to a coding sequence if the promoter affects the transcription or expression of the coding sequence. Functionally linked DNA sequences can be very close or contiguous, and can be in the same reading frame if necessary to join two protein coding regions.
[0106]
“Peptide nucleic acid (PNA)” refers to an antisense molecule or anti-gene agent having an oligonucleotide of at least about 5 nucleotides in length attached to the peptide backbone of amino acid residues ending in lysine. The terminal lysine imparts solubility to this composition. PNA binds preferentially to complementary single-stranded DNA or RNA to stop transcription elongation. Polyethylene glycolation can extend the lifetime of PNA in cells.
GCREC “post-translational modifications” may include lipidation, glycosylation, phosphorylation, acetylation, racemization, proteolytic cleavage, and other modifications known in the art. These processes can occur synthetically or biochemically. Biochemical modifications depend on the GCREC enzyme environment and will vary with cell type.
[0107]
The “probe” refers to a nucleic acid encoding GCREC, a complementary sequence thereof, or a fragment thereof used for detecting the same nucleic acid, allelic nucleic acid, or related nucleic acid. A probe is an isolated oligonucleotide or polynucleotide that is a sequence attached to a detectable label or reporter molecule. Typical labels include radioactive isotopes, ligands, chemiluminescent reagents and enzymes. A “primer” is a short nucleic acid, usually a DNA oligonucleotide, that can form complementary base pairs and anneal to a target polynucleotide. The primer can then be extended along the target DNA strand by a DNA polymerase enzyme. Primer pairs can be used for amplification (and identification) of nucleic acids, eg, by polymerase chain reaction (PCR).
[0108]
The probes and primers used in the present invention usually consist of at least 15 consecutive nucleotide groups of known sequence. To increase specificity, longer probes and primers, such as probes consisting of at least 20, 25, 30, 40, 50, 60, 70, 80, 90, 100 or at least 150 consecutive nucleotides of the disclosed nucleic acid sequence And primers may also be used. Some probes and primers are much longer than this. It should be understood that nucleotides of any length supported by this specification, including tables, drawings and sequence listings may be used.
[0109]
See Sambrook, J. et al. (1989) for the preparation and use of probes and primers.Molecular Cloning: A Laboratory Manual, 2nd edition, 1-3, Cold Spring Harbor Press, Plainview NY, Ausubel, F.M., etc. (1987)Current Protocols in Molecular Biology, Greene Publ. Assoc. & Wiley-Intersciences, New York NY, Innis, M. et al. (1990)PCR Protocols, A Guide to Methods and Applications, Academic Press, San Diego CA, etc. To obtain a PCR primer pair from a known sequence, for example, a computer program therefor, such as Primer (Version 0.5, 1991, Whitehead Institute for Biomedical Research, Cambridge MA) can be used.
[0110]
The selection of oligonucleotides to be used as primers is performed using software known in the art for such purposes. For example, OLIGO 4.06 software is useful for selecting PCR primer pairs up to 100 nucleotides each, derived from oligonucleotides and up to 5,000 larger polynucleotides up to 32 kilobases of input polynucleotide sequences. It is also useful for analyzing sequences. Similar primer selection programs incorporate additional functionality for extended capabilities. For example, the PrimOU primer selection program (available to the public from the Genome Center of the University of Texas Southwestern Medical Center in Dallas, Texas) can select specific primers from the megabase sequence, and thus the entire genome range. This is useful for designing primers. Using the Primer3 primer selection program (available from the Whitehead Institute / MIT Center for Genome Research, Cambridge, Mass.), You can enter a “mispriming library” that allows you to specify the sequences you want to avoid as primer binding sites. Primer3 is particularly useful for selection of oligonucleotides for microarrays (the source code for the latter two primer selection programs can be obtained from the respective sources and modified to meet user-specific needs). The PrimerGen program (available from the UK Human Genome Mapping Project in Cambridge, UK-publicly available from the Resource Center) designs primers based on multiple sequence alignments, thereby maximally conserving or minimally conserving aligned nucleic acid sequences Allows selection of primers that hybridize to any of the regions. Therefore, this program is useful for identifying oligonucleotides and polynucleotide fragments, whether unique or conserved. Oligonucleotides and polynucleotide fragments identified by any of the above selection methods identify complete or partially complementary polynucleotides in hybridization techniques, eg, as PCR or sequencing primers, as microarray elements, or in nucleic acid samples Useful as a specific probe. The method for selecting the oligonucleotide is not limited to the above method.
[0111]
A “recombinant nucleic acid” is not a natural nucleic acid, but a nucleic acid having a sequence that is an artificial combination of two or more separated segments of sequence. This artificial combination is often achieved by chemical synthesis, but more commonly by artificial manipulation of isolated segments of nucleic acids, for example by genetic engineering techniques such as those described in Sambrook (supra). To do. The term recombinant nucleic acid also includes nucleic acids in which a portion of the nucleic acid has been modified by addition, substitution or deletion. Often recombinant nucleic acids include nucleic acid sequences operably linked to promoter sequences. Such recombinant nucleic acids can be part of a vector that is used, for example, to transform a cell.
[0112]
Alternatively, such a recombinant nucleic acid can be part of a viral vector, which can be based on, for example, vaccinia virus. Such vectors can be used to inoculate a mammal and the recombinant nucleic acid is expressed to induce a protective immune response in the mammal.
[0113]
A “regulatory element” is a nucleic acid sequence usually derived from the untranslated region of a gene, including enhancers, promoters, introns, and 5 ′ and 3 ′ untranslated regions (UTRs). Regulatory elements interact with host or viral proteins that control transcription, translation or RNA stability.
[0114]
A “reporter molecule” is a chemical or biochemical component used to label a nucleic acid, amino acid or antibody. Reporter molecules include radionuclides, enzymes, fluorescent agents, chemiluminescent agents, color formers, substrates, cofactors, inhibitors, magnetic particles and other components known in the art.
[0115]
An “RNA equivalent” for a DNA molecule consists of the same linear nucleotide sequence as the reference DNA molecule, but all the nitrogenous base thymines are replaced with uracil and the backbone of the sugar chain is deoxyribose. Without ribose.
[0116]
The term “sample” is used in its broadest sense. GCREC, GCREC-encoding nucleic acid groups, or samples presumed to contain fragments thereof include body fluids, chromosomes isolated from cells and cells, organelles, and extracts from membranes, There can be cells, genomic DNA, RNA, cDNA, tissue, tissue prints, etc. present in solution or fixed to a substrate.
[0117]
The terms “specific binding” and “specifically bind” refer to the interaction of a protein or peptide with an agonist, antibody, antagonist, small molecule, or any natural or synthetic binding composition. This interaction depends on the presence or absence of a specific structure of the protein (eg, an antigenic determinant or epitope) that is recognized by the binding molecule. For example, if an antibody is specific for epitope “A”, a polypeptide with epitope A may bind or bind in a reaction involving unbound labeled “A” and the antibody. If unlabeled “A” is present, the amount of labeled A bound to the antibody is reduced.
[0118]
The term “substantially purified” refers to an isolated or separated nucleic acid or amino acid sequence that has been removed from its natural environment and has removed at least about 60% of the naturally bound composition. Preferably about 75% or more, and most preferably about 90% or more.
[0119]
“Substitution” is the replacement of one or more amino acid residues or nucleotides with another amino acid residue or nucleotide, respectively.
[0120]
“Substrate” refers to any suitable solid or semi-solid support, including membranes and filters, chips, slides, wafers, fibers, magnetic or non-magnetic beads, gels, tubes, plates, polymers, microparticles, capillaries. included. The substrate can have various surface forms such as wells, grooves, pins, channels, holes, and the like, and polynucleotides and polypeptides are bound to the substrate surface.
[0121]
A “transcript image” or “expression profile” refers to the collective pattern of gene expression by a particular cell type or tissue at a given time under given conditions.
[0122]
“Transformation” refers to the process by which exogenous DNA is introduced into a recipient cell. Transformation can occur under natural or artificial conditions according to various methods known in the art, and is any known method that inserts an exogenous nucleic acid sequence into a prokaryotic or eukaryotic host cell. Based on this method. The method of transformation is selected according to the type of host cell to be transformed. Non-limiting transformation methods include viral infection, electroporation (electroporation), heat shock, lipofection and methods using a particle gun. A “transformed cell” includes a stably transformed cell in which the introduced DNA is replicable as an autonomously replicating plasmid or as part of a host chromosome. Furthermore, cells that transiently express introduced DNA or RNA for a limited period are also included.
[0123]
As used herein, a “transgenic organism” is any organism, including but not limited to animals and plants, in which one or more cells of the organism are, for example, subject to the present technology by human intervention. It has a heterologous nucleic acid introduced by transgenic techniques known in the art. Nucleic acids are introduced into cells either directly or indirectly by introduction into cell precursors. This is done by planned genetic manipulation, for example by microinjection or by introduction of recombinant viruses. In another embodiment, the introduction of the nucleic acid can be accomplished by infecting a recombinant viral vector, such as a lentiviral vector (Lois, C. et al. (2002) Science 295: 868-872). The term genetic engineering does not refer to classical crossbreeding or in vitro fertilization but to the introduction of recombinant DNA molecules. Among the genetically transformed organisms contemplated in accordance with the present invention are bacteria, cyanobacteria, fungi and animals and plants. The isolated DNA of the present invention can be introduced into a host by methods known in the art, such as infection, transfection, transformation or transconjugation. Techniques for transferring the DNA of the present invention into such organisms are well known and are described in references such as Sambrook et al. (1989), supra.
[0124]
A “variant” of a specific nucleic acid sequence is a sequence determined as a nucleic acid sequence having at least 40% sequence identity to the specific nucleic acid sequence over a certain length of one nucleic acid sequence. For the determination, blastn is executed by using “BLAST 2 Sequences” tool Version 2.0.9 (May 7, 1999) set as default parameters. Such nucleic acid pairs are, for example, at least 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% for a given length, It can show 96%, 97%, 98%, 99% or more sequence identity. Variants can be described, for example, as “allelic” variants (described above) or “splice” variants, “species” variants, “polymorphic” variants. Splice variants may have significant identity to the reference molecule, but will usually have more or fewer nucleotides due to alternative splicing of exons during mRNA processing. Corresponding polypeptides may have additional functional domain groups or may lack domain groups present in the reference molecule. Species variants are polynucleotides that vary from species to species. The resulting polypeptides usually have significant amino acid identity with each other. A polymorphic variant is a variation in the polynucleotide sequence of a particular gene between certain individuals. Polymorphic variants can also include “single nucleotide polymorphisms” (SNPs) that differ in one nucleotide base of the polynucleotide sequence. The presence of SNPs can indicate, for example, a particular population, condition or disease propensity.
[0125]
A “variant” of a specific polypeptide sequence is a sequence determined as a polypeptide sequence having at least 40% sequence identity to the specific polypeptide sequence over a certain length of one polypeptide sequence. It is. For the determination, blastp is executed by using “BLAST 2 Sequences” tool Version 2.0.9 (May 7, 1999) set as default parameters. Such polypeptide pairs are, for example, at least 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94% for one predetermined length of the polypeptide. 95%, 96%, 97%, 98%, 99% or more sequence identity.
[0126]
(invention)
Various embodiments of the present invention include a novel group of human G protein coupled receptors (GCREC) and a polynucleotide encoding GCREC. In addition, diagnosis, treatment, or prevention of olfactory neuropathy, cell proliferation abnormality, neurological disease, cardiovascular disorder, gastrointestinal disorder, autoimmune / inflammatory disorder, metabolic disorder, and viral infection using these compositions including.
[0127]
Table 1 summarizes the nomenclature of the full-length polynucleotide embodiments and polypeptide embodiments of the invention. Each polynucleotide and its corresponding polypeptide correlates to one Incyte project identification number (Incyte project ID). Each polypeptide sequence was represented by a polypeptide sequence identification number (polypeptide SEQ ID NO :) and an Incyte polypeptide sequence number (Incyte polypeptide ID). Each polynucleotide sequence was represented by a polynucleotide sequence identification number (polynucleotide SEQ ID NO :) and an Incyte polynucleotide consensus sequence number (Incyte polynucleotide ID).
[0128]
Table 2 shows sequences homologous to the polypeptides of the present invention identified by BLAST analysis against the GenBank protein (genpept) database. Columns 1 and 2 each show the polypeptide sequence identification number (polypeptide SEQ ID NO :) and the corresponding Incyte polypeptide sequence number (Incyte polypeptide ID) for each polypeptide of the invention. Column 3 shows the GenBank identification number (GenBank ID NO :) of the closest GenBank homologue. Column 4 shows the probability score for a match between each polypeptide and one or more of its homologues. Column 5 shows appropriate citations where applicable and annotations of GenBank homologues, all of which are included herein in the references.
[0129]
Table 3 shows various structural features of the polypeptides of the invention. Columns 1 and 2 show the polypeptide sequence identification number (SEQ ID NO :) and the corresponding Incyte polypeptide sequence number (Incyte polypeptide ID) for each polypeptide of the invention. Column 3 shows the number of amino acid residues of each polypeptide. Columns 4 and 5 show potential phosphorylation and glycosylation sites, respectively, as determined by the GCG sequence analysis software package MOTIFS program (Genetics Computer Group, Madison WI). Column 6 shows the amino acid residues that include the signature sequence, domain, and motif. Column 7 shows the analysis method for the analysis of the structure / function of the protein, and the applicable part further shows a searchable database used for the analysis method.
[0130]
Tables 2 and 3 together summarize the properties of each polypeptide of the present invention, which establishes that the claimed polypeptides are G protein coupled receptors. For example, SEQ ID NO: 1 has been shown by the Basic Local Alignment Search Tool (BLAST) to have 45% identity with murine olfactory receptor P2 (GenBank ID g7638409) from residue M1 to residue M251. The BLAST probability score is 2.0e-56, indicating the probability that an observed polypeptide sequence alignment will be obtained by chance. SEQ ID NO: 1 also has one transmembrane seven-pass receptor (rhodopsin family), which is a statistical in the PFAM database of conserved protein family domains based on the Hidden Markov Model (HMM). Determined by searching for significant matches (see Table 3). Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 1 is an olfactory receptor.
[0131]
In another example, SEQ ID NO: 4 was determined by the Basic Local Alignment Search Tool (BLAST) to be 86% identical to the mouse olfactory receptor (GenBank ID g5869916) from residue M1 to residue K315. The BLAST probability score is 3.6e-144, which indicates the probability of accidentally obtaining the observed polypeptide sequence. SEQ ID NO: 4 also has one transmembrane seven-pass receptor (rhodopsin family) domain, which is a conserved protein family domain group PFAM database based on the hidden Markov model (HMM) Determined by searching for statistically significant matches (see Table 3). Data from TMAP, BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 4 is an olfactory receptor.
[0132]
In another example, SEQ ID NO: 6 was determined by the Basic Local Alignment Search Tool (BLAST) to be 73% identical to the mouse olfactory receptor (GenBank ID g5869927) from residue M1 to residue A296. The BLAST probability score is 2.1e-111, indicating the probability that an observed polypeptide sequence alignment will be obtained by chance. SEQ ID NO: 6 also has one transmembrane seven-pass receptor (rhodopsin family) domain, which is a conserved protein family domain group PFAM database based on the Hidden Markov Model (HMM) Determined by searching for statistically significant matches (see Table 3). Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 6 is an olfactory receptor.
[0133]
In another example, SEQ ID NO: 10 was determined by the Basic Local Alignment Search Tool (BLAST) to be 66% identical to the human olfactory receptor (GenBank ID g2921710) from residue I68 to residue P282 ( (See Table 2). The BLAST probability score is 8.3e-78, indicating the probability of accidentally obtaining the observed polypeptide sequence. SEQ ID NO: 10 also has a single rhodopsin family seven-transmembrane receptor domain, which is statistical in the PFAM database of conserved protein family domains based on the Hidden Markov Model (HMM). Was determined by searching for significant matches (see Table 3). Data from BLIMPS and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 10 is an olfactory receptor.
[0134]
SEQ ID NO: 11 is 50% identical to the mouse odorant receptor MOR83 (GenBank ID g6178006) from residue N5 to residue S308, as determined by BLAST analysis with a BLAST probability score of 1.9e-85 is there. SEQ ID NO: 11 also has one rhodopsin family 7-transmembrane receptor domain, which was determined by searching for statistically significant matches in the HMMER-PFAM database of conserved protein family domains. Data from BLIMPS analysis provides further confirmation that SEQ ID NO: 11 is an olfactory receptor.
[0135]
SEQ ID NO: 12 is 59% identical to mouse odorant receptor S1 (GenBank ID g4680254) from residue N13 to residue L320, as determined by BLAST analysis with a BLAST probability score of 7.4e-93 is there. SEQ ID NO: 12 also has one rhodopsin family seven-transmembrane receptor domain, which was determined by searching for statistically significant matches in the HMMER-PFAM database of conserved protein family domains. Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 12 is an olfactory receptor.
[0136]
SEQ ID NO: 13 is 54% identical to chicken olfactory receptor 4 (GenBank ID g1246534) from residue M1 to residue R306, as determined by BLAST analysis, with a BLAST probability score of 5.8e-86 . SEQ ID NO: 13 also has one rhodopsin family seven-transmembrane receptor domain, which was determined by searching for statistically significant matches in the HMMER-PFAM database of conserved protein family domains. Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 13 is an olfactory receptor.
[0137]
SEQ ID NO: 14 is determined by BLAST analysis to be 47% identical to the human olfactory receptor HsOLF1 (GenBank ID g1336041) from residue E16 to residue V325, and the BLAST probability score is 1.7e-77. SEQ ID NO: 14 also has one rhodopsin family seven-transmembrane receptor domain, which was determined by searching for statistically significant matches in the HMMER-PFAM database of conserved protein family domains. Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 14 is an olfactory receptor.
[0138]
SEQ ID NO: 15 is determined by BLAST analysis to be 49% identical to chicken olfactory receptor 4 (GenBank ID g1514480) from residue M1 to residue V309, with a BLAST probability score of 1.9e-78. SEQ ID NO: 15 also has one rhodopsin family transmembrane seven-pass receptor domain, determined by searching for statistically significant matches in the HMMER-PFAM database of conserved protein family domains. Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 15 is an olfactory receptor.
[0139]
SEQ ID NO: 16 has 49% identity from residue N6 to residue K314 to the human olfactory receptor HOR5'Beta11 (GenBank ID g11908214), determined by BLAST analysis and BLAST probability score of 3.0e- 80, which indicates the probability of accidentally obtaining the observed polypeptide sequence alignment. SEQ ID NO: 16 was also determined by searching for statistically significant matches in the HMMER-PFAM database of conserved protein family domains with one rhodopsin family 7-transmembrane receptor domain . Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 16 is an olfactory receptor.
[0140]
SEQ ID NO: 17 was determined by BLAST analysis to be 54% identical to the mouse olfactory receptor MOR 3'Beta6 (GenBank ID g11908221) from residue P12 to residue V306, with a BLAST probability score of 9.4e-86 is there. SEQ ID NO: 17 also has one rhodopsin family seven-transmembrane receptor domain, which was determined by searching for statistically significant matches in the HMMER-PFAM database of conserved protein family domains. Data from the BLIMPS analysis provides further confirmation that SEQ ID NO: 17 is an olfactory receptor.
[0141]
In another example, SEQ ID NO: 20 may have 55% identity with the mouse odorant receptor S1 (GenBank ID g4680254) from residue N7 to residue L309. ) (See Table 2). The BLAST probability score is 6.7e-85, indicating the probability that an observed polypeptide sequence alignment will be obtained by chance. SEQ ID NO: 20 also has one transmembrane seven-pass receptor (rhodopsin family) domain, which is a conserved protein family domain group PFAM database based on the hidden Markov model (HMM) Determined by searching for statistically significant matches (see Table 3). Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 20 is an odorant receptor.
[0142]
In yet another example, SEQ ID NO: 26 has 64% identity with the mouse odorant receptor MOR18 (GenBank ID g6178008) from residue V61 to residue V361. Basic Local Alignment Search Tool ( BLAST) (see Table 2). The BLAST probability score is 9.9e-107, indicating the probability that an observed polypeptide sequence alignment will be obtained by chance. SEQ ID NO: 26 also has one transmembrane seven-pass receptor (rhodopsin family) domain, which is a conserved protein family domain group PFAM database based on the hidden Markov model (HMM) Determined by searching for statistically significant matches (see Table 3). Data from BLIMPS, MOTIFS, and PROFILESCAN analyzes provide further confirmation that SEQ ID NO: 26 is an odorant receptor. SEQ ID NO: 2-3, SEQ ID NO: 5, SEQ ID NO: 7-9, SEQ ID NO: 18-19 and SEQ ID NO: 21-25 were analyzed and annotated in a similar manner. The algorithm and parameters for analysis of SEQ ID NO: 1-26 are listed in Table 7.
[0143]
As shown in Table 4, full-length polynucleotide embodiments were assembled using cDNA sequences or coding (exon) sequences derived from genomic DNA, or any combination of these two sequences. Column 1 shows the polynucleotide sequence identification number (polynucleotide SEQ ID NO) and the corresponding Incyte polynucleotide consensus sequence number (Incyte ID) for each polynucleotide of the invention, and the length of each polynucleotide sequence in base pairs. Yes. Column 2 relates to the cDNA and / or genomic sequence used in the assembly of the full-length polynucleotide embodiment, and also to identify, for example, SEQ ID NO: 27-52 or SEQ ID NO: 27-52 The starting nucleotide (5 ′) position and the ending nucleotide (3 ′) position of a fragment of a polynucleotide useful in a hybridization technique or amplification technique for distinguishing from a group of polynucleotides to be performed are indicated.
[0144]
The polynucleotide fragment described in column 2 of Table 4 may refer to, for example, an Incyte cDNA group derived from, for example, a tissue-specific cDNA library group or a pooled cDNA library group. Alternatively, the polynucleotide fragment described in column 2 may refer to the GenBank cDNA or EST that contributed to the assembly of the full-length polynucleotide. In addition, the polynucleotide fragments listed in column 2 may identify sequences from the ENSEMBL (The Sanger Centre, Cambridge, UK) database (ie, sequences that include the designation “ENST”). Alternatively, the polynucleotide fragments listed in column 2 may be derived from the NCBI RefSeq Nucleotide Sequence Records database (ie, sequences containing the designation “NM” or “NT”) and from the NCBI RefSeq Protein Sequence Records. (Ie, sequences that include the designation “NP”). Alternatively, the polynucleotide fragment listed in column 2 may refer to an assembly consisting of both cDNA and Genscan predicted exons grouped together by an “exon-stitching” algorithm. For example, FL_XXXXXX_N in the polynucleotide sequence1_N2_YYYYY_NThree_NFour The sequences identified as are “stitched” sequences, where XXXXXX is the identification number of the cluster of sequences to which the algorithm is applied, YYYYY is the number of predictions the algorithm creates, and N1,2,3 ...Represents a specific group of exons that were manually edited during the analysis (Example 5reference). Alternatively, the polynucleotide fragments in row 2 may refer to an assembly of exons joined together by an “exon-stretching” algorithm. For example, among the polynucleotide sequences, the sequence identified as FLXXXXXX_gAAAAA_gBBBBB_1_N is the “stretch” sequence identification number. Where XXXXXX is the Incyte project identification number, gAAAAA is the GenBank identification number of the human genome sequence to which the `` exon stretching '' algorithm is applied, gBBBBB is the GenBank identification number of the nearest GenBank protein homolog, or NCBI RefSeq identification number, N is specified Refers to exons of (Example 5See). When a RefSeq sequence is used as a protein homolog for the “exon stretching” algorithm, the RefSeq identifier represented by “NM”, “NP”, or “NT” is the GenBank identifier (ie, gBBBBB ) Can be used instead.
[0145]
Alternatively, the prefix code identifies a component sequence derived from a manually edited component sequence, a component sequence predicted from a genomic DNA sequence, or a combined sequence analysis method. The following table lists the constituent sequence prefix codes and examples of sequence analysis methods corresponding to the prefix codes (Examples 4 and 5See).
Figure 2005500037
[0146]
In some cases, Incyte cDNA coverage overlapping with the sequence coverage as shown in Table 4 was obtained to confirm the final consensus polynucleotide sequence, but no corresponding Incyte cDNA identification number was given.
[0147]
Table 5 shows a representative cDNA library for full-length polynucleotides assembled using Incyte cDNA sequences. A representative cDNA library is an Incyte cDNA library, most often represented by Incyte cDNA sequences, which were used to assemble and confirm the polynucleotides. The tissues and vectors used to create the cDNA library are shown in Table 5 and described in Table 6.
[0148]
The present invention also includes GCREC variants. Preferred variants of GCREC have at least about 80%, alternatively at least about 90%, or even at least about 95% amino acid sequence identity to the GCREC amino acid sequence, and have functional or structural characteristics of GCREC It is a mutant containing at least one.
[0149]
Various embodiments also include a polynucleotide encoding GCREC. In certain embodiments, the present invention provides a polynucleotide sequence having a sequence selected from the group consisting of SEQ ID NO: 27-52, encoding GCREC. The polynucleotide sequence of SEQ ID NO: 27-52 also includes an equivalent RNA sequence as shown in the sequence listing, where the occurrence of the nitrogen base thymine is replaced by uracil and the sugar backbone is deoxyribose. There is no ribose.
[0150]
The present invention also includes a group of polynucleotide variants encoding GCREC. In particular, such variant polynucleotides have at least about 70% polynucleotide sequence identity, or at least about 85% polynucleotide sequence identity, or even at least about 95%, with a polynucleotide encoding GCREC. % Of polynucleotide sequence identity. In certain embodiments of the present invention, a SEQ ID having at least about 70%, alternatively at least about 85%, or at least about 95% identity with an amino acid sequence selected from the group consisting of SEQ ID NO: 27-52 A polynucleotide variant having a sequence selected from the group consisting of NO: 27-52. Any of the polynucleotide variants described above may encode a polypeptide having at least one functional or structural characteristic of GCREC.
[0151]
Additionally or alternatively, certain polynucleotide variants of the invention are splice variants of a polynucleotide encoding GCREC. Some splice variants may have multiple portions with significant sequence identity to the polynucleotide encoding GCREC, but the addition or absence of a few blocks of sequence caused by alternative splicing of exons during mRNA processing. Loss usually results in having more or fewer polynucleotides. In some splice variants, less than about 70%, or less than about 60%, or less than about 50% polynucleotide sequence identity is found over the entire length with the polynucleotide encoding GCREC, Some portions of this splice variant have at least about 70%, or at least about 85%, or at least about 95%, or even 100% polynucleotide sequence identity with each portion of the polynucleotide encoding GCREC. It will have sex. Any of the splice variants described above can encode a polypeptide having at least one functional or structural characteristic of GCREC.
[0152]
Those skilled in the art will appreciate that the degeneracy of the genetic code creates a variety of polynucleotide sequences that encode GCREC, some of which have minimal similarity to any known native gene polynucleotide sequences. Will be understood. Thus, the present invention may cover all possible polynucleotide sequence variations that can be produced by selection of combinations based on possible codon selection. These combinations are based on the standard triplet genetic code applied to the polynucleotide sequence of natural GCREC. Consider that all such mutations are clearly disclosed.
[0153]
The polynucleotide encoding GCREC and its variants is generally capable of hybridizing to a native GCREC polynucleotide under suitably selected stringency conditions, but includes substantially different codons, such as including non-natural codon groups. It may be beneficial to create a polynucleotide that encodes GCREC with use or a derivative thereof. Codons can be selected to increase the expression rate of peptides generated in a particular eukaryotic or prokaryotic host based on the frequency with which the host utilizes the particular codon. Examples of other reasons for substantially altering the nucleotide sequence encoding GCREC and its derivatives without altering the encoded amino acid sequence group include, for example, a longer half-life than a transcript made from the native sequence, etc. There is the production of RNA transcripts with more favorable properties.
[0154]
The present invention also includes the production by fully synthetic chemistry of a group of polynucleotides or fragments thereof encoding GCREC and its derivatives. After production, the synthetic polynucleotide can be inserted into any of a variety of available expression vectors and cell lines using reagents well known in the art. In addition, synthetic chemistry can be used to induce mutations in certain polynucleotides encoding GCREC or any fragment thereof.
[0155]
Embodiments of the present invention are capable of hybridizing under various stringency conditions to the claimed polynucleotide, in particular, the polynucleotide having the sequence shown in SEQ ID NO: 27-52, and fragments thereof. Including polynucleotides (eg, Wahl, GM and SL Berger (1987) Methods Enzymol. 152: 399-407, Kimmel, AR (1987) Methods Enzymol. 152: 507-511.) Including annealing and washing conditions Hybridization conditions are described in “Definitions”.
[0156]
Methods for DNA sequencing are known in the art, and any of the embodiments of the present invention can use DNA sequencing methods. Enzymes can be used for DNA sequencing methods. For example, Klenow fragment of DNA polymerase 1, SEQUENASE (US Biochemical, Cleveland OH), Taq polymerase (Applied Biosystems), thermostable T7 polymerase (Amersham Biosciences, Piscataway NJ) can be used. Alternatively, a polymerase and a proofreading exonuclease can be used in combination, as seen, for example, in the ELONGASE amplification system (Invitrogen, Carlsbad CA). Preferably, sequence preparation is automated using equipment such as the MICROLAB 2200 liquid transfer system (Hamilton, Reno, NV), the PTC200 thermal cycler (MJ Research, Watertown MA) and the ABI CATALYST 800 thermal cycler (Applied Biosystems). The sequencing is then performed using the ABI 373 or 377 DNA sequencing system (Applied Biosystems), the MEGABACE 1000 DNA sequencing system (Amersham Biosciences) or other systems known in the art. The resulting sequence is analyzed using various algorithms well known in the art (eg, Ausubel, F.M. (1997)Short Protocols in Molecular Biology, John Wiley & Sons, New York NY, 7.7 units, Meyers, R.A. (1995)Molecular Biology and BiotechnologyWiley VCH, New York NY, pages 856-853).
[0157]
Utilizing various PCR-based methods well-known in the art and partial nucleotide sequences, nucleic acids encoding GCREC can be extended to detect upstream sequences such as promoters and regulatory elements . For example, one of the methods that can be used is the restriction site PCR method, which uses a universal primer and a nested primer to amplify an unknown sequence from genomic DNA in a cloning vector (eg, Sarkar, G. (1993 ) See PCR Methods Applic. 2: 318-322). Another method is inverse PCR, which amplifies an unknown sequence from a circularized template using a group of primers extending in various directions. The template is obtained from a group of restriction enzymes consisting of a certain known genomic locus and its surrounding sequences (see, eg, Triglia, T. et al. (1988) Nucleic Acids Res. 16: 8186). A third method is the capture PCR method, which includes PCR amplification of DNA fragments adjacent to known sequences of human and yeast artificial chromosomal DNA (eg Lagerstrom, M. et al. (1991) PCR Methods). (See Applic 1: 111-119). In this method, a recombinant double-stranded sequence can be inserted into an unknown sequence region using multiple restriction enzyme digestion and ligation reactions prior to PCR. Several other methods are known in the art that can be used to search for unknown sequences (see, eg, Parker, J.D. et al. (1991) Nucleic Acids Res. 19: 3055-3060). In addition, genomic DNA can be walked using PCR, nested primers, and PROMOTERFINDER libraries (Clontech, Palo Alto CA). This procedure is useful for discovery of intron / exon junctions without the need to screen libraries. All PCR-based methods use commercially available software such as OLIGO 4.06 primer analysis software (National Biosciences, Plymouth MN) or another suitable program, about 22-30 nucleotides in length and about 50% GC content. Thus, the primer group can be designed to anneal to the template at a temperature of about 68 ° C. to 72 ° C.
[0158]
When screening for full-length cDNA groups, it is preferable to use library groups that are size-selected to include larger cDNA groups. In addition, random primer libraries often contain sequences having the 5 ′ region of the gene cluster, and are suitable for situations where an oligo d (T) library cannot produce a full-length cDNA. Genomic libraries may be useful for extending sequences into the 5 ′ non-transcribed regulatory region.
[0159]
Commercially available capillary electrophoresis systems can be used to analyze the size of the sequencing or PCR product or to confirm its nucleotide sequence. Specifically, capillary sequencing is a flowable polymer for electrophoretic separation, a laser-activated fluorescent dye that is specific for four different nucleotides, and detection of the emitted wavelength. And a CCD camera to be used. The output / light intensity can be converted to an electrical signal using appropriate software (such as GENOTYPER, SEQUENCE NAVIGATOR from Applied Biosystems). The entire process from sample loading to computer analysis and electronic data display can be computer controlled. Capillary electrophoresis is particularly suitable for sequencing small DNA fragments that are present in small amounts in a particular sample.
[0160]
In another embodiment of the invention, a polynucleotide encoding GCREC or a fragment thereof may be cloned into a recombinant DNA molecule that causes GCREC, a fragment or functional equivalent thereof to be expressed in a suitable host cell. Due to the inherent degeneracy of the genetic code, other polynucleotides encoding substantially the same or functionally equivalent polypeptides can be produced and these sequences can be utilized for the expression of GCREC.
[0161]
For various purposes, the polynucleotides of the invention can be recombined using a number of methods generally known in the art to modify the sequence encoding GCREC. The various purposes of this recombination include, but are not limited to, cloning of the gene product or modification of processing and / or expression. Nucleotide sequences can be recombined using random fragmentation of gene fragments and synthetic oligonucleotides and DNA shuffling by PCR reassembly. For example, site-directed mutagenesis via oligonucleotides can be used to introduce mutations that create new restriction sites, alter glycosylation patterns, change codon preference, generate splice variants, and the like.
[0162]
Nucleotides of the present invention are disclosed in MOLECULARBREEDING (Maxygen Inc., Santa Clara CA; U.S. Pat.No. 5,837,458; Chang, C.-C. et al. (1999) Nat. Biotechnol. 17: 793-797; Christians, FC et al. Nat. Biotechnol. 17: 259-264; Crameri, A. et al. (1996) Nat. Biotechnol. 14: 315-319). This can modify or improve the biological properties of GCREC, such as biological or enzymatic activity, or the ability to bind to other molecules and compounds. DNA shuffling is a process of creating a library of gene variants using gene fragment recombination via PCR. The library is then subjected to a selection or screening procedure that identifies a group of genetic variants with the desired characteristics. These suitable variants can then be pooled and further repeated for DNA shuffling and selection / screening. Thus, “artificial” breeding and rapid molecular evolution create diverse genes. For example, single gene fragments with random point mutations can be recombined, screened, and then shuffled until the desired properties are optimized. Alternatively, a method for controlling the genetic diversity of a plurality of naturally occurring genes by recombining a fragment group of a predetermined gene with a fragment of a homologous gene of the same gene family obtained from the same species or different species. Can be maximized.
[0163]
In another embodiment, the polynucleotide encoding GCREC can be synthesized in whole or in part using chemical methods well known in the art (eg, Caruthers. MH et al. (1980) Nucleic Acids Symp. Ser. 7: 215-223; and Horn, T. et al. (1980) Nucleic Acids Symp. Ser. 7: 225-232). Alternatively, chemical methods known in the art can be used to synthesize GCREC itself or fragments thereof. For example, peptide synthesis can be performed using various liquid phase or solid phase techniques (eg, Creighton, T. (1984)Proteins, Structures and Molecular Properties, WH Freeman, New York NY, pages 55-60; and Roberge, J.Y. et al. (1995) Science 269: 202-204). Automated synthesis can be achieved using an ABI 431A peptide synthesizer (Applied Biosystems). Furthermore, the variant polypeptide can be obtained by modifying the amino acid sequence of GCREC, or any part thereof, directly upon synthesis and / or in combination with sequences from other proteins or any part thereof. Or a polypeptide having one sequence of a natural polypeptide.
[0164]
This peptide can be substantially purified by preparative high performance liquid chromatography (see, for example, Chiez, R.M. and F.Z. Regnier (1990) Methods Enzymol. 182: 392-421). The composition of this synthetic peptide can be confirmed by amino acid analysis or sequencing (see, for example, Creighton, pages 28-53 above).
[0165]
In order to express biologically active GCREC, a polynucleotide encoding GCREC or a derivative thereof may be inserted into a suitable expression vector. A suitable expression vector is a vector having elements necessary for controlling transcription and translation of a coding sequence inserted into a suitable host. Necessary elements include regulatory sequences within the vector and in the polynucleotide encoding GCREC (eg, enhancers, constitutive and inducible promoters, 5 ′ and 3 ′ untranslated regions, etc.). Necessary elements vary in strength and specificity. More specific translation of the polynucleotides encoding GCREC can also be achieved using specific initiation signals. Examples of initiation signals include ATG initiation codons and nearby sequences such as Kozak sequences. If the polynucleotide sequence encoding GCREC, its initiation codon, and upstream regulatory sequences are inserted into a suitable expression vector, no additional transcriptional or translational control signals may be required. However, if only the coding sequence or a fragment thereof is inserted, an exogenous translational control signal such as an in-frame ATG start codon should be included in the expression vector. Exogenous translation elements and initiation codons can originate from a variety of natural and synthetic products. Inclusion of an enhancer suitable for the particular host cell system used can increase the efficiency of expression (see, eg, Scharf, D. et al. (1994) Results Probl. Cell Differ. 20: 125-162).
[0166]
Methods which are well known to those skilled in the art can be used to create an expression vector having a polynucleotide encoding GCREC and suitable transcriptional and translational control elements. These methods include in vitro recombinant DNA techniques, synthetic techniques, and in vivo genetic recombination techniques (eg, Sambrook, J. et al. (1989)Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, Plainview NY, 4, 8, and 16-17; Ausubel, F.M. et al. (1995)Current Protocols in Molecular Biology, John Wiley & Sons, New York NY, 9, 13, and 16).
[0167]
A variety of expression vector / host systems may be utilized to retain and express the polynucleotide encoding GCREC. Such expression vector / host systems include, but are not limited to, microorganisms such as bacteria transformed with recombinant bacteriophage, plasmid or cosmid DNA expression vectors, yeast transformed with yeast expression vectors, Transformed with an insect cell line infected with a viral expression vector (eg baculovirus), a viral expression vector (eg cauliflower mosaic virus, CaMV or tobacco mosaic virus, TMV) or a bacterial expression vector (eg Ti plasmid or pBR322 plasmid) Plant cell lines, animal cell lines (e.g., Sambrook; supra Ausubel; Van Heeke, G. and SM Schuster (1989) J. Biol. Chem. 264: 5503-5509; Engelhard, EK et al. (1994) Proc. Natl. Acad. Sci. USA 91: 3224-3227; Sandig, V. et al. (1996) Hum. Gene Ther. 7: 1937-1945; Takamatsu, N. (1987) EMBO J. 6: 307-311; `` Maglow Hill Manabu technology Yearbook "(The McGraw Hill Yearbook of Science and Technology(1992) McGraw Hill, New York NY, 191-196; Logan, J. and T. Shenk (1984) Proc. Natl. Acad. Sci. USA 81: 3655-3659; and Harrington, JJ et al. (1997) Nat. Genet. 15: 345-355). Expression vectors derived from retroviruses, adenoviruses, herpesviruses or vaccinia viruses, or expression vectors derived from various bacterial plasmids can be used to deliver polynucleotides to target organs, tissues or cell populations (eg Di Nicola , M. et al. (1998) Cancer Gen. Ther. 5 (6): 350-356; Yu, M. et al. (1993) Proc. Natl. Acad. Sci. USA 90 (13): 6340-6344; Buller, RM (1985) Nature 317 (6040): 813-815; McGregor, DP et al. (1994) Mol.Immunol. 31 (3): 219-226; and Verma, IM and N. Somia (1997) Nature 389: 239- 242). The present invention is not limited by the host cell used.
[0168]
In bacterial systems, a number of cloning and expression vectors may be selected depending upon the use intended for polynucleotides encoding GCREC. For example, a multifunctional E. coli vector such as PBLUESCRIPT (Stratagene, La Jolla CA) or PSPORT1 plasmid (Invitrogen) can be used for routine cloning, subcloning and propagation of a polynucleotide encoding GCREC. Ligation of a polynucleotide encoding GCREC to the multicloning site of the vector disrupts the lacZ gene, allowing a colorimetric screening method for the identification of transformed bacteria containing recombinant molecules. In addition, these vectors may be useful for in vitro transcription in cloned sequences, dideoxy sequencing, single-stranded rescue with helper phage, generation of nested deletions (eg, Van Heeke, G. and SM). Schuster (1989) J. Biol. Chem. 264: 5503-5509). For example, when a large amount of GCREC is required for the production of antibodies, vectors that direct high-level expression of GCREC can be used. For example, vectors with a strong inducible SP6 bacteriophage promoter or an inducible T7 bacteriophage promoter can be used.
[0169]
A yeast expression system can also be used to produce GCREC. A large number of vectors with constitutive or inducible promoters such as alpha factor, alcohol oxidase, PGH promoter, etc. can be used in Saccharomyces cerevisiae or Pichia pastoris. In addition, such vectors direct either the secreted or intracellular retention of the expressed protein and incorporate foreign polynucleotide sequences into the host genome for stable growth. (See, eg, Ausubel, 1995; Bitter, GA et al. (1987) Methods Enzymol. 153: 516-544; and Scorer, CA et al. (1994) Bio / Technology 12: 181-184, supra).
[0170]
Plant systems can also be used for the expression of GCREC. Transcription of the polynucleotide encoding GCREC can be facilitated by viral promoters, eg, 35S and 19S promoters from CaMV, such as those used alone or in combination with omega leader sequences from TMV (Takamatsu, N. (1987) EMBO J 6: 307-311). Alternatively, plant promoters such as the small subunit of RuBisCO, or heat shock promoters can be used (eg Coruzzi, G. et al. (1984) EMBO J. 3: 1671-1680; Broglie, R. et al. (1984) Science 224: 838 -843; and Winter, J. et al. (1991) Results Probl. Cell Differ. 17: 85-105). These constructs can be introduced into plant cells by direct DNA transformation or by pathogen-mediated transfection (eg, “Mugglow Hill Science and Technology Yearbook” (The McGraw Hill Yearbook of Science and Technology) (1992) McGraw Hill New York NY, see pages 191-196).
[0171]
In mammalian cells, a number of virus-based expression systems can be utilized. When adenovirus is used as an expression vector, a group of polynucleotides encoding GCREC can be ligated to an adenovirus transcription / translation complex consisting of a late promoter and a triple leader sequence. By inserting into the nonessential E1 or E3 region of the adenovirus genome, infectious viruses that express GCREC in host cells can be obtained (see, eg, Logan, J. and T. Shenk (1984) Proc. Natl. Acad. Sci. USA 81: 3655-3659). In addition, transcription enhancers such as the Rous sarcoma virus (RSV) enhancer can be used to increase expression in mammalian host cells. Proteins can also be expressed at high levels using vectors based on SV40 or EBV.
[0172]
In addition, human artificial chromosomes (HACs) can be used to deliver fragments of DNA that are larger than fragments that can be contained in a plasmid or that can be expressed from a plasmid. Approximately 6 kb to 10 Mb HACs have been made for therapy and delivered by conventional delivery methods (liposomes, polycation amino polymers, or vesicles) (eg, Harrington, JJ et al. (1997) Nat. Genet. 15: 345). -355).
[0173]
In order to produce recombinant proteins in mammalian systems over a long period of time, stable expression of GCREC in cell lines is desirable. For example, expression vectors and selectable marker genes on the same vector or on different vectors can be used to transform a polynucleotide encoding GCREC into a cell line. The expression vector used can have a replication element of viral origin and / or an endogenous expression element. After the introduction of the vector, the cells can be grown in enhanced medium for about 1-2 days before being transferred to the selective medium. The purpose of the selectable marker is to confer resistance to the selective agent, and the presence of the selectable marker allows growth and recovery of cells that successfully express the introduced sequence. Resistant clones of stably transformed cells can be propagated using tissue culture techniques appropriate to the cell type.
[0174]
Any number of selection systems can be used to recover transformed cell lines. Such a selection system is not limited to tkHerpes simplex virus thymidine kinase gene used for cells and aprThere are herpes simplex virus adenine phosphoribosyltransferase genes used for cells (see eg Wigler, M. et al. (1977) Cell 11: 223-232; Lowy, I. et al. (1980) Cell 22: 817-823 ). Moreover, tolerance to antimetabolites, antibiotics or herbicides can be used as a basis for selection. For example, dhfr provides resistance to methotrexate, neo provides resistance to the aminoglycosides neomycin and G-418, als provides resistance to chlorsulfuron, and pat provides resistance to phosphinothricin acetyltransferase (eg, Wigler, M.). Et al. (1980) Proc. Natl. Acad. Sci. USA 77: 3567-3570; Colbere-Garapin, F. et al. (1981) J. Mol. Biol. 150: 1-14). Other selectable genes (eg, trpB and hisD, which modify cellular requirements for metabolites) are also described in the literature (eg Hartman, SC and RC Mulligan (1988) Proc. Natl. Acad. Sci. USA 85: 8047-8051). Visible markers such as anthocyanins, green fluorescent protein (GFP; Clontech), β-glucuronidase and its substrate β-glucuronide, or luciferase and its substrate luciferin can be used. These markers can be used not only to identify transformants, but also to quantify transient or stable protein expression due to a particular vector system (eg Rhodes, CA (1995) Methods Mol. Biol. 55: 121-131).
[0175]
Even if the presence or absence of marker gene expression suggests the presence of the target gene, the presence and expression of the gene may need to be confirmed. For example, when a sequence encoding GCREC is inserted into a marker gene sequence, a transformed cell group having a polynucleotide group encoding GCREC can be identified by the lack of marker gene function. Alternatively, a marker gene can be placed in tandem with one sequence encoding GCREC under the control of a single promoter. Expression of a marker gene in response to induction or selection usually also indicates tandem gene expression.
[0176]
In general, host cells having a polynucleotide encoding GCREC and expressing GCREC can be identified using various methods well known to those skilled in the art. These methods include protein-biological including DNA-DNA or DNA-RNA hybridization, PCR methods, membrane systems for detection and / or quantification of nucleic acids or proteins, solution-based, or chip-based techniques. This includes but is not limited to test methods or immunological assays.
[0177]
Immunological methods for detecting and measuring GCREC expression using specific polyclonal antibodies or specific monoclonal antibodies are known in the art. Examples of such techniques include enzyme-linked immunosorbent assay (ELISA), radioimmunoassay (RIA), fluorescence activated cell sorting (FACS), and the like. A two-site monoclonal-based immunoassay using a group of monoclonal antibodies that react with two non-interfering epitopes on GCREC is preferred, but a competitive binding test can also be used. These and other assays are well known in the art (eg, Hampton, R. et al. (1990)Serological Methods, a Laboratory Manual, APS Press, St. Paul MN, Sect. IV; Coligan, J.E. et al. (1997)Current Protocols in Immunology, Greene Pub.Associates and Wiley-Interscience, New York NY; and Pound, J.D. (1998)Immunochemical Protocols, Humana Press, Totowa NJ).
[0178]
A wide variety of labeling and conjugation methods are known to those skilled in the art and can be used in various nucleic acid and amino acid assays. Means for generating labeled hybridization probes or PCR probes for detecting sequences related to polynucleotides encoding GCREC include oligo-labeling, nick translation, end-labeling, or labeling. PCR amplification using the synthesized nucleotides is included. Alternatively, a polynucleotide encoding GCREC, or any fragment thereof, can be cloned into a vector for generating mRNA probes. Such vectors are known in the art and are commercially available and should be used for the synthesis of RNA probes in vitro with the addition of a suitable RNA polymerase such as T7, T3 or SP6 and labeled nucleotides. Can do. These methods can be performed using various commercial kits such as Amersham Biosciences, Promega (Madison WI), U.S. Biochemical. Suitable reporter molecules or labels that can be used to facilitate detection include substrates, cofactors, inhibitors, magnetic particles, as well as radionuclides, enzymes, fluorescent agents, chemiluminescent agents, color formers, and the like.
[0179]
Host cells transformed with a polynucleotide encoding GCREC can be cultured under conditions suitable for expression and recovery of the protein in cell culture media. Whether a protein produced from a transformed cell is secreted or remains intracellular depends on the sequence used, the vector, or both. Those skilled in the art will appreciate that expression vectors having a polynucleotide group encoding GCREC can be designed to have a signal sequence group that directs secretion of GCREC across a prokaryotic or eukaryotic cell membrane.
[0180]
In addition, selection of a host cell line may be made by its ability to modulate the expression of the inserted polynucleotide or to process the expressed protein in the desired form. Such polypeptide modifications include, but are not limited to, acetylation, carboxylation, glycosylation, phosphorylation, lipidation and acylation. Post-translational processing that cleaves the “prepro” or “pro” form of the protein can be used to identify induction, folding, and / or activity of the protein to the target. Various host cells (eg CHO, HeLa, MDCK, HEK293, WI38, etc.) with specific cellular equipment and characteristic mechanisms for post-translational activity are available from the American Type Culture Collection (ATCC, Manassas, VA). And can be selected to ensure correct modification and processing of the foreign protein.
[0181]
In another embodiment of the invention, a natural polynucleotide, modified polynucleotide, or recombinant polynucleotide encoding GCREC is linked to a heterologous sequence and the translation of a fusion protein in any of the host systems described above. Can result. For example, a chimeric GCREC protein containing a heterologous moiety that can be recognized by a commercially available antibody can facilitate the screening of peptide libraries for inhibitors of GCREC activity. Also, heterologous protein portions and heterologous peptide portions can facilitate the purification of the fusion protein using a commercially available affinity matrix. Such moieties include, but are not limited to, glutathione S transferase (GST), maltose binding protein (MBP), thioredoxin (Trx), calmodulin binding peptide (CBP), 6-His, FLAG, c-myc, There is hemagglutinin (HA). GST on immobilized glutathione, MBP on maltose, Trx on phenylarsine oxide, CBP on calmodulin, and 6-His on metal chelate resins allow for purification of cognate fusion proteins. FLAG, c-myc and hemagglutinin (HA) allow immunoaffinity purification of fusion proteins using commercially available monoclonal and polyclonal antibodies that specifically recognize these epitope tags. In addition, when the fusion protein is genetically engineered to have a proteolytic cleavage site between the sequence encoding GCREC and the heterologous protein sequence, GCREC can be cleaved from the heterologous portion after purification. Methods for expression and purification of the fusion protein are described in Ausubel (1995) chapter 10 above. Various commercially available kits can also be used to facilitate the expression and purification of the fusion protein.
[0182]
In another embodiment, using TNT rabbit reticulocyte lysate or wheat germ extraction system (Promega)in vitroThe radiolabeled GCREC can then be synthesized. These systems couple transcription and translation of protein coding sequences operably linked to a T7, T3 or SP6 promoter. Translation is for example35Occurs in the presence of a radiolabeled amino acid precursor such as S-methionine.
[0183]
GCREC or a fragment or variant thereof can be used to screen for compounds that specifically bind to GCREC. One or more test compounds can be used to screen for specific binding to GCREC. In various embodiments, 1, 2, 3, 4, 5, 10, 20, 50, 100, or 200 test compounds can be screened for specific binding to GCREC. Examples of test compounds include antibodies, anticalin, oligonucleotides, proteins (eg, ligands and receptors), or small molecules.
[0184]
In a related embodiment, the GCREC variant can be used to screen the binding of a test compound, eg, an antibody, to GCREC, to GCREC variant, or to GCREC and / or one or more GCREC variants in combination. In some embodiments, a GCREC variant can be used to screen for compounds that bind to the GCREC variant but do not bind to GCREC with the exact sequence of SEQ ID NO: 1-26. GCREC variants used to perform such screening may have a range of sequence identity to about 50% to about 99% GCREC, with various embodiments having 60%, 70%, 75%, 80%, It can have 85%, 90% and 95% sequence identity.
[0185]
In some embodiments, the compound identified by the specific binding screen to GCREC may be closely related to the natural ligand of GCREC, such as a ligand or a fragment thereof, or a natural substrate, structural or functional Mimetic or natural binding partner (eg Coligan, JE et al. (1991)Current Protocols in Immunology 1 (2): see chapter 5). In another embodiment, the compound thus identified can be the natural ligand of the receptor GCREC (e.g. Howard, AD et al. (2001) Trends Pharmacol. Sci. 22: 132-140; Wise, A. et al. (2002) Drug See Discovery Today 7: 235-246).
[0186]
In another embodiment, the compound identified by the screening for specific binding to GCREC is a natural receptor to which GCREC binds, or at least to a fragment of the receptor, or for example all or part of a ligand binding site or binding pocket. May be closely related to certain fragments of the receptor. For example, the compound may be a GCREC receptor capable of transmitting a signal or a GCREC decoy receptor capable of not transmitting a signal (Ashkenazi, A. and VM Divit (1999) Curr. Opin. Cell Biol. 11: 255). -260; Mantovani, A. et al. (2001) Trends Immunol. 22: 328-336). The compound can be rationally designed using known techniques. Examples of such techniques include those used to make the compound etanercept (ENBREL; Immunex Corp., Seattle WA). Etanercept is effective in treating human rheumatoid arthritis. Etanercept is a genetically engineered p75 tumor necrosis factor (TNF) receptor dimer, human IgG1 (Taylor, P.C. et al. (2001) Curr. Opin. Immunol. 13: 611-616).
[0187]
In one embodiment, two or more antibodies with similar or different specificities can be screened for specific binding to GCREC or a fragment or variant thereof. The binding specificity of the antibodies screened in this way can be selected to identify specific fragments or variants of GCREC. In one embodiment, antibodies with binding specificities that can preferentially identify specific fragments or variants of GCREC can be selected. In another embodiment, antibodies with binding specificities that can preferentially diagnose specific diseases or conditions with increased, decreased or abnormal GCREC production can be selected.
[0188]
In one embodiment, anticalin can be screened for specific binding to GCREC or a fragment or variant thereof. Anticalin is a ligand-binding protein and is constructed based on a lipocalin scaffold (Weiss, GA and HB Lowman (2000) Chem. Biol. 7: R177-R184; Skerra, A. (2001) J. Biotechnol. 74 : 257-275). The protein structure of lipocalins may include a β-barrel with an eight-stranded antiparallel β-strand that supports four loops at its open end. These loops form the natural ligand binding site of lipocalin. This site can be re-engineered with in vitro amino acid substitutions to confer new binding specificity. Amino acid substitutions can be made using methods known in the art or described herein, including conservative substitutions (e.g., substitutions that do not change binding specificity) or substitutions that change binding specificity mildly, moderately, or greatly. May be included.
[0189]
In one embodiment, screening for compounds that specifically bind to, stimulate or inhibit GCREC includes the generation of suitable cells that express GCREC as either a secreted protein or a protein on the cell membrane. Suitable cells include cells from mammals, yeast, Drosophila, or E. coli. Cells expressing GCREC, or cell membrane fragments containing GCREC, are contacted with a test compound and analyzed for binding or inhibition of stimulation or activity of either GCREC or the compound.
[0190]
Some assays simply allow the test compound to be conjugated experimentally to the polypeptide and the binding detected with a fluorophore, radioisotope, enzyme conjugate or other detectable label. For example, the assay can include mixing at least one test compound with GCREC in solution or immobilized on a solid support, and detecting binding of GCREC to the compound. Alternatively, detection and measurement of test compound binding in the presence of labeled competitor can be performed. In addition, this assay can be performed using cell-free reconstituted specimens, chemical libraries or natural product mixtures, where the test compound is released in solution or immobilized on a solid support.
[0191]
The assay can be used to assess the ability of a compound to bind to its natural ligand and / or inhibit its binding to its natural receptor. Examples of such assays include radiolabel assays such as those described in US Pat. Nos. 5,914,236 and 6,372,724. In related embodiments, one or more amino acid substitutions can be introduced into a polypeptide compound (such as a receptor) to improve or modify its ability to bind to a natural ligand (e.g., Matthews, DJ and JA Wells. 1994) Chem. Biol. 1: 25-30). In another related embodiment, one or more amino acid substitutions can be introduced into a polypeptide compound (such as a ligand) to improve or modify its ability to bind to a natural receptor (e.g. Cunningham, BC and JA Wells (1991) Proc. Natl. Acad. Sci. USA 88: 3407-3411; Lowman, HB et al. (1991) J. Biol. Chem. 266: 10982-10988).
[0192]
GCREC or a fragment or variant thereof can be used to screen for compounds that modulate the activity of GCREC. Such compounds can include agonists, antagonists, partial agonists or inverse agonists and the like. In one example, the assay is performed under conditions where GCREC activity is permissible, wherein at least one test compound is mixed with GCREC and the activity of GCREC in the presence of the test compound is determined in the absence of the test compound. Compare with the activity of GCREC. A change in the activity of GCREC in the presence of the test compound suggests the presence of a compound that modulates the activity of GCREC. Alternatively, the assay is performed by mixing the test compound with an in vitro or cell-free system having GCREC under conditions suitable for the activity of GCREC. In any of these assays, the test compound that modulates the activity of GCREC may indirectly modulate, in which case no direct contact with the test compound is required. At least one or more test compounds can be screened.
[0193]
In another example, homologous recombination in embryonic stem cells (ES cells) is used to “knock out” a polynucleotide encoding GCREC or a mammalian homolog thereof in an animal model system. Such techniques are well known in the art and are useful for the production of human disease animal models (see, eg, US Pat. Nos. 5,175,383 and 5,767,337). For example, mouse ES cells such as the 129 / SvJ cell line are derived from early mouse embryos and can be grown in culture. The ES cells are transformed with a vector having the target gene disrupted with a marker gene such as the neomycin phosphotransferase gene (neo: Capecchi, M.R. (1989) Science 244: 1288-1292). This vector is integrated into the corresponding region of the host genome by homologous recombination. Alternatively, homologous recombination is performed using the Cre-loxP system, and the target gene is knocked out in a tissue-specific or developmental stage-specific manner (Marth, JD (1996) Clin. Invest. 97: 1999-2002; Wagner, KU et al. (1997) Nucleic Acids Res. 25: 4323-4330). Transformed ES cells are identified and microinjected into mouse cell blastocysts collected from, for example, the C57BL / 6 mouse strain. These blastocysts are surgically introduced into pseudopregnant females, the genetic traits of the resulting chimeric progeny are identified, and they are crossed to create heterozygous or homozygous systems. Genetically modified animals produced in this way can be tested with potential therapeutic and toxic drugs.
[0194]
A polynucleotide encoding GCREC can be engineered in vitro in human blastocyst-derived ES cells. Human ES cells have the potential to differentiate into at least eight separate cell lineages, including endoderm, mesoderm and ectoderm cell types. These cell lines differentiate, for example, into neural cells, hematopoietic lineages and cardiomyocytes (Thomson, J.A. et al. (1998) Science 282: 1145-1147).
[0195]
A polynucleotide encoding GCREC can be used to create “knock-in” humanized animals (pigs) or transgenic animals (mouse or rat) modeled on human disease. Using knock-in technology, a region of the polynucleotide encoding GCREC is injected into animal ES cells and the injected sequence is integrated into the animal cell genome. Transformed cells are injected into blastula and transplanted as described above. Test for genetically modified progeny or inbreds and treat with potential medicines to obtain information on the treatment of human disease. Mammalian inbred lines that overexpress GCREC, such as secreting GCREC into milk by alternative methods, can be a convenient source of this protein (Janne, J. et al. (1998) Biotechnol. Annu. Rev. 4: 55- 74).
[0196]
(Treatment)
Chemical and structural similarities, such as similarities in the context of sequences and motifs, exist between regions of GCREC and G protein coupled receptors. See Table 6 for examples of tissues that express GCREC. GCREC is also closely associated with frontal cortical tissue and diseased cartilage tissue. Thus, GCREC is thought to play a role in olfactory neuropathy, cell proliferation abnormalities, neurological diseases, cardiovascular disorders, gastrointestinal disorders, autoimmune / inflammatory diseases, metabolic disorders and viral infections. In the treatment of diseases associated with increased GCREC expression or activity, it is desirable to reduce GCREC expression or activity. Further, in the treatment of diseases associated with a decrease in the expression or activity of GCREC, it is desirable to increase the expression or activity of GCREC.
[0197]
Thus, in one embodiment, a patient may be administered GCREC or a fragment or derivative thereof for the treatment or prevention of a disease associated with decreased GCREC expression or activity. Without limitation, examples of such diseases include neuronal loss of olfaction, of which there are three types. The pathological conditions that cause transport loss include acute viral upper respiratory tract infections, bacterial rhinitis, allergic rhinitis, bacterial sinusitis, and various mucosal secretion abnormalities, which are associated with odorant access to the olfactory membrane. Hinder. The cause of sensory olfactory loss is disruption of the olfactory membrane, which occurs with viral infections, neoplasms, inhalation of toxic chemicals, drugs, and radiation therapy to the head. Neuronal olfactory loss occurs in head trauma, Parkinson's disease, Alzheimer's disease, Korsakov psychosis, vitamin B12 deficiency, neofrontal neoplasia, congenital disease, and drugs such as ethanol, amphetamine, topical cocaine, aminoglycoside, tetracycline and smoking As a result of neurotoxicity. Endocrine disorders such as Cushing's syndrome, hypothyroidism, and diabetes can affect odor perception. Inferior frontal meningiomas are the most frequent cause of olfactory loss, but olfactory sensations are also metastasized in pituitary adenomas, suprasellar meningiomas, and anterior Willis rings It also occurs as a result of an aneurysm. These tumors and hamartomas can trigger seizures with phantom olfactory. None of the psychophysical methods can distinguish between sensory and neurogenic olfactory loss, and no available treatment has demonstrated efficacy in sensory neuronal loss of olfaction. Further examples of diseases associated with decreased activity or expression of GCREC include cell proliferation abnormalities, neurological diseases, cardiovascular diseases, gastrointestinal diseases, autoimmune / inflammatory diseases, metabolic disorders and viral infections. Actinic keratosis, atherosclerosis, bursitis, cirrhosis, hepatitis, mixed connective tissue disease (MCTD), myelofibrosis, paroxysmal nocturnal hemoglobinuria, polycythemia vera, psoriasis, primary platelet blood And adenocarcinoma, leukemia, lymphoma, melanoma, myeloma, sarcoma, and teratocarcinoma, specifically adrenal gland, bladder, bone, bone marrow, brain, breast, neck, gallbladder, ganglion, gastrointestinal tract, There are cancers of the heart, kidney, liver, lung, muscle, ovary, pancreas, parathyroid gland, penis, prostate, salivary gland, skin, spleen, testis, thymus, thyroid, uterus. Neurological disorders include epilepsy, ischemic cerebrovascular disorder, stroke, cerebral neoplasm, Alzheimer's disease, Pick's disease, Huntington's disease, dementia, Parkinson's disease and other extrapyramidal disorders, amyotrophic lateral sclerosis and other movements Neuronal disorders, progressive neuromuscular atrophy, retinitis pigmentosa (retinitis pigmentosa), hereditary ataxia, multiple sclerosis and other demyelinating diseases, bacterial and viral meningitis, brain abscess, stiffness Prion including subdural abscess, epidural abscess, purulent intracranial thrombophlebitis, myelitis and radiculitis, viral central nervous system disease, Kuru and Creutzfeldt-Jakob disease, Gerstmann-Straussler-Scheinker syndrome Disease, fatal familial insomnia, neurotrophic and metabolic diseases, neurofibromatosis, tuberous sclerosis, cerebelloretinal hemangioblastomatosis, trigeminal vascular syndrome, mental retardation and others CNS developmental disorder, cerebral palsy, neuroskeletal disorder, autonomic nervous system disorder, cranial nerve disease, spinal cord disease, muscular dystrophy and other neuromuscular disorders, peripheral neuropathy, dermatomyositis and polymyositis, heritability, metabolism Sexual, endocrine, and addictive myopathy, myasthenia gravis, periodic limb paralysis, mood and anxiety disorders, mental disorders including schizophrenia (schizophrenia) disorders, and seasonal disorders (SAD) ), Restlessness, amnesia, tension disease, diabetic neuropathy, tardive dyskinesia, dystonia, paranoid psychosis, postherpetic neuralgia, and Tourette's disease, progressive supranuclear palsy, cortical basal ganglia, familial If you have frontotemporal dementia. Cardiovascular diseases include arteriovenous fistula, atherosclerosis, hypertension, vasculitis, Raynaud's disease, aneurysm, arterial dissection, varicose vein, thrombophlebitis and venous thrombus, vascular tumors, thrombolysis, balloon angioplasty, Complications of vascular replacement and coronary artery bypass grafting, congestive heart failure, ischemic heart disease, angina, myocardial infarction, hypertensive heart disease, degenerative valvular heart disease, calcified aortic stenosis, congenital bicuspid Aortic valve, mitral annulus calcification, mitral valve prolapse, rheumatic fever, rheumatic heart disease, infective endocarditis, nonbacterial thrombotic endocarditis, systemic lupus erythematosus endocarditis, There are carcinoid heart disease, cardiomyopathy, myocarditis, pericarditis, neoplastic heart disease, congenital heart disease, and heart transplant complications. Gastrointestinal disorders include dysphagia, peptic esophagitis, esophageal spasm, esophageal stenosis, esophageal cancer, dyspepsia, digestive disorders, gastritis, gastric cancer, anorexia, nausea, vomiting, gastric paralysis, sinus or pyloric edema, abdominal angina , Heartburn, gastroenteritis, ileus, intestinal infection, peptic ulcer, cholelithiasis, cholecystitis, cholestasis, pancreatitis, pancreatic cancer, biliary tract disease, hepatitis, hyperbilirubinemia, cirrhosis, passive congestion of the liver , Hepatome, infectious colitis, ulcerative colitis, ulcerative proctitis, Crohn's disease, Whipple's disease, Mallory-Weiss syndrome, colon cancer, colonic obstruction, irritable bowel syndrome, short bowel syndrome, diarrhea, constipation, gastrointestinal bleeding , And acquired immune deficiency syndrome (AIDS) enteropathy, jaundice, hepatic encephalopathy, hepatorenal syndrome, fatty liver, hemochromatosis, Wilson's disease, alpha-1-antitrypsin deficiency, Reye syndrome, primary sclerosing cholangitis, Liver infarction, portal vein circulation Obstruction and thrombus, central lobular necrosis, liver purpura, hepatic vein thrombus, hepatic vein occlusion, vein occlusion, preeclampsia, eclampsia, gestational acute fatty liver, intrahepatic cholestasis and nodular hyperplasia and There are liver cancer including adenoma and carcinoma. Acquired immune deficiency syndrome (AIDS), Addison's disease (chronic primary adrenal insufficiency), adult respiratory distress syndrome, allergy, ankylosing spondylitis, amyloidosis, anemia, asthma, atherosclerosis , Autoimmune hemolytic anemia, autoimmune thyroiditis, autoimmune multi-glandular endocrine candidiasis ectodermal dystrophy (APECED), bronchitis, cholecystitis, contact dermatitis, Crohn's disease, atopic dermatitis, skin Myositis, diabetes, pulmonary emphysema, lymphocytic factor-induced accidental lymphopenia, fetal erythroblastosis (neolytic hemolysis), erythema nodosum, atrophic gastritis, glomerulonephritis, Goodpasture syndrome, gout, Graves' disease, Hashimoto thyroiditis, hypereosinophilia, irritable bowel syndrome, multiple sclerosis, myasthenia gravis, myocardial or pericarditis, osteoarthritis, osteoporosis, pancreatitis, polymyositis, psoriasis, lye -Syndrome, rheumatoid arthritis, scleroderma, Sjogren's syndrome, systemic anaphylaxis, systemic lupus erythematosus, systemic sclerosis, thrombocytopenic purpura, ulcerative colitis, uveitis, Werner syndrome, cancer, hemodialysis, There are complications of extracorporeal circulation, viral infections, bacterial infections, fungal infections, parasitic infections, protozoal infections, helminth infections, trauma. Metabolic disorders include diabetes, obesity and osteoporosis. Also includes viral pathogen infections, including adenovirus, arenavirus, bunyavirus, calicivirus, coronavirus, filovirus, hepadnavirus, herpesvirus, flavivirus, orthomyxovirus, parvovirus, papovavirus, paramyxovirus , Picornavirus, poxvirus, reovirus, retrovirus, rhabdovirus and togavirus.
[0198]
In another embodiment, a vector capable of expressing GCREC or a fragment or derivative thereof is administered to a patient to treat or prevent diseases associated with decreased expression or activity of GCREC, including but not limited to the diseases described above. It is also possible to do.
[0199]
In yet another embodiment, a substantially purified component comprising GCREC is administered to a patient with a suitable pharmaceutical carrier and associated with a decrease in the expression or activity of GCREC, including but not limited to the above-mentioned diseases. It is also possible to treat or prevent the disease.
[0200]
In yet another embodiment, an agonist that modulates the activity of GCREC may be administered to a patient to treat or prevent diseases associated with decreased expression or activity of GCREC, including but not limited to those described above. Is possible.
[0201]
In yet another example, an antagonist of GCREC can be administered to a patient to treat or prevent a disease associated with increased GCREC expression or activity. Examples of such diseases include, but are not limited to, olfactory neuropathy, cell proliferation abnormalities, neurological diseases, cardiovascular disorders, gastrointestinal disorders, autoimmune / inflammatory diseases, metabolic disorders, and viral infections as described above. Symptoms are included. In one aspect, an antibody that specifically binds to GCREC can be used directly as an antagonist or indirectly as a targeting or delivery mechanism that delivers the drug to cells or tissues that express GCREC.
[0202]
In another example, a vector expressing the complement of a polynucleotide encoding GCREC is administered to a patient to treat a disease associated with increased expression or activity of GCREC, including but not limited to the diseases described above. Or it can be prevented.
[0203]
In another embodiment, any protein, agonist, antagonist, complementary sequence, or vector embodiment can be administered in combination with another suitable therapeutic agent. Suitable therapeutic agents for use in combination therapy can be selected by one skilled in the art according to conventional pharmaceutical principles. When combined with a therapeutic agent, it can provide a synergistic effect in the treatment or prevention of the various diseases described above. This method makes it possible to increase the pharmaceutical effect with a small amount of each drug, thereby reducing the possibility of side effects.
[0204]
An antagonist of GCREC may be produced using methods generally known in the art. Specifically, antibodies can be made using purified GCREC, or a library of therapeutic agents can be screened to identify those that specifically bind to GCREC. GCREC antibodies can also be produced using methods generally known in the art. Such antibodies may include, but are not limited to, polyclonal antibodies, monoclonal antibodies, chimeric antibodies, single chain antibodies, Fab fragments and fragments produced by Fab expression libraries. Neutralizing antibodies (ie, antibodies that inhibit dimer formation) are usually suitable for therapy. Single chain antibodies (e.g. camels or llamas from origin) may be potent enzyme inhibitors, appear to have advantages in the design of peptidomimetics, and also in the development of immunosorbents and biosensors (Muyldermans, S. (2001) J. Biotechnol. 74: 277-302).
[0205]
For the production of antibodies, various hosts, including goats, rabbits, rats, mice, camels, dromedaries, llamas, humans and others, can use GCREC or any fragment, or oligos thereof with immunogenic properties. It can be immunized by injection of peptides. Depending on the host species, various adjuvants can be used to enhance the immune response. Such adjuvants include, but are not limited to, Freund's adjuvant, mineral gel adjuvants such as aluminum hydroxide, lysolecithin, pluronic polyol, polyanion, peptide, oil emulsion, mussel hemocyanin (KLH), dinitrophenol, etc. There is a surfactant. Among adjuvants used in humans, BCG (Bacille Calmette-Guerin) and Corynebacterium parvum (Corynebacterium parvum) Is particularly preferred.
[0206]
Oligopeptides, peptides or fragments used to induce antibodies against GCREC are preferably those having an amino acid sequence consisting of at least about 5 amino acids and generally at least about 10 amino acids. These oligopeptides, peptides or fragments are also preferably identical to part of the amino acid sequence of the natural protein. A short extension of the GCREC amino acid can be fused to the sequence of another protein, such as mussel hemocyanin, to produce an antibody against the chimeric molecule.
[0207]
Monoclonal antibodies against GCREC can be generated by continuous cell lines in the medium using any technique that produces antibody molecules. Such technologies include, but are not limited to, hybridoma technology, human B cell hybridoma technology, and EBV-hybridoma technology (eg, Kohler, G. et al. (1975) Nature 256: 495-497; Kozbor, D. (1985) J. Immunol. Methods 81: 31-42; Cote, RJ et al. (1983) Proc. Natl. Acad. Sci. USA 80: 2026-2030; and Cole, SP et al. (1984) Mol. Cell Biol. 62: 109-120).
[0208]
Furthermore, techniques developed for the production of “chimeric antibodies”, such as splicing mouse antibody genes into human antibody genes, can be used to obtain molecules with suitable antigen specificity and biological activity (eg Morrison, SL et al. (1984) Proc. Natl. Acad. Sci. USA 81: 6851-6855; Neuberger, MS et al. (1984) Nature 312: 604-608; and Takeda, S. et al. (1985) Nature 314: 452-454. reference). Alternatively, the described techniques for the production of single chain antibodies are applied to produce GCREC specific single chain antibodies using methods known in the art. Antibodies with related specificity but different idiotype composition can also be produced by chain shuffling from random combinations of immunoglobulin libraries (eg Burton DR (1991) Proc. Natl. Acad. Sci. USA). 88: 10134-10137).
[0209]
Antibody production in lymphocyte populationsin vivoIt can also be done by induction of production or by screening libraries or panels of immunoglobulins or very specific binding reagents as disclosed in the literature (see eg Orlandi, R. et al. (1989) Proc. Natl. Acad. Sci. USA 86: 3833-3837; Winter, G. et al. (1991) Nature 349: 293-299).
[0210]
Antibody fragments with specific binding sites for GCREC can also be produced. For example, without limitation, such fragments include F (ab ′) produced by pepsin digestion of antibody molecules.2 Fragment and F (ab ')2 And Fab fragments made by reducing the disulfide bridges of the fragments. Alternatively, a Fab expression library can be generated to quickly and easily identify monoclonal Fab fragments with the desired specificity (see, eg, Huse, WD et al. (1989) Science 246: 1275-1281) .
[0211]
Screening with various immunoassays (immunoassays) can identify antibodies with the desired specificity. Numerous protocols for immunoradiometric assays or competitive binding assays using either polyclonal or monoclonal antibodies with established specificity are known in the art. Such immunoassays usually involve the measurement of complex formation between GCREC and its specific antibody. A two-site monoclonal-based immunoassay is generally used, using a group of monoclonal antibodies reactive against two non-interfering GCREC epitopes, but competitive binding studies are also available (Pound, supra).
[0212]
Various methods such as Scatchard analysis in conjunction with radioimmunoassay techniques can be used to assess the affinity of an antibody for GCREC. Affinity is expressed by the binding constant Ka. The definition of Ka is a value obtained by dividing the molar concentration of GCREC antibody complex under equilibrium state by the molar concentration of free antibody and free antigen. Polyclonal antibodies have heterogeneous affinities for various GCREC epitopes, and Ka as determined for a given polyclonal antibody formulation represents the average affinity or binding activity of the GCREC antibody group. Monoclonal antibodies are monospecific for certain GCREC epitopes, and the Ka determined for certain formulations of monoclonal antibodies represents a true measure of affinity. Ka value is 109-1012L / mol high affinity antibody formulations are preferably used in immunoassays where the GCREC-antibody complex must withstand harsh manipulations. Ka value is 106-107A liter / mol low affinity antibody formulation is preferably used for immunopurification and similar processes where GCREC needs to eventually dissociate (preferably in an activated state) from the antibody (Catty, D. et al. (1988)Antibodies, Volume I: A Practical Approach, IRL Press, Washington, DC; Liddell, J. E. and Cryer, A. (1991)A Practical Guide to Monoclonal Antibodies, John Wiley & Sons, New York NY).
[0213]
The antibody titer and binding activity of the polyclonal antibody formulation can be further evaluated to determine the quality and suitability of such formulation for certain applications used later. For example, polyclonal antibody preparations containing at least 1-2 mg / ml of specific antibodies, preferably 5-10 mg / ml of specific antibodies are generally used in processes where GCREC-antibody complexes must be precipitated. Antibody specificity, antibody titer, binding activity, and guidelines for antibody quality and use in various applications are generally available (see, eg, Catty, Coligan et al., Supra).
[0214]
In another embodiment of the invention, a polynucleotide encoding GCREC, or any fragment or complementary sequence thereof, can be used for therapeutic purposes. In some embodiments, gene expression can be modified by designing sequences complementary to the coding and regulatory regions of the gene encoding GCREC and antisense molecules (DNA, RNA, PNA, or modified oligonucleotides). . Such techniques are well known in the art, and antisense oligonucleotides or larger fragments can be designed from various positions along the control region of the sequence encoding GCREC, or along the coding region (eg, Agrawal, S., Editing (1996)Antisense Therapeutics, Humana Press Inc., Totawa NJ).
[0215]
For use in therapy, any gene delivery system suitable for introducing an antisense sequence into a suitable target cell can be used. Antisense sequences can be delivered into cells in the form of expression plasmids that produce sequences complementary to at least a portion of the cell sequence encoding the target protein during transcription (eg, Slater, JE et al. (1998) J. Allergy). Clin. Immunol. 102 (3): 469-475; and Scanlon, KJ et al. (1995) 9 (13): 1288-1296). Antisense sequences can also be introduced into cells using viral vectors such as retroviruses and adeno-associated virus vectors (eg, Miller, AD (1990) Blood 76: 271, supra, Ausubel, Uckert, W And W. Walther (1994) Pharmacol. Ther. 63 (3): 323-347). Other gene delivery mechanisms include liposome systems, artificial viral envelopes and other systems known in the art (eg, Rossi, JJ (1995) Br. Med. Bull. 51 (1): 217-225). Boado, RJ et al. (1998) J. Pharm. Sci. 87 (11): 1308-1315; Morris, MC et al. (1997) Nucleic Acids Res. 25 (14): 2730-2736).
[0216]
In another embodiment of the invention, a polynucleotide encoding GCREC may be used for somatic or germ cell gene therapy. Gene therapy treats (i) gene deficiency (eg, severe combined immunodeficiency (SCID) − characterized by X chromosome linkage inheritance (Cavazzana-Calvo, M. et al. (2000) Science 288: 669-672) X1 disease), severe combined immunodeficiency syndrome associated with congenital adenosine deaminase (ADA) deficiency (Blaese, RM et al. (1995) Science 270: 475-480; Bordignon, C. et al. (1995) Science 270: 470-475), cystic fibrosis (Zabner, J. et al. (1993) Cell 75: 207-216; Crystal, RG et al. (1995) Hum. Gene Therapy 6: 643-666; Crystal, RG et al. (1995) Hum Gene Therapy 6: 667-703), thalassamia, familial hypercholesterolemia, and hemophilia caused by factor 8 or factor 9 deficiency (Crystal, RG (1995) Science 270: 404-410 , Verma, IM and N. Somia (1997) Nature 389: 239-242), (ii) expressing a conditional lethal gene product (eg, in the case of cancer resulting from uncontrolled cell growth), (iii) Intravesicular parasites such as human immunodeficiency virus (HIV) (Baltimore, D. (1988) Nature 335: 395-396, Poeschla, E. et al. (1996) Proc. Natl. Acad. Sci. USA. 93: 11395 -11399) and other proteins such as human retroviruses, hepatitis B or C virus (HBV, HCV), parasitic fungi such as Candida albicans and Paracoccidioides brasiliensis, and parasites such as P. falciparum and Trypanosoma cruzi It can be expressed. When a gene deficiency necessary for the expression or regulation of GCREC causes a disease, it is possible to express GCREC from a suitable population of introduced cells to alleviate the expression of symptoms caused by the gene deficiency.
[0217]
In a further embodiment of the invention, diseases and disorders due to GCREC deficiency are treated by creating mammalian expression vectors encoding GCREC and introducing these vectors into GCREC deficient cells by mechanical means. Mechanical introduction techniques for in vivo or ex vivo cells include (i) direct DNA microinjection into individual cells, (ii) gene guns, (iii) transfection via liposomes, ( iv) with receptor-mediated gene transfer, and (v) with the use of DNA transposons (Morgan, RA and WF Anderson (1993) Annu. Rev. Biochem. 62: 191-217, Ivics, Z. (1997) Cell 91: 501-510; Boulay, JL. And H. Recipon (1998) Curr. Opin. Biotechnol. 9: 445-450).
[0218]
Examples of expression vectors that may be effective for the expression of GCREC include, but are not limited to, pcDNA 3.1, EpiTag, pRcCMV2, pREP, pVAX, pCR2-TOPOTA vector (Invitrogen, Carlsbad CA), pCMV-Script, pCMV-Tag, PEGSH / PERV (Stratagene, La Jolla CA) and PTET-OFF, PTET-ON, PTRE2, PTRE2-LUC, PTK-HYG (Clontech, Palo Alto CA). To express GCREC, (i) a constitutively active promoter (eg, cytomegalovirus (CMV), rous sarcoma virus (RSV), SV40 virus, thymidine kinase (TK), or β-actin gene) (Ii) inducible promoters (eg tetracycline regulatable promoters (Gossen, M. and H. Bujard (1992) Proc. Natl. Acad. Sci, contained in the commercially available T-REX plasmid (Invitrogen)) USA 89: 5547-5551; Gossen, M. et al. (1995) Science 268: 1766-1769; Rossi, FMV and HM Blau (1998) Curr. Opin. Biotechnol. 9: 451-456), ecdysone-inducible promoter ( Included in the commercially available plasmids PVGRXR and PIND: Invitrogen), FK506 / rapamycin inducible promoter, or RU486 / mifepristone inducible promoter (Rossi, FMV and HM Blau, supra), or ( iii) It is possible to use a natural promoter or a tissue specific promoter of an endogenous gene encoding GCREC derived from a normal individual.
[0219]
By using a commercially available liposome transformation kit (for example, Invitrogen's PerFect Lipid Transfection Kit), those skilled in the art do not need much effort to optimize the parameters of the experiment, and the polynucleotide group can be used as the target cell group in culture. Can be delivered. Alternatively, the calcium phosphate method (Graham. F.L. and A.J. Eb (1973) Virology 52: 456-467) or electroporation (Neumann, E. et al. (1982) EMBO J. 1: 841-845). In order to introduce DNA into primary culture cells, modifications to standardized mammalian transfection protocols are required.
[0220]
In another embodiment of the invention, a disease or disorder caused by a gene defect associated with the expression of GCREC is treated with (i) a polyvirus encoding GCREC under the control of a retroviral terminal repeat (LTR) promoter or some independent promoter. Rev responsive element (RRE) with nucleotides, (ii) suitable RNA packaging signals, (iii) additional retroviral cis-acting RNA sequences and coding sequences necessary for efficient vector propagation A retroviral vector consisting of Retroviral vectors (eg PFB and PFBNEO) are commercially available from Stratagene and are based on published data (Riviere, I. et al. (1995) Proc. Natl. Acad. Sci. USA 92: 6733-6737). The above data is cited as a part of this specification. This vector is propagated in a suitable vector producing cell line (VPCL). VPCL expresses envelope genes with affinity for receptors on each target cell, or pan-affinity envelope proteins such as VSVg (Armentano, D. et al. (1987) J. Virol. 61: 1647-1650; Bender, MA et al. (1987) J. Virol. 61: 1639-1646; Adam, MA and AD Miller (1988) J. Virol. 62: 3802-3806; Dull, T. et al. (1998) J. Virol. 72: 8463-8471; Zufferey, R. et al. (1998) J. Virol. 72: 9873-9880). US Pat. No. 5,910,434 granted to Rigg (“Method for obtaining retrovirus packaging cell lines producing high transducing efficiency retroviral supernatant”) discloses a method for obtaining a retroviral packaging cell line, which is incorporated herein by reference. Part of the description. Breeding of retroviral vectors and cell populations (eg CD4+Transduction of the T cell group) and the return of the transduced cell group to the patient is a technique well known to those skilled in the art of gene therapy, and is described in many documents (Ranga, U. et al. (1997). J. Virol. 71: 7020-7029; Bauer, G. et al. (1997) Blood 89: 2259-2267; Bonyhadi, ML (1997) J. Virol. 71: 4707-4716; Ranga, U. et al. (1998) Proc Natl. Acad. Sci. USA 95: 1201-1206; Su, L. (1997) Blood 89: 2283-2290).
[0221]
In one embodiment, an adenoviral gene therapy delivery system is used to deliver a polynucleotide encoding GCREC to cells having one or more genetic abnormalities associated with the expression of GCREC. The production and packaging of adenoviral vectors is well known to those skilled in the art. Replication-deficient adenovirus vectors have been proved to be able to be used in a variety of ways to introduce genes encoding various immunoregulatory proteins into intact islets (Csete, ME et al. (1995) Transplantation 27: 263-268). Adenoviral vectors that may be used are described in US Pat. No. 5,707,618 (“Adenovirus vectors for gene therapy”) to Armentano, which is incorporated herein by reference. See also Antinozzi, P.A. et al. (1999) Annu. Rev. Nutr. 19: 511-544 and Verma, I.M. and N. Somia (1997) Nature 18: 389: 239-242 for adenoviral vectors. Both documents are hereby incorporated by reference.
[0222]
In another embodiment, a herpes-based gene therapy delivery system is used to deliver a polynucleotide encoding GCREC to target cells having one or more genetic abnormalities associated with the expression of GCREC. The use of herpes simplex virus (HSV) vectors can be particularly valuable when introducing GCREC into central neurons where HSV is tropic. The production and packaging of herpes vectors is known to those skilled in the art. A replication competent herpes simplex virus (HSV) type 1 vector has been used to deliver a reporter gene to the primate eye (Liu, X. et al. (1999) Exp. Eye Res. 169: 385-395). The production of HSV-1 viral vectors is also disclosed in US Pat. No. 5,804,413 (“Herpes simplex virus swains for gene transfer”) granted to DeLuca, which is incorporated herein by reference. . US Pat. No. 5,804,413 describes a recombinant HSV d92 comprising a genome with at least one exogenous gene introduced into a cell under the control of a promoter suitable for purposes including human gene therapy. . The patent also discloses the generation and use of recombinant HSV lines lacking ICP4, ICP27, and ICP22. For HSV vectors, see also Goins, W.F. et al. (1999) J. Virol. 73: 519-532 and Xu, H. et al. (1994) Dev. Biol. 163: 152-161. Both documents are hereby incorporated by reference. Manipulation of cloned herpesvirus sequences, production of recombinant virus after transfection with multiple plasmids with various segments of large herpesvirus genomes, herpesvirus growth and proliferation, and cell populations Infection with herpesviruses is a technique known to those skilled in the art.
[0223]
In another embodiment, an alphavirus (positive single stranded RNA virus) vector is used to deliver a polynucleotide encoding GCREC to target cells. Biological research on the prototype alphavirus Semliki Forest Virus (SFV) has been extensive and gene transfer vectors are based on the SFV genome (Garoff, H. and K.-J. Li (1998) Cun. Opin. Biotech. 9: 464-469). During the replication of alpha viral RNA, subgenomic RNA is produced that normally encodes the viral capsid proteins. Since this subgenomic RNA replicates to a higher level than the full-length genomic RNA, the capsid proteins are overproduced compared to viral proteins with enzymatic activity (eg, proteases and polymerases). Similarly, by introducing the GCREC coding sequence into the region encoding the capsid of the α virus genome, a large number of GCREC-encoding RNAs are produced in the vector-introduced cells, and GCREC is synthesized at a high level. Usually, infection with alpha virus is accompanied by cell lysis within a few days. On the other hand, the ability of a group of normal hamster kidney cells (BHK-21) with a variant of Sindbis virus (SIN) to establish a persistent infection can apply lytic replication of α viruses to gene therapy (Dryga, SA et al. (1997) Virology 228: 74-83). Since the α virus has a wide host range, GCREC can be introduced into various types of cells. Specific transduction of a subset of cells in a population may require cell sorting prior to transduction. Methods for treating alphavirus infectious cDNA clones, alphavirus cDNA and RNA transfection methods, and alphavirus infection methods are known to those skilled in the art.
[0224]
It is also possible to inhibit gene expression using an oligonucleotide derived from a transcription initiation site. This position is, for example, between about −10 and about +10 counting from the start site. Similarly, inhibition can be achieved using triple helix base pairing methods. Triple helix base pairing is useful because it inhibits the ability of the double helix to open sufficiently for the binding of polymerases, transcription factors or regulatory molecules. Recent therapeutic advances using triple helix DNA are described in the literature (eg Gee, J.E. et al. (1994) in Huber, B.E. and B.I. Carr,Molecular and Immunologic ApproachesFutura Publishing, Mt. Kisco NY, pages 163-177). Complementary sequences or antisense molecules can also be designed to block translation of mRNA by preventing transcripts from binding to ribosomes.
[0225]
Ribozymes are enzymatic RNA molecules. Ribozymes can be used to catalyze the specific cleavage of RNA. The mechanism of ribozyme action involves sequence specific hybridization of the ribozyme molecule to complementary target RNA and subsequent internal nucleotide strand breaks. For example, artificially engineered hammerhead ribozyme molecules may specifically and effectively catalyze the cleavage of nucleotides of RNA molecules encoding GCREC.
[0226]
Specific ribozyme cleavage sites within any RNA target are first identified by scanning the target molecule for ribozyme cleavage sites including GUA, GUU, GUC sequences. Once identified, evaluate whether a short RNA sequence of 15-20 ribonucleotides corresponding to the region of the target gene with the cleavage site has secondary structural features that render the oligonucleotide dysfunctional. Is possible. Assessment of the suitability of candidate targets can also be performed by testing accessibility to hybridization with complementary oligonucleotide groups using a ribonuclease protection assay.
[0227]
Complementary ribonucleic acid molecules and ribozymes can be made using any method known in the art for nucleic acid molecule synthesis. As a production method, there is a method of chemically synthesizing oligonucleotides such as solid phase phosphoramidite chemical synthesis. Alternatively, the DNA molecule encoding GCRECin vitroandin vivoRNA molecules can be created by transcription. Such DNA sequences can be incorporated into a variety of vectors using a suitable RNA polymerase promoter such as T7 or SP6. Alternatively, these cDNA constructs that synthesize complementary RNA constitutively or inducibly can be introduced into cell lines, cells or tissues.
[0228]
RNA molecules can be modified to increase intracellular stability and half-life. Non-limiting possible modifications include the addition of flanking sequences at the 5 'end, 3' end, or both of the molecule, or phosphorothioate or 2 'O- rather than phosphodiesterase linkages in the main chain of the molecule. Use of methyl is included. This concept is originally in the production of PNA groups, but can be extended to all these molecules. For this purpose, acetyl-, methyl-, thio- and similar modifications of adenine, cytidine, guanine, thymine, and uridine that are not easily recognized by endogenous endonucleases, or unconventional bases such as inosine , Queosine, wybutosine.
[0229]
Further embodiments of the invention include methods of screening for compounds that are effective in altering the expression of a polynucleotide encoding GCREC. Compounds that may be effective in causing, but not limited to, expression modification of specific polynucleotides include oligonucleotides, antisense oligonucleotides, triple helix-forming oligonucleotides, polypeptide transcriptional regulators such as transcription factors, and There are non-polymeric chemical entities that can interact with specific polynucleotide sequences. Effective compounds can alter polynucleotide expression by acting as either inhibitors or enhancers of polynucleotide expression. Thus, in the treatment of diseases associated with increased GCREC expression or activity, compounds that specifically inhibit the expression of polynucleotides encoding GCREC are therapeutically useful and are associated with decreased GCREC expression or activity. In the treatment of disease, compounds that specifically promote the expression of a polynucleotide encoding GCREC may be therapeutically useful.
[0230]
At least one or more test compounds can be screened for effectiveness in altering the expression of a particular polynucleotide. Any method known in the art can be used to obtain the test compound. As an acquisition method, there is chemical modification of a known compound effective in the following cases. When modifying the expression of a polynucleotide, when selecting from a library of existing, commercial or private, natural or non-natural compounds, and compounds based on the chemical and / or structural properties of the target polynucleotide. There is a case of rational design and a case of selecting from a library of compounds generated in combination or at random. A sample with a polynucleotide encoding GCREC is exposed to at least one of the test compounds thus obtained. The sample can be, for example, an intact cell, a permeabilized cell, or an in vitro cell-free or reconstituted biochemical system. Alterations in the expression of a polynucleotide encoding GCREC are assayed by any method well known in the art. Usually, the expression of a specific nucleotide is detected by hybridization using a probe having a nucleotide sequence complementary to the sequence of a polynucleotide encoding GCREC. Quantifying the amount of hybridization can form the basis for comparison of expression of polynucleotides that are exposed to or not exposed to one or more test compounds. Detection of a change in the expression of the polynucleotide exposed to the test compound indicates that the test compound is effective in altering the expression of the polynucleotide. Screening for compounds effective for altered expression of certain polynucleotides can be performed, such as the Schizosaccharomyces pombe gene expression system (Atkins, D. et al. (1999) US Pat. No. 5,932,435, Arndt, GM et al. ( 2000) Nucleic Acids Res. 28: E15) or human cell lines such as HeLa cells (Clarke, ML et al. (2000) Biochem. Biophys. Res. Commun. 268: 8-13). Certain embodiments of the invention relate to the process of screening a combinatorial library of oligonucleotides (deoxyribonucleotides, ribonucleotides, peptide nucleic acids, modified oligonucleotides) for antisense activity against a particular polynucleotide sequence (Bruice TW et al. (1997) US Pat. No. 5,686,242; Bruice, TW et al. (2000) US Pat. No. 6,022,691).
[0231]
Numerous methods for introducing vectors into cells or tissues are available and are equally suitable for in vivo, in vitro and ex vivo use. For ex vivo treatment, the vector can be introduced into stem cells taken from the patient, cloned and expanded back to the patient by autologous transplantation. Delivery by transfection or by ribosome injection or polycation amino polymers can be performed using methods well known in the art (see, eg, Goldman, CK et al. (1997) Nat. Biotechnol. 15: 462-466). ).
[0232]
Any of the above treatment methods can be applied to all subjects in need of treatment including, for example, mammals such as humans, dogs, cats, cows, horses, rabbits, monkeys and the like.
[0233]
A further embodiment of the invention relates to the administration of certain compositions generally having certain active ingredients formulated with certain pharmaceutically acceptable excipients. Excipients include, for example, sugar, starch, cellulose, gum and protein. Various dosage forms are widely known.Remi ngton's Pharmaceutical Sciences(Maack Publishing, Easton PA). Such a composition may be composed of GCREC, an antibody to GCREC, a mimic of GCREC, an agonist, an antagonist, or an inhibitor.
[0234]
The compositions used in the present invention can be administered by any number of routes including, but not limited to, oral, intravenous, intramuscular, intraarterial, intramedullary, intrathecal. , Intraventricular, lung, transdermal, subcutaneous, intraperitoneal, intranasal, intestinal, topical, sublingual or rectal.
[0235]
Compositions administered from the lungs can be prepared in liquid or dry powder form. Such compositions are usually aerosolized just before the patient inhales. In the case of small molecules (eg traditional low molecular weight organic drugs), aerosol delivery of fast acting formulations is known in the art. In the case of macromolecules (eg, larger peptides and proteins), recent improvements in pulmonary delivery through the alveolar region of the lung in the art can substantially transport drugs such as insulin into the blood circulation (See Patton, JS et al., US Pat. No. 5,997,848, etc.). Pulmonary delivery is superior in administration without needle injection and eliminates the need for penetration enhancers that may be toxic.
[0236]
Compositions suitable for use in the present invention include compositions that contain as much active ingredient as necessary to achieve a given purpose. The determination of an effective dose is within the ability of those skilled in the art.
[0237]
In order to deliver macromolecules having GCREC, or fragments thereof, directly into the cells, special various shapes of compositions can be prepared. For example, a liposomal formulation comprising a cell-impermeable polymer can facilitate cell fusion and intracellular delivery of the polymer. Alternatively, GCREC or a fragment thereof can be attached to the short cation N-terminus obtained from HIV Tat-1 protein. The fusion proteins thus generated have been shown to transduce cell groups of all tissues, including the brain, of a mouse model system (Schwarze, SR et al. (1999) Science 285: 1569- 1572).
[0238]
For any compound, the therapeutically effective dose can be estimated initially either in cell culture assays, such as neoplastic cell culture assays, or in animal models such as mice, rabbits, dogs, or pigs. The animal model may also be used to determine the appropriate concentration range and route of administration. Such information can then be used to determine beneficial doses and routes for administration to humans.
[0239]
A therapeutically effective amount refers to the amount of an active ingredient that ameliorates symptoms or conditions, such as GCREC or a fragment thereof, an antibody of GCREC, an agonist or antagonist of GCREC, an inhibitor, and the like. Therapeutic efficacy and toxicity can be determined by standard pharmaceutical techniques in cell culture or animal experiments, for example ED.50(Therapeutically effective amount of 50% of the population) or LD50It can be determined, for example, by measuring (lethal dose of 50% of the population). The dose ratio of toxic to therapeutic effects is the therapeutic index, and LD50/ ED50It can be expressed as a ratio. Compositions that exhibit high therapeutic indices are desirable. Data obtained from cell culture assays and animal experiments is used to develop a range of dosage for human use. The dosage contained in such compositions has little or no toxicity, and ED50It is preferable to be in the range of the blood concentration that contains Depending on the mode of administration used, patient sensitivity and route of administration, the dosage will vary within this range.
[0240]
The exact dosage will be determined by the practitioner in light of factors related to the subject that requires treatment. Dosage forms and dosages are adjusted to provide sufficient levels of the active ingredient or to maintain the desired effect. Factors related to the subject include the severity of the disease, the patient's general health, the patient's age, weight and gender (gender), time and frequency of administration, drug formulation, reaction sensitivity and response to treatment. obtain. Long-acting compositions may be administered once every 3-4 days, once a week, or once every two weeks, depending on the half-life and clearance rate of the particular formulation.
[0241]
The usual dose depends on the route of administration, but is about 0.1-100,000 μg, up to about 1 g in total. Guidance on specific dosages and delivery methods is described in the literature and is usually available to practitioners. Those skilled in the art will utilize different formulations for nucleotides than for proteins or their inhibitors. Similarly, delivery of polynucleotides or polypeptides will be specific to particular cells, symptoms, sites, etc.
(Diagnosis)
In another embodiment, an antibody that specifically binds to GCREC is used to diagnose a disease characterized by the expression of GCREC, or to monitor a patient being treated with an agonist or antagonist or inhibitor of GCREC or GCREC May be used in assays. Antibodies useful for diagnostic purposes are made in the same manner as described above in the treatment section. GCREC diagnostic assays include methods for detecting GCREC in human body fluids or cell or tissue extracts using antibodies and labels. This antibody is used with or without modification. It can also be labeled covalently or non-covalently with a reporter molecule. A wide variety of reporter molecules are known in the art and can be used, some of which have been described above.
[0242]
Various protocols for measuring GCREC, such as ELISA, RIA, FACS, etc., are well known in the art and provide a basis for diagnosing altered or abnormal levels of expression of GCREC. Normal or standard GCREC expression values are determined by mixing body fluids or cell extracts from normal mammals, such as human subjects, with antibodies to GCREC under conditions suitable for complex formation. Establish by letting The amount of standard complex formation can be quantified by various methods such as photometry. The amount of GCREC expression in disease samples from subjects, controls, and biopsy tissues is compared to a standard value. The deviation between the standard value and the subject establishes the parameter for diagnosing the disease.
[0243]
In another embodiment of the invention, a polynucleotide encoding GCREC may be used for diagnostic purposes. Polynucleotides that can be used include oligonucleotides, complementary RNA and DNA molecules, and PNA. These polynucleotides can be used to detect and quantify gene expression in biopsy tissues where GCREC expression can correlate with disease. This diagnostic assay can be used to determine the presence of GCREC, as well as overexpression, and to monitor the regulation of GCREC levels during treatment.
[0244]
In one aspect, hybridization with PCR probes capable of detecting a polynucleotide, such as a genomic sequence, encoding GCREC or a closely related molecule may be used to identify a nucleic acid sequence encoding GCREC. Whether the probe is made from a highly specific region (eg, a 5 ′ regulatory region) or a slightly less specific region (eg, a conserved motif); The stringency of hybridization or amplification will determine whether the probe will identify only the native sequence encoding GCREC, or whether it will identify alleles or related sequences.
[0245]
Probes can also be used to detect related sequences. It may also have at least 50% sequence identity with any sequence encoding GCREC. The hybridization probes of the present invention may be DNA or RNA and may be derived from the sequence of SEQ ID NO: 27-52 or from a genomic sequence group, such as a promoter, enhancer, intron, etc. of the GCREC gene.
[0246]
As a means for preparing a hybridization probe group specific to a polynucleotide group encoding GCREC, a method of cloning a polynucleotide group encoding GCREC or a GCREC derivative group into vectors for preparing an mRNA probe group including. Vectors for making mRNA probes are known to those skilled in the art and are commercially available and used to synthesize RNA probes in vitro by adding a suitable RNA polymerase and a suitable labeled nucleotide. obtain. Hybridization probes can be labeled with various reporter populations. Examples of reporter groups include32P or35Examples thereof include a radionuclide such as S, or an enzyme label such as alkaline phosphatase bound to a probe via an avidin / biotin binding system.
[0247]
A polynucleotide encoding GCREC can be used to diagnose a disease associated with the expression of GCREC. Without limitation, examples of such diseases include neuronal loss of olfaction, of which there are three types. The pathological conditions that cause transport loss include acute viral upper respiratory tract infections, bacterial rhinitis, allergic rhinitis, bacterial sinusitis, and various mucosal secretion abnormalities, which are associated with odorant access to the olfactory membrane. Hinder. The cause of sensory olfactory loss is disruption of the olfactory membrane, which occurs with viral infections, neoplasms, inhalation of toxic chemicals, drugs, and radiation therapy to the head. Neuronal olfactory loss occurs in head trauma, Parkinson's disease, Alzheimer's disease, Korsakov psychosis, vitamin B12 deficiency, neofrontal neoplasia, congenital disease, and drugs such as ethanol, amphetamine, topical cocaine, aminoglycoside, tetracycline and smoking As a result of neurotoxicity. Endocrine disorders such as Cushing's syndrome, hypothyroidism, and diabetes can affect odor perception. Inferior frontal meningiomas are the most frequent oncogenic cause of olfactory loss, but olfactory sensations are also found in pituitary adenomas, suprasellar meningiomas and aneurysms of the anterior Willis ring It also occurs as a result of metastasis. These tumors and hamartomas can trigger seizures with phantom olfactory. None of the psychophysical methods can distinguish between sensory and neurogenic olfactory loss, and no available treatment has demonstrated efficacy in sensory neuronal loss of olfaction. Further examples of diseases associated with decreased activity or expression of GCREC include cell proliferation abnormalities, neurological diseases, cardiovascular diseases, gastrointestinal diseases, autoimmune / inflammatory diseases, metabolic disorders and viral infections. Actinic keratosis, atherosclerosis, bursitis, cirrhosis, hepatitis, mixed connective tissue disease (MCTD), myelofibrosis, paroxysmal nocturnal hemoglobinuria, polycythemia vera, psoriasis, primary platelet blood And adenocarcinoma, leukemia, lymphoma, melanoma, myeloma, sarcoma, and teratocarcinoma, specifically adrenal gland, bladder, bone, bone marrow, brain, breast, neck, gallbladder, ganglion, gastrointestinal tract, There are cancers of the heart, kidney, liver, lung, muscle, ovary, pancreas, parathyroid gland, penis, prostate, salivary gland, skin, spleen, testis, thymus, thyroid, uterus. Neurological disorders include epilepsy, ischemic cerebrovascular disorder, stroke, cerebral neoplasm, Alzheimer's disease, Pick's disease, Huntington's disease, dementia, Parkinson's disease and other extrapyramidal disorders, amyotrophic lateral sclerosis and other movements Neuronal disorders, progressive neuromuscular atrophy, retinitis pigmentosa (retinitis pigmentosa), hereditary ataxia, multiple sclerosis and other demyelinating diseases, bacterial and viral meningitis, brain abscess, stiffness Prion including subdural abscess, epidural abscess, purulent intracranial thrombophlebitis, myelitis and radiculitis, viral central nervous system disease, Kuru and Creutzfeldt-Jakob disease, Gerstmann-Straussler-Scheinker syndrome Disease, fatal familial insomnia, neurotrophic and metabolic diseases, neurofibromatosis, tuberous sclerosis, cerebelloretinal hemangioblastomatosis, trigeminal vascular syndrome, mental retardation and others CNS developmental disorder, cerebral palsy, neuroskeletal disorder, autonomic nervous system disorder, cranial nerve disease, spinal cord disease, muscular dystrophy and other neuromuscular disorders, peripheral neuropathy, dermatomyositis and polymyositis, heritability, metabolism Sexual, endocrine, and addictive myopathy, myasthenia gravis, periodic limb paralysis, mood and anxiety disorders, mental disorders including schizophrenia (schizophrenia) disorders, and seasonal disorders (SAD) ), Restlessness, amnesia, tension disease, diabetic neuropathy, tardive dyskinesia, dystonia, paranoid psychosis, postherpetic neuralgia, and Tourette's disease, progressive supranuclear palsy, cortical basal ganglia, familial If you have frontotemporal dementia. Cardiovascular diseases include arteriovenous fistula, atherosclerosis, hypertension, vasculitis, Raynaud's disease, aneurysm, arterial dissection, varicose vein, thrombophlebitis and venous thrombus, vascular tumors, thrombolysis, balloon angioplasty, Complications of vascular replacement and coronary artery bypass grafting, congestive heart failure, ischemic heart disease, angina, myocardial infarction, hypertensive heart disease, degenerative valvular heart disease, calcified aortic stenosis, congenital bicuspid Aortic valve, mitral annulus calcification, mitral valve prolapse, rheumatic fever, rheumatic heart disease, infective endocarditis, nonbacterial thrombotic endocarditis, systemic lupus erythematosus endocarditis, There are carcinoid heart disease, cardiomyopathy, myocarditis, pericarditis, neoplastic heart disease, congenital heart disease, and heart transplant complications. Gastrointestinal disorders include dysphagia, peptic esophagitis, esophageal spasm, esophageal stenosis, esophageal cancer, dyspepsia, digestive disorders, gastritis, gastric cancer, anorexia, nausea, vomiting, gastric paralysis, sinus or pyloric edema, abdominal angina , Heartburn, gastroenteritis, ileus, intestinal infection, peptic ulcer, cholelithiasis, cholecystitis, cholestasis, pancreatitis, pancreatic cancer, biliary tract disease, hepatitis, hyperbilirubinemia, cirrhosis, passive congestion of the liver , Hepatome, infectious colitis, ulcerative colitis, ulcerative proctitis, Crohn's disease, Whipple's disease, Mallory-Weiss syndrome, colon cancer, colonic obstruction, irritable bowel syndrome, short bowel syndrome, diarrhea, constipation, gastrointestinal bleeding , And acquired immune deficiency syndrome (AIDS) enteropathy, jaundice, hepatic encephalopathy, hepatorenal syndrome, fatty liver, hemochromatosis, Wilson's disease, alpha-1-antitrypsin deficiency, Reye syndrome, primary sclerosing cholangitis, Liver infarction, portal vein circulation Obstruction and thrombus, central lobular necrosis, liver purpura, hepatic vein thrombus, hepatic vein occlusion, vein occlusion, preeclampsia, eclampsia, gestational acute fatty liver, intrahepatic cholestasis and nodular hyperplasia and There are liver cancer including adenoma and carcinoma. Acquired immune deficiency syndrome (AIDS), Addison's disease (chronic primary adrenal insufficiency), adult respiratory distress syndrome, allergy, ankylosing spondylitis, amyloidosis, anemia, asthma, atherosclerosis , Autoimmune hemolytic anemia, autoimmune thyroiditis, autoimmune multi-glandular endocrine candidiasis ectodermal dystrophy (APECED), bronchitis, cholecystitis, contact dermatitis, Crohn's disease, atopic dermatitis, skin Myositis, diabetes, pulmonary emphysema, lymphocytic factor-induced accidental lymphopenia, fetal erythroblastosis (neolytic hemolysis), erythema nodosum, atrophic gastritis, glomerulonephritis, Goodpasture syndrome, gout, Graves' disease, Hashimoto thyroiditis, hypereosinophilia, irritable bowel syndrome, multiple sclerosis, myasthenia gravis, myocardial or pericarditis, osteoarthritis, osteoporosis, pancreatitis, polymyositis, psoriasis, lye -Syndrome, rheumatoid arthritis, scleroderma, Sjogren's syndrome, systemic anaphylaxis, systemic lupus erythematosus, systemic sclerosis, thrombocytopenic purpura, ulcerative colitis, uveitis, Werner syndrome, cancer, hemodialysis, There are complications of extracorporeal circulation, viral infections, bacterial infections, fungal infections, parasitic infections, protozoal infections, helminth infections, trauma. Metabolic disorders include diabetes, obesity and osteoporosis. Also includes viral pathogen infections, including adenovirus, arenavirus, bunyavirus, calicivirus, coronavirus, filovirus, hepadnavirus, herpesvirus, flavivirus, orthomyxovirus, parvovirus, papovavirus, paramyxovirus , Picornavirus, poxvirus, reovirus, retrovirus, rhabdovirus and togavirus. Polynucleotides encoding GCREC include Southern, Northern, dot blot, or other membrane-based techniques, PCR methods, dipsticks, pins, and multi-format ELISA assays, and It can be used in microarrays that utilize body fluids or tissues collected from patients to detect altered GCREC expression. Such qualitative or quantitative methods are known in the art.
[0248]
In certain embodiments, a group of nucleotides encoding GCREC may be used in assays that detect related disorders, particularly those mentioned above. A polynucleotide complementary to a sequence encoding GCREC can be labeled by standard methods and added to a body fluid or tissue sample taken from a patient under conditions suitable for the formation of a hybridization complex. After a suitable incubation period, the sample is washed and the signal is quantified and compared to a standard value. If the amount of signal in a patient sample is significantly changed compared to a control sample, the presence of a level change in the group of polynucleotides encoding GCREC in that sample reveals the presence of the associated disease. Such assays can also be used to evaluate specific therapeutic effects in animal experiments, clinical trials, or to monitor individual patient treatment.
[0249]
Establish a normal or standard profile for expression in order to provide diagnostic criteria for diseases associated with the expression of GCREC. This is accomplished by mixing body fluids or cells extracted from either normal animal or human subjects with sequences encoding GCREC or fragments thereof under conditions suitable for hybridization or amplification. obtain. Standard hybridization can be quantified by comparing values obtained from experiments conducted with known amounts of substantially purified polynucleotides to values obtained from normal subjects. The standard value thus obtained can be compared with the value obtained from a sample obtained from a patient showing signs of disease. Deviation from standard values is used to determine the presence of the disease.
[0250]
Once the presence of the disease is established and the treatment protocol is initiated, the hybridization assay can be repeated periodically to determine whether the patient's expression level has begun to approach that observed by normal subjects. The results obtained from continuous assays can be used to show the effect of treatment over a period of days to months.
[0251]
For cancer, the presence of an abnormal amount of transcripts (underexpressed or overexpressed) in living tissue from an individual indicates a predisposition to the disease or is a way to detect the disease before clinical symptoms appear. Can be provided. This type of clearer diagnosis allows medical professionals to take advantage of preventive or aggressive treatment early on, thereby preventing the development or further progression of cancer.
[0252]
Additional diagnostic utilization of oligonucleotides designed from sequences encoding GCREC can contribute to the use of PCR. These oligomers can be synthesized chemically, produced enzymatically, or produced in vitro. Oligomers preferably contain a fragment of a polynucleotide encoding GCREC, or a fragment of a polynucleotide complementary to a polynucleotide encoding GCREC to identify specific genes and conditions under optimized conditions Used for Oligomers can also be used for the detection, quantification, or both of closely related DNA or RNA sequences under moderately stringent conditions.
[0253]
In certain embodiments, single nucleotide polymorphisms (SNPs) can be detected using oligonucleotide primers derived from a group of polynucleotides encoding GCREC. SNPs are substitutions, insertions and deletions that often cause human congenital or acquired genetic diseases. Although not limited, SNP detection methods include single-stranded conformation polymorphism (SSCP) and fluorescent SSCP (fSSCP). In SSCP, DNA is amplified using oligonucleotide primers derived from a group of polynucleotides encoding GCREC and polymerase chain reaction (PCR). This DNA can be derived from, for example, diseased or normal tissue, biopsy samples, body fluids, and the like. SNPs in DNA make a difference in the secondary and tertiary structure of single-stranded PCR products. Differences can be detected using gel electrophoresis in non-denaturing gels. In fSSCP, oligonucleotide primers are fluorescently labeled. As a result, the amplimer can be detected by a high-throughput device such as a DNA sequencing machine. In addition, a sequence database analysis method called in silico SNP (in silico SNP, isSNP) identifies polymorphisms by comparing the sequences of individual overlapping DNA fragments that are assembled into a common consensus sequence. Can do. These computer-based methods filter out sequence variations that result from sequencing errors in the laboratory preparation of DNA or using statistical models and automated analysis of DNA sequence chromatograms. In another embodiment, SNPs are detected and characterized, for example, by mass spectrometry using a high throughput MASSARRAY system (Sequenom, Inc., San Diego CA).
[0254]
SNP can be used to study the genetic basis of human disease. For example, at least 16 common SNPs are associated with non-insulin dependent diabetes. SNPs are also useful for testing differences in disease outcomes in single gene diseases. Single gene diseases include cystic fibrosis, sickle cell anemia, or chronic granulomatosis. For example, a group of variants in MBL2, a mannose-binding lectin, has been shown to correlate with adverse lung outcome in cystic fibrosis. SNPs also have utility in pharmacogenomics. Pharmacogenomics identifies genetic variants that affect a patient's response to drugs (eg, life-threatening toxicity). For example, certain mutations in N-acetyltransferase are associated with a high incidence of peripheral neuropathy in response to isoniazid, an antituberculous drug. On the other hand, certain mutations in the core promoter of the ALOX5 gene result in a reduced clinical response to treatment with certain anti-asthma drugs that target the 5-lipoxygenase pathway. Analyzing the distribution of SNPs in different population groups is useful for investigating genetic drift, mutation, genetic recombination, gene selection, and tracking the origin of the population and its movement (Taylor, JG et al. (2001) Trends Mol. Med. 7: 507-512; Kwok, P.-Y. and Z. Gu (1999) Mol. Med. Today 5: 538-543; Nowotny, P. et al. (2001) Curr. Opin Neurobiol. 11: 637-641).
[0255]
Methods that can be used to quantify the expression of GCREC include radiolabeling or biotin labeling of nucleotides, coamplification of control nucleic acids, and interpolation of results obtained from standard curves (eg, Melby, PC et al. (1993) ) J. Immunol. Methods 159: 235-244; Duplaa, C. et al. (1993) Anal. Biochem. 212: 229-236). Accelerate the quantification rate of multiple samples by performing high-throughput assays where the oligomer of interest is present in various dilutions and the quantification is rapid by spectrophotometric or colorimetric reactions .
[0256]
In yet another example, oligonucleotides or longer fragments derived from any of the polynucleotides described herein can be used as elements in a microarray. Microarrays can be used in transcriptional imaging techniques that simultaneously monitor the relative expression levels of multiple genes. This is described below. Microarrays can also be used to identify genetic variants, mutations and polymorphisms. Use this information to determine gene function, understand the genetic basis of the disease, diagnose the disease, monitor disease progression / regression as a function of gene expression, and develop drug activity in disease treatment And can be monitored. In particular, this information can be used to develop a pharmacogenomic profile of the patient in order to select the most appropriate and effective treatment for the patient. For example, based on a patient's pharmacogenomic profile, a therapeutic agent that is highly effective against the patient and that exhibits few side effects can be selected.
[0257]
In another example, GCREC, GCREC fragments, and antibodies specific for GCREC can be used as elements on the microarray. The microarray can be used to monitor or measure protein-protein interactions, drug-target interactions and gene expression profiles as described above.
[0258]
Certain embodiments relate to the use of the polynucleotides of the present invention to produce a transcription image of a tissue or cell type. A transcript image represents a global pattern of gene expression by a particular tissue or cell type. Comprehensive gene expression patterns can be analyzed by quantifying the number and relative abundance of genes expressed at a given time under given conditions (Seilhamer et al. US Pat. No. 5,840,484 “Comparative Gene Transcript Analysis”). Which patent is hereby incorporated by reference). Thus, a transcript image can be generated by hybridizing a polynucleotide or a complement thereof of the invention to the entire tissue or cell type transcript or reverse transcript. In certain embodiments, hybridization is generated in a high throughput format such that the polynucleotides of the invention or their complements have a subset of multiple elements on a microarray. The resulting transcript image can provide a profile of gene activity.
[0259]
Transcript images can be generated using transcripts isolated from tissues, cell lines, biopsies or biological samples thereof. The transcript image thus reflects gene expression in vivo for tissue or biopsy samples and in vitro for cell lines.
[0260]
Transcript images that produce the expression profiles of polynucleotides of the invention can also be used in in vitro model systems and preclinical evaluation of drugs, or in connection with toxicity tests of industrial or natural environmental compounds. All compounds elicit a characteristic gene expression pattern that marks the mechanism of action and toxicity, often referred to as molecular fingerprints or toxicant signatures (Nuwaysir, EF et al. (1999) Mol. Carcinog 24: 153-159; Steiner, S. and NL Anderson (2000) Toxicol. Lett. 112-113: 467-471). If a test compound has the same signature as that of a compound with known toxicity, it may share toxic properties. A fingerprint or signature is most useful and accurate when it contains expression information from multiple genes and gene families. Ideally, measurement of expression across the genome provides the highest quality signature. Even if there are genes whose expression is not altered by any tested compound, those genes are important because their expression levels can be used to normalize the remaining expression data. The normalize procedure is useful for comparing expression data after treatment with various compounds. Assigning gene function to elements of a toxic signature helps to interpret the toxic mechanism, but knowledge of gene function is not required for statistical matching of signature groups that leads to prediction of toxicity (eg, 2000 2 See Press Release 00-02 issued by the National Institute of Environmental Health Sciences on May 29. http://www.niehs.nih.gov/oc/ available at news / toxchip.htm). Therefore, it is important and desirable to include all expressed gene sequences in toxicological screening using toxicity signatures.
[0261]
In some embodiments, the toxicity of a test compound can be assessed by treating a biological sample with nucleic acid with the test compound. Nucleic acid expressed in the treated biological sample can be hybridized with one or more probes specific for the polynucleotide of the invention, thereby quantifying the transcription level corresponding to the polynucleotide of the invention. The transcription level in the treated biological sample is compared to the level in the untreated biological sample. Differences in transcription levels between the two samples indicate the toxic response caused by the test compound in the treated sample.
[0262]
Another embodiment relates to analysis of a proteome of a tissue or cell type using the polypeptides disclosed in the present invention. The term proteome refers to the global pattern of protein expression in a particular tissue or cell type. Each protein component of the proteome can be individually subject to further analysis. Proteome expression patterns or profiles can be analyzed by quantifying the number and relative abundance of proteins expressed at a given time under given conditions. Thus, a proteomic profile of a cell can be generated by isolating and analyzing polypeptides of a particular tissue or cell type. In some embodiments, the separation is achieved by two-dimensional gel electrophoresis in which the protein is separated from the sample by one-dimensional isoelectric focusing and separated according to molecular weight by two-dimensional sodium dodecyl sulfate slab gel electrophoresis. (Steiner and Anderson, above). Proteins are visualized in the gel as dispersed, unique points by staining the gel with a substance such as Coomassie Blue, or silver stain or fluorescent stain. The optical density of each protein spot is usually proportional to the protein level in the sample. The optical density of equally located protein spots from different samples, eg, biological samples either treated or untreated with the test compound or therapeutic agent, are compared to identify changes in protein spot density associated with the treatment. Proteins within the spot are partially sequenced using standard methods using, for example, chemical or enzymatic cleavage followed by mass spectrometry. The identity of a protein within a spot can be determined by comparing its subsequence, preferably at least 5 consecutive amino acid residues, to the polypeptide sequence of interest. In some cases, additional sequence data is obtained for definitive protein identification.
[0263]
Proteomic profiles can also be generated by quantifying GCREC expression levels using antibodies specific for GCREC. In some embodiments, these antibodies are used as elements on a microarray, and protein expression levels are quantified by exposing the microarray to a sample and detecting the level of protein binding to each array element (Lueking, A. et al. (1999). Anal. Biochem. 270: 103-111; Mendoze, LG et al. (1999) Biotechniques 27: 778-788). Detection can be performed in various ways known in the art, for example, a thiol-reactive or amino-reactive fluorescent compound can be reacted with a protein in the sample to detect the amount of fluorescent binding in each array element.
[0264]
Toxicity signatures at the proteome level are also useful for toxicological screening and should be analyzed in parallel with the toxicity signature at the transcript level. For some proteins in some tissues, there is a poor correlation between transcript abundance and protein abundance (Anderson, NL and J. Seilhamer (1997) Electrophoresis 18: 533-537). Proteome toxicity signatures may be useful in the analysis of compounds that do not affect so much but alter the proteome profile. Furthermore, since analysis of transcripts in body fluids is difficult due to rapid degradation of mRNA, proteome profiling can be more reliable and informative in such cases.
[0265]
In another embodiment, the toxicity of a test compound is calculated by treating a biological sample containing the protein with the test compound. Proteins expressed in the treated biological sample are separated so that the amount of each protein can be quantified. The amount of each protein is compared to the amount of the corresponding protein in the untreated biological sample. The difference in the amount of protein in both samples is indicative of a toxic response to the test compound in the treated sample. Individual proteins are identified by sequencing the amino acid residues of the individual proteins and comparing these subsequences to the polypeptides of the invention.
[0266]
In another embodiment, the toxicity of a test compound is calculated by treating a biological sample containing the protein with the test compound. The protein obtained from the biological sample is incubated with an antibody specific for the polypeptide of the present invention. The amount of protein recognized by the antibody is quantified. The amount of protein in the treated biological sample is compared to the amount of protein in the untreated biological sample. The difference in the amount of protein in both samples is indicative of a toxic response to the test compound in the treated sample.
[0267]
Microarrays are prepared, used and analyzed by methods known in the art (eg, Brennan, TM et al. (1995) US Pat. No. 5,474,796, Schena, M. et al. (1996) Proc. Natl. Acad. Sci. USA 93: 10614-10619, Baldeschweiler et al. (1995) PCT Application No. WO95 / 251116, Shalon, D. et al. (1995) PCT Application No. WO95 / 35505, Heller, RA et al. (1997) Proc. Natl. Acad. Sci USA 94: 2150-2155, Heller, MJ et al. (1997) US Pat. No. 5,605,662). Various types of microarrays are well known,DNA Microarrays: A Practical Approach, M. Schena, edited (1999) by Oxford University Press, London.
[0268]
In another embodiment of the invention, the nucleic acid sequence encoding GCREC can also be used to create hybridization probes useful for mapping the native genomic sequence. Either a coding sequence or a non-coding sequence can be used, and in some cases a non-coding sequence is preferred over a coding sequence. For example, conservation of coding sequences within members of a multigene family can result in unwanted cross-hybridization during chromosomal mapping. Nucleic acid sequences can be specific chromosomes, specific regions of chromosomes or artificially formed chromosomes, eg, human artificial chromosomes (HAC), yeast artificial chromosomes (YAC), bacterial artificial chromosomes (BAC), bacterial P1 products, or single chromosome cDNA Mapped to library. (See, for example, Harrington, JJ et al. (1997) Nat. Genet. 15: 345-355; Price, CM (1993) Blood Rev. 7: 127-134; Trask, BJ (1991) Trends Genet. 7: 149-154). ). Once mapped, nucleic acid sequences can be used to develop genetic linkage maps that correlate inheritance of a disease state with, for example, inheritance of a specific chromosomal region or restriction fragment length polymorphism (RFLP) (eg, Lander , ES and D. Botstein (1986) Proc. Natl. Acad. Sci. USA 83: 7353-7357).
[0269]
Fluorescence in situ hybridization (FISH) can be correlated with other physical and genetic map data (see, eg, Heinz-Ulrich, et al. (1995) in Meyers, supra, pages 965-968). Examples of genetic map data can be found in various scientific journals or the Online Mendelian Inheritance in Man (OMIM) website. Because the correlation between the location of the gene encoding GCREC on a physical chromosomal map and a predisposition to a specific disease or a predisposition to a specific disease can help determine the region of DNA associated with this disease Can facilitate the work of positional cloning.
[0270]
Genetic maps can be expanded using physical mapping techniques such as linkage analysis with established chromosomal markers, and in situ hybridization of chromosomal specimens. By placing a gene on the chromosome of another mammal, such as a mouse, the associated markers can often be revealed even if the exact chromosomal locus is unknown. This information is valuable for researchers searching for disease genes using gene discovery techniques such as positional cloning. Once a gene (s) involved in a disease or syndrome is roughly positioned by genetic linkage to a specific genomic region, such as the 11q22-23 region of vasodilatory ataxia, it is mapped to that region Any sequence may represent a related or regulatory gene for further investigation (see, eg, Gatti, RA et al. (1988) Nature 336: 577-580). The nucleotide sequence of the present invention can also be used for detecting a difference in chromosomal location among the healthy person, the owner, and the affected person due to translocation, inversion, and the like.
[0271]
In another embodiment of the invention, GCREC, its catalytic fragment or immunogenic fragment or its oligopeptides may be used for screening a library of compounds in any of a variety of drug screening techniques. Fragments used for drug screening can be free in solution, fixed to a solid support, retained on the cell surface, or located intracellularly. The formation of a complex due to the binding of GCREC to the agent to be tested can be measured.
[0272]
Another drug screening method is used to screen compounds with suitable binding affinity for the protein of interest with high throughput (see, eg, Geysen, et al. (1984) PCT application WO 84/03564). . In this method, a large number of different small molecule test compounds are synthesized on a solid substrate. The test compound is washed after reacting with GCREC or a fragment thereof. The bound GCREC is then detected by methods well known in the art. Purified GCREC can also be coated directly onto plates used in the drug screening techniques described above. Alternatively, non-neutralizing antibodies can be used to capture the peptide and immobilize the peptide on a solid support.
[0273]
In another example, a competitive drug screening assay can be used in which neutralizing antibodies capable of specifically binding to GCREC compete with test compounds for binding to GCREC. In this method, antibodies can be used to detect the presence of any peptide that shares one or more antigenic determinants with GCREC.
[0274]
In another embodiment, the nucleotide sequence encoding GCREC is a molecular biology technique to be developed in the future, and features of the nucleotide sequence currently known (including but not limited to triplet genetic code, specific base pairs It can be used for new technologies that depend on (including interactions, etc.).
[0275]
Without further details, those skilled in the art will be able to make full use of the present invention with the above description. Accordingly, the examples described below are for illustrative purposes only and do not limit the invention in any way.
[0276]
All patent applications, patents, and publications disclosed above and below are disclosed in U.S. Patent Application No. 60 / 300,494 (translated by Morita, confirmed through Abigail). / 305,326, 60 / 308,165, 60 / 310,115, 60 / 311,413, and 60 / 314,679 are hereby incorporated by reference.
【Example】
[0277]
1 cDNA Library creation
The Incyte cDNA group is derived from the cDNA library group described in the LIFESEQ GOLD database (Incyte Genomics, Palo Alto CA). Some tissues were homogenized and dissolved in guanidinium isothiocyanate solution, and other tissues were homogenized and dissolved in phenol or a suitable mixture of denaturants. TRIZOL (Invitrogen), which is an example of a mixed solution, is a single-phase solution of phenol and guanidine isothiocyanate. The resulting lysate was layered on a cesium chloride cushion solution and centrifuged or extracted with chloroform. RNA was precipitated from the lysate using either isopropanol, sodium acetate and ethanol, or another conventional method.
[0278]
To increase RNA purity, RNA extraction and precipitation with phenol was repeated as many times as necessary. In some cases, RNA was treated with DNase. In most libraries, poly (A) + RNA was isolated using oligo d (T) -linked paramagnetic particles (Promega), OLIGOTEX latex particles (QIAGEN, Chatsworth CA) or OLIGOTEX mRNA purification kit (QIAGEN). Alternatively, RNA was isolated directly from tissue lysates using another RNA isolation kit, such as POLY (A) PURE mRNA purification kit (Ambion, Austin TX).
[0279]
In some cases, RNA was provided to Stratagene, which produced the corresponding set of cDNA libraries. Otherwise, cDNA was synthesized using the UNIZAP vector system (Stratagene) or SUPERSCRIPT plasmid system (Invitrogen) using the recommended or similar methods known in the art to create a cDNA library (Ausubel, supra). (See 1997, 5.1-6.6 units). Reverse transcription was initiated using oligo d (T) or random primers. A synthetic oligonucleotide adapter was ligated to double stranded cDNA and the cDNA was digested with a suitable restriction enzyme or group of enzymes. For most libraries, cDNA size selection (300-1000 bp) was performed using SEPHACRYL S1000, SEPHAROSE CL2B or SEPHAROSE CL4B column chromatography (Amersham Biosciences) or preparative agarose gel electrophoresis. The cDNA was ligated to suitable restriction enzyme sites on the polylinker of a suitable plasmid. Suitable plasmids include, for example, PBLUESCRIPT plasmid (Stratagene), PSPORT1 plasmid (Invitrogen) PCDNA2.1 plasmid (Invitrogen, Carlsbad CA), PBK-CMV plasmid (Stratagene), PCR2-TOPOTA plasmid (Invitrogen), PCMV-ICIS plasmid (Stratagene) ), PIGEN (Incyte Genomics, Palo Alto CA), pRARE (Incyte Genomics), or plNCY (Incyte Genomics), or derivatives thereof. The recombinant plasmid was transformed into qualified E. coli cells such as Stratagene XL1-Blue, XL1-BIueMRF or SOLR, or Invitrogen DH5α, DH10B or ElectroMAX DH10B.
[0280]
2 cDNA Clone isolation
Example 1The UNIZAP vector system (Stratagene) was used to recover the plasmid obtained as described above from the host cell.in vivoThis was done by excision or by cell lysis. Plasmid purification methods include Magic or WIZARD Minipreps DNA purification system (Promega), AGTC Miniprep purification kit (Edge Biosystems, Gaithersburg MD), QIAWELL QIAWELL 8 Plasmid, QIAWELL 8 Plus Plasmid and QIAWELL 8 Ultra Plasmid Purification System, REAL At least one of the Prep 96 plasmid purification kits was used. The plasmid was precipitated and then resuspended in 0.1 ml distilled water and stored at 4 ° C. either lyophilized or not lyophilized.
[0281]
Alternatively, plasmid DNA was amplified from host cell lysates using direct binding PCR in a high throughput format (Rao, V.B. (1994) Anal. Biochem. 216: 1-14). Host cell lysis and thermal cycling processes were performed in a single reaction mixture. Samples are processed and stored in 384-well plates, and the concentration of amplified plasmid DNA is determined fluorimetrically using PICOGREEN dye (Molecular Probes, Eugene OR) and FLUOROSKAN II fluorescence scanner (Labsystems Oy, Helsinki, Finland) Quantified.
[0282]
3 Sequencing and analysis
Example 2The Incyte cDNA recovered from the plasmid as described in 1 was sequenced as shown below. Sequencing of cDNA can be performed using standard methods or high-throughput equipment such as ABI CATALYST 800 thermal cycler (Applied Biosystems) or PTC-200 thermal cycler (MJ Research), HYDRA microdispenser (Robbins Scientific) or MICROLAB 2200 (Hamilton) liquid. Treated in conjunction with the transfer system. A cDNA sequencing reaction was prepared using a reagent provided by Amersham Biosciences, or a reagent of an ABI sequencing kit, for example, ABI PRISM BIGDYE Terminator cycle sequencing ready reaction kit (Applied Biosystems). For electrophoretic separation of cDNA sequencing reactions and detection of labeled polynucleotides, ABI PRISM 373 or 377 sequencing using MEGABACE 1000 DNA sequencing system (Amersham Biosciences) or standard ABI protocol and base calling software Systems (Applied Biosystems) or other sequence analysis systems known in the art were used. Reading frames within the cDNA sequences were identified using standard methods (reviewed in Ausubel, 1997, 7.7 units supra). Select several cDNA sequences,Example 8The sequence was extended with the technique disclosed in.
[0283]
Polynucleotide sequences derived from Incyte cDNA were validated by removing vector, linker and poly (A) sequences and masking ambiguous bases. At that time, an algorithm and a program based on BLAST, dynamic programming, and adjacent dinucleotide frequency analysis were used. Next, the following database group was queried for Incyte cDNA sequences or their translations. That is, selected public databases (e.g. GenBank primates, rodents, mammals, vertebrates, eukaryotes and BLOCKS, PRINTS, DOMO, PRODOM) and humans, rats, mice, nematodes (Caenorhabditis elegans), Budding yeast (Saccharomyces cerevisiae), Fission yeast (Schizosaccharomyces pombe)andCandida albicansPROTEOME databases with sequences from (Incyte Genomics, Palo Alto CA), and hidden Markov model (HMM) based protein family databases such as PFAM, INCY, and TIGRFAM (Haft, DH et al. (2001) Nucleic Acids 29: 41-43); and HMM-based protein domain databases such as SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95: 5857-5864; Letunic, I. et al. (2002) Nucleic Acids Res (30: 242-244) (HMM is a probabilistic approach to analyzing the consensus primary structure of gene families, such as Eddy, SR (1996) Cuff. Opin. Struct. Biol. 6: 361-365. See). Queries were made using programs based on BLAST, FASTA, BLIMPS, and HMMER. The Incyte cDNA sequence was assembled to yield the full length polynucleotide sequence. Alternatively, GenBank cDNA group, GenBank EST group, stitched sequence group, stretched sequence group, or Genscan predicted coding sequence group (Examples 4 and 5The Incyte cDNA assembly was extended to full length. Assembly was performed using a program based on Phred, Phrap and Consed, and a cDNA assembly was screened for open reading frames using a program based on GenMark, BLAST and FASTA. The full length polynucleotide sequence was translated and the corresponding full length polypeptide sequence was derived. Alternatively, the polypeptide can start at any methionine residue of the full-length translated polypeptide. Subsequent queries for analysis of full-length polypeptide sequences include databases such as GenBank protein databases (genpept), SwissProt, PROTEOME databases, BLOCKS, PRINTS, DOMO, PRODOM and Prosite, PFAM, INCY, and TIGRFAM Hidden Markov Model (HMM) based protein family database group, and HMM based protein domain database group such as SMART. Full-length polynucleotide sequences are also analyzed using MACDNASIS PRO software (Hitachi Software Engineering, South San Francisco CA) and LASERGENE software (DNASTAR). Sequence alignments between polynucleotides and polypeptides are generated using default parameters specified by the CLUSTAL algorithm incorporated into the MEGALIGN multi-sequence alignment program (DNASTAR). This also calculates the percent identity between aligned sequences.
[0284]
Table 7 gives an overview of the tools, programs and algorithms used for analysis and assembly of Incyte cDNA and full-length sequences, as well as applicable descriptions, references and threshold parameters. The tools, programs and algorithms used are shown in column 1 of Table 7 and a brief description thereof is shown in column 2. Column 3 is a preferred reference, all of which are incorporated herein by reference in their entirety. Where applicable, column 4 shows the parameters, such as score, probability value, etc., used to evaluate the strength with which the two sequences match (the higher the score or the lower the probability value, the 2 High identity between sequences).
[0285]
The above programs used for the assembly and analysis of full-length polynucleotide sequences and polypeptide sequences were also used to identify the polynucleotide sequence fragments of SEQ ID NO: 27-52. A group of fragments of about 20 to about 4000 nucleotides useful for hybridization and amplification techniques is shown in column 2 of Table 4.
[0286]
4 Genome DNA And editing of coding sequences from
To identify putative G protein-coupled receptors, first the Genscan gene identification program was run against a public genome sequence database (eg gbpri or gbhtg). Genscan is a universal gene identification program that analyzes genomic DNA sequences from various organisms (Burge, C. and S. Karlin (1997) J. Mol. Biol. 268: 78-94, Burge, C. and S Karlin (1998) Curr. Opin. Struct. Biol. 8: 346-354). This program links predicted exons together to form an assembled cDNA sequence that spans from methionine to a stop codon. The output of Genscan is a FASTA database of polynucleotide and polypeptide sequences. The maximum range of sequences that Genscan analyzes at one time was set to 30 kb. To determine which of these Genscan predicted cDNA sequences encode a G protein-coupled receptor, the encoded polypeptides were queried and analyzed for G protein-coupled receptors from the PFAM model group. Potential G protein coupled receptors were also identified. This was done by homology to Incyte cDNA sequences already annotated as G protein coupled receptors. These selected Genscan predicted sequences were then compared to the public databases genpept and gbpri by BLAST analysis. If necessary, Genscan predicted sequences were edited by comparison with the top BLAST hits from genpept to correct errors in the sequence predicted by Genscan, such as extra or omitted exons. BLAST analysis was also used to find any Incyte cDNA or public cDNA coverage of the Genscan predicted sequence, thus providing evidence of transcription. When Incyte cDNA coverage was available, this information was used to correct or confirm the Genscan predicted sequence. The full-length polynucleotide sequence isExample 3The Genscan predicted coding sequence was assembled with Incyte cDNA sequences and / or public cDNA sequences using the assembly process described in. Alternatively, the full-length polynucleotide sequence is completely derived from the edited or unedited Genscan predicted coding sequence.
[0287]
5 of genome sequence data cDNA Assembly with array data
Stitch arrangement ( Stitched Sequence )
In order to extend the partial cDNA sequence group,Example 4Exon groups predicted by the Genscan gene identification program described in 1) were used.Example 3The assembled partial cDNA groups as described in 1. were mapped to genomic DNA and decomposed into cluster groups with related cDNA groups and exons predicted from Genscan from one or more genomic sequences. To integrate the cDNA and genome information, each cluster was analyzed using a certain algorithm based on graph theory and dynamic programming to generate potential splice variants. The sequences were subsequently confirmed, edited or extended to create a full length sequence. A sequence segment group in which the total length of the segment is in two or more sequences was identified in the cluster, and the segment groups identified as such were considered to be equal due to transitivity. For example, if a section is in one cDNA and two genomic sequences, all three sections were considered equal. This process allows unrelated but contiguous genomic sequences to be cross-linked by joining them with cDNA sequences. The sections thus identified were “stitched” by the stitch algorithm in the order they appear along their parent sequences to generate the longest possible sequence and group of sequence variants. Linkage between sections (cDNA-cDNA or genomic sequence-genomic sequence) that continues along one type of parent sequence takes precedence over linkages that change the type of parent (cDNA-genomic sequence). The resulting stitch sequences were translated and compared with public databases genpept and gbpri by BLAST analysis. The incorrect exon group predicted by Genscan was corrected by comparison with the top BLAST hits from genpept. If necessary, the sequences were further extended using additional cDNA sequences or by examining genomic DNA.
[0288]
Stretch arrangement ( Stretched Sequence )
Partial DNA sequences were extended to full length with one algorithm based on BLAST analysis. First, using the BLAST program, against public databases such as GenBank primate, rodent, mammalian, vertebrate and eukaryotic databases,Example 3The assembled partial cDNA was queried as described in. The closest GenBank protein homologue is then analyzed by BLAST analysis using the Incyte cDNA sequence orExample 4Compared to any of the GenScan exon predicted sequences described in. The resulting high scoring segment pair (HSP) was used to produce a chimeric protein and the translated sequence was mapped onto the GenBank protein homologue. Insertions or deletions can occur in the chimeric protein relative to the original GenBank protein homologue. Homologous genomic sequences were retrieved from public human genome databases using GenBank protein homologues, chimeric proteins or both as probes. In this way, the partial DNA sequence was stretched or extended by the addition of homologous genomic sequences. The resulting stretch sequence was examined to determine whether it contained the complete gene.
[0289]
6 GCREC Chromosome Mapping of Polynucleotides that Code
The sequences used to assemble SEQ ID NO: 27-52 were compared to the sequences of the Incyte LIFESEQ database and public domain databases using the BLAST et al. Implementation of the Smith-Waterman algorithm. Sequences in these databases that matched SEQ ID NO: 27-52 were assembled into clusters of consecutive overlapping sequences using an assembly algorithm such as Phrap (Table 7). Using the radiation hybrid and genetic map data available from public sources such as the Stanford Human Genome Center (SHGC), Whitehead Genome Research Institute (WIGR), and Genethon, any clustered sequence has already been Judged whether it was mapped. If the mapped sequence was contained in a cluster, the entire sequence of that cluster was assigned to a map location along with the individual SEQ ID numbers.
[0290]
The location on the map is expressed as a range or section of the human chromosome. The position of a section on the map (centi-morgan units) is measured relative to the end of the chromosome's short arm (p-arm) (centi-morgan (cM) is a unit of measurement based on the frequency of recombination between chromosomal markers. On average, 1 cM is approximately equal to 1 megabase (Mb) of human DNA, although this value varies widely due to recombination hot and cold spots). The cM distance is based on a set of genetic markers mapped by Genethon that provide boundaries for radiation hybrid markers whose sequences are contained within each cluster. NCBI “GeneMap'99” (http://www.ncbi.nlm.nih.gov/genemap/) and other resources such as human genome maps that can be obtained by general individuals have already identified disease genes. It can be determined whether it is mapped in or near the section.
[0291]
7 Analysis of polynucleotide expression
Northern analysis is an experimental technique used to detect the presence of a transcript of a gene and involves the hybridization of labeled nucleotide sequences to a membrane to which RNA from a particular cell type or tissue is bound. (See, eg, Sambrook, Chapter 7; Ausubel (1995) chapters 4 and 16 above).
[0292]
Similar or related computer technology using BLAST was used to search for identical or related molecules in cDNA databases such as GenBank and LIFESEQ (Incyte Genomics). Northern analysis is much faster than some membrane-based hybridizations. In addition, the sensitivity of computer searches can be modified to determine whether any particular match is classified as strict or homologous. The search criterion is the product score, which is defined by the following formula.
[0293]
[Expression 1]
Figure 2005500037
[0294]
The product score takes into account both the similarity between two sequences and the length with which the sequences match. The product score is a normalized value from 0 to 100, and is obtained as follows. Multiply the BLAST score by the nucleotide sequence identity and divide the product by 5 times the shorter length of the two sequences. To calculate the BLAST score, a score of +5 is assigned to each matching base in a high scoring segment pair (HSP) and -4 is assigned to each mismatched base. Two sequences can share more than one HSP (separated by gaps). If there are two or more HSPs, the product score is calculated using the segment pair with the highest BLAST score. The product score represents the balance between the fractional overlap and the quality of the BLAST alignment. For example, a product score of 100 is obtained only if there is a 100% match over the shorter length of the two sequences compared. The product score 70 is obtained when either one end is 100% coincident and 70% overlap, or the other end is 88% coincident and 100% overlap. A product score of 50 is obtained if either end is 100% coincident and 50% overlap, or 79% coincidence and 100% overlap.
[0295]
Alternatively, the polynucleotide encoding GCREC is analyzed for the tissue source from which it was derived. For example, some full-length sequences are at least partially assembled using overlapping Incyte cDNA sequences (Example 3See). Each cDNA sequence is derived from a cDNA library made from human tissue. Each human tissue is classified into one of the following organ / tissue categories. Cardiovascular system, connective tissue, digestive system, embryonic structure, endocrine system, exocrine gland, female genital organ, male genital organ, germ cell, blood and immune system, liver, musculoskeletal system, nervous system, pancreas, respiratory system, Sensory organs, skin, stomatognathic system, non-classified / mixed or urinary tract. Count the number of libraries in each category and divide by the total number of libraries in all categories. Similarly, each human tissue is classified into one of the following disease / condition categories: cancer, cell lines, development, inflammation, neurological, trauma, cardiovascular, pool, etc. Count the number of libraries in each category and divide by the total number of libraries in all categories. The resulting percentage reflects tissue-specific and disease-specific expression of the cDNA encoding GCREC. cDNA sequences and cDNA library / tissue information can be obtained from the LIFESEQ GOLD database (Incyte Genomics, Palo Alto CA).
[0296]
8 GCREC Of a polynucleotide encoding
Full-length polynucleotides are produced by extending the fragments using oligonucleotide primers designed from appropriate fragments of the full-length molecule. One primer was synthesized to initiate a 5 ′ extension of a known fragment and another primer was synthesized to initiate a 3 ′ extension of a known fragment. The OLIGO 4.06 software (National Biosciences) or another appropriate program was used to design the starting primer group, with a length of about 22-30 nucleotides, a GC content of about 50% or more, and a temperature of about 68-72 ° C To anneal to the target sequence. All elongations of nucleotide groups that resulted in hairpin structures and primer-primer dimers were avoided.
[0297]
The sequence was extended using selected human cDNA libraries. Where more than one extension was necessary or desirable, additional primers or nested sets of primers were designed.
[0298]
High fidelity amplification was obtained by PCR using methods well known to those skilled in the art. PCR was performed in a 96-well plate using a PTC-200 thermal cycler (MJ Research, Inc.). The reaction mixture has template DNA and 200 nmol of each primer. Mg2 +And (NHFour)2SOFourAnd a reaction buffer containing 2-mercaptoethanol, Taq DNA polymerase (Amersham Biosciences), ELONGASE enzyme (Invitrogen), and Pfu DNA polymerase (Stratagene). For the primer pair PCI A and PCI B, amplification was performed with the following parameters. Step 1: 3 minutes at 94 ° C. Step 2: 15 seconds at 94 ° C. Step 3: 1 minute at 57 ° C. Step 4: 2 minutes at 68 ° C. Step 5: Repeat steps 2, 3 and 4 20 times. Step 6: 5 minutes at 68 ° C. Step 7: Store at 4 ° C.
[0299]
The DNA concentration in each well was determined by adding 100 μl PICOGREEN quantitative reagent (0.25% (v / v) PICOGREEN; Molecular Probes, Eugene OR) dissolved in 1 × TE and 0.5 μl undiluted PCR product to an opaque fluorometer The solution was distributed to each well of a plate (Corning Costar, Acton MA), and determination was made so that DNA could bind to the reagent. Plates were scanned with Fluoroskan II (Labsystems Oy, Helsinki, Finland) to measure sample fluorescence and quantify DNA concentration. An aliquot of 5-10 μl of the reaction mixture was analyzed by electrophoresis on a 1% agarose gel to determine which reaction was successful in extending the sequence.
[0300]
Elongated nucleotides are desalted and concentrated, transferred to a 384-well plate, digested with CviJI cholera virus endonuclease (Molecular Biology Research, Madison WI), sonicated or sheared into the pUC 18 vector (Amersham Biosciences) Was reconsolidated. For shotgun sequencing, digested nucleotides were separated on a low concentration (0.6-0.8%) agarose gel, fragments were excised, and agar was digested with Agar ACE (Promega). Elongated clones were religated to pUC 18 vector (Amersham Biosciences) using T4 ligase (New England Biolabs, Beverly MA), treated with Pfu DNA polymerase (Stratagene) to fill restriction site overhangs, and qualified E. coli cells were transfected. Transfected cell groups were selected in a medium containing antibiotics, and each colony was collected and cultured overnight at 37 ° C. in a 384 well plate group in LB / 2X carbenicillin culture solution.
[0301]
Cells were lysed and DNA was PCR amplified using Taq DNA polymerase (Amersham Biosciences) and Pfu DNA polymerase (Stratagene) with the following parameters. Step 1: 3 minutes at 94 ° C. Step 2: 15 seconds at 94 ° C. Step 3: 1 minute at 60 ° C. Step 4: 2 minutes at 72 ° C. Step 5: Repeat steps 2, 3 and 4 29 times. Step 6: 5 minutes at 72 ° C. Step 7: Store at 4 ° C. For quantification of DNA, PICOGREEN reagent (Molecular Probes) was used as described above. Samples with low DNA recovery were reamplified under the same conditions described above. Samples are diluted with 20% dimethyl sulfoxide (1: 2, v / v), DYENAMIC energy transfer sequencing primer, and DYENAMIC DIRECT kit (Amersham Biosciences) or ABI PRISM BIGDYE terminator cycle sequencing ready reaction kit (Terminator cycle sequencing ready reaction kit) (Applied Biosystems).
[0302]
Similarly, full-length polynucleotides were verified using the above procedure. Alternatively, 5 ′ regulatory sequences were obtained using full-length polynucleotides using the oligonucleotides designed for such extension and some appropriate genomic library in the above procedure.
[0303]
9 GCREC Of single-nucleotide polymorphisms in polynucleotides encoding
A common DNA sequence variant known as a single nucleotide polymorphism (SNP) was identified in SEQ ID NO: 27-52 using the LIFESEQ database (Incyte Genomics). Sequences from the same gene are clustered together,Example 3Assembled to allow the identification of all sequence variants in the gene. An algorithm with a set of filters was used to distinguish SNPs from other sequence variants. Preliminary filters eliminate the majority of basecall errors by requiring a minimum Phred quality score of 15 and also include sequence alignment errors and the absence of vector sequences, chimeras, and splice variants. We also eliminated errors that were the result of proper trimming. The original set of chromatogram files in the vicinity of the putative SNP was analyzed by an automated procedure for advanced chromosome analysis. The clone error filter group used a statistically generated algorithm to identify errors that occurred during the laboratory process. Errors include those caused by reverse transcriptase, polymerase, or autosomal mutations. Clustered error filters use statistically generated algorithms to identify errors resulting from clustering of closely related homologs or pseudogenes, or errors caused by non-human sequence contamination . The final set of filters removed duplicates and SNPs found in immunoglobulins or T cell receptors.
[0304]
Several SNPs were selected for further characterization. Selection was performed by mass spectrometry using a high-throughput MASSARRAY system (Sequenom, Inc.) and analyzed for allele frequencies at SNP sites in four different human populations. The white population consists of 92 individuals (46 boys, 46 girls), 83 from Utah, 4 from France, 3 from Venezuela, and 2 from Amish. The African population consists of 194 individuals (97 boys and 97 girls), all of whom are African American. The Hispanic group consists of 324 individuals (162 boys and 162 girls), all of whom are Mexican Hispanics. The Asian population consists of 126 individuals (64 boys, 62 girls). The reported parent breakdown is 43% Chinese, 31% Japanese, 13% Korean, 5% Vietnamese, 8 % Are other Asians. Allele frequency analysis was first made in the Caucasian population, and in some cases, SNPs that did not show allelic variation in this population were not tested in the other three populations.
[0305]
10 Labeling and use of individual hybridization probes
CDNA, mRNA, or genomic DNA is screened using a hybridization probe derived from SEQ ID NO: 27-52. Although specifically described for labeling oligonucleotides of about 20 base pairs, essentially the same procedure is used for larger nucleotide fragments. Oligonucleotides were designed using the latest software such as OLIGO 4.06 software (National Biosciences).32Label by combining P] adenosine triphosphate (Amersham Biosciences) 250 μCi with T4 polynucleotide kinase (DuPont NEN, Boston MA). The labeled oligonucleotide is substantially purified using a SEPHADEX G-25 ultrafine molecular size exclusion dextran bead column (Amersham Biosciences). In a typical membrane-based hybridization analysis of human genomic DNA digested with either one of Ase I, Bgl II, Eco RI, Pst I, Xba I or Pvu II (DuPont NEN)7An aliquot containing a count of labeled probes is used.
[0306]
DNA from each digest is fractionated on a 0.7% agarose gel and transferred to a nylon membrane (Nytran Plus, Schleicher & Schuell, Durham NH). Hybridization is performed at 40 ° C. for 16 hours. In order to remove non-specific signal groups, the blot groups are washed sequentially at room temperature, for example under conditions of 0.1 × sodium citrate saline and 0.5% sodium dodecyl sulfate. Visualize and compare hybridization patterns using autoradiography or alternative imaging means.
[0307]
11 Microarray
Linking or synthesizing array elements on a microarray can be accomplished using photolithography, piezo printing (see inkjet printing, Baldeschweiler, etc.), mechanical microspotting techniques, and techniques derived therefrom. obtain. In each of the above technologies, the substrate should be a solid with a uniform, non-porous surface (Schena (1999) supra). Recommended substrates include silicon, silica, glass slides, glass chips and silicon wafers. Alternatively, a procedure similar to dot blot or slot blot may be utilized to place and bind elements to the surface of the substrate using thermal, ultraviolet, chemical or mechanical bonding procedures. Conventional arrays can be made using available methods and machinery known to those skilled in the art and can have any suitable number of elements (eg, Schena, M. et al. (1995) Science 270: 467-470 Shalon, D. et al. (1996) Genome Res. 6: 639-645; see Marshall, A. and J. Hodgson (1998) Nat. Biotechnol. 16: 27-31).
[0308]
Full-length cDNAs, expressed sequence tags (ESTs), or fragments or oligomers thereof can be elements of the microarray. Fragments or oligomers suitable for hybridization can be selected using software known in the art such as LASERGENE software (DNASTAR). The array element group is hybridized with the polynucleotide group in the biological sample. The polynucleotide in the biological sample is conjugated to a molecular tag such as a fluorescent label to facilitate detection. After hybridization, unhybridized nucleotides from the biological sample are removed and hybridization at each array element is detected using a fluorescent scanner. Alternatively, hybridization can also be detected using laser desorption and mass spectrometry. The degree of complementarity and relative abundance of each polynucleotide that hybridizes to an element on the microarray can be calculated. The preparation and use of the microarray in one embodiment is detailed below.
[0309]
Tissue or cell sample preparation
The guanidinium thiocyanate method was used to isolate total RNA from tissue samples and poly (A)+The oligo (dT) cellulose method is used to purify RNA. Each poly (A)+MMLV reverse transcriptase was used to reverse transcribe RNA samples, and 0.05 pg / μl oligo (dT) primer (21mer), 1 × first strand buffer, 0.03 unit / μl RNase inhibitor, 500 μM Use dATP, 500 μM dGTP, 500 μM dTTP, 40 μM dCTP, 40 μM dCTP-Cy3 (BDS) or dCTP-Cy5 (Amersham Biosciences). For reverse transcription, use the GEMBRIGHT kit (Incyte) and 200 ng of poly (A)+Perform in a volume of 25 ml containing RNA. Specific control poly (A)+RNA groups are synthesized from non-coding yeast genomic DNA by in vitro transcription. After incubating at 37 ° C for 2 hours, each reaction sample (one Cy3, the other Cy5 labeled) was treated with 2.5 ml of 0.5M sodium hydroxide and incubated at 85 ° C for 20 minutes to stop the reaction To degrade RNA. Two consecutive CHROMA SPIN 30 gel filtration spin columns (CLONTECH Laboratories, Inc. (CLONTECH), Palo Alto CA) are used for sample group purification. After mixing, ethanol precipitation of the two reaction samples is performed with 1 ml glycogen (1 mg / ml), 60 ml sodium acetate, and 300 ml 100% ethanol. The sample is then completely dried using SpeedVAC (Savant Instruments Inc., Holbrook NY) and resuspended in 14 μl of 5 × SSC / 0.2% SDS.
[0310]
Microarray preparation
Array elements are made using the sequences of the present invention. Each array element is amplified from a group of bacterial cells containing a group of cloned cDNA inserts and a group of vectors. PCR amplification uses primers complementary to the vector sequences adjacent to the cDNA insert. Array elements are amplified by 30 cycles of PCR from an initial amount of 1-2 ng to a final amount in excess of 5 μg. Amplified array elements are purified using SEPHACRYL-400 (Amersham Biosciences).
[0311]
The purified array element is fixed on a polymer-coated slide glass. Microscope slides (Corning) are ultrasonically washed in 0.1% SDS and acetone and thoroughly washed with distilled water during and after treatment. The slides were etched in 4% hydrofluoric acid (VWR Scientific Products Corporation (VWR), West Chester PA), washed thoroughly in distilled water, and 0.05% aminopropylsilane (Sigma) in 95% ethanol. Use to coat. Coated slides are cured in an oven at 110 ° C.
[0312]
Array elements are added to the coated glass substrate using the procedure described in US Pat. No. 5,807,522. This patent is hereby incorporated by reference. 1 μl of array element DNA with an average concentration of 100 ng / μl is filled into an open capillary printing element by means of a robotic apparatus. The instrument now places approximately 5 nl of array element samples per slide.
[0313]
STRATALINKER UV crosslinker (Stratagene) is used to UV crosslink the microarray. The microarray is washed once with 0.2% SDS and three times with distilled water at room temperature. In order to block non-specific binding sites, microarray incubation was performed in 60% at 30 ° C. in 0.2% casein in phosphate buffered saline (PBS) (Tropix, Inc., Bedford MA) before Wash with 0.2% SDS and distilled water as done.
[0314]
Hybridization
The 9 μl sample mixture used for the hybridization reaction contains 0.2 μg of each of the cDNA synthesis products labeled with Cy3 or Cy5 in 5 × SSC, 0.2% SDS hybridization buffer. The sample mixture is heated to 65 ° C. for 5 minutes and aliquoted onto the microarray surface to 1.8 cm.2Cover with a cover glass. The array is transferred to a waterproof chamber with a cavity slightly larger than the microscope slide. To keep the chamber at 100% humidity, add 140 μl of 5 × SSC to one corner of the chamber. The chamber with the array is incubated at 60 ° C. for approximately 6.5 hours. The array is washed in the first wash buffer (1 × SSC, 0.1% SDS) for 10 minutes at 45 ° C., in the second wash buffer (0.1 × SSC) for 10 minutes at 45 ° C., dry.
[0315]
detection
To detect reporter-labeled hybridization complexes, an Innova 70 mixed gas 10 W laser (Coherent, Inc., Santa Clara CA) that can generate spectral lines at 488 nm for Cy3 excitation and 632 nm for Cy5 excitation. A microscope equipped with is used. A 20 × microscope objective (Nikon, Inc., Melville NY) is used to focus the excitation laser light on the array. The slide containing the array is placed on the microscope's computer-controlled XY stage and raster scanned through the objective lens. The 1.8 cm × 1.8 cm array used in this example scans with a resolution of 20 μm.
[0316]
In two different scans, the mixed gas multiline laser sequentially excites the two fluorophores. The emitted light is separated based on wavelength and sent to two photomultiplier detectors (PMT R1477, Hamamatsu Photonics Systems, Bridgewater NJ) corresponding to the two fluorophores. A suitable filter group is placed between the array and the photomultiplier tube to filter the signal. The maximum emission wavelength of the fluorophore used is 565 nm for Cy3 and 650 nm for Cy5. The instrument can record spectra from both fluorophores simultaneously, but with a suitable filter in the laser source, it scans once for each fluorophore and typically scans each array twice.
[0317]
Usually, to calibrate the sensitivity of each scan, a cDNA control species is added to the sample mixture at some known concentration and the signal intensity generated by the control species is used. A particular position on the array contains a complementary DNA sequence, and the intensity of the signal at that position is correlated at a hybridization species weight ratio of 1: 100,000. When two samples from different sources (such as representative test cells and control cells) are each labeled with a different fluorophore and hybridized to a single array to identify differently expressed genes. Performs calibration by labeling a sample of cDNA to be calibrated with two fluorophores and adding equal amounts of each to the hybridization mixture.
[0318]
A 12-bit RTI-835H analog-to-digital (A / D) conversion board (Analog Devices, Inc., Norwood MA) installed on an IBM-compatible PC computer is used to digitize the photomultiplier tube output. The digitized data is displayed as an image in which the signal intensity is mapped using a linear 20 color conversion from a blue (low signal) to red (high signal) pseudo color scale. Data is also analyzed quantitatively. When exciting and measuring two different fluorophores simultaneously, using the emission spectra of each fluorophore, the data is first corrected for optical crosstalk between the fluorophores (due to overlapping emission spectra).
[0319]
A grid is overlaid on the fluorescent signal image, whereby the signal from each spot is collected on each element of the grid. The fluorescence signals within each element are integrated to give a numerical value depending on the average intensity of the signal. The software used for signal analysis is the GEMTOOLS gene expression analysis program (Incyte). Array elements that showed an expression change of at least about 2-fold, an SB ratio of 2.5 or greater, and an element spot size of at least 40% were identified in the GEMTOOLS program (Incyte Genomics) as showing differential expression.
[0320]
12 Complementary polynucleotides
A sequence complementary to a sequence encoding GCREC, or any portion thereof, is used to detect, reduce or inhibit the expression of native GCREC. Although the use of oligonucleotides containing about 15-30 base pairs is described, essentially the same procedure is used for smaller or larger sequence fragments. Appropriate oligonucleotides are designed using Oligo 4.06 software (National Biosciences) and the GCREC coding sequence. To inhibit transcription, a complementary oligonucleotide is designed from the most unique 5 'sequence and used to prevent the promoter from binding to the coding sequence. To inhibit translation, a complementary oligonucleotide is designed to prevent ribosome binding to the transcript encoding GCREC.
[0321]
13 GCREC Expression
GCREC expression and purification is accomplished using bacterial or viral based expression systems. To express GCREC in bacteria, the cDNA is subcloned into a suitable vector having an antibiotic resistance gene and an inducible promoter that increases the transcription level of the cDNA. Such promoters include, but are not limited to, the T5 or T7 bacteriophage promoter used in conjunction with the lac operator regulatory element and the trp-lac (tac) hybrid promoter. The recombinant vector is transformed into a suitable bacterial host such as BL21 (DE3). Antibiotic-resistant bacteria express GCREC when induced with isopropyl β-D thiogalactopyranoside (IPTG). GCREC expression in eukaryotic cells is commonly known as baculovirus in insect cell lines or mammalian cell linesAutographica californicaInfected with a recombinant form of nuclear polyhedrosis virus (AcMNPV). The baculovirus nonessential polyhedrin gene is replaced with a cDNA encoding GCREC. The replacement is done by homologous recombination or by bacterial mediated gene transfer with transfer plasmid mediated. The infectivity of the virus is maintained and a high level of cDNA transcription is performed by a strong polyhedrin promoter. Recombinant baculoviruses are often a type of night owlSpodoptera frugiperda(Sf9) Used to infect insect cells, but sometimes used to infect human hepatocytes. In the case of the latter infection, further genetic modification to baculovirus is required (Engelhard, EK et al. (1994) Proc. Natl. Acad. Sci. USA 91: 3224-3227; Sandig, V. et al. (1996) ) See Hum. Gene Ther. 7: 1937-1945).
[0322]
In most expression systems, GCREC is synthesized with, for example, glutathione S transferase (GST) or a peptide epitope tag such as FLAG or 6-His to form a fusion protein, and recombinant fusion protein from unpurified cell lysate. Affinity-based purification of can be performed rapidly in one step. GST is a 26 kDa enzyme from Schistosoma japonicum that allows purification of the fusion protein on immobilized glutathione while maintaining protein activity and antigenicity (Amersham Biosciences). After purification, the GST moiety can be proteolytically cleaved from GCREC at various specifically engineered sites. FLAG is an 8-amino acid peptide that allows immunoaffinity purification using commercially available monoclonal and polyclonal anti-FLAG antibodies (Eastman Kodak). 6-His, in which 6 histidine residues are continuously extended, allows purification on metal chelate resins (QIAGEN). Methods for protein expression and purification are described in Ausubel (1995) chapters 10 and 16 above. GCREC is purified by these methods and used directly toExamples 17, 18 and 19Applicable assays can be performed.
[0323]
14 Functional assays
GCREC function is assessed by the expression of sequences encoding GCREC at physiologically elevated levels in mammalian cell culture systems. Subclone the cDNA into a mammalian expression vector containing a strong promoter that expresses cDNA at high levels. Vectors selected include the PCMV SPORT plasmid (Invitrogen, Carlsbad CA) and the PCR 3.1 plasmid (Invitrogen), both of which have a cytomegalovirus promoter. Using a liposomal formulation or electroporation, 5-10 μg of the recombinant vector is transiently transfected into a human cell line, eg, an endothelial or hematopoietic cell line. In addition, 1-2 μg of plasmid containing the sequence encoding the labeled protein is simultaneously transfected. The expression of the labeled protein provides a means to distinguish between transfected and non-transfected cells. Moreover, the expression of cDNA from the recombinant vector can be accurately predicted by the expression of the labeled protein. The labeled protein can be selected from, for example, green fluorescent protein (GFP; Clontech), CD64 or CD64-GFP fusion protein. Identify transfected cells expressing GFP or CD64-GFP using flow cytometry (FCM), an automated, laser-optical technology, and determine the apoptotic status and other cellular properties of those cells evaluate. FCM detects and measures the uptake of fluorescent molecules that diagnose phenomena that precede or occur simultaneously with cell death. These phenomena include changes in nuclear DNA content as measured by DNA staining with propidium iodide, changes in cell size and granularity as measured by forward and 90 ° side scatter, bromodeoxy Down-regulation of DNA synthesis measured by decreased uridine uptake, cell surface and altered protein expression measured by reactivity with specific antibodies, and cell surface of fluorescein-conjugated annexin V protein There is a change in the plasma membrane composition measured by binding to. For flow cytometry, see Ormerod, M.G. (1994).Flow Cytometry, There is a description in Oxford, New York NY.
[0324]
The effect of GCREC on gene expression can be calculated using a highly purified cell population transfected with either a sequence encoding GCREC and either CD64 or CD64-GFP. CD64 or CD64-GFP is expressed on the transfected cell surface and binds to a conserved region of human immunoglobulin G (IgG). Transfected and non-transfected cells can be efficiently separated using magnetic beads coated with either human IgG or antibodies to CD64 (DYNAL, Lake Success NY). mRNA can be purified from these cells by methods well known to those skilled in the art. The expression of mRNA encoding GCREC and other gene groups of interest can be analyzed by Northern analysis or microarray technology.
[0325]
15 GCREC Production of specific antibodies
Substantially purified GCREC is performed by polyacrylamide gel electrophoresis (PAGE; see, for example, Harrington, MG (1990) Methods Enzymol. 182: 488-495) or other purification techniques and used as a standard. Antibodies are generated by immunizing animals (eg, rabbits, mice, etc.) using standard protocols.
[0326]
Alternatively, GCREC amino acid sequences are analyzed using LASERGENE software (DNASTAR) to determine regions with high immunogenicity. Then, a corresponding oligopeptide is synthesized, and an antibody is generated using this oligopeptide by a method well known to those skilled in the art. There are many descriptions in the art regarding the selection of appropriate epitopes such as the vicinity of the C-terminal or a hydrophilic region (see Ausubel, 1995, Chapter 11 above).
[0327]
Typically, oligopeptides of about 15 residues in length are synthesized using an ABI 431A peptide synthesizer (Applied Biosystems) using FMOC chemistry and by reaction using N-maleimidobenzoyl-N-hydroxysuccinimide ester (MBS). Bind to KLH (Sigma-Aldrich, St. Louis MO) to increase immunogenicity (see, eg, Ausubel, 1995, supra). Rabbits are immunized with oligopeptide-KLH conjugate in complete Freund's adjuvant. In order to test the anti-peptide activity and anti-GCREC activity of the obtained antiserum, for example, the peptide or GCREC is bound to a certain substrate, blocked with 1% BSA, reacted with rabbit antiserum and washed. Further, it is reacted with radioactive iodine-labeled goat anti-rabbit IgG.
[0328]
16 Natural using specific antibodies GCREC Purification
Natural GCREC or recombinant GCREC is substantially purified by immunoaffinity chromatography using an antibody specific for GCREC. An immunoaffinity column is formed by covalently binding an activated chromatography resin such as CNBr-activated SEPHAROSE (Amersham Biosciences) and an anti-GCREC antibody. After binding, the resin is blocked and washed according to the manufacturer's instructions.
[0329]
The culture solution containing GCREC is passed through an immunoaffinity column, and the column is washed under conditions that allow preferential adsorption of GCREC (eg, with a high ionic strength buffer in the presence of a surfactant). The column is eluted under conditions that break the binding between the antibody and GCREC (eg, with some pH 2-3 buffer, or a high concentration of a chaotrope such as urea or thiocyanate ion) to recover the GCREC. .
[0330]
17 GCREC Of molecules that interact with
Molecules that interact with GCREC can include molecules involved in signal transduction, such as G proteins, and agonists and antagonists. GCREC or a fragment thereof125Label with I Bolton Hunter reagent (see, eg, Bolton A.E. and W.M. Hunter (1973) Biochem. J. 133: 529-539). Examples of the GCREC fragment include a fragment having one or more of three extracellular loops, an extracellular N-terminal region, or a third intracellular loop. Candidate molecules pre-sequenced in each well of the multi-well plate are incubated with labeled GCREC, washed and all wells with labeled GCREC complex are assayed. Data obtained by varying the GCREC concentration are used to calculate the number of GCRECs, affinity with candidate ligand molecules and association values.
[0331]
Alternatively, molecules that interact with GCREC may be selected from the yeast two-hybrid system described in Fields, S. and O. Song (1989, Nature 340: 245-246) or the MATCHMAKER system ( Analysis is performed using a commercially available kit based on a two-hybrid system such as Clontech).
[0332]
GCREC can also be used in the PATHCALLING process (CuraGen Corp., New Haven CT) using a high-throughput yeast two-hybrid system to determine all interactions between proteins encoded by two large libraries of genes. (Nandabalan, K. et al. (2000) US Pat. No. 6,057,101).
[0333]
Potential agonists or antagonists of GCREC for activation or inhibition of GCREC receptor actionExamples 18 and 19Can be tested using the assay described in. Candidate molecules can be selected from known GCREC agonists or antagonists, peptide libraries, or combinatorial chemical libraries.
[0334]
The method for detecting the interaction between GCREC and an intracellular signaling molecule such as G protein is based on a G protein-coupled membrane 7 having an internal segment or cytoplasmic domain obtained from an orphan G protein-coupled membrane seven-pass receptor. Based on the premise that it is exchanged for the similarity domain of the round-trip receptor and used to identify G proteins and downstream signaling pathways activated by the orphan receptor domain (Kobilka, BK et al. (1988) Science 240: 1310-1316). In one similar method, orphan receptor domains can be cloned as part of a fusion protein and used in binding assays to demonstrate interactions with specific G proteins. Studies have shown that the third intracellular loop of the G protein-coupled membrane seven-pass receptor is important for G protein interactions and signal transduction (Conklin, BR et al. (1993) Cell 73 : 631-641). For example, a DNA fragment corresponding to the third intracellular loop of GCREC can be amplified by polymerase chain reaction (PCR) and subcloned into a fusion vector such as pGEX (Pharmacia Biotech). The construct is transformed into an appropriate bacterial host, induced, and the fusion protein is purified from cell lysates by glutathione-Sepharose 4B (Pharmacia Biotech) affinity chromatography.
[0335]
in vitroFor binding assays, cell extracts with G protein are 50 mM Tris (pH 7.8), 1 mM EGTA, 5 mM MgCl.2Prepare by extraction with 20 mM CHAPS, 20% glycerol, 10 μg each of aprotinin and leupeptin and 20 μl of 50 mM phenylmethylsulfonyl fluoride. The lysate is incubated for 45 minutes on ice with constant agitation, and the supernatant is collected by centrifugation at 23,000 g for 15 minutes at 4 ° C. 750 μg of cell extract is incubated with glutathione S transferase (GST) fusion protein beads for 2 hours at 4 ° C. GST beads are washed 5 times with phosphate buffered saline. The bound G protein subunit was used with pertussis toxin or cholera toxin [32Detect by P] ADP ribosylation. SDS sample buffer (4.6% (w / v) SDS, 10% (v / v) β-mercaptoethanol, 20% (w / v) glycerol, 95.2 mM Tris-HCl (pH 6.8), 0.8. The reaction is terminated by adding 01% (w / v) bromophenol blue). [32P] ADP-labeled proteins are separated on a 10% SDS-PAGE gel and autoradiographed. Proteins separated in the gel are transferred to nitrocellulose paper and blotted (5% skim milk powder, 50 mM Tris-HCl (pH 8.0), 2 mM CaCl280 mM NaCl, 0.02% NaNThree And 0.2% Nonidet P-40) for 1 hour at room temperature,αIncubate with subtype selective antibody (1: 500; Calbiochem-Novabiochem) for 1.5 hours. After three washes, the blots are incubated with horseradish peroxidase (HRP) -conjugated goat anti-rabbit immunoglobulin (1: 2000, Cappel, Westchester PA) and visualized with a chemiluminescence-based ECL method (Amersham Corp.).
[0336]
18 GCREC Demonstration of activity
One assay for GCREC activity measures the expression of GCREC on the cell surface. A cDNA encoding GCREC is transfected into a suitable mammalian cell line. Cell surface proteins are labeled with biotin as described (de la Fuente, M. A. et al. (1997) Blood 90: 2398-2405). Immunoprecipitation is performed using GCREC-specific antibodies, and immunoprecipitated samples are analyzed using sodium dodecyl sulfate polyacrylamide gel electrophoresis (SDS-PAGE) and immunoblotting techniques. The ratio of labeled and unlabeled immunoprecipitate is proportional to the amount of GCREC expressed on the cell surface.
[0337]
Alternatively, one assay of GCREC activity is based on a prototype assay for modulation of cell proliferation mediated by ligand / receptor. This assay measures the rate of DNA synthesis in Swiss mouse 3T3 cells. A plasmid carrying a polynucleotide encoding GCREC is added to quiescent 3T3 cultured cells using transfection methods well known in the art. Transiently transfected cells are then [ThreeIncubate in the presence of H] thymidine (a radioactive DNA precursor molecule). A variable amount of GCREC ligand is then added to the cultured cells. [ThreeIncorporation of [H] thymidine into the acid-precipitable DNA is measured at appropriate time intervals using a radioisotope counter. The amount incorporated is directly proportional to the amount of newly synthesized DNA. A linear dose response curve for a GCREC ligand concentration range of at least 100 times suggests receptor activity. One unit of activity per milliliter is defined as the concentration of GCREC that yields a response level of 50%. Here, the response level of 100% means that the acid-precipitable DNA has [ThreeH] represents the maximum uptake of thymidine (McKay, I. and I. Leigh, edited (1993)Growth Factors: A Practical Approach, Oxford University Press, New York, NY, p. 73).
[0338]
Alternatively, GCREC activity assays are based on the ability of GCREC family proteins to modulate second messenger signaling pathways activated by G proteins (eg, cAMP pathway; Gaudin, P. et al. (1998) J. Biol. Chem. 273: 4990-4996). A plasmid (encoding full length GCREC) is transfected into a mammalian cell line. The cell line is, for example, a Chinese hamster ovary (CHO) or human fetal kidney (HEK-293) cell line, and a method well known in the art is used. Transfected cells are grown in media in a 12-well tray for 48 hours, then the media is discarded and attached cells are gently washed with PBS. The cells are then incubated in medium with or without ligand for 30 minutes, then the medium is removed and cell lysis is treated with 1 M perchloric acid. Measurement of cAMP levels in the lysate is performed by radioimmunoassay by methods well known in the art. The change in the level of cAMP in the lysate from cells exposed to ligand (compared to that without ligand) is proportional to the amount of GCREC present in the transfected cells.
[0339]
To measure changes in inositol phosphate levels, cells are grown in 24-well plates. 1 × 10 on plateFivePlace cells / well and incubate with inositol-free medium [ThreeH] myo-inositol (2 μCi / well) for 48 hours. After removing the medium and washing the cells with a buffer containing 10 mM LiCl, the ligand is added. The reaction is stopped by adding perchloric acid. Inositol phosphate extraction and separation is performed on Dowex AG1-X8 (Bio-Rad) anion exchange resin and total labeled inositol phosphate is counted by liquid scintillation. The change in the level of labeled inositol phosphate from cells exposed to the ligand (compared to that without ligand) is proportional to the amount of GCREC present in the transfected cells.
[0340]
The yeast two-hybrid system can be used to demonstrate the binding of a protein to a specific receptor and the formation of a stable complex, where the yeast (e.g. strain y190 (MATa gal4 gal80 his3 trp1-901 ade2-101 ura3-52 leu2-3, -112 + URA3 :: GAL_lacZ, LYS2 :: GAL_HIS3 cyhr) Are grown in yeast extract, peptone dextrose (YPD), Synthetic Complete (SC), or drop-out medium (Harper, J.W. et al. (1993) Cell 75: 805-816). Affinity chromatography can be used to biochemically characterize interactions and demonstrate ligand recognition and binding, including purified protein (GST or GST fusion) and whole cell protein (e.g. HEK293 human fetal kidney The cells are mixed with the desired vector. Extraction and fractionation of bound protein is performed on 10% SDS-PAGE and then detected by Western blotting (Tsai, R.Y.L. and Reed, R.R. (1997) J. Neurosci. 17: 4159-4169).
[0341]
A recording pipette is available for direct assessment of nerve impulse activity, and a fluorescein-sensillum-lymph ringer (SLR) is applied to the pipette to produce a sensilla trichodea (specialized) Selected sensory organs). For example, the hairy sensory sensation is reached from the open end of the sensory hair of a male Bombyx mori, and the change in spontaneous nerve impulse activity is measured. This impulse activity can be recorded directly from receptor cells (eg, bombycol, bombycarreceptor) (Laue, M. et al. (1997) Cell Tissue Res. 288: 149-158).
[0342]
19 GCREC Ligand identification
GCREC is expressed in eukaryotic cell lines such as CHO (Chinese Hamster Ovary) or HEK (Human Fetal Kidney) 293. These cell lines have a good GCREC expression process. It also has a wide range of G protein groups that can functionally link the expressed GCREC to downstream effectors. Transformed cells are assayed for activation of the expressed receptor in the presence of the candidate ligand. Activity, cAMP or Ca2+Etc. Measured by changes in intracellular second messengers. These can be done using standard methods known in the art or under the transcriptional control of a photoprotein (eg, firefly luciferase or green fluorescent protein) in response to a promoter (responsive to stimulation of protein kinase C by an activated receptor). Can be measured directly using a reporter gene assay as in (Milligan, G. et al. (1996) Trends Pharmacol. Sci. 17: 235-237). Assay techniques are available for both these second messenger systems, such as adenylyl cyclase activated FlashPlate Assay (NEN Life Sciences Products) and other multi-well plate formats, or Fluo-4 AM (Molecular Probes) Fluorescent Ca2+Enables high-throughput readout using the indicator in conjunction with the FLIPR fluorescence quantitative plate readout system (Molecular Devices). When the physiologically relevant second messenger pathway is not known, GCREC is used for phospholipase C and Ca.2+G protein G, which has been demonstrated to bind a wide range of G proteins, to pass GCREC signaling through pathways involved in mobilizationα 15/16(Offerrnanns, S. and M.I. Simon (1995) J. Biol. Chem. 270: 15175-15180). Alternatively, GCREC may provide the advantage of no background for GCREC activation screening by being expressed in engineered yeast systems that are deficient in endogenous GCREC. These yeast systems are human GCREC and GαProteins are substituted for the corresponding components of the endogenous yeast pheromone receptor pathway. Downstream signaling pathways are also altered to convert the normal yeast response to the signal to positive growth on selective media or to reporter gene expression (Broach, JR and J. Thorner (1996) Nature 384 (supp .): 14-16). Receptors are screened against putative ligands, such as known GCREC ligands and other naturally bioactive molecules. Biological extracts extracted from tissues, biological fluids and cell supernatants are also screened.
[0343]
It will be apparent to those skilled in the art that various modifications and variations can be made in the described compositions, methods and systems of the invention without departing from the scope and spirit of the invention. The present invention provides a novel and useful protein group and a polynucleotide group encoding them, and can be used in the drug discovery process, and the present invention relates to diseases and pathologies using these compositions. It will be appreciated that methods of detection, diagnosis, and treatment are provided. While the invention has been described with reference to several embodiments, it is to be understood that the scope of the invention should not be unduly limited to such specific embodiments . The description of such embodiments should not be considered complete, nor is the invention limited to the forms disclosed. Furthermore, elements of one embodiment can be easily recombined with elements of one or more other embodiments. Such a combination may form a number of embodiments within the scope of the present invention. The scope of the present invention is intended to be defined by the appended claims and their equivalents.
[0344]
(Short description of the table)
Table 1 summarizes the nomenclature of the full-length polynucleotide embodiments and polypeptide embodiments of the invention.
[0345]
Table 2 shows the GenBank identification numbers and GenBank homologue annotations closest to the polypeptide embodiment of the present invention. Also shown is the probability score for each polypeptide and its homologues (one or more) matching.
[0346]
Table 3 shows structural features of polypeptide embodiments, such as predicted motifs and domains, along with methods, algorithms and searchable databases used to analyze the polypeptides.
[0347]
Table 4 shows the cDNA and / or genomic DNA fragments used to assemble the polynucleotide embodiments, along with selected fragments of the polynucleotide.
Table 5 shows a representative cDNA library of the polynucleotide embodiment.
[0348]
Table 6 is an appendix explaining the tissues and vectors used for the preparation of the cDNA library shown in Table 5.
[0349]
Table 7 shows the tools, programs, and algorithms used for polynucleotide and polypeptide analysis, along with applicable descriptions, references, and threshold parameters.
[0350]
[Table 1]
Figure 2005500037
[0351]
[Table 2-1]
Figure 2005500037
[0352]
[Table 2-2]
Figure 2005500037
[0353]
[Table 2-3]
Figure 2005500037
[0354]
[Table 3-1]
Figure 2005500037
[0355]
[Table 3-2]
Figure 2005500037
[0356]
[Table 3-3]
Figure 2005500037
[0357]
[Table 3-4]
Figure 2005500037
[0358]
[Table 3-5]
Figure 2005500037
[0359]
[Table 3-6]
Figure 2005500037
[0360]
[Table 3-7]
Figure 2005500037
[0361]
[Table 3-8]
Figure 2005500037
[0362]
[Table 3-9]
Figure 2005500037
[0363]
[Table 3-10]
Figure 2005500037
[0364]
[Table 3-11]
Figure 2005500037
[0365]
[Table 3-12]
Figure 2005500037
[0366]
[Table 3-13]
Figure 2005500037
[0367]
[Table 3-14]
Figure 2005500037
[0368]
[Table 3-15]
Figure 2005500037
[0369]
[Table 3-16]
Figure 2005500037
[0370]
[Table 3-17]
Figure 2005500037
[0371]
[Table 3-18]
Figure 2005500037
[0372]
[Table 3-19]
Figure 2005500037
[0373]
[Table 3-20]
Figure 2005500037
[0374]
[Table 3-21]
Figure 2005500037
[0375]
[Table 3-22]
Figure 2005500037
[0376]
[Table 3-23]
Figure 2005500037
[0377]
[Table 3-24]
Figure 2005500037
[0378]
[Table 3-25]
Figure 2005500037
[0379]
[Table 3-26]
Figure 2005500037
[0380]
[Table 3-27]
Figure 2005500037
[0381]
[Table 3-28]
Figure 2005500037
[0382]
[Table 3-29]
Figure 2005500037
[0383]
[Table 4-1]
Figure 2005500037
[0384]
[Table 4-2]
Figure 2005500037
[0385]
[Table 4-3]
Figure 2005500037
[0386]
[Table 5]
Figure 2005500037
[0387]
[Table 6-1]
Figure 2005500037
[0388]
[Table 6-2]
Figure 2005500037
[0389]
[Table 6-3]
Figure 2005500037
[0390]
[Table 6-4]
Figure 2005500037
[0390]
[Table 7-1]
Figure 2005500037
[0392]
[Table 7-2]
Figure 2005500037

Claims (114)

以下の(a)乃至(d)からなる群から選択した単離されたポリペプチド。
(a)SEQ ID NO:1-26(配列番号1乃至26)からなる群から選択した或るアミノ酸配列を持つポリペプチド
(b)SEQ ID NO:1-26からなる群から選択したアミノ酸配列に対して少なくとも90%が同一であるような天然アミノ酸配列を持つポリペプチド
(c)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を有するポリペプチドの生物学的活性断片
(d)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を有するポリペプチドの免疫原性断片
An isolated polypeptide selected from the group consisting of the following (a) to (d).
(A) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 (SEQ ID NOs: 1 to 26) (b) an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 A polypeptide having a natural amino acid sequence such that at least 90% is identical to it (c) a biologically active fragment of a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 (d) SEQ An immunogenic fragment of a polypeptide having an amino acid sequence selected from the group consisting of ID NO: 1-26
SEQ ID NO:1-26からなる群から選択したアミノ酸配列を有する、請求項1に記載の単離されたポリペプチド。2. The isolated polypeptide of claim 1 having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26. 請求項1のポリペプチドをコードする単離されたポリヌクレオチド。2. An isolated polynucleotide encoding the polypeptide of claim 1. 請求項2のポリペプチドをコードする単離されたポリヌクレオチド。An isolated polynucleotide encoding the polypeptide of claim 2. SEQ ID NO:27-52からなる群から選択したポリヌクレオチド配列を有する、請求項4に記載の単離されたポリヌクレオチド。5. The isolated polynucleotide of claim 4 having a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52. 請求項3に記載のポリヌクレオチドへ機能的に連結したプロモーター配列を有する組換えポリヌクレオチド。A recombinant polynucleotide having a promoter sequence operably linked to the polynucleotide of claim 3. 請求項6に記載の組換えポリヌクレオチドを用いて形質転換した細胞。A cell transformed with the recombinant polynucleotide according to claim 6. 請求項6に記載の組換えポリヌクレオチドを有する遺伝形質転換生物。A genetically transformed organism comprising the recombinant polynucleotide according to claim 6. 請求項1のポリペプチドを生産する方法であって、
(a)前記ポリペプチドの発現に好適な条件下で、請求項1のポリペプチドをコードする或るポリヌクレオチドへ機能的に連結されたプロモーター配列を持つ組換えポリヌクレオチドで形質転換される細胞を培養する過程と、
(b)そのように発現した前記ポリペプチドを回収する過程、とからなることを特徴とする方法。
A method for producing the polypeptide of claim 1, comprising:
(A) a cell transformed with a recombinant polynucleotide having a promoter sequence operably linked to a polynucleotide encoding the polypeptide of claim 1 under conditions suitable for expression of said polypeptide; Culturing, and
And (b) recovering the polypeptide so expressed.
前記ポリペプチドが、SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を含むことを特徴とする、請求項9に記載の方法。10. A method according to claim 9, characterized in that the polypeptide comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26. 請求項1に記載のポリペプチドと特異結合するような単離された抗体。An isolated antibody that specifically binds to the polypeptide of claim 1. 以下の(a)乃至(e)からなる群から選択した単離されたポリヌクレオチド。
(a)SEQ ID NO:27-52からなる群から選択した或るポリヌクレオチド配列を有するポリヌクレオチド
(b)SEQ ID NO:27-52からなる群から選択したポリヌクレオチド配列と少なくとも90%が同一であるような天然ポリヌクレオチド配列を有するポリヌクレオチド
(c)(a)のポリヌクレオチドに相補的なポリヌクレオチド
(d)(b)のポリヌクレオチドに相補的なポリヌクレオチド
(e)(a)〜(d)のRNA等価物
An isolated polynucleotide selected from the group consisting of the following (a) to (e):
(A) a polynucleotide having a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52 (b) at least 90% identical to a polynucleotide sequence selected from the group consisting of SEQ ID NO: 27-52 A polynucleotide complementary to a polynucleotide of polynucleotide (d) (b) complementary to the polynucleotide of polynucleotide (c) (a) having a natural polynucleotide sequence such as d) RNA equivalent
請求項12に記載のポリヌクレオチドの少なくとも60の連続したヌクレオチドを持つ、単離されたポリヌクレオチド。13. An isolated polynucleotide having at least 60 contiguous nucleotides of the polynucleotide of claim 12. 請求項12に記載のポリヌクレオチドの配列を有する標的ポリヌクレオチドをサンプル中から検出する方法であって、
(a)前記サンプル中の前記標的ポリヌクレオチドに相補的な或る配列を有する少なくとも20の連続したヌクレオチド群を持つ或るプローブと前記サンプルとをハイブリダイズし、該プローブが、或るハイブリダイゼーション複合体が前記プローブと前記標的ポリヌクレオチドまたはその断片群との間に形成される条件下で、前記標的ポリヌクレオチドへ特異的にハイブリダイズする過程と、
(b)前記ハイブリダイゼーション複合体の有無を検出し、該複合体が存在する場合にはオプションでその量を検出する過程、とを含む方法。
A method for detecting a target polynucleotide having the sequence of the polynucleotide of claim 12 in a sample comprising:
(A) hybridizing the sample with a probe having a group of at least 20 consecutive nucleotides having a sequence complementary to the target polynucleotide in the sample, the probe comprising a hybridization complex Specifically hybridizing to the target polynucleotide under conditions where a body is formed between the probe and the target polynucleotide or fragments thereof;
(B) detecting the presence or absence of the hybridization complex, and optionally detecting the amount of the complex if present.
前記プローブが少なくとも60の連続したヌクレオチドを含むことを特徴とする請求項14に記載の方法。15. The method of claim 14, wherein the probe comprises at least 60 consecutive nucleotides. 請求項12に記載のポリヌクレオチドの配列を有する標的ポリヌクレオチドをサンプル中から検出する方法であって、
(a)ポリメラーゼ連鎖反応増幅を用いて前記標的ポリヌクレオチドまたはその断片を増幅する過程と、
(b)前記増幅した標的ポリヌクレオチドまたはその断片の有無を検出し、該標的ポリヌクレオチドまたはその断片が存在する場合にはオプションでその量を検出する過程、とを含むことを特徴とする方法。
A method for detecting a target polynucleotide having the sequence of the polynucleotide of claim 12 in a sample comprising:
(A) amplifying the target polynucleotide or fragment thereof using polymerase chain reaction amplification;
(B) detecting the presence or absence of the amplified target polynucleotide or a fragment thereof, and optionally detecting the amount of the target polynucleotide or a fragment thereof if present.
請求項1のポリペプチドと、薬剤として許容できる賦形剤とを含むことを特徴とする組成物。A composition comprising the polypeptide of claim 1 and a pharmaceutically acceptable excipient. 前記ポリペプチドが、SEQ ID NO:1-26からなる群から選択したアミノ酸配列を含む請求項17の組成物。18. The composition of claim 17, wherein said polypeptide comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26. 機能的GCRECの発現の低下に関連する疾患や病態の治療方法であって、そのような治療が必要な患者にA method of treating a disease or condition associated with a decrease in the expression of functional GCREC for patients in need of such treatment の組成物を投与する過程を含むことを特徴とする治療方法。A method of treatment comprising the step of administering a composition. 請求項1のポリペプチドのアゴニストとしての有効性を確認するために化合物をスクリーニングする方法であって、
(a)請求項1のポリペプチドを有する或るサンプルを或る化合物に曝す過程と、
(b)前記サンプルにおいてアゴニスト活性を検出する過程、とを含むことを特徴とするスクリーニング方法。
A method of screening a compound to confirm the effectiveness of the polypeptide of claim 1 as an agonist, comprising:
(A) exposing a sample having the polypeptide of claim 1 to a compound;
(B) A screening method comprising the step of detecting agonist activity in the sample.
請求項20に記載の方法で同定したアゴニスト化合物と、薬剤として許容できる賦形剤とを含むことを特徴とする組成物。21. A composition comprising an agonist compound identified by the method of claim 20 and a pharmaceutically acceptable excipient. 機能的GCRECの発現の低下に関連する疾患や病態の治療方法であって、そのような治療を要する患者への請求項21の組成物の投与を含む治療方法。22. A method of treating a disease or condition associated with reduced expression of functional GCREC, comprising administering the composition of claim 21 to a patient in need of such treatment. 請求項1のポリペプチドのアンタゴニストとしての有効性を確認するために化合物をスクリーニングする方法であって、
(a)請求項1のポリペプチドを有する或るサンプルを或る化合物に曝す過程と、
(b)前記サンプルにおいてアンタゴニスト活性を検出する過程、とを含むことを特徴とするスクリーニング方法。
A method of screening a compound to confirm the effectiveness of the polypeptide of claim 1 as an antagonist comprising:
(A) exposing a sample having the polypeptide of claim 1 to a compound;
(B) a screening method comprising the step of detecting antagonist activity in the sample.
請求項23の方法で同定したアンタゴニスト化合物と、薬剤として許容できる賦形剤とを有する組成物。24. A composition comprising an antagonist compound identified by the method of claim 23 and a pharmaceutically acceptable excipient. 機能的GCRECの過剰発現に関連する疾患や病状の治療方法であって、そのような治療を要する患者への、請求項24の組成物の投与を含む治療方法。25. A method of treating a disease or condition associated with overexpression of functional GCREC, comprising administering the composition of claim 24 to a patient in need of such treatment. 請求項1のポリペプチドに特異結合する化合物をスクリーニングする方法であって、
(a)請求項1に記載のポリペプチドを適切な諸条件下で少なくとも1つの試験化合物と混合する過程と、
(b)請求項1に記載のポリペプチドの試験化合物との結合を検出し、それによって請求項1に記載のポリペプチドに特異結合する化合物を同定する過程、とを含むことを特徴とする方法。
A method for screening for a compound that specifically binds to the polypeptide of claim 1, comprising:
(A) mixing the polypeptide of claim 1 with at least one test compound under suitable conditions;
(B) detecting the binding of the polypeptide of claim 1 to a test compound and thereby identifying the compound that specifically binds to the polypeptide of claim 1, .
請求項1のポリペプチドの活性をモジュレート(調節)する化合物をスクリーニングする方法であって、
(a)請求項1に記載のポリペプチドの活性が許容された条件下で、該ポリペプチドを少なくとも1つの試験化合物と混合する過程と、
(b)請求項1に記載のポリペプチドの活性を試験化合物の存在下で算定する過程と、
(c)試験化合物の存在下での請求項1に記載のポリペプチドの活性を、試験化合物の不存在下での請求項1に記載のポリペプチドの活性と比較する過程とを含み、試験化合物の存在下での請求項1に記載のポリペプチドの活性の変化が、請求項1に記載のポリペプチドの活性を調節する化合物を標示することを特徴とする方法。
A method of screening for compounds that modulate (modulate) the activity of the polypeptide of claim 1 comprising:
(A) mixing the polypeptide with at least one test compound under conditions that permit activity of the polypeptide of claim 1;
(B) calculating the activity of the polypeptide of claim 1 in the presence of a test compound;
(C) comparing the activity of the polypeptide of claim 1 in the presence of the test compound with the activity of the polypeptide of claim 1 in the absence of the test compound, 2. A method wherein the change in activity of the polypeptide of claim 1 in the presence of is indicative of a compound that modulates the activity of the polypeptide of claim 1.
請求項5の配列を持つ標的ポリヌクレオチドの発現を改変するのに効果的な化合物をスクリーニングする方法であって、
(a)前記標的ポリヌクレオチドの発現に好適な諸条件下で、前記標的ポリヌクレオチドを有する或るサンプルを或る化合物に曝露する過程と、
(b)前記標的ポリヌクレオチドの、改変された発現を検出する過程と、
(c)可変量の前記化合物の存在下と前記化合物の不存在下で、前記標的ポリヌクレオチドの発現を比較する過程、とを含む方法。
A method of screening for compounds effective to alter the expression of a target polynucleotide having the sequence of claim 5 comprising:
(A) exposing a sample having the target polynucleotide to a compound under conditions suitable for expression of the target polynucleotide;
(B) detecting altered expression of the target polynucleotide;
(C) comparing the expression of the target polynucleotide in the presence of a variable amount of the compound and in the absence of the compound.
試験化合物の毒性を算定する方法であって、
(a)核酸群を有する或る生体サンプルを前記試験化合物で処理する過程と、
(b)処理した前記生体サンプルの核酸群と、請求項12のポリヌクレオチドの少なくとも20の連続するヌクレオチド群を有する或るプローブをハイブリダイズさせる過程であって、このハイブリダイゼーションが、前記プローブと前記生体サンプルの或る標的ポリヌクレオチドとの間で或る特異的なハイブリダイゼーション複合体が形成される諸条件下で行われ、前記標的ポリヌクレオチドが、請求項12のポリヌクレオチドのポリヌクレオチド配列またはその断片を有するポリヌクレオチドである、前記過程と、
(c)ハイブリダイゼーション複合体の収量を定量する過程と、
(d)前記処理された生体サンプル中の前記ハイブリタイゼーション複合体の量を、或る処理されていない生体サンプル中の前記ハイブリタイゼーション複合体の量と比較する過程とを含み、前記処理された生体サンプル中の前記ハイブリタイゼーション複合体の量の差が、前記試験化合物の毒性を標示することを特徴とする方法。
A method for calculating the toxicity of a test compound comprising:
(A) treating a biological sample having a nucleic acid group with the test compound;
(B) hybridizing a nucleic acid group of the treated biological sample with a probe having at least 20 consecutive nucleotide groups of the polynucleotide of claim 12, wherein the hybridization comprises the probe and the probe 13. A polynucleotide sequence of the polynucleotide of claim 12 or a sequence thereof, wherein the target polynucleotide is formed under conditions that form a specific hybridization complex with a target polynucleotide of a biological sample. A polynucleotide comprising a fragment, the above process;
(C) quantifying the yield of the hybridization complex;
(D) comparing the amount of the hybridization complex in the treated biological sample with the amount of the hybridization complex in an untreated biological sample, A difference in the amount of the hybridization complex in a biological sample is indicative of the toxicity of the test compound.
生体サンプル中のGCRECの発現に関連する症状または疾患に対する診断試験法であって、
(a)前記抗体が前記ポリペプチドに結合し、抗体とポリペプチドとの複合体が形成されるのに適した諸条件下で、前記生体サンプルを請求項11に記載の抗体と混合する過程と、
(b)前記複合体を検出する過程とを含み、前記複合体の存在が、前記生体サンプル中の前記ポリペプチドの存在と相関する方法。
A diagnostic test for a condition or disease associated with the expression of GCREC in a biological sample, comprising:
(A) mixing the biological sample with the antibody of claim 11 under conditions suitable for the antibody to bind to the polypeptide and to form a complex of the antibody and the polypeptide; ,
(B) a method of detecting the complex, wherein the presence of the complex correlates with the presence of the polypeptide in the biological sample.
請求項11の抗体であって、
(a)キメラ抗体
(b)一本鎖抗体
(c)Fab断片
(d)F(ab')2断片
(e)ヒト化抗体、のいずれかであることを特徴とする抗体。
The antibody of claim 11, comprising
An antibody comprising any one of (a) a chimeric antibody, (b) a single chain antibody, (c) a Fab fragment, (d) an F (ab ′) 2 fragment, and (e) a humanized antibody.
請求項11に記載の抗体と、許容できる賦形剤とを有する組成物。12. A composition comprising the antibody of claim 11 and an acceptable excipient. 被検者におけるGCRECの発現に関連する症状又は疾患の診断方法であって、請求項32に記載の組成物の有効量を前記被検者に投与する過程を含むことを特徴とする方法。33. A method for diagnosing a symptom or disease associated with the expression of GCREC in a subject, comprising the step of administering to the subject an effective amount of the composition of claim 32. 前記抗体が標識されることを特徴とする、請求項32に記載の組成物。33. The composition of claim 32, wherein the antibody is labeled. 被検者におけるGCRECの発現に関連する症状又は疾患の診断方法であって、請求項34に記載の組成物の有効量を前記被検者に投与する過程を含むことを特徴とする方法。35. A method for diagnosing a symptom or disease associated with the expression of GCREC in a subject, comprising the step of administering to the subject an effective amount of the composition of claim 34. 請求項11の抗体の特異性を持つポリクローナル抗体を調製する方法であって、
(a)抗体応答を誘発する諸条件下で、SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列またはその免疫原性断片を有する或るポリペプチドを用いて或る動物を免疫化する過程と、
(b)前記動物から抗体を単離する過程と、
(c)前記単離された抗体を該ポリペプチドでスクリーニングし、それによって、SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を有する或るポリペプチドに特異結合するようなポリクローナル抗体を同定する過程、とを含むことを特徴とする方法。
A method for preparing a polyclonal antibody having the specificity of the antibody of claim 11, comprising:
(A) immunizing an animal with a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 or an immunogenic fragment thereof under conditions that elicit an antibody response The process of becoming
(B) isolating the antibody from the animal;
(C) a polyclonal so that said isolated antibody is screened with said polypeptide, thereby binding specifically to a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 Identifying the antibody.
請求項36の方法で産生したポリクローナル抗体。37. A polyclonal antibody produced by the method of claim 36. 請求項37のポリクローナル抗体と好適なキャリアとを有する組成物。38. A composition comprising the polyclonal antibody of claim 37 and a suitable carrier. 請求項11に記載の抗体の特異性を有するモノクローナル抗体を作製する方法であって、
(a)抗体応答を誘発する諸条件下で、SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列またはその免疫原性断片を有する或るポリペプチドを用いて或る動物を免疫化する過程と、
(b)前記動物から、抗体を産出する細胞を単離する過程と、
(c)不死化した細胞と前記抗体産出細胞とを融合し、モノクローナル抗体を産出するハイブリドーマ細胞を形成する過程と、
(d)前記ハイブリドーマ細胞を培養する過程と、
(e)SEQ ID NO:1-26からなる群から選択したアミノ酸配列を有するポリペプチドに特異結合するようなモノクローナル抗体を前記培養物から単離する過程、とを含むことを特徴とする方法。
A method for producing a monoclonal antibody having the specificity of the antibody according to claim 11,
(A) immunizing an animal with a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 or an immunogenic fragment thereof under conditions that elicit an antibody response The process of becoming
(B) isolating cells producing antibodies from said animal;
(C) fusing the immortalized cell with the antibody-producing cell to form a hybridoma cell that produces a monoclonal antibody;
(D) culturing the hybridoma cells;
(E) isolating from the culture a monoclonal antibody that specifically binds to a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26.
請求項39に記載の方法で産出したモノクローナル抗体。40. A monoclonal antibody produced by the method of claim 39. 請求項40に記載のモノクローナル抗体と適切なキャリアとを有する組成物。41. A composition comprising the monoclonal antibody of claim 40 and a suitable carrier. Fab発現ライブラリのスクリーニングによって前記抗体を産出することを特徴とする、請求項11に記載の抗体。12. The antibody according to claim 11, wherein the antibody is produced by screening a Fab expression library. 組換え免疫グロブリンライブラリをスクリーニングすることにより産出される、請求項11に記載の抗体。12. The antibody of claim 11, which is produced by screening a recombinant immunoglobulin library. SEQ ID NO:1-26からなる群から選択したアミノ酸配列を有するポリペプチドをサンプル中に検出する方法であって、
(a)前記抗体と前記ポリペプチドとの特異結合を許容する条件下で、或るサンプルと共に請求項11に記載の抗体をインキュベートする過程と、
(b)特異結合を検出する過程とを含み、該特異結合が、SEQ ID NO:1-26からなる群から選択したアミノ酸配列を有するポリペプチドがサンプル中に存在することを標示することを特徴とする方法。
A method of detecting in a sample a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26,
(A) incubating the antibody of claim 11 with a sample under conditions that allow specific binding of the antibody to the polypeptide;
(B) detecting specific binding, wherein the specific binding indicates that a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 is present in the sample And how to.
SEQ ID NO:1-26 からなる群から選択したアミノ酸配列を有するポリペプチドを精製する方法であって、
(a)前記抗体と前記ポリペプチドとの特異結合を許容する条件下で、或るサンプルと共に請求項11に記載の抗体をインキュベートする過程と、
(b)前記サンプルから前記抗体を分離し、SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を有する精製ポリペプチドを得る過程、とを含むことを特徴とする方法。
A method for purifying a polypeptide having an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26, comprising:
(A) incubating the antibody of claim 11 with a sample under conditions that allow specific binding of the antibody to the polypeptide;
(B) separating the antibody from the sample to obtain a purified polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26.
マイクロアレイの少なくとも1つのエレメントが請求項13に記載のポリヌクレオチドであるマイクロアレイ。14. A microarray, wherein at least one element of the microarray is a polynucleotide according to claim 13. ポリヌクレオチド群を有する或るサンプルの発現プロフィールを作製する方法であって、
(a)該サンプルの該ポリヌクレオチド群を標識する過程と、
(b)ハイブリダイゼーション複合体の形成に適した諸条件下で請求項46のマイクロアレイのエレメント群をサンプルの標識されたポリヌクレオチド群と接触させる過程と、
(c)該サンプル中の該ポリヌクレオチド群の発現を定量化する過程、とを含むことを特徴とする方法。
A method for generating an expression profile of a sample having a polynucleotide group comprising:
(A) labeling the polynucleotide group of the sample;
(B) contacting the elements of the microarray of claim 46 with the labeled polynucleotides of the sample under conditions suitable for formation of a hybridization complex;
(C) quantifying the expression of the polynucleotide group in the sample.
固体基板上の固有の物理的位置に付着された種々のヌクレオチド分子を有するアレイであって、少なくとも1つの前記ヌクレオチド分子が、或る標的ポリヌクレオチドの少なくとも30の連続したヌクレオチド群と特異的にハイブリダイズ可能な最初のオリゴヌクレオチドまたはポリヌクレオチド配列を含み、前記の標的ポリヌクレオチドが請求項12に記載のポリヌクレオチドであることを特徴とするアレイ。An array having various nucleotide molecules attached to unique physical locations on a solid substrate, wherein at least one said nucleotide molecule specifically hybridizes to at least 30 consecutive nucleotide groups of a target polynucleotide. 13. An array comprising a first oligonucleotide or polynucleotide sequence capable of soybean, wherein the target polynucleotide is the polynucleotide of claim 12. 請求項48に記載のアレイで、前記の最初のオリゴヌクレオチドまたはポリヌクレオチドの配列が前記の標的ポリヌクレオチドの少なくとも30の連続したヌクレオチドに完全に相補的であることを特徴とするアレイ。49. The array of claim 48, wherein the first oligonucleotide or polynucleotide sequence is completely complementary to at least 30 contiguous nucleotides of the target polynucleotide. 請求項48に記載のアレイで、前記の最初のオリゴヌクレオチドまたはポリヌクレオチドの配列が前記の標的ポリヌクレオチドの少なくとも60の連続したヌクレオチドに完全に相補的であることを特徴とするアレイ。49. The array of claim 48, wherein the sequence of the first oligonucleotide or polynucleotide is completely complementary to at least 60 contiguous nucleotides of the target polynucleotide. 請求項48に記載のアレイで、前記のオリゴヌクレオチドまたはポリヌクレオチドの最初の配列が前記の標的ポリヌクレオチドに完全に相補的であることを特徴とするアレイ。49. The array of claim 48, wherein the initial sequence of the oligonucleotide or polynucleotide is completely complementary to the target polynucleotide. 請求項48に記載のアレイで、マイクロアレイであることを特徴とするアレイ。49. The array of claim 48, wherein the array is a microarray. 請求項48に記載のアレイで、前記のオリゴヌクレオチドまたはポリヌクレオチドの最初の配列を有するヌクレオチド分子にハイブリダイズした前記の標的ポリヌクレオチドを有することを特徴とするアレイ。49. The array of claim 48, comprising the target polynucleotide hybridized to a nucleotide molecule having a first sequence of the oligonucleotide or polynucleotide. 請求項48に記載のアレイで、或るリンカーが少なくとも1つの前記のヌクレオチド分子と前記の固体基板とを連結していることを特徴とするアレイ。49. The array of claim 48, wherein a linker connects at least one of the nucleotide molecules and the solid substrate. 請求項48に記載のアレイで、該基板上の固有の物理的位置の各々が複数のヌクレオチド分子を含み、任意の単一の固有の物理的位置でのその複数のヌクレオチド分子は同一の配列を有し、該基板上の固有の物理的位置の各々は、該基板上の別の固有の物理的位置でのヌクレオチド分子群の配列とは異なる或る配列を有するヌクレオチド分子群を含むことを特徴とするアレイ。49. The array of claim 48, wherein each unique physical location on the substrate comprises a plurality of nucleotide molecules, wherein the plurality of nucleotide molecules at any single unique physical location comprises the same sequence. Each of the unique physical locations on the substrate comprises a nucleotide molecule group having a sequence that is different from the sequence of the nucleotide molecule group at another unique physical location on the substrate. An array. 或る嗅覚および/または味覚をモジュレート(調節)、模倣、および/またはブロックする化合物を同定する方法であって、以下の過程を含む方法。
(a)該化合物を、以下の(i)乃至(iii)を有する群から選択した或る嗅覚受容体ポリペプチドおよび/または味覚受容体ポリペプチドと接触させる過程。
(i)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を持つポリペプチド
(ii)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列を有するポリペプチドの生物学的活性断片
(iii)SEQ ID NO:1-26からなる群から選択した或るアミノ酸配列に対して少なくとも90%が同一であるようなアミノ酸配列を有する嗅覚受容体および/または味覚受容体。
(b)該受容体ポリペプチドに対して、特異的に結合、および/または、その活性に作用する化合物を同定する過程。
A method for identifying a compound that modulates, mimics, and / or blocks a certain olfaction and / or taste, comprising the following steps.
(A) contacting the compound with a certain olfactory receptor polypeptide and / or taste receptor polypeptide selected from the group having the following (i) to (iii):
(I) a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 (ii) a living organism of a polypeptide having a certain amino acid sequence selected from the group consisting of SEQ ID NO: 1-26 (Iii) an olfactory receptor and / or a taste receptor having an amino acid sequence that is at least 90% identical to an amino acid sequence selected from the group consisting of SEQ ID NO: 1-26.
(B) identifying a compound that specifically binds to and / or affects the activity of the receptor polypeptide.
請求項56に記載の方法であり、該受容体ポリペプチドが哺乳動物細胞の表面上に発現される方法。57. The method of claim 56, wherein the receptor polypeptide is expressed on the surface of a mammalian cell. 請求項57に記載の方法であり、該哺乳動物細胞がGタンパク質を発現する方法。58. The method of claim 57, wherein the mammalian cell expresses G protein. 請求項58に記載の方法であり、該哺乳動物細胞が複数のGタンパク質共役受容体を発現する方法。59. The method of claim 58, wherein the mammalian cell expresses a plurality of G protein coupled receptors. 請求項59に記載の方法であり、該哺乳動物細胞が別の嗅覚および/または味覚受容体ポリペプチドを発現する方法。60. The method of claim 59, wherein the mammalian cell expresses another olfactory and / or taste receptor polypeptide. 請求項56に記載の方法であり、該受容体ポリペプチドが別のポリペプチドに融合される方法。57. The method of claim 56, wherein the receptor polypeptide is fused to another polypeptide. SEQ ID NO:1のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 1. SEQ ID NO:2のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 2. SEQ ID NO:3のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 3. SEQ ID NO:4のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 4. SEQ ID NO:5のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 5. SEQ ID NO:6のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 6. SEQ ID NO:7のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 7. SEQ ID NO:8のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 8. SEQ ID NO:9のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 9. SEQ ID NO:10のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 10. SEQ ID NO:11のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 11. SEQ ID NO:12のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 12. SEQ ID NO:13のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 13. SEQ ID NO:14のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 14. SEQ ID NO:15のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 15. SEQ ID NO:16のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 16. SEQ ID NO:17のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 17. SEQ ID NO:18のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 18. SEQ ID NO:19のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 19. SEQ ID NO:20のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 20. SEQ ID NO:21のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 21. SEQ ID NO:22のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 22. SEQ ID NO:23のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 23. SEQ ID NO:24のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 24. SEQ ID NO:25のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 25. SEQ ID NO:26のアミノ酸配列を有する請求項1に記載のポリペプチド。2. The polypeptide of claim 1 having the amino acid sequence of SEQ ID NO: 26. SEQ ID NO:27のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 27. SEQ ID NO:28のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 28. SEQ ID NO:29のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 29. SEQ ID NO:30のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 30. SEQ ID NO:31のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 31. SEQ ID NO:32のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 32. SEQ ID NO:33のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 33. SEQ ID NO:34のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 34. SEQ ID NO:35のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 35. SEQ ID NO:36のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 36. SEQ ID NO:37のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 37. SEQ ID NO:38のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 38. SEQ ID NO:39のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 39. SEQ ID NO:40のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 40. SEQ ID NO:41のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 41. SEQ ID NO:42のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 42. SEQ ID NO:43のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 43. SEQ ID NO:44のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 44. SEQ ID NO:45のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 45. SEQ ID NO:46のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 46. SEQ ID NO:47のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 47. SEQ ID NO:48のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 48. SEQ ID NO:49のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 49. SEQ ID NO:50のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 50. SEQ ID NO:51のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of Claim 12 having the polynucleotide sequence of SEQ ID NO: 51. SEQ ID NO:52のポリヌクレオチド配列を有する請求項12に記載のポリヌクレオチド。The polynucleotide of claim 12 having the polynucleotide sequence of SEQ ID NO: 52.
JP2003507246A 2001-06-22 2002-06-20 G protein coupled receptor Pending JP2005500037A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US30049401P 2001-06-22 2001-06-22
US30532601P 2001-07-13 2001-07-13
US30816501P 2001-07-27 2001-07-27
US31011501P 2001-08-03 2001-08-03
US31141301P 2001-08-10 2001-08-10
US31467901P 2001-08-24 2001-08-24
PCT/US2002/020036 WO2003000859A2 (en) 2001-06-22 2002-06-20 G-protein coupled receptors

Publications (1)

Publication Number Publication Date
JP2005500037A true JP2005500037A (en) 2005-01-06

Family

ID=27559646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003507246A Pending JP2005500037A (en) 2001-06-22 2002-06-20 G protein coupled receptor

Country Status (5)

Country Link
EP (1) EP1551872A2 (en)
JP (1) JP2005500037A (en)
AU (1) AU2002316366A1 (en)
CA (1) CA2450925A1 (en)
WO (1) WO2003000859A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015202075A (en) * 2014-04-14 2015-11-16 花王株式会社 Search method of butyl acrylate odor inhibitor

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7803982B2 (en) 2001-04-20 2010-09-28 The Mount Sinai School Of Medicine Of New York University T1R3 transgenic animals, cells and related methods

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001027158A2 (en) * 1999-10-08 2001-04-19 Digiscents Olfactory receptor sequences
US7374878B2 (en) * 2000-06-22 2008-05-20 Senomyx, Inc. Receptor fingerprinting, sensory perception, and biosensors of chemical sensants

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015202075A (en) * 2014-04-14 2015-11-16 花王株式会社 Search method of butyl acrylate odor inhibitor

Also Published As

Publication number Publication date
CA2450925A1 (en) 2003-01-03
AU2002316366A1 (en) 2003-01-08
WO2003000859A2 (en) 2003-01-03
WO2003000859A3 (en) 2004-01-08
EP1551872A2 (en) 2005-07-13

Similar Documents

Publication Publication Date Title
JP2004523203A (en) G protein-coupled receptor
JP2004500808A (en) G protein-coupled receptor
US20030138818A1 (en) G-protein coupled receptors
JP2004516817A (en) G protein-coupled receptor
JP2003527107A (en) G protein-coupled receptor
JP2005508631A (en) Receptors and membrane-bound proteins
JP2004513614A (en) G protein-coupled receptor
JP2004516812A (en) Receptor
JP2003528633A (en) G protein-coupled receptor
JP2005514903A (en) Receptors and membrane-bound proteins
JP2004530409A (en) Transmembrane protein
JP2004515215A (en) G protein-coupled receptor
JP2004528007A (en) G protein-coupled receptor
JP2005503111A (en) G protein coupled receptor
JP2004507212A (en) G protein-coupled receptor
JP2004537283A (en) Transporters and ion channels
WO2003025130A2 (en) Receptors and membrane-associated proteins
JP2005500008A (en) Receptors and membrane-bound proteins
JP2004523236A (en) Neurotransmission-related proteins
JP2005500037A (en) G protein coupled receptor
JP2004532630A (en) G protein-coupled receptor
CA2459323A1 (en) G-protein coupled receptors
JP2005504503A (en) Receptors and membrane-related proteins
JP2004531204A (en) G protein-coupled receptor
JP2005501503A (en) G protein coupled receptor