JP2004531228A - Estrogen receptor alpha mutant and method for detecting the same - Google Patents

Estrogen receptor alpha mutant and method for detecting the same Download PDF

Info

Publication number
JP2004531228A
JP2004531228A JP2002560443A JP2002560443A JP2004531228A JP 2004531228 A JP2004531228 A JP 2004531228A JP 2002560443 A JP2002560443 A JP 2002560443A JP 2002560443 A JP2002560443 A JP 2002560443A JP 2004531228 A JP2004531228 A JP 2004531228A
Authority
JP
Japan
Prior art keywords
nucleic acid
estrogen receptor
estrogen
peptide
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002560443A
Other languages
Japanese (ja)
Inventor
カルシ,フランシス
カッセル,マイケル,ジェイ
ウォン,スチュアート,スー・イン
ウィン・ディーン,エミリー,エス
Original Assignee
アプレラ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アプレラ コーポレーション filed Critical アプレラ コーポレーション
Publication of JP2004531228A publication Critical patent/JP2004531228A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70567Nuclear receptors, e.g. retinoic acid receptor [RAR], RXR, nuclear orphan receptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Analytical Chemistry (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本発明は、エストロゲン受容体遺伝子/タンパクの、エストロゲン受容体アルファ遺伝子と新規の多型/ハプロタイプのゲノム構造を定義する、ヒト染色体6とcDNA由来のゲノムDNA配列に基づく。このような多型/ハプロタイプは、ガン、骨粗鬆症、心臓血管疾患等へのかかりやすさ等の、変異エストロゲン受容体によって媒介/変調される、様々な異常を引き起こす可能性がある。この配列アプローチに基づいて、本発明は、エストロゲンアルファ遺伝子のゲノムヌクレオチド配列、cDNA配列、アミノ酸配列、及び多型/ハプロタイプ配列、サンプル中のこれらの配列/多型/ハプロタイプを検出する方法、変異エストロゲン受容体により媒介される異常を持つ又は発現する危険性を測定する方法、及び変異エストロゲン受容体により媒介される異常を治療するために用いられる化合物をスクリーニングする方法を提供する。The present invention is based on the genomic DNA sequence from human chromosome 6 and cDNA, which defines the genomic structure of the estrogen receptor alpha gene and the novel polymorphism / haplotype of the estrogen receptor gene / protein. Such polymorphisms / haplotypes can cause a variety of abnormalities mediated / modulated by mutant estrogen receptors, such as susceptibility to cancer, osteoporosis, cardiovascular disease, and the like. Based on this sequence approach, the present invention provides genomic nucleotide, cDNA, amino acid, and polymorphism / haplotype sequences for the estrogen alpha gene, methods for detecting these sequences / polymorphisms / haplotypes in samples, mutant estrogen Methods are provided for determining the risk of having or developing a receptor-mediated disorder, and for screening compounds used to treat a mutant estrogen receptor-mediated disorder.

Description

【0001】
関連出願
本出願は、2000年10月20日付け出願のU.S. Serial No.09/692,414(Atty.Docket CL000258)、2001年1月24日付け出願のU.S. Serial No.09/768,184(Atty.Docket CL000258CIP)、2001年3月13日付け出願のU.S. Serial No.09/804,076(Atty.Docket CL000258CI2)、及び2001年4月5日付け出願のU.S. Serial No.09/826,314(Atty.Docket CL000258CI3)の優先権を主張するものである。
【0002】
技術分野
本発明は疾患の発見と治療方法に関する。特に、本発明はエストロゲン受容体アルファ遺伝子(ESR−α)における従来未知の核酸/アミノ酸多型、及びエストロゲン受容体により媒介/変調される疾患や障害の診断方法、治療方法の開発に用いるための、該遺伝子の遺伝子配列を提供するものである。
【0003】
背景技術
エストロゲン受容体
ヒトエストロゲン受容体アルファは、核ホルモン受容体のファミリーに属する。核ホルモン受容体は、特定のホルモン応答因子を含む遺伝子の転写を開始又は増大することのできるホルモン活性転写因子のファミリーである。
エストロゲン受容体タンパクは、66kDaの分子量を有する595個のアミノ酸からなり、翻訳されたエキソン8つ、異なる機能を持つドメイン6つを有する。これらのドメインのうち2つでは、核ホルモン受容体スーパーファミリーの初期の配列が高く保持されている。このドメインのうちの1つであるDNA結合ドメイン(DBD)は、ホルモン応答遺伝子のプロモーター中のホルモン応答因子への受容体の結合を媒介する2つの亜鉛フィンガーを含んでいる。C末端領域では、ホルモン結合ドメイン(HBD)は他のホルモン受容体と配列相同性を有する2つの領域を含み、ホルモン特性と選択性を与えている。ヒトエストロゲン受容体アルファ遺伝子は、染色体6q.25.1に位置している。
【0004】
エストロゲン受容体、及びこれに類似した他のステロイド受容体は、ステロイド(エストラジオール)又はタモキシフェンのようなステロイド類似体と結合し、活性化される転写因子である。活性化に際して、受容体はエストロゲン活性化遺伝子のプロモーター領域に位置するエストロゲン受容体成分(ERE)と結合してホモ二量体又はヘテロ二量体を形成し、宿主の補活性化剤との相互作用による転写を調整する。
【0005】
心臓血管疾患におけるエストロゲンの役割
心臓病は女性の主な死亡原因であり、この事実は女性や医師達によって認識されている。45〜65歳の女性の9人に1人は何らかの心臓血管疾患を有しており、65歳以上では3人に1人に増加する。毎年、全米で24万人が心臓病により死亡しており、このうち、発作で死亡した人は約9万人である。さらに、1年以内に心臓発作を起こした人の約44%が死亡している。これに比べて男性の場合は26%である(Warren MP and Kulak J Clin Obs Gyn 1998 1(4):976−987)。
【0006】
エストロゲンは、多種多様な細胞タイプに対して、広範囲にわたり生理的な影響を及ぼす。例えば、細胞の成長とアポトーシス、及び複製に関連する無数の機能を調節している。エストロゲン受容体には、αとβの2つのタイプがある。血管と骨にはβ受容体が含まれ、肝臓にはα受容体が含まれる。そして、中枢神経系ではα及びβ受容体の両方が見られる。これらの異なる受容体部位の相互作用は、エストロゲンと、例えばラロキシフェン等の選択的エストロゲン受容体モジュレータ(SERM)の生物学的効果に影響する。結合パターンは、エストロゲン又はSERMが、エストロゲンアゴニスト又はアンタゴニストとして作用するよう命令する(Mendelsohn ME and Karas RH New Engl J Med 1999, 340(23):1801−1811;Grese TA and Dodge JA Curr Pharm Design 1998, 4:71−92)。SERMと受容体結合部位には、組織に特有の関係が存在する。エストロゲンは、HDLコレステロール値を増大し、LDLコレステロール値を減少させ、プラスミノーゲン活性抑制因子値を減少させる(Meisler JG Jour Women’s Health 1999, 8(1):51−57)。全てのエストロゲンは、発現に細胞受容体を必要とする。一般にエストロゲン受容体は、リガンド誘導性の転写因子であり、ホルモン結合後に、対象遺伝子の発現を調整する(Faustini−Fustini et al. Eur J Endocrin 1999, 140:111−129)。エストロゲンは、おそらく血管壁にも重要な影響を及ぼしている。エストラジオールとプロゲステロン受容体が、動脈内皮及び平滑筋細胞で確認されている(Campisi D et al. Int J Tiss React 1987, IX(5):393−398)。エストロゲンは動脈壁に作用し、血管平滑筋を弛緩し、血管抵抗を減少させる。この機構は、内皮由来の弛緩因子及び内生的な硝酸塩の刺激によるようである(Warren MP and Kulak J Clin Obs Gyn 1998 41(4):976−987)。17B−エストラジオールによる緩和は、心臓状態の調整に重要な役割を果たし、閉経後の女性における心臓疾患の危険性を低下する。一酸化窒素の産生はエストロゲン受容体により媒介される。なぜなら受容体が抗エストロゲン剤によりブロックされる際に一酸化窒素が抑制されるからである。
【0007】
いくつかの研究においては、エストロゲンによる療法が心臓病の危険性を最高で50%低下させることが示されている(most recently reviewed by Mendelsohn ME and Karas RH New Engl J Med 1999, 340(23):1801−1811;Rich−Edwards JW N Engl J Med, 1995, 332:1758−1765; Gerhard M, Ganz P, Circulation, 1995, 92:5−8; rodstein F, et al N Engl J Med 1997, 336:1769−75; Chasen−Taber L and Stampfer MJ Ann of Int Med, 1998, 128:467−477; Warren MP and Kulak J Clin Obstet Gyn 1998, 41(4):976−987)。エストロゲンの減少は、女性における心血管系疾患の発症の最も重要な要因のうちの1つであるかもしれない。
【0008】
エストロゲンがアテローム発生を防止するという直接の証拠がない間にも、エストロゲンが心臓血管疾患の減少に有効であることを示唆する多くの疫学的証拠が存在していた;(1)全ての年齢層において、女性の心臓血管疾患の発病率は男性より低い;(2)早期に閉経しエストロゲンを使用しない女性においては、同年代の閉経前の女性に対して、心臓血管疾患を有する数が2倍であった;(3)エストロゲンを使用する閉経後の女性は使用しない女性と比較して、心臓血管疾患の発病率がかなり低い;(4)血管造影法により検出された心臓血管疾患を有する女性は、エストロゲンを用いた場合、生存率が高い。
【0009】
近年、エストロゲン療法による心臓血管疾患の発病率及び死亡率に対する良好な結果が報告されたので、閉経後の女性に対するエストロゲンの使用が、広範囲にわたり注目されるに至った(Meinertz T Herz 1997, 22: 151−157)。米国の医科大学により刊行されたエストロゲン治療のためのガイドラインには、「冠状動脈性心臓病を持つ女性に対してホルモン療法が有効である」と述べられている。
【0010】
30以上の予見的な研究と13の管理された研究により、心臓血管疾患の発生率又は普及、及び全ての死亡原因に対するエストロゲン代替療法の影響についての調査が行われた(Stampfer MJ et al. New Engl J Med 1991, 325:756−62; Grady D et al. Ann Intern Med 1992, 117:1016−37)。これらの研究のほとんどで、閉経後のエストロゲン使用者における冠状動脈性心臓病の発生率及び死亡率は、非使用者と比べてより低いことが示された。特に、エストロゲン使用者の冠状動脈性疾患は、非使用者の約50%であることが示された。全体的には、この証拠の大部分は、0.56の相対的な危険性でエストロゲンの保護効果を強く支持している(95% 信頼区間 0.50−0.61)。しかしながら、これらの研究には「健康な女性の選択の傾向」が存在し、潜在的に結果を混同させているかもしれない(エストロゲン使用者は、エストロゲン非使用者と比較し、より良い体重管理が行われ、運動量が多く、喫煙が少ない)。さらに、エストロゲン使用者がより高い教育を受け、より高い収入を有している等の傾向もこれらの疫学研究を混乱させている(Abrams J Clin Cardiol 1998, 21:218−222)。
【0011】
以前の観察は、ランダム化されていなかったために、種々の方法論的な傾向から、危険性減少の50%のうち25%が信頼されていた(Grodstein F and Stampfer MJ Prog Cardiol Dis 1995, 38: 199−210; Barrett−Conner E and Grady D 1998, Annu Rev Public Health 19:55−72)。最近、2つのメタ分析により、エストロゲン使用による冠状動脈性心臓病の減少は35〜44%であると見積もられた。無傷の子宮を有するエストロゲン単独使用の女性において、子宮ガンの危険性が向上するとの報告があったことから、最近の研究では、エストロゲンの是否の調査が行われている。新しい証拠では、エストロゲンに加えてプロゲスチン(通常メドロキシプロゲスチンアセテート)を使用する場合には、エストロゲンを単独で使用する場合と等しい心臓を保護効果が受けられないことが示唆されている(Hulley S et al 1998 JAMA 280:605−613; Abrams J Clin Cardiol 1998, 21:218−222)。
【0012】
閉経期におけるエストロゲンの低下は、HDLコレステロール値の6%の低下と、LDLコレステロール値の5%の増加に関連しており、これは閉経後の女性が閉経前の女性と比較して、より高い心臓血管疾患発病率を有することの説明となるかもしれない。エストロゲンを使用する閉経後の女性における心臓血管疾患の発病率が低いことは、LDLコレステロール値が15〜19%減少する、及びHDLコレステロール値が16〜18%増加するという結果によって一部説明できるかもしれない(JAMA 1995, 273:199−208)。PEPI(Postmenopausal Estrogen/Progestin Intervention)というランダム化された二重盲式偽薬対照試験では、単独でエストロゲンを使用する女性のHDLコレステロール値が、組み合わせてエストロゲンを使用した女性と比較して著しく増大することが示された(JAMA 1995、273:199−208)。最近、ヒト以外の霊長類の研究によりこれらの調査結果が立証された(Clarkson TB Lab An Sci 1998, 48(6):569−72)。脂質側面のエストロゲンの影響についての統計モデルにより、エストロゲンによる25〜50%の明らかな心臓保護は、HDL−コレステロールの良好な変化に媒介されることが示された(Bush TL et al. 1987 Circulation 75:1102−9; Gruchow HW et al. 1988 Am Heart J 115:954−63)。
【0013】
エストロゲン代替療法は危険を伴わない訳ではない。長年にわたり、経口避妊薬の使用者は非使用者と比較して、静脈血栓塞栓症(VTE)の危険性が3〜4倍に増大することが示されていた(Weiss G Am J Obstet Gynecol 1999 180:S295−301)。ある研究により、固有の凝固因子が経口避妊薬に関連するVTEにおいて重要な役割を果たしていることが示された(Vandenbroucke JP et al. Lancet 1994 344:1453−7; Rosing J et al. Br J Haematol 1997, 97:233−238)。ライデン突然変異因子Vは、経口避妊薬非使用者においてはVTEの危険性を5〜10倍に増大するが、第三世代の経口避妊薬使用者においては30倍に増大する。結合されたエストロゲンは、体内の自然な血液凝固阻止システム(APC)に対する抵抗を引き起こす。経口避妊薬の使用者におけるライデン突然変異因子Vによる異型接合体は、同型接合の女性と同等のAPC抵抗に発展する。
【0014】
エストロゲンは子宮内膜ガンの危険性を約6倍に増大するが、プロゲスチンを加えることにより、この影響はほとんどなくなる(Barrett−Conner E and Grady D 1998, Ann Rev Public Health 19:55−72)。エストロゲン代替が乳ガンの危険性を増大するかどうかという議論は続けられているが、いくつかの研究により危険性は30%増大することが示されている(Greendale GA et al. Lancet 1999, 353:571−80)。
【0015】
エストロゲン代替療法が女性の心臓血管疾患の危険性を減少するかどうか、そして、それが乳ガンの危険性を増大するかどうかについて立証するべく、ランダム化された多くの研究が進められている。最近完了したある試験HERS(Heart and Estrogen/progestin Replacement Study)では、すでに心臓疾患を有する2700人の女性において、連続的にエストロゲンとメドロキシプロゲステロンアセテートを処方した場合と、コントロール偽薬を処方した場合との比較を行った(Hully S et al. 1998 JAMA 280(7):605−13)。コントロールと比較して、介入グループは心臓病の発病が1年間の試験では著しく多かったが、4〜5年の試験では著しく少なかった。さらに、ホルモン使用女性の研究においては、初期の段階で血栓塞栓症の発病率の著しい増加が起こった。これらの結果に基づくと、ホルモン代替療法は心臓病の二次的予防に勧めることはできない。
【0016】
エストロゲンを用いた心臓血管系疾患の一次的予防に関して、他に2つの大きな臨床研究が現在行われている。2005年に英国で完了することになっているThe Women’s Health Initiative、及び2010年に完了されることになっているWIS−DOMと呼ばれる研究では、エストロゲンの心臓血管系疾患に対する保護効果に新しい光を投じるであろう(Meisler JG Jour Women’s Health 1999, 8(1):51−5)。
【0017】
まとめると、現在進行中の研究は、特に最近明らかにされたデザイナーエストロゲン又はSERMに関連するエストロゲン代替療法が、胸と子宮内膜組織に悪影響を起こさずに、骨と同様に心血管系に有効な影響を及ぼすことを示唆している。それでもなお、慎重に観察する必要がある。エストロゲンを摂取する女性は平均して、より教育され、より健康で、より高い収入を持ち、より良く健康管理を行っている。むしろエストロゲンよりも、これらの違いにより心臓病の危険性が低下しているかもしれない。
【0018】
現在疾患を持たない閉経後の女性においては、エストロゲン代替療法は、データの重要性、一貫性、生物学的信用性を考慮した場合、有用な影響を持つように見える。すでに疾患を持つ女性においては、安全性と、心臓血管疾患に対する保護医薬としての外因性エストロゲンの有効性に関し、問題が残っている。
【0019】
エストロゲンと自己免疫性疾患
A.全身性エリテマトーデス(SLE)
エストロゲンが全身エリテマトーデスに関連するという見解が、以下のことから広く知られている:
1.子供を出産した女性は、全身エリテマトーデスを発症する可能性が男性の9倍高い。思春期以前では、女性の発症率は男性の3倍以上であるが、閉経後の女性では、発症率は同世代の男性と同程度である。多くの研究がなされ、これらの性による違いは、おそらくエストロゲンに関係があることが示された(Lahita R.G., 1986: Springer Seminars in Immunopathology 9, 305−314; Krammer, G.M. and Tsokos, G.C. , 1998 Clinical Immunology and Immunopathology 89: 192−195; Rider at al., 1998 Clinical Immunology and Immunopathology 89: 171−180)。
【0020】
SLEでのエストロゲンの役割の糸口は、経口避妊薬がこの病状に不利な影響を及ぼすと結論した研究から得られた(Buton, J.P., 1996 Ann. Med. Interne, 147:259−264; Julkunen, 1991: Scan. J. Rheumatol. 20:427−433)。
【0021】
2.SLEとともにKlinefelter症候群(XXY)を有する患者が報告された(Stern et al., 1977: Arthritis and Rheumatism 20:18−22)。
【0022】
3.SLE患者は、抗エストロゲン抗体を有する(Feldman, 1987: Biochem. Biophys. Acta, 145:1342−1348: Bucala et al., 1987: Clin. Exp. Immunol. 67:167−175)。
【0023】
過去には、経口避妊薬がSLEを突発的に引き起こすとされており、低量の服用はSLE患者にとって安全であるという現在の考えに至るまで、SLEの女性において経口避妊薬の使用は賛同されていなかった(Julkunen HA Scand J Rheumatol 1991;20(6):427−33)。また同様に、ホルモン代替療法もSLE患者にとって安全であると考えられている(Mok et al., Scand J Rheumatol 1998;27(5):342−6: Kreidstein et al., 1997, J Rheumatol 1997 Nov;24(11):2149−52)。
【0024】
4.エストロゲンアンタゴニストであるタモキシフェンは、疾患の進行を改善するようである(Sthoeger, 1997, Ann N Y Acad Sci 1997 Apr 5;815:367−8: Sthoeger, 1994, J Rheumatol 1994 Dec;21(12):2231−8)。
【0025】
B.エストロゲン、リウマチ関節炎(RA)及び骨関節炎
慢性関節リウマチにおけるエストロゲンに関連する文献は、骨関節炎に比べて明らかでない。疫学研究においては、経口避妊薬はRAの発病を遅らせるが、エストロゲン単独ではRAの症状を軽減することがないことから、RAが女性ホルモンにより影響を受けることを示唆している(Bijlsma Am J Reprod Immunol 1992 Oct−Dec;28(3−4):231−4)。エストロゲン補助剤の処方は、RAをもつ閉経後の女性の骨密度を増大し、しばしばRAと併発することのある骨粗鬆症に対して保護となるかもしれない(van den Brink: Ann Rheum Dis 1993 Apr;52(4):302−5)。上述の研究ではエストロゲンがRAの症状を軽減しないことが示され、他の研究ではエストロゲン補助剤療法でさえも症状を改善しないと結論づけた。エストロゲン受容体において、RA発病の歳と関連すると考えられる1つの多型が報告された(Ushiyama Ann Rheum Dis 1999 Jan;58(1):7−10)。
【0026】
一方で骨関節炎は、エストロゲン置換療法(ERT)を受けている閉経後の女性では起こりにくいということは(Felson Curr Opin Rheumatol 1998 May;10(3):269−72)、ERTが骨関節炎の防止に有益であるかもしれないことを提案している。
【0027】
C.エストロゲンと骨粗鬆症
骨粗鬆症は、骨がもろくなり、骨折の危険に至る骨の病気である。骨粗鬆症を有する閉経期後の女性の治療は、ホルモン、特にエストロゲンの代替を含む。エストロゲンは、骨損失及び骨折の発生を減少する(Weiss et al., N Engl J Med 1980 Nov 20;303(21):1195−8 :Paganini−Hill et al., Ann Intern Med 1981 Jul;95(1):28−31: Ettinger et al., Ann Intern Med 1985 Mar;102(3):319−24)。
【0028】
さらに、エストロゲン受容体における多型は、ヒトとマウスの両方において骨損失と関係していた.( Kobayashi J Bone Miner Res 1996 Mar;11(3):306−11 : Kurabayashi Am J Obstet Gynecol 1999 May;180(5):1115−20; Deng Hum Genet 1998 Nov;103(5):576−85 )。
【0029】
エストロゲンと認識機能
女性は男性と比較してアルツハイマー病になる危険性が高い。いくつかの研究によって、エストロゲンを使用することにより、閉経期後の女性におけるアルツハイマー病の発病率を低下できることが示されている。アルツハイマー病の女性においても、エストロゲンを使用することにより、深刻な症状を抑え、知能の低下を遅らせる。長期間(10年以上)使用している女性においては危険性が最も低い。しかし、短期間使用した女性においても効果は得られた。
【0030】
エストロゲンと乳ガン
乳ガンの発病の主な危険因子は、性、年齢、家族の乳ガン歴、初潮の年齢、最初の妊娠満期産の年齢、及び閉経の年齢である。これらの要因の全て(家族歴を除く)は、エストロゲンの分泌寿命と直接関係していることが示され、ホルモン分泌の増大が乳ガンの危険性の増大と関連している。ガンの危険性の増大は、乳房上皮細胞でのエストロゲン受容体に媒介される増殖的反応に起因すると考えられている。
【0031】
エストロゲン受容体アンタゴニストであるタモキシフェンは、乳ガンの防止と治療の両方に効果を示す医薬となることが示された。免疫組織化学方法を使用することにより、組織に発現するエストロゲン受容体タンパク量によって、胸腫瘍がエストロゲン受容体陽性であるか又は陰性であるかに分類することができる。エストロゲン受容体陽性の腫瘍は、エストロゲン受容体陰性の腫瘍より、タモキシフェンによる治療により好適に応答する。閉経前の女性は、閉経後の女性より、エストロゲン受容体陰性の乳ガンを発症することが多い。
【0032】
エストロゲン受容体の構造と機能の突然変異は、初期の胸腫瘍又は乳ガン細胞系において説明されている。しかしながら、これらの変化が一次的(及び発ガンに至る過程に関する)か、二次的(及びガン組織中の遺伝子の不安定性の結果)かどうかは明らかでない。さらに、これらの身体の突然変異に加えて、いくつかの研究で、遺伝DNA配列の変化と乳ガンの発達との関係の可能性を指摘しているが、これらについても議論の余地がある。
【0033】
そしてさらに、最近、乳ガンにおけるエストロゲン受容体の役割を示す証拠として、乳ガンの発達の素因を作る変異体で遺伝する遺伝子BRCA1が、エストロゲン受容体の信号を抑制することが発見された。
【0034】
エストロゲンと子宮内膜ガン
子宮内膜ガンは女性における最も一般的な骨盤の悪性腫瘍であるが、約75%は診断の時点で子宮内に確認されるので、通常は子宮摘出によって治癒することができる。子宮内膜細胞をエストロゲンへ無抵抗に暴露すると、子宮ガン細胞への発達の機会を劇的に増大するため、エストロゲン単独のホルモン代替療法を無傷の子宮を有する女性に行ってはならない。プロゲステロンの周期的又は連続的投与は、子宮内膜細胞の過度の増殖防止に役立ち、またホルモン代替治療法の一部としてエストロゲンを処方されている閉経後の女性において、子宮内膜ガンの危険性を減らす。
【0035】
子宮内膜ガンの多くの場合では、エストロゲン受容体が発現しており、一般的には、エストロゲン応答性の腫瘍は好適に予測することできる。後天的な(身体の)突然変異は、最大8.5%であるとされているが、子宮内膜ガンの発達、進行における突然変異の役割は、現在はっきりしていない。
【0036】
いくぶん議論の余地があるとは言え、研究により、タモキシフェンの使用が子宮内膜ガンに発展する機会を増大していることが示唆されている。これは、エストロゲン受容体封鎖の役割に加えて、タモキシフェンが部分的な受容体アゴニスト活性を有し、子宮内膜増殖を誘発するエストロゲン応答性遺伝子を低級誘発していることを示す。
【0037】
種々の疾患の媒介/変調におけるエストロゲン受容体の発展を得て、エストロゲン受容体中の配列多型を特定し、疾患の状態、治療効果等と関連づけることが重要である。本発明は、従来未知であった種々のESR−アルファタンパクの多型を提供することにより、これらの技術を進歩させるものである。
【0038】
SNP
全生物のゲノムは、進化過程において自然発生的な突然変異を受け、祖先配列の変異形態を生成する(Gusella, Ann. Rev. Biochem. 55, 831−854 (1986))。変異形態は祖先形態と比べ、進化の点で好都合又は不都合であるかもしれず、あるいは関係ないかもしれない。例えば、変異体が致命的な不都合を受けた場合は、後の世代には伝えられない。他方、変異形態が種の進化にとって好都合であった場合には、その種の多く又はほとんどのDNAに組み込まれ、効果的に先祖形態となる。さらに変異形態の影響は、状況によって、有益、有害の両方でありうる。例えば、異型接合鎌状赤血球突然変異はマラリアに対しての抵抗を持つが、同型接合鎌状赤血球突然変異は通常致命的である。多くの例では、先祖形態と変異形態は、種の中で共存している。配列の複数形態の共存は、SNP等の多型を引き起こす。
【0039】
参照対立遺伝子形態は任意に示されて、例えば最も多い形態又は最初に特定される対立遺伝子形態であり、他方の対立遺伝子形態は、選択的、変異、多型対立遺伝子として示される。選ばれた集団の中で最も頻繁に起こる対立遺伝子形態は、「野生型」形態と呼ばれている。
【0040】
ヒトゲノムの多型のうち約90%が単一ヌクレオチド多型(SNP)である。SNPの位置又は部位は、通常、高度に保護された対立遺伝子(個体数の1/100又は1/1000以下が変化する配列)に従う。個体のそれぞれのSNP位置での対立遺伝子は同型接合又は異型接合であるかもしれない。本発明で確認されたように、SNP位置での最小頻度の対立遺伝子は、より高頻度の対立遺伝子より少なく1%以下の頻度である。いくつかの例において、SNPは、SNPを含むヌクレオチド配列がアミノ酸コード化配列であることを意味する「cSNP」とされる。
【0041】
SNPは、多型部位の一つのヌクレオチドが他のものに置換されることによって起こる。置換は転移又は転換により起こる。転移とはプリンヌクレオチドが他のプリンヌクレオチドに、又はピリミジンヌクレオチドが他のピリミジンヌクレオチドに換わることである。転換とはプリンがピリミジンに換わること、又はその逆である。またSNPは、1つの塩基が挿入又は削除された変異形態(indelと呼ばれる)であるかもしれない。コドンコーディングにおいてアミノ酸を他のアミノ酸とする置換は、非同義コドン変異又はミスセンス突然変異と呼ばれる。同義コドン変異又はサイレント突然変異は、遺伝コードの縮重のためアミノ酸の変異を生じない。ナンセンス突然変異は、終止コドンを形成する非同義コドン変異であり、ポリペプチド鎖の早期終結、及び不完全なタンパクを導く。
【0042】
SNPは、原則的には、bi−、tri−、tetra−の対立遺伝子となることができる。しかしながら、tri−、tetra−は極めて珍しく、ほとんど存在しない(Brookes, Gene 234 (1999) 177−186)。このため、SNPはしばしば、「bi−対立遺伝子マーカー」又は 「di−対立遺伝子マーカー」と呼ばれる。
【0043】
原因SNPは、遺伝子発現、又は遺伝子生成物の機能発現の変化を生じるSNPであり、ほとんどの場合で臨床表現型の予測が可能である。これらは、ポリペプチド生成物をコード化する遺伝子領域に入るSNP、すなわちcSNPを含んでいる。これらのSNPは、ポリペプチド生成物のアミノ酸配列の変更(すなわち非同義コドン変異)を生じ、欠損、又は他の変異タンパクの発現を引き起こすかもしれない。さらに、ナンセンス突然変異の場合には、SNPはポリペプチド生成物の早期終結に至るかもしれない。このような変異生成物は、疾患状態、例えば遺伝子病を生じる可能性がある。コード化配列内に多型を有する遺伝子の例は、鎌状赤血球貧血と嚢胞性線維症を含む遺伝病を引き起こす。原因SNPは、必ずしもコード領域で起こる必要があるわけでなく、核酸によってコード化されるタンパクの発現及び/又は活動に最終的に影響する何れの領域でも起こりうる。これらの遺伝子領域には、プロモーター領域のSNP等の転写に関する遺伝子領域;欠損プライシングを引き起こすイントロン−エクソン境界のSNP、又はポリアデニル化信号領域等の信号配列を処理するmRNA中のSNP等の転写過程に関連する遺伝子領域が含まれている。例えば、SNPはイントロンのスプライシングを抑制し、早期終止コドンを含むmRNAを引き起こし、欠損タンパクに至るかもしれない。したがって、調節領域のSNPは発現に大きく影響を与えることとなる。
【0044】
原因SNPではないいくつかのSNPは、それでも疾患を引き起こす配列と密接に関連し、分離される。この場合、SNPの存在は疾患の存在又はかかりやすさと相関している。これらのSNPは、診断学や疾患へのかかりやすさのスクリーニングに非常に有用である。
【0045】
臨床試験では、患者の医薬での治療に対する反応がしばしば異質であることが示されている。したがって、医薬の設計及び治療の向上が必要であるといえる。SNPは、患者の治療に最も適した特定の医薬を決定するために用いることができる(これは、しばしば「薬理ゲノミクス」と呼ばれる)。薬理ゲノミクスは薬学研究における医薬の選択プロセスにも用いることができる。(Linder et al. (1997), Clinical Chemistry, 43, 254; Marshall (1997), Nature Biotechnology, 15, 1249; International Patent Application WO 97/40462, Spectra Biomedical; and Schafer et al. (1998), Nature Biotechnology, 16, 3.)
【0046】
集団研究
集団遺伝学とは、メンデルの法則や他の遺伝原理が、どのように集団全体において適用されるかという研究である。このような研究は進化を適切に理解するために必要不可欠である。なぜなら、基本的に進化とは集団の遺伝子構成の革新的な変化の結果生じるものであるからである。従って、集団遺伝学により、分離、組換え、及び突然変異等の遺伝現象の影響を理解及び予測することが努められ、同時に、母集団の大きさ、交接パターン、個人の地理的分布、移住、及び自然淘汰等の生態学的及び進化的因子が考慮されなければならない。
【0047】
理想的には、集団遺伝子の構成がどのようにしてなるかを解明し、自然淘汰又は人工的な選別の結果生じる集団の変化を予測するため、どのように集団遺伝子のタイプと頻度を論じるかを理解することが望まれる。
【0048】
それらの多くの問題を説明するためには、遺伝子座間に存在する関係(連鎖)を理解することが重要である。
【0049】
連鎖は、遺伝子座が同一染色体上の近接位置にあるので、2つ以上の非対立性遺伝子の共遺伝であり、減数分裂後も、非連鎖遺伝子と予測される50%以上が関連している。減数分裂中に物理的な交差があり、生殖細胞生成中に個々の染色分体間で、母方、父方の遺伝寄与の物理的な交換が起こっていることは明らかである。この交換により、必然的にそれぞれの親と隣接していた染色体領域の遺伝子が分離され、残った配列と混合した結果、「組換え」が生じる。減数分裂の交差による組換えの生成工程は、遺伝特性の再配列において重要な特徴であり、遺伝子伝達の理解の中核をなしている。
【0050】
組換えは、一般的にDNAの大きなセグメント間で起こる。これはDNAの隣接範囲と遺伝子とが連動していることを意味している。逆に、与えられた染色体上で互いに遠く離れたDNA領域は、交差の過程においても離れているようである。
【0051】
減数分裂間に起こる組換え現象を明らかにするために、分子マーカーを用いることができる。異なる長さの(CA)の繰り返しであるいくつかのマーカーは、ヒトDNAの至る所に存在し、それらの長さにはわずかな選択圧力があり、位置マーカーと、染色体にそった位置確認特性として用いられる。これらのマーカーは、母方由来の遺伝子領域から、父方由来のものを区別するのに用いることができる。
【0052】
他のマーカーは、単一ヌクレオチド多型(SNP)であり、これらはbi−対立遺伝子マーカーであり、これらのマーカーの子孫への伝達についての分析にも用いることができる。
【0053】
染色体に沿った1組のマーカーのパターンは「ハプロタイプ」と呼ばれる。そして、同一の小さな染色体セグメント上の対立遺伝子は、系図を通じてブロックとして伝達されるという傾向がある。ハプロタイプ公知の親の子孫においてハプロタイプを分析することにより、どの染色体中のどの親のセグメントがどの子に伝達されたかを確認することが可能である。組換えによって壊れていない場合、ハプロタイプは、マッピング目的で、単一高度多型遺伝子座の対立遺伝子とみなされうる。
【0054】
連鎖マーカーの特定対立遺伝子と関連する病原性遺伝子が優先的に生成することを「連鎖不平衡」(LD)と呼ぶ。この種の不平衡は一般的に、ほとんどの病原性染色体が同一の突然変異を伝えること、及びテストされたマーカーが病原性遺伝子に非常に近いことを意味している。例えば、HLA遺伝子座全体を通じて多くの連鎖不平衡がある。A3対立遺伝子は、B7、B14対立遺伝子と共にLD中にあり、その結果、B7とB14は血色素沈着症と高い関連性を有する。従って、たとえ他のファミリーメンバーが正式な連鎖分析に利用可能ではなくても、HLA分類は単独で血色素沈着症の危険性の推定を著しく変更できる。結果として、遺伝子推定位置周辺のいくつかのマーカーを組合せて用いることにより、ファミリーに影響する又は影響しないように、ハプロタイプの決定を行うことができる。
【0055】
SNPに基づくアソシエーション解析と連鎖不平衡マッピング
SNPは、特定のSNP、又は例えば乳ガンのような病的状態と関連する他の多型を特定するためのアソシエーション研究に有用である。アソシエーション研究は、一般的な母集団の範囲内で実行されるかもしれず、影響を受けるファミリーの個体に関連して行われる研究(連鎖研究)に限られるものではない。SNPを用いたアソシエーション研究は、重要な障害(例えば乳ガン)を有する多くの患者において、類似した年齢、経歴のコントロール同様に、SNP対立遺伝子の頻度を決定することを含む。患者とコントロールの適切な選択は、SNPアソシエーション研究の成功に重要である。したがって、よく特徴づけられた表現型をもつ個人の集合が、極めて望ましい。例えば、特定のSNP遺伝子型と公知の表現型との間の関連を見つけるために、血圧と心拍数は、これらの生理学上のパラメータが公知である高血圧の人のSNPパターンと相関させることができる。特定のSNP又はSNPハプロタイプと表現型的性質との間の有意の関連は、標準の統計方法によって決定することができる。アソシエーション解析は、直接、またはLDに基づいて行うことができる。直接のアソシエーション解析においては、病原性配列の候補である原因SNPの試験を行う。
【0056】
LDに基づいたSNPアソシエーション解析において、真の病原性配列または病原性SNPにより、LD中のSNPが発見するために、ランダムなSNPが広いゲノム領域(あるいはゲノム全体)で試験される。この研究のためには、アソシエーションを検出するために、その遺伝子座によって連鎖不均衡にあるように、ランダムなSNPが未知の病原性遺伝子座の十分に近くに位置するように、高密度SNPマップが必要である。SNPは高頻度で起こる傾向があって、ゲノムを通じて均一に間隔をおいて配置される。SNPの頻度と均一性は、縦列繰り返し多型のような他のタイプの多型と比較して、病原性の遺伝子位置の近接で見つかる可能性がより高いことを意味する。また、SNPは、VNTR等の縦列繰り返し多型よりも、突然変異的に安定である。LDに基づくアソシエーション研究では、何の遺伝子がどこにあるといった予備知識なしに、病気にかかりやすい遺伝子を発見することが可能である。
【0057】
しかしながら、現在、全てのヒトゲノムにおいて実行可能なSNPアソシエーション研究はなく、乳ガンと関係する候補遺伝子がSNP特定及びアソシエーション解析における対象とされている。候補遺伝子の研究では、直接疾患の発達に影響すると仮定される遺伝子を特定するために、疾患原因についての先見的な知識が用いられる。候補遺伝子の研究では、病気の治療に用いられる薬剤により直接の対象とされる遺伝子に焦点が当てられるかもしれない。乳ガンの感染性の増大に関連するSNPを発見するために、候補遺伝子は疾患経路に生理的に関係するシステムから選ばれる。これらの遺伝子に発見されたSNPは、適切なコントロールと比較して、病気にかかっている個人において、疾患との統計的な関連がテストされる。候補遺伝子の研究は、候補SNPの数と、分類し、広範囲(又は完全なゲノム領域)でのランダムSNPのLDに基づいたアソシエーション研究との比較を行う必要のある個体数とを大幅に減らすことができる長所を持つ。さらに、候補遺伝子研究ではゲノムの特定領域のLD範囲は予測されない。
【0058】
適切に間隔をおいて配置され、十分な情報を有するSNPマーカーの高密度マップの使用と組み合わせて、アソシエーション研究(連鎖不均衡ベースゲノムワイドアソシエーションを含む)により、乳ガン等の複合疾患に関連するほとんどの遺伝子の特定が可能になる。これは特定の疾患と関連する原因SNPを含む候補遺伝子の選択性を向上させる。本発明に開示されている全てのSNPは、ゲノムワイドアソシエーション研究、又は候補遺伝子アソシエーション研究の一部に用いることができる。
【0059】
本発明は、先端技術を進歩させるとともに、エストロゲン受容体遺伝子における従来未知のSNPを提供することにより商業的に有用な例を提供する。
【0060】
発明の概要
本発明は、エストロゲン受容体アルファ遺伝子、エストロゲン受容体遺伝子/タンパクの新規な多型、及び未知のハプロタイプのゲノム構造を定義するヒトの染色体6からのゲノムDNA及びcDNAの配列決定に基づく。このような多型/ハプロタイプは、癌、骨粗鬆症、心血管疾患等へのかかりやすさなどの変異エストロゲン受容体により媒介/変調される様々な病気を導き得る。この配列決定による手法に基づき、本発明はゲノムヌクレオチド配列、cDNA配列、アミノ酸配列、ESR−アルファ遺伝子中の配列多型、これらの多型のハプロタイプ、試料中のこれらの配列/多型を検知する方法、変異エストロゲン受容体により媒介される病気になるか又は進展する危険性を決定する方法、及び変異エストロゲン受容体により媒介される病気を治療するために使用される化合物をスクリーニングする方法を提供する。
【0061】
発明の詳細な説明
一般説明
本発明は、エストロゲン受容体アルファ遺伝子、エストロゲン受容体遺伝子/タンパクの新規な多型、及び未知のハプロタイプのゲノム構造を定義するための、ヒトの染色体6及びcDNAからのゲノムDNAの配列決定に基づく。このような多型/ハプロタイプは、変異エストロゲン受容体により媒介/変調される、癌、骨粗鬆症、心血管疾患へのかかりやすさなどの様々な病気へと導き得る。この配列決定による手法に基づき、本発明はゲノムヌクレオチド配列、cDNA配列、アミノ酸配列、ESR−アルファ遺伝子中の配列多型、これらの多型のハプロタイプ、試料中のこれらの配列/多型を検知する方法、変異エストロゲン受容体により媒介される病気になるか又は進展する危険性を決定する方法、及び変異エストロゲン受容体により媒介される病気を治療するために使用される化合物をスクリーニングする方法を提供する。
【0062】
単離SNP含有核酸分子
本発明は1種以上の本発明が開示するSNPを含む単離核酸分子を提供する。さらに本発明は、変異タンパクをコード化する単離核酸分子を提供する。このような核酸分子は、1種以上の本発明に係るSNPからなるか、実質的にこれらからなるか、又はこれらを含む。核酸分子は追加の核酸残基を有し得る。このような核酸残基は、例えば天然にその核酸分子と連なるものであるか又は異種のヌクレオチド配列である。
【0063】
ここで、「単離」SNP含有核酸分子は本発明のSNPを含むものであり、核酸の天然源に存在する他の核酸から分離されたものである。一般に、ここで使われる単離SNP含有核酸は、SNPのいずれかの側においてフランキングヌクレオチド配列を伴う本発明が開示するSNP位置を1つ以上含む。このフランキング配列は、検知試薬のために使用するならば、好ましくは概ね300塩基まで、100塩基まで、50塩基まで、30塩基まで、15塩基まで、10塩基まで、又は4塩基までを、又は図面に開示されたコーディング変異体を含むタンパクを生成するために使用するならば、全体のタンパクコード化配列の長さを、SNP位置のいずれかの側に有する。重要な点は、核酸は遠隔の、及び重要でないフランキング配列から単離されることであり、そして組換え発現、SNP位置のためのプローブ及びプライマーの調製、及びSNP含有核酸配列に特有な他の使用等の、ここに開示される特有の操作又は使用をし得る適切な長さであることである。
【0064】
さらに、本発明のSNP位置を含むcDNA分子等の「単離」核酸分子は、組換え技術、化学前駆体、又は化学的に合成する場合における他の化学物質により生産する場合には、他の細胞物質、又は培養媒体を実質的に含まないものであり得る。しかしながら、核酸分子は他のコーディング又は調節配列と融合し得、この場合もなお単離したものとみなされる。例えば、ベクターに含まれる組換えDNA分子は単離したものとみなされる。単離DNA分子のさらなる例としては、異型宿主細胞に保持された組換えDNA分子、又は溶液中の精製(部分的に又は実質的な)DNA分子が含まれる。単離RNA分子には、本発明の単離SNP含有DNA分子のin vivo又はin vitroのRNA転写体が含まれる。本発明に係る単離核酸分子には、さらに合成的に生産された分子が含まれる。
【0065】
単離SNP含有核酸分子は、mRNA等のRNA形態、又はDNA形態であり得る。このDNAには、クローニングにより得られるか、化学合成技術により生産されるか、又はこれらの組み合わせにより生産されるcDNA及びゲノムDNAが含まれる。核酸、特にDNAは、二本鎖又は一本鎖であり得る。一本鎖の核酸はコーディング鎖(センス鎖)、又は非コーディング鎖(アンチセンス鎖)であり得る。
【0066】
本発明はさらに、ここに開示される核酸分子にストリンジェント条件下でハイブリダイズした関連核酸分子を提供する。ここで「ストリンジェント条件下でのハイブリダイズ」とは、互いに少なくとも60〜70%の相同性を有するペプチドをコード化するヌクレオチド配列が、一般的には互いにハイブリダイズして残存するようハイブリダイズ及び洗浄を行う条件を意味する。この条件は、少なくとも60%、70%、80%、90%、又はそれ以上が互いに相同である配列が通常なお互いにハイブリダイズしているようなものであり得る。そのようなストリンジェント条件は当業者に知られており、Current Protocols in Molecular Biology, John Wiley & Sons, N.Y.(1989), 6.3.1−6.3.6に記載されている。ストリンジェント条件下でのハイブリダイズの一例は、約45℃において6X塩化ナトリウム/クエン酸ナトリウム(SSC)でハイブリダイズし、続いて50〜65℃において、0.2XSSC、0.1%SDSで1回以上洗浄するという条件である。低いストリンジェントハイブリダイズ条件へ加減する例は、当技術においてよく知られている。
【0067】
具体的な実施例
ペプチド分子
【0068】
本発明はエストロゲン受容体の変異体をコード化する核酸配列を提供する。これらの変異体分子/配列は、ここで本発明のエストロゲン受容体変異体、本発明のエストロゲン受容体タンパク、又は本発明のペプチド/タンパクとして参照される。
【0069】
本発明は、ここに開示されるエストロゲン受容体変異タンパクのアミノ酸配列からなるか、実質的にそれからなるか、又はそれを含む単離エストロゲン受容体タンパク分子を提供する。
【0070】
ここで、タンパク又はペプチドは、それが細胞物質を実質的に含まない、又は化学前駆体や他の化学物質を実質的に含まない場合に、「単離」又は「精製」されたという。本発明のペプチドは均一に、又はある程度の純度に精製され得る。精製のレベルは使用目的に基づく。重要な特徴は、相当量の他成分が存在したとしても、調製物がペプチドの所望の機能を発揮できるということである。
【0071】
ここで、「細胞物質を実質的に含まない」とは、少なくとも約30%(乾燥重量)以下の他のタンパク(即ち汚染タンパク)、20%以下の他のタンパク、10%以下の他のタンパク、又は5%以下の他のタンパクを有するペプチドの調製を含む。ペプチドが組換えにより生産される場合、実質的に培養媒体を含まない、即ち、培養媒体はタンパク調製物の約20%以下である。
【0072】
「化学前駆体又は他の化学物質を実質的に含まない」とは、ペプチドがその合成時に関与する化学前駆体又は他の化学物質から単離される該ペプチドの調製を含む。ある例では、「化学前駆体又は他の化学物質を実質的に含まない」とは、少なくとも約30%(乾燥重量)以下の化学前駆体又は他の化学物質、20%以下の化学前駆体又は他の化学物質、10%以下の化学前駆体又は他の化学物質、又は5%以下の化学前駆体又は他の化学物質を有するエストロゲン受容体タンパクの調製を含む。
【0073】
単離エストロゲン受容体タンパクは、天然にそれを発現する細胞から精製することができ、それを発現するように変異された細胞(組換え体)から精製することができ、又は公知のタンパク合成手法を用いて合成できる。例えば、エストロゲン受容体タンパクをコード化している核酸分子は発現ベクターへクローンされ、該発現ベクターは宿主細胞へ導入され、そしてタンパクが該宿主細胞で発現する。該タンパクはその後、標準のタンパク精製技術を用いて適当な精製過程により細胞から単離され得る。これらの技術の多くは以下に記述される。
【0074】
したがって、本発明は図2に与えられる配列多型を1種以上含む、図1に概括されたアミノ酸配列からなるタンパクを提供する。アミノ酸配列がそのタンパクの最終的なアミノ酸配列である場合、タンパクはそのアミノ酸配列からなる。
【0075】
さらに本発明は、図2に与えられる配列多型を1種以上含む、実質的に図1に概括されるアミノ酸配列からなるタンパクを提供する。アミノ酸配列が、例えば最終タンパク中に付加的アミノ酸残基が少量のみ存在する場合、タンパクは実質的にそのアミノ酸配列からなる。
【0076】
さらに本発明は、図2に与えられる配列多型を1種以上含む、図1のアミノ酸配列を含むタンパクを提供する。このアミノ酸配列が該タンパクの最終的なアミノ酸配列の少なくとも一部分である場合、タンパクはアミノ酸配列を含む。このようにこのタンパクは該ペプチドのみであり得、又は天然にそのタンパクに連なるか又は異型のアミノ酸残基/ペプチド配列であるアミノ酸残基(隣接するコード化配列)等の、追加のアミノ酸配列も持ち得る。このようなタンパクは、数個の追加アミノ酸残基を持ち得、または数百又はそれ以上の追加アミノ酸を含むことができる。これらの各種タンパクを調製/単離する方法を、以下に簡潔に説明する。
【0077】
本発明のエストロゲン受容体タンパクは、異型配列と接合し、キメラ又は融合タンパクを形成し得る。このようなキメラ又は融合タンパクは、実質的にそのエストロゲン受容体タンパクとは相同でないアミノ酸配列を有する異型タンパクへ作用的に結合されたエストロゲン受容体タンパクを含む。「作用的に結合された」とは、エストロゲン受容体タンパクと異型タンパクがフレーム内に融合することを示す。異型タンパクは、エストロゲン受容体タンパクのN末端又はC末端に融合され得る。
【0078】
ここで、融合タンパクはエストロゲン受容体タンパクの活性に本質的に影響しない。例えば、融合タンパクは、酵素融合タンパク、例えばベータガラクトシダーゼ融合体、イーストツーハイブリッドGAL融合体、ポリ−His融合体、MYC標識、HI標識、Ig融合体を含むがこれらに限定されない。このような融合タンパク、特にポリ−His融合体は、組換えエストロゲン受容体タンパクの精製を容易にすることができる。ある宿主細胞(例えば哺乳類の宿主細胞)では、タンパクの発現及び/又は分泌は、異型の信号配列の使用により増加され得る。
【0079】
キメラ又は融合タンパクは、標準の組換えDNA技術により生産され得る。例えば、異なるタンパク配列をコードするDNAフラグメントは、従来技術により互いにフレーム内に括られる。他の例では、融合遺伝子は自動DNAシンセサイザーを含む従来技術により合成され得る。あるいは、二つの連続した遺伝子フラグメントの間の相補的な突出を生じるアンカープライマーを用い、続いてアニール及び再増幅してキメラ遺伝子配列を生成して遺伝子フラグメントのPCR増幅を行うことができる(Ausubel et al.,CurrentProtocols in Molecular Biology,1992を参照)。さらに、融合部分をすでにコード化した多くの発現ベクターが商業的に入手可能である(例えばGSTタンパクが挙げられる)。エストロゲン受容体タンパクをコード化した核酸は、融合部分をエストロゲン受容体タンパクにフレーム内で連結させることで発現ベクター等へクローニングし得る。
【0080】
ポリペプチドは、20天然由来アミノ酸と通常呼ばれる20のアミノ酸以外のアミノ酸をしばしば含む。さらに、末端アミノ酸を含む多くのアミノ酸は、天然の過程、加工や翻訳後修飾、又は従来技術としてよく知られている化学修飾技術により修飾される。ポリペプチドに天然に起こる典型的な修飾は基本書、詳細な専攻論文、及び研究文献に記述されており、当業者によく知られている。したがって、このポリペプチドは、置換アミノ酸残基が遺伝子コードによりコード化されたものではない誘導体又は類似体;置換基が含まれる誘導体又は類似体;成熟ポリペプチドが、ポリペプチドの半寿命を増加する化合物等の、他の化合物(例えばポリエチレングリコール)と融合した誘導体又は類似体;リーダー又は分泌性の配列、又は成熟トランスポーターペプチドまたはプロタンパク精製のための配列等の付加的なアミノ酸が成熟トランスポーターペプチドに融合した誘導体又は類似体をふくむ。
【0081】
知られている修飾は、アセチル化、アシル化、ADPリボシル化、フラビンの共有結合、ヘム半部の共有結合、ヌクレオチド又はヌクレオチド誘導体の共有結合、脂質又は脂質誘導体の共有結合、ホスホチジリノシトールの共有結合、架橋、環化、ジスルフィド結合形成、ジメチル化、共有結合架橋の形成、シスチンの形成、ピログルタミンの形成、ホルミル化、ガンマカルボキシル化、グリコシル化、GPIアンカー形成、水和化、ヨード化、メチル化、ミリストイル化、酸化、タンパク分解加工、ホスホリル化、プレニル化、ラセミ化、セレノイル化、硫酸化、アルギニル化等のアミノ酸のタンパクへの転移RNA媒介付加、及びユビキチン化を含むがこれに限定されない。
【0082】
このような修飾は当業者によく知られており、科学文献に大いに詳細に記述されている。いくつかの汎用されている修飾として、例えばグリコシル化、脂質結合、硫酸化、グルタミン酸残基のガンマカルボキシル化、水和化、及びADPリボシル化はほとんどの基本書に記述されている。このような基本書としては、Proteins−Structure AND Molecular Properties, 2ndEd.,T.E.Creighton, W.H.Freeman AND Company, NewYork(1993)が挙げられる。この主題についての多くの詳細な論評が入手でき、例えば Wold, F., Posttranslational Covalent Modification of Proteins, B.C. Johnston, Ed., Academic Press, New York 1−12(1983);Seifter et al.(Meth. Enzymol. 182:626−646(1990)) AND Rattan et al.(Ann. N.Y. Acad. Sci. 663:48−62(1992))が挙げられる。
【0083】
さらに本発明は、本発明のエストロゲン受容体タンパクのフラグメント、加えてこれらのフラグメントを含む及びフラグメントからなるタンパク及びペプチドを提供する。しかしながら、本発明のフラグメントは、本発明に先立ち公開されたフラグメントを含まない。
【0084】
ここで、フラグメントはエストロゲン受容体タンパク由来の隣接する8個以上のアミノ酸残基を含む。該フラグメントはエストロゲン受容体タンパクの1種以上の生物学的活性を保持する能力に基づき選択することができ、あるいは機能(例えば免疫抗原としての作用)を果たし得る能力のために選択することができる。特に重要なフラグメントは生物学的に活性なフラグメント、ペプチドであり、これらは例えば長さにして約8個以上のアミノ酸であり、変異アミノ酸残基(図2)を含む。このようなフラグメントは通常、本発明のエストロゲン受容体タンパクのドメイン又はモチーフ、例えば活性サイト、リガンド結合ドメイン、又はDNA結合ドメインを含む。さらに可能なフラグメントとしては、ドメイン又はモチーフを含有するフラグメント、溶解性ペプチドフラグメント、及び免疫原性構造を含有するフラグメントがあるがこれに限定されない。予測されるドメイン及び機能性サイトは、当業者に公知で直ちに入手可能なコンピュータプログラム(例えばPROSITE分析)により直ちに特定し得る。
【0085】
タンパク/ペプチドの使用
本発明のタンパクは、抗体を増加し又は他の免疫反応を誘発するため;生物的液体中のタンパク(又はその結合相手又は受容体)のレベルを定量的に決定するために設計されたアッセイにおける試薬(ラベル試薬を含む)として;対応するタンパクが優先的に発現する組織(形成的に、又は組織分化又は発達の特別な段階での、又は病気の状態における)のマーカーとして;ハイスループットのスクリーニングのための多数のタンパクパネルを含む、タンパクの生物活性を決定するため;のアッセイに使用できる。いずれかの又は全てのこれらの研究用途は、研究用製品としての商用化のための試薬グレード又はキットフォーマットへと発展させることができる。上記の使用を達成するための方法は、当業者に公知である。このような方法を開示する文献には、「Molecular Cloning:A Laboratory Manual」,2d ed., Cold Spring Harbor Laboratory Press, Sambrook, J., E.F.Fritsch AND T.Maniatis eds., 1989,及び「Methods in Enzymology:Guide to Molecular Cloning Techniques」, Academic Press, Berger,S.L. AND A.R.Kimmels eds., 1987が含まれる。
【0086】
本発明のエストロゲン受容体タンパクは生物学的アッセイに有用である。該アッセイは、公知のエストロゲン受容体の機能又は活性、あるいはエストロゲン受容体に関連した状態の診断及び治療に有用な性質をも伴う。
【0087】
本発明のエストロゲン受容体タンパクは、細胞系又は無細胞系のシステムでの薬剤スクリーニングアッセイにも有用である。細胞系のシステムは、ネイティブ、即ち通常該受容体タンパクを発現する細胞でもよく、生検としてでもよく、又は細胞培養へ拡張し得る。しかしながら、ある例において細胞系のアッセイは、受容体タンパクを発現する組換え宿主細胞を含む。
【0088】
本発明のエストロゲン受容体タンパクは、受容体の活性を変調する化合物を特定するために使用することができる。本発明のエストロゲン受容体タンパク及び適当なフラグメントの双方は、受容体の活性を結合及び/又は変調するための能力についての候補化合物を検査するためのハイスループットのスクリーンとして使用できる。これらの化合物は、化合物の受容体活性に対する効果を決定するために、機能性受容体に対してさらにスクリーンすることができる。さらに、これらの化合物は、活性/効果を決定するために動物又は無脊椎動物のシステムでテストすることができる。受容体を所望の程度に活性化し(アゴニスト)、又は不活性化する(アンタゴニスト)化合物が特定される。このような化合物は、本発明の変異エストロゲン受容体タンパクの1種以上に作用する能力により選択される。
【0089】
さらに受容体ポリペプチドは、受容体タンパクと、通常受容体タンパク(例えばエストロゲン)と相互作用する対象分子との間の相互作用を刺激又は阻害する能力により化合物をスクリーンするために使用することができる。該対象は、受容体タンパクが通常相互作用するリガンド又は結合相手(例えばエストロゲンリガンド又はDNA配列)であり得る。このようなアッセイは通常、受容体タンパク又はフラグメントが該対象分子と相互作用する条件下で、受容体タンパクを候補化合物と結合させ、そしてタンパクと対象との間の複合体生成を検知するか、又はタンパクと対象との間の相互作用の生物学的結果を検知するステップを含む。
【0090】
候補化合物としては、例えば次のものを含む。1)Ig−テール融合ペプチド、及びランダムペプチドライブラリーのメンバー(例えばLam et al.,Nature354:82−84(1991);Houghten et al.,Nature354:84−86(1991)を参照)及び、D型及び/又はL型アミノ酸から作られる化学誘導分子ライブラリーのメンバーを含む可溶性ペプチド等のペプチド;2)ホスホペプチド(例えばホスホペプチドライブラリーのランダム及び部分的に縮退したメンバー(例えばSongyang et al.,Cell 72:767−778(1993)を参照);3)抗体(例えば、Fab,F(ab‘)2、Fab発現ライブラリーフラグメント、抗体のエピトープ結合フラグメントだけでなく、ポリクロナール、モノクロナール、ヒューマナイズド、抗イディオティピック、キメラ、及び単一鎖抗体);4)小型の有機、無機分子(例えばコンビナトリアル及び天然生産物ライブラリーから得られる分子)
【0091】
ある候補化合物としては、リガンド結合と競合する受容体の可溶性フラグメントが挙げられる。他の候補化合物としては、変異受容体、又は受容体機能に影響を及ぼす変異を含む適切なフラグメントがあり、このためにリガンドとの競合が起こる。したがって、例えば高い親和性でリガンドと競合するフラグメント、又はリガンドと結合して離れないフラグメントが本発明に含まれる。
【0092】
本発明はさらに、受容体の活性を変調(刺激又は阻害)する化合物を特定するための末端アッセイを含む。このアッセイは通常、受容体活性を表す信号伝達経路における挙動のアッセイを含む。例えば、受容体タンパクに依存する信号カスケードに応答して上下に調整される遺伝子の発現がアッセイできる。ある例において、このような遺伝子の調節領域は、ルシフェラーゼ等の容易に検知できるマーカーへ作用的に結合することができる。あるいは、受容体タンパク又は受容体タンパク対象のホスホリル化も測定できる。受容体により媒介される生物学的又は生化学的機能の何れもが末端アッセイとして使用できる。これらは、ここに記述された、引用文献における、これらの末端アッセイ対象の文献により取り入れた、全ての生化学的又は生化学/生物学的現象、及び当業者に公知の他の機能を含む。
【0093】
受容体ポリペプチドは、受容体と相互作用する化合物を発見するために設計された方法における競合結合アッセイとしても有用である。化合物は該化合物がポリペプチドと結合又は他の相互作用をする条件下で受容体ポリペプチドにさらされる。受容体へのリガンドもその混合物へ加えられる。テスト化合物が受容体又はリガンドと相互作用する場合、形成される複合体の量又は受容体対象からの活性を減少させる。このタイプのアッセイは、受容体の特別な領域と相互作用する化合物を探す場合に特に有用である。
【0094】
無細胞の薬剤スクリーニングアッセイを行うには、アッセイの自動化の便宜を図ると同時に、一方又は両方のタンパクの非複合体型からの、複合体の分離を容易にするため、受容体タンパク、フラグメント、又はその対象分子を固定化することが望ましいこともある。
【0095】
マトリックスにタンパクを固定化する技術が薬剤スクリーニングアッセイに使用できる。ある例において、タンパクがマトリックスへ結合されるドメインを加えた融合タンパクが提供される。例えば、グルタチオン−S−トランスフェラーゼ/15625融合タンパクは、グルタチオンセファローゼビーズ(Sigma Chemical, St.Louis, MO)又はグルタチオン誘導体化マイクロタイタープレートに吸着され得る。これはその後、細胞溶菌液(例えば35Sでラベルした)及び候補化合物と結合され、この混合物は複合体形成へと導く条件下(例えば塩とpHの生理学的条件)で培養される。培養に続き、未結合のラベルを除くためにビーズを洗浄し、マトリックス固定化がなされ、放射性ラベルが直接、又は複合体が解離した後の上澄みで決定される。代わりに、複合体はマトリックスから解離することができ、SDS−PAGEにより分離され、ビーズフラクション中に見いだされる受容体結合タンパクのレベルは標準の電気泳動技術を用いゲルから定量される。例えば、ポリペプチド又はその対象分子は、従来よく知られている技術を用いてビオチンとステプタビジンの共役を利用して固定化し得る。代わりに、タンパクと反応性があるがタンパクの対象分子への結合を妨害しない抗体が、プレートのくぼみへ誘導体化され、タンパクは抗体の共役によりくぼみにトラップされる。受容体結合タンパクと候補化合物の調製物は、受容体タンパクが存在するくぼみで培養され、くぼみにトラップされた複合体は定量され得る。このような複合体を検知する方法としては、GST固定化複合体のために上述したものに加えて、対象分子に関連した酵素活性を検知することによる酵素結合アッセイと同様に、受容体タンパク対象分子と反応性の、又は受容体タンパクと反応性であり対象分子と競合する抗体を用いた複合体の免疫検知を含む。
【0096】
本発明のタンパクを変調する試薬は、上記の1種以上のアッセイを単独又は組み合わせて用いることにより特定できる。細胞系又は無細胞系のシステムを初めに使用し、その後動物又は他のモデルシステムで活性を確認するのが一般的には好ましい。このようなモデルシステムは従来よく知られており、この状況において直ちに用いることができる。これらの薬剤スクリーニングアッセイにより特定される受容体タンパクの変調剤は、エストロゲン受容体タンパクを発現する細胞を治療することにより、受容体経路で媒介される病気をもつ患者の治療に用いることができる。これらの治療方法は、ここに開示されたように医薬組成物中のタンパク活性の変調剤を、治療の必要に応じて患者へ投与するステップを含む。
【0097】
本発明はさらに、上述のスクリーニングアッセイにより特定される新規な試薬に属する。したがって、適当な動物モデルにおいて、ここに開示されたように特定された試薬をさらに使用することは本発明の範囲内に属する。例えば、ここに開示されたように特定された試薬(例えばエストロゲン受容体変調試薬、アンチセンスエストロゲン受容体核酸分子、エストロゲン受容体特異抗体、又はエストロゲン受容体結合相手)が、このような試薬による治療の効率、毒性、副作用を決定するために動物モデルにおいて使用できる。あるいは、ここに開示されたように特定された試薬は、このような試薬の作用のメカニズムを決定するために動物モデルにおいて使用できる。さらに、本発明はここに開示されたような治療のために上述のスクリーニングアッセイにより特定された新規な試薬の使用に関係する。
【0098】
本発明のエストロゲン受容体タンパクは、エストロゲン受容体により媒介される病気又は病気へのかかりやすさを診断するための対象を提供するのにも有用である。したがって、本発明は細胞中、組織中、又は有機体中における、本発明のエストロゲン受容体変異体(又はコード化mRNA)の存在、又はそのレベルを検知するための方法を提供する。この方法は、生物学的試料を、受容体タンパク(又は受容体をコード化する遺伝子、mRNA)と相互作用が可能な化合物に、相互作用が検知されるように接触させることを含む。
【0099】
試料中のタンパクを検知する一つの試薬は、エストロゲン受容体タンパクの変異型に選択的に結合することができる抗体である。このような試料は、患者の体内に存在する組織、細胞、及び生物的液体と同時に、患者から分離された組織、細胞、及び生物的液体を含む。
【0100】
本発明のエストロゲン受容体タンパクは、変異エストロゲン受容体をもつ患者の進行中の病気、病気へのかかりやすさを診断するための対象も提供する。ここでの病気は特に骨成長、細胞分化等のエストロゲン経由のものを含む。例えば、受容体は生物学的試料から単離され、異常型の受容体活性を生じる遺伝子突然変異の存在をアッセイすることができる。これは、アミノ酸置換、削除、挿入、再配列(異常型のスプライシング現象の結果として)、そして図2に与えられる適当な後翻訳修正を含む。分析手法は、変更電気伝導度、変更トリプシン消化、細胞ベース又は無細胞のアッセイにおける変更受容体活性、リガンド又は抗体結合パターンにおける変更、変更等電点、直接アミノ酸配列決定、そしてタンパク中の突然変異を検知するために有用な知られている他のアッセイ技術を含む。特に有用なのは図2に与えられるバリエーションである。
【0101】
ペプチドを検知するためのIn vitroの技術は、酵素免疫測定法(ELISA)、ウエスタンブロット、免疫沈降、及び免疫蛍光を含む。あるいは、ペプチドは、患者にラベルした抗ペプチド抗体を導入することにより、In vivoで患者内に検知できる。例えば、抗体は、患者内におけるその存在と位置が標準のイメージング技術により検知できる放射性マーカーでラベルされ得る。特に有用なのは、患者内で発現する、ここに開示されるエストロゲン受容体の特異なアレル変異体を検知する方法及び、試料中のペプチドのフラグメントを検知する方法である。
【0102】
該ペプチドは、薬理ゲノミクス分析にも有用である。薬理ゲノミクスは、薬剤処理過程の改変及び患者における異常な作用により、薬剤への応答に対し臨床的に有意である遺伝的変異を扱う。例えば、Eichelbaum,M.(Clin.Exp.Pharmacol.Physiol.23(10−11):983−985(1996))や、Linder,M.W.(Clin.Chem.43(2):254−266(1997))を参照。これらの変異の臨床結果は、代謝にかかる個人の変異の結果として、ある個人においては治療薬が激しい毒性となり、またある個人においては薬剤による治療が失敗する。このように、個人の遺伝子型が、治療化合物が体に作用する道筋を、又は体が化合物を代謝する道筋を決定し得るのである。さらに薬剤代謝酵素の活性は、薬剤作用の強さ及び長さの両方に影響を与える。このように、個人の薬理ゲノミクスにより、個人の遺伝子型に基づく予防的又は治療的治療のために、化合物の効果的な化合物及び、効果的な投薬量を選択できる。幾つかの薬剤代謝酵素における遺伝子多型の発見は、標準的な薬剤投与によって、なぜある患者において期待した薬剤効果が得られなかったり、過度の薬剤効果を示したり、又は深刻な毒性を経験するのかを説明する。多型は広い代謝の遺伝子表現型、及び乏しい代謝の遺伝子表現型に表現されうる。したがって、遺伝子多型は受容体タンパクの対立遺伝子タンパク変異を導き、この場合、1つの個体群における1つ以上の受容体の機能が、他の個体群とは異なる。したがって、ペプチドにより対象の治療法に影響を与え得る遺伝子的素質を確かめることができる。例えば、リガンドベースの治療において、多型はアミノ末端の細胞外ドメイン及び/又はリガンド結合が幾らか活性である他のリガンド結合領域を引き起こし、そして受容体の活性化を引き起こす。したがって、リガンドの服用量は当然に、ある多型/ハプロタイプを含む与えられた個体群において治療効果が最大となるように調節される。遺伝子型に代えて、特異的な多型ペプチドが特定し得る。
【0103】
抗体
また、本発明は本発明のエストロゲン受容体タンパクに選択的に結合する抗体、及びそのフラグメントを与える。ここで、抗体は、対象タンパクと結合し、関連しないタンパクとは有意に結合しない場合、選択的にそれと結合する。抗体は、対象タンパクと実質的に相同ではない他のタンパクとも結合する場合であっても、該タンパクが抗体の対象タンパクのフラグメント又はドメインと相同性を有する限り、なお選択的にタンパクと結合するとみなされる。この場合、タンパクに結合している抗体は、ある程度の交差反応性を持つにも関わらず、なお選択的であると理解される。
【0104】
ここで抗体は、当技術において認識されるものと一致する用語で定義される。これらは、抗原の攻撃に反応して哺乳類生物により生産されたマルチサブユニットタンパクである。本発明の抗体は、ポリクロナール抗体及びモノクロナール抗体、そしてFab又はF(ab’)、及びFvフラグメント等の抗体のフラグメントを含むがこれに限定されない。
【0105】
与えられた対象ペプチドに対する抗体を生成及び/又は特定する多くの方法が知られている。該方法の幾つかは、Harlow,Antibodies,Cold Spring Harbor Press,(1989)に記述されている。一般に、抗体を生成するためには、単離ペプチドを免疫原とし、これがラット、ラビット、又はマウス等の哺乳類生物へ投与される。全長タンパク、抗原性ペプチドフラグメント、又は融合タンパクを使用することができる。
【0106】
抗体は、好ましくはエストロゲン受容体タンパクの領域又は離散的なフラグメントから調製される。抗体は、ここに開示されるペプチドのいかなる領域においても調製され得る。しかしながら、好ましい領域は機能/活性、及び/又は受容体/結合相手相互作用を伴う領域を含む。抗原性フラグメントは通常、少なくとも10個の隣接アミノ酸残基を含む。しかしながら、該抗原性ペプチドは少なくとも12、14、20又はそれ以上のアミノ酸残基を含むことができる。このようなフラグメントは、例えば疎水性領域等のタンパクの表面に位置する領域に相当するフラグメント等の、物理的性質により選択され得る。
【0107】
本発明の抗体の検知は、抗体を検知可能な物質へカップリング(即ち、物理的な結合)させることにより容易にすることができる。検知可能な物質の例としては、様々な酵素、補綴基、蛍光物質、発光物質、バイオ発光物質、及び放射性物質が含まれる。適当な酵素の例としては、ホルセラディッシュパーオキシダーゼ、アルカリホスファターゼ、β−ガラクトシダーゼ、又はアセチルコリンエステラーゼが含まれる。適当な補綴基複合体の例としては、ストレプタビジン/ビオチン、及びアビジン/ビオチンが含まれる。適当な蛍光物質の例としては、ウンベリフェロン、フルオレセイン、フルオレセインイソチオシアナーゼ、ローダミン、ジクロロトリアジニルアミンフルオレセイン、塩化ダンシル、又はフィコエリスリンが含まれる。発光物質の例としては、ルミノールが含まれる。発光物質の例としては、ルシフェラーゼ、ルシフェリン、及びアエクオリンが含まれ、適当な放射性物質の例としては、125I、131I、35S、又はHが含まれる。
【0108】
抗体の使用
抗体は、アフィニティークロマトグラフィー又は免疫沈降等の標準的な技術により、本発明のエストロゲン受容体タンパクを単離するために使用することができる。抗体は、細胞及び、宿主細胞で発現し組換え的に生産されたタンパクからの、天然タンパクの精製を容易にすることができる。さらにこの抗体は、生物の様々な組織間における、そして通常の発達過程において、本発明のエストロゲン受容体タンパクの発現パターンを決定するために、細胞又は組織中における該タンパクの存在の検知に有用である。さらにこの抗体は、発現の量及びパターンを評価するために、in situ、in vitro、又は細胞溶解液又は上澄み中におけるタンパクの検知に使用することができる。またこの抗体は、発達中における異常な組織分布又は異常な発現の評価に使用することができる。全長エストロゲン受容体タンパクの循環フラグメントの抗体検知は、代謝回転の特定に使用することができる。
【0109】
さらにこの抗体は、病気の活性段階等の病気状態において、又はタンパクの機能と関連する病気への傾向を持つ個人において、発現の評価に使用することができる(特に骨の成長/形成/劣化を伴う病気)。変調が不適切な組織分布、成長的な発現、タンパクの発現レベル、又は発現/加工された型により引き起こされる場合、抗体は、通常のタンパクに対して調製することができる。変調がタンパクの特異的な突然変異により特徴付けられる場合には、この突然変異タンパクに特異的な抗体は、特異的な突然変異タンパクの存在のアッセイに使用できる。
【0110】
この抗体は、生物の様々な組織中の細胞の、通常及び異常型の遺伝子局在を評価するためにも使用できる。診断的な使用は、遺伝子試験だけでなく、治療法をモニターするためにも適用できる。したがって、治療が終局的に発現レベル、又は異常型配列の存在及び異常型組織分布、又は成長的な発現を直すことを意図している場合には、そのタンパク又は関連するフラグメントに対して向けられた抗体を、治療効率をモニターするために使用することができる。
【0111】
加えて、抗体は薬理ゲノム分析に有用である。例えば、多型タンパクに対して調製された抗体は、修正した治療法が求められる個人を特定するために使用することができる。この抗体は、電気伝導度、等電点、トリプシンペプチド消化、そして従来技術において知られている他の物理的アッセイにより分析される異常型エストロゲン受容体タンパクのための免疫的マーカーとしての診断ツールとしても有用である。
【0112】
この抗体は、タンパク機能の阻害、例えばリガンド等の結合相手へのエストロゲン受容体タンパクの結合の阻害にも有用である。これらの使用は、治療がタンパクの機能の阻害を伴う治療状況にも適用することができる。抗体は、例えば結合を阻害し、これによりタンパクの活性を変調(作用又は拮抗)するために使用することができる。抗体は、機能が要求されるサイトを含む特別なフラグメントに対して、又は細胞又は細胞膜と関連しているそのままのタンパクに対して調製することができる。
【0113】
本発明は、生物学的サンプル中のタンパクの存在を検知するための抗体を使用するためのキットも包含する。このキットは、ラベル化又はラベル可能な抗体等の抗体及び、生物学的サンプル中のエストロゲン受容体タンパクを検知するための化合物又は試薬;該サンプル中のタンパクの量を決定する手段;該サンプル中のエストロゲン受容体タンパクの量を基準と比較する手段;及び使用のための手引きを含むことができる。
【0114】
核酸分子
本発明はさらに、本発明にかかるエストロゲン受容体タンパクをコード化する単離核酸分子を提供する。該核酸分子は、本発明のエストロゲン受容体タンパクの一つをコード化するヌクレオチド配列からなる、本質的に該ヌクレオチド配列からなる、又は該ヌクレオチド配列を含む。
【0115】
ここでいう「単離」核酸分子とは、核酸の天然源に存在する他の核酸から区別されたものである。好ましくは「単離」核酸は、本来核酸が誘導された有機体のゲノムDNA中で核酸にフランキングする配列(すなわち、核酸の5´又は3´末端に位置する配列)がない。しかしながら、いくらかフランキングするヌクレオチド配列を含むことができ、その例としては約5KB,4KB,3KB,2KB,又は1KB以下であり、特に連続的にペプチドをコード化する配列及び同一遺伝子内でペプチドをコード化する配列であるが、ゲノム配列のイントロンから離れた配列である。重要な点は、核酸が離れた重要でない隣接配列から単離されたことであり、ここで述べる組換えの発現、プローブ及びプライマーの調製、及び核酸配列に特異的な他の用途等の特殊な操作の対象となるということである。
【0116】
さらに、cDNA分子等の「単離」核酸分子は、他の細胞材料、又は組換え技術で製造された場合には培地、化学合成された場合には化学前駆体又は他の化学物質を実質的に含まない。しかしながら、核酸分子は他のコード化又は調節配列と融合することができ、これも単離したと考えられる。
【0117】
例えば、ベクターに含まれる組換えDNA分子は単離されていると考えられる。単離DNA分子のさらなる例としては、非相同な宿主細胞中に維持された組換えDNA分子、または溶液中の精製(部分的に又は実質的に)されたDNA分子があげられる。単離RNA分子は、in vivo、又はin vitroでの本発明の単離DNA分子のRNA転写を含む。さらに本発明にかかる単離核酸分子は合成的に製造された分子を含む。
【0118】
従って、本発明は、図1に示されるヌクレオチド配列よりなる、図2に提供される一つ以上の配列多型を含む核酸分子を提供する。ヌクレオチド配列が核酸分子の完全なヌクレオチド配列であるので、核酸分子はヌクレオチド配列からなっている。
【0119】
本発明はさらに、図1に示されたヌクレオチド配列より実質的になる、図2に提供される1つ以上の配列多型を含む核酸分子を提供する。核酸分子は実質的に、最終的な核酸分子中に幾つかの付加的核酸残基が存在するヌクレオチド配列よりなる。
【0120】
本発明はさらに、図1のヌクレオチド配列を含む、図2に提供される1つ以上の配列多型を含む核酸分子を提供する。核酸分子は、該ヌクレオチド配列が核酸分子の最終的なヌクレオチド配列の一部である核酸配列の場合、該ヌクレオチド配列を含む。このように、核酸分子はヌクレオチド配列のみ、又は付加的核酸残基を有することができ、核酸残基はヌクレオチド配列又は非相同性ヌクレオチド配列と自然に関連したものである。このような核酸分子はわずかな付加的ヌクレオチドを有する、又は数百又はそれ以上の付加的ヌクレオチドを含む。これら様々なタイプの核酸分子がどのようにして作られ/単離されたかの簡単な説明を以下に提供する。
【0121】
単離核酸分子は、成熟タンパクと付加的アミノ酸又はカルボキシル末端アミノ酸、又は成熟ペプチド内のアミノ酸(例えば成熟形態が1つ以上のペプチド鎖を有する場合)をコード化することがある。このような配列はタンパクが前駆体から成熟体へ成長する際、タンパク搬送の促進、タンパク半減期の延長又は短縮、又はアッセイ又は製造時のタンパク操作の効率化、又は他の事由に役割を果たす。一般にin situの場合、付加的アミノ酸は細胞酵素により成熟タンパクから切り離される。
【0122】
上記のように、単離核酸分子は、エストロゲン受容体タンパクのみをコード化する配列、主又は副配列(例えばpre−pro 又はpro−タンパク配列)等の、成熟ペプチド及び付加的コード配列をコード化する配列、付加的コード配列を有し又は有さない成熟ペプチドをコード化する配列、プロモーターなどのゲノム調節配列に加えて、例えばイントロン及び非コード化5´及び3´配列等の転写はされるが翻訳はされず、転写、mRNA処理(スプライシング及びポリアデニル化信号を含む)、リボゾーム結合及びmRNAの安定化に役割を果たす付加的非コード配列を含むが、これに制限されない。さらに、核酸分子は、例えば精製に有用なペプチドなどをコード化するマーカー配列に融合されたものでもよい。
【0123】
単離核酸分子は、mRNA等のRNA形態、又はcDNA及びクローニング又は化学合成技術、又はこれらの組み合わせで得られたゲノムDNAを含むDNA形態でありえる。核酸、特にDNAは二重鎖又は一重鎖である。一重鎖はコード鎖(センス鎖)又は非コード鎖(アンチセンス鎖)でありえる。
【0124】
フラグメントは、12又はそれ以上のヌクレオチドの連続的ヌクレオチド配列を含む。さらにフラグメントは、少なくとも30,40,50,100,250,又は500のヌクレオチド長であることができる。フラグメントの長さは使用目的に依存する。例えば、フラグメントはペプチドのエピトープ挙動部分をコード化し、又はDNAプローブ又はプライマーとして有用である。このようなフラグメントは、オリゴヌクレオチドプローブを合成する公知のヌクレオチド配列を用い、単離することができる。標識されたプローブは、コード部分に対応する核酸を単離するため、cDNAライブラリー、ゲノムDNAライブラリー又はmRNAをスクリーニングするために用いることができる。さらに、プライマーは、遺伝子の特定部分をクローンするためPCR反応を用いることができる。
【0125】
プローブ/プライマーは、典型的には実質的に精製されたオリゴヌクレオチド又はオリゴヌクレオチド対を含む。オリゴヌクレオチドは典型的には、少なくとも約12,20,25,40,50又はそれ以上の連続的なヌクレオチドとなるように、ストリンジェント条件下でハイブリダイズするヌクレオチド配列部分を含む。
【0126】
ここで「ストリンジェント条件下でのハイブリダイズ」とは、典型的には相互にハイブリダイズして残存し、ペプチドをコード化するヌクレオチド配列が互いに少なくとも50−55%の相同性を有するまでハイブリダイズ及び洗浄を行うことを意味する。前記条件は、典型的には相互にハイブリダイズして残存し、互いに配列が少なくとも約65%、少なくとも約70%、又は少なくとも約75%以上相同性を有する。このようなストリンジェント条件は、当業者に公知であり、Current Protocols in Molecular Biology,John Wiley & Sons, N.Y.(1989),6.3.1−6.3.6に記載されている。ストリンジェントハイブリダイズ条件の一例は、6X 塩化ナトリウム/クエン酸ナトリウム(SSC)、約45℃でハイブリダイズし、0.2×SSC、0.1%SDS 50−65℃で1回以上洗浄するという条件である。
【0127】
核酸分子の利用
本発明の核酸分子はプローブ、プライマー、化学的中間体、および生物学的アッセイに有用である。プローブは図2に示した1つ以上の配列多型を含む、図1のヌクレオチド配列よりなる核酸分子の全長にわたっていずれかの配列にかかるものでありえる。従って、それは5´非コード化部分、コード化部分、及び3´非コード化部分から誘導できる。しかしながら、前述したように、フラグメントは、本発明以前に公開されたフラグメントを含むものではない。
【0128】
核酸分子は、PCRによる核酸分子のいずれかの与えられた部分の増幅に有用であり、また、望ましい長さ及び配列の反増感分子の合成に有用である。
【0129】
核酸分子はまた、組換ベクターを構成するのにも有用である。このようなベクターはペプチド配列の一部分又はすべてを発現する発現ベクターを含む。ベクターは挿入ベクターを含み、他の核酸分子配列に融合して使用され、例えば細胞ゲノム中に、遺伝子及び/又は遺伝子生成物の発現状態を変えるために用いられる。例えば、内生コード化配列を、そのすべて又はその一部について1以上の特に変異を引き起こすコード化部分に相同的に組換えることができる。
【0130】
核酸分子はまた、タンパクの抗原部分を示すのにも有用である。
核酸分子また、ここに記述された核酸分子から、全長又は一部のmRNAに対応するリボザイムを設計するのに有用である。
核酸分子はまた、核酸分子及びペプチドの一部またはすべてを発現する宿主細胞を構築するのに有用である。
【0131】
核酸分子はまた、前記核酸分子及びペプチドのすべて又は一部を発現する遺伝子組換動物を構築するのに有用である。
核酸分子はまた、ペプチドの一部又は全部を発現するベクターを作るのに有用である。
【0132】
核酸分子はまた、核酸分子の発現の存在、レベル、形態及び分布を決定するハイブリダイズプローブとして有用である。従って、プローブは、細胞、組織及び有機体における特定核酸分子の存在を検知し、又はレベルを決定するために用いられ得る。核酸のレベルはDNA又はRNAで決定される。従って、ここに記述されるペプチドに対応するプローブは、与えられた細胞、組織、又は有機体で、発現及び/又は遺伝子複製数の評価に用いることができる。これらを使用することは、正常状態に比較し、エストロゲン受容タンパクの発現が増加又は減少することに関連した異常の診断に等価である。
【0133】
mRNAの検出のin vitro技術は、ノーザンハイブリダイズ及びin situハイブリダイズを含む。DNA検出のin vitro技術は、サウザンハイブリダイズ及びin situハイブリダイズを含む。
【0134】
プローブは、エストロゲン受容体タンパクを発現する細胞又は組織を特定するための診断検査キットの一部として用いることができ、それは対象からの細胞のサンプル中の受容体コード化核酸、例えばmRNA又はゲノムDNAのレベルを測定すること、又はエストロゲン受容体遺伝子が変異していないかを検出することで行われる。
【0135】
核酸発現アッセイは、エストロゲン受容体核酸発現を変調する化合物を特定するスクリーニング試薬として有用である。
【0136】
従って本発明により、エストロゲン受容体遺伝子の核酸発現に関連した異常を処置するために用い得る化合物の特定のための方法が提供される。この方法は、典型的にはエストロゲン受容体核酸の発現を変調する化合物の能力をアッセイし、望ましくないエストロゲン受容体核酸発現により特徴づけられる異常の処置にその物質が使用し得るかを判定する。これらのアッセイは細胞ベース系及び細胞フリー系で行うことができる。細胞ベースのアッセイは、エストロゲン受容体核酸を自然に発現している細胞、又は特定の核酸配列を発現するように遺伝的に設計された組換え細胞を含む。
【0137】
エストロゲン受容体核酸発現のアッセイは、mRNAレベルなどの核酸レベルの直接的アッセイ、又は信号経路に関連する二次的な化合物により行われる。さらにエストロゲン受容タンパク信号経路に対する遺伝子発現の上昇又は減少制御がアッセイされる。この具体例では、これらの遺伝子の調節部分はルシフェラーゼのようなレポーター遺伝子と結合されることができる。
【0138】
そして、エストロゲン受容体遺伝子発現の変調剤は、細胞が候補化合物と接触し、mRNAの発現が検出されることで特定される。候補化合物の存在下でのエストロゲン受容体mRNAの発現レベルが、候補化合物不存在下でのエストロゲン受容体mRNAの発現レベルと比較される。候補化合物は、この比較に基づき核酸発現の変調剤として判定され、例えば異常な核酸発現に特徴づけられる異常の処置に使用される。mRNAの発現が候補化合物の存在下で、不存在下に比較して統計的に著しく大きい場合には、その候補化合物は核酸発現の刺激剤として特定される。mRNAの発現が候補化合物の存在下で、不存在下に比較して統計的に著しく小さい場合には、その候補化合物は核酸発現の阻害剤として特定される。
【0139】
本発明は、核酸を対象として、エストロゲン受容体を発現する細胞又は組織にエストロゲン受容体核酸発現の変調を行う遺伝子変調剤とした薬剤スクリーニングを通して特定された化合物を用いた処置方法を提供する。変調は、向上変調(例えば活性化又はアゴニスト化)又は低下調整(抑制又はアンタゴニスト化)の両方の調節、または核酸発現を含む。
【0140】
あるいは、エストロゲン受容体核酸発現の変調剤は、その薬剤又は小分子がそのタンパクが発現している細胞又は組織中でエストロゲン受容体核酸発現を阻害するものである限り、ここに記述されたスクリーニングアッセイを用いて特定された小分子又は薬剤である。
【0141】
核酸分子は、臨床試験又は処理管理において、エストロゲン受容体遺伝子の発現又は活性に対する変調化合物の有効性のモニターに有効である。遺伝子発現パターンは化合物により処理の連続的効果のバロメーターとなり、特に患者が耐性を示す化合物に有効である。遺伝子発現パターンは化合物に影響された細胞の生理的反応を示すマーカーとしてもまた有用である。従って、このようなモニターは化合物の投与量の増加又は患者が耐性を示さない別の化合物の投与を許可する。同様に、核酸発現のレベルが好ましいレベル以下に落ちたら、化合物の投与を比例して減少させることができる。
【0142】
核酸分子はまた、エストロゲン受容体核酸発現の質的変化に対する診断アッセイに有用であり、特に病状に質的変化を導き出す。核酸分子はエストロゲン受容体遺伝子及びmRNAのような遺伝子発現生成物の変異を検出するのに用いることができる。核酸分子はエストロゲン受容体遺伝子中で自然に生じた遺伝子変異を検出するハイブリダイズプローブとして用いることができ、そして変異を有する対象が変異により生じる異常の危険性があるか否かを判定することができる。変異は、遺伝子中の1以上のヌクレオチドの欠如、付加、置換;転置又は転移のような染色体再配置;異常メチル化パターンのようなゲノムDNAの変化、増幅のような遺伝子複写数の変化等を含む。逆機能に関連したエストロゲン受容体遺伝子の変異形態の検出は、活性診断、又は疾患がエストロゲン受容体タンパクの過剰発現、過小発現、又は変異発現の結果である場合には疾患へのかかりやすさの診断方法となる。
【0143】
エストロゲン受容体遺伝子に変異を有する個人は、各種技術により遺伝子レベルで検出することができる。ゲノムDNAは直接に分析し、又は分析に先立ちPCRを用いて増幅することもできる。RNA又はcDNAは同様に用いることができる。ある用途では、変異の検出は、アンカーPCR又はRACE PCRのように、ポリメラーゼ鎖反応(PCR)(U.S.Patent No.4,683,195及び4,683,202)におけるプローブ/プライマーの使用に関連し、又は異なるものではリゲーション鎖反応(LCR)(Landegran et al., Science 241:1077−1080(1988);及びNakazawa et al., PNAS 91:360−364(1994)参照)に関連し、後者は特に遺伝子のポイント変異の検出に特に有効である(Abravaya et al., Nucleic Acids Res.23:675−682(1995)参照)。この方法は、患者から細胞サンプルを収集する工程、サンプルの細胞から核酸(例えばゲノム,mRNA又は両者)を単離する工程、核酸サンプルを遺伝子(もし存在すれば)のハイブリダイズ及び増幅が生じる条件下で、遺伝子に特にハイブリダイズした1以上のプライマーと接触させる工程、増幅生成物の存在又は不存在を検出し、又は増幅生成物の大きさを検出しコントロールサンプルの長さと対比する工程を含む。欠如及び挿入は増幅生成物を正常ゲノタイプと比較することにより、大きさの変化で検出することができる。ポイント変異は、増幅DNAを正常RNA、又は不増感DNAとハイブリダイズすることで特定することができる。
【0144】
あるいは、エストロゲン受容体遺伝子の変異は直接に、例えば変形された限定酵素消化パターンをゲル電気泳動で決定することで特定することができる。
さらに、配列−特定リボザイム(U.S.Patent No.5,498,531)を、リボザイム分裂サイトの成長又は減少により特定変異の存在をスコア化することができる。完全に一致した配列は、ヌクレアーゼ開裂消化アッセイ又は融点の相違により、一致しない配列から区別することができる。
【0145】
特定位置の配列変化は、RNase及びS1保護のようなヌクレアーゼ保護アッセイ又は化学開裂法により評価することができる。さらに、変異エストロゲン受容体遺伝子と野性型遺伝子との間の配列の相違を、直接DNA配列化により決定する。自動配列化手段の各種は、診断アッセイを実行するときに有効であり(Naeve,C.W.,(1995)Biotechniques 19:448)、マススペクトルによる配列化を含む(PCT International Publication No.WO94/16101;Cohen et al., Adv.Chromatogr.36:127−162(1996);及びGriffin et al., Appl.Biochem. Biotechnol. 38;147−159(1993)参照)。
【0146】
遺伝子の変異を検出する他の方法は、RNA/RNA又はRNA/DNA二重鎖の不適合塩基を検出するため、開裂試薬から保護する方法(Myers et al., Science 230;1242(1985));Cotton et al.,PNAS85:4397(1988);Saleeba et al.,Meth.Enzymol.217:286−295(1992))、変異及び野性型核酸の電気泳動量を比較するもの(Orita et al.,PNAS 86;2766(1989);Cotton et al., Mutat.Res.285:125−144(1993);及びHayashi et al.,Genet.Anal.Tech.Appl.9:73−79(1992))、及び変性グラジェントゲル電気泳動を用い、変性剤の傾斜濃度を含むポリアクリルアミドゲル中で変異又は野性型フラグメントの移動をアッセイするもの(Myers et al., Nature 313:495(1985))が含まれる。ポイント変異を検出する他の技術の例には、選択的オリゴヌクレオチドハイブリダイズ、選択的増幅、及び選択的プライマー伸長が含まれる。
【0147】
核酸分子はまた、疾患を不要に起こさせず、治療様相に影響を与えるゲノタイプの個体を試験するためにも有用である。そして、核酸分子は個体の遺伝子型と、治療のために用いられた化合物に対する個体の反応との間の相関を研究するのに用いることができる(薬理ゲノム相関)。従って、ここに記述された核酸分子は、好ましい化合物及び治療のための投与量を選択するため、ある個体のエストロゲン受容体遺伝子の変異量を評価するために用いることができる。
【0148】
そして、治療に影響を与える遺伝子変異を示す核酸分子は、個体に対するテーラー治療に用いることのできる診断対象を提供する。従って、これらの多型/ハプロタイプを有する組換細胞及び動物の製造は、薬剤及び投与量の効果的な臨床設計を可能とする。
【0149】
核酸分子は、細胞、組織及び生体中でのエストロゲン受容体遺伝子発現の調整を行うため、不増感性の形成に有用である。DNA不増感核酸分子は、転写及びその後のエストロゲン受容体タンパクの製造を阻止するため、転写に関連する遺伝子の部分に相補的に設計される。不増感RNA又はDNA核酸分子は、mRNAにハイブリダイズされ、mRNAのエストロゲン受容体タンパクへの翻訳を阻止する。
【0150】
あるいは、不増感分子の1種は、エストロゲン受容体核酸の発現を減少させるためmRNAを不活性化するために用いられる。従って、これらの分子は、異常又は望ましくないエストロゲン受容体核酸発現により特徴づけられる異常を処置することができる。この技術は、mRNAが翻訳される能力を減じる核酸配列を相補的にmRNAの1以上の部分に含ませたリボチームによる開裂に関する。可能な部分は、コード化部分及び特に基質結合部分のような、エストロゲン受容体タンパクの触媒及び他の機能的活性に関連したコード化部分である。
【0151】
核酸分子はさらに、エストロゲン受容体遺伝子発現に異常を有する細胞を含む患者の遺伝子治療のベクターを提供する。そして、ex vivoで変調され、患者に戻された患者の細胞を含む組換細胞を、個人の処置のため、患者の細胞が望ましいエストロゲン受容体タンパクを生成する位置に導入するものである。
【0152】
本発明はまた、生物的サンプル中のエストロゲン受容体核酸の存在を検知するキットを含む。例えば、このキットは、標識された又は標識できる核酸又は生物的サンプル中のエストロゲン受容体核酸を検知することのできる薬剤;、サンプル中のエストロゲン受容体核酸の量を決定できる手段;及びサンプル中のエストロゲン受容体核酸量を標準と比較する手段を含む。化合物又は薬剤は適当な容器に封入される。このキットはさらにエストロゲン受容体タンパクmRNA又はDNAを検出するキットの使用に関する説明書を含む。
【0153】
SNP含有核酸検出方法の設計
本発明のSNP核酸分子はプローブ、プライマー、化学的中間体、およびSNPの生物学的アッセイに有用である。プローブ/プライマーは図2に示した1つ以上のSNPと一致しているか、または5´及び/又は3´と一致している。しかしながら、前述したように、フラグメントは、本発明のSNPと関連しないフラグメント、又はSNP検出の技術において知られているフラグメントを含むものではない。ここで提供されたSNP含有核酸分子と情報は、PCRが、本発明において提供されたSNPを増幅し、フォーマットされたSNP検出試薬/キットを設計するPCRプライマーを設計するのにまた有用である。
【0154】
プローブ/プライマーは、典型的には実質的に精製されたオリゴヌクレオチド又はオリゴヌクレオチド対を含む。オリゴヌクレオチドは典型的には、少なくとも約12,20,25,40,50又はそれ以上の連続的なヌクレオチドとなるように、ストリンジェント条件下でハイブリダイズされたヌクレオチド配列部分を含む。特定の条件に基づいて、連続的なヌクレオチドは対象SNP位置を含むことができ、又は、所望のアッセイを実行するSNP位置である近接5´及び/又は3´SNPに十分近い特定部分になることもできる。
【0155】
好ましいプライマーとプローブ配列は、図1、2、及び9において提供された配列を使ってすぐに決定できる。それは当技術者には明白であり、そのようなプライマーとプローブは、本発明のSNPをゲノタイピングする診断プローブや増幅プライマーとして有効であり、キット型に組み入れることができる。
【0156】
SNPを分析するために、SNP対立遺伝子(「対立遺伝子特定オリゴヌクレオチド」、「対立遺伝子特定プローブ」、または「対立遺伝子特定プライマー」として表される)に特有なオリゴヌクレオチドを使うことが適切である。多型を分析するための対立遺伝子特定プローブの設計と用途は、例えばSaiki et al., Nature 324, 163−166 (1986); Dattagupta, EP 235,726, Saiki, WO 89/11548に説明されている。
【0157】
ハイブリダイズベースのアッセイにおいて、対立遺伝子特有プローブは、1人のヒト由来の対象DNAのセグメントにハイブリダイズするが、異なる多型が存在する別のヒト由来のセグメントにはハイブリダイズしないよう設計される。ハイブリダイズ条件は、対立遺伝子間のハイブリダイズ強度に重要な差異、好ましくは重要な二元性応答があるため、十分ストリンジェントであるべきであり、それによってプローブが対立遺伝子の1つだけにハイブリダイズする。いくつかのプローブが、対象DNAのセグメントにハイブリダイズするように設計されるので、多型部分はプローブの中心位置(例えば7位の15量体、8又は9位の16量体)に配列する。プローブの設計により、異なる対立遺伝子間のハイブリダイズが、よく識別できるようになる。
【0158】
対立遺伝子特定プローブはしばしば対で使われ、「対」は、SNP位置での対立遺伝子の変異を表す1つのヌクレオチド不一致を除いて同一である。対の一方は対象配列と完全に一致し、他方は変異型と完全に一致している。配列において、数対のプローブは、同じ対象配列内の複数の多型を同時分析する同じ担体に固定することができる。
【0159】
あるタイプのPCRベースのアッセイにおいては、対立遺伝子特定プライマーがSNP位置と重複している対象DNA部分にハイブリダイズし、プライマーが完全な相補性を表す対立遺伝子型のプライマーだけが増幅する。(Gibbs, Nucleic Acid Res. 17 2427−2448 (1989)参照)。このプライマーは、末端部分でハイブリダイズする2番目のプライマーと共役して使われる。増幅は、2つのプライマーから生じ、特定の対立遺伝子型の存在を示すことのできる生成物を生じる。コントロールは、通常プライマーの2つの対により実行される。1対は多型部分の単一塩基が不一致であり、もう1対は末梢部分へ完全に相補性を表す。単一塩基不一致は増幅を阻止し、生成物は全く成形されない。この方法は、不一致が多型に配列したオリゴヌクレオチドの3´−most位に含まれている時、最もよく機能する。それは、この位置がプライマーから伸張し最も不安定であるためである(例えばWO 93/22456参照)。このPCRベースのアッセイはTaqManアッセイの一部として利用され、下記のように説明される。
【0160】
SNP検出キット、核酸配列、及び組み込みシステム
本発明にはさらに、図1、2、4、8、及び9において提供されたSNPに基づく、核酸分子の配列又はマイクロ配列、プローブ/プライマーセットなどのSNP検出キットを提供する。
【0161】
本発明の1具体例において、ここで明らかにされた1つ以上のSNPを検出する1回以上のアッセイを実行するために、必要な試薬を含むキットを提供する。本発明は、本発明おけるSNPを分析するマルチ成分組み込みシステムも提供する。
【0162】
SNP検出キットは1つ以上のオリゴヌクレオチドプローブ、または対のプローブを含むことができ、それは個々のSNP位置、またはその位置の近くでハイブリダイズする。本発明のSNPの少なくとも1つのSNPを含む多数のSNPを試験するために、複数対の対立遺伝子特定オリゴヌクレオチドをキットに同時に含むことができる。配列などのいくつかのキットにおいて、対立遺伝子特定オリゴヌクレオチドが提供され、基質に固定される。例えば、同じ基質は、少なくとも1;10;100;1000;10000;100000;300000、又は図1、2、4、8、及び9において示された多型のうちのほぼすべてを検出するための対立遺伝子特定オリゴヌクレオチドプローブを含むことができる。
【0163】
特に本発明は、小さく仕切られ、1以上の容器を有するもので、(a) 核酸プローブの1つ、例えばここに記述されるSNP含有ヒトゲノムのフラグメントを結合することのできる対立遺伝子特定オリゴヌクレオチドを含む第一の容器;及び(b)洗浄剤、又は結合プローブの存在を検出することのできる試薬の1つ以上を含むことのできる1以上の容器を含むコンパートメント化されたキットを提供する。
詳細には、コンパートメント化されたキットは、複数の試薬が入れられる隔離された容器を各キットが有する。そのような容器は、小さなガラス容器、プラスチック容器、プラスチックのストライプ、ガラス又は紙、又はシリカのような配列化材料を含む。このような容器は、1つのコンパートメントから他のコンパートメントに試薬を効率的に移行させ、サンプル及び試薬は相互汚染せず、各容器の試薬又は溶液は一の容器から他の容器へ定量的に添加される。このような容器は、被検サンプルを入れる容器、核酸プローブを入れる容器、洗浄液(リン酸緩衝液、Tris緩衝液など)を入れる容器、結合プローブを検出する試薬を入れる容器を含む。さらにキットは、PCR又は他の酵素反応のための試薬、及びキットを使用する使用説明書を含むことができる。当業者は、本発明の未特定SNPを識別し、ここに記述された配列を用い、定型的に特定することができ、これを周知のキット形式に折り込んで用いることができる。
【0164】
さらに本発明により、図2の変異態の1つ以上を含む、図1の配列情報に基づく核酸分子の配列またはマイクロ配列が提供される。
【0165】
ここで用いる「配列」又は「マイクロ配列」とは、基板上に合成された別個のポリヌクレオチド又はオリゴヌクレオチドの配列を表し、基板は紙、ナイロン又は他種の膜、フィルター、チップ、スライドグラス又は他の適当な固形担体である。1つの具体例において、マイクロ配列はU.S.Patent 5,837,832,Chee et al., PCT 出願 WO95/11995(Chee et al.),Lockhart,D.J.et al.(1996;Nat.Biotech.14:1675−1680)及びShena,M.et al.(1996;Proc.Natl.Acad.Sci.93:10614−10619)に記載された方法にしたがって調製され且つ使用され、これらは参考としてここに折り込まれる。他の具体例では、このような配列はBrown et al., U.S.Patent No.5,807,522に記載される方法により製造される。配列またはマイクロ配列は、一般的に、「DNAチップ」と表される。
【0166】
異なるSNP位置と一致している個々のプローブまたは対のプローブにおいて、対立遺伝子特定オリゴヌクレオチドなどの多数のオリゴヌクレオチドプローブが配列される。オリヌクレオチドは、基板の特定領域に、光照射化学処理により合成される。基板は、紙、ナイロン又は他種の膜、フィルター、チップ、スライドグラス、又は他の適当な固体担体である。
【0167】
オリゴヌクレオチド配列に基づくハイブリダイズアッセイは、短いオリゴヌクレオチドプローブのハイブリダイズ安定度において、完全に一致する及び不一致である対象配列変異における相違に依存している。多型情報は、選ばれた位置で固体の担体(例えばチップ)に取り付けられたオリゴヌクレオチドプローブの高密度配列を含む基本的な構造によって、効率的に得られる。個々のDNAチップは、格子状に並び、ダイムサイズへ小型化され、個々の特定SNP位置又は対立遺伝子変異と一致し、数千から数百万のDNAプローブを含む。好ましくは、プローブは、アドレス可能な配列において、固体の担体に結び付けられる。
【0168】
配列/チップテクノロジーはすでに多くのケースにおいて成功し適用されている。例えば、BRCA1遺伝子、s.cerevisiae突然変異菌株、及びHIV−Iウイルスのプロテアーゼ遺伝子(Hacia et al., 1996; Shoemaker et al., 1996 ; Kozal et al., 1996) において変異のスクリーニングが行われた。SNP検出にて使う変異形チップがカスタマイズされた基質上に製造できる。
【0169】
SNPを検出するのに有用な配列ベースのタイリング計画は、EP 785280において説明される。すなわち配列は一般に多くの特定多型に「タイリングされる」。「タイリング」とは、前に選ばれた配列変異態だけでなく、対象配列に相補的な配列により構成されているオリゴヌクレオチドプローブの定義された合成、例えば1つ以上のモノマーベースの1つ以上の与えられた位置の置換、すなわちヌクレオチドを表す。タイリング計画はPCT出願 No.WO 95/11995でさらに説明されている。特定の面において、配列は多くの特定SNPにタイリングされる。特に、配列は、各検出ブロックが特定SNPまたはSNPセットに特有の多くの検出ブロックを含むようタイリングされる。例えば、特定SNPを含む配列セグメントを測定する多くのプローブを含むように、検出ブロックがタイリングされる。個々の対立遺伝子に相補性を表すプローブを得るために、プローブは、SNP位置で異なる対において合成される。SNP位置で異なるプローブだけでなく、一置換体プローブもまた、一般に検出ブロック内でタイリングされる。この方法は、ここに記述されたSNP情報にすぐ適用できる。
【0170】
これらの一置換体プローブは、ヌクレオチド残基(A、T、G、C、及びUから選ばれる)によって置換された多型からの一定数の塩基をどちらの方向にも持つ。一般に、タイリングされた検出ブロックのプローブは、SNPから5塩基離れた配列位置の置換を含む。一置換体プローブは、実際のハイブリダイズを人為的交雑ハイブリダイズと区別するために、内的コントロールをタイリング配列に行う。対象配列及び配列の洗浄を持つハイブリダイズの完成において、配列は、対象配列がハイブリダイズする配列における位置を決定するよう考察される。走査された配列からのハイブリダイズデーターは、サンプル内の対立遺伝子又はSNPの対立遺伝子の存在を識別するために分析される。ハイブリダイズと走査は、PCT出願No.WO 92/10092、WO 95/11995とU.S.Patent No.5424186における説明のように行われる。
【0171】
従って、いくつかの具体例において、チップは長さ約15ヌクレオチドのフラグメントの核酸配列を含む。他の具体例では、チップは、図1、2、8、及び9に記述されているグループから選ばれる少なくとも1つの配列、相補的な配列、フラグメント、少なくとも8つ以上、好ましくは10、15、20、より好ましくは25、30、40、47、又は50の連続的なヌクレオチドと多型塩基を含むフラグメントを含む。いくつかの具体例では、多型塩基は、ポリヌクレオチドの中央から、5、4、3、2、又は1のヌクレオチド内にあり、より好ましくは該ポリヌクレオチドの中央にある。他の具体例では、チップは、本発明のポリヌクレオチドをいくつか持つ配列を含む。
【0172】
オリゴヌクレオチドは基板上に化学結合処理及びインクジェット処理装置により合成され、これはPCT 出願 WO95/251116(Baldeschweiler et al.)に記載されており、そのすべては参考としてここに折り込まれる。他の例では、「格子化」配列はドット(又はスロット)がcDNAフラグメント又はオリゴヌクレオチドを、真空システム、加熱、UV、機械的又は化学的結合処理により基板の表面に配置及び結合する。上記のような配列は、手作業又は適当な機械(スロットブロット又はドットブロット装置)、材料(適当な固体担体のいずれか)及び機械(ロボット化設備)、及び8,24,96,384,1536,6144又はそれ以上のオリゴヌクレオチド、又は商業的に用いられる設備の効率的使用となるオリゴヌクレオチドにより製造される。
【0173】
このような配列を用い、本発明は、本発明にかかるSNPを特定する方法を提供する。詳細には、このような方法は被検サンプルを1以上の核酸分子と共にインキュベートし、被検サンプル中の成分に核酸分子が結合することをアッセイする。このアッセイは、多くの遺伝子、少なくとも本発明にかかるSNP及び/又は本発明にかかるSNPの対立遺伝子の1つを含む配列を含む。
【0174】
被検サンプルと核酸分子のインキュベーション条件は変化する。インキュベーション条件はアッセイに用いられた形態、採用された検出方法、及びアッセイに用いられた核酸分子の型及び性質に依存する。当業者は、ここに記述されたヒトゲノムの新規なSNPを用いるのに適したように、一般的な適用されるハイブリダイゼーション、増幅、又は配列アッセイ形態を調製することができる。このようなアッセイの例は、Chard,T,An Introduction to Radioimmunoassay and Related Techniques, Elsevier Science Publishers,Amsterdam, The Netherlands(1986);Bullock,G.R.et al., Techniques in Immnocytochemistry,Academic Press,Orlando,FL Vol.1(1982),Vol.2(1983),Vol.3(1985);Tijssen,P., Practice and Theory of Enzyme Immunoassay: Laboratory Techniques in Biochemistry and Molecular Biology,Elsevier Science Publishers,Amsterdam,The Netherlands(1985)に記載されている。
【0175】
本発明のテストサンプルは、タンパク、核酸抽出物、体液(血、尿、唾液、痰、胃液等)から得られる細胞膜抽出物、培養細胞、生検材料、または他の組織調製物から得ることができるが、これら限定されない。上記の方法により使われたテストサンプルは、アッセイフォーマット、検出方法の性質、およびサンプルとして使用された組織、細胞、抽出物に基づき変異する。核酸、タンパク、または細胞抽出物を用意する方法は、当業者によく知られており、利用された系と互換のサンプルを得るために、すぐに適応できる。
【0176】
マルチ成分組み込みシステムは、また、SNP分析に使用できる。そのような系は、単一の機能的な装置において、PCRなどの製法及び毛管状の電気泳動法反応を小型化し、コンパートメント化する。このような技術の例はUS patent 5,589,136に記述されており、PCR増幅及びチップの毛管状の電気泳動法を説明している。
【0177】
組み込みシステムは主に、マイクロ流体系が使われる時に考察できる。これらの系は、ガラス、ケイ素、石英、またはプラスチック製のウェハーの上に設計されたマイクロチップに含まれるマイクロチャンネル型を含む。サンプルの動きは、動作部なしで機能的な微視的なバルブとポンプを作成するためにマイクロチップの種々の区域に適用された電気、電気浸透、または流体静力によりコントロールされる。電圧を変えることにより、マイクロ機械加工されたチャンネル間の交差における液状の流量をコントロールし、マイクロチップの種々の断面を横切るポンピングの液体流率を変更する。
【0178】
SNPをゲノタイピングするために、マイクロ流体系は、例えば、核酸増幅、小型配列プライマー延長、毛管状の電気泳動法、及びレーザーを引き起こす蛍光検出等の検出方法を合成する。
【0179】
最初のステップにおいて、DNAサンプルは増幅され、好ましくはPCRにより増幅される。そして、増幅生成物は、達成目標とされた多型塩基のすぐ上流にハイブリダイズするddNTP(個々のddNTPのための特定蛍光)、及び適切なオリゴヌクレオチド小型配列プライマーを使って自動化された小型配列反応に従っている。いったん3´末端の延長が完成されたら、プライマーは、未包含である蛍光性のddNTPから毛管状の電気泳動法により単離される。毛管状の電気泳動法で使われる単離媒体は例えば、ポリアクリルアミド、ポリエチレングリコール、またはデキストランとすることができる。単一のヌクレオチドプライマー延長生成物に含まれるddNTPは、レーザー誘導蛍光検出により識別される。このマイクロチップは少なくとも96から384またはそれ以上のサンプルを並行して処理するために使用できる。
【0180】
ベクター/宿主細胞
本発明は、ここに記載の核酸分子を含むベクターも提供する。「ベクター」とは、核酸分子を輸送するビヒクル、好ましくは核酸分子を意味する。ベクターが核酸分子である場合、その核酸分子は共有結合でベクターの核酸と結合されている。本発明のこの見地から、ベクターはプラスミド、1本鎖又は2本鎖のファージ、1本鎖又は2本鎖のRNA又はDNAウイルスベクター、又は人工染色体を含み、例えば、BAC、PAC、YAC、MACなどが挙げられる。
ベクターは、染色体外成分として宿主細胞中で維持可能であり、そこで核酸分子の別のコピーを複製、生産する。あるいは、ベクターは、宿主細胞ゲノム中に組み込み、宿主細胞が複製する際に核酸分子の別のコピーを生産してもよい。
【0181】
本発明は、維持のためのベクター(クローニングベクター)又は核酸分子発現のためのベクター(発現ベクター)を提供する。ベクターは、原核細胞又は真核細胞、又はその両者において機能することができる(シャトルベクター)。
発現ベクターは、シス作用性調節領域を含み、該領域は、核酸分子の転写が宿主細胞中でできるように、ベクター中で核酸分子に作動可能に結合されている。核酸分子は、転写に作用することが可能な別の核酸分子と共に宿主細胞に導入することができる。従って、この第2の核酸分子は、ベクターからの核酸分子の転写ができるように、シス調節コントロール領域と相互作用するトランス作用性因子を与えてもよい。あるいは、トランス作用性因子は、宿主細胞により供給されてもよい。また、トランス作用性因子は、ベクターそれ自体から生産することもできる。しかしながら、いくつかの実験において、核酸分子の転写及び/又は翻訳は無細胞系で起こり得ることが理解される。
【0182】
ここに記載の核酸分子が作動可能に結合している調節配列は、mRNA転写を指示するプロモーターを含む。これは、これらに限定されないが、バクテリオファージλから残ったプロモーター、大腸菌からのlac、TRP、及びTACプロモーター、SV40からの初期及び後期プロモーター、CMV即時型プロモーター、アデノウイルス初期及び後期プロモーター、ならびにレトロウイルス長末端反復を含む。
転写を促進するコントロール部位の他に、発現ベクターは、レプレッサー結合部位やエンハンサーなどの転写調節部位も含んでよい。例として、SV40エンハンサー、サイトメガロウイルス即時型エンハンサー、ポリオーマエンハンサー、アデノウイルスエンハンサー、レトロウイルスLTRエンハンサーを含む。
【0183】
転写の開始及びコントロールのための部位を含む他、発現ベクターは、転写終止に必要な配列を含むことが可能であり、また転写される部位においては、翻訳のためのリボソーム結合部位を含むことも可能である。発現のための他の調節コントロール要素は、ポリアデニル化シグナルと共に、開始及び終止コドンも含む。当業者は、発現ベクターに有用な多数の調節配列を知っているであろう。このような調節配列は例えば、Sambrook et al., Molecular Cloning: Alaboratory Manual. 2nd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harber, NY(1989)に記載されている。
【0184】
多様な発現ベクターを核酸分子の発現に用いることができる。このような発現ベクターは、染色体ベクター、エピソームベクター、ウイルス由来ベクターを含み、例えば、細菌プラスミド由来、バクテリオファージ由来、酵母エピソーム由来、酵母人工染色体を含む酵母染色体要素由来、バクロウイルス、SV40などのパポーバウイルス、ワクシニアウイルス、アデノウイルス、ポックスウイルス、仮性狂犬病ウイルス、レトロウイルスなどのウイルス由来のベクターが挙げられる。ベクターはプラスミド及びバクテリオファージ遺伝要素、例えば、コスミド、ファージミドなどに由来するようなこれら起源の組み合わせに由来してもよい。原核及び真核宿主のための適当なクローニングベクター及び発現ベクターは、Sambrook et al., Molecular Cloning: Alaboratory Manual. 2nd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harber, NY(1989)に記載されている。
【0185】
調節配列は1つ以上の宿主細胞における構成性発現を与えてもよく(すなわち、組織特異的)、又は、温度、栄養添加剤、又はホルモンや別のリガンドのような外因性因子によるような1つ以上の細胞型での誘導性発現を与えてもよい。原核及び真核宿主における構成性発現及び誘導性発現を与える様々なベクターは当業者に良く知られている。
【0186】
核酸分子は、周知の方法論により、ベクターの核酸に挿入することができる。一般に、最終的に発現するDNA配列は、1つ以上の制限酵素によりDNA配列と発現ベクターを切断し、その後そのフラグメントが互いに連結することにより発現ベクターに結合する。制限酵素の消化及び連結反応の手順は、当業者に良く知られている。
適当な核酸分子を含むベクターは、周知の技術を用い、増殖又は発現に適当な宿主細胞に導入することができる。細菌細胞は、大腸菌、放線菌、及びネズミチフス菌を含むが、これらに限定されない。真核細胞は、酵母、ショウジョウバエなどの昆虫細胞、COSやCHO細胞などの動物細胞、及び植物細胞を含むが、これらに限定されない。
【0187】
ここに記載のように、融合タンパクとしてペプチドを発現することが望ましいかもしれない。従って、本発明は、ペプチドが生産できる融合ベクターを提供する。融合ベクターは、組換えタンパクの発現を増強し、組換えタンパクの溶解度を向上させ、そして例えばアフィニティー精製のためのリガンドとして作用することによりタンパク精製を助けることができる。タンパク加水分解の切断部位は、融合部分の接合点に導入してもよく、その結果、所望のペプチドを最終的に融合部分から分離することができる。タンパク加水分解酵素は、Xa因子、トロンビン、及びエンテロキナーゼを含むが、これらに限定されない。代表的な融合発現ベクターは、pGEX (Smith et al., Gene 67:31−40 (1988))、 pMAL (New England Biolabs, Beverly, MA)、及び目的とする組換えタンパクに対してグルタチオンS−トランスフェラーゼ(GST)、マルトースE結合タンパク、又はプロテインAとそれぞれ融合するpRIT5 (Pharmacia, Piscataway, NJ)を含む。
適切な誘導性非融合大腸菌発現ベクターの例としては、pTrc (Amann et al., Gene 69:301−315 (1988)) 及び pET 11d (Studier et al., Gene Expression Technology: Methods in Enzymology 185:60−89 (1990))を含む。
【0188】
組換えタンパクの発現は、宿主細胞の組換えタンパクをタンパク加水分解的に切断する能力が減じられている遺伝的バックグラウンドを与えることにより、宿主細菌において最大化することができる(Gottesman, S., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, California (1990) 119−128)。あるいは、関心のある核酸分子の配列は、大腸菌などの特定の宿主細胞のための優先的コドンの使用(preferential codon usage)を提供するように変更することができる(Wada et al., Nucleic Acids Res. 20:2111−2118 (1992))。
【0189】
核酸分子は、酵母において作用する発現ベクターにより発現することも可能である。酵母、例えばS. cerevisiae での発現のためのベクターの例としては、pYepSec1 (Baldari, et al., EMBO J. 6:229−234 (1987))、 pMFa (Kurjan et al., Cell 30:933−943(1982))、 pJRY88 (Schultz et al., Gene 54:113−123 (1987))、 及び pYES2 (Invitrogen Corporation, San Diego, CA)を含む。
【0190】
核酸分子は、また、例えばバクロウイルス発現ベクターを用い、昆虫細胞中で発現させることもできる。培養昆虫細胞(例えば、Sf 9 細胞)中でのタンパク発現に有用なバクロウイルスベクターは、pAc系(Smith et al., Mol. Cell Biol. 3:2156−2165 (1983)) 及び pVL系(Lucklow et al., Virology 170:31−39 (1989))を含む。
本発明のある実施例においては、ここに記載の核酸分子は、ほ乳類の発現ベクターを用い、ほ乳類細胞においてする。ほ乳類発現ベクターの例として、pCDM8 (Seed, B. Nature 329:840(1987)) 及び pMT2PC (Kaufman et al., EMBO J. 6:187−195 (1987))を含む。
【0191】
ここに挙げた発現ベクターは、核酸分子を発現するのに有用で当業者が利用可能な周知のベクターのうち、単なる例として提供するものである。当業者は、ここに記載の核酸分子の維持、増殖又は発現に適した他のベクターについて知っているであろう。これらは、例えば、Sambrook, J., Fritsh, E. F., and Maniatis, T. Molecular Cloning: A Laboratory Manual. 2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989に認められる。
【0192】
本発明は、ここに記載の核酸配列が逆向きにベクター中にクローン化されてはいるが、アンチセンスRNAの転写を許可する調節配列に作用可能に結合されているベクターも含む。従って、アンチセンス転写物は、コーディング領域及び非コーディング領域の両方を含む、ここに記載の核酸分子配列の全て又は1部に対して生産することができる。このアンチセンスRNAの発現は、センスRNAの発現に関する上記各パラメータに従う(調節配列、構成性又は誘導性発現、組織特異的発現)。
【0193】
本発明は、また、ここに記載のベクターを含む組換え宿主細胞にも関する。宿主細胞は、従って、原核細胞、酵母のような下等真核細胞、昆虫細胞のような他の真核細胞、及びほ乳類細胞のような高等真核細胞を含む。
組換え宿主細胞は、ここに記載のベクター構成物を当業者が容易に使用可能な技術により細胞に導入することにより作製される。これらは、リン酸カルシウムトランスフェクション、DEAE−デキストラン媒介トランスフェクション、カチオン性脂質媒介トランスフェクション、エレクトロポレーション、形質導入、感染、リポフェクション、及びSambrook, et al. (Molecular Cloning: A Laboratory Manual. 2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)に認められるような他の技術を含むが、これらに限定されない。
【0194】
宿主細胞は、1つのベクター以上を含むことができる。従って、異なるヌクレオチド配列を同じ細胞の異なるベクター上に導入することができる。同様に、核酸分子を単独で、又は、発現ベクターのためのトランス作用性因子を提供する核酸分子に無関係な他の核酸分子とともに導入することもできる。1つのベクター以上を細胞に導入する場合、ベクターは独立して導入するか、共に導入するか、又は核酸分子ベクターに結合することができる。
【0195】
バクテリオファージ及びウイルス性ベクターの場合、これらは感染及び形質導入の標準的な方法によりパッケージ化ウイルス又はカプセル化ウイルスとして細胞内に導入することができる。ウイルスベクターは、複製能コンピテント又は複製能欠損であることが可能である。ウイルス複製が欠損している場合、複製は欠損を補足する機能を発揮する宿主細胞において起こる。
【0196】
ベクターは、一般的に、組換えベクター構成物を含む細胞亜集団が選択できる選択可能マーカーを含む。このマーカーは、ここに記載の核酸分子を含む同一のベクター中に含まれていてもよく、又は別のベクター上にあってもよい。マーカーは、原核宿主細胞に関するテトラサイクリン抵抗性又はアンピシリン抵抗性遺伝子、及び真核宿主細胞に関するジヒドロ葉酸レダクターゼ抵抗性又はネオマイシン抵抗性を含む。しかしながら、表現型形質を選択する何れのマーカーも効果的であろう。
【0197】
成熟タンパクは細菌、酵母、ほ乳類細胞、および他の細胞において適当な調節配列のコントロール下に生産可能であるが、無細胞転写及び翻訳系をここに記載のDNA構成物に由来するRNAを用いてこれらタンパクを生産するのに使用することも可能である。
ペプチドの分泌が必要な場合には、それはエストロゲンレセプターのようなタンパクを含むマルチトランスメンブランドメインで実行することは難しいが、適当な分泌シグナルをベクター中に加える。シグナル配列は、ペプチドに対して内因性であるか、又はこれらのペプチドに対して異型であることができる。
【0198】
そのペプチドを媒体中に分泌しない場合、それはエストロゲンレセプターの代表的なケースであるが、そのタンパクは凍結解凍、音波処理、機械的破砕、溶菌剤の使用等を含む標準的な破砕方法により宿主細胞から単離することができる。ペプチドは、その後、硫酸アンモニウム沈降、酸抽出、アニオン又はカチオン交換クロマトグラフィー、リン酸セルロースクロマトグラフィー、疎水的相互作用クロマトグラフィー、アフィニティークロマトグラフィー、ヒドロキシルアパタイトクロマトグラフィー、レクチンクロマトグラフィー、又は高速液体クロマトグラフィー等の周知の精製方法により回収、精製することができる。
【0199】
ここに記載のペプチドの組換え生産における宿主細胞に依存して、ペプチドは、細胞によっては細菌中で生産する場合のようにグリコシル化されないかもしれないが、様々なグリコシル化パターンを有する可能性があることも理解される。さらに、宿主を媒介したプロセスの結果のような場合には、ペプチドは初期修飾メチオニンを含むかもしれない。
【0200】
ベクター及び宿主細胞の使用
ここに記載のペプチドを発現する組換え宿主細胞は、様々な用途を有する。まず、その細胞は、エストロゲン受容体タンパクの生産、又は、さらに精製して所望量のエストロゲン受容体タンパクやフラグメントを生産することができるペプチドの生産に有用である。従って、発現ベクターを含む宿主細胞は、ペプチド生産に有用である。
【0201】
宿主細胞は、また、当該分野で公知のフォーマットと共に前記のようなエストロゲン受容体タンパク又はエストロゲン受容体タンパクフラグメントに関連する細胞ベースアッセイにも有用である。従って、ネイティブエストロゲン受容体タンパクを発現する組換え宿主細胞は、エストロゲン受容体タンパク機能を刺激又は抑制する物質アッセイに有用である。
宿主細胞はまた、その機能に影響があるエストロゲン受容体タンパク突然変異体の特定にも有用である。その突然変異体が自然に発生し、病理を起こすのであれば、その突然変異を含む宿主細胞は、ネイティブエストロゲン受容体タンパクに対しては示さないかもしれない効果であって、エストロゲン受容体タンパク突然変異体に対しては望ましい効果(例えば、刺激機能や抑制機能)を有する化合物の分析に有用である。
【0202】
遺伝子工学宿主細胞は、さらに非ヒト形質転換動物の生産に使用することができる。形質転換動物は、好ましくはほ乳類、例えば、ラットやマウスなどの齧歯類であり、その動物の細胞の1つ以上が導入遺伝子を含むものである。導入遺伝子は、形質転換動物が発育した細胞のゲノム中に組み込まれ、その形質転換動物の1つ以上の細胞型又は組織中の成熟動物のゲノム中に残存する外因性DNAである。これらの動物は、エストロゲン受容体タンパクの機能の研究、ならびにエストロゲン受容体タンパク活性の変調剤の特定及び評価に有用である。形質転換動物の他の例として、非ヒト霊長目動物、ヒツジ、イヌ、ウシ、ヤギ、ニワトリ、両生類を含む。
【0203】
形質転換動物は、受精卵母細胞の雄前核中に核酸を導入することにより生産することができる。例えばマイクロインジェクション、レトロウイルス感染、卵母細胞の疑似妊娠雌養育動物中での発育などにより生産できる。エストロゲン受容体タンパクヌクレオチド配列は何れも、マウスのような非ヒト動物のゲノム中に導入遺伝子として導入することができる。
発現ベクターにおいて有用な調節配列又は他の配列は何れも、形質転換配列の部分を形成することができる。これは、既に含まれていない場合には、イントロン配列及びポリアデニル化シグナルを含む。組織特異的調節配列は、導入遺伝子に作用可能に結合し、特定の細胞に対してエストロゲン受容体タンパクの発現を指示する。
【0204】
胚操作(embryo manipulation)及びマイクロインジェクションによる形質転換動物の創出方法は、特にマウスのような動物では、当該技術分野において通常行われており、例えば、米国特許公報第4,736,866号及び第4,870,009号(共にLeder et al.)、米国特許公報第4,873,191号(Wagner et al.)、ならびにHogan, B., Manipulating the Mouse Embryo, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1986)等に記載されている。同様の方法は、他の形質転換動物の生産にも使用される。形質転換の基礎動物は、そのゲノム中の導入遺伝子及び/又はその動物の組織又は細胞中の形質転換mRNAの発現に基づき特定することができる。形質転換動物は、その後、導入遺伝子を保有する別の動物を生むのに用いることができる。また、導入遺伝子を保有する形質転換動物は、さらに別の導入遺伝子を保有する別の形質転換動物に改良することができる。形質転換動物はまた、ここに記載の相同組換え宿主細胞を用いて完全な動物又はその動物の組織を生産する動物も含む。
【0205】
別の実施例において、形質転換非ヒト動物は、導入遺伝子発現調節ができる選択システムを含み生産することができる。そのようなシステムの一例は、バクテリオファージP1のcre/oxPリコンビナーゼシステムである。cre/oxPリコンビナーゼシステムに関しては、例えば、Lakso et al. PNAS 89:6232−6236 (1992)を参照。リコンビナーゼシステムの別の例はS. cerevisiae のFLPリコンビナーゼシステムである(O’Gorman et al. Science 251:1351−1355 (1991))。cre/oxPリコンビナーゼシステムを導入遺伝子の発現調節に使用する場合、Creリコンビナーゼ及び選択タンパクの両方をコード化する導入遺伝子を含む動物が必要である。このような動物は、「複」形質転換動物の構築を通じて、例えば、2つの形質転換動物、すなわち、1つは選択タンパクをコード化する導入遺伝子を含み、他方はリコンビナーゼをコード化する導入遺伝子を含む2つの形質転換動物を交配することにより、得ることができる。
【0206】
ここに記載の非ヒト形質転換動物のクローンは、また、Wilmut, I. et al. Nature 385:810−813 (1997)ならびにPCT国際公開公報 WO 97/07668及びWO 97/07669に記載の方法により生産することもできる。簡単に説明すれば、細胞、例えば、体細胞は、成長サイクルからの脱してG期に入るように、形質転換動物から単離、誘導することができる。
休止細胞は、その後、例えばその休止細胞を単離したものと同種の動物からの無核卵母細胞に対して電気パルスを使用することにより、融合することができる。この再構築卵母細胞は、その後、培養して桑実胚又は尾胞に発達し、疑似妊娠雌養育動物にトランスファーする。この雌養育動物の子は、その細胞、例えば体細胞を単離した動物からのクローンであろう。
【0207】
ここに記載のペプチドを発現する組換え細胞を含む形質転換動物は、ここに記載のアッセイをin vivo状況下で行うのに有用である。in vivoで存在し、リガンド結合、エストロゲン受容体タンパク活性化、及びシグナル形質導入を果たすことができる様々な生理的因子は、in vitroの無細胞分析又は細胞ベース分析から明らかでないかもしれない。従って、非ヒト形質転換動物の提供は、in vivoにおけるエストロゲン受容体タンパク機能、例えば、リガンド相互作用、エストロゲン受容体タンパク機能に対する特異的突然変異エストロゲン受容体タンパクの影響、ならびにキメラエストロゲン受容体タンパクの影響を含む機能の分析に有用である。また、ヌル突然変異、すなわち、実質的に又は完全に1つ以上のエストロゲン受容体タンパク機能を除去する突然変異の影響を評価することもできる。
【0208】
【実施例】
1. SNPの特定及び評価
エキソンの各隣接配列(エキソン/イントロン境界)にフランキングするプライマーを用いて、エストロゲン受容体アルファ(ESR1)の各エキソンをPCR増幅し、増幅フラグメントの配列を分析した。PCR鋳型として、コリエール多様パネル(5民族群の各10名)からのゲノムDNA(図2(b)参照)、及び/又は48名の患者からのリバプール臨床胸部腫瘍及び対応する血液サンプル(英国リバプールで得た組織より。図2(a)参照)を使用した。PolyPhred バーション2.0(D. A. Nickerson, S. Taylor, N. Kolker, Univ. of Washington, 1998)を配列において(デフォルトセッティングで)実行し、潜在的な異型接合体を可視化した。標識部位の特性が試験され、多型性を確認した。
【0209】
頻度2以上、特性スコア20以上の36個のSNPが、臨床サンプルに特有な13で判明した。15個のSNPは、臨床サンプルの異型接合性における少なくとも1つの変化例を示し、4個のSNPは、異型接合性における少なくとも1つの欠損例を示した。分析には、SNP特定及び検出のためにPCRプライマーを使用した(図2(e)参照)。
さらに、図2(d)のプライマーセット及びM13プライマーをオーバーラッピングPCR及びクローンシーケンシングに使用した。
【0210】
【表1】
臨床サンプル中で判明したSNPの要約:全SNPは、頻度2以上、特性スコア20以上であった(図8参照)。

Figure 2004531228
【0211】
【表2】
臨床サンプルにおける異型接合体の変化の要約:SNPは頻度2以上、特性スコア20以上であった(図8参照)。
Figure 2004531228
【0212】
図2(c)は、リバプールコントロール群対血液又は腫瘍群における分析SNPを含んだ。
図5は、ESR1タンパクのドメイン構造及びここに開示された多くのSNP位置を示す。図6は、被験サンプル中のSNP及び発生頻度のグラフ図である。
図8(a)(1)は、北欧州人、中国人、インド−パキスタン人、アフリカ系アメリカ人、及び南西部ネイティブアメリカ人の民族グループから集めたコリエールサンプル中のSNP及び発生頻度を示す。3’フランキングエキソン8において、SNPの位置は、遺伝子バンクにあるAL078582の配列に基づく。結果は、特定の民族グループ間での検出のために使用可能である。図8(a)(2)は、コリエールパネル中の部位167989(イントロン1D,#9)のSNPのゲノタイピングを示す。このパネルは、100名のコーカサス人を含み、51名は男性で、49名は女性である。結果は、マイナー対立遺伝子の頻度が9%であることを示す。
【0213】
図8(b)(1)は、北欧人からの血液サンプル及び乳ガンサンプルのグループから選択したリバプールサンプルにおけるSNP及び発生頻度を示す。
図8(b)(2)は、追加のリバプール患者60名中のSNP部位167,989(イントロン1D,#9)のタックヒトゲノタイピング(Taq Man genotyping)の結果を示す。この結果は、マイナー対立遺伝子(G)の頻度が血液中14%、腫瘍中10%であったことを示す。これは、図8(b)(1)に示されるコリエールサンプルのSNPゲノタイピングと同様であり、マイナー対立遺伝子での頻度は血液中16%、腫瘍中17%であった。リバプールコントロール群(95のケース)は、マイナー対立遺伝子での頻度は10.5%であったことを示す(図2(c))。
【0214】
2.ハプロタイプ分析
SNP発見のために開発された方法は、ハプロタイプデータを得るよう設計された。SNPは、特定のハプロタイプに関連させることが可能であった。サンプルcDNAは、未知の比率で存在するランダム群から得た。特定のクローンからのSNPはハプロタイプ中にクラスター化され、作られた。
【0215】
データは、2つのサンプルタイプからなる(図4(a)及び(b))。リバプールサンプルは、48名の患者からのものであり、各患者は腫瘍及び対応する血液サンプルを有した。コリエールサンプルは、コントロールであったが、それらは対応するコントロールではなかった。むしろ、それらは、欧州人、中国人、インド−パキスタン人、及びアフリカ系アメリカ人の混合に含まれた。ESR1における46のSNPは、リバプールサンプルにおいて記録された。同じ46のSNPと、RSR1遺伝子の3’の追加の6のSNPが、コリエールサンプルにおいて記録された。
【0216】
これらのデータは個体の最も適当なハプロタイプフェーズを推測するための分析に供した。その結果は、図4(a)に示されているが、各ハプロタイプはナンバーを有し、ダッシュのついたナンバーはそのハプロタイプのカウント(又は頻度)である。
図4(b)は、近接接合樹形図に適合させた非単独ハプロタイプデータである。樹形図が矢印のところで切断されている場合には、3L, 10−4, …73Lを含む分岐は樹形図の残部から「分岐X」として区画される。下記に分岐X対樹形図残部のハプロタイプにおける腫瘍発生率の違いを示す。各ハプロタイプの発生率は、まずダッシュのついたナンバーを足すことによりカウントした。Lは腫瘍性リバプールサンプルを示し、Lはコリエールコントロールを示す。
【0217】
Figure 2004531228
は、2×2の表に基づき0.0001より小さな確率を有する自由度で、21.29と計算された。従って、ER1遺伝子の分岐Xは、腫瘍に関連するより多くの機会を有する。この全分岐は、世界の他の場所では大変まれである。欧州人の間でさえ、20のハプロタイプからたった1つしか存在しなかった。
【0218】
コリエールコントロール、リバプールコントロール、リバプール腫瘍サンプルの間の大きな頻度差で分岐を特定した部位は以下の通り。
Figure 2004531228
【0219】
エストロゲン受容体1のプロモーター領域及びSNP
CAAT及びTATAのボックスは配列の最初の200 b.p.にあり、これらの距離は、基礎プロモーターとして機能的であるかもしれないと考えられる。
CAAT−TATA部位間の距離及び実際に特定された転写の開始は、約300 b.p.であり(通常は約20−40 b.p.)、この領域はNFAT, NFKB, SP1−ファミリー, CEBP 及び EBOX等のマルチプルTF領域を含む。これらの大部分は特異の(組織、細胞型)の発現の調節に関係した。
【0220】
T(SNP)の領域は、興味深い性質を有する。それは維持(TC)6−繰り返しを有するだけでなく、5−プライムに(CA)6も有する。維持モチーフは同じ領域のCACAYTCTCである。公知のTF部位からこの領域に顕著に合うものはなく、それは新規なTF部位のようである。T(SNP)に大変近いのはアリール炭化水素/Arntヘテロ二量体に関するAHRARNT_02と呼ばれるTF部位である。CACAYTCTC部位は、コファクターの結合点か、Arnt複合体を正しく配置するのを助けるものである。TF結合部位における単独の突然変異は、タンパク結合の親和性を数倍低下させ、疾患経路に導くかもしれない。
【0221】
本発明において、SNPはちょうど、短いGAの繰り返し(GAGAGAGA)中のエキソン1Cの13bp上流に起こる。分岐(図4)中の関連SNPのうち、3つはサイレント突然変異であり、1つは3’UTR中にあり、残りはイントロン領域中にある。
重要なTからGのSNP(#9)は、プロモーター領域のサイト167989(イントロン1D)中にある(図2(a),(b),(c))。遺伝子コピーの欠損は、ガンの危険性に関連する。遺伝子発現を減じるプロモーター突然変異は、同様の影響を及ぼす。
【0222】
GからTのトランスバージョンは、交互のプロモーター部位中にある。エストロゲン生理学、おそらくは核でのシグナル伝達の全体的なレベルに対してある効果がある。関連した分岐(及び分岐のハプロタイプ)(図4)の「効果」は、全体的なエストロゲン受容体感受性及び反応性を増加させること、又はそのサイクルが非調節(非生理学的)成長シグナルの方向である別の成長過程の方に誘導可能なことであると予測される。エストロゲンの露出は、事実すべての疫学的研究において乳ガンの原因に重大な役割を果たす。
【0223】
さらに、TF結合部位とSNPは、下記のように、5のSNPが転写結合部位に生じたESR1遺伝子中に検出された。
Figure 2004531228
【0224】
ESR1 ゲノム配列決定−エストロゲン受容体アルファの完全ゲノム構造
エストロゲン受容体(ER)は、核ホルモン受容体遺伝子スーパーファミリーの1つである。この遺伝子のファミリーは、3つの別個のドメイン、すなわち、変異(N)−末端ドメイン、高度維持DNA結合ドメイン及び維持(C)−末端ドメインのモジュラー構造を特徴とする(参考文献1,2参照)。機能的には、(N)−末端ドメインはトランス活性化を、DNA結合ドメインは二量体化及びDNA結合を、(C)−末端ドメインはトランス活性化、二量化、リガンド結合、核トランスロケーション、サイレンシング、及び熱ショックタンパク結合を、それぞれ調節する。核ホルモン遺伝子スーパーファミリーの各ドメインの機能は、それらが見つかる受容体に無関係で、ドメインは異なる異型タンパク中に位置する場合であっても、その機能を保有する(参考文献3、4、5参照)。これら遺伝子の主なサブファミリーは、進化の初期に単純な遺伝子複製を通じて進化したので、核ホルモン受容体遺伝子スーパーファミリーのドメインモジュール性が存在する(参考文献6)。核ホルモン受容体遺伝子ファミリーは、2つの異なる分類スキームに従って分離することができる。一方はホルモン結合に基づき、他方は二量化と、受容体のDNA応答エレメントへの結合方法に基づく(参考文献2参照)。
【0225】
ERαのcDNAは、まず、MCF−7乳ガン細胞系列からクローン化及びシークエンスし、v−erb−A 遺伝子に対して27%の同一性と41%の保存性を有することが判明した(参考文献7)。ERαは、蛍光in situハイブリダイゼーション(FISH)及び染色体結合を用いて染色体6q25.1にマップした(参考文献8)。1996年に、新規なエストロゲン受容体(ERβ)が縮重PCRにより特定され(参考文献9)、FISHにより14q22−24にマップされた(参考文献10)。ERα及びERβは、DNA結合ドメイン中96%の配列同一性と、リガンド結合ドメイン中58%の同一性を有し、ヒンジ(hinge)(ドメインD)と同様に5’及び3’末端においては同一性が低いことが示された。様々なERα及びERβ変異体は、これまで単一及び複数のエキソン欠損、切断転写、及び挿入を含む転写物を含め記載されてきた(参考文献11,12,13)。これらの変異体は、正常組織、腫瘍組織及び細胞系列を含む様々な起源から単離された。乳ガン患者の腫瘍のER状態は、内分泌療法に対する応答のインジケータとして用いられ(参考文献14,15)、多くの研究により乳ガン腫瘍の進行、ER−ネガティブ状態、及びホルモンアンタゴニスト抵抗性におけるERの役割が検討されてきた(参考文献16参照)。
【0226】
ER遺伝子の重要性から、我々はその全体をクローン化し、その完全な構造を決定しようとした。初めに、標準細菌人工染色体(BAC)配列決定を用いて遺伝子のコーディング領域の配列情報を発生させた。セレーラのヒトゲノム配列決定が進行したとき、ERの残存領域はセレーラレジオンアセンブリを用いて埋められた。25kbより小さな領域は、公知のBAC(Al353611.6, positions 1,497−25,941)を用いてERα上に埋められた。
【0227】
材料及び方法
1)BACスクリーニング
適当なマーカーがERα及びERβエキソンに設計され、リサーチジェネティクス(Huntsville, AL)から市販のBACクローンを得るために用いられた。いくつかのポジティブBACを選び、それぞれのクローンを確認のために再スクリーニングした。
【0228】
2)DNAの単離及びライブラリーの作製
BACのDNAは、QIAGENカラム(QIAGEN, Inc., Valencia, CA) を用い、メーカー仕様書に従って、確認したクローンから単離した。ショットガンライブラリーは、標準プロトコルに従い作製した(参考文献17)。簡単に説明すると、単離したBACのDNAを音波処理、ポリッシュ、及びサイズ分画した。サイズを選択したDNAフラグメントは、その後標準の連結反応技術を用いてpUC19中にサブクローン化した。連結したDNAは、エレクトロコンピテント細胞(Life Technologies, Rockville, MD)中にトランスフォームし、一晩成長させた。
【0229】
3)DNA配列決定及び注釈
配列決定反応は、ビッグダイターミネーターケミストリー(Big Dye Terminator chemistry, Applied Biosystems, Foster City, CA)を用いて実行し、ABI PRISM 3700 DNAアナライザー (Applied Biosystems)で行った。Phred (参考文献18), Phrap 及び Consed (参考文献19)は塩基呼び出し、アセンブリ及びフィニシングにぞれぞれ使用した。エキソン位置は、クロスマッチを用いて決定し、公表された遺伝子配列をゲノムのコンティグと比較した。
【0230】
結果
1.エストロゲン受容体アルファ
ERαのゲノム配列及びERαの公表されたmRNA配列のアライメントは、その遺伝子が14エキソンからなり、446,296 bpのゲノム配列をカバーすることを示す (図7,表3)。
2. エストロゲン受容体ベータ
ERβのゲノム配列及びERβの公表されたmRNA配列のアライメントは、その遺伝子が17エキソンからなり、253,748 bpのゲノム配列をカバーすることを示す(図2,表1)。セレーラゲノムブラウザでの分析により、遺伝子、ヒトシナプス核発現遺伝子2(syne−2, accession number NM_015180.1)、を特定することができた。それは、反対の鎖上でERβのイントロン9内に完全に含まれる。syne−2遺伝子のさらなる分析により、それは21エキソンからなり、51,471 bpのゲノム配列をカバーすることが示された。
【0231】
考察
完全なERαゲノム配列と様々なERβ転写物のアライメントは、遺伝子が446,296 bpのゲノム配列をカバーし、14エキソンからなることを示す。エキソン1E(AJ002561) (参考文献20)の公表配列とERαゲノム配列のアライメントは、エキソン1Eが実際には2つの別のエキソンからなることを明らかにした。新しく示されたエキソンは、これまでに確立された命名規約に従い、ここではエキソン1Gという。エキソン1Gは、エキソン1Eの約45 kb上流に位置し、GT/AG スプラス部位共通配列に一致する(図1,表1)。
【0232】
完全なERβゲノム配列に対する様々なERβ転写物のアライメントは、これまで受け入れられていたよりも複雑な体制を示す(参考文献13)。ERβcx変異体(AB006589)の5’UTRは実際には7つの非翻訳エキソン(ここではエキソン−1〜−7という)からなり、これらは全て、GT/AGスプライス部位共通配列に一致する(図2,表1)。ERβ変異体 AF061055及びAF061054(参考文献12)の配列アライメントは、これらの転写物が両方ともイントロン配列を含み、おそらく部分的に成熟した転写物であることを示した。これらの部分的成熟転写物は両方ともエキソン7と、エキソン9の一部を含むが、イントロン配列が存在する部位のスプライス部位共通配列には一致していない。
【0233】
セレーラゲノムブラウザを用いてERゲノム配列を調べることにより、ERβのイントロン9内に完全に含まれた分離遺伝子を特定することができた。この遺伝子は、ヒトシナプス核発現遺伝子2(syne−2)であり、50Kbのゲノム配列をカバーし、21のエキソンからなることが示された。これらは全てGT/AGスプライス共通配列に一致する(表4)。syne−2遺伝子は、ERβのアンチセンス鎖上に位置する。
ERα及びERβの配列及び構造の完成は、これらの重要な受容体のさらなる理解と特徴づけに寄与する。
【0234】
【表3】
ヒトエストロゲン受容体におけるエキソン−イントロン境界及び位置:
エキソン配列は大文字、イントロン配列は小文字、スプライス部位は太字で示す。
Figure 2004531228
【0235】
【表4】
ヒトシナプス核発現遺伝子2におけるエキソン−イントロン境界及び位置:
エキソン配列は大文字、イントロン配列は小文字、スプライス部位は太字で示す。
Figure 2004531228
【0236】
参考文献
1. Ribeiro RC, Kushner PJ, Baxter JD, Tenbaum S, Baniahmad A. The nuclear hormone receptor gene superfamily. Annu Rev Med 1995;46:443−53.
2. Tenbaum S, Baniahmad A. Nuclear receptors: structure, function and involvement in disease. Int J Biochem Cell Biol. 1997 Dec;29(12):1325−41.
3. Baniahmad C, Baniahmad A, O’Malley BW. A rapid method combining a functional test of fusion proteins in vivo and their purification. Biotechniques. 1994 Feb;16(2):194−6.
4. Parker MG, White R. Nuclear receptors spring into action. Nat Struct Biol. 1996 Feb;3(2):113−5.
5. Schwabe JW. Transcriptional control: how nuclear receptors get turned on. Curr Biol. 1996 Apr 1;6(4):372−4.
【0237】
6. Laudet V, Hanni C, Coll J, Catzeflis F, Stehelin D. Evolution of the nuclear receptor gene superfamily. EMBO J. 1992 Mar;11(3):1003−13.
7. Green S, Walter P, Kumar V, Krust A, Bornert JM, Argos P, Chambon P. Human oestrogen receptor cDNA: sequence, expression and homology to v−erb−A. Nature. 1986 Mar 13−19;320(6058):134−9.
8. Menasce LP, White GR, Harrison CJ, Boyle JM. Localization of the estrogen receptor locus (ESR) to chromosome 6q25.1 by FISH and a simple post−FISH banding technique. Genomics 1993 Jul;17(1):263−5.
9. Mosselman S, Polman J, Dijkema R. ER beta: identification and characterization of a novel human estrogen receptor. FEBS Lett. 1996 Aug 19;392(1):49−53.
10. Enmark E, Pelto−Huikko M, Grandien K, Lagercrantz S, Lagercrantz J, Fried G, Nordenskjold M, Gustafsson JA. Human estrogen receptor beta−gene structure, chromosomal localization, and expression pattern. J Clin Endocrinol Metab. 1997 Dec;82(12):4258−65.
【0238】
11. Murphy LC, Dotzlaw H, Leygue E, Douglas D, Coutts A, Watson PH. Estrogen receptor variants and mutations. J Steroid Biochem Mol Biol. 1997 Aug;62(5−6):363−72.
12. Moore JT, McKee DD, Slentz−Kesler K, Moore LB, Jones SA, Horne EL, Su JL, Kliewer SA, Lehmann JM, Willson TM. Cloning and characterization of human estrogen receptor beta isoforms. Biochem Biophys Res Commun. 1998 Jun 9;247(1):75−8.
13. Ogawa S, Inoue S, Watanabe T, Orimo A, Hosoi T, Ouchi Y, Muramatsu M. Molecular cloning and characterization of human estrogen receptor betacx: a potential inhibitor of estrogen action in human. Nucleic Acids Res. 1998 Aug 1;26(15):3505−12.
14. Osborne CK, Yochmowitz MG, Knight WA 3d, McGuire WL. The value of estrogen and progesterone receptors in the treatment of breast cancer. Cancer 1980 Dec 15;46(12 Suppl):2884−8.
15. DeSombre ER, Carbone PP, Jensen EV, McGuire WL, Wells SA Jr, Wittliff JL, Lipsett M Special report. Steriod receptors in breast cancer. N Engl J Med 1979 Nov 1;301(18):1011−2.
【0239】
16. Parl, Fritz F., Estrogens, Estrogen receptor, and Breast Cancer. IOS Press, Amsterdam, Netherlands, 2000.
17. Birren B, Green ED, Klapholz S, Myers, R, Riethman H, Roskams J, (eds.) (1997), Genome Analysis: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.
18. Ewing B, Hillier L, Wendl MC, Green P. Base−calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res 1998 Mar;8(3):175−85.
19. Gordon D, Abajian C, Green P. Consed: a graphical tool for sequence finishing. Genome Res 1998 Mar;8(3):195−202.
20. Flouriot G, Griffin C, Kenealy M, Sonntag−Buck V, Gannon F. Differentially expressed messenger RNA isoforms of the human estrogen receptor−alpha gene are generated by alternative splicing and promoter usage. Mol Endocrinol 1998 Dec;12(12):1939−54.
【0240】
上記明細書に記載の全ての出版物及び特許はここに織り込まれるものである。本発明に記載の方法及びシステムの様々な修飾及び変更は本発明の範囲ならびに精神を外れない範囲で当業者に明らかである。本発明は特定の好ましい実施例に関連して記載しているが、クレームされた本発明はこのような特定の実施例に不当に限定されないことが理解されるべきである。実際に、分子生物学及び関連する分野の当業者に自明な、前記本発明の実施態様の様々な修飾はクレームの範囲内である。
【配列表】
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228

【図面の簡単な説明】
【図1】エストロゲン受容体アルファ遺伝子の完全ゲノム配列。
【図2】エストロゲン受容体アルファゲノムDNAに見出される配列多型(ヌクレオチドの位置は図1で与えられる配列に基づく)。
(a)リバプール臨床組織サンプル中のSNP
(b)コリエール多様性パネル中のSNP
(c)リバプールコントロール母集団中のSNP
(d)PCRプライマー
(e)シークエンシングプライマー
【図3】エストロゲン受容体アルファタンパクのアミノ酸配列。
【図4】エストロゲン受容体ハプロタイプ(ハプロタイプの項参照)。
(a)48人の患者からのリバプールサンプル、各患者は、腫瘍と対応する血液サンプルを有する。コリエールサンプルはコントロールである。
(b)隣接樹に適する非単独ハプロタイプデータ(Lはリバプールサンプル)。
【図5】ESR1タンパクのドメイン構造とここに開示されるSNP位置。
【図6】本発明に係る多くのSNPの分布及び頻度。
【図7】ヒトESR1遺伝子座のグラフ表現。
(a)ヒトエストロゲン受容体アルファ(ERα)の完全構造。エキソンは塗りつぶした四角で、イントロンは水平線で表す。
(b)ゲノム配列を完成するために使用されたコンティグの順番と名前。GAナンバーはセレーラコンティグナンバーを表す。リサーチジェネティクスBACクローンは基準プレート及び詳細番号で表される。
【図8】ESRアルファSNP:a)コリエールサンプル中、b)リバプールサンプル中(T=腫瘍サンプル、B=血液サンプル、LC=リバプールコントロール)、c)リバプールコントロールサンプル中。
【図9】SNPを有するESRアルファエキソン(「N」、「C」、「I」、「A」、「S」については図2を参照)。下線の配列はプライマー配列を表す。[0001]
Related application
This application is related to U.S. Patent Application Ser. S. Serial No. 09 / 692,414 (Atty. Docket CL000258), filed on Jan. 24, 2001. S. Serial No. 09 / 768,184 (Atty. Docket CL000258CIP), filed on March 13, 2001, U.S. Pat. S. Serial No. 09 / 804,076 (Atty. Docket CL000258CI2), and U.S. Patent Application Ser. S. Serial No. 09 / 826,314 (Atty. Docket CL000258CI3).
[0002]
Technical field
The present invention relates to methods for detecting and treating diseases. In particular, the present invention relates to the development of diagnostic and therapeutic methods for previously unknown nucleic acid / amino acid polymorphisms in the estrogen receptor alpha gene (ESR-α) and diseases and disorders mediated / modulated by the estrogen receptor. , The gene sequence of the gene.
[0003]
Background art
Estrogen receptor
Human estrogen receptor alpha belongs to the family of nuclear hormone receptors. Nuclear hormone receptors are a family of hormonally active transcription factors capable of initiating or increasing the transcription of genes, including certain hormonal response factors.
The estrogen receptor protein consists of 595 amino acids with a molecular weight of 66 kDa, has eight translated exons, and six domains with different functions. In two of these domains, the early sequences of the nuclear hormone receptor superfamily are highly conserved. One of these domains, the DNA binding domain (DBD), contains two zinc fingers that mediate the binding of the receptor to hormone responsive elements in the promoter of the hormone responsive gene. In the C-terminal region, the hormone binding domain (HBD) contains two regions with sequence homology to other hormone receptors, conferring hormonal properties and selectivity. The human estrogen receptor alpha gene is located on chromosome 6q. 25.1.
[0004]
Estrogen receptors, and other similar steroid receptors, are transcription factors that are activated by binding to steroids (estradiol) or steroid analogs such as tamoxifen. Upon activation, the receptor binds to the estrogen receptor component (ERE) located in the promoter region of the estrogen activating gene to form a homodimer or heterodimer, which interacts with the host coactivator. Adjust the transfer by action.
[0005]
The role of estrogen in cardiovascular disease
Heart disease is the leading cause of death in women, a fact recognized by women and doctors. One in nine women between the ages of 45 and 65 has some cardiovascular disease, increasing to one in three for those aged 65 and older. Every year, 240,000 people die from heart disease in the United States, of which about 90,000 die from stroke. In addition, about 44% of people who have had a heart attack within one year die. In comparison, it is 26% for males (Warren MP and Kulac J Clin Obs Gyn 1998 1 (4): 976-187).
[0006]
Estrogen has a wide range of physiological effects on a wide variety of cell types. For example, it regulates a myriad of functions related to cell growth and apoptosis, and replication. There are two types of estrogen receptors, α and β. Blood vessels and bones contain β receptors, and liver contains α receptors. And in the central nervous system, both α and β receptors are found. The interaction of these different receptor sites affects the biological effects of estrogen and selective estrogen receptor modulators (SERMs) such as, for example, raloxifene. The binding pattern directs the estrogen or SERM to act as an estrogen agonist or antagonist (Mendelsohn ME and Karas RH New Engl J Med 1999, 340 (23): 1801-1181; 4: 71-92). There is a tissue-specific relationship between SERMs and receptor binding sites. Estrogen increases HDL cholesterol levels, lowers LDL cholesterol levels, and decreases plasminogen activity inhibitor (Meisler JG Jour Woman's Health 1999, 8 (1): 51-57). All estrogens require a cell receptor for expression. In general, the estrogen receptor is a ligand-inducible transcription factor, and regulates the expression of a target gene after binding to a hormone (Faustini-Fustini et al. Eur J Endocrin 1999, 140: 111-129). Estrogen probably also has important effects on the vascular wall. Estradiol and progesterone receptors have been identified in arterial endothelium and smooth muscle cells (Campis D et al. Int J Tissue React 1987, IX (5): 393-398). Estrogen acts on the arterial wall, relaxing vascular smooth muscle and reducing vascular resistance. This mechanism appears to be due to stimulation of endothelium-derived relaxing factors and endogenous nitrates (Warren MP and Kulac J Clin Obs Gyn 1998 41 (4): 976-187). Alleviation by 17B-estradiol plays an important role in regulating cardiac status and reduces the risk of heart disease in postmenopausal women. Nitric oxide production is mediated by estrogen receptors. This is because nitric oxide is suppressed when the receptor is blocked by antiestrogens.
[0007]
Several studies have shown that estrogen therapy reduces the risk of heart disease by up to 50% (most recently reviewed by Mendelshon ME and Karas RH New Engl J Med 1999, 340 (23): 1801-1181; Rich-Edwards JW N Engl J Med, 1995, 332: 1758-1765; Gerhard M, Ganz P, Circulation, 1995, 92: 5-8; rodstein F, et al. 1769-75; Chasen-Taber Land and Stampfer MJ Ann of Int Med, 1998, 128: 467-474; Warren M and Kulak J Clin Obstet Gyn 1998, 41 (4): 976-987). Estrogen depletion may be one of the most important factors in the development of cardiovascular disease in women.
[0008]
While there is no direct evidence that estrogen prevents atherogenesis, there is much epidemiological evidence suggesting that estrogen is effective in reducing cardiovascular disease; (1) All ages Women have a lower incidence of cardiovascular disease than men; (2) women who have early menopause and do not use estrogen have twice as many cardiovascular diseases as pre-menopausal women than men of the same age. (3) postmenopausal women using estrogen have a significantly lower incidence of cardiovascular disease compared to women not using it; (4) women with cardiovascular disease detected by angiography When using estrogen, the survival rate is high.
[0009]
In recent years, the use of estrogen in postmenopausal women has gained widespread attention as good results on cardiovascular disease morbidity and mortality from estrogen therapy have been reported (Meinertz T Herz 1997, 22: 151-157). Guidelines for the treatment of estrogen, published by the United States Medical College, state that "hormonal therapy is effective in women with coronary heart disease."
[0010]
More than 30 prospective and 13 controlled studies have investigated the incidence or prevalence of cardiovascular disease and the effects of estrogen replacement therapy on all causes of death (Stampfer MJ et al. New. Engl J Med 1991, 325: 756-62; Grady D et al. Ann Intern Med 1992, 117: 1016-37). Most of these studies have shown that the incidence and mortality of coronary heart disease in postmenopausal estrogen users is lower than in non-users. In particular, coronary artery disease among estrogen users has been shown to be about 50% of non-users. Overall, most of this evidence strongly supports the protective effect of estrogen with a relative risk of 0.56 (95% confidence interval 0.50-0.61). However, there is a “trend of choice for healthy women” in these studies, which may potentially confuse the results (estrogens use better weight management compared to non-estrogen users) There is more exercise, less smoking). In addition, the tendency for estrogen users to be better educated and have higher incomes has also disrupted these epidemiological studies (Abrams J Clin Cardiol 1998, 21: 218-222).
[0011]
Earlier observations indicated that 25% of the 50% reduction in risk was trusted due to various methodological trends because it was not randomized (Grodstein F and Stampfer MJ Prog Cardiol Dis 1995, 38: 199). -210; Barrett-Conner E and Grady D 1998, Annu Rev Public Health 19: 55-72). Recently, two meta-analyses have estimated that estrogen use reduces coronary heart disease by 35-44%. Recent studies have investigated the use of estrogen, with reports of an increased risk of uterine cancer in women using estrogen alone with an intact uterus. New evidence suggests that the use of progestins (usually medroxyprogestin acetate) in addition to estrogens is not as protective of the heart as the use of estrogens alone (Hulley Set et al.). al 1998 JAMA 280: 605-613; Abrams J Clin Cardiol 1998, 21: 218-222).
[0012]
Estrogen reduction at menopause is associated with a 6% decrease in HDL cholesterol levels and a 5% increase in LDL cholesterol levels, which is higher in postmenopausal women than in premenopausal women It may be an explanation for having a cardiovascular disease incidence. The lower incidence of cardiovascular disease in postmenopausal women using estrogens may be partially explained by the results of a 15-19% decrease in LDL cholesterol and a 16-18% increase in HDL cholesterol. (JAMA 1995, 273: 199-208). In a randomized, double-blind, placebo-controlled trial of PEPI (Postmenopausal Estrogen / Progestin Intervention), HDL cholesterol levels in women using estrogen alone are significantly increased compared to women using estrogen in combination. (JAMA 1995, 273: 199-208). Recently, studies of non-human primates have corroborated these findings (Clarkson TB Lab An Sci 1998, 48 (6): 569-72). Statistical models for the effects of estrogen on the lipid profile have shown that 25-50% of apparent cardioprotection by estrogen is mediated by good changes in HDL-cholesterol (Bush TL et al. 1987 Circulation 75). Gruchow HW et al. 1988 Am Heart J 115: 954-63).
[0013]
Estrogen replacement therapy is not without danger. For many years, users of oral contraceptives have been shown to increase the risk of venous thromboembolism (VTE) by a factor of 3 to 4 compared to non-users (Weiss G Am J Obstet Gynecol 1999). 180: S295-301). One study has shown that intrinsic clotting factors play an important role in VTE associated with oral contraceptives (Vandenbrooke JP et al. Lancet 1994 344: 1453- 7; Rossing J et al. Br J Haematol). 1997, 97: 233-238). Leiden Mutant V increases the risk of VTE 5- to 10-fold in non-contraceptive users, but 30-fold in third-generation oral contraceptive users. The bound estrogen causes resistance to the body's natural anticoagulant system (APC). Heterozygotes due to Leiden Mutant V in oral contraceptive users develop equivalent APC resistance to homozygous women.
[0014]
Estrogen increases the risk of endometrial cancer about 6-fold, but with the addition of progestin this effect is almost eliminated (Barrett-Conner E and Grady D 1998, Ann Rev Public Health 19: 55-72). There is ongoing debate whether estrogen replacement increases the risk of breast cancer, but several studies have shown that the risk is increased by 30% (Greendale GA et al. Lancet 1999, 353: 571-80).
[0015]
Many randomized studies are underway to establish whether estrogen replacement therapy reduces the risk of cardiovascular disease in women and whether it increases the risk of breast cancer. One recently completed study, HERS (Heart and Estrogen / Progestin Replacement Study), showed that 2,700 women who already had heart disease were continuously prescribed estrogen and medroxyprogesterone acetate, with and without a control placebo. (Hully S et al. 1998 JAMA 280 (7): 605-13). Compared to controls, the intervention group had significantly more heart disease onset in the one year study, but significantly less in the four to five year study. In addition, studies of hormone-using women have shown a significant increase in the incidence of thromboembolism at an early stage. Based on these results, hormone replacement therapy cannot be recommended for secondary prevention of heart disease.
[0016]
Two other major clinical studies are currently underway for the primary prevention of cardiovascular disease using estrogens. A study called The Women's Health Initiative, slated to be completed in the UK in 2005, and a WIS-DOM, slated to be completed in 2010, indicate that estrogen has a new protective effect on cardiovascular disease. Will cast light (Meisler JG Jour Women's Health 1999, 8 (1): 51-5).
[0017]
In summary, ongoing research suggests that estrogen replacement therapy, particularly in connection with designer estrogen or SERMs, has recently been shown to be as effective in the cardiovascular system as bone, without adversely affecting breast and endometrial tissue. Has a significant effect. Nevertheless, careful observation is required. On average, women who take estrogen are better educated, healthier, have higher incomes, and are better at managing their health. Rather than estrogen, these differences may reduce the risk of heart disease.
[0018]
In postmenopausal women who are currently ill, estrogen replacement therapy appears to have a useful impact given the importance, consistency, and biological credibility of the data. For women who already have the disease, issues remain regarding the safety and effectiveness of exogenous estrogens as protective medicine against cardiovascular disease.
[0019]
Estrogen and autoimmune diseases
A. Systemic lupus erythematosus (SLE)
The view that estrogen is associated with systemic lupus erythematosus is widely known from the following:
1. Women who give birth to a child are nine times more likely to develop lupus erythematosus than men. Before puberty, the incidence of women is more than three times that of men, but in postmenopausal women, the incidence is similar to that of men of the same age. Numerous studies have shown that these gender differences are probably related to estrogen (Lahita RG, 1986: Springer Seminars in Immunopathology 9, 305-314; Krammer, GM and. Tsokos, GC, 1998 Clinical Immunology and Immunopathology 89: 192-195; Rider at al., 1998 Clinical Immunology and Immunopathology 180: 89.
[0020]
A clue to the role of estrogen in SLE came from studies that concluded that birth control pills had a detrimental effect on this condition (Buton, JP, 1996 Ann. Med. International, 147: 259-264). Julkunen, 1991: Scan. J. Rheumatol. 20: 427-433).
[0021]
2. A patient with Klinefilter syndrome (XXY) with SLE was reported (Stern et al., 1977: Arthritis and Rheumatism 20: 18-22).
[0022]
3. SLE patients have anti-estrogen antibodies (Feldman, 1987: Biochem. Biophys. Acta, 145: 1342-1348: Bucala et al., 1987: Clin. Exp. Immunol. 67: 167-175).
[0023]
In the past, birth control pills have been shown to cause SLE spontaneously, and up to the current belief that low doses are safe for SLE patients, the use of birth control pills in women with SLE has been agreed. (Julkunen HA Scand J Rheumatol 1991; 20 (6): 427-33). Similarly, hormone replacement therapy is also considered safe for SLE patients (Mok et al., Scand J Rheumatol 1998; 27 (5): 342-6: Kreidstein et al., 1997, J Rheumatol 1997 Nov). 24 (11): 2149-52).
[0024]
4. Tamoxifen, an estrogen antagonist, appears to improve disease progression (Sthoeger, 1997, Ann NY Acad Sci 1997 Apr 5; 815: 367-8: Sthoeger, 1994, J Rheumatol 1994: 12 (12); 2231-8).
[0025]
B. Estrogen, rheumatoid arthritis (RA) and osteoarthritis
The literature relating to estrogen in rheumatoid arthritis is less clear than osteoarthritis. In epidemiological studies, oral contraceptives delay the onset of RA, but estrogen alone does not reduce RA symptoms, suggesting that RA is affected by female hormones (Bijlsma Am J Reprod). Immunol 1992 Oct-Dec; 28 (3-4): 231-4). Estrogen adjuvant prescriptions increase bone density in postmenopausal women with RA and may provide protection against osteoporosis, which can often accompany RA (van den Brink: Ann Rheum Dis 1993 Apr; 52 (4): 302-5). The above study showed that estrogen did not reduce the symptoms of RA, and other studies concluded that even estrogen adjuvant therapy did not improve the symptoms. One polymorphism at the estrogen receptor that was thought to be associated with the age of RA onset was reported (Ushiyama Ann Rheum Dis 1999 Jan; 58 (1): 7-10).
[0026]
On the other hand, the fact that osteoarthritis is less likely to occur in postmenopausal women receiving estrogen replacement therapy (ERT) (Felson Curr Opin Rheumatol 1998 May; 10 (3): 269-72), suggests that ERT prevents osteoarthritis. Suggests that it might be useful.
[0027]
C. Estrogen and osteoporosis
Osteoporosis is a bone disease that causes the bones to become brittle and at risk of fracture. Treatment of postmenopausal women with osteoporosis involves the replacement of hormones, especially estrogens. Estrogen reduces bone loss and the occurrence of fractures (Weiss et al., N Engl J Med 1980 Nov 20; 303 (21): 1195-8: Paganini-Hill et al., Ann Intern Med 1981 Jul; 95 ( 1): 28-31: Ettinger et al., Ann Intern Med 1985 Mar; 102 (3): 319-24).
[0028]
In addition, polymorphisms at the estrogen receptor have been associated with bone loss in both humans and mice. (Kobayashi J Bone Miner Res 1996 Mar; 11 (3): 306-11: Kurabayashi Am J Obstet Gynecol 1999 May; 180 (5): 11115-20; Deng Hum Genet 1998-85; 103; .
[0029]
Estrogen and cognitive function
Women are at higher risk for Alzheimer's disease than men. Several studies have shown that estrogen use can reduce the incidence of Alzheimer's disease in postmenopausal women. Even in women with Alzheimer's disease, the use of estrogens reduces serious symptoms and slows the decline in intelligence. The risk is lowest for women who use it for a long time (10 years or more). However, the effect was also obtained in women who used it for a short time.
[0030]
Estrogen and breast cancer
The major risk factors for developing breast cancer are sex, age, family breast cancer history, age at menarche, age at first term pregnancy, and age at menopause. All of these factors (except family history) have been shown to be directly related to estrogen secretory lifespan, and increased hormone secretion is associated with increased risk of breast cancer. The increased risk of cancer has been attributed to estrogen receptor-mediated proliferative responses in breast epithelial cells.
[0031]
Tamoxifen, an estrogen receptor antagonist, has been shown to be a drug that is effective in both preventing and treating breast cancer. By using immunohistochemical methods, breast tumors can be classified as estrogen receptor positive or negative according to the amount of estrogen receptor protein expressed in the tissue. Estrogen receptor positive tumors respond better to treatment with tamoxifen than estrogen receptor negative tumors. Premenopausal women develop estrogen receptor-negative breast cancer more often than postmenopausal women.
[0032]
Mutations in the structure and function of the estrogen receptor have been described in early breast tumor or breast cancer cell lines. However, it is not clear whether these changes are primary (and related to the process leading to carcinogenesis) or secondary (and the consequence of gene instability in cancer tissue). Furthermore, in addition to these body mutations, several studies have pointed to a possible relationship between genetic DNA sequence alterations and breast cancer development, but these are also controversial.
[0033]
And, more recently, as evidence for the role of estrogen receptors in breast cancer, it has been discovered that the gene BRCA1, inherited in a mutant that predisposes to breast cancer development, suppresses estrogen receptor signaling.
[0034]
Estrogen and endometrial cancer
Endometrial cancer is the most common pelvic malignancy in women, but can usually be cured by hysterectomy, as about 75% are found in the uterus at the time of diagnosis. Excessive exposure of endometrial cells to estrogen dramatically increases the chance of developing uterine cancer cells, so hormone replacement therapy with estrogen alone should not be given to women with an intact uterus. Periodic or continuous administration of progesterone helps prevent excessive proliferation of endometrial cells and may increase the risk of endometrial cancer in postmenopausal women who are prescribed estrogen as part of hormone replacement therapy. Reduce.
[0035]
In many cases of endometrial cancer, the estrogen receptor is expressed, and in general, estrogen-responsive tumors can be suitably predicted. Acquired (body) mutations are said to be up to 8.5%, but the role of the mutation in the development and progression of endometrial cancer is currently unclear.
[0036]
Although somewhat controversial, studies suggest that the use of tamoxifen has increased the chances of developing endometrial cancer. This indicates that, in addition to the role of estrogen receptor blockade, tamoxifen has partial receptor agonist activity and down-regulates estrogen responsive genes that induce endometrial proliferation.
[0037]
It is important to gain the development of estrogen receptors in mediating / modulating various diseases, identify sequence polymorphisms in estrogen receptors, and correlate them with disease states, therapeutic effects, and the like. The present invention advances these techniques by providing various previously unknown ESR-alpha protein polymorphisms.
[0038]
SNP
The genomes of all organisms undergo spontaneous mutations during the evolution process, producing mutated forms of ancestral sequences (Gusella, Ann. Rev. Biochem. 55, 831-854 (1986)). Mutant forms may be advantageous or inconvenient in terms of evolution compared to ancestral forms, or may not be relevant. For example, if a mutant suffers a fatal inconvenience, it will not be passed on to later generations. If, on the other hand, the mutant form is favorable to the evolution of the species, it will be incorporated into much or most of the DNA of that species, effectively becoming the ancestral form. In addition, the effects of the variant may be both beneficial and deleterious, depending on the situation. For example, heterozygous sickle cell mutations have resistance to malaria, whereas homozygous sickle cell mutations are usually fatal. In many instances, ancestral and mutant forms coexist in species. The coexistence of multiple forms of the sequence causes polymorphisms such as SNPs.
[0039]
The reference allelic form is arbitrarily indicated, for example, the most prevalent form or the first specified allelic form, while the other allelic form is indicated as an alternative, mutated, polymorphic allele. The most frequently occurring allelic form in the chosen population is called the "wild-type" form.
[0040]
About 90% of polymorphisms in the human genome are single nucleotide polymorphisms (SNPs). The location or location of a SNP usually follows a highly protected allele (a sequence that varies by 1/100 or 1/1000 or less of the population). The allele at each SNP position in an individual may be homozygous or heterozygous. As identified in the present invention, the least frequent allele at the SNP location is less frequent than the more frequent allele and less than 1%. In some examples, the SNP is referred to as "cSNP", meaning that the nucleotide sequence containing the SNP is an amino acid coding sequence.
[0041]
SNPs occur when one nucleotide at a polymorphic site is replaced by another. Substitution occurs by transposition or conversion. Transfer is the exchange of a purine nucleotide for another purine nucleotide or for a pyrimidine nucleotide. Conversion is the conversion of a purine into a pyrimidine or vice versa. SNPs may also be in a mutated form (called indel) with one base inserted or deleted. Substitution of an amino acid for another amino acid in codon coding is called a non-synonymous codon mutation or missense mutation. Synonymous codon mutations or silent mutations do not result in amino acid mutations due to the degeneracy of the genetic code. Nonsense mutations are non-synonymous codon mutations that form a stop codon, leading to premature termination of the polypeptide chain and incomplete protein.
[0042]
SNPs can in principle be bi-, tri-, tetra- alleles. However, tri- and tetra- are extremely rare and almost nonexistent (Brookes, Gene 234 (1999) 177-186). For this reason, SNPs are often referred to as “bi-allele markers” or “di-allele markers”.
[0043]
A causal SNP is a SNP that causes a change in gene expression or functional expression of a gene product, and in most cases, can predict a clinical phenotype. These include SNPs that enter the gene region encoding the polypeptide product, ie, cSNPs. These SNPs result in alterations in the amino acid sequence of the polypeptide product (ie, non-synonymous codon mutations) and may cause deletion or expression of other mutated proteins. Furthermore, in the case of nonsense mutations, SNPs may lead to premature termination of the polypeptide product. Such mutated products can result in a disease state, for example, a genetic disease. Examples of genes having polymorphisms in the coding sequence cause genetic diseases including sickle cell anemia and cystic fibrosis. The causal SNP need not necessarily occur in the coding region, but can occur in any region that ultimately affects the expression and / or activity of the protein encoded by the nucleic acid. These gene regions include gene regions related to transcription of SNPs and the like in the promoter region; SNPs in the intron-exon boundary that cause defective pricing, and SNPs and the like in mRNAs that process signal sequences such as polyadenylation signal regions. Contains related gene regions. For example, SNPs suppress splicing of introns, causing mRNAs containing premature stop codons, which may lead to defective proteins. Therefore, the SNP in the regulatory region greatly affects the expression.
[0044]
Some SNPs that are not causative SNPs are still closely related and segregated with the disease-causing sequence. In this case, the presence of the SNP correlates with the presence or susceptibility of the disease. These SNPs are very useful for diagnostics and screening for susceptibility to disease.
[0045]
Clinical trials have shown that patients' responses to treatment with drugs are often heterogeneous. Therefore, it may be necessary to improve the design and treatment of medicines. SNPs can be used to determine the particular drug that is most appropriate for treating a patient (this is often referred to as "pharmacogenomics"). Pharmacogenomics can also be used in the drug selection process in pharmaceutical research. (Linder et al. (1997), Clinical Chemistry, 43, 254; Marshall (1997), Nature Biotechnology, 15, 1249; , 16, 3)
[0046]
Group study
Population genetics is a study of how Mendel's laws and other genetic principles are applied across populations. Such research is essential for a proper understanding of evolution. This is because evolution is basically the result of innovative changes in the genetic makeup of a population. Therefore, population genetics seeks to understand and predict the effects of genetic phenomena, such as segregation, recombination, and mutation, while at the same time, population size, mating patterns, individual geographic distribution, migration, And ecological and evolutionary factors such as natural selection must be considered.
[0047]
Ideally, how to discuss population gene types and frequencies in order to understand how population genes are organized and to predict population changes resulting from natural or artificial selection. It is desired to understand.
[0048]
To explain many of these issues, it is important to understand the relationships (linkages) that exist between loci.
[0049]
Linkage is a co-inheritance of two or more non-allelic genes because the loci are in close proximity on the same chromosome, and more than 50% of the predicted non-linked genes are associated after meiosis . It is clear that there is a physical crossover during meiosis and that there is a physical exchange of maternal and paternal genetic contributions between individual chromatids during germ cell generation. This exchange necessarily resulted in the separation of genes in the chromosomal regions that were adjacent to each parent and mixing with the remaining sequences, resulting in “recombination”. The process of generation of recombination by meiotic crossover is an important feature in the rearrangement of genetic characteristics and is central to understanding gene transfer.
[0050]
Recombination generally occurs between large segments of DNA. This means that the adjacent region of DNA and the gene are linked. Conversely, regions of DNA far apart from each other on a given chromosome also appear to be apart during the process of crossover.
[0051]
Molecular markers can be used to reveal recombination events that occur during meiosis. Different length (CA)nSome markers that are repeats of are ubiquitous in human DNA, have a slight selection pressure on their length, and are used as position markers and chromosomal localization features. These markers can be used to distinguish paternally derived genes from maternally derived gene regions.
[0052]
Other markers are single nucleotide polymorphisms (SNPs), which are bi-allelic markers, which can also be used to analyze the transmission of these markers to progeny.
[0053]
The pattern of a set of markers along a chromosome is called a "haplotype." And alleles on the same small chromosomal segment tend to be transmitted as blocks throughout the pedigree. By analyzing haplotypes in offspring of a parent whose haplotype is known, it is possible to confirm which parental segment in which chromosome was transmitted to which child. If not broken by recombination, the haplotype can be considered as an allele of a single highly polymorphic locus for mapping purposes.
[0054]
The preferential generation of a virulence gene associated with a particular allele of a linkage marker is called "linkage disequilibrium" (LD). This type of imbalance generally means that most pathogenic chromosomes carry the same mutation, and that the marker tested is very close to the virulence gene. For example, there is a lot of linkage disequilibrium throughout the HLA locus. The A3 allele is in LD along with the B7 and B14 alleles, so that B7 and B14 are highly associated with hemoglobinosis. Thus, the HLA classification alone can significantly alter the estimate of hemoglobin disease risk, even if other family members are not available for formal linkage analysis. As a result, haplotype determinations can be made with or without affecting families by using a combination of several markers around the putative gene location.
[0055]
Association analysis and linkage disequilibrium mapping based on SNP
SNPs are useful in association studies to identify specific SNPs or other polymorphisms associated with a pathological condition, such as breast cancer. Association studies may be performed within a general population and are not limited to studies performed on individuals in affected families (linkage studies). Association studies with SNPs involve determining the frequency of SNP alleles in many patients with significant disorders (eg, breast cancer), as well as controls of similar age and history. Proper selection of patients and controls is critical to the success of SNP association studies. Therefore, a set of individuals with a well-characterized phenotype is highly desirable. For example, to find an association between a particular SNP genotype and a known phenotype, blood pressure and heart rate can be correlated with the SNP pattern of a hypertensive person whose physiological parameters are known. . Significant associations between a particular SNP or SNP haplotype and phenotypic traits can be determined by standard statistical methods. Association analysis can be performed directly or based on LD. In direct association analysis, a causative SNP that is a candidate for a pathogenic sequence is tested.
[0056]
In LD-based SNP association analysis, random SNPs are tested in large genomic regions (or the entire genome) to find SNPs in LD, with either true pathogenic sequences or pathogenic SNPs. For this study, a high-density SNP map was used to detect associations, such that the random SNPs were located close enough to the unknown virulence loci to be in linkage disequilibrium by that locus. is necessary. SNPs tend to occur frequently and are evenly spaced throughout the genome. The frequency and homogeneity of SNPs means that they are more likely to be found in close proximity to the pathogenic gene location compared to other types of polymorphisms, such as tandem repeat polymorphisms. SNPs are also more mutationally stable than tandemly repeated polymorphisms such as VNTR. With LD-based association studies, it is possible to discover genes susceptible to disease without prior knowledge of what genes are and where.
[0057]
However, currently there is no feasible SNP association study in all human genomes, and candidate genes associated with breast cancer are targeted for SNP identification and association analysis. In studying candidate genes, a priori knowledge of the cause of the disease is used to identify genes that are assumed to directly affect disease development. Studies of candidate genes may focus on genes that are directly targeted by drugs used to treat the disease. To find SNPs associated with increased infectivity of breast cancer, candidate genes are selected from systems that are physiologically involved in the disease pathway. SNPs found in these genes are tested for a statistical association with the disease in sick individuals, as compared to appropriate controls. Studying candidate genes significantly reduces the number of candidate SNPs and the number of individuals that need to be categorized and compared to LD-based association studies of random SNPs over a large (or complete genomic region) Has the advantage of being able to. Furthermore, candidate gene studies do not predict the LD range of specific regions of the genome.
[0058]
Association studies (including linkage disequilibrium-based genome-wide association), combined with the use of densely spaced maps of well-spaced and well-informed SNP markers, have led to the identification of most diseases associated with complex diseases such as breast cancer. Can be identified. This improves the selectivity of candidate genes, including the causal SNP associated with a particular disease. All of the SNPs disclosed in the present invention can be used for part of genome wide association studies or candidate gene association studies.
[0059]
The present invention advances the state of the art and provides commercially useful examples by providing previously unknown SNPs in the estrogen receptor gene.
[0060]
Summary of the Invention
The present invention is based on the sequencing of genomic DNA and cDNA from human chromosome 6, defining the genomic structure of the estrogen receptor alpha gene, a novel polymorphism of the estrogen receptor gene / protein, and an unknown haplotype. Such polymorphisms / haplotypes can lead to various diseases mediated / modulated by mutant estrogen receptors, such as susceptibility to cancer, osteoporosis, cardiovascular disease and the like. Based on this sequencing approach, the present invention detects genomic nucleotide sequences, cDNA sequences, amino acid sequences, sequence polymorphisms in the ESR-alpha gene, haplotypes of these polymorphisms, and these sequences / polymorphisms in a sample. Methods of determining the risk of developing or developing a disease mediated by a mutant estrogen receptor and methods of screening compounds used to treat a disease mediated by a mutant estrogen receptor .
[0061]
DETAILED DESCRIPTION OF THE INVENTION
General description
The present invention is based on the sequencing of genomic DNA from human chromosome 6 and cDNA to define the genomic structure of the estrogen receptor alpha gene, novel polymorphisms of the estrogen receptor gene / protein, and unknown haplotypes. . Such polymorphisms / haplotypes can lead to various diseases, such as cancer, osteoporosis, and susceptibility to cardiovascular disease, which are mediated / modulated by mutant estrogen receptors. Based on this sequencing approach, the present invention detects genomic nucleotide sequences, cDNA sequences, amino acid sequences, sequence polymorphisms in the ESR-alpha gene, haplotypes of these polymorphisms, and these sequences / polymorphisms in a sample. Methods of determining the risk of developing or developing a disease mediated by a mutant estrogen receptor and methods of screening compounds used to treat a disease mediated by a mutant estrogen receptor .
[0062]
Isolated SNP-containing nucleic acid molecule
The present invention provides an isolated nucleic acid molecule comprising one or more SNPs disclosed by the present invention. The invention further provides an isolated nucleic acid molecule that encodes the mutant protein. Such a nucleic acid molecule consists, consists essentially of, or comprises one or more SNPs according to the invention. Nucleic acid molecules can have additional nucleic acid residues. Such nucleic acid residues are, for example, those naturally associated with the nucleic acid molecule or a heterologous nucleotide sequence.
[0063]
Here, an "isolated" SNP-containing nucleic acid molecule includes a SNP of the present invention and is separated from other nucleic acids present in the natural source of the nucleic acid. Generally, an isolated SNP-containing nucleic acid as used herein comprises one or more of the SNP positions disclosed by the present invention with flanking nucleotide sequences on either side of the SNP. The flanking sequence, if used for a detection reagent, is preferably up to about 300 bases, up to 100 bases, up to 50 bases, up to 30 bases, up to 15 bases, up to 4 bases, or up to 4 bases, or If used to generate proteins containing the coding variants disclosed in the figures, the length of the entire protein coding sequence will be on either side of the SNP position. The important point is that the nucleic acid is isolated from distant and insignificant flanking sequences, and that recombinant expression, preparation of probes and primers for SNP positions, and other features specific to SNP-containing nucleic acid sequences It is of an appropriate length to allow for the particular operations or uses disclosed herein, such as use.
[0064]
In addition, an "isolated" nucleic acid molecule, such as a cDNA molecule containing a SNP position of the invention, may be produced by recombinant techniques, chemical precursors, or other chemicals when chemically synthesized. It may be substantially free of cellular material or culture media. However, the nucleic acid molecule can be fused to other coding or regulatory sequences, and still be considered isolated. For example, a recombinant DNA molecule contained in a vector is considered isolated. Further examples of an isolated DNA molecule include a recombinant DNA molecule retained in an atypical host cell, or a purified (partially or substantially) DNA molecule in solution. Isolated RNA molecules include in vivo or in vitro RNA transcripts of the isolated SNP-containing DNA molecules of the invention. Isolated nucleic acid molecules according to the present invention further include molecules that are synthetically produced.
[0065]
An isolated SNP-containing nucleic acid molecule can be in the form of RNA, such as mRNA, or in the form of DNA. This DNA includes cDNA and genomic DNA obtained by cloning, produced by chemical synthesis techniques, or produced by a combination thereof. Nucleic acids, especially DNA, can be double-stranded or single-stranded. Single-stranded nucleic acids can be the coding strand (sense strand) or the non-coding strand (antisense strand).
[0066]
The invention further provides related nucleic acid molecules that hybridize under stringent conditions to the nucleic acid molecules disclosed herein. As used herein, “hybridization under stringent conditions” means that the nucleotide sequences encoding peptides having at least 60 to 70% homology to each other generally hybridize and remain hybridized to each other. It means the condition for performing the washing. The conditions may be such that sequences that are at least 60%, 70%, 80%, 90% or more homologous to each other are usually still hybridizing to each other. Such stringent conditions are known to those skilled in the art, and are described in Current Protocols in Molecular Biology, John Wiley & Sons, NJ. Y. (1989), 6.3.1-6.3.6. One example of hybridization under stringent conditions is hybridization at about 45 ° C. with 6 × sodium chloride / sodium citrate (SSC), followed by 50 × 65 ° C. with 0.2 × SSC, 0.1% SDS. The condition is that washing is performed at least once. Examples of moderating to low stringent hybridization conditions are well known in the art.
[0067]
Specific examples
Peptide molecule
[0068]
The present invention provides nucleic acid sequences encoding variants of the estrogen receptor. These variant molecules / sequences are referred to herein as estrogen receptor variants of the invention, estrogen receptor proteins of the invention, or peptides / proteins of the invention.
[0069]
The present invention provides an isolated estrogen receptor protein molecule consisting of, consisting essentially of, or comprising the amino acid sequence of an estrogen receptor mutant protein disclosed herein.
[0070]
Here, a protein or peptide is said to be "isolated" or "purified" if it is substantially free of cellular material or substantially free of chemical precursors or other chemicals. The peptides of the invention can be purified to homogeneity or to some degree of purity. The level of purification is based on the intended use. An important feature is that the preparation can perform the desired function of the peptide, even in the presence of significant amounts of other components.
[0071]
As used herein, "substantially free of cellular material" refers to at least about 30% (dry weight) or less of other proteins (ie, contaminated proteins), 20% or less of other proteins, and 10% or less of other proteins. Or the preparation of peptides having 5% or less of other proteins. If the peptide is produced recombinantly, it is substantially free of culture medium, ie, the culture medium is less than about 20% of the protein preparation.
[0072]
"Substantially free of chemical precursors or other chemicals" includes the preparation of peptides in which the peptide is isolated from the chemical precursors or other chemicals involved in its synthesis. In certain examples, “substantially free of chemical precursors or other chemicals” refers to at least about 30% or less (dry weight) or less of chemical precursors or other chemicals, 20% or less of chemical precursors or Including the preparation of estrogen receptor proteins with less than 10% of other chemicals or less than or equal to 5% of chemical precursors or other chemicals.
[0073]
The isolated estrogen receptor protein can be purified from cells that naturally express it, can be purified from cells mutated to express it (recombinant), or known protein synthesis techniques. Can be used for synthesis. For example, a nucleic acid molecule encoding an estrogen receptor protein is cloned into an expression vector, the expression vector is introduced into a host cell, and the protein is expressed in the host cell. The protein can then be isolated from the cells by a suitable purification process using standard protein purification techniques. Many of these techniques are described below.
[0074]
Accordingly, the present invention provides a protein comprising one or more of the sequence polymorphisms given in FIG. 2 and comprising the amino acid sequence outlined in FIG. If the amino acid sequence is the final amino acid sequence of the protein, the protein consists of the amino acid sequence.
[0075]
The invention further provides a protein comprising one or more of the sequence polymorphisms given in FIG. 2 and consisting essentially of the amino acid sequence outlined in FIG. If the amino acid sequence is, for example, only a small amount of additional amino acid residues present in the final protein, the protein consists essentially of that amino acid sequence.
[0076]
Further, the present invention provides a protein comprising the amino acid sequence of FIG. 1 comprising one or more of the sequence polymorphisms given in FIG. If the amino acid sequence is at least part of the final amino acid sequence of the protein, the protein comprises the amino acid sequence. Thus, the protein may be the peptide alone, or additional amino acid sequences, such as amino acid residues that are naturally linked to the protein or that are atypical amino acid residues / peptide sequences (adjacent coding sequences). Can have. Such proteins can have several additional amino acid residues, or can include hundreds or more additional amino acids. The method for preparing / isolating these various proteins is briefly described below.
[0077]
The estrogen receptor proteins of the present invention may be conjugated to heterologous sequences to form chimeric or fusion proteins. Such chimeric or fusion proteins include an estrogen receptor protein operably linked to a variant protein having an amino acid sequence that is not substantially homologous to the estrogen receptor protein. "Operably linked" indicates that the estrogen receptor protein and the atypical protein fuse in frame. Variant proteins can be fused to the N-terminus or C-terminus of the estrogen receptor protein.
[0078]
Here, the fusion protein has essentially no effect on the activity of the estrogen receptor protein. For example, fusion proteins include, but are not limited to, enzyme fusion proteins, such as beta-galactosidase fusions, yeast two-hybrid GAL fusions, poly-His fusions, MYC labels, HI labels, Ig fusions. Such fusion proteins, particularly poly-His fusions, can facilitate purification of the recombinant estrogen receptor protein. In certain host cells (eg, mammalian host cells), protein expression and / or secretion can be increased through the use of atypical signal sequences.
[0079]
Chimeric or fusion proteins can be produced by standard recombinant DNA techniques. For example, DNA fragments encoding different protein sequences are framed together by conventional techniques. In another example, the fusion gene can be synthesized by conventional techniques, including automatic DNA synthesizers. Alternatively, a PCR amplification of gene fragments can be performed using an anchor primer that produces a complementary overhang between two consecutive gene fragments, followed by annealing and reamplification to produce a chimeric gene sequence (Ausubel et al. al., Current Protocols in Molecular Biology, 1992). In addition, many expression vectors are commercially available that already encode a fusion moiety (including, for example, GST protein). A nucleic acid encoding an estrogen receptor protein can be cloned into an expression vector or the like by linking the fusion moiety to the estrogen receptor protein in frame.
[0080]
Polypeptides often contain amino acids other than the 20 amino acids commonly referred to as the 20 naturally-occurring amino acids. In addition, many amino acids, including terminal amino acids, are modified by natural processes, processing or post-translational modifications, or chemical modification techniques well known in the art. Typical modifications that occur naturally in polypeptides are described in basic books, detailed major dissertations, and research literature, and are well known to those skilled in the art. Thus, the polypeptide is a derivative or analog in which the substituted amino acid residue is not encoded by the genetic code; a derivative or analog containing the substituent; the mature polypeptide increases the half-life of the polypeptide Derivatives or analogs fused to other compounds (eg, polyethylene glycol), such as compounds; additional amino acids, such as leader or secretory sequences, or sequences for purification of mature transporter peptides or proproteins, Derivatives or analogs fused to the peptide are included.
[0081]
Known modifications include acetylation, acylation, ADP-ribosylation, covalent attachment of flavin, covalent attachment of half of heme, covalent attachment of nucleotides or nucleotide derivatives, covalent attachment of lipids or lipid derivatives, phosphotidylinositol Bond, crosslink, cyclization, disulfide bond formation, dimethylation, formation of covalent crosslink, formation of cystine, formation of pyroglutamine, formylation, gamma carboxylation, glycosylation, GPI anchor formation, hydration, iodine Transfer RNA-mediated addition of amino acids to proteins, including acetylation, methylation, myristoylation, oxidation, proteolytic processing, phosphorylation, prenylation, racemization, selenoylation, sulphation, arginylation, and ubiquitination. It is not limited to.
[0082]
Such modifications are well known to those skilled in the art and have been described in great detail in the scientific literature. Some commonly used modifications, such as glycosylation, lipid binding, sulfation, gamma carboxylation of glutamic acid residues, hydration, and ADP ribosylation are described in most textbooks. Such a basic book includes Proteins-Structure AND Molecular Properties, 2nd Ed. , T .; E. FIG. Creighton, W.C. H. Freeman AND Company, New York (1993). Many detailed commentaries on this subject are available, see for example, Wold, F .; B., Posttranslational Covalent Modification of Proteins, B .; C. Johnston, Ed. , Academic Press, New York 1-12 (1983); Seifter et al. (Meth. Enzymol. 182: 626-646 (1990)) AND Rattan et al. (Ann. NY Acad. Sci. 663: 48-62 (1992)).
[0083]
The present invention further provides fragments of the estrogen receptor proteins of the present invention, as well as proteins and peptides comprising and consisting of these fragments. However, the fragments of the present invention do not include the fragments published prior to the present invention.
[0084]
Here, the fragment contains eight or more adjacent amino acid residues from the estrogen receptor protein. The fragments may be selected based on their ability to retain one or more biological activities of the estrogen receptor protein, or may be selected for their ability to perform a function (eg, acting as an immune antigen). . Particularly important fragments are biologically active fragments, peptides, which are, for example, about 8 or more amino acids in length and include mutated amino acid residues (FIG. 2). Such fragments usually comprise a domain or motif of an estrogen receptor protein of the invention, such as an active site, a ligand binding domain, or a DNA binding domain. Further possible fragments include, but are not limited to, fragments containing domains or motifs, soluble peptide fragments, and fragments containing immunogenic structures. Predicted domains and functional sites can be readily identified by computer programs known to the skilled artisan and readily available (eg, PROSITE analysis).
[0085]
Use of proteins / peptides
The proteins of the invention may be used to increase antibodies or elicit other immune responses; in assays designed to quantitatively determine the level of protein (or its binding partner or receptor) in biological fluids. As reagents (including labeling reagents); as markers for tissues in which the corresponding protein is preferentially expressed (formally or at a particular stage of tissue differentiation or development, or in disease states); high-throughput screening To determine the biological activity of a protein, including a large number of protein panels. Any or all of these research applications can be developed into reagent grade or kit formats for commercialization as research products. Methods for achieving the above uses are known to those skilled in the art. References disclosing such a method include "Molecular Cloning: A Laboratory Manual", 2d ed. , Cold Spring Harbor Laboratory Press, Sambrook, J. et al. , E .; F. Fritsch AND T. Maniatis eds. 1989, and "Methods in Enzymology: Guide to Molecular Cloning Technologies", Academic Press, Berger, S.M. L. AND A. R. Kimmels eds. , 1987.
[0086]
The estrogen receptor proteins of the present invention are useful in biological assays. The assay also involves properties or activities of known estrogen receptors, or properties that are useful for diagnosing and treating conditions associated with estrogen receptors.
[0087]
The estrogen receptor proteins of the present invention are also useful in drug screening assays in cell-based or cell-free systems. Cell-based systems may be native, ie, cells that normally express the receptor protein, may be biopsied, or may be expanded into cell culture. However, in certain instances, cell-based assays involve recombinant host cells that express the receptor protein.
[0088]
The estrogen receptor proteins of the present invention can be used to identify compounds that modulate receptor activity. Both the estrogen receptor proteins and appropriate fragments of the invention can be used as high-throughput screens to test candidate compounds for their ability to bind and / or modulate the activity of the receptor. These compounds can be further screened against a functional receptor to determine the effect of the compound on receptor activity. In addition, these compounds can be tested on animal or invertebrate systems to determine activity / effect. Compounds that activate (agonist) or inactivate (antagonist) the receptor to the desired degree are identified. Such compounds are selected for their ability to act on one or more of the mutant estrogen receptor proteins of the present invention.
[0089]
In addition, receptor polypeptides can be used to screen compounds for their ability to stimulate or inhibit the interaction between a receptor protein and a molecule of interest that normally interacts with the receptor protein (eg, estrogen). . The subject can be a ligand or binding partner (eg, an estrogen ligand or DNA sequence) with which the receptor protein normally interacts. Such assays typically bind the receptor protein to a candidate compound under conditions in which the receptor protein or fragment interacts with the molecule of interest, and detect the formation of a complex between the protein and the subject, or Or detecting the biological consequences of the interaction between the protein and the subject.
[0090]
The candidate compounds include, for example, the following. 1) Ig-tail fusion peptides, and members of random peptide libraries (see, for example, Lam et al., Nature 354: 82-84 (1991); Houghten et al., Nature 354: 84-86 (1991)) and D Peptides, such as soluble peptides, including members of a chemically-derived molecular library made from type and / or L-type amino acids; 2) phosphopeptides (eg, random and partially degenerate members of a phosphopeptide library (eg, Songyang et al.). , Cell 72: 767-778 (1993)); 3) Antibodies (e.g., Fab, F (ab ') 2, Fab expression library fragments, epitope binding fragments of antibodies as well as polyclonal, monoclonal, Humanized, anti-idiopic, chimeric, and single-chain antibodies); 4) small organic, inorganic molecules (eg, molecules obtained from combinatorial and natural product libraries).
[0091]
Certain candidate compounds include soluble fragments of the receptor that compete for ligand binding. Other candidate compounds include mutant receptors or suitable fragments containing mutations that affect receptor function, which result in competition with the ligand. Thus, for example, fragments that compete with the ligand with high affinity, or that bind to and remain with the ligand are included in the invention.
[0092]
The invention further includes terminal assays to identify compounds that modulate (stimulate or inhibit) the activity of the receptor. This assay usually involves an assay of behavior in a signal transduction pathway indicative of receptor activity. For example, the expression of a gene that is up or down regulated in response to a signal cascade that depends on the receptor protein can be assayed. In certain instances, the regulatory region of such a gene can be operatively linked to a readily detectable marker such as luciferase. Alternatively, phosphorylation of the receptor protein or receptor protein subject can also be measured. Any biological or biochemical function mediated by the receptor can be used as a terminal assay. These include all biochemical or biochemical / biological phenomena, and other functions known to those skilled in the art, incorporated herein by reference to these terminal assays, as described herein.
[0093]
Receptor polypeptides are also useful as competitive binding assays in methods designed to discover compounds that interact with the receptor. The compound is exposed to the receptor polypeptide under conditions that cause the compound to bind or otherwise interact with the polypeptide. A ligand for the receptor is also added to the mixture. When the test compound interacts with the receptor or ligand, it reduces the amount of complex formed or activity from the receptor subject. This type of assay is particularly useful when looking for compounds that interact with specific regions of the receptor.
[0094]
To perform a cell-free drug screening assay, a receptor protein, fragment, or peptide is used to facilitate the automation of the assay while facilitating separation of the complex from the uncomplexed form of one or both proteins. It may be desirable to immobilize the molecule of interest.
[0095]
Techniques for immobilizing proteins on matrices can be used in drug screening assays. In one example, a fusion protein is provided that adds a domain where the protein is bound to a matrix. For example, the glutathione-S-transferase / 15625 fusion protein can be adsorbed to glutathione sepharose beads (Sigma Chemical, St. Louis, MO) or glutathione-derivatized microtiter plates. This is followed by a cell lysate (eg,35S) and the candidate compound, and the mixture is cultured under conditions that lead to complex formation (eg, physiological conditions of salt and pH). Following incubation, the beads are washed to remove unbound label, matrix immobilization is performed, and the radiolabel is determined either directly or in the supernatant after dissociation of the complex. Alternatively, the complex can be dissociated from the matrix, separated by SDS-PAGE, and the level of receptor binding protein found in the bead fraction quantified from the gel using standard electrophoresis techniques. For example, the polypeptide or its target molecule can be immobilized using conjugation of biotin and steptavidin using a conventionally well-known technique. Alternatively, an antibody that is reactive with the protein but does not interfere with the binding of the protein to the molecule of interest is derivatized into the wells of the plate, and the protein is trapped in the wells by conjugation of the antibody. Preparations of the receptor binding protein and the candidate compound are cultured in the cavity in which the receptor protein is present, and the complexes trapped in the cavity can be quantified. Methods for detecting such complexes include those described above for GST-immobilized complexes, as well as enzyme-linked assays by detecting enzyme activity associated with the molecule of interest, as well as receptor protein targets. Includes immunodetection of the conjugate using an antibody that is reactive with the molecule or with the receptor protein and competes with the molecule of interest.
[0096]
The protein-modulating reagents of the present invention can be identified by using one or more of the above assays alone or in combination. It is generally preferred to use a cell-based or cell-free system first and then confirm activity in an animal or other model system. Such model systems are well known in the art and can be used immediately in this circumstance. Receptor protein modulators identified by these drug screening assays can be used to treat patients with a receptor mediated disease by treating cells that express the estrogen receptor protein. These methods of treatment include the step of administering to the patient a modulator of protein activity in a pharmaceutical composition as disclosed herein, as needed for treatment.
[0097]
The invention further belongs to the novel reagents identified by the screening assays described above. Therefore, it is within the scope of the present invention to further use a reagent identified as disclosed herein in a suitable animal model. For example, a reagent identified as disclosed herein (e.g., an estrogen receptor modulating reagent, an antisense estrogen receptor nucleic acid molecule, an estrogen receptor specific antibody, or an estrogen receptor binding partner) can be treated with such a reagent. Can be used in animal models to determine the efficacy, toxicity, and side effects of the drug. Alternatively, reagents identified as disclosed herein can be used in animal models to determine the mechanism of action of such reagents. Further, the present invention relates to the use of the novel reagents identified by the above-described screening assays for treatment as disclosed herein.
[0098]
The estrogen receptor proteins of the present invention are also useful for providing a subject for diagnosing a disease or susceptibility to a disease mediated by estrogen receptors. Accordingly, the invention provides a method for detecting the presence or level of an estrogen receptor variant (or encoding mRNA) of the invention in a cell, tissue, or organism. The method includes contacting a biological sample with a compound capable of interacting with a receptor protein (or a gene encoding a receptor, mRNA) such that the interaction is detected.
[0099]
One reagent for detecting a protein in a sample is an antibody that can selectively bind to a mutant form of the estrogen receptor protein. Such samples include tissues, cells, and biological fluids present in the patient as well as tissues, cells, and biological fluids separated from the patient.
[0100]
The estrogen receptor protein of the present invention also provides a subject for diagnosing ongoing illness, susceptibility to illness in a patient having a mutant estrogen receptor. The diseases herein include those via estrogen, such as bone growth and cell differentiation. For example, the receptor can be isolated from a biological sample and assayed for the presence of a genetic mutation that results in an aberrant form of receptor activity. This includes amino acid substitutions, deletions, insertions, rearrangements (as a result of aberrant splicing phenomena), and the appropriate post-translational corrections given in FIG. Analytical methods include altered electrical conductivity, altered trypsin digestion, altered receptor activity in cell-based or cell-free assays, altered ligand or antibody binding patterns, altered isoelectric points, direct amino acid sequencing, and mutations in proteins. And other known assay techniques useful for detecting Particularly useful are the variations given in FIG.
[0101]
In vitro techniques for detecting peptides include enzyme linked immunosorbent assays (ELISAs), western blots, immunoprecipitations, and immunofluorescence. Alternatively, the peptide can be detected in the patient in vivo by introducing a labeled anti-peptide antibody into the patient. For example, an antibody can be labeled with a radioactive marker whose presence and location in a patient can be detected by standard imaging techniques. Particularly useful are methods for detecting specific allelic variants of the estrogen receptors disclosed herein, as well as methods for detecting fragments of a peptide in a sample, which are expressed in a patient.
[0102]
The peptides are also useful for pharmacogenomic analysis. Pharmacogenomics deals with genetic variants that are clinically significant for response to drugs due to alterations in the drug processing process and abnormal effects in patients. See, for example, Eichelbaum, M .; (Clin. Exp. Pharmacol. Physiol. 23 (10-11): 983-985 (1996)) and Linder, M .; W. (Clin. Chem. 43 (2): 254-266 (1997)). The clinical consequences of these mutations are that in some individuals the therapeutic agent becomes severely toxic as a result of mutations in metabolic individuals, and in others the drug treatment fails. Thus, an individual's genotype may determine the way in which the therapeutic compound acts on the body, or the way in which the body metabolizes the compound. In addition, the activity of drug metabolizing enzymes affects both the strength and length of drug action. Thus, the pharmacogenomics of an individual can select an effective compound and an effective dosage of the compound for prophylactic or therapeutic treatment based on the genotype of the individual. The discovery of genetic polymorphisms in some drug metabolizing enzymes indicates that standard drug administration may not achieve the expected drug effect, show excessive drug effect, or experience severe toxicity in some patients I will explain. Polymorphisms can be expressed in broad metabolic and poor metabolic gene phenotypes. Thus, genetic polymorphisms lead to allelic variation of a receptor protein, where the function of one or more receptors in one population differs from that of other populations. Thus, the genetic predisposition that can affect the subject's therapy with the peptide can be ascertained. For example, in ligand-based therapies, polymorphisms cause amino-terminal extracellular domains and / or other ligand binding regions where ligand binding is somewhat active, and result in receptor activation. Thus, the dosage of the ligand will, of course, be adjusted to maximize the therapeutic effect in a given population containing the polymorphism / haplotype. Instead of genotype, specific polymorphic peptides can be identified.
[0103]
antibody
The present invention also provides an antibody that selectively binds to the estrogen receptor protein of the present invention, and a fragment thereof. Here, the antibody selectively binds to a target protein if it does not significantly bind to an unrelated protein. Even if the antibody binds to another protein that is not substantially homologous to the target protein, it still binds to the protein selectively as long as the protein has homology to a fragment or domain of the target protein of the antibody. It is regarded. In this case, it is understood that the antibody binding to the protein is still selective despite having some cross-reactivity.
[0104]
Here, antibody is defined by terms consistent with those recognized in the art. These are multi-subunit proteins produced by mammalian organisms in response to antigen challenge. The antibodies of the present invention include polyclonal and monoclonal antibodies, and Fab or F (ab ')2And Fv fragments, including, but not limited to, antibody fragments.
[0105]
Many methods for generating and / or identifying antibodies to a given peptide of interest are known. Some of the methods are described in Harlow, Antibodies, Cold Spring Harbor Press, (1989). Generally, to produce antibodies, the isolated peptide is used as an immunogen and administered to a mammalian organism such as a rat, rabbit, or mouse. Full length proteins, antigenic peptide fragments, or fusion proteins can be used.
[0106]
Antibodies are preferably prepared from regions or discrete fragments of the estrogen receptor protein. Antibodies can be prepared in any region of the peptides disclosed herein. However, preferred regions include those involved with function / activity and / or receptor / binding partner interactions. Antigenic fragments usually contain at least 10 contiguous amino acid residues. However, the antigenic peptide can include at least 12, 14, 20, or more amino acid residues. Such fragments can be selected for their physical properties, for example, fragments corresponding to regions located on the surface of the protein, such as hydrophobic regions.
[0107]
Detection of an antibody of the invention can be facilitated by coupling (ie, physically linking) the antibody to a detectable substance. Examples of detectable substances include various enzymes, prosthetic groups, fluorescent materials, luminescent materials, bioluminescent materials, and radioactive materials. Examples of suitable enzymes include forcella dish peroxidase, alkaline phosphatase, β-galactosidase, or acetylcholinesterase. Examples of suitable prosthetic base complexes include streptavidin / biotin, and avidin / biotin. Examples of suitable fluorescent materials include umbelliferone, fluorescein, fluorescein isothiocyanase, rhodamine, dichlorotriazinylamine fluorescein, dansyl chloride, or phycoerythrin. Examples of luminescent materials include luminol. Examples of luminescent materials include luciferase, luciferin, and aequorin; examples of suitable radioactive materials include125I,131I,35S, or3H is included.
[0108]
Use of antibodies
Antibodies can be used to isolate the estrogen receptor proteins of the invention by standard techniques such as affinity chromatography or immunoprecipitation. Antibodies can facilitate the purification of natural proteins from cells and from recombinantly produced proteins expressed in host cells. Furthermore, the antibodies are useful in detecting the presence of the estrogen receptor protein of the present invention in cells or tissues to determine the expression pattern of the protein in various tissues of the organism and during normal development. is there. In addition, the antibodies can be used in situ, in vitro, or for detection of proteins in cell lysates or supernatants to assess expression levels and patterns. This antibody can also be used to assess abnormal tissue distribution or abnormal expression during development. Antibody detection of circulating fragments of the full-length estrogen receptor protein can be used to identify turnover.
[0109]
In addition, the antibodies can be used to assess expression in disease states, such as the active stages of the disease, or in individuals prone to diseases associated with protein function (especially bone growth / formation / deterioration). Accompanying illness). If the modulation is caused by inappropriate tissue distribution, growth expression, protein expression levels, or expressed / engineered forms, the antibodies can be prepared against normal proteins. If the modulation is characterized by a specific mutation in the protein, antibodies specific for the mutant protein can be used in assays for the presence of the specific mutant protein.
[0110]
The antibodies can also be used to assess normal and aberrant gene localization of cells in various tissues of an organism. Diagnostic uses can be applied not only to genetic testing, but also to monitoring therapies. Thus, where treatment is intended to ultimately alter expression levels, or the presence and abnormal tissue distribution of aberrant sequences, or growth-directed expression, it may be directed to that protein or related fragments. Antibodies can be used to monitor therapeutic efficiency.
[0111]
In addition, antibodies are useful for pharmacogenomic analysis. For example, antibodies prepared against a polymorphic protein can be used to identify individuals in need of a modified therapy. This antibody is used as a diagnostic tool as an immunological marker for aberrant estrogen receptor proteins analyzed by electrical conductivity, isoelectric point, tryptic peptide digestion, and other physical assays known in the art. Is also useful.
[0112]
This antibody is also useful for inhibiting protein function, for example, inhibiting binding of estrogen receptor protein to a binding partner such as a ligand. These uses can also be applied to therapeutic situations where treatment involves inhibition of protein function. Antibodies can be used, for example, to inhibit binding, thereby modulating (acting or antagonizing) the activity of a protein. Antibodies can be prepared against specific fragments containing sites where function is required, or against intact proteins associated with cells or cell membranes.
[0113]
The invention also includes a kit for using the antibody to detect the presence of a protein in a biological sample. The kit comprises an antibody, such as a labeled or labelable antibody, and a compound or reagent for detecting an estrogen receptor protein in a biological sample; a means for determining the amount of protein in the sample; Means for comparing the amount of estrogen receptor protein of the present invention to a reference; and guidance for use.
[0114]
Nucleic acid molecule
The present invention further provides an isolated nucleic acid molecule encoding an estrogen receptor protein according to the present invention. The nucleic acid molecule consists of, consists essentially of, or comprises the nucleotide sequence encoding one of the estrogen receptor proteins of the present invention.
[0115]
As used herein, an "isolated" nucleic acid molecule is one that is distinguished from other nucleic acids that are present in the natural source of the nucleic acid. Preferably, an "isolated" nucleic acid is free of sequences that naturally flank the nucleic acid in the genomic DNA of the organism from which the nucleic acid was derived (ie, sequences located at the 5 'or 3' end of the nucleic acid). However, it may include some flanking nucleotide sequences, such as up to about 5 KB, 4 KB, 3 KB, 2 KB, or 1 KB or less, especially sequences that encode the peptide continuously and the peptide within the same gene. A sequence that encodes but is separated from introns of the genomic sequence. The important point is that the nucleic acid was isolated from distant, unimportant flanking sequences, which are specialized for recombinant expression, preparation of probes and primers, and other uses specific to the nucleic acid sequence described herein. That is, it is a target of operation.
[0116]
In addition, an "isolated" nucleic acid molecule, such as a cDNA molecule, can substantially bind other cellular material, or media when produced by recombinant techniques, or chemical precursors or other chemicals when chemically synthesized. Not included. However, the nucleic acid molecule can be fused to other coding or regulatory sequences, which are also considered isolated.
[0117]
For example, a recombinant DNA molecule contained in a vector is considered isolated. Further examples of an isolated DNA molecule include a recombinant DNA molecule maintained in a heterologous host cell, or a purified (partially or substantially) DNA molecule in solution. An isolated RNA molecule comprises an RNA transcript of the isolated DNA molecule of the present invention in vivo or in vitro. Further, the isolated nucleic acid molecules according to the present invention include synthetically produced molecules.
[0118]
Accordingly, the present invention provides a nucleic acid molecule comprising one or more of the sequence polymorphisms provided in FIG. 2, consisting of the nucleotide sequence shown in FIG. A nucleic acid molecule consists of a nucleotide sequence because the nucleotide sequence is the complete nucleotide sequence of the nucleic acid molecule.
[0119]
The present invention further provides a nucleic acid molecule comprising one or more of the sequence polymorphisms provided in FIG. 2, consisting essentially of the nucleotide sequence shown in FIG. A nucleic acid molecule consists essentially of a nucleotide sequence in which some additional nucleic acid residues are present in the final nucleic acid molecule.
[0120]
The invention further provides a nucleic acid molecule comprising one or more of the sequence polymorphisms provided in FIG. 2, comprising the nucleotide sequence of FIG. A nucleic acid molecule includes a nucleotide sequence if the nucleotide sequence is a nucleic acid sequence that is part of the final nucleotide sequence of the nucleic acid molecule. Thus, a nucleic acid molecule can have only a nucleotide sequence or additional nucleic acid residues, where the nucleic acid residues are naturally related to the nucleotide sequence or heterologous nucleotide sequence. Such nucleic acid molecules have few additional nucleotides or contain hundreds or more additional nucleotides. A brief description of how these various types of nucleic acid molecules were made / isolated is provided below.
[0121]
An isolated nucleic acid molecule may encode a mature protein and additional amino acids or carboxyl terminal amino acids, or amino acids within a mature peptide (eg, where the mature form has one or more peptide chains). Such sequences may play a role in promoting protein transport, increasing or decreasing protein half-life, or increasing the efficiency of protein manipulation during assays or production, or other reasons, when the protein grows from a precursor to a mature form. . Generally, in situ, additional amino acids are cleaved from the mature protein by cellular enzymes.
[0122]
As noted above, the isolated nucleic acid molecule encodes the mature peptide and additional coding sequences, such as sequences encoding only the estrogen receptor protein, major or minor sequences (eg, pre-pro or pro-protein sequences). In addition to sequences that encode mature peptides, with or without additional coding sequences, and genomic regulatory sequences such as promoters, for example, introns and non-coding 5 'and 3' sequences are transcribed. Are not translated and include, but are not limited to, additional non-coding sequences that play a role in transcription, mRNA processing (including splicing and polyadenylation signals), ribosome binding and mRNA stabilization. Further, the nucleic acid molecule may be fused to a marker sequence encoding, for example, a peptide useful for purification.
[0123]
An isolated nucleic acid molecule can be in the form of RNA, such as mRNA, or in the form of DNA, including genomic DNA obtained by cDNA and cloning or chemical synthesis techniques, or a combination thereof. Nucleic acids, especially DNA, are double-stranded or single-stranded. A single strand can be the coding strand (sense strand) or the non-coding strand (antisense strand).
[0124]
Fragments comprise a contiguous nucleotide sequence of 12 or more nucleotides. Further, fragments can be at least 30, 40, 50, 100, 250, or 500 nucleotides in length. The length of the fragment depends on the purpose of use. For example, fragments encode the epitope-behaving portions of the peptide or are useful as DNA probes or primers. Such fragments can be isolated using known nucleotide sequences for synthesizing oligonucleotide probes. Labeled probes can be used to isolate nucleic acids corresponding to the coding portion, to screen cDNA libraries, genomic DNA libraries or mRNA. In addition, primers can use PCR reactions to clone specific portions of the gene.
[0125]
The probe / primer typically comprises a substantially purified oligonucleotide or oligonucleotide pair. Oligonucleotides typically include a portion of a nucleotide sequence that hybridizes under stringent conditions to be at least about 12, 20, 25, 40, 50 or more contiguous nucleotides.
[0126]
As used herein, the term "hybridizes under stringent conditions" refers to a residue which typically hybridizes to each other and hybridizes until the nucleotide sequences encoding the peptides have at least 50-55% homology to each other. And cleaning. The conditions typically remain hybridized to each other and have at least about 65%, at least about 70%, or at least about 75% or more homology with each other. Such stringent conditions are known to those of skill in the art and are described in Current Protocols in Molecular Biology, John Wiley & Sons, N.W. Y. (1989), 6.3.1-6.3.6. One example of stringent hybridization conditions is to hybridize at 6 × sodium chloride / sodium citrate (SSC) at about 45 ° C. and wash at least once with 0.2 × SSC, 0.1% SDS at 50-65 ° C. Condition.
[0127]
Use of nucleic acid molecules
The nucleic acid molecules of the invention are useful for probes, primers, chemical intermediates, and biological assays. Probes can span any sequence over the entire length of the nucleic acid molecule consisting of the nucleotide sequence of FIG. 1, including one or more of the sequence polymorphisms shown in FIG. Thus, it can be derived from a 5 'non-coding part, a coding part, and a 3' non-coding part. However, as mentioned above, fragments do not include fragments published prior to the present invention.
[0128]
Nucleic acid molecules are useful for amplifying any given portion of the nucleic acid molecule by PCR and for the synthesis of anti-sensitizing molecules of desired length and sequence.
[0129]
Nucleic acid molecules are also useful for constructing recombinant vectors. Such vectors include expression vectors that express part or all of the peptide sequence. Vectors include insertion vectors and are used in fusions with other nucleic acid molecule sequences, for example, in the genome of a cell, to alter the expression status of a gene and / or gene product. For example, the endogenous coding sequence can be homologously recombined with one or more specifically mutated coding portions for all or a portion thereof.
[0130]
Nucleic acid molecules are also useful for indicating the antigenic portion of a protein.
Nucleic Acid Molecules Also useful from the nucleic acid molecules described herein to design ribozymes corresponding to full or partial mRNA.
The nucleic acid molecules are also useful for constructing host cells that express some or all of the nucleic acid molecules and peptides.
[0131]
The nucleic acid molecules are also useful for constructing transgenic animals that express all or a portion of the nucleic acid molecules and peptides.
Nucleic acid molecules are also useful for making vectors that express some or all of the peptide.
[0132]
Nucleic acid molecules are also useful as hybridizing probes to determine the presence, level, morphology and distribution of nucleic acid molecule expression. Accordingly, probes can be used to detect or determine the level of a particular nucleic acid molecule in cells, tissues and organisms. Nucleic acid levels are determined in DNA or RNA. Accordingly, probes corresponding to the peptides described herein can be used to evaluate expression and / or gene copy number in a given cell, tissue, or organism. The use of these is equivalent to the diagnosis of abnormalities associated with increased or decreased estrogen receptor protein expression compared to normal.
[0133]
In vitro techniques for detection of mRNA include Northern hybridizations and in situ hybridizations. In vitro techniques for DNA detection include Southern hybridizations and in situ hybridizations.
[0134]
The probe can be used as part of a diagnostic test kit to identify cells or tissues that express the estrogen receptor protein, which is a receptor-encoding nucleic acid, such as mRNA or genomic DNA, in a sample of cells from a subject. Or by detecting whether the estrogen receptor gene is mutated.
[0135]
Nucleic acid expression assays are useful as screening reagents to identify compounds that modulate estrogen receptor nucleic acid expression.
[0136]
Thus, the present invention provides methods for identifying compounds that can be used to treat abnormalities associated with estrogen receptor gene nucleic acid expression. The method typically assayes the ability of the compound to modulate estrogen receptor nucleic acid expression and determines if the agent can be used to treat an abnormality characterized by unwanted estrogen receptor nucleic acid expression. These assays can be performed in cell-based and cell-free systems. Cell-based assays include cells that naturally express estrogen receptor nucleic acid, or recombinant cells that are genetically designed to express a particular nucleic acid sequence.
[0137]
Assays of estrogen receptor nucleic acid expression are performed by direct assays at the nucleic acid level, such as at the mRNA level, or by secondary compounds involved in signal pathways. In addition, increased or decreased regulation of gene expression on the estrogen receptor protein signaling pathway is assayed. In this embodiment, the regulatory portion of these genes can be linked to a reporter gene such as luciferase.
[0138]
The modulator of estrogen receptor gene expression is identified by contacting the cell with a candidate compound and detecting mRNA expression. The level of estrogen receptor mRNA expression in the presence of the candidate compound is compared to the level of estrogen receptor mRNA expression in the absence of the candidate compound. Candidate compounds are determined as modulators of nucleic acid expression based on this comparison and are used, for example, in treating abnormalities characterized by abnormal nucleic acid expression. If the expression of the mRNA is statistically significantly greater in the presence of the candidate compound compared to its absence, the candidate compound is identified as a stimulator of nucleic acid expression. If the expression of the mRNA is statistically significantly lower in the presence of the candidate compound compared to its absence, the candidate compound is identified as an inhibitor of nucleic acid expression.
[0139]
The present invention provides a method for treating a nucleic acid using a compound specified through drug screening as a gene modulator that modulates estrogen receptor nucleic acid expression in cells or tissues that express the estrogen receptor. Modulation includes the modulation of both up-modulation (eg, activation or agonism) or down-regulation (suppression or antagonism), or nucleic acid expression.
[0140]
Alternatively, the modulator of estrogen receptor nucleic acid expression is a screening assay described herein, so long as the agent or small molecule inhibits estrogen receptor nucleic acid expression in cells or tissues in which the protein is expressed. Are small molecules or drugs identified using
[0141]
Nucleic acid molecules are useful in clinical trials or in treatment management to monitor the effectiveness of modulatory compounds on estrogen receptor gene expression or activity. The gene expression pattern is a barometer of the continuous effect of the treatment with the compound, and is particularly useful for compounds for which the patient is resistant. Gene expression patterns are also useful as markers that indicate the physiological response of cells affected by the compound. Thus, such a monitor would permit an increase in the dose of the compound or the administration of another compound to which the patient is not resistant. Similarly, if the level of nucleic acid expression falls below the desired level, the administration of the compound can be proportionally reduced.
[0142]
Nucleic acid molecules are also useful in diagnostic assays for qualitative changes in estrogen receptor nucleic acid expression, and particularly elicit qualitative changes in disease states. Nucleic acid molecules can be used to detect mutations in gene expression products such as estrogen receptor genes and mRNA. Nucleic acid molecules can be used as hybridization probes to detect naturally occurring genetic mutations in the estrogen receptor gene, and to determine whether a subject with a mutation is at risk for an abnormality caused by the mutation. it can. Mutations can include deletions, additions, or substitutions of one or more nucleotides in a gene; chromosomal rearrangements such as transposition or transfer; changes in genomic DNA such as abnormal methylation patterns, changes in the number of gene copies such as amplification, and the like. Including. Detection of a mutant form of the estrogen receptor gene associated with inverse function can be used to assess activity, or to determine susceptibility to the disease if the disease is the result of overexpression, underexpression, or mutation of the estrogen receptor protein. It is a diagnostic method.
[0143]
Individuals having a mutation in the estrogen receptor gene can be detected at the genetic level by various techniques. Genomic DNA can be analyzed directly or amplified using PCR prior to analysis. RNA or cDNA can be used as well. In some applications, the detection of mutations involves the use of probes / primers in the polymerase chain reaction (PCR) (U.S. Patent Nos. 4,683,195 and 4,683,202), such as anchor PCR or RACE PCR. Or, differently, to the ligation chain reaction (LCR) (see Landegran et al., Science 241: 1077-1080 (1988); and Nakazawa et al., PNAS 91: 360-364 (1994)). However, the latter is particularly effective in detecting point mutations in genes (see Abravaya et al., Nucleic Acids Res. 23: 675-682 (1995)). The method comprises the steps of collecting a cell sample from a patient, isolating a nucleic acid (eg, genomic, mRNA, or both) from the cells of the sample, and subjecting the nucleic acid sample to hybridization (if present) and amplification of the gene (if present). Contacting the gene with one or more primers specifically hybridized to the gene, detecting the presence or absence of the amplification product, or detecting the size of the amplification product and comparing it to the length of a control sample. . Absences and insertions can be detected by changes in size by comparing the amplification product to a normal genotype. Point mutations can be identified by hybridizing the amplified DNA with normal RNA or unsensitized DNA.
[0144]
Alternatively, mutations in the estrogen receptor gene can be identified directly, for example, by determining the modified restricted enzyme digestion pattern by gel electrophoresis.
In addition, sequence-specific ribozymes (U.S. Patent No. 5,498,531) can be scored for the presence of specific mutations by growing or reducing ribozyme cleavage sites. Perfectly matched sequences can be distinguished from unmatched sequences by nuclease cleavage digestion assays or differences in melting points.
[0145]
Sequence changes at specific positions can be assessed by nuclease protection assays such as RNase and S1 protection or by chemical cleavage methods. In addition, sequence differences between the mutant estrogen receptor gene and the wild-type gene are determined by direct DNA sequencing. Various types of automatic sequencing means are effective when performing diagnostic assays (Naeve, CW, (1995) Biotechniques 19: 448) and include sequencing by mass spectrum (PCT International Publication No. WO 94/94). Cohen et al., Adv. Chromatogr. 36: 127-162 (1996); and Griffin et al., Appl. Biochem. Biotechnol. 38; 147-159 (1993)).
[0146]
Other methods for detecting gene mutations include protecting against cleavage reagents to detect incompatible bases in RNA / RNA or RNA / DNA duplexes (Myers et al., Science 230; 1242 (1985)); Cotton et al. , PNAS 85: 4397 (1988); Saleeba et al. , Meth. Enzymol. 217: 286-295 (1992)), comparing the electrophoretic amounts of mutant and wild-type nucleic acids (Orita et al., PNAS 86; 2766 (1989); Cotton et al., Mutat. Res. 285: 125-). 144 (1993); and Hayashi et al., Genet. Anal. Tech. Appl. 9: 73-79 (1992)) and denaturing gradient gel electrophoresis, in polyacrylamide gels containing gradient concentrations of denaturing agents. Which assay for the migration of a mutant or wild type fragment (Myers et al., Nature 313: 495 (1985)). Examples of other techniques for detecting point mutations include selective oligonucleotide hybridization, selective amplification, and selective primer extension.
[0147]
Nucleic acid molecules are also useful for testing individuals of genotype that do not unnecessarily cause disease and affect therapeutic modality. The nucleic acid molecule can then be used to study the correlation between an individual's genotype and the individual's response to the compound used for therapy (pharmacogenomic correlation). Accordingly, the nucleic acid molecules described herein can be used to evaluate the amount of estrogen receptor gene mutation in an individual to select preferred compounds and therapeutic dosages.
[0148]
And the nucleic acid molecule which shows the gene mutation which affects a therapy provides the diagnostic subject which can be used for the tailor therapy for an individual. Therefore, the production of recombinant cells and animals having these polymorphisms / haplotypes allows for effective clinical design of drugs and dosages.
[0149]
Nucleic acid molecules regulate estrogen receptor gene expression in cells, tissues and organisms, and are therefore useful for insensitivity formation. DNA-insensitized nucleic acid molecules are designed to be complementary to the portion of the gene involved in transcription to prevent transcription and subsequent production of the estrogen receptor protein. The insensitive RNA or DNA nucleic acid molecule hybridizes to the mRNA and blocks translation of the mRNA into estrogen receptor protein.
[0150]
Alternatively, one of the desensitizing molecules is used to inactivate mRNA to reduce expression of estrogen receptor nucleic acid. Thus, these molecules can treat abnormalities characterized by abnormal or unwanted estrogen receptor nucleic acid expression. This technique involves cleavage by ribozymes in which the nucleic acid sequence that reduces the ability of the mRNA to be translated is complementarily included in one or more portions of the mRNA. Possible moieties are coding moieties associated with the catalytic and other functional activities of estrogen receptor proteins, such as coding moieties and especially substrate binding moieties.
[0151]
The nucleic acid molecule further provides a vector for gene therapy in a patient comprising cells having abnormal estrogen receptor gene expression. The recombinant cells, including the patient's cells that have been modulated ex vivo and returned to the patient, are then introduced into a position where the patient's cells produce the desired estrogen receptor protein for treatment of the individual.
[0152]
The invention also includes a kit for detecting the presence of an estrogen receptor nucleic acid in a biological sample. For example, the kit comprises a labeled or labelable nucleic acid or an agent capable of detecting estrogen receptor nucleic acid in a biological sample; a means for determining the amount of estrogen receptor nucleic acid in the sample; Means for comparing the amount of estrogen receptor nucleic acid with a standard. The compound or agent is enclosed in a suitable container. The kit further includes instructions for using the kit to detect estrogen receptor protein mRNA or DNA.
[0153]
Design of method for detecting SNP-containing nucleic acid
The SNP nucleic acid molecules of the invention are useful in probes, primers, chemical intermediates, and biological assays for SNPs. Probes / primers are consistent with one or more of the SNPs shown in FIG. 2, or with 5 'and / or 3'. However, as noted above, fragments do not include fragments that are not associated with the SNPs of the present invention, or that are known in the art of SNP detection. The SNP-containing nucleic acid molecules and information provided herein are also useful for PCR to amplify the SNPs provided in the present invention and to design PCR primers to design formatted SNP detection reagents / kits.
[0154]
The probe / primer typically comprises a substantially purified oligonucleotide or oligonucleotide pair. Oligonucleotides typically include a portion of a nucleotide sequence that has been hybridized under stringent conditions to be at least about 12, 20, 25, 40, 50 or more contiguous nucleotides. Based on certain conditions, the contiguous nucleotides can include the SNP position of interest or become a specific portion sufficiently close to the nearby 5 'and / or 3' SNP that is the SNP position performing the desired assay. You can also.
[0155]
Preferred primer and probe sequences can be readily determined using the sequences provided in FIGS. 1, 2, and 9. It will be apparent to those skilled in the art that such primers and probes are useful as diagnostic or amplification primers for genotyping the SNPs of the present invention and can be incorporated into kit forms.
[0156]
To analyze SNPs, it is appropriate to use oligonucleotides specific to SNP alleles (designated as "allele-specific oligonucleotides", "allele-specific probes", or "allele-specific primers"). . The design and use of allele-specific probes for analyzing polymorphisms is described, for example, in Saiki et al. , Nature 324, 163-166 (1986); Datatagta, EP 235,726, Saiki, WO 89/11548.
[0157]
In a hybridization-based assay, an allele-specific probe is designed to hybridize to a segment of DNA of interest from one human, but not to another human-derived segment where different polymorphisms are present. . Hybridization conditions should be sufficiently stringent because there are significant differences in hybridization intensity between alleles, preferably significant binary responses, so that the probe hybridizes to only one of the alleles. Soy. Since some probes are designed to hybridize to a segment of the DNA of interest, the polymorphic portion is arranged at the central position of the probe (eg, 15-mer at position 7, 16-mer at position 8 or 9). . The design of the probe allows the hybridization between the different alleles to be well distinguished.
[0158]
Allele specific probes are often used in pairs, where "pairs" are identical except for a single nucleotide mismatch representing an allelic variation at the SNP position. One of the pair is completely identical to the subject sequence and the other is completely identical to the mutant. In a sequence, several pairs of probes can be immobilized on the same carrier for simultaneous analysis of multiple polymorphisms within the same sequence of interest.
[0159]
In one type of PCR-based assay, the allele-specific primer hybridizes to the portion of the DNA of interest that overlaps the SNP position, and only primers of the allele type, for which the primers exhibit perfect complementarity, are amplified. (See Gibbs, Nucleic Acid Res. 17 2427-2448 (1989)). This primer is used in conjunction with a second primer that hybridizes at the end. Amplification results from the two primers, resulting in a product that can indicate the presence of a particular allelic type. Controls are usually performed with two pairs of primers. One pair is mismatched at the single base of the polymorphic portion and the other pair is completely complementary to the peripheral portion. Single base mismatches prevent amplification and no product is formed. This method works best when the mismatch is included at the 3'-most position of the polymorphic oligonucleotide. This is because this position extends from the primer and is most unstable (see, for example, WO 93/22456). This PCR-based assay is utilized as part of the TaqMan assay and is described as follows.
[0160]
SNP detection kit, nucleic acid sequence, and integration system
The present invention further provides SNP detection kits, such as sequences or microsequences of nucleic acid molecules, probe / primer sets, based on the SNPs provided in FIGS. 1, 2, 4, 8, and 9.
[0161]
In one embodiment of the invention, a kit is provided that includes the necessary reagents to perform one or more assays that detect one or more SNPs disclosed herein. The present invention also provides a multi-component incorporation system for analyzing SNPs in the present invention.
[0162]
A SNP detection kit can include one or more oligonucleotide probes, or pairs of probes, that hybridize at or near an individual SNP location. To test multiple SNPs, including at least one of the SNPs of the present invention, multiple pairs of allele specific oligonucleotides can be included in the kit simultaneously. In some kits, such as sequences, allele specific oligonucleotides are provided and immobilized on a substrate. For example, the same substrate may be at least 1; 10; 100; 1000; 10000; 100,000; 300,000, or alleles to detect nearly all of the polymorphisms shown in FIGS. 1, 2, 4, 8, and 9. Gene specific oligonucleotide probes can be included.
[0163]
In particular, the present invention relates to a method comprising the steps of: (a) providing an allele-specific oligonucleotide capable of binding one of the nucleic acid probes, for example, a fragment of the SNP-containing human genome described herein; And (b) a compartmentalized kit comprising one or more containers that can include one or more of a detergent or a reagent capable of detecting the presence of a bound probe.
In particular, compartmentalized kits each have an isolated container in which a plurality of reagents are placed. Such containers include small glass containers, plastic containers, plastic stripes, glass or paper, or ordered materials such as silica. Such containers efficiently transfer reagents from one compartment to another, do not cause cross-contamination of samples and reagents, and quantitatively add reagents or solutions from each container from one container to another. Is done. Such containers include a container for holding a test sample, a container for holding a nucleic acid probe, a container for holding a washing solution (phosphate buffer, Tris buffer, etc.), and a container for holding a reagent for detecting a bound probe. Further, the kit can include reagents for PCR or other enzymatic reactions, and instructions for using the kit. A person skilled in the art can identify the unspecified SNP of the present invention, identify it routinely using the sequences described herein, and use it by folding it into a well-known kit format.
[0164]
Further, the invention provides a sequence or microsequence of a nucleic acid molecule based on the sequence information of FIG. 1, comprising one or more of the variants of FIG.
[0165]
As used herein, `` sequence '' or `` microarray '' refers to a sequence of discrete polynucleotides or oligonucleotides synthesized on a substrate, wherein the substrate is paper, nylon or other types of membranes, filters, chips, glass slides or Other suitable solid carriers. In one embodiment, the microarray is a U.S.A. S. Patent 5,837,832, Chee et al. , PCT Application WO 95/11995 (Cee et al.), Lockhart, D .; J. et al. (1996; Nat. Biotech. 14: 1675-1680) and Shena, M .; et al. (1996; Proc. Natl. Acad. Sci. 93: 10614-10619), which are incorporated herein by reference. In other embodiments, such sequences are described in Brown et al. , U.S. S. Patent No. 5,807,522. Sequences or microarrays are generally referred to as "DNA chips."
[0166]
In individual probes or pairs of probes corresponding to different SNP positions, multiple oligonucleotide probes, such as allele specific oligonucleotides, are sequenced. The oligonucleotide is synthesized in a specific region of the substrate by light irradiation chemical treatment. The substrate is a paper, nylon or other type of membrane, filter, chip, glass slide, or other suitable solid carrier.
[0167]
Hybridization assays based on oligonucleotide sequences rely on differences in perfectly matched and mismatched sequence variations of interest in the hybridization stability of short oligonucleotide probes. Polymorphism information is efficiently obtained by a basic structure that includes a high density sequence of oligonucleotide probes attached to a solid support (eg, chip) at selected locations. Individual DNA chips are arranged in a grid, miniaturized to dime size, and correspond to individual specific SNP positions or allelic variations, and contain thousands to millions of DNA probes. Preferably, the probes are bound to a solid support in an addressable sequence.
[0168]
Array / chip technology has already been successfully applied in many cases. For example, the BRCA1 gene, s. Mutation screening was performed on cerevisiae mutant strains and the HIV-1 virus protease gene (Hasia et al., 1996; Shomaker et al., 1996; Kozal et al., 1996). Mutant chips used for SNP detection can be manufactured on customized substrates.
[0169]
Useful sequence-based tiling schemes for detecting SNPs are described in EP 785280. That is, the sequence is generally “tiled” to many specific polymorphisms. "Tiling" refers to a defined synthesis of an oligonucleotide probe consisting of a sequence complementary to the sequence of interest, as well as a sequence variant selected previously, eg, one of one or more monomer bases. The above substitution at the given position, that is, nucleotide. The tiling plan is described in PCT Application No. This is further described in WO 95/11995. In certain aspects, sequences are tiled to many specific SNPs. In particular, the sequences are tiled such that each detection block contains many detection blocks specific to a particular SNP or set of SNPs. For example, the detection block is tiled to include a number of probes that measure a sequence segment that includes a particular SNP. Probes are synthesized in different pairs at SNP positions to obtain probes that exhibit complementarity to individual alleles. Mono-substituted probes, as well as probes that differ at SNP positions, are also generally tiled within the detection block. This method is immediately applicable to the SNP information described here.
[0170]
These monosubstituted probes have a fixed number of bases in either direction from the polymorphism replaced by nucleotide residues (selected from A, T, G, C, and U). Generally, the tiling detection block probe contains a substitution at a sequence position 5 bases away from the SNP. Monosubstituted probes provide an internal control to the tiling sequence to distinguish actual hybridization from artificial hybrid hybridization. In completing a hybrid with a subject sequence and a wash of the sequence, the sequence is considered to determine its position in the sequence to which the subject sequence hybridizes. Hybridization data from the scanned sequence is analyzed to identify the presence of the allele or SNP allele in the sample. Hybridization and scanning are described in PCT Application No. WO 92/10092, WO 95/11995 and U.S. Pat. S. Patent No. Performed as described in 5424186.
[0171]
Thus, in some embodiments, the chip comprises a fragment nucleic acid sequence of about 15 nucleotides in length. In other embodiments, the chip comprises at least one sequence selected from the group described in FIGS. 1, 2, 8, and 9, a complementary sequence, a fragment, at least eight or more, preferably 10, 15, Fragments containing 20, more preferably 25, 30, 40, 47 or 50 contiguous nucleotides and polymorphic bases. In some embodiments, the polymorphic base is within 5, 4, 3, 2, or 1 nucleotides from the center of the polynucleotide, more preferably at the center of the polynucleotide. In another embodiment, the chip comprises a sequence having some of the polynucleotides of the invention.
[0172]
Oligonucleotides are synthesized on the substrate by chemical bonding and inkjet processing equipment, which is described in PCT application WO 95/251116 (Baldeshweiler et al.), All of which are incorporated herein by reference. In another example, a "lattice" sequence is one in which dots (or slots) place and bind cDNA fragments or oligonucleotides to the surface of the substrate by a vacuum system, heating, UV, mechanical or chemical bonding processes. Arrays such as those described above may be manual or suitable machines (slot blot or dot blot equipment), materials (either suitable solid carriers) and machines (robotized equipment), and 8,24,96,384,1536. , 6144 or more, or oligonucleotides that make efficient use of commercially used equipment.
[0173]
Using such a sequence, the present invention provides a method for identifying a SNP according to the present invention. In particular, such methods include incubating a test sample with one or more nucleic acid molecules and assaying the binding of the nucleic acid molecules to components in the test sample. This assay comprises a sequence comprising a number of genes, at least one SNP according to the invention and / or one allele of a SNP according to the invention.
[0174]
Incubation conditions for the test sample and the nucleic acid molecule vary. Incubation conditions will depend on the form used in the assay, the detection method employed, and the type and nature of the nucleic acid molecule used in the assay. One skilled in the art can prepare the commonly applied hybridization, amplification, or sequence assay formats as appropriate for using the novel SNPs of the human genome described herein. Examples of such assays are described in Chard, T, An Introduction to Radioimmunoassay and Related Technologies, Elsevier Science Publishers, Amsterdam, The Netherlands, The Netherlands, The Netherlands, The Netherlands; R. et al. , Technologies in Immunochemistry, Academic Press, Orlando, FL Vol. 1 (1982), Vol. 2 (1983), Vol. 3 (1985); Tijssen, P .; , Practice and Theory of Enzyme Immunoassay: described in Laboratory Technologies in Biochemistry and Molecular Biology, Physiological Sciences, 85, 85, 85, 85, 85.
[0175]
The test sample of the present invention can be obtained from proteins, nucleic acid extracts, cell membrane extracts obtained from body fluids (blood, urine, saliva, sputum, gastric juice, etc.), cultured cells, biopsy materials, or other tissue preparations. It is possible, but not limited to these. The test sample used by the above method will vary based on the assay format, the nature of the detection method, and the tissues, cells, and extracts used as the sample. Methods for preparing nucleic acids, proteins, or cell extracts are well known to those skilled in the art and can be readily adapted to obtain samples that are compatible with the system utilized.
[0176]
Multi-component integration systems can also be used for SNP analysis. Such systems miniaturize and compartmentalize processes such as PCR and capillary electrophoresis reactions in a single functional device. Examples of such techniques are described in US patent 5,589,136 and describe PCR amplification and capillary electrophoresis of chips.
[0177]
Embedded systems can be considered mainly when microfluidic systems are used. These systems include microchannel types contained in microchips designed on glass, silicon, quartz, or plastic wafers. The movement of the sample is controlled by electrical, electroosmotic, or hydrostatic forces applied to various areas of the microchip to create a functional microscopic valve and pump without any moving parts. Changing the voltage controls the liquid flow rate at the intersection between the micromachined channels and changes the liquid flow rate of the pump across the various cross sections of the microchip.
[0178]
To genotype SNPs, microfluidic systems synthesize detection methods such as, for example, nucleic acid amplification, miniature sequence primer extension, capillary electrophoresis, and laser-induced fluorescence detection.
[0179]
In a first step, the DNA sample is amplified, preferably by PCR. The amplification products are then hybridized immediately upstream of the targeted polymorphic base (ddNTPs (specific fluorescence for individual ddNTPs)) and automated mini-sequences using appropriate oligonucleotide mini-sequence primers. Follow the reaction. Once the 3 'end extension is completed, the primers are isolated by capillary electrophoresis from the unencapsulated fluorescent ddNTPs. The isolation medium used in capillary electrophoresis can be, for example, polyacrylamide, polyethylene glycol, or dextran. The ddNTPs contained in a single nucleotide primer extension product are identified by laser-induced fluorescence detection. This microchip can be used to process at least 96 to 384 or more samples in parallel.
[0180]
Vector / host cell
The invention also provides a vector comprising a nucleic acid molecule described herein. "Vector" means a vehicle, preferably a nucleic acid molecule, for transporting a nucleic acid molecule. When the vector is a nucleic acid molecule, the nucleic acid molecule is covalently linked to the vector nucleic acid. In this aspect of the invention, vectors include plasmids, single- or double-stranded phage, single- or double-stranded RNA or DNA viral vectors, or artificial chromosomes, for example, BAC, PAC, YAC, MAC And the like.
The vector can be maintained in the host cell as an extrachromosomal component, where it replicates and produces another copy of the nucleic acid molecule. Alternatively, the vector may integrate into the host cell genome and produce another copy of the nucleic acid molecule as the host cell replicates.
[0181]
The present invention provides a vector for maintenance (cloning vector) or a vector for expression of a nucleic acid molecule (expression vector). Vectors can function in prokaryotic or eukaryotic cells, or both (shuttle vectors).
The expression vector contains a cis-acting regulatory region, which is operably linked to the nucleic acid molecule in the vector such that transcription of the nucleic acid molecule can occur in a host cell. A nucleic acid molecule can be introduced into a host cell along with another nucleic acid molecule capable of affecting transcription. Thus, the second nucleic acid molecule may provide a trans-acting factor that interacts with the cis-regulatory control region to allow transcription of the nucleic acid molecule from the vector. Alternatively, the trans-acting factor may be supplied by a host cell. Also, trans-acting factors can be produced from the vector itself. However, it is understood that in some experiments, transcription and / or translation of the nucleic acid molecule can occur in a cell-free system.
[0182]
The regulatory sequences to which the nucleic acid molecules described herein are operably linked include a promoter that directs mRNA transcription. This includes, but is not limited to, the remaining promoters from bacteriophage λ, the lac, TRP, and TAC promoters from E. coli, the early and late promoters from SV40, the immediate CMV promoter, the adenovirus early and late promoters, and the retrovirus. Contains the viral long terminal repeat.
In addition to a control site that promotes transcription, the expression vector may also include a transcription regulatory site such as a repressor binding site or an enhancer. Examples include the SV40 enhancer, cytomegalovirus immediate enhancer, polyoma enhancer, adenovirus enhancer, retrovirus LTR enhancer.
[0183]
In addition to including sites for initiation and control of transcription, the expression vector can include sequences necessary for termination of transcription, and, in the site to be transcribed, may include a ribosome binding site for translation. It is possible. Other regulatory control elements for expression also include start and stop codons, as well as a polyadenylation signal. One of skill in the art would know many regulatory sequences useful in expression vectors. Such regulatory sequences are described, for example, in Sambrook et al. , Molecular Cloning: Laboratory Manual. 2nd ed. , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989).
[0184]
A variety of expression vectors can be used for expressing the nucleic acid molecule. Such expression vectors include chromosomal vectors, episomal vectors, and virus-derived vectors, for example, bacterial plasmid derived, bacteriophage derived, yeast episomal derived, yeast chromosome elements including yeast artificial chromosomes, baculovirus, papovavirus such as SV40 , Vaccinia virus, adenovirus, poxvirus, pseudorabies virus, retrovirus and the like. Vectors may be derived from combinations of these sources, such as from plasmids and bacteriophage genetic elements, eg, cosmids, phagemids, and the like. Suitable cloning and expression vectors for prokaryotic and eukaryotic hosts are described in Sambrook et al. , Molecular Cloning: Laboratory Manual. 2nd ed. , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989).
[0185]
The regulatory sequence may provide for constitutive expression in one or more host cells (ie, tissue-specific), or may be one such as by temperature, nutrient additives, or an exogenous factor such as a hormone or another ligand. Inducible expression in one or more cell types may be provided. A variety of vectors that provide for constitutive and inducible expression in prokaryotic and eukaryotic hosts are well known to those of skill in the art.
[0186]
The nucleic acid molecule can be inserted into the vector nucleic acid by well-known methodologies. Generally, the final expressed DNA sequence is ligated to the expression vector by cleaving the DNA sequence and the expression vector with one or more restriction enzymes, and then linking the fragments together. Procedures for digestion and ligation of restriction enzymes are well known to those skilled in the art.
Vectors containing appropriate nucleic acid molecules can be introduced into host cells suitable for growth or expression using well known techniques. Bacterial cells include, but are not limited to, E. coli, actinomycetes, and Salmonella typhimurium. Eukaryotic cells include, but are not limited to, yeast, insect cells such as Drosophila, animal cells such as COS and CHO cells, and plant cells.
[0187]
As described herein, it may be desirable to express the peptide as a fusion protein. Accordingly, the present invention provides a fusion vector capable of producing a peptide. Fusion vectors can enhance recombinant protein expression, increase the solubility of the recombinant protein, and aid in protein purification, for example, by acting as a ligand for affinity purification. A cleavage site for protein hydrolysis may be introduced at the junction of the fusion moiety, so that the desired peptide can ultimately be separated from the fusion moiety. Proteolytic enzymes include, but are not limited to, factor Xa, thrombin, and enterokinase. Representative fusion expression vectors include pGEX (Smith et al., Gene 67: 31-40 (1988)), pMAL (New England Biolabs, Beverly, Mass.), And glutathione S- against recombinant proteins of interest. PRIT5 (Pharmacia, Piscataway, NJ) fused to transferase (GST), maltose E-binding protein, or protein A, respectively.
Examples of suitable inducible non-fused Escherichia coli expression vectors include pTrc (Amann et al., Gene 69: 301-315 (1988)) and pET 11d (Studier et al., Gene Expression Technology: Methods 18th org. -89 (1990)).
[0188]
Recombinant protein expression can be maximized in host bacteria by providing a genetic background with a reduced ability of the host cell to proteolytically cleave the recombinant protein (Gottesman, S. et al. , Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, California (1990) 119-128). Alternatively, the sequence of the nucleic acid molecule of interest can be modified to provide preferential codon usage for a particular host cell, such as E. coli (Wada et al., Nucleic Acids Res. 20: 2111-2118 (1992)).
[0189]
The nucleic acid molecule can be expressed by an expression vector that acts in yeast. Yeasts such as S. Examples of vectors for expression in S. cerevisiae include pYepSec1 (Baldari, et al., EMBO J. 6: 229-234 (1987)) and pMFa (Kurjan et al., Cell 30: 933-943 (1982)). ), PJRY88 (Schultz et al., Gene 54: 113-123 (1987)), and pYES2 (Invitrogen Corporation, San Diego, CA).
[0190]
Nucleic acid molecules can also be expressed in insect cells, for example, using a baculovirus expression vector. Baculovirus vectors useful for protein expression in cultured insect cells (eg, Sf 9 cells) include the pAc system (Smith et al., Mol. Cell Biol. 3: 2156-2165 (1983)) and the pVL system (Lucklow). et al., Virology 170: 31-39 (1989)).
In one embodiment of the invention, the nucleic acid molecules described herein are used in mammalian cells using a mammalian expression vector. Examples of mammalian expression vectors include pCDM8 (Seed, B. Nature 329: 840 (1987)) and pMT2PC (Kaufman et al., EMBO J. 6: 187-195 (1987)).
[0191]
The expression vectors listed here are provided by way of example only among well-known vectors useful for expressing nucleic acid molecules and available to those of skill in the art. One of skill in the art would know of other vectors suitable for maintaining, propagating or expressing the nucleic acid molecules described herein. These are described, for example, in Sambrook, J .; Fritsh, E .; F. , And Maniatis, T .; Molecular Cloning: A Laboratory Manual. 2nd, ed. , Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989.
[0192]
The invention also includes vectors where the nucleic acid sequences described herein have been cloned in the reverse orientation into the vector, but are operably linked to regulatory sequences that permit transcription of the antisense RNA. Thus, antisense transcripts can be produced for all or a portion of the nucleic acid molecule sequences described herein, including both coding and non-coding regions. The expression of the antisense RNA is in accordance with the above-mentioned parameters relating to the expression of the sense RNA (regulatory sequence, constitutive or inducible expression, tissue-specific expression).
[0193]
The present invention also relates to a recombinant host cell comprising the vector described herein. Host cells thus include prokaryotic cells, lower eukaryotic cells such as yeast, other eukaryotic cells such as insect cells, and higher eukaryotic cells such as mammalian cells.
Recombinant host cells are produced by introducing the vector constructs described herein into cells by techniques readily available to those of skill in the art. These include calcium phosphate transfection, DEAE-dextran mediated transfection, cationic lipid mediated transfection, electroporation, transduction, infection, lipofection, and Sambrook, et al. (Molecular Cloning: A Laboratory Manual. 2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY;
[0194]
A host cell can contain more than one vector. Thus, different nucleotide sequences can be introduced on different vectors of the same cell. Similarly, a nucleic acid molecule can be introduced alone or with other nucleic acid molecules unrelated to the nucleic acid molecule that provides the trans-acting factor for the expression vector. When more than one vector is introduced into a cell, the vectors can be introduced independently, co-introduced, or ligated to a nucleic acid molecule vector.
[0195]
In the case of bacteriophage and viral vectors, these can be introduced into cells as packaged or encapsulated viruses by standard methods of infection and transduction. Viral vectors can be replication competent or replication defective. When viral replication is defective, replication occurs in a host cell that functions to complement the defect.
[0196]
Vectors generally contain a selectable marker from which a subpopulation of cells containing the recombinant vector construct can be selected. The marker may be included on the same vector containing the nucleic acid molecules described herein, or may be on a separate vector. Markers include the tetracycline or ampicillin resistance gene for prokaryotic host cells and the dihydrofolate reductase or neomycin resistance for eukaryotic host cells. However, any marker that selects a phenotypic trait may be effective.
[0197]
While mature proteins can be produced in bacteria, yeast, mammalian cells, and other cells under the control of appropriate regulatory sequences, cell-free transcription and translation systems can be performed using RNA derived from the DNA constructs described herein. They can also be used to produce these proteins.
If secretion of the peptide is required, it is difficult to perform on a multi-transmembrane domain containing proteins such as the estrogen receptor, but an appropriate secretion signal is added into the vector. The signal sequence may be endogenous to the peptides or may be atypical to these peptides.
[0198]
If the peptide is not secreted into the medium, which is a typical case of the estrogen receptor, the protein can be isolated from host cells by standard disruption methods, including freeze-thaw, sonication, mechanical disruption, use of lytic agents, and the like. Can be isolated from The peptide is then precipitated by ammonium sulfate precipitation, acid extraction, anion or cation exchange chromatography, cellulose phosphate chromatography, hydrophobic interaction chromatography, affinity chromatography, hydroxylapatite chromatography, lectin chromatography, or high performance liquid chromatography, etc. And can be recovered and purified by the well-known purification method described above.
[0199]
Depending on the host cell in the recombinant production of the peptides described herein, the peptide may not be glycosylated as in cells produced in bacteria, but may have different glycosylation patterns. It is also understood that there is. Further, in some cases, such as the result of a host-mediated process, the peptide may include an initial modified methionine.
[0200]
Use of vectors and host cells
Recombinant host cells expressing the peptides described herein have a variety of uses. First, the cells are useful for producing estrogen receptor proteins or for producing peptides that can be further purified to produce desired amounts of estrogen receptor proteins and fragments. Therefore, host cells containing the expression vector are useful for peptide production.
[0201]
Host cells are also useful in cell-based assays involving estrogen receptor proteins or estrogen receptor protein fragments as described above, as well as in formats known in the art. Therefore, recombinant host cells that express native estrogen receptor protein are useful for assaying substances that stimulate or suppress estrogen receptor protein function.
Host cells are also useful for identifying estrogen receptor protein mutants that affect their function. If the mutant occurs spontaneously and causes pathology, the host cell containing the mutation may have an effect on the native estrogen receptor protein that is It is useful for analyzing a compound having a desired effect (for example, a stimulating function or a suppressing function) on the mutant.
[0202]
Genetically engineered host cells can be further used to produce non-human transgenic animals. The transgenic animal is preferably a mammal, for example a rodent such as a rat or mouse, wherein one or more of the animal's cells contains the transgene. A transgene is exogenous DNA that is integrated into the genome of the cell in which the transgenic animal has developed and remains in the genome of the adult animal in one or more cell types or tissues of the transgenic animal. These animals are useful for studying the function of estrogen receptor protein, and for identifying and evaluating modulators of estrogen receptor protein activity. Other examples of transgenic animals include non-human primates, sheep, dogs, cows, goats, chickens, and amphibians.
[0203]
Transgenic animals can be produced by introducing a nucleic acid into the male pronucleus of a fertilized oocyte. For example, it can be produced by microinjection, retrovirus infection, development of oocytes in pseudopregnant female foster animals, and the like. Any of the estrogen receptor protein nucleotide sequences can be introduced as a transgene into the genome of a non-human animal, such as a mouse.
Any regulatory sequences or other sequences useful in expression vectors can form part of the transforming sequence. This includes the intron sequence and polyadenylation signal if not already included. Tissue-specific regulatory sequences are operably linked to the transgene and direct specific cells to express estrogen receptor protein.
[0204]
Methods for creating transgenic animals by embryo manipulation and microinjection are routine in the art, especially for animals such as mice, and are described, for example, in US Pat. Nos. 4,736,866 and No. 4,870,009 (both Leder et al.), U.S. Pat. No. 4,873,191 (Wagner et al.), And Hogan, B.A. , Manipulating the Mouse Embryo, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1986). Similar methods are used for the production of other transgenic animals. The basal animal for transformation can be identified based on the transgene in its genome and / or the expression of the transformed mRNA in tissues or cells of the animal. The transgenic animal can then be used to generate another animal that carries the transgene. In addition, a transgenic animal carrying a transgene can be improved to another transgenic animal carrying another transgene. Transgenic animals also include animals that produce whole animals or their tissues using the homologous recombination host cells described herein.
[0205]
In another embodiment, transgenic non-human animals can be produced comprising a selection system capable of regulating transgene expression. One example of such a system is the cre / oxP recombinase system of bacteriophage P1. Regarding the cre / oxP recombinase system, see, for example, Lakso et al. PNAS 89: 6232-6236 (1992). Another example of a recombinase system is the S. recombinase system. cerevisiae FLP recombinase system (O'Gorman et al. Science 251: 1351-1355 (1991)). If the cre / oxP recombinase system is used to regulate transgene expression, an animal containing the transgene encoding both the Cre recombinase and the selection protein is required. Such animals can be constructed, for example, through the construction of a "double" transgenic animal, for example, comprising two transgenic animals, one containing a transgene encoding a selection protein and the other containing a transgene encoding a recombinase. By breeding two transformed animals.
[0206]
Clones of the non-human transgenic animals described herein are also described in Wilmut, I .; et al. Nature 385: 810-813 (1997) and the methods described in PCT International Publication Nos. WO 97/07668 and WO 97/07669. Briefly, cells, eg, somatic cells, escape from the growth cycle and0Can be isolated and derived from the transgenic animal to enter the phase.
Resting cells can then be fused, for example, by using an electrical pulse on annucleated oocytes from an animal of the same species as which the resting cells were isolated. This reconstructed oocyte is then cultured to develop into a morula or tail vesicle and transferred to a pseudopregnant female foster animal. The offspring of the female foster animal will be a clone from the animal from which the cell, eg, a somatic cell, was isolated.
[0207]
Transgenic animals containing recombinant cells expressing the peptides described herein are useful for performing the assays described herein in an in vivo situation. The various physiological factors present in vivo and capable of effecting ligand binding, estrogen receptor protein activation, and signal transduction may not be apparent from in vitro cell-free or cell-based assays. Thus, the provision of non-human transgenic animals may provide for in vivo estrogen receptor protein function, such as ligand interaction, the effects of specific mutant estrogen receptor proteins on estrogen receptor protein function, and the effect of chimeric estrogen receptor protein. Useful for analyzing functions including effects. The effect of a null mutation, ie, a mutation that substantially or completely eliminates one or more estrogen receptor protein functions, can also be evaluated.
[0208]
【Example】
1. Identification and evaluation of SNP
Each exon of the estrogen receptor alpha (ESR1) was PCR amplified using primers flanking each exon flanking sequence (exon / intron boundary) and the sequence of the amplified fragment was analyzed. Genomic DNA (see FIG. 2 (b)) from the Colliere Diversity Panel (10 each of 5 ethnic groups) and / or Liverpool clinical breast tumors and corresponding blood samples from 48 patients (Liverpool, UK) as PCR templates (See FIG. 2 (a)). PolyPhred version 2.0 (DA Nickerson, S. Taylor, N. Kolker, Univ. Of Washington, 1998) was run on the array (with default settings) to visualize potential heterozygotes. The properties of the labeling site were tested to confirm the polymorphism.
[0209]
Thirty-six SNPs with a frequency of ≧ 2 and a trait score of ≧ 20 were identified with a clinical sample specific 13 Fifteen SNPs showed at least one change in heterozygosity of the clinical sample, and four SNPs showed at least one defect in heterozygosity. For analysis, PCR primers were used for SNP identification and detection (see FIG. 2 (e)).
Furthermore, the primer set and M13 primer of FIG. 2 (d) were used for overlapping PCR and clone sequencing.
[0210]
[Table 1]
Summary of SNPs found in clinical samples: All SNPs had a frequency of 2 or more and a characteristic score of 20 or more (see FIG. 8).
Figure 2004531228
[0211]
[Table 2]
Summary of heterozygous changes in clinical samples: SNPs had a frequency of ≧ 2 and a characteristic score of ≧ 20 (see FIG. 8).
Figure 2004531228
[0212]
FIG. 2 (c) included the analyzed SNPs in the Liverpool control group versus the blood or tumor group.
FIG. 5 shows the domain structure of the ESR1 protein and many of the SNP positions disclosed herein. FIG. 6 is a graph showing the SNP and the frequency of occurrence in the test sample.
FIG. 8 (a) (1) shows SNPs and incidence in collier samples collected from ethnic groups of Northern Europeans, Chinese, Indo-Pakistani, African American, and Southwestern Native Americans. . In 3 'flanking exon 8, the location of the SNP is based on the sequence of AL078582 in the gene bank. The results can be used for detection between specific ethnic groups. FIG. 8 (a) (2) shows genotyping of the SNP at site 167989 (Intron 1D, # 9) in the Collier panel. The panel includes 100 Caucasians, 51 male and 49 female. The results show that the frequency of the minor allele is 9%.
[0213]
FIG. 8 (b) (1) shows the SNP and occurrence frequency in Liverpool samples selected from the group of blood samples from Nordic people and breast cancer samples.
FIG. 8 (b) (2) shows the results of tack human genotyping of SNP sites 167,989 (intron 1D, # 9) in 60 additional Liverpool patients. This result indicates that the frequency of the minor allele (G) was 14% in blood and 10% in tumor. This is similar to the SNP genotyping of the collier sample shown in FIG. 8 (b) (1). The frequency of the minor allele was 16% in blood and 17% in tumor. The Liverpool control group (95 cases) shows that the frequency at the minor allele was 10.5% (FIG. 2 (c)).
[0214]
2. Haplotype analysis
The method developed for SNP discovery was designed to obtain haplotype data. SNPs could be associated with specific haplotypes. Sample cDNA was obtained from a random group present at an unknown ratio. SNPs from specific clones were clustered into haplotypes and made.
[0215]
The data consists of two sample types (FIGS. 4 (a) and (b)). Liverpool samples were from 48 patients, each patient having a tumor and a corresponding blood sample. The Collier samples were controls, but they were not the corresponding controls. Rather, they were included in a mix of Europeans, Chinese, Indo-Pakistani, and African Americans. Forty-six SNPs in ESR1 were recorded in the Liverpool sample. The same 46 SNPs and an additional 6 SNPs 3 'of the RSR1 gene were recorded in the Collier sample.
[0216]
These data were subjected to analysis to infer the most appropriate haplotype phase of the individual. The results are shown in FIG. 4 (a), where each haplotype has a number and the number with a dash is the count (or frequency) of that haplotype.
FIG. 4 (b) shows non-single haplotype data adapted to a close-junction tree diagram. If the tree diagram is cut at the arrow, the branch including 3L, 10-4,... 73L is defined as "branch X" from the rest of the tree diagram. The differences in tumor incidence in the haplotypes in Branch X versus the rest of the dendrogram are shown below. The incidence of each haplotype was counted by first adding the numbers with dashes. L indicates a neoplastic Liverpool sample, and L indicates a Collier control.
[0217]
Figure 2004531228
X2Was calculated to be 21.29 with a degree of freedom having a probability of less than 0.0001 based on a 2 × 2 table. Thus, branch X of the ER1 gene has more opportunities to associate with tumors. This full fork is very rare elsewhere in the world. Even among Europeans, there was only one out of 20 haplotypes.
[0218]
The sites where branching was identified with a large frequency difference between the Colliere control, Liverpool control and Liverpool tumor samples are as follows.
Figure 2004531228
[0219]
3 . Estrogen receptor 1 promoter region and SNP
The CAAT and TATA boxes are the first 200 b. Of the sequence. p. It is thought that these distances may be functional as basal promoters.
The distance between the CAAT-TATA sites and the actual start of transcription specified is about 300 b. p. (Usually about 20-40 bp), and this region includes multiple TF regions such as NFAT, NFKB, SP1-family, CEBP and EBOX. Most of these have been implicated in the regulation of specific (tissue, cell type) expression.
[0220]
The region of T (SNP) has interesting properties. It not only has a maintenance (TC) 6-repeat, but also has a 5-prime (CA) 6. The maintenance motif is CACAYTCTC in the same region. None of the known TF sites fit this region significantly, and it appears to be a novel TF site. Very close to T (SNP) is the TF site called AHRARNT_02 for the aryl hydrocarbon / Arnt heterodimer. The CACAYTCTC site aids in the correct placement of the cofactor attachment point or Arnt complex. A single mutation in the TF binding site may reduce the affinity of protein binding by several folds and lead to disease pathways.
[0221]
In the present invention, the SNP occurs exactly 13 bp upstream of exon 1C in a short GA repeat (GAGAGAGA). Of the related SNPs in the branch (FIG. 4), three are silent mutations, one is in the 3'UTR and the rest are in the intron region.
An important T to G SNP (# 9) is located at site 167989 (intron 1D) in the promoter region (FIGS. 2 (a), (b) and (c)). Loss of gene copy is associated with cancer risk. Promoter mutations that reduce gene expression have a similar effect.
[0222]
G to T transversions are in alternating promoter sites. There are certain effects on estrogen physiology, perhaps the overall level of signaling in the nucleus. The "effect" of the associated branch (and the haplotype of the branch) (FIG. 4) is to increase overall estrogen receptor sensitivity and reactivity, or that the cycle is in the direction of unregulated (non-physiological) growth signals. It is expected that it can be guided towards some other growth process. Estrogen exposure plays a crucial role in the cause of breast cancer in virtually all epidemiological studies.
[0223]
Furthermore, the TF binding site and SNP were detected in the ESR1 gene in which 5 SNPs occurred in the transcription binding site, as described below.
Figure 2004531228
[0224]
4 . ESR1 Genome Sequencing-Complete Genome Structure of Estrogen Receptor Alpha
The estrogen receptor (ER) is a member of the nuclear hormone receptor gene superfamily. This family of genes is characterized by a modular structure of three distinct domains: a mutated (N) -terminal domain, a highly maintained DNA binding domain, and a maintained (C) -terminal domain (see references 1, 2). . Functionally, the (N) -terminal domain is for transactivation, the DNA binding domain is for dimerization and DNA binding, and the (C) -terminal domain is for transactivation, dimerization, ligand binding, nuclear translocation. , Silencing, and heat shock protein binding, respectively. The function of each domain of the nuclear hormone gene superfamily is independent of the receptor in which they are found, and retains its function even when the domains are located in different atypical proteins (see references 3, 4, and 5). ). Because the major subfamilies of these genes evolved early in evolution through simple gene replication, there is a domain modularity of the nuclear hormone receptor gene superfamily (Ref. 6). The nuclear hormone receptor gene family can be separated according to two different classification schemes. One is based on hormone binding and the other is based on dimerization and the method of binding the receptor to the DNA response element (see reference 2).
[0225]
The ERα cDNA was first cloned and sequenced from the MCF-7 breast cancer cell line and was found to have 27% identity and 41% conservation with respect to the v-erb-A gene (Ref. 7). ). ERa was mapped to chromosome 6q25.1 using fluorescence in situ hybridization (FISH) and chromosome binding (8). In 1996, a novel estrogen receptor (ERβ) was identified by degenerate PCR (ref. 9) and mapped to 14q22-24 by FISH (ref. 10). ERα and ERβ have 96% sequence identity in the DNA binding domain and 58% identity in the ligand binding domain, and are identical at the 5 ′ and 3 ′ ends as in the hinge (domain D). Was shown to be low. A variety of ERα and ERβ variants have been described previously, including transcripts containing single and multiple exon deletions, truncated transcripts, and insertions (refs. 11, 12, 13). These variants have been isolated from a variety of sources including normal tissues, tumor tissues and cell lines. The tumor ER status of breast cancer patients has been used as an indicator of response to endocrine therapy (Refs. 14, 15) and many studies have suggested a role for ERs in breast cancer tumor progression, ER-negative status, and hormone antagonist resistance. Has been studied (see reference 16).
[0226]
Due to the importance of the ER gene, we cloned it whole and sought to determine its complete structure. Initially, standard bacterial artificial chromosome (BAC) sequencing was used to generate sequence information for the coding region of the gene. As the human genome sequencing of Celera progressed, the remaining regions of the ER were filled in using Celera Legion assembly. Regions smaller than 25 kb were filled in on ERa using known BACs (Al353611.6, positions 1,497-25,941).
[0227]
Materials and methods
1) BAC screening
Appropriate markers were designed for the ERa and ERβ exons and used to obtain commercially available BAC clones from Research Genetics (Huntsville, AL). Several positive BACs were selected and each clone was rescreened for confirmation.
[0228]
2) Isolation of DNA and preparation of library
BAC DNA was isolated from the confirmed clones using a QIAGEN column (QIAGEN, Inc., Valencia, CA) according to the manufacturer's specifications. Shotgun libraries were made according to standard protocols (Ref. 17). Briefly, isolated BAC DNA was sonicated, polished, and size fractionated. The size selected DNA fragments were then subcloned into pUC19 using standard ligation techniques. The ligated DNA was transformed into electrocompetent cells (Life Technologies, Rockville, MD) and grown overnight.
[0229]
3) DNA sequencing and annotation
Sequencing reactions were performed using Big Dye Terminator chemistry, Applied Biosystems, Foster City, CA, and performed on an ABI PRISM 3700 DNA Analyzer (Applied Bios). Phred (ref. 18), Prap and Consed (ref. 19) were used for base calling, assembly and finishing, respectively. Exon positions were determined using cross-matching and the published gene sequence was compared to the genomic contig.
[0230]
result
1. Estrogen receptor alpha
Alignment of the ERα genomic sequence and the published mRNA sequence of ERα shows that the gene consists of 14 exons and covers a 446,296 bp genomic sequence (FIG. 7, Table 3).
2. Estrogen receptor beta
Alignment of the ERβ genomic sequence and the published mRNA sequence of ERβ shows that the gene consists of 17 exons and covers a 253,748 bp genomic sequence (Figure 2, Table 1). The gene, human synaptic nucleus expression gene 2 (syn-2, accession number NM_015180.1) was identified by analysis with the Serera genome browser. It is completely contained within intron 9 of ERβ on the opposite strand. Further analysis of the syne-2 gene showed that it consisted of 21 exons and covered a genomic sequence of 51,471 bp.
[0231]
Consideration
Alignment of the complete ERα genomic sequence with the various ERβ transcripts indicates that the gene covers a 446,296 bp genomic sequence and consists of 14 exons. Alignment of the published sequence of exon 1E (AJ002561) (ref. 20) with the ERα genomic sequence revealed that exon 1E actually consists of two separate exons. The newly indicated exon follows the nomenclature established so far and is referred to herein as exon 1G. Exon 1G is located approximately 45 kb upstream of exon 1E and corresponds to the GT / AG splice site consensus sequence (Figure 1, Table 1).
[0232]
Alignment of the various ERβ transcripts to the complete ERβ genomic sequence shows a more complex organization than heretofore accepted (13). The 5′UTR of the ERβcx mutant (AB006589) is actually composed of seven untranslated exons (herein referred to as exons-1 to -7), all of which correspond to the GT / AG splice site consensus sequence (FIG. 2). , Table 1). Sequence alignment of the ERβ mutants AF061055 and AF061054 (ref. 12) indicated that these transcripts both contained intron sequences and were probably partially mature transcripts. Both of these partially mature transcripts contain exon 7 and part of exon 9, but do not match the splice site consensus sequence where the intron sequence is present.
[0233]
By examining the ER genomic sequence using the Cellera Genome Browser, the isolated gene completely contained within intron 9 of ERβ could be identified. This gene is a human synaptic nucleus expression gene 2 (syn-2), which has been shown to cover a 50 Kb genomic sequence and consist of 21 exons. These all correspond to the GT / AG splice consensus sequence (Table 4). The syne-2 gene is located on the antisense strand of ERβ.
Completion of the sequence and structure of ERα and ERβ contributes to further understanding and characterization of these key receptors.
[0234]
[Table 3]
Exon-intron boundaries and locations at the human estrogen receptor:
Exon sequences are in upper case, intron sequences are in lower case, and splice sites are in bold.
Figure 2004531228
[0235]
[Table 4]
Exon-Intron Boundary and Location in Human Synaptic Nuclear Expression Gene 2:
Exon sequences are in upper case, intron sequences are in lower case, and splice sites are in bold.
Figure 2004531228
[0236]
References
1. Ribeiro RC, Kushner PJ, Baxter JD, Tenbaum S, Baniahmad A. The nuclear hormone receptor gene superfamily. Annu Rev Med 1995; 46: 443-53.
2. Tenbaum S, Baniahmad A. Nuclear receptors: structure, function and evolution in disease. Int J Biochem Cell Biol. 1997 Dec; 29 (12): 1325-41.
3. Baniahmad C, Baniahmad A, O'Malley BW. A rapid method combining a functional test of fusion proteins in vivo and the air purification. Biotechniques. 1994 Feb; 16 (2): 194-6.
4. Parker MG, White R. Nuclear receptors spring into action. Nat Struct Biol. 1996 Feb; 3 (2): 113-5.
5. Schwabe JW. Transcriptional control: how nuclear receptors get turned on. Curr Biol. 1996 Apr 1; 6 (4): 372-4.
[0237]
6. Laudet V, Hanni C, Coll J, Catzeflis F, Stehelin D. Evolution of the nuclear receptor gene superfamily. EMBO J.S. 1992 Mar; 11 (3): 1003-13.
7. Green S, Walter P, Kumar V, Krust A, Bornert JM, Argos P, Chambon P. Human oestrogen receptor cDNA: sequence, expression and homology to v-erb-A. Nature. 1986 Mar 13-19; 320 (6058): 134-9.
8. Menasce LP, White GR, Harrison CJ, Boyle JM. Localization of the estrogen receptor locus (ESR) to chromasome 6q25.1 by FISH and a simple post-FISH banding technique. Genomics 1993 Jul; 17 (1): 263-5.
9. Mosselman S, Polman J, Dijkema R. ER beta: identification and characterisation of a novel human estrogen receptor. FEBS Lett. 1996 Aug 19; 392 (1): 49-53.
10. Enmark E, Pelto-Huikko M, Grandien K, Lagercrantz S, Lagercrantz J, Fried G, Nordenskjold M, Gustafsson JA. Human estrogen receptor beta-gene structure, chromosomal localization, and expression pattern. J Clin Endocrinol Metab. 1997 Dec; 82 (12): 4258-65.
[0238]
11. Murphy LC, Dotzlaw H, League E, Douglas D, Coutts A, Watson PH. Estrogen receptor variants and mutations. J Steroid Biochem Mol Biol. 1997 Aug; 62 (5-6): 363-72.
12. Moore JT, McKee DD, Slentz-Kesler K, Moore LB, Jones SA, Horne EL, Su JL, Kliewer SA, Lehmann JM, Willson TM. Cloning and characteristics of human estrogen receptor beta isoforms. Biochem Biophys Res Commun. 1998 Jun 9; 247 (1): 75-8.
13. Ogawa S, Inoue S, Watanabe T, Orimo A, Hosoi T, Ouchi Y, Muramatsu M. Molecular cloning and characterisation of human estrogen receptor betax: a potential inhibitor of estrogen action in human. Nucleic Acids Res. 1998 August 1: 26 (15): 3505-12.
14. Osborne CK, Yochmowitz MG, Knight WA 3d, McGuire WL. The value of estrogen and progesterone receptors in the treatment of breast cancer. Cancer 1980 Dec 15; 46 (12 Suppl): 2884-8.
15. DeSombre ER, Carbone PP, Jensen EV, McGuire WL, Wells SA Jr, Wittliff JL, Lipsett M Special report. Stereoceptors in breast cancer. N Engl J Med 1979 Nov 1; 301 (18): 1011-2.
[0239]
16. Parl, Fritz F.A. , Estrogens, Estrogen receptor, and Breast Cancer. IOS Press, Amsterdam, Netherlands, 2000.
17. Birren B, Green ED, Klapolz S, Myers, R, Riethman H, Roskams J, (eds.) (1997), Genome Analysis: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.
18. Ewing B, Hillier L, Wendl MC, Green P. Base-calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res 1998 Mar; 8 (3): 175-85.
19. Gordon D, Abajan C, Green P. Consed: a graphical tool for sequence finishing. Genome Res 1998 Mar; 8 (3): 195-202.
20. Flouriot G, Griffin C, Knealy M, Sonntag-Buck V, Gannon F. Differentially expressed messenger RNA isoforms of the human estrogen receptor-alpha gene are generated by the alternating splicing and promoter. Mol Endocrinol 1998 Dec; 12 (12): 1939-54.
[0240]
All publications and patents mentioned in the above specification are herein incorporated. Various modifications and variations of the described method and system will be apparent to those skilled in the art without departing from the scope and spirit of the invention. While the invention has been described in connection with specific preferred embodiments, it should be understood that the invention as claimed should not be unduly limited to such specific embodiments. Indeed, various modifications of the described modes for carrying out the invention which are obvious to those skilled in molecular biology and related fields are within the scope of the claims.
[Sequence list]
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228
Figure 2004531228

[Brief description of the drawings]
FIG. 1. Complete genomic sequence of the estrogen receptor alpha gene.
FIG. 2. Sequence polymorphisms found in estrogen receptor alpha genomic DNA (nucleotide positions are based on the sequence given in FIG. 1).
(A) SNP in Liverpool clinical tissue sample
(B) SNPs in the Collier Diversity Panel
(C) SNPs in Liverpool control population
(D) PCR primer
(E) Sequencing primer
FIG. 3. Amino acid sequence of estrogen receptor alpha protein.
FIG. 4: Estrogen receptor haplotype (see haplotype).
(A) Liverpool samples from 48 patients, each patient has a tumor and a corresponding blood sample. The Collier sample is a control.
(B) Non-single haplotype data suitable for neighboring trees (L is Liverpool sample).
FIG. 5. Domain structure of ESR1 protein and SNP positions disclosed herein.
FIG. 6: Distribution and frequency of many SNPs according to the invention.
FIG. 7 is a graphical representation of the human ESR1 locus.
(A) Complete structure of human estrogen receptor alpha (ERα). Exons are filled squares, and introns are horizontal lines.
(B) The order and name of the contigs used to complete the genome sequence. The GA number represents a cellera contig number. Research Genetics BAC clones are designated by reference plate and detail number.
FIG. 8: ESR alpha SNPs: a) in Collier sample, b) in Liverpool sample (T = tumor sample, B = blood sample, LC = Liverpool control), c) in Liverpool control sample.
FIG. 9: ESR alpha exon with SNP (see FIG. 2 for “N”, “C”, “I”, “A”, “S”). The underlined sequence represents the primer sequence.

Claims (17)

下記(a)及び(b)からなる群から選択されるアミノ酸配列からなる単離ペプチド。
(a)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列。
(b)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列のフラグメントであって、少なくとも10個の隣接するアミノ酸を含むフラグメント。
An isolated peptide comprising an amino acid sequence selected from the group consisting of the following (a) and (b):
(A) Amino acid sequence of mutant estrogen receptor protein given in FIG.
(B) A fragment of the amino acid sequence of the mutant estrogen receptor protein provided in FIG. 2, comprising at least 10 contiguous amino acids.
下記(a)及び(b)からなる群から選択されるアミノ酸配列を含む単離ペプチド。
(a)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列。
(b)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列のフラグメントであって、少なくとも10個の隣接するアミノ酸を含むフラグメント。
An isolated peptide comprising an amino acid sequence selected from the group consisting of the following (a) and (b).
(A) Amino acid sequence of mutant estrogen receptor protein given in FIG.
(B) A fragment of the amino acid sequence of the mutant estrogen receptor protein provided in FIG. 2, comprising at least 10 contiguous amino acids.
請求項1記載のペプチドに選択的に結合する単離抗体。An isolated antibody that selectively binds to the peptide of claim 1. 下記(a)、(b)及び(c)からなる群から選択されるヌクレオチド配列からなる単離核酸分子。
(a)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列をコード化するヌクレオチド配列。
(b)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列のフラグメントをコード化するヌクレオチド配列。
(c)(a)−(b)の核酸分子の補体である核酸分子。
An isolated nucleic acid molecule consisting of a nucleotide sequence selected from the group consisting of the following (a), (b) and (c):
(A) Nucleotide sequence encoding the amino acid sequence of the mutant estrogen receptor protein provided in FIG.
(B) Nucleotide sequence encoding a fragment of the amino acid sequence of the mutant estrogen receptor protein provided in FIG.
(C) a nucleic acid molecule that is the complement of the nucleic acid molecule of (a)-(b).
下記(a)、(b)及び(c)からなる群から選択されるヌクレオチド配列を含む単離核酸分子。
(a)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列をコード化するヌクレオチド配列。
(b)図2で与えられる変異エストロゲン受容体タンパクのアミノ酸配列のフラグメントをコード化するヌクレオチド配列。
(c)(a)−(b)の核酸分子の補体である核酸分子。
An isolated nucleic acid molecule comprising a nucleotide sequence selected from the group consisting of (a), (b) and (c) below.
(A) Nucleotide sequence encoding the amino acid sequence of the mutant estrogen receptor protein provided in FIG.
(B) Nucleotide sequence encoding a fragment of the amino acid sequence of the mutant estrogen receptor protein provided in FIG.
(C) a nucleic acid molecule that is the complement of the nucleic acid molecule of (a)-(b).
請求項4記載の核酸配列を含む核酸ベクター。A nucleic acid vector comprising the nucleic acid sequence according to claim 4. 請求項5記載の核酸配列を含む核酸ベクター。A nucleic acid vector comprising the nucleic acid sequence according to claim 5. 請求項6記載のベクターを含む宿主細胞。A host cell comprising the vector according to claim 6. 請求項7記載のベクターを含む宿主細胞。A host cell comprising the vector according to claim 7. 請求項1記載の何れかのペプチドの生産方法であって、(a)−(b)のペプチド配列の何れかをコード化するヌクレオチド配列を宿主細胞に導入し、その核酸配列からタンパクを発現する条件下で該宿主細胞を培養することを含む、ペプチドの生産方法。2. The method for producing a peptide according to claim 1, wherein a nucleotide sequence encoding any of the peptide sequences (a)-(b) is introduced into a host cell, and a protein is expressed from the nucleic acid sequence. A method for producing a peptide, comprising culturing the host cell under conditions. 請求項2記載の何れかのペプチドの生産方法であって、(a)−(b)のペプチド配列の何れかをコード化するヌクレオチド配列を宿主細胞に導入し、その核酸配列からタンパクを発現する条件下で該宿主細胞を培養することを含む、ペプチドの生産方法。3. The method for producing a peptide according to claim 2, wherein a nucleotide sequence encoding any of the peptide sequences (a) and (b) is introduced into a host cell, and a protein is expressed from the nucleic acid sequence. A method for producing a peptide, comprising culturing the host cell under conditions. サンプル中における請求項1記載の何れかのペプチドの存在の検出方法であって、サンプル中の該ペプチドの存在を特異的に検出可能な作用物質とサンプルを接触させ、その後該ペプチドの存在を検出することを含む検出方法。2. A method for detecting the presence of any of the peptides according to claim 1 in a sample, comprising contacting the sample with an agent capable of specifically detecting the presence of the peptide in the sample, and then detecting the presence of the peptide. A detection method comprising: 請求項12記載の方法に使用するための試薬を含むキットであって、該試薬が前記ペプチドに特異的に結合する作用物質を含むキット。13. A kit comprising a reagent for use in the method of claim 12, wherein said reagent comprises an agent that specifically binds to said peptide. サンプル中における請求項4記載の核酸配列の存在の検出方法であって、ストリンジェント条件下で該核酸配列にハイブリダイズするオリゴヌクレオチドにサンプルを接触させ、該サンプル中の該核酸配列に該オリゴヌクレオチドが結合するか否かを決定することを含む検出方法。5. A method for detecting the presence of a nucleic acid sequence according to claim 4 in a sample, wherein the sample is contacted with an oligonucleotide that hybridizes to the nucleic acid sequence under stringent conditions, and A method of detecting, comprising determining whether or not binds. 請求項14記載の方法に使用するための試薬を含むキットであって、該試薬がストリンジェント条件下で前記核酸分子の何れかにハイブリダイズする化合物を含むキット。15. A kit comprising a reagent for use in the method of claim 14, wherein the reagent comprises a compound that hybridizes under stringent conditions to any of the nucleic acid molecules. 請求項1記載の何れかのペプチドに結合する作用物質の特定方法であて、該ペプチドを物質に接触させ、その接触混合物を分析して前記物質がペプチドに結合して複合体を形成するか否かを決定することを含む特定方法。The method for identifying an agent that binds to any peptide according to claim 1, wherein the peptide is contacted with a substance, and the contact mixture is analyzed to determine whether the substance binds to the peptide to form a complex. A specific method that includes determining 変異エストロゲン受容体により媒介される疾患を有する、又は発症する危険があるヒトを特定する方法であって、エストロゲン受容体遺伝子配列の変更に関してそのヒトから単離した核酸分子を分析し、図2及び図4で与えられる変異体からなる群から選択される前記エストロゲン受容体遺伝子における変更を、骨疾患を有する又は発症する危険があると特定することを含む特定方法。A method for identifying a human having or at risk of developing a disease mediated by a mutant estrogen receptor, comprising analyzing nucleic acid molecules isolated from the human for alterations in the estrogen receptor gene sequence, A method of identifying, comprising identifying an alteration in said estrogen receptor gene selected from the group consisting of the variants provided in FIG. 4 as having or at risk of developing a bone disease.
JP2002560443A 2000-10-20 2001-08-21 Estrogen receptor alpha mutant and method for detecting the same Pending JP2004531228A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US69241400A 2000-10-20 2000-10-20
US76818401A 2001-01-24 2001-01-24
US80407601A 2001-03-13 2001-03-13
US82631401A 2001-04-05 2001-04-05
PCT/US2001/025990 WO2002034945A2 (en) 2000-10-20 2001-08-21 Estrogen receptor alpha variants and methods of detection thereof

Publications (1)

Publication Number Publication Date
JP2004531228A true JP2004531228A (en) 2004-10-14

Family

ID=27505440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002560443A Pending JP2004531228A (en) 2000-10-20 2001-08-21 Estrogen receptor alpha mutant and method for detecting the same

Country Status (5)

Country Link
EP (1) EP1328661A2 (en)
JP (1) JP2004531228A (en)
AU (1) AU2001286560A1 (en)
CA (1) CA2426405A1 (en)
WO (1) WO2002034945A2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020123095A1 (en) * 1999-10-20 2002-09-05 Pe Corporation (Ny) Estrogen receptor alpha variants and methods of detection thereof
GB201505305D0 (en) 2015-03-27 2015-05-13 Immatics Biotechnologies Gmbh Novel Peptides and combination of peptides for use in immunotherapy against various tumors
MY193703A (en) 2015-03-27 2022-10-26 Immatics Biotechnologies Gmbh Novel peptides and combination of peptides for use in immunotherapy against various tumors

Also Published As

Publication number Publication date
AU2001286560A1 (en) 2002-05-06
WO2002034945A3 (en) 2002-08-08
WO2002034945A2 (en) 2002-05-02
CA2426405A1 (en) 2002-05-02
EP1328661A2 (en) 2003-07-23

Similar Documents

Publication Publication Date Title
US5352775A (en) APC gene and nucleic acid probes derived therefrom
JP3455228B2 (en) Chromosome 13 linkage-breast cancer susceptibility gene
RU2161309C2 (en) Mutations of mts gene in embryonic line and method of detection of predisposition to malignant tumors
JP4368522B2 (en) Mutations in the myostatin gene that cause double massing in mammals
US20040170994A1 (en) DNA sequences for human tumour suppressor genes
JP2002502227A (en) Methods for diagnosing predisposition to breast and ovarian cancer
JP2002503943A (en) In vivo mutations and polymorphisms in 17q-linked breast and ovarian cancer susceptibility genes
US8907067B2 (en) Nucleotide and amino acid sequences relating to respiratory diseases and obesity
US20020123095A1 (en) Estrogen receptor alpha variants and methods of detection thereof
CA2520271C (en) Methods for the diagnosis and treatment of epilepsy
US7479368B2 (en) Method for detecting subjects having Paget's disease of bone
JP2004537959A (en) Estrogen receptor α mutant and method for detecting the same
JP2004512816A (en) Estrogen receptor β mutant and method for detecting the same
JP2004531228A (en) Estrogen receptor alpha mutant and method for detecting the same
AU2002319062A1 (en) Paget disease of bone
JP3241736B2 (en) 17q-linked breast and ovarian cancer susceptibility genes
US20040203073A1 (en) ATP-binding transporter (ABC7) and method for detection of Anemia and Ataxia
AU1118301A (en) Tumour suppressor genes from chromosome 16
WO2008042762A2 (en) Single nucleotide polymorphisms associated with cardiovascular disease
WO2002070699A2 (en) Cofactors of the estrogen receptor alpha and methods of use
WO2002053585A2 (en) Mammalian nuclear receptor cofactor cf11 and methods of use
WO2002053591A1 (en) Mammalian nuclear receptor cofactor cf12 and methods of use
JP2003523202A (en) Isolated human phosphatase protein, nucleic acid molecule encoding human phosphatase protein and method of using same
WO1998056908A1 (en) Vitamin d receptor isoform proteins
WO2002042322A2 (en) Mammalian nuclear receptor cofactors cf7 and cf8 and methods of use