JP2002325588A - ヒト・dnaミスマッチ修復蛋白 - Google Patents

ヒト・dnaミスマッチ修復蛋白

Info

Publication number
JP2002325588A
JP2002325588A JP2002016830A JP2002016830A JP2002325588A JP 2002325588 A JP2002325588 A JP 2002325588A JP 2002016830 A JP2002016830 A JP 2002016830A JP 2002016830 A JP2002016830 A JP 2002016830A JP 2002325588 A JP2002325588 A JP 2002325588A
Authority
JP
Japan
Prior art keywords
ser
leu
glu
lys
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002016830A
Other languages
English (en)
Other versions
JP3752457B2 (ja
Inventor
William A Haseltine
ウイリアム・エイ・ハセルティン
Steven M Ruben
スティーブン・エム・ルーベン
Fei Uei In
イン−フェイ・ウェイ
Mark D Adams
マーク・ディー・アダムス
Robert D Fleischmann
ロバート・ディー・フレイシュマン
Claire M Fraser
クレール・エム・フレーザー
Rebecca A Fuldner
レベッカ・エイ・フルドナー
Ewen F Kirkness
ユエン・エフ・カークネス
Craig A Rosen
クレーグ・エイ・ローゼン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Human Genome Sciences Inc
Original Assignee
Human Genome Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/187,757 external-priority patent/US6482606B1/en
Priority claimed from US08/294,312 external-priority patent/US6380369B1/en
Application filed by Human Genome Sciences Inc filed Critical Human Genome Sciences Inc
Publication of JP2002325588A publication Critical patent/JP2002325588A/ja
Application granted granted Critical
Publication of JP3752457B2 publication Critical patent/JP3752457B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

(57)【要約】 【課題】 本発明は、ヒト・DNA修復蛋白およびかか
る蛋白をコードするDNA(RNA)、さらに組み換え
法によるかかる蛋白の製造方法を開示する。さらに本発
明は、hMLH1、hMLH2およびhMLH3遺伝子
における変化を診断する方法を提供する。 【解決手段】 hMLH1、hMLH2およびhMLH
3遺伝子配列ならびにhMLH1、hMLH2およびh
MLH3遺伝子における変化を診断する方法。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、新たに同定された
ポリヌクレオチド、かかるポリヌクレオチドによりコー
ドされるポリペプチド、かかるポリヌクレオチドならび
にポリペプチドの使用、さらにかかるポリヌクレオチド
ならびにポリペプチドの製造に関する。より詳細には、
本発明ポリペプチドは原核細胞のmutL4遺伝子のヒ
ト・相同体であり、以後、hMLH1、hMLH2およ
びhMLH3という。
【0002】
【従来の技術】原核生物および真核生物の両方におい
て、DNAミスマッチ修復遺伝子は、DNA複製および
遺伝学的組み換えの間に生じるエラーの修正において際
立った役割を果たしている。現在までのところ、イー・
コリ(E.coli)のメチル特異的DNAミスマッチ修復系
は最もよく理解されているDNAミスマッチ修復系であ
る。イー・コリにおいて、この修復経路は、ミューテー
ター遺伝子mutS、mutL、mutHおよびuvr
Dの生成を包含している。これらの遺伝子のうちいずれ
か1つの変異体はミューテーター表現型を示すであろ
う。MutSは、この修復プロセスを開始するDNAミ
スマッチ結合蛋白であり、uvrDはDNAヘリカーゼ
であり、MutHは、半メチル化GATC配列の非メチ
ル化鎖を切開する潜在的なエンドヌクレアーゼである。
MutL蛋白はミスマッチDNA−MutS−MutH
複合体を認識し、これに結合してMutH蛋白のエンド
ヌクレアーゼ活性を増大させる。非メチル化DNA鎖が
MutHにより切断された後、1本鎖DNA結合蛋白、
DNAポリメラーゼIII、エキソヌクレアーゼIおよび
DNAリガーゼがこの修復プロセスの完了に必要とされ
る(モドリッチ,ピー(Modrich P.)、アニュ・レビュ・
ジェネティクス(Annu.Rev.Genetics)、第25巻:2
29〜253頁(1991年))。
【0003】イー・コリのMutLHS系のエレメント
は、原核生物および真核生物の進化の過程で保存されて
いるように思われる。遺伝学的研究分析は、サッカロマ
イセス・セレビシエ(Saccharomyces cerevisiae)は細
菌のMutLHS系と同様のミスマッチ修復系を有する
ことを示唆している。エス・セレビシエ(S.cerevisia
e)において、少なくとも2つのMutL相同体である
PMS1およびMLH1が報告されている。それらのう
ちのいずれかの変異は有糸分裂ミューテーター表現型を
導く(プロラ(Prolla)ら、モレ・セル・バイオロ(Mo
l.Cell.Biol.)第14巻:407〜415頁(1994
年))。少なくとも3つのMutS相同体、すなわち、
MSH1、MSH2、およびMSH3がエス・セレビシ
エにおいて見いだされている。MSH2遺伝子の崩壊は
核変異率に影響する。エス・セレビシエにおける変異体
MSH2、PMS1、およびMLH1は、ジヌクレオチ
ド繰り返し配列の拡張および濃縮速度を増大させること
が見いだされている(ストランド(Strand)ら、ネイチ
ャー(Nature)、第365巻:274〜276頁(19
93年))。
【0004】肺癌、前立腺癌、卵巣癌、乳癌、結腸癌お
よび胃癌のごとき多くのヒトの腫瘍は繰り返しDNA配
列の不安定性を示す(ハン(Han)ら、キャンサー(Cance
r)、第53巻:5087〜5089頁(1993年);
チボドー(Thibodeau)ら、サイエンス(Science)、第
206巻:816〜819頁(1993年);リシンガ
ー(Risinger)ら、キャンサー(Cancer)、第53巻:
5100〜5103頁(1993年))。この現象は、
おそらくDNAミスマッチ修復の欠乏がこれらの癌の原
因であろうということを示唆する。
【0005】最近まで、ヒトにおけるDNAミスマッチ
修復系についてはほとんどわかっていないが、MutS
遺伝子のヒト・相同体がクローン化され、遺伝性非ポリ
ポーシス結腸癌(HNPCC)の原因であることがわか
った(フィッシェル(Fishel)ら、セル(Cell)第75
巻:1027〜1038頁(1993年)およびリーチ
(Leach)ら、セル、第75巻:1215〜1225頁
(1993年))。当初は、HNPCCは、ジヌクレオ
チド不安定性を引き起こす染色体2p16における遺伝
子座に関連しているとされた。次いで、DNAミスマッ
チ修復蛋白(MutS)相同体がこの遺伝子座に位置
し、いくつかの保存的領域におけるC→T過渡的変異が
特異的にHNPCC患者において観察されることが報告
された。遺伝性非ポリポーシス結腸癌はヒトの最もあり
ふれた遺伝病の1つであり、西洋世界においては200
人に1人が罹患している。
【0006】遺伝性結腸癌はいくつかの遺伝子座におけ
る変異から生じうることが示されている。染色体5上の
遺伝子に関連している家族性結腸腺腫症ポリポーシス
(APC)は遺伝性結腸癌のごく一部の原因である。遺
伝性結腸癌はガードナー症候群(Gardner's syndrom
e)、ターコット症候群(Turcot's syndrome)、ポイツ
−ジェガーズ症候群(Peutz-Jaeghers syndrome)およ
び幼若結腸ポリポーシスにも関連している。さらに、遺
伝性非ポリポーシス結腸癌はすべてのヒトの癌の5%を
占める。すべての異なるタイプの家族性結腸癌は遺伝の
優性常染色体モードによって伝達されることが示されて
いる。染色体2の短いアームへのHNPCCの局在化以
外に、第2の遺伝子座がHNPCC素因に関連していた
(リンドホルム(Lindholm)ら、ネイチャー・ジェネテ
ィクス(Nature Genetics)第5巻:279〜282頁
(1933年))。染色体3の短いアーム上の多形性マ
ーカーとその疾病遺伝子座との間において強力な関連が
示された。この知見は、おそらく、種々のDNAミスマ
ッチ修復蛋白上の変異がヒトの遺伝性の疾患および癌の
発生に重大な役割を果たしていることを示唆する。
【0007】HNPCCは、結腸、子宮内膜および他の
器官の癌の明らかな常染色体優性的に遺伝する素因によ
って臨床的に特徴づけられる(リンチ,エイチ・ティー
(Lynch,H.T.)ら、ガストロエンテロロジー(Gastroente
rology)、第104巻:1535〜1549頁(199
3年))。特定の家族性HNPCCにおける疾病に関連
している2p16および3p21〜22におけるマーカ
ーの同定により、そのメンデル則の性質が明確に確認さ
れた(ペルトマキ,ピー(Peltomaki,P.)ら、サイエン
ス(Science)、第260巻:810〜812頁(19
93年))。HNPCC患者由来の腫瘍は、単純な繰り
返し配列(マイクロサテライト(microsatellites)の
広範な変化により特徴づけられる(アールトネン,エル
・エイ(Aaltonen,L.A.)ら、サイエンス第260巻:
812〜816頁(1993年))。このタイプの遺伝
学的不安定性は、もともと、部分集団中(散在性結腸直
腸癌の12ないし18%)において観察された(上記文
献)。細菌および酵母における研究により、DNAミス
マッチ修復遺伝子の欠陥はマイクロサテライトの同様の
不安定性を引き起こす可能性があり(レビンソン,ジー
(Levinson,G.)およびグートマン,ジー・エイ(Gutma
n,G.A.)、ヌクレイック・アシッズ・リサーチ(Nuc.Ac
ids Res.)、第15巻:5325〜5338頁(198
7年))、ミスマッチ修復の欠損はHNPCCの原因で
あると仮定された(ストランド,エム(Strand,M.)ら、
ネイチャー第365巻:274〜276頁(1993
年))。HNPCC腫瘍細胞系からの抽出物の分析によ
り、ミスマッチ修復が実際に欠損しており、この推定を
明確に指示するものであることが示された(パーソン
ズ,アール・ピー(Parsons,R.P.)ら、セル(Cell)、第
75巻:1227〜1236頁(1993年))。すべ
ての家族性HNPCCが同一の遺伝子座に関連している
わけではなく、そして酵母において少なくとも3つの遺
伝子が同様の表現型を作る可能性があるので、他のミス
マッチ修復遺伝子がHNPCCの同じケースにおいて役
割を果たしている可能性があると思われる。
【0008】hMLH1は、酵母・mutL−相同体y
MLH1と最も相同性が高いが、hMLH2およびhM
LH3は酵母・mutL−相同体yPMS1に対してよ
り高い相同性を有する(hMLH2およびhMLH3
は、酵母・PMS1遺伝子に対するそれらの相同性のた
めに、時々、明細書中でhPMS1およびhPMS2と
いう)。hMLH1以外にも、染色体2q32上のhM
LH2遺伝子および染色体7p22上のhMLH3遺伝
子は、HNPCC患者の生殖系列において変異している
ことが見いだされた。このことは、HNPCCに関与す
る遺伝子数を2倍にし、この疾病の比較的高い発生率の
説明の一助となる。
【0009】
【発明が解決しようとする課題】上記事情に鑑みると、
ヒト・DNA修復蛋白およびかかる蛋白をコードするD
NA(RNA)、さらに組み換え法によるかかる蛋白の
製造方法に対する必要性が生じている。また、ヒト・D
NA修復遺伝子における変化を調べる方法も必要となっ
ている。
【0010】
【課題を解決するための手段および発明の実施の形態】
本発明の1の態様によれば、hMLH1、hMLH2お
よびhMLH3である新規な推定上の成熟ポリペプチ
ド、ならびに生物学的に活性があり診断上または治療上
有用なフラグメント、アナログおよびそれらの誘導体が
提供される。本発明ポリペプチドはヒト起源である。本
発明のもう1つの態様によれば、mRNA、DNA、c
DNA、ゲノムDNAを包含する、かかるペプチド、並
びに生物学的に活性があり診断上または治療上有用なそ
のフラグメント、アナログおよび誘導体をコードする単
離核酸分子が提供される。本発明のさらにもう1つの態
様によれば、hMLH1、hMLH2およびhMLH3
配列に特異的にハイブリダイズするに十分な長さの核酸
分子からなる核酸プローブが提供される。
【0011】本発明のさらにもう1つの態様によれば、
hMLH1、hMLH2またはhMLH3核酸配列を含
んでいる組み換え原核および/または真核宿主細胞を、
該蛋白の発現を促進する条件下で培養し、次いで、該蛋
白を回収することからなる、組み換え法によるかかるポ
リペプチドの製造方法が提供される。本発明のさらなる
態様によれば、治療目的、例えば、癌の治療のための、
かかるポリペプチドおよびかかるポリペプチドをコード
するポリヌクレオチドの使用方法が提供される。
【0012】本発明のもう1つの態様によれば、hML
H1、hMLH2またはhMLH3核酸配列およびかか
る核酸配列によりコードされる蛋白における変異に関連
した疾病の診断方法および該疾病に対する感受性の診断
方法が提供される。本発明のさらなる態様によれば、D
NAの科学的研究、合成、およびDNAベクターの製造
に関するインビトロ目的の、かかるポリペプチドおよび
かかるポリペプチドをコードするポリヌクレオチドの使
用方法が提供される。本発明のこれらのおよび他の態様
は、本明細書の教示から当業者に明らかである。
【0013】以下の図面は本発明具体例の説明であり、
請求の範囲により包含される本発明の範囲を限定する意
味はない。図1−6は、ヒト・DNA修復蛋白hMLH
1のcDNA配列および対応する推定アミノ酸配列を示
す。アミノ酸を標準的な1文字略記法により表す。37
3自動DNAシークエンサー(アプライド・バイオシス
テムズ・インコーポレイテッド(Applied Biosystems,I
nc.)を用いて配列決定を行った。配列決定の精度は9
7%より高いと予想される。図7−14は、hMLH2
のcDNA配列および対応する推定アミノ酸配列を示
す。アミノ酸を標準的な1文字略記法により表す。図1
5−21は、hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。図22−24は、MACAW(バージ
ョン1.0)プログラムを用いて、エス・セレビシエ
(S.cerevisiae)のPMS1(yPMS1)の推定アミ
ノ酸配列と、hMLH2ならびにhMLH3アミノ酸配
列とを並べたものである。保存性のあるブロックのアミ
ノ酸は大文字で示され、それらのペア−ワイズ・スコア
(pair-wise scores)の平均上に影をつけた。図25
は、hMLH2の変異分析である。(A)HNPCC患
者のCWにおける転写停止変異に関するIVSP分析お
よびマッピング。コドン1から369までの翻訳(レー
ン1)、コドン1から290までの翻訳(レーン2)、
コドン1から214までの翻訳(レーン3)。CWは患
者CWのcDNAから翻訳され、NORは正常個体のc
DNAから翻訳される。矢じりは、潜在的な停止変異に
より切断されたポリペプチドを示す。矢印は分子量マー
カーをキロダルトンで示す。(B)CWの配列分析によ
り、コドン233におけるCのTへのトランジション変
異が示される(矢印により示す)。レーン1およびレー
ン3は対照患者由来の配列;レーン2はCWのゲノムD
NA由来の配列である。各配列混合物からのddA混合
物を隣のレーンに負荷してddC、ddD、およびdd
T混合物との比較を容易にする。図26は、hMLH3
の変異分析である。(A)患者GCからのhMLH3の
IVSP分析。レーンGCは個体GCの線維芽細胞由
来;レーンGCxは患者GCの腫瘍由来;レーンNOR
1および2は正常対照個体由来である。FLは全長の蛋
白を示し、矢じりは生殖系列の切断されたポリペプチド
を示す。矢印は分子量マーカーをキロダルトンで示す。
(B)患者GCからのDNAについてのPCR分析は、
障害が腫瘍細胞中の両方のhMLH3対立遺伝子に存在
することを示す。cDNA中の欠損領域の5'側、3'
側、またはその中間(MID)を増幅するプライマーを
用いて増幅を行った。レーン1,患者GCの線維芽細胞
由来のDNA;レーン2,患者GCの腫瘍由来のDN
A;レーン3,正常対照患者由来のDNA;レーン4,D
NA鋳型なしの反応。矢印は分子量を塩基対で示す。
【0014】本発明の1の態様によれば、図1−6、7
−14および15−21(配列番号:2、4および6)
の推定アミノ酸配列を有する成熟ポリペプチドをコード
する単離核酸(ポリヌクレオチド)、またはATCC寄
託物75649、75651、75650として寄託さ
れたクローン(1994年1月25日寄託)のcDNA
によりコードされる成熟ポリペプチドをコードする単離
核酸(ポリヌクレオチド)が提供される。 ATCC寄
託物75649は、本明細書ではhMLH1と呼ばれる
ヒト・DNA修復蛋白をコードする全長の配列を含むc
DNAクローンであり;ATCC寄託物75651は、
本明細書ではhMLH2と呼ばれるヒト・DNA修復蛋
白をコードする全長の配列を含むcDNAクローンであ
り;ATCC寄託物75650は、本明細書ではhML
H3と呼ばれるヒト・DNA修復蛋白をコードする全長
の配列を含むcDNAクローンである。
【0015】本発明のポリペプチドをコードするポリヌ
クレオチドを、心臓、肺、前立腺、脾臓、肝臓、胆嚢、
胎児の脳および精巣組織から調製された1種またはそれ
以上のライブラリーから得てもよい。hMLH1のポリ
ヌクレオチドはヒト・胆嚢cDNAライブラリーから発
見された。さらに、N末端においてhMLH1と同一で
ある6種のcDNAクローンが、ヒト・小脳、8週目の
胚、胎児心臓、HSC172細胞およびジャーケット細
胞(Jurket cell)cDNAのライブラリーから得られ
た。hMLH1遺伝子は、細菌および酵母のmutL蛋
白に対して相同性を示す85kD蛋白をコードする75
6アミノ酸の読み取り枠を含んでいる。しかしながら、
その5'非翻訳領域は、オリゴヌクレオチドを設計する
ために非翻訳領域を伸長させる目的で胎児心臓から得た
cDNAクローンから得られた。
【0016】hMLH2遺伝子はヒト・T細胞リンパ種
cDNAライブラリー由来であった。hMLH2のcD
NAクローンは、イン−フレーム(in-frame)停止コド
ンが両側に隣接している2796塩基対の読み取り枠を
含むことが同定された。それは酵母のPMS1ファミリ
ーに構造的に関連している。それは934アミノ酸残基
からなる蛋白をコードする読み取り枠を含んでいる。該
蛋白は、蛋白全体に関して、酵母・PMS1と27%の
同一性および82%の類似性という最高度の相同性を示
す。3種のPMS関連蛋白の中で有意な相同性のある第
2の領域はカルボキシル末端であり、コドン800〜9
00にある。この領域は、酵母・PMS1蛋白hMLH
2ならびにhMLH3蛋白との間において、それぞれ、
22%および47%の相同性を有するが、これらの蛋白
と他の酵母・mutL相同体であるyMLH1との間に
おいてはごくわずかな相同性しか観察されなかった。
【0017】hMLH3遺伝子はヒト・子宮内膜腫瘍c
DNAライブラリー由来であった。hNLH3クローン
は2586塩基対の読み取り枠を有すると同定された。
それは酵母のPMS2ファミリーに構造的に関連してい
る。それは862アミノ酸残基からなる蛋白をコードす
る読み取り枠を含んでいる。該蛋白は、蛋白全体に関し
て、酵母・PMS2と32%の同一性および66%の類
似性という最高度の相同性を示す。イー・コリ由来のm
utL相同体において保存されているGFRGEALド
メインが、hMLH1、hMLH2およびhMLH3の
アミノ酸配列において保存されていることは、hMLH
1、hMLH2およびhMLH3の推定上の同定に関し
て重要である。
【0018】本発明ポリヌクレオチドはRNA形態また
はDNA形態であってよく、該DNAはcDNA、ゲノ
ムDNAおよび合成DNAを包含する。DNAは2本鎖
または1本鎖であってよく、1本鎖がコーディング鎖で
あっても非コーディング鎖であってもよい。成熟ポリペ
プチドをコードするコーディング配列は図1−6、7−
14および15−21(配列番号:1)に示すコーディ
ング配列または寄託されたクローンのコーディング配列
と同じであってもよく、あるいは遺伝コードの余剰もし
くは縮重の結果として、コーディング配列が、図1−
6、7−14および15−21(配列番号:2、4およ
び6)のDNAまたは寄託されたcDNAと同じ成熟ポ
リペプチドをコードしている別のコーディング配列であ
ってもよい。図1−6、7−14および15−21(配
列番号:2、4および6)の成熟ポリペプチドまたは寄
託されたcDNAによりコードされる成熟ポリペプチド
をコードするポリヌクレオチドは、成熟ポリペプチドに
関するコーディング配列のみ;成熟ポリペプチドに関す
るコーディング配列(ならびに所望によりさらなるコー
ディング配列も)およびイントロンもしくは成熟ポリペ
プチドに関する配列の5'および/または3'側の非コー
ディング配列のごとき非コーディング配列を包含する。
よって、用語「ポリペプチドをコードするポリヌクレオ
チド」は、ポリペプチド、並びにさらなるコーディング
配列および/または非コーディング配列を含むポリヌク
レオチドを包含する。
【0019】さらに本発明は、図1−6、7−14およ
び15−21(配列番号:2、4および6)の推定アミ
ノ酸配列を有するポリペプチドまたは寄託されたクロー
ンのcDNAによりコードされるポリペプチドのフラグ
メント、アナログおよび誘導体をコードする上記ポリヌ
クレオチドの変異体に関する。ポリヌクレオチドの変異
体は天然に存在するポリヌクレオチド対立遺伝子変異体
または天然に存在しないポリヌクレオチドの変異体であ
ってよい。よって、本発明は、図1−6、7−14およ
び15−21(配列番号:2、4および6)に示すもの
と同じ成熟ポリペプチドをコードするポリヌクレオチド
または寄託されたクローンのcDNAによりコードされ
るのと同じ成熟ポリペプチドをコードするポリヌクレオ
チド、並びに図1−6、7−14および15−21(配
列番号:2、4および6)に示すものと同じ成熟ポリペ
プチドまたは寄託されたクローンのcDNAによりコー
ドされるのと同じ成熟ポリペプチドのフラグメント、誘
導体またはアナログをコードするかかるポリヌクレオチ
ドの変異体を包含する。かかるヌクレオチド変異体は、
欠失変異体、置換変異体および付加もしくは挿入変異体
を包含する。上記のごとく、ポリヌクレオチドは、図1
−6、7−14および15−21(配列番号:1、3お
よび5)に示すコーディング配列または寄託されたクロ
ーンのコーディング配列の天然に存在する対立遺伝子変
異体であるコーディング配列を有していてもよい。当該
分野において知られているように、対立遺伝子変異種
は、1個またはそれ以上のヌクレオチドの置換、欠失ま
たは付加を有していてもよいポリヌクレオチド配列のも
う1つの形態であり、コードされるポリペプチドの機能
を実質的に変化させない。
【0020】さらに本発明ポリヌクレオチドは、本発明
ポリペプチドの精製を可能にするマーカー配列にイン−
フレーム(in-frame)で融合したコーディング配列を有
していてもよい。マーカー配列は、例えば、細菌宿主の
場合にマーカーに融合した成熟ポリペプチドの精製を行
うためのpQE−9ベクターにより提供されるヘキサ−
ヒスチジンタグ(hexa-histidine tag)であってもよ
く、あるいは、例えば、哺乳動物宿主、例えばCOS−
7細胞を用いる場合には、マーカー配列がヘマグチニン
(HA)タグであってもよい。HAタグは、インフルエ
ンザ・ヘマグルチニン蛋白由来のエピトープに対応する
(ウィルソン,アイ(Wilson,I.)ら、セル、第37巻:
767頁(1984年))。
【0021】さらに本発明は、少なくとも50%、好ま
しくは70%の配列間同一性がある場合に、上記配列と
ハイブリダイズするポリヌクレオチドに関する。詳細に
は、本発明は、厳密な条件下で上記ポリヌクレオチドに
ハイブリダイズするポリヌクレオチドに関する。本明細
書の用語「厳密な条件」は、少なくとも95%、好まし
くは少なくとも97%の配列間同一性がある場合にのみ
ハイブリダイゼーションが起こることを意味する。好ま
しい具体例において、上記ポリヌクレオチドにハイブリ
ダイズするポリヌクレオチドは、図1−6、7−14お
よび15−21(配列番号:1、3および5)のcDN
Aまたは寄託されたcDNAによりコードされる成熟ポ
リペプチドと実質的に同じ生物学的機能または活性を保
持しているポリペプチドをコードする。
【0022】本明細書にいう寄託物とは、特許手続き上
の微生物の寄託の国際的承認に関するブダペスト条約の
下に維持されるものを意味する。これらの寄託物は当業
者の便宜のためのみに提供され、寄託物が35U.S.
C.§112の下で必要とされるという承認ではない。
寄託された材料中に含まれるポリヌクレオチドの配列、
ならびにそれによりコードされるポリペプチドのアミノ
酸配列は、参照により本明細書に記載されているものと
見なされ、本明細書の配列の記載との矛盾のイベントに
おいて支配的である。該寄託材料の製造、使用または販
売にはライセンスが必要でありうるし、かかるライセン
スをここで認める。
【0023】さらに本発明は、図1−6、7−14およ
び15−21(配列番号:2、4および6)の推定アミ
ノ酸配列を有するポリペプチド、または寄託されたcD
NAによりコードされるアミノ酸配列を有するポリペプ
チド、並びにかかるポリペプチドのフラグメント、アナ
ログおよび誘導体に関する。図1−6、7−14および
15−21(配列番号:2、4および6)のポリペプチ
ドまたは寄託cDNAによりコードされるポリペプチド
をいう場合、「フラグメント」、「誘導体」および「ア
ナログ」は、かかるポリペプチドと実質的に同じ生物学
的機能または活性を有するポリペプチドを意味する。よ
って、アナログは、プロ蛋白部分の開裂により活性化さ
れて活性成熟ポリペプチドを生じうるプロ蛋白を包含す
る。 本発明ポリペプチドは、組み換えポリペプチド、
天然ポリペプチドまたは合成ポリペプチドであってよ
く、好ましくは組み換えポリペプチドである。図1−
6、7−14および15−21(配列番号:2、4およ
び6)のポリペプチドまたは寄託cDNAによりコード
されるポリペプチドのフラグメント、誘導体またはアナ
ログは、(i)1個またはそれ以上のアミノ酸残基が保
存的もしくは非保存的アミノ酸残基(好ましくは保存性
残基)で置換されているもの(かかる置換アミノ酸残基
は遺伝コードによりコードされていてもよく、あるいは
されていなくてもよい)、あるいは(ii)1個またはそ
れ以上のアミノ酸残基が置換基を有するもの、あるいは
(iii)成熟ポリペプチドが、ポリペプチドの半減期を
延ばす化合物のごとき別の化合物(例えば、ポリエチレ
ングリコール)に融合しているもの、であってもよい。
かかるフラグメント、誘導体およびアナログは本明細書
の教示から、当業者の範囲内にあると思われる。好まし
くは、本発明のポリペプチドおよびポリヌクレオチドは
単離形態であり、好ましくは均一に精製される。
【0024】用語「単離」は、物質がその元の環境(例
えば、天然に存在する場合には天然環境)から取り出さ
れていることを意味する。例えば、生きた動物中に存在
する天然のポリヌクレオチドまたはポリペプチドは単離
されなが、天然系において同時に存在する物質のいくつ
かまたはすべてから分離された同じポリヌクレオチドま
たはポリペプチドは単離される。かかるポリヌクレオチ
ドはベクターの一部でありうるし、さらに/またはかか
るポリヌクレオチドまたはポリペプチドは組成物の一部
でありうるし、さらにかかるベクターまたは組成物がそ
の天然環境の一部分でないという点で単離されうる。
【0025】本発明はまた、本発明ポリヌクレオチドを
含むベクター、本発明ベクターで遺伝学的に操作された
宿主細胞、および組み換え法による本発明ポリペプチド
の製造に関する。例えば、クローニングベクターまたは
発現ベクターであってもよい本発明ベクターで宿主細胞
を遺伝学的に操作する。例えば、ベクターは、プラスミ
ド、ウイルス粒子、ファージ等の形態であってもよい。
プロモーターを活性化し、形質転換体を選択し、あるい
はhMLH1、hMLH2およびhMLH3遺伝子を増
幅するのに適するように修飾された慣用的な栄養培地中
で操作された宿主細胞を培養する。温度、pH等のごと
き培養条件は、発現用に選択された宿主細胞に関して以
前用いられたものであり、当業者に明らかであろう。組
み換え法によるポリペプチドの製造のために本発明ポリ
ヌクレオチドを用いてもよい。よって、例えば、ポリヌ
クレオチドが、ポリヌクレオチド発現のための種々の発
現ベクターのいずれか1つに含有されていてもよい。か
かるベクターは、染色体、非染色体および合成DNA配
列、例えば、SV40誘導体;細菌プラスミド;ファー
ジDNA;バキュロウイルス;酵母プラスミド;プラス
ミドならびにファージのDNAの組み合わせ由来のベク
ター;ワクチニア、アデノウイルス、伝染性上皮腫ウイ
ルスならびに偽狂犬病のごときウイルスDNAを包含す
る。しかしながら、宿主中で複製可能で製造可能である
限り、他のいずれのベクターであっても使用できる。種
々の方法により適当なDNA配列をベクター中に挿入す
ることができる。一般的には、当該分野において知られ
た方法によりDNA配列を適当な制限エンドヌクレアー
ゼ部位中に挿入する。かかる方法および他の方法は当業
者の範囲内であると思われる。発現ベクター中のDNA
配列は、mRNA合成を指令するための適当な発現調節
配列(プロモーター)に作動可能に結合している。かか
るプロモーターの代表例として、LTRもしくはSV4
0プロモーター、イー・コリのlacもしくはtrp、
ラムダファージPLプロモーター、および原核細胞また
は真核細胞あるいはそのウイルス中で遺伝子の発現を調
節することが知られている他のプロモーターが挙げられ
る。また、発現ベクターは、翻訳介しのためのリボゾー
ム結合部位および転写ターミネーターを含んでいる。ま
た、ベクターが、発現を増幅するための適当な配列を含
んでいてもよい。さらに、好ましくは、発現ベクター
は、形質転換宿主細胞の選択のための表現型の特徴を提
供する1個またはそれ以上の選択可能なマーカー遺伝
子、例えば、真核細胞培養についてジヒドロ葉酸レダク
ターゼまたはネオマイシン耐性遺伝子、あるいはイー・
コリにおいてはテトラサイクリンまたはアンピシリン耐
性遺伝子を含んでいる。
【0026】上記の適当なDNA配列ならびに適当なプ
ロモーターもしくは調節配列を含有するベクターを用い
て適当な宿主を形質転換して、宿主が蛋白を発現しうる
ようにする。適当な宿主の代表例としては、イー・コリ
(E.coli)、ストレプトマイセス(Streptomyces)、サ
ルモネラ・ティフィムリウム(Salmonella typhimuriu
m)のごとき細菌細胞;酵母のごとき真菌細胞;ドロソ
フィラ(Drosophila)S2ならびにスポドプテラ(Spod
optera)Sf9のごとき昆虫細胞;CHO、COSもし
くはボウズ・メラノーマ(Bowes melanoma);アデノウ
イルス;植物細胞等が挙げられる。適当な宿主の選択
は、本明細書の教示から、当業者の範囲内であると思わ
れる。より詳細には、さらに本発明は、上記で広く述べ
た1またはそれ以上の配列からなる組み換え構築物を包
含する。該構築物はプラスミドまたはウイルスベクター
のごときベクターからなり、その中へ本発明配列が順方
向または逆方向に挿入されている。この具体例の好まし
い態様において、さらに構築物は、例えば、該配列に作
動可能に結合したプロモーターを包含する調節配列から
なる。多数の適当なベクターおよびプロモーターが当業
者に知られており、市販されている。以下のベクター
を、実施例を用いて提供する。細菌のもの:pQE7
0、pQE60、pQE−9(キアジェン・インコーポ
レイテッド(Qiagen,Inc.)、pbs、pD10、phage
script、psiX174、pbluescript SK、pbsk
s、pNH8A、pNH16a、pNH18A、pNH
46A(ストラタジーン(Stratagene));ptrc9
9a、pKK223−3、pKK233−3、pDR5
40、pRIT5(ファルマシア(Pharmacia))。真
核細胞のもの:pWLNEO、pSV2CAT、pOG
44、pXT1、pSG(ストラタジーン)、pSVK
3、pBPV、pMSG、pSVL(ファルマシア)。
しかしながら、宿主中で複製可能で製造可能である限
り、他のいずれのベクターであっても使用できる。CA
T(クロラムフェニコールトランスフェラーゼ)ベクタ
ーまたは選択可能マーカーを有する他のベクターを用い
て、プロモーター領域をいずれの所望遺伝子からであっ
ても選択することができる。2つの適当なベクターはp
KK232−8およびpCM7である。特別に命名され
た細菌プロモーターは、lacI、lacZ、T3、T
7、gpt、ラムダPR、PLおよびTRPを包含す
る。真核プロモーターは、CMV即時初期、HSVチミ
ジンキナーゼ、初期ならびに後期SV40、レトロウイ
ルス由来のLTRs、およびマウス・メタロチオネイン
−Iを包含する。適当なベクターおよびプロモーターの
選択は、十分に当業者の通常のレベルである。
【0027】さらなる具体例において、本発明は、上記
構築物を含有する宿主細胞に関する。該宿主細胞は、哺
乳動物のごとき高等真核細胞であってもよく、あるいは
酵母細胞のごとき下等真核細胞でってもよく、また、宿
主細胞は細菌細胞のごとき原核細胞であってもよい。宿
主細胞中への構築物の導入を、リン酸カルシウムトラン
スフェクション、DEAE−デキストランによるトラン
スフェクション、またはエレクトロポーレーション(デ
イビス,エル(Davis,L.)、ディブナー,エム(Dibner,
M.)、バティー,アイ(Battey,I.)、ベイシック・メソ
ッズ・イン・モレキュラー・バイオロジー(Basic Meth
ods in Molecular Biology)(1986年))により行
うことができる。宿主細胞中の構築物を慣用的方法で使
用して組み換え配列によりコードされた遺伝子産物を製
造することができる。別法として、慣用的ペプチド合成
装置により、本発明ポリペプチドを合成的に製造するこ
ともできる。
【0028】適当なプロモーターの調節下において、成
熟蛋白を、哺乳動物細胞、酵母、細菌、または他の細胞
において発現させることができる。本発明DNA構築物
由来のRNAを用い、無細胞翻訳系を用いてかかる蛋白
を製造してもよい。原核および真核宿主について用いる
適当なクローニングおよび発現ベクターは、サムブルッ
ク(Sambrook)ら、モレキュラー・クローニング;ア・
ラボラトリー・マニュアル(Molecular Cloning:A Labo
ratory Manual)、第2版、コールド・スプリング・ハ
ーバー(Cold Spring Harbor)、N.Y.(1989年)
により記載されており、参照により該開示を本明細書に
記載されているものと見なす。本発明ポリペプチドをコ
ードしているDNAの高等真核生物による転写を、ベク
ター中にエンハンサー配列を挿入することにより増大さ
せる。エンハンサーはDNAのシス作用性エレメントで
あり、通常は、約10ないし300bpであり、プロモ
ーターに作用してその転写を増大させる。例は、複製開
始点の後期側の100ないし270bpのSV40エン
ハンサー、サイトメガロウイルスの初期プロモーターエ
ンハンサー、複製開始点の後期側のポリオーマエンハン
サー、およびアデノウイルスエンハンサーを包含する。
一般的には、組み換え発現ベクターは、複製開始点およ
び宿主細胞の形質転換を可能にするイー・コリのアンピ
シリン耐性遺伝子ならびにエス・セレビシエのTRP1
遺伝子のごとき選択可能マーカー、および下流の構造配
列の転写を指令する高発現遺伝子由来のプロモーターを
含んでいる。かかるプロモーターは、3−ホスホグリセ
レートキナーゼ(PGK)、α−因子、酸ホスファター
ゼ、または特に熱ショック蛋白をコードするオペロン由
来であってもよい。異種構造配列を、翻訳開始ならびに
ターミネーション配列とともに適当なフェーズ(phas
e)中に集める。所望により、異種配列が、例えば、発
現組み換え産物の安定化または精製簡単化のごとき所望
の特徴を付与するN末端同定ペプチドを含んでいる融合
蛋白をコードしていてもよい。
【0029】所望蛋白をコードする構造DNA配列を適
当な翻訳開始ならびにターミネーションシグナルととも
に、機能的プロモーターを伴った作動可能なリーディン
グフェーズ(reading phase)中に挿入することによ
り、細菌での使用に有用な発現ベクターを構築する。ベ
クターは、1個またはそれ以上の表現型の選択可能マー
カーおよびベクターの維持を確実なものにし、所望であ
れば宿主中での増幅を可能にする複製開始点からなるで
あろう。形質転換に適する原核宿主は、イー・コリ、バ
チルス・ズブチリス(Bacillus subtilis)、サルモネ
ラ・ティフィムリウムおよびシュードモナス(Pseudomo
nas)属、ストレプトマイセス属、およびスタフィロコ
ッカス(Staphylococcus)属の種々の種を包含するが、
他のものも選択の対象でありうる。代表的であるが限定
的でない例において、細菌での使用に有用なベクター
は、選択可能マーカーおよびよく知られたクローニング
ベクターpBR322(ATCC37017)の遺伝エ
レメントよりなる市販プラスミド由来の細菌の複製開始
点からなる。かかる市販ベクターは、例えば、pKK2
23−3(スゥエーデン、ウプサラ(Uppsala)のファ
ルマシア・ファイン・ケミカルズ(Pharmacia Fine Che
micals))およびGEM1(アメリカ合衆国、ウィスコ
ンシン州、マジソン(Madison)のプロメガ・バイオテ
ク(Promega Biotech))を包含する。これらのpBR
322「骨格」部分を適当なプロモーターおよび発現す
べき構造配列と結合する。適当な宿主株の形質転換、次
いで、適当な細胞密度に至る宿主株の増殖後、適当な手
段(例えば、温度シフトまたは化学的誘導)により選択
プロモーターを誘導し、適当時間細胞を培養する。典型
的には、細胞を遠心分離により収穫し、物理的または化
学的手段により破壊し、次いで、得られた粗抽出物をさ
らなる精製のために取っておく。凍結−融解の繰り返
し、超音波処理、機械的破壊、または細胞溶解剤の使用
を包含するいずれの慣用的な方法によっても蛋白発現に
用いる微生物細胞を破壊することができ、かかる方法は
当業者によく知られている。
【0030】種々の哺乳動物細胞培養系を用いて組み換
え蛋白を発現させることもできる。哺乳動物発現系の例
は、グルツマン(Gluzman)、セル、第23巻:175
頁(1981年)により記載されたサル・腎臓線維芽細
胞のCOS−7細胞系、およびC適合ベクターを発現さ
せる能力のある他の細胞系、例えば、C127、3T
3、CHO、HeLaおよびBHK細胞系を包含する。
哺乳動物発現ベクターは、複製開始点、適当なプロモー
ターならびにエンハンサー、および必要とされるいずれ
かのリボゾーム結合部位、ポリアデニレーション部位、
スプライスドナーならびにアクセプター部位、転写ター
ミネーション配列、および5'フランキング非転写配列
からなるであろう。SV40スプライス由来のDNA配
列、およびポリアデニレーション部位を用いて必要な非
転写遺伝エレメントを提供してもよい。
【0031】硫酸アンモニウムまたはエタノール沈殿、
酸抽出、アニオンもしくはカチオン交換クロマトグラフ
ィー、ホスホセルロースクロマトグラフィー、疎水性相
互作用クロマトグラフィー、アフィニティークロマトグ
ラフィー、ヒドロキシアパタイトクロマトグラフィーお
よびレクチンクロマトグラフィーを包含する方法によ
り、組み換え細胞培養物からポリペプチドを回収し精製
することができる。成熟蛋白の配置の完成において必要
に応じて蛋白再生工程を用いることができる。最後に、
最終精製工程として高品質液体クロマトグラフィー(H
PLC)を用いることができる。本発明ポリペプチドは
当然に精製された生成物であってもよく、あるいは化学
合成法の生成物であってもよく、あるいは原核もしくは
真核宿主から組み換え法により製造されてもよい(例え
ば、培養された細菌、酵母、高等植物、昆虫および哺乳
動物細胞)。組み換え製造法に用いる宿主に応じて、本
発明ポリペプチドはグリコシレーションされていてもよ
く、あるいはされていなくてもよい。
【0032】本発明のさらなる態様において、ガン、詳
細には、遺伝性のガンに対する感受性の決定方法が提供
される。よって、ヒト・mutLの相同体であるヒト・
修復蛋白、さらに詳細には本明細書に記載のヒト・修復
蛋白における変異はガンに他する感受性を示すものであ
り、かかるヒト・相同体をコードする核酸配列をかかる
感受性の確認のためのアッセイに用いてもよい。よっ
て、例えば、該アッセイを用いて本明細書記載のヒト・
DNA修復蛋白における欠失、切断、挿入、フレームシ
フト等のごとき変異を決定してもよく、かかる変異はガ
ン素因の指示となるものである。例えば、DNA配列決
定アッセイにより変異を確認してもよい。血液試料(こ
れに限定しない)を包含する組織試料をヒト・患者から
得る。試料を当該分野のいて知られた方法により処理し
てRNAを得る。mRNA上に存在するポリアデノシン
伸長部分にハイブリダイズするポリチミジン残基からな
るオリゴヌクレオチドプライマーを添加することにより
第1鎖cDNAをRNA試料から合成する。逆転写酵素
およびデオキシヌクレオチドを添加して第1鎖DNAの
合成を行う。本発明DNA修復蛋白のDNA配列に基づ
いてプライマー配列を合成する。一般的には、プライマ
ー配列は15ないし30個、好ましくは18ないし25
個のヒト・DNA修復遺伝子の連続した塩基からなる。
表1は、hMLH1に基づくオリゴヌクレオチドプライ
マー配列の実例を示す。該プライマーをペアー(1の
「センス」鎖および1の「アンチセンス鎖」)にして用
いてPCR法(サイキ(Saiki)ら、ネイチャー、第3
24巻:163〜166頁(1986年))により患者
からのcDNAを増幅して、かかる蛋白に対する患者の
cDNAの3種の重複フラグメントを得る。また表1は
好ましいプライマー配列ペアーのリストを示す。次い
で、遺伝子全体のうちの約200塩基対の各ポイントに
おけるcDNAの塩基対に対応するように合成されたプ
ライマー配列のセットを用いて、重複フラグメントをジ
デオキシ法に供する。
【0033】
【表1】 *図1−6のヌクレオチド配列に沿った位置に対応する
数であり、ATGは1である。
【0034】好ましいプライマー配列ペアーは: 758、1313 1319、1320 660、1909 725、1995 1680、2536 1727、2610 表1に示すヌクレオチド配列は、それぞれ配列番号:7
から配列番号:19までのものを表す。
【0035】表2は、使用できるオリゴヌクレオチドプ
ライマー配列の代表例(センスおよびアンチセンス)を
掲載するものであり、好ましくは、プライマー配列の全
セットを配列決定に用いて、患者のDNA修復蛋白にお
ける変異がどの部分に存在するかを決定する。プライマ
ー配列は15ないし30塩基の長さであり、好ましくは
18ないし25塩基の間の長さである。次いで、患者か
ら決定された配列の情報を変異していない配列と比較し
て変異が存在するかどうかを決定する。
【0036】
【表2】 *図1−6のヌクレオチド配列に沿った位置に対応する
数であり、ATGは1である。表2に示すヌクレオチド
配列は、それぞれ配列番号:20から配列番号:33ま
でのものを表す。
【0037】もう1つの具体例において、表2のプライ
マー配列をPCR法に用いて変異領域を増幅することが
できた。該領域を配列決定し、かかる変異遺伝子素因を
予想するための診断として用いることができた。別法と
して、変性剤の存在下または不存在下におけるゲル中の
DNAフラグメントの電気泳動度の変化を検出すること
により行われるDNA配列の相違に基づく遺伝学的試験
により、本発明遺伝子における変異に対するアッセイを
行ってもよい。高分解能ゲル電気泳動により、小規模の
配列欠失および挿入を可視化することができる。特異的
融点または部分的融点によってゲル中の異なる位置で異
なるDNAフラグメントの移動が妨害される変性ホルム
アミドグラジエントゲルにより、異なる配列のDNAフ
ラグメントを識別してもよい(例えば、メイヤーズ(Me
yers)ら、サイエンス、第230巻:1242頁(19
85年)参照)。RNaseおよびS1プロテクション
のごときヌクレアーゼプロテクションアッセイまたは化
学的開裂法(例えば、コットン(Cotton)ら、PNA
S,USA、第85巻:4397〜4401頁(198
5年))により、特定の位置における配列の変化を明ら
かにしてもよい。RNase消化または融点の相違によ
り、完全にマッチした配列をミスマッチの2本鎖から識
別することができる。よって、ハイブリダイゼーショ
ン、RNaseプロテクション、化学的開裂、ウェスタ
ンブロット分析、直接的DNA配列決定または制限酵素
の使用(例えば、制限フラグメント長多型性(RFL
P))およびゲノムDNAのサザンブロッティングのご
とき方法によって、特定のDNA配列の検出を行うこと
ができる。より慣用的なゲル電気泳動および配列決定の
ほかに、インシトゥ(in situ)分析により変異を検出
することもできる。
【0038】ポリペプチドを用い、かかるポリペプチド
のインビボ(in vivo)発現により癌を治療し、あるい
は癌を予防してもよく、これを、しばしば、「遺伝子治
療」という。よって、例えば、患者からの細胞をエクス
ビボ(ex vivo)でポリペプチドをコードするポリヌク
レオチド(DNAまたはRNA)を用いて操作し、次い
で、該ポリペプチドで治療すべき患者に該操作された細
胞を提供する。例えば、本発明ポリペプチドをコードす
るRNAを含むレトロウイルス粒子を用いることによ
り、当該分野において知られた方法により細胞を操作し
てもよい。同様に、例えば、当該分野において知られた
方法により、インビボでのポリペプチド発現よってに細
胞をインビボで操作してもよい。当該分野において知ら
れているように、本発明ポリペプチドをコードするRN
Aを含むレトロウイルス粒子の生産用プロデューサー細
胞を、インビボでの細胞の操作およびインビボでのポリ
ペプチドの発現のために患者に投与してもよい。かかる
方法による本発明ポリペプチド投与のためのこれらの方
法および他の方法は、本発明の教示から当業者に明らか
であるはずである。例えば、細胞の操作用の発現ビヒク
ルはレトロウイルス以外のものであってもよく、例え
ば、適当な送達ビヒクルと組み合わせた後でインビボで
の細胞の操作に用いられるアデノウイルスであってもよ
い。
【0039】本明細書において同定された各cDNA配
列またはその一部分を、ポリヌクレオチド試薬として、
多様な方法で使用することができる。該配列を特定の細
胞タイプにおける特定のmRNAの存在に関する診断プ
ローブとして該配列を用いることができる。さらに、遺
伝学的連関分析(多形性)における使用に適した診断プ
ローブとしてこれらの配列を用いることができる。ま
た、本発明配列は染色体の同定に価値がある。該配列は
特異的に標的化され、個々のヒト・染色体の特定の位置
にハイブリダイズしうる。そのうえ、染色体上の特定部
位を同定する必要が現在ある。実際の配列データ(繰り
返し多型性)に基づくわずかの染色体マーキング試薬が
染色体位置のマーキングに用いられている。本発明の染
色体に対するDNAのマッピングは、それらの配列を疾
病に関連した遺伝子と関連づけることにおける重要な第
1工程である。簡単に説明すると、cDNAからPCR
プライマー(好ましくは、15〜25bp)を調製する
ことにより、配列を染色体に対してマッピングすること
ができる。3'非翻訳領域のコンピューター分析を用い
て、ゲノムDNA中の1個より多いエキソンをまたがな
いプライマーを迅速に選択し、かくして、増幅プロセス
を複雑になる。次いで、これらのプライマーを、個々の
ヒト・染色体を含む体細胞ハイブリッドのPCRスクリ
ーニングに用いる。プライマーに対応するヒト・遺伝子
を含むハイブリッドのみが増幅フラグメントを生じるで
あろう。
【0040】体細胞ハイブリッドのPCRマッピング
は、特定の染色体に対して特定のDNAを帰属するため
の迅速方法である。同じオリゴヌクレオチドプライマ−
について本発明を用いて、特定の染色体または大規模な
ゲノムクローンのプールからのフラグメントのパネルに
ついて、同様の方法で、下位の位置決めを行うことがで
きる。同様に用いてその染色体に対してマッピングでき
る他のマッピング法は、インシトゥ・ハイブリダイゼー
ション、標識フロー−ソーティッド染色体(labeled fl
ow-sorted chromosomes)でのプレスクリーニングおよ
び染色体特異的cDNAライブラリー構築のためのハイ
ブリダイゼーションによるプレセレクションを包含す
る。中期染色体スプレッド(spread)に対するcDNA
クローンの蛍光インシトゥハイブリダイゼーション(F
ISH)を用いて1工程で正確な染色体上の位置がわか
る。この方法は500また600塩基程度の短いcDN
Aについて用いることができる。しかしながら、それよ
りも長いクローンは、ユニークな染色体上の位置に結合
して簡単な検出のための十分なシグナルを発する可能性
がある。FISHは、発現配列tagまたはESTが由
来するクローンの使用を必要とし、クローンが長いほど
よい。例えば、2000bpがよく、4000bpがよ
りよいが、4000bpよりも長いものは、合理的なパ
ーセンテージで良好な結果を得るにはおそらく必要ない
であろう。この方法のレビューのためには、バーマ(Ve
rma)ら、ヒューマン・クロモゾームズ:ア・マニュア
ル・オブ・ベイシック・テクニックス(Human Chromoso
mes:a Manual of Basic Techniques)、パーガモン・プ
レス(Pergamon Press)、ニューヨーク(1988年)
参照。正確な染色体上の位置に配列をマッピングしたな
らば、染色体上の配列の物理的位置を遺伝学的マップの
データを用いて修正することができる。かかるデータ
は、例えば、ブイ・マクシック(V.McKusick)、メンデ
リアン・インヘリタンス・イン・マン(Mendelian Inhe
ritance in Man)(ジョーンズ・ホプキンス(Jones Ho
pkins)大学のウェルチ・メディカルライブラリー(Wel
ch Medical Library)からオンラインで利用できる)に
おいて見いだされる。次いで、同じ染色体領域にマッピ
ングされた遺伝子と疾病との間の関係を、連関分析(物
理的に隣接した遺伝子の同時遺伝)により確認する。次
いで、罹患した個体と罹患していない個体との間のcD
NAまたはゲノム配列の相違を決定することが必要であ
る。変異が罹患した個体のいくつかまたはすべてにおい
て観察され、正常個体には観察されない場合には、該変
異は該疾病の原因である可能性がある。現在の物理的マ
ッピングの分解能および遺伝学的マッピング方法では、
疾病に関連した1の染色体領域に正確に位置するcDN
Aは50ないし500個の原因遺伝子のうちの1個であ
る可能性がある(このことは、1メガベースのマッピン
グ分解能であり、20kbあたり1個の遺伝子であると
仮定してのことである)。
【0041】hMLH2遺伝子の5'領域を含むゲノム
P1クローン(1670)を用いてhMLH2の局在化
が示された。バンディング(banding)を明らかにする
ために対比染色されたヒト・中期染色体スプレッドの詳
細な分析により、hMLH2遺伝子がバンド2p32中
に存在することが示された。同様に、hMLH3遺伝子
の3'領域を含むゲノムP1クローン(2053)を用
いてhMLH3の存在位置が決定された。バンディング
(banding)を明らかにするために対比染色されたヒト
・中期染色体スプレッドの詳細な分析により、hMLH
3が染色体7上の最も遠方のバンドであるバンド7p2
2中に位置することが示された。種々のゲノムクローン
に関する分析により、hMLH3は、そのすべてが染色
体7上にある関連遺伝子のサブファミリーのメンバーで
あることが示された。
【0042】ポリペプチド、それらのフラグメントもし
くは誘導体、またはそれらのアナログ、あるいはそれら
を発現する細胞を免疫原として用いてそれらに対する抗
体を得ることができる。これらの抗体は、例えば、ポリ
クローナルまたはモノクローナルでありうる。また、本
発明は、キメラ、1本鎖、およびヒト化抗体、並びにF
abフラグメント、またはFab発現ライブラリーの生
成物を包含する。当該分野において知られた種々の方法
を、かかる抗体およびフラグメントの製造に使用しても
よい。ポリペプチドを動物に直接注射すること、または
ポリペプチドを動物に、好ましくはヒトに投与すること
により、本発明配列に対応するポリペプチドに対して生
成された抗体を得ることができる。次いで、そのように
して得られた抗体はポリペプチド自体に結合するであろ
う。この方式で、ポリペプチドの一部分のみをコードす
る配列を用いてネイティブなポリペプチド全体に結合す
る抗体を得ることができる。次いで、かかる抗体を用い
て、そのポリペプチドを発現する組織からそのポリペプ
チドを単離することができる。モノクローナル抗体の製
造に関して、連続細胞系培養により製造される抗体を提
供するいかなる方法を用いてもよい。例は、ハイブリド
ーマ法(コーラー(Kohler)およびミルステイン(Mils
tein)、1975年、ネイチャー、第256巻:495
〜497頁)、トリオーマ法、ヒト・B細胞ハイブリド
ーマ法(コズボール(Kozbor)ら、1983年、イミュ
ノロジー・トゥデイ(Immunology Today)、第4巻:7
2頁)、およびヒト・モノクローナル抗体を製造するた
めのEBV−ハイブリドーマ法(コール(Cole)ら、1
985年、モノクローナル・アンチボディーズ・アンド
・キャンサー・セラピー(Monoclonal Antibodies and
Cancer Therapy)、アラン・アール・リス・インコーポ
レイテッド(Alan R.Liss,Inc.)、77〜96頁)を包
含する。1本鎖抗体の製造に関して記載された方法(米
国特許第4,946,778号)を適用して本発明免疫原
性ポリペプチド生成物に対する1本鎖抗体を製造するこ
とができる。さらに、トランスジェニックマウスを用い
て本発明免疫原性ポリペプチド生成物に対するヒト化抗
体を発現させてもよい。
【0043】さらに本発明は、以下の実施例に関して記
載されるであろう。しかしながら、本発明はかかる実施
例に限定されないことが理解されるべきである。特記し
ないかぎり、すべての部または量は重量である。以下の
実施例の理解を容易にするために、しばしば出てくる方
法および/または用語について説明する。「プラスミ
ド」は、大文字および/または数字が先行および/また
は後に続く小文字pで示される。本発明の出発プラスミ
ドは市販の、制限されずに公的に入手可能な、または公
表された方法により市販プラスミドから構築可能なもの
であってもよい。さらに、記載されたプラスミドと等価
なプラスミドが当該分野において知られており、当業者
に明らかである。DNAの「消化」は、DNA中の特定
の配列においてのみ作用する制限酵素でのDNAの触媒
的開裂をいう。本発明において用いられる種々の制限酵
素は市販されており、それらの反応条件、コファクター
および他の必要物質は当業者に知られている。分析目的
ならば、典型的には、約20μlの緩衝液中で、1μg
のプラスミドまたはDNAフラグメントを約2ユニット
の酵素とともに使用する。プラスミド構築用のDNAフ
ラクションの単離を目的とするならば、典型的には、よ
り大きな体積中で、5ないし50μgのDNAを20な
いし250ユニットの酵素で消化する。特定の制限酵素
に関する適当なバッファーおよび基質量は製造者により
特定されている。37℃において約1時間のインキュベ
ーション時間が通常用いられるが、提供者の指示に従っ
て変更してもよい。消化後、反応物をポリアクリルアミ
ドゲルで直接電気泳動して所望フラグメントを単離す
る。ゲデル,ディー(Goeddel,D.)ら、ヌクレイック・
アシッズ・リサーチ、第8巻:4057頁(1980
年)により記載された8パーセントポリアクリルアミド
ゲルを用いて開裂フラグメントのサイズ分離を行う。
【0044】「オリゴヌクレオチド」は、化学合成され
てもよい1本鎖ポリデオキシヌクレオチドまたは2本の
相補的ポリデオキシヌクレオチド鎖のいずれかをいう。
かかる合成オリゴヌクレオチドは5'リン酸を有してお
らず、よって、キナーゼ存在下でATP用いてリン酸を
付加しなければ別のオリゴヌクレオチドに結合しないで
あろう。合成オリゴヌクレオチドは、デホスホリレーシ
ョンされたフラグメントに結合するであろう。「結合」
は、2種の2本鎖核酸フラグメント間にホスホジエステ
ル結合を形成するプロセスをいう(ティー・マニアティ
スら、上記文献、146頁)。特記しない限り、10ユ
ニットのT4DNAリガーゼ(「リガーゼ」)を0.5
μgのほぼ等モル量のDNAフラグメントに対して用
い、既知バッファーおよび条件下でライゲーションを行
ってもよい。特記しない限り、グラハム,エフ(Graham,
F.)およびファン・デル・エブ,エイ(Van der Eb,
A.)、ウイロロジー(Virology)、第52巻:456〜
457頁(1973年)の方法に記載のごとく形質転換
を行う。
【0045】
【実施例】実施例1 hMLH1の細菌での発現 まず、挿入フラグメントを合成するために、DNAの
5'および3'末端に対応するPCRオリゴヌクレオチド
プライマーを用いてヒト・DNAミスマッチ修復蛋白h
MLH1をコードする全長のDNA配列ATCC#75
649を増幅する。5'オリゴヌクレオチドプライマー
は配列CGGGATCCAT GTCGTTCGTG GCAGGG (配列番
号:34)を有し、開始コドンに続くhMLH1コーデ
ィグ配列の18個のヌクレオチドが続いているBamH
I制限酵素部位を含んでいる。3'配列GCTCTAGATT AACA
CCTCTC AAAGAC (配列番号:35)は、XbaI
部位に対する相補的配列を含み、該遺伝子の末端であ
る。制限酵素部位は細菌発現ベクターpQE−9(キア
ジェン・インコーポレイテッド(Quiagen,Inc.)、カリ
フォルニア州チャツワース(Chatsworth))上の制限酵
素部位に対応している。該プラスミドベクターは抗生物
質耐性(Amp)、細菌の複製開始点(ori)、I
PTG調節可能プロモーター/オペレーター(P/
O)、リボゾーム結合部位(RBS)、6−ヒスチジン
タグ(6−His)および制限酵素クローニング部位を
コードしている。pQE−9ベクターをBamHIおよ
びXbaIで消化し、次いで、細菌のRBSにおいて開
始する読み取り枠を維持しているpQE−9ベクター中
に該挿入フラグメントを結合する。次いで、結合混合物
を用いて、多コピーのプラスミドpREP4を含んでい
るイー・コリM15/rep4株(キアジェン・インコ
ーポレイテッド)を形質転換する。pREP4はlac
Iリプレッサーを発現し、さらにカナマイシン耐性(K
an )を付与する。LBプレート上での増殖能により
形質転換体を確認し、アンピシリン/カナマイシン耐性
コロニーを選択する。プラスミドDNAを単離し、制限
分析により確認する。所望の構築物を含有するクローン
を、Amp(100μg/ml)およびKan(25μ
g/ml)の両方を補足したLB培地中で一晩(O/
N)液体培養する。該一晩培養物を用いて1:100な
いし1:250の割合の大型培養に接種する。光学密度
600(O.D.600)が0.4と0.6の間になるまで
細胞を増殖させる。次いで、IPTG(イソプロピル−
β−D−チオガラクトピラノシド)を添加して最終濃度
1mMとする。
【0046】LacIリプレッサーを不活性化し、P/
Oの読みを解除して遺伝子発現を増大させることにより
IPTGは誘導を行う。細胞をさらに3ないし4時間増
殖させる。次いで、遠心分離(6000xgで20分)
により細胞を収穫する。カオトロピック剤である6Mグ
アニジン塩酸中で細胞ペレットを溶解させる。清澄化
後、6−Hisタグを有する蛋白による固い結合を可能
にする条件下(ホリウチ,イー(Horiuchi,E.)ら、ジェ
ネティック・エンジニアリング、プリンシプル・アンド
・メソッズ(Genetic Engineering,Principles and Met
hods)、第12巻:87〜98頁(1990年))での
ニッケル−キレートカラムクロマトグラフィーにより、
可溶化したhMLH1をこの溶液から精製する。いくつ
かのプロトコール(ジェニック,アール(Jaenicke,R.)お
よびルドルフ,アール(Rudolph,R.)、プロテイン・ス
トラクチャー−ア・プラクティカル・アプローチ(Prot
einStructure-A Practical Approach)、IRLプレス
(IRL Press)、ニューヨーク(1990年))により
GnHClからの蛋白の再生を行うことができる。ま
ず、段階的透析を用いてGnHClを除去する。別法と
して、Ni−キレートカラムから単離された精製蛋白を
第2のカラムに結合させることができ、直線的にGnH
Clを減少させるグラジエントを行う。カラムに結合
し、次いで、250mMイミダゾール、150mM N
aCl、25mM Tris−HCl pH7.5およ
び10%グリセロールを含有するバッファーで溶離する
間に蛋白は再生される。最後に、可溶性蛋白を、5mM
重炭酸アンモニウムを含有する貯蔵用バッファーに対し
て透析する。精製蛋白をSDS−PAGEにより分析し
た。
【0047】実施例2 hMLH1、hMLH2ならびにhMLH3の発現およ
びイー・コリmut1に対する相補の検出のための自発
的変異アッセイ pQE9hMLH1、pQE9hMLH2またはpQE
9hMLH3/GW3733形質転換体を自発的変異ア
ッセイに供した。さらにプラスミドベクターpQE9を
AB1157(k-12,argE3 hisG4,LeuB6proA2 thr-1 ar
a-1 rpsL31 supE44 tsx-33)およびGW3733に形質
転換して、それぞれ陽性および陰性対照として用いた。
約100ないし1000個のイー・コリを接種した15
個の2ml培養物を、LBアンピシリン培地中37℃に
おいてmlあたり2x10個まで増殖させた。各培養
物10μlを希釈し、アンピシリンプレートに撒いて生
細胞数を測定した。次いで、各培養物の残りの細胞をセ
イライン中に濃縮し、アルギニンを欠いた最少培地のプ
レートに撒いてArgの復帰を測定した。表3におい
て、等式(r/m)−In(m)=1.24(リー(Le
a)ら、ジャーナル・オブ・ジェネティクス(J.Genetic
s)、第49巻:264〜285頁(1949年))に
従って、分散あたりの変異株のメジアン数(r)から、培
養物あたりの平均変異数(m)を計算した。1世代あた
りの変異率をm/Nとして記録した。ここに、Nは培養
物あたりの細胞の平均数を表す。
【0048】 表3 自発的変異率 株 変異/世代 AB1157+ベクター (5.6±0.1)x10−9a GW3733+ベクター (1.1±0.2)x10−6a GW3733+phMLH1 (3.7±1.3)x10−7a GW3733+phMLH2 (3.1±0.6)x10−7b GW3733+phMLH3 (2.1±0.8)x10−7b a:3系の実験の平均 b:4系の実験の平均
【0049】機能相補の結果は、ヒト・mutLは部分
的にイー・コリのmutLミューテーター表現型を救済
することを示し、ヒト・mutLは細菌発現系において
うまく発現されるのみならず細菌中で機能することが示
された。
【0050】実施例3 hMHL1の染色体マッピング hMHL1に関するcDNAの5'末端における配列に
従ってオリゴヌクレオチドプライマーのセットを設計し
た。このプライマーのセットは94kbセグメントに及
ぶ。下記条件のセットにおいてこのプライマーのセット
をポリメラーゼ連鎖反応に使用した: 30秒、95℃ 1分、56℃ 1分、70℃ このサイクルを32回繰り返し、次いで、70℃で5分
のサイクルを1回行った。体細胞ハイブリッドパネル
(ビオス・インコーポレイテッド(Bios,Inc.)のほか
に、ヒト、マウス、およびハムスターを鋳型として用い
た。8%ポリアクリルアミドゲルまたは3.5%アガロ
ースゲルのいずれかにより反応物を分析した。染色体3
に対応するヒト・ゲノムDNA試料および体細胞ハイブ
リッド試料中において94塩基対のバンドが観察され
た。さらに、種々の他の体細胞ハイブリッドゲノムDN
Aを用いてhMLH1遺伝子の染色体3pへの局在化が
示された。
【0051】実施例4 HNPCC血族におけるhMLH1遺伝子の変異の決定
方法 HNPCC血族である人からの組織試料から得たRNA
からcDNAを得て、該cDNAをPCRの鋳型として
用いた。PCRはにはプライマー GCATCTAGAC GTTTCCTTGG C (配列番号:36) および CATCCAAGCT TCTGTTCCCG (配列番号:37) (図1−6のコドン1から394までを増幅); GGGGTGCAGC AGCACATCG (配列番号:38) および GGAGGCAGAA TGTGTGAGCG (配列番号:39) (図1−6(配列番号:2)のコドン326から729
までを増幅);さらに TCCCAAAGAA GGACTTGCT (配列番号:40)、 および AGTATAAGTC TTAAGTGCTA CC (配列番号:41) (図1−6(配列番号:2)のコドン602から756
まで、および3’非翻訳配列の128ヌクレオチドを増
幅)を用いた。すべての分析に関して用いたPCR条件
は、サン・シドランスキ,ディー(San Sidransky,D.)
ら、サイエンス、第252巻:706頁(1991年)
に記載の緩衝液中、95℃で30秒、52〜58℃で6
0〜120秒、次いで、70℃で60〜120秒を35
サイクル行うことからなっていた。SequiThermポリメラ
ーゼ(エピセンター・テクノロジーズ(Epicentre Tech
nologies))を用い、5'末端をT4ポリヌクレオチド
キナーゼで標識したプライマーを用いてPCR生成物を
配列決定した。選択されたエキソンのイントロン−エキ
ソン境界も決定し、ゲノムPCR生成物を分析して結果
を確認した。次いで、変異と思われるものを有するPC
R生成物をクローン化し、配列決定して直接配列決定の
結果を確認した。ホルトン,ティー・エイ(Holton,T.
A.)およびグラハム,エム・ダブリュ(Graham,M.W.)、
ヌクレイック・アシッズ・リサーチ、第19巻:115
6頁(1991年)に記載のごとくPCR生成物をT−
テイルドベクター(T-tailed vector)中にクローン化
し、T7ポリメラーゼ(ユナイテッド・ステイツ・バイ
オケミカル(United States Biochemical))を用いて
配列決定した。7つの血族からの罹患した個体はすべ
て、hMLH1遺伝子のコドン578から632までの
ヘテロ接合欠失を示した。これらの7つの血族のうちの
5人は共通の祖先にたどり着くことができた。製造者に
より記載されたようにして、プライマーをT4ポリヌク
レオチドキナーゼで標識して、さらにゲノムDNAのP
CR生成物を配列決定することにより、SequiThermポリ
メラーゼを用いてP1クローン(全hMLH1遺伝子を
含むヒト・ゲノムP1ライブラリー(ジェノム・システ
ムズ(Genome Systems))をサイクルシークエンシング
(cycle-sequencing)することにより、コドン578〜
632周辺のゲノム配列を決定した。コドン578〜6
32を含むエキソンを増幅するのに用いたプライマー
は、 TTTATGGTTT CTCACCTGCC (配列番号:42) および GTTATCTGCC CACCTCAGC (配列番号:43)であっ
た。PCR生成物は、該エキソンの上流の105bpの
イントロンC配列およびエキソンの117bp下流を含
んでいた。PCR生成物中の変異は該血族においては観
察されず、ゆえにRNAにおける欠失は単なるスプライ
ス部位の変異のせいではなかった。コドン578〜63
2は、上記血族における遺伝子生成物から欠失されてい
る単一エキソンを構成することがわかった。このエキソ
ンはいくつかの非常に保存的なアミノ酸を含んでいる。
【0052】第2の家族(L7)において、上記プライ
マーを用いてPCRを行ったところ、コドン727の最
初のヌクレオチド(nt)から始まる4bpの欠失が観
察された。この欠失は166ヌクレオチド下流の新たな
ストップコドンを伴うフレームシフトにより起こり、h
MLH1のカルボキシ末端の29個のアミノ酸が53個
のアミノ酸(通常は、そのうちのいくつかは3'非翻訳
領域のヌクレオチドによりコードされている)により置
換された。上記プライマーを用いるPCRの後、別の血
族(L2516)において別の変異が見られ、該変異は
コドン755と756との間の4bpの挿入からなって
いた。この挿入はフレームシフトおよび正常なターミネ
ーションコドンから102ヌクレオチド(34アミノ
酸)下流までを含むORFの拡張を引き起こした。それ
ゆえ、血族L7およびL2516両方における変異はh
MLH1のC末端を変化させると予想された。連関の研
究には血族が少なすぎたので、コードされる蛋白のサイ
ズの変化からhMLH1における可能な変異を決定し
た。hMLH1の組み合わせ転写−翻訳(coupled tran
scription-translation)に用いたプライマーは、図1
−6のコドン1から394までについてはGGATCCTAAT A
CGACTCACT ATAGGGAGAC CACCATGGCA TCTAGACGTT TCCCTTG
GC(配列番号:44)およびCATCCAAGCT TCTGTTCCCG
(配列番号:45)であり、図1−6(配列番号:
2)のコドン326から729までについてはGGATCCTA
AT ACGACTCACT ATAGGGAGAC CACCATGGGG GTGCAGCAGC ACA
TCG(配列番号:46)およびGGAGGCAGAA TGTGTGAGCG
(配列番号:47)であった。得られたPCR生成
物は、T7 RNAポリメラーゼによる転写に関するシ
グナルおよびそれらの5'末端における翻訳開始に関す
るシグナルを有していた。18の血族からの患者のリン
パ芽球細胞由来のRNAを用いて2種の生成物(それぞ
れ、コドン1からコドン394まで伸長、またはコドン
326からコドン729まで伸長)を増幅した。次い
で、PCRプライマー中に取り込まれている転写−翻訳
シグナルを用いてインビトロでPCR生成物を転写し、
翻訳した。パウエル,エス・エム(Powell,S.M.)ら、ニ
ュー・イングランド・ジャーナル・オブ・メディシン
(NewEngland Journal of Medicine)、第329巻、1
982頁(1993年)により記載されたようにして、
かつ40マイクロCiの35S標識メチオニンを用いて
行われた組み合わせ転写−翻訳反応において、PCR生
成物を鋳型として用いた。試料を同じバッファーで希釈
し、5分間煮沸し、次いで、10%から20%までのア
クリルアミドのグラジエントを有するドデシル硫酸ナト
リウム−ポリアクリルアミドゲル上の電気泳動により分
析した。ゲルを乾燥し、ラジオグラフィーに供した。す
べての試料は予想されたサイズのポリペプチドを示した
が、異常に移動するポリペプチドが1つのケースにおい
てさらに見いだされた。関連のあるPCR生成物の配列
を決定し、コドン347の最初のヌクレオチドから始ま
る371bpの欠失を有することが見いだされた。この
変化はヘテロ接合形態において存在し、コドン346の
30ヌクレオチド下流の新たな停止コドンにおけるフレ
ームシフトを生じ、かくして、観察された切断ポリペプ
チドが説明された。マイクロサテライト不安定性を示す
4種の結腸腫瘍細胞系を試験した。4種のうち1種(細
胞系H6)はこのアッセイにおいて正常ペプチドを示さ
ず、27kdのところに移動する短い生成物のみを生産
した。対応cDNAの配列を決定し、コドン252にお
けるCのAへのトランスバージョンを有することが見い
だされ、セリンに代わってターミネーションコドンが生
じていた。翻訳の分析と一致して、正常なCの位置にお
けるバンドはこの腫瘍由来のcDNAまたはゲノムDN
Aにおいて同定されず、それが機能的hMLH1遺伝子
を欠くことが示された。表4はこれらの配列決定アッセ
イの結果を示す。結腸癌の家族歴を有する人において欠
失が見いだされた。より詳細には、10家族のうち9家
族がhMLH1の変異を示した。
【0053】
【表3】
【0054】実施例5 hMLH2の細菌での発現および精製 まず、挿入フラグメントを合成するために、DNA配列
の5'および3'末端に対応するPCRオリゴヌクレオチ
ドプライマーを用いてhMLH2をコードするDNA配
列ATCC#75651を増幅する。5'オリゴヌクレ
オチドプライマーは配列 CGGGATCCAT GAAACAATTG CCTGCGGC (配列番号:4
8)を有しており、この配列は、開始コドンに続くhM
LH2の17個のヌクレオチドが続いているBamHI
制限酵素部位を含んでいる。3'配列GCTCTAGACC AGACTC
ATGC TGTTTT (配列番号:49)はXbaI部位
に対する相補的配列を含み、hMLH2の18個のヌク
レオチドが後に続いている。制限酵素部位は細菌発現ベ
クターpQE−9(キアジェン・インコーポレイテッド
(Qiagen,Inc.)、カリフォルニア州チャツワース(Cha
tworth))の制限酵素部位に対応している。pQE−9
は、抗生物質耐性(Amp)、細菌の複製開始点(o
ri)、IPTG−調節可能プロモーターオペレーター
(P/O)、リボゾーム結合部位(RBS)、6−Hi
sタグおよび制限酵素部位をコードしている。次いで、
増幅された配列およびpQE−9をBamHIおよびX
baIで消化する。増幅された配列をpQE−9中に結
合し、ヒスチジンタグおよびRBSをコードしている配
列を伴うフレーム中に挿入する。次いで、結合混合物を
用いて、多コピーのプラスミドpREP4を含んでいる
イー・コリM15/rep4株(キアジェン・インコー
ポレイテッド)を形質転換する。pREP4はlacI
リプレッサーを発現し、さらにカナマイシン耐性(Ka
)を付与する。LBプレート上での増殖能により形
質転換体を確認し、アンピシリン/カナマイシン耐性コ
ロニーを選択する。プラスミドDNAを単離し、制限分
析により確認する。所望の構築物を含有するクローン
を、Amp(100μg/ml)およびKan(25μ
g/ml)の両方を補足したLB培地中で一晩(O/
N)液体培養する。該一晩培養物を用いて1:100な
いし1:250の割合の大型培養に接種する。光学密度
600(O.D.600)が0.4と0.6の間になるまで
細胞を増殖させる。次いで、IPTG(イソプロピル−
β−D−チオガラクトピラノシド)を添加して最終濃度
1mMとする。
【0055】LacIリプレッサーを不活性化し、P/
Oの読みを解除して遺伝子発現を増大させることにより
IPTGは誘導を行う。細胞をさらに3ないし4時間増
殖させる。次いで、遠心分離(6000xgで20分)
により細胞を収穫する。カオトロピック剤である6Mグ
アニジン塩酸中で細胞ペレットを溶解させる。清澄化
後、6−Hisタグを有する蛋白による固い結合を可能
にする条件下(ホリウチ,イー(Horiuchi,E.)ら、ジェ
ネティック・エンジニアリング、プリンシプル・アンド
・メソッズ(Genetic Engineering,Principles and Met
hods)、第12巻:87〜98頁(1990年))での
ニッケル−キレートカラムクロマトグラフィーにより、
可溶化したhMLH1をこの溶液から精製する。いくつ
かのプロトコール(ジェニック,アール(Jaenicke,R.)お
よびルドルフ,アール(Rudolph,R.)、プロテイン・ス
トラクチャー−ア・プラクティカル・アプローチ(Prot
einStructure-A Practical Approach)、IRLプレス
(IRL Press)、ニューヨーク(1990年))により
GnHClからの蛋白の再生を行うことができる。ま
ず、段階的透析を用いてGnHClを除去する。別法と
して、Ni−キレートカラムから単離された精製蛋白を
第2のカラムに結合させることができ、直線的にGnH
Clを減少させるグラジエントを行う。カラムに結合
し、次いで、250mMイミダゾール、150mM N
aCl、25mM Tris−HCl pH7.5およ
び10%グリセロールを含有するバッファーで溶離する
間に蛋白は再生される。最後に、可溶性蛋白を、5mM
重炭酸アンモニウムを含有する貯蔵用バッファーに対し
て透析する。精製蛋白をSDS−PAGEにより分析し
た。
【0056】実施例6 hMLH3の細菌での発現および精製 まず、挿入フラグメントを合成するためにDNA配列の
5'および3'末端に対応するPCRオリゴヌクレオチド
プライマーを用いて、hMLH3をコードするDNA配
列ATCC#75650を増幅する。5'オリゴヌクレ
オチドプライマーは配列CGGGATCCAT GGAGCGAGCT GAGAGC
(配列番号:50)を有しており、この配列は、
開始コドンに続くhMLH3の18個のヌクレオチドが
続いているBamHI制限酵素部位を含んでいる。3'
配列GCTCTAGAGT GAAGACTCTG TCT (配列番号:5
1)はXbaI部位に対する相補的配列を含み、hML
H3の18個のヌクレオチドが後に続いている。制限酵
素部位は細菌発現ベクターpQE−9(キアジェン・イ
ンコーポレイテッド(Qiagen,Inc.)、カリフォルニア
州チャツワース(Chatworth))の制限酵素部位に対応
している。pQE−9は、抗生物質耐性(Amp)、
細菌の複製開始点(ori)、IPTG−調節可能プロ
モーターオペレーター(P/O)、リボゾーム結合部位
(RBS)、6−Hisタグおよび制限酵素部位をコー
ドしている。次いで、増幅された配列およびpQE−9
をBamHIおよびXbaIで消化する。増幅された配
列をpQE−9中に結合し、ヒスチジンタグおよびRB
Sをコードしている配列を伴うフレーム中に挿入する。
次いで、結合混合物を用いて、多コピーのプラスミドp
REP4を含んでいるイー・コリM15/rep4株
(キアジェン・インコーポレイテッド)を形質転換す
る。pREP4はlacIリプレッサーを発現し、さら
にカナマイシン耐性(Kan)を付与する。LBプレ
ート上での増殖能により形質転換体を確認し、アンピシ
リン/カナマイシン耐性コロニーを選択する。プラスミ
ドDNAを単離し、制限分析により確認する。所望の構
築物を含有するクローンを、Amp(100μg/m
l)およびKan(25μg/ml)の両方を補足した
LB培地中で一晩(O/N)液体培養する。該一晩培養
物を用いて1:100ないし1:250の割合の大型培
養に接種する。光学密度600(O.D.600)が0.
4と0.6の間になるまで細胞を増殖させる。次いで、
IPTG(イソプロピル−β−D−チオガラクトピラノ
シド)を添加して最終濃度1mMとする。
【0057】LacIリプレッサーを不活性化し、P/
Oの読みを解除して遺伝子発現を増大させることにより
IPTGは誘導を行う。細胞をさらに3ないし4時間増
殖させる。次いで、遠心分離(6000xgで20分)
により細胞を収穫する。カオトロピック剤である6Mグ
アニジン塩酸中で細胞ペレットを溶解させる。清澄化
後、6−Hisタグを有する蛋白による固い結合を可能
にする条件下(ホリウチ,イー(Horiuchi,E.)ら、ジェ
ネティック・エンジニアリング、プリンシプル・アンド
・メソッズ(Genetic Engineering,Principles and Met
hods)、第12巻:87〜98頁(1990年))での
ニッケル−キレートカラムクロマトグラフィーにより、
可溶化したhMLH1をこの溶液から精製する。いくつ
かのプロトコール(ジェニック,アール(Jaenicke,R.)お
よびルドルフ,アール(Rudolph,R.)、プロテイン・ス
トラクチャー−ア・プラクティカル・アプローチ(Prot
einStructure-A Practical Approach)、IRLプレス
(IRL Press)、ニューヨーク(1990年))により
GnHClからの蛋白の再生を行うことができる。ま
ず、段階的透析を用いてGnHClを除去する。別法と
して、Ni−キレートカラムから単離された精製蛋白を
第2のカラムに結合させることができ、直線的にGnH
Clを減少させるグラジエントを行う。カラムに結合
し、次いで、250mMイミダゾール、150mM N
aCl、25mM Tris−HCl pH7.5およ
び10%グリセロールを含有するバッファーで溶離する
間に蛋白は再生される。最後に、可溶性蛋白を、5mM
重炭酸アンモニウムを含有する貯蔵用バッファーに対し
て透析する。精製蛋白をSDS−PAGEにより分析し
た。
【0058】実施例7 遺伝性の癌におけるhMLH2およびhMLH3の変異
の決定方法 ゲノムクローンの単離 hMLH2およびhMLH3のcDNA配列に関して選
択されたプライマーを用いるPCRにより、ヒト・ゲノ
ムP1ライブラリー(ジェノミック・システムズ・イン
コーポレイテッド(Genomic Systems,Inc.))をスクリ
ーニングした。 プライマー AAGCTGCTCT GTTAAAAGCG (配列番号:52) および GCACCAGCAT CCAAGGAG (配列番号:53) を用いてhMLH2に関して2個のクローンを単離し、
133bpの生成物を得た。プライマー CAACCATGAG ACACATCGC (配列番号:54) および AGGTTAGTGA AGACTCTGTC (配列番号:55) を用いてhMLH3に関して3個のクローンを単離し、
121bpの生成物を得た。ジゴキシゲニンデオキシ−
ウリジン5'−トリホスフェート(ベーリンガー・マン
ハイム(Boehringer Manheim))を用いてゲノムクロー
ンをニックトランスレーションし、ジョンソン,シー(J
ohnson,C.)ら、メソッズ・セル・バイオロ(Methods C
ell Biol.)、第35巻:73〜99頁(1991年)
に記載のごとくFISHを行った。発現されたhMLH
3遺伝子座への特異的ハイブリダイゼーションのために
大過剰のヒト・cot−1 DNAを用いてhMLH3
プローブとのハイブリダイゼーションを行った。4,6
−ジアミノ−2−フェニルインドールおよびヨウ化プロ
ピジウムを用いて染色体を対比染色し、C−およびR−
バンドの組み合わせを得た。クールド・チャージ−カッ
プルド・デバイス・カメラ(cooled charge-coupled de
vice camera)(フォトメトリクス(Photometrics)、
アリゾナ州タクソン(Tucson))および可変励起波長フ
ィルター(ジョンソン,シー(Johnson,C.)ら、ジェネ
ティ・アナリ・テク・アプリ(Genet.Anal.Tech.App
l.)、第8巻:75頁(1991年)と組み合わせたト
リプル−バンド・フィルター・セット(Triple-band fi
lter set)(クロマ・テクノロジー(Chroma Technolog
y)、バーモント州ブラットレボロ(Brattleboro))を用
いて、正確なマッピングのために配置されたイメージを
得た。イメージの収集、分析および染色体断片長の測定
を、ISeeグラフィカル・プログラム・システム(IS
ee Graphical Program System)(イノビジョン・コー
ポレイション(InovisionCorporation)、ノースカロラ
イナ州ダラム(Durham))を用いて行った。
【0059】転写にカップリングした翻訳の変異の分析 IVSP分析の目的で、hMLH2遺伝子を3つの重複
セグメントに分けた。第1のセグメントはコドン1から
500までを含んでいたが、中間のセグメントはコドン
270から755まで、最後のセグメントはコドン48
5からコドン933における翻訳終結部位までを含んで
いた。第1のセグメントに関するプライマーは、GGATCC
TAAT ACGACTCACT ATAGGGAGAC CACCATGGAA CAATTGCCTG C
GG(配列番号:56)およびCCTGCTCCAC TCATCTGC
(配列番号:57)であり、中間のセグメントに関し
ては、GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGAA
GATATCTTAA AGTTAATCCG(配列番号:58)およびGGCTT
CTTCT ACTCTATATG G (配列番号:59)であり、
最後のセグメントに関しては、GGATCCTAAT ACGACTCACT
ATAGGGAGAC CACCATGGCA GGTCTTGAAA ACTCTTCG(配列番
号:60)およびAAAACAAGTC AGTGAATCCT C (配
列番号:61)であった。患者CWにおける停止変異を
マッピングするために用いたプライマーは、すべて第1
のセグメントと同じ5'プライマーであった。3'ネステ
ィッドプライマーは: AAGCACATCT GTTTCTGCTG (配列番号:62)コドン1から369 ACGAGTAGAT TCCTTTAGGC (配列番号:63)コドン1から290 CAGAACTGAC ATGAGAGCC (配列番号:64)コドン1から214 であった。
【0060】hMLH3の分析のために、hMLH3の
cDNAを全長生成物として、あるいは2つの重複セグ
メントとして増幅した。全長のhMLH3に関するプラ
イマーは、GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATG
GAG CGAGCTGAGA GC(配列番号:65)およびAGGTTAGTG
A AGACTCTGTC (配列番号:66)(コドン1から
863まで)であった。セグメント1に関しては、セン
スプライマーは上記のものと同じで、アンチセンスプラ
イマーはCTGAGGTCTC AGCAGGC (配列番号:67)
(コドン1から472まで)であった。セグメント2の
プライマーはGGATCCTAAT ACGACTCACT ATAGGGAGAC CACCA
TGGTG TCCATTTCCA GACTGCG(配列番号:68)およびAG
GTTAGTGA AGACTCTGTC (配列番号:69)(コド
ン415から863まで)であった。増幅を下記のごと
く行った。
【0061】PCR生成物は、T7 RNAポリメラー
ゼおよび5'末端における翻訳開始の認識シグナルを含
んでいた。40μCiの36S−メチオニン(NEN、
デュポン(Dupont))を含有するカップリングした転写
−翻訳反応においてPCR生成物を鋳型として用いた。
試料をSDS試料バッファーで希釈し、10%から20
%までのアクリルアミドのグラジエントを含有するSD
S−ポリアクリルアミドゲル上の電気泳動により分析し
た。ゲルを固定し、EnHance(デュポン)で処理
し、乾燥し、次いで、オートラジオグラフィーに供し
た。
【0062】RT−PCRおよびPCR生成物の直接配
列決定 Superscript II(ライフ・テクノロジーズ(Life Techn
ologies)を用いてリンパ芽球または腫瘍細胞のRNA
からcDNAを得た。次いで、cDNAをPCR用鋳型
として用いた。すべての増幅の条件は、バッファー中、
95℃で30秒、52℃ないし65℃で60秒ないし1
20秒、次いで、70℃で60秒ないし120秒で、3
5サイクルであった。PCR生成物を直接配列決定し、
T−テイルドクローニングベクターPCR2000(イ
ンビトロジェン(Invitrogen))中にクローン化し、T
7ポリメラーゼ(ユナイテッド・ステイツ・バイオケミ
カル)を用いて配列決定した。PCR生成物の直接配列
決定のために、PCR反応物をまずフェノールクロロホ
ルム抽出し、次いで、エタノール沈殿した。製造者によ
り説明されているようにSequithermポリメラーゼ(エピ
センター・テクノロジーズ)およびガンマ−32P標識
プライマーを用いて鋳型を直接配列決定した。
【0063】変異のイントロン/エキソン境界およびゲ
ノム分析 製造者により説明されているようにガンマ−32P標識
プライマーおよびSequithermポリメラーゼを用いてP1
クローンをサイクル配列決定(cycle-sequencing)する
ことによりイントロン/エキソン境界を決定した。コド
ン195から233までを含むhMLH2エキソンを増
幅するために用いたプライマーはTTATTTGGCA GAAAAGCAG
A G (配列番号:70)およびTTAAAAGACT AACCTC
TTGC C (配列番号:71)であり、215bpの
生成物が得られた。プライマーCTGCTGTTAT GAACAATATG
G (配列番号:72)を用いて生成物をサイクル
配列決定した。患者GCにおけるhMLH3のゲノム欠
失を分析するために用いたプライマーは:5'領域増幅
用には CAGAAGCAGT TGCAAAGCC (配列番号:73)と AAACCGTACT CTTCACACAC (配列番号:74) (hMLH3のコドン233から257を含む74bp
の生成物が得られる)、 GAGGAAAAGC TTTTGTTGGC (配列番号:75)と CAGTGGCTGC TGACTGAC (配列番号:76) (hMLH3のコドン347から377を含む93bp
の生成物が得られる)、さらに TCCAGAACCA AGAAGGAGC (配列番号:77)と TGAGGTCTCA GCAGGC (配列番号:78) (hMLH3のコドン439から472を含む99bp
の生成物が得られる)であった。
【0064】 表5 HNPCCに罹患した患者からのHMLH2およびHMLH3における変異のま とめ 試料 コドン ヌクレオチド ゲノム変化 予想コーディング cDNA変化 変化 HMLH2 CW 233 スキップした CAGからTAGへ GLNから停止 エキソン コドンへ HMLH3 MN、NS、 20 CGGからCAGへ CGGからCAGへ ARGからGLNへ TF GC 268から 1203bpの 欠失 イン−フレーム 669まで 欠失 欠失 GCx 268から 1203bpの 欠失 フレームシフト、 669まで 欠失 切断
【0065】上記教示を考慮すれば本発明に対する多く
の修飾および変更可能が可能であり、それゆえ、添付し
た請求の範囲に範囲内であり、本発明を特別に説明した
のとは別なように実施してもよい。
【0066】
【発明の効果】本発明によれは、3種のヒト・DNA修
復蛋白およびかかる蛋白をコードするDNA(RN
A)、さらに組み換え法によるかかる蛋白の製造方法を
が提供される。ヒト・DNA修復遺伝子の1つであるh
MLH1は染色体3に対してマッピングされ、hMLH
2は染色体2に対してマッピングされ、さらにhMLH
3は染色体7に対してマッピングされた。本発明は、h
MLH1、hMLH2およびhMLH3遺伝子における
変化を診断する方法を提供する。
【0067】
【配列表】 SEQUENCE LISTING <110> Human Genome Sciences, Inc. <120> Human DNA Mismatch Repair Proteins <130> PF106PCT <140> PCT/US95/01035 <141> 1996-01-25 <150> 08/294,312 <151> 1994-08-23 <150> 08/210,143 <151> 1994-03-16 <150> 08/187,757 <151> 1994-01-27 <160> 78 <170> PatentIn version 3.0 <210> 1 <211> 2525 <212> DNA <213> homo sapiens <220> <221> CDS <222> (42)..(2312) <400> 1 gttgaacatc tagacgtttc cttggctctt ctggcgccaa a atg tcg ttc gtg gca 56 Met Ser Phe Val Ala 1 5 ggg gtt att cgg cgg ctg gac gag aca gtg gtg aac cgc atc gcg gcg 104 Gly Val Ile Arg Arg Leu Asp Glu Thr Val Val Asn Arg Ile Ala Ala 10 15 20 ggg gaa gtt atc cag cgg cca gct aat gct atc aaa gag atg att gag 152 Gly Glu Val Ile Gln Arg Pro Ala Asn Ala Ile Lys Glu Met Ile Glu 25 30 35 aac tgt tta gat gca aaa tcc aca agt att caa gtg att gtt aaa gag 200 Asn Cys Leu Asp Ala Lys Ser Thr Ser Ile Gln Val Ile Val Lys Glu 40 45 50 gga ggc ctg aag ttg att cag atc caa gac aat ggc acc ggg atc agg 248 Gly Gly Leu Lys Leu Ile Gln Ile Gln Asp Asn Gly Thr Gly Ile Arg 55 60 65 aaa gaa gat ctg gat att gta tgt gaa agg ttc act act agt aaa ctg 296 Lys Glu Asp Leu Asp Ile Val Cys Glu Arg Phe Thr Thr Ser Lys Leu 70 75 80 85 cag tcc ttt gag gat tta gcc agt att tct acc tat ggc ttt cga ggt 344 Gln Ser Phe Glu Asp Leu Ala Ser Ile Ser Thr Tyr Gly Phe Arg Gly 90 95 100 gag gct ttg gcc agc ata agc cat gtg gct cat gtt act att aca acg 392 Glu Ala Leu Ala Ser Ile Ser His Val Ala His Val Thr Ile Thr Thr 105 110 115 aaa aca gct gat gga aag tgt gca tac aga gca agt tac tca gat gga 440 Lys Thr Ala Asp Gly Lys Cys Ala Tyr Arg Ala Ser Tyr Ser Asp Gly 120 125 130 aaa ctg aaa gcc cct cct aaa cca tgt gct ggc aat caa ggg acc cag 488 Lys Leu Lys Ala Pro Pro Lys Pro Cys Ala Gly Asn Gln Gly Thr Gln 135 140 145 atc acg gtg gag gac ctt ttt tac aac ata gcc acg agg aga aaa gct 536 Ile Thr Val Glu Asp Leu Phe Tyr Asn Ile Ala Thr Arg Arg Lys Ala 150 155 160 165 tta aaa aat cca agt gaa gaa tat ggg aaa att ttg gaa gtt gtt ggc 584 Leu Lys Asn Pro Ser Glu Glu Tyr Gly Lys Ile Leu Glu Val Val Gly 170 175 180 agg tat tca gta cac aat gca ggc att agt ttc tca gtt aaa aaa caa 632 Arg Tyr Ser Val His Asn Ala Gly Ile Ser Phe Ser Val Lys Lys Gln 185 190 195 gga gag aca gta gct gat gtt agg aca cta ccc aat gcc tca acc gtg 680 Gly Glu Thr Val Ala Asp Val Arg Thr Leu Pro Asn Ala Ser Thr Val 200 205 210 gac aat att cgc tcc gtc ttt gga aat gct gtt agt cga gaa ctg ata 728 Asp Asn Ile Arg Ser Val Phe Gly Asn Ala Val Ser Arg Glu Leu Ile 215 220 225 gaa att gga tgt gag gat aaa acc cta gcc ttc aaa atg aat ggt tac 776 Glu Ile Gly Cys Glu Asp Lys Thr Leu Ala Phe Lys Met Asn Gly Tyr 230 235 240 245 ata tcc aat gca aac tac tca gtg aag aag tgc atc ttc tta ctc ttc 824 Ile Ser Asn Ala Asn Tyr Ser Val Lys Lys Cys Ile Phe Leu Leu Phe 250 255 260 atc aac cat cgt ctg gta gaa tca act tcc ttg aga aaa gcc ata gaa 872 Ile Asn His Arg Leu Val Glu Ser Thr Ser Leu Arg Lys Ala Ile Glu 265 270 275 aca gtg tat gca gcc tat ttg ccc aaa aac aca cac cca ttc ctg tac 920 Thr Val Tyr Ala Ala Tyr Leu Pro Lys Asn Thr His Pro Phe Leu Tyr 280 285 290 ctc agt tta gaa atc agt ccc cag aat gtg gat gtt aat gtg cac ccc 968 Leu Ser Leu Glu Ile Ser Pro Gln Asn Val Asp Val Asn Val His Pro 295 300 305 aca aag cat gaa gtt cac ttc ctg cac gag gag agc atc ctg gag cgg 1016 Thr Lys His Glu Val His Phe Leu His Glu Glu Ser Ile Leu Glu Arg 310 315 320 325 gtg cag cag cac atc gag agc aag ctc ctg ggc tcc aat tcc tcc agg 1064 Val Gln Gln His Ile Glu Ser Lys Leu Leu Gly Ser Asn Ser Ser Arg 330 335 340 atg tac ttc acc cag act ttg cta cca gga ctt gct ggc ccc tct ggg 1112 Met Tyr Phe Thr Gln Thr Leu Leu Pro Gly Leu Ala Gly Pro Ser Gly 345 350 355 gag atg gtt aaa tcc aca aca agt ctg acc tcg tct tct act tct gga 1160 Glu Met Val Lys Ser Thr Thr Ser Leu Thr Ser Ser Ser Thr Ser Gly 360 365 370 agt agt gat aag gtc tat gcc cac cag atg gtt cgt aca gat tcc cgg 1208 Ser Ser Asp Lys Val Tyr Ala His Gln Met Val Arg Thr Asp Ser Arg 375 380 385 gaa cag aag ctt gat gca ttt ctg cag cct ctg agc aaa ccc ctg tcc 1256 Glu Gln Lys Leu Asp Ala Phe Leu Gln Pro Leu Ser Lys Pro Leu Ser 390 395 400 405 agt cag ccc cag gcc att gtc aca gag gat aag aca gat att tct agt 1304 Ser Gln Pro Gln Ala Ile Val Thr Glu Asp Lys Thr Asp Ile Ser Ser 410 415 420 ggc agg gct agg cag caa gat gag gag atg ctt gaa ctc cca gcc cct 1352 Gly Arg Ala Arg Gln Gln Asp Glu Glu Met Leu Glu Leu Pro Ala Pro 425 430 435 gct gaa gtg gct gcc aaa aat cag agc ttg gag ggg gat aca aca aag 1400 Ala Glu Val Ala Ala Lys Asn Gln Ser Leu Glu Gly Asp Thr Thr Lys 440 445 450 ggg act tca gaa atg tca gag aag aga gga cct act tcc agc aac ccc 1448 Gly Thr Ser Glu Met Ser Glu Lys Arg Gly Pro Thr Ser Ser Asn Pro 455 460 465 aga aag aga cat cgg gaa gat tct gat gtg gaa atg gtg gaa gat gat 1496 Arg Lys Arg His Arg Glu Asp Ser Asp Val Glu Met Val Glu Asp Asp 470 475 480 485 tcc cga aag gaa atg act gca gct tgt acc ccc cgg aga agg atc att 1544 Ser Arg Lys Glu Met Thr Ala Ala Cys Thr Pro Arg Arg Arg Ile Ile 490 495 500 aac ctc act agt gtt ttg agt ctc cag gaa gaa att aat gag cag gga 1592 Asn Leu Thr Ser Val Leu Ser Leu Gln Glu Glu Ile Asn Glu Gln Gly 505 510 515 cat gag gtt ctc cgg gag atg ttg cat aac cac tcc ttc gtg ggc tgt 1640 His Glu Val Leu Arg Glu Met Leu His Asn His Ser Phe Val Gly Cys 520 525 530 gtg aat cct cag tgg gcc ttg gca cag cat caa acc aag tta tac ctt 1688 Val Asn Pro Gln Trp Ala Leu Ala Gln His Gln Thr Lys Leu Tyr Leu 535 540 545 ctc aac acc acc aag ctt agt gaa gaa ctg ttc tac cag ata ctc att 1736 Leu Asn Thr Thr Lys Leu Ser Glu Glu Leu Phe Tyr Gln Ile Leu Ile 550 555 560 565 tat gat ttt gcc aat ttt ggt gtt ctc agg tta tcg gag cca gca ccg 1784 Tyr Asp Phe Ala Asn Phe Gly Val Leu Arg Leu Ser Glu Pro Ala Pro 570 575 580 ctc ttt gac ctt gcc atg ctt gcc tta gat agt cca gag agt ggc tgg 1832 Leu Phe Asp Leu Ala Met Leu Ala Leu Asp Ser Pro Glu Ser Gly Trp 585 590 595 aca gag gaa gat ggt ccc aaa gaa gga ctt gct gaa tac att gtt gag 1880 Thr Glu Glu Asp Gly Pro Lys Glu Gly Leu Ala Glu Tyr Ile Val Glu 600 605 610 ttt ctg aag aag aag gct gag atg ctt gca gac tat ttc tct ttg gaa 1928 Phe Leu Lys Lys Lys Ala Glu Met Leu Ala Asp Tyr Phe Ser Leu Glu 615 620 625 att gat gag gaa ggg aac ctg att gga tta ccc ctt ctg att gac aac 1976 Ile Asp Glu Glu Gly Asn Leu Ile Gly Leu Pro Leu Leu Ile Asp Asn 630 635 640 645 tat gtg ccc cct ttg gag gga ctg cct atc ttc att ctt cga cta gcc 2024 Tyr Val Pro Pro Leu Glu Gly Leu Pro Ile Phe Ile Leu Arg Leu Ala 650 655 660 act gag gtg aat tgg gac gaa gaa aag gaa tgt ttt gaa agc ctc agt 2072 Thr Glu Val Asn Trp Asp Glu Glu Lys Glu Cys Phe Glu Ser Leu Ser 665 670 675 aaa gaa tgc gct atg ttc tat tcc atc cgg aag cag tac ata tct gag 2120 Lys Glu Cys Ala Met Phe Tyr Ser Ile Arg Lys Gln Tyr Ile Ser Glu 680 685 690 gag tcg acc ctc tca ggc cag cag agt gaa gtg cct ggc tcc att cca 2168 Glu Ser Thr Leu Ser Gly Gln Gln Ser Glu Val Pro Gly Ser Ile Pro 695 700 705 aac tcc tgg aag tgg act gtg gaa cac att gtc tat aaa gcc ttg cgc 2216 Asn Ser Trp Lys Trp Thr Val Glu His Ile Val Tyr Lys Ala Leu Arg 710 715 720 725 tca cac att ctg cct cct aaa cat ttc aca gaa gat gga aat atc ctg 2264 Ser His Ile Leu Pro Pro Lys His Phe Thr Glu Asp Gly Asn Ile Leu 730 735 740 cag ctt gct aac ctg cct gat cta tac aaa gtc ttt gag agg tgt taa 2312 Gln Leu Ala Asn Leu Pro Asp Leu Tyr Lys Val Phe Glu Arg Cys 745 750 755 atatggttat ttatgcactg tgggatgtgt tcttctttct ctgtattccg atacaaagtg 2372 ttgtatcaaa gtgtgatata caaagtgtac caacataagt gttggtagca cttaagactt 2432 atacttgcct tctgatagta ttcctttata cacagtggat tgattataaa taaatagatg 2492 tgtcttaaca taaaaaaaaa aaaaaaaaaa aaa 2525 <210> 2 <211> 756 <212> PRT <213> homo sapiens <400> 2 Met Ser Phe Val Ala Gly Val Ile Arg Arg Leu Asp Glu Thr Val Val 1 5 10 15 Asn Arg Ile Ala Ala Gly Glu Val Ile Gln Arg Pro Ala Asn Ala Ile 20 25 30 Lys Glu Met Ile Glu Asn Cys Leu Asp Ala Lys Ser Thr Ser Ile Gln 35 40 45 Val Ile Val Lys Glu Gly Gly Leu Lys Leu Ile Gln Ile Gln Asp Asn 50 55 60 Gly Thr Gly Ile Arg Lys Glu Asp Leu Asp Ile Val Cys Glu Arg Phe 65 70 75 80 Thr Thr Ser Lys Leu Gln Ser Phe Glu Asp Leu Ala Ser Ile Ser Thr 85 90 95 Tyr Gly Phe Arg Gly Glu Ala Leu Ala Ser Ile Ser His Val Ala His 100 105 110 Val Thr Ile Thr Thr Lys Thr Ala Asp Gly Lys Cys Ala Tyr Arg Ala 115 120 125 Ser Tyr Ser Asp Gly Lys Leu Lys Ala Pro Pro Lys Pro Cys Ala Gly 130 135 140 Asn Gln Gly Thr Gln Ile Thr Val Glu Asp Leu Phe Tyr Asn Ile Ala 145 150 155 160 Thr Arg Arg Lys Ala Leu Lys Asn Pro Ser Glu Glu Tyr Gly Lys Ile 165 170 175 Leu Glu Val Val Gly Arg Tyr Ser Val His Asn Ala Gly Ile Ser Phe 180 185 190 Ser Val Lys Lys Gln Gly Glu Thr Val Ala Asp Val Arg Thr Leu Pro 195 200 205 Asn Ala Ser Thr Val Asp Asn Ile Arg Ser Val Phe Gly Asn Ala Val 210 215 220 Ser Arg Glu Leu Ile Glu Ile Gly Cys Glu Asp Lys Thr Leu Ala Phe 225 230 235 240 Lys Met Asn Gly Tyr Ile Ser Asn Ala Asn Tyr Ser Val Lys Lys Cys 245 250 255 Ile Phe Leu Leu Phe Ile Asn His Arg Leu Val Glu Ser Thr Ser Leu 260 265 270 Arg Lys Ala Ile Glu Thr Val Tyr Ala Ala Tyr Leu Pro Lys Asn Thr 275 280 285 His Pro Phe Leu Tyr Leu Ser Leu Glu Ile Ser Pro Gln Asn Val Asp 290 295 300 Val Asn Val His Pro Thr Lys His Glu Val His Phe Leu His Glu Glu 305 310 315 320 Ser Ile Leu Glu Arg Val Gln Gln His Ile Glu Ser Lys Leu Leu Gly 325 330 335 Ser Asn Ser Ser Arg Met Tyr Phe Thr Gln Thr Leu Leu Pro Gly Leu 340 345 350 Ala Gly Pro Ser Gly Glu Met Val Lys Ser Thr Thr Ser Leu Thr Ser 355 360 365 Ser Ser Thr Ser Gly Ser Ser Asp Lys Val Tyr Ala His Gln Met Val 370 375 380 Arg Thr Asp Ser Arg Glu Gln Lys Leu Asp Ala Phe Leu Gln Pro Leu 385 390 395 400 Ser Lys Pro Leu Ser Ser Gln Pro Gln Ala Ile Val Thr Glu Asp Lys 405 410 415 Thr Asp Ile Ser Ser Gly Arg Ala Arg Gln Gln Asp Glu Glu Met Leu 420 425 430 Glu Leu Pro Ala Pro Ala Glu Val Ala Ala Lys Asn Gln Ser Leu Glu 435 440 445 Gly Asp Thr Thr Lys Gly Thr Ser Glu Met Ser Glu Lys Arg Gly Pro 450 455 460 Thr Ser Ser Asn Pro Arg Lys Arg His Arg Glu Asp Ser Asp Val Glu 465 470 475 480 Met Val Glu Asp Asp Ser Arg Lys Glu Met Thr Ala Ala Cys Thr Pro 485 490 495 Arg Arg Arg Ile Ile Asn Leu Thr Ser Val Leu Ser Leu Gln Glu Glu 500 505 510 Ile Asn Glu Gln Gly His Glu Val Leu Arg Glu Met Leu His Asn His 515 520 525 Ser Phe Val Gly Cys Val Asn Pro Gln Trp Ala Leu Ala Gln His Gln 530 535 540 Thr Lys Leu Tyr Leu Leu Asn Thr Thr Lys Leu Ser Glu Glu Leu Phe 545 550 555 560 Tyr Gln Ile Leu Ile Tyr Asp Phe Ala Asn Phe Gly Val Leu Arg Leu 565 570 575 Ser Glu Pro Ala Pro Leu Phe Asp Leu Ala Met Leu Ala Leu Asp Ser 580 585 590 Pro Glu Ser Gly Trp Thr Glu Glu Asp Gly Pro Lys Glu Gly Leu Ala 595 600 605 Glu Tyr Ile Val Glu Phe Leu Lys Lys Lys Ala Glu Met Leu Ala Asp 610 615 620 Tyr Phe Ser Leu Glu Ile Asp Glu Glu Gly Asn Leu Ile Gly Leu Pro 625 630 635 640 Leu Leu Ile Asp Asn Tyr Val Pro Pro Leu Glu Gly Leu Pro Ile Phe 645 650 655 Ile Leu Arg Leu Ala Thr Glu Val Asn Trp Asp Glu Glu Lys Glu Cys 660 665 670 Phe Glu Ser Leu Ser Lys Glu Cys Ala Met Phe Tyr Ser Ile Arg Lys 675 680 685 Gln Tyr Ile Ser Glu Glu Ser Thr Leu Ser Gly Gln Gln Ser Glu Val 690 695 700 Pro Gly Ser Ile Pro Asn Ser Trp Lys Trp Thr Val Glu His Ile Val 705 710 715 720 Tyr Lys Ala Leu Arg Ser His Ile Leu Pro Pro Lys His Phe Thr Glu 725 730 735 Asp Gly Asn Ile Leu Gln Leu Ala Asn Leu Pro Asp Leu Tyr Lys Val 740 745 750 Phe Glu Arg Cys 755 <210> 3 <211> 3063 <212> DNA <213> homo sapiens <220> <221> CDS <222> (81)..(2879) <400> 3 ggcacgagtg gctgcttgcg gctagtggat ggtaattgcc tgcctcgcgc tagcagcaag 60 ctgctctgtt aaaagcgaaa atg aaa caa ttg cct gcg gca aca gtt cga ctc 113 Met Lys Gln Leu Pro Ala Ala Thr Val Arg Leu 1 5 10 ctt tca agt tct cag atc atc act tcg gtg gtc agt gtt gta aaa gag 161 Leu Ser Ser Ser Gln Ile Ile Thr Ser Val Val Ser Val Val Lys Glu 15 20 25 ctt att gaa aac tcc ttg gat gct ggt gcc aca agc gta gat gtt aaa 209 Leu Ile Glu Asn Ser Leu Asp Ala Gly Ala Thr Ser Val Asp Val Lys 30 35 40 ctg gag aac tat gga ttt gat aaa att gag gtg cga gat aac ggg gag 257 Leu Glu Asn Tyr Gly Phe Asp Lys Ile Glu Val Arg Asp Asn Gly Glu 45 50 55 ggt atc aag gct gtt gat gca cct gta atg gca atg aag tac tac acc 305 Gly Ile Lys Ala Val Asp Ala Pro Val Met Ala Met Lys Tyr Tyr Thr 60 65 70 75 tca aaa ata aat agt cat gaa gat ctt gaa aat ttg aca act tac ggt 353 Ser Lys Ile Asn Ser His Glu Asp Leu Glu Asn Leu Thr Thr Tyr Gly 80 85 90 ttt cgt gga gaa gcc ttg ggg tca att tgt tgt ata gct gag gtt tta 401 Phe Arg Gly Glu Ala Leu Gly Ser Ile Cys Cys Ile Ala Glu Val Leu 95 100 105 att aca aca aga acg gct gct gat aat ttt agc acc cag tat gtt tta 449 Ile Thr Thr Arg Thr Ala Ala Asp Asn Phe Ser Thr Gln Tyr Val Leu 110 115 120 gat ggc agt ggc cac ata ctt tct cag aaa cct tca cat ctt ggt caa 497 Asp Gly Ser Gly His Ile Leu Ser Gln Lys Pro Ser His Leu Gly Gln 125 130 135 ggt aca act gta act gct tta aga tta ttt aag aat cta cct gta aga 545 Gly Thr Thr Val Thr Ala Leu Arg Leu Phe Lys Asn Leu Pro Val Arg 140 145 150 155 aag cag ttt tac tca act gca aaa aaa tgt aaa gat gaa ata aaa aag 593 Lys Gln Phe Tyr Ser Thr Ala Lys Lys Cys Lys Asp Glu Ile Lys Lys 160 165 170 atc caa gat ctc ctc atg agc ttt ggt atc ctt aaa cct gac tta agg 641 Ile Gln Asp Leu Leu Met Ser Phe Gly Ile Leu Lys Pro Asp Leu Arg 175 180 185 att gtc ttt gta cat aac aag gca gtt att tgg cag aaa agc aga gta 689 Ile Val Phe Val His Asn Lys Ala Val Ile Trp Gln Lys Ser Arg Val 190 195 200 tca gat cac aag atg gct ctc atg tca gtt ctg ggg act gct gtt atg 737 Ser Asp His Lys Met Ala Leu Met Ser Val Leu Gly Thr Ala Val Met 205 210 215 aac aat atg gaa tcc ttt cag tac cac tct gaa gaa tct cag att tat 785 Asn Asn Met Glu Ser Phe Gln Tyr His Ser Glu Glu Ser Gln Ile Tyr 220 225 230 235 ctc agt gga ttt ctt cca aag tgt gat gca gac cac tct ttc act agt 833 Leu Ser Gly Phe Leu Pro Lys Cys Asp Ala Asp His Ser Phe Thr Ser 240 245 250 ctt tca aca cca gaa aga agt ttc atc ttc ata aac agt cga cca gta 881 Leu Ser Thr Pro Glu Arg Ser Phe Ile Phe Ile Asn Ser Arg Pro Val 255 260 265 cat caa aaa gat atc tta aag tta atc cga cat cat tac aat ctg aaa 929 His Gln Lys Asp Ile Leu Lys Leu Ile Arg His His Tyr Asn Leu Lys 270 275 280 tgc cta aag gaa tct act cgt ttg tat cct gtt ttc ttt ctg aaa atc 977 Cys Leu Lys Glu Ser Thr Arg Leu Tyr Pro Val Phe Phe Leu Lys Ile 285 290 295 gat gtt cct aca gct gat gtt gat gta aat tta aca cca gat aaa agc 1025 Asp Val Pro Thr Ala Asp Val Asp Val Asn Leu Thr Pro Asp Lys Ser 300 305 310 315 caa gta tta tta caa aat aag gaa tct gtt tta att gct ctt gaa aat 1073 Gln Val Leu Leu Gln Asn Lys Glu Ser Val Leu Ile Ala Leu Glu Asn 320 325 330 ctg atg acg act tgt tat gga cca tta cct agt aca aat tct tat gaa 1121 Leu Met Thr Thr Cys Tyr Gly Pro Leu Pro Ser Thr Asn Ser Tyr Glu 335 340 345 aat aat aaa aca gat gtt tcc gca gct gac atc gtt ctt agt aaa aca 1169 Asn Asn Lys Thr Asp Val Ser Ala Ala Asp Ile Val Leu Ser Lys Thr 350 355 360 gca gaa aca gat gtg ctt ttt aat aaa gtg gaa tca tct gga aag aat 1217 Ala Glu Thr Asp Val Leu Phe Asn Lys Val Glu Ser Ser Gly Lys Asn 365 370 375 tat tca aat gtt gat act tca gtc att cca ttc caa aat gat atg cat 1265 Tyr Ser Asn Val Asp Thr Ser Val Ile Pro Phe Gln Asn Asp Met His 380 385 390 395 aat gat gaa tct gga aaa aac act gat gat tgt tta aat cac cag ata 1313 Asn Asp Glu Ser Gly Lys Asn Thr Asp Asp Cys Leu Asn His Gln Ile 400 405 410 agt att ggt gac ttt ggt tat ggt cat tgt agt agt gaa att tct aac 1361 Ser Ile Gly Asp Phe Gly Tyr Gly His Cys Ser Ser Glu Ile Ser Asn 415 420 425 att gat aaa aac act aag aat gca ttt cag gac att tca atg agt aat 1409 Ile Asp Lys Asn Thr Lys Asn Ala Phe Gln Asp Ile Ser Met Ser Asn 430 435 440 gta tca tgg gag aac tct cag acg gaa tat agt aaa act tgt ttt ata 1457 Val Ser Trp Glu Asn Ser Gln Thr Glu Tyr Ser Lys Thr Cys Phe Ile 445 450 455 agt tcc gtt aag cac acc cag tca gaa aat ggc aat aaa gac cat ata 1505 Ser Ser Val Lys His Thr Gln Ser Glu Asn Gly Asn Lys Asp His Ile 460 465 470 475 gat gag agt ggg gaa aat gag gaa gaa gca ggt ctt gaa aac tct tcg 1553 Asp Glu Ser Gly Glu Asn Glu Glu Glu Ala Gly Leu Glu Asn Ser Ser 480 485 490 gaa att tct gca gat gag tgg agc agg gga aat ata ctt aaa aat tca 1601 Glu Ile Ser Ala Asp Glu Trp Ser Arg Gly Asn Ile Leu Lys Asn Ser 495 500 505 gtg gga gag aat att gaa cct gtg aaa att tta gtg cct gaa aaa agt 1649 Val Gly Glu Asn Ile Glu Pro Val Lys Ile Leu Val Pro Glu Lys Ser 510 515 520 tta cca tgt aaa gta agt aat aat aat tat cca atc cct gaa caa atg 1697 Leu Pro Cys Lys Val Ser Asn Asn Asn Tyr Pro Ile Pro Glu Gln Met 525 530 535 aat ctt aat gaa gat tca tgt aac aaa aaa tca aat gta ata gat aat 1745 Asn Leu Asn Glu Asp Ser Cys Asn Lys Lys Ser Asn Val Ile Asp Asn 540 545 550 555 aaa tct gga aaa gtt aca gct tat gat tta ctt agc aat cga gta atc 1793 Lys Ser Gly Lys Val Thr Ala Tyr Asp Leu Leu Ser Asn Arg Val Ile 560 565 570 aag aaa ccc atg tca gca agt gct ctt ttt gtt caa gat cat cgt cct 1841 Lys Lys Pro Met Ser Ala Ser Ala Leu Phe Val Gln Asp His Arg Pro 575 580 585 cag ttt ctc ata gaa aat cct aag act agt tta gag gat gca aca cta 1889 Gln Phe Leu Ile Glu Asn Pro Lys Thr Ser Leu Glu Asp Ala Thr Leu 590 595 600 caa att gaa gaa ctg tgg aag aca ttg agt gaa gag gaa aaa ctg aaa 1937 Gln Ile Glu Glu Leu Trp Lys Thr Leu Ser Glu Glu Glu Lys Leu Lys 605 610 615 tat gaa gag aag gct act aaa gac ttg gaa cga tac aat agt caa atg 1985 Tyr Glu Glu Lys Ala Thr Lys Asp Leu Glu Arg Tyr Asn Ser Gln Met 620 625 630 635 aag aga gcc att gaa cag gag tca caa atg tca cta aaa gat ggc aga 2033 Lys Arg Ala Ile Glu Gln Glu Ser Gln Met Ser Leu Lys Asp Gly Arg 640 645 650 aaa aag ata aaa ccc acc agc gca tgg aat ttg gcc cag aag cac aag 2081 Lys Lys Ile Lys Pro Thr Ser Ala Trp Asn Leu Ala Gln Lys His Lys 655 660 665 tta aaa acc tca tta tct aat caa cca aaa ctt gat gaa ctc ctt cag 2129 Leu Lys Thr Ser Leu Ser Asn Gln Pro Lys Leu Asp Glu Leu Leu Gln 670 675 680 tcc caa att gaa aaa aga agg agt caa aat att aaa atg gta cag atc 2177 Ser Gln Ile Glu Lys Arg Arg Ser Gln Asn Ile Lys Met Val Gln Ile 685 690 695 ccc ttt tct atg aaa aac tta aaa ata aat ttt aag aaa caa aac aaa 2225 Pro Phe Ser Met Lys Asn Leu Lys Ile Asn Phe Lys Lys Gln Asn Lys 700 705 710 715 gtt gac tta gaa gag aag gat gaa cct tgc ttg atc cac aat ctc agg 2273 Val Asp Leu Glu Glu Lys Asp Glu Pro Cys Leu Ile His Asn Leu Arg 720 725 730 ttt cct gat gca tgg cta atg aca tcc aaa aca gag gta atg tta tta 2321 Phe Pro Asp Ala Trp Leu Met Thr Ser Lys Thr Glu Val Met Leu Leu 735 740 745 aat cca tat aga gta gaa gaa gcc ctg cta ttt aaa aga ctt ctt gag 2369 Asn Pro Tyr Arg Val Glu Glu Ala Leu Leu Phe Lys Arg Leu Leu Glu 750 755 760 aat cat aaa ctt cct gca gag cca ctg gaa aag cca att atg tta aca 2417 Asn His Lys Leu Pro Ala Glu Pro Leu Glu Lys Pro Ile Met Leu Thr 765 770 775 gag agt ctt ttt aat gga tct cat tat tta gac gtt tta tat aaa atg 2465 Glu Ser Leu Phe Asn Gly Ser His Tyr Leu Asp Val Leu Tyr Lys Met 780 785 790 795 aca gca gat gac caa aga tac agt gga tca act tac ctg tct gat cct 2513 Thr Ala Asp Asp Gln Arg Tyr Ser Gly Ser Thr Tyr Leu Ser Asp Pro 800 805 810 cgt ctt aca gcg aat ggt ttc aag ata aaa ttg ata cca gga gtt tca 2561 Arg Leu Thr Ala Asn Gly Phe Lys Ile Lys Leu Ile Pro Gly Val Ser 815 820 825 att act gaa aat tac ttg gaa ata gaa gga atg gct aat tgt ctc cca 2609 Ile Thr Glu Asn Tyr Leu Glu Ile Glu Gly Met Ala Asn Cys Leu Pro 830 835 840 ttc tat gga gta gca gat tta aaa gaa att ctt aat gct ata tta aac 2657 Phe Tyr Gly Val Ala Asp Leu Lys Glu Ile Leu Asn Ala Ile Leu Asn 845 850 855 aga aat gca aag gaa gtt tat gaa tgt aga cct cgc aaa gtg ata agt 2705 Arg Asn Ala Lys Glu Val Tyr Glu Cys Arg Pro Arg Lys Val Ile Ser 860 865 870 875 tat tta gag gga gaa gca gtg cgt cta tcc aga caa tta ccc atg tac 2753 Tyr Leu Glu Gly Glu Ala Val Arg Leu Ser Arg Gln Leu Pro Met Tyr 880 885 890 tta tca aaa gag gac atc caa gac att atc tac aga atg aag cac cag 2801 Leu Ser Lys Glu Asp Ile Gln Asp Ile Ile Tyr Arg Met Lys His Gln 895 900 905 ttt gga aat gaa att aaa gag tgt gtt cat ggt cgc cca ttt ttt cat 2849 Phe Gly Asn Glu Ile Lys Glu Cys Val His Gly Arg Pro Phe Phe His 910 915 920 cat tta acc tat ctt cca gaa act aca tga ttaaatatgt ttaagaagat 2899 His Leu Thr Tyr Leu Pro Glu Thr Thr 925 930 tagttaccat tgaaattggt tctgtcataa aacagcatga gtctggtttt aaattatctt 2959 tgtattatgt gtcacatggt tattttttaa atgaggattc actgacttgt ttttatattg 3019 aaaaaagttc cacgtattgt agaaaacgta aataaactaa taac 3063 <210> 4 <211> 932 <212> PRT <213> homo sapiens <400> 4 Met Lys Gln Leu Pro Ala Ala Thr Val Arg Leu Leu Ser Ser Ser Gln 1 5 10 15 Ile Ile Thr Ser Val Val Ser Val Val Lys Glu Leu Ile Glu Asn Ser 20 25 30 Leu Asp Ala Gly Ala Thr Ser Val Asp Val Lys Leu Glu Asn Tyr Gly 35 40 45 Phe Asp Lys Ile Glu Val Arg Asp Asn Gly Glu Gly Ile Lys Ala Val 50 55 60 Asp Ala Pro Val Met Ala Met Lys Tyr Tyr Thr Ser Lys Ile Asn Ser 65 70 75 80 His Glu Asp Leu Glu Asn Leu Thr Thr Tyr Gly Phe Arg Gly Glu Ala 85 90 95 Leu Gly Ser Ile Cys Cys Ile Ala Glu Val Leu Ile Thr Thr Arg Thr 100 105 110 Ala Ala Asp Asn Phe Ser Thr Gln Tyr Val Leu Asp Gly Ser Gly His 115 120 125 Ile Leu Ser Gln Lys Pro Ser His Leu Gly Gln Gly Thr Thr Val Thr 130 135 140 Ala Leu Arg Leu Phe Lys Asn Leu Pro Val Arg Lys Gln Phe Tyr Ser 145 150 155 160 Thr Ala Lys Lys Cys Lys Asp Glu Ile Lys Lys Ile Gln Asp Leu Leu 165 170 175 Met Ser Phe Gly Ile Leu Lys Pro Asp Leu Arg Ile Val Phe Val His 180 185 190 Asn Lys Ala Val Ile Trp Gln Lys Ser Arg Val Ser Asp His Lys Met 195 200 205 Ala Leu Met Ser Val Leu Gly Thr Ala Val Met Asn Asn Met Glu Ser 210 215 220 Phe Gln Tyr His Ser Glu Glu Ser Gln Ile Tyr Leu Ser Gly Phe Leu 225 230 235 240 Pro Lys Cys Asp Ala Asp His Ser Phe Thr Ser Leu Ser Thr Pro Glu 245 250 255 Arg Ser Phe Ile Phe Ile Asn Ser Arg Pro Val His Gln Lys Asp Ile 260 265 270 Leu Lys Leu Ile Arg His His Tyr Asn Leu Lys Cys Leu Lys Glu Ser 275 280 285 Thr Arg Leu Tyr Pro Val Phe Phe Leu Lys Ile Asp Val Pro Thr Ala 290 295 300 Asp Val Asp Val Asn Leu Thr Pro Asp Lys Ser Gln Val Leu Leu Gln 305 310 315 320 Asn Lys Glu Ser Val Leu Ile Ala Leu Glu Asn Leu Met Thr Thr Cys 325 330 335 Tyr Gly Pro Leu Pro Ser Thr Asn Ser Tyr Glu Asn Asn Lys Thr Asp 340 345 350 Val Ser Ala Ala Asp Ile Val Leu Ser Lys Thr Ala Glu Thr Asp Val 355 360 365 Leu Phe Asn Lys Val Glu Ser Ser Gly Lys Asn Tyr Ser Asn Val Asp 370 375 380 Thr Ser Val Ile Pro Phe Gln Asn Asp Met His Asn Asp Glu Ser Gly 385 390 395 400 Lys Asn Thr Asp Asp Cys Leu Asn His Gln Ile Ser Ile Gly Asp Phe 405 410 415 Gly Tyr Gly His Cys Ser Ser Glu Ile Ser Asn Ile Asp Lys Asn Thr 420 425 430 Lys Asn Ala Phe Gln Asp Ile Ser Met Ser Asn Val Ser Trp Glu Asn 435 440 445 Ser Gln Thr Glu Tyr Ser Lys Thr Cys Phe Ile Ser Ser Val Lys His 450 455 460 Thr Gln Ser Glu Asn Gly Asn Lys Asp His Ile Asp Glu Ser Gly Glu 465 470 475 480 Asn Glu Glu Glu Ala Gly Leu Glu Asn Ser Ser Glu Ile Ser Ala Asp 485 490 495 Glu Trp Ser Arg Gly Asn Ile Leu Lys Asn Ser Val Gly Glu Asn Ile 500 505 510 Glu Pro Val Lys Ile Leu Val Pro Glu Lys Ser Leu Pro Cys Lys Val 515 520 525 Ser Asn Asn Asn Tyr Pro Ile Pro Glu Gln Met Asn Leu Asn Glu Asp 530 535 540 Ser Cys Asn Lys Lys Ser Asn Val Ile Asp Asn Lys Ser Gly Lys Val 545 550 555 560 Thr Ala Tyr Asp Leu Leu Ser Asn Arg Val Ile Lys Lys Pro Met Ser 565 570 575 Ala Ser Ala Leu Phe Val Gln Asp His Arg Pro Gln Phe Leu Ile Glu 580 585 590 Asn Pro Lys Thr Ser Leu Glu Asp Ala Thr Leu Gln Ile Glu Glu Leu 595 600 605 Trp Lys Thr Leu Ser Glu Glu Glu Lys Leu Lys Tyr Glu Glu Lys Ala 610 615 620 Thr Lys Asp Leu Glu Arg Tyr Asn Ser Gln Met Lys Arg Ala Ile Glu 625 630 635 640 Gln Glu Ser Gln Met Ser Leu Lys Asp Gly Arg Lys Lys Ile Lys Pro 645 650 655 Thr Ser Ala Trp Asn Leu Ala Gln Lys His Lys Leu Lys Thr Ser Leu 660 665 670 Ser Asn Gln Pro Lys Leu Asp Glu Leu Leu Gln Ser Gln Ile Glu Lys 675 680 685 Arg Arg Ser Gln Asn Ile Lys Met Val Gln Ile Pro Phe Ser Met Lys 690 695 700 Asn Leu Lys Ile Asn Phe Lys Lys Gln Asn Lys Val Asp Leu Glu Glu 705 710 715 720 Lys Asp Glu Pro Cys Leu Ile His Asn Leu Arg Phe Pro Asp Ala Trp 725 730 735 Leu Met Thr Ser Lys Thr Glu Val Met Leu Leu Asn Pro Tyr Arg Val 740 745 750 Glu Glu Ala Leu Leu Phe Lys Arg Leu Leu Glu Asn His Lys Leu Pro 755 760 765 Ala Glu Pro Leu Glu Lys Pro Ile Met Leu Thr Glu Ser Leu Phe Asn 770 775 780 Gly Ser His Tyr Leu Asp Val Leu Tyr Lys Met Thr Ala Asp Asp Gln 785 790 795 800 Arg Tyr Ser Gly Ser Thr Tyr Leu Ser Asp Pro Arg Leu Thr Ala Asn 805 810 815 Gly Phe Lys Ile Lys Leu Ile Pro Gly Val Ser Ile Thr Glu Asn Tyr 820 825 830 Leu Glu Ile Glu Gly Met Ala Asn Cys Leu Pro Phe Tyr Gly Val Ala 835 840 845 Asp Leu Lys Glu Ile Leu Asn Ala Ile Leu Asn Arg Asn Ala Lys Glu 850 855 860 Val Tyr Glu Cys Arg Pro Arg Lys Val Ile Ser Tyr Leu Glu Gly Glu 865 870 875 880 Ala Val Arg Leu Ser Arg Gln Leu Pro Met Tyr Leu Ser Lys Glu Asp 885 890 895 Ile Gln Asp Ile Ile Tyr Arg Met Lys His Gln Phe Gly Asn Glu Ile 900 905 910 Lys Glu Cys Val His Gly Arg Pro Phe Phe His His Leu Thr Tyr Leu 915 920 925 Pro Glu Thr Thr 930 <210> 5 <211> 2771 <212> DNA <213> homo sapiens <220> <221> CDS <222> (25)..(2613) <400> 5 cgaggcggat cgggtgttgc atcc atg gag cga gct gag agc tcg agt aca 51 Met Glu Arg Ala Glu Ser Ser Ser Thr 1 5 gaa cct gct aag gcc atc aaa cct att gat cgg aag tca gtc cat cag 99 Glu Pro Ala Lys Ala Ile Lys Pro Ile Asp Arg Lys Ser Val His Gln 10 15 20 25 att tgc tct ggg cag gtg gta ctg agt cta agc act gcg gta aag gag 147 Ile Cys Ser Gly Gln Val Val Leu Ser Leu Ser Thr Ala Val Lys Glu 30 35 40 tta gta gaa aac agt ctg gat gct ggt gcc act aat att gat cta aag 195 Leu Val Glu Asn Ser Leu Asp Ala Gly Ala Thr Asn Ile Asp Leu Lys 45 50 55 ctt aag gac tat gga gtg gat ctt att gaa gtt tca gac aat gga tgt 243 Leu Lys Asp Tyr Gly Val Asp Leu Ile Glu Val Ser Asp Asn Gly Cys 60 65 70 ggg gta gaa gaa gaa aac ttc gaa ggc tta act ctg aaa cat cac aca 291 Gly Val Glu Glu Glu Asn Phe Glu Gly Leu Thr Leu Lys His His Thr 75 80 85 tct aag att caa gag ttt gcc gac cta act cag gtt gaa act ttt ggc 339 Ser Lys Ile Gln Glu Phe Ala Asp Leu Thr Gln Val Glu Thr Phe Gly 90 95 100 105 ttt cgg ggg gaa gct ctg agc tca ctt tgt gca ctg agc gat gtc acc 387 Phe Arg Gly Glu Ala Leu Ser Ser Leu Cys Ala Leu Ser Asp Val Thr 110 115 120 att tct acc tgc cac gca tcg gcg aag gtt gga act cga ctg atg ttt 435 Ile Ser Thr Cys His Ala Ser Ala Lys Val Gly Thr Arg Leu Met Phe 125 130 135 gat cac aat ggg aaa att atc cag aaa acc ccc tac ccc cgc ccc aga 483 Asp His Asn Gly Lys Ile Ile Gln Lys Thr Pro Tyr Pro Arg Pro Arg 140 145 150 ggg acc aca gtc agc gtg cag cag tta ttt tcc aca cta cct gtg cgc 531 Gly Thr Thr Val Ser Val Gln Gln Leu Phe Ser Thr Leu Pro Val Arg 155 160 165 cat aag gaa ttt caa agg aat att aag aag gag tat gcc aaa atg gtc 579 His Lys Glu Phe Gln Arg Asn Ile Lys Lys Glu Tyr Ala Lys Met Val 170 175 180 185 cag gtc tta cat gca tac tgt atc att tca gca ggc atc cgt gta agt 627 Gln Val Leu His Ala Tyr Cys Ile Ile Ser Ala Gly Ile Arg Val Ser 190 195 200 tgc acc aat cag ctt gga caa gga aaa cga cag cct gtg gta tgc aca 675 Cys Thr Asn Gln Leu Gly Gln Gly Lys Arg Gln Pro Val Val Cys Thr 205 210 215 ggt gga agc ccc agc ata aag gaa aat atc ggc tct gtg ttt ggg cag 723 Gly Gly Ser Pro Ser Ile Lys Glu Asn Ile Gly Ser Val Phe Gly Gln 220 225 230 aag cag ttg caa agc ctc att cct ttt gtt cag ctg ccc cct agt gac 771 Lys Gln Leu Gln Ser Leu Ile Pro Phe Val Gln Leu Pro Pro Ser Asp 235 240 245 tcc gtg tgt gaa gag tac ggt ttg agc tgt tcg gat gct ctg cat aat 819 Ser Val Cys Glu Glu Tyr Gly Leu Ser Cys Ser Asp Ala Leu His Asn 250 255 260 265 ctt ttt tac atc tca ggt ttc att tca caa tgc acg cat gga gtt gga 867 Leu Phe Tyr Ile Ser Gly Phe Ile Ser Gln Cys Thr His Gly Val Gly 270 275 280 agg agt tca aca gac aga cag ttt ttc ttt atc aac cgg cgg cct tgt 915 Arg Ser Ser Thr Asp Arg Gln Phe Phe Phe Ile Asn Arg Arg Pro Cys 285 290 295 gac cca gca aag gtc tgc aga ctc gtg aat gag gtc tac cac atg tat 963 Asp Pro Ala Lys Val Cys Arg Leu Val Asn Glu Val Tyr His Met Tyr 300 305 310 aat cga cac cag tat cca ttt gtt gtt ctt aac att tct gtt gat tca 1011 Asn Arg His Gln Tyr Pro Phe Val Val Leu Asn Ile Ser Val Asp Ser 315 320 325 gaa tgc gtt gat atc aat gtt act cca gat aaa agg caa att ttg cta 1059 Glu Cys Val Asp Ile Asn Val Thr Pro Asp Lys Arg Gln Ile Leu Leu 330 335 340 345 caa gag gaa aag ctt ttg ttg gca gtt tta aag acc tct ttg ata gga 1107 Gln Glu Glu Lys Leu Leu Leu Ala Val Leu Lys Thr Ser Leu Ile Gly 350 355 360 atg ttt gat agt gat gtc aac aag cta aat gtc agt cag cag cca ctg 1155 Met Phe Asp Ser Asp Val Asn Lys Leu Asn Val Ser Gln Gln Pro Leu 365 370 375 ctg gat gtt gaa ggt aac tta ata aaa atg cat gca gcg gat ttg gaa 1203 Leu Asp Val Glu Gly Asn Leu Ile Lys Met His Ala Ala Asp Leu Glu 380 385 390 aag ccc atg gta gaa aag cag gat caa tcc cct tca tta agg act gga 1251 Lys Pro Met Val Glu Lys Gln Asp Gln Ser Pro Ser Leu Arg Thr Gly 395 400 405 gaa gaa aaa aaa gac gtg tcc att tcc aga ctg cga gag gcc ttt tct 1299 Glu Glu Lys Lys Asp Val Ser Ile Ser Arg Leu Arg Glu Ala Phe Ser 410 415 420 425 ctt cgt cac aca aca gag aac aag cct cac agc cca aag act cca gaa 1347 Leu Arg His Thr Thr Glu Asn Lys Pro His Ser Pro Lys Thr Pro Glu 430 435 440 cca aga agg agc cct cta gga cag aaa agg ggt atg ctg tct tct agc 1395 Pro Arg Arg Ser Pro Leu Gly Gln Lys Arg Gly Met Leu Ser Ser Ser 445 450 455 act tca ggt gcc atc tct gac aaa ggc gtc ctg aga cct cag aaa gag 1443 Thr Ser Gly Ala Ile Ser Asp Lys Gly Val Leu Arg Pro Gln Lys Glu 460 465 470 gca gtg agt tcc agt cac gga ccc agt gac cct acg gac aga gcg gag 1491 Ala Val Ser Ser Ser His Gly Pro Ser Asp Pro Thr Asp Arg Ala Glu 475 480 485 gtg gag aag gac tcg ggg cac ggc agc act tcc gtg gat tct gag ggg 1539 Val Glu Lys Asp Ser Gly His Gly Ser Thr Ser Val Asp Ser Glu Gly 490 495 500 505 ttc agc atc cca gac acg ggc agt cac tgc agc agc gag tat gcg gcc 1587 Phe Ser Ile Pro Asp Thr Gly Ser His Cys Ser Ser Glu Tyr Ala Ala 510 515 520 agc tcc cca ggg gac agg ggc tcg cag gaa cat gtg gac tct cag gag 1635 Ser Ser Pro Gly Asp Arg Gly Ser Gln Glu His Val Asp Ser Gln Glu 525 530 535 aaa gcg cct gaa act gac gac tct ttt tca gat gtg gac tgc cat tca 1683 Lys Ala Pro Glu Thr Asp Asp Ser Phe Ser Asp Val Asp Cys His Ser 540 545 550 aac cag gaa gat acc gga tgt aaa ttt cga gtt ttg cct cag cca act 1731 Asn Gln Glu Asp Thr Gly Cys Lys Phe Arg Val Leu Pro Gln Pro Thr 555 560 565 aat ctc gca acc cca aac aca aag cgt ttt aaa aaa gaa gaa att ctt 1779 Asn Leu Ala Thr Pro Asn Thr Lys Arg Phe Lys Lys Glu Glu Ile Leu 570 575 580 585 tcc agt tct gac att tgt caa aag tta gta aat act cag gac atg tca 1827 Ser Ser Ser Asp Ile Cys Gln Lys Leu Val Asn Thr Gln Asp Met Ser 590 595 600 gcc tct cag gtt gat gta gct gtg aaa att aat aag aaa gtt gtg ccc 1875 Ala Ser Gln Val Asp Val Ala Val Lys Ile Asn Lys Lys Val Val Pro 605 610 615 ctg gac ttt tct atg agt tct tta gct aaa cga ata aag cag tta cat 1923 Leu Asp Phe Ser Met Ser Ser Leu Ala Lys Arg Ile Lys Gln Leu His 620 625 630 cat gaa gca cag caa agt gaa ggg gaa cag aat tac agg aag ttt agg 1971 His Glu Ala Gln Gln Ser Glu Gly Glu Gln Asn Tyr Arg Lys Phe Arg 635 640 645 gca aag att tgt cct gga gaa aat caa gca gcc gaa gat gaa cta aga 2019 Ala Lys Ile Cys Pro Gly Glu Asn Gln Ala Ala Glu Asp Glu Leu Arg 650 655 660 665 aaa gag ata agt aaa acg atg ttt gca gaa atg gaa atc att ggt cag 2067 Lys Glu Ile Ser Lys Thr Met Phe Ala Glu Met Glu Ile Ile Gly Gln 670 675 680 ttt aac ctg gga ttt ata ata acc aaa ctg aat gag gat atc ttc ata 2115 Phe Asn Leu Gly Phe Ile Ile Thr Lys Leu Asn Glu Asp Ile Phe Ile 685 690 695 gtg gac cag cat gcc acg gac gag aag tat aac ttc gag atg ctg cag 2163 Val Asp Gln His Ala Thr Asp Glu Lys Tyr Asn Phe Glu Met Leu Gln 700 705 710 cag cac acc gtg ctc cag ggg cag agg ctc ata gca cct cag act ctc 2211 Gln His Thr Val Leu Gln Gly Gln Arg Leu Ile Ala Pro Gln Thr Leu 715 720 725 aac tta act gct gtt aat gaa gct gtt ctg ata gaa aat ctg gaa ata 2259 Asn Leu Thr Ala Val Asn Glu Ala Val Leu Ile Glu Asn Leu Glu Ile 730 735 740 745 ttt aga aag aat ggc ttt gat ttt gtt atc gat gaa aat gct cca gtc 2307 Phe Arg Lys Asn Gly Phe Asp Phe Val Ile Asp Glu Asn Ala Pro Val 750 755 760 act gaa agg gct aaa ctg att tcc ttg cca act agt aaa aac tgg acc 2355 Thr Glu Arg Ala Lys Leu Ile Ser Leu Pro Thr Ser Lys Asn Trp Thr 765 770 775 ttc gga ccc cag gac gtc gat gaa ctg atc ttc atg ctg agc gac agc 2403 Phe Gly Pro Gln Asp Val Asp Glu Leu Ile Phe Met Leu Ser Asp Ser 780 785 790 cct ggg gtc atg tgc cgg cct tcc cga gtc aag cag atg ttt gcc tcc 2451 Pro Gly Val Met Cys Arg Pro Ser Arg Val Lys Gln Met Phe Ala Ser 795 800 805 aga gcc tgc cgg aag tcg gtg atg att ggg act gct ctt aac aca agc 2499 Arg Ala Cys Arg Lys Ser Val Met Ile Gly Thr Ala Leu Asn Thr Ser 810 815 820 825 gag atg aag aaa ctg atc acc cac atg ggg gag atg gac cac ccc tgg 2547 Glu Met Lys Lys Leu Ile Thr His Met Gly Glu Met Asp His Pro Trp 830 835 840 aac tgt ccc cat gga agg cca acc atg aga cac atc gcc aac ctg ggt 2595 Asn Cys Pro His Gly Arg Pro Thr Met Arg His Ile Ala Asn Leu Gly 845 850 855 gtc att tct cag aac tga ccgtagtcac tgtatggaat aattggtttt 2643 Val Ile Ser Gln Asn 860 atcgcagatt tttatgtttt gaaagacaga gtcttcacta accttttttg ttttaaaatg 2703 aaacctgcta cttaaaaaaa atacacatca cacccattta aaagtgatct tgagaacctt 2763 ttcaaacc 2771 <210> 6 <211> 862 <212> PRT <213> homo sapiens <400> 6 Met Glu Arg Ala Glu Ser Ser Ser Thr Glu Pro Ala Lys Ala Ile Lys 1 5 10 15 Pro Ile Asp Arg Lys Ser Val His Gln Ile Cys Ser Gly Gln Val Val 20 25 30 Leu Ser Leu Ser Thr Ala Val Lys Glu Leu Val Glu Asn Ser Leu Asp 35 40 45 Ala Gly Ala Thr Asn Ile Asp Leu Lys Leu Lys Asp Tyr Gly Val Asp 50 55 60 Leu Ile Glu Val Ser Asp Asn Gly Cys Gly Val Glu Glu Glu Asn Phe 65 70 75 80 Glu Gly Leu Thr Leu Lys His His Thr Ser Lys Ile Gln Glu Phe Ala 85 90 95 Asp Leu Thr Gln Val Glu Thr Phe Gly Phe Arg Gly Glu Ala Leu Ser 100 105 110 Ser Leu Cys Ala Leu Ser Asp Val Thr Ile Ser Thr Cys His Ala Ser 115 120 125 Ala Lys Val Gly Thr Arg Leu Met Phe Asp His Asn Gly Lys Ile Ile 130 135 140 Gln Lys Thr Pro Tyr Pro Arg Pro Arg Gly Thr Thr Val Ser Val Gln 145 150 155 160 Gln Leu Phe Ser Thr Leu Pro Val Arg His Lys Glu Phe Gln Arg Asn 165 170 175 Ile Lys Lys Glu Tyr Ala Lys Met Val Gln Val Leu His Ala Tyr Cys 180 185 190 Ile Ile Ser Ala Gly Ile Arg Val Ser Cys Thr Asn Gln Leu Gly Gln 195 200 205 Gly Lys Arg Gln Pro Val Val Cys Thr Gly Gly Ser Pro Ser Ile Lys 210 215 220 Glu Asn Ile Gly Ser Val Phe Gly Gln Lys Gln Leu Gln Ser Leu Ile 225 230 235 240 Pro Phe Val Gln Leu Pro Pro Ser Asp Ser Val Cys Glu Glu Tyr Gly 245 250 255 Leu Ser Cys Ser Asp Ala Leu His Asn Leu Phe Tyr Ile Ser Gly Phe 260 265 270 Ile Ser Gln Cys Thr His Gly Val Gly Arg Ser Ser Thr Asp Arg Gln 275 280 285 Phe Phe Phe Ile Asn Arg Arg Pro Cys Asp Pro Ala Lys Val Cys Arg 290 295 300 Leu Val Asn Glu Val Tyr His Met Tyr Asn Arg His Gln Tyr Pro Phe 305 310 315 320 Val Val Leu Asn Ile Ser Val Asp Ser Glu Cys Val Asp Ile Asn Val 325 330 335 Thr Pro Asp Lys Arg Gln Ile Leu Leu Gln Glu Glu Lys Leu Leu Leu 340 345 350 Ala Val Leu Lys Thr Ser Leu Ile Gly Met Phe Asp Ser Asp Val Asn 355 360 365 Lys Leu Asn Val Ser Gln Gln Pro Leu Leu Asp Val Glu Gly Asn Leu 370 375 380 Ile Lys Met His Ala Ala Asp Leu Glu Lys Pro Met Val Glu Lys Gln 385 390 395 400 Asp Gln Ser Pro Ser Leu Arg Thr Gly Glu Glu Lys Lys Asp Val Ser 405 410 415 Ile Ser Arg Leu Arg Glu Ala Phe Ser Leu Arg His Thr Thr Glu Asn 420 425 430 Lys Pro His Ser Pro Lys Thr Pro Glu Pro Arg Arg Ser Pro Leu Gly 435 440 445 Gln Lys Arg Gly Met Leu Ser Ser Ser Thr Ser Gly Ala Ile Ser Asp 450 455 460 Lys Gly Val Leu Arg Pro Gln Lys Glu Ala Val Ser Ser Ser His Gly 465 470 475 480 Pro Ser Asp Pro Thr Asp Arg Ala Glu Val Glu Lys Asp Ser Gly His 485 490 495 Gly Ser Thr Ser Val Asp Ser Glu Gly Phe Ser Ile Pro Asp Thr Gly 500 505 510 Ser His Cys Ser Ser Glu Tyr Ala Ala Ser Ser Pro Gly Asp Arg Gly 515 520 525 Ser Gln Glu His Val Asp Ser Gln Glu Lys Ala Pro Glu Thr Asp Asp 530 535 540 Ser Phe Ser Asp Val Asp Cys His Ser Asn Gln Glu Asp Thr Gly Cys 545 550 555 560 Lys Phe Arg Val Leu Pro Gln Pro Thr Asn Leu Ala Thr Pro Asn Thr 565 570 575 Lys Arg Phe Lys Lys Glu Glu Ile Leu Ser Ser Ser Asp Ile Cys Gln 580 585 590 Lys Leu Val Asn Thr Gln Asp Met Ser Ala Ser Gln Val Asp Val Ala 595 600 605 Val Lys Ile Asn Lys Lys Val Val Pro Leu Asp Phe Ser Met Ser Ser 610 615 620 Leu Ala Lys Arg Ile Lys Gln Leu His His Glu Ala Gln Gln Ser Glu 625 630 635 640 Gly Glu Gln Asn Tyr Arg Lys Phe Arg Ala Lys Ile Cys Pro Gly Glu 645 650 655 Asn Gln Ala Ala Glu Asp Glu Leu Arg Lys Glu Ile Ser Lys Thr Met 660 665 670 Phe Ala Glu Met Glu Ile Ile Gly Gln Phe Asn Leu Gly Phe Ile Ile 675 680 685 Thr Lys Leu Asn Glu Asp Ile Phe Ile Val Asp Gln His Ala Thr Asp 690 695 700 Glu Lys Tyr Asn Phe Glu Met Leu Gln Gln His Thr Val Leu Gln Gly 705 710 715 720 Gln Arg Leu Ile Ala Pro Gln Thr Leu Asn Leu Thr Ala Val Asn Glu 725 730 735 Ala Val Leu Ile Glu Asn Leu Glu Ile Phe Arg Lys Asn Gly Phe Asp 740 745 750 Phe Val Ile Asp Glu Asn Ala Pro Val Thr Glu Arg Ala Lys Leu Ile 755 760 765 Ser Leu Pro Thr Ser Lys Asn Trp Thr Phe Gly Pro Gln Asp Val Asp 770 775 780 Glu Leu Ile Phe Met Leu Ser Asp Ser Pro Gly Val Met Cys Arg Pro 785 790 795 800 Ser Arg Val Lys Gln Met Phe Ala Ser Arg Ala Cys Arg Lys Ser Val 805 810 815 Met Ile Gly Thr Ala Leu Asn Thr Ser Glu Met Lys Lys Leu Ile Thr 820 825 830 His Met Gly Glu Met Asp His Pro Trp Asn Cys Pro His Gly Arg Pro 835 840 845 Thr Met Arg His Ile Ala Asn Leu Gly Val Ile Ser Gln Asn 850 855 860 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 7 gttgaacatc tagacgtctc 20 <210> 8 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 8 tcgtggcagg ggttattcg 19 <210> 9 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 9 ctacccaatg cctcaaccg 19 <210> 10 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 10 gagaactgat agaaattgga tg 22 <210> 11 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 11 gggacatgag gttctccg 18 <210> 12 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 12 gggctgtgtg aatcctcag 19 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 13 cggttcacca ctgtctcgtc 20 <210> 14 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 14 tccaggatgc tctcctcg 18 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 15 caagtcctgg tagcaaagtc 20 <210> 16 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 16 atggcaaggt caaagagcg 19 <210> 17 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <220> <221> misc_feature <222> (22)..(22) <223> n equals a, t, g or c <400> 17 caacaatgta ttcagnaagt cc 22 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 18 ttgatacaac actttgtatc g 21 <210> 19 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 19 ggaatactat cagaaggcaa g 21 <210> 20 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 20 acagagcaag ttactcagat g 21 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 21 gtacacaatg caggcattag 20 <210> 22 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 22 aatgtggatg ttaatgtgca c 21 <210> 23 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 23 ctgacctcgt cttcctac 18 <210> 24 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 24 cagcaagatg aggagatgc 19 <210> 25 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 25 ggaaatggtg gaagatgatt c 21 <210> 26 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 26 cttctcaaca ccaagc 16 <210> 27 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 27 gaaattgatg aggaagggaa c 21 <210> 28 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 28 cttctgattg acaactatgt gc 22 <210> 29 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 29 cacagaagat ggaaatatcc tg 22 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 30 gtgttggtag cacttaagac 20 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 31 tttcccatat tcttcacttg 20 <210> 32 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 32 gtaacatgag ccacatggc 19 <210> 33 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 33 ccactgtctc gtccagccg 19 <210> 34 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 5' primer with BamHI restriction site <400> 34 cgggatccat gtcgttcgtg gcaggg 26 <210> 35 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 3' primer with XbaI restriction site <400> 35 gctctagatt aacacctctc aaagac 26 <210> 36 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 primer useful for amplifying codons 1 to 394 <400> 36 gcatctagac gtttccttgg c 21 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 394 of hMLH1 <400> 37 catccaagct tctgttcccg 20 <210> 38 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 <400> 38 ggggtgcagc agcacatcg 19 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 <400> 39 ggaggcagaa tgtgtgagcg 20 <210> 40 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 602 to 756 plus 128 nucleotides of 3' untranslated sequence of hMLH1 <400> 40 tcccaaagaa ggacttgct 19 <210> 41 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 602 to 756 plus 128 nucleotides of 3' untranslated sequence of hMLH1 <400> 41 agtataagtc ttaagtgcta cc 22 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 578 to 632 of hMLH1 <400> 42 tttatggttt ctcacctgcc 20 <210> 43 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 578 to 632 of hMLH1 <400> 43 gttatctgcc cacctcagc 19 <210> 44 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 394 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 44 ggatcctaat acgactcact atagggagac caccatggca tctagacgtt tcccttggc 59 <210> 45 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 394 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 45 catccaagct tctgttcccg 20 <210> 46 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 46 ggatcctaat acgactcact atagggagac caccatgggg gtgcagcagc acatcg 56 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 47 ggaggcagaa tgtgtgagcg 20 <210> 48 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 5' primer with a BamHI restriction site <400> 48 cgggatccat gaaacaattg cctgcggc 28 <210> 49 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 3' primer with XbaI restriction site <400> 49 gctctagacc agactcatgc tgtttt 26 <210> 50 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 5' primer with a BamHI restriction site <400> 50 cgggatccat ggagcgagct gagagc 26 <210> 51 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 3' primer with XbaI restriction site <400> 51 gctctagagt gaagactctg tct 23 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 primer <400> 52 aagctgctct gttaaaagcg 20 <210> 53 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 primer <400> 53 gcaccagcat ccaaggag 18 <210> 54 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 primer <400> 54 caaccatgag acacatcgc 19 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 primer <400> 55 aggttagtga agactctgtc 20 <210> 56 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 500 of hMLH2 <400> 56 ggatcctaat acgactcact atagggagac caccatggaa caattgcctg cgg 53 <210> 57 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 500 of hMLH2 <400> 57 cctgctccac tcatctgc 18 <210> 58 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 270 to 755 of hMLH2 <400> 58 ggatcctaat acgactcact atagggagac caccatggaa gatatcttaa agttaatccg 60 <210> 59 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 270 to 755 of hMLH2 <400> 59 ggcttcttct actctatatg g 21 <210> 60 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying from codon 485 to the translation termination site at codon 933 of hMLH2 <400> 60 ggatcctaat acgactcact atagggagac caccatggca ggtcttgaaa actcttcg 58 <210> 61 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying from codon 485 to the translation termination site at codon 933 of hMLH2 <400> 61 aaaacaagtc agtgaatcct c 21 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 3' primer useful for amplifying up to codon 369 of hMLH2 <400> 62 aagcacatct gtttctgctg 20 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 3' primer useful for amplifying up to codon 290 of hMLH2 <400> 63 acgagtagat tcctttaggc 20 <210> 64 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> 3' primer useful for amplifying up to codon 214 of hMLH2 <400> 64 cagaactgac atgagagcc 19 <210> 65 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 863 hMLH3 <400> 65 ggatcctaat acgactcact atagggagac caccatggag cgagctgaga gc 52 <210> 66 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 863 hMLH3 <400> 66 aggttagtga agactctgtc 20 <210> 67 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying up to codon 472 of hMLH3 <400> 67 ctgaggtctc agcaggc 17 <210> 68 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 415 to 863 of hMLH3 <400> 68 ggatcctaat acgactcact atagggagac caccatggtg tccatttcca gactgcg 57 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 415 to 863 of hMLH3 <400> 69 aggttagtga agactctgtc 20 <210> 70 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 195 to 233 of hMLH2 <400> 70 ttatttggca gaaaagcaga g 21 <210> 71 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 195 to 233 of hMLH2 <400> 71 ttaaaagact aacctcttgc c 21 <210> 72 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> sequencing primer useful for sequencing codons 195 to 233 of hMLH 2 <400> 72 ctgctgttat gaacaatatg g 21 <210> 73 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 233 to 257 of hMLH3 <400> 73 cagaagcagt tgcaaagcc 19 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 233 to 257 of hMLH3 <400> 74 aaaccgtact cttcacacac 20 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 347 of 377 of hMLH3 <400> 75 gaggaaaagc ttttgttggc 20 <210> 76 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 347 of 377 of hMLH3 <400> 76 cagtggctgc tgactgac 18 <210> 77 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 439 to 472 of hMLH3 <400> 77 tccagaacca agaaggagc 19 <210> 78 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 439 to 472 of hMLH3 <400> 78 tgaggtctca gcaggc 16
【図面の簡単な説明】
【図1】 ヒト・DNA修復蛋白hMLH1のcDNA
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な1文字略記法により表す。373自動DNA
シークエンサー(アプライド・バイオシステムズ・イン
コーポレイテッド(Applied Biosystems,Inc.)を用い
て 配列決定を行った。配列決定の精度は97%より高
いと予想される。
【図2】 ヒト・DNA修復蛋白hMLH1のcDNA
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な1文字略記法により表す。373自動DNA
シークエンサー(アプライド・バイオシステムズ・イン
コーポレイテッド(Applied Biosystems,Inc.)を用い
て 配列決定を行った。配列決定の精度は97%より高
いと予想される。
【図3】 ヒト・DNA修復蛋白hMLH1のcDNA
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な1文字略記法により表す。373自動DNA
シークエンサー(アプライド・バイオシステムズ・イン
コーポレイテッド(Applied Biosystems,Inc.)を用い
て 配列決定を行った。配列決定の精度は97%より高
いと予想される。
【図4】 ヒト・DNA修復蛋白hMLH1のcDNA
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な1文字略記法により表す。373自動DNA
シークエンサー(アプライド・バイオシステムズ・イン
コーポレイテッド(Applied Biosystems,Inc.)を用い
て 配列決定を行った。配列決定の精度は97%より高
いと予想される。
【図5】 ヒト・DNA修復蛋白hMLH1のcDNA
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な1文字略記法により表す。373自動DNA
シークエンサー(アプライド・バイオシステムズ・イン
コーポレイテッド(Applied Biosystems,Inc.)を用い
て 配列決定を行った。配列決定の精度は97%より高
いと予想される。
【図6】 ヒト・DNA修復蛋白hMLH1のcDNA
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な1文字略記法により表す。373自動DNA
シークエンサー(アプライド・バイオシステムズ・イン
コーポレイテッド(Applied Biosystems,Inc.)を用い
て 配列決定を行った。配列決定の精度は97%より高
いと予想される。
【図7】 hMLH2のcDNA配列および対応する推
定アミノ酸配列を示す。アミノ酸を標準的な1文字略記
法により表す。
【図8】 hMLH2のcDNA配列および対応する推
定アミノ酸配列を示す。アミノ酸を標準的な1文字略記
法により表す。
【図9】 hMLH2のcDNA配列および対応する推
定アミノ酸配列を示す。アミノ酸を標準的な1文字略記
法により表す。
【図10】 hMLH2のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図11】 hMLH2のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図12】 hMLH2のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図13】 hMLH2のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図14】 hMLH2のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図15】 hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図16】 hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図17】 hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図18】 hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図19】 hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図20】 hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図21】 hMLH3のcDNA配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な1文字略
記法により表す。
【図22】 MACAW(バージョン1.0)プログラ
ムを用いて、エス・セレビシエ(S.cerevisiae)のPM
S1(yPMS1)の推定アミノ酸配列と、hMLH2
ならびにhMLH3アミノ酸配列とを並べたものであ
る。保存性のあるブロックのアミノ酸は大文字で示さ
れ、それらのペア−ワイズ・スコア(pair-wise score
s)の平均上に影をつけた。
【図23】 MACAW(バージョン1.0)プログラ
ムを用いて、エス・セレビシエ(S.cerevisiae)のPM
S1(yPMS1)の推定アミノ酸配列と、hMLH2
ならびにhMLH3アミノ酸配列とを並べたものであ
る。保存性のあるブロックのアミノ酸は大文字で示さ
れ、それらのペア−ワイズ・スコア(pair-wise score
s)の平均上に影をつけた。
【図24】 MACAW(バージョン1.0)プログラ
ムを用いて、エス・セレビシエ(S.cerevisiae)のPM
S1(yPMS1)の推定アミノ酸配列と、hMLH2
ならびにhMLH3アミノ酸配列とを並べたものであ
る。保存性のあるブロックのアミノ酸は大文字で示さ
れ、それらのペア−ワイズ・スコア(pair-wise score
s)の平均上に影をつけた。
【図25】 hMLH2の変異分析である。(A)HN
PCC患者のCWにおける転写停止変異に関するIVS
P分析およびマッピング。コドン1から369までの翻
訳(レーン1)、コドン1から290までの翻訳(レー
ン2)、コドン1から214までの翻訳(レーン3)。
CWは患者CWのcDNAから翻訳され、NORは正常
個体のcDNAから翻訳される。矢じりは、潜在的な停
止変異により切断されたポリペプチドを示す。矢印は分
子量マーカーをキロダルトンで示す。(B)CWの配列
分析により、コドン233におけるCのTへのトランジ
ション変異が示される(矢印により示す)。レーン1お
よびレーン3は対照患者由来の配列;レーン2はCWの
ゲノムDNA由来の配列である。各配列混合物からのd
dA混合物を隣のレーンに負荷してddC、ddD、お
よびddT混合物との比較を容易にする。
【図26】 hMLH3の変異分析である。(A)患者
GCからのhMLH3のIVSP分析。レーンGCは個
体GCの線維芽細胞由来;レーンGCxは患者GCの腫
瘍由来;レーンNOR1および2は正常対照個体由来で
ある。FLは全長の蛋白を示し、矢じりは生殖系列の切
断されたポリペプチドを示す。矢印は分子量マーカーを
キロダルトンで示す。(B)患者GCからのDNAにつ
いてのPCR分析は、障害が腫瘍細胞中の両方のhML
H3対立遺伝子に存在することを示す。cDNA中の欠
損領域の5'側、3'側、またはその中間(MID)を増
幅するプライマーを用いて増幅を行った。レーン1,患
者GCの線維芽細胞由来のDNA;レーン2,患者GC
の腫瘍由来のDNA;レーン3,正常対照患者由来のD
NA;レーン4,DNA鋳型なしの反応。矢印は分子量
を塩基対で示す。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) C12R 1:19) (72)発明者 ウイリアム・エイ・ハセルティン アメリカ合衆国ワシントン・ディーシー 20007、ノースウェスト、ピー・ストリー ト3053番 (72)発明者 スティーブン・エム・ルーベン アメリカ合衆国メリーランド州20832、オ ルネイ、ヘリテイジ・ヒルズ・ドライブ 18528番 (72)発明者 イン−フェイ・ウェイ アメリカ合衆国メリーランド州20878、ダ ーネスタウン、ストロー・ベイル・レーン 13524番 (72)発明者 マーク・ディー・アダムス アメリカ合衆国メリーランド州20878、ノ ース・ポトマック、ドゥフィーフ・ドライ ブ15205番 (72)発明者 ロバート・ディー・フレイシュマン アメリカ合衆国メリーランド州20878、ゲ イザースバーグ、チフェリイ・スクエア・ ロード470番 (72)発明者 クレール・エム・フレーザー アメリカ合衆国メリーランド州20854、ポ トマック、グレン・ミル・ロード11915番 (72)発明者 レベッカ・エイ・フルドナー アメリカ合衆国メリーランド州20838、バ ーネスビル、バーネスビル・ロード18040 番、ボックス306 (72)発明者 ユエン・エフ・カークネス アメリカ合衆国メリーランド州20832、オ ルネイ、リトル・ビスタ・テラス2519番 (72)発明者 クレーグ・エイ・ローゼン アメリカ合衆国メリーランド州20882、レ イトンズビル、ローリング・ヒル・ロード 22400番 Fターム(参考) 4B024 AA11 BA80 CA04 DA06 EA04 GA11 HA12 4B063 QA13 QA19 QA20 QQ08 QQ43 QR32 QR56 QR62 QS25 QS34 4B064 AG01 CA02 CA19 CC24 DA01 DA13 4H045 AA10 BA10 CA40 FA74

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 本明細書に記載されたいずれかの発明。
JP2002016830A 1994-01-27 2002-01-25 ヒト・dnaミスマッチ修復蛋白 Expired - Fee Related JP3752457B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US08/187,757 US6482606B1 (en) 1994-01-27 1994-01-27 Human DNA mismatch repair polynucleotides
US08/187,757 1994-01-27
US08/210,143 US6620619B2 (en) 1994-01-27 1994-03-16 Human DNA mismatch repair protein
US08/210,143 1994-03-16
US08/294,312 1994-08-23
US08/294,312 US6380369B1 (en) 1994-01-27 1994-08-23 Human DNA mismatch repair proteins

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP52016295A Division JP3732509B2 (ja) 1994-01-27 1995-01-25 ヒト・dnaミスマッチ修復蛋白

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005165712A Division JP2005323601A (ja) 1994-01-27 2005-06-06 ヒト・dnaミスマッチ修復蛋白

Publications (2)

Publication Number Publication Date
JP2002325588A true JP2002325588A (ja) 2002-11-12
JP3752457B2 JP3752457B2 (ja) 2006-03-08

Family

ID=27392292

Family Applications (3)

Application Number Title Priority Date Filing Date
JP52016295A Expired - Fee Related JP3732509B2 (ja) 1994-01-27 1995-01-25 ヒト・dnaミスマッチ修復蛋白
JP2002016830A Expired - Fee Related JP3752457B2 (ja) 1994-01-27 2002-01-25 ヒト・dnaミスマッチ修復蛋白
JP2005165712A Withdrawn JP2005323601A (ja) 1994-01-27 2005-06-06 ヒト・dnaミスマッチ修復蛋白

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP52016295A Expired - Fee Related JP3732509B2 (ja) 1994-01-27 1995-01-25 ヒト・dnaミスマッチ修復蛋白

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2005165712A Withdrawn JP2005323601A (ja) 1994-01-27 2005-06-06 ヒト・dnaミスマッチ修復蛋白

Country Status (9)

Country Link
US (3) US6610477B1 (ja)
EP (1) EP0749496A4 (ja)
JP (3) JP3732509B2 (ja)
AU (1) AU697269B2 (ja)
CA (1) CA2182206A1 (ja)
IL (1) IL112453A0 (ja)
MX (1) MX9602977A (ja)
NZ (1) NZ281023A (ja)
WO (1) WO1995020678A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7229755B1 (en) 1993-11-17 2007-06-12 Dana Farber Cancer Institute, Inc. Method for detection of alterations in the DNA mismatch repair pathway
US7396678B1 (en) 1993-11-17 2008-07-08 Dana-Farber Cancer Institute Method for detection of alterations in the DNA mismatch repair pathway
US6191268B1 (en) * 1993-12-17 2001-02-20 Dana-Farber Cancer Institute Compositions and methods relating to DNA mismatch repair genes
CA2182206A1 (en) * 1994-01-27 1995-08-03 William A. Haseltine Human dna mismatch repair proteins
US7022472B2 (en) 1998-10-22 2006-04-04 Diadexus, Inc. Mutations in human MLH1 and human MSH2 genes useful in diagnosing colorectal cancer
US20030130215A1 (en) 2000-09-21 2003-07-10 Ryan James W. Isolated genomic polynucleotide fragments from chromosome 7
WO2002061085A2 (en) 2000-10-31 2002-08-08 Ryan James W Isolated genomic polynucleotide fragments from the p15 region of chromosome 11
US20040235108A1 (en) * 2003-05-23 2004-11-25 Luigi Grasso Monoclonal antibodies that specifically bind a tumor antigen
CA2548813A1 (en) * 2003-12-08 2005-06-23 Morphotek, Inc. Antibodies that specifically bind pms2
JP4805848B2 (ja) 2004-02-12 2011-11-02 モルフォテック、インク. 腫瘍抗原の生物活性を特異的に阻止するモノクローナル抗体
ES2429340T3 (es) * 2005-03-10 2013-11-14 Morphotek, Inc. Anticuerpos anti-mesotelina
WO2006116592A2 (en) * 2005-04-22 2006-11-02 Morphotek, Inc. Antibodies with immune effector activity and that internalize in folate receptor alpha-positive cells
EP2126105A4 (en) * 2007-02-20 2010-11-03 Anaptysbio Inc SOMATIC HYPERPERMUTATION SYSTEMS
US10767222B2 (en) 2013-12-11 2020-09-08 Accuragen Holdings Limited Compositions and methods for detecting rare sequence variants
US11859246B2 (en) 2013-12-11 2024-01-02 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
US11286519B2 (en) 2013-12-11 2022-03-29 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
CN114807323A (zh) 2015-10-09 2022-07-29 安可济控股有限公司 用于富集扩增产物的方法及组合物
EP3458586B1 (en) 2016-05-16 2022-12-28 Accuragen Holdings Limited Method of improved sequencing by strand identification
WO2018035170A1 (en) 2016-08-15 2018-02-22 Accuragen Holdings Limited Compositions and methods for detecting rare sequence variants
US11203782B2 (en) 2018-03-29 2021-12-21 Accuragen Holdings Limited Compositions and methods comprising asymmetric barcoding
US12049665B2 (en) 2018-06-12 2024-07-30 Accuragen Holdings Limited Methods and compositions for forming ligation products

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4737454A (en) 1983-07-14 1988-04-12 Molecular Diagnostics, Inc. Fast photochemical method of labelling nucleic acids for detection purposes in hybridization assays
US5124443A (en) 1989-05-16 1992-06-23 University Of Kansas cDNA clones encoding chicken egg white cystatin
EP0679716A4 (en) 1993-11-12 1999-06-09 Kenichi Matsubara GENE SIGNATURE.
US7229755B1 (en) 1993-11-17 2007-06-12 Dana Farber Cancer Institute, Inc. Method for detection of alterations in the DNA mismatch repair pathway
ATE273387T1 (de) 1993-12-02 2004-08-15 Univ Johns Hopkins Menschliches mutator-gen nmsh2 und seine verbindung zum hereditaren, nichtpolypösen kolorrektalen karzinom
US6191268B1 (en) 1993-12-17 2001-02-20 Dana-Farber Cancer Institute Compositions and methods relating to DNA mismatch repair genes
US5922855A (en) * 1993-12-17 1999-07-13 Oregon Health Sciences University Mammalian DNA mismatch repair genes MLH1 and PMS1
US6380369B1 (en) * 1994-01-27 2002-04-30 Human Genome Sciences, Inc. Human DNA mismatch repair proteins
CA2182206A1 (en) * 1994-01-27 1995-08-03 William A. Haseltine Human dna mismatch repair proteins

Also Published As

Publication number Publication date
CA2182206A1 (en) 1995-08-03
JPH09508280A (ja) 1997-08-26
IL112453A0 (en) 1995-03-30
US20030027177A1 (en) 2003-02-06
JP2005323601A (ja) 2005-11-24
US6610477B1 (en) 2003-08-26
NZ281023A (en) 1998-04-27
AU1733095A (en) 1995-08-15
AU697269B2 (en) 1998-10-01
JP3752457B2 (ja) 2006-03-08
EP0749496A4 (en) 1999-03-03
US6416984B1 (en) 2002-07-09
JP3732509B2 (ja) 2006-01-05
EP0749496A1 (en) 1996-12-27
MX9602977A (es) 1998-01-31
WO1995020678A1 (en) 1995-08-03

Similar Documents

Publication Publication Date Title
JP2005323601A (ja) ヒト・dnaミスマッチ修復蛋白
JP2002300893A (ja) ヒト成長ホルモン
US6380369B1 (en) Human DNA mismatch repair proteins
JPH10509328A (ja) ケラチノサイト増殖因子−2
US5686598A (en) Genes associated with retinal dystrophies
JP2002519027A (ja) 網膜芽腫結合タンパク質(rbp−7)をコードする核酸および前記核酸に関連する多型マーカー
US6620619B2 (en) Human DNA mismatch repair protein
JPH09511140A (ja) スタンニウスの小体の蛋白、スタンニオカルシン
US6010874A (en) Early onset alzheimer&#39;s disease gene and gene products
JPH1057076A (ja) ヒト MutY
JPH10500019A (ja) ヒトのオキサリル−CoAデカルボキシラーゼ
JPH07289297A (ja) 癌抑制遺伝子
CA2376361A1 (en) Prostate cancer-related gene 3 (pg-3) and biallelic markers thereof
JPH11502119A (ja) ヒトb細胞転座遺伝子−2及び3
WO2002004505A1 (fr) Nouveau polypeptide, semaphorine humaine 9, et polynucleotide codant ce polypeptide
US20020102543A1 (en) Novel murine polynucleotide sequences and mutant cells and mutant animals defined thereby
JPH11506309A (ja) ヒトアミン輸送体
JPH09191883A (ja) ヒトNBPhoxタンパク質をコードするDNA
JPH10509320A (ja) ヒトMutT2
JPH09191884A (ja) ヒトneuroDタンパク質をコードするDNA
JPH10508484A (ja) ヒトdnaリガーゼiii
WO2001092518A1 (fr) Nouveau polypeptide, proteine humaine 9.5 associee a la ccr4, et polynucleotide codant ce polypeptide
US20040185442A1 (en) Novel polypeptide-human retinoic acid-responsive protein 53.57 and a polynucleotide encoding the same
WO2001046439A1 (fr) Nouveau polypeptide, proteine dnaj humaine 39, et polynucleotide codant pour ce polypeptide
WO2001073004A1 (fr) Nouveau polypeptide, proteine humaine de liaison du retinaldehyde 39, et polynucleotide codant pour ce polypeptide

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040729

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041207

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050214

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20050218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051212

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091216

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees