JP2002325588A

JP2002325588A - ヒト・ｄｎａミスマッチ修復蛋白

Info

Publication number: JP2002325588A
Application number: JP2002016830A
Authority: JP
Inventors: William A Haseltine; ウイリアム・エイ・ハセルティン; Steven M Ruben; スティーブン・エム・ルーベン; Fei Uei In; イン−フェイ・ウェイ; Mark D Adams; マーク・ディー・アダムス; Robert D Fleischmann; ロバート・ディー・フレイシュマン; Claire M Fraser; クレール・エム・フレーザー; Rebecca A Fuldner; レベッカ・エイ・フルドナー; Ewen F Kirkness; ユエン・エフ・カークネス; Craig A Rosen; クレーグ・エイ・ローゼン
Original assignee: Human Genome Sciences Inc
Current assignee: Human Genome Sciences Inc
Priority date: 1994-01-27
Filing date: 2002-01-25
Publication date: 2002-11-12
Anticipated expiration: 2021-03-08
Also published as: EP0749496A4; EP0749496A1; AU697269B2; US6416984B1; US6610477B1; JPH09508280A; NZ281023A; US20030027177A1; MX9602977A; AU1733095A; JP3752457B2; CA2182206A1; JP3732509B2; WO1995020678A1; IL112453A0; JP2005323601A

Abstract

(57)【要約】【課題】本発明は、ヒト・ＤＮＡ修復蛋白およびかか
る蛋白をコードするＤＮＡ（ＲＮＡ）、さらに組み換え
法によるかかる蛋白の製造方法を開示する。さらに本発
明は、ｈＭＬＨ１、ｈＭＬＨ２およびｈＭＬＨ３遺伝子
における変化を診断する方法を提供する。【解決手段】ｈＭＬＨ１、ｈＭＬＨ２およびｈＭＬＨ
３遺伝子配列ならびにｈＭＬＨ１、ｈＭＬＨ２およびｈ
ＭＬＨ３遺伝子における変化を診断する方法。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、新たに同定された
ポリヌクレオチド、かかるポリヌクレオチドによりコー
ドされるポリペプチド、かかるポリヌクレオチドならび
にポリペプチドの使用、さらにかかるポリヌクレオチド
ならびにポリペプチドの製造に関する。より詳細には、
本発明ポリペプチドは原核細胞のｍｕｔＬ４遺伝子のヒ
ト・相同体であり、以後、ｈＭＬＨ１、ｈＭＬＨ２およ
びｈＭＬＨ３という。

【０００２】

【従来の技術】原核生物および真核生物の両方におい
て、ＤＮＡミスマッチ修復遺伝子は、ＤＮＡ複製および
遺伝学的組み換えの間に生じるエラーの修正において際
立った役割を果たしている。現在までのところ、イー・
コリ（E.coli）のメチル特異的ＤＮＡミスマッチ修復系
は最もよく理解されているＤＮＡミスマッチ修復系であ
る。イー・コリにおいて、この修復経路は、ミューテー
ター遺伝子ｍｕｔＳ、ｍｕｔＬ、ｍｕｔＨおよびｕｖｒ
Ｄの生成を包含している。これらの遺伝子のうちいずれ
か１つの変異体はミューテーター表現型を示すであろ
う。ＭｕｔＳは、この修復プロセスを開始するＤＮＡミ
スマッチ結合蛋白であり、ｕｖｒＤはＤＮＡヘリカーゼ
であり、ＭｕｔＨは、半メチル化ＧＡＴＣ配列の非メチ
ル化鎖を切開する潜在的なエンドヌクレアーゼである。
ＭｕｔＬ蛋白はミスマッチＤＮＡ−ＭｕｔＳ−ＭｕｔＨ
複合体を認識し、これに結合してＭｕｔＨ蛋白のエンド
ヌクレアーゼ活性を増大させる。非メチル化ＤＮＡ鎖が
ＭｕｔＨにより切断された後、１本鎖ＤＮＡ結合蛋白、
ＤＮＡポリメラーゼIII、エキソヌクレアーゼＩおよび
ＤＮＡリガーゼがこの修復プロセスの完了に必要とされ
る（モドリッチ,ピー（Modrich P.）、アニュ・レビュ・
ジェネティクス（Annu.Rev.Genetics）、第２５巻：２
２９〜２５３頁（１９９１年））。

【０００３】イー・コリのＭｕｔＬＨＳ系のエレメント
は、原核生物および真核生物の進化の過程で保存されて
いるように思われる。遺伝学的研究分析は、サッカロマ
イセス・セレビシエ（Saccharomyces cerevisiae）は細
菌のＭｕｔＬＨＳ系と同様のミスマッチ修復系を有する
ことを示唆している。エス・セレビシエ（S.cerevisia
e）において、少なくとも２つのＭｕｔＬ相同体である
ＰＭＳ１およびＭＬＨ１が報告されている。それらのう
ちのいずれかの変異は有糸分裂ミューテーター表現型を
導く（プロラ（Prolla）ら、モレ・セル・バイオロ（Mo
l.Cell.Biol.）第１４巻：４０７〜４１５頁（１９９４
年））。少なくとも３つのＭｕｔＳ相同体、すなわち、
ＭＳＨ１、ＭＳＨ２、およびＭＳＨ３がエス・セレビシ
エにおいて見いだされている。ＭＳＨ２遺伝子の崩壊は
核変異率に影響する。エス・セレビシエにおける変異体
ＭＳＨ２、ＰＭＳ１、およびＭＬＨ１は、ジヌクレオチ
ド繰り返し配列の拡張および濃縮速度を増大させること
が見いだされている（ストランド（Strand）ら、ネイチ
ャー（Nature）、第３６５巻：２７４〜２７６頁（１９
９３年））。

【０００４】肺癌、前立腺癌、卵巣癌、乳癌、結腸癌お
よび胃癌のごとき多くのヒトの腫瘍は繰り返しＤＮＡ配
列の不安定性を示す（ハン(Han)ら、キャンサー（Cance
r）、第５３巻：５０８７〜５０８９頁（１９９３年）；
チボドー（Thibodeau）ら、サイエンス（Science）、第
２０６巻：８１６〜８１９頁（１９９３年）；リシンガ
ー（Risinger）ら、キャンサー（Cancer）、第５３巻：
５１００〜５１０３頁（１９９３年））。この現象は、
おそらくＤＮＡミスマッチ修復の欠乏がこれらの癌の原
因であろうということを示唆する。

【０００５】最近まで、ヒトにおけるＤＮＡミスマッチ
修復系についてはほとんどわかっていないが、ＭｕｔＳ
遺伝子のヒト・相同体がクローン化され、遺伝性非ポリ
ポーシス結腸癌（ＨＮＰＣＣ）の原因であることがわか
った（フィッシェル（Fishel）ら、セル（Cell）第７５
巻：１０２７〜１０３８頁（１９９３年）およびリーチ
（Leach）ら、セル、第７５巻：１２１５〜１２２５頁
（１９９３年））。当初は、ＨＮＰＣＣは、ジヌクレオ
チド不安定性を引き起こす染色体２ｐ１６における遺伝
子座に関連しているとされた。次いで、ＤＮＡミスマッ
チ修復蛋白（ＭｕｔＳ）相同体がこの遺伝子座に位置
し、いくつかの保存的領域におけるＣ→Ｔ過渡的変異が
特異的にＨＮＰＣＣ患者において観察されることが報告
された。遺伝性非ポリポーシス結腸癌はヒトの最もあり
ふれた遺伝病の１つであり、西洋世界においては２００
人に１人が罹患している。

【０００６】遺伝性結腸癌はいくつかの遺伝子座におけ
る変異から生じうることが示されている。染色体５上の
遺伝子に関連している家族性結腸腺腫症ポリポーシス
（ＡＰＣ）は遺伝性結腸癌のごく一部の原因である。遺
伝性結腸癌はガードナー症候群（Gardner's syndrom
e）、ターコット症候群（Turcot's syndrome）、ポイツ
−ジェガーズ症候群（Peutz-Jaeghers syndrome）およ
び幼若結腸ポリポーシスにも関連している。さらに、遺
伝性非ポリポーシス結腸癌はすべてのヒトの癌の５％を
占める。すべての異なるタイプの家族性結腸癌は遺伝の
優性常染色体モードによって伝達されることが示されて
いる。染色体２の短いアームへのＨＮＰＣＣの局在化以
外に、第２の遺伝子座がＨＮＰＣＣ素因に関連していた
（リンドホルム（Lindholm）ら、ネイチャー・ジェネテ
ィクス（Nature Genetics）第５巻：２７９〜２８２頁
（１９３３年））。染色体３の短いアーム上の多形性マ
ーカーとその疾病遺伝子座との間において強力な関連が
示された。この知見は、おそらく、種々のＤＮＡミスマ
ッチ修復蛋白上の変異がヒトの遺伝性の疾患および癌の
発生に重大な役割を果たしていることを示唆する。

【０００７】ＨＮＰＣＣは、結腸、子宮内膜および他の
器官の癌の明らかな常染色体優性的に遺伝する素因によ
って臨床的に特徴づけられる（リンチ,エイチ・ティー
(Lynch,H.T.)ら、ガストロエンテロロジー（Gastroente
rology）、第１０４巻：１５３５〜１５４９頁（１９９
３年））。特定の家族性ＨＮＰＣＣにおける疾病に関連
している２ｐ１６および３ｐ２１〜２２におけるマーカ
ーの同定により、そのメンデル則の性質が明確に確認さ
れた（ペルトマキ,ピー（Peltomaki,P.）ら、サイエン
ス（Science）、第２６０巻：８１０〜８１２頁（１９
９３年））。ＨＮＰＣＣ患者由来の腫瘍は、単純な繰り
返し配列（マイクロサテライト（microsatellites）の
広範な変化により特徴づけられる（アールトネン,エル
・エイ（Aaltonen,L.A.）ら、サイエンス第２６０巻：
８１２〜８１６頁（１９９３年））。このタイプの遺伝
学的不安定性は、もともと、部分集団中（散在性結腸直
腸癌の１２ないし１８％）において観察された（上記文
献）。細菌および酵母における研究により、ＤＮＡミス
マッチ修復遺伝子の欠陥はマイクロサテライトの同様の
不安定性を引き起こす可能性があり（レビンソン,ジー
（Levinson,G.）およびグートマン,ジー・エイ（Gutma
n,G.A.）、ヌクレイック・アシッズ・リサーチ（Nuc.Ac
ids Res.）、第１５巻：５３２５〜５３３８頁（１９８
７年））、ミスマッチ修復の欠損はＨＮＰＣＣの原因で
あると仮定された（ストランド,エム（Strand,M.）ら、
ネイチャー第３６５巻：２７４〜２７６頁（１９９３
年））。ＨＮＰＣＣ腫瘍細胞系からの抽出物の分析によ
り、ミスマッチ修復が実際に欠損しており、この推定を
明確に指示するものであることが示された（パーソン
ズ,アール・ピー（Parsons,R.P.）ら、セル（Cell）、第
７５巻：１２２７〜１２３６頁（１９９３年））。すべ
ての家族性ＨＮＰＣＣが同一の遺伝子座に関連している
わけではなく、そして酵母において少なくとも３つの遺
伝子が同様の表現型を作る可能性があるので、他のミス
マッチ修復遺伝子がＨＮＰＣＣの同じケースにおいて役
割を果たしている可能性があると思われる。

【０００８】ｈＭＬＨ１は、酵母・ｍｕｔＬ−相同体ｙ
ＭＬＨ１と最も相同性が高いが、ｈＭＬＨ２およびｈＭ
ＬＨ３は酵母・ｍｕｔＬ−相同体ｙＰＭＳ１に対してよ
り高い相同性を有する（ｈＭＬＨ２およびｈＭＬＨ３
は、酵母・ＰＭＳ１遺伝子に対するそれらの相同性のた
めに、時々、明細書中でｈＰＭＳ１およびｈＰＭＳ２と
いう）。ｈＭＬＨ１以外にも、染色体２ｑ３２上のｈＭ
ＬＨ２遺伝子および染色体７ｐ２２上のｈＭＬＨ３遺伝
子は、ＨＮＰＣＣ患者の生殖系列において変異している
ことが見いだされた。このことは、ＨＮＰＣＣに関与す
る遺伝子数を２倍にし、この疾病の比較的高い発生率の
説明の一助となる。

【０００９】

【発明が解決しようとする課題】上記事情に鑑みると、
ヒト・ＤＮＡ修復蛋白およびかかる蛋白をコードするＤ
ＮＡ（ＲＮＡ）、さらに組み換え法によるかかる蛋白の
製造方法に対する必要性が生じている。また、ヒト・Ｄ
ＮＡ修復遺伝子における変化を調べる方法も必要となっ
ている。

【００１０】

【課題を解決するための手段および発明の実施の形態】
本発明の１の態様によれば、ｈＭＬＨ１、ｈＭＬＨ２お
よびｈＭＬＨ３である新規な推定上の成熟ポリペプチ
ド、ならびに生物学的に活性があり診断上または治療上
有用なフラグメント、アナログおよびそれらの誘導体が
提供される。本発明ポリペプチドはヒト起源である。本
発明のもう１つの態様によれば、ｍＲＮＡ、ＤＮＡ、ｃ
ＤＮＡ、ゲノムＤＮＡを包含する、かかるペプチド、並
びに生物学的に活性があり診断上または治療上有用なそ
のフラグメント、アナログおよび誘導体をコードする単
離核酸分子が提供される。本発明のさらにもう１つの態
様によれば、ｈＭＬＨ１、ｈＭＬＨ２およびｈＭＬＨ３
配列に特異的にハイブリダイズするに十分な長さの核酸
分子からなる核酸プローブが提供される。

【００１１】本発明のさらにもう１つの態様によれば、
ｈＭＬＨ１、ｈＭＬＨ２またはｈＭＬＨ３核酸配列を含
んでいる組み換え原核および／または真核宿主細胞を、
該蛋白の発現を促進する条件下で培養し、次いで、該蛋
白を回収することからなる、組み換え法によるかかるポ
リペプチドの製造方法が提供される。本発明のさらなる
態様によれば、治療目的、例えば、癌の治療のための、
かかるポリペプチドおよびかかるポリペプチドをコード
するポリヌクレオチドの使用方法が提供される。

【００１２】本発明のもう１つの態様によれば、ｈＭＬ
Ｈ１、ｈＭＬＨ２またはｈＭＬＨ３核酸配列およびかか
る核酸配列によりコードされる蛋白における変異に関連
した疾病の診断方法および該疾病に対する感受性の診断
方法が提供される。本発明のさらなる態様によれば、Ｄ
ＮＡの科学的研究、合成、およびＤＮＡベクターの製造
に関するインビトロ目的の、かかるポリペプチドおよび
かかるポリペプチドをコードするポリヌクレオチドの使
用方法が提供される。本発明のこれらのおよび他の態様
は、本明細書の教示から当業者に明らかである。

【００１３】以下の図面は本発明具体例の説明であり、
請求の範囲により包含される本発明の範囲を限定する意
味はない。図１−６は、ヒト・ＤＮＡ修復蛋白ｈＭＬＨ
１のｃＤＮＡ配列および対応する推定アミノ酸配列を示
す。アミノ酸を標準的な１文字略記法により表す。３７
３自動ＤＮＡシークエンサー（アプライド・バイオシス
テムズ・インコーポレイテッド（Applied Biosystems,I
nc.）を用いて配列決定を行った。配列決定の精度は９
７％より高いと予想される。図７−１４は、ｈＭＬＨ２
のｃＤＮＡ配列および対応する推定アミノ酸配列を示
す。アミノ酸を標準的な１文字略記法により表す。図１
５−２１は、ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。図２２−２４は、ＭＡＣＡＷ（バージ
ョン１.０）プログラムを用いて、エス・セレビシエ
（S.cerevisiae）のＰＭＳ１（ｙＰＭＳ１）の推定アミ
ノ酸配列と、ｈＭＬＨ２ならびにｈＭＬＨ３アミノ酸配
列とを並べたものである。保存性のあるブロックのアミ
ノ酸は大文字で示され、それらのペア−ワイズ・スコア
（pair-wise scores）の平均上に影をつけた。図２５
は、ｈＭＬＨ２の変異分析である。（Ａ）ＨＮＰＣＣ患
者のＣＷにおける転写停止変異に関するＩＶＳＰ分析お
よびマッピング。コドン１から３６９までの翻訳（レー
ン１）、コドン１から２９０までの翻訳（レーン２）、
コドン１から２１４までの翻訳（レーン３）。ＣＷは患
者ＣＷのｃＤＮＡから翻訳され、ＮＯＲは正常個体のｃ
ＤＮＡから翻訳される。矢じりは、潜在的な停止変異に
より切断されたポリペプチドを示す。矢印は分子量マー
カーをキロダルトンで示す。（Ｂ）ＣＷの配列分析によ
り、コドン２３３におけるＣのＴへのトランジション変
異が示される（矢印により示す）。レーン１およびレー
ン３は対照患者由来の配列；レーン２はＣＷのゲノムＤ
ＮＡ由来の配列である。各配列混合物からのｄｄＡ混合
物を隣のレーンに負荷してｄｄＣ、ｄｄＤ、およびｄｄ
Ｔ混合物との比較を容易にする。図２６は、ｈＭＬＨ３
の変異分析である。（Ａ）患者ＧＣからのｈＭＬＨ３の
ＩＶＳＰ分析。レーンＧＣは個体ＧＣの線維芽細胞由
来；レーンＧＣｘは患者ＧＣの腫瘍由来；レーンＮＯＲ
１および２は正常対照個体由来である。ＦＬは全長の蛋
白を示し、矢じりは生殖系列の切断されたポリペプチド
を示す。矢印は分子量マーカーをキロダルトンで示す。
（Ｂ）患者ＧＣからのＤＮＡについてのＰＣＲ分析は、
障害が腫瘍細胞中の両方のｈＭＬＨ３対立遺伝子に存在
することを示す。ｃＤＮＡ中の欠損領域の５'側、３'
側、またはその中間（ＭＩＤ）を増幅するプライマーを
用いて増幅を行った。レーン１,患者ＧＣの線維芽細胞
由来のＤＮＡ；レーン２,患者ＧＣの腫瘍由来のＤＮ
Ａ；レーン３,正常対照患者由来のＤＮＡ；レーン４,Ｄ
ＮＡ鋳型なしの反応。矢印は分子量を塩基対で示す。

【００１４】本発明の１の態様によれば、図１−６、７
−１４および１５−２１（配列番号：２、４および６）
の推定アミノ酸配列を有する成熟ポリペプチドをコード
する単離核酸（ポリヌクレオチド）、またはＡＴＣＣ寄
託物７５６４９、７５６５１、７５６５０として寄託さ
れたクローン（１９９４年１月２５日寄託）のｃＤＮＡ
によりコードされる成熟ポリペプチドをコードする単離
核酸（ポリヌクレオチド）が提供される。ＡＴＣＣ寄
託物７５６４９は、本明細書ではｈＭＬＨ１と呼ばれる
ヒト・ＤＮＡ修復蛋白をコードする全長の配列を含むｃ
ＤＮＡクローンであり；ＡＴＣＣ寄託物７５６５１は、
本明細書ではｈＭＬＨ２と呼ばれるヒト・ＤＮＡ修復蛋
白をコードする全長の配列を含むｃＤＮＡクローンであ
り；ＡＴＣＣ寄託物７５６５０は、本明細書ではｈＭＬ
Ｈ３と呼ばれるヒト・ＤＮＡ修復蛋白をコードする全長
の配列を含むｃＤＮＡクローンである。

【００１５】本発明のポリペプチドをコードするポリヌ
クレオチドを、心臓、肺、前立腺、脾臓、肝臓、胆嚢、
胎児の脳および精巣組織から調製された１種またはそれ
以上のライブラリーから得てもよい。ｈＭＬＨ１のポリ
ヌクレオチドはヒト・胆嚢ｃＤＮＡライブラリーから発
見された。さらに、Ｎ末端においてｈＭＬＨ１と同一で
ある６種のｃＤＮＡクローンが、ヒト・小脳、８週目の
胚、胎児心臓、ＨＳＣ１７２細胞およびジャーケット細
胞（Jurket cell）ｃＤＮＡのライブラリーから得られ
た。ｈＭＬＨ１遺伝子は、細菌および酵母のｍｕｔＬ蛋
白に対して相同性を示す８５ｋＤ蛋白をコードする７５
６アミノ酸の読み取り枠を含んでいる。しかしながら、
その５'非翻訳領域は、オリゴヌクレオチドを設計する
ために非翻訳領域を伸長させる目的で胎児心臓から得た
ｃＤＮＡクローンから得られた。

【００１６】ｈＭＬＨ２遺伝子はヒト・Ｔ細胞リンパ種
ｃＤＮＡライブラリー由来であった。ｈＭＬＨ２のｃＤ
ＮＡクローンは、イン−フレーム（in-frame）停止コド
ンが両側に隣接している２７９６塩基対の読み取り枠を
含むことが同定された。それは酵母のＰＭＳ１ファミリ
ーに構造的に関連している。それは９３４アミノ酸残基
からなる蛋白をコードする読み取り枠を含んでいる。該
蛋白は、蛋白全体に関して、酵母・ＰＭＳ１と２７％の
同一性および８２％の類似性という最高度の相同性を示
す。３種のＰＭＳ関連蛋白の中で有意な相同性のある第
２の領域はカルボキシル末端であり、コドン８００〜９
００にある。この領域は、酵母・ＰＭＳ１蛋白ｈＭＬＨ
２ならびにｈＭＬＨ３蛋白との間において、それぞれ、
２２％および４７％の相同性を有するが、これらの蛋白
と他の酵母・ｍｕｔＬ相同体であるｙＭＬＨ１との間に
おいてはごくわずかな相同性しか観察されなかった。

【００１７】ｈＭＬＨ３遺伝子はヒト・子宮内膜腫瘍ｃ
ＤＮＡライブラリー由来であった。ｈＮＬＨ３クローン
は２５８６塩基対の読み取り枠を有すると同定された。
それは酵母のＰＭＳ２ファミリーに構造的に関連してい
る。それは８６２アミノ酸残基からなる蛋白をコードす
る読み取り枠を含んでいる。該蛋白は、蛋白全体に関し
て、酵母・ＰＭＳ２と３２％の同一性および６６％の類
似性という最高度の相同性を示す。イー・コリ由来のｍ
ｕｔＬ相同体において保存されているＧＦＲＧＥＡＬド
メインが、ｈＭＬＨ１、ｈＭＬＨ２およびｈＭＬＨ３の
アミノ酸配列において保存されていることは、ｈＭＬＨ
１、ｈＭＬＨ２およびｈＭＬＨ３の推定上の同定に関し
て重要である。

【００１８】本発明ポリヌクレオチドはＲＮＡ形態また
はＤＮＡ形態であってよく、該ＤＮＡはｃＤＮＡ、ゲノ
ムＤＮＡおよび合成ＤＮＡを包含する。ＤＮＡは２本鎖
または１本鎖であってよく、１本鎖がコーディング鎖で
あっても非コーディング鎖であってもよい。成熟ポリペ
プチドをコードするコーディング配列は図１−６、７−
１４および１５−２１（配列番号：１）に示すコーディ
ング配列または寄託されたクローンのコーディング配列
と同じであってもよく、あるいは遺伝コードの余剰もし
くは縮重の結果として、コーディング配列が、図１−
６、７−１４および１５−２１（配列番号：２、４およ
び６）のＤＮＡまたは寄託されたｃＤＮＡと同じ成熟ポ
リペプチドをコードしている別のコーディング配列であ
ってもよい。図１−６、７−１４および１５−２１（配
列番号：２、４および６）の成熟ポリペプチドまたは寄
託されたｃＤＮＡによりコードされる成熟ポリペプチド
をコードするポリヌクレオチドは、成熟ポリペプチドに
関するコーディング配列のみ；成熟ポリペプチドに関す
るコーディング配列（ならびに所望によりさらなるコー
ディング配列も）およびイントロンもしくは成熟ポリペ
プチドに関する配列の５'および／または３'側の非コー
ディング配列のごとき非コーディング配列を包含する。
よって、用語「ポリペプチドをコードするポリヌクレオ
チド」は、ポリペプチド、並びにさらなるコーディング
配列および／または非コーディング配列を含むポリヌク
レオチドを包含する。

【００１９】さらに本発明は、図１−６、７−１４およ
び１５−２１（配列番号：２、４および６）の推定アミ
ノ酸配列を有するポリペプチドまたは寄託されたクロー
ンのｃＤＮＡによりコードされるポリペプチドのフラグ
メント、アナログおよび誘導体をコードする上記ポリヌ
クレオチドの変異体に関する。ポリヌクレオチドの変異
体は天然に存在するポリヌクレオチド対立遺伝子変異体
または天然に存在しないポリヌクレオチドの変異体であ
ってよい。よって、本発明は、図１−６、７−１４およ
び１５−２１（配列番号：２、４および６）に示すもの
と同じ成熟ポリペプチドをコードするポリヌクレオチド
または寄託されたクローンのｃＤＮＡによりコードされ
るのと同じ成熟ポリペプチドをコードするポリヌクレオ
チド、並びに図１−６、７−１４および１５−２１（配
列番号：２、４および６）に示すものと同じ成熟ポリペ
プチドまたは寄託されたクローンのｃＤＮＡによりコー
ドされるのと同じ成熟ポリペプチドのフラグメント、誘
導体またはアナログをコードするかかるポリヌクレオチ
ドの変異体を包含する。かかるヌクレオチド変異体は、
欠失変異体、置換変異体および付加もしくは挿入変異体
を包含する。上記のごとく、ポリヌクレオチドは、図１
−６、７−１４および１５−２１（配列番号：１、３お
よび５）に示すコーディング配列または寄託されたクロ
ーンのコーディング配列の天然に存在する対立遺伝子変
異体であるコーディング配列を有していてもよい。当該
分野において知られているように、対立遺伝子変異種
は、１個またはそれ以上のヌクレオチドの置換、欠失ま
たは付加を有していてもよいポリヌクレオチド配列のも
う１つの形態であり、コードされるポリペプチドの機能
を実質的に変化させない。

【００２０】さらに本発明ポリヌクレオチドは、本発明
ポリペプチドの精製を可能にするマーカー配列にイン−
フレーム（in-frame）で融合したコーディング配列を有
していてもよい。マーカー配列は、例えば、細菌宿主の
場合にマーカーに融合した成熟ポリペプチドの精製を行
うためのｐＱＥ−９ベクターにより提供されるヘキサ−
ヒスチジンタグ（hexa-histidine tag）であってもよ
く、あるいは、例えば、哺乳動物宿主、例えばＣＯＳ−
７細胞を用いる場合には、マーカー配列がヘマグチニン
（ＨＡ）タグであってもよい。ＨＡタグは、インフルエ
ンザ・ヘマグルチニン蛋白由来のエピトープに対応する
（ウィルソン,アイ（Wilson,I.）ら、セル、第３７巻：
７６７頁（１９８４年））。

【００２１】さらに本発明は、少なくとも５０％、好ま
しくは７０％の配列間同一性がある場合に、上記配列と
ハイブリダイズするポリヌクレオチドに関する。詳細に
は、本発明は、厳密な条件下で上記ポリヌクレオチドに
ハイブリダイズするポリヌクレオチドに関する。本明細
書の用語「厳密な条件」は、少なくとも９５％、好まし
くは少なくとも９７％の配列間同一性がある場合にのみ
ハイブリダイゼーションが起こることを意味する。好ま
しい具体例において、上記ポリヌクレオチドにハイブリ
ダイズするポリヌクレオチドは、図１−６、７−１４お
よび１５−２１（配列番号：１、３および５）のｃＤＮ
Ａまたは寄託されたｃＤＮＡによりコードされる成熟ポ
リペプチドと実質的に同じ生物学的機能または活性を保
持しているポリペプチドをコードする。

【００２２】本明細書にいう寄託物とは、特許手続き上
の微生物の寄託の国際的承認に関するブダペスト条約の
下に維持されるものを意味する。これらの寄託物は当業
者の便宜のためのみに提供され、寄託物が３５Ｕ.Ｓ.
Ｃ.§１１２の下で必要とされるという承認ではない。
寄託された材料中に含まれるポリヌクレオチドの配列、
ならびにそれによりコードされるポリペプチドのアミノ
酸配列は、参照により本明細書に記載されているものと
見なされ、本明細書の配列の記載との矛盾のイベントに
おいて支配的である。該寄託材料の製造、使用または販
売にはライセンスが必要でありうるし、かかるライセン
スをここで認める。

【００２３】さらに本発明は、図１−６、７−１４およ
び１５−２１（配列番号：２、４および６）の推定アミ
ノ酸配列を有するポリペプチド、または寄託されたｃＤ
ＮＡによりコードされるアミノ酸配列を有するポリペプ
チド、並びにかかるポリペプチドのフラグメント、アナ
ログおよび誘導体に関する。図１−６、７−１４および
１５−２１（配列番号：２、４および６）のポリペプチ
ドまたは寄託ｃＤＮＡによりコードされるポリペプチド
をいう場合、「フラグメント」、「誘導体」および「ア
ナログ」は、かかるポリペプチドと実質的に同じ生物学
的機能または活性を有するポリペプチドを意味する。よ
って、アナログは、プロ蛋白部分の開裂により活性化さ
れて活性成熟ポリペプチドを生じうるプロ蛋白を包含す
る。本発明ポリペプチドは、組み換えポリペプチド、
天然ポリペプチドまたは合成ポリペプチドであってよ
く、好ましくは組み換えポリペプチドである。図１−
６、７−１４および１５−２１（配列番号：２、４およ
び６）のポリペプチドまたは寄託ｃＤＮＡによりコード
されるポリペプチドのフラグメント、誘導体またはアナ
ログは、（i）１個またはそれ以上のアミノ酸残基が保
存的もしくは非保存的アミノ酸残基（好ましくは保存性
残基）で置換されているもの（かかる置換アミノ酸残基
は遺伝コードによりコードされていてもよく、あるいは
されていなくてもよい）、あるいは（ii）１個またはそ
れ以上のアミノ酸残基が置換基を有するもの、あるいは
（iii）成熟ポリペプチドが、ポリペプチドの半減期を
延ばす化合物のごとき別の化合物（例えば、ポリエチレ
ングリコール）に融合しているもの、であってもよい。
かかるフラグメント、誘導体およびアナログは本明細書
の教示から、当業者の範囲内にあると思われる。好まし
くは、本発明のポリペプチドおよびポリヌクレオチドは
単離形態であり、好ましくは均一に精製される。

【００２４】用語「単離」は、物質がその元の環境（例
えば、天然に存在する場合には天然環境）から取り出さ
れていることを意味する。例えば、生きた動物中に存在
する天然のポリヌクレオチドまたはポリペプチドは単離
されなが、天然系において同時に存在する物質のいくつ
かまたはすべてから分離された同じポリヌクレオチドま
たはポリペプチドは単離される。かかるポリヌクレオチ
ドはベクターの一部でありうるし、さらに／またはかか
るポリヌクレオチドまたはポリペプチドは組成物の一部
でありうるし、さらにかかるベクターまたは組成物がそ
の天然環境の一部分でないという点で単離されうる。

【００２５】本発明はまた、本発明ポリヌクレオチドを
含むベクター、本発明ベクターで遺伝学的に操作された
宿主細胞、および組み換え法による本発明ポリペプチド
の製造に関する。例えば、クローニングベクターまたは
発現ベクターであってもよい本発明ベクターで宿主細胞
を遺伝学的に操作する。例えば、ベクターは、プラスミ
ド、ウイルス粒子、ファージ等の形態であってもよい。
プロモーターを活性化し、形質転換体を選択し、あるい
はｈＭＬＨ１、ｈＭＬＨ２およびｈＭＬＨ３遺伝子を増
幅するのに適するように修飾された慣用的な栄養培地中
で操作された宿主細胞を培養する。温度、ｐＨ等のごと
き培養条件は、発現用に選択された宿主細胞に関して以
前用いられたものであり、当業者に明らかであろう。組
み換え法によるポリペプチドの製造のために本発明ポリ
ヌクレオチドを用いてもよい。よって、例えば、ポリヌ
クレオチドが、ポリヌクレオチド発現のための種々の発
現ベクターのいずれか１つに含有されていてもよい。か
かるベクターは、染色体、非染色体および合成ＤＮＡ配
列、例えば、ＳＶ４０誘導体；細菌プラスミド；ファー
ジＤＮＡ；バキュロウイルス；酵母プラスミド；プラス
ミドならびにファージのＤＮＡの組み合わせ由来のベク
ター；ワクチニア、アデノウイルス、伝染性上皮腫ウイ
ルスならびに偽狂犬病のごときウイルスＤＮＡを包含す
る。しかしながら、宿主中で複製可能で製造可能である
限り、他のいずれのベクターであっても使用できる。種
々の方法により適当なＤＮＡ配列をベクター中に挿入す
ることができる。一般的には、当該分野において知られ
た方法によりＤＮＡ配列を適当な制限エンドヌクレアー
ゼ部位中に挿入する。かかる方法および他の方法は当業
者の範囲内であると思われる。発現ベクター中のＤＮＡ
配列は、ｍＲＮＡ合成を指令するための適当な発現調節
配列（プロモーター）に作動可能に結合している。かか
るプロモーターの代表例として、ＬＴＲもしくはＳＶ４
０プロモーター、イー・コリのｌａｃもしくはｔｒｐ、
ラムダファージＰＬプロモーター、および原核細胞また
は真核細胞あるいはそのウイルス中で遺伝子の発現を調
節することが知られている他のプロモーターが挙げられ
る。また、発現ベクターは、翻訳介しのためのリボゾー
ム結合部位および転写ターミネーターを含んでいる。ま
た、ベクターが、発現を増幅するための適当な配列を含
んでいてもよい。さらに、好ましくは、発現ベクター
は、形質転換宿主細胞の選択のための表現型の特徴を提
供する１個またはそれ以上の選択可能なマーカー遺伝
子、例えば、真核細胞培養についてジヒドロ葉酸レダク
ターゼまたはネオマイシン耐性遺伝子、あるいはイー・
コリにおいてはテトラサイクリンまたはアンピシリン耐
性遺伝子を含んでいる。

【００２６】上記の適当なＤＮＡ配列ならびに適当なプ
ロモーターもしくは調節配列を含有するベクターを用い
て適当な宿主を形質転換して、宿主が蛋白を発現しうる
ようにする。適当な宿主の代表例としては、イー・コリ
（E.coli）、ストレプトマイセス（Streptomyces）、サ
ルモネラ・ティフィムリウム（Salmonella typhimuriu
m）のごとき細菌細胞；酵母のごとき真菌細胞；ドロソ
フィラ（Drosophila）Ｓ２ならびにスポドプテラ（Spod
optera）Ｓｆ９のごとき昆虫細胞；ＣＨＯ、ＣＯＳもし
くはボウズ・メラノーマ（Bowes melanoma）；アデノウ
イルス；植物細胞等が挙げられる。適当な宿主の選択
は、本明細書の教示から、当業者の範囲内であると思わ
れる。より詳細には、さらに本発明は、上記で広く述べ
た１またはそれ以上の配列からなる組み換え構築物を包
含する。該構築物はプラスミドまたはウイルスベクター
のごときベクターからなり、その中へ本発明配列が順方
向または逆方向に挿入されている。この具体例の好まし
い態様において、さらに構築物は、例えば、該配列に作
動可能に結合したプロモーターを包含する調節配列から
なる。多数の適当なベクターおよびプロモーターが当業
者に知られており、市販されている。以下のベクター
を、実施例を用いて提供する。細菌のもの：ｐＱＥ７
０、ｐＱＥ６０、ｐＱＥ−９（キアジェン・インコーポ
レイテッド（Qiagen,Inc.）、ｐｂｓ、ｐＤ１０、phage
script、ｐｓｉＸ１７４、pbluescript SK、ｐｂｓｋ
ｓ、ｐＮＨ８Ａ、ｐＮＨ１６ａ、ｐＮＨ１８Ａ、ｐＮＨ
４６Ａ（ストラタジーン（Stratagene））；ｐｔｒｃ９
９ａ、ｐＫＫ２２３−３、ｐＫＫ２３３−３、ｐＤＲ５
４０、ｐＲＩＴ５（ファルマシア（Pharmacia））。真
核細胞のもの：ｐＷＬＮＥＯ、ｐＳＶ２ＣＡＴ、ｐＯＧ
４４、ｐＸＴ１、ｐＳＧ（ストラタジーン）、ｐＳＶＫ
３、ｐＢＰＶ、ｐＭＳＧ、ｐＳＶＬ（ファルマシア）。
しかしながら、宿主中で複製可能で製造可能である限
り、他のいずれのベクターであっても使用できる。ＣＡ
Ｔ（クロラムフェニコールトランスフェラーゼ）ベクタ
ーまたは選択可能マーカーを有する他のベクターを用い
て、プロモーター領域をいずれの所望遺伝子からであっ
ても選択することができる。２つの適当なベクターはｐ
ＫＫ２３２−８およびｐＣＭ７である。特別に命名され
た細菌プロモーターは、ｌａｃＩ、ｌａｃＺ、Ｔ３、Ｔ
７、ｇｐｔ、ラムダＰＲ、ＰＬおよびＴＲＰを包含す
る。真核プロモーターは、ＣＭＶ即時初期、ＨＳＶチミ
ジンキナーゼ、初期ならびに後期ＳＶ４０、レトロウイ
ルス由来のＬＴＲｓ、およびマウス・メタロチオネイン
−Ｉを包含する。適当なベクターおよびプロモーターの
選択は、十分に当業者の通常のレベルである。

【００２７】さらなる具体例において、本発明は、上記
構築物を含有する宿主細胞に関する。該宿主細胞は、哺
乳動物のごとき高等真核細胞であってもよく、あるいは
酵母細胞のごとき下等真核細胞でってもよく、また、宿
主細胞は細菌細胞のごとき原核細胞であってもよい。宿
主細胞中への構築物の導入を、リン酸カルシウムトラン
スフェクション、ＤＥＡＥ−デキストランによるトラン
スフェクション、またはエレクトロポーレーション（デ
イビス,エル（Davis,L.）、ディブナー,エム（Dibner,
M.）、バティー,アイ（Battey,I.）、ベイシック・メソ
ッズ・イン・モレキュラー・バイオロジー（Basic Meth
ods in Molecular Biology）（１９８６年））により行
うことができる。宿主細胞中の構築物を慣用的方法で使
用して組み換え配列によりコードされた遺伝子産物を製
造することができる。別法として、慣用的ペプチド合成
装置により、本発明ポリペプチドを合成的に製造するこ
ともできる。

【００２８】適当なプロモーターの調節下において、成
熟蛋白を、哺乳動物細胞、酵母、細菌、または他の細胞
において発現させることができる。本発明ＤＮＡ構築物
由来のＲＮＡを用い、無細胞翻訳系を用いてかかる蛋白
を製造してもよい。原核および真核宿主について用いる
適当なクローニングおよび発現ベクターは、サムブルッ
ク（Sambrook）ら、モレキュラー・クローニング；ア・
ラボラトリー・マニュアル（Molecular Cloning:A Labo
ratory Manual）、第２版、コールド・スプリング・ハ
ーバー（Cold Spring Harbor）、Ｎ.Ｙ.（１９８９年）
により記載されており、参照により該開示を本明細書に
記載されているものと見なす。本発明ポリペプチドをコ
ードしているＤＮＡの高等真核生物による転写を、ベク
ター中にエンハンサー配列を挿入することにより増大さ
せる。エンハンサーはＤＮＡのシス作用性エレメントで
あり、通常は、約１０ないし３００ｂｐであり、プロモ
ーターに作用してその転写を増大させる。例は、複製開
始点の後期側の１００ないし２７０ｂｐのＳＶ４０エン
ハンサー、サイトメガロウイルスの初期プロモーターエ
ンハンサー、複製開始点の後期側のポリオーマエンハン
サー、およびアデノウイルスエンハンサーを包含する。
一般的には、組み換え発現ベクターは、複製開始点およ
び宿主細胞の形質転換を可能にするイー・コリのアンピ
シリン耐性遺伝子ならびにエス・セレビシエのＴＲＰ１
遺伝子のごとき選択可能マーカー、および下流の構造配
列の転写を指令する高発現遺伝子由来のプロモーターを
含んでいる。かかるプロモーターは、３−ホスホグリセ
レートキナーゼ（ＰＧＫ）、α−因子、酸ホスファター
ゼ、または特に熱ショック蛋白をコードするオペロン由
来であってもよい。異種構造配列を、翻訳開始ならびに
ターミネーション配列とともに適当なフェーズ（phas
e）中に集める。所望により、異種配列が、例えば、発
現組み換え産物の安定化または精製簡単化のごとき所望
の特徴を付与するＮ末端同定ペプチドを含んでいる融合
蛋白をコードしていてもよい。

【００２９】所望蛋白をコードする構造ＤＮＡ配列を適
当な翻訳開始ならびにターミネーションシグナルととも
に、機能的プロモーターを伴った作動可能なリーディン
グフェーズ（reading phase）中に挿入することによ
り、細菌での使用に有用な発現ベクターを構築する。ベ
クターは、１個またはそれ以上の表現型の選択可能マー
カーおよびベクターの維持を確実なものにし、所望であ
れば宿主中での増幅を可能にする複製開始点からなるで
あろう。形質転換に適する原核宿主は、イー・コリ、バ
チルス・ズブチリス（Bacillus subtilis）、サルモネ
ラ・ティフィムリウムおよびシュードモナス（Pseudomo
nas）属、ストレプトマイセス属、およびスタフィロコ
ッカス（Staphylococcus）属の種々の種を包含するが、
他のものも選択の対象でありうる。代表的であるが限定
的でない例において、細菌での使用に有用なベクター
は、選択可能マーカーおよびよく知られたクローニング
ベクターｐＢＲ３２２（ＡＴＣＣ３７０１７）の遺伝エ
レメントよりなる市販プラスミド由来の細菌の複製開始
点からなる。かかる市販ベクターは、例えば、ｐＫＫ２
２３−３（スゥエーデン、ウプサラ（Uppsala）のファ
ルマシア・ファイン・ケミカルズ（Pharmacia Fine Che
micals））およびＧＥＭ１（アメリカ合衆国、ウィスコ
ンシン州、マジソン（Madison）のプロメガ・バイオテ
ク（Promega Biotech））を包含する。これらのｐＢＲ
３２２「骨格」部分を適当なプロモーターおよび発現す
べき構造配列と結合する。適当な宿主株の形質転換、次
いで、適当な細胞密度に至る宿主株の増殖後、適当な手
段（例えば、温度シフトまたは化学的誘導）により選択
プロモーターを誘導し、適当時間細胞を培養する。典型
的には、細胞を遠心分離により収穫し、物理的または化
学的手段により破壊し、次いで、得られた粗抽出物をさ
らなる精製のために取っておく。凍結−融解の繰り返
し、超音波処理、機械的破壊、または細胞溶解剤の使用
を包含するいずれの慣用的な方法によっても蛋白発現に
用いる微生物細胞を破壊することができ、かかる方法は
当業者によく知られている。

【００３０】種々の哺乳動物細胞培養系を用いて組み換
え蛋白を発現させることもできる。哺乳動物発現系の例
は、グルツマン（Gluzman）、セル、第２３巻：１７５
頁（１９８１年）により記載されたサル・腎臓線維芽細
胞のＣＯＳ−７細胞系、およびＣ適合ベクターを発現さ
せる能力のある他の細胞系、例えば、Ｃ１２７、３Ｔ
３、ＣＨＯ、ＨｅＬａおよびＢＨＫ細胞系を包含する。
哺乳動物発現ベクターは、複製開始点、適当なプロモー
ターならびにエンハンサー、および必要とされるいずれ
かのリボゾーム結合部位、ポリアデニレーション部位、
スプライスドナーならびにアクセプター部位、転写ター
ミネーション配列、および５'フランキング非転写配列
からなるであろう。ＳＶ４０スプライス由来のＤＮＡ配
列、およびポリアデニレーション部位を用いて必要な非
転写遺伝エレメントを提供してもよい。

【００３１】硫酸アンモニウムまたはエタノール沈殿、
酸抽出、アニオンもしくはカチオン交換クロマトグラフ
ィー、ホスホセルロースクロマトグラフィー、疎水性相
互作用クロマトグラフィー、アフィニティークロマトグ
ラフィー、ヒドロキシアパタイトクロマトグラフィーお
よびレクチンクロマトグラフィーを包含する方法によ
り、組み換え細胞培養物からポリペプチドを回収し精製
することができる。成熟蛋白の配置の完成において必要
に応じて蛋白再生工程を用いることができる。最後に、
最終精製工程として高品質液体クロマトグラフィー（Ｈ
ＰＬＣ）を用いることができる。本発明ポリペプチドは
当然に精製された生成物であってもよく、あるいは化学
合成法の生成物であってもよく、あるいは原核もしくは
真核宿主から組み換え法により製造されてもよい（例え
ば、培養された細菌、酵母、高等植物、昆虫および哺乳
動物細胞）。組み換え製造法に用いる宿主に応じて、本
発明ポリペプチドはグリコシレーションされていてもよ
く、あるいはされていなくてもよい。

【００３２】本発明のさらなる態様において、ガン、詳
細には、遺伝性のガンに対する感受性の決定方法が提供
される。よって、ヒト・ｍｕｔＬの相同体であるヒト・
修復蛋白、さらに詳細には本明細書に記載のヒト・修復
蛋白における変異はガンに他する感受性を示すものであ
り、かかるヒト・相同体をコードする核酸配列をかかる
感受性の確認のためのアッセイに用いてもよい。よっ
て、例えば、該アッセイを用いて本明細書記載のヒト・
ＤＮＡ修復蛋白における欠失、切断、挿入、フレームシ
フト等のごとき変異を決定してもよく、かかる変異はガ
ン素因の指示となるものである。例えば、ＤＮＡ配列決
定アッセイにより変異を確認してもよい。血液試料（こ
れに限定しない）を包含する組織試料をヒト・患者から
得る。試料を当該分野のいて知られた方法により処理し
てＲＮＡを得る。ｍＲＮＡ上に存在するポリアデノシン
伸長部分にハイブリダイズするポリチミジン残基からな
るオリゴヌクレオチドプライマーを添加することにより
第１鎖ｃＤＮＡをＲＮＡ試料から合成する。逆転写酵素
およびデオキシヌクレオチドを添加して第１鎖ＤＮＡの
合成を行う。本発明ＤＮＡ修復蛋白のＤＮＡ配列に基づ
いてプライマー配列を合成する。一般的には、プライマ
ー配列は１５ないし３０個、好ましくは１８ないし２５
個のヒト・ＤＮＡ修復遺伝子の連続した塩基からなる。
表１は、ｈＭＬＨ１に基づくオリゴヌクレオチドプライ
マー配列の実例を示す。該プライマーをペアー（１の
「センス」鎖および１の「アンチセンス鎖」)にして用
いてＰＣＲ法（サイキ（Saiki）ら、ネイチャー、第３
２４巻：１６３〜１６６頁（１９８６年））により患者
からのｃＤＮＡを増幅して、かかる蛋白に対する患者の
ｃＤＮＡの３種の重複フラグメントを得る。また表１は
好ましいプライマー配列ペアーのリストを示す。次い
で、遺伝子全体のうちの約２００塩基対の各ポイントに
おけるｃＤＮＡの塩基対に対応するように合成されたプ
ライマー配列のセットを用いて、重複フラグメントをジ
デオキシ法に供する。

【００３３】

【表１】 *図１−６のヌクレオチド配列に沿った位置に対応する
数であり、ＡＴＧは１である。

【００３４】好ましいプライマー配列ペアーは：７５８、１３１３１３１９、１３２０６６０、１９０９７２５、１９９５１６８０、２５３６１７２７、２６１０表１に示すヌクレオチド配列は、それぞれ配列番号：７
から配列番号：１９までのものを表す。

【００３５】表２は、使用できるオリゴヌクレオチドプ
ライマー配列の代表例（センスおよびアンチセンス）を
掲載するものであり、好ましくは、プライマー配列の全
セットを配列決定に用いて、患者のＤＮＡ修復蛋白にお
ける変異がどの部分に存在するかを決定する。プライマ
ー配列は１５ないし３０塩基の長さであり、好ましくは
１８ないし２５塩基の間の長さである。次いで、患者か
ら決定された配列の情報を変異していない配列と比較し
て変異が存在するかどうかを決定する。

【００３６】

【表２】 *図１−６のヌクレオチド配列に沿った位置に対応する
数であり、ＡＴＧは１である。表２に示すヌクレオチド
配列は、それぞれ配列番号：２０から配列番号：３３ま
でのものを表す。

【００３７】もう１つの具体例において、表２のプライ
マー配列をＰＣＲ法に用いて変異領域を増幅することが
できた。該領域を配列決定し、かかる変異遺伝子素因を
予想するための診断として用いることができた。別法と
して、変性剤の存在下または不存在下におけるゲル中の
ＤＮＡフラグメントの電気泳動度の変化を検出すること
により行われるＤＮＡ配列の相違に基づく遺伝学的試験
により、本発明遺伝子における変異に対するアッセイを
行ってもよい。高分解能ゲル電気泳動により、小規模の
配列欠失および挿入を可視化することができる。特異的
融点または部分的融点によってゲル中の異なる位置で異
なるＤＮＡフラグメントの移動が妨害される変性ホルム
アミドグラジエントゲルにより、異なる配列のＤＮＡフ
ラグメントを識別してもよい（例えば、メイヤーズ（Me
yers）ら、サイエンス、第２３０巻：１２４２頁（１９
８５年）参照）。ＲＮａｓｅおよびＳ１プロテクション
のごときヌクレアーゼプロテクションアッセイまたは化
学的開裂法（例えば、コットン（Cotton）ら、ＰＮＡ
Ｓ,ＵＳＡ、第８５巻：４３９７〜４４０１頁（１９８
５年））により、特定の位置における配列の変化を明ら
かにしてもよい。ＲＮａｓｅ消化または融点の相違によ
り、完全にマッチした配列をミスマッチの２本鎖から識
別することができる。よって、ハイブリダイゼーショ
ン、ＲＮａｓｅプロテクション、化学的開裂、ウェスタ
ンブロット分析、直接的ＤＮＡ配列決定または制限酵素
の使用（例えば、制限フラグメント長多型性（ＲＦＬ
Ｐ））およびゲノムＤＮＡのサザンブロッティングのご
とき方法によって、特定のＤＮＡ配列の検出を行うこと
ができる。より慣用的なゲル電気泳動および配列決定の
ほかに、インシトゥ（in situ）分析により変異を検出
することもできる。

【００３８】ポリペプチドを用い、かかるポリペプチド
のインビボ（in vivo）発現により癌を治療し、あるい
は癌を予防してもよく、これを、しばしば、「遺伝子治
療」という。よって、例えば、患者からの細胞をエクス
ビボ（ex vivo）でポリペプチドをコードするポリヌク
レオチド（ＤＮＡまたはＲＮＡ）を用いて操作し、次い
で、該ポリペプチドで治療すべき患者に該操作された細
胞を提供する。例えば、本発明ポリペプチドをコードす
るＲＮＡを含むレトロウイルス粒子を用いることによ
り、当該分野において知られた方法により細胞を操作し
てもよい。同様に、例えば、当該分野において知られた
方法により、インビボでのポリペプチド発現よってに細
胞をインビボで操作してもよい。当該分野において知ら
れているように、本発明ポリペプチドをコードするＲＮ
Ａを含むレトロウイルス粒子の生産用プロデューサー細
胞を、インビボでの細胞の操作およびインビボでのポリ
ペプチドの発現のために患者に投与してもよい。かかる
方法による本発明ポリペプチド投与のためのこれらの方
法および他の方法は、本発明の教示から当業者に明らか
であるはずである。例えば、細胞の操作用の発現ビヒク
ルはレトロウイルス以外のものであってもよく、例え
ば、適当な送達ビヒクルと組み合わせた後でインビボで
の細胞の操作に用いられるアデノウイルスであってもよ
い。

【００３９】本明細書において同定された各ｃＤＮＡ配
列またはその一部分を、ポリヌクレオチド試薬として、
多様な方法で使用することができる。該配列を特定の細
胞タイプにおける特定のｍＲＮＡの存在に関する診断プ
ローブとして該配列を用いることができる。さらに、遺
伝学的連関分析（多形性）における使用に適した診断プ
ローブとしてこれらの配列を用いることができる。ま
た、本発明配列は染色体の同定に価値がある。該配列は
特異的に標的化され、個々のヒト・染色体の特定の位置
にハイブリダイズしうる。そのうえ、染色体上の特定部
位を同定する必要が現在ある。実際の配列データ（繰り
返し多型性）に基づくわずかの染色体マーキング試薬が
染色体位置のマーキングに用いられている。本発明の染
色体に対するＤＮＡのマッピングは、それらの配列を疾
病に関連した遺伝子と関連づけることにおける重要な第
１工程である。簡単に説明すると、ｃＤＮＡからＰＣＲ
プライマー（好ましくは、１５〜２５ｂｐ）を調製する
ことにより、配列を染色体に対してマッピングすること
ができる。３'非翻訳領域のコンピューター分析を用い
て、ゲノムＤＮＡ中の１個より多いエキソンをまたがな
いプライマーを迅速に選択し、かくして、増幅プロセス
を複雑になる。次いで、これらのプライマーを、個々の
ヒト・染色体を含む体細胞ハイブリッドのＰＣＲスクリ
ーニングに用いる。プライマーに対応するヒト・遺伝子
を含むハイブリッドのみが増幅フラグメントを生じるで
あろう。

【００４０】体細胞ハイブリッドのＰＣＲマッピング
は、特定の染色体に対して特定のＤＮＡを帰属するため
の迅速方法である。同じオリゴヌクレオチドプライマ−
について本発明を用いて、特定の染色体または大規模な
ゲノムクローンのプールからのフラグメントのパネルに
ついて、同様の方法で、下位の位置決めを行うことがで
きる。同様に用いてその染色体に対してマッピングでき
る他のマッピング法は、インシトゥ・ハイブリダイゼー
ション、標識フロー−ソーティッド染色体（labeled fl
ow-sorted chromosomes）でのプレスクリーニングおよ
び染色体特異的ｃＤＮＡライブラリー構築のためのハイ
ブリダイゼーションによるプレセレクションを包含す
る。中期染色体スプレッド（spread）に対するｃＤＮＡ
クローンの蛍光インシトゥハイブリダイゼーション（Ｆ
ＩＳＨ）を用いて１工程で正確な染色体上の位置がわか
る。この方法は５００また６００塩基程度の短いｃＤＮ
Ａについて用いることができる。しかしながら、それよ
りも長いクローンは、ユニークな染色体上の位置に結合
して簡単な検出のための十分なシグナルを発する可能性
がある。ＦＩＳＨは、発現配列ｔａｇまたはＥＳＴが由
来するクローンの使用を必要とし、クローンが長いほど
よい。例えば、２０００ｂｐがよく、４０００ｂｐがよ
りよいが、４０００ｂｐよりも長いものは、合理的なパ
ーセンテージで良好な結果を得るにはおそらく必要ない
であろう。この方法のレビューのためには、バーマ（Ve
rma）ら、ヒューマン・クロモゾームズ：ア・マニュア
ル・オブ・ベイシック・テクニックス（Human Chromoso
mes:a Manual of Basic Techniques）、パーガモン・プ
レス（Pergamon Press）、ニューヨーク（１９８８年）
参照。正確な染色体上の位置に配列をマッピングしたな
らば、染色体上の配列の物理的位置を遺伝学的マップの
データを用いて修正することができる。かかるデータ
は、例えば、ブイ・マクシック（V.McKusick）、メンデ
リアン・インヘリタンス・イン・マン（Mendelian Inhe
ritance in Man）（ジョーンズ・ホプキンス（Jones Ho
pkins）大学のウェルチ・メディカルライブラリー（Wel
ch Medical Library）からオンラインで利用できる）に
おいて見いだされる。次いで、同じ染色体領域にマッピ
ングされた遺伝子と疾病との間の関係を、連関分析（物
理的に隣接した遺伝子の同時遺伝）により確認する。次
いで、罹患した個体と罹患していない個体との間のｃＤ
ＮＡまたはゲノム配列の相違を決定することが必要であ
る。変異が罹患した個体のいくつかまたはすべてにおい
て観察され、正常個体には観察されない場合には、該変
異は該疾病の原因である可能性がある。現在の物理的マ
ッピングの分解能および遺伝学的マッピング方法では、
疾病に関連した１の染色体領域に正確に位置するｃＤＮ
Ａは５０ないし５００個の原因遺伝子のうちの１個であ
る可能性がある（このことは、１メガベースのマッピン
グ分解能であり、２０ｋｂあたり１個の遺伝子であると
仮定してのことである）。

【００４１】ｈＭＬＨ２遺伝子の５'領域を含むゲノム
Ｐ１クローン（１６７０）を用いてｈＭＬＨ２の局在化
が示された。バンディング（banding）を明らかにする
ために対比染色されたヒト・中期染色体スプレッドの詳
細な分析により、ｈＭＬＨ２遺伝子がバンド２ｐ３２中
に存在することが示された。同様に、ｈＭＬＨ３遺伝子
の３'領域を含むゲノムＰ１クローン（２０５３）を用
いてｈＭＬＨ３の存在位置が決定された。バンディング
（banding）を明らかにするために対比染色されたヒト
・中期染色体スプレッドの詳細な分析により、ｈＭＬＨ
３が染色体７上の最も遠方のバンドであるバンド７ｐ２
２中に位置することが示された。種々のゲノムクローン
に関する分析により、ｈＭＬＨ３は、そのすべてが染色
体７上にある関連遺伝子のサブファミリーのメンバーで
あることが示された。

【００４２】ポリペプチド、それらのフラグメントもし
くは誘導体、またはそれらのアナログ、あるいはそれら
を発現する細胞を免疫原として用いてそれらに対する抗
体を得ることができる。これらの抗体は、例えば、ポリ
クローナルまたはモノクローナルでありうる。また、本
発明は、キメラ、１本鎖、およびヒト化抗体、並びにＦ
ａｂフラグメント、またはＦａｂ発現ライブラリーの生
成物を包含する。当該分野において知られた種々の方法
を、かかる抗体およびフラグメントの製造に使用しても
よい。ポリペプチドを動物に直接注射すること、または
ポリペプチドを動物に、好ましくはヒトに投与すること
により、本発明配列に対応するポリペプチドに対して生
成された抗体を得ることができる。次いで、そのように
して得られた抗体はポリペプチド自体に結合するであろ
う。この方式で、ポリペプチドの一部分のみをコードす
る配列を用いてネイティブなポリペプチド全体に結合す
る抗体を得ることができる。次いで、かかる抗体を用い
て、そのポリペプチドを発現する組織からそのポリペプ
チドを単離することができる。モノクローナル抗体の製
造に関して、連続細胞系培養により製造される抗体を提
供するいかなる方法を用いてもよい。例は、ハイブリド
ーマ法（コーラー（Kohler）およびミルステイン（Mils
tein）、１９７５年、ネイチャー、第２５６巻：４９５
〜４９７頁）、トリオーマ法、ヒト・Ｂ細胞ハイブリド
ーマ法（コズボール（Kozbor）ら、１９８３年、イミュ
ノロジー・トゥデイ（Immunology Today）、第４巻：７
２頁）、およびヒト・モノクローナル抗体を製造するた
めのＥＢＶ−ハイブリドーマ法（コール（Cole）ら、１
９８５年、モノクローナル・アンチボディーズ・アンド
・キャンサー・セラピー（Monoclonal Antibodies and
Cancer Therapy）、アラン・アール・リス・インコーポ
レイテッド（Alan R.Liss,Inc.）、７７〜９６頁）を包
含する。１本鎖抗体の製造に関して記載された方法（米
国特許第４,９４６,７７８号）を適用して本発明免疫原
性ポリペプチド生成物に対する１本鎖抗体を製造するこ
とができる。さらに、トランスジェニックマウスを用い
て本発明免疫原性ポリペプチド生成物に対するヒト化抗
体を発現させてもよい。

【００４３】さらに本発明は、以下の実施例に関して記
載されるであろう。しかしながら、本発明はかかる実施
例に限定されないことが理解されるべきである。特記し
ないかぎり、すべての部または量は重量である。以下の
実施例の理解を容易にするために、しばしば出てくる方
法および／または用語について説明する。「プラスミ
ド」は、大文字および／または数字が先行および／また
は後に続く小文字ｐで示される。本発明の出発プラスミ
ドは市販の、制限されずに公的に入手可能な、または公
表された方法により市販プラスミドから構築可能なもの
であってもよい。さらに、記載されたプラスミドと等価
なプラスミドが当該分野において知られており、当業者
に明らかである。ＤＮＡの「消化」は、ＤＮＡ中の特定
の配列においてのみ作用する制限酵素でのＤＮＡの触媒
的開裂をいう。本発明において用いられる種々の制限酵
素は市販されており、それらの反応条件、コファクター
および他の必要物質は当業者に知られている。分析目的
ならば、典型的には、約２０μｌの緩衝液中で、１μｇ
のプラスミドまたはＤＮＡフラグメントを約２ユニット
の酵素とともに使用する。プラスミド構築用のＤＮＡフ
ラクションの単離を目的とするならば、典型的には、よ
り大きな体積中で、５ないし５０μｇのＤＮＡを２０な
いし２５０ユニットの酵素で消化する。特定の制限酵素
に関する適当なバッファーおよび基質量は製造者により
特定されている。３７℃において約１時間のインキュベ
ーション時間が通常用いられるが、提供者の指示に従っ
て変更してもよい。消化後、反応物をポリアクリルアミ
ドゲルで直接電気泳動して所望フラグメントを単離す
る。ゲデル,ディー（Goeddel,D.）ら、ヌクレイック・
アシッズ・リサーチ、第８巻：４０５７頁（１９８０
年）により記載された８パーセントポリアクリルアミド
ゲルを用いて開裂フラグメントのサイズ分離を行う。

【００４４】「オリゴヌクレオチド」は、化学合成され
てもよい１本鎖ポリデオキシヌクレオチドまたは２本の
相補的ポリデオキシヌクレオチド鎖のいずれかをいう。
かかる合成オリゴヌクレオチドは５'リン酸を有してお
らず、よって、キナーゼ存在下でＡＴＰ用いてリン酸を
付加しなければ別のオリゴヌクレオチドに結合しないで
あろう。合成オリゴヌクレオチドは、デホスホリレーシ
ョンされたフラグメントに結合するであろう。「結合」
は、２種の２本鎖核酸フラグメント間にホスホジエステ
ル結合を形成するプロセスをいう（ティー・マニアティ
スら、上記文献、１４６頁）。特記しない限り、１０ユ
ニットのＴ４ＤＮＡリガーゼ（「リガーゼ」）を０.５
μｇのほぼ等モル量のＤＮＡフラグメントに対して用
い、既知バッファーおよび条件下でライゲーションを行
ってもよい。特記しない限り、グラハム,エフ（Graham,
F.）およびファン・デル・エブ,エイ（Van der Eb,
A.）、ウイロロジー（Virology）、第５２巻：４５６〜
４５７頁（１９７３年）の方法に記載のごとく形質転換
を行う。

【００４５】

【実施例】実施例１ｈＭＬＨ１の細菌での発現まず、挿入フラグメントを合成するために、ＤＮＡの
５'および３'末端に対応するＰＣＲオリゴヌクレオチド
プライマーを用いてヒト・ＤＮＡミスマッチ修復蛋白ｈ
ＭＬＨ１をコードする全長のＤＮＡ配列ＡＴＣＣ＃７５
６４９を増幅する。５'オリゴヌクレオチドプライマー
は配列CGGGATCCAT GTCGTTCGTG GCAGGG （配列番
号：３４）を有し、開始コドンに続くｈＭＬＨ１コーデ
ィグ配列の１８個のヌクレオチドが続いているＢａｍＨ
Ｉ制限酵素部位を含んでいる。３'配列GCTCTAGATT AACA
CCTCTC AAAGAC （配列番号：３５）は、ＸｂａＩ
部位に対する相補的配列を含み、該遺伝子の末端であ
る。制限酵素部位は細菌発現ベクターｐＱＥ−９（キア
ジェン・インコーポレイテッド（Quiagen,Inc.）、カリ
フォルニア州チャツワース（Chatsworth））上の制限酵
素部位に対応している。該プラスミドベクターは抗生物
質耐性（Ａｍｐ^ｒ）、細菌の複製開始点（ｏｒｉ）、Ｉ
ＰＴＧ調節可能プロモーター／オペレーター（Ｐ／
Ｏ）、リボゾーム結合部位（ＲＢＳ）、６−ヒスチジン
タグ（６−Ｈｉｓ）および制限酵素クローニング部位を
コードしている。ｐＱＥ−９ベクターをＢａｍＨＩおよ
びＸｂａＩで消化し、次いで、細菌のＲＢＳにおいて開
始する読み取り枠を維持しているｐＱＥ−９ベクター中
に該挿入フラグメントを結合する。次いで、結合混合物
を用いて、多コピーのプラスミドｐＲＥＰ４を含んでい
るイー・コリＭ１５／ｒｅｐ４株（キアジェン・インコ
ーポレイテッド）を形質転換する。ｐＲＥＰ４はｌａｃ
Ｉリプレッサーを発現し、さらにカナマイシン耐性（Ｋ
ａｎ ^ｒ）を付与する。ＬＢプレート上での増殖能により
形質転換体を確認し、アンピシリン／カナマイシン耐性
コロニーを選択する。プラスミドＤＮＡを単離し、制限
分析により確認する。所望の構築物を含有するクローン
を、Ａｍｐ（１００μｇ／ｍｌ）およびＫａｎ（２５μ
ｇ／ｍｌ）の両方を補足したＬＢ培地中で一晩（Ｏ／
Ｎ）液体培養する。該一晩培養物を用いて１：１００な
いし１：２５０の割合の大型培養に接種する。光学密度
６００（Ｏ.Ｄ.６００）が０.４と０.６の間になるまで
細胞を増殖させる。次いで、ＩＰＴＧ（イソプロピル−
β−Ｄ−チオガラクトピラノシド）を添加して最終濃度
１ｍＭとする。

【００４６】ＬａｃＩリプレッサーを不活性化し、Ｐ／
Ｏの読みを解除して遺伝子発現を増大させることにより
ＩＰＴＧは誘導を行う。細胞をさらに３ないし４時間増
殖させる。次いで、遠心分離（６０００ｘｇで２０分）
により細胞を収穫する。カオトロピック剤である６Ｍグ
アニジン塩酸中で細胞ペレットを溶解させる。清澄化
後、６−Ｈｉｓタグを有する蛋白による固い結合を可能
にする条件下（ホリウチ,イー（Horiuchi,E.）ら、ジェ
ネティック・エンジニアリング、プリンシプル・アンド
・メソッズ（Genetic Engineering,Principles and Met
hods）、第１２巻：８７〜９８頁（１９９０年））での
ニッケル−キレートカラムクロマトグラフィーにより、
可溶化したｈＭＬＨ１をこの溶液から精製する。いくつ
かのプロトコール（ジェニック,アール(Jaenicke,R.)お
よびルドルフ,アール（Rudolph,R.）、プロテイン・ス
トラクチャー−ア・プラクティカル・アプローチ（Prot
einStructure-A Practical Approach）、ＩＲＬプレス
（IRL Press）、ニューヨーク（１９９０年））により
ＧｎＨＣｌからの蛋白の再生を行うことができる。ま
ず、段階的透析を用いてＧｎＨＣｌを除去する。別法と
して、Ｎｉ−キレートカラムから単離された精製蛋白を
第２のカラムに結合させることができ、直線的にＧｎＨ
Ｃｌを減少させるグラジエントを行う。カラムに結合
し、次いで、２５０ｍＭイミダゾール、１５０ｍＭＮ
ａＣｌ、２５ｍＭＴｒｉｓ−ＨＣｌｐＨ７.５およ
び１０％グリセロールを含有するバッファーで溶離する
間に蛋白は再生される。最後に、可溶性蛋白を、５ｍＭ
重炭酸アンモニウムを含有する貯蔵用バッファーに対し
て透析する。精製蛋白をＳＤＳ−ＰＡＧＥにより分析し
た。

【００４７】実施例２ｈＭＬＨ１、ｈＭＬＨ２ならびにｈＭＬＨ３の発現およ
びイー・コリｍｕｔ１に対する相補の検出のための自発
的変異アッセイｐＱＥ９ｈＭＬＨ１、ｐＱＥ９ｈＭＬＨ２またはｐＱＥ
９ｈＭＬＨ３／ＧＷ３７３３形質転換体を自発的変異ア
ッセイに供した。さらにプラスミドベクターｐＱＥ９を
ＡＢ１１５７（k-12,argE3 hisG4,LeuB6proA2 thr-1 ar
a-1 rpsL31 supE44 tsx-33）およびＧＷ３７３３に形質
転換して、それぞれ陽性および陰性対照として用いた。
約１００ないし１０００個のイー・コリを接種した１５
個の２ｍｌ培養物を、ＬＢアンピシリン培地中３７℃に
おいてｍｌあたり２ｘ１０^８個まで増殖させた。各培養
物１０μｌを希釈し、アンピシリンプレートに撒いて生
細胞数を測定した。次いで、各培養物の残りの細胞をセ
イライン中に濃縮し、アルギニンを欠いた最少培地のプ
レートに撒いてＡｒｇ⁻の復帰を測定した。表３におい
て、等式（ｒ／ｍ）−Ｉｎ（ｍ）＝１.２４（リー（Le
a）ら、ジャーナル・オブ・ジェネティクス（J.Genetic
s）、第４９巻：２６４〜２８５頁（１９４９年））に
従って、分散あたりの変異株のメジアン数(ｒ)から、培
養物あたりの平均変異数（ｍ）を計算した。１世代あた
りの変異率をｍ／Ｎとして記録した。ここに、Ｎは培養
物あたりの細胞の平均数を表す。

【００４８】表３自発的変異率株変異／世代ＡＢ１１５７＋ベクター（５.６±０.１）ｘ１０^−９ａＧＷ３７３３＋ベクター（１.１±０.２）ｘ１０^−６ａＧＷ３７３３＋ｐｈＭＬＨ１（３.７±１.３）ｘ１０^−７ａＧＷ３７３３＋ｐｈＭＬＨ２（３.１±０.６）ｘ１０^−７ｂＧＷ３７３３＋ｐｈＭＬＨ３（２.１±０.８）ｘ１０^−７ｂａ：３系の実験の平均ｂ：４系の実験の平均

【００４９】機能相補の結果は、ヒト・ｍｕｔＬは部分
的にイー・コリのｍｕｔＬミューテーター表現型を救済
することを示し、ヒト・ｍｕｔＬは細菌発現系において
うまく発現されるのみならず細菌中で機能することが示
された。

【００５０】実施例３ｈＭＨＬ１の染色体マッピングｈＭＨＬ１に関するｃＤＮＡの５'末端における配列に
従ってオリゴヌクレオチドプライマーのセットを設計し
た。このプライマーのセットは９４ｋｂセグメントに及
ぶ。下記条件のセットにおいてこのプライマーのセット
をポリメラーゼ連鎖反応に使用した：３０秒、９５℃ １分、５６℃ １分、７０℃ このサイクルを３２回繰り返し、次いで、７０℃で５分
のサイクルを１回行った。体細胞ハイブリッドパネル
（ビオス・インコーポレイテッド（Bios,Inc.）のほか
に、ヒト、マウス、およびハムスターを鋳型として用い
た。８％ポリアクリルアミドゲルまたは３.５％アガロ
ースゲルのいずれかにより反応物を分析した。染色体３
に対応するヒト・ゲノムＤＮＡ試料および体細胞ハイブ
リッド試料中において９４塩基対のバンドが観察され
た。さらに、種々の他の体細胞ハイブリッドゲノムＤＮ
Ａを用いてｈＭＬＨ１遺伝子の染色体３ｐへの局在化が
示された。

【００５１】実施例４ＨＮＰＣＣ血族におけるｈＭＬＨ１遺伝子の変異の決定
方法ＨＮＰＣＣ血族である人からの組織試料から得たＲＮＡ
からｃＤＮＡを得て、該ｃＤＮＡをＰＣＲの鋳型として
用いた。ＰＣＲはにはプライマー GCATCTAGAC GTTTCCTTGG C （配列番号：３６）および CATCCAAGCT TCTGTTCCCG （配列番号：３７）（図１−６のコドン１から３９４までを増幅）； GGGGTGCAGC AGCACATCG （配列番号：３８）および GGAGGCAGAA TGTGTGAGCG （配列番号：３９）（図１−６（配列番号：２）のコドン３２６から７２９
までを増幅）；さらに TCCCAAAGAA GGACTTGCT （配列番号：４０）、および AGTATAAGTC TTAAGTGCTA CC （配列番号：４１）（図１−６（配列番号：２）のコドン６０２から７５６
まで、および３’非翻訳配列の１２８ヌクレオチドを増
幅）を用いた。すべての分析に関して用いたＰＣＲ条件
は、サン・シドランスキ,ディー（San Sidransky,D.）
ら、サイエンス、第２５２巻：７０６頁（１９９１年）
に記載の緩衝液中、９５℃で３０秒、５２〜５８℃で６
０〜１２０秒、次いで、７０℃で６０〜１２０秒を３５
サイクル行うことからなっていた。SequiThermポリメラ
ーゼ（エピセンター・テクノロジーズ（Epicentre Tech
nologies））を用い、５'末端をＴ４ポリヌクレオチド
キナーゼで標識したプライマーを用いてＰＣＲ生成物を
配列決定した。選択されたエキソンのイントロン−エキ
ソン境界も決定し、ゲノムＰＣＲ生成物を分析して結果
を確認した。次いで、変異と思われるものを有するＰＣ
Ｒ生成物をクローン化し、配列決定して直接配列決定の
結果を確認した。ホルトン,ティー・エイ（Holton,T.
A.）およびグラハム,エム・ダブリュ（Graham,M.W.）、
ヌクレイック・アシッズ・リサーチ、第１９巻：１１５
６頁（１９９１年）に記載のごとくＰＣＲ生成物をＴ−
テイルドベクター（T-tailed vector）中にクローン化
し、Ｔ７ポリメラーゼ（ユナイテッド・ステイツ・バイ
オケミカル（United States Biochemical））を用いて
配列決定した。７つの血族からの罹患した個体はすべ
て、ｈＭＬＨ１遺伝子のコドン５７８から６３２までの
ヘテロ接合欠失を示した。これらの７つの血族のうちの
５人は共通の祖先にたどり着くことができた。製造者に
より記載されたようにして、プライマーをＴ４ポリヌク
レオチドキナーゼで標識して、さらにゲノムＤＮＡのＰ
ＣＲ生成物を配列決定することにより、SequiThermポリ
メラーゼを用いてＰ１クローン（全ｈＭＬＨ１遺伝子を
含むヒト・ゲノムＰ１ライブラリー（ジェノム・システ
ムズ（Genome Systems））をサイクルシークエンシング
（cycle-sequencing）することにより、コドン５７８〜
６３２周辺のゲノム配列を決定した。コドン５７８〜６
３２を含むエキソンを増幅するのに用いたプライマー
は、 TTTATGGTTT CTCACCTGCC （配列番号：４２）および GTTATCTGCC CACCTCAGC （配列番号：４３）であっ
た。ＰＣＲ生成物は、該エキソンの上流の１０５ｂｐの
イントロンＣ配列およびエキソンの１１７ｂｐ下流を含
んでいた。ＰＣＲ生成物中の変異は該血族においては観
察されず、ゆえにＲＮＡにおける欠失は単なるスプライ
ス部位の変異のせいではなかった。コドン５７８〜６３
２は、上記血族における遺伝子生成物から欠失されてい
る単一エキソンを構成することがわかった。このエキソ
ンはいくつかの非常に保存的なアミノ酸を含んでいる。

【００５２】第２の家族（Ｌ７）において、上記プライ
マーを用いてＰＣＲを行ったところ、コドン７２７の最
初のヌクレオチド（ｎｔ）から始まる４ｂｐの欠失が観
察された。この欠失は１６６ヌクレオチド下流の新たな
ストップコドンを伴うフレームシフトにより起こり、ｈ
ＭＬＨ１のカルボキシ末端の２９個のアミノ酸が５３個
のアミノ酸（通常は、そのうちのいくつかは３'非翻訳
領域のヌクレオチドによりコードされている）により置
換された。上記プライマーを用いるＰＣＲの後、別の血
族（Ｌ２５１６）において別の変異が見られ、該変異は
コドン７５５と７５６との間の４ｂｐの挿入からなって
いた。この挿入はフレームシフトおよび正常なターミネ
ーションコドンから１０２ヌクレオチド（３４アミノ
酸）下流までを含むＯＲＦの拡張を引き起こした。それ
ゆえ、血族Ｌ７およびＬ２５１６両方における変異はｈ
ＭＬＨ１のＣ末端を変化させると予想された。連関の研
究には血族が少なすぎたので、コードされる蛋白のサイ
ズの変化からｈＭＬＨ１における可能な変異を決定し
た。ｈＭＬＨ１の組み合わせ転写−翻訳（coupled tran
scription-translation）に用いたプライマーは、図１
−６のコドン１から３９４までについてはGGATCCTAAT A
CGACTCACT ATAGGGAGAC CACCATGGCA TCTAGACGTT TCCCTTG
GC（配列番号：４４）およびCATCCAAGCT TCTGTTCCCG
（配列番号：４５）であり、図１−６（配列番号：
２）のコドン３２６から７２９までについてはGGATCCTA
AT ACGACTCACT ATAGGGAGAC CACCATGGGG GTGCAGCAGC ACA
TCG（配列番号：４６）およびGGAGGCAGAA TGTGTGAGCG
（配列番号：４７）であった。得られたＰＣＲ生成
物は、Ｔ７ＲＮＡポリメラーゼによる転写に関するシ
グナルおよびそれらの５'末端における翻訳開始に関す
るシグナルを有していた。１８の血族からの患者のリン
パ芽球細胞由来のＲＮＡを用いて２種の生成物（それぞ
れ、コドン１からコドン３９４まで伸長、またはコドン
３２６からコドン７２９まで伸長）を増幅した。次い
で、ＰＣＲプライマー中に取り込まれている転写−翻訳
シグナルを用いてインビトロでＰＣＲ生成物を転写し、
翻訳した。パウエル,エス・エム（Powell,S.M.）ら、ニ
ュー・イングランド・ジャーナル・オブ・メディシン
（NewEngland Journal of Medicine）、第３２９巻、１
９８２頁（１９９３年）により記載されたようにして、
かつ４０マイクロＣｉの^３５Ｓ標識メチオニンを用いて
行われた組み合わせ転写−翻訳反応において、ＰＣＲ生
成物を鋳型として用いた。試料を同じバッファーで希釈
し、５分間煮沸し、次いで、１０％から２０％までのア
クリルアミドのグラジエントを有するドデシル硫酸ナト
リウム−ポリアクリルアミドゲル上の電気泳動により分
析した。ゲルを乾燥し、ラジオグラフィーに供した。す
べての試料は予想されたサイズのポリペプチドを示した
が、異常に移動するポリペプチドが１つのケースにおい
てさらに見いだされた。関連のあるＰＣＲ生成物の配列
を決定し、コドン３４７の最初のヌクレオチドから始ま
る３７１ｂｐの欠失を有することが見いだされた。この
変化はヘテロ接合形態において存在し、コドン３４６の
３０ヌクレオチド下流の新たな停止コドンにおけるフレ
ームシフトを生じ、かくして、観察された切断ポリペプ
チドが説明された。マイクロサテライト不安定性を示す
４種の結腸腫瘍細胞系を試験した。４種のうち１種（細
胞系Ｈ６）はこのアッセイにおいて正常ペプチドを示さ
ず、２７ｋｄのところに移動する短い生成物のみを生産
した。対応ｃＤＮＡの配列を決定し、コドン２５２にお
けるＣのＡへのトランスバージョンを有することが見い
だされ、セリンに代わってターミネーションコドンが生
じていた。翻訳の分析と一致して、正常なＣの位置にお
けるバンドはこの腫瘍由来のｃＤＮＡまたはゲノムＤＮ
Ａにおいて同定されず、それが機能的ｈＭＬＨ１遺伝子
を欠くことが示された。表４はこれらの配列決定アッセ
イの結果を示す。結腸癌の家族歴を有する人において欠
失が見いだされた。より詳細には、１０家族のうち９家
族がｈＭＬＨ１の変異を示した。

【００５３】

【表３】

【００５４】実施例５ｈＭＬＨ２の細菌での発現および精製まず、挿入フラグメントを合成するために、ＤＮＡ配列
の５'および３'末端に対応するＰＣＲオリゴヌクレオチ
ドプライマーを用いてｈＭＬＨ２をコードするＤＮＡ配
列ＡＴＣＣ＃７５６５１を増幅する。５'オリゴヌクレ
オチドプライマーは配列 CGGGATCCAT GAAACAATTG CCTGCGGC （配列番号：４
８）を有しており、この配列は、開始コドンに続くｈＭ
ＬＨ２の１７個のヌクレオチドが続いているＢａｍＨＩ
制限酵素部位を含んでいる。３'配列GCTCTAGACC AGACTC
ATGC TGTTTT （配列番号：４９）はＸｂａＩ部位
に対する相補的配列を含み、ｈＭＬＨ２の１８個のヌク
レオチドが後に続いている。制限酵素部位は細菌発現ベ
クターｐＱＥ−９（キアジェン・インコーポレイテッド
（Qiagen,Inc.）、カリフォルニア州チャツワース（Cha
tworth））の制限酵素部位に対応している。ｐＱＥ−９
は、抗生物質耐性（Ａｍｐ^ｒ）、細菌の複製開始点（ｏ
ｒｉ）、ＩＰＴＧ−調節可能プロモーターオペレーター
（Ｐ／Ｏ）、リボゾーム結合部位（ＲＢＳ）、６−Ｈｉ
ｓタグおよび制限酵素部位をコードしている。次いで、
増幅された配列およびｐＱＥ−９をＢａｍＨＩおよびＸ
ｂａＩで消化する。増幅された配列をｐＱＥ−９中に結
合し、ヒスチジンタグおよびＲＢＳをコードしている配
列を伴うフレーム中に挿入する。次いで、結合混合物を
用いて、多コピーのプラスミドｐＲＥＰ４を含んでいる
イー・コリＭ１５／ｒｅｐ４株（キアジェン・インコー
ポレイテッド）を形質転換する。ｐＲＥＰ４はｌａｃＩ
リプレッサーを発現し、さらにカナマイシン耐性（Ｋａ
ｎ^ｒ）を付与する。ＬＢプレート上での増殖能により形
質転換体を確認し、アンピシリン／カナマイシン耐性コ
ロニーを選択する。プラスミドＤＮＡを単離し、制限分
析により確認する。所望の構築物を含有するクローン
を、Ａｍｐ（１００μｇ／ｍｌ）およびＫａｎ（２５μ
ｇ／ｍｌ）の両方を補足したＬＢ培地中で一晩（Ｏ／
Ｎ）液体培養する。該一晩培養物を用いて１：１００な
いし１：２５０の割合の大型培養に接種する。光学密度
６００（Ｏ.Ｄ.６００）が０.４と０.６の間になるまで
細胞を増殖させる。次いで、ＩＰＴＧ（イソプロピル−
β−Ｄ−チオガラクトピラノシド）を添加して最終濃度
１ｍＭとする。

【００５５】ＬａｃＩリプレッサーを不活性化し、Ｐ／
Ｏの読みを解除して遺伝子発現を増大させることにより
ＩＰＴＧは誘導を行う。細胞をさらに３ないし４時間増
殖させる。次いで、遠心分離（６０００ｘｇで２０分）
により細胞を収穫する。カオトロピック剤である６Ｍグ
アニジン塩酸中で細胞ペレットを溶解させる。清澄化
後、６−Ｈｉｓタグを有する蛋白による固い結合を可能
にする条件下（ホリウチ,イー（Horiuchi,E.）ら、ジェ
ネティック・エンジニアリング、プリンシプル・アンド
・メソッズ（Genetic Engineering,Principles and Met
hods）、第１２巻：８７〜９８頁（１９９０年））での
ニッケル−キレートカラムクロマトグラフィーにより、
可溶化したｈＭＬＨ１をこの溶液から精製する。いくつ
かのプロトコール（ジェニック,アール(Jaenicke,R.)お
よびルドルフ,アール（Rudolph,R.）、プロテイン・ス
トラクチャー−ア・プラクティカル・アプローチ（Prot
einStructure-A Practical Approach）、ＩＲＬプレス
（IRL Press）、ニューヨーク（１９９０年））により
ＧｎＨＣｌからの蛋白の再生を行うことができる。ま
ず、段階的透析を用いてＧｎＨＣｌを除去する。別法と
して、Ｎｉ−キレートカラムから単離された精製蛋白を
第２のカラムに結合させることができ、直線的にＧｎＨ
Ｃｌを減少させるグラジエントを行う。カラムに結合
し、次いで、２５０ｍＭイミダゾール、１５０ｍＭＮ
ａＣｌ、２５ｍＭＴｒｉｓ−ＨＣｌｐＨ７.５およ
び１０％グリセロールを含有するバッファーで溶離する
間に蛋白は再生される。最後に、可溶性蛋白を、５ｍＭ
重炭酸アンモニウムを含有する貯蔵用バッファーに対し
て透析する。精製蛋白をＳＤＳ−ＰＡＧＥにより分析し
た。

【００５６】実施例６ｈＭＬＨ３の細菌での発現および精製まず、挿入フラグメントを合成するためにＤＮＡ配列の
５'および３'末端に対応するＰＣＲオリゴヌクレオチド
プライマーを用いて、ｈＭＬＨ３をコードするＤＮＡ配
列ＡＴＣＣ＃７５６５０を増幅する。５'オリゴヌクレ
オチドプライマーは配列CGGGATCCAT GGAGCGAGCT GAGAGC
（配列番号：５０）を有しており、この配列は、
開始コドンに続くｈＭＬＨ３の１８個のヌクレオチドが
続いているＢａｍＨＩ制限酵素部位を含んでいる。３'
配列GCTCTAGAGT GAAGACTCTG TCT （配列番号：５
１）はＸｂａＩ部位に対する相補的配列を含み、ｈＭＬ
Ｈ３の１８個のヌクレオチドが後に続いている。制限酵
素部位は細菌発現ベクターｐＱＥ−９（キアジェン・イ
ンコーポレイテッド（Qiagen,Inc.）、カリフォルニア
州チャツワース（Chatworth））の制限酵素部位に対応
している。ｐＱＥ−９は、抗生物質耐性（Ａｍｐ^ｒ）、
細菌の複製開始点（ｏｒｉ）、ＩＰＴＧ−調節可能プロ
モーターオペレーター（Ｐ／Ｏ）、リボゾーム結合部位
（ＲＢＳ）、６−Ｈｉｓタグおよび制限酵素部位をコー
ドしている。次いで、増幅された配列およびｐＱＥ−９
をＢａｍＨＩおよびＸｂａＩで消化する。増幅された配
列をｐＱＥ−９中に結合し、ヒスチジンタグおよびＲＢ
Ｓをコードしている配列を伴うフレーム中に挿入する。
次いで、結合混合物を用いて、多コピーのプラスミドｐ
ＲＥＰ４を含んでいるイー・コリＭ１５／ｒｅｐ４株
（キアジェン・インコーポレイテッド）を形質転換す
る。ｐＲＥＰ４はｌａｃＩリプレッサーを発現し、さら
にカナマイシン耐性（Ｋａｎ^ｒ）を付与する。ＬＢプレ
ート上での増殖能により形質転換体を確認し、アンピシ
リン／カナマイシン耐性コロニーを選択する。プラスミ
ドＤＮＡを単離し、制限分析により確認する。所望の構
築物を含有するクローンを、Ａｍｐ（１００μｇ／ｍ
ｌ）およびＫａｎ（２５μｇ／ｍｌ）の両方を補足した
ＬＢ培地中で一晩（Ｏ／Ｎ）液体培養する。該一晩培養
物を用いて１：１００ないし１：２５０の割合の大型培
養に接種する。光学密度６００（Ｏ.Ｄ.６００）が０.
４と０.６の間になるまで細胞を増殖させる。次いで、
ＩＰＴＧ（イソプロピル−β−Ｄ−チオガラクトピラノ
シド）を添加して最終濃度１ｍＭとする。

【００５７】ＬａｃＩリプレッサーを不活性化し、Ｐ／
Ｏの読みを解除して遺伝子発現を増大させることにより
ＩＰＴＧは誘導を行う。細胞をさらに３ないし４時間増
殖させる。次いで、遠心分離（６０００ｘｇで２０分）
により細胞を収穫する。カオトロピック剤である６Ｍグ
アニジン塩酸中で細胞ペレットを溶解させる。清澄化
後、６−Ｈｉｓタグを有する蛋白による固い結合を可能
にする条件下（ホリウチ,イー（Horiuchi,E.）ら、ジェ
ネティック・エンジニアリング、プリンシプル・アンド
・メソッズ（Genetic Engineering,Principles and Met
hods）、第１２巻：８７〜９８頁（１９９０年））での
ニッケル−キレートカラムクロマトグラフィーにより、
可溶化したｈＭＬＨ１をこの溶液から精製する。いくつ
かのプロトコール（ジェニック,アール(Jaenicke,R.)お
よびルドルフ,アール（Rudolph,R.）、プロテイン・ス
トラクチャー−ア・プラクティカル・アプローチ（Prot
einStructure-A Practical Approach）、ＩＲＬプレス
（IRL Press）、ニューヨーク（１９９０年））により
ＧｎＨＣｌからの蛋白の再生を行うことができる。ま
ず、段階的透析を用いてＧｎＨＣｌを除去する。別法と
して、Ｎｉ−キレートカラムから単離された精製蛋白を
第２のカラムに結合させることができ、直線的にＧｎＨ
Ｃｌを減少させるグラジエントを行う。カラムに結合
し、次いで、２５０ｍＭイミダゾール、１５０ｍＭＮ
ａＣｌ、２５ｍＭＴｒｉｓ−ＨＣｌｐＨ７.５およ
び１０％グリセロールを含有するバッファーで溶離する
間に蛋白は再生される。最後に、可溶性蛋白を、５ｍＭ
重炭酸アンモニウムを含有する貯蔵用バッファーに対し
て透析する。精製蛋白をＳＤＳ−ＰＡＧＥにより分析し
た。

【００５８】実施例７遺伝性の癌におけるｈＭＬＨ２およびｈＭＬＨ３の変異
の決定方法ゲノムクローンの単離ｈＭＬＨ２およびｈＭＬＨ３のｃＤＮＡ配列に関して選
択されたプライマーを用いるＰＣＲにより、ヒト・ゲノ
ムＰ１ライブラリー（ジェノミック・システムズ・イン
コーポレイテッド（Genomic Systems,Inc.））をスクリ
ーニングした。プライマー AAGCTGCTCT GTTAAAAGCG （配列番号：５２）および GCACCAGCAT CCAAGGAG （配列番号：５３）を用いてｈＭＬＨ２に関して２個のクローンを単離し、
１３３ｂｐの生成物を得た。プライマー CAACCATGAG ACACATCGC （配列番号：５４）および AGGTTAGTGA AGACTCTGTC （配列番号：５５）を用いてｈＭＬＨ３に関して３個のクローンを単離し、
１２１ｂｐの生成物を得た。ジゴキシゲニンデオキシ−
ウリジン５'−トリホスフェート（ベーリンガー・マン
ハイム（Boehringer Manheim））を用いてゲノムクロー
ンをニックトランスレーションし、ジョンソン,シー（J
ohnson,C.）ら、メソッズ・セル・バイオロ（Methods C
ell Biol.）、第３５巻：７３〜９９頁（１９９１年）
に記載のごとくＦＩＳＨを行った。発現されたｈＭＬＨ
３遺伝子座への特異的ハイブリダイゼーションのために
大過剰のヒト・ｃｏｔ−１ＤＮＡを用いてｈＭＬＨ３
プローブとのハイブリダイゼーションを行った。４,６
−ジアミノ−２−フェニルインドールおよびヨウ化プロ
ピジウムを用いて染色体を対比染色し、Ｃ−およびＲ−
バンドの組み合わせを得た。クールド・チャージ−カッ
プルド・デバイス・カメラ（cooled charge-coupled de
vice camera）（フォトメトリクス（Photometrics）、
アリゾナ州タクソン（Tucson））および可変励起波長フ
ィルター（ジョンソン,シー（Johnson,C.）ら、ジェネ
ティ・アナリ・テク・アプリ（Genet.Anal.Tech.App
l.）、第８巻：７５頁（１９９１年）と組み合わせたト
リプル−バンド・フィルター・セット（Triple-band fi
lter set）（クロマ・テクノロジー（Chroma Technolog
y）、バーモント州ブラットレボロ(Brattleboro))を用
いて、正確なマッピングのために配置されたイメージを
得た。イメージの収集、分析および染色体断片長の測定
を、ＩＳｅｅグラフィカル・プログラム・システム（IS
ee Graphical Program System）（イノビジョン・コー
ポレイション（InovisionCorporation）、ノースカロラ
イナ州ダラム（Durham））を用いて行った。

【００５９】転写にカップリングした翻訳の変異の分析ＩＶＳＰ分析の目的で、ｈＭＬＨ２遺伝子を３つの重複
セグメントに分けた。第１のセグメントはコドン１から
５００までを含んでいたが、中間のセグメントはコドン
２７０から７５５まで、最後のセグメントはコドン４８
５からコドン９３３における翻訳終結部位までを含んで
いた。第１のセグメントに関するプライマーは、GGATCC
TAAT ACGACTCACT ATAGGGAGAC CACCATGGAA CAATTGCCTG C
GG（配列番号：５６）およびCCTGCTCCAC TCATCTGC
（配列番号：５７）であり、中間のセグメントに関し
ては、GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGAA
GATATCTTAA AGTTAATCCG（配列番号：５８）およびGGCTT
CTTCT ACTCTATATG G （配列番号：５９）であり、
最後のセグメントに関しては、GGATCCTAAT ACGACTCACT
ATAGGGAGAC CACCATGGCA GGTCTTGAAA ACTCTTCG（配列番
号：６０）およびAAAACAAGTC AGTGAATCCT C （配
列番号：６１）であった。患者ＣＷにおける停止変異を
マッピングするために用いたプライマーは、すべて第１
のセグメントと同じ５'プライマーであった。３'ネステ
ィッドプライマーは： AAGCACATCT GTTTCTGCTG （配列番号：６２）コドン１から３６９ ACGAGTAGAT TCCTTTAGGC （配列番号：６３）コドン１から２９０ CAGAACTGAC ATGAGAGCC （配列番号：６４）コドン１から２１４であった。

【００６０】ｈＭＬＨ３の分析のために、ｈＭＬＨ３の
ｃＤＮＡを全長生成物として、あるいは２つの重複セグ
メントとして増幅した。全長のｈＭＬＨ３に関するプラ
イマーは、GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATG
GAG CGAGCTGAGA GC（配列番号：６５）およびAGGTTAGTG
A AGACTCTGTC （配列番号：６６）（コドン１から
８６３まで）であった。セグメント１に関しては、セン
スプライマーは上記のものと同じで、アンチセンスプラ
イマーはCTGAGGTCTC AGCAGGC （配列番号：６７）
（コドン１から４７２まで）であった。セグメント２の
プライマーはGGATCCTAAT ACGACTCACT ATAGGGAGAC CACCA
TGGTG TCCATTTCCA GACTGCG（配列番号：６８）およびAG
GTTAGTGA AGACTCTGTC （配列番号：６９）（コド
ン４１５から８６３まで）であった。増幅を下記のごと
く行った。

【００６１】ＰＣＲ生成物は、Ｔ７ＲＮＡポリメラー
ゼおよび５'末端における翻訳開始の認識シグナルを含
んでいた。４０μＣｉの^３６Ｓ−メチオニン（ＮＥＮ、
デュポン（Dupont））を含有するカップリングした転写
−翻訳反応においてＰＣＲ生成物を鋳型として用いた。
試料をＳＤＳ試料バッファーで希釈し、１０％から２０
％までのアクリルアミドのグラジエントを含有するＳＤ
Ｓ−ポリアクリルアミドゲル上の電気泳動により分析し
た。ゲルを固定し、ＥｎＨａｎｃｅ（デュポン）で処理
し、乾燥し、次いで、オートラジオグラフィーに供し
た。

【００６２】ＲＴ−ＰＣＲおよびＰＣＲ生成物の直接配
列決定 Superscript II（ライフ・テクノロジーズ（Life Techn
ologies）を用いてリンパ芽球または腫瘍細胞のＲＮＡ
からｃＤＮＡを得た。次いで、ｃＤＮＡをＰＣＲ用鋳型
として用いた。すべての増幅の条件は、バッファー中、
９５℃で３０秒、５２℃ないし６５℃で６０秒ないし１
２０秒、次いで、７０℃で６０秒ないし１２０秒で、３
５サイクルであった。ＰＣＲ生成物を直接配列決定し、
Ｔ−テイルドクローニングベクターＰＣＲ２０００（イ
ンビトロジェン（Invitrogen））中にクローン化し、Ｔ
７ポリメラーゼ（ユナイテッド・ステイツ・バイオケミ
カル）を用いて配列決定した。ＰＣＲ生成物の直接配列
決定のために、ＰＣＲ反応物をまずフェノールクロロホ
ルム抽出し、次いで、エタノール沈殿した。製造者によ
り説明されているようにSequithermポリメラーゼ（エピ
センター・テクノロジーズ）およびガンマ−^３２Ｐ標識
プライマーを用いて鋳型を直接配列決定した。

【００６３】変異のイントロン／エキソン境界およびゲ
ノム分析製造者により説明されているようにガンマ−^３２Ｐ標識
プライマーおよびSequithermポリメラーゼを用いてＰ１
クローンをサイクル配列決定（cycle-sequencing）する
ことによりイントロン／エキソン境界を決定した。コド
ン１９５から２３３までを含むｈＭＬＨ２エキソンを増
幅するために用いたプライマーはTTATTTGGCA GAAAAGCAG
A G （配列番号：７０）およびTTAAAAGACT AACCTC
TTGC C （配列番号：７１）であり、２１５ｂｐの
生成物が得られた。プライマーCTGCTGTTAT GAACAATATG
G （配列番号：７２）を用いて生成物をサイクル
配列決定した。患者ＧＣにおけるｈＭＬＨ３のゲノム欠
失を分析するために用いたプライマーは：５'領域増幅
用には CAGAAGCAGT TGCAAAGCC （配列番号：７３）と AAACCGTACT CTTCACACAC （配列番号：７４）（ｈＭＬＨ３のコドン２３３から２５７を含む７４ｂｐ
の生成物が得られる）、 GAGGAAAAGC TTTTGTTGGC （配列番号：７５）と CAGTGGCTGC TGACTGAC （配列番号：７６）（ｈＭＬＨ３のコドン３４７から３７７を含む９３ｂｐ
の生成物が得られる）、さらに TCCAGAACCA AGAAGGAGC （配列番号：７７）と TGAGGTCTCA GCAGGC （配列番号：７８）（ｈＭＬＨ３のコドン４３９から４７２を含む９９ｂｐ
の生成物が得られる）であった。

【００６４】表５ＨＮＰＣＣに罹患した患者からのＨＭＬＨ２およびＨＭＬＨ３における変異のまとめ試料コドンヌクレオチドゲノム変化予想コーディングｃＤＮＡ変化変化ＨＭＬＨ２ＣＷ２３３スキップした CAGからTAGへＧＬＮから停止エキソンコドンへＨＭＬＨ３ＭＮ、ＮＳ、２０ CGGからCAGへ CGGからCAGへ ARGからGLNへＴＦＧＣ２６８から１２０３ｂｐの欠失イン−フレーム６６９まで欠失欠失ＧＣｘ２６８から１２０３ｂｐの欠失フレームシフト、６６９まで欠失切断

【００６５】上記教示を考慮すれば本発明に対する多く
の修飾および変更可能が可能であり、それゆえ、添付し
た請求の範囲に範囲内であり、本発明を特別に説明した
のとは別なように実施してもよい。

【００６６】

【発明の効果】本発明によれは、３種のヒト・ＤＮＡ修
復蛋白およびかかる蛋白をコードするＤＮＡ（ＲＮ
Ａ）、さらに組み換え法によるかかる蛋白の製造方法を
が提供される。ヒト・ＤＮＡ修復遺伝子の１つであるｈ
ＭＬＨ１は染色体３に対してマッピングされ、ｈＭＬＨ
２は染色体２に対してマッピングされ、さらにｈＭＬＨ
３は染色体７に対してマッピングされた。本発明は、ｈ
ＭＬＨ１、ｈＭＬＨ２およびｈＭＬＨ３遺伝子における
変化を診断する方法を提供する。

【００６７】

【配列表】 SEQUENCE LISTING <110> Human Genome Sciences, Inc. <120> Human DNA Mismatch Repair Proteins <130> PF106PCT <140> PCT/US95/01035 <141> 1996-01-25 <150> 08/294,312 <151> 1994-08-23 <150> 08/210,143 <151> 1994-03-16 <150> 08/187,757 <151> 1994-01-27 <160> 78 <170> PatentIn version 3.0 <210> 1 <211> 2525 <212> DNA <213> homo sapiens <220> <221> CDS <222> (42)..(2312) <400> 1 gttgaacatc tagacgtttc cttggctctt ctggcgccaa a atg tcg ttc gtg gca 56 Met Ser Phe Val Ala 1 5 ggg gtt att cgg cgg ctg gac gag aca gtg gtg aac cgc atc gcg gcg 104 Gly Val Ile Arg Arg Leu Asp Glu Thr Val Val Asn Arg Ile Ala Ala 10 15 20 ggg gaa gtt atc cag cgg cca gct aat gct atc aaa gag atg att gag 152 Gly Glu Val Ile Gln Arg Pro Ala Asn Ala Ile Lys Glu Met Ile Glu 25 30 35 aac tgt tta gat gca aaa tcc aca agt att caa gtg att gtt aaa gag 200 Asn Cys Leu Asp Ala Lys Ser Thr Ser Ile Gln Val Ile Val Lys Glu 40 45 50 gga ggc ctg aag ttg att cag atc caa gac aat ggc acc ggg atc agg 248 Gly Gly Leu Lys Leu Ile Gln Ile Gln Asp Asn Gly Thr Gly Ile Arg 55 60 65 aaa gaa gat ctg gat att gta tgt gaa agg ttc act act agt aaa ctg 296 Lys Glu Asp Leu Asp Ile Val Cys Glu Arg Phe Thr Thr Ser Lys Leu 70 75 80 85 cag tcc ttt gag gat tta gcc agt att tct acc tat ggc ttt cga ggt 344 Gln Ser Phe Glu Asp Leu Ala Ser Ile Ser Thr Tyr Gly Phe Arg Gly 90 95 100 gag gct ttg gcc agc ata agc cat gtg gct cat gtt act att aca acg 392 Glu Ala Leu Ala Ser Ile Ser His Val Ala His Val Thr Ile Thr Thr 105 110 115 aaa aca gct gat gga aag tgt gca tac aga gca agt tac tca gat gga 440 Lys Thr Ala Asp Gly Lys Cys Ala Tyr Arg Ala Ser Tyr Ser Asp Gly 120 125 130 aaa ctg aaa gcc cct cct aaa cca tgt gct ggc aat caa ggg acc cag 488 Lys Leu Lys Ala Pro Pro Lys Pro Cys Ala Gly Asn Gln Gly Thr Gln 135 140 145 atc acg gtg gag gac ctt ttt tac aac ata gcc acg agg aga aaa gct 536 Ile Thr Val Glu Asp Leu Phe Tyr Asn Ile Ala Thr Arg Arg Lys Ala 150 155 160 165 tta aaa aat cca agt gaa gaa tat ggg aaa att ttg gaa gtt gtt ggc 584 Leu Lys Asn Pro Ser Glu Glu Tyr Gly Lys Ile Leu Glu Val Val Gly 170 175 180 agg tat tca gta cac aat gca ggc att agt ttc tca gtt aaa aaa caa 632 Arg Tyr Ser Val His Asn Ala Gly Ile Ser Phe Ser Val Lys Lys Gln 185 190 195 gga gag aca gta gct gat gtt agg aca cta ccc aat gcc tca acc gtg 680 Gly Glu Thr Val Ala Asp Val Arg Thr Leu Pro Asn Ala Ser Thr Val 200 205 210 gac aat att cgc tcc gtc ttt gga aat gct gtt agt cga gaa ctg ata 728 Asp Asn Ile Arg Ser Val Phe Gly Asn Ala Val Ser Arg Glu Leu Ile 215 220 225 gaa att gga tgt gag gat aaa acc cta gcc ttc aaa atg aat ggt tac 776 Glu Ile Gly Cys Glu Asp Lys Thr Leu Ala Phe Lys Met Asn Gly Tyr 230 235 240 245 ata tcc aat gca aac tac tca gtg aag aag tgc atc ttc tta ctc ttc 824 Ile Ser Asn Ala Asn Tyr Ser Val Lys Lys Cys Ile Phe Leu Leu Phe 250 255 260 atc aac cat cgt ctg gta gaa tca act tcc ttg aga aaa gcc ata gaa 872 Ile Asn His Arg Leu Val Glu Ser Thr Ser Leu Arg Lys Ala Ile Glu 265 270 275 aca gtg tat gca gcc tat ttg ccc aaa aac aca cac cca ttc ctg tac 920 Thr Val Tyr Ala Ala Tyr Leu Pro Lys Asn Thr His Pro Phe Leu Tyr 280 285 290 ctc agt tta gaa atc agt ccc cag aat gtg gat gtt aat gtg cac ccc 968 Leu Ser Leu Glu Ile Ser Pro Gln Asn Val Asp Val Asn Val His Pro 295 300 305 aca aag cat gaa gtt cac ttc ctg cac gag gag agc atc ctg gag cgg 1016 Thr Lys His Glu Val His Phe Leu His Glu Glu Ser Ile Leu Glu Arg 310 315 320 325 gtg cag cag cac atc gag agc aag ctc ctg ggc tcc aat tcc tcc agg 1064 Val Gln Gln His Ile Glu Ser Lys Leu Leu Gly Ser Asn Ser Ser Arg 330 335 340 atg tac ttc acc cag act ttg cta cca gga ctt gct ggc ccc tct ggg 1112 Met Tyr Phe Thr Gln Thr Leu Leu Pro Gly Leu Ala Gly Pro Ser Gly 345 350 355 gag atg gtt aaa tcc aca aca agt ctg acc tcg tct tct act tct gga 1160 Glu Met Val Lys Ser Thr Thr Ser Leu Thr Ser Ser Ser Thr Ser Gly 360 365 370 agt agt gat aag gtc tat gcc cac cag atg gtt cgt aca gat tcc cgg 1208 Ser Ser Asp Lys Val Tyr Ala His Gln Met Val Arg Thr Asp Ser Arg 375 380 385 gaa cag aag ctt gat gca ttt ctg cag cct ctg agc aaa ccc ctg tcc 1256 Glu Gln Lys Leu Asp Ala Phe Leu Gln Pro Leu Ser Lys Pro Leu Ser 390 395 400 405 agt cag ccc cag gcc att gtc aca gag gat aag aca gat att tct agt 1304 Ser Gln Pro Gln Ala Ile Val Thr Glu Asp Lys Thr Asp Ile Ser Ser 410 415 420 ggc agg gct agg cag caa gat gag gag atg ctt gaa ctc cca gcc cct 1352 Gly Arg Ala Arg Gln Gln Asp Glu Glu Met Leu Glu Leu Pro Ala Pro 425 430 435 gct gaa gtg gct gcc aaa aat cag agc ttg gag ggg gat aca aca aag 1400 Ala Glu Val Ala Ala Lys Asn Gln Ser Leu Glu Gly Asp Thr Thr Lys 440 445 450 ggg act tca gaa atg tca gag aag aga gga cct act tcc agc aac ccc 1448 Gly Thr Ser Glu Met Ser Glu Lys Arg Gly Pro Thr Ser Ser Asn Pro 455 460 465 aga aag aga cat cgg gaa gat tct gat gtg gaa atg gtg gaa gat gat 1496 Arg Lys Arg His Arg Glu Asp Ser Asp Val Glu Met Val Glu Asp Asp 470 475 480 485 tcc cga aag gaa atg act gca gct tgt acc ccc cgg aga agg atc att 1544 Ser Arg Lys Glu Met Thr Ala Ala Cys Thr Pro Arg Arg Arg Ile Ile 490 495 500 aac ctc act agt gtt ttg agt ctc cag gaa gaa att aat gag cag gga 1592 Asn Leu Thr Ser Val Leu Ser Leu Gln Glu Glu Ile Asn Glu Gln Gly 505 510 515 cat gag gtt ctc cgg gag atg ttg cat aac cac tcc ttc gtg ggc tgt 1640 His Glu Val Leu Arg Glu Met Leu His Asn His Ser Phe Val Gly Cys 520 525 530 gtg aat cct cag tgg gcc ttg gca cag cat caa acc aag tta tac ctt 1688 Val Asn Pro Gln Trp Ala Leu Ala Gln His Gln Thr Lys Leu Tyr Leu 535 540 545 ctc aac acc acc aag ctt agt gaa gaa ctg ttc tac cag ata ctc att 1736 Leu Asn Thr Thr Lys Leu Ser Glu Glu Leu Phe Tyr Gln Ile Leu Ile 550 555 560 565 tat gat ttt gcc aat ttt ggt gtt ctc agg tta tcg gag cca gca ccg 1784 Tyr Asp Phe Ala Asn Phe Gly Val Leu Arg Leu Ser Glu Pro Ala Pro 570 575 580 ctc ttt gac ctt gcc atg ctt gcc tta gat agt cca gag agt ggc tgg 1832 Leu Phe Asp Leu Ala Met Leu Ala Leu Asp Ser Pro Glu Ser Gly Trp 585 590 595 aca gag gaa gat ggt ccc aaa gaa gga ctt gct gaa tac att gtt gag 1880 Thr Glu Glu Asp Gly Pro Lys Glu Gly Leu Ala Glu Tyr Ile Val Glu 600 605 610 ttt ctg aag aag aag gct gag atg ctt gca gac tat ttc tct ttg gaa 1928 Phe Leu Lys Lys Lys Ala Glu Met Leu Ala Asp Tyr Phe Ser Leu Glu 615 620 625 att gat gag gaa ggg aac ctg att gga tta ccc ctt ctg att gac aac 1976 Ile Asp Glu Glu Gly Asn Leu Ile Gly Leu Pro Leu Leu Ile Asp Asn 630 635 640 645 tat gtg ccc cct ttg gag gga ctg cct atc ttc att ctt cga cta gcc 2024 Tyr Val Pro Pro Leu Glu Gly Leu Pro Ile Phe Ile Leu Arg Leu Ala 650 655 660 act gag gtg aat tgg gac gaa gaa aag gaa tgt ttt gaa agc ctc agt 2072 Thr Glu Val Asn Trp Asp Glu Glu Lys Glu Cys Phe Glu Ser Leu Ser 665 670 675 aaa gaa tgc gct atg ttc tat tcc atc cgg aag cag tac ata tct gag 2120 Lys Glu Cys Ala Met Phe Tyr Ser Ile Arg Lys Gln Tyr Ile Ser Glu 680 685 690 gag tcg acc ctc tca ggc cag cag agt gaa gtg cct ggc tcc att cca 2168 Glu Ser Thr Leu Ser Gly Gln Gln Ser Glu Val Pro Gly Ser Ile Pro 695 700 705 aac tcc tgg aag tgg act gtg gaa cac att gtc tat aaa gcc ttg cgc 2216 Asn Ser Trp Lys Trp Thr Val Glu His Ile Val Tyr Lys Ala Leu Arg 710 715 720 725 tca cac att ctg cct cct aaa cat ttc aca gaa gat gga aat atc ctg 2264 Ser His Ile Leu Pro Pro Lys His Phe Thr Glu Asp Gly Asn Ile Leu 730 735 740 cag ctt gct aac ctg cct gat cta tac aaa gtc ttt gag agg tgt taa 2312 Gln Leu Ala Asn Leu Pro Asp Leu Tyr Lys Val Phe Glu Arg Cys 745 750 755 atatggttat ttatgcactg tgggatgtgt tcttctttct ctgtattccg atacaaagtg 2372 ttgtatcaaa gtgtgatata caaagtgtac caacataagt gttggtagca cttaagactt 2432 atacttgcct tctgatagta ttcctttata cacagtggat tgattataaa taaatagatg 2492 tgtcttaaca taaaaaaaaa aaaaaaaaaa aaa 2525 <210> 2 <211> 756 <212> PRT <213> homo sapiens <400> 2 Met Ser Phe Val Ala Gly Val Ile Arg Arg Leu Asp Glu Thr Val Val 1 5 10 15 Asn Arg Ile Ala Ala Gly Glu Val Ile Gln Arg Pro Ala Asn Ala Ile 20 25 30 Lys Glu Met Ile Glu Asn Cys Leu Asp Ala Lys Ser Thr Ser Ile Gln 35 40 45 Val Ile Val Lys Glu Gly Gly Leu Lys Leu Ile Gln Ile Gln Asp Asn 50 55 60 Gly Thr Gly Ile Arg Lys Glu Asp Leu Asp Ile Val Cys Glu Arg Phe 65 70 75 80 Thr Thr Ser Lys Leu Gln Ser Phe Glu Asp Leu Ala Ser Ile Ser Thr 85 90 95 Tyr Gly Phe Arg Gly Glu Ala Leu Ala Ser Ile Ser His Val Ala His 100 105 110 Val Thr Ile Thr Thr Lys Thr Ala Asp Gly Lys Cys Ala Tyr Arg Ala 115 120 125 Ser Tyr Ser Asp Gly Lys Leu Lys Ala Pro Pro Lys Pro Cys Ala Gly 130 135 140 Asn Gln Gly Thr Gln Ile Thr Val Glu Asp Leu Phe Tyr Asn Ile Ala 145 150 155 160 Thr Arg Arg Lys Ala Leu Lys Asn Pro Ser Glu Glu Tyr Gly Lys Ile 165 170 175 Leu Glu Val Val Gly Arg Tyr Ser Val His Asn Ala Gly Ile Ser Phe 180 185 190 Ser Val Lys Lys Gln Gly Glu Thr Val Ala Asp Val Arg Thr Leu Pro 195 200 205 Asn Ala Ser Thr Val Asp Asn Ile Arg Ser Val Phe Gly Asn Ala Val 210 215 220 Ser Arg Glu Leu Ile Glu Ile Gly Cys Glu Asp Lys Thr Leu Ala Phe 225 230 235 240 Lys Met Asn Gly Tyr Ile Ser Asn Ala Asn Tyr Ser Val Lys Lys Cys 245 250 255 Ile Phe Leu Leu Phe Ile Asn His Arg Leu Val Glu Ser Thr Ser Leu 260 265 270 Arg Lys Ala Ile Glu Thr Val Tyr Ala Ala Tyr Leu Pro Lys Asn Thr 275 280 285 His Pro Phe Leu Tyr Leu Ser Leu Glu Ile Ser Pro Gln Asn Val Asp 290 295 300 Val Asn Val His Pro Thr Lys His Glu Val His Phe Leu His Glu Glu 305 310 315 320 Ser Ile Leu Glu Arg Val Gln Gln His Ile Glu Ser Lys Leu Leu Gly 325 330 335 Ser Asn Ser Ser Arg Met Tyr Phe Thr Gln Thr Leu Leu Pro Gly Leu 340 345 350 Ala Gly Pro Ser Gly Glu Met Val Lys Ser Thr Thr Ser Leu Thr Ser 355 360 365 Ser Ser Thr Ser Gly Ser Ser Asp Lys Val Tyr Ala His Gln Met Val 370 375 380 Arg Thr Asp Ser Arg Glu Gln Lys Leu Asp Ala Phe Leu Gln Pro Leu 385 390 395 400 Ser Lys Pro Leu Ser Ser Gln Pro Gln Ala Ile Val Thr Glu Asp Lys 405 410 415 Thr Asp Ile Ser Ser Gly Arg Ala Arg Gln Gln Asp Glu Glu Met Leu 420 425 430 Glu Leu Pro Ala Pro Ala Glu Val Ala Ala Lys Asn Gln Ser Leu Glu 435 440 445 Gly Asp Thr Thr Lys Gly Thr Ser Glu Met Ser Glu Lys Arg Gly Pro 450 455 460 Thr Ser Ser Asn Pro Arg Lys Arg His Arg Glu Asp Ser Asp Val Glu 465 470 475 480 Met Val Glu Asp Asp Ser Arg Lys Glu Met Thr Ala Ala Cys Thr Pro 485 490 495 Arg Arg Arg Ile Ile Asn Leu Thr Ser Val Leu Ser Leu Gln Glu Glu 500 505 510 Ile Asn Glu Gln Gly His Glu Val Leu Arg Glu Met Leu His Asn His 515 520 525 Ser Phe Val Gly Cys Val Asn Pro Gln Trp Ala Leu Ala Gln His Gln 530 535 540 Thr Lys Leu Tyr Leu Leu Asn Thr Thr Lys Leu Ser Glu Glu Leu Phe 545 550 555 560 Tyr Gln Ile Leu Ile Tyr Asp Phe Ala Asn Phe Gly Val Leu Arg Leu 565 570 575 Ser Glu Pro Ala Pro Leu Phe Asp Leu Ala Met Leu Ala Leu Asp Ser 580 585 590 Pro Glu Ser Gly Trp Thr Glu Glu Asp Gly Pro Lys Glu Gly Leu Ala 595 600 605 Glu Tyr Ile Val Glu Phe Leu Lys Lys Lys Ala Glu Met Leu Ala Asp 610 615 620 Tyr Phe Ser Leu Glu Ile Asp Glu Glu Gly Asn Leu Ile Gly Leu Pro 625 630 635 640 Leu Leu Ile Asp Asn Tyr Val Pro Pro Leu Glu Gly Leu Pro Ile Phe 645 650 655 Ile Leu Arg Leu Ala Thr Glu Val Asn Trp Asp Glu Glu Lys Glu Cys 660 665 670 Phe Glu Ser Leu Ser Lys Glu Cys Ala Met Phe Tyr Ser Ile Arg Lys 675 680 685 Gln Tyr Ile Ser Glu Glu Ser Thr Leu Ser Gly Gln Gln Ser Glu Val 690 695 700 Pro Gly Ser Ile Pro Asn Ser Trp Lys Trp Thr Val Glu His Ile Val 705 710 715 720 Tyr Lys Ala Leu Arg Ser His Ile Leu Pro Pro Lys His Phe Thr Glu 725 730 735 Asp Gly Asn Ile Leu Gln Leu Ala Asn Leu Pro Asp Leu Tyr Lys Val 740 745 750 Phe Glu Arg Cys 755 <210> 3 <211> 3063 <212> DNA <213> homo sapiens <220> <221> CDS <222> (81)..(2879) <400> 3 ggcacgagtg gctgcttgcg gctagtggat ggtaattgcc tgcctcgcgc tagcagcaag 60 ctgctctgtt aaaagcgaaa atg aaa caa ttg cct gcg gca aca gtt cga ctc 113 Met Lys Gln Leu Pro Ala Ala Thr Val Arg Leu 1 5 10 ctt tca agt tct cag atc atc act tcg gtg gtc agt gtt gta aaa gag 161 Leu Ser Ser Ser Gln Ile Ile Thr Ser Val Val Ser Val Val Lys Glu 15 20 25 ctt att gaa aac tcc ttg gat gct ggt gcc aca agc gta gat gtt aaa 209 Leu Ile Glu Asn Ser Leu Asp Ala Gly Ala Thr Ser Val Asp Val Lys 30 35 40 ctg gag aac tat gga ttt gat aaa att gag gtg cga gat aac ggg gag 257 Leu Glu Asn Tyr Gly Phe Asp Lys Ile Glu Val Arg Asp Asn Gly Glu 45 50 55 ggt atc aag gct gtt gat gca cct gta atg gca atg aag tac tac acc 305 Gly Ile Lys Ala Val Asp Ala Pro Val Met Ala Met Lys Tyr Tyr Thr 60 65 70 75 tca aaa ata aat agt cat gaa gat ctt gaa aat ttg aca act tac ggt 353 Ser Lys Ile Asn Ser His Glu Asp Leu Glu Asn Leu Thr Thr Tyr Gly 80 85 90 ttt cgt gga gaa gcc ttg ggg tca att tgt tgt ata gct gag gtt tta 401 Phe Arg Gly Glu Ala Leu Gly Ser Ile Cys Cys Ile Ala Glu Val Leu 95 100 105 att aca aca aga acg gct gct gat aat ttt agc acc cag tat gtt tta 449 Ile Thr Thr Arg Thr Ala Ala Asp Asn Phe Ser Thr Gln Tyr Val Leu 110 115 120 gat ggc agt ggc cac ata ctt tct cag aaa cct tca cat ctt ggt caa 497 Asp Gly Ser Gly His Ile Leu Ser Gln Lys Pro Ser His Leu Gly Gln 125 130 135 ggt aca act gta act gct tta aga tta ttt aag aat cta cct gta aga 545 Gly Thr Thr Val Thr Ala Leu Arg Leu Phe Lys Asn Leu Pro Val Arg 140 145 150 155 aag cag ttt tac tca act gca aaa aaa tgt aaa gat gaa ata aaa aag 593 Lys Gln Phe Tyr Ser Thr Ala Lys Lys Cys Lys Asp Glu Ile Lys Lys 160 165 170 atc caa gat ctc ctc atg agc ttt ggt atc ctt aaa cct gac tta agg 641 Ile Gln Asp Leu Leu Met Ser Phe Gly Ile Leu Lys Pro Asp Leu Arg 175 180 185 att gtc ttt gta cat aac aag gca gtt att tgg cag aaa agc aga gta 689 Ile Val Phe Val His Asn Lys Ala Val Ile Trp Gln Lys Ser Arg Val 190 195 200 tca gat cac aag atg gct ctc atg tca gtt ctg ggg act gct gtt atg 737 Ser Asp His Lys Met Ala Leu Met Ser Val Leu Gly Thr Ala Val Met 205 210 215 aac aat atg gaa tcc ttt cag tac cac tct gaa gaa tct cag att tat 785 Asn Asn Met Glu Ser Phe Gln Tyr His Ser Glu Glu Ser Gln Ile Tyr 220 225 230 235 ctc agt gga ttt ctt cca aag tgt gat gca gac cac tct ttc act agt 833 Leu Ser Gly Phe Leu Pro Lys Cys Asp Ala Asp His Ser Phe Thr Ser 240 245 250 ctt tca aca cca gaa aga agt ttc atc ttc ata aac agt cga cca gta 881 Leu Ser Thr Pro Glu Arg Ser Phe Ile Phe Ile Asn Ser Arg Pro Val 255 260 265 cat caa aaa gat atc tta aag tta atc cga cat cat tac aat ctg aaa 929 His Gln Lys Asp Ile Leu Lys Leu Ile Arg His His Tyr Asn Leu Lys 270 275 280 tgc cta aag gaa tct act cgt ttg tat cct gtt ttc ttt ctg aaa atc 977 Cys Leu Lys Glu Ser Thr Arg Leu Tyr Pro Val Phe Phe Leu Lys Ile 285 290 295 gat gtt cct aca gct gat gtt gat gta aat tta aca cca gat aaa agc 1025 Asp Val Pro Thr Ala Asp Val Asp Val Asn Leu Thr Pro Asp Lys Ser 300 305 310 315 caa gta tta tta caa aat aag gaa tct gtt tta att gct ctt gaa aat 1073 Gln Val Leu Leu Gln Asn Lys Glu Ser Val Leu Ile Ala Leu Glu Asn 320 325 330 ctg atg acg act tgt tat gga cca tta cct agt aca aat tct tat gaa 1121 Leu Met Thr Thr Cys Tyr Gly Pro Leu Pro Ser Thr Asn Ser Tyr Glu 335 340 345 aat aat aaa aca gat gtt tcc gca gct gac atc gtt ctt agt aaa aca 1169 Asn Asn Lys Thr Asp Val Ser Ala Ala Asp Ile Val Leu Ser Lys Thr 350 355 360 gca gaa aca gat gtg ctt ttt aat aaa gtg gaa tca tct gga aag aat 1217 Ala Glu Thr Asp Val Leu Phe Asn Lys Val Glu Ser Ser Gly Lys Asn 365 370 375 tat tca aat gtt gat act tca gtc att cca ttc caa aat gat atg cat 1265 Tyr Ser Asn Val Asp Thr Ser Val Ile Pro Phe Gln Asn Asp Met His 380 385 390 395 aat gat gaa tct gga aaa aac act gat gat tgt tta aat cac cag ata 1313 Asn Asp Glu Ser Gly Lys Asn Thr Asp Asp Cys Leu Asn His Gln Ile 400 405 410 agt att ggt gac ttt ggt tat ggt cat tgt agt agt gaa att tct aac 1361 Ser Ile Gly Asp Phe Gly Tyr Gly His Cys Ser Ser Glu Ile Ser Asn 415 420 425 att gat aaa aac act aag aat gca ttt cag gac att tca atg agt aat 1409 Ile Asp Lys Asn Thr Lys Asn Ala Phe Gln Asp Ile Ser Met Ser Asn 430 435 440 gta tca tgg gag aac tct cag acg gaa tat agt aaa act tgt ttt ata 1457 Val Ser Trp Glu Asn Ser Gln Thr Glu Tyr Ser Lys Thr Cys Phe Ile 445 450 455 agt tcc gtt aag cac acc cag tca gaa aat ggc aat aaa gac cat ata 1505 Ser Ser Val Lys His Thr Gln Ser Glu Asn Gly Asn Lys Asp His Ile 460 465 470 475 gat gag agt ggg gaa aat gag gaa gaa gca ggt ctt gaa aac tct tcg 1553 Asp Glu Ser Gly Glu Asn Glu Glu Glu Ala Gly Leu Glu Asn Ser Ser 480 485 490 gaa att tct gca gat gag tgg agc agg gga aat ata ctt aaa aat tca 1601 Glu Ile Ser Ala Asp Glu Trp Ser Arg Gly Asn Ile Leu Lys Asn Ser 495 500 505 gtg gga gag aat att gaa cct gtg aaa att tta gtg cct gaa aaa agt 1649 Val Gly Glu Asn Ile Glu Pro Val Lys Ile Leu Val Pro Glu Lys Ser 510 515 520 tta cca tgt aaa gta agt aat aat aat tat cca atc cct gaa caa atg 1697 Leu Pro Cys Lys Val Ser Asn Asn Asn Tyr Pro Ile Pro Glu Gln Met 525 530 535 aat ctt aat gaa gat tca tgt aac aaa aaa tca aat gta ata gat aat 1745 Asn Leu Asn Glu Asp Ser Cys Asn Lys Lys Ser Asn Val Ile Asp Asn 540 545 550 555 aaa tct gga aaa gtt aca gct tat gat tta ctt agc aat cga gta atc 1793 Lys Ser Gly Lys Val Thr Ala Tyr Asp Leu Leu Ser Asn Arg Val Ile 560 565 570 aag aaa ccc atg tca gca agt gct ctt ttt gtt caa gat cat cgt cct 1841 Lys Lys Pro Met Ser Ala Ser Ala Leu Phe Val Gln Asp His Arg Pro 575 580 585 cag ttt ctc ata gaa aat cct aag act agt tta gag gat gca aca cta 1889 Gln Phe Leu Ile Glu Asn Pro Lys Thr Ser Leu Glu Asp Ala Thr Leu 590 595 600 caa att gaa gaa ctg tgg aag aca ttg agt gaa gag gaa aaa ctg aaa 1937 Gln Ile Glu Glu Leu Trp Lys Thr Leu Ser Glu Glu Glu Lys Leu Lys 605 610 615 tat gaa gag aag gct act aaa gac ttg gaa cga tac aat agt caa atg 1985 Tyr Glu Glu Lys Ala Thr Lys Asp Leu Glu Arg Tyr Asn Ser Gln Met 620 625 630 635 aag aga gcc att gaa cag gag tca caa atg tca cta aaa gat ggc aga 2033 Lys Arg Ala Ile Glu Gln Glu Ser Gln Met Ser Leu Lys Asp Gly Arg 640 645 650 aaa aag ata aaa ccc acc agc gca tgg aat ttg gcc cag aag cac aag 2081 Lys Lys Ile Lys Pro Thr Ser Ala Trp Asn Leu Ala Gln Lys His Lys 655 660 665 tta aaa acc tca tta tct aat caa cca aaa ctt gat gaa ctc ctt cag 2129 Leu Lys Thr Ser Leu Ser Asn Gln Pro Lys Leu Asp Glu Leu Leu Gln 670 675 680 tcc caa att gaa aaa aga agg agt caa aat att aaa atg gta cag atc 2177 Ser Gln Ile Glu Lys Arg Arg Ser Gln Asn Ile Lys Met Val Gln Ile 685 690 695 ccc ttt tct atg aaa aac tta aaa ata aat ttt aag aaa caa aac aaa 2225 Pro Phe Ser Met Lys Asn Leu Lys Ile Asn Phe Lys Lys Gln Asn Lys 700 705 710 715 gtt gac tta gaa gag aag gat gaa cct tgc ttg atc cac aat ctc agg 2273 Val Asp Leu Glu Glu Lys Asp Glu Pro Cys Leu Ile His Asn Leu Arg 720 725 730 ttt cct gat gca tgg cta atg aca tcc aaa aca gag gta atg tta tta 2321 Phe Pro Asp Ala Trp Leu Met Thr Ser Lys Thr Glu Val Met Leu Leu 735 740 745 aat cca tat aga gta gaa gaa gcc ctg cta ttt aaa aga ctt ctt gag 2369 Asn Pro Tyr Arg Val Glu Glu Ala Leu Leu Phe Lys Arg Leu Leu Glu 750 755 760 aat cat aaa ctt cct gca gag cca ctg gaa aag cca att atg tta aca 2417 Asn His Lys Leu Pro Ala Glu Pro Leu Glu Lys Pro Ile Met Leu Thr 765 770 775 gag agt ctt ttt aat gga tct cat tat tta gac gtt tta tat aaa atg 2465 Glu Ser Leu Phe Asn Gly Ser His Tyr Leu Asp Val Leu Tyr Lys Met 780 785 790 795 aca gca gat gac caa aga tac agt gga tca act tac ctg tct gat cct 2513 Thr Ala Asp Asp Gln Arg Tyr Ser Gly Ser Thr Tyr Leu Ser Asp Pro 800 805 810 cgt ctt aca gcg aat ggt ttc aag ata aaa ttg ata cca gga gtt tca 2561 Arg Leu Thr Ala Asn Gly Phe Lys Ile Lys Leu Ile Pro Gly Val Ser 815 820 825 att act gaa aat tac ttg gaa ata gaa gga atg gct aat tgt ctc cca 2609 Ile Thr Glu Asn Tyr Leu Glu Ile Glu Gly Met Ala Asn Cys Leu Pro 830 835 840 ttc tat gga gta gca gat tta aaa gaa att ctt aat gct ata tta aac 2657 Phe Tyr Gly Val Ala Asp Leu Lys Glu Ile Leu Asn Ala Ile Leu Asn 845 850 855 aga aat gca aag gaa gtt tat gaa tgt aga cct cgc aaa gtg ata agt 2705 Arg Asn Ala Lys Glu Val Tyr Glu Cys Arg Pro Arg Lys Val Ile Ser 860 865 870 875 tat tta gag gga gaa gca gtg cgt cta tcc aga caa tta ccc atg tac 2753 Tyr Leu Glu Gly Glu Ala Val Arg Leu Ser Arg Gln Leu Pro Met Tyr 880 885 890 tta tca aaa gag gac atc caa gac att atc tac aga atg aag cac cag 2801 Leu Ser Lys Glu Asp Ile Gln Asp Ile Ile Tyr Arg Met Lys His Gln 895 900 905 ttt gga aat gaa att aaa gag tgt gtt cat ggt cgc cca ttt ttt cat 2849 Phe Gly Asn Glu Ile Lys Glu Cys Val His Gly Arg Pro Phe Phe His 910 915 920 cat tta acc tat ctt cca gaa act aca tga ttaaatatgt ttaagaagat 2899 His Leu Thr Tyr Leu Pro Glu Thr Thr 925 930 tagttaccat tgaaattggt tctgtcataa aacagcatga gtctggtttt aaattatctt 2959 tgtattatgt gtcacatggt tattttttaa atgaggattc actgacttgt ttttatattg 3019 aaaaaagttc cacgtattgt agaaaacgta aataaactaa taac 3063 <210> 4 <211> 932 <212> PRT <213> homo sapiens <400> 4 Met Lys Gln Leu Pro Ala Ala Thr Val Arg Leu Leu Ser Ser Ser Gln 1 5 10 15 Ile Ile Thr Ser Val Val Ser Val Val Lys Glu Leu Ile Glu Asn Ser 20 25 30 Leu Asp Ala Gly Ala Thr Ser Val Asp Val Lys Leu Glu Asn Tyr Gly 35 40 45 Phe Asp Lys Ile Glu Val Arg Asp Asn Gly Glu Gly Ile Lys Ala Val 50 55 60 Asp Ala Pro Val Met Ala Met Lys Tyr Tyr Thr Ser Lys Ile Asn Ser 65 70 75 80 His Glu Asp Leu Glu Asn Leu Thr Thr Tyr Gly Phe Arg Gly Glu Ala 85 90 95 Leu Gly Ser Ile Cys Cys Ile Ala Glu Val Leu Ile Thr Thr Arg Thr 100 105 110 Ala Ala Asp Asn Phe Ser Thr Gln Tyr Val Leu Asp Gly Ser Gly His 115 120 125 Ile Leu Ser Gln Lys Pro Ser His Leu Gly Gln Gly Thr Thr Val Thr 130 135 140 Ala Leu Arg Leu Phe Lys Asn Leu Pro Val Arg Lys Gln Phe Tyr Ser 145 150 155 160 Thr Ala Lys Lys Cys Lys Asp Glu Ile Lys Lys Ile Gln Asp Leu Leu 165 170 175 Met Ser Phe Gly Ile Leu Lys Pro Asp Leu Arg Ile Val Phe Val His 180 185 190 Asn Lys Ala Val Ile Trp Gln Lys Ser Arg Val Ser Asp His Lys Met 195 200 205 Ala Leu Met Ser Val Leu Gly Thr Ala Val Met Asn Asn Met Glu Ser 210 215 220 Phe Gln Tyr His Ser Glu Glu Ser Gln Ile Tyr Leu Ser Gly Phe Leu 225 230 235 240 Pro Lys Cys Asp Ala Asp His Ser Phe Thr Ser Leu Ser Thr Pro Glu 245 250 255 Arg Ser Phe Ile Phe Ile Asn Ser Arg Pro Val His Gln Lys Asp Ile 260 265 270 Leu Lys Leu Ile Arg His His Tyr Asn Leu Lys Cys Leu Lys Glu Ser 275 280 285 Thr Arg Leu Tyr Pro Val Phe Phe Leu Lys Ile Asp Val Pro Thr Ala 290 295 300 Asp Val Asp Val Asn Leu Thr Pro Asp Lys Ser Gln Val Leu Leu Gln 305 310 315 320 Asn Lys Glu Ser Val Leu Ile Ala Leu Glu Asn Leu Met Thr Thr Cys 325 330 335 Tyr Gly Pro Leu Pro Ser Thr Asn Ser Tyr Glu Asn Asn Lys Thr Asp 340 345 350 Val Ser Ala Ala Asp Ile Val Leu Ser Lys Thr Ala Glu Thr Asp Val 355 360 365 Leu Phe Asn Lys Val Glu Ser Ser Gly Lys Asn Tyr Ser Asn Val Asp 370 375 380 Thr Ser Val Ile Pro Phe Gln Asn Asp Met His Asn Asp Glu Ser Gly 385 390 395 400 Lys Asn Thr Asp Asp Cys Leu Asn His Gln Ile Ser Ile Gly Asp Phe 405 410 415 Gly Tyr Gly His Cys Ser Ser Glu Ile Ser Asn Ile Asp Lys Asn Thr 420 425 430 Lys Asn Ala Phe Gln Asp Ile Ser Met Ser Asn Val Ser Trp Glu Asn 435 440 445 Ser Gln Thr Glu Tyr Ser Lys Thr Cys Phe Ile Ser Ser Val Lys His 450 455 460 Thr Gln Ser Glu Asn Gly Asn Lys Asp His Ile Asp Glu Ser Gly Glu 465 470 475 480 Asn Glu Glu Glu Ala Gly Leu Glu Asn Ser Ser Glu Ile Ser Ala Asp 485 490 495 Glu Trp Ser Arg Gly Asn Ile Leu Lys Asn Ser Val Gly Glu Asn Ile 500 505 510 Glu Pro Val Lys Ile Leu Val Pro Glu Lys Ser Leu Pro Cys Lys Val 515 520 525 Ser Asn Asn Asn Tyr Pro Ile Pro Glu Gln Met Asn Leu Asn Glu Asp 530 535 540 Ser Cys Asn Lys Lys Ser Asn Val Ile Asp Asn Lys Ser Gly Lys Val 545 550 555 560 Thr Ala Tyr Asp Leu Leu Ser Asn Arg Val Ile Lys Lys Pro Met Ser 565 570 575 Ala Ser Ala Leu Phe Val Gln Asp His Arg Pro Gln Phe Leu Ile Glu 580 585 590 Asn Pro Lys Thr Ser Leu Glu Asp Ala Thr Leu Gln Ile Glu Glu Leu 595 600 605 Trp Lys Thr Leu Ser Glu Glu Glu Lys Leu Lys Tyr Glu Glu Lys Ala 610 615 620 Thr Lys Asp Leu Glu Arg Tyr Asn Ser Gln Met Lys Arg Ala Ile Glu 625 630 635 640 Gln Glu Ser Gln Met Ser Leu Lys Asp Gly Arg Lys Lys Ile Lys Pro 645 650 655 Thr Ser Ala Trp Asn Leu Ala Gln Lys His Lys Leu Lys Thr Ser Leu 660 665 670 Ser Asn Gln Pro Lys Leu Asp Glu Leu Leu Gln Ser Gln Ile Glu Lys 675 680 685 Arg Arg Ser Gln Asn Ile Lys Met Val Gln Ile Pro Phe Ser Met Lys 690 695 700 Asn Leu Lys Ile Asn Phe Lys Lys Gln Asn Lys Val Asp Leu Glu Glu 705 710 715 720 Lys Asp Glu Pro Cys Leu Ile His Asn Leu Arg Phe Pro Asp Ala Trp 725 730 735 Leu Met Thr Ser Lys Thr Glu Val Met Leu Leu Asn Pro Tyr Arg Val 740 745 750 Glu Glu Ala Leu Leu Phe Lys Arg Leu Leu Glu Asn His Lys Leu Pro 755 760 765 Ala Glu Pro Leu Glu Lys Pro Ile Met Leu Thr Glu Ser Leu Phe Asn 770 775 780 Gly Ser His Tyr Leu Asp Val Leu Tyr Lys Met Thr Ala Asp Asp Gln 785 790 795 800 Arg Tyr Ser Gly Ser Thr Tyr Leu Ser Asp Pro Arg Leu Thr Ala Asn 805 810 815 Gly Phe Lys Ile Lys Leu Ile Pro Gly Val Ser Ile Thr Glu Asn Tyr 820 825 830 Leu Glu Ile Glu Gly Met Ala Asn Cys Leu Pro Phe Tyr Gly Val Ala 835 840 845 Asp Leu Lys Glu Ile Leu Asn Ala Ile Leu Asn Arg Asn Ala Lys Glu 850 855 860 Val Tyr Glu Cys Arg Pro Arg Lys Val Ile Ser Tyr Leu Glu Gly Glu 865 870 875 880 Ala Val Arg Leu Ser Arg Gln Leu Pro Met Tyr Leu Ser Lys Glu Asp 885 890 895 Ile Gln Asp Ile Ile Tyr Arg Met Lys His Gln Phe Gly Asn Glu Ile 900 905 910 Lys Glu Cys Val His Gly Arg Pro Phe Phe His His Leu Thr Tyr Leu 915 920 925 Pro Glu Thr Thr 930 <210> 5 <211> 2771 <212> DNA <213> homo sapiens <220> <221> CDS <222> (25)..(2613) <400> 5 cgaggcggat cgggtgttgc atcc atg gag cga gct gag agc tcg agt aca 51 Met Glu Arg Ala Glu Ser Ser Ser Thr 1 5 gaa cct gct aag gcc atc aaa cct att gat cgg aag tca gtc cat cag 99 Glu Pro Ala Lys Ala Ile Lys Pro Ile Asp Arg Lys Ser Val His Gln 10 15 20 25 att tgc tct ggg cag gtg gta ctg agt cta agc act gcg gta aag gag 147 Ile Cys Ser Gly Gln Val Val Leu Ser Leu Ser Thr Ala Val Lys Glu 30 35 40 tta gta gaa aac agt ctg gat gct ggt gcc act aat att gat cta aag 195 Leu Val Glu Asn Ser Leu Asp Ala Gly Ala Thr Asn Ile Asp Leu Lys 45 50 55 ctt aag gac tat gga gtg gat ctt att gaa gtt tca gac aat gga tgt 243 Leu Lys Asp Tyr Gly Val Asp Leu Ile Glu Val Ser Asp Asn Gly Cys 60 65 70 ggg gta gaa gaa gaa aac ttc gaa ggc tta act ctg aaa cat cac aca 291 Gly Val Glu Glu Glu Asn Phe Glu Gly Leu Thr Leu Lys His His Thr 75 80 85 tct aag att caa gag ttt gcc gac cta act cag gtt gaa act ttt ggc 339 Ser Lys Ile Gln Glu Phe Ala Asp Leu Thr Gln Val Glu Thr Phe Gly 90 95 100 105 ttt cgg ggg gaa gct ctg agc tca ctt tgt gca ctg agc gat gtc acc 387 Phe Arg Gly Glu Ala Leu Ser Ser Leu Cys Ala Leu Ser Asp Val Thr 110 115 120 att tct acc tgc cac gca tcg gcg aag gtt gga act cga ctg atg ttt 435 Ile Ser Thr Cys His Ala Ser Ala Lys Val Gly Thr Arg Leu Met Phe 125 130 135 gat cac aat ggg aaa att atc cag aaa acc ccc tac ccc cgc ccc aga 483 Asp His Asn Gly Lys Ile Ile Gln Lys Thr Pro Tyr Pro Arg Pro Arg 140 145 150 ggg acc aca gtc agc gtg cag cag tta ttt tcc aca cta cct gtg cgc 531 Gly Thr Thr Val Ser Val Gln Gln Leu Phe Ser Thr Leu Pro Val Arg 155 160 165 cat aag gaa ttt caa agg aat att aag aag gag tat gcc aaa atg gtc 579 His Lys Glu Phe Gln Arg Asn Ile Lys Lys Glu Tyr Ala Lys Met Val 170 175 180 185 cag gtc tta cat gca tac tgt atc att tca gca ggc atc cgt gta agt 627 Gln Val Leu His Ala Tyr Cys Ile Ile Ser Ala Gly Ile Arg Val Ser 190 195 200 tgc acc aat cag ctt gga caa gga aaa cga cag cct gtg gta tgc aca 675 Cys Thr Asn Gln Leu Gly Gln Gly Lys Arg Gln Pro Val Val Cys Thr 205 210 215 ggt gga agc ccc agc ata aag gaa aat atc ggc tct gtg ttt ggg cag 723 Gly Gly Ser Pro Ser Ile Lys Glu Asn Ile Gly Ser Val Phe Gly Gln 220 225 230 aag cag ttg caa agc ctc att cct ttt gtt cag ctg ccc cct agt gac 771 Lys Gln Leu Gln Ser Leu Ile Pro Phe Val Gln Leu Pro Pro Ser Asp 235 240 245 tcc gtg tgt gaa gag tac ggt ttg agc tgt tcg gat gct ctg cat aat 819 Ser Val Cys Glu Glu Tyr Gly Leu Ser Cys Ser Asp Ala Leu His Asn 250 255 260 265 ctt ttt tac atc tca ggt ttc att tca caa tgc acg cat gga gtt gga 867 Leu Phe Tyr Ile Ser Gly Phe Ile Ser Gln Cys Thr His Gly Val Gly 270 275 280 agg agt tca aca gac aga cag ttt ttc ttt atc aac cgg cgg cct tgt 915 Arg Ser Ser Thr Asp Arg Gln Phe Phe Phe Ile Asn Arg Arg Pro Cys 285 290 295 gac cca gca aag gtc tgc aga ctc gtg aat gag gtc tac cac atg tat 963 Asp Pro Ala Lys Val Cys Arg Leu Val Asn Glu Val Tyr His Met Tyr 300 305 310 aat cga cac cag tat cca ttt gtt gtt ctt aac att tct gtt gat tca 1011 Asn Arg His Gln Tyr Pro Phe Val Val Leu Asn Ile Ser Val Asp Ser 315 320 325 gaa tgc gtt gat atc aat gtt act cca gat aaa agg caa att ttg cta 1059 Glu Cys Val Asp Ile Asn Val Thr Pro Asp Lys Arg Gln Ile Leu Leu 330 335 340 345 caa gag gaa aag ctt ttg ttg gca gtt tta aag acc tct ttg ata gga 1107 Gln Glu Glu Lys Leu Leu Leu Ala Val Leu Lys Thr Ser Leu Ile Gly 350 355 360 atg ttt gat agt gat gtc aac aag cta aat gtc agt cag cag cca ctg 1155 Met Phe Asp Ser Asp Val Asn Lys Leu Asn Val Ser Gln Gln Pro Leu 365 370 375 ctg gat gtt gaa ggt aac tta ata aaa atg cat gca gcg gat ttg gaa 1203 Leu Asp Val Glu Gly Asn Leu Ile Lys Met His Ala Ala Asp Leu Glu 380 385 390 aag ccc atg gta gaa aag cag gat caa tcc cct tca tta agg act gga 1251 Lys Pro Met Val Glu Lys Gln Asp Gln Ser Pro Ser Leu Arg Thr Gly 395 400 405 gaa gaa aaa aaa gac gtg tcc att tcc aga ctg cga gag gcc ttt tct 1299 Glu Glu Lys Lys Asp Val Ser Ile Ser Arg Leu Arg Glu Ala Phe Ser 410 415 420 425 ctt cgt cac aca aca gag aac aag cct cac agc cca aag act cca gaa 1347 Leu Arg His Thr Thr Glu Asn Lys Pro His Ser Pro Lys Thr Pro Glu 430 435 440 cca aga agg agc cct cta gga cag aaa agg ggt atg ctg tct tct agc 1395 Pro Arg Arg Ser Pro Leu Gly Gln Lys Arg Gly Met Leu Ser Ser Ser 445 450 455 act tca ggt gcc atc tct gac aaa ggc gtc ctg aga cct cag aaa gag 1443 Thr Ser Gly Ala Ile Ser Asp Lys Gly Val Leu Arg Pro Gln Lys Glu 460 465 470 gca gtg agt tcc agt cac gga ccc agt gac cct acg gac aga gcg gag 1491 Ala Val Ser Ser Ser His Gly Pro Ser Asp Pro Thr Asp Arg Ala Glu 475 480 485 gtg gag aag gac tcg ggg cac ggc agc act tcc gtg gat tct gag ggg 1539 Val Glu Lys Asp Ser Gly His Gly Ser Thr Ser Val Asp Ser Glu Gly 490 495 500 505 ttc agc atc cca gac acg ggc agt cac tgc agc agc gag tat gcg gcc 1587 Phe Ser Ile Pro Asp Thr Gly Ser His Cys Ser Ser Glu Tyr Ala Ala 510 515 520 agc tcc cca ggg gac agg ggc tcg cag gaa cat gtg gac tct cag gag 1635 Ser Ser Pro Gly Asp Arg Gly Ser Gln Glu His Val Asp Ser Gln Glu 525 530 535 aaa gcg cct gaa act gac gac tct ttt tca gat gtg gac tgc cat tca 1683 Lys Ala Pro Glu Thr Asp Asp Ser Phe Ser Asp Val Asp Cys His Ser 540 545 550 aac cag gaa gat acc gga tgt aaa ttt cga gtt ttg cct cag cca act 1731 Asn Gln Glu Asp Thr Gly Cys Lys Phe Arg Val Leu Pro Gln Pro Thr 555 560 565 aat ctc gca acc cca aac aca aag cgt ttt aaa aaa gaa gaa att ctt 1779 Asn Leu Ala Thr Pro Asn Thr Lys Arg Phe Lys Lys Glu Glu Ile Leu 570 575 580 585 tcc agt tct gac att tgt caa aag tta gta aat act cag gac atg tca 1827 Ser Ser Ser Asp Ile Cys Gln Lys Leu Val Asn Thr Gln Asp Met Ser 590 595 600 gcc tct cag gtt gat gta gct gtg aaa att aat aag aaa gtt gtg ccc 1875 Ala Ser Gln Val Asp Val Ala Val Lys Ile Asn Lys Lys Val Val Pro 605 610 615 ctg gac ttt tct atg agt tct tta gct aaa cga ata aag cag tta cat 1923 Leu Asp Phe Ser Met Ser Ser Leu Ala Lys Arg Ile Lys Gln Leu His 620 625 630 cat gaa gca cag caa agt gaa ggg gaa cag aat tac agg aag ttt agg 1971 His Glu Ala Gln Gln Ser Glu Gly Glu Gln Asn Tyr Arg Lys Phe Arg 635 640 645 gca aag att tgt cct gga gaa aat caa gca gcc gaa gat gaa cta aga 2019 Ala Lys Ile Cys Pro Gly Glu Asn Gln Ala Ala Glu Asp Glu Leu Arg 650 655 660 665 aaa gag ata agt aaa acg atg ttt gca gaa atg gaa atc att ggt cag 2067 Lys Glu Ile Ser Lys Thr Met Phe Ala Glu Met Glu Ile Ile Gly Gln 670 675 680 ttt aac ctg gga ttt ata ata acc aaa ctg aat gag gat atc ttc ata 2115 Phe Asn Leu Gly Phe Ile Ile Thr Lys Leu Asn Glu Asp Ile Phe Ile 685 690 695 gtg gac cag cat gcc acg gac gag aag tat aac ttc gag atg ctg cag 2163 Val Asp Gln His Ala Thr Asp Glu Lys Tyr Asn Phe Glu Met Leu Gln 700 705 710 cag cac acc gtg ctc cag ggg cag agg ctc ata gca cct cag act ctc 2211 Gln His Thr Val Leu Gln Gly Gln Arg Leu Ile Ala Pro Gln Thr Leu 715 720 725 aac tta act gct gtt aat gaa gct gtt ctg ata gaa aat ctg gaa ata 2259 Asn Leu Thr Ala Val Asn Glu Ala Val Leu Ile Glu Asn Leu Glu Ile 730 735 740 745 ttt aga aag aat ggc ttt gat ttt gtt atc gat gaa aat gct cca gtc 2307 Phe Arg Lys Asn Gly Phe Asp Phe Val Ile Asp Glu Asn Ala Pro Val 750 755 760 act gaa agg gct aaa ctg att tcc ttg cca act agt aaa aac tgg acc 2355 Thr Glu Arg Ala Lys Leu Ile Ser Leu Pro Thr Ser Lys Asn Trp Thr 765 770 775 ttc gga ccc cag gac gtc gat gaa ctg atc ttc atg ctg agc gac agc 2403 Phe Gly Pro Gln Asp Val Asp Glu Leu Ile Phe Met Leu Ser Asp Ser 780 785 790 cct ggg gtc atg tgc cgg cct tcc cga gtc aag cag atg ttt gcc tcc 2451 Pro Gly Val Met Cys Arg Pro Ser Arg Val Lys Gln Met Phe Ala Ser 795 800 805 aga gcc tgc cgg aag tcg gtg atg att ggg act gct ctt aac aca agc 2499 Arg Ala Cys Arg Lys Ser Val Met Ile Gly Thr Ala Leu Asn Thr Ser 810 815 820 825 gag atg aag aaa ctg atc acc cac atg ggg gag atg gac cac ccc tgg 2547 Glu Met Lys Lys Leu Ile Thr His Met Gly Glu Met Asp His Pro Trp 830 835 840 aac tgt ccc cat gga agg cca acc atg aga cac atc gcc aac ctg ggt 2595 Asn Cys Pro His Gly Arg Pro Thr Met Arg His Ile Ala Asn Leu Gly 845 850 855 gtc att tct cag aac tga ccgtagtcac tgtatggaat aattggtttt 2643 Val Ile Ser Gln Asn 860 atcgcagatt tttatgtttt gaaagacaga gtcttcacta accttttttg ttttaaaatg 2703 aaacctgcta cttaaaaaaa atacacatca cacccattta aaagtgatct tgagaacctt 2763 ttcaaacc 2771 <210> 6 <211> 862 <212> PRT <213> homo sapiens <400> 6 Met Glu Arg Ala Glu Ser Ser Ser Thr Glu Pro Ala Lys Ala Ile Lys 1 5 10 15 Pro Ile Asp Arg Lys Ser Val His Gln Ile Cys Ser Gly Gln Val Val 20 25 30 Leu Ser Leu Ser Thr Ala Val Lys Glu Leu Val Glu Asn Ser Leu Asp 35 40 45 Ala Gly Ala Thr Asn Ile Asp Leu Lys Leu Lys Asp Tyr Gly Val Asp 50 55 60 Leu Ile Glu Val Ser Asp Asn Gly Cys Gly Val Glu Glu Glu Asn Phe 65 70 75 80 Glu Gly Leu Thr Leu Lys His His Thr Ser Lys Ile Gln Glu Phe Ala 85 90 95 Asp Leu Thr Gln Val Glu Thr Phe Gly Phe Arg Gly Glu Ala Leu Ser 100 105 110 Ser Leu Cys Ala Leu Ser Asp Val Thr Ile Ser Thr Cys His Ala Ser 115 120 125 Ala Lys Val Gly Thr Arg Leu Met Phe Asp His Asn Gly Lys Ile Ile 130 135 140 Gln Lys Thr Pro Tyr Pro Arg Pro Arg Gly Thr Thr Val Ser Val Gln 145 150 155 160 Gln Leu Phe Ser Thr Leu Pro Val Arg His Lys Glu Phe Gln Arg Asn 165 170 175 Ile Lys Lys Glu Tyr Ala Lys Met Val Gln Val Leu His Ala Tyr Cys 180 185 190 Ile Ile Ser Ala Gly Ile Arg Val Ser Cys Thr Asn Gln Leu Gly Gln 195 200 205 Gly Lys Arg Gln Pro Val Val Cys Thr Gly Gly Ser Pro Ser Ile Lys 210 215 220 Glu Asn Ile Gly Ser Val Phe Gly Gln Lys Gln Leu Gln Ser Leu Ile 225 230 235 240 Pro Phe Val Gln Leu Pro Pro Ser Asp Ser Val Cys Glu Glu Tyr Gly 245 250 255 Leu Ser Cys Ser Asp Ala Leu His Asn Leu Phe Tyr Ile Ser Gly Phe 260 265 270 Ile Ser Gln Cys Thr His Gly Val Gly Arg Ser Ser Thr Asp Arg Gln 275 280 285 Phe Phe Phe Ile Asn Arg Arg Pro Cys Asp Pro Ala Lys Val Cys Arg 290 295 300 Leu Val Asn Glu Val Tyr His Met Tyr Asn Arg His Gln Tyr Pro Phe 305 310 315 320 Val Val Leu Asn Ile Ser Val Asp Ser Glu Cys Val Asp Ile Asn Val 325 330 335 Thr Pro Asp Lys Arg Gln Ile Leu Leu Gln Glu Glu Lys Leu Leu Leu 340 345 350 Ala Val Leu Lys Thr Ser Leu Ile Gly Met Phe Asp Ser Asp Val Asn 355 360 365 Lys Leu Asn Val Ser Gln Gln Pro Leu Leu Asp Val Glu Gly Asn Leu 370 375 380 Ile Lys Met His Ala Ala Asp Leu Glu Lys Pro Met Val Glu Lys Gln 385 390 395 400 Asp Gln Ser Pro Ser Leu Arg Thr Gly Glu Glu Lys Lys Asp Val Ser 405 410 415 Ile Ser Arg Leu Arg Glu Ala Phe Ser Leu Arg His Thr Thr Glu Asn 420 425 430 Lys Pro His Ser Pro Lys Thr Pro Glu Pro Arg Arg Ser Pro Leu Gly 435 440 445 Gln Lys Arg Gly Met Leu Ser Ser Ser Thr Ser Gly Ala Ile Ser Asp 450 455 460 Lys Gly Val Leu Arg Pro Gln Lys Glu Ala Val Ser Ser Ser His Gly 465 470 475 480 Pro Ser Asp Pro Thr Asp Arg Ala Glu Val Glu Lys Asp Ser Gly His 485 490 495 Gly Ser Thr Ser Val Asp Ser Glu Gly Phe Ser Ile Pro Asp Thr Gly 500 505 510 Ser His Cys Ser Ser Glu Tyr Ala Ala Ser Ser Pro Gly Asp Arg Gly 515 520 525 Ser Gln Glu His Val Asp Ser Gln Glu Lys Ala Pro Glu Thr Asp Asp 530 535 540 Ser Phe Ser Asp Val Asp Cys His Ser Asn Gln Glu Asp Thr Gly Cys 545 550 555 560 Lys Phe Arg Val Leu Pro Gln Pro Thr Asn Leu Ala Thr Pro Asn Thr 565 570 575 Lys Arg Phe Lys Lys Glu Glu Ile Leu Ser Ser Ser Asp Ile Cys Gln 580 585 590 Lys Leu Val Asn Thr Gln Asp Met Ser Ala Ser Gln Val Asp Val Ala 595 600 605 Val Lys Ile Asn Lys Lys Val Val Pro Leu Asp Phe Ser Met Ser Ser 610 615 620 Leu Ala Lys Arg Ile Lys Gln Leu His His Glu Ala Gln Gln Ser Glu 625 630 635 640 Gly Glu Gln Asn Tyr Arg Lys Phe Arg Ala Lys Ile Cys Pro Gly Glu 645 650 655 Asn Gln Ala Ala Glu Asp Glu Leu Arg Lys Glu Ile Ser Lys Thr Met 660 665 670 Phe Ala Glu Met Glu Ile Ile Gly Gln Phe Asn Leu Gly Phe Ile Ile 675 680 685 Thr Lys Leu Asn Glu Asp Ile Phe Ile Val Asp Gln His Ala Thr Asp 690 695 700 Glu Lys Tyr Asn Phe Glu Met Leu Gln Gln His Thr Val Leu Gln Gly 705 710 715 720 Gln Arg Leu Ile Ala Pro Gln Thr Leu Asn Leu Thr Ala Val Asn Glu 725 730 735 Ala Val Leu Ile Glu Asn Leu Glu Ile Phe Arg Lys Asn Gly Phe Asp 740 745 750 Phe Val Ile Asp Glu Asn Ala Pro Val Thr Glu Arg Ala Lys Leu Ile 755 760 765 Ser Leu Pro Thr Ser Lys Asn Trp Thr Phe Gly Pro Gln Asp Val Asp 770 775 780 Glu Leu Ile Phe Met Leu Ser Asp Ser Pro Gly Val Met Cys Arg Pro 785 790 795 800 Ser Arg Val Lys Gln Met Phe Ala Ser Arg Ala Cys Arg Lys Ser Val 805 810 815 Met Ile Gly Thr Ala Leu Asn Thr Ser Glu Met Lys Lys Leu Ile Thr 820 825 830 His Met Gly Glu Met Asp His Pro Trp Asn Cys Pro His Gly Arg Pro 835 840 845 Thr Met Arg His Ile Ala Asn Leu Gly Val Ile Ser Gln Asn 850 855 860 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 7 gttgaacatc tagacgtctc 20 <210> 8 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 8 tcgtggcagg ggttattcg 19 <210> 9 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 9 ctacccaatg cctcaaccg 19 <210> 10 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 10 gagaactgat agaaattgga tg 22 <210> 11 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 11 gggacatgag gttctccg 18 <210> 12 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 12 gggctgtgtg aatcctcag 19 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 13 cggttcacca ctgtctcgtc 20 <210> 14 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 14 tccaggatgc tctcctcg 18 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 15 caagtcctgg tagcaaagtc 20 <210> 16 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 16 atggcaaggt caaagagcg 19 <210> 17 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <220> <221> misc_feature <222> (22)..(22) <223> n equals a, t, g or c <400> 17 caacaatgta ttcagnaagt cc 22 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 18 ttgatacaac actttgtatc g 21 <210> 19 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 19 ggaatactat cagaaggcaa g 21 <210> 20 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 20 acagagcaag ttactcagat g 21 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 21 gtacacaatg caggcattag 20 <210> 22 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 22 aatgtggatg ttaatgtgca c 21 <210> 23 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 23 ctgacctcgt cttcctac 18 <210> 24 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 24 cagcaagatg aggagatgc 19 <210> 25 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 25 ggaaatggtg gaagatgatt c 21 <210> 26 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 26 cttctcaaca ccaagc 16 <210> 27 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 27 gaaattgatg aggaagggaa c 21 <210> 28 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 28 cttctgattg acaactatgt gc 22 <210> 29 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 29 cacagaagat ggaaatatcc tg 22 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 sense primer <400> 30 gtgttggtag cacttaagac 20 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 31 tttcccatat tcttcacttg 20 <210> 32 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 32 gtaacatgag ccacatggc 19 <210> 33 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 antisense primer <400> 33 ccactgtctc gtccagccg 19 <210> 34 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 5' primer with BamHI restriction site <400> 34 cgggatccat gtcgttcgtg gcaggg 26 <210> 35 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 3' primer with XbaI restriction site <400> 35 gctctagatt aacacctctc aaagac 26 <210> 36 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> hMLH1 primer useful for amplifying codons 1 to 394 <400> 36 gcatctagac gtttccttgg c 21 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 394 of hMLH1 <400> 37 catccaagct tctgttcccg 20 <210> 38 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 <400> 38 ggggtgcagc agcacatcg 19 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 <400> 39 ggaggcagaa tgtgtgagcg 20 <210> 40 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 602 to 756 plus 128 nucleotides of 3' untranslated sequence of hMLH1 <400> 40 tcccaaagaa ggacttgct 19 <210> 41 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 602 to 756 plus 128 nucleotides of 3' untranslated sequence of hMLH1 <400> 41 agtataagtc ttaagtgcta cc 22 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 578 to 632 of hMLH1 <400> 42 tttatggttt ctcacctgcc 20 <210> 43 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 578 to 632 of hMLH1 <400> 43 gttatctgcc cacctcagc 19 <210> 44 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 394 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 44 ggatcctaat acgactcact atagggagac caccatggca tctagacgtt tcccttggc 59 <210> 45 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 394 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 45 catccaagct tctgttcccg 20 <210> 46 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 46 ggatcctaat acgactcact atagggagac caccatgggg gtgcagcagc acatcg 56 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 326 to 729 of hMLH1 wherein PCR product may be used for coupled transcription-translation <400> 47 ggaggcagaa tgtgtgagcg 20 <210> 48 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 5' primer with a BamHI restriction site <400> 48 cgggatccat gaaacaattg cctgcggc 28 <210> 49 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 3' primer with XbaI restriction site <400> 49 gctctagacc agactcatgc tgtttt 26 <210> 50 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 5' primer with a BamHI restriction site <400> 50 cgggatccat ggagcgagct gagagc 26 <210> 51 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 3' primer with XbaI restriction site <400> 51 gctctagagt gaagactctg tct 23 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 primer <400> 52 aagctgctct gttaaaagcg 20 <210> 53 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> hMLH2 primer <400> 53 gcaccagcat ccaaggag 18 <210> 54 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 primer <400> 54 caaccatgag acacatcgc 19 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hMLH3 primer <400> 55 aggttagtga agactctgtc 20 <210> 56 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 500 of hMLH2 <400> 56 ggatcctaat acgactcact atagggagac caccatggaa caattgcctg cgg 53 <210> 57 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 500 of hMLH2 <400> 57 cctgctccac tcatctgc 18 <210> 58 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 270 to 755 of hMLH2 <400> 58 ggatcctaat acgactcact atagggagac caccatggaa gatatcttaa agttaatccg 60 <210> 59 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 270 to 755 of hMLH2 <400> 59 ggcttcttct actctatatg g 21 <210> 60 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying from codon 485 to the translation termination site at codon 933 of hMLH2 <400> 60 ggatcctaat acgactcact atagggagac caccatggca ggtcttgaaa actcttcg 58 <210> 61 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying from codon 485 to the translation termination site at codon 933 of hMLH2 <400> 61 aaaacaagtc agtgaatcct c 21 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 3' primer useful for amplifying up to codon 369 of hMLH2 <400> 62 aagcacatct gtttctgctg 20 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 3' primer useful for amplifying up to codon 290 of hMLH2 <400> 63 acgagtagat tcctttaggc 20 <210> 64 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> 3' primer useful for amplifying up to codon 214 of hMLH2 <400> 64 cagaactgac atgagagcc 19 <210> 65 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 863 hMLH3 <400> 65 ggatcctaat acgactcact atagggagac caccatggag cgagctgaga gc 52 <210> 66 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 1 to 863 hMLH3 <400> 66 aggttagtga agactctgtc 20 <210> 67 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying up to codon 472 of hMLH3 <400> 67 ctgaggtctc agcaggc 17 <210> 68 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 415 to 863 of hMLH3 <400> 68 ggatcctaat acgactcact atagggagac caccatggtg tccatttcca gactgcg 57 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 415 to 863 of hMLH3 <400> 69 aggttagtga agactctgtc 20 <210> 70 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 195 to 233 of hMLH2 <400> 70 ttatttggca gaaaagcaga g 21 <210> 71 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 195 to 233 of hMLH2 <400> 71 ttaaaagact aacctcttgc c 21 <210> 72 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> sequencing primer useful for sequencing codons 195 to 233 of hMLH 2 <400> 72 ctgctgttat gaacaatatg g 21 <210> 73 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 233 to 257 of hMLH3 <400> 73 cagaagcagt tgcaaagcc 19 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 233 to 257 of hMLH3 <400> 74 aaaccgtact cttcacacac 20 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 347 of 377 of hMLH3 <400> 75 gaggaaaagc ttttgttggc 20 <210> 76 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 347 of 377 of hMLH3 <400> 76 cagtggctgc tgactgac 18 <210> 77 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 439 to 472 of hMLH3 <400> 77 tccagaacca agaaggagc 19 <210> 78 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> primer useful for amplifying codons 439 to 472 of hMLH3 <400> 78 tgaggtctca gcaggc 16

【図面の簡単な説明】

【図１】ヒト・ＤＮＡ修復蛋白ｈＭＬＨ１のｃＤＮＡ
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な１文字略記法により表す。３７３自動ＤＮＡ
シークエンサー（アプライド・バイオシステムズ・イン
コーポレイテッド（Applied Biosystems,Inc.）を用い
て配列決定を行った。配列決定の精度は９７％より高
いと予想される。

【図２】ヒト・ＤＮＡ修復蛋白ｈＭＬＨ１のｃＤＮＡ
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な１文字略記法により表す。３７３自動ＤＮＡ
シークエンサー（アプライド・バイオシステムズ・イン
コーポレイテッド（Applied Biosystems,Inc.）を用い
て配列決定を行った。配列決定の精度は９７％より高
いと予想される。

【図３】ヒト・ＤＮＡ修復蛋白ｈＭＬＨ１のｃＤＮＡ
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な１文字略記法により表す。３７３自動ＤＮＡ
シークエンサー（アプライド・バイオシステムズ・イン
コーポレイテッド（Applied Biosystems,Inc.）を用い
て配列決定を行った。配列決定の精度は９７％より高
いと予想される。

【図４】ヒト・ＤＮＡ修復蛋白ｈＭＬＨ１のｃＤＮＡ
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な１文字略記法により表す。３７３自動ＤＮＡ
シークエンサー（アプライド・バイオシステムズ・イン
コーポレイテッド（Applied Biosystems,Inc.）を用い
て配列決定を行った。配列決定の精度は９７％より高
いと予想される。

【図５】ヒト・ＤＮＡ修復蛋白ｈＭＬＨ１のｃＤＮＡ
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な１文字略記法により表す。３７３自動ＤＮＡ
シークエンサー（アプライド・バイオシステムズ・イン
コーポレイテッド（Applied Biosystems,Inc.）を用い
て配列決定を行った。配列決定の精度は９７％より高
いと予想される。

【図６】ヒト・ＤＮＡ修復蛋白ｈＭＬＨ１のｃＤＮＡ
配列および対応する推定アミノ酸配列を示す。アミノ酸
を標準的な１文字略記法により表す。３７３自動ＤＮＡ
シークエンサー（アプライド・バイオシステムズ・イン
コーポレイテッド（Applied Biosystems,Inc.）を用い
て配列決定を行った。配列決定の精度は９７％より高
いと予想される。

【図７】ｈＭＬＨ２のｃＤＮＡ配列および対応する推
定アミノ酸配列を示す。アミノ酸を標準的な１文字略記
法により表す。

【図８】ｈＭＬＨ２のｃＤＮＡ配列および対応する推
定アミノ酸配列を示す。アミノ酸を標準的な１文字略記
法により表す。

【図９】ｈＭＬＨ２のｃＤＮＡ配列および対応する推
定アミノ酸配列を示す。アミノ酸を標準的な１文字略記
法により表す。

【図１０】ｈＭＬＨ２のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１１】ｈＭＬＨ２のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１２】ｈＭＬＨ２のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１３】ｈＭＬＨ２のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１４】ｈＭＬＨ２のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１５】ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１６】ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１７】ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１８】ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図１９】ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図２０】ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図２１】ｈＭＬＨ３のｃＤＮＡ配列および対応する
推定アミノ酸配列を示す。アミノ酸を標準的な１文字略
記法により表す。

【図２２】ＭＡＣＡＷ（バージョン１.０）プログラ
ムを用いて、エス・セレビシエ（S.cerevisiae）のＰＭ
Ｓ１（ｙＰＭＳ１）の推定アミノ酸配列と、ｈＭＬＨ２
ならびにｈＭＬＨ３アミノ酸配列とを並べたものであ
る。保存性のあるブロックのアミノ酸は大文字で示さ
れ、それらのペア−ワイズ・スコア（pair-wise score
s）の平均上に影をつけた。

【図２３】ＭＡＣＡＷ（バージョン１.０）プログラ
ムを用いて、エス・セレビシエ（S.cerevisiae）のＰＭ
Ｓ１（ｙＰＭＳ１）の推定アミノ酸配列と、ｈＭＬＨ２
ならびにｈＭＬＨ３アミノ酸配列とを並べたものであ
る。保存性のあるブロックのアミノ酸は大文字で示さ
れ、それらのペア−ワイズ・スコア（pair-wise score
s）の平均上に影をつけた。

【図２４】ＭＡＣＡＷ（バージョン１.０）プログラ
ムを用いて、エス・セレビシエ（S.cerevisiae）のＰＭ
Ｓ１（ｙＰＭＳ１）の推定アミノ酸配列と、ｈＭＬＨ２
ならびにｈＭＬＨ３アミノ酸配列とを並べたものであ
る。保存性のあるブロックのアミノ酸は大文字で示さ
れ、それらのペア−ワイズ・スコア（pair-wise score
s）の平均上に影をつけた。

【図２５】ｈＭＬＨ２の変異分析である。（Ａ）ＨＮ
ＰＣＣ患者のＣＷにおける転写停止変異に関するＩＶＳ
Ｐ分析およびマッピング。コドン１から３６９までの翻
訳（レーン１）、コドン１から２９０までの翻訳（レー
ン２）、コドン１から２１４までの翻訳（レーン３）。
ＣＷは患者ＣＷのｃＤＮＡから翻訳され、ＮＯＲは正常
個体のｃＤＮＡから翻訳される。矢じりは、潜在的な停
止変異により切断されたポリペプチドを示す。矢印は分
子量マーカーをキロダルトンで示す。（Ｂ）ＣＷの配列
分析により、コドン２３３におけるＣのＴへのトランジ
ション変異が示される（矢印により示す）。レーン１お
よびレーン３は対照患者由来の配列；レーン２はＣＷの
ゲノムＤＮＡ由来の配列である。各配列混合物からのｄ
ｄＡ混合物を隣のレーンに負荷してｄｄＣ、ｄｄＤ、お
よびｄｄＴ混合物との比較を容易にする。

【図２６】ｈＭＬＨ３の変異分析である。（Ａ）患者
ＧＣからのｈＭＬＨ３のＩＶＳＰ分析。レーンＧＣは個
体ＧＣの線維芽細胞由来；レーンＧＣｘは患者ＧＣの腫
瘍由来；レーンＮＯＲ１および２は正常対照個体由来で
ある。ＦＬは全長の蛋白を示し、矢じりは生殖系列の切
断されたポリペプチドを示す。矢印は分子量マーカーを
キロダルトンで示す。（Ｂ）患者ＧＣからのＤＮＡにつ
いてのＰＣＲ分析は、障害が腫瘍細胞中の両方のｈＭＬ
Ｈ３対立遺伝子に存在することを示す。ｃＤＮＡ中の欠
損領域の５'側、３'側、またはその中間（ＭＩＤ）を増
幅するプライマーを用いて増幅を行った。レーン１,患
者ＧＣの線維芽細胞由来のＤＮＡ；レーン２,患者ＧＣ
の腫瘍由来のＤＮＡ；レーン３,正常対照患者由来のＤ
ＮＡ；レーン４,ＤＮＡ鋳型なしの反応。矢印は分子量
を塩基対で示す。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｃ１２Ｒ 1:19） (72)発明者ウイリアム・エイ・ハセルティンアメリカ合衆国ワシントン・ディーシー 20007、ノースウェスト、ピー・ストリート3053番 (72)発明者スティーブン・エム・ルーベンアメリカ合衆国メリーランド州20832、オルネイ、ヘリテイジ・ヒルズ・ドライブ 18528番 (72)発明者イン−フェイ・ウェイアメリカ合衆国メリーランド州20878、ダーネスタウン、ストロー・ベイル・レーン 13524番 (72)発明者マーク・ディー・アダムスアメリカ合衆国メリーランド州20878、ノース・ポトマック、ドゥフィーフ・ドライブ15205番 (72)発明者ロバート・ディー・フレイシュマンアメリカ合衆国メリーランド州20878、ゲイザースバーグ、チフェリイ・スクエア・ロード470番 (72)発明者クレール・エム・フレーザーアメリカ合衆国メリーランド州20854、ポトマック、グレン・ミル・ロード11915番 (72)発明者レベッカ・エイ・フルドナーアメリカ合衆国メリーランド州20838、バーネスビル、バーネスビル・ロード18040 番、ボックス306 (72)発明者ユエン・エフ・カークネスアメリカ合衆国メリーランド州20832、オルネイ、リトル・ビスタ・テラス2519番 (72)発明者クレーグ・エイ・ローゼンアメリカ合衆国メリーランド州20882、レイトンズビル、ローリング・ヒル・ロード 22400番Ｆターム(参考） 4B024 AA11 BA80 CA04 DA06 EA04 GA11 HA12 4B063 QA13 QA19 QA20 QQ08 QQ43 QR32 QR56 QR62 QS25 QS34 4B064 AG01 CA02 CA19 CC24 DA01 DA13 4H045 AA10 BA10 CA40 FA74

Claims

【特許請求の範囲】

【請求項１】本明細書に記載されたいずれかの発明。