JP2008125390A

JP2008125390A - 逆ホモ接合マッピング法による同祖領域の抽出方法および遺伝子スクリーニング方法

Info

Publication number: JP2008125390A
Application number: JP2006311855A
Authority: JP
Inventors: Showa Kanda; 将和神田; Hiroyasu Iwasa; 泰靖岩佐; Koichi Hagiwara; 弘一萩原; Yasushi Okazaki; 康司岡▲崎▼
Original assignee: Saitama Medical University
Current assignee: Saitama Medical University
Priority date: 2006-11-17
Filing date: 2006-11-17
Publication date: 2008-06-05

Abstract

【課題】多型マーカーを用いて、遺伝子疾患の原因遺伝子の候補領域を効率よく探索する方法を提供すること。
【解決手段】対象とコントロール対象とに由来するＤＮＡ間の多型マーカーを比較し、対象とコントロール対象とに共通する非候補領域を抽出する、非候補領域抽出ステップと、２以上の対象に由来するＤＮＡ間の多型マーカーを比較し、対象間に共通する候補領域を抽出する、候補領域抽出ステップと、上記候補領域から上記非候補領域を除いて同祖領域を抽出する、同祖領域抽出ステップと、を含む、同祖領域の抽出方法。
【選択図】なし

Description

本発明は、多型マーカーを用いて、遺伝子疾患の原因遺伝子の候補領域を効率よく探索する方法に関する。

疾患の発症原因または関連する遺伝子を同定する疾患遺伝子解析研究は、疾患の治療法の開発に極めて重要であり、ポストゲノム研究の重要な課題の一つである。疾患感受性遺伝子の同定方法としては、疾患感受性遺伝子の領域を特定する連鎖解析や罹患同胞対解析、ホモ接合マッピング法などの解析方法が開発されている。

連鎖解析とは、表現型に関連する遺伝子座と染色体上のマーカー遺伝子座との連鎖がどの程度あるのかを手がかりにして、染色体上の原因遺伝子の存在領域を絞り込んでいく方法である。また、罹患同胞対解析とは、同じ疾患を有している兄弟姉妹を比較して、染色体上の原因遺伝子の存在領域を絞り込んでいく方法である。

連鎖解析による劣性疾患遺伝子の同定法としては、多型を用いたホモ接合体マッピング（ＨｏｍｏｚｙｇｏｓｉｔｙＭａｐｐｉｎｇ）法が知られている。ホモ接合体マッピング法は、ある特定の１遺伝子の変異により起きる劣性かつ単一遺伝子疾患の原因遺伝子を取る方法として１９８７年にエリック・ランダー博士らにより提唱され、実際に成果を挙げている方法である（非特許文献１）。これらの解析において、多型マーカーが用いられている（非特許文献２）。ホモ接合体マッピング法では、多型としてＳＮＰの一つである制限酵素切断断片長多型（ＲｅｓｔｒｉｃｔｉｏｎＦｒａｇｍｅｎｔＬｅｎｇｔｈＰｏｌｙｍｏｒｐｈｉｓｍ、ＲＦＬＰ）を用いたもの（非特許文献１）や、マイクロサテライト多型を用いたもの（非特許文献３）がある。

また、疾患と対立遺伝子（もしくはマーカー遺伝子座）が関連しているかを調べる方法として、関連解析が知られている。関連解析は、コントロール集団と疾患を有している集団で特定の多型マーカーの出現頻度を比較することによって、疾患と特定のマーカーとの関連を生じる連鎖不平衡を見出し、疾患と密接に連鎖した遺伝子座を絞り込む方法である。

このように、おおよその染色体位置に関する情報を得て、その情報に基づいて原因遺伝子を同定するポジショナルクローニングによって、疾患の原因遺伝子、例えば、Ｘ連鎖性慢性肉芽腫症の原因遺伝子（非特許文献４）などが同定されている。また、上記連鎖解析及び関連解析によって同定された疾患感受性遺伝子としては、ヒト２型糖尿病の原因遺伝子が知られている（特許文献１）。
特開２００２−３３９９０１Ｌａｎｄｅｒ，Ｅ．Ｓ．ｅｔａｌ．Ｓｉｅｎｃｅ２３６：１５６７，１９８７．中村祐輔著「ゲノム医学からゲノム医療へ」、羊土社、２００５年Ｋｏｂａｙａｓｈｉ，Ｋ．ｅｔａｌ．ＮａｔｕｒｅＧｅｎｅｔｉｃｓ２２：１５９，１９９７．Ｒｏｙｅｒ−Ｐｏｋｏｒａｅｔａｌ．Ｎａｔｕｒｅ３２２：３２−３８，１９８５．ＤｉｅｔｚＨ．ｅｔａｌ．Ｎａｔｕｒｅ３５２: ３３７−３３９，１９９１．ＳａｋａｉＬ. ｅｔａｌ．ＣｅｌｌＢｉｏｌ．１０３:２４９９−２５０９，１９８６．

しかしながら、連鎖解析や罹患同胞対解析は家系解析を基本とするものであり、その遺伝子解析を行う前段階となる対象を得る過程において困難性を有している。同一家系内の患者は、共通祖先に由来する大きな染色体断片を共有するため、上記解析により得られる候補領域は広い上に、原因遺伝子を含まない領域をも多く共有している可能性がある。また、ホモ接合体マッピング法も、おおまかに候補領域を抽出するにとどまり、数十以上の候補遺伝子が存在する候補領域内から真の原因遺伝子を探し出す工程が必要であるため、膨大な費用と時間がかかるという課題があった。また、ポジショナルクローニングの困難さは、染色体上の候補領域の広さによって決まるため、効率的に候補領域を絞り込む方法の開発が望まれていた。

また、近年ヒトゲノムにおけるＤＮＡ多型のパターンが解析され、ハプロタイプ地図が完成したことにより、ハプロタイプと疾患感受性遺伝子の関係が研究されている。しかし、ヒトにおいて染色体は２組存在し、一人の遺伝子座（多型）がすべてわかったとしてもいずれのハプロタイプに由来するかを特定することはできない。そのため、関連解析等により疾患感受性遺伝子の推定を行うが、関連解析は、対立遺伝子間や表現型間の関係を統計学的に述べているにすぎず、関連を生じる要因は連鎖不平衡以外にも存在するため、偽陽性が多く再検定を行わなければならないという問題点が存在する。また、症例群とコントロール群との不一致によっても関連が認められる可能性がある。したがって、偽陽性の可能性、再現性の低さやコントロール群の選定における不確実性が欠点となっており、有意な解析結果を得るためには、膨大な費用と時間がかかるという課題があった。

本発明は、上記従来技術の有する課題に鑑みてなされたものであり、多型マーカーを用いて、遺伝子疾患の原因遺伝子の候補領域を効率よく探索する方法を提供することを目的とする。

ある集団における疾患の発症原因は、同一遺伝子の突然変異が異なる個人に同時に起こり発症するのではなく、一人の先祖の単一遺伝子の変異であることが多いと考えられている。すなわち、同一疾患を有する患者は、同じ祖先に由来する疾患感受性遺伝子の存在する染色体領域を共有し、この様な領域内の遺伝子変異、ＳＮＰ、マイクロサテライト多型などのすべての塩基配列が、同一疾患を有する患者において保存されていることになる。そのため、ある集団の異なる個人間において、同一の塩基配列を有している領域内に疾患感受性遺伝子が存在していることになる。

本発明者らは、鋭意研究した結果、遺伝子疾患の原因遺伝子の候補領域を効率よく探索するために、患者と健常者との間で共有される染色体領域に着目する方法を見出した。これにより、同じ祖先に由来し、疾患感受性遺伝子と連鎖または関連することのない染色体領域（非候補領域）を検索することができる。また、患者と患者との間で共有され、疾患感受性遺伝子の存在が疑われる候補領域から上記非候補領域を差し引くことにより、原因遺伝子の候補領域を効率よく絞り込むことが可能であることを見出した。かかる知見に基づき、本発明者は、逆ホモ接合マッピング法（ＲｅｖｅｒｓｅＨｏｍｏｚｙｇｏｓｔｉｙＭａｐｐｉｎｇ法）、すなわち、遺伝子疾患の原因遺伝子の候補領域を効率よく探索する方法を提供することを可能とし、本発明を完成した。

（１）すなわち、本発明は、対象とコントロール対象とに由来するＤＮＡ間の多型マーカーを比較し、対象とコントロール対象とに共通する非候補領域を抽出する、非候補領域抽出ステップと、２以上の対象に由来するＤＮＡ間の多型マーカーを比較し、対象間に共通する候補領域を抽出する、候補領域抽出ステップと、上記候補領域から上記非候補領域を除いて同祖領域を抽出する、同祖領域抽出ステップと、を含む、同祖領域の抽出方法を提供する。

上記方法における対象は、特定の遺伝子疾患を有する患者であることが好ましい。本発明の同祖領域の抽出方法によれば、遺伝子疾患の原因遺伝子の候補領域を効率よく探索することができる。特に、単一遺伝子疾患の原因遺伝子を含む候補領域、中でも、浸透率の高い単一遺伝子疾患の原因遺伝子を含む候補領域を効率よく探索することができる。例えば、家系解析によって得られた候補領域が広範であっても、本発明の方法を行うことにより、原因遺伝子を含まない領域を除くことができるため、候補領域を効率よく絞り込むことができる。

また本発明は、ある特定の疾患や遺伝子変異を含まない領域または含む可能性の低い領域を除くことによって、候補領域を絞り込むという考えに基づいている。そのため、関連解析とは異なり、連鎖不平衡以外の要因によって得られた偽陽性の領域が加えられることがなく、関連解析におけるコントロール選定の不確実性を排除することができ、コントロールの選定が容易となる。

（２）本発明は、また、対象とコントロール対象とに由来するＤＮＡ間の多型マーカーを比較し、対象とコントロール対象とに共通する非候補領域を抽出する、非候補領域抽出ステップと、２以上の対象に由来するＤＮＡ間の多型マーカーを比較し、対象間に共通する候補領域を抽出する、候補領域抽出ステップと、上記候補領域から上記非候補領域を除いて同祖領域を抽出する、同祖領域抽出ステップと、上記同祖領域のＤＮＡ配列情報および遺伝子情報を基に、対象とコントロール対象との遺伝子を比較し、対象の原因遺伝子を検索するステップと、を含む、遺伝子スクリーニング方法を提供する。

この構成により、原因遺伝子を含まない領域を除くことができるため、候補領域を効率よく絞り込むことができる。つまり、候補領域に存在する候補遺伝子の数を絞り込むことができるため、その中から真の原因遺伝子を同定するための費用、労力および時間を低減することができる。したがって、従来と比較して、原因遺伝子の同定が容易となる。また、上記方法における対象は、特定の遺伝子疾患を有する患者であることが好ましい。

本発明は、家系内および同一祖先に由来する集団内での解析に応用することができ、さらに、劣性遺伝疾患のみならず、優性遺伝疾患の原因遺伝子の探索にも適用することができる。また、従来の疾患感受性遺伝子の探索方法に限らず、２対象間の染色体領域を比較するあらゆる方法に適用することができる点において有用である。また、本発明者らが発明したｈｏｍｏｚｙｇｏｓｉｔｙｆｉｎｇｅｒｐｒｉｎｔ法および／またはホモ接合ハプロタイプ法と合わせて解析を行うことにより、劣性遺伝の疾患感受性遺伝子の同定の精度を向上させ、少数の対象数で判定することができる。

また本発明は、家系内の患者に限らず、ある特定の遺伝子疾患を有する患者のデータを利用することができ、コントロールの選定も容易であることから、従来よりも広範囲な対象およびコントロール対象を利用することができる。つまり、他の解析によって得られたデータや公共のデータベースなどの公知のデータを活用することができる。したがって、原因遺伝子の検索のための費用、労力および時間を低減することができる点において優れている。

さらに、本発明を植物や動物に対し行うことにより、疾患に関してはヒトと同様に原因遺伝子の探索が可能となるとともに、有用な機能を果たす遺伝子や、有用な形質を発現するような遺伝子の探索が可能であり、品種改良等の分野においても利用することができる。

以下に、各発明を実施するための最な実施形態について詳細に説明する。本発明は、これらの実施形態に何ら限定されるものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。

まず、本実施形態の基本となる原因遺伝子の遺伝様式について、図１を用いて説明する。この図は、ある一族の家系図を示している。突然変異等により、Ａが疾患の原因となる異常疾患原因遺伝子（黒色）を有しているものとする。この場合に、その子供であるＢ、ＣはＡから１本の染色体を受け継ぐが、減数分裂時の交叉によりＡの原因遺伝子を有している染色体との共通部分（グレー部分）は短くなる。この共通部分が「同祖領域」である。ここで、異常疾患遺伝子が劣性遺伝疾患である場合には、Ｆのように共通の祖先Ａに由来する原因遺伝子がホモ接合となった場合に、疾患を発症する。また、優性遺伝疾患である場合には、原因遺伝子を有しているＢ、Ｃ、Ｄ、Ｅ、Ｆの全員に疾患発症の可能性がある。しかし、劣性遺伝、優性遺伝のどちらの場合においても、原因遺伝子とその近傍の領域が受け継がれており、この領域においてはＡからＦの全員が同じハプロタイプを有していることになる。

一方で、同祖領域の中には、原因遺伝子および原因遺伝子座を含む領域とは異なる領域（ハッチング部分）も存在する。したがって、従来の解析方法によって得られた候補領域には、原因遺伝子とは関係のない領域（非候補領域）も含まれる。この事実に基づき、本発明は完成されたものである。

したがって、前述の事実から、対象およびコントロール対象間で同じハプロタイプを有する領域を特定することができれば、原因遺伝子とは関係のない非候補領域を特定することができる。本発明は、２対象間に共通する染色体領域を抽出する方法であればあらゆる方法を応用することができ、対象およびコントロール対象間で共有されている非候補領域を抽出し、候補領域を効率的に絞り込むことができる。

次に、本実施形態の概要について、図２および図３を用いて説明する。
本実施形態の同祖領域の抽出方法は、対象とコントロール対象とに由来するＤＮＡ間の多型マーカーを比較し、対象とコントロール対象とに共通する非候補領域を抽出する、非候補領域抽出ステップ（ステップ１）と、２以上の対象に由来するＤＮＡ間の多型マーカーを比較し、対象間に共通する候補領域を抽出する、候補領域抽出ステップ（ステップ２）と、候補領域から非候補領域を除いて同祖領域を抽出する、同祖領域抽出ステップ（ステップ３）と、を含む。

はじめに、候補領域抽出ステップ（ステップ２）を説明する。候補領域抽出ステップ（ステップ２）は、従来の疾患遺伝子解析に相当する。つまり、患者間に共通する同祖領域を抽出し、この領域を疾患の原因遺伝子を含む候補領域と見なす方法である。この場合、対象は特定の遺伝子疾患を有する患者である。以下に、図２を用いて説明する。図２は、従来のホモ接合マッピング法を模式的に示した図である。劣性遺伝子疾患の原因遺伝子を同定するための方法であるホモ接合マッピング法の原理は、原因遺伝子を含む染色体上の領域が、単一患者内でホモ接合しており、さらに、患者間で共通に保有されていることを前提としている。まず、それぞれの患者において染色体上に点在するマーカーを比較し、二本の染色体間でホモ接合している領域を抽出する（図２、黒色部分）。次に、複数の患者間でマーカーを比較し、患者間で共通する領域を抽出する（破線で囲んだ部分）。以上が、ステップ２である。さらに従来の疾患遺伝子解析では、得られた領域を疾患の原因遺伝子を含む候補領域と見なし、染色体の位置情報を基に、原因遺伝子を同定する。

本実施形態においては、候補領域抽出ステップ（ステップ２）に加えて、非候補領域抽出ステップ（ステップ１）を行う。ステップ１は、患者と健常者とに共通する領域、つまり、原因遺伝子とは関係のない領域（非候補領域）を抽出するステップである。抽出方法は、比較対象を患者および健常者にする以外は、ステップ１と同様の方法で行うことができる。

図３は、本実施形態の同祖領域の抽出方法における同祖領域抽出ステップ（ステップ３）を模式的に示した図である。ステップ３では、候補領域抽出ステップ（ステップ２）で得られた患者間で共通する領域（図３、黒色部分）から、非候補領域抽出ステップ（ステップ１）で得られた患者−健常者間で共通する領域（図３、グレー部分）を差し引くことによって、疾患の原因遺伝子に関する同祖領域を抽出し、候補領域を絞り込む。

また、本実施形態の遺伝子スクリーニング方法は、対象とコントロール対象とに由来するＤＮＡ間の多型マーカーを比較し、対象とコントロール対象とに共通する非候補領域を抽出する、非候補領域抽出ステップ（ステップ１）と、２以上の対象に由来するＤＮＡ間の多型マーカーを比較し、対象間に共通する候補領域を抽出する、候補領域抽出ステップ（ステップ２）と、候補領域から非候補領域を除いて同祖領域を抽出する、同祖領域抽出ステップ（ステップ３）と、同祖領域のＤＮＡ配列情報および遺伝子情報を基に、対象とコントロール対象との遺伝子を比較し、対象の原因遺伝子を検索するステップ（ステップ４）と、を含む。

本実施形態の遺伝子スクリーニング方法におけるステップ１〜３は、本実施形態の同祖領域の抽出方法におけるステップ１〜３と同様に行えばよい。また、本実施形態の遺伝子スクリーニング方法における原因遺伝子を検索するステップ（ステップ４）は、まず、ステップ１〜３によって得られた同祖領域のＤＮＡ配列情報および遺伝子情報を、公知のデータベースや実験的手法により得る。次に、領域内のＤＮＡ配列情報および遺伝子情報から、候補遺伝子を抽出し、それぞれの候補遺伝子の情報から、有力な候補遺伝子を選択する。候補遺伝子の情報としては、候補遺伝子が既知遺伝子の場合、遺伝子の機能などの公知の解析結果、未知遺伝子の場合は既知のタンパク質のドメインとの比較などによる機能の予測などが利用可能である。疾患の様態、発症組織、時期などの情報から、疾患に関与することが期待できる有力な候補遺伝子を選択すればよい。また併せて、各候補遺伝子の塩基配列を、対象とコントロール対象との間で比較し、遺伝子疾患に関与する可能性のある塩基置換を検索する。そして、有力な候補遺伝子を選択したら、その候補遺伝子の機能を、分子遺伝学的手法、例えば、実験動物を用いた遺伝子改変実験などによって調べる。このように、それぞれの候補領域および候補遺伝子に対して、原因遺伝子を同定するまでステップ４を繰り返す。本実施形態の方法によれば、従来法よりも、候補領域および候補遺伝子を絞り込めるため、従来法よりも容易に原因遺伝子を同定することができる。

上述のように本発明は、ある特定の疾患や遺伝子変異を含まない領域または含む可能性の低い領域を除くことによって、候補領域を絞り込むという考えに基づいている。患者と患者との間で共有される候補領域から原因遺伝子とは関係のない領域（非候補領域）を差し引くことにより、原因遺伝子の候補領域を効率よく絞り込むことが可能である。そこで本発明者は、この多型マーカーを用いた遺伝子疾患の原因遺伝子の検索方法および遺伝子スクリーニング方法を、「逆ホモ接合マッピング法（ＲｅｖｅｒｓｅＨｏｍｏｚｙｇｏｓｔｉｙＭａｐｐｉｎｇ法）」と名づけた。

さらに、本実施形態についてより詳細に説明する。
本発明における「対象」とは、個体の染色体上に存在する特定の遺伝子変異によって、特定の特徴的な形質を有する個体を指し、また特に、特定の遺伝子疾患を有する個体を指す。ここで、対象はヒト、ヒト以外の動物、植物、その他の微生物などであってもよい。また対象は二倍体以上の個体が好ましい。多くの場合、対象はヒトである。ヒトである場合には、１つの拡張した家系をなす集団、つまり、祖先集団を共有する集団（例えば、日本人）から対象を選定することが好ましい。祖先集団を共有する集団から対象を選定することが好ましい理由は、共通の祖先に由来する同祖領域を有する確率が高いからである。それに対して、民族間の交わりが多く近交係数の小さな集団（例えばアメリカのような集団）では、交叉によって同祖領域が短くなっているため、同祖領域の判定が難しい。また、多型マーカーを構成している塩基を他検体と比較した場合に、偶然に多型マーカーが一致しているのか、あるいは同祖であるために一致しているのかの判断が困難となるためである。また、ＤＮＡは、染色体を構成するゲノムＤＮＡであり、血液、唾液、組織、細胞などから採取することができる。ゲノムＤＮＡの調製方法は、多型のタイピング方法に合わせた方法で行えば、特に限定されない。また、多型のタイピングには、後述のマーカー多型のデータベースなどの公知のデータを活用することができる。

「コントロール対象」とは、解析対象とする単一遺伝子変異を有しない個体を指す。ヒトでは、コントロール対象は健常者とも言うが、この場合、解析対象とする単一遺伝子疾患の患者でないことが保証されていれば良いと考えられる。コントロール対象は、上記対象と同一の生物種から選定する。また、同一集団から選定することが好ましい。ＤＮＡの調製および多型のタイピングについては上述の方法を用いることができる。また、健常者のマーカー多型のデータは、国際ＨａｐＭａｐ計画が公開しているサイト（ｈｔｔｐ：／／ｗｗｗ．ｈａｐｍａｐ．ｏｒｇ／）などから得ることができる。国際ＨａｐＭａｐ計画は、ヒトの病気や薬に対する反応性に関わる遺伝子を発見するための基盤を整備するプロジェクトである。

「多型」とは、ＤＮＡ上の塩基の違いをいい、ある塩基の変化が人口中１％以上の頻度で存在しているものと定義されている。しかし、実際には１％以下の頻度で存在している塩基の変化を多型と呼ぶこともある。本発明においては、塩基に多様性のあるものをすべて多型とする。「多型マーカー」とは、ＤＮＡ上の特定の多型を、疾患感受性遺伝子を検索する際にマーカー（標識）として用いたものである。多型マーカーとして、マイクロサテライト多型、ＶＮＴＲ（Ｖａｒｉａｂｌｅｎｕｍｂｅｒｏｆｔａｎｄｅｍｒｅｐｅａｔ）多型、一塩基多型（ＳｉｎｇｌｅＮｕｃｌｅｏｔｉｄｅＰｏｌｙｍｏｒｐｈｉｓｍ：ＳＮＰ）などが解析に用いられている。ＤＮＡ上には２〜数十塩基の繰り返し配列が存在する。その多くは遺伝情報を持たず、機能不明な領域にあり、生物の個体間で違いが生じやすい部分である。この繰り返し部分の回数が個人間で異なっており、多型となっている。この部分の多型のうち数塩基から数十塩基のものを「ＶＮＴＲ多型」、２から４塩基のものを「マイクロサテライト多型」という。また「ＳＮＰ」とは、ＤＮＡ中の一塩基の違いによる多型をいう。ＳＮＰには、ＲＦＬＰも含まれる。ＳＮＰは、塩基配列中に高頻度に存在しており、ヒトにおいては３００塩基あたりに１個程度存在し、染色体全体では３００万から１０００万個あるといわれている。近年、このＳＮＰの違いを利用して疾患感受性遺伝子の探索が行われている。本発明において、多型マーカーとしてマイクロサテライト多型又はＶＮＴＲ多型を用いることができる。また、多型の箇所の多さから、本発明においては、多型マーカーとしてＳＮＰを用いることが好ましい。さらに、ＳＮＰ、マイクロサテライト多型、ＶＮＴＲ多型のいずれか二以上を組合せて用いてもよい。また、多型のデータベースが公開されており、疾患感受性遺伝子の解析に利用されてきている（非特許文献２等参照）。データベースには、上述の国際ＨａｐＭａｐ計画に加えて、例えば、ＮＣＢＩが公開しているｄｂＳＮＰデータベース（ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＳＮＰ／ｉｎｄｅｘ．ｈｔｍｌ）や、科学技術振興事業団と東京大学医科学研究所が共同で公開しているＪＳＮＰ（日本人のＳＮＰ）データベース（ｈｔｔｐ：／／ｓｎｐ．ｉｍｓ．ｕ−ｔｏｋｙｏ．ａｃ．ｊｐ）などがある。本発明は、これらのデータベースを適用することができる。また、ＤＮＡマイクロアレイなどの方法を用いて、ＳＮＰなどの多型を検出してもよい。

「ホモ接合」とは、相同染色体の全部又は一部の領域が同一塩基であることをいう。父親由来と母親由来の対立する塩基（対立塩基対）がどちらも同じ塩基であることをいい、ホモ接合である塩基対をホモ接合体という。

「疾患感受性遺伝子」とは、遺伝子疾患における原因遺伝子、または疾患に関係する遺伝子のことである。本発明においては、「疾患の原因遺伝子」、または単に「原因遺伝子」とも言う。疾患の原因となる染色体上の変異、つまり塩基置換は、タンパク質をコードするコード領域のみならず、遺伝子の発現を制御する領域などの非コード領域にも存在し得る。したがって、本発明における遺伝子とは、コード領域および非コード領域をも含む広義な意味を包含する。また、「候補遺伝子」とは、原因遺伝子であることが疑われる、または期待できる遺伝子であり、原因遺伝子の検索によって得られた候補領域に存在する遺伝子を指す。なお、本発明を品種改良等の分野において利用するばあいは、原因遺伝子は有用な機能を果たす遺伝子や有用な形質を発現するような遺伝子に置き換えてもよい。

「同祖遺伝子」および「同祖領域」とは、それぞれ共通祖先に由来することが明らかである対立遺伝子および染色体上の領域を指す。ここで、領域とは染色体領域とも言い、染色体上の位置を意味する。ある祖先における突然変異等により生じた遺伝子疾患では、疾患の原因遺伝子は同祖領域に含まれる同祖遺伝子として子孫に受け継がれる。本発明における同祖領域の抽出とは、特に、目的とする原因遺伝子に関係する領域を抽出することを指す。

「候補領域」とは、２以上の対象間に共通する領域、つまり、２以上の対象間で共通するそれぞれの領域およびその総和の領域を指す。特定の遺伝子疾患を有する患者間の場合、候補領域は同祖領域を多く含むか、同祖領域にほぼ等しいことが期待でき、また、原因遺伝子を含むことが期待できる。なお、候補領域および同祖領域の中には、原因遺伝子および原因遺伝子座を含む領域とは異なる領域も存在すると考えられる。また、本発明における「非候補領域」とは、対象およびコントロール対象間で共通するそれぞれの領域およびその総和の領域を指す。特定の遺伝子疾患を有する患者および健常者間の場合、非候補領域は、原因遺伝子と連鎖または関連することのない染色体領域に相当する。

共通領域の抽出方法は、２つの対象間、ならびに、対象およびコントロール対象間のいずれの場合も、以下に述べる２個体間に共通する領域の抽出方法を用いることができる。２個体間に共通する領域の抽出方法は、２個体それぞれから得た多型データを比較することで、２個体ペア間で共通する領域をそれぞれ抽出し、得られたすべての領域を足し合わせて、共通領域とすることによって行う。具体的には、多型のデータの比較および共通領域の抽出は、染色体上に隣り合って配置されている多型が連続かつある一定数（Ｎ）以上続くことを条件とする。ここで、多型は、上述のＳＮＰ、マイクロサテライト多型、ＶＮＴＲ多型を用いてもよく、いずれか二以上を組合せて用いてもよい。特に、ＳＮＰが好ましい。

定数（Ｎ）は、それぞれの多型、設定された多型間の平均距離および扱う対象に応じて、当業者が適切に設定することができる。多型として、染色体上に平均５．８ｋｂ間隔で設定されているＳＮＰを用いたときの定数（Ｎ）は、非候補領域を抽出する場合には、７０が好ましく、７０以上がより好ましく、例えば、７５，８０，８５，９０または７０以上の任意の数値を設定することができる。定数（Ｎ）が７０未満の場合は、同一祖先に由来しない領域を含む可能性が高くなり、また、短い（１７０〜４００ｋｂ以下）共通領域が数多く得られるため、効率的な原因遺伝子の検索が困難となる。この場合、定数（Ｎ）は７０以上のより大きな数値が、得られる共通領域の信頼性が高くなるため好ましいが、定数（Ｎ）が大きすぎると、例えば２００以上であると、１７０〜１２００ｋｂ程度の共通領域を非候補領域から除くこととなるため、２個体間に共通する領域の抽出が困難となる。また、Ｎ数が多くなるにつれ、偶然に２個体ペアで一致する領域の出現頻度は低くなる。したがって、実際の運用においては、Ｎ数が多い領域を優先的に非候補領域と見なすことが好ましい。なお、特定の遺伝子疾患を有する患者間の場合、患者−健常者間に比べて、共通領域は長くなる傾向がある。

以下、実施例に基づいて本発明をより具体的に説明するが、本発明は以下の実施例に制限するものではない。

本発明における逆ホモ接合マッピング法による同祖領域の抽出方法および遺伝子スクリーニング方法を、以下に述べる通り、擬似疾患モデルに適用し、本発明の方法が有効に機能することを確認した。

＜マルファン症候群＞
マルファン症候群（Ｍａｒｆａｎｓｙｎｄｒｏｍｅ：ＯＭＩＭ＃１５４７００参照）は、骨格、肺、目、心臓や血管といった多くの器官に症状がでる結合組織の疾患である。その７５％が遺伝により、２５％は自発的な（新たな）突然変異の結果として発症することが知られている。発生頻度は人口の約５０００人に一人程度である。マルファン症候群を持つほとんどの患者に大動脈の拡大が認められ、これに伴い、動脈解離が起きて胸の中心、腹部、背中などに激しい痛み等の症状を訴える。大動脈が裂けた場合は、死亡に至ることもあり、緊急手術や薬物治療が必要となる。

マルファン症候群の原因遺伝子は、連鎖解析および遺伝子クローニング解析から、第１５番染色体上に存在するフィブリリン−１遺伝子（ｆｉｂｒｉｌｌｉｎ−１、ＦＢＮ１）であることが明らかとなった（非特許文献５）。フィブリリン−１は、線維組織の形成に関わる細胞間接着因子であり、分子量およそ３５０ｋＤａの結合組織タンパク質として単離され、皮膚、肺などの結合組織に広く発現していることが知られている（非特許文献６）。フィブリリン−１遺伝子の変異により、正常なフィブリリンタンパク質が生産されなくなり、結合組織が脆弱となり細胞に弾力性を減少させ大動脈や網膜、硬膜、骨の形成等に異常をもたらす。

＜対象＞
本実施例では、原因遺伝子の知られている遺伝子疾患を擬似疾患モデルとして、本発明の同祖領域の抽出方法を適用した。上述のマルファン症候群を擬似疾患モデルとして扱った。対象は、マルファン症候群の患者９名である。また、コントロール対象は、上述の国際ＨａｐＭａｐ計画のサイトにて利用可能である健常者（４５名）とし、そのデータを本実施例の解析に用いた。

＜多型マーカーの選択＞
多型マーカーは、染色体の全範囲に亘って満遍なく配置されているＡｆｆｉｍｅｔｒｉｘ社のＧｅｎｅＣｈｉｐ（登録商標）ＨｕｍａｎＭａｐｐｉｎｇ５００ｋＡｒｒａｙＳｅｔを用いて行った。ＧｅｎｅＣｈｉｐＨｕｍａｎＭａｐｐｉｎｇ５００ｋＡｒｒａｙＳｅｔは、テロメアとセントロメアを除く領域を幅広くカバーし、約５０万個のＳＮＰを一度に検出することができる。１０ｋｂ以内に少なくとも１個のＳＮＰが含まれる領域は、全ＤＮＡの８５％に相当し、ＳＮＰ間の物理的距離の中央値は２．５ｋｂ、平均距離は５．８ｋｂであるため、疾患の原因が分かっていない場合の同祖領域の判定において好ましい。なお、上述の国際ＨａｐＭａｐ計画のサイトにて利用可能な多型マーカーのデータは、ＧｅｎｅＣｈｉｐＨｕｍａｎＭａｐｐｉｎｇ５００ｋＡｒｒａｙＳｅｔを用いて得られたデータである。

＜候補領域の抽出＞
対象であるマルファン症候群の患者９名から得られたＤＮＡサンプルを用いて、ホモ接合マッピング法の類似法により、患者９名に共通する領域を抽出した。具体的には、ＨｕｍａｎＭａｐｐｉｎｇ５００ｋＡｒｒａｙＳｅｔを用いて、１サンプルあたり約５０万個のＳＮＰデータを得た。そして、各ＳＮＰデータを比較して、染色体上に隣り合って配置されているＳＮＰが連続かつある一定数（Ｎ）以上続くことを条件として、サンプル間で共通な領域を抽出した。定数（Ｎ）には、８０を用いた。その結果を、図４に示す。図４は、マルファン症候群の患者９名に共通する染色体上の領域、つまり、候補領域を示している。黒色の領域が、候補領域を示している。既に特定されているマルファン症候群の原因遺伝子（ＦＢＮ１、クロスハッチング部分）は、本実施例で同定された複数の候補領域の中で、一番広い領域（候補領域Ａ）に存在していた。候補領域Ａは、染色体１５番の４５，６６０，８４１番目から４９，９７８，４３５番目の塩基に相当する領域であった。図５は、候補領域Ａに含まれる遺伝子を模式的に示した図である。現在の時点でこの領域には、３１個の遺伝子の存在が遺伝子データベースに登録されている。

＜非候補領域の抽出＞
非候補領域の抽出は、以下の手順で行った。まず、それぞれ１名の患者および健常者からなる患者−健常者ペアを設定した。次に、各患者−健常者ペア間のＳＮＰデータを比較して、ペア間の共通領域を抽出した。複数の患者−健常者ペアから得られた共通領域を足し合わせ、非候補領域とした。健常者のＳＮＰデータ（４５名分）は、国際ＨａｐＭａｐ計画から得た。患者−健常者ペア間のＳＮＰデータを、染色体上に隣り合って配置されているＳＮＰが連続かつある一定数（Ｎ）以上続くことを条件として比較し、共通領域の抽出を行った。定数（Ｎ）として、６０〜１００を用いて検討した。

＜同祖領域の抽出＞
上述の手順により得られた候補領域Ａから非候補領域を差し引いて得られた領域を、図６および図７に示す。図６は、候補領域Ａおよびその周辺領域のみを示しており、それぞれの定数（Ｎ）を定めた際に得られる非候補領域（グレー部分）を候補領域Ａ（黒色部分）から差し引いて得られた同祖領域を示すものである。定数（Ｎ）＝６０の場合は、原因遺伝子を含む形で誤検出している。これは、設定されたＮ数が小さいことが原因と考えられた。Ｎ数が多くなるにつれ、偶然に患者-健常人ペアで一致する領域の出現頻度は低くなる。このことから、実際の運用においては、Ｎ数が多い領域を優先的に非候補領域と見なすことが好ましい。図７は、定数（Ｎ）＝８０の非候補領域（グレー部分）を候補領域Ａ（黒色部分）から差し引いて得られた候補領域Ａおよびその周辺の同祖領域を示すものである。定数（Ｎ）＝８０に設定した場合、非候補領域として、染色体第１５番の４７，０７４，１６６番目から４７，８３９，４９７番目まで、および、４８，４０８，１７５番目から４９，４２２，５３８番目の塩基までの２箇所の領域が得られた。また、定数（Ｎ）＝１００に設定した場合は、染色体第１５番の４８，４０８，１７５番目から４９，４２２，５３８番目の塩基までの非候補領域が得られた。

＜考察＞
以上の結果から、従来の手法で得られた候補領域から非候補領域を差し引くことによって、原因遺伝子に関する同祖領域を絞り込むことができることが確認できた。本実施例においては、候補領域Ａに含まれる３１の候補遺伝子から１８の候補遺伝子に絞り込むことができることが確認できた。したがって、逆ホモ接合マッピング法が有用であることが証明された。なお、今回の実施例では、優性遺伝形式と分類されるＭａｒｆａｎ症候群を扱っているが、本発明は劣性遺伝形式の単一遺伝子疾患にも適用可能であると考えられる。したがって、本発明の同祖領域の抽出方法および遺伝子のスクリーニング方法は、疾患遺伝子の同定において非常に有効な解析方法を提供するものであることが判明した。

遺伝子疾患の原因遺伝子を同定する疾患遺伝子解析研究において、本発明の逆ホモ接合マッピング法による同祖領域の抽出方法および遺伝子のスクリーニング方法を適用することによって、遺伝子疾患の原因遺伝子の候補領域を効率よく探索することができる。特に、単一遺伝子疾患の原因遺伝子を含む候補領域、中でも、浸透率の高い単一遺伝子疾患の原因遺伝子を含む候補領域を効率よく探索することができる。本発明は、家系内および同一祖先に由来する集団内での解析に応用することができる。また、劣性遺伝疾患のみならず、優性遺伝疾患の原因遺伝子の探索にも適用することができる。さらに、従来の疾患感受性遺伝子の探索方法に限らず、２対象間の染色体領域を比較するあらゆる方法に適用することができる点において有用である。

また本発明は、従来よりも広範囲な対象およびコントロール対象を利用することができ、他の解析によって得られたデータや公共のデータベースなどの公知のデータを活用することができる。したがって、効率的に原因遺伝子の検索を行うことができる。また、同定された遺伝子は創薬分野においての利用性が非常に高い。

さらに、本発明を植物や動物に対し行うことにより、疾患に関してはヒトと同様に原因遺伝子の探索が可能となるとともに、有用な機能を果たす遺伝子や有用な形質を発現するような遺伝子を同定することも可能であるため、品種改良等の分野においても利用可能であり、畜産・農業上の利用性も非常に高い。

遺伝子疾患の原因遺伝子の遺伝様式について、ある一族の家系図を模式的に示す図である。従来のホモ接合マッピング法を模式的に示す図である。本実施形態の同祖領域の抽出方法における同祖領域抽出ステップを模式的に示す図である。本実施例におけるマルファン症候群患者に共通する染色体上の領域を模式的に示す図である。本実施例におけるマルファン症候群患者に共通する染色体上の領域（候補領域Ａ）および領域内に含まれる遺伝子を模式的に示す図である。本実施例におけるマルファン症候群の原因遺伝子に関する同祖領域を模式的に示す図である。定数（Ｎ）を、それぞれ（ａ）６０，（ｂ）８０および（ｃ）１００に設定した。本実施例におけるマルファン症候群の原因遺伝子に関する同祖領域および領域内に含まれる遺伝子を模式的に示す図である。

Claims

対象とコントロール対象とに由来するＤＮＡ間の多型マーカーを比較し、対象とコントロール対象とに共通する非候補領域を抽出する、非候補領域抽出ステップと、
２以上の対象に由来するＤＮＡ間の多型マーカーを比較し、対象間に共通する候補領域を抽出する、候補領域抽出ステップと、
前記候補領域から前記非候補領域を除いて同祖領域を抽出する、同祖領域抽出ステップと、
を含む、同祖領域の抽出方法。
対象とコントロール対象とに由来するＤＮＡ間の多型マーカーを比較し、対象とコントロール対象とに共通する非候補領域を抽出する、非候補領域抽出ステップと、
２以上の対象に由来するＤＮＡ間の多型マーカーを比較し、対象間に共通する候補領域を抽出する、候補領域抽出ステップと、
前記候補領域から前記非候補領域を除いて同祖領域を抽出する、同祖領域抽出ステップと、
前記同祖領域のＤＮＡ配列情報および遺伝子情報を基に、対象とコントロール対象との遺伝子を比較し、対象の原因遺伝子を検索するステップと、
を含む、遺伝子スクリーニング方法。
前記対象が、特定の遺伝子疾患を有する患者である、前記請求項１または２に記載の方法。