WO2018025521A1

WO2018025521A1 - 落屑症候群又は落屑緑内障の発症リスクの判定方法

Info

Publication number: WO2018025521A1
Application number: PCT/JP2017/022158
Authority: WO
Inventors: 啓田代; 茂木下; 和彦森; 陽子池田; 盛夫上野; 正和中野; 隆一佐藤; 史子佐藤; 健悟吉井
Original assignee: 京都府公立大学法人; シスメックス株式会社; 参天製薬株式会社
Priority date: 2016-08-05
Filing date: 2017-06-15
Publication date: 2018-02-08
Also published as: JP7064215B2; JPWO2018025521A1

Abstract

被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程を含む、被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。本発明の方法により、被検者由来のサンプル中に存在する本発明のSNP群について分析することにより、被検者における落屑症候群又は落屑緑内障の発症リスクの有無を判定し、さらには、リスクの高低を予測することができる。

Description

落屑症候群又は落屑緑内障の発症リスクの判定方法

　本発明は、落屑症候群（exfoliation syndrome）又は落屑緑内障（exfoliation glaucoma）の発症リスクを判定する方法、落屑症候群又は落屑緑内障の発症リスク判定装置、及び該装置に実行させるためのコンピュータプログラムに関する。

　緑内障は、網膜神経節細胞が障害され、不可逆的に進行し失明に至る神経変性疾患である。緑内障の病型の一つである落屑緑内障は前房内に落屑物質が観察される落屑症候群から発症する緑内障である。

　非特許文献１では落屑緑内障あるいは落屑症候群において、LOXL1遺伝子に特定のSNPsが認められることが開示されている。また、非特許文献２ではTBC1D21遺伝子とPML遺伝子において、非特許文献３ではCACNA1A遺伝子においても、落屑緑内障あるいは落屑症候群に関連するSNPsが認められることが開示されている。

http://science.sciencemag.org/content/sci/317/5843/1397.full.pdf http://www.readcube.com/articles/10.1038/srep05340 http://www.nature.com/ng/journal/v47/n4/pdf/ng.3226.pdf

　本発明の課題は、落屑症候群又は落屑緑内障の発症リスクを高精度に判定する方法、当該方法を実行する落屑症候群又は落屑緑内障の発症リスク判定装置、及び当該装置に実行させるためのコンピュータプログラムを提供することである。

　本発明者らは、前記課題を解決せんと鋭意検討した結果、本発明者らが保有する多数の落屑症候群又は落屑緑内障患者と非落屑症候群かつ非緑内障健常人の検体を用いて高密度チップにより取得したジェノタイプデータ情報に基づくゲノムワイド関連解析（genome-wide association study, GWAS）を実施することで、落屑症候群又は落屑緑内障の発症リスクマーカーSNP群を同定し、その中でも、高精度な判定に寄与する特定のSNP群を見出し、当該SNP群と残りのSNPから選択されるSNP群とを組み合わせたSNP集団に関して、サンプル中のリスクアレルの総数を測定することにより、落屑症候群又は落屑緑内障の発症リスクを高精度に判定できることを見出し、本発明を完成するに至った。

　即ち、本発明は、下記〔１〕～〔３〕に関する。
〔１〕　被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を含む、被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。
〔２〕　プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータを備え、前記メモリには、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されている、落屑症候群又は落屑緑内障の発症リスクを有する被検者の検出装置。
〔３〕　プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータであって、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行させる、コンピュータプログラム。

　本発明の方法により、被検者由来のサンプル中に存在する本発明のSNP群について分析することにより、被検者における落屑症候群又は落屑緑内障の発症リスクの有無を判定し、さらには、リスクの高低を予測することができる。このリスクに基づき被検者は落屑症候群又は落屑緑内障の予防措置を講じ、又は適切な治療を受けることができる。

図１は、被検者における落屑症候群又は落屑緑内障の発症リスク判定装置の一例を示した概略図である。図２は、図１に示される判定装置のハードウェア構成を示すブロック図である。図３は、図１に示される判定装置を用いた落屑症候群又は落屑緑内障の発症リスクの判定のフローチャートである。図４は、表１記載のSNPと表２から選択されたSNPの計30個を用いて発症リスクの有無の判定を行った結果を示した図である。図５は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。図６は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。図７は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。図８は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。図９は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。図１０は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。図１１は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。図１２は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。図１３は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。図１４は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。図１５は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。図１６は、表１記載のSNPと表２から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。

　本発明は、特定の一塩基多型（以下、SNPと記載することもある）についてアレルをin vitroで検出する工程を含む、落屑症候群又は落屑緑内障の発症リスクを判定する方法であって、被検者由来のサンプルにおいて前記したアレルを測定し、当該アレルがリスクアレルである場合に、その情報を用いて落屑症候群又は落屑緑内障の発症リスクがあると判定できる情報を提供する、落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法である。即ち、本発明は、高精度なリスク判定に寄与する特定のSNP群を構成メンバーとして含む測定対象を設定し、そこで検出したリスクアレルの総数を数え、当該リスクアレルの総数が予め設定された閾値を上回る場合に落屑症候群又は落屑緑内障の発症リスクがあるとする情報を提供できることに大きな特徴を有する。これにより、落屑症候群又は落屑緑内障の発症リスクの診断を補助することが可能となる。よって、本発明の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法とは、落屑症候群又は落屑緑内障の発症リスクに関する情報を提供する方法でもあり、また、落屑症候群又は落屑緑内障の発症リスクを判定、評価、又は検査する方法でもある。なお、本明細書において、「多型」または「バリアント」とは、ある生物種におけるゲノムの特定の位置の塩基配列や構造（挿入・欠失、逆位、コピー数）に多様性が認められることを言い、多型が存在する部位(以下、多型部位ともいう)とは一塩基多型(SNP)等のバリアントが認められるゲノム上の部位を言う。

　本発明において、「アレル」とは、ある多型部位において取りうる、互いに異なる塩基を有するそれぞれの型を言い、「リスクアレル」とは、落屑症候群又は落屑緑内障と関連するSNPの各アレルのうち、落屑症候群又は落屑緑内障ではない健常者群より、落屑症候群又は落屑緑内障の患者群において頻度が高いアレルを言い、「非リスクアレル」とは、リスクアレルではないアレルを言う。

　本発明において、「落屑症候群又は落屑緑内障の発症リスク」とは、被検者の落屑症候群又は落屑緑内障に関するリスクであり、疾患感受性によって決まる将来的な落屑症候群又は落屑緑内障の発症の可能性を言う。本発明において、リスクの予測とは、被検者の将来のリスクの有無を現時点で判定し、又は、被検者の将来のリスクの大小を現時点で決定することを言う。

　本発明の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法は、
特定のSNPについてアレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて被検者の情報を取得する情報取得工程、及び
前記情報に基づいて被検者の発症リスクを判定するための情報を提供する情報提供工程
を含む。以下に工程ごとに順を追って説明するが、先に、本発明において測定対象となる、落屑症候群又は落屑緑内障の発症に関連するSNP群を同定した方法を説明する。なお、落屑症候群又は落屑緑内障の発症に関連するSNP群のことを、本発明のSNP群と記載することもある。

(落屑症候群又は落屑緑内障の発症に関連するSNP群の同定)
　本発明において、落屑症候群又は落屑緑内障の発症に関連するSNP群は、具体的には、先ず、落屑症候群又は落屑緑内障と診断された患者、及び、落屑症候群又は落屑緑内障ではないと診断され、かつ、問診によって緑内障家族歴を有さないと判断された非落屑症候群かつ非緑内障健常者(単に、非患者又は対照者と記載することもある)からゲノムDNAをそれぞれ抽出する。そして、ヒトゲノム上の公知のSNP約20万～500万個を指標として、個々のSNPにおけるアレル頻度を患者群と非患者群において比較し種々解析することにより、頻度の差が統計学的有意であると認められるマーカー候補のSNP群を見出す。次いで、この候補群から更に解析を行うことで、本発明で用いるSNP群(マーカーSNP群)を決定し、その中から、より高精度な判定結果を与える特定のSNP群(コアSNP群)と残りのSNP群(プールSNP群)を設定し、これらを組み合わせて用いることにより、落屑症候群又は落屑緑内障の発症リスクの有無の判定、及び落屑症候群又は落屑緑内障の発症リスクの大小の予測が可能となる。なお、詳細は実施例の項にて説明するが、以下のような方法により、本発明で開示された落屑症候群又は落屑緑内障に関連するSNP群を同定することができる。

(1)　マーカー候補のSNP群を見出す方法
　患者群と非患者群、それぞれの血液からゲノムDNAを抽出する。血液中のゲノムDNAは公知の任意の方法によって抽出することができるが、例えば細胞を溶解して溶出させたDNAを、シリカでコーティングした磁性ビーズの表面に結合させ、磁気を利用して分離、回収することによってDNAを抽出することができる。

　抽出したDNAサンプル中のSNPにおけるアレルの同定手段は特に限定されず、当該技術において公知のSNP検出方法及びSNPタイピング方法から適宜選択すればよい。

　ここでは、ゲノムワイド関連解析(GWAS)を用いる手法について説明する。具体的には、例えば、ゲノム全領域に分布するSNPを含むDNAマイクロアレイ(アフィメトリクス社、Genome-Wide Human SNP Array 6.0)を用いて行うことができる。その際に、Quality control（以下、「ＱＣ」ともいう）を行うことで、抽出するSNPを選択してもよい。

　Quality controlにおけるSNP採否の基準となるコールレートとしては、例えば、好ましくは85％以上、より好ましくは90％以上、更に好ましくは95％以上のコールレートを示すSNPを採用することが望ましい。また、その他に、マイナーアレル頻度(MAF)が0.01未満のSNP、及び遺伝子型の分布がハーディー・ワインバーグ平衡(HWE)から有意に(false discovery rateが0.001未満)逸脱したSNPについては、候補から除外することが望ましい。

　Quality controlで選択されたSNPについては、更に絞り込みを行う。具体的には、例えば、統計ソフトウェアを用いてカイ二乗検定を行うことで、P値が好ましくは1×10^-3以下、より好ましくは3×10^-4以下、更に好ましくは1×10^-4以下を満たすSNPを選択する。

　次に、前記抽出されたSNPについては、ジェノタイピング不良SNPを除外するための２次元クラスタープロット解析、例えば、ジェノタイピングソフトウェア(アフィメトリクス社、Genotyping Console)から得られるクラスタープロット画像を目視で観察することによって、ジェノタイピング不良のSNPを除外して、マーカー候補のSNP群を決定する。

　このようにして選択されたSNPは、GenBankやdbSNPのような公知配列や公知SNPのデータベースを参照することにより、そのSNPが存在するゲノム上の位置、配列情報、SNPが存在する遺伝子又は近傍に存在する遺伝子、遺伝子上に存在する場合にはイントロン又はエキソンの区別やその機能、他の生物種における相同遺伝子などの情報を得ることができる。

(2)　マーカーSNP群を見出す方法
　次に、前記で得られたマーカー候補のSNP群について、ジェノタイプデータを数値化して抽出する。

　数値化においては、ジェノタイプデータ及びリスクアレルデータベースを参照して、例えばジェノタイプデータに含まれる所定のアレルにおいて、リスクアレルがホモの場合には数値２を、リスクアレルがヘテロの場合には数値１を、非リスクアレルがホモの場合には数値０を、それぞれ付与する。そして、得られた数値を、各アレルの出現頻度の平均値と観測される頻度を用いて以下の数式により正規化を行って、選択されたSNP群における数値化したジェノタイプデータ行列を作成する。

　なお、リスクアレルとは、患者群に高頻度に出現するアレルをいう。本発明で、リスクアレルはオッズ比に基づいて規定される。オッズ比とは、一般に患者群における危険因子を持つ人の割合と持たない人の割合の比、即ちオッズを、非患者群において同様に求めたオッズで除したものであり、本発明のようなケース・コントロール研究において用いられることが多い。本発明においてオッズ比はアレル頻度に基づいて求められ、患者群における、あるアレルの頻度と他のアレルの比を、非患者群において同様にして得られる頻度の比で除して算出することができる。なお、各アレルの出現頻度は、例えば、被検者のデータを取得するに伴って、そのデータが追加更新されて随時再算出可能なものである。

　次いで、数値化したジェノタイプデータ行列を用いて、クラスター解析を行う。具体的には、例えば、SNP間の連鎖不平衡(linkage disequilibrium, LD)を考慮し、独立性が高いと思われるSNPを主成分分析(principal component analysis, PCA)により決定する。主成分分析の方法としては、公知の方法を用いることが出来るが、例えば、前記で選択されたSNPについて、全ゲノム又は染色体のそれぞれにおいて情報縮約を行って因子負荷量(主成分と元の変数との間の相関係数に相当)を算出し、それに基づいて候補領域を決定し、当該領域内でP値が最も低いSNPを候補SNPとして選択することで、本発明のマーカーSNP群を決定する。但し、全ゲノムからの計算と染色体のそれぞれからの計算から重複したSNPは除く。

　次に、本発明のマーカーSNP群から、高精度な判定に寄与する特定のSNP群を更に選定する方法について説明する。以降、かかるSNP群のことを、コアSNP群と記載する。

(3)　コアSNP群とプールSNP群を見出す方法
　コアSNP群は、前記で得られたマーカーSNP群からP値が低い順に50個程度のSNP群を選択し、選択されたSNP群について新たな集団による再現実験を行うことで決定することができる。また、プールSNP群は、マーカーSNP群からコアSNP群を除いた群とする。

　より詳しくは、前記のようにして選択されたSNP群について、マーカー候補のSNP群を同定する際に用いた患者群と非患者群とは別の集団から、採取したDNAを用いてアレルの同定を行う。ここで、別集団とは、一部に重複が生じていてもよいが、完全非同一が好ましい集団である。解析方法としては、例えば、質量分析法が好ましく、公知のMassARRAYを用いることができる。なお、Quality controlを行ってもよく、その際のコールレートとしては、例えば、好ましくは85％以上、より好ましくは90％以上、更に好ましくは95％以上のコールレートを示すSNPを採用することが望ましい。また、その他に、マイナーアレル頻度(MAF)が0.01未満のSNP、及び遺伝子型の分布がハーディー・ワインバーグ平衡(HWE)から有意に(false discovery rateが0.001未満)逸脱したSNPについては、候補から除外することが望ましい。

　次いで、前記同定されたSNPについて、前記と同様にして２次元クラスタープロット解析を行って、ジェノタイピング不良SNPを除外する。

　このようにして選択されたSNPについて、例えば、ジェノタイピングソフトウェアを用いてカイ二乗検定を行うことで、P値が好ましくは1×10^-3以下、より好ましくは3×10^-4以下、更に好ましくは1×10^-4以下を満たすSNPを選択する。

　選択されたSNP群については、２回の解析結果を統合して判断することが好ましいことから、公知のメタ解析の手法、例えば、コクラン・マンテル・ヘンツェル法によって解析結果を統合して評価することができる。そして、当該解析手法によりP値が3×10^-3以下を満たすSNPを本発明におけるコアSNP群(計12個)とし、コアSNP群に該当しない残りのSNP群(計450個)をプールSNP群とする。以下に、コアSNP群におけるSNPを含むプローブ配列を表１に、プールSNP群におけるSNPを含むプローブ配列を表２（表２－１～表２－２３）にそれぞれ示す。表中、各SNPの対立遺伝子(アレル)はプローブ配列における括弧内に記載し、リスクアレルを含む配列を配列番号Ａ、非リスクアレルを含む配列を配列番号Ｂとする。

　かくして選択された本発明のSNP群を用いて、被検者由来のサンプルに対して以下の各工程を行う。

〔アレル測定工程〕
　アレル測定工程では、前記コアSNP群(表１)について必ず測定を行い、かつ、プールSNP群(表２)から選ばれるSNP(プール選抜SNP群)についても測定を行う。測定対象のSNP数は、コアSNP群を含めた合計が少なくとも30個であれば特に限定はなく、例えば、測定対象が30個の場合は、コアSNP 12個とプール選抜SNP 18個で構成される。測定対象が40個の場合は、コアSNP 12個とプール選抜SNP 28個で構成される。測定対象が50個の場合は、コアSNP 12個とプール選抜SNP 38個で構成される。測定対象が90個の場合は、コアSNP 12個とプール選抜SNP 78個で構成される。測定対象が120個の場合は、コアSNP 12個とプール選抜SNP 108個で構成される。測定対象が150個の場合は、コアSNP 12個とプール選抜SNP 138個で構成される。

　また、本発明では、１回の測定結果を持って次の情報取得工程に進んでもよいが、判定精度を向上させる観点から、複数回の測定ステップを行って得られた複数の結果を持って情報取得工程に進むことができる。この場合、12個のコアSNP群についてはいずれかの測定ステップで、重複せずに、かつ、12個全てが測定対象として用いられ得る。ステップ毎のコアSNP群の数は同一であっても、異なっていてもよい。また、ステップ毎の測定対象SNP数も同一であっても、異なっていてもよく、各ステップにおいてコアSNP群を含めた合計が少なくとも30個であれば特に限定はない。

　具体的には、例えば、アレル測定工程が２回の測定ステップを含む場合は、
コアSNP群から選ばれる1個以上のSNP(第１コアSNP群)と、プールSNP群から選ばれる複数のSNP(第１プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第１SNP群について測定を行う第１測定ステップと、
第１コアSNP群とは異なる1個以上のSNP(第２コアSNP群)と、プールSNP群から選ばれる複数のSNP(第２プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第２SNP群について測定を行う第２測定ステップ
を含む工程が例示され、ここで、前記第１プール選抜SNP群と第２プール選抜SNP群とは非同一である。各測定ステップにおける測定対象のSNP数を例示すると、例えば、第１SNP群における第１コアSNP群は6個、第１プール選抜SNP群が24個以上であり、第２SNP群における第２コアSNP群は6個、第２プール選抜SNP群が24個以上の例が挙げられる。なお、本明細書において「非同一」とは完全同一ではないことを意味し、例えば、1個のみ異なる場合であってもよく、プール選抜SNP群の構成SNPが全て異なる場合であってもよい。

　また、アレル測定工程が３回の測定ステップを含む場合は、
コアSNP群から選ばれる1個以上のSNP(第１コアSNP群)と、プールSNP群から選ばれる複数のSNP(第１プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第１SNP群について測定を行う第１測定ステップと、
第１コアSNP群とは異なる1個以上のSNP(第２コアSNP群)と、プールSNP群から選ばれる複数のSNP(第２プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第２SNP群について測定を行う第２測定ステップと、
第１コアSNP群及び第２コアSNP群とは異なる1個以上のSNP(第３コアSNP群)と、プールSNP群から選ばれる複数のSNP(第３プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第３SNP群について測定を行う第３測定ステップ
を含む工程が例示され、ここで、前記第１プール選抜SNP群と第２プール選抜SNP群と第３プール選抜SNP群とはいずれも非同一である。また、各測定ステップにおける測定対象のSNP数を例示すると、例えば、第１SNP群における第１コアSNP群は4個、第１プール選抜SNP群が26個以上であり、第２SNP群における第２コアSNP群は4個、第２プール選抜SNP群が26個以上であり、第３SNP群における第３コアSNP群は4個、第３プール選抜SNP群が26個以上である例が挙げられる。

　なお、本発明においては、必要により、４回目以降の測定を行うこともできる。

　本発明で用いられる生体試料としては、ゲノム由来のDNAを抽出可能なものであれば何でも良い。例えば、全血、全血球、白血球、リンパ球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織、又は毛根等が用いられる。かかる生体試料からのDNA抽出方法としては、公知の任意の方法を採用することができる。

　測定対象のSNP群に関しては、公知の方法に従って、そのアレルを決定して測定結果を得る。具体的には、例えば、本発明のSNP群の配列情報に基づき設計した、各アレルに特異的なプローブ(表１～表２)を用いてハイブリダイズさせ、そのシグナルを検出することによりそれぞれのアレルを検出することができる。プローブを用いてハイブリダイズさせる方法の例としてはタックマン法、インベーダー(Invader(登録商標))法、ライトサイクラー法、サイクリンプローブ法、MPSS法、ビーズアレイ法、DNAチップ法、マイクロアレイ法などがある。また、プローブによるハイブリダイズを行わずにアレルを検出することも可能であり、例えば、PCR-RFLP法、SSCP法、質量分析法、次世代シークエンス法、ダイレクトシークエンス法などを用いることができる。これらの方法は公知の条件に従って行うことができる。

　かくして得られた測定結果を次の情報取得工程に供する。

〔情報取得工程〕
　情報取得工程では、測定対象のアレルに基づいて落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する。アレルの情報としては、バリアントが存在するか否かについての情報や測定されたアレルの種類についての情報であってもよく、その数を取得したものであってもよい。また、SNPと相関する値(統計値など)として算出されたものであってもよい。なかでも、本発明では、判定精度を向上する観点から、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントしたものであることが好ましい。即ち、予め取得したリスクアレルデータに基づいて、測定されたアレルがリスクアレルであるか否かの判別を行って、測定対象のSNP群全体においてリスクアレルと判定されたアレルの総数(リスクアレル保有数ともいう)を数える。また、複数回の測定ステップを行う場合には、各測定においてリスクアレルの総数があらかじめ設定した予め設定された閾値を超えるかどうかで、陽性か陰性かを判定し、それらの数をカウントする。このようにして得られたリスクアレルの総数と、複数回の測定ステップを行う場合には、更に、各測定結果の陽性、陰性の個数を被検者の定量値として認定して、次の情報提供工程に進むことが好ましい。

〔情報提供工程〕
　情報提供工程では、得られた情報に基づいて被検者の発症リスクを判定するための情報を被検者に提供する。

　発症リスクを判定する方法としては、例えば、前記工程により得られる情報がリスクアレル保有数である場合、具体的には、４つの態様が挙げられる。
態様１：リスクアレル保有数の数値によって発症リスクの有無を判定する態様
態様２：複数のリスクアレル保有数が得られる場合の発症リスクの有無を統合して判定する態様
態様３：リスクアレル保有数に基づいて発症リスクを有する確率を算出する態様
態様４：リスクアレル保有数に基づいて所定の確率で発症リスクを有する確率を算出する態様

　態様１の方法としては、例えば、情報取得工程により得られた被検者に関する結果(リスクアレル保有数)が、アレル測定工程で用いられたSNPに基づいて予めＲＯＣ(Receiver Operating Characteristic)分析により定められたカットオフ値を、上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は当該リスクが低いとの情報を提供する方法が挙げられる。

　より詳しくは、先ず、被検者のリスクアレル保有数を予め設定された閾値と対比する。閾値とは患者と非患者とを識別する適切なカットオフ値のことであり、当該閾値と定量値を対比することにより、落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定できる。

　閾値は以下のようにして設定することができる。被検者の定量値を取得する際に測定対象として選定されたSNP群と同じSNP群に関して、予め落屑症候群又は落屑緑内障か否かを診断された被検者から採取した生体試料を用いて、上述のようにしてリスクアレル数を測定し、「落屑症候群又は落屑緑内障の発症リスクの有無」と「リスクアレル数」を統計的に処理することにより、両データ間の相関を解析する。解析された結果から、例えば、真陽性率の高さ(感度の高さ)を重視するか、真陰性率の高さ(特異度の高さ)を重視するか、又は真陽性率と真陰性率をどの程度でバランスさせるか等の目的に応じて、閾値を設定することができる。即ち、測定対象のSNP群が異なれば、そこに存在するリスクアレルも当然異なることから、測定対象のSNP群によって閾値は変動する。ここで、真陽性率とは、落屑症候群又は落屑緑内障の発症リスクを有する者を正しく落屑症候群又は落屑緑内障の発症リスクを有する者として判定する確率のことであり、真陰性率とは、落屑症候群又は落屑緑内障の発症リスクを有しない者を正しく落屑症候群又は落屑緑内障の発症リスクを有しない者として判定する確率のことである。

　患者と非患者とを識別する適切なカットオフ値である閾値の具体的な設定方法としては、先ず、被検者の定量値を取得する際に測定対象として選択されたSNP群と同じSNP群に関して、縦軸に真陽性率(感度)、横軸に真陰性率(1－特異度)をとって作成したＲＯＣ曲線を作成する(ＲＯＣ分析を実施する)。次に、グラフの左上隅からの距離が最小となる点を閾値としてもよく、ＲＯＣ曲線下面積(Area Under the Curve, AUC)が0.5となる斜線から最も離れた点を閾値としてもよく、任意の特異度や感度になるような点を閾値として設定してもよい。本発明では、感度が1、(1－特異度)が0に最も近い結果を与える閾値を設定することが好ましく、例えば、〔(1－感度)²＋(1－特異度)²〕が最少となる値を閾値と設定することができる。

　なお、閾値は、被検者の定量値を取得する際に別途同時に取得してもよく、事前に取得しておいたものであってもよい。また、被検者の定量値と比較する際に、それまでに得られた解析結果を随時追加更新して、取得されたものであってもよい。

　また、閾値の設定においては、判定精度の向上の観点から、正規化や重み付けを行ってもよい。具体的には、例えば、正規化の方法としては、正規分布曲線と比較する方法を用いることができる。また、重み付けの方法としては、各SNPのオッズ比を考慮して重み付けを行うことができる。

　こうして予め設定された閾値と被検者の定量値とを対比することで、被検者が落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定することができる。

　態様２の方法としては、例えば、アレル測定工程が複数の測定ステップを含む場合、情報取得工程により得られた被検者に関する各測定ステップでの結果(各リスクアレル保有数)が、各測定ステップで用いられたSNP群に基づいて予めＲＯＣ分析により定められたカットオフ値を上回るか否かを指標として、前記被検者が落屑症候群又は落屑緑内障を発症するリスクの高低についての情報を提供する方法が挙げられる。

　より詳しくは、先ず、被検者のリスクアレル保有数を、測定ステップ毎に、予め設定された閾値と対比して発症リスクの有無を判定する。閾値は態様１と同様にして設定することができる。次に、測定ステップ毎の発症リスクの有無の結果を統合する。具体的には、例えば、測定ステップを３回行って、発症リスクがある場合を「＋」、ない場合を「－」として表示する場合、１回目の判定結果が「＋」、２回目の判定結果が「＋」、３回目の判定結果が「＋」の統合結果は「＋＋＋」であり、１回目の判定結果が「＋」、２回目の判定結果が「＋」、３回目の判定結果が「－」の統合結果は「＋＋－」であり、１回目の判定結果が「＋」、２回目の判定結果が「－」、３回目の判定結果が「＋」の統合結果は「＋－＋」に分類される。よって、３回の判定において１回陰性であるという確率としては同じであっても、「＋＋－」と「＋－＋」は異なる分類に該当することになる。そして、得られた統合結果を用いて、予め判明している発症リスクを有する群・発症リスクを有さない群のグラフ上において同じ分類に該当する傾向に基づいて落屑症候群又は落屑緑内障の発症リスクが高いか低いかを判定する。

　発症リスクを有する群・発症リスクを有さない群のグラフは以下のようにして作成することができる。例えば、予め診断された被検者について統合結果を得て、「＋＋＋」、「＋＋－」、「＋－＋」等のパターン毎に、落屑症候群又は落屑緑内障の発症リスクを有するか否かの人数を集積することで作成することができる。

　こうして予め作成された発症リスクを有する群・発症リスクを有さない群のグラフにおいて、被検者の統合結果から該当する区分の情報を得ることで、被検者が落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定することができる。

　なお、態様２において、後述するベイズ定理を当てはめて、落屑症候群又は落屑緑内障の発症リスクを有する確率を算出してもよい。

　態様３の方法としては、例えば、情報取得工程で得られた結果にベイズ定理を当てはめて、落屑症候群又は落屑緑内障を発症するリスクを有する確率を算出する方法が挙げられる。一般に、臨床現場においては、検査対象者がその疾患の発症リスクを有するか否かは不明であり、検査結果から疾患の発症リスクの有無を推定することになるので、検査方法の陽性的中率（PPV）や陰性的中率（NPV）が高いことも望まれている。ここで、陽性的中率とは、検査結果が陽性の場合に疾患を有する者の割合であり、陰性的中率とは、検査結果が陰性の場合に発症リスクを有していない者の割合である。落屑症候群又は落屑緑内障の発症リスクを有する確率として提示することで当該確率が高いほど、落屑症候群又は落屑緑内障を発症するリスクの高い群に分類されることがより容易に理解されることになる。

　具体的な発症リスクを有する確率を算出する方法としては、情報取得工程で得られた結果(リスクアレル保有数)を態様１と同様にして閾値と対比することで、落屑症候群又は落屑緑内障の発症リスクの有無を判断し、その結果にベイズ定理の方法を当てはめて発症リスクを有する確率を算出する。ベイズ定理の方法においては、事前確率（有病率）に、前述した感度と特異度を組み合わせて事後確率（陽性的中率、陰性的中率）を求めることができることから、本発明においては、落屑症候群又は落屑緑内障の発症リスクの確率が事後確率として表される。言い換えると、ベイズ定理の方法を用いない場合は、発症リスクを有する確率は有病率と同じであるけれども、ベイズ定理の方法を用いることにより、検査により陽性結果が出た場合は、その被検者の発症リスクの確率は陽性的中率により表すことができることを意味する。具体的には、陽性的中率＝有病率×感度／〔有病率×感度＋(1－有病率)×(1－特異度)〕、陰性的中率＝特異度×(1－有病率)／〔特異度×(1－有病率)＋有病率×(1－感度)〕により求めることができ、例えば、有病率が0.8％であって、検査の感度が70％、特異度が70％の場合、陽性的中率は1.8％、陰性的中率は99.7％と算出される。よって、陽性結果が出た被検者の発症リスクは1.8％であることから、有病率よりも高く、更なる診察を受けるように助言することができる。また、前記検査を３回組み合わせて行った場合には、陽性的中率は9.3％、陰性的中率は99.9％と算出されることから、３回目の検査においてリスクアレル数がカットオフ値を超えた検査対象者は、落屑症候群又は落屑緑内障の発症リスクがより高いと判定することができる。

　こうして被検者の全体バックグラウンドとして、有病率の影響も含めた判定が行なえることで、被検者の落屑症候群又は落屑緑内障の発症リスクの確率として提示することが可能となる。

　態様４の方法としては、例えば、情報取得工程で得られた結果にベイズ定理を当てはめて、リスクアレル保有数に基づく発症リスクを有する確率(平均発症リスク、95％信用区間)を算出し、更に予め設定されたパーセント(％)以上の確率で落屑症候群又は落屑緑内障を発症するリスクを有する確率を算出する方法が挙げられる。ここで、設定されるパーセントとしては、例えば、70％、80％、90％等の任意の数値を設定することができ、値が大きい程、高精度で判定を行うことができる。

　より詳しくは、例えば、態様２で用いた予め診断された被検者から得られた統合結果「＋＋＋」、「＋＋－」、「＋－＋」等のパターン毎に、ベイズ定理により落屑症候群又は落屑緑内障の発症リスクを有する確率密度関数を算出する。例えば７０％以上の確率を算出する場合、確率密度関数から連続確率変数である発症リスクを有する確率が７０以上となる密度を範囲とする面積が発症リスクを有する確率となる。

　かくして、本発明においては、被検者の落屑症候群又は落屑緑内障の発症リスクを、リスクアレル数の合計数を閾値と対比することで、落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定するだけでなく、その確率を算出することによって、被検者の落屑症候群又は落屑緑内障の発症リスクに関する情報をより詳細に提供することができる。

　本発明はまた、落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する装置を提供する。

　本発明の装置としては、プロセッサおよび前記プロセッサの制御下にあるメモリを備えたコンピュータを含み、前記メモリには、下記の工程：
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されている。

　また、本発明には、被検者における落屑症候群又は落屑緑内障の発症リスクの判定をコンピュータに実行させるためのコンピュータプログラムも含まれる。そのようなコンピュータプログラムとしては、例えば、次のとおりである。

　コンピュータに読み取り可能な媒体に記録されているコンピュータプログラムであって、下記の工程：
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行させて、被検者における落屑症候群又は落屑緑内障の発症リスクの判定を行わせる。

　上記の媒体は、上記のコンピュータプログラムが非一時的に記録され、且つコンピュータに読取可能な媒体であってもよい。

　以下に、本発明の方法を実施するのに好適な装置の一例を、図面を参照して説明する。しかし、本実施形態は、この例のみに限定されるものではない。図１は、被検者における落屑症候群又は落屑緑内障の発症リスクの判定装置の一例を示した概略図である。図１に示された判定装置１０は、測定装置２０と、該測定装置２０と接続されたコンピュータシステム３０とを含んでいる。

　本実施形態において、測定装置２０は、マイクロアレイ上のプローブと結合したDNAに基づくシグナルを検出するスキャナーもしくは質量分析機器である。本実施形態において、シグナルは、蛍光シグナルなどの光学的情報もしくは質量分析結果である。測定用試料と接触させたマイクロアレイを測定装置２０にセットすると、測定装置２０は、マイクロアレイ上のプローブに結合した、被検者の生体試料由来の核酸に基づく光学的情報もしくは質量分析結果を取得し、得られた光学的情報もしくは質量分析結果をコンピュータシステム３０に送信する。

　スキャナーは、マイクロアレイ上のプローブに結合したDNAに基づくシグナルの検出が可能であれば特に限定されない。シグナルは、被検者の生体試料由来のDNAの標識に用いられた標識物質によって異なることから、スキャナーは、標識物質の種類に応じて適宜選択することができる。例えば、標識物質が蛍光物質である場合、測定装置２０として、当該蛍光物質から生じる蛍光を検出可能なマイクロアレイスキャナーが用いられる。

　なお、SNPを次世代シークエンス法やダイレクトシークエンス法により検出する場合、測定装置２０は、DNA増幅装置及びシークエンス解析装置からなる装置であってもよい。この場合、測定用試料、DNA増幅用の酵素及びプライマーなどを含む反応液を測定装置２０にセットし、DNA増幅法によって反応液中のDNAを増幅させる。そして、測定装置２０は、増幅産物の塩基配列を解析して配列情報を取得し、得られた配列情報をコンピュータシステム３０に送信する。

　コンピュータシステム３０は、コンピュータ本体３００と、入力部３０１と、検体情報や判定結果などを表示する表示部３０２とを含む。コンピュータシステム３０は、測定装置２０から光学的情報もしくは質量分析結果もしくは配列情報を受信する。そして、コンピュータシステム３０のプロセッサは、光学的情報もしくは質量分析結果もしくは配列情報に基づいて、被検者における落屑症候群又は落屑緑内障の発症リスクを判定するプログラムを実行する。なお、コンピュータシステム３０は、図１に示されるように測定装置２０とは別個の機器であってもよいし、測定装置２０を内包する機器であってもよい。後者の場合、コンピュータシステム３０は、それ自体で判定装置１０となってもよい。

　コンピュータ本体３００は、図２に示されるように、ＣＰＵ(Central Processing Unit)３１０と、ＲＯＭ(Read Only Memory)３１１と、ＲＡＭ(Random Access Memory)３１２と、ハードディスク３１３と、入出力インターフェイス３１４と、読出装置３１５と、通信インターフェイス３１６と、画像出力インターフェイス３１７とを備えている。ＣＰＵ３１０、ＲＯＭ３１１、ＲＡＭ３１２、ハードディスク３１３、入出力インターフェイス３１４、読出装置３１５、通信インターフェイス３１６及び画像出力インターフェイス３１７は、バス３１８によってデータ通信可能に接続されている。また、測定装置２０は、通信インターフェイス３１６により、コンピュータシステム３０と通信可能に接続されている。

　ＣＰＵ３１０は、ＲＯＭ３１１に記憶されているプログラム及びＲＡＭ３１２にロードされたプログラムを実行することが可能である。ＣＰＵ３１０は、有効性予測値を算出し、ＲＯＭ３１１に格納されている判別式を読み出し、有効性を判定する。ＣＰＵ３１０は、判定結果を出力して表示部３０２に表示させる。

　ＲＯＭ３１１は、マスクＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭなどによって構成されている。ＲＯＭ３１１には、前述のようにＣＰＵ３１０によって実行されるプログラム及びこれに用いるデータが記録されている。ＲＯＭ３１１には、予め設定された閾値などが記録されていてもよい。

　ＲＡＭ３１２は、ＳＲＡＭ、ＤＲＡＭなどによって構成されている。ＲＡＭ３１２は、ＲＯＭ３１１及びハードディスク３１３に記録されているプログラムの読み出しに用いられる。ＲＡＭ３１２はまた、これらのプログラムを実行するときに、ＣＰＵ３１０の作業領域として利用される。

　ハードディスク３１３は、ＣＰＵ３１０に実行させるためのオペレーティングシステム、アプリケーションプログラム(落屑症候群又は落屑緑内障の発症リスクの判定のためのコンピュータプログラム)などのコンピュータプログラム及び当該コンピュータプログラムの実行に用いるデータがインストールされている。ハードディスク３１３には、予め設定された閾値などが記録されていてもよい。

　読出装置３１５は、フラッシュメモリ、フレキシブルディスクドライブ、ＣＤ－ＲＯＭドライブ、ＤＶＤＲＯＭドライブなどによって構成されている。読出装置３１５は、可搬型記録媒体４０に記録されたプログラム又はデータを読み出すことができる。読取装置と記載することもある。

　入出力インターフェイス３１４は、例えば、ＵＳＢ、ＩＥＥＥ１３９４、ＲＳ－２３２Ｃなどのシリアルインターフェイスと、ＳＣＳＩ、ＩＤＥ、ＩＥＥＥ１２８４などのパラレルインターフェイスと、Ｄ／Ａ変換器、Ａ／Ｄ変換器などからなるアナログインターフェイスとから構成されている。入出力インターフェイス３１４には、キーボード、マウスなどの入力部３０１が接続されている。操作者は、当該入力部３０１により、コンピュータ本体３００に各種の指令を入力することが可能である。

　通信インターフェイス３１６は、例えば、Ethernet(登録商標)インターフェイスなどである。コンピュータ本体３００は、通信インターフェイス３１６により、プリンタなどへの印刷データの送信も可能である。

　画像出力インターフェイス３１７は、ＬＣＤ、ＣＲＴなどで構成される表示部３０２に接続されている。これにより、表示部３０２は、ＣＰＵ３１０から与えられた画像データに応じた映像信号を出力できる。表示部３０２は、入力された映像信号にしたがって画像(画面)を表示する。

　次に、判定装置１０による、落屑症候群又は落屑緑内障の発症リスクの高低を判定する処理手順を説明する。ここでは、マイクロアレイ上のプローブに結合した、被検者の生体試料由来のDNAに基づく蛍光情報からリスクアレル情報を取得し、得られた測定値を用いて判定を行なう場合を例として説明する。しかし、本実施形態は、この例のみに限定されるものではない。

　図３を参照して、ステップＳ１０１において、判定装置１０のＣＰＵ３１０は、測定装置２０から蛍光情報を取得する。次に、ステップＳ１０２において、ＣＰＵ３１０は、取得した蛍光情報から蛍光強度を算出し、ＲＡＭ３１２に記憶する。そして、ステップＳ１０３において、ＣＰＵ３１０は、ＲＡＭ３１２に記憶された前記蛍光強度から各バリアントの有無及びその種類を決定し、ＲＯＭ３１１又はハードディスク３１３に記憶されたアレルデータにしたがって、リスクアレル総数を算出する。

　その後、ステップＳ１０４において、ＣＰＵ３１０は、算出された有効性予測値と、ＲＯＭ３１１又はハードディスク３１３に記憶された予め設定された閾値とを用いて、被検者における落屑症候群又は落屑緑内障の発症リスクの高低を判定する。ここで、リスクアレル総数が予め設定された閾値よりも小さいとき、処理は、ステップＳ１０５に進行し、ＣＰＵ３１０は、被検者における落屑症候群又は落屑緑内障の発症リスクが低いことを示す判定結果をＲＡＭ３１２に記憶する。一方、リスクアレル総数が予め設定された閾値よりも低くないとき(すなわち、リスクアレル総数がカットオフ値以上であるとき)、処理は、ステップＳ１０６に進行し、ＣＰＵ３１０は、被検者における落屑症候群又は落屑緑内障の発症リスクが高いことを示す判定結果をＲＡＭ３１２に記憶する。

　そして、ステップＳ１０７において、ＣＰＵ３１０は、判定結果を出力し、表示部３０２に表示させたり、プリンタに印刷させたりする。これにより、被検者における落屑症候群又は落屑緑内障の発症リスクが高いか否かの判定を補助する情報を医師などに提供することができる。

　以下、実施例を示して本発明を具体的に説明する。この実施例は、単なる本発明の例示であり、何ら限定を意味するものではない。なお、以下の実施例では、特に詳細な説明がない一般的に用いられる分子生物学的手法については、モレキュラークローニング (Joseph Sambrook et al., Molecular Cloning - A Laboratory Manual, 3rd Edition, Cold Spring Harbor Laboratory Press, 2001)などの成書に記載された方法及び条件が用いられる。

試験例１　マーカーSNP（コアSNP+プールSNP）の選択
　落屑症候群又は落屑緑内障と診断された患者(落屑症候群又は落屑緑内障の患者群)201例、及び、落屑症候群又は落屑緑内障ではないと診断され、かつ、問診によって緑内障家族歴を有さないと判断された非患者697例、それぞれの血液から、市販の自動核酸抽出機を使用して、ゲノムDNAを抽出した。ゲノムDNAの抽出は機器及びキットの取扱説明書に従い実施した。本方法により、血液検体350μLから約5μgのゲノムDNAを得た。

　SNPの分析は、ヒトゲノム上の公知のSNP約100万個の分析が可能な市販のマイクロアレイ型のSNP分析キットDNAマイクロアレイ（Genome-Wide Human SNP Array 6.0）を用いて906,600個のSNPのジェノタイプデータを取得し、QCフィルター (Call Rate, ≧0.95; MAF, ≧0.01; HWE, ≧0.001) を用いて652,792個の高精度なSNPデータを選択した。さらに、以下の過程により697個のSNPマーカー候補群を抽出した。
(1) ゲノムワイド関連解析（アレルデータによるχ²検定）でP<0.001を抽出条件とした。
(2) 抽出された全SNPについて、アフィメトリクス社のジェノタイピングソフトウェア (Genotyping Console) から得られる2Dクラスタープロット画像に基づき、3人の検者の目視による判定によってクラスター不良のSNPを除外した。

　マーカーSNPはSNPマーカー候補群から以下の手順により462個を選択した。なお、マーカーSNPはコアSNP 12個とプールSNP 450個から構成される。
(1) ジェノタイプデータを、以下の手順でコード化（数値変換）および正規化を行った。
　　(a) Risk Allele Homo: 2、Risk Allele Hetero: 1、Other Allele Homo: 0とした。
　　(b) 数値変換は落屑症候群又は落屑緑内障の患者群および非患者群の各群で、平均値および観測アレル頻度を用いて、前述の数式に従って数値の正規化を行った。
(2) 連鎖不平衡（linkage disequilibrium, LD）を考慮したSNPマーカー候補群の組合せを主成分分析（principle component analysis, PCA）を用いたクラスター解析により算出した。
　　(a) SNPマーカー候補群を用いて、患者群および非患者群の全検体をPCAに供し、検体で情報縮約（Cluster SNP）することで得られる因子負荷量（主成分と元の変数との間の相関係数に相当）を算出した。次に、各SNPの最も高い因子負荷量の絶対値を示す主成分を基準とするクラスターにより候補領域を決定し、各候補領域内で最小のP値を得たSNPをマーカーSNPの候補とした。
　　(b) 「各染色体」でのSNPマーカー候補群を用いて、(a) と同様に各染色体で候補領域を決定し、マーカーSNPの候補とした。
　　(c) (a) と (b) のマーカーSNP候補を組み合わせて、重複を除いた。

コアSNPの取得
　マーカーSNPの上位67個を用いて、別集団の患者254例と非患者1,052例を用いてマスアレイによる再現実験を実施した。QCフィルター (Call Rate, ≧0.9; MAF, ≧0.01; HWE, ≧0.001)を通過したSNP群を用いて関連解析（アレルデータによるχ²検定）を実施した。ゲノムワイド関連解析とマスアレイによる再現実験の再現性について、コクラン・マンテル・ヘンツェル検定結果（P<0.0008）を基準とした12個のSNPをコアSNPとした。

プールSNPの取得
　マーカーSNPからコアSNPを除いた群をプールSNPとした。

実施例１
　患者群200例と非患者群200例について、試験例１と同様にして血液を採取してゲノムDNAを抽出し、実施例１（表３）についてそれぞれ示すプローブを用いて、ハイブリダイゼーションでアレルデータを取得し、リスクアレルの総数をカウントした。なお、実施例１で用いたプローブは、表１に記載の12個のプローブ及び表２から選択された18個のプローブである。

　リスクアレルの総数を横軸にした度数分布図を作成し、ＲＯＣ分析を行った結果を図４に示す。図４より、実施例１では感度72.5％、特異度80.0％であるカットオフ値が31個の場合にAUCが0.846であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

実施例２
　実施例１と用いるプローブが異なる以外は、実施例１と同様にしてデータ取得を行った。具体的には、下記表４に示すプローブを用いた。

（態様１）
　上記表４に示す90個のプローブ(コアSNP群12個、プールSNP群78個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。リスクアレルの総数を横軸にした度数分布図を作成し、ＲＯＣ分析を行った結果を図５に示す。図５より、感度90.5％、特異度85.5％であるカットオフ値が67個の場合にAUCが0.961であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

（態様２）
　次に、前記態様１で用いたプローブを30個ずつに分けて、測定ステップを測定ステップ１、測定ステップ２、測定ステップ３の３グループに分けて行い、リスクアレルの総数をカウントした。

　得られた結果について、前記と同様にして、リスクアレルの度数分布図とＲＯＣ曲線を取得した。結果を図６に示す。図６より、第１測定での結果が感度79.0％、特異度77.0％でのカットオフ値が20個であり、第２測定での結果が感度81.5％、特異度73.0％でのカットオフ値が22個であり、第３測定での結果が感度77.5％、特異度72.5％でのカットオフ値が25個であり、それぞれの測定における判定結果が得られることが分かった。

　また、図７に、前記３測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記３測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

（態様３及び４）
　態様２と同様にして、個々のグループでの判定結果を得た上で、ベイズ定理を用いてリスクアレル保有数に基づく発症リスクを有する数確率(平均発症リスク、95％信用区間)を算出した。また、ベイズ定理を用いた確率密度関数の発症リスクを有する確率が70以上となる密度を範囲とする面積を算出し、70％以上の確率で発症するリスクの確率を示した。結果を図８に示す。

　なお、ベイズ定理を用いた解析は、以下の手順に従って行った。
(a) 事前分布π(θ)は一様分布(無情報事前分布)とした。事前分布は、ベータ分布を採用した。
(b) 尤度は患者群および非患者群の全検体からランダムに、患者群200例と非患者群200例を選び、各リスクアレル保有数でのデータ数(観察数)と患者数(陽性数)から算出した。分布は二項分布を採用した。
(c) 事後分布は、ベイズの定理(事後分布π(θ|D)∝事前分布×尤度)より算出した。
(d) 事後分布から、平均発症リスク(％)、95％信用区間(％)、発症リスクを有する確率(％)を算出した。

実施例３
　実施例１及び２と用いるプローブが異なる以外は、実施例１と同様にしてデータ取得を行った。具体的には、下記表５に示すプローブを用いた。

（態様１）
　上記表５に示す120個のプローブ(コアSNP群12個、プールSNP群108個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。実施例１と同様にして、リスクアレルの度数分布図とＲＯＣ分析を行った結果を図９に示す。図９より、感度92.5％、特異度84.5％であるカットオフ値が93個の場合にAUCが0.959であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

（態様２）
　次に、前記態様１で用いたプローブを40個ずつに分けて、測定ステップを測定ステップ１、測定ステップ２、測定ステップ３の３グループに分けて行い、リスクアレルの総数をカウントした。

　得られた結果について、前記と同様にして、リスクアレルの度数分布図とＲＯＣ曲線を取得した。結果を図１０に示す。図１０より、第１測定での結果が感度76.5％、特異度79.5％でのカットオフ値が27個であり、第２測定での結果が感度70.0％、特異度86.5％でのカットオフ値が34個であり、第３測定での結果が感度73.0％、特異度80.0％でのカットオフ値が36個であり、それぞれの測定における判定結果が得られることが分かった。

　また、図１１に、前記３測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記３測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

（態様３及び４）
　態様２と同様にして、個々のグループでの判定結果を得た上で、実施例２と同様にして、平均発症リスク(％)、95％信用区間(％)、70％以上の確率で発症するリスクの確率(％)を算出した。結果を図１２に示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

実施例４
　実施例１及び２及び３と用いるプローブが異なる以外は、実施例１と同様にしてデータ取得を行った。具体的には、下記表６に示すプローブを用いた。

（態様１）
　上記表６に示す150個のプローブ(コアSNP群12個、プールSNP群138個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。実施例１と同様にして、リスクアレルの度数分布図とＲＯＣ分析を行った結果を図１３に示す。図１３より、感度90.0％、特異度91.5％であるカットオフ値が120個の場合にAUCが0.971であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

　得られた結果について、前記と同様にして、リスクアレルの度数分布図とＲＯＣ曲線を取得した。結果を図１４に示す。図１４より、第１測定での結果が感度80.0％、特異度80.5％でのカットオフ値が38個であり、第２測定での結果が感度78.5％、特異度81.5％でのカットオフ値が40個であり、第３測定での結果が感度76.5％、特異度75.5％でのカットオフ値が43個であり、それぞれの測定における判定結果が得られることが分かった。

　また、図１５に、前記３測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記３測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

（態様３及び４）
　態様２と同様にして、個々のグループでの判定結果を得た上で、実施例２と同様にして、平均発症リスク(％)、95％信用区間(％)、70％以上の確率で発症するリスクの確率(％)を算出した。結果を図１６に示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。

実施例５　ベイズ流アプローチによるマーカーSNPフィードバック改善ループ
　実施例２又は実施例３又は実施例４の判定後の追跡研究により、落屑症候群又は落屑緑内障の発症および陰性の結果を得ることで、データの蓄積と更新(追加学習)を行う。追加学習は、追跡研究によって新たに得られた分類結果を用いてベイズの事前分布π(θ)を更新する。
・追跡研究により新たに得られたジェノタイプデータを従来の結果に加えた関連解析(アレルデータによるχ²検定)を実施し、プールSNPの入れ替えを実施する。また、入れ替えを実施する場合は、「情報取得工程」の各測定のＲＯＣ分析の再計算によるカットオフ値の再設定を行い、「情報提供工程」におけるベイズの事前分布を忘却し、一様分布(無情報事前分布)として再計算する。
・データの蓄積と更新により、ジェノタイプデータを用いてアレルデータによるχ²検定の結果が変化した場合、マーカー候補SNPの入れ替えを実施する。

　本発明の方法により、被検者由来のDNA上の本発明のSNPのアレルを分析することにより、被検者の落屑症候群又は落屑緑内障の発症リスクの高低を判定することができる。このリスクに基づき被検者は落屑症候群又は落屑緑内障の予防措置を講じ、又は先制医療を含む適切な治療を受けることができる。また、本発明のSNPを用いて、落屑症候群又は落屑緑内障の発症リスクが高い者を選択して緑内障治療薬の臨床試験を行うことにより、緑内障治療薬の臨床試験の期間を短縮できるため、有用である。

　１０　　　判定装置
　２０　　　測定装置
　３０　　　コンピュータシステム
　４０　　　記録媒体
　３００　　コンピュータ本体
　３０１　　入力部
　３０２　　表示部
　３１０　　ＣＰＵ
　３１１　　ＲＯＭ
　３１２　　ＲＡＭ
　３１３　　ハードディスク
　３１４　　入出力インターフェイス
　３１５　　読出装置（読取装置）
　３１６　　通信インターフェイス
　３１７　　画像出力インターフェイス
　３１８　　バス

Claims

　被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を含む、被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。
　アレル測定工程が、
コアSNP群から選ばれる1個以上のSNP(第１コアSNP群)と、プールSNP群から選ばれる複数のSNP(第１プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第１SNP群について測定を行う第１測定ステップと、
第１コアSNP群とは異なる1個以上のSNP(第２コアSNP群)と、プールSNP群から選ばれる複数のSNP(第２プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第２SNP群について測定を行う第２測定ステップ
を含む工程であり、
ここで、前記第１プール選抜SNP群と第２プール選抜SNP群とは非同一である、請求項１記載の方法。
　アレル測定工程が、
コアSNP群から選ばれる1個以上のSNP(第１コアSNP群)と、プールSNP群から選ばれる複数のSNP(第１プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第１SNP群について測定を行う第１測定ステップと、
第１コアSNP群とは異なる1個以上のSNP(第２コアSNP群)と、プールSNP群から選ばれる複数のSNP(第２プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第２SNP群について測定を行う第２測定ステップと、
第１コアSNP群及び第２コアSNP群とは異なる1個以上のSNP(第３コアSNP群)と、プールSNP群から選ばれる複数のSNP(第３プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第３SNP群について測定を行う第３測定ステップ
を含む工程であり、
ここで、前記第１プール選抜SNP群と第２プール選抜SNP群と第３プール選抜SNP群とはいずれも非同一である、請求項１記載の方法。
　情報取得工程が、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントするステップを含む工程である、請求項１～３いずれか記載の方法。
　生体試料が、全血、全血球、白血球、リンパ球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織、又は毛根である、請求項１～４いずれか記載の方法。
　情報提供工程が、前記情報取得工程により得られた被検者に関する結果が、アレル測定工程で用いられたSNPに基づいて予め設定された閾値を、上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが低いとの情報を提供するステップを含む工程である、請求項１～５いずれか記載の方法。
　情報提供工程が、前記アレル測定工程が複数の測定ステップを含む場合、前記情報取得工程により得られた被検者に関する各測定ステップでの結果が、各測定ステップで用いられたSNP群に基づいて予め設定された閾値を上回るか否かを指標として、前記被検者が落屑症候群又は落屑緑内障を発症するリスクの高低についての情報を提供するステップを含む工程である、請求項２～５いずれか記載の方法。
　情報提供工程が、前記情報取得工程で得られた結果にベイズ定理を当てはめて、前記被検者が落屑症候群又は落屑緑内障の発症リスクを有する確率を算出するステップを含む工程である、請求項１～５いずれか記載の方法。
　情報提供工程が、前記情報取得工程で得られた結果にベイズ定理を当てはめて、前記被検者の落屑症候群又は落屑緑内障を予め設定されたパーセント(％)以上の確率で発症リスクを有する確率を算出するステップを含む工程である、請求項１～５いずれか記載の方法。
　プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータを備え、前記メモリには、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されている、落屑症候群又は落屑緑内障の発症リスクを有する被検者の検出装置。
　プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータであって、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表１に記載の12個のコアSNP群と、表２に記載のプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行させる、コンピュータプログラム。