JP2005524383A

JP2005524383A - 統合失調症の診断に用いる一塩基多型

Info

Publication number: JP2005524383A
Application number: JP2003525680A
Authority: JP
Inventors: ケイテス，ポール・エス; テング，チ−フセ
Original assignee: ファルマシア・アンド・アップジョン・カンパニー・エルエルシー
Priority date: 2001-08-28
Filing date: 2002-08-28
Publication date: 2005-08-18

Abstract

本発明は、多型部位を含む、ヒトＧタンパク質共役型受容体Ｓｅｑ−４０遺伝子の核酸セグメントを提供する。これらの部位に隣接する領域にハイブリダイズする、アレル特異的プライマーおよびプローブもまた提供する。本発明はまた、統合失調症を発症する遺伝的リスクを決定する方法または統合失調症を診断する方法も提供する。

Description

関連出願へのクロスリファレンス
本出願は、本明細書に援用される、出願第６０／３１５５０１号、２００１年８月２８日出願の優先権を主張する。

発明の分野
本発明は、多型部位を含む、ヒトＧタンパク質共役型受容体Ｓｅｑ−４０の核酸セグメントを提供する。本発明はまた、統合失調症を発症する（ｄｅｖｅｌｏｐ）遺伝的リスクを決定する方法、または統合失調症を診断する方法も提供する。

背景
一塩基多型
すべての生物は、進化の過程で、定期的に突然変異を経験し、そしてしたがって、祖先配列の変異型を生成する（Ｇｕｓｅｌｌａ，Ａｎｎ．Ｒｅｖ．Ｂｉｏｃｈｅｍ．５５，８３１−８５４（１９８６））。変異型は、祖先型に比較して、進化上の利点を与える可能性もあるし、また与えない可能性もある。変異型は、中立である可能性もある。ある場合は、変異型は致死であり、そして該生物のさらなる世代に伝達されない。他の場合は、変異型は、種に進化上の利点を与え、そして最終的にその種の多くのメンバーまたは大部分のメンバーのＤＮＡに取り込まれ、そして事実上、祖先型になる。多くの場合、単数または複数の祖先型および変異型両方が生き延び、そして種の集団に共存する。配列の多数の型のこの共存が多型を生じる。

いくつかの異なる種類の多型が報告されてきている。制限断片長多型（ＲＦＬＰ）は、Ｂｏｔｓｔｅｉｎら，Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．３２，３１４−３３１（１９８０）に記載されるように、制限断片の長さを改変するＤＮＡ配列中の変異を意味する。制限断片長多型は、制限部位を生成するかまたは欠失させ、こうして制限断片の長さを変化させることが可能である。ＲＦＬＰは、ヒトおよび動物の遺伝子解析で、広く用いられてきている（米国特許第５，８５６，１０４号、１９９９年１月５日、Ｃｈｅｅら、ＷＯ９０／１３６６８；ＷＯ９０／１１３６９；Ｄｏｎｉｓ−Ｋｅｌｌｅｒ，Ｃｅｌｌ５１，３１９−３３７（１９８７）；Ｌａｎｄｅｒら，Ｇｅｎｅｔｉｃｓ１２１，８５−９９（１９８９）を参照されたい）。遺伝性形質を特定のＲＦＬＰに結びつけることが可能である場合、個体におけるＲＦＬＰの存在を用いて、動物がやはりその形質を示すであろう尤度を予測することが可能である。

他の多型は、タンデムの二、三、および四ヌクレオチド反復モチーフを含む、短タンデム反復（ＳＴＲ）の形を取る。これらのタンデム反復はまた、可変数タンデム反復（ＶＮＴＲ）多型とも称される。ＶＮＴＲは、身元解析および父子解析（米国特許第５，０７５，２１７号；Ａｒｍｏｕｒら，ＦＥＢＳＬｅｔｔ．３０７，１１３−１１５（１９９２）；Ｈｏｒｎら、ＷＯ９１／１４００３；Ｊｅｆｆｒｅｙｓ、ＥＰ３７０，７１９）、並びに多数の遺伝子マッピング研究に用いられてきている。

いくつかの他の多型は、同一種の個体間の単一ヌクレオチド変異の形を取る。こうした多型は、ＲＦＬＰ、ＳＴＲおよびＶＮＴＲよりはるかに頻繁である。しかし、単一ヌクレオチド変化はまた、制限酵素部位の生成または破壊も生じうるため、一塩基多型はまた、ＲＦＬＰも生じる可能性があることを認識すべきである。いくつかの一塩基多型は、タンパク質コード配列で生じ、この場合、多型の１つは、不全タンパク質または他の変異タンパク質の発現を生じ、そして潜在的に遺伝疾患を生じる可能性がある。コード配列内の多型が遺伝疾患を生じる遺伝子の例には、ベータ−グロビン（鎌形赤血球貧血）およびＣＦＴＲ（嚢胞性線維症）が含まれる。他の一塩基多型は、非コード領域で生じる。これらの多型のいくつかはまた、（例えば不全スプライシングの結果として）不全タンパク質発現を生じる可能性がある。他の一塩基多型は、表現型上の影響を持たないが、なお、表現型への影響に遺伝的に関連する可能性がある。

一塩基多型の頻度および均一性がより高いため、他の多型の場合よりも、こうした多型が目的の遺伝子座により近接して見出される確率は、より高い。また、異なる型の性質決定された一塩基多型は、しばしば、他の種類の多型よりも区別が容易である（例えばアレル特異的ハイブリダイゼーションプローブまたはプライマーを使用するアッセイの使用による）。多数の遺伝子産物が疾患の解析に役割を果たす、統合失調症のような疾患では、ＳＮＰは、研究ツールとして際立った見込みを示し、そしてＳＮＰはまた、価値ある診断ツールである可能性もある。

統合失調症（ｓｃｈｉｚｏｐｈｒｅｎｉａ）
統合失調症は、人口のおよそ１％が罹患する、壊滅的な神経精神障害であり、そして罹患個体およびその家族の人生に深刻な破壊を生じる。一般的な症状には、妄想、思考の分裂、および幻視または幻聴とともに、感情的振る舞いの変化が含まれる。症状に評点を付けるいくつかのスケール、および診断を確かめる方法が開発されてきており、これには、臨床的診断の正確さを改良することを試みた、米国精神医学会によるＤＭＳ分類（ＤｉａｇｎｏｓｔｉｃａｎｄＳｔａｔｉｓｔｉｃａｌＭａｎｕａｌｏｆＭｅｎｔａｌＤｉｓｏｒｄｅｒｓ、第３版および第４版）が含まれる。しかし、いくつかの根底にある異常から、類似の症状が生じる可能性があり、そして臨床的症状にのみ頼る診断は困難で、そして賛否両論であるとともに、主観的で時間がかかり、そして費用がかかる。したがって、統合失調症を診断する新規方法、または統合失調症を発症する素因を予測する新規方法に対する、切迫した必要性がある。

引用文献

発明の概要
本発明は、統合失調症に関連する一組の多型マーカーの発見に基づく。これらのマーカーは、我々がＳｅｑ−４０と命名した、Ｇタンパク質共役型受容体（ＧＰＣＲ）遺伝子のコード領域とともに非コード領域中に位置する。Ｓｅｑ−４０のコード領域および該当する非コード領域を以下に示す。多型を太字で示す。

上記配列は、２０００年１１月１６日に出願され、そしてＷＯ０１３６４７３として公開された米国特許出願第０９／７１４４４９号に報告されるようなＯＲＦ予測を含有する。選択的スプライシング変異体が存在する可能性があることが認識されるであろう。この配列は、さらなる隣接配列を含有する。

本発明は、統合失調症の診断に適しているか、または統合失調症を発症する尤度を予測するのに適している、ヒトＧタンパク質共役型受容体Ｓｅｑ−４０遺伝子の配列由来のポリヌクレオチド断片の最初の記述を含む。本発明はさらに、診断法および予測法を含む。

本発明の１つの態様は、配列番号１の１２〜２００の隣接するヌクレオチドまたはその相補体を含むか、該ヌクレオチドまたはその相補体からなるか、あるいは該ヌクレオチドまたはその相補体から本質的になる単離ポリヌクレオチドであって、１９４，６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の多型部位からなる群より選択される、少なくとも１つのＳｅｑ−４０多型部位を含む、前記ポリヌクレオチドを含む。この定義、および用語「１２〜２００の隣接するヌクレオチド」を使用する以下の他の定義はすべて、長さ１２〜２００ヌクレオチドのありとあらゆる整数のポリヌクレオチドを含むことを意味する。

本発明は、１９４位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、６０１位のヌクレオチドが、ヌクレオチドＡまたはＧの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、１０２９位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、１０３８位のヌクレオチドが、ヌクレオチドＣまたはＧの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、１０７４位のヌクレオチドが、ヌクレオチドＡまたはＣの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、２１０６位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、２１８５位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、２３５９位のヌクレオチドが、ヌクレオチドＴまたはＧの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、２６６３位のヌクレオチドが、ヌクレオチドＣまたはＧの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

本発明は、２７６９位のヌクレオチドが、ヌクレオチドＡまたはＧの群より選択される、配列番号１の１２〜２００の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。

これらのセグメントの相補体もまた含まれる。セグメントは、ＤＮＡまたはＲＮＡであることが可能であるし、そして二本鎖または一本鎖であることが可能である。いくつかのセグメントは、長さ１０〜２０塩基または１０〜５０塩基である。好ましいセグメントは、長さ１０〜４００塩基である。

本発明はさらに、配列番号１に示す配列にハイブリダイズする、アレル特異的オリゴヌクレオチドまたはその相補体を提供する。これらのオリゴヌクレオチドは、プローブまたはプライマーであることが可能である。

本発明はさらに、個体由来の核酸を解析する方法を提供する。該方法は、どのヌクレオチド（単数または複数）が、Ｓｅｑ−４０内に含有される多型部位、すなわち「Ｓｅｑ−４０多型」または「Ｓｅｑ−４０多型部位」に存在するかを決定する。場合によって、配列番号１内の各多型部位の塩基を、１つの反応で同時に決定する。この種の解析は、疾患表現型の存在に関して試験する複数の個体に対して、行うことが可能である。次いで、疾患表現型または疾患状態を発症する性向の存在または非存在を、試験した個体の多型部位に存在する塩基または塩基の組と相関させることが可能である。あるいは、この決定工程は、単一染色体上のＳｅｑ−４０多型部位の同一性を決定するような方式で行う。

本発明はしたがって、１９４、６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の１以上のヌクレオチドを含む核酸を含む、患者由来の材料を得て、そしてＳｅｑ−４０ハプロタイプを決定することにより、患者におけるＳｅｑ−４０ハプロタイプの存在または非存在を決定することによって、統合失調症を診断する方法、または統合失調症に対する素因を決定する方法を提供する。

配列表の簡単な説明
配列番号１１９４、６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位で見られる変異を含む、Ｓｅｑ−４０のＤＮＡ配列
配列番号２２６５および２９１位で見られる変異を含む、ＳＥＱ−４０のアミノ酸配列。

配列番号３ＰＣＲプライマー−実施例１
配列番号４ＰＣＲプライマー−実施例１
配列番号５配列決定プライマー−実施例１
配列番号６配列決定プライマー−実施例１
配列番号７配列決定プライマー−実施例１
配列番号８配列決定プライマー−実施例１
配列番号９ＴａｑＭａｎプローブ−表３
配列番号１０ＴａｑＭａｎプローブ−表３
配列番号１１ＴａｑＭａｎプローブ−表３
配列番号１２ＴａｑＭａｎプローブ−表３
配列番号１３ＴａｑＭａｎプローブ−表３
配列番号１４ＴａｑＭａｎプローブ−表３
配列番号１５ＴａｑＭａｎプローブ−表３
配列番号１６ＴａｑＭａｎプローブ−表３
配列番号１７ＴａｑＭａｎプローブ−表３
配列番号１８ＴａｑＭａｎプローブ−表３
配列番号１９ＴａｑＭａｎプローブ−表３
配列番号２０ＴａｑＭａｎプローブ−表３
配列番号２１ＰＣＲプライマー−表３
配列番号２２ＰＣＲプライマー−表３
配列番号２３ＰＣＲプライマー−表３
配列番号２４ＰＣＲプライマー−表３
配列番号２５ＰＣＲプライマー−表３
配列番号２６ＰＣＲプライマー−表３
配列番号２７ＰＣＲプライマー−表３
配列番号２８ＰＣＲプライマー−表３
配列番号２９ＰＣＲプライマー−表３
配列番号３０ＰＣＲプライマー−表３
配列番号３１ＰＣＲプライマー−表３
配列番号３２ＰＣＲプライマー−表３
配列番号３３ＳＮＰ６合成アレル
配列番号３４ＳＮＰ６合成アレル
配列番号３５ＳＮＰ６合成アレルオリゴマー
配列番号３６ＳＮＰ６合成アレルオリゴマー
配列番号３７ＳＮＰ６合成アレルオリゴマー
配列番号３８ＳＮＰ７合成アレル
配列番号３９ＳＮＰ７合成アレル
配列番号４０ＳＮＰ７合成アレルオリゴマー
配列番号４１ＳＮＰ７合成アレルオリゴマー
配列番号４２ＳＮＰ７合成アレルオリゴマー

発明の詳細な説明
定義
定義
用語「アレル」は、本明細書において、ヌクレオチド配列の変異体を指す。
「統合失調症に作用する剤」には、当該技術分野において、統合失調症の１以上の症状に対処するか、該症状を減少させるか、または該症状を軽減することが知られる、いかなる薬剤または化合物も含む。「統合失調症に作用する剤」には、当該技術分野に知られる統合失調症に関与する酵素または制御分子の活性または濃度を変調する、いかなる薬剤または化合物も含まれる。統合失調症に作用する剤には、限定されるわけではないが、トラジン、メレリル、モデケート、プロリキシン、ナベーン、ステラジンおよびハルドール、リスペリドン（リスパダール）、クロザピン（クロザリル）、オランザピン（ジプレキサ）およびクエチアピン（セロクエル）が含まれる。

用語「統合失調症に作用する剤に対する反応」は、限定されるわけではないが、化合物を代謝する能力、プロドラッグを活性薬剤に変換する能力、並びに個体における薬剤の薬物動態学（吸収、分布、排出）および薬力学（受容体関連）を含む薬剤能力を指す。用語「統合失調症に作用する剤に対する副作用」は、薬剤の主な薬理学的作用の延長から生じる療法の副作用、または特有の宿主因子と薬剤の相互作用から生じる、固有の副作用を指す。「統合失調症に作用する剤に対する副作用」には、限定されるわけではないが、起立性低血圧症、視覚のぼけ、口内乾燥、鼻詰まり、および便秘などの自律神経性副作用が含まれる。「統合失調症に作用する剤に対する副作用」にはまた、不安、睡眠障害、性的機能障害、胃腸障害、吐き気、下痢、起立性低血圧（ｏｒｔｈｏｓｔａｓｉｓ）、めまい、鎮静、高血圧、ショック、無動症（動きの緩慢化）、静座不能症（四肢の静止不能）、および遅発性ジスキネジー（動きの永続的、非可逆的な障害）も含まれる。

用語「相補性」または「その相補体」は、本明細書において、相補性領域全体に渡って、別の明記するポリヌクレオチドと、ワトソン・クリック塩基対形成することが可能なポリヌクレオチドの配列を指す。この用語は、配列のみに基づいて、ポリヌクレオチド対に適用され、そして２つのポリヌクレオチドが実際に結合する、いかなる特定の組の条件にも基づかない。

用語「遺伝子型」は、本明細書において、個体またはサンプルに存在するアレルの同一性を指す。本発明の背景において、遺伝子型は、好ましくは、個体またはサンプルに存在する多型アレルの説明を指す。用語、多型マーカーに関するサンプルまたは個体の「遺伝子型決定（ｇｅｎｏｔｙｐｉｎｇ）」は、個体が多型マーカー部位で所持する特定のアレルまたは特定のヌクレオチドを決定することからなる。

用語「ヘテロ接合性率」は、本明細書において、集団中、特定のアレルがヘテロ接合体である個体の出現率を指す。多型系において、ヘテロ接合性率は、平均して、２Ｐａ（１−Ｐａ）に等しく、式中、Ｐａは最も一般的でないアレルの頻度である。遺伝研究において有用であるために、遺伝子マーカーは、無作為に選択された個人がヘテロ接合体である確率が妥当であるのを可能にするのに適したレベルを有するべきである。

用語「突然変異」は、本明細書において、１％未満の頻度を有する、異なるゲノムまたは個体間のＤＮＡ配列の相違を指す。
用語「ハプロタイプ」は、１つの染色体上のアレルの現実に存在する組み合わせを指す。本発明の関連において、ハプロタイプは、好ましくは、既定の個体に見られ、そして表現型と関連する可能性がある多型の組み合わせを指す。

用語「多型」は、本明細書において、異なるゲノムまたは個体間の２以上の代替ゲノム配列またはアレルの存在を指す。「多型の」は、集団中に、特定のゲノム配列の２以上の変異体を見出すことが可能な状態を指す。「多型部位」は、変異が起こる遺伝子座である。多型は、集団中の、２以上の遺伝的に決定される代替配列またはアレルの存在を指す。好ましい多型は、各々、選択した集団の１％より高い頻度で存在し、そしてより好ましくは、１０％または２０％より高い頻度で存在する、少なくとも２つのアレルを有する。多型遺伝子座は、１塩基対まで小さいことも可能である。多型マーカーには、制限断片長多型、可変数タンデム反復（ＶＮＴＲ）、超可変領域、ミニサテライト、二ヌクレオチド反復、三ヌクレオチド反復、四ヌクレオチド反復、単純配列反復、およびＡｌｕなどの挿入要素が含まれる。最初に同定されたアレル型が、恣意的に、参照型と称され、そして他のアレル型が、代替アレルまたは変異アレルと称される。選択した集団に最も頻繁に存在するアレル型は、ときに、野生型と称される。二倍体生物は、アレル型に関して、ホモ接合体またはヘテロ接合体であることが可能である。二アレル多型は、２つの型を有する。三アレル多型は、３つの型を有する。

「一塩基多型」（ＳＮＰ）は、単一塩基対の変化である。一塩基多型は、アレル配列間の変異部位である、単一ヌクレオチドが占める多型部位で生じる。通常、該部位の前および後には、アレルの非常に保存された配列（例えば集団の１／１００または１／１０００未満のメンバーで異なる配列）が存在する。

一塩基多型は、通常、多型部位で１つのヌクレオチドが別のヌクレオチドに置換されたために生じる。トランジションは、１つのプリンの別のプリンによる置換、または１つのピリミジンの別のピリミジンによる置換である。トランスバージョンは、プリンのピリミジンによる置換、またはその逆の置換である。一塩基多型はまた、参照アレルに比較した、ヌクレオチドの欠失から生じるか、またはヌクレオチドの挿入から生じることも可能である。単一のヌクレオチドが変化した結果、制限部位が破壊されるか、制限部位が生成されることが可能であることに注目すべきである。したがって、一塩基多型がまた、制限断片長多型として現れる可能性もある。

一塩基多型（ＳＮＰ）は、ＲＦＬＰ、およびＶＮＴＲと同じ方式で使用可能であるが、いくつかの利点を提供する。一塩基多型は、より高い頻度で存在し、そして他の型の多型よりも、ゲノム全体に、より均一に間隔を空けて配置されている。ＳＮＰは、大まかに、１／１０００塩基対の頻度で生じ、そして最も豊富でないアレルが１％以上の頻度を有するという必要条件によって、稀な変異または突然変異から区別される（Ｂｒｏｏｋｅｓ、１９９９）。ＳＮＰの例には：
１．遺伝子にコードされるタンパク質産物において、１つのアミノ酸を別のものに置換する、非同義コード領域変化、
２．遺伝暗号の縮重のため、アミノ酸コード配列を改変しない、同義変化、
３．遺伝子の転写を改変する可能性も、またしない可能性もある、プロモーター、エンハンサーまたは他の遺伝子調節要素配列の変化、
４．ｍＲＮＡの非翻訳領域、特に、リボソーム結合、翻訳開始の効率を改変する可能性がある５’端、あるいはｍＲＮＡ安定性を改変する可能性がある３’端での変化、および
５．転写物のスプライシングまたは他の遺伝子制御要素の機能を改変する可能性がある、イントロン領域内の変化
が含まれる。

用語「二アレル多型」および「二アレルマーカー」は、本明細書において交換可能に用いられ、集団中にかなり高い頻度で２つのアレルを有する多型、好ましくは一塩基多型を指す。「二アレルマーカーアレル」は、二アレルマーカー部位に存在するヌクレオチド変異体を指す。典型的には、本発明の二アレルマーカーのより一般的でないアレルの頻度は、１％より高いと認定されてきており、好ましくは、頻度は１０％より高く、より好ましくは、頻度は少なくとも２０％（すなわち少なくとも０．３２のヘテロ接合性率）であり、さらにより好ましくは、頻度は少なくとも３０％（すなわち少なくとも０．４２のヘテロ接合性率）である。より一般的でないアレルの頻度が３０％以上である二アレルマーカーを、「高品質二アレルマーカー」と称する。

用語「Ｓｅｑ−４０多型」または「Ｓｅｑ−４０多型部位」は、本明細書において、本明細書に開示するＳｅｑ−４０遺伝子内の多型または多型部位を意味する。この用語は、Ｓｅｑ−４０コード配列、イントロン領域および隣接領域内の多型部位での多型を含むであろう。「Ｓｅｑ−４０多型」は、有用性を有するために、Ｓｅｑ−４０タンパク質産物中のアミノ酸を変化させる必要はない。用語、Ｓｅｑ−４０多型は、一塩基多型、二アレル多型および他のものを含み、そして本開示の表１に記載する多型である。Ｓｅｑ−４０一塩基多型は、単一ヌクレオチドの変異を反映する多型である。用語「少なくとも１つのＳｅｑ−４０多型部位」は、本開示の表１に詳細に示すものから選択される、Ｓｅｑ−４０遺伝子内の、少なくとも１つの多型部位を意味する。

本明細書に交換可能に用いられるように、用語「オリゴヌクレオチド」および「ポリヌクレオチド」には、一本鎖または二重鎖型いずれかの、１ヌクレオチドより多い、ＲＮＡ、ＤＮＡ、またはＲＮＡ／ＤＮＡハイブリッド配列が含まれる。用語「ヌクレオチド」は、本明細書において、一本鎖または二重鎖型いずれかの、いかなる長さでもよいＲＮＡ、ＤＮＡ、またはＲＮＡ／ＤＮＡハイブリッド配列を含む分子を説明する形容詞である。用語「ヌクレオチド」はまた、本明細書において、個々のヌクレオチドまたは多様なヌクレオチド、すなわち、プリンまたはピリミジン、リボースまたはデオキシリボース糖部分、およびリン酸基、あるいはオリゴヌクレオチドまたはポリヌクレオチド内のヌクレオチドの場合、ホスホジエステル連結を含む、分子、またはより大きい核酸分子中の個々の単位を指す名詞である。しかし、用語「ヌクレオチド」はまた、本明細書において、少なくとも１つの修飾、（ａ）代替連結基、（ｂ）プリンの類似型、（ｃ）ピリミジンの類似型、または（ｄ）糖の類似型を含む、「修飾ヌクレオチド」を含む。類似の連結基、プリン、ピリミジン、および糖の例に関しては、例えばＰＣＴ公報第ＷＯ９５／０４０６４号を参照されたい。しかし、本発明のポリヌクレオチドは、好ましくは、５０％を越えて、慣用的なデオキシリボースヌクレオチドで、そして最も好ましくは、９０％を越えて、慣用的なデオキシリボースヌクレオチドで構成される。本発明のポリヌクレオチド配列は、合成、組換え、ｅｘｖｉｖｏ生成、またはこれらの組み合わせを含む、既知の方法いずれかとともに、当該技術分野で知られる精製法いずれかを利用することによって、調製可能である。

ポリヌクレオチドの中央に対する、ポリヌクレオチド中のヌクレオチドの位置を、以下の方式で本明細書に記載する。ポリヌクレオチドが、奇数のヌクレオチドを有する場合、ポリヌクレオチドの３’端および５’端からの距離が等しいヌクレオチドを、該ポリヌクレオチドの「中央」にあるとみなし、そして中央のヌクレオチドにすぐ隣接するヌクレオチドいずれか、または中央にあるヌクレオチド自体を「中央から１ヌクレオチド以内」にあるとみなす。ポリヌクレオチド中のヌクレオチドが奇数であれば、ポリヌクレオチドの中央の５ヌクレオチド位はいずれも、中央の２ヌクレオチド以内にあるとみなされるであろうし、以下同様である。ポリヌクレオチドが偶数のヌクレオチドを有する場合、ポリヌクレオチドの中央には結合があり、そしてヌクレオチドはないであろう。したがって、中央の２ヌクレオチドを「中央から１ヌクレオチド以内」にあるとみなし、そしてポリヌクレオチド中央の４ヌクレオチドをいずれも、「中央から２ヌクレオチド以内」にあるとみなし、以下同様である。１以上のヌクレオチドの置換、挿入または欠失を伴う多型では、多型の置換、挿入、または欠失ポリヌクレオチドの３’から、ポリヌクレオチドの３’端までの距離、および多型の置換、挿入、または欠失ポリヌクレオチドから、ポリヌクレオチドの５’端までの距離の相違が、０または１ヌクレオチドである場合、多型、アレルまたは二アレルマーカーは、ポリヌクレオチドの「中央」にある。この相違が０〜３である場合、多型は、「中央から１ヌクレオチド以内」にあるとみなされる。相違が０〜５である場合、多型は、「中央から２ヌクレオチド以内」にあるとみなされる。相違が０〜７である場合、多型は、「中央から３ヌクレオチド以内」にあるとみなされ、以下同様である。１以上のヌクレオチドの置換、挿入または欠失を伴う多型では、多型の置換、挿入、または欠失ポリヌクレオチドから、ポリヌクレオチドの３’端までの距離、および多型の置換、挿入、または欠失ポリヌクレオチドから、ポリヌクレオチドの５’端までの距離の相違が、０または１ヌクレオチドである場合、多型、アレルまたは二アレルマーカーは、ポリヌクレオチドの「中央」にある。この相違が０〜３である場合、多型は、「中央から１ヌクレオチド以内」にあるとみなされる。相違が０〜５である場合、多型は、「中央から２ヌクレオチド以内」にあるとみなされる。相違が０〜７である場合、多型は、「中央から３ヌクレオチド以内」にあるとみなされ、以下同様である。

ポリヌクレオチドの端に対する、ポリヌクレオチド中のヌクレオチドの位置を、以下の方式で本明細書に記載する。ヌクレオチドは、ポリヌクレオチドの５’端または３’端いずれかにあるならば、ポリヌクレオチドの「端」にある。

用語「上流」は、本明細書において、特定の参照ポイントからポリヌクレオチドの５’端に向かう位置を指す。用語「塩基対形成された」および「ワトソン・クリック塩基対形成された」は、本明細書において交換可能に用いられ、２つの水素結合によってアデニン残基に連結されているチミンまたはウラシル残基、並びに３つの水素結合によって連結されているシトシンおよびグアニン残基を含む、二重らせんＤＮＡに見られるような方式で配列同一性によって、互いに水素結合することが可能なヌクレオチドを指す（Ｓｔｒｙｅｒ，Ｌ．，Ｂｉｏｃｈｅｍｉｓｔｒｙ，第４版，１９９５を参照されたい）。

用語「単離された」は、本明細書において、限定されるわけではないが、他の核酸、炭水化物、脂質およびタンパク質（ポリヌクレオチドの合成に用いられる酵素など）を含む他の化合物から、ある程度分離されている、本発明のポリヌクレオチドまたはポリヌクレオチドベクター、あるいは直鎖ポリヌクレオチドからの、共有結合で閉環されたポリヌクレオチドの分離を記載する。ポリヌクレオチドは、試料の少なくとも約５０％、好ましくは６０〜７５％が、単一ポリヌクレオチド配列およびコンホメーション（直鎖対共有結合閉環）を示す場合、実質的に単離されている。実質的に単離されたポリヌクレオチドは、典型的には、核酸試料の約５０％、好ましくは６０〜９０重量／重量％、より一般的には約９５％を含み、そして好ましくは、約９９％以上、純粋である。ポリヌクレオチド単離または均質性の度合いは、試料のアガロースまたはポリアクリルアミドゲル電気泳動に続いて、染色ゲル上で、単一ポリヌクレオチドバンドを視覚化するなど、当該技術分野に周知の、いくつかの手段によって示すことが可能である。特定の目的のため、ＨＰＬＣまたは当該技術分野に周知の他の手段を用いることによって、より高い分解能が提供可能である。

用語、プライマーは、適切な条件下（すなわち４つの異なるヌクレオシド三リン酸、およびＤＮＡまたはＲＮＡポリメラーゼまたは逆転写酵素などの重合のための剤）、適切な緩衝液中、そして適切な温度で、テンプレートが指示するＤＮＡ合成の開始点として作用することが可能な一本鎖オリゴヌクレオチドを指す。プライマーの適切な長さは、プライマーの意図される使用に応じるが、典型的には、１５〜３０ヌクレオチドの範囲である。短いプライマー分子は、一般的に、テンプレートと十分に安定なハイブリッド複合体を形成するのに、より低い温度を必要とする。プライマーは、テンプレートの配列を正確に反映する必要はないが、テンプレートとハイブリダイズするために十分に相補的でなければならない。用語、プライマー部位は、プライマーがハイブリダイズする標的ＤＮＡの領域を指す。用語、プライマー対は、増幅しようとするＤＮＡ配列の５’端とハイブリダイズする５’上流プライマー、および増幅しようとするＤＮＡ配列の３’端の相補体とハイブリダイズする３’下流プライマーを含むプライマーの組を意味する。

用語「プローブ」または「ハイブリダイゼーションプローブ」は、試料に存在する特定のポリヌクレオチド配列を同定するのに使用可能な、定義された核酸セグメント（またはヌクレオチド類似体セグメント、例えば本明細書に定義するようなポリヌクレオチド）を示し、前記核酸セグメントは、ハイブリダイゼーションによって同定しようとする、特定のポリヌクレオチド配列に相補的なヌクレオチド配列を含む。「プローブ」または「ハイブリダイゼーションプローブ」は、核酸の相補鎖に塩基特異的な方式で結合することが可能な核酸である。こうしたプローブには、Ｎｉｅｌｓｅｎら，Ｓｃｉｅｎｃｅ２５４，１４９７−１５００（１９９１）に記載されるような、ペプチド核酸も含まれる。ハイブリダイゼーションは、通常、「ストリンジェントな条件」下、例えば、１Ｍ以下の塩濃度および少なくとも２５℃の温度で行われる。例えば、５ｘＳＳＰＥ（７５０ｍＭＮａＣｌ、５０ｍＭリン酸ナトリウム、５ｍＭＥＤＴＡ、ｐＨ７．４）および２５〜３０℃の温度の条件は、アレル特異的プローブハイブリダイゼーションに適している。この特定の緩衝液組成は、例として提供されるが、当業者は、同等に適切な他の組成を容易に代用することが可能である。

用語「配列決定」は、本明細書において、核酸中のヌクレオチドの順序を決定する過程を意味する。核酸を配列決定する多様な方法が当該技術分野に周知である。こうした配列決定法には、例えば、本明細書に援用される、Ｓａｎｇｅｒら，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．７４：５４６３（１９９７）に記載されるように、ジデオキシ仲介鎖終結のサンガー法が含まれる（本明細書に援用される、“ＤＮＡＳｅｑｕｅｎｃｉｎｇ”，Ｓａｍｂｒｏｏｋら（監修），ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（第２版）中，ニューヨーク州プレーンビュー；ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（１９８９）もまた参照されたい）。大腸菌（Ｅ．ｃｏｌｉ）ＤＮＡポリメラーゼＩのクレノウ断片；シークエナーゼＴＭ（Ｔ７ＤＮＡポリメラーゼ）；ＴａｑＤＮＡポリメラーゼおよびＡｍｐｌｉＴａｑを含む多様なポリメラーゼを、酵素的配列決定法で使用可能である。周知の配列決定法にはまた、ＤＮＡのマクサム・ギルバート化学分解も含まれる（本明細書に援用される、ＭａｘａｍおよびＧｉｌｂｅｒｔ，ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ．６５：４９９（１９８０）、および“ＤＮＡＳｅｑｕｅｎｃｉｎｇ”、Ｓａｍｂｒｏｏｋら、上記、１９８９を参照されたい）。当業者は、配列決定が現在、しばしば、自動化法の補助で行われていることを認識する。

用語「統合失調症（ｓｃｈｉｚｏｐｈｒｅｎｉａ）」は、慣用的な意味を有し、例えばＤＳＭ−ＩＩＩ−Ｒに記載される一群の症状によって特徴付けられる精神障害を指す。
用語「形質（ｔｒａｉｔ）」および「表現型」は、本明細書において交換可能に用いられ、そして例えば疾患の症状、または疾患に対する感受性などの、目に見えるか、検出可能か、または別の方式で測定可能な生物の特性いずれかを指す。典型的には、用語「形質」または「表現型」は、本明細書において、統合失調症の症状、または統合失調症に対する感受性を指すか；あるいは統合失調症に作用する剤に対する個体の反応を指すか；あるいは統合失調症に作用する剤に対する副作用の症状、または該副作用に対する感受性を指す。

本発明の多型
Ｓｅｑ−４０ｃＤＮＡのヌクレオチドおよびアミノ酸配列は、どちらも本明細書に援用される、米国特許出願第０９／７１４４４９号およびＷＯ０１／３６４７３号に先に開示されている。

Ｓｅｑ−４０は、ＧＰＣＲスーパーファミリーのアミン作用性／コリン作用性ブランチと最も近い配列相同性を持つ、新規ＧＰＣＲであるが、生体アミン受容体の特徴を持たない。脳切片におけるｍＲＮＡのｉｎｓｉｔｕハイブリダイゼーションによって、Ｓｅｑ−４０ＲＮＡが、脳の辺縁系領域、より具体的には、皮質、梨状皮質、海馬、視床下部、黒質緻密部、側方隔壁（ｌａｔｅｒａｌｓｅｐｔｕｍ）、分界条床核（ｂｅｄｎｕｃｌｅｕｓｏｆｓｔｒｉａｔｅｒｍｉｎａｌｉｓ）、視床、腹側被蓋（ｖｅｎｔｒａｌｔｅｇｍｅｎｔａｌ）、脚間核、背面縫線（ｄｏｒｓａｌｒａｐｈｅ）、内側膝状体（ｍｅｄｉａｌｇｅｎｉｃｕｌａｔｅ）、カエハ島、脈絡叢、および視床腹部で発現されることが示される。

Ｓｅｑ−４０をコードする遺伝子の染色体位置を、スタンフォードＧ３放射ハイブリッドパネル（ＲｅｓｅａｃｈＧｅｎｅｔｉｃｓ，Ｉｎｃ．、アラバマ州ハンツビル）を用いて決定した。このパネルは、スタンフォード・ヒトゲノムセンターが生成した全ヒトゲノムの８３の放射ハイブリッドクローンを含有する。どのレーンがＰＣＲ産物を生じるかを決定するため、配列番号１の配列から、ＰＣＲプライマーを設計した。期待されるＰＣＲ産物の存在または非存在に関して、レーンをスコア付けし、そして解析のため、ｅ−メールを介して、結果をスタンフォード・ヒトゲノムセンターに提出した。この解析によって、Ｓｅｑ−４０は染色体６上に配置されており、スタンフォードマーカーＳＨＧＣ−１８３６（平均断片サイズは４．０Ｍｂ）に最も近くに連鎖し、ＬＯＤスコアは１１．８４である（３．０より高いスコアはいずれも、非常に有意であるとみなされる）ことがわかる。このマーカーは、６ｑ２１位に位置する。Ｃａｏら（１９９７）は、２つの独立のデータセットの連鎖解析を用いて、領域６ｑ１３−６ｑ２６が、統合失調症感受性遺伝子座を含有することが非常に示唆されると示していた。

表１

上述のように、配列番号１の１９４位のＳｅｑ−４０一塩基多型をＳ１と称し、配列番号１の６０１位のＳｅｑ−４０一塩基多型をＳ２と称し、配列番号１の１０２９位のＳｅｑ−４０一塩基多型をＳ３と称し、配列番号１の１０３８位のＳｅｑ−４０一塩基多型をＳ４と称し、配列番号１の１０７４位のＳｅｑ−４０一塩基多型をＳ５と称し、配列番号１の２１０６位のＳｅｑ−４０一塩基多型をＳ６と称し、配列番号１の２１８５位のＳｅｑ−４０一塩基多型をＳ７と称し、配列番号１の２３５９位のＳｅｑ−４０一塩基多型をＳ８と称し、配列番号１の２６６３位のＳｅｑ−４０一塩基多型をＳ９と称し、そして配列番号１の２７９６位のＳｅｑ−４０一塩基多型をＳ１０と称する。

問題の多型が既に性質決定されているかどうかに応じて、２つの別個の種類の解析がある。第一の種類の解析は、ときに、デノボ（ｄｅｎｏｖｏ）同定と呼ばれる。第二の種類の解析は、同定された多型のどの型（単数または複数）が、試験中の個体に存在するかを決定する解析である。第一の種類の解析は、異なる個体中の標的配列を比較して、変異ポイント、すなわち多型部位を同定する。ヒトで、最大の民族特有の多様性を示す個体群、並びに植物および動物で、最大の品種および種多様性を示す個体群を解析することによって、遺伝子座の最も一般的なアレル／ハプロタイプに特徴的なパターンを同定し、そして集団におけるこうした集団の頻度を決定することが可能である。地理、人種、または性別などの規準によって特徴付けられる下位集団に関して、さらにアレル頻度を決定することも可能である。本発明の多型のデノボ同定を説明する例を以下に記載する。

（実施例１）
本発明の多型のデノボ同定
材料および方法
ＤＮＡ試料
ＤＮＡ試料を、匿名の血液試料から得た。ＱｉａＡｍｐＤＮＡ血液ミニキット（Ｑｉａｇｅｎ）を用いてＤＮＡを調製した。試料を集団管理西ミシガン（ＰｏｐｕｌａｔｉｏｎＣｏｎｔｒｏｌＷｅｓｔｅｒｎＭｉｃｈｉｇａｎ）試料と称し、そしてＣＯＮ０１と名付けた。

Ｓｅｑ−４０のＰＣＲ増幅
先に開示されたＳｅｑ４０配列を用いて、ＣｅｌｅｒａヒトゲノムデータベースをＢＬＡＳＴ解析することによって、Ｓｅｑ４０ゲノム配列を同定した。検索によって、１つのエントリー、ＧＡ＿４６７４７２８５が、Ｓｅｑ−４０のコード情報を含むヒトゲノム配列およそ９．８ｋｂを含有すると同定された。Ｓｅｑ４０コード領域を含むおよそ３ｋｂのゲノム配列とともに、およそ１ｋｂ上流および０．５ｋｂ下流を含み、ＧＡ＿４６７４７２８５のヌクレオチド２９４６〜６０２４に対応する配列を増幅するため、プライマーを設計した。プライマーＰＳＫ１００およびＰＳＫ１０５（それぞれ配列番号３および４）を用いて、ヒトゲノムＤＮＡから、Ｓｅｑ４０ＳＮＰ．ｓｅｑと称するこの配列を増幅した。

ＳｔｒａｔａｇｅｎｅＲｏｂｏｃｙｃｌｅｒを用いて、製造者の指示にしたがって、５０μｌ反応中、ＡｍｐｌｉＴａｑＧｏｌｄ（ＰｅｒｋｉｎＥｌｍｅｒ）を用いてＰＣＲを行った。周期プログラムは以下のとおりであった：９４℃１０分間を１周期、その後、９５℃３０秒間、５５℃１分間および６８℃５分間を５０周期、その後、６８℃１０分間を１周期。

ＭｕｌｔｉＳｃｒｅｅｎ−ＰＣＲフィルタープレート（Ｍｉｌｌｉｐｏｒｅ）を用いて、ＰＣＲ産物を精製した。ＰＣＲ反応物をプレート上に装填し、そしてプレートをＭｕｌｔｉＳｃｒｅｅｎマニフォールド（Ｍｉｌｌｉｐｏｒｅ）上に置き、そして２４インチＨｇの真空を５〜１０分間適用した。マニフォールドからプレートを取り除き、そして５０μｌのＨ_２Ｏを各ウェルに添加した。プレートをプレート混合装置上に置き、そして５分間激しく震蘯した。各ウェルから精製ＰＣＲ産物を回収し、そして新たな９６ウェル反応プレートに入れた。

ＤＮＡ配列決定
蛍光に基づくＡＢＩ３７７配列決定装置（ＰｅｒｋｉｎＥｌｍｅｒ／ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓＤｉｖｉｓｉｏｎ、ＰＥ／ＡＢＤ、カリフォルニア州フォスターシティー）およびＴａｑＦＳＴＭポリメラーゼを含むＡＢＩＢｉｇＤｙｅ^ＴＭターミネーター周期配列決定即時反応キットを用いて、ＰＣＲ断片を直接配列決定した。各周期配列決定反応は、９．６μｌのＨ_２Ｏ、８．４μｌのＢｉｇＤｙｅターミネーター混合物（８μｌのＢｉｇＤｙｅターミネーターおよび０．４μｌのＤＭＳＯ）、１μｌＤＮＡ（〜０．５μｇ）、および１μｌプライマー（２５ｎｇ／μｌ）を含有し、そしてＰｅｒｋｉｎ−Ｅｌｍｅｒ９６００中でこの反応を行った。９８℃１分間の初期変性、その後：９６℃３０秒間、５０℃３０秒間のアニーリング、および６０℃４分間の伸長の５０周期で、周期配列決定を行った。ＡＧＴＣ（登録商標）ゲルろ過ブロック（ＥｄｇｅＢｉｏｓＳｙｓｔｅｍｓ、メリーランド州ゲイザースバーグ）を用いて伸長産物を精製した。カラム上にピペットで各反応産物を装填し、これをその後、スウィングバケット遠心分離装置（ＳｏｒｖａｌｌモデルＲＴ６０００Ｂテーブルトップ遠心分離装置）中、７５０ｘｇで２分間、室温で遠心分離した。カラム精製試料を、約６０分間真空で乾燥させ、そしてその後、２μｌのＤＮＡ装填溶液（８３％脱イオンホルムアミド、８．３ｍＭＥＤＴＡ、および１．６ｍｇ／ｍｌブルーデキストラン）に溶解した。その後、試料を９０℃に２、３分間加熱し、そしてＡＢＩ３７７配列決定装置による配列解析のため、各試料０．７５μｌをゲル試料ウェルに装填した。コンピュータプログラムＰＯＬＹＰＨＲＥＤを用いて、配列クロマトグラムを解析した。Ｎｉｃｋｅｒｓｏｎ，Ｄ．Ａ．（１９９７）ＮｕｃｌｅｉｃＡｃｉｄＲｅｓｅａｒｃｈ，２５（１４），ｐｐ．２７４５−２７５１。

結果
集団管理西ミシガン試料（ＣＯＮ０１と命名）と称する、７２個体由来のＤＮＡを含有するプレートを、上述のプライマーを用いて増幅した。ＰＣＲ産物を精製し、そして以下のプライマー（配列番号３〜８）を用いて配列決定した。

７２個体の配列を比較して、そして配列中の相違を示す、コンピュータプログラムＰＯＬＹＰＨＲＥＤを用いて、クロマトグラムを解析した。総数１０のＳＮＰを同定した。結果の要約を以下の表２に示す。

表２

５つのＳＮＰは、５’隣接領域にあり、２つはコード領域にあり、そして３つは３’隣接領域にある。ＳＮＰの位置は、配列番号１の配列に比較して、ヌクレオチド１９４、６０１、１０２９、１０３８、１０７４、２１０６、および２１８５、２３５９、２６６３および２７９６にある。各ＳＮＰに関する稀なアレルの頻度は、それぞれ、３８、４３、７．５、２０、８．９、５．６、４．９、１９、１８、３９パーセントである。これらの頻度は、異なる集団またはより大きい集団を用いた場合には、変化する可能性もあることに注意すべきである。

また、コード領域中のどちらのＳＮＰもアミノ酸を変化させ、そして抗体に基づく診断に受け入れられるであろうことが注目される。
変異遺伝子産物に特異的に結合するが、対応するプロトタイプ遺伝子産物には結合しない、ポリクローナルおよび／またはモノクローナル抗体が意図される。抗体は、マウスまたは他の動物に、変異遺伝子産物またはその合成ペプチド断片を注射することによって作成可能である。例えばＨａｒｌｏｗおよびＬａｎｅ，Ａｎｔｉｂｏｄｉｅｓ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ，ニューヨーク（１９８８）；Ｇｏｄｉｎｇ，Ｍｏｎｏｃｌｏｎａｌａｎｔｉｂｏｄｉｅｓ，ＰｒｉｎｃｉｐｌｅｓａｎｄＰｒａｃｔｉｃｅ（第２版）ＡｃａｄｅｍｉｃＰｒｅｓｓ，ニューヨーク（１９８６）に記載されるように、モノクローナル抗体をスクリーニングする。変異体遺伝子産物との特異的免疫反応性、および対応するプロトタイプ遺伝子産物に対する免疫反応性の欠如に関して、モノクローナル抗体を試験する。これらの抗体は、変異体型を検出する診断アッセイにおいて、または薬剤組成物中の活性成分として、有用である。こうした抗体を用いた診断は、当該技術分野に周知であり、そして限定されるわけではないが、ウェスタンブロット解析、ＥＬＩＳＡ解析およびラジオイムノアッセイを含むことが可能である。

関連性研究
上述のように、多型が同定されたら、試験中の個体には、同定された多型のどの型（単数または複数）が存在しているかを決定することが望ましくなる。これは、疾患状態とのありうる関連性に関して、多型をさらに性質決定する際に重要となる。こうした関連性を決定したら、同じ方法をもちろん、診断目的および予後目的に使用することが可能である。特定のヌクレオチド位の同一性を決定する際、多様な適切な方法があり、これを順番に論じる。

Ａ．試料の調製
解析中の個体由来の標的核酸において、多型を検出する。ゲノムＤＮＡのアッセイには、実質的にいかなる生物学的試料も適切である（純粋な赤血球細胞を除く）。例えば、好適な組織試料には、全血、精液、唾液、涙、尿、糞便物質、汗、頬側試料（ｂｕｃｃａｌ）、皮膚および毛髪が含まれる。ｃＤＮＡまたはｍＲＮＡのアッセイに関しては、標的核酸が発現されている臓器から、組織試料を得なくてはならない。

以下に記載する多くの方法は、標的試料からのＤＮＡの増幅を必要とする。これは、ＰＣＲによって達成可能である。一般的には、ＰＣＲＴｅｃｈｎｏｌｏｇｙ：ＰｒｉｎｃｉｐｌｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓｆｏｒＤＮＡＡｍｐｌｉｆｉｃａｔｉｏｎ（Ｈ．Ａ．Ｅｒｌｉｃｈ監修，ＦｒｅｅｍａｎＰｒｅｓｓ，ニューヨーク州ニューヨーク，１９９２）；ＰＣＲＰｒｏｔｏｃｏｌｓ：ＡＧｕｉｄｅｔｏＭｅｄｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ（Ｉｎｎｉｓら監修，ＡｃａｄｅｍｉｃＰｒｅｓｓ，カリフォルニア州サンディエゴ，１９９０）；Ｍａｔｔｉｌａら，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１９，４９６７（１９９１）；Ｅｃｋｅｒｔら，ＰＣＲＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ１，１７（１９９１）；ＰＣＲ（ＭｃＰｈｅｒｓｏｎら監修，ＩＲＬＰｒｅｓｓ，オックスフォード）；および米国特許第４，６８３，２０２号（各々、すべての目的のため、本明細書に援用される）を参照されたい。

他の適切な増幅法には、リガーゼ連鎖反応（ＬＣＲ）（ＷｕおよびＷａｌｌａｃｅ，Ｇｅｎｏｍｉｃｓ４，５６０（１９８９），Ｌａｎｄｅｇｒｅｎら，Ｓｃｉｅｎｃｅ２４１，１０７７（１９８８））、転写増幅（Ｋｗｏｈら，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６，１１７３（１９８９））、および自律配列複製（ｓｅｌｆ−ｓｕｓｔａｉｎｅｄｓｅｑｕｅｎｃｅｒｅｐｌｉｃａｔｉｏｎ）（Ｇｕａｔｅｌｌｉら，Ｐｒｏｃ．Ｎａｔ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，８７，１８７４（１９９０））および核酸に基づく配列増幅（ＮＡＳＢＡ）が含まれる。後者の２つの増幅法は、等温転写に基づく等温反応を伴い、それぞれ約３０または１００対１の比で、増幅産物として一本鎖ＲＮＡ（ｓｓＲＮＡ）および二本鎖ＤＮＡ（ｄｓＤＮＡ）両方を生じる。

Ｂ．標的ＤＮＡにおける多型の検出
１．アレル特異的プローブ
多型を解析するためのアレル特異的プローブの設計および使用は、例えばＳａｉｋｉら，Ｎａｔｕｒｅ３２４，１６３−１６６（１９８６）；Ｄａｔｔａｇｕｐｔａ、ＥＰ２３５，７２６、Ｓａｉｋｉ、ＷＯ８９／１１５４８に記載される。２個体由来のそれぞれのセグメントに異なる多型が存在するため、ある個体由来の標的ＤＮＡセグメントにハイブリダイズするが、別の個体由来の対応するセグメントにはハイブリダイズしない、アレル特異的プローブを設計することが可能である。ハイブリダイゼーション条件は、アレル間にハイブリダイゼーション強度の有意な相違があり、そして好ましくは、本質的に二元的な反応があり、それによってプローブがアレルの一方のみにハイブリダイズするように、十分にストリンジェントであるべきである。いくつかのプローブは、多型部位がプローブの中央の位置に（例えば１５量体では７位に；１６量体では８または９位いずれかに）並列して、標的ＤＮＡセグメントにハイブリダイズするように設計される。このプローブ設計は、異なるアレル型間のハイブリダイゼーションにおいて、優れた区別を達成する。

これらのプローブは、これらが、好ましくは８〜５０ヌクレオチドを含み、そしてこれらが本発明の多型マーカーを含む配列にハイブリダイズするのに十分に相補的であり、そして好ましくはわずか１ヌクレオチド変異に関して、標的配列を区別することが可能であるのに十分に特異的であることで特徴付けられる。本発明のプローブのＧＣ含量は、通常、１０〜７５％の間、好ましくは３５〜６０％の間、そしてより好ましくは４０〜５５％の間の範囲である。これらのプローブの長さは、１０、１５、２０、または３０〜少なくとも１００ヌクレオチドの範囲、好ましくは１０〜５０、より好ましくは１８〜３５ヌクレオチドの範囲であることが可能である。特に好ましいプローブは、長さ２５ヌクレオチドである。好ましくは、多型マーカーは、ポリヌクレオチドプローブの中央４ヌクレオチド以内にある。特に好ましいプローブでは、多型マーカーが前記ポリヌクレオチドの中央にある。より短いプローブは、標的核酸配列に対する特異性を欠き、そして一般的に、テンプレートと十分に安定なハイブリッド複合体を形成するのに、より低い温度を必要とする。より長いプローブは、産生するのが高価であり、そしてときに、自己ハイブリダイズして、ヘアピン構造を形成する可能性がある。オリゴヌクレオチドプローブを合成する方法が上述されており、そして本発明のプローブにも適用可能である。

好ましくは、本発明のプローブは、標識されているか、または固体支持体上に固定されている。標識および固体支持体は、当該技術分野に周知である。検出プローブは、一般的に核酸配列であるか、または例えば国際特許出願ＷＯ９２／２０７０２に開示されるペプチド核酸、米国特許第５，１８５，４４４号；第５，０３４，５０６号および第５，１４２，０４７号に記載されるモルホリノ類似体（ａｎａｌｏｇ）などの非荷電核酸類似体である。プローブは、「伸長不能」にされている必要がある可能性があり、この場合、さらなるｄＮＴＰはプローブに付加不能である。類似体は、通常、そのままで伸長不能であり、そして核酸プローブは、ヒドロキシ基がもはや伸長に関与不能となるように、該プローブの３’端を修飾することによって、伸長不能にすることが可能である。例えば、プローブの３’端を捕捉標識または検出標識で官能化して、それによってヒドロキシ基を消費するか、または別の方式で遮断することが可能である。あるいは、３’ヒドロキシ基を単に、切断するか、置換するか、または修飾することが可能である。

本発明のプローブは、いくつかの目的のために有用である。これらをゲノムＤＮＡに対するサザンハイブリダイゼーションまたはｍＲＮＡに対するノーザンハイブリダイゼーションに使用することが可能である。プローブはまた、ＰＣＲ増幅産物を検出するのにも使用可能である。アレル特異的プローブへのハイブリダイゼーションをアッセイすることによって、既定の試料における二アレルマーカーの存在または非存在を検出することが可能である。

アレイ形式のハイスループット平行ハイブリダイゼーションが「ハイブリダイゼーションアッセイ」に特に含まれ、そしてこれを以下に記載する。
アレル特異的プローブは、しばしば、対で用いられ、対の一方のメンバーは、標的配列の参照型に完全なマッチを示し、そして他方のメンバーは、変異型に完全なマッチを示す。その後、同一標的配列内の多数の多型を同時に解析するため、数対のプローブを同じ支持体上に固定することが可能である。

２．アレル特異的プライマー
アレル特異的プライマーは、多型と重複する標的ＤＮＡ上の部位にハイブリダイズし、そしてプライマーが完全な相補性を示すアレル型の増幅のみをプライミングする。Ｇｉｂｂｓ，ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ．１７，２４２７−２４４８（１９８９）を参照されたい。このプライマーを、遠位部位とハイブリダイズする第二のプライマーと組み合わせて用いる。増幅は、２つのプライマーから進行し、特定のアレル型が存在することを示す、検出可能な産物を生じる。対照実験は、通常、第二の対のプライマーを用いて行われ、このうち、プライマーの一方は多型部位に単一塩基ミスマッチを示し、そして他方は遠位部位に完全な相補性を示す。単一塩基ミスマッチによって増幅が妨げられ、そして検出可能な産物はまったく形成されない。この方法は、多型と並列するオリゴヌクレオチドの最も３’の位にミスマッチが含まれる際に最適に働くが、これは、この位が、プライマーからの伸長をもっとも不安定にするためである。例えばＷＯ９３／２２４５６を参照されたい。本発明はもちろん、遠位ミスマッチを持つこうしたプライマーとともに、選択した条件で、不安定な塩基対形成を行い、そしてしたがって、非効率的にプライミングするプライマーも意図する。

３．直接配列決定
本発明の多型の配列の直接解析は、ジデオキシ鎖終結法またはマクサム・ギルバート法いずれかを用いて達成可能である（Ｓａｍｂｒｏｏｋら，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（第２版，ＣＳＨＰ，ニューヨーク１９８９）；Ｚｙｓｋｉｎｄら，ＲｅｃｏｍｂｉｎａｎｔＤＮＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，（Ａｃａｄ．Ｐｒｅｓｓ，１９８８）を参照されたい）。ＤＮＡ配列決定分野は、過去数年間でかなり進歩してきており、そして本発明はこうした進歩を意図することを認識すべきである。最も顕著には、過去十年以内に、自動化ＤＮＡ配列解析の信頼性が増加してきている。

４．変性勾配ゲル電気泳動
変性勾配ゲル電気泳動を用いることによって、ポリメラーゼ連鎖反応を用いて生成した増幅産物を解析することが可能である。配列に応じた、異なる融解特性および溶液中のＤＮＡの電気泳動移動に基づいて、異なるアレルを同定することが可能である。Ｅｒｌｉｃｈ監修，ＰＣＲＴｅｃｈｎｏｌｏｇｙ，ＰｒｉｎｃｉｐｌｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓｆｏｒＤＮＡＡｍｐｌｉｆｉｃａｔｉｏｎ（Ｗ．Ｈ．ＦｒｅｅｍａｎａｎｄＣｏ，ニューヨーク，１９９２），第７章。

５．一本鎖コンホメーション多型解析
Ｏｒｉｔａら，Ｐｒｏｃ．Ｎａｔ．Ａｃａｄ．Ｓｃｉ．８６，２７６６−２７７０（１９８９）に記載されるように、一本鎖ＰＣＲ産物の電気泳動移動の変化によって塩基相違を同定する、一本鎖コンホメーション多型解析を用いて、標的配列のアレルを区別することが可能である。増幅されたＰＣＲ産物を上述のように生成し、そして加熱するかまたは別の方式で変性して、一本鎖増幅産物を形成することが可能である。一本鎖核酸は、再フォールディングするか、または塩基配列に部分的に依存する二次構造を形成することが可能である。一本鎖増幅産物の異なる電気泳動移動度を、標的配列のアレル間の塩基配列相違に関連付けることが可能である。

上述の方法を修飾した他の方法も存在し、これには、フィルター上のアレル特異的ハイブリダイゼーション、アレル特異的ＰＣＲ、制限酵素消化を加えたＰＣＲ（ＲＦＬＰ−ＰＣＲ）、変性キャピラリー電気泳動、プライマー伸長および飛行時間型質量分析、および５’ヌクレアーゼ（Ｔａｑ−Ｍａｎ^ＴＭ）アッセイが含まれる。

Ｔａｑ−Ｍａｎアッセイは、ＴａｑＤＮＡポリメラーゼの５’ヌクレアーゼ活性が、集積する増幅産物に特異的にアニーリングしたＤＮＡプローブを消化することをうまく利用する。蛍光エネルギー移動を介して相互作用するドナー−アクセプター色素対でＴａｑ−Ｍａｎプローブを標識する。増幅中、前進するポリメラーゼによってＴａｑ−Ｍａｎプローブが切断され、消光アクセプター色素からドナー色素が解離して、ドナー蛍光が非常に増加する。２つのアレル変異体を検出するのに必要な試薬をすべて反応開始時に合わせておくことが可能であり、そして結果をリアルタイムで監視するか、または終点アッセイとすることが可能である（Ｌｉｖａｋら，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ，９：３４１−３４２，１９９５を参照されたい）。均質ハイブリダイゼーションに基づく別の方法では、アレル識別に分子ビーコン（ｂｅａｃｏｎ）を用いる。分子ビーコンは、均質溶液における、特定の核酸の存在を知らせる、ヘアピン型オリゴヌクレオチドプローブである。ビーコンが標的に結合すると、コンホメーション再編成が起こり、これによって内部で消光されていた蛍光体の蛍光が回復する（Ｔｙａｇｉら，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，１６：４９−５３１１９９８）。

ＳＮＰの遺伝子型を決定するのに好ましい技術は、解析する各ＳＮＰの詳細な最適化を必要としない、大規模自動化解析を可能にすべきである。後者の例は、マイクロタイタープレート（Ｈｙｂａｉｄ）および「単一ストリンジェンシー」ＤＮＡ−チップハイブリダイゼーション（Ａｆｆｙｍｅｔｒｉｘ）に形式をあわせやすいＤＡＳＨ（動的アレル特異的ハイブリダイゼーション）である。もちろん、このリストが包括的でないことを認識すべきである。

本発明には、アレイ形式のハイスループット平行ハイブリダイゼーションが特に含まれ、そしてこれを以下に説明する。
オリゴヌクレオチドアレイに基づくハイブリダイゼーションアッセイは、完全にマッチした標的配列変異体およびミスマッチした標的配列変異体への短いオリゴヌクレオチドのハイブリダイゼーション安定性の相違に頼る。選択した位置で固体支持体（チップ）に付着したオリゴヌクレオチドプローブの高密度アレイを含む基本構造を通じて、多型情報への効率的なアクセスを得る。各ＤＮＡチップは、グリッド様パターンに配置され、そして１０セント硬貨の大きさに小型化した、数千〜数百万の個々の合成ＤＮＡプローブを含有することが可能である。

チップ技術はすでに、多くの場合で適用され、成功を収めてきている。例えば、ＢＲＣＡＩ遺伝子、Ｓ．セレビシエ（Ｓ．ｃｅｒｅｖｉｓｉａｅ）突然変異体株、およびＨＩＶ−Ｉウイルスのプロテアーゼ遺伝子において、突然変異のスクリーニングが行われてきている（Ｈａｃｉａら，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ，１４（４）：４４１−４４７，１９９６；Ｓｈｏｅｍａｋｅｒら，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ，１４（４）：４５０−４５６，１９９６Ｋｏｚａｌら，ＮａｔｕｒｅＭｅｄｉｃｉｎｅ，２：７５３−７５９，１９９６）。二アレル多型を検出する際に使用する多様な形式のチップは、Ａｆｆｙｍｅｔｒｉｘ（ＧｅｎｅＣｈｉｐ^ＴＭ）、Ｈｙｓｅｑ（ＨｙＣｈｉｐおよびＨｙＧｎｏｓｔｉｃｓ）、およびＰｒｏｔｏｇｅｎｅＬａｂｏｒａｔｏｒｉｅｓによってカスタマイズに基づいて製作可能である。

一般的に、これらの方法は、個体由来で多型マーカーを含む標的核酸配列セグメントに相補的なオリゴヌクレオチドプローブのアレイを使用する。ＥＰ７８５２８０は、一塩基多型の検出のためのタイリング戦略を記載する。簡潔には、多数の特定の多型に関して、アレイを一般的に「タイリング」することが可能である。「タイリング」によって、一般的に、目的の標的配列に相補的な配列とともに、その配列のあらかじめ選択された変異、例えば単量体の基準セットの１以上のメンバー、すなわちヌクレオチドでの、１以上の既定の位の置換で構成される、明示されるオリゴヌクレオチドプローブの組の合成を意味する。タイリング戦略は、ＰＣＴ出願第ＷＯ９５／１１９９５号にさらに説明されている。特定の側面において、いくつかの特定の、同定された二アレルマーカー配列に関してアレイをタイリングする。特に、いくつかの検出ブロックを含むようにアレイをタイリングし、ここで、各検出ブロックは、特定の二アレルマーカー、または二アレルマーカーの組に特異的である。例えば、特定の多型を含む配列セグメントにまたがる、いくつかのプローブを含むように検出ブロックをタイリングすることが可能である。プローブが各アレルに相補的であることを確実にするため、二アレルマーカーが異なる対で、プローブを合成する。多型塩基が異なるプローブに加え、一般的に、単一置換プローブもまた、検出ブロック内にタイリングする。これらの単一置換プローブは、多型からどちらかの方向の特定の数の塩基までが、残りのヌクレオチド（Ａ、Ｔ、Ｇ、ＣおよびＵから選択される）で置換されている塩基を有する。典型的には、タイリングされた検出ブロック中のプローブは、二アレルマーカーから５塩基離れた塩基までで、そして該塩基を含む配列位の置換を含むであろう。人為的クロスハイブリダイゼーションから実際のハイブリダイゼーションを区別するため、単一置換プローブは、タイリングされたアレイの内部対照を提供する。標的配列とのハイブリダイゼーションが完了し、そしてアレイを洗浄した際、アレイをスキャンして、標的配列がハイブリダイズするアレイ上の位置を決定する。その後、スキャンしたアレイ由来のハイブリダイゼーションデータを解析して、二アレルマーカーのどの単数または複数のアレルが試料に存在するかを同定する。ハイブリダイゼーションおよびスキャンは、ＰＣＴ出願第ＷＯ９２／１００９２号および第ＷＯ９５／１１９９５号、並びに米国特許第５，４２４，１８６号に記載されるとおりに実行可能である。

したがって、いくつかの態様において、チップは、長さ約１５ヌクレオチドの断片の核酸配列アレイを含むことが可能である。さらなる態様において、チップは、配列番号１の６〜８００の隣接するヌクレオチドを含む単離ポリヌクレオチドおよびそれに相補的な配列、または多型部位を少なくとも１つ含む、少なくとも約８の連続するヌクレオチド、好ましくは１０、１５、２０、より好ましくは２５、３０、４０、４７、または５０の連続するヌクレオチドの、前記ポリヌクレオチドの断片からなる群より選択される、少なくとも１つの配列を含むアレイを含むことが可能である。いくつかの態様において、チップは、本発明のこれらのポリヌクレオチドの、少なくとも２、３、４、５、６、７、８またはそれ以上のアレイを含むことが可能である。固体支持体、および固体支持体に付着した、本発明のポリヌクレオチドを１にさらに記載する。

蛍光アレル特異的ＰＣＲ（ＦＡＳ−ＰＣＲ）は、検出しようとするアレルに正確にマッチし、単一の３’ヌクレオチドが異なる、アレル特異的プライマーを用いる（Ｈｏｗａｒｄら１９９９）。したがって、二アレルＳＮＰの各アレルに正確にマッチするよう設計した２つのプライマーを、単一で共通の逆方向プライマーとともに用いて、アレル特異的プライマーの各々を検出する。これは、ＰＣＲ増幅プライマーの３’ヌクレオチドが正確にマッチしなければ、増幅は成功しないという観察を好適に使用する。典型的には、各アレル特異的プライマーを異なる蛍光プライマーでタグ付けして、ＰＥＢｉｏｓｙｓｔｅｍｓモデル３１０／３７３／３７７または３７００などの自動化ＤＮＡ解析系を用いて、ゲル電気泳動またはキャピラリー電気泳動によって解析した際、その区別を可能にする。

また、ＤＮＡ塩基組成の相違による、熱変性相違を使用した技術を用いて、迅速に、そして効率的に、ＳＮＰを遺伝子型決定することが可能である。この試験の１つの態様において、１つのプライマーに２６塩基の５’ＧＣテールを付加することを例外として、アレル特異的プライマーを上述のように作成して、二アレルＳＮＰを検出する（ＧｅｒｍｅｒおよびＨｉｇｕｉｃｈｉ、１９９９）。単一で共通の逆方向プライマーとともにＰＣＲ増幅した後、ｄｓＤＮＡに優先的に結合する蛍光色素（例えばＳＹＢＲグリーン１）を試験管に添加して、そしてその後、ＰＣＲ増幅のｄｓＤＮＡ産物の熱変性プロフィールを決定する。ＧＣテール付きプライマーによって増幅されるＳＮＰに関してヘテロ接合体である試料は、温度スケールの高い側で変性し、一方、ＧＣタグ付きでないプライマーによって増幅されるＳＮに関してホモ接合体である試料は、温度スケールの低い側で変性するであろう。ヘテロ接合体試料は、熱変性プロフィールにおいて、２つのピークを示すであろう。

前述の技術の変形において、熱変性曲線によって、動的アレル特異的ハイブリダイゼーション（ＤＡＳＨ）を検出する（Ｈｏｗｅｌｌら、１９９９）。この試験の１つの態様において、ＰＣＲプライマー対を用いて、ＳＮＰを含有するＤＮＡ試料のゲノム領域を増幅する。これらのプライマーの１つをビオチン化して、続いて、ストレプトアビジンをコーティングしたマイクロタイタープレートにビオチン化された産物の鎖が結合する一方、ビオチン化されていない鎖がアルカリで洗い流されるのを可能にする。１つのアレルに完全にマッチするオリゴヌクレオチドプローブを、低温で、固定ＰＣＲ産物にハイブリダイズさせる。これによって、ｄｓＤＮＡインターカレート色素（ｉｎｔｅｒｃａｌａｔｉｎｇｄｙｅ）（例えばＳＹＢＲグリーン１）と相互作用するｄｓＤＮＡ領域が形成される。その後、熱変性プロフィールによって、融点の相違のため、二アレルＳＮＰ間の単一塩基ミスマッチを区別する試験が可能になる。ＳＮＰの遺伝子型を決定する他の方法、およびＳｅｑ−４０遺伝子中のＳＮＰの検出へのその適用が、当業者に想定されることが可能である。

（実施例２）
統合失調症集団の遺伝子型決定
目的
オーファンＧタンパク質共役型受容体Ｓｅｑ−４０が統合失調症のリスク増加と関連するかどうかを確かめるため、Ｓｅｑ−４０の遺伝子内および該遺伝子周囲のＳＮＰに関して、ＮＩＭＨ統合失調症試料由来のＤＮＡを遺伝子型決定すること。

材料および方法
ＤＮＡ試料
米国精神保健研究所・統合失調症遺伝学イニシアチブからＤＮＡ試料を得た。各ＤＮＡ試料由来の２５ナノグラムを９６ウェルプレートに入れ（Ｓｃｈｚ０１、Ｓｃｈｚ０２、Ｓｃｈｚ０３、Ｓｃｈｚ０４）、乾燥させ、その後、−２０℃で保存した。Ｓｃｈｚ０１、Ｓｃｈｚ０２およびＳｃｈｚ０３と名付けたプレートは、７２試料を含有し、最初の３つのカラムは、対照として用いるため、ブランクのままにした。Ｓｃｈｚ０４と名付けたプレートは、Ａ４〜Ａ１２のウェルに９試料を含有した。

ＴａｑＭａｎ（登録商標）ＭＧＢプローブを用いたアレルの識別
ソフトウェア、プライマー・エクスプレス、バージョン１．５（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）を用いて、各ＳＮＰに対するプライマーおよびＴａｑｍａｎ（登録商標）ＭＧＢプローブ（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）を設計した。表３は、各ＳＮＰに対するすべてのプライマーおよびプローブを列挙する。１００μＭの最終濃度で、プライマーをＨ_２Ｏ中に再懸濁した。５μｌの２ｘＴａｑＭａｎ（登録商標）ユニバーサルＰＣＲマスターミックス、２００ｎＭの各プローブ、９００ｎＭの順方向プライマーおよび逆方向プライマー、並びに１０μｌまでのＨ_２Ｏからなる１０μｌ中で、ＰＣＲ反応を行った。乾燥したＤＮＡ試料に、この１０μｌを添加した。以下の対照実験、８のテンプレート不含対照実験、８のアレル１対照実験、および８のアレル２対照実験を各プレート上で行った。アレル１および２対照は、実施例１に記載するＣｏｎ０１由来のＤＮＡを２５ｎｇ含有した。プレートをＴｉｔｅｒプレート震蘯装置上に置き、そして５分間激しく震蘯し、その後、１０００ｒｐｍで簡単に回転させた。以下の熱周期条件：５０℃２分間→９５℃１０分間→３５周期の９２℃１５秒間、６０℃１分間を用いて、９６００サイクラー（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）中、熱サイクリングを行った。終点プレート読み取りに関して、製造者の指示にしたがって、ＡＢＩＰＲＩＳＭ７７００配列検出装置（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）を用いて蛍光シグナルを検出した。ＳＤＳソフトウェア、バージョン１．７（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）を用いて、データを解析した。

結果
統合失調症試料に対してアレル識別を行うため、我々はＴａｑＭａｎ（登録商標）アッセイ法を用いている。この方法は、２つのプローブ、より一般的なアレル（アレル１）を含有するもの、およびより一般的でないアレル（アレル２）を含有するもう一方のものを設計することを伴う。２つのプローブは、２つのアレルを区別するのに用いる、異なる蛍光レポーター色素（ＦＡＭおよびＶＩＣ）、および非蛍光性消光色素を含有する。７５〜１５０ｂｐの間のＰＣＲ産物を生じるため、プローブに隣接する順方向プライマーおよび逆方向プライマーを設計する。ＰＣＲアッセイ中、２つのプローブおよびプライマーをＤＮＡに添加する。ＤＮＡ試料がアレル１に関してホモ接合体である場合、アレル１のプローブがＰＣＲ産物にハイブリダイズし、レポーター色素がＴａｑＤＮＡポリメラーゼの５’ヌクレアーゼ活性に切断され、そしてそのレポーター色素の蛍光が増加するであろう。ＤＮＡ試料がアレル２に関してホモ接合体である場合、アレル２のプローブに付着したレポーター色素の蛍光が増加するであろう。試料がアレル１およびアレル２に関してヘテロ接合体である場合、どちらのレポーター色素も蛍光が増加するであろう。ＰＣＲ反応後、ＡＢＩＰＲＩＳＭ７７００配列検出装置上で、蛍光を読み取る。アレル識別に用いたプライマーおよびＴａｑＭａｎ（登録商標）ＭＧＢプローブを表３に示す。表は、どのプローブがアレル１のＳＮＰまたはアレル２のＳＮＰを含有するかを示す。ＳＮＰ１、２および７に関しては、センス鎖に対してプローブを設計し、そしてＳＮＰ３および４に関しては、アンチセンス（相補）鎖に対してプローブを設計する。表３において、ＳＮＰヌクレオチドを太字および下線で示した。Ａｌ１（アレル１）は、プローブがより一般的なアレルのＳＮＰを含有することを示し、そしてＡｌ２（アレル２）は、プローブが稀なアレルのＳＮＰを含有することを示す。Ｆは順方向プライマーであり、そしてＲは逆方向プライマーである。

表３．Ｓｅｑ−４０のプライマーおよびＴａｑＭａｎ（登録商標）ＭＧＢプローブ

この実験は、各プレート上に、８のテンプレート不含対照、８の既知のアレル１対照、および８の既知のアレル２対照を有するように設計され、ＳＤＳソフトウェアはこの対照を用いて、未知の試料の結果を自動呼出しした。対照ＤＮＡは、ＳＮＰ６および７を除き、ＳＮＰ発見中に用いた試料（実施例１）から得た。ＳＮＰ６およびＳＮＰ７に関しては、西ミシガン集団（ＣＯＮ０１）には、ホモ接合体状態で、この稀なアレルを所持するゲノムは見られなかった。ＳＮＰを含有するゲノム配列に隣接する順方向プライマーおよび逆方向プライマーのプライミング部位を含有する、Ｔａｑｍａｎ解析の合成標的を構築した。簡潔には、２．０μｌの２５ｍＭｄＮＴＰミックスを含有する最終体積３０μｌの１ｘクレノウ緩衝液（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）中、２．０μｇの各オリゴヌクレオチドを９５℃に１分間加熱して、３時間の期間に渡って室温に冷却した。０．５単位のクレノウ酵素を添加して、そして室温で１５分間、反応を進行させた。２μｌの０．５ＭＥＤＴＡを添加し、反応を７５℃に１０分間加熱した。１０μｌＴａｑｍａｎ反応あたり、０．０４μｌのアニーリングしたプライマーを用いた。

ＳＮＰ６アレル１に関して、生成した合成配列は（アレル１が太字）：

であった。
ＳＮＰ６アレル２に関して、合成配列は（アレル２が太字）：

であった。
オリゴＰＳＫ１０８および１１０からアレル１を構築した：

オリゴＰＳＫ１０９および１１０からアレル２を構築した：

ＳＮＰ７アレル１に関して、合成配列は（アレル１が太字）：

であった。
ＳＮＰ７アレル２に関して、合成配列は（アレル２が太字）：

であった。
オリゴＰＳＫ１１１および１１３からアレル１を構築した：

オリゴＰＳＫ１１２および１１３からアレル２を構築した：

２２５のＮＩＭＨ統合失調症試料由来の、２５マイクログラムのＤＮＡを、９６ウェルマイクロタイタープレートの残りのウェルにアリコットし、その後、乾燥させた。
我々が得たＮＩＭＨ試料中の個体の人口統計データは、よく定義されている。我々は、この研究のために選択した、６２の核となる家族から、２２５の個体由来の遺伝子型データを収集した（しかし、実施例３に詳述する統計解析には、２４８が利用可能であった）。母の民族性が不明である個体が５３人であり、おおよそ６８の個体の母がアフリカン・アメリカンであり、５１が西ヨーロッパ系であり、３９がアングロサクソンであり、１４が地中海人種であり、そして２３が他の民族背景であった（数は完全には加算的でない）。総数１１１の個体が統合失調症と診断され、５０の個体は精神疾患を患ったことがまったくなく、１５の個体は未知の疾患状態を有し、そして７２の個体は、別の種類の精神疾患を有した。

２２５のＮＩＭＨ統合失調症試料に対して、５つのＳＮＰに関するＴａｑＭａｎ（登録商標）アッセイを行った。表４は、ＳＮＰ発見段階で用いた、ＮＩＭＨ試料およびＣＯＮ０１試料両方由来の、稀なアレル頻度の要約を示す。結果の統計的評価および統合失調症表現型との関連は、本出願中、後述する。

表４．遺伝子型決定結果の要約。パーセンテージは、発見段階で決定した、稀なアレルの割合である。

遺伝子診断法における本発明の多型
本発明の多型はまた、統合失調症を発症するリスクが増加しているか、または統合失調症を患っている個体を同定することが可能な診断試験を発展するのにも使用可能である。本発明の診断技術は、多様な方法論を使用して、試験中の被験者が、統合失調症を発症するリスクの増加と関連する多型マーカーパターンを有するかどうか、または個体が、特定の突然変異を所持すると同時に、統合失調症を患っているかどうかを決定することが可能であり、こうした方法論には、家族研究、単一精子ＤＮＡ解析または体細胞ハイブリッドなどの、ハプロタイプ決定のために個々の染色体の解析を可能にする方法が含まれる。

個別ハプロタイプ決定
個体において、同一染色体セグメント上の特定の多型部位を占めるヌクレオチドの同一性（ハプロタイプ）を決定するのが、特に好都合であることが、以下の実施例３から明らかであろう。

本発明はしたがって、患者から配列番号１の１９４、６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の多型部位を含む核酸を含む材料を得て；配列番号１の１９４、６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の多型部位のいずれかに隣接するヌクレオチド配列に相補的なオリゴヌクレオチドプライマー対を用いて、核酸を酵素的に増幅して、該多型部位のいずれかまたは他のＳｅｑ−４０多型部位を含有する増幅産物を生じ、そしてＳｅｑ−４０ハプロタイプを決定することにより、患者におけるＳｅｑ−４０ハプロタイプの存在または非存在を決定することによって、統合失調症を診断する方法、または統合失調症に対する素因を決定する方法をさらに提供する。

ハプロタイプを決定するため、増幅された産物を直接配列決定するか、または配列解析前にベクターにサブクローニングすることが可能であると、当業者は理解する。ＡｍｅｒｓｈａｍＬｉｆｅＳｃｉｅｎｃｅ（イリノイ州アーリントンハイツ）のシークエナーゼＴＭキットを含む商業的に入手可能な配列決定キットを用いて、本発明の方法で増幅した産物を配列決定することが可能である。自動化配列解析もまた有用である可能性があり、そしてＰｒｉｓｍ３７７ＤＮＡ配列決定装置または３７３ＤＮＡ配列決定装置などの自動化配列決定装置が、例えばＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ（カリフォルニア州フォスターシティー；本明細書に援用されるＦｒａｚｉｅｒら，Ｅｌｅｃｔｒｏｐｈｏｒｅｓｉｓ１７：１５５０−１５５２（１９９６）もまた参照されたい）から商業的に入手可能である。二倍体ゲノム中のどちらのコピーも配列決定可能であるため、個別ハプロタイプ組成を、直接配列解析から推測することが可能である。

別の可能性として、例えば非対称ＰＣＲ増幅によって（Ｎｅｗｔｏｎら，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，１７：２５０３−２５１６，１９８９；Ｗｕら，Ｐｒｏｃ．ＮａｔｌＡｃａｄＳｃｉ．ＵＳＡ，８６：２７５７，１９８９を参照されたい）、または限界希釈後、ＰＣＲ増幅することにより、単一の染色体を単離することによって（Ｒｕａｎｏら，Ｐｒｏｃ．ＮａｔｌＡｃａｄ．Ｓｃｉ．ＵＳＡ，８７：６２９６−６３００，１９９０を参照されたい）、単一染色体を独立に研究することが可能である。さらに、特定のアレルを二重にＰＣＲ増幅することによって、十分に近い多型マーカーに関して、試料のハプロタイプを決定することが可能である（Ｓａｒｋａｒ，Ｇ．およびＳｏｍｍｅｒＳ．Ｓ．，Ｂｉｏｔｅｃｈｎｉｑｕｅｓ，１９９１）。

本発明は、個体が本発明の突然変異または多型と持つと同時に、統合失調症を発症するリスクがあるか、または統合失調症を患っているかどうかを決定する診断法を提供する。本発明はまた、個体が統合失調症障害に作用する剤に陽性に反応する可能性があるかどうか、または統合失調症に作用する剤に対する副作用を発症するリスクがあるかどうかを決定する方法も提供する。

これらの方法は、個体から核酸試料を得て、そして該核酸試料が、形質を発症するリスクの指標となるか、または形質を引き起こすアレルを所持する結果、個体が該形質を呈する指標となる、少なくとも１つのアレルまたは少なくとも１つの多型ハプロタイプを含有するかどうかを決定することを伴う。

好ましくは、こうした診断法において、個体から核酸試料を得て、そして上述の方法を用いて、この試料の遺伝子型を決定する。診断法は、単一の多型または多型群に基づくことが可能である。これらの方法の各々において、試験中の被験者から核酸試料を得て、そして表１および２に列挙する多型マーカーの１以上の多型パターンを決定する。

１つの態様において、核酸試料に対してＰＣＲ増幅を行って、検出可能な表現型と関連する多型が同定されている領域を増幅する。増幅産物の配列を決定して、個体が、検出可能な表現型と関連する１以上の多型を所持するかどうかを決定する。増幅産物を生成するのに用いるプライマーは、表３に列挙するプライマーを含むことが可能である。あるいは、核酸試料を上述のように微量配列決定反応に供して、個体が、候補遺伝子中の突然変異または多型から生じる検出可能な表現型と関連する、１以上の多型を所持するかどうかを決定する。微量配列決定反応に用いるプライマーは、表３に列挙するプライマーを含むことが可能である。別の態様において、検出可能な表現型と関連する１以上の候補遺伝子アレルと特異的にハイブリダイズする、１以上のアレル特異的オリゴヌクレオチドプローブと核酸試料を接触させる。ハイブリダイゼーションアッセイに用いるプローブは、表３に列挙するプローブを含むことが可能である。

好ましい態様において、配列番号１の１９４，６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の多型部位からなる群より選択される、少なくとも１つの二アレルマーカーに存在するヌクレオチドの同一性を決定し、そして検出可能な形質は統合失調症である。

これらの診断法は、特定の状況下で、予防的治療を開始するか、または重大なハプロタイプを所持する個体が軽度の症状などの警告の兆候を予見するのを可能にするのに使用可能であるため、非常に価値がある。攻撃が極端に激しく、そして間に合うように治療しなければ、ときに致死性である疾患、例えば喘息の場合、潜在的な素因の知識は、この素因がたとえ絶対的でなくても、非常に有意な方式で、治療効力に寄与する可能性がある。同様に、潜在的な副作用に対する素因があると診断されれば、こうした副作用が臨床試験中に観察されなかった治療に、医師が直ちに変更することが可能になる。

薬剤への反応または薬剤に対する副作用を解析し、そして予測する診断法を用いて、個体を特定の薬剤で治療すべきかどうかを決定することが可能である。例えば、診断によって、個体が特定の薬剤での治療に陽性に反応する可能性が示されたならば、その個体に薬剤を投与することが可能である。逆に、診断によって、個体が特定の薬剤での治療に陰性に反応する可能性が示されたならば、別の治療コースを指示することが可能である。陰性反応は、有効な反応の欠如または毒性の副作用の存在のいずれかとして定義可能である。

臨床薬剤試験は、本発明のマーカーの別の適用に相当する。統合失調症に作用する剤に対する反応または統合失調症に作用する剤に対する副作用の指標となる１以上のマーカーは、上述の方法を用いて同定可能である。その後、こうした剤の臨床試験の潜在的な参加者をスクリーニングして、薬剤に良好に反応する可能性が最も高い個体を同定し、そして副作用を経験する可能性がある個体を排除することが可能である。こうすれば、この研究で陽性に反応する可能性がない個体を含んだ結果、測定値を低下させることなく、そして望ましくない安全性の問題の危険を冒すことなく、薬剤に陽性に反応する個体において、薬剤治療の有効性を測定することが可能である。
本発明のポリヌクレオチドを含む診断キットを、以下にさらに記載する。

診断キット
本発明は、上述のような少なくとも１つのアレル特異的オリゴヌクレオチドを含むキットをさらに提供する。アミノ酸変化を生じるアレルの場合、キットは、相当するエピトープに対する抗体を含有することが可能である。しばしば、キットは、異なる型の多型にハイブリダイズするアレル特異的オリゴヌクレオチドの１以上の対を含有する。いくつかのキットでは、支持体に固定したアレル特異的オリゴヌクレオチドを提供する。例えば、記載する多型の双方を検出するため、同一の支持体が、アレル特異的オリゴヌクレオチドプローブ群を含むことが可能である。キットの任意のさらなる構成要素には、例えば、制限酵素、逆転写酵素またはポリメラーゼ、基質であるヌクレオチド三リン酸、標識するのに用いる手段（例えば標識がビオチンであるならば、アビジン酵素コンジュゲートおよび酵素基質および色原体）、および逆転写反応、ＰＣＲ反応、またはハイブリダイゼーション反応に適した緩衝剤が含まれる。通常、キットはまた、該方法を実施するための説明書も含有する。

本発明を用いて、個体が、統合失調症と関連付けられているＳｅｑ−４０多型を有するかどうかを決定する。こうしたＳｅｑ−４０多型は、一般の集団における前記多型の頻度および統合失調症患者における該多型の頻度を比較する、集団研究において、遺伝子リスク要因であることが示されている。例えば、前記多型が、一般的な集団において、３％の頻度で生じるが、統合失調症患者で３０％の頻度で生じる場合、前記多型に関する試験は、統合失調症を発症するリスクがより高い個体を明らかにするであろう。この情報を予後的に用いて、将来的にいずれ統合失調症を発症するリスクが増加している個体を同定するか、あるいは診断的に用いて、臨床検査で統合失調症を示し、したがって、統合失調症、または他の関連する疾患、例えば双極性統合失調症性障害、抑うつ性統合失調症性障害、統合失調症型人格障害、非感情性精神異常（統合失調症様障害、妄想性障害、精神異常ＮＯＳ）、または気分不調和精神抑うつ障害または妄想性人格障害または統合失調症性人格障害を有する可能性がより高いと診断される可能性がある個体を同定することが可能である。

予後目的または診断目的の前記Ｓｅｑ−４０多型の解析は、限定されるわけではないが、フィルター上のアレル特異的ハイブリダイゼーション、アレル特異的ＰＣＲ、制限酵素消化を加えたＰＣＲ（ＲＦＬＰ−ＰＣＲ）、変性キャピラリー電気泳動、プライマー伸長および飛行時間型質量分析、および５’ヌクレアーゼ（Ｔａｑ−Ｍａｎ）アッセイを含む、ＳＮＰを正確に検出することが可能な技術いずれか１つによって行うことも可能である。

ＳＮＰ遺伝子型決定の好ましい技術は、解析する各ＳＮＰの詳細な最適化を必要としない、大規模自動化解析を可能にすべきである。後者の例は、マイクロタイタープレート（Ｈｙｂａｉｄ）および「単一ストリンジェンシー」ＤＮＡ−チップハイブリダイゼーション（Ａｆｆｙｍｅｔｒｉｘ）に形式をあわせやすいＤＡＳＨ（動的アレル特異的ハイブリダイゼーション）である。

本発明の多型マーカーを用いた遺伝子解析法
多型の同一性が確立されたら、表現型の存在または非存在と、多型の特定の型を関連付けるように試みることが望ましくなる。本発明の特定の多型と統合失調症表現型の関連を確立したが、本発明はまた、他の疾患状態の解析用マーカーとして、統合失調症または他の疾患の薬剤治療に対する感受性のマーカーとして、本発明の多型部位を使用することも意図し、あるいは、本発明の多型は、ヒトゲノムの完全遺伝子マップまたは部分的遺伝子マップいずれに含まれることも可能である。

本発明の多型マーカーは、当該技術分野に知られる、遺伝子型および表現型間に統計的に有意な相関を立証する、いかなる方法にも使用を見出す。複雑な形質の遺伝子解析には、異なる方法が利用可能である（ＬａｎｄｅｒおよびＳｃｈｏｒｋ，Ｓｃｉｅｎｃｅ，２６５，２０３７−２０４８，１９９４を参照されたい）。多型が表現型形質と関連しているかどうかを決定するため、３つの主な方法を用いる：家族研究を用いて、遺伝子座および推定上の形質遺伝子座間の同時分離の証拠を探す、連鎖アプローチ（パラメトリックまたはノンパラメトリック）、並びにアレルおよび形質または形質を引き起こすアレル間の、統計的に有意な関連の証拠を探す、関連アプローチ、並びに連鎖および関連両方に関して検定する、伝達不平衡検定（ＴＤＴ）。

パラメトリックおよびノンパラメトリック連鎖解析法に、多型マーカーを使用することが可能である。好ましくは、本発明の多型マーカーを用い、ケース−コントロール法などの関連研究を用いて、統合失調症または他の障害と関連する遺伝子を同定する。このアプローチは、罹患家族の使用を必要とせず、そして複雑な形質および散発性形質と関連する遺伝子の同定を可能にする。

本発明の多型マーカーを用いた遺伝子解析は、いかなる規模で行うことも可能である。本発明の多型マーカーのすべての組または本発明の多型マーカーのいかなるサブセットを用いることも可能である。さらに、本発明の多型マーカーを含む遺伝子マーカーのいかなる組を用いることも可能である。本発明の多型マーカーと組み合わせた遺伝子マーカーとして使用可能な二アレル多型の組がＷＯ９８／２０１６５に記載されている。上述のように、本発明の多型マーカーは、ヒトゲノムの完全遺伝子マップまたは部分的遺伝子マップいずれに含まれることも可能であることに注目すべきである。
これらの異なる使用が、本発明および請求項に特に意図される。

Ａ．連鎖解析
連鎖解析は、家系内の世代全体の遺伝子マーカーの伝達および特定の形質の伝達の間の相関を確立することに基づく。したがって、連鎖解析の目的は、家系において、目的の形質と同時分離を示すマーカー遺伝子座を検出することである。

パラメトリック法
代々の世代からデータが入手可能である場合、遺伝子座対間の連鎖の度合いを研究する機会がある。組換え比の推定は、遺伝子座を遺伝子マップ上に整理し、そして配置するのを可能にする。遺伝子マーカーである遺伝子座を用いて、遺伝子マップを確立することが可能であり、そしてその後、マーカーおよび形質間の連鎖強度を計算し、そしてマーカー、およびこれらの形質に影響を及ぼす遺伝子の相対的な位置を示すのに用いることが可能である。連鎖解析のための古典的な方法は、対数オッズ比（ｌｏｄ）スコア法である（ＭｏｒｔｏｎＮ．Ｅ．，Ａｍ．ＪＨｕｍ．Ｇｅｎｅｔ．，７：２７７−３１８，１９９５；ＯｔｔＪ．，ＡｎａｌｙｓｉｓｏｆＨｕｍａｎＧｅｎｅｔｉｃＬｉｎｋａｇｅ，ＪｏｈｎＨｏｐｋｉｎｓＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ボルチモア，１９９１を参照されたい）。ｌｏｄスコアの計算は、疾患の遺伝様式の指定を必要とする（パラメトリック法）。一般的に、連鎖解析を用いて同定される候補領域の長さは、２〜２０Ｍｂの間である。候補領域が上述のように同定されたら、さらなるマーカーを用いた組換え個体の解析によって、候補領域をさらに描写することが可能になる。連鎖解析研究は、一般的に、最大５，０００のマイクロサテライトマーカーの使用に頼り、したがって、理論的に得られる連鎖解析最大解像度を、平均約６００ｋｂに制限してきた。

連鎖解析は、明らかなメンデル遺伝パターンを示し、そして高い浸透率（ｐｅｎｅｔｒａｎｃｅ）（すなわちアレルの形質陽性キャリアー数および集団中のキャリアー総数間の比）を有する単純な遺伝形質をマッピングするのに適用され、成功を収めてきた。しかし、パラメトリック連鎖解析には多様な欠点がある。まず、研究する各形質に適した遺伝的モデルの選択に頼ることによって制限される。さらに、すでに言及したように、連鎖解析を用いて達成可能な解像度が制限されており、そして連鎖解析を通じて最初に同定される、典型的な２Ｍｂ〜２０Ｍｂ領域の解析を絞り込むには、補足的な研究が必要である。さらに、パラメトリック連鎖解析アプローチは、複雑な遺伝形質に適用した際は、多数の遺伝子および／または環境的要因が組み合わされた作用などのため、困難であることが判明している。ｌｏｄスコア解析において、これらの要因を適切にモデリングすることは非常に困難である。こうした場合、近年、Ｒｉｓｃｈ，Ｎ．およびＭｅｒｉｋａｎｇａｓ，Ｋ．（Ｓｃｉｅｎｃｅ，２７３：１５１６−１５１７，１９９６）に論じられたように、これらの状況に連鎖解析を適用するのに必要な、適切な数の罹患家族を募るには、非常に大きな努力および高い費用が必要である。

ノンパラメトリック法
連鎖解析のためのいわゆるノンパラメトリック法の利点は、これらが、疾患の遺伝様式の指定を必要とせず、複雑な形質の解析に、より有用である傾向があることである。ノンパラメトリック法では、罹患した親類群が、偶然の場合に期待されるよりも、その領域の同一コピーをより頻繁に受け継ぐことを示すことによって、染色体領域の遺伝パターンが、ランダムなメンデル分離と相関していないことを立証しようと試みる。罹患した親類群は、不完全な浸透率および多遺伝子遺伝の存在下においてさえ、過剰な「アレル共有」を示すはずである。ノンパラメトリック連鎖解析では、２個体におけるマーカー遺伝子座のマッチの度合いは、状態同一（ＩＢＳ）アレルの数、または同祖同一（ＩＢＤ）アレルの数、いずれかによって測定可能である。罹患同胞対解析は、周知の特別なケースであり、そしてこの解析はこれらの方法の最も単純な型である。

本発明の多型マーカーは、パラメトリックおよびノンパラメトリック連鎖解析両方に使用可能である。好ましくは、多型マーカーをノンパラメトリック法において用い、これによって複雑な形質に関与する遺伝子のマッピングが可能になる。本発明の多型マーカーは、ＩＢＤ法およびＩＢＳ法両方で使用して、複雑な形質に影響を及ぼす遺伝子をマッピングすることが可能である。こうした研究では、高密度の多型マーカーをうまく利用して、隣接するいくつかの多型マーカー遺伝子座をプールし、多アレルマーカーによって達成される効率性を達成することが可能である（Ｚｈａｏら，Ａｍ．ＪＨｕｍ．Ｇｅｎｅｔ．，６３：２２５−２４０，１９９８）。

しかし、パラメトリックおよびノンパラメトリック連鎖解析法はどちらも、罹患した親類群を利用する必要があり、薬剤反応の遺伝子解析において、または治療に対する副作用の解析において、限定された価値しか持たない傾向がある。この種の解析は、家族ケースの利用可能性が欠如しているケースでは、実際的でない。実際、家族において１より多い個体が、同時に同じ薬剤に曝露されている可能性は非常に低い。

Ｂ．集団関連研究
本発明は、本発明の多型マーカーを用いて検出可能な形質と関連する、多型マーカーを同定するための方法を含む。１つの態様において、本発明は、多型マーカーアレルまたは多型マーカーハプロタイプおよび形質間の関連を検出する方法を含む。さらに、本発明は、本発明の多型マーカーアレルいずれかと連鎖不平衡にある、形質を引き起こすアレルを同定する方法を含む。

上述のように、一般的な集団内で関連研究を行うことが可能であり、そして関連研究は、罹患家族中の関連個体に対して行う研究に限定されない。関連研究は、散発性形質または多因子形質の解析を可能にするため、非常に価値がある。さらに、関連研究は、細かいスケールのマッピングのための強力な方法を代表し、連鎖研究よりも、形質を引き起こすアレルの、より細かいマッピングを可能にする。家系に基づく研究は、しばしば、形質を引き起こすアレルの位置を狭くするだけである。したがって、本発明の多型マーカーを用いた関連研究を用いて、連鎖解析法によって同定された候補領域において、形質を引き起こすアレルの位置を絞り込むことが可能である。本発明の多型マーカーを用いて、特定の遺伝子が形質と関連していることを立証可能である。こうした使用が、本発明および請求の範囲に特に意図される。

多型マーカーを用いた関連研究を行う一般的な戦略は、両方の群で、本発明の多型マーカーのアレル頻度を測定し、そして統計的に比較するため、２つの群の個体（ケース−コントロール集団）をスキャンすることである。

少なくとも１以上の解析した多型マーカーに関して、形質と、統計的に有意な関連が同定されたら：関連アレルが、形質を引き起こすのに直接関与している（関連アレルが形質を引き起こすアレルである）か、またはよりありうることだが、関連アレルが、形質を引き起こすアレルと連鎖不平衡にあると仮定することが可能である。候補遺伝子機能に関して、関連アレルの特定の性質は、通常、関連アレルおよび形質間の関係（原因となるかまたは連鎖不平衡にある）に、さらなる洞察を与える。証拠によって、候補遺伝子内の関連アレルが、形質を引き起こすアレルでなく、実際に形質を引き起こすアレルと連鎖不平衡にある可能性が最も高いことが示されたならば、形質を引き起こすアレルは、関連するマーカーの近傍を配列決定することによって、見出すことが可能である。

通常、２つの連続する工程で関連研究を行う。第一段階では、形質陽性集団および形質陰性集団において、いくつかの多型マーカー頻度を決定する。解析の第二段階では、相当する領域由来のより高密度のマーカーを用いて、候補遺伝子の同一性および既定の形質に関与する遺伝子座の位置をさらに絞り込む。

ハプロタイプ解析
上述のように、疾患アレルを所持する染色体はまず、突然変異または移住（ｍｉｇｒａｔｉｏｎ）の結果として、集団中に現れ、突然変異アレルは、必然的に、一組の連鎖マーカー：祖先ハプロタイプを有する染色体にある。このハプロタイプを集団全体で追跡することが可能であり、そして既定の形質との統計的な関連を解析することが可能である。ハプロタイプ研究とも呼ばれる多ポイント関連研究で、単一ポイント（アレル）関連研究を補うことによって、関連研究の統計的な能力が増加する。したがって、ハプロタイプ関連研究によって、祖先キャリアーハプロタイプの頻度および種類を定義することが可能になる。ハプロタイプ解析は、これが個体マーカーに関与する解析の統計的な能力を増加させる点で、重要である。

ハプロタイプ頻度解析の第一段階では、本発明で同定された多型マーカーの多様な組み合わせに基づいて、ありうるハプロタイプの頻度を決定する。その後、形質陽性個体および対照個体の別個の集団に関して、ハプロタイプ頻度を比較する。統計的に有意な結果を得るために、この解析に供すべき、形質陽性個体の数は、通常、３０〜３００の間の範囲であり、個体の好ましい数は、５０〜１５０の間の範囲である。この研究に用いる、罹患していない個体（またはランダムコントロール）の数にも同じ考慮があてはまる。この第一の解析の結果によって、ケース−コントロール集団におけるハプロタイプ頻度が提供され、評価したハプロタイプ頻度各々に関して、ｐ値およびオッズ比を計算する。統計的に有意な関連が見られるならば、既定のハプロタイプを所持する個体が、研究中の形質に罹患する相対的なリスクを概算することが可能である。

相互作用解析
本発明の多型マーカーはまた、多遺伝子相互作用から生じる、検出可能な形質と関連する多型マーカーのパターンを同定するのにも使用可能である。非連鎖遺伝子座のアレル間の遺伝的相互作用の解析は、本明細書に記載する技術を用いた、個々の遺伝子型決定を必要とする。適切なレベルの統計的有意性を持つ、選択した組の多型マーカーの間のアレル相互作用解析を、ハプロタイプ解析とみなすことが可能である。相互作用解析は、第一の遺伝子座の既定のハプロタイプに関して、ケース−コントロール集団を階層化して、そして各下位集団で、第二の遺伝子座のハプロタイプ解析を行うことからなる。
関連研究に用いる統計的な方法をさらに以下に記載する。

１．）集団中の多型マーカーアレルまたは多型マーカーハプロタイプ頻度の決定
集団中のアレル頻度の決定
集団中の多型マーカーのアレル頻度は、この意図される目的に適した上述の方法の１つまたは遺伝子型決定法いずれかを用いて、決定可能である。プールした試料または個々の試料の遺伝子型を決定すると、集団中の多型マーカーアレルの頻度を決定することが可能になる。必要な遺伝子型決定数を減少させる１つの方法は、プールした試料を用いることである。プールした試料を用いる際の主な障害は、プールをセットアップする際の、正確なＤＮＡ濃度決定の正確さおよび再現性に関する。個々の試料の遺伝子型を決定すると、感度、再現性および正確さがより高くなり、そして；これが本発明で使用するのに好ましい方法である。好ましくは、各個体の遺伝子型を別個に決定し、そして単純な遺伝子計測を適用して、既定の集団中の多型マーカーのアレルの頻度または遺伝子型の頻度を決定する。

集団中のハプロタイプ頻度の決定
二倍体個体が、１より多い遺伝子座でヘテロ接合体である場合、ハプロタイプの配偶子相（ｇａｍｅｔｉｃｐｈａｓｅ）は未知である。家族における系統情報を用いると、ときに、配偶子相を推察することが可能である（Ｐｅｒｌｉｎら，Ａｍ．ＪＨｕｍ．Ｇｅｎｅｔ．，５５：７７７−７８７，１９９４）。系統情報が入手不能な場合、異なる戦略が使用可能である。１つの可能性は、多部位へテロ接合体二倍体を解析から排除して、ホモ接合体および単一部位ヘテロ接合体の個体のみを残すことであるが、このアプローチは、試料組成に偏向を生じ、そして低頻度ハプロタイプの過小評価を生じる可能性がある。先に記載したように、別の可能性は、例えば非対称ＰＣＲ増幅によって（Ｎｅｗｔｏｎら，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，１７：２５０３−２５１６，１９８９；Ｗｕら，Ｐｒｏｃ．ＮａｔｌＡｃａｄＳｃｉ．ＵＳＡ，８６：２７５７，１９８９を参照されたい）、または限界希釈後、ＰＣＲ増幅することにより、単一の染色体を単離することによって（Ｒｕａｎｏら，Ｐｒｏｃ．ＮａｔｌＡｃａｄ．Ｓｃｉ．ＵＳＡ，８７：６２９６−６３００，１９９０を参照されたい）、単一染色体を独立に研究することである。さらに、特定のアレルを二重にＰＣＲ増幅することによって、十分に近い多型マーカーに関して、試料のハプロタイプを決定することが可能である（Ｓａｒｋａｒ，Ｇ．およびＳｏｍｍｅｒＳ．Ｓ．，Ｂｉｏｔｅｃｈｎｉｑｕｅｓ，１９９１）。これらのアプローチは、これらが技術的に複雑であるか、さらなるコストを伴うか、大規模での生成が不能であるか、または偏向を導入する可能性があるため、完全には満足のいくものでない。これらの困難を克服するため、ＣｌａｒｋＡ．Ｇ．（ＭｏｌＢｉｏｌＥｖｏｌ，７：１１１−１２２，１９９０）に導入された、ＰＣＲ増幅ＤＮＡ遺伝子型の相を推察するアルゴリズムを使用可能である。簡潔には、原理は、あいまいでない（ｕｎａｍｂｉｇｕｏｕｓ）個体、すなわち完全にホモ接合体である個体および単一部位でヘテロ接合体である個体を調べることによって、試料に存在するハプロタイプの予備的リストを埋め始めることである。その後、先に認識されたハプロタイプが存在する可能性に関して、同一試料中の他の個体をスクリーニングする。陽性の同定各々に関して、すべての個体に関する相情報が、解決されるか、または未解決と同定されるまで、認識されるハプロタイプのリストに、補足ハプロタイプを加える。この方法は、多へテロ接合体個体各々に、単一のハプロタイプを割り当てるが、１より多いヘテロ接合部位がある場合、いくつかのハプロタイプも可能である。あるいは、各個体にハプロタイプを割り当てることなく、集団におけるハプロタイプ頻度を推定する方法を使用可能である。好ましくは、ハーディ・ワインバーグ比率（任意交配）の仮定のもとに、ハプロタイプ頻度の最大尤度推定値を生じる、期待値最大化（ＥＭ）アルゴリズム（Ｄｅｍｐｓｔｅｒら，ＪＲ．Ｓｔａｔ．Ｓｏｃ．，３９Ｂ：１−３８，１９７７）に基づく方法を用いる（ＥｘｃｏｆｆｉｅｒＬ．およびＳｌａｔｋｉｎＭ．，ＭｏｌＢｉｏｌＥｖｏｌ，１２（５）：９２１９２７，１９９５を参照されたい）。ＥＭアルゴリズムは、データがあいまいであり、そして／または不完全である際に有用な推定に対する、一般化された反復最大尤度アプローチである。見出し「統計的方法」以下に、ハプロタイプの推定をさらに記載する。集団において、ハプロタイプ頻度を決定するかまたは推定する、当該技術分野に知られる他のいかなる方法もまた、使用可能である。

２．連鎖不平衡解析
連鎖不平衡は、２以上の遺伝子座のアレルのランダムでない関連であり、そして疾患形質に関与する遺伝子をマッピングするための強力なツールを代表する（ＡｊｉｏｋａＲ．Ｓ．ら，Ａｍ．ＪＨｕｍ．Ｇｅｎｅｔ．，６０：１４３９−１４４７，１９９７を参照されたい）。多型マーカーは、ヒトゲノム中に高密度に配置されており、そして他の種類の遺伝子マーカー（例えばＲＦＬＰまたはＶＮＴＲマーカー）よりも、より多くの数で遺伝子型決定することが可能であるため、連鎖不平衡に基づく遺伝子解析には、特に有用である。本発明の多型マーカーを、当該技術分野に知られる、いかなる連鎖不平衡解析法で使用することも可能である。

簡潔には、疾患突然変異が最初に集団に導入された際（新たな突然変異または突然変異キャリアーの移住によって）、該突然変異は必然的に単一染色体上に、そしてしたがって、連鎖マーカーの単一の「バックグラウンド」または「祖先」ハプロタイプ上に存在する。その結果、これらのマーカーおよび疾患突然変異間には、完全な不平衡がある：疾患突然変異は、特定の組のマーカーアレルの存在のみによって見出される。それに続く世代を通じて、疾患突然変異およびこれらのマーカー多型の間に組換えが起こり、そして次第に不平衡が消散する。この消散の速さは、組換え頻度の関数であり、したがって、疾患遺伝子に最も近いマーカーは、遠く離れたものより、高いレベルの不平衡を示すであろう。組換えによって破壊されなければ、「祖先」ハプロタイプ、および異なる遺伝子座のマーカーアレル間の連鎖不平衡は、家系を通じてだけでなく、集団を通じても追跡可能である。連鎖不平衡は、通常、１つの遺伝子座での１つの特定のアレルおよび第二の遺伝子座での別の特定のアレルの間の関連として見られる。

疾患およびマーカー遺伝子座間の不平衡パターンまたは曲線は、疾患遺伝子座で最大値を生じると期待される。その結果、疾患アレルおよび近くで連鎖した遺伝子マーカーの間の連鎖不平衡の量が、疾患遺伝子の位置に関して、価値ある情報をもたらす可能性がある。疾患遺伝子座の細かい規模でのマッピングのため、研究中の領域のマーカー間に存在する連鎖不平衡パターンについて、ある程度の知識を有することが有用である。上述のように、連鎖不平衡の解析を通じて達成されるマッピング解像度は、連鎖研究のものよりはるかに高い。連鎖不平衡と組み合わせた高密度多型マーカー解析は、細かい規模のマッピングの強力なツールを提供する。

目的のゲノム領域中に第一の多型マーカーが同定されたら、当業者は、本発明の教示を用いて、この第一のマーカーと連鎖不平衡にある、さらなる多型マーカーを容易に同定可能である。前述のように、形質と関連する第一のマーカーと連鎖不平衡にあるいかなるマーカーも、該形質と関連付けられるであろう。したがって、既定の多型マーカーおよび形質間に関連が立証されたなら、この特定の領域において、多型マーカーの密度を増加させるため、この形質に関連するさらなる多型マーカーを発見するのが、非常に興味深い。原因となる遺伝子または突然変異は、形質と最大の相関を示すマーカーまたはマーカーの組の近傍に見出されるであろう。

既定のマーカーと連鎖不平衡にあるさらなるマーカーの同定は：（ａ）複数の個体から、第一の多型マーカーを含むゲノム断片を増幅し；（ｂ）前記の第一の多型マーカーを宿するゲノム領域において、第二の多型マーカーを同定し；（ｃ）前記の第一の多型マーカーおよび第二の多型マーカー間の連鎖不平衡解析を行い；そして（ｄ）前記の第一のマーカーと連鎖不平衡にあるものとして、前記の第二の多型マーカーを選択することを伴う。工程（ｂ）および（ｃ）を含むサブコンビネーションもまた意図される。

多型マーカーを同定し、そして連鎖不平衡解析を行う方法が本明細書に記載され、そして過度の実験なしに、当業者によって実行可能である。本発明はひいてはまた、図１に示す特定の多型マーカーと連鎖不平衡にあり、そして既定の形質とそれぞれの関連に関して、類似の特性を示すと期待される多型マーカーにも関する。
見出し「統計的方法」以下に、連鎖不平衡を計算する別の方法を記載する。

３．形質−マーカー関連の、集団に基づくケース−コントロール研究
上述のように、同一染色体上の異なる遺伝子座での特定のアレル対の存在はランダムではなく、そしてランダムからの逸脱を連鎖不平衡と呼ぶ。関連研究は、集団頻度に重点を置き、そして連鎖不平衡現象に頼る。既定の遺伝子中の特定のアレルが、特定の形質を引き起こすのに直接関与している場合、その頻度は、形質陰性集団またはランダムコントロール集団における頻度と比較して、罹患（形質陽性）集団で、統計的に増加するであろう。連鎖不平衡が存在する結果、形質を引き起こすアレルを所持するハプロタイプに存在する他のアレルすべての頻度もまた、形質陰性個体またはランダムコントロールに比較して、形質陽性個体で、増加するであろう。したがって、形質、および形質を引き起こすアレルと連鎖不平衡にあるアレル（特に多型マーカーアレル）いずれかの間の関連は、その特定の領域に形質関連遺伝子が存在することを示唆するのに十分であろう。多型マーカーに関して、ケース−コントロール集団の遺伝子型を決定し、形質を引き起こすアレルを狭い範囲に位置決定する関連を同定することが可能である。形質と関連する１つの既定のマーカーと連鎖不平衡にあるマーカーはいずれも、該形質と関連付けられるであろうためである。形質を引き起こすアレルを発見するため、すべてのありうる機能する多型をスクリーニングする代わりとして、限定された数の遺伝子多型（特に多型マーカー）のケース−コントロール集団における相対頻度を解析することが、連鎖不平衡によって可能になる。関連研究は、関連しないケース−コントロール集団におけるマーカーアレルの頻度を比較し、そして該研究は、複雑な形質の詳細な分析のための強力なツールを代表する。

ケース−コントロール集団（包含基準）
集団に基づく関連研究は、家族性遺伝に関わりなく、ケース−コントロール集団中の特定の遺伝子マーカーまたはマーカーの組の優勢を比較する。これらは、関連しないケース（罹患または形質陽性）個体および関連しないコントロール（非罹患または形質陰性またはランダム）個体の比較に基づく。好ましくは、コントロール群は、非罹患または形質陰性個体で構成される。さらに、コントロール群は、ケース集団に民族的にマッチする。さらに、コントロール群は、好ましくは、研究中の形質に関する、主な既知の混乱要因に関して、ケース集団にマッチする（例えば年齢に依存する形質に関しては年齢マッチ）。理想的には、２つのサンプル中の個体は、その疾患状態のみが異なると期待される方式で対形成される。以下、「形質陽性集団」、「ケース集団」および「罹患集団」は、交換可能に用いられる。

関連研究を用いた複雑な形質の詳細な分析の重要な工程は、ケース−コントロール集団の選択である（ＬａｎｄｅｒおよびＳｃｈｏｒｋ，Ｓｃｉｅｎｃｅ，２６５，２０３７−２０４８，１９９４を参照されたい）。ケース−コントロール集団の選択の主な工程は、既定の形質または表現型の臨床的定義である。形質陽性表現型群および形質陰性表現型群に含もうとする個体を注意深く選択することによって、いかなる遺伝形質も、本明細書に提示する関連法によって解析可能である。４つの規準がしばしば有用である：臨床的表現型、開始時の年齢、家族歴および重症度。連続性の形質または定量的な形質（例えば血圧など）の選択法は、これらの形質陽性集団および形質陰性集団に、重複する表現型を持つ個体を含まないように、研究中の形質の表現型分布の両端の個体を選択することを伴う。好ましくは、ケース−コントロール集団は、表現型が均質の集団からなる。形質陽性集団および形質陰性集団は、各々、研究中の総集団の１〜９８％、好ましくは１〜８０％、より好ましくは１〜５０％、そしてより好ましくは１〜３０％、最も好ましくは１〜２０％に相当し、そして重複する表現型を示さない個体の中で選択される、表現型が均一な個体の集団からなる。２つの形質表現型間の相違が明らかであればあるほど、多型マーカーとの関連を検出する確率が高くなる。劇的に異なるが、相対的に均一である表現型を選択することによって、研究中の集団のサンプルサイズが十分に有意であれば、関連研究における効率的な比較が可能になり、そして遺伝子レベルでの際立った相違の検出が可能になる。

好ましい態様において、５０〜３００の形質陽性個体、好ましくは約１００の個体の第一の群を、その表現型にしたがって採用する。同様の数の形質陰性個体が、こうした研究に含まれる。

本発明において、包含規準の典型的な例には、ＣＮＳ障害またはＣＮＳ障害に作用する薬剤に対する反応の評価、またはＣＮＳ障害に作用する薬剤での治療に対する副作用が含まれる。

本発明の多型マーカーを含む多型マーカーを用いた関連研究の適切な例は、以下の集団を伴う研究である：
１．治療から生じる副作用を患う、統合失調症に作用する剤で治療したケース集団、および副作用を示さない、同一剤で治療したコントロール集団、または
２．有益な反応を示す、統合失調症に作用する剤で治療したケース集団、および有益な反応を示さない、同一剤で治療したコントロール集団。
３．別のＣＮＳ障害を患うケース集団、および健康な罹患していないコントロール集団。

Ｃ．関連の存在下での連鎖に関する検定
本発明の多型マーカーはさらに、ＴＤＴ（伝達／不平衡検定）でも使用可能である。ＴＤＴは、連鎖および関連両方に関してテストし、そして集団階層化によって影響を受けない。ＴＤＴは、罹患個体およびその両親に関するデータ、または両親の代わりに、罹患していない同胞由来のデータを必要とする（Ｓｐｉｅｌｍａｎ．Ｓ．ら，Ａｍ．ＪＨｕｍ．Ｇｅｎｅｔ．，５２：５０６−５１６，１９９３；ＳｃｈａｉｄＤ．Ｊ．ら，Ｇｅｎｅｔ．Ｅｐｉｄｅｍｉｏｌ．，１３：４２３−４５１，１９９６，Ｓｐｉｅｌｍａｎ．Ｓ．およびＥｗｅｎｓＷ．Ｊ．，Ａｍ．ＪＨｕｍ．Ｇｅｎｅｔ．，６２：４５０−４５８，１９９８を参照されたい）。この方法は、家族に基づく実験設計を使用して、ケース群およびコントロール群のミスマッチ、あるいは異なる人種群または民族群からなる亜集団の混合による潜在的な落とし穴を回避する。さらに、理論的な解析によって、このアプローチは、疾患リスクが２倍または４倍に増加するような、比較的小さい影響を持つアレルを検出するため、伝統的な連鎖に基づくアプローチより、はるかにより強力である可能性があることが示される。

一般に、ＴＤＴアプローチは、ハプロタイプいずれかの過剰な伝達／過小な伝達いずれかがあるかどうかを調べるため、親および罹患した子由来の遺伝子型データを必要とする。伝達されるハプロタイプはケースとみなすことが可能であり、そして非伝達ハプロタイプは、コントロールとみなすことが可能である。コンピュータプログラムＴＲＡＮＳＭＩＴ（Ｃｌａｙｔｏｎ、９９）を使用して、解析を行うことも可能である。

（実施例３）
本発明の多型の伝達不平衡解析
我々は、実施例２で生成したＮＩＭＨ統合失調症データに関して、家族に基づく関連研究を行った。

データの説明
我々の研究のため、ＮＩＭＨ統合失調症コレクションから選択したのは、６２の核となる家族由来の、２４８個体（２２５個体の遺伝子型データ）であった。母の民族性が不明である個体が５３人であり、おおよそ６８の個体の母がアフリカン・アメリカンであり、５１が西ヨーロッパ系であり、３９がアングロサクソンであり、１４が地中海人種であり、そして２３が他の民族背景であった（数は完全には加算的でない）。

総数１１１の個体が統合失調症と診断され、５０の個体は精神疾患を患ったことがまったくなく、１５の個体は未知の疾患状態を有し、そして７２の個体は、別の種類の精神疾患を有した。

解析法
コンピュータプログラム「Ｔｒａｎｓｍｉｔ」Ｃｌａｙｔｏｎ，Ｄ．Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ，１９９９．６５（４）：ｐ．１１７０−７を用いて、疾患状態、データ、家系構造および遺伝子型データを解析した。ＴｒａｎｓｍｉｔのＩ型エラーは、集団階層化によって影響を受けないことが示唆されている。ブートストラッピング法から得たｐ値を報告する。一方または両方の親の遺伝子型決定が不能である場合、親の遺伝子型を推測するため、Ｔｒａｎｓｍｉｔは別の子供からの遺伝子型データを利用する。

結果
我々は、予期されるよりも頻繁に、ハプロタイプが罹患子孫に伝達されているかどうか決定する「総合的（ｇｌｏｂａｌ）検定」を行った。個別のハプロタイプに対しても検定を行った。

Ｓ７は、０．０００３５の総合的検定のｐ値を有し、そしてＳ１−Ｓ４の組み合わせは、０．０００３６の総合的検定のｐ値を有する。どちらもボンフェローニの修正を行って、統計的に有意である。Ｓ４−Ｓ７、Ｓ２−Ｓ４、Ｓ１−Ｓ７、Ｓ２−Ｓ４−Ｓ８、Ｓ１−Ｓ２−Ｓ４およびＳ２−Ｓ７はボンフェローニ修正なしに０．００５レベルで有意であり、そしてＳ１−Ｓ２−Ｓ７、Ｓ４−Ｓ７−Ｓ８、Ｓ４、Ｓ２−Ｓ７−Ｓ８、Ｓ１、Ｓ７−Ｓ８、Ｓ２およびＳ１−Ｓ７−Ｓ８は、ボンフェローニ修正なしに０．０５レベルで有意である。選択したＳＮＰに関して、すべての組み合わせを調べた。

検定は、ハプロタイプいずれかが他のハプロタイプよりも罹患子孫により頻繁に伝達されるかどうかを決定した。疾患と有意な関連を示すＳＮＰのハプロタイプがいくつかあった。Ｓ７でのハプロタイプＧが、期待されるよりも、罹患子孫に伝達されることが観察された。上述のように、この観察の有意なレベルは、ブートストラッピング法を用いると０．０００３５である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ１およびＳ４の組み合わせに関して、４つのハプロタイプＧ−Ｃ、Ａ−Ｃ、Ａ−Ｇ、およびＧ−Ｇがある。ハプロタイプＧ−Ｃは、期待されるより多く、有意に罹患子孫に伝達され、そしてＡ−ＧおよびＧ−Ｇは期待されるより伝達されないことが観察された。Ｇ−Ｃハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．００００２３である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ４およびＳ７の組み合わせに関して、４つのハプロタイプＣ−Ｇ、Ｇ−Ｇ、Ｃ−Ａ、およびＧ−Ａがある。ハプロタイプＣ−Ｇは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ｃ−Ｇハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．００００７９である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ２およびＳ４の組み合わせに関して、４つのハプロタイプＡ−Ｃ、Ｇ−Ｃ、Ｇ−Ｇ、およびＡ−Ｇがある。ハプロタイプＡ−Ｃは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ａ−Ｃハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．０００９０６である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ１およびＳ７の組み合わせに関して、４つのハプロタイプＧ−Ｇ、Ａ−Ｇ、Ｇ−Ａ、およびＡ−Ａがある。ハプロタイプＧ−Ｇは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ｇ−Ｇハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．００１６８９である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ２、Ｓ４およびＳ８の組み合わせに関して、７つのハプロタイプＡ−Ｃ−Ｔ、Ａ−Ｃ−Ｇ、Ｇ−Ｃ−Ｔ、Ｇ−Ｃ−Ｇ、Ｇ−Ｇ−Ｔ、Ｇ−Ｇ−ＧおよびＡ−Ｇ−Ｔがある。ハプロタイプＡ−Ｃ−Ｔは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると０．００２５５２である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ１、Ｓ２およびＳ４の組み合わせに関して、５つのハプロタイプＧ−Ａ−Ｃ、Ａ−Ｇ−Ｃ、Ｇ−Ｇ−Ｃ、Ａ−Ｇ−Ｇ、およびＧ−Ａ−Ｇがある。ハプロタイプＧ−Ａ−Ｃは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ｇ−Ａ−Ｃハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．００１８６６である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ２およびＳ７の組み合わせに関して、４つのハプロタイプＡ−Ｇ、Ｇ−Ｇ、Ｇ−Ａ、およびＡ−Ａがある。ハプロタイプＡ−Ｇは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ａ−Ｇハプロタイプハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．００９５２である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ１、Ｓ２およびＳ７の組み合わせに関して、６つのハプロタイプＧ−Ａ−Ｇ、Ａ−Ｇ−Ｇ、Ｇ−Ｇ−Ｇ、Ｇ−Ｇ−Ａ、およびＧ−Ａ−ＡおよびＡ−Ｇ−Ａがある。ハプロタイプＧ−Ａ−Ｇは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ｇ−Ａ−Ｇハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．０１２３５１である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ４、Ｓ７およびＳ８の組み合わせに関して、７つのハプロタイプＣ−Ｇ−Ｔ、Ｃ−Ｇ−Ｇ、Ｇ−Ｇ−Ｔ、Ｃ−Ａ−Ｇ、およびＧ−Ｇ−ＧおよびＧ−Ａ−Ｇ、およびＣ−Ａ−Ｔがある。ハプロタイプＣ−Ｇ−Ｔは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ｃ−Ｇ−Ｔハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．０３２２４６である。

Ｓ４のハプロタイプＣは、期待されるより多く罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると０．０２１６１１である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ２、Ｓ７およびＳ８の組み合わせに関して、７つのハプロタイプＡ−Ｇ−Ｔ、Ｇ−Ｇ−Ｔ、Ｇ−Ｇ−Ｔ、Ａ−Ｇ−Ｇ、およびＧ−Ｇ−ＧおよびＧ−Ａ−Ｇ、Ｇ−Ａ−ＴおよびＡ−Ａ−Ｇがある。ハプロタイプＡ−Ｇ−Ｔは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ａ−Ｇ−Ｔハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．０９４３５７である。

Ｓ１のハプロタイプＧは、期待されるより多く罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると０．０２８３５である。

遺伝子Ｓｅｑ−４０のＳＮＰＳ７およびＳ８の組み合わせに関して、４つのハプロタイプＧ−Ｔ、Ｇ−Ｇ、Ａ−Ｇ、およびＡ−Ｔがある。ハプロタイプＧ−Ｔは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。Ｇ−Ｔハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると０．３９９７５である。

Ｓ２のハプロタイプＡは、期待されるより多く罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると０．０３２９０５である。

表９にデータを示す。
表５

上述のように、Ｔｒａｎｓｍｉｔを用いて総合的検定のｐ値を計算した。個別ハプロタイプのｐ値もまた計算した。さらに、最も有意な遺伝子座（Ｓ１−Ｓ４およびＳ７）の総合的検定のｐ値を代替法によって解析している（上の表の括弧内に開示する結果）。

我々は、ＮＩＭＨ家系に関するＮＩＭＨ表現型データ（疾患状態）に無関係なシミュレーション遺伝子型データを生成し、そしてＴｒａｎｓｍｉｔを用いて該データを解析する（疾患とまったく関係がないＳＮＰ／ＳＮＰ類の遺伝子型データを解析するのと同等）ことによってこれを行い、そしてＴｒａｎｓｍｉｔが、この種のデータからのｐ値を過小評価する傾向がある可能性があることを確定した。この現象は、より大きいｐ値に関するより、非常に小さいｐ値に関して、より明確である。

簡潔には、ハーディ・ワインバーグ平衡およびメンデルの第一の法則（等しい分離）が有効であるという仮定のもとに、ＮＩＭＨデータから推定した集団ハプロタイプ頻度を用いて、１万の家系に関してシミュレーション遺伝子型データを生成した。ＮＩＭＨ由来の表現型データおよび生成した遺伝子型を持つ各家系をＴｒａｎｓｍｉｔによって解析し、そして結果を記録した。この過程は、統合失調症に関連しないゲノムにおいて、１０，０００の遺伝子を調べるのと類似である。Ｓｅｑ−４０のＳ１−Ｓ４のハプロタイプに関して、Ｔｒａｎｍｉｔが報告するｐ値は、０．０００３６７である。しかし、１０，０００の家系のうち１２は、０．０００３６７以下のｐ値を有する。理想的には、総合的検定のｐ値は、実験に基づくｐ値と等しいはずである。

ｐ値の数値の意味は、単に偶然に得るよりも、それと同等か、またはそれより極端な結果を有する確率である。上記の実施例に関しては、０．０００３６７以下のｐ値を有するには、１０，０００の家系から約３が観察される（１０，０００ｘ０．０００３６７＝３．７）はずであるが、１０，０００から１２が観察された。したがって、この代替法では、ｐ値は０．００１２であると報告される。同様に、Ｓ７ハプロタイプに関するｐ値は、同様の解析では、０．００４４と報告される可能性がある。この現象は、より大きいｐ値よりも、非常に小さいｐ値に関して、より明確である。報告されるｐ値が約０．０５である場合、実験に基づくｐ値は、０．０５にかなり近く、したがって、他のハプロタイプに関するｐ値は、この絞込み解析によって、本質的に不変のままである。

Ｄ．統計的方法
一般的に、形質および遺伝子型が、統計的に有意な相関を示すかどうかを検定する、当該技術分野に知られるいかなる方法も、本発明の多型と形質を相関させるのに使用可能である。

１．連鎖解析における方法
連鎖解析に有用な統計的方法およびコンピュータプログラムが当業者に周知である（ＴｅｒｗｉｌｌｉｇｅｒＪ．Ｄ．およびＯｔｔＪ．，ＨａｎｄｂｏｏｋｏｆＨｕｍａｎＧｅｎｅｔｉｃＬｉｎｋａｇｅ，ＪｏｈｎＨｏｐｋｉｎｓＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ロンドン，１９９４；ＯｔｔＪ．，ＡｎａｌｙｓｉｓｏｆＨｕｍａｎＧｅｎｅｔｉｃＬｉｎｋａｇｅ，ＪｏｈｎＨｏｐｋｉｎｓＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ボルチモア，１９９１を参照されたい）。

２．集団におけるハプロタイプ頻度を推定する方法
上述のように、遺伝子型をスコア付けする際、ヘテロ接合体を区別することがしばしば不可能であり、したがって、ハプロタイプ頻度は容易には推測可能でない。配偶子相が未知である場合、ハプロタイプ頻度は、多遺伝子座遺伝子型データから推定可能である。当業者に知られるいかなる方法を用いて、ハプロタイプ頻度を推定することも可能である（ＬａｎｇｅＫ．，ＭａｔｈｅｍａｔｉｃａｌａｎｄＳｔａｔｉｓｔｉｃａｌＭｅｔｈｏｄｓｆｏｒＧｅｎｅｔｉｃＡｎａｌｙｓｉｓ，Ｓｐｒｉｎｇｅｒ，ニューヨーク，１９９７；Ｗｅｉｒ，Ｂ．Ｓ．，ＧｅｎｅｔｉｃｄａｔａＡｎａｌｙｓｉｓＩ：ＭｅｔｈｏｄｓｆｏｒＤｉｓｃｒｅｔｅｐｏｐｕｌａｔｉｏｎｇｅｎｅｔｉｃＤａｔａ，ＳｉｎａｕｅｒＡｓｓｏｃ．，Ｉｎｃ．，米国メリーランド州サンダーランド，１９９６を参照されたい）。好ましくは、期待値最大化（ＥＭ）アルゴリズムを用いて、最大尤度ハプロタイプ頻度を計算する（Ｄｅｍｐｓｔｅｒら，ＪＲ．Ｓｔａｔ．Ｓｏｃ．，３９Ｂ：１−３８，１９９７；ＥｘｃｏｆｆｉｅｒＬ．およびＳｌａｔｋｉｎＭ．，Ｍｏｌ．Ｂｉｏｌ．Ｅｖｏｌ．，１２（５）：９２１−９２７，１９９５を参照されたい）。この方法は、配偶子相が未知である際、多遺伝子座遺伝子型データからハプロタイプ頻度の最大尤度推定値を得ることを目的とした反復法である。ハプロタイプ推定は、通常、例えばＥＭ−ＨＡＰＬＯプログラム（ＨａｗｌｅｙＭ．Ｅ．ら，Ａｍ．ＪＰｈｙｓ．Ａｎｔｈｒｏｐｏｌ．，１８：１０４，１９９４）またはＡｒｌｅｑｕｉｎプログラム（Ｓｃｈｎｅｉｄｅｒら，Ａｒｌｅｑｕｉｎ：ａｓｏｆｔｗａｒｅｆｏｒｐｏｐｕｌａｔｉｏｎｇｅｎｅｔｉｃｓｄａｔａａｎａｌｙｓｉｓ，ＵｎｉｖｅｒｓｉｔｙｏｆＧｅｎｅｖａ，１９９７）を用いて、ＥＭアルゴリズムを適用することによって、行われる。ＥＭアルゴリズムは、推定のための一般化された反復最大尤度アプローチであり、そしてこのアルゴリズムを以下に簡潔に説明する。

本出願の以下の部分において、表現型は、未知の相の多遺伝子座遺伝子型を指すであろう。遺伝子型は、既知の相の多遺伝子座遺伝子型を指すであろう。
Ｋマーカーに関して、Ｎの関連しない個体のサンプルを型決定するとする。観察されるデータは、Ｆの異なる表現型に分類可能な、未知の相のＫ遺伝子座表現型である。根底にありうるＨのハプロタイプがあるとする（Ｋの多型マーカーの場合、Ｈ＝２^Ｋ）。表現型ｊに関して、ｃ_ｊの遺伝子型がありうるとする。したがって、以下の等式を有する：

（式中、Ｐ_ｊは、表現型ｊの確率であり、ｈ_ｋおよびｈ_ｌは遺伝子型ｉの２つのハプロタイプ構成要素である）。ハーディ・ワインバーグ平衡下では、ｐｒ（ｈ_ｋ，ｈ_ｊ）は

となる。
Ｅ−Ｍアルゴリズムの続く工程は、以下のように記載可能である：
ｐ_１ ^（０）、ｐ^（０）、・・・・・・・ｐ_Ｈ ^（０）と記載される、ハプロタイプ頻度の最初の値から出発して、これらの最初の値が、遺伝子型頻度を推定するように働き（期待値工程）、そしてその後、ｐ_１ ^（１）、ｐ^（１）、・・・・・・・ｐ_Ｈ ^（１）と記載される、ハプロタイプ頻度の別の組を推定し（最大化工程）、ハプロタイプ頻度の組の変化が、非常に小さくなるまで、これらの２つの工程を反復する。

停止規準は、２つの反復間のハプロタイプ頻度の最大相違が１０^−７未満であることであってもよい。これらの値は、推定の望ましい正確さに応じて、調整可能である。
詳細には、既定の反復ｓで、期待値工程は、以下の等式：

（式中、遺伝子型Ｉは表現型ｊで生じ、そしてｈ_ｋおよびｈ_ｌは遺伝子型ｉを構成する）によって遺伝子型頻度を計算することからなる。各確率は、上述の等式１および等式２にしたがって得られる。

その後、最大化工程は、単純に、遺伝子型頻度が与えられた際の別の組のハプロタイプ頻度を推定する。このアプローチはまた、遺伝子計数法としても知られる（Ｓｍｉｔｈ，Ａｎｎ．Ｈｕｍ．Ｇｅｎｅｔ．，２１：２５４−２７６，１９５７）。

（式中、∂_ｉｔは、遺伝子型ｉにおけるハプロタイプｔの回数を計数する指標変数であり、０、１または２の値を取る。）
最終的に得た推定値が、最大尤度推定値であることを確かめるために、いくつかの値が離れていること（ｄｅｐａｒｔｕｒｅ）が必要である。得た推定値を比較し、そして差があれば、最高の尤度に向かう推定値を取っておく。

３．マーカー間の連鎖不平衡を計算する方法
いくつかの方法を用いて、いずれか２つの遺伝子位間の連鎖不平衡を計算することが可能であり、実際は、集団から得たハプロタイプデータに対して、統計的関連検定を適用することによって、連鎖不平衡を測定する。ピアッツァの公式：Δ_ａｉａｊ＝√０４−√（０４＋０３）（０４＋０２）：
（式中、０４＝Ｍ_ｉでアレルａ_ｉを持たず、そしてＭ_ｊでアレルａ_ｊを持たない遺伝子型の−−頻度
０３＝Ｍ_ｉでアレルａ_ｉを持たず、そしてＭ_ｊでアレルａ_ｊを持つ遺伝子型の−＋頻度
０２＝Ｍ_ｉでアレルａ_ｉを持ち、そしてＭ_ｊでアレルａ_ｊを持たない遺伝子型の＋−頻度）
にしたがって、すべてのアレルの組み合わせ（ａ_ｉ、ａ_ｊ；ａ_ｉ、ｂ_ｊ；ｂ_ｉ、ａ_ｊおよびｂ_ｉ、ｂ_ｊ）に関して、マーカーＭｉでアレル（ａ_ｉ／ｂ_ｉ）を、そしてマーカーＭｊでアレル（ａ_ｊ／ｂ_ｊ）を有する、本発明の多型マーカー（Ｍ_ｉ、Ｍ_ｊ）の少なくとも１つを含む、多型マーカーのいかなる対の間の連鎖不平衡も計算可能である。Ｗｅｉｒ（ＷｅｉｒＢ．Ｓ．，ＧｅｎｅｔｉｃＤａｔａＡｎａｌｙｓｉｓ，ＳｉｎａｕｅｒＡｓｓ．監修，１９９６）に記載されるように、デルタ（複合遺伝子型不平衡係数）に関する最大尤度推定値（ＭＬＥ）にしたがっても、すべてのアレル組み合わせ（ａ_ｉ、ａ_ｊ；ａ_ｉ、ｂ_ｊ；ｂ_ｉ、ａ_ｊおよびｂ_ｉ、ｂ_ｊ）に関して、多型マーカー（Ｍ_ｉ、Ｍ_ｊ）の対の間の連鎖不平衡（ＬＤ）を計算可能である。複合連鎖不平衡に関するＭＬＥは：
Ｄ_ａｉａｊ＝（２ｎ_１，＋ｎ_２＋ｎ_３＋ｎ_４／２）／Ｎ−２（ｐｒ（ａ_ｊ）・ｐｒ（ａ_ｊ））
（式中、ｎ１＝Σ表現型（ａ_ｉ／ａ_ｉ、ａ_ｊ／ａ_ｊ）であり、ｎ２＝Σ表現型（ａ_ｉ／ａ_ｉ、ａ_ｊ／ｂ_ｊ）であり、ｎ３＝Σ表現型（ａ_ｉ／ｂ_ｉ、ａ_ｊ／ａ_ｊ）であり、ｎ４＝Σ表現型（ａ_ｉ／ｂ_ｉ、ａ_ｊ／ｂ_ｊ）であり、そしてＮはサンプル中の個体数である）である。この公式は、ハプロタイプではなく、遺伝子型データのみが入手可能である際に、アレル間の連鎖不平衡を推定するのを可能にする。

マーカー間の連鎖不平衡を計算する別の手段は、以下のとおりである。ハーディ・ワインバーグ平衡に適合する、１対の多型マーカー、Ｍ_ｉ（ａ_ｉｂ_ｊ）およびＭ_ｊ（ａ_ｉｂ_ｊ）に関して、上述のアプローチにしたがって、既定の集団における４つのありうるハプロタイプ頻度を推定することが可能である。

ａｉおよびａｊ間の配偶子不平衡の推定は、単純に：
Ｄ’_ａｉａｊ＝ｐｒ（ハプロタイプ（ａ_ｉ，ａ_ｊ））−ｐｒ（ａ_ｉ）−ｐｒ（ａ_ｊ）
（式中、ｐｒ（ａ_ｉ）はアレルａ_ｉの確率であり、そしてｐｒ（ａ_ｊ）はアレルａ_ｊの確率であり、そしてｐｒ（ハプロタイプ（ａ_ｉ，ａ_ｊ））は、上述の等式３におけるように推定される）である。１対の多型マーカーに関して、Ｍ_ｉおよびＭ_ｊ間の関連を説明するのに、不平衡の１つの測定値のみが必要である。

その後、上記の値の規準化値を以下のように計算する：
Ｄ’_ａｉａｊ＝Ｄ’_ａｉａｊ／最大値（−ｐｒ（ａ_ｉ）．ｐｒ（ａ_ｊ），−ｐｒ（ｂ_ｉ）．ｐｒ（ｂ_ｊ））、Ｄ_ａｉａｊ＜０の場合
Ｄ’_ａｉａｊ＝Ｄ’_ａｉａｊ／最大値（ｐｒ（ｂ_ｉ）．ｐｒ（ａ_ｊ），ｐｒ（ａ_ｉ）．ｐｒ（ｂ_ｊ））、Ｄ_ａｉａｊ＞０の場合
当業者は、過度な実験を伴わずに、他のＬＤ計算法を使用可能であることを容易に認識するであろう。適切なヘテロ接合性率を有する多型マーカーの組の中で、５０〜１０００の関連しない個体、好ましくは７５〜２００の関連しない個体、より好ましくは１００前後の関連しない個体を遺伝子型決定することによって、連鎖不平衡を決定することが可能である。

４．関連に関する検定
当該技術分野に知られる統計検定いずれかによって、そして必要とされる統計的有意性の認められる閾値いずれかを用いて、表現型および遺伝子型の間の相関の統計的有意性を決定する方法を決定することが可能であり、この場合、遺伝子型は、多型マーカーでのアレルまたはこうしたアレルで構成されるハプロタイプである。特定の方法および有意性の閾値の適用は、一般の当業者の技術の範囲内である。

ケース集団およびコントロール集団において、多型マーカーアレルの頻度を決定し、そして研究中の形質および多型マーカーアレル間の相関を示すであろう、統計的に有意な頻度の相違があるかどうかを決定する、統計検定を用いて、これらの頻度を比較することによって、関連に関する検定を行う。同様に、ケース集団およびコントロール集団において、既定の組の多型マーカーのすべてのありうるハプロタイプ頻度を推定し、そして研究中のハプロタイプおよび表現型（形質）間に統計的に有意な相関があるかどうかを決定する、統計検定を用いて、これらの頻度を比較することによって、ハプロタイプ解析を行う。遺伝子型および表現型間の統計的に有意な関連に関して検定するのに有用ないかなる統計ツールも使用可能である。好ましくは、使用する統計検定は、１度の自由度を持つカイ検定である。Ｐ値を計算する（Ｐ値は、観察されたものと同程度に大きいか、またはそれより大きい統計値が偶然生じるであろう確率である）。

統計的有意性
好ましい態様において、さらなる診断試験のための陽性の基礎として、または初期防御療法のための予備的な出発点としての、診断目的のための有意性である、多型マーカー関連に関連するｐ値は、好ましくは、単一多型マーカー解析に関しては、好ましくは約１ｘ１０^−２以下、より好ましくは約１ｘ１０^−４以下であり、そしていくつかのマーカーを伴うハプロタイプ解析に関しては、約１ｘ１０^−３以下、より好ましくは１ｘ１０^−６以下、そして最も好ましくは、約１ｘ１０^−８以下である。これらの値は、単一マーカーまたは多数のマーカーの組み合わせを伴う関連研究いずれかに適用可能であると考えられる。

当業者は、本発明の多型マーカーを用いた関連研究を行うため、出発点として、上述の範囲の値を用いることが可能である。そうすることで、本発明の多型マーカーおよびＣＮＳ障害の間の有意な関連を明らかにすることが可能であり、そして診断目的および薬剤スクリーニング目的に使用することが可能である。

表現型に基づくパーミュテーション（ｐｈｅｎｏｔｙｐｉｃｐｅｒｍｕｔａｔｉｏｎ）
上述の第一段階のハプロタイプ解析が統計的に有意であることを確認するため、ケース−コントロール個体由来の遺伝子型決定データをプールし、そして形質表現型に関してランダム化する、さらなる解析を行うことが適切である可能性がある。第一段階で得たデータを編集するために用いる、ケース−コントロール集団として、同数の個体を含有する２群に、各個別遺伝子型決定データをランダムに割り当てる。好ましくはこれらの人工的な群に対して、好ましくは最高の相対リスク係数を示す第一段階の解析のハプロタイプに含まれるマーカーに関して、第二段階のハプロタイプ解析を行う。この実験を、好ましくは、少なくとも１００〜１００００回の間で反復する。反復することによって、有意なｐ値レベルを持つ、得られたハプロタイプの割合を決定することが可能になる。

統計的関連の評価
偽陽性の問題に取り組むため、ランダムゲノム領域において、同一のケース−コントロール集団で、同様の解析を行うことが可能である。ランダム領域における結果および候補領域における結果を、ＷＯ００／２８０８０、表題“Ｍｅｔｈｏｄｓ，ｓｏｆｔｗａｒｅａｎｄａｐｐａｒａｔｉｆｏｒｉｄｅｎｔｉｆｙｉｎｇｇｅｎｏｍｉｃｒｅｇｉｏｎｓｈａｒｂｏｒｉｎｇａｇｅｎｅａｓｓｏｃｉａｔｅｄｗｉｔｈａｄｅｔｅｃｔａｂｌｅｔｒａｉｔ”に記載されるように、比較する。

リスク要因の評価
リスク要因（遺伝子疫学では、リスク要因は、マーカー遺伝子座での特定のアレルまたはハプロタイプの存在または非存在である）および疾患の間の関連を、オッズ比（ＯＲ）によって、そして相対リスク（ＲＲ）によって測定する。Ｐ（Ｒ^＋）が、個体がＲで疾患を発症する確率であり、そしてＰ（Ｒ７）が、個体がリスク要因を持たない確率であるならば、相対リスクは、単に、２つの確率の比、すなわち：ＲＲ＝Ｐ（Ｒ^＋）／Ｐ（Ｒ⁻）である。

ケース−コントロール研究では、サンプル抽出設計のため、相対リスクの直接の測定値は得ることが不可能である。しかし、オッズ比によって、低発生率疾患の相対リスクの優れた近似が可能になり、そしてオッズ比は以下のように計算可能である：
ＯＲ＝［Ｆ＋／（１−Ｆ^＋）］／［Ｆ⁻／（１−Ｆ⁻）］
Ｆ＋は、ケースにおいて、リスク要因に曝露される頻度であり、そしてＦ⁻は、コントロールにおいてリスク要因に曝露される頻度である。研究のアレル頻度またはハプロタイプ頻度を用いて、Ｆ＋およびＦ⁻を計算し、そしてＦ＋およびＦ⁻はさらに、根底にある遺伝モデル（優性、劣性、相加的・・・）に応じる。

既定のリスク要因のために形質を示す、集団中の個々の比率を記載する、寄与リスク（ＡＲ）をさらに推定することが可能である。この測定値は、疾患病因における特定の因子の役割を定量化し、そしてリスク要因の公衆衛生への影響に関して定量化する際に重要である。この測定値の公衆衛生との関連は、問題の曝露が存在していなかったならば防御可能であった、集団中の疾患ケースの比率を推定することにある。ＡＲは、以下のように決定される：
ＡＲ＝Ｐ_Ｅ（ＲＲ−Ｉ）／（Ｐ_Ｅ（ＲＲ−Ｉ）＋１）
ＡＲは、多型マーカーアレルまたは多型マーカーハプロタイプに寄与しうるリスクである。ＰＥは、全体的な集団内で、アレルまたはハプロタイプに曝露される頻度であり；そしてＲＲは、研究中の形質が全体的な集団で相対的に低い出現率を有する際、オッズ比を用いて推定される相対リスクである。

機能突然変異の同定
本発明の多型マーカーおよび統合失調症で、陽性の関連が確認されたため、選択した数の形質陽性個体および形質陰性個体の配列を比較することによって、突然変異に関して、Ｓｅｑ−４０遺伝子をスキャンすることが可能である。好ましい態様において、突然変異に関して、候補遺伝子のエクソンおよびスプライシング部位などの機能領域、プロモーターおよび他の制御領域をスキャンする。好ましくは、形質陽性個体は、形質と関連することが示されたハプロタイプまたはアレルを所持し、そして形質陰性個体は、形質と関連するハプロタイプまたはアレルを所持しない。突然変異検出法は、多型部位同定に用いた方法と、本質的に同様である。

こうした突然変異を検出するのに用いる方法は、一般的に、以下の工程を含む：（ａ）形質陽性患者および形質陰性対照のＤＮＡ試料由来の、形質と関連する多型マーカーまたは多型マーカー群を含むＳｅｑ−４０遺伝子領域の増幅；（ｂ）増幅された領域の配列決定；（ｃ）形質陽性患者および形質陰性対照由来のＤＮＡ配列の比較；および（ｄ）形質陽性患者に特異的な突然変異の決定。工程（ｂ）および（ｃ）を含むサブコンビネーションが特に意図される。

その後、本明細書に記載するものなどの遺伝子型決定法いずれかにより、好ましくは、個々の試験形式で、微量配列決定技術を用いて、ケースおよびコントロールのより大きい集団をスクリーニングすることによって、候補多型を確証することが好ましい。期待される関連結果と適合した頻度で、ケースおよびコントロールに多型が存在する場合、多型を候補突然変異とみなす。

本発明の多型マーカーと統合失調症の関連
本発明の背景において、Ｓｅｑ−４０中の本発明の多型マーカーアレルおよび統合失調症の間の関連を立証した。

多くの神経化学的知見が明らかになりつつあり、少なくとも特定のサブタイプに関して、こうした知見が統合失調症の生物学的基礎と関連付けられてきている。しかし、定義される、そして特定の統合失調症の表現型がなく、そして遺伝子解析に適したマーカーがないことが、統合失調症に関連する遺伝子を、信頼性をもって同定するには、大きな障害となっている。その結果、今日、精神科医は、直感および試行錯誤によって、抗統合失調症医薬品を選択しなければならず；この状況は、正しい化合物が選択されるまで、自殺する可能性がある患者を数週間または数ヶ月、危険にさらす可能性がある。明らかに、統合失調症に関与する遺伝子の同定に成功し；したがって研究者が統合失調症の病因を理解し、そして症状よりも原因に取り組むのを可能にする、強い必要性がある。

この情報は非常に価値がある。潜在的な遺伝的素因の知識は、この素因が絶対的でなくても、統合失調症患者の治療効力に、そして診断ツールの開発に、非常に有意な方式で寄与する可能性がある。

本発明が、前述の説明および実施例に詳細に記載されるのとは別の方式で、実施可能であることが明らかであろう。
上記の教示に鑑みて、本発明の多くの修飾および変動が可能であり、そしてしたがって、これらは本発明の範囲内にある。

本明細書に引用されるすべての刊行物の全開示が、本明細書に援用される。

多型の位置を示した、Ｓｅｑ−４０遺伝子の構成。統合失調症とともに有意に伝達される、いくつかのＳｅｑ−４０ハプロタイプ。

【配列表】

Claims

配列番号１の１２〜２００の隣接するヌクレオチドまたはその相補体からなる単離ポリヌクレオチドであって、１９４，６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の多型部位からなる群より選択される、少なくとも１つのＳｅｑ−４０多型部位を含む、前記ポリヌクレオチド。
１９４位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、請求項１の単離ポリヌクレオチド。
請求項２の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
６０１位のヌクレオチドが、ヌクレオチドＡまたはＧの群より選択される、請求項１の単離ポリヌクレオチド。
請求項４の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
１０２９位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、請求項１の単離ポリヌクレオチド。
請求項６の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
１０３８位のヌクレオチドが、ヌクレオチドＣまたはＧの群より選択される、請求項１の単離ポリヌクレオチド。
請求項８の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
１０７４位のヌクレオチドが、ヌクレオチドＡまたはＣの群より選択される、請求項１の単離ポリヌクレオチド。
請求項１０の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２１０６位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、請求項１の単離ポリヌクレオチド。
請求項１２の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２１８５位のヌクレオチドが、ヌクレオチドＧまたはＡの群より選択される、請求項１の単離ポリヌクレオチド。
請求項１４の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２３５９位のヌクレオチドが、ヌクレオチドＴまたはＧの群より選択される、請求項１の単離ポリヌクレオチド。
請求項１６の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２６６３位のヌクレオチドが、ヌクレオチドＣまたはＧの群より選択される、請求項１の単離ポリヌクレオチド。
請求項１８の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２７９６位のヌクレオチドが、ヌクレオチドＡまたはＧの群より選択される、請求項１の単離ポリヌクレオチド。
請求項２０の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
１００ヌクレオチド未満である、請求項１の単離ポリヌクレオチド。
５０ヌクレオチド未満である、請求項１の単離ポリヌクレオチド。
２０ヌクレオチド未満である、請求項１の単離ポリヌクレオチド。
多型が、前記ポリヌクレオチド中央から４ヌクレオチド以内にある、請求項１の単離ポリヌクレオチド。
多型が、前記ポリヌクレオチド中央にある、請求項１の単離ポリヌクレオチド。
多型が、前記ポリヌクレオチドの末端にある、請求項１の単離ポリヌクレオチド。
プローブである、請求項１の単離ポリヌクレオチド。
プライマーである、請求項１の単離ポリヌクレオチド。
配列番号１の少なくとも１２の隣接するヌクレオチドまたはその相補体を含む単離ポリヌクレオチドであって、１９４，６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位のＳｅｑ−４０多型部位からなる群より選択される、少なくとも１つのＳｅｑ−４０多型部位を含み、単数または複数の前記Ｓｅｑ−４０多型部位が、１９４位のＡ、６０１位のＧ、１０２９位のＡ、１０３８位のＧ、１０７４位のＣ、２１０６位のＡ、２１８５位のＡ、２３５９位のＴ、２６６３位のＧ、および２７９６位のＡからなる群より選択される、少なくとも１つのアレルに占められている、前記ポリヌクレオチド。
１９４位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、１９４位がＡによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項３１の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
６０１位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、６０１位がＧによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項３３の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
１０２９位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、１０２９位がＡによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項３５の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
１０３８位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、１０３８位がＧによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項３７の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
１０７４位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、１０７４位がＣによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項３９の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２１０６位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、２１０６位がＡによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項４１の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２１８５位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、２１８５位がＡによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項４３の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２３５９位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、２３５９位がＴによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項４３の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
２３５９位のヌクレオチドを含む、配列番号１の少なくとも１２の隣接するヌクレオチドを含み、２３５９位がＴによって占められている、請求項３０記載の単離ポリヌクレオチド。
請求項４７の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
診断目的または予後目的のため、個体由来の、Ｓｅｑ−４０をコードする核酸分子またはその断片を分類する方法であって、
配列番号１の１９４，６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の多型部位からなる群より選択される、少なくとも１つのＳｅｑ−４０多型部位を占めるヌクレオチドに対応する、前記核酸由来のヌクレオチドの同一性を決定する
ことを含む、前記方法。
決定する工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の１０２９位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の１０３８位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の１０７４位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の２１０６位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の２３５９位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の２６６３位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、配列番号１またはその断片の２７９６位のヌクレオチドの同一性を決定することを含む、請求項４９の方法。
決定する工程が、ＤＮＡの増幅を含む、請求項２１の方法。
診断目的または予後目的で、個体におけるハプロタイプを決定する方法であって、
単一染色体上の配列番号１の：
（ａ）１９４および１０３８位
（ｂ）１０３８および２１８５位
（ｃ）６０１および１０３８位
（ｄ）１９４および２１８５位
（ｅ）６０１および１０３８および２３５９位
（ｆ）１９４および６０１および１０３８位
（ｇ）６０１および２１８５位
（ｈ）１９４および６０１および２１８５位
（ｉ）１０３８および２１８５および２３５９位
（ｊ）６０１および２１８５および２３５９位
（ｋ）２１８５および２３５９位
（ｌ）１９４および２１８５および２３５９位
（ｍ）２１０６および２１８５位
の多型部位からなる群より選択される、１より多いＳｅｑ−４０多型部位を占めるヌクレオチドに対応する、前記核酸由来のヌクレオチドを決定する
ことを含む、前記方法。
決定する工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の１０３８位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の１０３８位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の１０３８位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性を決定し、配列番号１またはその断片の１０３８位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性を決定し、配列番号１またはその断片の６０１位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の１０３８位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性を決定し、配列番号１またはその断片の６０１位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の１０３８位のヌクレオチドの同一性を決定し、配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性を決定し、配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性を決定し、配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、配列番号１またはその断片の２１０６位のヌクレオチドの同一性を決定し、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性を決定することを含む、請求項６１の方法。
決定する工程が、ＤＮＡの増幅を含む、請求項６１の方法。
決定する工程が、特定のアレルの多重ＰＣＲ増幅を含む、請求項６１の方法。
患者が統合失調症を発症する（ｄｅｖｅｌｏｐ）性向を評価する方法であって、
単一染色体上の配列番号１の：
（ａ）１９４および１０３８位
（ｂ）１０３８および２１８５位
（ｃ）６０１および１０３８位
（ｄ）１９４および２１８５位
（ｅ）６０１および１０３８および２３５９位
（ｆ）１９４および６０１および１０３８位
（ｇ）６０１および２１８５位
（ｈ）１９４および６０１および２１８５位
（ｉ）１０３８および２１８５および２３５９位
（ｊ）６０１および２１８５および２３５９位
（ｋ）２１８５および２３５９位
（ｌ）１９４および２１８５および２３５９位
（ｍ）２１０６および２１８５位
の、１以上のＳｅｑ−４０多型部位を占めるヌクレオチドに対応する、前記患者から得た核酸由来のヌクレオチドを決定し、そして
患者が統合失調症を発症する性向を有するかどうかを評価する
ことを含む、前記方法。
評価工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性がＧであり、そして配列番号１またはその断片の１０３８位のヌクレオチドの同一性がＣであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の１０３８位のヌクレオチドの同一性がＣであり、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性がＡであり、そして配列番号１またはその断片の１０３８位のヌクレオチドの同一性がＣであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性がＧであり、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性がＡであり、配列番号１またはその断片の１０３８位のヌクレオチドの同一性がＣであり、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性がＴであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性がＧであり、配列番号１またはその断片の６０１位のヌクレオチドの同一性がＡであり、そして配列番号１またはその断片の１０３８位のヌクレオチドの同一性がＣであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性がＡであり、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性がＧであり、配列番号１またはその断片の６０１位のヌクレオチドの同一性がＡであり、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の１０３８位のヌクレオチドの同一性がＣであり、配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであり、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性がＴであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の６０１位のヌクレオチドの同一性がＡであり、配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであり、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性がＴであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性がＧであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであり、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性がＴであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の１９４位のヌクレオチドの同一性がＧであり、配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであり、そして配列番号１またはその断片の２３５９位のヌクレオチドの同一性がＴであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
評価工程が、配列番号１またはその断片の２１０６位のヌクレオチドの同一性がＧであり、そして配列番号１またはその断片の２１８５位のヌクレオチドの同一性がＧであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項８１の方法。
Ｓｅｑ−４０多型集団における頻度を決定する方法であって：
ａ）請求項４９の方法にしたがって、前記多型に関して、前記集団由来の個体の遺伝子型を決定し；そして
ｂ）前記集団における前記多型の比率提示を決定する
ことを含む、前記方法。
集団において、多型マーカーの組に関して、ハプロタイプの頻度を推定する方法であって：
ａ）１９４、６０１、１０２９、１０３８、１０７４、２１０６、２１８５、２３５９、２６６３および２７９６位の多型部位からなる群より選択される、少なくとも１つのＳｅｑ−４０多型に関して、前記集団中の各個体の遺伝子型を決定し；
ｂ）ゲノムに存在する第二の多型マーカーの両コピーに関して、前記の第二の多型マーカーのヌクレオチドの同一性を決定することによって、前記の第二の多型マーカーに関して、前記集団中の各個体の遺伝子型を決定し；そして
ｃ）工程ａ）およびｂ）で決定したヌクレオチドの同一性に、ハプロタイプ決定法を適用して、前記頻度の推定値を得る
ことを含む、前記方法。
前記ハプロタイプ決定法が、非対称ＰＣＲ増幅、特定のアレルの多重ＰＣＲ増幅、クラーク法、クレイトン法、または期待値最大化アルゴリズムからなる群より選択される、請求項９８記載の方法。
アレルおよび表現型間の関連を検出する方法であって：
ａ）請求項９６の方法にしたがって、形質陽性集団における、少なくとも１つのＳｅｑ−４０多型の頻度を決定し；
ｂ）請求項９６の方法にしたがって、対照集団における、前記Ｓｅｑ−４０多型の頻度を決定し；そして
ｃ）前記アレルおよび前記表現型間に統計的に有意な関連が存在するかどうかを決定する
工程を含む、前記方法。
前記表現型が統合失調症に作用する剤に対する反応である、請求項１００記載の方法。
前記表現型が統合失調症に作用する剤に対する副作用である、請求項１００記載の方法。
内蔵キットにおいて、小体積中に、Ｓｅｑ−４０多型部位を占める単数または複数のヌクレオチドの同一性を決定するために必要な構成要素を含む、診断キット。
少なくとも１つの多型部位を含む、配列番号１またはその相補体の６〜８００の隣接するヌクレオチドを含む、単離ポリヌクレオチドを含む、請求項１０３の診断キット。
多型部位を含む配列番号１のセグメントを増幅するのに使用するための単離ポリヌクレオチドを含む、請求項１０３の診断キット。
（ａ）配列番号２のアミノ酸２６５位のバリンからイソロイシンを区別することが可能な、配列番号２のアミノ酸２６５位を含むエピトープに対する抗体；または
（ｂ）配列番号２のアミノ酸２９１位のシステインからチロシンを区別することが可能な、配列番号２のアミノ酸２９１位を含むエピトープに対する抗体
からなる抗体群より選択される、抗体。
内蔵キットにおいて、小体積中に、請求項１０６の抗体を含む、診断キット。