JP2005524383A - 統合失調症の診断に用いる一塩基多型 - Google Patents

統合失調症の診断に用いる一塩基多型 Download PDF

Info

Publication number
JP2005524383A
JP2005524383A JP2003525680A JP2003525680A JP2005524383A JP 2005524383 A JP2005524383 A JP 2005524383A JP 2003525680 A JP2003525680 A JP 2003525680A JP 2003525680 A JP2003525680 A JP 2003525680A JP 2005524383 A JP2005524383 A JP 2005524383A
Authority
JP
Japan
Prior art keywords
seq
nucleotide
fragment
identity
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003525680A
Other languages
English (en)
Inventor
ケイテス,ポール・エス
テング,チ−フセ
Original Assignee
ファルマシア・アンド・アップジョン・カンパニー・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファルマシア・アンド・アップジョン・カンパニー・エルエルシー filed Critical ファルマシア・アンド・アップジョン・カンパニー・エルエルシー
Priority claimed from PCT/US2002/025950 external-priority patent/WO2003020980A2/en
Publication of JP2005524383A publication Critical patent/JP2005524383A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、多型部位を含む、ヒトGタンパク質共役型受容体Seq−40遺伝子の核酸セグメントを提供する。これらの部位に隣接する領域にハイブリダイズする、アレル特異的プライマーおよびプローブもまた提供する。本発明はまた、統合失調症を発症する遺伝的リスクを決定する方法または統合失調症を診断する方法も提供する。

Description

関連出願へのクロスリファレンス
本出願は、本明細書に援用される、出願第60/315501号、2001年8月28日出願の優先権を主張する。
発明の分野
本発明は、多型部位を含む、ヒトGタンパク質共役型受容体Seq−40の核酸セグメントを提供する。本発明はまた、統合失調症を発症する(develop)遺伝的リスクを決定する方法、または統合失調症を診断する方法も提供する。
背景
一塩基多型
すべての生物は、進化の過程で、定期的に突然変異を経験し、そしてしたがって、祖先配列の変異型を生成する(Gusella, Ann. Rev. Biochem. 55, 831−854(1986))。変異型は、祖先型に比較して、進化上の利点を与える可能性もあるし、また与えない可能性もある。変異型は、中立である可能性もある。ある場合は、変異型は致死であり、そして該生物のさらなる世代に伝達されない。他の場合は、変異型は、種に進化上の利点を与え、そして最終的にその種の多くのメンバーまたは大部分のメンバーのDNAに取り込まれ、そして事実上、祖先型になる。多くの場合、単数または複数の祖先型および変異型両方が生き延び、そして種の集団に共存する。配列の多数の型のこの共存が多型を生じる。
いくつかの異なる種類の多型が報告されてきている。制限断片長多型(RFLP)は、Botsteinら, Am. J. Hum. Genet. 32, 314−331(1980)に記載されるように、制限断片の長さを改変するDNA配列中の変異を意味する。制限断片長多型は、制限部位を生成するかまたは欠失させ、こうして制限断片の長さを変化させることが可能である。RFLPは、ヒトおよび動物の遺伝子解析で、広く用いられてきている(米国特許第5,856,104号、1999年1月5日、Cheeら、WO 90/13668;WO 90/11369;Donis−Keller, Cell 51, 319−337(1987);Landerら, Genetics 121, 85−99(1989)を参照されたい)。遺伝性形質を特定のRFLPに結びつけることが可能である場合、個体におけるRFLPの存在を用いて、動物がやはりその形質を示すであろう尤度を予測することが可能である。
他の多型は、タンデムの二、三、および四ヌクレオチド反復モチーフを含む、短タンデム反復(STR)の形を取る。これらのタンデム反復はまた、可変数タンデム反復(VNTR)多型とも称される。VNTRは、身元解析および父子解析(米国特許第5,075,217号;Armourら, FEBS Lett. 307, 113−115(1992);Hornら、WO 91/14003;Jeffreys、EP 370,719)、並びに多数の遺伝子マッピング研究に用いられてきている。
いくつかの他の多型は、同一種の個体間の単一ヌクレオチド変異の形を取る。こうした多型は、RFLP、STRおよびVNTRよりはるかに頻繁である。しかし、単一ヌクレオチド変化はまた、制限酵素部位の生成または破壊も生じうるため、一塩基多型はまた、RFLPも生じる可能性があることを認識すべきである。いくつかの一塩基多型は、タンパク質コード配列で生じ、この場合、多型の1つは、不全タンパク質または他の変異タンパク質の発現を生じ、そして潜在的に遺伝疾患を生じる可能性がある。コード配列内の多型が遺伝疾患を生じる遺伝子の例には、ベータ−グロビン(鎌形赤血球貧血)およびCFTR(嚢胞性線維症)が含まれる。他の一塩基多型は、非コード領域で生じる。これらの多型のいくつかはまた、(例えば不全スプライシングの結果として)不全タンパク質発現を生じる可能性がある。他の一塩基多型は、表現型上の影響を持たないが、なお、表現型への影響に遺伝的に関連する可能性がある。
一塩基多型の頻度および均一性がより高いため、他の多型の場合よりも、こうした多型が目的の遺伝子座により近接して見出される確率は、より高い。また、異なる型の性質決定された一塩基多型は、しばしば、他の種類の多型よりも区別が容易である(例えばアレル特異的ハイブリダイゼーションプローブまたはプライマーを使用するアッセイの使用による)。多数の遺伝子産物が疾患の解析に役割を果たす、統合失調症のような疾患では、SNPは、研究ツールとして際立った見込みを示し、そしてSNPはまた、価値ある診断ツールである可能性もある。
統合失調症(schizophrenia)
統合失調症は、人口のおよそ1%が罹患する、壊滅的な神経精神障害であり、そして罹患個体およびその家族の人生に深刻な破壊を生じる。一般的な症状には、妄想、思考の分裂、および幻視または幻聴とともに、感情的振る舞いの変化が含まれる。症状に評点を付けるいくつかのスケール、および診断を確かめる方法が開発されてきており、これには、臨床的診断の正確さを改良することを試みた、米国精神医学会によるDMS分類(Diagnostic and Statistical Manual of Mental Disorders、第3版および第4版)が含まれる。しかし、いくつかの根底にある異常から、類似の症状が生じる可能性があり、そして臨床的症状にのみ頼る診断は困難で、そして賛否両論であるとともに、主観的で時間がかかり、そして費用がかかる。したがって、統合失調症を診断する新規方法、または統合失調症を発症する素因を予測する新規方法に対する、切迫した必要性がある。
引用文献
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383
発明の概要
本発明は、統合失調症に関連する一組の多型マーカーの発見に基づく。これらのマーカーは、我々がSeq−40と命名した、Gタンパク質共役型受容体(GPCR)遺伝子のコード領域とともに非コード領域中に位置する。Seq−40のコード領域および該当する非コード領域を以下に示す。多型を太字で示す。
Figure 2005524383
Figure 2005524383
上記配列は、2000年11月16日に出願され、そしてWO 0136473として公開された米国特許出願第09/714449号に報告されるようなORF予測を含有する。選択的スプライシング変異体が存在する可能性があることが認識されるであろう。この配列は、さらなる隣接配列を含有する。
本発明は、統合失調症の診断に適しているか、または統合失調症を発症する尤度を予測するのに適している、ヒトGタンパク質共役型受容体Seq−40遺伝子の配列由来のポリヌクレオチド断片の最初の記述を含む。本発明はさらに、診断法および予測法を含む。
本発明の1つの態様は、配列番号1の12〜200の隣接するヌクレオチドまたはその相補体を含むか、該ヌクレオチドまたはその相補体からなるか、あるいは該ヌクレオチドまたはその相補体から本質的になる単離ポリヌクレオチドであって、194,601、1029、1038、1074、2106、2185、2359、2663および2796位の多型部位からなる群より選択される、少なくとも1つのSeq−40多型部位を含む、前記ポリヌクレオチドを含む。この定義、および用語「12〜200の隣接するヌクレオチド」を使用する以下の他の定義はすべて、長さ12〜200ヌクレオチドのありとあらゆる整数のポリヌクレオチドを含むことを意味する。
本発明は、194位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、601位のヌクレオチドが、ヌクレオチドAまたはGの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、1029位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、1038位のヌクレオチドが、ヌクレオチドCまたはGの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、1074位のヌクレオチドが、ヌクレオチドAまたはCの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、2106位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、2185位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、2359位のヌクレオチドが、ヌクレオチドTまたはGの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、2663位のヌクレオチドが、ヌクレオチドCまたはGの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
本発明は、2769位のヌクレオチドが、ヌクレオチドAまたはGの群より選択される、配列番号1の12〜200の隣接するヌクレオチドからなる単離ポリヌクレオチドを提供する。
これらのセグメントの相補体もまた含まれる。セグメントは、DNAまたはRNAであることが可能であるし、そして二本鎖または一本鎖であることが可能である。いくつかのセグメントは、長さ10〜20塩基または10〜50塩基である。好ましいセグメントは、長さ10〜400塩基である。
本発明はさらに、配列番号1に示す配列にハイブリダイズする、アレル特異的オリゴヌクレオチドまたはその相補体を提供する。これらのオリゴヌクレオチドは、プローブまたはプライマーであることが可能である。
本発明はさらに、個体由来の核酸を解析する方法を提供する。該方法は、どのヌクレオチド(単数または複数)が、Seq−40内に含有される多型部位、すなわち「Seq−40多型」または「Seq−40多型部位」に存在するかを決定する。場合によって、配列番号1内の各多型部位の塩基を、1つの反応で同時に決定する。この種の解析は、疾患表現型の存在に関して試験する複数の個体に対して、行うことが可能である。次いで、疾患表現型または疾患状態を発症する性向の存在または非存在を、試験した個体の多型部位に存在する塩基または塩基の組と相関させることが可能である。あるいは、この決定工程は、単一染色体上のSeq−40多型部位の同一性を決定するような方式で行う。
本発明はしたがって、194、601、1029、1038、1074、2106、2185、2359、2663および2796位の1以上のヌクレオチドを含む核酸を含む、患者由来の材料を得て、そしてSeq−40ハプロタイプを決定することにより、患者におけるSeq−40ハプロタイプの存在または非存在を決定することによって、統合失調症を診断する方法、または統合失調症に対する素因を決定する方法を提供する。
配列表の簡単な説明
配列番号1 194、601、1029、1038、1074、2106、2185、2359、2663および2796位で見られる変異を含む、Seq−40のDNA配列
配列番号2 265および291位で見られる変異を含む、SEQ−40のアミノ酸配列。
配列番号3 PCRプライマー−実施例1
配列番号4 PCRプライマー−実施例1
配列番号5 配列決定プライマー−実施例1
配列番号6 配列決定プライマー−実施例1
配列番号7 配列決定プライマー−実施例1
配列番号8 配列決定プライマー−実施例1
配列番号9 TaqManプローブ−表3
配列番号10 TaqManプローブ−表3
配列番号11 TaqManプローブ−表3
配列番号12 TaqManプローブ−表3
配列番号13 TaqManプローブ−表3
配列番号14 TaqManプローブ−表3
配列番号15 TaqManプローブ−表3
配列番号16 TaqManプローブ−表3
配列番号17 TaqManプローブ−表3
配列番号18 TaqManプローブ−表3
配列番号19 TaqManプローブ−表3
配列番号20 TaqManプローブ−表3
配列番号21 PCRプライマー−表3
配列番号22 PCRプライマー−表3
配列番号23 PCRプライマー−表3
配列番号24 PCRプライマー−表3
配列番号25 PCRプライマー−表3
配列番号26 PCRプライマー−表3
配列番号27 PCRプライマー−表3
配列番号28 PCRプライマー−表3
配列番号29 PCRプライマー−表3
配列番号30 PCRプライマー−表3
配列番号31 PCRプライマー−表3
配列番号32 PCRプライマー−表3
配列番号33 SNP6合成アレル
配列番号34 SNP6合成アレル
配列番号35 SNP6合成アレルオリゴマー
配列番号36 SNP6合成アレルオリゴマー
配列番号37 SNP6合成アレルオリゴマー
配列番号38 SNP7合成アレル
配列番号39 SNP7合成アレル
配列番号40 SNP7合成アレルオリゴマー
配列番号41 SNP7合成アレルオリゴマー
配列番号42 SNP7合成アレルオリゴマー
発明の詳細な説明
定義
定義
用語「アレル」は、本明細書において、ヌクレオチド配列の変異体を指す。
「統合失調症に作用する剤」には、当該技術分野において、統合失調症の1以上の症状に対処するか、該症状を減少させるか、または該症状を軽減することが知られる、いかなる薬剤または化合物も含む。「統合失調症に作用する剤」には、当該技術分野に知られる統合失調症に関与する酵素または制御分子の活性または濃度を変調する、いかなる薬剤または化合物も含まれる。統合失調症に作用する剤には、限定されるわけではないが、トラジン、メレリル、モデケート、プロリキシン、ナベーン、ステラジンおよびハルドール、リスペリドン(リスパダール)、クロザピン(クロザリル)、オランザピン(ジプレキサ)およびクエチアピン(セロクエル)が含まれる。
用語「統合失調症に作用する剤に対する反応」は、限定されるわけではないが、化合物を代謝する能力、プロドラッグを活性薬剤に変換する能力、並びに個体における薬剤の薬物動態学(吸収、分布、排出)および薬力学(受容体関連)を含む薬剤能力を指す。用語「統合失調症に作用する剤に対する副作用」は、薬剤の主な薬理学的作用の延長から生じる療法の副作用、または特有の宿主因子と薬剤の相互作用から生じる、固有の副作用を指す。「統合失調症に作用する剤に対する副作用」には、限定されるわけではないが、起立性低血圧症、視覚のぼけ、口内乾燥、鼻詰まり、および便秘などの自律神経性副作用が含まれる。「統合失調症に作用する剤に対する副作用」にはまた、不安、睡眠障害、性的機能障害、胃腸障害、吐き気、下痢、起立性低血圧(orthostasis)、めまい、鎮静、高血圧、ショック、無動症(動きの緩慢化)、静座不能症(四肢の静止不能)、および遅発性ジスキネジー(動きの永続的、非可逆的な障害)も含まれる。
用語「相補性」または「その相補体」は、本明細書において、相補性領域全体に渡って、別の明記するポリヌクレオチドと、ワトソン・クリック塩基対形成することが可能なポリヌクレオチドの配列を指す。この用語は、配列のみに基づいて、ポリヌクレオチド対に適用され、そして2つのポリヌクレオチドが実際に結合する、いかなる特定の組の条件にも基づかない。
用語「遺伝子型」は、本明細書において、個体またはサンプルに存在するアレルの同一性を指す。本発明の背景において、遺伝子型は、好ましくは、個体またはサンプルに存在する多型アレルの説明を指す。用語、多型マーカーに関するサンプルまたは個体の「遺伝子型決定(genotyping)」は、個体が多型マーカー部位で所持する特定のアレルまたは特定のヌクレオチドを決定することからなる。
用語「ヘテロ接合性率」は、本明細書において、集団中、特定のアレルがヘテロ接合体である個体の出現率を指す。多型系において、ヘテロ接合性率は、平均して、2Pa(1−Pa)に等しく、式中、Paは最も一般的でないアレルの頻度である。遺伝研究において有用であるために、遺伝子マーカーは、無作為に選択された個人がヘテロ接合体である確率が妥当であるのを可能にするのに適したレベルを有するべきである。
用語「突然変異」は、本明細書において、1%未満の頻度を有する、異なるゲノムまたは個体間のDNA配列の相違を指す。
用語「ハプロタイプ」は、1つの染色体上のアレルの現実に存在する組み合わせを指す。本発明の関連において、ハプロタイプは、好ましくは、既定の個体に見られ、そして表現型と関連する可能性がある多型の組み合わせを指す。
用語「多型」は、本明細書において、異なるゲノムまたは個体間の2以上の代替ゲノム配列またはアレルの存在を指す。「多型の」は、集団中に、特定のゲノム配列の2以上の変異体を見出すことが可能な状態を指す。「多型部位」は、変異が起こる遺伝子座である。多型は、集団中の、2以上の遺伝的に決定される代替配列またはアレルの存在を指す。好ましい多型は、各々、選択した集団の1%より高い頻度で存在し、そしてより好ましくは、10%または20%より高い頻度で存在する、少なくとも2つのアレルを有する。多型遺伝子座は、1塩基対まで小さいことも可能である。多型マーカーには、制限断片長多型、可変数タンデム反復(VNTR)、超可変領域、ミニサテライト、二ヌクレオチド反復、三ヌクレオチド反復、四ヌクレオチド反復、単純配列反復、およびAluなどの挿入要素が含まれる。最初に同定されたアレル型が、恣意的に、参照型と称され、そして他のアレル型が、代替アレルまたは変異アレルと称される。選択した集団に最も頻繁に存在するアレル型は、ときに、野生型と称される。二倍体生物は、アレル型に関して、ホモ接合体またはヘテロ接合体であることが可能である。二アレル多型は、2つの型を有する。三アレル多型は、3つの型を有する。
「一塩基多型」(SNP)は、単一塩基対の変化である。一塩基多型は、アレル配列間の変異部位である、単一ヌクレオチドが占める多型部位で生じる。通常、該部位の前および後には、アレルの非常に保存された配列(例えば集団の1/100または1/1000未満のメンバーで異なる配列)が存在する。
一塩基多型は、通常、多型部位で1つのヌクレオチドが別のヌクレオチドに置換されたために生じる。トランジションは、1つのプリンの別のプリンによる置換、または1つのピリミジンの別のピリミジンによる置換である。トランスバージョンは、プリンのピリミジンによる置換、またはその逆の置換である。一塩基多型はまた、参照アレルに比較した、ヌクレオチドの欠失から生じるか、またはヌクレオチドの挿入から生じることも可能である。単一のヌクレオチドが変化した結果、制限部位が破壊されるか、制限部位が生成されることが可能であることに注目すべきである。したがって、一塩基多型がまた、制限断片長多型として現れる可能性もある。
一塩基多型(SNP)は、RFLP、およびVNTRと同じ方式で使用可能であるが、いくつかの利点を提供する。一塩基多型は、より高い頻度で存在し、そして他の型の多型よりも、ゲノム全体に、より均一に間隔を空けて配置されている。SNPは、大まかに、1/1000塩基対の頻度で生じ、そして最も豊富でないアレルが1%以上の頻度を有するという必要条件によって、稀な変異または突然変異から区別される(Brookes、1999)。SNPの例には:
1.遺伝子にコードされるタンパク質産物において、1つのアミノ酸を別のものに置換する、非同義コード領域変化、
2.遺伝暗号の縮重のため、アミノ酸コード配列を改変しない、同義変化、
3.遺伝子の転写を改変する可能性も、またしない可能性もある、プロモーター、エンハンサーまたは他の遺伝子調節要素配列の変化、
4.mRNAの非翻訳領域、特に、リボソーム結合、翻訳開始の効率を改変する可能性がある5’端、あるいはmRNA安定性を改変する可能性がある3’端での変化、および
5.転写物のスプライシングまたは他の遺伝子制御要素の機能を改変する可能性がある、イントロン領域内の変化
が含まれる。
用語「二アレル多型」および「二アレルマーカー」は、本明細書において交換可能に用いられ、集団中にかなり高い頻度で2つのアレルを有する多型、好ましくは一塩基多型を指す。「二アレルマーカーアレル」は、二アレルマーカー部位に存在するヌクレオチド変異体を指す。典型的には、本発明の二アレルマーカーのより一般的でないアレルの頻度は、1%より高いと認定されてきており、好ましくは、頻度は10%より高く、より好ましくは、頻度は少なくとも20%(すなわち少なくとも0.32のヘテロ接合性率)であり、さらにより好ましくは、頻度は少なくとも30%(すなわち少なくとも0.42のヘテロ接合性率)である。より一般的でないアレルの頻度が30%以上である二アレルマーカーを、「高品質二アレルマーカー」と称する。
用語「Seq−40多型」または「Seq−40多型部位」は、本明細書において、本明細書に開示するSeq−40遺伝子内の多型または多型部位を意味する。この用語は、Seq−40コード配列、イントロン領域および隣接領域内の多型部位での多型を含むであろう。「Seq−40多型」は、有用性を有するために、Seq−40タンパク質産物中のアミノ酸を変化させる必要はない。用語、Seq−40多型は、一塩基多型、二アレル多型および他のものを含み、そして本開示の表1に記載する多型である。Seq−40一塩基多型は、単一ヌクレオチドの変異を反映する多型である。用語「少なくとも1つのSeq−40多型部位」は、本開示の表1に詳細に示すものから選択される、Seq−40遺伝子内の、少なくとも1つの多型部位を意味する。
本明細書に交換可能に用いられるように、用語「オリゴヌクレオチド」および「ポリヌクレオチド」には、一本鎖または二重鎖型いずれかの、1ヌクレオチドより多い、RNA、DNA、またはRNA/DNAハイブリッド配列が含まれる。用語「ヌクレオチド」は、本明細書において、一本鎖または二重鎖型いずれかの、いかなる長さでもよいRNA、DNA、またはRNA/DNAハイブリッド配列を含む分子を説明する形容詞である。用語「ヌクレオチド」はまた、本明細書において、個々のヌクレオチドまたは多様なヌクレオチド、すなわち、プリンまたはピリミジン、リボースまたはデオキシリボース糖部分、およびリン酸基、あるいはオリゴヌクレオチドまたはポリヌクレオチド内のヌクレオチドの場合、ホスホジエステル連結を含む、分子、またはより大きい核酸分子中の個々の単位を指す名詞である。しかし、用語「ヌクレオチド」はまた、本明細書において、少なくとも1つの修飾、(a)代替連結基、(b)プリンの類似型、(c)ピリミジンの類似型、または(d)糖の類似型を含む、「修飾ヌクレオチド」を含む。類似の連結基、プリン、ピリミジン、および糖の例に関しては、例えばPCT公報第WO 95/04064号を参照されたい。しかし、本発明のポリヌクレオチドは、好ましくは、50%を越えて、慣用的なデオキシリボースヌクレオチドで、そして最も好ましくは、90%を越えて、慣用的なデオキシリボースヌクレオチドで構成される。本発明のポリヌクレオチド配列は、合成、組換え、ex vivo生成、またはこれらの組み合わせを含む、既知の方法いずれかとともに、当該技術分野で知られる精製法いずれかを利用することによって、調製可能である。
ポリヌクレオチドの中央に対する、ポリヌクレオチド中のヌクレオチドの位置を、以下の方式で本明細書に記載する。ポリヌクレオチドが、奇数のヌクレオチドを有する場合、ポリヌクレオチドの3’端および5’端からの距離が等しいヌクレオチドを、該ポリヌクレオチドの「中央」にあるとみなし、そして中央のヌクレオチドにすぐ隣接するヌクレオチドいずれか、または中央にあるヌクレオチド自体を「中央から1ヌクレオチド以内」にあるとみなす。ポリヌクレオチド中のヌクレオチドが奇数であれば、ポリヌクレオチドの中央の5ヌクレオチド位はいずれも、中央の2ヌクレオチド以内にあるとみなされるであろうし、以下同様である。ポリヌクレオチドが偶数のヌクレオチドを有する場合、ポリヌクレオチドの中央には結合があり、そしてヌクレオチドはないであろう。したがって、中央の2ヌクレオチドを「中央から1ヌクレオチド以内」にあるとみなし、そしてポリヌクレオチド中央の4ヌクレオチドをいずれも、「中央から2ヌクレオチド以内」にあるとみなし、以下同様である。1以上のヌクレオチドの置換、挿入または欠失を伴う多型では、多型の置換、挿入、または欠失ポリヌクレオチドの3’から、ポリヌクレオチドの3’端までの距離、および多型の置換、挿入、または欠失ポリヌクレオチドから、ポリヌクレオチドの5’端までの距離の相違が、0または1ヌクレオチドである場合、多型、アレルまたは二アレルマーカーは、ポリヌクレオチドの「中央」にある。この相違が0〜3である場合、多型は、「中央から1ヌクレオチド以内」にあるとみなされる。相違が0〜5である場合、多型は、「中央から2ヌクレオチド以内」にあるとみなされる。相違が0〜7である場合、多型は、「中央から3ヌクレオチド以内」にあるとみなされ、以下同様である。1以上のヌクレオチドの置換、挿入または欠失を伴う多型では、多型の置換、挿入、または欠失ポリヌクレオチドから、ポリヌクレオチドの3’端までの距離、および多型の置換、挿入、または欠失ポリヌクレオチドから、ポリヌクレオチドの5’端までの距離の相違が、0または1ヌクレオチドである場合、多型、アレルまたは二アレルマーカーは、ポリヌクレオチドの「中央」にある。この相違が0〜3である場合、多型は、「中央から1ヌクレオチド以内」にあるとみなされる。相違が0〜5である場合、多型は、「中央から2ヌクレオチド以内」にあるとみなされる。相違が0〜7である場合、多型は、「中央から3ヌクレオチド以内」にあるとみなされ、以下同様である。
ポリヌクレオチドの端に対する、ポリヌクレオチド中のヌクレオチドの位置を、以下の方式で本明細書に記載する。ヌクレオチドは、ポリヌクレオチドの5’端または3’端いずれかにあるならば、ポリヌクレオチドの「端」にある。
用語「上流」は、本明細書において、特定の参照ポイントからポリヌクレオチドの5’端に向かう位置を指す。用語「塩基対形成された」および「ワトソン・クリック塩基対形成された」は、本明細書において交換可能に用いられ、2つの水素結合によってアデニン残基に連結されているチミンまたはウラシル残基、並びに3つの水素結合によって連結されているシトシンおよびグアニン残基を含む、二重らせんDNAに見られるような方式で配列同一性によって、互いに水素結合することが可能なヌクレオチドを指す(Stryer, L., Biochemistry, 第4版, 1995を参照されたい)。
用語「単離された」は、本明細書において、限定されるわけではないが、他の核酸、炭水化物、脂質およびタンパク質(ポリヌクレオチドの合成に用いられる酵素など)を含む他の化合物から、ある程度分離されている、本発明のポリヌクレオチドまたはポリヌクレオチドベクター、あるいは直鎖ポリヌクレオチドからの、共有結合で閉環されたポリヌクレオチドの分離を記載する。ポリヌクレオチドは、試料の少なくとも約50%、好ましくは60〜75%が、単一ポリヌクレオチド配列およびコンホメーション(直鎖対共有結合閉環)を示す場合、実質的に単離されている。実質的に単離されたポリヌクレオチドは、典型的には、核酸試料の約50%、好ましくは60〜90重量/重量%、より一般的には約95%を含み、そして好ましくは、約99%以上、純粋である。ポリヌクレオチド単離または均質性の度合いは、試料のアガロースまたはポリアクリルアミドゲル電気泳動に続いて、染色ゲル上で、単一ポリヌクレオチドバンドを視覚化するなど、当該技術分野に周知の、いくつかの手段によって示すことが可能である。特定の目的のため、HPLCまたは当該技術分野に周知の他の手段を用いることによって、より高い分解能が提供可能である。
用語、プライマーは、適切な条件下(すなわち4つの異なるヌクレオシド三リン酸、およびDNAまたはRNAポリメラーゼまたは逆転写酵素などの重合のための剤)、適切な緩衝液中、そして適切な温度で、テンプレートが指示するDNA合成の開始点として作用することが可能な一本鎖オリゴヌクレオチドを指す。プライマーの適切な長さは、プライマーの意図される使用に応じるが、典型的には、15〜30ヌクレオチドの範囲である。短いプライマー分子は、一般的に、テンプレートと十分に安定なハイブリッド複合体を形成するのに、より低い温度を必要とする。プライマーは、テンプレートの配列を正確に反映する必要はないが、テンプレートとハイブリダイズするために十分に相補的でなければならない。用語、プライマー部位は、プライマーがハイブリダイズする標的DNAの領域を指す。用語、プライマー対は、増幅しようとするDNA配列の5’端とハイブリダイズする5’上流プライマー、および増幅しようとするDNA配列の3’端の相補体とハイブリダイズする3’下流プライマーを含むプライマーの組を意味する。
用語「プローブ」または「ハイブリダイゼーションプローブ」は、試料に存在する特定のポリヌクレオチド配列を同定するのに使用可能な、定義された核酸セグメント(またはヌクレオチド類似体セグメント、例えば本明細書に定義するようなポリヌクレオチド)を示し、前記核酸セグメントは、ハイブリダイゼーションによって同定しようとする、特定のポリヌクレオチド配列に相補的なヌクレオチド配列を含む。「プローブ」または「ハイブリダイゼーションプローブ」は、核酸の相補鎖に塩基特異的な方式で結合することが可能な核酸である。こうしたプローブには、Nielsenら, Science 254, 1497−1500(1991)に記載されるような、ペプチド核酸も含まれる。ハイブリダイゼーションは、通常、「ストリンジェントな条件」下、例えば、1M以下の塩濃度および少なくとも25℃の温度で行われる。例えば、5xSSPE(750mM NaCl、50mMリン酸ナトリウム、5mM EDTA、pH7.4)および25〜30℃の温度の条件は、アレル特異的プローブハイブリダイゼーションに適している。この特定の緩衝液組成は、例として提供されるが、当業者は、同等に適切な他の組成を容易に代用することが可能である。
用語「配列決定」は、本明細書において、核酸中のヌクレオチドの順序を決定する過程を意味する。核酸を配列決定する多様な方法が当該技術分野に周知である。こうした配列決定法には、例えば、本明細書に援用される、Sangerら, Proc. Natl. Acad. Sci. 74:5463(1997)に記載されるように、ジデオキシ仲介鎖終結のサンガー法が含まれる(本明細書に援用される、“DNA Sequencing”, Sambrookら(監修), Molecular Cloning:A Laboratory Manual(第2版)中, ニューヨーク州プレーンビュー;Cold Spring Harbor Laboratory Press(1989)もまた参照されたい)。大腸菌(E. coli)DNAポリメラーゼIのクレノウ断片;シークエナーゼTM(T7 DNAポリメラーゼ);Taq DNAポリメラーゼおよびAmpliTaqを含む多様なポリメラーゼを、酵素的配列決定法で使用可能である。周知の配列決定法にはまた、DNAのマクサム・ギルバート化学分解も含まれる(本明細書に援用される、MaxamおよびGilbert, Methods Enzymol. 65:499(1980)、および“DNA Sequencing”、Sambrookら、上記、1989を参照されたい)。当業者は、配列決定が現在、しばしば、自動化法の補助で行われていることを認識する。
用語「統合失調症(schizophrenia)」は、慣用的な意味を有し、例えばDSM−III−Rに記載される一群の症状によって特徴付けられる精神障害を指す。
用語「形質(trait)」および「表現型」は、本明細書において交換可能に用いられ、そして例えば疾患の症状、または疾患に対する感受性などの、目に見えるか、検出可能か、または別の方式で測定可能な生物の特性いずれかを指す。典型的には、用語「形質」または「表現型」は、本明細書において、統合失調症の症状、または統合失調症に対する感受性を指すか;あるいは統合失調症に作用する剤に対する個体の反応を指すか;あるいは統合失調症に作用する剤に対する副作用の症状、または該副作用に対する感受性を指す。
本発明の多型
Seq−40 cDNAのヌクレオチドおよびアミノ酸配列は、どちらも本明細書に援用される、米国特許出願第09/714449号およびWO 01/36473号に先に開示されている。
Seq−40は、GPCRスーパーファミリーのアミン作用性/コリン作用性ブランチと最も近い配列相同性を持つ、新規GPCRであるが、生体アミン受容体の特徴を持たない。脳切片におけるmRNAのin situハイブリダイゼーションによって、Seq−40 RNAが、脳の辺縁系領域、より具体的には、皮質、梨状皮質、海馬、視床下部、黒質緻密部、側方隔壁(lateral septum)、分界条床核(bed nucleus of stria terminalis)、視床、腹側被蓋(ventral tegmental)、脚間核、背面縫線(dorsal raphe)、内側膝状体(medial geniculate)、カエハ島、脈絡叢、および視床腹部で発現されることが示される。
Seq−40をコードする遺伝子の染色体位置を、スタンフォードG3放射ハイブリッドパネル(Reseach Genetics, Inc.、アラバマ州ハンツビル)を用いて決定した。このパネルは、スタンフォード・ヒトゲノムセンターが生成した全ヒトゲノムの83の放射ハイブリッドクローンを含有する。どのレーンがPCR産物を生じるかを決定するため、配列番号1の配列から、PCRプライマーを設計した。期待されるPCR産物の存在または非存在に関して、レーンをスコア付けし、そして解析のため、e−メールを介して、結果をスタンフォード・ヒトゲノムセンターに提出した。この解析によって、Seq−40は染色体6上に配置されており、スタンフォードマーカーSHGC−1836(平均断片サイズは4.0Mb)に最も近くに連鎖し、LODスコアは11.84である(3.0より高いスコアはいずれも、非常に有意であるとみなされる)ことがわかる。このマーカーは、6q21位に位置する。Caoら(1997)は、2つの独立のデータセットの連鎖解析を用いて、領域6q13−6q26が、統合失調症感受性遺伝子座を含有することが非常に示唆されると示していた。
表1
Figure 2005524383
上述のように、配列番号1の194位のSeq−40一塩基多型をS1と称し、配列番号1の601位のSeq−40一塩基多型をS2と称し、配列番号1の1029位のSeq−40一塩基多型をS3と称し、配列番号1の1038位のSeq−40一塩基多型をS4と称し、配列番号1の1074位のSeq−40一塩基多型をS5と称し、配列番号1の2106位のSeq−40一塩基多型をS6と称し、配列番号1の2185位のSeq−40一塩基多型をS7と称し、配列番号1の2359位のSeq−40一塩基多型をS8と称し、配列番号1の2663位のSeq−40一塩基多型をS9と称し、そして配列番号1の2796位のSeq−40一塩基多型をS10と称する。
問題の多型が既に性質決定されているかどうかに応じて、2つの別個の種類の解析がある。第一の種類の解析は、ときに、デノボ(de novo)同定と呼ばれる。第二の種類の解析は、同定された多型のどの型(単数または複数)が、試験中の個体に存在するかを決定する解析である。第一の種類の解析は、異なる個体中の標的配列を比較して、変異ポイント、すなわち多型部位を同定する。ヒトで、最大の民族特有の多様性を示す個体群、並びに植物および動物で、最大の品種および種多様性を示す個体群を解析することによって、遺伝子座の最も一般的なアレル/ハプロタイプに特徴的なパターンを同定し、そして集団におけるこうした集団の頻度を決定することが可能である。地理、人種、または性別などの規準によって特徴付けられる下位集団に関して、さらにアレル頻度を決定することも可能である。本発明の多型のデノボ同定を説明する例を以下に記載する。
(実施例1)
本発明の多型のデノボ同定
材料および方法
DNA試料
DNA試料を、匿名の血液試料から得た。QiaAmp DNA血液ミニキット(Qiagen)を用いてDNAを調製した。試料を集団管理西ミシガン(Population Control Western Michigan)試料と称し、そしてCON01と名付けた。
Seq−40のPCR増幅
先に開示されたSeq40配列を用いて、CeleraヒトゲノムデータベースをBLAST解析することによって、Seq40ゲノム配列を同定した。検索によって、1つのエントリー、GA_46747285が、Seq−40のコード情報を含むヒトゲノム配列およそ9.8kbを含有すると同定された。Seq40コード領域を含むおよそ3kbのゲノム配列とともに、およそ1kb上流および0.5kb下流を含み、GA_46747285のヌクレオチド2946〜6024に対応する配列を増幅するため、プライマーを設計した。プライマーPSK100およびPSK105(それぞれ配列番号3および4)を用いて、ヒトゲノムDNAから、Seq40SNP.seqと称するこの配列を増幅した。
Figure 2005524383
Stratagene Robocyclerを用いて、製造者の指示にしたがって、50μl反応中、AmpliTaq Gold(Perkin Elmer)を用いてPCRを行った。周期プログラムは以下のとおりであった:94℃10分間を1周期、その後、95℃30秒間、55℃1分間および68℃5分間を50周期、その後、68℃10分間を1周期。
MultiScreen−PCRフィルタープレート(Millipore)を用いて、PCR産物を精製した。PCR反応物をプレート上に装填し、そしてプレートをMultiScreenマニフォールド(Millipore)上に置き、そして24インチHgの真空を5〜10分間適用した。マニフォールドからプレートを取り除き、そして50μlのHOを各ウェルに添加した。プレートをプレート混合装置上に置き、そして5分間激しく震蘯した。各ウェルから精製PCR産物を回収し、そして新たな96ウェル反応プレートに入れた。
DNA配列決定
蛍光に基づくABI377配列決定装置(Perkin Elmer/Applied Biosystems Division、PE/ABD、カリフォルニア州フォスターシティー)およびTaq FSTMポリメラーゼを含むABI BigDyeTMターミネーター周期配列決定即時反応キットを用いて、PCR断片を直接配列決定した。各周期配列決定反応は、9.6μlのHO、8.4μlのBigDyeターミネーター混合物(8μlのBig Dyeターミネーターおよび0.4μlのDMSO)、1μl DNA(〜0.5μg)、および1μlプライマー(25ng/μl)を含有し、そしてPerkin−Elmer 9600中でこの反応を行った。98℃1分間の初期変性、その後:96℃30秒間、50℃30秒間のアニーリング、および60℃4分間の伸長の50周期で、周期配列決定を行った。AGTC(登録商標)ゲルろ過ブロック(Edge BiosSystems、メリーランド州ゲイザースバーグ)を用いて伸長産物を精製した。カラム上にピペットで各反応産物を装填し、これをその後、スウィングバケット遠心分離装置(SorvallモデルRT6000Bテーブルトップ遠心分離装置)中、750xgで2分間、室温で遠心分離した。カラム精製試料を、約60分間真空で乾燥させ、そしてその後、2μlのDNA装填溶液(83%脱イオンホルムアミド、8.3mM EDTA、および1.6mg/mlブルーデキストラン)に溶解した。その後、試料を90℃に2、3分間加熱し、そしてABI377配列決定装置による配列解析のため、各試料0.75μlをゲル試料ウェルに装填した。コンピュータプログラムPOLYPHREDを用いて、配列クロマトグラムを解析した。Nickerson, D.A.(1997)Nucleic Acid Research, 25(14), pp.2745−2751。
結果
集団管理西ミシガン試料(CON01と命名)と称する、72個体由来のDNAを含有するプレートを、上述のプライマーを用いて増幅した。PCR産物を精製し、そして以下のプライマー(配列番号3〜8)を用いて配列決定した。
Figure 2005524383
72個体の配列を比較して、そして配列中の相違を示す、コンピュータプログラムPOLYPHREDを用いて、クロマトグラムを解析した。総数10のSNPを同定した。結果の要約を以下の表2に示す。
表2
Figure 2005524383
5つのSNPは、5’隣接領域にあり、2つはコード領域にあり、そして3つは3’隣接領域にある。SNPの位置は、配列番号1の配列に比較して、ヌクレオチド194、601、1029、1038、1074、2106、および2185、2359、2663および2796にある。各SNPに関する稀なアレルの頻度は、それぞれ、38、43、7.5、20、8.9、5.6、4.9、19、18、39パーセントである。これらの頻度は、異なる集団またはより大きい集団を用いた場合には、変化する可能性もあることに注意すべきである。
また、コード領域中のどちらのSNPもアミノ酸を変化させ、そして抗体に基づく診断に受け入れられるであろうことが注目される。
変異遺伝子産物に特異的に結合するが、対応するプロトタイプ遺伝子産物には結合しない、ポリクローナルおよび/またはモノクローナル抗体が意図される。抗体は、マウスまたは他の動物に、変異遺伝子産物またはその合成ペプチド断片を注射することによって作成可能である。例えばHarlowおよびLane, Antibodies, A Laboratory Manual, Cold Spring Harbor Press, ニューヨーク(1988);Goding, Monoclonal antibodies, Principles and Practice(第2版)Academic Press, ニューヨーク(1986)に記載されるように、モノクローナル抗体をスクリーニングする。変異体遺伝子産物との特異的免疫反応性、および対応するプロトタイプ遺伝子産物に対する免疫反応性の欠如に関して、モノクローナル抗体を試験する。これらの抗体は、変異体型を検出する診断アッセイにおいて、または薬剤組成物中の活性成分として、有用である。こうした抗体を用いた診断は、当該技術分野に周知であり、そして限定されるわけではないが、ウェスタンブロット解析、ELISA解析およびラジオイムノアッセイを含むことが可能である。
関連性研究
上述のように、多型が同定されたら、試験中の個体には、同定された多型のどの型(単数または複数)が存在しているかを決定することが望ましくなる。これは、疾患状態とのありうる関連性に関して、多型をさらに性質決定する際に重要となる。こうした関連性を決定したら、同じ方法をもちろん、診断目的および予後目的に使用することが可能である。特定のヌクレオチド位の同一性を決定する際、多様な適切な方法があり、これを順番に論じる。
A.試料の調製
解析中の個体由来の標的核酸において、多型を検出する。ゲノムDNAのアッセイには、実質的にいかなる生物学的試料も適切である(純粋な赤血球細胞を除く)。例えば、好適な組織試料には、全血、精液、唾液、涙、尿、糞便物質、汗、頬側試料(buccal)、皮膚および毛髪が含まれる。cDNAまたはmRNAのアッセイに関しては、標的核酸が発現されている臓器から、組織試料を得なくてはならない。
以下に記載する多くの方法は、標的試料からのDNAの増幅を必要とする。これは、PCRによって達成可能である。一般的には、PCR Technology:Principles and Applications for DNA Amplification(H.A. Erlich監修, Freeman Press, ニューヨーク州ニューヨーク, 1992);PCR Protocols:A Guide to Medhods and Applications(Innisら監修, Academic Press, カリフォルニア州サンディエゴ, 1990);Mattilaら, Nucleic Acids Res. 19, 4967(1991);Eckertら, PCR Methods and Applications 1, 17(1991);PCR(McPhersonら監修, IRL Press, オックスフォード);および米国特許第4,683,202号(各々、すべての目的のため、本明細書に援用される)を参照されたい。
他の適切な増幅法には、リガーゼ連鎖反応(LCR)(WuおよびWallace, Genomics 4, 560(1989), Landegrenら, Science 241, 1077(1988))、転写増幅(Kwohら, Proc. Natl. Acad. Sci. USA 86, 1173(1989))、および自律配列複製(self−sustained sequence replication)(Guatelliら, Proc. Nat. Acad. Sci. USA, 87, 1874(1990))および核酸に基づく配列増幅(NASBA)が含まれる。後者の2つの増幅法は、等温転写に基づく等温反応を伴い、それぞれ約30または100対1の比で、増幅産物として一本鎖RNA(ssRNA)および二本鎖DNA(dsDNA)両方を生じる。
B.標的DNAにおける多型の検出
1.アレル特異的プローブ
多型を解析するためのアレル特異的プローブの設計および使用は、例えばSaikiら, Nature 324, 163−166(1986);Dattagupta、EP 235,726、Saiki、WO 89/11548に記載される。2個体由来のそれぞれのセグメントに異なる多型が存在するため、ある個体由来の標的DNAセグメントにハイブリダイズするが、別の個体由来の対応するセグメントにはハイブリダイズしない、アレル特異的プローブを設計することが可能である。ハイブリダイゼーション条件は、アレル間にハイブリダイゼーション強度の有意な相違があり、そして好ましくは、本質的に二元的な反応があり、それによってプローブがアレルの一方のみにハイブリダイズするように、十分にストリンジェントであるべきである。いくつかのプローブは、多型部位がプローブの中央の位置に(例えば15量体では7位に;16量体では8または9位いずれかに)並列して、標的DNAセグメントにハイブリダイズするように設計される。このプローブ設計は、異なるアレル型間のハイブリダイゼーションにおいて、優れた区別を達成する。
これらのプローブは、これらが、好ましくは8〜50ヌクレオチドを含み、そしてこれらが本発明の多型マーカーを含む配列にハイブリダイズするのに十分に相補的であり、そして好ましくはわずか1ヌクレオチド変異に関して、標的配列を区別することが可能であるのに十分に特異的であることで特徴付けられる。本発明のプローブのGC含量は、通常、10〜75%の間、好ましくは35〜60%の間、そしてより好ましくは40〜55%の間の範囲である。これらのプローブの長さは、10、15、20、または30〜少なくとも100ヌクレオチドの範囲、好ましくは10〜50、より好ましくは18〜35ヌクレオチドの範囲であることが可能である。特に好ましいプローブは、長さ25ヌクレオチドである。好ましくは、多型マーカーは、ポリヌクレオチドプローブの中央4ヌクレオチド以内にある。特に好ましいプローブでは、多型マーカーが前記ポリヌクレオチドの中央にある。より短いプローブは、標的核酸配列に対する特異性を欠き、そして一般的に、テンプレートと十分に安定なハイブリッド複合体を形成するのに、より低い温度を必要とする。より長いプローブは、産生するのが高価であり、そしてときに、自己ハイブリダイズして、ヘアピン構造を形成する可能性がある。オリゴヌクレオチドプローブを合成する方法が上述されており、そして本発明のプローブにも適用可能である。
好ましくは、本発明のプローブは、標識されているか、または固体支持体上に固定されている。標識および固体支持体は、当該技術分野に周知である。検出プローブは、一般的に核酸配列であるか、または例えば国際特許出願WO 92/20702に開示されるペプチド核酸、米国特許第5,185,444号;第5,034,506号および第5,142,047号に記載されるモルホリノ類似体(analog)などの非荷電核酸類似体である。プローブは、「伸長不能」にされている必要がある可能性があり、この場合、さらなるdNTPはプローブに付加不能である。類似体は、通常、そのままで伸長不能であり、そして核酸プローブは、ヒドロキシ基がもはや伸長に関与不能となるように、該プローブの3’端を修飾することによって、伸長不能にすることが可能である。例えば、プローブの3’端を捕捉標識または検出標識で官能化して、それによってヒドロキシ基を消費するか、または別の方式で遮断することが可能である。あるいは、3’ヒドロキシ基を単に、切断するか、置換するか、または修飾することが可能である。
本発明のプローブは、いくつかの目的のために有用である。これらをゲノムDNAに対するサザンハイブリダイゼーションまたはmRNAに対するノーザンハイブリダイゼーションに使用することが可能である。プローブはまた、PCR増幅産物を検出するのにも使用可能である。アレル特異的プローブへのハイブリダイゼーションをアッセイすることによって、既定の試料における二アレルマーカーの存在または非存在を検出することが可能である。
アレイ形式のハイスループット平行ハイブリダイゼーションが「ハイブリダイゼーションアッセイ」に特に含まれ、そしてこれを以下に記載する。
アレル特異的プローブは、しばしば、対で用いられ、対の一方のメンバーは、標的配列の参照型に完全なマッチを示し、そして他方のメンバーは、変異型に完全なマッチを示す。その後、同一標的配列内の多数の多型を同時に解析するため、数対のプローブを同じ支持体上に固定することが可能である。
2.アレル特異的プライマー
アレル特異的プライマーは、多型と重複する標的DNA上の部位にハイブリダイズし、そしてプライマーが完全な相補性を示すアレル型の増幅のみをプライミングする。Gibbs, Nucleic Acid Res. 17, 2427−2448(1989)を参照されたい。このプライマーを、遠位部位とハイブリダイズする第二のプライマーと組み合わせて用いる。増幅は、2つのプライマーから進行し、特定のアレル型が存在することを示す、検出可能な産物を生じる。対照実験は、通常、第二の対のプライマーを用いて行われ、このうち、プライマーの一方は多型部位に単一塩基ミスマッチを示し、そして他方は遠位部位に完全な相補性を示す。単一塩基ミスマッチによって増幅が妨げられ、そして検出可能な産物はまったく形成されない。この方法は、多型と並列するオリゴヌクレオチドの最も3’の位にミスマッチが含まれる際に最適に働くが、これは、この位が、プライマーからの伸長をもっとも不安定にするためである。例えばWO 93/22456を参照されたい。本発明はもちろん、遠位ミスマッチを持つこうしたプライマーとともに、選択した条件で、不安定な塩基対形成を行い、そしてしたがって、非効率的にプライミングするプライマーも意図する。
3.直接配列決定
本発明の多型の配列の直接解析は、ジデオキシ鎖終結法またはマクサム・ギルバート法いずれかを用いて達成可能である(Sambrookら, Molecular Cloning, A Laboratory Manual(第2版, CSHP, ニューヨーク 1989);Zyskindら, Recombinant DNA Laboratory Manual, (Acad. Press, 1988)を参照されたい)。DNA配列決定分野は、過去数年間でかなり進歩してきており、そして本発明はこうした進歩を意図することを認識すべきである。最も顕著には、過去十年以内に、自動化DNA配列解析の信頼性が増加してきている。
4.変性勾配ゲル電気泳動
変性勾配ゲル電気泳動を用いることによって、ポリメラーゼ連鎖反応を用いて生成した増幅産物を解析することが可能である。配列に応じた、異なる融解特性および溶液中のDNAの電気泳動移動に基づいて、異なるアレルを同定することが可能である。Erlich監修, PCR Technology, Principles and Applications for DNA Amplification(W.H. Freeman and Co, ニューヨーク, 1992), 第7章。
5.一本鎖コンホメーション多型解析
Oritaら, Proc. Nat. Acad. Sci. 86, 2766−2770(1989)に記載されるように、一本鎖PCR産物の電気泳動移動の変化によって塩基相違を同定する、一本鎖コンホメーション多型解析を用いて、標的配列のアレルを区別することが可能である。増幅されたPCR産物を上述のように生成し、そして加熱するかまたは別の方式で変性して、一本鎖増幅産物を形成することが可能である。一本鎖核酸は、再フォールディングするか、または塩基配列に部分的に依存する二次構造を形成することが可能である。一本鎖増幅産物の異なる電気泳動移動度を、標的配列のアレル間の塩基配列相違に関連付けることが可能である。
上述の方法を修飾した他の方法も存在し、これには、フィルター上のアレル特異的ハイブリダイゼーション、アレル特異的PCR、制限酵素消化を加えたPCR(RFLP−PCR)、変性キャピラリー電気泳動、プライマー伸長および飛行時間型質量分析、および5’ヌクレアーゼ(Taq−ManTM)アッセイが含まれる。
Taq−Manアッセイは、Taq DNAポリメラーゼの5’ヌクレアーゼ活性が、集積する増幅産物に特異的にアニーリングしたDNAプローブを消化することをうまく利用する。蛍光エネルギー移動を介して相互作用するドナー−アクセプター色素対でTaq−Manプローブを標識する。増幅中、前進するポリメラーゼによってTaq−Manプローブが切断され、消光アクセプター色素からドナー色素が解離して、ドナー蛍光が非常に増加する。2つのアレル変異体を検出するのに必要な試薬をすべて反応開始時に合わせておくことが可能であり、そして結果をリアルタイムで監視するか、または終点アッセイとすることが可能である(Livakら, Nature Genetics, 9:341−342, 1995を参照されたい)。均質ハイブリダイゼーションに基づく別の方法では、アレル識別に分子ビーコン(beacon)を用いる。分子ビーコンは、均質溶液における、特定の核酸の存在を知らせる、ヘアピン型オリゴヌクレオチドプローブである。ビーコンが標的に結合すると、コンホメーション再編成が起こり、これによって内部で消光されていた蛍光体の蛍光が回復する(Tyagiら, Nature Biotechnology, 16:49−531 1998)。
SNPの遺伝子型を決定するのに好ましい技術は、解析する各SNPの詳細な最適化を必要としない、大規模自動化解析を可能にすべきである。後者の例は、マイクロタイタープレート(Hybaid)および「単一ストリンジェンシー」DNA−チップハイブリダイゼーション(Affymetrix)に形式をあわせやすいDASH(動的アレル特異的ハイブリダイゼーション)である。もちろん、このリストが包括的でないことを認識すべきである。
本発明には、アレイ形式のハイスループット平行ハイブリダイゼーションが特に含まれ、そしてこれを以下に説明する。
オリゴヌクレオチドアレイに基づくハイブリダイゼーションアッセイは、完全にマッチした標的配列変異体およびミスマッチした標的配列変異体への短いオリゴヌクレオチドのハイブリダイゼーション安定性の相違に頼る。選択した位置で固体支持体(チップ)に付着したオリゴヌクレオチドプローブの高密度アレイを含む基本構造を通じて、多型情報への効率的なアクセスを得る。各DNAチップは、グリッド様パターンに配置され、そして10セント硬貨の大きさに小型化した、数千〜数百万の個々の合成DNAプローブを含有することが可能である。
チップ技術はすでに、多くの場合で適用され、成功を収めてきている。例えば、BRCA I遺伝子、S.セレビシエ(S. cerevisiae)突然変異体株、およびHIV−Iウイルスのプロテアーゼ遺伝子において、突然変異のスクリーニングが行われてきている(Haciaら, Nature Genetics, 14(4):441−447, 1996;Shoemakerら, Nature Genetics, 14(4):450−456, 1996 Kozalら, Nature Medicine, 2:753−759, 1996)。二アレル多型を検出する際に使用する多様な形式のチップは、Affymetrix(GeneChipTM)、Hyseq(HyChipおよびHyGnostics)、およびProtogene Laboratoriesによってカスタマイズに基づいて製作可能である。
一般的に、これらの方法は、個体由来で多型マーカーを含む標的核酸配列セグメントに相補的なオリゴヌクレオチドプローブのアレイを使用する。EP785280は、一塩基多型の検出のためのタイリング戦略を記載する。簡潔には、多数の特定の多型に関して、アレイを一般的に「タイリング」することが可能である。「タイリング」によって、一般的に、目的の標的配列に相補的な配列とともに、その配列のあらかじめ選択された変異、例えば単量体の基準セットの1以上のメンバー、すなわちヌクレオチドでの、1以上の既定の位の置換で構成される、明示されるオリゴヌクレオチドプローブの組の合成を意味する。タイリング戦略は、PCT出願第WO 95/11995号にさらに説明されている。特定の側面において、いくつかの特定の、同定された二アレルマーカー配列に関してアレイをタイリングする。特に、いくつかの検出ブロックを含むようにアレイをタイリングし、ここで、各検出ブロックは、特定の二アレルマーカー、または二アレルマーカーの組に特異的である。例えば、特定の多型を含む配列セグメントにまたがる、いくつかのプローブを含むように検出ブロックをタイリングすることが可能である。プローブが各アレルに相補的であることを確実にするため、二アレルマーカーが異なる対で、プローブを合成する。多型塩基が異なるプローブに加え、一般的に、単一置換プローブもまた、検出ブロック内にタイリングする。これらの単一置換プローブは、多型からどちらかの方向の特定の数の塩基までが、残りのヌクレオチド(A、T、G、CおよびUから選択される)で置換されている塩基を有する。典型的には、タイリングされた検出ブロック中のプローブは、二アレルマーカーから5塩基離れた塩基までで、そして該塩基を含む配列位の置換を含むであろう。人為的クロスハイブリダイゼーションから実際のハイブリダイゼーションを区別するため、単一置換プローブは、タイリングされたアレイの内部対照を提供する。標的配列とのハイブリダイゼーションが完了し、そしてアレイを洗浄した際、アレイをスキャンして、標的配列がハイブリダイズするアレイ上の位置を決定する。その後、スキャンしたアレイ由来のハイブリダイゼーションデータを解析して、二アレルマーカーのどの単数または複数のアレルが試料に存在するかを同定する。ハイブリダイゼーションおよびスキャンは、PCT出願第WO 92/10092号および第WO 95/11995号、並びに米国特許第5,424,186号に記載されるとおりに実行可能である。
したがって、いくつかの態様において、チップは、長さ約15ヌクレオチドの断片の核酸配列アレイを含むことが可能である。さらなる態様において、チップは、配列番号1の6〜800の隣接するヌクレオチドを含む単離ポリヌクレオチドおよびそれに相補的な配列、または多型部位を少なくとも1つ含む、少なくとも約8の連続するヌクレオチド、好ましくは10、15、20、より好ましくは25、30、40、47、または50の連続するヌクレオチドの、前記ポリヌクレオチドの断片からなる群より選択される、少なくとも1つの配列を含むアレイを含むことが可能である。いくつかの態様において、チップは、本発明のこれらのポリヌクレオチドの、少なくとも2、3、4、5、6、7、8またはそれ以上のアレイを含むことが可能である。固体支持体、および固体支持体に付着した、本発明のポリヌクレオチドを1にさらに記載する。
蛍光アレル特異的PCR(FAS−PCR)は、検出しようとするアレルに正確にマッチし、単一の3’ヌクレオチドが異なる、アレル特異的プライマーを用いる(Howardら 1999)。したがって、二アレルSNPの各アレルに正確にマッチするよう設計した2つのプライマーを、単一で共通の逆方向プライマーとともに用いて、アレル特異的プライマーの各々を検出する。これは、PCR増幅プライマーの3’ヌクレオチドが正確にマッチしなければ、増幅は成功しないという観察を好適に使用する。典型的には、各アレル特異的プライマーを異なる蛍光プライマーでタグ付けして、PE Biosystemsモデル310/373/377または3700などの自動化DNA解析系を用いて、ゲル電気泳動またはキャピラリー電気泳動によって解析した際、その区別を可能にする。
また、DNA塩基組成の相違による、熱変性相違を使用した技術を用いて、迅速に、そして効率的に、SNPを遺伝子型決定することが可能である。この試験の1つの態様において、1つのプライマーに26塩基の5’GCテールを付加することを例外として、アレル特異的プライマーを上述のように作成して、二アレルSNPを検出する(GermerおよびHiguichi、1999)。単一で共通の逆方向プライマーとともにPCR増幅した後、dsDNAに優先的に結合する蛍光色素(例えばSYBRグリーン1)を試験管に添加して、そしてその後、PCR増幅のdsDNA産物の熱変性プロフィールを決定する。GCテール付きプライマーによって増幅されるSNPに関してヘテロ接合体である試料は、温度スケールの高い側で変性し、一方、GCタグ付きでないプライマーによって増幅されるSNに関してホモ接合体である試料は、温度スケールの低い側で変性するであろう。ヘテロ接合体試料は、熱変性プロフィールにおいて、2つのピークを示すであろう。
前述の技術の変形において、熱変性曲線によって、動的アレル特異的ハイブリダイゼーション(DASH)を検出する(Howellら、1999)。この試験の1つの態様において、PCRプライマー対を用いて、SNPを含有するDNA試料のゲノム領域を増幅する。これらのプライマーの1つをビオチン化して、続いて、ストレプトアビジンをコーティングしたマイクロタイタープレートにビオチン化された産物の鎖が結合する一方、ビオチン化されていない鎖がアルカリで洗い流されるのを可能にする。1つのアレルに完全にマッチするオリゴヌクレオチドプローブを、低温で、固定PCR産物にハイブリダイズさせる。これによって、dsDNAインターカレート色素(intercalating dye)(例えばSYBRグリーン1)と相互作用するdsDNA領域が形成される。その後、熱変性プロフィールによって、融点の相違のため、二アレルSNP間の単一塩基ミスマッチを区別する試験が可能になる。SNPの遺伝子型を決定する他の方法、およびSeq−40遺伝子中のSNPの検出へのその適用が、当業者に想定されることが可能である。
(実施例2)
統合失調症集団の遺伝子型決定
目的
オーファンGタンパク質共役型受容体Seq−40が統合失調症のリスク増加と関連するかどうかを確かめるため、Seq−40の遺伝子内および該遺伝子周囲のSNPに関して、NIMH統合失調症試料由来のDNAを遺伝子型決定すること。
材料および方法
DNA試料
米国精神保健研究所・統合失調症遺伝学イニシアチブからDNA試料を得た。各DNA試料由来の25ナノグラムを96ウェルプレートに入れ(Schz01、Schz02、Schz03、Schz04)、乾燥させ、その後、−20℃で保存した。Schz01、Schz02およびSchz03と名付けたプレートは、72試料を含有し、最初の3つのカラムは、対照として用いるため、ブランクのままにした。Schz04と名付けたプレートは、A4〜A12のウェルに9試料を含有した。
TaqMan(登録商標)MGBプローブを用いたアレルの識別
ソフトウェア、プライマー・エクスプレス、バージョン1.5(Applied Biosystems)を用いて、各SNPに対するプライマーおよびTaqman(登録商標)MGBプローブ(Applied Biosystems)を設計した。表3は、各SNPに対するすべてのプライマーおよびプローブを列挙する。100μMの最終濃度で、プライマーをHO中に再懸濁した。5μlの2xTaqMan(登録商標)ユニバーサルPCRマスターミックス、200nMの各プローブ、900nMの順方向プライマーおよび逆方向プライマー、並びに10μlまでのHOからなる10μl中で、PCR反応を行った。乾燥したDNA試料に、この10μlを添加した。以下の対照実験、8のテンプレート不含対照実験、8のアレル1対照実験、および8のアレル2対照実験を各プレート上で行った。アレル1および2対照は、実施例1に記載するCon01由来のDNAを25ng含有した。プレートをTiterプレート震蘯装置上に置き、そして5分間激しく震蘯し、その後、1000rpmで簡単に回転させた。以下の熱周期条件:50℃2分間→95℃10分間→35周期の92℃15秒間、60℃1分間を用いて、9600サイクラー(Applied Biosystems)中、熱サイクリングを行った。終点プレート読み取りに関して、製造者の指示にしたがって、ABI PRISM 7700配列検出装置(Applied Biosystems)を用いて蛍光シグナルを検出した。SDSソフトウェア、バージョン1.7(Applied Biosystems)を用いて、データを解析した。
結果
統合失調症試料に対してアレル識別を行うため、我々はTaqMan(登録商標)アッセイ法を用いている。この方法は、2つのプローブ、より一般的なアレル(アレル1)を含有するもの、およびより一般的でないアレル(アレル2)を含有するもう一方のものを設計することを伴う。2つのプローブは、2つのアレルを区別するのに用いる、異なる蛍光レポーター色素(FAMおよびVIC)、および非蛍光性消光色素を含有する。75〜150bpの間のPCR産物を生じるため、プローブに隣接する順方向プライマーおよび逆方向プライマーを設計する。PCRアッセイ中、2つのプローブおよびプライマーをDNAに添加する。DNA試料がアレル1に関してホモ接合体である場合、アレル1のプローブがPCR産物にハイブリダイズし、レポーター色素がTaq DNAポリメラーゼの5’ヌクレアーゼ活性に切断され、そしてそのレポーター色素の蛍光が増加するであろう。DNA試料がアレル2に関してホモ接合体である場合、アレル2のプローブに付着したレポーター色素の蛍光が増加するであろう。試料がアレル1およびアレル2に関してヘテロ接合体である場合、どちらのレポーター色素も蛍光が増加するであろう。PCR反応後、ABI PRISM 7700配列検出装置上で、蛍光を読み取る。アレル識別に用いたプライマーおよびTaqMan(登録商標)MGBプローブを表3に示す。表は、どのプローブがアレル1のSNPまたはアレル2のSNPを含有するかを示す。SNP1、2および7に関しては、センス鎖に対してプローブを設計し、そしてSNP3および4に関しては、アンチセンス(相補)鎖に対してプローブを設計する。表3において、SNPヌクレオチドを太字および下線で示した。Al1(アレル1)は、プローブがより一般的なアレルのSNPを含有することを示し、そしてAl2(アレル2)は、プローブが稀なアレルのSNPを含有することを示す。Fは順方向プライマーであり、そしてRは逆方向プライマーである。
表3.Seq−40のプライマーおよびTaqMan(登録商標)MGBプローブ
Figure 2005524383
この実験は、各プレート上に、8のテンプレート不含対照、8の既知のアレル1対照、および8の既知のアレル2対照を有するように設計され、SDSソフトウェアはこの対照を用いて、未知の試料の結果を自動呼出しした。対照DNAは、SNP6および7を除き、SNP発見中に用いた試料(実施例1)から得た。SNP6およびSNP7に関しては、西ミシガン集団(CON01)には、ホモ接合体状態で、この稀なアレルを所持するゲノムは見られなかった。SNPを含有するゲノム配列に隣接する順方向プライマーおよび逆方向プライマーのプライミング部位を含有する、Taqman解析の合成標的を構築した。簡潔には、2.0μlの25mM dNTPミックスを含有する最終体積30μlの1xクレノウ緩衝液(Life Technologies)中、2.0μgの各オリゴヌクレオチドを95℃に1分間加熱して、3時間の期間に渡って室温に冷却した。0.5単位のクレノウ酵素を添加して、そして室温で15分間、反応を進行させた。2μlの0.5M EDTAを添加し、反応を75℃に10分間加熱した。10μl Taqman反応あたり、0.04μlのアニーリングしたプライマーを用いた。
SNP6アレル1に関して、生成した合成配列は(アレル1が太字):
Figure 2005524383
であった。
SNP6アレル2に関して、合成配列は(アレル2が太字):
Figure 2005524383
であった。
オリゴPSK108および110からアレル1を構築した:
Figure 2005524383
オリゴPSK109および110からアレル2を構築した:
Figure 2005524383
SNP7アレル1に関して、合成配列は(アレル1が太字):
Figure 2005524383
であった。
SNP7アレル2に関して、合成配列は(アレル2が太字):
Figure 2005524383
であった。
オリゴPSK111および113からアレル1を構築した:
Figure 2005524383
オリゴPSK112および113からアレル2を構築した:
Figure 2005524383
225のNIMH統合失調症試料由来の、25マイクログラムのDNAを、96ウェルマイクロタイタープレートの残りのウェルにアリコットし、その後、乾燥させた。
我々が得たNIMH試料中の個体の人口統計データは、よく定義されている。我々は、この研究のために選択した、62の核となる家族から、225の個体由来の遺伝子型データを収集した(しかし、実施例3に詳述する統計解析には、248が利用可能であった)。母の民族性が不明である個体が53人であり、おおよそ68の個体の母がアフリカン・アメリカンであり、51が西ヨーロッパ系であり、39がアングロサクソンであり、14が地中海人種であり、そして23が他の民族背景であった(数は完全には加算的でない)。総数111の個体が統合失調症と診断され、50の個体は精神疾患を患ったことがまったくなく、15の個体は未知の疾患状態を有し、そして72の個体は、別の種類の精神疾患を有した。
225のNIMH統合失調症試料に対して、5つのSNPに関するTaqMan(登録商標)アッセイを行った。表4は、SNP発見段階で用いた、NIMH試料およびCON01試料両方由来の、稀なアレル頻度の要約を示す。結果の統計的評価および統合失調症表現型との関連は、本出願中、後述する。
表4.遺伝子型決定結果の要約。パーセンテージは、発見段階で決定した、稀なアレルの割合である。
Figure 2005524383
遺伝子診断法における本発明の多型
本発明の多型はまた、統合失調症を発症するリスクが増加しているか、または統合失調症を患っている個体を同定することが可能な診断試験を発展するのにも使用可能である。本発明の診断技術は、多様な方法論を使用して、試験中の被験者が、統合失調症を発症するリスクの増加と関連する多型マーカーパターンを有するかどうか、または個体が、特定の突然変異を所持すると同時に、統合失調症を患っているかどうかを決定することが可能であり、こうした方法論には、家族研究、単一精子DNA解析または体細胞ハイブリッドなどの、ハプロタイプ決定のために個々の染色体の解析を可能にする方法が含まれる。
個別ハプロタイプ決定
個体において、同一染色体セグメント上の特定の多型部位を占めるヌクレオチドの同一性(ハプロタイプ)を決定するのが、特に好都合であることが、以下の実施例3から明らかであろう。
本発明はしたがって、患者から配列番号1の194、601、1029、1038、1074、2106、2185、2359、2663および2796位の多型部位を含む核酸を含む材料を得て;配列番号1の194、601、1029、1038、1074、2106、2185、2359、2663および2796位の多型部位のいずれかに隣接するヌクレオチド配列に相補的なオリゴヌクレオチドプライマー対を用いて、核酸を酵素的に増幅して、該多型部位のいずれかまたは他のSeq−40多型部位を含有する増幅産物を生じ、そしてSeq−40ハプロタイプを決定することにより、患者におけるSeq−40ハプロタイプの存在または非存在を決定することによって、統合失調症を診断する方法、または統合失調症に対する素因を決定する方法をさらに提供する。
ハプロタイプを決定するため、増幅された産物を直接配列決定するか、または配列解析前にベクターにサブクローニングすることが可能であると、当業者は理解する。Amersham Life Science(イリノイ州アーリントンハイツ)のシークエナーゼTMキットを含む商業的に入手可能な配列決定キットを用いて、本発明の方法で増幅した産物を配列決定することが可能である。自動化配列解析もまた有用である可能性があり、そしてPrism 377 DNA配列決定装置または373 DNA配列決定装置などの自動化配列決定装置が、例えばApplied Biosystems(カリフォルニア州フォスターシティー;本明細書に援用されるFrazierら, Electrophoresis 17:1550−1552(1996)もまた参照されたい)から商業的に入手可能である。二倍体ゲノム中のどちらのコピーも配列決定可能であるため、個別ハプロタイプ組成を、直接配列解析から推測することが可能である。
別の可能性として、例えば非対称PCR増幅によって(Newtonら, Nucleic Acids Res., 17:2503−2516, 1989;Wuら, Proc. Natl Acad Sci. USA, 86:2757, 1989を参照されたい)、または限界希釈後、PCR増幅することにより、単一の染色体を単離することによって(Ruanoら, Proc. Natl Acad. Sci. USA, 87:6296−6300, 1990を参照されたい)、単一染色体を独立に研究することが可能である。さらに、特定のアレルを二重にPCR増幅することによって、十分に近い多型マーカーに関して、試料のハプロタイプを決定することが可能である(Sarkar, G.およびSommer S.S., Biotechniques, 1991)。
本発明は、個体が本発明の突然変異または多型と持つと同時に、統合失調症を発症するリスクがあるか、または統合失調症を患っているかどうかを決定する診断法を提供する。本発明はまた、個体が統合失調症障害に作用する剤に陽性に反応する可能性があるかどうか、または統合失調症に作用する剤に対する副作用を発症するリスクがあるかどうかを決定する方法も提供する。
これらの方法は、個体から核酸試料を得て、そして該核酸試料が、形質を発症するリスクの指標となるか、または形質を引き起こすアレルを所持する結果、個体が該形質を呈する指標となる、少なくとも1つのアレルまたは少なくとも1つの多型ハプロタイプを含有するかどうかを決定することを伴う。
好ましくは、こうした診断法において、個体から核酸試料を得て、そして上述の方法を用いて、この試料の遺伝子型を決定する。診断法は、単一の多型または多型群に基づくことが可能である。これらの方法の各々において、試験中の被験者から核酸試料を得て、そして表1および2に列挙する多型マーカーの1以上の多型パターンを決定する。
1つの態様において、核酸試料に対してPCR増幅を行って、検出可能な表現型と関連する多型が同定されている領域を増幅する。増幅産物の配列を決定して、個体が、検出可能な表現型と関連する1以上の多型を所持するかどうかを決定する。増幅産物を生成するのに用いるプライマーは、表3に列挙するプライマーを含むことが可能である。あるいは、核酸試料を上述のように微量配列決定反応に供して、個体が、候補遺伝子中の突然変異または多型から生じる検出可能な表現型と関連する、1以上の多型を所持するかどうかを決定する。微量配列決定反応に用いるプライマーは、表3に列挙するプライマーを含むことが可能である。別の態様において、検出可能な表現型と関連する1以上の候補遺伝子アレルと特異的にハイブリダイズする、1以上のアレル特異的オリゴヌクレオチドプローブと核酸試料を接触させる。ハイブリダイゼーションアッセイに用いるプローブは、表3に列挙するプローブを含むことが可能である。
好ましい態様において、配列番号1の194,601、1029、1038、1074、2106、2185、2359、2663および2796位の多型部位からなる群より選択される、少なくとも1つの二アレルマーカーに存在するヌクレオチドの同一性を決定し、そして検出可能な形質は統合失調症である。
これらの診断法は、特定の状況下で、予防的治療を開始するか、または重大なハプロタイプを所持する個体が軽度の症状などの警告の兆候を予見するのを可能にするのに使用可能であるため、非常に価値がある。攻撃が極端に激しく、そして間に合うように治療しなければ、ときに致死性である疾患、例えば喘息の場合、潜在的な素因の知識は、この素因がたとえ絶対的でなくても、非常に有意な方式で、治療効力に寄与する可能性がある。同様に、潜在的な副作用に対する素因があると診断されれば、こうした副作用が臨床試験中に観察されなかった治療に、医師が直ちに変更することが可能になる。
薬剤への反応または薬剤に対する副作用を解析し、そして予測する診断法を用いて、個体を特定の薬剤で治療すべきかどうかを決定することが可能である。例えば、診断によって、個体が特定の薬剤での治療に陽性に反応する可能性が示されたならば、その個体に薬剤を投与することが可能である。逆に、診断によって、個体が特定の薬剤での治療に陰性に反応する可能性が示されたならば、別の治療コースを指示することが可能である。陰性反応は、有効な反応の欠如または毒性の副作用の存在のいずれかとして定義可能である。
臨床薬剤試験は、本発明のマーカーの別の適用に相当する。統合失調症に作用する剤に対する反応または統合失調症に作用する剤に対する副作用の指標となる1以上のマーカーは、上述の方法を用いて同定可能である。その後、こうした剤の臨床試験の潜在的な参加者をスクリーニングして、薬剤に良好に反応する可能性が最も高い個体を同定し、そして副作用を経験する可能性がある個体を排除することが可能である。こうすれば、この研究で陽性に反応する可能性がない個体を含んだ結果、測定値を低下させることなく、そして望ましくない安全性の問題の危険を冒すことなく、薬剤に陽性に反応する個体において、薬剤治療の有効性を測定することが可能である。
本発明のポリヌクレオチドを含む診断キットを、以下にさらに記載する。
診断キット
本発明は、上述のような少なくとも1つのアレル特異的オリゴヌクレオチドを含むキットをさらに提供する。アミノ酸変化を生じるアレルの場合、キットは、相当するエピトープに対する抗体を含有することが可能である。しばしば、キットは、異なる型の多型にハイブリダイズするアレル特異的オリゴヌクレオチドの1以上の対を含有する。いくつかのキットでは、支持体に固定したアレル特異的オリゴヌクレオチドを提供する。例えば、記載する多型の双方を検出するため、同一の支持体が、アレル特異的オリゴヌクレオチドプローブ群を含むことが可能である。キットの任意のさらなる構成要素には、例えば、制限酵素、逆転写酵素またはポリメラーゼ、基質であるヌクレオチド三リン酸、標識するのに用いる手段(例えば標識がビオチンであるならば、アビジン酵素コンジュゲートおよび酵素基質および色原体)、および逆転写反応、PCR反応、またはハイブリダイゼーション反応に適した緩衝剤が含まれる。通常、キットはまた、該方法を実施するための説明書も含有する。
本発明を用いて、個体が、統合失調症と関連付けられているSeq−40多型を有するかどうかを決定する。こうしたSeq−40多型は、一般の集団における前記多型の頻度および統合失調症患者における該多型の頻度を比較する、集団研究において、遺伝子リスク要因であることが示されている。例えば、前記多型が、一般的な集団において、3%の頻度で生じるが、統合失調症患者で30%の頻度で生じる場合、前記多型に関する試験は、統合失調症を発症するリスクがより高い個体を明らかにするであろう。この情報を予後的に用いて、将来的にいずれ統合失調症を発症するリスクが増加している個体を同定するか、あるいは診断的に用いて、臨床検査で統合失調症を示し、したがって、統合失調症、または他の関連する疾患、例えば双極性統合失調症性障害、抑うつ性統合失調症性障害、統合失調症型人格障害、非感情性精神異常(統合失調症様障害、妄想性障害、精神異常NOS)、または気分不調和精神抑うつ障害または妄想性人格障害または統合失調症性人格障害を有する可能性がより高いと診断される可能性がある個体を同定することが可能である。
予後目的または診断目的の前記Seq−40多型の解析は、限定されるわけではないが、フィルター上のアレル特異的ハイブリダイゼーション、アレル特異的PCR、制限酵素消化を加えたPCR(RFLP−PCR)、変性キャピラリー電気泳動、プライマー伸長および飛行時間型質量分析、および5’ヌクレアーゼ(Taq−Man)アッセイを含む、SNPを正確に検出することが可能な技術いずれか1つによって行うことも可能である。
SNP遺伝子型決定の好ましい技術は、解析する各SNPの詳細な最適化を必要としない、大規模自動化解析を可能にすべきである。後者の例は、マイクロタイタープレート(Hybaid)および「単一ストリンジェンシー」DNA−チップハイブリダイゼーション(Affymetrix)に形式をあわせやすいDASH(動的アレル特異的ハイブリダイゼーション)である。
本発明の多型マーカーを用いた遺伝子解析法
多型の同一性が確立されたら、表現型の存在または非存在と、多型の特定の型を関連付けるように試みることが望ましくなる。本発明の特定の多型と統合失調症表現型の関連を確立したが、本発明はまた、他の疾患状態の解析用マーカーとして、統合失調症または他の疾患の薬剤治療に対する感受性のマーカーとして、本発明の多型部位を使用することも意図し、あるいは、本発明の多型は、ヒトゲノムの完全遺伝子マップまたは部分的遺伝子マップいずれに含まれることも可能である。
本発明の多型マーカーは、当該技術分野に知られる、遺伝子型および表現型間に統計的に有意な相関を立証する、いかなる方法にも使用を見出す。複雑な形質の遺伝子解析には、異なる方法が利用可能である(LanderおよびSchork, Science, 265, 2037−2048, 1994を参照されたい)。多型が表現型形質と関連しているかどうかを決定するため、3つの主な方法を用いる:家族研究を用いて、遺伝子座および推定上の形質遺伝子座間の同時分離の証拠を探す、連鎖アプローチ(パラメトリックまたはノンパラメトリック)、並びにアレルおよび形質または形質を引き起こすアレル間の、統計的に有意な関連の証拠を探す、関連アプローチ、並びに連鎖および関連両方に関して検定する、伝達不平衡検定(TDT)。
パラメトリックおよびノンパラメトリック連鎖解析法に、多型マーカーを使用することが可能である。好ましくは、本発明の多型マーカーを用い、ケース−コントロール法などの関連研究を用いて、統合失調症または他の障害と関連する遺伝子を同定する。このアプローチは、罹患家族の使用を必要とせず、そして複雑な形質および散発性形質と関連する遺伝子の同定を可能にする。
本発明の多型マーカーを用いた遺伝子解析は、いかなる規模で行うことも可能である。本発明の多型マーカーのすべての組または本発明の多型マーカーのいかなるサブセットを用いることも可能である。さらに、本発明の多型マーカーを含む遺伝子マーカーのいかなる組を用いることも可能である。本発明の多型マーカーと組み合わせた遺伝子マーカーとして使用可能な二アレル多型の組がWO 98/20165に記載されている。上述のように、本発明の多型マーカーは、ヒトゲノムの完全遺伝子マップまたは部分的遺伝子マップいずれに含まれることも可能であることに注目すべきである。
これらの異なる使用が、本発明および請求項に特に意図される。
A.連鎖解析
連鎖解析は、家系内の世代全体の遺伝子マーカーの伝達および特定の形質の伝達の間の相関を確立することに基づく。したがって、連鎖解析の目的は、家系において、目的の形質と同時分離を示すマーカー遺伝子座を検出することである。
パラメトリック法
代々の世代からデータが入手可能である場合、遺伝子座対間の連鎖の度合いを研究する機会がある。組換え比の推定は、遺伝子座を遺伝子マップ上に整理し、そして配置するのを可能にする。遺伝子マーカーである遺伝子座を用いて、遺伝子マップを確立することが可能であり、そしてその後、マーカーおよび形質間の連鎖強度を計算し、そしてマーカー、およびこれらの形質に影響を及ぼす遺伝子の相対的な位置を示すのに用いることが可能である。連鎖解析のための古典的な方法は、対数オッズ比(lod)スコア法である(Morton N.E., Am. J Hum. Genet., 7:277−318, 1995;Ott J., Analysis of Human Genetic Linkage, John Hopkins University Press, ボルチモア, 1991を参照されたい)。lodスコアの計算は、疾患の遺伝様式の指定を必要とする(パラメトリック法)。一般的に、連鎖解析を用いて同定される候補領域の長さは、2〜20Mbの間である。候補領域が上述のように同定されたら、さらなるマーカーを用いた組換え個体の解析によって、候補領域をさらに描写することが可能になる。連鎖解析研究は、一般的に、最大5,000のマイクロサテライトマーカーの使用に頼り、したがって、理論的に得られる連鎖解析最大解像度を、平均約600kbに制限してきた。
連鎖解析は、明らかなメンデル遺伝パターンを示し、そして高い浸透率(penetrance)(すなわちアレルの形質陽性キャリアー数および集団中のキャリアー総数間の比)を有する単純な遺伝形質をマッピングするのに適用され、成功を収めてきた。しかし、パラメトリック連鎖解析には多様な欠点がある。まず、研究する各形質に適した遺伝的モデルの選択に頼ることによって制限される。さらに、すでに言及したように、連鎖解析を用いて達成可能な解像度が制限されており、そして連鎖解析を通じて最初に同定される、典型的な2Mb〜20Mb領域の解析を絞り込むには、補足的な研究が必要である。さらに、パラメトリック連鎖解析アプローチは、複雑な遺伝形質に適用した際は、多数の遺伝子および/または環境的要因が組み合わされた作用などのため、困難であることが判明している。lodスコア解析において、これらの要因を適切にモデリングすることは非常に困難である。こうした場合、近年、Risch, N.およびMerikangas, K.(Science, 273:1516−1517, 1996)に論じられたように、これらの状況に連鎖解析を適用するのに必要な、適切な数の罹患家族を募るには、非常に大きな努力および高い費用が必要である。
ノンパラメトリック法
連鎖解析のためのいわゆるノンパラメトリック法の利点は、これらが、疾患の遺伝様式の指定を必要とせず、複雑な形質の解析に、より有用である傾向があることである。ノンパラメトリック法では、罹患した親類群が、偶然の場合に期待されるよりも、その領域の同一コピーをより頻繁に受け継ぐことを示すことによって、染色体領域の遺伝パターンが、ランダムなメンデル分離と相関していないことを立証しようと試みる。罹患した親類群は、不完全な浸透率および多遺伝子遺伝の存在下においてさえ、過剰な「アレル共有」を示すはずである。ノンパラメトリック連鎖解析では、2個体におけるマーカー遺伝子座のマッチの度合いは、状態同一(IBS)アレルの数、または同祖同一(IBD)アレルの数、いずれかによって測定可能である。罹患同胞対解析は、周知の特別なケースであり、そしてこの解析はこれらの方法の最も単純な型である。
本発明の多型マーカーは、パラメトリックおよびノンパラメトリック連鎖解析両方に使用可能である。好ましくは、多型マーカーをノンパラメトリック法において用い、これによって複雑な形質に関与する遺伝子のマッピングが可能になる。本発明の多型マーカーは、IBD法およびIBS法両方で使用して、複雑な形質に影響を及ぼす遺伝子をマッピングすることが可能である。こうした研究では、高密度の多型マーカーをうまく利用して、隣接するいくつかの多型マーカー遺伝子座をプールし、多アレルマーカーによって達成される効率性を達成することが可能である(Zhaoら, Am. J Hum. Genet., 63:225−240, 1998)。
しかし、パラメトリックおよびノンパラメトリック連鎖解析法はどちらも、罹患した親類群を利用する必要があり、薬剤反応の遺伝子解析において、または治療に対する副作用の解析において、限定された価値しか持たない傾向がある。この種の解析は、家族ケースの利用可能性が欠如しているケースでは、実際的でない。実際、家族において1より多い個体が、同時に同じ薬剤に曝露されている可能性は非常に低い。
B.集団関連研究
本発明は、本発明の多型マーカーを用いて検出可能な形質と関連する、多型マーカーを同定するための方法を含む。1つの態様において、本発明は、多型マーカーアレルまたは多型マーカーハプロタイプおよび形質間の関連を検出する方法を含む。さらに、本発明は、本発明の多型マーカーアレルいずれかと連鎖不平衡にある、形質を引き起こすアレルを同定する方法を含む。
上述のように、一般的な集団内で関連研究を行うことが可能であり、そして関連研究は、罹患家族中の関連個体に対して行う研究に限定されない。関連研究は、散発性形質または多因子形質の解析を可能にするため、非常に価値がある。さらに、関連研究は、細かいスケールのマッピングのための強力な方法を代表し、連鎖研究よりも、形質を引き起こすアレルの、より細かいマッピングを可能にする。家系に基づく研究は、しばしば、形質を引き起こすアレルの位置を狭くするだけである。したがって、本発明の多型マーカーを用いた関連研究を用いて、連鎖解析法によって同定された候補領域において、形質を引き起こすアレルの位置を絞り込むことが可能である。本発明の多型マーカーを用いて、特定の遺伝子が形質と関連していることを立証可能である。こうした使用が、本発明および請求の範囲に特に意図される。
多型マーカーを用いた関連研究を行う一般的な戦略は、両方の群で、本発明の多型マーカーのアレル頻度を測定し、そして統計的に比較するため、2つの群の個体(ケース−コントロール集団)をスキャンすることである。
少なくとも1以上の解析した多型マーカーに関して、形質と、統計的に有意な関連が同定されたら:関連アレルが、形質を引き起こすのに直接関与している(関連アレルが形質を引き起こすアレルである)か、またはよりありうることだが、関連アレルが、形質を引き起こすアレルと連鎖不平衡にあると仮定することが可能である。候補遺伝子機能に関して、関連アレルの特定の性質は、通常、関連アレルおよび形質間の関係(原因となるかまたは連鎖不平衡にある)に、さらなる洞察を与える。証拠によって、候補遺伝子内の関連アレルが、形質を引き起こすアレルでなく、実際に形質を引き起こすアレルと連鎖不平衡にある可能性が最も高いことが示されたならば、形質を引き起こすアレルは、関連するマーカーの近傍を配列決定することによって、見出すことが可能である。
通常、2つの連続する工程で関連研究を行う。第一段階では、形質陽性集団および形質陰性集団において、いくつかの多型マーカー頻度を決定する。解析の第二段階では、相当する領域由来のより高密度のマーカーを用いて、候補遺伝子の同一性および既定の形質に関与する遺伝子座の位置をさらに絞り込む。
ハプロタイプ解析
上述のように、疾患アレルを所持する染色体はまず、突然変異または移住(migration)の結果として、集団中に現れ、突然変異アレルは、必然的に、一組の連鎖マーカー:祖先ハプロタイプを有する染色体にある。このハプロタイプを集団全体で追跡することが可能であり、そして既定の形質との統計的な関連を解析することが可能である。ハプロタイプ研究とも呼ばれる多ポイント関連研究で、単一ポイント(アレル)関連研究を補うことによって、関連研究の統計的な能力が増加する。したがって、ハプロタイプ関連研究によって、祖先キャリアーハプロタイプの頻度および種類を定義することが可能になる。ハプロタイプ解析は、これが個体マーカーに関与する解析の統計的な能力を増加させる点で、重要である。
ハプロタイプ頻度解析の第一段階では、本発明で同定された多型マーカーの多様な組み合わせに基づいて、ありうるハプロタイプの頻度を決定する。その後、形質陽性個体および対照個体の別個の集団に関して、ハプロタイプ頻度を比較する。統計的に有意な結果を得るために、この解析に供すべき、形質陽性個体の数は、通常、30〜300の間の範囲であり、個体の好ましい数は、50〜150の間の範囲である。この研究に用いる、罹患していない個体(またはランダムコントロール)の数にも同じ考慮があてはまる。この第一の解析の結果によって、ケース−コントロール集団におけるハプロタイプ頻度が提供され、評価したハプロタイプ頻度各々に関して、p値およびオッズ比を計算する。統計的に有意な関連が見られるならば、既定のハプロタイプを所持する個体が、研究中の形質に罹患する相対的なリスクを概算することが可能である。
相互作用解析
本発明の多型マーカーはまた、多遺伝子相互作用から生じる、検出可能な形質と関連する多型マーカーのパターンを同定するのにも使用可能である。非連鎖遺伝子座のアレル間の遺伝的相互作用の解析は、本明細書に記載する技術を用いた、個々の遺伝子型決定を必要とする。適切なレベルの統計的有意性を持つ、選択した組の多型マーカーの間のアレル相互作用解析を、ハプロタイプ解析とみなすことが可能である。相互作用解析は、第一の遺伝子座の既定のハプロタイプに関して、ケース−コントロール集団を階層化して、そして各下位集団で、第二の遺伝子座のハプロタイプ解析を行うことからなる。
関連研究に用いる統計的な方法をさらに以下に記載する。
1.)集団中の多型マーカーアレルまたは多型マーカーハプロタイプ頻度の決定
集団中のアレル頻度の決定
集団中の多型マーカーのアレル頻度は、この意図される目的に適した上述の方法の1つまたは遺伝子型決定法いずれかを用いて、決定可能である。プールした試料または個々の試料の遺伝子型を決定すると、集団中の多型マーカーアレルの頻度を決定することが可能になる。必要な遺伝子型決定数を減少させる1つの方法は、プールした試料を用いることである。プールした試料を用いる際の主な障害は、プールをセットアップする際の、正確なDNA濃度決定の正確さおよび再現性に関する。個々の試料の遺伝子型を決定すると、感度、再現性および正確さがより高くなり、そして;これが本発明で使用するのに好ましい方法である。好ましくは、各個体の遺伝子型を別個に決定し、そして単純な遺伝子計測を適用して、既定の集団中の多型マーカーのアレルの頻度または遺伝子型の頻度を決定する。
集団中のハプロタイプ頻度の決定
二倍体個体が、1より多い遺伝子座でヘテロ接合体である場合、ハプロタイプの配偶子相(gametic phase)は未知である。家族における系統情報を用いると、ときに、配偶子相を推察することが可能である(Perlinら, Am. J Hum. Genet., 55:777−787, 1994)。系統情報が入手不能な場合、異なる戦略が使用可能である。1つの可能性は、多部位へテロ接合体二倍体を解析から排除して、ホモ接合体および単一部位ヘテロ接合体の個体のみを残すことであるが、このアプローチは、試料組成に偏向を生じ、そして低頻度ハプロタイプの過小評価を生じる可能性がある。先に記載したように、別の可能性は、例えば非対称PCR増幅によって(Newtonら, Nucleic Acids Res., 17:2503−2516, 1989;Wuら, Proc. Natl Acad Sci. USA, 86:2757, 1989を参照されたい)、または限界希釈後、PCR増幅することにより、単一の染色体を単離することによって(Ruanoら, Proc. Natl Acad. Sci. USA, 87:6296−6300, 1990を参照されたい)、単一染色体を独立に研究することである。さらに、特定のアレルを二重にPCR増幅することによって、十分に近い多型マーカーに関して、試料のハプロタイプを決定することが可能である(Sarkar, G.およびSommer S.S., Biotechniques, 1991)。これらのアプローチは、これらが技術的に複雑であるか、さらなるコストを伴うか、大規模での生成が不能であるか、または偏向を導入する可能性があるため、完全には満足のいくものでない。これらの困難を克服するため、Clark A.G.(Mol Biol Evol, 7:111−122, 1990)に導入された、PCR増幅DNA遺伝子型の相を推察するアルゴリズムを使用可能である。簡潔には、原理は、あいまいでない(unambiguous)個体、すなわち完全にホモ接合体である個体および単一部位でヘテロ接合体である個体を調べることによって、試料に存在するハプロタイプの予備的リストを埋め始めることである。その後、先に認識されたハプロタイプが存在する可能性に関して、同一試料中の他の個体をスクリーニングする。陽性の同定各々に関して、すべての個体に関する相情報が、解決されるか、または未解決と同定されるまで、認識されるハプロタイプのリストに、補足ハプロタイプを加える。この方法は、多へテロ接合体個体各々に、単一のハプロタイプを割り当てるが、1より多いヘテロ接合部位がある場合、いくつかのハプロタイプも可能である。あるいは、各個体にハプロタイプを割り当てることなく、集団におけるハプロタイプ頻度を推定する方法を使用可能である。好ましくは、ハーディ・ワインバーグ比率(任意交配)の仮定のもとに、ハプロタイプ頻度の最大尤度推定値を生じる、期待値最大化(EM)アルゴリズム(Dempsterら, J R. Stat. Soc., 39B:1−38, 1977)に基づく方法を用いる(Excoffier L.およびSlatkin M., Mol Biol Evol, 12(5):921927, 1995を参照されたい)。EMアルゴリズムは、データがあいまいであり、そして/または不完全である際に有用な推定に対する、一般化された反復最大尤度アプローチである。見出し「統計的方法」以下に、ハプロタイプの推定をさらに記載する。集団において、ハプロタイプ頻度を決定するかまたは推定する、当該技術分野に知られる他のいかなる方法もまた、使用可能である。
2.連鎖不平衡解析
連鎖不平衡は、2以上の遺伝子座のアレルのランダムでない関連であり、そして疾患形質に関与する遺伝子をマッピングするための強力なツールを代表する(Ajioka R.S.ら, Am. J Hum. Genet., 60:1439−1447, 1997を参照されたい)。多型マーカーは、ヒトゲノム中に高密度に配置されており、そして他の種類の遺伝子マーカー(例えばRFLPまたはVNTRマーカー)よりも、より多くの数で遺伝子型決定することが可能であるため、連鎖不平衡に基づく遺伝子解析には、特に有用である。本発明の多型マーカーを、当該技術分野に知られる、いかなる連鎖不平衡解析法で使用することも可能である。
簡潔には、疾患突然変異が最初に集団に導入された際(新たな突然変異または突然変異キャリアーの移住によって)、該突然変異は必然的に単一染色体上に、そしてしたがって、連鎖マーカーの単一の「バックグラウンド」または「祖先」ハプロタイプ上に存在する。その結果、これらのマーカーおよび疾患突然変異間には、完全な不平衡がある:疾患突然変異は、特定の組のマーカーアレルの存在のみによって見出される。それに続く世代を通じて、疾患突然変異およびこれらのマーカー多型の間に組換えが起こり、そして次第に不平衡が消散する。この消散の速さは、組換え頻度の関数であり、したがって、疾患遺伝子に最も近いマーカーは、遠く離れたものより、高いレベルの不平衡を示すであろう。組換えによって破壊されなければ、「祖先」ハプロタイプ、および異なる遺伝子座のマーカーアレル間の連鎖不平衡は、家系を通じてだけでなく、集団を通じても追跡可能である。連鎖不平衡は、通常、1つの遺伝子座での1つの特定のアレルおよび第二の遺伝子座での別の特定のアレルの間の関連として見られる。
疾患およびマーカー遺伝子座間の不平衡パターンまたは曲線は、疾患遺伝子座で最大値を生じると期待される。その結果、疾患アレルおよび近くで連鎖した遺伝子マーカーの間の連鎖不平衡の量が、疾患遺伝子の位置に関して、価値ある情報をもたらす可能性がある。疾患遺伝子座の細かい規模でのマッピングのため、研究中の領域のマーカー間に存在する連鎖不平衡パターンについて、ある程度の知識を有することが有用である。上述のように、連鎖不平衡の解析を通じて達成されるマッピング解像度は、連鎖研究のものよりはるかに高い。連鎖不平衡と組み合わせた高密度多型マーカー解析は、細かい規模のマッピングの強力なツールを提供する。
目的のゲノム領域中に第一の多型マーカーが同定されたら、当業者は、本発明の教示を用いて、この第一のマーカーと連鎖不平衡にある、さらなる多型マーカーを容易に同定可能である。前述のように、形質と関連する第一のマーカーと連鎖不平衡にあるいかなるマーカーも、該形質と関連付けられるであろう。したがって、既定の多型マーカーおよび形質間に関連が立証されたなら、この特定の領域において、多型マーカーの密度を増加させるため、この形質に関連するさらなる多型マーカーを発見するのが、非常に興味深い。原因となる遺伝子または突然変異は、形質と最大の相関を示すマーカーまたはマーカーの組の近傍に見出されるであろう。
既定のマーカーと連鎖不平衡にあるさらなるマーカーの同定は:(a)複数の個体から、第一の多型マーカーを含むゲノム断片を増幅し;(b)前記の第一の多型マーカーを宿するゲノム領域において、第二の多型マーカーを同定し;(c)前記の第一の多型マーカーおよび第二の多型マーカー間の連鎖不平衡解析を行い;そして(d)前記の第一のマーカーと連鎖不平衡にあるものとして、前記の第二の多型マーカーを選択することを伴う。工程(b)および(c)を含むサブコンビネーションもまた意図される。
多型マーカーを同定し、そして連鎖不平衡解析を行う方法が本明細書に記載され、そして過度の実験なしに、当業者によって実行可能である。本発明はひいてはまた、図1に示す特定の多型マーカーと連鎖不平衡にあり、そして既定の形質とそれぞれの関連に関して、類似の特性を示すと期待される多型マーカーにも関する。
見出し「統計的方法」以下に、連鎖不平衡を計算する別の方法を記載する。
3.形質−マーカー関連の、集団に基づくケース−コントロール研究
上述のように、同一染色体上の異なる遺伝子座での特定のアレル対の存在はランダムではなく、そしてランダムからの逸脱を連鎖不平衡と呼ぶ。関連研究は、集団頻度に重点を置き、そして連鎖不平衡現象に頼る。既定の遺伝子中の特定のアレルが、特定の形質を引き起こすのに直接関与している場合、その頻度は、形質陰性集団またはランダムコントロール集団における頻度と比較して、罹患(形質陽性)集団で、統計的に増加するであろう。連鎖不平衡が存在する結果、形質を引き起こすアレルを所持するハプロタイプに存在する他のアレルすべての頻度もまた、形質陰性個体またはランダムコントロールに比較して、形質陽性個体で、増加するであろう。したがって、形質、および形質を引き起こすアレルと連鎖不平衡にあるアレル(特に多型マーカーアレル)いずれかの間の関連は、その特定の領域に形質関連遺伝子が存在することを示唆するのに十分であろう。多型マーカーに関して、ケース−コントロール集団の遺伝子型を決定し、形質を引き起こすアレルを狭い範囲に位置決定する関連を同定することが可能である。形質と関連する1つの既定のマーカーと連鎖不平衡にあるマーカーはいずれも、該形質と関連付けられるであろうためである。形質を引き起こすアレルを発見するため、すべてのありうる機能する多型をスクリーニングする代わりとして、限定された数の遺伝子多型(特に多型マーカー)のケース−コントロール集団における相対頻度を解析することが、連鎖不平衡によって可能になる。関連研究は、関連しないケース−コントロール集団におけるマーカーアレルの頻度を比較し、そして該研究は、複雑な形質の詳細な分析のための強力なツールを代表する。
ケース−コントロール集団(包含基準)
集団に基づく関連研究は、家族性遺伝に関わりなく、ケース−コントロール集団中の特定の遺伝子マーカーまたはマーカーの組の優勢を比較する。これらは、関連しないケース(罹患または形質陽性)個体および関連しないコントロール(非罹患または形質陰性またはランダム)個体の比較に基づく。好ましくは、コントロール群は、非罹患または形質陰性個体で構成される。さらに、コントロール群は、ケース集団に民族的にマッチする。さらに、コントロール群は、好ましくは、研究中の形質に関する、主な既知の混乱要因に関して、ケース集団にマッチする(例えば年齢に依存する形質に関しては年齢マッチ)。理想的には、2つのサンプル中の個体は、その疾患状態のみが異なると期待される方式で対形成される。以下、「形質陽性集団」、「ケース集団」および「罹患集団」は、交換可能に用いられる。
関連研究を用いた複雑な形質の詳細な分析の重要な工程は、ケース−コントロール集団の選択である(LanderおよびSchork, Science, 265, 2037−2048, 1994を参照されたい)。ケース−コントロール集団の選択の主な工程は、既定の形質または表現型の臨床的定義である。形質陽性表現型群および形質陰性表現型群に含もうとする個体を注意深く選択することによって、いかなる遺伝形質も、本明細書に提示する関連法によって解析可能である。4つの規準がしばしば有用である:臨床的表現型、開始時の年齢、家族歴および重症度。連続性の形質または定量的な形質(例えば血圧など)の選択法は、これらの形質陽性集団および形質陰性集団に、重複する表現型を持つ個体を含まないように、研究中の形質の表現型分布の両端の個体を選択することを伴う。好ましくは、ケース−コントロール集団は、表現型が均質の集団からなる。形質陽性集団および形質陰性集団は、各々、研究中の総集団の1〜98%、好ましくは1〜80%、より好ましくは1〜50%、そしてより好ましくは1〜30%、最も好ましくは1〜20%に相当し、そして重複する表現型を示さない個体の中で選択される、表現型が均一な個体の集団からなる。2つの形質表現型間の相違が明らかであればあるほど、多型マーカーとの関連を検出する確率が高くなる。劇的に異なるが、相対的に均一である表現型を選択することによって、研究中の集団のサンプルサイズが十分に有意であれば、関連研究における効率的な比較が可能になり、そして遺伝子レベルでの際立った相違の検出が可能になる。
好ましい態様において、50〜300の形質陽性個体、好ましくは約100の個体の第一の群を、その表現型にしたがって採用する。同様の数の形質陰性個体が、こうした研究に含まれる。
本発明において、包含規準の典型的な例には、CNS障害またはCNS障害に作用する薬剤に対する反応の評価、またはCNS障害に作用する薬剤での治療に対する副作用が含まれる。
本発明の多型マーカーを含む多型マーカーを用いた関連研究の適切な例は、以下の集団を伴う研究である:
1.治療から生じる副作用を患う、統合失調症に作用する剤で治療したケース集団、および副作用を示さない、同一剤で治療したコントロール集団、または
2.有益な反応を示す、統合失調症に作用する剤で治療したケース集団、および有益な反応を示さない、同一剤で治療したコントロール集団。
3.別のCNS障害を患うケース集団、および健康な罹患していないコントロール集団。
C.関連の存在下での連鎖に関する検定
本発明の多型マーカーはさらに、TDT(伝達/不平衡検定)でも使用可能である。TDTは、連鎖および関連両方に関してテストし、そして集団階層化によって影響を受けない。TDTは、罹患個体およびその両親に関するデータ、または両親の代わりに、罹患していない同胞由来のデータを必要とする(Spielman. S.ら, Am. J Hum. Genet., 52:506−516, 1993;Schaid D.J.ら, Genet. Epidemiol., 13:423−451, 1996, Spielman. S.およびEwens W.J., Am. J Hum. Genet., 62:450−458, 1998を参照されたい)。この方法は、家族に基づく実験設計を使用して、ケース群およびコントロール群のミスマッチ、あるいは異なる人種群または民族群からなる亜集団の混合による潜在的な落とし穴を回避する。さらに、理論的な解析によって、このアプローチは、疾患リスクが2倍または4倍に増加するような、比較的小さい影響を持つアレルを検出するため、伝統的な連鎖に基づくアプローチより、はるかにより強力である可能性があることが示される。
一般に、TDTアプローチは、ハプロタイプいずれかの過剰な伝達/過小な伝達いずれかがあるかどうかを調べるため、親および罹患した子由来の遺伝子型データを必要とする。伝達されるハプロタイプはケースとみなすことが可能であり、そして非伝達ハプロタイプは、コントロールとみなすことが可能である。コンピュータプログラムTRANSMIT(Clayton、99)を使用して、解析を行うことも可能である。
(実施例3)
本発明の多型の伝達不平衡解析
我々は、実施例2で生成したNIMH統合失調症データに関して、家族に基づく関連研究を行った。
データの説明
我々の研究のため、NIMH統合失調症コレクションから選択したのは、62の核となる家族由来の、248個体(225個体の遺伝子型データ)であった。母の民族性が不明である個体が53人であり、おおよそ68の個体の母がアフリカン・アメリカンであり、51が西ヨーロッパ系であり、39がアングロサクソンであり、14が地中海人種であり、そして23が他の民族背景であった(数は完全には加算的でない)。
総数111の個体が統合失調症と診断され、50の個体は精神疾患を患ったことがまったくなく、15の個体は未知の疾患状態を有し、そして72の個体は、別の種類の精神疾患を有した。
解析法
コンピュータプログラム「Transmit」Clayton, D. Am. J.Hum. Genet, 1999. 65(4):p.1170−7を用いて、疾患状態、データ、家系構造および遺伝子型データを解析した。TransmitのI型エラーは、集団階層化によって影響を受けないことが示唆されている。ブートストラッピング法から得たp値を報告する。一方または両方の親の遺伝子型決定が不能である場合、親の遺伝子型を推測するため、Transmitは別の子供からの遺伝子型データを利用する。
結果
我々は、予期されるよりも頻繁に、ハプロタイプが罹患子孫に伝達されているかどうか決定する「総合的(global)検定」を行った。個別のハプロタイプに対しても検定を行った。
S7は、0.00035の総合的検定のp値を有し、そしてS1−S4の組み合わせは、0.00036の総合的検定のp値を有する。どちらもボンフェローニの修正を行って、統計的に有意である。S4−S7、S2−S4、S1−S7、S2−S4−S8、S1−S2−S4およびS2−S7はボンフェローニ修正なしに0.005レベルで有意であり、そしてS1−S2−S7、S4−S7−S8、S4、S2−S7−S8、S1、S7−S8、S2およびS1−S7−S8は、ボンフェローニ修正なしに0.05レベルで有意である。選択したSNPに関して、すべての組み合わせを調べた。
検定は、ハプロタイプいずれかが他のハプロタイプよりも罹患子孫により頻繁に伝達されるかどうかを決定した。疾患と有意な関連を示すSNPのハプロタイプがいくつかあった。S7でのハプロタイプGが、期待されるよりも、罹患子孫に伝達されることが観察された。上述のように、この観察の有意なレベルは、ブートストラッピング法を用いると0.00035である。
遺伝子Seq−40のSNP S1およびS4の組み合わせに関して、4つのハプロタイプG−C、A−C、A−G、およびG−Gがある。ハプロタイプG−Cは、期待されるより多く、有意に罹患子孫に伝達され、そしてA−GおよびG−Gは期待されるより伝達されないことが観察された。G−Cハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.000023である。
遺伝子Seq−40のSNP S4およびS7の組み合わせに関して、4つのハプロタイプC−G、G−G、C−A、およびG−Aがある。ハプロタイプC−Gは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。C−Gハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.000079である。
遺伝子Seq−40のSNP S2およびS4の組み合わせに関して、4つのハプロタイプA−C、G−C、G−G、およびA−Gがある。ハプロタイプA−Cは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。A−Cハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.000906である。
遺伝子Seq−40のSNP S1およびS7の組み合わせに関して、4つのハプロタイプG−G、A−G、G−A、およびA−Aがある。ハプロタイプG−Gは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。G−Gハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.001689である。
遺伝子Seq−40のSNP S2、S4およびS8の組み合わせに関して、7つのハプロタイプA−C−T、A−C−G、G−C−T、G−C−G、G−G−T、G−G−GおよびA−G−Tがある。ハプロタイプA−C−Tは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると0.002552である。
遺伝子Seq−40のSNP S1、S2およびS4の組み合わせに関して、5つのハプロタイプG−A−C、A−G−C、G−G−C、A−G−G、およびG−A−Gがある。ハプロタイプG−A−Cは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。G−A−Cハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.001866である。
遺伝子Seq−40のSNP S2およびS7の組み合わせに関して、4つのハプロタイプA−G、G−G、G−A、およびA−Aがある。ハプロタイプA−Gは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。A−Gハプロタイプハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.00952である。
遺伝子Seq−40のSNP S1、S2およびS7の組み合わせに関して、6つのハプロタイプG−A−G、A−G−G、G−G−G、G−G−A、およびG−A−AおよびA−G−Aがある。ハプロタイプG−A−Gは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。G−A−Gハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.012351である。
遺伝子Seq−40のSNP S4、S7およびS8の組み合わせに関して、7つのハプロタイプC−G−T、C−G−G、G−G−T、C−A−G、およびG−G−GおよびG−A−G、およびC−A−Tがある。ハプロタイプC−G−Tは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。C−G−Tハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.032246である。
S4のハプロタイプCは、期待されるより多く罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると0.021611である。
遺伝子Seq−40のSNP S2、S7およびS8の組み合わせに関して、7つのハプロタイプA−G−T、G−G−T、G−G−T、A−G−G、およびG−G−GおよびG−A−G、G−A−TおよびA−A−Gがある。ハプロタイプA−G−Tは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。A−G−Tハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.094357である。
S1のハプロタイプGは、期待されるより多く罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると0.02835である。
遺伝子Seq−40のSNP S7およびS8の組み合わせに関して、4つのハプロタイプG−T、G−G、A−G、およびA−Tがある。ハプロタイプG−Tは、期待されるより多く、有意に罹患子孫に伝達されることが観察された。G−Tハプロタイプ伝達が観察される個別ハプロタイプ検定の有意なレベルは、ブートストラッピング法を用いると0.39975である。
S2のハプロタイプAは、期待されるより多く罹患子孫に伝達されることが観察された。この観察の有意なレベルは、ブートストラッピング法を用いると0.032905である。
表9にデータを示す。
表5
Figure 2005524383
Figure 2005524383
Figure 2005524383
上述のように、Transmitを用いて総合的検定のp値を計算した。個別ハプロタイプのp値もまた計算した。さらに、最も有意な遺伝子座(S1−S4およびS7)の総合的検定のp値を代替法によって解析している(上の表の括弧内に開示する結果)。
我々は、NIMH家系に関するNIMH表現型データ(疾患状態)に無関係なシミュレーション遺伝子型データを生成し、そしてTransmitを用いて該データを解析する(疾患とまったく関係がないSNP/SNP類の遺伝子型データを解析するのと同等)ことによってこれを行い、そしてTransmitが、この種のデータからのp値を過小評価する傾向がある可能性があることを確定した。この現象は、より大きいp値に関するより、非常に小さいp値に関して、より明確である。
簡潔には、ハーディ・ワインバーグ平衡およびメンデルの第一の法則(等しい分離)が有効であるという仮定のもとに、NIMHデータから推定した集団ハプロタイプ頻度を用いて、1万の家系に関してシミュレーション遺伝子型データを生成した。NIMH由来の表現型データおよび生成した遺伝子型を持つ各家系をTransmitによって解析し、そして結果を記録した。この過程は、統合失調症に関連しないゲノムにおいて、10,000の遺伝子を調べるのと類似である。Seq−40のS1−S4のハプロタイプに関して、Tranmitが報告するp値は、0.000367である。しかし、10,000の家系のうち12は、0.000367以下のp値を有する。理想的には、総合的検定のp値は、実験に基づくp値と等しいはずである。
p値の数値の意味は、単に偶然に得るよりも、それと同等か、またはそれより極端な結果を有する確率である。上記の実施例に関しては、0.000367以下のp値を有するには、10,000の家系から約3が観察される(10,000x0.000367=3.7)はずであるが、10,000から12が観察された。したがって、この代替法では、p値は0.0012であると報告される。同様に、S7ハプロタイプに関するp値は、同様の解析では、0.0044と報告される可能性がある。この現象は、より大きいp値よりも、非常に小さいp値に関して、より明確である。報告されるp値が約0.05である場合、実験に基づくp値は、0.05にかなり近く、したがって、他のハプロタイプに関するp値は、この絞込み解析によって、本質的に不変のままである。
D.統計的方法
一般的に、形質および遺伝子型が、統計的に有意な相関を示すかどうかを検定する、当該技術分野に知られるいかなる方法も、本発明の多型と形質を相関させるのに使用可能である。
1.連鎖解析における方法
連鎖解析に有用な統計的方法およびコンピュータプログラムが当業者に周知である(Terwilliger J.D.およびOtt J., Handbook of Human Genetic Linkage, John Hopkins University Press, ロンドン, 1994;Ott J., Analysis of Human Genetic Linkage, John Hopkins University Press, ボルチモア, 1991を参照されたい)。
2.集団におけるハプロタイプ頻度を推定する方法
上述のように、遺伝子型をスコア付けする際、ヘテロ接合体を区別することがしばしば不可能であり、したがって、ハプロタイプ頻度は容易には推測可能でない。配偶子相が未知である場合、ハプロタイプ頻度は、多遺伝子座遺伝子型データから推定可能である。当業者に知られるいかなる方法を用いて、ハプロタイプ頻度を推定することも可能である(Lange K., Mathematical and Statistical Methods for Genetic Analysis, Springer, ニューヨーク, 1997;Weir, B.S., Genetic data Analysis I:Methods for Discrete population genetic Data, Sinauer Assoc., Inc., 米国メリーランド州サンダーランド, 1996を参照されたい)。好ましくは、期待値最大化(EM)アルゴリズムを用いて、最大尤度ハプロタイプ頻度を計算する(Dempsterら, J R. Stat. Soc., 39B:1−38, 1997;Excoffier L.およびSlatkin M., Mol. Biol. Evol., 12(5):921−927, 1995を参照されたい)。この方法は、配偶子相が未知である際、多遺伝子座遺伝子型データからハプロタイプ頻度の最大尤度推定値を得ることを目的とした反復法である。ハプロタイプ推定は、通常、例えばEM−HAPLOプログラム(Hawley M.E.ら, Am. J Phys. Anthropol., 18:104, 1994)またはArlequinプログラム(Schneiderら, Arlequin:a software for population genetics data analysis, University of Geneva, 1997)を用いて、EMアルゴリズムを適用することによって、行われる。EMアルゴリズムは、推定のための一般化された反復最大尤度アプローチであり、そしてこのアルゴリズムを以下に簡潔に説明する。
本出願の以下の部分において、表現型は、未知の相の多遺伝子座遺伝子型を指すであろう。遺伝子型は、既知の相の多遺伝子座遺伝子型を指すであろう。
Kマーカーに関して、Nの関連しない個体のサンプルを型決定するとする。観察されるデータは、Fの異なる表現型に分類可能な、未知の相のK遺伝子座表現型である。根底にありうるHのハプロタイプがあるとする(Kの多型マーカーの場合、H=2)。表現型jに関して、cの遺伝子型がありうるとする。したがって、以下の等式を有する:
Figure 2005524383
(式中、Pは、表現型jの確率であり、hおよびhは遺伝子型iの2つのハプロタイプ構成要素である)。ハーディ・ワインバーグ平衡下では、pr(h,h)は
Figure 2005524383
となる。
E−Mアルゴリズムの続く工程は、以下のように記載可能である:
(0)、p(0)、・・・・・・・p (0)と記載される、ハプロタイプ頻度の最初の値から出発して、これらの最初の値が、遺伝子型頻度を推定するように働き(期待値工程)、そしてその後、p (1)、p(1)、・・・・・・・p (1)と記載される、ハプロタイプ頻度の別の組を推定し(最大化工程)、ハプロタイプ頻度の組の変化が、非常に小さくなるまで、これらの2つの工程を反復する。
停止規準は、2つの反復間のハプロタイプ頻度の最大相違が10−7未満であることであってもよい。これらの値は、推定の望ましい正確さに応じて、調整可能である。
詳細には、既定の反復sで、期待値工程は、以下の等式:
Figure 2005524383
(式中、遺伝子型Iは表現型jで生じ、そしてhおよびhは遺伝子型iを構成する)によって遺伝子型頻度を計算することからなる。各確率は、上述の等式1および等式2にしたがって得られる。
その後、最大化工程は、単純に、遺伝子型頻度が与えられた際の別の組のハプロタイプ頻度を推定する。このアプローチはまた、遺伝子計数法としても知られる(Smith, Ann. Hum. Genet., 21:254−276, 1957)。
Figure 2005524383
(式中、∂itは、遺伝子型iにおけるハプロタイプtの回数を計数する指標変数であり、0、1または2の値を取る。)
最終的に得た推定値が、最大尤度推定値であることを確かめるために、いくつかの値が離れていること(departure)が必要である。得た推定値を比較し、そして差があれば、最高の尤度に向かう推定値を取っておく。
3.マーカー間の連鎖不平衡を計算する方法
いくつかの方法を用いて、いずれか2つの遺伝子位間の連鎖不平衡を計算することが可能であり、実際は、集団から得たハプロタイプデータに対して、統計的関連検定を適用することによって、連鎖不平衡を測定する。ピアッツァの公式:Δaiaj=√04−√(04+03)(04+02):
(式中、04=Mでアレルaを持たず、そしてMでアレルaを持たない遺伝子型の−−頻度
03=Mでアレルaを持たず、そしてMでアレルaを持つ遺伝子型の−+頻度
02=Mでアレルaを持ち、そしてMでアレルaを持たない遺伝子型の+−頻度)
にしたがって、すべてのアレルの組み合わせ(a、a;a、b;b、aおよびb、b)に関して、マーカーMiでアレル(a/b)を、そしてマーカーMjでアレル(a/b)を有する、本発明の多型マーカー(M、M)の少なくとも1つを含む、多型マーカーのいかなる対の間の連鎖不平衡も計算可能である。Weir(Weir B.S., Genetic Data Analysis, Sinauer Ass.監修, 1996)に記載されるように、デルタ(複合遺伝子型不平衡係数)に関する最大尤度推定値(MLE)にしたがっても、すべてのアレル組み合わせ(a、a;a、b;b、aおよびb、b)に関して、多型マーカー(M、M)の対の間の連鎖不平衡(LD)を計算可能である。複合連鎖不平衡に関するMLEは:
aiaj=(2n,+n+n+n/2)/N−2(pr(a)・pr(a))
(式中、n1=Σ表現型(a/a、a/a)であり、n2=Σ表現型(a/a、a/b)であり、n3=Σ表現型(a/b、a/a)であり、n4=Σ表現型(a/b、a/b)であり、そしてNはサンプル中の個体数である)である。この公式は、ハプロタイプではなく、遺伝子型データのみが入手可能である際に、アレル間の連鎖不平衡を推定するのを可能にする。
マーカー間の連鎖不平衡を計算する別の手段は、以下のとおりである。ハーディ・ワインバーグ平衡に適合する、1対の多型マーカー、M(a)およびM(a)に関して、上述のアプローチにしたがって、既定の集団における4つのありうるハプロタイプ頻度を推定することが可能である。
aiおよびaj間の配偶子不平衡の推定は、単純に:
D’aiaj=pr(ハプロタイプ(a,a))−pr(a)−pr(a
(式中、pr(a)はアレルaの確率であり、そしてpr(a)はアレルaの確率であり、そしてpr(ハプロタイプ(a,a))は、上述の等式3におけるように推定される)である。1対の多型マーカーに関して、MおよびM間の関連を説明するのに、不平衡の1つの測定値のみが必要である。
その後、上記の値の規準化値を以下のように計算する:
D’aiaj=D’aiaj/最大値(−pr(a).pr(a),−pr(b).pr(b))、Daiaj<0の場合
D’aiaj=D’aiaj/最大値(pr(b).pr(a),pr(a).pr(b))、Daiaj>0の場合
当業者は、過度な実験を伴わずに、他のLD計算法を使用可能であることを容易に認識するであろう。適切なヘテロ接合性率を有する多型マーカーの組の中で、50〜1000の関連しない個体、好ましくは75〜200の関連しない個体、より好ましくは100前後の関連しない個体を遺伝子型決定することによって、連鎖不平衡を決定することが可能である。
4.関連に関する検定
当該技術分野に知られる統計検定いずれかによって、そして必要とされる統計的有意性の認められる閾値いずれかを用いて、表現型および遺伝子型の間の相関の統計的有意性を決定する方法を決定することが可能であり、この場合、遺伝子型は、多型マーカーでのアレルまたはこうしたアレルで構成されるハプロタイプである。特定の方法および有意性の閾値の適用は、一般の当業者の技術の範囲内である。
ケース集団およびコントロール集団において、多型マーカーアレルの頻度を決定し、そして研究中の形質および多型マーカーアレル間の相関を示すであろう、統計的に有意な頻度の相違があるかどうかを決定する、統計検定を用いて、これらの頻度を比較することによって、関連に関する検定を行う。同様に、ケース集団およびコントロール集団において、既定の組の多型マーカーのすべてのありうるハプロタイプ頻度を推定し、そして研究中のハプロタイプおよび表現型(形質)間に統計的に有意な相関があるかどうかを決定する、統計検定を用いて、これらの頻度を比較することによって、ハプロタイプ解析を行う。遺伝子型および表現型間の統計的に有意な関連に関して検定するのに有用ないかなる統計ツールも使用可能である。好ましくは、使用する統計検定は、1度の自由度を持つカイ検定である。P値を計算する(P値は、観察されたものと同程度に大きいか、またはそれより大きい統計値が偶然生じるであろう確率である)。
統計的有意性
好ましい態様において、さらなる診断試験のための陽性の基礎として、または初期防御療法のための予備的な出発点としての、診断目的のための有意性である、多型マーカー関連に関連するp値は、好ましくは、単一多型マーカー解析に関しては、好ましくは約1x10−2以下、より好ましくは約1x10−4以下であり、そしていくつかのマーカーを伴うハプロタイプ解析に関しては、約1x10−3以下、より好ましくは1x10−6以下、そして最も好ましくは、約1x10−8以下である。これらの値は、単一マーカーまたは多数のマーカーの組み合わせを伴う関連研究いずれかに適用可能であると考えられる。
当業者は、本発明の多型マーカーを用いた関連研究を行うため、出発点として、上述の範囲の値を用いることが可能である。そうすることで、本発明の多型マーカーおよびCNS障害の間の有意な関連を明らかにすることが可能であり、そして診断目的および薬剤スクリーニング目的に使用することが可能である。
表現型に基づくパーミュテーション(phenotypic permutation)
上述の第一段階のハプロタイプ解析が統計的に有意であることを確認するため、ケース−コントロール個体由来の遺伝子型決定データをプールし、そして形質表現型に関してランダム化する、さらなる解析を行うことが適切である可能性がある。第一段階で得たデータを編集するために用いる、ケース−コントロール集団として、同数の個体を含有する2群に、各個別遺伝子型決定データをランダムに割り当てる。好ましくはこれらの人工的な群に対して、好ましくは最高の相対リスク係数を示す第一段階の解析のハプロタイプに含まれるマーカーに関して、第二段階のハプロタイプ解析を行う。この実験を、好ましくは、少なくとも100〜10000回の間で反復する。反復することによって、有意なp値レベルを持つ、得られたハプロタイプの割合を決定することが可能になる。
統計的関連の評価
偽陽性の問題に取り組むため、ランダムゲノム領域において、同一のケース−コントロール集団で、同様の解析を行うことが可能である。ランダム領域における結果および候補領域における結果を、WO 00/28080、表題“Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait”に記載されるように、比較する。
リスク要因の評価
リスク要因(遺伝子疫学では、リスク要因は、マーカー遺伝子座での特定のアレルまたはハプロタイプの存在または非存在である)および疾患の間の関連を、オッズ比(OR)によって、そして相対リスク(RR)によって測定する。P(R)が、個体がRで疾患を発症する確率であり、そしてP(R7)が、個体がリスク要因を持たない確率であるならば、相対リスクは、単に、2つの確率の比、すなわち:RR=P(R)/P(R)である。
ケース−コントロール研究では、サンプル抽出設計のため、相対リスクの直接の測定値は得ることが不可能である。しかし、オッズ比によって、低発生率疾患の相対リスクの優れた近似が可能になり、そしてオッズ比は以下のように計算可能である:
OR=[F+/(1−F)]/[F/(1−F)]
F+は、ケースにおいて、リスク要因に曝露される頻度であり、そしてFは、コントロールにおいてリスク要因に曝露される頻度である。研究のアレル頻度またはハプロタイプ頻度を用いて、F+およびFを計算し、そしてF+およびFはさらに、根底にある遺伝モデル(優性、劣性、相加的・・・)に応じる。
既定のリスク要因のために形質を示す、集団中の個々の比率を記載する、寄与リスク(AR)をさらに推定することが可能である。この測定値は、疾患病因における特定の因子の役割を定量化し、そしてリスク要因の公衆衛生への影響に関して定量化する際に重要である。この測定値の公衆衛生との関連は、問題の曝露が存在していなかったならば防御可能であった、集団中の疾患ケースの比率を推定することにある。ARは、以下のように決定される:
AR=P(RR−I)/(P(RR−I)+1)
ARは、多型マーカーアレルまたは多型マーカーハプロタイプに寄与しうるリスクである。PEは、全体的な集団内で、アレルまたはハプロタイプに曝露される頻度であり;そしてRRは、研究中の形質が全体的な集団で相対的に低い出現率を有する際、オッズ比を用いて推定される相対リスクである。
機能突然変異の同定
本発明の多型マーカーおよび統合失調症で、陽性の関連が確認されたため、選択した数の形質陽性個体および形質陰性個体の配列を比較することによって、突然変異に関して、Seq−40遺伝子をスキャンすることが可能である。好ましい態様において、突然変異に関して、候補遺伝子のエクソンおよびスプライシング部位などの機能領域、プロモーターおよび他の制御領域をスキャンする。好ましくは、形質陽性個体は、形質と関連することが示されたハプロタイプまたはアレルを所持し、そして形質陰性個体は、形質と関連するハプロタイプまたはアレルを所持しない。突然変異検出法は、多型部位同定に用いた方法と、本質的に同様である。
こうした突然変異を検出するのに用いる方法は、一般的に、以下の工程を含む:(a)形質陽性患者および形質陰性対照のDNA試料由来の、形質と関連する多型マーカーまたは多型マーカー群を含むSeq−40遺伝子領域の増幅;(b)増幅された領域の配列決定;(c)形質陽性患者および形質陰性対照由来のDNA配列の比較;および(d)形質陽性患者に特異的な突然変異の決定。工程(b)および(c)を含むサブコンビネーションが特に意図される。
その後、本明細書に記載するものなどの遺伝子型決定法いずれかにより、好ましくは、個々の試験形式で、微量配列決定技術を用いて、ケースおよびコントロールのより大きい集団をスクリーニングすることによって、候補多型を確証することが好ましい。期待される関連結果と適合した頻度で、ケースおよびコントロールに多型が存在する場合、多型を候補突然変異とみなす。
本発明の多型マーカーと統合失調症の関連
本発明の背景において、Seq−40中の本発明の多型マーカーアレルおよび統合失調症の間の関連を立証した。
多くの神経化学的知見が明らかになりつつあり、少なくとも特定のサブタイプに関して、こうした知見が統合失調症の生物学的基礎と関連付けられてきている。しかし、定義される、そして特定の統合失調症の表現型がなく、そして遺伝子解析に適したマーカーがないことが、統合失調症に関連する遺伝子を、信頼性をもって同定するには、大きな障害となっている。その結果、今日、精神科医は、直感および試行錯誤によって、抗統合失調症医薬品を選択しなければならず;この状況は、正しい化合物が選択されるまで、自殺する可能性がある患者を数週間または数ヶ月、危険にさらす可能性がある。明らかに、統合失調症に関与する遺伝子の同定に成功し;したがって研究者が統合失調症の病因を理解し、そして症状よりも原因に取り組むのを可能にする、強い必要性がある。
この情報は非常に価値がある。潜在的な遺伝的素因の知識は、この素因が絶対的でなくても、統合失調症患者の治療効力に、そして診断ツールの開発に、非常に有意な方式で寄与する可能性がある。
本発明が、前述の説明および実施例に詳細に記載されるのとは別の方式で、実施可能であることが明らかであろう。
上記の教示に鑑みて、本発明の多くの修飾および変動が可能であり、そしてしたがって、これらは本発明の範囲内にある。
本明細書に引用されるすべての刊行物の全開示が、本明細書に援用される。
多型の位置を示した、Seq−40遺伝子の構成。 統合失調症とともに有意に伝達される、いくつかのSeq−40ハプロタイプ。
【配列表】
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383
Figure 2005524383

Claims (102)

  1. 配列番号1の12〜200の隣接するヌクレオチドまたはその相補体からなる単離ポリヌクレオチドであって、194,601、1029、1038、1074、2106、2185、2359、2663および2796位の多型部位からなる群より選択される、少なくとも1つのSeq−40多型部位を含む、前記ポリヌクレオチド。
  2. 194位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、請求項1の単離ポリヌクレオチド。
  3. 請求項2の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  4. 601位のヌクレオチドが、ヌクレオチドAまたはGの群より選択される、請求項1の単離ポリヌクレオチド。
  5. 請求項4の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  6. 1029位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、請求項1の単離ポリヌクレオチド。
  7. 請求項6の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  8. 1038位のヌクレオチドが、ヌクレオチドCまたはGの群より選択される、請求項1の単離ポリヌクレオチド。
  9. 請求項8の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  10. 1074位のヌクレオチドが、ヌクレオチドAまたはCの群より選択される、請求項1の単離ポリヌクレオチド。
  11. 請求項10の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  12. 2106位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、請求項1の単離ポリヌクレオチド。
  13. 請求項12の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  14. 2185位のヌクレオチドが、ヌクレオチドGまたはAの群より選択される、請求項1の単離ポリヌクレオチド。
  15. 請求項14の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  16. 2359位のヌクレオチドが、ヌクレオチドTまたはGの群より選択される、請求項1の単離ポリヌクレオチド。
  17. 請求項16の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  18. 2663位のヌクレオチドが、ヌクレオチドCまたはGの群より選択される、請求項1の単離ポリヌクレオチド。
  19. 請求項18の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  20. 2796位のヌクレオチドが、ヌクレオチドAまたはGの群より選択される、請求項1の単離ポリヌクレオチド。
  21. 請求項20の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  22. 100ヌクレオチド未満である、請求項1の単離ポリヌクレオチド。
  23. 50ヌクレオチド未満である、請求項1の単離ポリヌクレオチド。
  24. 20ヌクレオチド未満である、請求項1の単離ポリヌクレオチド。
  25. 多型が、前記ポリヌクレオチド中央から4ヌクレオチド以内にある、請求項1の単離ポリヌクレオチド。
  26. 多型が、前記ポリヌクレオチド中央にある、請求項1の単離ポリヌクレオチド。
  27. 多型が、前記ポリヌクレオチドの末端にある、請求項1の単離ポリヌクレオチド。
  28. プローブである、請求項1の単離ポリヌクレオチド。
  29. プライマーである、請求項1の単離ポリヌクレオチド。
  30. 配列番号1の少なくとも12の隣接するヌクレオチドまたはその相補体を含む単離ポリヌクレオチドであって、194,601、1029、1038、1074、2106、2185、2359、2663および2796位のSeq−40多型部位からなる群より選択される、少なくとも1つのSeq−40多型部位を含み、単数または複数の前記Seq−40多型部位が、194位のA、601位のG、1029位のA、1038位のG、1074位のC、2106位のA、2185位のA、2359位のT、2663位のG、および2796位のAからなる群より選択される、少なくとも1つのアレルに占められている、前記ポリヌクレオチド。
  31. 194位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、194位がAによって占められている、請求項30記載の単離ポリヌクレオチド。
  32. 請求項31の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  33. 601位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、601位がGによって占められている、請求項30記載の単離ポリヌクレオチド。
  34. 請求項33の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  35. 1029位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、1029位がAによって占められている、請求項30記載の単離ポリヌクレオチド。
  36. 請求項35の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  37. 1038位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、1038位がGによって占められている、請求項30記載の単離ポリヌクレオチド。
  38. 請求項37の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  39. 1074位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、1074位がCによって占められている、請求項30記載の単離ポリヌクレオチド。
  40. 請求項39の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  41. 2106位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、2106位がAによって占められている、請求項30記載の単離ポリヌクレオチド。
  42. 請求項41の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  43. 2185位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、2185位がAによって占められている、請求項30記載の単離ポリヌクレオチド。
  44. 請求項43の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  45. 2359位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、2359位がTによって占められている、請求項30記載の単離ポリヌクレオチド。
  46. 請求項43の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  47. 2359位のヌクレオチドを含む、配列番号1の少なくとも12の隣接するヌクレオチドを含み、2359位がTによって占められている、請求項30記載の単離ポリヌクレオチド。
  48. 請求項47の単離ポリヌクレオチドの相補体である、単離ポリヌクレオチド。
  49. 診断目的または予後目的のため、個体由来の、Seq−40をコードする核酸分子またはその断片を分類する方法であって、
    配列番号1の194,601、1029、1038、1074、2106、2185、2359、2663および2796位の多型部位からなる群より選択される、少なくとも1つのSeq−40多型部位を占めるヌクレオチドに対応する、前記核酸由来のヌクレオチドの同一性を決定する
    ことを含む、前記方法。
  50. 決定する工程が、配列番号1またはその断片の194位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  51. 決定する工程が、配列番号1またはその断片の601位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  52. 決定する工程が、配列番号1またはその断片の1029位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  53. 決定する工程が、配列番号1またはその断片の1038位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  54. 決定する工程が、配列番号1またはその断片の1074位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  55. 決定する工程が、配列番号1またはその断片の2106位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  56. 決定する工程が、配列番号1またはその断片の2185位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  57. 決定する工程が、配列番号1またはその断片の2359位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  58. 決定する工程が、配列番号1またはその断片の2663位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  59. 決定する工程が、配列番号1またはその断片の2796位のヌクレオチドの同一性を決定することを含む、請求項49の方法。
  60. 決定する工程が、DNAの増幅を含む、請求項21の方法。
  61. 診断目的または予後目的で、個体におけるハプロタイプを決定する方法であって、
    単一染色体上の配列番号1の:
    (a)194および1038位
    (b)1038および2185位
    (c)601および1038位
    (d)194および2185位
    (e)601および1038および2359位
    (f)194および601および1038位
    (g)601および2185位
    (h)194および601および2185位
    (i)1038および2185および2359位
    (j)601および2185および2359位
    (k)2185および2359位
    (l)194および2185および2359位
    (m)2106および2185位
    の多型部位からなる群より選択される、1より多いSeq−40多型部位を占めるヌクレオチドに対応する、前記核酸由来のヌクレオチドを決定する
    ことを含む、前記方法。
  62. 決定する工程が、配列番号1またはその断片の194位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の1038位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  63. 決定する工程が、配列番号1またはその断片の1038位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2185位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  64. 決定する工程が、配列番号1またはその断片の601位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の1038位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  65. 決定する工程が、配列番号1またはその断片の194位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2185位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  66. 決定する工程が、配列番号1またはその断片の601位のヌクレオチドの同一性を決定し、配列番号1またはその断片の1038位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2359位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  67. 決定する工程が、配列番号1またはその断片の194位のヌクレオチドの同一性を決定し、配列番号1またはその断片の601位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の1038位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  68. 決定する工程が、配列番号1またはその断片の601位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2185位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  69. 決定する工程が、配列番号1またはその断片の194位のヌクレオチドの同一性を決定し、配列番号1またはその断片の601位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2185位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  70. 決定する工程が、配列番号1またはその断片の1038位のヌクレオチドの同一性を決定し、配列番号1またはその断片の2185位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2359位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  71. 決定する工程が、配列番号1またはその断片の601位のヌクレオチドの同一性を決定し、配列番号1またはその断片の2185位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2359位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  72. 決定する工程が、配列番号1またはその断片の2185位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2359位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  73. 決定する工程が、配列番号1またはその断片の194位のヌクレオチドの同一性を決定し、配列番号1またはその断片の2185位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2359位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  74. 決定する工程が、配列番号1またはその断片の2106位のヌクレオチドの同一性を決定し、そして配列番号1またはその断片の2185位のヌクレオチドの同一性を決定することを含む、請求項61の方法。
  75. 決定する工程が、DNAの増幅を含む、請求項61の方法。
  76. 決定する工程が、特定のアレルの多重PCR増幅を含む、請求項61の方法。
  77. 患者が統合失調症を発症する(develop)性向を評価する方法であって、
    単一染色体上の配列番号1の:
    (a)194および1038位
    (b)1038および2185位
    (c)601および1038位
    (d)194および2185位
    (e)601および1038および2359位
    (f)194および601および1038位
    (g)601および2185位
    (h)194および601および2185位
    (i)1038および2185および2359位
    (j)601および2185および2359位
    (k)2185および2359位
    (l)194および2185および2359位
    (m)2106および2185位
    の、1以上のSeq−40多型部位を占めるヌクレオチドに対応する、前記患者から得た核酸由来のヌクレオチドを決定し、そして
    患者が統合失調症を発症する性向を有するかどうかを評価する
    ことを含む、前記方法。
  78. 評価工程が、配列番号1またはその断片の194位のヌクレオチドの同一性がGであり、そして配列番号1またはその断片の1038位のヌクレオチドの同一性がCであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  79. 評価工程が、配列番号1またはその断片の1038位のヌクレオチドの同一性がCであり、そして配列番号1またはその断片の2185位のヌクレオチドの同一性がGであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  80. 評価工程が、配列番号1またはその断片の601位のヌクレオチドの同一性がAであり、そして配列番号1またはその断片の1038位のヌクレオチドの同一性がCであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  81. 評価工程が、配列番号1またはその断片の194位のヌクレオチドの同一性がGであり、そして配列番号1またはその断片の2185位のヌクレオチドの同一性がGであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  82. 評価工程が、配列番号1またはその断片の601位のヌクレオチドの同一性がAであり、配列番号1またはその断片の1038位のヌクレオチドの同一性がCであり、そして配列番号1またはその断片の2359位のヌクレオチドの同一性がTであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  83. 評価工程が、配列番号1またはその断片の194位のヌクレオチドの同一性がGであり、配列番号1またはその断片の601位のヌクレオチドの同一性がAであり、そして配列番号1またはその断片の1038位のヌクレオチドの同一性がCであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  84. 評価工程が、配列番号1またはその断片の601位のヌクレオチドの同一性がAであり、そして配列番号1またはその断片の2185位のヌクレオチドの同一性がGであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  85. 評価工程が、配列番号1またはその断片の194位のヌクレオチドの同一性がGであり、配列番号1またはその断片の601位のヌクレオチドの同一性がAであり、そして配列番号1またはその断片の2185位のヌクレオチドの同一性がGであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  86. 評価工程が、配列番号1またはその断片の1038位のヌクレオチドの同一性がCであり、配列番号1またはその断片の2185位のヌクレオチドの同一性がGであり、そして配列番号1またはその断片の2359位のヌクレオチドの同一性がTであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  87. 評価工程が、配列番号1またはその断片の601位のヌクレオチドの同一性がAであり、配列番号1またはその断片の2185位のヌクレオチドの同一性がGであり、そして配列番号1またはその断片の2359位のヌクレオチドの同一性がTであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  88. 評価工程が、配列番号1またはその断片の194位のヌクレオチドの同一性がGであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  89. 評価工程が、配列番号1またはその断片の2185位のヌクレオチドの同一性がGであり、そして配列番号1またはその断片の2359位のヌクレオチドの同一性がTであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  90. 評価工程が、配列番号1またはその断片の194位のヌクレオチドの同一性がGであり、配列番号1またはその断片の2185位のヌクレオチドの同一性がGであり、そして配列番号1またはその断片の2359位のヌクレオチドの同一性がTであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  91. 評価工程が、配列番号1またはその断片の2106位のヌクレオチドの同一性がGであり、そして配列番号1またはその断片の2185位のヌクレオチドの同一性がGであるならば、患者が統合失調症を発症する性向を有すると決定することを含む、請求項81の方法。
  92. Seq−40多型集団における頻度を決定する方法であって:
    a)請求項49の方法にしたがって、前記多型に関して、前記集団由来の個体の遺伝子型を決定し;そして
    b)前記集団における前記多型の比率提示を決定する
    ことを含む、前記方法。
  93. 集団において、多型マーカーの組に関して、ハプロタイプの頻度を推定する方法であって:
    a)194、601、1029、1038、1074、2106、2185、2359、2663および2796位の多型部位からなる群より選択される、少なくとも1つのSeq−40多型に関して、前記集団中の各個体の遺伝子型を決定し;
    b)ゲノムに存在する第二の多型マーカーの両コピーに関して、前記の第二の多型マーカーのヌクレオチドの同一性を決定することによって、前記の第二の多型マーカーに関して、前記集団中の各個体の遺伝子型を決定し;そして
    c)工程a)およびb)で決定したヌクレオチドの同一性に、ハプロタイプ決定法を適用して、前記頻度の推定値を得る
    ことを含む、前記方法。
  94. 前記ハプロタイプ決定法が、非対称PCR増幅、特定のアレルの多重PCR増幅、クラーク法、クレイトン法、または期待値最大化アルゴリズムからなる群より選択される、請求項98記載の方法。
  95. アレルおよび表現型間の関連を検出する方法であって:
    a)請求項96の方法にしたがって、形質陽性集団における、少なくとも1つのSeq−40多型の頻度を決定し;
    b)請求項96の方法にしたがって、対照集団における、前記Seq−40多型の頻度を決定し;そして
    c)前記アレルおよび前記表現型間に統計的に有意な関連が存在するかどうかを決定する
    工程を含む、前記方法。
  96. 前記表現型が統合失調症に作用する剤に対する反応である、請求項100記載の方法。
  97. 前記表現型が統合失調症に作用する剤に対する副作用である、請求項100記載の方法。
  98. 内蔵キットにおいて、小体積中に、Seq−40多型部位を占める単数または複数のヌクレオチドの同一性を決定するために必要な構成要素を含む、診断キット。
  99. 少なくとも1つの多型部位を含む、配列番号1またはその相補体の6〜800の隣接するヌクレオチドを含む、単離ポリヌクレオチドを含む、請求項103の診断キット。
  100. 多型部位を含む配列番号1のセグメントを増幅するのに使用するための単離ポリヌクレオチドを含む、請求項103の診断キット。
  101. (a)配列番号2のアミノ酸265位のバリンからイソロイシンを区別することが可能な、配列番号2のアミノ酸265位を含むエピトープに対する抗体;または
    (b)配列番号2のアミノ酸291位のシステインからチロシンを区別することが可能な、配列番号2のアミノ酸291位を含むエピトープに対する抗体
    からなる抗体群より選択される、抗体。
  102. 内蔵キットにおいて、小体積中に、請求項106の抗体を含む、診断キット。
JP2003525680A 2001-08-28 2002-08-28 統合失調症の診断に用いる一塩基多型 Withdrawn JP2005524383A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US31550102P 2001-08-28 2001-08-28
PCT/US2002/025950 WO2003020980A2 (en) 2001-08-28 2002-08-28 Single nucleotide polymorphisms diagnostic for schizophrenia

Publications (1)

Publication Number Publication Date
JP2005524383A true JP2005524383A (ja) 2005-08-18

Family

ID=35004139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003525680A Withdrawn JP2005524383A (ja) 2001-08-28 2002-08-28 統合失調症の診断に用いる一塩基多型

Country Status (1)

Country Link
JP (1) JP2005524383A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012505641A (ja) * 2008-10-20 2012-03-08 エフ.ホフマン−ラ ロシュ アーゲー 改善されたアレル−特異的増幅

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012505641A (ja) * 2008-10-20 2012-03-08 エフ.ホフマン−ラ ロシュ アーゲー 改善されたアレル−特異的増幅

Similar Documents

Publication Publication Date Title
JP2004537311A (ja) 摂食障害に関連する遺伝子およびsnp
AU2699901A (en) Biallelic markers derived from genomic regions carrying genes involved in central nervous system disorders
JP2004528847A (ja) 精神分裂症の一塩基多型診断
US20030170667A1 (en) Single nucleotide polymorphisms diagnostic for schizophrenia
JP2005524383A (ja) 統合失調症の診断に用いる一塩基多型
US20040115699A1 (en) Single nucleotide polymorphisms diagnostic for schizophrenia
EP1451349A2 (en) Biallelic markers of d-amino acid oxidase and uses thereof
JP2005537010A (ja) 精神分裂症の一塩基多型診断
KR101100323B1 (ko) Pcmt1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법
US20090305246A1 (en) Schizophrenia associated genes and markers
KR101167945B1 (ko) Atg16l1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
US20030170679A1 (en) Single nucleotide polymorphisms in GH-1
JP2004512842A (ja) インスリン遺伝子の5’隣接領域におけるアリル変異および体脂肪に基づく、インスリン非依存型糖尿病のリスク評価方法
KR101168737B1 (ko) Fanca 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법
AU2002338451A1 (en) Single nucleotide polymorphisms diagnostic for schizophrenia
KR101167940B1 (ko) Fmn2 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR101167942B1 (ko) Alg12 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR100841556B1 (ko) 단일염기다형을 포함하는 폴리뉴클레오티드 및 그를 포함하는 진단키트
KR101167934B1 (ko) Ticam1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 자폐 스펙트럼 장애 분석방법
KR101168734B1 (ko) Lamc1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법
KR100768685B1 (ko) 단일염기다형을 포함하는 폴리뉴클레오티드, 그를 포함하는마이크로어레이 및 진단키트, 및 그를 이용한 조기폐경진단방법
KR100909372B1 (ko) 단일염기다형을 포함하는 폴리뉴클레오티드를 이용한조기폐경 진단방법
KR101168735B1 (ko) Cyp19a1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법
KR101196239B1 (ko) Tg 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드를 포함하는 조기폐경 진단용 키트 및 이를 이용한 분석방법
WO2008093343A2 (en) Schizophrenia associated genes and markers

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070813