JP2012501181A

JP2012501181A - バイオマーカー・プロファイルを測定するためのシステムおよび方法

Info

Publication number: JP2012501181A
Application number: JP2011525187A
Authority: JP
Inventors: アントーニイェーフィク・イリーナ; タム・ジョーゼフ; アーティーミシン・ロマン; ジェラル・クリストフ・ペ・ジェ; ヴィスティセン・ヤン・バストホルム
Original assignee: ハー・ルンドベック・アクチエゼルスカベット
Priority date: 2008-08-27
Filing date: 2009-08-27
Publication date: 2012-01-19
Also published as: AU2009285766A1; CN102224256A; KR20110057188A; EP2318551A4; EA201071324A1; CA2728171A1; WO2010025216A9; EP2318551A1; WO2010025216A1; US20110172501A1; BRPI0914859A2

Abstract

本発明は、情動障害の患者を診断するための方法およびシステムに関する。本方法は、対象体の情動障害に対する感受性を予測するのにも有用である。

Description

本出願は、電子的形態で提出された配列表を含有しており、該配列表は、ファイル名が７１０２１−ＷＯ−ＰＣＴ＿ＳｅｑｕｅｎｃｅＬｉｓｔｉｎｇ＿ＳＴ２５．ｔｘｔであり、サイズが１４８，６５８バイトであり、２００９年８月２５日に作成された。該配列表は、参照によりその全体が本明細書に組み込まれる。

本発明は、対照対象の遺伝子のｍＲＮＡ発現レベルを罹患している対象のｍＲＮＡ発現レベルに対してプロファイリングおよび比較することにより、障害を患っている対象の転写プロファイルを同定する方法および組成物を提供する。本発明は、そのような対象のバイオマーカーと関連する転写プロファイルを決定することにより、情動障害など対象の障害を予測および診断するための方法および組成物をさらに提供する。

本出願の全体にわたって、種々の刊行物が、括弧内に引用することにより参照されている。これらの刊行物の開示は、本発明が関する技術水準についてより完全に記述するために、それらの全体が参照により本出願に組み込まれる。

現行の精神医学診断分類、特に情動障害用の診断分類には、明確な臨床的記述が欠如しており、ある診断実体を別の実体と区別して説明する生物学的特徴が含まれていない。今日の分類は、情動障害、例えば大うつ病性障害の臨床徴候をさらに特定することを可能にするが、その判断基準は依然として大きな論争の的であり、必ずしも生物学的な原理に基づいていない（Parkerら、Am. J. Psychiatry 2000年、157巻（8号）：1195〜1203頁（非特許文献１））。

情動障害には、重度対軽度または中等度うつ病、メランコリー型対非定型うつ病などの精神病性うつ病を含む双極性障害ＩおよびＩＩ、気分変調症ならびに大うつ病性障害などの多くの臨床区分が存在する。そのため、これらの区分に関する明確な生物学的マーカーまたはバイオマーカーは、記述されていない。さらに、特定の障害に関する区分が欠如していることは、治療に影響を及ぼす場合がある。さらに、共存症は、２つの障害の存在を区別して説明することができない医師にとって問題となる。

まとめると、精神医学における臨床評価および非特異的な臨床診断判断基準は、同様の生物学を共有する患者を認識するために生物学的マーカーの必要性を強調している。これは、情動障害に関する特定のジレンマと考えられる。なぜなら臨床的差異および明確な生物学的特徴を示すサブタイプが存在する根拠が出現しつつあるからである（GoldおよびChrousos、Mol. Psychiatry 2002年、7巻（3号）：254〜275頁（非特許文献２））。しかしながら、これまでのところ、情動障害に関して患者集団の区分を区別して説明することが一貫して示されている生物学的マーカーは存在しない。

以前の研究により、デキサメタゾン／副腎皮質刺激ホルモン放出ホルモン（ＤＥＸ／ＣＲＨ）検査など、対照の対象と比べたうつを罹患している対象の生物学的変化、または治療前後の対象の生物学的変化を測定する検査が研究されている。しかしながら、そのような検査は、少数の患者で検討されており、再現性がなく、および／または生物学的に読み取った情報を特定の表現型と関連させていない。（Ising, M.ら、Biol. Psychiatry、2006年、11月20日、出版前の電子出版（非特許文献３）；Kunugi, H.ら、Neuropsychopharm. 2006年、31巻（1号）：212〜20頁（非特許文献４））。臨床関連バイオマーカーは、特定の生物学および特定の表現型に関連付けられなければならず、理想的には、治療により正常レベルに復帰すべきであるため、これは妥当である。

糖尿病、アルツハイマー病、および癌についてのタンパク質バイオマーカーが同定されている。（例えば、米国特許第７，１２５，６６３号（特許文献１）、第７，０９７，９８９号（特許文献２）、第７，０７４，５７６号（特許文献３）、および第６，９２５，３８９号（特許文献４）を参照。）しかしながら、質量分析法および抗体に対する特異的結合などのタンパク質バイオマーカーを検出する方法は、再現不能なデータをもたらすことが多く、これらの方法は、ハイスループットでの使用に有利ではない。

マイクロアレイを使用するハイスループット発現分析法が、遺伝子発現の変化を評価するために使用されているが、入り混じった結果または無関係な結果をもたらしている（Brenner, S.ら、Nat Biotechnol. 2000年、18巻（6号）：597〜8頁（非特許文献５）；Schenaら、Science．1995年、270巻（5235号）：467〜70頁（非特許文献６）；Velculescu, V.E.ら、Science．1995年、270巻（5235号）：484〜7頁（非特許文献７））。対象の数に対して測定される遺伝子発現の比率が大きいため、抑うつ障害が異質性であることを考慮すると、マイクロアレイ・データでは多数の偽陽性が予測される。（総説は以下を参照、Iwamoto K、およびKato T.、Neuroscientist 2006年、12巻（4号）：349〜61頁（非特許文献８）；Bunney WEら、Am J Psychiatry 2003年、160巻（4号）：657〜66頁（非特許文献９）；ならびにIga J、Ueno S、およびOhmori T.、Ann Med 2008年、40巻（5号）：336〜42頁（非特許文献１０））。Sibilleら（Neuropsychopharm．2004年、29巻（2号）：351〜61頁（非特許文献１１））は大規模ゲノム解析を実施したが、うつ病および自殺に相関する分子的差異を立証する根拠が見つからず、うつ病に関連することが以前に見出されていた遺伝子の発現レベルの変化を再現することができなかった。このような問題のため、一貫したプロファイルは同定されていない。

複数の関連遺伝子のフォーカス・アレイ（focused array）およびｑＰＣＲを使用して、ストレス関連遺伝子が同定されているが、これらの研究は、うつ病に関連する診断プロファイルの同定に未だ至っていない（Rokutanら、J. Med. Invest．2005年、52巻（3〜4号）：137〜44頁（非特許文献１２）；Ohmoriら、J. Med. Invest．2005年、52巻（補巻）：266〜71頁（非特許文献１３））。ラット脳領域では、特定遺伝子の転写における変化が、気分および不安の制御に関与すると考えられているが、これらの変化はヒト血液試料とは相関しない（国際公開第２００７１０６６８５号Ａ２（特許文献５））。

米国特許第７，１２５，６６３号米国特許第７，０９７，９８９号米国特許第７，０７４，５７６号米国特許第６，９２５，３８９号国際公開第２００７１０６６８５号Ａ２国際公開第０３／０６１５６４号米国特許第５，９８１，１８０号国際出願第ＰＣＴ／ＵＳ８７／００８８０号米国特許出願公開第２００３／３０１３４３０７号Ａ１

Parkerら、Am. J. Psychiatry 2000年、157巻（8号）：1195〜1203頁 GoldおよびChrousos、Mol. Psychiatry 2002年、7巻（3号）：254〜275頁 Ising, M.ら、Biol. Psychiatry、2006年、11月20日、出版前の電子出版 Kunugi, H.ら、Neuropsychopharm. 2006年、31巻（1号）：212〜20頁 Brenner, S.ら、Nat Biotechnol. 2000年、18巻（6号）：597〜8頁 Schenaら、Science. 1995年、270巻（5235号）：467〜70頁 Velculescu, V.E. ら、Science. 1995年、270巻（5235号）：484〜7頁 Iwamoto K、およびKato T.、Neuroscientist 2006年、12巻（4号）：349〜61頁 Bunney WEら、Am J Psychiatry 2003年、160巻（4号）：657〜66頁 Iga J、Ueno S、およびOhmori T.、Ann Med 2008年、40巻（5号）：336〜42頁 Sibilleら、Neuropsychopharm. 2004年、29巻（2号）：351〜61頁 Rokutanら、J. Med. Invest. 2005年、52巻（3〜4号）：137〜44頁 Ohmoriら、J. Med. Invest. 2005年、52巻（補巻）：266〜71頁 Atkinson, A.J.ら、Biomarkers and Surrogate Endpoints： Preferred Definitions and Conceptual Framework, Clinical Pharm. & Therapeutics、2001年3月、69巻（3号）：89〜95頁 Draghici、2003年、Data Analysis Tools for DNA Microarrays、Chapman & Hall/CRC社 Lewin、2002年、Genes VII. Oxford University Press Inc.社、ニューヨーク市、ニューヨーク州 Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市 Lenoxら、2002年、American Journal of Medical Genetics （Neuropsychiatric Genetics）114巻：391〜406頁 Paul編、2003年、Fundamental Immunology、第5版、Raven Press社、ニューヨーク市、69〜105頁 Sambrookら、2001年、Molecular Cloning： A Laboratory Manual. 第3版、Cold Spring Harbor Laboratory Press （コールド・スプリング・ハーバー、ニューヨーク） Zouら、2002年、Oncogene 21巻：4855〜4862頁 Ausubelら、最新版、Current Protocols in Molecular Biology、Greene Publishing and Wiley-Interscience社、ニューヨーク市 Shenaら、1996年、Proc. Natl. Acad. Sci. U.S.A. 93巻：10614頁 Tijessen、1993年、Hybridization With Nucleic Acid Probes、Elsevier Science Publishers B.V.社 Kricka、1992年、Nonisotopic DNA Probe Techniques、Academic Press社、サンディエゴ市、カリフォルニア州 Draghici、Data Analysis Tools for DNA Microanalysis、2003年、CRC Press LLC社、ボーカラトーン、フロリダ州、342〜343頁 MullisおよびFaloona、1987年、Methods Enzymol. 155巻：335頁 Walkerら、1992年、PNAS 89巻：382〜396頁 Fujaら、2004年、Journal of Biotechnology 108巻：193〜205頁 HarlowおよびLane、1988年、Antibodies： A Laboratory Manual、Cold Spring Harbor Laboratory Press社（コールド・スプリング・ハーバー、ニューヨーク市） Gnanadesikan、1977年、Methods for Statistical Data Analysis of Multivariate Observations、ニューヨーク市：Wiley社、1977年 Breiman、1984年、Classification and Regression Trees、ベルモント、カリフォルニア州：Wadsworth International Group社 Tibshirani、1990年、Generalized Additive Models、ロンドン：Chapman and Hall社 Neal、1996年、Bayesian Learning for Neural Networks、ニューヨーク市：Springer-Verlag社 Insua、1998年、Feedforward neural networks for nonparametric regression In：Practical Nonparametric and Semiparametric Bayesian Statistics、181〜194頁、ニューヨーク市：Springer社 Harper、「Pyrolysis and GC in Polymer Analysis」、Dekker社、ニューヨーク市（1985年） Wagnerら、2002年、Anal. Chem. 74巻：1824〜1835頁 Brightら、2002年、J. Microbiol. Methods 48巻：127〜38頁 Dalluge、2000年、Fresenius J. Anal. Chem. 366巻：701〜711頁 Duda、2001年、Pattern Classification、John Wiley & Sons, Inc.社、ニューヨーク市、395〜396頁 Duda、2001年、Pattern Classification、John Wiley & Sons, Inc.社、ニューヨーク市、396〜408頁および411〜412頁 Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市、9章 Breiman、1999年、「Random Forests - Random Features」、Technical Report 567、Statistics Department、U.C.Berkeley、1999年9月 Duda、Pattern Classification、第2版、2001年、John Wiley & Sons, Inc社 Duda、2001年、Pattern Classification、John Wiley & Sons, Inc.社、ニューヨーク市、408〜409頁 Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市、283〜295頁 Mount、2001年、Bioinformatics： sequence and genome analysis、Cold Spring Harbor Laboratory Press社、コールド・スプリング・ハーバー、ニューヨーク市 Abdi、1994年、「A neural network primer」、J. Biol System. 2巻、247〜283頁 DudaおよびHart、Pattern Classification and Scene Analysis、1973年、John Wiley & Sons, Inc.社、ニューヨーク市、211〜256頁 Dudaら、Pattern Classification、第2版、John Wiley & Sons, Inc社、ニューヨーク市 KaufmanおよびRousseeuw、1990年、Finding Groups in Data： An Introduction to Cluster Analysis、Wiley社、ニューヨーク市、ニューヨーク州 Everitt、1993年、Cluster analysis （第3版）、Wiley社、ニューヨーク市、ニューヨーク州 Backer、1995年、Computer-Assisted Reasoning in Cluster Analysis、Prentice Hall社、アッパー・サドル・リバー、ニュージャージー州 CristianiniおよびShawe-Taylor、2000年、An Introduction to Support Vector Machines、Cambridge University Press社、ケンブリッジ市 Boserら、1992年、「A training algorithm for optimal margin classifiers」、in Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory、ACM Press社、ピッツバーグ、ペンシルベニア州、142〜152頁 Vapnik、1998年、Statistical Learning Theory、Wiley社、ニューヨーク市 Fureyら、2000年、Bioinformatics 16巻、906〜914頁 Tipping, M：Sparse Bayesian Learning and the Relevance Vector Machine、Journal of Machine Learning Research 1巻、2001年、211〜244頁 Deb, K：Multi-Objective Optimization using Evolutionary Algorithms、Wiley社、2001年 Breiman, L.、2001年、Machine Learning 45巻（1号）：5〜32頁 Cortes, C.およびVapnik, V.、1995年、Machine Learning、20巻（3号）：273〜97頁 Ersboll, B.K.およびConradsen, K.（2005年）An Introduction to Statistics. 第7版、IMM Draper, N.およびSmith, H.（1981年）Applied Regression Analysis、第2版、ニューヨーク市：John Wiley & Sons, Inc.社 James K.E.ら、2005年、Statistics in Medicine、24巻（19号）：3019〜35頁 Dettling, M.、2003年、Proceedings of the 3rdInternational Workshop on Distributed Statistical Computing、3月20〜22日、ウィーン、オーストリア、Hornick、Leisch、およびSeilis編 Friedman, J.、Hastie, T.、およびTibshirani, R. 2000年、Annals of Statistics 28巻（2号）：337〜407頁 V. N. Vapnik、Statistical Learning Theory、Wiley社、ニューヨーク市、1998年 Burnham, K. P.およびD. R. Anderson、2002年．Model Selection and Multimodel Inference： A Practical-Theoretic Approach、第2版、Springer-Verlag社 Devijver, P. A.およびJ. Kittler、1982年、Pattern Recognition： A Statistical Approach、Prentice-Hall社、ロンドン米国精神医学会により出版されたThe Diagnostic and Statistical Manual of Mental Disorders、第4版、改訂版（DSM-IV-TR（登録商標）（1994年10月、2000年5月改訂） Andersen, C. L.ら、Cancer Res、2004年、64巻：5245〜5250頁 Jin, P.ら、BMC Genomics、2004年、5巻：55頁 Huggett, J.ら、Genes and Immunity、2005年、6巻：279〜284頁 Vandesompele, J.ら、Genome Biol、2002年、3巻（7号）：RESEARCH0034.1-0034.11（電子出版 2002年6月18日） Applied Biosystems Application Note 2006年、publication 127AP08-01 Livak, K.およびSchmittgen, T.、Methods、2001年、25巻：402〜408頁 Liaw, A、およびWiener, M. 2002年、12月、Classification and regression by randomForest. R News Vol. 2/3：18〜22頁

本発明は、試験対象の情動障害を診断する方法であって、該試験対象のバイオマーカー・プロファイル中の複数のバイオマーカーの複数の特徴が、ある値セットを満たすかどうかを評価し、該値セットを満たすことが、前記情動障害を該試験対象が罹患していることを予測し、そして該複数の特徴が、該複数のバイオマーカーの測定可能な態様であり、該複数のバイオマーカーが、表１Ａに列挙されている少なくとも２つのバイオマーカーを含む方法を提供する。

本発明は、コンピュータ・プログラム製品も提供し、該コンピュータ・プログラム製品は、コンピュータ読み取り可能な記憶媒体およびそこに内蔵されているコンピュータ・プログラム・メカニズムを含み、該コンピュータ・プログラム・メカニズムは、本診断法を実行するためのインストラクションを含む。

本発明の１つの態様は、１つまたは複数のプロセッサおよび該１つまたは複数のプロセッサに接続されたメモリを含み、該メモリが本診断法を実行するためのインストラクションを格納しているコンピュータを提供する。

本発明の別の態様は、試験対象が情動障害の症状を示す可能性を決定する方法であって、該試験対象のバイオマーカー・プロファイル中の複数のバイオマーカーの複数の特徴が、ある値セットを満たすかどうかを評価し、該値セットを満たすことが、情動障害の症状を該試験対象が示す可能性を提供し、そして該複数の特徴が該複数のバイオマーカーの測定可能な態様であり、該複数のバイオマーカーが表１Ａに列挙されている少なくとも２つのバイオマーカーを含む方法を提供する。

別の態様では、本発明は、複数の対照対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルを提供する。例えば、本発明は、複数のうつ病対象、重度うつ病対象、または双極性対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルを提供する。本発明は、複数の境界性人格障害対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルをさらに提供する。本発明は、複数のＰＴＳＤ対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルも提供する。

本発明は、第１の複数の対照対象の集団的尺度を含む転写プロファイルが、例えばデータベースに格納されることも提供する。第２の複数の対象、例えば罹患対象の集団的尺度を含む転写プロファイルは、分類アルゴリズムを使用して、第１の複数の対照対象の転写プロファイルと比較される。分類アルゴリズムは、対象の各々を分類する出力を提供する。

本発明は、患者の転写プロファイルを同定することにより情動障害を診断する方法であって、そのような転写プロファイルを対照対象または対照対象群のプロファイルと比較し、それにより該転写プロファイルにおける変化の存在または非存在に基づいて該患者の情動障害を診断する方法を提供する。

本発明の１つの態様は、情動障害を罹患している対象を診断するための方法であって、
（ａ）複数の対照対象および複数の罹患対象から生体試料を取得すること、
（ｂ）該複数の対照対象および該複数の罹患対象の試料中の遺伝子のｍＲＮＡ発現レベルを測定し、該遺伝子が、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴおよびＶＭＡＴ２からなる群から選択されること、
（ｃ）該複数の対照対象および該複数の罹患対象に由来する各遺伝子のｍＲＮＡ発現レベルを収集し、コンピュータ媒体中のｍＲＮＡデータとして保存すること、
（ｄ）分類アルゴリズムにより、そのようなｍＲＮＡデータを処理すること、および
（ｅ）該対象を分類する出力データを提供すること、
を含み、
それにより、情動障害を罹患している対象を診断する方法を提供する。

本発明は、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴおよびＶＭＡＴ２からなる群から選択される遺伝子の対象の転写プロファイルを、複数の対照対象の遺伝子の転写プロファイルと比較することにより、情動障害に対する該対象の感受性を予測するための方法をさらに提供する。

本発明の１つの態様は、対象が情動障害の症状を示す可能性を予測するための方法であって、
（ａ）複数の対照対象および複数の罹患対象から生体試料を取得すること、
（ｂ）該複数の対照対象および該複数の罹患対象の試料中の遺伝子のｍＲＮＡ発現レベルを測定し、該遺伝子が、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴおよびＶＭＡＴ２からなる群から選択されること、
（ｃ）該複数の対照対象および該複数の罹患対象に由来する各遺伝子のｍＲＮＡ発現レベルを収集し、コンピュータ媒体中のｍＲＮＡデータとして保存すること、
（ｄ）分類アルゴリズムにより、そのようなｍＲＮＡデータを処理すること、および
（ｅ）該対象を分類する出力データを提供すること、
を含み、
それにより、該対象が情動障害の症状を示す可能性を予測する方法を提供する。

本発明の実施形態によるコンピュータ・システムの図解である。ｑＰＣＲ法により、ｃＤＮＡ１ｎｇ当たりのコピー数で測定された、対照対象対うつ病対象におけるＡＲＲＢ１（ベータ−アレスチン１）およびＧｉ２（グアニン・ヌクレオチド結合タンパク質アルファｉ２）の相対的ｍＲＮＡレベルをそれぞれ示す散布図である（ｐ＜０．００１；マン・ホイットニー検定）。ｑＰＣＲ法により、ｃＤＮＡ１ｎｇ当たりのコピー数で測定された、対照対象対うつ病対象におけるＭＡＰＫ１４（ｐ３８マイトジェン活性化プロテインキナーゼ１４）およびＯＤＣ１（オルニチンデカルボキシラーゼ１）の相対的ｍＲＮＡレベルをそれぞれ示す散布図である（ｐ＜０．００１；マン・ホイットニー検定）。ｑＰＣＲ法により、ｃＤＮＡ１ｎｇ当たりのコピー数で測定された、対照対象対重度うつ病対象におけるＥＲＫ１（細胞外シグナル制御キナーゼ１）、Ｇｉ２（グアニン・ヌクレオチド結合タンパク質アルファｉ２）、およびＭＡＰＫ１４（ｐ３８マイトジェン活性化プロテインキナーゼ１４）の相対的ｍＲＮＡレベルをそれぞれ示す散布図である（ｐ＜０．００１；マン・ホイットニー検定）。ｑＰＣＲ法により、ｃＤＮＡ１ｎｇ当たりのコピー数で測定された、対照対象対重度うつ病／双極性対象におけるＧｉ２（グアニン・ヌクレオチド結合タンパク質アルファｉ２）、ＧＲ（アルファ−グルココルチコイド受容体）、およびＭＡＰＫ１４（ｐ３８マイトジェン活性化プロテインキナーゼ１４）の相対的ｍＲＮＡレベルをそれぞれ示す散布図である（ｐ＜０．００１；マン・ホイットニー検定）。ｑＰＣＲ法により、ｃＤＮＡ１ｎｇ当たりのコピー数で測定された、対照対象対境界性人格障害対象におけるＧｉ２（グアニン・ヌクレオチド結合タンパク質アルファｉ２）、ＭＡＰＫ１４（ｐ３８マイトジェン活性化プロテインキナーゼ１４）、およびＭＲ（ミネラルコルチコイド受容体）の相対的ｍＲＮＡレベルをそれぞれ示す散布図である（ｐ＜０．００１；マン・ホイットニー検定）。ｑＰＣＲ法により、ｃＤＮＡ１ｎｇ当たりのコピー数で測定された、１９６人の対照対象対６６人の急性ＰＴＳＤ対象における、ＡＲＲＢ２（ベータ−アレスチン２）、ＥＲＫ２（細胞外シグナル制御キナーゼ２）、およびＲＧＳ２（Ｇタンパク質シグナル伝達の調節因子２）の相対的ｍＲＮＡレベルをそれぞれ示す散布図である（ｐ＜０．００１；マン・ホイットニー検定）。図８Ａは、うつ病対象対対照の分類において、遺伝子選択およびトレーニングの両方を実施し、９３％の正確度、ＰＰＶ＝９３％、およびＮＰＶ＝９４％をスコアするＳＬＲアルゴリズムの性能を図示する。ＲＦ遺伝子選択に先行するサポート・ベクター・マシン（ＳＶＭ）分類器（classifier）は、うつ病対象対対照の分類において、８８％の正確度、ＰＰＶ＝８９％、およびＮＰＶ＝８８％をスコアする。図８Ｂは、うつ病対象対対照の分類において、各方法の統計パラメーターに基づいて、ランダム・フォレスト法（ＲＦ）が表１Ａから１４個の遺伝子を選択し、段階的ロジスティック回帰法（ＳＬＲ）が表１Ａから１７個の遺伝子を選択することを示す。分類プロセスの選択ステップにおいてＲＦ法およびＳＬＲ法の両方により選択された重複遺伝子は、灰色で示されている。図９は、平均発現レベル（転写値）が重度うつ病患者と対照との間で有意に異なっていた（ｐ＜０．０５）遺伝子を示す。これら遺伝子は、表５Ａで見られるように、算出された−Ｌｏｇ（ｐ）値の大きさによりランク付けされている。図１０は、各対象のＥＲＫ１およびＭＡＰＫ１４からなる転写プロファイルによる、重度うつ病対象および対照対象の分布を表す。重度うつ病対象は、白抜きの円（○）により表されており、対照対象は、黒抜きの三角形（▲）により表されている。Ｘ軸およびＹ軸は、それぞれＥＲＫ１およびＭＡＰＫ１４に対する転写値（ｃＤＮＡ１ｎｇ当たりのコピー数）を示す。図１１は、各対象のＧｉ２およびＩＬ１ｂからなる転写プロファイルによる、重度うつ病対象および対照対象の分布を表す。重度うつ病対象は、白抜きの円（○）により表されており、対照対象は、黒抜きの三角形（▲）により表されている。Ｘ軸およびＹ軸は、それぞれＧｉ２およびＩＬ１ｂに対する転写値（ｃＤＮＡ１ｎｇ当たりのコピー数）を示す。図１２は、各対象のＥＲＫ１およびＩＬ１ｂからなる転写プロファイルによる、重度うつ病対象および対照対象の分布を表す。重度うつ病対象は、白抜きの円（○）により表されており、対照対象は、黒抜きの三角形（▲）により表されている。Ｘ軸およびＹ軸は、それぞれＥＲＫ１およびＩＬ１ｂに対する転写値（ｃＤＮＡ１ｎｇ当たりのコピー数）を示す。図１３は、各対象のＡＲＲＢ１およびＭＡＰＫ１４からなる転写プロファイルによる、重度うつ病対象および対照対象の分布を表す。重度うつ病対象は、白抜きの円（○）により表されており、対照対象は、黒抜きの三角形（▲）により表されている。Ｘ軸およびＹ軸は、それぞれＡＲＲＢ１およびＭＡＰＫ１４に対する転写値（ｃＤＮＡ１ｎｇ当たりのコピー数）を示す。

本発明は、バイオマーカー・プロファイル中のバイオマーカー特徴を評価することにより、迅速で正確な情動障害の診断を可能にする。これらバイオマーカー・プロファイルは、対象の生体試料から構築される。

５．１定義
本明細書で使用される場合、「情動障害」は、思考、感情、および挙動に影響を及ぼす、一貫した広範な気分の変化を特徴とする精神障害を意味するものとする。情動障害の例には、これらに限定されないが、抑うつ障害、不安障害、双極性障害、気分変調症、および統合失調感情障害が含まれる。不安障害には、これらに限定されないが、全般性不安障害、パニック障害、強迫性障害、恐怖症、および心的外傷後ストレス障害が含まれる。抑うつ障害には、これらに限定されないが、大うつ病性障害（ＭＤＤ）、緊張性うつ病、メランコリー型うつ病、非定型うつ病、精神病性うつ病、産後うつ病、双極性うつ病、および軽度、中等度もしくは重度うつ病が含まれる。人格障害には、これらに限定されないが、妄想性人格障害、反社会性人格障害および境界性人格障害が含まれる。

「バイオマーカー」は、生体試料中に存在するかまたは生体試料に由来する、タンパク質、ペプチド、プロテオグリカン、糖タンパク質、リポタンパク質、炭水化物、脂質、核酸（例えば、ｃＤＮＡもしくは増幅ＤＮＡなどのＤＮＡ、またはｍＲＮＡなどのＲＮＡ）、有機もしくは無機化学物質、天然もしくは合成高分子、低分子（例えば、代謝産物）、または先述のもののいずれかの特徴的分子もしくは特徴的断片などの、事実上あらゆる検出可能な化合物、あるいは正常な生物学的プロセス、病原性プロセス、または治療介入に対する薬理学的応答もしくはその兆候の指標として客観的に測定および評価される任意の他の特徴である。Atkinson, A.J.ら、Biomarkers and Surrogate Endpoints: Preferred Definitions and Conceptual Framework、Clinical Pharm. & Therapeutics、2001年3月；69巻（3号）：89〜95頁（非特許文献１４）を参照されたい。本状況で使用される場合、「〜に由来する」は、それが検出される場合、特定の分子が生体試料中に存在することを示す化合物を指す。例えば、特定のｃＤＮＡの検出は、生体試料中に特定のＲＮＡ転写物が存在することを示すことができる。別の例として、特定の抗体の検出または結合は、生体試料中に特定の抗原（例えば、タンパク質）が存在することを示すことができる。本明細書では、特徴的な分子または断片は、それが検出された場合、上記の特定された化合物の存在または含有量を示す分子または断片である。

バイオマーカーは、例えば、生体試料から単離されてもよく、または生体試料中で直接測定されてもよく、または生体試料に存在することを検出もしくは決定されてもよい。バイオマーカーは、例えば、機能的であってもよく、部分的に機能的であってもよく、または非機能的であってもよい。１つの実施形態では、バイオマーカーは単離され、例えば、様々な診断アッセイでのバイオマーカー検出を容易にすることができる特異的結合抗体を誘発するために使用される。任意のイムノアッセイは、バイオマーカー分子に結合可能な任意の抗体、抗体断片またはその誘導体（例えば、Ｆａｂ、Ｆ（ａｂ’）_２、Ｆｖ、またはｓｃＦｖ断片）を使用することができる。そのようなイムノアッセイは当技術分野で周知である。加えて、バイオマーカーがタンパク質またはその断片である場合、それを配列決定することができ、確立されている技術を使用して、そのコード遺伝子をクローニングすることができる。

本明細書で使用される場合、「バイオマーカーの種（ａｓｐｅｃｉｅｓｏｆａｂｉｏｍａｒｋｅｒ）」という用語は、本明細書に記述されている特定の遺伝子（例えば、下記の表１Ａに列挙されている遺伝子）のスプライス・バリアントなどの、本明細書に記述されているバイオマーカーの任意の特徴的部分または特徴的断片を指す。本明細書では、特徴的部分または特徴的断片は、それが検出された場合、上記の特定された転写物、ｃＤＮＡ、増幅核酸またはタンパク質の存在または含有量を示す分子の部分または断片である。

「バイオマーカー・プロファイル」は、バイオマーカーの測定可能な態様（例えば、含有量）などの特徴と共に、１つまたは複数のタイプのバイオマーカー（例えば、ｍＲＮＡ分子、ｃＤＮＡ分子、タンパク質および／もしくは炭水化物、またはその兆候など）を複数含んでいる。バイオマーカー・プロファイルは、そのようなバイオマーカーを少なくとも２つ含み、該バイオマーカーは、例えば、核酸および炭水化物など、同じ種類であってもよく、または異なる種類であってもよい。また、バイオマーカー・プロファイルは、少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５または１００またはそれ以上のバイオマーカーを含んでいてもよい。１つの実施形態では、バイオマーカー・プロファイルは、数百、または数千ものバイオマーカーを含んでいる。バイオマーカー・プロファイルは、１つまたは複数の対照または内部標準をさらに含むことができる。１つの実施形態では、バイオマーカー・プロファイルは、内部標準として機能する少なくとも１つのバイオマーカーを含む。「兆候」という用語は、本状況において本明細書で使用される場合、バイオマーカー・プロファイルが、核酸、ｍＲＮＡ分子、ｃＤＮＡ分子、タンパク質および／もしくは炭水化物、またはバイオマーカー分子体自体ではないバイオマーカーの任意の他の形態についての記号、データ、略語または他の同様の兆候を含有している状況を単に指す。例えば、本発明の例示的バイオマーカー・プロファイルは、表１Ａの遺伝子の名称を含む。

バイオマーカー・プロファイル中の各バイオマーカーは、対応する「特徴」を含んでいる。本明細書で使用される場合、「特徴」は、バイオマーカーの測定可能な態様を指す。特徴には、例えば、例示的バイオマーカー・プロファイル１に例示されているような、対象由来の生体試料中のバイオマーカーの存在または非存在を含むことができる。

例示的バイオマーカー・プロファイル１では、遺伝子Ａの転写物についての特徴値は「存在」であり、遺伝子Ｂの転写物についての特徴値は「非存在」である。

特徴は、例えば、例示的バイオマーカー・プロファイル２に例示されているような、対象由来の生体試料中のバイオマーカーの含有量を含むことができる。

例示的バイオマーカー・プロファイル２では、遺伝子Ａの転写物についての特徴値は３００単位であり、遺伝子Ｂの転写物についての特徴値は４００単位である。

また、特徴は、例示的バイオマーカー・プロファイル３に例示されているような、バイオマーカーの２つまたはそれ以上の測定可能な態様の比率であってもよい。

例示的バイオマーカー・プロファイル３では、遺伝子Ａの転写物についての特徴値および遺伝子Ｂの転写物についての特徴値は、０．７５（３００／４００）である。

いくつかの実施形態では、上記の例示的バイオマーカー・プロファイル１に例示されているように、バイオマーカー・プロファイル中の特徴とバイオマーカーとの間には一対一の対応が存在する。いくつかの実施形態では、上記の例示的バイオマーカー・プロファイル３に例示されているように、本発明のバイオマーカー・プロファイル中の特徴とバイオマーカーとの間の関係性は、より複雑である。

当業者であれば、特徴を計算する他の方法を考案することができ、そのような方法はすべて本発明の範囲内であることを認識するだろう。例えば、特徴は、２回またはそれ以上の時点で対象から収集された生体試料にわたるバイオマーカーの含有量の平均を表すことができる。さらに、特徴は、単一の時点で対象から得られた生体試料に由来する２つまたはそれ以上のバイオマーカーの含有量の差異または比率であってもよい。また、バイオマーカー・プロファイルは、少なくとも２、３、４、５、１０、２０、３０またはそれ以上の特徴を含んでいてもよい。１つの実施形態では、バイオマーカー・プロファイルは、数百、または数千もの特徴を含んでいる。

いくつかの実施形態では、バイオマーカーの特徴は、定量的ＰＣＲ（ｑＰＣＲ）を使用して測定される。遺伝子転写物の含有量を測定するｑＰＣＲの使用は周知である。いくつかの実施形態では、バイオマーカー特徴は、マイクロアレイを使用して測定される。マイクロアレイの構築および含有量データを取得するためにマイクロアレイを処理するのに用いられる技術は周知であり、例えば、Draghici、2003年、Data Analysis Tools for DNA Microarrays、Chapman & Hall/CRC社（非特許文献１５）および国際公開第０３／０６１５６４号（特許文献６）により記述されている。マイクロアレイは、複数のプローブを含む。いくつかの場合では、各プローブは、異なるバイオマーカーを認識、例えば結合する。いくつかの場合では、マイクロアレイの２つまたはそれ以上の異なるプローブは、同じバイオマーカーを認識、例えば結合する。したがって、典型的には、マイクロアレイのプローブ・スポットと対象バイオマーカーとの間の関係性は、２対１対応、３対１対応、または他のいくつかの形態の対応である。しかしながら、マイクロアレイのプローブとバイオマーカーとの間に、固有の一対一の対応が存在する場合があり得る。

本明細書で使用される場合、「相補的」という用語は、核酸配列（例えば本明細書に記述されている遺伝子をコードするヌクレオチド配列）の状況において、それらの水素結合特性の結果としての特定の窒素塩基間の化学親和性を指す。例えば、グアニン（Ｇ）はシトシン（Ｃ）とのみ水素結合を形成し、一方、アデニンは、ＤＮＡの場合チミン（Ｔ）とのみ水素結合を形成し、ＲＮＡの場合はウラシル（Ｕ）とのみ水素結合を形成する。これらの反応は、塩基対合と記述されており、対になった塩基（ＧとＣ、またはＡとＴ／Ｕ）は、相補的であると言われる。したがって、２つの核酸配列は、それらの窒素含有塩基が水素結合を形成することができる場合、相補的である可能性がある。そのような配列は、互いの「相補体」と呼ばれる。そのような相補体配列は、天然に存在してもよく、または例えばＤＮＡ分子またはＲＮＡ分子（例えば、ｍＲＮＡ転写物）のセンス鎖に相補的なアンチセンス核酸分子の場合のように、当業者に公知の任意の方法により化学的に合成することができる。例えば、Lewin、2002年、Genes VII．Oxford University Press Inc.社、ニューヨーク市、ニューヨーク州（非特許文献１６）を参照されたい。

本明細書で使用される場合、「データ分析アルゴリズム」とは、トレーニング集団中の対象のバイオマーカー・プロファイルを使用して判断ルールを構築するために使用されるアルゴリズムである。代表的なデータ分析アルゴリズムは、下記に記述されている。「判断ルール」は、データ分析アルゴリズムの最終産物であり、１つまたは複数の値セットを特徴とし、これらの値セットの各々は、情動障害の一態様、情動障害の発症、対象が情動障害になるという予測、または対象が情動障害の症状を示す可能性を示す。１つの特定の例では、値セットは、対象が情動障害を発症するだろうという予測を表す。別の例では、値セットは、対象が情動障害を発症しないだろうという予測を表す。

「判断ルール」は、バイオマーカー・プロファイルを評価するために使用される方法である。そのような判断ルールは、Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市（非特許文献１７）に例示されているように、当技術分野で公知の１つまたは複数の形態を取ることができる。判断ルールを、特徴のデータ・セットに対して実行するために使用し、とりわけ、情動障害の存在、または対象が情動障害の症状を示すか、もしくは有する可能性、または情動障害の発症に感受性を示す可能性を予測することができる。本発明のいくつかの実施形態で使用することができる例示的な判断ルールは、下記でさらに詳細に記述されている。

本明細書で使用される場合、「エンドフェノタイプ」という用語は、個体が症状を示しているかどうかに関わらず、疾病に関連するバイオマーカーなどの遺伝可能な特徴が存在することを意味するものとする。（総説は、Lenoxら、2002年、American Journal of Medical Genetics （Neuropsychiatric Genetics）114巻：391〜406頁（非特許文献１８）を参照されたい。）

本明細書で使用される場合、「遺伝子発現プロファイル」および「転写プロファイル」という用語は、選択された遺伝子のメッセンジャーリボ核酸（ｍＲＮＡ）レベルを相対的に測定することにより決定されるバイオマーカー・プロファイルである。転写プロファイルは、対象または患者の生体試料に由来する遺伝子の転写解析をすることにより測定される。

本明細書で使用される場合、「健常対照対象」、「健常対照」、および、「対照対象」は、大きな医学的または精神医学的問題を現在有していない対象を意味するものとするが、例えば頭痛を患っていてもよい。対照対象は、好ましくは、低いボディマス指数（ＢＭＩ、３０未満）を有しており、過去３カ月間に薬物を使用しておらず、ストレス・スコア、家族歴スコア、および症状スコアが低いかまたは０である。対照対象は、自己記入質問書により判明するような、精神疾患のあらゆる病歴、物質乱用のあらゆる病歴、精神疾患のあらゆる家族歴、あらゆる若年期ストレス要因、またはあらゆる最近のストレス要因を有していない場合がある。対照対象は、生体試料を取得する前に医師によりさらに評価されてもよいが、評価される必要はない。

「取得する」および「取得すること」という用語は、本明細書で使用される場合、それぞれ「所有に至る」または「所有に至ること」を意味する。これは、例えば、コンピュータ・システムの保存データからデータを取り出すことにより行うことができる。これはまた、例えば直接測定により行うことができる。

本明細書で使用される場合、「表現型」という用語は、対象の遺伝子型および環境の結果である測定可能および／または観察可能な生物学的特徴、臨床特徴または行動特徴を意味するものとする。

本明細書で使用される場合、「タンパク質」、「ペプチド」および「ポリペプチド」という用語は、別様の指定がない限り同義である。

本明細書で使用される場合、「ＰＴＳＤ対照対象」は、極端な心的外傷性ストレス要因にさらされておらず、あらゆる神経精神疾患に罹っていないと医師により評価された対象を意味するものとする。本発明のＰＴＳＤ対照対象は、一般的に一致した対象であり、例えば、同じ地理的地域からであり、障害を示す対象と同じ性別である。

本明細書で使用される場合、「特異的に」という用語および類似の用語は、抗体の状況では、抗原または断片に特異的に結合し、他の抗原または他の断片に特異的に結合しないペプチド、ポリペプチドおよび抗体またはその断片を指す。標準的実験技術により、例えば当業者に周知の任意のイムノアッセイにより判明するように、抗原に特異的に結合するペプチドまたはポリペプチドは、より低い親和性で他のペプチドまたはポリペプチドに結合する場合がある。そのようなイムノアッセイには、これらに限定されないが、ラジオイムノアッセイ（ＲＩＡ）および酵素結合免疫吸着アッセイ（ＥＬＩＳＡ）が含まれる。抗原に特異的に結合する抗体または断片は、関連抗原と交差反応する場合がある。好ましくは、抗原に特異的に結合する抗体またはそれらの断片は、他の抗原と交差反応しない。抗原−抗体相互作用、特異性および交差反応性に関する考察、ならびに上記のすべてを決定するための方法については、例えば、Paul編、2003年、Fundamental Immunology、第5版、Raven Press社、ニューヨーク市、69〜105頁（非特許文献１９）を参照されたい。

本明細書で使用される場合、「対象」は、動物であり、好ましくは哺乳動物であり、より好ましくは非ヒト霊長類であり、最も好ましくはヒトである。「対象」、「個体」、「候補」および「患者」という用語は、本明細書では同義的に使用される。いくつかの実施形態では、対象は動物である。他の実施形態では、対象は哺乳動物である。

本明細書で使用される場合、「試験対象」は、典型的には、判断ルールを構築するために使用されるトレーニング集団に存在しない任意の対象である。試験対象には、随意に、情動障害を罹患している疑いまたは情動障害を発症する可能性を有している疑いがあってもよい。

本明細書で使用される場合、「トレーニング集団」とは、データ分析アルゴリズムを使用して、情動障害の罹患リスクを有する対象のバイオマーカー・プロファイルを評価するための判断ルールを構築するために使用される対象の集団に由来する一組の試料である。好ましい実施形態では、トレーニング集団は、情動障害を罹患している対象および情動障害を罹患していない対象に由来する試料を含む。

本明細書中で使用される場合、「検証集団」とは、判断ルールの正確度または他の性能計量を決定するために使用される対象の集団に由来する一組の試料である。好ましい実施形態では、検証集団は、情動障害を罹患している対象および情動障害を罹患していない対象に由来する試料を含む。好ましい実施形態では、検証集団は、正確度または他の性能計量が求められる判断ルールをトレーニングするために使用されるトレーニング集団の一部である対象を含んでいない。

本明細書で使用される場合、「値セット」とは、バイオマーカー・プロファイル中の特徴についての値の組合せまたは値の範囲である。この値セットおよびその中の値の性質は、バイオマーカー・プロファイル中に存在する特徴のタイプ、および値セットを決定付ける判断ルールを構築するために使用されるデータ分析アルゴリズムに依存する。例示のために、例示的バイオマーカー・プロファイル２を再び取り上げる。

この例では、トレーニング集団の各メンバーのバイオマーカー・プロファイルが取得される。そのような各バイオマーカー・プロファイルは、測定された特徴、ここでは遺伝子Ａの転写物の含有量、および測定された特徴、ここでは遺伝子Ｂの転写物の含有量を含んでいる。これら特徴値、ここでは含有量値は、判断ルールを構築するためにデータ分析アルゴリズムにより使用される。この例では、データ分析アルゴリズムは、下記に記述されている決定木であり、このデータ分析アルゴリズムの最終産物、判断ルールは、決定木である。この判断ルールは、値セットを定義する。１つのそのような値セットは、情動障害を予測する。バイオマーカー特徴値がこの値セットを満たす対象は、情動障害を罹患している。この種類の例示的値セットは、例示的値セット１である。

別のそのような値セットは、情動障害ではない状態を予測する。バイオマーカー特徴値がこの値セットを満たす対象は、情動障害を罹患しているとは診断されない。この種類の例示的値セットは、例示的値セット２である。

データ分析アルゴリズムがニューラル・ネットワーク分析であり、このニューラル・ネットワーク分析の最終産物が、適切に加重されたニューラル・ネットワークである場合、１つの値セットは、対象が情動障害を罹患していることを加重ニューラル・ネットワークに示させることになるバイオマーカー・プロファイル特徴値の範囲である。別の値セットは、対象が情動障害を罹患していないことを加重ニューラル・ネットワークに示させることになるバイオマーカー・プロファイル特徴値の範囲である。

本明細書で使用される場合、マイクロアレイの状況での「プローブ・スポット」という用語は、試料中の特定の核酸の含有量を決定するために使用される、本明細書では「プローブ」と呼ばれる一本鎖ＤＮＡ分子（例えば、一本鎖ｃＤＮＡ分子または合成ＤＮＡオリゴマー）を指す。例えば、プローブ・スポットは、試験対象に由来する生体試料（例えば、細胞の収集物）中のｍＲＮＡレベルを決定するために使用することができる。特定の実施形態では、典型的なマイクロアレイは、グリッドにある既知位置のスライド・ガラス（または、他の基材）上に配置されている複数のプローブ・スポットを含む。各プローブ・スポットの核酸は、遺伝子の配列または目的の遺伝子の連続した一本鎖部分（例えば、１０量体、１１量体、１２量体、１３量体、１４量体、１５量体、１６量体、１７量体、１８量体、１９量体、２０量体、２１量体、２２量体、２３量体、２４量体、２５量体以上）であり、特定の遺伝子または目的の遺伝子によりコードされたｍＲＮＡに対するプローブである。各プローブ・スポットは単一の核酸配列を特徴とし、その相補的ＤＮＡ鎖またはｍＲＮＡ分子にのみそれをハイブリダイズさせる条件下でハイブリダイズされる。そのため、基材上に多くのプローブ・スポットが存在していてもよく、各々が固有の遺伝子または目的の配列を表していてもよい。加えて、２つまたはそれ以上のプローブ・スポットが同じ遺伝子配列を表していてもよい。いくつかの実施形態では、標識核酸試料は、プローブ・スポットにハイブリダイズされ、プローブ・スポットへ特異的にハイブリダイズされた標識核酸の量は、特定の生体試料中のその特定の核酸（例えば、特定の遺伝子のｍＲＮＡの転写物）のレベルを決定するために定量化することができる。プローブ、プローブ・スポット、およびマイクロアレイは、Draghici、2003年、Data Analysis Tools for DNA Microarrays、Chapman & Hall/CRC社（非特許文献１５）第2章に一般的に記述されている。

５．２対象をスクリーニングするための方法
本発明は、個体に由来する生体試料中に、情動障害を罹患している疑いのある試験個体のバイオマーカー・プロファイルの２つまたはそれ以上の特徴を検出することにより、情動障害の正確で迅速な予測および／または診断を可能にする。

本発明の特定の実施形態では、情動障害を罹患している疑いのある対象は、本発明の方法を使用してスクリーニングされる。これらの実施形態によると、本発明の方法は、例えば、精神科病棟に入院している対象および／またはある種の精神的トラウマを経験した対象をスクリーニングするために使用することができる。

特定の実施形態では、例えば血液などの生体試料が採取される。いくつかの実施形態では、生体試料は、血液、脳脊髄液、腹水、間質液、赤血球細胞、白血球細胞、または血小板である。白血球細胞（白血球）には、これらに限定されないが、好中球、好塩基球、好酸球、リンパ球、単球、およびマクロファージが含まれる。いくつかの実施形態では、生体試料は、全血のいくつかの成分である。１つの実施形態では、本発明は、ＲＮＡ安定化剤または保存剤を含有する使用準備済の収集チューブによる全血試料採取を使用する。このプロトコールは、適切な試料取扱い手順に従えば、ばらつきがほとんどないことが証明および保証されている。本発明は、大量の試料セットのハイスループット分析に使用することができる信頼性の高いロバストな転写マーカーを提供する。この信頼性の高い方法は、対照と患者とを区別することが示されている。いくつかの実施形態では、細胞画分内または血液の液体内（例えば、血漿または血清画分）のタンパク質、核酸、および／または他の分子（例えば、代謝産物）の混合物のある部分は、バイオマーカー・プロファイルとして分離される。これは、バイオマーカー・プロファイル中のバイオマーカーの特徴を測定することにより達成することができる。いくつかの実施形態では、生体試料は全血であるが、バイオマーカー・プロファイルは、全血から単離される白血球細胞で発現されるか、またはそうでなければ見出されるバイオマーカーから分離される。いくつかの実施形態では、生体試料は全血であるが、バイオマーカー・プロファイルは、全血から単離される赤血球細胞で発現されるか、またはそうでなければ見出されるバイオマーカーから分離される。

バイオマーカー・プロファイルは、少なくとも２つのバイオマーカーを含み、該バイオマーカーは、例えば、核酸および炭水化物など、同じ種類であってもよく、または異なる種類であってもよい。いくつかの実施形態では、バイオマーカー・プロファイルは、少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、９６、１００、１０５、１１０、１１５、１２０、１２５、１３０、１３５、１４０、１４５、１５０、１５５、１６０、１６５、１７０、１７５、１８０、１８５、１９０、１９５、または２００個またはそれ以上のバイオマーカーを含んでいる。１つの実施形態では、バイオマーカー・プロファイルは、数百、または数千ものバイオマーカーを含んでいる。いくつかの実施形態では、バイオマーカー・プロファイルは、少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、または５０個またはそれ以上のバイオマーカーを含んでいる。一例として、いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａから選択される、少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個またはそれ以上のバイオマーカーを含んでいる。

典型的な実施形態では、バイオマーカー・プロファイル中の各バイオマーカーは、ある特徴により表される。言いかえれば、バイオマーカーと特徴との間には対応性がある。いくつかの実施形態では、バイオマーカーと特徴との間の対応性は１：１であり、各バイオマーカーに対して、１つの特徴があることを意味している。いくつかの実施形態では、各バイオマーカーには複数の特徴がある。いくつかの実施形態では、バイオマーカー・プロファイル中にある１つのバイオマーカーに対応する特徴の数は、バイオマーカー・プロファイル中にある別のバイオマーカーに対応する特徴の数とは異なっている。そのため、いくつかの実施形態では、バイオマーカー・プロファイル中に、少なくとも２、３、４、５、６、または７つまたはそれ以上のバイオマーカーがある場合、バイオマーカー・プロファイルは、少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、９６、１００、１０５、１１０、１１５、１２０、１２５、１３０、１３５、１４０、１４５、１５０、１５５、１６０、１６５、１７０、１７５、１８０、１８５、１９０、１９５、または２００個またはそれ以上の特徴を含む場合がある。いくつかの実施形態では、バイオマーカー・プロファイルは、少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、または５０個またはそれ以上の特徴を含み得る。実施形態に関わらず、これら特徴は、任意の再現性のある測定技術または測定技術の組合せを使用することにより決定することができる。そのような技術には、本明細書中に記述されている任意の技術、または例えば下記の５．４節に開示されている任意の技術を含む、当技術分野で周知の技術が含まれる。典型的には、そのような技術は、単一の時点で対象から採取された生体試料、または複数の時点で採取された複数の試料を使用して、特徴値を測定するために使用される。１つの実施形態では、対象から採取された試料からバイオマーカー・プロファイルを取得するための例示的な技術は、ｃＤＮＡマイクロアレイである（例えば、下記の５．４．１．２節を参照）。別の実施形態では、対象から採取された試料からバイオマーカー・プロファイルを取得するための例示的な技術は、ＢＤサイトメトリ・ビーズアレイ（ＣＢＡ）ヒト炎症キットの取扱説明書（ＢＤＢｉｏｓｃｉｅｎｃｅｓ社）などに記載されている、タンパク質に基づくアッセイまたはタンパク質に基づく技術の他の形態または米国特許第５，９８１，１８０号（特許文献７）に記述されているビーズアッセイであり、それらの各々は、それらの全体が、特に生体試料中のタンパク質濃度をアッセイするための種々の方法の教示が、参照により本明細書に組み込まれる。さらに別の実施形態では、バイオマーカー・プロファイルは統合されており、これは、バイオマーカー・プロファイルが、核酸であるいくつかのバイオマーカーまたはそれらの徴候、およびタンパク質であるいくつかのバイオマーカーまたはそれらの兆候を含むことを意味する。そのような実施形態では、タンパク質に基づく技術および核酸に基づく技術を両方とも使用して、対象から採取された１つまたは複数の試料からバイオマーカー・プロファイルを取得する。言いかえれば、核酸であるバイオマーカー・プロファイル中のバイオマーカーと関連する特徴の特徴値は、核酸に基づく測定技術（例えば、核酸マイクロアレイ）により取得され、タンパク質であるバイオマーカー・プロファイル中のバイオマーカーと関連する特徴の特徴値は、タンパク質に基づく測定技術により取得される。いくつかの実施形態では、バイオマーカー・プロファイルは、下記の５．３節に記述されているキットなどのキットを使用して取得することができる。

５．３キット
本発明は、対象の情動障害を診断するのに有用なキットも提供する。いくつかの実施形態では、本発明のキットは、少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、９６、１００、１０５、１１０、１１５、１２０、１２５、１３０、１３５、１４０、１４５、１５０、１５５、１６０、１６５、１７０、１７５、１８０、１８５、１９０、１９５、または２００個またはそれ以上のバイオマーカー、および／またはそのようなバイオマーカーの存在もしくは含有量を検出するための試薬を含む。他の実施形態では、本発明のキットは、少なくとも２つのバイオマーカー、しかし数百またはそれ以上ものバイオマーカーを含む。いくつかの実施形態では、本発明のキットは、表１Ａから選択される少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個またはそれ以上のバイオマーカー、またはそのようなバイオマーカーの存在または含有量を検出するための試薬を含んでいる。５．１節に示されているバイオマーカーの定義によると、いくつかの場合では、バイオマーカーは、実際、例えば、遺伝子、ｍＲＮＡ、またはタンパク質自体ではなく、遺伝子、ｍＲＮＡ、またはタンパク質の特徴的分子である。したがって、バイオマーカーは、特定の遺伝子、ｍＲＮＡ、またはタンパク質自体ではなく、表１Ａで識別されている特定の遺伝子、ｍＲＮＡ、もしくはタンパク質、またはそれらの断片の存在または含有量を示す分子であってもよい。いくつかの実施形態では、本発明のキットは、少なくとも２つバイオマーカー、しかし数百またはそれ以上ものバイオマーカーを含む。いくつかの実施形態では、バイオマーカーおよび／またはバイオマーカーの存在または含有量を検出するための試薬の少なくとも２５パーセント、少なくとも３０パーセント、少なくとも３５パーセント、少なくとも４０パーセント、少なくとも６０パーセント、少なくとも８０パーセントは、表１Ａからのバイオマーカー、および／または表１Ａから選択されるバイオマーカーの存在または含有量を検出するための試薬から選択される。

本発明のキットのバイオマーカーは、本発明によるバイオマーカー・プロファイルを生成するために使用することができる。キットの化合物の種類の例には、これらに限定されないが、タンパク質およびそれらの断片、ペプチド、プロテオグリカン、糖タンパク質、リポタンパク質、炭水化物、脂質、核酸（例えば、ｃＤＮＡまたは増幅されたＤＮＡなどのＤＮＡ、またはｍＲＮＡなどのＲＮＡ）、有機または無機の化学薬品、天然または合成のポリマー、低分子（例えば、代謝産物）、または先述のもののいずれかの特徴的分子もしくは特徴的断片が含まれる。特定の実施形態では、バイオマーカーは、特定のサイズである（例えば、少なくとも１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１０５、１１０、１１５、１２０、１２５、１３０、１３５、１４０、１４５、１５０、１５５、１６０、１６５、１７０、１７５、１８０、１８５、１９０、１９５、２００、１０００、２０００、３０００、５０００、１０ｋ、２０ｋ、または１００ｋダルトンまたはそれ以上）。バイオマーカー（複数可）は、アレイの一部であってもよく、またはバイオマーカー（複数可）は、別々におよび／または個々に包装されていてもよい。またキットは、本発明のバイオマーカー・プロファイルを生成するために使用される少なくとも１つの内部標準を含んでいてもよい。同様に、内部標準または標準は、上記に記述されている種類の化合物のいずれであってもよい。

１つの実施形態では、本発明は、例えばマイクロアレイに見い出されるような、基材上のアドレス可能な位置に固定されていてもよくまたは固定されていなくてもよいプローブおよび／またはプライマーを含むキットを提供する。特定の実施形態では、本発明は、そのようなマイクロアレイを提供する。

本発明のいくつかの実施形態では、キットは、アプタマーなどの特異的バイオマーカー結合成分を含んでいてもよい。バイオマーカーが核酸を含む場合、キットは、バイオマーカーまたはバイオマーカーの相補鎖と二本鎖を形成可能なオリゴヌクレオチド・プローブを提供することができる。オリゴヌクレオチド・プローブは、検出可能に標識されていてもよい。そのような実施形態では、プローブはそれら自体が、本発明の範囲内にあるバイオマーカーである。

本発明のキットは、バイオマーカー・プロファイルを構築するのに使用することができる緩衝液などの追加的な組成物も含んでいてよい。微生物作用の予防は、種々の抗菌性および抗真菌物質、例えばパラベン、クロロブタノール、およびフェノール・ソルビン酸などを含有させることにより保証することができる。糖および塩化ナトリウムなどの等張剤を含むことが望ましい場合もある。

本発明のいくつかのキットは、マイクロアレイを含んでいる。１つの実施形態では、このマイクロアレイは、複数のプローブ・スポットを含み、複数のプローブ・スポットにある少なくとも２０パーセントのプローブ・スポットは、表１Ａのバイオマーカーに対応する。いくつかの実施形態では、複数のプローブ・スポットにあるプローブ・スポットの少なくとも２５パーセント、少なくとも３０パーセント、少なくとも３５パーセント、少なくとも４０パーセント、少なくとも６０パーセント、または少なくとも８０パーセントは、表１Ａのバイオマーカーおよび／または表１Ａのバイオマーカーの存在または含有量を検出するための試薬に対応する。そのようなプローブ・スポットは、本発明の範囲内のバイオマーカーである。いくつかの実施形態では、マイクロアレイは、基材上に約２〜約１００個のプローブ・スポットを含む。いくつかの実施形態では、マイクロアレイは、基材上に約２〜約１００個のプローブ・スポットを含む。本状況で使用される場合、「約」という用語は、記載値の５パーセント以内、記載値の１０パーセント内、または記載値の２５パーセント以内を意味する。いくつかの実施形態では、そのようなマイクロアレイは、当業者に公知の技術を使用するマイクロアレイ間較正または基準マイクロアレイなどの他のマイクロアレイによる較正のための１つまたは複数のプローブ・スポットを含有している。いくつかの実施形態では、そのようなマイクロアレイは、核酸マイクロアレイである。いくつかの実施形態では、そのようなマイクロアレイは、タンパク質マイクロアレイである。

本発明のいくつかのキットは、コンピュータ読み取り可能な記憶媒体に内蔵されているコンピュータ・プログラム機序を含むコンピュータ・プログラム製品として実装される。さらに、本発明の方法はいずれも、１つまたは複数のコンピュータまたは他の形態の装置に実装することができる。装置の例には、これらに限定されないが、コンピュータおよび分光法測定デバイス（例えば、マイクロアレイ・リーダまたはマイクロアレイ・スキャナー）が含まれる。さらになお、本発明の方法はいずれも、１つまたは複数のコンピュータ・プログラム製品に実装することができる。本発明のいくつかの実施形態は、本明細書で開示されている方法のいずれかまたはすべてをコードするコンピュータ・プログラム製品を提供する。そのような方法は、ＣＤ−ＲＯＭ、ＤＶＤ、磁気ディスク記憶媒体製品、または他の任意の実在するコンピュータ読み取り可能なデータもしくは実在するプログラム記憶媒体製品に格納することができる。そのような方法は、ＲＯＭ、１つまたは複数のプログラム可能なチップ、または１つもしくは複数の特定用途向け集積回路（ＡＳＩＣ）などの永久記録媒体に内蔵することができる。そのような永久記録媒体は、サーバ、８０２．１１アクセスポイント、８０２．１１無線ブリッジ／ステーション、中継器、ルーター、携帯電話、または他の電子機器に設置されていてもよい。コンピュータ・プログラム製品にコードされたそのような方法は、インターネットを介してまたは別様に、電子的に配布することもできる。

本発明のいくつかのキットは、本発明の方法のいずれかを個々にまたは集団的に実行する１つまたは複数のプログラムを含有するコンピュータ・プログラム製品を提供する。これらプログラム・モジュールは、ＣＤ−ＲＯＭ、ＤＶＤ、磁気ディスク記憶媒体製品、または他の任意の実在するコンピュータ読み取り可能なデータもしくは実在するプログラム記憶媒体製品に格納することができる。プログラム・モジュールは、ＲＯＭ、１つまたは複数のプログラム可能なチップ、または１つもしくは複数の特定用途向け集積回路（ＡＳＩＣ）などの永久記録媒体に内蔵することもできる。そのような永久記録媒体は、サーバ、８０２．１１アクセスポイント、８０２．１１無線ブリッジ／ステーション、中継器、ルーター、携帯電話、または他の電子機器に設置されていてもよい。コンピュータ・プログラム製品のソフトウェア・モジュールは、インターネットを介してまたは別様に、電子的に配布することもできる。

本発明のいくつかのキットは、１つまたは複数の処理装置を有するコンピュータ、および１つまたは複数の処理装置に接続されたメモリを含む。メモリは、情動障害罹患リスクのある試験対象のバイオマーカー・プロファイル中の複数の特徴が、値セットを満たしているかどうかを評価するための命令群を格納する。いくつかの実施形態では、値セットを満たすことにより、対象が情動障害を罹患していると診断する。いくつかの実施形態では、値セットを満たすことにより、対象が情動障害を罹患していないと診断される。１つの実施形態では、複数の特徴は、表１Ａに列挙されているバイオマーカーに対応する。

図１では、上記に記述されている機能性を支援する例示的なシステムが詳述されている。本システムは、好ましくは、以下のものを有するコンピュータ・システム１０である：
・中央処理装置２２；
・メイン不揮発性記憶媒体ユニット１４、例えばソフトウェアおよびデータを格納するためのハードディスク・ドライブ、記憶媒体コントローラ１２により制御される記憶媒体ユニット１４；
・不揮発性記憶媒体ユニット１４から読み込んだプログラムおよびデータを含むシステム・メモリ３６、好ましくは、システム・コントロール・プログラム、データ、およびアプリケーション・プログラムを格納するための高速ランダム・アクセス・メモリ（ＲＡＭ）；システム・メモリ３６は、読み出し専用メモリ（ＲＯＭ）を含むこともできる；
・１つまたは複数の入力デバイス（例えば、キーボード２８）およびディスプレイ２６または他の出力デバイスを含むユーザー・インターフェース３２；
・任意の有線または無線通信ネットワーク３４（例えば、インターネットなどの広域ネットワーク）に接続するためのネットワーク・インターフェース・カード２０；
・本システムの前述の要素を相互接続するための内部バス３０；および
・前述の要素に動力を供給する電源２４。

コンピュータ１０の作働は、主として、中央処理装置２２により実行されるオペレーティング・システム４０により制御される。オペレーティング・システム４０は、システム・メモリ３６に格納することができる。オペレーティング・システム４０に加えて、典型的な実装では、システム・メモリ３６は以下のものを含む：
・本発明により使用される種々のファイルおよびデータ構造へのアクセスを制御するためのファイル・システム４２；
・本発明による１つまたは複数の判断ルールの構築に使用されるトレーニング・データ・セット４４；
・トレーニング・データを処理し、判断ルールを構築するためのデータ分析アルゴリズム・モジュール５４；
・１つまたは複数の判断ルール５６；
・試験対象のバイオマーカー・プロファイル中の複数の特徴が、第１の値セットまたは第２の値セットを満たすかどうかを決定するためのバイオマーカー・プロファイル評価モジュール６０；
・バイオマーカー６４およびそのようなバイオマーカーの各々についての特徴６６を含む試験対象バイオマーカー・プロファイル６２；および
・本発明の選択バイオマーカー（例えば、表１Ａ）、および／またはそれら選択バイオマーカーの各々についての１つまたは複数の特徴に関するデータベース６８。

トレーニング・データセット４６は、複数の対象４６のデータを含む。各対象４６ごとに、対象識別子４８および複数のバイオマーカー５０が存在する。各バイオマーカー５０ごとに、少なくとも１つの特徴５２が存在する。図１には示されていないが、各特徴５２ごとに、特徴値が存在する。データ分析アルゴリズムを使用して構築された各判断ルール５６ごとに、少なくとも１つの判断ルール値セット５８が存在する。

図１に例示されているように、コンピュータ１０は、ソフトウェア・プログラム・モジュールおよびデータ構造を含む。コンピュータ１０に格納されるデータ構造は、トレーニング・データセット４４、判断ルール５６、試験対象バイオマーカー・プロファイル６２、およびバイオマーカー・データベース６８を含む。これらデータ構造の各々は、これらに限定されないが、単純なＡＳＣＩＩもしくはバイナリー・ファイル、Ｅｘｃｅｌスプレッドシート、リレーショナル・データベース（ＳＱＬ）、またはオンライン分析処理（ＯＬＡＰ）データベース（ＭＤＸおよび／またはその変法）を含む任意の形態のデータ保存システムを含んでいてもよい。いくつかの特定の実施形態では、そのようなデータ構造は各々、階層構造を含む１つまたは複数のデータベースの形態である（例えば、ｓｔａｒスキーマ（star schema））。いくつかの実施形態では、そのようなデータ構造は各々、明示的な階層を有していないデータベースの形態である（例えば、階層的に配置されていない次元表（dimension table））。

いくつかの実施形態では、システム１０に格納されているデータ構造またはシステム１０にアクセス可能なデータ構造の各々は、単一のデータ構造である。他の実施形態では、そのようなデータ構造は、実際に、同じコンピュータ１０によりホストされていてもよく、またはすべてがホストされていなくてもよい複数のデータ構造（例えば、データベース、ファイル、アーカイブ）を含む。例えば、いくつかの実施形態では、トレーニング・データセット４４は、コンピュータ１０および／または広域ネットワーク３４上にある、コンピュータ１０によりアドレス可能なコンピュータのいずれかに格納されている複数のＥｘｃｅｌスプレッドシートを含む。別の例では、トレーニング・データセット４４は、コンピュータ１０に格納されているか、または広域ネットワーク３４上にある、コンピュータ１０によりアドレス可能な１つまたは複数のコンピュータにわたって分配されているデータベースを含む。

図１に例示されている多くのモジュールおよびデータ構造は、１つまたは複数のリモート・コンピュータに配置することができることが理解されるだろう。例えば、本出願のいくつかの実施形態は、ウェブ・サービス型の実装である。そのような実施形態では、バイオマーカー・プロファイル評価モジュール６０および／または他のモジュールは、ネットワーク３４を介してコンピュータ１０と通信するクライアント・コンピュータに存在していてもよい。いくつかの実施形態では、例えば、バイオマーカー・プロファイル評価モジュール６０は、対話型のウェブ・ページであってもよい。

いくつかの実施形態では、図１に例示されているトレーニング・データセット４４、判断ルール５６、および／またはバイオマーカー・データベース６８は、単一のコンピュータ（コンピュータ１０）に存在しており、他の実施形態では、そのようなデータ構造およびモジュールの１つまたは複数は、１つまたは複数のリモート・コンピュータ（非表示）によりホストされている。１つまたは複数のコンピュータ上の図１に例示されているデータ構造およびソフトウェア・モジュールのあらゆる配置は、これらデータ構造およびソフトウェア・モジュールがネットワーク３４を介してまたは他の電子的手段により互いにアドレス可能である限り、本発明の範囲内にある。したがって、本発明は、多岐にわたるコンピュータ・システムを完全に包含する。

さらに、本発明の別の実施形態は、対象が情動障害を罹患しているかどうかを決定するためのグラフィカル・ユーザー・インターフェースを提供する。グラフィカル・ユーザー・インターフェースは、リモート・コンピュータから受信した搬送波に埋め込まれているデジタル信号にコードされている結果を表示するための表示領域を含む。複数の特徴は、複数のバイオマーカーの測定可能な態様である。複数のバイオマーカーは、表１Ａに列挙されている少なくとも２つのバイオマーカーを含む。試験対象のバイオマーカー・プロファイル中の複数の特徴が、第１の値セットを満たす場合、結果は第１の値を有する。試験対象のバイオマーカー・プロファイル中の複数の特徴が、第２の値セットを満たす場合、結果は第２の値を有する。

５．４バイオマーカー・プロファイルの生成
１つの実施形態によると、本発明の方法は、対象から採取した生体試料からバイオマーカー・プロファイルを生成することを含む。生体試料は、例えば、末梢組織、全血、脳脊髄液、腹水、間質液、赤血球細胞、白血球細胞、または血小板であってもよい。

５．４．１核酸バイオマーカーを検出する方法
本発明の特定の実施形態では、バイオマーカー・プロファイル中のバイオマーカーは核酸である。そのようなバイオマーカーおよびバイオマーカー・プロファイルの対応する特徴は、例えば、本明細書に記述されている１つまたは複数の遺伝子（例えば、表１Ａに列挙されている遺伝子）の発現産物（例えば、ポリヌクレオチドまたはポリペプチド）を検出することにより生成することができる。特定の実施形態では、バイオマーカー・プロファイル中のバイオマーカーおよび対応する特徴は、本明細書に開示されている遺伝子（例えば、表１Ａに列挙されている遺伝子）から発現される１つまたは複数の核酸を、決して限定ではないが、ハイブリダイゼーション、マイクロアレイ分析、ＲＴ−ＰＣＲ、ヌクレアーゼ保護アッセイ、およびノーザンブロット分析を含む当業者に周知である任意の方法を使用して、検出および／または分析することにより取得される。

ある実施形態では、本発明の方法および組成物により検出および／または分析される核酸には、例えば、メッセンジャーＲＮＡ（ｍＲＮＡ）分子、ｍＲＮＡスプライス・バリアントを含む発現されたＲＮＡ分子、および調節ＲＮＡ、ｃＲＮＡ分子（例えば、ｉｎｖｉｔｒｏで転写されるｃＤＮＡ分子から調製されるＲＮＡ分子）などのＲＮＡ分子、ならびにそれらの特徴的断片が含まれる。本発明の方法および組成物により検出および／または分析される核酸には、例えば、ゲノムＤＮＡ分子、ｃＤＮＡ分子などのＤＮＡ分子およびそれらの特徴的断片（例えば、オリゴヌクレオチド、ＥＳＴ、ＳＴＳなど）が含まれていてもよい。

本発明の方法および組成物により検出および／または分析される核酸分子は、試料から単離されるゲノムＤＮＡ分子またはゲノム外ＤＮＡ分子などの天然に存在する核酸分子、または生体試料に存在するか、生体試料から分離されるか、もしくは生体試料に由来するｍＲＮＡ分子などのＲＮＡ分子であってもよい。本発明の方法および組成物により検出および／または分析される核酸の試料は、例えば、ＤＮＡ、ＲＮＡ、またはＤＮＡおよびＲＮＡのコポリマーの分子を含む。一般的に、これら核酸は、特定の遺伝子または遺伝子の対立遺伝子に、または特定の遺伝子転写物に（例えば、特定の細胞タイプで発現される特定のｍＲＮＡ配列に、またはそのようなｍＲＮＡ配列に由来する特定のｃＤＮＡ配列に）対応する。本発明の方法および組成物により検出および／または分析される核酸は、同じ遺伝子の異なるエキソンに対応してもよく、例えば、その結果、その遺伝子の異なるスプライス・バリアントを検出および／または分析することができる。

特定の実施形態では、核酸は、生物学的試料に存在するか、または生物学的試料から分離されるか、または生物学的試料から部分的に分離される核酸からｉｎｖｉｔｒｏで調製される。例えば、１つの実施形態では、ＲＮＡは、試料（例えば、全細胞ＲＮＡ、ポリ（Ａ）^＋メッセンジャーＲＮＡ、それらの画分）から抽出され、メッセンジャーＲＮＡは、全抽出ＲＮＡから精製される。全ＲＮＡおよびポリ（Ａ）^＋ＲＮＡを調製するための方法は、当技術分野で周知であり、例えば、Sambrookら、2001年、Molecular Cloning: A Laboratory Manual. 第3版、Cold Spring Harbor Laboratory Press（コールド・スプリング・ハーバー、ニューヨーク）（非特許文献２０）で一般的に記述されている。

５．４．１．１核酸アレイ
本発明のある実施形態では、核酸アレイを使用して、本明細書に記述されている遺伝子（例えば、表１Ａに列挙されている遺伝子）の任意の１つまたは複数の発現を検出することにより、バイオマーカー・プロファイル中のバイオマーカーの特徴を生成する。本発明の１つの実施形態では、ｃＤＮＡマイクロアレイなどのマイクロアレイを使用して、バイオマーカー・プロファイル中のバイオマーカーの特徴値を決定する。ｃＤＮＡアレイの診断使用は、当技術分野で周知である。（例えば、Zouら、2002年、Oncogene 21巻：4855〜4862頁（非特許文献２１）；ならびにDraghici、2003年、Data Analysis Tools for DNA Microarrays、Chapman & Hall/CRC社（非特許文献１５）を参照）。ｃＤＮＡマイクロアレイ分析の例示的な方法は、下記に記述されている。

ある実施形態では、バイオマーカー・プロファイル中のバイオマーカーの特徴値は、生体試料に存在するｍＲＮＡ転写物の核酸配列を表すかまたは対応する、１つまたは複数のプローブ・スポットを含むマイクロアレイのアレイ検出可能標識核酸（例えば、試料から合成された蛍光標識ｃＤＮＡ）にハイブリダイズすることにより取得される。

核酸アレイ、例えばマイクロアレイは、多くの方法で製作することができ、それらのいくつかは本明細書で下記に記述されている。好ましくは、アレイは再現性が高く、所与のアレイの複数の複製を製作することが可能であり、前記マイクロアレイからの結果は互いに比較可能である。好ましくは、アレイは、結合（例えば、核酸ハイブリダイゼーション）条件下で安定的な物質から製作される。当業者であれば、アレイ上のプローブ・スポットに試験プローブをハイブリダイズさせるのに好適な支持物、基材、または担体について知るだろうし、または日常的な実験作業を使用することによりそれを確認することができるだろう。

使用されるアレイ、例えばマイクロアレイは、１つまたは複数の試験プローブを含むことができる。いくつかの実施形態では、そのような試験プローブの各々は、検出されるＲＮＡまたはＤＮＡのサブ配列に相補的な核酸配列を含む。各プローブは、典型的には異なる核酸配列を有しており、アレイの固体表面上の各プローブの位置は、通常は既知であるか、または決定することができる。本発明により有用なアレイには、例えば、オリゴヌクレオチド・マイクロアレイ、ｃＤＮＡに基づくアレイ、ＳＮＰアレイ、スプライス・バリアント・アレイ、および本明細書に記述されている遺伝子（例えば、表１Ａに列挙されている遺伝子）発現の定性的、定量的、または半定量的測定を提供することができる任意の他のアレイが含まれていてもよい。いくつかのタイプのマイクロアレイは、アドレス可能なアレイである。より具体的には、いくつかのマイクロアレイは、位置的にアドレス可能なアレイである。いくつかの実施形態では、アレイの各プローブは、固体支持体上の既知の所定位置に位置しており、そのため、各プローブの同一性（例えば配列）は、アレイ上（例えば、支持体上または表面上）のその位置から決定することができる。いくつかの実施形態では、アレイは、特注アレイである。マイクロアレイは、Draghici、2003年、Data Analysis Tools for DNA Microarrays、Chapman & Hall/CRC社（非特許文献１５）で一般的に記述されている。

本発明のいくつかの実施形態では、発現された転写物（例えば、本明細書に記述されている遺伝子の転写物）は、核酸アレイで表される。そのような実施形態では、一組の結合部位は、発現された転写物の様々な配列セグメントに相補的である様々な核酸を有するプローブを含むことができる。この種類に入る例示的な核酸は、長さが、１５〜２００個の塩基、２０〜１００個の塩基、２５〜５０個の塩基、４０〜６０個の塩基、または他のいくつかの範囲の塩基であってもよい。各プローブ配列は、その標的配列に相補的な配列に加えて、１つまたは複数のリンカー配列も含むことができる。本明細書で使用される場合、リンカー配列とは、その標的配列に相補的な配列と支持体表面との間の配列である。例えば、本発明の核酸アレイは、各標的遺伝子またはエキソンに特異的な１つのプローブを含むことができる。しかしながら、必要に応じて、核酸アレイは、いくつかの発現された転写物（例えば、本明細書、例えば表１Ａに記述されている遺伝子の転写物）に特異的な、少なくとも２、５、１０、１００、または１０００個またはそれ以上のプローブを含有することができる。例えば、アレイは、遺伝子の最長ｍＲＮＡアイソフォームの配列全体にわたって結合するプローブを含有していてもよい。

細胞、例えば生体試料中の細胞のＲＮＡに相補的なｃＤＮＡが製作され、好適なハイブリダイゼーション条件下でマイクロアレイにハイブリダイズされる場合、本明細書で記述されている遺伝子（例えば、表１Ａに列挙されている遺伝子）に対応するアレイ部位に対するハイブリダイゼーションのレベルは、その遺伝子から転写された１つまたは複数のｍＲＮＡの、細胞における出現率を反映することになることが理解されるだろう。あるいは、特定の遺伝子により産生される多数のアイソフォームまたは選択的スプライス・バリアントを識別しようとする場合、全細胞ｍＲＮＡに相補的な検出可能標識（例えば、フルオロフォア）ｃＤＮＡは、マイクロアレイにハイブリダイズすることができ、細胞において転写されないかまたはＲＮＡスプライシング中に除去される遺伝子のエキソンに対応するアレイ上の部位は、シグナル（例えば、蛍光シグナル）をほとんどまたはまったく示さず、エキソンを発現するコードされたｍＲＮＡが出現する遺伝子のエキソンに対応する部位は比較的強いシグナルを示す。その後、選択的スプライシングにより同一遺伝子から産生される様々なｍＲＮＡの相対的存在量は、その遺伝子についてモニターされるエキソンのセット全体にわたる信号シグナルのパターンにより決定される。

１つの実施形態では、異なるハイブリダイゼーション時間でのハイブリダイゼーション・レベルが、別々の同一マイクロアレイで別々に測定される。そのような測定の各々ついて、ハイブリダイゼーション・レベルが測定されるハイブリダイゼーション時間で、好ましくは、結合またはハイブリダイズされた核酸はすべて保持されるが、未結合核酸はすべて除去される条件化で、高濃度から中程度濃度の塩濃度（例えば、０．５〜３Ｍの塩濃度）の水溶液中、室温で、マイクロアレイを短時間洗浄する。その後、各プローブ上の残留ハイブリダイズ核酸分子の検出可能な標識を、使用されている特定の標識法に適切な方法により測定する。その後、その結果生じたハイブリダイゼーション・レベルを組み合わせて、ハイブリダイゼーション曲線を形成する。別の実施形態では、ハイブリダイゼーション・レベルは、単一のマイクロアレイを使用してリアルタイムで測定される。この実施形態では、マイクロアレイを継続的に試料とハイブリダイズさせ、非侵襲性の様式でマイクロアレイを各ハイブリダイゼーション時間で検査する。さらに別の実施形態では、１つのアレイを使用し、短時間ハイブリダイズさせ、洗浄し、ハイブリダイゼーション・レベルを測定し、同じ試料に戻し、さらにある期間ハイブリダイズさせ、洗浄し、再び測定して、ハイブリダイゼーション時間曲線を得ることができる。

いくつかの実施形態では、核酸ハイブリダイゼーション条件および洗浄条件は、分析される核酸バイオマーカーが、典型的にはその相補的ＤＮＡが位置している特定のアレイ部位で、アレイの相補的核酸配列と特異的に結合または特異的にハイブリダイズするように選択される。

そこに位置している二本鎖プローブＤＮＡを含有するアレイを、標的核酸分子と接触させる前に、ＤＮＡを一本鎖にする変性条件に供してもよい。一本鎖プローブＤＮＡ（例えば、合成オリゴデオキシリボ核酸）を含有するアレイは、標的核酸分子と接触させる前に、例えば自己相補的配列により形成されるヘアピンまたは二量体を除去するために、変性させることが必要な場合がある。

最適なハイブリダイゼーション条件は、プローブおよび標的核酸の長さ（例えば、２００塩基を超えるオリゴマー対ポリヌクレオチド）およびタイプ（例えば、ＲＮＡまたはＤＮＡ）に依存するだろう。核酸に対する特異的な（つまり、ストリンジェントな）ハイブリダイゼーション条件の一般的なパラメーターは、Sambrookら（上記）（非特許文献２０）およびAusubelら、最新版、Current Protocols in Molecular Biology、Greene Publishing and Wiley-Interscience社、ニューヨーク市（非特許文献２２）に記述されている。ＳｈｅｎａらのｃＤＮＡマイクロアレイが使用される場合、典型的なハイブリダイゼーション条件は、０．２％ＳＤＳを加えた５×ＳＳＣ中６５℃で４時間のハイブリダイゼーション、その後低ストリンジェンシー洗浄緩衝液（０．２％ＳＤＳを加えた１×ＳＳＣ）中２５℃での洗浄、その後より高ストリンジェンシー洗浄緩衝液（０．２％ＳＤＳを加えた０．１×ＳＳＣ）中２５℃で１０分間である（Shenaら、1996年、Proc. Natl. Acad. Sci. U.S.A. 93巻：10614頁（非特許文献２３））。有用なハイブリダイゼーション条件は、例えば、Tijessen、1993年、Hybridization With Nucleic Acid Probes、Elsevier Science Publishers B.V.社（非特許文献２４）；Kricka、1992年、Nonisotopic DNA Probe Techniques、Academic Press社、サンディエゴ市、カリフォルニア州（非特許文献２５）；およびZouら、2002年、Oncogene 21巻：4855〜4862頁（非特許文献２１）；およびDraghici、Data Analysis Tools for DNA Microanalysis、2003年、CRC Press LLC社、ボーカラトーン、フロリダ州、342〜343頁（非特許文献２６）にも提供されている。

特定の実施形態では、マイクロアレイは、例えば、下記の５．４．１．２節に記述されている方法により生成されたＲＴ−ＰＣＲ産物を分類するために使用することができる。

５．４．１．２ＲＴ−ＰＣＲ
ある実施形態では、本発明のバイオマーカー・プロファイル中のバイオマーカーの特徴値を決定するために、本明細書に記述されている遺伝子（例えば、表１Ａに列挙されている遺伝子）の１つまたは複数の発現レベルを、逆転写（ＲＴ）をポリメラーゼ連鎖反応（ＰＣＲ）と組み合わせて使用して、試料からＲＮＡを増幅することにより測定する。この実施形態によると、逆転写は、定量的であってもよく、または半定量的であってもよい。本明細書で教示されているＲＴ−ＰＣＲ法は、上記で、例えば５．４．１．１節に記述されているマイクロアレイ法と共に使用することができる。例えば、バルクＰＣＲ反応を実施し、ＰＣＲ産物を分離し、マイクロアレイのプローブ・スポットとして使用することができる。

試料に由来する全ＲＮＡまたはｍＲＮＡをテンプレートとして使用し、遺伝子（複数可）の転写部分に特異的なプライマーを、逆転写を開始するために使用する。ＲＮＡをｃＤＮＡに逆転写する方法は周知であり、Sambrookら、2001年、上記（非特許文献２０）に記述されている。プライマー設計は、公開されているか、またはＧｅｎＢａｎｋなどの任意の公的に利用可能な配列データベースから入手可能である公知のヌクレオチド配列に基づいて達成することができる。例えば、プライマーは、本明細書に記述されている遺伝子（例えば、表１Ａ中を参照）のいずれのためにも設計することができる。さらに、プライマー設計は、市販のソフトウェア（例えば、ＰｒｉｍｅｒＤｅｓｉｇｎｅｒ１．０、ＳｃｉｅｎｔｉｆｉｃＳｏｆｔｗａｒｅ社など）を使用することにより達成することができる。逆転写産物は、その後ＰＣＲ用のテンプレートとして使用される。

ＰＣＲは、目的の標的配列を増幅する耐熱性のＤＮＡ依存性ＤＮＡポリメラーゼにより触媒される複数サイクルのＤＮＡ複製を使用することによって、迅速に特定の核酸配列を増幅するための方法を提供する。ＰＣＲには、増幅しようとする核酸、増幅しようとする配列を隣接する２つの一本鎖オリゴヌクレオチド・プライマー、ＤＮＡポリメラーゼ、デオキシリボヌクレオシド三リン酸、緩衝液、および塩の存在が必要である。ＰＣＲ法は当技術分野で周知である。ＰＣＲ、例えば、MullisおよびFaloona、1987年、Methods Enzymol. 155巻：335頁（非特許文献２７）に記述されているように実施される。

ＰＣＲは、テンプレートＤＮＡまたはｃＤＮＡ（少なくとも１ｆｇ；１〜１０００ｎｇがより有用である）および少なくとも２５ｐｍｏｌのオリゴヌクレオチド・プライマーを使用して実施することができる。典型的な反応混合物は、以下のものを含んでいる：２μｌのＤＮＡ、２５ｐｍｏｌのオリゴヌクレオチド・プライマー、２．５μｌの１０ＭＰＣＲ緩衝液１（ＰｅｒｋｉｎＥｌｍｅｒ社製、フォスターシティ、カリフォルニア州）、０．４μｌの１．２５ＭｄＮＴＰ、０．１５μｌ（または２．５ユニット）のＴａｑＤＮＡポリメラーゼ（ＰｅｒｋｉｎＥｌｍｅｒ社製、フォスターシティ、カリフォルニア州）、および全容積を２５μｌにするための脱イオン水。鉱油で被覆し、プログラム可能なサーマル・サイクラーを使用してＰＣＲを実施する。

ＰＣＲサイクルの各ステップの長さおよび温度ならびにサイクル数は、実際に必要とされるストリンジェンシーに従って調整される。アニーリング温度およびタイミングは、プライマーがテンプレートにアニーリングすると予測される効率、および許容することができるミスマッチの程度の両方により決定される。プライマー・アニーリング条件のストリンジェンシーを最適化する能力は、十分に当業者の知識内にある。３０℃〜７２℃の間のアニーリング温度が使用される。テンプレート分子の初期変性は、通常、９２℃〜９９℃、４分間で生じ、その後、変性（９４〜９９℃で１５秒〜１分間）、アニーリング（上記で考察されているようにして決定された温度；１〜２分間）、および伸張（７２℃で１分間）からなる２０〜４０サイクルが続く。最終伸張ステップは、一般的に７２℃で４分間実行され、その後無期限（０〜２４時間）４℃のステップを続けてもよい。

定量ＲＴ−ＰＣＲ（「ＱＲＴ−ＰＣＲ」）は、本来定量的であり、遺伝子発現レベルの定量的測定を提供するために実施することもできる。ＱＲＴ−ＰＣＲでは、逆転写およびＰＣＲを２段階で実施してもよく、ＰＣＲと組み合わせた逆転写を同時に実施してもよい。Ｔａｑｍａｎ（ＰｅｒｋｉｎＥｌｍｅｒ社製、フォスターシティ、カリフォルニア州）またはＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ社（フォスターシティ、カリフォルニア州）により提供されているものなどの市販キットの技術のうちの１つが、転写物特異的アンチセンス・プローブを用いて実施される。このプローブは、ＰＣＲ産物（例えば、遺伝子由来の核酸断片）に特異的であり、消光性および蛍光性リポーター・プローブをオリゴヌクレオチドの５’末端に複合体化させて調製される。異なる蛍光マーカーは、異なるリポーターに結合されており、１つの反応で２つの産物の測定を可能にする。ＴａｑＤＮＡポリメラーゼは、活性化されると、その５’−３’エキソヌクレアーゼ活性により、テンプレートに結合したプローブの蛍光リポーターを引き剥がす。消光体は今や存在せず、リポーターは蛍光を発する。リポーターの色変化は、各特異的産物の量に比例しており、蛍光光度計で測定される。このように、各色の量が測定され、ＰＣＲ産物が定量化される。ＰＣＲ反応は、多数の個体に由来する試料が同時に処理および測定されるように、９６ウエルプレートで実施される。Ｔａｑｍａｎ系は、ゲル電気泳動を必要としないという追加的な利点を有しており、標準曲線と共に使用される場合、定量化を可能にする。

ＰＣＲ産物を定量的に検出するのに有用な第２の技術は、市販のＱｕａｎｔｉＴｅｃｔＳＹＢＲＧｒｅｅｎＰＣＲ（Ｑｉａｇｅｎ社、バレンシア、カリフォルニア州）などの挿入染料（intercolating dye）を使用することである。ＲＴ−ＰＣＲは、ＰＣＲ段階中にＰＣＲ産物に組み込まれ、ＰＣＲ産物の量に比例した蛍光をもたらすＳＹＢＲＧｒｅｅｎを蛍光標識として使用して実施される。

ＴａｑｍａｎおよびＱｕａｎｔｉＴｅｃｔＳＹＢＲ系は両方とも、ＲＮＡの逆転写後に使用してもよい。逆転写は、ＰＣＲステップと同じ反応混合物中で実施されてもよく（一段階プロトコール）、または逆転写は、ＰＣＲを使用して増幅する前に最初に実施（二段階プロトコール）してもいずれでもよい。

加えて、蛍光分子および消光分子を有するプローブを使用するＭＯＬＥＣＵＬＡＲＢＥＡＣＯＮＳ（登録商標）を含む、ｍＲＮＡ発現産物を定量的に測定する他の系が知られており、このプローブは、ヘアピン構造を形成可能であり、ヘアピン形態時には蛍光分子が消光され、ハイブリダイズ時には蛍光増加が、遺伝子発現の定量的測定をもたらす。

ＲＮＡ発現を定量的に測定する追加的な技術には、これらに限定されないが、ポリメラーゼ連鎖反応、リガーゼ連鎖反応、Ｑベータレプリカーゼ（例えば、国際出願第ＰＣＴ／ＵＳ８７／００８８０号（特許文献８）を参照）、等温増幅法（例えば、Walkerら、1992年、PNAS 89巻：382〜396頁（非特許文献２８）を参照）、鎖置換増幅（ＳＤＡ）、修復連鎖反応（repair chain reaction）、非対称定量ＰＣＲ（例えば、米国特許出願公開第２００３／３０１３４３０７号Ａ１（特許文献９））、およびFujaら、2004年、Journal of Biotechnology 108巻：193〜205頁（非特許文献２９）に記述されている多重ミクロスフェアビーズアッセイ（multiplex microsphere bead assay）が含まれる。

５．４．２タンパク質を検出する方法
本発明の特定の実施形態では、バイオマーカー・プロファイル中のバイオマーカーの特徴値は、タンパク質を検出することにより、例えば、１つまたは複数の本明細書に記述されている遺伝子（例えば表１Ａに列挙されている遺伝子）の発現産物（例えば、核酸またはタンパク質）、またはそのようなタンパク質の翻訳後修飾された形態もしくは別様に修飾またはプロセシングされた形態を検出することにより取得することができる。特定の実施形態では、バイオマーカー・プロファイルは、これらに限定されないが、タンパク質マイクロアレイ分析法、免疫組織化学法、質量分析法を含む当業者に公知である任意のタンパク質検出法を使用して、本明細書で開示されている遺伝子（例えば、表１Ａに列挙されている遺伝子）から発現される１つまたは複数のタンパク質および／またはその特徴的断片を検出および／または分析することにより生成される。

標準的技術を使用して、試料中に存在する１つまたは複数の目的タンパク質（例えば、表１Ａに列挙されている遺伝子から発現されるタンパク質）の量を決定することができる。例えば、例えばウエスタンブロット、免疫沈降後のドデシル硫酸ナトリウムポリアクリルアミドゲル電気泳動法（ＳＤＳ−ＰＡＧＥ）、および免疫細胞化学法などの、例えばイムノアッセイを使用する標準的技術を使用して、試料中に存在する１つまたは複数の目的タンパク質の量を決定することができる。目的タンパク質を検出するための１つの例示的な作用剤は、目的タンパク質に特異的に結合可能な抗体、好ましくは直接的または間接的のいずれかで検出可能に標識された抗体である。

そのような検出法の場合、必要に応じて、分析される試料由来のタンパク質は、当業者に周知の技術を使用して容易に単離することができる。タンパク質単離法は、例えば、HarlowおよびLane、1988年、Antibodies: A Laboratory Manual、Cold Spring Harbor Laboratory Press社（コールド・スプリング・ハーバー、ニューヨーク市）（非特許文献３０）に記述されているものなどであり得る。

５．５データ分析アルゴリズム
その対応する特徴値が情動障害を診断可能であるバイオマーカーが、本発明で特定される。これらバイオマーカーの同一性およびそれらの対応する特徴（例えば、発現レベル）を使用して、情動障害を罹患している対象と罹患していない対象とを区別する１つの判断ルールまたは複数の判断ルールを開発することができる。これら例示的なデータ分析アルゴリズムまたは当技術分野で公知の他の技術を使用して判断ルールが構築されたならば、その判断ルールを使用して、試験対象を複数の表現型クラス（例えば、情動障害を罹患している、情動障害を罹患していない）のうちの１つに分類することができる。これは、試験対象から得られたバイオマーカー・プロファイルに、判断ルールを適用することにより達成される。したがって、そのような判断ルールは、診断指標として非常に大きな価値を有する。

本発明は、１つの態様の中では、トレーニング集団から得られるバイオマーカー・プロファイルに対して、試験対象からのバイオマーカー・プロファイルを評価することを提供する。いくつかの実施形態では、トレーニング集団中の対象ならびに試験対象から得られる各バイオマーカー・プロファイルは、複数の異なるバイオマーカーの各々の特徴を含む。いくつかの実施形態では、この比較は、（ｉ）トレーニング集団からのバイオマーカー・プロファイルを使用して判断ルールを開発し、（ｉｉ）判断ルールを試験対象からのバイオマーカー・プロファイルに適用することにより達成される。このように、本発明のいくつかの実施形態で適用される判断ルールを使用して、試験対象が情動障害を罹患しているかどうかを決定する。

本発明のいくつかの実施形態では、判断ルールを適用した結果が、対象が情動障害を罹患していることを示す場合、対象は「情動障害」対象と診断される。判断ルールを適用した結果が、対象が情動障害を罹患していないことを示す場合、対象は「非情動障害」対象と診断される。したがって、いくつかの実施形態では、上述の二分決定状況における結果は、４つの考え得る結果を示す：
（ｉ）真に情動障害を罹患している。この場合、判断ルールは、対象が情動障害を罹患していることを示し、対象は実際に情動障害を罹患している（真陽性、ＴＰ）；
（ｉｉ）偽に情動障害を罹患している。この場合、判断ルールは、対象が情動障害を罹患していることを示しているが、実際には対象は情動障害を罹患していない（偽陽性、ＦＰ）；
（ｉｉｉ）真に情動障害を罹患していない。この場合、判断ルールは、対象が情動障害を罹患していないことを示し、対象は実際に情動障害を罹患していない（真陰性、ＴＮ）；または
（ｉｖ）偽に情動障害を罹患していない。この場合、判断ルールは、対象が情動障害を罹患していないことを示し、対象は実際に情動障害を罹患している（偽陰性、ＦＮ）。

ＴＰ、ＦＰ、ＴＮ、ＦＮは、別様に定義することができることが理解されるだろう。そのような代替的定義はすべて本発明の範囲内にあるが、本発明の理解を容易にするために、別段の指示がない限り、上記（ｉ）〜（ｉｖ）の定義により与えられたＴＰ、ＦＰ、ＴＮ、ＦＮの定義が、本明細書で使用されるだろう。

当業者であれば理解するように、多くの定量的判断基準を使用して、試験バイオマーカー・プロファイルと基準バイオマーカー・プロファイルとの間でなされる比較（例えば、試験対象からのバイオマーカー・プロファイルに判断ルールを適用すること）の性能を関連させることができる。これらには、陽性予測値（ＰＰＶ）、陰性予測値（ＮＰＶ）、特異性、感受性、正確度、および確実性が含まれる。加えて、受信者動作曲線（ＲＯＣ）などの他の構成概念を使用して、判断ルールの性能を評価することができる。本明細書で使用される場合：

数式中、Ｎは、比較された試料の数（例えば、試験試料の数）である。例えば、情動障害の分類が求められている対象が１０人である場合を想定する。１０人の試験対象の各々のバイオマーカー・プロファイルが構築される。その後、バイオマーカー・プロファイルの各々は、判断ルールを適用することにより評価され、この判断ルールは、トレーニング集団から得られたバイオマーカー・プロファイルに基づいて開発された。この例では、上記の数式のＮは１０に等しい。典型的には、Ｎは試料の数であり、各試料は集団の異なるメンバーから収集された。この集団は、実際には、２つの異なるタイプであり得る。１つのタイプでは、集団は、判断ルールを構築または改善するために、その試料および表現型データ（例えば、バイオマーカーの特徴値および対象が情動障害を罹患しているかどうかの兆候）が使用された対象を含む。そのような集団は、本明細書ではトレーニング集団と呼ばれる。別のタイプでは、集団は、判断ルールを構築するためには使用されなかった対象を含む。そのような集団は、本明細書では検証集団と呼ばれる。別段の指示がない限り、Ｎにより表される集団は、２つの集団タイプの混合ではなく、排他的にトレーニング集団または排他的に検証集団のいずれかである。正確度などのスコアは、それらが検証集団ではなくトレーニング集団に基づく場合、より高いだろう（１により近い）と理解されよう。にも関わらず、本明細書では、別段の指示が明示的にない限り、確実性（正確度）を含む判断ルール（または試験対象からのバイオマーカー・プロファイルを評価する他の形態）の性能を評価するために使用される判断基準はすべて、トレーニング集団または検証集団のいずれかに、その判断基準に対応する判断ルールを適用することにより測定される判断基準を指す。さらに、上記で定義されているＰＰＶ、ＮＰＶ、特異性、感受性、および正確度の定義は、Draghici、Data Analysis Tools for DNA Microanalysis、2003年、CRC Press LLC社、ボーカラトーン、フロリダ州、342〜343頁（非特許文献２６）にも見出すことができる。

いくつかの実施形態では、Ｎは、１人を超えているか、５人を超えているか、１０人を超えているか、２０人を超えているか、１０から１００人の間であるか、１００人を超えているか、または１０００人未満の対象である。いくつかの実施形態では、判断ルール（または他の形態の比較）は、トレーニング集団または検証集団に対して、少なくとも約９９％、またはそれさえもを超える確実性を有することができる。他の実施形態では、確実性は、トレーニング集団または検証集団に対して（およびしたがって、臨床患者などの、トレーニング集団の一部でない単一の対象に対して）、少なくとも約９７％、少なくとも約９５％、少なくとも約９０％、少なくとも約８５％、少なくとも約８０％、少なくとも約７５％、少なくとも約７０％、少なくとも約６５％、または少なくとも約６０％である。有用な確実性の度合いは、本発明の特定の方法に依存して変動する場合がある。本明細書中で使用される場合、「確実性」は「正確度」を意味する。１つの実施形態では、感受性および／または特異性は、トレーニング集団または検証集団に対して、少なくとも約９７％、少なくとも約９５％、少なくとも約９０％、少なくとも約８５％、少なくとも約８０％、少なくとも約７５％、少なくとも約７０％である。いくつかの実施形態では、そのような判断ルールを使用して、定められた正確度で、対象が情動障害を罹患しているかどうかを予測する。いくつかの実施形態では、そのような判断ルールを使用して、定められた正確度で情動障害を診断する。いくつかの実施形態では、そのような判断ルールを使用して、定められた正確度で、対象が情動障害の症状を示す可能性を決定する。

適切な確実性で試験対象を分類するために判断ルールに使用することができる特徴の数は、２またはそれ以上である。いくつかの実施形態では、特徴の数は、３またはそれ以上、４またはそれ以上、１０またはそれ以上、または１０〜２００の間である。しかしながら、判断ルールに使用される特徴の数は、求められている確実性の度合いに応じて、より多くともまたはより少なくともよいが、すべての場合で少なくとも２である。１つの実施形態では、試験対象を分類するために判断ルールに使用することができる特徴の数は、高い確実性で試験対象の分類を可能にするために最適化される。

判断ルールを開発するための関連データ分析アルゴリズムには、これらに限定されないが、以下のものを含む判別分析が含まれる：線形、ロジスティック、およびより柔軟性のある判別分析（例えば、Gnanadesikan、1977年、Methods for Statistical Data Analysis of Multivariate Observations、ニューヨーク市：Wiley社、1977年（非特許文献３１）を参照）；分類回帰樹木（ＣＡＲＴ、classification and regression tree）および変法などの樹木に基づくアルゴリズム（例えば、Breiman、1984年、Classification and Regression Trees、ベルモント、カリフォルニア州：Wadsworth International Group社（非特許文献３２）を参照）；一般化加法モデル；（例えば、Tibshirani、1990年、Generalized Additive Models、ロンドン：Chapman and Hall社（非特許文献３３）を参照）；ならびにニューラル・ネットワーク（例えば、Neal、1996年、Bayesian Learning for Neural Networks、ニューヨーク市：Springer-Verlag社（非特許文献３４）；およびInsua、1998年、Feedforward neural networks for nonparametric regression In: Practical Nonparametric and Semiparametric Bayesian Statistics、181〜194頁、ニューヨーク市：Springer社（非特許文献３５）、ならびに下記の５．５．２節を参照）。

１つの実施形態では、試験対象のバイオマーカー・プロファイルと、トレーニング集団から取得されたバイオマーカー・プロファイルとの比較が実施され、比較は判断ルールを適用することを含む。判断ルールは、コンピュータ・パターン認識アルゴリズムなどのデータ分析アルゴリズムを使用して構築される。判断ルールの構築に好適な他のデータ分析アルゴリズムには、これらに限定されないが、特徴値の分布における相異を検出するロジスティック回帰アルゴリズムまたはノンパラメトリック・アルゴリズムが含まれる（例えば、ウィルコクソン符号付順位検定（未補正および補正））。判断ルールは、１、２、３、４、５、１０、または２０個またはそれ以上バイオマーカーからの測定された観察可能値に対応する２、３、４、５、１０、または２０個またはそれ以上の特徴に基づいていてもよい。１つの実施形態では、判断ルールは、数百個またはそれ以上の特徴に基づく。判断ルールは、分類木アルゴリズムを使用して構築することもできる。例えば、トレーニング集団からの各バイオマーカー・プロファイルは、少なくとも３つの特徴を含むことができ、特徴は分類木アルゴリズムの予測因子である（下記の５．５．１節を参照）。判断ルールは、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、または約１００％の正確度で、集団（または種類）内のメンバーシップを予測する。

好適なデータ分析アルゴリズムは、当技術分野で公知であり、それらのいくつかは、Hastieら、上記（非特許文献１７）で概説されている。特定の実施形態では、本発明のデータ分析アルゴリズムは、分類回帰樹木（ＣＡＲＴ；下記の５．５．１節）、多重加法型回帰木（ＭＡＲＴ、Multiple Additive Regression Tree）、マイクロアレイ予測解析（ＰＡＭ、Prediction Analysis for Microarrays）、またはランダム・フォレスト分析（下記の５．５．１節）を含む。そのようなアルゴリズムは、血液試料などの生体物質に由来する複雑なスペクトルを分類して、対象が、正常であるか、または特定の疾患状態に特徴的なバイオマーカー発現レベルを示すかを識別する。他の実施形態では、本発明のデータ分析アルゴリズムは、ＡＮＯＶＡおよびノンパラメトリックの等価的方法、線形判別分析、ロジスティック回帰分析、最近傍分類器解析（nearest neighbor classifier analysis）、ニューラル・ネットワーク（下記の５．５．２節）、主成分分析、二次判別分析、回帰分類器（regression classifier）およびサポート・ベクター・マシン（下記の５．５．４節）、関連ベクター・マシンおよび遺伝アルゴリズム（下記の５．５．５節）を含む。判断ルールを構築するために、および／または判断ルール適用の速度および効率を増加させるために、および研究者のバイアスを回避するために、そのようなアルゴリズムを使用することができるが、当業者であれば、本発明の方法を実行するためには、コンピュータに基づくアルゴリズムは必要ではないことを理解するだろう。

バイオマーカー・プロファイルを生成するために使用された方法に関わらず、判断ルールを使用して、バイオマーカー・プロファイルを評価することができる。例えば、バイオマーカー・プロファイルを評価するために使用することができる好適な判断ルールは、Harper、「Pyrolysis and GC in Polymer Analysis」、Dekker社、ニューヨーク市（1985年）（非特許文献３６）に考察されているように、ガスクロマトグラフィーを使用して生成される。さらに、Wagnerら、2002年、Anal. Chem. 74巻：1824〜1835頁（非特許文献３７）では、静的飛行時間型二次イオン質量分析法（ＴＯＦ−ＳＩＭＳ）により取得されたスペクトルに基づいて対象を分類する能力を向上させる判断ルールが開示されている。加えて、Brightら、2002年、J. Microbiol. Methods 48巻：127〜38頁（非特許文献３８）では、ＭＡＬＤＩ−ＴＯＦ−ＭＳスペクトルを解析することにより、高い確実性（７９〜８９％の正確な分類率）で細菌株を識別する方法が開示されている。Dalluge、2000年、Fresenius J. Anal. Chem. 366巻：701〜711頁（非特許文献３９）では、複雑な生体試料中のバイオマーカー・プロファイルを分類するための、ＭＡＬＤＩ−ＴＯＦ−ＭＳおよび液体クロマトグラフィー・エレクトロスプレー・イオン化質量分析法（ＬＣ／ＥＳＩ−ＭＳ）の使用について考察されている。

５．５．１決定木
本発明で特定されるバイオマーカーの特徴値を使用して構築することができる１つのタイプの判断ルールは、決定木である。本明細書では、最終「決定木」は判断ルールであるが、「データ分析アルゴリズム」は、決定木を構築することができる任意の技術である。決定木は、トレーニング集団および特定のデータ分析アルゴリズムを使用して構築される。決定木は、Duda、2001年、Pattern Classification、John Wiley & Sons, Inc.社、ニューヨーク市、395〜396頁（非特許文献４０）により一般的に記述されている。樹木に基づく方法は、特徴空間を一組の長方形に分割し、その後モデル（定数のような）をその各々にフィッティングする。

トレーニング集団データは、トレーニング・セット集団にわたって、本発明のバイオマーカーの特徴（例えば、発現値、またはいくつかの他の観察可能値）を含んでいる。決定木を構築するために使用することができる１つの特定のアルゴリズムは、分類回帰樹木（ＣＡＲＴ）である。他の特定の決定木アルゴリズムには、これらに限定されないが、ＩＤ３、Ｃ４．５、ＭＡＲＴ、およびランダム・フォレストが含まれる。ＣＡＲＴ、ＩＤ３、およびＣ４．５は、Duda、2001年、Pattern Classification、John Wiley & Sons, Inc.社、ニューヨーク市、396〜408頁および411〜412頁（非特許文献４１）に記述されている。ＣＡＲＴ、ＭＡＲＴ，およびＣ４．５は、Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市、9章（非特許文献４２）に記述されている。ランダム・フォレストは、Breiman、1999年、「Random Forests - Random Features」、Technical Report 567、Statistics Department、U.C.Berkeley、1999年9月（非特許文献４３）に記述されている。

本発明のいくつかの実施形態では、決定木は、本発明のバイオマーカーの組合せの特徴を使用して、対象を分類するために使用される。決定木アルゴリズムは、教師あり学習アルゴリズムの種類に属する。決定木の目的は、現実世界の例データから分類器（木）を導出することである。この木は、決定木を導出すためには使用されていない未知の例を分類するために使用することができる。そのため、決定木は、トレーニング・データから導出される。例示的なトレーニング・データは、複数の対象（トレーニング集団）のデータを含有している。それぞれの対象各々について、それぞれの対象のクラス（例えば、情動障害を罹患している／情動障害を罹患していない）の複数の特徴がある。本発明の１つの実施形態では、トレーニング・データは、トレーニング集団わたるバイオマーカーの組合せの発現データである。

一般的に、多くの異なる決定木アルゴリズムが存在し、それらの多くは、Duda、Pattern Classification、第2版、2001年、John Wiley & Sons, Inc社（非特許文献４４）に記述されている。決定木アルゴリズムには、特徴処理、不純物測定、停止判断基準、および枝刈り（pruning）に関する考慮が必要とされることが多い。特定の決定木アルゴリズムには、これらに限定されないが、分類回帰樹木（ＣＡＲＴ）、多変量決定木、ＩＤ３、およびＣ４．５が含まれる。

１つの手法では、決定木が使用される場合、本発明に記述されている遺伝子の選択組合せの、トレーニング集団にわたる遺伝子発現データは、平均０および単位分散（mean zero and unit variance）に対して正規化される。トレーニング集団のメンバーは、トレーニング・セットおよび試験セットに無作為に分割される。例えば、１つの実施形態では、トレーニング集団のメンバーの３分の２は、トレーニング・セットに配置され、トレーニング集団のメンバーの３分の１は、試験セットに配置される。本発明に記述されているバイオマーカーの選択組合せの発現値を使用して、決定木を構築する。その後、決定木が試験セットのメンバーを正確に分類する能力を決定する。いくつかの実施形態では、この計算は、バイオマーカーの所与の組合せごとに数回実施される。各計算を反復する際には、トレーニング集団のメンバーは、トレーニング・セットおよび試験セットに無作為に割当てられる。その後、バイオマーカーの組合せの品質は、決定木計算のそのような反復の各々の平均として得られる。

各分岐が、本発明の一組のバイオマーカーの中の対応するバイオマーカーの特徴値、または２つのそのようなバイオマーカーの相対的な特徴値に基づく単変量決定木に加えて、多変量決定木を、判断ルールとして実装することができる。そのような多変量決定木では、決定のいくつかまたはすべては、実際に本発明の複数のバイオマーカーの特徴値の線形結合を含む。そのような線形結合は、分類に対する勾配降下法または誤差平方和判断基準の使用などの公知の技術を使用してトレーニングすることができる。そのような決定木を例示するために、以下の数式を想定する：
０．０４ｘ_１＋０．１６ｘ_２＜５００
数式中、ｘ_１およびｘ_２は、本発明のバイオマーカーの中からの２つの異なるバイオマーカーの２つの異なる特徴を指す。判断ルールを選択するために、特徴ｘ_１およびｘ_２の値を、未分類の対象から得られる測定から取得する。その後、これらの値を数式に挿入する。５００未満の値が算出される場合、決定木における第１の分岐が得られる。そうでなければ、決定木における第２の分岐が得られる。多変量決定木は、Duda、2001年、Pattern Classification、John Wiley & Sons, Inc.社、ニューヨーク市、408〜409頁（非特許文献４５）に記述されている。

本発明で使用することができる別の手法は、多変量適応的回帰スプライン（ＭＡＲＳ）である。ＭＡＲＳは、回帰のための適応的手順であり、本発明が取り組んでいる高次元の問題によく適している。ＭＡＲＳは、段階的線形回帰の一般化、または回帰設定においてＣＡＲＴの性能を向上するＣＡＲＴ法の変法と見ることができる。ＭＡＲＳは、Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市、283〜295頁（非特許文献４６）に記述されている。

５．５．２ニューラル・ネットワーク
いくつかの実施形態では、本発明の選択バイオマーカーについて測定された特徴データ（例えば、ＲＴ−ＰＣＲデータ、質量分析データ、マイクロアレイ・データ）を使用して、ニューラル・ネットワークをトレーニングすることができる。ニューラル・ネットワークは、２段階回帰または分類判断ルールである。ニューラル・ネットワークは、重み層により出力ユニット層に接続されている入力ユニット（およびバイアス）層を含む階層構造を有する。回帰の場合、出力ユニット層は、典型的には１つの出力ユニットのみを含んでいる。しかしながら、ニューラル・ネットワークは、複数の定量的応答をシームレスな様式で取り扱うことができる。

多層ニューラル・ネットワークには、入力ユニット（入力層）、隠れユニット（隠れ層）、および出力ユニット（出力層）がある。さらに、入力ユニットではない各ユニットに接続されている単一のバイアスユニットがある。ニューラル・ネットワークは、Dudaら、2001年、Pattern Classification、第2版、John Wiley & Sons, Inc.社、ニューヨーク市（非特許文献４５）；およびHastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市（非特許文献１７）に記述されている。ニューラル・ネットワークは、Draghici、2003年、Data Analysis Tools for DNA Microarrays、Chapman & Hall/CRC社（非特許文献１５）；およびMount、2001年、Bioinformatics: sequence and genome analysis、Cold Spring Harbor Laboratory Press社、コールド・スプリング・ハーバー、ニューヨーク市（非特許文献４７）にも記述されている。下記に開示されるものは、ニューラル・ネットワークのいくつかの例示的な形態である。

ニューラル・ネットワークの使用に対する基本的な手法は、トレーニングされていないネットワークから出発して、トレーニング・パターンを入力層に提示し、シグナルをネットに通し、出力層での出力を決定することである。その後、これら出力を標的値と比較し、いかなる相異も誤差に相当する。この誤差または判断基準関数は、重みの何らかのスカラ関数であり、ネットワーク出力が所望の出力と一致する場合に最小化される。したがって、重みは、この誤差の測定を低減するように調整される。回帰の場合、この誤差は、誤差平方和であってもよい。分類の場合、この誤差は、平方誤差またはクロス・エントロピー（偏差）のいずれであってもよい。例えば、Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市（非特許文献１７）を参照されたい。

３つの一般的に使用されるトレーニング・プロトコールは、確率的、バッチ、およびオンラインである。確率的トレーニングでは、パターンは、トレーニング・セットから無作為に選択され、ネットワークの重みは、各パターン提示のために更新される。確率的逆伝播（stochastic back-propagation）などの勾配降下法によりトレーニングされた多層非線形ネットワークは、ネットワーク・トポロジーにより定義される分類器の重み値の最尤推定を実施する。バッチ・トレーニング（batch training）では、学習が起る前にパターンはすべてネットワークに提示される。典型的には、バッチ・トレーニングでは、トレーニング・データを通していくつかの受け渡しがなされる。オンライン・トレーニング（online training）では、各パターンは、一度だけ（once and only once）でネットに提示される。

いくつかの実施形態では、重みの出発値を考慮する。重みが０に近い場合、ニューラル・ネットワークの隠れ層において一般的に使用されるシグモイドの操作部分（operative part of the sigmoid）（例えば、Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市（非特許文献１７）を参照）は、おおよそ線形であり、したがって、ニューラル・ネットワークは、ほぼ線形分類器へと崩壊する。いくつかの実施形態では、重みの出発値は、０に近い無作為の値であるように選択される。したがって、分類器は、ほぼ線形で始まり、重みが増加するにつれて非線形になる。個別ユニットは向きに限局化し、必要であれば非線形性を導入する。正確に０の重みを使用することは、０の導関数および完全な相称性に結びつき、アルゴリズムは決して移動しない。あるいは、大きな重みを用いて出発することは、不良な解に結びつくことが多い。

入力のスケーリングは、底部層における効果的な重みのスケーリングを決定するため、最終解の品質に大きな影響を及ぼす場合がある。したがって、いくつかの実施形態では、最初は、発現値はすべて平均０および標準偏差１を有するように標準化される。これにより、正則化プロセスにおいて入力がすべて等しく処理されることが保証され、無作為出発重みの意味のある範囲を選択することが可能になる。標準化入力と共に、［−０．７、＋０．７］の範囲にわたる無作為の一定した重みを取ることが典型的である。

３層ネットワークの使用における反復性問題は、ネットワークで使用する隠れユニットの最適数である。３層ネットワークの入力および出力の数は、解決しようとする問題により決定される。本発明では、所与のニューラル・ネットワークへの入力数は、トレーニング集団から選択されるバイオマーカーの数と等しいだろう。ニューラル・ネットワークの出力数は、典型的にはちょうど１だろう。しかしながら、いくつかの実施形態では、ちょうど２を超える状態がネットワークにより定義され得るように、１を超える出力が使用される。例えば、多重出力ニューラル・ネットワークを使用して、健常表現型と情動障害の種々の段階とを区別することができる。あまりにも多くの隠れユニットがニューラル・ネットワークで使用されると、ネットワークはあまりにも多くの自由度を有することになり、トレーニングが長くなり過ぎ、ネットワークがデータを過剰フィッティングすることになるというリスクがある。隠れユニットがあまりに少数である場合、トレーニング・セットは学習することができない。しかしながら、一般的に言えば、少数過ぎるよりは多過ぎる隠れユニットを有するほうが良好である。隠れユニットが少数過ぎると、分類器は、データの非線形性をとらえるのに十分な柔軟性を有することができず、隠れユニットが多過ぎると、下記に記述されているような適切な正則化または枝刈りが使用される場合、余分な重みが０に向かって収縮する場合がある。典型的な実施形態では、隠れユニットの数は、５〜１００の範囲のどこかにあり、この数は、入力の数およびトレーニング事例の数が増加するにつれて増加する。

使用する隠れユニットの数を決定する１つの一般的な手法は、正則化手法を適用することである。正則化手法では、古典的トレーニング誤差だけでなく分類器の複雑さにも依存する新しい判断基準関数が構築される。具体的には、新しい判断基準関数は、高度に複雑な分類器にペナルティを課し、この判断基準中での最小値を探索することは、トレーニング・セットの誤差とトレーニング・セット＋正則化項の誤差とのバランスをとることであり、それは、解の制限または所望の特性を表す：
Ｊ＝Ｊ_ｐａｔ＋ λＪ_ｒｅｇ
パラメーターλは、正則化を課す強度の多少を調整する。言いかえれば、より大きな値のλは、重みを０へと収縮させる傾向があるだろう。典型的には、検証セットとの相互検証を使用してλを推定する。この検証セットは、トレーニング集団の無作為サブセットを確保することにより取得することができる。ペナルティの他の形態、例えば重み推定ペナルティ（weight elimination penalty）が提案されている（例えば、Hastieら、2001年、The Elements of Statistical Learning、Springer-Verlag社、ニューヨーク市（非特許文献１７）を参照）。

使用する隠れユニットの数を決定する別の手法は、最も必要でない重みを除去、つまり枝刈りすることである。１つの手法では、最も小さな重さを有する重みが除去される（０に設定される）。そのような重さに基づく枝刈りは機能し得るが、最適ではない。小さな重さの重みが学習およびトレーニング・データにとって重要であることがある。いくつかの実施形態では、重さに基づく枝刈り手法を使用するのではなく、Ｗａｌｄ統計量が計算される。Ｗａｌｄ統計量の基本観念は、それらを使用して、分類器における隠れユニット（重み）の重要性を推定することができるということである。その後、最小の重要性を有する隠れユニットが除去される（それらの入力および出力重みを０に設定することにより）。この点に関する２つのアルゴリズムは、最適脳損傷（ＯＢＤ、Optimal Brain Damage）および最適脳外科医（ＯＢＳ、Optimal Brain Surgeon）アルゴリズムであり、これらは、二次近似を用いてトレーニング誤差がどのように重みに依存するかを予測し、最小のトレーニング誤差増加をもたらす重みを除去する。

最適脳損傷および最適脳外科医は、重みｗにおける極小誤差に対してネットワークをトレーニングし、その後最小トレーニング誤差増加をもたらす重みを枝刈りするという同一の基礎的手法を共有する。全重みベクトルδｗの変化に対する誤差の関数的増加の予測は、以下の通りである：

数式中、

はヘッシアン行列である。第１項は、誤差の極小値で消滅し、第３項以上の高次項は無視される。１つの重みを欠失するという制限が与えられれば、この関数を最小化にするための一般解は以下の通りである：

数式中、ｕ_ｑは、重み空間のｑ次方向に沿った単位ベクトルであり、Ｌ_ｑは、重みｑが枝刈りされ、他の重みがδｗに更新された場合の、重みｑの突出に対する近似、つまりトレーニング誤差の増加である。これらの数式は、Ｈの逆行列を必要とする。この逆行列を計算する１つの方法は、小さな値を用いて出発することである。Ｈ_０ ^−１＝α^−１Ｉ、ここでαは、小さなパラメーターであり、事実上、重み定数である。次に、この行列を、以下の数式に従って各パターンを用いて更新する：

数式中、下付き文字は、提示されているパターンに対応し、ａ_ｍは、ｍと共に減少する。十分なトレーニング・セットが提示された後、逆ヘッシアン行列は、Ｈ^−１＝Ｈ_ｎ ^−１で与えられる。アルゴリズムの形態の最適脳外科医法は以下の通りである：
begin initialize n_H,w, θ（開始n_H、ｗ、θを初期化する）
train a reasonably large network to minimum error（適度に大きなネットワークをトレーニングして、誤差を最小化する）
do compute H^-1 by Eqn. 1（Ｈ^−１を数式１で計算する）

最適脳損傷法は計算としてはより単純である。なぜならライン６の逆ヘッシアン行列の計算は、対角行列が特に単純であるからである。上記のアルゴリズムは、誤差が初期化された判断基準θより大きい場合に終了する。別の手法は、重みの除去によるＪ（ｗ）の変化が、ある判断基準値より大きい場合に終了するように、ライン６を変更することである。いくつかの実施形態では、逆伝播ニューラル・ネットワーク、例えば、Abdi、1994年、「A neural network primer」、J. Biol System. 2巻、247〜283頁（非特許文献４８）を参照されたい。

５．５．３クラスタリング
いくつかの実施形態では、本発明の選択バイオマーカーの特徴を使用して、トレーニング・セットをクラスタリングする。例えば、本発明に記述されている１０個の特徴（１０個のバイオマーカーに対応する）が使用される場合を想定する。トレーニング集団の各メンバーｍは、１０個のバイオマーカーの各々の特徴値（例えば、発現値）を有することになる。トレーニング集団中のメンバーｍに由来するそのような値は、以下のベクトルを定義する：
Ｘ_１ｍＸ_２ｍＸ_３ｍＸ_４ｍＸ_５ｍＸ_６ｍＸ_７ｍＸ_８ｍＸ_９ｍＸ_１０ｍ
ここで、Ｘ_ｉｍは、生物ｍのｉ番目のバイオマーカーの発現レベルである。トレーニング・セットにｍ生物が存在する場合、ｉバイオマーカーの選択は、ｍベクトルを定義することになる。本発明の方法は、ベクトルに使用されるすべてのあらゆるバイオマーカーの各発現値が、すべてのあらゆるベクトルｍに表されている必要がないことに留意されたい。言いかえれば、ｉ番目のバイオマーカーの１つが見出されていない対象からのデータでも、クラスタリングに使用することができる。そのような場合では、見当らない発現値には、「０」または他の何らかの正規化値のいずれかが割当てられる。いくつかの実施形態では、特徴値は、クラスタリングに先立って、０の平均値および単位分散を有するように正規化される。

トレーニング・グループにわたって同様の発現パターンを示すトレーニング集団のメンバーは、一緒にクラスタリングされる傾向があるだろう。本発明の遺伝子の特定の組合せは、ベクトルがトレーニング集団に見出される形質グループにクラスタリングされる場合、本発明のこの態様の良好な分類器であるとみなされる。例えば、トレーニング集団が、クラスａ：情動障害を罹患していない研究中の対象、およびクラスｂ：情動障害を罹患している研究中の対象を含んでいる場合、理想的なクラスタリング分類器は、集団を２つのグループにクラスタリングし、一方のクラスター・グループはクラスａを固有に表し、他方のクラスター・グループはクラスｂを固有に表すだろう。

クラスタリングは、DudaおよびHart、Pattern Classification and Scene Analysis、1973年、John Wiley & Sons, Inc.社、ニューヨーク市、211〜256頁（非特許文献４９）（以下「Duda 1973年」と称する）に記述されている。Duda 1973年の６．７節に記述されているように、クラスタリング問題は、データセットの自然なグループ化を見出す問題として記述されている。自然なグループ化を特定するために、２つの課題に取り組む。第１に、２つの試料間の類似性（または相違性）を測定する方法を決定する。この計量（類似性尺度）を使用して、あるクラスター中の試料が、他のクラスター中の試料と類似するよりも、互いにより類似していることを保証する。第２に、類似性尺度を使用して、データをクラスターに分割するための機序を決定する。

類似性尺度は、Duda 1973年の６．７節で考察されており、クラスタリング調査を始める１つの方法は、データセット中の全試料対間の距離関数を定義し、距離のマトリックスを計算することであると述べられている。距離が類似性の良好な尺度である場合、同じクラスター中の試料間の距離は、異なるクラスター中の試料間の距離より著しく短いだろう。しかしながら、Duda 1973年の２１５頁に述べられるように、クラスタリングは、距離計量の使用を必要としない。例えば、非計量的類似性関数ｓ（ｘ、ｘ’）を使用して、２つのベクトルｘおよびｘ’を比較することができる。慣例的に、ｓ（ｘ、ｘ’）は、ｘおよびｘ’がある程度「類似」している場合にその値が大きい対称的関数である。非計量的類似性関数ｓ（ｘ、ｘ’）の一例は、Duda 1973年の２１６頁に提供される。

データセット中のポイント間の「類似性」または「相違性」を測定するための方法が選択されると、クラスタリングは、データの任意の区分のクラスタリング品質を測定する判断基準関数を必要とする。判断基準関数を極値化するデータセットの区分を使用して、データをクラスタリングする。Duda 1973年の２１７頁を参照されたい。判断基準関数は、Duda 1973年の６．８節で考察されている。

より最近になって、Dudaら、Pattern Classification、第2版、John Wiley & Sons, Inc社、ニューヨーク市（非特許文献５０）が出版された。５３７〜５６３頁には、クラスタリングについて詳細に記述されている。クラスタリング技術については、以下の文献により多くの情報を見出すことができる：KaufmanおよびRousseeuw、1990年、Finding Groups in Data: An Introduction to Cluster Analysis、Wiley社、ニューヨーク市、ニューヨーク州（非特許文献５１）；Everitt、1993年、Cluster analysis（第3版）、Wiley社、ニューヨーク市、ニューヨーク州（非特許文献５２）；およびBacker、1995年、Computer-Assisted Reasoning in Cluster Analysis、Prentice Hall社、アッパー・サドル・リバー、ニュージャージー州（非特許文献５３）。本発明で使用することができる特定の例示的なクラスタリング技術には、これらに限定されないが、階層的クラスタリング（最近傍アルゴリズム、最長法アルゴリズム（farthest-neighbor algorithm）、平均連結法アルゴリズム（average linkage algorithm）、重心アルゴリズム（centroid algorithm）、または平方和アルゴリズムを使用する凝集クラスタリング）、ｋ−平均クラスタリング（k-means clustering）、曖昧ｋ−平均クラスタリング・アルゴリズム（fuzzy k-means clustering algorithm）、およびＪａｒｖｉｓ−Ｐａｔｒｉｃｋクラスタリングが含まれる。

５．５．４サポート・ベクター・マシン
本発明のいくつかの実施形態では、サポート・ベクター・マシン（ＳＶＭ）を使用して、本発明に記述されている遺伝子の特徴値を使用して、対象を分類する。ＳＶＭは、比較的新しいタイプの学習アルゴリズムである。例えば、CristianiniおよびShawe-Taylor、2000年、An Introduction to Support Vector Machines、Cambridge University Press社、ケンブリッジ市（非特許文献５４）；Boserら、1992年、「A training algorithm for optimal margin classifiers」、in Proceedings of the 5^th Annual ACM Workshop on Computational Learning Theory、ACM Press社、ピッツバーグ、ペンシルベニア州、142〜152頁（非特許文献５５）；Vapnik、1998年、Statistical Learning Theory、Wiley社、ニューヨーク市（非特許文献５６）；Mount、2001年、Bioinformatics: sequence and genome analysis、Cold Spring Harbor Laboratory Press社、コールド・スプリング・ハーバー、ニューヨーク市（非特許文献４７）；Duda、Pattern Classification、第2版、2001年、John Wiley & Sons, Inc.社（非特許文献４５）；およびHastie、2001年、The Elements of Statistical Learning、Springer社、ニューヨーク市（非特許文献１７）；およびFureyら、2000年、Bioinformatics 16巻、906〜914頁（非特許文献５７）を参照されたい。分類に使用される場合、ＳＶＭは、それらから最大距離にある超平面を有する所与のセットの二成分標識データ・トレーニング・データを分離する。線形分離が可能でない場合、ＳＶＭは、特徴空間に対する非線形マッピングを自動的に実現する「カーネル（kernel）」の技術と組み合わせて作働することができる。ＳＶＭにより特徴空間に見出される超平面は、入力空間の非線形決定境界に対応する。

１つの手法では、ＳＶＭが使用される場合、特徴データは、平均０および単位分散に対して正規化され、トレーニング集団のメンバーは、トレーニング・セットおよび試験セットに無作為に分割される。例えば、１つの実施形態では、トレーニング集団のメンバーの３分の２は、トレーニング・セットに配置され、トレーニング集団のメンバーの３分の１は、試験セットに配置される。本発明に記述されている遺伝子の組合せの発現値を使用して、ＳＶＭをトレーニングする。その後、トレーニングされたＳＶＭが試験セットのメンバーを正確に分類する能力を決定する。いくつかの実施形態では、この計算は、分子マーカーの所与の組合せごとに数回実施される。各計算を反復する際には、トレーニング集団のメンバーは、トレーニング・セットおよび試験セットに無作為に割当てられる。その後、バイオマーカーの組合せの品質は、ＳＶＭ計算のそのような反復の各々の平均として得られる。

５．５．５．関連ベクター・マシンおよび遺伝的アルゴリズム
関連ベクター・マシン（ＲＶＭ）は、回帰ならびに教師ありのマルチクラス分類問題に使用可能なカーネルに基づくベイジアン統計モデルである。（Tipping, M：Sparse Bayesian Learning and the Relevance Vector Machine、Journal of Machine Learning Research 1巻、2001年、211〜244頁（非特許文献５８））。分類ツールとして使用される場合、トレーニングされたＲＶＭは、新しいデータポイントのクラス・メンバーシップに関する確率論的予測を行う。ＲＶＭモデルでは、所定のセットの説明変数（つまり、遺伝子またはバイオマーカー）が、ロジスティックス・リンク関数によりクラス・メンバーシップ確率に影響を及ぼすことが仮定されている。多数の候補変数から選択される説明変数の最適セットを決定するために、ＲＶＭモデルは、異なるサブセットの候補変数に対してトレーニングおよび試験される多数のＲＶＭを評価する遺伝的最適化アルゴリズム内部で作働している（Deb, K：Multi-Objective Optimization using Evolutionary Algorithms、Wiley社、2001年（非特許文献５９））。各変数サブセットの性能は、相互検証により評価される。

５．５．６他のデータ分析アルゴリズム
上述のデータ分析アルゴリズムは、陽転者と非陽転者とを区別するために判断ルールを構築するために使用することができるタイプの方法の例に過ぎない。さらに、上述の技術の組合せを使用することができる。決定木およびブースティングの組合せの使用などのいくつかの組合せが記述されている。しかしながら、他の多くの組合せが可能である。加えて、射影追跡（Projection Pursuit）および加重投票（Weighted Voting）などの当技術分野の他の技術を使用して、判断ルールを構築することができる。

５．６バイオマーカー
特定の実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている少なくとも２つの異なるバイオマーカーを含む。バイオマーカー・プロファイルは、少なくとも２つのバイオマーカーのそれぞれの対応する特徴をさらに含む。そのようなバイオマーカーは、例えば、ｍＲＮＡ転写物、ｃＤＮＡもしくは他の何らかの核酸、例えば増幅核酸、またはタンパク質であってもよい。一般的に、少なくとも２つのバイオマーカーは、少なくとも２つの異なる遺伝子に由来している。少なくとも２つの異なるバイオマーカー中のバイオマーカーが表１Ａに列挙されている場合、バイオマーカーは、例えば、列挙されている遺伝子により産生される転写物、その相補体、またはその特徴的断片もしくは相補体、またはそのｃＤＮＡ、そのｃＤＮＡの特徴的断片、または転写物もしくはその相補体のすべてもしくは部分に対応する特徴的増幅核酸分子、または該遺伝子によりコードされるタンパク質、またはそのタンパク質の特徴的断片、または上記のいずれかの兆候であってもよい。そのような実施形態によると、本発明のバイオマーカー・プロファイルは、当業者に公知である任意の標準的アッセイを使用して、または本明細書に記述されているアッセイで、バイオマーカーを検出して、取得することができる。そのようなアッセイは、例えば、特定の遺伝子、または目的遺伝子（例えば表１Ａに開示されている遺伝子）の対立遺伝子の発現産物（例えば、核酸および／またはタンパク質）の検出が可能である。１つの実施形態では、そのようなアッセイでは、核酸マイクロアレイが使用される。

いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている２〜２９個のバイオマーカーを有する。いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている３〜２０個のバイオマーカーを有する。いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている４〜１５個のバイオマーカーを有する。いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている少なくとも２個のバイオマーカーを有する。いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている少なくとも３個のバイオマーカーを有する。いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている少なくとも４個のバイオマーカーを有する。いくつかの実施形態では、バイオマーカー・プロファイルは、表１Ａに列挙されている少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、または２５個またはそれ以上のバイオマーカーを含む。いくつかの実施形態では、そのようなバイオマーカーの各々は核酸である。いくつかの実施形態では、そのようなバイオマーカーの各々はタンパク質である。いくつかの実施形態では、バイオマーカー・プロファイル中のバイオマーカーのいくつかは核酸であり、バイオマーカー・プロファイル中のバイオマーカーのいくつかはタンパク質である。

５．７具体的な実施形態
本発明の１つの態様は、情動障害の症状を示す可能性が高い対象の遺伝子転写プロファイルを識別する方法に関する。そのような遺伝子転写プロファイルは、表１Ａから選択される遺伝子などの、対象の生体試料に由来する選択された遺伝子の転写解析に基づく。

本発明を使用して、単一のプロファイルへと凝集させることができる個々のバイオマーカーの含有量（例えば、発現レベル）を識別および分析することが可能である。そのような含有量プロファイルは、疾患を分類するための特徴として使用される。下記で考察されているように、転写解析は、対照対象および罹患対象の全血試料中の遺伝子発現プロファイルを決定するために行われる。表１Ａから選択される遺伝子の含有量は、表４、表５、および表６に例示されている。表４、表５、および表６の各々は、それぞれうつ病対象、重度うつ病対象、および双極性対象の、対照と比較した遺伝子転写プロファイルの代表的な例である。１つの実施形態では、表４に示されているようなうつ病遺伝子転写プロファイルを有する対象は、うつ病を罹患していると診断される。別の実施形態では、表５に示されているような重度うつ病遺伝子転写プロファイルを有する対象は、重度うつ病を罹患していると診断される。別の実施形態では、表６に示されているような双極性遺伝子転写プロファイルを有する対象は、双極性障害を罹患していると診断される。遺伝子転写プロファイルのさらなる代表的な例は、表４Ａおよび５Ｂに示されている。

１つの例では、遺伝子発現プロファイルを決定するために使用されるバイオマーカーは、表１Ａに記述されている遺伝子から選択された。代表的な転写バイオマーカー・プローブ・セットも、表１Ａに記述されている。そのプローブ・セットを使用して、周知の方法により定量ＰＣＲ（ｑＰＣＲ）を実施した。

本発明の態様は、表１Ａから選択される遺伝子の転写解析により決定されるような各対象に転写プロファイルを供給する。

転写解析は、当技術分野で周知の方法により実施することができる。例として、メッセンジャーＲＮＡ（ｍＲＮＡ）を含むＲＮＡは、動物身体、特にヒト身体の細胞物質、または細胞物質を含有する液体から単離することができる。細胞物質は、ｍＲＮＡを含む細胞内容物を含有することが理解される。本発明で使用される生体試料は、例えば、末梢組織、全血、脳脊髄液、腹水、および間質液から選択されてもよい。

本発明の他の実施形態では、生体試料は、全血、脳脊髄液、および末梢組織からなる群から選択される。本発明は、赤血球細胞（ＲＢＣ）、白血球細胞、および血小板からなる群から選択される全血の画分を使用して実施することもできる。白血球細胞（白血球）には、これらに限定されないが、好中球、好塩基球、好酸球、リンパ球、マクロファージ、および単球が含まれる。

試料中の遺伝子発現を測定するために、その試料中のＲＮＡまたはｍＲＮＡを逆転写にかけて複製ＤＮＡを生成し、その後そのＤＮＡ配列に基づくプローブまたはプライマー配列を使用して標準的方法により分析できる。個々の遺伝子の各々は、ポリメラーゼ連鎖反応（ＰＣＲ）、定量ＰＣＲ、ｉｎｓｉｔｕハイブリダイゼーション、ノーザンブロット解析、ビーズに基づくアッセイまたは遺伝子アレイなどの固体支持体固定化アッセイ、および当技術分野で周知の他の方法により解析することができる。

本明細書に記述されている本発明の態様によると、定量ＰＣＲ（ｑＰＣＲ）を使用して、ｍＲＮＡレベルを測定する。１つまたは複数の核酸プローブを使用して、生体試料に由来するｍＲＮＡレベルを測定した。プローブまたはプライマーは、目的の遺伝子に相補的なヌクレオチド（ｎｔ）配列であり、そのようなプローブ／プライマーの選択および合成は、当業者に周知の方法により行われる。本発明のプローブ／プライマーは、表１Ａに記述されているヌクレオチド配列に限定されない。

本発明は、対象から取得した生体試料から分析されるような対象の転写プロファイルを決定することにより、対照対象と比較して罹患対象を分類する方法をさらに提供する。

本発明は、表１Ａから選択される遺伝子の転写解析により決定される個別的転写プロファイルを供給する。そのような転写プロファイルは、既知の健常対照対象または既知の罹患対象の転写プロファイルに類似していると決定される場合、対象に個別的であると決定される。既知の健常対照対象または既知の罹患対象の転写プロファイルとの類似性は、本明細書に記述されているように、分類アルゴリズムなどの分類法により決定される。

いくつかの実施形態では、転写データは、本明細書に記述されているように、複数の対照対象から収集される。転写データは、本明細書中に記述されているように、情動障害などの疾患または障害を罹患している複数の対象から収集される。データ分析アルゴリズムは、各セットの転写データを入力として、各転写データ・セットに含有されている分類遺伝子を区別または識別するために使用される。そのようなアルゴリズムは、典型的には、「分類器」としても知られている分類アルゴリズムとして記述されている。この課題を実施するために使用されるデータ分析アルゴリズムは、当業者に周知であり、以下の例を使用することができる：ランダム・フォレスト法（Breiman, L.、2001年、Machine Learning 45巻（1号）：5〜32頁（非特許文献６０））、サポート・ベクター・マシン（ＳＶＭ）（Cortes, C.およびVapnik, V.、1995年、Machine Learning、20巻（3号）：273〜97頁（非特許文献６１））、段階的ロジスティック回帰法（ＳＬＲ）Ersboll, B.K.およびConradsen, K.（2005年）An Introduction to Statistics. 第7版、IMM（非特許文献６２）；Draper, N.およびSmith, H.（1981年）Applied Regression Analysis、第2版、ニューヨーク市：John Wiley & Sons, Inc.社（非特許文献６３））、再帰分割法（ＲＰＡＲＴ）（James K.E.ら、2005年、Statistics in Medicine、24巻（19号）：3019〜35頁（非特許文献６４））、罰則付ロジスティック回帰分析（Penalized Logistic Regression Analysis）（ＰＥＬＯＲＡ）（Dettling, M.、2003年、Proceedings of the 3^rd International Workshop on Distributed Statistical Computing、3月20〜22日、ウィーン、オーストリア、Hornick、Leisch、およびSeilis編（非特許文献６５））、ニューラル・ネットワーク、関連ベクター・マシン（ＲＶＭ）、ロジットブースト（LogitBoost）（Friedman, J.、Hastie, T.、およびTibshirani, R. 2000年、Annals of Statistics 28巻（2号）：337〜407頁（非特許文献６６））、マイクロアレイ予測解析（ＰＡＭ）、およびその他（V. N. Vapnik、Statistical Learning Theory、Wiley社、ニューヨーク市、1998年（非特許文献６７）参照）。そのような分類アルゴリズムまたは「分類器」は、それらの転写データに基づく患者の分類に関する出力を提供するために調整およびトレーニングされる。

トレーニングされた分類アルゴリズムにより選択される遺伝子またはバイオマーカーを分類することにより、特定のデータセットが属するクラス、例えば、対照データに関連するクラスまたは疾患データと関連するクラスのいずれかに関連する転写データの予測尺度がもたらされる。

任意の特定の理論により束縛されることは望まないが、ランダム・フォレスト・アルゴリズムは、多数の決定木からの出力に基づいて対象を分類するアンサンブル学習法とみなされている。各決定木は、利用可能なデータのブートストラップ試料に対してトレーニングされ、決定木の各ノードは、最も良好な説明変数（つまり、遺伝子またはバイオマーカー）により分割される。ランダム・フォレスト法は、自動的な変数選択を提供することも、選択された変数間の非線形相互作用を記述することも、両方とも可能である。

段階的ロジスティック回帰法（ＳＬＲ）は、データ入力をロジスティック曲線にフィッティングすることにより、事象発生の確率を予測する統計モデルとみなされている。ロジスティック・モデルでは、所定のセットの説明変数（つまり、遺伝子またはバイオマーカー）が、ロジスティックス・リンク関数により、確率に影響を及ぼすことが仮定されている。多数の候補変数から選択される説明変数の最適セットを決定するために、多数のロジスティック回帰モデルを、初期モデルから段階的な様式で構築し、最も正確なモデルを決定するために赤池の情報量基準（ＡＩＣ）を評価することにより比較する（Burnham, K. P.およびD. R. Anderson、2002年．Model Selection and Multimodel Inference: A Practical-Theoretic Approach、第2版、Springer-Verlag社（非特許文献６８））。

サポート・ベクター・マシン（ＳＶＭ）は、一般化された線形分類器のファミリーに属するとみなされている。ＳＶＭは、２グループ分類における入力データを、ｎ次元空間における２セットのベクトルとしてとらえ、２セットのベクトル間のマージンを最大化する超平面によりデータを分離する。ベクトルは、最大化する超平面に対して最小距離をとり、サポート・ベクターと呼ばれる。ＳＶＭは、自動的な変数（つまり、遺伝子またはバイオマーカー）選択を提供しない。

関連ベクター・マシン（ＲＶＭ）では、所定のセットの説明変数（つまり、遺伝子またはバイオマーカー）が、ロジスティックス・リンク関数によりクラス・メンバーシップ確率に影響を及ぼすことが仮定されている。ＲＶＭは、多数の候補変数から選択される説明変数の最適セットを決定しようと試みる。ＲＶＭは、多数のＲＶＭを評価および相互検証し、候補変数（つまり、遺伝子またはバイオマーカー）の最適セットを選択する遺伝的最適化アルゴリズムと共に作働させることができる。

分類アルゴリズムを用いて構築された転写プロファイルは、前述のデータ分析アルゴリズムのうちの１つを使用して、さらにトレーニングされる。分類誤差は、トレーニングされた分類アルゴリズムがクラス内のメンバーシップを予測する、正確度の尺度である。分類誤差は、リーブ・ワン・アウト相互検証法（ＬＯＯＣＶ、leave-one-out cross validation）、Ｋ分割検証法（K-fold validation）、または１０分割検証法（ten-fold validation）などの相互検証法により決定することができる（Devijver, P. A.およびJ. Kittler、1982年、Pattern Recognition: A Statistical Approach、Prentice-Hall社、ロンドン（非特許文献６９））。

所定の転写プロファイルを用いたアルゴリズムの正確度は、トレーニング中にそのアルゴリズムにより予測された真陽性（ＴＰ）、真陰性（ＴＮ）、偽陽性（ＦＰ）、および偽陰性（ＦＮ）の数を決定することにより測定することができる。正確度は、以下のように測定される：
正確度＝（ＴＰ＋ＴＮ）／ＴＰ＋ＴＮ＋ＦＰ＋ＦＮ）

陽性的中率（ＰＰＶ）、またはアルゴリズムにより陽性とスコアリングされた罹患対象の割合は、以下のように測定される：
ＰＰＶ＝ＴＰ／ＴＰ＋ＦＰ

陰性的中率（ＮＰＶ）、またはアルゴリズムにより陰性とスコアリングされた対照対象（疾患を罹患していない）の割合は、以下のように測定される
ＮＰＶ＝ＴＮ／ＴＮ＋ＦＮ

分類アルゴリズムの性能は、その分類が正確な変数（つまり、遺伝子）を良好に識別した程度を評価するジャカード類似性係数（Jaccard similarity coefficient）（ジャカード指標）によっても決定される。トレーニングされた分類アルゴリズムの正確度は、約６０％、６５％、７０％、７５％、８０％、８５％、９０％、または９５％を上回ることができる。トレーニングされた分類アルゴリズムのジャカード指標は、約６０％、６５％、７０％、７５％、８０％、８５％、９０％、または９５％を上回ることができる。トレーニングされた分類アルゴリズムのＰＰＶおよびＮＰＶは、約６０％、６５％、７０％、７５％、８０％、８５％、９０％、または９５％を上回ることができる。

対象の分類は、情動障害を罹患しているか、または情動障害の症状を示す可能性の高い対象の診断に有用であってもよい。対象を分類するための遺伝子転写プロファイルは、表１Ａの遺伝子の転写解析に基づく。本明細書に記述されている方法により分析されるような対象の転写プロファイルは、対象が罹患対象のクラスに属するかどうかを示すだろう。

いくつかの実施形態では、本発明は、試験対象の情動障害を診断する方法であって、該試験対象のバイオマーカー・プロファイル中の複数のバイオマーカーの複数の特徴が、ある値セットを満たすかどうかを評価し、該値セットを満たすことが、前記情動障害を該試験対象が罹患していることを予測し、該複数の特徴が、該複数のバイオマーカーの測定可能な態様であり、該複数のバイオマーカーが、表１Ａに列挙されている少なくとも２つのバイオマーカーを含む方法を提供する。本方法は、試験対象が情動障害を罹患しているかどうかの診断を、ユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体、またはローカルもしくはリモート・コンピュータ・システムに出力すること；または試験対象が情動障害を罹患しているかどうかの診断を、ユーザー読み取り可能な形態で表示することをさらに含む。

本発明のいくつかの実施形態では、複数のバイオマーカーは、表１Ａに列挙されている２〜２９個のバイオマーカーからなる。他の実施形態では、複数のバイオマーカーは、表１Ａに列挙されている３〜２０個のバイオマーカーからなる。さらに他の実施形態では、複数のバイオマーカーは、表１Ａに列挙されている少なくとも２、３、４、または５個のバイオマーカーを含む。

いくつかの実施形態では、複数の特徴は、表１Ａに列挙されている２〜２９個のバイオマーカーに対応する２〜２９個の特徴からなる。他の実施形態では、複数の特徴は、表１Ａに列挙されている３〜１５個のバイオマーカーに対応する３〜１５個の特徴からなる。さらに他の実施形態では、複数の特徴は、表１Ａに列挙されている少なくとも２個のバイオマーカーに対応する少なくとも２個の特徴を含む。

他の実施形態では、複数のバイオマーカーは、ＥＲＫ１およびＭＡＰＫ１４を含む。他の実施形態では、複数のバイオマーカーは、Ｇｉ２およびＩＬ−１ｂを含む。他の実施形態では、複数のバイオマーカーは、ＡＲＲＢ１およびＭＡＰＫ１４を含む。他の実施形態では、複数のバイオマーカーは、ＥＲＫ１およびＩＬ１ｂを含む。

本発明のいくつかの態様では、前記複数のバイオマーカー中の各バイオマーカーは、核酸である。他の態様では、前記複数のバイオマーカー中の各バイオマーカーは、ＤＮＡ、ｃＤＮＡ、増幅ＤＮＡ、ＲＮＡ、またはｍＲＮＡである。さらに他の態様では、前記複数のバイオマーカー中の各バイオマーカーは、タンパク質である。

他の実施形態では、試験対象のバイオマーカー・プロファイル中の前記複数の特徴中のある特徴は、複数のバイオマーカー中のバイオマーカーのある測定可能な態様であり、前記特徴の特徴値は、前記試験対象から採取された生体試料を使用して決定される。他の実施形態では、特徴は、生体試料中の前記バイオマーカーの含有量である。さらに他の実施形態では、生体試料は、末梢組織、全血、脳脊髄液、腹水、間質液、赤血球細胞、白血球細胞、または血小板である。

別の実施形態では、前記複数の特徴中の特徴は、前記バイオマーカー・プロファイル中のバイオマーカーの測定可能な態様であり、前記特徴の特徴値は、前記試験対象から採取された試料を使用して決定される。いくつかの実施形態では、バイオマーカー・プロファイル中のバイオマーカーは、核酸の兆候またはタンパク質の兆候である。他の実施形態では、バイオマーカー・プロファイル中のバイオマーカーは、ｍＲＮＡ分子の兆候またはｃＤＮＡ分子の兆候である。いくつかの実施形態では、ｍＲＮＡ分子またはｃＤＮＡ分子の兆候は、ｃＤＮＡ１ｎｇ当たりのコピー数などの転写物値である。いくつかの実施形態では、バイオマーカー・プロファイル中の第１のバイオマーカーは、核酸の兆候であり、バイオマーカー・プロファイル中の第２のバイオマーカーは、タンパク質の兆候である。

本発明のいくつかの態様では、値セットは、表４に示されているようなバイオマーカーの含有量を含み、表４の値セットを満たすことは、対象がうつ病を罹患していることを予測する。他の態様では、値セットは、表５に示されているようなバイオマーカーの含有量を含み、表５の値セットを満たすことは、対象が重度うつ病を罹患していることを予測する。他の態様では、値セットは、表６に示されているようなバイオマーカーの含有量を含み、表６の値セットを満たすことは、対象が双極性うつ病を罹患していることを予測する。さらに、本発明は、表４Ａにあるようなうつ病診断用の値セット、および表５Ｂにあるような重度うつ病診断用の値セットを提供する。

表４、５、および６に示されている値セットは、ｃＤＮＡ、つまりバイオマーカー遺伝子の転写物の１ｎｇ当たりのコピー数で表されるバイオマーカーの含有量により表される。例えば、表４にあるバイオマーカーＡＲＲＢ１についての、うつ病対象の転写物値の範囲は、１８９０６２±６２７２７コピー／ｎｇｃＤＮＡであり、それは、１２６３３５〜２５１７８９コピー／ｎｇｃＤＮＡの範囲と等しい。表４にあるバイオマーカーＣＤ８ａについての、うつ病対象の転写物値の範囲は、８３０４±５８２５コピー／ｎｇｃＤＮＡであり、それは、２４７９〜１４１２９コピー／ｎｇｃＤＮＡの範囲と等しい。本発明のいくつかの態様では、値セットを満たすことは、各バイオマーカーの所与の範囲内の値を有することを意味する。

いくつかの実施形態では、１ｎｇのｃＤＮＡ当たり１５１４８〜３５５０４コピーの範囲内のＥＲＫ１含有量、および１ｎｇのｃＤＮＡ当たり３９２４１〜１０７０７１コピーの範囲内のＭＡＰＫ１４含有量を含む値セットは、対象がうつ病を罹患していることを予測する。他の実施形態では、１ｎｇのｃＤＮＡ当たり６１７３４〜１６８５００コピーの範囲内のＧｉ２含有量、および１ｎｇのｃＤＮＡ当たり１５９３９〜４３３２３コピーの範囲内のＩＬ１ｂ含有量を含む値セットは、対象がうつ病を罹患していることを予測する。他の実施形態では、１ｎｇのｃＤＮＡ当たり１２６３３５〜２５１７８９コピーの範囲内のＡＲＲＢ１含有量、および１ｎｇのｃＤＮＡ当たり３９２４１〜１０７０７１コピーの範囲内のＭＡＰＫ１４含有量を含む値セットは、対象がうつ病を罹患していることを予測する。他の実施形態では、１ｎｇのｃＤＮＡ当たり１５１４８〜３５５０４コピーの範囲内のＥＲＫ１含有量、および１ｎｇのｃＤＮＡ当たり１５９３９〜４３３２３コピーの範囲内のＩＬ１ｂ含有量を含む値セットは、対象がうつ病を罹患していることを予測する。

他の実施形態では、０．２５〜０．４５の範囲内にある、ＭＡＰＫ１４含有量で除算されたＥＲＫ１含有量の比率を含む値セットは、対象がうつ病を罹患していることを予測する。他の実施形態では、０．１６〜０．３６の範囲内にある、ＩＬ１ｂ含有量で除算されたＧｉ２含有量の比率を含む値セットは、対象がうつ病を罹患していることを予測する。他の実施形態では、０．２９〜０．４９の範囲内にある、ＡＲＲＢ１含有量で除算されたＭＡＰＫ１４含有量の比率を含む値セットは、対象がうつ病を罹患していることを予測する。他の実施形態では、０．０．７５〜０．９５の範囲内にある、ＩＬ１ｂ含有量で除算されたＥＲＫ１含有量の比率を含む値セットは、対象がうつ病を罹患していることを予測する。

他の実施形態では、０．１９〜０．３９の範囲内にある、ＭＡＰＫ１４含有量で除算されたＥＲＫ１含有量の比率を含む値セットは、対象が重度うつ病を罹患していることを予測する。他の実施形態では、０．１８〜０．３８の範囲内にある、ＩＬ１ｂ含有量で除算されたＧｉ２含有量の比率を含む値セットは、対象が重度うつ病を罹患していることを予測する。他の実施形態では、０．３２〜０．５２の範囲内にある、ＡＲＲＢ１含有量で除算されたＭＡＰＫ１４含有量の比率を含む値セットは、対象が重度うつ病を罹患していることを予測する。他の実施形態では、０．６０〜０．８０の範囲内にある、ＩＬ１ｂ含有量で除算されたＥＲＫ１含有量の比率を含む値セットは、対象が重度うつ病を罹患していることを予測する。

上記の方法の他の態様では、本方法は、評価ステップに先立って、前記バイオマーカー・プロファイルを構築することをさらに含む。他の実施形態では、構築ステップは、前記試験対象の生体試料から前記複数の特徴を取得することを含む。いくつかの態様では、バイオマーカー・プロファイルは、第２のバイオマーカーの特徴値で第１のバイオマーカーの特徴値を除算することによるバイオマーカー含有量の比率を決定することにより構築される。そのようなバイオマーカー・プロファイルは、表４、表５、または表６に示される値を使用して構築することができる。

他の実施形態では、試料は、末梢組織、全血、脳脊髄液、腹水、間質液、赤血球細胞、白血球細胞、または血小板である。

上記の方法のさらに他の態様では、本方法は、評価ステップに先立って、前記第１の値セットを構築することをさらに含む。他の実施形態では、構築ステップは、データ分析アルゴリズムを、集団のメンバーから得られた特徴に適用することを含む。

いくつかの態様では、特徴は、ＥＲＫ１およびＭＡＰＫ１４を含むバイオマーカーの測定可能な態様であり、特徴値は、前記試験対象から採取された血液試料を使用して決定される。

他の実施形態では、集団は、情動障害を罹患していない第１の複数の対照対象に由来する第１の複数の生体試料、および情動障害を罹患している第２の複数の対象に由来する第２の複数の生体試料を含む。さらに他の実施形態では、データ分析アルゴリズムは、決定木、マイクロアレイ予測解析、多重加法型回帰木、ニューラル・ネットワーク、クラスタリング・アルゴリズム、主成分分析法、最近傍解析、線形判別分析、二次判別分析、サポート・ベクター・マシン法、進化法（evolutionary method）、関連ベクター・マシン法、遺伝的アルゴリズム、射影追跡法、または加重投票法である。

別の実施形態では、構築ステップは、判断ルールを生成し、そこでは、前記評価ステップが、前記判断ルールを複数の特徴に適用して、それらが第１の値セットを満たすかどうかを決定することを含む。いくつかの実施形態では、判断ルールは、前記集団中の対象を、（ｉ）情動障害を罹患していない対象、および（ｉｉ）７０パーセント以上の正確度で情動障害を罹患している対象として分類する。いくつかの実施形態では、判断ルールは、前記集団中の対象を、（ｉ）情動障害を罹患していない対象、および（ｉｉ）９０パーセント以上の正確度で情動障害を罹患している対象として分類する。

本発明のある態様では、情動障害は、双極性障害Ｉ、双極性障害ＩＩ、気分変調性障害、または抑うつ障害である。他の態様では、情動障害は、軽度うつ病、中程度のうつ病、重度うつ病、非定型うつ病、メランコリー型うつ病、または境界性人格障害である。さらに他の態様では、情動障害は、（ｉ）心的外傷後ストレス障害、または（ｉｉ）心的外傷後ストレス障害を伴わない心的外傷。いくつかの態様では、情動障害は、急性心的外傷後ストレス障害、または軽減された心的外傷後ストレス障害である。

本発明は、試験対象の情動障害を診断するために使用されるキットであって、該試験対象のバイオマーカー・プロファイル中の複数のバイオマーカーの複数の特徴が、ある値セットを満たすかどうかを評価するための試薬および説明書を含み、該値セットを満たすことが、前記情動障害を該試験対象が罹患していることを予測し、該複数の特徴が、該複数のバイオマーカーの測定可能な態様であり、該複数のバイオマーカーが、表１Ａに列挙されている少なくとも２つのバイオマーカーを含むキットを提供する。いくつかの態様では、試薬は、表１Ａから選択されるバイオマーカーのヌクレオチド配列を認識するプローブおよび／またはプライマーを含む。本発明のキットは、本発明によるバイオマーカー・プロファイルを生成するために使用される。いくつかの態様では、本発明のキットは、表１Ａに列挙されている少なくとも２つのバイオマーカーを含む複数のバイオマーカーから、試験対象のバイオマーカー・プロファイルを試験および評価するための説明書を提供する。他の態様では、本発明のキットは、試験対象のバイオマーカー・プロファイルがそのような値セットを満たすかどうかを決定するために、値セットを含む説明書を提供する。

本発明は、コンピュータ・プログラム製品も提供し、該コンピュータ・プログラム製品は、コンピュータ読み取り可能な記憶媒体およびそこに内蔵されているコンピュータ・プログラム・メカニズムを含み、該コンピュータ・プログラム・メカニズムは、上記の方法のいずれかを実行するためのインストラクションを含む。いくつかの態様では、コンピュータ・プログラム・メカニズムは、試験対象が情動障害を罹患しているかどうかの診断を、ユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体、またはローカルもしくはリモート・コンピュータ・システムに出力するためのインストラクション；または試験対象が情動障害を罹患しているかどうかの診断を、ユーザー読み取り可能な形態で表示するためのインストラクションをさらに含む。

本発明は、１つまたは複数のプロセッサ、および該１つまたは複数のプロセッサに接続されたメモリを含み、該メモリが上記の方法のいずれかを実行するためのインストラクションを格納するコンピュータも提供する。本発明のいくつかの態様では、メモリは、試験対象が情動障害を罹患しているかどうかの診断を、ユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体、またはローカルもしくはリモート・コンピュータ・システムに出力するためのインストラクション；または試験対象が情動障害を罹患しているかどうかの診断を、ユーザー読み取り可能な形態で表示するためのインストラクションをさらに含む。

本発明は、試験対象が情動障害の症状を示す可能性を決定する方法であって、該試験対象のバイオマーカー・プロファイル中の複数のバイオマーカーの複数の特徴が、ある値セットを満たすかどうかを評価し、該値セットを満たすことが、情動障害の症状を該試験対象が示す可能性を提供し、該複数の特徴が、該複数のバイオマーカーの測定可能な態様であり、該複数のバイオマーカーが、表１Ａに列挙されている少なくとも２つのバイオマーカーを含む方法をさらに提供する。

いくつかの実施形態では、複数のバイオマーカーは、ＥＲＫ１およびＭＡＰＫ１４を含む。他の実施形態では、複数のバイオマーカーは、Ｇｉ２およびＩＬ−１ｂを含む。他の実施形態では、複数のバイオマーカーは、ＡＲＲＢ１およびＭＡＰＫ１４を含む。他の実施形態では、複数のバイオマーカーは、ＥＲＫ１およびＩＬ１ｂを含む。

本発明のいくつかの実施形態では、複数のバイオマーカーは、ＥＲＫ１、ＰＢＲ、およびＭＡＰＫ１４を含む。別の実施形態では、複数のバイオマーカーは、ＰＢＲ、Ｇｉ２、およびＩＬ１ｂを含む。他の実施形態では、複数のバイオマーカーは、ＥＲＫ１、ＡＲＲＢ１、およびＭＡＰＫ１４を含む。いくつかの実施形態では、複数のバイオマーカーは、ＭＡＰＫ１４、ＥＲＫ１、およびＣＤ８ｂを含む。他の実施形態では、複数のバイオマーカーは、ＭＡＰＫ１４、ＥＲＫ１、およびＰ２Ｘ７を含む。さらに他の実施形態では、複数のバイオマーカーは、ＡＲＲＢ１、ＩＬ６、およびＣＤ８ａを含む。ある実施形態では、複数のバイオマーカーは、ＡＲＲＢ１、ＯＤＣ１、およびＰ２Ｘ７を含む。

さらに他の実施形態では、本方法は、試験対象が情動障害の症状を示す可能性を、ユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体、またはローカルもしくはリモート・コンピュータ・システムに出力すること；または試験対象が情動障害の症状を示す可能性を、ユーザー読み取り可能な形態で表示することをさらに含む。

本発明は、複数の対照対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルを提供する。本発明は、複数のうつ病対象、重度うつ病対象、または双極性対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルを提供する。本発明は、複数の境界性人格障害対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルをさらに提供する。本発明は、複数のＰＴＳＤ対象から収集された各生体試料に関する転写解析の尺度である転写プロファイルを提供する。

本発明は、第１の複数対照対象の集団的尺度を含む転写プロファイルが、例えばデータベースに格納されることも提供する。第２の複数対象、例えば罹患対象の集合的尺度を含む転写プロファイルは、データ分析アルゴリズム、特にトレーニングされた分類アルゴリズムを使用して、第１の複数対照対象の転写プロファイルと比較される。トレーニングされた分類アルゴリズムは、各セットの対象を分類する。トレーニングされた分類アルゴリズムは、分類を診断および割当てるのに有用な予測値を提供する。トレーニングされた分類アルゴリズムは、対象が障害の症状を示す可能性を予測するのに有用な予測値を提供する。

本発明の別の実施形態は、健常対照対象および罹患対象の転写プロファイルと比較した対象の個別的な転写プロファイルに基づいて、疾患または障害に対する対象の感受性を診断または予測すること、または障害の症状を示す可能性を予測することに関する。診断に使用するための遺伝子転写プロファイルは、表１Ａから選択される遺伝子転写解析に基づく。

本発明の１つの態様は、異なるタイプの情動障害、特に大うつ病性障害、双極性障害、境界性人格障害、および心的外傷後ストレス障害の診断に関する。

本発明の別の態様は、転写プロファイルを識別することにより患者集団を区別することに関する。例えば、通常、大うつ病であると診断されるだろう患者は、転写プロファイルにより、例えばメランコリー型うつ病および非定型うつ病などのうつ病のサブタイプに区分することができる。これらのうつ病サブタイプの鑑別治療応答に関する根拠は存在する。共存症を示す患者、つまり複数の障害に関するＤＳＭ−ＩＶ（登録商標）判断基準を満たす患者は、転写プロファイルの識別から利益を得るだろう。転写プロファイルは、１つの障害に関する共通の生物学的基盤を識別することができる。

１つの実施形態では、本発明は、上記の方法により、複数の健常対照対象から収集された生体試料に関する転写解析の尺度である転写プロファイルを提供する。本発明は、複数の情動障害対象から収集された生体試料に関する転写解析の尺度である転写プロファイルも提供する。例えば、本発明は、複数のうつ病対象、重度うつ病対象、または双極性対象から収集された生体試料に関する転写解析の尺度である転写プロファイルも提供する。本発明は、表４にあるような、複数のうつ病対象から収集された生体試料に関する転写解析の尺度である転写プロファイルを提供する。本発明は、表５にあるような、複数の重度うつ病対象から収集された生体試料に関する転写解析の尺度である転写プロファイルを提供する。本発明は、表６にあるような、複数の双極性対象から収集された生体試料に関する転写解析の尺度である転写プロファイルも提供する。本発明は、複数の境界性人格障害対象から収集された生体試料に関する転写解析の尺度である転写プロファイルをさらに提供する。本発明は、複数のＰＴＳＤ対象から収集された生体試料に関する転写解析の尺度である転写プロファイルを提供する。

本発明の１つの実施形態では、生体試料は全血である。

本発明は、第１の複数対照対象の集団的尺度を含む転写プロファイルが、例えばデータベースに格納されることも提供する。第２の複数対象、例えば罹患対象の集合的尺度を含む転写プロファイルは、分類アルゴリズムを使用して、第１の複数対照対象の転写プロファイルと比較される。分類アルゴリズムは、対象の各々を分類する出力を提供する。

本発明のいくつかの態様では、転写プロファイルは、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴ、およびＶＭＡＴ２からなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴ、およびＶＭＡＴ２からなる群から選択される少なくとも３つ遺伝子の転写解析から決定される。

いくつかの実施形態では、転写プロファイルは、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＲＥＢ１、ＣＲＥＢ２、ＥＲＫ２、Ｇｉ２、ＭＡＰＫ１４、ＯＤＣ１、Ｐ２Ｘ７、およびＰＢＲからなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、ＣＤ８ａ、ＥＲＫ１、ＭＡＰＫ１４、Ｐ２Ｘ７、およびＰＢＲからなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、Ｇｉ２、ＧＲ、およびＭＡＰＫ１４からなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、Ｇｉ２、ＧＲ、ＭＡＰＫ１４、およびＭＲからなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ｂ、ＥＲＫ２、ＩＤＯ、ＩＬ−６、ＭＲ、ＯＤＣ１、ＰＲＥＰ、およびＲＧＳ２からなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、ＡＲＲＢ１、ＣＲＥＢ１、ＥＲＫ２、Ｇｓ、ＩＬ−６、ＭＫＰ１、およびＲＧＳ２からなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、ＥＲＫ１およびＭＡＰＫ１４からなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、Ｇｉ２およびＩＬ１ｂからなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、ＡＲＲＢ１およびＭＡＰＫ１４からなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、ＥＲＫ１およびＩＬ１ｂからなる群から選択される遺伝子の転写解析から決定される。

別の実施形態では、転写プロファイルは、ＥＲＫ１、ＭＡＰＫ１４、およびＰ２Ｘ７からなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、Ｇｉ２、ＩＬ１ｂ、およびＰＢＲからなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、ＡＲＲＢ１、ＯＤＣ１、およびＰ２Ｘ７からなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、ＡＲＲＢ１、ＣＤ８ａ、およびＩＬ６からなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、ＣＤ８ｂ、ＥＲＫ１、およびＭＡＰＫ１４からなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、ＡＲＲＢ１、ＥＲＫ１、およびＭＡＰＫ１４からなる群から選択される遺伝子の転写解析から決定される。別の実施形態では、転写プロファイルは、ＥＲＫ１、ＭＡＰＫ１４、およびＰＢＲからなる群から選択される遺伝子の転写解析から決定される。

本発明のある態様は、対象の転写プロファイルを識別すること、およびそのような転写プロファイルを、対照対象または健常対照対象のグループのプロファイルと比較することを含む対象の情動障害を診断する方法を提供し、それにより転写プロファイルの変化または相異の存在または非存在に基づいて、対象が情動障害を示すかどうかを診断する。

本発明のいくつかの実施形態では、情動障害は、うつ病、重度うつ病、双極性障害、境界性人格障害からなる群から選択される。いくつかの実施形態では、情動障害は、心的外傷後ストレス障害、または心的外傷後ストレス障害を伴わない心的外傷から選択される。他の実施形態では、情動障害は、急性心的外傷後ストレス障害、または軽減された心的外傷後ストレス障害から選択される。

本発明の１つの態様は、対象が情動障害を示すかどうかを診断するための方法であって、
（ａ）情動障害を罹患している疑いのある対象から生体試料を取得すること、
（ｂ）該生体試料中のｍＲＮＡレベルを測定し、該ｍＲＮＡレベルが、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴ、およびＶＭＡＴ２からなる群から選択される遺伝子のｍＲＮＡレベルであること、
（ｃ）該ｍＲＮＡのレベルを、ｍＲＮＡデータとしてコンピュータ媒体に収集および格納すること、
（ｄ）そのようなｍＲＮＡデータを分類アルゴリズムにより処理し、該処理が、健常対照対象のｍＲＮＡデータと該ｍＲＮＡデータが同じであるかまたは異なっているかを決定すること、および
（ｅ）該対象を分類する出力データを提供することを含み、
それにより、該対象が情動障害を示すかどうかを診断する方法を提供する。

本発明は、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴ、およびＶＭＡＴ２からなる群から選択される遺伝子の、対象の転写プロファイルを、複数の健常対照対象の前記遺伝子の転写プロファイルと比較することにより、情動障害に対する該対象の感受性を予測するための方法をさらに提供する。

本発明の１つの態様は、対象が情動障害の症状を示す可能性を予測するための方法であって、
（ａ）対象から生体試料を取得すること、
（ｂ）ｍＲＮＡレベルを測定し、該ｍＲＮＡレベルが、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴ、およびＶＭＡＴ２からなる群から選択される遺伝子のｍＲＮＡレベルであること、
（ｃ）該ｍＲＮＡのレベルを、ｍＲＮＡデータとしてコンピュータ媒体に収集および格納すること、
（ｄ）そのようなｍＲＮＡデータを分類アルゴリズムにより処理し、該処理が、健常対照対象のｍＲＮＡデータと該ｍＲＮＡデータが同じであるかまたは異なっているかを決定すること、および
（ｅ）該対象を分類する出力データを提供することを含み、
それにより、該対象が情動障害の症状を示す可能性を予測する方法を提供する。

別の実施形態では、本方法は、ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ１、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、ＥＲＫ２、Ｇｉ２、Ｇｓ、ＧＲ、ＩＬ１ｂ、ＩＬ６、ＩＬ８、ＩＮＤＯ、ＭＡＰＫ１４、ＭＡＰＫ８、ＭＫＰ１、ＭＲ、ＯＤＣ１、Ｐ２Ｘ７、ＰＢＲ、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、ＳＥＲＴ、およびＶＭＡＴ２からなる群から選択される少なくとも２つ遺伝子のｍＲＮＡレベルを測定することを含んでいてもよい。

他の実施形態では、本方法は、表１Ａに列挙されている任意の３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、または２８個の遺伝子のｍＲＮＡレベルを測定することを含む。

他の実施形態では、本方法は、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＲＥＢ１、ＣＲＥＢ２、ＥＲＫ２、Ｇｉ２、ＭＡＰＫ１４、ＯＤＣ１、Ｐ２Ｘ７、およびＰＢＲからなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

別の実施形態では、本方法は、ＣＤ８ａ、ＥＲＫ１、ＭＡＰＫ１４、Ｐ２Ｘ７、およびＰＢＲからなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

別の実施形態では、本方法は、Ｇｉ２、ＧＲ、およびＭＡＰＫ１４からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

別の実施形態では、本方法は、Ｇｉ２、ＧＲ、ＭＡＰＫ１４、およびＭＲからなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

別の実施形態では、本方法は、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ｂ、ＥＲＫ２、ＩＤＯ、ＩＬ−６、ＭＲ、ＯＤＣ１、ＰＲＥＰ、およびＲＧＳ２からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

別の実施形態では、本方法は、ＡＲＲＢ１、ＣＲＥＢ１、ＥＲＫ２、Ｇｓ、ＩＬ−６、ＭＫＰ１、およびＲＧＳ２からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

別の実施形態では、本方法は、ＥＲＫ１およびＭＡＰＫ１４からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、Ｇｉ２およびＩＬ１ｂからなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、ＡＲＲＢ１およびＭＡＰＫ１４からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、ＥＲＫ１およびＩＬ１ｂからなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

別の実施形態では、本方法は、ＥＲＫ１、ＭＡＰＫ１４、およびＰ２Ｘ７からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、Ｇｉ２、ＩＬ１ｂ、およびＰＢＲからなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、ＡＲＲＢ１、ＯＤＣ１、およびＰ２Ｘ７からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、ＡＲＲＢ１、ＣＤ８ａ、およびＩＬ６からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、ＣＤ８ｂ、ＥＲＫ１、およびＭＡＰＫ１４からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、ＡＲＲＢ１、ＥＲＫ１、およびＭＡＰＫ１４からなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。別の実施形態では、本方法は、ＥＲＫ１、ＭＡＰＫ１４、およびＰＢＲからなる群から選択される遺伝子のｍＲＮＡレベルを測定することを含む。

いくつかの実施形態では、上記の方法は、コンピュータに支援された方法である。

５．７情動障害
本明細書中に記述されている精神医学的障害または精神障害、およびそれらの臨床徴候は、開業精神科医に公知である。ほとんどの精神科医は、各障害の特有な症状を認識することができる。

米国精神医学会により出版されたThe Diagnostic and Statistical Manual of Mental Disorders、第4版、改訂版（DSM-IV-TR（登録商標）（1994年10月、2000年5月改訂）（非特許文献７０）は、米国の医師が使用する精神障害の臨床分類用基準である。精神障害／精神医学的障害の症候学および診断判断基準は、ＤＳＭ−ＩＶ−ＴＲ（登録商標）ガイドラインに示されている。

５．７．１抑うつ障害
ＤＳＭ−ＩＶ−ＴＲ（登録商標）には、うつ病および大うつ病性障害（ＭＤＤ）の特定の診断判断基準が列挙されている。

ＤＳＭ−ＩＶ−ＴＲ（登録商標）では、同じ２週間の期間中に、少なくとも以下の症状のうち５つが、以前の適切に機能していた状態からの変化として提示および顕在化する（さらに、（１）または（２）のいずれかが症状に含まれていなければならない）症候群として、大うつ病エピソードが定義されている。：
１．抑うつ気分
２．関心または愉悦の低下
３．著しい体重の減少または増加
４．不眠症または過眠症
５．精神運動性の激越または遅滞
６．疲労または活力喪失
７．自己否定感情
８．思考力または集中力の低下；優柔不断
９．死について繰り返し考えること、自殺念慮、自殺企図、または自殺の具体的な計画

ＤＳＭ−ＩＶ−ＴＲ（登録商標）には、種々のサブタイプのうつ病に存在しているはずの症状の説明がさらに含まれている。うつ病は、精神病の症状を示す場合があり、または示さない場合もあり、メランコリー性の特徴を示す場合があり、または緊張性の特徴を示す場合もあり、非定型うつ病として分類される場合があることが指摘されている。

患者が示す症状の数および重症度に応じて、うつ病エピソードは、軽度、中程度、重度として指定することができる。臨床医は、患者が、定型（メランコリー型）、非定型、緊張性、または精神病性のうつ病を罹患しているかどうかを決定することができる。

臨床的には、うつ病は、異種混合性が非常に高い疾患であると考えられている。うつ病患者の遺伝子発現プロファイルは、この異種混合性を反映する場合がある。本発明に基づくと、患者をより良好に分類または診断するために、遺伝子発現プロファイルに基づき、うつ病のこれらのサブタイプをより良好に定義することが可能である。結果的に、薬物の開発および投与を、うつ病のサブタイプを罹患している患者に個別化することができる。

病歴および症状に関する情報を対照から取得および分析することにより、遺伝子発現プロファイルを使用して、本明細書に記述されている障害の症状を対象が示す可能性も予測される。

抑うつ障害、双極性障害、および気分変調性障害は、気分障害の種類の一部と考えられている。

本主題発明は、軽度、中程度、または重度うつ病などの抑うつ障害を示す転写プロファイルの客観的な尺度を提供する。本主題発明は、抑うつ障害のサブタイプを分類するための転写プロファイルも提供する。本発明は、軽度、中程度、重度うつ病などの抑うつ障害の対象を診断するための方法をさらに提供する。

５．７．２双極性障害
うつ病について記述されているように、双極性障害（ＢＤ）は、異種混合性の疾患であり、双極性Ｉ、双極性ＩＩ、および循環気質を含む下位区分またはサブタイプに区分される。双極性障害は、躁うつ病としても知られており、個人の気分、活力、および機能能力に異常な変調を引き起こす脳障害である。個人が皆経験する正常な「気分の起伏」とは異なり、双極性障害の症状は重度であり、その結果として人間関係への悪影響、仕事または学校の成績不良、および自殺さえももたらす場合がある。

ＢＤは、典型的には、人の生涯にわたって繰り返えされる躁およびうつの断続的エピソードとして現れる。エピソード間では、双極性障害のほとんどの人々は、無症状であるか、または何らかの残留症状を示す場合がある。うつ病エピソードは、存在することが多く、激しい（major）場合もあり、または重度である場合もある。躁病エピソードは、ＤＳＭ−ＩＶ−ＴＲ（登録商標）により記述されているように、仕事における障害または患者もしくは他人に対する危険を引き起こすのに十分であり、物質乱用または医学的状態の結果ではない著しい気分障害、睡眠要求の減少、過度の多弁、談話心迫、および／または思考の奔逸（racing thought）もしくは観念奔逸などの症状を特徴とする。

本発明は、双極性障害の対象を診断するための方法を提供する。ＢＤ患者は、双極性障害を示す転写プロファイルの客観的尺度から利益を得るだろう。

５．７．３境界性人格障害
境界性人格障害（ＢＰＤ）は、自己像、対人関係、および情動に関する、著しく衝動的な不安定性のパターンを含む。この不安定性は、家族および仕事生活および個人の自己同一性を分裂させることが多い。

ＤＳＭ−ＩＶ−ＴＲ（登録商標）では、ＢＰＤは、下記のうちの少なくとも５つにより示されると特徴付けられている：
１．過度の理想化および否定の両極端が交互に訪れることを特徴とする不安定で極端な対人関係のパターン。
２．潜在的に自己損傷的である、例えば、浪費、セックス、物質使用、万引き、無謀運転、または過食のうち少なくとも２つの区分における衝動。
３．著しい気分の反応性による情動不安定性。
４．不適切で極端な怒り、または怒りの抑制の欠如、例えば、かんしゃく、怒りの持続、物理的な喧嘩の反復を頻繁に示すこと。
５．自殺威嚇、身振り、もしくは挙動の反復、または自傷行為。
６．同一性障害；著しく持続的に不安定な自己像。
７．慢性的な空虚感または退屈感。
８．現実または想像による放棄を回避するための尋常でない努力。
９．一時的なストレス関連の妄想様観念または重度の解離症状。

ＢＰＤの患者は、心理療法で見られる最も挑戦的で耐治療性の患者のうちに入る。

本発明は、ＢＰＤの対象を診断するための方法を提供する。ＢＰＤ患者は、境界性人格障害を示す転写プロファイルの客観的尺度から利益を得るだろう。

５．７．４心的外傷後ストレス障害（ＰＴＳＤ）
ＤＳＭ−ＩＶ−ＴＲ（登録商標）では、心的外傷後ストレス障害は、実際の死もしくは重篤な外傷または死もしくは重篤な外傷への脅威を伴う事象を個人的に直接経験することを含む、極端な心的外傷ストレス要因に曝された後で、特徴的症状を発症することとして記述されている。そうした個人は、死、外傷、または別の人の物理的な完全性に対する脅威を伴う事象を目撃した場合がある。そうした事象に対する個人の反応は、極度の恐怖、無力感、または戦慄を含む。そうした個人は、映像、観念、または知覚を含む、執拗な事象の想起を繰り返すか、または事象の悪夢を繰り返す場合がある。

本発明は、急性ＰＴＳＤ、軽減されたＰＴＳＤ、またはＰＴＳＤを伴わない心的外傷を罹患している対象を診断するための方法を提供する。患者／対象は、急性ＰＴＳＤ、軽減されたＰＴＳＤ、またはＰＴＳＤを伴わない心的外傷を示す転写プロファイルの客観的な尺度から利益を得るだろう。

上記に記述されている方法により特定された転写プロファイルに基づき、正常な健常対象と、情動障害を罹患している対象とを決定、識別、および／または区別することが可能である。例として、本発明は、以下の実験の詳細によって、より良好に理解されるだろう。当業者であれば、特定の方法およびそこで考察されている結果は、以下に続く特許請求の範囲において、より完全に記述されている本発明の例示に過ぎないことを直ちに理解するだろう。

６実験の詳細
全ＲＮＡの単離。ヒト血液を、ＰＡＸｇｅｎｅ（商標）血液ＲＮＡチューブ（ＰｒｅＡｎａｌｙｔｉＸ社製、ホンブレヒティコン（Hombrechtikon）、スイス）に収集し、何回か反転させて混合し、ＲＮＡ単離の処理をするまで−２０℃または−８０℃で保管した。処理は、試料を室温で終夜インキュベートすることにより開始し、その後３０００×Ｇで１０分間遠心分離した。上清をデカントし、ペレットを５ｍｌの水に再懸濁し、その後さらなる遠心分離ステップを行った。洗浄および遠心分離ステップを２回繰り返し、ペレットを、チューブに残っている残留水（約１００ｕｌ）に再懸濁した。この溶液に、９４１μｌのＡｍｂｉｏｎ社製ＴｏＴＡＬＬＹＲＮＡ（商標）溶解／変性溶液（Ａｍｂｉｏｎ社製、オースティン、テキサス州）および５９μｌの３Ｍ酢酸ナトリウム、ｐＨ５．５（Ａｍｂｉｏｎ社製）を添加し、その後混合した。室温で１５分間インキュベーションした後、７７０μｌの酸性フェノール／クロロホルム（Ａｍｂｉｏｎ社製）を添加し、チューブをボルテックスして混合した。溶液を、２ｍｌのプラスチック・スクリューキャップ・チューブに移し、室温で５分間インキュベートした。フェノール抽出物を、最大速度（およそ１３，０００×Ｇ）で１分間、微量遠心機で遠心し、水層（１１００μｌ）を、５５０μｌの１００％エタノールを含有する新しいチューブに移した。混合した後、溶液を、Ａｍｂｉｏｎ社製ＲＮＡｑｕｅｏｕｓ（登録商標）−９６自動化キットろ過プレートの１つのウエルにアプライし、製造業者のプロトコールに従ってＲＮＡを精製した。ＲＮＡを溶出した後、試料を、ＤＮａｓｅＩ（Ｉｎｖｉｔｒｏｇｅｎ社製、カールズバッド、カリフォルニア州）で２回処理して、残基ゲノムＤＮＡを除去した。３ユニットの酵素を加えた１×ＤＮａｓｅ消化緩衝液中で、ＲＮＡを室温で１時間インキュベートした。終濃度が１３ｍＭになるようにＥＤＴＡを添加し、その後６８℃で１０分間加熱することにより酵素を不活化した。ＭｕｌｔｉＳｃｒｅｅｎ（登録商標）ＰＣＲ_{マイクロ９６}プレート（Ｍｉｌｌｉｐｏｒｅ社製、ビルリカ、マサチューセッツ州）を通過させて混合物を脱塩し、５０μｌの水で溶出した。１μｌ等量のＲＮＡを、Ａｇｉｌｅｎｔ社製２１００バイオアナライザー（Ａｇｉｌｅｎｔ社製、バルトブロン、ドイツ）で分析し、残りを−８０℃で保管した。ＲＮＡ試料の品質は、バイオアナライザー・ソフトウェアにより計算されたＲＩＮ値を使用して評価した。

ｃＤＮＡ合成
ｃＤＮＡの合成は、１６．５μｌの最終容積中で、およそ１μｇの全ＲＮＡを１．５μｌのランダム六量体（Ｉｎｖｉｔｒｏｇｅｎ社製、５００ｎｇ／μｌ）と混合することにより達成した。７５℃で１０分間および２５℃で１０分間インキュベーションした後、６μｌの第１鎖緩衝液（Ｉｎｖｉｔｒｏｇｅｎ社製）、１．５μｌの１０ｍＭｄＮＴＰ（Ｉｎｖｉｔｒｏｇｅｎ社製、各ｄＮＴＰ１０ｍＭ）、１．２５μｌのＳｕｐｅｒｓｃｒｉｐｔＩＩ（商標）（Ｉｎｖｉｔｒｏｇｅｎ社製、２００単位／μｌ）、および４μｌの水を添加した。最終反応容積は３０μｌであり、インキュベーションは、２５℃で１０分間、４２℃で１時間、および９５℃で１０分間実行した。７０μｌの水を添加するまで、反応物を４℃に冷却し、その後ＭｕｌｔｉＳｃｒｅｅｎ（登録商標）ＰＣＲ_{マイクロ９６}プレートを用いて精製した。１００μｌの水を用いてｃＤＮＡの溶出を実行し、その結果生じた物質を、定量化するまで−２０℃で保管した。ある場合には、ｃＤＮＡ反応の容積を２倍にして、物質の収量を増加させた。

ｃＤＮＡの定量化
染料インターカレーション・アッセイを使用して、ｃＤＮＡ収量を決定した。５μｌのｃＤＮＡを、４７μｌの最終容積中で、７μｌの０．５ＮＮａＯＨ、５０ｍＭＥＤＴＡと混合する。混合物を６５℃で１時間インキュベートしてＲＮＡを加水分解し、その後１０μｌの１Ｍトリス、ｐＨ７を添加することにより中和した。２５μｌ等量の加水分解反応液中のｃＤＮＡ濃度は、製造業者の説明書に従ってＱｕａｎｔ−ｉｔ（商標）Ｏｌｉｇｒｅｅｎ（登録商標）ｓｓＤＮＡ試薬（Ｉｎｖｉｔｒｏｇｅｎ社製）を使用して測定した。未知試料を、既知濃度の一本鎖ＤＮＡを使用して生成した検量曲線と比較した。蛍光測定はすべて、Ｆｕｓｉｏｎ（商標）アルファ装置（パッカード社製、メリダン（Meridan）、コネティカット州）を使用して行った。重複した加水分解反応液から得られた値を、未知ｃＤＮＡ試料の各々について平均した。重複測定が互いに１５％以内でなかった場合、第３の試料を実行し、前の２つの測定値と比較して、２つの最も近い値を平均した。

定量ポリメラーゼ連鎖反応（ｑＰＣＲ）
ｑＰＣＲの実行はすべて、表１Ａおよび１Ｂに示されているプライマー／プローブ・セットを使用して、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ社製７９００ＨＴ迅速リアルタイムＰＣＲシステム（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ社製、フォスターシティ、カリフォルニア州）またはＭＸ３０００Ｐ（登録商標）（Ｓｔｒａｔａｇｅｎｅ社製、ラホーヤ、カリフォルニア州）のいずれかで実施した。プローブはすべて、５’末端のＦＡＭ（商標）（Ａｐｐｌｅｒａ社製、ノーウォーク、コネティカット州）および３’末端のＢＨＱ−１（登録商標）消光体で標識されており、Ｂｉｏｓｅａｒｃｈ社（ノバート、カリフォルニア州）が合成した。各プライマー／プローブ・セットを検証して、アッセイの発現範囲にわたって、ＰＣＲ増幅の効率がおよそ１００％であることを保証した。各ヒト供与体由来のｃＤＮＡを１ウエル当たり１ｎｇまたは１０ｎｇのいずれかで含有する重複プレート（９６ウエル形式）を構築した。プレートは、２つの陰性対照ウエル（「ＮＴＣ」、水のみ）および１０個体の血液に由来する貯溜された市販のｃＤＮＡ（参照ｃＤＮＡ）の３つのウエルも含有する。各ｑＰＣＲ反応液は２５μｌ（最終容積）であり、下記の成分を含有していた：１２．５μｌのＢｒｉｌｌｉａｎｔＱＰＣＲＭａｓｔｅｒＭｉｘ（登録商標）（Ｓｔｒａｔａｇｅｎｅ社製）、４００ｎＭの順方向プライマー、４００ｎＭの逆方向プライマー、５０ｎＭのプローブ、および６０ｎＭ／３００ｎＭのＲＯＸ（商標）（Ａｐｐｌｅｒａ社製）（ＭＸ３０００Ｐ（登録商標）７９００ＨＴ装置）。サイクル条件は、９５℃、１０分間、その後９５℃、１５秒間；６０℃、１分間の４０サイクルだった。重複ｑＰＣＲの実行は、各遺伝子について実施した。例外的に、遺伝子の重複プレートが十分に一致しなかった場合、第３のｑＰＣＲプレートを実行した。取得されたＣｔ値に応じて、３つすべてのプレートからの値を平均するか、または異常なプレートをさらなる解析から除外した。

ｑＰＣＲの実行に使用した装置では、予備データ分析ステップが求められた。しかしながら、各々の場合、目的は、増幅曲線の中間点付近の増幅閾値を、所与のプレートの試料すべてに使用された同じ閾値に設定することだった。同じ遺伝子の重複プレート実行の閾値は、必ずしも同一でなかったが類似していた。ＭＸ３０００Ｐ（登録商標）の場合、以下の設定を使用して最初に閾値を決定した：平滑パラメーター＝５、ＭＸ４０００アルゴリズムを使用した基線計算、およびシグマ乗算器（sigma multiplier）によるサイクル６からサイクル１４を使用したバックグラウンドに基づく閾値は２０。必要な場合は、閾値の細かい調整を手動で行って、閾値を増幅プロットのほぼ中央に設定した。７９００ＨＴでのプレート実行の場合、装置の初期設定を使用して、最初に閾値を設定した。必要な場合は、その後手動調整を行った。

遺伝子発現の標準化
異なる試料間の遺伝子発現プロファイルを有効に比較するために、あらゆる根本的な生物学的変化を遮蔽する可能性がある変動を制御することが望ましい。例えば、酵素反応の効率、装置の性能、およびピペッティングの日差はすべて、所与の日に得られるシグナルに影響を及ぼすだろう。これらの変動の影響を最小限にするための好ましい方法は、多重正規化遺伝子の使用による（Andersen, C. L.ら、Cancer Res、2004年、64巻：5245〜5250頁（非特許文献７１）；Jin, P.ら、BMC Genomics、2004年、5巻：55頁（非特許文献７２）；Huggett, J.ら、Genes and Immunity、2005年、6巻：279〜284頁（非特許文献７３））。理想的な標準化遺伝子は、便利に測定されるレベルで発現され、実験計画の一部である操作によっては変化しない。標準化遺伝子の使用は普通のことであるが、研究者らは、自身が使用する遺伝子が自身の実験系で安定的に発現されるかどうかを検証しないことが多い。この問題を回避するために、市販のソフトウェア・プログラムであるＧｅＮｏｒｍ（商標）（ＰｒｉｍｅｒＤｅｓｉｇｎＬｔｄ社製、サウスハンプトン、英国）を使用した。その方法は、Vandesompele, J.ら、Genome Biol、2002年、3巻（7号）：RESEARCH0034.1-0034.11（電子出版 2002年6月18日）（非特許文献７４）による公表研究に基づいており、標準化遺伝子候補が安定的に発現されるかどうかを決定することを可能にする。標準化遺伝子を選択するためには、まず、血液試料を用いて実施された実験に重点をおいて文献を走査し、ヒトでの遺伝子発現を標準化するために研究者により以前に使用された遺伝子を特定する（Vandesompele, J.ら、Genome Biol、電子出版 2002年6月18日、3巻（7号）：RESEARCH0034.1-0034.11（非特許文献７４）、特に0034.5頁、表3；Applied Biosystems Application Note 2006年、publication 127AP08-01（非特許文献７５）、特に３頁、図１）。この探索から、表１Ｂに示されている遺伝子を特定した。これら遺伝子が、本実験における標準化に有効だったことを確認するために、７つの遺伝子の発現プロファイルを、正常対象、薬物治療を受けていないうつ病患者、および薬物治療を受けているうつ病患者を含む異なる実験セットに由来する血液試料を使用して、Ｇｅｎｏｒｍ（商標）で分析した。すべてのセットにおいて、７つの遺伝子の組合せは、０．１５以下の対比変動値（Ｖ）により決定したところ、良好な標準化を達成した（Vandesompele, J.ら、Genome Biol、電子出版 2002年6月18日、3巻（7号）：RESEARCH0034.1-0034.11（非特許文献７４））。

Ｇｅｎｏｒｍ（商標）によると、標準化のためには２つまたは３つの最良遺伝子を使用することが必要なだけであると記されているが、いくつかの理由で、３つを超える標準化遺伝子の組合せを考慮すべきである。第１に、より多くの標準化遺伝子を使用することにより、新しい薬物治療、遺伝的バックグラウンド、または疾患状態が、標準化遺伝子の発現に影響を及ぼす場合があることを考慮して、予測が支援されるだろう。３つを超える標準化遺伝子は、特定の実験で安定的に発現されないあらゆる遺伝子の影響を低下させることにより、プロセスを向上させることが期待される。また、発現データを標準化するために一貫して３つを超える遺伝子を使用することにより、長い期間をかけて実施されたすべての研究から発現結果を比較することができる。臨床試料は、適切な対照と必ずしも一致するとは限らないため、３つを超える標準化遺伝子の使用を考慮することは重要である。異なる実験にわたって遺伝子発現を比較する場合、３つを超える遺伝子を用いた標準化が好ましい方法であるが、比較する試料がすべて同じ様式で処理されていれば、任意の特定の実験において２つまたは３つの遺伝子を使用することは依然として有効である。

本明細書に記述されている遺伝子のいずれのプライマーも、上記の５．４．１．２節に記述されているように設計することができる。表１Ａおよび表１Ｂで特定されている遺伝子の公的に利用可能な配列は、遺伝子受入番号（ＧｅｎＢａｎｋデータベース）により示されており、参照によりそれらの全体が本明細書に組み込まれる。表１Ａおよび表１Ｂで特定されている遺伝子の配列は、表に示されている適切な配列番号により列挙されているように添付の配列表に開示されている。

転写データ分析
重複ＰＣＲプレートに由来する各未知試料の平均Ｃｔ（サイクル閾値）値を、各遺伝子ごとに決定した。リアルタイムＰＣＲアッセイでは、陽性反応を、蛍光シグナルの蓄積により検出する。Ｃｔは、蛍光シグナルが閾値を超える（つまり、バックグラウンド・レベルを超過する）のに必要なサイクル数として定義される。Ｃｔレベルは、試料中の標的核酸の量に反比例する（つまり、Ｃｔレベルが低ければ低いほど、試料中の標的核酸の量は大きくなる）。

各未知ｃＤＮＡ試料ならびに参照ｃＤＮＡの相対的発現レベルを、７つの標準化遺伝子からの平均Ｃｔ値を使用して、２^{−デルタＣｔ}法（Livak, K.およびSchmittgen, T.、Methods、2001年、25巻：402〜408頁（非特許文献７６））で計算した。次に、参照ｃＤＮＡの相対的発現レベルを１００％に設定し、その後他のすべての試料を、参照の割合として表した。最後に、これら割合を、参照ｃＤＮＡに含有されていた各遺伝子のコピー数と乗算することにより、これら割合をｃＤＮＡの１ｎｇ当たりのコピー数に変換した。

単変量統計分析およびグラフ化
遺伝子発現値と、患者／対象の質問票から得た臨床パラメーターとの間の相関性を、Ｒ統計パッケージを使用して調査した。質問票データを必要に応じてコード化して、比較を容易にした。遺伝子発現データを解析前に対数変換し、パラメトリック分析およびノンパラメトリック分析を両方とも実施した。有意性の閾値を、ｐ＜０．０５に設定した。例えば、表３を参照されたい。単変量検定を使用して、特定の遺伝子が一貫して上方制御または下方制御されているかどうかを、所与の対象集団ごとに決定した。

対照対象とうつ病患者との間で発現レベルを比較する散布図およびそれに伴う単変量統計分析を、ＧｒａｐｈＰａｄＰｒｉｓｍ４（登録商標）（ＧｒａｐｈＰａｄＳｏｆｔｗａｒｅ，Ｉｎｃ社、サンディエゴ、カリフォルニア州）を使用して、各遺伝子ごとに生成した。遺伝子発現値は、必ずしも正規的に分布しないため、ノンパラメトリックなマン・ホイットニー検定を使用してグループを比較した。有意性の閾値を、ｐ＜０．０５に設定した。若干の遺伝子およびそれらの血中の相対的発現レベルは、図２〜７に例示されている。

多変量解析
罹患患者と健常対照対象を区別するために、分類アルゴリズムを使用した。分類アルゴリズム、典型的には機械学習アルゴリズムは、以下の２つのステップに従って実行される：（１）ｍＲＮＡ転写データセットから、その遺伝子発現レベルが集団的に最も情報価値の高いことが見出される遺伝子のサブセットを選択する；（２）ステップ（１）で識別されるような遺伝子のサブセットに対してトレーニングされた事前選択タイプの分類アルゴリズムをトレーニングし、返す。

（１）遺伝子の選択
第１のステップでは、健常対照対象およびうつ病対象または他の罹患対象からのｍＲＮＡ転写データセットを、集団的にランダム・フォレスト・アルゴリズム（Breiman, L.、2001年、Machine Learning 45巻（1号）：5〜32頁（非特許文献６０））の入力として使用した。各データセットは、表１Ａに列挙されている遺伝子と本明細書に記述されている方法とに基づいて、各対象の血液試料に由来するｍＲＮＡ転写データを表している。最も重要でない遺伝子を連続的に除去することにより、ランダム・フォレスト・アルゴリズムは、アウト・オブ・バッグ（ＯＯＢ、out-of-bag）誤差最小化判断基準を使用して、最も重要な遺伝子を含有するリストを返す（Liaw, A、およびWiener, M. 2002年、12月、Classification and regression by randomForest. R News Vol. 2/3：18〜22頁（非特許文献７７））。

（２）トレーニングおよび分類化
第２のステップでは、サポート・ベクター・マシン分類アルゴリズム（Cortes, C.およびVapnik, V. 1995年、Machine Learning、20巻（3号）：273〜97頁（非特許文献６１））などを、ステップ（１）のようにして特定された最も重要な遺伝子に関連する転写プロファイルを使用して調整し、相互検証法に基づいてトレーニングした。

別の方法では、段階的ロジスティック回帰法を、最も重要であるかまたは最も説明的な遺伝子を選択するステップ（１）、および分類用アルゴリズムを相互検証法によりトレーニングするステップ（２）の両方のために使用する。

他の解析では、ＲＶＭ分類器を遺伝的アルゴリズムと共に使用した。データセットを、ＲＶＭアルゴリズムを用いてトレーニングし、遺伝的アルゴリズムは、異なるサブセットの候補変数に対してトレーニングおよび試験された多数のＲＶＭを評価して、考え得る遺伝子相互作用を識別した。各変数サブセットの性能は、相互検証により評価した。

トレーニング・ステップ中に、リーブ・ワン・アウト相互検証法（ＬＯＯＣＶ）または１０分割相互検証法などの相互検証法が、アルゴリズムにより実施された。相互検証法は、解析が単一サブセットについて初期に実施されるように、データの試料を別個のサブセットに分別し、他のサブセット（複数可）は、初期解析の確認および検証にその後使用するために保持されるという統計的行為である。データの初期サブセットはトレーニング・セットであり、他のサブセット（複数可）は、それらの分類を決定するために、未知として処理される検証または試験セットである。

例えば、全試料に由来するデータ（Ｎ）を、２つの別個のサブセットに分割し、データの一方のサブセット（ｍ）を試料の検証に使用する、つまりサブセットｍを未知のセットとして使用する。残りのサブセット（Ｎ−ｍ）により、分類アルゴリズムがトレーニングされる。そのような相互検証（ＣＶ）法を、データセットがすべて未知として処理されるまで繰り返す。正確度の値および予測値は、未知として処理された試料の各々が正確に分類したかどうかに基づいて計算することができる。

１つのそのような相互検証法では、分類アルゴリズムは、試料データセットの９０％を用いてトレーニングされ、試料データの残りの１０％の分類は、トレーニングされたアルゴリズムにより予測される。そのような１０分割ＣＶを、１０回繰り返す。相互検証法は「動作曲線」を示すことができる。つまり、トレーニングされた分類アルゴリズムは、何らかの無作為選択プロセスよりも良好に、例えば偶然よりも良好に機能する。上記の（１）および（２）で示されている指示に従って構築された分類アルゴリズムの分類誤差を推定するために、正確度、陽性的中率（ＰＰＶ）、および陰性的中率（ＰＰＶ）の計算を行って、トレーニングされた分類アルゴリズムが良好に機能した程度を決定した。

トレーニングされた分類アルゴリズムの正確度は、試料の総数中の正確分類の総数である。

上記の方法により「罹患」クラスに正確にスコアされたデータセット（つまり、対象）の数は、陽性的中率（ＰＰＶ）の尺度をもたらす。正確度率とも呼ばれるＰＰＶまたは疾患の事後確率は、正確に診断された陽性検査結果を有する患者の割合である。

また、上記の方法により「健常」または「対照」群に正確にスコアされたデータセット（つまり、対象）の数は、陰性的中率（ＮＰＶ）の尺度をもたらす。陰性的中率は、正確に診断された陰性検査結果を有する患者の割合である。

無作為化（並べ替え）データセットの解析
ＳＬＲまたはＳＶＭを使用して取得された分類の正確度が有意であったかどうか、つまり偶然より良好であったかどうかを決定するために、各データセットを以下のようにさらに解析した：
ａ）元のデータセットの正確度を、上記に説明されている方法により取得した。
ｂ）３つの新しい並べ替えデータセットを生成し、元のデータセットと同じような患者の割合を依然として維持しつつ、個々の試料の各々の帰属を無作為に割当てた。
ｃ）その後、各無作為化されたデータセットの正確度を計算した。
ｄ）１０個の正確度（元のデータセットの１０分割ＣＶから）を、マン・ホイットニー検定を使用して３０個の並べ替え正確度（１０分割ＣＶに基づいて行った３つのランダム・セット）と比較した。
ｅ）０．０１未満のｐ値をもたらす比較は、元のデータセットからの正確度が無作為の偶然によらないことを意味し、つまり対照群および患者群を分離することができることを意味すると解釈された。０．０１を超えるｐ値をもたらす比較は無作為であるとみなされ、患者群および対照群を確信を持って分離されないことを意味する。

転写プロファイルの特定に使用された患者／対象
これらの研究の１つの目的は、情動障害などの神経精神障害のリスクにある表現型を特定するのを支援することができる、正常供与体およびサブグループの血液で特定された転写プロファイルを、定義、相関、および関連させることであった。正常供与体の基線転写プロファイルを確立した後、正常集団と、臨床的に診断されたうつ病、重度うつ病、双極性障害、ＢＰＤ、またはＰＴＳＤを罹患している患者との間で比較を行った。これらの研究の別の目的は、対象を、正常対照またはうつ病、重度うつ病、双極性障害、ＢＰＤ、もしくはＰＴＳＤなどの情動障害を罹患している患者のいずれかに分類することができるプロファイルを特定することであった。

正常集団内のサブグループの存在、例えばリスク・プロファイルを有する対象を決定し、サブグループを全血の転写プロファイルと相関させることができるように、正常志願者の基線データベースを確立した。

対照患者／対象（米国）
５００個の血液試料を、ペンシルベニア州南東部およびデラウェア州区域に対応している血液銀行で献血する正常志願者から収集した。全供与者からインフォームドコンセントを得た。個人情報を不可逆的に匿名化した。

集団内の分散を最小限にするために、供与者を白人に限定した。集団内では、供与者は性別が均等に分かれていた。供与者について血液銀行で使用された上記のもの以外の追加的な排除要因はなかった。供与者は皆、全身健康状態、医学的問題、薬物使用および乱用、家族歴、ならびに精神医学的問題の特徴付けを支援するための質問票に記入することが求められた。質問票の項目は、著作権の制約無しで使用可能な標準的精神医学尺度に基づいていた。質問票の答えは自己申告であり、供与者は医学的評価または精神医学的評価を受けなかった。質問票は、表２に分類された要因を含む複数の要因を包含していた。

詳細な質問票を使用して、供与者の精神医学的障害の将来的リスクを増加させる場合がある供与者の病歴または現在の医学的状態における複数の要因に関するデータを取得し、固有の転写プロファイルを、質問票を使用して特定された特定の表現型に関連させた。このデータを使用して、正常集団を区分し、現在使用可能な方法を用いるよりも信頼性が高く一貫して、うつ病患者内の区画を特定した。評価された要因には、（これらに限定されないが）以下が含まれる：最近のストレスの多い生活上の出来事の重大さ、若年期ストレスの存在および重大さ、精神医学的障害の家族歴、ならびに食欲および睡眠パターンの変化を含む前うつ自律神経症状群。必要な場合、複数の質問群のスコアを統合して、複数の否定的要因、つまり症状スコアの影響を評価した。

潜在的に血液転写プロファイルに影響を及ぼし得る喫煙または肥満度指数（ＢＭＩ）などの共通因数は、極端と考えられる場合があるが、それらの交絡を回避するために、質問票データを使用して、デモグラフィックス的、個人的、または医学的属性の特定可能なパターンにより、供与者をグループ化した。これら要因を独立して評価し、転写プロファイルに対するそれらの影響を評価した。これらが前うつ表現型の特定を交絡させる場合があり、そのような要因には、ＢＭＩ、喫煙、アルコール乱用、薬物使用（および乱用）が含まれるため、供与者の特定および区分は、転写プロファイルに対するそれらの影響を評価するための非精神医学的な要因によるものであった。他の要因の影響も評価した。

対照患者／対象（デンマーク）
２００人の対象を、デンマーク民族出身（２世代までさかのぼる）に基づき、デンマークを地理的に包含するおよそ１０００人の健常志願者（対照対象）からの初期採血から選択した。したがって、出生地（および両親および祖父母の出生地）に関するデータを取得した。全身健康状態および精神医学的病歴を最初に取得した。精神医学的病歴情報を、うつ病の以前のエピソードに簡単なスクリーニングで補完した。２００人の対照対象のコホートでは、およそ４０歳の平均年齢（１８〜６５歳の範囲）の男性および女性の同様な分布がもたらされた。各対象は、身長、体重の評価、腹部周りおよび臀部周りの測定、ならびにＥＫＧを含むちょっとした健康診断を受けた。各対象は、人格のある種の特性ならびに医学的疾病および精神的疾病のより完全な家族歴に関して対象が特徴付けられた詳細な質問票に記入した。（表２を参照。）

上記で言及したような対照対象により提供されるデータを使用して、正常集団を区分し、特定の表現型を、末梢血で特定された転写プロファイルの変化と関連させた。表３Ａおよび３Ｂを参照されたい。

対照患者／対象（英国）
血液試料を、英国での管理された臨床研究に参加した健常志願者から収集した。全供与者からインフォームドコンセントを得た。この研究には男性および女性が含まれていた。女性は、容認された避妊法（二重障壁避妊）を使用する場合、外科的に避妊されいた場合、または閉経後（２年間月経がないと定義された）であった場合には参加したが、経口避妊薬は許可されなかった。参加した対象は、年齢が≧１８歳および≦４５歳であるが、≧６５歳未満である。この研究に参加した各対象は、研究者の見解では、研究前の身体検査、病歴、生命徴候、ＥＣＧ、ならびに血液生化学的、血液学的、および血清学的検査の結果、ならびに尿検査に基づき健康である。

うつ病患者の転写プロファイルの特定
うつ病患者の転写プロファイルの変化を評価するために、うつ病患者、つまり大うつ病性障害（ＭＤＤ）を罹患している患者に由来する血液を、管理された臨床研究で取得した。全供与者からインフォームドコンセントを得た。

患者選択基準：
研究に適格な患者／対象は、基線来院でＭＡＤＲＳ合計スコア≧２６およびＣＧＩ−Ｓスコア≧４を有する中程度のＭＤＤを罹患している男性または女性の外来患者だった。ＭＤＤの初期診断は、ＤＳＭ−ＩＶ−ＴＲ（登録商標）基準によるものでなければならない。患者は、年齢が１８〜６５歳であり（両端の年齢を含む）、精神科外来診療所および一般開業医で募集した。強迫性障害（ＯＣＤ）、心的外傷後ストレス障害（ＰＴＳＤ）、またはパニック障害（ＰＤ）以外に、二次的共存性不安障害を罹患している患者（ＤＳＭ−ＩＶ−Ｔｒ（登録商標）基準）は、この研究に参加することができた。さらに、それ以外では、患者は、研究者の見解では、身体検査、病歴、および生命徴候に基づいて健康だった。研究者の見解で、臨床研究プロトコールを遵守しない可能性の高い患者、または任意の理由で不適格であった患者は、研究から除外してもよい。

うつ病患者の転写プロファイルの特定
重度大うつ病性障害（ＳＭＤＤ）を罹患している患者の転写プロファイルの変化を評価するために、これら患者に由来する血液を、管理された臨床研究で取得した。全供与者からインフォームドコンセントを得た。

患者選択基準：
この研究に適格な患者／対象は、精神科外来診療所で募集されたＳＭＤＤを罹患している外来患者であり、年齢が１８〜６５歳（両端の年齢を含む）の男性または女性だった。この研究に参加した患者は皆、３０以上のＭＡＤＲＳ合計スコアを有するべきだった（つまり、より重度のうつ病患者）。選択された患者は、ＤＳＭＩＶ−ＴＲ（登録商標）基準による初期診断として大うつ病エピソード（ＭＤＥ）を罹患している（精神疾患簡易構造化面接法（ＭＩＮＩ、Mini International Neuropsychiatric Interview）で評価された現在のエピソード）。現在のＭＤＥが報告された期間は、少なくとも３カ月であり、基線で１２カ月未満である。患者は、中程度のうつ病患者に関して上記に説明されているような基準に基づいて、研究に参加する／除外される。研究者の見解で、臨床研究プロトコールを遵守しない可能性の高い患者、または任意の理由で不適格であった患者は、研究から除外することができた。

双極性患者の転写プロファイルの特定
双極性患者の転写プロファイルの変化の評価するため、双極性患者から血液を取得した。これら患者は、精神科医による詳細な評価を受けており、医療を受けていた。全供与者からインフォームドコンセントを得た。

患者選択基準：
患者／対象が、このプロトコールに基づいて血液を供与することができる前に、以下の基準が満たされていなければならない：
ａ）患者は、ＤＳＭＩＶ−ＴＲ（登録商標）により、中程度または重度大うつ病または双極性Ｉと診断されている。患者の８７パーセントは、双極性Ｉ型障害のＤＳＭＩＶ−ＴＲ（登録商標）基準を満たした。
ｂ）血液収集時に、患者は、いかなる精神薬理学的薬物も服用しておらず、いかなる精神薬理学的薬物も少なくとも２週間服用していない。加えて、患者は誰も、少なくとも２カ月の間、フルオキセチン、不可逆的ＭＡＯＩ、または蓄積性神経遮断薬で治療されていない。
ｃ）患者は、他の急性精神科的症状、例えば物質乱用を罹患していない。
ｄ）可能な場合は常に、女性患者からの血液試料は、月経開始の２週間以内に収集されるべきである。いかなる場合でも、最後の月経の１日目の日付は記録されることになる。
ｅ）患者は、過去６カ月間、いかなる非合法薬物／乱用薬物を摂取していない。
ｆ）患者は、過去６カ月間、アルコールを乱用していない。
ｇ）女性患者は妊娠しておらず、授乳していない。
ｈ）患者は、現在のところ（前週を含む）、他のいかなる一般的な急性医学的状態（軽度の状態、例えば感冒を含む）も罹患していない。
ｉ）患者は、現在のところ（前週を含む）、いかなる定期的な薬物治療（経口避妊薬、薬草療法、栄養補助剤、ビタミンを含む）も受けていない。
ｊ）患者は、血液試料収集前の週内に、いかなる薬物治療（経口避妊薬、薬草療法、栄養補助剤、ビタミンを含む）も受けるべきではない。薬物を摂取した場合、例えば急性の頭痛の場合、血液試料収集を１週間遅延させるべきである。
ｋ）患者が喫煙を示す場合、１日当たりの平均量に関する情報を提供する必要がある。
ｌ）患者が、乱用ではないアルコール消費を示す場合、１週当たりの平均量に関する情報を提供する必要がある。
ｍ）患者は、血液試料収集に伴う質問票を提出した。
ｎ）患者は、患者情報を読み理解した。
ｏ）患者は、インフォームドコンセントに署名した。

このプロトコールに基づき血液を供与するすべての患者から、以下の情報を取得しなければならない：詳細な精神医学的病歴および一般的病歴、精神医学的家族歴、現在症状の詳細な臨床的記述、少なくとも過去３カ月間の薬物治療歴、ならびに少なくとも過去６カ月間の非合法および合法薬物の乱用に関する情報。

境界性人格障害患者の転写プロファイルの特定
境界性人格障害（ＢＰＤ）の患者の転写プロファイルの変化を評価するために、境界性人格障害患者から血液を取得した。これら患者は、精神科医による詳細な評価を受けており、医療を受けていた。全供与者からインフォームドコンセントを得た。

ＢＰＤ研究用の患者／対象選択基準：
患者が、このプロトコールに基づいて血液を供与することができる前に、以下の基準が満たされていなければならない：
ａ）患者は、ＤＳＭ−ＩＶ（登録商標）により、境界性人格障害と診察されている。
ｂ）未治療患者群の場合、血液収集時に、患者は、いかなる精神薬理学的薬物も服用しておらず、いかなる精神薬理学的薬物も少なくとも２週間服用していない。フルオキセチン、不可逆的ＭＡＯＩ、または蓄積性神経遮断薬で過去に治療された患者は、血液収集前の少なくとも４週間は、これら薬物治療のいずれも受けていない。
ｃ）患者の小さなコホート（およそ２５人の患者）からの血液試料は、原発性精神障害（境界性人格障害）の急性精神医学的増悪期に収集されるだろう。他のすべての患者は、血液収集時に急性精神医学的増悪を罹患していないだろう。血液が急性増悪期に試料採取される患者でのみ、第２の試料が寛解中に収集されるだろう。医学的に可能な場合は常に、２時点での取扱いは同じだろう。
ｄ）患者は、他の急性精神科的症状、例えば物質乱用を罹患していない。
ｅ）可能な場合は常に、女性患者からの血液試料は、月経開始の２週間以内に収集されるべきである。いかなる場合でも、最後の月経の１日目の日付は記録されることになる。
ｆ）患者は、過去６カ月間、いかなる非合法薬物／乱用薬物を摂取していない。
ｇ）患者は、過去６カ月間、アルコールを乱用していない。
ｈ）女性患者は妊娠しておらず、授乳していない。
ｉ）患者は、現在のところ（前週を含む）、他のいかなる一般的な急性医学的状態（軽度の状態、例えば感冒を含む）も罹患していない。
ｊ）患者は、現在のところ（前週を含む）、処方されたベンラファクシンまたはデュロキセチン以外のいかなる定期的な薬物治療（経口避妊薬、薬草療法、栄養補助剤、ビタミンを含む）も受けていない。
ｋ）患者が、ベンラファクシンまたはデュロキセチンで治療されている場合、治療は、少なくとも３カ月間は現在の用量で与えられていなければならない。
ｌ）患者は、血液試料収集前の週内に、いかなる薬物治療（経口避妊薬、薬草療法、栄養補助剤、ビタミンを含む）も受けるべきではない。薬物を摂取した場合、例えば急性の頭痛の場合、血液試料収集を１週間遅延させるべきである。
ｍ）患者が喫煙を示す場合、１日当たりの平均量に関する情報を提供する必要がある。
ｎ）患者が、乱用ではないアルコール消費を示す場合、１週当たりの平均量に関する情報を提供する必要がある。
ｏ）患者は、血液試料収集に伴う質問票を提出した。
ｐ）患者は、患者情報を読み理解した。
ｑ）患者は、インフォームドコンセントに署名した。

このプロトコールに基づいて血液を供与するすべての患者から、家族歴、臨床的記述、ならびに薬物治療および薬物記録を含む詳細な精神医学的病歴を取得した。

患者は、転写プロファイルを交絡させる場合がある要因、例えば薬物使用、一般的医学的状態に特に取り組むために開発された質問票に記入した。患者は研究者に質問票を提出した。質問票は、転写解析サイトの人員に患者の身元が開示されないことを保証するために、血液試料および他の臨床データと同じコードでコード化された。質問票は、血液試料と一緒に転写解析サイトに移動させた。

心的外傷後ストレス障害（ＰＴＳＤ）患者の転写プロファイル
ＰＴＳＤの患者の転写プロファイルの変化の評価するため、ＰＴＳＤ患者から血液を取得した。これら患者は、精神科医による詳細な評価を受けており、医療を受けていた。全供与者からインフォームドコンセントを得た。

ＰＴＳＤ研究用の患者／対象選択基準：
この研究の対象は、以下の基準を満たした男性だった：
ａ）対象は、急性ＰＴＳＤまたは軽減されたＰＴＳＤと診断されているか（ＤＳＭ−ＩＶ（登録商標）による）、または心的外傷に曝されておりＰＴＳＤを発症していないか、または対照と分類される。心的外傷に曝されておらず、同じ地理的区域の出身だった対照を、この研究に選択した。
ｂ）血液収集時に、患者は、いかなる精神薬理学的薬物も服用しておらず、いかなる精神薬理学的薬物も少なくとも２週間服用していない。フルオキセチン、不可逆的ＭＡＯＩ、または蓄積性神経遮断薬で過去に治療された患者は、血液収集前の少なくとも４週間は、これら薬物治療のいずれも受けていない。
ｃ）患者は、他の急性精神科的症状、例えば物質乱用を罹患していない。
ｄ）患者は、過去６カ月間、いかなる非合法薬物／乱用薬物を摂取していない。
ｅ）患者は、過去６カ月間、アルコールを乱用していない。
ｆ）患者は、現在のところ（前週を含む）、他のいかなる一般的な急性医学的状態（軽度の状態、例えば感冒を含む）も罹患していない。
ｇ）患者は、血液試料収集前の週内に、いかなる薬物治療（薬草療法、栄養補助剤、ビタミンを含む）も受けるべきではない。薬物を摂取した場合、例えば急性の頭痛の場合、血液試料収集を１週間遅延させるべきである。
ｈ）患者が喫煙を示す場合、１日当たりの平均量に関する情報を提供する必要がある。
ｉ）患者が、乱用ではないアルコール消費を示す場合、１週当たりの平均量に関する情報を提供する必要がある。
ｊ）患者は、現在のところ（前週を含む）、いかなる定期的な薬物治療（薬草療法、栄養補助剤、ビタミンを含む）も受けていない。

上記に記述されているような臨床データおよびデモグラフィック・データはすべて、血液収集サイトで収集し、その後転写解析サイト（ＬｕｎｄｂｅｃｋＲｅｓｅａｒｃｈＵＳＡ社、パラマス、ニュージャージー州）に情報を移動させた。臨床的特徴と転写プロファイルとの任意の関係性の探検解析は、ＬｕｎｄｂｅｃｋＲｅｓｅａｒｃｈＵＳＡ社において、患者の身元を知ることなく実施された。

結果および考察
対照対象の転写プロファイルの同定。
表１Ａに列挙されている２９個の遺伝子の遺伝子発現レベルを、２つの対照群（米国およびデンマーク）からの対象を含む対照対象からの血液試料で測定した。

これら個体は皆、健康であるが、質問票の項目に対する特定の回答と相関する遺伝子発現の傾向が特定された。そのような傾向は、特定された場合、うつ病患者の集団で誇張される可能性がある。

質問票回答を統計分析のためにコード化された値に変換する。
米国およびデンマークの対照対象により記入された自己評価質問票には、類似しているが同一でない項目が含まれている。質問票からの情報を使用して、回答と遺伝子発現データとの間で考え得る関連性を探索するためには、統計分析の前に情報をコード化することが必要だった。

コード化戦略の例は以下の通りである：
ａ）年齢およびＢＭＩなどの連続変数は、対象により報告されたように使用された。あるいは、生スコアを、解析の前に２つまたは３つの区分（高値、中値、低値）に統合した。
ｂ）性別は、二値応答（０、１）に変換した。
ｃ）睡眠困難、活力の欠如、または気分の落ち込みなどのうつ病に関連する症状の頻度に関する質問は、言葉による回答（決してない、時々、ほとんどの日、毎日）から数値（０、１、２、３）に変換した。
ｄ）合併症状スコアは、症状の特定の組合せ値を積算して複合スコアを生成することにより生成した。その後、複合スコアに区分けした。
ｅ）対象のうつ病／不安症の家族歴に関する質問は、言葉による回答（無、二次親族のみ、一次親族）から数値（０、１、２）に変換した。
ｆ）対象個人のうつ病／不安症の履歴、またはうつ病／不安症のための薬理学的治療の履歴に関する質問は、言葉による回答（無、１つまたは複数）から二値応答（０、１）に変換した。

コード化の後、スピアマン相関分析、ｔ検定、およびＡＮＯＶＡを含む種々の統計的検定を使用して、遺伝子発現レベルと特定の臨床変数との間の関連性を探索した。

必要に応じて、統計的検定を使用して、対象が自己評価質問票で提供したコード化回答と、各遺伝子の発現を比較して相関性を特定した。合計３７７個の比較がなされたため（２９個の遺伝子×１３項目の質問票回答）、有意性の閾値をｐ＜０．０１に設定して、タイプ１の誤差の可能性を最小限しつつ、それでも多数の統計的に有意な結果を保持した。

表３Ａおよび３Ｂは、分析された質問票回答に基づいて、対照集団内で有意差を示す２９個の遺伝子（表１Ａから）のうちの１５個のみに関する相関性データを示す。残りの遺伝子については、有意差は検出されなかった。表３Ａおよび３Ｂは、１３項目の質問票回答のうちの１１項目に関するデータを示すが、ＢＭＩおよび年齢に関する相関性データは、有意差がなかったため示されていない。著しい遺伝子発現プロファイルと相関する臨床パラメーターのいくつかは、生涯経験、生涯治療、および症状スコアである。

表３Ａおよび３Ｂ。２つの対照群における臨床変数と遺伝子発現との間の相関性。
（^＊＊＝ｐ＜０．０１基準；^＊＊＊＝ｐ＜０．００１基準）

分析された合計３７７個の組合せのうち、２３個の組合せ（６％）が、分析された２つの対照群間の有意差を示す。しかしながら、これら組合せのうち３４５個（９４％）は、同じプロファイルを示す。これら組合せのうち９個は、表３Ａおよび３Ｂの網掛け部分により示されているように、研究された両対照群で、同じ方向への遺伝子発現の変化（つまり遺伝子の上方制御または下方制御）を示した。全体として、この分析は、分析に使用された２つの対照群が、非常に類似した遺伝子発現の傾向またはプロファイルを示していることを示す。

臨床パラメーターと関連する遺伝子発現プロファイルは、本明細書に記述されている多変量アルゴリズムにより分析することもできる。したがって、転写データと混合された臨床変数を、段階的ロジスティック回帰法またはＰＥＬＯＲＡなどの、当業者に公知である任意の好適なアルゴリズムにかけることができる。

うつ病患者の転写プロファイルの特定
抗うつ治療を受けていない１７４人の中程度のうつ病患者／対象から得られた血液試料を、最初に単変量法で分析した。表１Ａから選択される遺伝子の転写レベルを測定し、１９６人の健常対照対象のそのような遺伝子の発現レベルと比較した。対照と比較した、うつ病患者の代表的な遺伝子の発現プロファイルが、図２Ａ〜２Ｂおよび３Ａ〜３Ｂに示されている。

ＲＦ（選択）およびＳＶＭ（トレーニング）を使用した、中程度のうつ病患者と対照との分類は、図８Ａに示されているように、結果として８８％の高正確度でもたらされた（ＰＰＶ＝８９％；ＮＰＶ＝８８％）。遺伝子選択およびトレーニングを両方とも実施するＳＬＲアルゴリズムを使用した、中程度のうつ病患者と対照との分類は、図８Ａに示されているように、結果として９３％の高正確度でもたらされた（ＰＰＶ＝９３％；ＮＰＶ＝９４％）。

両アルゴリズムは、図８Ｂに示されているように、データセット全体に基づいて選択された遺伝子の良好な一致を示した。各方法の統計パラメーターに基づく分類に最も重要な遺伝子として、ランダム・フォレスト法は１４個の遺伝子を選択し、ＳＬＲは１７個の遺伝子を選択した。ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＲＥＢ１、ＣＲＥＢ２、ＥＲＫ２、Ｇｉ２、ＭＡＰＫ１４、ＯＤＣ１、Ｐ２Ｘ７、およびＰＢＲを含む１１個の遺伝子が、両方の方法により選択された。

データセットを無作為化、つまり患者または対照としての試料の帰属を無作為化し、上記のような同じ多変量解析にかけた。無作為化した後、両分類アルゴリズム（ＲＦ／ＳＶＭおよびＳＬＲ）は、実際のデータで取得されたものとは統計的に異なる正確度の値をもたらし、上記（図８Ａ）に列挙されている値が偶然よりも良好であり、群は統計的に分離可能であることを示す。

対象をプロファイルすることができ、表１Ａの遺伝子に基づく対象の転写データを、上記に記述されているようなパラメーターを用いてトレーニングされた分類アルゴリズムにかけて、中程度のうつ病の診断を取得した。

表１Ａから選択された遺伝子に関する、うつ病対象の転写プロファイルは、各バイオマーカー（例えば、遺伝子転写物）の含有量に基づいて表４に示されている。対照対象の転写物値は、比較のために示されている。

２遺伝子の組合せは、対照対象に対するうつ病対象の転写物値比率を比較することによっても評価した。表４Ａにあるように、うつ病対象と対照対象との間に、特定のバイオマーカーの含有量比率の著しい差異が見い出される。

より重度のうつ病患者集団の転写プロファイルの変化を評価するために、１２０人の重度うつ病患者から血液を取得し、表１Ａから選択された遺伝子の遺伝子発現を測定した。遺伝子発現データを、単変量法により統計的に分析した。患者転写データを、１９６人の対照の転写データと比較し、個々の遺伝子データの代表的な散布図を図４Ａ〜４Ｃに示す。

ＲＦ／ＳＶＭを使用した分類は、結果として９２％の高正確度をもたらした（ＰＰＶ＝８９％；ＮＰＶ＝９４％）。遺伝子選択およびトレーニングを両方とも実施するＳＬＲアルゴリズムの分類は、結果として９３％の高正確度をもたらした（ＰＰＶ＝９１％；ＮＰＶ＝９５％）。

両アルゴリズムは、データセット全体に基づいて選択された遺伝子の良好な一致を示した。各方法の統計パラメーターに基づく分類に最も重要な遺伝子として、ランダム・フォレスト分類法は合計７個の遺伝子を選択し、ＳＬＲは合計１２個の遺伝子を選択した。ＣＤ８ａ、ＥＲＫ１、ＭＡＰＫ１４、Ｐ２Ｘ７、およびＰＢＲを含む５個の遺伝子が、両方の方法により選択された。

患者／対照の帰属を無作為化した後、両分類アルゴリズム（ＲＦ／ＳＶＭおよびＳＬＲ）は、実際のデータで取得されたものとは統計的に異なる正確度値をもたらし、上記に列挙されている値が偶然よりも良好であり、群は統計的に分離可能であることを示す。

対象をプロファイルすることができ、表１Ａに含まれている遺伝子に基づく対象の転写データを、上記に記述されているようにトレーニングされた分類アルゴリズムにかけて、重度うつ病の診断を取得した。

表１Ａから選択された遺伝子に関する、重度うつ病対象の転写プロファイルは、各バイオマーカー（例えば、遺伝子転写物）の含有量に基づいて表５に示されている。対照対象の転写物値は、比較のために示されている。

平均発現レベル（転写物値）が、重度うつ病患者と対照との間で有意に異なっていた（ｐ＜０．０５）遺伝子は以下の通りである：ＡＤＡ、ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ａ、ＣＤ８ｂ、ＣＲＥＢ２、ＤＰＰ４、ＥＲＫ１、Ｇｉ２、Ｇｓ、ＩＬ１ｂ、ＩＬ８、ＭＡＰＫ１４、ＭＫＰ１、ＭＲ、Ｐ２Ｘ７、ＰＲＥＰ、ＲＧＳ２、Ｓ１００Ａ１０、およびＳＥＲＴ（表５Ａ）。

これら遺伝子を、算出した−Ｌｏｇ（ｐ）値（図９）の大きさによりランク付けし、それにより、ＥＲＫ１、Ｐ２Ｘ７、Ｇｉ２、ＡＲＲＢ１、およびＳ１００Ａ１０などのいくつかの遺伝子についての、患者転写物値と対照値との間の著しい差異を示す。

転写物値間の線形および非線形相互作用を探索するために、関連ベクター・マシン（ＲＶＭ）分類アルゴリズムを実施し、その後遺伝的アルゴリズムを、考え得る遺伝子間相互作用の空間を探索し、最もロバストで意味のある相互作用を選択するために使用した。単一遺伝子解もこのセットのアルゴリズムで検討し、患者を対照から分離するための単一遺伝子解の妥当性を確認した。ＡＲＲＢ１（正確度＝０．８６）およびＥＲＫ１（正確度＝０．８５）、次いでＰ２Ｘ７（正確度＝０．８２）およびＧｉ２（正確度＝０．８１）が、単一遺伝子解析において高度に情報量が高いことが判明する。例えば、対照に対する中程度のうつ病患者、重度うつ病患者、および双極性患者について、情報量が高い遺伝子発現データが示されている図２〜５も参照されたい。

いくつかの２遺伝子解は、うつ病患者および対照を９０％以上の正確度で分類することが特定された。ＥＲＫ１およびＭＡＰＫ１４の転写物値は、うつ病患者と対照とを９２％の正確度で分類することが示される。図１０には、ＥＲＫ１およびＭＡＰＫ１４の転写物値のみに基づく、重度うつ病対象および対照の分布が示されている。うつ病対象（表４にあるようなプロファイルを有する）の分類は、重度うつ病対象の結果と一致している。図１１、１２、および１３には、他の２遺伝子転写プロファイル、それぞれＩＬ１ｂ／Ｇｉ２、ＭＡＰＫ１４／ＡＲＲＢ１、およびＥＲＫ１／ＩＬ１ｂの転写物値に基づく、重度うつ病対象および対照の分布が示されている。２遺伝子の組合せは、対照対象に対する重度うつ病対象の転写物値比率を比較することによっても評価した。重度うつ病対象と対照対象との間に含有量比率の著しい差異があることが、表５Ｂに見られる。

双極性障害患者の転写プロファイルの同定
双極性障害患者の転写プロファイルの変化を評価するために、２３人のうつ病患者（ＤＳＭ−ＩＶ基準により双極性障害と確定的に診察されている２０人の患者）から血液を取得し、表１Ａから選択された遺伝子の遺伝子発現を測定した。遺伝子発現データを、単変量法により統計的に分析した。患者転写データを、１９６人の対照の転写データと比較し、個々の遺伝子データの代表的な散布図を図５Ａ〜５Ｃに示す。

ＲＦ／ＳＶＭを使用した分類は、結果として９４％の高正確度をもたらした（ＰＰＶ＝８６％；ＮＰＶ＝９５％）。遺伝子選択およびトレーニングを両方とも実施するＳＬＲアルゴリズムの分類は、結果として９７％の高正確度をもたらした（ＰＰＶ＝９０％；ＮＰＶ＝９９％）。

両アルゴリズムは、データセット全体に基づいて選択された遺伝子の良好な一致を示し、各方法の統計パラメーターに基づく分類に最も重要な遺伝子として、ランダム・フォレスト分類法は合計３個の遺伝子を選択し、ＳＬＲは合計５個の遺伝子を選択した。Ｇｉ２、ＧＲ、およびＭＡＰＫ１４を含む３個の遺伝子が、両方の方法により選択された。

対象をプロファイルすることができ、表１Ａに含まれている遺伝子に基づく対象の転写データを、上記に記述されているようにトレーニングされた分類アルゴリズムにかけて、双極性障害の診断を取得した。

各遺伝子についての双極性対象の転写のプロファイルは、各バイオマーカー（例えば、遺伝子転写物）の含有量に基づいて表６に示されている。対照対象の転写物値は、比較のために示されている。

境界性人格障害患者の転写プロファイルの同定
境界性人格障害患者の転写プロファイルの変化を評価するために、２１人の境界性人格障害患者から血液を取得し、表１Ａから選択された遺伝子の遺伝子発現を測定した遺伝子発現データを、単変量法により統計的に分析した。患者転写データを、１９６人の対照の転写データと比較し、個々の遺伝子データの代表的な散布図を図６Ａ〜６Ｃに示す。

ＲＦ（選択）およびＳＶＭ（トレーニング）を使用した分類は、結果として９７％の高正確度をもたらした（ＰＰＶ＝８７％；ＮＰＶ＝９８％）。遺伝子選択およびトレーニングを両方とも実施するＳＬＲアルゴリズムの分類は、結果として９８％の高正確度をもたらした（ＰＰＶ＝９０％；ＮＰＶ＝１００％）。

両アルゴリズムは、データセット全体に基づいて選択された遺伝子の良好な一致を示し、各方法の統計パラメーターに基づく分類に最も重要な遺伝子として、ランダム・フォレスト分類法は合計５個の遺伝子を選択し、ＳＬＲは合計４個の遺伝子を選択した。Ｇｉ２、ＧＲ、ＭＡＰＫ１４、およびＭＲを含む４個の遺伝子が、両方の方法により選択された。

対象をプロファイルすることができ、表１Ａに含まれている遺伝子に基づく対象の転写データを、上記に記述されているようにトレーニングされた分類アルゴリズムにかけて、境界性人格障害の診断を取得した。

ＰＴＳＤ患者の転写プロファイルの同定
急性ＰＴＳＤの患者、軽減されたＰＴＳＤの患者、および心的外傷イベントに曝されたがＰＴＳＤを発症していない個体群の転写プロファイルを評価した。これらの群を合わせて評価することにより、急性ＰＴＳＤと関連する発現変化を識別する機会、ならびにこの疾患からの回復またはこの疾患に対する抵抗性に関連する可能性のある差異を定義する機会が提供される。遺伝子発現データを、単変量法により統計的に分析した。６６人の急性ＰＴＳＤ患者からの患者転写データを、１９６人の対照の転写データと比較し、個々の遺伝子データの代表的な散布図を図７Ａ〜７Ｃに示す。

ＲＦ（選択）およびＳＶＭ（トレーニング）を使用し、対照対象と比較した急性ＰＴＳＤ患者の分類は、結果として７７％の正確度をもたらした（ＰＰＶ＝６４％；ＮＰＶ＝８２％）。遺伝子選択およびトレーニングを両方とも実施するＳＬＲアルゴリズムを使用した分類は、結果として８４％の正確度をもたらした（ＰＰＶ＝７７％；ＮＰＶ＝８７％）。ＳＬＲアルゴリズムは、このセットの試験データを使用するＳＶＭアルゴリズムより優れている。各分類アルゴリズムを、無作為化（並べ替え）型のデータセットと比較し、ＳＬＲは、並べ替えデータセットを使用して７３％の正確度値をもたらした（ＰＰＶ＝３９％；ＮＰＶ＝７５％）。統計分析は、実際のデータ対無作為化データで取得されたＳＬＲ正確度値が異なることを示し、群が分離可能であることを示した。

ＳＶＭは、並べ替えデータセットを使用して７３％の正確度値をもたらし（ＰＰＶ＝１０％；ＮＰＶ＝７５％）、並べ替え（無作為化）データでは減少傾向を示した。注目すべきは、ＳＶＭアルゴリズムで実際のデータを使用するＰＰＶ（この疾患の患者を陽性と予測する能力）が、並べ替えデータの１０％精度と比較して、６０％より良好であり、実際のデータを使用してトレーニングされたアルゴリズムは、無作為予測より優れていることを示していることである。

ＳＬＲは、急性ＰＴＳＤ患者対対照のデータセット全体に基づく分類のために最も重要な遺伝子として、以下の１０個の遺伝子の合計を選択した：ＡＲＲＢ１、ＡＲＲＢ２、ＣＤ８ｂ、ＥＲＫ２、ＩＤＯ、ＩＬ−６、ＭＲ、ＯＤＣ１、ＰＲＥＰ、およびＲＧＳ２。

対象をプロファイルすることができ、表１Ａに含まれている遺伝子に基づく対象の転写データを、上記に記述されているようにトレーニングされた分類アルゴリズムにかけて、急性ＰＴＳＤの診断を取得した。

ＲＦ（選択）およびＳＶＭ（トレーニング）を使用し、対照対象と比較した軽減されたＰＴＳＤ患者の分類は、結果として８１％の正確度をもたらした（ＰＰＶ＝５９％；ＮＰＶ＝８５％）。遺伝子選択およびトレーニングを両方とも実施するＳＬＲアルゴリズムの分類は、結果として８０％の正確度をもたらした（ＰＰＶ＝３３％；ＮＰＶ＝８６％）。しかしながら、分類アルゴリズムをこのデータセットの無作為化型で実行した場合、ＳＶＭおよびＳＬＲは、それぞれ８２％および８１％の正確度値をもたらした。これらの値は、実際のデータで取得された値と統計的に異なっておらず、アルゴリズムがこれら群を高信頼性で分離することができないことを示している。分離ができないため、この比較に関する遺伝子リストは報告されていない。臨床的見地からすると、アルゴリズムが対照と軽減患者とを識別することができないことは、これらの群間の生物学的な相異が欠如しているため予測されている。軽減患者が疾患の症状をもはや示さないため、軽減患者の遺伝子発現レベルが正常レベルに戻り、そのためアルゴリズムが有効に群を分離するのが妨げられると仮定することは合理的である。

ＲＦ（選択）およびＳＶＭ（トレーニング）を使用し、対照対象と比較した、心的外傷を受けたがＰＴＳＤを発症しなかった対象の分類は、結果として７４％の正確度をもたらした（ＰＰＶ＝６１％；ＮＰＶ＝７９％）。遺伝子選択およびトレーニングを両方とも実施するＳＬＲアルゴリズムの分類は、結果として７３％の正確度をもたらした（ＰＰＶ＝５９％；ＮＰＶ＝８０％）。多変量解析を無作為化データセットで実施した場合、ＲＦ／ＳＶＭおよびＳＬＲ分類アルゴリズムは両方とも、実際のデータで取得されたものとは統計的に異なる正確度の値をもたらし、上記に報告されている値が偶然よりも良好であり、群は分離可能であることを示す。

各方法の統計パラメーターに基づき、心的外傷患者および対照からのデータセット全体を使用した分類に最も重要な遺伝子として、ランダム・フォレスト分類法は合計１４個の遺伝子を選択し、ＳＬＲは合計１３個の遺伝子を選択した。ＡＲＲＢ２、ＣＲＥＢ１、ＥＲＫ２、Ｇｓ、ＩＬ−６、ＭＫＰ１、およびＲＧＳ２を含む７個の遺伝子が、両方の方法により選択された。

これら個体はＰＴＳＤと診断されていないが、アルゴリズムは、正確度、ＰＰＶ、およびＮＰＶ値が、本明細書に提示されている他の比較のいくつかより低いものの、依然としてそれらを対照と識別することができる。興味深いことには、急性ＰＴＳＤ患者に由来するＳＬＲ遺伝子リストの遺伝子のうちの６つは、ＰＴＳＤではない心的外傷患者の対応するリストの遺伝子と一致する（ＡＲＲＢ２、ＣＤ８ｂ、ＥＲＫ２、ＭＲ、ＩＬ−６、およびＲＧＳ２）。心的外傷を受けた患者は、まだ疾患を発症していない一方で、いくつかの遺伝子発現プロファイルを罹患患者と共有しており、心的外傷を受けた患者にリスクがある可能性を示している。

対象をプロファイルすることができ、表１Ａに含まれている遺伝子に基づく対象の転写データを、上記に記述されているようにトレーニングされた分類アルゴリズムにかけて、ＰＴＳＤではない心的外傷の診断を取得した。

７引用参考文献
本明細書に引用された参考文献はすべて、あたかも個々の刊行物または特許または特許出願の各々が、具体的におよび個々に参照によりその全体が、あらゆる目的のために本明細書中に組み込まれると示されているのと同じ程度に、それらの全体があらゆる目的のために参照により本明細書に組み込まれる。

８改変
当業者であれば明白になるように、本発明の多数の改変および変異を、本発明の趣旨および範囲から逸脱せずになすことができる。本明細書に記述されている特定の実施形態は、例として提供されているに過ぎず、本発明は、そのような特許請求の範囲に与えられる全範囲の等価物に加えて、添付の特許請求の範囲の条件にのみ制限されるべきである。

Claims

試験対象の情動障害を診断する方法であって、
前記試験対象のバイオマーカー・プロファイル中の複数のバイオマーカーの複数の特徴が、ある値セットを満たすかどうかを評価し、前記値セットを満たすことが、前記情動障害を前記試験対象が罹患していることを予測し、そして前記複数の特徴が、前記複数のバイオマーカーの測定可能な態様であり、前記複数のバイオマーカーが表１Ａに列挙されている少なくとも２つのバイオマーカーを含む方法。
前記試験対象が前記情動障害を罹患しているかどうかの診断を、ユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体、またはローカルもしくはリモート・コンピュータ・システムに出力すること；または前記試験対象が前記情動障害を罹患しているかどうかの診断を、ユーザー読み取り可能な形態で表示することをさらに含む、請求項１に記載の方法。
前記複数のバイオマーカーが、表１Ａに列挙されている２〜２９個のバイオマーカーからなる、請求項１に記載の方法。
前記複数のバイオマーカーが、表１Ａに列挙されている３〜２０個のバイオマーカーからなる、請求項１に記載の方法。
前記複数のバイオマーカーが、表１Ａに列挙されている少なくとも２つのバイオマーカーを含む、請求項１に記載の方法。
前記複数のバイオマーカーが、表１Ａに列挙されている少なくとも３つのバイオマーカーを含む、請求項１に記載の方法。
前記複数のバイオマーカーが、表１Ａに列挙されている少なくとも４つのバイオマーカーを含む、請求項１に記載の方法。
前記複数の特徴が、表１Ａに列挙されている２〜２９個のバイオマーカーに対応する２〜２９個の特徴からなる、請求項１に記載の方法。
前記複数の特徴が、表１Ａに列挙されている３〜１５個のバイオマーカーに対応する３〜１５個の特徴からなる、請求項１に記載の方法。
前記複数の特徴が、表１Ａに列挙されている少なくとも２つのバイオマーカーに対応する少なくとも２つの特徴を含む、請求項１に記載の方法。
前記複数のバイオマーカーが、ＥＲＫ１およびＭＡＰＫ１４を含む、請求項１に記載の方法。
前記複数のバイオマーカーが、Ｇｉ２およびＩＬ−１ｂを含む、請求項１に記載の方法。
前記複数のバイオマーカーが、ＡＲＲＢ１およびＭＡＰＫ１４を含む、請求項１に記載の方法。
前記複数のバイオマーカーが、ＥＲＫ１およびＩＬ１ｂを含む、請求項１に記載の方法。
前記複数のバイオマーカーが、ＡＲＲＢ１、ＩＬ６およびＣＤ８ａを含む、請求項１に記載の方法。
前記複数のバイオマーカーが、ＡＲＲＢ１、ＯＤＣ１およびＰ２Ｘ７を含む、請求項１に記載の方法。
前記複数のバイオマーカー中の各バイオマーカーが核酸である、請求項１に記載の方法。
前記複数のバイオマーカー中の各バイオマーカーが、ＤＮＡ、ｃＤＮＡ、増幅ＤＮＡ、ＲＮＡまたはｍＲＮＡである、請求項１に記載の方法。
前記試験対象の前記バイオマーカー・プロファイル中の前記複数の特徴中のある特徴が、前記複数のバイオマーカー中のあるバイオマーカーの測定可能な態様であり、そして前記特徴の特徴値が、前記試験対象から採取された生体試料を使用して決定される、請求項１に記載の方法。
前記特徴が、前記生体試料中の前記バイオマーカーの含有量であり、前記生体試料が全血である、請求項１９に記載の方法。
前記評価ステップに先立って、前記第１の値セットを構築することをさらに含む、請求項１に記載の方法。
前記構築ステップが、データ分析アルゴリズムを、集団のメンバーから得られる特徴に適用することを含む、請求項２１に記載の方法。
前記集団が、前記情動障害を罹患していない第１の複数の対照対象に由来する第１の複数の生体試料、および前記情動障害を罹患している第２の複数の対象に由来する第２の複数の生体試料を含む、請求項２２に記載の方法。
前記データ分析アルゴリズムが、決定木、マイクロアレイ予測解析、多重加法型回帰木、ニューラル・ネットワーク、クラスタリング・アルゴリズム、主成分分析法、最近傍解析、線形判別分析、二次判別分析、サポート・ベクター・マシン法、進化法、関連ベクター・マシン法、遺伝的アルゴリズム、射影追跡法または重み付き投票法である、請求項２２に記載の方法。
前記構築ステップが判断ルールを生成し、そして前記評価ステップが、前記判断ルールを前記複数の特徴に適用して、前記複数の特徴が前記第１の値セットを満たすかどうかを決定することを含む、請求項２１に記載の方法。
前記判断ルールが、前記集団中の対象を（ｉ）前記情動障害を罹患していない対象および（ｉｉ）７０パーセント以上の正確度で前記情動障害を罹患している対象として分類する、請求項２５に記載の方法。
前記判断ルールが、前記集団中の対象を（ｉ）前記情動障害を罹患していない対象および（ｉｉ）９０パーセント以上の正確度で前記情動障害を罹患している対象として分類する、請求項２５に記載の方法。
前記情動障害が、双極性障害Ｉ、双極性障害ＩＩ、気分変調性障害、または抑うつ障害である、請求項１に記載の方法。
前記情動障害が、軽度うつ病、中程度のうつ病、重度うつ病、非定型うつ病、メランコリー型うつ病または境界性人格障害である、請求項１に記載の方法。
コンピュータ読み取り可能な記憶媒体およびそこに内蔵されているコンピュータ・プログラム・メカニズムを含み、前記コンピュータ・プログラム・メカニズムが、請求項１に記載の方法を実行するためのインストラクションを含む、コンピュータ・プログラム製品。
前記コンピュータ・プログラム・メカニズムが、前記試験対象が前記情動障害を罹患しているかどうかの診断をユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体またはローカルもしくはリモート・コンピュータ・システムに出力するためのインストラクション；または前記試験対象が前記情動障害を罹患しているかどうかの診断を、ユーザー読み取り可能な形態で表示するためのインストラクションをさらに含む、請求項３０に記載のコンピュータ・プログラム製品。
１つまたは複数のプロセッサ、
前記１つまたは複数のプロセッサに接続されたメモリを含み、前記メモリが請求項１に記載の方法を実行するためのインストラクションを格納する、コンピュータ。
前記メモリが、前記試験対象が前記情動障害を罹患しているかどうかの診断をユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体またはローカルもしくはリモート・コンピュータ・システムに出力するためのインストラクション；または前記試験対象が前記情動障害を罹患しているかどうかの診断をユーザー読み取り可能な形態で表示するためのインストラクションをさらに含む、請求項３２に記載のコンピュータ。
試験対象が情動障害の症状を示す可能性を決定する方法であって、
前記試験対象のバイオマーカー・プロファイル中の複数のバイオマーカーの複数の特徴が、ある値セットを満たすかどうかを評価し、前記値セットを満たすことが、情動障害の症状を前記試験対象が示す可能性を提供し、そして前記複数の特徴が前記複数のバイオマーカーの測定可能な態様であり、前記複数のバイオマーカーが表１Ａに列挙されている少なくとも２つのバイオマーカーを含む方法。
前記試験対象が情動障害の症状を示す可能性を、ユーザー・インターフェース・デバイス、モニター、実在するコンピュータ読み取り可能な記憶媒体またはローカルもしくはリモート・コンピュータ・システムに出力すること；または前記試験対象が情動障害の症状を示す可能性をユーザー読み取り可能な形態で表示することをさらに含む、請求項３４に記載の方法。