JP2017510821A

JP2017510821A - 自閉症スペクトラム障害のリスクを決定するための方法およびシステム

Info

Publication number: JP2017510821A
Application number: JP2017504617A
Authority: JP
Inventors: ウテガイガンムーラー，; ドリスダミアン，; マツィエイパクーラ，; マークエー．デプリスト，
Original assignee: ラボラトリーコーポレイションオブアメリカホールディングス
Priority date: 2014-04-11
Filing date: 2015-04-10
Publication date: 2017-04-13
Anticipated expiration: 2035-04-10
Also published as: US20150293072A1; JP2021103177A; CA3157221A1; CN113009122A; EP3954991A3; WO2015157601A1; CA2945528C; EP3151665B1; JP6550124B2; EP3151665A4; CA2945528A1; CN106714556B; EP3954991A2; US20240019417A1; CN106714556A; CA3030255C; US9176113B1; CA3030255A1; EP3151665A1; JP2019200210A

Abstract

ある特定の実施形態において、本発明は、血液中の代謝産物レベルの集団分布曲線の分析が、自閉症スペクトラム障害（ＡＳＤ）のリスクの予測を容易にするため、および／または対象においてＡＳＤと非ＡＳＤ発達遅延（ＤＤ）とを識別するために使用できるという発見から生じたものである。ある特定の態様において、代謝産物の分布曲線におけるテール効果の存在、非存在、および／または方向（より高いまたはより低い）の査定からの情報は、ＡＳＤのリスクを予測するためおよび／またはＡＳＤとＤＤとを識別するために利用される。

Description

関連出願への相互参照
本出願は、２０１４年４月１１日に出願された米国仮特許出願第６１／９７８，７７３号および２０１４年５月２２日に出願された米国仮特許出願第６２／００２，１６９号の利益を主張する、２０１４年９月２２日に出願された米国特許出願第１４／４９３，１４１号の部分継続出願である米国特許出願第１４／６３３，５５８号の優先権を主張する。これら出願のそれぞれの内容は、それらの全体が本明細書において参考として援用される。

技術分野
本発明は、一般的に、自閉症スペクトラム障害（ＡＳＤ）および他の障害についてのリスクの予測に関する。

自閉症スペクトラム障害（ＡＳＤ）は、生まれてから最初の３年のうちにしばしば顕在化する、双方向の社会的相互作用の欠陥、言語の困難さ、ならびに反復行動および限定的な興味を特徴とする広汎性発達障害である。ＡＳＤの病因は十分理解されていないが、多因子性であり、遺伝学的要因と環境要因の両方が疾患の発症に寄与すると考えられている。

データから、親が自分の子供のＡＳＤを疑い始める平均年齢は２０ヶ月であるにもかかわらず、診断の年齢中央値は５４ヶ月を過ぎてからであることが示されている。臨床的な展望からの重要な課題は、子供がＡＳＤを有するかどうか、さらに自閉症処置計画のために専門家の照会を必要とするかどうかをできるだけ早期に決定することである。

ＡＳＤの診断は、典型的には、精神障害の診断と統計の手引きに詳述される基準を使用した子供の慎重な査定の後にのみ、発達小児科医および他の専門家によってなされる。信頼できる診断はしばしば、発達小児科医、神経病学者、精神科医、心理学者、発話と聴力の専門家および作業療法士などの複数の専門家による対象の集中的な査定を要する。さらに、親がＡＳＤを疑う平均年齢が２０ヶ月もの早期であるという事実にもかかわらず、ＡＳＤ診断の年齢中央値は５４ヶ月である。ＣＤＣ（疾病管理センター）によれば、ＡＳＤ診断と判断された子供のうち１８％しか３６ヶ月齢までに同定されないことが観察されている。残念なことに、診断未確定のＡＳＤに罹っている若年の子供は、小児期の発達の重要な期間中に早期の治療的介入から利益を得る機会を失う。ＡＳＤリスクを確実に決定するための、特に、治療的介入がより有効になる可能性が高い場合により早期により若年の子供を同定するための医療診断試験が必要である。

本発明の実施形態は、集団内および集団全体にわたり測定された代謝産物などの分析物の分布曲線の分析は、ＡＳＤなどの状態または障害のリスクを予測するための分類器を構築または改善するのに利用できる情報を提供するという発見から生じたものである。特に、血液中の代謝産物レベルの集団分布曲線の分析は、対象における自閉症スペクトラム障害（ＡＳＤ）のリスクの予測を容易にする。例えば、血液中の代謝産物レベルの集団分布曲線の分析は、対象において自閉症スペクトラム障害（ＡＳＤ）と、自閉症スペクトラム障害に起因しない発達遅延（ＤＤ）などの非ＡＳＤ発達障害とを識別するのに使用することができる。

２つの群を識別するバイオマーカーの統計学的分析は通常、２つの集団は、それらの平均バイオマーカーレベルの点で異なっており、この平均周辺の変動は、ガウス分布によって最もよく特徴付けられる実験上および／または集団の変動に起因すると仮定する。このベースラインモデルに反して、本明細書では、一部の分析物について、ただしそれ以外のものには当てはまらないが、ＡＳＤ、または時にはＤＤにおける分布は、複数の下位分布、すなわち本質的に他の健康状態と識別されていないある下位分布（例えば、ＡＳＤ分布とＤＤ分布とが識別されていない場合）、および対象の少数派において平均からかけ離れている別の下位分布、例えばその集団について組み合わされた分布の「テール」でそれ自身構成されていることを最大の特徴とすることが観察されている。この見識は、ベースラインとは著しく異なる分析の枠組みをもたらすものであり、ある特定の分析物について、集団分布の上位または下位部分に基づいて閾値を定義することによって、例えば、基準となるガウス分布モデルを必要としないランキングを確立することによって、より優れた結果が達成されることが見出されている。

したがって、本明細書において、ある代謝産物に関する代謝産物レベルの分布曲線の遠位部分において特定の集団（例えば、ＡＳＤまたはＤＤのいずれか）からの試料の濃縮がみられる場合、その代謝産物は、「テール濃縮」または「テール」効果を表すと説明される。代謝産物の分布曲線におけるテール効果の存在、非存在、および／または方向（より高いまたはより低い）の査定からの情報は、ＡＳＤのリスクを予測するために利用することができる。特定の代謝産物に関して、分布曲線の上位または下位部分（例えば、十分位数）に対応する、すなわち分布曲線の「テール」内（「右テール」中または「左テール」中かどうかにかかわらず）の代謝産物レベルは、ＡＳＤの存在または非存在について高い情報的価値があることが発見された。

さらに、オーバーラップする相互情報量の程度が低い複数の代謝産物が取り入れられるため、リスク予測は改善されることが見出されている。例えば、ＡＳＤの査定のために、相補的な診断／リスク査定情報を提供する代謝産物の特定の群が存在する。すなわち、第１の代謝産物のレベルの分析によって同定可能なＡＳＤ陽性個体（例えば、第１の代謝産物の同定されたテール内の個体）は、第２の代謝産物の分析によって同定可能なＡＳＤ陽性個体と同じではない（または低いがゼロではない程度のオーバーラップが存在する可能性がある）。特定の理論に縛られることは望まないが、この発見は、ＡＳＤそれ自身の多面的な性質を反映している可能性がある。

したがって、ある特定の実施形態において、リスク査定方法は、対象が複数の代謝産物を含む多数の同定された代謝産物テールのいずれかに当てはまるかどうかを同定するステップ、例えば、異なる代謝産物テールの予測変数が少なくとも部分的に排反する場合、例えば、複数の代謝産物が低い相互情報量で取り入れられることによってリスク予測が改善されるように、それらが低い相互情報量を有する場合を同定するステップを包含する。分類器は、予め決定されたレベルの予測可能性を、例えばＡＵＣ、すなわち、その分類器についての真陽性率（感度）に対して偽陽性率（１−特異度）をプロットしたＲＯＣ曲線下の面積の形態で有しており、テール効果を表す分類器に代謝産物が低い相互情報量で追加されるとＡＵＣは増加する。

一部の実施形態において、本発明は、血液中の代謝産物レベルのある特定の閾値の値は、対象における自閉症スペクトラム障害（ＡＳＤ）のリスク予測を容易にするのに使用できるという発見から生じたものである。ある特定の態様において、代謝産物の分布曲線におけるテール効果の存在、非存在、および／または方向（より高いまたはより低い）の査定から推測された代謝産物のこれらの閾値の値は、ＡＳＤのリスクを予測するのに利用される。ある特定の態様において、これらの閾値の値は、集団における代謝産物レベルの分布における上端または下端のいずれかに存在し得る。特定の代謝産物に関して、上の閾値の値を超えるおよび／または下の閾値の値を下回る代謝産物レベルは、ＡＳＤの存在または非存在について高い情報的価値があることが発見された。

一部の実施形態において、これらの代謝産物のレベルは、ＡＳＤを他の形態の発達遅延（例えば、自閉症スペクトラム障害に起因しない発達遅延（ＤＤ））と区別することにおいて有用である。

一態様において、本発明は、対象において自閉症スペクトラム障害（ＡＳＤ）と非ＡＳＤ発達遅延（ＤＤ）とを識別する方法であって、（ｉ）対象から得られた試料に由来する複数の代謝産物の第１の代謝産物のレベルを測定するステップであって、第１の代謝産物の集団分布が、ＡＳＤを有する対象の第１の集団および非ＡＳＤ発達遅延（ＤＤ）を有する対象の第２の集団において前もって特徴付けられ、ここで第１の代謝産物は、ＡＳＤテール効果および／またはＤＤテール効果を表すことが予め決定されており、各テール効果は、対応する（ＡＳＤまたはＤＤ）集団のメンバーで濃縮された関連する右テールまたは左テールを含み、ここで第１の代謝産物は、右テールを有するＡＳＤテール効果を表し、試料中の第１の代謝産物のレベルが第１の（ＡＳＤ）集団のメンバーで濃縮された右テールを定義する予め決定された上の（最小の）閾値より大きい場合、試料中の第１の代謝産物のレベルはＡＳＤテール内であり、ここで第１の代謝産物は、左テールを有するＡＳＤテール効果を表し、試料中の第１の代謝産物のレベルが第１の（ＡＳＤ）集団のメンバーで濃縮された左テールを定義する予め決定された下の（最大の）閾値未満である場合、試料中の第１の代謝産物のレベルはＡＳＤテール内であり、ここで第１の代謝産物は、右テールを有するＤＤテール効果を表し、試料中の第１の代謝産物のレベルが第２の（ＤＤ）集団のメンバーで濃縮された右テールを定義する予め決定された上の（最小の）閾値より大きい場合、試料中の第１の代謝産物のレベルはＤＤテール内であり、ここで第１の代謝産物は、左テールを有するＤＤテール効果を表し、試料中の第１の代謝産物のレベルが第２の（ＤＤ）集団のメンバーで濃縮された左テールを定義する予め決定された下の（最大の）閾値未満である場合、試料中の第１の代謝産物のレベルはＤＤテール内である、ステップ；（ｉｉ）試料に由来する複数の代謝産物の少なくとも１種の追加の代謝産物のレベルを測定するステップであって、少なくとも１種の追加の代謝産物のそれぞれの集団分布が、第１の集団および第２の集団において前もって特徴付けられ、ＡＳＤテール効果およびＤＤテール効果の少なくとも１つを表すことが予め決定されており、少なくとも１種の追加の代謝産物のそれぞれについて、ステップ（ｉ）に従って試料中の前記代謝産物のレベルが対応するＡＳＤテールおよび／またはＤＤテール内であるかどうかを同定するステップ；ならびに（ｉｉｉ）ステップ（ｉ）およびステップ（ｉｉ）で分析された代謝産物に関して試料がその範囲内にある同定されたＡＳＤテールおよび／または同定されたＤＤテールに基づいて、予め決定されたレベルの予測可能性を用いて、（ａ）対象がＡＳＤを有しＤＤを有さないこと、または（ｂ）対象がＤＤを有しＡＳＤを有さないことを決定するステップを含む方法を対象とする。

ある特定の実施形態において、第１の代謝産物は、関連する上の（最小の）または下の（最大の）閾値を有するＡＳＤテール効果を表すことが予め決定されており、前記閾値は、この基準を満たす未知の分類の試料（前もって特徴付けられていない試料）がＤＤに対してＡＳＤであるというオッズがｐ≦０．３で１．６：１以上になるように予め決定されている。ある特定の実施形態において、オッズは、２：１以上、または２．５：１以上、または２．７５：１以上、または３：１以上、または３．２５：１以上、または３．５：１以上、または３．７５：１以上、または４：１以上である。前述のもののいずれかにおいて、ｐ値（統計学的有意性の値）は、ｐ≦０．３、またはｐ≦０．２５、またはｐ≦０．２、またはｐ≦０．１５、またはｐ≦０．１、またはｐ≦０．０５を満たす。

ある特定の実施形態において、第１の代謝産物は、関連する上の（最小の）または下の（最大の）閾値を有するＤＤテール効果を表すことが予め決定されており、前記閾値は、この基準を満たす未知の分類の試料（前もって特徴付けられていない試料）がＡＳＤに対してＤＤであるというオッズがｐ≦０．３で１．６：１以上になるように予め決定されている。ある特定の実施形態において、オッズは、２：１以上、または２．５：１以上、または２．７５：１以上、または３：１以上、または３．２５：１以上、または３．５：１以上、または３．７５：１以上、または４：１以上である。前述のもののいずれかにおいて、ｐ値（統計学的有意性の値）は、ｐ≦０．３、またはｐ≦０．２５、またはｐ≦０．２、またはｐ≦０．１５、またはｐ≦０．１、またはｐ≦０．０５を満たす。

ある特定の実施形態において、予め決定されたレベルの予測可能性は、少なくとも０．７０のＡＵＣ（曲線下面積）を有する真陽性率（感度）に対して偽陽性率（１−特異度）をプロットした受信者動作特性（ＲＯＣ）曲線に相当する。

ある特定の実施形態において、代謝産物の１種または複数に関する予め決定された上の（最小の）閾値は、８５から９５パーセンタイル（例えば、小数点以下のパーセンタイルを切り捨てて、約９０パーセンタイル、または約８５、８６、８７、８８、８９、９１、９２、９３、９４、もしくは９５パーセンタイル）のパーセンタイルであり、代謝産物の１種または複数に関する予め決定された下の（最大の）閾値は、１０から２０パーセンタイル（例えば、小数点以下のパーセンタイルを切り捨てて、約１５パーセンタイル、または約１０、１１、１２、１３、１４、１６、１７、１８、１９、もしくは２０パーセンタイル）のパーセンタイルである。

ある特定の実施形態において、複数の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（hydroxyisovaleroylcarnitine）（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン（octenoylcarnitine）、および３−ヒドロキシヒプレートからなる群から選択される少なくとも２種の代謝産物を含む。

ある特定の実施形態において、複数の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、ｐ−クレゾールスルフェート、イソバレリルグリシン、ガンマ−ＣＥＨＣ、インドールアセテート、ピペコレート、１，５−アンヒドログルシトール（１，５−ＡＧ）、ラクテート、３−（３−ヒドロキシフェニル）プロピオネート、３−インドキシルスルフェート、パントテネート（ビタミンＢ５）、およびヒドロキシ−クロロタロニルからなる群から選択される少なくとも２種の代謝産物を含む。

ある特定の実施形態において、複数の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、ｐ−クレゾールスルフェート、イソバレリルグリシン、ガンマ−ＣＥＨＣ、インドールアセテート、ピペコレート、１，５−アンヒドログルシトール（１，５−ＡＧ）、ラクテート、３−（３−ヒドロキシフェニル）プロピオネート、３−インドキシルスルフェート、パントテネート（ビタミンＢ５）、およびヒドロキシ−クロロタロニルからなる群から選択される少なくとも３種の代謝産物を含む。

ある特定の実施形態において、複数の代謝産物は、表６に列挙した対から選択される少なくとも１つの代謝産物の対を含む。

ある特定の実施形態において、複数の代謝産物は、表７で列挙した３つ組から選択される少なくとも１つの代謝産物の３つ組を含む。

ある特定の実施形態において、複数の代謝産物は、２種の代謝産物のセットとして一緒に組み合わされて、少なくとも０．６２（例えば、少なくとも約０．６３、０．６４、または０．６５）のＡＵＣを提供する少なくとも１つの代謝産物の対を含み、ここでＡＵＣは、その２種の代謝産物のセットにのみ基づく分類器についての真陽性率（感度）に対して偽陽性率（１−特異度）をプロットしたＲＯＣ曲線下の面積である。

ある特定の実施形態において、複数の代謝産物は、３種の代謝産物のセットとして一緒に組み合わされて、少なくとも０．６６（例えば、少なくとも約０．６７または０．６８）のＡＵＣを提供する少なくとも１つの代謝産物の３つ組を含み、ここでＡＵＣは、その３種の代謝産物のセットにのみ基づく分類器についての真陽性率（感度）に対して偽陽性率（１−特異度）をプロットしたＲＯＣ曲線下の面積である。

別の態様において、本発明は、対象における自閉症スペクトラム障害（ＡＳＤ）のリスクを決定する方法であって、（ｉ）対象から得られた試料に由来する複数の代謝産物の第１の代謝産物のレベルを分析するステップであって、第１の代謝産物の集団分布が、公知の分類を有する対象の参照集団において前もって特徴付けられ、ここで第１の代謝産物は、ＡＳＤメンバーで濃縮された関連する右テールまたは左テールを含むＡＳＤテール効果を表すことが予め決定されており、ここで第１の代謝産物は、右テールを有するＡＳＤテール効果を表し、試料中の第１の代謝産物のレベルがＡＳＤ集団のメンバーで濃縮された右テールを定義する予め決定された上の（最小の）閾値より大きい場合、試料中の第１の代謝産物のレベルはＡＳＤテール内であり、ここで第１の代謝産物は、左テールを有するＡＳＤテール効果を表し、試料中の第１の代謝産物のレベルがＡＳＤ集団のメンバーで濃縮された左テールを定義する予め決定された下の（最大の）閾値未満である場合、試料中の第１の代謝産物のレベルはＡＳＤテール内である、ステップ；（ｉｉ）試料に由来する複数の代謝産物の少なくとも１種の追加の代謝産物のレベルを測定するステップであって、少なくとも１種の追加の代謝産物のそれぞれの集団分布が、参照集団において前もって特徴付けられ、ＡＳＤテール効果を表すことが予め決定されており、少なくとも１種の追加の代謝産物のそれぞれについて、ステップ（ｉ）に従って試料中の前記代謝産物のレベルが対応するＡＳＤテール内であるかどうかを同定するステップ；ならびに（ｉｉｉ）ステップ（ｉ）およびステップ（ｉｉ）で分析された代謝産物に関して試料がその範囲内にある同定されたＡＳＤテールに基づいて、予め決定されたレベルの予測可能性を用いて、ＡＳＤを有する対象のリスクを決定するステップを含む方法を対象とする。

ある特定の実施形態において、複数の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される少なくとも２種の代謝産物を含む。

別の態様において、本発明は、対象における自閉症スペクトラム障害（ＡＳＤ）のリスクを決定する方法であって、（ｉ）対象から得られた試料中の複数の代謝産物のレベルを分析するステップであって、複数の代謝産物が、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される少なくとも２種の代謝産物を含む、ステップ；ならびに（ｉｉ）複数の代謝産物の定量化されたレベルに基づいて、対象がＡＳＤを有するリスクを決定するステップを含む方法を対象とする。

ある特定の実施形態において、対象は、約５４ヶ月齢以下である。ある特定の実施形態において、対象は、約３６ヶ月齢以下である。

ある特定の実施形態において、試料は、血漿試料である。

ある特定の実施形態において、代謝産物のレベルを測定するステップは、質量分析を行うことを含む。ある特定の実施形態において、質量分析を行うことは、熱分解質量分析、フーリエ変換赤外分光分析、ラマン分光分析、ガスクロマトグラフ質量分析、高圧液体クロマトグラフィー／質量分析（ＨＰＬＣ／ＭＳ）、液体クロマトグラフィー（ＬＣ）−エレクトロスプレー質量分析、ｃａｐ−ＬＣ−タンデムエレクトロスプレー質量分析、および超高速液体クロマトグラフィー／エレクトロスプレーイオン化タンデム質量分析からなる群から選択される１つまたは複数のメンバーを行うことを含む。

別の態様において、本発明は、対象において自閉症スペクトラム障害（ＡＳＤ）と非ＡＳＤ発達遅延（ＤＤ）とを識別する方法であって、（ｉ）対象から得られた試料中の複数の代謝産物のレベルを分析するステップであって、複数の代謝産物が、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される少なくとも２種の代謝産物を含み、複数の代謝産物のレベルおよび／または集団分布が、参照集団において前もって特徴付けられる、ステップ；ならびに（ｉｉ）予め決定されたレベルの予測可能性を用いて、予め決定された閾値（例えば、公知の分類を有する試料の参照集団から決定された閾値）を有する対象からの試料に由来する複数の代謝産物のレベルを比較することによって、（ａ）対象がＡＳＤを有しＤＤを有さないこと、または（ｂ）対象がＤＤを有しＡＳＤを有さないことを決定するステップを含む方法を対象とする。

ある特定の実施形態において、本発明は、異なる代謝産物に重みを割り当てて、リスク予測においてそれらのそれぞれの機能を反映することによって、代謝産物を分析するための方法を提供する。一部の実施形態において、重みの割り当ては、代謝産物の生物学的機能（例えば、それらが属する経路）、それらの臨床的有用性、または統計もしくは疫学的分析に基づくそれらの重要性から推測することができる。

ある特定の実施形態において、本発明は、これらに限定されないが、クロマトグラフィーアッセイ、質量分析アッセイ、蛍光測定法アッセイ、電気泳動アッセイ、免疫親和性アッセイ、および免疫化学アッセイなどの様々な技術を使用して代謝産物を測定するための方法を提供する。

ある特定の実施形態において、本発明は、対象における自閉症スペクトラム障害（ＡＳＤ）のリスクを決定するための方法であって、対象からの試料に由来する複数の代謝産物のレベルを分析するステップ；および予め決定されたレベルの予測可能性を用いて、複数の代謝産物の定量化されたレベルに基づいて、対象が非ＡＳＤ発達障害ではなくＡＳＤを有するかどうかを決定するステップを含む方法を提供する。

ある特定の実施形態において、複数の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも１種の代謝産物を包含する。

ある特定の実施形態において、複数の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも２種の代謝産物を包含する。

ある特定の実施形態において、複数の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、または少なくとも１０種の代謝産物を包含する。

ある特定の実施形態において、複数の代謝産物は、追加の代謝産物を包含する。一部の実施形態において、複数の代謝産物は、２１種より多くの代謝産物を包含する。

ある特定の実施形態において、本発明は、対象において自閉症スペクトラム障害（ＡＳＤ）と非ＡＳＤ発達障害とを識別するための方法であって、対象からの試料に由来する複数の代謝産物のレベルを分析するステップ、代謝産物のレベルを、１つの参照集団におけるそれらのそれぞれの集団分布と比較するステップ、および予め決定されたレベルの予測可能性を用いて、対象からの試料に由来する複数の代謝産物のレベルを、参照集団における複数の代謝産物の前もって特徴付けられたレベルおよび／または集団分布と比較することによって、対象が非ＡＳＤ発達障害ではなくＡＳＤを有するかどうかを決定するステップを含む方法を提供する。

例えば、ある特定の実施形態において、本発明は、対象におけるＡＳＤのリスクを予測することができる少なくとも１種の代謝産物を包含する診断基準であって、ＲＯＣ曲線が、少なくとも０．６０、少なくとも０．６５、少なくとも０．７０、少なくとも０．７５、少なくとも０．８０、少なくとも０．８５または少なくとも０．９０のＡＵＣを有する、診断基準を提供する。ＡＵＣは、分類器について真陽性率（感度）に対して偽陽性率（１−特異度）をプロットしたＲＯＣ曲線下の面積である。

ある特定の実施形態において、分析のための少なくとも１種の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される。

ある特定の実施形態において、分析のための少なくとも１種の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される少なくとも２種またはそれより多く（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１種）のメンバーを含み、非ＡＳＤ集団分布曲線およびＡＳＤ集団分布曲線は、代謝産物のそれぞれ（例えば、テール効果を実証する前記代謝産物のそれぞれ）について確立される。

ある特定の実施形態において、分析のための代謝産物は、ガンマ−ＣＥＨＣ、キサンチン、ｐ−クレゾールスルフェート、オクテノイルカルニチン、フェニルアセチルグルタミン、およびそれらの組合せからなる群から選択される。

ある特定の実施形態において、分析のための代謝産物は、ガンマ−ＣＥＨＣである。

ある特定の実施形態において、分析のための代謝産物は、キサンチンである。

ある特定の実施形態において、分析のための代謝産物は、ｐ−クレゾールスルフェートである。

ある特定の実施形態において、分析のための代謝産物は、オクテノイルカルニチンである。

ある特定の実施形態において、分析のための代謝産物は、フェニルアセチルグルタミンである。

ある特定の実施形態において、分析のための代謝産物は、イソバレリルグリシンである。

ある特定の実施形態において、分析のための代謝産物は、ピペコレートである。

ある特定の実施形態において、分析のための代謝産物は、インドールアセテートである。

ある特定の実施形態において、分析のための代謝産物は、ヒドロキシ−クロロタロニルである。

ある特定の実施形態において、複数の代謝産物は、相補的である少なくとも第１の代謝産物および第２の代謝産物を含む（例えば、代謝産物によって提供される予測変数が部分的に排反して低い相互情報量を有するように、第１および第２の代謝産物のためのＡＳＤテール試料は実質的にオーバーラップしない。ある特定の実施形態において、複数の代謝産物が低い相互情報量で取り入れられることによってリスク予測は改善される。

ある特定の実施形態において、複数の代謝産物は、２種の代謝産物を含み、ここで２種の代謝産物は、２種の代謝産物のセットとして一緒に組み合わされて、少なくとも０．６２、０．６３、０．６４、または０．６５のＡＵＣを提供する。

ある特定の実施形態において、複数の代謝産物は、３種の代謝産物を含み、ここで３種の代謝産物は、３種の代謝産物のセットとして一緒に組み合わされて、少なくとも０．６６、０．６７、または０．６８のＡＵＣを提供する。

ある特定の実施形態において、本発明は、前もって定義された代謝産物の２つの群のレベルを分析することによって、対象において自閉症スペクトラム障害（ＡＳＤ）と非ＡＳＤ発達障害とを識別する方法を提供する。ある特定の実施形態において、代謝産物の第１の群は、ＡＳＤと密接に関連する代謝産物を表し、一方で代謝産物の第２の群は、対照状態（例えば、ＤＤ）と関連する代謝産物を表す。対象からの試料に由来する代謝産物の両方の群を分析することによって、対照状態ではなくＡＳＤを有する対象のリスクを、本開示で説明される様々な方法によって決定することができる。例えば、これは、代謝産物の第１の群について集約されたＡＳＤテール効果を、代謝産物の第２の群について集約された非ＡＳＤテール効果と比較することによって達成できる。

ある特定の実施形態において、本発明は、対象において自閉症スペクトラム障害（ＡＳＤ）と非ＡＳＤ発達遅延（ＤＤ）とを識別するための方法であって、（ｉ）対象から得られた試料中の複数の代謝産物のレベルを測定するステップであって、複数の代謝産物が、キサンチン、ガンマ−ＣＥＨＣ、ヒドロキシ−クロロタロニル、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、インドールアセテート、ｐ−クレゾールスルフェート、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、ヒドロキシイソバレロイルカルニチン（Ｃ５）、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも２種の代謝産物を含む、ステップ；ならびに（ｉｉ）（ａ）表９Ａで定義されるＡＳＤ（ＡＳＤ左テール効果）の指標であるか、もしくは（ｂ）表９Ｂで定義されるＤＤ（ＤＤ左テール効果）の指標である、予め決定された閾値濃度もしくはそれ未満のレベルを有する試料中の代謝産物の数を計算するステップ；ならびに／または（ｉｉｉ）（ａ）表９Ａで定義されるＡＳＤ（ＡＳＤ右テール効果）の指標であるか、もしくは（ｂ）表９Ｂで定義されるＤＤ（ＤＤ右テール効果）の指標である、予め決定された閾値濃度もしくはそれを超えるレベルを有する試料中の代謝産物の数を計算するステップ；ならびに（ｉｖ）ステップ（ｉｉ）および／または（ｉｉｉ）で得られた数に基づいて、対象がＡＳＤまたはＤＤを有すると決定するステップを含む方法を提供する。

ある特定の実施形態において、本発明は、対象がＡＳＤを有するかまたはそのリスクがあることを決定するための方法であって、（ｉ）対象から得られた試料中の複数の代謝産物のレベルを測定するステップであって、複数の代謝産物が、キサンチン、ガンマ−ＣＥＨＣ、ヒドロキシ−クロロタロニル、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、インドールアセテート、ｐ−クレゾールスルフェート、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、ヒドロキシイソバレロイルカルニチン（Ｃ５）、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも２種の代謝産物を含む、ステップ；ならびに（ｉｉ）（ａ）１８２．７ｎｇ／ｍｌまたはそれを超えるレベルのキサンチン；（ｂ）２０．３ｎｇ／ｍｌまたはそれを超えるレベルのヒドロキシル−クロロタロニル；（ｃ）２８．５ｎｇ／ｍｌまたはそれを超えるレベルの５−ヒドロキシインドールアセテート；（ｄ）６８６６００ｎｇ／ｍｌまたはそれを超えるレベルのラクテート；（ｅ）６３．３ｎｇ／ｍｌまたはそれを超えるレベルのパントテネート；（ｆ）３０３．６ｎｇ／ｍｌまたはそれを超えるレベルのピペコレート；（ｇ）３２．０ｎｇ／ｍｌまたはそれ未満のレベルのガンマ−ＣＥＨＣ；（ｈ）１４１．４ｎｇ／ｍｌまたはそれ未満のレベルのインドールアセテート；（ｉ）１８２．７ｎｇ／ｍｌまたはそれ未満のレベルのｐ−クレゾールスルフェート；（ｊ）１１９１０．３ｎｇ／ｍｌまたはそれ未満のレベルの１，５−アンヒドログルシトール（１，５−ＡＧ）；（ｋ）７．９８ｎｇ／ｍｌまたはそれ未満のレベルの３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）；（ｌ）２５６．７ｎｇ／ｍｌまたはそれ未満のレベルの３−インドキシルスルフェート；（ｍ）３．０ｎｇ／ｍｌまたはそれ未満のレベルの４−エチルフェニルスルフェート；（ｎ）１２．９ｎｇ／ｍｌまたはそれ未満のレベルのヒドロキシイソバレロイルカルニチン（Ｃ５）；（ｏ）１２４．８２ｎｇ／ｍｌまたはそれ未満のレベルのＮ１−メチル−２−ピリドン−５−カルボキサミド；および（ｐ）１６６．４ｎｇ／ｍｌまたはそれ未満のレベルのフェニルアセチルグルタミン（phenacetylglutamine）の２種またはそれより多くを検出するステップ；ならびに（ｉｉｉ）ステップ（ｉｉ）で検出された代謝産物レベルに基づいて対象がＡＳＤを有するかまたはそのリスクがあると決定するステップを含む方法を提供する。

一部の実施形態において、ステップ（ｉｉ）で検出される代謝産物レベルは、およそのレベルである。

一部の実施形態において、本発明は、自閉症スペクトラム障害（ＡＳＤ）を有するかまたはそれを有するリスクがあると対象を診断する方法であって、（ｉ）前記対象から得られた試料中の１つまたは複数の代謝産物のレベルを決定するステップ；（ｉｉ）１つまたは複数の代謝産物の決定されたレベルを、前記１つまたは複数の代謝産物の予め決定されたレベルと比較するステップであって、前記予め決定されたレベルが、ＡＳＤを有するかまたはＡＳＤを有するリスクがある対象の指標である、ステップ；および（ｉｉｉ）前記１つまたは複数の代謝産物の決定されたレベルと予め決定されたレベルとの差に基づいて、前記対象をＡＳＤを有するかまたはＡＳＤを有するリスクがあると診断するステップを含み、ここで前記１つまたは複数の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される、方法を提供する。

一部の実施形態において、本発明は、自閉症スペクトラム障害（ＡＳＤ）を有するかまたはそれを有するリスクがあると対象を診断する方法であって、（ｉ）前記対象から得られた試料中の１つまたは複数の代謝産物のレベルを決定するステップ；（ｉｉ）１つまたは複数の代謝産物の決定されたレベルを、前記１つまたは複数の代謝産物の予め決定されたレベルと比較するステップであって、前記予め決定されたレベルが、ＡＳＤを有するかまたはＡＳＤを有するリスクがある対象の指標である、ステップ；および（ｉｉｉ）前記１つまたは複数の代謝産物の決定されたレベルと予め決定されたレベルとの差に基づいて、前記対象をＡＳＤを有するかまたはＡＳＤを有するリスクがあると診断するステップを含み、ここで前記１つまたは複数の代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択され、ただし代謝産物は、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、または３−ヒドロキシヒプレートではない、方法を提供する。

ある特定の実施形態において、本発明は、対象からのある特定の代謝産物および遺伝情報の両方のレベルを測定することによって、対象においてＡＳＤリスクを決定するための方法を提供する。一部の実施形態において、遺伝情報は、コピー数多型（ＣＮＶ）および／または脆弱Ｘ（ＦＸＳ）検査を包含する。

追加の実施形態において、本発明のある特定の態様に関して説明された限定は、本発明の他の態様に適用することができる。例えば、１つの独立請求項に従属する請求項の限定は、一部の実施形態において、別の独立請求項に適用され得る。

図１は、２つの集団（例えば、ＡＳＤおよびＤＤ）における例示的な代謝産物の分布と、これら２つの集団間のこの代謝産物の平均シフトを例示する。

図２は、２つの集団（例えば、ＡＳＤおよびＤＤ）における例示的な代謝産物の分布と、これら２つの集団間のこの代謝産物のテール効果（例えば、ＡＳＤ分布はより高密度に集合したテールを有する）を例示する。

図３は、２つの集団（例えば、ＡＳＤおよびＤＤ）中の代謝産物５−ヒドロキシインドールアセテートの分布であって、統計学的に有意な平均シフト（ｔ検定；ｐ＜０．０１）および２つの集団間の統計学的に有意な右テール効果（「極値」はテール効果を示し、フィッシャーの検定においてｐ＝０．００１である）を表す分布を例示する。

図４は、２つの集団（例えば、ＡＳＤおよびＤＤ）中の代謝産物ガンマ−ＣＥＨＣの分布であって、２つの集団間の統計学的に有意な左テール効果（「極値」はテール効果を示し、フィッシャーの検定においてｐ＝０．００８である）を表す分布を例示する。

図５は、２つの集団（例えば、ＡＳＤおよびＤＤ）中の代謝産物フェニルアセチルグルタミンの分布であって、統計学的に有意な平均シフト（ｔ検定；ｐ＝０．００１）と、２つの集団間の統計学的に有意な左および右テール効果（「極値」はテール効果を示し、フィッシャーの検定においてｐ＝０．０００１である）を表す分布を例示する。分布は、２つの集団においてシフトしたガウス曲線として表される。

図６は、２つの例示的な代謝産物の相関を例示し、これら２種の代謝産物はテール効果の別個のプロファイルを所有し、相補的であることを実証する。

図７は、１８０人の対象における１２種の例示的な代謝産物のテール効果と、ＡＳＤおよびＤＤに関するそれらの予測力を例示する。

図８Ａは、例示的な１２種の代謝産物のパネルを使用した１８０個の試料に関するＡＳＤおよび非ＡＳＤテール効果のプロットを例示し、ＡＳＤ患者からの試料は、ＡＳＤテール効果の集約を示すことが実証される。

図８Ｂは、例示的な１２種の代謝産物のパネルを使用した１８０個の試料に関するＡＳＤおよび非ＡＳＤテール効果のプロットと、データをビニングする例示的な方法を例示する。

図８Ｃは、例示的な２１種の代謝産物のパネルを使用した１８０個の試料に関するＡＳＤおよび非ＡＳＤテール効果のプロットを例示し、ＡＳＤ患者からの試料は、ＡＳＤテール効果の集約を示すことが実証される。

図９は、例示的な１２種の代謝産物のパネルに関するＡＳＤの予測可能性の増加を増加したと査定された代謝産物の数として例示する。

図１０Ａは、例示的な１２種の代謝産物のパネルを使用したＡＳＤの予測可能性における三分化（trichotomization）の効果を例示する。

図１０Ｂは、例示的な２１種の代謝産物のパネルの分析におけるＡＳＤの予測可能性における三分化の効果を例示する。

図１１Ａは、例示的な１２種の代謝産物のパネルの分析のための非投票方法と比較した投票方法を使用したＡＳＤの予測可能性における改善を例示する。

図１１Ｂは、例示的な２１種の代謝産物のパネルを使用した非投票方法と比較した投票方法を使用したＡＳＤの予測可能性における改善を例示する。

図１２は、ＡＳＤの高い予測可能性を達成するために例示的な１２種の代謝産物のパネルを使用するための検証プロセスを例示する。

図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。図１３Ａ〜１３Ｕは、ＡＳＤ集団および非ＡＳＤ集団における２１種の例示的な代謝産物の集団分布を例示する。

図１４Ａ〜Ｂは、テール効果分析および平均シフト分析によって査定された、総数６００種の代謝産物からの例示的な１２種の代謝産物のパネル、例示的な２１種の代謝産物のパネル、および８４種の候補代謝産物のセットの包含および排除による、ＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。図１４Ａ〜Ｂは、テール効果分析および平均シフト分析によって査定された、総数６００種の代謝産物からの例示的な１２種の代謝産物のパネル、例示的な２１種の代謝産物のパネル、および８４種の候補代謝産物のセットの包含および排除による、ＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。

図１４Ｃ〜Ｄは、テール効果分析および平均シフト分析によって査定された、総数６００種の代謝産物からの例示的な１２種の代謝産物のパネルおよび例示的な２１種の代謝産物のパネルの包含（ホワイトリスト）および排除（ブラックリスト）による、ならびに試料の２つのコホート（すなわち、「クリスマス」および「イースター」）においてロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。図１４Ｃ〜Ｄは、テール効果分析および平均シフト分析によって査定された、総数６００種の代謝産物からの例示的な１２種の代謝産物のパネルおよび例示的な２１種の代謝産物のパネルの包含（ホワイトリスト）および排除（ブラックリスト）による、ならびに試料の２つのコホート（すなわち、「クリスマス」および「イースター」）においてロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。

図１５は、例示的な２１種の代謝産物のパネルのサブセットから選択される代謝産物の数の増加を使用することによるＡＳＤの予測可能性に対する効果を例示する。

図１６Ａは、例示的な１２種の代謝産物のパネルを使用してテール効果分析に遺伝情報を追加する効果を例示し、ＡＳＤを非ＡＳＤから選別する力の改善を実証する。

図１６Ｂは、例示的な２１種の代謝産物のパネルを使用してテール効果分析に遺伝情報を追加する効果を例示し、ＡＳＤを非ＡＳＤから選別する力の改善を実証する。

図１７Ａ〜Ｂは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、およびロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。図１７Ａ〜Ｂは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、およびロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。

図１８Ａ〜Ｂは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および２つのコホート（すなわち、「クリスマス」および「イースター」）においてロジスティック回帰を使用することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。図１８Ａ〜Ｂは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および２つのコホート（すなわち、「クリスマス」および「イースター」）においてロジスティック回帰を使用することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。

図１９Ａ〜Ｄは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。図１９Ａ〜Ｄは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。図１９Ａ〜Ｄは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。図１９Ａ〜Ｄは、代謝産物総数からの例示的な２１種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるＡＳＤの予測可能性に対する効果を例示する。（ブラックリスト＝排除されたもの、ホワイトリスト＝包含されたもの、ｍｘ＿１２＝例示的な１２種の代謝産物のパネル、ｍｘ＿標的化された２１種＝例示的な２１種の代謝産物のパネル、ｍｘ＿全候補＝８４種の候補代謝産物、全フィーチャ＝６００種の代謝産物の全セット）。

図２０は、ＡＳＤ予測のための例示的な２１種の代謝産物のパネルに関するテール効果分析の特異度および感度の代表的なプロットを例示する。

図２１は、ＡＳＤまたはＤＤのリスクスコアがＡＳＤおよびＤＤの予測代謝産物に関するオッズ比のｌｏｇ２値の合計に基づいて計算されるスコアリングシステムを例示する。

定義
本発明をより容易に理解するために、まずある特定の用語を以下で定義する。以下の用語および他の用語の追加の定義は明細書中のあらゆる箇所で明示される。

本出願において、文脈からそうではないことが明らかでない限り、（ｉ）用語「１つの（ａ）」は、「少なくとも１つの」を意味すると理解することができ、（ｉｉ）用語「または」は、「および／または」を意味すると理解することができ、（ｉｉｉ）用語「含む」および「包含する」は、単独で提示されているかまたは１つもしくは複数の追加の構成要素もしくはステップと共に提示されているかにかかわらず、列挙された構成要素またはステップを含むと理解することができ、（ｉｖ）用語「約」および「およそ」は、当業者により理解されるであろう標準偏差を許容すると理解することができ、（ｖ）範囲が提供される場合、端点が包含される。

薬剤：用語「薬剤」は、本明細書で使用される場合、例えばポリペプチド、核酸、糖類、脂質、小分子、金属、またはそれらの組合せなどの、あらゆる化学クラスの化合物または実体を指す場合がある。

およそ：本明細書で使用される場合、用語「およその」、「およそ」または「約」は、当業者によって関連する文脈に適するように理解されるであろう通常の統計学的変動を包含することが意図される。ある特定の実施形態において、用語「およその」、「およそ」または「約」は、特に他の指定がない限り、述べられた参照値の、いずれかの方向（それより大きいかまたはそれより小さい）で２５％、２０％、１９％、１８％、１７％、１６％、１５％、１４％、１３％、１２％、１１％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％またはそれ未満の範囲に収まるか、またはそうでなければ文脈から明白な値の範囲を指す（ただしこのような数値が可能性のある値の１００％を超えると予想される場合を除く）。

曲線下面積（ＡＵＣ）：分類器は、真陽性率（感度）に対して偽陽性率（１−特異度）をプロットした関連するＲＯＣ曲線（受信者動作特性曲線）を有する。ＲＯＣ曲線下の面積（ＡＵＣ）は、分類器が２つの診断群をどの程度うまく区別することができるかの尺度である。パーフェクトな分類器は、０．５のＡＵＣを有するランダムな分類器と比較して、１．０のＡＵＣを有する。

〜と関連する：この用語は、本明細書では、一方の存在、レベルおよび／または形態が他方のそれと相関している場合に使用されるように、２つの事象または実体が互いに「関連する」ことである。例えば、特定の実体の存在、レベルおよび／または形態が、特定の疾患、障害、または状態の発生率および／または感受性と相関する場合（例えば、関連集団全体で）、その実体は、その疾患、障害または状態と関連するとみなされる。

自閉症スペクトラム障害：本明細書で使用される場合、用語「自閉症スペクトラム障害」は、双方向の社会的相互作用の欠陥、言語の困難さ、反復行動および限定的な興味の１つまたは複数を特徴とする自閉症「スペクトラム」における発達障害を指すと当業者により認識される。自閉症スペクトラム障害は、ＤＳＭ−Ｖ（２０１３年５月）に、例えば、コミュニケーションの欠陥、例えば会話での不適切な応答、誤解を招く非言語的な相互作用、年齢に適した交友関係構築の困難さ、日常的作業における過度の依存、彼らの環境変化に対して極めて敏感なこと、および／または不適切な事柄への激しい集中などの一連の症状を含む障害と特徴付けられている。自閉症スペクトラム障害は加えて、例えばＤＳＭ−ＩＶ−ＴＲによって、自閉性障害、アスペルガー障害、レット障害、小児期崩壊性障害、および特定不能の広汎性発達障害（非定型自閉症など）を含むと特徴付けられている。一部の実施形態において、自閉症スペクトラム障害（ＡＳＤ）は、質問事項および観察スケジュールなどの標準化した試験手段を使用して特徴付けられる。例えば、一部の実施形態において、ＡＳＤは、（ｉ）自閉症診断観察スケジュール（ＡＤＯＳ）におけるコミュニケーションおよび社会的相互作用の総計に対する自閉症のカットオフを満たすスコア、ならびに自閉症診断面接改訂版（ＡＤＩ−Ｒ）における≦３６ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア；ならびに／または（ｉｉ）ＡＤＯＳにおけるコミュニケーションおよび社会的相互作用の総計に対するＡＳＤカットオフを満たすスコア、ならびにＡＤＩ−Ｒにおける≦３６ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア、ならびに（ｉｉ）（ａ）ＡＤＩ−Ｒにおける社会的相互作用およびコミュニケーションに関するカットオフ値を満たすスコア、または（ｉｉ）（ｂ）社会的相互作用もしくはコミュニケーションに関するカットオフ値を満たすスコア、およびＡＤＩ−Ｒにおける社会的相互作用もしくはコミュニケーションに対するカットオフ値の２ポイント以内であること（どちらもカットオフ値を満たしていない）、または（ｉｉ）（ｃ）スコアが、ＡＤＩ−Ｒにおける社会的相互作用およびコミュニケーションに関するカットオフ値の１ポイント以内であることによって特徴付けられる。

分類：本明細書で使用される場合、「分類」は、公知のクラス内の収集されたデータポイント間の共通のフィーチャを発見し、次いで異なるクラスの１つにデータポイントを割り振るための数学的方法または他の方法を使用することによって、データポイントを異なるクラスに選別することを学習するプロセスである。統計において、分類は、その部分集団が公知である観察を含有するデータの訓練セットに基づいて、部分集団の同一性が不明である新しい観察が属する部分集団を同定する問題である。したがって要求は、１つまたは複数の測定値、特色または特徴などに関する定量的情報に基づく群、および前もって決定された群分けがすでに確立されている訓練セットに基づく群に、新しい個々の項目が分類されることである。分類は、多くの適用を有する。いくつかのケースにおいて、分類は、データマイニング手順として採用される一方で、他のケースではより詳細な統計学的モデリングが用いられる。

分類器：本明細書で使用される場合、「分類器」は、データ分類を行うための方法、アルゴリズム、コンピュータープログラム、またはシステムである。広く使用される分類器の例としては、これらに限定されないが、ニューラルネットワーク（多層パーセプトロン）、ロジスティック回帰、サポートベクターマシン、ｋ−最近傍、ガウス混合モデル、ガウスのナイーブベイズ、決定木、部分最小二乗判別分析（ＰＳＬ−ＤＡ）、フィッシャーの線形判別、ロジスティック回帰、ナイーブベイズ分類器、パーセプトロン、サポートベクターマシン、二次分類器、カーネル推定、ブースティング、ニューラルネットワーク、ベイジアンネットワーク、隠れマルコフモデル、および学習ベクトル量子化が挙げられる。

決定：本明細書で説明される多くの手法は、「決定する」ステップを包含する。当業者であれば、本明細書を読めば、このような「決定」は、例えば本明細書で明示的に言及される具体的な技術などの当業者に利用可能な様々な技術のいずれかを利用してもよいし、またはその使用を介して達成されてもよいことを理解するであろう。一部の実施形態において、決定は、物理的な試料の操作を含む。一部の実施形態において、決定は、例えば関連分析を行うように適合されたコンピューターまたは他の処理ユニットを利用する、データまたは情報の考察および／または操作を含む。一部の実施形態において、決定は、ソースから関連情報および／または材料を受けることを含む。一部の実施形態において、決定は、試料または実体の１つまたは複数のフィーチャを、比較可能な参照と比較することを含む。

リスクの決定：本明細書で使用される場合、リスクの決定は、所与の対象が特定の状態または障害を有するかまたは有さない確率を計算または定量化することを包含する。一部の実施形態において、障害または状態、例えば自閉症スペクトラム障害（ＡＳＤ）または発達遅延（ＤＤ）に関する陽性または陰性診断は、決定されたリスクまたはリスクスコア（例えば、オッズ比または範囲）に全体的または部分的に基づいてなされ得る。

発達遅延：本明細書で使用される場合、発達遅延（ＤＤ）という成句は、小児発達の１つまたは複数のプロセス、例えば、自閉症スペクトラム障害に起因しない、身体的発達、認知発達、コミュニケーションの発達、社会性もしくは情緒の発達、または適応性の発達などにおける進行中の重度または軽度の遅延を指す。ＡＳＤを有する個体が発達的に遅延しているとみなされる可能性があるとしても、ＡＳＤおよびＤＤの分類が相互排他的になるように、本明細書で使用されるＡＳＤの分類はＤＤの分類に勝るとみなされることになる。言い換えれば、特に他の指定がない限り、ＤＤの分類は、非ＡＳＤ発達遅延を意味すると仮定される。一部の実施形態において、ＤＤは、非自閉症（ＡＵ）および非ＡＳＤであって、さらに、（ｉ）ミューレンスケールでは６９もしくはそれより低いスコア、ヴァインランドスケールでは６９もしくはそれより低いスコア、およびＳＣＱでは１４もしくはそれより低いスコア、または（ｉｉ）ミューレンもしくはヴァインランドのいずれかでは６９もしくはそれより低いスコア、および他の査定ではカットオフ値の標準偏差の半分以内（７７またはそれより低いスコア）を有することを特徴とする。

診断情報：本明細書で使用される場合、診断情報または診断で使用するための情報は、患者が疾患または状態を有するかどうかを決定することにおいて有用な、および／あるいは疾患もしくは状態の予後に関する重要性を有する、または疾患もしくは状態の処置（一般的な処置または何らかの特定の処置のいずれか）に対して応答する可能性がある、表現型のカテゴリーまたはあらゆるカテゴリーに、疾患または状態を分類することにおいて有用なあらゆる情報である。同様に、診断は、これらに限定されないが、対象が疾患もしくは状態（例えば自閉症スペクトラム障害）を有する可能性が高いかどうか、対象で顕在化した疾患もしくは状態の状況、病期もしくは特徴、障害の性質もしくは分類に関する情報、予後に関する情報、および／または適切な処置の選択において有用な情報などのあらゆるタイプの診断情報を提供することを指す。処置の選択としては、特定の治療剤または行動療法、食事の改変などの他の処置様式の選択、療法を保留するかまたは実行するかどうかについての選択、用量レジメン（例えば、特定の治療剤または治療剤の組合せの１つまたは複数の用量の頻度またはレベル）に関する選択などを挙げることができる。

マーカー：マーカーは、本明細書で使用される場合、その存在またはレベルが、特定の疾患もしくは状態と関連するか、または特定の疾患もしくは状態との相関を有する薬剤を指す。代替として、または加えて、一部の実施形態において、特定のマーカーの存在またはレベルは、例えば特定の障害に特徴的である可能性がある特定のシグナル伝達経路の活性（または活性レベル）と相関する。マーカーは、疾患または状態において病因学的な役割を果たすものでもよいし、またはそうでなくてもよい。マーカーの存在または非存在の統計学的有意性は、特定のマーカーに応じて様々であり得る。一部の実施形態において、マーカーの検出は、特定のサブクラスに障害が属する高い確率を反映するという点で、高度に特異的である。本発明によれば、有用なマーカーが、特定のサブクラスの障害を１００％の精度で区別する必要はない。

代謝産物：本明細書で使用される場合、代謝産物という用語は、身体の化学的または物理的プロセス中に産生された物質を指す。用語「代謝産物」は、代謝プロセスのあらゆる化学的または生化学的生成物、例えば生体分子のプロセシング、切断または消費によって産生されたあらゆる化合物を包含する。このような分子の例としては、これらに限定されないが、酸および関連化合物；モノ、ジ、およびトリカルボン酸（飽和、不飽和脂肪族および環式、アリール、アルカリル）；アルド酸（aldo-acid）、ケト酸；ラクトン型；ジベレリン（gibbereillin）；アブシジン酸；アルコール、ポリオール、誘導体、および関連化合物；エチルアルコール、ベンジルアルコール、メンタノール；プロピレングリコール、グリセロール、フィトール；イノシトール、フルフリルアルコール、メントール；アルデヒド、ケトン、キノン、誘導体、および関連化合物；アセトアルデヒド、ブチルアルデヒド、ベンズアルデヒド、アクロレイン、フルフラール、グリオキサール；アセトン、ブタノン；アントラキノン；炭水化物；単糖、二糖、三糖；アルカロイド、アミン、および他の塩基；ピリジン（ニコチン酸、ニコチンアミドなど）；ピリミジン（シチジン、チミンなど）；プリン（グアニン、アデニン、キサンチン／ヒポキサンチン、キネチンなど）；ピロール；キノリン（イソキノリンなど）；モルフィナン、トロパン、シンコナン；ヌクレオチド、オリゴヌクレオチド、誘導体、および関連化合物；グアノシン、シトシン、アデノシン、チミジン、イノシン；アミノ酸、オリゴペプチド（oligopepide）、誘導体、および関連化合物；エステル；フェノールおよび関連化合物；複素環式化合物および誘導体；ピロール、テトラピロール（コリノイドおよびポルフィン／ポルフィリン、ｗ／ｗ／ｏ金属イオン）；フラボノイド；インドール；脂質（脂肪酸およびトリグリセリドなど）、誘導体、および関連化合物；カロチノイド、フィトエン；およびステロール、テルペンなどのイソプレノイド；ならびに上記の分子の改変型が挙げられる。一部の実施形態において、代謝産物は、内因性物質の代謝生成物である。一部の実施形態において、代謝産物は、外因性物質の代謝生成物である。一部の実施形態において、代謝産物は、内因性物質および外因性物質の代謝生成物である。本明細書で使用される場合、用語「メタボローム」は、体液、細胞、組織、臓器、または生体中の代謝産物の化学的なプロファイルまたはフィンガープリントを指す。

代謝産物の分布曲線：本明細書で使用される場合、代謝産物の分布曲線は、集団密度（例えば、ＡＳＤまたはＤＤ）に対してプロットされた代謝産物レベルから誘導された関数によって定義される確率分布曲線である。一部の実施形態において、分布曲線は、データの標準曲線の当てはめである。一部の実施形態において、分布曲線は、最小二乗多項式曲線の当てはめである。一部の実施形態において、分布曲線は、非対称、または非ガウス性である。一部の実施形態において、分布曲線は、単に関連する診断カテゴリー対代謝産物の値を用いたケースのプロット（例えば、「ラグプロット」）であり、この場合、曲線の当てはめはない。

相互情報量：本明細書で使用される場合、相互情報量は、２つの変数の相互依存性の尺度（すなわち、ある変数を知ることによって他の変数に関する不確実性を減らす程度）を指す。高い相互情報量は、不確実性の低減が大きいことを示し、低い相互情報量は、低減が小さいことを示し、２つの確率変数間の相互情報量がゼロであることは、その変数は独立していることを意味する。

非自閉症スペクトラム障害（非ＡＳＤ）：本明細書で使用される場合、非自閉症スペクトラム障害（非ＡＳＤ）は、自閉症スペクトラム障害を有する子供または成人に属さない分類を指す。一部の実施形態において、「非ＡＳＤ」は、正常に発達する対象である。一部の実施形態において、非ＡＳＤ集団は、発達遅延（ＤＤ）を有する対象からなるかまたはそれを含む。一部の実施形態において、「非ＡＳＤ」は、ＤＤおよび正常に発達する対象の両方からなるかまたはそれを含む。

患者：本明細書で使用される場合、用語「患者」または「対象」は、例えば実験、診断、予防、および／または治療目的で試験もしくは組成物が投与されるかまたは投与され得るあらゆる生体を指す。一部の実施形態において、患者は、１つもしくは複数の障害もしくは状態に罹っているかまたは罹りやすい。一部の実施形態において、患者は、障害または状態の１つまたは複数の症状を呈する。一部の実施形態において、患者は、１つまたは複数の障害または状態を有することが疑われる。

予測可能性：本明細書で使用される場合、予測可能性は、対象の疾患の状態の正しい予測または予報を定性的または定量的のいずれかでなすことができる度合いを指す。パーフェクトな予測可能性は、厳密な決定論を意味するが、予測可能性の欠如は必ずしも決定論の欠如を意味しない。予測可能性への制限は、情報の欠如または過剰な複雑さなどの要因によって引き起こされる可能性がある。

予後および予測の情報：本明細書で使用される場合、予後および予測の情報という用語は、同義的に使用され、処置の非存在または存在下のいずれかにおける疾患または状態の経過のあらゆる態様を示すのに使用され得るあらゆる情報を指す。このような情報としては、これらに限定されないが、患者の疾患が治癒する尤度、患者の疾患が特定の療法に応答する尤度を挙げることができる（ここで応答は、様々な方法のいずれかで定義され得る）。予後および予測の情報は、診断情報の広範なカテゴリー内に包含される。

参照：用語「参照」は、本明細書において、目的の薬剤、個体、集団、試料、配列または値が比較される、標準または対照の薬剤、個体、集団、試料、配列または値を説明するのにしばしば使用される。一部の実施形態において、参照薬剤、個体、集団、試料、配列または値は、目的の薬剤、個体、集団、試料、配列または値の試験または決定と実質的に同時に試験および／または決定される。一部の実施形態において、参照薬剤、個体、集団、試料、配列または値は、ヒストリカルな参照であり、任意選択で有形のメディアで具現化される。典型的には、当業者により理解されるであろうが、参照薬剤、個体、集団、試料、配列または値は、目的の薬剤、個体、集団、試料、配列もしくは値を決定するかまたは特徴付けるために利用される条件に匹敵する条件下で決定されるかまたは特徴付けられる。

回帰分析：本明細書で使用される場合、「回帰分析」は、従属変数と１つまたは複数の独立変数との関係に焦点が当てられる場合に数種の変数をモデリングおよび分析するためのあらゆる技術を包含する。より具体的には、回帰分析は、独立変数のいずれか１つが変動して、他の独立変数が固定されたままの場合、どのように従属変数の典型的な値が変化するかを理解する助けになる。最も一般的には、回帰分析は、独立変数を考慮した従属変数の条件付き期待値、すなわち独立変数が固定されたままの場合の従属変数の平均値を推測する。あまり一般的ではないが、独立変数を考慮した従属変数の条件付き分布の分位数または他の位置パラメーターに焦点が当てられる。全てのケースにおいて、推測の標的は、回帰関数と呼ばれる独立変数の関数である。回帰分析において、回帰関数の周辺での従属変数の変動を特徴付けることも興味深く、これは、確率分布によって説明することができる。回帰分析は、その使用がどこで機械学習の分野と実質的なオーバーラップを有するかを予測および予報するために広く使用されている。回帰分析はまた、独立変数のなかでもどれが従属変数に関連するのかを理解すること、およびこれらの関係の形態を調査するのにも使用される。限定された環境において、回帰分析は、独立変数と従属変数との因果関係を推量するのに使用することができる。回帰分析を実行するための多数の技術が開発されてきた。線形回帰および通常の最小二乗回帰などのよく知られた方法は、回帰関数がデータから推測される有限数の未知のパラメーターに関して定義されるという点でパラメトリックである。ノンパラメトリック回帰は、関数の特定のセットに回帰関数を存在させる技術を指し、これは、無限次元であり得る。

リスク：文脈から理解されるであろうが、疾患、障害または状態の「リスク」は、特定の個体が、疾患、障害、もしくは状態と診断されるか、または疾患、障害、もしくは状態を発症する尤度の程度である。一部の実施形態において、リスクは、パーセンテージとして表現される。一部の実施形態において、リスクは、０、１、２、３、４、５、６、７、８、９、または１０から、１００％までである。一部の実施形態において、リスクは、参照試料または参照試料群と関連するリスクと比較したリスクとして表現される。一部の実施形態において、参照試料または参照試料群は、疾患、障害、または状態の公知のリスクを有する。一部の実施形態において、参照試料または参照試料群は、特定の個体と比較可能な個体に由来する。一部の実施形態において、相対的リスクは、０、１、２、３、４、５、６、７、８、９、１０種またはそれ超である。一部の実施形態において、相対的リスクは、相対的リスク（ＲＲ）またはオッズ比（ＯＲ）として表現することができる。

試料：本明細書で使用される場合、用語「試料」は、典型的には、本明細書で説明されるような目的のソースから得られたまたは誘導された生体試料を指す。一部の実施形態において、目的のソースは、動物またはヒトなどの生体を含む。一部の実施形態において、生体試料は、生体組織もしくは体液であるか、またはそれを含む。一部の実施形態において、生体試料は、骨髄；血液；血漿；血清；血液細胞；腹水；組織または細針生検試料；細胞を含有する体液；遊離の核酸；痰；唾液；尿；髄液、腹腔液；胸膜液；便；リンパ液；婦人科系の流体；皮膚スワブ；膣スワブ；口腔スワブ；鼻スワブ；洗浄物または洗浄液、例えば管洗浄液または気管支肺胞の洗浄液；吸引物；剥離物；骨髄検体；組織生検検体；手術検体；便、他の体液、分泌物、および／もしくは排泄物；ならびに／またはそれらからの細胞などであってもよいし、またはそれらを含んでいてもよい。一部の実施形態において、生体試料は、個体から得られた細胞であるかまたはそれを含む。一部の実施形態において、得られた細胞は、試料を得た個体からの細胞であるかまたはそれを包含する。一部の実施形態において、試料は、あらゆる適切な手段によって目的のソースから直接得られた「一次試料」である。例えば、一部の実施形態において、一次生体試料は、生検（例えば、細針吸引または組織生検）、手術、体液（例えば、血液、リンパ液、便など）の収集などからなる群から選択される方法により得られる。一部の実施形態において、文脈から明らかであろうが、用語「試料」は、（例えば、一次試料の１種もしくは複数の成分を除去することによって、および／または一次試料に１種もしくは複数の薬剤を添加することによって）一次試料を処理することにより得られる調製物を指す。例えば、半透膜を使用してろ過すること。このような「処理された試料」は、例えば、試料から抽出された核酸もしくはタンパク質、または一次試料をｍＲＮＡの増幅もしくは逆転写などの技術に供することや、ある特定の成分を単離および／もしくは精製すること等によって得られた核酸もしくはタンパク質を含んでいてもよい。

対象：「対象」は、哺乳動物（例えば、ヒト、一部の実施形態では出生前のヒトの形態を含む）を意味する。一部の実施形態において、対象は、関連する疾患、障害または状態に罹っている。一部の実施形態において、対象は、疾患、障害、または状態に罹りやすい。一部の実施形態において、対象は、疾患、障害または状態の１つまたは複数の症状または特徴を呈する。一部の実施形態において、対象は、疾患、障害、または状態のいかなる症状も特徴も呈していない。一部の実施形態において、対象は、疾患、障害、または状態に対する感受性またはそのリスクに特徴的な１つまたは複数のフィーチャを有する者である。対象は、患者であってもよく、患者は、疾患の診断または処置のための医療提供者の診察を受けるヒトを指す。一部の実施形態において、対象は、療法が投与される個体である。

実質的に：本明細書で使用される場合、用語「実質的に」は、目的の特徴または特性の程度または度合いが完全かまたは完全に近いことを表す定性的な条件を指す。生物学的分野における当業者は、生物学的および化学的な現象が、完了に至る、および／または完璧な状態まで進行する、または絶対的な結果を達成もしくは回避することは、あったとしてもほぼ皆無であることを理解するであろう。したがって、用語「実質的に」は、本明細書では、多くの生物学的および化学的な現象において固有の完璧な状態の起こり得る欠如を捉えるために使用される。

〜に罹っている：疾患、障害、または状態「に罹っている」個体は、疾患、障害、もしくは状態と診断されている、および／または疾患、障害、もしくは状態の１つもしくは複数の症状もしくは特徴を呈するもしくは呈している。

〜に罹りやすい：疾患、障害、または状態「に罹りやすい」個体は、疾患、障害、または状態を発症するリスクがある。一部の実施形態において、このような個体は、関連する疾患、障害、および／または状態を発症するリスクの増加に統計学的に相関する１つまたは複数の感受性因子を有することがわかっている。一部の実施形態において、疾患、障害、または状態に罹りやすい個体は、疾患、障害、または状態のいかなる症状も呈していない。一部の実施形態において、疾患、障害、または状態に罹りやすい個体は、疾患、障害、および／もしくは状態と診断されたことがないか、またはまだ診断されたことがない。一部の実施形態において、疾患、障害、または状態に罹りやすい個体は、疾患、障害、または状態の発症に関連する条件に曝露されたことがある個体である。一部の実施形態において、疾患、障害、および／または状態を発症するリスクは、集団ベースのリスクである（例えば、アレルギーに罹った個体の家族の一員など）。

テール濃縮およびテール効果：本明細書で使用される場合、用語「テール濃縮」または「テール効果」は、代謝産物レベルの分布曲線の遠位部分における特定の集団からの、比較的高い濃度の試料を有する代謝産物（または他の分析物）によって表される分類を強化する特性を指す。「上のテール」または「右テール」は、平均より大きい分布曲線の遠位部分を指す。「下のテール」または「左テール」は、平均より低い分布曲線の遠位部分を指す。一部の実施形態において、テールは、ランキングに基づく予め決定された閾値の値によって決定される。例えば、ある特定の代謝産物に関する試料の測定値が、その代謝産物に関する集団において８５から９５（例えば、９０）のパーセンタイルに対応する値より高い場合、またはその代謝産物に関する集団において１０から２０（例えば、１５）パーセンタイルに対応する値より低い場合、その試料は、テール内にあると称される。

治療剤：本明細書で使用される場合、成句「治療剤」は、対象に投与されると、治療効果を有する、ならびに／または所望の生物学的および／もしくは薬理効果を惹起するあらゆる薬剤を指す。一部の実施形態において、薬剤が投与される特定の対象が所望のまたは有益な治療結果を経験するかどうかにかかわらず、関連集団への薬剤の投与が、集団における所望のまたは有益な治療結果と統計学的に相関する場合、その薬剤は治療剤とみなされる。

訓練セット：本明細書で使用される場合、「訓練セット」は、可能性がある予測的関係を発見するための、情報科学の様々な分野で使用されるデータのセットである。訓練セットは、人工知能、機械学習、遺伝的プログラミング、知能システム、および統計で使用される。これらの分野の全てにおいて、訓練セットは、ほとんど同じ役割を有し、試験セットと共に使用されることが多い。

試験セット：本明細書で使用される場合、「試験セット」は、予測的関係の強度および有用性を査定するための、情報科学の様々な分野で使用されるデータのセットである。試験セットは、人工知能、機械学習、遺伝的プログラミング、知能システム、および統計で使用される。これらの分野の全てにおいて、試験セットは、ほとんど同じ役割を有する。

処置：本明細書で使用される場合、用語「処置」（また「処置する」または「処置すること」）は、特定の疾患、障害、および／もしくは状態を、部分的もしくは完全に、軽減する、改善する、緩和する、抑制する、その発病を遅延させる、その重症度を低下させる、ならびに／または特定の疾患、障害、および／もしくは状態の１つもしくは複数の症状、フィーチャ、および／もしくは原因の頻度、発生率もしくは重症度を低下させる物質または療法（例えば、行動療法）のあらゆる投与を指す。このような処置は、関連する疾患、障害および／もしくは状態の徴候を表さない対象の処置であってもよいし、ならびに／または疾患、障害、および／もしくは状態の初期徴候のみを表す対象の処置であってもよい。代替として、または加えて、このような処置は、関連する疾患、障害および／または状態の１つまたは複数の確立された徴候を表す対象の処置であってもよい。一部の実施形態において、処置は、関連する疾患、障害、および／または状態に罹っていると診断された対象の処置であってもよい。一部の実施形態において、処置は、関連する疾患、障害、および／または状態の発症リスクの増加と統計学的に相関する１つまたは複数の感受性因子を有することがわかっている対象の処置であってもよい。

詳細な説明
本発明は、試料、例えば血液試料または血漿試料中の代謝産物レベルの特異的な分析に基づいて対象における自閉症スペクトラム障害（ＡＳＤ）のリスクを決定するための方法およびシステムを提供する。以下の章で、本発明の様々な態様を詳細に説明する。章および見出しの使用は、本発明の限定を意味しない。各章は、本発明のあらゆる態様に当てはまり得る。本出願において、「または」の使用は、そうではないことが明らかでない限り、「および／または」を意味する。

自閉症スペクトラム障害
自閉症スペクトラム障害（ＡＳＤ）の臨床診断のための基準は、Diagnostics and Statistical Manual of Mental Disorders、バージョン５（ＤＳＭ−Ｖ、２０１３年５月公開）に記載されている。

ＡＳＤはさらに、例えば、ＤＳＭ−ＩＶ−ＴＲにより、自閉性障害、アスペルガー障害、レット障害、小児期崩壊性障害、および特定不能の広汎性発達障害（非定型自閉症など）を含むと特徴付けられている。

一部の実施形態において、ＡＳＤは、（ｉ）ＡＤＯＳにおけるコミュニケーションおよび社会的相互作用の総計に対する自閉症のカットオフを満たすスコア、ならびにＡＤＩ−Ｒにおける≦３６ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア；ならびに／または（ｉｉ）ＡＤＯＳにおけるコミュニケーションおよび社会的相互作用の総計に対するＡＳＤカットオフを満たすスコア、ならびにＡＤＩ−Ｒにおける≦３６ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア、ならびに（ｉｉ）（ａ）ＡＤＩ−Ｒにおける社会的相互作用およびコミュニケーションに関するカットオフ値を満たすスコア、または（ｉｉ）（ｂ）社会的相互作用もしくはコミュニケーションに関するカットオフ値を満たすスコア、およびＡＤＩ−Ｒにおける社会的相互作用もしくはコミュニケーションに対するカットオフ値の２ポイント（どちらもカットオフ値を満たしていない）以内であること、または（ｉｉ）（ｃ）スコアは、ＡＤＩ−Ｒにおける社会的相互作用およびコミュニケーションに関するカットオフ値の１ポイント以内であることによって特徴付けられる。

発達遅延
発達遅延は、小児発達の１つまたは複数のプロセス、例えば、ＡＳＤに起因しない、身体的発達、認知発達、コミュニケーションの発達、社会性もしくは情緒の発達、または適応性の発達などにおける重度または軽度の遅延である。一部の実施形態において、ＤＤは、非自閉症（ＡＵ）および非ＡＳＤであり、（ｉ）ミューレンスケールでは６９もしくはそれより低いスコア、ヴァインランドスケールでは６９もしくはそれより低いスコア、およびＳＣＱでは１４もしくはそれより低いスコア、または（ｉｉ）ミューレンもしくはヴァインランドのいずれかでは６９もしくはそれより低いスコア、および他の査定ではカットオフ値の標準偏差の半分以内（７７またはそれより低いスコア）を有することを特徴とする。ＡＳＤを有する個体が発達的に遅延しているとみなされる可能性があるとしても、ＡＳＤおよびＤＤの分類が相互排他的になるように、本明細書で使用されるＡＳＤの分類はＤＤの分類に勝るとみなされることになる。

ＡＳＤのリスク査定
言語、行動、または社会的な発達に障害のある症状を示す子供は、最も一般的には初期治療の環境でしばしば臨床医の診察を受けるが、臨床医は、その子供が、ＡＳＤ、または何らかの他の状態、障害、もしくは分類（例えば、ＤＤ）を有するかどうかを決定することができない。特に大々的な言語発達前の年齢の子供を診断することは困難であり、多くの初期治療の医師は、自分の患者を示差的に診断する能力も力量も有していない。例えば、ＡＳＤは、他の発達障害、状態、または分類、例えばＤＤと容易に区別されない可能性がある。

対象におけるＡＳＤのリスク（非ＡＳＤおよびＤＤの確率など）を査定して、ＡＳＤをＤＤと識別することが有用である。ＡＳＤのリスク査定は、早期の介入および処置の機会をもたらす。例えば、専門外の医師が、専門家への照会を提案するためにＡＳＤリスク査定を使用することが可能である。専門家は、患者のさらなる評価に優先順位をつけるために、ＡＳＤリスク査定を使用することが可能である。ＡＳＤリスクの査定はまた、最終的な診断の前に暫定的な診断を確立するのに使用される場合もあり、その期間中に、高いリスクの子供とその子供の家族に促進的なサービスを提供することができる。

対象におけるＡＳＤのリスクを決定するための方法が本明細書で説明される。一部の実施形態において、ＡＳＤリスクの決定は、対象が、約５０％より多くのＡＳＤを有する可能性を有することを決定することを包含する。一部の実施形態において、ＡＳＤリスクの決定は、対象が、約６０％、６５％、７０％、７４％、８０％、８５％、９０％、９５％、または９８％より多くのＡＳＤを有する可能性を有することを決定することを包含する。一部の実施形態において、ＡＳＤリスクの決定は、対象がＡＳＤを有することを決定することを包含する。一部の実施形態において、ＡＳＤリスクの決定は、対象がＡＳＤを有さない（すなわち、非ＡＳＤである）ことを決定することを包含する。

一部の実施形態において、本発明は、対象においてＡＳＤを非ＡＳＤ分類（例えば、ＤＤ）と識別するための方法を提供する。一部の実施形態において、ＡＳＤを非ＡＳＤ分類／状態と識別することは、対象が、非ＡＳＤ分類ではなく、約６０％、６５％、７０％、７４％、８０％、８５％、９０％、９５％、または９８％より多くのＡＳＤを有する可能性（すなわち、ＡＳＤを有し非ＡＳＤ分類を有さない可能性）を有することを決定することを包含する。一部の実施形態において、非ＡＳＤ分類は、ＤＤである。一部の実施形態において、非ＡＳＤ分類は、「正常」である。

一部の実施形態において、本発明は、対象がＡＳＤもＤＤも有さないことを決定するための方法を提供する。

分析方法
ＡＳＤリスクを査定するか、またはＡＳＤを他の非ＡＳＤ発達障害と識別するための方法が本明細書で説明される。一部の実施形態において、リスク査定は、対象からの試料、例えば血液試料中の代謝産物の測定および特徴付けに（少なくとも部分的に）基づく。一部の実施形態において、血漿試料を血液試料から得て、血漿試料を分析する。

代謝産物は、クロマトグラフィーおよび／または質量分析、蛍光測定法、電気泳動、免疫親和性、ハイブリダイゼーション、免疫化学、紫外線分光法（ＵＶ）、蛍光分析、放射化学分析、近赤外分光法（近ＩＲ）、核磁気共鳴分光法（ＮＭＲ）、光散乱分析（ＬＳ）、および比濁分析に基づくアッセイなどの様々な方法で検出することができる。

一部の実施形態において、代謝産物は、単独の、または質量分析と組み合わされた、液体もしくはガスクロマトグラフィーまたはイオン移動度（電気泳動）によって、または質量分析単独によって分析される。このような方法は、細胞の代謝産物などの生体分子を同定および定量化するのに使用されている。（例えば、Liら、２０００年；Rowleyら、２０００年；およびKusterおよびMann、１９９８年を参照）。質量分析方法は、例えば、単独、二重または三重の質量対電荷スキャニングおよび／またはフィルタリング（ＭＳ、ＭＳ／ＭＳ、またはＭＳ^３）を用いた、四重極、イオントラップ、または飛行時間型質量分析に基づき得、それに先行して、適切なイオン化方法、例えばエレクトロスプレーイオン化、大気圧化学イオン化、大気圧光イオン化、マトリックス支援レーザー脱離イオン化（ＭＡＬＤＩ）、または表面増強レーザー脱離イオン化（ＳＥＬＤＩ）が行われてもよい。（例えば、国際特許出願公報ＷＯ２００４０５６４５６号およびＷＯ２００４０８８３０９号を参照）。一部の実施形態において、生体試料からの代謝産物の第１の選別は、ガスもしくは液体クロマトグラフィーまたはイオン移動度／電気泳動を使用することによって達成することができる。一部の実施形態において、質量分析手順のためのイオン化は、エレクトロスプレーイオン化、大気圧化学イオン化、または大気圧光イオン化によって達成することができる。一部の実施形態において、質量分析機器としては、四重極、イオントラップ、または飛行時間型、またはフーリエ変換の機器が挙げられる。

一部の実施形態において、代謝産物は、生物系の小分子補体の同定および相対的定量化に最適化された、非標的化超高速液体もしくはガスクロマトグラフィー／エレクトロスプレーまたは大気圧化学イオン化タンデム質量分析のプラットフォームを介して、質量スケールで分析される。（例えば、Evansら、Anal. Chem.、２００９年、８１巻、６６５６〜６６６７頁を参照）。

一部の実施形態において、生体試料からの代謝産物の第１の選別は、ガスもしくは液体クロマトグラフィーまたはイオン移動度／電気泳動を使用することによって達成できる。一部の実施形態において、質量分析手順のためのイオン化は、エレクトロスプレーイオン化、大気圧化学イオン化、または大気圧光イオン化によって達成することができる。一部の実施形態において、質量分析機器としては、四重極、イオントラップ、または飛行時間型、またはフーリエ変換の機器が挙げられる。

一部の実施形態において、目的の代謝産物を含有する血液試料を遠心分離して、他の血液成分から血漿を分離する。ある特定の実施形態において、内部標準は不必要である。一部の実施形態において、血漿（その一部）に、規定量の内部標準を添加し、次いでメタノールを添加して、タンパク質などの血漿成分を沈殿させる。沈殿物を、遠心分離によって上清から分離し、上清を回収する。より正確な検出のために目的の代謝産物の濃度を増加させたい場合、上清を蒸発させて、残留物を適切な量の溶媒に溶解させる。目的の代謝産物の濃度が不必要に高い場合、上清を適切な溶媒で希釈する。適切な量の代謝産物含有試料を、移動相Ａおよび移動相Ｂの適切な混合物で平衡化した液体クロマトグラフィーカラムにローディングする。逆相液体クロマトグラフィーの場合、移動相Ａは、典型的には、ギ酸などの少量の添加剤を含むまたは含まない水であり、移動相Ｂは、典型的には、メタノールまたはアセトニトリルである。適切な勾配の移動相Ａおよび移動相Ｂを、カラムにポンプ注入して、保持時間、またはカラムからの溶出時間によって目的の代謝産物の分離を達成する。カラムから代謝産物が溶出すると、それらはイオン化され、気相に運ばれ、イオンが検出されて、質量分析によって定量化される。検出の特異性は、特異的な前駆イオンおよび前駆イオンから生成した特異的な生成物イオンに対して二重のフィルタリングを行うことによって達成される。目的の代謝産物から誘導されたイオンカウントを、所与の代謝産物に関して公知の量の内部標準から誘導されたイオンカウントに標準化すること、ならびに標準化したイオンカウントを、公知の量の純粋な代謝産物および内部標準を用いて確立された検量線と比較することによって、絶対定量を達成することができる。内部標準は、典型的には、純粋な代謝産物の安定同位体で標識された形態、または代謝産物の構造類似体の純粋な形態である。代わりに、任意単位の所与の代謝産物の相対的定量化は、選択された内部基準値（例えば、所与の群から発生した全試料における代謝産物レベルの中央値）に標準化することによって計算される場合がある。

一部の実施形態において、１つまたは複数の代謝産物は、イムノアッセイによって測定される。多数の特異的イムノアッセイ様式およびそれらのバリエーションを代謝産物の測定に利用することができる。（例えば、E. Maggio、Enzyme-Immunoassay、（１９８０年）（CRC Press, Inc.、Boca Raton、Fla.）を参照されたい；米国特許第４，７２７，０２２号「Methods forModulating Ligand-Receptor Interactions and their Application」；米国特許第４，６５９，６７８号「Immunoassay of Antigens」；米国特許第４，３７６，１１０号「ImmunometricAssays Using Monoclonal Antibodies」；米国特許第４，２７５，１４９号「MacromolecularEnvironment Control in Specific Receptor Assays」；米国特許第４，２３３，４０２号「Reagents and Method Employing Channeling」、および米国特許第４，２３０，７６７号「Heterogenous Specific Binding Assay Employing a Coenzyme as Label」も参照されたい）。抗体は、不動的な結合などの公知の技術に従って、診断アッセイに好適な固体支持体（例えば、プロテインＡまたはプロテインＧアガロースなどのビーズ、ラテックスまたはポリスチレンなどの材料で形成された、マイクロスフェア、プレート、スライド、またはウェル）にコンジュゲートされていてもよい。本明細書で説明される抗体は同様に、公知の技術に従って、放射標識（例えば、^３５Ｓ、^１２５Ｉ、^１３１Ｉ）、酵素標識（例えば、ホースラディッシュペルオキシダーゼ、アルカリホスファターゼ）、および蛍光標識（例えば、フルオレセイン、Ａｌｅｘａ、緑色蛍光タンパク質）などの検出可能な標識または基にコンジュゲートされていてもよい。

ＡＳＤリスクの決定
一部の実施形態において、本発明の方法は、現時点ではＡＳＤおよび／または他の発達障害の徴候も症状も表していない可能性があるが、それにもかかわらずＡＳＤおよび／または他の発達障害を有するかまたは発症するリスクを有する可能性がある対象から得られた試料中の代謝産物レベルを測定することに少なくとも部分的に基づいて、当業者が対象を同定する、診断する、または別の方法で査定することを可能にする。

ある特定の実施形態において、代謝産物または他の分析物のレベル（例えば、プロテオームまたはゲノム情報）を試験試料中で測定し、正常な対照レベル、またはＡＳＤではない発達障害、状態、もしくは分類（例えば、非ＡＳＤ発達遅延、ＤＤ）を有する対象におけるレベルと比較することができる。一部の実施形態において、用語「正常な対照レベル」は、典型的にはＡＳＤに罹っていないかまたはＡＳＤもしくは他の発達障害を有する可能性が低い対象で見出される、１つまたは複数の代謝産物、もしくは他の分析物のレベル、または指標を指す。一部の実施形態において、正常な対照レベルは、範囲または指標である。一部の実施形態において、正常な対照レベルは、前もって試験された対象のデータベースから決定される。正常な対照レベルと比較して、１つまたは複数の代謝産物、または他の分析物のレベルに差があることは、対象がＡＳＤを有するかまたはＡＳＤを発症するリスクがあることを示す可能性がある。逆に言えば、１つまたは複数の代謝産物、または他の分析物の正常な対照レベルと比較して、１つまたは複数の代謝産物のレベルに差がないことは、対象がＡＳＤを有さないか、またはＡＳＤを発症するリスクが低いことを示す可能性がある。

一部の実施形態において、参照値は、診断がわかっている（すなわち、ＡＳＤに罹っていると診断もしくは同定されているか、またはＡＳＤに罹っていると診断もしくは同定されていない）対照対象または集団から得られた値である。一部の実施形態において、参照値は、指標値またはベースライン値であり、例えば、本明細書で説明される「正常な対照レベル」である。一部の実施形態において、参照試料または指標値またはベースライン値は、ＡＳＤの処置を受けている１人もしくは複数の対象から採取もしくは誘導されるか、またはＡＳＤを発症するリスクが低い１人もしくは複数の対象から採取もしくは誘導されてもよいし、または処置を受けた結果としてＡＳＤリスク因子における改善を示した対象から採取もしくは誘導されてもよい。一部の実施形態において、参照試料または指標値またはベースライン値は、ＡＳＤの処置を受けていない１人または複数の対象から採取または誘導される。一部の実施形態において、試料は、ＡＳＤの最初の処置および／または処置の進行をモニターするためのそれに続くＡＳＤの処置を受けた対象から収集される。一部の実施形態において、参照値は、ＡＳＤの集団研究からのリスク予測アルゴリズムまたはコンピューターで計算した指標から誘導されたものである。一部の実施形態において、参照値は、ＡＳＤ以外の疾患または障害、例えば別の発達障害、例えば、非ＡＳＤ発達遅延（ＤＤ）を有する対象または集団からのものである。

一部の実施形態において、本発明の方法によって測定された代謝産物のレベルにおける差は、正常な対照レベル、参照値、指標値、またはベースライン値と比較した代謝産物のレベルの増加または減少を含む。一部の実施形態において、正常な対照集団、一般集団、または別の疾患を有する集団からの参照値に対する代謝産物のレベルの増加または減少は、ＡＳＤの存在、ＡＳＤの進行、ＡＳＤの悪化またはＡＳＤもしくはＡＳＤの症状の改善の指標である。一部の実施形態において、正常な対照集団、一般集団、または別の疾患を有する集団からの参照値に対する代謝産物のレベルの増加または減少は、ＡＳＤまたはそれに関連する合併症を発症するリスクの増加または減少の指標である。増加または減少は、ＡＳＤのための１つもしくは複数の処置レジメンの成功の指標である可能性があり、またはＡＳＤリスク因子の改善もしくは後退を示す可能性もある。増加または減少は、例えば、参照値の少なくとも５％、少なくとも１０％、少なくとも１５％、少なくとも２０％、少なくとも２５％、少なくとも３０％、少なくとも３５％、少なくとも４０％、少なくとも４５％、または少なくとも５０％であり得る。

一部の実施形態において、本明細書で説明される代謝産物のレベルにおける差は、統計学的に有意な差である。「統計学的に有意な」は、単独で偶然起こると予想される差より大きい差を指す。統計学的有意性は、当業界において公知のあらゆる方法によって決定することができる。例えば、統計学的有意性は、ｐ値によって決定することができる。ｐ値は、実験中の群間差が偶然起こる確率の尺度である。例えば、０．０１のｐ値は、偶然起こった結果が１００回に１回であることを意味する。ｐ値が小さいほど、群間で測定された差が偶然ではない可能性がより高くなる。ｐ値が０．０５またはそれ未満である場合、差は統計学的に有意であるとみなされる。一部の実施形態において、統計学的に有意なｐ値は、０．０４、０．０３、０．０２、０．０１、０．００５、もしくは０．００１またはそれ未満である。一部の実施形態において、統計学的に有意なｐ値は、０．３０、０．２５、０．２０、０．１５、もしくは０．１０またはそれ未満である（例えば、単一の特定の代謝産物が、他の代謝産物を包含する分類器に使用される場合に付加的な予測値を有するかどうかを同定するケースにおいて）。一部の実施形態において、ｐ値は、ｔ検定によって決定される。一部の実施形態において、ｐ値は、フィッシャーの検定により得られる。一部の実施形態において、統計学的有意性は、パネル中の数種の代謝産物の組合せの分析によって達成され、数学的なアルゴリズムと組み合わせて、統計学的に有意なリスク予測が達成される。

分類試験、アッセイ、または方法は、真陽性率（感度）に対して偽陽性率（１−特異度）をプロットした関連するＲＯＣ曲線（受信者動作特性曲線）を有する。ＲＯＣ曲線下の面積（ＡＵＣ）は、分類器が２つの診断群をどの程度うまく区別することができるかの尺度である。最大のＡＵＣは、１．０（パーフェクトな試験）であり、最小の面積は、０．５（例えば正常と疾患とで差がない面積）である。ＡＵＣが１に近づくにつれて、試験の精度が増加することが認められる。

一部の実施形態において、高度なリスク予測の精度は、ＡＵＣが少なくとも０．６０である試験またはアッセイである。一部の実施形態において、高度なリスク予測の精度は、ＡＵＣが少なくとも０．６５、少なくとも０．７０、少なくとも０．７５、少なくとも０．８０、少なくとも０．８５、少なくとも０．９０、または少なくとも０．９５である試験またはアッセイである。

テール効果の査定によるＡＳＤリスクの予測
一部の実施形態において、代謝産物レベルの平均差は、集団内もしくは集団間、例えばＡＳＤ集団とＤＤ集団との間で、または正常な対照集団と比較して査定される。一部の実施形態において、所与の集団（すなわち、ＡＳＤ）の試料からの代謝産物が、分布曲線のテールにおける濃縮に関して査定される。すなわちこれは、第２の集団（例えば、ＤＤ）と比較して指定された集団（例えば、ＡＳＤ）からの試料のより大きい比率が分布曲線のテールに存在するかどうか（すなわち、「テール効果」）を決定することである。一部の実施形態において、平均差とテール効果の両方が同定され、利用される。一部の実施形態において、テールは、予め決定された閾値の値によって決定される。例えば、ある特定の代謝産物に関する試料の測定値が、その代謝産物に関する集団において９０パーセンタイルに対応する値より高い場合（右テールまたは上のテール）、または１５パーセンタイルに対応する値より低い場合（左テールまたは下のテール）、その試料は、テール内にあると称される。一部の実施形態において、所与の代謝産物に関する右（上の）テールの閾値は、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、または９９パーセンタイルに対応する値である（例えば、この場合、所与の代謝産物に関する試料の測定値が、このパーセンタイルに関連する値より高い場合、試料は、右テール内にあると称される）。一部の実施形態において、所与の代謝産物に関する左（下の）テールの閾値は、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、または１パーセンタイルに対応する値である（例えば、この場合、所与の代謝産物に関する試料の測定値が、このパーセンタイルに関連する値よりも低い場合、試料は、左テール内にあると称される）。示されるパーセンタイル値は、小数値を含む。

一部の実施形態において、分布曲線は、１つまたは複数の集団の代謝産物レベルのプロットから生成される。一部の実施形態において、分布曲線は、単一の参照集団、例えば一般集団から生成される。一部の実施形態において、分布曲線は、２つの集団、例えば、ＡＳＤ集団およびＤＤなどの非ＡＳＤ集団から作成される。一部の実施形態において、分布曲線は、３つまたはそれより多くの集団、例えば、ＡＳＤ集団、非ＡＳＤであるがＤＤなどの別の発達障害／状態／分類を有する集団、および健康な（例えば、発達障害がない）対照集団から作成される。集団のそれぞれからの代謝産物の分布曲線は、１つより多くのリスク査定（例えばＡＳＤを診断すること、ＤＤを診断すること、ＡＳＤとＤＤとを識別すること）を行うのに利用することができる。本明細書で説明されるテール効果を利用する査定のための方法は、２つより多くの集団に適用され得る。

一部の実施形態において、複数の代謝産物およびそれらの分布は、リスク査定に使用される。一部の実施形態において、２種またはそれより多くの代謝産物のレベルは、ＡＳＤリスクを予測するのに利用される。一部の実施形態において、代謝産物の少なくとも２つは、表１で列挙した代謝産物から選択される。一部の実施形態において、代謝産物の少なくとも３つは、表１で列挙した代謝産物から選択される。一部の実施形態において、表１で列挙した代謝産物から選択される４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、または２１種の代謝産物は、ＡＳＤリスクを予測するのに使用される。

表１（表１Ａから１Ｃ）のさらなる議論は、以下の実施例の章に示す。

一部の実施形態において、分析のための少なくとも２種の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、ｐ−クレゾールスルフェート、イソバレリルグリシン、ガンマ−ＣＥＨＣ、インドールアセテート、ピペコレート、１，５−アンヒドログルシトール（１，５−ＡＧ）、ラクテート、３−（３−ヒドロキシフェニル）プロピオネート、３−インドキシルスルフェート、パントテネート（ビタミンＢ５）、ヒドロキシ−クロロタロニル、およびそれらの組合せからなる群から選択される。

一部の実施形態において、分析のための少なくとも３種の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、ｐ−クレゾールスルフェート、イソバレリルグリシン、ガンマ−ＣＥＨＣ、インドールアセテート、ピペコレート、１，５−アンヒドログルシトール（１，５−ＡＧ）、ラクテート、３−（３−ヒドロキシフェニル）プロピオネート、３−インドキシルスルフェート、パントテネート（ビタミンＢ５）、ヒドロキシ−クロロタロニル、およびそれらの組合せからなる群から選択される。

一部の実施形態において、代謝産物の特定のセットに関するテール効果の欠如についての情報がリスク査定に使用される。一部の実施形態において、テール効果の欠如は、ゼロの結果（すなわち、陰性情報とは対照的に、情報がないこと）を提供するために決定される。一部の実施形態において、テール効果の欠如は、他方の分類に対して一方の分類の指標であると決定される（例えば、ＡＳＤに対してよりＤＤの指標である）。

一部の実施形態において、分布曲線は、非対称または非ガウス性である。一部の実施形態において、分布曲線は、パラメトリックな分布パターンに従っていない。

一部の実施形態において、平均差からの情報（例えば、平均シフト）は、リスク査定のためのテール効果の情報と組み合わされる。一部の実施形態において、平均差からの情報は、テール効果の情報を使用せずにリスク査定のために使用される。

一部の実施形態において、代謝産物の分析は、ＡＳＤまたは他の障害に関する対象のリスクを決定するために、他のタイプの情報、例えば、遺伝情報、人口統計情報、および／または行動の査定と組み合わされる。

一部の実施形態において、ＡＳＤリスク査定は、対象から得られた生体試料（例えば、血液、血漿、尿、唾液、便）中のある特定の代謝産物の測定された量に少なくとも部分的に基づいて行われ、その場合、ある特定の代謝産物は、「テール効果」を表すことがここで見出されている。テール効果と関連する２つの集団間の統計学的に有意な平均シフトが必ずしもあるわけではないことが本発明者らによって見出されている。したがって、テール効果は、平均シフトとは異なる特殊な現象である。

ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、非ＡＳＤ集団（例えば、ＤＤ集団）に対してＡＳＤの指標である右テール効果を表す：
・非ＡＳＤ集団分布曲線が、非ＡＳＤ集団（例えば、ＤＤ集団）における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；
・ＡＳＤ集団分布曲線が、ＡＳＤ集団における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；ならびに
・非ＡＳＤ集団分布曲線およびＡＳＤ集団分布曲線が、（Ａ）および（Ｂ）の一方または両方が維持されることを特徴とする：
○（Ａ）（ｉ）ｘが代謝産物のレベルｎより大きい場合のＡＳＤ集団分布曲線下の面積の（ｉｉ）ｘが代謝産物のレベルｎより大きい場合の非ＡＳＤ集団分布曲線下の面積に対する比率が、１５０％より大きく（例えば、＞２００％、＞３００％、＞５００％、＞１０００％など）、それによって代謝産物のレベルｎより大きい試料についてＡＳＤ分類と非ＡＳＤ分類とを識別するための予測の有用性がもたらされること、および
○（Ｂ）ｎ’が、分布曲線を作成するのに使用される組み合わされた非ＡＳＤおよびＡＳＤ集団の上位の十分位数（または約５％から約２０％までのあらゆるカットオフ）に対応する最小の閾値の代謝産物レベルである場合、未知の試料（例えば、等しい数のＡＳＤおよび非ＡＳＤメンバーを有する集団から選択されるランダムな試料）が、少なくともｎ’の代謝産物レベルを有し、ＡＳＤ対非ＡＳＤである試料のオッズが、１．６：１以上であり（例えば、２：１以上、３：１以上、４：１以上、５：１以上、６：１以上、７：１以上、８：１以上、９：１以上、または１０：１以上）（例えば、ｐ＜０．３、ｐ＜０．２、ｐ＜０．１、ｐ＜０．０５、ｐ＜０．０３、またはｐ＜０．０１の場合、例えば、統計学的に有意な分類である）、それによって代謝産物のレベルｎ’より大きい試料についてＡＳＤ分類と非ＡＳＤ分類とを識別するための予測の有用性がもたらされること。

ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、非ＡＳＤ集団（例えば、ＤＤ集団）に対してＡＳＤの指標である左テール効果を表す：
・非ＡＳＤ集団分布曲線が、非ＡＳＤ集団（例えば、ＤＤ集団）における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；
・ＡＳＤ集団分布曲線が、ＡＳＤ集団における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；ならびに
・非ＡＳＤ集団分布曲線およびＡＳＤ集団分布曲線が、（Ａ）および（Ｂ）の一方または両方が維持されることを特徴とする：
○（Ａ）（ｉ）ｘが代謝産物のレベルｍより小さい場合のＡＳＤ集団分布曲線下の面積の（ｉｉ）ｘが代謝産物のレベルｍより小さい場合の非ＡＳＤ集団分布曲線下の面積に対する比率が、１５０％より大きく（例えば、＞２００％、＞３００％、＞５００％、＞１０００％など）、それによって代謝産物のレベルｍより小さい試料についてＡＳＤ分類と非ＡＳＤ分類とを識別するための予測の有用性がもたらされること、および
○（Ｂ）ｍ’が、分布曲線を作成するのに使用される組み合わされた非ＡＳＤおよびＡＳＤ集団の下位の十分位数（または約５％から約２０％までのあらゆるカットオフ）に対応する最大の閾値の代謝産物レベルである場合、未知の試料（例えば、等しい数のＡＳＤおよび非ＡＳＤメンバーを有する集団から選択されるランダムな試料）が、ｍ’未満の代謝産物レベルを有し、ＡＳＤ対非ＡＳＤである試料のオッズが、１．６：１以上であり（例えば、２：１以上、３：１以上、４：１以上、５：１以上、６：１以上、７：１以上、８：１以上、９：１以上、または１０：１以上）（例えば、ｐ＜０．３、ｐ＜０．２、ｐ＜０．１、ｐ＜０．０５、ｐ＜０．０３、またはｐ＜０．０１の場合、例えば、統計学的に有意な分類である）、それによって代謝産物のレベルｍ’より小さい試料についてＡＳＤ分類と非ＡＳＤ分類とを識別するための予測の有用性がもたらされること。

ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、ＡＳＤ集団に対して非ＡＳＤ（例えば、ＤＤ）の指標である右テール効果を表す：
・非ＡＳＤ集団分布曲線が、非ＡＳＤ集団（例えば、ＤＤ集団）における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；
・ＡＳＤ集団分布曲線が、ＡＳＤ集団における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；ならびに
・非ＡＳＤ集団分布曲線およびＡＳＤ集団分布曲線が、（Ａ）および（Ｂ）の一方または両方が維持されることを特徴とする：
○（Ａ）（ｉ）ｘが代謝産物のレベルｎより大きい場合の非ＡＳＤ集団分布曲線下の面積の（ｉｉ）ｘが代謝産物のレベルｎより大きい場合のＡＳＤ集団分布曲線下の面積に対する比率が、１５０％より大きく（例えば、＞２００％、＞３００％、＞５００％、＞１０００％など）、それによって代謝産物のレベルｎより大きい試料について非ＡＳＤ分類とＡＳＤ分類とを識別するための予測の有用性がもたらされること、および
○（Ｂ）ｎ’が、分布曲線を作成するのに使用される組み合わされた非ＡＳＤおよびＡＳＤ集団の上位の十分位数（または約５％から約２０％までのあらゆるカットオフ）に対応する最小の閾値の代謝産物レベルである場合、未知の試料（例えば、等しい数のＡＳＤおよび非ＡＳＤメンバーを有する集団から選択されるランダムな試料）が、ｎ’より大きい代謝産物レベルを有し、非ＡＳＤ対ＡＳＤである試料のオッズが、１．６：１以上であり（例えば、２：１以上、３：１以上、４：１以上、５：１以上、６：１以上、７：１以上、８：１以上、９：１以上、または１０：１以上）（例えば、ｐ＜０．３、ｐ＜０．２、ｐ＜０．１、ｐ＜０．０５、ｐ＜０．０３、またはｐ＜０．０１の場合、例えば、統計学的に有意な分類である）、それによって代謝産物のレベルｎ’より大きい試料について非ＡＳＤ分類とＡＳＤ分類とを識別するための予測の有用性がもたらされること。

ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、ＡＳＤ集団に対して非ＡＳＤ（例えば、ＤＤ）の指標である左テール効果を表す：
・非ＡＳＤ集団分布曲線が、非ＡＳＤ集団（例えば、ＤＤ集団）における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；
・ＡＳＤ集団分布曲線が、ＡＳＤ集団における代謝産物について確立され、ｘ軸は第１の代謝産物のレベルを示し、ｙ軸は対応する集団を示す；ならびに
・非ＡＳＤ集団分布曲線およびＡＳＤ集団分布曲線が、（Ａ）および（Ｂ）の一方または両方が維持されることを特徴とする：
○（Ａ）（ｉ）ｘが代謝産物のレベルｍより小さい場合の非ＡＳＤ集団分布曲線下の面積の（ｉｉ）ｘが代謝産物のレベルｍより小さい場合のＡＳＤ集団分布曲線下の面積に対する比率が、１５０％より大きく（例えば、＞２００％、＞３００％、＞５００％、＞１０００％など）、それによって代謝産物のレベルｍより小さい試料について非ＡＳＤ分類とＡＳＤ分類とを識別するための予測の有用性がもたらされること、および
○（Ｂ）ｍ’が、分布曲線を作成するのに使用される組み合わされた非ＡＳＤおよびＡＳＤ集団の下位の十分位数（または約５％から約２０％までのあらゆるカットオフ）に対応する最大の閾値の代謝産物レベルである場合、未知の試料（例えば、等しい数のＡＳＤおよび非ＡＳＤメンバーを有する集団から選択されるランダムな試料）が、ｍ’未満の代謝産物レベルを有し、非ＡＳＤ対ＡＳＤである試料のオッズが、１．６：１以上であり（例えば、２：１以上、３：１以上、４：１以上、５：１以上、６：１以上、７：１以上、８：１以上、９：１以上、または１０：１以上）（例えば、ｐ＜０．３、ｐ＜０．２、ｐ＜０．１、ｐ＜０．０５、ｐ＜０．０３、またはｐ＜０．０１の場合、例えば、統計学的に有意な分類である）、それによって代謝産物のレベルｍ’より小さい試料について非ＡＳＤ分類とＡＳＤ分類とを識別するための予測の有用性がもたらされること。

ある特定の実施形態において、リスク査定は、テール効果を表す複数の代謝産物を使用して行われる。ＡＳＤの査定のために、相補的な診断／リスク査定情報を提供する代謝産物（例えば、２種またはそれより多くの代謝産物）の特定の群が存在することが観察されている。例えば、第１の代謝産物のレベルの分析によって同定可能なＡＳＤ陽性個体（例えば、第１の代謝産物の同定されたテール内の個体）は、第２の代謝産物の分析によって同定可能な同じＡＳＤ陽性個体ではない（または低いがゼロではない程度のオーバーラップが存在する可能性がある）。第１の代謝産物のテールは、ある特定のＡＳＤ個体を予測するが、第２の代謝産物のテールは、他のＡＳＤ個体を予測する。特定の理論に縛られることは望まないが、この発見は、ＡＳＤそれ自身の多面的な性質を反映している可能性がある。

したがって、ある特定の実施形態において、リスク査定方法は、対象が複数の代謝産物を含む多数の同定された代謝産物テールのいずれかに当てはまるかどうかを同定するステップ、例えば、異なる代謝産物テールの予測変数が少なくとも部分的に排反する場合、例えば、複数の代謝産物が低い相互情報量で取り入れられることによってリスク予測が改善されるように、それらが低い相互情報量を有する場合を同定するステップを包含する。

一部の実施形態において、本発明は、ＡＳＤを有するかまたはＡＳＤを有するリスクがある対象を決定／診断する方法で使用するための、１つまたは複数の結合メンバーを提供し、各結合メンバーは、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される代謝産物に特異的に結合することが可能である。

一部の実施形態において、本発明は、ＡＳＤを有するかまたはＡＳＤを有するリスクがある対象を診断／決定するための結合メンバーの１つまたは複数の使用であって、前記結合メンバーが、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される代謝産物に特異的に結合することが可能である、使用を提供する。

結合メンバーは、核酸分子、タンパク質、ペプチド、抗体またはそれらの断片からなる群から選択されてもよく、これらは全て、特異的な代謝産物に結合することが可能である。ある特定の実施形態において、結合メンバーは、結合した代謝産物の検出およびそのレベルの決定に役立つように標識されていてもよい。

本発明は、固体支持体に固定された複数の結合メンバーであって、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択され、前記固体支持体上の結合メンバーの集団の少なくとも２０％、３０％、４０％、５０％、６０％、７０％、８０％、または９０％を構成する、結合メンバーをさらに提供する。

一部の実施形態において、本発明は、本明細書で説明される方法を実行するための、特にＡＳＤを有するかまたはＡＳＤを有するリスクがあると対象を決定／診断するためのキットを提供する。キットは、使用者が、試験中の試料における５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、８−ヒドロキシオクタノエート、ガンマ−ＣＥＨＣ、ヒドロキシイソバレロイルカルニチン（Ｃ５）、インドールアセテート、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、ｐ−クレゾールスルフェート、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および３−ヒドロキシヒプレートからなる群から選択される１つまたは複数の代謝産物の存在、レベル（上昇または低下）を決定することを可能にし、キットは、（ａ）それぞれ独立して、そこに固定された前記１つまたは複数の代謝産物の１種に特異的である複数の結合メンバーを有する固体支持体；（ｂ）標識を含む展開剤；ならびに任意選択で（ｃ）洗浄溶液、希釈液および緩衝液からなる群から選択される１つまたは複数の成分を含む。

対象
単発的な運動障害以外の可能性のある発達障害を評価するために１９の発達評価センターへと照会された１８ヶ月齢から６０ヶ月齢の間の対象から、血液試料を収集した。全ての対象についてインフォームドコンセントを得た。小児発達評価を専門とする診療施設から事前にＡＳＤと診断された対象、または研究手順を完了することができないかまたはそれを望んでいない対象を、研究から排除した。

対象は、ＳｙｎａｐＤｘ自閉症スペクトラム障害遺伝子発現分析（ＳＴＯＲＹ）研究に登録された対象である。ＳＴＯＲＹ研究は、医薬品の臨床試験の実施に関する基準（ＧｏｏｄＣｌｉｎｉｃａｌＰｒａｃｔｉｃｅ：ＧＣＰ）における現行のＩＣＨガイドラインと適用可能な規制上の要件に従って行われた。ＧＣＰは、ヒト対象の参加を伴う研究を設計する、実行する、記録する、および報告するための国際的な倫理上のおよび科学的な品質規格である。この規格の順守は、ヘルシンキ宣言を元にした指針と一致して、研究対象の権利、安全性、および満足のいく状態が保護され、臨床研究データが信用できるものであるということを公に保証する。

図１から１２に示した結果は、ＳＴＯＲＹ研究における男性からの１８０個の血液試料に基づく。試料セットは、１２２個のＡＳＤ試料および５８個のＤＤ（非ＡＳＤ）試料を包含していた。ＡＳＤ診断は、ＤＳＭ−Ｖ診断基準に従った。追加の結果は、ＳＴＯＲＹ研究における男性対象からの２９９個の血液試料のより広範なセットに基づく。より広範な試料セットは、１９８個のＡＳＤ試料および１０１個のＤＤ試料を包含していた。

全ての試験につき、およそ３ｍＬの血液試料をＥＤＴＡチューブ中に収集し、チューブを遠心分離することによって血漿を調製した。次いで血漿を凍結し、分析のための実験室に送った。実験室で、試料のメタノール抽出を実行し、最適化された超高速液体またはガスクロマトグラフィー／タンデム質量分析（ＵＨＰＬＣ／ＭＳ／ＭＳまたはＧＣ／ＭＳ／ＭＳ）方法によって抽出物を分析した（例えば、Anal. Chem.、２００９年、８１巻、６６５６〜６６６７頁を参照）。

データ分析
男性および女性対象の両方について血液試料中の代謝産物を定量化した。試料を代謝産物のレベルに関してアッセイし、所与の日に測定された全試料の中央値濃度に標準化した任意単位の濃度として定量化した。例えば、１より大きい単位は、その日の試料の中央値より大きい代謝産物の量を指し、１未満の単位は、中央値未満である量を指す。次いでクロス検証を実行し、ここで試料を、オーバーラップしない訓練／試験セットにランダムに分割し、そのセットで機械学習分類器の不偏の性能を評価した。ＡＳＤ予測について、特に男性対象において個々にかつ集合的に高い情報的価値がある２１種の代謝産物が同定された。

（実施例１）
代謝産物レベルの情報の見極め
この実施例は、ＡＳＤのリスク査定のための有用な情報は、従来の分析（例えば、平均シフトベースの分析）ではさもなければ見失っていたであろう試料の分布におけるテール効果の同定および分析を見極めることができることを示す。

代謝産物レベルが一度決定されれば、平均シフトおよびテール効果などリスク査定のための情報を実行する方法は複数ある。単独で平均シフトが見出され、最適ではないがいくつかの予測情報が提供された。図１に、例示的な平均シフトを示す。この図において、ＡＳＤ分布は非ＡＳＤ分布（ＤＤ）の右にシフトしている。

従来の平均シフト分析に加えて、本発明者らは、試料から追加の情報を見極めた。ＡＳＤおよび非ＡＳＤ（ここではＤＤ）試料について代謝産物の分布曲線をプロットしたところ、測定された代謝産物のサブセットについて、ＡＳＤまたはＤＤ集団のいずれかからの試料が右（上の）または左（下の）テールにおいて濃縮されていたこと（すなわち、テール効果）が発見された。図２に、代表的なテール効果を示す。注目すべきことに、２つの分布は、ほぼ同一な平均値を共有していた（すなわち、最小の平均シフトがあるかまたは平均シフトがなかった）。したがって、代謝産物の予測値は、平均シフトの従来の分析から見極めることができないであろう。

代謝産物は、右（上の）テール効果、または左（下の）テール効果、または両方を表す可能性がある。図３に、代表的な代謝産物である５−ＨＩＡＡについてのＡＳＤおよび非ＡＳＤ（ここではＤＤ）の分布曲線を示す。明らかな右テール効果が観察され、例えばＡＳＤ分布は、右テールでより大きいＡＵＣを有する。したがって、この代謝産物が高いレベルの試料は、ＡＳＤ集団のメンバーで高度に濃縮されることが実証される。この代謝産物を用いれば、平均シフト（ｔ検定値によって示される）および右テール（「極値」のフィッシャー検定値によって示される）の両方は、統計学的に有意である。

図４に、別の例示的な代謝産物であるガンマ−ＣＥＨＣについてのＡＳＤおよび非ＡＳＤ（ここではＤＤ）の分布曲線を示す。明らかな左テール効果が観察され、例えば、ＡＳＤ分布は、左テールでより大きいＡＵＣを有する。したがって、この代謝産物のレベルが低い試料は、ＡＳＤ集団のメンバーで高度に濃縮されることが実証される。この代謝産物を用いれば、平均シフト（ｔ検定値によって示される）は、統計学的に有意ではないが、左テールは統計学的に有意である。

これらのデータから、テール効果の同定および分析は、従来の平均シフト分析では得ることができないリスク査定のための追加の情報を提供することが示される。

（実施例２）
テール効果を実証する選択された代謝産物からのＡＳＤの強力な予測
この実施例は、ＡＳＤの予測のためのテール効果の査定を例示する。本発明者らは、男性対象から得られた試料におけるいくつかの代謝産物に関する統計学的に有意なテール効果を同定した。テール効果は、対象がどの集団に属するのか、すなわちＡＳＤ集団またはＤＤ集団に属するのかについての情報を単独でかつ累積的に与えた。表１は、高い予測力を有するＡＳＤ対ＤＤのテール効果を表す２１種の代謝産物の例示的なパネルを示す。

表１Ｂは、ＡＳＤを予測するテール効果を有する２１種の代謝産物のパネルの代謝産物を示す。各テール効果の統計学的有意性（ｐ値）、加えて分布曲線におけるその位置（すなわち、左テール効果または右テール効果）が示される。１より大きいオッズ比は、ＡＳＤの予測力を示す。例えば、５ＨＩＡＡは、オッズ比が４．９１の右テールを有しており、これは、ＳＴＯＲＹ研究のデータセットにおいて（ＡＳＤ試料とＤＤ試料との比率は２：１であった）、ＤＤ試料１個ごとにおよそ１０個のＡＳＤ試料が右テール中であったことを示す。ブートストラップ方法によって信頼区間を推測した。復元抽出しなおすことによって１０００の個々のブートストラップをＳＴＯＲＹデータから生成した。各ブートストラップにつき、テールの位置と対応するオッズ比を決定した。観察されたオッズ比の分布から９０％信頼区間を計算した。

これらの基準に基づいて、２１種の代謝産物のパネルの１９種の代謝産物が、ＡＳＤを予測することを見出した。

表１Ｃは、ＤＤを予測するテール効果を有する代謝産物を示す。各テール効果の統計学的有意性（ｐ値）、加えて分布曲線におけるその位置（すなわち、左テール効果または右テール効果）が示される。１未満のオッズ比は、ＤＤの予測力を示す。これらの基準に基づいて、２１種の代謝産物のパネルの８種の代謝産物が、ＤＤを予測することを見出した。ＡＳＤの場合と同様に、ＳＴＯＲＹ研究においてＤＤ対ＡＳＤ試料が１：２の比率であることを考慮してオッズ比および９０％信頼区間を決定した。

注目すべきことに、ある特定の代謝産物は、ＡＳＤまたはＤＤのいずれかの予測力を有する単一のテール効果（左または右のいずれか）を実証したが、それに対して他の代謝産物は、左および右テール効果の両方を実証することから、総合してＡＳＤおよびＤＤ両方の予測力が提供される。例えば、フェニルアセチルグルタミンおよびｐ−クレゾールスルフェートは、右および左テール効果の両方を実証する。

表１で列挙した２１種の代謝産物のテール効果は、図１３Ａから１３Ｕのグラフにおいて個々に示される。各グラフにつき、ＡＳＤおよびＤＤ集団両方における１種の代謝産物の分布が示される。各パネルの上の凡例は、代謝産物に関する左および右テールの統計学的有意性を示す（ｐ値はフィッシャーの検定によって生成した）。

いくつかの代謝産物、例えばフェニルアセチルグルタミンは、平均シフトおよびテール効果を表す。図５で示されるように、フェニルアセチルグルタミンは、統計学的に有意な平均シフト（ｔ検定；ｐ＝０．００１）ならびに２つの集団間の統計学的に有意な左および右テール効果（「極値」はテール効果を示し、フィッシャーの検定においてｐ＝０．０００１である）を表す。分布は、ＡＳＤ集団とＤＤ集団とでシフトしたガウス曲線として表される。

表２は、ＡＳＤおよび非ＡＳＤ集団における各代謝産物の基準となる集団分布に基づいて、２１種の代謝産物のパネルのテール効果を決定するのに使用される閾値の値を示す。例証として、上の閾値の値は、９０パーセンタイル分布に相当し、一方で下の閾値の値は、１５パーセンタイル分布に相当する。閾値の値の絶対測定（例えば、ｎｇ／ｍＬ、ｎＭなど）は、集団における代謝産物の平均濃度と共に表２の値を使用することによって計算することができる。

（実施例３）
複数の代謝産物を用いたＡＳＤの予測
複数の代謝産物（例えば、表１で列挙したもの）によって提供された情報は、疾患リスクの予測を助けるために個々にまたは群として使用することができる。特に、代謝産物の情報的価値があるセットは、それほどよく互いに相関せず、低い共線性（すなわち低い相互関係）を有するメンバーを包含する。例えば、図６は、ガンマ−ＣＥＨＣレベルと比較した５ＨＩＡＡレベルを示しており、これは、２種の代謝産物の情報的価値があるレベル間に相関が欠如していることを実証する。例えば、５ＨＩＡＡのテールで同定されたＡＳＤ個体（図３）は、一般的に、ガンマ−ＣＥＨＣのテールで同定されたのと同じＡＳＤ個体ではない。したがって、代謝産物５ＨＩＡＡおよびガンマ−ＣＥＨＣは、相補的な情報を提供するとみなされる。テールで濃縮された低い相互関係の代謝産物は、相補的な分類情報を提供する。

図７は、１８０個の試料のそれぞれについて、試料が、１２種の代謝産物のパネルの代謝産物のそれぞれのテール内にあるのかまたはテール内にないのかを示すチャートである。この例示的なパネルにおいて、２種の代謝産物、キサンチンおよびＰ−クレゾールスルフェートのテールは、非ＡＳＤ（例えば、ＤＤ）を予測し、一方で他の１０種の代謝産物のテールは、ＡＳＤを予測する。

複数の代謝産物が査定される場合、集約されたテール効果カウントの組合せの数は増加し、可能性のある集約されたテール効果カウントも同様である。ＡＳＤおよび非ＡＳＤ集団からの集約されたテール効果カウントの分布をプロットすることができ、結果得られた分布は、未知の試料が測定されるときにＡＳＤおよび非ＡＳＤ間の好適な選別を決定するのに使用することができる。図８Ａで示されるように、ＡＳＤおよび非ＡＳＤ（ここではＤＤ）試料は、投票（例えば、ビニング）スキームを採用して、テール効果が観察された代謝産物によって提供された相補的な情報をさらに利用することによってさらに分析することができる。合計１２種の代謝産物のデータが示される。１つの特定のスキームにおいて、所与の試料に関し、試料が非ＡＳＤ（ここではＤＤ）予測テール内に収まる代謝産物の数と同様に、試料がＡＳＤ予測テール内に収まる代謝産物の数を合計した。これらの２つの値は、ｘおよびｙ座標としてプロットされて示される（図８Ａ）。注目すべきことに、ＡＳＤで濃縮された代謝産物の数が増加する（ｙ軸においてより高くなる）につれて、および非ＡＳＤで濃縮された代謝産物の数が減少する（ｘ軸においてより低くなる）につれて、ＡＳＤのドットのなかに混在する非ＡＳＤのドットがより少なくなるようであり、例えばこれは、ＡＳＤの偽陽性診断に関する尤度がより低いことを示唆している。一方で、ＡＳＤで濃縮された代謝産物の数が減少する（ｙ軸においてより低くなる）につれて、および非ＡＳＤで濃縮された代謝産物の数が増加する（ｘ軸においてより高くなる）につれて、非ＡＳＤのドットのなかに混在するＡＳＤのドットがより少なくなり、例えばこれは、ＤＤの偽陽性診断に関する尤度がより低いことを示唆している。

試料を４つの異なる区間に分割し、これを図８Ｂに示した。特に上および右下の区間が、ＡＳＤまたはＤＤのリスク評価を促進する明確な選別を示した。

図８に示される４つの区間のなかでも、ＡＳＤを最も強く予測する区間は、２つまたはそれより多くのＡＳＤで濃縮されたフィーチャおよび０または１つの非ＡＳＤで濃縮されたフィーチャのいずれかを有する試料を包含していた。また、１つのＡＳＤで濃縮されたフィーチャおよび０または１つの非ＡＳＤで濃縮されたフィーチャのいずれかを有する区間もＡＳＤを予測したが、上記の区間ほど強くなかった。１つまたは複数の非ＡＳＤで濃縮されたフィーチャおよび０のＡＳＤで濃縮されたフィーチャを有する区間は、非ＡＳＤを強く予測した。また、ＡＳＤで濃縮されたフィーチャおよび非ＡＳＤで濃縮されたフィーチャを有さない試料の区間も、一部の環境では予測の情報を提供することがある。

１つの例示的な投票スキームにおいて、投票は、所与の試料について開票され、例えば、ＡＳＤで濃縮された代謝産物は１ポイントをスコア付けし、非ＡＳＤで濃縮された代謝産物は１ポイントを引いた。正の結果を有する（例えば、１に等しいかまたはそれより大きい）試料は、ＡＳＤ（またはＡＳＤの有意なリスクを有する）とみなされる可能性があり、負の結果を有する（−１に等しいかまたはそれ未満の）試料は、非ＡＳＤ（または非ＡＳＤの有意な尤度を有する）とみなされる可能性がある。ゼロの結果を有する試料は、試料中のＡＳＤ対非ＡＳＤの分布に応じて非ＡＳＤもしくはＡＳＤの可能性があるとみなされる可能性があるか、または未解決もしくは「分類なしの結果」の試料として戻される可能性がある。同様に、図８Ｃは、表１に記載された２１種の代謝産物のパネルの投票開票結果を示す。

別の例示的なスコアリングシステムにおいて（図２１に示される）、ＡＳＤおよびＤＤのフィーチャに関するオッズ比のｌｏｇ２値（ｌｏｇ２ＯＲ）を各代謝産物について合計して、ＡＳＤまたはＤＤのリスクスコアを計算した。

テール効果の情報は、ＡＳＤまたは非ＡＳＤの状態を有する対象を識別するのに使用される場合がある。同様に、テール効果の情報は、対象の別の疾患または状態、例えばＤＤのリスクを予測するのに使用される場合がある。

例えば、非ＡＳＤ集団、例えばＤＤのテール効果分布は、図８Ａおよび８Ｃで示されるように、その集団における所与の数の代謝産物に関する平均テール効果の合計の参照値を確立するのに使用することができる。この平均値は、未知の対象からの試料からの平均テール効果の合計と比較するための参照として使用することができ、ＡＳＤおよび非ＡＳＤ集団両方における代謝産物の集団分布曲線を得る必要なく、ＡＳＤに関する対象のリスクを査定するのに使用することができる。

テール効果の情報はまた、例えば、上記の例示的な投票スキームまたは類似のスキームで説明したように、改善した分類結果のために従来の平均シフト情報および／または他の分類情報と組み合わせてもよい。

ある特定の代謝産物の組合せの分析によって、ＡＳＤリスクの予測可能性を増加できることが本明細書において実証される。例えば、図９〜１１および１３〜１４Ａ〜Ｄは、投票スキームの使用がどのように分類器のＡＵＣを増加させ、予測能力を改善できるのかを例示する。１２種の代謝産物のパネルのサブセットを使用したところ、サブセットにおける代謝産物の数が増加するにつれて（１個から１２個）、ＡＳＤ予測力（ｙ軸）が増加した（図９）。また異なる分類器（すなわち、ロジスティック回帰、ナイーブベイズ、またはサポートベクターマシン（ＳＶＭ））の使用、および異なるフィーチャの選択も、ＡＵＣに影響を与える（図９）。図１０Ａは、同じ集団で、１２種の代謝産物のパネルを使用した、異なるフィーチャおよび分類器を使用したＡＳＤリスクの三分化した予測を示し、一方で図１０Ｂは、２１種の代謝産物のパネルを使用した結果を示す。図１１Ａおよび１１Ｂは、１２種の代謝産物のパネル（図１１Ａ）および２１種の代謝産物のパネル（図１１Ｂ）の投票スキームを使用したＡＳＤリスク予測における改善を示す。総合すると、これらの分析は、標的化された代謝産物を選択し、適切な統計のツールを使用することによって、ＡＳＤリスク査定の高度な確実性を達成できることを実証する。例えば、図１２で示されるように、１２種の代謝産物を使用する上述した方法に従って、少なくとも０．７４のＡＵＣが得られた。

（実施例４）
メタボロミクスデータからの高い影響力を有する代謝産物の選択
ＡＳＤおよびＤＤ対象からの試料を、およそ６００種の公知の代謝産物（表３に示される）の検出に関してスクリーニングした。最初の６００個のセットから、８４種の候補代謝産物が、テール効果を表すと同定された。試料中で検出される８４種の代謝産物のサブセットが明らかになり、表４では名前で識別される。代謝産物のパネル（例えば、１２種および２１種のパネル）を、高い個々の代謝産物のＡＵＣに基づいて８４種の候補代謝産物のセットから選択した。薬物療法または年齢との関連などの要因に基づいて、ある特定の候補代謝産物をパネルから排除した。

代謝産物の２つのパネル（図７の代謝産物で構成される１２種の代謝産物のパネル、および表１の代謝産物で構成される２１種の代謝産物のパネル）をＡＳＤリスク予測に関して試験した。結果から、１２種および２１種の代謝産物のパネルはＡＳＤの予測に強く寄与したことが示される。図１４Ａ〜Ｄに、ＡＳＤ予測において１２種または２１種のパネルの代謝産物を包含および排除する効果の概説を示す。ホワイトリストは、１２種または２１種の代謝産物のパネルのみからのデータを使用した分類器のＡＵＣ値を示し、一方でブラックリストは、１２種または２１種の代謝産物のパネルを排除した、ただし８４種の候補代謝産物の群または６００種の代謝産物の全群のいずれかからの他の代謝産物を使用した分類器のＡＵＣ値を示す（全候補＝８４種の候補代謝産物；全フィーチャ＝６００種の代謝産物）。平均シフト（上のパネル）およびテール分析（下のパネル）を行った。これらのデータから、査定が平均シフトまたはテール分析によってなされたかどうかにかかわらず、ＡＳＤの予測の情報は、１２種または２１種の代謝産物のパネル内の代謝産物に起因することが示される。したがって、強力なテール効果を表すことが観察された代謝産物（１２種および２１種の代謝産物群にある代謝産物）は、強力なテール効果を表さない６００種の代謝産物のパネルからの他の代謝産物よりかなり大きいＡＳＤ対ＤＤの予測力を有する。

図１４Ｃ〜Ｄは、図１４Ａ〜Ｂの結果を拡大したものであり、ロジスティック回帰に加えてナイーブベイズ分析を使用した追加の分析を包含する。加えて、図１４Ｂは、試料の異なるコホート（すなわち、「クリスマス」および「イースター」）に分割した結果を示す。左端のパネルは、１９２個の試料で分類器を訓練し、クリスマスコホートのみでクロス検証したＡＵＣの結果を示し、中央の左のパネルは、２９９個の試料で分類器を訓練し、クリスマスおよびイースターコホートでクロス検証したＡＵＣの結果を示し、中央の右のパネルは、イースターコホートのみからの試料で分類器を訓練し、イースターコホートのみでクロス検証したＡＵＣの結果を示し、右端のパネルは、クリスマスおよびイースターコホートからの試料で分類器を訓練し、イースターコホートでクロス検証したＡＵＣの結果を示す。１２種または２１種の代謝産物のパネル内の代謝産物（例えば、テール効果を表す代謝産物）を使用して、最も高いＡＵＣが達成された。

図１７Ａ〜Ｂ、１８Ａ〜Ｂおよび１９Ａ〜Ｄは、統計学的分析に追加されたフィーチャの数に従って１２種または２１種の代謝産物のパネル（ホワイトリスト）を包含すること、およびそれらを排除すること（ブラックリスト）によるＡＵＣ予測を示すことによって、図１４Ａ〜Ｄの結果を拡大したものである。上のパネルは、平均シフト分析からの結果を示し、下のパネルは、テール効果分析を示す。それぞれ個々のパネル内で、バーは、下記の記号と凡例で示されるように、異なる代謝産物のパネルを表す。

図１５に、合計２１種の代謝産物のサブセットが査定される場合におけるＡＳＤリスク予測の累積的なＡＵＣを説明する例示的なプロットを示す。この図において、ｘ軸は、２１種の代謝産物の群から選択されるサブセットからの代謝産物の数を示す。ｙ軸は、ＡＳＤの予測力を示す。ｘ軸上の各数値についていくつかのランダムな代謝産物の組合せを分析し、それらのＡＵＣ値をプロットした（ドット）。曲線は、使用された代謝産物（２１種の群から選択された）の数の増加に起因するＡＵＣ増加を示す。一方で、この図は、少数の代謝産物（例えば、３または５）を有するサブセットでさえも高いＡＵＣを表すことを実証する。したがって、ある特定の代謝産物は、特に重要な予測テールを有するようである。

表５に、高いＡＵＣ値をもたらす３、４、５、６、および７種の代謝産物を含有する表１からの２１種の代謝産物の代表的なサブセットを説明する例示的な表を示す。各サブセットのサイズ（３、４、５、６または７種）について、代謝産物セットの５０個のランダムな選択を分析した。例えば、２１種の代謝産物のパネルのうち３種のサブセットの場合、３種の代謝産物のサブセットの５０個のランダムな組合せ（合計１３３０個の可能性のある順列から）を査定した。最も高いＡＵＣを有する５０個のランダムなセットからの組合せが示される。したがって、２１種よりも少ない代謝産物を含有するある特定の代謝産物の組合せが、高いＡＵＣ値をもたらした。ガンマ−ＣＥＨＣ、ｐ−クレゾールスルフェート、キサンチン、フェニルアセチルグルタミン、イソバレリルグリシン、オクテノイルカルニチン、およびヒドロキシ−クロロタロニルなどの代謝産物が、高いＡＵＣ値をもたらした複数のサブセットにおいて出現したことから、これらの代謝産物は患者のＡＳＤ状態に密接に関連する可能性があることが示される。したがって、これらの代謝産物は、単独で、または互いにもしくは追加の代謝産物と組み合わせて、患者のＡＳＤリスクを予測することに関して特に有用であると考えられる。

ＡＳＤの予測可能性に関して、表１からの２１種の代謝産物の２種の代謝産物のサブセットを、対の組合せで査定した。表６に、ロバストなＡＵＣを有する代表的な対の組合せを示す。同様に、ＡＳＤの予測可能性に関して、表１からの２１種の代謝産物の３種の代謝産物のサブセットを、３つ組の組合せで査定した。表７に、ロバストなＡＵＣを有する代表的な３つ組の組合せを示す。

（実施例５）
１２種の代謝産物のパネルの分類器の検証
およそ３分の２がＡＳＤであった１８０個の試験された試料からのデータを使用して、図７に示される１２種の高い情報的価値がある代謝産物に基づき分類器を生成した。１３０個の試料の第２のコホートにおいて非ＡＳＤ（ここではＤＤ）からＡＳＤを判別する能力に関して、分類器を試験した。この方法は、０．７４のＡＵＣに相当する真の予測性能の不偏の推測をもたらした。図１２に、プロセスの略図を示す。

（実施例６）
代謝産物に遺伝情報を追加することはＡＳＤリスク予測を改善する可能性がある
代謝産物情報に遺伝情報を追加することは、ある特定の群にとってＡＳＤリスク予測を改善することが見出された。例えば、コピー数多型（ＣＮＶ）データを代謝産物情報と組み合わせることは、図１６Ａおよび１６Ｂで示されるようにＡＳＤリスク予測の信頼区間を有意に低下させる。図１６Ａが実証するように、遺伝情報を追加することは、ＡＳＤ群と非ＡＳＤ群との選別をさらに強化する。ＣＮＶに加えて、これらに限定されないが脆弱Ｘ（ＦＸＳ）状態などの他の遺伝情報は、精度が改善され、第１種および／または第２種の誤りが低減されたＡＳＤリスク予測を可能にする診断試験にさらに寄与する可能性がある。図１６Ｂで示されるように、このような追加の情報（例えば、「ＰａｔｈｏＣＶ」）を包含することは、ＡＳＤ群とＤＤ群との選別を増強し、したがってこれらの２つの状態の識別を助けた。

（実施例７）
代謝産物分析から出現した重要な生物学的経路
代謝産物情報のさらなる分析から、表１に提示される、別個の生物学的経路において重要な役割を果たす代謝産物のクラスターが解明された。例えば、２１種の代謝産物のうち７種は消化管微生物の活性に関連しており（３３％）、これを表８に示す。７種全てが、アミノ酸代謝産物である。７種のうち６種は、芳香族アミノ酸の代謝産物であり、ベンゼン環を有する。

ＡＳＤと強く関連する代謝産物の分析は、表１で示されるように、ある特定の生物学的経路との関係を解明する。例えば、ＡＳＤの予測の情報を提供する特定の代謝産物は、フェーズＩＩの生体内変換の欠陥、ベンゼン環を代謝する能力の障害、腎臓における再吸収の調節異常、カルニチン代謝の調節異常、および脳への大きい中性アミノ酸の輸送の不均衡を示唆していた。生物学的経路情報は、ＡＳＤリスク査定を改善すること、ならびに／またはＡＳＤの病因および病態生理学を調査することにさらに利用することができる。このような情報はまた、ＡＳＤ処置のための医薬的な治療薬を開発するのにも使用することができる。

（実施例８）
血液中の代謝産物濃度の解明
血漿試料中の絶対代謝産物濃度を、実施例２で説明される２１種の代謝産物のうち１９種について質量分析により決定した。血漿中の絶対代謝産物濃度（ｎｇ／ｍｌ）を、公知の量の代謝産物を含有する標準試料から作製した検量線を使用して計算した。

表９Ａは、ＡＳＤを予測する１７種の代謝産物を示す。テール効果の方向（左または右）、テール効果の存在を決定するための閾値の値（すなわち、左テール効果の場合は１５パーセンタイル、右テール効果の場合は９０パーセンタイル）、およびオッズ比（ｌｏｇ２）が提供される。陽性のオッズ比は、代謝産物のテール効果がＡＳＤを予測することを示す。

表９Ｂは、ＤＤを予測する７種の代謝産物を示す。テール効果の方向（左または右）、テール効果の存在を決定するための閾値の値（すなわち、左テール効果の場合は１５パーセンタイル、右テール効果の場合は９０パーセンタイル）、およびオッズ比（ｌｏｇ２）が提供される。陰性のオッズ比は、代謝産物のテール効果がＤＤを予測することを示す。

Claims

対象において自閉症スペクトラム障害（ＡＳＤ）と非ＡＳＤ発達遅延（ＤＤ）とを識別する方法であって、
（ｉ）前記対象から得られた試料中の複数の代謝産物のレベルを測定するステップであって、
前記複数の代謝産物が、キサンチン、ガンマ−ＣＥＨＣ、ヒドロキシ−クロロタロニル、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、インドールアセテート、ｐ−クレゾールスルフェート、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−（３−ヒドロキシフェニル）プロピオネート、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、ヒドロキシイソバレロイルカルニチン（Ｃ５）、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも２種の代謝産物を含む、ステップ；ならびに
（ｉｉ）
（ａ）表９Ａで定義されるＡＳＤ（ＡＳＤ左テール効果）の指標であるか、もしくは
（ｂ）表９Ｂで定義されるＤＤ（ＤＤ左テール効果）の指標である、
予め決定された閾値濃度もしくはそれ未満のレベルを有する前記試料中の代謝産物の数を計算するステップ；ならびに／または
（ｉｉｉ）
（ａ）表９Ａで定義されるＡＳＤ（ＡＳＤ右テール効果）の指標であるか、もしくは
（ｂ）表９Ｂで定義されるＤＤ（ＤＤ右テール効果）の指標である、
予め決定された閾値濃度もしくはそれを超えるレベルを有する前記試料中の代謝産物の数を計算するステップ；ならびに
（ｉｖ）ステップ（ｉｉ）および／または（ｉｉｉ）で得られた数に基づいて、前記対象がＡＳＤまたはＤＤを有すると決定するステップ
を含む方法。
前記複数の代謝産物が、キサンチンおよびガンマ−ＣＥＨＣを含む、請求項１に記載の方法。
前記試料が、血漿試料である、請求項１に記載の方法。
前記代謝産物のレベルが、質量分析によって測定される、請求項１に記載の方法。
前記対象が、約５４ヶ月齢以下である、請求項１に記載の方法。
前記対象が、約３６ヶ月齢以下である、請求項１に記載の方法。
対象がＡＳＤを有するかまたはそのリスクがあることを決定するための方法であって、
（ｉ）前記対象から得られた試料中の複数の代謝産物のレベルを測定するステップであって、
前記複数の代謝産物が、キサンチン、ガンマ−ＣＥＨＣ、ヒドロキシ−クロロタロニル、５−ヒドロキシインドールアセテート（５−ＨＩＡＡ）、インドールアセテート、ｐ−クレゾールスルフェート、１，５−アンヒドログルシトール（１，５−ＡＧ）、３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）、３−インドキシルスルフェート、４−エチルフェニルスルフェート、ヒドロキシイソバレロイルカルニチン（Ｃ５）、イソバレリルグリシン、ラクテート、Ｎ１−メチル−２−ピリドン−５−カルボキサミド、パントテネート（ビタミンＢ５）、フェニルアセチルグルタミン、ピペコレート、３−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも２種の代謝産物を含む、ステップ；ならびに
（ｉｉ）
（ａ）１８２．７ｎｇ／ｍｌまたはそれを超えるレベルのキサンチン；
（ｂ）２０．３ｎｇ／ｍｌまたはそれを超えるレベルのヒドロキシル−クロロタロニル；
（ｃ）２８．５ｎｇ／ｍｌまたはそれを超えるレベルの５−ヒドロキシインドールアセテート；
（ｄ）６８６６００．０ｎｇ／ｍｌまたはそれを超えるレベルのラクテート；
（ｅ）６３．３ｎｇ／ｍｌまたはそれを超えるレベルのパントテネート；
（ｆ）３０３．６ｎｇ／ｍｌまたはそれを超えるレベルのピペコレート；
（ｇ）３２．０ｎｇ／ｍｌまたはそれ未満のレベルのガンマ−ＣＥＨＣ；
（ｈ）１４１．４ｎｇ／ｍｌまたはそれ未満のレベルのインドールアセテート；
（ｉ）１８２．７ｎｇ／ｍｌまたはそれ未満のレベルのｐ−クレゾールスルフェート；
（ｊ）１１９１０．３ｎｇ／ｍｌまたはそれ未満のレベルの１，５−アンヒドログルシトール（１，５−ＡＧ）；
（ｋ）７．９８ｎｇ／ｍｌまたはそれ未満のレベルの３−カルボキシ−４−メチル−５−プロピル−２−フランプロパノエート（ＣＭＰＦ）；
（ｌ）２５６．７ｎｇ／ｍｌまたはそれ未満のレベルの３−インドキシルスルフェート；
（ｍ）３．０ｎｇ／ｍｌまたはそれ未満のレベルの４−エチルフェニルスルフェート；
（ｎ）１２．９ｎｇ／ｍｌまたはそれ未満のレベルのヒドロキシイソバレロイルカルニチン（Ｃ５）；
（ｏ）１２４．８２ｎｇ／ｍｌまたはそれ未満のレベルのＮ１−メチル−２−ピリドン−５−カルボキサミド；および
（ｐ）１６６．４ｎｇ／ｍｌまたはそれ未満のレベルのフェニルアセチルグルタミン
の２種またはそれより多くを検出するステップ；ならびに
（ｉｉｉ）ステップ（ｉｉ）で検出された前記代謝産物レベルに基づいて前記対象がＡＳＤを有するかまたはそのリスクがあると決定するステップ
を含む方法。
前記複数の代謝産物が、キサンチンおよびガンマ−ＣＥＨＣを含む、請求項７に記載の方法。
前記試料が、血漿試料である、請求項７に記載の方法。
前記代謝産物のレベルが、質量分析によって測定される、請求項７に記載の方法。
前記対象が、約５４ヶ月齢以下である、請求項７に記載の方法。
前記対象が、約３６ヶ月齢以下である、請求項７に記載の方法。