ASDの診断は、典型的には、精神障害の診断と統計の手引きに詳述される基準を使用した子供の慎重な査定の後にのみ、発達小児科医および他の専門家によってなされる。信頼できる診断はしばしば、発達小児科医、神経病学者、精神科医、心理学者、発話と聴力の専門家および作業療法士などの複数の専門家による対象の集中的な査定を要する。さらに、親がASDを疑う平均年齢が20ヶ月もの早期であるという事実にもかかわらず、ASD診断の年齢中央値は54ヶ月である。CDC(疾病管理センター)によれば、ASD診断と判断された子供のうち18%しか36ヶ月齢までに同定されないことが観察されている。残念なことに、診断未確定のASDに罹っている若年の子供は、小児期の発達の重要な期間中に早期の治療的介入から利益を得る機会を失う。ASDリスクを確実に決定するための、特に、治療的介入がより有効になる可能性が高い場合により早期により若年の子供を同定するための医療診断試験が必要である。
本発明の実施形態は、集団内および集団全体にわたり測定された代謝産物などの分析物の分布曲線の分析は、ASDなどの状態または障害のリスクを予測するための分類器を構築または改善するのに利用できる情報を提供するという発見から生じたものである。特に、血液中の代謝産物レベルの集団分布曲線の分析は、対象における自閉症スペクトラム障害(ASD)のリスクの予測を容易にする。例えば、血液中の代謝産物レベルの集団分布曲線の分析は、対象において自閉症スペクトラム障害(ASD)と、自閉症スペクトラム障害に起因しない発達遅延(DD)などの非ASD発達障害とを識別するのに使用することができる。
2つの群を識別するバイオマーカーの統計学的分析は通常、2つの集団は、それらの平均バイオマーカーレベルの点で異なっており、この平均周辺の変動は、ガウス分布によって最もよく特徴付けられる実験上および/または集団の変動に起因すると仮定する。このベースラインモデルに反して、本明細書では、一部の分析物について、ただしそれ以外のものには当てはまらないが、ASD、または時にはDDにおける分布は、複数の下位分布、すなわち本質的に他の健康状態と識別されていないある下位分布(例えば、ASD分布とDD分布とが識別されていない場合)、および対象の少数派において平均からかけ離れている別の下位分布、例えばその集団について組み合わされた分布の「テール」でそれ自身構成されていることを最大の特徴とすることが観察されている。この見識は、ベースラインとは著しく異なる分析の枠組みをもたらすものであり、ある特定の分析物について、集団分布の上位または下位部分に基づいて閾値を定義することによって、例えば、基準となるガウス分布モデルを必要としないランキングを確立することによって、より優れた結果が達成されることが見出されている。
したがって、本明細書において、ある代謝産物に関する代謝産物レベルの分布曲線の遠位部分において特定の集団(例えば、ASDまたはDDのいずれか)からの試料の濃縮がみられる場合、その代謝産物は、「テール濃縮」または「テール」効果を表すと説明される。代謝産物の分布曲線におけるテール効果の存在、非存在、および/または方向(より高いまたはより低い)の査定からの情報は、ASDのリスクを予測するために利用することができる。特定の代謝産物に関して、分布曲線の上位または下位部分(例えば、十分位数)に対応する、すなわち分布曲線の「テール」内(「右テール」中または「左テール」中かどうかにかかわらず)の代謝産物レベルは、ASDの存在または非存在について高い情報的価値があることが発見された。
さらに、オーバーラップする相互情報量の程度が低い複数の代謝産物が取り入れられるため、リスク予測は改善されることが見出されている。例えば、ASDの査定のために、相補的な診断/リスク査定情報を提供する代謝産物の特定の群が存在する。すなわち、第1の代謝産物のレベルの分析によって同定可能なASD陽性個体(例えば、第1の代謝産物の同定されたテール内の個体)は、第2の代謝産物の分析によって同定可能なASD陽性個体と同じではない(または低いがゼロではない程度のオーバーラップが存在する可能性がある)。特定の理論に縛られることは望まないが、この発見は、ASDそれ自身の多面的な性質を反映している可能性がある。
したがって、ある特定の実施形態において、リスク査定方法は、対象が複数の代謝産物を含む多数の同定された代謝産物テールのいずれかに当てはまるかどうかを同定するステップ、例えば、異なる代謝産物テールの予測変数が少なくとも部分的に排反する場合、例えば、複数の代謝産物が低い相互情報量で取り入れられることによってリスク予測が改善されるように、それらが低い相互情報量を有する場合を同定するステップを包含する。分類器は、予め決定されたレベルの予測可能性を、例えばAUC、すなわち、その分類器についての真陽性率(感度)に対して偽陽性率(1−特異度)をプロットしたROC曲線下の面積の形態で有しており、テール効果を表す分類器に代謝産物が低い相互情報量で追加されるとAUCは増加する。
一部の実施形態において、本発明は、血液中の代謝産物レベルのある特定の閾値の値は、対象における自閉症スペクトラム障害(ASD)のリスク予測を容易にするのに使用できるという発見から生じたものである。ある特定の態様において、代謝産物の分布曲線におけるテール効果の存在、非存在、および/または方向(より高いまたはより低い)の査定から推測された代謝産物のこれらの閾値の値は、ASDのリスクを予測するのに利用される。ある特定の態様において、これらの閾値の値は、集団における代謝産物レベルの分布における上端または下端のいずれかに存在し得る。特定の代謝産物に関して、上の閾値の値を超えるおよび/または下の閾値の値を下回る代謝産物レベルは、ASDの存在または非存在について高い情報的価値があることが発見された。
一部の実施形態において、これらの代謝産物のレベルは、ASDを他の形態の発達遅延(例えば、自閉症スペクトラム障害に起因しない発達遅延(DD))と区別することにおいて有用である。
一態様において、本発明は、対象において自閉症スペクトラム障害(ASD)と非ASD発達遅延(DD)とを識別する方法であって、(i)対象から得られた試料に由来する複数の代謝産物の第1の代謝産物のレベルを測定するステップであって、第1の代謝産物の集団分布が、ASDを有する対象の第1の集団および非ASD発達遅延(DD)を有する対象の第2の集団において前もって特徴付けられ、ここで第1の代謝産物は、ASDテール効果および/またはDDテール効果を表すことが予め決定されており、各テール効果は、対応する(ASDまたはDD)集団のメンバーで濃縮された関連する右テールまたは左テールを含み、ここで第1の代謝産物は、右テールを有するASDテール効果を表し、試料中の第1の代謝産物のレベルが第1の(ASD)集団のメンバーで濃縮された右テールを定義する予め決定された上の(最小の)閾値より大きい場合、試料中の第1の代謝産物のレベルはASDテール内であり、ここで第1の代謝産物は、左テールを有するASDテール効果を表し、試料中の第1の代謝産物のレベルが第1の(ASD)集団のメンバーで濃縮された左テールを定義する予め決定された下の(最大の)閾値未満である場合、試料中の第1の代謝産物のレベルはASDテール内であり、ここで第1の代謝産物は、右テールを有するDDテール効果を表し、試料中の第1の代謝産物のレベルが第2の(DD)集団のメンバーで濃縮された右テールを定義する予め決定された上の(最小の)閾値より大きい場合、試料中の第1の代謝産物のレベルはDDテール内であり、ここで第1の代謝産物は、左テールを有するDDテール効果を表し、試料中の第1の代謝産物のレベルが第2の(DD)集団のメンバーで濃縮された左テールを定義する予め決定された下の(最大の)閾値未満である場合、試料中の第1の代謝産物のレベルはDDテール内である、ステップ;(ii)試料に由来する複数の代謝産物の少なくとも1種の追加の代謝産物のレベルを測定するステップであって、少なくとも1種の追加の代謝産物のそれぞれの集団分布が、第1の集団および第2の集団において前もって特徴付けられ、ASDテール効果およびDDテール効果の少なくとも1つを表すことが予め決定されており、少なくとも1種の追加の代謝産物のそれぞれについて、ステップ(i)に従って試料中の前記代謝産物のレベルが対応するASDテールおよび/またはDDテール内であるかどうかを同定するステップ;ならびに(iii)ステップ(i)およびステップ(ii)で分析された代謝産物に関して試料がその範囲内にある同定されたASDテールおよび/または同定されたDDテールに基づいて、予め決定されたレベルの予測可能性を用いて、(a)対象がASDを有しDDを有さないこと、または(b)対象がDDを有しASDを有さないことを決定するステップを含む方法を対象とする。
ある特定の実施形態において、第1の代謝産物は、関連する上の(最小の)または下の(最大の)閾値を有するASDテール効果を表すことが予め決定されており、前記閾値は、この基準を満たす未知の分類の試料(前もって特徴付けられていない試料)がDDに対してASDであるというオッズがp≦0.3で1.6:1以上になるように予め決定されている。ある特定の実施形態において、オッズは、2:1以上、または2.5:1以上、または2.75:1以上、または3:1以上、または3.25:1以上、または3.5:1以上、または3.75:1以上、または4:1以上である。前述のもののいずれかにおいて、p値(統計学的有意性の値)は、p≦0.3、またはp≦0.25、またはp≦0.2、またはp≦0.15、またはp≦0.1、またはp≦0.05を満たす。
ある特定の実施形態において、第1の代謝産物は、関連する上の(最小の)または下の(最大の)閾値を有するDDテール効果を表すことが予め決定されており、前記閾値は、この基準を満たす未知の分類の試料(前もって特徴付けられていない試料)がASDに対してDDであるというオッズがp≦0.3で1.6:1以上になるように予め決定されている。ある特定の実施形態において、オッズは、2:1以上、または2.5:1以上、または2.75:1以上、または3:1以上、または3.25:1以上、または3.5:1以上、または3.75:1以上、または4:1以上である。前述のもののいずれかにおいて、p値(統計学的有意性の値)は、p≦0.3、またはp≦0.25、またはp≦0.2、またはp≦0.15、またはp≦0.1、またはp≦0.05を満たす。
ある特定の実施形態において、予め決定されたレベルの予測可能性は、少なくとも0.70のAUC(曲線下面積)を有する真陽性率(感度)に対して偽陽性率(1−特異度)をプロットした受信者動作特性(ROC)曲線に相当する。
ある特定の実施形態において、代謝産物の1種または複数に関する予め決定された上の(最小の)閾値は、85から95パーセンタイル(例えば、小数点以下のパーセンタイルを切り捨てて、約90パーセンタイル、または約85、86、87、88、89、91、92、93、94、もしくは95パーセンタイル)のパーセンタイルであり、代謝産物の1種または複数に関する予め決定された下の(最大の)閾値は、10から20パーセンタイル(例えば、小数点以下のパーセンタイルを切り捨てて、約15パーセンタイル、または約10、11、12、13、14、16、17、18、19、もしくは20パーセンタイル)のパーセンタイルである。
ある特定の実施形態において、複数の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(hydroxyisovaleroylcarnitine)(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン(octenoylcarnitine)、および3−ヒドロキシヒプレートからなる群から選択される少なくとも2種の代謝産物を含む。
ある特定の実施形態において、複数の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、p−クレゾールスルフェート、イソバレリルグリシン、ガンマ−CEHC、インドールアセテート、ピペコレート、1,5−アンヒドログルシトール(1,5−AG)、ラクテート、3−(3−ヒドロキシフェニル)プロピオネート、3−インドキシルスルフェート、パントテネート(ビタミンB5)、およびヒドロキシ−クロロタロニルからなる群から選択される少なくとも2種の代謝産物を含む。
ある特定の実施形態において、複数の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、p−クレゾールスルフェート、イソバレリルグリシン、ガンマ−CEHC、インドールアセテート、ピペコレート、1,5−アンヒドログルシトール(1,5−AG)、ラクテート、3−(3−ヒドロキシフェニル)プロピオネート、3−インドキシルスルフェート、パントテネート(ビタミンB5)、およびヒドロキシ−クロロタロニルからなる群から選択される少なくとも3種の代謝産物を含む。
ある特定の実施形態において、複数の代謝産物は、表6に列挙した対から選択される少なくとも1つの代謝産物の対を含む。
ある特定の実施形態において、複数の代謝産物は、表7で列挙した3つ組から選択される少なくとも1つの代謝産物の3つ組を含む。
ある特定の実施形態において、複数の代謝産物は、2種の代謝産物のセットとして一緒に組み合わされて、少なくとも0.62(例えば、少なくとも約0.63、0.64、または0.65)のAUCを提供する少なくとも1つの代謝産物の対を含み、ここでAUCは、その2種の代謝産物のセットにのみ基づく分類器についての真陽性率(感度)に対して偽陽性率(1−特異度)をプロットしたROC曲線下の面積である。
ある特定の実施形態において、複数の代謝産物は、3種の代謝産物のセットとして一緒に組み合わされて、少なくとも0.66(例えば、少なくとも約0.67または0.68)のAUCを提供する少なくとも1つの代謝産物の3つ組を含み、ここでAUCは、その3種の代謝産物のセットにのみ基づく分類器についての真陽性率(感度)に対して偽陽性率(1−特異度)をプロットしたROC曲線下の面積である。
別の態様において、本発明は、対象における自閉症スペクトラム障害(ASD)のリスクを決定する方法であって、(i)対象から得られた試料に由来する複数の代謝産物の第1の代謝産物のレベルを分析するステップであって、第1の代謝産物の集団分布が、公知の分類を有する対象の参照集団において前もって特徴付けられ、ここで第1の代謝産物は、ASDメンバーで濃縮された関連する右テールまたは左テールを含むASDテール効果を表すことが予め決定されており、ここで第1の代謝産物は、右テールを有するASDテール効果を表し、試料中の第1の代謝産物のレベルがASD集団のメンバーで濃縮された右テールを定義する予め決定された上の(最小の)閾値より大きい場合、試料中の第1の代謝産物のレベルはASDテール内であり、ここで第1の代謝産物は、左テールを有するASDテール効果を表し、試料中の第1の代謝産物のレベルがASD集団のメンバーで濃縮された左テールを定義する予め決定された下の(最大の)閾値未満である場合、試料中の第1の代謝産物のレベルはASDテール内である、ステップ;(ii)試料に由来する複数の代謝産物の少なくとも1種の追加の代謝産物のレベルを測定するステップであって、少なくとも1種の追加の代謝産物のそれぞれの集団分布が、参照集団において前もって特徴付けられ、ASDテール効果を表すことが予め決定されており、少なくとも1種の追加の代謝産物のそれぞれについて、ステップ(i)に従って試料中の前記代謝産物のレベルが対応するASDテール内であるかどうかを同定するステップ;ならびに(iii)ステップ(i)およびステップ(ii)で分析された代謝産物に関して試料がその範囲内にある同定されたASDテールに基づいて、予め決定されたレベルの予測可能性を用いて、ASDを有する対象のリスクを決定するステップを含む方法を対象とする。
ある特定の実施形態において、第1の代謝産物は、関連する上の(最小の)または下の(最大の)閾値を有するASDテール効果を表すことが予め決定されており、前記閾値は、この基準を満たす未知の分類の試料(前もって特徴付けられていない試料)がDDに対してASDであるというオッズがp≦0.3で1.6:1以上になるように予め決定されている。ある特定の実施形態において、オッズは、2:1以上、または2.5:1以上、または2.75:1以上、または3:1以上、または3.25:1以上、または3.5:1以上、または3.75:1以上、または4:1以上である。前述のもののいずれかにおいて、p値(統計学的有意性の値)は、p≦0.3、またはp≦0.25、またはp≦0.2、またはp≦0.15、またはp≦0.1、またはp≦0.05を満たす。
ある特定の実施形態において、予め決定されたレベルの予測可能性は、少なくとも0.70のAUC(曲線下面積)を有する真陽性率(感度)に対して偽陽性率(1−特異度)をプロットした受信者動作特性(ROC)曲線に相当する。
ある特定の実施形態において、複数の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される少なくとも2種の代謝産物を含む。
別の態様において、本発明は、対象における自閉症スペクトラム障害(ASD)のリスクを決定する方法であって、(i)対象から得られた試料中の複数の代謝産物のレベルを分析するステップであって、複数の代謝産物が、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される少なくとも2種の代謝産物を含む、ステップ;ならびに(ii)複数の代謝産物の定量化されたレベルに基づいて、対象がASDを有するリスクを決定するステップを含む方法を対象とする。
ある特定の実施形態において、対象は、約54ヶ月齢以下である。ある特定の実施形態において、対象は、約36ヶ月齢以下である。
ある特定の実施形態において、複数の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、p−クレゾールスルフェート、イソバレリルグリシン、ガンマ−CEHC、インドールアセテート、ピペコレート、1,5−アンヒドログルシトール(1,5−AG)、ラクテート、3−(3−ヒドロキシフェニル)プロピオネート、3−インドキシルスルフェート、パントテネート(ビタミンB5)、およびヒドロキシ−クロロタロニルからなる群から選択される少なくとも2種の代謝産物を含む。
ある特定の実施形態において、複数の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、p−クレゾールスルフェート、イソバレリルグリシン、ガンマ−CEHC、インドールアセテート、ピペコレート、1,5−アンヒドログルシトール(1,5−AG)、ラクテート、3−(3−ヒドロキシフェニル)プロピオネート、3−インドキシルスルフェート、パントテネート(ビタミンB5)、およびヒドロキシ−クロロタロニルからなる群から選択される少なくとも3種の代謝産物を含む。
ある特定の実施形態において、複数の代謝産物は、表6に列挙した対から選択される少なくとも1つの代謝産物の対を含む。
ある特定の実施形態において、複数の代謝産物は、表7で列挙した3つ組から選択される少なくとも1つの代謝産物の3つ組を含む。
ある特定の実施形態において、複数の代謝産物は、2種の代謝産物のセットとして一緒に組み合わされて、少なくとも0.62(例えば、少なくとも約0.63、0.64、または0.65)のAUCを提供する少なくとも1つの代謝産物の対を含み、ここでAUCは、その2種の代謝産物のセットにのみ基づく分類器についての真陽性率(感度)に対して偽陽性率(1−特異度)をプロットしたROC曲線下の面積である。
ある特定の実施形態において、複数の代謝産物は、3種の代謝産物のセットとして一緒に組み合わされて、少なくとも0.66(例えば、少なくとも約0.67または0.68)のAUCを提供する少なくとも1つの代謝産物の3つ組を含み、ここでAUCは、その3種の代謝産物のセットにのみ基づく分類器についての真陽性率(感度)に対して偽陽性率(1−特異度)をプロットしたROC曲線下の面積である。
ある特定の実施形態において、試料は、血漿試料である。
ある特定の実施形態において、代謝産物のレベルを測定するステップは、質量分析を行うことを含む。ある特定の実施形態において、質量分析を行うことは、熱分解質量分析、フーリエ変換赤外分光分析、ラマン分光分析、ガスクロマトグラフ質量分析、高圧液体クロマトグラフィー/質量分析(HPLC/MS)、液体クロマトグラフィー(LC)−エレクトロスプレー質量分析、cap−LC−タンデムエレクトロスプレー質量分析、および超高速液体クロマトグラフィー/エレクトロスプレーイオン化タンデム質量分析からなる群から選択される1つまたは複数のメンバーを行うことを含む。
別の態様において、本発明は、対象において自閉症スペクトラム障害(ASD)と非ASD発達遅延(DD)とを識別する方法であって、(i)対象から得られた試料中の複数の代謝産物のレベルを分析するステップであって、複数の代謝産物が、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される少なくとも2種の代謝産物を含み、複数の代謝産物のレベルおよび/または集団分布が、参照集団において前もって特徴付けられる、ステップ;ならびに(ii)予め決定されたレベルの予測可能性を用いて、予め決定された閾値(例えば、公知の分類を有する試料の参照集団から決定された閾値)を有する対象からの試料に由来する複数の代謝産物のレベルを比較することによって、(a)対象がASDを有しDDを有さないこと、または(b)対象がDDを有しASDを有さないことを決定するステップを含む方法を対象とする。
ある特定の実施形態において、本発明は、異なる代謝産物に重みを割り当てて、リスク予測においてそれらのそれぞれの機能を反映することによって、代謝産物を分析するための方法を提供する。一部の実施形態において、重みの割り当ては、代謝産物の生物学的機能(例えば、それらが属する経路)、それらの臨床的有用性、または統計もしくは疫学的分析に基づくそれらの重要性から推測することができる。
ある特定の実施形態において、本発明は、これらに限定されないが、クロマトグラフィーアッセイ、質量分析アッセイ、蛍光測定法アッセイ、電気泳動アッセイ、免疫親和性アッセイ、および免疫化学アッセイなどの様々な技術を使用して代謝産物を測定するための方法を提供する。
ある特定の実施形態において、本発明は、対象における自閉症スペクトラム障害(ASD)のリスクを決定するための方法であって、対象からの試料に由来する複数の代謝産物のレベルを分析するステップ;および予め決定されたレベルの予測可能性を用いて、複数の代謝産物の定量化されたレベルに基づいて、対象が非ASD発達障害ではなくASDを有するかどうかを決定するステップを含む方法を提供する。
ある特定の実施形態において、複数の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、3−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも1種の代謝産物を包含する。
ある特定の実施形態において、複数の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、3−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも2種の代謝産物を包含する。
ある特定の実施形態において、複数の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、3−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10種の代謝産物を包含する。
ある特定の実施形態において、複数の代謝産物は、追加の代謝産物を包含する。一部の実施形態において、複数の代謝産物は、21種より多くの代謝産物を包含する。
ある特定の実施形態において、本発明は、対象において自閉症スペクトラム障害(ASD)と非ASD発達障害とを識別するための方法であって、対象からの試料に由来する複数の代謝産物のレベルを分析するステップ、代謝産物のレベルを、1つの参照集団におけるそれらのそれぞれの集団分布と比較するステップ、および予め決定されたレベルの予測可能性を用いて、対象からの試料に由来する複数の代謝産物のレベルを、参照集団における複数の代謝産物の前もって特徴付けられたレベルおよび/または集団分布と比較することによって、対象が非ASD発達障害ではなくASDを有するかどうかを決定するステップを含む方法を提供する。
例えば、ある特定の実施形態において、本発明は、対象におけるASDのリスクを予測することができる少なくとも1種の代謝産物を包含する診断基準であって、ROC曲線が、少なくとも0.60、少なくとも0.65、少なくとも0.70、少なくとも0.75、少なくとも0.80、少なくとも0.85または少なくとも0.90のAUCを有する、診断基準を提供する。AUCは、分類器について真陽性率(感度)に対して偽陽性率(1−特異度)をプロットしたROC曲線下の面積である。
ある特定の実施形態において、分析のための少なくとも1種の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、3−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される。
ある特定の実施形態において、分析のための少なくとも1種の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される少なくとも2種またはそれより多く(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21種)のメンバーを含み、非ASD集団分布曲線およびASD集団分布曲線は、代謝産物のそれぞれ(例えば、テール効果を実証する前記代謝産物のそれぞれ)について確立される。
ある特定の実施形態において、分析のための代謝産物は、ガンマ−CEHC、キサンチン、p−クレゾールスルフェート、オクテノイルカルニチン、フェニルアセチルグルタミン、およびそれらの組合せからなる群から選択される。
ある特定の実施形態において、分析のための代謝産物は、ガンマ−CEHCである。
ある特定の実施形態において、分析のための代謝産物は、キサンチンである。
ある特定の実施形態において、分析のための代謝産物は、p−クレゾールスルフェートである。
ある特定の実施形態において、分析のための代謝産物は、オクテノイルカルニチンである。
ある特定の実施形態において、分析のための代謝産物は、フェニルアセチルグルタミンである。
ある特定の実施形態において、分析のための代謝産物は、イソバレリルグリシンである。
ある特定の実施形態において、分析のための代謝産物は、ピペコレートである。
ある特定の実施形態において、分析のための代謝産物は、インドールアセテートである。
ある特定の実施形態において、分析のための代謝産物は、オクテノイルカルニチンである。
ある特定の実施形態において、分析のための代謝産物は、ヒドロキシ−クロロタロニルである。
ある特定の実施形態において、複数の代謝産物は、相補的である少なくとも第1の代謝産物および第2の代謝産物を含む(例えば、代謝産物によって提供される予測変数が部分的に排反して低い相互情報量を有するように、第1および第2の代謝産物のためのASDテール試料は実質的にオーバーラップしない。ある特定の実施形態において、複数の代謝産物が低い相互情報量で取り入れられることによってリスク予測は改善される。
ある特定の実施形態において、複数の代謝産物は、2種の代謝産物を含み、ここで2種の代謝産物は、2種の代謝産物のセットとして一緒に組み合わされて、少なくとも0.62、0.63、0.64、または0.65のAUCを提供する。
ある特定の実施形態において、複数の代謝産物は、3種の代謝産物を含み、ここで3種の代謝産物は、3種の代謝産物のセットとして一緒に組み合わされて、少なくとも0.66、0.67、または0.68のAUCを提供する。
ある特定の実施形態において、本発明は、前もって定義された代謝産物の2つの群のレベルを分析することによって、対象において自閉症スペクトラム障害(ASD)と非ASD発達障害とを識別する方法を提供する。ある特定の実施形態において、代謝産物の第1の群は、ASDと密接に関連する代謝産物を表し、一方で代謝産物の第2の群は、対照状態(例えば、DD)と関連する代謝産物を表す。対象からの試料に由来する代謝産物の両方の群を分析することによって、対照状態ではなくASDを有する対象のリスクを、本開示で説明される様々な方法によって決定することができる。例えば、これは、代謝産物の第1の群について集約されたASDテール効果を、代謝産物の第2の群について集約された非ASDテール効果と比較することによって達成できる。
ある特定の実施形態において、本発明は、対象において自閉症スペクトラム障害(ASD)と非ASD発達遅延(DD)とを識別するための方法であって、(i)対象から得られた試料中の複数の代謝産物のレベルを測定するステップであって、複数の代謝産物が、キサンチン、ガンマ−CEHC、ヒドロキシ−クロロタロニル、5−ヒドロキシインドールアセテート(5−HIAA)、インドールアセテート、p−クレゾールスルフェート、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、ヒドロキシイソバレロイルカルニチン(C5)、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、3−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも2種の代謝産物を含む、ステップ;ならびに(ii)(a)表9Aで定義されるASD(ASD左テール効果)の指標であるか、もしくは(b)表9Bで定義されるDD(DD左テール効果)の指標である、予め決定された閾値濃度もしくはそれ未満のレベルを有する試料中の代謝産物の数を計算するステップ;ならびに/または(iii)(a)表9Aで定義されるASD(ASD右テール効果)の指標であるか、もしくは(b)表9Bで定義されるDD(DD右テール効果)の指標である、予め決定された閾値濃度もしくはそれを超えるレベルを有する試料中の代謝産物の数を計算するステップ;ならびに(iv)ステップ(ii)および/または(iii)で得られた数に基づいて、対象がASDまたはDDを有すると決定するステップを含む方法を提供する。
ある特定の実施形態において、本発明は、対象がASDを有するかまたはそのリスクがあることを決定するための方法であって、(i)対象から得られた試料中の複数の代謝産物のレベルを測定するステップであって、複数の代謝産物が、キサンチン、ガンマ−CEHC、ヒドロキシ−クロロタロニル、5−ヒドロキシインドールアセテート(5−HIAA)、インドールアセテート、p−クレゾールスルフェート、1,5−アンヒドログルシトール(1,5−AG)、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、ヒドロキシイソバレロイルカルニチン(C5)、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、3−ヒドロキシヒプレート、およびそれらの組合せからなる群から選択される少なくとも2種の代謝産物を含む、ステップ;ならびに(ii)(a)182.7ng/mlまたはそれを超えるレベルのキサンチン;(b)20.3ng/mlまたはそれを超えるレベルのヒドロキシル−クロロタロニル;(c)28.5ng/mlまたはそれを超えるレベルの5−ヒドロキシインドールアセテート;(d)686600ng/mlまたはそれを超えるレベルのラクテート;(e)63.3ng/mlまたはそれを超えるレベルのパントテネート;(f)303.6ng/mlまたはそれを超えるレベルのピペコレート;(g)32.0ng/mlまたはそれ未満のレベルのガンマ−CEHC;(h)141.4ng/mlまたはそれ未満のレベルのインドールアセテート;(i)182.7ng/mlまたはそれ未満のレベルのp−クレゾールスルフェート;(j)11910.3ng/mlまたはそれ未満のレベルの1,5−アンヒドログルシトール(1,5−AG);(k)7.98ng/mlまたはそれ未満のレベルの3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF);(l)256.7ng/mlまたはそれ未満のレベルの3−インドキシルスルフェート;(m)3.0ng/mlまたはそれ未満のレベルの4−エチルフェニルスルフェート;(n)12.9ng/mlまたはそれ未満のレベルのヒドロキシイソバレロイルカルニチン(C5);(o)124.82ng/mlまたはそれ未満のレベルのN1−メチル−2−ピリドン−5−カルボキサミド;および(p)166.4ng/mlまたはそれ未満のレベルのフェニルアセチルグルタミン(phenacetylglutamine)の2種またはそれより多くを検出するステップ;ならびに(iii)ステップ(ii)で検出された代謝産物レベルに基づいて対象がASDを有するかまたはそのリスクがあると決定するステップを含む方法を提供する。
一部の実施形態において、ステップ(ii)で検出される代謝産物レベルは、およそのレベルである。
一部の実施形態において、本発明は、自閉症スペクトラム障害(ASD)を有するかまたはそれを有するリスクがあると対象を診断する方法であって、(i)前記対象から得られた試料中の1つまたは複数の代謝産物のレベルを決定するステップ;(ii)1つまたは複数の代謝産物の決定されたレベルを、前記1つまたは複数の代謝産物の予め決定されたレベルと比較するステップであって、前記予め決定されたレベルが、ASDを有するかまたはASDを有するリスクがある対象の指標である、ステップ;および(iii)前記1つまたは複数の代謝産物の決定されたレベルと予め決定されたレベルとの差に基づいて、前記対象をASDを有するかまたはASDを有するリスクがあると診断するステップを含み、ここで前記1つまたは複数の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される、方法を提供する。
一部の実施形態において、本発明は、自閉症スペクトラム障害(ASD)を有するかまたはそれを有するリスクがあると対象を診断する方法であって、(i)前記対象から得られた試料中の1つまたは複数の代謝産物のレベルを決定するステップ;(ii)1つまたは複数の代謝産物の決定されたレベルを、前記1つまたは複数の代謝産物の予め決定されたレベルと比較するステップであって、前記予め決定されたレベルが、ASDを有するかまたはASDを有するリスクがある対象の指標である、ステップ;および(iii)前記1つまたは複数の代謝産物の決定されたレベルと予め決定されたレベルとの差に基づいて、前記対象をASDを有するかまたはASDを有するリスクがあると診断するステップを含み、ここで前記1つまたは複数の代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択され、ただし代謝産物は、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、または3−ヒドロキシヒプレートではない、方法を提供する。
ある特定の実施形態において、本発明は、対象からのある特定の代謝産物および遺伝情報の両方のレベルを測定することによって、対象においてASDリスクを決定するための方法を提供する。一部の実施形態において、遺伝情報は、コピー数多型(CNV)および/または脆弱X(FXS)検査を包含する。
追加の実施形態において、本発明のある特定の態様に関して説明された限定は、本発明の他の態様に適用することができる。例えば、1つの独立請求項に従属する請求項の限定は、一部の実施形態において、別の独立請求項に適用され得る。
図1は、2つの集団(例えば、ASDおよびDD)における例示的な代謝産物の分布と、これら2つの集団間のこの代謝産物の平均シフトを例示する。
図2は、2つの集団(例えば、ASDおよびDD)における例示的な代謝産物の分布と、これら2つの集団間のこの代謝産物のテール効果(例えば、ASD分布はより高密度に集合したテールを有する)を例示する。
図3は、2つの集団(例えば、ASDおよびDD)中の代謝産物5−ヒドロキシインドールアセテートの分布であって、統計学的に有意な平均シフト(t検定;p<0.01)および2つの集団間の統計学的に有意な右テール効果(「極値」はテール効果を示し、フィッシャーの検定においてp=0.001である)を表す分布を例示する。
図4は、2つの集団(例えば、ASDおよびDD)中の代謝産物ガンマ−CEHCの分布であって、2つの集団間の統計学的に有意な左テール効果(「極値」はテール効果を示し、フィッシャーの検定においてp=0.008である)を表す分布を例示する。
図5は、2つの集団(例えば、ASDおよびDD)中の代謝産物フェニルアセチルグルタミンの分布であって、統計学的に有意な平均シフト(t検定;p=0.001)と、2つの集団間の統計学的に有意な左および右テール効果(「極値」はテール効果を示し、フィッシャーの検定においてp=0.0001である)を表す分布を例示する。分布は、2つの集団においてシフトしたガウス曲線として表される。
図6は、2つの例示的な代謝産物の相関を例示し、これら2種の代謝産物はテール効果の別個のプロファイルを所有し、相補的であることを実証する。
図7は、180人の対象における12種の例示的な代謝産物のテール効果と、ASDおよびDDに関するそれらの予測力を例示する。
図8Aは、例示的な12種の代謝産物のパネルを使用した180個の試料に関するASDおよび非ASDテール効果のプロットを例示し、ASD患者からの試料は、ASDテール効果の集約を示すことが実証される。
図8Bは、例示的な12種の代謝産物のパネルを使用した180個の試料に関するASDおよび非ASDテール効果のプロットと、データをビニングする例示的な方法を例示する。
図8Cは、例示的な21種の代謝産物のパネルを使用した180個の試料に関するASDおよび非ASDテール効果のプロットを例示し、ASD患者からの試料は、ASDテール効果の集約を示すことが実証される。
図9は、例示的な12種の代謝産物のパネルに関するASDの予測可能性の増加を増加したと査定された代謝産物の数として例示する。
図10Aは、例示的な12種の代謝産物のパネルを使用したASDの予測可能性における三分化(trichotomization)の効果を例示する。
図10Bは、例示的な21種の代謝産物のパネルの分析におけるASDの予測可能性における三分化の効果を例示する。
図11Aは、例示的な12種の代謝産物のパネルの分析のための非投票方法と比較した投票方法を使用したASDの予測可能性における改善を例示する。
図11Bは、例示的な21種の代謝産物のパネルを使用した非投票方法と比較した投票方法を使用したASDの予測可能性における改善を例示する。
図12は、ASDの高い予測可能性を達成するために例示的な12種の代謝産物のパネルを使用するための検証プロセスを例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図13A〜13Uは、ASD集団および非ASD集団における21種の例示的な代謝産物の集団分布を例示する。
図14A〜Bは、テール効果分析および平均シフト分析によって査定された、総数600種の代謝産物からの例示的な12種の代謝産物のパネル、例示的な21種の代謝産物のパネル、および84種の候補代謝産物のセットの包含および排除による、ASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図14A〜Bは、テール効果分析および平均シフト分析によって査定された、総数600種の代謝産物からの例示的な12種の代謝産物のパネル、例示的な21種の代謝産物のパネル、および84種の候補代謝産物のセットの包含および排除による、ASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図14C〜Dは、テール効果分析および平均シフト分析によって査定された、総数600種の代謝産物からの例示的な12種の代謝産物のパネルおよび例示的な21種の代謝産物のパネルの包含(ホワイトリスト)および排除(ブラックリスト)による、ならびに試料の2つのコホート(すなわち、「クリスマス」および「イースター」)においてロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図14C〜Dは、テール効果分析および平均シフト分析によって査定された、総数600種の代謝産物からの例示的な12種の代謝産物のパネルおよび例示的な21種の代謝産物のパネルの包含(ホワイトリスト)および排除(ブラックリスト)による、ならびに試料の2つのコホート(すなわち、「クリスマス」および「イースター」)においてロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図15は、例示的な21種の代謝産物のパネルのサブセットから選択される代謝産物の数の増加を使用することによるASDの予測可能性に対する効果を例示する。
図16Aは、例示的な12種の代謝産物のパネルを使用してテール効果分析に遺伝情報を追加する効果を例示し、ASDを非ASDから選別する力の改善を実証する。
図16Bは、例示的な21種の代謝産物のパネルを使用してテール効果分析に遺伝情報を追加する効果を例示し、ASDを非ASDから選別する力の改善を実証する。
図17A〜Bは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、およびロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図17A〜Bは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、およびロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図18A〜Bは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および2つのコホート(すなわち、「クリスマス」および「イースター」)においてロジスティック回帰を使用することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図18A〜Bは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および2つのコホート(すなわち、「クリスマス」および「イースター」)においてロジスティック回帰を使用することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図19A〜Dは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図19A〜Dは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図19A〜Dは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図19A〜Dは、代謝産物総数からの例示的な21種の代謝産物のパネルの包含および排除による、テール効果分析を平均シフト分析と比較することによる、および「クリスマス」コホートもしくは「イースター」コホートのいずれか、または両方の組合せを使用してロジスティック回帰をベイズ分析と比較することによるASDの予測可能性に対する効果を例示する。(ブラックリスト=排除されたもの、ホワイトリスト=包含されたもの、mx_12=例示的な12種の代謝産物のパネル、mx_標的化された21種=例示的な21種の代謝産物のパネル、mx_全候補=84種の候補代謝産物、全フィーチャ=600種の代謝産物の全セット)。
図20は、ASD予測のための例示的な21種の代謝産物のパネルに関するテール効果分析の特異度および感度の代表的なプロットを例示する。
図21は、ASDまたはDDのリスクスコアがASDおよびDDの予測代謝産物に関するオッズ比のlog2値の合計に基づいて計算されるスコアリングシステムを例示する。
定義
本発明をより容易に理解するために、まずある特定の用語を以下で定義する。以下の用語および他の用語の追加の定義は明細書中のあらゆる箇所で明示される。
本出願において、文脈からそうではないことが明らかでない限り、(i)用語「1つの(a)」は、「少なくとも1つの」を意味すると理解することができ、(ii)用語「または」は、「および/または」を意味すると理解することができ、(iii)用語「含む」および「包含する」は、単独で提示されているかまたは1つもしくは複数の追加の構成要素もしくはステップと共に提示されているかにかかわらず、列挙された構成要素またはステップを含むと理解することができ、(iv)用語「約」および「およそ」は、当業者により理解されるであろう標準偏差を許容すると理解することができ、(v)範囲が提供される場合、端点が包含される。
薬剤:用語「薬剤」は、本明細書で使用される場合、例えばポリペプチド、核酸、糖類、脂質、小分子、金属、またはそれらの組合せなどの、あらゆる化学クラスの化合物または実体を指す場合がある。
およそ:本明細書で使用される場合、用語「およその」、「およそ」または「約」は、当業者によって関連する文脈に適するように理解されるであろう通常の統計学的変動を包含することが意図される。ある特定の実施形態において、用語「およその」、「およそ」または「約」は、特に他の指定がない限り、述べられた参照値の、いずれかの方向(それより大きいかまたはそれより小さい)で25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%またはそれ未満の範囲に収まるか、またはそうでなければ文脈から明白な値の範囲を指す(ただしこのような数値が可能性のある値の100%を超えると予想される場合を除く)。
曲線下面積(AUC):分類器は、真陽性率(感度)に対して偽陽性率(1−特異度)をプロットした関連するROC曲線(受信者動作特性曲線)を有する。ROC曲線下の面積(AUC)は、分類器が2つの診断群をどの程度うまく区別することができるかの尺度である。パーフェクトな分類器は、0.5のAUCを有するランダムな分類器と比較して、1.0のAUCを有する。
〜と関連する:この用語は、本明細書では、一方の存在、レベルおよび/または形態が他方のそれと相関している場合に使用されるように、2つの事象または実体が互いに「関連する」ことである。例えば、特定の実体の存在、レベルおよび/または形態が、特定の疾患、障害、または状態の発生率および/または感受性と相関する場合(例えば、関連集団全体で)、その実体は、その疾患、障害または状態と関連するとみなされる。
自閉症スペクトラム障害:本明細書で使用される場合、用語「自閉症スペクトラム障害」は、双方向の社会的相互作用の欠陥、言語の困難さ、反復行動および限定的な興味の1つまたは複数を特徴とする自閉症「スペクトラム」における発達障害を指すと当業者により認識される。自閉症スペクトラム障害は、DSM−V(2013年5月)に、例えば、コミュニケーションの欠陥、例えば会話での不適切な応答、誤解を招く非言語的な相互作用、年齢に適した交友関係構築の困難さ、日常的作業における過度の依存、彼らの環境変化に対して極めて敏感なこと、および/または不適切な事柄への激しい集中などの一連の症状を含む障害と特徴付けられている。自閉症スペクトラム障害は加えて、例えばDSM−IV−TRによって、自閉性障害、アスペルガー障害、レット障害、小児期崩壊性障害、および特定不能の広汎性発達障害(非定型自閉症など)を含むと特徴付けられている。一部の実施形態において、自閉症スペクトラム障害(ASD)は、質問事項および観察スケジュールなどの標準化した試験手段を使用して特徴付けられる。例えば、一部の実施形態において、ASDは、(i)自閉症診断観察スケジュール(ADOS)におけるコミュニケーションおよび社会的相互作用の総計に対する自閉症のカットオフを満たすスコア、ならびに自閉症診断面接改訂版(ADI−R)における≦36ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア;ならびに/または(ii)ADOSにおけるコミュニケーションおよび社会的相互作用の総計に対するASDカットオフを満たすスコア、ならびにADI−Rにおける≦36ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア、ならびに(ii)(a)ADI−Rにおける社会的相互作用およびコミュニケーションに関するカットオフ値を満たすスコア、または(ii)(b)社会的相互作用もしくはコミュニケーションに関するカットオフ値を満たすスコア、およびADI−Rにおける社会的相互作用もしくはコミュニケーションに対するカットオフ値の2ポイント以内であること(どちらもカットオフ値を満たしていない)、または(ii)(c)スコアが、ADI−Rにおける社会的相互作用およびコミュニケーションに関するカットオフ値の1ポイント以内であることによって特徴付けられる。
分類:本明細書で使用される場合、「分類」は、公知のクラス内の収集されたデータポイント間の共通のフィーチャを発見し、次いで異なるクラスの1つにデータポイントを割り振るための数学的方法または他の方法を使用することによって、データポイントを異なるクラスに選別することを学習するプロセスである。統計において、分類は、その部分集団が公知である観察を含有するデータの訓練セットに基づいて、部分集団の同一性が不明である新しい観察が属する部分集団を同定する問題である。したがって要求は、1つまたは複数の測定値、特色または特徴などに関する定量的情報に基づく群、および前もって決定された群分けがすでに確立されている訓練セットに基づく群に、新しい個々の項目が分類されることである。分類は、多くの適用を有する。いくつかのケースにおいて、分類は、データマイニング手順として採用される一方で、他のケースではより詳細な統計学的モデリングが用いられる。
分類器:本明細書で使用される場合、「分類器」は、データ分類を行うための方法、アルゴリズム、コンピュータープログラム、またはシステムである。広く使用される分類器の例としては、これらに限定されないが、ニューラルネットワーク(多層パーセプトロン)、ロジスティック回帰、サポートベクターマシン、k−最近傍、ガウス混合モデル、ガウスのナイーブベイズ、決定木、部分最小二乗判別分析(PSL−DA)、フィッシャーの線形判別、ロジスティック回帰、ナイーブベイズ分類器、パーセプトロン、サポートベクターマシン、二次分類器、カーネル推定、ブースティング、ニューラルネットワーク、ベイジアンネットワーク、隠れマルコフモデル、および学習ベクトル量子化が挙げられる。
決定:本明細書で説明される多くの手法は、「決定する」ステップを包含する。当業者であれば、本明細書を読めば、このような「決定」は、例えば本明細書で明示的に言及される具体的な技術などの当業者に利用可能な様々な技術のいずれかを利用してもよいし、またはその使用を介して達成されてもよいことを理解するであろう。一部の実施形態において、決定は、物理的な試料の操作を含む。一部の実施形態において、決定は、例えば関連分析を行うように適合されたコンピューターまたは他の処理ユニットを利用する、データまたは情報の考察および/または操作を含む。一部の実施形態において、決定は、ソースから関連情報および/または材料を受けることを含む。一部の実施形態において、決定は、試料または実体の1つまたは複数のフィーチャを、比較可能な参照と比較することを含む。
リスクの決定:本明細書で使用される場合、リスクの決定は、所与の対象が特定の状態または障害を有するかまたは有さない確率を計算または定量化することを包含する。一部の実施形態において、障害または状態、例えば自閉症スペクトラム障害(ASD)または発達遅延(DD)に関する陽性または陰性診断は、決定されたリスクまたはリスクスコア(例えば、オッズ比または範囲)に全体的または部分的に基づいてなされ得る。
発達遅延:本明細書で使用される場合、発達遅延(DD)という成句は、小児発達の1つまたは複数のプロセス、例えば、自閉症スペクトラム障害に起因しない、身体的発達、認知発達、コミュニケーションの発達、社会性もしくは情緒の発達、または適応性の発達などにおける進行中の重度または軽度の遅延を指す。ASDを有する個体が発達的に遅延しているとみなされる可能性があるとしても、ASDおよびDDの分類が相互排他的になるように、本明細書で使用されるASDの分類はDDの分類に勝るとみなされることになる。言い換えれば、特に他の指定がない限り、DDの分類は、非ASD発達遅延を意味すると仮定される。一部の実施形態において、DDは、非自閉症(AU)および非ASDであって、さらに、(i)ミューレンスケールでは69もしくはそれより低いスコア、ヴァインランドスケールでは69もしくはそれより低いスコア、およびSCQでは14もしくはそれより低いスコア、または(ii)ミューレンもしくはヴァインランドのいずれかでは69もしくはそれより低いスコア、および他の査定ではカットオフ値の標準偏差の半分以内(77またはそれより低いスコア)を有することを特徴とする。
診断情報:本明細書で使用される場合、診断情報または診断で使用するための情報は、患者が疾患または状態を有するかどうかを決定することにおいて有用な、および/あるいは疾患もしくは状態の予後に関する重要性を有する、または疾患もしくは状態の処置(一般的な処置または何らかの特定の処置のいずれか)に対して応答する可能性がある、表現型のカテゴリーまたはあらゆるカテゴリーに、疾患または状態を分類することにおいて有用なあらゆる情報である。同様に、診断は、これらに限定されないが、対象が疾患もしくは状態(例えば自閉症スペクトラム障害)を有する可能性が高いかどうか、対象で顕在化した疾患もしくは状態の状況、病期もしくは特徴、障害の性質もしくは分類に関する情報、予後に関する情報、および/または適切な処置の選択において有用な情報などのあらゆるタイプの診断情報を提供することを指す。処置の選択としては、特定の治療剤または行動療法、食事の改変などの他の処置様式の選択、療法を保留するかまたは実行するかどうかについての選択、用量レジメン(例えば、特定の治療剤または治療剤の組合せの1つまたは複数の用量の頻度またはレベル)に関する選択などを挙げることができる。
マーカー:マーカーは、本明細書で使用される場合、その存在またはレベルが、特定の疾患もしくは状態と関連するか、または特定の疾患もしくは状態との相関を有する薬剤を指す。代替として、または加えて、一部の実施形態において、特定のマーカーの存在またはレベルは、例えば特定の障害に特徴的である可能性がある特定のシグナル伝達経路の活性(または活性レベル)と相関する。マーカーは、疾患または状態において病因学的な役割を果たすものでもよいし、またはそうでなくてもよい。マーカーの存在または非存在の統計学的有意性は、特定のマーカーに応じて様々であり得る。一部の実施形態において、マーカーの検出は、特定のサブクラスに障害が属する高い確率を反映するという点で、高度に特異的である。本発明によれば、有用なマーカーが、特定のサブクラスの障害を100%の精度で区別する必要はない。
代謝産物:本明細書で使用される場合、代謝産物という用語は、身体の化学的または物理的プロセス中に産生された物質を指す。用語「代謝産物」は、代謝プロセスのあらゆる化学的または生化学的生成物、例えば生体分子のプロセシング、切断または消費によって産生されたあらゆる化合物を包含する。このような分子の例としては、これらに限定されないが、酸および関連化合物;モノ、ジ、およびトリカルボン酸(飽和、不飽和脂肪族および環式、アリール、アルカリル);アルド酸(aldo-acid)、ケト酸;ラクトン型;ジベレリン(gibbereillin);アブシジン酸;アルコール、ポリオール、誘導体、および関連化合物;エチルアルコール、ベンジルアルコール、メンタノール;プロピレングリコール、グリセロール、フィトール;イノシトール、フルフリルアルコール、メントール;アルデヒド、ケトン、キノン、誘導体、および関連化合物;アセトアルデヒド、ブチルアルデヒド、ベンズアルデヒド、アクロレイン、フルフラール、グリオキサール;アセトン、ブタノン;アントラキノン;炭水化物;単糖、二糖、三糖;アルカロイド、アミン、および他の塩基;ピリジン(ニコチン酸、ニコチンアミドなど);ピリミジン(シチジン、チミンなど);プリン(グアニン、アデニン、キサンチン/ヒポキサンチン、キネチンなど);ピロール;キノリン(イソキノリンなど);モルフィナン、トロパン、シンコナン;ヌクレオチド、オリゴヌクレオチド、誘導体、および関連化合物;グアノシン、シトシン、アデノシン、チミジン、イノシン;アミノ酸、オリゴペプチド(oligopepide)、誘導体、および関連化合物;エステル;フェノールおよび関連化合物;複素環式化合物および誘導体;ピロール、テトラピロール(コリノイドおよびポルフィン/ポルフィリン、w/w/o金属イオン);フラボノイド;インドール;脂質(脂肪酸およびトリグリセリドなど)、誘導体、および関連化合物;カロチノイド、フィトエン;およびステロール、テルペンなどのイソプレノイド;ならびに上記の分子の改変型が挙げられる。一部の実施形態において、代謝産物は、内因性物質の代謝生成物である。一部の実施形態において、代謝産物は、外因性物質の代謝生成物である。一部の実施形態において、代謝産物は、内因性物質および外因性物質の代謝生成物である。本明細書で使用される場合、用語「メタボローム」は、体液、細胞、組織、臓器、または生体中の代謝産物の化学的なプロファイルまたはフィンガープリントを指す。
代謝産物の分布曲線:本明細書で使用される場合、代謝産物の分布曲線は、集団密度(例えば、ASDまたはDD)に対してプロットされた代謝産物レベルから誘導された関数によって定義される確率分布曲線である。一部の実施形態において、分布曲線は、データの標準曲線の当てはめである。一部の実施形態において、分布曲線は、最小二乗多項式曲線の当てはめである。一部の実施形態において、分布曲線は、非対称、または非ガウス性である。一部の実施形態において、分布曲線は、単に関連する診断カテゴリー対代謝産物の値を用いたケースのプロット(例えば、「ラグプロット」)であり、この場合、曲線の当てはめはない。
相互情報量:本明細書で使用される場合、相互情報量は、2つの変数の相互依存性の尺度(すなわち、ある変数を知ることによって他の変数に関する不確実性を減らす程度)を指す。高い相互情報量は、不確実性の低減が大きいことを示し、低い相互情報量は、低減が小さいことを示し、2つの確率変数間の相互情報量がゼロであることは、その変数は独立していることを意味する。
非自閉症スペクトラム障害(非ASD):本明細書で使用される場合、非自閉症スペクトラム障害(非ASD)は、自閉症スペクトラム障害を有する子供または成人に属さない分類を指す。一部の実施形態において、「非ASD」は、正常に発達する対象である。一部の実施形態において、非ASD集団は、発達遅延(DD)を有する対象からなるかまたはそれを含む。一部の実施形態において、「非ASD」は、DDおよび正常に発達する対象の両方からなるかまたはそれを含む。
患者:本明細書で使用される場合、用語「患者」または「対象」は、例えば実験、診断、予防、および/または治療目的で試験もしくは組成物が投与されるかまたは投与され得るあらゆる生体を指す。一部の実施形態において、患者は、1つもしくは複数の障害もしくは状態に罹っているかまたは罹りやすい。一部の実施形態において、患者は、障害または状態の1つまたは複数の症状を呈する。一部の実施形態において、患者は、1つまたは複数の障害または状態を有することが疑われる。
予測可能性:本明細書で使用される場合、予測可能性は、対象の疾患の状態の正しい予測または予報を定性的または定量的のいずれかでなすことができる度合いを指す。パーフェクトな予測可能性は、厳密な決定論を意味するが、予測可能性の欠如は必ずしも決定論の欠如を意味しない。予測可能性への制限は、情報の欠如または過剰な複雑さなどの要因によって引き起こされる可能性がある。
予後および予測の情報:本明細書で使用される場合、予後および予測の情報という用語は、同義的に使用され、処置の非存在または存在下のいずれかにおける疾患または状態の経過のあらゆる態様を示すのに使用され得るあらゆる情報を指す。このような情報としては、これらに限定されないが、患者の疾患が治癒する尤度、患者の疾患が特定の療法に応答する尤度を挙げることができる(ここで応答は、様々な方法のいずれかで定義され得る)。予後および予測の情報は、診断情報の広範なカテゴリー内に包含される。
参照:用語「参照」は、本明細書において、目的の薬剤、個体、集団、試料、配列または値が比較される、標準または対照の薬剤、個体、集団、試料、配列または値を説明するのにしばしば使用される。一部の実施形態において、参照薬剤、個体、集団、試料、配列または値は、目的の薬剤、個体、集団、試料、配列または値の試験または決定と実質的に同時に試験および/または決定される。一部の実施形態において、参照薬剤、個体、集団、試料、配列または値は、ヒストリカルな参照であり、任意選択で有形のメディアで具現化される。典型的には、当業者により理解されるであろうが、参照薬剤、個体、集団、試料、配列または値は、目的の薬剤、個体、集団、試料、配列もしくは値を決定するかまたは特徴付けるために利用される条件に匹敵する条件下で決定されるかまたは特徴付けられる。
回帰分析:本明細書で使用される場合、「回帰分析」は、従属変数と1つまたは複数の独立変数との関係に焦点が当てられる場合に数種の変数をモデリングおよび分析するためのあらゆる技術を包含する。より具体的には、回帰分析は、独立変数のいずれか1つが変動して、他の独立変数が固定されたままの場合、どのように従属変数の典型的な値が変化するかを理解する助けになる。最も一般的には、回帰分析は、独立変数を考慮した従属変数の条件付き期待値、すなわち独立変数が固定されたままの場合の従属変数の平均値を推測する。あまり一般的ではないが、独立変数を考慮した従属変数の条件付き分布の分位数または他の位置パラメーターに焦点が当てられる。全てのケースにおいて、推測の標的は、回帰関数と呼ばれる独立変数の関数である。回帰分析において、回帰関数の周辺での従属変数の変動を特徴付けることも興味深く、これは、確率分布によって説明することができる。回帰分析は、その使用がどこで機械学習の分野と実質的なオーバーラップを有するかを予測および予報するために広く使用されている。回帰分析はまた、独立変数のなかでもどれが従属変数に関連するのかを理解すること、およびこれらの関係の形態を調査するのにも使用される。限定された環境において、回帰分析は、独立変数と従属変数との因果関係を推量するのに使用することができる。回帰分析を実行するための多数の技術が開発されてきた。線形回帰および通常の最小二乗回帰などのよく知られた方法は、回帰関数がデータから推測される有限数の未知のパラメーターに関して定義されるという点でパラメトリックである。ノンパラメトリック回帰は、関数の特定のセットに回帰関数を存在させる技術を指し、これは、無限次元であり得る。
リスク:文脈から理解されるであろうが、疾患、障害または状態の「リスク」は、特定の個体が、疾患、障害、もしくは状態と診断されるか、または疾患、障害、もしくは状態を発症する尤度の程度である。一部の実施形態において、リスクは、パーセンテージとして表現される。一部の実施形態において、リスクは、0、1、2、3、4、5、6、7、8、9、または10から、100%までである。一部の実施形態において、リスクは、参照試料または参照試料群と関連するリスクと比較したリスクとして表現される。一部の実施形態において、参照試料または参照試料群は、疾患、障害、または状態の公知のリスクを有する。一部の実施形態において、参照試料または参照試料群は、特定の個体と比較可能な個体に由来する。一部の実施形態において、相対的リスクは、0、1、2、3、4、5、6、7、8、9、10種またはそれ超である。一部の実施形態において、相対的リスクは、相対的リスク(RR)またはオッズ比(OR)として表現することができる。
試料:本明細書で使用される場合、用語「試料」は、典型的には、本明細書で説明されるような目的のソースから得られたまたは誘導された生体試料を指す。一部の実施形態において、目的のソースは、動物またはヒトなどの生体を含む。一部の実施形態において、生体試料は、生体組織もしくは体液であるか、またはそれを含む。一部の実施形態において、生体試料は、骨髄;血液;血漿;血清;血液細胞;腹水;組織または細針生検試料;細胞を含有する体液;遊離の核酸;痰;唾液;尿;髄液、腹腔液;胸膜液;便;リンパ液;婦人科系の流体;皮膚スワブ;膣スワブ;口腔スワブ;鼻スワブ;洗浄物または洗浄液、例えば管洗浄液または気管支肺胞の洗浄液;吸引物;剥離物;骨髄検体;組織生検検体;手術検体;便、他の体液、分泌物、および/もしくは排泄物;ならびに/またはそれらからの細胞などであってもよいし、またはそれらを含んでいてもよい。一部の実施形態において、生体試料は、個体から得られた細胞であるかまたはそれを含む。一部の実施形態において、得られた細胞は、試料を得た個体からの細胞であるかまたはそれを包含する。一部の実施形態において、試料は、あらゆる適切な手段によって目的のソースから直接得られた「一次試料」である。例えば、一部の実施形態において、一次生体試料は、生検(例えば、細針吸引または組織生検)、手術、体液(例えば、血液、リンパ液、便など)の収集などからなる群から選択される方法により得られる。一部の実施形態において、文脈から明らかであろうが、用語「試料」は、(例えば、一次試料の1種もしくは複数の成分を除去することによって、および/または一次試料に1種もしくは複数の薬剤を添加することによって)一次試料を処理することにより得られる調製物を指す。例えば、半透膜を使用してろ過すること。このような「処理された試料」は、例えば、試料から抽出された核酸もしくはタンパク質、または一次試料をmRNAの増幅もしくは逆転写などの技術に供することや、ある特定の成分を単離および/もしくは精製すること等によって得られた核酸もしくはタンパク質を含んでいてもよい。
対象:「対象」は、哺乳動物(例えば、ヒト、一部の実施形態では出生前のヒトの形態を含む)を意味する。一部の実施形態において、対象は、関連する疾患、障害または状態に罹っている。一部の実施形態において、対象は、疾患、障害、または状態に罹りやすい。一部の実施形態において、対象は、疾患、障害または状態の1つまたは複数の症状または特徴を呈する。一部の実施形態において、対象は、疾患、障害、または状態のいかなる症状も特徴も呈していない。一部の実施形態において、対象は、疾患、障害、または状態に対する感受性またはそのリスクに特徴的な1つまたは複数のフィーチャを有する者である。対象は、患者であってもよく、患者は、疾患の診断または処置のための医療提供者の診察を受けるヒトを指す。一部の実施形態において、対象は、療法が投与される個体である。
実質的に:本明細書で使用される場合、用語「実質的に」は、目的の特徴または特性の程度または度合いが完全かまたは完全に近いことを表す定性的な条件を指す。生物学的分野における当業者は、生物学的および化学的な現象が、完了に至る、および/または完璧な状態まで進行する、または絶対的な結果を達成もしくは回避することは、あったとしてもほぼ皆無であることを理解するであろう。したがって、用語「実質的に」は、本明細書では、多くの生物学的および化学的な現象において固有の完璧な状態の起こり得る欠如を捉えるために使用される。
〜に罹っている:疾患、障害、または状態「に罹っている」個体は、疾患、障害、もしくは状態と診断されている、および/または疾患、障害、もしくは状態の1つもしくは複数の症状もしくは特徴を呈するもしくは呈している。
〜に罹りやすい:疾患、障害、または状態「に罹りやすい」個体は、疾患、障害、または状態を発症するリスクがある。一部の実施形態において、このような個体は、関連する疾患、障害、および/または状態を発症するリスクの増加に統計学的に相関する1つまたは複数の感受性因子を有することがわかっている。一部の実施形態において、疾患、障害、または状態に罹りやすい個体は、疾患、障害、または状態のいかなる症状も呈していない。一部の実施形態において、疾患、障害、または状態に罹りやすい個体は、疾患、障害、および/もしくは状態と診断されたことがないか、またはまだ診断されたことがない。一部の実施形態において、疾患、障害、または状態に罹りやすい個体は、疾患、障害、または状態の発症に関連する条件に曝露されたことがある個体である。一部の実施形態において、疾患、障害、および/または状態を発症するリスクは、集団ベースのリスクである(例えば、アレルギーに罹った個体の家族の一員など)。
テール濃縮およびテール効果:本明細書で使用される場合、用語「テール濃縮」または「テール効果」は、代謝産物レベルの分布曲線の遠位部分における特定の集団からの、比較的高い濃度の試料を有する代謝産物(または他の分析物)によって表される分類を強化する特性を指す。「上のテール」または「右テール」は、平均より大きい分布曲線の遠位部分を指す。「下のテール」または「左テール」は、平均より低い分布曲線の遠位部分を指す。一部の実施形態において、テールは、ランキングに基づく予め決定された閾値の値によって決定される。例えば、ある特定の代謝産物に関する試料の測定値が、その代謝産物に関する集団において85から95(例えば、90)のパーセンタイルに対応する値より高い場合、またはその代謝産物に関する集団において10から20(例えば、15)パーセンタイルに対応する値より低い場合、その試料は、テール内にあると称される。
治療剤:本明細書で使用される場合、成句「治療剤」は、対象に投与されると、治療効果を有する、ならびに/または所望の生物学的および/もしくは薬理効果を惹起するあらゆる薬剤を指す。一部の実施形態において、薬剤が投与される特定の対象が所望のまたは有益な治療結果を経験するかどうかにかかわらず、関連集団への薬剤の投与が、集団における所望のまたは有益な治療結果と統計学的に相関する場合、その薬剤は治療剤とみなされる。
訓練セット:本明細書で使用される場合、「訓練セット」は、可能性がある予測的関係を発見するための、情報科学の様々な分野で使用されるデータのセットである。訓練セットは、人工知能、機械学習、遺伝的プログラミング、知能システム、および統計で使用される。これらの分野の全てにおいて、訓練セットは、ほとんど同じ役割を有し、試験セットと共に使用されることが多い。
試験セット:本明細書で使用される場合、「試験セット」は、予測的関係の強度および有用性を査定するための、情報科学の様々な分野で使用されるデータのセットである。試験セットは、人工知能、機械学習、遺伝的プログラミング、知能システム、および統計で使用される。これらの分野の全てにおいて、試験セットは、ほとんど同じ役割を有する。
処置:本明細書で使用される場合、用語「処置」(また「処置する」または「処置すること」)は、特定の疾患、障害、および/もしくは状態を、部分的もしくは完全に、軽減する、改善する、緩和する、抑制する、その発病を遅延させる、その重症度を低下させる、ならびに/または特定の疾患、障害、および/もしくは状態の1つもしくは複数の症状、フィーチャ、および/もしくは原因の頻度、発生率もしくは重症度を低下させる物質または療法(例えば、行動療法)のあらゆる投与を指す。このような処置は、関連する疾患、障害および/もしくは状態の徴候を表さない対象の処置であってもよいし、ならびに/または疾患、障害、および/もしくは状態の初期徴候のみを表す対象の処置であってもよい。代替として、または加えて、このような処置は、関連する疾患、障害および/または状態の1つまたは複数の確立された徴候を表す対象の処置であってもよい。一部の実施形態において、処置は、関連する疾患、障害、および/または状態に罹っていると診断された対象の処置であってもよい。一部の実施形態において、処置は、関連する疾患、障害、および/または状態の発症リスクの増加と統計学的に相関する1つまたは複数の感受性因子を有することがわかっている対象の処置であってもよい。
詳細な説明
本発明は、試料、例えば血液試料または血漿試料中の代謝産物レベルの特異的な分析に基づいて対象における自閉症スペクトラム障害(ASD)のリスクを決定するための方法およびシステムを提供する。以下の章で、本発明の様々な態様を詳細に説明する。章および見出しの使用は、本発明の限定を意味しない。各章は、本発明のあらゆる態様に当てはまり得る。本出願において、「または」の使用は、そうではないことが明らかでない限り、「および/または」を意味する。
自閉症スペクトラム障害
自閉症スペクトラム障害(ASD)の臨床診断のための基準は、Diagnostics and Statistical Manual of Mental Disorders、バージョン5(DSM−V、2013年5月公開)に記載されている。
ASDはさらに、例えば、DSM−IV−TRにより、自閉性障害、アスペルガー障害、レット障害、小児期崩壊性障害、および特定不能の広汎性発達障害(非定型自閉症など)を含むと特徴付けられている。
一部の実施形態において、ASDは、(i)ADOSにおけるコミュニケーションおよび社会的相互作用の総計に対する自閉症のカットオフを満たすスコア、ならびにADI−Rにおける≦36ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア;ならびに/または(ii)ADOSにおけるコミュニケーションおよび社会的相互作用の総計に対するASDカットオフを満たすスコア、ならびにADI−Rにおける≦36ヶ月での社会的相互作用、コミュニケーション、行動パターン、および発達異常に対するカットオフ値を満たすスコア、ならびに(ii)(a)ADI−Rにおける社会的相互作用およびコミュニケーションに関するカットオフ値を満たすスコア、または(ii)(b)社会的相互作用もしくはコミュニケーションに関するカットオフ値を満たすスコア、およびADI−Rにおける社会的相互作用もしくはコミュニケーションに対するカットオフ値の2ポイント(どちらもカットオフ値を満たしていない)以内であること、または(ii)(c)スコアは、ADI−Rにおける社会的相互作用およびコミュニケーションに関するカットオフ値の1ポイント以内であることによって特徴付けられる。
発達遅延
発達遅延は、小児発達の1つまたは複数のプロセス、例えば、ASDに起因しない、身体的発達、認知発達、コミュニケーションの発達、社会性もしくは情緒の発達、または適応性の発達などにおける重度または軽度の遅延である。一部の実施形態において、DDは、非自閉症(AU)および非ASDであり、(i)ミューレンスケールでは69もしくはそれより低いスコア、ヴァインランドスケールでは69もしくはそれより低いスコア、およびSCQでは14もしくはそれより低いスコア、または(ii)ミューレンもしくはヴァインランドのいずれかでは69もしくはそれより低いスコア、および他の査定ではカットオフ値の標準偏差の半分以内(77またはそれより低いスコア)を有することを特徴とする。ASDを有する個体が発達的に遅延しているとみなされる可能性があるとしても、ASDおよびDDの分類が相互排他的になるように、本明細書で使用されるASDの分類はDDの分類に勝るとみなされることになる。
ASDのリスク査定
言語、行動、または社会的な発達に障害のある症状を示す子供は、最も一般的には初期治療の環境でしばしば臨床医の診察を受けるが、臨床医は、その子供が、ASD、または何らかの他の状態、障害、もしくは分類(例えば、DD)を有するかどうかを決定することができない。特に大々的な言語発達前の年齢の子供を診断することは困難であり、多くの初期治療の医師は、自分の患者を示差的に診断する能力も力量も有していない。例えば、ASDは、他の発達障害、状態、または分類、例えばDDと容易に区別されない可能性がある。
対象におけるASDのリスク(非ASDおよびDDの確率など)を査定して、ASDをDDと識別することが有用である。ASDのリスク査定は、早期の介入および処置の機会をもたらす。例えば、専門外の医師が、専門家への照会を提案するためにASDリスク査定を使用することが可能である。専門家は、患者のさらなる評価に優先順位をつけるために、ASDリスク査定を使用することが可能である。ASDリスクの査定はまた、最終的な診断の前に暫定的な診断を確立するのに使用される場合もあり、その期間中に、高いリスクの子供とその子供の家族に促進的なサービスを提供することができる。
対象におけるASDのリスクを決定するための方法が本明細書で説明される。一部の実施形態において、ASDリスクの決定は、対象が、約50%より多くのASDを有する可能性を有することを決定することを包含する。一部の実施形態において、ASDリスクの決定は、対象が、約60%、65%、70%、74%、80%、85%、90%、95%、または98%より多くのASDを有する可能性を有することを決定することを包含する。一部の実施形態において、ASDリスクの決定は、対象がASDを有することを決定することを包含する。一部の実施形態において、ASDリスクの決定は、対象がASDを有さない(すなわち、非ASDである)ことを決定することを包含する。
一部の実施形態において、本発明は、対象においてASDを非ASD分類(例えば、DD)と識別するための方法を提供する。一部の実施形態において、ASDを非ASD分類/状態と識別することは、対象が、非ASD分類ではなく、約60%、65%、70%、74%、80%、85%、90%、95%、または98%より多くのASDを有する可能性(すなわち、ASDを有し非ASD分類を有さない可能性)を有することを決定することを包含する。一部の実施形態において、非ASD分類は、DDである。一部の実施形態において、非ASD分類は、「正常」である。
一部の実施形態において、本発明は、対象がASDもDDも有さないことを決定するための方法を提供する。
分析方法
ASDリスクを査定するか、またはASDを他の非ASD発達障害と識別するための方法が本明細書で説明される。一部の実施形態において、リスク査定は、対象からの試料、例えば血液試料中の代謝産物の測定および特徴付けに(少なくとも部分的に)基づく。一部の実施形態において、血漿試料を血液試料から得て、血漿試料を分析する。
代謝産物は、クロマトグラフィーおよび/または質量分析、蛍光測定法、電気泳動、免疫親和性、ハイブリダイゼーション、免疫化学、紫外線分光法(UV)、蛍光分析、放射化学分析、近赤外分光法(近IR)、核磁気共鳴分光法(NMR)、光散乱分析(LS)、および比濁分析に基づくアッセイなどの様々な方法で検出することができる。
一部の実施形態において、代謝産物は、単独の、または質量分析と組み合わされた、液体もしくはガスクロマトグラフィーまたはイオン移動度(電気泳動)によって、または質量分析単独によって分析される。このような方法は、細胞の代謝産物などの生体分子を同定および定量化するのに使用されている。(例えば、Liら、2000年;Rowleyら、2000年;およびKusterおよびMann、1998年を参照)。質量分析方法は、例えば、単独、二重または三重の質量対電荷スキャニングおよび/またはフィルタリング(MS、MS/MS、またはMS3)を用いた、四重極、イオントラップ、または飛行時間型質量分析に基づき得、それに先行して、適切なイオン化方法、例えばエレクトロスプレーイオン化、大気圧化学イオン化、大気圧光イオン化、マトリックス支援レーザー脱離イオン化(MALDI)、または表面増強レーザー脱離イオン化(SELDI)が行われてもよい。(例えば、国際特許出願公報WO2004056456号およびWO2004088309号を参照)。一部の実施形態において、生体試料からの代謝産物の第1の選別は、ガスもしくは液体クロマトグラフィーまたはイオン移動度/電気泳動を使用することによって達成することができる。一部の実施形態において、質量分析手順のためのイオン化は、エレクトロスプレーイオン化、大気圧化学イオン化、または大気圧光イオン化によって達成することができる。一部の実施形態において、質量分析機器としては、四重極、イオントラップ、または飛行時間型、またはフーリエ変換の機器が挙げられる。
一部の実施形態において、代謝産物は、生物系の小分子補体の同定および相対的定量化に最適化された、非標的化超高速液体もしくはガスクロマトグラフィー/エレクトロスプレーまたは大気圧化学イオン化タンデム質量分析のプラットフォームを介して、質量スケールで分析される。(例えば、Evansら、Anal. Chem.、2009年、81巻、6656〜6667頁を参照)。
一部の実施形態において、生体試料からの代謝産物の第1の選別は、ガスもしくは液体クロマトグラフィーまたはイオン移動度/電気泳動を使用することによって達成できる。一部の実施形態において、質量分析手順のためのイオン化は、エレクトロスプレーイオン化、大気圧化学イオン化、または大気圧光イオン化によって達成することができる。一部の実施形態において、質量分析機器としては、四重極、イオントラップ、または飛行時間型、またはフーリエ変換の機器が挙げられる。
一部の実施形態において、目的の代謝産物を含有する血液試料を遠心分離して、他の血液成分から血漿を分離する。ある特定の実施形態において、内部標準は不必要である。一部の実施形態において、血漿(その一部)に、規定量の内部標準を添加し、次いでメタノールを添加して、タンパク質などの血漿成分を沈殿させる。沈殿物を、遠心分離によって上清から分離し、上清を回収する。より正確な検出のために目的の代謝産物の濃度を増加させたい場合、上清を蒸発させて、残留物を適切な量の溶媒に溶解させる。目的の代謝産物の濃度が不必要に高い場合、上清を適切な溶媒で希釈する。適切な量の代謝産物含有試料を、移動相Aおよび移動相Bの適切な混合物で平衡化した液体クロマトグラフィーカラムにローディングする。逆相液体クロマトグラフィーの場合、移動相Aは、典型的には、ギ酸などの少量の添加剤を含むまたは含まない水であり、移動相Bは、典型的には、メタノールまたはアセトニトリルである。適切な勾配の移動相Aおよび移動相Bを、カラムにポンプ注入して、保持時間、またはカラムからの溶出時間によって目的の代謝産物の分離を達成する。カラムから代謝産物が溶出すると、それらはイオン化され、気相に運ばれ、イオンが検出されて、質量分析によって定量化される。検出の特異性は、特異的な前駆イオンおよび前駆イオンから生成した特異的な生成物イオンに対して二重のフィルタリングを行うことによって達成される。目的の代謝産物から誘導されたイオンカウントを、所与の代謝産物に関して公知の量の内部標準から誘導されたイオンカウントに標準化すること、ならびに標準化したイオンカウントを、公知の量の純粋な代謝産物および内部標準を用いて確立された検量線と比較することによって、絶対定量を達成することができる。内部標準は、典型的には、純粋な代謝産物の安定同位体で標識された形態、または代謝産物の構造類似体の純粋な形態である。代わりに、任意単位の所与の代謝産物の相対的定量化は、選択された内部基準値(例えば、所与の群から発生した全試料における代謝産物レベルの中央値)に標準化することによって計算される場合がある。
一部の実施形態において、1つまたは複数の代謝産物は、イムノアッセイによって測定される。多数の特異的イムノアッセイ様式およびそれらのバリエーションを代謝産物の測定に利用することができる。(例えば、E. Maggio、Enzyme-Immunoassay、(1980年)(CRC Press, Inc.、Boca Raton、Fla.)を参照されたい;米国特許第4,727,022号「Methods forModulating Ligand-Receptor Interactions and their Application」;米国特許第4,659,678号「Immunoassay of Antigens」;米国特許第4,376,110号「ImmunometricAssays Using Monoclonal Antibodies」;米国特許第4,275,149号「MacromolecularEnvironment Control in Specific Receptor Assays」;米国特許第4,233,402号「Reagents and Method Employing Channeling」、および米国特許第4,230,767号「Heterogenous Specific Binding Assay Employing a Coenzyme as Label」も参照されたい)。抗体は、不動的な結合などの公知の技術に従って、診断アッセイに好適な固体支持体(例えば、プロテインAまたはプロテインGアガロースなどのビーズ、ラテックスまたはポリスチレンなどの材料で形成された、マイクロスフェア、プレート、スライド、またはウェル)にコンジュゲートされていてもよい。本明細書で説明される抗体は同様に、公知の技術に従って、放射標識(例えば、35S、125I、131I)、酵素標識(例えば、ホースラディッシュペルオキシダーゼ、アルカリホスファターゼ)、および蛍光標識(例えば、フルオレセイン、Alexa、緑色蛍光タンパク質)などの検出可能な標識または基にコンジュゲートされていてもよい。
ASDリスクの決定
一部の実施形態において、本発明の方法は、現時点ではASDおよび/または他の発達障害の徴候も症状も表していない可能性があるが、それにもかかわらずASDおよび/または他の発達障害を有するかまたは発症するリスクを有する可能性がある対象から得られた試料中の代謝産物レベルを測定することに少なくとも部分的に基づいて、当業者が対象を同定する、診断する、または別の方法で査定することを可能にする。
ある特定の実施形態において、代謝産物または他の分析物のレベル(例えば、プロテオームまたはゲノム情報)を試験試料中で測定し、正常な対照レベル、またはASDではない発達障害、状態、もしくは分類(例えば、非ASD発達遅延、DD)を有する対象におけるレベルと比較することができる。一部の実施形態において、用語「正常な対照レベル」は、典型的にはASDに罹っていないかまたはASDもしくは他の発達障害を有する可能性が低い対象で見出される、1つまたは複数の代謝産物、もしくは他の分析物のレベル、または指標を指す。一部の実施形態において、正常な対照レベルは、範囲または指標である。一部の実施形態において、正常な対照レベルは、前もって試験された対象のデータベースから決定される。正常な対照レベルと比較して、1つまたは複数の代謝産物、または他の分析物のレベルに差があることは、対象がASDを有するかまたはASDを発症するリスクがあることを示す可能性がある。逆に言えば、1つまたは複数の代謝産物、または他の分析物の正常な対照レベルと比較して、1つまたは複数の代謝産物のレベルに差がないことは、対象がASDを有さないか、またはASDを発症するリスクが低いことを示す可能性がある。
一部の実施形態において、参照値は、診断がわかっている(すなわち、ASDに罹っていると診断もしくは同定されているか、またはASDに罹っていると診断もしくは同定されていない)対照対象または集団から得られた値である。一部の実施形態において、参照値は、指標値またはベースライン値であり、例えば、本明細書で説明される「正常な対照レベル」である。一部の実施形態において、参照試料または指標値またはベースライン値は、ASDの処置を受けている1人もしくは複数の対象から採取もしくは誘導されるか、またはASDを発症するリスクが低い1人もしくは複数の対象から採取もしくは誘導されてもよいし、または処置を受けた結果としてASDリスク因子における改善を示した対象から採取もしくは誘導されてもよい。一部の実施形態において、参照試料または指標値またはベースライン値は、ASDの処置を受けていない1人または複数の対象から採取または誘導される。一部の実施形態において、試料は、ASDの最初の処置および/または処置の進行をモニターするためのそれに続くASDの処置を受けた対象から収集される。一部の実施形態において、参照値は、ASDの集団研究からのリスク予測アルゴリズムまたはコンピューターで計算した指標から誘導されたものである。一部の実施形態において、参照値は、ASD以外の疾患または障害、例えば別の発達障害、例えば、非ASD発達遅延(DD)を有する対象または集団からのものである。
一部の実施形態において、本発明の方法によって測定された代謝産物のレベルにおける差は、正常な対照レベル、参照値、指標値、またはベースライン値と比較した代謝産物のレベルの増加または減少を含む。一部の実施形態において、正常な対照集団、一般集団、または別の疾患を有する集団からの参照値に対する代謝産物のレベルの増加または減少は、ASDの存在、ASDの進行、ASDの悪化またはASDもしくはASDの症状の改善の指標である。一部の実施形態において、正常な対照集団、一般集団、または別の疾患を有する集団からの参照値に対する代謝産物のレベルの増加または減少は、ASDまたはそれに関連する合併症を発症するリスクの増加または減少の指標である。増加または減少は、ASDのための1つもしくは複数の処置レジメンの成功の指標である可能性があり、またはASDリスク因子の改善もしくは後退を示す可能性もある。増加または減少は、例えば、参照値の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、または少なくとも50%であり得る。
一部の実施形態において、本明細書で説明される代謝産物のレベルにおける差は、統計学的に有意な差である。「統計学的に有意な」は、単独で偶然起こると予想される差より大きい差を指す。統計学的有意性は、当業界において公知のあらゆる方法によって決定することができる。例えば、統計学的有意性は、p値によって決定することができる。p値は、実験中の群間差が偶然起こる確率の尺度である。例えば、0.01のp値は、偶然起こった結果が100回に1回であることを意味する。p値が小さいほど、群間で測定された差が偶然ではない可能性がより高くなる。p値が0.05またはそれ未満である場合、差は統計学的に有意であるとみなされる。一部の実施形態において、統計学的に有意なp値は、0.04、0.03、0.02、0.01、0.005、もしくは0.001またはそれ未満である。一部の実施形態において、統計学的に有意なp値は、0.30、0.25、0.20、0.15、もしくは0.10またはそれ未満である(例えば、単一の特定の代謝産物が、他の代謝産物を包含する分類器に使用される場合に付加的な予測値を有するかどうかを同定するケースにおいて)。一部の実施形態において、p値は、t検定によって決定される。一部の実施形態において、p値は、フィッシャーの検定により得られる。一部の実施形態において、統計学的有意性は、パネル中の数種の代謝産物の組合せの分析によって達成され、数学的なアルゴリズムと組み合わせて、統計学的に有意なリスク予測が達成される。
分類試験、アッセイ、または方法は、真陽性率(感度)に対して偽陽性率(1−特異度)をプロットした関連するROC曲線(受信者動作特性曲線)を有する。ROC曲線下の面積(AUC)は、分類器が2つの診断群をどの程度うまく区別することができるかの尺度である。最大のAUCは、1.0(パーフェクトな試験)であり、最小の面積は、0.5(例えば正常と疾患とで差がない面積)である。AUCが1に近づくにつれて、試験の精度が増加することが認められる。
一部の実施形態において、高度なリスク予測の精度は、AUCが少なくとも0.60である試験またはアッセイである。一部の実施形態において、高度なリスク予測の精度は、AUCが少なくとも0.65、少なくとも0.70、少なくとも0.75、少なくとも0.80、少なくとも0.85、少なくとも0.90、または少なくとも0.95である試験またはアッセイである。
テール効果の査定によるASDリスクの予測
一部の実施形態において、代謝産物レベルの平均差は、集団内もしくは集団間、例えばASD集団とDD集団との間で、または正常な対照集団と比較して査定される。一部の実施形態において、所与の集団(すなわち、ASD)の試料からの代謝産物が、分布曲線のテールにおける濃縮に関して査定される。すなわちこれは、第2の集団(例えば、DD)と比較して指定された集団(例えば、ASD)からの試料のより大きい比率が分布曲線のテールに存在するかどうか(すなわち、「テール効果」)を決定することである。一部の実施形態において、平均差とテール効果の両方が同定され、利用される。一部の実施形態において、テールは、予め決定された閾値の値によって決定される。例えば、ある特定の代謝産物に関する試料の測定値が、その代謝産物に関する集団において90パーセンタイルに対応する値より高い場合(右テールまたは上のテール)、または15パーセンタイルに対応する値より低い場合(左テールまたは下のテール)、その試料は、テール内にあると称される。一部の実施形態において、所与の代謝産物に関する右(上の)テールの閾値は、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、または99パーセンタイルに対応する値である(例えば、この場合、所与の代謝産物に関する試料の測定値が、このパーセンタイルに関連する値より高い場合、試料は、右テール内にあると称される)。一部の実施形態において、所与の代謝産物に関する左(下の)テールの閾値は、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、または1パーセンタイルに対応する値である(例えば、この場合、所与の代謝産物に関する試料の測定値が、このパーセンタイルに関連する値よりも低い場合、試料は、左テール内にあると称される)。示されるパーセンタイル値は、小数値を含む。
一部の実施形態において、分布曲線は、1つまたは複数の集団の代謝産物レベルのプロットから生成される。一部の実施形態において、分布曲線は、単一の参照集団、例えば一般集団から生成される。一部の実施形態において、分布曲線は、2つの集団、例えば、ASD集団およびDDなどの非ASD集団から作成される。一部の実施形態において、分布曲線は、3つまたはそれより多くの集団、例えば、ASD集団、非ASDであるがDDなどの別の発達障害/状態/分類を有する集団、および健康な(例えば、発達障害がない)対照集団から作成される。集団のそれぞれからの代謝産物の分布曲線は、1つより多くのリスク査定(例えばASDを診断すること、DDを診断すること、ASDとDDとを識別すること)を行うのに利用することができる。本明細書で説明されるテール効果を利用する査定のための方法は、2つより多くの集団に適用され得る。
一部の実施形態において、複数の代謝産物およびそれらの分布は、リスク査定に使用される。一部の実施形態において、2種またはそれより多くの代謝産物のレベルは、ASDリスクを予測するのに利用される。一部の実施形態において、代謝産物の少なくとも2つは、表1で列挙した代謝産物から選択される。一部の実施形態において、代謝産物の少なくとも3つは、表1で列挙した代謝産物から選択される。一部の実施形態において、表1で列挙した代謝産物から選択される4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、または21種の代謝産物は、ASDリスクを予測するのに使用される。
表1(表1Aから1C)のさらなる議論は、以下の実施例の章に示す。
一部の実施形態において、分析のための少なくとも2種の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、p−クレゾールスルフェート、イソバレリルグリシン、ガンマ−CEHC、インドールアセテート、ピペコレート、1,5−アンヒドログルシトール(1,5−AG)、ラクテート、3−(3−ヒドロキシフェニル)プロピオネート、3−インドキシルスルフェート、パントテネート(ビタミンB5)、ヒドロキシ−クロロタロニル、およびそれらの組合せからなる群から選択される。
一部の実施形態において、分析のための少なくとも3種の代謝産物は、フェニルアセチルグルタミン、キサンチン、オクテノイルカルニチン、p−クレゾールスルフェート、イソバレリルグリシン、ガンマ−CEHC、インドールアセテート、ピペコレート、1,5−アンヒドログルシトール(1,5−AG)、ラクテート、3−(3−ヒドロキシフェニル)プロピオネート、3−インドキシルスルフェート、パントテネート(ビタミンB5)、ヒドロキシ−クロロタロニル、およびそれらの組合せからなる群から選択される。
一部の実施形態において、代謝産物の特定のセットに関するテール効果の欠如についての情報がリスク査定に使用される。一部の実施形態において、テール効果の欠如は、ゼロの結果(すなわち、陰性情報とは対照的に、情報がないこと)を提供するために決定される。一部の実施形態において、テール効果の欠如は、他方の分類に対して一方の分類の指標であると決定される(例えば、ASDに対してよりDDの指標である)。
一部の実施形態において、分布曲線は、非対称または非ガウス性である。一部の実施形態において、分布曲線は、パラメトリックな分布パターンに従っていない。
一部の実施形態において、平均差からの情報(例えば、平均シフト)は、リスク査定のためのテール効果の情報と組み合わされる。一部の実施形態において、平均差からの情報は、テール効果の情報を使用せずにリスク査定のために使用される。
一部の実施形態において、代謝産物の分析は、ASDまたは他の障害に関する対象のリスクを決定するために、他のタイプの情報、例えば、遺伝情報、人口統計情報、および/または行動の査定と組み合わされる。
一部の実施形態において、ASDリスク査定は、対象から得られた生体試料(例えば、血液、血漿、尿、唾液、便)中のある特定の代謝産物の測定された量に少なくとも部分的に基づいて行われ、その場合、ある特定の代謝産物は、「テール効果」を表すことがここで見出されている。テール効果と関連する2つの集団間の統計学的に有意な平均シフトが必ずしもあるわけではないことが本発明者らによって見出されている。したがって、テール効果は、平均シフトとは異なる特殊な現象である。
ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、非ASD集団(例えば、DD集団)に対してASDの指標である右テール効果を表す:
・非ASD集団分布曲線が、非ASD集団(例えば、DD集団)における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;
・ASD集団分布曲線が、ASD集団における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;ならびに
・非ASD集団分布曲線およびASD集団分布曲線が、(A)および(B)の一方または両方が維持されることを特徴とする:
○(A)(i)xが代謝産物のレベルnより大きい場合のASD集団分布曲線下の面積の(ii)xが代謝産物のレベルnより大きい場合の非ASD集団分布曲線下の面積に対する比率が、150%より大きく(例えば、>200%、>300%、>500%、>1000%など)、それによって代謝産物のレベルnより大きい試料についてASD分類と非ASD分類とを識別するための予測の有用性がもたらされること、および
○(B)n’が、分布曲線を作成するのに使用される組み合わされた非ASDおよびASD集団の上位の十分位数(または約5%から約20%までのあらゆるカットオフ)に対応する最小の閾値の代謝産物レベルである場合、未知の試料(例えば、等しい数のASDおよび非ASDメンバーを有する集団から選択されるランダムな試料)が、少なくともn’の代謝産物レベルを有し、ASD対非ASDである試料のオッズが、1.6:1以上であり(例えば、2:1以上、3:1以上、4:1以上、5:1以上、6:1以上、7:1以上、8:1以上、9:1以上、または10:1以上)(例えば、p<0.3、p<0.2、p<0.1、p<0.05、p<0.03、またはp<0.01の場合、例えば、統計学的に有意な分類である)、それによって代謝産物のレベルn’より大きい試料についてASD分類と非ASD分類とを識別するための予測の有用性がもたらされること。
ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、非ASD集団(例えば、DD集団)に対してASDの指標である左テール効果を表す:
・非ASD集団分布曲線が、非ASD集団(例えば、DD集団)における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;
・ASD集団分布曲線が、ASD集団における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;ならびに
・非ASD集団分布曲線およびASD集団分布曲線が、(A)および(B)の一方または両方が維持されることを特徴とする:
○(A)(i)xが代謝産物のレベルmより小さい場合のASD集団分布曲線下の面積の(ii)xが代謝産物のレベルmより小さい場合の非ASD集団分布曲線下の面積に対する比率が、150%より大きく(例えば、>200%、>300%、>500%、>1000%など)、それによって代謝産物のレベルmより小さい試料についてASD分類と非ASD分類とを識別するための予測の有用性がもたらされること、および
○(B)m’が、分布曲線を作成するのに使用される組み合わされた非ASDおよびASD集団の下位の十分位数(または約5%から約20%までのあらゆるカットオフ)に対応する最大の閾値の代謝産物レベルである場合、未知の試料(例えば、等しい数のASDおよび非ASDメンバーを有する集団から選択されるランダムな試料)が、m’未満の代謝産物レベルを有し、ASD対非ASDである試料のオッズが、1.6:1以上であり(例えば、2:1以上、3:1以上、4:1以上、5:1以上、6:1以上、7:1以上、8:1以上、9:1以上、または10:1以上)(例えば、p<0.3、p<0.2、p<0.1、p<0.05、p<0.03、またはp<0.01の場合、例えば、統計学的に有意な分類である)、それによって代謝産物のレベルm’より小さい試料についてASD分類と非ASD分類とを識別するための予測の有用性がもたらされること。
ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、ASD集団に対して非ASD(例えば、DD)の指標である右テール効果を表す:
・非ASD集団分布曲線が、非ASD集団(例えば、DD集団)における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;
・ASD集団分布曲線が、ASD集団における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;ならびに
・非ASD集団分布曲線およびASD集団分布曲線が、(A)および(B)の一方または両方が維持されることを特徴とする:
○(A)(i)xが代謝産物のレベルnより大きい場合の非ASD集団分布曲線下の面積の(ii)xが代謝産物のレベルnより大きい場合のASD集団分布曲線下の面積に対する比率が、150%より大きく(例えば、>200%、>300%、>500%、>1000%など)、それによって代謝産物のレベルnより大きい試料について非ASD分類とASD分類とを識別するための予測の有用性がもたらされること、および
○(B)n’が、分布曲線を作成するのに使用される組み合わされた非ASDおよびASD集団の上位の十分位数(または約5%から約20%までのあらゆるカットオフ)に対応する最小の閾値の代謝産物レベルである場合、未知の試料(例えば、等しい数のASDおよび非ASDメンバーを有する集団から選択されるランダムな試料)が、n’より大きい代謝産物レベルを有し、非ASD対ASDである試料のオッズが、1.6:1以上であり(例えば、2:1以上、3:1以上、4:1以上、5:1以上、6:1以上、7:1以上、8:1以上、9:1以上、または10:1以上)(例えば、p<0.3、p<0.2、p<0.1、p<0.05、p<0.03、またはp<0.01の場合、例えば、統計学的に有意な分類である)、それによって代謝産物のレベルn’より大きい試料について非ASD分類とASD分類とを識別するための予測の有用性がもたらされること。
ある特定の実施形態において、特定の代謝産物が以下のように特徴付けられる場合、その代謝産物は、ASD集団に対して非ASD(例えば、DD)の指標である左テール効果を表す:
・非ASD集団分布曲線が、非ASD集団(例えば、DD集団)における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;
・ASD集団分布曲線が、ASD集団における代謝産物について確立され、x軸は第1の代謝産物のレベルを示し、y軸は対応する集団を示す;ならびに
・非ASD集団分布曲線およびASD集団分布曲線が、(A)および(B)の一方または両方が維持されることを特徴とする:
○(A)(i)xが代謝産物のレベルmより小さい場合の非ASD集団分布曲線下の面積の(ii)xが代謝産物のレベルmより小さい場合のASD集団分布曲線下の面積に対する比率が、150%より大きく(例えば、>200%、>300%、>500%、>1000%など)、それによって代謝産物のレベルmより小さい試料について非ASD分類とASD分類とを識別するための予測の有用性がもたらされること、および
○(B)m’が、分布曲線を作成するのに使用される組み合わされた非ASDおよびASD集団の下位の十分位数(または約5%から約20%までのあらゆるカットオフ)に対応する最大の閾値の代謝産物レベルである場合、未知の試料(例えば、等しい数のASDおよび非ASDメンバーを有する集団から選択されるランダムな試料)が、m’未満の代謝産物レベルを有し、非ASD対ASDである試料のオッズが、1.6:1以上であり(例えば、2:1以上、3:1以上、4:1以上、5:1以上、6:1以上、7:1以上、8:1以上、9:1以上、または10:1以上)(例えば、p<0.3、p<0.2、p<0.1、p<0.05、p<0.03、またはp<0.01の場合、例えば、統計学的に有意な分類である)、それによって代謝産物のレベルm’より小さい試料について非ASD分類とASD分類とを識別するための予測の有用性がもたらされること。
ある特定の実施形態において、リスク査定は、テール効果を表す複数の代謝産物を使用して行われる。ASDの査定のために、相補的な診断/リスク査定情報を提供する代謝産物(例えば、2種またはそれより多くの代謝産物)の特定の群が存在することが観察されている。例えば、第1の代謝産物のレベルの分析によって同定可能なASD陽性個体(例えば、第1の代謝産物の同定されたテール内の個体)は、第2の代謝産物の分析によって同定可能な同じASD陽性個体ではない(または低いがゼロではない程度のオーバーラップが存在する可能性がある)。第1の代謝産物のテールは、ある特定のASD個体を予測するが、第2の代謝産物のテールは、他のASD個体を予測する。特定の理論に縛られることは望まないが、この発見は、ASDそれ自身の多面的な性質を反映している可能性がある。
したがって、ある特定の実施形態において、リスク査定方法は、対象が複数の代謝産物を含む多数の同定された代謝産物テールのいずれかに当てはまるかどうかを同定するステップ、例えば、異なる代謝産物テールの予測変数が少なくとも部分的に排反する場合、例えば、複数の代謝産物が低い相互情報量で取り入れられることによってリスク予測が改善されるように、それらが低い相互情報量を有する場合を同定するステップを包含する。
一部の実施形態において、本発明は、ASDを有するかまたはASDを有するリスクがある対象を決定/診断する方法で使用するための、1つまたは複数の結合メンバーを提供し、各結合メンバーは、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される代謝産物に特異的に結合することが可能である。
一部の実施形態において、本発明は、ASDを有するかまたはASDを有するリスクがある対象を診断/決定するための結合メンバーの1つまたは複数の使用であって、前記結合メンバーが、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される代謝産物に特異的に結合することが可能である、使用を提供する。
結合メンバーは、核酸分子、タンパク質、ペプチド、抗体またはそれらの断片からなる群から選択されてもよく、これらは全て、特異的な代謝産物に結合することが可能である。ある特定の実施形態において、結合メンバーは、結合した代謝産物の検出およびそのレベルの決定に役立つように標識されていてもよい。
本発明は、固体支持体に固定された複数の結合メンバーであって、5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択され、前記固体支持体上の結合メンバーの集団の少なくとも20%、30%、40%、50%、60%、70%、80%、または90%を構成する、結合メンバーをさらに提供する。
一部の実施形態において、本発明は、本明細書で説明される方法を実行するための、特にASDを有するかまたはASDを有するリスクがあると対象を決定/診断するためのキットを提供する。キットは、使用者が、試験中の試料における5−ヒドロキシインドールアセテート(5−HIAA)、1,5−アンヒドログルシトール(1,5−AG)、3−(3−ヒドロキシフェニル)プロピオネート、3−カルボキシ−4−メチル−5−プロピル−2−フランプロパノエート(CMPF)、3−インドキシルスルフェート、4−エチルフェニルスルフェート、8−ヒドロキシオクタノエート、ガンマ−CEHC、ヒドロキシイソバレロイルカルニチン(C5)、インドールアセテート、イソバレリルグリシン、ラクテート、N1−メチル−2−ピリドン−5−カルボキサミド、p−クレゾールスルフェート、パントテネート(ビタミンB5)、フェニルアセチルグルタミン、ピペコレート、キサンチン、ヒドロキシ−クロロタロニル、オクテノイルカルニチン、および3−ヒドロキシヒプレートからなる群から選択される1つまたは複数の代謝産物の存在、レベル(上昇または低下)を決定することを可能にし、キットは、(a)それぞれ独立して、そこに固定された前記1つまたは複数の代謝産物の1種に特異的である複数の結合メンバーを有する固体支持体;(b)標識を含む展開剤;ならびに任意選択で(c)洗浄溶液、希釈液および緩衝液からなる群から選択される1つまたは複数の成分を含む。
対象
単発的な運動障害以外の可能性のある発達障害を評価するために19の発達評価センターへと照会された18ヶ月齢から60ヶ月齢の間の対象から、血液試料を収集した。全ての対象についてインフォームドコンセントを得た。小児発達評価を専門とする診療施設から事前にASDと診断された対象、または研究手順を完了することができないかまたはそれを望んでいない対象を、研究から排除した。
対象は、SynapDx自閉症スペクトラム障害遺伝子発現分析(STORY)研究に登録された対象である。STORY研究は、医薬品の臨床試験の実施に関する基準(Good Clinical Practice:GCP)における現行のICHガイドラインと適用可能な規制上の要件に従って行われた。GCPは、ヒト対象の参加を伴う研究を設計する、実行する、記録する、および報告するための国際的な倫理上のおよび科学的な品質規格である。この規格の順守は、ヘルシンキ宣言を元にした指針と一致して、研究対象の権利、安全性、および満足のいく状態が保護され、臨床研究データが信用できるものであるということを公に保証する。
図1から12に示した結果は、STORY研究における男性からの180個の血液試料に基づく。試料セットは、122個のASD試料および58個のDD(非ASD)試料を包含していた。ASD診断は、DSM−V診断基準に従った。追加の結果は、STORY研究における男性対象からの299個の血液試料のより広範なセットに基づく。より広範な試料セットは、198個のASD試料および101個のDD試料を包含していた。
全ての試験につき、およそ3mLの血液試料をEDTAチューブ中に収集し、チューブを遠心分離することによって血漿を調製した。次いで血漿を凍結し、分析のための実験室に送った。実験室で、試料のメタノール抽出を実行し、最適化された超高速液体またはガスクロマトグラフィー/タンデム質量分析(UHPLC/MS/MSまたはGC/MS/MS)方法によって抽出物を分析した(例えば、Anal. Chem.、2009年、81巻、6656〜6667頁を参照)。
データ分析
男性および女性対象の両方について血液試料中の代謝産物を定量化した。試料を代謝産物のレベルに関してアッセイし、所与の日に測定された全試料の中央値濃度に標準化した任意単位の濃度として定量化した。例えば、1より大きい単位は、その日の試料の中央値より大きい代謝産物の量を指し、1未満の単位は、中央値未満である量を指す。次いでクロス検証を実行し、ここで試料を、オーバーラップしない訓練/試験セットにランダムに分割し、そのセットで機械学習分類器の不偏の性能を評価した。ASD予測について、特に男性対象において個々にかつ集合的に高い情報的価値がある21種の代謝産物が同定された。
(実施例1)
代謝産物レベルの情報の見極め
この実施例は、ASDのリスク査定のための有用な情報は、従来の分析(例えば、平均シフトベースの分析)ではさもなければ見失っていたであろう試料の分布におけるテール効果の同定および分析を見極めることができることを示す。
代謝産物レベルが一度決定されれば、平均シフトおよびテール効果などリスク査定のための情報を実行する方法は複数ある。単独で平均シフトが見出され、最適ではないがいくつかの予測情報が提供された。図1に、例示的な平均シフトを示す。この図において、ASD分布は非ASD分布(DD)の右にシフトしている。
従来の平均シフト分析に加えて、本発明者らは、試料から追加の情報を見極めた。ASDおよび非ASD(ここではDD)試料について代謝産物の分布曲線をプロットしたところ、測定された代謝産物のサブセットについて、ASDまたはDD集団のいずれかからの試料が右(上の)または左(下の)テールにおいて濃縮されていたこと(すなわち、テール効果)が発見された。図2に、代表的なテール効果を示す。注目すべきことに、2つの分布は、ほぼ同一な平均値を共有していた(すなわち、最小の平均シフトがあるかまたは平均シフトがなかった)。したがって、代謝産物の予測値は、平均シフトの従来の分析から見極めることができないであろう。
代謝産物は、右(上の)テール効果、または左(下の)テール効果、または両方を表す可能性がある。図3に、代表的な代謝産物である5−HIAAについてのASDおよび非ASD(ここではDD)の分布曲線を示す。明らかな右テール効果が観察され、例えばASD分布は、右テールでより大きいAUCを有する。したがって、この代謝産物が高いレベルの試料は、ASD集団のメンバーで高度に濃縮されることが実証される。この代謝産物を用いれば、平均シフト(t検定値によって示される)および右テール(「極値」のフィッシャー検定値によって示される)の両方は、統計学的に有意である。
図4に、別の例示的な代謝産物であるガンマ−CEHCについてのASDおよび非ASD(ここではDD)の分布曲線を示す。明らかな左テール効果が観察され、例えば、ASD分布は、左テールでより大きいAUCを有する。したがって、この代謝産物のレベルが低い試料は、ASD集団のメンバーで高度に濃縮されることが実証される。この代謝産物を用いれば、平均シフト(t検定値によって示される)は、統計学的に有意ではないが、左テールは統計学的に有意である。
これらのデータから、テール効果の同定および分析は、従来の平均シフト分析では得ることができないリスク査定のための追加の情報を提供することが示される。
(実施例2)
テール効果を実証する選択された代謝産物からのASDの強力な予測
この実施例は、ASDの予測のためのテール効果の査定を例示する。本発明者らは、男性対象から得られた試料におけるいくつかの代謝産物に関する統計学的に有意なテール効果を同定した。テール効果は、対象がどの集団に属するのか、すなわちASD集団またはDD集団に属するのかについての情報を単独でかつ累積的に与えた。表1は、高い予測力を有するASD対DDのテール効果を表す21種の代謝産物の例示的なパネルを示す。
表1Bは、ASDを予測するテール効果を有する21種の代謝産物のパネルの代謝産物を示す。各テール効果の統計学的有意性(p値)、加えて分布曲線におけるその位置(すなわち、左テール効果または右テール効果)が示される。1より大きいオッズ比は、ASDの予測力を示す。例えば、5HIAAは、オッズ比が4.91の右テールを有しており、これは、STORY研究のデータセットにおいて(ASD試料とDD試料との比率は2:1であった)、DD試料1個ごとにおよそ10個のASD試料が右テール中であったことを示す。ブートストラップ方法によって信頼区間を推測した。復元抽出しなおすことによって1000の個々のブートストラップをSTORYデータから生成した。各ブートストラップにつき、テールの位置と対応するオッズ比を決定した。観察されたオッズ比の分布から90%信頼区間を計算した。
これらの基準に基づいて、21種の代謝産物のパネルの19種の代謝産物が、ASDを予測することを見出した。
表1Cは、DDを予測するテール効果を有する代謝産物を示す。各テール効果の統計学的有意性(p値)、加えて分布曲線におけるその位置(すなわち、左テール効果または右テール効果)が示される。1未満のオッズ比は、DDの予測力を示す。これらの基準に基づいて、21種の代謝産物のパネルの8種の代謝産物が、DDを予測することを見出した。ASDの場合と同様に、STORY研究においてDD対ASD試料が1:2の比率であることを考慮してオッズ比および90%信頼区間を決定した。
注目すべきことに、ある特定の代謝産物は、ASDまたはDDのいずれかの予測力を有する単一のテール効果(左または右のいずれか)を実証したが、それに対して他の代謝産物は、左および右テール効果の両方を実証することから、総合してASDおよびDD両方の予測力が提供される。例えば、フェニルアセチルグルタミンおよびp−クレゾールスルフェートは、右および左テール効果の両方を実証する。
表1で列挙した21種の代謝産物のテール効果は、図13Aから13Uのグラフにおいて個々に示される。各グラフにつき、ASDおよびDD集団両方における1種の代謝産物の分布が示される。各パネルの上の凡例は、代謝産物に関する左および右テールの統計学的有意性を示す(p値はフィッシャーの検定によって生成した)。
いくつかの代謝産物、例えばフェニルアセチルグルタミンは、平均シフトおよびテール効果を表す。図5で示されるように、フェニルアセチルグルタミンは、統計学的に有意な平均シフト(t検定;p=0.001)ならびに2つの集団間の統計学的に有意な左および右テール効果(「極値」はテール効果を示し、フィッシャーの検定においてp=0.0001である)を表す。分布は、ASD集団とDD集団とでシフトしたガウス曲線として表される。
表2は、ASDおよび非ASD集団における各代謝産物の基準となる集団分布に基づいて、21種の代謝産物のパネルのテール効果を決定するのに使用される閾値の値を示す。例証として、上の閾値の値は、90パーセンタイル分布に相当し、一方で下の閾値の値は、15パーセンタイル分布に相当する。閾値の値の絶対測定(例えば、ng/mL、nMなど)は、集団における代謝産物の平均濃度と共に表2の値を使用することによって計算することができる。
(実施例3)
複数の代謝産物を用いたASDの予測
複数の代謝産物(例えば、表1で列挙したもの)によって提供された情報は、疾患リスクの予測を助けるために個々にまたは群として使用することができる。特に、代謝産物の情報的価値があるセットは、それほどよく互いに相関せず、低い共線性(すなわち低い相互関係)を有するメンバーを包含する。例えば、図6は、ガンマ−CEHCレベルと比較した5HIAAレベルを示しており、これは、2種の代謝産物の情報的価値があるレベル間に相関が欠如していることを実証する。例えば、5HIAAのテールで同定されたASD個体(図3)は、一般的に、ガンマ−CEHCのテールで同定されたのと同じASD個体ではない。したがって、代謝産物5HIAAおよびガンマ−CEHCは、相補的な情報を提供するとみなされる。テールで濃縮された低い相互関係の代謝産物は、相補的な分類情報を提供する。
図7は、180個の試料のそれぞれについて、試料が、12種の代謝産物のパネルの代謝産物のそれぞれのテール内にあるのかまたはテール内にないのかを示すチャートである。この例示的なパネルにおいて、2種の代謝産物、キサンチンおよびP−クレゾールスルフェートのテールは、非ASD(例えば、DD)を予測し、一方で他の10種の代謝産物のテールは、ASDを予測する。
複数の代謝産物が査定される場合、集約されたテール効果カウントの組合せの数は増加し、可能性のある集約されたテール効果カウントも同様である。ASDおよび非ASD集団からの集約されたテール効果カウントの分布をプロットすることができ、結果得られた分布は、未知の試料が測定されるときにASDおよび非ASD間の好適な選別を決定するのに使用することができる。図8Aで示されるように、ASDおよび非ASD(ここではDD)試料は、投票(例えば、ビニング)スキームを採用して、テール効果が観察された代謝産物によって提供された相補的な情報をさらに利用することによってさらに分析することができる。合計12種の代謝産物のデータが示される。1つの特定のスキームにおいて、所与の試料に関し、試料が非ASD(ここではDD)予測テール内に収まる代謝産物の数と同様に、試料がASD予測テール内に収まる代謝産物の数を合計した。これらの2つの値は、xおよびy座標としてプロットされて示される(図8A)。注目すべきことに、ASDで濃縮された代謝産物の数が増加する(y軸においてより高くなる)につれて、および非ASDで濃縮された代謝産物の数が減少する(x軸においてより低くなる)につれて、ASDのドットのなかに混在する非ASDのドットがより少なくなるようであり、例えばこれは、ASDの偽陽性診断に関する尤度がより低いことを示唆している。一方で、ASDで濃縮された代謝産物の数が減少する(y軸においてより低くなる)につれて、および非ASDで濃縮された代謝産物の数が増加する(x軸においてより高くなる)につれて、非ASDのドットのなかに混在するASDのドットがより少なくなり、例えばこれは、DDの偽陽性診断に関する尤度がより低いことを示唆している。
試料を4つの異なる区間に分割し、これを図8Bに示した。特に上および右下の区間が、ASDまたはDDのリスク評価を促進する明確な選別を示した。
図8に示される4つの区間のなかでも、ASDを最も強く予測する区間は、2つまたはそれより多くのASDで濃縮されたフィーチャおよび0または1つの非ASDで濃縮されたフィーチャのいずれかを有する試料を包含していた。また、1つのASDで濃縮されたフィーチャおよび0または1つの非ASDで濃縮されたフィーチャのいずれかを有する区間もASDを予測したが、上記の区間ほど強くなかった。1つまたは複数の非ASDで濃縮されたフィーチャおよび0のASDで濃縮されたフィーチャを有する区間は、非ASDを強く予測した。また、ASDで濃縮されたフィーチャおよび非ASDで濃縮されたフィーチャを有さない試料の区間も、一部の環境では予測の情報を提供することがある。
1つの例示的な投票スキームにおいて、投票は、所与の試料について開票され、例えば、ASDで濃縮された代謝産物は1ポイントをスコア付けし、非ASDで濃縮された代謝産物は1ポイントを引いた。正の結果を有する(例えば、1に等しいかまたはそれより大きい)試料は、ASD(またはASDの有意なリスクを有する)とみなされる可能性があり、負の結果を有する(−1に等しいかまたはそれ未満の)試料は、非ASD(または非ASDの有意な尤度を有する)とみなされる可能性がある。ゼロの結果を有する試料は、試料中のASD対非ASDの分布に応じて非ASDもしくはASDの可能性があるとみなされる可能性があるか、または未解決もしくは「分類なしの結果」の試料として戻される可能性がある。同様に、図8Cは、表1に記載された21種の代謝産物のパネルの投票開票結果を示す。
別の例示的なスコアリングシステムにおいて(図21に示される)、ASDおよびDDのフィーチャに関するオッズ比のlog2値(log2 OR)を各代謝産物について合計して、ASDまたはDDのリスクスコアを計算した。
テール効果の情報は、ASDまたは非ASDの状態を有する対象を識別するのに使用される場合がある。同様に、テール効果の情報は、対象の別の疾患または状態、例えばDDのリスクを予測するのに使用される場合がある。
例えば、非ASD集団、例えばDDのテール効果分布は、図8Aおよび8Cで示されるように、その集団における所与の数の代謝産物に関する平均テール効果の合計の参照値を確立するのに使用することができる。この平均値は、未知の対象からの試料からの平均テール効果の合計と比較するための参照として使用することができ、ASDおよび非ASD集団両方における代謝産物の集団分布曲線を得る必要なく、ASDに関する対象のリスクを査定するのに使用することができる。
テール効果の情報はまた、例えば、上記の例示的な投票スキームまたは類似のスキームで説明したように、改善した分類結果のために従来の平均シフト情報および/または他の分類情報と組み合わせてもよい。
ある特定の代謝産物の組合せの分析によって、ASDリスクの予測可能性を増加できることが本明細書において実証される。例えば、図9〜11および13〜14A〜Dは、投票スキームの使用がどのように分類器のAUCを増加させ、予測能力を改善できるのかを例示する。12種の代謝産物のパネルのサブセットを使用したところ、サブセットにおける代謝産物の数が増加するにつれて(1個から12個)、ASD予測力(y軸)が増加した(図9)。また異なる分類器(すなわち、ロジスティック回帰、ナイーブベイズ、またはサポートベクターマシン(SVM))の使用、および異なるフィーチャの選択も、AUCに影響を与える(図9)。図10Aは、同じ集団で、12種の代謝産物のパネルを使用した、異なるフィーチャおよび分類器を使用したASDリスクの三分化した予測を示し、一方で図10Bは、21種の代謝産物のパネルを使用した結果を示す。図11Aおよび11Bは、12種の代謝産物のパネル(図11A)および21種の代謝産物のパネル(図11B)の投票スキームを使用したASDリスク予測における改善を示す。総合すると、これらの分析は、標的化された代謝産物を選択し、適切な統計のツールを使用することによって、ASDリスク査定の高度な確実性を達成できることを実証する。例えば、図12で示されるように、12種の代謝産物を使用する上述した方法に従って、少なくとも0.74のAUCが得られた。
(実施例4)
メタボロミクスデータからの高い影響力を有する代謝産物の選択
ASDおよびDD対象からの試料を、およそ600種の公知の代謝産物(表3に示される)の検出に関してスクリーニングした。最初の600個のセットから、84種の候補代謝産物が、テール効果を表すと同定された。試料中で検出される84種の代謝産物のサブセットが明らかになり、表4では名前で識別される。代謝産物のパネル(例えば、12種および21種のパネル)を、高い個々の代謝産物のAUCに基づいて84種の候補代謝産物のセットから選択した。薬物療法または年齢との関連などの要因に基づいて、ある特定の候補代謝産物をパネルから排除した。
代謝産物の2つのパネル(図7の代謝産物で構成される12種の代謝産物のパネル、および表1の代謝産物で構成される21種の代謝産物のパネル)をASDリスク予測に関して試験した。結果から、12種および21種の代謝産物のパネルはASDの予測に強く寄与したことが示される。図14A〜Dに、ASD予測において12種または21種のパネルの代謝産物を包含および排除する効果の概説を示す。ホワイトリストは、12種または21種の代謝産物のパネルのみからのデータを使用した分類器のAUC値を示し、一方でブラックリストは、12種または21種の代謝産物のパネルを排除した、ただし84種の候補代謝産物の群または600種の代謝産物の全群のいずれかからの他の代謝産物を使用した分類器のAUC値を示す(全候補=84種の候補代謝産物;全フィーチャ=600種の代謝産物)。平均シフト(上のパネル)およびテール分析(下のパネル)を行った。これらのデータから、査定が平均シフトまたはテール分析によってなされたかどうかにかかわらず、ASDの予測の情報は、12種または21種の代謝産物のパネル内の代謝産物に起因することが示される。したがって、強力なテール効果を表すことが観察された代謝産物(12種および21種の代謝産物群にある代謝産物)は、強力なテール効果を表さない600種の代謝産物のパネルからの他の代謝産物よりかなり大きいASD対DDの予測力を有する。
図14C〜Dは、図14A〜Bの結果を拡大したものであり、ロジスティック回帰に加えてナイーブベイズ分析を使用した追加の分析を包含する。加えて、図14Bは、試料の異なるコホート(すなわち、「クリスマス」および「イースター」)に分割した結果を示す。左端のパネルは、192個の試料で分類器を訓練し、クリスマスコホートのみでクロス検証したAUCの結果を示し、中央の左のパネルは、299個の試料で分類器を訓練し、クリスマスおよびイースターコホートでクロス検証したAUCの結果を示し、中央の右のパネルは、イースターコホートのみからの試料で分類器を訓練し、イースターコホートのみでクロス検証したAUCの結果を示し、右端のパネルは、クリスマスおよびイースターコホートからの試料で分類器を訓練し、イースターコホートでクロス検証したAUCの結果を示す。12種または21種の代謝産物のパネル内の代謝産物(例えば、テール効果を表す代謝産物)を使用して、最も高いAUCが達成された。
図17A〜B、18A〜Bおよび19A〜Dは、統計学的分析に追加されたフィーチャの数に従って12種または21種の代謝産物のパネル(ホワイトリスト)を包含すること、およびそれらを排除すること(ブラックリスト)によるAUC予測を示すことによって、図14A〜Dの結果を拡大したものである。上のパネルは、平均シフト分析からの結果を示し、下のパネルは、テール効果分析を示す。それぞれ個々のパネル内で、バーは、下記の記号と凡例で示されるように、異なる代謝産物のパネルを表す。
図15に、合計21種の代謝産物のサブセットが査定される場合におけるASDリスク予測の累積的なAUCを説明する例示的なプロットを示す。この図において、x軸は、21種の代謝産物の群から選択されるサブセットからの代謝産物の数を示す。y軸は、ASDの予測力を示す。x軸上の各数値についていくつかのランダムな代謝産物の組合せを分析し、それらのAUC値をプロットした(ドット)。曲線は、使用された代謝産物(21種の群から選択された)の数の増加に起因するAUC増加を示す。一方で、この図は、少数の代謝産物(例えば、3または5)を有するサブセットでさえも高いAUCを表すことを実証する。したがって、ある特定の代謝産物は、特に重要な予測テールを有するようである。
表5に、高いAUC値をもたらす3、4、5、6、および7種の代謝産物を含有する表1からの21種の代謝産物の代表的なサブセットを説明する例示的な表を示す。各サブセットのサイズ(3、4、5、6または7種)について、代謝産物セットの50個のランダムな選択を分析した。例えば、21種の代謝産物のパネルのうち3種のサブセットの場合、3種の代謝産物のサブセットの50個のランダムな組合せ(合計1330個の可能性のある順列から)を査定した。最も高いAUCを有する50個のランダムなセットからの組合せが示される。したがって、21種よりも少ない代謝産物を含有するある特定の代謝産物の組合せが、高いAUC値をもたらした。ガンマ−CEHC、p−クレゾールスルフェート、キサンチン、フェニルアセチルグルタミン、イソバレリルグリシン、オクテノイルカルニチン、およびヒドロキシ−クロロタロニルなどの代謝産物が、高いAUC値をもたらした複数のサブセットにおいて出現したことから、これらの代謝産物は患者のASD状態に密接に関連する可能性があることが示される。したがって、これらの代謝産物は、単独で、または互いにもしくは追加の代謝産物と組み合わせて、患者のASDリスクを予測することに関して特に有用であると考えられる。
ASDの予測可能性に関して、表1からの21種の代謝産物の2種の代謝産物のサブセットを、対の組合せで査定した。表6に、ロバストなAUCを有する代表的な対の組合せを示す。同様に、ASDの予測可能性に関して、表1からの21種の代謝産物の3種の代謝産物のサブセットを、3つ組の組合せで査定した。表7に、ロバストなAUCを有する代表的な3つ組の組合せを示す。
(実施例5)
12種の代謝産物のパネルの分類器の検証
およそ3分の2がASDであった180個の試験された試料からのデータを使用して、図7に示される12種の高い情報的価値がある代謝産物に基づき分類器を生成した。130個の試料の第2のコホートにおいて非ASD(ここではDD)からASDを判別する能力に関して、分類器を試験した。この方法は、0.74のAUCに相当する真の予測性能の不偏の推測をもたらした。図12に、プロセスの略図を示す。
(実施例6)
代謝産物に遺伝情報を追加することはASDリスク予測を改善する可能性がある
代謝産物情報に遺伝情報を追加することは、ある特定の群にとってASDリスク予測を改善することが見出された。例えば、コピー数多型(CNV)データを代謝産物情報と組み合わせることは、図16Aおよび16Bで示されるようにASDリスク予測の信頼区間を有意に低下させる。図16Aが実証するように、遺伝情報を追加することは、ASD群と非ASD群との選別をさらに強化する。CNVに加えて、これらに限定されないが脆弱X(FXS)状態などの他の遺伝情報は、精度が改善され、第1種および/または第2種の誤りが低減されたASDリスク予測を可能にする診断試験にさらに寄与する可能性がある。図16Bで示されるように、このような追加の情報(例えば、「PathoCV」)を包含することは、ASD群とDD群との選別を増強し、したがってこれらの2つの状態の識別を助けた。
(実施例7)
代謝産物分析から出現した重要な生物学的経路
代謝産物情報のさらなる分析から、表1に提示される、別個の生物学的経路において重要な役割を果たす代謝産物のクラスターが解明された。例えば、21種の代謝産物のうち7種は消化管微生物の活性に関連しており(33%)、これを表8に示す。7種全てが、アミノ酸代謝産物である。7種のうち6種は、芳香族アミノ酸の代謝産物であり、ベンゼン環を有する。
ASDと強く関連する代謝産物の分析は、表1で示されるように、ある特定の生物学的経路との関係を解明する。例えば、ASDの予測の情報を提供する特定の代謝産物は、フェーズIIの生体内変換の欠陥、ベンゼン環を代謝する能力の障害、腎臓における再吸収の調節異常、カルニチン代謝の調節異常、および脳への大きい中性アミノ酸の輸送の不均衡を示唆していた。生物学的経路情報は、ASDリスク査定を改善すること、ならびに/またはASDの病因および病態生理学を調査することにさらに利用することができる。このような情報はまた、ASD処置のための医薬的な治療薬を開発するのにも使用することができる。
(実施例8)
血液中の代謝産物濃度の解明
血漿試料中の絶対代謝産物濃度を、実施例2で説明される21種の代謝産物のうち19種について質量分析により決定した。血漿中の絶対代謝産物濃度(ng/ml)を、公知の量の代謝産物を含有する標準試料から作製した検量線を使用して計算した。
表9Aは、ASDを予測する17種の代謝産物を示す。テール効果の方向(左または右)、テール効果の存在を決定するための閾値の値(すなわち、左テール効果の場合は15パーセンタイル、右テール効果の場合は90パーセンタイル)、およびオッズ比(log2)が提供される。陽性のオッズ比は、代謝産物のテール効果がASDを予測することを示す。
表9Bは、DDを予測する7種の代謝産物を示す。テール効果の方向(左または右)、テール効果の存在を決定するための閾値の値(すなわち、左テール効果の場合は15パーセンタイル、右テール効果の場合は90パーセンタイル)、およびオッズ比(log2)が提供される。陰性のオッズ比は、代謝産物のテール効果がDDを予測することを示す。