以下に、本発明にかかる前立腺疾患の評価方法の実施の形態(第1実施形態)ならびに本発明にかかる前立腺疾患評価装置、前立腺疾患評価方法、前立腺疾患評価システム、前立腺疾患評価プログラムおよび記録媒体の実施の形態(第2実施形態)を、図面に基づいて詳細に説明する。なお、本実施の形態により本発明が限定されるものではない。
[第1実施形態]
[1−1.本発明の概要]
ここでは、本発明にかかる前立腺疾患の評価方法の概要について図1を参照して説明する。図1は本発明の基本原理を示す原理構成図である。
まず、本発明では、評価対象(例えば動物やヒトなど個体)から採取した血液から、アミノ酸の濃度値に関するアミノ酸濃度データを測定する(ステップS−11)。ここで、血中アミノ酸濃度の分析は次のように行った。採血した血液サンプルを、ヘパリン処理したチューブに採取し、採取した血液サンプルを遠心することにより血液から血漿を分離した。全ての血漿サンプルは、アミノ酸濃度の測定時まで−70℃で凍結保存した。アミノ酸濃度測定時には、スルホサリチル酸を添加し3%濃度調整により除蛋白処理を行い、測定には、ポストカラムでニンヒドリン反応を用いた高速液体クロマトグラフィー(HPLC)を原理としたアミノ酸分析機を使用した。なお、アミノ酸濃度の単位は、例えばモル濃度や重量濃度、これらの濃度に任意の定数を加減乗除することで得られるものでもよい。
つぎに、本発明では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値に基づいて、評価対象につき、前立腺癌および前立腺肥大のうち少なくとも1つを含む前立腺疾患の状態を評価する(ステップS−12)。
以上、本発明によれば、評価対象から採取した血液からアミノ酸の濃度値に関するアミノ酸濃度データを測定し、測定した評価対象のアミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値に基づいて、評価対象につき、前立腺癌および前立腺肥大のうち少なくとも1つを含む前立腺疾患の状態を評価する。これにより、血液中のアミノ酸の濃度のうち前立腺疾患の状態と関連するアミノ酸の濃度を利用して、前立腺疾患の状態を精度よく評価することができる。具体的には、前立腺疾患に罹患している可能性の高い被験者を1種の検体で且つ短時間に絞り込むことができ、その結果、被験者への時間的、身体的および金銭的負担を軽減することができる。また、具体的には、複数のアミノ酸の濃度により、ある検体が前立腺疾患を発症しているか否かを精度よく評価することができ、その結果、検査の効率化や高精度化を図ることができる。
ここで、ステップS−12を実行する前に、ステップS−11で測定した評価対象のアミノ酸濃度データから欠損値や外れ値などのデータを除去してもよい。これにより、前立腺疾患の状態をさらに精度よく評価することができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値に基づいて、評価対象につき、前立腺疾患または非前立腺疾患であるか否か、前立腺癌または非前立腺癌であるか否か、または、前立腺癌または前立腺肥大であるか否かを判別してもよい。これにより、血液中のアミノ酸の濃度のうち、前立腺疾患と非前立腺疾患との2群判別や前立腺癌と非前立腺癌との2群判別、前立腺癌と前立腺肥大との2群判別に有用なアミノ酸の濃度を利用して、これらの2群判別を精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値、およびアミノ酸の濃度を変数とする予め設定した多変量判別式であってTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出し、算出した判別値に基づいて、評価対象につき、前立腺疾患の状態を評価してもよい。これにより、前立腺疾患の状態と有意な相関がある多変量判別式で得られる判別値を利用して、前立腺疾患の状態を精度よく評価することができる。具体的には、前立腺疾患に罹患している可能性の高い被験者を1種の検体で且つ短時間に絞り込むことができ、その結果、被験者への時間的、身体的および金銭的負担を軽減することができる。また、具体的には、複数のアミノ酸の濃度や当該アミノ酸の濃度を変数とする判別式により、ある検体が前立腺疾患を発症しているか否かを精度よく評価することができ、その結果、検査の効率化や高精度化を図ることができる。
また、ステップS−12では、算出した判別値に基づいて、評価対象につき、前立腺疾患または非前立腺疾患であるか否か、前立腺癌または非前立腺癌であるか否か、または、前立腺癌または前立腺肥大であるか否かを判別してもよい。具体的には、判別値と予め設定された閾値(カットオフ値)とを比較することで、評価対象につき、前立腺疾患または非前立腺疾患であるか否か、前立腺癌または非前立腺癌であるか否か、または、前立腺癌または前立腺肥大であるか否かを判別してもよい。これにより、前立腺疾患と非前立腺疾患との2群判別や前立腺癌と非前立腺癌との2群判別、前立腺癌と前立腺肥大との2群判別に有用な多変量判別式で得られる判別値を利用して、これらの2群判別を精度よく行うことができる。
なお、多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つでもよい。これにより、前立腺疾患と非前立腺疾患との2群判別や前立腺癌と非前立腺癌との2群判別、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、これらの2群判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、前立腺疾患または非前立腺疾患であるか否かを判別してもよい。これにより、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、数式1の分数式、Tau、Glu、Pro、Ala、Cit、ABAを変数とするロジスティック回帰式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とするロジスティック回帰式、またはTau、Glu、Gly、Cit、ABA、Valを変数とする線形判別式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とする線形判別式でもよい。これにより、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a1(Tau/ABA) + b1(Thr/Cit) + c1(Glu/Ser) + d1(Pro/Asn) + e1 ・・・(数式1)
(数式1において、a1,b1,c1,d1,e1は任意の実数である。)
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、前立腺癌または非前立腺癌であるか否かを判別してもよい。これにより、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、数式2の分数式、数式3の分数式もしくは数式4の分数式、Tau、Ala、ABA、Trp、Orn、Argを変数とするロジスティック回帰式、Tau、Glu、Cit、ABA、Val、Ornを変数とするロジスティック回帰式、Tau、Thr、Ala、Trp、Orn、Argを変数とするロジスティック回帰式もしくはAsn,Ala,Val,Met,Trp,Argを変数とするロジスティック回帰式、またはTau、Ala、ABA、Trp、Orn、Argを変数とする線形判別式、Tau、Glu、Ala、Cit、Met、Ornを変数とする線形判別式、Tau、Thr、Ser、Ala、Orn、Argを変数とする線形判別式もしくはAsn,Ala,Val,Met,Tyr,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a2(Tau/Trp) + b2(Thr/Ser) + c2(Glu/Asn) + d2(Orn/Gln) + e2 ・・・(数式2)
a3(Tau/Met) + b3(Ser/Cit) + c3(Asn/Thr) + d3(Glu/Pro) + e3 ・・・(数式3)
a4(Thr/Orn) + b4(Ser/Ile) + c4(Asn/Glu) + d4(Gln/Tau) + e4 ・・・(数式4)
(数式2において、a2,b2,c2,d2,e2は任意の実数であり、数式3において、a3,b3,c3,d3,e3は任意の実数であり、数式4において、a4,b4,c4,d4,e4は任意の実数である。)
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Gly、Cit、Val、His、Trp、Lysの濃度値、およびThr、Ser、Gly、Cit、Val、His、Trp、Lysを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、前立腺癌または前立腺肥大であるか否かを判別してもよい。これにより、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、数式5の分数式、Thr、Ala、Val、Tyr、Trp、Lysを変数とするロジスティック回帰式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とするロジスティック回帰式、またはThr、Ala、Val、Tyr、Trp、Lysを変数とする線形判別式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a5(Ser/Gln) + b5(Glu/Tau) + c5(Ala/Asn) + d5(Val/Thr) + e5 ・・・(数式5)
(数式5において、a5,b5,c5,d5,e5は任意の実数である。)
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する第2実施形態に記載の多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を前立腺疾患の状態の評価に好適に用いることができる。
ここで、多変量判別式とは、一般に多変量解析で用いられる式の形式を意味し、例えば分数式、重回帰式、多重ロジスティック回帰式、線形判別関数、マハラノビス距離、正準判別関数、サポートベクターマシン、決定木などを包含する。また、異なる形式の多変量判別式の和で示されるような式も含まれる。また、重回帰式、多重ロジスティック回帰式、正準判別関数においては各変数に係数および定数項が付加されるが、この場合の係数および定数項は、好ましくは実数であること、より好ましくはデータから判別を行うために得られた係数および定数項の99%信頼区間の範囲に属する値、さらに好ましくはデータから判別を行うために得られた係数および定数項の95%信頼区間の範囲に属する値であればかまわない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。
また、分数式とは、当該分数式の分子がアミノ酸A,B,C,・・・の和で表わされ、且つ当該分数式の分母がアミノ酸a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられるアミノ酸にはそれぞれ適当な係数がついてもかまわない。また、分子や分母に用いられるアミノ酸は重複してもかまわない。また、各分数式に適当な係数がついてもかまわない。また、各変数の係数の値や定数項の値は、実数であればかまわない。分数式で、分子の変数と分母の変数を入れ替えた組み合わせは、目的変数との相関の正負の符号は概して逆転するが、それらの相関性は保たれるので、判別性では同等と見なせるので、分子の変数と分母の変数を入れ替えた組み合わせも、包含するものである。
なお、本発明は、前立腺疾患の状態を評価する際、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。また、本発明は、前立腺疾患の状態を評価する際、多変量判別式における変数として、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。
[1−2.第1実施形態にかかる前立腺疾患の状態の評価方法]
ここでは、第1実施形態にかかる前立腺疾患の状態の評価方法について図2を参照して説明する。図2は、第1実施形態にかかる前立腺疾患の状態の評価方法の一例を示すフローチャートである。
まず、動物やヒトなどの個体から採取した血液から、アミノ酸の濃度値に関するアミノ酸濃度データを測定する(ステップSA−11)。なお、アミノ酸の濃度値の測定は、上述した方法で行う。
つぎに、ステップSA−11で測定した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去する(ステップSA−12)。
つぎに、ステップSA−12で欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データや、アミノ酸の濃度を変数とする予め設定した多変量判別式(当該多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つである。)に基づいて、個体につき、下記11.〜13.に示す判別のいずれか1つを行う(ステップSA−13)。
11.前立腺疾患または非前立腺疾患であるか否かの判別
アミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、前立腺疾患または非前立腺疾患であるか否かを判別する、またはアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、前立腺疾患または非前立腺疾患であるか否かを判別する。
12.前立腺癌または非前立腺癌であるか否かの判別
アミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値に基づいて、評価対象につき、前立腺癌または非前立腺癌であるか否かを判別する、またはアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、前立腺癌または非前立腺癌であるか否かを判別する。
13.前立腺癌または前立腺肥大であるか否かの判別
アミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値に基づいて、評価対象につき、前立腺癌または前立腺肥大であるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Gly、Cit、Val、His、Trp、Lysの濃度値、およびThr、Ser、Gly、Cit、Val、His、Trp、Lysを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、前立腺癌または前立腺肥大であるか否かを判別する。
[1−3.第1実施形態のまとめ、およびその他の実施形態]
以上、詳細に説明したように、第1実施形態にかかる前立腺疾患の評価方法によれば、(1)個体から採取した血液からアミノ酸濃度データを測定し、(2)測定した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去し、(3)欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データや、アミノ酸の濃度を変数とする予め設定した多変量判別式に基づいて、個体につき、上記11.〜13.に示す判別のいずれか1つを行う。これにより、血液中のアミノ酸の濃度のうち、前立腺疾患と非前立腺疾患との2群判別や前立腺癌と非前立腺癌との2群判別、前立腺癌と前立腺肥大との2群判別に有用なアミノ酸の濃度を利用して、これらの2群判別を精度よく行うことができる。また、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。また、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。また、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
なお、ステップSA−13において上記11.に示す判別を行う場合、多変量判別式は、数式1の分数式、Tau、Glu、Pro、Ala、Cit、ABAを変数とするロジスティック回帰式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とするロジスティック回帰式、またはTau、Glu、Gly、Cit、ABA、Valを変数とする線形判別式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とする線形判別式でもよい。これにより、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a1(Tau/ABA) + b1(Thr/Cit) + c1(Glu/Ser) + d1(Pro/Asn) + e1 ・・・(数式1)
(数式1において、a1,b1,c1,d1,e1は任意の実数である。)
また、ステップSA−13において上記12.に示す判別を行う場合、多変量判別式は、数式2の分数式、数式3の分数式もしくは数式4の分数式、Tau、Ala、ABA、Trp、Orn、Argを変数とするロジスティック回帰式、Tau、Glu、Cit、ABA、Val、Ornを変数とするロジスティック回帰式、Tau、Thr、Ala、Trp、Orn、Argを変数とするロジスティック回帰式もしくはAsn,Ala,Val,Met,Trp,Argを変数とするロジスティック回帰式、またはTau、Ala、ABA、Trp、Orn、Argを変数とする線形判別式、Tau、Glu、Ala、Cit、Met、Ornを変数とする線形判別式、Tau、Thr、Ser、Ala、Orn、Argを変数とする線形判別式もしくはAsn,Ala,Val,Met,Tyr,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a2(Tau/Trp) + b2(Thr/Ser) + c2(Glu/Asn) + d2(Orn/Gln) + e2 ・・・(数式2)
a3(Tau/Met) + b3(Ser/Cit) + c3(Asn/Thr) + d3(Glu/Pro) + e3 ・・・(数式3)
a4(Thr/Orn) + b4(Ser/Ile) + c4(Asn/Glu) + d4(Gln/Tau) + e4 ・・・(数式4)
(数式2において、a2,b2,c2,d2,e2は任意の実数であり、数式3において、a3,b3,c3,d3,e3は任意の実数であり、数式4において、a4,b4,c4,d4,e4は任意の実数である。)
また、ステップSA−13において上記13.に示す判別を行う場合、多変量判別式は、数式5の分数式、Thr、Ala、Val、Tyr、Trp、Lysを変数とするロジスティック回帰式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とするロジスティック回帰式、またはThr、Ala、Val、Tyr、Trp、Lysを変数とする線形判別式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a5(Ser/Gln) + b5(Glu/Tau) + c5(Ala/Asn) + d5(Val/Thr) + e5 ・・・(数式5)
(数式5において、a5,b5,c5,d5,e5は任意の実数である。)
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する第2実施形態に記載の多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を前立腺疾患の状態の評価に好適に用いることができる。
[第2実施形態]
[2−1.本発明の概要]
ここでは、本発明にかかる前立腺疾患評価装置、前立腺疾患評価方法、前立腺疾患評価システム、前立腺疾患評価プログラムおよび記録媒体の概要について、図3を参照して説明する。図3は本発明の基本原理を示す原理構成図である。
まず、本発明は、制御部で、アミノ酸の濃度値に関する予め取得した評価対象(例えば動物やヒトなど個体)のアミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値、およびアミノ酸の濃度を変数とする記憶部で記憶した多変量判別式であってTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出する(ステップS−21)。
つぎに、本発明は、制御部で、ステップS−21で算出した判別値に基づいて、評価対象につき、前立腺癌および前立腺肥大のうち少なくとも1つを含む前立腺疾患の状態を評価する(ステップS−22)。
以上、本発明によれば、アミノ酸の濃度値に関する予め取得した評価対象のアミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値、およびアミノ酸の濃度を変数とする記憶部で記憶した多変量判別式であってTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出し、算出した判別値に基づいて、評価対象につき、前立腺疾患の状態を評価する。これにより、前立腺疾患の状態と有意な相関がある多変量判別式で得られる判別値を利用して、前立腺疾患の状態を精度よく評価することができる。具体的には、前立腺疾患に罹患している可能性の高い被験者を1種の検体で且つ短時間に絞り込むことができ、その結果、被験者への時間的、身体的および金銭的負担を軽減することができる。また、具体的には、複数のアミノ酸の濃度や当該アミノ酸の濃度を変数とする判別式により、ある検体が前立腺疾患を発症しているか否かを精度よく評価することができ、その結果、検査の効率化や高精度化を図ることができる。
ここで、ステップS−22では、ステップS−21で算出した判別値に基づいて、評価対象につき、前立腺疾患または非前立腺疾患であるか否か、前立腺癌または非前立腺癌であるか否か、または、前立腺癌または前立腺肥大であるか否かを判別してもよい。これにより、前立腺疾患と非前立腺疾患との2群判別や前立腺癌と非前立腺癌との2群判別、前立腺癌と前立腺肥大との2群判別に有用な多変量判別式で得られる判別値を利用して、これらの2群判別を精度よく行うことができる。
また、多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つでもよい。これにより、前立腺疾患と非前立腺疾患との2群判別や前立腺癌と非前立腺癌との2群判別、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、これらの2群判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、前立腺疾患または非前立腺疾患であるか否かを判別してもよい。これにより、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、数式1の分数式、Tau、Glu、Pro、Ala、Cit、ABAを変数とするロジスティック回帰式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とするロジスティック回帰式、またはTau、Glu、Gly、Cit、ABA、Valを変数とする線形判別式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とする線形判別式でもよい。これにより、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a1(Tau/ABA) + b1(Thr/Cit) + c1(Glu/Ser) + d1(Pro/Asn) + e1 ・・・(数式1)
(数式1において、a1,b1,c1,d1,e1は任意の実数である。)
また、ステップS−21では、アミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、前立腺癌または非前立腺癌であるか否かを判別してもよい。これにより、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、数式2の分数式、数式3の分数式もしくは数式4の分数式、Tau、Ala、ABA、Trp、Orn、Argを変数とするロジスティック回帰式、Tau、Glu、Cit、ABA、Val、Ornを変数とするロジスティック回帰式、Tau、Thr、Ala、Trp、Orn、Argを変数とするロジスティック回帰式もしくはAsn,Ala,Val,Met,Trp,Argを変数とするロジスティック回帰式、またはTau、Ala、ABA、Trp、Orn、Argを変数とする線形判別式、Tau、Glu、Ala、Cit、Met、Ornを変数とする線形判別式、Tau、Thr、Ser、Ala、Orn、Argを変数とする線形判別式もしくはAsn,Ala,Val,Met,Tyr,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a2(Tau/Trp) + b2(Thr/Ser) + c2(Glu/Asn) + d2(Orn/Gln) + e2 ・・・(数式2)
a3(Tau/Met) + b3(Ser/Cit) + c3(Asn/Thr) + d3(Glu/Pro) + e3 ・・・(数式3)
a4(Thr/Orn) + b4(Ser/Ile) + c4(Asn/Glu) + d4(Gln/Tau) + e4 ・・・(数式4)
(数式2において、a2,b2,c2,d2,e2は任意の実数であり、数式3において、a3,b3,c3,d3,e3は任意の実数であり、数式4において、a4,b4,c4,d4,e4は任意の実数である。)
また、ステップS−21では、アミノ酸濃度データに含まれるThr、Ser、Gly、Cit、Val、His、Trp、Lysの濃度値、およびThr、Ser、Gly、Cit、Val、His、Trp、Lysを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、前立腺癌または前立腺肥大であるか否かを判別してもよい。これにより、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、数式5の分数式、Thr、Ala、Val、Tyr、Trp、Lysを変数とするロジスティック回帰式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とするロジスティック回帰式、またはThr、Ala、Val、Tyr、Trp、Lysを変数とする線形判別式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a5(Ser/Gln) + b5(Glu/Tau) + c5(Ala/Asn) + d5(Val/Thr) + e5 ・・・(数式5)
(数式5において、a5,b5,c5,d5,e5は任意の実数である。)
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を前立腺疾患の状態の評価に好適に用いることができる。
ここで、多変量判別式とは、一般に多変量解析で用いられる式の形式を意味し、例えば分数式、重回帰式、多重ロジスティック回帰式、線形判別関数、マハラノビス距離、正準判別関数、サポートベクターマシン、決定木などを包含する。また、異なる形式の多変量判別式の和で示されるような式も含まれる。また、重回帰式、多重ロジスティック回帰式、正準判別関数においては各変数に係数および定数項が付加されるが、この場合の係数および定数項は、好ましくは実数であること、より好ましくはデータから判別を行うために得られた係数および定数項の99%信頼区間の範囲に属する値、さらに好ましくはデータから判別を行うために得られた係数および定数項の95%信頼区間の範囲に属する値であればかまわない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。
また、分数式とは、当該分数式の分子がアミノ酸A,B,C,・・・の和で表わされ、且つ当該分数式の分母がアミノ酸a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられるアミノ酸にはそれぞれ適当な係数がついてもかまわない。また、分子や分母に用いられるアミノ酸は重複してもかまわない。また、各分数式に適当な係数がついてもかまわない。また、各変数の係数の値や定数項の値は、実数であればかまわない。分数式で、分子の変数と分母の変数を入れ替えた組み合わせは、目的変数との相関の正負の符号は概して逆転するが、それらの相関性は保たれるので、判別性では同等と見なせるので、分子の変数と分母の変数を入れ替えた組み合わせも、包含するものである。
なお、本発明は、前立腺疾患の状態を評価する際、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。また、本発明は、前立腺疾患の状態を評価する際、多変量判別式における変数として、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。
ここで、多変量判別式作成処理(工程1〜工程4)の概要について詳細に説明する。
まず、本発明は、制御部で、アミノ酸濃度データと前立腺疾患の状態を表す指標に関する前立腺疾患状態指標データとを含む記憶部で記憶した前立腺疾患状態情報から所定の式作成手法に基づいて、多変量判別式の候補である候補多変量判別式(例えば、y=a1x1+a2x2+・・・+anxn、y:前立腺疾患状態指標データ、xi:アミノ酸濃度データ、ai:定数、i=1,2,・・・,n)を作成する(工程1)。なお、事前に、前立腺疾患状態情報から欠損値や外れ値などを持つデータを除去してもよい。
なお、工程1において、前立腺疾患状態情報から、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、ロジスティック回帰分析、k−means法、クラスター解析、決定木などの多変量解析に関するものを含む。)を併用して複数の候補多変量判別式を作成してもよい。具体的には、多数の健常者および前立腺疾患患者から得た血液を分析して得たアミノ酸濃度データおよび前立腺疾患状態指標データから構成される多変量データである前立腺疾患状態情報に対して、複数の異なるアルゴリズムを利用して複数の候補多変量判別式を同時並行的に作成してもよい。例えば、異なるアルゴリズムを利用して判別分析およびロジスティック回帰分析を同時に行い、2つの異なる候補多変量判別式を作成してもよい。また、主成分分析を行って作成した候補多変量判別式を利用して前立腺疾患状態情報を変換し、変換した前立腺疾患状態情報に対して判別分析を行うことで候補多変量判別式を作成してもよい。これにより、最終的に、診断条件に合った適切な多変量判別式を作成することができる。
ここで、主成分分析を用いて作成した候補多変量判別式は、全てのアミノ酸濃度データの分散を最大にするような各アミノ酸変数からなる一次式である。また、判別分析を用いて作成した候補多変量判別式は、各群内の分散の和の全てのアミノ酸濃度データの分散に対する比を最小にするような各アミノ酸変数からなる高次式(指数や対数を含む)である。また、サポートベクターマシンを用いて作成した候補多変量判別式は、群間の境界を最大にするような各アミノ酸変数からなる高次式(カーネル関数を含む)である。また、重回帰分析を用いて作成した候補多変量判別式は、全てのアミノ酸濃度データからの距離の和を最小にするような各アミノ酸変数からなる高次式である。ロジスティック回帰分析を用いて作成した候補多変量判別式は、尤度を最大にするような各アミノ酸変数からなる一次式を指数とする自然対数を項に持つ分数式である。また、k−means法とは、各アミノ酸濃度データのk個近傍を探索し、近傍点の属する群の中で一番多いものをそのデータの所属群と定義し、入力されたアミノ酸濃度データの属する群と定義された群とが最も合致するようなアミノ酸変数を選択する手法である。また、クラスター解析とは、全てのアミノ酸濃度データの中で最も近い距離にある点同士をクラスタリング(群化)する手法である。また、決定木とは、アミノ酸変数に序列をつけて、序列が上位であるアミノ酸変数の取りうるパターンからアミノ酸濃度データの群を予測する手法である。
多変量判別式作成処理の説明に戻り、本発明は、制御部で、工程1で作成した候補多変量判別式を、所定の検証手法に基づいて検証(相互検証)する(工程2)。候補多変量判別式の検証は、工程1で作成した各候補多変量判別式に対して行う。
なお、工程2において、ブートストラップ法やホールドアウト法、リーブワンアウト法などのうち少なくとも1つに基づいて候補多変量判別式の判別率や感度、特異性、情報量基準などのうち少なくとも1つに関して検証してもよい。これにより、前立腺疾患状態情報や診断条件を考慮した予測性または堅牢性の高い候補多変量判別式を作成することができる。
ここで、判別率とは、全入力データの中で、本発明で評価した前立腺疾患の状態が正しい割合である。また、感度とは、入力データに記載された前立腺疾患の状態が罹病になっているものの中で、本発明で評価した前立腺疾患の状態が正しい割合である。また、特異性とは、入力データに記載された前立腺疾患の状態が健常になっているものの中で、本発明で評価した前立腺疾患の状態が正しい割合である。また、情報量基準とは、工程1で作成した候補多変量判別式のアミノ酸変数の数と、本発明で評価した前立腺疾患の状態および入力データに記載された前立腺疾患の状態の差異と、を足し合わせたものである。また、予測性とは、候補多変量判別式の検証を繰り返すことで得られた判別率や感度、特異性を平均したものである。また、堅牢性とは、候補多変量判別式の検証を繰り返すことで得られた判別率や感度、特異性の分散である。
多変量判別式作成処理の説明に戻り、本発明は、制御部で、工程2での検証結果から所定の変数選択手法に基づいて候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる前立腺疾患状態情報に含まれるアミノ酸濃度データの組み合わせを選択する(工程3)。アミノ酸変数の選択は、工程1で作成した各候補多変量判別式に対して行う。これにより、候補多変量判別式のアミノ酸変数を適切に選択することができる。そして、工程3で選択したアミノ酸濃度データを含む前立腺疾患状態情報を用いて再び工程1を実行する。
なお、工程3において、工程2での検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式のアミノ酸変数を選択してもよい。
ここで、ベストパス法とは、候補多変量判別式に含まれるアミノ酸変数を1つずつ順次減らしていき、候補多変量判別式が与える評価指標を最適化することでアミノ酸変数を選択する方法である。
多変量判別式作成処理の説明に戻り、本発明は、制御部で、上述した工程1、工程2および工程3を繰り返し実行し、これにより蓄積した検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで、多変量判別式を作成する(工程4)。なお、候補多変量判別式の選出には、例えば、同じ式作成手法で作成した候補多変量判別式の中から最適なものを選出する場合と、すべての候補多変量判別式の中から最適なものを選出する場合とがある。
以上、説明したように、多変量判別式作成処理では、前立腺疾患状態情報に基づいて、候補多変量判別式の作成、候補多変量判別式の検証および候補多変量判別式の変数の選択に関する処理を一連の流れで体系化(システム化)して実行することにより、個々の前立腺疾患の状態の評価に最適な多変量判別式を作成することができる。
[2−2.システム構成]
ここでは、第2実施形態にかかる前立腺疾患評価システム(以下では本システムと記す場合がある。)の構成について、図4から図20を参照して説明する。なお、本システムはあくまでも一例であり、本発明はこれに限定されない。
まず、本システムの全体構成について図4および図5を参照して説明する。図4は本システムの全体構成の一例を示す図である。また、図5は本システムの全体構成の他の一例を示す図である。本システムは、図4に示すように、評価対象につき前立腺疾患の状態を評価する前立腺疾患評価装置100と、アミノ酸の濃度値に関する評価対象のアミノ酸濃度データを提供する情報通信端末装置であるクライアント装置200とを、ネットワーク300を介して通信可能に接続して構成されている。
なお、本システムは、図5に示すように、前立腺疾患評価装置100やクライアント装置200の他に、前立腺疾患評価装置100で多変量判別式を作成する際に用いる前立腺疾患状態情報や前立腺疾患の状態を評価するために用いる多変量判別式などを格納したデータベース装置400を、ネットワーク300を介して通信可能に接続して構成されてもよい。これにより、ネットワーク300を介して、前立腺疾患評価装置100からクライアント装置200やデータベース装置400へ、あるいはクライアント装置200やデータベース装置400から前立腺疾患評価装置100へ、前立腺疾患の状態に関する情報などが提供される。ここで、前立腺疾患の状態に関する情報とは、ヒトの前立腺疾患の状態に関する特定の項目について測定した値に関する情報である。また、前立腺疾患の状態に関する情報は、前立腺疾患評価装置100やクライアント装置200や他の装置(例えば各種の計測装置等)で生成され、主にデータベース装置400に蓄積される。
つぎに、本システムの前立腺疾患評価装置100の構成について図6から図18を参照して説明する。図6は、本システムの前立腺疾患評価装置100の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
前立腺疾患評価装置100は、当該前立腺疾患評価装置を統括的に制御するCPU等の制御部102と、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して当該前立腺疾患評価装置をネットワーク300に通信可能に接続する通信インターフェース部104と、各種のデータベースやテーブルやファイルなどを格納する記憶部106と、入力装置112や出力装置114に接続する入出力インターフェース部108と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。ここで、前立腺疾患評価装置100は、各種の分析装置(例えばアミノ酸アナライザー等)と同一筐体で構成されてもよい。また、前立腺疾患評価装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成してもよい。例えば、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
記憶部106は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置、フレキシブルディスク、光ディスク等を用いることができる。記憶部106には、OS(Operating System)と協働してCPUに命令を与え各種処理を行うためのコンピュータプログラムが記録されている。記憶部106は、図示の如く、利用者情報ファイル106aと、アミノ酸濃度データファイル106bと、前立腺疾患状態情報ファイル106cと、指定前立腺疾患状態情報ファイル106dと、多変量判別式関連情報データベース106eと、判別値ファイル106fと、評価結果ファイル106gと、を格納する。
利用者情報ファイル106aは、利用者に関する利用者情報を格納する。図7は、利用者情報ファイル106aに格納される情報の一例を示す図である。利用者情報ファイル106aに格納される情報は、図7に示すように、利用者を一意に識別するための利用者IDと、利用者が正当な者であるか否かの認証を行うための利用者パスワードと、利用者の氏名と、利用者の所属する所属先を一意に識別するための所属先IDと、利用者の所属する所属先の部門を一意に識別するための部門IDと、部門名と、利用者の電子メールアドレスと、を相互に関連付けて構成されている。
図6に戻り、アミノ酸濃度データファイル106bは、アミノ酸の濃度値に関するアミノ酸濃度データを格納する。図8は、アミノ酸濃度データファイル106bに格納される情報の一例を示す図である。アミノ酸濃度データファイル106bに格納される情報は、図8に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、アミノ酸濃度データとを相互に関連付けて構成されている。ここで、図8では、アミノ酸濃度データを数値、すなわち連続尺度として扱っているが、アミノ酸濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、アミノ酸濃度データに、他の生体情報(アミノ酸以外の他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなど)を組み合わせてもよい。
図6に戻り、前立腺疾患状態情報ファイル106cは、多変量判別式を作成する際に用いる前立腺疾患状態情報を格納する。図9は、前立腺疾患状態情報ファイル106cに格納される情報の一例を示す図である。前立腺疾患状態情報ファイル106cに格納される情報は、図9に示すように、個体番号と、前立腺疾患の状態を表す指標(指標T1、指標T2、指標T3・・・)に関する前立腺疾患状態指標データ(T)と、アミノ酸濃度データと、を相互に関連付けて構成されている。ここで、図9では、前立腺疾患状態指標データおよびアミノ酸濃度データを数値(すなわち連続尺度)として扱っているが、前立腺疾患状態指標データおよびアミノ酸濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、前立腺疾患状態指標データは、前立腺疾患の状態のマーカーとなる既知の単一の状態指標であり、数値データを用いてもよい。
図6に戻り、指定前立腺疾患状態情報ファイル106dは、後述する前立腺疾患状態情報指定部102gで指定した前立腺疾患状態情報を格納する。図10は、指定前立腺疾患状態情報ファイル106dに格納される情報の一例を示す図である。指定前立腺疾患状態情報ファイル106dに格納される情報は、図10に示すように、個体番号と、指定した前立腺疾患状態指標データと、指定したアミノ酸濃度データと、を相互に関連付けて構成されている。
図6に戻り、多変量判別式関連情報データベース106eは、後述する候補多変量判別式作成部102h1で作成した候補多変量判別式を格納する候補多変量判別式ファイル106e1と、後述する候補多変量判別式検証部102h2での検証結果を格納する検証結果ファイル106e2と、後述する変数選択部102h3で選択したアミノ酸濃度データの組み合わせを含む前立腺疾患状態情報を格納する選択前立腺疾患状態情報ファイル106e3と、後述する多変量判別式作成部102hで作成した多変量判別式を格納する多変量判別式ファイル106e4と、で構成される。
候補多変量判別式ファイル106e1は、後述する候補多変量判別式作成部102h1で作成した候補多変量判別式を格納する。図11は、候補多変量判別式ファイル106e1に格納される情報の一例を示す図である。候補多変量判別式ファイル106e1に格納される情報は、図11に示すように、ランクと、候補多変量判別式(図11では、F1(Gly,Leu,Phe,・・・)やF2(Gly,Leu,Phe,・・・)、F3(Gly,Leu,Phe,・・・)など)とを相互に関連付けて構成されている。
図6に戻り、検証結果ファイル106e2は、後述する候補多変量判別式検証部102h2での検証結果を格納する。図12は、検証結果ファイル106e2に格納される情報の一例を示す図である。検証結果ファイル106e2に格納される情報は、図12に示すように、ランクと、候補多変量判別式(図12では、Fk(Gly,Leu,Phe,・・・)やFm(Gly,Leu,Phe,・・・)、Fl(Gly,Leu,Phe,・・・)など)と、各候補多変量判別式の検証結果(例えば各候補多変量判別式の評価値)と、を相互に関連付けて構成されている。
図6に戻り、選択前立腺疾患状態情報ファイル106e3は、後述する変数選択部102h3で選択した変数に対応するアミノ酸濃度データの組み合わせを含む前立腺疾患状態情報を格納する。図13は、選択前立腺疾患状態情報ファイル106e3に格納される情報の一例を示す図である。選択前立腺疾患状態情報ファイル106e3に格納される情報は、図13に示すように、個体番号と、後述する前立腺疾患状態情報指定部102gで指定した前立腺疾患状態指標データと、後述する変数選択部102h3で選択したアミノ酸濃度データと、を相互に関連付けて構成されている。
図6に戻り、多変量判別式ファイル106e4は、後述する多変量判別式作成部102hで作成した多変量判別式を格納する。図14は、多変量判別式ファイル106e4に格納される情報の一例を示す図である。多変量判別式ファイル106e4に格納される情報は、図14に示すように、ランクと、多変量判別式(図14では、Fp(Phe,・・・)やFp(Gly,Leu,Phe)、Fk(Gly,Leu,Phe,・・・)など)と、各式作成手法に対応する閾値と、各多変量判別式の検証結果(例えば各多変量判別式の評価値)と、を相互に関連付けて構成されている。
図6に戻り、判別値ファイル106fは、後述する判別値算出部102iで算出した判別値を格納する。図15は、判別値ファイル106fに格納される情報の一例を示す図である。判別値ファイル106fに格納される情報は、図15に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、ランク(多変量判別式を一意に識別するための番号)と、判別値と、を相互に関連付けて構成されている。
図6に戻り、評価結果ファイル106gは、後述する判別値基準評価部102jでの評価結果(具体的には、後述する判別値基準判別部102j1での判別結果)を格納する。図16は、評価結果ファイル106gに格納される情報の一例を示す図である。評価結果ファイル106gに格納される情報は、評価対象である個体(サンプル)を一意に識別するための個体番号と、予め取得した評価対象のアミノ酸濃度データと、多変量判別式で算出した判別値と、前立腺疾患の状態に関する評価結果と、を相互に関連付けて構成されている。
図6に戻り、記憶部106には、上述した情報以外にその他情報として、Webサイトをクライアント装置200に提供するための各種のWebデータや、CGIプログラム等が記録されている。Webデータとしては後述する各種のWebページを表示するためのデータ等があり、これらデータは例えばHTMLやXMLで記述されたテキストファイルとして形成されている。また、Webデータを作成するための部品用のファイルや作業用のファイルやその他一時的なファイル等も記憶部106に記憶される。記憶部106には、必要に応じて、クライアント装置200に送信するための音声をWAVE形式やAIFF形式の如き音声ファイルで格納したり、静止画や動画をJPEG形式やMPEG2形式の如き画像ファイルで格納したりすることができる。
通信インターフェース部104は、前立腺疾患評価装置100とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
入出力インターフェース部108は、入力装置112や出力装置114に接続する。ここで、出力装置114には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下では、出力装置114をモニタ114として記載する場合がある。)。入力装置112には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
制御部102は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部102は、図示の如く、大別して、要求解釈部102aと閲覧処理部102bと認証処理部102cと電子メール生成部102dとWebページ生成部102eと受信部102fと前立腺疾患状態情報指定部102gと多変量判別式作成部102hと判別値算出部102iと判別値基準評価部102jと結果出力部102kと送信部102mとを備えている。制御部102は、データベース装置400から送信された前立腺疾患状態情報やクライアント装置200から送信されたアミノ酸濃度データに対して、欠損値のあるデータの除去・外れ値の多いデータの除去・欠損値のあるデータの多い変数の除去などのデータ処理も行う。
要求解釈部102aは、クライアント装置200やデータベース装置400からの要求内容を解釈し、その解釈結果に応じて制御部102の各部に処理を受け渡す。閲覧処理部102bは、クライアント装置200からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行なう。認証処理部102cは、クライアント装置200やデータベース装置400からの認証要求を受けて、認証判断を行う。電子メール生成部102dは、各種の情報を含んだ電子メールを生成する。Webページ生成部102eは、利用者がクライアント装置200で閲覧するWebページを生成する。
受信部102fは、クライアント装置200やデータベース装置400から送信された情報(具体的には、アミノ酸濃度データや前立腺疾患状態情報、多変量判別式など)を、ネットワーク300を介して受信する。前立腺疾患状態情報指定部102gは、多変量判別式を作成するにあたり、対象とする前立腺疾患状態指標データおよびアミノ酸濃度データを指定する。
多変量判別式作成部102hは、受信部102fで受信した前立腺疾患状態情報や前立腺疾患状態情報指定部102gで指定した前立腺疾患状態情報に基づいて多変量判別式を作成する。具体的には、多変量判別式作成部102hは、前立腺疾患状態情報から、候補多変量判別式作成部102h1、候補多変量判別式検証部102h2および変数選択部102h3を繰り返し実行させることにより蓄積された検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで、多変量判別式を作成する。
なお、多変量判別式が予め記憶部106の所定の記憶領域に格納されている場合には、多変量判別式作成部102hは、記憶部106から所望の多変量判別式を選択することで、多変量判別式を作成してもよい。また、多変量判別式作成部102hは、多変量判別式を予め格納した他のコンピュータ装置(例えばデータベース装置400)から所望の多変量判別式を選択しダウンロードすることで、多変量判別式を作成してもよい。
ここで、多変量判別式作成部102hの構成について図17を参照して説明する。図17は、多変量判別式作成部102hの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。多変量判別式作成部102hは、候補多変量判別式作成部102h1と、候補多変量判別式検証部102h2と、変数選択部102h3と、をさらに備えている。候補多変量判別式作成部102h1は、前立腺疾患状態情報から所定の式作成手法に基づいて多変量判別式の候補である候補多変量判別式を作成する。なお、候補多変量判別式作成部102h1は、前立腺疾患状態情報から、複数の異なる式作成手法を併用して複数の候補多変量判別式を作成してもよい。候補多変量判別式検証部102h2は、候補多変量判別式作成部102h1で作成した候補多変量判別式を所定の検証手法に基づいて検証する。なお、候補多変量判別式検証部102h2は、ブートストラップ法、ホールドアウト法、リーブワンアウト法のうち少なくとも1つに基づいて候補多変量判別式の判別率、感度、特異性、情報量基準のうち少なくとも1つに関して検証してもよい。変数選択部102h3は、候補多変量判別式検証部102h2での検証結果から所定の変数選択手法に基づいて候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる前立腺疾患状態情報に含まれるアミノ酸濃度データの組み合わせを選択する。なお、変数選択部102h3は、検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式の変数を選択してもよい。
図6に戻り、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つの濃度値、および多変量判別式作成部102hで作成した多変量判別式であってTau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出する。
ここで、多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つでもよい。
また、判別値基準判別部102j1で前立腺疾患または非前立腺疾患であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つの濃度値、および多変量判別式作成部102hで作成したTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、数式1の分数式、Tau、Glu、Pro、Ala、Cit、ABAを変数とするロジスティック回帰式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とするロジスティック回帰式、またはTau、Glu、Gly、Cit、ABA、Valを変数とする線形判別式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とする線形判別式でもよい。
a1(Tau/ABA) + b1(Thr/Cit) + c1(Glu/Ser) + d1(Pro/Asn) + e1 ・・・(数式1)
(数式1において、a1,b1,c1,d1,e1は任意の実数である。)
また、判別値基準判別部102j1で前立腺癌または非前立腺癌であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つの濃度値、および多変量判別式作成部102hで作成したTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、数式2の分数式、数式3の分数式もしくは数式4の分数式、Tau、Ala、ABA、Trp、Orn、Argを変数とするロジスティック回帰式、Tau、Glu、Cit、ABA、Val、Ornを変数とするロジスティック回帰式、Tau、Thr、Ala、Trp、Orn、Argを変数とするロジスティック回帰式もしくはAsn,Ala,Val,Met,Trp,Argを変数とするロジスティック回帰式、またはTau、Ala、ABA、Trp、Orn、Argを変数とする線形判別式、Tau、Glu、Ala、Cit、Met、Ornを変数とする線形判別式、Tau、Thr、Ser、Ala、Orn、Argを変数とする線形判別式もしくはAsn,Ala,Val,Met,Tyr,Trpを変数とする線形判別式でもよい。
a2(Tau/Trp) + b2(Thr/Ser) + c2(Glu/Asn) + d2(Orn/Gln) + e2 ・・・(数式2)
a3(Tau/Met) + b3(Ser/Cit) + c3(Asn/Thr) + d3(Glu/Pro) + e3 ・・・(数式3)
a4(Thr/Orn) + b4(Ser/Ile) + c4(Asn/Glu) + d4(Gln/Tau) + e4 ・・・(数式4)
(数式2において、a2,b2,c2,d2,e2は任意の実数であり、数式3において、a3,b3,c3,d3,e3は任意の実数であり、数式4において、a4,b4,c4,d4,e4は任意の実数である。)
また、判別値基準判別部102j1で前立腺癌または前立腺肥大であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Gly、Cit、Val、His、Trp、Lysの濃度値、および多変量判別式作成部102hで作成したThr、Ser、Gly、Cit、Val、His、Trp、Lysを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、数式5の分数式、Thr、Ala、Val、Tyr、Trp、Lysを変数とするロジスティック回帰式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とするロジスティック回帰式、またはThr、Ala、Val、Tyr、Trp、Lysを変数とする線形判別式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とする線形判別式でもよい。
a5(Ser/Gln) + b5(Glu/Tau) + c5(Ala/Asn) + d5(Val/Thr) + e5 ・・・(数式5)
(数式5において、a5,b5,c5,d5,e5は任意の実数である。)
判別値基準評価部102jは、判別値算出部102iで算出した判別値に基づいて、評価対象につき、前立腺疾患の状態を評価する。判別値基準評価部102jは、判別値基準判別部102j1をさらに備えている。ここで、判別値基準評価部102jの構成について図18を参照して説明する。図18は、判別値基準評価部102jの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。判別値基準判別部102j1は、判別値算出部102iで算出した判別値に基づいて、評価対象につき、「前立腺疾患または非前立腺疾患であるか否かの判別」、「前立腺癌または非前立腺癌であるか否かの判別」、「前立腺癌または前立腺肥大であるか否かの判別」を行う。
図6に戻り、結果出力部102kは、制御部102の各処理部での処理結果(判別値基準評価部102jでの評価結果(具体的には判別値基準判別部102j1での判別結果)を含む)等を出力装置114に出力する。
送信部102mは、評価対象のアミノ酸濃度データの送信元のクライアント装置200に対して評価結果を送信したり、データベース装置400に対して、前立腺疾患評価装置100で作成した多変量判別式や評価結果を送信したりする。
つぎに、本システムのクライアント装置200の構成について図19を参照して説明する。図19は、本システムのクライアント装置200の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
クライアント装置200は、制御部210とROM220とHD230とRAM240と入力装置250と出力装置260と入出力IF270と通信IF280とで構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
制御部210は、Webブラウザ211、電子メーラ212、受信部213、送信部214を備えている。Webブラウザ211は、Webデータを解釈し、解釈したWebデータを後述するモニタ261に表示するブラウズ処理を行う。なお、Webブラウザ211には、ストリーム映像の受信・表示・フィードバック等を行う機能を備えたストリームプレイヤ等の各種のソフトウェアをプラグインしてもよい。電子メーラ212は、所定の通信規約(例えば、SMTP(Simple Mail Transfer Protocol)やPOP3(Post Office Protocol version 3)等)に従って電子メールの送受信を行う。受信部213は、通信IF280を介して、前立腺疾患評価装置100から送信された評価結果などの各種情報を受信する。送信部214は、通信IF280を介して、評価対象のアミノ酸濃度データなどの各種情報を前立腺疾患評価装置100へ送信する。
入力装置250はキーボードやマウスやマイク等である。なお、後述するモニタ261もマウスと協働してポインティングデバイス機能を実現する。出力装置260は、通信IF280を介して受信した情報を出力する出力手段であり、モニタ(家庭用テレビを含む)261およびプリンタ262を含む。この他、出力装置260にスピーカ等を設けてもよい。入出力IF270は入力装置250や出力装置260に接続する。
通信IF280は、クライアント装置200とネットワーク300(またはルータ等の通信装置)とを通信可能に接続する。換言すると、クライアント装置200は、モデムやTAやルータなどの通信装置および電話回線を介して、または専用線を介してネットワーク300に接続される。これにより、クライアント装置200は、所定の通信規約に従って前立腺疾患評価装置100にアクセスすることができる。
ここで、プリンタ・モニタ・イメージスキャナ等の周辺装置を必要に応じて接続した情報処理装置(例えば、既知のパーソナルコンピュータ・ワークステーション・家庭用ゲーム装置・インターネットTV・PHS端末・携帯端末・移動体通信端末・PDA等の情報処理端末など)に、Webデータのブラウジング機能や電子メール機能を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより、クライアント装置200を実現してもよい。
また、クライアント装置200の制御部210は、制御部210で行う処理の全部または任意の一部を、CPUおよび当該CPUにて解釈して実行するプログラムで実現してもよい。ROM220またはHD230には、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。当該コンピュータプログラムは、RAM240にロードされることで実行され、CPUと協働して制御部210を構成する。また、当該コンピュータプログラムは、クライアント装置200と任意のネットワークを介して接続されるアプリケーションプログラムサーバに記録されてもよく、クライアント装置200は、必要に応じてその全部または一部をダウンロードしてもよい。また、制御部210で行う処理の全部または任意の一部を、ワイヤードロジック等によるハードウェアで実現してもよい。
つぎに、本システムのネットワーク300について図4、図5を参照して説明する。ネットワーク300は、前立腺疾患評価装置100とクライアント装置200とデータベース装置400とを相互に通信可能に接続する機能を有し、例えばインターネットやイントラネットやLAN(有線/無線の双方を含む)等である。なお、ネットワーク300は、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、携帯回線交換網または携帯パケット交換網(IMT2000方式、GSM(登録商標)方式またはPDC/PDC−P方式等を含む)や、無線呼出網や、Bluetooth(登録商標)等の局所無線網や、PHS網や、衛星通信網(CS、BSまたはISDB等を含む)等でもよい。
つぎに、本システムのデータベース装置400の構成について図20を参照して説明する。図20は、本システムのデータベース装置400の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
データベース装置400は、前立腺疾患評価装置100または当該データベース装置400で多変量判別式を作成する際に用いる前立腺疾患状態情報や、前立腺疾患評価装置100で作成した多変量判別式、前立腺疾患評価装置100での評価結果などを格納する機能を有する。図20に示すように、データベース装置400は、当該データベース装置400を統括的に制御するCPU等の制御部402と、ルータ等の通信装置および専用線等の有線または無線の通信回路を介して当該データベース装置をネットワーク300に通信可能に接続する通信インターフェース部404と、各種のデータベースやテーブルやファイル(例えばWebページ用ファイル)などを格納する記憶部406と、入力装置412や出力装置414に接続する入出力インターフェース部408と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
記憶部406は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置や、フレキシブルディスクや、光ディスク等を用いることができる。記憶部406には、各種処理に用いる各種プログラム等を格納する。通信インターフェース部404は、データベース装置400とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部404は、他の端末と通信回線を介してデータを通信する機能を有する。入出力インターフェース部408は、入力装置412や出力装置414に接続する。ここで、出力装置414には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下で、出力装置414をモニタ414として記載する場合がある。)。また、入力装置412には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
制御部402は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部402は、図示の如く、大別して、要求解釈部402aと閲覧処理部402bと認証処理部402cと電子メール生成部402dとWebページ生成部402eと送信部402fとを備えている。
要求解釈部402aは、前立腺疾患評価装置100からの要求内容を解釈し、その解釈結果に応じて制御部402の各部に処理を受け渡す。閲覧処理部402bは、前立腺疾患評価装置100からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行う。認証処理部402cは、前立腺疾患評価装置100からの認証要求を受けて、認証判断を行う。電子メール生成部402dは、各種の情報を含んだ電子メールを生成する。Webページ生成部402eは、利用者がクライアント装置200で閲覧するWebページを生成する。送信部402fは、前立腺疾患状態情報や多変量判別式などの各種情報を、前立腺疾患評価装置100へ送信する。
[2−3.本システムの処理]
ここでは、以上のように構成された本システムで行われる前立腺疾患評価サービス処理の一例を、図21を参照して説明する。図21は、前立腺疾患評価サービス処理の一例を示すフローチャートである。
なお、本処理で用いるアミノ酸濃度データは、個体から予め採取した血液を分析して得たアミノ酸の濃度値に関するものである。ここで、血液中のアミノ酸の分析方法について簡単に説明する。まず、採血した血液サンプルを、ヘパリン処理したチューブに採取し、その後、当該チューブに対して遠心分離を行うことで血漿を分離する。なお、分離したすべての血漿サンプルは、アミノ酸濃度の測定時まで−70℃で凍結保存する。そして、アミノ酸濃度の測定時に、血漿サンプルに対してスルホサリチル酸を添加し、3%濃度調整により除蛋白処理を行う。なお、アミノ酸濃度の測定には、ポストカラムでニンヒドリン反応を用いた高速液体クロマトグラフィー(HPLC)を原理としたアミノ酸分析機を使用した。
まず、Webブラウザ211を表示した画面上で利用者が入力装置250を介して前立腺疾患評価装置100が提供するWebサイトのアドレス(URLなど)を指定すると、クライアント装置200は前立腺疾患評価装置100へアクセスする。具体的には、利用者がクライアント装置200のWebブラウザ211の画面更新を指示すると、Webブラウザ211は、前立腺疾患評価装置100が提供するWebサイトのアドレスを所定の通信規約で前立腺疾患評価装置100へ送信することで、アミノ酸濃度データ送信画面に対応するWebページの送信要求を、当該アドレスに基づくルーティングで前立腺疾患評価装置100へ行う。
つぎに、前立腺疾患評価装置100は、要求解釈部102aで、クライアント装置200からの送信を受け、当該送信の内容を解析し、解析結果に応じて制御部102の各部に処理を移す。具体的には、送信の内容がアミノ酸濃度データ送信画面に対応するWebページの送信要求であった場合、前立腺疾患評価装置100は、主として閲覧処理部102bで、記憶部106の所定の記憶領域に格納されている当該Webページを表示するためのWebデータを取得し、取得したWebデータをクライアント装置200へ送信する。より具体的には、利用者からアミノ酸濃度データ送信画面に対応するWebページの送信要求があった場合、前立腺疾患評価装置100は、まず、制御部102で、利用者IDや利用者パスワードの入力を利用者に対して求める。そして、利用者IDやパスワードが入力されると、前立腺疾患評価装置100は、認証処理部102cで、入力された利用者IDやパスワードと利用者情報ファイル106aに格納されている利用者IDや利用者パスワードとの認証判断を行う。そして、前立腺疾患評価装置100は、認証可の場合にのみ、閲覧処理部102bで、アミノ酸濃度データ送信画面に対応するWebページを表示するためのWebデータをクライアント装置200へ送信する。なお、クライアント装置200の特定は、クライアント装置200から送信要求と共に送信されたIPアドレスで行う。
つぎに、クライアント装置200は、前立腺疾患評価装置100から送信されたWebデータ(アミノ酸濃度データ送信画面に対応するWebページを表示するためのもの)を受信部213で受信し、受信したWebデータをWebブラウザ211で解釈し、モニタ261にアミノ酸濃度データ送信画面を表示する。
つぎに、モニタ261に表示されたアミノ酸濃度データ送信画面に対し利用者が入力装置250を介して個体のアミノ酸濃度データなどを入力・選択すると、クライアント装置200は、送信部214で、入力情報や選択事項を特定するための識別子を前立腺疾患評価装置100へ送信することで、評価対象の個体のアミノ酸濃度データを前立腺疾患評価装置100へ送信する(ステップSA−21)。なお、ステップSA−21におけるアミノ酸濃度データの送信は、FTP等の既存のファイル転送技術等により実現してもよい。
つぎに、前立腺疾患評価装置100は、要求解釈部102aで、クライアント装置200から送信された識別子を解釈することによりクライアント装置200の要求内容を解釈し、前立腺疾患の状態の評価用の多変量判別式の送信要求をデータベース装置400へ行う。
つぎに、データベース装置400は、要求解釈部402aで、前立腺疾患評価装置100からの送信要求を解釈し、記憶部406の所定の記憶領域に格納した、Tau、Thr、Ser、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Cys2のうち少なくとも1つを変数として含む多変量判別式(例えばアップデートされた最新のもの。当該多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つである。)を、前立腺疾患評価装置100へ送信する(ステップSA−22)。
ここで、ステップSA−22において前立腺疾患評価装置100へ送信する多変量判別式は、後述するステップSA−26で前立腺疾患または非前立腺疾患であるか否かを判別する場合には、Tau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、数式1の分数式、Tau、Glu、Pro、Ala、Cit、ABAを変数とするロジスティック回帰式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とするロジスティック回帰式、またはTau、Glu、Gly、Cit、ABA、Valを変数とする線形判別式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とする線形判別式でもよい。
a1(Tau/ABA) + b1(Thr/Cit) + c1(Glu/Ser) + d1(Pro/Asn) + e1 ・・・(数式1)
(数式1において、a1,b1,c1,d1,e1は任意の実数である。)
また、ステップSA−22において前立腺疾患評価装置100へ送信する多変量判別式は、後述するステップSA−26で前立腺癌または非前立腺癌であるか否かを判別する場合には、Tau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、数式2の分数式、数式3の分数式もしくは数式4の分数式、Tau、Ala、ABA、Trp、Orn、Argを変数とするロジスティック回帰式、Tau、Glu、Cit、ABA、Val、Ornを変数とするロジスティック回帰式、Tau、Thr、Ala、Trp、Orn、Argを変数とするロジスティック回帰式もしくはAsn,Ala,Val,Met,Trp,Argを変数とするロジスティック回帰式、またはTau、Ala、ABA、Trp、Orn、Argを変数とする線形判別式、Tau、Glu、Ala、Cit、Met、Ornを変数とする線形判別式、Tau、Thr、Ser、Ala、Orn、Argを変数とする線形判別式もしくはAsn,Ala,Val,Met,Tyr,Trpを変数とする線形判別式でもよい。
a2(Tau/Trp) + b2(Thr/Ser) + c2(Glu/Asn) + d2(Orn/Gln) + e2 ・・・(数式2)
a3(Tau/Met) + b3(Ser/Cit) + c3(Asn/Thr) + d3(Glu/Pro) + e3 ・・・(数式3)
a4(Thr/Orn) + b4(Ser/Ile) + c4(Asn/Glu) + d4(Gln/Tau) + e4 ・・・(数式4)
(数式2において、a2,b2,c2,d2,e2は任意の実数であり、数式3において、a3,b3,c3,d3,e3は任意の実数であり、数式4において、a4,b4,c4,d4,e4は任意の実数である。)
また、ステップSA−22において前立腺疾患評価装置100へ送信する多変量判別式は、後述するステップSA−26で前立腺癌または前立腺肥大であるか否かを判別する場合には、Thr、Ser、Gly、Cit、Val、His、Trp、Lysを変数として含むものでもよい。具体的には、多変量判別式は、数式5の分数式、Thr、Ala、Val、Tyr、Trp、Lysを変数とするロジスティック回帰式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とするロジスティック回帰式、またはThr、Ala、Val、Tyr、Trp、Lysを変数とする線形判別式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とする線形判別式でもよい。
a5(Ser/Gln) + b5(Glu/Tau) + c5(Ala/Asn) + d5(Val/Thr) + e5 ・・・(数式5)
(数式5において、a5,b5,c5,d5,e5は任意の実数である。)
図21の説明に戻り、前立腺疾患評価装置100は、受信部102fで、クライアント装置200から送信された個体のアミノ酸濃度データおよびデータベース装置400から送信された多変量判別式を受信し、受信したアミノ酸濃度データをアミノ酸濃度データファイル106bの所定の記憶領域に格納すると共に、受信した多変量判別式を多変量判別式ファイル106e4の所定の記憶領域に格納する(ステップSA−23)。
つぎに、前立腺疾患評価装置100は、制御部102で、ステップSA−23で受信した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去する(ステップSA−24)。
つぎに、前立腺疾患評価装置100は、判別値算出部102iで、ステップSA−24で欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データおよびステップSA−23で受信した多変量判別式に基づいて、当該多変量判別式の値である判別値を算出し(ステップSA−25)、判別値基準判別部102j1で、ステップSA−25で算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、下記21.〜23.に示す判別のいずれか1つを行い、その判別結果を評価結果ファイル106gの所定の記憶領域に格納する(ステップSA−26)。
21.前立腺疾患または非前立腺疾患であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、His、Trp、Lys、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、前立腺疾患または非前立腺疾患であるか否かを判別する。
22.前立腺癌または非前立腺癌であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つの濃度値、およびTau、Thr、Asn、Glu、Pro、Ala、Cit、ABA、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Cys2のうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、前立腺癌または非前立腺癌であるか否かを判別する。
23.前立腺癌または前立腺肥大であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Gly、Cit、Val、His、Trp、Lysの濃度値、およびThr、Ser、Gly、Cit、Val、His、Trp、Lysを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、前立腺癌または前立腺肥大であるか否かを判別する。
図21の説明に戻り、前立腺疾患評価装置100は、送信部102mで、ステップSA−26で得た判別結果を、アミノ酸濃度データの送信元のクライアント装置200とデータベース装置400とへ送信する(ステップSA−27)。具体的には、まず、前立腺疾患評価装置100は、Webページ生成部102eで、判別結果を表示するためのWebページを作成し、作成したWebページに対応するWebデータを記憶部106の所定の記憶領域に格納する。ついで、利用者がクライアント装置200のWebブラウザ211に入力装置250を介して所定のURLを入力し上述した認証を経た後、クライアント装置200は、当該Webページの閲覧要求を前立腺疾患評価装置100へ送信する。ついで、前立腺疾患評価装置100は、閲覧処理部102bで、クライアント装置200から送信された閲覧要求を解釈し、判別結果を表示するためのWebページに対応するWebデータを記憶部106の所定の記憶領域から読み出す。そして、前立腺疾患評価装置100は、送信部102mで、読み出したWebデータをクライアント装置200へ送信すると共に、当該Webデータ又は判別結果をデータベース装置400へ送信する。
ここで、ステップSA−27において、前立腺疾患評価装置100は、制御部102で、判別結果を電子メールで利用者のクライアント装置200へ通知してもよい。具体的には、まず、前立腺疾患評価装置100は、電子メール生成部102dで、利用者IDなどを基にして利用者情報ファイル106aに格納されている利用者情報を送信タイミングに従って参照し、利用者の電子メールアドレスを取得する。ついで、前立腺疾患評価装置100は、電子メール生成部102dで、取得した電子メールアドレスを宛て先とし利用者の氏名および判別結果を含む電子メールに関するデータを生成する。ついで、前立腺疾患評価装置100は、送信部102mで、生成した当該データを利用者のクライアント装置200へ送信する。
また、ステップSA−27において、前立腺疾患評価装置100は、FTP等の既存のファイル転送技術等で、判別結果を利用者のクライアント装置200へ送信してもよい。
図21の説明に戻り、データベース装置400は、制御部402で、前立腺疾患評価装置100から送信された判別結果またはWebデータを受信し、受信した判別結果またはWebデータを記憶部406の所定の記憶領域に保存(蓄積)する(ステップSA−28)。
また、クライアント装置200は、受信部213で、前立腺疾患評価装置100から送信されたWebデータを受信し、受信したWebデータをWebブラウザ211で解釈し、個体の判別結果が記されたWebページの画面をモニタ261に表示する(ステップSA−29)。なお、判別結果が前立腺疾患評価装置100から電子メールで送信された場合には、クライアント装置200は、電子メーラ212の公知の機能で、前立腺疾患評価装置100から送信された電子メールを任意のタイミングで受信し、受信した電子メールをモニタ261に表示する。
以上により、利用者は、モニタ261に表示されたWebページを閲覧することで、前立腺疾患に関する個体の判別結果を確認することができる。なお、利用者は、モニタ261に表示されたWebページの表示内容をプリンタ262で印刷してもよい。
また、判別結果が前立腺疾患評価装置100から電子メールで送信された場合には、利用者は、モニタ261に表示された電子メールを閲覧することで、前立腺疾患に関する個体の判別結果を確認することができる。利用者は、モニタ261に表示された電子メールの表示内容をプリンタ262で印刷してもよい。
これにて、前立腺疾患評価サービス処理の説明を終了する。
[2−4.第2実施形態のまとめ、およびその他の実施形態]
以上、詳細に説明したように、前立腺疾患評価システムによれば、クライアント装置200は個体のアミノ酸濃度データを前立腺疾患評価装置100へ送信し、データベース装置400は前立腺疾患評価装置100からの要求を受けて前立腺疾患の判別用の多変量判別式を前立腺疾患評価装置100へ送信する。そして、前立腺疾患評価装置100は、(1)クライアント装置200からアミノ酸濃度データを受信すると共にデータベース装置400から多変量判別式を受信し、(2)受信したアミノ酸濃度データおよび多変量判別式に基づいて判別値を算出し、(3)算出した判別値と予め設定した閾値とを比較することで、個体につき、上記21.〜23.に示す判別のいずれか1つを行い、(4)この判別結果をクライアント装置200やデータベース装置400へ送信する。そして、クライアント装置200は前立腺疾患評価装置100から送信された判別結果を受信して表示し、データベース装置400は前立腺疾患評価装置100から送信された判別結果を受信して格納する。これにより、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。また、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。また、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
なお、ステップSA−26において上記21.に示す判別を行う場合、多変量判別式は、数式1の分数式、Tau、Glu、Pro、Ala、Cit、ABAを変数とするロジスティック回帰式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とするロジスティック回帰式、またはTau、Glu、Gly、Cit、ABA、Valを変数とする線形判別式もしくはAsn,Glu,Ala,Val,Met,Trpを変数とする線形判別式でもよい。これにより、前立腺疾患と非前立腺疾患との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a1(Tau/ABA) + b1(Thr/Cit) + c1(Glu/Ser) + d1(Pro/Asn) + e1 ・・・(数式1)
(数式1において、a1,b1,c1,d1,e1は任意の実数である。)
また、ステップSA−26において上記22.に示す判別を行う場合、多変量判別式は、数式2の分数式、数式3の分数式もしくは数式4の分数式、Tau、Ala、ABA、Trp、Orn、Argを変数とするロジスティック回帰式、Tau、Glu、Cit、ABA、Val、Ornを変数とするロジスティック回帰式、Tau、Thr、Ala、Trp、Orn、Argを変数とするロジスティック回帰式もしくはAsn,Ala,Val,Met,Trp,Argを変数とするロジスティック回帰式、またはTau、Ala、ABA、Trp、Orn、Argを変数とする線形判別式、Tau、Glu、Ala、Cit、Met、Ornを変数とする線形判別式、Tau、Thr、Ser、Ala、Orn、Argを変数とする線形判別式もしくはAsn,Ala,Val,Met,Tyr,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と非前立腺癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a2(Tau/Trp) + b2(Thr/Ser) + c2(Glu/Asn) + d2(Orn/Gln) + e2 ・・・(数式2)
a3(Tau/Met) + b3(Ser/Cit) + c3(Asn/Thr) + d3(Glu/Pro) + e3 ・・・(数式3)
a4(Thr/Orn) + b4(Ser/Ile) + c4(Asn/Glu) + d4(Gln/Tau) + e4 ・・・(数式4)
(数式2において、a2,b2,c2,d2,e2は任意の実数であり、数式3において、a3,b3,c3,d3,e3は任意の実数であり、数式4において、a4,b4,c4,d4,e4は任意の実数である。)
また、ステップSA−26において上記23.に示す判別を行う場合、多変量判別式は、数式5の分数式、Thr、Ala、Val、Tyr、Trp、Lysを変数とするロジスティック回帰式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とするロジスティック回帰式、またはThr、Ala、Val、Tyr、Trp、Lysを変数とする線形判別式もしくはSer,Gln,Gly,Cit,Val,Trpを変数とする線形判別式でもよい。これにより、前立腺癌と前立腺肥大との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
a5(Ser/Gln) + b5(Glu/Tau) + c5(Ala/Asn) + d5(Val/Thr) + e5 ・・・(数式5)
(数式5において、a5,b5,c5,d5,e5は任意の実数である。)
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を前立腺疾患の状態の評価に好適に用いることができる。
また、本発明は、上述した第2実施形態以外にも、特許請求の範囲の書類に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。例えば、上述した第2実施形態で説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データおよび検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。例えば、前立腺疾患評価装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。また、前立腺疾患評価装置100の各部または各装置が備える処理機能(特に制御部102にて行なわれる各処理機能)については、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて、その全部または任意の一部を実現することができ、ワイヤードロジックによるハードウェアとして実現することもできる。
ここで、「プログラム」とは任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は、必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものを含む。なお、プログラムは、記録媒体に記録されており、必要に応じて前立腺疾患評価装置100に機械的に読み取られる。記録媒体に記録されたプログラムを各装置で読み取るための具体的な構成や読み取り手順や読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
また、「記録媒体」とは任意の「可搬用の物理媒体」や任意の「固定用の物理媒体」や「通信媒体」を含むものとする。なお、「可搬用の物理媒体」とはフレキシブルディスクや光磁気ディスクやROMやEPROMやEEPROMやCD−ROMやMOやDVD等である。「固定用の物理媒体」とは各種コンピュータシステムに内蔵されるROMやRAMやHD等である。「通信媒体」とは、LANやWANやインターネット等のネットワークを介してプログラムを送信する場合における通信回線や搬送波のように、短期にプログラムを保持するものである。
最後に、前立腺疾患評価装置100で行う多変量判別式作成処理の一例について図22を参照して詳細に説明する。図22は多変量判別式作成処理の一例を示すフローチャートである。なお、当該多変量判別式作成処理は、前立腺疾患状態情報を管理するデータベース装置400で行ってもよい。
なお、本説明では、前立腺疾患評価装置100は、データベース装置400から事前に取得した前立腺疾患状態情報を、前立腺疾患状態情報ファイル106cの所定の記憶領域に格納しているものとする。また、前立腺疾患評価装置100は、前立腺疾患状態情報指定部102gで事前に指定した前立腺疾患状態指標データおよびアミノ酸濃度データを含む前立腺疾患状態情報を、指定前立腺疾患状態情報ファイル106dの所定の記憶領域に格納しているものとする。
まず、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、指定前立腺疾患状態情報ファイル106dの所定の記憶領域に格納されている前立腺疾患状態情報から所定の式作成手法に基づいて候補多変量判別式を作成し、作成した候補多変量判別式を候補多変量判別式ファイル106e1の所定の記憶領域に格納する(ステップSB−21)。具体的には、まず、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、ロジスティック回帰分析、k−means法、クラスター解析、決定木などの多変量解析に関するものを含む。)の中から所望のものを1つ選択し、選択した式作成手法に基づいて、作成する候補多変量判別式の形(式の形)を決定する。つぎに、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、前立腺疾患状態情報に基づいて、選択した式選択手法に対応する種々(例えば平均や分散など)の計算を実行する。つぎに、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、計算結果および決定した候補多変量判別式のパラメータを決定する。これにより、選択した式作成手法に基づいて候補多変量判別式が作成される。なお、複数の異なる式作成手法を併用して候補多変量判別式を同時並行(並列)的に作成する場合は、選択した式作成手法ごとに上記の処理を並行して実行すればよい。また、複数の異なる式作成手法を併用して候補多変量判別式を直列的に作成する場合は、例えば、主成分分析を行って作成した候補多変量判別式を利用して前立腺疾患状態情報を変換し、変換した前立腺疾患状態情報に対して判別分析を行うことで候補多変量判別式を作成してもよい。
つぎに、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、ステップSB−21で作成した候補多変量判別式を所定の検証手法に基づいて検証(相互検証)し、検証結果を検証結果ファイル106e2の所定の記憶領域に格納する(ステップSB−22)。具体的には、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、指定前立腺疾患状態情報ファイル106dの所定の記憶領域に格納されている前立腺疾患状態情報に基づいて候補多変量判別式を検証する際に用いる検証用データを作成し、作成した検証用データに基づいて候補多変量判別式を検証する。なお、ステップSB−21で複数の異なる式作成手法を併用して候補多変量判別式を複数作成した場合には、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、各式作成手法に対応する候補多変量判別式ごとに所定の検証手法に基づいて検証する。ここで、ステップSB−22において、ブートストラップ法やホールドアウト法、リーブワンアウト法などのうち少なくとも1つに基づいて候補多変量判別式の判別率や感度、特異性、情報量基準などのうち少なくとも1つに関して検証してもよい。これにより、前立腺疾患状態情報や診断条件を考慮した予測性または堅牢性の高い候補指標式を選択することができる。
つぎに、多変量判別式作成部102hは、変数選択部102h3で、ステップSB−22での検証結果から所定の変数選択手法に基づいて、候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる前立腺疾患状態情報に含まれるアミノ酸濃度データの組み合わせを選択し、選択したアミノ酸濃度データの組み合わせを含む前立腺疾患状態情報を選択前立腺疾患状態情報ファイル106e3の所定の記憶領域に格納する(ステップSB−23)。なお、ステップSB−21で複数の異なる式作成手法を併用して候補多変量判別式を複数作成し、ステップSB−22で各式作成手法に対応する候補多変量判別式ごとに所定の検証手法に基づいて検証した場合には、ステップSB−23において、多変量判別式作成部102hは、変数選択部102h3で、ステップSB−22での検証結果に対応する候補多変量判別式ごとに所定の変数選択手法に基づいて候補多変量判別式の変数を選択する。ここで、ステップSB−23において、検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式の変数を選択してもよい。なお、ベストパス法とは、候補多変量判別式に含まれる変数を1つずつ順次減らしていき、候補多変量判別式が与える評価指標を最適化することで変数を選択する方法である。また、ステップSB−23において、多変量判別式作成部102hは、変数選択部102h3で、指定前立腺疾患状態情報ファイル106dの所定の記憶領域に格納されている前立腺疾患状態情報に基づいてアミノ酸濃度データの組み合わせを選択してもよい。
つぎに、多変量判別式作成部102hは、指定前立腺疾患状態情報ファイル106dの所定の記憶領域に格納されている前立腺疾患状態情報に含まれるアミノ酸濃度データの全ての組み合わせが終了したか否かを判定し、判定結果が「終了」であった場合(ステップSB−24:Yes)には次のステップ(ステップSB−25)へ進み、判定結果が「終了」でなかった場合(ステップSB−24:No)にはステップSB−21へ戻る。なお、多変量判別式作成部102hは、予め設定した回数が終了したか否かを判定し、判定結果が「終了」であった場合には(ステップSB−24:Yes)次のステップ(ステップSB−25)へ進み、判定結果が「終了」でなかった場合(ステップSB−24:No)にはステップSB−21へ戻ってもよい。また、多変量判別式作成部102hは、ステップSB−23で選択したアミノ酸濃度データの組み合わせが、指定前立腺疾患状態情報ファイル106dの所定の記憶領域に格納されている前立腺疾患状態情報に含まれるアミノ酸濃度データの組み合わせまたは前回のステップSB−23で選択したアミノ酸濃度データの組み合わせと同じであるか否かを判定し、判定結果が「同じ」であった場合(ステップSB−24:Yes)には次のステップ(ステップSB−25)へ進み、判定結果が「同じ」でなかった場合(ステップSB−24:No)にはステップSB−21へ戻ってもよい。また、多変量判別式作成部102hは、検証結果が具体的には各候補多変量判別式に関する評価値である場合には、当該評価値と各式作成手法に対応する所定の閾値との比較結果に基づいて、ステップSB−25へ進むかステップSB−21へ戻るかを判定してもよい。
つぎに、多変量判別式作成部102hは、検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで多変量判別式を決定し、決定した多変量判別式(選出した候補多変量判別式)を多変量判別式ファイル106e4の所定の記憶領域に格納する(ステップSB−25)。ここで、ステップSB−25において、例えば、同じ式作成手法で作成した候補多変量判別式の中から最適なものを選出する場合と、すべての候補多変量判別式の中から最適なものを選出する場合とがある。
これにて、多変量判別式作成処理の説明を終了する。
前立腺生検による前立腺癌の診断が行われた前立腺癌患者群の血液サンプル、および非前立腺癌群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺癌群および非前立腺癌群のアミノ酸変数の分布に関する箱ひげ図を図23(横軸は、非前立腺癌群:1、前立腺癌群:2)に示す。前立腺癌群と非前立腺癌群との判別を目的に2群間のt検定を実施した。
非前立腺癌群に比べて前立腺癌群では、Ala、Tau、Cys2、Ornが有意に増加し、Leu、Trp、Val、Ileが有意に減少した。この結果から、アミノ酸変数Ala、Tau、Cys2、Orn、Leu、Trp、Val、Ileが前立腺癌群と非前立腺癌群との2群間の判別能を持つことが判明した。
実施例1で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式1が得られた。なお、この他に、指標式1と同等の判別性能を有する多変量判別式は複数得られた。それらを図24、図25に示す。また、図24、図25に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式1:0.24(Tau)/(Trp) − 0.03(Thr)/(Ser) − 0.002(Glu)/(Asn) + 2.13(Orn)/(Gln) + 0.72
指標式1による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図26参照)。その結果、0.941±0.012(95%信頼区間は0.917〜0.966)が得られた。また、指標式1による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を5%として最適なカットオフ値を求めた。その結果、カットオフ値が1.086となり、また、感度96.67%、特異度80.25%、陽性適中率20.48%、陰性適中率99.78%、正診率81.07%が得られた。これらの結果から、指標式1が診断性能の高い有用なものであることが判明した。
実施例1で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式2として、Tau、Ala、ABA、Trp、Orn、Argから構成されるロジスティック回帰式(アミノ酸変数Tau、Ala、ABA、Trp、Orn、Argの数係数と定数項は順に、0.0519、0.0137、0.0792、−0.1079、0.0795、−0.0201、−8.5123)が得られた。なお、この他に、指標式2と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図27、図28に示す。また、図27、図28に示す式における各係数の値は、それを実数倍したものでもよい。
指標式2による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図29参照)。その結果、0.950±0.011(95%信頼区間は0.929〜0.971)が得られた。また、指標式2による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を5%として最適なカットオフ値を求めた。その結果、カットオフ値が0.060となり、また、感度90.00%、特異度89.24%、陽性適中率30.57%、陰性適中率99.41%、正診率89.28%が得られた。これらの結果から、指標式2が診断性能の高い有用なものであることが判明した。
実施例1で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、線形判別分析(変数網羅法)により探索した。その結果、指標式3として、Tau、Ala、ABA、Trp、Orn、Argから構成される線形判別関数(アミノ酸変数Tau、Ala、ABA、Trp、Orn、Argの数係数は順に、5.713e−01、6.033e−02、2.377e−01、−5.546e−01、5.431e−01、−1.042e−01、−3.573e+01)が得られた。なお、この他に、指標式3と同等の判別性能を有する線形判別関数は複数得られた。それらを図30、図31に示す。また、図30、図31に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式3による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図32参照)。その結果、0.954±0.010(95%信頼区間は0.934〜0.974)が得られた。また、指標式3による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を5%として最適なカットオフ値を求めた。その結果、カットオフ値が11.15となり、また、感度93.33%、特異度90.12%、陽性適中率33.22%、陰性適中率99.61%、正診率90.28%が得られた。これらの結果から、指標式3が診断性能の高い有用なものであることが判明した。
前立腺生検による前立腺癌の診断が行われた前立腺癌患者群の血液サンプル、および非前立腺癌群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺癌群および非前立腺癌群のアミノ酸変数の分布に関する箱ひげ図を図33(横軸は、非前立腺癌群:1、前立腺癌群:2)に示す。前立腺癌群と非前立腺癌群との判別を目的に2群間のt検定を実施した。
非前立腺癌群に比べて前立腺癌群では、Tauが有意に増加し、Glu、Cit、ABA、Cys2、Met、Ile、Trpが有意に減少した。この結果から、アミノ酸変数Tau、Glu、Cit、ABA、Cys2、Met、Ile、Trpが前立腺癌群と非前立腺癌群との2群間の判別能を持つことが判明した。
実施例5で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標の中に指標式4が得られた。なお、この他に、指標式4と同等の判別性能を有する多変量判別式は複数得られた。それらを図34、図35に示す。また、図34、図35に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式4:0.19(Tau)/(Met) + 0.13(Ser)/(Cit) + 0.25(Asn)/(Thr) − 0.75(Glu)/(Pro) + 0.50
指標式4による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図36参照)。その結果、0.969±0.013(95%信頼区間は0.943〜0.995)が得られた。また、指標式1による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を22%として最適なカットオフ値を求めた。その結果、カットオフ値が1.264となり、また、感度96.67%、特異度88.68%、陽性適中率70.66%、陰性適中率98.95%、正診率90.44%が得られた。これらの結果から、指標式4が診断性能の高い有用なものであることが判明した。
実施例5で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式5として、Tau、Glu、Cit、ABA、Val、Ornから構成されるロジスティック回帰式(アミノ酸変数Tau、Glu、Cit、ABA、Val、Ornの数係数と定数項は順に、0.0760、−0.1100、−0.4990、−0.3076、0.0418、0.0992、0.8657)が得られた。なお、この他に、指標式5と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図37、図38に示す。また、図37、図38に示す式における各係数の値は、それを実数倍したものでもよい。
指標式5による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図39参照)。その結果、0.988±0.008(95%信頼区間は0.972〜1)が得られた。また、指標式5による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を22%として最適なカットオフ値を求めた。その結果、カットオフ値が0.269となり、また、感度93.33%、特異度92.93%、陽性適中率78.83%、陰性適中率98.02%、正診率93.02%が得られた。これらの結果から、指標式5が診断性能の高い有用なものであることが判明した。
実施例5で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、線形判別分析(変数網羅法)により探索した。その結果、指標式6として、Tau、Glu、Ala、Cit、Met、Ornから構成される線形判別関数(アミノ酸変数Tau、Glu、Ala、Cit、Met、Ornの数係数は順に、−3.776e−01、2.843e−01、−2.857e−02、5.645e−01、6.426e−01、−2.102e−01、−5.599e+00)が得られた。なお、この他に、指標式6と同等の判別性能を有する線形判別関数は複数得られた。それらを図40、図41に示す。また、図40、図41に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式6による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図42参照)。その結果、0.978±0.011(95%信頼区間は0.957〜1)が得られた。また、指標式6による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を22%として最適なカットオフ値を求めた。その結果、カットオフ値が−4.27となり、また、感度93.33%、特異度84.22%、陽性適中率69.93%、陰性適中率97.92%、正診率89.70%が得られた。これらの結果から、指標式6が診断性能の高い有用なものであることが判明した。
前立腺生検による前立腺癌の診断が行われた前立腺癌患者群の血液サンプル、および非前立腺癌群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺癌群および非前立腺癌群のアミノ酸変数の分布に関する箱ひげ図を図43(横軸は、非前立腺癌群:1、前立腺癌群:2)に示す。前立腺癌群と非前立腺癌群との判別を目的に2群間のt検定を実施した。
非前立腺癌群に比べて前立腺癌群では、Tau、Glu、Ala、Cys2、Ornが有意に増加し、Met、Ile、Leu、Phe、Trpが有意に減少した。この結果から、アミノ酸変数Tau、Glu、Ala、Cys2、Orn、Met、Ile、Leu、Phe、Trpが前立腺癌群と非前立腺癌群との2群間の判別能を持つことが判明した。
実施例9で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標の中に指標式7が得られた。なお、この他に、指標式7と同等の判別性能を有する多変量判別式は複数得られた。それらを図44、図45に示す。また、図44、図45に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式7:−0.34(Thr)/(Orn) + 0.25(Ser)/(Ile) − 0.03(Asn)/(Glu) − 0.08(Gln)/(Tau) + 2.62
指標式7による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図46参照)。その結果、0.958±0.021(95%信頼区間は0.916〜0.999)が得られた。また、指標式7による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を37%として最適なカットオフ値を求めた。その結果、カットオフ値が1.426となり、また、感度93.33%、特異度88.46%、陽性適中率82.61%、陰性適中率95.76%、正診率90.26%が得られた。これらの結果から、指標式7が診断性能の高い有用なものであることが判明した。
実施例9で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式8として、Tau、Thr、Ala、Trp、Orn、Argから構成されるロジスティック回帰式(アミノ酸変数Tau、Thr、Ala、Trp、Orn、Argの数係数と定数項は順に、0.3610、−0.1862、0.0604、−0.2344、0.4838、−0.1130、−25.0814)が得られた。なお、この他に、指標式8と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図47、図48に示す。また、図47、図48に示す式における各係数の値は、それを実数倍したものでもよい。
指標式8による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図49参照)。その結果、0.985±0.014(95%信頼区間は0.957〜1)が得られた。また、指標式8による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を37%として最適なカットオフ値を求めた。その結果、カットオフ値が0.355となり、また、感度96.67%、特異度90.24%、陽性適中率85.34%、陰性適中率97.88%、正診率92.62%が得られた。これらの結果から、指標式8が診断性能の高い有用なものであることが判明した。
実施例9で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、線形判別分析(変数網羅法)により探索した。その結果、指標式9として、Tau、Thr、Ser、Ala、Orn、Argから構成される線形判別関数(アミノ酸変数Tau、Thr、Ser、Ala、Orn、Argの数係数は順に、−6.459e−01、1.829e−01、−1.391e−01、−7.718e−02、−6.794e−01、2.498e−01、7.303e+01)が得られた。なお、この他に、指標式9と同等の判別性能を有する線形判別関数は複数得られた。それらを図50、図51に示す。また、図50、図51に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式9による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図52参照)。その結果、0.981±0.014(95%信頼区間は0.954〜1)が得られた。また、指標式9による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、前立腺癌群の有症率を37%として最適なカットオフ値を求めた。その結果、カットオフ値が2.32となり、また、感度96.67%、特異度88.46%、陽性適中率83.12%、陰性適中率97.83%、正診率91.50%が得られた。これらの結果から、指標式9が診断性能の高い有用なものであることが判明した。
前立腺生検による前立腺癌の診断が行われた前立腺癌患者群の血液サンプル、および前立腺肥大患者群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺癌群および前立腺肥大群のアミノ酸変数の分布に関する箱ひげ図を図53(横軸は、前立腺肥大群:1、前立腺癌群:2)に示す。前立腺癌群と前立腺肥大群との判別を目的に2群間のt検定を実施した。
前立腺肥大群に比べて前立腺癌群ではThrが有意に減少した。この結果から、アミノ酸変数Thrが前立腺癌群と前立腺肥大群との2群間の判別能を持つことが判明した。
実施例13で用いたサンプルデータを用いた。前立腺癌群と前立腺肥大群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標の中に指標式10が得られた。なお、この他に、指標式10と同等の判別性能を有する多変量判別式は複数得られた。それらを図54、図55に示す。また、図54、図55に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式10:3.77(Ser)/(Gln) − 0.31(Glu)/(Tau) + 0.07(Ala)/(Asn) + 0.26(Val)/(Thr) − 0.16
指標式10による前立腺癌の診断性能を検証すべく、前立腺癌群と前立腺肥大群との2群判別に関してROC曲線の曲線下面積による評価を行った(図56参照)。その結果、0.780±0.066(95%信頼区間は0.650〜0.910)が得られた。また、指標式10による前立腺癌群と前立腺肥大群との2群判別のカットオフ値について、前立腺癌群の有症率を45%として最適なカットオフ値を求めた。その結果、カットオフ値が1.587となり、また、感度73.33%、特異度73.91%、陽性適中率69.70%、陰性適中率77.21%、正診率73.65%が得られた。これらの結果から、指標式10が診断性能の高い有用なものであることが判明した。
実施例13で用いたサンプルデータを用いた。前立腺癌群と前立腺肥大群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式11として、Thr、Ala、Val、Tyr、Trp、Lysから構成されるロジスティック回帰式(アミノ酸変数Thr、Ala、Val、Tyr、Trp、Lysの数係数と定数項は順に、−0.0634、0.0101、0.0169、0.0569、−0.0934、−0.0224、5.3209)が得られた。なお、この他に、指標式11と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図57、図58に示す。また、図57、図58に示す式における各係数の値は、それを実数倍したものでもよい。
指標式11による前立腺癌の診断性能を検証すべく、前立腺癌群と前立腺肥大群との2群判別に関してROC曲線の曲線下面積による評価を行った(図59参照)。その結果、0.832±0.059(95%信頼区間は0.716〜0.948)が得られた。また、指標式11による前立腺癌群と前立腺肥大群の2群判別のカットオフ値について、前立腺癌群の有症率を37%として最適なカットオフ値を求めた。その結果、カットオフ値が0.552となり、また、感度83.33%、特異度78.26%、陽性適中率75.82%、陰性適中率85.16%、正診率80.54%が得られた。これらの結果から、指標式11が診断性能の高い有用なものであることが判明した。
実施例13で用いたサンプルデータを用いた。前立腺癌群と前立腺肥大群との2群判別性能を最大化する指標を、線形判別分析(変数網羅法)により探索した。その結果、指標式12として、Thr、Ala、Val、Tyr、Trp、Lysから構成される線形判別関数(アミノ酸変数Tau、Thr、Ser、Ala、Orn、Argの数係数は順に、−5.143e−01、8.710e−02、1.289e−01、4.425e−01、−6.921e−01、−1.912e−01、3.929e+01)が得られた。なお、この他に、指標式12と同等の判別性能を有する線形判別関数は複数得られた。それらを図60、図61に示す。また、図60、図61に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式12による前立腺癌の診断性能を検証すべく、前立腺癌群と前立腺肥大群との2群判別に関してROC曲線の曲線下面積による評価を行った(図62参照)。その結果、0.820±0.061(95%信頼区間は0.700〜0.940)が得られた。また、指標式12による前立腺癌群と前立腺肥大群との2群判別のカットオフ値について、前立腺癌群の有症率を45%として最適なカットオフ値を求めた。その結果、カットオフ値が−1.50となり、また、感度83.33%、特異度73.91%、陽性適中率72.33%、陰性適中率84.42%、正診率78.15%が得られた。これらの結果から、指標式12が診断性能の高い有用なものであることが判明した。
前立腺生検による前立腺疾患の診断が行われた前立腺癌、前立腺肥大といった前立腺疾患者群の血液サンプル、および非前立疾患群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺疾患群および非前立腺疾患群のアミノ酸変数の分布に関する箱ひげ図を図63(横軸は、非前立腺疾患群:1、前立腺疾患群:2)に示す。前立腺疾患群と非前立腺疾患群との判別を目的に2群間のt検定を実施した。
非前立腺疾患群に比べて前立腺疾患群ではTau、Asn、Gly、Lysが有意に増加し、Glu、Cit、ABA、Cys2、Met、Ileが有意に減少した。この結果から、アミノ酸変数Tau、Asn、Gly、Lys、Glu、Cit、ABA、Cys2、Met、Ileが前立腺疾患群と非前立腺疾患群との2群間の判別能を持つことが判明した。
実施例17で用いたサンプルデータを用いた。前立腺疾患群と非前立腺疾患群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標の中に指標式13が得られた。なお、この他に、指標式13と同等の判別性能を有する多変量判別式は複数得られた。それらを図64、図65に示す。また、図64、図65に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式13:0.12(Tau)/(ABA) + 0.14(Thr)/(Cit) − 0.38(Glu)/(Ser) + 0.01(Pro)/(Asn) + 0.50
指標式13による前立腺疾患の診断性能を検証すべく、前立腺疾患群と非前立腺疾患群との2群判別に関してROC曲線の曲線下面積による評価を行った(図66参照)。その結果、0.977±0.011(95%信頼区間は0.955〜0.998)が得られた。また、指標式13による前立腺疾患群と非前立腺疾患群との2群判別のカットオフ値について、前立腺疾患群の有症率を33%として最適なカットオフ値を求めた。その結果、カットオフ値が1.268となり、また、感度96.23%、特異度80.19%、陽性適中率70.52%、陰性適中率97.73%、正診率85.48%が得られた。これらの結果から、指標式13が診断性能の高い有用なものであることが判明した。
実施例17で用いたサンプルデータを用いた。前立腺疾患群と非前立腺疾患群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式14として、Tau、Glu、Pro、Ala、Cit、ABAから構成されるロジスティック回帰式(アミノ酸変数Tau、Glu、Pro、Ala、Cit、ABAの数係数と定数項は順に、0.0778、−0.0705、−0.0074、0.0209、−0.4891、−0.3098、9.2727)が得られた。なお、この他に、指標式14と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図67、図68に示す。また、図67、図68に示す式における各係数の値は、それを実数倍したものでもよい。
指標式14による前立腺疾患の診断性能を検証すべく、前立腺疾患群と非前立腺疾患群との2群判別に関してROC曲線の曲線下面積による評価を行った(図69参照)。その結果、0.982±0.009(95%信頼区間は0.963〜1.000)が得られた。また、指標式14による前立腺疾患群と非前立腺疾患群との2群判別のカットオフ値について、前立腺疾患群の有症率を37%として最適なカットオフ値を求めた。その結果、カットオフ値が0.450となり、また、感度90.57%、特異度100.00%、陽性適中率100.00%、陰性適中率95.56%、正診率96.89%が得られた。これらの結果から、指標式14が診断性能の高い有用なものであることが判明した。
実施例17で用いたサンプルデータを用いた。前立腺疾患群と非前立腺疾患群との2群判別性能を最大化する指標を、線形判別分析(変数網羅法)により探索した。その結果、指標式15として、Tau、Glu、Gly、Cit、ABA、Valから構成される線形判別関数(アミノ酸変数Tau、Glu、Gly、Cit、ABA、Valの数係数は順に、−3.158e−01、1.439e−01、−5.537e−02、6.746e−01、6.473e−01、−4.858e−02、2.269e+00)が得られた。なお、この他に、指標式15と同等の判別性能を有する線形判別関数は複数得られた。それらを図70、図71に示す。また、図70、図71に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式15による前立腺疾患の診断性能を検証すべく、前立腺疾患群と非前立腺疾患群との2群判別に関してROC曲線の曲線下面積による評価を行った(図72参照)。その結果、0.850±0.032(95%信頼区間は0.788〜0.913)が得られた。また、指標式15による前立腺疾患群と非前立腺疾患群との2群判別のカットオフ値について、前立腺疾患群の有症率を33%として最適なカットオフ値を求めた。その結果、カットオフ値が−5.34となり、また、感度80.00%、特異度80.62%、陽性適中率67.03%、陰性適中率89.11%、正診率80.41%が得られた。これらの結果から、指標式15が診断性能の高い有用なものであることが判明した。
実施例1、13、17に用いたサンプルデータを用いた。上述した実施例2、14、18に対する比較例として、本出願人による国際出願である国際公開第2008/016111号に記載の指標式1、10、11、13を用いて、前立腺癌群と健常群、前立腺肥大群と前立腺癌群、及び前立腺疾患群と健常群の2群判別性能を検証した。その結果、図73に示すように、それぞれの2群判別に対しいずれの式を用いても、上述した実施例2、14、18で得られたROC_AUCを上回るROC_AUCの値は得られなかった。これにより、本発明における多変量判別式が、本出願人による国際出願である国際公開第2008/016111号に記載の指標式群よりも、これらの判別に関して高い判別性能を有することが確認された。
前立腺生検による前立腺癌の診断が行われた前立腺癌患者群の血液サンプル、および非前立腺癌群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺癌群および非前立腺癌群のアミノ酸変数の分布に関する箱ひげ図を図74(横軸は、非前立腺癌群:1、前立腺癌群:2)に示す。前立腺癌群と非前立腺癌群との判別を目的に2群間のt検定を実施した。
非前立腺癌群に比べて前立腺癌群では、Thr、Asn、Ala、Hisが有意に増加し、Val、Met、Leu、Trpが有意に減少した(有意差確率p<0.05)。この結果から、アミノ酸変数Thr、Asn、Ala、His、Val、Met、Leu、Trpが前立腺癌群と非前立腺癌群との2群間の判別能を持つことが判明した。
実施例22で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式16として、Asn,Ala,Val,Met,Trp,Argから構成されるロジスティック回帰式(アミノ酸変数Asn,Ala,Val,Met,Trp,Argの数係数と定数項は順に、0.08585、0.01405、−0.01816、−0.11079、−0.08095、−0.02272、3.18118)が得られた。なお、この他に指標式16と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図75、図76、図77、図78に示す。また、図75、図76、図77、図78に示す式における各係数の値は、それを実数倍したものでもよい。
指標式16による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図79参照)。その結果、0.850±0.031(95%信頼区間は0.789〜0.911)が得られた。また、指標式16による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、感度と特異度の平均値が最大となるカットオフ値を求めた。その結果、カットオフ値が−0.1574となり、また、感度82%、特異度76%が得られた。これらの結果から、指標式16が診断性能の高い有用なものであることが判明した。
実施例22で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群との2群判別性能を最大化する指標を、線形判別分析(ROC最大基準による変数網羅法)により探索した。その結果、指標式17として、Asn,Ala,Val,Met,Tyr,Trpから構成される線形判別関数(アミノ酸変数Asn,Ala,Val,Met,Tyr,Trpの数係数は順に、0.07557、0.01311、−0.01544、−0.16644、0.02693、−0.08447、2.48506)が得られた。なお、この他に指標式17と同等の判別性能を有する線形判別関数は複数得られた。それらを図80、図81、図82、図83に示す。また、図80、図81、図82、図83に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式17による前立腺癌の診断性能を検証すべく、前立腺癌群と非前立腺癌群との2群判別に関してROC曲線の曲線下面積による評価を行った(図84参照)。その結果、0.852±0.028(95%信頼区間は0.797〜0.906)が得られた。また、指標式17による前立腺癌群と非前立腺癌群との2群判別のカットオフ値について、感度と特異度の平均値が最大となるカットオフ値を求めた。その結果、カットオフ値が−0.4851となり、また、感度93%、特異度64%が得られた。これらの結果から、指標式17が診断性能の高い有用なものであることが判明した。
実施例22で用いたサンプルデータを用いた。前立腺癌群と非前立腺癌群の2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Ala,Trp,Val,Met,Leu,Asn,His,Thr,Proが、ROC曲線下面積0.7,0.75,0.8をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認され、これらのアミノ酸を変数として用いた多変量判別式が前立腺癌群と非前立腺癌群の2群間の判別能を持つことが判明した(図85参照)。
前立腺生検による前立腺癌の診断が行われた前立腺癌患者群の血液サンプル、および前立腺肥大患者群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺癌群および前立腺肥大群のアミノ酸変数の分布に関する箱ひげ図を図86(横軸は、前立腺肥大群:1、前立腺癌群:2)に示す。前立腺癌群と前立腺肥大群との判別を目的に2群間のt検定を実施した。
前立腺肥大群に比べて前立腺癌群ではGly、Trp、Lysが有意に減少した(有意差確率p<0.05)。この結果から、アミノ酸変数Gly、Trp、Lysが前立腺癌群と前立腺肥大群との2群間の判別能を持つことが判明した。
実施例26で用いたサンプルデータを用いた。前立腺癌群と前立腺肥大群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式18として、Ser,Gln,Gly,Cit,Val,Trpから構成されるロジスティック回帰式(アミノ酸変数Ser,Gln,Gly,Cit,Val,Trpの数係数と定数項は順に、0.05102、0.01259、−0.05243、0.05778、−0.02344、−0.05969、6.78981)が得られた。なお、この他に指標式18と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図87、図88、図89、図90に示す。また、図87、図88、図89、図90に示す式における各係数の値は、それを実数倍したものでもよい。
指標式18による前立腺癌の診断性能を検証すべく、前立腺癌群と前立腺肥大群との2群判別に関してROC曲線の曲線下面積による評価を行った(図91参照)。その結果、0.848±0.041(95%信頼区間は0.768〜0.929)が得られた。また、指標式18による前立腺癌群と前立腺肥大群との2群判別のカットオフ値について、感度と特異度の平均値が最大となるカットオフ値を求めた。その結果、カットオフ値が0.3355となり、また、感度71%、特異度85%が得られた。これらの結果から、指標式18が診断性能の高い有用なものであることが判明した。
実施例26で用いたサンプルデータを用いた。前立腺癌群と前立腺肥大群との2群判別性能を最大化する指標を、線形判別分析(ROC最大基準による変数網羅法)により探索した。その結果、指標式19として、Ser,Gln,Gly,Cit,Val,Trpから構成される線形判別関数(アミノ酸変数Ser,Gln,Gly,Cit,Val,Trpの数係数は順に、0.03070、0.00620、−0.03718、0.05108、−0.01641、−0.03504、5.98134)が得られた。なお、この他に指標式19と同等の判別性能を有する線形判別関数は複数得られた。それらを図92、図93、図94、図95に示す。また、図92、図93、図94、図95に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式19による前立腺癌の診断性能を検証すべく、前立腺癌群と前立腺肥大群との2群判別に関してROC曲線の曲線下面積による評価を行った(図96参照)。その結果、0.844±0.042(95%信頼区間は0.762〜0.926)が得られた。また、指標式19による前立腺癌群と前立腺肥大群との2群判別のカットオフ値について、感度と特異度の平均値が最大となるカットオフ値を求めた。その結果、カットオフ値が−0.1540となり、また、感度73%、特異度82%が得られた。これらの結果から、指標式19が診断性能の高い有用なものであることが判明した。
実施例26で用いたサンプルデータを用いた。前立腺癌群と前立腺肥大群の2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Gly,Val,Ser,Trp,Cit,Lys,Hisが、ROC曲線下面積0.7,0.75,0.8をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認され、これらのアミノ酸を変数として用いた多変量判別式が前立腺癌群と前立腺肥大群の2群間の判別能を持つことが判明した(図97参照)。
前立腺生検による前立腺疾患の診断が行われた前立腺癌、前立腺肥大といった前立腺疾患者群の血液サンプル、および非前立疾患群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。前立腺疾患群および非前立腺疾患群のアミノ酸変数の分布に関する箱ひげ図を図98(横軸は、非前立腺疾患群:1、前立腺疾患群:2)に示す。前立腺疾患群と非前立腺疾患群との判別を目的に2群間のt検定を実施した。
非前立腺疾患群に比べて前立腺疾患群ではThr、Asn、Glu、Pro、Ala、Hisが有意に増加し、Cit、Val、Met、Leu、Trpが有意に減少した。この結果から、アミノ酸変数Thr、Asn、Glu、Pro、Ala、His、Cit、Val、Met、Leu、Trpが前立腺疾患群と非前立腺疾患群との2群間の判別能を持つことが判明した。
実施例30で用いたサンプルデータを用いた。前立腺疾患群と非前立腺疾患群との2群判別性能を最大化する指標を、ロジスティック解析(ROC最大基準による変数網羅法)により探索した。その結果、指標式20として、Asn,Glu,Ala,Val,Met,Trpから構成されるロジスティック回帰式(アミノ酸変数Asn,Glu,Ala,Val,Met,Trpの数係数と定数項は順に、0.09273、0.02241、0.01196、−0.01415、−0.12983、−0.05678、−0.7474)が得られた。なお、この他に指標式20と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図99、図100、図101、図102に示す。また、図99、図100、図101、図102に示す式における各係数の値は、それを実数倍したものでもよい。
指標式20による前立腺疾患の診断性能を検証すべく、前立腺疾患群と非前立腺疾患群との2群判別に関してROC曲線の曲線下面積による評価を行った(図103参照)。その結果、0.822±0.026(95%信頼区間は0.772〜0.872)が得られた。また、指標式20による前立腺疾患群と非前立腺疾患群との2群判別のカットオフ値について、感度と特異度の平均値が最大となるカットオフ値を求めた。その結果、カットオフ値が−1.239となり、また、感度86%、特異度66%が得られた。これらの結果から、指標式20が診断性能の高い有用なものであることが判明した。
実施例30で用いたサンプルデータを用いた。前立腺疾患群と非前立腺疾患群との2群判別性能を最大化する指標を、線形判別分析(ROC最大基準による変数網羅法)により探索した。その結果、指標式21として、Asn,Glu,Ala,Val,Met,Trpから構成される線形判別関数(アミノ酸変数Asn,Glu,Ala,Val,Met,Trpの数係数は順に、0.08591、0.01994、0.01194、−0.01250、−0.13483、−0.05252、0.15837)が得られた。なお、この他に指標式21と同等の判別性能を有する線形判別関数は複数得られた。それらを図104、図105、図106、図107に示す。また、図104、図105、図106、図107に示す式における各係数の値は、それを実数倍したもの、あるいは任意の定数項を付加したものでもよい。
指標式21による前立腺疾患の診断性能を検証すべく、前立腺疾患群と非前立腺疾患群との2群判別に関してROC曲線の曲線下面積による評価を行った(図108参照)。その結果、0.822±0.026(95%信頼区間は0.772〜0.872)が得られた。また、指標式21による前立腺疾患群と非前立腺疾患群との2群判別のカットオフ値について、感度と特異度の平均値が最大となるカットオフ値を求めた。その結果、カットオフ値が−0.2271となり、また、感度85%、特異度65%が得られた。これらの結果から、指標式21が診断性能の高い有用なものであることが判明した。
実施例30で用いたサンプルデータを用いた。前立腺疾患群と非前立腺疾患群の2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Ala、Met、Asn、Trp、Leu、His、Val,Glu、Citが、ROC曲線下面積0.7,0.75,0.8をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認され、これらのアミノ酸を変数として用いた多変量判別式が前立腺疾患群と非前立腺疾患群の2群間の判別能を持つことが判明した(図109参照)。