以下に、本発明にかかる女性生殖器癌の評価方法の実施の形態(第1実施形態)ならびに本発明にかかる女性生殖器癌評価装置、女性生殖器癌評価方法、女性生殖器癌評価システム、女性生殖器癌評価プログラムおよび記録媒体の実施の形態(第2実施形態)を、図面に基づいて詳細に説明する。なお、本実施の形態により本発明が限定されるものではない。
[第1実施形態]
[1−1.本発明の概要]
ここでは、本発明にかかる女性生殖器癌の評価方法の概要について図1を参照して説明する。図1は本発明の基本原理を示す原理構成図である。
まず、本発明では、評価対象(例えば動物やヒトなど個体)から採取した血液から、アミノ酸の濃度値に関するアミノ酸濃度データを測定する(ステップS−11)。ここで、血中アミノ酸濃度の分析は次のように行った。採血した血液サンプルを、ヘパリン処理したチューブに採取し、採取した血液サンプルを遠心することにより血液から血漿を分離した。全ての血漿サンプルは、アミノ酸濃度の測定時まで−70℃で凍結保存した。アミノ酸濃度測定時には、スルホサリチル酸を添加し3%濃度調整により除蛋白処理を行い、測定には、ポストカラムでニンヒドリン反応を用いた高速液体クロマトグラフィー(HPLC)を原理としたアミノ酸分析機を使用した。なお、アミノ酸濃度の単位は、例えばモル濃度や重量濃度、これらの濃度に任意の定数を加減乗除することで得られるものでもよい。
つぎに、本発明では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値に基づいて、評価対象につき、子宮頸癌、子宮体癌および卵巣癌のうち少なくとも1つを含む女性生殖器癌の状態を評価する(ステップS−12)。
以上、本発明によれば、評価対象から採取した血液からアミノ酸の濃度値に関するアミノ酸濃度データを測定し、測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値に基づいて、評価対象につき、女性生殖器癌の状態を評価する。これにより、血液中のアミノ酸の濃度のうち女性生殖器癌の状態と関連するアミノ酸の濃度を利用して、女性生殖器癌の状態を精度よく評価することができる。具体的には、女性生殖器癌に罹患している可能性の高い被験者を1種の検体で且つ短時間に絞り込むことができ、その結果、被験者への時間的、身体的および金銭的負担を軽減することができる。また、具体的には、複数のアミノ酸の濃度により、ある検体が女性生殖器癌を発症しているか否かを精度よく評価することができ、その結果、検査の効率化や高精度化を図ることができる。
ここで、ステップS−12を実行する前に、ステップS−11で測定した評価対象のアミノ酸濃度データから欠損値や外れ値などのデータを除去してもよい。これにより、女性生殖器癌の状態をさらに精度よく評価することができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値に基づいて、評価対象につき、女性生殖器癌または非女性生殖器癌であるか否か、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否か、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否か、子宮頸癌または非子宮頸癌であるか否か、子宮体癌または非子宮体癌であるか否か、卵巣癌または非卵巣癌であるか否か、女性生殖器癌罹患リスク群または健常群であるか否か、または、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別してもよい。これにより、血液中のアミノ酸の濃度のうち、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、女性生殖器癌罹患リスク群と健常群との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に有用なアミノ酸の濃度を利用して、これらの2群判別やこれらの判別を精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびアミノ酸の濃度を変数とする予め設定した多変量判別式であってThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出し、算出した判別値に基づいて、評価対象につき、女性生殖器癌の状態を評価してもよい。これにより、女性生殖器癌の状態と有意な相関がある多変量判別式で得られる判別値を利用して、女性生殖器癌の状態を精度よく評価することができる。具体的には、女性生殖器癌に罹患している可能性の高い被験者を1種の検体で且つ短時間に絞り込むことができ、その結果、被験者への時間的、身体的および金銭的負担を軽減することができる。また、具体的には、複数のアミノ酸の濃度や当該アミノ酸の濃度を変数とする判別式により、ある検体が女性生殖器癌を発症しているか否かを精度よく評価することができ、その結果、検査の効率化や高精度化を図ることができる。
また、ステップS−12では、算出した判別値に基づいて、評価対象につき、女性生殖器癌または非女性生殖器癌であるか否か、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否か、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否か、子宮頸癌または非子宮頸癌であるか否か、子宮体癌または非子宮体癌であるか否か、卵巣癌または非卵巣癌であるか否か、女性生殖器癌罹患リスク群または健常群であるか否か、または、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別してもよい。具体的には、判別値と予め設定された閾値(カットオフ値)とを比較することで、評価対象につき、女性生殖器癌または非女性生殖器癌であるか否か、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否か、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否か、子宮頸癌または非子宮頸癌であるか否か、子宮体癌または非子宮体癌であるか否か、卵巣癌または非卵巣癌であるか否か、女性生殖器癌罹患リスク群または健常群であるか否か、または、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別してもよい。これにより、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、女性生殖器癌罹患リスク群と健常群との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に有用な多変量判別式で得られる判別値を利用して、これらの2群判別やこれらの判別を精度よく行うことができる。
なお、多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つでもよい。これにより、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、女性生殖器癌罹患リスク群と健常群との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、これらの2群判別やこれらの判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かを判別してもよい。これにより、子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Gln、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式、Ile、His、Cit、Arg、Tyr、Trpを変数とする分数式もしくはa−ABA、Cit、Metを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、a−ABA、Met、Hisを変数とする線形判別式、Ala、Ile、His、Trp、Argを変数とする線形判別式、Gly、Cit、Met、Pheを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、a−ABA、Met、Tyr、Hisを変数とするロジスティック回帰式、Val、Ile、His、Trp、Argを変数とするロジスティック回帰式、Cit、a−ABA、Met、Tyrを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かを判別してもよい。これにより、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Phe、His、Argを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、His、Lys、Argを変数とするロジスティック回帰式、Thr、a−ABA、Met、Hisを変数とするロジスティック回帰式、Cit、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、子宮頸癌または非子宮頸癌であるか否かを判別してもよい。これにより、子宮頸癌と非子宮頸癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、a−ABA、His、Valを変数とする分数式、a−ABA、Met、Valを変数とする分数式もしくはMet、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Val、Met、Lysを変数とする線形判別式、Cit、Met、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、Met、His、Orn、Argを変数とするロジスティック回帰式、Val、Tyr、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌と非子宮頸癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、子宮体癌または非子宮体癌であるか否かを判別してもよい。これにより、子宮体癌と非子宮体癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Asn、Citを変数とする分数式、Gln、His、Lys、Argを変数とする線形判別式、Gly、Met、Phe、Hisを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とする線形判別式、またはGln、Gly、His、Argを変数とするロジスティック回帰式、Gln、Phe、His、Argを変数とするロジスティック回帰式、Gln、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とするロジスティック回帰式でもよい。これにより、子宮体癌と非子宮体癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、卵巣癌または非卵巣癌であるか否かを判別してもよい。これにより、卵巣癌と非卵巣癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Orn、Cit、Metを変数とする分数式、Gln、Cit、Tyrを変数とする分数式もしくはOrn、His、Phe、Trpを変数とする分数式、Ser、Cit、Orn、Trpを変数とする線形判別式、Ser、Cit、Ile、Ornを変数とする線形判別式、Phe、Trp、Orn、Lysを変数とする線形判別式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とする線形判別式、またはSer、Cit、Trp、Ornを変数とするロジスティック回帰式、Gln、Cit、Ile、Tyrを変数とするロジスティック回帰式、Asn、Phe、His、Trpを変数とするロジスティック回帰式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とするロジスティック回帰式でもよい。これにより、卵巣癌と非卵巣癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、女性生殖器癌罹患リスク群または健常群であるか否かを判別してもよい。これにより、女性生殖器癌罹患リスク群と健常群との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Phe、His、Met、Pro、Lys、Argを変数とする線形判別式、またはPhe、His、Met、Pro、Lys、Argを変数とするロジスティック回帰式でもよい。これにより、女性生殖器癌罹患リスク群と健常群との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−12では、ステップS−11で測定した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別してもよい。これにより、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Cit、Met、Lys、Asn、Ala、Thr、Gln、a−ABAを変数とするマハラノビス距離法で作成された式、またはHis、Leu、Ser、Thr、Glu、Gln、Ala、Lysを変数とするマハラノビス距離法で作成された式でもよい。これにより、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する第2実施形態に記載の多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を女性生殖器癌の状態の評価に好適に用いることができる。
ここで、多変量判別式とは、一般に多変量解析で用いられる式の形式を意味し、例えば分数式、重回帰式、多重ロジスティック回帰式、線形判別関数、マハラノビス距離、正準判別関数、サポートベクターマシン、決定木などを包含する。また、異なる形式の多変量判別式の和で示されるような式も含まれる。また、重回帰式、多重ロジスティック回帰式、正準判別関数においては各変数に係数および定数項が付加されるが、この場合の係数および定数項は、好ましくは実数であること、より好ましくはデータから判別を行うために得られた係数および定数項の99%信頼区間の範囲に属する値、さらに好ましくはデータから判別を行うために得られた係数および定数項の95%信頼区間の範囲に属する値であればかまわない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。
また、分数式とは、当該分数式の分子がアミノ酸A,B,C,・・・の和で表わされ、且つ当該分数式の分母がアミノ酸a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられるアミノ酸にはそれぞれ適当な係数がついてもかまわない。また、分子や分母に用いられるアミノ酸は重複してもかまわない。また、各分数式に適当な係数がついてもかまわない。また、各変数の係数の値や定数項の値は、実数であればかまわない。分数式で、分子の変数と分母の変数を入れ替えた組み合わせは、目的変数との相関の正負の符号は概して逆転するが、それらの相関性は保たれるので、判別性では同等と見なせるので、分子の変数と分母の変数を入れ替えた組み合わせも、包含するものである。
なお、本発明は、女性生殖器癌の状態を評価する際、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。また、本発明は、女性生殖器癌の状態を評価する際、多変量判別式における変数として、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。
[1−2.第1実施形態にかかる女性生殖器癌の状態の評価方法]
ここでは、第1実施形態にかかる女性生殖器癌の状態の評価方法について図2を参照して説明する。図2は、第1実施形態にかかる女性生殖器癌の状態の評価方法の一例を示すフローチャートである。
まず、動物やヒトなどの個体から採取した血液から、アミノ酸の濃度値に関するアミノ酸濃度データを測定する(ステップSA−11)。なお、アミノ酸の濃度値の測定は、上述した方法で行う。
つぎに、ステップSA−11で測定した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去する(ステップSA−12)。
つぎに、ステップSA−12で欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データや、アミノ酸の濃度を変数とする予め設定した多変量判別式(当該多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つである。)に基づいて、個体につき、下記11.〜18.に示す判別のいずれか1つを行う(ステップSA−13)。
11.女性生殖器癌または非女性生殖器癌であるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、女性生殖器癌または非女性生殖器癌であるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、女性生殖器癌または非女性生殖器癌であるか否かを判別する。
12.子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かを判別する。
13.子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かを判別する。
14.子宮頸癌または非子宮頸癌であるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌または非子宮頸癌であるか否かを判別する、またはアミノ酸濃度データに含まれるAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌または非子宮頸癌であるか否かを判別する。
15.子宮体癌または非子宮体癌であるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮体癌または非子宮体癌であるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮体癌または非子宮体癌であるか否かを判別する。
16.卵巣癌または非卵巣癌であるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、卵巣癌または非卵巣癌であるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、卵巣癌または非卵巣癌であるか否かを判別する。
17.子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別する。
18.女性生殖器癌罹患リスク群または健常群であるか否かの判別
アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、女性生殖器癌罹患リスク群または健常群であるか否かを判別する、またはアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、女性生殖器癌罹患リスク群または健常群であるか否かを判別する。
[1−3.第1実施形態のまとめ、およびその他の実施形態]
以上、詳細に説明したように、第1実施形態にかかる女性生殖器癌の評価方法によれば、(1)個体から採取した血液からアミノ酸濃度データを測定し、(2)測定した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去し、(3)欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データや、アミノ酸の濃度を変数とする予め設定した多変量判別式に基づいて、個体につき、上記11.〜18.に示す判別のいずれか1つを行う。これにより、血液中のアミノ酸の濃度のうち、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に有用なアミノ酸の濃度を利用して、これらの2群判別やこれらの判別を精度よく行うことができる。また、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、女性生殖器癌罹患リスク群と健常群との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、これらの2群判別やこれらの判別をさらに精度よく行うことができる。
なお、ステップSA−13において上記12.に示す判別を行う場合、多変量判別式は、Gln、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式、Ile、His、Cit、Arg、Tyr、Trpを変数とする分数式もしくはa−ABA、Cit、Metを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、a−ABA、Met、Hisを変数とする線形判別式、Ala、Ile、His、Trp、Argを変数とする線形判別式、Gly、Cit、Met、Pheを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、a−ABA、Met、Tyr、Hisを変数とするロジスティック回帰式、Val、Ile、His、Trp、Argを変数とするロジスティック回帰式、Cit、a−ABA、Met、Tyrを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップSA−13において上記13.に示す判別を行う場合、多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Phe、His、Argを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、His、Lys、Argを変数とするロジスティック回帰式、Thr、a−ABA、Met、Hisを変数とするロジスティック回帰式、Cit、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップSA−13において上記14.に示す判別を行う場合、多変量判別式は、a−ABA、His、Valを変数とする分数式、a−ABA、Met、Valを変数とする分数式もしくはMet、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Val、Met、Lysを変数とする線形判別式、Cit、Met、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、Met、His、Orn、Argを変数とするロジスティック回帰式、Val、Tyr、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌と非子宮頸癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップSA−13において上記15.に示す判別を行う場合、多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Asn、Citを変数とする分数式、Gln、His、Lys、Argを変数とする線形判別式、Gly、Met、Phe、Hisを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とする線形判別式、またはGln、Gly、His、Argを変数とするロジスティック回帰式、Gln、Phe、His、Argを変数とするロジスティック回帰式、Gln、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とするロジスティック回帰式でもよい。これにより、子宮体癌と非子宮体癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップSA−13において上記16.に示す判別を行う場合、多変量判別式は、Orn、Cit、Metを変数とする分数式、Gln、Cit、Tyrを変数とする分数式もしくはOrn、His、Phe、Trpを変数とする分数式、Ser、Cit、Orn、Trpを変数とする線形判別式、Ser、Cit、Ile、Ornを変数とする線形判別式、Phe、Trp、Orn、Lysを変数とする線形判別式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とする線形判別式、またはSer、Cit、Trp、Ornを変数とするロジスティック回帰式、Gln、Cit、Ile、Tyrを変数とするロジスティック回帰式、Asn、Phe、His、Trpを変数とするロジスティック回帰式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とするロジスティック回帰式でもよい。これにより、卵巣癌と非卵巣癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップSA−13において上記17.に示す判別を行う場合、多変量判別式は、Cit、Met、Lys、Asn、Ala、Thr、Gln、a−ABAを変数とするマハラノビス距離法で作成された式、またはHis、Leu、Ser、Thr、Glu、Gln、Ala、Lysを変数とするマハラノビス距離法で作成された式でもよい。これにより、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップSA−13において上記18.に示す判別を行う場合、多変量判別式は、Phe、His、Met、Pro、Lys、Argを変数とする線形判別式、またはPhe、His、Met、Pro、Lys、Argを変数とするロジスティック回帰式でもよい。これにより、女性生殖器癌罹患リスク群と健常群との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する第2実施形態に記載の多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を女性生殖器癌の状態の評価に好適に用いることができる。
[第2実施形態]
[2−1.本発明の概要]
ここでは、本発明にかかる女性生殖器癌評価装置、女性生殖器癌評価方法、女性生殖器癌評価システム、女性生殖器癌評価プログラムおよび記録媒体の概要について、図3を参照して説明する。図3は本発明の基本原理を示す原理構成図である。
まず、本発明は、制御部で、アミノ酸の濃度値に関する予め取得した評価対象(例えば動物やヒトなど個体)のアミノ酸濃度データに含まれるArg、Asn、Cit、Gly、His、Leu、Met、Lys、Phe、Thr、Trp、Tyr、Valのうち少なくとも1つの濃度値、およびアミノ酸の濃度を変数とする記憶部で記憶した多変量判別式であってArg、Asn、Cit、Gly、His、Leu、Met、Lys、Phe、Thr、Trp、Tyr、Valのうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出する(ステップS−21)。
つぎに、本発明は、制御部で、ステップS−21で算出した判別値に基づいて、評価対象につき、子宮頸癌、子宮体癌および卵巣癌のうち少なくとも1つを含む女性生殖器癌の状態を評価する(ステップS−22)。
以上、本発明によれば、アミノ酸の濃度値に関する予め取得した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびアミノ酸の濃度を変数とする記憶部で記憶した多変量判別式であってThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出し、算出した判別値に基づいて、評価対象につき、女性生殖器癌の状態を評価する。これにより、女性生殖器癌の状態と有意な相関がある多変量判別式で得られる判別値を利用して、女性生殖器癌の状態を精度よく評価することができる。具体的には、女性生殖器癌に罹患している可能性の高い被験者を1種の検体で且つ短時間に絞り込むことができ、その結果、被験者への時間的、身体的および金銭的負担を軽減することができる。また、具体的には、複数のアミノ酸の濃度や当該アミノ酸の濃度を変数とする判別式により、ある検体が女性生殖器癌を発症しているか否かを精度よく評価することができ、その結果、検査の効率化や高精度化を図ることができる。
ここで、ステップS−22では、ステップS−21で算出した判別値に基づいて、評価対象につき、女性生殖器癌または非女性生殖器癌であるか否か、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否か、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否か、子宮頸癌または非子宮頸癌であるか否か、子宮体癌または非子宮体癌であるか否か、卵巣癌または非卵巣癌であるか否か、女性生殖器癌罹患リスク群または健常群であるか否か、または、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別してもよい。これにより、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、女性生殖器癌罹患リスク群と健常群との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に有用な多変量判別式で得られる判別値を利用して、これらの2群判別やこれらの判別を精度よく行うことができる。
また、多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つでもよい。これにより、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、女性生殖器癌罹患リスク群と健常群との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、これらの2群判別やこれらの判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かを判別してもよい。これにより、子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Gln、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式、Ile、His、Cit、Arg、Tyr、Trpを変数とする分数式もしくはa−ABA、Cit、Metを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、a−ABA、Met、Hisを変数とする線形判別式、Ala、Ile、His、Trp、Argを変数とする線形判別式、Gly、Cit、Met、Pheを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、a−ABA、Met、Tyr、Hisを変数とするロジスティック回帰式、Val、Ile、His、Trp、Argを変数とするロジスティック回帰式、Cit、a−ABA、Met、Tyrを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かを判別してもよい。これにより、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Phe、His、Argを変数とする線形判別式もしくはCit、Ile、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、His、Lys、Argを変数とするロジスティック回帰式、Thr、a−ABA、Met、Hisを変数とするロジスティック回帰式もしくはCit、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値およびAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、子宮頸癌または非子宮頸癌であるか否かを判別してもよい。これにより、子宮頸癌と非子宮頸癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、a−ABA、His、Valを変数とする分数式、a−ABA、Met、Valを変数とする分数式もしくはMet、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Val、Met、Lysを変数とする線形判別式、Cit、Met、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、Met、His、Orn、Argを変数とするロジスティック回帰式、Val、Tyr、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌と非子宮頸癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つの濃度値およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、子宮体癌または非子宮体癌であるか否かを判別してもよい。これにより、子宮体癌と非子宮体癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Asn、Citを変数とする分数式、Gln、His、Lys、Argを変数とする線形判別式、Gly、Met、Phe、Hisを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とする線形判別式、またはGln、Gly、His、Argを変数とするロジスティック回帰式、Gln、Phe、His、Argを変数とするロジスティック回帰式、Gln、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とするロジスティック回帰式でもよい。これにより、子宮体癌と非子宮体癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値およびThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、卵巣癌または非卵巣癌であるか否かを判別してもよい。これにより、卵巣癌と非卵巣癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Orn、Cit、Metを変数とする分数式、Gln、Cit、Tyrを変数とする分数式もしくはOrn、His、Phe、Trpを変数とする分数式、Ser、Cit、Orn、Trpを変数とする線形判別式、Ser、Cit、Ile、Ornを変数とする線形判別式、Phe、Trp、Orn、Lysを変数とする線形判別式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とする線形判別式、またはSer、Cit、Trp、Ornを変数とするロジスティック回帰式、Gln、Cit、Ile、Tyrを変数とするロジスティック回帰式、Asn、Phe、His、Trpを変数とするロジスティック回帰式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とするロジスティック回帰式でもよい。これにより、卵巣癌と非卵巣癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、女性生殖器癌罹患リスク群または健常群であるか否かを判別してもよい。これにより、女性生殖器癌罹患リスク群と健常群との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Phe、His、Met、Pro、Lys、Argを前記変数とする前記線形判別式、またはPhe、His、Met、Pro、Lys、Argを前記変数とする前記ロジスティック回帰式でもよい。これにより、女性生殖器癌罹患リスク群と健常群との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップS−21では、アミノ酸濃度データに含まれるThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値およびThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS−22では、算出した判別値に基づいて、評価対象につき、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別してもよい。これにより、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。なお、この場合に用いる多変量判別式は、Cit、Met、Lys、Asn、Ala、Thr、Gln、a−ABAを変数とするマハラノビス距離法で作成された式、またはHis、Leu、Ser、Thr、Glu、Gln、Ala、Lysを変数とするマハラノビス距離法で作成された式でもよい。これにより、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を女性生殖器癌の状態の評価に好適に用いることができる。
ここで、多変量判別式とは、一般に多変量解析で用いられる式の形式を意味し、例えば分数式、重回帰式、多重ロジスティック回帰式、線形判別関数、マハラノビス距離、正準判別関数、サポートベクターマシン、決定木などを包含する。また、異なる形式の多変量判別式の和で示されるような式も含まれる。また、重回帰式、多重ロジスティック回帰式、正準判別関数においては各変数に係数および定数項が付加されるが、この場合の係数および定数項は、好ましくは実数であること、より好ましくはデータから判別を行うために得られた係数および定数項の99%信頼区間の範囲に属する値、さらに好ましくはデータから判別を行うために得られた係数および定数項の95%信頼区間の範囲に属する値であればかまわない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。
また、分数式とは、当該分数式の分子がアミノ酸A,B,C,・・・の和で表わされ、且つ当該分数式の分母がアミノ酸a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられるアミノ酸にはそれぞれ適当な係数がついてもかまわない。また、分子や分母に用いられるアミノ酸は重複してもかまわない。また、各分数式に適当な係数がついてもかまわない。また、各変数の係数の値や定数項の値は、実数であればかまわない。分数式で、分子の変数と分母の変数を入れ替えた組み合わせは、目的変数との相関の正負の符号は概して逆転するが、それらの相関性は保たれるので、判別性では同等と見なせるので、分子の変数と分母の変数を入れ替えた組み合わせも、包含するものである。
なお、本発明は、女性生殖器癌の状態を評価する際、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。また、本発明は、女性生殖器癌の状態を評価する際、多変量判別式における変数として、アミノ酸の濃度以外に、その他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなどをさらに用いてもかまわない。
ここで、多変量判別式作成処理(工程1〜工程4)の概要について詳細に説明する。
まず、本発明は、制御部で、アミノ酸濃度データと女性生殖器癌の状態を表す指標に関する女性生殖器癌状態指標データとを含む記憶部で記憶した女性生殖器癌状態情報から所定の式作成手法に基づいて、多変量判別式の候補である候補多変量判別式(例えば、y=a1x1+a2x2+・・・+anxn、y:女性生殖器癌状態指標データ、xi:アミノ酸濃度データ、ai:定数、i=1,2,・・・,n)を作成する(工程1)。なお、事前に、女性生殖器癌状態情報から欠損値や外れ値などを持つデータを除去してもよい。
なお、工程1において、女性生殖器癌状態情報から、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、ロジスティック回帰分析、k−means法、クラスター解析、決定木などの多変量解析に関するものを含む。)を併用して複数の候補多変量判別式を作成してもよい。具体的には、多数の健常者および女性生殖器癌患者から得た血液を分析して得たアミノ酸濃度データおよび女性生殖器癌状態指標データから構成される多変量データである女性生殖器癌状態情報に対して、複数の異なるアルゴリズムを利用して複数の候補多変量判別式を同時並行的に作成してもよい。例えば、異なるアルゴリズムを利用して判別分析およびロジスティック回帰分析を同時に行い、2つの異なる候補多変量判別式を作成してもよい。また、主成分分析を行って作成した候補多変量判別式を利用して女性生殖器癌状態情報を変換し、変換した女性生殖器癌状態情報に対して判別分析を行うことで候補多変量判別式を作成してもよい。これにより、最終的に、診断条件に合った適切な多変量判別式を作成することができる。
ここで、主成分分析を用いて作成した候補多変量判別式は、全てのアミノ酸濃度データの分散を最大にするような各アミノ酸変数からなる一次式である。また、判別分析を用いて作成した候補多変量判別式は、各群内の分散の和の全てのアミノ酸濃度データの分散に対する比を最小にするような各アミノ酸変数からなる高次式(指数や対数を含む)である。また、サポートベクターマシンを用いて作成した候補多変量判別式は、群間の境界を最大にするような各アミノ酸変数からなる高次式(カーネル関数を含む)である。また、重回帰分析を用いて作成した候補多変量判別式は、全てのアミノ酸濃度データからの距離の和を最小にするような各アミノ酸変数からなる高次式である。ロジスティック回帰分析を用いて作成した候補多変量判別式は、尤度を最大にするような各アミノ酸変数からなる一次式を指数とする自然対数を項に持つ分数式である。また、k−means法とは、各アミノ酸濃度データのk個近傍を探索し、近傍点の属する群の中で一番多いものをそのデータの所属群と定義し、入力されたアミノ酸濃度データの属する群と定義された群とが最も合致するようなアミノ酸変数を選択する手法である。また、クラスター解析とは、全てのアミノ酸濃度データの中で最も近い距離にある点同士をクラスタリング(群化)する手法である。また、決定木とは、アミノ酸変数に序列をつけて、序列が上位であるアミノ酸変数の取りうるパターンからアミノ酸濃度データの群を予測する手法である。
多変量判別式作成処理の説明に戻り、本発明は、制御部で、工程1で作成した候補多変量判別式を、所定の検証手法に基づいて検証(相互検証)する(工程2)。候補多変量判別式の検証は、工程1で作成した各候補多変量判別式に対して行う。
なお、工程2において、ブートストラップ法やホールドアウト法、リーブワンアウト法などのうち少なくとも1つに基づいて候補多変量判別式の判別率や感度、特異性、情報量基準などのうち少なくとも1つに関して検証してもよい。これにより、女性生殖器癌状態情報や診断条件を考慮した予測性または堅牢性の高い候補多変量判別式を作成することができる。
ここで、判別率とは、全入力データの中で、本発明で評価した女性生殖器癌の状態が正しい割合である。また、感度とは、入力データに記載された女性生殖器癌の状態が罹病になっているものの中で、本発明で評価した女性生殖器癌の状態が正しい割合である。また、特異性とは、入力データに記載された女性生殖器癌の状態が健常になっているものの中で、本発明で評価した女性生殖器癌の状態が正しい割合である。また、情報量基準とは、工程1で作成した候補多変量判別式のアミノ酸変数の数と、本発明で評価した女性生殖器癌の状態および入力データに記載された女性生殖器癌の状態の差異と、を足し合わせたものである。また、予測性とは、候補多変量判別式の検証を繰り返すことで得られた判別率や感度、特異性を平均したものである。また、堅牢性とは、候補多変量判別式の検証を繰り返すことで得られた判別率や感度、特異性の分散である。
多変量判別式作成処理の説明に戻り、本発明は、制御部で、工程2での検証結果から所定の変数選択手法に基づいて候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる女性生殖器癌状態情報に含まれるアミノ酸濃度データの組み合わせを選択する(工程3)。アミノ酸変数の選択は、工程1で作成した各候補多変量判別式に対して行う。これにより、候補多変量判別式のアミノ酸変数を適切に選択することができる。そして、工程3で選択したアミノ酸濃度データを含む女性生殖器癌状態情報を用いて再び工程1を実行する。
なお、工程3において、工程2での検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式のアミノ酸変数を選択してもよい。
ここで、ベストパス法とは、候補多変量判別式に含まれるアミノ酸変数を1つずつ順次減らしていき、候補多変量判別式が与える評価指標を最適化することでアミノ酸変数を選択する方法である。
多変量判別式作成処理の説明に戻り、本発明は、制御部で、上述した工程1、工程2および工程3を繰り返し実行し、これにより蓄積した検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで、多変量判別式を作成する(工程4)。なお、候補多変量判別式の選出には、例えば、同じ式作成手法で作成した候補多変量判別式の中から最適なものを選出する場合と、すべての候補多変量判別式の中から最適なものを選出する場合とがある。
以上、説明したように、多変量判別式作成処理では、女性生殖器癌状態情報に基づいて、候補多変量判別式の作成、候補多変量判別式の検証および候補多変量判別式の変数の選択に関する処理を一連の流れで体系化(システム化)して実行することにより、個々の女性生殖器癌の状態の評価に最適な多変量判別式を作成することができる。
[2−2.システム構成]
ここでは、第2実施形態にかかる女性生殖器癌評価システム(以下では本システムと記す場合がある。)の構成について、図4から図20を参照して説明する。なお、本システムはあくまでも一例であり、本発明はこれに限定されない。
まず、本システムの全体構成について図4および図5を参照して説明する。図4は本システムの全体構成の一例を示す図である。また、図5は本システムの全体構成の他の一例を示す図である。本システムは、図4に示すように、評価対象につき女性生殖器癌の状態を評価する女性生殖器癌評価装置100と、アミノ酸の濃度値に関する評価対象のアミノ酸濃度データを提供する情報通信端末装置であるクライアント装置200とを、ネットワーク300を介して通信可能に接続して構成されている。
なお、本システムは、図5に示すように、女性生殖器癌評価装置100やクライアント装置200の他に、女性生殖器癌評価装置100で多変量判別式を作成する際に用いる女性生殖器癌状態情報や女性生殖器癌の状態を評価するために用いる多変量判別式などを格納したデータベース装置400を、ネットワーク300を介して通信可能に接続して構成されてもよい。これにより、ネットワーク300を介して、女性生殖器癌評価装置100からクライアント装置200やデータベース装置400へ、あるいはクライアント装置200やデータベース装置400から女性生殖器癌評価装置100へ、女性生殖器癌の状態に関する情報などが提供される。ここで、女性生殖器癌の状態に関する情報とは、ヒトの女性生殖器癌の状態に関する特定の項目について測定した値に関する情報である。また、女性生殖器癌の状態に関する情報は、女性生殖器癌評価装置100やクライアント装置200や他の装置(例えば各種の計測装置等)で生成され、主にデータベース装置400に蓄積される。
つぎに、本システムの女性生殖器癌評価装置100の構成について図6から図18を参照して説明する。図6は、本システムの女性生殖器癌評価装置100の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
女性生殖器癌評価装置100は、当該女性生殖器癌評価装置を統括的に制御するCPU等の制御部102と、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して当該女性生殖器癌評価装置をネットワーク300に通信可能に接続する通信インターフェース部104と、各種のデータベースやテーブルやファイルなどを格納する記憶部106と、入力装置112や出力装置114に接続する入出力インターフェース部108と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。ここで、女性生殖器癌評価装置100は、各種の分析装置(例えばアミノ酸アナライザー等)と同一筐体で構成されてもよい。また、女性生殖器癌評価装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成してもよい。例えば、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
記憶部106は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置、フレキシブルディスク、光ディスク等を用いることができる。記憶部106には、OS(Operating System)と協働してCPUに命令を与え各種処理を行うためのコンピュータプログラムが記録されている。記憶部106は、図示の如く、利用者情報ファイル106aと、アミノ酸濃度データファイル106bと、女性生殖器癌状態情報ファイル106cと、指定女性生殖器癌状態情報ファイル106dと、多変量判別式関連情報データベース106eと、判別値ファイル106fと、評価結果ファイル106gと、を格納する。
利用者情報ファイル106aは、利用者に関する利用者情報を格納する。図7は、利用者情報ファイル106aに格納される情報の一例を示す図である。利用者情報ファイル106aに格納される情報は、図7に示すように、利用者を一意に識別するための利用者IDと、利用者が正当な者であるか否かの認証を行うための利用者パスワードと、利用者の氏名と、利用者の所属する所属先を一意に識別するための所属先IDと、利用者の所属する所属先の部門を一意に識別するための部門IDと、部門名と、利用者の電子メールアドレスと、を相互に関連付けて構成されている。
図6に戻り、アミノ酸濃度データファイル106bは、アミノ酸の濃度値に関するアミノ酸濃度データを格納する。図8は、アミノ酸濃度データファイル106bに格納される情報の一例を示す図である。アミノ酸濃度データファイル106bに格納される情報は、図8に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、アミノ酸濃度データとを相互に関連付けて構成されている。ここで、図8では、アミノ酸濃度データを数値、すなわち連続尺度として扱っているが、アミノ酸濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、アミノ酸濃度データに、他の生体情報(アミノ酸以外の他の代謝物の濃度や遺伝子の発現量、タンパク質の発現量、被験者の年齢・性別、喫煙の有無、心電図の波形を数値化したものなど)を組み合わせてもよい。
図6に戻り、女性生殖器癌状態情報ファイル106cは、多変量判別式を作成する際に用いる女性生殖器癌状態情報を格納する。図9は、女性生殖器癌状態情報ファイル106cに格納される情報の一例を示す図である。女性生殖器癌状態情報ファイル106cに格納される情報は、図9に示すように、個体番号と、女性生殖器癌の状態を表す指標(指標T1、指標T2、指標T3・・・)に関する女性生殖器癌状態指標データ(T)と、アミノ酸濃度データと、を相互に関連付けて構成されている。ここで、図9では、女性生殖器癌状態指標データおよびアミノ酸濃度データを数値(すなわち連続尺度)として扱っているが、女性生殖器癌状態指標データおよびアミノ酸濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、女性生殖器癌状態指標データは、女性生殖器癌の状態のマーカーとなる既知の単一の状態指標であり、数値データを用いてもよい。
図6に戻り、指定女性生殖器癌状態情報ファイル106dは、後述する女性生殖器癌状態情報指定部102gで指定した女性生殖器癌状態情報を格納する。図10は、指定女性生殖器癌状態情報ファイル106dに格納される情報の一例を示す図である。指定女性生殖器癌状態情報ファイル106dに格納される情報は、図10に示すように、個体番号と、指定した女性生殖器癌状態指標データと、指定したアミノ酸濃度データと、を相互に関連付けて構成されている。
図6に戻り、多変量判別式関連情報データベース106eは、後述する候補多変量判別式作成部102h1で作成した候補多変量判別式を格納する候補多変量判別式ファイル106e1と、後述する候補多変量判別式検証部102h2での検証結果を格納する検証結果ファイル106e2と、後述する変数選択部102h3で選択したアミノ酸濃度データの組み合わせを含む女性生殖器癌状態情報を格納する選択女性生殖器癌状態情報ファイル106e3と、後述する多変量判別式作成部102hで作成した多変量判別式を格納する多変量判別式ファイル106e4と、で構成される。
候補多変量判別式ファイル106e1は、後述する候補多変量判別式作成部102h1で作成した候補多変量判別式を格納する。図11は、候補多変量判別式ファイル106e1に格納される情報の一例を示す図である。候補多変量判別式ファイル106e1に格納される情報は、図11に示すように、ランクと、候補多変量判別式(図11では、F1(Gly,Leu,Phe,・・・)やF2(Gly,Leu,Phe,・・・)、F3(Gly,Leu,Phe,・・・)など)とを相互に関連付けて構成されている。
図6に戻り、検証結果ファイル106e2は、後述する候補多変量判別式検証部102h2での検証結果を格納する。図12は、検証結果ファイル106e2に格納される情報の一例を示す図である。検証結果ファイル106e2に格納される情報は、図12に示すように、ランクと、候補多変量判別式(図12では、Fk(Gly,Leu,Phe,・・・)やFm(Gly,Leu,Phe,・・・)、Fl(Gly,Leu,Phe,・・・)など)と、各候補多変量判別式の検証結果(例えば各候補多変量判別式の評価値)と、を相互に関連付けて構成されている。
図6に戻り、選択女性生殖器癌状態情報ファイル106e3は、後述する変数選択部102h3で選択した変数に対応するアミノ酸濃度データの組み合わせを含む女性生殖器癌状態情報を格納する。図13は、選択女性生殖器癌状態情報ファイル106e3に格納される情報の一例を示す図である。選択女性生殖器癌状態情報ファイル106e3に格納される情報は、図13に示すように、個体番号と、後述する女性生殖器癌状態情報指定部102gで指定した女性生殖器癌状態指標データと、後述する変数選択部102h3で選択したアミノ酸濃度データと、を相互に関連付けて構成されている。
図6に戻り、多変量判別式ファイル106e4は、後述する多変量判別式作成部102hで作成した多変量判別式を格納する。図14は、多変量判別式ファイル106e4に格納される情報の一例を示す図である。多変量判別式ファイル106e4に格納される情報は、図14に示すように、ランクと、多変量判別式(図14では、Fp(Phe,・・・)やFp(Gly,Leu,Phe)、Fk(Gly,Leu,Phe,・・・)など)と、各式作成手法に対応する閾値と、各多変量判別式の検証結果(例えば各多変量判別式の評価値)と、を相互に関連付けて構成されている。
図6に戻り、判別値ファイル106fは、後述する判別値算出部102iで算出した判別値を格納する。図15は、判別値ファイル106fに格納される情報の一例を示す図である。判別値ファイル106fに格納される情報は、図15に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、ランク(多変量判別式を一意に識別するための番号)と、判別値と、を相互に関連付けて構成されている。
図6に戻り、評価結果ファイル106gは、後述する判別値基準評価部102jでの評価結果(具体的には、後述する判別値基準判別部102j1での判別結果)を格納する。図16は、評価結果ファイル106gに格納される情報の一例を示す図である。評価結果ファイル106gに格納される情報は、評価対象である個体(サンプル)を一意に識別するための個体番号と、予め取得した評価対象のアミノ酸濃度データと、多変量判別式で算出した判別値と、女性生殖器癌の状態に関する評価結果と、を相互に関連付けて構成されている。
図6に戻り、記憶部106には、上述した情報以外にその他情報として、Webサイトをクライアント装置200に提供するための各種のWebデータや、CGIプログラム等が記録されている。Webデータとしては後述する各種のWebページを表示するためのデータ等があり、これらデータは例えばHTMLやXMLで記述されたテキストファイルとして形成されている。また、Webデータを作成するための部品用のファイルや作業用のファイルやその他一時的なファイル等も記憶部106に記憶される。記憶部106には、必要に応じて、クライアント装置200に送信するための音声をWAVE形式やAIFF形式の如き音声ファイルで格納したり、静止画や動画をJPEG形式やMPEG2形式の如き画像ファイルで格納したりすることができる。
通信インターフェース部104は、女性生殖器癌評価装置100とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
入出力インターフェース部108は、入力装置112や出力装置114に接続する。ここで、出力装置114には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下では、出力装置114をモニタ114として記載する場合がある。)。入力装置112には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
制御部102は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部102は、図示の如く、大別して、要求解釈部102aと閲覧処理部102bと認証処理部102cと電子メール生成部102dとWebページ生成部102eと受信部102fと女性生殖器癌状態情報指定部102gと多変量判別式作成部102hと判別値算出部102iと判別値基準評価部102jと結果出力部102kと送信部102mとを備えている。制御部102は、データベース装置400から送信された女性生殖器癌状態情報やクライアント装置200から送信されたアミノ酸濃度データに対して、欠損値のあるデータの除去・外れ値の多いデータの除去・欠損値のあるデータの多い変数の除去などのデータ処理も行う。
要求解釈部102aは、クライアント装置200やデータベース装置400からの要求内容を解釈し、その解釈結果に応じて制御部102の各部に処理を受け渡す。閲覧処理部102bは、クライアント装置200からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行なう。認証処理部102cは、クライアント装置200やデータベース装置400からの認証要求を受けて、認証判断を行う。電子メール生成部102dは、各種の情報を含んだ電子メールを生成する。Webページ生成部102eは、利用者がクライアント装置200で閲覧するWebページを生成する。
受信部102fは、クライアント装置200やデータベース装置400から送信された情報(具体的には、アミノ酸濃度データや女性生殖器癌状態情報、多変量判別式など)を、ネットワーク300を介して受信する。女性生殖器癌状態情報指定部102gは、多変量判別式を作成するにあたり、対象とする女性生殖器癌状態指標データおよびアミノ酸濃度データを指定する。
多変量判別式作成部102hは、受信部102fで受信した女性生殖器癌状態情報や女性生殖器癌状態情報指定部102gで指定した女性生殖器癌状態情報に基づいて多変量判別式を作成する。具体的には、多変量判別式作成部102hは、女性生殖器癌状態情報から、候補多変量判別式作成部102h1、候補多変量判別式検証部102h2および変数選択部102h3を繰り返し実行させることにより蓄積された検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで、多変量判別式を作成する。
なお、多変量判別式が予め記憶部106の所定の記憶領域に格納されている場合には、多変量判別式作成部102hは、記憶部106から所望の多変量判別式を選択することで、多変量判別式を作成してもよい。また、多変量判別式作成部102hは、多変量判別式を予め格納した他のコンピュータ装置(例えばデータベース装置400)から所望の多変量判別式を選択しダウンロードすることで、多変量判別式を作成してもよい。
ここで、多変量判別式作成部102hの構成について図17を参照して説明する。図17は、多変量判別式作成部102hの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。多変量判別式作成部102hは、候補多変量判別式作成部102h1と、候補多変量判別式検証部102h2と、変数選択部102h3と、をさらに備えている。候補多変量判別式作成部102h1は、女性生殖器癌状態情報から所定の式作成手法に基づいて多変量判別式の候補である候補多変量判別式を作成する。なお、候補多変量判別式作成部102h1は、女性生殖器癌状態情報から、複数の異なる式作成手法を併用して複数の候補多変量判別式を作成してもよい。候補多変量判別式検証部102h2は、候補多変量判別式作成部102h1で作成した候補多変量判別式を所定の検証手法に基づいて検証する。なお、候補多変量判別式検証部102h2は、ブートストラップ法、ホールドアウト法、リーブワンアウト法のうち少なくとも1つに基づいて候補多変量判別式の判別率、感度、特異性、情報量基準のうち少なくとも1つに関して検証してもよい。変数選択部102h3は、候補多変量判別式検証部102h2での検証結果から所定の変数選択手法に基づいて候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる女性生殖器癌状態情報に含まれるアミノ酸濃度データの組み合わせを選択する。なお、変数選択部102h3は、検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式の変数を選択してもよい。
図6に戻り、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成した多変量判別式であってThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含むものに基づいて、当該多変量判別式の値である判別値を算出する。
ここで、多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つでもよい。
また、判別値基準判別部102j1で子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成したThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、Gln、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式、Ile、His、Cit、Arg、Tyr、Trpを変数とする分数式もしくはa−ABA、Cit、Metを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、a−ABA、Met、Hisを変数とする線形判別式、Ala、Ile、His、Trp、Argを変数とする線形判別式、Gly、Cit、Met、Pheを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、a−ABA、Met、Tyr、Hisを変数とするロジスティック回帰式、Val、Ile、His、Trp、Argを変数とするロジスティック回帰式、Cit、a−ABA、Met、Tyrを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。
また、判別値基準判別部102j1で子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成したThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Phe、His、Argを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、His、Lys、Argを変数とするロジスティック回帰式、Thr、a−ABA、Met、Hisを変数とするロジスティック回帰式、Cit、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。
また、判別値基準判別部102j1で子宮頸癌または非子宮頸癌であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成したAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、a−ABA、His、Valを変数とする分数式、a−ABA、Met、Valを変数とする分数式もしくはMet、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Val、Met、Lysを変数とする線形判別式、Cit、Met、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、Met、His、Orn、Argを変数とするロジスティック回帰式、Val、Tyr、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とするロジスティック回帰式でもよい。
また、判別値基準判別部102j1で子宮体癌または非子宮体癌であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成したThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Asn、Citを変数とする分数式、Gln、His、Lys、Argを変数とする線形判別式、Gly、Met、Phe、Hisを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とする線形判別式、またはGln、Gly、His、Argを変数とするロジスティック回帰式、Gln、Phe、His、Argを変数とするロジスティック回帰式、Gln、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とするロジスティック回帰式でもよい。
また、判別値基準判別部102j1で卵巣癌または非卵巣癌であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成したThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、Orn、Cit、Metを変数とする分数式、Gln、Cit、Tyrを変数とする分数式もしくはOrn、His、Phe、Trpを変数とする分数式、Ser、Cit、Orn、Trpを変数とする線形判別式、Ser、Cit、Ile、Ornを変数とする線形判別式、Phe、Trp、Orn、Lysを変数とする線形判別式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とする線形判別式、またはSer、Cit、Trp、Ornを変数とするロジスティック回帰式、Gln、Cit、Ile、Tyrを変数とするロジスティック回帰式、Asn、Phe、His、Trpを変数とするロジスティック回帰式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とするロジスティック回帰式でもよい。
また、判別値基準判別部102j1で女性生殖器癌罹患リスク群または健常群であるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成したThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、Phe、His、Met、Pro、Lys、Argを変数とする線形判別式、またはPhe、His、Met、Pro、Lys、Argを変数とするロジスティック回帰式でもよい。
また、判別値基準判別部102j1で子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別する場合には、判別値算出部102iは、受信部102fで受信した評価対象のアミノ酸濃度データに含まれるThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値および多変量判別式作成部102hで作成したThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、この場合に用いる多変量判別式は、Cit、Met、Lys、Asn、Ala、Thr、Gln、a−ABAを変数とするマハラノビス距離法で作成された式、またはHis、Leu、Ser、Thr、Glu、Gln、Ala、Lysを変数とするマハラノビス距離法で作成された式でもよい。
判別値基準評価部102jは、判別値算出部102iで算出した判別値に基づいて、評価対象につき、女性生殖器癌の状態を評価する。判別値基準評価部102jは、判別値基準判別部102j1をさらに備えている。ここで、判別値基準評価部102jの構成について図18を参照して説明する。図18は、判別値基準評価部102jの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。判別値基準判別部102j1は、判別値算出部102iで算出した判別値に基づいて、評価対象につき、女性生殖器癌または非女性生殖器癌であるか否か、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否か、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否か、子宮頸癌または非子宮頸癌であるか否か、子宮体癌または非子宮体癌であるか否か、卵巣癌または非卵巣癌であるか否か、女性生殖器癌罹患リスク群または健常群であるか否か、または、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別する。
図6に戻り、結果出力部102kは、制御部102の各処理部での処理結果(判別値基準評価部102jでの評価結果(具体的には判別値基準判別部102j1での判別結果)を含む)等を出力装置114に出力する。
送信部102mは、評価対象のアミノ酸濃度データの送信元のクライアント装置200に対して評価結果を送信したり、データベース装置400に対して、女性生殖器癌評価装置100で作成した多変量判別式や評価結果を送信したりする。
つぎに、本システムのクライアント装置200の構成について図19を参照して説明する。図19は、本システムのクライアント装置200の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
クライアント装置200は、制御部210とROM220とHD230とRAM240と入力装置250と出力装置260と入出力IF270と通信IF280とで構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
制御部210は、Webブラウザ211、電子メーラ212、受信部213、送信部214を備えている。Webブラウザ211は、Webデータを解釈し、解釈したWebデータを後述するモニタ261に表示するブラウズ処理を行う。なお、Webブラウザ211には、ストリーム映像の受信・表示・フィードバック等を行う機能を備えたストリームプレイヤ等の各種のソフトウェアをプラグインしてもよい。電子メーラ212は、所定の通信規約(例えば、SMTP(Simple Mail Transfer Protocol)やPOP3(Post Office Protocol version 3)等)に従って電子メールの送受信を行う。受信部213は、通信IF280を介して、女性生殖器癌評価装置100から送信された評価結果などの各種情報を受信する。送信部214は、通信IF280を介して、評価対象のアミノ酸濃度データなどの各種情報を女性生殖器癌評価装置100へ送信する。
入力装置250はキーボードやマウスやマイク等である。なお、後述するモニタ261もマウスと協働してポインティングデバイス機能を実現する。出力装置260は、通信IF280を介して受信した情報を出力する出力手段であり、モニタ(家庭用テレビを含む)261およびプリンタ262を含む。この他、出力装置260にスピーカ等を設けてもよい。入出力IF270は入力装置250や出力装置260に接続する。
通信IF280は、クライアント装置200とネットワーク300(またはルータ等の通信装置)とを通信可能に接続する。換言すると、クライアント装置200は、モデムやTAやルータなどの通信装置および電話回線を介して、または専用線を介してネットワーク300に接続される。これにより、クライアント装置200は、所定の通信規約に従って女性生殖器癌評価装置100にアクセスすることができる。
ここで、プリンタ・モニタ・イメージスキャナ等の周辺装置を必要に応じて接続した情報処理装置(例えば、既知のパーソナルコンピュータ・ワークステーション・家庭用ゲーム装置・インターネットTV・PHS端末・携帯端末・移動体通信端末・PDA等の情報処理端末など)に、Webデータのブラウジング機能や電子メール機能を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより、クライアント装置200を実現してもよい。
また、クライアント装置200の制御部210は、制御部210で行う処理の全部または任意の一部を、CPUおよび当該CPUにて解釈して実行するプログラムで実現してもよい。ROM220またはHD230には、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。当該コンピュータプログラムは、RAM240にロードされることで実行され、CPUと協働して制御部210を構成する。また、当該コンピュータプログラムは、クライアント装置200と任意のネットワークを介して接続されるアプリケーションプログラムサーバに記録されてもよく、クライアント装置200は、必要に応じてその全部または一部をダウンロードしてもよい。また、制御部210で行う処理の全部または任意の一部を、ワイヤードロジック等によるハードウェアで実現してもよい。
つぎに、本システムのネットワーク300について図4、図5を参照して説明する。ネットワーク300は、女性生殖器癌評価装置100とクライアント装置200とデータベース装置400とを相互に通信可能に接続する機能を有し、例えばインターネットやイントラネットやLAN(有線/無線の双方を含む)等である。なお、ネットワーク300は、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、携帯回線交換網または携帯パケット交換網(IMT2000方式、GSM方式またはPDC/PDC−P方式等を含む)や、無線呼出網や、Bluetooth(登録商標)等の局所無線網や、PHS網や、衛星通信網(CS、BSまたはISDB等を含む)等でもよい。
つぎに、本システムのデータベース装置400の構成について図20を参照して説明する。図20は、本システムのデータベース装置400の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
データベース装置400は、女性生殖器癌評価装置100または当該データベース装置400で多変量判別式を作成する際に用いる女性生殖器癌状態情報や、女性生殖器癌評価装置100で作成した多変量判別式、女性生殖器癌評価装置100での評価結果などを格納する機能を有する。図20に示すように、データベース装置400は、当該データベース装置400を統括的に制御するCPU等の制御部402と、ルータ等の通信装置および専用線等の有線または無線の通信回路を介して当該データベース装置をネットワーク300に通信可能に接続する通信インターフェース部404と、各種のデータベースやテーブルやファイル(例えばWebページ用ファイル)などを格納する記憶部406と、入力装置412や出力装置414に接続する入出力インターフェース部408と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
記憶部406は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置や、フレキシブルディスクや、光ディスク等を用いることができる。記憶部406には、各種処理に用いる各種プログラム等を格納する。通信インターフェース部404は、データベース装置400とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部404は、他の端末と通信回線を介してデータを通信する機能を有する。入出力インターフェース部408は、入力装置412や出力装置414に接続する。ここで、出力装置414には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下で、出力装置414をモニタ414として記載する場合がある。)。また、入力装置412には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
制御部402は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部402は、図示の如く、大別して、要求解釈部402aと閲覧処理部402bと認証処理部402cと電子メール生成部402dとWebページ生成部402eと送信部402fとを備えている。
要求解釈部402aは、女性生殖器癌評価装置100からの要求内容を解釈し、その解釈結果に応じて制御部402の各部に処理を受け渡す。閲覧処理部402bは、女性生殖器癌評価装置100からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行う。認証処理部402cは、女性生殖器癌評価装置100からの認証要求を受けて、認証判断を行う。電子メール生成部402dは、各種の情報を含んだ電子メールを生成する。Webページ生成部402eは、利用者がクライアント装置200で閲覧するWebページを生成する。送信部402fは、女性生殖器癌状態情報や多変量判別式などの各種情報を、女性生殖器癌評価装置100へ送信する。
[2−3.本システムの処理]
ここでは、以上のように構成された本システムで行われる女性生殖器癌評価サービス処理の一例を、図21を参照して説明する。図21は、女性生殖器癌評価サービス処理の一例を示すフローチャートである。
なお、本処理で用いるアミノ酸濃度データは、個体から予め採取した血液を分析して得たアミノ酸の濃度値に関するものである。ここで、血液中のアミノ酸の分析方法について簡単に説明する。まず、採血した血液サンプルを、ヘパリン処理したチューブに採取し、その後、当該チューブに対して遠心分離を行うことで血漿を分離する。なお、分離したすべての血漿サンプルは、アミノ酸濃度の測定時まで−70℃で凍結保存する。そして、アミノ酸濃度の測定時に、血漿サンプルに対してスルホサリチル酸を添加し、3%濃度調整により除蛋白処理を行う。なお、アミノ酸濃度の測定には、ポストカラムでニンヒドリン反応を用いた高速液体クロマトグラフィー(HPLC)を原理としたアミノ酸分析機を使用した。
まず、Webブラウザ211を表示した画面上で利用者が入力装置250を介して女性生殖器癌評価装置100が提供するWebサイトのアドレス(URLなど)を指定すると、クライアント装置200は女性生殖器癌評価装置100へアクセスする。具体的には、利用者がクライアント装置200のWebブラウザ211の画面更新を指示すると、Webブラウザ211は、女性生殖器癌評価装置100が提供するWebサイトのアドレスを所定の通信規約で女性生殖器癌評価装置100へ送信することで、アミノ酸濃度データ送信画面に対応するWebページの送信要求を、当該アドレスに基づくルーティングで女性生殖器癌評価装置100へ行う。
つぎに、女性生殖器癌評価装置100は、要求解釈部102aで、クライアント装置200からの送信を受け、当該送信の内容を解析し、解析結果に応じて制御部102の各部に処理を移す。具体的には、送信の内容がアミノ酸濃度データ送信画面に対応するWebページの送信要求であった場合、女性生殖器癌評価装置100は、主として閲覧処理部102bで、記憶部106の所定の記憶領域に格納されている当該Webページを表示するためのWebデータを取得し、取得したWebデータをクライアント装置200へ送信する。より具体的には、利用者からアミノ酸濃度データ送信画面に対応するWebページの送信要求があった場合、女性生殖器癌評価装置100は、まず、制御部102で、利用者IDや利用者パスワードの入力を利用者に対して求める。そして、利用者IDやパスワードが入力されると、女性生殖器癌評価装置100は、認証処理部102cで、入力された利用者IDやパスワードと利用者情報ファイル106aに格納されている利用者IDや利用者パスワードとの認証判断を行う。そして、女性生殖器癌評価装置100は、認証可の場合にのみ、閲覧処理部102bで、アミノ酸濃度データ送信画面に対応するWebページを表示するためのWebデータをクライアント装置200へ送信する。なお、クライアント装置200の特定は、クライアント装置200から送信要求と共に送信されたIPアドレスで行う。
つぎに、クライアント装置200は、女性生殖器癌評価装置100から送信されたWebデータ(アミノ酸濃度データ送信画面に対応するWebページを表示するためのもの)を受信部213で受信し、受信したWebデータをWebブラウザ211で解釈し、モニタ261にアミノ酸濃度データ送信画面を表示する。
つぎに、モニタ261に表示されたアミノ酸濃度データ送信画面に対し利用者が入力装置250を介して個体のアミノ酸濃度データなどを入力・選択すると、クライアント装置200は、送信部214で、入力情報や選択事項を特定するための識別子を女性生殖器癌評価装置100へ送信することで、評価対象の個体のアミノ酸濃度データを女性生殖器癌評価装置100へ送信する(ステップSA−21)。なお、ステップSA−21におけるアミノ酸濃度データの送信は、FTP等の既存のファイル転送技術等により実現してもよい。
つぎに、女性生殖器癌評価装置100は、要求解釈部102aで、クライアント装置200から送信された識別子を解釈することによりクライアント装置200の要求内容を解釈し、女性生殖器癌の状態の評価用の多変量判別式の送信要求をデータベース装置400へ行う。
つぎに、データベース装置400は、要求解釈部402aで、女性生殖器癌評価装置100からの送信要求を解釈し、記憶部406の所定の記憶領域に格納した、Thr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式(例えばアップデートされた最新のもの。当該多変量判別式は、1つの分数式または複数の分数式の和、またはロジスティック回帰式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式のいずれか1つである。)を女性生殖器癌評価装置100へ送信する(ステップSA−22)。
ここで、ステップSA−22において女性生殖器癌評価装置100へ送信する多変量判別式は、後述するステップSA−26で子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かを判別する場合には、Thr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、Gln、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式、Ile、His、Cit、Arg、Tyr、Trpを変数とする分数式もしくはa−ABA、Cit、Metを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、a−ABA、Met、Hisを変数とする線形判別式、Ala、Ile、His、Trp、Argを変数とする線形判別式、Gly、Cit、Met、Pheを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、a−ABA、Met、Tyr、Hisを変数とするロジスティック回帰式、Val、Ile、His、Trp、Argを変数とするロジスティック回帰式、Cit、a−ABA、Met、Tyrを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。
また、ステップSA−22において女性生殖器癌評価装置100へ送信する多変量判別式は、後述するステップSA−26で子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かを判別する場合には、Thr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Phe、His、Argを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、His、Lys、Argを変数とするロジスティック回帰式、Thr、a−ABA、Met、Hisを変数とするロジスティック回帰式、Cit、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。
また、ステップSA−22において女性生殖器癌評価装置100へ送信する多変量判別式は、後述するステップSA−26で子宮頸癌または非子宮頸癌であるか否かを判別する場合には、Asn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、a−ABA、His、Valを変数とする分数式、a−ABA、Met、Valを変数とする分数式もしくはMet、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Val、Met、Lysを変数とする線形判別式、Cit、Met、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、Met、His、Orn、Argを変数とするロジスティック回帰式、Val、Tyr、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とするロジスティック回帰式でもよい。
また、ステップSA−22において女性生殖器癌評価装置100へ送信する多変量判別式は、後述するステップSA−26で子宮体癌または非子宮体癌であるか否かを判別する場合には、Thr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Asn、Citを変数とする分数式、Gln、His、Lys、Argを変数とする線形判別式、Gly、Met、Phe、Hisを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とする線形判別式、またはGln、Gly、His、Argを変数とするロジスティック回帰式、Gln、Phe、His、Argを変数とするロジスティック回帰式、Gln、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とするロジスティック回帰式でもよい。
また、ステップSA−22において女性生殖器癌評価装置100へ送信する多変量判別式は、後述するステップSA−26で卵巣癌または非卵巣癌であるか否かを判別する場合には、Thr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、Orn、Cit、Metを変数とする分数式、Gln、Cit、Tyrを変数とする分数式もしくはOrn、His、Phe、Trpを変数とする分数式、Ser、Cit、Orn、Trpを変数とする線形判別式、Ser、Cit、Ile、Ornを変数とする線形判別式、Phe、Trp、Orn、Lysを変数とする線形判別式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とする線形判別式、またはSer、Cit、Trp、Ornを変数とするロジスティック回帰式、Gln、Cit、Ile、Tyrを変数とするロジスティック回帰式、Asn、Phe、His、Trpを変数とするロジスティック回帰式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とするロジスティック回帰式でもよい。
また、ステップSA−22において女性生殖器癌評価装置100へ送信する多変量判別式は、後述するステップSA−26で女性生殖器癌罹患リスク群または健常群であるか否かを判別する場合には、Thr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、Phe、His、Met、Pro、Lys、Argを変数とする線形判別式、またはPhe、His、Met、Pro、Lys、Argを変数とするロジスティック回帰式でもよい。
また、ステップSA−22において女性生殖器癌評価装置100へ送信する多変量判別式は、後述するステップSA−26で子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別する場合には、Thr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含むものでもよい。具体的には、多変量判別式は、Cit、Met、Lys、Asn、Ala、Thr、Gln、a−ABAを変数とするマハラノビス距離法で作成された式、またはHis、Leu、Ser、Thr、Glu、Gln、Ala、Lysを変数とするマハラノビス距離法で作成された式でもよい。
図21の説明に戻り、女性生殖器癌評価装置100は、受信部102fで、クライアント装置200から送信された個体のアミノ酸濃度データおよびデータベース装置400から送信された多変量判別式を受信し、受信したアミノ酸濃度データをアミノ酸濃度データファイル106bの所定の記憶領域に格納すると共に、受信した多変量判別式を多変量判別式ファイル106e4の所定の記憶領域に格納する(ステップSA−23)。
つぎに、女性生殖器癌評価装置100は、制御部102で、ステップSA−23で受信した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去する(ステップSA−24)。
つぎに、女性生殖器癌評価装置100は、判別値算出部102iで、ステップSA−24で欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データおよびステップSA−23で受信した多変量判別式に基づいて、当該多変量判別式の値である判別値を算出し(ステップSA−25)、判別値基準判別部102j1で、ステップSA−25で算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、下記21.〜28.に示す判別のいずれか1つを行い、その判別結果を評価結果ファイル106gの所定の記憶領域に格納する(ステップSA−26)。
21.女性生殖器癌または非女性生殖器癌であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値およびThr、Ser、Asn、Gln、Pro、Gly、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、女性生殖器癌または非女性生殖器癌であるか否かを判別する。
22.子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌、卵巣癌のいずれかまたは非女性生殖器癌であるか否かを判別する。
23.子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌のいずれかまたは非子宮頸癌、非子宮体癌のいずれかであるか否かを判別する。
24.子宮頸癌または非子宮頸癌であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびAsn、Val、Met、Leu、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌または非子宮頸癌であるか否かを判別する。
25.子宮体癌または非子宮体癌であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Pro、Gly、Cit、Val、Met、Ile、Leu、Phe、His、Trp、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮体癌または非子宮体癌であるか否かを判別する。
26.卵巣癌または非卵巣癌であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Ala、Cit、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、卵巣癌または非卵巣癌であるか否かを判別する。
27.子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Glu、Gln、Pro、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体につき、子宮頸癌、子宮体癌、卵巣癌のいずれかであるか否かを判別する。
28.女性生殖器癌罹患リスク群または健常群であるか否かの判別
ステップSA−25では、個体のアミノ酸濃度データに含まれるThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つの濃度値、およびThr、Ser、Asn、Gln、Pro、Ala、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Argのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップSA−26では、算出した判別値に基づいて、評価対象につき、女性生殖器癌罹患リスク群または健常群であるか否かを判別する。
図21の説明に戻り、女性生殖器癌評価装置100は、送信部102mで、ステップSA−26で得た判別結果を、アミノ酸濃度データの送信元のクライアント装置200とデータベース装置400とへ送信する(ステップSA−27)。具体的には、まず、女性生殖器癌評価装置100は、Webページ生成部102eで、判別結果を表示するためのWebページを作成し、作成したWebページに対応するWebデータを記憶部106の所定の記憶領域に格納する。ついで、利用者がクライアント装置200のWebブラウザ211に入力装置250を介して所定のURLを入力し上述した認証を経た後、クライアント装置200は、当該Webページの閲覧要求を女性生殖器癌評価装置100へ送信する。ついで、女性生殖器癌評価装置100は、閲覧処理部102bで、クライアント装置200から送信された閲覧要求を解釈し、判別結果を表示するためのWebページに対応するWebデータを記憶部106の所定の記憶領域から読み出す。そして、女性生殖器癌評価装置100は、送信部102mで、読み出したWebデータをクライアント装置200へ送信すると共に、当該Webデータ又は判別結果をデータベース装置400へ送信する。
ここで、ステップSA−27において、女性生殖器癌評価装置100は、制御部102で、判別結果を電子メールで利用者のクライアント装置200へ通知してもよい。具体的には、まず、女性生殖器癌評価装置100は、電子メール生成部102dで、利用者IDなどを基にして利用者情報ファイル106aに格納されている利用者情報を送信タイミングに従って参照し、利用者の電子メールアドレスを取得する。ついで、女性生殖器癌評価装置100は、電子メール生成部102dで、取得した電子メールアドレスを宛て先とし利用者の氏名および判別結果を含む電子メールに関するデータを生成する。ついで、女性生殖器癌評価装置100は、送信部102mで、生成した当該データを利用者のクライアント装置200へ送信する。
また、ステップSA−27において、女性生殖器癌評価装置100は、FTP等の既存のファイル転送技術等で、判別結果を利用者のクライアント装置200へ送信してもよい。
図21の説明に戻り、データベース装置400は、制御部402で、女性生殖器癌評価装置100から送信された判別結果またはWebデータを受信し、受信した判別結果またはWebデータを記憶部406の所定の記憶領域に保存(蓄積)する(ステップSA−28)。
また、クライアント装置200は、受信部213で、女性生殖器癌評価装置100から送信されたWebデータを受信し、受信したWebデータをWebブラウザ211で解釈し、個体の判別結果が記されたWebページの画面をモニタ261に表示する(ステップSA−29)。なお、判別結果が女性生殖器癌評価装置100から電子メールで送信された場合には、クライアント装置200は、電子メーラ212の公知の機能で、女性生殖器癌評価装置100から送信された電子メールを任意のタイミングで受信し、受信した電子メールをモニタ261に表示する。
以上により、利用者は、モニタ261に表示されたWebページを閲覧することで、女性生殖器癌に関する個体の判別結果を確認することができる。なお、利用者は、モニタ261に表示されたWebページの表示内容をプリンタ262で印刷してもよい。
また、判別結果が女性生殖器癌評価装置100から電子メールで送信された場合には、利用者は、モニタ261に表示された電子メールを閲覧することで、女性生殖器癌に関する個体の判別結果を確認することができる。利用者は、モニタ261に表示された電子メールの表示内容をプリンタ262で印刷してもよい。
これにて、女性生殖器癌評価サービス処理の説明を終了する。
[2−4.第2実施形態のまとめ、およびその他の実施形態]
以上、詳細に説明したように、女性生殖器癌評価システムによれば、クライアント装置200は個体のアミノ酸濃度データを女性生殖器癌評価装置100へ送信し、データベース装置400は女性生殖器癌評価装置100からの要求を受けて女性生殖器癌の判別用の多変量判別式を女性生殖器癌評価装置100へ送信する。そして、女性生殖器癌評価装置100は、(1)クライアント装置200からアミノ酸濃度データを受信すると共にデータベース装置400から多変量判別式を受信し、(2)受信したアミノ酸濃度データおよび多変量判別式に基づいて判別値を算出し、(3)算出した判別値と予め設定した閾値とを比較することで、個体につき、上記21.〜28.に示す判別のいずれか1つを行い、(4)この判別結果をクライアント装置200やデータベース装置400へ送信する。そして、クライアント装置200は女性生殖器癌評価装置100から送信された判別結果を受信して表示し、データベース装置400は女性生殖器癌評価装置100から送信された判別結果を受信して格納する。これにより、女性生殖器癌と非女性生殖器癌との2群判別や子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別、子宮頸癌と非子宮頸癌との2群判別、子宮体癌と非子宮体癌との2群判別、卵巣癌と非卵巣癌との2群判別、女性生殖器癌罹患リスク群と健常群との2群判別、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、これらの2群判別やこれらの判別をさらに精度よく行うことができる。
なお、ステップSA−26において上記22.に示す判別を行う場合、多変量判別式は、Gln、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式、Ile、His、Cit、Arg、Tyr、Trpを変数とする分数式もしくはa−ABA、Cit、Metを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、a−ABA、Met、Hisを変数とする線形判別式、Ala、Ile、His、Trp、Argを変数とする線形判別式、Gly、Cit、Met、Pheを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、a−ABA、Met、Tyr、Hisを変数とするロジスティック回帰式、Val、Ile、His、Trp、Argを変数とするロジスティック回帰式、Cit、a−ABA、Met、Tyrを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌、卵巣癌のいずれかと非女性生殖器癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップSA−26において上記23.に示す判別を行う場合、多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Phe、His、Argを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とする線形判別式、またはVal、His、Lys、Argを変数とするロジスティック回帰式、Thr、a−ABA、Met、Hisを変数とするロジスティック回帰式、Cit、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Cit、Ile、Tyrを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌、子宮体癌のいずれかと非子宮頸癌、非子宮体癌のいずれかとの判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップSA−26において上記24.に示す判別を行う場合、多変量判別式は、a−ABA、His、Valを変数とする分数式、a−ABA、Met、Valを変数とする分数式もしくはMet、His、Cit、Argを変数とする分数式、Gly、Val、His、Argを変数とする線形判別式、Gly、Val、Met、Lysを変数とする線形判別式、Cit、Met、His、Argを変数とする線形判別式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とする線形判別式、またはVal、Leu、His、Argを変数とするロジスティック回帰式、Met、His、Orn、Argを変数とするロジスティック回帰式、Val、Tyr、His、Argを変数とするロジスティック回帰式もしくはHis、Leu、Met、Ile、Tyr、Lysを変数とするロジスティック回帰式でもよい。これにより、子宮頸癌と非子宮頸癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップSA−26において上記25.に示す判別を行う場合、多変量判別式は、Lys、His、Argを変数とする分数式、a−ABA、His、Metを変数とする分数式もしくはIle、His、Asn、Citを変数とする分数式、Gln、His、Lys、Argを変数とする線形判別式、Gly、Met、Phe、Hisを変数とする線形判別式、Cit、Ile、His、Argを変数とする線形判別式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とする線形判別式、またはGln、Gly、His、Argを変数とするロジスティック回帰式、Gln、Phe、His、Argを変数とするロジスティック回帰式、Gln、Ile、His、Argを変数とするロジスティック回帰式もしくはHis、Asn、Val、Pro、Cit、Ileを変数とするロジスティック回帰式でもよい。これにより、子宮体癌と非子宮体癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップSA−26において上記26.に示す判別を行う場合、多変量判別式は、Orn、Cit、Metを変数とする分数式、Gln、Cit、Tyrを変数とする分数式もしくはOrn、His、Phe、Trpを変数とする分数式、Ser、Cit、Orn、Trpを変数とする線形判別式、Ser、Cit、Ile、Ornを変数とする線形判別式、Phe、Trp、Orn、Lysを変数とする線形判別式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とする線形判別式、またはSer、Cit、Trp、Ornを変数とするロジスティック回帰式、Gln、Cit、Ile、Tyrを変数とするロジスティック回帰式、Asn、Phe、His、Trpを変数とするロジスティック回帰式もしくはHis、Trp、Glu、Cit、Ile、Ornを変数とするロジスティック回帰式でもよい。これにより、卵巣癌と非卵巣癌との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
また、ステップSA−26において上記27.に示す判別を行う場合、多変量判別式は、Cit、Met、Lys、Asn、Ala、Thr、Gln、a−ABAを変数とするマハラノビス距離法で作成された式、またはHis、Leu、Ser、Thr、Glu、Gln、Ala、Lysを変数とするマハラノビス距離法で作成された式でもよい。これにより、子宮頸癌と子宮体癌と卵巣癌との判別に特に有用な多変量判別式で得られる判別値を利用して、当該判別をさらに精度よく行うことができる。
また、ステップSA−26において上記28.に示す判別を行う場合、多変量判別式は、Phe、His、Met、Pro、Lys、Argを変数とする線形判別式、またはPhe、His、Met、Pro、Lys、Argを変数とするロジスティック回帰式でもよい。これにより、女性生殖器癌罹患リスク群と健常群との2群判別に特に有用な多変量判別式で得られる判別値を利用して、当該2群判別をさらに精度よく行うことができる。
なお、上述した多変量判別式は、本出願人による国際出願である国際公開第2004/052191号に記載の方法や、本出願人による国際出願である国際公開第2006/098192号に記載の方法(後述する多変量判別式作成処理)で作成することができる。これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を女性生殖器癌の状態の評価に好適に用いることができる。
また、本発明は、上述した第2実施形態以外にも、特許請求の範囲の書類に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。例えば、上述した第2実施形態で説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データおよび検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。例えば、女性生殖器癌評価装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。また、女性生殖器癌評価装置100の各部または各装置が備える処理機能(特に制御部102にて行なわれる各処理機能)については、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて、その全部または任意の一部を実現することができ、ワイヤードロジックによるハードウェアとして実現することもできる。
ここで、「プログラム」とは任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は、必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものを含む。なお、プログラムは、記録媒体に記録されており、必要に応じて女性生殖器癌評価装置100に機械的に読み取られる。記録媒体に記録されたプログラムを各装置で読み取るための具体的な構成や読み取り手順や読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
また、「記録媒体」とは任意の「可搬用の物理媒体」や任意の「固定用の物理媒体」や「通信媒体」を含むものとする。なお、「可搬用の物理媒体」とはフレキシブルディスクや光磁気ディスクやROMやEPROMやEEPROMやCD−ROMやMOやDVD等である。「固定用の物理媒体」とは各種コンピュータシステムに内蔵されるROMやRAMやHD等である。「通信媒体」とは、LANやWANやインターネット等のネットワークを介してプログラムを送信する場合における通信回線や搬送波のように、短期にプログラムを保持するものである。
最後に、女性生殖器癌評価装置100で行う多変量判別式作成処理の一例について図22を参照して詳細に説明する。図22は多変量判別式作成処理の一例を示すフローチャートである。なお、当該多変量判別式作成処理は、女性生殖器癌状態情報を管理するデータベース装置400で行ってもよい。
なお、本説明では、女性生殖器癌評価装置100は、データベース装置400から事前に取得した女性生殖器癌状態情報を、女性生殖器癌状態情報ファイル106cの所定の記憶領域に格納しているものとする。また、女性生殖器癌評価装置100は、女性生殖器癌状態情報指定部102gで事前に指定した女性生殖器癌状態指標データおよびアミノ酸濃度データを含む女性生殖器癌状態情報を、指定女性生殖器癌状態情報ファイル106dの所定の記憶領域に格納しているものとする。
まず、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、指定女性生殖器癌状態情報ファイル106dの所定の記憶領域に格納されている女性生殖器癌状態情報から所定の式作成手法に基づいて候補多変量判別式を作成し、作成した候補多変量判別式を候補多変量判別式ファイル106e1の所定の記憶領域に格納する(ステップSB−21)。具体的には、まず、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、ロジスティック回帰分析、k−means法、クラスター解析、決定木などの多変量解析に関するものを含む。)の中から所望のものを1つ選択し、選択した式作成手法に基づいて、作成する候補多変量判別式の形(式の形)を決定する。つぎに、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、女性生殖器癌状態情報に基づいて、選択した式選択手法に対応する種々(例えば平均や分散など)の計算を実行する。つぎに、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、計算結果および決定した候補多変量判別式のパラメータを決定する。これにより、選択した式作成手法に基づいて候補多変量判別式が作成される。なお、複数の異なる式作成手法を併用して候補多変量判別式を同時並行(並列)的に作成する場合は、選択した式作成手法ごとに上記の処理を並行して実行すればよい。また、複数の異なる式作成手法を併用して候補多変量判別式を直列的に作成する場合は、例えば、主成分分析を行って作成した候補多変量判別式を利用して女性生殖器癌状態情報を変換し、変換した女性生殖器癌状態情報に対して判別分析を行うことで候補多変量判別式を作成してもよい。
つぎに、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、ステップSB−21で作成した候補多変量判別式を所定の検証手法に基づいて検証(相互検証)し、検証結果を検証結果ファイル106e2の所定の記憶領域に格納する(ステップSB−22)。具体的には、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、指定女性生殖器癌状態情報ファイル106dの所定の記憶領域に格納されている女性生殖器癌状態情報に基づいて候補多変量判別式を検証する際に用いる検証用データを作成し、作成した検証用データに基づいて候補多変量判別式を検証する。なお、ステップSB−21で複数の異なる式作成手法を併用して候補多変量判別式を複数作成した場合には、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、各式作成手法に対応する候補多変量判別式ごとに所定の検証手法に基づいて検証する。ここで、ステップSB−22において、ブートストラップ法やホールドアウト法、リーブワンアウト法などのうち少なくとも1つに基づいて候補多変量判別式の判別率や感度、特異性、情報量基準などのうち少なくとも1つに関して検証してもよい。これにより、女性生殖器癌状態情報や診断条件を考慮した予測性または堅牢性の高い候補指標式を選択することができる。
つぎに、多変量判別式作成部102hは、変数選択部102h3で、ステップSB−22での検証結果から所定の変数選択手法に基づいて、候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる女性生殖器癌状態情報に含まれるアミノ酸濃度データの組み合わせを選択し、選択したアミノ酸濃度データの組み合わせを含む女性生殖器癌状態情報を選択女性生殖器癌状態情報ファイル106e3の所定の記憶領域に格納する(ステップSB−23)。なお、ステップSB−21で複数の異なる式作成手法を併用して候補多変量判別式を複数作成し、ステップSB−22で各式作成手法に対応する候補多変量判別式ごとに所定の検証手法に基づいて検証した場合には、ステップSB−23において、多変量判別式作成部102hは、変数選択部102h3で、ステップSB−22での検証結果に対応する候補多変量判別式ごとに所定の変数選択手法に基づいて候補多変量判別式の変数を選択する。ここで、ステップSB−23において、検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式の変数を選択してもよい。なお、ベストパス法とは、候補多変量判別式に含まれる変数を1つずつ順次減らしていき、候補多変量判別式が与える評価指標を最適化することで変数を選択する方法である。また、ステップSB−23において、多変量判別式作成部102hは、変数選択部102h3で、指定女性生殖器癌状態情報ファイル106dの所定の記憶領域に格納されている女性生殖器癌状態情報に基づいてアミノ酸濃度データの組み合わせを選択してもよい。
つぎに、多変量判別式作成部102hは、指定女性生殖器癌状態情報ファイル106dの所定の記憶領域に格納されている女性生殖器癌状態情報に含まれるアミノ酸濃度データの全ての組み合わせが終了したか否かを判定し、判定結果が「終了」であった場合(ステップSB−24:Yes)には次のステップ(ステップSB−25)へ進み、判定結果が「終了」でなかった場合(ステップSB−24:No)にはステップSB−21へ戻る。なお、多変量判別式作成部102hは、予め設定した回数が終了したか否かを判定し、判定結果が「終了」であった場合には(ステップSB−24:Yes)次のステップ(ステップSB−25)へ進み、判定結果が「終了」でなかった場合(ステップSB−24:No)にはステップSB−21へ戻ってもよい。また、多変量判別式作成部102hは、ステップSB−23で選択したアミノ酸濃度データの組み合わせが、指定女性生殖器癌状態情報ファイル106dの所定の記憶領域に格納されている女性生殖器癌状態情報に含まれるアミノ酸濃度データの組み合わせまたは前回のステップSB−23で選択したアミノ酸濃度データの組み合わせと同じであるか否かを判定し、判定結果が「同じ」であった場合(ステップSB−24:Yes)には次のステップ(ステップSB−25)へ進み、判定結果が「同じ」でなかった場合(ステップSB−24:No)にはステップSB−21へ戻ってもよい。また、多変量判別式作成部102hは、検証結果が具体的には各候補多変量判別式に関する評価値である場合には、当該評価値と各式作成手法に対応する所定の閾値との比較結果に基づいて、ステップSB−25へ進むかステップSB−21へ戻るかを判定してもよい。
つぎに、多変量判別式作成部102hは、検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで多変量判別式を決定し、決定した多変量判別式(選出した候補多変量判別式)を多変量判別式ファイル106e4の所定の記憶領域に格納する(ステップSB−25)。ここで、ステップSB−25において、例えば、同じ式作成手法で作成した候補多変量判別式の中から最適なものを選出する場合と、すべての候補多変量判別式の中から最適なものを選出する場合とがある。
これにて、多変量判別式作成処理の説明を終了する。
子宮頸癌、子宮体癌、卵巣癌の確定診断が行われた子宮頸癌、子宮体癌、卵巣癌の患者群の血液サンプルおよび非子宮頸癌、非子宮体癌、非卵巣癌の群の血液サンプルから、前述のアミノ酸分析法により血中アミノ酸濃度を測定した。ここで、本実施例1および以後の実施例において、子宮頸癌、子宮体癌、卵巣癌の患者群を総称して癌患者群と表記し、非子宮頸癌、非子宮体癌、非卵巣癌の群を非癌群と表記する場合がある。また、非癌群のうち、子宮筋腫などの良性疾患に罹患している群を良性疾患群、それ以外の群を健常群と表記する場合がある。また、良性疾患群と癌患者群の集団を女性生殖器癌罹患リスク群と表記する場合がある。
癌患者群、良性疾患群及び健常群のアミノ酸変数の分布に関する箱ひげ図を図23に、子宮頸癌群、子宮体癌群、卵巣癌群、良性疾患群及び健常群のアミノ酸変数の分布に関する箱ひげ図を図24に示す。また、各群間の2群判別に関して、各アミノ酸変数のROC曲線下面積を計算した結果を図25に示す。
図23、図24、図25に示したように、健常群、良性疾患群、癌患者群の間で、多くのアミノ酸の濃度に差異が認められた。特に、非癌群、良性疾患群もしくは健常群と癌患者群との2群判別や健常群と女性生殖器癌罹患リスク群との2群判別においては、Asn、Val、Met、Leu、His、Trp、Argが常にROC_AUCの値の高い上位12位以内にあることが認められた。また、非癌群、良性疾患群または健常群と子宮頸癌群との2群判別においては、Gly、Val、Leu、Phe、His、Lys、Argが常にROC_AUCの値の高い上位12位以内にあることが認められた。また、非癌群、良性疾患群または健常群と子宮体癌群との2群判別においては、Thr、Asn、Gly、Val、His、Trp、Argが常にROC_AUCの値の高い上位12位以内にあることが認められた。さらに、非癌群、良性疾患群または健常群と卵巣癌群との2群判別においては、Asn、Cit、Val、Met、Leu、Tyr、His、Trp、Lys、Argが常にROC_AUCの値の高い上位12位以内にあることが認められた。このことから、これらのアミノ酸が、子宮頸癌、子宮体癌、卵巣癌に寄与していることが認められた。
実施例1で用いたサンプルデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と非癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式1(図26参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と非癌群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式2(図26参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と非癌群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した、その結果、同等の性能を持つ複数の指標式の中に指標式3(図26参照)が得られた。なお、指標式1、指標式2、指標式3に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と健常群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式4(図26参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と健常群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式5(図26参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と健常群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式6(図26参照)が得られた。なお、指標式4、指標式5、指標式6に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と良性疾患群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式7(図26参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と良性疾患群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式(図26参照)の中に指標式8が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と良性疾患群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式9(図26参照)が得られた。なお、指標式7、指標式8、指標式9に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、健常群と女性生殖器癌罹患リスク群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式10(図26参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、健常群と女性生殖器癌罹患リスク群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式11(図26参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、健常群と女性生殖器癌罹患リスク群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式12(図26参照)が得られた。なお、指標式10、指標式11、指標式12に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別における指標式1〜3の診断性能を検証すべく、癌患者群と非癌群との2群判別についてROC曲線による評価を行った。その結果、図26に示すような診断性能が得られ、これら視指標式が診断性能の高い有用なものであることが判明した。また、図26に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮頸癌群、子宮体癌群、卵巣癌群の判別における指標式4〜6の診断性能を検証すべく、癌患者群と健常群との2群判別についてROC曲線による評価を行った。その結果、図26に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図26に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮頸癌群、子宮体癌群、卵巣癌群の判別における指標式7〜9の診断性能を検証すべく、癌患者群と良性疾患群との2群判別についてROC曲線による評価を行った。その結果、図26に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図26に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮頸癌群、子宮体癌群、卵巣癌群の判別における指標式10〜12の診断性能を検証すべく、健常群と女性生殖器癌罹患リスク群との2群判別についてROC曲線による評価を行った。その結果、図26に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図26に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
指標式1〜12のそれぞれについて、図27から図42に順に示すように、同等の判別の性能を有する指標式が複数得られた。なお、図27から図42に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例1に用いたサンプルデータのうち、子宮頸癌群、子宮体癌群及び非癌群のデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と非癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式13(図43参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と非癌群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式14(図43参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と非癌群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式15(図43参照)が得られた。なお、指標式13、指標式14、指標式15に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と健常群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式16(図43参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と健常群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式17(図43参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と健常群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式18(図43参照)が得られた。なお、指標式16、指標式17、指標式18に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と良性疾患群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式19(図43参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と良性疾患群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式20(図43参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群及び子宮体癌群と良性疾患群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式21(図43参照)が得られた。なお、指標式19、指標式20、指標式21に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群の判別における指標式13〜15の診断性能を検証すべく、子宮頸癌群及び子宮体癌群と非癌群との2群判別についてROC曲線による評価を行った。その結果、図43に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図43に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮頸癌群、子宮体癌群の判別における指標式16〜18の診断性能を検証すべく、子宮頸癌群及び子宮体癌群と健常群との2群判別についてROC曲線による評価を行った。その結果、図43に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図43に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮頸癌群、子宮体癌群の判別における指標式19〜21の診断性能を検証すべく、子宮頸癌群及び子宮体癌群と良性疾患群との2群判別についてROC曲線による評価を行った。その結果、図43に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図43に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
指標式13〜21のそれぞれについて、図44〜図55に順に示すように、同等の判別の性能を有する指標式が複数得られた。なお、図44〜図55に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例1に用いたサンプルデータのうち、子宮頸癌群及び非癌群のデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と非癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式22(図56参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と非癌群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式23(図56参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と非癌群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式24(図56参照)が得られた。なお、指標式22、指標式23、指標式24に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と健常群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式25(図56参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と健常群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式26(図56参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と健常群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式27(図56参照)が得られた。なお、指標式25、指標式26、指標式27に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と良性疾患群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式28(図56参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と良性疾患群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式29(図56参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群と良性疾患群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式30(図56参照)が得られた。なお、指標式28、指標式29、指標式30に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群の判別における指標式22〜25の診断性能を検証すべく、子宮頸癌群と非癌群との2群判別についてROC曲線による評価を行った。その結果、図56に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図56に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮頸癌群の判別における指標式25〜27の診断性能を検証すべく、子宮頸癌群と健常群との2群判別についてROC曲線による評価を行った。その結果、図56に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図56に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮頸癌群の判別における指標式28〜30の診断性能を検証すべく、子宮頸癌群と良性疾患群との2群判別についてROC曲線による評価を行った。その結果、図56に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図56に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
指標式22〜30のそれぞれについて、図57〜図68に順に示すように、同等の判別の性能を有する指標式が複数得られた。なお、図57〜図68に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例1に用いたサンプルデータのうち、子宮体癌群及び非癌群のデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と非癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式31(図69参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と非癌群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式32(図69参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と非癌群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式33(図69参照)が得られた。なお、指標式31、指標式32、指標式33に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と健常群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式34(図69参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と健常群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式35(図69参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と健常群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式36(図69参照)が得られた。なお、指標式34、指標式35、指標式36に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と良性疾患群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式37(図69参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と良性疾患群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式38(図69参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮体癌群と良性疾患群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式39(図69参照)が得られた。なお、指標式37、指標式38、指標式39に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮体癌群の判別における指標式31〜33の診断性能を検証すべく、子宮体癌群と非癌群との2群判別についてROC曲線による評価を行った。その結果、図69に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図69に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮体癌群の判別における指標式34〜36の診断性能を検証すべく、子宮体癌群と健常群との2群判別についてROC曲線による評価を行った。その結果、図69に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図69に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
子宮体癌群の判別における指標式37〜39の診断性能を検証すべく、子宮体癌群と良性疾患群との2群判別についてROC曲線による評価を行った。その結果、図69に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図69に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
指標式31〜39のそれぞれについて、図70〜図81に順に示すように、同等の判別の性能を有する指標式が複数得られた。なお、図70〜図81に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例1に用いたサンプルデータのうち、卵巣癌群及び非癌群のデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と非癌群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式40(図82参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と非癌群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式41(図82参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と非癌群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式42(図82参照)が得られた。なお、指標式40、指標式41、指標式42に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と健常群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式43(図82参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と健常群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式44(図82参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と健常群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式45(図82参照)が得られた。なお、指標式43、指標式44、指標式45に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と良性疾患群との2群判別性能を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式46(図82参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と良性疾患群との2群判別性能を最大化する指標を、線形判別分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式47(図82参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、卵巣癌群と良性疾患群との2群判別性能を最大化する指標を、ロジスティック回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式48(図82参照)が得られた。なお、指標式46、指標式47、指標式48に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
卵巣癌群の判別における指標式40〜42の診断性能を検証すべく、卵巣癌群と非癌群との2群判別についてROC曲線による評価を行った。その結果、図82に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図82に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
卵巣癌群の判別における指標式43〜45の診断性能を検証すべく、卵巣癌群と健常群との2群判別についてROC曲線による評価を行った。その結果、図82に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図82に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
卵巣癌群の判別における指標式46〜48の診断性能を検証すべく、卵巣癌群と良性疾患群との2群判別についてROC曲線による評価を行った。その結果、図82に示すような診断性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。また、図82に示すように、これらの指標式について、最適なカットオフ値や、用いたデータでの感度、特異度、陽性的中率、陰性的中率及び正答率を求めた。
指標式40〜48のそれぞれについて、図83〜図94に順に示すように、同等の判別の性能を有する指標式が複数得られた。なお、図83〜図94に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例1に用いたサンプルデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群、良性疾患群、健常群の3群間のスピアマン順位相関係数を最大化する指標を、本出願人による国際出願である国際公開第2004/052191号に記載の方法を用いて鋭意探索した。その結果、同等の性能を持つ複数の指標式の中に指標式49(図95参照)が得られた。また、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群、良性疾患群、健常群の3群間のスピアマン相関係数を最大化する指標を、重回帰分析(AIC最小基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に指標式50(図95参照)が得られた。なお、指標式49、指標式50に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頸癌群、子宮体癌群、卵巣癌群の判別における指標式49及び50の診断性能を検証すべく、癌患者群、良性疾患群、健常群の3群間のスピアマン順位相関係数、並びに癌患者群と健常群、癌患者群と良性疾患群、及び良性疾患群と健常群の2群判別について、ROC曲線による評価を行った。その結果、図95に示すような判別性能が得られ、これらの指標式が診断性能の高い有用なものであることが判明した。
指標式49及び50のそれぞれについて、図96〜図99に順に示すように、同等の判別の性能を有する指標式が複数得られた。なお、図96〜図99に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例1に用いたサンプルデータのうち、子宮頸癌群、子宮体癌群及び卵巣癌群のデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群、子宮体癌群、卵巣癌群の3群判別性能を最大化する指標を、ステップワイズ変数選択法によるマハラノビス距離による判別分析により探索した。その結果、変数群1としてCit、Met、Lys、Asn、Ala、Thr、Gln、a−ABAが得られた。
変数群1による子宮頸癌群、子宮体癌群、卵巣癌群の診断性能を、判別結果の正答率で評価した。その結果、図100に示すように、子宮頸癌の正答率が90.0%、子宮体癌の正答率が90.2%、卵巣癌の正答率が81.0%、全体の正答率が事前確率を各群それぞれ33.3%で等しいとした場合87.1%、と高い判別性能を示した。
図101〜図103に示すように、変数群1と同等の判別性能を有するアミノ酸変数群の組み合わせが複数得られた。
実施例1に用いたサンプルデータのうち、子宮頸癌群、子宮体癌群及び卵巣癌群のデータを用いた。子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、子宮頸癌群、子宮体癌群、卵巣癌群の3群判別性能を最大化する指標を、ステップワイズ変数選択法による線形判別分析により探索した。その結果、指標式群1として、アミノ酸変数Asn、Pro、Cit、ABA、Val、Ile、Tyr、Phe、Trp、Orn、Lys及び定数項からなる判別式群(図104参照)が得られた。なお、指標式群1における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
指標式群1による子宮頸癌群、子宮体癌群、卵巣癌群の診断性能を、判別結果の正答率で評価した。その結果、図105に示すように、子宮頸癌の正答率が55.0%、子宮体癌の正答率が58.5%、卵巣癌の正答率が81.0%、全体の正答率が事前確率を各群それぞれ33.3%で等しいとした場合63.4%、と高い判別性能を示した。
図106、図107に示すように、指標式群1と同等の判別の性能を有するアミノ酸変数群の組み合わせが複数得られた。
実施例1に用いたサンプルデータを用いた。上述した実施例2に対する比較例として、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して、癌患者群と非癌群、健常群と良性疾患群、癌患者群と健常群、良性疾患群と癌患者群、及び女性生殖器癌罹患リスク群と健常群の2群判別性能を、本出願人による国際出願である国際公開第2006/098192号に記載の指標式1,10,11,13を用いて検証した。その結果、図108に示すように、それぞれの2群判別に対しいずれの式を用いても、上述した実施例2で得られたROC_AUCを上回るROC_AUCの値は得られなかった。これにより、本発明における多変量判別式が、本出願人による国際出願である国際公開第2006/098192号に記載の指標式群よりも、子宮頸癌群、子宮体癌群、卵巣癌群の判別に関して高い判別性能を有することが確認された。
子宮頸癌、子宮体癌、卵巣癌の確定診断が行われた子宮頸癌、子宮体癌、卵巣癌患者群の血液サンプル、および非子宮頸癌、非子宮体癌、非卵巣癌群の血液サンプルから、前述のアミノ酸分析により血中アミノ酸濃度を測定した。アミノ酸濃度の単位はnmol/mlである。ここで、本実施例11および以後の実施例において、子宮頸癌、子宮体癌、卵巣癌の患者群を総称して癌患者群と表記し、非子宮頸癌、非子宮体癌、非卵巣癌の群を非癌群と表記する場合がある。また、子宮頸癌、子宮体癌の患者群を総称して子宮癌患者群と表記する場合がある。また、非癌群のうち、子宮筋腫などの良性疾患に罹患している群を良性疾患群、それ以外の群を健常群と表記する場合がある。また、良性疾患群と癌患者群の集団を女性生殖器癌罹患リスク群と表記する場合がある。
癌患者群および非癌群のアミノ酸変数の分布に関する箱ひげ図を図109に示す。なお、図109において、横軸は非癌群(Control)と癌患者群(Cancer)とを表し、図中のABAおよびCysはそれぞれα−ABA(α−アミノ酪酸)およびCystineを表す。
癌患者群と非癌群の判別を目的に2群間のt検定を実施した。その結果、非癌群に比べて癌患者群では、Pro、Ile、Ornが有意に増加し(有意差確率p<0.05)、またPhe、His、Trp、Asn、Val、Leu、Met、Ser、Thr、Gln、Ala、Tyr、Argが有意に減少した(有意差確率p<0.05)。これにより、アミノ酸変数Pro、Ile、Orn、Phe、His、Trp、Asn、Val、Leu、Met、Ser、Thr、Gln、Ala、Tyr、Argが、癌患者群と非癌群の2群間の判別能を持つことが判明した。
更に、癌患者群と非癌群との2群判別における各アミノ酸変数の判別性能をROC曲線のAUCで評価した。その結果、アミノ酸変数His、Trp、Asn、Val、Leu、MetについてAUCが0.65より大きい値を示した。これにより、アミノ酸変数His、Trp、Asn、Val、Leu、Metが、癌患者群と非癌群の2群間の判別能を持つことが判明した。
子宮癌患者群および非子宮癌群のアミノ酸変数の分布に関する箱ひげ図を図110に示す。なお、図110において、横軸は非子宮癌群(Control)と子宮癌患者群(Cancer)とを表し、図中のABAおよびCysはそれぞれα−ABA(α−アミノ酪酸)およびCystineを表す。
子宮癌患者群と非子宮癌群の判別を目的に2群間のt検定を実施した。その結果、非子宮癌群に比べて子宮癌患者群では、Pro、Ile、Ornが有意に増加し(有意差確率p<0.05)、またPhe、His、Trp、Asn、Val、Leu、Met、Ser、Argが有意に減少した(有意差確率p<0.05)。これにより、アミノ酸変数Pro、Ile、Orn、Phe、His、Trp、Asn、Val、Leu、Met、Ser、Argが、子宮癌患者群と非子宮癌群の2群間の判別能を持つことが判明した。
更に、子宮癌患者群と非子宮癌群との2群判別における各アミノ酸変数の判別性能をROC曲線のAUCで評価した。その結果、アミノ酸変数His、Trp、Asn、Val、Leu、MetについてAUCが0.65より大きい値を示した。これにより、アミノ酸変数His、Trp、Asn、Val、Leu、Metが、子宮癌患者群と非子宮癌群の2群間の判別能を持つことが判明した。
子宮体癌患者群および非子宮体癌群のアミノ酸変数の分布に関する箱ひげ図を図111に示す。なお、図111において、横軸は非子宮体癌群(Control)と子宮体癌患者群(Cancer)とを表し、図中のABAおよびCysはそれぞれα−ABA(α−アミノ酪酸)およびCystineを表す。
子宮体癌患者群と非子宮体癌群の判別を目的に2群間のt検定を実施した。その結果、非子宮体癌群に比べて子宮体癌患者群では、Pro、Ileが有意に増加し(有意差確率p<0.05)、またPhe、His、Trp、Asn、Val、Leu、Met、Ser、Argが有意に減少した(有意差確率p<0.05)。これにより、アミノ酸変数Pro、Ile、Phe、His、Trp、Asn、Val、Leu、Met、Ser、Argが、子宮体癌患者群と非子宮体癌群の2群間の判別能を持つことが判明した。
更に、子宮体癌患者群と非子宮体癌群との2群判別における各アミノ酸変数の判別性能をROC曲線のAUCで評価した。その結果、アミノ酸変数His、Trp、Asn、ValについてAUCが0.65より大きい値を示した。これにより、アミノ酸変数His、Trp、Asn、Valが、子宮体癌患者群と非子宮体癌群の2群間の判別能を持つことが判明した。
子宮頸癌患者群および非子宮頸癌群のアミノ酸変数の分布に関する箱ひげ図を図112に示す。なお、図112において、横軸は非子宮頸癌群(Control)と子宮頸癌患者群(Cancer)とを表し、図中のABAおよびCysはそれぞれα−ABA(α−アミノ酪酸)およびCystineを表す。
子宮頸癌患者群と非子宮頸癌群の判別を目的に2群間のt検定を実施した。その結果、非子宮頸癌群に比べて子宮頸癌患者群では、Phe、His、Trp、Val、Leu、Met、Argが有意に減少した(有意差確率p<0.05)。これにより、アミノ酸変数Phe、His、Trp、Val、Leu、Met、Argが、子宮頸癌患者群と非子宮頸癌群の2群間の判別能を持つことが判明した。
更に、子宮頸癌患者群と非子宮頸癌群との2群判別における各アミノ酸変数の判別性能をROC曲線のAUCで評価した。その結果、アミノ酸変数Phe、His、Val、Leu、MetについてAUCが0.65より大きい値を示した。これにより、アミノ酸変数Phe、His、Val、Leu、Metが、子宮頸癌患者群と非子宮頸癌群の2群間の判別能を持つことが判明した。
卵巣癌患者群および非卵巣癌群のアミノ酸変数の分布に関する箱ひげ図を図113に示す。なお、図113において、横軸は非卵巣癌群(Control)と卵巣癌患者群(Cancer)とを表し、図中のABAおよびCysはそれぞれα−ABA(α−アミノ酪酸)およびCystineを表す。
卵巣癌患者群と非卵巣癌群の判別を目的に2群間のt検定を実施した。その結果、非卵巣癌群に比べて卵巣癌患者群では、Citが有意に増加し(有意差確率p<0.05)、またPhe、His、Trp、Asn、Val、Leu、Met、Ser、Thr、Gln、Ala、Tyr、Lys、Argが有意に減少した(有意差確率p<0.05)。これにより、アミノ酸変数Cit、Phe、His、Trp、Asn、Val、Leu、Met、Ser、Thr、Gln、Ala、Tyr、Lys、Argが、卵巣癌患者群と非卵巣癌群の2群間の判別能を持つことが判明した。
更に、卵巣癌患者群と非卵巣癌群との2群判別における各アミノ酸変数の判別性能をROC曲線のAUCで評価した。その結果、アミノ酸変数His、Trp、Asn、Val、Leu、Met、Thr、Ala、Tyr、Lys、ArgについてAUCが0.65より大きい値を示した。これにより、アミノ酸変数His、Trp、Asn、Val、Leu、Met、Thr、Ala、Tyr、Lys、Argが、卵巣癌患者群と非卵巣癌群の2群間の判別能を持つことが判明した。
女性生殖器癌罹患リスク群および健常群のアミノ酸変数の分布に関する箱ひげ図を図114に示す。なお、図114において、横軸は健常群(Control)と女性生殖器癌罹患リスク群(Risk)とを表し、図中のABAおよびCysはそれぞれα−ABA(α−アミノ酪酸)およびCystineを表す。
女性生殖器癌罹患リスク群と健常群の判別を目的に2群間のt検定を実施した。その結果、健常群に比べて女性生殖器癌罹患リスク群では、Pro、Ile、Ornが有意に増加し(有意差確率p<0.05)、またPhe、His、Trp、Asn、Val、Leu、Met、Ser、Thr、Gln、Ala、Tyr、Argが有意に減少した(有意差確率p<0.05)。これにより、アミノ酸変数Pro、Ile、Orn、Phe、His、Trp、Asn、Val、Leu、Met、Ser、Thr、Gln、Ala、Tyr、Argが、女性生殖器癌罹患リスク群と健常群の2群間の判別能を持つことが判明した。
更に、女性生殖器癌罹患リスク群と健常群との2群判別における各アミノ酸変数の判別性能をROC曲線のAUCで評価した。その結果、アミノ酸変数Phe、His、Trp、MetについてAUCが0.65より大きい値を示した。これにより、アミノ酸変数Phe、His、Trp、Metが、女性生殖器癌罹患リスク群と健常群の2群間の判別能を持つことが判明した。
実施例11で用いたサンプルデータを用いた。癌患者群と非癌群との2群判別性能を最大化する指標をロジスティック解析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式51として、His、Leu、Met、Cit、Ile、Tyrから構成されるロジスティック回帰式(アミノ酸変数His、Leu、Met、Cit、Ile、Tyrの数係数と定数項は順に、−0.10000、−0.04378、−0.17879、0.03911、0.07852、0.03566、5.86036)が得られた。
癌患者群と非癌群との2群判別における指標式51の判別性能をROC曲線のAUCで評価した(図115参照)。その結果、0.898±0.017(95%信頼区間は0.865〜0.932)が得られた。これにより、指標式51が診断性能の高い有用な指標であることが判明した。また、指標式51による癌患者群と非癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−1.021となり、感度85.83%、特異度82.74%が得られた。これにより、指標式51が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式51と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図116、図117、図118および図119に示す。なお、図116、図117、図118および図119に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。癌患者群と非癌群との2群判別性能を最大化する指標を線形判別分析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式52として、His、Leu、Met、Cit、Ile、Tyrから構成される線形判別式(アミノ酸変数His、Leu、Met、Cit、Ile、Tyrの数係数と定数項は順に、−0.09793、−0.04270、−0.17595、0.05477、0.07512、0.03331、6.27211)が得られた。
癌患者群と非癌群との2群判別における指標式52の判別性能をROC曲線のAUCで評価した(図120参照)。その結果、0.899±0.017(95%信頼区間は0.866〜0.932)が得られた。これにより、指標式52が診断性能の高い有用な指標であることが判明した。また、指標式52による癌患者群と非癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−0.08697となり、感度85.04%、特異度93。71%が得られた。これにより、指標式52が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式52と同等の判別性能を有する線形判別式は複数得られた。それらを図121、図122、図123および図124に示す。なお、図121、図122、図123および図124に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。癌患者群と非癌群との2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Asn、Pro、Met、Ile、Leu、His、Trp、OrnがROC曲線下面積0.7,0.75,0.8、0.85をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認された(図125参照)。これにより、これらのアミノ酸を変数として用いた多変量判別式が癌患者群と非癌群との2群間の判別能を持つことが判明した。
実施例11で用いたサンプルデータを用いた。子宮癌患者群と非子宮癌群の2群判別性能を最大化する指標をロジスティック解析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式53として、His、Leu、Met、Cit、Ile、Tyrから構成されるロジスティック回帰式(アミノ酸変数His、Leu、Met、Cit、Ile、Tyrの数係数と定数項は順に、−0.09298、−0.04434、−0.17139、0.5732、0.07267、0.03790、4.67230)が得られた。
子宮癌患者群と非子宮癌群との2群判別における指標式53の判別性能をROC曲線のAUCで評価した(図126参照)。その結果、0.893±0.019(95%信頼区間は0.856〜0.930)が得られた。これにより、指標式53が診断性能の高い有用な指標であることが判明した。また、指標式53による子宮癌患者群と非子宮癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−0.1608となり、感度87.10%、特異度82.74%が得られた。これにより、指標式53が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式53と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図127、図128、図129および図130に示す。なお、図127、図128、図129および図130に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。子宮癌患者群と非子宮癌群との2群判別性能を最大化する指標を線形判別分析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式54として、His、Leu、Met、Cit、Ile、Tyrから構成される線形判別式(アミノ酸変数His、Leu、Met、Cit、Ile、Tyrの数係数と定数項は順に、−0.09001、−0.04336、−0.17394、0.07537、0.06825、0.03673、5.35827)が得られた。
子宮癌患者群と非子宮癌群との2群判別における指標式54の判別性能をROC曲線のAUCで評価した(図131参照)。その結果、0.898±0.017(95%信頼区間は0.865〜0.932)が得られた。これにより、指標式54が診断性能の高い有用な指標であることが判明した。また、指標式54による子宮癌患者群と非子宮癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−1.021となり、感度85.83%、特異度83.06%が得られた。これにより、指標式54が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式54と同等の判別性能を有する線形判別式は複数得られた。それらを図132、図133、図134および図135に示す。なお、図132、図133、図134および図135に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。子宮癌患者群と非子宮癌群との2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Pro、Met、Ile、His、OrnがROC曲線下面積0.7,0.75,0.8、0.85をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認された(図136参照)。これにより、これらのアミノ酸を変数として用いた多変量判別式が子宮癌群と非子宮癌群との2群間の判別能を持つことが判明した。
実施例11で用いたサンプルデータを用いた。子宮体癌患者群と非子宮体癌群との2群判別性能を最大化する指標をロジスティック解析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式55として、His、Asn、Val、Pro、Cit、Ileから構成されるロジスティック回帰式(アミノ酸変数His、Asn、Val、Pro、Cit、Ileの数係数と定数項は順に、−0.10149、−0.07968、−0.01336、0.01018、0.07129、0.04046、4.92397)が得られた。
子宮体癌患者群と非子宮体癌群との2群判別における指標式55の判別性能をROC曲線のAUCで評価した(図137参照)。その結果、0.8988±0.020(95%信頼区間は0.859〜0.938)が得られた。これにより、指標式55が診断性能の高い有用な指標であることが判明した。また、指標式55による子宮体癌患者群と非子宮体癌群との2群判別おけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−1.490となり、感度88.52%、特異度83.06が得られた。これにより、指標式55が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式55と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図138、図139、図140および図141に示す。なお、図138、図139、図140および図141に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。子宮体癌患者群と非子宮体癌群との2群判別性能を最大化する指標を線形判別分析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式56として、His、Asn、Val、Pro、Cit、Ileから構成される線形判別式(アミノ酸変数His、Asn、Val、Pro、Cit、Ileの数係数と定数項は順に、−0.10159、−0.08532、−0.01190、0.01489、0.09591、0.03032、5.61323)が得られた。
子宮体癌患者群と非子宮体癌群との2群判別における指標式56の判別性能をROC曲線のAUCで評価した(図142参照)。その結果、0.886±0.024(95%信頼区間は0.840〜0.933)が得られた。これにより、指標式56が診断性能の高い有用な指標であることが判明した。また、指標式56による子宮体癌患者群と非子宮体癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−1.356となり、感度88.52%、特異度77.85%が得られた。これにより、指標式56が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式56と同等の判別性能を有する線形判別式は複数得られた。それらを図143、図144、図145および図146に示す。なお、図143、図144、図145および図146に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。子宮体癌患者群と非子宮体癌群との2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Asn、Pro、Cit、Val、Ile、His、TrpがROC曲線下面積0.7,0.75,0.8、0.85をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認された(図147参照)。これにより、これらのアミノ酸を変数として用いた多変量判別式が子宮体癌群と非子宮体癌群との2群間の判別能を持つことが判明した。
実施例11で用いたサンプルデータを用いた。子宮頚癌患者群と非子宮頸癌群との2群判別性能を最大化する指標をロジスティック解析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式57として、His、Leu、Met、Ile、Tyr、Lysから構成されるロジスティック回帰式(アミノ酸変数Orn,Gln,Trp,Citの数係数と定数項は順に、−0.08512、−0.07076、−0.23776、0.07109、0.04448、0.01621、5.37165)が得られた。
子宮頚癌患者群と非子宮頸癌群との2群判別における指標式57の判別性能をROC曲線のAUCで評価した(図148参照)。その結果、0.919±0.020(95%信頼区間は0.879〜0.959)が得られた。これにより、指標式57が診断性能の高い有用な指標であることが判明した。また、指標式57による子宮頚癌患者群と非子宮頸癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−2.498となり、感度81.11%、特異度85.87%が得られた。これにより、指標式57が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式57と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図149、図150、図151および図152に示す。なお、図149、図150、図151および図152に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。子宮頚癌患者群と非子宮頚癌群との2群判別性能を最大化する指標を線形判別分析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式58として、His、Leu、Met、Ile、Tyr、Lysから構成される線形判別式(アミノ酸変数His、Leu、Met、Ile、Tyr、Lysの数係数と定数項は順に、−0.09598、−0.08891、−0.25487、0.09919、0.04440、0.02223、7.68576)が得られた。
子宮頚癌患者群と非子宮頚癌群との2群判別における指標式58の判別性能をROC曲線のAUCで評価した(図153参照)。その結果、0.921±0.019(95%信頼区間は0.883〜0.959)が得られた。これにより、指標式58が診断性能の高い有用な指標であることが判明した。また、指標式58による子宮頚癌患者群と非子宮頚癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−0.2189となり、感度90.63%、特異度83.39%が得られた。これにより、指標式58が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式58と同等の判別性能を有する線形判別式は複数得られた。それらを図154、図155、図156および図157に示す。なお、図154、図155、図156および図157に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。子宮頚癌患者群と非子宮頚癌群との2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Val、Met、Leu、Phe、His、OrnがROC曲線下面積0.7,0.75,0.8、0.85をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認された(図158参照)。これにより、これらのアミノ酸を変数として用いた多変量判別式が子宮頚癌群と非子宮頚癌群との2群間の判別能を持つことが判明した。
実施例11で用いたサンプルデータを用いた。卵巣癌患者群と非卵巣癌群との2群判別性能を最大化する指標をロジスティック解析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式59として、His、Trp、Glu,CIt、Ile、Ornから構成されるロジスティック回帰式(アミノ酸変数His、Trp、Glu,CIt、Ile、Ornの数係数と定数項は順に、−0.13767−0.11457−0.04031−0.15449、0.08765、0.04631、10.70464)が得られた。
卵巣癌患者群と非卵巣癌群との2群判別における指標式59の判別性能をROC曲線のAUCで評価した(図159参照)。その結果、0.950±0.016(95%信頼区間は0.917〜0.982)が得られた。これにより、指標式59が診断性能の高い有用な指標であることが判明した。また、指標式59による卵巣癌患者群と非卵巣癌群の2群判別おけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−1.909となり、感度88.24、特異度89.58%が得られた。これにより、指標式59が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式59と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図160、図161、図162および図163に示す。なお、図160、図161、図162および図163に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。卵巣癌患者群と非卵巣癌群との2群判別性能を最大化する指標を線形判別分析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式60として、His、Trp、Glu、Cit、Ile、Ornから構成される線形判別式(アミノ酸変数His、Trp、Glu、Cit、Ile、Ornの数係数と定数項は順に、−0.13983、−0.11341、−0.04572−0.10368、0.12160、0.05459、9.27981)が得られた。
卵巣癌患者群と非卵巣癌群との2群判別における指標式60の判別性能をROC曲線のAUCで評価した(図164参照)。その結果、0.951±0.014(95%信頼区間は0.924〜0.979)が得られた。これにより、指標式60が診断性能の高い有用な指標であることが判明した。また、指標式60による卵巣癌患者群と非卵巣癌群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が0.09512となり、感度88.24%、特異度89.58%が得られた。これにより、指標式60が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式60と同等の判別性能を有する線形判別式は複数得られた。それらを図165、図166、図167および図168に示す。なお、図165、図166、図167および図168に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。卵巣癌患者群と非卵巣癌群との2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Asn、Met、Ile、Leu、His、Trp、OrnがROC曲線下面積0.75,0.8、0.85、0.9をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認された(図169参照)。これにより、これらのアミノ酸を変数として用いた多変量判別式が卵巣癌群と非卵巣癌群との2群間の判別能を持つことが判明した。
実施例11で用いたサンプルデータを用いた。女性生殖器癌罹患リスク群と健常群との2群判別性能を最大化する指標をロジスティック解析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式61として、Phe、His、Met、Pro、Lys、Argから構成されるロジスティック回帰式(アミノ酸変数Phe、His、Met、Pro、Lys、Argの数係数と定数項は順に、−0.06095、−0.11827、−0.14776、0.01459、0.03299、−0.03875、10.40250)が得られた。
女性生殖器癌罹患リスク群と健常群との2群判別における指標式61の判別性能をROC曲線のAUCで評価した(図170参照)。その結果、0.903±0.014(95%信頼区間は0.876〜0.930)が得られた。これにより、指標式61が診断性能の高い有用な指標であることが判明した。また、指標式61による女性生殖器癌罹患リスク群と健常群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−0.5313となり、感度89.14%、特異度76.53%が得られた。これにより、指標式61が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式61と同等の判別性能を有するロジスティック回帰式は複数得られた。それらを図171、図172、図173および図174に示す。なお、図171、図172、図173および図174に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。女性生殖器癌罹患リスク群と健常群との2群判別性能を最大化する指標を線形判別分析(ROC曲線下面積最大化基準による変数網羅法)により探索した。その結果、指標式62として、Phe、His、Met、Pro、Lys、Argから構成される線形判別式(アミノ酸変数Phe、His、Met、Pro、Lys、Argの数係数と定数項は順に、−0.05213、−0.10933、−0.14686、0.01480、0.03207、−0.03318、8.84450)が得られた。
女性生殖器癌罹患リスク群と健常群との2群判別における指標式62の判別性能をROC曲線のAUCで評価した(図175参照)。その結果、0.903±0.014(95%信頼区間は0.876〜0.930)が得られた。これにより、指標式62が診断性能の高い有用な指標であることが判明した。また、指標式62による女性生殖器癌罹患リスク群と健常群との2群判別におけるカットオフ値について、感度と特異度の平均値について最適なカットオフ値を求めると、カットオフ値が−0.4778となり、感度88.69%、特異度77.93%が得られた。これにより、指標式62が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式62と同等の判別性能を有する線形判別式は複数得られた。それらを図176、図177、図178および図179に示す。なお、図176、図177、図178および図179に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11で用いたサンプルデータを用いた。女性生殖器癌罹患リスク群と健常群との2群判別を行う線形判別式を変数網羅法により全て抽出した。このとき、各式に出現するアミノ酸変数の最大値は6として、この条件を満たす全ての式のROC曲線下面積を計算した。このとき、ROC曲線下面積がある閾値以上の式中で、各アミノ酸が出現する頻度を測定した結果、Pro、Met、Phe、His、Trp、ArgがROC曲線下面積0.7,0.75,0.8、0.85をそれぞれ閾値としたときに、常に高頻度で抽出されるアミノ酸の上位10位以内となることが確認された(図180参照)。これにより、これらのアミノ酸を変数として用いた多変量判別式が女性生殖器癌罹患リスク群と健常群の2群間の判別能を持つことが判明した。
実施例11に用いたサンプルデータを用いた。癌患者群、良性疾患群、健常群の3群判別性能を最大化する指標を線形判別分析(スピアマン順位相関係数最大化基準による変数網羅法)により探索した。その結果、同等の性能を持つ複数の指標式の中に、指標式63「His、Trp、Met、Pro、Ile、Lysから構成される線形判別式(アミノ酸変数His、Trp、Met、Pro、Ile、Lysの数係数と定数項は順に、−0.02749、−0.01483、−0.04099、0.00232、0.01338、0.00419)」が得られた。癌患者群、良性疾患群、健常群の3群判別における指標式63の判別性能をスピアマン順位相関係数で評価した。その結果、0.728が得られた。これにより、指標式63が診断性能の高い有用な指標であることが判明した。また、癌患者群と健常群、癌患者群と良性疾患群、及び良性疾患群と健常群のそれぞれの2群判別における指標式63の判別性能をROC曲線のAUCで評価した。その結果、それぞれの2群判別に対して、0.943、0.757、0.841が得られた。これにより、指標式63が診断性能の高い有用な指標であることが判明した。なお、このほかに指標式63と同等の判別性能を有する線形判別式は複数得られた。それらを図181および図182に示す。なお、図181および図182に示す式における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
実施例11に用いたサンプルデータのうち、子宮頚癌群、子宮体癌群及び卵巣癌群のデータを用いた。子宮頚癌群、子宮体癌群、卵巣癌群の3群判別性能を最大化するアミノ酸変数を、マハラノビス距離による判別分析により探索した。その結果、変数群1として、His、Leu、Ser、Thr、Glu、Gln、Ala、Lysが得られた。
子宮頚癌群、子宮体癌群、卵巣癌群の3群判別における変数群1の判別性能を、判別結果の正答率で評価した。その結果、全体の正答率が80.3%と高い判別性能を示した。なお、図183および図184に示すように、変数群1と同等の判別性能を有するアミノ酸変数群の組み合わせが複数得られた。
実施例11に用いたサンプルデータのうち、子宮頚癌群、子宮体癌群及び卵巣癌群のデータを用いた。子宮頚癌群、子宮体癌群、卵巣癌群の3群判別性能を最大化する指標を線形判別分析により探索した。その結果、アミノ酸変数Phe、Trp、Pro、Glu、Cit、Tyr、Lys及び定数項からなる線形判別式群1が得られた。なお、線形判別式群1における各係数の値は、それを実数倍したものでもよく、定数項の値は、それに任意の実定数を加減乗除したものでもよい。
子宮頚癌群、子宮体癌群、卵巣癌群の3群判別における線形判別式群1の判別性能を、判別結果の正答率で評価した。その結果、全体の正答率が62.2%と高い判別性能を示した。なお、図185、図186に示すように、線形判別式群1と同等の判別性能を有する線形判別式群を構成するアミノ酸変数群の組み合わせが複数得られた。