JP3480940B2 - ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法 - Google Patents

ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法

Info

Publication number
JP3480940B2
JP3480940B2 JP52872997A JP52872997A JP3480940B2 JP 3480940 B2 JP3480940 B2 JP 3480940B2 JP 52872997 A JP52872997 A JP 52872997A JP 52872997 A JP52872997 A JP 52872997A JP 3480940 B2 JP3480940 B2 JP 3480940B2
Authority
JP
Japan
Prior art keywords
variables
data
variable
training
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP52872997A
Other languages
English (en)
Other versions
JP2000501869A (ja
Inventor
ラポイント,ジエローム
デジーノ,デユアン・デイ
Original Assignee
アデザ・バイオメデイカル・コーポレイシヨン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アデザ・バイオメデイカル・コーポレイシヨン filed Critical アデザ・バイオメデイカル・コーポレイシヨン
Publication of JP2000501869A publication Critical patent/JP2000501869A/ja
Application granted granted Critical
Publication of JP3480940B2 publication Critical patent/JP3480940B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

【発明の詳細な説明】 本出願は、1996年2月9日出願、Jerome Lapointeお
よびDuane DeSienoの米国特許出願第08/599275号「METH
OD FOR DEVELOPING MEDICAL AND BIOCHEMICAL DIAGNOST
IC TESTS USING NEURAL NETWORKS」の一部継続出願であ
り、かつ1996年2月9日出願、Jerome LapointeおよびD
uane DeSienoの米国仮特許出願第60/011449号「METHOD
AND APPARATUS FOR AIDING IN THE DIAGNOSIS OF ENDOM
ETRIOSIS USING A PLURALITY OF PARAMETERS SUITED FO
R ANALYSIS THROUGH A NEURAL NETWORK」の35U.S.C§11
9(e)による優先権を主張するものである。
上記の出願および仮出願それぞれの主題は、全体とし
て参照により本発明の一部となる。
マイクロフィッシュ付録 本明細書に記載のプログラム用のコンピュータプログ
ラムソースコードを含む二つのコンピュータ付録は、本
願の出願と同時に提出されている。このコンピュータ付
録は、37C.F.R.1.96(b)に従ってマイクロフィッシュ
付録に変換できる。以下「マイクロフィッシュ付録」と
呼ぶコンピュータ付録は、それぞれ全体として参照によ
り本発明の一部となる。
したがって、本特許文献の開示の一部は、著作権保護
を受ける資料を含む。著作権所有者は、本特許文献また
は特許開示のいずれかが特許商標庁特許ファイルまたは
レコードに記載されたときに、それによるファクシミリ
複製に異議はないが、それ以外の場合すべての著作権は
どんなものでも留保する。
発明の分野 本発明の主題は、医療診断補助装置の開発のための、
予測技術、特に非線形予測技術の使用に関する。特に、
医療診断ツールおよび診断の方法の開発のために患者病
歴情報からの入力を有するニューラルネットワークおよ
び他のエキスパートシステムに対して有効なトレーニン
グ技法が提供される。
発明の背景 データ収集、意思決定支援システムおよびニューラルネ
ットワーク いくつかのコンピュータ意思決定支援システムは、情
報を分類し、かつ入力データ中のパターンを識別する能
力を有し、大量の変数を有するデータセットおよび変数
間の複雑な相互作用を評価する場合に特に有用である。
集合的に「データ収集」または「データベース中の知識
発見」(本明細書では意思決定支援システム)と呼ばれ
るこれらのコンピュータ意思決定システムは、プロセッ
サ、内部デバイスおよび周辺デバイス、メモリデバイス
および入出力インタフェースを有する同じ基本ハードウ
ェア構成要素、例えば、パーソナルコンピュータ(PC)
を使用する。システム間の区別は、ソフトウェア中で起
こり、より基本的には、ソフトウェアがそれに基づいて
いるパラダイム中で起こる。意思決定支援機能を提供す
るパラダイムは、回帰方法、決定ツリー、判別分析、パ
ターン認識、ベイズの決定理論、およびファジー論理を
含む。より広く使用されている意思決定支援コピュータ
システムの一つは人工ニューラルネットワークである。
人工ニューラルネットワークまたは「ニューラルネッ
ト」は、ニューロンと呼ばれる個々の処理要素が層中に
配列され、連続的な層中の要素間の多数の相互接続を備
える並列情報処理ツールである。処理要素の働きは、処
理要素の出力が一般に非線形の伝達関数によって決定さ
れる生物学神経細胞に近似するようにモデル化される。
ニューラルネットワークの代表的なモデルでは、入力を
受け取る要素用の入力層、出力を発生する一つまたは複
数の要素を含む出力層、およびそれらの間の要素の一つ
または複数の隠れた層中に処理要素が配列される。隠れ
た層は、非線形問題をそれによって解決できる手段を与
える。処理要素中、要素への入力信号は、各入力に関連
する重み係数に従って算術的に重み付けされる。得られ
た重み付けされた合計は、S字形関数など、選択された
非線形伝達関数によって変換されて、各処理要素ごと
に、その値が0から1まで変動する出力をもたらす。学
習プロセスは「トレーニング」と呼ばれ、特定の処理要
素が、他の処理要素の出力と結合したときにニューラル
ネットワークの出力とトレーニングデータ中に提示され
た所望の出力との間に生じた誤差を最小限に抑える結果
を発生する出力を与えるように、処理要素の重みに対す
る一連のインタラクティブ調整を必要とする試行錯誤プ
ロセスである。要素の重みの調整は誤差信号によってト
リガされる。トレーニングデータは、各例がニューラル
ネットワークに提示されるべき一組の入力値および関連
する一組の所望の出力値を含むいくつかのトレーニング
例として説明される。
一般的なトレーニング方法は、誤差信号をネットワー
ク中を逆方向に伝搬させる逆方向伝搬または「バックプ
ロップ」である。誤差信号は、所与の要素の重みをどの
くらい変化させるべきかおよび誤差勾配を決定するため
に使用される。その目的は、平均二乗誤差の大域的最小
値に収束することである。収束に向かう経路、すなわち
下り勾配はステップの形でとられる。各ステップは、処
理要素の入力重みの調整である。各ステップのサイズは
学習率によって決定される。下り勾配の傾斜は、収束が
達成されたという誤った印象を与え、不正確な結果をも
たらす極小値の働きをする谷を有する平坦な領域および
急な領域を含む。
バックプロップのいくつかの変形は、前の重み変化値
の一部が現在の値に追加される運動量項を組み込む。こ
れは、運動量をアルゴリズムの軌道の下り勾配中に追加
する。これは、アルゴリズムの軌道が極小値中に「捕
獲」されるのを防ぐ。運動量項を含む一つの逆方向伝搬
方法は、運動量率が適応性のある「クイックプロップ」
である。クイックプロップ変形は、Fahlman(「Fast Le
arning Variations on Back−Propagation:An Empirica
l Study」、Proceedings on the 1988 Connectionist M
odels Summer School、ピッツバーグ、1988年、D.Toure
tzky他編、pp.38−51、Morgan Kaufmann、カリフォルニ
ア州San Mateo、Lebriereとの共著、「The Cascade−Co
rrelation Learning Architecture」、Advances in Neu
ral Information Processing Systems2(デンバー、198
9年)、D.Touretzky編、pp.524−32、Morgan Kaufman
n、カリフォルニア州San Mateo参照)によって記載され
ている。クイックプロップアリゴリズムは、Carnegie M
ellon UniversityのSchool of Computer Scienceによっ
て維持されるArtificial Intelligence Repositoryか
ら、公的に入手でき、インターネットを介してダウンロ
ードできる。クイックプロップでは、動的運動量率を勾
配の傾斜に基づいて計算する。傾斜が直前の重み調整の
後の傾斜よりも小さいが、それと同じ符号を有する場
合、重み変化は加速する。加速率は、傾斜値間の連続的
な差の大きさによって決定される。現在の傾斜が前の傾
斜と反対の方向である場合、重み変化は減速する。クイ
ックプロップ方法は、収束速度を改善し、できる限り急
な下り勾配を与え、極小値への収束を防ぐのを助ける。
ニューラルネットワークが十分なトレーニングデータ
に基づいてトレーニングされるとき、ニューラルネット
ワークは、トレーニングデータの一部でなかった新しい
入力データの組用の正確な解決策に対して一般化するこ
とができる連想メモリの働きをする。ニューラルネット
ワークは、完全なデータがない場合または雑音がある場
合でも動作できることが示されている。また、新しいデ
ータまたはテストデータに対するネットワークの性能は
トレーニングデータに対する性能よりも低くなる傾向に
あることが観測されている。テストデータに対する性能
の差は、ネットワークがトレーニングデータから一般化
することができた範囲を示す。しかしながら、ニューラ
ルネットワークは、再トレーニングでき、したがって新
しいデータから学習でき、ネットワークの全体的な性能
を改善できる。
したがって、ニューラルネットは、医療診断など、予
測を必要とする領域を含めて、多数の様々な問題に好適
となる特性を有する。
ニューラルネットおよび診断 患者を診断および/または治療する場合、医師は、患
者の状態、症状、および適用できる医療診断テストの結
果を使用して、患者の疾病状態または状態を識別する。
医師は、症状およびテスト結果と特定の診断との関連を
慎重に決定し、特定の診断を行う際に経験および直感に
基づく判断を使用しなければならない。医療診断では、
医療病歴、物理的試験、生化学テストを含むいくつかの
情報源から情報を統合する必要がある。試験およびテス
トおよび質問に対する答えの結果に基づいて、医師は、
その人のトレーニング、経験、知識、専門知識を使用し
て、診断を定形化する。最終的な診断には、検証または
定式化するために後続の外科手順が必要である。したが
って、診断のプロセスは、意思決定支援、直感、経験の
組合せを必要とする。医師の診断の有効性は、その人の
経験および能力に依存する。
医療診断の予測的および直感的性質のために、ニュー
ラルネットワークおよびこのプロセスを助ける他のエキ
スパートシステムを開発する試みがなされている。医療
診断へのニューラルネットワークの適用が報告されてい
る。例えば、ニューラルネットワークは、心臓血管障害
の診断を助けるために使用されている(例えば、Baxt
(1991年)「Use of an Artificial Neural Network fo
r the Diagnosis of Myocardial Infarction」、Annals
of Internal Medicine 115:843;Baxt(1992年)「Impr
oving the Accuracy of an Artificial Neural Network
Using Multiple Differently Trained Networks」、Ne
ural Computation 4:772;Baxt(1992年)「Analysis of
the clinical variables that drive decision in an
artificial neural network trained to identify the
presence of myocardial infarction」、Annals of Eme
rgency Medicine 21:1439;Baxt(1994年)「Complexit
y,chaos and human physiology:the justification for
non−linear neural computational analysis」、Canc
er Letters 77:85参照)。他の医療診断用途としては、
癌診断(例えば、Maclin他(1991年)「Using Neural N
etworks to Diagnose Cancer」Journal of Medical Sys
tems 15:11−9;Rogers他(1994年)「Artificial Neura
l Networks for Early Detection and Diagnosis of Ca
ncer」Cancer Letters 77:79−83;Wilding他(1994年)
「Application of Backpropogation Neural Networks t
o Diagnosis of Breast and Ovarian Cancer」Cancer L
etters 77:145−53),neuromuscular disorders(Patti
chis他(1995年を参照)「Neural Network Models in E
MG Diagnosis」、IEEE Transactions on Biomedical En
gineering 42:5:486−495参照)および慢性疲労症候群
(Solms他(1996年)「A Neural Network Diagnostic T
ool for the Chronic Fatigue Syndrome」、Internatio
nal Conference on Neural Networks,Paper No.108を参
照)にニューラルネットワークを使用することである。
しかしながら、これらの方法は、広い範囲の状態に対し
て実際的な診断テストの開発に関連する重大な問題を処
理できず、また入力変数の選択を処理しない。
MYCIN(Davis他、「Production Systems as a Repres
entation for a Knowledge−based Consultation Progr
am」、Artificial Intelligence、1977年、8:1:15−4
5)およびその子孫TEIRESIAS、EMYCIN、PUFF、CENTAU
R、VM、GUIDON、SACON、ONCOCINおよびROGETを含む知識
ベースのエキスパートシステムを含めて、医療診断に応
用できるニューラルネットワーク以外のコンピュータ意
思決定支援方法が報告されている。MYCINは、いくつか
の伝染病を診断し、かつ抗菌療法を規定する対話式プロ
グラムである。そのような知識ベースのシステムは、実
際の知識および規則またはその知識を使用するための他
の方法を含む。すべての情報および規則は、ニューラル
ネットワークの場合と同様に、入力データに基づいて所
望の結果に到達するためにそれ自体の手順を開発するシ
ステム以外のシステムのメモリ中に事前にプログラムさ
れる。他のコンピュータ診断方法は、トレーニングパタ
ーンおよびアプリオリ情報からの確率密度関数に基づい
てパターンを分類する信念または因果的確率的ネットワ
ークとも呼ばれるベイズのネットワークである。乳癌と
診断する乳房X線写真の解釈に使用されるベイズの意思
決定システムが報告されている(Roberts他「MammoNet:
A Bayesian Network diagnosing Breast Cancer」、Mid
west Artificial Intelligence and Cognitive Science
Society Conference,イリノイ州Carbondale,1995年4
月)and Hypertension(Blinowska他(1993年)「Diagn
ostica−A Bayesian Decision−Aid System−Applied t
o Hypertension Diagnosis」、IEEE Transactions on B
iomedical Engineering 40:230−35)。ベイズの意思決
定システムは、線形関係の信頼性および処理できる入力
データ点の数に関して若干制限され、変数間の非線形関
係を必要とする意思決定支援にはあまり適さない。ニュ
ーラルネットワークの処理要素を使用してベイズの方法
を実施すれば、これらの制限の一部を克服できる(例え
ばPenny他(1996年)、「Neural Networks in Clinical
Medicine」、Medical Decision−support、1996年、1
6:4:386−98参照)。これらの方法は、医師をまねるこ
とによって、重要な変数がシステム中に入力される障害
を診断するために使用されている。しかしながら、これ
らのシステムを使用して、既存の診断手順を改善するこ
とが重要であろう。
子宮内膜症 子宮内膜症は、子宮状組織が子宮外で成長することで
ある。これは、約15〜30パーセントの生殖年齢女性に影
響を及ぼす。子宮内膜症の原因は未知であるが、後退月
経、子宮から腹膜腔中への子宮内膜組織および細胞(月
経堆積物)の退潮に起因しうる。後退月経はたいていの
女性またはすべての女性に起こると考えられるが、なぜ
ある女性が子宮内膜症になり、他の女性は子宮内膜症に
ならないのかははっきりしない。
子宮内膜症を有するすべての女性が症状を示すか、ま
たはその疾病を煩うとは限らない。子宮内膜症の程度ま
たは重さは症状に相関しない。重い疾病を有する女性は
完全に無症候性であり、最小の疾病を有する他の女性は
耐え難い痛みを受ける。不妊症、骨盤痛、月経困難症、
子宮内膜症の過去の発生など、子宮内膜症に関連してい
る症状は、しばしば子宮内膜症を有しない女性に起こ
る。他の場合には、これらの症状は現れ、女性は子宮内
膜症を有する。これらの症状と子宮内膜症との間の関係
は存在すると思われるが、これらのおよび他のファクタ
との相互作用は複雑である。臨床医は、しばしば上記の
指示の組合せに基づいて子宮内膜症を有する優れた候補
者であると考えられる患者に対して診断腹腔鏡検査を実
施する。しかしながら、子宮内膜症は、これらの女性の
かなりの部分に存在しない。したがって、子宮内膜症
は、医師が情報の複雑な組を使用して、診断を定形化す
るために経験に頼らなければならない疾病状態の一例を
表す。診断の有効性は、医師の経験および能力に関係す
る。
したがって、症状だけから女性が子宮内膜症を有する
かどうかを決定することは不可能であった。医学界内
で、子宮内膜症の診断は、手術中に子宮内膜障害を直接
視覚化することによってしか確認されない。多数の医師
は、しばしば更なる制限を加え、子宮内膜バイオプシー
組織に関する組織学を使用して、推測される障害を子宮
内膜状(腺およびストロマ)として検証するよう要求し
ている。したがって、子宮内膜症用の非侵襲性診断テス
トはかなり有用であろう。
したがって、本発明の目的は、子宮内膜症用の非侵襲
性診断補助装置を提供することである。また、本発明の
目的は、子宮内膜症および他の障害および状態の診断を
助ける意思決定支援システム中で使用すべき重要な変数
を選択する方法を提供することである。また、本発明の
目的は、新しい変数を識別すること、疾病用の新しい生
化学テストおよびマーカを識別すること、既存の診断方
法を改善する新しい診断テストを設計することである。
発明の概要 疾病、障害、および他の医療状態の診断およびそれを
助ける意思決定支援システムを使用する方法が提供され
る。本発明において提供される方法は、患者病歴データ
および重要な変数の識別を使用して診断テストを開発す
る方法、重要な選択される変数を識別する方法、診断テ
ストを設計する方法、診断テストの有用性を評価する方
法、診断テストの臨床的効用を拡大する方法、様々な可
能な治療の結果を予測することによって治療方針を選択
する方法を含む。また、子宮内膜症など診断することが
難しい疾病、特定の期間中の出産の可能性など妊娠関連
事象の予測、女性の健康に関連する他のそのような障害
を含めて、障害の診断を助ける疾病パラメータまたは変
数が提供される。本明細書では女性の障害を例に挙げる
が、本発明の方法は任意の障害または状態に適用できる
ことを理解されたい。
また、ニューラルネットワークトレーニングを使用し
て、テストの感度および特異性を改善するためにテスト
の開発を案内し、疾病状態または医療状態の全体的な診
断またはその潜在能力を改善する診断テストを選択する
手段が提供される。最後に、所与の診断テストの有効性
を評価する方法が説明される。
したがって、本発明では、障害または状態の診断を助
ける変数または変数の組を識別する方法が提供される。
重要な変数を識別し、選択する方法および診断用の生成
システムでは、患者のデータまたは情報、一般に患者の
病歴または臨床データを収集し、このデータに基づく変
数を識別する。例えば、データは、各患者が経験した妊
娠の回数に関する各患者ごとの情報を含む。したがっ
て、抽出された変数は妊娠の回数である。変数を意思決
定支援システムによって分析し、ニューラルネットワー
クによって例証して、重要なまたは関連する変数を識別
する。
ニューラルネットワークや他の適応性のある処理シス
テム(「データ収集ツール」と総称)など、コンピュー
タベースの意思決定支援システムを使用して、医療診断
テストを開発する方法が提供される。ニューラルネット
ワークまたは他のそのようなシステムは、患者のデータ
および症状が既知であるか、または推測されるテスト患
者のグループから収集された観測値に基づいてトレーニ
ングされる。関連する変数のサブセットまたは複数のサ
ブセットは、ニューラルネットワークやニューラルネッ
トワークのコンセンサスなど、意思決定支援システムま
たは複数の意思決定支援システムを使用して識別され
る。別の組の意思決定支援システムは、識別されたサブ
セットに基づいてトレーニングされ、その症状用のニュ
ーラルネットベースのテストなど、コンセンサス意思決
定支援システムベースのテストを発生する。コンセンサ
スニューラルネットワークなど、コンセンサスシステム
を使用すれば、ニューラルネットワークベースのシステ
ムなど、意思決定支援システムの極小値の負の影響を最
小限に抑えられ、それによりシステムの確度が改善され
る。
また、性能を向上または改善するために、使用する患
者の数を増やせば患者データを増大させることができ
る。また、生化学テストデータおよび他のデータを追加
の例の一部として、またはデータを変数選択プロセスの
前に追加の変数として使用して含めることができる。
得られたシステムは、診断の補助装置として使用され
る。さらに、システムを使用するとき、患者データを記
憶し、次いでそれを使用して、システムをさらにトレー
ニングし、特定の遺伝的集団に適合するシステムを開発
することができる。追加のデータのシステム中へのこの
入力は、自動的に実施されるか、または手動で実施され
る。そうすることによって、システムは、連続的に学習
し、それらが使用される特定の環境に適合する。得られ
たシステムは、診断の他に、疾病または障害の重さの評
価、選択された治療プロトコルの結果の予測を含む多数
の用途を有する。このシステムはまた、生化学テストデ
ータや他のそのようなデータなど、診断手順中の他のデ
ータの値を評価するため、および特定の疾病を診断する
ために有用な新しいテストを識別するために使用され
る。
したがってまた、既存の生化学テストを改善する方
法、関連する生化学テストを識別する方法、障害および
状態の診断を助ける新しい生化学テストを開発する方法
が提供される。これらの方法では、意思決定支援システ
ムベースのテストの性能に対する特定のテストまたは潜
在的な新しいテストの影響を評価する。テストからの情
報の追加が性能を改善する場合、そのようなテストは診
断に関連する。
本発明において特に重要であり、かつ本発明の方法が
容易に適用できる障害および状態は、子宮内膜症、不妊
症、特定の期間中の出産の可能性など妊娠関連事象の予
測、子癇前症を含めて、婦人科学状態および生殖能力に
影響を及ぼす他の状態である。ただし、これらに限定さ
れない。しかしながら、本発明の方法は任意の障害また
は状態に適用できることを理解されたい。
これらの方法は、ニューラルネットワークに関して例
を挙げて説明するが、エキスパートシステム、ファジー
論理、決定ツリー、および一般的に非線形である他の統
計的意思決定支援システムなど、他のデータ収集ツール
も使用できることを理解されたい。本発明において提供
される変数は意思決定支援システムとともに使用するよ
うになされているが、変数を識別した後、重要な変数の
知識を備えた人、一般に医師は、それらを使用して、意
思決定支援システムがない場合、またはあまり複雑でな
い線形分析システムを使用して診断を助けることができ
る。
本明細書に示すように、診断を助ける際に今まで重要
であることが知られていなかった変数またはその組合せ
が識別される。さらに、生化学テストデータを補足する
ことなく、患者病歴データを使用して、本発明において
提供されるニューラルネットなど、意思決定支援システ
ムとともに使用したときに障害または状態を診断する
か、または障害または状態の診断を助けることができ
る。さらに、生化学データを使用した診断または生化学
データを使用しない診断の確度は、侵襲性外科診断手順
が不要になるほど十分である。
また、本発明では、診断テストの臨床的効用を識別
し、拡大する方法が提供される。特定のテストの結果、
今まで注目する障害または状態に関して臨床的効用があ
ると考えられていなかった特定のテストの結果は、変数
と結合され、ニューラルネットなど、意思決定支援シス
テムとともに使用される。システムの性能、障害を正確
に診断する能力がテストの結果の追加によって改善され
た場合、テストは、臨床的効用または新しい効用を有す
ることになる。
同様に、得られたシステムを使用すれば、薬品または
療法の新しい効用を識別することができ、また特定の薬
品および療法の用途を識別することができる。例えば、
このシステムを使用すれば、特定の薬品または療法が有
効である患者の副次集団を選択することができる。した
がって、薬品または療法用の指示を拡大する方法、およ
び新しい薬品および療法を識別する方法が提供される。
特定の実施形態では、ニューラルネットワークを使用
して、特定の観測値およびテスト結果を評価し、生化学
診断テストまたは他の診断テストの開発を案内し、テス
ト用の意思決定支援機能を提供する。
また、意思決定支援システム中で使用される重要な変
数(パラメータ)またはその組を識別する方法が提供さ
れる。この方法は、本明細書では医療診断に関して例を
挙げて説明するが、重要なパラメータまたは変数を複数
の中から選択する。財務分析など、任意の分野において
広く応用できる。
特に、変数の有効な組合せを選択する方法が提供され
る。この方法は、(1)一組の「n」個の候補変数およ
び最初は空である一組の「選択された重要な変数」を与
えるステップ、(2)カイ二乗および感度分析に基づい
てすべての候補変数を順位付けするステップ、(3)最
も高い「m」個の順位付けされた変数(mは1からnま
で)を一度に取り、重要な変数の現在の組に結合された
変数に基づいてニューラルネットのコンセンサスをトレ
ーニングすることによって各変数を評価するステップ、
(4)m個の変数のうち最もよい変数(最もよい変数と
は最も高い性能を与える変数である)を選択し、それが
選択された重要な変数の性能と比較して性能を改善する
場合、それを「選択された重要な変数」の組に追加し、
それを候補組から除去し、ステップ(3)で処理を継続
し、それ以外の場合、ステップ(5)に進むステップ、
(5)候補組のすべての変数を評価した場合、プロセス
を終了し、それ以外の場合、次の最も高い「m」個の順
位付けされた変数を一度に取り、重要な選択された変数
の現在の組に結合された変数に基づいてニューラルネッ
トのコンセンサスをトレーニングすることによって各変
数を評価し、ステップ(4)を実施するステップを含
む。重要な選択された変数の最終組は、複数、一般に三
つから五つよりも多い変数を含む。
特定の実施形態では、感度分析は、(k)観測データ
セット中の各変数ごとに平均観測値を決定するステッ
プ、(l)トレーニング例を選択し、意思決定支援シス
テム中で例を実行して、通常の出力として指定され、記
憶される出力値を発生するステップ、(m)選択された
トレーニング例中の第一の変数を選択し、観測値を第一
の変数の平均観測値と交換し、意思決定支援システム中
で修正された例を順方向モードで実行し、出力を修正さ
れた出力として記録するステップ、(n)通常の出力と
修正された出力との差を二乗し、それを各変数ごとに合
計として累積するステップ(この合計は各変数ごとに選
択された変数合計に指定される)、(o)例中の各変数
ごとにステップ(m)およびステップ(n)を繰り返す
ステップ、(p)データセット中の各例ごとにステップ
(l)からステップ(n)を繰り返すステップ(選択さ
れた変数の各合計は、意思決定支援システム出力の決定
に対する各変数の相対的寄与を表す)を含む。この合計
は、意思決定支援システム出力の決定に対するその相対
的寄与に従って各変数を順位付けするために使用され
る。
本明細書で示すように、ニューラルネットワークなど
コンピュータベースの意思決定支援システムは、最初に
重要であると考えられていなかったいくつかの入力ファ
クタが結果に影響を及ぼしうることを明らかにする。関
連する入力ファクタを明らかにするニューラルネットワ
ークのこの能力により、診断テストの設計を案内するの
にニューラルネットワークを使用することができる。し
たがって、診断テストを設計する方法、および診断テス
トの効用を評価する方法も提供される。各場合におい
て、テストまたは可能なテストからのデータは、意思決
定支援システムの入力に加えられる。データが入力中に
含まれるときに結果が改善された場合、診断テストは臨
床的効用を有する。今まで特定の障害の診断において重
要であることが知られていなかったテストが識別され、
または新しいテストが開発できる。ニューラルネットワ
ークは、スプリアスデータ点の影響を減じ、かつ代用さ
れうる他のデータ点があればそれを識別することによっ
て診断テストに耐性を加えることができる。
ネットワークを一組の変数に対してトレーニングし、
次いで診断テストデータまたは生化学テストデータから
の臨床データおよび/または追加の患者情報を入力デー
タに追加する。ない場合と比較して結果を改善する変数
を選択する。したがって、今まで特定の障害を診断する
際に重要であることが知られていなかった特定のテスト
が関連性を有することが分かる。例えば、血清抗体のウ
ェスタンブロット上の特定のスポットの有無を疾病状態
に相関させることができる。特定のスポット(すなわち
抗原)の同一性に基づいて、新しい診断テストが開発で
きる。
疾病の診断を助けるために予測技術を適用する方法、
より具体的には疾病子宮内膜症の診断を助けるために様
々な情報源からの入力とともにニューラルネットワーク
技法を使用する方法の一例が提供される。コンピュータ
システム中のネットワークのコンセンサスに従って動作
するニューラルネットワークのトレーニングされた組を
使用して、その一部が一般に疾病状態に関連しない、例
えば調査によって得られる特定の臨床的関連を評価す
る。これは、例示的な疾病状態子宮内膜症の場合に証明
され、子宮内膜症の診断を助けるために使用されるファ
クタが提供される。ニューラルネットワークトレーニン
グは、本明細書で臨床データと呼ぶ、その疾病状態が外
科的に検証されていないかなりの数の臨床患者の医師に
よって供給される答えと質問との相関に基づいている。
40個以上の臨床データファクタの集合から抽出される
特定のトレーニングされたニューラルネットワーク中の
12個から約16個の複数のファクタ、具体的には一組の14
個のファクタが子宮内膜症の一次兆候として識別され
る。次のパラメータの組、すなわち年齢、パリティ(出
産回数)、妊娠(妊娠回数)、流産回数、喫煙(箱/
日)、過去の子宮内膜症歴、月経困難症、骨盤痛、異常
pap/形成異常症、骨盤手術歴、薬物治療歴、妊娠高血圧
症、生殖器いぼ、糖尿病が重要であると識別された。他
の同様のパラメータの組も識別された。これらの変数の
サブセットも子宮内膜症を診断する際に使用できる。
次の三つの変数の組合せのうちの一つ(または複数)
を含む、選択されたパラメータの組の任意のサブセッ
ト、特に14個の変数の組が子宮内膜症の診断用の意思決
定支援システムとともに使用できる。
a)出産回数、子宮内膜症歴、骨盤手術歴 b)糖尿病、妊娠高血圧症、喫煙 c)妊娠高血圧症、異常papしみ/形成異常症、子宮内
膜症歴 d)年齢、喫煙、子宮内膜症歴 e)喫煙、子宮内膜症歴、月経困難症 f)年齢、糖尿病、子宮内膜症歴 g)妊娠高血圧症、出産回数、子宮内膜症歴 h)喫煙、出産回数、子宮内膜症歴 i)妊娠高血圧症、子宮内膜症歴、骨盤手術歴 j)妊娠回数、子宮内膜症歴、骨盤手術歴 k)出産回数、異常PAPしみ/形成異常症、子宮内膜症
歴 l)出産回数、異常PAPしみ/形成異常症、月経困難症 m)子宮内膜症歴、骨盤手術歴、月経困難症 n)妊娠回数、子宮内膜症歴、月経困難症。
子宮内膜症の診断に変数を使用する診断ソフトウェア
および例示的なニューラルネットワークも提供される。
このソフトウェアは、臨床的に有用な子宮内膜症インデ
ックスを生成する。
他の実施形態では、子宮内膜症のテストに使用される
診断ニューラルネットワークシステムの性能は、ネット
ワークのトレーニングに使用されるファクタ(本明細書
では生化学テストデータと呼ぶ。これは分析からのテス
ト、脈拍や血圧など、生命徴候などのデータを含む)の
一部として関連する生化学テストからの生化学テスト結
果に基づく変数を含めることによって向上する。それに
よって得られる例示的なネットワークは、生化学テスト
の結果および14個の臨床パラメータを含めて、15個の入
力ファクタを使用する増大ニューラルネットワークであ
る。8個の増大ニューラルネットワークの重みの組は、
8個の臨床データニューラルネットワークの重みの組と
異なる。例示の生化学テストは、ELISA診断テストフォ
ーマットなど、免疫診断テストフォーマットを使用す
る。
本明細書で例示した子宮内膜症に適用した方法は、例
えば、不妊症、特定の期間中の出産の可能性など妊娠関
連事象の予測、子癇前症など、婦人科学障害および女性
関連障害を含めたがそれだけには限られない、他の障害
用のファクタを識別するために同様に適用し、使用でき
る。したがって、ニューラルネットワークは、疾病状態
を予測し、それらを生化学データに結合する際に重要な
ファクタの識別に基づいて疾病状態を予測するようにト
レーニングできる。
得られた診断システムは、状態または障害の存在だけ
でなく、障害の重さを診断するために、また治療方針を
選択する際の補助装置として適しており、使用できる。
図面の簡単な説明 第1図は、患者病歴ベースの診断テストプロセスを開
発するための流れ図である。
第2図は、生化学診断テストを開発するための流れ図
である。
第3図は、重要な変数を分離するプロセスの流れ図で
ある。
第4図は、変数の分割を含む一つまたは一組のニュー
ラルネットワークをトレーニングするプロセスの流れ図
である。
第5図は、生化学診断テストを開発するための流れ図
である。
第6図は、生化学診断テストの有効性を決定するため
の流れ図である。
第7図は、複数のニューラルネットワークのコンセン
サスネットワーク用に使用されるフォームの臨床データ
に基づいてトレーニングされたニューラルネットワーク
の概略図である。
第8図は、八個のニューラルネットワークのコンセン
サス用に使用されるフォームのテスト結果データによっ
て増大した臨床データに基づいてトレーニングされたニ
ューラルネットワークの第二の実施形態の概略図であ
る。
第9図は、ニューラルネットワークの各ノードの処理
要素の概略図である。
第10図は、ニューラルネットワークの第一または第二
の実施形態を使用した八個のニューラルネットワークの
コンセンサスネットワークの概略図である。
第11図は、診断子宮内膜症インデックス中のユーザイ
ンタフェースの例示的なインタフェーススクリーンの図
である。
好ましい実施形態の詳細な説明 定義 別段の定義がない限り、本明細書で使用するすべての
技術用語および科学用語は、一般に本発明がそれに属す
る技術分野の当業者が理解できるのと同じ意味を有す
る。本明細書で参照するすべての特許および文献は、参
照により本発明の一部となる。
本明細書で使用する「データ収集システム」または
「データシステム中の知識発見」とも呼ばれる意思決定
支援システムは、入力データを分類するためにデータに
基づいてトレーニングされ、次いでトレーニングデータ
に基づいて後で意思決定を行うために新しい入力データ
とともに使用できる任意のシステム、一般にコンピュー
タベースのシステムである。これらのシステムは、エキ
スパートシステム、ファジー論理、非線形回帰分析、多
変量分析、意思決定ツリー分類装置、ベイズの信念ネッ
トワーク、および本明細書で例示するニューラルネット
ワークを含む。ただし、これらに限定されない。
本明細書で使用する適応機械学習プロセスは、データ
を使用して、予測解決策を生成する任意のシステムであ
る。そのようなプロセスは、エキスパートシステム、ニ
ューラルネットワーク、およびファジー論理によって実
施されるプロセスである。
本明細書で使用するエキスパートシステムは、そのタ
スクの知識またはその知識を使用するための論理的な規
制または手順に基づくコンピュータベースの問題解決お
よび意思決定支援システムである。専門分野の専門家の
経験からの知識ならびに論理がコンピュータ中に入力さ
れる。
本明細書で使用するニューラルネットワーク、または
ニューラルネットは、密に相互接続された適応処理要素
から構成される並列計算モデルである。ニューラルネッ
トワークでは、処理要素は、入力層、出力層、および少
なくとも一つの隠れた層中に構成される。適切なニュー
ラルネットワークは、当業者に知られている(例えば、
米国特許第5251626号、第5473537号および第5331550
号、Baxt(1991年)「Use of an Artificial Neural Ne
twork for the Diagnosis of Myocardial Infarctio
n」、Annals of Internal Medicine 115:843;Baxt(199
2年)「Improving the Accuracy of an Artificial Neu
ral Network Using Multiple Differently Trained Net
works」、Neural Computation 4:772;Baxt(1992年)
「Analysis of the clinical variables that drive de
cision in an artificial neural network trained to
identify the presence of myocardial infarction」、
Annals of Emergency Medicine 21:1439;Baxt(1994
年)「Complexity,chaos and human physiology:the ju
stification for non−linear neural computational a
nalysis」、Cancer Letters 77:85参照)。
本明細書で使用するパーセプトロンまたは人工ニュー
ロンとも呼ばれる処理要素は、複数の入力からの入力デ
ータを伝達関数に従って単一の二進出力中にマップする
計算ユニットである。各処理要素は、その入力で受信さ
れた信号を掛けられて、重み付けされた入力値を発生す
る各入力に対応する入力重みを有する。処理要素は、各
入力の重み付けされた入力値を合計して、重み付けされ
た合計を発生し、次いでこれが伝達関数によって定義さ
れたしきい値と比較される。
本明細書で使用するしきい値関数または活性化関数と
も呼ばれる伝達関数は、二つの別個のカテゴリを定義す
る曲線を生成する数学的関数である。伝達関数は、線形
であるが、ニューラルネットワーク中で使用されると
き、より一般的には、二次関数、多項式関数、またはS
字形関数を含めて非線形である。
本明細書で使用する逆方向伝搬は、ターゲット出力と
実際の出力との間の誤差を訂正するためのニューラルネ
ットワーク用のトレーニング方法である。誤差信号はニ
ューラルネットワークの処理層中にフィードバックされ
て、処理要素の重みの変化により実際の出力がターゲッ
ト出力により近づく。
本明細書で使用するクイックプロップは、Fahlmanが
提案し、開発し、報告した逆方向伝搬方向である(「Fa
st Learning Variations on Back−Propagation:An Emp
irical Study」、Proceedings on the 1988 Connection
ist Models Summer School,Pittsburgh,1988,D.Touretz
ky他編,pp.38−51,Morgan Kaufmann,カリフォルニア州S
an Mateo;Lebriereとの共著、「The Cascade−Correlat
ion Learning Architecture」、Advances in Neural In
formation Processing Systems 2,(Denver,1989),D.T
ouretzky編,pp.524−32.Morgan Kaufmann,カリフォルニ
ア州San Mateo)。
本明細書で使用する診断は、疾病、障害または他の医
療状態の存在、不在、重さまたは治療方法を評価する予
測プロセスである。本明細書では、診断はまた、治療か
ら得られた結果を決定する予測プロセスを含む。
本明細書で使用する生化学テストデータは、免疫学的
検定法、生物学的検定法、クロマトグラフィ、モニタお
よびイメージャからのデータ、測定値を含む(ただしこ
れらに限定されない)任意の分析方法の結果であり、ま
た、脈拍、体温、血圧、例えば、EKG、ECG、EEG、バイ
オリズムモニタの結果、および他のそのような情報な
ど、生命徴候および身体機能に関するデータを含む。分
析は、例えば、分析物、血清マーカ、抗体、およびサン
プル中の患者から得られる他のそのような材料を評価で
きる。
本明細書で使用する患者病歴データは、質問表などに
よって、患者から得られたデータであるが、一般に本明
細書で使用する生化学テストデータを含まない。ただ
し、そのようなデータが病歴データである限りは、所望
の解決策は、障害の診断を生成できる数または結果を生
成する。
本明細書で使用するトレーニング例は、単一の診断用
の観測データ、一般に一人の患者に関する観測データを
含む。
本明細書で使用する患者病歴データから識別されたパ
ラメータは、本明細書では観測ファクタまたは値または
変数と呼ぶ。例えば、患者データは、個々の患者の喫煙
習慣に関する情報を含む。それに関連する変数は喫煙で
ある。
本明細書で使用する分割手段は、80%など、データの
一部を選択し、それをニューラルネットをトレーニング
するために使用し、残りの部分をテストデータとして使
用することを意味する。したがって、ネットワークは、
データの一部以外に基づいてトレーニングされる。この
プロセスは、その場合繰り返され、第二のネットワーク
をトレーニングできる。このプロセスは、すべての区分
がテストデータおよびトレーニングデータとして使用さ
れるまで繰り返される。
本明細書で使用する使用できるデータを複数のサブセ
ット中に分割することによるトレーニングの方法は、一
般にトレーニングの「ホールドアウト法」と呼ばれる。
ホールドアウト方法は、ネットワークトレーニングに使
用できるデータが制限されるときに特に有用である。
本明細書で使用するトレーニングは、入力データを使
用して、意思決定支援システムを生成するプロセスであ
る。特に、ニューラルネットに関して、トレーニング
は、特定の処理要素が、他の処理要素の出力と結合され
たときに、ニューラルネットの出力とトレーニングデー
タ中に提示された所望の出力との間の生じた誤差を最小
限に抑える結果を発生する出力を与える処理要素の重み
に対する一連のインタラクティブ調整を行う試行錯誤プ
ロセスである。
本明細書で使用する変数選択プロセスは、予測結果を
もたらす変数の組合せを任意の使用できる組から選択す
る系統的方法である。選択は、追加の変数の追加が結果
を改善しないようにサブセットの予測性能を最大にする
ことによって実施される。本明細書において提供される
好ましい方法では、可能なすべての組合せを考慮せずに
変数が選択できる。
本明細書で使用する候補変数は、意思決定支援システ
ムとともに使用できる財務記録など診断実施形態または
他の記録用のテスト患者のグループから収集された観測
値から選択された項目である。候補変数は、患者データ
などのデータを収集し、観測値を一組の変数として分類
することによって得られる。
本明細書で使用する重要な選択された変数は、手元の
タスクのネットワーク性能を高める変数である。使用で
きるすべての変数を含めることは、最適なニューラルネ
ットワークをもたらさない。いくつかの変数がネットワ
ークトレーニング中に含まれるとき、ネットワーク性能
は低下する。関連するパラメータのみを使用してトレー
ニングされるネットワークは、ネットワーク性能の向上
をもたらす。これらの変数はまた、本明細書において関
連する変数のサブセットとも呼ばれる。
本明細書で使用する順位付けは、変数を選択の順序で
リストするプロセスである。順位付けは、任意でよく、
または整理されることが好ましい。整理は、例えば、診
断などタスクに対して変数を重要度順に順位付けする統
計分析によるか、意思決定支援システムベースの分析に
よって実施される。順位付けはまた、例えば、専門家
か、規則ベースのシステムか、またはこれらの方法の任
意の組合せによって実施できる。
本明細書で使用するニューラルネットワークのコンセ
ンサスは、各出力の重みが任意に決定されるか、または
等しい値に設定される複数のニューラルネットワークか
らの出力の線形結合である。
本明細書で使用するグリーディアルゴリズムは、所与
のデータセットからの点を含めるか、除くかどうかを決
定することによってデータセットを最適化する方法であ
る。このセットは、要素がない状態から始まり、部分解
決策があるとすれば、目的を最も改善する他の値が選択
される近視最適化によって残りの要素の実現可能なセッ
トから要素を連続的に選択する。
本明細書で使用するジェネティックアルゴリズムは、
トレーニングサイクル中に実行され、かつ所望のターゲ
ットに到達する際にそれらの性能に従って順位付けされ
るランダムに生成されるニューラルネットワークの初期
分布から始まる方法である。十分に実行しないネットワ
ークはその分布から除去され、より適切なネットワーク
は、親ネットワークの所望の特性を保持する子孫へのク
ロスオーバプロセス用に保持され、選択される。
本明細書で使用するシステムの性能は、結果が特定の
結果をより正確に予測または決定したときに改善され
る、またはより高くなると言われる。また、システムの
性能は、一般により多くのトレーニング例を使用したと
きによりよくなることを理解されたい。したがって、本
発明のシステムは、それらが使用されるときに時間とと
もに向上し、より多くの患者データが蓄積され、次いで
トレーニングデータとしてシステムに追加される。
本明細書で使用する感度=TP/(TP+FN)、特異性はT
N/(TN+FP)である。ただし、TP=真の正、TN=真の
負、FP=偽の正、FN=偽の負である。臨床感度は、テス
トが疾病を有する患者をどのくらいよく検出するかを測
定する。臨床特異性は、テストが疾病を有しない患者を
どのくらいよく正確に識別するかを測定する。
本明細書で使用する正予測値(PPV)はTP/(TP+FP)
である。負予測値(NPV)はTN/(TN+FN)である。正予
測値は、正テストを有する患者が実際に疾病を有する可
能性である。負予測値は、負テスト結果を有する患者が
疾病を有しない可能性である。
本明細書で使用するファジー論理は、正確に記述でき
ないシステムを処理する手法である。メンバシップ関数
(データセット中のメンバシップ)はファジー論理シス
テム中では二進ではない。代わりにメンバシップ関数は
分数値をとる。したがって、要素は、セットのメンバシ
ップの係数が異なる場合にもかかわらず、矛盾する二つ
のセット中に同時に含まれうる。したがって、このタイ
プの手法は、yesまたは答えがない質問に答えるために
有用である。したがって、このタイプの論理は、答えが
しばしば一つの程度である患者病歴質問票からの返答を
分類するのに適している。
1.一般的考察および一般的方法 患者病歴および/または生化学情報など観測値を分析
するニューラルネットワークをトレーニングするために
いくつかの技法が使用できることが決定されている。使
用できるデータおよび分析すべき問題の特性に応じて、
様々なニューラルネットワークトレーニング技法が使用
できる。例えば、大量のトレーニング入力が使用できる
場合、冗長トレーニング情報をなくす方法が採用され
る。
本明細書に示すように、ニューラルネットワークはま
た、最初に重要であると考えられていなかったいくつか
の入力ファクタが結果に影響を及ぼすことを明らかに
し、かつ多分重要なファクタが結果決定因ではないこと
を明らかにする。関連する入力ファクタおよび関連しな
い入力ファクタを明らかにするニューラルネットワーク
の能力は、診断テストの設計を案内する際にニューラル
ネットワークを使用することを可能にする。本明細書に
示すように、ニューラルネットワーク、および他のその
ようなデータ収集ツールは、診断における貴重な進歩で
あり、診断テストの感度および特異性を高める機会を与
える。本明細書に示すように、極小値の現象のために不
十分な確度を答えの可能性を回避するよう注意しなけれ
ばならない。本発明の方法は、この問題の回避するか、
または少なくともそれを最小限に抑える手段を提供す
る。
開発診断手順、特に患者情報にのみまたは一部に基づ
く診断テストを開発する場合、いくつかの問題が解決さ
れる。例えば、一般に、トレーニングデータが使用でき
る限られた数の患者が存在するので限られた量のデータ
が存在する。これを解決するために、以下で説明するよ
うに、患者情報は、ネットワークをトレーニングすると
きに分割される。また、一般に、使用できるデータに関
連して使用するために使用できる多数の入力観測ファク
タが存在し、したがって観測値を順位付けし、選択する
方法が開発された。
また、一般に、使用できる患者データ中に多数の二進
(真/偽)入力ファクタが存在するが、これらのファク
タは、一般に性質がまばら(使用できる患者データ中の
二進入力ファクタの一部の場合においてのみ正または負
である値)である。また、診断中の正のファクタと負の
ファクタとの間に高度のオーバラップが存在する。
上記その他の特性は、診断テストを開発するために使
用される手順および方法の選択に影響を及ぼす。これら
の問題は、本発明において処理され、解決される。
2.患者病歴診断テストの開発 診断テスト 患者病歴データのみに基づく診断の方法が提供され
る。本明細書で証明するように、患者病歴情報のみに依
存するが、診断を助ける意思決定支援システムを提供す
ることができる。したがって、得られたシステムは、生
化学テストデータの予測能力を改善すること、新しい疾
病マーカを識別すること、生化学テストを開発するこ
と、今まで特定の障害を予測すると考えられていなかっ
たテストを識別するために使用できる。
これらの方法はまた、選択された治療方法の結果を予
測することによって適切な治療方法を選択し、療法後の
状態を予測するために使用できる。トレーニング用の入
力変数は、例えば、選択された治療および結果を含め
て、診断および他の使用できるデータを示す電子的患者
記録から得られる。得られた意思決定支援システムは、
その場合、例えば、異なる治療に応答し、かつ特定の治
療の結果を予測する異なるクラスに女性を分類するため
に使用できるすべてのデータとともに使用される。これ
により、治療またはプロトコルの選択が成功する確率を
最も高くすることができる。
同様に、これらのシステムは、薬品または療法の新し
い効用を識別するために使用でき、また特定の薬品およ
び療法の用途を識別するために使用できる。例えば、こ
れらのシステムは、特定の薬品または療法が有効である
患者の副次集団を選択するために使用できる。したがっ
て、薬品または療法の支持を拡大する方法および新しい
薬品および療法を識別する方法が提供される。
患者データの収集、変数の生成、および概要 本発明の方法を例示するために、第1図に、患者病歴
ベースの診断テスト方法を開発する流れ図を示す。この
プロセスは、患者病歴データの収集から始まる(ステッ
プA)。患者病歴データまたは観測値は、患者質問票、
臨床結果、場合によっては診断テスト結果、患者医療記
録から得られ、コンピュータ読取り可能な形でコンピュ
ータ上で動作するシステムに供給される。デジタルコン
ピュータでは、患者病歴データは、(真/偽など)二進
値と定量(連続的な)値の二つの形態の一組の変数に分
類される。二進値変数は、「たばこを吸いますか」とい
う質問に対する答えを含むこともある。定量値変数は、
「一日に何箱たばこを吸いますか」という質問に対する
答えであることもある。メンバシップ関数など他の値も
入力手段として有用である。
患者病歴データはまた、診断すべきき医療状態の存
在、不在、または重さを示すと考えられるターゲットま
たは所望の結果変数を含む。この所望の結果情報は、ニ
ューラルネットワークトレーニング用に有用である。ト
レーニングデータ中に含めるべきデータの選択は、診断
すべき医療状態の存在、重さまたは不在の知識または仮
定を使用して行われる。本明細書に示すように、診断は
また、進行の評価および/または療法治療の有効性を含
む。
定義でき、したがって生成できる変数の数は扱いにく
い。二進変数は、一般に、正(または負の)応答の数が
しばしば応答の全体的な数の一部であるのでまばらであ
る。したがって、代表的なトレーニングデータ環境中で
使用できる多数の変数および少数の患者が存在する場
合、診断にとって重要な変数のサブセットを使用できる
変数から分離するステップがとられる(ステップB)。
使用できる変数の中からの変数のサブセットの特定の選
択は、ニューラルネットワークの診断性能に影響を及ぼ
す。
本明細書で概説した方法は、一般に医師などトレーニ
ングされた専門家によって選択された変数のサブセット
と比較して感度および信頼性が同等であるか、または優
れている変数のサブセットをつくり出すことが分かって
いる。いくつかの例では、変数は、順位または関連性の
順に優先権が与えられるか、または配置される。
その後、診断手順で使用すべき最後のニューラルネッ
トワークをトレーニングする(ステップC)。好ましい
実施形態では、ネットワークのコンセンサス(すなわち
複数のネットワーク)をトレーニングする。得られたネ
ットワークは、完成した患者病歴診断テスト(ステップ
D)用の意思決定支援機能を形成する。
重要な変数を分離する方法 重要な変数を分離する方法が本発明において提供され
る。この方法によれば、変数の可能なすべての組合せを
比較することによって有効な変数の組を選択することが
できる。重要な変数は、意思決定支援システム用の入力
として使用される。
重要な変数または関連する変数の分離−変数の順位付け 第3図に、診断テスト中の重要な変数または関連する
変数を分離する方法の流れ図を示す(ステップE)。そ
のような方法は、一般に、潜在的に関連する情報が与え
られているデジタルコンピュータシステムを使用して実
施される。この手順では、独立した二つの方法を使用し
て変数を重要度の順に順位付けし、次いで順位の最上部
から使用できる変数のサブセットを選択する。上記のよ
うに、当業者は、カイ二乗または感度分析の代わりに他
の順位付け方法を使用することができる。また、xをN
(候補変数の総数)まで設定した場合、順位付けは任意
である。
このシステムは、以下で説明するように、使用できる
データに基づいて複数のニューラルネットワークをトレ
ーニングし(ステップ1)、次いですべてのトレーニン
グされたネットワーク上で感度分析を生成して、各入力
変数が診断を実施するためにネットワーク中でどの程度
まで使用されたかを決定する(ステップJ)。各入力変
数のコンセンサス感度分析は、各トレーニングされたネ
ットワークごとに個々の感度分析結果を平均化すること
によって決定される。感度に基づいて、患者病歴情報か
ら得られた各変数ごとの順位を決定する(ステップ
K)。
変数の順位付け 好ましい実施形態では、変数は、カイ二乗分析など統
計分析および/または感度分析など意思決定支援システ
ムベースの分析を使用して順位付けされる。例示の実施
形態では、感度分析およびカイ二乗分析を使用して、変
数を順位付けする。限定しないが、回帰分析、判別分
析、および当業者に知られている他の方法を含めて、他
の統計方法および/または意思決定支援システムベース
の方法も使用できる。順位付けされた変数は、ネットワ
ークをトレーニングするために使用でき、また本発明に
おいて与えられる変数選択の方法中で使用できることが
好ましい。
この方法では、各入力を変更し、出力の対応する変化
を測定する感度分析を使用する(またModai他(1993
年)「Clinical Decisions for Psychiatric Inpatient
s and Their Evaluation by Trained Neural Network
s」、Methods of Information in Medicine 32:396−9
9;Wilding他(1994年)「Application of Backpropogat
ion Neural Networks to Diagnosis of Breast and Ova
rian Cancer」、Cancer Letters 77:145−53;Ruck他(1
990年)「Feature Selection in Feed−Forward Neural
Networks」Neural Network Computing 20:40−48;Utan
s他(1993年)「Selecting Neural Network Architectu
res Via the Prediction Risk:Application to Corpora
te Bond Rating Prediction」、Proceedings of the Fi
rst International Conference on Artificial Intelli
gence Applications on Wall Street.Washington,D.C.,
IEEE Computer Society Press.pp.35−41;Penny他(199
6年)「Neural Networks in Clinical Medicine」、Med
ical Decision−support 4:386−398参照)。そのよう
な方法は、今まで本明細書で説明するように、重要な変
数を選択するために使用されていなかった。例えば、感
度分析を使用して、重要な変数を選択するためにではな
く、変数間の関係を決定する統計手法を開発することが
報告されている(Baxt他(1995年)「Bootstrapping Co
nfidence Intervals for Clinical Input Variable Eff
ects in a Network Trained to Identify the Presence
of Myocardial Infarction」、Neural Computation 7:
624−38参照)。そのような感度分析は、本明細書で説
明するように診断の補助手段として重要な変数の選択の
一部として使用できる。
第3図のステップKに感度分析の概要を示す。各ネッ
トワークまたは複数のトレーニングされたニューラルネ
ットワーク(ネットワークN1からNn)は、各トレーニン
グ例Sx(出力が知られているか、または推測される入力
データグループ。少なくとも二つのトレーニング例が存
在しなければならない)ごとに順方向モードで実行され
る。ただし、「x」はトレーニング例の数である。各ト
レーニング例Sxの各ネットワークN1〜Nnの出力は、記録
される、すなわちメモリ中に記憶される。すべてのトレ
ーニング例中の各入力変数の平均値を含む新しいトレー
ニング例が定義される。一度に一つ、各元の各トレーニ
ング例Sx値の各入力変数がその対応する平均値V1(avg)
からVy(avg)と交換される。ただし、「y」は変数の数
である。修正されたトレーニング例Sx'は、複数のネッ
トワーク中で再び実行され、各変数の各ネットワークご
とに修正された出力を発生する。元のトレーニング例Sx
からの出力と各入力変数の修正された出力との間の差
は、各入力変数に対応する個々の合計を得るために二乗
され、合計される(累計される)。説明するために、例
えば、それぞれ15個の変数V1〜V15を有する別々の10個
のニューラルネットワークN1〜N10および異なる5個の
トレーニング例S1〜S5の場合、5個のトレーニング例の
各トレーニング例は、10個のネットワークを介して実行
され、合計50個の出力を発生する。各トレーニング例か
ら変数V1をとり、平均値V1(avg)を計算する。この平均
化された値V1(avg)は、5個のトレーニング例の各トレ
ーニング例中に代用され、修正されたトレーニング例
S1'〜S5'を生成し、それらは、再び10個のネットワーク
中で実行される。50個の修正された出力値がネットワー
クN1〜N10および5個のトレーニング例によって生成さ
れる。修正は、平均値変数V1(avg)を使用した結果であ
る。50個の元の出力値および修正された出力値それぞれ
の間の差を計算する、すなわちネットワークN6中のトレ
ーニングS4からの元の出力OUT(S4N6)を、ネットワー
クN6中のトレーニング例S4からの修正された出力OUT(S
4'N6)から引く。この差値を二乗する[OUT(S4'N6)−
OUT(S4N6)]2 V1。この値を、変数V1がその平均値V
1(avg)と代用された反復に対してネットワークとトレー
ニング例のすべての組合せについて二乗された差値と合
計する。すなわち 次に、このプロセスを変数#2について繰り返し、ネッ
トワークとトレーニング例の各組合せごとに元の出力と
修正された出力との間の差を求め、二乗し、次いで差を
合計する。このプロセスを、15個のすべての変数が終了
するまで各変数ごとに繰り返す。
次いで、すべての変数が単一の生じた出力に等しく寄
与した場合に正規化された値が1.0になるように生じた
各合計を正規化する。前の例の後、各変数ごとに合計二
乗差を合計して、すべての変数について全合計二乗差を
得る。各変数の値を全合計二乗差で割り、各変数からの
寄与を正規化する。この情報から、各変数の正規化され
た値を重要度の順に順位付けすることができる。より高
い相対的な数は、対応する変数が出力により大きい影響
を及ぼすことを示す。入力変数の感度分析を使用して、
どの変数がネットワーク出力を発生するに最大の役目を
果たしたかを示す。
本発明では、コンセンサスネットワークを使用して、
感度分析を実施することは変数選択プロセスを改善する
ことが分かっている。例えば、二つの変数が高度に相関
する場合、データに基づいてトレーニングされた単一の
ニューラルネットワークがその二つの変数の一方のみ使
用して、診断をつくり出すこともある。変数が高度に相
関する場合、両方の変数を含めることによって得られる
ものはほとんどなく、どちらの変数を含めるべきかの選
択は、トレーニング中のネットワークの初期開始条件に
依存する。単一のネットワークを使用する感度分析は、
一方のみ、または他方のみが重要であることを示すこと
もある。それぞれ異なる初期条件を使用してトレーニン
グされる複数のネットワークのコンセンサスから得られ
る感度分析は、高度に相関した両方の変数が重要である
ことを明らかにすることがある。感度分析を一組のニュ
ーラルネットワークにわたって平均化することによっ
て、初期条件の影響を最小限に抑えるコンセンサスが形
成される。
カイ二乗分割表 まばらな二進データを処理する場合、所与の変数に対
する正の応答は、診断中の条件に高度に相関することも
あるが、トレーニングデータ中で発生することはごくま
れであるので、ニューラルネットワーク感度分析によっ
て示される変数の重要度が非常に低くなることもある。
これらの発生を捕らえるために、カイ二乗分割表が二次
順位付けプロセスとして使用される。テーブルの各セル
が二つの変数の組合せに対して観測された頻度である二
進変数に対する2×2分割表カイ二乗テストを実施する
(第3図、ステップF)。(経験的に決定されることも
ある)最適なしきい値を使用して、連続的な変数に対し
て2×2分割表カイ二乗テストを実施する(ステップ
G)。カイ二乗分析に基づいた二進変数および連続的な
変数を順位付けする(ステップH)。
二進変数に対して動作する標準のカイ二乗2×2分割
表(ステップF)を使用して、特定の二進入力変数と
(トレーニングデータを既知の単一出力結果と比較する
ことによって決定された)所望の出力との間の関係の重
要度を決定する。小さいカイ二乗値を有する変数は、一
般に所望の出力に関連しない。
連続的な値を有する変数の場合、連続的な変数をしき
い値と比較することによって2×2分割表を構成できる
(ステップG)。しきい値は、経験的に修正され、でき
る限り大きいカイ二乗値をもたらす。
次いで、連続的な変数のカイ二乗値と二進変数のカイ
二乗値とを共通の順位付けのために結合できる(ステッ
プH)。次いで、カイ二乗順位付けされた変数を感度分
析順位付けされた変数と結合する第二のレベルの順位付
けを実施できる(ステップL)。順位付けのこの結合に
より、出力に大きく関連し、かつまばらな変数(すなわ
ち、ごく一部の場合正または負である値)を重要な変数
の組の中に含めることができる。さもなければ、そのよ
うな非線形システム中の重要な情報が容易に見落とされ
る可能性がある。
順位付けされた変数の中からの重要な変数の選択 上記のように、重要な変数は、識別された変数の中か
ら選択される。選択は、第二のレベルの順位付けプロセ
スが呼び出されたときに変数を順位付けした後で実施さ
れることが好ましい。意思決定支援システム中で使用さ
れる重要な変数(パラメータ)またはその組を識別する
方法も提供される。この方法は、本明細書では医療診断
を例に挙げて説明するが、重要なパラメータまたは変数
を複数の中から選択する統計ベースの予測を行う財務分
析や他の試みなど任意の分野において広く応用できる。
特に、変数の有効な組合せを選択する方法が提供され
る。一組の「n」個の候補変数および最初空である一組
の「選択された重要な変数」を与えるステップ(1)、
および上述のように、カイ二乗および感度分析に基づい
てすべての候補変数を順位付けするステップ(2)の
後、この方法は、一度に最大「m」個(mは1からnま
で)の順位付けされた変数をとり、重要な変数の現在の
組と結合された変数に基づいてニューラルネットのコン
センサスをトレーニングすることによって各変数を評価
するステップ(3)、m個の変数のうち最もよい変数を
選択し(最もよい変数とは性能を最も改善する変数であ
る)、それが性能を改善する場合、それを「選択された
重要な変数」セットに追加し、それを候補セットから除
去し、ステップ(3)での処理を継続し、それ以外の場
合、ステップ(5)に進むことによって継続するステッ
プ(4)、候補セット上のすべての変数が評価されてい
れば、プロセスが終了し、それ以外の場合、一度に次に
最も大きい「m」個の順位付けされた変数をとり、重要
な選択された変数の現在の組と結合された変数に基づい
てニューラルネットのコンセンサスをトレーニングし、
ステップ(4)を実施することによって各変数を評価す
るステップ(5)を含む。
特に、第二のレベルの順位付けプロセス(ステップ
L)は、感度分析(ステップK)からの最も高い順位付
けされた変数を重要な変数の組に追加すること(ステッ
プH)によって開始する。あるいは、第二のレベルの順
位付けプロセスは、空の組から開放し、次いで順位付け
の二つの組の各組から上部のいくつか(x個)の変数を
テストすることによって開始する。この第二のレベルの
順位付けプロセスでは、使用できるデータからの変数の
現在選択されている区分またはサブセットに対してネッ
トワークトレーニング手順(ステップI)を使用して、
一組のニューラルネットワークをトレーニングする。順
位付けプロセスは、「重要な」変数の現在の組(一般に
最初空である)ならびに順位付け中または順位付けのた
めにテスト中の現在の変数を使用し、またグリーディア
ルゴリズムを使用して、前に識別された重要な変数に基
づいて入力組を近視的に最適化することによって入力変
数の組を最適化して、出力を最も改善する残りの変数を
識別するするネットワークトレーニング手順である。
このトレーニングプロセスを第4図に示す。ニューラ
ルネットワークによって使用される入力の数は、所望の
出力、すなわちトレーニングデータの既知のターゲット
出力に大きく貢献しないことが分かる入力を排除するこ
とによって制御される。米国カリフォルニア州La Jolla
Logical Designs Consulting社のWindowsTM用のThinks
ProTMニューラルネットワーク(またはTrainDosTMDOSバ
ージョン)や、当業者が開発できるそのような他のプロ
グラムなど、業務用コンピュータプログラムは、入力を
変更し、ネットワークをトレーニングするために使用で
きる。
米国オレゴン州ビーバートンのCalifornia Scientifi
c Software社、Nevada Adaptive Solutionsから販売さ
れているBrainmakertm、米国ペンシルバニア州ピッツバ
ーグのNeuralWare社から販売されているNeural Network
Utility/2tm、および米国メリーランド州のフレデリッ
クのWard Systems Group社から販売されているNeuroShe
lltmおよびNeuroWindowstmを含めて、いくつかの他の市
販のニューラルネットワークコンピュータプログラムを
使用して、上記の動作のいずれかを実施できる。変数選
択およびネットワーク最適化の機能を提供する他のタイ
プのデータ収集ツール、すなわち意思決定支援システム
も設計でき、また他の市販のシステムも使用できる。例
えば、米国ワシントン州レドモンドのBioCompSystems社
から販売されているNeuroGenetic OptimizerTM、および
シンガポール共和国のNew Wave Intelligent BusinessS
ystem(NIB5)社から販売されているNeuro Forecaster/
GENETICAは、自然選択に基づいてモデル化された遺伝ア
ルゴリズムを使用して、ネットワーク分布中の十分に実
行しないモードをなくし、かつ最適化されたネットワー
クを「成長」させるために最もよく実行する速度を子孫
ノードに送り、かつ結果に大きく貢献しない入力変数を
なくす。遺伝アルゴリズムに基づくネットワークは、変
異を使用して、極小値中での捕獲を回避し、またクロス
オーバプロセスを使用して、新しい構造を分布中に導入
する。
データ中の知識発見(KDD)は、変数中に存在する重
要な関係を識別するために設計された他のデータ収集ツ
ール、意思決定支援システムであり、多数の可能な関係
が存在する場合に有用である。米国マサチューセッツ州
ベッドフォードのThinking Machines社から販売されて
いるDarwintm、米国カリフォルニア州マウンテンビュー
のSilicon Graphics社から販売されているMinesettm
米国カリフォルニア州サンフランシスコのUltragem Dat
a Mining社のEikoplextmを含めて、いくつかのKDDシス
テムが販売されている。(Eikoplextmは心臓病の存在の
確率を決定する分類規則を与えるために使用されてい
る)。他のシステムも当業者によって開発されうる。
順位付け手順を継続して、例えば、xを2に設定した
場合、二つの順位付け組の各組からの上部の二つの変数
をプロセスによってテストし(第3図、ステップL、
S)、テスト結果が改善を示すかどうかを確かめるため
に結果を検査する(ステップT)。改善が存在する場
合、単一の最も性能のよい変数を「重要な」変数の組に
追加し、次いでその変数を他のテスト(ステップS)の
ために二つの順位から除去する(第3図、ステップ
U)。改善が存在しない場合、改善が見つかるまで、ま
たは二つの組からのすべての変数がテストされるまで各
組からの次のx個の変数についてプロセスを繰り返す。
このプロセスは、ソースセットが空である、すなわちす
べての関連する変数または重要な変数が最後のネットワ
ーク中に含まれるまで、またはテストすべき組の中の残
りのすべての変数が重要な変数の現在のリストの性能以
下であることが分かるまで繰り返される。この除去プロ
セスは、重要な変数の組を決定するためにテストしなけ
ればならない使用できる変数のサブセットの数を大いに
減らす。最悪の場合でも、10個の使用できる変数では、
プロセスは、x=2の場合34個のサブセットのみ、x=
1の場合1024個の可能な組合せの19個のサブセットのみ
をテストする。したがって、100個の使用できる変数が
存在する場合、394個のサブセットのみがx=2の場合
テストされる。したがって、最もよいテスト性能を有す
るネットワークからの変数を使用のために識別する(第
3図、ステップV)。
次いで、診断を実施するようにネットワークの最後の
組をトレーニングする(第4図、ステップM、N、Q、
R)。一般に、いくつかの最後のニューラルネットワー
クが診断を実施するようにトレーニングされる。ニュー
ラルネットワークのこの組は、エンドユーザに供給でき
る製品の基礎となりうる。異なる初期条件(初期重み)
が所与のネットワークに対して異なる出力を発生しうる
ので、コンセンサスを求めることが有用である。(異な
る初期重みは、誤差が極小値中に捕獲されるのを回避す
るために使用される)。コンセンサスは、トレーニング
されたネットワークの各ネットワークの出力を平均化す
ることによって形成され、これは次いで診断テストの単
一出力になる。
ネットワークのコンセンサスをトレーニングする 第4図に、ニューラルネットワークのコンセンサスを
トレーニングする手順を示す。まず、現在のトレーニン
グサイクルが最後のトレーニングステップであるかどう
かを決定する(ステップM)。yesの場合、すべての使
用できるデータをトレーニングデータセット中に入れる
(すなわちP=1)(ステップN)。noの場合、使用で
きるデータをP個の等しいサイズの区分に分割し、デー
タを各区分ごとにランダムに選択する(ステップO)。
例示の実施形態では、例えば、5個の区分、例えば、P1
〜P5を使用できるトレーニングデータのフルセットから
生成する。次いで、二つの構成に取りかかる(ステップ
P)。まず、一つまたは複数の区分をテストファイルに
コピーし、残りの区分をトレーニングファイルにコピー
する。5個の区分の例示の実施形態を継続し、全データ
セットの20%を表す区分の一つ、例えば、P1をテストフ
ァイルにコピーする。残りの4個のファイルP2〜P4をト
レーニングデータとして識別する。トレーニング区分を
使用して、N個のニューラルネットワークのグループを
トレーニングする。各ネットワークは異なる開始重みを
有する(ステップQ)。したがって、例示の実施形態で
は、20個の異なる乱数種を使用してランダムに選択され
た開始重みを有する20個のネットワーク(N=20)が存
在する。20個のネットワークの各ネットワークごとにト
レーニングを完了した後、20個のすべてのネットワーク
の出力値を平均化して、トレーニングされたネットワー
クのテストデータの平均性能を与える。次いで、トレー
ニングされたネットワークを介してテストファイル(区
分P1)中のデータを実行して、トレーニングされたネッ
トワークの性能の推定値を与える。この性能は、一般に
予測の二乗平均誤差または誤分類率として決定される。
各ネットワークの個々の性能推定値を平均化することに
よって最終性能推定値を生成し、完成したコンセンサス
ネットワークをつくり出す(ステップR)。使用できる
データを複数のサブセットに分割することによるトレー
ニングのこの方法は、一般にトレーニングの「ホールド
アウト方法」と呼ばれる。ホールドアウト方法は、ネッ
トワークトレーニングに使用できるデータが制限される
ときに特に有用である。
テストセット性能は、テストセット性能を最大にする
ネットワークパラメータを識別する様々な実験を実施す
ることによって経験的に最大化できる。実験のこの組中
で修正できるパラメータは、1)隠れた処理要素の数、
2)入力に加えられる雑音の量、3)誤差許容度の量、
4)学習アルゴリズムの選択、5)重み減衰の量、6)
変数の数を含む。可能なすべての組合せの完全な探索
は、一般に、必要とされる処理時間の量のために実際的
でない。したがって、テストネットワークは、ThinksPr
oTMやユーザが開発したプログラムなど、コンピュータ
プログラムを介して経験的に選択されるトレーニングパ
ラメータを使用してトレーニングされるか、または注目
する分野で働いている他者によって生成された既存のテ
スト結果の結果からトレーニングされる。「最もよい」
構成が決定された後、ネットワークの最終組を完成した
データセットに基づいてトレーニングできる。
3.生化学診断テストの開発 変数を分離する同様の技法を使用して、生化学診断テ
ストを構築または検証することができ、また生化学診断
テストデータを患者病気診断テストと組み合わせて、医
療診断の信頼性を高めることができる。
選択された生化学テストは、患者および/または患者
の症状に関連して有用な診断情報がそこから得られる任
意のテストを含む。このテストは、機器ベースである
か、または非機器ベースであり、また生物学試料、患者
兆候、患者状態、および/またはこれらのファクタの変
化の分析を含む。いくつかの分析方法のいずれも使用で
き、免疫学的検定法、生物学的検定法、クロマトグラフ
ィ、モニタおよびイメージャを含む。ただし、これらに
限定されない。この分析は、分析物、血清マーカ、抗
体、およびサンプル中の患者から得られるものなどを評
価できる。さらに、患者に関する情報がテストに関連し
て供給できる。そのような情報は、年齢、体重、血圧、
遺伝的履歴、および他のそのようなパラメータまたは変
数を含む。ただし、これらに限定されない。
この実施形態において開発された例示の生化学テスト
は、Enzyme Linked Immunosorbent AssayまたはELIS
Aテストなど、標準化されたテストフォーマットを使用
するが、本明細書で与えられる情報は、他の生化学テス
トまたは診断テストの開発に適用でき、ELISAテストの
開発に限定されない(例えばELISAテストの説明につい
ては、Atassi他編、「Molecular Immunology:A Textboo
k」、Marcel Dekker Inc.,New York and Basel 1984参
照)。ELISAテストの開発にとって重要な情報は、抗体
プロファイルを特徴付け、かつ抗体の特性を抽出するた
めに蛋白質に対する抗体の反応度を決定するテストフォ
ーマットであるウェスタンブロットテスト中に得られ
る。
ウェスタンブロットは、例えば、混合物中の特定の抗
原をポリアクリルアミドゲル上で分離させ、ニトロセル
ロース上ににじませ、ラベル付けされた抗体をプローブ
として検出することによって、これらの抗原を識別する
ために使用される技法である。(例えばウェスタンブロ
ットについては、StitesおよびTerr編、「Basic and Cl
inical Immunology」、Seventh Edition、Appleton and
Large 1991を参照)。しかしながら、ウェスタンブロ
ットテストを診断ツールとして使用することは時々望ま
しくない。代わりに、診断に関連する情報を含む分子量
の範囲を事前に識別し、次いでこの情報を同等のELISA
テスト中に「コード化」できる。
この例では、有効な生化学診断テストの開発は、疾病
症状が既知であるか、または推測される患者のウェスタ
ンブロットデータの使用可能度に依存する。第5図を参
照すると、ウェスタンブロットデータをソースとして使
用し(ステップW)、ウェスタンブロットデータを処理
する場合の第一のステップは、ニューラルネットワーク
によって使用されるウェスタンブロットデータを事前処
理することである(ステップX)。画像は、コンピュー
タを使用して、スプライン補間および画像正規化を実施
することによってデジタル化され、固定の寸法のトレー
ニング記録に変換される。多数のウェスタンブロットテ
ストからのデータを使用するために画像中の情報のみに
基づいて画像を所与のゲル上で整合する必要がある。ニ
ューラルネットワークの各入力は、特定の分子量または
分子量の範囲を正確に表す必要がある。通常、生成され
る各ゲルは、較正用に標準画像を含む。含まれる蛋白質
は、既知の分子量のものであり、したがって標準画像は
また、同じウェスタンブロット中に含まれる画像の整合
に使用できる。例えば、標準曲線を使用して、同じウェ
スタンブロット上の他の画像の分子量範囲を推定し、そ
れによりニトロセルロースストリップを整合することが
できる。
画像を整合する方法は立方スプライン補間である。こ
れは、標準によって表されたデータ点で滑らかな遷移を
保証する方法である。外挿による起こりうる性能問題を
回避するために、外挿が線形になるように終端条件を設
定する。コンピュータの整合ステップは、ウェスタンブ
ロットの出力上の所与のバンドに対して分子量の推定値
の変動を最小限に抑える。
次いで、最も暗いバンドが1.0の倍率変更された密度
を有し、かつ最も明るいバンドが0.0に倍率変更される
ように密度を倍率変更することによって画像の密度を正
規化するために得られた走査画像を処理する。次いで、
この画像を処理して、以下で説明するように最初にトレ
ーニングされなければならないニューラルネットワーク
への入力になる数の固定の長さのベクトルにする。
トレーニング例は、ウェスタンブロットデータの処理
から生成された結果をトレーニングする上述のプロセス
と同じプロセスで作成される(ステップY)。開始重み
に対する依存度、相互依存変数中の冗長度、ネットワー
クを過剰トレーニングすることから生じる減感の認識さ
れた問題を最小限に抑えるために、前に論じた分割方法
によるデータに基づいて一組のニューラルネットワーク
(コンセンサス)をトレーニングすることが有用であ
る。
処理されたウェスタンブロットデータに対するトレー
ニング実行の感度分析から、大いに寄与する分子量(M
W)の領域を決定し、識別できる(ステップAA)。分離
ステップの一部として、入力と所望の出力との間の相関
の符号が同じである限り、隣接する領域中の入力を「ビ
ン」中に結合することが好ましい。このプロセスは、ウ
ェスタンブロットによってつくり出された代表的な100
プラス入力、および他の入力を、約20個未満の入力のは
るかにより操作可能な数まで減らす。
特定の実施形態では、分子量の複数の範囲は、診断中
の条件を示す所望の出力に相関することが分かる。相関
は、正または負である。減少した入力表示は、ウェスタ
ンブロットトレーニング中に発見されたピークの各ピー
クを中心としたガウス領域を使用して生成される。標準
偏差は、ガウスの値が領域の縁部で0.5以下であるよう
に決定される。
特定の実施形態では、ニューラルネットワーク入力を
生成する基本操作は、計算のために分子量のログを使用
して、ガウス画像とウェスタンブロット画像との間で畳
み込みを実施することである。
データは、上述のように、ホールドアウト方法を使用
してテストできる。例えば、5個の区分を使用し、各区
分中、データの80%をトレーニング用に使用し、データ
の20%をテスト用に使用することもある。データは、各
区分が各ゲルからの例を有する可能性があるようにシャ
ッフルされる。
診断にとって重要な分子量領域を識別した後(ステッ
プAA)、分子量の選択された一つまたは複数の領域の一
つまたは複数のテストを構築する(ステップAB)。ELIS
A生化学テストは一例である。診断にとって重要である
と識別された分子量の選択された一つまたは複数の領域
は、その場合、物理的に識別され、ELISA生化学テスト
の構成要素として使用される。同じ相関符号の領域は単
一のELISAテスト中に結合されても結合されなくてもよ
いが、異なる相関符号の領域は、単一のテスト中に結合
されてはならない。そのような生化学テストの値は、そ
の場合、生化学テスト結果を既知のまたは推測される医
療状態と比較することによって決定される。
この例では、生化学診断テストの開発は、第2図に示
されるプロセス中で患者データと生化学データを結合す
ることによって向上する。これらの条件下では、患者病
歴診断テストは生化学診断テストの基礎である。本明細
書で説明するように、重要な変数として識別された変数
は、診断にとって重要な分子量領域を識別するために使
用すべき一組のニューラルネットワークをトレーニング
するためにウェスタンブロットデータから得られたデー
タと結合される。
第2図を参照すると、ウェスタンブロットデータをソ
ースとして使用し(ステップW)、上述のようにニュー
ラルネットワークが使用するために事前処理する(ステ
ップX)。患者病歴データからの重要な変数およびウェ
スタンブロットデータの処理から生成された結果を結合
し、結合されたデータを使用してトレーニングする(ス
テップY)上述のプロセスと同様のプロセス中でトレー
ニング例を作成する。並行して、ネットワークを上述の
ように患者病歴データに基づいてトレーニングする(ス
テップZ)。
開始重み、相互依存変数間の冗長度、およびネットワ
ークを過剰トレーニングすることによって生じる減感に
対する依存度の認識された問題を最小限に抑えるため
に、分割方法によってデータに基づいて一組のニューラ
ルネットワーク(コンセンサスセット)をトレーニング
することが好ましいことが分かった。患者病歴データの
みに基づくトレーニング実行の感度分析から、上述のよ
うに、大きく寄与する分子量の領域を決定し、識別でき
る(ステップAA)。分離プロセス中の他のステップとし
て、その後、ウェスタンブロットデータ用の重要なビン
を分離するために結合された患者病歴およびビン情報を
入力として使用して、一組のネットワークをトレーニン
グする。「重要なビン」は、患者病歴情報の寄与を考慮
する診断に関連する分子量の重要な領域を表す。これら
のビンは、診断の所望の出力と正または負に相関する。
診断にとって重要な分子量領域を識別した後(ステッ
プAA)、選択された領域または複数の領域用の一つまた
は複数のテストを作成し、上述のように確認する(ステ
ップAB)。次いで、設計されたELISAテストを生成し、
使用して、データベース中の各患者ごとにELISAデータ
を生成する(ステップAC)。ELISAデータおよび重要な
患者病歴データを入力として使用して、上述の分割手法
を使用して一組のネットワークをトレーニングする(ス
テップAE)。分割手法を使用すれば、生化学テストの下
限の推定値が得られる。一組のネットワーク、すなわち
供給できる製品として使用すべきネットワークの最終ト
レーニング(ステップAE)は、トレーニングデータの一
部としてすべての使用できるデータを使用して行われ
る。必要な場合、新しいデータを使用して、診断テスト
の性能を確認できる(ステップAF)。すべてのトレーニ
ングデータの性能は、生化学テストの性能推定値の上限
になる。ネットワークのコンセンサスは、意図された診
断テスト出力(AG)を表す。このニューラルネットワー
クの最後の組は、その場合診断に使用できる。
4.ニューラルネットワーク性能の改善 ニューラルネットワークを例に挙げて説明した意思決
定支援システム、および本発明において提供される方法
の重要な特徴は、性能を改善する能力である。上記で概
説したトレーニング方法は、より多くの情報が使用でき
るようになるにつれて繰り返される。動作中、すべての
入力変数および出力変数は、記録され、将来のトレーニ
ングセッション中にトレーニングデータを増大させる。
このようにして、診断ニューラルネットワークは、個々
の母集団および母集団特性のゆるやかな変化に適合でき
る。
トレーニングニューラルネットワークが、ユーザが所
要の情報を入力し、かつニューラルネットワークスコア
をユーザに出力することを可能にする装置中に含まれる
場合、使用中の性能を改善するプロセスが自動化され
る。各エントリおよび対応する出力は、メモリ中に保持
される。ネットワークを再トレーニングするステップは
装置中にコード化できるので、ネットワークは、母集団
に固有のデータを使用してどんなときでも再トレーニン
グできる。
5.診断テスト治療方法の有効性を評価する方法 一般に、診断テストの有効性または有用性は、診断テ
スト結果が分かっているかまたは推測される患者医療状
態と比較することによって決定される。診断テストは、
診断テスト結果と患者医療状態との間に良好な相関があ
る場合に有効であると考えられる。診断テスト結果と患
者医療状態との間の相関がよければよいほど、診断テス
トの有効性に置かれる評価は高くなる。そのような相関
がない場合、診断テストは、あまり有効でないと考えら
れる。本発明において提供されるシステムは、そのテス
トに対応する変数が重要な選択された変数であるかどう
かを決定することによって生化学テストの有効性を評価
する手段を提供する。システムの性能を改善するデータ
をもたらすテストが識別される。
診断テスト結果と患者医療状態との間の相関と無関係
に、診断テストの有効性をそれにより決定できる方法
(第6図)について以下で説明する。同様の方法を使用
して、特定の治療の有効性を評価できる。
一実施形態では、この方法は、患者データのみに基づ
いてトレーニングされた患者病歴診断ニューラルネット
ワークの性能を、患者病歴データとELISAデータなど生
化学テストデータとの結合に基づいてトレーニングされ
た結合ニューラルネットワークの性能と比較する。患者
病歴データを使用して、すべて上述のように、診断用の
重要な変数を分離し(ステップAH)、最後のニューラル
ネットワークをトレーニングする(ステップAJ)。並行
して、その患者データが分かっているすべての患者また
はサブセットについて生化学テスト結果を与え(ステッ
プAK)、すべて上述のように、まず診断用の重要な変数
を分離し(ステップAL)、その後最後のニューラルネッ
トワークをトレーニングすること(ステップAM)によっ
て診断ニューラルネットワークを結合した患者データお
よび生化学データに基づいてトレーニングする。
次いで、ステップANで、ステップAJから得られた患者
病歴診断ニューラルネットワークの性能を、ステップAM
から得られた結合した診断ニューラルネットワークの性
能と比較する。診断ニューラルネットワークの性能はい
くつの手段ででも測定できる。一例では、各診断ニュー
ラルネットワーク出力と患者の分かっているまたは推測
される医療状態との間の相関を比較する。その場合、性
能をこの相関の関数として測定できる。性能を測定する
多数の他の方法がある。この例では、ステップAJから得
られたものに勝るステップAMから得られた結合した診断
ニューラルネットワークの性能の向上を生化学テストの
有効性の尺度として使用する。
そのテスト結果と分かっているまたは推測される医療
状態との間の十分な相関を欠いているこの例の生化学テ
スト、および一般の診断テストは、通常、効用が限られ
ると考えられる。そのようなテストは、上述の方法によ
っていくつかの用途を有することが示され、したがって
さもなければ有益でないと考えられるかもしれないその
テストの有効性が高くなる。本明細書で説明した方法に
は、診断テストの有用性を評価する手段を提供するこ
と、かつまた診断テストの有効性を高める手段を提供す
ることの二つの目的に適う。
6.診断用の変数の識別および診断テストの開発へのこれ
らの方法の応用 本発明において提供される方法およびネットワーク
は、例えば、重要な変数を識別し、既存の生化学テスト
を改善し、新しいテストを開発し、療法経過を評価し、
新しい疾病マーカを識別する手段を提供する。これらの
利点を例示するために、提供される方法は、特定の期間
中の陣痛および出産の可能性など、子宮内膜症および妊
娠関連事象に適用されている。
子宮内膜症 本明細書に記載の方法は、子宮内膜症の診断用の非侵
襲性方法を開発する手段を提供している。さらに、本発
明の方法は、子宮内膜症を示すデータを与える生化学テ
ストを開発し、また新しい生化学テストを識別し、開発
する手段を提供する。
意思決定支援システムの変数選択および使用の方法
は、子宮内膜症に適用されている。意思決定支援システ
ム、この例では、ニューラルネットワークのコンセンサ
スは、子宮内膜症の診断用に開発されている。「例」で
詳述するこの開発の過程で、患者病歴データ、すなわち
質問表フォーマットによって患者から得られるデータの
みを利用する子宮内膜症の診断を助けることができるニ
ューラルネットワークを開発できることが分かった。生
化学テストデータを使用して、特定のネットワークの性
能を高めることができることが分かったが、診断ツール
としてのその価値にとっては重要でなかった。変数選択
プロトコルおよびニューラルネットは、子宮内膜症を診
断する手段を提供する意思決定支援システム中に入力で
きる変数の組を選択する手段を提供する。識別された変
数の一部は、従来子宮内膜症に関連していた変数を含む
が、他の変数はそうではない。さらに、上記のように、
子宮内膜症に関連する骨盤痛や月経困難症などの変数
は、診断が可能なようにそれに線形的に相関しない。
例示的な意思決定支援システムについて例中で説明す
る。例えば、本明細書でpat07で示される一つのニュー
ラルネットワークについて例14で説明する。pat07ネッ
トワーク出力と子宮内膜症を有する確率との比較は正の
相関をもたらす(表1参照)。pat07ネットワークは、
女性のpat07スコアに基づいて子宮内膜症を有する女性
の可能性を予測できる。例えば、女性が0.6のpat07スコ
アを有する場合、彼女は子宮内膜症を有する90%の確率
を有する。pat07スコアが0.4の場合、彼女は子宮内膜症
を有する確率が10%である。データベースに適用したと
きのpat07出力のダイナミックレンジは、約0.3から約0.
7であった。理論上、出力値は、0から1まで変動しう
るが、0.3以下の値または0.7以上の値は観測されなかっ
た。pat07ネットワークを使用して、800人以上の女性を
評価し、その性能は次のように要約できる。
pat07ネットワークスコアは、子宮内膜症を有する可
能性と解釈され、女性が子宮内膜症を有すると診断され
るかどうかではない。可能性は、各スコアグループ中で
発見される子宮内膜症の相対発生率に基づく。例えば、
0.6またはそれ以上のpat07ネットワークスコアを有する
女性のグループでは、これらの女性の90%が子宮内膜症
を有し、これらの女性の10%が子宮内膜症を有しない。
この可能性は、不妊症科にいる女性の人工に関連する。
pat07ネットワークを含むソフトウェアプログラムが開
発されている。
adezacrf.exeと呼ばれる一つのプログラムは、ユーザ
が女性のpat07ネットワークスコアを得ることを可能に
する単一のスクリーンウィンドウインタフェースを提供
する。ユーザは、14個のすべての変数の値を入力し、す
べてのキーストロークの後でpat07ネットワークスコア
を計算する。adzcrf2.exeと呼ばれる他のプログラム
は、adezacrf.exeとほとんど厳密に同じであるが、一つ
の追加の入力、すなわちELISAテストの値を入力でき
る。このプログラムおよびネットワークは、診断テスト
の臨床的効用を拡大する方法の具体的な例である。ELIS
Aテスト結果は子宮内膜症に相関しなかった。それだけ
ではELISAテストは臨床的効用を有しない。他の入力パ
ラメータとして、ELISAテストは、ネットワーク分析用
の入力としてELISA結果を組み込むことがELISAテストの
臨床効用を拡大するように、ネットワーク性能を改善し
た。adzcrf2.exeと呼ばれる(本明細書の付録IIに記載
されている)他のプログラムは、ユーザが女性のpat07
ネットワークスコアを得ることを可能にする多重スクリ
ーンウィンドウインタフェースを提供する。多重データ
エントリスクリーンは、すべての患者病歴データを入力
し、pat07用の入力として必要とされるパラメータだけ
は入力しないようにユーザを案内する。ユーザがすべて
のデータを入力し、正確なものと認めた後で、pat07ス
コアを計算する。このプログラムはまた、*.fdbファイ
ル中に入力されたデータを保管し、データをインポート
し、インポートされたデータ上のpat07スコアを計算
し、データをエクスポートすることができる。ユーザ
は、前に入力したデータを編集することができる。上記
の三つのプログラムはすべて、子宮内膜症用の診断ソフ
トウェアの具体的な例として役立つ。
第11図に、診断ソフトウェア中で使用される例示的な
インタフェーススクリーンを示す。MicroSoft Windows
TMタイプのディスプレイとして提供されるディスプレイ
1100は、子宮内膜症の診断用に決定された重要な変数の
各変数ごとに数値を入力するためのテンプレートを提供
する。テストを実施するためのデータの入力は、従来の
キーボードのみを使用するか、またはコンピュータマウ
ス、トラックボールまたはジョイスティックと組み合わ
せて実施される。本明細書では、マウスとキーボードの
組合せを使用する。各テキストボックス1101〜1106は、
重要な変数、すなわち年齢(ボックス1101)、妊娠回数
(ボックス1102)、出産回数(ボックス1103)、流産回
数(ボックス1104)、一日当たり吸うたばこの箱数(ボ
ックス1105)、ELISAテスト結果(ボックス1106)を表
す数値を入力するためのものである。対象患者の年齢を
入力するために、ユーザは、スクリーン上のポインタが
ボックス1101中に入るようにマウスを動かし、次いでそ
の位置でクリックする。キーボードを使用して、患者の
年齢を表す数を入力する。選択されたボックスでポイン
トし、クリックすることによって残りのボックスにアク
セスする。
ボックス1107〜1115は、データが二進、すなわち「ye
s」か「no」である重要な選択された変数である。ボッ
クスおよび変数は次のように相関する。
ボックス 変数 1107 子宮内膜症の過去病歴 1108 月経困難症 1109 妊娠中の高血圧症 1110 骨盤痛 1111 異常PAP/形成異常症 1112 骨盤手術歴 1113 薬物治療歴 1114 生殖器いぼ 1115 糖尿病 これらの変数の任意の変数に対する「yes」は、対応
するボックスをポイントし、マウスボタンをクリックし
て、ボックス中の「X」を示すことによって表示でき
る。
ネットワークは、すべてのキーストロークの後でデー
タを自動的に処理し、したがってテンプレート1100中へ
のすべての入力の後でテキストボックス1118〜1120中に
表示される出力値中に変化が現れる。「Endo」とラベル
付けされたテキストボックス1118は、子宮内膜症の存在
に対してコンセンサスネットワーク出力を与える。「No
Endo」とラベル付けされたテキストボックス1119は、
子宮内膜症の不在に対してコンセンサスネットワーク出
力を与える。テキストボックス1120は、患者が子宮内膜
症を有するかどうかを示す相対的スコアを与える。テキ
ストボックス1120中のスコアは、医師が結果を解釈する
ことをより容易にするボックス1118および1119から得ら
れた人工的な数であることに留意されたい。上記のよう
に、25までの正の範囲中のこのボックス中の値は、子宮
内膜症を有することを示し、−25までの負の範囲の値
は、子宮内膜症を有しないことを示す。選択された変換
は、医師がpat07出力をより容易に解釈することを可能
にする。
例で説明したように、pat07は、子宮内膜症を予測す
る唯一のネットワークではない。pat08からpat23aで示
される他のネットワークが開発されている。これらも子
宮内膜症を予測する。これらのすべてのネットワーク
は、まったく同様に動作し、容易にpat07の代わりに使
用できる。したがって、pat07を開発するために使用し
た方法に従って、他の同様に機能するニューラルネット
が開発でき、開発されている。pat08およびpat09は、pa
t07に最も類似している。これらのネットワークは、上
記で概説したプロトコルに従って開発され、pat07の開
発用に使用されるものと同じ組から重要な変数を選択す
ることができた。
変数の初期重み付けは、変数選択手順の結果に対して
は影響を及ぼすが、最後の診断結果中ではそうではない
ことが分かった。pat08およびpat09は、pat07と同じ患
者データのデータベースを使用して、疾病関連パラメー
タを導出した。pat10からpat23aは、元々いくつかのパ
ラメータ、すなわち子宮内膜症歴、骨盤手術歴、月経困
難症歴、骨盤痛の重要度を明らかにするために設計され
たトレーニング実行であった。これらを開発するため
に、変数選択プロセスから変数を差し引くことによって
その変数の重要度を評価した。変数選択プロセスおよび
最後のコンセンサスネットワークをトレーニングするこ
とで、ネットワーク性能は著しく低下しないことが分か
った。
したがって、特定の変数または変数の組は子宮内膜症
を予測する場合に重要であると考えられていたが、その
ような変数がない場合にトレーニングされるネットワー
クは、子宮内膜症を予測する著しく低下した能力を有し
ない。これらの結果は、(1)変数選択およびコンセン
サスネットワークトレーニング用の方法の有効性、およ
び(2)一般にネットワークの適合性を証明する。一つ
のデータタイプがない場合、ネットワークは、その情報
を引き出すべき他の変数を見つけた。一つの変数がない
場合、ネットワークは、異なる変数をその所定の位置で
選択し、性能を維持した。
子宮内膜症を有する疑いがある患者は、一般に疾病を
診断するために診断手術を受けなければならない。患者
病歴情報および任意選択でウェスタンブロットデータな
ど生化学テストデータを使用して、この障害を確実に診
断する能力は、手術の非常に望ましい代替手段を与え
る。本発明の方法および識別された変数はそれを行う手
段を与える。
子宮内膜症の疾病の診断に関連するデータが収集され
ている。このデータは、患者病歴データ、ウェスタンブ
ロットデータ、ELISAデータを含む。「例」に示される
本発明の方法の適用は、患者病歴データのみが子宮内膜
症を予測できることを証明した。
変数選択プロトコルの性能を評価し、14個の変数ネッ
トワーク(pat07)が14個の変数の可能なすべての組合
せと比較して(性能に関して)順位付けされることを確
認するために、ネットワークを変数の可能なすべての組
合せ(16,384の組合せ)に基づいてトレーニングした。
また、変数選択プロトコルを14個の変数の組に適用し
た。14個の変数の中から、5個の変数を選択した。これ
らは、妊娠高血圧症、出産回数、異常PAP/形成異常症、
子宮内膜症歴、および骨盤手術歴である。この組合せを
16,384の可能な組合せから68番目に最もよく実行する組
合せとして順位付けし(99.6百分位数)、それにより変
数選択プロトコルの有効性を証明した。また、14個のす
べての変数を含む組合せを16,384の可能な組合せから71
8番目に順位付けした(95.6百分位数)。
これらの結果はまた、14個の変数のサブセットが有用
であることを示す。特に、3個の変数の次の組合せの一
つ(または複数)のパラメータの選択された組の任意の
サブセット、特に14個の変数の組が子宮内膜症の診断用
に意思決定支援システムとともに使用できる。
a)出産回数、子宮内膜症歴、骨盤手術歴 b)糖尿病、妊娠高血圧症、喫煙 c)妊娠高血圧症、異常papしみ/形成異常症、子宮内
膜症歴 d)年齢、喫煙、子宮内膜症歴 e)喫煙、子宮内膜症歴、月経困難症 f)年齢、糖尿病、子宮内膜症歴 g)妊娠高血圧症、出産回数、子宮内膜症歴 h)喫煙、出産回数、子宮内膜症歴 i)妊娠高血圧症、子宮内膜症歴、骨盤手術歴 j)妊娠回数、子宮内膜症歴、骨盤手術歴 k)出産回数、異常PAPしみ/形成異常症、子宮内膜症
歴 l)出産回数、異常PAPしみ/形成異常症、月経困難症 m)子宮内膜症、骨盤手術歴、月経困難症 n)妊娠回数、子宮内膜症歴、月経困難症。
例で示すように、列挙した14個の変数と同じ働きをす
る重要な選択された変数の他の組が得られる。他のより
小さいそのサブセットも識別できる。
特定の期間中の出産の可能性など、妊娠関連事象の予測 本発明の方法は、任意の障害または状態に適用でき、
特に診断テストが適切に相関し得るか、または生化学テ
ストまたは好都合な生化学テストが使用できない状態に
適している。例えば、本発明の方法は、特定の期間中の
出産の可能性など、妊娠関連事象の予測に適用されてい
る。
間近に迫った出産の決定は、例えば、34週までに生ま
れた幼児の新生児残存者を増やすために重要である。妊
娠の週20後に妊娠患者からの膣腔または子宮頸管からの
分泌サンプル中の胎児のフィブロネクチンの存在は、34
週前の陣痛および出産の危険に関連する。妊娠の週20後
に妊娠患者からの膣腔または子宮頸管からの分泌サンプ
ル中の胎児のフィブロネクチンをスクリーニングする方
法および装置が販売されている(米国特許第5516702
号、第5468619号、第5281522号、および第5096830号参
照。また、米国特許第5236846号、第5223440号、および
第5185270号参照)。
これらの分泌物中の胎児のフィブロネクチンの存在
と、34週前の陣痛および出産との相関は完全ではない。
著しい偽正率および偽負率が存在する。したがって、34
週前の陣痛および出産の可能性を評価する方法の必要に
対処し、使用できるテストの予想可能度を改善するため
に、本発明の方法は、いくつかの妊娠関連事象の可能性
を評価する意思決定支援システムの開発に適用されてい
る。特に、懐胎の34週前(または後)の出産を予測する
ニューラルネットが開発された。本明細書で説明した開
発されたニューラルネットワークおよび他の意思決定支
援システムは、偽正の数を少なくすることによって胎児
のフィブロネクチン(fFN)の性能を改善できる。例13
に示される結果は、本発明の方法を使用すれば、予測性
能が改善されるので既存のテストの診断効用が改善でき
ることを証明する。
上述のように、これらの方法を使用して、前に疾病、
状態または障害に関連すると考えられていなかったテス
トを識別し、新しいテストを設計し、新しい疾病マーカ
を識別することができる。
次の例は、説明のためにのみ記載し、本発明の範囲を
限定するものではない。
例1 患者病歴データの関連変数についての評価 この例は、候補変数の選択を説明する。
要件 患者病歴を評価して、どの変数が診断に関連するかを
決定する。この例は、診断で使用する各変数についての
感度分析を実施することによって実施される。この分析
の実施には二つの方法を使用することができる。第一の
方法は、全ての情報についてネットワークをトレーニン
グし、各入力がネットワーク出力に及ぼす影響をネット
ワークの重みから決定する方法である。第二の方法は、
変数を含んでトレーニングしたネットワーク、および変
数を排除してトレーニングした第二のネットワークの、
二つのネットワークの性能を比較する方法である。この
トレーニングは、関連すると考えられる変数のそれぞれ
について実施することになる。性能に寄与しないものは
排除されることになる。こうした操作は、ネットワーク
への入力のディメンションを低下させるために実施でき
る。限られた量のデータでトレーニングする場合には、
入力のディメンションが低いことにより、ネットワーク
の一般化能力が高まることになる。
データの分析 この例で使用するデータは、510件の患者病歴を含ん
でいた。各記録は120個のテキストおよび数字フィール
ドを含む。これらのフィールドのうち45個は、手術前に
知られており、常に情報を含むものとして識別された。
これらのフィールドは、ネットワークの分析およびトレ
ーニングに利用できる基本的な変数として使用した。こ
の例で使用した変数の概要は以下の通りである。
使用した方法 変数の重要性を決定する、最も一般的に使用される方
法は、全ての変数を含むデータについてニューラルネッ
トワークをトレーニングする方法である。トレーニング
したネットワークを基礎として使用して、ネットワーク
およびトレーニングデータについて感度分析を実施す
る。各トレーニング例では、ネットワークは順方向モー
ドに実行される(トレーニングなし)。ネットワーク出
力を記録した。各入力変数について、ネットワークは、
変数をそのトレーニング例にわたるその変数の平均値で
置換して、再実行される。出力値の差を二乗して累積す
る。各トレーニング例についてこのプロセスを繰り返
す。次いでその結果生じた合計を正規化し、正規化した
値の合計が変数の数と等しくなるようにする。このよう
に、全ての変数が等しく出力に寄与する場合には、それ
らの正規化値は1.0になるはずである。次いで正規化値
を重要性の順に順位付けすることができる。
上記の手法にはいくつかの問題がある。第一に、これ
は発見されたニューラルネットワークの解決策に依存す
る。異なるネットワークの開始重みを使用すれば、異な
る順位付けが発見される可能性がある。第二に、二つの
変数の相関性が高い場合には、そのいずれを使用しても
十分な情報を含むことになる。ネットワークトレーニン
グ実行に依存して、ただ一つの変数しか重要であると識
別することはできない。第三の問題は、トレーニングし
すぎたネットワークが、変数の真の重要性を曲解する可
能性があることである。
上記の問題の影響を最小限に抑えるために、いくつか
のネットワークをデータについてトレーニングした。で
きる限り最良のテストセットの性能を生み出すようにト
レーニングプロセスを洗練し、ネットワークが入力と所
望の出力との間の基礎関係を学習しているようにした。
このプロセスの終了までに、ネットワークの良好なセッ
トが利用可能になり、また最後にトレーニングしたネッ
トワークについてのトレーニング構成も確立されること
になる。トレーニングした各ネットワークについて感度
分析を実施し、正規化値を平均した。この例では、トレ
ーニング実行は、ホールドアウト方法を使用して利用可
能なデータの五つの区分についてトレーニングした15個
のネットワークを含んでいた。
変数の順位付けが確立された後で、テスト実行を行
い、変数の排除がテストセットの性能に及ぼす影響を決
定した。寄与の小さい変数を排除すると、テストセット
の性能が低下する。トレーニングデータが限られている
ことによって過剰トレーニングが問題になる場合には、
変数を排除することによってテストセットの性能を実際
に改善することができる。処理時間を節約するために、
順位付けに基づくテストでは変数のグループを排除する
こともできる。
結果 順位付けまたは変数は以下の通りとなり、これらはpa
t05の実行でトレーニングされたネットワークについて
報告される。
01.35.薬物治療歴 02.33.Endoの過去の病歴 03.11.出産回数 04.37.骨盤痛 05.40.月経困難症 06.34.骨盤手術歴 07.1.年齢(preproc) 08.13.不妊症歴 09.8.箱/日 10.36.現在の外因性ホルモン 11.42.不妊症 12.18.誘発ホルモン 13.15.無排卵 14.14.排卵 15.43.付属器の壊/肥厚症 16.45.その他の症状 17.30.異常PAP/形成異常症 18.26.子宮外妊娠 19.19.ヘルペス 20.39.月経異常 21.12.流産回数 22.41.性交疼痛症 23.24.子宮/卵管異常 24.31.婦人癌 25.32.その他の病歴 26.10.妊娠回数 27.28.卵巣嚢胞 28.25.フィブロイド 29.22.膣感染 30.16.未知 31.27.機能性子宮出血 32.38.異常な痛み 33.5.妊娠過形成 34.9.薬物使用 35.20.生殖器いぼ 36.3.妊娠DM 37.4.高血圧症 38.21.その他のSTD 39.23.PID 40.44.未決定 41.2.糖尿病 42.17.乏排卵 43.6.自己免疫疾患 44.29.多嚢胞性卵巣症候群 45.7.移植 変数のサブセットをテストし、14個の変数の最後のセ
ットを使用してpat07のネットワークをトレーニングし
た(例13および14参照)。上記の上位14個にはないいく
つかの変数も使用した。これによりテストセットの性能
が改善された。pat07のネットワークについての順位付
けは以下の通りである。
01.10.Endoの過去の病歴 02.6.出産回数 03.14.月経困難症 04.1.年齢(preproc) 05.13.骨盤痛 06.11.骨盤手術歴 07.4.箱/日 08.12.薬物治療歴 09.5.妊娠回数 10.7.流産回数 11.9.異常PAP/形成異常症 12.3.妊娠過形成 13.8.生殖器いぼ 14.2.糖尿病 結論 この例で識別された変数のセットは、テストおよび情
報に基づいて妥当であると考えられる。
例2 患者病歴データについてのネットワークのトレーニング この例は、上記の14個の変数を使用して、様々なパラ
メータを設定および最適化する方法を明らかにする。
要件 上記の例が完了すると、減少した患者病歴についてネ
ットワークのセットをトレーニングし、それらの性能を
記録する。実験を実行し、ネットワークのトレーニング
に最良の構成およびパラメータを決定した。性能の分析
を実施して偽の正および偽の負の数を決定し、所与の患
者のサブセットを信頼性高く診断することができるかど
うかを調べた。データが限られているので、推定した性
能は、残りのデータについてのテストおよびトレーニン
グのためにデータベースの小さな部分(25%)を除外す
ることによって決定した。ネットワークの一つで全ての
データをテストデータとして使用するまで、この方法を
繰り返した。次いでテストデータについての組み合わせ
た結果が性能の推定となる。最後のネットワークは、利
用可能な全てのデータをトレーニングデータとして使用
してトレーニングした。
使用した方法 少ないトレーニング例を扱う場合には、ネットワーク
構成およびパラメータ設定の決定に便利なテスト情報を
提供するためには、ホールドアウト方法が有効である。
処理時間を大幅に増加させることなくトレーニングに利
用できるデータを最大限にするために、提案された25%
ではなく、20%のホールドアウトを使用した。これによ
り四つではなく五つのデータ区分が生じ、データの80%
が各区分のトレーニング用となった。
ランダム開始重みの影響を最小限に抑えるために、複
数のネットワークを全トレーニング実行でトレーニング
した。こうした実行では、三つのネットワークを、デー
タの五つの区分のそれぞれで、それぞれ異なるランダム
開始からトレーニングした。ネットワークの出力を平均
して、単一のネットワークから得られるより低い分散を
有するコンセンサス結果を形成する。
いくつかの実験を実施し、テストセットの性能を最大
限にするネットワークのパラメータを発見した。このプ
ロセスで修正したパラメータは以下の通りである。
1.隠れた処理要素の数 2.入力に追加された雑音の量 3.誤差許容度の量 4.使用する学習アルゴリズム 5.使用する重み減衰の量 6.使用する入力変数の数 45個の変数の可能な全ての組合せを完全に探索するこ
とは、テストに必要とされるCPU時間の量により容易で
はない。テストネットワークは、この領域で重要である
と当業者に知られているパラメータに基づいて、また以
前のテストの結果に基づいて選択したパラメータでトレ
ーニングした。その他の変数のセットも適当である。ま
た、本明細書の別の部分に示すように、選択した14個の
変数全ての組合せをテストした。最良の構成が決定され
た後で、510人の患者の完全なデータセットについて、
最後のセットのネットワークをトレーニングした。最後
のセットのネットワークでは、八つのネットワークのコ
ンセンサスを作成し、最終的な統計値を生成した。
結果 最終的ホールドアウトトレーニングの実行は、14個の
変数を有するpat06であった。テストデータについての
性能は68.23%であった。全トレーニング実行は、pat06
と同じネットワーク構成を有するpat07であった。トレ
ーニングデータについての性能は72.9%であった。最後
のトレーニング実行についての統計値を、ネットワーク
出力値のカットオフの使用に基づいて生成した。ネット
ワーク出力がカットオフ以下である場合には、この例は
考慮されていない。以下の表はpat07中の八つのネット
ワークのコンセンサスについての結果の概要である。ad
zcrfと呼ばれるテストプログラムを生成して、この最後
のトレーニングを明らかにした。
例3 ウェスタンブロットデータの事前処理および入力 要件 最初に論理設計に送られた、患者についてのウェスタ
ンブロットからの抗原データは、ピーク分子量およびそ
れらが関連する強度のみについての情報を提供した。こ
のデータ、およびこのデータが取られた元の画像の分析
は、より多くの情報をニューラルネットワークに提供す
ることができるようにデジタル化された元の画像を使用
することができることを示す。二つの実験について元の
画像を検査すると、画像データを事前処理は、画像中の
特定の分子量の位置の可変性を低下させる。この事前処
理では、標準画像に適した多項式を使用して、修正した
画像を生成することになる。画像の事前処理は、画像の
背景レベルおよびコントラストを正規化するステップも
含むことになる。
事前処理が完了した後で、画像データをそのままで使
用する、またはピーク分子量を抽出することができる。
得られた画像から、ニューラルネットワークへの入力が
生成されることになる。通常の画像は約1000ピクセルの
長さであるので、入力数を減少させる方法が調査される
ことになる。画像が、全てまたは減少したディメンショ
ン(解像度)の画像を使用して直接ネットワーク入力に
コード化されるので、ニューラルネットワークは、監視
学習でトレーニングされ、疾病の決定に関係する分子量
の範囲の決定を補助することになる。この例は、ネット
ワークへの入力中で画像を全体として使用することを焦
点とする。
使用した方法 相関技術を使用して、ウェスタンブロットの画像につ
いての同様の特徴を突き合わせて、相関プロットを生成
した。これらのプロットから、サンプルを正確に整合す
るには、二つのサンプルの相関プロットについての突合
せの変動が大きすぎると結論付けられた。ネットワーク
の各入力は分子量値を正確に表現する必要があるので、
標準画像からの情報のみを画像の整合に使用することに
決定した。
標準画像について二次適合を実施し、相対移動性情報
を分子量に翻訳する手段を生成する。相対移動性の曲線
を分子量の対数に対してプロットし、RSQR値を検査した
後で、二次適合はこの翻訳を実施するのに十分に正確で
はなかったと結論付けられた。二次適合を使用して標準
分子について計算した分子量は、ゲルごとに様々であ
る。
相対移動性の分子量への翻訳を改善するためにいくつ
かの方法を試みた。三次スプライン補間法を翻訳した。
この方法は、データ点でのなめらかな移行を保証し、迅
速に計算される。唯一重要なのは、標準がカバーする区
間の外側にある相対移動性の値について、この方法がど
のように実施されるかということである。終了条件が適
当に設定されていれば、補外法の問題は回避されるもの
と考えられる。これが選択した方法である。
スプライン補間法を使用して、画像を一定寸法のトレ
ーニング記録に変換した。この時点で、画像強度の正規
化を考慮しなければならない。二つの選択肢が考えられ
る。第一は、正規化を実施しないことである。第二は、
画像にわたる最大値が1.0にセットされ、最小値が0.0に
セットされるように画像を処理することである。各選択
肢についてネットワークをトレーニングし、その結果を
比較した。入力に雑音が追加されなければ、事前処理し
た画像ネットワークは97%のトレーニング例性能を有
し、事前処理しなかった場合の性能は79%であった。雑
音が追加された場合には、二つの選択肢は同様の結果を
与えた。さらなるトレーニング実行のために事前処理し
た画像を使用することを選択した。この選択により、ウ
ェスタンブロット法を使用して達成することができる許
容度の範囲内で、所与のネットワーク入力が特定の分子
量と一貫して関連付けられることが保証された。
上記の選択を使用して、一連の八つのニューラルネッ
トワークをトレーニングし、Endo存在変数の予測に基づ
く様々な分子量の重要性についての情報を提供した。相
関の方向の分析を可能にするために、単一の隠れた処理
要素のみをトレーニングに使用した。各ネットワークに
ついて感度分析を実施し、得られたコンセンサスをExce
lを使用してプロットした。
次いでネットワークの重みを平均し、各重みについて
のコンセンサス値を生成した。隠れた要素から出力への
相互接続の重みは正にも負にもなるので、これらの重み
は全ての出力接続が同じ符号を有するように変形した。
次いで重みを平均し、その結果をExcelを使用してプロ
ットした。
結果 ネットワーク入力への画像整合およびMax/Min画像事
前処理のために三次スプライン補間法を使用して、ウェ
スタンブロットデータの分析を実施した。ウェスタンブ
ロット法による、画像の整合の確度において一定量の変
動性が期待できる場合には、この手法は、多項式適合が
最初に使用した、より良好な結果を与えるものと考えら
れる。
最終的コンセンサスネットワークについての感度分析
および重みのプロットは、疾病の予測および診断を補助
することができるウェスタンブロットの領域があること
を示した。ネットワークの重みに見られる、正および負
の相関の領域の幅もまた、示された結果が有意であるこ
とを示す。ピークが非常に狭い場合には、ピークは、過
剰トレーニングと同様のトレーニングプロセスの人為結
果であり、学習される基礎プロセスを形成しないものと
結論付けなければならない。重要であると考えられる領
域は以下の通りである。
正の相関 31503.98−34452.12 62548.87−65735.97 84279.36−89458.49 負の相関 19165.9−20142.47 50263.36−53352.14 67725.77−78614.77 正および負のピークはいくつか存在するが、これら
が、二つのELISAテストに含まれる可能性が最も高いと
考えられる。一方のテストは正の領域を焦点とし、もう
一方は負の領域を焦点とする。次いで得られた二つの値
を、ニューラルネットワークへの入力として患者病歴デ
ータと組み合わせることができる。
結論 ニューラルネットワークは、ウェスタンブロットに基
づいて疾病の存在と相関する領域を発見することができ
た。
例4 ウェスタンブロットデータについての一定入力寸法の調
査 要件 事前処理した画像から抽出したピーク分子量を使用し
て、患者についてのウェスタンブロットデータの変化す
る寸法を、ニューラルネットワークについての一定の寸
法に換算する方法を調査した。この手法は、ネットワー
ク入力が全画像手法より大幅に少なくなるので望まし
い。基本的な問題は、相互に関係する可能性のある分子
量の変数がテストで生じることである。例およびこの例
の結果を比較すると、分子量のパターンが存在するこ
と、またはそれらの分子量が関連がないかどうかが示さ
れる。分子量データにはいくらか変動性があるので、ニ
ューラルネットワークについて分類を実施しても、この
データを処理する手法はファジーメンバシップ関数と同
様である。
追加条件 ウェスタンブロットデータから一部分が識別される。
これらの部分の積は再生可能であるので、この情報の使
用の有効性は、ウェスタンブロット画像データを処理し
て、これらの部分の分子量に対応するbinsにすることに
より決定される。
使用した方法 例4の結果から、分子量のいくつかの範囲が疾病と相
関があるものと決定される。例5に見られる各ピークに
集中するガウス領域を使用することにより、減少した入
力表現が生成された。ガウスの値が領域の縁部で0.5以
下になるようにガウスの標準偏差を決定した。ニューラ
ルネットワーク入力を生成するために実施した基本操作
は、ガウスとウェスタンブロット画像との間のたたみ込
みである。計算は全て、分子量の対数を使用して実施し
た。
別々のソフトウェアプログラムが生成された。このプ
ログラムは、正規化した画像についての分子量および強
度に対するたたみ込みを実施した。ネットワーク入力の
計算のパラメータは、binprocプログラム中の表に含ま
れる。binprocでは、平均および標準偏差はこの表に記
憶される。表の値が変更されるときに、プログラムは再
コンパイルされる。プログラムは、Excelを使用して匹
敵するウェスタンブロット画像にガウスをプロットする
ことができる出力ファイルを生成するテストモードを有
する。領域のプロットはドキュメンテーションに含まれ
る。
36個の小部分を処理する際には、小部分の位置をbinp
rocの表の値に翻訳するようにbinproc.cを再度修正し
た。この修正したプログラムをfproc.dと呼ぶ。その目
的は、分子量値を標準に基づいて正規化するのに必要な
スプライン補間を実施することである。binprocからbin
proc2.cを生成し、平均偏差表および標準偏差表を、供
給されたファイル中の小部分の終点に対応するmin.表お
よびmax.表で置き換えた。
上記プログラムから生成された任意のデータファイル
をテストするために、データの80%をトレーニング用
に、残りの20%をテスト用に使用して、ホールドアウト
方法を使用した。ウェスタンブロットデータからトレー
ニングデータが生成された後で、乱数列および患者のID
列をExcelのスプレッドシートに追加した。次いで乱数
列上でデータをソートした。これにより実際にデータが
シャッフルされる。このようにして、各区分が各ゲルか
らの例を有する可能性が高い。これらの割合で、五つの
別々のトレーニングおよびテストファイルが、組み合わ
せたテストセットの結果からネットワークの性能を推定
することができるように生成される。
ThinksProTMを使用して、入力を排除することによ
り、ネットワークが使用する入力の数を変化させること
ができる。排除された入力は、トレーニング中にネット
ワークに提示されない。ガイドとして感度分析を使用し
て、重要でない入力を除去する。入力スペースのディメ
ンションを減少させることは、トレーニング例の数が少
ないときにはさらに重要になる。この方法は、患者病歴
トレーニング実行中の変数を除去する際に使用したもの
と同じである。現在では、このプロセスは手動で行う。
結果 例5では、全てのデータについてのトレーニングされ
たネットワークを使用して、分類プロセスに重要な分子
量の範囲を決定した。この例では、ホールドアウト方法
を使用して、テストセットの性能を推定することができ
るようにネットワークをトレーニングした。第一のテス
トセットは、例5で識別された領域に基づいている。第
二のテストセットは、四つのishgelファイル中で識別さ
れた小部分を使用して作成された。
例5で見られた上位六つの領域に基づく最初のコンセ
ンサス実行の性能は低い(50%)。生成された入力デー
タの分析により、入力データの生成に使用された領域
は、画像データから重要な情報を捕捉するには狭すぎる
ことが示された。領域の幅を広げ、上位六つではなく、
例5からの上位10個の領域を含めた。幅を広げた10個の
領域についてのテストはわずかに良好な性能を示した。
感度分析を使用して、10個の領域のうち三つを除去し、
完全なテストを実行した。幅を広げた10個の領域のうち
六つについての性能は、54.5%に向上した。
ネットワークへの入力数がさらに減少するにつれて、
テストセットの性能(ホールドアウト方法で推定)は高
まり続ける。66392.65から78614.74の範囲の分子量を有
するただ一つの領域しか使用しない場合に最高の性能が
達成された。ホールドアウト方法を使用した、テストデ
ータについての性能の推定値は58.5%であった。
このプロセスを、識別された小部分に基づく36個の領
域を開始として使用して再度適用した。36個の小部分に
は大量の重複が存在した。上位七つの小部分を、感度分
析を使用して36個から決定した。小部分のサブセットを
使用して、58%という同様の性能が達成された。
結論 テストでは非常に高い結果は生じなかった。このこと
の主な理由は、この例で利用できるトレーニングデータ
の量が限られていたことである可能性が高い。以前の例
から得られた結果は、トレーニングサンプル中の患者数
が減少するにつれて妥当性データについての性能も低下
したことを示した。この関係を以下の表に示す。
患者数が減少しても、Elisa変数を含む場合にはElisa/
患者病歴データについてより良好な結果が達成された。
このことはELISA変数の価値を示す。
いくつかの領域を、疾病の分類に重要であると決定で
きることは明らかである。大幅に異なる領域のセットが
同様の結果を生じ、ウェスタンブロットデータ中に、疾
病の存在を示すパターンが存在する可能性があることを
示す。患者のデータベースが少ない場合には、これらの
パターンを分離することはより困難になる。
ウェスタンブロットデータ用のデータベースのサイズ
の増加により、このデータについてトレーニングしたネ
ットワークの性能が改善されることになることは明らか
である。ウェスタンブロットデータを患者病歴データと
組み合わせると、ネットワークの入力寸法が増加するこ
とになる。入力寸法が増加すると、通常は一般化を保証
するためにより多くのトレーニング例が必要となる。
例5 ウェスタンブロットデータを使用するトレーニングネッ
トワーク この例の目的は、ウェスタンブロットデータのみを使
用して診断についての性能推定を決定するようにネット
ワークのセットをトレーニングすることである。実験を
実行し、ネットワークのトレーニングのための最良の構
成およびパラメータを決定した。上記の例2に記載した
方法を、この性能推定に使用する。最後のネットワーク
は、利用可能な全てのデータをトレーニングデータとし
て使用してトレーニングした。このトレーニングしたネ
ットワークの出力(抗原指標)は、組み合わされたデー
タフェーズ中で生成されたネットワークへの入力として
使用した。
使用した方法 いくつかの方法を使用して、利用可能なトレーニング
データについての最もよく実施される入力のセットを発
見した。以前の例から、感度分析を使用すると、各入力
変数の重要性の識別において良好な結果が生じることが
分かった。その数のネットワークは、感度分析によって
手動で決定された変数の組合せについてトレーニングし
た。
自動化手順を準備する際に、変数の2×2分割表カイ
二乗分析を使用して、変数の重要性の代替の順位付けを
提供した。入力は連続的であるので、各入力についてし
きい値を使用して、分割表に必要な情報を生成した。カ
イ二乗値は、しきい値の設定に依存して変化する。変数
の順位付けに使用するしきい値は、カイ二乗統計値を最
大にするように選択した。
自動化手順の開発中に行われるトレーニング実行は、
これらの順位付けから選択される。トレーニング実行が
行われた時点で、自動化手順は定形化されていない。全
体の処理時間を節約するために、トレーニングデータの
ただ一つの区分しか使用しない。次いでトレーニングお
よびテストデータの第一区分中で良好に実施された変数
の組合せを、残りの区分について試した。
本文献で提案する最良の入力のセットを発見する一つ
の方法は、遺伝アルゴリズムを使用して、最もよく実施
される入力のセットを決定するものである。ジェネティ
ックアルゴリズムは、通常は、良好な解答に収束するに
は数千回も反復する必要がある。ウェスタンブロットデ
ータの処理では、これは、トレーニング例のサイズが小
さい場合でも大量のコンピュータ時間に相当することに
なる。10個の変数について、全ての組合せを枚挙するに
は1024回のトレーニング実行が必要となる。ジェネティ
ックアルゴリズムの代替の方法を試みた。この代替の方
法では、選択した入力のセットに基づいてテストセット
のRMS誤差を予測するように、ニューラルネットワーク
をトレーニングした。この実験で使用したトレーニング
例は、ウェスタンブロットデータの第一区分についての
トレーニング実行の結果である。次いで全ての組合せで
予測ネットワークをテストし、予測された最小の組合せ
を決定する。次いで入力の組合せを使用して、ウェスタ
ンブロットデータについてネットワークをトレーニング
する。この方法およびジェネティックアルゴリズム手法
の主な欠点は、非常に有効であることが分かっている感
度分析情報が、このプロセスにおいて無視されることで
ある。
結果 ウェスタンブロットデータ中の10個の変数(bins)に
ついての基本的順位付けは、200個の例の全データベー
スについてトレーニングした八つのネットワークのコン
センサスに基づく。その結果は以下の通りである。
7 :1.182073 9 :1.055611 3 :1.053245 8 :1.039028 6 :1.027239 10:1.023135 4 :0.978769 5 :0.952821 2 :0.899936 1 :0.788143 カイ二乗分析に基づく10個の変数の順位付けは以下の
通りである。
3 :4.380517 9 :3.751625 7 :3.372731 2 :3.058437 6 :3.022164 5 :2.787982 10:1.614931 4 :1.225725 1 :0.975502 8 :0.711958 ウェスタンブロットデータの分析中に、トレーニング
データの一つまたは複数の第一区分についてのいくつか
のネットワークをトレーニングした。テストの結果は以
下のように順位付けられ、変数がトレーニング実行に含
まれることを示す。
上記のテスト実行を参照すると、順位付け中のより重
要な変数が下位のテストセット誤差に寄与すること、お
よび含まれる変数が多くなると、テストセットの結果が
低くなることは明らかである。このことは、高性能ニュ
ーラルネットワークの開発における、変数の最良のサブ
セットを選択することの重要性を示す。
いくつかの組合せの変数を使用して、トレーニングデ
ータの全ての区分についてネットワークをトレーニング
した。これらの実行の結果を以下に示す。
変数の両方の順位付けは3、7、および9が重要であ
ると示すので、十分なトレーニングデータが存在する場
合には、この組合せが57.5%を超える可能性が高い。こ
の組合せについてのトレーニング例の性能は63.9%であ
り、これは発生した過剰トレーニングのレベルを示す。
上記に示した第一区分ネットワークのいくつかは、テス
ト性能を予測するようにトレーニングしたニューラルネ
ットワークによって選択された変数の組合せを有する。
これらのネットワークは最後の列の番号によって示され
る。この番号は、テストが実行されるシーケンスを示
す。番号のない組合せは、順位付けから手動で選択し
た。このプロセスを継続すれば、予測ネットワークは最
終的に最良の組合せを発見するはずである。テストセッ
トの性能に影響を及ぼす可能性のあるファクタは数多く
存在するので、テストセットの結果には多くの「雑音」
が存在する可能性が高い。この方法をより良好に働かせ
るために、予測されたテストセットの誤差についてトレ
ーニング値を生成するためにコンセンサス手法が必要に
なることがある。この問題はコンセンサス手法を使用す
る際にも見られる。
結論 変数の感度および分割表順位付けを使用するプロセス
は、ニューラルネットワークの性能を最大限にするよう
に変数のセットを選ぶための有効かつ効率的な技術であ
る。両方の順位付けの下での上位三つの変数は同じであ
り、これはこれらの方法が良好に実施されることを示
す。この方法は、ウェスタンブロットデータを処理する
ことは明らかであるが、任意形態のデータについてよく
作用し、これを患者病歴データにも適用可能な汎用ニュ
ーラルネットワーク技術にする。
上記の結果は、データが多ければ性能レベルが向上す
ることを示す。感度分析は、変数の相対値の変動がほと
んどないことを示す。ほとんどの変数は解答に寄与す
る。完全ウェスタンブロット画像についてトレーニング
したニューラルネットワークの重みの分析に基づいてbi
nsが選択されるので、このことが期待される。しかし、
全てまたはほとんどの変数を使用することにより、ニュ
ーラルネットワークは急速に過剰トレーニング状態とな
る。これは、トレーニング例にデータを追加することに
よって回避することができる。
ニューラルネットワークに案内されて変数を選択する
テストは、順位付け手法より有効性が低いことが分かっ
た。順位付け手法が最も有効であることは明らかである
が、ニューラルネットワーク案内手法でも最終的には最
良の変数のセットを発見することができる。これは遺伝
アルゴリズムより直接的な手法であるので、同様のデー
タについて、ジェネティックアルゴリズムより良好に実
施される可能性が高い。この方法の主な欠点は、探索の
補助に感度分析情報を使用しないことである。
例6 患者病歴およびELISAデータを組み合わせる 要件 上記の例で開発した処理を使用して、患者病歴データ
およびELISAデータの組合せについてネットワークのセ
ットをトレーニングする。抗原の全セットの使用に基づ
いてELISAテストから生成される指標を使用して、この
情報を患者病歴データと組み合わせることによって達成
される性能の改善を決定することになる。
追加要件 上記要件に加えて、複数のELISAからのデータ、ELISA
100およびELISA200データとELISA2データとの間の比
較、ならびに変数の相互関係の分析を実施し、元のELIS
Aテストが関係する変数を決定する助けとした。
使用した方法 ELISAテストの結果を含めることによって達成される
診断テストの性能の改善を決定するために、例2で説明
したホールドアウト方法を使用していくつかのトレーニ
ングを行った。各区分中でデータの80%がトレーニング
に使用され、残りの20%がテストに使用されるように、
データの区分を作成した。
ランダム開始重みの影響を最小限に抑えるために、い
くつかのネットワークは全トレーニング実行でトレーニ
ングする。こうした実行では、三つのネットワークは、
それぞれ異なるランダム開始からの、データの五つの区
分のそれぞれでトレーニングした。ネットワークの出力
を平均し、単一のネットワークから得られるより低い変
動を有するコンセンサス結果を形成した。全ての形態の
ELISAデータを利用することができる患者数は325である
ので、元の14個の変数での新しいトレーニング実行を行
い、ELISAデータが疾病の診断に与える影響を比較する
正確な平均を提供した。ELISA2データの分析は、そのテ
ストのための広範囲の値を示した。ELISA2のELISA100デ
ータに対する関係を示すプロットは、ELISA2データの対
数の方が未処理値より良好である可能性があることを示
す。
比較トレーニング実行は以下のように構成される。
実行1:ELISA100、ELISA200、対数(ELISA2)および元の
14個の変数 実行2:(ELISA2)および元の14個の変数 実行3:元の14個の変数 これらの比較実行を行った後で、ネットワークの最後
のセットを325人の患者の完全なデータセットについて
トレーニングした。ネットワークの最後のセットでは、
八つのネットワークのコンセンサスを作成し、最終的な
統計値を生成した。最後の実行の統計値は、トレーニン
グデータについてのみ報告され、真の性能の上限を表
す。最後のホールドアウト実行の結果は、性能について
の可能な下限を表す。
トレーニングデータから、診断に利用できないものも
含めた65個の変数のそれぞれは、325個のトレーニング
例の中のトレーニング例に組み込まれる。TrainDosトレ
ーニングプログラムは、ネットワークの生成を自動化
し、変数間の関係を提供するように修正した。65個のネ
ットワークのそれぞれでは、一つの変数が残りの64個に
よって予測される。予測を行う際の各変数の重要性を示
すために、各ネットワークについて感度分析を実行し
た。
結果 三つの比較実行についてのコンセンサス結果は以下の
通りである。
実行1:全てのELISA変数(CRFE:1) 66.46% 実行2:ELISA2の対数(CRFEL2) 66.77% 実行3:ELISA変数なし(CRFEL0) 62.76% 実行1および実行2を比較すると、ELISA100およびELIS
A200のデータをELISA2データに追加したことの影響がな
いことが分かる。したがって、ELISA100およびELISA200
の変数は除去することができる。
実行2および実行3を比較すると、ELISAテストに基
づく入力によって、疾病の診断が改善されたことが分か
る。
実行3をpat06と比較すると、テストの性能が5.47%
低下することが分かる。これは単にトレーニングに利用
できる患者数の減少によるものである。このことは、50
0を超えるトレーニングデータの増加は、テストデータ
についてのニューラルネットワークの性能に対して相当
な影響を有する可能性が高いことも意味する。
これらの結果に基づいて、最後のネットワークをトレ
ーニングした。八つのネットワークは325人の患者につ
いてトレーニングした。このトレーニングデータについ
ての性能は72.31%であった。これはpat07実行と同様の
結果であるが、ELISA2データによる改善が利用可能なト
レーニングデータの量が減少したことによって相殺され
ていることは明らかである。
感度分析の結果は、15個の変数の中で7番目に順位付
けされたELISA2の変数を使用したことを示す。
八つのトレーニングしたネットワークの対数ファイル
から、隠れた処理要素出力のプロットを作成した。所望
の出力をプロット上に示すことができるように平均を求
めた。八つのネットワークを比較することにより、それ
ぞれが異なる方法でタスクを実施することが明らかとな
る。データ点のいくつかのクラスタ化が、いくつかのプ
ロットに見られる。これは一貫して起こるわけではない
ので、結論を導き出すことはできない。
ネットワーク出力値のカットオフの使用に基づいて、
最後のトレーニング実行について統計値を生成した。ネ
ットワーク出力がカットオフ以下である場合には、この
例は考慮していない。以下の表はCRFLE2中の八つのネッ
トワークのコンセンサスについての結果の概要である。
一般に、これらの結果はpat07についての結果より良好
である。
この最後のトレーニングのデモとして、adzcrf2.exe
(付録II参照)と呼ばれるテストプログラムを生成し
た。このプログラムにより、ELISAフィールド中の値入
力に基づくpat07およびCRFEL2の実行が可能になる。こ
のフィールド中の値が0であると、pat07が使用され
る。
変数の関係の分析を実施した。この関係の分析に基づ
いて、Endo存在を寄与ファクタとして示す変数を、予測
Endo中で使用する変数と比較した。二つのネットワーク
(PATVARSAおよびPATVARS3)のトレーニングの結果は、
Endoの場合には、相関を使用した場合のように関係が対
称的ではないことを示す。結果を要約するために、CRFV
ARSA.XLSを感度分析の結果から構築した。これらの結果
は、関係の非線形特性を示す。変数の重要性は、トレー
ニング実行中のその他の変数の影響を受ける。このこと
は、この分析の利便性を高めるために重要でない変数を
自動的に除去する手段が必要になることもあることを意
味する。
変数の関係(CRFVAR00からCRFVAR64)の分析は、ほと
んどの場合に、ELISA2テストの対数の方が未処理のELIS
A2値より高い有効性を有することを示す。特に、予測す
るEndo存在およびAFS Stageの両方について上位に順位
付けされた対数値ではそのようになる。
結論 ELISA2テストは、ニューラルネットワークの予測能力
を追加する。ELISA2テストにより、元のELISAテストは
不要となる。この結果に基づいて、ウェスタンブロット
データの処理の結果は、ニューラルネットワークの診断
テストの能力をさらに改善することになる可能性が高
い。
トレーニングデータの増加の影響は、実行3とpat06
の比較において明らかに見られる。この性能の差は、ト
レーニングデータの増加によってニューラルネットワー
クの性能が大幅に向上したことを意味する。この比較か
ら、データを二倍にすれば性能は10から15%向上するこ
とになることは明らかである。データを8倍から10倍に
すれば、性能は75から80%向上する可能性がある。
例7 患者病歴Stage/AFS Scoreトレーニング 要件 上記の例で開発した方法を使用して、疾病のstageま
たはAFS Scoreのいずれかについての関連のある変数を
識別する。使用するターゲット出力変数の選択は、重要
な患者病歴変数のフェーズ1リストを使用するトレーニ
ング実行からのテストセットの性能の比較によって決定
される。重要な変数のリストを選択した後で、510個の
患者データベースについて八つのニューラルネットワー
クのコンセンサスをトレーニングすることになる。
使用した方法 Stageに望ましい出力およびAFS scoreに望ましい出
力について、トレーニング例を構築した。Stage情報の
欠落した患者が7人、Score情報が欠落した患者が28人
存在した。stage変数については、データが欠落してい
る場合には平均値2.09を使用した。scoreについては、
欠落データは、stage変数の値に依存する値で置換し
た。stage1では、scoreとして3を使用した。stage2で
は、10.5を使用した。stage3では28を使用し、stage4で
は値55を使用した。stageおよびscoreは、所望の出力が
0.0から1.0の範囲となるように再処理した。stageは線
形に翻訳した。scoreについては二つの方法を使用し
た。第一の方法は12.5で割ったscoreの平方根である。
第二の方法は、score+1の対数を150の対数で割った数
である。
ホールドアウト方法を使用して、stage、scoreの平方
根、およびscoreの対数についてネットワークをトレー
ニングした。これらのネットワークは、45個の変数を使
用してトレーニングした。その結果を比較して、どの変
数および処理を、この例の残りに使用するかを決定し
た。scoreの対数を選択した。
この時点で、重要な変数のセットを分離する手順が開
始された。八つのネットワークを全トレーニング例につ
いてトレーニングし、コンセンサス感度分析を生成して
変数の第一の順位付けを生み出した。次いでカイ二乗分
割表を生成し、変数の第二の順位付けを生み出した。重
要な変数を分離する手順は手動で開始するが、時間がか
かりすぎることが分かった。この手順は、コンピュータ
プログラムとして実施し、約一週間コンピュータ上で実
行した。
変数選択の結果から、八つ1組のネットワークを全ト
レーニング例についてトレーニングした。コンセンサス
結果を分析し、Endo存在の結果と比較した。
結果 45個全ての変数の感度分析により以下の変数の順位付
けが与えられた。
カイ二乗分析から、以下の変数の順位付けが与えられ
た。
変数選択手順中に選択した変数は以下の通りであり、こ
れは最後の感度分析からの順位付けを示す。
scoreネットワークとEndo存在ネットワークとの比較
は、所望のscore出力にしきい値を与え、Endo存在の比
較を生み出すことによって実施することができる。scor
eおよびpat07のネットワークについての結果を以下に示
す。
結論 この例で識別した変数のセットは妥当であると考えら
れる。
自動化変数選択方法は適当に機能すると考えられる。
変数の選択は、感度分析によって良好に予測される。
疾病を予測する方法は二つあるので、Endo存在ネット
ワークおよびScoreネットワークを組み合わせて、予測
の信頼性を向上させることができる。
例8 患者病歴Adhesionsトレーニング 要件 例7で概説した方法を使用して、Adhesionsターゲッ
ト出力変数についての関連変数を識別する。このターゲ
ット出力変数は、重要な患者病歴変数のフェーズ1リス
トを使用して実行されることになる。これにより、新し
い出力を、フェーズ1中で使用されるEndo存在ターゲッ
ト変数と比較することも可能になる。重要な変数のリス
トを選択した後で、510個の患者データベースについて
八つのニューラルネットワークのコンセンサスをトレー
ニングすることになる。
使用した方法 adhesions変数についてのトレーニングデータは、例
7の場合と同様に生成した。adhesions変数は、Endo存
在の場合に使用したのと同様の方法で二つの出力変数を
生成した。この時点で、重要な変数のセットを分離する
手順が開始された。八つ1組のネットワークを全トレー
ニング例についてトレーニングし、コンセンサス感度分
析を生成して変数の第一の順位付けを生み出した。次い
でカイ二乗分割表を生成し、変数の第二の順位付けを生
み出した。重要な変数を分離する手順は手動で開始する
が、時間がかかりすぎることが分かった。この手順は、
コンピュータプログラムとして実施し、完了するまでに
約一週間コンピュータ上で実行した。
変数選択の結果から、八つ1組のネットワークを全ト
レーニング例についてトレーニングした。コンセンサス
結果を分析し、Endo存在の結果と比較した。
結果 45個全ての変数の感度分析により以下の変数の順位付
けが与えられた。
カイ二乗分析により以下の変数の順位付けが与えられ
た。
変数選択手順中に選択した変数は以下の通りであり、
これは最後の感度分析からの順位付けを示す。
ScoreネットワークとEndo存在ネットワークとの比較
は、所望のscore出力にしきい値を与え、Endo存在の比
較を生み出すことによって実施することができる。scor
eおよびpat07のネットワークについての結果を以下に示
す。
結論 この例で識別した変数のセットは妥当であると考えら
れる。自動化変数選択方法は適当に機能すると考えられ
る。変数の選択は、感度分析によって良好に予測され
る。
例9 この例は本明細書で提供するプロセスの再現性を示す。
使用した方法 AdhesionsおよびScoreについての重要な変数の選択に
使用したソフトウェアは、Endo存在の所望の出力を処理
するように修正した。このソフトウェアは、各特定テス
トについて再コンパイルする必要なく、一般的な場合に
実行することができるようにさらに修正した。
Adhesionおよびscoreについての実行と同様に、Endo
存在変数について実行を行った。これは、変数選択プロ
セス中に四つのネットワークのコンセンサスを使用する
ことを含む。トレーニングデータはトレーニングプロセ
ス中に五つの区分に分割し、テストする変数の現在のセ
ットをそれぞれ評価する、総数で20個のネットワークを
生成した。
異なる乱数シードを有する実行の結果は、コンセンサ
ス中のネットワーク数を増加させる必要があることを示
した。
10個のネットワークのコンセンサスをプロセス中に使
用して、二つの追加変数選択実行を行った。この場合に
は、総数で50個のネットワークが変数の単一の組合せを
評価するようにトレーニングされる。二つの別々の実行
を、ランダム開始シードのみを変更して、同様に行っ
た。
こうした最後の二つの変数選択実行から、八つ1組の
ネットワークは、各変数セット(pat08、pat09)につい
てトレーニングされ、新しいデータ(元の510個の記録
データベースには含まれない)についてそれらの性能を
評価することを可能にする。これらのネットワークの性
能についての統計値は、それらを元のpat07のコンセン
サスネットと比較することができるように生成される。
結果 異なる乱数シードを使用するそれぞれの場合で、変数
選択プロセスは、重要な変数の様々なセットを発見し
た。コンセンサス中のネットワーク数が10まで増加する
と、異なる実行中で共通の変数が増加する。
pat07について使用した元の14個の変数の多くは、10
コンセンサスネットを使用する変数選択実行において重
要であると確認された。選択した変数について行った最
後の実行は、pat08およびpat09と呼ばれる。
pat08およびpat09コンセンサスネットワーク中で使用
した変数を、それらの感度分析の順位付けとともに以下
に示す。
結論 変数選択プロセスは良好に働き、pat07ネットと同様
またはそれ以上に働く二つの代替のネットワークを生み
出した。この結論の理由は、トレーニングデータのみに
ついて生成した性能統計値が、pat08およびpat09よりpa
t07の方がわずかに良好に現れるためである。変数選択
プロセスはテストセットの性能に基づいて慎重に変数を
選ぶので、関連するネットワークが過剰トレーニングに
なっている可能性は低い。ネットワークが過剰トレーニ
ング状態になる場合の典型的な特徴は、トレーニング例
の性能が向上し、テストセットの性能が低下することで
ある。したがってpat07の性能の方が高いと、わずかに
過剰トレーニングの結果となる可能性がある。
変数選択プロセスは明らかに、同じトレーニングデー
タについての二つの代替の選択を生み出したが、二つの
選択の性能は非常に類似していると考えられる。これは
二つの実行についての最後の変数選択のテストセットの
性能に基づいている。二つの変数の相対的な性能が近い
場合には、ランダムファクタがそれらの相対的な順位付
けに影響を及ぼす可能性があることが明らかになった。
変数選択実行中のランダムファクタは、ランダム開始点
と、トレーニング中に入力に付加された雑音の使用とを
含む。ランダム雑音は、より良好な一般化(翻訳:テス
トセットの性能)を補助することが分かっている。コン
センサス中のネットワーク数が増加するにつれて、ラン
ダム影響の度合いは低下する。
高品質のネットワークを生み出す変数のセットの決定
は、変数選択プロセスによって扱われるものと考えられ
る。うまく働く変数のより多くの組合せが枚挙されるに
つれて、特定の変数または変数の組合せが、良好な性能
には不可欠であることが明らかになる。
例10 子宮内膜症の過去の病歴および骨盤手術歴の排除の診断
性能に対する評価 この例の目的は、患者の子宮内膜症を有する危険性を
評価する際の「子宮内膜症の過去の病歴」変数および
「過去の骨盤手術歴」変数の重要性を決定し、その結論
を予測する際の任意の所与の変数の重要性を測定する代
替の手段(感度分析とは異なる)を提供することであ
る。
タスク: 1.「子宮内膜症の過去の病歴」を除いて変数選択プロセ
スを適用する。
2.変数選択プロセスについて様々なランダムシード変数
を使用して、タスク(1)を繰り返す。
3.上記のタスク(1)および(2)で識別した「子宮内
膜症関連変数」の両セットについて、コンセンサスネッ
トワークトレーニングプロセスを完了する。
4.子宮内膜症データベースから「過去の骨盤手術歴」変
数を除いて、上記タスク(1)、(2)、および(3)
を繰り返す。
5.子宮内膜症データベースから「子宮内膜症の過去の病
歴」変数および「過去の骨盤手術歴」変数の両方を除い
て、上記タスク(1)、(2)、および(3)を繰り返
す。
使用した方法 例9で開発した変数選択ソフトウェアを基本として使
用して、例10のそれぞれについての結果を生成した。こ
のソフトウェアは、例10の要件に基づいて考慮から排除
されることになる変数をユーザが識別することができる
ように修正した。このソフトウェアは、除去した変数の
影響をより容易に理解することができるように、テスト
する変数のセットのそれぞれについての分類性能を報告
することができるようにも修正した。
行った各変数選択実行について、変数選択プロセスの
パラメータは以下のように設定した。
区分数:5 コンセンサスネットワーク:10 トレーニング例サイズ:510 パス数:999 変数選択プロセス中のデータベース変数の順序付け
は、感度分析およびカイ二乗分析に基づいている。この
順序付けは、pat08およびpat09で使用したものと同様で
ある。
この例のためにトレーニングしたネットワークは、以
下のように識別される(二つのネットは異なるランダム
シードを有する)。
Endoの過去の病歴を除去:pat10、pat11 過去の骨盤手術歴を除去:pat12、pat13 両変数を除去:pat14、pat15 変数およびランダムシードの各組合せについて変数選
択プロセスが完了した後で、八つ1組のネットワーク
を、識別された選択した変数を使用してトレーニングし
た。これらのネットワークのそれぞれは、完全な510個
の記録データベースについてトレーニングされる。これ
らのトレーニング実行から、出力のコンセンサスがExce
lのスプレッドシート中で生成され、各ネットワークの
性能を評価することができる。
結果 ネットワークのコンセンサスの通常の性能を、5の区
分でホールドアウト方法を使用して推定した。pat08お
よびpat09の場合のように、全ての変数が利用可能であ
る場合には、分類性能は65.23%と推定された。
子宮内膜症の過去の病歴の変数が考慮から除去される
場合(pat10およびpat11)には、性能は62.47%と推定
された。これは2.76%の低下に相当する。
過去の骨盤手術歴の変数が考慮から除去される場合
(pat12およびpat13)には、性能は64.52%と推定され
た。これは0.72%のみの低下に相当する。
両変数が考慮から除去される場合(pat14およびpat1
5)には、性能は62.43%と推定された。これは2.80%の
低下に相当する。これは子宮内膜症の過去の病歴を除去
した場合よりわずかに悪いだけであり、変数が独立であ
る(相関がない)という想定に基づくその他の結果と矛
盾しないと考えられる。
結論 利用可能であればニューラルネットワークで骨盤手術
歴を使用するが、この変数を除去した影響は最小限であ
った。ニューラルネットワークは、その他の情報を使用
することによってこの変数の除去を補償することができ
るものと考えられる。
子宮内膜症の過去の病歴の除去は有意である。この変
数は、いかなる感度分析でも常にリストの最上位にあ
る。その除去は、全ての変数が利用可能であるときには
平均を超えて約2.76%の性能低下を引き起こした。平均
性能が65.23%と推定され、50%は偶然に達成すること
ができるものとすると、これは18.12%の有効低下に相
当する。
両変数が除去された場合には、どのような有意な性能
低下も現れず、これはこれら二つの変数の間に相互作用
がないことを示す。変数を除去し、変数選択プロセスを
実行するこのプロセスは、所与の変数の真の値を決定す
る良好な手法であると考えられる。診断に重要だが高度
に相関する変数は二つ存在し、一方のみを除去しても、
ネットワークがもう一方を使用することによってこれを
補償するので、ほとんど影響がないことに留意された
い。それらの値が明らかになるのは、両方を除去したと
きのみである。
例11 骨盤痛および月経困難症の除去の診断性能に対する評価 要件 目的: 1.患者の子宮内膜症を有する危険性を評価する際の「骨
盤痛」変数および「月経困難症」変数の重要性を決定す
ること。
2.その結論を予測する際の任意の所与の変数の重要性を
測定する別々の機構(感度分析とは異なる)を提供する
こと。
タスク: 1.本明細書に記載の変数選択プロセスを適用する。
2.変数選択プロセスについて様々なランダムシード変数
を使用して、タスク(1)を繰り返す。
3.上記のタスク(1)および(2)で識別した「子宮内
膜症関連変数」の両セットについて、コンセンサスネッ
トワークトレーニングプロセスを完了する。
4.子宮内膜症データベースから「月経困難症」変数を除
いて、上記タスク(1)、(2)、および(3)を繰り
返す。
5.子宮内膜症データベースから「骨盤痛」変数および
「月経困難症」変数の両方を除いて、上記タスク
(1)、(2)、および(3)を繰り返す。
使用した方法 例9で開発した変数選択ソフトウェアを基本として使
用して、これらのタスクのそれぞれについての結果を生
成した。
行った各変数選択実行について、変数選択プロセスの
パラメータは以下のように設定した。
区分数:5 コンセンサスネットワーク:10 トレーニング例サイズ:510 パス数:999 変数選択プロセス中のデータベース変数の順序付け
は、感度分析およびカイ二乗分析に基づいている。この
順序付けは、pat08およびpat09で使用したものと同様で
ある。このタスクのためにトレーニングしたネットワー
クは、以下のように識別される(二つのネットは異なる
ランダムシードを有する)。
骨盤痛を除去:pat16、pat17、pat17A 月経困難症を除去:pat18、pat19 両変数を除去:pat20、pat21 四つの変数(EXs.11および12):pat22、pat23、pat23A 変数およびランダムシードの各組合せについて変数選
択プロセスが完了した後で、八つ1組のネットワーク
を、識別された選択した変数を使用してトレーニングし
た。これらのネットワークのそれぞれは、完全な510個
の記録データベースについてトレーニングされる。これ
らのトレーニング実行から、出力のコンセンサスがExce
lのスプレッドシート中で生成され、各ネットワークの
性能を評価することができる。
結果 ネットワークのコンセンサスの通常の性能を、5の区
分でホールドアウト方法を使用して推定した。pat08お
よびpat09の場合のように、全ての変数が利用可能であ
る場合には、分類性能は65.23%と推定された。
骨盤痛の変数が考慮から除去される場合(pat16およ
びpat17)には、性能は61.03%と推定された。これは4.
20%の低下に相当する。
月経困難症の変数が考慮から除去される場合(pat18
およびpat19)には、性能は63.44%と推定された。これ
は1.79%のみの低下に相当する。
両変数が考慮から除去される場合(pat20およびpat2
1)には、性能は61.22%と推定された。これは4.00%の
低下に相当する。これは骨盤痛のみを除去した場合より
良好である。これは骨盤痛についての性能低下が誇張さ
れることを意味する。骨盤痛を含まずに最もよく実施さ
れるネットワークは、62.29%の性能を有し、これは2.9
4%の低下を与える。両方とも除去したときに性能が与
えられる場合には、これはより妥当な推定となる。
結論 四つの変数をテストして、重要性の順序で変数を順位
付けすると以下の通りとなる。
骨盤痛 2.94から4.20%の低下 endoの過去の病歴 2.76%の低下 月経困難症 1.79%の低下 過去の骨盤手術歴 0.72%の低下 変数を除去し、変数選択プロセスを実行するこのプロ
セスは、所与の変数の値を決定する良好な手法である。
診断に重要だが高度に相関する変数は二つ存在し、一方
のみを除去しても、ネットワークがもう一方を使用する
ことによってこれを補償するので、ほとんど影響がない
ことに留意されたい。それらの真の値が明らかになるの
は、両方を除去したときのみである。
例12 軽度および重度の子宮内膜症を区別するようにニューラ
ルネットワークをトレーニングする 目的: 1.最小限/軽度の子宮内膜症と中程度/重度の子宮内膜
症とを区別するネットワークのコンセンサスをトレーニ
ングすること。
タスク: 1.ネットワークを以下のようにAFS scoreにトレーニン
グする。
正=Endo Stage IIIまたはIV 負=Endoなし、Endo Stage IまたはII 2.子宮内膜症データベースのニューラルネットワークを
使用する医療および生化学テストを開発する方法に記載
の変数選択プロセスを適用する。
3.変数選択プロセスに対して様々なランダムシード変数
を使用して、タスク(2)を繰り返す。
4.進行する前に上記(2)および(3)で選択した変数
を比較する。選択した変数のセットが大幅に異なる場合
には、様々なランダムシード重みを使用してタスク
(2)を繰り返す。
5.上記(2)および(3)で選択した変数について最後
のコンセンサスネットワークをトレーニングする。
6.Endoが患者に存在した子宮内膜症データベースのサブ
セットのみを使用して、ステップ(2)から(5)を繰
り返す。
使用した方法 例10で開発し、例11で修正した変数選択ソフトウェア
を基本として使用して、この例のタスクのそれぞれにつ
いての結果を生成した。
行った各変数選択実行について、変数選択プロセスの
パラメータは以下のように設定した。
区分数:5 コンセンサスネットワーク:20 トレーニング例サイズ:510(ステップ(6)では29
0) パス数:999 変数選択プロセス中のデータベース変数の順序付け
は、例1で説明した新しいターゲット出力について特に
実行される感度分析およびカイ二乗分析に基づいてい
る。この例のためにトレーニングしたネットワークは、
以下のように識別される(二つのネットは異なるランダ
ムシードを有する)。
全データベースについてトレーニングしたネット:AFS
01およびAFS02 Endo存在サブセットについてトレーニングしたネッ
ト:AFSEP1およびAFSEP2 変数およびランダムシードの各組合せについて変数選
択プロセスが完了した後で、八つ1組のネットワーク
を、識別された選択した変数を使用してトレーニングし
た。これらのAFS01およびAFS02変数についてのネットワ
ークのそれぞれは、完全な510個の記録データベースに
ついてトレーニングされる。AFSEP1およびAFSEP2変数に
ついてのネットワークのそれぞれは、endo存在変数が正
である291個の記録についてトレーニングされる。これ
らのトレーニング実行から、出力のコンセンサスがExce
lのスプレッドシート中で生成され、各ネットワークの
性能を評価することができる。
結果 減少したサブセット実行中で発見された変数のカウン
トは、全トレーニング例についての実行の場合より少な
い。ネットワークのコンセンサスの通常の性能は、5の
区分のホールドアウト方法を使用して推定された。全ト
レーニング例を使用するAFS実行についての通常の分類
性能は77.22549%であった。endo存在サブセットについ
ての通常の分類性能は63.008621%であった。全ての例
が負として分類される場合には、全トレーニング例につ
いての性能は78.82%、サブセットについては65.29%に
なるはずである。正および負の分類のためのカットオフ
値を変更することにより、これらの数字によって提示さ
れるより良好な性能を達成することができる。
結論 全トレーニング例およびendo存在例のサブセットにつ
いての変数選択実行の結果は、重要な変数の決定ではト
レーニング例のサイズが重要であることを示す。トレー
ニング例のサイズが大きくなるにつれて、より多くの変
数が重要と考えられることになることは明らかである。
この結果は、トレーニングデータが多くなれば、変数選
択プロセス、および診断テストの構築に使用するコンセ
ンサスネットワークの全体的な性能が改善されることを
示すものと解釈することもできる。
例13 変数選択、妊娠に関係する事象を予測するニューラルネ
ットの開発、および胎児フィブロネクチンのテストの性
能の改善 データは、米国特許第5468619号に記載のアッセイの
臨床試験に含まれる700人を超える被験患者から収集し
た。変数選択は、胎児フィブロネクチン(fFN)テスト
データなしで実施した。EGA1からEGA4で示される最後の
ネットワークは、以下の表に示す変数でトレーニングさ
れる。
EGA1からEGA4は、変数選択に使用されるニューラルネ
ットワークを表す。EGA1では、変数選択プロトコルは、
入力層に八つの入力、隠れた層に三つの処理要素、およ
び出力層に一つの出力を有するネットワークアーキテク
チャで実施される。EGA2は、入力層の入力が九つである
ことを除けばEGA1と同様である。EGA3は、入力層に七つ
の入力、隠れた層に三つの処理要素、および出力層に一
つの出力を有する。EGA4は、EGA1の入力層の入力が八つ
であることを除けば、EGA1と同様である。
選択した変数は以下の通りである。
最終的なコンセンサスネットワークの性能 EGA=推定在胎齢(34週未満);TP=真の正;TN=真の負;
FP=偽の正;FN=偽の負;SN=感度;SP=特異性;PPV=正
の予測値;NPV=負の予測値;OR=オッズ比(正しい総数
/正しい回答の総数);fFN=fFNについてのELISAアッセ
イからの結果 この結果は、七つの患者変数およびfFN ELISAアッセ
イを含み、34週未満での分娩を予測するニューラルネッ
トであるネットワークEGA4が、fFN ELISAアッセイより
はるかに少ない偽の正を有することを示す。さらに、偽
の正の数は50%低下した。fFNテストをニューラルネッ
トに組み込むことで、fFN ELISAアッセイの性能が向上
した。全てのニューラルネットは、単独のfFNテストよ
り良好に実施された。したがって、本明細書の方法は、
妊娠に関係する事象を予測するために使用することがで
きるニューラルネットおよびその他の意思決定支援シス
テムを開発するために使用することができる。
例14 pat07変数の特定のサブセットについてコンセンサスニ
ューラルネットワークをトレーニングする この例は、pat07変数のpat07性能への寄与を測量し、
最小数のpat07変数を使用して子宮内膜症ネットワーク
を開発するように設計されたタスクの結果を示す。
タスク: 1.以下のpat07変数の組合せを使用して最後のコンセン
サスネットワークをトレーニングする。
a.全14個からEndo歴を引く(総数13個の変数) b.全14個から骨盤痛を引く(総数13個の変数) c.全14個から月経困難症を引く(総数13個の変数) d.全14個から骨盤手術を引く(総数13個の変数) 2.pat07変数のその他の組合せを使用して最後のコンセ
ンサスネットワークをトレーニングする。
a.Endo歴、骨盤痛、および月経困難症 b.Endo歴の骨盤痛、月経困難症、および骨盤手術歴 3.上記結果から示されるpat07変数のその他の組合せを
使用して最後のコンセンサスネットワークをトレーニン
グする。
使用した方法 元の患者データベースを使用して、評価すべき変数の
各組合せについてトレーニング例が生成された。これら
のトレーニング例は、所与のコンセンサス実行に必要な
変数のみを含む。TrainDosTMをバッチモードで使用し
て、評価すべき変数の各組合せについて八つのニューラ
ルネットワークのセットをトレーニングした。ネットワ
ークは、pat07トレーニング実行と同様のパラメータを
使用してトレーニングした。唯一の相違は、各ネットワ
ークについての乱数シードの設定である。各ネットワー
クは、全510個の記録データベースについてトレーニン
グされた。これらのトレーニング実行から、出力のコン
センサスがExcelのスプレッドシート中で生成され、各
ネットワークの性能を評価することができる。
結果 これらの実行は最後のトレーニング実行であるので、
変数を除去した影響は見られるが、ホールドアウト方法
によって達成することができるほど明白な指示は与えな
い。
結論 所与の変数のセットの寄与を決定することを目的とす
る全トレーニング例についての変数選択実行の結果は、
変数選択プロセスで使用した評価方法ほど良好な方法で
はない。5の区分、および20個のネットコンセンサスで
の評価用の「ホールドアウト」方法は、変数を比較する
ための大幅に良好な統計値を与える。
例15 ニューラルネットワーク(pat07)を介した分析に適し
た複数のパラメータを使用する、子宮内膜症の診断を補
助する方法および装置 第7図は、複数のニューラルネットワークのコンセン
サスネットワーク(第10図)で使用される形態の臨床デ
ータについてトレーニングされた一タイプのニューラル
ネットワーク10の一実施形態を示す概略図である。この
構造は、デジタルコンピュータで処理される重み値およ
びデータとともにデジタル形式で記憶される。この第一
タイプニューラルネットワーク10は、三つの層、すなわ
ち入力層12、隠れた層14、および出力層16を含む。入力
層12は、平均および標準偏差値を生成して、入力層に入
力される臨床ファクタに重み付けする正規化装置(図示
せず)をそれぞれ備える14個の入力プリプロセッサ17〜
30を有する。平均および標準偏差値は、ネットワークト
レーニングデータに固有である。入力層のプリプロセッ
サ17〜30はそれぞれ、経路51〜64、および65〜78を介し
て、隠れた層14の第一および第二処理要素48、50に結合
され、隠れた層の処理要素48、50がそれぞれ、各入力プ
リプロセッサ17〜30から値または信号を受けるようにな
っている。各経路は、トレーニングデータについてのト
レーニングの結果に基づく固有の重みを備える。固有の
重み80〜93および95〜108は出力と非線形に関係し、各
ネットワーク構造およびトレーニングデータの初期値に
ついて固有である。重みの最終値は、ネットワークトレ
ーニングに割り当てられた初期化値に基づく。トレーニ
ングの結果生じる重みの組合せは、重みで表現されるそ
の記述が所望の解決策を生成する機能的装置、またはよ
り詳細には子宮内膜症の診断の暫定的指標を含む。
本明細書で提供する子宮内膜症テストでは、ニューラ
ルネットワークをトレーニングするために使用される、
出力がそれに基づくファクタは、疾病の過去の病歴、出
産回数、月経困難症、年齢、骨盤痛、骨盤手術歴、一日
あたりの喫煙量、薬物治療歴、妊娠回数、流産回数、異
常PAP/形成異常症、妊娠高血圧症、生殖器いぼ、糖尿病
である。これら14個のファクタは、40を超える臨床ファ
クタの元のセットの中で、最も影響力のある(最大感度
の)セットであると決定されている。(影響力のあるフ
ァクタのその他のセットも導かれている。上記の各例を
参照)。
隠れた層は、経路164および179を介して処理要素48お
よび50に提供されるバイアス重み94、119によってバイ
アスされる。出力層16は、二つの出力処理要素120、122
を含む。出力層16は、隠れた層の処理要素48、50の両方
から、経路123、124、および125、126を介して入力を受
ける。出力層の処理要素120、122は、重み110、112、お
よび114、116によって重み付けされる。出力層16は、経
路129および131を介して処理要素120および122に提供さ
れるバイアス重み128、130によってバイアスされる。
子宮内膜症の有無または重さの暫定的指標は、二つの
処理要素120、122からの値AおよびBの出力対である。
これらの値は常に0から1の間の正である。一方の指標
は、子宮内膜症が存在することを示す。もう一方の指標
は、子宮内膜症が存在しないことを示す。出力対A、B
は一般に有効な疾病の指標を与えるが、トレーニングし
たニューラルネットワークのコンセンサスネットワーク
はより信頼性の高いインデックスを提供する。
第10図を参照すると、最後の指標対C、Dは、複数、
詳細には八つの、トレーニングされたニューラルネット
ワーク10Aから10H(第10図)からの暫定的指標対のコン
センサスの分析に基づいている。各暫定的指標対A、B
は、経路133〜140および141〜148を介して二つのコンセ
ンサスプロセッサ150、152の一方に供給される。第一コ
ンセンサスプロセッサ150は全ての正の指標を処理す
る。第二コンセンサスプロセッサ152は全ての負の指標
を処理する。各コンセンサスプロセッサ150、152は平均
化装置である、すなわち同様の暫定的指標対A、Bの集
合の、平均などの一次結合を単に形成する。その結果の
信頼性指標対は所望の結果であり、入力は被験患者につ
いての臨床ファクタのセットである。
第9図は、代表的なプロセッサ要素120を示す。同様
のプロセッサ48および50は、さらに多くの入力要素を有
し、プロセッサ要素122はほぼ同一である。代表的なプ
ロセッサ要素120は、各入力経路(ここでは全体として
要素ごとに15、16、または3の番号を付け、プロセッサ
要素120の一部分として示す)上に複数の重み乗算器11
0、114、128を含む。重み乗算器からの重み付けされた
値は、加算器156に結合される。加算器156の出力は、S
字型伝達関数やアークタンジェント伝達関数などの活性
化関数158に結合される。プロセッサ要素は、専用ハー
ドウェアとして、またはソフトウェア機能中で実施する
ことができる。
感度分析を実施して、臨床ファクタの相対的な重要性
を決定することができる。感度分析は、デジタルコンピ
ュータ上で以下のように実施される。トレーニングした
ニューラルネットワークを、各トレーニング例(真の出
力が知られている、または推測される入力データ群)に
ついて順方向モード(トレーニングなし)で実行する。
次いで各トレーニング例についてのネットワークの出力
を記録する。その後、各入力変数を全トレーニング例に
わたる入力変数の平均値で置き換えて、ネットワークを
再実行する。次いで各出力の値の差を二乗して合計(累
積)し、個別の合計を得る。
この感度分析プロセスは、各トレーニング例について
実施する。次いで全ての変数が単一の結果出力に等しく
寄与する場合に正規化が1.0となるように、各結果合計
を従来のプロセスに従って正規化する。この情報から、
正規化値を重要性の順序で順位付けすることができる。
臨床データの分析では、このニューラルネットワーク
システムについてのファクタの感度の順序は、疾病の過
去の病歴、出産回数、月経困難症、年齢、骨盤痛、骨盤
手術歴、一日あたりの喫煙量、薬物治療歴、妊娠回数、
流産回数、異常PAP/形成異常症、妊娠高血圧症、生殖器
いぼ、糖尿病であると決定された。
特定のニューラルネットワークシステムがトレーニン
グされ、有効な診断ツールであることが分かった。第7
図および第10図に示すニューラルネットワークシステム
は以下のように記述される。
0.バイアス 1.年齢 2.糖尿病 3.妊娠高血圧症 4.一日あたりの喫煙量 5.妊娠回数 6.出産回数 7.流産回数 8.生殖器いぼ 9.異常PAP/形成異常症 10.子宮内膜症の病歴 11.骨盤手術歴 12.薬物治療歴 13.骨盤痛 14.月経困難症 という、感度の順序ではなく識別の順序になっている重
みは、八つの第一タイプのニューラルネットワーク10そ
れぞれについて以下のようになっている。
第一タイプのニューラルネットワークについての正規化
した観測値 さらに、本明細書で提供するように、ELISA形式テス
トによるテストなどの生化学テストの結果を使用して、
トレーニングした増加されたニューラルネットワークシ
ステムを生成し、感度および特異性の比較的高い信頼性
レベルを生み出すことができる。こうした第二タイプの
ニューラルネットワークを第8図に示す。入力層12のノ
ード31と、一対の重み109および111が追加されているこ
とを除けば、番号は第7図と同様である。ただし、ネッ
トワーク中の全ての重みは、追加の生化学結果でトレー
ニングすると変化する。正確な重みセットは、特定の生
化学テストトレーニング例に依存する。
本明細書で提供されるトレーニングシステムを使用す
ることができる。代替のトレーニング技術を使用するこ
ともできる(例えば、Baxtによる「Use of an Artifici
al Neural Network for the Diagnosis of Myocardial
Infarction」、Annals of Internal Medicine 115,p.84
3(1991年12月1日);「Improving the Accuracy of a
n Artificial Neural Network Using Multiple Differe
ntly Trained Networks」、Neural Computation 4,p.77
2(1992年)を参照のこと)。
テスト結果を評価する際には、高scoreは疾病が存在
することに相関し、低scoreは疾病が存在しないことに
相関し、極端なscoreは信頼性を高めるが、中程度のsco
reは信頼性を低下させることに留意した。子宮内膜症が
存在することは、0.6以上の出力によって示され、それ
が存在しないことは0.4以下によって示される。高い相
対scoreが、疾病の高い相対重さと相関することにも留
意した。本明細書の方法は、疾病状態の有無または重さ
を確立するためにそれ以上の手順、しばしば手術を必要
とする患者数を最小限に抑える。
当業者には修正形態が明らかであるので、本発明は添
付の特許請求の範囲によってのみ制限されるものとす
る。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G06N 5/04 550 G06N 5/04 550N 580 580A (72)発明者 デジーノ,デユアン・デイ アメリカ合衆国、カリフオルニア・ 92037、ラ・ジヨラ、オリート・コー ト・2015 (56)参考文献 特開 平7−155295(JP,A) 特開 平2−61769(JP,A) 特開 平7−253343(JP,A) 特開 平8−212181(JP,A) 特開 平8−249007(JP,A) 特開 平2−294768(JP,A) 特開 平5−324811(JP,A) 特開 平4−175964(JP,A) 特開 平6−119291(JP,A) 長田典子・他,「ニューロ応用の真珠 品質評価装置」,三菱電機技報,日本, 三菱電機エンジニアリング株式会社, 1994年 8月25日,Vol.68,No. 8,pp.24−29 田中豊・他,「パソコン統計解析ハン ドブックII 多変量解析編」,日本, 共立出版株式会社,1984年 9月 5 日,初版,pp.16−23 武長寛・他,「感度解析を用いたニュ ーラルネットの入力層の最適化とその数 字認識への適用」,電気学会論文誌D, 日本,社団法人電気学会,1991年 1月 20日,Vol.111,No.1,pp. 36−44 長田典子・他,「感性計測技術に基づ く真珠品質評価システムの開発」,電気 学会論文誌C,日本,社団法人電気学 会,1992年 2月20日,Vol.112, No.2,pp.111−116 (58)調査した分野(Int.Cl.7,DB名) G06N 1/00 - 7/08 G06F 17/60 G06F 19/00 G06F 17/17 A61B 5/00 A61B 10/00 G01N 33/48 JSTファイル(JOIS) CSDB(日本国特許庁) WPI/L(DIALOG) INSPEC(DIALOG)

Claims (48)

    (57)【特許請求の範囲】
  1. 【請求項1】(a)第一の組のn個の候補変数および最
    初は空である第二の組の選択された重要な変数を与える
    ステップと、 (b)候補変数を一度に一つずつ取り、選択された重要
    な変数の現在の組に結合された変数に基づいて意思決定
    支援システムをトレーニングすることによって各変数を
    評価するステップと、 (c)候補変数のうち、意思決定支援システムの最も高
    い性能を与える変数である最もよい変数を選択し、最も
    よい候補変数が選択された重要な変数の性能と比較して
    性能を改善する場合、それを選択された重要な変数の組
    に追加し、それを候補の組から除去し、ステップ(b)
    での評価を継続するステップを含んでおり、 結果が特定の帰結をより正確に予測ないし判定している
    場合に、システムの性能が改善されたといい、 最もよい候補変数が性能を改善しない場合、プロセスを
    終了するとともに上記ステップをコンピュータ・プロセ
    ッサによって実行し、メモリ内に記号化する変数選択の
    ための方法。
  2. 【請求項2】ステップ(a)において、候補変数が患者
    から得られ、かつ病歴データおよび/または生化学デー
    タを含む請求の範囲第1項に記載の方法。
  3. 【請求項3】請求の範囲第1項に記載の方法に従って一
    組の重要な選択された変数を選択するステップと、 診断用のテストを生成するために重要な選択された変数
    の選択された最後の組を使用して、意思決定支援システ
    ムをトレーニングするステップとを含む診断を援助する
    テストを生成する方法。
  4. 【請求項4】診断を援助するテストを生成する方法が、
    医学的状態または障害が存在する可能性を評価し、特定
    の状態が将来現れるか、または生じる可能性を評価し、
    または1クールの治療法を選択するか、または治療の有
    効性を決定する請求の範囲第3項に記載の方法。
  5. 【請求項5】状態が妊娠関連状態または子宮内膜症であ
    る請求の範囲第4項に記載の方法。
  6. 【請求項6】診断を援助するテストを生成する方法が、
    医学的状態の存在、不在または重さを評価するか、また
    は治療単位の生じる可能性のある結果を決定する請求の
    範囲第3項に記載の方法。
  7. 【請求項7】請求の範囲第1項に記載の方法に従って一
    組の重要な選択された変数を選択するステップと、 生化学テストのみよりも有効なテストを生成するために
    重要な選択された変数および生化学テストデータの選択
    された最後の組を使用して、意思決定支援システムをト
    レーニングするステップとを含む診断生化学テストの有
    効性を改善する方法。
  8. 【請求項8】(a)請求の範囲第1項に記載の方法に従
    って一組の重要な選択された変数を選択するステップ
    と、 (b)一組の生化学テストデータを識別し、生化学テス
    トデータの組の各要素に結合された重要な選択された変
    数の選択された最後の組を使用して、意思決定支援シス
    テムをトレーニングし、得られたシステムの性能を評価
    するステップと、 (c)生化学テストデータの組の各要素に関してすべて
    の要素がトレーニング中に使用されるまでトレーニング
    および評価を繰り返すステップと、 (d)最も性能がよいシステムをもたらす生化学データ
    の組の要素を選択するステップとを含む障害または状態
    の診断を助ける生化学テストを識別する方法。
  9. 【請求項9】(a)第一の組のn個の候補変数および最
    初は空である第二の組の選択された重要な変数を与える
    ステップと (b)すべての候補変数を任意に、または順序立って順
    序付けするステップと、 (c)最も大きいm個の順位付けされた変数を一度に一
    つずつとり、ただしmは1からnまでであり、選択され
    た重要な変数の現在の組と結合された変数に基づいて意
    思決定支援システムをトレーニングすることによって各
    変数を評価するステップと、 (d)m個の変数のうち、意思決定支援システムの最も
    高い性能を与える変数である最もよい変数を選択し、最
    もよい変数が選択された重要な変数の性能と比較して性
    能を改善する場合、それを選択された重要な変数の組に
    追加し、それを候補の組から除去し、ステップ(c)で
    の処理を継続し、変数が選択された重要な変数の性能と
    比較して性能を改善しない場合、ステップ(e)での評
    価を継続するステップと、 (e)候補組のすべての変数が評価されているかどうか
    を決定し、それらが評価されている場合、プロセスが終
    了し、選択された重要な変数の組が完成した組になり、
    それ以外の場合、引き続き次に最も大きいm個の順位付
    けされた変数を一度に一つずつとり、重要な選択された
    変数の現在の組と結合された変数に基づいて意思決定支
    援システムをトレーニングし、ステップ(d)を実施す
    ることによって各変数を評価し、上記ステップをコンピ
    ュータ・プロセッサによって実行し、メモリ内に記号化
    するステップとを含む変数選択のための方法。
  10. 【請求項10】候補変数が生化学テストデータを含む請
    求の範囲第3項または第9項に記載の方法。
  11. 【請求項11】順位付けが、感度分析または他の意思決
    定支援システムベースの分析を含む分析に基づく請求の
    範囲第9項に記載の方法。
  12. 【請求項12】順位付けが、統計分析を含むプロセスに
    基づく請求の範囲第9項に記載の方法。
  13. 【請求項13】順位付けが、カイ二乗、回帰分析または
    判別分析を含むプロセスに基づく請求の範囲第9項に記
    載の方法。
  14. 【請求項14】順位付けが、エキスパート、ルールベー
    スのシステム、感度分析またはその組合せによる評価を
    使用するプロセスによって決定される請求の範囲第9項
    に記載の方法。
  15. 【請求項15】感度分析が、 (i)観測データセット中の各変数ごとに平均観測値を
    決定するステップと、 (ii)トレーニング例を選択し、意思決定支援システム
    を介して例を実行して、通常の出力として指定され、記
    憶される出力値を発生するステップと、 (iii)選択されたトレーニング例中の第一の変数を選
    択し、観測値を第一の変数の平均観測値と交換し、修正
    された例を意思決定支援システム中で順方向モードで実
    行し、出力を修正された出力として記録するステップ
    と、 (iv)通常の出力と修正された出力との差を二乗し、そ
    れを合計として累積するステップであって各変数ごとの
    合計は各変数ごとに選択された変数合計に指定されるス
    テップと、 (v)例中の各変数ごとにステップ(iii)およびステ
    ップ(iv)を繰り返すステップと、 (vi)データセット中の各例ごとにステップ(ii)〜
    (v)を繰り返すステップであって選択された変数の各
    合計は、意思決定支援システム出力の決定に対する各変
    数の相対的寄与を表すステップとを含む請求の範囲第11
    項または第14項に記載の方法。
  16. 【請求項16】意思決定支援システムがニューラルネッ
    トワークのコンセンサスを含む請求の範囲第1項または
    第9項に記載の方法。
  17. 【請求項17】n個の候補変数の組および選択された重
    要な変数の組がそれぞれコンピュータ中に記憶されるコ
    ンピュータ支援方法である請求の範囲第1項または第9
    項に記載の方法。
  18. 【請求項18】状態用の意思決定支援システムベースの
    テストをつくり出すために選択された重要な変数の完成
    した組に基づく最後の意思決定支援システムをトレーニ
    ングするステップをさらに含む請求の範囲第3項に記載
    の方法。
  19. 【請求項19】状態が婦人科学状態である請求の範囲第
    3項に記載の方法。
  20. 【請求項20】状態が、不妊症、妊娠関連事象、および
    子癇前症の中から選択される請求の範囲第19項に記載の
    方法。
  21. 【請求項21】(a)その人の医学的状態が既知である
    テスト患者のグループから観測結果を収集するステップ
    と、 (b)観測結果を、観測値を有する一組の候補変数に分
    類し、観測値を観測データセットとしてコンピュータ中
    に記憶するステップと、 (c)請求の範囲第1項または第9項に記載の方法を用
    いて、コンピュータシステム中にプログラムされた第一
    の意思決定支援システムを使用して、選択された重要な
    変数のサブセットが実質上医学的状態を示す候補変数を
    含むように観測データセットを分類することによって候
    補変数の組から選択された重要な変数のサブセットを選
    択するステップと、 (d)選択された重要な変数のサブセットに対応する観
    測データを使用して、第二の意思決定支援システムベー
    スのシステムが状態、疾病または障害用の意思決定支援
    ベースの診断テストを構成するように第二の意思決定支
    援システムをトレーニングするステップとを含む、コン
    ピュータシステムにおいて患者の医学的状態、疾病また
    は障害を診断するのを助ける意思決定支援システムベー
    スのテストを開発する方法。
  22. 【請求項22】テスト患者のグループから観測結果を収
    集した後、および第二の意思決定支援ベースのシステム
    をトレーニングする前に、 その人の状態が既知であるか、または推測されるテスト
    患者の少なくとも一部から生化学テストのテスト結果を
    収集し、それらを一組の候補変数に分類し、次いでこれ
    らを第一の組の候補変数に追加するステップと、次いで ステップ(c)および(d)を繰り返すステップとをさ
    らに含む請求の範囲第21項に記載の方法。
  23. 【請求項23】選択された重要な変数の最後のサブセッ
    トで終わる一つ又は複数の生化学テストデータ変数を識
    別し、それにより識別された一つ又は複数の生化学テス
    トデータ変数が疾病、障害または状態のインジケータと
    して役立つステップをさらに含む請求の範囲第22項に記
    載の方法。
  24. 【請求項24】テストが、疾病、障害、または他の医学
    的状態の存在、不在または重さまたは治療単位を評価す
    る請求の範囲第21項から第23項のいずれか一項に記載の
    方法。
  25. 【請求項25】テストが選択された治療から得られた結
    果を決定するのを助ける請求の範囲第21項から第23項の
    いずれか一項に記載の方法。
  26. 【請求項26】意思決定支援システムがニューラルネッ
    トワークを含み、かつ最後の組がニューラルネットワー
    クのコンセンサスを構成する請求の範囲第21項から第23
    項のいずれか一項に記載の方法。
  27. 【請求項27】選択した重要な変数の第一のサブセット
    が、意思決定支援ベースのシステムまたはそのコンセン
    サス上で実施される感度分析を使用して識別される請求
    の範囲第21項から第23項のいずれか一項に記載の方法。
  28. 【請求項28】第一の意思決定支援システムが少なくと
    も一つのニューラルネットワークを含む請求の範囲第21
    項から第23項のいずれか一項に記載の方法。
  29. 【請求項29】第二の意思決定支援システムが少なくと
    も一つのニューラルネットワークを含む請求の範囲第21
    項から第23項のいずれか一項に記載の方法。
  30. 【請求項30】一つまたは複数の識別した生化学テスト
    データ変数についての診断生化学テストを開発するステ
    ップをさらに含む、請求の範囲第23項に記載の方法。
  31. 【請求項31】追加の観測結果を患者から収集し、それ
    らを、その後で第一セットの候補変数に追加する候補変
    数のセットに分類するステップと、 (f)ステップ(c)および(d)を繰り返すステップ
    とをさらに含む、請求の範囲第21項から第23項のいずれ
    か一項に記載の方法。
  32. 【請求項32】請求の範囲第23項の方法を実行するステ
    ップと、 選択された重要な変数である生化学データ変数を識別す
    るステップと、 そこから変数が得られる生化学データまたは疾病マーカ
    を検出するテストを開発するステップとを含む、新しい
    生化学テストを開発する、または新しい疾病マーカを識
    別する方法。
  33. 【請求項33】候補変数が生化学テストデータを含む、
    請求の範囲第21項または第22項に記載の方法。
  34. 【請求項34】順位付けが、感度分析またはその他の意
    思決定支援システムベースの分析を含む分析に基づいて
    いる、請求の範囲第21項に記載の方法。
  35. 【請求項35】順位付けが、統計分析を含むプロセスに
    基づいている、請求の範囲第21項に記載の方法。
  36. 【請求項36】順位付けが、カイ二乗、回帰分析、また
    は判別分析を含むプロセスに基づいている、請求の範囲
    第21項に記載の方法。
  37. 【請求項37】順位付けが、エキスパート、ルールベー
    スのシステム、感度分析またはその組合せによる評価を
    使用するプロセスによって決定される、請求の範囲第21
    項に記載の方法。
  38. 【請求項38】感度分析が、 (i)観測データセット中の各変数について平均観測値
    を決定するステップと、 (ii)トレーニング例を選択し、意思決定支援システム
    を介してこの例を実行して、通常の出力として指定さ
    れ、記憶される出力値を生成するステップと、 (iii)選択したトレーニング例中の第一変数を選択
    し、観測値を第一変数の平均観測値で置換し、修正した
    例を意思決定支援システム中で順方向モードで実行し、
    その出力を修正された出力として記録するステップと、 (iv)通常の出力と修正した出力の差を二乗し、これを
    合計として累積するステップであって各変数ごとの合計
    は各変数ごとに選択された変数合計に指定されるステッ
    プと、 (v)例中の各変数についてステップ(iii)および(i
    v)を繰り返すステップと、 (vi)データセット中の各例についてステップ(ii)〜
    (v)を繰り返すステップであって選択された変数の各
    合計は、意思決定支援システム出力の決定に対する各変
    数の相対的寄与を表すステップとを含む、請求の範囲第
    34項または第37項に記載の方法。
  39. 【請求項39】(vii)それらの意思決定支援システム
    出力の決定に対する相対的寄与に従って変数を順位付け
    するステップをさらに含む、請求の範囲第38項に記載の
    方法。
  40. 【請求項40】第二意思決定支援システムをトレーニン
    グするステップが、以前に未使用の観測データのセット
    を、トレーニング後に第二意思決定支援システムを介し
    て実行して、医学的状態の指標についての性能推定値を
    提供する妥当性検査ステップを含み、以前に未使用の観
    測データのセットが、その医学的状態が知られている患
    者から収集される、請求の範囲第21項から第23項のいず
    れか一に記載の方法。
  41. 【請求項41】第二意思決定支援システムをトレーニン
    グするステップが、観測データセットを、少なくとも一
    つのテスト用データ区分および複数のトレーニング用デ
    ータ区分を含む複数の区分に分割するステップを含み、
    第二意思決定支援システムが複数のトレーニング用デー
    タ区分を使用して実行され、テスト用データ区分が、ト
    レーニング用データ区分が実行された後で第二意思決定
    支援システムについての最終的な性能推定値を提供する
    ために使用される、請求の範囲第21項から第23項のいず
    れか一に記載の方法。
  42. 【請求項42】第二意思決定支援システムが、固有の開
    始重みのセットおよび性能レーティング値をそれぞれ有
    する複数のニューラルネットワークを含む、請求の範囲
    第41項に記載の方法。
  43. 【請求項43】最終的な性能推定値が、複数のニューラ
    ルネットワークについての性能レーティング値を平均す
    ることによって生成される、請求の範囲第42項に記載の
    方法。
  44. 【請求項44】患者病歴データの結果および/または生
    化学テスト結果から観測値が得られる、請求の範囲第21
    項から第23項のいずれか一に記載の方法。
  45. 【請求項45】状態が、妊娠に関係する状態または子宮
    内膜症である、請求の範囲第21項から第23項のいずれか
    一に記載の方法。
  46. 【請求項46】障害が子宮内膜症であり、候補変数が、 (i)過去の子宮内膜症歴、出産回数、月経困難症、年
    齢、骨盤痛、骨盤手術歴、一日あたりの喫煙量、薬物治
    療歴、妊娠回数、出産回数、異常PAP/形成異常症、妊娠
    高血圧症、生殖器いぼ、および糖尿病、または (ii)年齢、経産回数、妊娠回数、出産回数、一日あた
    りの喫煙量、過去の子宮内膜症歴、月経困難症、骨盤
    痛、異常PAP、骨盤手術歴、薬物治療歴、妊娠高血圧
    症、生殖器いぼ、および糖尿病から選択した少なくとも
    四つの変数を含む、請求の範囲第21項に記載の方法。
  47. 【請求項47】意思決定支援システムがニューラルネッ
    トワークまたはニューラルネットワークのコンセンサス
    を含む、請求の範囲第46項に記載の方法。
  48. 【請求項48】少なくとも五つの変数が選択される、請
    求の範囲第46項に記載の方法。
JP52872997A 1996-02-09 1997-02-07 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法 Expired - Fee Related JP3480940B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US1144996P 1996-02-09 1996-02-09
US59927596A 1996-02-09 1996-02-09
US08/599,275 1996-02-09
US60/011,449 1996-02-09
PCT/US1997/002104 WO1997029447A2 (en) 1996-02-09 1997-02-07 Method for selecting medical and biochemical diagnostic tests using neural network-related applications

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003141050A Division JP3782792B2 (ja) 1996-02-09 2003-05-19 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法

Publications (2)

Publication Number Publication Date
JP2000501869A JP2000501869A (ja) 2000-02-15
JP3480940B2 true JP3480940B2 (ja) 2003-12-22

Family

ID=26682401

Family Applications (6)

Application Number Title Priority Date Filing Date
JP52872997A Expired - Fee Related JP3480940B2 (ja) 1996-02-09 1997-02-07 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2003141050A Expired - Lifetime JP3782792B2 (ja) 1996-02-09 2003-05-19 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2005134396A Expired - Fee Related JP4139822B2 (ja) 1996-02-09 2005-05-02 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2005357564A Expired - Fee Related JP4168187B2 (ja) 1996-02-09 2005-12-12 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2007235531A Pending JP2008065836A (ja) 1996-02-09 2007-09-11 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2008000723A Pending JP2008136874A (ja) 1996-02-09 2008-01-07 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法

Family Applications After (5)

Application Number Title Priority Date Filing Date
JP2003141050A Expired - Lifetime JP3782792B2 (ja) 1996-02-09 2003-05-19 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2005134396A Expired - Fee Related JP4139822B2 (ja) 1996-02-09 2005-05-02 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2005357564A Expired - Fee Related JP4168187B2 (ja) 1996-02-09 2005-12-12 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2007235531A Pending JP2008065836A (ja) 1996-02-09 2007-09-11 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP2008000723A Pending JP2008136874A (ja) 1996-02-09 2008-01-07 ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法

Country Status (5)

Country Link
EP (1) EP0879449A2 (ja)
JP (6) JP3480940B2 (ja)
AU (1) AU2316297A (ja)
CA (1) CA2244913A1 (ja)
WO (1) WO1997029447A2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6678669B2 (en) 1996-02-09 2004-01-13 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
US6622036B1 (en) * 2000-02-09 2003-09-16 Cns Response Method for classifying and treating physiologic brain imbalances using quantitative EEG
US6601034B1 (en) 1998-03-05 2003-07-29 American Management Systems, Inc. Decision management system which is cross-function, cross-industry and cross-platform
US8364578B1 (en) 1998-03-05 2013-01-29 Cgi Technologies And Solutions Inc. Simultaneous customer/account strategy execution in a decision management system
US6546545B1 (en) 1998-03-05 2003-04-08 American Management Systems, Inc. Versioning in a rules based decision management system
US6609120B1 (en) 1998-03-05 2003-08-19 American Management Systems, Inc. Decision management system which automatically searches for strategy components in a strategy
CA2326579C (en) * 1998-04-03 2011-01-18 Triangle Pharmaceuticals, Inc. Systems, methods and computer program products for guiding the selection of therapeutic treatment regimens
AU4971499A (en) * 1998-07-30 2000-02-21 Arcturus Engineering, Inc. Medical diagnostic and treatment information system and method
US6708155B1 (en) 1999-07-07 2004-03-16 American Management Systems, Inc. Decision management system with automated strategy optimization
JP4726177B2 (ja) * 2000-06-08 2011-07-20 ビルコ・ビーブイビーエイ ニューラルネットワークを使用して治療薬耐性を予測し、そして薬剤耐性の遺伝的基礎を定めるための方法およびシステム
AU6378501A (en) * 2000-06-09 2001-12-17 Medimage Aps A fail-sure computer aided method for anticoagulant treatment
AU2001285476A1 (en) * 2000-09-06 2002-03-22 Cellomics, Inc. Method and system for obtaining knowledge based recommendations
US6920439B1 (en) 2000-10-10 2005-07-19 Hrl Laboratories, Llc Method and apparatus for incorporating decision making into classifiers
US6988088B1 (en) * 2000-10-17 2006-01-17 Recare, Inc. Systems and methods for adaptive medical decision support
US7315784B2 (en) 2001-02-15 2008-01-01 Siemens Aktiengesellschaft Network for evaluating data obtained in a biochip measurement device
US20020155587A1 (en) 2001-04-20 2002-10-24 Sequenom, Inc. System and method for testing a biological sample
US7840421B2 (en) 2002-07-31 2010-11-23 Otto Carl Gerntholtz Infectious disease surveillance system
US20040103001A1 (en) * 2002-11-26 2004-05-27 Mazar Scott Thomas System and method for automatic diagnosis of patient health
US7529394B2 (en) 2003-06-27 2009-05-05 Siemens Medical Solutions Usa, Inc. CAD (computer-aided decision) support for medical imaging using machine learning to adapt CAD process with knowledge collected during routine use of CAD system
JP2007521854A (ja) * 2003-12-02 2007-08-09 シュレイガ ロッテム 母体−胎児状態の診断、スクリーニング、予防、及び治療のための人工知能及び装置
US20090083768A1 (en) * 2007-09-20 2009-03-26 Hatalkar Atul N Context platform framework for aggregation, analysis and use of contextual information
DK2603138T3 (en) * 2010-08-13 2018-02-05 Respiratory Motion Inc DEVICES AND METHODS FOR MONITORING RESPIRATION VARIATION IN MEASURING RESPIRATION VOLUMES, MOVEMENT AND VARIABILITY
WO2016040725A1 (en) 2014-09-11 2016-03-17 Berg Llc Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data
JP6481335B2 (ja) * 2014-11-06 2019-03-13 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム
JP6280997B1 (ja) * 2016-10-31 2018-02-14 株式会社Preferred Networks 疾患の罹患判定装置、疾患の罹患判定方法、疾患の特徴抽出装置及び疾患の特徴抽出方法
JP2019101902A (ja) * 2017-12-06 2019-06-24 株式会社グルーヴノーツ データ処理装置、データ処理方法及びデータ処理プログラム
JP2021519479A (ja) * 2018-03-19 2021-08-10 アンブリー ジェネティクス コーポレーションAmbry Genetics Corporation 遺伝子検査とゲノム検査を識別するための人工知能と機械学習プラットフォーム
KR102043376B1 (ko) 2018-08-16 2019-11-11 한국과학기술연구원 심층 신경망 알고리즘을 이용하는 실시간 스트레스 분석 방법
EP3844722A4 (en) 2018-08-29 2022-06-01 Movidius Ltd. COMPUTER VISION SYSTEM
KR102166441B1 (ko) * 2018-10-02 2020-10-16 재단법인대구경북과학기술원 병변 검출 장치 및 제어 방법
JP7220727B2 (ja) 2019-01-31 2023-02-10 富士フイルム株式会社 学習済みモデル、学習方法、及びプログラム、並びに医用情報取得装置、方法、及びプログラム
WO2020189235A1 (ja) * 2019-03-20 2020-09-24 国立大学法人大阪大学 学習済みモデル、制御装置、摩擦攪拌接合システム、ニューラルネットワークシステム、及び学習済みモデルの生成方法
CN110164549A (zh) * 2019-05-20 2019-08-23 南通奕霖智慧医学科技有限公司 一种基于神经网络分类器的儿科分诊方法及系统
KR102187344B1 (ko) * 2019-09-03 2020-12-04 메디사피엔스 주식회사 결정 트리를 이용한 반려동물 진단 방법 및 장치
US20220383111A1 (en) * 2019-09-27 2022-12-01 D5Ai Llc Selective training of deep learning modules
JPWO2022190891A1 (ja) * 2021-03-11 2022-09-15
KR20230027810A (ko) * 2021-08-20 2023-02-28 가톨릭대학교 산학협력단 예후 예측 장치, 방법 및 기록매체
US20230169168A1 (en) * 2021-11-29 2023-06-01 Microsoft Technology Licensing, Llc. Detect anomalous container deployment at a container orchestration service
CN115116594B (zh) * 2022-06-06 2024-05-31 中国科学院自动化研究所 医疗装置有效性的检测方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3231810B2 (ja) * 1990-08-28 2001-11-26 アーチ・デベロップメント・コーポレーション ニューラル・ネットワークを用いた鑑別診断支援方法
JP3081043B2 (ja) * 1991-12-27 2000-08-28 シスメックス株式会社 脳梗塞の診断方法
JPH05277119A (ja) * 1992-03-31 1993-10-26 Nuclear Fuel Ind Ltd 癌診断装置
CA2161655A1 (en) * 1993-04-30 1994-11-10 James David Keeler Method and apparatus for determining the sensitivity of inputs to a neural network on output parameters
JP3226400B2 (ja) * 1993-12-06 2001-11-05 富士通株式会社 診断装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
武長寛・他,「感度解析を用いたニューラルネットの入力層の最適化とその数字認識への適用」,電気学会論文誌D,日本,社団法人電気学会,1991年 1月20日,Vol.111,No.1,pp.36−44
田中豊・他,「パソコン統計解析ハンドブックII 多変量解析編」,日本,共立出版株式会社,1984年 9月 5日,初版,pp.16−23
長田典子・他,「ニューロ応用の真珠品質評価装置」,三菱電機技報,日本,三菱電機エンジニアリング株式会社,1994年 8月25日,Vol.68,No.8,pp.24−29
長田典子・他,「感性計測技術に基づく真珠品質評価システムの開発」,電気学会論文誌C,日本,社団法人電気学会,1992年 2月20日,Vol.112,No.2,pp.111−116

Also Published As

Publication number Publication date
EP0879449A2 (en) 1998-11-25
JP2008065836A (ja) 2008-03-21
JP3782792B2 (ja) 2006-06-07
JP2005319301A (ja) 2005-11-17
JP4139822B2 (ja) 2008-08-27
JP2006172461A (ja) 2006-06-29
AU2316297A (en) 1997-08-28
JP4168187B2 (ja) 2008-10-22
WO1997029447A2 (en) 1997-08-14
JP2000501869A (ja) 2000-02-15
JP2008136874A (ja) 2008-06-19
WO1997029447A3 (en) 1998-05-07
JP2004041713A (ja) 2004-02-12
CA2244913A1 (en) 1997-08-14

Similar Documents

Publication Publication Date Title
JP3480940B2 (ja) ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
US6556977B1 (en) Methods for selecting, developing and improving diagnostic tests for pregnancy-related conditions
Islam et al. Machine learning to predict pregnancy outcomes: a systematic review, synthesizing framework and future research agenda
Aruna et al. An investigation of neuro-fuzzy systems in psychosomatic disorders
CN113610118B (zh) 一种基于多任务课程式学习的青光眼诊断方法、装置、设备及方法
Chinnasamy et al. Machine learning based cardiovascular disease prediction
Singh Prediction of Thyroid Disease using Deep Learning Techniques
Van Calster et al. An application of methods for the probabilistic three-class classification of pregnancies of unknown location
Kavya et al. Heart Disease Prediction Using Logistic Regression
Zou et al. An intelligent adverse delivery outcomes prediction model based on the fusion of multiple obstetric clinical data
Karthik et al. Algorithm Accuracy Verification in Heart Disease Analysis using Machine Learning
US11869674B2 (en) Translation of medical evidence into computational evidence and applications thereof
Graselin et al. A Systematic Review based on the Detection of PCOS using Machine Learning Techniques
Muller et al. Logistic regression model as classifier for early detection of gestational diabetes mellitus
Wongso et al. Empowering Pregnancy Risk Assessment: A Web-Based Classification Framework with K-Means Clustering Enhanced Models
Gao et al. Systematic review and network meta-analysis of machine learning algorithms in sepsis prediction
Bhat Assistive PCOS Detection Platform with Clinical Data and Ultrasound Scan using Machine Learning.
Flynn et al. Assessing diagnostic technologies
Hidayat et al. Diagnosis of Preeclampsia in Pregnant Women Based on K-Nearest Neighbor Algorithm
Ibarra-Cuevas et al. Determining relevant risk factors for breast cancer
Park et al. Original Research Article Study on prediction and diagnosis AI model of frequent chronic diseases based on health checkup big data
Pascual-Fontanilles et al. Challenges in the Exploitation of Historical Clinical Data for the Classification of Diabetic Retinopathy Patients
Eberhard et al. Deep Survival Analysis for Interpretable Time-Varying Prediction of Preeclampsia Risk
Ibrahim et al. Research Article Discovery of Knowledge in the Incidence of a Type of Lung Cancer for Patients through Data Mining Models
CN118098597A (zh) 一种妊娠期糖尿病与特定出生缺陷的风险预测方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081010

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081010

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081010

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091010

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091010

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101010

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131010

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees