JP2021530777A

JP2021530777A - 人工知能に基づく医療ソリューションを開発するための患者のシミュレーション

Info

Publication number: JP2021530777A
Application number: JP2021500264A
Authority: JP
Inventors: ボロツキー、リッラ; デュフォール、ポール; シエ、イーチン; リッチモンド、デイヴィッド
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2018-07-18
Filing date: 2019-07-11
Publication date: 2021-11-11
Anticipated expiration: 2039-07-11
Also published as: US20200027530A1; CN112424873A; JP7446278B2; WO2020016103A1

Abstract

人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施するためのメカニズムが提供される。認知人工知能トレーニング・メカニズムは、現実の患者データ・セットからの現実の患者の非画像に基づく情報に摂動を与えて、摂動を与えられた非画像に基づく情報を形成する。認知人工知能トレーニング・メカニズムは、摂動を与えられた非画像に基づく情報および現実の患者の摂動を与えられていない医用画像を使用して人工的患者データ・セット内の人工的患者データを生成する。その後、認知人工知能トレーニング・メカニズムは、現実の患者データ・セット内の現実の患者データおよび人工的患者データ・セット内の人工的患者データを使用して、認知データ処理システムによって利用される学習アルゴリズムの動作をトレーニングする。

Description

本出願は、一般に、改良されたデータ処理装置および方法に関し、より詳細には、人工知能に基づく医療ソリューションを開発するために患者をシミュレートするメカニズムに関する。

意思決定支援システムは、情報を検索して解析することにおいて専門家が支援を必要とするさまざまな産業に存在する。本出願全体を通じて使用される例は、医療産業において採用されている診断システムである。診断システムは、構造化された知識を使用するシステム、構造化されていない知識を使用するシステム、および臨床的意思決定の式、ルール、ツリー、またはアルゴリズムを使用するシステムに分類され得る。最も初期の診断システムは、構造化された知識または古典的な手動で構築された知識ベースを使用していた。１９７０年代に開発されたＩｎｔｅｒｎｉｓｔ−Ｉシステムは、病気と研究結果の間の関係および病気間の関係を使用する。やはり１９７０年代に開発された感染病を診断するためのＭＹＣＩＮシステムは、特定の事実が真である場合に、特定の確信度を有する特定の他の事実を断定することができるということを述べる生成ルールの形態で、構造化された知識を使用する。１９８０年代から開発されたＤＸｐｌａｉｎは、Ｉｎｔｅｒｎｉｓｔ−Ｉに類似する構造化された知識を使用するが、研究結果の階層的辞書を追加する。

１９９０年代から開発されたＩｌｉａｄは、さらに洗練された確率的推論を追加し、Ｉｌｉａｄでは、各病気が、病気に関連付けられた（Ｉｌｉａｄの設計の対象になる母集団内の）先験的確率および研究結果のリストを、研究結果が存在する有病の患者の一部（感度）および研究結果が存在する無病の患者の一部（１−特異度）と共に有する。

２０００年には、構造化されていない知識を使用する診断システムが現れ始めた。これらのシステムは、例えば、検索を容易にするために文書内でタグ付けされている研究結果および病気などの実体のような、何らかの知識の構造化を使用する。例えば、ＩＳＡＢＥＬは、研究結果の入力を前提として、Ａｕｔｏｎｏｍｙ情報検索ソフトウェアおよび医学の教科書のデータベースを使用して適切な診断を検索する。ＡｕｔｏｎｏｍｙＡｕｍｉｎｅｎｃｅは、研究結果を前提として、Ａｕｔｏｎｏｍｙ技術を使用して診断を検索し、体組織によって診断を構造化する。ＦｉｒｓｔＣＯＮＳＵＬＴは、主訴および年齢グループによって医学書、医学雑誌、および治療指針の大規模な集合を検索し、可能性のある診断に到達できるようにする。ＰＥＰＩＤＤＤＸは、ＰＥＰＩＤの独立した臨床コンテンツに基づく診断ジェネレータである。

多数の医学的障害に関する臨床的意思決定ルールが開発され、医師および患者がこれらのルールを適用するのを支援するためのコンピュータ・システムが開発された。ＡＣＩ−ＴＩＰＩ（ＡｃｕｔｅＣａｒｄｉａｃＩｓｃｈｅｍｉａＴｉｍｅ−ＩｎｓｅｎｓｉｔｉｖｅＰｒｅｄｉｃｔｉｖｅＩｎｓｔｒｕｍｅｎｔ）は、急性心虚血を示唆する胸痛またはその他の症状がある患者のトリアージを支援するために、臨床的特徴およびＥＣＧの特徴を入力として受け取り、急性心虚血の確率を出力として生成する。ＡＣＩ−ＴＩＰＩは、多くの市販の心臓モニタ／除細動器に組み込まれている。ＣａｓｅＷａｌｋｅｒシステムは、４項目の質問表を使用して、大鬱病性障害を診断する。ＰＫＣＡｄｖｉｓｏｒは、腹痛および嘔吐などの９８の患者の問題に関する助言を提供する。

医学的応用のための機械学習に基づくアルゴリズム、特に深層学習アルゴリズムは、モデルが未見の患者集団に対して性能を維持することを保証するために、特定の条件を有する多数の患者のデータセットを必要とする。教師あり学習の場合、グランド・トゥルース（患者が特定の条件または病気を有するかどうか、病変が円形であるか、または不規則な形状を有するか、など）を確立することも不可欠である。教師なし学習の場合、グランド・トゥルースは不要であるが、通常、望ましい性能を達成するために必要な患者の数がさらに多くなる。医用画像に基づくソリューションの場合、異なる供給業者による画像研究の取得も不可欠である。機械学習に基づくソリューションの一般化可能性を保証するために、トレーニング・データセット内の患者は、グランド・トゥルースに加えて、さまざまな患者の特性（例えば、人種、性別、年齢、医療履歴、家族歴、臨床危険因子、併存症、特定の条件の異なるレベルなど）に関する変動性をカバーするべきである。

人工知能に基づくシステムをトレーニングするための十分に大きいデータセットを取得することは、重要な問題である。そのような大きいデータセットの生成は、非常に多くのリソースを消費するプロセスになる傾向があり、実行するために、対象の専門家の大量の時間を必要とする。さらに、そのようなプロセスは、手動プロセスになる傾向があり、誤りが発生しやすい手動プロセスの性質の影響を受ける。したがって、実施形態例は、人工知能に基づく医療ソリューションを開発するために患者をシミュレートするメカニズムを提供する。すなわち、これらのメカニズムは、患者情報に対して動作する人工知能システムをトレーニングする目的で、患者を表すデータセットを拡張する。これらのメカニズムは、許容できる信頼性を有する現実の患者のセットの情報および医用画像の患者データ・セットから開始する。本発明によれば、許容できるとは、標準的な病院における標準的治療に適合すると認識される技術、人員、および手順を使用して情報および医用画像が生成されるということを意味する。このシステムは、患者データ・セット内の現実の患者の情報および医用画像内で摂動を生成し、現実の患者および現実の患者から得られた人工的患者の両方に関する情報および医用画像を含む、より大きい患者データ・セットを生成する。人工的患者に関連付けられた患者データ・セットの一部を生成するために、これらのメカニズムは、現実の患者の情報に摂動を与えて人工的患者の情報を生成し、医用画像に摂動を与えて、摂動が与えられた患者情報と一致する人工的医用画像を生成し、人工的患者の情報および関連付けられた人工的医用画像を含めて患者データ・セットを拡張する。その後、現実の患者および現実の患者を表す人工的患者の両方に関する情報を含むより大きい患者データ・セットが、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングするために利用される。

したがって、当技術分野において、前述の問題に対処する必要がある。

この「発明の概要」は、概念の選択を簡略化された形態で導入するために提供されており、本明細書の「発明を実施するための形態」において、さらに説明される。この「発明の概要」は、請求される対象の重要な要因または不可欠な特徴を識別するよう意図されておらず、請求される対象の範囲の制限に使用されることも意図されていない。

第１の態様から見ると、本発明は、少なくとも１つのプロセッサおよび少なくとも１つのメモリを備えている認知データ処理システムにおいて、方法を提供し、少なくとも１つのメモリが命令を含んでおり、命令が、少なくとも１つのプロセッサによって実行されて、少なくとも１つのプロセッサに、人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施させ、認知人工知能トレーニング・メカニズムは、認知人工知能トレーニング・メカニズムの非画像に基づく情報摂動エンジンによって、現実の患者データ・セットからの現実の患者の非画像に基づく情報に摂動を与えて、摂動を与えられた非画像に基づく情報を形成することと、認知人工知能トレーニング・メカニズムの人工的患者組み立てエンジンによって、摂動を与えられた非画像に基づく情報および現実の患者の摂動を与えられていない医用画像を使用して人工的患者データ・セット内の人工的患者データを生成することと、認知人工知能トレーニング・メカニズムのトレーニング・エンジンによって、現実の患者データ・セット内の現実の患者データおよび人工的患者データ・セット内の人工的患者データを使用して、認知データ処理システムによって利用される学習アルゴリズムの動作をトレーニングすることとを実行するように動作する。

さらに別の態様から見ると、本発明は、人工知能に基づく医療ソリューションを開発するために患者をシミュレートするコンピュータ・プログラム製品を提供し、このコンピュータ・プログラム製品は、処理回路によって読み取り可能な、本発明のステップを実行するための方法を実行するためにこの処理回路によって実行されるための命令を格納している、コンピュータ可読ストレージ媒体を備えている。

さらに別の態様から見ると、本発明は、コンピュータ可読媒体に格納された、デジタル・コンピュータの内部メモリに読み込み可能なコンピュータ・プログラムを提供し、このコンピュータ・プログラムは、コンピュータ上で実行された場合に本発明のステップを実行するためのソフトウェア・コード部分を含んでいる。

さらに別の態様から見ると、本発明は、少なくとも１つのプロセッサと、少なくとも１つのプロセッサに結合された少なくとも１つのメモリとを備えている装置を提供し、少なくとも１つのメモリが命令を含んでおり、命令が、少なくとも１つのプロセッサによって実行された場合に、少なくとも１つのプロセッサに、人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施させ、少なくとも１つのプロセッサに、認知人工知能トレーニング・メカニズムの非画像に基づく情報摂動エンジンによって、現実の患者データ・セットからの現実の患者の非画像に基づく情報に摂動を与えて、摂動を与えられた非画像に基づく情報を形成することと、認知人工知能トレーニング・メカニズムの人工的患者組み立てエンジンによって、摂動を与えられた非画像に基づく情報および現実の患者の摂動を与えられていない医用画像を使用して人工的患者データ・セット内の人工的患者データを生成することと、認知人工知能トレーニング・メカニズムのトレーニング・エンジンによって、現実の患者データ・セット内の現実の患者データおよび人工的患者データ・セット内の人工的患者データを使用して、認知データ処理システムによって利用される学習アルゴリズムの動作をトレーニングすることとをさらに実行させる。

１つの実施形態例では、少なくとも１つのプロセッサおよび少なくとも１つのメモリを備えているデータ処理システムにおいて、方法が提供され、少なくとも１つのメモリが命令を含んでおり、命令が、少なくとも１つのプロセッサによって実行されて、少なくとも１つのプロセッサに、人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施させる。この方法は、認知人工知能トレーニング・メカニズムの非画像に基づく情報摂動エンジンによって、現実の患者データ・セットからの現実の患者の非画像に基づく情報に摂動を与えて、摂動を与えられた非画像に基づく情報を形成することを含む。この方法は、認知人工知能トレーニング・メカニズムの人工的患者組み立てエンジンによって、摂動を与えられた非画像に基づく情報および現実の患者の摂動を与えられていない医用画像を使用して人工的患者データ・セット内の人工的患者データを生成することも含む。さらに、この方法は、認知人工知能トレーニング・メカニズムのトレーニング・エンジンによって、現実の患者データ・セット内の現実の患者データおよび人工的患者データ・セット内の人工的患者データを使用して、認知データ処理システムによって利用される学習アルゴリズムの動作をトレーニングすることを含む。

他の実施形態例では、コンピュータ可読プログラムを含んでいるコンピュータ使用可能媒体またはコンピュータ可読媒体を備えているコンピュータ・プログラム製品が提供される。このコンピュータ可読プログラムは、コンピューティング・デバイス上で実行された場合、コンピューティング・デバイスに、方法の実施形態例に関して上で概説された動作のうちのさまざまな動作およびその組み合わせを実行させる。

さらに別の実施形態例では、システム／装置が提供される。このシステム／装置は、１つまたは複数のプロセッサおよび１つまたは複数のプロセッサに結合されたメモリを備えてよい。このメモリは命令を含んでよく、これらの命令は、１つまたは複数のプロセッサによって実行された場合に、１つまたは複数のプロセッサに、方法の実施形態例に関して上で概説された動作のうちのさまざまな動作およびその組み合わせを実行させる。

本発明の実施形態例の以下の詳細な説明を考慮して、本発明のこれらおよびその他の特徴および優位性が説明され、当業者にとって明らかになるであろう。

本発明ならびに本発明の好ましい使用方法とその他の目的、および優位性は、実施形態例の以下の詳細な説明を、添付の図面と一緒に読みながら参照することによって、最も良く理解されるであろう。

コンピュータ・ネットワーク内の認知システムの一実施形態例の概略図を示す図である。実施形態例の態様が実装される例示的なデータ処理システムのブロック図である。一実施形態例に従って認知システムの要素の相互作用を示す例示的な図である。実施形態例に従って、データ処理システム内で人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施することにおいて、認知システムによって実行される動作の例示的なフローチャートを示す図である。

実施形態例のさまざまな態様のさらに詳細な説明を開始する前に、この説明全体にわたって、「メカニズム」という用語が、さまざまな動作、機能などを実行する本発明の要素を指すために使用されるということが、最初に理解されるべきである。「メカニズム」は、この用語が本明細書において使用されるとき、装置、手順、またはコンピュータ・プログラム製品の形態での、実施形態例の機能または態様の実装であってよい。手順の場合、手順は、１つまたは複数のデバイス、装置、コンピュータ、データ処理システムなどによって実装される。コンピュータ・プログラム製品の場合、特定の「メカニズム」に関連付けられた機能を実装するため、または特定の「メカニズム」に関連付けられた動作を実行するために、コンピュータ・プログラム製品内またはコンピュータ・プログラム製品上で具現化されたコンピュータ・コードまたは命令によって表された論理が、１つまたは複数のハードウェア・デバイスによって実行される。したがって、本明細書に記載されたメカニズムは、特殊なハードウェア、汎用ハードウェア上で実行されるソフトウェア、命令が特殊なハードウェアまたは汎用ハードウェアによって容易に実行可能になるように媒体に格納されたソフトウェア命令、機能を実行するための手順または方法、あるいはこれらのいずれかの組み合わせとして実装されてよい。

本説明および特許請求の範囲では、実施形態例の特定の特徴および要素に関して、「１つの」、「〜のうちの少なくとも１つ」、および「〜のうちの１つまたは複数」という用語を使用することがある。これらの用語および語句が、特定の実施形態例に存在する特定の特徴または要素のうちの少なくとも１つが存在するが、２つ以上が存在する可能性もあるということを述べるよう意図されているということが、理解されるべきである。すなわち、これらの用語／語句は、説明または特許請求の範囲を、存在している単一の特徴／要素に制限するよう意図されておらず、そのような特徴／要素が複数存在することを必要とするよう意図されていない。反対に、これらの用語／語句は、少なくとも単一の特徴／要素のみを必要とし、そのような特徴／要素は、説明および特許請求の範囲内に複数存在する可能性がある。

さらに、「エンジン」という用語の使用が、本発明の実施形態および特徴を説明することに関して本明細書において使用された場合、エンジンに起因するか、またはエンジンによって実行されるか、あるいはその両方である動作、ステップ、プロセスなどを実現するため、または実行するため、あるいはその両方のためのいずれかの特定の実装を制限するよう意図されていないということが、理解されるべきである。エンジンは、機械可読メモリに読み込まれるか、または格納されて、プロセッサによって実行される適切なソフトウェアと組み合わせた一般的なプロセッサまたは特殊なプロセッサあるいはその両方の任意の使用を含むが、これらに限定されない、指定された機能を実行するソフトウェア、ハードウェア、またはファームウェア、あるいはその組み合わせであってよいが、これらに限定されない。さらに、特定のエンジンに関連付けられたすべての名前は、特に指定されない限り、参照の便宜のためであり、特定の実装を制限するよう意図されていない。さらに、あるエンジンに起因する任意の機能が、同じ種類または異なる種類の別のエンジンの機能に組み込まれるか、もしくは結合されるか、またはその両方が行われるか、あるいはさまざまな構成の１つまたは複数のエンジンにわたって分散されて、複数のエンジンによって同じように実行されてよい。

加えて、以下の説明では、実施形態例のさまざまな要素の複数のさまざまな例を使用して、実施形態例の例示的な実装をさらに説明し、実施形態例のメカニズムの理解を助けているということが、理解されるべきである。これらの例は、非限定的であるよう意図されており、実施形態例のメカニズムの実装のさまざまな可能性を網羅していない。本説明を考慮して、これらのさまざまな要素に関して、本発明の範囲から逸脱することなく、本明細書において提供された例に加えて、またはそれらの例を置き換えて利用できる、多くのその他の代替の実装が存在するということが、当業者にとって明らかであろう。

前述したように、本発明は、人工知能に基づく医療ソリューションを開発するために患者をシミュレートするメカニズムを提供する。実施形態例は、さまざまな種類のデータ処理環境において利用されてよい。実施形態例の特定の要素および機能の説明の背景を提供するために、以下では、図１〜３が、実施形態例の態様が実装されてよい例示的な環境として提供される。図１〜３は単なる例であり、本発明の態様または実施形態が実装されてよい環境に関して、どのような制限も主張することも、意味することも意図されていないということが、理解されるべきである。本発明の範囲から逸脱することなく、示された環境に対して多くの変更が行われてよい。

図１〜３は、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングすることにおいて使用するために、現実の患者の情報および医用画像に基づいて人工的患者の情報および医用画像を生成するための、実施形態例のメカニズムを実装するために使用される要求処理パイプライン、要求処理方法、および要求処理コンピュータ・プログラム製品を実装する、例示的な認知システムを説明することを対象にしている。これらの要求は、構造要求メッセージまたは非構造化要求メッセージ、自然言語の質問、あるいは認知システムによって実行される動作を要求するための任意のその他の適切な形式として提供されてよい。以下でさらに詳細に説明されるように、本発明の認知システムにおいて実装される特定のアプリケーションは、人工知能に基づく医療ソリューションを開発するために患者をシミュレートするアプリケーションである。

認知システムは、以下の例では単一の要求処理パイプラインを含んでいるとして示されているが、実際には複数の要求処理パイプラインを含んでよいということが、理解されるべきである。各要求処理パイプラインは、望ましい実装に応じて、異なる領域に関連付けられた要求を処理するように別々にトレーニングされるか、または構成されるか、あるいはその両方が行われてよく、あるいは入力要求に対して同じ解析または異なる解析を実行するように構成されてよい。例えば、場合によっては、第１の要求処理パイプラインは、検出された肺結節の悪性度の確率を生成することを対象にする入力要求に対して動作するように、トレーニングされてよい。他の事例では、例えば要求処理パイプラインは、異なる種類の認知機能を提供するように、または異なる種類のアプリケーションを支援するように構成されてよく、例えば、ある要求処理パイプラインは、胸部組織内の悪性度の確率を生成するためなどに使用されている。

さらに、各要求処理パイプラインは、各要求処理パイプラインが取り込んで処理する１つまたは複数のコーパスに関連付けられてよく、例えば、上の例では、あるコーパスは肺癌の領域に関連する文書に関するものであり、別のコーパスは乳癌の領域に関連する文書に関するものである。場合によっては、要求処理パイプラインはそれぞれ、同じ領域の入力質問を処理してよいが、異なる解析および可能性のある応答が生成されるように、異なる構成（例えば、異なるアノテータまたは異なってトレーニングされたアノテータ）を有してよい。認知システムは、入力要求の決定された領域などに基づいて、要求を適切な要求処理パイプラインにルーティングし、複数の要求処理パイプラインによって実行される処理によって生成された最終結果を結合して評価するための追加の論理、ならびに複数の要求処理パイプラインの利用を容易にするその他の制御および相互作用の論理を提供してよい。

本発明は、要求を処理する１つまたは複数の要求処理パイプラインを実装する認知システムとの関連において説明されているが、実施形態例がそのような説明に限定されないということが、理解されるべきである。むしろ、実施形態例のメカニズムは、「質問」として提示されるか、または指定された一連の入力データに対して認知動作を実行するための認知システムに対する要求として書式設定された要求を、関連する１つまたは複数のコーパスおよび認知システムを構成するために使用される特定の構成情報を使用して、処理してよい。

以下でさらに詳細に説明されるように、実施形態例は、人工知能に基づく医療ソリューションを開発するために患者をシミュレートすることに関して、医療認知システムのこれらのパイプラインまたは要求処理パイプラインのメカニズムの機能に統合され、これらの機能を強化し、拡張することができる。例えば、非常に大きいデータ・セットを生成するために使用できるシード・データ・セットを表すために、患者の特徴（民族性、年齢、気腫のレベル、その他の条件など）に関して十分多様な初期患者データ・セットを識別する。これらの多様な特徴ごとに、認知システムは、多様な特徴だけでなく、初期患者データ・セットに関連付けられた１つまたは複数の医用画像にも摂動を与え、人工的に生成された患者の新しい医用画像を生成するが、これらの医用画像は、人工的に生成された患者の他の多様な特徴に対して行われた摂動と相関関係がある。すなわち、これらの摂動はランダムではなく、代わりに、一貫性のある摂動が生成される。例えば、医用画像に摂動が与えられてよいが、これらの摂動は、この人工的患者を生成するために他の摂動によって行われた気腫のレベルにおける変更と一致する領域に集中されてよい。人工的患者の摂動を与えられた患者の特徴および医用画像、ならびに現実の患者の特徴および医用画像を利用して、認知システムは、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングする。

図１〜３で説明されているメカニズムは単なる例であり、実施形態例が実装される認知システムのメカニズムの種類に関して、どのような制限も述べることも、意味することも意図されていないということが、理解されるべきである。図１〜３に示されている例示的な認知システムに対する多くの変更が、本発明の範囲から逸脱することなく、本発明のさまざまな実施形態において実装されてよい。

概要として、認知システムは、特殊なコンピュータ・システム、またはコンピュータ・システムのセットであり、人間の認知機能をエミュレートするようにハードウェア論理または（ソフトウェアが実行されるハードウェア論理と組み合わせた）ソフトウェア論理あるいはその両方を使用して構成される。これらの認知システムは、人間のような特徴を、考えを伝達することおよび操作することに適用し、デジタル計算の固有の強みと組み合わせた場合に、高い精度および柔軟性で大規模な問題を解くことができる。認知システムは、人間の思考過程に近づく１つまたは複数のコンピュータ実装認知動作を実行することに加えて、人間の専門知識および認知を拡張および拡大するために、より自然な方法で人間と機械が対話できるようにする。認知システムは、例えば自然言語処理（ＮＬＰ：natural language processing）に基づく論理などの人工知能論理、および機械学習論理を含んでおり、特殊なハードウェア、ハードウェア上で実行されるソフトウェア、または特殊なハードウェアおよびハードウェア上で実行されるソフトウェアの任意の組み合わせとして提供されてよい。認知システムの論理は認知動作を実装し、認知動作の例としては、質問回答、コーパス内の内容の異なる部分内の関連する概念の識別、例えばインターネットのＷｅｂページ検索などの、インテリジェントな検索アルゴリズム、医療診断および治療推奨、ならびにその他の種類の推奨の生成（例えば、特定のユーザにとって興味のある項目、可能性のある新しい連絡先の推奨など）が挙げられるが、これらに限定されない。

ＩＢＭ（登録商標）Ｗａｔｓｏｎ（商標）は、そのような認知システムの一例であり、人間が読める言語を処理し、テキストの通過間の推定を、人間のように高い精度で、人間よりもはるかに高速かつ大量に識別することができる。ＩＢＭおよびＩＢＭＷａｔｓｏｎは、世界中の多くの管轄区域で登録されている、ＩｎｔｅｒｎａｔｉｏｎａｌＢｕｓｉｎｅｓｓＭａｃｈｉｎｅｓＣｏｒｐｏｒａｔｉｏｎの商標である。一般に、そのような認知システムは、以下の機能を実行することができる。
・複雑な人間の言語を操作し、理解する。
・大量の構造化データおよび非構造化データを取り込んで処理する。
・仮説を生成して評価する。
・関連する証拠のみに基づく応答を検討して評価する。
・状況に固有の助言、洞察、および指導を提供する。
・機械学習プロセスを通じた各反復および対話により、知識を改善し、学習する。
・影響を与える時点で、意思決定を可能にする（状況に即した指導）。
・作業に比例して規模を変更する。
・人間の専門知識および認知を拡張および拡大する。
・自然言語から、共鳴、人間のような属性、および特質を識別する。
・自然言語から、さまざまな言語固有の属性または不可知的属性を推定する。
・データ点（画像、テキスト、音声）からの高度な関連する想起（記憶および思い出すこと）。
・経験に基づく人間の認知を模倣する状況認識によって予測し、感知する。または、
・自然言語および特定の証拠に基づいて質問に回答する。

１つの態様では、認知システムは、要求処理パイプラインを使用して、それらの認知システムに提示された要求に応答するか、または自然言語の要求として提示されることもあれば、提示されないこともある要求を処理するか、あるいはその両方を実行するためのメカニズムを提供する。要求処理パイプラインは、データ処理ハードウェア上で実行される人工知能アプリケーションであり、自然言語で提示された特定の対象領域に関する要求に応答する。要求処理パイプラインは、ネットワークを経由した入力、電子文書またはその他のデータのコーパス、コンテンツ作成者からのデータ、１人または複数のコンテンツ・ユーザからの情報、およびその他の可能性のある入力のソースからのその他のそのような入力を含む、さまざまなソースからの入力を受信する。データ・ストレージ・デバイスは、データのコーパスを格納する。コンテンツ作成者は、要求処理パイプラインと共にデータのコーパスの一部として使用するために、文書の内容を作成する。この文書は、要求処理システムにおいて使用するための任意のファイル、テキスト、記事、またはデータのソースを含んでよい。例えば、要求処理パイプラインは、領域または対象領域（例えば、金融の領域、医学の領域、法律の領域など）に関する知識体系にアクセスし、この知識体系（知識ベース）は、さまざまな構成（例えば、オントロジーなどの領域固有の情報の構造化されたリポジトリ、または領域に関連する非構造化データ、または領域に関する自然言語文書の集合）で整理され得る。

コンテンツ・ユーザは、要求を、要求処理パイプラインを実装する認知システムに入力する。次に、要求処理パイプラインは、文書、文書のセクション、コーパス内のデータの一部などを評価することによって、データのコーパスの内容を使用して要求に応答する。プロセスが、意味内容に関して文書の特定のセクションを評価する場合、このプロセスは、要求処理パイプラインからそのような文書を照会するために、さまざまな規約を使用することができ、例えば、適切に形成された要求として照会を要求処理パイプラインに送信し、次に、この照会が要求処理パイプラインによって解釈され、要求に対する１つまたは複数の応答を含んでいる応答が提供される。意味内容は、単語、語句、記号、およびシンボルなどの記号表現間の関係、記号表現が表すもの、記号表現の明示的意味、または言外の意味に基づく内容である。言い換えると、意味内容は、自然言語処理を使用することなどによって表現を解釈する内容である。

以下でさらに詳細に説明されるように、要求処理パイプラインは、要求を受信し、要求を構文解析して要求の主要な特徴を抽出し、抽出された特徴を使用して照会を組み立て、その後、それらの照会をデータのコーパスに適用する。データのコーパスへの照会の適用に基づいて、要求処理パイプラインは、要求に対する有益な応答を含んでいる可能性のあるデータのコーパスの部分に関して、データのコーパス全体を調べることによって、要求に対する一連の応答を生成する。次に、要求処理パイプラインは、要求の言語、およびさまざまな推論アルゴリズムを使用した照会の適用中に検出されたデータのコーパスの部分の各々において使用されている言語に対して、綿密な解析を実行する。適用される数百または数千の推論アルゴリズムが存在することがあり、それらのアルゴリズムの各々は、異なる解析（例えば、比較、自然言語解析、字句解析など）を実行して、スコアを生成する。例えば、一部の推論アルゴリズムは、要求およびデータのコーパスの検出された部分の言語内の用語および同義語の一致を調べてよい。他の推論アルゴリズムは、言語内の時間的特徴または空間的特徴を調べてよく、さらに他の推論アルゴリズムは、データのコーパスの部分のソースを評価して、その正確さを評価してよい。

前述したように、要求処理パイプラインのメカニズムは、データまたは情報のコーパス（内容のコーパスとも呼ばれる）からの情報にアクセスして解析し、その後、このデータの解析に基づいて回答結果を生成することによって動作する。データのコーパスからの情報にアクセスすることは、通常、構造化されたレコードの集合内に何が存在するかに関する要求に回答するデータベースの照会、および非構造化データ（テキスト、マークアップ言語など）の集合に対する照会に応答して文書のリンクの集合を配信する検索を含む。従来の要求処理システムは、データのコーパスおよび入力要求に基づいて回答を生成し、データのコーパスに関して要求の集合に対する回答を検証し、データのコーパスを使用してデジタル・テキスト内の誤りを修正し、要求に対する応答を可能性のある回答（すなわち、回答の候補）のプールから選択することができる。

図１は、コンピュータ・ネットワーク１０２内で要求処理パイプライン１０８（一部の実施形態では、要求処理パイプラインであってよい）を実装する認知システム１００の一実施形態例の概略図を示している。本説明の目的で、要求処理パイプライン１０８が、要求の形態で構造化された要求または構造化されていない要求あるいはその両方を処理するということが、仮定される。本明細書に記載された原理と共に使用されてよい質問処理動作の一例が、米国特許出願公開第２０１１／０１２５７３４ｎｂ号において説明されている。認知システム１００は、１つまたは複数のコンピューティング・デバイス１０４Ａ〜Ｃ（１つまたは複数のプロセッサおよび１つまたは複数のメモリと、場合によっては、バス、ストレージ・デバイス、通信インターフェイスなどを含む、従来技術において通常知られている任意のその他のコンピューティング・デバイスの要素とを備えている）上で実装され、コンピュータ・ネットワーク１０２に接続されている。単に説明の目的で、図１は、コンピューティング・デバイス１０４Ａ上のみで実装される認知システム１００を示しているが、前述したように、認知システム１００は、複数のコンピューティング・デバイス１０４Ａ〜Ｃなどの複数のコンピューティング・デバイスにわたって、分散されてよい。ネットワーク１０２は、サーバ・コンピューティング・デバイスとして動作してよい複数のコンピューティング・デバイス１０４Ａ〜Ｃ、ならびにクライアント・コンピューティング・デバイスとして動作してよい１１０および１１２を含んでおり、これらのコンピューティング・デバイスは、１つまたは複数の有線データ通信リンクまたは無線データ通信リンクあるいはその両方を介して、互いに、および他のデバイスまたはコンポーネントと通信し、各通信リンクは、ワイヤ、ルータ、スイッチ、送信器、受信器などのうちの１つまたは複数を含む。一部の実施形態例では、認知システム１００およびネットワーク１０２は、１人または複数の認知システム・ユーザのために、各コンピューティング・デバイス１１０および１１２を介した要求処理機能を可能にする。他の実施形態では、認知システム１００およびネットワーク１０２は、望ましい実装（例えば、認知情報の取り出し、ユーザのトレーニング／教育、データの認知評価など）に応じて多くの異なる形態を取ってよい要求の処理および認知応答の生成を含むが、これに限定されない、その他の種類の認知動作を提供してよい。認知システム１００のその他の実施形態は、本明細書に示されている以外のコンポーネント、システム、サブシステム、またはデバイス、あるいはその組み合わせと共に使用されてよい。

認知システム１００は、さまざまなソースから入力を受信する要求処理パイプライン１０８を実装するように構成される。要求は、情報に関する自然言語の要求、認知動作の実行に関する自然言語の要求などの形態で提示されてよい。例えば、認知システム１００は、ネットワーク１０２、電子文書１３２、１３４、および１３６の１つまたは複数のコーパス、認知システム・ユーザ、またはその他のデータおよびその他の可能性のある入力のソース、あるいはその組み合わせから、入力を受信する。１つの実施形態では、認知システム１００への入力の一部または全部が、ネットワーク１０２を介してルーティングされる。ネットワーク１０２上のさまざまなコンピューティング・デバイス１０４Ａ〜Ｄは、コンテンツ作成者および認知システム・ユーザのためのアクセス・ポイントを含んでいる。コンピューティング・デバイス１０４Ａ〜Ｃの一部は、データの１つまたは複数のコーパス１３２、１３４、および１３６（単に説明の目的で、図１では分離した実体として示されている）を格納するデータベース用のデバイスを含む。データの１つまたは複数のコーパス１３２、１３４、および１３６の一部は、１つまたは複数のその他のネットワーク接続ストレージ・デバイス上、１つまたは複数のデータベース内、または図１に明示的に示されていないその他のコンピューティング・デバイス上で提供されてもよい。認知システム１００が、ローカルおよびグローバル（例えば、インターネット）を含む任意のサイズの環境内で動作できるように、ネットワーク１０２は、さまざまな実施形態では、ローカル・ネットワーク接続およびリモート接続を含む。

１つの実施形態では、コンテンツ作成者は、認知システム１００でデータのコーパスの一部として使用するために、データの１つまたは複数のコーパス１３２、１３４、および１３６の文書の内容を作成する。この文書は、認知システム１００において使用するための任意のファイル、テキスト、記事、またはデータのソースを含む。認知システム・ユーザは、ネットワーク１０２へのネットワーク接続またはインターネット接続を介して認知システム１００にアクセスし、データの１つまたは複数のコーパス１３２、１３４、および１３６の内容に基づいて応答／処理される要求を、認知システム１００に対して行う。１つの実施形態では、要求は、自然言語を使用して形成される。認知システム１００は、パイプライン１０８を介して要求を構文解析して解釈し、提示された要求に対する１つまたは複数の応答、要求に対する応答、要求の処理の結果などを含んでいる応答を、認知システム・ユーザ（例えば、認知システム・ユーザ１１０）に提供する。一部の実施形態では、認知システム１００は、応答の候補のランク付きリストで、応答をユーザに提供し、一方、他の実施形態例では、認知システム１００は、単一の最終的な応答または最終的な応答の組み合わせおよびその他の応答の候補のランク付きリストを提供する。

認知システム１００は、データの１つまたは複数のコーパス１３２、１３４、および１３６から取得された情報に基づいて要求を処理するための複数の段階を含んでいるパイプライン１０８を実装する。パイプライン１０８は、要求およびデータの１つまたは複数のコーパス１３２、１３４、および１３６の処理に基づいて、要求に対する応答を生成する。パイプライン１０８は、図３に関して下でさらに詳細に説明される。

一部の実施形態例では、認知システム１００は、ＩｎｔｅｒｎａｔｉｏｎａｌＢｕｓｉｎｅｓｓＭａｃｈｉｎｅｓＣｏｒｐｏｒａｔｉｏｎ（ニューヨーク州アーモンク市）から提供されるＩＢＭＷａｔｓｏｎ（商標）認知システムであってよく、この認知システムは、以下で説明される実施形態例のメカニズムを使用して拡張されている。前に概説したように、ＩＢＭＷａｔｓｏｎ（商標）認知システムのパイプラインは、要求を受信して構文解析し、要求の主要な特徴を抽出し、その後、その結果が、データの１つまたは複数のコーパス１３２、１３４、および１３６に適用される照会を組み立てるために使用される。

次に、さまざまな推論アルゴリズムから取得されたスコアが、統計モデルに対して重み付けされ、この統計モデルは、この例では、可能性のある応答の候補が要求によって推定される、証拠に関してＩＢＭＷａｔｓｏｎ（商標）認知システム１００のパイプライン１０８が有している信頼度を集約する。このプロセスは、応答の候補の各々について繰り返され、応答の候補のランク付きリストを生成し、その後、このランク付きリストが、要求を送信したユーザ（例えば、クライアント・コンピューティング・デバイス１１０のユーザ）に提示されてよく、またはこのランク付きリストから最終的な応答が選択されて、このユーザに提示される。ＩＢＭＷａｔｓｏｎ（商標）認知システム１００のパイプライン１０８に関する詳細は、例えば、ＩＢＭＣｏｒｐｏｒａｔｉｏｎのＷｅｂサイト（ＩＢＭＲｅｄｂｏｏｋｓ（商標））などから取得できる。例えば、ＩＢＭＷａｔｓｏｎ（商標）認知システムのパイプラインに関する情報は、Yuan et al., “Watson and Healthcare,” IBM developerWorks, 2011および“The Era of Cognitive Systems: An Inside Look at IBM Watson and How it Works” by Rob High, IBM Redbooks, 2012に記載されている。

前述したように、クライアント・デバイスから認知システム１００への入力は、自然言語の質問の形態で提示されてよいが、実施形態例はそのような形態に限定されない。むしろ、入力質問は、実際には、認知解析を実行するための基礎を決定して認知解析の結果を提供するＩＢＭＷａｔｓｏｎ（商標）などの認知システムの自然言語構文解析および解析メカニズムを含むが、これらに限定されない、構造化された入力または構造化されていない入力あるいはその両方の入力の解析を使用して、構文解析および解析を実行できる任意の適切な種類の要求として、書式設定されるか、または構造化されてよい。医療に基づく認知システムの場合、この解析は、患者の医療記録、１つまたは複数のコーパスからの医療指導文書などを処理して、医療志向の認知システムの結果を提供することを含んでよい。

本発明との関連において、認知システム１００は、人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知機能を提供してよい。例えば、特定の実装に応じて、知識ベースの拡張に基づく動作は、人工知能システムのトレーニング、患者の診断、治療推奨システム、医療業務管理システム、個人的患者治療計画の生成および監視、医学的試験または特定の種類の治療に適した患者を識別するためなどのさまざまな目的での患者の電子医療記録（ＥＭＲ）の評価などを含んでよい。したがって、認知システム１００は、医学的種類または医療の種類の領域において動作し、構造化された要求または構造化されていない要求、自然言語の入力質問などとしての要求処理パイプライン１０８の入力を介して、そのような医療の動作に関する要求を処理することができる、医療認知システム１００であってよい。一実施形態例では、認知システム１００は、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングするために患者をシミュレートする、認知人工知能トレーニング・システムである。

図１に示されているように、認知システム１００は、現実の患者に関連付けられた小さい患者データ・セット内で摂動を生成して、現実的な患者を表す人工的患者データを生成し、患者データ・セットを増やす、認知人工知能トレーニング・メカニズム１２０を実装するために、特殊なハードウェア、ハードウェア上で実行されるソフトウェア、または特殊なハードウェアおよびハードウェア上で実行されるソフトウェアの任意の組み合わせにおいて実装された論理を含むように、実施形態例のメカニズムに従って、さらに拡張される。認知人工知能トレーニング・メカニズム１２０は、人口統計、家族歴、医療履歴、実験結果、放射線医学およびその他の報告、または同様のもの、ならびに特定の病気を明示することがある医用画像などの、非画像に基づく情報を含む全体的な視点から患者を検討する／表す。したがって、認知人工知能トレーニング・メカニズム１２０は、患者データ・セットを拡張するために、人工的患者の情報および医用画像を生成するように、現実の患者の非画像に基づく情報および医用画像に摂動を与える。その後、現実の患者に関連付けられた非画像に基づく情報および医用画像と、人工的患者に関連付けられた、摂動を与えられた非画像に基づく情報および医用画像との両方が、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングするために利用される。したがって、図１に示されているように、認知人工知能トレーニング・メカニズム１２０は、非画像に基づく情報摂動エンジン１２２、医用画像摂動エンジン１２４、人工的患者組み立てエンジン１２６、およびトレーニング・エンジン１２８を備えている。

認知人工知能トレーニング・メカニズム１２０は、特定の患者が特定の病気（肺癌、乳癌、鬱血性心不全、ポリープなど）を有しているかどうかに関して照会をポストする将来の医療専門家などの、回答される臨床的質問１３０の予想に基づいて動作する。以下では、認知人工知能トレーニング・メカニズム１２０の動作の一例として肺癌を利用するが、実施形態例はこの病気のみに限定されない。前述したように、認知システム１００は、例示的な肺癌の肯定的指示または否定的指示を正確に提供するための十分な患者データを有していないことがある人工知能システムであってよい。したがって、回答される臨床的質問１３０を処理する前に、非画像に基づく情報摂動エンジン１２２は、人工的患者をシミュレートするために必要な要件１３２と、肺癌に関して検査されている、肯定的な肺癌の診断または否定的な肺癌の診断のいずれかを有する現実の患者１３４に関連付けられた患者データ・セットとを識別する。すなわち、医療専門家が回答を求めている臨床的質問と同じ臨床的質問が、認知システム１００をトレーニングするために使用され、トレーニングの完了後に、認知システム１００が、「将来の」未見の患者の同じ臨床的質問に回答する。

１つの実施形態では、非画像に基づく情報摂動エンジン１２２は、人工的患者の非画像に基づく情報を生成するために、人工的患者をシミュレートするために必要な要件１３２、および現実の患者１３４に関連付けられた患者データ・セットからの現実の患者に関連付けられた非画像に基づく情報を利用して、非画像に基づく情報に摂動を与える。例えば、非画像に基づく情報摂動エンジン１２２は、喫煙歴、その他の病気、家族歴、年齢、肥満度指数、医療履歴、実験結果、放射線医学およびその他の報告などの、構造化された非画像に基づく情報または構造化されていない非画像に基づく情報あるいはその両方に対して１つまたは複数の変更を行い、１人または複数の人工的患者に関する摂動を与えられた非画像に基づく情報を生成する。非画像に基づく情報摂動エンジン１２２によって摂動を与えられた非画像に基づく情報を有する現実の患者ごとに、その後、医用画像摂動エンジン１２４が、現実の患者１３４に関連付けられた患者データ・セットからの１つまたは複数の関連する医用画像および関連する摂動を与えられた非画像に基づく情報を利用して、１つまたは複数の関連する医用画像に摂動を与え、１つまたは複数の摂動を与えられた医用画像を生成する。

別の実施形態では、医用画像摂動エンジン１２４が、現実の患者１３４に関連付けられた患者データ・セットからの１つまたは複数の医用画像に摂動を与えて、１つまたは複数の摂動を与えられた医用画像を生成し、その後、非画像に基づく情報摂動エンジン１２２が、現実の患者１３４に関連付けられた患者データ・セットからの現実の患者に関連付けられた非画像に基づく情報に摂動を与えて、人工的患者の非画像に基づく情報を生成する。さらに別の実施形態では、医用画像摂動エンジン１２４が、現実の患者１３４に関連付けられた患者データ・セットからの１つまたは複数の医用画像に摂動を与え、実質的にそれと同時に、非画像に基づく情報摂動エンジン１２２が、現実の患者１３４に関連付けられた患者データ・セットからの現実の患者に関連付けられた非画像に基づく情報に摂動を与えて、人工的患者の１つまたは複数の摂動を与えられた医用画像および関連する非画像に基づく情報をそれぞれ生成する。さらに別の実施形態では、非画像に基づく情報摂動エンジン１２２が人工的患者の非画像に基づく情報を生成するために、非画像に基づく情報に摂動を与えるが、しかし現実の患者からの実際の医用画像が利用される。すなわち、例えば、現実の患者の電子医療記録は肺癌の家族歴がないことを示しているが、非画像に基づく情報摂動エンジン１２２が、その現実の患者の摂動を与えられていない医用画像に関連付けて、患者の父親が肺癌を有しているようにその現実の患者の上記電子医療記録を使用して人工的患者を生成する。

非画像に基づく情報摂動エンジン１２２および医用画像摂動エンジン１２４によって実行された摂動は、肯定的に診断された患者と否定的に診断された患者の両方の患者データに対して作用してよい。すなわち、医用画像摂動エンジン１２４は、肯定的患者の医用画像から悪性肺結節または悪性肺腫瘤をコピーして、否定的患者からの画像に貼り付け、この画像が肯定的患者からの画像であるかのように見えるようにしてよい。このようにすることは、非画像に基づく情報摂動エンジン１２２が、付随する放射線医学的報告内のテキストを、結節が見つからないことを示す状態から、貼り付けられた結節の存在および位置を示す新しい状態に変更することを含むこともできる。同じことを、コンピュータ断層撮影（ＣＴ：computerized axial tomography）スキャン、磁気共鳴断層撮影（ＭＲＩ：magnetic resonance imaging）スキャン、超音波（Ｕ／Ｓ：ultrasound）スキャン、陽電子放射断層撮影（ＰＥＴ：positron emission tomography）スキャン、Ｘ線スキャンなどの異なる画像診断法を使用して、乳癌の乳房病変、または肝臓癌もしくは結腸癌に対して行うことができる。肯定的患者に対して逆の動作が実行されてよく、その場合、肺結節または肺腫瘤が医用画像から削除され、付随する放射線医学的報告内のテキストが、結節が見つかったことを示す状態から、結節が存在しないことを示す新しい状態に変更される。

したがって、非画像に基づく情報摂動エンジン１２２および医用画像摂動エンジン１２４の目標は、現実の患者の非画像に基づく情報および医用画像を受け取り、２種類の患者を区別するように深層学習に基づくアルゴリズムの動作をトレーニングするその後の機械学習の試みにおいて使用できるほど十分に現実的な非画像に基づく情報および医用画像を有する新しい人工的患者を生成することである。したがって、特定の人工的患者の場合、人工的患者組み立てエンジン１２６が、非画像に基づく情報摂動エンジン１２２によって摂動を与えられた、摂動を与えられた非画像に基づく情報、および医用画像摂動エンジン１２４によって摂動を与えられた、関連する摂動を与えられた１つまたは複数の医用画像を利用して、人工的患者１３６に関連付けられた患者データ・セットを組み立てる。

したがって、人工的患者組み立てエンジン１２６は、人工的患者ごとに、肺癌に関して肯定的に診断されていること、または肺癌に関して否定的に診断されていることを表す人工的患者の人工的患者データ１３６を生成する。トレーニング・エンジン１２８は、肯定的に診断された人工的患者１３６と否定的に診断された人工的患者１３６の両方に関連付けられた患者データ・セット、および肯定的に診断された現実の患者１３４と否定的に診断された現実の患者１３４の両方に関連付けられた患者データ・セットを利用して、２種類の患者および任意選択的に現実の患者と人工的患者を区別するように、認知システム１００によって実行される深層学習に基づくアルゴリズムの動作をトレーニングする。深層学習に基づくアルゴリズムは、機械学習の一例にすぎない。人工的患者１３６に関連付けられた患者データ・セットおよび現実の患者１３４に関連付けられた患者データ・セットは、本発明の範囲から逸脱することなく、任意の機械学習に基づくシステム（例えば、ニューラル・ネットワーク、サポート・ベクター・マシン、決定木、分類器の連携（例えば、ランダム・フォレスト）などの、さまざまな分類器）をトレーニングするために使用されてもよい。トレーニング・エンジン１２８は、人工的患者１３６に関連付けられた患者データ・セットからの画像のうちの１つ、または現実の患者１３４に関連付けられた患者データ・セットからの画像のうちの１つのいずれかを取り込み、画像が、（１）現実の肯定的非画像に基づく情報および医用画像、（２）現実の否定的非画像に基づく情報および医用画像、（３）人工的な肯定的非画像に基づく情報および医用画像、または（４）人工的な否定的非画像に基づく情報および医用画像のいずれであるかを予測しようと試みる。

トレーニング・エンジン１２８は、特殊な敵対的損失関数を利用して、この目標が達成される範囲を定量化し、非画像に基づく情報摂動エンジン１２２、医用画像摂動エンジン１２４、および人工的患者組み立てエンジン１２６への逆伝搬の更新を駆動する。すなわち、１つの実施形態では、トレーニング・エンジン１２８は、将来の変更がより正確な非画像に基づく情報の変更および医用画像の変更を提供し、それによって、深層学習に基づくアルゴリズムの動作の効率および精度を向上させるように、非画像に基づく情報摂動エンジン１２２および医用画像摂動エンジン１２４によって行われる非画像に基づく情報の変更および医用画像の変更に関連付けられた重みをそれぞれ調整する。したがって、トレーニング・エンジン１２８の逆伝搬は、非画像に基づく情報摂動エンジン１２２および医用画像摂動エンジン１２４が、深層学習に基づくアルゴリズムのトレーニングにおいて使用される可能性がより高い非画像に基づく情報および医用画像を生成するように、重みを調整する。実施形態例は、トレーニング・エンジン１２８が、本発明の範囲から逸脱することなく、他の方法で、目標が達成される範囲を定量化し、非画像に基づく情報摂動エンジン１２２、医用画像摂動エンジン１２４、および人工的患者組み立てエンジン１２６への逆伝搬の更新を駆動してよいということを認識している。

前述したように、実施形態例のメカニズムは、コンピュータ技術に根差しており、そのようなコンピューティング・システムまたはデータ処理システムに存在する論理を使用して実装される。これらのコンピューティング・システムまたはデータ処理システムは、前述したさまざまな動作を実装するように、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組み合わせによって具体的に構成される。そのため、本発明の態様が実装されてよいデータ処理システムの一種の一例として、図２が提供されている。多くのその他の種類のデータ処理システムが、実施形態例のメカニズムを具体的に実装するために、同様に構成されてよい。

図２は、実施形態例の態様が実装される例示的なデータ処理システムのブロック図である。データ処理システム２００は、図１のサーバ１０４またはクライアント１１０などのコンピュータの例であり、データ処理システム２００内に、本発明の実施形態例のプロセスを実装するコンピュータ使用可能なコードまたは命令が配置される。１つの実施形態例では、図２は、本明細書に記載された実施形態例の追加のメカニズムを含むように拡張された認知システム１００およびシステムのパイプライン１０８を実装する、サーバ１０４などのサーバ・コンピューティング・デバイスを表す。

示されている例では、データ処理システム２００は、ノース・ブリッジおよびメモリ・コントローラ・ハブ（ＮＢ／ＭＣＨ：north bridge and memory controller hub）２０２およびサウス・ブリッジおよび入出力（Ｉ／Ｏ）コントローラ・ハブ（ＳＢ／ＩＣＨ：south bridge and input/output (I/O) controller hub）２０４を含んでいるハブ・アーキテクチャを採用している。処理ユニット２０６、メイン・メモリ２０８、およびグラフィック・プロセッサ２１０が、ＮＢ／ＭＣＨ２０２に接続されている。グラフィック・プロセッサ２１０は、アクセラレーテッド・グラフィックス・ポート（ＡＧＰ：accelerated graphics port）を介してＮＢ／ＭＣＨ２０２に接続されている。

示されている例では、ローカル・エリア・ネットワーク（ＬＡＮ：local area network）アダプタ２１２が、ＳＢ／ＩＣＨ２０４に接続されている。オーディオ・アダプタ２１６、キーボードおよびマウス・アダプタ２２０、モデム２２２、読み取り専用メモリ（ＲＯＭ：read only memory）２２４、ハード・ディスク・ドライブ（ＨＤＤ：hard disk drive）２２６、ＣＤ−ＲＯＭドライブ２３０、ユニバーサル・シリアル・バス（ＵＳＢ：universal serial bus）ポートおよびその他の通信ポート２３２、ならびにＰＣＩ／ＰＣＩｅデバイス２３４が、バス２３８およびバス２４０を介してＳＢ／ＩＣＨ２０４に接続されている。ＰＣＩ／ＰＣＩｅデバイスは、例えば、ノートブック・コンピュータ用のイーサネット（登録商標）・アダプタ、アドイン・カード、およびＰＣカードを含んでよい。ＰＣＩはカード・バス・コントローラを使用するが、ＰＣＩｅはカード・バス・コントローラを使用しない。ＲＯＭ２２４は、例えば、フラッシュ基本入出力システム（ＢＩＯＳ：basic input/output system）であってよい。

ＨＤＤ２２６およびＣＤ−ＲＯＭドライブ２３０は、バス２４０を介してＳＢ／ＩＣＨ２０４に接続されている。ＨＤＤ２２６およびＣＤ−ＲＯＭドライブ２３０は、例えば、ＩＤＥ（integrated drive electronics）またはシリアルＡＴＡ（ＳＡＴＡ：serial advanced technology attachment）インターフェイスを使用してよい。スーパーＩ／Ｏ（ＳＩＯ：Super I/O）デバイス２３６が、ＳＢ／ＩＣＨ２０４に接続されている。

オペレーティング・システムが、処理ユニット２０６上で実行される。オペレーティング・システムは、図２のデータ処理システム２００内のさまざまなコンポーネントを調整して制御する。クライアントとして、オペレーティング・システムは、Ｍｉｃｒｏｓｏｆｔ（登録商標）Ｗｉｎｄｏｗｓ８（登録商標）などの市販のオペレーティング・システムである。Ｊａｖａ（商標）プログラミング・システムなどのオブジェクト指向プログラミング・システムが、オペレーティング・システムと共に実行されてよく、データ処理システム２００上で実行されているＪａｖａ（商標）プログラムまたはアプリケーションからのオペレーティング・システムに対する呼び出しを提供する。

サーバとして、データ処理システム２００は、例えば、ＡｄｖａｎｃｅｄＩｎｔｅｒａｃｔｉｖｅＥｘｅｃｕｔｉｖｅ（ＡＩＸ（登録商標））オペレーティング・システムまたはＬＩＮＵＸ（登録商標）オペレーティング・システムを実行するＩＢＭ（登録商標）ｅＳｅｒｖｅｒ（商標）Ｓｙｓｔｅｍｐ（登録商標）コンピュータ・システムであってよい。データ処理システム２００は、処理ユニット２０６内で複数のプロセッサを含んでいる対称型マルチプロセッサ（ＳＭＰ：symmetric multiprocessor）システムであってよい。代替として、シングル・プロセッサ・システムが採用されてよい。

オペレーティング・システム、オブジェクト指向プログラミング・システム、およびアプリケーションまたはプログラムの命令が、ＨＤＤ２２６などのストレージ・デバイスに配置され、処理ユニット２０６によって実行するためにメイン・メモリ２０８に読み込まれる。本発明の実施形態例のプロセスは、コンピュータ使用可能なプログラム・コードを使用して、処理ユニット２０６によって実行され、このプログラム・コードは、例えばメイン・メモリ２０８、ＲＯＭ２２４などのメモリ内、または例えば１つまたは複数の周辺機器２２６および２３０内に、配置される。

図２に示されているように、バス２３８またはバス２４０などのバス・システムは、１つまたは複数のバスから成る。当然ながら、バス・システムは、通信ファブリックまたは通信アーキテクチャに接続された異なるコンポーネントまたはデバイス間のデータの転送を提供する任意の種類の通信ファブリックまたは通信アーキテクチャを使用して、実装されてよい。図２のモデム２２２またはネットワーク・アダプタ２１２などの通信ユニットは、データの送受信に使用される１つまたは複数のデバイスを含んでいる。メモリは、例えば、メイン・メモリ２０８、ＲＯＭ２２４、または図２のＮＢ／ＭＣＨ２０２において見られるようなキャッシュであってよい。

当業者は、図１および２に示されているハードウェアが実装に応じて変わってよいということを、理解するであろう。フラッシュ・メモリ、同等の不揮発性メモリ、または光ディスク・ドライブなどの、その他の内部ハードウェアまたは周辺機器が、図１および２に示されているハードウェアに加えて、またはそれらのハードウェアの代わりに、使用されてよい。また、実施形態例のプロセスは、本発明の範囲から逸脱することなく、前述したＳＭＰシステム以外のマルチプロセッサ・データ処理システムに適用されてよい。

さらに、データ処理システム２００は、クライアント・コンピューティング・デバイス、サーバ・コンピューティング・デバイス、タブレット・コンピュータ、ラップトップ・コンピュータ、電話またはその他の通信デバイス、パーソナル・デジタル・アシスタント（ＰＤＡ：personal digital assistant）などを含む、複数の異なるデータ処理システムのいずれかの形態を取ってよい。一部の例では、データ処理システム２００は、例えばオペレーティング・システム・ファイルまたはユーザによって生成されたデータあるいはその両方を格納するために、不揮発性メモリを提供するようにフラッシュ・メモリを使用して構成された、ポータブル・コンピューティング・デバイスであってよい。基本的に、データ処理システム２００は、アーキテクチャの制限なしで、任意の既知のデータ処理システムまたは今後開発されるデータ処理システムであってよい。

図３は、一実施形態例に従って認知システムの要素の相互作用を示す例示的な図である。図３の例示的な図は、図１で説明された認知システム１００などの認知システムであってよい認知システム３００の実装を示しており、認知システム３００は、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、認知システム１００などの認知システムによって利用される深層学習に基づくアルゴリズムの動作をトレーニングすることによって、人工知能に基づく医療ソリューションを開発するための患者のシミュレーションを実装するように構成されている。この場合も、深層学習に基づくアルゴリズムは、機械学習の一例にすぎない。人工的患者１３６に関連付けられた患者データ・セットおよび現実の患者１３４に関連付けられた患者データ・セットは、本発明の範囲から逸脱することなく、任意の機械学習に基づくシステム（例えば、ニューラル・ネットワーク、サポート・ベクター・マシン、決定木、分類器の連携（例えば、ランダム・フォレスト）などの、さまざまな分類器）をトレーニングするために使用されてもよい。ただし、この図は単に例示的な実装であり、認知システム１００の他の実施形態では、本発明の範囲から逸脱することなく、人工知能に基づく医療ソリューションを開発するための患者のその他のシミュレーションが実装されてよいということが、理解されるべきである。

図３に示されているように、認知システム３００は、回答される臨床的質問３３０の方法で、ネットワーク３０２を介して１つまたは複数のコンピューティング・デバイス３０４から入力データを受信する。本明細書では、実施形態例に従って、認知システム３００は、認知人工知能トレーニング・メカニズム３２０を含むように拡張される。認知人工知能トレーニング・メカニズム３２０は、図１の対応する要素１２２〜１２８に関して前述した方法と同様の方法で動作する、非画像に基づく情報摂動エンジン３２２、医用画像摂動エンジン３２４、人工的患者組み立てエンジン３２６、およびトレーニング・エンジン３２８を備えている。

認知人工知能トレーニング・メカニズム３２０は、特定の患者が特定の病気（肺癌、乳癌、鬱血性心不全、ポリープなど）を有しているかどうかに関して照会をポストする将来の医療専門家などの、回答される臨床的質問３３０の予想に基づいて動作する。以下では、認知人工知能トレーニング・メカニズム３２０の動作の一例として肺癌を利用するが、実施形態例はこの病気のみに限定されない。前述したように、認知システム３００は、肺癌の肯定的指示または否定的指示を正確に提供するための十分な患者データを有していないことがある人工知能システムであってよい。したがって、回答される臨床的質問３３０を処理する前に、非画像に基づく情報摂動エンジン３２２は、人工的患者をシミュレートするために必要な要件３３２と、肺癌に関して検査されている、肯定的な肺癌の診断または否定的な肺癌の診断のいずれかを有する現実の患者３３４に関連付けられた患者データ・セットとを識別する。すなわち、医療専門家が回答を求めている臨床的質問と同じ臨床的質問が、認知システム１００をトレーニングするために使用され、トレーニングの完了後に、認知システム１００が、「将来の」未見の患者の同じ臨床的質問に回答する。

１つの実施形態では、非画像に基づく情報摂動エンジン３２２は、人工的患者の非画像に基づく情報を生成するために、人工的患者をシミュレートするために必要な要件３３２、および現実の患者３３４に関連付けられた患者データ・セットからの現実の患者に関連付けられた非画像に基づく情報を利用して、非画像に基づく情報に摂動を与える。例えば、非画像に基づく情報摂動エンジン３２２は、喫煙歴、その他の病気、家族歴、年齢、肥満度指数、医療履歴、実験結果、放射線医学およびその他の報告などの、構造化された非画像に基づく情報または構造化されていない非画像に基づく情報あるいはその両方に対して１つまたは複数の変更を行い、１人または複数の人工的患者に関する摂動を与えられた非画像に基づく情報を生成する。非画像に基づく情報摂動エンジン３２２によって摂動を与えられた非画像に基づく情報を有する現実の患者ごとに、その後、医用画像摂動エンジン３２４が、現実の患者３３４に関連付けられた患者データ・セットからの１つまたは複数の関連する医用画像および関連する摂動を与えられた非画像に基づく情報を利用して、１つまたは複数の関連する医用画像に摂動を与え、１つまたは複数の摂動を与えられた医用画像を生成する。

別の実施形態では、医用画像摂動エンジン３２４が、現実の患者３３４に関連付けられた患者データ・セットからの１つまたは複数の医用画像に摂動を与えて、１つまたは複数の摂動を与えられた医用画像を生成し、その後、非画像に基づく情報摂動エンジン３２２が、現実の患者３３４に関連付けられた患者データ・セットからの現実の患者に関連付けられた非画像に基づく情報に摂動を与えて、人工的患者の非画像に基づく情報を生成する。さらに別の実施形態では、医用画像摂動エンジン３２４が、現実の患者３３４に関連付けられた患者データ・セットからの１つまたは複数の医用画像に摂動を与え、実質的にそれと同時に、非画像に基づく情報摂動エンジン３２２が、現実の患者３３４に関連付けられた患者データ・セットからの現実の患者に関連付けられた非画像に基づく情報に摂動を与えて、人工的患者の１つまたは複数の摂動を与えられた医用画像および関連する非画像に基づく情報をそれぞれ生成する。さらに別の実施形態では、非画像に基づく情報摂動エンジン１２２が人工的患者の非画像に基づく情報を生成するために、非画像に基づく情報に摂動を与えるが、しかし現実の患者からの実際の医用画像が利用される。すなわち、例えば、現実の患者の電子医療記録は肺癌の家族歴がないことを示しているが、非画像に基づく情報摂動エンジン１２２が、その現実の患者の摂動を与えられていない医用画像に関連付けて、患者の父親が肺癌を有しているようにその現実の患者の上記電子医療記録を使用して人工的患者を生成する。

医用画像摂動エンジン３２４によって実行された摂動は、肯定的に診断された患者と否定的に診断された患者の両方の患者データに対して作用してよい。すなわち、非画像に基づく情報摂動エンジン３２２および医用画像摂動エンジン３２４は、肯定的患者の医用画像から悪性肺結節または悪性肺腫瘤をコピーして、否定的患者からの画像に貼り付け、この画像が肯定的患者からの画像であるかのように見えるようにしてよい。このようにすることは、非画像に基づく情報エンジン３２２が、付随する放射線医学的報告内のテキストを、結節が見つからないことを示す状態から、貼り付けられた結節の存在および位置を示す新しい状態に変更することを含むこともできる。同じことを、コンピュータ断層撮影（ＣＴ）スキャン、磁気共鳴断層撮影（ＭＲＩ）スキャン、超音波（Ｕ／Ｓ）スキャン、陽電子放射断層撮影（ＰＥＴ）スキャン、Ｘ線スキャンなどの異なる画像診断法を使用して、乳癌の乳房病変、または肝臓癌もしくは結腸癌に対して行うことができる。肯定的患者に対して逆の動作が実行されてよく、その場合、肺結節または肺腫瘤が医用画像から削除され、付随する放射線医学的報告内のテキストが、結節が見つかったことを示す状態から、結節が存在しないことを示す新しい状態に変更される。

したがって、非画像に基づく情報摂動エンジン３２２および医用画像摂動エンジン３２４の目標は、現実の患者の非画像に基づく情報および医用画像を受け取り、２種類の患者を区別するように深層学習に基づくアルゴリズムの動作をトレーニングするその後の機械学習の試みにおいて使用できるほど十分に現実的な非画像に基づく情報および医用画像を有する新しい人工的患者を生成することである。深層学習に基づくアルゴリズムは、機械学習の一例にすぎない。人工的患者１３６に関連付けられた患者データ・セットおよび現実の患者１３４に関連付けられた患者データ・セットは、本発明の範囲から逸脱することなく、任意の機械学習に基づくシステム（例えば、ニューラル・ネットワーク、サポート・ベクター・マシン、決定木、分類器の連携（例えば、ランダム・フォレスト）などの、さまざまな分類器）をトレーニングするために使用されてもよい。したがって、特定の現実の患者の場合、人工的患者組み立てエンジン３２６が、非画像に基づく情報摂動エンジン３２２によって摂動を与えられた、摂動を与えられた非画像に基づく情報、および医用画像摂動エンジン３２４によって摂動を与えられた、関連する摂動を与えられた１つまたは複数の医用画像を利用して、人工的患者３３６に関連付けられた患者データ・セットを組み立てる。

したがって、人工的患者組み立てエンジン３２６は、人工的患者ごとに、肺癌に関して肯定的に診断されていること、または肺癌に関して否定的に診断されていることを表す人工的患者の人工的患者データ３３６を生成する。トレーニング・エンジン３２８は、肯定的に診断された人工的患者３３６と否定的に診断された人工的患者３３６の両方に関連付けられた患者データ・セット、および肯定的に診断された現実の患者３３４と否定的に診断された現実の患者３３４の両方に関連付けられた患者データ・セットを利用して、２種類の患者および任意選択的に現実の患者と人工的患者を区別するように、認知システム３００によって実行されるアルゴリズムの動作をトレーニングする。トレーニング・エンジン３２８は、人工的患者３３６に関連付けられた患者データ・セットからの画像のうちの１つ、または現実の患者３３４に関連付けられた患者データ・セットからの画像のうちの１つのいずれかを取り込み、画像が、（１）現実の肯定的非画像に基づく情報および医用画像、（２）現実の否定的非画像に基づく情報および医用画像、（３）人工的な肯定的非画像に基づく情報および医用画像、または（４）人工的な否定的非画像に基づく情報および医用画像のいずれであるかを予測しようと試みる。

トレーニング・エンジン３２８は、特殊な敵対的損失関数を利用して、この目標が達成される範囲を定量化し、非画像に基づく情報摂動エンジン３２２、医用画像摂動エンジン３２４、および人工的患者組み立てエンジン３２６への逆伝搬の更新を駆動する。すなわち、１つの実施形態では、トレーニング・エンジン３２８は、将来の変更がより正確な非画像に基づく情報の変更および医用画像の変更を提供し、それによって、深層学習に基づくアルゴリズムの動作の効率および精度を向上させるように、非画像に基づく情報摂動エンジン３２２および医用画像摂動エンジン３２４によって行われる非画像に基づく情報の変更および医用画像の変更に関連付けられた重みをそれぞれ調整する。したがって、トレーニング・エンジン３２８の逆伝搬は、非画像に基づく情報摂動エンジン３２２および医用画像摂動エンジン３２４が、深層学習に基づくアルゴリズムのトレーニングにおいて使用される可能性がより高い非画像に基づく情報および医用画像を生成するように、重みを調整する。実施形態例は、トレーニング・エンジン３２８が、本発明の範囲から逸脱することなく、他の方法で、目標が達成される範囲を定量化し、非画像に基づく情報摂動エンジン３２２、医用画像摂動エンジン３２４、および人工的患者組み立てエンジン３２６への逆伝搬の更新を駆動してよいということを認識している。

本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであってよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいるコンピュータ可読記憶媒体を含んでよい。

コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組み合わせであってよいが、これらに限定されない。コンピュータ可読ストレージ媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ：random access memory）、読み取り専用メモリ（ＲＯＭ：read-only memory）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ：erasable programmable read-only memoryまたはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ：static random access memory）、ポータブル・コンパクト・ディスク読み取り専用メモリ（ＣＤ−ＲＯＭ：compact disc read-only memory）、デジタル多用途ディスク（ＤＶＤ：digital versatile disk）、メモリ・スティック、フロッピー（登録商標）・ディスク、パンチカードまたは命令が記録されている溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組み合わせを含む。本明細書において使用されるとき、コンピュータ可読ストレージ媒体は、それ自体が、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波（例えば、光ファイバ・ケーブルを通過する光パルス）、あるいはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。

本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から各コンピューティング・デバイス／処理デバイスへ、またはネットワーク（例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組み合わせ）を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされ得る。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを備えてよい。各コンピューティング・デバイス／処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス／処理デバイス内のコンピュータ可読ストレージ媒体に格納するために転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ：instruction-set-architecture）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、あるいは、Ｊａｖａ（登録商標）、Ｓｍａｌｌｔａｌｋ（登録商標）、Ｃ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む１つまたは複数のプログラミング言語の任意の組み合わせで記述されたソース・コードまたはオブジェクト・コードであってよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ：wide area network）を含む任意の種類のネットワークを介してユーザのコンピュータに接続されてよく、または接続は、（例えば、インターネット・サービス・プロバイダを使用してインターネットを介して）外部コンピュータに対して行われてよい。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ（ＦＰＧＡ：field-programmable gate arrays）、またはプログラマブル・ロジック・アレイ（ＰＬＡ：programmable logic arrays）を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路をカスタマイズするためのコンピュータ可読プログラム命令を実行してよい。

本発明の態様は、本明細書において、本発明の実施形態に従って、方法、装置（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組み合わせが、コンピュータ可読プログラム命令によって実装され得るということが理解されるであろう。

これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読ストレージ媒体がフローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作の態様を実施する命令を含んでいる製品を備えるように、コンピュータ可読ストレージ媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組み合わせに特定の方式で機能するように指示できるものであってもよい。

コンピュータ可読プログラム命令は、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作を実施するように、コンピュータ実装プロセスを生成するために、コンピュータ、その他のプログラム可能なデータ処理装置、またはその他のデバイスに読み込まれ、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で一連の動作可能なステップを実行させるものであってもよい。

図４は、実施形態例に従って、データ処理システム内で人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施することにおいて、認知システムによって実行される動作の例示的なフローチャートを示している。動作が開始すると、認知人工知能トレーニング・メカニズムが、回答される臨床的質問の予想に関して入力データを受信する（ステップ４０２）。認知人工知能トレーニング・メカニズムは、人工的患者をシミュレートするために必要な要件と、肺癌に関して検査されている、肯定的な肺癌の診断または否定的な肺癌の診断のいずれかを有する現実の患者に関連付けられた患者データ・セットとを識別する（ステップ４０４）。

認知人工知能トレーニング・メカニズムは、人工的患者の摂動を与えられた非画像に基づく情報を生成するために、人工的患者をシミュレートするために必要な要件、および現実の患者に関連付けられた患者データ・セットからの現実の患者に関連付けられた非画像に基づく情報を利用して、非画像に基づく情報に摂動を与える（ステップ４０６）。認知人工知能トレーニング・メカニズムは、１つまたは複数の摂動を与えられた医用画像を生成するために、人工的患者をシミュレートするために必要な要件、および現実の患者に関連付けられた患者データ・セットからの１つまたは複数の関連する医用画像を利用して、１つまたは複数の関連する医用画像に摂動を与える（ステップ４０８）。ステップ４０６および４０８が、実質的に同時に、または１つのステップが他のステップの後に続くように、動作してよいということに、注意するべきである。すなわち、１つのステップが他のステップの後に続く場合、認知人工知能トレーニング・メカニズムは、人工的患者の摂動を与えられた医用画像を利用して現実の患者の非画像に基づく情報に摂動を与え、人工的患者の摂動を与えられた非画像に基づく情報を生成してよい。代替として、認知人工知能トレーニング・メカニズムは、人工的患者の摂動を与えられた非画像に基づく情報を利用して現実の患者の１つまたは複数の関連する医用画像に摂動を与え、人工的患者の１つまたは複数の摂動を与えられた医用画像を生成してよい。

次に、認知人工知能トレーニング・メカニズムが、非画像に基づく情報摂動エンジンによって摂動を与えられた、摂動を与えられた非画像に基づく情報、および医用画像摂動エンジンによって摂動を与えられた、関連する摂動を与えられた１つまたは複数の医用画像を利用して、人工的患者に関連付けられた患者データ・セットを組み立てる（ステップ４１０）。この時点から、認知人工知能トレーニング・メカニズムは、将来の変更がより正確な非画像に基づく情報の変更および医用画像の変更を提供するように、逆伝搬を実行して、現実の患者の非画像に基づく情報に摂動を与える方法、および現実の患者の医用画像に摂動を与える方法を更新してよい（ステップ４１２）。さらに、認知人工知能トレーニング・メカニズムは、現実の患者データ・セットと生成された人工的患者データ・セットの両方を利用して、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングする（ステップ４１４）。その後、動作が終了する。

図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態に従って、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための１つまたは複数の実行可能な命令を備える、命令のモジュール、セグメント、または部分を表してよい。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生してよい。例えば、連続して示された２つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によっては逆の順序で実行されてよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組み合わせは、規定された機能または動作を実行するか、または専用ハードウェアとコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実装され得るということにも注意する。

したがって、実施形態例は、人工知能に基づく医療ソリューションを開発するために患者をシミュレートするメカニズムを提供する。これらのメカニズムは、患者情報に対して動作する人工知能システムをトレーニングする目的で、患者を表すデータセットを拡張する。これらのメカニズムは、許容できる信頼性を有する現実の患者のセットの情報および医用画像の患者データ・セットから開始する。このシステムは、患者データ・セット内の現実の患者の情報および医用画像内で摂動を生成し、現実の患者および現実の患者から得られた人工的患者の両方に関する情報および医用画像を含む、より大きい患者データ・セットを生成する。人工的患者に関連付けられた患者データ・セットの一部を生成するために、これらのメカニズムは、現実の患者の情報に摂動を与えて人工的患者の情報を生成し、医用画像に摂動を与えて、摂動が与えられた患者情報と一致する人工的医用画像を生成し、人工的患者の情報および関連付けられた人工的医用画像を含めて患者データ・セットを拡張する。その後、現実の患者および現実の患者を表す人工的患者の両方に関する情報を含むより大きい患者データ・セットが、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングするために利用される。

前述したように、実施形態例が、完全にハードウェアである実施形態、完全にソフトウェアである実施形態、またはハードウェアとソフトウェアの両方の要素を含んでいる実施形態の形態を取ってよいということが、理解されるべきである。１つの実施形態例では、実施形態例のメカニズムは、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むが、これらに限定されない、ソフトウェアまたはプログラム・コードにおいて実装される。

プログラム・コードの格納または実行あるいはその両方を行うのに適したデータ処理システムは、例えばシステム・バスなどの通信バスを介して直接的または間接的にメモリ素子に結合された、少なくとも１つのプロセッサを含む。メモリ素子は、プログラム・コードの実際の実行時に使用されるローカル・メモリと、バルク・ストレージと、実行時にバルク・ストレージからコードが取得されなければならない回数を減らすために少なくとも一部のプログラム・コードを一時的に格納するキャッシュ・メモリとを、含むことができる。メモリは、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＤＲＡＭ、ＳＲＡＭ、フラッシュ・メモリ、半導体メモリなどを含むが、これらに限定されない、さまざまな種類であってよい。

入出力デバイスまたはＩ／Ｏデバイス（キーボード、ディスプレイ、ポインティング・デバイスなどを含むが、これらに限定されない）は、直接的に、あるいは介在する有線もしくは無線Ｉ／Ｏインターフェイスもしくはコントローラまたはその両方などを介して、システムに結合され得る。Ｉ／Ｏデバイスは、従来のキーボード、ディスプレイ、ポインティング・デバイスなど以外の、例えば、スマートフォン、タブレット・コンピュータ、タッチ・スクリーン・デバイス、音声認識デバイスなどを含むが、これらに限定されない、有線または無線接続を介して結合された通信デバイスなどの、多くの異なる形態を取ってよい。任意の既知のＩ／Ｏデバイスまたは今後開発されるＩ／Ｏデバイスが、実施形態例の範囲に含まれるよう意図されている。

ネットワーク・アダプタがシステムに結合され、介在するプライベート・ネットワークまたはパブリック・ネットワークを通じて、データ処理システムを、他のデータ処理システムまたはリモート・プリンタまたはストレージ・デバイスに結合できるようにしてもよい。モデム、ケーブル・モデム、およびイーサネット（登録商標）・カードは、有線通信に現在使用可能なネットワーク・アダプタのうちの、ごくわずかの種類にすぎない。８０２．１１ａ／ｂ／ｇ／ｎ無線通信アダプタ、Ｂｌｕｅｔｏｏｔｈ無線アダプタなどを含むが、これらに限定されない、無線通信に基づくネットワーク・アダプタが利用されてもよい。任意の既知のネットワーク・アダプタまたは今後開発されるネットワーク・アダプタが、本発明の範囲に含まれるよう意図されている。

本発明の説明は、例示および説明の目的で提示されており、網羅的であることは意図されておらず、開示された形態での発明に制限されない。記載された実施形態の範囲および思想を逸脱することなく多くの変更および変形が、当業者にとって明らかであろう。本発明の原理、実際的な適用を最も適切に説明するため、およびその他の当業者が、企図された特定の用途に適するようなさまざまな変更を伴う多様な実施形態に関して、本発明を理解できるようにするために、実施形態が選択されて説明された。本明細書で使用された用語は、実施形態の原理、実際の適用、または市場で見られる技術を超える技術的改良を最も適切に説明するため、または他の当業者が本明細書で開示された実施形態を理解できるようにするために選択されている。

人工知能に基づくシステムをトレーニングするための十分に大きいデータセットを取得することは、重要な問題である。そのような大きいデータセットの生成は、非常に多くのリソースを消費するプロセスになる傾向があり、実行するために、対象の専門家の大量の時間を必要とする。さらに、そのようなプロセスは、手動プロセスになる傾向があり、誤りが発生しやすい手動プロセスの性質の影響を受ける。

実施形態例は、人工知能に基づく医療ソリューションを開発するために患者をシミュレートするメカニズムを提供する。すなわち、これらのメカニズムは、患者情報に対して動作する人工知能システムをトレーニングする目的で、患者を表すデータセットを拡張する。これらのメカニズムは、許容できる信頼性を有する現実の患者のセットの情報および医用画像の患者データ・セットから開始する。本発明によれば、許容できるとは、標準的な病院における標準的治療に適合すると認識される技術、人員、および手順を使用して情報および医用画像が生成されるということを意味する。このシステムは、患者データ・セット内の現実の患者の情報および医用画像内で摂動を生成し、現実の患者および現実の患者から得られた人工的患者の両方に関する情報および医用画像を含む、より大きい患者データ・セットを生成する。人工的患者に関連付けられた患者データ・セットの一部を生成するために、これらのメカニズムは、現実の患者の情報に摂動を与えて人工的患者の情報を生成し、医用画像に摂動を与えて、摂動が与えられた患者情報と一致する人工的医用画像を生成し、人工的患者の情報および関連付けられた人工的医用画像を含めて患者データ・セットを拡張する。その後、現実の患者および現実の患者を表す人工的患者の両方に関する情報を含むより大きい患者データ・セットが、その他の方法で可能になるであろう動作よりも効率的かつ正確に動作し、深層学習に基づくアルゴリズムが未見の患者集団の要件に従って動作することを保証するように、深層学習に基づくアルゴリズムの動作をトレーニングするために利用される。

実施形態例のさまざまな態様のさらに詳細な説明を開始する前に、この説明全体にわたって、「メカニズム」という用語が、さまざまな動作、機能などを実行する本発明の要素を指すために使用されるということが、最初に理解されるべきである。「メカニズム」は、この用語が本明細書において使用されるとき、装置、手順、またはコンピュータ・プログラム製品の形態での、実施形態例の機能または態様の実装であってよい。手順の場合、手順は、１つまたは複数のデバイス、装置、コンピュータ、データ処理システムなどによって実装される。コンピュータ・プログラム製品の場合、特定の「メカニズム」に関連付けられた機能を実装するため、または特定の「メカニズム」に関連付けられた動作を実行するために、コンピュータ・プログラム製品内またはコンピュータ・プログラム製品上で具現化されたコンピュータ・コードまたは命令によって表された論理が、１つまたは複数のハードウェア・デバイスによって実行される。したがって、本明細書に記載されたメカニズムは、特殊なハードウェア、汎用ハードウェア上で実行されるソフトウェア、命令が特殊なハードウェアまたは汎用ハードウェアによって容易に実行可能になるように媒体に格納されたソフトウェア命令、機能を実行するための手順または方法、あるいはこれらのいずれかの組み合わせとして実装されてよい。本説明および特許請求の範囲では、実施形態例の特定の特徴および要素に関して、「１つの」、「〜のうちの少なくとも１つ」、および「〜のうちの１つまたは複数」という用語を使用することがある。これらの用語および語句が、特定の実施形態例に存在する特定の特徴または要素のうちの少なくとも１つが存在するが、２つ以上が存在する可能性もあるということを述べるよう意図されているということが、理解されるべきである。すなわち、これらの用語／語句は、説明または特許請求の範囲を、存在している単一の特徴／要素に制限するよう意図されておらず、そのような特徴／要素が複数存在することを必要とするよう意図されていない。反対に、これらの用語／語句は、少なくとも単一の特徴／要素のみを必要とし、そのような特徴／要素は、説明および特許請求の範囲内に複数存在する可能性がある。

Claims

方法であって、
少なくとも１つのプロセッサおよび少なくとも１つのメモリを備えている認知データ処理システムにおいて、前記少なくとも１つのメモリが命令を含んでおり、前記命令が、前記少なくとも１つのプロセッサによって実行されて、前記少なくとも１つのプロセッサに、人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施させ、前記認知人工知能トレーニング・メカニズムが、
前記認知人工知能トレーニング・メカニズムの非画像に基づく情報摂動エンジンによって、現実の患者データ・セットからの現実の患者の非画像に基づく情報に摂動を与えて、摂動を与えられた非画像に基づく情報を形成することと、
前記認知人工知能トレーニング・メカニズムの人工的患者組み立てエンジンによって、前記摂動を与えられた非画像に基づく情報および前記現実の患者の摂動を与えられていない医用画像を使用して人工的患者データ・セット内の人工的患者データを生成することと、
前記認知人工知能トレーニング・メカニズムのトレーニング・エンジンによって、前記現実の患者データ・セット内の現実の患者データおよび前記人工的患者データ・セット内の前記人工的患者データを使用して、前記認知データ処理システムによって利用される学習アルゴリズムの動作をトレーニングすることと
を実行するように動作する、方法。
前記認知人工知能トレーニング・メカニズムの医用画像摂動エンジンによって、前記現実の患者データ・セットからの前記現実の患者の医用画像に摂動を与えて、摂動を与えられた医用画像を形成することであって、前記摂動を与えられた非画像に基づく情報を使用して前記現実の患者データ・セットからの前記現実の患者の前記医用画像に摂動が与えられる、前記形成することと、
前記認知人工知能トレーニング・メカニズムの前記人工的患者組み立てエンジンによって、前記摂動を与えられた非画像に基づく情報および前記現実の患者の前記摂動を与えられた医用画像を使用して前記人工的患者データ・セット内の前記人工的患者データを生成することと、
前記認知人工知能トレーニング・メカニズムの前記トレーニング・エンジンによって、前記現実の患者データ・セット内の前記現実の患者データおよび前記人工的患者データ・セット内の前記人工的患者データを使用して、前記認知データ処理システムによって利用される前記学習アルゴリズムの前記動作をトレーニングすることと
をさらに含んでいる、請求項１に記載の方法。
前記摂動を与えられた医用画像を使用して前記現実の患者データ・セットからの前記現実の患者の前記非画像に基づく情報に摂動が与えられる、請求項２に記載の方法。
前記現実の患者の前記非画像に基づく情報に前記摂動を与えること、および前記現実の患者の前記医用画像に前記摂動を与えることが、人工的患者をシミュレートするために必要な一連の要件に基づく、請求項２または３に記載の方法。
前記現実の患者データ・セットが、病気に関して検査されている、前記病気の肯定的診断または前記病気の否定的診断のいずれかを有する現実の患者を含んでいる、請求項１ないし４のいずれかに記載の方法。
前記現実の患者の前記非画像に基づく情報に前記摂動を与えること、および前記現実の患者の前記医用画像に前記摂動を与えることが、
前記摂動を与えられた非画像に基づく情報および前記摂動を与えられた医用画像が、前記患者が病気の肯定的診断を有していることを示すように、前記病気の否定的診断を有する前記現実の患者の前記非画像に基づく情報および前記医用画像を変更することを含んでいる、請求項２ないし５のいずれかに記載の方法。
前記現実の患者の前記非画像に基づく情報に前記摂動を与えること、および前記現実の患者の前記医用画像に前記摂動を与えることが、
前記摂動を与えられた非画像に基づく情報および前記摂動を与えられた医用画像が、前記患者が病気の否定的診断を有していることを示すように、前記病気の肯定的診断を有する前記現実の患者の前記非画像に基づく情報および前記医用画像を変更することを含んでいる、請求項２ないし６のいずれかに記載の方法。
将来の非画像に基づく情報の変更および前記医用画像の変更の精度を向上させるために、他の現実の患者の非画像に基づく情報および医用画像に対する摂動がさらに変更されるように、前記トレーニング・エンジンによって更新の逆伝搬を実行することをさらに含んでいる、請求項１ないし７のいずれかに記載の方法。
人工知能に基づく医療ソリューションを開発するために患者をシミュレートするコンピュータ・プログラム製品であって、
処理回路によって読み取り可能な、請求項１ないし８のいずれかに記載の方法を実行するために前記処理回路によって実行されるための命令を格納しているコンピュータ可読ストレージ媒体を備えている、コンピュータ・プログラム製品。
コンピュータ可読媒体に格納された、デジタル・コンピュータの内部メモリに読み込み可能なコンピュータ・プログラムであって、前記プログラムがコンピュータ上で実行された場合に請求項１ないし８のいずれかに記載の方法を実行するためのソフトウェア・コード部分を含んでいる、コンピュータ・プログラム。
装置であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに結合された少なくとも１つのメモリと
を備えており、前記少なくとも１つのメモリが命令を含んでおり、前記命令が、前記少なくとも１つのプロセッサによって実行された場合に、前記少なくとも１つのプロセッサに、人工知能に基づく医療ソリューションを開発するために患者をシミュレートする認知人工知能トレーニング・メカニズムを実施させ、前記少なくとも１つのプロセッサに、
前記認知人工知能トレーニング・メカニズムの非画像に基づく情報摂動エンジンによって、現実の患者データ・セットからの現実の患者の非画像に基づく情報に摂動を与えて、摂動を与えられた非画像に基づく情報を形成することと、
前記認知人工知能トレーニング・メカニズムの人工的患者組み立てエンジンによって、前記摂動を与えられた非画像に基づく情報および前記現実の患者の摂動を与えられていない医用画像を使用して人工的患者データ・セット内の人工的患者データを生成することと、
前記認知人工知能トレーニング・メカニズムのトレーニング・エンジンによって、前記現実の患者データ・セット内の現実の患者データおよび前記人工的患者データ・セット内の前記人工的患者データを使用して、前記認知データ処理システムによって利用される学習アルゴリズムの動作をトレーニングすることと
をさらに実行させる、装置。
前記命令が、前記少なくとも１つのプロセッサに、
前記認知人工知能トレーニング・メカニズムの医用画像摂動エンジンによって、前記現実の患者データ・セットからの前記現実の患者の医用画像に摂動を与えて、摂動を与えられた医用画像を形成することであって、前記摂動を与えられた非画像に基づく情報を使用して前記現実の患者データ・セットからの前記現実の患者の前記医用画像に摂動が与えられる、前記形成することと、
前記認知人工知能トレーニング・メカニズムの前記人工的患者組み立てエンジンによって、前記摂動を与えられた非画像に基づく情報および前記現実の患者の前記摂動を与えられた医用画像を使用して前記人工的患者データ・セット内の前記人工的患者データを生成することと、
前記認知人工知能トレーニング・メカニズムの前記トレーニング・エンジンによって、前記現実の患者データ・セット内の前記現実の患者データおよび前記人工的患者データ・セット内の前記人工的患者データを使用して、前記認知データ処理システムによって利用される前記学習アルゴリズムの前記動作をトレーニングすることと
をさらに実行させる、請求項１１に記載の装置。
前記摂動を与えられた医用画像を使用して前記現実の患者データ・セットからの前記現実の患者の前記非画像に基づく情報に摂動が与えられる、請求項１１に記載の装置。
前記現実の患者の前記非画像に基づく情報に前記摂動を与えること、および前記現実の患者の前記医用画像に前記摂動を与えることが、人工的患者をシミュレートするために必要な一連の要件に基づく、請求項１３に記載の装置。