JP2023509976A

JP2023509976A - リアルタイム放射線医学を行うための方法およびシステム

Info

Publication number: JP2023509976A
Application number: JP2022542426A
Authority: JP
Inventors: スー，ジェイソン; マトゥール，ラケシュ; モンバーケット，ブレント; マシューズ，トーマス
Original assignee: ホワイトラビット・エーアイ・インコーポレイテッド
Priority date: 2020-01-09
Filing date: 2021-01-08
Publication date: 2023-03-10
Also published as: WO2021142209A1; US20230005151A1; EP4088282A4; EP4088282A1; CA3164331A1

Abstract

本開示は、リアルタイムおよび／またはＡＩ支援の放射線医学を実施することを対象とする方法およびシステムを提供する。被検者の身体の部位の画像を処理するための方法は、（ａ）被検者の身体の部位の画像を取得するステップと、（ｂ）訓練済アルゴリズムを使用して、画像またはその導出物を、複数のカテゴリのうちの１つのカテゴリに分類するステップであって、分類するステップが、画像処理アルゴリズムを適用するステップを含む、分類するステップと、（ｃ）画像が複数のカテゴリのうちの第１のカテゴリに分類されると、画像を、放射線医学的評価のために第１の放射線科医に送るステップ、または（ｉｉ）画像が複数のカテゴリのうちの第２のカテゴリに分類されると、画像を、放射線医学的評価のために第２の放射線科医に送るステップ、および（ｄ）放射線医学的分析に少なくとも部分的に基づいて被検者を診察するために、第１の放射線科医または第２の放射線科医から推奨を受け取るステップとを含んでもよい。

Description

相互参照
[001]本出願は、２０２０年１月９日に提出された米国仮特許出願第６２／９５８，８５９号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。

[002]乳癌は、米国の女性に最も広くみられるがんであり、２０１７年だけで２５万を超える新規の診断があった。約８人に１人の女性が、その生涯の何らかの時点で乳癌であると診断される。処置の改善に関わらず、米国では４万人を超える女性が毎年乳癌により死亡する。スクリーニングマンモグラフィの広い受診によりある程度、乳癌死亡率の低下に大きな進歩があった。乳癌のスクリーニングは、後期がんと比較して予後がずっと良好であり、処置コストが低い早期がんを識別するのを助けることが可能である。この差は非常に重要な可能性がある：限局的な乳癌のある女性は９９％近い５年生存率を有するが、転移性の乳癌のある女性の５年生存率は２７％である。

[003]このように立証されたベネフィットに関わらず、スクリーニングマンモグラフィの受診率は、予約取得の長い遅れ、不明確な価格設定、診察結果を受け取る長い待ち時間、紛らわしいレポートなど、一部患者経験の貧しさにより妨げられる。さらには、価格設定の透明性の欠如から生じる問題は、医療機関同士のコストの大きなバラつきによってひどくなる。同様に、診察結果を受け取るための伝達時間は、医療機関同士で一貫性がない。加えて、放射線科医のパフォーマンスの著しいバラつきにより、患者は場所と収入に応じて非常に様々なケアの基準を経験することになる。

[004]本開示は、人工知能を使用して、医学的画像データをさらなるスクリーニングおよび／または診断評価のために個別の放射線医学的ワークフローに階層化することによって、被検者の放射線医学的評価を行うための方法およびシステムを提供する。そのような被検者は、疾患（例えば、がん）を有する被検者および疾患（例えば、がん）のない被検者を含み得る。スクリーニングは、例えば乳癌などのがんに向けたものであってもよい。階層化は、疾患関連の評価または他の評価（例えば、事例の推定される難しさ）に基づいて行われてもよい。

[005]一態様では、本開示は、（ａ）被検者の身体の部位の少なくとも１つの画像を取得するステップと、（ｂ）訓練済アルゴリズムを使用して、少なくとも１つの画像またはその導出物を、複数のカテゴリのうちの１つのカテゴリに分類するステップであって、分類するステップが、画像処理アルゴリズムを少なくとも１つの画像またはその導出物に適用するステップを含む、分類するステップと、（ｃ）（ｂ）において少なくとも１つの画像またはその導出物を分類すると、（ｉ）少なくとも１つの画像が複数のカテゴリのうちの第１のカテゴリに分類されると、少なくとも１つの画像またはその導出物を、放射線医学的評価のために第１の放射線科医に送るステップ、または（ｉｉ）少なくとも１つの画像が複数のカテゴリのうちの第２のカテゴリに分類されると、少なくとも１つの画像またはその導出物を、放射線医学的評価のために第２の放射線科医に送るステップ、および（ｄ）少なくとも１つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、第１の放射線科医または第２の放射線科医から被検者の放射線医学的評価を受け取るステップを含む、被検者の身体の部位の少なくとも１つの画像を処理するための方法を提供する。

[006]いくつかの実施形態では、（ｂ）は、少なくとも１つの画像またはその導出物を、正常、曖昧、または疑わしいとして分類するステップを含む。いくつかの実施形態では、方法は、少なくとも１つの画像またはその導出物を、少なくとも１つの画像またはその導出物の（ｂ）における分類に基づいて分類器に送るステップをさらに含む。いくつかの実施形態では、（ｃ）は、少なくとも１つの画像またはその導出物を、放射線医学的評価のために、第１の複数の放射線科医のうちの第１の放射線科医、または第２の複数の放射線科医のうちの第２の放射線科医に送るステップを含む。いくつかの実施形態では、少なくとも１つの画像またはその導出物は、医学的画像である。

[007]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の感度で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の特異性で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の陽性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の陰性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。

[008]いくつかの実施形態では、訓練済機械学習アルゴリズムは、異常な組織を含むか、異常な組織を含むと疑われる、少なくとも１つの画像またはその導出物の少なくとも１つの領域を識別するように構成される。

[009]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、がんを示すために、正常、曖昧、または疑わしいとして分類する。いくつかの実施形態では、がんは乳癌である。いくつかの実施形態では、少なくとも１つの画像またはその導出物は、被検者の乳房の三次元画像である。いくつかの実施形態では、訓練済機械学習アルゴリズムは、がんを示すか、がんを示すと疑われる画像を含む少なくとも約１００の独立的な訓練サンプルを使用して訓練される。

[010]いくつかの実施形態では、訓練済アルゴリズムは、がんを示すか、がんを示すと疑われる陽性画像を含む第１の複数の独立的な訓練サンプル、およびがんを示さないか、がんを示すと疑われない陰性画像を含む第２の複数の独立的な訓練サンプルを使用して訓練される。いくつかの実施形態では、訓練済アルゴリズムは教師あり機械学習アルゴリズムを含む。いくつかの実施形態では、教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン（ＳＶＭ）、ニューラルネットワーク、またはランダムフォレストを含む。

[011]いくつかの実施形態では、方法は、被検者をモニタリングするステップをさらに含み、モニタリングするステップは、被検者の身体の部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価するステップが、複数の時間的ポイントのそれぞれにおける、少なくとも１つの画像またはその導出物の、正常、曖昧、または疑わしいとしての分類に少なくとも部分的に基づいている。いくつかの実施形態では、複数の時間的ポイントにおける、被検者の身体の画像の評価における差は、（ｉ）被検者の診断、（ｉｉ）被検者の予後、および（ｉｉｉ）被検者の一連の処置の有効性または非有効性から成る群から選択される、１つまたは複数の臨床的指標を示す。

[012]いくつかの実施形態では、（ｃ）は、（ｉ）少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、少なくとも１つの画像が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、（ｉｉ）少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、少なくとも１つの画像が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または（ｉｉｉ）少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、少なくとも１つの画像が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとをさらに含む。いくつかの実施形態では、（ｃ）は、少なくとも１つの画像が疑わしいと分類された場合、少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、（ｃ）は、少なくとも１つの画像が曖昧であると分類された場合、少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、（ｃ）は、少なくとも１つの画像が正常であると分類された場合、少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者のスクリーニング結果は、少なくとも１つの画像またはその導出物を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第１のセットは、オンサイトクリニックに配置され、少なくとも１つの画像またはその導出物はオンサイトクリニックにおいて取得される。

[013]いくつかの実施形態では、放射線科医の第２のセットは放射線専門医を含み、放射線専門医は、少なくとも１つの画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される。いくつかの実施形態では、放射線科医の第３のセットは、オンサイトクリニックからリモートに配置され、少なくとも１つの画像はオンサイトクリニックにおいて取得される。いくつかの実施形態では、放射線科医の第３のセットのうちの第３の放射線科医は、複数の画像を含むバッチのうち少なくとも１つの画像またはその導出物の放射線科医評価を実施し、バッチは放射線医学的評価の効率の向上のために選択される。

[014]いくつかの実施形態では、方法は、被検者の診断手順を、スクリーニング結果に少なくとも部分的に基づいて実施して、被検者の診断結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者の診断結果は、少なくとも１つの画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、少なくとも１つの画像を取得するステップから約１時間以内に作り出される。

[015]いくつかの実施形態では、少なくとも１つの画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性（例えば、組織密度または物理的性質）、異物の存在（例えば、インプラント）、所見のタイプ、病状（例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される）、またはそれらの組合せを含む。

[016]いくつかの実施形態では、少なくとも１つの画像またはその導出物は、第１の放射線科医、第２の放射線科医、または第３の放射線科医の追加的な特性（例えば、第１の放射線科医、第２の放射線科医、または第３の放射線科医の、少なくとも１つの画像またはその導出物の放射線医学的評価を行う個人的な能力）に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。

[017]いくつかの実施形態では、（ｃ）は、少なくとも１つの画像またはその導出物を第１の放射線科医に送るステップ、または少なくとも１つの画像またはその導出物を第２の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップをさらに含む。いくつかの実施形態では、方法は、アラートを、被検者または被検者の臨床医療従事者に送信するステップをさらに含む。いくつかの実施形態では、方法は、アラートを、患者のモバイルアプリケーションを通じて被検者に送信するステップをさらに含む。いくつかの実施形態では、アラートは、（ｂ）とリアルタイムか、（ｂ）とほぼリアルタイムで生成される。

[018]いくつかの実施形態では、画像処理アルゴリズムを適用するステップは、少なくとも１つの画像またはその導出物内で関心領域を識別するステップと、関心領域をラベル付けして少なくとも１つのラベル付けされた画像を作り出すステップとを含む。いくつかの実施形態では、方法は、少なくとも１つのラベル付けされた画像をデータベースに記憶するステップをさらに含む。いくつかの実施形態では、方法は、少なくとも１つの画像またはその導出物のうちの１つまたは複数、および分類を、データベースに記憶するステップをさらに含む。いくつかの実施形態では、方法は、少なくとも１つの画像またはその導出物のうちの１つまたは複数および分類に少なくとも部分的に基づいて、少なくとも１つの画像のプレゼンテーションを生成するステップをさらに含む。いくつかの実施形態では、方法は、プレゼンテーションをデータベースに記憶するステップをさらに含む。

[019]いくつかの実施形態では、（ｃ）は、（ｂ）とリアルタイムか、（ｂ）とほぼリアルタイムで実施される。いくつかの実施形態では、少なくとも１つの画像は、被検者から取得された複数の画像を含み、複数の画像は、異なるモダリティを使用して、または異なる時間的ポイントにおいて取得される。いくつかの実施形態では、分類するステップは、被検者の臨床健康データを処理するステップを含む。

[020]別の態様では、本開示は、被検者の身体の部位の少なくとも１つの画像を処理するためのコンピュータシステムを提供する：被検者の身体の部位の少なくとも１つの画像を記憶するように構成されたデータベースと、データベースに動作可能に結合された１つまたは複数のコンピュータプロセッサであって、１つまたは複数のコンピュータプロセッサが、（ａ）訓練済アルゴリズムを使用して、少なくとも１つの画像またはその導出物を、複数のカテゴリのうちの１つのカテゴリに分類するステップであって、分類するステップが、画像処理アルゴリズムを少なくとも１つの画像またはその導出物に適用するステップを含む、分類するステップと、（ｂ）（ａ）において少なくとも１つの画像またはその導出物を分類すると、（ｉ）少なくとも１つの画像が複数のカテゴリのうちの第１のカテゴリに分類されると、少なくとも画像またはその導出物を、放射線医学的評価のために第１の放射線科医に送るステップと、または（ｉｉ）少なくとも１つの画像が複数のカテゴリのうちの第２のカテゴリに分類されると、少なくとも１つの画像またはその導出物を、放射線医学的評価のために第２の放射線科医に送るステップと、（ｃ）少なくとも１つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、第１の放射線科医または第２の放射線科医から被検者の放射線医学的評価を受け取るステップとを行うように個々に、または集合的にプログラムされる、１つまたは複数のコンピュータプロセッサと。

[021]いくつかの実施形態では、（ａ）は、少なくとも１つの画像またはその導出物を、正常、曖昧、または疑わしいとして分類するステップを含む。いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、少なくとも１つの画像またはその導出物を、少なくとも１つの画像または導出物の（ａ）における分類に基づいて分類器に送るステップをさらに行うように、個々に、または集合的にプログラムされる。いくつかの実施形態では、（ｂ）は、少なくとも１つの画像またはその導出物を、放射線医学的評価のために、第１の複数の放射線科医のうちの第１の放射線科医、または第２の複数の放射線科医のうちの第２の放射線科医に送るステップを含む。いくつかの実施形態では、少なくとも１つの画像またはその導出物は、医学的画像である。

[022]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の感度で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の特異性で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の陽性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、少なくとも約８０％の陰性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済機械学習アルゴリズムが、異常な組織を含むか、異常な組織を含むと疑われる、少なくとも１つの画像またはその導出物の少なくとも１つの領域を識別するように構成される。

[023]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも１つの画像またはその導出物を、がんを示すために、正常、曖昧、または疑わしいとして分類する。いくつかの実施形態では、がんは乳癌である。いくつかの実施形態では、少なくとも１つの画像またはその導出物が、被検者の乳房の三次元画像である。いくつかの実施形態では、訓練済機械学習アルゴリズムは、がんを示すか、がんを示すと疑われる画像を含む少なくとも約１００の独立的な訓練サンプルを使用して訓練される。

[024]いくつかの実施形態では、訓練済アルゴリズムは、がんを示すか、がんを示すと疑われる陽性画像を含む第１の複数の独立的な訓練サンプル、およびがんを示さないか、がんを示すと疑われない陰性画像を含む第２の複数の独立的な訓練サンプルを使用して訓練される。いくつかの実施形態では、訓練済アルゴリズムは教師あり機械学習アルゴリズムを含む。いくつかの実施形態では、教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン（ＳＶＭ）、ニューラルネットワーク、またはランダムフォレストを含む。

[025]いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、被検者をモニタリングするステップをさらに行うように、個々に、または集合的にプログラムされ、モニタリングするステップは、被検者の身体の部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価するステップは、複数の時間的ポイントのそれぞれにおける、少なくとも１つの画像またはその導出物の、正常、曖昧、または疑わしいとしての分類に少なくとも部分的に基づいている。いくつかの実施形態では、複数の時間的ポイントにおける、被検者の身体の画像の評価における差は、（ｉ）被検者の診断、（ｉｉ）被検者の予後、および（ｉｉｉ）被検者の一連の処置の有効性または非有効性から成る群から選択される、１つまたは複数の臨床的指標を示す。

[026]いくつかの実施形態では、（ｂ）は、（ｉ）少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、少なくとも１つの画像またはその導出物が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、（ｉｉ）少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、少なくとも１つの画像またはその導出物が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または（ｉｉｉ）少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、少なくとも１つの画像またはその導出物が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとをさらに含む。いくつかの実施形態では、（ｂ）は、少なくとも１つの画像が疑わしいと分類された場合、少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、（ｂ）は、少なくとも１つの画像が曖昧であると分類された場合、少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、（ｂ）は、少なくとも１つの画像が正常であると分類された場合、少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者のスクリーニング結果は、少なくとも１つの画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第１のセットは、オンサイトクリニックに配置され、少なくとも１つの画像はオンサイトクリニックにおいて取得される。

[027]いくつかの実施形態では、放射線科医の第２のセットは放射線専門医を含み、放射線専門医は、少なくとも１つの画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される。いくつかの実施形態では、放射線科医の第３のセットは、オンサイトクリニックからリモートに配置され、少なくとも１つの画像はオンサイトクリニックにおいて取得される。いくつかの実施形態では、放射線科医の第３のセットのうちの第３の放射線科医は、複数の画像を含むバッチのうち少なくとも１つの画像またはその導出物の放射線科医評価を実施し、バッチは放射線医学的評価の効率の向上のために選択される。

[028]いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、スクリーニング結果に少なくとも部分的に基づいて、被検者に対して行われる診断手順から被検者の診断結果をさらに取得するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、被検者の診断結果は、少なくとも１つの画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、少なくとも１つの画像を取得するステップから約１時間以内に作り出される。

[029]いくつかの実施形態では、少なくとも１つの画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性（例えば、組織密度または物理的性質）、異物の存在（例えば、インプラント）、所見のタイプ、病状（例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される）、またはそれらの組合せを含む。

[030]いくつかの実施形態では、少なくとも１つの画像またはその導出物は、第１の放射線科医、第２の放射線科医、または第３の放射線科医の追加的な特性（例えば、第１の放射線科医、第２の放射線科医、または第３の放射線科医の、少なくとも１つの画像またはその導出物の放射線医学的評価を行う個人的な能力）に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。

[031]いくつかの実施形態では、（ｂ）は、少なくとも１つの画像またはその導出物を第１の放射線科医に送るステップ、または少なくとも１つの画像またはその導出物を第２の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップをさらに含む。いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、アラートを、被検者または被検者の臨床医療従事者にさらに送信するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、アラートを、患者のモバイルアプリケーションを通じて被検者にさらに送信するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、アラートは、（ａ）とリアルタイムか、（ａ）とほぼリアルタイムで生成される。

[032]いくつかの実施形態では、画像処理アルゴリズムを適用するステップは、少なくとも１つの画像またはその導出物内で関心領域を識別するステップと、関心領域をラベル付けして少なくとも１つのラベル付けされた画像を作り出すステップとを含む。いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、少なくとも１つのラベル付けされた画像をデータベースにさらに記憶するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、少なくとも１つの画像またはその導出物のうちの１つまたは複数、および分類を、データベースにさらに記憶するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、少なくとも１つの画像のうちの１つまたは複数および分類に少なくとも部分的に基づいて、少なくとも１つの画像またはその導出物のプレゼンテーションをさらに生成するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、１つまたは複数のコンピュータプロセッサは、プレゼンテーションをデータベースにさらに記憶するように、個々に、または集合的にプログラムされる。

[033]いくつかの実施形態では、（ｂ）は、（ａ）とリアルタイムか、（ａ）とほぼリアルタイムで実施される。いくつかの実施形態では、少なくとも１つの画像は、被検者から取得された複数の画像を含み、複数の画像は、異なるモダリティを使用して、または異なる時間的ポイントにおいて取得される。いくつかの実施形態では、分類するステップは、被検者の臨床健康データを処理するステップを含む。

[034]本開示の別の態様は、１つまたは複数のコンピュータプロセッサによって実行されると、上述の方法または本明細書における他での方法のいずれかを実装する機械実行可能コードを含む、非一時的なコンピュータ可読媒体を提供する。

[035]本開示の別の態様は、１つまたは複数のコンピュータプロセッサおよびそれに結合されたコンピュータメモリを備えるシステムを提供する。コンピュータメモリは、１つまたは複数のコンピュータプロセッサによって実行されると、上述の方法または本明細書における他での方法のいずれかを実装する機械実行可能コードを含む。

[036]本開示の追加的な態様および利点は、以下の詳細な説明から当業者には容易に明らかとなろう。以下の詳細な説明では、本開示の単なる例示的な実施形態が示され、説明される。理解されるように、本開示は、他の実施形態および異なる実施形態に対応しており、そのいくつかの詳細は、すべて本開示から逸脱することなく様々な明確な点から修正形態が可能なものである。したがって、図面および説明は、性質として制限的なものではなく、例示的なものと考えられるべきである。

参照による組み込み
[037]本明細書において言及されるすべての出版物、特許、および特許出願は、それぞれ個々の出版物、特許、または特許出願が参照により組み込まれるように具体的かつ個々に示されている場合と同じ程度に、参照により本明細書に組み込まれる。参照により組み込まれる出版物および特許または特許出願が本明細書に含まれる開示と矛盾する範囲で、本明細書は、そのような矛盾する資料に取って代わるおよび／または優先することが意図される。

[038]本発明の新規な特徴を、特に添付の特許請求の範囲を用いて説明する。本発明の特徴および利点は、本発明の原理が利用されている例示的な実施形態を説明する以下の詳細な説明、および添付の図面（本明細書では「図面」および「図」とも称される）を参照することによって、より良く理解されるであろう。

[039]開示される実施形態による、（例えば、放射線科医または放射線技師による）放射線医学的レビュー用に事例を送るための方法の例示的なワークフローの図である。 [040]開示される実施形態による、被検者のマンモグラフィデータを、正常、不確実、および疑わしい、の３つの異なるワークフローのうちの１つに分類することによって、マンモグラフィスクリーニングを受けている被検者を階層化するように構成されたトリアージエンジンを使用する方法の例の図である。 [041]開示される実施形態による、マンモグラフィ技師または技師アシスタントの視点からのビューを含む、リアルタイム放射線医学システム用のユーザインターフェースの例の図である。開示される実施形態による、放射線科医の視点からのビューを含む、リアルタイム放射線医学システム用のユーザインターフェースの例の図である。開示される実施形態による、請求担当者の視点からのビューを含む、リアルタイム放射線医学システム用のユーザインターフェースの例の図である。開示される実施形態による、超音波技師または技師アシスタントの視点からのビューを含む、リアルタイム放射線医学システム用のユーザインターフェースの例の図である。 [042]本明細書で提供される方法を実装するようにプログラムされた、または構成されたコンピュータシステムの図である。 [043]開示される実施形態による、リアルタイム放射線医学システムを使用して検出される様々なサイズ（２ｍｍから２９ｍｍの範囲）の乳癌腫瘍の検出頻度の例示的なプロットである。 [044]開示される実施形態による、スクリーニングマンモグラフィからの陽性予測値（ＰＰＶ１）対コールバック率の例示的なプロットである。 [045]開示される実施形態による、放射線科医の第１のセット、放射線科医の第２のセット、および放射線科医の合計セット全体についての、バッチの（コントロール、ＢＩ－ＲＡＤｓ、および密度を含む）解釈時間（左）と、コントロールに対する解釈時間のパーセンテージ改善（右）とを比較する例示的なプロットである。 [046]開示される実施形態による、検査データセットで評価される二値分類タスクに対するＤＮＮのパフォーマンスを示す受信者操作特性（ＲＯＣ：ｒｅｃｅｉｖｅｒｏｐｅｒａｔｉｎｇｃｈａｒａｃｔｅｒｉｓｔｉｃ）曲線である。 [047]開示される実施形態による、ＡＩ対応リアルタイム放射線医学システムおよび患者のモバイルアプリケーション（アプリ）を使用する、クリニックを通じた患者フローの概略の例の図である。 [048]開示される実施形態による、ＡＩ支援放射線医学的評価ワークフローの概略の例の図である。 [049]開示される実施形態による、より適時的なレポート配信および疑わしい事例のための（例えば、バッチ読影セッティングにおいて行われるような）フォローアップを可能にするために、スクリーニングマンモグラフィ用に機械学習を使用して開発されたトリアージソフトウェアシステムの例の図である。 [050]開示される実施形態による、ＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度カテゴリ（Ａ）ａｌｍｏｓｔｅｎｔｉｒｅｌｙｆａｔｔｙ（ほぼ全体的に脂肪）について、デジタル乳腺トモシンセシス（ＤＢＴ）診察から導出した合成２Ｄマンモグラフィ（ＳＭ）画像の例の図である。開示される実施形態による、ＢＩ－ＲＡＤＳ乳腺密度カテゴリ（Ｂ）ｓｃａｔｔｅｒｅｄａｒｅａｓｏｆｆｉｂｒｏｇｌａｎｄｕｌａｒｄｅｎｓｉｔｙ（線維腺密度が散乱するエリア）について、ＤＢＴ診察から導出した合成２Ｄマンモグラフィ（ＳＭ）画像の例の図である。開示される実施形態による、ＢＩ－ＲＡＤＳ乳腺密度カテゴリ（Ｃ）ｈｅｔｅｒｏｇｅｎｅｏｕｓｌｙｄｅｎｓｅ（不均一に高密度）について、ＤＢＴ診察から導出した合成２Ｄマンモグラフィ（ＳＭ）画像の例の図である。開示される実施形態による、ＢＩ－ＲＡＤＳ乳腺密度カテゴリ（Ｄ）ｅｘｔｒｅｍｅｌｙｄｅｎｓｅ（極めて高密度）について、ＤＢＴ診察から導出した合成２Ｄマンモグラフィ（ＳＭ）画像の例の図である。 [051]図１３Ａ～図１３Ｄは、開示される実施形態による、同一圧力下での同一乳房の比較の図である。図１３Ａは、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）画像である。図１３Ｂは、合成２Ｄマンモグラフィ（ＳＭ）画像である。図１３Ｃは、ＦＦＤＭ画像について元の部位が白色四角により示されるズームインされた領域の図である。図１３Ｄは、ＳＭ画像について元の部位が白色四角により示されるズームインされた領域の図である。図１３Ｃと図１３Ｄは、２つの画像タイプ間に生じ得るテクスチャおよびコントラストの差異を強調するための図である。 [052]開示される実施形態による、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）検査セットに対して評価した、ＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度タスクについての混同行列の図である。各ビンにおける検査サンプル（試験）の数をカッコ内に示す。開示される実施形態による、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）検査セットに対して評価した、二値密度タスク（高密度であるＢＩ－ＲＡＤＳＣ＋Ｄ対非高密度であるＢＩ－ＲＡＤＳＡ＋Ｂ）についての混同行列の図である。各ビンにおける検査サンプル（試験）の数をカッコ内に示す。 [053]開示される実施形態による、Ｓｉｔｅ１ＳＭ検査セットに対して評価した、適応なしのＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度タスクについての混同行列の図である。各ビンにおける検査サンプル（試験）の数をカッコ内に示す。開示される実施形態による、Ｓｉｔｅ１ＳＭ検査セットに対して評価した、適応なしの二値密度タスク（高密度であるＢＩ－ＲＡＤＳＣ＋Ｄ対非高密度であるＢＩ－ＲＡＤＳＡ＋Ｂ）についての混同行列の図である。各ビンにおける検査サンプル（試験）の数をカッコ内に示す。開示される実施形態による、Ｓｉｔｅ１ＳＭ検査セットに対して評価した、５００訓練サンプルの行列キャリブレーションによる適応ありのＢＩ－ＲＡＤＳ乳腺密度タスクについての混同行列の図である。各ビンにおける検査サンプル（試験）の数をカッコ内に示す。開示される実施形態による、Ｓｉｔｅ１ＳＭ検査セットに対して評価した、５００訓練サンプルの行列キャリブレーションによる適応ありの二値密度タスク（高密度対非高密度）についての混同行列の図である。各ビンにおける検査サンプル（試験）の数をカッコ内に示す。 [054]開示される実施形態による、Ｓｉｔｅ２ＳＭ検査セットに対して評価した、適応なしのＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度タスクについての混同行列の図である。開示される実施形態による、Ｓｉｔｅ２ＳＭ検査セットに対して評価した、適応なしの二値密度タスク（高密度であるＢＩ－ＲＡＤＳＣ＋Ｄ対非高密度であるＢＩ－ＲＡＤＳＡ＋Ｂ）についての混同行列の図である。開示される実施形態による、Ｓｉｔｅ２ＳＭ検査セットに対して評価した、５００訓練サンプルの行列キャリブレーションによる適応ありのＢＩ－ＲＡＤＳ乳腺密度タスクについての混同行列の図である。開示される実施形態による、Ｓｉｔｅ２ＳＭ検査セットに対して評価した、５００訓練サンプルの行列キャリブレーションによる適応ありの二値密度タスク（高密度対非高密度）についての混同行列の図である。各ビンにおける検査サンプル（試験）の数をカッコ内に示す。 [055]開示される実施形態による、Ｓｉｔｅ１データセットについて、ｍａｃｒｏＡＵＣによって測定された、適応方法のパフォーマンスに対する訓練データ量の影響の図である。開示される実施形態による、Ｓｉｔｅ１データセットについて、線形重みづけされたコーエンのカッパ係数によって測定された、適応方法のパフォーマンスに対する訓練データ量の影響の図である。開示される実施形態による、Ｓｉｔｅ２ＳＭデータセットについて、ｍａｃｒｏＡＵＣによって測定された、適応方法のパフォーマンスに対する訓練データ量の影響の図である。開示される実施形態による、Ｓｉｔｅ２ＳＭデータセットについて、線形重みづけされたコーエンのカッパ係数によって測定された、適応方法のパフォーマンスに対する訓練データ量の影響の図である。 [056]リアルタイム放射線医学的評価ワークフローの概略の例の図である。 [057]リアルタイム放射線医学的評価ワークフローの概略の例の図である。 [058]遠隔画像診断セッティングにおけるＡＩ支援放射線医学的評価ワークフローの概略の例の図である。

[059]本発明の様々な実施形態が、本明細書で示され説明されているが、当業者には、そのような実施形態は単なる例として提供されることが明らかであろう。当業者にとっては多数の変形例、変更、および置き換えが、本発明から逸脱することなく、想到する場合がある。本明細書で説明される本発明の実施形態に対して様々な代替が採用され得ることを理解されたい。

[060]本明細書および特許請求の範囲で使用される場合、そうではないと明確に述べられない限り、単数形「ａ」、「ａｎ」、「ｔｈｅ」は複数形を含む。例えば、用語「核酸（ａｎｕｃｌｅｉｃａｃｉｄ）」は、その混合物を含め、「複数の核酸（ｎｕｃｌｅｉｃａｃｉｄｓ）」を含む。

[061]本明細書で使用される場合、用語「被検者」は一般に、検査可能または検出可能な遺伝情報を有するエンティティまたは媒体を称する。被検者は、人、個体、または患者であり得る。被検者は、例えば哺乳類などの脊椎動物であり得る。哺乳類の非限定的な例としては、人間、サル、家畜、狩猟用動物、げっ歯類、およびペットが挙げられる。被検者は、がんを有する人、またはがんを有する疑いのある人であり得る。被検者は、被検者のがん（例えば、乳癌）など、被検者の健康上のまたは生理学的な状態またはコンディションを示す症状を呈している場合がある。代替として、被検者は、そのような健康上のまたは生理学的な状態またはコンディションに関して無症状である可能性がある。

[062]乳癌は、米国の女性に最も広くみられるがんであり、２０１７年だけで２５万を超える新規の診断があった。約８人に１人の女性が、その生涯の何らかの時点で乳癌であると診断される。処置の改善に関わらず、米国では４万人を超える女性が毎年乳癌により死亡する。スクリーニングマンモグラフィの広い受診によりある程度、乳癌死亡率の低下に大きな進歩があった。乳癌のスクリーニングは、後期がんと比較して予後がずっと良好であり、処置コストが低い早期がんを識別するのを助けることが可能である。この差は非常に重要な可能性がある：限局的な乳癌のある女性は９９％近い５年生存率を有するが、転移性の乳癌のある女性の５年生存率は２７％である。

[063]このように立証されたベネフィットに関わらず、スクリーニングマンモグラフィの受診率は、予約取得の長い遅れ、不明確な価格設定、診察結果を受け取る長い待ち時間、紛らわしいレポートなど、一部患者経験の貧しさにより妨げられる。さらには、価格設定の透明性の欠如から生じる問題は、医療機関同士のコストの大きなバラつきによってひどくなる。同様に、診察結果を受け取るための伝達時間は、医療機関同士で一貫性がない。加えて、放射線科医のパフォーマンスの著しいバラつきにより、患者は場所と収入に応じて非常に様々なケアの基準を経験することになる。

[064]本開示は、人工知能を使用して、医学的画像データをさらなるスクリーニングおよび／または診断評価のために個別の放射線医学的ワークフローに階層化することによって、被検者のリアルタイム放射線医学を行うための方法およびシステムを提供する。そのような被検者は、がんのある被検者およびがんのない被検者を含み得る。スクリーニングは、例えば乳癌などのがんに向けたものであってもよい。

[065]図１は、開示される実施形態による、（例えば、放射線科医、放射線専門家、または放射線技師による）放射線医学的レビュー用に事例を送るための方法の例示的なワークフローを図示する。一態様では、本開示は、被検者の身体の部位の少なくとも１つの画像を処理するための方法１００を提供する。方法１００は、被検者の身体の部位の画像を取得することを含んでもよい（動作１０２の通り）。次に、方法１００は、訓練済アルゴリズムを使用して、画像またはその導出物を、複数のカテゴリのうちの１つのカテゴリに分類することを含んでもよい（動作１０４の通り）。例えば、分類することは、画像処理アルゴリズムを画像またはその導出物に適用することを含んでもよい。次に、方法１００は、画像が複数のカテゴリのうち第１のカテゴリに分類されたか、それとも第２のカテゴリに分類されたかを判定することを含んでもよい（動作１０６の通り）。画像が第１のカテゴリに分類された場合、方法１００は、画像を、放射線医学的評価のために第１の放射線科医に送ることを含んでもよい（動作１０８の通り）。画像が第２のカテゴリに分類された場合、方法１００は、画像を、放射線医学的評価のために第２の放射線科医に送ることを含んでもよい（動作１１０の通り）。次に、方法１００は、画像の放射線医学的評価に基づいて、（例えば、第１の放射線科医もしくは第２の放射線科医から、または別の放射線科医もしくは医師から）被検者を診察するよう提案を受け取ることを含んでもよい（動作１１２の通り）。

[066]図２は、開示される実施形態による、被検者のマンモグラフィデータを、正常、不確実、および疑わしい、の３つの異なるワークフローのうちの１つに分類することによって、マンモグラフィスクリーニングを受けている被検者を階層化するように構成されたトリアージエンジンを使用する方法の例を図示する。まず、患者の電子カルテ（ＥＨＲ）と医学的画像を含むデータセットが用意される。次に、ＡＩベースのトリアージエンジンは、ＥＨＲと医学的画像を処理してデータセットを分析し、正常と思われる、疑わしい可能性がある、または疑わしいと思われる、として分類する。次に、患者のデータセットは、正常、不確実、または疑わしいとのデータセットの分類に基づいて、それぞれ、正常な場合のワークフロー、不確実な場合のワークフロー、および疑わしい場合のワークフロー、の３つのワークフローのうちの１つによって処理される。３つのワークフローのそれぞれは、放射線科医レビューまたはさらなるＡＩベースの分析（例えば、訓練済アルゴリズムによって）を含んでもよい。正常な場合のワークフローは、患者のデータセットが正常であるという、ＡＩベースの（任意選択で、クラウドベースの）確認を含んでもよく、確認されると慣例的なスクリーニングが完了する。例えば、放射線科医のグループは、正常な場合のワークフロー事例を、大量かつ効率的にレビューする場合がある。代替的に、正常な場合のワークフローは、患者のデータセットが疑わしいという、ＡＩベースの（任意選択で、クラウドベースの）判定を含んでもよく、判定されると患者のデータセットの迅速な放射線科医レビューが発注される。例えば、放射線科医の第２のグループは、少数かつ効率的ではなく疑わしい場合のワークフロー事例をレビューしてもよい（例えば、放射線専門医がより詳細な放射線医学的評価を行う）。同様に、不確実な場合と疑わしい場合のワークフローもまた、患者のデータセットの迅速な放射線科医レビューを含んでもよい。いくつかの実施形態では、本明細書の他で説明されるように、放射線科医の異なるセットを使用して、異なるワークフローをレビューする。いくつかの実施形態では、放射線科医の同一のセットを使用して、異なるワークフローを（例えば、放射線医学的評価向けの事例の優先度に応じて異なる時間的ポイントにおいて）レビューする。

[067]図３Ａ～図３Ｄは、開示される実施形態による、マンモグラフィ技師または技師アシスタント（図３Ａ）、放射線科医（図３Ｂ）、請求担当者（図３Ｃ）、および超音波技師または技師アシスタント（図３Ｄ）の視点からのビューを含む、リアルタイム放射線医学システム用のユーザインターフェースの例の図を示す。ビューは、どの領域がＡＩアルゴリズムによって疑わしいと識別されたかを示すヒートマップを含んでもよい。マンモグラフィの技師または技師アシスタントは、患者がリアルタイム放射線医学的評価に適しているかどうかを調べるために、患者にいくつかの質問をして、その質問に対する応答を評価する場合がある。放射線科医は、患者の医学的画像（例えば、マンモグラフィ画像）を本開示のリアルタイム放射線医学方法およびシステムにしたがって、読影または解釈してもよい。請求担当者は、患者がリアルタイム放射線医学的評価に適しているかに基づいて診断コストを推定してもよい。マンモグラフィ／超音波の技師または技師アシスタントは、患者にリアルタイム放射線医学的評価の結果を待機するよう知らせてもよい。ユーザインターフェースは、技師または技師アシスタントが取得画像に補正を行うことができるように、または画像取得を繰り返すことができるように、取得画像が低品質であるという（例えば、ＡＩベースのアルゴリズムによって生成された）通知を技師または技師アシスタントに与えてもよい。

医学的画像の取得
[068]医学的画像は、人間被検者（例えば、患者）から取得または導出することができる。医学的画像は、コンピュータサーバ（例えば、クラウドベースのサーバ）、ローカルサーバ、ローカルコンピュータ、またはモバイルデバイス（スマートフォンまたはタブレットなど））などのデータベースに記憶してもよい。医学的画像は、がんのある被検者から、がんがあると疑われる被検者から、またはがんのない被検者もしくはがんがあると疑われない被検者から取得されてもよい。

[069]医学的画像は、がんのある被検者の処置の前および／または後に得られてもよい。医学的画像は、処置または処置レジームの間に被検者から取得されてもよい。処置の効果を経時的にモニタリングするために、医学的画像の複数のセットが被検者から取得されてもよい。医学的画像は、臨床検査を通じて最終的な陽性または陰性の診断が利用可能ではない、がん（例えば、乳癌）があると分かっているか、それが疑われる被検者から得られてもよい。医学的画像は、がんがあると疑われる被検者から得られてもよい。医学的画像は、疲労、悪心、体重減少、痛みや疼痛、衰弱または出血などの説明されない症状を感じている被検者から得られてもよい。医学的画像は、説明される症状を有する被検者から得られてもよい。医学的画像は、家族歴、年齢、高血圧もしくは高血圧前段階、糖尿病もしくは糖尿病前症、体重過多もしくは肥満、環境露出、ライフスタイルのリスクファクタ（例えば、喫煙、アルコール消費、または薬物使用）、または他のリスクファクタの存在などのファクタによって、がんが発生するリスクにある被検者から得られてもよい。

[070]医学的画像は、マンモグラフィスキャン、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、デジタルＸ線スキャン、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、核医学スキャン、サーモグラフィスキャン、眼科スキャン、光干渉断層撮影スキャン、心電図スキャン、内視鏡スキャン、光透視スキャン、骨密度測定スキャン、光学スキャン、またはそれらのあらゆる組合せなどの、１つまたは複数のイメージングモダリティを使用して得られてもよい。医学的画像は、画像特性（例えば、コントラスト、明るさ、シャープネス）を向上するため、ノイズもしくはアーチファクトを除去するため、周波数範囲をフィルタリングするため、画像を小さなファイルサイズに圧縮するため、または画像をサンプリングもしくはクロップするために、画像処理技法または深層学習を使用して、事前処理されてもよい。医学的画像は、生であってもよく、（例えば、複数の２Ｄ画像から３Ｄ容積を作り出すために）再構築されてもよい。画像は、組織特性または機能的ＭＲＩ（ｆＭＲＩ）もしくは安静時ｆＭＲＩにおけるような機能的挙動に相関付けられたマップを計算するために処理されてもよい。画像は、ヒートマップまたは流体などの情報を示す追加的な情報と重ね合わせてもよい。画像は、同一被検者のいくつかのスキャンからの、または数名の被検者からの、画像の合成から作成されてもよい。

[071]訓練済アルゴリズム
[072]１つまたは複数の被検者の身体の部位の複数の医学的画像を含むデータセットを取得した後、訓練済アルゴリズムを使用してデータセットを処理し、画像を、正常、曖昧、または疑わしいとして分類することができる。例えば、訓練済アルゴリズムを使用して、被検者の複数の医学的画像における関心領域（ＲＯＩ）を判定すること、およびＲＯＩを処理して画像を、正常、曖昧、または疑わしいとして分類することができる。訓練済アルゴリズムは、画像を、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、または９９％より高い精度で、少なくとも約２５、少なくとも約５０、少なくとも約１００、少なくとも約１５０、少なくとも約２００、少なくとも約２５０、少なくとも約３００、少なくとも約３５０、少なくとも約４００、少なくとも約４５０、少なくとも約５００、または約５００よりも多い独立したサンプルについて、正常、曖昧、または疑わしいとして分類するように構成されてもよい。

[073]訓練済アルゴリズムは、教師あり機械学習アルゴリズムを含んでもよい。訓練済アルゴリズムは、分類回帰木（ＣＡＲＴ：ｃｌａｓｓｉｆｉｃａｔｉｏｎａｎｄｒｅｇｒｅｓｓｉｏｎｔｒｅｅ）アルゴリズムを含んでもよい。教師あり機械学習アルゴリズムとしては、例えば、ランダムフォレスト、サポートベクタマシン（ＳＶＭ）、ニューラルネットワーク（例えば、深層ニューラルネットワーク（ＤＮＮ））、または深層学習アルゴリズムを挙げることができる。訓練済アルゴリズムは、教師なし機械学習アルゴリズムを含んでもよい。

[074]訓練済アルゴリズムは、複数の入力変数を受け入れて、複数の入力変数に基づいて１つまたは複数の出力値を作り出すように構成されてもよい。複数の入力変数は、被検者の身体の部位の医学的画像を含む１つまたは複数のデータセットから抽出した特徴を含んでもよい。例えば、入力変数は、医学的画像のデータセット中の、潜在的にがん的または疑わしい関心領域（ＲＯＩ）の数を含んでもよい。潜在的にがん的または疑わしい関心領域（ＲＯＩ）は、画像セグメント化などの多様な画像処理手法を使用して医学的画像のデータセットから識別または抽出されてもよい。入力変数はまた、３Ｄ容積またはある時間に渡る複数の診察におけるスライスからのいくつかの画像を含んでもよい。複数の入力変数はまた、被検者の臨床健康データを含んでもよい。

[075]いくつかの実施形態では、臨床健康データは、年齢、体重、身長、肥満指数（ＢＭＩ）、血圧、心拍、グルコースレベルなど、被検者の１つまたは複数の定量的な測定値を含む。別の例として、臨床健康データは、人種、民族、投薬歴または他の臨床処置歴、喫煙歴、アルコール消費履歴、日常活動または運動レベル、遺伝的検査結果、血液検査結果、イメージング結果、およびスクリーニング結果など、１つまたは複数のカテゴリ的な測定値を含むことが可能である。

[076]訓練済アルゴリズムは、１つまたは複数の画像（例えば、放射線医学的画像）に対して画像処理を行うように構成された１つまたは複数のモジュールを含んでもよく、それにより１つまたは複数の画像の検出またはセグメント化を作り出す。訓練済アルゴリズムは、１つまたは複数の出力値のそれぞれが固定数の可能な値のうちの１つを含むように、分類器（例えば、線形分類器、ロジスティック回帰分類器など）を含んで、分類器による医学的画像を含むデータセットの分類を示してもよい。訓練済アルゴリズムは、１つまたは複数の出力値のそれぞれが２つの値（例えば、｛０，１｝、｛陽性，陰性｝、｛高リスク，低リスク｝、または｛疑わしい，正常｝）のうちの１つを含むように、二値分類器を含んで、分類器による医学的画像を含むデータセットの分類を示してもよい。訓練済アルゴリズムは、１つまたは複数の出力値のそれぞれが３つ以上の値（例えば、｛０，１，２｝、｛陽性，陰性，もしくは中間｝、｛高リスク，中リスク、または低リスク｝、または｛疑わしい、正常、または分類不能｝）のうちの１つを含むように、別のタイプの分類器であって、分類器による医学的画像を含むデータセットの分類を示してもよい。出力値は、説明ラベル、数値、またはそれらの組合せを含んでもよい。出力値の一部は、説明ラベルを含んでもよい。そのような説明ラベルは、識別情報、指標、見込み、または被検者の疾患もしくは障害状態のリスクを提供することができ、例えば、陽性、陰性、高リスク、中リスク、低リスク、疑わしい、正常、または分類不能を含んでもよい。そのような説明ラベルは、被検者のフォローアップの診断手順または処置の識別情報を提供する場合があり、例えば、がんまたは他の状態を処置するために適した治療的介入、治療的介入の持続時間、および／または治療的介入の投与法を含んでもよい。そのような説明ラベルは、被検者に対して行うことが適当であり得る二次的な臨床検査の識別情報を提供する場合があり、例えば、画像検査、血液検査、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、デジタルＸ線、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、またはそれらのあらゆる組合せを含んでもよい。別の例として、そのような説明ラベルは、被検者のがんの予後を提供する場合がある。別の例として、そのような説明ラベルは、被検者のがんの相対的な評価（例えば、推定ステージまたは腫瘍負荷）を提供する場合がある。一部の説明ラベルは、例えば「陽性」を１に、「陰性」を０にマッピングすることによって、数値にマッピングされる場合がある。

[077]出力値の一部は、バイナリ値、整数、または連続値などの数値を含んでもよい。そのようなバイナリ出力値は、例えば、｛０，１｝、｛陽性，陰性｝、または｛高リスク，低リスク｝を含んでもよい。そのような整数出力値は、例えば｛０，１，２｝を含んでもよい。そのような連続出力値は、例えば少なくとも０かつ１以下の確率値を含んでもよい。そのような連続出力値は、例えばＲＯＩの中心座標を含んでもよい。そのような連続出力値は、被検者のがんの予後を示す場合がある。一部の数値は、例えば１を「陽性」に、０を「陰性」にマッピングすることによって、説明ラベルにマッピングされる場合がある。がんの確率マップなどの、数値のアレイまたはマップが作り出されてもよい。

[078]出力値の一部は、１つまたは複数の切り捨て値に基づいて割り当てられてもよい。例えば、医学的画像を含むデータセットが、被検者が少なくとも５０％の確率でがん（例えば、乳癌）を有することを示す場合、医学的画像を含むデータセットの二値分類は「陽性」または１の出力値を割り当ててもよい。例えば、医学的画像を含むデータセットが、被検者が５０％未満の確率でがんを有することを示す場合、医学的画像を含むデータセットの二値分類は「陰性」または０の出力値を割り当ててもよい。この場合、単一の切り捨て値５０％を使用して、医学的画像を含むデータセットを、２つの可能な二値出力値のうちの１つに分類する。単一の切り捨て値の例としては、約１％、約２％、約５％、約１０％、約１５％、約２０％、約２５％、約３０％、約３５％、約４０％、約４５％、約５０％、約５５％、約６０％、約６５％、約７０％、約７５％、約８０％、約８５％、約９０％、約９１％、約９２％、約９３％、約９４％、約９５％、約９６％、約９７％、約９８％、および約９９％を挙げることができる。

[079]別の例として、被検者が少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上の確率でがんを有することを、医学的画像を含むデータセットが示す場合、医学的画像を含むデータセットの分類は「陽性」または１の出力値を割り当ててもよい。被検者が約５０％超、約５５％超、約６０％超、約６５％超、約７０％超、約７５％超、約８０％超、約８５％超、約９０％超、約９１％超、約９２％超、約９３％超、約９４％超、約９５％超、約９６％超、約９７％超、約９８％超、または約９９％超の確率でがんを有することを、医学的画像を含むデータセットが示す場合、サンプルの分類は「陽性」または１の出力値を割り当ててもよい。

[080]被検者が約５０％未満、約４５％未満、約４０％未満、約３５％未満、約３０％未満、約２５％未満、約２０％未満、約１５％未満、約１０％未満、約９％未満、約８％未満、約７％未満、約６％未満、約５％未満、約４％未満、約３％未満、約２％未満、または約１％未満の確率でがんを有することを、医学的画像を含むデータセットが示す場合、医学的画像を含むデータセットの分類は「陰性」または０の出力値を割り当ててもよい。被検者が約５０％以下、約４５％以下、約４０％以下、約３５％以下、約３０％以下、約２５％以下、約２０％以下、約１５％以下、約１０％以下、約９％以下、約８％以下、約７％以下、約６％以下、約５％以下、約４％以下、約３％以下、約２％以下、または約１％以下の確率でがんを有することを、医学的画像を含むデータセットが示す場合、医学的画像を含むデータセットの分類は「陰性」または０の出力値を割り当ててもよい。

[081]医学的画像を含むデータセットが「陽性」、「陰性」、１、または０として分類されない場合、医学的画像を含むデータセットの分類は「中間」または２の出力値を割り当ててもよい。この場合、２つの切り捨て値のセットを使用して、医学的画像を含むデータセットを、３つの可能な出力値のうちの１つに分類する。切り捨て値のセットの例としては、｛１％，９９％｝、｛２％，９８％｝、｛５％，９５％｝、｛１０％，９０％｝、｛１５％，８５％｝、｛２０％，８０％｝，｛２５％，７５％｝、｛３０％，７０％｝、｛３５％，６５％｝、｛４０％，６０％｝、および｛４５％，５５％｝を挙げることができる。同様に、ｎ個の切り捨て値のセットを使用して、医学的画像を含むデータセットを、ｎ＋１個の可能な出力値のうちの１つに分類してもよく、この場合ｎはあらゆる正の整数である。

[082]訓練済アルゴリズムは、複数の独立的な訓練サンプルを用いて訓練されてもよい。独立的な訓練サンプルのそれぞれは、被検者からの医学的画像を含むデータセット、医学的画像を分析することによって取得される関連するデータセット（例えば、ラベルまたはアノテーション）、および医学的画像を含むデータセットに対応する１つまたは複数の既知の出力値（例えば、画像の読影の難しさ、画像を読影するのにかかった時間、臨床的診断、予後、欠落、被検者のがんの処置有効性）を含んでもよい。独立的な訓練サンプルは、医学的画像を含むデータセット、ならびに関連するデータセットおよび複数の異なる被検者から取得または導出された出力を含んでもよい。独立的な訓練サンプルは、医学的画像を含むデータセット、ならびに関連するデータセットおよび同一被検者から複数の異なる時間的ポイントで（例えば、毎週、毎月、または毎年など定期的に）取得された出力を含んでもよい。独立的な訓練サンプルは、がんまたは疾患の存在に関連付けられてもよい（例えば、医学的画像を含むデータセットを含む訓練サンプル、ならびにがんまたは疾患があると分かっている複数の被検者から取得または導出された関連するデータセットおよび出力）。独立的な訓練サンプルは、がんまたは疾患がないことに関連付けられてもよい（例えば、医学的画像を含むデータセットを含む訓練サンプル、ならびに以前にがんと診断されたことがないと分かっている、またはがんもしくは疾患について陰性の検査結果を受け取っている複数の被検者から、取得または導出された関連するデータセットおよび出力）。

[083]訓練済アルゴリズムは、少なくとも約５０、少なくとも約１００、少なくとも約２５０、少なくとも約５００、少なくとも約１０００、少なくとも約５０００、少なくとも約１万、少なくとも約１５０００、少なくとも約２万、少なくとも約２５０００、少なくとも約３万、少なくとも約３５０００、少なくとも約４万、少なくとも約４５０００、少なくとも約５万、少なくとも約１０万、少なくとも約１５万、少なくとも約２０万、少なくとも約２５万、少なくとも約３０万、少なくとも約３５万、少なくとも約４０万、少なくとも約４５万、または少なくとも約５０万の独立的な訓練サンプルを用いて訓練されてもよい。独立的な訓練サンプルは、疾患（例えば、がん）の存在に関連付けられる医学的画像を含むデータセットおよび／または疾患（例えば、がん）がないことに関連付けられる医学的画像を含むデータセットを含んでもよい。訓練済アルゴリズムは、約５０万以下、約４５万以下、約４０万以下、約３５万以下、約３０万以下、約２５万以下、約２０万以下、約１５万以下、約１０万以下、約５万以下、約２５０００以下、約１万以下、約５０００以下、約１０００以下、約５００以下、約２５０以下、約１００以下、または約５０以下の疾患（例えば、がん）の存在に関連付けられる独立的な訓練サンプルを用いて訓練されてもよい。いくつかの実施形態では、医学的画像を含むデータセットは、訓練済アルゴリズムを訓練するために使用されるサンプルとは無関係である。

[084]訓練済アルゴリズムは、疾患（例えば、がん）の存在に関連付けられる独立的な訓練サンプルの第１の数、および疾患（例えば、がん）が存在しないことに関連付けられる独立的な訓練サンプルの第２の数を用いて訓練されてもよい。疾患（例えば、がん）の存在に関連付けられる独立的な訓練サンプルの第１の数は、疾患（例えば、がん）が存在しないことに関連付けられる独立的な訓練サンプルの第２の数以下であってもよい。疾患（例えば、がん）の存在に関連付けられる独立的な訓練サンプルの第１の数は、疾患（例えば、がん）が存在しないことに関連付けられる独立的な訓練サンプルの第２の数に等しくてもよい。疾患（例えば、がん）の存在に関連付けられる独立的な訓練サンプルの第１の数は、疾患（例えば、がん）が存在しないことに関連付けられる独立的な訓練サンプルの第２の数より大きくてもよい。

[085]訓練済アルゴリズムは、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上の精度で、少なくとも約５０，少なくとも約１００、少なくとも約２５０、少なくとも約５００、少なくとも約１０００、少なくとも約５０００、少なくとも約１万、少なくとも約１５０００、少なくとも約２万、少なくとも約２５０００、少なくとも約３万、少なくとも約３５０００、少なくとも約４万、少なくとも約４５０００、少なくとも約５万、少なくとも約１０万、少なくとも約１５万、少なくとも約２０万、少なくとも約２５万、少なくとも約３０万、少なくとも約３５万、少なくとも約４０万、少なくとも約４５万、または少なくとも約５０万の独立的な検査サンプルについて、医学的画像を分類するように構成されてもよい。訓練済アルゴリズムによって医学的画像を分類する精度は、正常または疑わしいとして正しく識別または分類される独立的な検査サンプルのパーセンテージとして計算されてもよい（例えば、がんがあると分かっている被検者、またはがんについての臨床検査結果が陰性である被検者からの画像）。

[086]訓練済アルゴリズムは、医学的画像を、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上の陽性予測値（ＰＰＶ）で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類するＰＰＶは、本当に異常な状態（例えば、がん）を有する被検者に相当する、疑わしいとして識別または分類される医学的画像のパーセンテージとして計算されてもよい。

[087]訓練済アルゴリズムは、医学的画像を、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上の陰性予測値（ＮＰＶ）で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類するＮＰＶは、本当に異常な状態（例えば、がん）を有さない被検者に相当する、正常として識別または分類される医学的画像のパーセンテージとして計算されてもよい。

[088]訓練済アルゴリズムは、医学的画像を、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、少なくとも約９９．１％、少なくとも約９９．２％、少なくとも約９９．３％、少なくとも約９９．４％、少なくとも約９９．５％、少なくとも約９９．６％、少なくとも約９９．７％、少なくとも約９９．８％、少なくとも約９９．９％、少なくとも約９９．９９％、少なくとも約９９．９９９％、またはそれ以上の臨床的感度で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類する臨床的感度は、ある状態（例えば、がん）を有すると分かっている被検者から取得された、その状態について疑わしいとして正しく識別または分類される医学的画像のパーセンテージとして計算されてもよい。

[089]訓練済アルゴリズムは、医学的画像を、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、少なくとも約９９．１％、少なくとも約９９．２％、少なくとも約９９．３％、少なくとも約９９．４％、少なくとも約９９．５％、少なくとも約９９．６％、少なくとも約９９．７％、少なくとも約９９．８％、少なくとも約９９．９％、少なくとも約９９．９９％、少なくとも約９９．９９９％、またはそれ以上の臨床的特異性で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類する臨床的特異性は、ある状態にない被検者（例えば、がんについて臨床検査結果が陰性の被検者）から取得された、その状態について正常として正しく識別または分類される医学的画像のパーセンテージとして計算されてもよい。

[090]訓練済アルゴリズムは、医学的画像を、少なくとも約０．５０、少なくとも約０．５５、少なくとも約０．６０、少なくとも約０．６５、少なくとも約０．７０、少なくとも約０．７５、少なくとも約０．８０、少なくとも約０．８１、少なくとも約０．８２、少なくとも約０．８３、少なくとも約０．８４、少なくとも約０．８５、少なくとも約０．８６、少なくとも約０．８７、少なくとも約０．８８、少なくとも約０．８９、少なくとも約０．９０、少なくとも約０．９１、少なくとも約０．９２、少なくとも約０．９３、少なくとも約０．９４、少なくとも約０．９５、少なくとも約０．９６、少なくとも約０．９７、少なくとも約０．９８、少なくとも約０．９９、またはそれ以上の曲線下面積（ＡＵＣ：Ａｒｅａ－Ｕｎｄｅｒ－Ｃｕｒｖｅ）で分類するように構成されてもよい。ＡＵＣは、医学的画像を含むデータセットを正常または疑わしいとして分類する際に訓練済アルゴリズムに関連付けられる受信者操作特性（ＲＯＣ）曲線の積分（例えば、ＲＯＣ曲線下の面積）として計算されてもよい。

[091]訓練済アルゴリズムは、がんを識別するパフォーマンス、精度、ＰＰＶ、ＮＰＶ、臨床的感度、臨床的特異性、またはＡＵＣのうちの１つまたは複数を改善するために、調節または微調整されてもよい。訓練済アルゴリズムは、訓練済アルゴリズムのパラメータ（例えば、本明細書の他で説明されるような医学的画像を含むデータセットを分類するために使用される切り捨て値のセット、またはニューラルネットワークのパラメータもしくは重み）を調節することによって調節または微調整されてもよい。訓練済アルゴリズムは、訓練プロセスの間、または訓練プロセスが完了した後、絶え間なく調節または微調整されてもよい。

[092]最初に訓練済アルゴリズムが訓練された後、入力のサブセットは、高品質な分類を行うために含まれる、最も影響するものまたは最も重要なものとして識別されてもよい。例えば、医学的画像を含むデータセットの複数の特徴のサブセットは、高品質な分類またはがんの識別を行うために含まれる、最も影響するものまたは最も重要なものとして識別されてもよい。医学的画像を含むデータセットの複数の特徴またはそのサブセットは、高品質な分類またはがんの識別に向けて、それぞれ個々の特徴の影響度または重要性を示す分類メトリクスに基づいてランク付けされてもよい。そのようなメトリクスを使用して、場合によっては著しく、訓練済アルゴリズムを所望のパフォーマンスレベルまで訓練するために使用され得る入力変数（例えば、予測変数）の数を減らすことができる（例えば、所望の最小精度、ＰＰＶ、ＮＰＶ、臨床的感度、臨床的特異性、ＡＵＣ、またはそれらの組合せに基づいて）。例えば、訓練済アルゴリズムに数十から数百の入力変数を含む複数の変数を用いて訓練済アルゴリズムを訓練することが、９９％より高い分類の精度となる場合、代わりに複数の変数のうち、そのような最も影響があるか最も重要な入力変数の約５以下、約１０以下、約１５以下、約２０以下、約２５以下、約３０以下、約３５以下、約４０以下、約４５以下、約５０以下、または約１００以下の選択されたサブセットだけを用いて訓練済アルゴリズムを訓練することは、低下はするが、なお許容可能な分類の精度（例えば、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％）を与えることが可能である。サブセットは、複数の入力変数全体をランク付け順にすること、および予め定められた数（例えば、約５以下、約１０以下、約１５以下、約２０以下、約２５以下、約３０以下、約３５以下、約４０以下、約４５以下、約５０以下、または約１００以下）の最良の分類メトリクスを有する入力変数を選択することによって選択されてもよい。

がんを識別すること、またはモニタリングすること
[093]訓練済アルゴリズムを使用して被検者の身体の部位の複数の医学的画像を含むデータセットを処理して、画像を正常、曖昧、または疑わしいとして分類した後、がんは被検者内で識別またはモニタリングされてもよい。識別は、少なくとも部分的に、正常、曖昧、もしくは疑わしいという画像の分類、医学的画像を含むデータセットから抽出した複数の特徴、および／または被検者の臨床健康データに基づいて行われてもよい。識別は、放射線科医、複数の放射線科医、または訓練済アルゴリズムによって行われてもよい。

[094]がんは、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上の精度で、被検者内で識別されてもよい。がんを識別する精度は、がんを有するまたは有さないとして正しく識別または分類される、独立的な検査の被検者（例えば、がんがあると分かっている被検者、またはがんについての臨床検査結果が陰性である被検者）のパーセンテージとして計算されてもよい。

[095]がんは、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上の陽性予測値（ＰＰＶ）で、被検者内で識別されてもよい。がんを識別するＰＰＶは、本当にがんを有する被検者に相当する、がんを有するとして識別または分類される独立的な検査の被検者のパーセンテージとして計算されてもよい。

[096]がんは、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上の陰性予測値（ＮＰＶ）で、被検者内で識別されてもよい。訓練済アルゴリズムを使用してがんを識別するＮＰＶは、本当にがんを有さない被検者に相当する、がんを有さないとして識別または分類される独立的な検査の被検者のパーセンテージとして計算されてもよい。

[097]がんは、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、少なくとも約９９．１％、少なくとも約９９．２％、少なくとも約９９．３％、少なくとも約９９．４％、少なくとも約９９．５％、少なくとも約９９．６％、少なくとも約９９．７％、少なくとも約９９．８％、少なくとも約９９．９％、少なくとも約９９．９９％、少なくとも約９９．９９９％、またはそれ以上の臨床的感度で、被検者内で識別されてもよい。がんを識別する臨床的感度は、がんを有するとして正しく識別または分類される、がんの存在に関連付けられる独立的な検査の被検者（例えば、がんがあると分かっている被検者）のパーセンテージとして計算されてもよい。

[098]がんは、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、少なくとも約９９．１％、少なくとも約９９．２％、少なくとも約９９．３％、少なくとも約９９．４％、少なくとも約９９．５％、少なくとも約９９．６％、少なくとも約９９．７％、少なくとも約９９．８％、少なくとも約９９．９％、少なくとも約９９．９９％、少なくとも約９９．９９９％、またはそれ以上の臨床的特異性で、被検者内で識別されてもよい。がんを識別する臨床的特異性は、がんを有さないとして正しく識別または分類される、がんがないことに関連付けられる独立的な検査の被検者（例えば、がんについての臨床検査結果が陰性である被検者）のパーセンテージとして計算されてもよい。

[099]いくつかの実施形態では、被検者は、がんのリスクがあるとして識別されてもよい。被検者をがんのリスクがあるとして識別した後、リスクがあるとして被験者が識別されたがんに少なくとも部分的に基づいて、被検者には臨床的介入が選択されてもよい。いくつかの実施形態では、臨床的介入は、複数の臨床的介入から選択される（例えば、様々なタイプのがんに対し臨床的に示される）。

[100]いくつかの実施形態では、訓練済アルゴリズムは、被検者が、少なくとも約５％、少なくとも約１０％、少なくとも約１５％、少なくとも約２０％、少なくとも約２５％、少なくとも約３０％、少なくとも約３５％、少なくとも約４０％、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれ以上で、がんのリスクがあると判定してもよい。

[101]訓練済アルゴリズムは、被検者が、少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８１％、少なくとも約８２％、少なくとも約８３％、少なくとも約８４％、少なくとも約８５％、少なくとも約８６％、少なくとも約８７％、少なくとも約８８％、少なくとも約８９％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、少なくとも約９９．１％、少なくとも約９９．２％、少なくとも約９９．３％、少なくとも約９９．４％、少なくとも約９９．５％、少なくとも約９９．６％、少なくとも約９９．７％、少なくとも約９９．８％、少なくとも約９９．９％、少なくとも約９９．９９％、少なくとも約９９．９９９％、またはそれ以上の精度で、がんのリスクがあると判定してもよい。

[102]被検者が、がんを有していると識別すると、被検者には、任意選択で、治療的介入がなされてもよい（例えば、被検者のがんを処置するための適当な一連の処置を処方する）。治療的介入は、有効量の薬物の処方、がんのさらなる検査もしくは評価、がんのさらなるモニタリング、またはそれらの組合せを含んでもよい。被検者が現在一連の処置によりがんの処置中である場合、治療的介入は、その後の異なる一連の処置（例えば、現在の一連の処置が有効性でないため、処置の有効性を大きくすること）を含んでもよい。

[103]治療的介入は、がんの診断を確かめるために被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、胸部Ｘ線、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、またはそれらのあらゆる組合せを含んでもよい。

[104]画像の正常、曖昧、または疑わしいという分類、医学的画像を含むデータセットから抽出した複数の特徴、および／または被検者の臨床健康データは、患者（例えば、がんのある被検者またはがんを処置中の被検者）をモニタリングするために一定期間に渡って評価されてもよい。場合によっては、患者の医学的画像の分類は、一連の処置の間に変わってもよい。例えば、有効な処置によってがんのリスクが低下している患者のデータセットの特徴は、健康な被検者（例えば、がんのない被検者）のプロファイルまたは分布に近づくようにシフトする場合がある。逆に、例えば、有効ではない処置によってがんのリスクが上昇している患者のデータセットの特徴は、がんのリスクがより高い被検者またはさらに進行したがんを有する被検者のプロファイルまたは分布に近づくようにシフトする場合がある。

[105]被検者のがんは、被検者のがんを処置するための一連の処置をモニタリングすることによってモニタリングされてもよい。モニタリングすることは、２つ以上の時間的ポイントで被検者のがんを評価することを含んでもよい。評価することは、少なくとも、正常、曖昧、もしくは疑わしいという画像の分類、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイントのそれぞれで判定された被検者の臨床健康データに基づいていてもよい。

[106]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイント間で判定された被検者の臨床健康データは、（ｉ）被検者のがんの診断、（ｉｉ）被検者のがんの予後、（ｉｉｉ）被検者のがんのリスクの上昇、（ｉｖ）被検者のがんのリスクの低下、（ｖ）被検者のがんを処置するための一連の処置の有効性および、（ｖｉ）被検者のがんを処置するための一連の処置の非有効性などの、１つまたは複数の臨床的指標を示す場合がある。

[107]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんの診断を示す場合がある。例えば、早い時間的ポイントにおいて被検者にがんが検出されていなかったが、後の時間的ポイントでは被検者にがんが検出された場合、その差は、被検者にがんがあるという診断を示す。臨床的行為または決定は、例えば被検者に新しい治療的介入を処方することなど、被検者にがんがあるという診断のこの指標に基づいて行われてもよい。臨床的行為または決定は、がんの診断を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、胸部Ｘ線、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、またはそれらのあらゆる組合せを含んでもよい。

[108]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんの予後を示す場合がある。

[109]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんのリスクが上昇していることを示す場合がある。例えば、早い時間的ポイントと後の時間的ポイントの両方において、被検者にがんが検出され、かつその差が正の差（例えば、早い時間的ポイントから後の時間的ポイントに向けて大きくなる）である場合、その差は、被検者のがんのリスクが上昇していることを示す場合がある。臨床的行為または決定は、例えば被検者に新しい治療的介入を処方すること、または治療的介入を切り替えること（例えば、現在の処置を終了して新しい処置を処方すること）など、がんのリスクが上昇しているというこの指標に基づいて行われてもよい。臨床的行為または決定は、がんのリスクの上昇を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、胸部Ｘ線、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、またはそれらのあらゆる組合せを含んでもよい。

[110]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんのリスクが低下していることを示す場合がある。例えば、早い時間的ポイントと後の時間的ポイントの両方において、被検者にがんが検出され、かつその差が負の差（例えば、早い時間的ポイントから後の時間的ポイントに向けて小さくなる）である場合、その差は、被検者のがんのリスクが低下していることを示す場合がある。臨床的行為または決定は、被検者について、がんのリスクが低下しているというこの指標に基づいて行われてもよい（例えば、現在の治療的介入を継続するか終了すること）。臨床的行為または決定は、がんのリスクの低下を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、胸部Ｘ線、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、またはそれらのあらゆる組合せを含んでもよい。

[111]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんを処置するための一連の処置の有効性を示す場合がある。例えば、早い時間的ポイントにおいて被検者にがんが検出されたが、後の時間的ポイントでは被検者にがんが検出されなかった場合、その差は、被検者のがんを処置するための一連の処置の有効性を示す。臨床的行為または決定は、被検者のがんを処置するための一連の処置の有効性のこの指標に基づいて行われてもよく、例えば、被検者に対して現在の治療的介入を継続するか終了する。臨床的行為または決定は、がんを処置するための一連の処置の有効性を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、胸部Ｘ線、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、またはそれらのあらゆる組合せを含んでもよい。

[112]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および／または２つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんを処置するための一連の処置の非有効性を示す場合がある。例えば、早い時間的ポイントと後の時間的ポイントの両方において、被検者にがんが検出され、かつその差が正またはゼロの差（例えば、早い時間的ポイントから後の時間的ポイントに向けて大きくなるか、一定レベルのまま）であり、また有効な処置が早い時間的ポイントで示された場合、その差は、被検者のがんを処置するための一連の処置の非有効性を示す場合がある。臨床的行為または決定は、被検者のがんを処置するための一連の処置の非有効性のこの指標に基づいて行われてもよく、例えば、被検者に対して、現在の治療的介入を終了する、および／または異なる新しい治療的介入に切り替える（例えば、処方する）。臨床的行為または決定は、がんを処置するための一連の処置の非有効性を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法（ＣＴ）スキャン、磁気共鳴画像法（ＭＲＩ）スキャン、超音波スキャン、胸部Ｘ線、陽電子放出断層撮影法（ＰＥＴ）スキャン、ＰＥＴ－ＣＴスキャン、またはそれらのあらゆる組合せを含んでもよい。

[113]疾患のレポートを出力すること
[114]被検者において、がんが識別された後、または疾患もしくはがんのリスクの上昇がモニタリングされた後、被検者の疾患またはがんを示す（例えば、疾患またはがんを識別するかその指標を提供する）レポートが電子的に出力されてもよい。被検者は、疾患またはがんを表していなくてもよい（例えば、合併症など疾患またはがんが無症候性のものである）。レポートは、ユーザの電子デバイスのグラフィカルユーザインターフェース（ＧＵＩ）に提示されてもよい。ユーザは、被検者、介護者、医師、看護師、または別の医療ワーカーであってもよい。

[115]レポートは、（ｉ）被検者のがんの診断、（ｉｉ）被検者の疾患またはがんの予後、（ｉｉｉ）被検者の疾患またはがんのリスクの上昇、（ｉｖ）被検者の疾患またはがんのリスクの低下、（ｖ）被検者の疾患またはがんを処置するための一連の処置の有効性、（ｖｉ）被検者の疾患またはがんを処置するための一連の処置の非有効性、（ｖｉｉ）疾患またはがんの部位および／または疑わしさのレベル、および（ｖｉｉｉ）疾患またはがんの提案される一連の診断の有効性尺度などの、１つまたは複数の臨床的指標を含んでもよい。レポートは、このような１つまたは複数の臨床的指標に基づいて行われた、１つまたは複数の臨床的行為または決定を含んでもよい。そのような臨床的行為または決定は、治療的介入、または被検者の疾患またはがんのさらなる臨床的な評価もしくは検査を対象としたものであってもよい。

[116]例えば、被検者の疾患またはがんの診断の臨床的指標は、被検者に対する新しい治療的介入を処方する臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんのリスクの上昇の臨床的指標は、被検者に対する新しい治療的介入を処方すること、または治療的介入を切り替えること（例えば、現在の処置を終了して新しい処置を処方すること）の臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんのリスクの低下の臨床的指標は、被検者に対して現在の治療的介入を継続するか終了する臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんを処置するための一連の処置の有効性の臨床的指標は、被検者に対して現在の治療的介入を継続するか終了する臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんを処置するための一連の処置の非有効性の臨床的指標は、被検者について現在の治療的介入を終了する、および／または異なる新しい治療的介入に切り替える（例えば、処方する）臨床的行為を伴ってもよい。別の例として、疾患またはがんの部位の臨床的指標は、新しい診断的検査を処方する臨床的行為、特に指標のターゲットとなり得るその検査のあらゆる特定のパラメータを伴ってもよい。

コンピュータシステム
[117]本開示は、本開示の方法を実装するようプログラムされたコンピュータシステムを提供する。図４は、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することを行うようにプログラムされた、または構成されたコンピュータシステム４０１を示す。

[118]コンピュータシステム４０１は、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することなど、本開示の分析、計算、および生成の様々な態様を調節することが可能である。コンピュータシステム４０１は、ユーザの電子デバイスまたは電子デバイスに対してリモートに配置されるコンピュータシステムであり得る。電子デバイスは、モバイル型の電子デバイスであることが可能である。

[119]コンピュータシステム４０１は、中央処理装置（ＣＰＵ、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも称される）４０５を含み、ＣＰＵ４０５はシングルコアまたはマルチコアのプロセッサであってもよく、または並列処理向けの複数のプロセッサであることができる。コンピュータシステム４０１はまた、メモリもしくはメモリロケーション４１０（例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ）、電子記憶装置４１５（例えば、ハードディスク）、１つもしくは複数の他のシステムとの通信するための通信インターフェース４２０（例えば、ネットワークアダプタ）、ならびにキャッシュ、他のメモリ、データ記憶装置、および／または電子ディスプレイアダプタなどの周辺デバイス４２５を含む。メモリ４１０、記憶装置４１５、インターフェース４２０および周辺デバイス４２５は、マザーボードなどの通信バス（実線）を通じてＣＰＵ４０５と通信している。記憶装置４１５は、データを記憶するためのデータ記憶装置（またはデータリポジトリ）であってもよい。コンピュータシステム４０１は、通信インターフェース４２０に助けられてコンピュータネットワーク（「ネットワーク」）４３０に動作可能に結合することが可能である。ネットワーク４３０は、Ｉｎｔｅｒｎｅｔ、インターネットおよび／もしくはエクストラネット、またはＩｎｔｅｒｎｅｔと通信するイントラネットおよび／もしくはエクストラネットであり得る。

[120]一部の事例では、ネットワーク４３０は、電気通信および／またはデータネットワークである。ネットワーク４３０は、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる１つまたは複数のコンピュータサーバを含むことが可能である。例えば、１つまたは複数のコンピュータサーバは、ネットワーク４３０（「クラウド」）上でクラウドコンピューティングに、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することなど、本開示の分析、計算、および生成の様々な態様を実行させることが可能である。そのようなクラウドコンピューティングは、例えば、ＡｍａｚｏｎＷｅｂＳｅｒｖｉｃｅｓ（ＡＷＳ）、ＭｉｃｒｏｓｏｆｔＡｚｕｒｅ、ＧｏｏｇｌｅＣｌｏｕｄＰｌａｔｆｏｒｍ、およびＩＢＭｃｌｏｕｄなどの、クラウドコンピューティングプラットフォームによって実現することができる。ネットワーク４３０は、一部の事例ではコンピュータシステム４０１に助けられて、ピアツーピアネットワークを実装することが可能であり、ピアツーピアネットワークは、コンピュータシステム４０１に結合されたデバイスが、クライアントまたはサーバとして振る舞えるようにすることが可能である。

[121]ＣＰＵ４０５は、１つもしくは複数のコンピュータプロセッサおよび／または１つもしくは複数のグラフィック処理ユニット（ＧＰＵ）を含んでもよい。ＣＰＵ４０５は、プログラムまたはソフトウェアとして具体化可能な機械可読命令のシーケンスを実行することが可能である。命令は、メモリ４１０などのメモリロケーションに記憶することができる。命令は、ＣＰＵ４０５に送ることが可能であり、続いてＣＰＵ４０５が本開示の方法を実装するようプログラムまたは構成することが可能である。ＣＰＵ４０５によって実行される動作の例としては、フェッチ、デコーダ、実行、およびライトバックを挙げることが可能である。

[122]ＣＰＵ４０５は、集積回路などの回路の一部であることが可能である。システム４０１の１つまたは複数の他のコンポーネントは、回路に含まれることが可能である。場合によっては、回路は特定用途向け集積回路（ＡＳＩＣ）である。

[123]記憶装置４１５は、ドライバ、ライブラリ、および保存されたプログラムなどのファイルを記憶することが可能である。記憶装置４１５は、例えば、ユーザ設定およびユーザプログラムなどのユーザデータを記憶することができる。コンピュータシステム４０１は、一部の事例では、イントラネットまたはＩｎｔｅｒｎｅｔを通じてコンピュータシステム４０１と通信するリモートサーバ上に配置されるなど、コンピュータシステム４０１の外部にある１つまたは複数の追加的なデータ記憶装置を含むことが可能である。

[124]コンピュータシステム４０１は、ネットワーク４３０を通じて１つまたは複数のリモートのコンピュータシステムと通信することが可能である。例えば、コンピュータシステム４０１は、ユーザのリモートのコンピュータシステムと通信することが可能である。リモートコンピュータシステムの例としては、パーソナルコンピュータ（例えば、ポータブルのＰＣ）、スレートまたはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ対応デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、または携帯情報端末が挙げられる。ユーザは、ネットワーク４３０を介してコンピュータシステム４０１にアクセスすることが可能である。

[125]本明細書で説明される方法は、コンピュータシステム４０１の電子記憶ロケーション上、例えばメモリ４１０または電子記憶装置４１５上に記憶された機械（例えば、コンピュータプロセッサ）実行可能コードによって実装することが可能である。機械実行可能または機械可読コードは、ソフトウェアの形態で提供される場合がある。使用中、コードはプロセッサ４０５によって実行可能である。場合によっては、コードは、記憶装置４１５から取り出すことが可能であり、プロセッサ４０５による容易なアクセスのために、メモリ４１０に記憶され得る。一部の状況では、電子記憶装置４１５は除外される可能性があり、機械実行可能命令はメモリ４１０に記憶される。

[126]コードは、コードを実行するように構成されたプロセッサを有する機械での使用のためにプリコンパイルされて設定することが可能であるか、ランタイム中にコンパイルすることが可能である。コードは、プリコンパイルまたはアズコンパイルされた様式でコードが実行され得るように選択され得る、プログラミング言語として供給することが可能である。

[127]コンピュータシステム４０１などの本明細書で提供されるシステムおよび方法の態様は、プログラミングとして具体化することが可能である。技術の様々な態様は、通常は機械（またはプロセッサ）実行可能コード、および／またはあるタイプの機械可読媒体で実行されるか具体化される関連データの形態の「製品」または「製造物品」として考えてもよい。機械実行可能コードは、メモリ（例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスクなどの電子記憶装置に記憶することが可能である。「記憶」タイプの媒体としては、コンピュータ、プロセッサなど、または様々な半導体メモリ、テープドライブ、ディスクドライブなどの、その関連モジュールの有形なメモリのいずれか、またはすべてを挙げることが可能であり、これらはいつでもソフトウェアプログラミング用に非一時的な記憶を実現することができる。ソフトウェアのすべてまたは一部は、Ｉｎｔｅｒｎｅｔまたは様々な他の電気通信ネットワークを通じて、時々通信される場合がある。そのような通信は、例えば、ソフトウェアを１つのコンピュータまたはプロセッサから別のものにロードすること、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームにロードすることを可能にすることができる。故に、ソフトウェア要素を運び得る別のタイプの媒体としては、有線および光学固定電話（ｌａｎｄｌｉｎｅ）ネットワークを通じる、ならびに様々な無線（ａｉｒ－ｌｉｎｋ）上での、ローカルデバイス間の物理的インターフェース間で使用されるような、光学的、電気的、および電磁的な波が挙げられる。そのような波を搬送する、有線または無線リンク、光学リンクなどの物理的な要素はまた、ソフトウェアを運ぶ媒体と考えることができる。本明細書で使用される場合、非一時的な、有形の「記憶」媒体として限定されない限り、コンピュータまたは機械「可読媒体」という用語は、命令を実行用にプロセッサに提供することに関与するあらゆる媒体を指す。

[128]したがって、コンピュータ実行可能コードなどの機械可読媒体は、有形な記憶媒体、搬送波媒体、または物理的な送信媒体を含む形態を取ることができるが、それに限定されなくてもよい。非揮発性の記憶媒体としては、例えば図面に示される、光学または磁気ディスク、あらゆるコンピュータなどの記憶デバイスにおけるいずれか、データベースを実装するために使用され得るものなど、が挙げられる。揮発性の記憶媒体としては、そのようなコンピュータプラットフォームの主メモリなどの動的メモリが挙げられる。有形の送信媒体としては、同軸ケーブル、銅線、および光ファイバが挙げられ、コンピュータシステム内のバスを含む配線が含まれる。搬送波送信媒体は、高周波（ＲＦ）および赤外（ＩＲ）データ通信中に生成されるような、電気的もしくは電磁気的な信号、または音響波もしくは光波の形態を取る場合がある。したがって、コンピュータ可読媒体の一般的な形態としては、例えば以下が挙げられる：フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、あらゆる他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、あらゆる他の光学媒体、パンチカード紙テープ、孔のパターンを有するあらゆる他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、あらゆる他のメモリチップもしくはカートリッジ、データもしくは命令を移送する搬送波、そのような搬送波を移送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび／もしくはデータを読み出すことができるあらゆる他の媒体。コンピュータ可読媒体のこのような形態の多くは、１つまたは複数の命令の１つまたは複数のシーケンスを実行用にプロセッサに搬送するのに関与する可能性がある。

[129]コンピュータシステム４０１は、電子ディスプレイ４３５を含むか、電子ディスプレイ４３５と通信することが可能であり、電子ディスプレイ４３５は、例えば訓練済アルゴリズムの訓練およびテストを示す視覚的表示、正常、曖昧、または疑わしいとしての分類を示す画像データの視覚的表示、がんを有するという被検者の識別情報、または被検者のがんを示す電子的レポート（例えば、診断または放射線医学的レポート）を提供するためのユーザインターフェース（ＵＩ）４４０を含む。ＵＩの例としては、限定しないが、グラフィカルユーザインターフェース（ＧＵＩ）およびウェブベースのユーザインターフェースが挙げられる。

[130]本開示の方法およびシステムは、１つまたは複数のアルゴリズムによって実装することが可能である。アルゴリズムは、中央処理装置４０５によって実行されると、ソフトウェアにより実装される。アルゴリズムは、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することが可能である。

実施例
[131]

リアルタイム放射線医学を用いた患者ケアの改善
[132]本開示のシステムおよび方法を使用して、リアルタイム放射線医学スクリーニングおよび診断ワークフローを、複数の患者に対して行った。例として、リアルタイム放射線医学のクリニックの第１日目に、患者は正常な事例についての即時結果を受け取り、患者の感情は安心して落ち着いたものとなった。

[133]別の例として、リアルタイム放射線医学のクリニックの翌日に、別の患者はスクリーニング中に疑わしいという所見を受け取り、疑わしい所見について３時間以内に診断的なフォローアップが行われた。患者は放射線科医に、その所見は良性であり、がんがあると疑われないと伝えられた。患者は非常に安心し、最終診断結果を待つ心配が避けられて喜んだ。米国では、どこでも平均して、そのようなプロセスは２週間から８週間かかることがある。迅速なワークフローを持つ特定のクリニックでも、リアルタイム放射線医学の支援がない場合は、プロセスには１～２週間かかる場合がある。

[134]別の例として、リアルタイム放射線医学のクリニックでの別の日に、ＡＩベースのリアルタイム放射線医学システムは、３ｍｍの乳癌腫瘍を検出し、これは５日後に生検によってがんであると確かめられた。図５は、開示される実施形態による、放射線科医によって検出される様々なサイズ（２ｍｍから２９ｍｍの範囲）の乳癌腫瘍の検出頻度の例示的なプロットを示す。リアルタイム放射線医学システムは、処置する時間を低減することによって、救命上の臨床的影響力を提供することができる。がんは、この患者が自身の次のスクリーニングまたは診断手順を受けるまで成長し続ける可能性があり、その時には、除去や処置がより生命を脅かすもの、痛みがあり、高額となり、成功率が低くなっている場合がある。

[135]リアルタイム放射線医学のクリニックの別の例として、患者は１時間以内に疑わしい所見についての診断的なフォローアップ手順を受け取った。生検が必要とされたが、患者がアスピリンを服用していたので生検は翌診療日に完了した。生検は、リアルタイム放射線医学によって検出されたがんを確かめた。放射線医学的なワークアップ期間は、８診療日から１日に低減し、診断にかかる時間は１カ月から１週間に低減した。

[136]リアルタイム放射線医学システムの臨床的影響力は、ＰＰＶ１およびコールバック率などのスクリーニングマンモグラフィメトリクスによって測定されてもよい。ＰＰＶ１は一般に、１年以内にがんと組織診断される、放射線科医による異常初期解釈の診察のパーセンテージを称する。コールバック率は一般に、異常初期解釈の診察のパーセンテージを称する（例えば、「リコール率」）。６週間のスパンの間、リアルタイム放射線医学のクリニックは７９６患者の事例を、ＡＩベースの分析を用いて処理し、そのうち９４事例はリアルタイムに放射線科医によって読影されるべきであるとフラグが立てられた。全部で４事例ががんと診断され、そのうち３事例が（例えば、生検によって）がんであると確かめられた。

[137]図６は、開示される実施形態による、スクリーニングマンモグラフィからの陽性予測値（ＰＰＶ１）対コールバック率の例示的なプロットを示す。前向きな調査では、コールバック率１１．８％でＰＰＶ１が３．２％となった。対照的に、中間的な放射線科医は、コールバック率１１．６％でＰＰＶ１が４．４％を有する。

[138]図７は、開示される実施形態による、放射線科医の第１のセット、放射線科医の第２のセット、および放射線科医の合計セット全体についての、ＡＩソートされたバッチにおける画像を読影するための解釈時間（Ｂｉ－ＲＡＤＳＡｓｓｅｓｓｍｅｎｔ、および密度を含む）（左）と、ランダムにシャッフルされたバッチを読影したコントロールに対する解釈時間のパーセンテージ改善（右）とを比較する例示的なプロットを示す。この図面は、ＡＩ駆動のワークフローが、放射線科医の生産性を統計的にかなりの程度まで（約１３％から２１％の範囲で）改善できることを示している。

[139]

深層ニューラルネットワークを用いるスクリーニングマンモグラフィにおける疑わしい所見の分類
[140]深層学習は、多様なコンピュータビジョンおよび画像処理の用途に適用され得る。例えば、深層学習は、所与のタスクに関連する画像特徴を自動的に学習するために使用されてもよく、分類、検出から、セグメント化に渡る様々なタスクに使用される場合がある。深層ニューラルネットワーク（ＤＮＮ）に基づく計算科学的モデルは、スクリーニングマンモグラフィなどの放射線医学的用途で開発され、疑わしさを識別するために、可能性としては異常または高リスク病変を識別するために使用され、放射線科医の生産性を向上することができる。場合によっては、深層学習モデルは、人間レベルのパフォーマンスに匹敵するか、それを上回ることさえできる。加えて、深層学習を使用して、一般的な放射線科医のパフォーマンスが乳房イメージング専門家のパフォーマンスに近づくよう高めることを支援することができる。例えば、一般的な放射線科医は通常、フェローシップに訓練された乳房放射線科医と比べて、がんの検出率が低く、リコール率がずっと高い。

[141]深層学習は、悪性と良性の所見の区別を含め、スクリーニングマンモグラフィの解釈を行うために使用することが可能である。ＤＮＮモデルは、このタスク向けに訓練され、特に専門家ではない読影者のために、見逃されたがんを識別する、または偽陽性のコールバックを減少させる。

[142]ＤＮＮモデルは、一般向けにアクセス可能なＤｉｇｉｔａｌＤａｔａｂａｓｅｆｏｒＳｃｒｅｅｎｉｎｇＭａｍｍｏｇｒａｐｈｙ（ＤＤＳＭ）データセット（ｅｎｇ．ｕｓｆ．ｅｄｕ／ｃｖｐｒｇ／Ｍａｍｍｏｇｒａｐｈｙ／Ｄａｔａｂａｓｅ．ｈｔｍｌ）を使用して訓練された。ＤＤＳＭは、１０，０００を超えるデジタル化されたスキャンフィルムのマンモグラフィ画像を伴う２，６２０の症例を含む。画像は、正常なマンモグラムと、疑わしい所見があるマンモグラムとに、均等に分割された。正常なマンモグラムは、患者の４年間フォローアップを経て確かめられた。疑わしい所見は、生検証明の良性の所見（５１％）と生検証明の悪性の所見（４９％）とに、さらに分割された。慣例的な臨床ケアの一部として、生検によってフォローアップされない明らかに良性の所見を持つすべての事例は、データセットから除外された。結果として、このデータセットで良性と悪性の所見を見分けることは、典型的な臨床的マンモグラフィスクリーニングのシナリオよりも困難な場合がある。

[143]ＤＤＳＭデータセットは、訓練データセットを含むサブセット、検証データセット、およびテスト用データセットに分割された。訓練データセットを使用して、ＤＮＮは、乳房の良性の所見または正常領域と悪性の所見とを見分けるように訓練された。データセットは、深層学習プロセスを導くにあたり極めて重要な場合がある、画像内で腫瘍の場所を指摘するアノテーションを含んでいた。

[144]この二値分類タスクに対するＤＮＮのパフォーマンスは、受信者操作特性（ＲＯＣ）曲線の使用を通じてテスト用データセットに対して評価された（図８に示される通り）。ＤＮＮモデルは、悪性と良性の所見とを、ＲＯＣ曲線（ＡＵＣ）の０．８９より下の面積によって示されるような高い精度で見分けるために使用された。対照的に、放射線専門医は通常、スクリーニングマンモグラフィでのがん検出のタスクについては、８４．４％の感度と９０．８％の特異性を達成することができる。ＤＮＮモデルは、ＤＤＳＭデータセットに見られるより難しい事例で、悪性と良性の所見とを、７９．２％の感度と８０．０％の特異性で見分けるために使用された。放射線専門医に対するパフォーマンスのギャップは、一部、データセットのサイズが比較的小さいことに起因しており、より大きな訓練データセットを組み込むことにより軽減することができる。さらには、ＤＮＮモデルは、精度、感度、特異性、ＡＵＣ、陽性予測値、陰性予測値、またはそれらの組合せに関して、一般的な放射線科医を上回るようにさらに構成することができる。

[145]高精度のＤＮＮモデルが、限定的な一般向けのベンチマークデータセットを訓練することによって開発された。データセットは恐らく臨床的なセッティングにおけるものより困難であるが、ＤＮＮモデルは、ほぼ人間レベルのパフォーマンスで悪性と良性の所見とを見分けることができた。

[146]同様のＤＮＮモデルが、セントルイス・ワシントン大学とパートナーシップ関係にあるセントルイスのＪｏａｎｎｅＫｎｉｇｈｔＢｒｅａｓｔＨｅａｌｔｈＣｅｎｔｅｒの臨床的なマンモグラフィデータセットを使用して訓練されてもよい。このデータセットは大規模な医療記録データベースを含んでおり、１０万人を上回る患者を含み、４０００例の生検確認のがん患者、１５０万画像から成る４０万を超える画像セッションが含まれる。データセットは、深層学習プロセスを最適化するために、手動または自動でラベル付けされてもよい（例えば、アノテーションをビルドすることによって）。ＤＮＮのパフォーマンスは訓練データセットのサイズとともに著しく改善するため、この一意で膨大かつ豊富なデータセットにより、ＤＤＳＭデータに対して訓練されたＤＮＮモデルと比較してＤＮＮモデルの感度および特異性が劇的に向上する場合がある。このような高精度ＤＮＮモデルは、乳癌スクリーニングに変革的な改善の機会を与え、すべての女性が専門家レベルのケアを受けられるようにする。

[147]

早期がん検出のための人工知能（ＡＩ）駆動の放射線医学クリニック
[148]はじめに
[149]乳癌は、米国の女性に最も広くみられ、２０１７年だけで２５万を超える新規の診断があった。約８人に１人の女性が、その生涯の何らかの時点で乳癌であると診断される。処置の改善に関わらず、米国では４万人を超える女性が毎年乳癌により死亡する。スクリーニングマンモグラフィの広い受診により、一部の乳癌死亡率の低下に大きな進歩があった（１９８９年から３９％低下）。乳癌のスクリーニングは、後期がんと比較して予後がずっと良好であり、処置コストが低い早期がんを識別することを助けることが可能である。この差は非常に重要な可能性がある：限局的な乳癌のある女性は９９％近い５年生存率を有するが、転移性の乳癌のある女性の５年生存率は２７％である。

[150]このような実証されたベネフィットにも関わらず、現在女性の約半分しかＡｍｅｒｉｃａｎＣｏｌｌｅｇｅｏｆＲａｄｉｏｌｏｇｙによって推奨されるレートでマンモグラムを受けていない。このマンモグラフィ利用の低さは、患者にとって、またヘルスケアシステムにとって、出費がかさみコストが高くなるという形で著しい負担となる場合がある。スクリーニングマンモグラフィの受診率は、予約取得の長い遅れ、不明確な価格設定、診察結果を受け取る長い待ち時間、紛らわしいレポートなど、一部患者経験の貧しさにより妨げられる。さらには、価格設定の透明性の欠如から生じる問題は、医療機関同士のコストの大きなバラつきによってひどくなる。同様に、診察結果を受け取るための伝達時間は、医療機関同士で一貫性がない。

[151]加えて、放射線科医のパフォーマンスの著しいバラつきにより、患者は場所と収入に応じて非常に様々なケアの基準を経験することになる。例えば、がん検出率は、１０パーセンタイルの放射線科医と比較して９０パーセンタイルの放射線科医について２倍以上高くなっている。偽陽性率（例えば、健康な患者が誤ってフォローアップ診察にリコールされる割合）には、これらの２つのグループでさらに大きな差がある。米国で行われるすべてのスクリーニング検査を集約すると、コールバックされる約９６％の患者は偽陽性である。がんの大きな社会的そして個人的な負担を、しばしば患者の貧しい経験、一貫性のないスクリーニングパフォーマンス、および大きなコスト変動と併せて考えると、ＡＩベースまたはＡＩ支援のスクリーニング手法が、マンモグラフィスクリーニングのこの臨床的な精度を著しく改善するために開発されることが可能である。

[152]人工知能およびソフトウェアにおけるイノベーションは、がんの早期における正確な検出を含む健康上の結果に著しい改善を達成することに向けて活用することが可能である。このような改善は、コスト透明性、予約のスケジューリング、患者ケア、放射線医学的ワークフロー、診断精度、結果伝達からフォローアップに至る患者の行動において、１つまたは複数のステップに影響を及ぼす可能性がある。イメージングセンターのＡＩ駆動のネットワークは、高品質サービス、適時性、精度、および費用対効果を実現するように開発され得る。そのようなクリニックでは、女性は直ちにマンモグラムをスケジューリングすること、および単一回の訪問で女性が帰る前にがんの診断を受け取ることができる。ＡＩ駆動のクリニックは、本開示の「リアルタイム放射線医学」方法およびシステムを使用することによって、従来的な２回訪問のスクリーニング－診断パラダイムを単一回の訪問に変形することが可能である。人工知能は、トリアージエンジンを使用して臨床的なワークフローを患者ごとにカスタマイズするために、またスクリーニング検査をどのように読み取るかを調整して放射線科医の精度を著しく向上させる（例えば、放射線科医の疲労を低減することにより）ために使用されてもよく、それによってがん検出の精度を改善する。スクリーニング／診断プロセスに対しては、ＡＩベースまたはＡＩ支援の手法を使用して、患者スケジューリング、顧客アウトリーチを通じたスクリーニングガイドライン遵守の改善、および患者が対面するアプリケーションを用いたレポート伝達の適時性など、追加的な改善を実現することが可能である。自己改善システムは、データを生成してＡＩベースのシステムを改善するより良好なクリニックを作り上げるために、ＡＩを使用してもよい。

[153]ＡＩ駆動の放射線科ネットワークを作る重要な構成要素は、患者獲得を通じて成長を進めることである。システムの他の構成要素は放射線医学的ワークフローのプロセスを合理化し、患者に改善および合理化された体験を提供することができる一方で、患者の募集と登録は、高パフォーマンスのために十分なデータを収集してＡＩ駆動システムを訓練するために重要である。

[154]さらには、ＡＩ駆動クリニックは、患者がクリニックに到着する前の患者体験を改善することによって、スクリーニングマンモグラフィに対する支障を低減する場合がある。このことは、受診を制限する２つの主な障壁に対処することを含み得る：（１）診察のコストについての懸念、および（２）便利な場所にあるクリニックに気付かないこと。従来的なクリニックにあるように、価格と利用可能性がまったく不透明な場合、価格とサービスには著しい変動が存在する場合があり、それによって患者の予約のスケジューリングに対する支障となっている。

[155]スケジューリングプロセスを合理化して患者への透明性を与えるためにＡＩベースのユーザアプリケーションが開発されてもよい。アプリケーションは、ユーザの保険がきくクリニックの地図、ならびに予約に利用可能な時間をユーザに提供するように構成されてもよい。健康保険に入っている人には、スクリーニングマンモグラムは２Ｄおよび３Ｄの両方とも自己負担なしである。これは、負担が生じ得るあらゆる潜在的なコストとともに、スケジューリングの時点で患者に明確に示され得る。診察結果の適時性についての保証も患者に提示される場合があり、このことは、患者に予約をスケジューリングすることを億劫にさせ得る、患者の潜在的な不安の原因に対処するものである。

[156]アプリケーションは、患者の保険を確かめて、必要であればスケジューリングプロセスの間に、かかりつけ医（ＰＣＰ）からの作業命令を要求するように構成されてもよい。アプリケーションは、患者のクリニック訪問の間、より効率的に患者を処理するために、予診フォームのユーザ入力を受信するように構成されてもよい。患者に診察の前に完了すべき残りのフォームに残りがあれば、残りのフォームを完了するために患者にはクリニックにチェックインする際にデバイスが与えられる場合がある。アプリケーションは、このようなフォームの電子的な入力を容易にして、現在の標準的なケアで行われるような、手書きの紙のフォームでの時間がかかり、誤りが生じやすいタスクを、低減または除去するように構成されてもよい。診察日に先立って書類のユーザ入力を容易にすることによって、アプリケーションは、患者がより合理化された体験を得られるようにして、オンサイトでの運用上のタスクに割かれる時間とリソースが少なくなる。

[157]患者の以前得られたマンモグラムも、診察に先立って取得される場合がある。提携クリニックで得られた画像では、このプロセスは患者に分かりやすく生じ得る。訪問前に以前の画像を取得することによって、新しく得られる画像を迅速にレビューするための潜在的なボトルネックが除去され得る。

[158]予約をスケジューリングした後、アプリケーションは、出席率を向上させるべく患者に近づく診察についてのリマインダを提供するように構成されてもよい。アプリケーションはまた、不安を最小限にすべく、また診察室で手順の説明に費やす時間を減らすべく、患者に診察手順についての情報を事前に提供するように構成されてもよい。さらには、かかりつけ医（ＰＣＰ）との関係性を築くために、紹介医は自身の患者がマンモグラフィ予約をスケジューリングしているかどうかを確認してもよい。これは、医師がコンプライアンスを評価して、医師の推奨にしたがって適時的に予約を登録していない患者を奨励することができる。

[159]リアルタイム放射線医学システム
[160]従来型の乳癌スクリーニングパラダイムは、患者に不安をもたらす著しい遅れを含む場合がある。これは、この予防的ケアを受けることを選ぶ女性の数を減らし、彼女らのがんの発見が後になるリスクにさらす可能性があり、その時には処置がより困難でより命に関わることになる。通常の患者は、スクリーニングマンモグラムのためにクリニックを訪問し、クリニックで約３０分過ごした後に帰る。女性は、その後３０日間、電話または書面を待機して、スクリーニングマンモグラムに疑わしい異常性があること、そして女性がフォローアップ診断予約をスケジューリングすべきであるという知らせを受け取る。次に、患者はその予約にもう１週間待ち、その間、女性は追加的なイメージングを受け、生検が必要かどうかを判定してもよい。

[161]現在のパラダイムは、大規模実施（例えば、１日あたり１００を上回る患者）でスクリーニングされる患者のボリュームによって動機付けされる。このようなイメージングセンターは、放射線科医が所与の日に行われたスクリーニングマンモグラムをプロセスすることができるより前に、通常少なくとも１～２日分の読影する必要があるスクリーニング診察のバックログを有する。このような事例のいずれかが診断的なワークアップを必要とする場合、その診察は、診断的な診察の長さの大きな変動（例えば、２０分から１２０分に渡る）のために、すぐに行うことができない場合が多い。スケジューリングは、これを考慮せず、結果として患者の待ち時間を長引かせ、技師向けのワークフローが不十分なものとなる。

[162]自身のスクリーニングマンモグラムの即時的なリアルタイムの読影を受け取った患者は、３週間後までそれがない患者に比べてあまり大きな不安を体験しなくてもよい。対照的に、スクリーニングで偽陽性（疑わしいとフラグが立てられた正常な事例）を受け取ったが、即時的な読影を受け取った女性は、正常なマンモグラムを受け取った女性の不安とほぼ同じレベルを体験した。このような女性のほとんどは、自分自身が異常なスクリーンを有すると意識しなかった。しかしながら、異常なスクリーンを有すると意識する女性は、乳房関連の懸念および他の医学的問題について、さらに医学的な注意を探す傾向がある。さらには、女性は、自分自身のマンモグラムの結果とともに自分がマンモグラフィクリニックから帰ると分かっている場合、スクリーニングプロセスにより満足している場合があり、将来的なスクリーニング推奨にずっとしたがいやすい場合がある。そのような患者の満足度の向上は、健康計画におけるメンバー保持を改善し得る。追加的に、疑わしい事例の即時的な読影は、乳癌診断までの時間を減少させる場合があり、それによって患者ケアおよび結果を改善する。

[163]場合によっては、クリニックは、ボリュームを制限することによってリアルタイムのサービスを提供することができる。そのようなクリニックは、必要が生じた場合に患者が診断的な診察を伴うスクリーニング手順を即時的にフォローアップすることができるように、所与の時間に数人の患者だけのスケジューリングをしてもよい。この手順は、高額で、時間がかかり、大規模に行うには受け入れられない場合があり、これはやはりほとんどの女性が、潜在的に生活を変えるような結果を数週間待つ必要があることを意味している。おおまかに４００万人の女性が毎年、そのような不愉快なスクリーニングプロセスに遭遇する可能性がある。

[164]本開示の方法およびシステムを使用して、ＡＩベースのトリアージシステムが、スクリーニングマンモグラフィ向けに開発されてもよい。
[165]スクリーニング診察画像は、臨床的なイメージングシステムから受信されるため、これらの画像は、ＡＩ駆動ＴｒｉａｇｅＥｎｇｉｎｅによって処理されてもよく、次いで、このエンジンは患者の事例を複数のワークフローのうちの１つに階層化する。例えば、複数のワークフローは、２つのカテゴリを含んでもよい（例えば、正常および疑わしい）。別の例として、複数のワークフローは、３つのカテゴリを含んでもよい（例えば、正常、不確実、および疑わしい）。次いで、このようなカテゴリのそれぞれは、担当のワークフローの特定のセットを実施することを専門とする専任の放射線科医の異なるセットによって扱われ得る。

[166]図９は、開示される実施形態による、ＡＩ対応リアルタイム放射線医学システムおよび患者のモバイルアプリケーション（アプリ）を使用する、クリニックを通じた患者フローの概略の例を示す。患者は、ウェブサイトまたは患者用アプリに登録することによって開始する。次に、患者は患者用アプリを使用して放射線医学スクリーニングの予約をスケジューリングする。次に、患者は患者用アプリを使用して予診フォームを完了させる。次に、患者はクリニックに到着してスクリーニング診察を受ける。次に、患者のスクリーニング診察から取得された医学的画像に対してＡＩベースの放射線医学的評価が実施される。次に、患者の画像および診察結果が患者用アプリを通じて患者に提供される。次に、必要があれば、または推奨されれば、患者は患者用アプリを使用して予約を再スケジューリングする。スクリーニング診察プロセスは、以前と同様に進められてもよい。

[167]図１０は、開示される実施形態による、ＡＩ支援放射線医学的評価ワークフローの概略の例を示す。まず、患者の電子カルテ（ＥＨＲ）と医学的画像を含むデータセットが用意される。次に、ＡＩベースのトリアージエンジンは、ＥＨＲと医学的画像を処理してデータセットを分析して、データセットを正常と思われる、疑わしい可能性がある、または疑わしいと思われる、として分類する。次に、ワークフロー分配モジュールは、患者のデータセットを、正常と思われる、疑わしい可能性がある、または疑わしいと思われるとのデータセットの分類に基づいて、それぞれ、正常な場合のワークフロー、不確実な場合のワークフロー、および疑わしい場合のワークフロー、の３つのワークフローのうちの１つに分配する。３つのワークフローのそれぞれは、放射線科医レビューまたはさらなるＡＩベースの分析（例えば、訓練済アルゴリズムによって）を含んでもよい。

[168]マンモグラフィスクリーニング診察の大多数は、正常カテゴリに分類され得る。放射線科医の第１のセットをこのワークフローだけに集中させることによって、「バッチ読影」の概念と価値、およびそれに関連する生産性ゲインが適用され拡張され得る。この放射線科医の第１のセットによって扱われる事例はほとんどすべて正常な事例であり得るため、大幅に変わった事例を扱うことによって生じるコンテキストスイッチおよびペナルティは少ない可能性がある。ＡＩベースのシステムでは、レポートは自動的に事前埋め込みされてもよく、放射線科医がレポートを書くよりも、画像の解釈にかなり多くの時間を費やすことができるようにしている。放射線科医がＡＩ評価の正常事例に同意せず、その事例は疑わしいと考える稀な事例では、そのような事例は普段通りに扱ってもよく、患者は診断的な診察をスケジューリングしてもよい。このような正常事例は、ＡＩベースのシステムが類似していると判定してある事例をグループ化することによって生産性の改善を実現するために、さらにずっと同質なバッチへと、さらにサブ分割されてもよい。例えば、すべてのＡＩ判定の高密度乳房を一緒にバッチ化すること、またはＡＩ導出の特徴に基づいて視覚的に類似している事例をバッチ化すること。

[169]マンモグラフィスクリーニング診察のごく一部は、不確実な場合のワークフローに分類される場合がある。そのようなセッションは、ＡＩシステムは正常であるとして分類しないが、完全に疑わしいというしきい値もまた満足しない所見を伴う場合がある。これらは通常、正常な場合または疑わしい場合のワークフローの事例に比べて、放射線科医評価の１セッション当たりに著しく時間を必要とする非常に複雑な事例であり得る。このような理由で、別個の放射線科医の第２のセットに、この少数の作業を行うよう集中させることが有益な場合があり、この作業はあまり同質性がなく、潜在的に著しく解釈およびレポーティング要求事項が多い。これらの放射線科医は、数年の経験または訓練を通じ、この困難な事例の読影において、より専門性が高い。この専門化は、ＡＩが判定するカテゴリまたは特徴に基づいて、さらにより具体的になる場合がある。例えば、ある放射線科医のグループは、ＡＩ判定の腫瘍塊を正しく評価することについて、他のグループよりも良好なパフォーマンスを見せる場合がある。したがって、アルゴリズムによってそのように識別される診察は、このより好適な専門家のグループにルーティングされてもよい。場合によっては、放射線科医の第２のセットは、放射線科医の第１のセットと同じであるが、異なる事例のセットの放射線医学的評価は、事例の優先順位に基づいて、異なる時間に行われる。場合によっては、放射線科医の第２のセットは、放射線科医の第１のセットのサブセットである。

[170]マンモグラフィスクリーニング診察の最も少数であるが最も重要な部分は、疑わしい場合のワークフローに分類され得る。放射線科医の第３のセットは、この役割に割り当てられてもよく、これらの事例を自身の「オンコール」義務として効果的に読影する。放射線科医の時間のほとんどは、スケジューリングされた診断的な診察を行うのに費やされる場合がある。しかしながら、診察間のダウンタイムでは、放射線科医は、可能な限り早く診断を検証できるように、あらゆる疑わしい事例に対するアラートを受ける場合がある。このような事例は、患者がフォローアップの診断的な診察を可能な限り早く始めることができるように、効率的に扱うために極めて重要な場合がある。場合によっては、放射線科医の第３のセットは、放射線科医の第１のまたは第２のセットと同じであるが、異なる事例のセットの放射線医学的評価は、事例の優先順位に基づいて、異なる時間に行われる。場合によっては、放射線科医の第３のセットは、放射線科医の第１または第２のセットのサブセットである。

[171]場合によっては、ワークフローは、医学的画像を分析して医学的画像の放射線医学的評価を実施する難しさを判定するために、ＡＩベースのアルゴリズムを適用すること、次いで判定された難しさの程度に基づいて、放射線医学的評価のために医学的画像を優先順位付けすること、または医学的画像を（例えば、複数の異なる放射線科医のセットのうちの）放射線科医のセットに割り当てることを含んでもよい。例えば、難しさの低い事例（例えば、より「慣例的な」事例）は、技能または経験の程度が比較的低い放射線科医のセットに割り当てられてもよく、一方で難しさの高い事例（例えば、より疑わしいか、慣例的ではない事例）は、技能または経験の程度が比較的高い放射線科医（専門化された放射線科医）の異なるセットに割り当てられてもよい。例えば、難しさの低い事例（例えば、より「慣例的な」事例）はスケジュールの空きレベルが比較的低い放射線科医の第１のセットに割り当られてもよく、一方で難しさの高い事例（例えば、より疑わしいか、慣例的ではない事例）は、スケジュールの空きレベルが比較的高い放射線科医の異なるセットに割り当てられてもよい。

[172]場合によっては、難しさの程度は、画像を完全に評価するために必要な推定時間長さによって測ってもよい（例えば、約１分、約２分、約３分、約４分、約５分、約６分、約７分、約８分、約９分、約１０分、約１５分、約２０分、約２５分、約３０分、約４０分、約５０分、約６０分、または約６０分より長い）。場合によっては、難しさの程度は、複数の無関係の放射線医学的評価に渡る医学的画像の放射線医学的評価の一致または合意の推定程度によって測ってもよい（例えば、異なる放射線科医によって、または同一の放射線科医によって異なる日に行う）。例えば、放射線医学的評価の一致または合意の推定程度は、約５０％、約５５％、約６０％、約６５％、約７０％、約７５％、約８０％、約８５％、約９０％、約９５％、約９６％、約９７％、約９８％、約９９％、または約９９％より高くてもよい。場合によっては、難しさの程度は、放射線科医の教育、経験、または専門知識の所望のレベルによって測ってもよい（例えば、約１年未満、約１年、１～２年の間、約２年、２～３年の間、約３年、３～４年の間、約４年、４～５年の間、約５年、５～６年の間、約６年、６～７年の間、約７年、７～８年の間、約８年、８～９年の間、約９年、９～１０年の間、約１０年、または約１０年より長い）。場合によっては、難しさの程度は、推定される感度、特異性、陽性予測値（ＰＰＶ）、陰性予測値（ＮＰＶ）、または放射線医学的評価の精度（例えば、約５０％、約５５％、約６０％、約６５％、約７０％、約７５％、約８０％、約８５％、約９０％、約９５％、約９６％、約９７％、約９８％、約９９％、または約９９％より高い）によって測ってもよい。

[173]場合によっては、ワークフローは、医学的画像を分析して医学的画像のカテゴリ化を判定するために、ＡＩベースのアルゴリズムを適用すること、次いで判定された医学的画像のカテゴリ化に基づいて、放射線医学的評価のために医学的画像を優先順位付けすること、または医学的画像を（例えば、複数の異なる放射線科医のセットのうちの）放射線科医のセットに割り当てることを含んでもよい。例えば、類似の特性を有する事例のセットは、ともにカテゴライズされて同一の放射線科医または放射線科医のセットに割り当てられてもよく、それによってコンテキストスイッチの低減および効率性と精度における向上を達成する。類似の特性は、例えば、ＲＯＩがある身体の部位、組織の密度、ＢＩＲＡＤＳスコアなどに基づいていてもよい。場合によっては、ワークフローは、医学的画像を分析して医学的画像の病変タイプを判定するために、ＡＩベースのアルゴリズムを適用すること、次いで判定された医学的画像の病変タイプに基づいて、放射線医学的評価のために医学的画像を優先順位付けすること、または医学的画像を（例えば、複数の異なる放射線科医のセットのうちの）放射線科医のセットに割り当てることを含んでもよい。

[174]場合によっては、ワークフローは、市場ベースのシステムを介して放射線科医に事例を自身に割り当てさせることを含んでもよく、それによってそれぞれの事例がＡＩベースのアルゴリズムによって評価され、放射線医学的評価の適当な価格またはコストを判定する。そのような価格またはコストは、放射線医学的評価が完了すると、各放射線科医へ補填される定められた相対的な価値単位であり得る。例えば、ある事例の各放射線医学的評価は、定められた特性（例えば、難しさ、診察時間の長さ）に基づいて価格決定されてもよい。そのようなワークフローでは、事例は放射線科医に割り当てられなくてもよく、それによって比較的慣例的な、または容易なものを選んで事例当たり高い払い戻し率を得る放射線科医の問題が回避される。

[175]場合によっては、ワークフローは、事例を、放射線科医の評価されたパフォーマンス（例えば、放射線医学的評価を行う際の、放射線科医の以前の感度、特異性、陽性予測値（ＰＰＶ）、陰性予測値（ＮＰＶ）、精度、または効率）に基づいて、放射線科医に割り当てることを含んでもよい。そのようなパフォーマンスは、品質制御を確かにするために、コントロール事例（例えば、陽性または陰性のコントロール事例）を目隠し的なやり方で放射線科医に割り当てることに基づいて判定または改良されてもよい。例えば、より良好なパフォーマンスを持つ放射線科医は、ボリュームの多い事例または高い価値もしくは補填のある事例を割り当てられてもよい。所与の放射線科医（例えば、任意の所与の日）に対して、このような明確な役割を定義することによって、各ワークフローは、タスク固有のニーズに対して個々に最適化することができる。ＡＩ駆動のトリアージエンジンは、リアルタイム放射線医学を大規模に患者へ伝達できるようにすることが可能である。システムはまた、専門知識に基づいて事例の動的な割り振りを可能にする場合がある。例えば、フェローシップに訓練された乳房イメージング者は、彼らの卓越した経験が活用され得る不確実な場合のワークフローでは最も価値のあるイメージング者であり得る。その上、我々は、クリニックのネットワーク越しに、クリニックをまたいだスクリーンの解釈を行うことが可能であり、あらゆる個々のクリニックのスタッフ配置や患者ベースに関わらず放射線科医の時間の有効利用を確かにするよう行うことが可能である。

[176]レポート伝達は次のように行われてもよい。ＭａｍｍｏｇｒａｐｈｙＱｕａｌｉｔｙＳｔａｎｄａｒｄｓＡｃｔ（ＭＱＳＡ）は、すべての患者は自身のマンモグラフィレポートの書面のレイサマリーを直接的に受け取ることを義務付けている。このレポートは、マンモグラムから３０日以内に送られなければならない。ケアを進めて不安を和らげるために口頭での結果が使用されることが多いが、これは書面のレポートによってサポートされなければならない。レポートは、郵送、電子的に送信、または患者に手渡しすることが可能である。通常、クリニックは、紙の郵便を使用してレポートを患者に配達することができる。ＡＩベースのクリニックは、マンモグラフィレポートを、電子的に患者用アプリケーションを介して配達してもよい。ソース画像はまた、患者が情報を容易に取得して他のクリニックに転送することができるように、電子的に利用可能にされてもよい。リアルタイム放射線医学ワークフローにおける患者は、スクリーニングと診断的なレポートを、クリニックから帰る前に即時的に受け取ることができる。

[177]スクリーニング結果の適時的なレポーティングは、患者満足度に極めて重要な場合がある。結果を２週間より長く待つこと、および疑問に答えてもらうために誰かに連絡することができないでいることは、患者の不満に寄与する主な理由として考えられてきた（これはまた将来的なスクリーニング率の低下となり得る。）このシステムは、患者が不意に誤ったレポートを受け取らないこと、および患者が自身の結果をいつ受け取ることができるかについて、不確実さを持たないことを確実にすることができる。

[178]ＡＩベースのシステムは、以下のように絶えず訓練されてもよい。臨床的な実務が運用されるに伴い、新しいデータが絶えず収集され、ＡＩシステムをさらに訓練して改良するために使用され、それによりケアの品質をさらに改善し、患者体験への新しい改善を可能にする。各患者診察は、システムにアノテーション付けされた、恐らくは生検証明の例を与え、データセットに追加する。特に、リアルタイム放射線医学システムのワークフローは、価値の高い事例を捉えることを優先付けすることを容易にする。偽陽性および偽陰性（フラグは立てられていないが本当は疑わしい事例）の識別は、教育的な価値の高い難しい例を提供することによってシステムのパフォーマンスを向上させるために重要な場合がある。正しく（例えば、放射線科医のレビューに関してグラウンドトゥルースとして）分類される事例でさえ、有用なフィードバックを与えることができる。このような事例を訓練データセットに組み込むことは、システムに不確実なキャリブレーションについての情報の価値あるソースを提供することができ、これはＡＩベースのシステムによって作り出される信頼値が正確であることを確かにする。これは、全体的なロバスト性、ひいてはシステムの信用を劇的に向上させる場合がある。エンドツーエンドの患者ワークフローを改善すること、および放射線科医をそのループに維持することによって、ＡＩベースの臨床システムは上で概説した重要な情報を自動的に発見することができる。得られるシステムは常に改善され、常に高品質の患者ケアおよび放射線科医支援を提供することができる。

[179]ＡＩ駆動のマンモグラフィスクリーニングクリニックは、スクリーニングプロセスを通じて患者に高品質なサービスと精度を提供することができる。患者は、クリニックを訪ね、がんについてのスクリーニングを受け、あらゆる必要なフォローアップ作業を受け、そしてその診断を手に帰ることができ、それによって迅速な結果を伴う一連の単一の訪問の間に、スクリーニングと診断全体のプロセスを完了することができる。患者用アプリケーションは、価格の透明性、手間のかからないスケジューリング、誤りのないフォーム記入、およびレポートと画像の瞬時伝達を実現するように構成され、それによって患者スクリーニングプロセスの容易さ、ストレス、および効率を改善することができる。

[180]放射線科医は、ＡＩトリアージエンジンによって編成される、正常な場合、不確実な場合、および疑わしい（または画像のＡＩ評価に基づく代替的なカテゴリ化）場合のワークフローという専門化されたセットを採用することによって、より正確でより生産性の高い結果を提供することができる。ＡＩシステムが学習し、臨床医の能力を高めるため、臨床医はさらに有能になるかも知れない。ＡＩベースまたはＡＩ支援のマンモグラフィは、低コストかつ高効率で大規模人数スケールに対して行われてもよく、それによってがんスクリーニングプロセスおよび患者の結果を向上する。

[181]

人工知能技術と組み合わせた場合の乳癌スクリーニングマンモグラフィにおけるリアルタイム放射線医学
[182]放射線科医による即時的なレビューのために疑わしいスクリーニングマンモグラムを優先付けするように構成されたソフトウェアシステムが開発され、それによって診断的なフォローアップまでの時間を低減する。ソフトウェアシステムは、疑わしいマンモグラフィ事例についてのレビュー時間を短縮することによって、患者不安ならびに処置までの全体的な時間を大幅に低減することを目的として開発される。第１の評価と第２の評価の間が最大で約２～４週間になることも多い、待ち時間の低減は、このような実際に乳癌が陽性である患者の平均余命を延ばすよう期待され得る。さらなる潜在的なベネフィットは、ソフトウェアが何らかのがんを見落とす見込みを減らすことができることである。

[183]一部の研究では、スクリーニングでは偽陽性（疑わしいとフラグが立てられた正常な事例、ＢＩＲＡＤＳ０）であるが、即時的なフォローアップを受け取った女性は、正常な場合の診断を受け取った女性の不安とほぼ同じレベルを体験する場合がある。このような女性の多くは、自分自身が異常なスクリーニング結果を持つと意識すらしない場合がある。したがって、即時的なフォローアップのケアは、偽陽性のスクリーニング結果により生じる潜在的な不安を和らげることができる。

[184]その一方で、偽陽性のスクリーニング結果を受け取り、数日から数週間後にフォローアップの診断的な診察にコールバックされる女性は、乳房関連の懸念および他の医学的問題について、さらに医学的な注意を探す傾向がある。したがって、マンモグラフィスキャンと同一クリニック訪問の間に最終的なマンモグラフィ結果を受け取ることができる女性は、スクリーニング体験により満足し、将来的なスクリーニング推奨に高い遵守率を有する可能性が高い場合がある。

[185]しかしながら、多くの乳房イメージングセンターは、即時的なフォローアップ診察を伝達することができないことがある。これは、スケジューリング制約、他の機関からの以前の評価を受け取る適時性、および取得直後の各診察の読影による生産性の損失を含む、いくつかの困難に起因する可能性がある。恐らく最も重要なことであるが、いくつかの乳房スクリーニング事例をまとめて読影することは、読影者の評価精度を大幅に向上させる。これにより、診察の読影前に十分に大きな事例のバッチが収集されるまで待機する必要が生じ、指示された場合に患者へ即時的な結果とフォローアップ診察を提供することを不可能にする。

[186]機械学習ベースの方法は、マンモグラフィおよびトモシンセシス画像において疑わしい所見を評価するために採用される。トリアージソフトウェアシステムが、より適時的なレポート配信および疑わしい事例のための（例えば、バッチ読影セッティングにおいて行われるような）フォローアップを可能にするために、スクリーニングマンモグラフィ用に機械学習を使用して開発される（図１１に示される通り）。医学的画像は、処理のためにリアルタイム放射線医学システムに与えられる。リアルタイム放射線医学システムのＡＩベースのトリアージエンジンは、医学的画像を処理して、画像を疑わしいか、それとも疑わしくない（例えば、正常または慣例的）か、を分類する。画像がＡＩベースのトリアージエンジンによって疑わしいと分類された場合、画像は即時的な放射線科医レビューに送られる（例えば、最初のスクリーニング予約と同一の訪問の間に、または同じ日のうちに）。即時的な放射線科医レビューは、疑わしい事例を確かめることにつながる（それにより即時的な診断的な診察が発注されることになる）、または疑わしい事例であることを覆す場合がある（それにより次回のスケジューリングされた慣例的な年に一度のスクリーニングが実施されることになる）。画像がＡＩベースのトリアージエンジンによって疑わしくない（例えば、正常または慣例的）と分類された場合、画像は慣例的な放射線科医レビューに送られる。慣例的な放射線科医レビューは、事例が疑わしいと評価する場合があり（それにより慣例的な診断的な診察が発注されることになる）、または事例が疑わしくないとの確認となる場合がある（それにより次回のスケジューリングされた慣例的な年に一度のスクリーニングが実施されることになる）。

[187]このソフトウェアは、大規模乳房スクリーニングクリニックが、異常が見られるマンモグラフィ結果を有する患者に、同一日または同一訪問での診断的なフォローアップイメージングを渡すことを可能にする。そのような素早い診断的なフォローアップイメージングを活用することは、乳房イメージングクリニックが最高レベルのサービスとともに最高精度を伝達すること、および患者不安を大幅に低減することへの道を切り開くことができる。

[188]このような機械学習ベースの手法を使用して、ＡＩによって評価されない患者およびフォローアップの診断的な評価を同一日に受け取らない患者と比べて、患者が高い確率でより長い寿命を有するよう、真の腫瘍の治療までの時間が低減される。

[189]マンモグラフィおよびトモシンセシス画像における疑わしい所見を評価するための機械学習ベースの手法は、次のようにいくつかの利点および目的を検討する。第１に、最初のスクリーニング診察から診断的イメージング結果の伝達までの時間が、乳癌スクリーニングについて、（恐らくは大幅に）低減され、正確な診断の見込みが改善される。例えば、そのような診断は、さらなる感度、特異性、陽性予測値、陰性予測値、受信者操作特性より下の面積（ＡＵＲＯＣ）、またはそれらの組合せを伴って作り出されてもよい。第２に、放射線科医と人工知能とを組み合わせる手法は、最初の評価のスピードおよび／または品質を効率的に改善する場合がある。第３に、より高度な診断的な診察（例えば、追加的なＸ線ベースのイメージング、超音波イメージング、別のタイプの医学的イメージング、またはそれらの組合せ）が、患者が自身のスクリーニング結果を受け取ってから短期間（例えば、６０分以内）のうちに完了されてもよい。第４に、そのような方法は、結果およびフォローアップイメージングのより適時的な伝達による、患者満足度を改善することにつながり得ることが有利である。

[190]方法
[191]臨床的なワークフローは、患者へより高いレベルのサービスを提供するよう最適化される。より多くの患者およびデータが訓練データセットに収集されるにつれ、機械学習アルゴリズムは、絶えずそのコンピュータ支援の診断の精度（または感度、特異性、陽性予測値、陰性予測値、ＡＵＲＯＣ、もしくはその組合せ）が改善する。

[192]コンピュータアルゴリズムおよびソフトウェアは、乳房スクリーニング画像を恐らくは異常および正常カテゴリに、高い精度で自動的に分類するように開発される。そのようなソフトウェアは、大規模乳房スクリーニングクリニックが、異常が見られる初期スクリーニング結果を有する患者に、同一日または同一訪問での診断的なフォローアップイメージングを渡すことを可能にし得る。このことはまた、臨床的な運用に対する変化、特に最初の検査の６０分間の間にスクリーニング事例をどのように読み取り、第２の診断的な評価をどのように行うことができるか、に対する変化を評価することを必要とする。

[193]素早いスクリーニング手法は、乳房スクリーニングクリニックにおいてすべての患者に対して行われる。スクリーニングを受ける患者の約１０％は、疑わしいという結果を有し、続いて同日のうちまたは同一訪問の間に診断的な診察が行われるよう推奨される。スクリーニング結果およびフォローアップの診断的な診察の素早いターンアラウンドタイムは、臨床環境における放射線科医と、臨床スタッフと、患者との間での注意深いコーディネートにより可能となる。さらに情報が収集されるにつれ、ますます大規模な訓練データセットで訓練される機械学習は、疑わしいマンモグラフィスキャンを検出する際にさらに高いレベルの精度を与える。

[194]スクリーニング診察の取得が完了すると、画像はルータに送られ、ソフトウェアにより受信され、素早く分類される（例えば、約１分以内に）。スクリーニングが機械学習アルゴリズムによって恐らく正常であるとしてマークされる場合、患者は自身の訪問を終え、普段通りにクリニックから退出する。しかしながら、スクリーニングが機械学習アルゴリズムによって恐らく異常であるとしてフラグが立てられる場合、患者は事例が放射線科医によって迅速にレビューされる間、最大約１０分待つように言われる（図１１に示される通り）。

[195]所与のクリニックが１日当たり約３０患者をスクリーニングすること、および陽性の可能性が１０％の率であると仮定すると、通常は機械学習アルゴリズムによって１日当たり約３患者が陽性であると分かり、放射線科医によるレビューの後、リアルタイムの診断的なフォローアップに適していると指定されることになる（例えば、普通、追加的なトモシンセシスイメージングと、恐らく超音波による診察）。

[196]リアルタイム放射線医学方法およびシステムの有効性を実証するために、いくつかのメトリクスが使用される。第１に、慣例的なワークフローおよび提案されるリアルタイムのワークフロー下での患者の最初のスクリーニング診察と診断的イメージング結果の伝達との間の時間の変化が、事例のスクリーニングがレビューされる時期の遅れの変化、ならびに文書の郵送と予約のスケジューリングなどのロジスティックスにおける変化の両方を捉えるために、測定され得る。

[197]第２に、リアルタイム放射線医学モデルが、収集された最新のデータに基づいて絶えず（例えば、毎月ベースで）評価される。例えば、コンピュータビジョンのアルゴリズムのパラメータは、すぐ後続のスクリーニング期間に向けて（例えば、一カ月）その精度を改善するために微調整および変更される。コンピュータプログラムへの変更の有効性は、数百の代表的な診察のブラインドテストデータセットに対して、および後続のスクリーニング期間からの暫定結果から評価される。

[198]第３に、患者満足度調査が定期的にレビューされ、短時間（例えば、約６０分）内のフォローアップの診断的な診察をより良好に可能にするために、運用上のプロセスがどのように改善され得るかを判定するのを助ける。

[199]以下のデータは、リアルタイム放射線医学ワークフローを介してマンモグラフィスクリーニング／診断的評価を受ける患者ごとに収集されてもよい：患者人口統計学（例えば、年齢、人種、身長、体重、社会経済的背景、喫煙状態など）、患者イメージングデータ（例えば、マンモグラフィにより取得）、患者の結果（例えば、スクリーニングおよび診断的な診察についてのＢＩＲＡＤＳ、ならびに適用可能であれば生検病理結果）、患者の訪問イベントのタイムスタンプ、バッチ読影およびリアルタイム事例についての患者のコールバック率、ならびにスクリーニングおよび診断的な事例についての放射線科医解釈時間。

[200]本開示の方法およびシステムを使用して、以下を含む潜在的なベネフィットを有するリアルタイム放射線医学が行うことができる：他のやり方では認識されない可能性があった（または腫瘍が進行してしまわないと認識することができない）腫瘍を検出すること、処置までの時間の低減、従来の評価プロセスと比較した場合の、認識および処置に起因する患者の寿命の改善、検査の間の待ち時間がなくなったことによる患者不安の低減。

[201]

フルフィールド・デジタルマンモグラフィおよびデジタル乳腺トモシンセシス診察についての、乳腺密度深層学習モデルのマルチサイト調査
[202]概要
[203]深層学習（ＤＬ）モデルは、マンモグラフィ乳腺密度推定に有望であるが、訓練データが限られていること、またはクリニックをまたいで生じ得る画像の違いにより、パフォーマンスが妨げられる可能性がある。デジタル乳腺トモシンセシス（ＤＢＴ）診察は、乳癌スクリーニングおよび乳腺密度評価にますます標準になっているが、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）診察にはずっと多くのデータが利用可能である。３ＤのＤＢＴ診察から導出された合成２Ｄマンモグラフィ（ＳＭ）画像のために、ＦＦＤＭ画像および限られたＳＭデータを使用して、マルチサイトのセッティングにおいて、乳腺密度ＤＬモデルが開発された。ＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度を予測するように、遡及的な調査のために２００８年から２０１７年（Ｓｉｔｅ１：５７４９２患者、７５０７５２画像）に得られたＦＦＤＭ画像を使用して、ＤＬモデルが訓練された。２つの機関（Ｓｉｔｅ１：３８４２患者、１４４７２画像；Ｓｉｔｅ２：７５５７患者、６３９７３画像）からのＳＭデータセットに対して、ＦＦＤＭモデルが評価された。ＳＭデータセットに対するパフォーマンスを改善するために適応方法が検討され、それぞれの適法方法に対するデータセットサイズの影響が考慮された。統計的有意性は信頼区間の使用を通じて評価され、ブートストラップ法によって推定された。適応がない場合でも、モデルは３つのデータセットすべてについて最初のレポートを行った放射線科医と近い一致を見せた（Ｓｉｔｅ１ＦＦＤＭ：線形重みづけされたκｗ＝０．７５，９５％信頼区間（ＣＩ）：［０．７４，０．７６］；Ｓｉｔｅ１ＳＭ：κｗ＝０．７１，ＣＩ：［０．６４，０．７８］；Ｓｉｔｅ２ＳＭ：κｗ＝０．７２，ＣＩ：［０．７０，０．７５］）。適応がある場合では、５００ＳＭ画像だけの使用によって、Ｓｉｔｅ２（Ｓｉｔｅ１：κｗ＝０．７２，ＣＩ：［０．６６，０．７９］，Ｓｉｔｅ２：κｗ＝０．７９，ＣＩ：［０．７６，０．８１］）についてパフォーマンスが改善された。このような結果は、ＢＩ－ＲＡＤＳ乳腺密度ＤＬモデルは、ＳＭ画像を必要としないか、ほとんど必要としない方法の使用によって、２つの機関からのＦＦＤＭおよびＳＭ画像に対して高レベルのパフォーマンスを実証したことを確立する。

[204]マルチサイト調査は、例えば、Ｍａｔｔｈｅｗｓらの「ＡＭｕｌｔｉｓｉｔｅＳｔｕｄｙｏｆａＢｒｅａｓｔＤｅｎｓｉｔｙＤｅｅｐＬｅａｒｎｉｎｇＭｏｄｅｌｆｏｒＦｕｌｌ－ＦｉｅｌｄＤｉｇｉｔａｌＭａｍｍｏｇｒａｐｈｙａｎｄＳｙｎｔｈｅｔｉｃＭａｍｍｏｇｒａｐｈｙ」、Ｒａｄｉｏｌｏｇｙ：ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ、ｄｏｉ．ｏｒｇ／１０．１１４８／ｒｙａｉ．２０２０２０００１５に記載されるようなフルフィールド・デジタルマンモグラフィおよび合成マンモグラフィ向けの乳腺密度深層学習モデルを開発するために行
われた。この文献はその全体が参照により本明細書に組み込まれる。

[205]はじめに
[206]乳腺密度は乳癌にとって重要なリスクファクタであり、エリアの密度が高いほどマンモグラム内の所見にマスクをし、感度をさらに低下させる可能性がある。一部の状態では、クリニックは女性に対しその密度を知らせる必要がある。放射線科医は通常、乳腺密度を次の４カテゴリに分割する、ＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）レキシコンを使用して乳腺密度を評価する：ａｌｍｏｓｔｅｎｔｉｒｅｌｙｆａｔｔｙ（ほぼ全体的に脂肪）、ｓｃａｔｔｅｒｅｄａｒｅａｓｏｆｆｉｂｒｏｇｌａｎｄｕｌａｒｄｅｎｓｉｔｙ（線維腺密度が散乱するエリア）、ｈｅｔｅｒｏｇｅｎｅｏｕｓｌｙｄｅｎｓｅ（不均一に高密度）およびｅｘｔｒｅｍｅｌｙｄｅｎｓｅ（極めて高密度）（図１２Ａ～図１２Ｄに示される通り）。残念ながら、ＢＩ－ＲＡＤＳ乳腺密度の評価において、放射線科医は読影者内および読影者間でのバラつきを見せ、これは臨床的なケアおよび推定されるリスクにおける差となり得る。

[207]図１２Ａ～図１２Ｄは、４つのＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度カテゴリ（Ａ）ａｌｍｏｓｔｅｎｔｉｒｅｌｙｆａｔｔｙ（ほぼ全体的に脂肪）（図１２Ａ）、（Ｂ）ｓｃａｔｔｅｒｅｄａｒｅａｓｏｆｆｉｂｒｏｇｌａｎｄｕｌａｒｄｅｎｓｉｔｙ（線維腺密度が散乱するエリア）（図１２Ｂ）、（Ｃ）ｈｅｔｅｒｏｇｅｎｅｏｕｓｌｙｄｅｎｓｅ（不均一に高密度）（図１２Ｃ）、（Ｄ）ｅｘｔｒｅｍｅｌｙｄｅｎｓｅ（極めて高密度）（図１２Ｄ）のそれぞれについて、デジタル乳腺トモシンセシス（ＤＢＴ）診察から導出した合成２Ｄマンモグラフィ（ＳＭ）画像の例を示す。画像は、ＤｉｇｉｔａｌＩｍａｇｉｎｇａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎｓｉｎＭｅｄｉｃｉｎｅ（ＤＩＣＯＭ）ヘッダで見られるグレースケールの強度ウィンドウが０．０～１．０の範囲となるよう正規化される。

[208]深層学習（ＤＬ）は、フィルム画像およびフルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）画像の両方について、ＢＩ－ＲＡＤＳ乳腺密度を評価するために採用されてもよく、一部のモデルは、個々の放射線科医よりもコンセンサス予想と近い一致を見せる。このようなＤＬモデルを臨床的な実践で使用する期待を実現するためには、２つの主要な課題が満足される必要がある。１つ目は、読影者パフォーマンスの改善に起因して、乳癌スクリーニングがますますデジタル乳腺トモシンセシス（ＤＢＴ）に移るにしたがい、ＤＬモデルはＤＢＴ診察に対応する必要があり得る。図１３Ａ～図１３Ｄは、ＦＦＤＭおよびＤＢＴ診察用の２Ｄ画像同士の画像特性の違いを示す。しかしながら、多くの機関における比較的最近のＤＢＴの採用は、ＤＬモデルを訓練するために利用可能なデータセットが、ＦＦＤＭ診察と比べてＤＢＴ診察には極めて限られていることが多いことを意味する。２つ目に、ＤＬモデルは、サイトをまたいで一貫したパフォーマンスを与える必要があり得るが、サイトをまたぐ場合はイメージング技術、患者人口統計学、または評価実務における違いがモデルパフォーマンスに影響を及ぼし得る。実用上、これは、各サイトからの追加的なデータをほとんど必要とせずに達成される必要があり得る。

[209]図１３Ａ～図１３Ｄは、ある被検者の同一圧力下での同一乳房のフルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）画像（図１３Ａ）と合成２Ｄマンモグラフィ（ＳＭ）画像（図１３Ｂ）との比較、ならびにＦＦＤＭ画像（図１３Ｃ）とＳＭ画像（図１３Ｄ）の両方について元の部位が白色四角により示される、２つの画像タイプ間に生じ得るテクスチャおよびコントラストの差異を強調するための、ズームインされた領域を示す。画像は、ＤｉｇｉｔａｌＩｍａｇｉｎｇａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎｓｉｎＭｅｄｉｃｉｎｅ（ＤＩＣＯＭ）ヘッダで見られるグレースケールの強度ウィンドウが０．０～１．０の範囲となるよう正規化される。

[210]２つの機関におけるＦＦＤＭおよびＤＢＴ診察両方について、最初のレポートを行った放射線科医に近い一致を与えるＢＩ－ＲＡＤＳ乳腺密度ＤＬモデルが開発された。まず、ＤＬモデルは、１機関からの大規模なＦＦＤＭデータセットを使用して、ＢＩ－ＲＡＤＳ乳腺密度を予測するように訓練された。次いで、モデルは、同一機関および別個の機関から得られたＦＦＤＭ診察の検査セットならびにＤＢＴ診察の一部として生成された合成２Ｄマンモグラフィ（ＳＭ）画像（Ｃ－Ｖｉｅｗ，Ｈｏｌｏｇｉｃ，Ｉｎｃ．，Ｍａｒｌｂｏｒｏｕｇｈ，ＭＡ）に対して評価された。２つのＳＭデータセットに対するパフォーマンスを改善するために、ＳＭ画像をほとんど必要としない適応技法が探られた。

[211]資料および方法
[212]治験審査委員会によって、データが収集された２サイトのそれぞれに遡及的な調査が承認された（Ｓｉｔｅ１：内部的な治験審査委員会、Ｓｉｔｅ２：ＷｅｓｔｅｒｎＩｎｓｔｉｔｕｔｉｏｎａｌＲｅｖｉｅｗＢｏａｒｄ）。インフォームドコンセントは破棄され、すべてのデータはＨｅａｌｔｈＩｎｓｕｒａｎｃｅＰｏｒｔａｂｉｌｉｔｙａｎｄＡｃｃｏｕｎｔａｂｉｌｉｔｙＡｃｔ（健康保険のポータビリティと説明責任に関する法律）にしたがって取り扱った。

[213]データセットは２つのサイトから収集された：Ｓｉｔｅ１は米国中西部域にある学術医療センター、Ｓｉｔｅ２は北カリフォルニアにある外来放射線医学クリニックである。Ｓｉｔｅ１では、１９１，４９３マンモグラフィ診察が選ばれた（ＦＦＤＭ：ｎ＝１８７，６２７；ＳＭ：ｎ＝３，８６６）。診察は乳房イメージング経験のある１１名の放射線科医のうちの１名によって読影された。Ｓｉｔｅ２では、１６２８３診察が選ばれた。診察は９年から４１年に渡る乳房イメージング経験のある１２名の放射線科医のうちの１名によって読影された。放射線科医のＢＩ－ＲＡＤＳ乳腺密度の評価は、各サイトのマンモグラフィレポーティングソフトウェアから取得された（Ｓｉｔｅ１：Ｍａｇｖｉｅｗバージョン７．１、Ｍａｇｖｉｅｗ、Ｂｕｒｔｏｎｓｖｉｌｌｅ、メリーランド州；Ｓｉｔｅ２：ＭＲＳバージョン７．２．０；ＭＲＳＳｙｓｔｅｍｓＩｎｃ．シアトル、ワシントン州）。本発明のＤＬモデルの開発を容易にするために、患者は訓練目的（ＦＦＤＭ：５０７００，８８％；Ｓｉｔｅ１ＳＭ：３１６９，８２％；Ｓｉｔｅ２ＳＭ：６０５６，８０％）、検証目的（ＦＦＤＭ：１８３２，３％；Ｓｉｔｅ１ＳＭ：４０３，１０％；Ｓｉｔｅ２ＳＭ：７５７，１０％）、またはテスト目的（ＦＦＤＭ：４９６０，９％；Ｓｉｔｅ１ＳＭ：２７０，７％；Ｓｉｔｅ２ＳＭ：７４４，１０％）にランダムに選ばれた。ＢＩ－ＲＡＤＳ乳腺密度評価を有するすべての診察が含まれた。検査セットには、診察は４つすべての標準的なスクリーニングマンモグラフィ画像（左右乳房の内外斜位ビューと頭尾方向ビュー）を有することが必要とされた。セットごとのＢＩ－ＲＡＤＳ乳腺密度評価の配分は、表１（Ｓｉｔｅ１）および表２（Ｓｉｔｅ２）に示される。

[214]表１：Ｓｉｔｅ１のフルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）および合成２Ｄマンモグラフィ（ＳＭ）の、訓練（Ｔｒａｉｎ）、検証（Ｖａｌ）、およびテスト（Ｔｅｓｔ）データセットの説明。患者、診察、および画像の総数がデータセットごとに与えられる。４つのＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度カテゴリの画像の数もまた、与えられる。

[215]表２：Ｓｉｔｅ２の合成２Ｄマンモグラフィ（ＳＭ）の、訓練（Ｔｒａｉｎ）、検証（Ｖａｌ）、およびテスト（Ｔｅｓｔ）データセットの説明。患者、診察、および画像の総数がデータセットごとに与えられる。４つのＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度カテゴリの画像の数もまた、与えられる。

[216]２サイトは、異なる患者人口を提供する。Ｓｉｔｅ１からの患者コホートは、コーカサス系５９％（３４１９２／５８３９７）、アフリカ系アメリカ人２３％（１３２０１／５８３９７）、アジア系３％（１６３０／５８３９７）、およびヒスパニック系１％（７５７／５８３９７）であり、一方でＳｉｔｅ２はコーカサス系５８％（４３５０／７５５７）、アフリカ系アメリカ人１％（１１０／７５５７）、アジア系２１％（１５９４／７５５７）、およびヒスパニック系７％（５２２／７５５７）である。

[217]深層学習モデル
[218]ＤＬモデルおよび訓練手順は、深層ニューラルネットワークモデルを含むｐｙｔｏｒｃｈＤＬフレームワーク（ｐｙｔｏｒｃｈ．ｏｒｇ、バージョン１．０）を使用して実装された。ベースモデルアーキテクチャは、バッチ正規化レイヤがグループ正規化レイヤで置換されたｐｒｅ－ａｃｔｉｖａｔｉｏｎＲｅｓｎｅｔ－３４を含んだ。モデルは、入力としてマンモグラフィ診察からのビューのうちの１つに対応する単一画像を処理し、画像がＢＩ－ＲＡＤＳ乳腺密度カテゴリのそれぞれに属する乳房の画像である推定確率を作り出すように構成された。

[219]深層学習（ＤＬ）モデルは、学習速度が１０^－４および重み減衰が１０^－３のＡｄａｍオプティマイザの使用によって、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）データセット（表１に示される通り）を使用して訓練された。重み減衰は、正規化レイヤに属するパラメータには適用されなかった。入力は４１６×３２０ピクセルにリサイズされ、ピクセル強度値は、ＤｉｇｉｔａｌＩｍａｇｉｎｇａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎｓｉｎＭｅｄｉｃｉｎｅ（ＤＩＣＯＭ）ヘッダで見られるグレースケールの強度ウィンドウが０．０～１．０の範囲となるよう正規化された。訓練は、ＮＶＩＤＩＡ（カリフォルニア州サンタクララ）製ＧＴＸ１０８０Ｔｉグラフィック処理ユニット２つに分散されたバッチサイズ２５６を用いて混合精度および勾配チェックポイントを使用して行われた。各バッチは、ＢＩ－ＲＡＤＳＢまたはＢＩ－ＲＡＤＳＣのサンプルを選択する確率が、ＢＩ－ＲＡＤＳＡまたはＢＩ－ＲＡＤＳＤサンプルを選択する確率の４倍になるようにサンプリングされ、これは概ね米国で見られる密度の分布に相当する。データ強化のために、水平および垂直フリッピングが採用された。訓練の進行度についてより頻繁な情報を得るために、６７万２０００を超えるサンプルの合計訓練セットサイズに対して、エポックは１０万サンプルでキャップされた。モデルはそのような１００エポックについて訓練された。結果は、検証セットに対する交差エントロピー損失が最小となったエポックについてレポートされ、これは９３エポック後に生じた。

[220]ベクトルおよび行列キャリブレーション方法のためのパラメータは、ＢＦＧＳ最適化方法（ｓｃｉｐｙ．ｏｒｇ、バージョン１．１．０）の使用によって交差エントロピー損失関数を最小にすることによって選ばれた。パラメータは、線形レイヤが恒等変換に相当するように初期化された。訓練は、勾配のＬ２ノルムが１０^－６未満になったときか、反復数が５００を越えたときに停止された。最後の完全結合層をファインチューニング法向けに再訓練することが、学習速度が１０^－４および重み減衰が１０^－５のＡｄａｍオプティマイザの使用によって、実施された。バッチサイズは６４にセットされた。完全結合層は、ランダム初期化から１００エポック訓練され、結果は検証交差エントロピー損失が最小となるエポックについてレポートされる。ベースモデルに対するものと同じ手順にしたがって、合成２Ｄマンモグラフィ（ＳＭ）データセットに対するスクラッチからの訓練が行われた。ファインチューニングおよびスクラッチからの訓練では、エポックのサイズは訓練サンプルの数にセットされた。

[221]ドメイン適応
[222]１つのドメイン（ソースドメイン）からのデータセットに対して訓練されたモデルを用いて、そのナレッジを、通常はずっと小さなサイズである別のドメイン（ターゲットドメイン）のデータセットに移すために、ドメイン適応が実行された。前段のレイヤでＤＬモデルによって学習された特徴は一般的であり得、例えばドメインとタスクに依らない（ｄｏｍａｉｎａｎｄｔａｓｋａｇｎｏｓｔｉｃ）。ドメインおよびタスクの類似度に応じて、１つのドメインから学習されたより深い特徴を、別のドメインまたはタスクに再利用することが可能である。新しいドメインに修正することなく直接適用可能なモデルは、一般化するためのものである。

[223]ＦＦＤＭ画像（ソースドメイン）に対して訓練されたＤＬモデルを、ＳＭ画像（ターゲットドメイン）に適応するための、ＦＦＤＭドメインから学習したすべての特徴を再利用する手法が開発された。第１に、ニューラルネットワークのキャリブレーションを行うために、小さな線形レイヤが最後の完全結合層に続いて追加された。線形レイヤには２つの形態が考えられた：（１）ベクトルキャリブレーションと称される、行列が対角であるもの、および（２）行列キャリブレーションと称される、行列が自由に変形するよう許可されたもの。第２に、Ｒｅｓｎｅｔ－３４モデルの最後の完全結合層は、ターゲットドメインからのサンプルに対して再訓練され、これはファインチューニングと称される。

[224]ターゲットドメインのデータセットサイズの影響を調査するために、適応技法が、ある範囲のサイズに対して様々なＳＭ訓練セットについて反復された。適応プロセスは、訓練データの異なるランダムなサンプルを用いてデータセットサイズごとに１０回反復された。サンプルごとに、訓練画像は、全訓練セットから置き換えることなくランダムに選択された。基準として、Ｒｅｓｎｅｔ－３４モデルが、例えばランダムな初期化から、ＳＭデータセットごとに最大数の訓練サンプルについて、スクラッチから訓練された。

[225]統計的な分析
[226]診察レベルの評価を得るために、診察における各画像が、ＤＬモデルを用いて処理され、得られた確率は平均された。いくつかのパフォーマンスメトリクスが、４クラスのＢＩ－ＲＡＤＳ乳腺密度タスク、および二値の高密度（ＢＩ－ＲＡＤＳＣ＋Ｄ）対非高密度（ＢＩ－ＲＡＤＳＡ＋Ｂ）タスクについて、このような平均確率から計算された：（１）最初のレポートを行った放射線科医との一致に基づいて推定された精度、（２）受信者操作特性曲線より下の面積（ＡＵＣ）、および（３）コーエンのカッパ係数（ｓｃｉｋｉｔ－ｌｅａｒｎ．ｏｒｇ、バージョン０．２０．０）。８０００のランダムなサンプルについて、検査セットの非スチューデント化されたピボットのブートストラップ法の使用によって、信頼区間が計算された。４クラスの問題では、ｍａｃｒｏＡＵＣ（あるタスク対他のタスクからの４つのＡＵＣ値の平均）および線形重みづけされたコーエンのカッパ係数がレポートされた。二値密度タスクでは、予測された高密度および非高密度の確率が、対応するＢＩ－ＲＡＤＳ密度カテゴリについて予測された確率を加算することによって計算された。

[227]結果
[228]ＦＦＤＭ診察に対する深層学習モデルのパフォーマンスは、次のように評価された。最初に訓練済モデルは、Ｓｉｔｅ１からのＦＦＤＭ診察の大きなホールドアウトされた検査セット（４９６０患者、５３０４８画像、平均年齢：５６．９、年齢範囲：２３～９７）に対して評価された。この場合、画像は同一の機関からの、モデルを訓練するために採用された画像タイプと同一のタイプのものである。ＤＬモデルによって予測されるＢＩ－ＲＡＤＳ乳腺密度分布（Ａ：８．５％、Ｂ：５２．２％、Ｃ：３６．１％、Ｄ：３．２％）は、最初のレポートを行った放射線科医の分布（Ａ：９．３％、Ｂ：５２．０％、Ｃ：３４．６％、Ｄ：４．０％）と類似した。ＤＬモデルは、多様なパフォーマンス尺度（表３に示される通り）に対して４クラスＢＩ－ＲＡＤＳ乳腺密度タスクについて、精度（８２．２％、９５％信頼区間（ＣＩ）：［８１．６％，８２．９％］）および線形重みづけされたコーエンのカッパ係数（κｗ＝０．７５、ＣＩ：［０．７４，０．７６］）を含め、放射線科医に近い一致を見せた。二値の乳腺密度タスクに対しても、高レベルの一致が観察された（精度＝９１．１％、ＣＩ：［９０．６％，９１．６％］、ＡＵＣ＝０．９７１、ＣＩ：［０．９６８，０．９７３］、κ＝０．８１、ＣＩ：［０．８０，０．８２］）。図１４Ａ～図１４Ｄに示される混同行列によって実証されるように、ＤＬモデルは複数の乳腺密度カテゴリから外れることは滅多になかった（例えば、ｅｘｔｒｅｍｅｌｙｄｅｎｓｅｂｒｅａｓｔをｓｃａｔｔｅｒｅｄ結果として呼ぶことによる；０．０３％、４／１３２６２）。これは、このようなタイプの大きな誤差に対して、いかなる明示的なペナルティを伴わずに、ＤＬモデルによって暗黙的に学習される。

[229]図１４Ａ～図１４Ｂは、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）検査セットに対して評価した、ＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度タスクについての混同行列（図１４Ａ）、および二値密度タスク（高密度であるＢＩ－ＲＡＤＳＣ＋Ｄ対非高密度であるＢＩ－ＲＡＤＳＡ＋Ｂ）についての混同行列（図１４Ｂ）を示す。各ビンにおける検査サンプル（診察）の数をカッコ内に示す。

[230]表３：４クラスＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度タスクと二値密度タスク（高密度であるＢＩ－ＲＡＤＳＣ＋Ｄ対非高密度であるＢＩ－ＲＡＤＳＡ＋Ｂ）との両方についての、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）診察用の検査セットに対する本開示の深層学習モデルのパフォーマンス。９５％信頼区間がブラケット内に与えられる。他の調査からの結果が、それら各々の検査セットに対して評価されて比較ポイントとして示される。

[231]結果を他の調査のコンテキストに配置するために、ＦＦＤＭ検査セットに対する深層学習モデルのパフォーマンスが、学術センターから得られた他の大規模なＦＦＤＭデータセットに対して評価された結果および市販の乳腺密度ソフトウェアと比較された（表３に示される通り）。ＦＦＤＭＤＬモデルは、匹敵するパフォーマンスを与えるように見える。

[232]ＤＢＴ診察に対する深層学習モデルのパフォーマンスは、次のように評価された。結果は、まずＳｉｔｅ１ＳＭ検査セット（２７０患者、１０８０画像、平均年齢：５４．６、年齢範囲：２８～７２）についてレポートされたが、これは２サイト間で生じ得るあらゆる差を回避するためである。表４に示すように、適応なしで実施されるときでも、モデルはＢＩ－ＲＡＤＳ乳腺密度タスクについて最初のレポートを行った放射線科医に近い一致を見せた（精度＝７９％、ＣＩ：［７４％，８４％］；κｗ＝０．７１、ＣＩ：［０．６４，０．７８］）。ＤＬモデルは、ＳＭ画像についての乳腺密度をわずかに過小評価し（図１５Ａ～図１５Ｄに示される通り）、放射線科医（Ａ：８．９％、Ｂ：４９．６％、Ｃ：３５．９％、Ｄ：５．６％）に対して非高密度事例が多く、高密度事例が少ないＢＩ－ＲＡＤＳ乳腺密度分布を作り出している（Ａ：１０．４％、Ｂ：５７．８％、Ｃ：２８．９％、Ｄ：３．０％）。この偏りは、図１３に示される差、すなわち乳房の特定の領域がＳＭ画像ではより暗く見えることに起因するものであり得る。同じような偏りが、他の自動化された乳腺密度推定ソフトウェアで示されている［３３］。二値密度タスクについての一致はまた、適応なしで極めて高い（精度＝８８％、ＣＩ：［８４％，９２％］；κ＝０．７５、ＣＩ：［０．６７，０．８３］；ＡＵＣ＝０．９７、ＣＩ：［０．９６，０．９９］。

[233]表４：１つのデータセットに対して訓練された深層学習（ＤＬ）モデルを、５００の合成２Ｄマンモグラフィ（ＳＭ）画像のセットを持つ別のモデルに適応するための本開示の方法およびシステムのパフォーマンス。データセットは、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）データセットには「ＭＭ」、Ｓｉｔｅ１のＳＭデータセットには「Ｃ１」、およびＳｉｔｅ２のＳＭデータセットには「Ｃ２」として示す。参照として、ＦＦＤＭデータセット（６７万２０００訓練サンプル）に対してスクラッチから訓練され、その検査セットに対して評価されたモデルのパフォーマンスも示される。検査セットに対してブートストラップ法によって計算された９５％信頼区間がブラケット内に与えられる。

[234]５００ＳＭ画像を用いた行列キャリブレーションによる適応の後、密度分布は、放射線科医による分布（Ａ：５．９％、Ｂ：５３．７％、Ｃ：３５．９％、Ｄ：４．４％）により類似したものとなったが、全体的な一致は類似した（精度＝８０％、ＣＩ：［７６％，８５％］；κｗ＝０．７２、ＣＩ：［０．６６，０．７９］）。２つの高密度なクラスの精度は、２つの非高密度なクラスを犠牲にして改善された（図１５Ａ～図１５Ｄに示される通り）。二値密度タスクではかなりの改善が見られ、コーエンのカッパ係数が０．７５［０．６７，０．８３］から０．８２［０．７６，０．９０］（精度＝９１％，ＣＩ：［８８％，９５％］；ＡＵＣ＝０．９７、ＣＩ：［０．９６，０．９９］）に増大した。

[235]図１５Ａ～図１５Ｄは、Ｓｉｔｅ１のＳＭ検査セットに対して評価した、適応なしのＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度タスクについての混同行列（図１５Ａ）、適応なしの二値密度タスク（高密度であるＢＩ－ＲＡＤＳＣ＋Ｄ対非高密度であるＢＩ－ＲＡＤＳＡ＋Ｂ）についての混同行列（図１５Ｂ）、５００訓練サンプルの行列キャリブレーションによる適応ありのＢＩ－ＲＡＤＳ乳腺密度タスクについての混同行列（図１５Ｃ）、５００訓練サンプルの行列キャリブレーションによる適応ありの二値密度タスク（高密度対非高密度）についての混同行列（図１５Ｂ）を示す。各ビンにおける検査サンプル（診察）の数をカッコ内に示す。

[236]適応なしのＳｉｔｅ２のＳＭ検査セット（７４４患者、６１９２画像、平均年齢：５５．２、年齢範囲：３０～９２）について、ＤＬモデルと最初のレポートを行った放射線科医との間には、やはり程度の高い一致が観察された（表４に示される通り、精度＝７６％、ＣＩ：［７４％，７８％］；κｗ＝０．７２ＣＩ：［０．７０，０．７５］）。ＤＬモデルによって予測されるＢＩ－ＲＡＤＳ乳腺密度分布（Ａ：５．７％、Ｂ：４８．８％、Ｃ：３６．４％、Ｄ：９．１％）は、Ｓｉｔｅ１のデータセットに見られる分布にさらに類似した。モデルは、患者人口統計学が異なるＳｉｔｅ２には最適でない場合がある、Ｓｉｔｅ１のＦＦＤＭデータセットから以前のものを学習してしまっている可能性がある。予測される密度分布は、Ｓｉｔｅ１で見られたような低い密度推定に偏っているようには見えない（図１６Ａ～図１６Ｄに示される通り）。これは、２つのサイト間でのＳＭ画像またはその解釈における何らかの違いを示唆する場合がある。二値密度タスクについての一致は殊に強かった（精度＝９２％、ＣＩ：［９１％，９３％］；κ＝０．８４、ＣＩ：［０．８１，０．８７］；ＡＵＣ＝０．９８０、ＣＩ：［０．９７６，０．９８６］）。適応なしのＳｉｔｅ２データセットに対する非常に良好なパフォーマンスは、ＤＬモデルがサイトをまたいで、うまく一般化され得ることを実証する。

[237]５００訓練サンプルについての行列キャリブレーションによる適応によって、Ｓｉｔｅ２のＳＭデータセットに対するＢＩ－ＲＡＤＳ乳腺密度タスクについてのパフォーマンスは大幅に改善した（精度＝８０、ＣＩ：［７８，８２］；κｗ＝０．７９、ＣＩ：［０．７６，０．８１］）。適応の後、予測されるＢＩ－ＲＡＤＳ乳腺密度分布（Ａ：１６．９％、Ｂ：４３．３％、Ｃ：２９．４％、Ｄ：１０．４％）は、放射線科医の分布（Ａ：１５．３％、Ｂ：４２．２％、Ｃ：３０．２％、Ｄ：１２．３％）とさらに類似した。適応は、このサイトでは乳腺密度の人口統計学的な分布についての調節を助けている可能性がある。二値の乳腺密度タスクにはあまり改善が見られなかった（精度＝９２、ＣＩ：［９１，９４］、κ＝０．８４、ＣＩ：［０．８２，０．８７］；ＡＵＣ＝０．９８３、ＣＩ：［０．９７８，０．９８８］）。

[238]図１６Ａ～図１６Ｄは、Ｓｉｔｅ２のＳＭ検査セットに対して評価した、適応なしのＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度タスクについての混同行列（図１６Ａ）、適応なしの二値密度タスク（高密度であるＢＩ－ＲＡＤＳＣ＋Ｄ対非高密度であるＢＩ－ＲＡＤＳＡ＋Ｂ）についての混同行列（図１６Ｂ）、５００訓練サンプルの行列キャリブレーションによる適応ありのＢＩ－ＲＡＤＳ乳腺密度タスクについて（図１６Ｃ）、５００訓練サンプルの行列キャリブレーションによる適応ありの二値密度タスク（高密度対非高密度）についての混同行列（図１６Ｂ）を示す。各ビンにおける検査サンプル（診察）の数をカッコ内に示す。

[239]異なる適応方法の相対的なパフォーマンスは、適応に利用可能な訓練サンプルの数に依存する可能性があり、訓練サンプルが多いほど、パラメータが多い方法に有益となる。図１７Ａ～図１７Ｄは、開示される実施形態による、Ｓｉｔｅ１データセットについて、ｍａｃｒｏＡＵＣによって測定された、適応方法のパフォーマンスに対する訓練データ量の影響（図１７Ａ）、Ｓｉｔｅ１データセットについて、線形重みづけされたコーエンのカッパ係数によって測定された、適応方法のパフォーマンスに対する訓練データ量の影響（図１７Ｂ）、Ｓｉｔｅ２のＳＭデータセットについて、ｍａｃｒｏＡＵＣによって測定された、適応方法のパフォーマンスに対する訓練データ量の影響（図１７Ｃ）、Ｓｉｔｅ２のＳＭデータセットについて、線形重みづけされたコーエンのカッパ係数によって測定された、適応方法のパフォーマンスに対する訓練データ量の影響（図１７Ｄ）を示す。９５％信頼区間を計算する際に行ったように、検査セットの限られたサイズから生じる不確定性ではなく、訓練データの選択から生じる不確定性を調査するために、結果は、データセットサイズ（本明細書の他で説明されるような）ごとに訓練データの１０個のランダムなリアル化に対してレポートされる。各適応方法は、最良のパフォーマンスを提供するサンプル数の範囲を有し、領域は適応方法のパラメータ数に対応している（ベクトルキャリブレーション：４＋４＝８パラメータ；行列キャリブレーション：４×４＋４＝２０パラメータ；ファインチューニング：５１２×４＋４＝２０５２パラメータ）。訓練サンプルの数が非常に少ない場合（例えば、１００画像未満）、何らかの適応方法がパフォーマンスにマイナスに影響した。最大規模のデータセットサイズでも、ＳＭ画像に対してスクラッチから訓練されたＲｅｓｎｅｔ－３４モデルがＦＦＤＭから適応されたモデルのパフォーマンスを超えるには、訓練データの量があまりにも限定され過ぎた。

[240]図１７Ａ～図１７Ｄは、適応されたモデルのパフォーマンスに対するターゲットドメイン中の訓練サンプルの数の影響を、Ｓｉｔｅ１の合成２Ｄマンモグラフィ（ＳＭ）検査セットについてｍａｃｒｏＡＵＣ（図１７Ａ）、および線形に重みづけしたコーエンのカッパ係数（図１７Ｂ）によって測定したもの、ならびにＳｉｔｅ２のＳＭ検査セットについてｍａｃｒｏＡＵＣ（図１７Ｃ）、および線形に重みづけしたコーエンのカッパ係数（図１７Ｄ）によって測定したものを示す。結果は、ベクトルキャリブレーションと行列キャリブレーション、および最後の完全結合層（ファインチューニング）を再訓練することについて示される。エラーバーは、訓練データの１０個のランダムなサンプリングに対して計算された平均の標準誤差を示す。適応する前のパフォーマンス（なし）およびスクラッチからの訓練は、参照として示される。Ｓｉｔｅ１のＳＭ調査では、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）パフォーマンスは、追加的な参照として機能した。それぞれのグラフは、所与のメトリクスとデータセットについての異なる適応方法の比較を容易にするべく、それ自身の全ダイナミックレンジを用いて示されていることに留意されたい。

[241]議論
[242]ＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度は、乳癌リスクと放射線科医感度の重要なインジケータであり得るが、読影者内および読影者間でのバラつきが、この尺度の有効性を限られたものにしている場合がある。乳腺密度を推定するための深層学習（ＤＬ）モデルは、このバラつきを低減しつつ、なお正確な評価を実現するように構成されてもよい。しかしながら、このようなＤＬモデルは、デジタル乳腺トモシンセシス（ＤＢＴ）診察に適用可能であると実証され、機関をまたいで一般化することができ、それによって有用な臨床的なツールとしての適性を示している。ＤＢＴ診察用の訓練データが限られていることを克服するために、ＤＬモデルは最初、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）画像の大きなセットに対して訓練される。ＦＦＤＭ画像のホールドアウトされた検査セットに対して評価される場合、モデルは放射線科医レポートのＢＩ－ＲＡＤＳ乳腺密度に近い一致を示した（κｗ＝０．７５、９５％信頼区間（ＣＩ）：［０．７４，０．７６］）。次いで、モデルは、ＤＢＴ診察の一部として生成される合成２Ｄマンモグラフィ（ＳＭ）画像の２つのデータセットに対して評価された。ＦＦＤＭデータと同一機関からのＳＭデータセット（Ｓｉｔｅ１：κｗ＝０．７１、ＣＩ：［０．６４，０．７８］）、および別の機関からのＳＭデータセット（Ｓｉｔｅ２：κｗ＝０．７２、ＣＩ：［０．７０，０．７５］）についても、高いレベルの一致が見られた。ＤＬモデルの強いパフォーマンスは、これがＤＢＴ診察および異なる機関からのデータに一般化される得ることを実証している。ＳＭデータセットについてのモデルのさらなる適応は、Ｓｉｔｅ１では何らかの改善に（κｗ＝０．７２、ＣＩ：［０．６６，０．７９］）、またＳｉｔｅ２ではずっと大幅な改善に（κｗ＝０．７９、ＣＩ：［０．７６，０．８１］）つながった。

[243]最初のレポートを行った放射線科医の評価がグラウンドトゥルースとして受け入れられると、このような放射線科医同士の読影者間でのバラつきのレベルが、所与のデータセットに対して達成され得るパフォーマンスに対して大きな影響力を有する。例えば、適応の後、Ｓｉｔｅ２のＳＭデータセットに対して得られるパフォーマンスは、モデルを訓練するために使用されるＦＦＤＭデータセットに対して得られるパフォーマンスより高かった。これは、読影者２名だけで診察の８０％以上が読み取られたことにより、Ｓｉｔｅ２のＳＭデータセットについての読影者間のバラつきが限られたものとなった結果の可能性が高い。

[244]他の手法とは対照的に、ＢＩ－ＲＡＤＳ乳腺密度ＤＬモデルは、ＤＢＴ診察からのＳＭ画像に対して、および複数機関からのデータに対して、評価された。さらには、上で議論したように、ＤＬモデルは、ＦＦＤＭ画像に対して評価した場合、他のＤＬモデルおよび市販の乳腺密度ソフトウェアと比較して匹敵するパフォーマンスを実証した（κｗ＝０．７５、ＣＩ：［０．７４，０．７６］対Ｌｅｈｍａｎら０．６７、ＣＩ：［０．６６，０．６８］；Ｖｏｌｐａｒａ０．５７、ＣＩ：［０．５５，０．５９］、Ｑｕａｎｔｒａ０．４６、ＣＩ：［０．４４，０．４７］）［１９，３］。手法ごとに、本発明者ら自身の結果がレポートされるやり方と同じように、結果がその個々の検査セットに対してレポートされる。

[245]体積乳腺密度などの乳腺密度の他の尺度は、３Ｄトモシンセシス容積用の自動化されたソフトウェアまたはＤＢＴ診察からの推測によって推定されてもよい。閾値は、このような尺度をＢＩ－ＲＡＤＳ乳腺密度に変換するように選ぶことが可能であるが、これは、ＢＩ－ＲＡＤＳ乳腺密度の直接的な推定よりも一致のレベルが低下することになり得る（例えば、放射線科医評価のＢＩ－ＲＡＤＳ乳腺密度と体積乳腺密度から導出した評価との一致はκｗ＝０．４７）。ここではＢＩ－ＲＡＤＳ乳腺密度を３Ｄトモシンセシス容積の代わりに２ＤのＳＭ画像から推定するが、このことがＦＦＤＭ画像からの転移学習を簡略化し、乳房放射線科医が密度を評価するやり方をミラーリングするからである。

[246]場合によっては、深層学習（ＤＬ）モデルが新しい機関に適合される際、画像内容、患者人口統計学、または解釈放射線科医における機関をまたいだ差異に対して調節が行われる場合がある。この最後の調節により、最初のＤＬモデルと適合済ＤＬモデルとの間に、ある程度の読影者間のバラつきが生じ得るが、モデルが各グループの放射線科医のコンセンサスを学習すれば、個々の読影者間のバラつきよりも低くなる可能性がある。結果として、Ｓｉｔｅ２のＳＭデータセットについての適合の後に観察される改善されたＤＬモデルのパフォーマンスは、ＦＦＤＭデータセットと比較した患者人口統計学または放射線科医評価実務における差異に起因するものであり得る。Ｓｉｔｅ１のＳＭデータセットについての改善が弱かったことは、このような同一ファクタにおける類似性に起因するものであり得る。訓練サンプルの数の関数としてのドメイン適応技法の比較については、訓練サンプルの数に基づいてモデル内のパラメータの数を調整することによって、スクラッチから訓練されたＤＬモデルを訓練するための良好なパフォーマンスが得られる場合がある。

[247]このような結果は、ＢｒｅａｓｔＩｍａｇｉｎｇＲｅｐｏｒｔｉｎｇａｎｄＤａｔａＳｙｓｔｅｍ（ＢＩ－ＲＡＤＳ）乳腺密度の深層学習（ＤＬ）モデルの広範な使用が、臨床的なケアを改善する大きな可能性を秘めていることを確かにしている。適応なしのＤＬモデルの成功は、モデルによって学習される特徴が、デジタル乳腺トモシンセシス（ＤＢＴ）診察からの、フルフィールド・デジタルマンモグラフィ（ＦＦＤＭ）画像と合成２Ｄマンモグラフィ（ＳＭ）画像との両方に、ならびに異なる読影者および機関に、広く適用可能であることを示す。したがって、ＢＩ－ＲＡＤＳ乳腺密度ＤＬモデルは、新しいサイトおよび機関に、大規模なデータセットおよびスクラッチからの訓練モデルを編集する追加的な努力なしに展開することができる。サイトおよび画像タイプをまたいで一般化することが可能なＢＩ－ＲＡＤＳ乳腺密度ＤＬモデルは、女性の乳腺密度について、高速で低コスト、かつより一貫性のある推定を行うために使用され得る。

[248]

最適化された放射線医学ワークフローのためのリアルタイム放射線医学
[249]機械学習ベースの分類システムが開発され、被検者の医学的画像を含むデータセットの分析に基づいて放射線医学的な解釈作業（例えば、複数の異なるワークフロー同士で）を、ソート、優先付け、強化、または編集する。放射線医学的評価のために事例をソート、優先付け、強化、または編集することは、医学的画像データに基づいて実施されてもよい（ラベルまたはアノテーション情報などのメタデータだけに依拠する代わりに、画像データのヘッダまたはデータベース要素など）。例えば、医学的画像は、１つまたは複数の画像処理アルゴリズムによって処理されてもよい。機械学習ベースの放射線医学システムは、医学的画像のデータセットを、様々な放射線医学的評価に、それらのそのような様々な評価に対する適性に基づいて階層化できるようにすることによって、高速かつより正確な診断を伝達する高度な放射線医学ワークフローを可能にする。例えば、複数の異なるワークフローは、放射線科医の複数の異なるセットによる放射線医学的評価を含んでもよい。放射線科医は、患者の医学的画像が取得されるクリニックに対して、オンサイトにいてもよいし、リモートにいてもよい。

[250]いくつかの実施形態では、機械学習ベースの分類システムは、被検者の医学的画像を含むデータセットの分析に基づいて、複数の異なるワークフロー同士で放射線医学的な解釈作業を、ソート、または優先付けするように構成される。例えば、医学的画像を含むデータセットのうちの１つのセットは、データセットの第１のセットがデータセットの第２のセットよりも高い優先度または緊急度を有するというＡＩトリアージエンジンの判定に基づいて、医学的画像を含むデータセットの別のセットよりも放射線医学的評価について優先されてもよい。

[251]いくつかの実施形態では、リアルタイム放射線医学システムは、ＡＩ対応トリアージワークフローを使用して、スクリーニング診察を通じて被検者の医学的画像を得て、次いでＡＩを使用して放射線医学的な結果（例えば、スクリーニング結果および／または診断結果）を、医学的画像を取得した後、数分のうち（例えば、約５分、約１０分、約１５分、約３０分、約４５分、約６０分、約９０分、約２時間、約３時間、約４時間、約５時間、約６時間、約７時間、または約８時間以内に）に患者へ伝達する。

[252]いくつかの実施形態では、リアルタイム放射線医学システムは、ＡＩ判定のアラート事例のクリニックスタッフと対話するためのリアルタイム通知システムを含む。通知システムは、スクリーニングクリニック内の様々な場所に（例えば、クリニックスタッフのワークステーションに）設置される。ユーザ（例えば、医師およびクリニックスタッフ）は役割を割り当てられ、役割ごとに異なる通知を受け取る。通知は、患者の事例について訓練済アルゴリズムによって緊急事態が判定されると、トリガされる。例えば、通知は、アドバイザリ情報ならびに訪問中リアルタイムに患者の臨床的なワークフローに影響を及ぼし得る、情報を入力する許可ユーザの両方を含んでもよい。医師（例えば、処置を行う医師または放射線科医）は、緊急事態事例が生じるとリアルタイムのアラートを介してこのような事例を通知され、通知からの情報を使用してより良好な診断を提供する。

[253]いくつかの実施形態では、リアルタイム放射線医学システムは、患者に通知を送るための患者のモバイルアプリケーション（アプリ）を含む。通知は、患者のスクリーニング／診断的な訪問のステータス、患者の医学的画像に対して実施された放射線医学的評価、放射線医学的評価から構築されたプレゼンテーションなどを含んでもよい。

[254]いくつかの実施形態では、リアルタイム放射線医学システムは、将来的な取り出しのために、医学的画像を含むデータセット（例えば、放射線医学的画像）、データセットのＡＩエンリッチメント（例えば、画像処理アルゴリズムなどを介して、ＡＩによってラベル付け、アノテーション付け、または処理された医学的画像）、スクリーニング結果、診断結果、ならびに医学的画像および結果のプレゼンテーションを、獲得、取得、および記憶するように構成されたデータベースを含む。リアルタイム放射線医学システムは、サービスを患者および患者の臨床医療従事者（例えば、放射線科医およびクリニックスタッフ）に提供して、データベースの内容を取り出し、アクセスおよび閲覧するように構成される。リアルタイム放射線医学システムのサービスは、いくつかのＡＩモデルをチェーン化することを含め、記憶されたデータセットから、複雑な計算科学的なグラフを構築するサポートをしてもよい。

[255]図１８は、リアルタイム放射線医学評価ワークフローの概略の例を示す。リアルタイム放射線医学評価ワークフローは、被検者から画像を獲得することを含んでもよい（例えば、マンモグラフィを介して）。画像は、画像が疑わしい事例に対応すること検出するために、本開示のシステムおよび方法（例えば、ＡＩアルゴリズムを含む）を使用して処理されてもよい。臨床医は、被検者がリアルタイム放射線医学評価に適しているとアラートされてもよい。被検者がクリニックで待っている間、画像は放射線医学的評価のために放射線科医に送られ、放射線医学的評価の結果は、さらなるレビューのために臨床医に提供される。

[256]図１９は、リアルタイム放射線医学評価ワークフローの概略の別の例を示す。本開示のシステムおよび方法（例えば、ＡＩアルゴリズムを含む）を使用して、被検者の画像がＰＡＣＳデータベースから検索され、分析される。ＡＩ分析が、所与の被検者（例えば、患者）が疑わしい画像を有していないことを示す場合、患者コーディネータに通知され、次いで患者コーディネータは、結果は放射線医学的評価が実施された後に、自宅で受け取ることになると、患者に知らせる。ＡＩ分析が、患者が疑わしい画像を有すると示す場合、技師に通知され、次いで技師は（１）病歴を更新し、放射線科医に放射線医学的評価を実施するように通知して、患者コーディネータに結果を提供するか、（２）請求担当に患者のフォローアップ診察についての自己負担額を処理するように通知し、患者コーディネータに通知する。患者コーディネータは、結果を患者と共有して、必要であればフォローアップ予約をスケジューリングしてもよい。

[257]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、（ｉ）画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、画像が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、（ｉｉ）画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、画像が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または（ｉｉｉ）画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、画像が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとを含む。

[258]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、少なくとも１つの画像が疑わしいと分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、画像が曖昧であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、画像が正常であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、スクリーニング結果を作り出すステップを含む。

[259]いくつかの実施形態では、被検者のスクリーニング結果は、画像またはその導出物を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第１のセットは、オンサイトクリニック（例えば、画像またはその導出物が取得されたクリニック）に配置される。

[260]いくつかの実施形態では、放射線科医の第２のセットは放射線専門医（例えば、画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練された放射線科医）を含む。いくつかの実施形態では、放射線科医の第３のセットは、オンサイトクリニック（例えば、画像が取得されたクリニック）からリモートに配置される。いくつかの実施形態では、放射線科医の第３のセットのうちの第３の放射線科医は、複数の画像を含むバッチの画像またはその導出物の放射線科医評価を実施する（例えば、この場合、バッチは放射線医学的評価の効率の向上のために選択される）。

[261]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、被検者の診断手順を、スクリーニング結果に少なくとも部分的に基づいて実施して、被検者の診断結果を作り出すステップを含む。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップから約１時間以内に作り出される。

[262]いくつかの実施形態では、画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性（例えば、組織密度または物理的性質）、異物の存在（例えば、インプラント）、所見のタイプ、病状（例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される）、またはそれらの組合せを含む。

[263]いくつかの実施形態では、画像またはその導出物は、第１の放射線科医、第２の放射線科医、または第３の放射線科医の追加的な特性（例えば、第１の放射線科医、第２の放射線科医、または第３の放射線科医の、少なくとも１つの画像またはその導出物の放射線医学的評価を行う個人的な能力）に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。

[264]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、画像またはその導出物を第１の放射線科医に送るステップ、または画像またはその導出物を第２の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップを含む。いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、アラートを、被検者または被検者の臨床医療従事者に送信するステップを含む。いくつかの実施形態ではリアルタイム放射線医学評価ワークフローは、アラートを、患者のモバイルアプリケーションを通じて被検者に送信するステップを含む。いくつかの実施形態では、アラートは、（ｂ）とリアルタイムか、（ｂ）とほぼリアルタイムで生成される。

[265]いくつかの実施形態では、リアルタイム放射線医学システムはＡＩ駆動の遠隔画像診断プラットフォームを含む。遠隔画像診断プラットフォームは、事例を医師によるレビュー用に、医学的画像の取得とリアルタイムに、または実質的にリアルタイムにルーティングする、ＡＩベースの放射線医学作業分配器を備える。遠隔画像診断プラットフォームは、画像タイプおよび医師のＡＩベースのプロファイリングを実施して、個々の医師の所与の事例のデータセットの取り扱い、評価、または解釈における適性に基づいて、各事例を複数の医師の中から１名の医師に割り当てるように構成されてもよい。放射線科医は、それぞれが放射線医学的技能、専門知識、および経験の別個のセットを有する、放射線科医のネットワークに所属してもよい。遠隔画像診断プラットフォームは、技能、専門知識、経験、およびコストの所望の組合せを有する医師をネットワークで検索することに基づいて事例を医師に割当てもよい。放射線科医は、患者の医学的画像が取得されるクリニックに対して、オンサイトにいてもよいし、リモートにいてもよい。いくつかの実施形態では、放射線科医の専門知識は、データの評価的セットに対する様々な放射線科医タスクについて、放射線科医のパフォーマンスをＡＩモデルのパフォーマンスと比較することによって判定されてもよい。放射線科医は、自身が引き受けて実施する個々の事例ごとに、放射線医学的評価を実施することに対して支払いを受けてもよい。いくつかの実施形態では、リアルタイム放射線医学システムは、ＡＩ判定の難しさ、緊急度、および放射線医学的作業の価値（例えば、放射線医学的評価、解釈、またはレビュー）に基づいた放射線医学的な作業の動的な価格設定を特徴とする。

[266]いくつかの実施形態では、リアルタイム放射線医学システムは、放射線医学的評価、解釈、またはレビューのために、複数の医学的画像事例を、医学的画像事例のサブグループに編成、優先順位付け、または階層化するように構成される。医学的画像事例の階層化は、個々の事例を評価する際の人間の効率を改善するために、個々の医学的画像事例の画像特性に基づいて、ＡＩアルゴリズムによって実施されてもよい。例えば、アルゴリズムは、例えば解剖学的構造の類似の領域に位置する類似の病変タイプを有する識別事例を入れるなど、視覚的に類似しているか、診断的に類似している事例を人間によるレビューのために一緒にグループ化してもよい。

[267]図２０は、遠隔画像診断セッティングにおけるＡＩ支援放射線医学評価ワークフローの概略の例を示す。本開示のシステムおよび方法（例えば、ＡＩアルゴリズムを含む）を使用して、被検者の画像がＡＩアルゴリズムを使用してＰＡＣＳデータベースから検索されて分析され、放射線医学的評価のために事例を（例えば、被検者の乳腺密度および／または乳癌リスクに基づいて）優先順位付けおよび除外する。ＡＩ支援放射線医学評価ワークフローは、放射線科医の技能レベルに基づいて、放射線医学的評価の事例のルーティングを最適化することができる。例えば、第１の放射線科医は、平均読影時間４５秒、専門家レベルの専門知識、および極めて高密度な乳房を評価するための技能を有する場合がある。別の例として、第２の放射線科医は、平均読影時間４０１秒、および初心者レベルの専門知識を有する場合がある。別の例として、第３の放射線科医は、平均読影時間３２３秒、および初心者レベルの専門知識を有する場合がある。別の例として、第４の放射線科医は、平均読影時間１４５秒、および初心者レベルの専門知識を有する場合がある。例えば、第５の放射線科医は、平均読影時間６０秒、専門家レベルの専門知識、および良性塊を評価するための技能を有する場合がある。ＡＩ支援放射線医学評価ワークフローは所与の被検者の事例を、第１、第２、第３、第４、または第５の放射線科医から選択された放射線科医に向けて、所与の被検者の事例についての放射線科医らの平均読影時間、専門知識レベル、および／または技能レベルに基づいて、送ってもよい。

[268]いくつかの実施形態では、ＡＩ支援放射線医学評価ワークフローは、（ｉ）画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、画像が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、（ｉｉ）画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、画像が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または（ｉｉｉ）画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、画像が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとを含む。

[269]いくつかの実施形態では、ＡＩ支援放射線医学評価ワークフローは、少なくとも１つの画像が疑わしいと分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、ＡＩ支援放射線医学評価ワークフローは、画像が曖昧であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、ＡＩ支援放射線医学評価ワークフローは、画像が正常であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、スクリーニング結果を作り出すステップを含む。

[270]いくつかの実施形態では、被検者のスクリーニング結果は、画像またはその導出物を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第１のセットは、オンサイトクリニック（例えば、画像またはその導出物が取得されたクリニック）に配置される。

[271]いくつかの実施形態では、放射線科医の第２のセットは放射線専門医（例えば、画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練された放射線科医）を含む。いくつかの実施形態では、放射線科医の第３のセットは、オンサイトクリニック（例えば、画像が取得されたクリニック）からリモートに配置される。いくつかの実施形態では、放射線科医の第３のセットのうちの第３の放射線科医は、複数の画像を含むバッチの画像またはその導出物の放射線科医評価を実施する（例えば、この場合、バッチは放射線医学的評価の効率の向上のために選択される）。

[272]いくつかの実施形態では、ＡＩ支援放射線医学評価ワークフローは、被検者の診断手順を、スクリーニング結果に少なくとも部分的に基づいて実施して、被検者の診断結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップから約１時間以内に作り出される。

[273]いくつかの実施形態では、画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性（例えば、組織密度または物理的性質）、異物の存在（例えば、インプラント）、所見のタイプ、病状（例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される）、またはそれらの組合せを含む。

[274]いくつかの実施形態では、画像またはその導出物は、第１の放射線科医、第２の放射線科医、または第３の放射線科医の追加的な特性（例えば、第１の放射線科医、第２の放射線科医、または第３の放射線科医の、少なくとも１つの画像またはその導出物の放射線医学的評価を行う個人的な能力）に少なくとも部分的に基づいて、第１の放射線科医、第２の放射線科医、または第３の放射線科医に送られる。

[275]いくつかの実施形態では、ＡＩ支援放射線医学評価ワークフローは、画像またはその導出物を第１の放射線科医に送るステップ、または画像またはその導出物を第２の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップを含む。いくつかの実施形態では、ＡＩ支援放射線医学評価ワークフローは、アラートを、被検者または被検者の臨床医療従事者に送信するステップを含む。いくつかの実施形態ではＡＩ支援放射線医学評価ワークフローは、アラートを、患者のモバイルアプリケーションを通じて被検者に送信するステップを含む。いくつかの実施形態では、アラートは、（ｂ）とリアルタイムか、（ｂ）とほぼリアルタイムで生成される。

[276]本発明の好ましい実施形態が、本明細書で示され説明されているが、当業者には、そのような実施形態は単なる例として提供されることが明らかであろう。本発明は、本明細書で与えられる具体的な例によって限定されることは意図されていない。本発明は、上で言及した明細書を参照して説明されたが、本明細書における実施形態の説明および例示は、限定的な意味で解釈されるよう意味されるものではない。当業者にとっては多数の変形、変更、および置き換えが、本発明から逸脱することなく、想到されよう。さらには、本発明のすべての態様は、多様な条件と変数に依存する、本明細書で述べられる具体的な描写、構成または相対的な比率に限定されないことを理解されたい。本発明を実用化する際は、本明細書で説明される本発明の実施形態に対して様々な代替が採用され得ることを理解されたい。したがって、本発明はまた、あらゆるそのような代替、修正、変形、または等価物を包含することを企図される。以下の特許請求の範囲は、本発明の範囲を定めること、ならびにこれらの特許請求の範囲およびその等価物の範囲内の方法および構造が、それらによってカバーされることを意図される。

Claims

前記被検者の身体の部位の少なくとも１つの画像を処理するための方法であって、
（ａ）前記被検者の身体の前記部位の前記少なくとも１つの画像を取得するステップと、
（ｂ）訓練済アルゴリズムを使用して、前記少なくとも１つの画像またはその導出物を、複数のカテゴリのうちの１つのカテゴリに分類するステップであって、分類する前記ステップは、画像処理アルゴリズムを前記少なくとも１つの画像またはその導出物に適用するステップを含む、ステップと、
（ｃ）（ｂ）において前記少なくとも１つの画像またはその導出物を分類すると、（ｉ）前記少なくとも１つの画像が前記複数のカテゴリのうちの第１のカテゴリに分類された場合に、前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために第１の放射線科医に送るステップ、または、（ｉｉ）前記少なくとも１つの画像が前記複数のカテゴリのうちの第２のカテゴリに分類された場合に、前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために第２の放射線科医に送るステップと、
（ｄ）前記少なくとも１つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、前記第１の放射線科医または前記第２の放射線科医から前記被検者の放射線医学的評価を受け取るステップと
を含む方法。
請求項１に記載の方法であって、（ｂ）は、前記少なくとも１つの画像またはその導出物を、正常、曖昧、または、疑わしいとして分類するステップを含む、方法。
請求項２に記載の方法であって、前記少なくとも１つの画像またはその導出物を、前記少なくとも１つの画像またはその導出物の（ｂ）における前記分類に基づいて分類器に送るステップをさらに含む方法。
請求項３に記載の方法であって、（ｃ）は、前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために、第１の複数の放射線科医のうちの第１の放射線科医、または、第２の複数の放射線科医のうちの第２の放射線科医に送るステップを含む、方法。
請求項１に記載の方法であって、前記少なくとも１つの画像またはその導出物は医学的画像である、方法。
請求項２に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の感度で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
請求項２に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の特異性で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
請求項２に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の陽性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
請求項２に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の陰性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
請求項２に記載の方法であって、前記訓練済機械学習アルゴリズムは、前記異常な組織を含むかまたは含むと疑われる、前記少なくとも１つの画像またはその導出物の少なくとも１つの領域を識別するように構成される、方法。
請求項２に記載の方法であって、訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、がんを示すために、正常、曖昧、または、疑わしいとして分類する、方法。
請求項１１に記載の方法であって、前記がんは乳癌である、方法。
請求項１２に記載の方法であって、前記少なくとも１つの画像またはその導出物は、前記被検者の前記乳房の三次元画像である、方法。
請求項１１に記載の方法であって、前記訓練済機械学習アルゴリズムは、がんを示すかまたは示すと疑われる画像を含む少なくとも約１００の独立的な訓練サンプルを使用して訓練される、方法。
請求項１１に記載の方法であって、前記訓練済アルゴリズムは、がんを示すかまたは示すと疑われる陽性画像を含む第１の複数の独立的な訓練サンプル、および、がんを示さないかまたは示すと疑われない陰性画像を含む第２の複数の独立的な訓練サンプルを使用して訓練される、方法。
請求項１に記載の方法であって、前記訓練済アルゴリズムは教師あり機械学習アルゴリズムを含む、方法。
請求項１６に記載の方法であって、前記教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン（ＳＶＭ）、ニューラルネットワーク、または、ランダムフォレストを含む、方法。
請求項２に記載の方法であって、前記被検者をモニタリングするステップをさらに含み、モニタリングする前記ステップは、前記被検者の前記身体の前記部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価する前記ステップは、前記複数の時間的ポイントのそれぞれにおける、前記少なくとも１つの画像またはその導出物の、正常、曖昧、または、疑わしいとしての前記分類に少なくとも部分的に基づく、方法。
請求項１８に記載の方法であって、前記複数の時間的ポイントにおける、前記被検者の前記身体の前記画像の前記評価における差は、（ｉ）前記被検者の診断、（ｉｉ）前記被検者の予後、および、（ｉｉｉ）前記被検者の一連の処置の有効性または非有効性を含む群から選択される１つまたは複数の臨床的指標を示す、方法。
請求項２から１９までのいずれか一項に記載の方法であって、（ｃ）は、（ｉ）前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、前記少なくとも１つの画像またはその導出物が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップ、（ｉｉ）前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、前記少なくとも１つの画像またはその導出物が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップ、または、（ｉｉｉ）前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、前記少なくとも１つの画像またはその導出物が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップをさらに含む方法。
請求項２０に記載の方法であって、前記被検者の前記スクリーニング結果は、前記少なくとも１つの画像またはその導出物を取得する前記ステップと同じクリニック訪問において作り出される、方法。
請求項２０に記載の方法であって、放射線科医の前記第１のセットはオンサイトクリニックに配置され、前記少なくとも１つの画像またはその導出物は前記オンサイトクリニックにおいて取得される、方法。
請求項２０に記載の方法であって、放射線科医の前記第２のセットは放射線専門医を含み、該放射線専門医は、前記少なくとも１つの画像またはその導出物を、前記訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される、方法。
請求項２０に記載の方法であって、放射線科医の前記第３のセットは、オンサイトクリニックからリモートに配置され、前記少なくとも１つの画像は前記オンサイトクリニックにおいて取得される、方法。
請求項２０に記載の方法であって、放射線科医の前記第３のセットのうちの前記第３の放射線科医は、複数の画像を含むバッチのうち前記少なくとも１つの画像またはその導出物の前記放射線科医評価を実施し、前記バッチは前記放射線医学的評価の効率の向上のために選択される、方法。
請求項２０から２５のいずれか一項に記載の方法であって、前記被検者の診断手順を、前記スクリーニング結果に少なくとも部分的に基づいて実施して、前記被検者の診断結果を作り出すステップをさらに含む方法。
請求項２６に記載の方法であって、前記被検者の前記診断結果は、前記少なくとも１つの画像を取得する前記ステップと同じクリニック訪問において作り出される、方法。
請求項２７に記載の方法であって、前記被検者の前記診断結果は、前記少なくとも１つの画像を取得する前記ステップから約１時間以内に作り出される、方法。
請求項２０から２８のいずれか一項に記載の方法であって、前記少なくとも１つの画像またはその導出物は、前記被検者の前記身体の前記部位の追加的な特性に少なくとも部分的に基づいて、前記第１の放射線科医、前記第２の放射線科医、または、前記第３の放射線科医に送られる、方法。
請求項２９に記載の方法であって、前記追加的な特性は、解剖学的構造、組織特性、異物の存在、所見のタイプ、病状、または、それらの組合せを含む、方法。
請求項２０から３０のいずれか一項に記載の方法であって、前記少なくとも１つの画像またはその導出物は、前記第１の放射線科医、前記第２の放射線科医、または、前記第３の放射線科医の追加的な特性に少なくとも部分的に基づいて、前記第１の放射線科医、前記第２の放射線科医、または、前記第３の放射線科医に送られる、方法。
請求項１から３１までのいずれか一項に記載の方法であって、（ｃ）は、前記少なくとも１つの画像またはその導出物を前記第１の放射線科医に送る前記ステップ、または、前記少なくとも１つの画像またはその導出物を前記第２の放射線科医に送る前記ステップに少なくとも部分的に基づいて、アラートを生成するステップをさらに含む方法。
請求項３２に記載の方法であって、前記アラートを、前記被検者または前記被検者の臨床医療従事者に送信するステップをさらに含む方法。
請求項３３に記載の方法であって、前記アラートを、患者のモバイルアプリケーションを通じて前記被検者に送信するステップをさらに含む方法。
請求項３２に記載の方法であって、前記アラートは、（ｂ）とリアルタイムかまたはほぼリアルタイムで生成される、方法。
請求項１に記載の方法であって、前記画像処理アルゴリズムを適用するステップは、前記少なくとも１つの画像またはその導出物内で関心領域を識別するステップと、前記関心領域をラベル付けして少なくとも１つのラベル付けされた画像を作り出すステップとを含む、方法。
請求項３６に記載の方法であって、前記少なくとも１つのラベル付けされた画像をデータベースに記憶するステップをさらに含む方法。
請求項１から３７のいずれか一項に記載の方法であって、前記少なくとも１つの画像またはその導出物のうちの１つまたは複数および前記分類をデータベースに記憶するステップをさらに含む方法。
請求項１から３８までのいずれか一項に記載の方法であって、前記少なくとも１つの画像またはその導出物のうちの１つまたは複数および前記分類に少なくとも部分的に基づいて、前記少なくとも１つの画像またはその導出物のプレゼンテーションを生成するステップをさらに含む方法。
請求項３９に記載の方法であって、前記プレゼンテーションを前記データベースに記憶するステップをさらに含む方法。
請求項１から４０までのいずれか一項に記載の方法であって、（ｃ）は、（ｂ）とリアルタイムかまたはほぼリアルタイムで実行される、方法。
請求項１に記載の方法であって、前記少なくとも１つの画像は、前記被検者から取得された複数の画像を含み、前記複数の画像は、異なるモダリティを使用するかまたは異なる時間的ポイントにおいて取得される、方法。
請求項１に記載の方法であって、分類する前記ステップは、前記被検者の臨床健康データを処理するステップを含む、方法。
前記被検者の身体の部位の少なくとも１つの画像を処理するためのコンピュータシステムであって、
前記被検者の身体の前記部位の前記少なくとも１つの画像を記憶するように構成されたデータベースと、
前記データベースに動作可能に結合された１つまたは複数のコンピュータプロセッサであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、
（ａ）訓練済アルゴリズムを使用して、前記少なくとも１つの画像またはその導出物を、複数のカテゴリのうちの１つのカテゴリに分類するステップであって、分類する前記ステップは、画像処理アルゴリズムを前記少なくとも１つの画像またはその導出物に適用するステップを含む、ステップと、
（ｂ）（ｂ）において前記少なくとも１つの画像またはその導出物を分類すると、（ｉ）前記少なくとも１つの画像が前記複数のカテゴリのうちの第１のカテゴリに分類される場合に、前記少なくとも画像またはその導出物を、放射線医学的評価のために第１の放射線科医に送るステップ、または、（ｉｉ）前記少なくとも１つの画像が前記複数のカテゴリのうちの第２のカテゴリに分類される場合に、前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために第２の放射線科医に送るステップと、
（ｃ）前記少なくとも１つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、前記第１の放射線科医または前記第２の放射線科医から前記被検者の放射線医学的評価を受け取るステップと
を行うようにプログラムされる、１つまたは複数のコンピュータプロセッサと。
請求項４４に記載のコンピュータシステムであって、（ｂ）は、前記少なくとも１つの画像またはその導出物を、正常、曖昧、または、疑わしいとして分類するステップを含む、コンピュータシステム。
請求項４５に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも１つの画像またはその導出物を、前記少なくとも１つの画像または導出物の（ａ）における前記分類に基づいて分類器に送るステップをさらに行うようにプログラムされる、コンピュータシステム。
請求項４６に記載のコンピュータシステムであって、（ｃ）は、前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために、第１の複数の放射線科医のうちの第１の放射線科医、または、第２の複数の放射線科医のうちの第２の放射線科医に送るステップを含む、コンピュータシステム。
請求項４４に記載のコンピュータシステムであって、前記少なくとも１つの画像またはその導出物は医学的画像である、コンピュータシステム。
請求項４５に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の感度で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
請求項４５に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の特異性で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
請求項４５に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の陽性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
請求項４５に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、少なくとも約８０％の陰性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
請求項４５に記載のコンピュータシステムであって、前記訓練済機械学習アルゴリズムは、前記異常な組織を含むかまたは含むと疑われる、前記少なくとも１つの画像またはその導出物の前記少なくとも１つの領域を識別するように構成される、コンピュータシステム。
請求項４４から４６に記載のコンピュータシステムであって、訓練済アルゴリズムは、前記少なくとも１つの画像またはその導出物を、がんを示すために、正常、曖昧、または、疑わしいとして分類する、コンピュータシステム。
請求項５４に記載のコンピュータシステムであって、前記がんは乳癌である、コンピュータシステム。
請求項５５に記載のコンピュータシステムであって、前記少なくとも１つの画像またはその導出物は、前記被検者の前記乳房の三次元画像である、コンピュータシステム。
請求項５４に記載のコンピュータシステムであって、前記訓練済機械学習アルゴリズムは、がんを示すかまたは示すと疑われる画像を含む少なくとも約１００の独立的な訓練サンプルを使用して訓練される、コンピュータシステム。
請求項５４に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、がんを示すかまたは示すと疑われる陽性画像を含む第１の複数の独立的な訓練サンプル、および、がんを示さないかまたは示すと疑われない陰性画像を含む第２の複数の独立的な訓練サンプルを使用して訓練される、コンピュータシステム。
請求項４４に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、教師あり機械学習アルゴリズムを含む、コンピュータシステム。
請求項５９に記載のコンピュータシステムであって、前記教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン（ＳＶＭ）、ニューラルネットワーク、または、ランダムフォレストを含む、コンピュータシステム。
請求項４５に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記被検者をモニタリングするステップをさらに行うようにプログラムされ、モニタリングする前記ステップは、前記被検者の前記身体の前記部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価する前記ステップは、前記複数の時間的ポイントのそれぞれにおける、前記少なくとも１つの画像またはその導出物の、正常、曖昧、または、疑わしいとしての前記分類に少なくとも部分的に基づく、コンピュータシステム。
請求項６１に記載のコンピュータシステムであって、前記複数の時間的ポイントにおける、前記被検者の前記身体の前記画像の前記評価における差は、（ｉ）前記被検者の診断、（ｉｉ）前記被検者の予後、および、（ｉｉｉ）前記被検者の一連の処置の有効性または非有効性を含む群から選択される１つまたは複数の臨床的指標を示す、コンピュータシステム。
請求項４４から６２までのいずれか一項に記載のコンピュータシステムであって、（ｂ）は、（ｉ）前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第１のセットのうちの第１の放射線科医に送って、前記少なくとも１つの画像またはその導出物が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、（ｉｉ）前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第２のセットのうちの第２の放射線科医に送って、前記少なくとも１つの画像またはその導出物が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または、（ｉｉｉ）前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために放射線科医の第３のセットのうちの第３の放射線科医に送って、前記少なくとも１つの画像またはその導出物が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとをさらに含む、コンピュータシステム。
請求項６３に記載のコンピュータシステムであって、前記被検者の前記スクリーニング結果は、前記少なくとも１つの画像またはその導出物を取得する前記ステップと同じクリニック訪問において作り出される、コンピュータシステム。
請求項６３に記載のコンピュータシステムであって、放射線科医の前記第１のセットは、オンサイトクリニックに配置され、前記少なくとも１つの画像またはその導出物は前記オンサイトクリニックにおいて取得される、コンピュータシステム。
請求項６３に記載のコンピュータシステムであって、放射線科医の前記第２のセットは放射線専門医を含み、該放射線専門医は、前記少なくとも１つの画像またはその導出物を、前記訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される、コンピュータシステム。
請求項６３に記載のコンピュータシステムであって、放射線科医の前記第３のセットは、オンサイトクリニックからリモートに配置され、前記少なくとも１つの画像は前記オンサイトクリニックにおいて取得される、コンピュータシステム。
請求項６３に記載のコンピュータシステムであって、放射線科医の前記第３のセットのうちの前記第３の放射線科医は、複数の画像を含むバッチのうち前記少なくとも１つの画像またはその導出物の前記放射線科医評価を実施し、前記バッチは前記放射線医学的評価の効率の向上のために選択される、コンピュータシステム。
請求項６３から６８までのいずれか一項に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記スクリーニング結果に少なくとも部分的に基づいて、前記被検者に対して行われる診断手順から前記被検者の診断結果をさらに取得するようにプログラムされる、コンピュータシステム。
請求項６９に記載のコンピュータシステムであって、前記被検者の前記診断結果は、前記少なくとも１つの画像を取得する前記ステップと同じクリニック訪問において取得される、コンピュータシステム。
請求項７０に記載のコンピュータシステムであって、前記被検者の前記診断結果は、前記少なくとも１つの画像を取得する前記ステップから約１時間以内に取得される、コンピュータシステム。
請求項６３から７１のいずれか一項に記載のコンピュータシステムであって、前記少なくとも１つの画像またはその導出物は、前記被検者の前記身体の前記部位の追加的な特性に少なくとも部分的に基づいて、前記第１の放射線科医、前記第２の放射線科医、または、前記第３の放射線科医に送られる、コンピュータシステム。
請求項７２に記載のコンピュータシステムであって、前記追加的な特性は、解剖学的構造、組織特性、異物の存在、所見のタイプ、病状、または、それらの組合せを含む、コンピュータシステム。
請求項６３から７３のいずれか一項に記載のコンピュータシステムであって、前記少なくとも１つの画像またはその導出物は、前記第１の放射線科医、前記第２の放射線科医、または、前記第３の放射線科医の追加的な特性に少なくとも部分的に基づいて、前記第１の放射線科医、前記第２の放射線科医、または、前記第３の放射線科医に送られる、コンピュータシステム。
請求項４４から７４までのいずれか一項に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも１つの画像またはその導出物を前記第１の放射線科医に送る前記ステップ、または、前記少なくとも１つの画像またはその導出物を前記第２の放射線科医に送る前記ステップに少なくとも部分的に基づいて、アラートをさらに生成するようにプログラムされる、コンピュータシステム。
請求項７５に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記アラートを前記被検者または前記被検者の臨床医療従事者にさらに送信するようにプログラムされる、コンピュータシステム。
請求項７６に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記アラートを患者のモバイルアプリケーションを通じて前記被検者にさらに送信するようにプログラムされる、コンピュータシステム。
請求項７５に記載のコンピュータシステムであって、前記アラートは、（ａ）とリアルタイムかまたはほぼリアルタイムで生成される、コンピュータシステム。
請求項４４に記載のコンピュータシステムであって、前記画像処理アルゴリズムを適用するステップは、前記少なくとも１つの画像またはその導出物内で関心領域を識別するステップと、前記関心領域をラベル付けして少なくとも１つのラベル付けされた画像を作り出すステップとを含む、コンピュータシステム。
請求項７９に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも１つのラベル付けされた画像を前記データベースにさらに記憶するようにプログラムされる、コンピュータシステム。
請求項４４から８０までのいずれか一項に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも１つの画像またはその導出物のうちの１つまたは複数および前記分類を前記データベースにさらに記憶するようにプログラムされる、コンピュータシステム。
請求項４４から８１までのいずれか一項に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも１つの画像のうちの１つまたは複数および前記分類に少なくとも部分的に基づいて、前記少なくとも１つの画像またはその導出物のプレゼンテーションをさらに生成するようにプログラムされる、コンピュータシステム。
請求項８２に記載のコンピュータシステムであって、前記１つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記プレゼンテーションを前記データベースにさらに記憶するようにプログラムされる、コンピュータシステム。
請求項４４に記載のシステムであって、前記１つまたは複数のコンピュータプロセッサに動作可能に結合された電子ディスプレイをさらに備え、前記電子ディスプレイは前記推奨を表示するように構成されるグラフィカルユーザインターフェースを備える、システム。
請求項４４から８４までのいずれか一項に記載のシステムであって、（ｂ）は、（ａ）とリアルタイムかまたはほぼリアルタイムで実行される、システム。
請求項４４に記載の方法であって、前記少なくとも１つの画像は、前記被検者から取得された複数の画像を含み、前記複数の画像は、異なるモダリティを使用するかまたは異なる時間的ポイントにおいて取得される、方法。
請求項４４に記載の方法であって、分類する前記ステップは、前記被検者の臨床健康データを処理するステップを含む、方法。
１つまたは複数のコンピュータプロセッサによって実行されると、前記被検者の身体の部位の少なくとも１つの画像を処理するための方法を実施する機械実行可能コードを含む非一時的なコンピュータ可読媒体であって、前記方法は、
（ａ）前記被検者の身体の前記部位の前記少なくとも１つの画像を取得するステップと、
（ｂ）訓練済アルゴリズムを使用して、前記少なくとも１つの画像またはその導出物を、複数のカテゴリのうちの１つのカテゴリに分類するステップであって、分類する前記ステップは、画像処理アルゴリズムを前記少なくとも１つの画像またはその導出物に適用するステップを含む、ステップと、
（ｃ）（ｂ）において前記少なくとも１つの画像またはその導出物を分類すると、（ｉ）前記少なくとも１つの画像が前記複数のカテゴリのうちの第１のカテゴリに分類される場合に、前記少なくとも画像またはその導出物を、放射線医学的評価のために第１の放射線科医に送るステップ、または、（ｉｉ）前記少なくとも１つの画像が前記複数のカテゴリのうちの第２のカテゴリに分類される場合に、前記少なくとも１つの画像またはその導出物を、放射線医学的評価のために第２の放射線科医に送るステップと、
（ｄ）前記少なくとも１つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、前記第１の放射線科医または前記第２の放射線科医から前記被検者の放射線医学的評価を受け取るステップと
を含む、非一時的なコンピュータ可読媒体。