JP2019061710A

JP2019061710A - ３ｄバッチ正規化を伴う三次元（３ｄ）畳み込み

Info

Publication number: JP2019061710A
Application number: JP2018228657A
Authority: JP
Inventors: ソーチャー，リチャード; Socher Richard; ション，カイミング; Caiming Xiong; タイ，カイ，ション; Kai Sheng Tai
Original assignee: Salesforce com Inc
Current assignee: Salesforce Inc
Priority date: 2015-08-15
Filing date: 2018-12-06
Publication date: 2019-04-18
Anticipated expiration: 2036-08-15
Also published as: JP2018531648A; AU2018229500B2; US11416747B2; CN108140141B; US10282663B2; CA2994713C; JP2021093178A; AU2016308097B2; CN110688891A; CA2994713A1; JP6838038B2; WO2017031088A1; EP3335158B1; EP3335158A1; US20190213482A1; CN108140141A; US20170046616A1; JP7094407B2; AU2018229500A1; JP6450053B2

Abstract

【課題】計算機的に効率の良い、畳み込みニューラルネットワーク（ＣＮＮ）内における３Ｄ画像分類および物体認識方法を提供する。【解決手段】サブネットワークモジュールを装備した、３Ｄディープ畳み込みニューラルネットワークアーキテクチャー（ＤＣＮＮＡ）を使用する。また、サブネットワークは３Ｄデータを、異なる３Ｄ畳み込み層経路によって３Ｄデータを並列処理の対象にすることによって複数のスケールで畳み込みする。加えて、サブネットワークのパフォーマンスはサブネットワークへの３Ｄ入力を正規化し、代わりに３ＤＤＣＮＮＡの学習率を増加させる３Ｄバッチ正規化（ＢＮ）を行う。一連のサブネットワークモジュールに渡る数層の３Ｄ畳み込みおよび３Ｄによる３Ｄサブサンプリングの後、垂直次元が削減された特徴マップが３Ｄ放射線体積から生成され、１つ以上の全結合層へ提供される。【選択図】図２

Description

優先権出願
本出願は２０１５年８月１５日に出願された“ＭｅｄｉｃａｌＶｉｓｉｏｎＳｙｓｔｅｍ”と称する米国仮特許出願第６２／２０５，７１８号（特許弁護士整理番号ＳＡＬＥ１１６５−１／２０２１ＰＲ）に関連しその利益を主張するものである。当該仮出願はここに引用することにより、あらゆる目的のために組み込まれているものとする。

開示される技術は、一般に３Ｄディープ畳み込みニューラルネットワーク（ＤＣＮＮＡ）内の三次元（３Ｄ）データの処理中の計算能力およびメモリ利用などの、計算資源の利用の向上に関し、とりわけ、計算機的に効率の良い、畳み込みニューラルネットワーク（ＣＮＮ）内における３Ｄ画像分類および物体認識の実施に関する。

本章で議論する対象は、本章による言及の結果のみによって先行技術であると仮定されるべきではない。同様に、本章で提示されるまたは背景として提供される対象に関連する問題は、先行技術内で認められると仮定されるべきではない。本章の対象は異なるアプローチを表現するにすぎず、特許請求する技術の実施例にも関連してもよい。

開示される技術により、限られたメモリと計算機容量の中で膨大な量のデータを処理する必要がある、医療用画像などのビッグデータシナリオにおいても、畳み込みニューラルネットワーク（ＣＮＮ）の利用が可能になる。既存のディープ畳み込みニューラルネットワーク（ＣＮＮ）の主要な技術的課題は、多大な計算資源を必要とするということである。開示する技術によれば、この問題は、３Ｄディープ畳み込みニューラルネットワークアーキテクチャー（ＤＣＮＮＡ）内に、３Ｄデータが演算負荷の高い操作の対象になる前に３Ｄデータへ次元削減操作を行う、いわゆるサブネットワークを追加することで解決される。また、サブネットワークは３Ｄデータに対して、異なる３Ｄ畳み込み層経路（例えば１ｘ１ｘ１畳み込み、３ｘ３ｘ３畳み込み、５ｘ５ｘ５畳み込み、７ｘ７ｘ７畳み込み）によって３Ｄデータを並列処理の対象にすることにより、複数のスケールで畳み込みを行う。このようなマルチスケール操作は直列の畳み込みを行う従来のＣＮＮよりも計算機的に安価である。加えて、サブネットワークのパフォーマンスはサブネットワークへの３Ｄ入力を正規化し、代わりに３ＤＤＣＮＮＡの学習率を増加させる３Ｄバッチ正規化（ＢＮ）によりさらに改善される。

機械学習は、明確にプログラミングされていなくとも学習を行う能力をコンピューターに提供する、人工知能（ＡＩ）のエリアの研究分野である。静的プログラミングに対して、機械学習は、あるデータで訓練したアルゴリズムを、該データまたは別のデータに関する予測を生成するために使用する。ディープラーニングは、データの低レベル解析の層ごとに、該データの高レベル抽象化をモデリングする機械学習の一形態である。近年、ＣＮＮにより画像分類および物体認識は大きく進歩した。畳み込みフィルターの複数層を訓練することにより、サポートベクトルマシン（ＳＶＭ）、ＰＣＡ、線形判別分析（ＬＤＡ）、ベイズインターパーソナル分類器などの多くの機械学習ツールの一般化の能力は、訓練の量が増えるに従い、素早く飽和する傾向にある。しかし、ＣＮＮは、異なる時刻において多数の様々な画像を用いて訓練する場合、従来の機械学習アルゴリズムと比較してより良いパフォーマンスをすることが判明した。ＣＮＮは物体認識において複雑な特徴を自動的に学習でき、手作業で作成した特徴よりも優れたパフォーマンスを達成する。

しかしながら、ＣＮＮは、それがないとネットワークが学習および印象的な認識パフォーマンスを実現することに失敗する、多量の訓練データを必要とする。このような多量のデータで訓練を行うには数千ものＣＰＵコアおよび／またはＧＰＵのような多大な計算資源が必要であり、それによりＣＮＮの応用例は限定的なものとなり、モバイルや組み込み計算機には拡張不可能なものとなる。従って、ビッグデータの解析時に計算資源のパフォーマンスを向上させるＣＮＮアーキテクチャーが必要とされる。

図面においては、異なる図においても、同様の部分には同様の参照記号を割り当てる。また、図面は、必ずしも同一のスケールではあらず、代わりに、開示する技術の原理を図示するために概して強調されている。以下、本開示の様々な実施態様を、以下の図面を参照して説明する。
図１は実施例に従ったシステムの構成レベルの概略を示す。図２は本開示における技術の一実施態様における３ＤＤＣＮＮＡ内のサブネットワークのブロック図であり、マルチスケール３Ｄ畳み込み層経路および３Ｄプーリング操作の詳細を示す。図３は複数のサブネットワークおよび、前および後処理層を備えた３ＤＤＣＮＮＡの例である。図４Ａは正規化された３Ｄ入力を生成するために前のサブネットワークからの３Ｄ入力へ適用する３Ｄバッチ正規化（ＢＮ）操作の一実施例を示す。図４Ｂは別途に学習された非線形活性化を正規化された３Ｄ入力へ適用する、次のサブネットワークによる処理のための、スケール変更されシフトされた３Ｄ出力への、３Ｄバッチ正規化（ＢＮ）操作の一実施例を示す。図５は複数のサブネットワークおよび３Ｄバッチ正規化層の組み合わせを使用する３ＤＤＣＮＮＡのブロック図を示す。図６は３ＤＤＣＮＮＡの一実施例を示す。図７は人間の脳の医療用スキャンによる３Ｄ放射性体積の形態をとる、３ＤＤＣＮＮＡによって使用されるグレースケール３Ｄ入力データの例を示す。図８は人間の脳の医療用スキャンによる３Ｄ放射性体積の形をとる、３ＤＤＣＮＮＡによって使用されるカラーの３Ｄ入力データの例である。図９は人間の脳の医療用スキャンから生成された３Ｄ放射性体積に基づいた、３ＤＤＣＮＮＡが人間の脳内の頭蓋内出血（ＩＨ）構造の検出に使用されるユースケースの一実施例を示す。図１０は３ＤＤＣＮＮＡの出力に基づいて、出力の計算に最も寄与した３Ｄ入力データの特徴を決定するための、図７に示された３Ｄ入力データをバックトラックする処理の一実施例である。図１１は、開示されたＤＣＮＮＡを使用しない場合の３ＤＣＮＮの実験結果の一実施例をデモンストレーションするＰＲ曲線を示す。図１２は開示されたＤＣＮＮＡを使用する場合の３ＤＣＮＮの実験結果の一実施例をデモンストレーションするＰＲ曲線を示す。図１３はディープニューラルネットワークにおいて３Ｄデータを畳み込む代表手法である。図１４はディープニューラルネットワークにおいて３Ｄデータを畳み込む別のプロセスである。図１５は、開示技術の１つ以上の実施例による、図１のシステムと統合することに適したマルチテナントシステムの例のブロック図である。

序
以下、図を参照して詳細な説明を行う。開示する技術の実施例が示されるが、開示する技術の請求項によって定義される範囲を限定する目的ではない。当業者は、以下の説明には様々な等価なバリエーションがあることを認識する。

議論は以下のように体系付けられる。まず、様々な実施例により問題点を指摘し導入として提示する。そして、アーキテクチャーレベルにて一実施例を議論することにより、より高レベルの説明を行う。次に、３Ｄデータを効果的に処理するために、ある実施例に用いられるアルゴリズムを議論する。最後に、システムを実施するためのより具体的なアーキテクチャーおよび３Ｄデータの例、３Ｄディープ畳み込みニューラルネットワークアーキテクチャー（ＤＣＮＮＡ）を適用するユースケース例、実験結果、マルチテナント環境における処理と組み込みについて議論する。

ＣＮＮで３Ｄを処理すると、より多いパラメーター、膨大なメモリおよび計算機的要求が伴う。従来のＣＮＮは、入力３Ｄ画像から、スカラーまたはベクトルであるボクセル信号により、データのエンコードとデコードを組み合わせて、特徴マップを抽出する。入力画像は、固定されたボクセルの近傍を隠れ層のベクトル特徴空間にマップすることによりエンコードされ、出力層において、オリジナル画像空間へ再構成される。多様な入力データの特性のパターンをとらえた特徴の抽出には、オートエンコーダの訓練において再構成エラーを減らすために、誤差逆伝播法および特徴量空間のプロパティへの制限を採用している。しかしながら、ベクトルであるボクセル信号を持つ３Ｄ画像からグローバルな特徴を抽出することは、入力（エンコード）および出力（デコード）層において評価されるパラメーターの数が急速に増えているために、演算負荷が高く、過大な訓練データセットを必要とする。

３Ｄデータを処理する計算機負荷を克服するために、開示される技術においては、３Ｄ放射線体積が演算負荷の高い操作の対象になる前に３Ｄ放射線体積へ次元削減操作を行う、いわゆるサブネットワークモジュールを装備した、３Ｄディープ畳み込みニューラルネットワークアーキテクチャー（ＤＣＮＮＡ）を使用する。加えて、サブネットワークのパフォーマンスはサブネットワークへの３Ｄ入力を正規化し、代わりに３ＤＤＣＮＮＡの学習率を増加させる３Ｄバッチ正規化（ＢＮ）によりさらに改善される。一連のサブネットワークモジュールに渡る、３Ｄカーネル（すなわち学習された隠れた重み）を用いた数層の３Ｄ畳み込みおよび３Ｄサブサンプリングの後、３Ｄ放射線体積から垂直次元が削減された特徴マップが生成され、１つ以上の全結合層へ提供される。該全結合層の演算の後、分類または回帰された出力が生成される。１つの実施例は、３ＤＤＣＮＮＡは、それぞれの後に３ＤＢＮ層が続く３つ以上のサブネットワークモジュール、畳み込み層、サブサンプリング層、全結合層、および出力層を備える。

３ＤＤＣＮＮＡのより深い層への重みのアップデートを行うと、結果として３Ｄ入力の分布が絶えず変化し、対応する代替特徴体積表現または特徴マップが、重みの収束を妨げる。一実施例では、訓練の繰り返しにおいて、重みのアップデートは重みの分散の片寄りを起こし、代替特徴体積表現が次の繰り返しにおいて増幅される。さらに、３Ｄにおける特徴において問題は悪化し、任意の分散が層の数に基づいて指数関数的に増幅される。開示する技術ではこれに対抗して、結果である代替特徴体積表現をよりよく維持するため、サブネットワーク処理ステップの後に、ＤＣＮＮＡの隠れ層に、ＤＣＮＮＡの非線形活性化の正規化を可能にする３Ｄバッチ正規化（ＢＮ）技術を採用する。一実施例では、この正規化の幾何学的解釈は、もしも３Ｄ入力が多変数ガウス分布であれば、ある実施における変換データは、ゼロ平均のガウス分布および単位共分散である。結果、ＢＮは、学習率を向上させることにより、また学習を正規化することにより、３ＤＤＣＮＮＡの学習を加速させる。

さらに、医療のプロフェッショナルは、３Ｄ医療用画像を解釈し、および診断テストにおいて異常を発見するための、様々な医療用ワークフローを持っている。例えば、年１回のマンモグラムにおいては、患者は放射線科のかかりつけ医にかかる。特許は、３Ｄ医療用画像の組が結果として提供される、例えばＸ線によるマンモグラムを受け、そしてことによると、現場の専門家が追加の調査や代わりの画像が必要かを判断するため、Ｘ線写真に対して予備の検討を行うかもしれない。Ｘ線写真は電子システムに投入され、専門家が吟味し、かかりつけ医のための診断を記入する。患者はかかりつけ医からの呼び出しを待ち、マンモグラムの結果を入手する。このプロセスにおいては、マンモグラムの実施から結果まで数週間を要し得る。必要なのは、短時間で応答でき、診断の誤りが少なく、また、専門性または経験が少ないプロフェッショナルがより高いレベルで仕事を行えるようにするための、このような３Ｄ医療用画像を取り扱う新しいプロセスである。

開示された実施例に基づいたシステム、装置、および方法は、医療視覚の文脈、および３Ｄデータにより説明される。他の事例では、開示された技術は、情報技術、不正検知、遠隔通信システム、金融システム、証券取引、銀行業務、ビジネスインテリジェンス、マーケティング、鉱業、エネルギー等、および２Ｄ、３Ｄ、４Ｄまたはｎ次元データに適用することができる。以下の例は範囲、文脈、設定を、定義または限定するよう受け取られるべきではなく、他のサービスが可能である。他の適用も可能であり、以下の例が決定的、または範囲もしくは設定のいずれかを制限すると解釈されるべきではない。

開示された技術は、ディープ畳み込みニューラルネットワークアーキテクチャー内部での三次元（３Ｄ）データの処理における計算能力およびメモリ使用のような、計算資源の使用の改善に関する。開示された技術は、オンデマンドデータベースシステム、マルチテナント環境等を含む、任意のコンピューター実行システムにて実施できる。さらに、本技術は、協力し互いに通信する２つ以上の独立し異なるコンピューター実行システムを使用して実施できる。本技術は、プロセス、方法、装置、システム、デバイス、コンピューターにより読み取り可能な命令またはコンピュータープログラムコードを記憶したコンピューター可読記憶媒体のような、または、コンピューターにより読み取り可能なプログラムコードを内部に組み込んだコンピューターにより利用可能な媒体を備えたコンピュータープログラム製品のような、コンピューター可読媒体、などを含む数々の方法で実施可能である。

開示された技術は、データベースシステム、マルチテナント環境、またはＯｒａｃｌｅ^ＴＭ互換データベース実装ＩＢＭＤＢ２ＥｎｔｅｒｐｒｉｓｅＳｅｒｖｅｒ^ＴＭ互換関係データベース実装、ＭｙＳＱＬ^ＴＭまたはＰｏｓｔｇｒｅＳＱＬ^ＴＭ互換関係データベース実装またはＭｉｃｒｏｓｏｆｔＳＱＬＳｅｒｖｅｒ^ＴＭ互換関係データベース実装のような関係データベース実装、またはＶａｍｐｉｒｅ^ＴＭ互換非関係データベース実装、ＡｐａｃｈｅＣａｓｓａｎｄｒａ^ＴＭ互換非関係データベース実装、ＢｉｇＴａｂｌｅ^ＴＭ互換非関係データベース実装、またはＨＢａｓｅ^ＴＭまたはＤｙｎａｍｏＤＢ^ＴＭ互換非関係データベース実装、のような、ＮｏＳＱＬ非関係データベース実装を含む、任意のコンピューターに実装されたシステムにおいて実施することができる。

加えて、開示された技術はＭａｐＲｅｄｕｃｅ^ＴＭ、バルク同期プログラミング、ＭＰＩｐｒｉｍｉｔｉｖｅｓ等、またはＡｐａｃｈｅＳｔｏｒｍ^ＴＭ、ＡｐａｃｈｅＳｐａｒｋ^ＴＭ、ＡｐａｃｅＫａｆｋａ^ＴＭ、Ｔｒｕｖｉｓｏ^ＴＭ、ＩＢＭＩｎｆｏ−Ｓｐｈｅｒｅ^ＴＭ、Ｂｏｒｅａｌｉｓ^ＴＭおよびＹａｈｏｏ！Ｓ４^ＴＭなどの異なるストリーム管理システムを使用して実施できる。

システムの概要
従来の畳み込みニューラルネットワーク（ＣＮＮ）において計算機的に効果的な３Ｄ画像分類および物体認識を行うシステムおよび様々な実施例について説明する。ある実施例におけるシステムの構造レベルの概略を示す図１を参照してシステムとプロセスを説明する。図１は構造図であるので、明瞭な説明のために特定の細部は意図的に省略されている。図１の議論は以下のように整理される。まず、図の要素について説明し、それらの相互接続を説明する。次に、システム内での要素の用途をより詳細に説明する。

図１はシステム１００を含む。システム１００は機械学習システム１１０、タブレット１６２、携帯電話１６４、そしてコンピューター１６６のような計算装置、訓練データ記憶装置１７６、テストデータ記憶装置１８６およびネットワーク１６０を含む。機械学習システム１１０はテスト部１１２、訓練部１２２、ディープラーニングネットワーク１３２、および３Ｄ畳み込みニューラルネットワーク（ＣＮＮ）１４２を含む。

システム１００の要素の相互接続について説明する。ネットワーク１６０はタブレット１６２、携帯電話１６４、コンピューター１６６、訓練データ記憶装置１７６、テストデータ記憶装置１８６、および機械学習システム１１０を通信可能なように接続する（実線で示される）。実際の通信経路は、パブリックおよび／またはプライベートネットワークを通るポイントツーポイントである。テストデータなどの項目は、例えばアプリケーション記憶装置（図示せず）を介して、間接的に届けられる。通信は、例えばプライベートネットワーク、ＶＰＮ、ＭＰＬＳ回線、またはインターネットなどの様々なネットワークを介して行われ、ＲＥＳＴ、ＪＳＯＮ、ＸＭＬ、ＳＯＡＰ、および／またはＪＭＳなどの適切なＡＰＩおよびデータ交換フォーマットを使用してもよい。通信は暗号化されてもよい。この通信は一般的にはＬＡＮ（ローカルエリアネットワーク）、ＷＡＮ（広域ネットワーク）、電話回線網（公衆交換電話網（ＰＳＴＮ）、セッション開始プロトコル（ＳＩＰ）、無線ネットワーク、ポイントツーポイントネットワーク、スター型ネットワーク、トークンリングネットワーク、ハブネットワーク、インターネット、モバイルインターネットの包含を介して、またＥＤＧＥ、３Ｇ、４ＧＬＴＥ、Ｗｉ−ＦｉおよびＷｉＭＡＸのようなプロトコルを介して行われる。加えて、ユーザー名／パスワード、ＯＡｕｔｈ、Ｋｅｒｂｅｒｏｓ、ＳｅｃｕｒｅＩＤ、デジタル署名、その他などの認証・認可技術を、通信を安全にするために使用してもよい。

３Ｄ畳み込みニューラルネットワーク（ＣＮＮ）
図１の要素、およびそれらの相互接続を説明したので、図の要素をより詳細に説明する。機械学習システム１１０はテスト部１１２および訓練部１２２を介して様々な機能を提供する。訓練部１２２は、コスト関数を最小化することにより、３Ｄ畳み込みニューラルネットワーク（ＣＮＮ）１４２を訓練する。一実施例では、コスト関数は、勾配の指定を誤差逆伝播法アルゴリズムに依拠する確率的勾配降下法（ＳＧＤ）を使用して最小化される。ある実施例では、訓練部１２２はＳＧＤを使用して、与えられたバッチサイズにおいてミニバッチから推定された勾配に基づいた繰り返しのアップデートを行い、ここで１つのアップデートは各ミニバッチの後に行われる。一実施例では、各勾配のアップデートはさらに、現在の勾配と、３ＤＣＮＮ１４２の前方伝播中にコスト関数によって計算されたエラー値に基づいた直前のアップデート繰り返しによる勾配の重みづけされたの組み合わせとして３ＤＣＮＮ１４２の様々なパラメーターをアップデートする、モーメントに基づいた学習ルールにより増大される。

３ＤＣＮＮ１４２を訓練するためには、訓練データ記憶装置１７６からの３Ｄデータが使用される。一実施例では、訓練データ記憶装置１７６は、３ＤＣＮＮ１４２をサービスまたは製品として提供する第一の企業体によって整備され利用される。別の実施例では、訓練データ記憶装置１７６は、第一の企業体によって、第一の企業体によって開発された３ＤＣＮＮ１４２をビジネスまたは技術的課題を解決するために適用する第二の企業体（例えば仲介ベンダー）と共同して配置される。さらに別の実施例では、訓練データ記憶装置１７６は、エンドユーザーによって提供された、またはエンドユーザーを使用して（例えばクラウドソーシング）生成されたデータを使用して配置される。ある実施例では、３ＤＣＮＮ１４２は、最新鋭の正確さと信頼性をもってコンピューター視覚タスクを遂行する医療視覚視点を持った学習システムとして働く。この医療視覚システムは医療のプロフェッショナルによりラベル付けされた例をもとに訓練され、その後画像データに基づいた特定の医療的問題の確認と診断を補助するために展開される。訓練中は、適切な医療プロフェッショナルにより健康および／または異常要素として特徴づけられた３Ｄ医療用画像および／または画像の一部分が、ディープラーニング医療視覚システムに提供される。

一実施例における訓練データは、１つ以上の画像の組から成る。一実施例においては、各画像または画像の組は、１つ以上の追加情報に関連付けられる。ある実施例においては、追加情報は画像または画像の組に対するラベルを含む。一実施例においては、訓練データは、ラベル付けされた一組のコンピューター断層（ＣＴ）スキャンである。他の実施例では、超音波、磁気共鳴画像（ＭＲＩ）画像などを含む、他の型の画像を含む。

３Ｄ医療用画像は、例えば様々な健康および異常な眼を例示する眼底撮影法のような、様々な題材を含んでいてもよい。眼底の画像は様々なフォーマットであってもよい。眼の異常としては、糖尿病網膜症、鬱血乳頭、動脈性高血圧の眼科的兆候などが、その他の異常の中でも考えられる。他の３Ｄ医療用画像は他の題材を含んでいてもよい。例えば、ＣＴスキャンとしては、様々な健康または異常な題材を含んだ頭部のＣＴスキャンが考えられる。例えば、異常な頭部のＣＴスキャンは、頭蓋内出血、硬膜血腫、硬膜下血種、実質内出血、脳室内出血、くも膜下出血、脳室の拡大／偏位、脳槽異常、腫瘤病変／腫瘤効果、浮腫の一般的エビデンス、膿瘍、虚血梗塞を示す凝血、頭蓋骨骨折、およびｈｙｐｅｒｄｅｎｓｅ中大脳動脈（ＭＣＡ）のうち１つ以上を示すことがあり得る。同一または他のエリアの、他の３Ｄ医療用画像により、例えば肺塞栓症のような肺または心臓の異常のような、他の異常題材が示され得る。

ある実施例では、訓練データは３ＤＣＮＮ１４２によって処理され得る。画像処理は、訓練データ画像内のデータへの１つ以上の操作を含む。画像処理の例は、特定のピクセルまたはボクセル数、粒度レベル、画像フォーマット等へと訓練データを正規化することを含む。一実施例では、画像処理は、訓練データをサイズまたはピクセルまたはボクセルの数の閾値、またはボクセルの強度または粒度レベルを満たすように特定のサイズへ縮尺変更する訓練、および、特定の内容を中心化する訓練、または特定のまたは一定の方向へ回転される訓練を含み得る。

ある実施例では、画像処理は、三次元（３Ｄ）体積の二次元（２Ｄ）コラージュを作成し、訓練データの二次元（２Ｄ）処理を可能にすることを含む。一実施例では、画像処理は、三次元（３Ｄ）体積のサブセットを選択することを含む。ある実施例では、３Ｄ医療用画像は複数の関連画像をまとめたものであり得る。ある実施例では、コラージュは、１つより多い医療用画像から作成され得る。

訓練データ記憶装置１７６からの訓練中に３ＤＣＮＮ１４２の全てのパラメーターを学習すれば、３ＤＣＮＮ１４２はテストデータからの画像分類と物体認識の準備が出来た状態になる。一実施例では、テストデータはテストデータ記憶装置１８６に記憶されている３Ｄデータである。テスト中には、テスト部１１２は３ＤＣＮＮ１４２を実行し、誤差逆伝搬法を行わずに３Ｄ入力データの予測を生成する。画像分類の場合はテスト時に、１つ以上のカテゴリーに属する３Ｄ入力データの事後確率を推定する特徴マップを生成するために、３Ｄ入力データは３ＤＣＮＮ１４２の様々な畳み込み層、サブネットワーク、バッチ正規化層、およびプーリング層を通される。一実施例では、テストデータ記憶装置１８６は、３ＤＣＮＮ１４２をサービスまたは製品として提供する第一の企業体によって整備され利用される。別の実施例では、テストデータ記憶装置１８６は、第一の企業体によって、第一の企業体によって開発された３ＤＣＮＮ１４２をビジネスまたは技術的課題を解決するために適用する第二の企業体（例えば仲介ベンダー）と協働して配置される。さらに別の実施例では、テストデータ記憶装置１８６は、エンドユーザーによって提供された、またはエンドユーザーを使用して（例えばクラウドソーシング）生成されたデータを使用して配置される。

システム１００に示される一実施例では、３Ｄ訓練データおよびテストデータはＣａｓｓａｎｄｒａ^ＴＭのようなＮｏＳＱＬキーバリューカラムストア分散記憶システム１７８および１８８に記憶される。Ｃａｓｓａｎｄｒａ^ＴＭの３Ｄデータは多数のノードまたはコモディティーサーバーＣ１からＣ３にわたって拡散され、Ｊａｖａ（登録商標）、Ｓｃａｌａ、Ｒｕｂｙ，ＣｌｏｊｕｒｅまたはＰｙｔｈｏｎに基づいたＡＰＩ（例えばＨｅｃｔｏｒ、Ｐｅｌｏｐｓ、ＣＱＬ、Ｔｈｒｉｆｔ、Ｐｈｐｃａｓｓａ，ＰｙＣａｓｓａ等）を使用して接続が行われる。他の実施例では、３Ｄ訓練およびテストデータはＨａｄｏｏｐクラスター１７９および１８９のようなＨａｄｏｏｐ分散ファイルシステム（ＨＤＦＳ）に記憶される。

３Ｄデータ／３Ｄ放射線体積
ある実施例では、３Ｄ訓練およびテストデータは各点（ｘ、ｙ、ｚ）の、別個のボクセル座標（ｉ、ｊ、ｋ）へマップされた、体積表現である。一実施例では、３Ｄ入力データは、固定の占有率または、表面の湾曲グリッド（例えば２４ｘ２４ｘ２４、３２ｘ３２ｘ３２、２５６ｘ２５６ｘ２５６、２００ｘ１５０ｘ１５０、３１７ｘ２１５ｘ２５４、３６ｘ２２４ｘ２２４）を設定された、ＤｘＤｘＤボクセルの体積を持つ。一実施例では医療視覚コンテキスト、３Ｄ訓練およびテストデータは３Ｄ放射線体積であり、医療用スキャンにより生成された人間の臓器の構造の、解剖学上における３Ｄ形状のバリエーションを示している。図７は、３ＤＤＣＮＮＡによって使用される、人間の脳の医療用スキャン（例えばＭＲＩ、ＣＴ）による３Ｄ放射線体積の形をとるグレースケールの３Ｄ入力データ７００の例である。図８は３ＤＤＣＮＮＡによって使用される、人間の脳の医療用スキャンの、３Ｄ放射線体積の形をとる、カラーの３Ｄ入力データ８００の例である。一実施例においては、３Ｄ放射線体積７００および８００は人間の脳の３Ｄモデルを示している。他の実施例では、３Ｄ放射線体積７００および８００は３Ｄの点群を示している。他の実施例では、３Ｄの訓練およびテストデータはコンピューター支援設計（ＣＡＤ）モデルを含む。

ディープラーニングネットワーク１３２は上以上のＧＰＵ上で動作する。ディープラーニングネットワーク１３２は人工ニューロンを多層積み重ねて形成したフィードフォワードネットワークである。各層は、ニューロンが特徴検知器として働くデータの新しい表現をモデル化する。再帰的に、より深いニューロンは前の層で検知された特徴によって形作られた新しい特徴を学習する。結果は、より高いレベルの特徴の検出器の階層構造となる。ディープラーニングネットワーク１３２はさらに、１つ以上のＧＰＵで動作する３ＤＣＮＮ１４２を含む。一実施例においては、３ＤＣＮＮ１４２は、タブレット１６２、携帯電話１６４、およびコンピューター１６６などの、１つ以上のクライアント機器のプロセッサーにおいて動作する。

一実施例においては、３ＤＣＮＮ１４２は、畳み込み層、サブネットワーク、３Ｄバッチ正規化層、プーリング層、および全結合層を含む。３ＤＣＮＮ１４２は、３Ｄ入力データ／放射線体積に対して同一サイズパッチを利用して畳み込みの計算を行う固定サイズの３Ｄパッチまたは３Ｄカーネルである、いわゆる３Ｄ受容野を使用する。一実施例では、出力特徴マップ、を生成するために３Ｄ放射線体積の全てのボクセルおよび中間特徴マップが対象にされていることを確実にするために、ストライドが設定される。ある実施例では、畳み込み操作のあと、次元を減らし、演算の繰り返しを避けるために、中間特徴マップを使用したサブサンプリングが行われる。ある実施例では、全結合層は、多次元特徴マップを連結するため、そして該特徴マップを分類器として固定サイズカテゴリにするために使用される。３ＤＣＮＮ１４２の層は、前述したように、重みが誤差逆伝搬法を使用して訓練中に調整される、訓練可能なパラメーターを持っている。３ＤＣＮＮ１４２の各部は、Ｓｉｇｍｏｉｄ、ランプ関数（ＲｅＬＵ）またはＬｅａｋｙＲｅＬＵのような、ある型の非線形活性化を使用する。ある実施例では、３ＤＣＮＮ１４２の最上位層では、３Ｄ入力を［０、１］にマップするソフトマックス活性化関数を使用する。これにより出力を確率と解釈し、ボクセルの選択を最も高い確率で行うことができるようになる。

ここでシステム１００を特定のブロックを参照して説明したが、ブロックは説明の利便性のために定義されたのであり、構成要素の部分の物理的な配置を要求するように意図されたものではない。さらに、ブロックは物理的に別個の構成要素に対応する必要はない。物理的に別個の構成要素が使用されることとなれば、構成要素間の接続（例えばデータ通信）は、要求により、有線および／または無線であってもよい。異なる要素または構成要素は１つのソフトウエアモジュールへと結合されてもよく、複数のソフトウエアモジュールが同じハードウエア上で実行されてもよい。

サブネットワークモジュール
図２は開示する技術の一実施例における３ＤＤＣＮＮＡ（３ＤＣＮＮ１４２のような）内のサブネットワーク２００Ａのブロック図２００を示し、マルチスケール３Ｄ畳み込み層経路および３Ｄプーリング操作を詳細に示す。一実施例では、サブネットワーク２００Ａは特徴マップを入力とし、１ｘ１ｘ１畳み込みから３ｘ３ｘ３、５ｘ５ｘ５、７ｘ７ｘ７畳み込み、および３ｘ３ｘ３プーリングのような３ＤＭａｘプーリング層のように、様々な、いくつかの３Ｄ畳み込み層経路を並列で適用する。さらに、３Ｄ入力データはサブネットワーク２００Ａにより複数スケール２１０および２１４において処理される。これはサブネットワーク２００Ａに入力として供給される特徴マップが、次元削減送２１２および３ＤＭａｘプーリング層２２２によって、最初に、マルチスケール２１０において並列に処理されることを意味する。さらに進み、次元層２１２の１ｘ１ｘ１畳み込みの結果である最適化された特徴マップは、異なる３Ｄ畳み込み層経路２１６（例えば１ｘ１ｘ１、３ｘ３ｘ３、５ｘ５ｘ５、７ｘ７ｘ７の畳み込み）によりマルチスケール２１４で並列に処理される。サブネットワーク２００Ａにおける層経路の各層は、連結層２３４において最終出力として１つの特徴マップに連結され、異なる出力または特徴マップを生成する。

次元削減層２１２および２２４は次元削減を実行するために使用される。例えば、９０の特徴を持つ３６ｘ２２４ｘ２２４ボクセルの３Ｄ入力に１ｘ１ｘ１の４０のフィルターによる畳み込みを行った結果は４０ｘ３６ｘ２２４ｘ２２４のサイズになる。一実施例では、次元削減層はＳｉｇｍｏｉｄ，ＲｅＬＵまたはＬｅａｋｙＲｅＬＵのような非線形活性化も備えている。図２に示されるように、サブネットワーク２００Ａ内では、１ｘ１ｘ１、３ｘ３ｘ３、５ｘ５ｘ５および７ｘ７ｘ７畳み込みのようには３Ｄ入力は直接３Ｄ畳み込み層経路に供給はされない。代わりに、入力の次元を削減するために、追加の１ｘ１ｘ１畳み込みが、次元削減層２１２として使用される。さらに、３ＤＭａｘプーリング層２２２の出力は、次元削減層２２４として働く追加の１ｘ１ｘ１畳み込みへ提供される。

図３は、最低から最高へと連続して配置された複数のサブネットワーク２００Ａ、２００Ｂおよび２００Ｃ、３ＤＤＣＮＮＡ３００（３ＤＣＮＮ１４２のような）、および前処理層３１０および後処理層３２０の例である。ある実施例では、前のサブネットワーク（例えばサブネットワーク２００Ａ）の出力は次のサブネットワークの畳み込みおよびプーリング（例えばサブネットワーク２００Ｂ）への入力へ使用される。各サブネットワーク２００Ａ、２００Ｂおよび２００Ｃは代替特徴体積表現、または入力３Ｄ放射線体積の特徴マップを生成する。ある実施例では、３Ｄ入力データ／放射線体積は１つ以上の、３Ｄ畳み込み３１１、２Ｄ畳み込み３１２、１Ｄ畳み込み３１３、３Ｄプーリング操作３１４、２Ｄプーリング操作３１５、１Ｄプーリング操作３１６、などの前処理層３１０の処理対象になる。ある実施例では、３Ｄ入力データ／放射線体積は１つ以上の、３Ｄ畳み込み３２１、２Ｄ畳み込み３２２、１Ｄ畳み込み３２３、３Ｄプーリング操作３２４、２Ｄプーリング操作３２５、１Ｄプーリング操作３２６、などの後処理層３２０の処理対象になる。一実施例では、３以上のモジュールサブネットワーク２００Ａ、２００Ｂ、および２００Ｃによる３Ｄ入力データおよび中間代替特徴体積表現または特徴マップの処理の後、モジュールサブネットワークの最高位のものの出力（サブネットワーク２００Ｃのような）は垂直プーリング層で処理され、３Ｄ入力放射線体積から垂直次元削減出力が生成される。

バッチ正規化
３ＤＣＮＮ１４２の深い層の重みアップデートの結果は、変化し続ける３Ｄ入力の分布、および対応する代替特徴体積表現または特徴マップとなり、重みの収束を妨げる。一実施例では、訓練の繰り返しにおいて、重みアップデートは、代替特徴体積表現が次の繰り返しにおいて増幅されるように、重みの分散に偏差を起こす。さらに、任意の偏差は層の数に基づいて指数関数的に増大するため、３Ｄ特徴量Ｆ１からＦｎにおいて問題は悪化する。開示する技術ではこれに、結果である代替特徴体積表現をよりよく維持するため、毎サブネットワーク処理ステップの後に、隠れ層に、３ＤＣＮＮ１４２の非線形活性化に対する正規化を可能にする３Ｄバッチ正規化（ＢＮ）技術を採用することにより対抗する。一実施例では、この正規化の幾何学的解釈は、３Ｄ入力データが多変数ガウス分布であったとき、変換されたデータは、ある実施例では、ゼロ平均と単位共分散を持つガウス分布である。結果、ＢＮは、学習率を向上させ、また学習を正規化し、その結果３ＤＣＮＮ１４２の学習を加速させる。

図４Ａは正規化された３Ｄ入力を生成するために、前のサブネットワークからの３Ｄ入力へ３Ｄバッチ正規化（ＢＮ）操作４００Ａを行う一実施例を示す。図４Ａでは、前のモジュールサブネットワークからの３Ｄ入力は、複数の３Ｄ特徴Ｆ１からＦｎを含む。図４Ａでは、特徴Ｆ１からＦｎが三次元であることは記号
によって示される。このステップでは、３Ｄ特徴Ｆ１からＦｎはゼロ平均および単位分散へ正規化され、図４Ｂにて線形変換される。平均および分散は、例を挙げるとＦ１からＦｎの３Ｄ特徴の各次元において計算され、訓練データセットのミニバッチ（例えばバッチ１）毎ではない。ある実施例では、平均と分散の移動平均が、テスト中、正規化に使用するために整備される。結果として得られる、正規化された特徴Ｆ１’からＦｎ’が図４Ａの右側に示される。

図４Ｂは、学習された非線形活性化を、正規化された３Ｄ入力へ適用して、次のサブネットワークによる処理のための、スケール変更およびシフトされた３Ｄ出力を生成する、３Ｄバッチ正規化（ＢＮ）操作４００Ｂの一実施例を示す。一実施例では、３ＤＢＮ層は、前のサブネットワークの後、そして続く非線形活性化の直前に導入される。図４Ｂでは、正規化された特徴Ｆ１’からＦｎ’が三次元であることが記号
により示される。本ステップでは、続くサブネットワークへの入力表現として使用できる、スケール変更されシフトされた３Ｄ特徴Ｆ１’’からＦｎ’’を生成するために、学習された非線形活性化（例えばＲｅＬＵ非線形（ｙ＝ｍａｘ（０，ｘ））を正規化された３Ｄ特徴Ｆ１’からＦｎ’へ適用する。非線形活性化は誤差逆伝搬法の中で、スケールパラメーターおよびシフトパラメーターの２つのパラメーターを使用して訓練される。３ＤＢＮのこのステップの中で、最後の後方パスによってアップデートされた、非線形活性化におけるスケール変更されてシフトされたパラメーターは、図４Ａの正規化された３Ｄ入力へ適用される。結果として得られる、スケール変更されシフトされた特徴Ｆ１’’からＦｎ’’を図４Ｂの右側に示す。

図５は複数のサブネットワークおよび３Ｄバッチ正規化層の組み合わせを使用する３ＤＤＣＮＮＡ（３ＤＣＮＮ１４２のような）のブロック図５００である。図５においては、各サブネットワーク２００Ａ、２００Ｂおよび２００Ｃの直後に、前のサブネットワーク（例えばサブネットワーク２００Ａ）からの出力を正規化し、正規化された出力へ学習された非線形活性化を適用して次のサブネットワーク（例えばサブネットワーク２００Ｂ）へのスカッシュされた入力を生成する３Ｄバッチ正規化層がある。

ディープＣＮＮアーキテクチャー（ＤＣＮＮＡ）の例
図６は３ＤＤＣＮＮＡ６００の例の一実施例を示す。概要としては、３ＤＤＣＮＮＡ６００は、前処理層、モジュールサブネットワーク、３Ｄバッチ正規化（ＢＮ）層、および後処理層という、主な３つの部分を有する。他の実施例においては、畳み込み操作は、図６に示すものとは違う順序で、および／または、違うまたはより少ない、または追加のアクションにより実行される。ある実施例においては、複数の畳み込み操作が結合されてもよい。

図６において、３Ｄ入力データは最初に、３Ｄ畳み込み層を備える前処理層により処理され、その後、１ＤのＭａｘプーリング層、その後には２つの３Ｄ畳み込み層、最後に１ＤＭａｘプーリング層が続く。一層目の３Ｄ畳み込み層は６４個の１ｘ１ｘ７ｘ７のサイズの３Ｄ畳み込みカーネルまたはフィルターを含み、これは、１つの特徴が１ｘ７ｘ７ボクセルで畳み込まれることを示す。続く１ＤのＭａｘプーリング層のサイズは１ｘ３ｘ３である。一層目の３Ｄ畳み込み層のように、二層目の３Ｄ畳み込み層は６４個の３Ｄ畳み込みカーネルまたはフィルターを含むが、サイズは６４ｘ１ｘ７ｘ７である。三層目の３Ｄ畳み込み層は１９２個の、６４ｘ１ｘ１ｘ１のサイズの３Ｄ畳み込みカーネルまたはフィルターを備える。前処理層の中の最後の層は１Ｄでサイズ１ｘ３ｘ３のＭａｘプーリング層である。

図２のサブネットワーク２００Ａを参照して前述した処理レイアウトおよびパイプラインの後に、３ＤＤＣＮＮＡ６００が続く。３ＤＤＣＮＮＡ６００の次の構成要素は、モジュールサブネットワークＡ、ＢおよびＣである。処理しているデータが３Ｄ放射線体積であるため、サブネットワークＡ、ＢおよびＣの全ては、３Ｄ畳み込みカーネルまたはフィルターを伴う３Ｄ畳み込み層経路を使用する３Ｄモジュールである。さらに、サブネットワークＡ，ＢおよびＣのそれぞれは、入来する代替特徴表現または特徴マップに対して、１ｘ１ｘ１、３ｘ３ｘ３、５ｘ５ｘ５畳み込みである３Ｄ畳み込み層経路により処理される前に次元を削減するため、１ｘ１ｘ１畳み込みを使用する１つ以上の次元削減層を含む。さらに、サブネットワークＡ、ＢおよびＣもまた３ＤＭａｘプーリング層を採用し、その出力は、追加の１ｘ１ｘ１次元削減畳み込みによりさらに次元が削減される。最後に、入来する代替特徴表現は、サブネットワークＡ、ＢおよびＣにおいて、次元削減層およびＭａｘプーリング層が代替特徴表現に対して並行して動作できるよう、また次元削減層およびＭａｘプーリングの出力が異なる３Ｄ畳み込み層経路において並行して処理されるよう、複数のスケールで処理される。

特に、サブネットワークＡは６４個の、１９２ｘ１ｘ１ｘ１のサイズ（１ｘ１ｘ１畳み込み）の、次元削減層として働く３Ｄ畳み込みカーネルまたはフィルターを含む。サブネットワークＡもまた、入来する特徴マップを並行してマルチスケールで処理する、１２８個のサイズ９６ｘ３ｘ３ｘ３（３ｘ３ｘ３畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、および３２個の、サイズ１６ｘ５ｘ５ｘ５（５ｘ５ｘ５畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、２つの３Ｄ畳み込み層経路を含む。これらの２つの層経路への入力は、９６個のサイズ１９２ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、また１６個のサイズ１９２ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、２つの対応する次元削減層によって削減される。３ＤＭａｘプーリング層はサイズ３ｘ３ｘ３であり、出力を別の３２個のサイズ９６ｘ１ｘ３ｘ３の３Ｄ畳み込みカーネルまたはフィルターによる３Ｄ畳み込み層経路へ受け渡す。６４個のサイズ１９２ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、１２８個のサイズ９６ｘ３ｘ３ｘ３（３ｘ３ｘ３畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる２つの３Ｄ畳み込み層経路、および３２個の、サイズ１６ｘ５ｘ５ｘ５（５ｘ５ｘ５畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、そして３２個のサイズ９６ｘ１ｘ３ｘ３の３Ｄ畳み込みカーネルまたはフィルターによる３Ｄ畳み込み層経路の出力は、２５６個の特徴へ連結される。

特に、サブネットワークＢは１２８個の、２５６ｘ１ｘ１ｘ１のサイズ（１ｘ１ｘ１畳み込み）の、次元削減層として働く３Ｄ畳み込みカーネルまたはフィルターを含む。サブネットワークＢはまた、入来する特徴マップを並行してマルチスケールで処理する、１９２個のサイズ１２８ｘ３ｘ３ｘ３（３ｘ３ｘ３畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、および９６個の、サイズ３２ｘ５ｘ５ｘ５（５ｘ５ｘ５畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、２つの３Ｄ畳み込み層経路を含む。これらの２つの層経路への入力は、１２８個のサイズ２５６ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、また３２個のサイズ２５６ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、２つの対応する次元削減層によって削減される。３ＤＭａｘプーリング層は、サイズ３ｘ３ｘ３であり、出力を別の６４個のサイズ２５６ｘ１ｘ３ｘ３の３Ｄ畳み込みカーネルまたはフィルターによる３Ｄ畳み込み層経路へ受け渡す。１２８個のサイズ２５６ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、１９２個のサイズ１２８ｘ３ｘ３ｘ３（３ｘ３ｘ３畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる２つの３Ｄ畳み込み層経路、および９６個の、サイズ３２ｘ５ｘ５ｘ５（５ｘ５ｘ５畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、そして６４個のサイズ２５６ｘ１ｘ３ｘ３の３Ｄ畳み込みカーネルまたはフィルターによる３Ｄ畳み込み層経路の出力は、４８０個の特徴を生成するよう連結される。

特に、サブネットワークＣは６４個の、４８０ｘ１ｘ１ｘ１のサイズ（１ｘ１ｘ１畳み込み）の、次元削減層として働く３Ｄ畳み込みカーネルまたはフィルターを含む。サブネットワークＢはまた、入来する特徴マップを並行してマルチスケールで処理する、１２８個のサイズ９６ｘ３ｘ３ｘ３（３ｘ３ｘ３畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、および３２個の、サイズ１６ｘ５ｘ５ｘ５（５ｘ５ｘ５畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、２つの３Ｄ畳み込み層経路を含む。これらの２つの層経路への入力は、９６個のサイズ４８０ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、また１６個のサイズ４８０ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる、２つの対応する次元削減層によって削減される。３ＤＭａｘプーリング層はサイズ３ｘ３ｘ３であり、出力を別の３２個のサイズ４８０ｘ１ｘ３ｘ３の３Ｄ畳み込みカーネルまたはフィルターによる３Ｄ畳み込み層経路へ受け渡す。６４個のサイズ４８０ｘ１ｘ１ｘ１（１ｘ１ｘ１畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、１２８個のサイズ９６ｘ３ｘ３ｘ３（３ｘ３ｘ３畳み込み）の３Ｄ畳み込みカーネルまたはフィルターによる２つの３Ｄ畳み込み層経路、および３２個の、サイズ１６ｘ５ｘ５ｘ５（５ｘ５ｘ５畳み込み）の３Ｄ畳み込みカーネルまたはフィルター、そして３２個のサイズ４８０ｘ１ｘ３ｘ３の３Ｄ畳み込みカーネルまたはフィルターによる３Ｄ畳み込み層経路の出力は、連結される。

３ＤＤＣＮＮＡ６００はまた、サブネットワークＡ、ＢおよびＣの各連結された出力を各次元において正規化および非線形スカッシュの処理対象とするために、各サブネットワークＡ、ＢそしてＣのすぐ後に３Ｄバッチ正規化層とともに配置される。後処理層はサイズ１ｘ３ｘ３の１ＤＭａｘプーリング層、およびｚ軸に沿ったＭａｘプール畳み込みを含む。最後の代替特徴表現のサイズは１２５４４ｘ１であり、さらにサイズ２ｘ１に削減される。

頭蓋内出血（ＩＨ）におけるユースケース
図９は、医療用スキャンまたは撮像９０２から生成された３Ｄ放射線体積に基づいて、３ＤＤＣＮＮＡが、人間の脳内の頭蓋内出血（ＩＨ）構造の検知に使用されるユースケース９００の一実施例を示す。ＣＴスキャン９０４のような３Ｄ放射線体積は、人間の脳のスキャン結果である。機械学習システム１１０は、人間の脳に関連する１つ以上の型の異常を特定するよう訓練されている。ある実施例では、機械学習システム１１０は１つの異常を特定するよう訓練されている。ある実施例では、機械学習システム１１０は１より多い異常を特定するよう訓練されていて、マルチクラスラベリングと呼ばれる。ある実施例では、１より多い異常の特定は、１より多い異常によって訓練された機械学習システム１１０によって行われる。たとえば、人間の脳の異常は、出血の特定、アルツハイマーにおける斑や繊維化、発作の証拠が含み得る。この例では、機械学習システム１１０の一実施例が、人間の脳の画像を健康または異常として分類し、頭蓋内出血（ＩＨ）、アルツハイマーおよび／または発作などの、どのような型の異常があるかを特定し、結果９０６を健康サービスプロバイダー９０８へ転送する。

別の実施例では、機械学習システム１１０は人間の脳の入力された３Ｄ放射線体積を、出血の識別、アルツハイマーの可能性の証拠、または発作の兆候などを含む異常として分類する。ある実施例では、分類の信頼度もまた提供される。ある実施例では、１つより多い分類が、各分類に関連した信頼度とともに提供される。別の実施例では、機械学習システム１１０は、画像を出血、アルツハイマー、発作、または「正常」、として分類し、このとき「正常」とは、各可能性のある異常および各異常に関連した信頼度を検討した後に適用される診断である。ある実施例では、３Ｄ放射線体積は人間の眼についてのものであり、機械学習システム１１０は人間の眼に関連する１つ以上の型の異常を特定するよう訓練されている。

従って、機械学習システム１１０は深刻な病状の診断に要する時間を減少させることができ、そのため深刻な病状の患者へよりタイムリーな支援を提供することができる。一実施例では、機械学習システム１１０は３Ｄ放射線体積から診断を提供する。例えば、頭蓋内出血が存在する、などである。一実施例では、機械学習システム１１０は３Ｄ放射線体積から、実際の診断というよりは、兆候を提供する。例えば、３Ｄ放射線体積は、腔内の液体、および／または頭蓋外の血液を特定することができ、その両方は頭蓋骨の骨折の兆候である。一実施例では、機械学習システム１１０は、頭蓋骨の骨折があるか否かの結論を導くことは行わず、画像データから兆候を特定する。別の実施例では、機械学習システム１１０は、頭蓋骨の骨折があるか否かの結論を、兆候に基づいて導く。一実施例では、機械学習システム１１０は、兆候と共に、結論の信頼区間も提供する。

ある実施例では、機械学習システム１１０は、３Ｄ放射線体積の解析の結果に基づいた警告を提供する。ある実施例では、機械学習システム１１０は病状に関連した危険因子を提供する。例えば、一実施例では、機械学習システム１１０は信頼度評価値を、未来の異常の兆候として、３Ｄ医療用画像上に見つかった病状に添付する。

図１０は、図７に示された３Ｄ入力データ／放射線体積を、３ＤＤＣＮＮＡの出力に基づいて、出力の計算に最も寄与した３Ｄ入力／放射線体積の特徴を決定するためにバックトラックする処理１０００の一実施例を示す。バックトラック１０００において、出力の計算に最も寄与した３Ｄ入力データの特徴は、図１０の個々の青色の脳の画像内に、白色の構造としてハイライトされる。

図１１は、３ＤＣＮＮの、開示されたＤＣＮＮＡを使用しない実験結果の一実施例を実演するＰＲ曲線１１００を示す。ＰＲ曲線１１００においては、適合率は９０％で、再現率は４７％である。図１２は、３ＤＣＮＮの、開示されたＤＣＮＮＡを使用した場合の実験結果の一実施例を実演するＰＲ曲線１２００を示す。ＰＲ曲線１２００においては、適合率は９０％で、再現率は４７％から５０％に上昇した。

プロセス
図１３はディープニューラルネットワークにおける３Ｄデータの畳み込みの代表手法１３００である。フローチャート１３００は、１つ以上のプロセッサーが情報を受信または引き出し、情報を処理し、結果を記憶し、結果を送信するよう構成された、例えばコンピューターまたは他のデータ処理システムによって、少なくとも部分的には実施することができる。他の実施例においては、図１３に示された動作を別の順番で、および／または異なる、またはより少ない、または追加の動作を実行してもよい。ある実施例においては、複数の動作が結合されてもよい。利便性のために、このフローチャートについては方法を実行するシステムを参照して説明する。システムは方法の一部である必要はない。

開示する技術の本章および他の章にて説明する方法は、１つ以上の以下の特徴、および／または開示する追加の方法の中で説明される特徴を含み得る。簡潔性のために、本出願にて開示された特徴の組み合わせは個別に列挙はせず、それぞれ元となる特徴の組に応じて繰り返したりはしない。読者は、本方法にて特定された方法が、システムの概要、３ＤＣＮＮ、３Ｄデータ／３Ｄ放射線体積、サブネットワークモジュール、バッチ正規化、ＤＮＣＣＡの例、ＩＨユースケースなどとして、実施例として特定された元となる特徴の組とどのように容易に組み合わせることができるかを理解するであろう。

図１３は動作１３００にて開始する、入力放射線体積を特徴づける三次元（３Ｄ）データが受信されるプロセス１３１０を含む。ある実施例では、入力放射線体積は、各点（ｘ、ｙ、ｚ）を別個のボクセル座標（ｉ、ｊ、ｋ）へマップした形をとる、体積による表現である。一実施例では、３Ｄ入力データは、固定の占有率または、表面の湾曲グリッド（例えば２４ｘ２４ｘ２４、３２ｘ３２ｘ３２、２５６ｘ２５６ｘ２５６、２００ｘ１５０ｘ１５０、３１７ｘ２１５ｘ２５４、３６ｘ２２４ｘ２２４）を設定された、ＤｘＤｘＤボクセルの体積を持つ。３Ｄデータから抽出された特徴の数は、先頭に追加され、ＦｘＤｘＤｘＤの形を作る。垂直方向のスライスの数は、従来より各スライス中の２Ｄピクセルの数よりも少ないものとされ、放射線科医が見る画像の数を管理可能にしている。医療視覚の文脈における一実施例では、３Ｄの訓練およびテストデータは、医療用スキャンから生成した、人間の臓器の構造の解剖学的３Ｄ形状の種類を示す、３Ｄ放射線体積である。一実施例では、入力放射線体積は、人間の脳の３Ｄモデルを表す。さらに別の実施例では、入力放射線体積は、３Ｄの点群を表す。他の実施例では、他の入力放射線体積の例は、ＣＡＤ（コンピューター支援設計）モデルを含む。

プロセス１３００は動作１３２０にて継続し、そこでは入力放射線体積を特徴づける３Ｄデータはディープニューラルネットワークを使用して、入力放射線体積の代替特徴体積表現を生成するために処理される。一実施例では、ディープニューラルネットワークは複数のサブネットワークを備える。一実施例では、サブネットワークは最低から最高へと連続して配置され、ディープニューラルネットワークを使用して入力放射線体積を特徴づけるデータの処理には、その流れの中でデータをサブネットワークを通して処理することが含まれる。一実施例では、最初の３Ｄ畳み込み層経路は、入力放射線体積からセミグローバルな特徴を抽出する３ｘ３ｘ３の畳み込みである。一実施例では、２つ目の３Ｄ畳み込み層経路は、入力放射線体積からグローバルな特徴を抽出する５ｘ５ｘ５の畳み込みである。一実施例では、３つ目の３Ｄ畳み込み層経路は、入力放射線体積からローカルな特徴を抽出する１ｘ１ｘ１の畳み込みである。

動作１３３０において、３以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、上に議論されたように、連続している中での前のサブネットワークにより生成された前の出力表現を受信するよう構成される。

動作１３４０において、３以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、上に議論されたように、少なくとも３つの、変化する畳み込み体積の並列な３Ｄ畳み込み層経路を通して、前の出力表現を処理するよう構成される。

動作１３５０において、３以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークはさらに、上に議論されたように、並列３ＤＭａｘプーリング経路を通して前の出力表現を処理するよう構成される。

動作１３６０において、３以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、各モジュールサブネットワークからの出力表現を生成するために、３Ｄ畳み込み層経路からの出力と３ＤＭａｘプーリング経路を連結するよう構成される。

動作１３７０において、上に議論されたように、サブネットワークの３Ｄ畳み込み層経路の出力表現は３Ｄバッチ正規化によって状態が調整される。一実施例においては、３Ｄバッチ正規化は代替特徴体積表現内の各特徴へそれぞれ独立して適用され、バッチごとに適用される。一実施例では、あるバッチ内の代替特徴量表現に対して、３Ｄバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散を持つ。

動作１３８０にて、プロセスは、上に議論されたように、正規化された代替特徴体積表現を、ディープニューラルネットワークの訓練が３Ｄバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、パラメーター化された非線形活性化を通して直ちに処理する。

動作１３９０において、処理は、上に議論されたように、３以上のモジュールサブネットワークを通してデータを処理することに続いて、最高のモジュールサブネットワークの出力を垂直Ｍａｘプーリング層を通して、入力放射線体積から垂直次元が削減された出力を生成するために処理する。

本章において説明した方法の他の実施例は、上に説明された任意の方法を実行するための、プロセッサーにより実行可能な命令を記憶した非一時的なコンピューター可読記憶媒体を含み得る。本章において説明したさらに別の実施例は、上に説明された任意の方法を実行可能であるメモリに記憶された命令を実行可能で、メモリおよび１つ以上のプロセッサーを含むシステムを含み得る。

図１４はディープニューラルネットワークにて３Ｄデータを畳み込む代表手法１４００である。フローチャート１４００は、１つ以上のプロセッサーが情報を受信または引き出し、情報を処理し、結果を記憶し、結果を送信するよう構成された、例えばコンピューターまたは他のデータ処理システムによって、少なくとも部分的には実施することができる。他の実施例においては、図１４に示された動作を別の順番で、および／または異なる、またはより少ない、または追加の動作を実行してもよい。ある実施例においては、複数の動作が結合されてもよい。利便性のために、このフローチャートについては方法を実行するシステムを参照して説明する。システムは方法の一部である必要はない。

開示する技術の本章および他の章にて説明する方法は１つ以上の、以下の特徴、および／または開示する追加の方法の中で説明される特徴を含み得る。簡潔性のために、本出願にて開示された特徴の組み合わせは個別に列挙はせず、各元となる特徴の組に応じて繰り返したりはしない。読者は、本方法にて特定された方法が、システムの概要、３ＤＣＮＮ、３Ｄデータ／３Ｄ放射線体積、サブネットワークモジュール、バッチ正規化、ＤＮＣＣＡの例、ＩＨユースケース、などとして、実施例として特定された元となる特徴の組とどのように容易に組み合わせることができるかを理解するであろう。

図１４は、入力放射線体積を特徴づける三次元（３Ｄ）データを受信する動作１４１０にて始まるプロセス１４００を含む。ある実施例では、入力放射線体積は、各点（ｘ、ｙ、ｚ）を別個のボクセル座標（ｉ、ｊ、ｋ）へマップした形をとる、体積による表現である。一実施例では、３Ｄ入力データは、固定の占有率または、表面の湾曲グリッド（例えば２４ｘ２４ｘ２４、３２ｘ３２ｘ３２、２５６ｘ２５６ｘ２５６、２００ｘ１５０ｘ１５０、３１７ｘ２１５ｘ２５４、３６ｘ２２４ｘ２２４）を設定された、ＤｘＤｘＤボクセルの体積を持つ。医療視覚の文脈における一実施例では、３Ｄの訓練およびテストデータは、医療用スキャンから生成した、人間の臓器の構造の解剖学的３Ｄ形状の種類を示す、３Ｄ放射線体積である。一実施例では、入力放射線体積は、人間の脳の３Ｄモデルを表す。さらに別の実施例では、入力放射線体積は、３Ｄの点群を表す。他の実施例では、他の入力放射線体積の例は、ＣＡＤ（コンピューター支援設計）モデルを含む。

プロセス１４００は動作１４２０にて継続し、そこでは入力放射線体積を特徴づける３Ｄデータはディープニューラルネットワークを使用して、入力放射線体積の代替特徴体積表現を生成するために処理される。一実施例では、ディープニューラルネットワークは複数のサブネットワークを備える。一実施例では、サブネットワークは最低から最高へと連続して配置され、ディープニューラルネットワークを使用して入力放射線体積を特徴づけるデータの処理は、その流れの中でデータをサブネットワークを通して処理することを含む。一実施例では、最初の３Ｄ畳み込み層経路は、入力放射線体積からセミグローバルな特徴を抽出する３ｘ３ｘ３の畳み込みである。一実施例では、２つ目の３Ｄ畳み込み層経路は、入力放射線体積からグローバルな特徴を抽出する５ｘ５ｘ５の畳み込みである。一実施例では、３つ目の３Ｄ畳み込み層経路は、入力放射線体積からローカルな特徴を抽出する１ｘ１ｘ１の畳み込みである。

動作１４３０においては、上に議論されたように、多様な畳み込み体積のうち少なくとも３つの並列３Ｄ畳み込み層経路は、前の出力表現を、次元削減層において複数のスケールの畳み込み値によって処理する。

動作１４４０において、３以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、上に議論されたように、少なくとも３つの、変化する畳み込み体積の並列な３Ｄ畳み込み層経路を通して、前の出力表現を処理するよう構成される。

動作１４５０において、３以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークはさらに、上に議論されたように、並列３ＤＭａｘプーリング経路を通して前の出力表現を処理するよう構成される。

動作１４６０において、３以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、各モジュールサブネットワークからの出力表現を生成するために、３Ｄ畳み込み層経路からの出力と３Ｄプーリング経路を連結するよう構成される。３Ｄプーリング経路は、最大、最小、または平均のプーリング操作を含む。

動作１４７０において、上に議論されたように、サブネットワークの３Ｄ畳み込み層経路の出力表現は３Ｄバッチ正規化によって状態が調整される。一実施例においては、３Ｄバッチ正規化は代替特徴体積表現内の各特徴へそれぞれ独立して適用され、バッチごとに適用される。一実施例では、あるバッチ内の代替特徴量表現に対して、３Ｄバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散を持つ。

動作１４８０の処理は、上に議論されたように、正規化された代替特徴体積表現を、ディープニューラルネットワークの訓練が３Ｄバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、パラメーター化された非線形活性化を通して直ちに処理することを含む。

動作１４９０の処理は、上に議論されたように、３以上のモジュールサブネットワークを通してデータを処理することに続いて、最高のモジュールサブネットワークの出力を垂直Ｍａｘプーリング層を通して、入力放射線体積から垂直次元が削減された出力を生成するために処理することを含む。

マルチテナント統合
図１５は、開示技術の１つ以上の実施例による、図１のシステムと統合することに適したマルチテナントシステムの例のブロック図である。図１のシステム１００はマルチテナントシステムを使用して実施され得る。この件に関して、図１５は、図１のシステム１００と統合することに適したマルチテナントシステムの例の１つ以上の実施例の、概念のブロック図を提示する。

一般的に、図１５の図示されたマルチテナントシステム１５００は、ここでは代替として「マルチテナントデータベース」と称される複数のテナント間で共有される共通データベース１５３０からデータ１５３２に基づいて仮想アプリケーション１５２８Ａおよび１５２８Ｂを動的に生成しサポートするサーバー１５０２を含む。仮想アプリケーション１５２８Ａおよび１５２８Ｂによって生成されたデータおよびサービスは、ネットワーク１５４５を介して、任意の数のクライアント機器１５４０Ａおよび１５４０Ｂに、要求に応じて提供される。仮想アプリケーション１５２８Ａおよび１５２８Ｂはランタイム（またはオンデマンド）で、マルチテナントシステム１５００へ加入した各様々なテナントへデータベース１５３０内のデータ１５３２へのセキュアなアクセスを提供する共通アプリケーションプラットフォーム１５１０を使用して、適切に生成される。１つの非限定例として、マルチテナントシステム１５００は、マルチテナントの、任意の数の認証されたユーザーをサポートできる、オンデマンド・マルチテナント顧客管理（ＣＲＭ）システムの形で実施されている。

ここで使用される「テナント」または「組織」とは、マルチテナントデータベース１５３０内におけるデータの共通のサブセットへのアクセスを共有する、一人以上のユーザーのグループを指す。関連して、各テナントは、それぞれのテナントに関連付けられた、またはアサインされた、さもなければ属する、一人以上のユーザーを含む。マルチテナントシステム１５００内のそれぞれのユーザーは、マルチテナントシステム１５００にサポートされる複数のテナントのうち特定のテナントに、関連付けられ、またはアサインされ、さもなければ属している。テナントは、ユーザー、ユーザーの部門、仕事または法律的な組織、および／または、マルチテナントシステム１５００内の特定の組のユーザー用のデータを整備するためのその他の要素を表している。複数テナントがサーバー１５０２およびデータベース１５３０へのアクセスを共有するが、サーバー１５０２から各テナントへ提供される特定のデータおよびサービスは、他のテナントへ提供されるものから安全に孤立させることができる。従ってマルチテナントアーキテクチャーは、異なる組のユーザーが、他のテナントに属するかさもなければ関連付いているデータ１５３２を全く共有せずに、機能やハードウエアリソースを共有することを可能にする。

マルチテナントデータベース１５３０は、任意の数のテナントに関連付けられたデータ１５３２を記憶し管理する、任意の種類のレポジトリまたは他のデータ記憶システムである。データベース１５３０は任意の型の従来のデータベースサーバーハードウエアを使用して実装されてもよい。様々な実施例において、データベース１５３０はサーバー１５０２と処理ハードウエアを共有する。他の実施例では、データベース１５３０は、本明細書において説明する様々な機能を実行するためにサーバー１５０２と通信する別個の物理的および／または仮想データベースサーバーハードウエアを使用して実装される。ある実施例では、データベース１５３０は、データベース管理システムまたはデータ１５３２の特定のサブセットを、仮想アプリケーション１５２８Ａまたは１５２８Ｂにより開始されたかさもなければ提供されたクエリに応答して、仮想アプリケーション１５２８Ａまたは１５２８Ｂのインスタンスへ引き出しまたは提供するため最適クエリプランを決定することができる他の同等のソフトウエアを含む。マルチテナントデータベース１５３０は、データをランタイムで、アプリケーションプラットフォーム１５１０によって生成されたオンデマンド仮想アプリケーション１５２８Ａおよび１５２８Ｂに提供する（または提供することができる）ため、マルチテナントデータベース１５３０は本明細書において、代替としてオンデマンドデータベースとも称される。

実際は、データ１５３２は、アプリケーションプラットフォーム１５１０をサポートするために任意の方法で整理され体裁を整えられる。様々な実施例において、データ１５３２は、セミアモルファス・ヒープ型フォーマットを整備するため、比較的少数の大容量データテーブルへと適切に整理される。データ１５３２はその後特定の仮想アプリケーション１５２８Ａまたは１５２８Ｂからの必要に応じて整理されてもよい。様々な実施例において、従来のデータの関係は、要求に応じて、従来のデータベース組織のインデックス付け、一意性、要素間の関係、および／または他の局面を確立する、任意の数のピボットテーブル１５３４を使用して確立される。更なるデータ操作およびレポートフォーマットは、一般的には、様々なメタデータ構成を使用してランタイムで行われる。ユニバーサルデータディレクトリ（ＵＤＤ）内のメタデータ１５３６は、例えば任意の数のフォーム、レポート、ワークフロー、ユーザーアクセス権、ワークロジックおよび、複数のテナントに共通する他の構成を説明するために使用され得る。テナント特有のフォーマット、機能および他の構成は、要求に応じて、テナント特有のメタデータ１５３８Ａおよび１５３８Ｂとして整備されてもよい。データ１５３２を、無理にテナントやアプリケーションに共通の非柔軟なグローバルな構造をとらせるよりも、データベース１５３０は、比較的型にはまらないよう、要求に応じて追加の構造を提供するピボットテーブル１５３４およびメタデータ１５３８Ａと１５３８Ｂと共に整理される。そのためにも、アプリケーションプラットフォーム１５１０は、仮想アプリケーション１５２８Ａと１５２８Ｂの「仮想の」構成要素を生成し、またデータベース１５３０から比較的型にはまらないデータ１５３２を提示するため、ピボットテーブル１５３４および／またはメタデータ１５３８Ａと１５３８Ｂを適切に使用する。

サーバー１５０２は、仮想アプリケーション１５２８Ａおよび１５２８Ｂを生成するための動的アプリケーションプラットフォーム１５１０を集合的に提供する、１つ以上の実際および／または仮想の計算システムを使用するよう実装される。例えば、サーバー１５０２は、典型的には、適宜、従来のネットワーク通信、クラスター管理、負荷バランスおよび他の機能と関連してお互いに併せて動作する、実際のおよび／または仮想のサーバーのクラスターを使用して実装される。サーバー１５０２は、プロセッサー１５０５、メモリ１５０６、入力／出力機能１５０７などの、任意の種類の従来の処理ハードウエアと共に動作する。入力／出力機能１５０７は一般的にはネットワークへのインターフェース（例えばネットワーク１５４５または任意の他のローカルエリア、広域、または他のネットワーク）、大容量記憶装置、ディスプレイ装置、データ入力装置等を表す。プロセッサー１５０５は、任意の数の「クラウドベースの」またはその他の仮想システムを含む、１つ以上のプロセッサー、制御器、マイクロプロセッサー、マイクロコントローラ、処理コアおよび／または任意の数の分散または統合システム中に広がった他の計算資源などの、任意の適切な処理システムを使用して実装されてもよい。メモリ１５０６は、任意の種類のランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、フラッシュメモリ、磁気または光学大容量記憶装置等を含む、プロセッサー１５０５上においてプログラム命令を記憶することができる短期または長期記憶装置または他のコンピューターにより読み取り可能な媒体を表す。コンピューターにより実行可能なプログラム命令は、サーバー１５０２および／またはプロセッサー１５０５により読み取られ実行されたとき、サーバー１５０２および／またはプロセッサー１５０５がアプリケーションプラットフォーム１５１０および／または仮想アプリケーション１５２８Ａおよび１５２８Ｂを作成、生成、さもなければ促進し、本明細書にて説明される１つ以上の追加タスク、動作、機能、および／または処理を実行する。メモリ１５０６はコンピューターによって読み取り可能な媒体の１つの適切な実施例を示し、そして、代わりにまたは加えて、サーバー１５０２は、携帯用ハードドライブ、ＵＳＢフラッシュドライブ、光学ディスクなどの、持ち運び可能な、または移動可能な構成要素またはアプリケーションプラットフォームとして実現される、外部のコンピューターにより読み取り可能な媒体により受信し協力して動作する。

アプリケーションプラットフォーム１５１０は、クライアント機器１５４０Ａおよび１５４０Ｂへデータおよび／またはサービスを提供する仮想アプリケーション１５２８Ａおよび１５２８Ｂを生成する、任意の種類のソフトウエアアプリケーションまたは処理エンジンである。典型的な実施例では、アプリケーションプラットフォーム１５１０は、任意の種類の従来のまたは占有のオペレーティングシステム１５０８を使用して、処理ハードウエア１５０２の処理リソース、通信インターフェースおよび他の機能へのアクセスを獲得する。仮想アプリケーション１５２８Ａおよび１５２８Ｂは、典型的には、クライアント機器１５４０Ａおよび１５４０Ｂから受信した入力に応答してランタイムで生成される。図示された実施例において、アプリケーションプラットフォーム１５１０はバルクデータ処理エンジン１５１２、クエリ生成器１５１４、テキストインデックスおよび他の検索機能を提供する検索エンジン１５１６、およびランタイムアプリケーション生成器１５２０を含む。これらの各機能は別個のプロセスまたは他のモジュールとして実装されてもよく、また同等の実施例においては異なるおよび／または追加の機能、構成要素、または他のモジュールを要求に応じて含んでもよい。

ランタイムアプリケーション生成器１５２０は、クライアント機器１５４０Ａおよび１５４０Ｂからの特定の要求に応じて、仮想アプリケーション１５２８Ａおよび１５２８Ｂを、動的にビルドし実行する。仮想アプリケーション１５２８Ａおよび１５２８Ｂは典型的には、特定のアプリケーション１５２８Ａおよび１５２８Ｂの特定の表、レポート、インターフェースおよび／または他の機能を説明する、テナント特有のメタデータ１５３８に従って構成される。様々な実施例において、各仮想アプリケーション１５２８Ａおよび１５２８Ｂは、クライアント機器１５４０Ａおよび１５４０Ｂと関連したブラウザーまたは他のクライアントプログラム１５４２Ａおよび１５４２Ｂへ供給されることができる動的ウェブコンテンツを適宜生成する。

ランタイムアプリケーション生成器１５２０はクエリ生成器１５１４と適切に相互作用し、クライアント機器１５４０Ａおよび１５４０Ｂのユーザーによって開始された、さもなければ提供された入力クエリに応答して、データベース１５３０から必要に応じてマルチテナントデータ１５３２を効果的に入手する。典型的な実施例では、クエリ生成器１５１４は、（ユーザーに関連したテナントと共に）特定の機能を要求したユーザーのアイデンティティを考慮し、その後、ユニバーサルデータディレクトリ（ＵＤＤ）内のシステムワイドなメタデータ１５３６、テナント特有のメタデータ１５３８、ピボットテーブル１５３４、および／または他の入手可能なリソースを使用してデータベース１５３０に対してクエリをビルドし実行する。従って、本例の中のクエリ生成器１５１４は、リクエストを開始したユーザーおよび／またはテナントのアクセス権とクエリが一貫していることを保証することで、共通データベース１５３０のセキュリティを維持する。このように、クエリ生成器１５１４は、要求を行ったユーザーおよび／またはテナントのための表、レポート、または仮想アプリケーション１５２８Ａまたは１５２８Ｂの他の機能の内容物とするために、そのユーザーおよび／またはテナントからアクセス可能なデータ１５３２のサブセットをデータベース１５３０から安定して得る。

図１５をいまだに参照し、データ処理エンジン１５１２は、データ１５３２に対して、アップロードやダウンロード、アップデート、オンライントランザクション処理等、などのバルク処理動作を行う。多くの実施例では、データ１５３２に対するより緊急でない処理は処理リソースが入手可能になった時点で起こるようにスケジュールし、その結果、クエリ生成器１５１４、検索エンジン１５１６、仮想アプリケーション１５２８Ａおよび１５２８Ｂ等のようなより緊急なデータ処理に優先度が割り当てられるようにしてもよい。

実施例では、アプリケーションプラットフォーム１５１０は、サポートするテナントのためのデータ駆動仮想アプリケーション１５２８Ａおよび１５２８Ｂを作成および／または生成することに使用される。このような仮想アプリケーション１５２８Ａおよび１５２８Ｂは、カスタム（またはテナント特有）の画面１５２４、標準（またはユニバーサルな）画面１５２２等、のようなインターフェース機能を利用する。任意の数のカスタムおよび／または標準オブジェクト１５２６は、テナント上で開発された仮想アプリケーション１５２８Ａおよび１５２８Ｂへの統合のために入手可能である。本明細書において使用される「カスタム」は各オブジェクトまたはアプリケーションがテナント特有（例えばマルチテナント中の特定のテナントに関連付けられたユーザーのみが利用可能）またはユーザー特有（例えばマルチテントシステム中の特定のユーザーのサブセットにとって利用可能）であることを意味し、一方「標準」または「ユニバーサル」アプリケーションはマルチテナントシステム中の複数のテナントにとって利用可能である。各仮想アプリケーション１５２８Ａおよび１５２８Ｂに関連したデータ１５３２はデータベース１５３０へ適宜提供され、要求されるかまたは必要となるまで、特定の仮想アプリケーション１５２８Ａおよび１５２８Ｂの特定の機能（例えばレポート、表、機能、オブジェクト、フィールド、数式、コード等）を説明するメタデータ１５３８と共に記憶される。例えば、仮想アプリケーション１５２８Ａおよび１５２８Ｂはテナントへアクセスできる複数のオブジェクト１５２６を含み、テナントへアクセスできる各オブジェクト１５２６に対して、各オブジェクトの型に関連した様々なフィールドの値と共に、オブジェクトの型に関係のある情報がデータベース１５３０内のメタデータ１５３８として維持される。関連して、オブジェクトの型は、各オブジェクト１５２６の構造（例えばフォーマット、機能および他の構成）、および関連した様々なフィールドを定義する。

引き続き図１５を参照して、サーバー１５０２から提供されたデータおよびサービスは、ネットワーク１５４５上の、任意の種類のパーソナルコンピューター、携帯電話、タブレットおよびネットワーク接続可能なクライアント機器１５４０Ａまたは１５４０Ｂを使用して引き出すことができる。実施例では、クライアント機器１５４０Ａおよび１５４０Ｂは、マルチテナントデータベース１５３０から引き出されたデータおよび／または情報を図表によって提示可能なモニター、スクリーン、または従来の電気的ディスプレイなどのディスプレイ機器を含む。典型的には、ユーザーは、サーバー１５０２とネットワーク１５４５を介して、ハイパーテキスト転送プロトコル（ＨＴＴＰ）などのネットワークプロトコルを使用して接触するために、クライアント機器１５４０Ａおよび１５４０Ｂによって実行された従来のブラウザーアプリケーションまたは他のクライアントプログラム１５４２を操作する。典型的にはユーザーはサーバー１５０２へ彼または彼女自身のアイデンティティを認証して、サーバー１５０２と続いて起こる通信においてユーザーを特定するセッション識別子（「セッションＩＤ」）を得る。特定されたユーザーガ仮想アプリケーション１５２８Ａオヨビ１５２８Ｂヘノアクセスを要求すると、ランタイムアプリケーション生成器１５２０は、メタデータ１５３８に基づいてランタイムデアプリケーションを適宜、適切に作成する。上述されたように、仮想アプリケーション１５２８Ａまたは１５２８ＢはＪａｖａ、ＡｃｔｉｖｅＸ、または他の、クライアント機器１５４０Ａまたは１５４０Ｂ状で実行されている従来のクライアントソフトウエアを使用して提示され得る内容を含んでもよく、他の実施例においては単に、ユーザーによって提示され閲覧される、動的ウェブまたは他の内容を提供してもよい。

上述の説明は、説明を目的としたものであり、対象または応用の実装、およびそのような実装の用途を限定することを目的とするものではない。さらに、技術分野、背景、または詳細な説明にて提示された、表現または含意された理論に制約する意図はない。本明細書中で使用されるように、「例の」という言葉は「例、実例、説明として働く」ということを意味する。本明細書中で説明されたいかなる実施例は、他の実施例よりも好ましく有利であると解釈される必要はなく、本明細書中で説明された実施例は対象または応用性をいかなる方法においても限定しようとする意図はない。

簡潔さのために、データベース、ソーシャルネットワーク、ユーザーインターフェース、およびシステムの他の機能的側面（およびシステムの各動作構成要素）に関連する従来の技術は本明細書中にて詳細には説明しない。加えて、実装は任意の数のシステムおよび／またはネットワークアーキテクチャー、データ転送プロトコル、および機器構成と共に実施されてもよく、そして本明細書において説明されたシステムは１つの適切な例に過ぎないことを、当業者は理解するであろう。さらに、本明細書において特定の用語は参照用途のみとして使用されており、従って限定する意図はない。例えば、用語「第一の」「第二の」およびこのような他の数字を含む用語は、文脈において明確に示されない限り、順序や順番を含意するものではない。

本明細書中で機能および／または論理ブロック構成要素の観点から、および動作、処理タスク、および機能の記号表現を参照して説明される対象の実装は、様々な計算構成要素または装置により実行され得る。このような動作、タスク、および機能は、コンピューターにより実行される、コンピューターで処理される、ソフトウエアに実装される、またはコンピューターに実装されるものとして言及される。実際は、他の処理信号と同じように、データのビットを表現する電気信号を、１つ以上の処理システムまたは機器により、アクセス可能なメモリロケーションにて操作することにより、説明された動作、タスク、および機能を実行できる。データビットが維持されるメモリロケーションは、データビットに対応する特定の電気的、磁気的、光学的、または有機プロパティを持つ物理的ロケーションである。図に示される様々なブロック構成要素は任意の数のハードウエア、ソフトウエア、および／またはファームウエア構成要素によって実現されることが理解されるであろう。例えば、システムまたは構成要素の実装は、例えばメモリ要素、デジタル信号処理要素、論理要素、ルックアップテーブル等の、１つ以上のマイクロプロセッサーまたは他の制御装置により様々な機能を実行する、様々な集積回路を採用してもよい。ソフトウエアまたはファームウエア中に実装される場合は、本明細書中で説明されるシステムの様々な要素は、本質的には、様々なタスクを実行するコードセグメントまたは命令である。プログラムまたはコードセグメントはプロセッサーによって読み取り可能な媒体に記憶され、または通信媒体または通信経路上を搬送波に盛り込まれたコンピューターデータ信号により送信される。「プロセッサーによって読み取り可能な媒体」または「機械によって読み取り可能な媒体」は情報を記憶または送信できる任意の媒体を含み得る。プロセッサーによって読み取り可能な媒体の例は、電子回路、半導体メモリ装置、ＲＯＭ、フラッシュメモリ、消去可能ＲＯＭ（ＥＲＯＭ）、フロッピーディスク、ＣＤ−ＲＯＭ、光ファイバー媒体、無線周波数（ＲＦ）リンク等を含み得る。コンピューターデータ信号は、電子ネットワークチャネル、光ファイバー、大気、電磁路、またはＲＦリンクのような送信媒体上を伝播することができる任意の信号を含み得る。コードセグメントはインターネット、イントラネット、ＬＡＮ等のコンピューターネットワークを介してダウンロードされ得る。関連して、本明細書において説明された対象は任意のコンピューターに実装されたシステムおよび／または協調し互いに通信する２つ以上の独立し異なるコンピューターに実装されたシステムにおいて実施され得る。１つ以上の実施例において、本明細書において説明された対象は仮想ユーザー関係管理（ＣＲＭ）アプリケーションと併せてマルチテナント環境内で実施され得る。

上に参照された任意のデータ構造およびコードは、多数の実施例によれば、コンピューターシステムが利用するためのコードおよび／またはデータを記憶可能な任意の装置または媒体であり得る、コンピューター可読記憶媒体に記憶される。これは、揮発性メモリ、不揮発性メモリ、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、ディスクドライブ、磁気テープ、ＣＤ（コンパクトディスク）、ＤＶＤ（デジタル多目的ディスクまたはデジタルビデオディスク）のような磁気および光学記憶装置、または現在既知のまたは後に開発されたコンピューターによって読み取り可能な媒体を格納可能な他の媒体を、限定せず含む。

前述の説明は、開示された技術を作成し利用する事を可能にするために提示された。開示された実施例の様々な変更が今後明らかになるが、本明細書中で定義された原則は、他の実施例そして開示された技術の精神と要旨から逸脱しない応用例へ適用されてもよい。従って、開示された技術は示された実施例に限定する意図はなく、本明細書中で開示された原理および機能と整合する最も広い範囲で認められるべきである。開示される技術の範囲は添付した特許請求の範囲により定義される。

いくつかの態様を記載しておく。
〔態様１〕
ディープニューラルネットワークにおいて三次元（３Ｄ）データを畳み込む方法であって、前記方法は、
入力放射線体積を特徴づける三次元（３Ｄ）データを受信することと、
前記入力放射線体積を特徴づける前記３Ｄデータを、ディープニューラルネットワークを使用して処理して、前記入力放射線体積の代替特徴体積表現を生成することであって、前記ディープニューラルネットワークは複数のサブネットワークを含み、前記サブネットワークは最低から最高まで連続で配置され、前記ディープニューラルネットワークを使用した前記入力放射線体積を特徴づける前記データを処理することは、前記連続の中における前記サブネットワークのそれぞれを通して前記データを処理することを備え、
前記サブネットワークのうち３つ以上はモジュールサブネットワークであり、各前記モジュールサブネットワークは、
前記連続の中における前のサブネットワークにより生成された前の出力表現を受信し、
様々な畳み込み体積の少なくとも３つの並列３Ｄ畳み込み層経路を通して前記前の出力表現を処理し、
前記前の出力表現を並列３ＤＭａｘプーリング経路を通してさらに処理し、
前記３Ｄ畳み込み層経路および前記３ＤＭａｘプーリング経路の出力を連結して各前記モジュールサブネットワークからの出力表現を生成する
よう構成される、ことと、
前記３つ以上のモジュールサブネットワークを通して前記データを処理することに続いて、最高の前記モジュールサブネットワークの出力を垂直Ｍａｘプーリング層を通して処理し、前記入力放射線体積から削減された垂直次元の出力を生成することと、
を含む、方法。
〔態様２〕
最初の３Ｄ畳み込み層経路は、前記入力放射線体積からセミグローバルな特徴を抽出する３ｘ３の畳み込みである、態様１に記載の方法。
〔態様３〕
２つ目の３Ｄ畳み込み層経路は、前記入力放射線体積からグローバルな特徴を抽出する５ｘ５の畳み込みである、態様１に記載の方法。
〔態様４〕
３つ目の３Ｄ畳み込み層経路は、前記入力放射線体積からローカルな特徴を抽出する１ｘ１の畳み込みである、態様１に記載の方法。
〔態様５〕
前記入力放射線体積は医療用スキャンから生成した、人間の内蔵の構造の、３Ｄの解剖学的形状のバリエーションを示す、態様１に記載の方法。
〔態様６〕
前記入力放射線体積は３Ｄモデルデータを表す、態様１に記載の方法。
〔態様７〕
前記入力放射線体積はＣＡＤ（コンピューター支援設計）のモデルデータを表す、態様１に記載の方法。
〔態様８〕
前記入力放射線体積は３Ｄの点群を表す、態様１に記載の方法。
〔態様９〕
前記サブネットワークの３Ｄ畳み込み層経路の前記出力表現を３Ｄバッチ正規化によって状態を調整することであって、
前記３Ｄバッチ正規化は、前記代替特徴体積表現内の各特徴へ独立して適用され、バッチごとに適用され、
あるバッチ内の前記代替特徴量表現に対して、前記３Ｄバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散とを持つ、こと
をさらに含む態様１に記載の方法。
〔態様１０〕
前記正規化された代替特徴体積表現を、パラメーター化された非線形活性化を通して、前記ディープニューラルネットワークの訓練が前記３Ｄバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、直ちに処理すること、をさらに含む態様９に記載の方法。
〔態様１１〕
ディープニューラルネットワークにおいて三次元（３Ｄ）データを畳み込む方法であって、前記方法は、
入力放射線体積を特徴づける三次元（３Ｄ）データを受信することと、
前記入力放射線体積を特徴づける前記３Ｄデータを、ディープニューラルネットワークを使用して処理して、前記入力放射線体積の代替特徴体積表現を生成することであって、前記ディープニューラルネットワークは複数のサブネットワークを含み、前記サブネットワークは最低から最高まで連続で配置され、前記ディープニューラルネットワークを使用した前記入力放射線体積を特徴づける前記データを処理することは、前記連続の中における前記サブネットワークのそれぞれを通して前記データを処理することを備え、
前記サブネットワークのうち３つ以上はモジュールサブネットワークであり、各前記モジュールサブネットワークは、
前記連続の中における前のサブネットワークにより生成された前の出力表現を受信し、
様々な畳み込み体積の少なくとも３つの並列３Ｄ畳み込み層経路に対して、次元削減層において複数のスケールの畳み込み値によって前記前の出力表現を処理し、
さらに前記前の出力表現を並列３Ｄプーリング経路によって処理し、
前記３Ｄ畳み込み層経路および前記３Ｄプーリング経路の出力を連結して各前記モジュールサブネットワークからの出力表現を生成する
よう構成される、ことと、
前記３以上のモジュールサブネットワークを通して前記データを処理することに続いて、最高の前記モジュールサブネットワークの出力を垂直プーリング層を通して処理し、前記入力放射線体積から削減された垂直次元の出力を生成することと、
を含む、方法。
〔態様１２〕
最初の３Ｄ畳み込み層経路は、前記入力放射線体積からセミグローバルな特徴を抽出する３ｘ３の畳み込みである、態様１１に記載の方法。
〔態様１３〕
２つ目の３Ｄ畳み込み層経路は、前記入力放射線体積からグローバルな特徴を抽出する５ｘ５の畳み込みである、態様１１に記載の方法。
〔態様１４〕
前記次元削減層は、前記入力放射線体積からローカルな特徴を抽出する１ｘ１の畳み込みである、態様１１に記載の方法。
〔態様１５〕
前記サブネットワークによる処理に先立ち、前記入力放射線体積に対して、１つ以上の予備の３Ｄおよび／または２Ｄ畳み込みを適用すること、をさらに含む態様１１に記載の方法。
〔態様１６〕
前記サブネットワークによる処理に先立ち、前記入力放射線体積に対して、１つ以上の予備の３Ｄおよび／または２Ｄプーリング操作を適用すること、をさらに含む態様１１に記載の方法。
〔態様１７〕
前記サブネットワークによる処理の後に、前記入力放射線体積に対して、１つ以上の後処理の３Ｄおよび／または２Ｄ畳み込みを適用すること、をさらに含む態様１１に記載の方法。
〔態様１８〕
前記サブネットワークによる処理の後に、前記入力放射線体積に対して、１つ以上の後処理の３Ｄおよび／または２Ｄプーリング操作を適用すること、をさらに含む態様１１に記載の方法。
〔態様１９〕
前記サブネットワークの３Ｄ畳み込み層経路の前記出力表現を３Ｄバッチ正規化によって状態を調整することであって、
前記３Ｄバッチ正規化は、前記代替特徴体積表現内の各特徴へ独立して適用され、バッチごとに適用され、
あるバッチ内の前記代替特徴量表現に対して、前記３Ｄバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散とを持つ、こと
をさらに含む態様１１に記載の方法。
〔態様２０〕
前記正規化された代替特徴体積表現を、パラメーター化された非線形活性化を通して、前記ディープニューラルネットワークの訓練が前記３Ｄバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、直ちに処理すること、をさらに含む態様１９に記載の方法。
〔態様２１〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様１の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様２２〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様９の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様２３〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様１０の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様２４〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様１１の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様２５〕
メモリに接続された１つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様１の動作を実行する、システム。
〔態様２６〕
メモリに接続された１つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様９の動作を実行する、システム。
〔態様２７〕
メモリに接続された１つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様１０の動作を実行する、システム。
〔態様２８〕
メモリに接続された１つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様１１の動作を実行する、システム。

Claims

ニューラルネットワークにおいて三次元（３Ｄ）データを分類するコンピューター実行方法であって、前記方法は、
入力放射線体積を特徴づける三次元（３Ｄ）データを受信することと、
前記入力放射線体積を特徴づける前記３Ｄデータを、前記ニューラルネットワークを使用して処理することであって、前記ニューラルネットワークは複数のサブネットワークを含み、前記サブネットワークは最低から最高まで連続で配置され、前記ニューラルネットワークを使用した前記３Ｄデータを処理することは、前記連続の中における前記サブネットワークのそれぞれを通して前記データを処理することを備え、
前記サブネットワークのそれぞれは、
前記連続の中における前のサブネットワークにより生成された前の出力表現を受信し、
様々な畳み込み体積の複数の並列３Ｄ畳み込み層経路を通して前記前の出力表現を処理し、
前記前の出力表現を並列プーリング経路を通してさらに処理し、
前記３Ｄ畳み込み層経路および前記並列プーリング経路の出力を連結して各前記サブネットワークからの出力表現を生成する
よう構成される、ことと、
前記サブネットワークを通して前記データを処理することに続いて、最高の前記サブネットワークの出力をプーリング層および少なくとも一つの次元削減層を通して処理し、前記入力放射線体積の次元より削減された次元をもつ出力を生成することと、
前記受信した３Ｄデータを、前記削減された垂直次元をもつ前記生成された出力に基づいて分類することと、を含む、方法。
最初の３Ｄ畳み込み層経路は、前記３Ｄデータからセミグローバルな特徴を抽出する３ｘ３の畳み込みである、請求項１に記載の方法。
２つ目の３Ｄ畳み込み層経路は、前記３Ｄデータからグローバルな特徴を抽出する５ｘ５の畳み込みである、請求項１または２に記載の方法。
３つ目の３Ｄ畳み込み層経路は、前記３Ｄデータからローカルな特徴を抽出する１ｘ１の畳み込みである、請求項１ないし３のうちいずれか一項に記載の方法。
前記３Ｄデータは３Ｄモデルデータ；コンピューター支援設計のモデルデータ；または３Ｄの点群を表す、請求項１ないし４のうちいずれか一項に記載の方法。
前記サブネットワークの３Ｄ畳み込み層経路の前記出力表現を３Ｄバッチ正規化によって状態を調整することであって、
前記３Ｄバッチ正規化は、前記ニューラルネットワークによって生成される代替的な特徴体積表現の各特徴へ独立して適用され、バッチごとに適用され、
あるバッチ内の前記代替的な特徴体積表現に対して、前記３Ｄバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替的な特徴体積表現は、画像データ量のゼロ平均と単位分散とを持つ、こと
をさらに含む請求項１ないし５のうちいずれか一項に記載の方法。
前記正規化された代替的な特徴体積表現を、パラメーター化された非線形活性化を通して、前記ニューラルネットワークの訓練が前記３Ｄバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、直ちに処理すること、をさらに含む請求項６に記載の方法。
前記並列プーリング経路がＭａｘプーリング経路であり、前記プーリング層がＭａｘプーリング層である、請求項１ないし７のうちいずれか一項に記載の方法。
ニューラルネットワークであって、当該ニューラルネットワークは：
３Ｄデータを受信する前処理ネットワークと、
連続で配置された複数のサブネットワークであって、前記複数のサブネットワークは前記前処理ネットワークからの出力を受け取る第一のサブネットワークと、前記複数のサブネットワークにおける前のサブネットワークからの出力を受け取る第二のサブネットワークとを含み、
前記第一のサブネットワークは：
前記前処理ネットワークからの出力を様々な畳み込み体積に基づいて処理するための複数の第一の３Ｄ畳み込み層経路と；
前記複数の第一の３Ｄ畳み込み層経路と並列に前記前処理ネットワークからの出力を処理するための第一のプーリング経路と；
前記複数の第一の３Ｄ畳み込み層経路および前記第一のプーリング経路からの出力を連結するための第一の連結ネットワークとを有しており、
前記第二のサブネットワークは：
前記前のサブネットワークからの出力を様々な畳み込み体積に基づいて処理するための複数の第二の３Ｄ畳み込み層経路と；
前記複数の第二の３Ｄ畳み込み層経路と並列に前記前のサブネットワークからの出力を処理するための第二のプーリング経路と；
前記複数の第二の３Ｄ畳み込み層経路および前記第二のプーリング経路からの出力を連結するための第二の連結ネットワークとを有しており、
当該ニューラルネットワークはさらに、
前記第二のサブネットワークの出力を処理して、前記入力放射線体積の次元より削減された次元をもつ出力を生成するためのプーリング層および少なくとも一つの次元削減層と；
前記３Ｄデータを、前記プーリング層の出力に基づいて分類するための分類器と、
を有する、ニューラルネットワーク。
前記第一のプーリング経路がＭａｘプーリング経路であり、前記プーリング層がＭａｘプーリング層である、請求項９に記載のニューラルネットワーク。
前記第一の３Ｄ畳み込み層経路のうちの第一のものが、前記３Ｄデータからセミグローバルな特徴を抽出する３ｘ３の畳み込みである、請求項９または１０に記載のニューラルネットワーク。
前記第一の３Ｄ畳み込み層経路のうちの第二のものが、前記３Ｄデータからグローバルな特徴を抽出する５ｘ５の畳み込みである、請求項９ないし１１のうちいずれか一項に記載のニューラルネットワーク。
前記第一の３Ｄ畳み込み層経路のうちの第三のものが、前記３Ｄデータからローカルな特徴を抽出する１ｘ１の畳み込みである、請求項９ないし１２のうちいずれか一項に記載のニューラルネットワーク。
前記３Ｄデータは医療スキャンデータ；コンピューター支援設計（CAD）のモデルデータ；または３Ｄの点群を表す、請求項９ないし１３のうちいずれか一項に記載のニューラルネットワーク。
前記第二のサブネットワークの出力を、前記プーリング層に提供する前に、状態を調整するためのバッチ正規化層をさらに含み、
前記３Ｄバッチ正規化層は、当該ニューラルネットワークによって生成される代替的な特徴体積表現の各特徴へ独立して適用され、バッチごとに適用され、
あるバッチ内の前記代替的な特徴体積表現に対して、前記バッチ正規化層は、正規化された代替的な特徴体積表現が画像データ値のゼロ平均および単位分散を持つよう、画像データ値のスケール変更およびシフトを行う、
請求項９ないし１４のうちいずれか一項に記載のニューラルネットワーク。
前記正規化された代替的な特徴体積表現を処理するための、学習可能なスケール変更およびシフトパラメーターをもつパラメーター化された非線形活性化層であって、前記非線形活性化層の訓練により前記バッチ正規化を減殺できる、請求項１５に記載のニューラルネットワーク。
前記前処理ネットワークが、一つまたは複数の３Ｄ畳み込み層および一つまたは複数のＭａｘプーリング層を有する、請求項９ないし１５のうちいずれか一項に記載のニューラルネットワーク。
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、請求項１ないし８のうちいずれか一項に記載の方法を実行する、非一時的なコンピューター可読記憶媒体。