JP6838038B2 - 3dバッチ正規化を伴う三次元(3d)畳み込み - Google Patents

3dバッチ正規化を伴う三次元(3d)畳み込み Download PDF

Info

Publication number
JP6838038B2
JP6838038B2 JP2018228657A JP2018228657A JP6838038B2 JP 6838038 B2 JP6838038 B2 JP 6838038B2 JP 2018228657 A JP2018228657 A JP 2018228657A JP 2018228657 A JP2018228657 A JP 2018228657A JP 6838038 B2 JP6838038 B2 JP 6838038B2
Authority
JP
Japan
Prior art keywords
data
layer
output
neural network
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018228657A
Other languages
English (en)
Other versions
JP2019061710A (ja
Inventor
ソーチャー,リチャード
ション,カイミング
タイ,カイ,ション
Original Assignee
セールスフォース ドット コム インコーポレイティッド
セールスフォース ドット コム インコーポレイティッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by セールスフォース ドット コム インコーポレイティッド, セールスフォース ドット コム インコーポレイティッド filed Critical セールスフォース ドット コム インコーポレイティッド
Publication of JP2019061710A publication Critical patent/JP2019061710A/ja
Application granted granted Critical
Publication of JP6838038B2 publication Critical patent/JP6838038B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10116X-ray image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30068Mammography; Breast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Architecture (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Description

優先権出願
本出願は2015年8月15日に出願された“Medical Vision System”と称する米国仮特許出願第62/205,718号(特許弁護士整理番号 SALE 1165−1/2021PR)に関連しその利益を主張するものである。当該仮出願はここに引用することにより、あらゆる目的のために組み込まれているものとする。
開示される技術は、一般に3Dディープ畳み込みニューラルネットワーク(DCNNA)内の三次元(3D)データの処理中の計算能力およびメモリ利用などの、計算資源の利用の向上に関し、とりわけ、計算機的に効率の良い、畳み込みニューラルネットワーク(CNN)内における3D画像分類および物体認識の実施に関する。
本章で議論する対象は、本章による言及の結果のみによって先行技術であると仮定されるべきではない。同様に、本章で提示されるまたは背景として提供される対象に関連する問題は、先行技術内で認められると仮定されるべきではない。本章の対象は異なるアプローチを表現するにすぎず、特許請求する技術の実施例にも関連してもよい。
開示される技術により、限られたメモリと計算機容量の中で膨大な量のデータを処理する必要がある、医療用画像などのビッグデータシナリオにおいても、畳み込みニューラルネットワーク(CNN)の利用が可能になる。既存のディープ畳み込みニューラルネットワーク(CNN)の主要な技術的課題は、多大な計算資源を必要とするということである。開示する技術によれば、この問題は、3Dディープ畳み込みニューラルネットワークアーキテクチャー(DCNNA)内に、3Dデータが演算負荷の高い操作の対象になる前に3Dデータへ次元削減操作を行う、いわゆるサブネットワークを追加することで解決される。また、サブネットワークは3Dデータに対して、異なる3D畳み込み層経路(例えば1x1x1畳み込み、3x3x3畳み込み、5x5x5畳み込み、7x7x7畳み込み)によって3Dデータを並列処理の対象にすることにより、複数のスケールで畳み込みを行う。このようなマルチスケール操作は直列の畳み込みを行う従来のCNNよりも計算機的に安価である。加えて、サブネットワークのパフォーマンスはサブネットワークへの3D入力を正規化し、代わりに3D DCNNAの学習率を増加させる3Dバッチ正規化(BN)によりさらに改善される。
機械学習は、明確にプログラミングされていなくとも学習を行う能力をコンピューターに提供する、人工知能(AI)のエリアの研究分野である。静的プログラミングに対して、機械学習は、あるデータで訓練したアルゴリズムを、該データまたは別のデータに関する予測を生成するために使用する。ディープラーニングは、データの低レベル解析の層ごとに、該データの高レベル抽象化をモデリングする機械学習の一形態である。近年、CNNにより画像分類および物体認識は大きく進歩した。畳み込みフィルターの複数層を訓練することにより、サポートベクトルマシン(SVM)、PCA、線形判別分析(LDA)、ベイズインターパーソナル分類器などの多くの機械学習ツールの一般化の能力は、訓練の量が増えるに従い、素早く飽和する傾向にある。しかし、CNNは、異なる時刻において多数の様々な画像を用いて訓練する場合、従来の機械学習アルゴリズムと比較してより良いパフォーマンスをすることが判明した。CNNは物体認識において複雑な特徴を自動的に学習でき、手作業で作成した特徴よりも優れたパフォーマンスを達成する。
しかしながら、CNNは、それがないとネットワークが学習および印象的な認識パフォーマンスを実現することに失敗する、多量の訓練データを必要とする。このような多量のデータで訓練を行うには数千ものCPUコアおよび/またはGPUのような多大な計算資源が必要であり、それによりCNNの応用例は限定的なものとなり、モバイルや組み込み計算機には拡張不可能なものとなる。従って、ビッグデータの解析時に計算資源のパフォーマンスを向上させるCNNアーキテクチャーが必要とされる。
図面においては、異なる図においても、同様の部分には同様の参照記号を割り当てる。また、図面は、必ずしも同一のスケールではあらず、代わりに、開示する技術の原理を図示するために概して強調されている。以下、本開示の様々な実施態様を、以下の図面を参照して説明する。
図1は実施例に従ったシステムの構成レベルの概略を示す。 図2は本開示における技術の一実施態様における3D DCNNA内のサブネットワークのブロック図であり、マルチスケール3D畳み込み層経路および3Dプーリング操作の詳細を示す。 図3は複数のサブネットワークおよび、前および後処理層を備えた3D DCNNAの例である。 図4Aは正規化された3D入力を生成するために前のサブネットワークからの3D入力へ適用する3Dバッチ正規化(BN)操作の一実施例を示す。 図4Bは別途に学習された非線形活性化を正規化された3D入力へ適用する、次のサブネットワークによる処理のための、スケール変更されシフトされた3D出力への、3Dバッチ正規化(BN)操作の一実施例を示す。 図5は複数のサブネットワークおよび3Dバッチ正規化層の組み合わせを使用する3D DCNNAのブロック図を示す。 図6は3D DCNNAの一実施例を示す。 図7は人間の脳の医療用スキャンによる3D放射性体積の形態をとる、3D DCNNAによって使用されるグレースケール3D入力データの例を示す。 図8は人間の脳の医療用スキャンによる3D放射性体積の形をとる、3D DCNNAによって使用されるカラーの3D入力データの例である。 図9は人間の脳の医療用スキャンから生成された3D 放射性体積に基づいた、3D DCNNAが人間の脳内の頭蓋内出血(IH)構造の検出に使用されるユースケースの一実施例を示す。 図10は3D DCNNAの出力に基づいて、出力の計算に最も寄与した3D入力データの特徴を決定するための、図7に示された3D入力データをバックトラックする処理の一実施例である。 図11は、開示されたDCNNAを使用しない場合の3D CNNの実験結果の一実施例をデモンストレーションするPR曲線を示す。 図12は開示されたDCNNAを使用する場合の3D CNNの実験結果の一実施例をデモンストレーションするPR曲線を示す。 図13はディープニューラルネットワークにおいて3Dデータを畳み込む代表手法である。 図14はディープニューラルネットワークにおいて3Dデータを畳み込む別のプロセスである。 図15は、開示技術の1つ以上の実施例による、図1のシステムと統合することに適したマルチテナントシステムの例のブロック図である。

以下、図を参照して詳細な説明を行う。開示する技術の実施例が示されるが、開示する技術の請求項によって定義される範囲を限定する目的ではない。当業者は、以下の説明には様々な等価なバリエーションがあることを認識する。
議論は以下のように体系付けられる。まず、様々な実施例により問題点を指摘し導入として提示する。そして、アーキテクチャーレベルにて一実施例を議論することにより、より高レベルの説明を行う。次に、3Dデータを効果的に処理するために、ある実施例に用いられるアルゴリズムを議論する。最後に、システムを実施するためのより具体的なアーキテクチャーおよび3Dデータの例、3Dディープ畳み込みニューラルネットワークアーキテクチャー(DCNNA)を適用するユースケース例、実験結果、マルチテナント環境における処理と組み込みについて議論する。
CNNで3Dを処理すると、より多いパラメーター、膨大なメモリおよび計算機的要求が伴う。従来のCNNは、入力3D画像から、スカラーまたはベクトルであるボクセル信号により、データのエンコードとデコードを組み合わせて、特徴マップを抽出する。入力画像は、固定されたボクセルの近傍を隠れ層のベクトル特徴空間にマップすることによりエンコードされ、出力層において、オリジナル画像空間へ再構成される。多様な入力データの特性のパターンをとらえた特徴の抽出には、オートエンコーダの訓練において再構成エラーを減らすために、誤差逆伝播法および特徴量空間のプロパティへの制限を採用している。しかしながら、ベクトルであるボクセル信号を持つ3D画像からグローバルな特徴を抽出することは、入力(エンコード)および出力(デコード)層において評価されるパラメーターの数が急速に増えているために、演算負荷が高く、過大な訓練データセットを必要とする。
3Dデータを処理する計算機負荷を克服するために、開示される技術においては、3D放射線体積が演算負荷の高い操作の対象になる前に3D放射線体積へ次元削減操作を行う、いわゆるサブネットワークモジュールを装備した、3Dディープ畳み込みニューラルネットワークアーキテクチャー(DCNNA)を使用する。加えて、サブネットワークのパフォーマンスはサブネットワークへの3D入力を正規化し、代わりに3D DCNNAの学習率を増加させる3Dバッチ正規化(BN)によりさらに改善される。一連のサブネットワークモジュールに渡る、3Dカーネル(すなわち学習された隠れた重み)を用いた数層の3D畳み込みおよび3Dサブサンプリングの後、3D放射線体積から垂直次元が削減された特徴マップが生成され、1つ以上の全結合層へ提供される。該全結合層の演算の後、分類または回帰された出力が生成される。1つの実施例は、3D DCNNAは、それぞれの後に3D BN層が続く3つ以上のサブネットワークモジュール、畳み込み層、サブサンプリング層、全結合層、および出力層を備える。
3D DCNNA のより深い層への重みのアップデートを行うと、結果として3D入力の分布が絶えず変化し、対応する代替特徴体積表現または特徴マップが、重みの収束を妨げる。一実施例では、訓練の繰り返しにおいて、重みのアップデートは重みの分散の片寄りを起こし、代替特徴体積表現が次の繰り返しにおいて増幅される。さらに、3Dにおける特徴において問題は悪化し、任意の分散が層の数に基づいて指数関数的に増幅される。開示する技術ではこれに対抗して、結果である代替特徴体積表現をよりよく維持するため、サブネットワーク処理ステップの後に、DCNNAの隠れ層に、DCNNAの非線形活性化の正規化を可能にする3Dバッチ正規化(BN)技術を採用する。一実施例では、この正規化の幾何学的解釈は、もしも3D入力が多変数ガウス分布であれば、ある実施における変換データは、ゼロ平均のガウス分布および単位共分散である。結果、BNは、学習率を向上させることにより、また学習を正規化することにより、3D DCNNAの学習を加速させる。
さらに、医療のプロフェッショナルは、3D医療用画像を解釈し、および診断テストにおいて異常を発見するための、様々な医療用ワークフローを持っている。例えば、年1回のマンモグラムにおいては、患者は放射線科のかかりつけ医にかかる。特許は、3D医療用画像の組が結果として提供される、例えばX線によるマンモグラムを受け、そしてことによると、現場の専門家が追加の調査や代わりの画像が必要かを判断するため、X線写真に対して予備の検討を行うかもしれない。X線写真は電子システムに投入され、専門家が吟味し、かかりつけ医のための診断を記入する。患者はかかりつけ医からの呼び出しを待ち、マンモグラムの結果を入手する。このプロセスにおいては、マンモグラムの実施から結果まで数週間を要し得る。必要なのは、短時間で応答でき、診断の誤りが少なく、また、専門性または経験が少ないプロフェッショナルがより高いレベルで仕事を行えるようにするための、このような3D医療用画像を取り扱う新しいプロセスである。
開示された実施例に基づいたシステム、装置、および方法は、医療視覚の文脈、および3Dデータにより説明される。他の事例では、開示された技術は、情報技術、不正検知、遠隔通信システム、金融システム、証券取引、銀行業務、ビジネスインテリジェンス、マーケティング、鉱業、エネルギー等、および2D、3D、4Dまたはn次元データに適用することができる。以下の例は範囲、文脈、設定を、定義または限定するよう受け取られるべきではなく、他のサービスが可能である。他の適用も可能であり、以下の例が決定的、または範囲もしくは設定のいずれかを制限すると解釈されるべきではない。
開示された技術は、ディープ畳み込みニューラルネットワークアーキテクチャー内部での三次元(3D)データの処理における計算能力およびメモリ使用のような、計算資源の使用の改善に関する。開示された技術は、オンデマンドデータベースシステム、マルチテナント環境等を含む、任意のコンピューター実行システムにて実施できる。さらに、本技術は、協力し互いに通信する2つ以上の独立し異なるコンピューター実行システムを使用して実施できる。本技術は、プロセス、方法、装置、システム、デバイス、コンピューターにより読み取り可能な命令またはコンピュータープログラムコードを記憶したコンピューター可読記憶媒体のような、または、コンピューターにより読み取り可能なプログラムコードを内部に組み込んだコンピューターにより利用可能な媒体を備えたコンピュータープログラム製品のような、コンピューター可読媒体、などを含む数々の方法で実施可能である。
開示された技術は、データベースシステム、マルチテナント環境、またはOracleTM互換データベース実装IBM DB2 Enterprise ServerTM互換関係データベース実装、MySQLTM またはPostgreSQLTM互換関係データベース実装またはMicrosoft SQL ServerTM互換関係データベース実装のような関係データベース実装、またはVampireTM互換非関係データベース実装、Apache CassandraTM互換非関係データベース実装、BigTableTM互換非関係データベース実装、またはHBaseTMまたはDynamoDBTM互換非関係データベース実装、のような、NoSQL非関係データベース実装を含む、任意のコンピューターに実装されたシステムにおいて実施することができる。
加えて、開示された技術はMapReduceTM、バルク同期プログラミング、MPI primitives等、またはApache StormTM、Apache SparkTM、Apace KafkaTM、TruvisoTM、IBM Info−SphereTM、BorealisTMおよびYahoo! S4TMなどの異なるストリーム管理システムを使用して実施できる。
システムの概要
従来の畳み込みニューラルネットワーク(CNN)において計算機的に効果的な3D画像分類および物体認識を行うシステムおよび様々な実施例について説明する。ある実施例におけるシステムの構造レベルの概略を示す図1を参照してシステムとプロセスを説明する。図1は構造図であるので、明瞭な説明のために特定の細部は意図的に省略されている。図1の議論は以下のように整理される。まず、図の要素について説明し、それらの相互接続を説明する。次に、システム内での要素の用途をより詳細に説明する。
図1はシステム100を含む。システム100は機械学習システム110、タブレット162、携帯電話164、そしてコンピューター166のような計算装置、訓練データ記憶装置176、テストデータ記憶装置186およびネットワーク160を含む。機械学習システム110はテスト部112、訓練部122、ディープラーニングネットワーク132、および3D畳み込みニューラルネットワーク(CNN)142を含む。
システム100の要素の相互接続について説明する。ネットワーク160はタブレット162、携帯電話164、コンピューター166、訓練データ記憶装置176、テストデータ記憶装置186、および機械学習システム110を通信可能なように接続する(実線で示される)。実際の通信経路は、パブリックおよび/またはプライベートネットワークを通るポイントツーポイントである。テストデータなどの項目は、例えばアプリケーション記憶装置(図示せず)を介して、間接的に届けられる。通信は、例えばプライベートネットワーク、VPN、MPLS回線、またはインターネットなどの様々なネットワークを介して行われ、REST、JSON、XML、SOAP、および/またはJMSなどの適切なAPIおよびデータ交換フォーマットを使用してもよい。通信は暗号化されてもよい。この通信は一般的には LAN(ローカルエリアネットワーク)、WAN(広域ネットワーク)、電話回線網(公衆交換電話網(PSTN)、セッション開始プロトコル(SIP)、無線ネットワーク、ポイントツーポイントネットワーク、スター型ネットワーク、トークンリングネットワーク、ハブネットワーク、インターネット、モバイルインターネットの包含を介して、またEDGE、3G、4GLTE、Wi−FiおよびWiMAXのようなプロトコルを介して行われる。加えて、ユーザー名/パスワード、OAuth、Kerberos、SecureID、デジタル署名、その他などの認証・認可技術を、通信を安全にするために使用してもよい。
3D畳み込みニューラルネットワーク(CNN)
図1の要素、およびそれらの相互接続を説明したので、図の要素をより詳細に説明する。機械学習システム110はテスト部112および訓練部122を介して様々な機能を提供する。訓練部122は、コスト関数を最小化することにより、3D畳み込みニューラルネットワーク(CNN)142を訓練する。一実施例では、コスト関数は、勾配の指定を誤差逆伝播法アルゴリズムに依拠する確率的勾配降下法(SGD)を使用して最小化される。ある実施例では、訓練部122はSGDを使用して、与えられたバッチサイズにおいてミニバッチから推定された勾配に基づいた繰り返しのアップデートを行い、ここで1つのアップデートは各ミニバッチの後に行われる。一実施例では、各勾配のアップデートはさらに、現在の勾配と、3D CNN142の前方伝播中にコスト関数によって計算されたエラー値に基づいた直前のアップデート繰り返しによる勾配の重みづけされたの組み合わせとして3D CNN142の様々なパラメーターをアップデートする、モーメントに基づいた学習ルールにより増大される。
3D CNN142を訓練するためには、訓練データ記憶装置176からの3Dデータが使用される。一実施例では、訓練データ記憶装置176は、3D CNN142をサービスまたは製品として提供する第一の企業体によって整備され利用される。別の実施例では、訓練データ記憶装置176は、第一の企業体によって、第一の企業体によって開発された3D CNN142をビジネスまたは技術的課題を解決するために適用する第二の企業体(例えば仲介ベンダー)と共同して配置される。さらに別の実施例では、訓練データ記憶装置176は、エンドユーザーによって提供された、またはエンドユーザーを使用して(例えばクラウドソーシング)生成されたデータを使用して配置される。ある実施例では、3D CNN142は、最新鋭の正確さと信頼性をもってコンピューター視覚タスクを遂行する医療視覚視点を持った学習システムとして働く。この医療視覚システムは医療のプロフェッショナルによりラベル付けされた例をもとに訓練され、その後画像データに基づいた特定の医療的問題の確認と診断を補助するために展開される。訓練中は、適切な医療プロフェッショナルにより健康および/または異常要素として特徴づけられた3D医療用画像および/または画像の一部分が、ディープラーニング医療視覚システムに提供される。
一実施例における訓練データは、1つ以上の画像の組から成る。一実施例においては、各画像または画像の組は、1つ以上の追加情報に関連付けられる。ある実施例においては、追加情報は画像または画像の組に対するラベルを含む。一実施例においては、訓練データは、ラベル付けされた一組のコンピューター断層(CT)スキャンである。他の実施例では、超音波、磁気共鳴画像(MRI)画像などを含む、他の型の画像を含む。
3D医療用画像は、例えば様々な健康および異常な眼を例示する眼底撮影法のような、様々な題材を含んでいてもよい。眼底の画像は様々なフォーマットであってもよい。眼の異常としては、糖尿病網膜症、鬱血乳頭、動脈性高血圧の眼科的兆候などが、その他の異常の中でも考えられる。他の3D医療用画像は他の題材を含んでいてもよい。例えば、CTスキャンとしては、様々な健康または異常な題材を含んだ頭部のCTスキャンが考えられる。例えば、異常な頭部のCTスキャンは、頭蓋内出血、硬膜血腫、硬膜下血種、実質内出血、脳室内出血、くも膜下出血、脳室の拡大/偏位、脳槽異常、腫瘤病変/腫瘤効果、浮腫の一般的エビデンス、膿瘍、虚血梗塞を示す凝血、頭蓋骨骨折、およびhyperdense中大脳動脈(MCA)のうち1つ以上を示すことがあり得る。同一または他のエリアの、他の3D医療用画像により、例えば肺塞栓症のような肺または心臓の異常のような、他の異常題材が示され得る。
ある実施例では、訓練データは3D CNN142によって処理され得る。画像処理は、訓練データ画像内のデータへの1つ以上の操作を含む。画像処理の例は、特定のピクセルまたはボクセル数、粒度レベル、画像フォーマット等へと訓練データを正規化することを含む。一実施例では、画像処理は、訓練データをサイズまたはピクセルまたはボクセルの数の閾値、またはボクセルの強度または粒度レベルを満たすように特定のサイズへ縮尺変更する訓練、および、特定の内容を中心化する訓練、または特定のまたは一定の方向へ回転される訓練を含み得る。
ある実施例では、画像処理は、三次元(3D)体積の二次元(2D)コラージュを作成し、訓練データの二次元(2D)処理を可能にすることを含む。一実施例では、画像処理は、三次元(3D)体積のサブセットを選択することを含む。ある実施例では、3D医療用画像は複数の関連画像をまとめたものであり得る。ある実施例では、コラージュは、1つより多い医療用画像から作成され得る。
訓練データ記憶装置176からの訓練中に3D CNN 142の全てのパラメーターを学習すれば、3D CNN142はテストデータからの画像分類と物体認識の準備が出来た状態になる。一実施例では、テストデータはテストデータ記憶装置186に記憶されている3Dデータである。テスト中には、テスト部112は3D CNN142を実行し、誤差逆伝搬法を行わずに3D入力データの予測を生成する。画像分類の場合はテスト時に、1つ以上のカテゴリーに属する3D入力データの事後確率を推定する特徴マップを生成するために、3D入力データは3D CNN142の様々な畳み込み層、サブネットワーク、バッチ正規化層、およびプーリング層を通される。一実施例では、テストデータ記憶装置186は、3D CNN142をサービスまたは製品として提供する第一の企業体によって整備され利用される。別の実施例では、テストデータ記憶装置186は、第一の企業体によって、第一の企業体によって開発された3D CNN142をビジネスまたは技術的課題を解決するために適用する第二の企業体(例えば仲介ベンダー)と協働して配置される。さらに別の実施例では、テストデータ記憶装置186は、エンドユーザーによって提供された、またはエンドユーザーを使用して(例えばクラウドソーシング)生成されたデータを使用して配置される。
システム100に示される一実施例では、3D訓練データおよびテストデータはCassandraTMのようなNoSQLキーバリューカラムストア分散記憶システム178および188に記憶される。CassandraTMの3Dデータは多数のノードまたはコモディティーサーバーC1からC3にわたって拡散され、Java(登録商標)、Scala、Ruby,ClojureまたはPythonに基づいたAPI(例えばHector、Pelops、CQL、Thrift、Phpcassa,PyCassa等)を使用して接続が行われる。他の実施例では、3D訓練およびテストデータはHadoopクラスター179および189のようなHadoop分散ファイルシステム(HDFS)に記憶される。
3Dデータ/3D放射線体積
ある実施例では、3D訓練およびテストデータは各点(x、y、z)の、別個のボクセル座標(i、j、k)へマップされた、体積表現である。一実施例では、3D入力データは、固定の占有率または、表面の湾曲グリッド(例えば24x24x24、32x32x32、256x256x256、200x150x150、317x215x254、36x224x224)を設定された、DxDxDボクセルの体積を持つ。一実施例では医療視覚コンテキスト、3D訓練およびテストデータは3D放射線体積であり、医療用スキャンにより生成された人間の臓器の構造の、解剖学上における3D形状のバリエーションを示している。図7は、3D DCNNAによって使用される、人間の脳の医療用スキャン(例えばMRI、CT)による3D放射線体積の形をとるグレースケールの3D入力データ700の例である。図8は3D DCNNAによって使用される、人間の脳の医療用スキャンの、3D放射線体積の形をとる、カラーの3D入力データ800の例である。一実施例においては、3D放射線体積700および800は人間の脳の3Dモデルを示している。他の実施例では、3D放射線体積700および800は3Dの点群を示している。他の実施例では、3Dの訓練およびテストデータはコンピューター支援設計(CAD)モデルを含む。
ディープラーニングネットワーク132は上以上のGPU上で動作する。ディープラーニングネットワーク132は人工ニューロンを多層積み重ねて形成したフィードフォワードネットワークである。各層は、ニューロンが特徴検知器として働くデータの新しい表現をモデル化する。再帰的に、より深いニューロンは前の層で検知された特徴によって形作られた新しい特徴を学習する。結果は、より高いレベルの特徴の検出器の階層構造となる。ディープラーニングネットワーク132はさらに、1つ以上のGPUで動作する3D CNN142を含む。一実施例においては、3D CNN142は、タブレット162、携帯電話164、およびコンピューター166などの、1つ以上のクライアント機器のプロセッサーにおいて動作する。
一実施例においては、3D CNN142は、畳み込み層、サブネットワーク、3Dバッチ正規化層、プーリング層、および全結合層を含む。3D CNN142は、3D入力データ/放射線体積に対して同一サイズパッチを利用して畳み込みの計算を行う固定サイズの3Dパッチまたは3Dカーネルである、いわゆる3D受容野を使用する。一実施例では、出力特徴マップ、を生成するために3D放射線体積の全てのボクセルおよび中間特徴マップが対象にされていることを確実にするために、ストライドが設定される。ある実施例では、畳み込み操作のあと、次元を減らし、演算の繰り返しを避けるために、中間特徴マップを使用したサブサンプリングが行われる。ある実施例では、全結合層は、多次元特徴マップを連結するため、そして該特徴マップを分類器として固定サイズカテゴリにするために使用される。3D CNN142の層は、前述したように、重みが誤差逆伝搬法を使用して訓練中に調整される、訓練可能なパラメーターを持っている。3D CNN142の各部は、Sigmoid、ランプ関数(ReLU)またはLeaky ReLUのような、ある型の非線形活性化を使用する。ある実施例では、3D CNN142の最上位層では、3D入力を[0、1]にマップするソフトマックス活性化関数を使用する。これにより出力を確率と解釈し、ボクセルの選択を最も高い確率で行うことができるようになる。
ここでシステム100を特定のブロックを参照して説明したが、ブロックは説明の利便性のために定義されたのであり、構成要素の部分の物理的な配置を要求するように意図されたものではない。さらに、ブロックは物理的に別個の構成要素に対応する必要はない。物理的に別個の構成要素が使用されることとなれば、構成要素間の接続(例えばデータ通信)は、要求により、有線および/または無線であってもよい。異なる要素または構成要素は1つのソフトウエアモジュールへと結合されてもよく、複数のソフトウエアモジュールが同じハードウエア上で実行されてもよい。
サブネットワークモジュール
図2は開示する技術の一実施例における3D DCNNA(3D CNN142のような)内のサブネットワーク200Aのブロック図200を示し、マルチスケール3D畳み込み層経路および3Dプーリング操作を詳細に示す。一実施例では、サブネットワーク200Aは特徴マップを入力とし、1x1x1 畳み込みから3x3x3、5x5x5、7x7x7畳み込み、および3x3x3プーリングのような3D Maxプーリング層のように、様々な、いくつかの3D畳み込み層経路を並列で適用する。さらに、3D入力データはサブネットワーク200Aにより複数スケール210および214において処理される。これはサブネットワーク200Aに入力として供給される特徴マップが、次元削減送212および3DMaxプーリング層222によって、最初に、マルチスケール210において並列に処理されることを意味する。さらに進み、次元層212の1x1x1畳み込みの結果である最適化された特徴マップは、異なる3D畳み込み層経路216(例えば1x1x1 、3x3x3、5x5x5、7x7x7の畳み込み)によりマルチスケール214で並列に処理される。サブネットワーク200Aにおける層経路の各層は、連結層234において最終出力として1つの特徴マップに連結され、異なる出力または特徴マップを生成する。
次元削減層212および224は次元削減を実行するために使用される。例えば、90の特徴を持つ36x224x224ボクセルの3D入力に1x1x1の40のフィルターによる畳み込みを行った結果は40x36x224x224のサイズになる。一実施例では、次元削減層はSigmoid, ReLUまたはLeaky ReLUのような非線形活性化も備えている。図2に示されるように、サブネットワーク200A内では、1x1x1、3x3x3、5x5x5および7x7x7畳み込みのようには3D入力は直接3D畳み込み層経路に供給はされない。代わりに、入力の次元を削減するために、追加の1x1x1畳み込みが、次元削減層212として使用される。さらに、3D Maxプーリング層222の出力は、次元削減層224として働く追加の1x1x1畳み込みへ提供される。
図3は、最低から最高へと連続して配置された複数のサブネットワーク200A、200Bおよび200C、3D DCNNA300(3D CNN142のような)、および前処理層310および後処理層320の例である。ある実施例では、前のサブネットワーク(例えばサブネットワーク200A)の出力は次のサブネットワークの畳み込みおよびプーリング(例えばサブネットワーク200B)への入力へ使用される。各サブネットワーク200A、200Bおよび200Cは代替特徴体積表現、または入力3D放射線体積の特徴マップを生成する。ある実施例では、3D入力データ/放射線体積は1つ以上の、3D畳み込み311、2D畳み込み312、1D畳み込み313、3Dプーリング操作314、2Dプーリング操作315、1Dプーリング操作316、などの前処理層310の処理対象になる。ある実施例では、3D入力データ/放射線体積は1つ以上の、3D畳み込み321、2D畳み込み322、1D畳み込み323、3Dプーリング操作324、2Dプーリング操作325、1Dプーリング操作326、などの後処理層320の処理対象になる。一実施例では、3以上のモジュールサブネットワーク200A、200B、および200Cによる3D入力データおよび中間代替特徴体積表現または特徴マップの処理の後、モジュールサブネットワークの最高位のものの出力(サブネットワーク200Cのような)は垂直プーリング層で処理され、3D入力放射線体積から垂直次元削減出力が生成される。
バッチ正規化
3D CNN142の深い層の重みアップデートの結果は、変化し続ける3D入力の分布、および対応する代替特徴体積表現または特徴マップとなり、重みの収束を妨げる。一実施例では、訓練の繰り返しにおいて、重みアップデートは、代替特徴体積表現が次の繰り返しにおいて増幅されるように、重みの分散に偏差を起こす。さらに、任意の偏差は層の数に基づいて指数関数的に増大するため、3D特徴量F1からFnにおいて問題は悪化する。開示する技術ではこれに、結果である代替特徴体積表現をよりよく維持するため、毎サブネットワーク処理ステップの後に、隠れ層に、3D CNN142の非線形活性化に対する正規化を可能にする3Dバッチ正規化(BN)技術を採用することにより対抗する。一実施例では、この正規化の幾何学的解釈は、3D入力データが多変数ガウス分布であったとき、変換されたデータは、ある実施例では、ゼロ平均と単位共分散を持つガウス分布である。結果、BNは、学習率を向上させ、また学習を正規化し、その結果3D CNN142の学習を加速させる。
図4Aは正規化された3D入力を生成するために、前のサブネットワークからの3D入力へ3Dバッチ正規化(BN)操作400Aを行う一実施例を示す。図4Aでは、前のモジュールサブネットワークからの3D入力は、複数の3D特徴F1からFnを含む。図4Aでは、特徴F1からFnが三次元であることは記号
によって示される。このステップでは、3D特徴F1からFnはゼロ平均および単位分散へ正規化され、図4Bにて線形変換される。平均および分散は、例を挙げるとF1からFnの3D特徴の各次元において計算され、訓練データセットのミニバッチ(例えばバッチ1)毎ではない。ある実施例では、平均と分散の移動平均が、テスト中、正規化に使用するために整備される。結果として得られる、正規化された特徴F1’からFn’が図4Aの右側に示される。
図4Bは、学習された非線形活性化を、正規化された3D入力へ適用して、次のサブネットワークによる処理のための、スケール変更およびシフトされた3D出力を生成する、3Dバッチ正規化(BN)操作400Bの一実施例を示す。一実施例では、3D BN層は、前のサブネットワークの後、そして続く非線形活性化の直前に導入される。図4Bでは、正規化された特徴F1’からFn’が三次元であることが記号
により示される。本ステップでは、続くサブネットワークへの入力表現として使用できる、スケール変更されシフトされた3D特徴F1’’からFn’’を生成するために、学習された非線形活性化(例えばReLU非線形(y=max(0,x))を正規化された3D特徴F1’からFn’へ適用する。非線形活性化は誤差逆伝搬法の中で、スケールパラメーターおよびシフトパラメーターの2つのパラメーターを使用して訓練される。3D BNのこのステップの中で、最後の後方パスによってアップデートされた、非線形活性化におけるスケール変更されてシフトされたパラメーターは、図4Aの正規化された3D入力へ適用される。結果として得られる、スケール変更されシフトされた特徴F1’’からFn’’を図4Bの右側に示す。
図5は複数のサブネットワークおよび3Dバッチ正規化層の組み合わせを使用する3D DCNNA(3D CNN142のような)のブロック図500である。図5においては、各サブネットワーク200A、200Bおよび200Cの直後に、前のサブネットワーク(例えばサブネットワーク200A)からの出力を正規化し、正規化された出力へ学習された非線形活性化を適用して次のサブネットワーク(例えばサブネットワーク200B)へのスカッシュされた入力を生成する3Dバッチ正規化層がある。
ディープCNNアーキテクチャー(DCNNA)の例
図6は3D DCNNA600の例の一実施例を示す。概要としては、3D DCNNA600は、前処理層、モジュールサブネットワーク、3Dバッチ正規化(BN)層、および後処理層という、主な3つの部分を有する。他の実施例においては、畳み込み操作は、図6に示すものとは違う順序で、および/または、違うまたはより少ない、または追加のアクションにより実行される。ある実施例においては、複数の畳み込み操作が結合されてもよい。
図6において、3D入力データは最初に、3D畳み込み層を備える前処理層により処理され、その後、1DのMaxプーリング層、その後には2つの3D畳み込み層、最後に1D Maxプーリング層が続く。一層目の3D畳み込み層は64個の1x1x7x7のサイズの3D畳み込みカーネルまたはフィルターを含み、これは、1つの特徴が1x7x7ボクセルで畳み込まれることを示す。続く1D のMaxプーリング層のサイズは1x3x3である。一層目の3D畳み込み層のように、二層目の3D畳み込み層は64個の3D畳み込みカーネルまたはフィルターを含むが、サイズは64x1x7x7である。三層目の3D畳み込み層は192個の、64x1x1x1のサイズの3D畳み込みカーネルまたはフィルターを備える。前処理層の中の最後の層は1Dでサイズ1x3x3のMaxプーリング層である。
図2のサブネットワーク200Aを参照して前述した処理レイアウトおよびパイプラインの後に、3D DCNNA 600が続く。3D DCNNA 600の次の構成要素は、モジュールサブネットワークA、BおよびCである。処理しているデータが3D放射線体積であるため、サブネットワークA、BおよびCの全ては、3D畳み込みカーネルまたはフィルターを伴う3D畳み込み層経路を使用する3Dモジュールである。さらに、サブネットワークA,BおよびCのそれぞれは、入来する代替特徴表現または特徴マップに対して、1x1x1、3x3x3、5x5x5畳み込みである3D畳み込み層経路により処理される前に次元を削減するため、1x1x1畳み込みを使用する1つ以上の次元削減層を含む。さらに、サブネットワークA、BおよびCもまた3D Maxプーリング層を採用し、その出力は、追加の1x1x1次元削減畳み込みによりさらに次元が削減される。最後に、入来する代替特徴表現は、サブネットワークA、BおよびCにおいて、次元削減層およびMaxプーリング層が代替特徴表現に対して並行して動作できるよう、また次元削減層およびMaxプーリングの出力が異なる3D畳み込み層経路において並行して処理されるよう、複数のスケールで処理される。
特に、サブネットワークAは64個の、192x1x1x1のサイズ(1x1x1畳み込み)の、次元削減層として働く3D畳み込みカーネルまたはフィルターを含む。サブネットワークAもまた、入来する特徴マップを並行してマルチスケールで処理する、128個のサイズ96x3x3x3(3x3x3畳み込み)の3D畳み込みカーネルまたはフィルター、および32個の、サイズ16x5x5x5(5x5x5畳み込み)の3D畳み込みカーネルまたはフィルターによる、2つの3D畳み込み層経路を含む。これらの2つの層経路への入力は、96個のサイズ192x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルターによる、また16個のサイズ192x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルターによる、2つの対応する次元削減層によって削減される。3D Maxプーリング層はサイズ3x3x3であり、出力を別の32個のサイズ96x1x3x3の3D畳み込みカーネルまたはフィルターによる3D畳み込み層経路へ受け渡す。64個のサイズ192x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルター、128個のサイズ96x3x3x3(3x3x3畳み込み)の3D畳み込みカーネルまたはフィルターによる2つの3D畳み込み層経路、および32個の、サイズ16x5x5x5(5x5x5畳み込み)の3D畳み込みカーネルまたはフィルター、そして32個のサイズ96x1x3x3の3D畳み込みカーネルまたはフィルターによる3D畳み込み層経路の出力は、256個の特徴へ連結される。
特に、サブネットワークBは128個の、256x1x1x1のサイズ(1x1x1畳み込み)の、次元削減層として働く3D畳み込みカーネルまたはフィルターを含む。サブネットワークBはまた、入来する特徴マップを並行してマルチスケールで処理する、192個のサイズ128x3x3x3(3x3x3畳み込み)の3D畳み込みカーネルまたはフィルター、および96個の、サイズ32x5x5x5(5x5x5畳み込み)の3D畳み込みカーネルまたはフィルターによる、2つの3D畳み込み層経路を含む。これらの2つの層経路への入力は、128個のサイズ256x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルターによる、また32個のサイズ256x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルターによる、2つの対応する次元削減層によって削減される。3D Maxプーリング層は、サイズ3x3x3であり、出力を別の64個のサイズ256x1x3x3の3D畳み込みカーネルまたはフィルターによる3D畳み込み層経路へ受け渡す。128個のサイズ256x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルター、192個のサイズ128x3x3x3(3x3x3畳み込み)の3D畳み込みカーネルまたはフィルターによる2つの3D畳み込み層経路、および96個の、サイズ32x5x5x5(5x5x5畳み込み)の3D畳み込みカーネルまたはフィルター、そして64個のサイズ256x1x3x3の3D畳み込みカーネルまたはフィルターによる3D畳み込み層経路の出力は、480個の特徴を生成するよう連結される。
特に、サブネットワークCは64個の、480x1x1x1のサイズ(1x1x1畳み込み)の、次元削減層として働く3D畳み込みカーネルまたはフィルターを含む。サブネットワークBはまた、入来する特徴マップを並行してマルチスケールで処理する、128個のサイズ96x3x3x3(3x3x3畳み込み)の3D畳み込みカーネルまたはフィルター、および32個の、サイズ16x5x5x5(5x5x5畳み込み)の3D畳み込みカーネルまたはフィルターによる、2つの3D畳み込み層経路を含む。これらの2つの層経路への入力は、96個のサイズ480x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルターによる、また16個のサイズ480x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルターによる、2つの対応する次元削減層によって削減される。3D Maxプーリング層はサイズ3x3x3であり、出力を別の32個のサイズ480x1x3x3の3D畳み込みカーネルまたはフィルターによる3D畳み込み層経路へ受け渡す。64個のサイズ480x1x1x1(1x1x1畳み込み)の3D畳み込みカーネルまたはフィルター、128個のサイズ96x3x3x3(3x3x3畳み込み)の3D畳み込みカーネルまたはフィルターによる2つの3D畳み込み層経路、および32個の、サイズ16x5x5x5(5x5x5畳み込み)の3D畳み込みカーネルまたはフィルター、そして32個のサイズ480x1x3x3の3D畳み込みカーネルまたはフィルターによる3D畳み込み層経路の出力は、連結される。
3D DCNNA600はまた、サブネットワークA、BおよびCの各連結された出力を各次元において正規化および非線形スカッシュの処理対象とするために、各サブネットワークA、BそしてCのすぐ後に3Dバッチ正規化層とともに配置される。後処理層はサイズ1x3x3の1D Maxプーリング層、およびz軸に沿ったMaxプール畳み込みを含む。最後の代替特徴表現のサイズは12544x1であり、さらにサイズ2x1に削減される。
頭蓋内出血(IH)におけるユースケース
図9は、医療用スキャンまたは撮像 902から生成された3D放射線体積に基づいて、3D DCNNAが、人間の脳内の頭蓋内出血(IH)構造の検知に使用されるユースケース900の一実施例を示す。CTスキャン904のような3D放射線体積は、人間の脳のスキャン結果である。機械学習システム110は、人間の脳に関連する1つ以上の型の異常を特定するよう訓練されている。ある実施例では、機械学習システム110は1つの異常を特定するよう訓練されている。ある実施例では、機械学習システム110は1より多い異常を特定するよう訓練されていて、マルチクラスラベリングと呼ばれる。ある実施例では、1より多い異常の特定は、1より多い異常によって訓練された機械学習システム110によって行われる。たとえば、人間の脳の異常は、出血の特定、アルツハイマーにおける斑や繊維化、発作の証拠が含み得る。この例では、機械学習システム110の一実施例が、人間の脳の画像を健康または異常として分類し、頭蓋内出血(IH)、アルツハイマーおよび/または発作などの、どのような型の異常があるかを特定し、結果906を健康サービスプロバイダー908へ転送する。
別の実施例では、機械学習システム110は人間の脳の入力された3D放射線体積を、出血の識別、アルツハイマーの可能性の証拠、または発作の兆候などを含む異常として分類する。ある実施例では、分類の信頼度もまた提供される。ある実施例では、1つより多い分類が、各分類に関連した信頼度とともに提供される。別の実施例では、機械学習システム110は、画像を出血、アルツハイマー、発作、または「正常」、として分類し、このとき「正常」とは、各可能性のある異常および各異常に関連した信頼度を検討した後に適用される診断である。ある実施例では、3D放射線体積は人間の眼についてのものであり、機械学習システム110は人間の眼に関連する1つ以上の型の異常を特定するよう訓練されている。
従って、機械学習システム110は深刻な病状の診断に要する時間を減少させることができ、そのため深刻な病状の患者へよりタイムリーな支援を提供することができる。一実施例では、機械学習システム110は3D放射線体積から診断を提供する。例えば、頭蓋内出血が存在する、などである。一実施例では、機械学習システム110は3D放射線体積から、実際の診断というよりは、兆候を提供する。例えば、3D放射線体積は、腔内の液体、および/または頭蓋外の血液を特定することができ、その両方は頭蓋骨の骨折の兆候である。一実施例では、機械学習システム110は、頭蓋骨の骨折があるか否かの結論を導くことは行わず、画像データから兆候を特定する。別の実施例では、機械学習システム110は、頭蓋骨の骨折があるか否かの結論を、兆候に基づいて導く。一実施例では、機械学習システム110は、兆候と共に、結論の信頼区間も提供する。
ある実施例では、機械学習システム110は、3D放射線体積の解析の結果に基づいた警告を提供する。ある実施例では、機械学習システム110は病状に関連した危険因子を提供する。例えば、一実施例では、機械学習システム110は信頼度評価値を、未来の異常の兆候として、3D医療用画像上に見つかった病状に添付する。
図10は、図7に示された3D入力データ/放射線体積を、3D DCNNAの出力に基づいて、出力の計算に最も寄与した3D入力/放射線体積の特徴を決定するためにバックトラックする処理1000の一実施例を示す。バックトラック1000において、出力の計算に最も寄与した3D入力データの特徴は、図10の個々の青色の脳の画像内に、白色の構造としてハイライトされる。
図11は、3D CNNの、開示されたDCNNAを使用しない実験結果の一実施例を実演するPR曲線1100を示す。PR曲線1100においては、適合率は90%で、再現率は47%である。図12は、3D CNNの、開示されたDCNNAを使用した場合の実験結果の一実施例を実演するPR曲線1200を示す。PR曲線1200においては、適合率は90%で、再現率は47%から50%に上昇した。
プロセス
図13はディープニューラルネットワークにおける3Dデータの畳み込みの代表手法1300である。フローチャート1300は、1つ以上のプロセッサーが情報を受信または引き出し、情報を処理し、結果を記憶し、結果を送信するよう構成された、例えばコンピューターまたは他のデータ処理システムによって、少なくとも部分的には実施することができる。他の実施例においては、図13に示された動作を別の順番で、および/または異なる、またはより少ない、または追加の動作を実行してもよい。ある実施例においては、複数の動作が結合されてもよい。利便性のために、このフローチャートについては方法を実行するシステムを参照して説明する。システムは方法の一部である必要はない。
開示する技術の本章および他の章にて説明する方法は、1つ以上の以下の特徴、および/または開示する追加の方法の中で説明される特徴を含み得る。簡潔性のために、本出願にて開示された特徴の組み合わせは個別に列挙はせず、それぞれ元となる特徴の組に応じて繰り返したりはしない。読者は、本方法にて特定された方法が、システムの概要、3D CNN、3Dデータ/3D放射線体積、サブネットワークモジュール、バッチ正規化、DNCCAの例、IHユースケースなどとして、実施例として特定された元となる特徴の組とどのように容易に組み合わせることができるかを理解するであろう。
図13は動作1300にて開始する、入力放射線体積を特徴づける三次元(3D)データが受信されるプロセス1310を含む。ある実施例では、入力放射線体積は、各点(x、y、z)を別個のボクセル座標(i、j、k)へマップした形をとる、体積による表現である。一実施例では、3D入力データは、固定の占有率または、表面の湾曲グリッド(例えば24x24x24、32x32x32、256x256x256、200x150x150、317x215x254、36x224x224)を設定された、DxDxDボクセルの体積を持つ。3Dデータから抽出された特徴の数は、先頭に追加され、FxDxDxDの形を作る。垂直方向のスライスの数は、従来より各スライス中の2Dピクセルの数よりも少ないものとされ、放射線科医が見る画像の数を管理可能にしている。医療視覚の文脈における一実施例では、3Dの訓練およびテストデータは、医療用スキャンから生成した、人間の臓器の構造の解剖学的3D形状の種類を示す、3D放射線体積である。一実施例では、入力放射線体積は、人間の脳の3Dモデルを表す。さらに別の実施例では、入力放射線体積は、3Dの点群を表す。他の実施例では、他の入力放射線体積の例は、CAD(コンピューター支援設計)モデルを含む。
プロセス1300は動作1320にて継続し、そこでは入力放射線体積を特徴づける3Dデータはディープニューラルネットワークを使用して、入力放射線体積の代替特徴体積表現を生成するために処理される。一実施例では、ディープニューラルネットワークは複数のサブネットワークを備える。一実施例では、サブネットワークは最低から最高へと連続して配置され、ディープニューラルネットワークを使用して入力放射線体積を特徴づけるデータの処理には、その流れの中でデータをサブネットワークを通して処理することが含まれる。一実施例では、最初の3D畳み込み層経路は、入力放射線体積からセミグローバルな特徴を抽出する3x3x3の畳み込みである。一実施例では、2つ目の3D畳み込み層経路は、入力放射線体積からグローバルな特徴を抽出する5x5x5の畳み込みである。一実施例では、3つ目の3D畳み込み層経路は、入力放射線体積からローカルな特徴を抽出する1x1x1の畳み込みである。
動作1330において、3以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、上に議論されたように、連続している中での前のサブネットワークにより生成された前の出力表現を受信するよう構成される。
動作1340において、3以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、上に議論されたように、少なくとも3つの、変化する畳み込み体積の並列な3D畳み込み層経路を通して、前の出力表現を処理するよう構成される。
動作1350において、3以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークはさらに、上に議論されたように、並列3D Maxプーリング経路を通して前の出力表現を処理するよう構成される。
動作1360において、3以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、各モジュールサブネットワークからの出力表現を生成するために、3D畳み込み層経路からの出力と3D Maxプーリング経路を連結するよう構成される。
動作1370において、上に議論されたように、サブネットワークの3D畳み込み層経路の出力表現は3Dバッチ正規化によって状態が調整される。一実施例においては、3Dバッチ正規化は代替特徴体積表現内の各特徴へそれぞれ独立して適用され、バッチごとに適用される。一実施例では、あるバッチ内の代替特徴量表現に対して、3Dバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散を持つ。
動作1380にて、プロセスは、上に議論されたように、正規化された代替特徴体積表現を、ディープニューラルネットワークの訓練が3Dバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、パラメーター化された非線形活性化を通して直ちに処理する。
動作1390において、処理は、上に議論されたように、3以上のモジュールサブネットワークを通してデータを処理することに続いて、最高のモジュールサブネットワークの出力を垂直Maxプーリング層を通して、入力放射線体積から垂直次元が削減された出力を生成するために処理する。
本章において説明した方法の他の実施例は、上に説明された任意の方法を実行するための、プロセッサーにより実行可能な命令を記憶した非一時的なコンピューター可読記憶媒体を含み得る。本章において説明したさらに別の実施例は、上に説明された任意の方法を実行可能であるメモリに記憶された命令を実行可能で、メモリおよび1つ以上のプロセッサーを含むシステムを含み得る。
図14はディープニューラルネットワークにて3Dデータを畳み込む代表手法1400である。フローチャート1400は、1つ以上のプロセッサーが情報を受信または引き出し、情報を処理し、結果を記憶し、結果を送信するよう構成された、例えばコンピューターまたは他のデータ処理システムによって、少なくとも部分的には実施することができる。他の実施例においては、図14に示された動作を別の順番で、および/または異なる、またはより少ない、または追加の動作を実行してもよい。ある実施例においては、複数の動作が結合されてもよい。利便性のために、このフローチャートについては方法を実行するシステムを参照して説明する。システムは方法の一部である必要はない。
開示する技術の本章および他の章にて説明する方法は1つ以上の、以下の特徴、および/または開示する追加の方法の中で説明される特徴を含み得る。簡潔性のために、本出願にて開示された特徴の組み合わせは個別に列挙はせず、各元となる特徴の組に応じて繰り返したりはしない。読者は、本方法にて特定された方法が、システムの概要、3D CNN、3Dデータ/3D放射線体積、サブネットワークモジュール、バッチ正規化、DNCCAの例、IHユースケース、などとして、実施例として特定された元となる特徴の組とどのように容易に組み合わせることができるかを理解するであろう。
図14は、入力放射線体積を特徴づける三次元(3D)データを受信する動作1410にて始まるプロセス1400を含む。ある実施例では、入力放射線体積は、各点(x、y、z)を別個のボクセル座標(i、j、k)へマップした形をとる、体積による表現である。一実施例では、3D入力データは、固定の占有率または、表面の湾曲グリッド(例えば24x24x24、32x32x32、256x256x256、200x150x150、317x215x254、36x224x224)を設定された、DxDxDボクセルの体積を持つ。医療視覚の文脈における一実施例では、3Dの訓練およびテストデータは、医療用スキャンから生成した、人間の臓器の構造の解剖学的3D形状の種類を示す、3D放射線体積である。一実施例では、入力放射線体積は、人間の脳の3Dモデルを表す。さらに別の実施例では、入力放射線体積は、3Dの点群を表す。他の実施例では、他の入力放射線体積の例は、CAD(コンピューター支援設計)モデルを含む。
プロセス1400は動作1420にて継続し、そこでは入力放射線体積を特徴づける3Dデータはディープニューラルネットワークを使用して、入力放射線体積の代替特徴体積表現を生成するために処理される。一実施例では、ディープニューラルネットワークは複数のサブネットワークを備える。一実施例では、サブネットワークは最低から最高へと連続して配置され、ディープニューラルネットワークを使用して入力放射線体積を特徴づけるデータの処理は、その流れの中でデータをサブネットワークを通して処理することを含む。一実施例では、最初の3D畳み込み層経路は、入力放射線体積からセミグローバルな特徴を抽出する3x3x3の畳み込みである。一実施例では、2つ目の3D畳み込み層経路は、入力放射線体積からグローバルな特徴を抽出する5x5x5の畳み込みである。一実施例では、3つ目の3D畳み込み層経路は、入力放射線体積からローカルな特徴を抽出する1x1x1の畳み込みである。
動作1430においては、上に議論されたように、多様な畳み込み体積のうち少なくとも3つの並列3D畳み込み層経路は、前の出力表現を、次元削減層において複数のスケールの畳み込み値によって処理する。
動作1440において、3以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、上に議論されたように、少なくとも3つの、変化する畳み込み体積の並列な3D畳み込み層経路を通して、前の出力表現を処理するよう構成される。
動作1450において、3以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークはさらに、上に議論されたように、並列3D Maxプーリング経路を通して前の出力表現を処理するよう構成される。
動作1460において、3以上のサブネットワークはモジュールサブネットワークであり、各モジュールサブネットワークは、各モジュールサブネットワークからの出力表現を生成するために、3D畳み込み層経路からの出力と3Dプーリング経路を連結するよう構成される。3Dプーリング経路は、最大、最小、または平均のプーリング操作を含む。
動作1470において、上に議論されたように、サブネットワークの3D畳み込み層経路の出力表現は3Dバッチ正規化によって状態が調整される。一実施例においては、3Dバッチ正規化は代替特徴体積表現内の各特徴へそれぞれ独立して適用され、バッチごとに適用される。一実施例では、あるバッチ内の代替特徴量表現に対して、3Dバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散を持つ。
動作1480の処理は、上に議論されたように、正規化された代替特徴体積表現を、ディープニューラルネットワークの訓練が3Dバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、パラメーター化された非線形活性化を通して直ちに処理することを含む。
動作1490の処理は、上に議論されたように、3以上のモジュールサブネットワークを通してデータを処理することに続いて、最高のモジュールサブネットワークの出力を垂直Maxプーリング層を通して、入力放射線体積から垂直次元が削減された出力を生成するために処理することを含む。
本章において説明した方法の他の実施例は、上に説明された任意の方法を実行するための、プロセッサーにより実行可能な命令を記憶した非一時的なコンピューター可読記憶媒体を含み得る。本章において説明したさらに別の実施例は、上に説明された任意の方法を実行可能であるメモリに記憶された命令を実行可能で、メモリおよび1つ以上のプロセッサーを含むシステムを含み得る。
マルチテナント統合
図15は、開示技術の1つ以上の実施例による、図1のシステムと統合することに適したマルチテナントシステムの例のブロック図である。図1のシステム100はマルチテナントシステムを使用して実施され得る。この件に関して、図15は、図1のシステム100と統合することに適したマルチテナントシステムの例の1つ以上の実施例の、概念のブロック図を提示する。
一般的に、図15の図示されたマルチテナントシステム1500は、ここでは代替として「マルチテナントデータベース」と称される複数のテナント間で共有される共通データベース1530からデータ1532に基づいて仮想アプリケーション1528Aおよび1528Bを動的に生成しサポートするサーバー1502を含む。仮想アプリケーション1528Aおよび1528Bによって生成されたデータおよびサービスは、ネットワーク1545を介して、任意の数のクライアント機器1540Aおよび1540Bに、要求に応じて提供される。仮想アプリケーション1528Aおよび1528Bはランタイム(またはオンデマンド)で、マルチテナントシステム1500へ加入した各様々なテナントへデータベース1530内のデータ1532へのセキュアなアクセスを提供する共通アプリケーションプラットフォーム1510を使用して、適切に生成される。1つの非限定例として、マルチテナントシステム1500は、マルチテナントの、任意の数の認証されたユーザーをサポートできる、オンデマンド・マルチテナント顧客管理(CRM)システムの形で実施されている。
ここで使用される「テナント」または「組織」とは、マルチテナントデータベース1530内におけるデータの共通のサブセットへのアクセスを共有する、一人以上のユーザーのグループを指す。関連して、各テナントは、それぞれのテナントに関連付けられた、またはアサインされた、さもなければ属する、一人以上のユーザーを含む。マルチテナントシステム1500内のそれぞれのユーザーは、マルチテナントシステム1500にサポートされる複数のテナントのうち特定のテナントに、関連付けられ、またはアサインされ、さもなければ属している。テナントは、ユーザー、ユーザーの部門、仕事または法律的な組織、および/または、マルチテナントシステム1500内の特定の組のユーザー用のデータを整備するためのその他の要素を表している。複数テナントがサーバー1502およびデータベース1530へのアクセスを共有するが、サーバー1502から各テナントへ提供される特定のデータおよびサービスは、他のテナントへ提供されるものから安全に孤立させることができる。従ってマルチテナントアーキテクチャーは、異なる組のユーザーが、他のテナントに属するかさもなければ関連付いているデータ1532を全く共有せずに、機能やハードウエアリソースを共有することを可能にする。
マルチテナントデータベース1530は、任意の数のテナントに関連付けられたデータ1532を記憶し管理する、任意の種類のレポジトリまたは他のデータ記憶システムである。データベース1530は任意の型の従来のデータベースサーバーハードウエアを使用して実装されてもよい。様々な実施例において、データベース1530はサーバー1502と処理ハードウエアを共有する。他の実施例では、データベース1530は、本明細書において説明する様々な機能を実行するためにサーバー1502と通信する別個の物理的および/または仮想データベースサーバーハードウエアを使用して実装される。ある実施例では、データベース1530は、データベース管理システムまたはデータ1532の特定のサブセットを、仮想アプリケーション1528Aまたは1528Bにより開始されたかさもなければ提供されたクエリに応答して、仮想アプリケーション1528Aまたは1528Bのインスタンスへ引き出しまたは提供するため最適クエリプランを決定することができる他の同等のソフトウエアを含む。マルチテナントデータベース1530は、データをランタイムで、アプリケーションプラットフォーム1510によって生成されたオンデマンド仮想アプリケーション1528Aおよび1528Bに提供する(または提供することができる)ため、マルチテナントデータベース1530は本明細書において、代替としてオンデマンドデータベースとも称される。
実際は、データ1532は、アプリケーションプラットフォーム1510をサポートするために任意の方法で整理され体裁を整えられる。様々な実施例において、データ1532は、セミアモルファス・ヒープ型フォーマットを整備するため、比較的少数の大容量データテーブルへと適切に整理される。データ1532はその後特定の仮想アプリケーション1528Aまたは1528Bからの必要に応じて整理されてもよい。様々な実施例において、従来のデータの関係は、要求に応じて、従来のデータベース組織のインデックス付け、一意性、要素間の関係、および/または他の局面を確立する、任意の数のピボットテーブル1534を使用して確立される。更なるデータ操作およびレポートフォーマットは、一般的には、様々なメタデータ構成を使用してランタイムで行われる。ユニバーサルデータディレクトリ(UDD)内のメタデータ1536は、例えば任意の数のフォーム、レポート、ワークフロー、ユーザーアクセス権、ワークロジックおよび、複数のテナントに共通する他の構成を説明するために使用され得る。テナント特有のフォーマット、機能および他の構成は、要求に応じて、テナント特有のメタデータ1538Aおよび1538Bとして整備されてもよい。データ1532を、無理にテナントやアプリケーションに共通の非柔軟なグローバルな構造をとらせるよりも、データベース1530は、比較的型にはまらないよう、要求に応じて追加の構造を提供するピボットテーブル1534およびメタデータ1538Aと1538Bと共に整理される。そのためにも、アプリケーションプラットフォーム1510は、仮想アプリケーション1528Aと1528Bの「仮想の」構成要素を生成し、またデータベース1530から比較的型にはまらないデータ1532を提示するため、ピボットテーブル1534および/またはメタデータ1538Aと1538Bを適切に使用する。
サーバー1502は、仮想アプリケーション1528Aおよび1528Bを生成するための動的アプリケーションプラットフォーム1510を集合的に提供する、1つ以上の実際および/または仮想の計算システムを使用するよう実装される。例えば、サーバー1502は、典型的には、適宜、従来のネットワーク通信、クラスター管理、負荷バランスおよび他の機能と関連してお互いに併せて動作する、実際のおよび/または仮想のサーバーのクラスターを使用して実装される。サーバー1502は、プロセッサー1505、メモリ1506、入力/出力機能1507などの、任意の種類の従来の処理ハードウエアと共に動作する。入力/出力機能1507は一般的にはネットワークへのインターフェース(例えばネットワーク1545または任意の他のローカルエリア、広域、または他のネットワーク)、大容量記憶装置、ディスプレイ装置、データ入力装置等を表す。プロセッサー1505は、任意の数の「クラウドベースの」またはその他の仮想システムを含む、1つ以上のプロセッサー、制御器、マイクロプロセッサー、マイクロコントローラ、処理コアおよび/または任意の数の分散または統合システム中に広がった他の計算資源などの、任意の適切な処理システムを使用して実装されてもよい。メモリ1506は、任意の種類のランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、フラッシュメモリ、磁気または光学大容量記憶装置等を含む、プロセッサー1505上においてプログラム命令を記憶することができる短期または長期記憶装置または他のコンピューターにより読み取り可能な媒体を表す。コンピューターにより実行可能なプログラム命令は、サーバー1502および/またはプロセッサー1505により読み取られ実行されたとき、サーバー1502および/またはプロセッサー1505がアプリケーションプラットフォーム1510および/または仮想アプリケーション1528Aおよび1528Bを作成、生成、さもなければ促進し、本明細書にて説明される1つ以上の追加タスク、動作、機能、および/または処理を実行する。メモリ1506はコンピューターによって読み取り可能な媒体の1つの適切な実施例を示し、そして、代わりにまたは加えて、サーバー1502は、携帯用ハードドライブ、USBフラッシュドライブ、光学ディスクなどの、持ち運び可能な、または移動可能な構成要素またはアプリケーションプラットフォームとして実現される、外部のコンピューターにより読み取り可能な媒体により受信し協力して動作する。
アプリケーションプラットフォーム1510は、クライアント機器1540Aおよび1540Bへデータおよび/またはサービスを提供する仮想アプリケーション1528Aおよび1528Bを生成する、任意の種類のソフトウエアアプリケーションまたは処理エンジンである。典型的な実施例では、アプリケーションプラットフォーム1510は、任意の種類の従来のまたは占有のオペレーティングシステム1508を使用して、処理ハードウエア1502の処理リソース、通信インターフェースおよび他の機能へのアクセスを獲得する。仮想アプリケーション1528Aおよび1528Bは、典型的には、クライアント機器1540Aおよび1540Bから受信した入力に応答してランタイムで生成される。図示された実施例において、アプリケーションプラットフォーム1510はバルクデータ処理エンジン1512、クエリ生成器1514、テキストインデックスおよび他の検索機能を提供する検索エンジン1516、およびランタイムアプリケーション生成器1520を含む。これらの各機能は別個のプロセスまたは他のモジュールとして実装されてもよく、また同等の実施例においては異なるおよび/または追加の機能、構成要素、または他のモジュールを要求に応じて含んでもよい。
ランタイムアプリケーション生成器1520は、クライアント機器1540Aおよび1540Bからの特定の要求に応じて、仮想アプリケーション1528Aおよび1528Bを、動的にビルドし実行する。仮想アプリケーション1528Aおよび1528Bは典型的には、特定のアプリケーション1528Aおよび1528Bの特定の表、レポート、インターフェースおよび/または他の機能を説明する、テナント特有のメタデータ1538に従って構成される。様々な実施例において、各仮想アプリケーション1528Aおよび1528Bは、クライアント機器1540Aおよび1540Bと関連したブラウザーまたは他のクライアントプログラム1542Aおよび1542Bへ供給されることができる動的ウェブコンテンツを適宜生成する。
ランタイムアプリケーション生成器1520はクエリ生成器1514と適切に相互作用し、クライアント機器1540Aおよび1540Bのユーザーによって開始された、さもなければ提供された入力クエリに応答して、データベース1530から必要に応じてマルチテナントデータ1532を効果的に入手する。典型的な実施例では、クエリ生成器1514は、(ユーザーに関連したテナントと共に)特定の機能を要求したユーザーのアイデンティティを考慮し、その後、ユニバーサルデータディレクトリ(UDD)内のシステムワイドなメタデータ1536、テナント特有のメタデータ1538、ピボットテーブル1534、および/または他の入手可能なリソースを使用してデータベース1530に対してクエリをビルドし実行する。従って、本例の中のクエリ生成器1514は、リクエストを開始したユーザーおよび/またはテナントのアクセス権とクエリが一貫していることを保証することで、共通データベース1530のセキュリティを維持する。このように、クエリ生成器1514は、要求を行ったユーザーおよび/またはテナントのための表、レポート、または仮想アプリケーション1528Aまたは1528Bの他の機能の内容物とするために、そのユーザーおよび/またはテナントからアクセス可能なデータ1532のサブセットをデータベース1530から安定して得る。
図15をいまだに参照し、データ処理エンジン1512は、データ1532に対して、アップロードやダウンロード、アップデート、オンライントランザクション処理等、などのバルク処理動作を行う。多くの実施例では、データ1532に対するより緊急でない処理は処理リソースが入手可能になった時点で起こるようにスケジュールし、その結果、クエリ生成器1514、検索エンジン1516、仮想アプリケーション1528Aおよび1528B等のようなより緊急なデータ処理に優先度が割り当てられるようにしてもよい。
実施例では、アプリケーションプラットフォーム1510は、サポートするテナントのためのデータ駆動仮想アプリケーション1528Aおよび1528Bを作成および/または生成することに使用される。このような仮想アプリケーション1528Aおよび1528Bは、カスタム(またはテナント特有)の画面1524、標準(またはユニバーサルな)画面1522等、のようなインターフェース機能を利用する。任意の数のカスタムおよび/または標準オブジェクト1526は、テナント上で開発された仮想アプリケーション1528Aおよび1528Bへの統合のために入手可能である。本明細書において使用される「カスタム」は各オブジェクトまたはアプリケーションがテナント特有(例えばマルチテナント中の特定のテナントに関連付けられたユーザーのみが利用可能)またはユーザー特有(例えばマルチテントシステム中の特定のユーザーのサブセットにとって利用可能)であることを意味し、一方「標準」または「ユニバーサル」アプリケーションはマルチテナントシステム中の複数のテナントにとって利用可能である。各仮想アプリケーション1528Aおよび1528Bに関連したデータ1532はデータベース1530へ適宜提供され、要求されるかまたは必要となるまで、特定の仮想アプリケーション1528Aおよび1528Bの特定の機能(例えばレポート、表、機能、オブジェクト、フィールド、数式、コード等)を説明するメタデータ1538と共に記憶される。例えば、仮想アプリケーション1528Aおよび1528Bはテナントへアクセスできる複数のオブジェクト1526を含み、テナントへアクセスできる各オブジェクト1526に対して、各オブジェクトの型に関連した様々なフィールドの値と共に、オブジェクトの型に関係のある情報がデータベース1530内のメタデータ1538として維持される。関連して、オブジェクトの型は、各オブジェクト1526の構造(例えばフォーマット、機能および他の構成)、および関連した様々なフィールドを定義する。
引き続き図15を参照して、サーバー1502から提供されたデータおよびサービスは、ネットワーク1545上の、任意の種類のパーソナルコンピューター、携帯電話、タブレットおよびネットワーク接続可能なクライアント機器1540Aまたは1540Bを使用して引き出すことができる。実施例では、クライアント機器1540Aおよび1540Bは、マルチテナントデータベース1530から引き出されたデータおよび/または情報を図表によって提示可能なモニター、スクリーン、または従来の電気的ディスプレイなどのディスプレイ機器を含む。典型的には、ユーザーは、サーバー1502とネットワーク1545を介して、ハイパーテキスト転送プロトコル(HTTP)などのネットワークプロトコルを使用して接触するために、クライアント機器1540Aおよび1540Bによって実行された従来のブラウザーアプリケーションまたは他のクライアントプログラム1542を操作する。典型的にはユーザーはサーバー1502へ彼または彼女自身のアイデンティティを認証して、サーバー1502と続いて起こる通信においてユーザーを特定するセッション識別子(「セッションID」)を得る。特定されたユーザーガ仮想アプリケーション1528Aオヨビ1528Bヘノアクセスを要求すると、ランタイムアプリケーション生成器1520は、メタデータ1538に基づいてランタイムデアプリケーションを適宜、適切に作成する。上述されたように、仮想アプリケーション1528Aまたは1528BはJava、ActiveX、または他の、クライアント機器1540Aまたは1540B状で実行されている従来のクライアントソフトウエアを使用して提示され得る内容を含んでもよく、他の実施例においては単に、ユーザーによって提示され閲覧される、動的ウェブまたは他の内容を提供してもよい。
上述の説明は、説明を目的としたものであり、対象または応用の実装、およびそのような実装の用途を限定することを目的とするものではない。さらに、技術分野、背景、または詳細な説明にて提示された、表現または含意された理論に制約する意図はない。本明細書中で使用されるように、「例の」という言葉は「例、実例、説明として働く」ということを意味する。本明細書中で説明されたいかなる実施例は、他の実施例よりも好ましく有利であると解釈される必要はなく、本明細書中で説明された実施例は対象または応用性をいかなる方法においても限定しようとする意図はない。
簡潔さのために、データベース、ソーシャルネットワーク、ユーザーインターフェース、およびシステムの他の機能的側面(およびシステムの各動作構成要素)に関連する従来の技術は本明細書中にて詳細には説明しない。加えて、実装は任意の数のシステムおよび/またはネットワークアーキテクチャー、データ転送プロトコル、および機器構成と共に実施されてもよく、そして本明細書において説明されたシステムは1つの適切な例に過ぎないことを、当業者は理解するであろう。さらに、本明細書において特定の用語は参照用途のみとして使用されており、従って限定する意図はない。例えば、用語「第一の」「第二の」およびこのような他の数字を含む用語は、文脈において明確に示されない限り、順序や順番を含意するものではない。
本明細書中で機能および/または論理ブロック構成要素の観点から、および動作、処理タスク、および機能の記号表現を参照して説明される対象の実装は、様々な計算構成要素または装置により実行され得る。このような動作、タスク、および機能は、コンピューターにより実行される、コンピューターで処理される、ソフトウエアに実装される、またはコンピューターに実装されるものとして言及される。実際は、他の処理信号と同じように、データのビットを表現する電気信号を、1つ以上の処理システムまたは機器により、アクセス可能なメモリロケーションにて操作することにより、説明された動作、タスク、および機能を実行できる。データビットが維持されるメモリロケーションは、データビットに対応する特定の電気的、磁気的、光学的、または有機プロパティを持つ物理的ロケーションである。図に示される様々なブロック構成要素は任意の数のハードウエア、ソフトウエア、および/またはファームウエア構成要素によって実現されることが理解されるであろう。例えば、システムまたは構成要素の実装は、例えばメモリ要素、デジタル信号処理要素、論理要素、ルックアップテーブル等の、1つ以上のマイクロプロセッサーまたは他の制御装置により様々な機能を実行する、様々な集積回路を採用してもよい。ソフトウエアまたはファームウエア中に実装される場合は、本明細書中で説明されるシステムの様々な要素は、本質的には、様々なタスクを実行するコードセグメントまたは命令である。プログラムまたはコードセグメントはプロセッサーによって読み取り可能な媒体に記憶され、または通信媒体または通信経路上を搬送波に盛り込まれたコンピューターデータ信号により送信される。「プロセッサーによって読み取り可能な媒体」または「機械によって読み取り可能な媒体」は情報を記憶または送信できる任意の媒体を含み得る。プロセッサーによって読み取り可能な媒体の例は、電子回路、半導体メモリ装置、ROM、フラッシュメモリ、消去可能ROM(EROM)、フロッピーディスク、CD−ROM、光ファイバー媒体、無線周波数(RF)リンク等を含み得る。コンピューターデータ信号は、電子ネットワークチャネル、光ファイバー、大気、電磁路、またはRFリンクのような送信媒体上を伝播することができる任意の信号を含み得る。コードセグメントはインターネット、イントラネット、LAN等のコンピューターネットワークを介してダウンロードされ得る。関連して、本明細書において説明された対象は任意のコンピューターに実装されたシステムおよび/または協調し互いに通信する2つ以上の独立し異なるコンピューターに実装されたシステムにおいて実施され得る。1つ以上の実施例において、本明細書において説明された対象は仮想ユーザー関係管理(CRM)アプリケーションと併せてマルチテナント環境内で実施され得る。
上に参照された任意のデータ構造およびコードは、多数の実施例によれば、コンピューターシステムが利用するためのコードおよび/またはデータを記憶可能な任意の装置または媒体であり得る、コンピューター可読記憶媒体に記憶される。これは、揮発性メモリ、不揮発性メモリ、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、ディスクドライブ、磁気テープ、CD(コンパクトディスク)、DVD(デジタル多目的ディスクまたはデジタルビデオディスク)のような磁気および光学記憶装置、または現在既知のまたは後に開発されたコンピューターによって読み取り可能な媒体を格納可能な他の媒体を、限定せず含む。
前述の説明は、開示された技術を作成し利用する事を可能にするために提示された。開示された実施例の様々な変更が今後明らかになるが、本明細書中で定義された原則は、他の実施例そして開示された技術の精神と要旨から逸脱しない応用例へ適用されてもよい。従って、開示された技術は示された実施例に限定する意図はなく、本明細書中で開示された原理および機能と整合する最も広い範囲で認められるべきである。開示される技術の範囲は添付した特許請求の範囲により定義される。
いくつかの態様を記載しておく。
〔態様1〕
ディープニューラルネットワークにおいて三次元(3D)データを畳み込む方法であって、前記方法は、
入力放射線体積を特徴づける三次元(3D)データを受信することと、
前記入力放射線体積を特徴づける前記3Dデータを、ディープニューラルネットワークを使用して処理して、前記入力放射線体積の代替特徴体積表現を生成することであって、前記ディープニューラルネットワークは複数のサブネットワークを含み、前記サブネットワークは最低から最高まで連続で配置され、前記ディープニューラルネットワークを使用した前記入力放射線体積を特徴づける前記データを処理することは、前記連続の中における前記サブネットワークのそれぞれを通して前記データを処理することを備え、
前記サブネットワークのうち3つ以上はモジュールサブネットワークであり、各前記モジュールサブネットワークは、
前記連続の中における前のサブネットワークにより生成された前の出力表現を受信し、
様々な畳み込み体積の少なくとも3つの並列3D畳み込み層経路を通して前記前の出力表現を処理し、
前記前の出力表現を並列3D Maxプーリング経路を通してさらに処理し、
前記3D畳み込み層経路および前記3D Maxプーリング経路の出力を連結して各前記モジュールサブネットワークからの出力表現を生成する
よう構成される、ことと、
前記3つ以上のモジュールサブネットワークを通して前記データを処理することに続いて、最高の前記モジュールサブネットワークの出力を垂直Maxプーリング層を通して処理し、前記入力放射線体積から削減された垂直次元の出力を生成することと、
を含む、方法。
〔態様2〕
最初の3D畳み込み層経路は、前記入力放射線体積からセミグローバルな特徴を抽出する3x3の畳み込みである、態様1に記載の方法。
〔態様3〕
2つ目の3D畳み込み層経路は、前記入力放射線体積からグローバルな特徴を抽出する5x5の畳み込みである、態様1に記載の方法。
〔態様4〕
3つ目の3D畳み込み層経路は、前記入力放射線体積からローカルな特徴を抽出する1x1の畳み込みである、態様1に記載の方法。
〔態様5〕
前記入力放射線体積は医療用スキャンから生成した、人間の内蔵の構造の、3Dの解剖学的形状のバリエーションを示す、態様1に記載の方法。
〔態様6〕
前記入力放射線体積は3Dモデルデータを表す、態様1に記載の方法。
〔態様7〕
前記入力放射線体積はCAD(コンピューター支援設計)のモデルデータを表す、態様1に記載の方法。
〔態様8〕
前記入力放射線体積は3Dの点群を表す、態様1に記載の方法。
〔態様9〕
前記サブネットワークの3D畳み込み層経路の前記出力表現を3Dバッチ正規化によって状態を調整することであって、
前記3Dバッチ正規化は、前記代替特徴体積表現内の各特徴へ独立して適用され、バッチごとに適用され、
あるバッチ内の前記代替特徴量表現に対して、前記3Dバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散とを持つ、こと
をさらに含む態様1に記載の方法。
〔態様10〕
前記正規化された代替特徴体積表現を、パラメーター化された非線形活性化を通して、前記ディープニューラルネットワークの訓練が前記3Dバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、直ちに処理すること、をさらに含む態様9に記載の方法。
〔態様11〕
ディープニューラルネットワークにおいて三次元(3D)データを畳み込む方法であって、前記方法は、
入力放射線体積を特徴づける三次元(3D)データを受信することと、
前記入力放射線体積を特徴づける前記3Dデータを、ディープニューラルネットワークを使用して処理して、前記入力放射線体積の代替特徴体積表現を生成することであって、前記ディープニューラルネットワークは複数のサブネットワークを含み、前記サブネットワークは最低から最高まで連続で配置され、前記ディープニューラルネットワークを使用した前記入力放射線体積を特徴づける前記データを処理することは、前記連続の中における前記サブネットワークのそれぞれを通して前記データを処理することを備え、
前記サブネットワークのうち3つ以上はモジュールサブネットワークであり、各前記モジュールサブネットワークは、
前記連続の中における前のサブネットワークにより生成された前の出力表現を受信し、
様々な畳み込み体積の少なくとも3つの並列3D畳み込み層経路に対して、次元削減層において複数のスケールの畳み込み値によって前記前の出力表現を処理し、
さらに前記前の出力表現を並列3Dプーリング経路によって処理し、
前記3D畳み込み層経路および前記3Dプーリング経路の出力を連結して各前記モジュールサブネットワークからの出力表現を生成する
よう構成される、ことと、
前記3以上のモジュールサブネットワークを通して前記データを処理することに続いて、最高の前記モジュールサブネットワークの出力を垂直プーリング層を通して処理し、前記入力放射線体積から削減された垂直次元の出力を生成することと、
を含む、方法。
〔態様12〕
最初の3D畳み込み層経路は、前記入力放射線体積からセミグローバルな特徴を抽出する3x3の畳み込みである、態様11に記載の方法。
〔態様13〕
2つ目の3D畳み込み層経路は、前記入力放射線体積からグローバルな特徴を抽出する5x5の畳み込みである、態様11に記載の方法。
〔態様14〕
前記次元削減層は、前記入力放射線体積からローカルな特徴を抽出する1x1の畳み込みである、態様11に記載の方法。
〔態様15〕
前記サブネットワークによる処理に先立ち、前記入力放射線体積に対して、1つ以上の予備の3Dおよび/または2D畳み込みを適用すること、をさらに含む態様11に記載の方法。
〔態様16〕
前記サブネットワークによる処理に先立ち、前記入力放射線体積に対して、1つ以上の予備の3Dおよび/または2Dプーリング操作を適用すること、をさらに含む態様11に記載の方法。
〔態様17〕
前記サブネットワークによる処理の後に、前記入力放射線体積に対して、1つ以上の後処理の3Dおよび/または2D畳み込みを適用すること、をさらに含む態様11に記載の方法。
〔態様18〕
前記サブネットワークによる処理の後に、前記入力放射線体積に対して、1つ以上の後処理の3Dおよび/または2Dプーリング操作を適用すること、をさらに含む態様11に記載の方法。
〔態様19〕
前記サブネットワークの3D畳み込み層経路の前記出力表現を3Dバッチ正規化によって状態を調整することであって、
前記3Dバッチ正規化は、前記代替特徴体積表現内の各特徴へ独立して適用され、バッチごとに適用され、
あるバッチ内の前記代替特徴量表現に対して、前記3Dバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替特徴体積表現は、画像データ量にゼロ平均と単位分散とを持つ、こと
をさらに含む態様11に記載の方法。
〔態様20〕
前記正規化された代替特徴体積表現を、パラメーター化された非線形活性化を通して、前記ディープニューラルネットワークの訓練が前記3Dバッチ正規化を減殺できるような学習可能なスケール変更およびシフトパラメーターによって、直ちに処理すること、をさらに含む態様19に記載の方法。
〔態様21〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様1の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様22〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様9の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様23〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様10の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様24〕
コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記命令は、プロセッサー上で実行されたとき、態様11の方法を実行する、非一時的なコンピューター可読記憶媒体。
〔態様25〕
メモリに接続された1つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様1の動作を実行する、システム。
〔態様26〕
メモリに接続された1つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様9の動作を実行する、システム。
〔態様27〕
メモリに接続された1つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様10の動作を実行する、システム。
〔態様28〕
メモリに接続された1つ以上のプロセッサーを含むシステムであって、前記メモリにはコンピューター命令が搭載されており、前記命令は前記プロセッサー上で実行されたとき、態様11の動作を実行する、システム。

Claims (18)

  1. ニューラルネットワークにおいて三次元(3D)データを分類するコンピューター実行方法であって、前記コンピューター実行方法は、
    入力放射線体積を特徴づける三次元(3D)データを受信することと、
    前記入力放射線体積を特徴づける前記3Dデータを、前記ニューラルネットワークを使用して処理することであって、前記ニューラルネットワークは複数のサブネットワークを含み、前記サブネットワークは最低レベルの特徴検出器から最高レベルの特徴検出器まで連続で配置され、前記ニューラルネットワークを使用した前記3Dデータを処理することは、前記連続の中における前記サブネットワークのそれぞれを通して前記3Dデータを処理することを備え、
    前記サブネットワークのそれぞれは、
    前記連続の中における前のサブネットワークにより生成された前の出力表現を受信し、
    様々な畳み込み体積の複数の並列3D畳み込み層経路を通して前記前の出力表現を処理し、
    前記前の出力表現を並列プーリング経路を通してさらに処理し、
    前記複数の並列3D畳み込み層経路および前記並列プーリング経路の出力を連結して各前記サブネットワークからの出力表現を生成する
    よう構成される、ことと、
    前記サブネットワークを通して前記3Dデータを処理することに続いて、前記サブネットワークの最高レベルの特徴検出器の出力をプーリング層および少なくとも一つの次元削減層を通して処理し、前記入力放射線体積の次元より削減された次元をもつ出力を生成することと、
    前記受信した3Dデータを、前記削減された次元をもつ前記出力に基づいて分類することと、 を含む、コンピューター実行方法。
  2. 最初の3D畳み込み層経路は、前記3Dデータからセミグローバルな特徴を抽出する3x3x3の畳み込みである、請求項1に記載のコンピューター実行方法。
  3. 2つ目の3D畳み込み層経路は、前記3Dデータからグローバルな特徴を抽出する5x5x5の畳み込みである、請求項1または2に記載のコンピューター実行方法。
  4. 3つ目の3D畳み込み層経路は、前記3Dデータからローカルな特徴を抽出する1x1x1の畳み込みである、請求項1ないし3のうちいずれか一項に記載のコンピューター実行方法。
  5. 前記3Dデータは3Dモデルデータ;コンピューター支援設計のモデルデータ;または3Dの点群を表す、請求項1ないし4のうちいずれか一項に記載のコンピューター実行方法。
  6. 前記サブネットワークの複数の並列3D畳み込み層経路の前記出力表現を3Dバッチ正規化によって状態を調整することであって、
    前記3Dバッチ正規化は、前記ニューラルネットワークによって生成される代替的な特徴体積表現の各特徴へ独立して適用され、バッチごとに適用され、
    あるバッチ内の前記代替的な特徴体積表現に対して、前記3Dバッチ正規化により画像データ量のスケール変更およびシフトが行われ、正規化された代替的な特徴体積表現は、画像データ量のゼロ平均と単位分散とを持つ、こと
    をさらに含む請求項1ないし5のうちいずれか一項に記載のコンピューター実行方法。
  7. 前記正規化された代替的な特徴体積表現を、学習可能なスケール変更およびシフトパラメーターをもつパラメーター化された非線形活性化を通して直ちに処理することをさらに含み、それによる前記ニューラルネットワークの訓練が前記3Dバッチ正規化を減殺できる、請求項6に記載のコンピューター実行方法。
  8. 前記並列プーリング経路がMaxプーリング経路であり、前記プーリング層がMaxプーリング層である、請求項1ないし7のうちいずれか一項に記載のコンピューター実行方法。
  9. ニューラルネットワークであって、当該ニューラルネットワークは:
    3Dデータを受信する前処理ネットワークと、
    連続で配置された複数のサブネットワークであって、前記複数のサブネットワークは前記前処理ネットワークからの出力を受け取る第一のサブネットワークと、前記複数のサブネットワークにおける前のサブネットワークからの出力を受け取る第二のサブネットワークとを含み、
    前記第一のサブネットワークは:
    前記前処理ネットワークからの出力を様々な畳み込み体積に基づいて処理するための複数の第一の3D畳み込み層経路と;
    前記複数の第一の3D畳み込み層経路と並列に前記前処理ネットワークからの出力を処理するための第一のプーリング経路と;
    前記複数の第一の3D畳み込み層経路および前記第一のプーリング経路からの出力を連結するための第一の連結ネットワークとを有しており、
    前記第二のサブネットワークは:
    前記前のサブネットワークからの出力を様々な畳み込み体積に基づいて処理するための複数の第二の3D畳み込み層経路と;
    前記複数の第二の3D畳み込み層経路と並列に前記前のサブネットワークからの出力を処理するための第二のプーリング経路と;
    前記複数の第二の3D畳み込み層経路および前記第二のプーリング経路からの出力を連結するための第二の連結ネットワークとを有しており、
    当該ニューラルネットワークはさらに、
    前記第二のサブネットワークの出力を処理して、前記3Dデータの次元より削減された次元をもつ出力を生成するためのプーリング層および少なくとも一つの次元削減層と;
    前記3Dデータを、前記プーリング層の出力に基づいて分類するための分類器と、
    を有する、ニューラルネットワーク。
  10. 前記第一のプーリング経路がMaxプーリング経路であり、前記プーリング層がMaxプーリング層である、請求項9に記載のニューラルネットワーク。
  11. 前記第一の3D畳み込み層経路のうちの第一のものが、前記3Dデータからセミグローバルな特徴を抽出する3x3x3の畳み込みである、請求項9または10に記載のニューラルネットワーク。
  12. 前記第一の3D畳み込み層経路のうちの第二のものが、前記3Dデータからグローバルな特徴を抽出する5x5x5の畳み込みである、請求項9ないし11のうちいずれか一項に記載のニューラルネットワーク。
  13. 前記第一の3D畳み込み層経路のうちの第三のものが、前記3Dデータからローカルな特徴を抽出する1x1x1の畳み込みである、請求項9ないし12のうちいずれか一項に記載のニューラルネットワーク。
  14. 前記3Dデータは医療スキャンデータ;コンピューター支援設計(CAD)のモデルデータ;または3Dの点群を表す、請求項9ないし13のうちいずれか一項に記載のニューラルネットワーク。
  15. 前記第二のサブネットワークの出力を、前記プーリング層に提供する前に、バッチ正規化によって状態を調整するためのバッチ正規化層をさらに含み、
    前記バッチ正規化層は、当該ニューラルネットワークによって生成される代替的な特徴体積表現の各特徴へ独立して適用され、バッチごとに適用され、
    あるバッチ内の前記代替的な特徴体積表現に対して、前記バッチ正規化層は、正規化された代替的な特徴体積表現が画像データ値のゼロ平均および単位分散を持つよう、画像データ値のスケール変更およびシフトを行う、
    請求項9ないし14のうちいずれか一項に記載のニューラルネットワーク。
  16. 前記正規化された代替的な特徴体積表現を処理するための、学習可能なスケール変更およびシフトパラメーターをもつパラメーター化された非線形活性化層をさらに有しており、前記非線形活性化層の訓練前記バッチ正規化を減殺できる、請求項15に記載のニューラルネットワーク。
  17. 前記前処理ネットワークが、一つまたは複数の3D畳み込み層および一つまたは複数のMaxプーリング層を有する、請求項9ないし15のうちいずれか一項に記載のニューラルネットワーク。
  18. コンピュータープログラム命令を記録した非一時的なコンピューター可読記憶媒体であって、前記コンピュータープログラム命令は、プロセッサー上で実行されたとき、請求項1ないし8のうちいずれか一項に記載のコンピューター実行方法を実行する、非一時的なコンピューター可読記憶媒体。
JP2018228657A 2015-08-15 2018-12-06 3dバッチ正規化を伴う三次元(3d)畳み込み Active JP6838038B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562205718P 2015-08-15 2015-08-15
US62/205,718 2015-08-15

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018511134A Division JP6450053B2 (ja) 2015-08-15 2016-08-15 3dバッチ正規化を伴う三次元(3d)畳み込み

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021019668A Division JP7094407B2 (ja) 2015-08-15 2021-02-10 3dバッチ正規化を伴う三次元(3d)畳み込み

Publications (2)

Publication Number Publication Date
JP2019061710A JP2019061710A (ja) 2019-04-18
JP6838038B2 true JP6838038B2 (ja) 2021-03-03

Family

ID=56802697

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2018511134A Active JP6450053B2 (ja) 2015-08-15 2016-08-15 3dバッチ正規化を伴う三次元(3d)畳み込み
JP2018228657A Active JP6838038B2 (ja) 2015-08-15 2018-12-06 3dバッチ正規化を伴う三次元(3d)畳み込み
JP2021019668A Active JP7094407B2 (ja) 2015-08-15 2021-02-10 3dバッチ正規化を伴う三次元(3d)畳み込み

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018511134A Active JP6450053B2 (ja) 2015-08-15 2016-08-15 3dバッチ正規化を伴う三次元(3d)畳み込み

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021019668A Active JP7094407B2 (ja) 2015-08-15 2021-02-10 3dバッチ正規化を伴う三次元(3d)畳み込み

Country Status (7)

Country Link
US (2) US10282663B2 (ja)
EP (2) EP3582151A1 (ja)
JP (3) JP6450053B2 (ja)
CN (2) CN108140141B (ja)
AU (2) AU2016308097B2 (ja)
CA (1) CA2994713C (ja)
WO (1) WO2017031088A1 (ja)

Families Citing this family (229)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10331852B2 (en) 2014-01-17 2019-06-25 Arterys Inc. Medical imaging and efficient sharing of medical imaging information
EP3767630A1 (en) 2014-01-17 2021-01-20 Arterys Inc. Methods for four dimensional (4d) flow magnetic resonance imaging
JP6706788B2 (ja) * 2015-03-06 2020-06-10 パナソニックIpマネジメント株式会社 画像認識方法、画像認識装置およびプログラム
US11113598B2 (en) 2015-06-01 2021-09-07 Salesforce.Com, Inc. Dynamic memory network
EP3380859A4 (en) 2015-11-29 2019-07-31 Arterys Inc. AUTOMATED SEGMENTATION OF CARDIAC VOLUME
JP7110098B2 (ja) * 2015-12-18 2022-08-01 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 頭部コンピュータ断層撮影における緊急性の特徴の解釈及び定量化
US10853449B1 (en) 2016-01-05 2020-12-01 Deepradiology, Inc. Report formatting for automated or assisted analysis of medical imaging data and medical diagnosis
US11237528B2 (en) * 2016-02-16 2022-02-01 Ademco Inc. System and method for handing off the configuration of a building device from a contractor to a customer using a hang tag or the like
US10565493B2 (en) 2016-09-22 2020-02-18 Salesforce.Com, Inc. Pointer sentinel mixture architecture
GB2555136A (en) * 2016-10-21 2018-04-25 Nokia Technologies Oy A method for analysing media content
US10839284B2 (en) 2016-11-03 2020-11-17 Salesforce.Com, Inc. Joint many-task neural network model for multiple natural language processing (NLP) tasks
US10963782B2 (en) 2016-11-04 2021-03-30 Salesforce.Com, Inc. Dynamic coattention network for question answering
US20180129937A1 (en) 2016-11-04 2018-05-10 Salesforce.Com, Inc. Quasi-recurrent neural network
US10565305B2 (en) 2016-11-18 2020-02-18 Salesforce.Com, Inc. Adaptive attention model for image captioning
EP3573520A4 (en) 2017-01-27 2020-11-04 Arterys Inc. AUTOMATED SEGMENTATION USING FULLY CONVOLUTIVE NETWORKS
KR101902883B1 (ko) 2017-02-22 2018-10-01 연세대학교 산학협력단 컴퓨터 단층촬영 영상에서 플라크를 분석하기 위한 방법 및 장치
US11164308B2 (en) * 2017-02-27 2021-11-02 The Regents Of The University Of California System and method for improved medical images
US11308391B2 (en) * 2017-03-06 2022-04-19 Baidu Usa Llc Offline combination of convolutional/deconvolutional and batch-norm layers of convolutional neural network models for autonomous driving vehicles
US10896367B2 (en) * 2017-03-07 2021-01-19 Google Llc Depth concatenation using a matrix computation unit
US11250311B2 (en) 2017-03-15 2022-02-15 Salesforce.Com, Inc. Deep neural network-based decision network
US11468318B2 (en) * 2017-03-17 2022-10-11 Portland State University Frame interpolation via adaptive convolution and adaptive separable convolution
US12089977B2 (en) 2017-03-24 2024-09-17 Pie Medical Imaging B.V. Method and system for assessing vessel obstruction based on machine learning
US10475214B2 (en) * 2017-04-05 2019-11-12 General Electric Company Tomographic reconstruction based on deep learning
JP2018175227A (ja) 2017-04-10 2018-11-15 富士フイルム株式会社 医用画像表示装置、方法およびプログラム
US10565318B2 (en) 2017-04-14 2020-02-18 Salesforce.Com, Inc. Neural machine translation with latent tree attention
EP3616120B1 (en) 2017-04-27 2024-09-04 Retinascan Limited System and method for automated funduscopic image analysis
CN108805261B (zh) * 2017-04-28 2021-11-12 微软技术许可有限责任公司 基于八叉树的卷积神经网络
CN107194559B (zh) * 2017-05-12 2020-06-05 杭州电子科技大学 一种基于三维卷积神经网络的工作流识别方法
US11386327B2 (en) 2017-05-18 2022-07-12 Salesforce.Com, Inc. Block-diagonal hessian-free optimization for recurrent and convolutional neural networks
US10817650B2 (en) 2017-05-19 2020-10-27 Salesforce.Com, Inc. Natural language processing using context specific word vectors
CN107133496B (zh) * 2017-05-19 2020-08-25 浙江工业大学 基于流形学习与闭环深度卷积双网络模型的基因特征提取方法
CN107067043B (zh) * 2017-05-25 2020-07-24 哈尔滨工业大学 一种农作物病虫害检测方法
CN107392097B (zh) * 2017-06-15 2020-07-07 中山大学 一种单目彩色视频的三维人体关节点定位方法
WO2019004350A1 (ja) * 2017-06-29 2019-01-03 株式会社 Preferred Networks データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法
JP2020525258A (ja) * 2017-06-30 2020-08-27 プロマトン・ホールディング・ベー・フェー 深層学習法を使用する3d歯顎顔面構造の分類および3dモデリング
EP3432263B1 (en) * 2017-07-17 2020-09-16 Siemens Healthcare GmbH Semantic segmentation for cancer detection in digital breast tomosynthesis
US10706534B2 (en) * 2017-07-26 2020-07-07 Scott Anderson Middlebrooks Method and apparatus for classifying a data point in imaging data
CN108022238B (zh) * 2017-08-09 2020-07-03 深圳科亚医疗科技有限公司 对3d图像中对象进行检测的方法、计算机存储介质和系统
US11514661B2 (en) * 2017-08-21 2022-11-29 Nokia Technologies Oy Method, system and apparatus for pattern recognition
US11373750B2 (en) * 2017-09-08 2022-06-28 The General Hospital Corporation Systems and methods for brain hemorrhage classification in medical images using an artificial intelligence network
US10692602B1 (en) * 2017-09-18 2020-06-23 Deeptradiology, Inc. Structuring free text medical reports with forced taxonomies
US10499857B1 (en) 2017-09-19 2019-12-10 Deepradiology Inc. Medical protocol change in real-time imaging
US10496884B1 (en) 2017-09-19 2019-12-03 Deepradiology Inc. Transformation of textbook information
US10482337B2 (en) * 2017-09-29 2019-11-19 Infineon Technologies Ag Accelerating convolutional neural network computation throughput
EP3462373A1 (en) 2017-10-02 2019-04-03 Promaton Holding B.V. Automated classification and taxonomy of 3d teeth data using deep learning methods
US11087211B2 (en) * 2017-10-05 2021-08-10 Salesforce.Com, Inc. Convolutional neural network (CNN)-based suggestions for anomaly input
US10803984B2 (en) 2017-10-06 2020-10-13 Canon Medical Systems Corporation Medical image processing apparatus and medical image processing system
US10635813B2 (en) 2017-10-06 2020-04-28 Sophos Limited Methods and apparatus for using machine learning on multiple file fragments to identify malware
US11517197B2 (en) 2017-10-06 2022-12-06 Canon Medical Systems Corporation Apparatus and method for medical image reconstruction using deep learning for computed tomography (CT) image noise and artifacts reduction
BR112020007105A2 (pt) * 2017-10-09 2020-09-24 The Board Of Trustees Of The Leland Stanford Junior University método para treinar um dispositivo de diagnóstico por imagem para realizar uma imagem para diagnóstico médico com uma dose reduzida de agente de contraste
US10083375B1 (en) * 2017-10-13 2018-09-25 StradVision, Inc. Method and device for performing activation and convolution operation at the same time and learning method and learning device for the same
US10049323B1 (en) * 2017-10-13 2018-08-14 StradVision, Inc. Method and device for performing activation and convolution operation at the same time and learning method and learning device for the same
CN109684901B (zh) * 2017-10-19 2023-06-06 富士通株式会社 图像处理装置和图像处理方法
EP3699863A4 (en) * 2017-10-24 2020-10-14 Toru Nagasaka IMAGE INTERPRETATION DEVICE
US11170287B2 (en) 2017-10-27 2021-11-09 Salesforce.Com, Inc. Generating dual sequence inferences using a neural network model
US10573295B2 (en) 2017-10-27 2020-02-25 Salesforce.Com, Inc. End-to-end speech recognition with policy learning
US11604956B2 (en) 2017-10-27 2023-03-14 Salesforce.Com, Inc. Sequence-to-sequence prediction using a neural network model
US11562287B2 (en) 2017-10-27 2023-01-24 Salesforce.Com, Inc. Hierarchical and interpretable skill acquisition in multi-task reinforcement learning
US10592767B2 (en) 2017-10-27 2020-03-17 Salesforce.Com, Inc. Interpretable counting in visual question answering
US11928600B2 (en) 2017-10-27 2024-03-12 Salesforce, Inc. Sequence-to-sequence prediction using a neural network model
US10783640B2 (en) * 2017-10-30 2020-09-22 Beijing Keya Medical Technology Co., Ltd. Systems and methods for image segmentation using a scalable and compact convolutional neural network
CN107817898B (zh) * 2017-10-31 2022-07-22 努比亚技术有限公司 操作模式识别方法、终端及存储介质
US10535001B2 (en) 2017-11-06 2020-01-14 International Business Machines Corporation Reducing problem complexity when analyzing 3-D images
US20200321130A1 (en) * 2017-11-13 2020-10-08 The Trustees Of Columbia University In The City Of New York System, method and computer-accessible medium for determining breast cancer risk
US10542270B2 (en) 2017-11-15 2020-01-21 Salesforce.Com, Inc. Dense video captioning
US11551353B2 (en) 2017-11-22 2023-01-10 Arterys Inc. Content based image retrieval for lesion analysis
CN107885464B (zh) * 2017-11-28 2021-11-02 北京小米移动软件有限公司 数据存储方法、装置及计算机可读存储介质
WO2019108252A1 (en) * 2017-12-03 2019-06-06 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping
US10565729B2 (en) 2017-12-03 2020-02-18 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping
US10796452B2 (en) 2017-12-03 2020-10-06 Facebook, Inc. Optimizations for structure mapping and up-sampling
US11276002B2 (en) 2017-12-20 2022-03-15 Salesforce.Com, Inc. Hybrid training of deep networks
CN108009634B (zh) * 2017-12-21 2021-05-25 美的集团股份有限公司 一种卷积神经网络的优化方法、装置及计算机存储介质
EP3503038A1 (en) 2017-12-22 2019-06-26 Promaton Holding B.V. Automated 3d root shape prediction using deep learning methods
CN108109102B (zh) * 2017-12-28 2021-11-23 珠海市君天电子科技有限公司 一种数据处理方法、装置、电子设备及存储介质
CN108280453B (zh) * 2018-01-08 2020-06-16 西安电子科技大学 基于深度学习的低功耗快速检测图像目标方法
US10664966B2 (en) 2018-01-25 2020-05-26 International Business Machines Corporation Anomaly detection using image-based physical characterization
WO2019145912A1 (en) 2018-01-26 2019-08-01 Sophos Limited Methods and apparatus for detection of malicious documents using machine learning
US11941491B2 (en) 2018-01-31 2024-03-26 Sophos Limited Methods and apparatus for identifying an impact of a portion of a file on machine learning classification of malicious content
US11164003B2 (en) * 2018-02-06 2021-11-02 Mitsubishi Electric Research Laboratories, Inc. System and method for detecting objects in video sequences
US10776581B2 (en) 2018-02-09 2020-09-15 Salesforce.Com, Inc. Multitask learning as question answering
US10393842B1 (en) * 2018-02-20 2019-08-27 The Board Of Trustees Of The Leland Stanford Junior University Highly-scalable image reconstruction using deep convolutional neural networks with bandpass filtering
US11227218B2 (en) 2018-02-22 2022-01-18 Salesforce.Com, Inc. Question answering from minimal context over documents
US10929607B2 (en) 2018-02-22 2021-02-23 Salesforce.Com, Inc. Dialogue state tracking using a global-local encoder
US10373022B1 (en) * 2018-02-28 2019-08-06 Konica Minolta Laboratory U.S.A., Inc. Text image processing using stroke-aware max-min pooling for OCR system employing artificial neural network
US11106182B2 (en) 2018-03-16 2021-08-31 Salesforce.Com, Inc. Systems and methods for learning for domain adaptation
US10783875B2 (en) 2018-03-16 2020-09-22 Salesforce.Com, Inc. Unsupervised non-parallel speech domain adaptation using a multi-discriminator adversarial network
CN108446730B (zh) * 2018-03-16 2021-05-28 推想医疗科技股份有限公司 一种基于深度学习的ct肺结节检测装置
US11030780B2 (en) * 2018-03-26 2021-06-08 The Board Of Trustees Of The Leland Stanford Junior University Ultrasound speckle reduction and image reconstruction using deep learning techniques
EP3547254A1 (de) 2018-03-29 2019-10-02 Siemens Healthcare GmbH Analyse-verfahren und analyseeinheit zur ermittlung radiologischer ergebnisdaten
US10699407B2 (en) 2018-04-11 2020-06-30 Pie Medical Imaging B.V. Method and system for assessing vessel obstruction based on machine learning
US11367222B2 (en) 2018-04-20 2022-06-21 Hewlett-Packard Development Company, L.P. Three-dimensional shape classification and retrieval using convolutional neural networks and majority vote
EP3561778A1 (en) 2018-04-26 2019-10-30 Promaton Holding B.V. Automated correction of metal affected voxel representations of x-ray data using deep learning techniques
CN108717869B (zh) * 2018-05-03 2021-08-13 中国石油大学(华东) 基于卷积神经网络的糖尿病视网膜并发症诊断辅助系统
CN110163834B (zh) * 2018-05-14 2023-08-25 腾讯科技(深圳)有限公司 对象识别方法和装置及存储介质
US11600194B2 (en) 2018-05-18 2023-03-07 Salesforce.Com, Inc. Multitask learning as question answering
US10909157B2 (en) 2018-05-22 2021-02-02 Salesforce.Com, Inc. Abstraction of text summarization
US11631009B2 (en) 2018-05-23 2023-04-18 Salesforce.Com, Inc Multi-hop knowledge graph reasoning with reward shaping
CN108960053A (zh) * 2018-05-28 2018-12-07 北京陌上花科技有限公司 归一化处理方法及装置、客户端
CN108959728B (zh) * 2018-06-12 2023-04-07 杭州法动科技有限公司 基于深度学习的射频器件参数优化方法
CN108921283A (zh) * 2018-06-13 2018-11-30 深圳市商汤科技有限公司 深度神经网络的归一化方法和装置、设备、存储介质
US11625609B2 (en) * 2018-06-14 2023-04-11 International Business Machines Corporation Integration of external applications into deep neural networks
JP7020312B2 (ja) * 2018-06-15 2022-02-16 日本電信電話株式会社 画像特徴学習装置、画像特徴学習方法、画像特徴抽出装置、画像特徴抽出方法、及びプログラム
EP3814981A4 (en) * 2018-06-26 2022-01-26 Nokia Technologies OY METHOD AND DEVICE FOR COMPUTER VIEWING
US11690551B2 (en) 2018-07-30 2023-07-04 Biosense Webster (Israel) Ltd. Left atrium shape reconstruction from sparse location measurements using neural networks
CN109102070B (zh) * 2018-08-22 2020-11-24 地平线(上海)人工智能技术有限公司 卷积神经网络数据的预处理方法和装置
US11436481B2 (en) 2018-09-18 2022-09-06 Salesforce.Com, Inc. Systems and methods for named entity recognition
US10970486B2 (en) * 2018-09-18 2021-04-06 Salesforce.Com, Inc. Using unstructured input to update heterogeneous data stores
US11514915B2 (en) 2018-09-27 2022-11-29 Salesforce.Com, Inc. Global-to-local memory pointer networks for task-oriented dialogue
US11645509B2 (en) 2018-09-27 2023-05-09 Salesforce.Com, Inc. Continual neural network learning via explicit structure learning
US11029694B2 (en) 2018-09-27 2021-06-08 Salesforce.Com, Inc. Self-aware visual-textual co-grounded navigation agent
US11087177B2 (en) 2018-09-27 2021-08-10 Salesforce.Com, Inc. Prediction-correction approach to zero shot learning
US11947668B2 (en) * 2018-10-12 2024-04-02 Sophos Limited Methods and apparatus for preserving information between layers within a neural network
CN113168499A (zh) * 2018-10-13 2021-07-23 伊普拉利技术有限公司 检索专利文档的方法
CN109448039B (zh) * 2018-10-22 2021-12-10 浙江科技学院 一种基于深度卷积神经网络的单目视觉深度估计方法
CN111144560B (zh) * 2018-11-05 2024-02-02 杭州海康威视数字技术股份有限公司 一种深度神经网络运算方法及装置
US11043005B2 (en) * 2018-11-23 2021-06-22 Volvo Car Corporation Lidar-based multi-person pose estimation
CN109711269B (zh) * 2018-12-03 2023-06-20 辽宁工程技术大学 一种基于3d卷积谱空特征融合的高光谱图像分类算法
CN109754389B (zh) * 2018-12-07 2021-08-24 北京市商汤科技开发有限公司 一种图像处理方法、装置及设备
US10963652B2 (en) 2018-12-11 2021-03-30 Salesforce.Com, Inc. Structured text translation
US11822897B2 (en) 2018-12-11 2023-11-21 Salesforce.Com, Inc. Systems and methods for structured text translation with tag alignment
US11995854B2 (en) * 2018-12-19 2024-05-28 Nvidia Corporation Mesh reconstruction using data-driven priors
CN109730656A (zh) * 2019-01-09 2019-05-10 中国科学院苏州纳米技术与纳米仿生研究所 用于脉搏波信号分类的神经网络系统、计算机设备
CN109784476B (zh) * 2019-01-12 2022-08-16 福州大学 一种改进dsod网络的方法
US11922323B2 (en) 2019-01-17 2024-03-05 Salesforce, Inc. Meta-reinforcement learning gradient estimation with variance reduction
US10325185B1 (en) * 2019-01-23 2019-06-18 StradVision, Inc. Method and device for online batch normalization, on-device learning, and continual learning applicable to mobile devices or IOT devices additionally referring to one or more previous batches to be used for military purpose, drone or robot, and testing method and testing device using the same
CN109799977B (zh) * 2019-01-25 2021-07-27 西安电子科技大学 指令程序开发调度数据的方法及系统
US20200242771A1 (en) * 2019-01-25 2020-07-30 Nvidia Corporation Semantic image synthesis for generating substantially photorealistic images using neural networks
US10372573B1 (en) * 2019-01-28 2019-08-06 StradVision, Inc. Method and device for generating test patterns and selecting optimized test patterns among the test patterns in order to verify integrity of convolution operations to enhance fault tolerance and fluctuation robustness in extreme situations
US11574052B2 (en) 2019-01-31 2023-02-07 Sophos Limited Methods and apparatus for using machine learning to detect potentially malicious obfuscated scripts
JP7433767B2 (ja) 2019-01-31 2024-02-20 潔 佐賀 マルチテナント管理装置、マルチテナント管理方法、及びプログラム
EP3690753A1 (en) * 2019-02-04 2020-08-05 Elektrobit Automotive GmbH Determination of the driving context of a vehicle
CN109919046B (zh) * 2019-02-19 2020-10-13 清华大学 一种基于关系特征的三维点云特征学习方法和装置
US11562201B2 (en) * 2019-02-25 2023-01-24 Microsoft Technology Licensing, Llc Neural network layer processing with normalization and transformation of data
US11568306B2 (en) 2019-02-25 2023-01-31 Salesforce.Com, Inc. Data privacy protected machine learning systems
US10839543B2 (en) * 2019-02-26 2020-11-17 Baidu Usa Llc Systems and methods for depth estimation using convolutional spatial propagation networks
US11003867B2 (en) 2019-03-04 2021-05-11 Salesforce.Com, Inc. Cross-lingual regularization for multilingual generalization
US11366969B2 (en) 2019-03-04 2022-06-21 Salesforce.Com, Inc. Leveraging language models for generating commonsense explanations
US11087092B2 (en) 2019-03-05 2021-08-10 Salesforce.Com, Inc. Agent persona grounded chit-chat generation framework
US11580445B2 (en) 2019-03-05 2023-02-14 Salesforce.Com, Inc. Efficient off-policy credit assignment
US11308639B2 (en) 2019-03-12 2022-04-19 Volvo Car Corporation Tool and method for annotating a human pose in 3D point cloud data
US20200293878A1 (en) * 2019-03-13 2020-09-17 Expedia, Inc. Handling categorical field values in machine learning applications
CN110060290B (zh) * 2019-03-14 2021-06-04 中山大学 一种基于3d卷积神经网络的双目视差计算方法
WO2020190870A1 (en) * 2019-03-15 2020-09-24 The Trustees Of Columbia University In The City Of New York System, method and computer-accessible medium for image reconstruction of non-cartesian magnetic resonance imaging information using deep learning
US11232308B2 (en) 2019-03-22 2022-01-25 Salesforce.Com, Inc. Two-stage online detection of action start in untrimmed videos
US11354573B2 (en) 2019-03-25 2022-06-07 International Business Machines Corporation Dynamically resizing minibatch in neural network execution
US11281863B2 (en) 2019-04-18 2022-03-22 Salesforce.Com, Inc. Systems and methods for unifying question answering and text classification via span extraction
WO2020223434A1 (en) * 2019-04-30 2020-11-05 The Trustees Of Columbia University In The City Of New York Classifying neurological disease status using deep learning
CN110045348A (zh) * 2019-05-05 2019-07-23 应急管理部上海消防研究所 一种基于改进卷积神经网络的人体运动状态分类方法
CN110222726A (zh) * 2019-05-15 2019-09-10 北京字节跳动网络技术有限公司 图像处理方法、装置及电子设备
US11487939B2 (en) 2019-05-15 2022-11-01 Salesforce.Com, Inc. Systems and methods for unsupervised autoregressive text compression
US11620572B2 (en) 2019-05-16 2023-04-04 Salesforce.Com, Inc. Solving sparse reward tasks using self-balancing shaped rewards
US11604965B2 (en) 2019-05-16 2023-03-14 Salesforce.Com, Inc. Private deep learning
US11562251B2 (en) 2019-05-16 2023-01-24 Salesforce.Com, Inc. Learning world graphs to accelerate hierarchical reinforcement learning
US11062183B2 (en) * 2019-05-21 2021-07-13 Wipro Limited System and method for automated 3D training content generation
US11687588B2 (en) 2019-05-21 2023-06-27 Salesforce.Com, Inc. Weakly supervised natural language localization networks for video proposal prediction based on a text query
US11775775B2 (en) 2019-05-21 2023-10-03 Salesforce.Com, Inc. Systems and methods for reading comprehension for a question answering task
US11669712B2 (en) 2019-05-21 2023-06-06 Salesforce.Com, Inc. Robustness evaluation via natural typos
US11657269B2 (en) * 2019-05-23 2023-05-23 Salesforce.Com, Inc. Systems and methods for verification of discriminative models
EP3751579A1 (en) 2019-06-13 2020-12-16 RaySearch Laboratories AB System and method for training a machine learning model and for providing an estimated interior image of a patient
WO2021002356A1 (ja) * 2019-07-02 2021-01-07 コニカミノルタ株式会社 放射線画像判定装置、検査システム及びプログラム
CN112215329B (zh) * 2019-07-09 2023-09-29 杭州海康威视数字技术股份有限公司 基于神经网络的卷积计算方法及装置
TWI702615B (zh) * 2019-07-26 2020-08-21 長佳智能股份有限公司 視網膜病變評估模型建立方法及系統
CN110516305B (zh) * 2019-07-26 2021-02-12 西安交通大学 基于注意机制元学习模型的小样本下故障智能诊断方法
US11443137B2 (en) 2019-07-31 2022-09-13 Rohde & Schwarz Gmbh & Co. Kg Method and apparatus for detecting signal features
US11615240B2 (en) 2019-08-15 2023-03-28 Salesforce.Com, Inc Systems and methods for a transformer network with tree-based attention for natural language processing
WO2021042124A1 (en) * 2019-08-28 2021-03-04 Visualize K.K. Methods and systems for predicting pressure maps of 3d objects from 2d phots using deep learning
CN110598852A (zh) * 2019-08-29 2019-12-20 北京小米移动软件有限公司 子网络采样方法、构建超网络拓扑结构的方法及装置
CN110826687B (zh) * 2019-08-30 2023-11-21 安谋科技(中国)有限公司 数据处理方法及其装置、介质和系统
CN110619359B (zh) * 2019-09-06 2020-11-27 上海杏脉信息科技有限公司 一种根据人体医学影像确定肺结核分级的方法与装置
CN110827208A (zh) * 2019-09-19 2020-02-21 重庆特斯联智慧科技股份有限公司 卷积神经网络的通用池化增强方法、装置、设备及介质
US11599792B2 (en) 2019-09-24 2023-03-07 Salesforce.Com, Inc. System and method for learning with noisy labels as semi-supervised learning
US11568000B2 (en) 2019-09-24 2023-01-31 Salesforce.Com, Inc. System and method for automatic task-oriented dialog system
US11640527B2 (en) 2019-09-25 2023-05-02 Salesforce.Com, Inc. Near-zero-cost differentially private deep learning with teacher ensembles
CN114531911A (zh) * 2019-09-27 2022-05-24 兄弟工业株式会社 机器学习模型、生成装置、计算机程序
CN110660074B (zh) * 2019-10-10 2021-04-16 北京同创信通科技有限公司 一种建立废钢等级划分神经网络模型方法
US11475283B2 (en) 2019-10-24 2022-10-18 Apple Inc. Multi dimensional convolution in neural network processor
US11410302B2 (en) * 2019-10-31 2022-08-09 Tencent America LLC Two and a half dimensional convolutional neural network for predicting hematoma expansion in non-contrast head computerized tomography images
US11620515B2 (en) 2019-11-07 2023-04-04 Salesforce.Com, Inc. Multi-task knowledge distillation for language model
CN112783890B (zh) * 2019-11-08 2024-05-07 珠海金山办公软件有限公司 一种生成数据透视表行的方法及装置
US11347708B2 (en) 2019-11-11 2022-05-31 Salesforce.Com, Inc. System and method for unsupervised density based table structure identification
US11334766B2 (en) 2019-11-15 2022-05-17 Salesforce.Com, Inc. Noise-resistant object detection with noisy annotations
US11288438B2 (en) 2019-11-15 2022-03-29 Salesforce.Com, Inc. Bi-directional spatial-temporal reasoning for video-grounded dialogues
US11922303B2 (en) 2019-11-18 2024-03-05 Salesforce, Inc. Systems and methods for distilled BERT-based training model for text classification
US11537899B2 (en) 2019-11-18 2022-12-27 Salesforce.Com, Inc. Systems and methods for out-of-distribution classification
KR20210062838A (ko) * 2019-11-22 2021-06-01 엘지전자 주식회사 인공지능 기반의 음성처리 방법
KR20210066207A (ko) * 2019-11-28 2021-06-07 엘지전자 주식회사 객체를 인식하는 인공 지능 장치 및 그 방법
JP7337675B2 (ja) 2019-12-04 2023-09-04 キヤノンメディカルシステムズ株式会社 医用データ処理装置
CN111105015A (zh) * 2019-12-06 2020-05-05 浪潮(北京)电子信息产业有限公司 一种通用cnn推理加速器及其控制方法、可读存储介质
US11416688B2 (en) 2019-12-09 2022-08-16 Salesforce.Com, Inc. Learning dialogue state tracking with limited labeled data
US11573957B2 (en) 2019-12-09 2023-02-07 Salesforce.Com, Inc. Natural language processing engine for translating questions into executable database queries
US11640505B2 (en) 2019-12-09 2023-05-02 Salesforce.Com, Inc. Systems and methods for explicit memory tracker with coarse-to-fine reasoning in conversational machine reading
US12086539B2 (en) 2019-12-09 2024-09-10 Salesforce, Inc. System and method for natural language processing using neural network with cross-task training
US11256754B2 (en) 2019-12-09 2022-02-22 Salesforce.Com, Inc. Systems and methods for generating natural language processing training samples with inflectional perturbations
US11487999B2 (en) 2019-12-09 2022-11-01 Salesforce.Com, Inc. Spatial-temporal reasoning through pretrained language models for video-grounded dialogues
US11514292B2 (en) 2019-12-30 2022-11-29 International Business Machines Corporation Grad neural networks for unstructured data
US11669745B2 (en) 2020-01-13 2023-06-06 Salesforce.Com, Inc. Proposal learning for semi-supervised object detection
US11562147B2 (en) 2020-01-23 2023-01-24 Salesforce.Com, Inc. Unified vision and dialogue transformer with BERT
JP7322358B2 (ja) * 2020-01-30 2023-08-08 富士通株式会社 情報処理プログラム、情報処理方法、及び情報処理装置
US11710042B2 (en) * 2020-02-05 2023-07-25 Adobe Inc. Shaping a neural network architecture utilizing learnable sampling layers
US20210249104A1 (en) 2020-02-06 2021-08-12 Salesforce.Com, Inc. Systems and methods for language modeling of protein engineering
US11663481B2 (en) 2020-02-24 2023-05-30 Adobe Inc. Neural network architecture pruning
CN111340964B (zh) * 2020-03-05 2023-03-24 长春中国光学科学技术馆 一种基于迁移学习的3d模型图像的构建方法
US11263476B2 (en) 2020-03-19 2022-03-01 Salesforce.Com, Inc. Unsupervised representation learning with contrastive prototypes
US11328731B2 (en) 2020-04-08 2022-05-10 Salesforce.Com, Inc. Phone-based sub-word units for end-to-end speech recognition
US20210350550A1 (en) * 2020-05-11 2021-11-11 Nvidia Corporation Gaze estimation using one or more neural networks
US11295430B2 (en) 2020-05-20 2022-04-05 Bank Of America Corporation Image analysis architecture employing logical operations
US11379697B2 (en) 2020-05-20 2022-07-05 Bank Of America Corporation Field programmable gate array architecture for image analysis
CN111797971B (zh) * 2020-05-27 2024-08-23 北京迈格威科技有限公司 应用卷积神经网络进行数据处理的方法、装置和电子系统
US11669699B2 (en) 2020-05-31 2023-06-06 Saleforce.com, inc. Systems and methods for composed variational natural language generation
US11720559B2 (en) 2020-06-02 2023-08-08 Salesforce.Com, Inc. Bridging textual and tabular data for cross domain text-to-query language semantic parsing with a pre-trained transformer language encoder and anchor text
CN111783570A (zh) * 2020-06-16 2020-10-16 厦门市美亚柏科信息股份有限公司 一种目标重识别的方法、装置、系统及计算机存储介质
US11694330B2 (en) 2020-07-13 2023-07-04 Canon Medical Systems Corporation Medical image processing apparatus, system, and method
US20220050877A1 (en) 2020-08-14 2022-02-17 Salesforce.Com, Inc. Systems and methods for query autocompletion
US11934952B2 (en) 2020-08-21 2024-03-19 Salesforce, Inc. Systems and methods for natural language processing using joint energy-based models
US11934781B2 (en) 2020-08-28 2024-03-19 Salesforce, Inc. Systems and methods for controllable text summarization
CN112182219A (zh) * 2020-10-09 2021-01-05 杭州电子科技大学 一种基于日志语义分析的在线服务异常检测方法
US11829442B2 (en) 2020-11-16 2023-11-28 Salesforce.Com, Inc. Methods and systems for efficient batch active learning of a deep neural network
US12080289B2 (en) * 2020-12-22 2024-09-03 Samsung Electronics Co., Ltd. Electronic apparatus, system comprising electronic apparatus and server and controlling method thereof
CN114881913A (zh) * 2021-02-05 2022-08-09 富泰华工业(深圳)有限公司 图像瑕疵检测方法、装置、电子设备及存储介质
US11842492B2 (en) 2021-04-16 2023-12-12 Natasha IRONSIDE Cerebral hematoma volume analysis
US11915829B2 (en) 2021-04-19 2024-02-27 Natasha IRONSIDE Perihematomal edema analysis in CT images
US12010129B2 (en) 2021-04-23 2024-06-11 Sophos Limited Methods and apparatus for using machine learning to classify malicious infrastructure
US11875898B2 (en) 2021-05-26 2024-01-16 Merative Us L.P. Automatic condition diagnosis using an attention-guided framework
US11830187B2 (en) 2021-05-26 2023-11-28 International Business Machines Corporation Automatic condition diagnosis using a segmentation-guided framework
CN113469427A (zh) * 2021-06-24 2021-10-01 国网山东省电力公司东营供电公司 基于卷积lstm的光伏电站日前发电量预测方法及系统
CN113627434B (zh) * 2021-07-07 2024-05-28 中国科学院自动化研究所 一种应用于自然图像的处理模型的搭建方法及装置
CN113568068B (zh) * 2021-07-22 2022-03-29 河南大学 一种基于mpi并行的三维神经网络的强对流天气预测方法
US12106045B2 (en) * 2021-10-13 2024-10-01 International Business Machines Corporation Self-learning annotations to generate rules to be utilized by rule-based system
CN117593610B (zh) * 2024-01-17 2024-04-26 上海秋葵扩视仪器有限公司 图像识别网络训练及部署、识别方法、装置、设备及介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125194A (en) * 1996-02-06 2000-09-26 Caelum Research Corporation Method and system for re-screening nodules in radiological images using multi-resolution processing, neural network, and image processing
JP5368687B2 (ja) * 2007-09-26 2013-12-18 キヤノン株式会社 演算処理装置および方法
CN101847210B (zh) * 2010-06-25 2012-10-03 哈尔滨工业大学 基于二维经验模态分解和小波降噪的多分组图像分类方法
CN103366180B (zh) * 2013-06-14 2016-06-01 山东大学 一种基于自动特征学习的细胞图像分割方法
CN103369303B (zh) * 2013-06-24 2016-08-17 深圳市宇恒互动科技开发有限公司 动作行为分析记录及重现的系统及方法
WO2016033506A1 (en) 2014-08-29 2016-03-03 Google Inc. Processing images using deep neural networks
EP3065086A1 (en) * 2015-03-02 2016-09-07 Medizinische Universität Wien Computerized device and method for processing image data
WO2016161115A1 (en) * 2015-03-31 2016-10-06 Mayo Foundation For Medical Education And Research System and methods for automatic polyp detection using convolutional neural networks
JP6383321B2 (ja) * 2015-04-08 2018-08-29 株式会社エクスメディオ 診断支援システム
CA2982526C (en) * 2015-04-13 2020-04-14 Case Western Reserve University Dual energy x-ray coronary calcium grading
US11113598B2 (en) 2015-06-01 2021-09-07 Salesforce.Com, Inc. Dynamic memory network
US20160350653A1 (en) 2015-06-01 2016-12-01 Salesforce.Com, Inc. Dynamic Memory Network
WO2016194161A1 (ja) * 2015-06-03 2016-12-08 株式会社日立製作所 超音波診断装置、及び画像処理方法
US20170032280A1 (en) 2015-07-27 2017-02-02 Salesforce.Com, Inc. Engagement estimator

Also Published As

Publication number Publication date
JP2018531648A (ja) 2018-11-01
US20190213482A1 (en) 2019-07-11
US11416747B2 (en) 2022-08-16
CA2994713C (en) 2019-02-12
AU2018229500A1 (en) 2018-10-04
EP3335158A1 (en) 2018-06-20
EP3335158B1 (en) 2019-07-24
JP2021093178A (ja) 2021-06-17
EP3582151A1 (en) 2019-12-18
JP6450053B2 (ja) 2019-01-09
CN110688891B (zh) 2024-05-31
AU2016308097B2 (en) 2018-08-02
JP7094407B2 (ja) 2022-07-01
US20170046616A1 (en) 2017-02-16
WO2017031088A1 (en) 2017-02-23
US10282663B2 (en) 2019-05-07
CN110688891A (zh) 2020-01-14
CN108140141B (zh) 2019-09-06
AU2016308097A1 (en) 2018-03-08
CN108140141A (zh) 2018-06-08
JP2019061710A (ja) 2019-04-18
AU2018229500B2 (en) 2020-01-16
CA2994713A1 (en) 2017-02-23

Similar Documents

Publication Publication Date Title
JP6838038B2 (ja) 3dバッチ正規化を伴う三次元(3d)畳み込み
Arbabshirani et al. Advanced machine learning in action: identification of intracranial hemorrhage on computed tomography scans of the head with clinical workflow integration
US11751832B2 (en) CTA large vessel occlusion model
Khagi et al. Pixel‐Label‐Based Segmentation of Cross‐Sectional Brain MRI Using Simplified SegNet Architecture‐Based CNN
JP2021056995A (ja) 医用情報処理装置、医用情報処理システム及び医用情報処理方法
Naga Srinivasu et al. Variational Autoencoders‐BasedSelf‐Learning Model for Tumor Identification and Impact Analysis from 2‐D MRI Images
EP3709309A1 (en) Medical data collection for machine learning
Ansari et al. Multiple sclerosis lesion segmentation in brain MRI using inception modules embedded in a convolutional neural network
Saddique et al. A hybrid approach of using symmetry technique for brain tumor segmentation
Cepa et al. Generative Adversarial Networks in Healthcare: A Case Study on MRI Image Generation
Wu et al. Semiautomatic segmentation of glioma on mobile devices
Ma et al. Nonlocal atlas‐guided multi‐channel forest learning for human brain labeling
CN117651951A (zh) 人工智能实现的偏好学习
Premananthan et al. A new AI assisted medical molecular image diagnostic model
Geng et al. Multimodal medical image fusion by adaptive manifold filter
EP4372684A1 (en) Patient-specific auto-segmentation in online adaptive radiotherapy
US20240203093A1 (en) Image processing apparatus, method, and program
US20220237467A1 (en) Model suitability coefficients based on generative adversarial networks and activation maps
Zhao et al. Magnetic resonance imaging standardization for accurate grading of cerebral gliomas
Naveed et al. AD-Net: Attention-based dilated convolutional residual network with guided decoder for robust skin lesion segmentation
Mishra et al. Brain tumor image segmentation using model average ensembling of deep networks
CN117616469A (zh) 用于自动分割质量保证的器官感兴趣形状的分类
Shafi et al. Ensemble self-attention technology for improving the accuracy and efficiency of lung disease diagnosis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210210

R150 Certificate of patent or registration of utility model

Ref document number: 6838038

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250