CN110688891A - 采用3d批归一化的三维(3d)卷积 - Google Patents

采用3d批归一化的三维(3d)卷积 Download PDF

Info

Publication number
CN110688891A
CN110688891A CN201910749196.7A CN201910749196A CN110688891A CN 110688891 A CN110688891 A CN 110688891A CN 201910749196 A CN201910749196 A CN 201910749196A CN 110688891 A CN110688891 A CN 110688891A
Authority
CN
China
Prior art keywords
data
sub
network
processing
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910749196.7A
Other languages
English (en)
Other versions
CN110688891B (zh
Inventor
R·佐赫尔
熊蔡明
戴凯升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Easy To Enjoy Information Technology Co Ltd
Original Assignee
Easy To Enjoy Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Easy To Enjoy Information Technology Co Ltd filed Critical Easy To Enjoy Information Technology Co Ltd
Priority to CN201910749196.7A priority Critical patent/CN110688891B/zh
Publication of CN110688891A publication Critical patent/CN110688891A/zh
Application granted granted Critical
Publication of CN110688891B publication Critical patent/CN110688891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10116X-ray image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30068Mammography; Breast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Architecture (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

所公开的技术使用配备有所谓子网络模块的3D深度卷积神经网络体系架构(DCNNA),其在3D放射体经受计算昂贵的操作之前对3D放射体执行降维操作。此外,子网络通过使3D数据经受不同的3D卷积层路径的并行处理而以多尺度卷积3D数据。这种多尺度操作在计算上比传统的执行串行卷积的CNN便宜。此外,通过3D批归一化(BN)进一步提高子网络的性能,所述3D批归一化将馈送到子网络的3D输入归一化,这反过来又提高了3D DCNNA的学习速率。在跨越一系列子网络模块进行几层3D卷积和3D子采样之后,从3D放射体生成具有降低垂直维度的特征图谱并且馈送到一个或更多个全连接层。

Description

采用3D批归一化的三维(3D)卷积
本申请是2016年8月15日提出的第201680053094.6号中国专利申请的分案申请。
优先权申请
本申请涉及并要求2015年8月15日提交的标题为“医学视觉系统(Medical VisionSystem)”的美国临时专利申请62/205,718(代理人案号SALE 1165-1/2021PR)的权益。出于所有目的,该优先权临时申请通过引用并入本文。
技术领域
公开的技术总地涉及在对3D深度卷积神经网络体系架构(DCNNA)内部的三维(3D)数据进行处理期间改进对计算资源(诸如,计算能力和存储器使用)的利用,并且具体地,涉及在卷积神经网络(CNN)中执行计算高效的3D图像分类和对象识别。
背景技术
本节中讨论的主题不应仅由于在本节中提到而被认为是现有技术。同样地,在本节中提及的问题或与作为背景提供的主题相关联的问题不应当被认为是先前在现有技术中已经认识到的。本节中的主题仅仅表示不同的方法,其本身也可以对应于所要求保护的技术的实现。
所公开的技术使得在大数据场景中(诸如医学成像)利用卷积神经网络(CNN)是可行的,其中需要用有限的存储器和计算能力来处理大量的数据。现有的深度卷积神经网络(CNN)的一个主要技术问题是对显著计算资源的需求。所公开的技术通过在3D深度卷积神经网络体系架构(DCNNA)内添加所谓的子网络来解决该技术问题,其在3D数据经受计算昂贵的操作之前对3D数据执行降维操作。此外,子网络通过使3D数据经受由不同的3D卷积层路径(例如,1×1×1卷积,3×3×3卷积,5×5×5卷积,7×7×7卷积)进行并行处理而以多尺度卷积3D数据。这种多尺度操作在计算上比执行串行卷积的传统CNN便宜。另外,通过3D批归一化(BN)进一步提高子网络的性能,所述3D批归一化使馈送到子网络的3D输入归一化,这反过来提高了3D DCNNA的学习速率。
机器学习是人工智能(AI)领域内的研究领域,其在计算机没有被明确编程的情况下给予其学习能力。与静态编程相反,机器学习使用对某些数据进行训练的算法来进行与该数据或其他数据相关的预测。深度学习是机器学习的一种形式,它通过对数据的低级分析的层来对数据进行高级抽象建模。最近,CNN在图像分类和对象识别方面取得了重大进展。通过训练多层卷积滤波器,许多机器学习工具(如支持向量机(SVM)、PCA、线性判别分析(LDA)、贝叶斯人际分类器等)的泛化能力随着训练量的增加迅速趋于饱和。但是,与传统机器学习算法相比,CNN在不同时间采用大量不同的图像训练时已显示出更好的表现。与手工制作的特征相比,CNN能够自动学习用于对象识别的复杂特征,并且实现卓越的性能。
然而,CNN需要大量的训练数据,没有这些训练数据,网络不能学习和交付令人印象深刻的识别性能。训练如此庞大的数据需要巨大的计算资源,例如数千个CPU核和/或GPU,这使得CNN的应用受到限制,并且不能扩展到移动和嵌入式计算。因此,需要提高分析大数据的计算资源的性能的CNN体系架构。
附图说明
在附图中,纵观不同的视图,相似的附图标记通常指代相似的部分。而且,附图不一定按比例绘制,而是通常将重点放在说明所公开的技术的原理上。在以下描述中,参考以下附图来描述所公开的技术的各种实现方式,其中:
图1示出了根据实现方式的系统的体系架构级的示意图。
图2示出了所公开的技术的一种实现方式的3D DCNNA内的子网络的框图,其详细示出了多尺度3D卷积层路径和3D池化操作。
图3是具有多个子网络以及预处理层和后处理层的示例性3DDCNNA。
图4A示出了应用于来自前面的子网络的3D输入以生成归一化3D输入的3D批归一化(BN)操作的一种实现方式。
图4B示出3D批归一化(BN)操作的一种实现方式,其将单独的学习非线性激活应用于归一化3D输入以缩放和转移3D输出,用于由后面的子网络处理。
图5示出了使用多个子网络和3D批归一化层的组合的3D DCNNA的框图。
图6描绘了示例性3D DCNNA的一种实现方式。
图7示出了由3D DCNNA使用的、人脑医学扫描的3D放射体形式的灰阶3D输入数据的示例。
图8示出了由3D DCNNA使用的、人脑医学扫描的3D放射体形式的彩色3D输入数据的示例。
图9是3D DCNNA用于基于从人脑医学扫描生成的3D放射体来检测人脑中的颅内出血(IH)结构的用例的一种实现方式。
图10描绘了回溯图7中所示的3D输入数据以基于3D DCNNA的输出来确定对该输出的计算最有贡献的3D输入数据的特征的一种实现方式。
图11示出了准确率-召回率(precision-recall)曲线,以展示未使用所公开的DCNNA的3D CNN的实验结果的一种实现方式。
图12描绘了准确率-召回率曲线,以展示使用所公开的DCNNA的3D CNN的实验结果的一种实现方式。
图13是在深度神经网络中卷积3D数据的代表性方法。
图14示出了在深度神经网络中卷积3D数据的另一个过程。
图15是根据所公开的技术的一个或更多个实现方式的适用于与图1的系统集成的示例性多租户(multi-tenant)系统的框图。
具体实施方式
简介
以下详细描述参照附图进行。描述样本实现方式来说明所公开的技术,而不是限制其范围,该范围由权利要求限定。本领域的普通技术人员将认识到以下描述的各种等同变体。
讨论被组织如下。首先,将呈现描述由各种实现方式解决的一些问题的介绍。然后,将在体系架构级上讨论一种实现方式的高级描述。接下来,讨论由一些实现方式用于有效处理3D数据的算法。最后,讨论用于实现该系统以及3D数据的例子、应用所公开的3D深度卷积神经网络体系架构(DCNNA)的样本用例、一些实验结果、处理以及与多租户环境的集成的更详细的体系架构。
在CNN中处理3D伴随着参数数量的增加以及显著的存储器和计算需求。传统CNN通过结合数据编码和解码,从一组具有标量或矢量体素(voxel-wise)信号的输入3D图像中提取特征图谱。输入图像通过将每个固定的体素邻域映射到隐藏层中的矢量特征空间进行编码,并且在输出层中重构回原始图像空间。为了提取捕获输入数据变化的特征模式的特征,自编码器的训练采用反向传播和对特征空间的属性的约束来减少重构错误。然而,由于在输入(编码)和输出(解码)层中要评估的参数的数量快速增加,因此从具有矢量体素信号的3D图像中提取全局特征在计算上是昂贵的并且需要太大的训练数据集。
为了克服处理3D数据的计算负担,所公开的技术使用配备有所谓的子网络模块的3D深度卷积神经网络体系架构(DCNNA),所述子网络模块在3D放射体经受计算昂贵的操作之前对3D放射体执行降维操作。另外,通过3D批归一化(BN)进一步提高子网络的性能,所述3D批归一化对馈送到子网络的3D输入进行归一化,这反过来提高了3D DCNNA的学习速率。在通过一系列子网络模块的3D内核(即,所学习的隐藏权重的矩阵)进行3D卷积和3D子采样的若干层之后,从3D放射体生成具有降低的垂直维度的特征图谱,并且将其馈送到一个或更多个全连接层(fully connected layer)。在全连接层计算之后,生成经分类或回归的输出。在一个示例性实施例中,3D DCNNA包括至少三个子网络模块,每个子网络模块后面跟着3D BN层、一些卷积层、子采样层和全连接层以及输出层。
由于对3D DCNNA的更深层的权重更新导致3D输入的连续变化分布以及相应的替代特征体表示或特征图谱,这阻碍了它们的权重的收敛。在一种实现方式中,在训练迭代处,权重更新导致权重方差的偏差,这样替代特征体表示在下一次迭代时被放大。此外,3D特征会使问题恶化,因为任何偏差都会基于层数呈指数放大。所公开的技术通过在DCNNA的隐藏层中采用3D批归一化(BN)技术来对此进行反击,所述3D批归一化允许在每个子网络处理步骤之后对DCNNA的非线性激活进行归一化,以便更好地保留所得到的替代特征体表示。在一种实现方式中,这种归一化的几何解释是,如果3D输入数据是多变量高斯,则在一些实现方式中,经变换的数据是具有零均值和一致协方差(identity covariance)的高斯。因此,BN通过提高学习率和使学习正规化来加速3D DCNNA的学习。
此外,医疗专业人员具有各种适当的医疗工作流程来解释3D医学图像并识别诊断测试中的异常。例如,对于每年的乳房X光检查,患者可由其主保健医师提供给放射门诊。该患者具有产生一组3D医学图像的乳房X光照片,例如X射线,并且现场专家可能对X射线进行初步审查以判定是否需要额外的视图或替换图像。然后X射线在电子系统中排队等待专家检查和为主保健医师写出诊断。患者等待她的主保健医师的电话,以获得乳房X光照片的结果。从乳房X光照片到结果,这个过程可能需要几个星期。所需要的是处理这样的3D医学图像的新过程,以缩短响应时间、减少诊断错误并且使非专业或没有经验的医疗专业人员能够以更高水平执行。
在医学视觉背景和3D数据中描述了根据所公开的实现方式的系统、装置和方法的示例。在其他实例中,所公开的技术可以应用于信息技术、欺诈检测、电信系统、金融系统、证券交易、银行业务、商业智能、市场营销、采矿、能源等以及2D、3D、4D或nD数据。其他的服务是可能的,诸如以下的示例不应该被看作是限定性的或者是在范围、环境或者设置上进行限制的。
所公开的技术涉及在处理深度卷积神经网络体系架构内部的三维(3D)数据期间提高计算资源(诸如计算能力和存储器使用)的利用率。所公开的技术可以在包括按需数据库系统、多租户环境等的任何计算机实现的系统的环境中实现。另外,该技术可以使用两个或更多个彼此协作和通信的独立且不同的计算机实现的系统来实现。该技术可以以多种方式来实现,包括实现为过程、方法、装置、系统、设备、计算机可读介质(诸如存储计算机可读指令或计算机程序代码的计算机可读存储介质),或者实现为包括计算机可用介质的计算机程序产品,所述计算机可用介质具有包含于其中的计算机可读程序代码。
所公开的技术可以在包括数据库系统、多租户环境或相关数据库实现(如OracleTM兼容数据库实现、IBM DB2Enterprise ServerTM兼容关系数据库实现、MySQLTM或PostgreSQLTM兼容关系数据库实现或Microsoft SQL ServerTM兼容关系数据库实现)或NoSQL非关系数据库实现(诸如VampireTM兼容非关系数据库实现、Apache CassandraTM兼容非关系数据库实现、BigTableTM兼容非关系数据库实现或HBaseTM或DynamoDBTM兼容非关系数据库实现)的任何计算机实现的系统的环境中实现。
另外,所公开的技术可以使用不同的编程模型(如MapReduceTM、大量同步编程、MPI原语等)或不同的流管理系统(如Apache StormTM、Apache SparkTM、Apace KafkaTM、TruvisoTM、IBM Info-SphereTM、BorealisTM和Yahoo!S4TM
系统概述
我们描述了用于在卷积神经网络(CNN)中执行计算高效的3D图像分类和对象识别的系统和各种实现方式。将参照图1描述该系统和过程,图1示出了根据实现方式的系统的体系架构级的示意图。由于图1是体系架构图,因此故意省略了某些细节以提高描述的清晰度。图1的讨论将安排如下。首先,将描述图中的元件,然后是它们的互连。然后,将更详细地描述系统中元件的使用。
图1包括系统100。系统100包括机器学习系统110、计算设备如平板电脑162、移动设备164和计算机166、训练数据存储176、测试数据存储186和网络160。机器学习系统110包括测试器112、训练器122、深度学习网络132和3D卷积神经网络(CNN)142。
现在将描述系统100的元件的互连。网络160将平板电脑162、移动设备164、计算机166、训练数据存储176、测试数据存储186和机器学习系统110通信地(由实线表示)耦合。实际的通信路径可以是公共和/或专用网络上的点对点。一些项目(如测试数据)可例如经由应用程序商店(未示出)间接交付。通信可以发生在各种网络上,例如专用网络、VPN、MPLS电路或因特网,并且可以使用适当的API和数据交换格式,例如REST、JSON、XML、SOAP和/或JMS。通信可以被加密。该通信通常通过网络(诸如LAN(局域网)、WAN(广域网)、电话网络(公共交换电话网络(PSTN)、会话发起协议(SIP)、无线网络、点对点网络、星形网、令牌环网、枢纽网、互联网(包括移动互联网))经由协议(诸如EDGE、3G、4G LTE、Wi-Fi、WiMAX)。此外,多种授权和认证技术(诸如用户名/密码、OAuth、Kerberos、SecureID、数字证书等)可以用于确保通信。
3D卷积神经网络(CNN)
已经描述了图1的元件及其互连,现在将更详细地描述图中的元件。机器学习系统110经由测试器112和训练器122提供各种功能。训练器122通过最小化成本函数来训练3D卷积神经网络(CNN)142。在一种实现方式中,使用依赖于反向传播算法来估计梯度的随机梯度下降(SGD)使成本函数最小化。在一些实现方式中,训练器122使用SGD来基于从具有给定批大小(batch size)的小批(mini-batch)估计的梯度执行迭代更新,其中更新发生在每个小批之后。在一种实现方式中,每个梯度更新进一步通过基于矩(moment)的学习规则来增强,其基于正向传播期间由成本函数确定的3D CNN 142的误差值将3D CNN 142的各种参数更新为当前梯度和先前迭代更新的梯度的加权组合。
为了训练3D CNN 142,使用来自训练数据存储176的3D数据。在一种实现方式中,训练数据存储176由提供3D CNN 142作为服务或产品的第一商业实体维护和使用。在另一种实现方式中,训练数据存储176由第一商业实体与第二商业实体(例如,中间商)合作填充,第二商业实体应用由第一商业实体开发的3D CNN 142来解决商业或技术问题。在又一种实现方式中,训练数据存储176使用由终端用户提供或生成的数据(例如,众包)填充。在一种实现方式中,3D CNN 142充当具有医疗视觉焦点的学习系统,其以最新的精确度和可靠性执行计算机视觉任务。该医学视觉系统使用由医学专业人员标记的示例进行训练,然后被部署为基于成像数据辅助识别和诊断某些医学问题。在训练期间,将由适当的医学专业人员表征为包含健康和/或异常元素的3D医学图像和/或图像部分提供给深度学习医学视觉系统。
在一种实现方式中,训练数据由一个或更多个图像或图像组组成。在一种实现方式中,图像或图像组中的每一个与一个或更多个附加信息片相关联。在一些实现方式中,附加信息片包括图像或图像组的标签。在一种实现方式中,训练数据是计算机断层摄影(CT)扫描的一组标记组。其他实现方式包括其他图像类型,包括超声波、磁共振成像(MRI)图像。
3D医学图像可以包含各种主题,例如眼底照相,例示各种健康和异常的眼睛。眼底图像可以有各种格式。可能的眼部异常包括糖尿病性视网膜病变、视神经乳头水肿和动脉高血压的眼科表现以及其他眼睛异常。其他3D医学图像可能包括其他主题。例如,可能的CT扫描包括颅脑CT扫描,其包含各种健康和异常的主题。例如颅脑CT扫描异常可能表现为颅内出血、硬膜外血肿、硬膜下血肿、脑实质内出血、脑室内出血、蛛网膜下腔出血、脑室扩张/移位、脑池异常、肿块/质量效应、普通水肿证据、脓肿、指示缺血性梗塞的凝块、颅骨骨折和高密度大脑中动脉(MCA)中的一个或更多个。相同区域或其他区域的其他3D医学图像可能会显示其他异常主题,如肺部或心脏异常,例如肺栓塞。
在一些实现方式中,训练数据可以由3D CNN 142处理。图像处理包括一个或更多个操作以操纵训练数据图像内的数据。图像处理的示例包括将训练数据归一化为特定尺寸或数量的像素或体素、粒度级别、图像格式等。在一种实现方式中,图像处理可以包括将训练数据重新缩放到特定尺寸以满足尺寸阈值或像素数量或者体素数量或者体素强度或粒度级别,以及把训练数据集中于特定类型的内容上或者使训练数据朝向特定或者一致的方向。
在一些实现方式中,图像处理包括创建三维(3D)体的二维(2D)拼贴(collage),允许训练数据图像的二维(2D)处理。在一种实现方式中,图像处理包括选择三维(3D)体的子集。在一些实现方式中,3D医学图像可以由多个相关图像缝合在一起。在一些实现方式中,可以从多于一个的医学图像创建拼贴。
一旦在训练期间学习了来自训练数据存储176的3D CNN 142的所有参数,则3DCNN 142准备好从测试数据进行图像分类和对象识别。在一种实现方式中,测试数据是存储在测试数据存储186中的3D数据。在测试期间,测试器112执行3D CNN 142,其对3D输入数据进行预测而不进行完全反向传播(full back propagation)。在图像分类的情况下,在测试时间,3D输入数据通过3D CNN 142的各种卷积层、子网络、批归一化层和池化层以生成特征图谱,其估计3D输入数据的后验概率(posterior probability)属于一个或更多个类别。在一种实现方式中,测试数据存储186由提供3D CNN 142作为服务或产品的第一商业实体维护和使用。在另一实现方式中,测试数据存储186由第一商业实体与第二商业实体(例如中间商)合作填充,第二商业实体应用由第一商业实体开发的3D CNN142来解决商业或技术问题。在又一实现方式中,测试数据存储186使用由终端用户提供的或使用终端用户生成的数据(例如,众包)来填充。
在系统100所示的一实现方式中,3D训练和测试数据被存储在NoSQL键值列存储分布式存储系统178和188(例如CassandraTM)中。CassandraTM中的3D数据分布在许多节点或商品服务器C1-C3上,可以使用基于Java、Scala、Ruby、Clojure或Python的API(例如Hector、Pelops、CQL、Thrift、Phpcassa、PyCassa等)进行连接。在其他实现方式中,3D训练和测试数据存储在Hadoop分布式文件系统(HDFS)(如Hadoop集群179和189)中。
3D数据/3D放射体
在一些实现方式中,3D训练和测试数据是体表示,每个点(x,y,z)被映射到离散体素坐标(i,j,k)。在一种实现方式中,3D输入数据具有设置为固定占用或表面曲率网格的D×D×D体素的体(例如,24×24×24、32×32×32、256×256×256、200×150×150、317×215×254、36×224×224)。在医学视觉背景下的一种实现方式中,3D训练和测试数据是3D放射体,其表示从医学扫描生成的人体器官结构的3D解剖形状变化。图7示出了由3D DCNNA使用的、人脑的医学扫描(例如,MRI、CT)的3D放射体形式的灰阶3D输入数据700的示例。图8示出由3D DCNNA使用的、人脑的医学扫描的3D放射体形式的彩色3D输入数据800的示例。在一种实现方式中,3D放射体700和800表示人脑的3D模型。在其他实现方式中,3D放射体700和800表示3D点云。在其他实现方式中,3D训练和测试数据的其他示例包括CAD(计算机辅助绘图)模型。
深度学习网络132在一个或更多个GPU上操作。深度学习网络132是通过堆叠多层人造神经元形成的前馈网络。每层都建模新的数据表示,其中神经元充当特征检测器。递归地,更深的神经元学习检测由前面的层检测到的那些形成的新特征。结果是越来越高级的特征检测器的层级。深度学习网络132进一步包括3D CNN 142,其也在至少一个GPU上操作。在一种实现方式中,3D CNN 142在一个或更多个客户端设备(例如平板电脑162、移动设备164和计算机166)的处理器上操作。
在一种实现方式中,3D CNN 142包括卷积层、子网络、3D批归一化层、池化层和全连接层。3D CNN 142使用所谓的3D接受域(receptive field),其是固定大小的3D补丁(patch)或3D内核,以采用相同大小的补丁对3D输入数据/放射体计算卷积。在一种实现方式中,设置步幅以确保3D放射体和中间特征图谱中的每个体素被覆盖以生成输出特征图谱。在一些实现方式中,在卷积操作之后,使用中间特征图谱完成子采样,以减小尺寸并防止重复计算。在一些实现方式中,全连接层被用于级联(concatenate)多维特征图谱并且将特征图谱变为固定尺寸的类别作为分类器。3D CNN142的层具有可训练参数,其权重在训练期间使用反向传播进行调整,如上所述。3D CNN 142中的单元使用某种形式的非线性激活,例如S形、整流线性激活(ReLU)或泄漏ReLU。在一些实现方式中,3D CNN 142的顶层使用softmax激活功能,其将3D输入映射到[0,1]。这允许将输出解释为概率和具有最高概率的体素的选择。
尽管在本文中参考特定框对系统100进行了描述,但是应该理解,框是为了描述的方便而定义的,并且不旨在要求组件部分的特定物理布置。此外,框不需要对应于物理上不同的组件。就使用物理上不同的组件而言,组件之间的连接(例如,用于数据通信)根据需要可以是有线和/或无线的。不同的元件或组件可以组合成单个软件模块,并且多个软件模块可以在同一硬件上运行。
子网络模块
图2示出了在所公开的技术的一种实现方式中的3D DCNNA(诸如3D CNN 142)内的子网络200A的框图200,详细示出了多尺度3D卷积层路径和3D池化操作。在一种实现方式中,子网络200A采用特征图谱作为输入,并且并行地应用从1×1×1卷积到3×3×3、5×5×5和7×7×7卷积变化的若干3D卷积层路径以及3D最大池化层(如3×3×3池)。此外,3D输入数据由子网络200A在多尺度210和214处处理。这意味着馈送到子网络200A作为输入的特征图谱首先由降维层212和3D最大池化层222在多尺度210处并行处理。进一步推进,由维度层212的1×1×1卷积得到的优化的特征图谱然后由不同的3D卷积层路径216(例如,1×1×1、3×3×3、5×5×5、7×7×7卷积)在多尺度214处并行处理。具有子网络200A的每个层或层路径生成不同的输出或特征图谱,其被级联成一个特征图谱作为级联层234处的最终输出。
降维层212和224被用于进行降维。例如,具有90个特征的36×224×224体素的3D输入与1×1×1的40个滤波器卷积会导致尺寸为40×36×224×224。在一种实现方式中,降维层还配备有非线性激活,诸如Sigmoid、ReLU或泄漏ReLU。如图2所示,在子网络200A内,3D输入不直接馈送到3D卷积层路径(诸如1×1×1、3×3×3、5×5×5和7×7×7卷积)中。相反,额外的1×1×1卷积被用作降维层212,以减少输入维度。此外,3D最大池化层222的输出被馈送到充当降维层224的附加1×1×1卷积中。
图3是具有以从最低到最高顺序布置的多个子网络200A、200B和200C以及预处理层310和后处理层320的示例性3D DCNNA 300(诸如3D CNN 142)。在一些实现方式中,前一个子网络(例如,子网络200A)的输出被用作下一个子网络的卷积和池化(例如,子网络200B)的输入。子网络200A、200B和200C中的每一个生成输入3D放射体的替代特征体表示或特征图谱。在一些实现方式中,3D输入数据/放射体经历一个或更多个预处理层310,诸如3D卷积311、2D卷积312、1D卷积313、3D池化操作314、2D池化操作315和1D池化操作316。在一些实现方式中,3D输入数据/放射体经历一个或更多个后处理层320,诸如3D卷积321、2D卷积322、1D卷积323、3D池化操作324、2D池化操作325和1D池化操作326。在一种实现方式中,在通过三个或更多个模块子网络200A、200B和200C处理3D输入数据和中间替代特征体表示或特征图谱之后,通过垂直池化层处理最高的模块子网络(诸如子网络200C)的输出,以从3D输入放射体生成降低的垂直维度的输出。
批归一化
由于3D CNN142的更深层的权重更新导致3D输入的连续变化的分布以及相应的替代特征体表示或特征图谱,这阻碍了它们的权重的收敛(convergence)。在一种实现方式中,在训练迭代处,权重更新导致权重方差的偏差,这样替代特征体表示在下一次迭代时被放大。此外,采用3D特征F1至Fn会使问题恶化,因为任何偏差都会基于层数呈指数放大。所公开的技术通过在隐藏层中采用3D批归一化(BN)技术来对此进行反击,该技术考虑在每个子网络处理步骤之后对3D CNN 142的非线性激活进行归一化,以便更好地保留所得到的替代特征体表示。在一种实现方式中,该归一化的几何解释是,如果3D输入数据是多变量高斯,则在一些实现方式中,变换的数据是具有零均值和同一协方差的高斯。因此,BN通过提高学习速度和使学习正规化来加速3D CNN 142的学习。
图4A示出了应用于来自先前子网络的3D输入以产生归一化3D输入的3D批归一化(BN)操作400A的一种实现方式。在图4A中,来自先前模块子网络的3D输入包括多个3D特征F1至Fn。在图4A中,特征F1至Fn的三个维度由符号
Figure BDA0002166626390000121
表示。在该步骤,将3D特征F1至Fn归一化为零均值和单位方差,然后在图4B中线性变换。平均值和方差在3D特征F1到Fn的每个维度计算,即通过示例而非来自训练数据集的小批(例如批1)的每个示例。在一些实现方式中,平均值和方差的运行平均值被保持,以用于在测试期间进行归一化。得到的归一化特征F1'至Fn'在图4A的右侧示出。
图4B示出3D批归一化(BN)操作400B的一种实现方式,其将单独的学习非线性激活应用于归一化3D输入以生成缩放和移位的(scaled and shifted)3D输出,以供后续子网络处理。在一种实现方式中,在先前子网络之后并紧接在随后的非线性激活之前引入3D BN层。在图4B中,归一化特征F1'至Fn'的三维由符号
Figure BDA0002166626390000122
表示。在该步骤,将经学习的非线性激活(例如,ReLU非线性(y=max(0,x))应用于归一化3D特征F1'至Fn',以生成缩放和移位的3D特征F1”至Fn”,其被用作后续子网络的输入表示。非线性激活在反向传播期间使用两个参数进行训练:缩放(scale)参数和移位(shift)参数。在3D BN的这个步骤中,在最后的反向通道中更新的非线性激活的缩放和移位参数被应用于图4A的归一化的3D输入。所得到的缩放和移位特征F1”到Fn”显示在图4B的右侧。
图5示出了3D DCNNA(诸如3D CNN 142)的框图500,其使用多个子网络和3D批归一化层的组合。在图5中,子网络200A、200B和200C中的每一个之后紧接着3D批归一化层,其对来自先前子网络(例如,子网络200A)的输出进行归一化,并将学习的非线性激活应用于归一化输出,以生成用于随后的子网络(例如,子网络200B)的挤压的(squashed)输入。
示例性深度CNN体系架构(DCNNA)
图6描绘了示例性3D DCNNA 600的一种实现方式。在高层次上,3D DCNNA 600包括三个主要部分:预处理层、模块子网络、3D批归一化(BN)层和后处理层。其他实现方式可以以不同顺序和/或与图6中所示出的不同的、更少或额外的动作执行卷积操作。在一些实现方式中可以组合多个卷积操作。
在图6中,3D输入数据首先由包括3D卷积层的预处理层处理,其后是1D最大池化层,后面是两个或更多3D卷积层和最终1D最大池化层。第一3D卷积层包含64个3D卷积核或尺寸为1×1×7×7的滤波器,这意味着一个特征在1×7×7体素上卷积。以下1D最大池化层的尺寸为1×3×3。如同第一3D卷积层,第二3D卷积层包含64个3D卷积核或滤波器,但是有64×1×7×7个。第三3D卷积层包含192个3D卷积核或尺寸为64×1×1×1的滤波器。预处理层中的最后一层是尺寸为1×3×3的1D最大池化层。
3D DCNNA 600遵循上文关于图2中的子网络200A描述的过程布局和流水线。3DDCNNA600的下一个组件是模块子网络A、B和C。所有子网络A、B和C都是3D模块,其使用具有3D卷积核或滤波器的3D卷积层路径,因为正在处理的数据是3D放射体。此外,每个子网络A、B和C包括至少一个降维层,其在它们被1×1×1、3×3×3、5×5×5卷积的3D卷积层路径处理之前,使用1×1×1卷积来降低输入替代特征表示或特征图谱的维度。此外,每个子网络A、B和C还采用3D最大池化层,其输出通过1×1×1卷积的额外降维进一步降低了维度。最后,在多个尺度下在每个子网络A、B和C中处理输入的替代特征表示,使得降维层和最大池化层并行地操作替代特征表示,并且降维层和最大池化层的输出还由不同的3D卷积层路径并行处理。
具体而言,子网络A包括64个3D卷积核或尺寸为192×1×1×1(1×1×1卷积)的滤波器,其用作降维层。子网络A还包括128个3D卷积核或尺寸为96×3×3×3(3×3×3卷积)的滤波器以及32个3D卷积核或尺寸为16×5×5×5(5×5×5卷积)的滤波器的两个3D卷积层路径,其以多尺度并行处理输入的特征图谱。这两个层路径的输入通过96个3D卷积核或尺寸为192×1×1×1(1×1×1卷积)的滤波器和16个3D卷积核或尺寸为192×1×1×1(1×1×1卷积)的滤波器的两个相应的降维层来减少。3D最大池化层的尺寸为3×3×3,并将其输出转发到另一个具有32个3D卷积核或尺寸为96×1×3×3的滤波器的3D卷积层路径。64个3D卷积核或尺寸为192×1×1×1(1×1×1卷积)的滤波器的输出,128个3D卷积核或尺寸为96×3×3×3(3×3×3卷积)的滤波器和32个3D卷积核或尺寸为16×5×5×5(5×5×5卷积)的滤波器的两个3D卷积层路径,以及具有32个3D卷积核或尺寸为96×1×3×3的滤波器的3D卷积层路径被级联以产生256个特征。
具体而言,子网络B包括128个3D卷积核或尺寸为256×1×1×1(1×1×1卷积)的滤波器,其用作降维层。子网络B还包括192个3D卷积内核或尺寸为128×3×3×3(3×3×3卷积)的滤波器和96个3D卷积核或尺寸为32×5×5×5(5×5×5卷积)的滤波器的两个3D卷积层路径,其以多尺度并行处理输入的特征图谱。这两个层路径的输入通过128个3D卷积核或尺寸为256×1×1×1(1×1×1卷积)的滤波器和32个3D卷积核或尺寸为256×1×1×1(1×1×1卷积)的滤波器的两个相应的降维层来减少。3D最大池化层的尺寸为3×3×3,并将其输出转发到另一个具有64个3D卷积核或尺寸为256×1×3×3的滤波器的3D卷积层路径。128个3D卷积核或尺寸为256×1×1×1(1×1×1卷积)的滤波器的输出,192个3D卷积核或尺寸为128×3×3×3(3×3×3卷积)的滤波器和96个3D卷积核或尺寸为32×5×5×5(5×5×5卷积)的两个3D卷积层路径,以及具有64个3D卷积核或尺寸为256×1×3×3的滤波器的3D卷积层路径被级联以产生480个特征。
具体而言,子网络C包括64个3D卷积核或尺寸为480×1×1×1(1×1×1卷积)的滤波器,其用作降维层。子网络B还包括128个3D卷积核或尺寸为96×3×3×3(3×3×3卷积)的滤波器和32个3D卷积核或尺寸为16×5×5×5(5×5×5卷积)的滤波器的两个3D卷积层路径,其以多尺度并行处理输入的特征图谱。这两个层路径的输入通过96个3D卷积核或尺寸为480×1×1×1(1×1×1卷积)的滤波器和16个3D卷积核或尺寸为480×1×1×1(1×1×1卷积)的滤波器的两个相应的降维层来减少。3D最大池化层的尺寸为3×3×3,并将其输出转发到另一个具有32个3D卷积核或尺寸为480×1×3×3的滤波器的3D卷积层路径。64个3D卷积核或尺寸为480×1×1×1(1×1×1卷积)的滤波器的输出,128个3D卷积核或尺寸为96×3×3×3(3×3×3卷积)的滤波器和32个3D卷积核或尺寸为16×5×5×5(5×5×5卷积)的两个3D卷积层路径,以及具有32个3D卷积核或尺寸为480×1×3×3的滤波器的3D卷积层路径被级联。
3D DCNNA 600还紧紧跟随每个具有3D批归一化层的子网络A、B和C,其使得子网络A、B和C的各自级联的输出经历归一化以及每个维度上的非线性挤压。后处理层包含尺寸为1×3×3的1D最大池化层和沿z轴的最大池化卷积。最终的替代特征表示尺寸为12544×1,其进一步被缩小为2×1。
颅内出血(IH)用例
图9是用例900的一种实现方式,其中3D DCNNA被用于基于从人脑的医学扫描或成像902生成的3D放射体来检测人脑中的颅内出血(IH)结构。3D放射体(诸如CT扫描904)是人脑的扫描。机器学习系统110被训练以识别与人脑相关联的一种或更多种类型的异常的存在或不存在。在一些实现方式中,机器学习系统110被训练以识别单个异常。在一些实现方式中,机器学习系统110被训练以识别多于一种的异常,称为多类标记。在一些实现方式中,多于一种异常的识别来自机器学习系统110,其对多于一种异常进行协同训练。例如,人脑的异常可能包括识别出血、阿尔茨海默斑和缠结以及中风的证据。在该示例中,机器学习系统110的一种实现方式将人脑的图像分类为健康或异常,并且然后识别存在何种类型的异常:颅内出血(IH)、阿尔茨海默氏症和/或中风并将结果906转发到健康服务提供商908。
在该示例的另一实现方式中,机器学习系统110将人脑的输入3D放射体分类为异常,包括出血指示、可能的阿尔茨海默病的证据或中风的指示。在一些实现方式中,还提供了分类的置信度。在一些实现方式中,多于一种的分类具有用于每种分类的相关置信度。在另一实现方式中,机器学习系统110将图像分类为出血、阿尔茨海默病、中风或“正常”,使得在查看每种可能的异常和每种异常的相关置信度之后应用作为诊断的“正常”。在一些实现方式中,3D放射体属于人眼,并且机器学习系统110被训练以识别与人眼相关联的一种或更多种类型的异常。
因此,机器学习系统110减少了诊断严重医学状况所花费的时间,并且因此能够向患有严重医学状况的患者提供更及时的帮助。在一种实现方式中,机器学习系统110从3D放射体提供诊断。例如,存在颅内出血。在一种实现方式中,机器学习系统110提供来自3D放射体的指标,而不是实际的诊断。例如,3D放射体可以识别鼻窦和/或颅外血液中的液体,这两者都是颅骨骨折的指标。在一种实现方式中,机器学习系统110不会得出关于是否存在颅骨骨折的结论,而是基于图像数据来识别指标。在另一种实现方式中,机器学习系统110确实基于指标得出是否存在头骨骨折的结论。在一种实现方式中,机器学习系统110提供结论的置信区间以及指标。
在一些实现方式中,机器学习系统110基于其对3D放射体的分析结果来提供警报。在一些实现方式中,机器学习系统110提供与医学状况相关联的风险因素。例如,在一个实现方式中,机器学习系统110可以将置信度等级附加到在3D医学图像中发现的状况,作为未来异常的指标。
图10描绘了回溯1000图7中所示的3D输入数据/放射体,以基于3D DCNNA的输出来确定最有助于计算输出的3D输入数据/放射体的特征的一种实现方式。通过回溯1000,对计算输出贡献最大的3D输入数据的特征在图10中各个蓝色大脑图像内突出显示为白色结构。
图11示出了准确率-召回率(precision-recall)曲线1100,以展示未使用所公开的DCNNA的3D CNN的实验结果的一种实现方式。在准确率-召回率曲线1100中,准确率为90%,召回率为47%。图12描绘了准确率-召回率曲线1200,以演示使用所公开的DCNNA的3DCNN的实验结果的一种实现方式。在准确率-召回率曲线1200中,准确率为90%,召回率从47%增加到50%。
过程
图13是在深度神经网络中卷积3D数据的代表性方法1300。流程图1300可以至少部分用计算机或其他数据处理系统实现,例如通过配置为接收或检索信息、处理信息、存储结果和传送结果的一个或更多个处理器。其他实现方式可以以不同的顺序和/或以与图13中所示的那些动作不同的、更少或附加的动作来执行动作。在一些实现方式中可以组合多个动作。为了方便起见,参考执行方法的系统来描述该流程图。该系统不必是该方法的一部分。
在所公开的技术的该部分和其他部分中描述的方法可以包括以下特征和/或结合所公开的附加方法描述的特征中的一个或更多个。为了简明,本申请中公开的特征的组合不单独枚举,并且不针对每个基本特征组重复。读者将理解如何将这种方法中识别的特征容易地与被识别为实现方式(诸如系统概述、3D CNN、3D数据/3D放射体、子网络模块、批归一化、示例性DCNNA、IH用例等)的基本特征组相结合。
图13包括过程1300,其开始于动作1310,其中接收表征输入放射体的三维(3D)数据。在一些实现方式中,输入放射体是每个点(×,y,z)被映射到离散体素坐标(i,j,k)的体表示。在一种实现方式中,3D输入数据具有被设置为固定占用或表面曲率网格的D×D×D体素(例如,24×24×24、32×32×32、256×256×256、200×150×150、317×215×254、36×224×224)的体。从3D数据中提取的特征的数量被预置(prepend),以形成F×D×D×D。传统上垂直切片的数量少于每个切片(slice)中的2D像素的数量,以使得放射科医师查看的图像数量易于管理。在医学视觉背景下的一种实现方式中,3D训练和测试数据是表示从医学扫描生成的人体器官结构的3D解剖形状变化的3D放射体。在一种实现方式中,输入放射体表示人脑的3D模型。在又一实现方式中,输入放射体表示3D点云。在其他实现方式中,输入放射体的其他示例包括CAD(计算机辅助绘图)模型。
过程1300在动作1320处继续,其中使用深度神经网络处理表征输入放射体的3D数据,以生成输入放射体的替代特征体表示。在一种实现方式中,深度神经网络包括多个子网络。在一种实现方式中,子网络以从最低到最高的序列布置,并且使用深度神经网络处理表征输入放射体的数据包括通过序列中的每个子网处理数据。在一种实现方式中,第一3D卷积层路径是3×3×3卷积,其从输入放射体中提取半全局特征。在一种实现方式中,第二3D卷积层路径是5×5×5卷积,其从输入放射体中提取全局特征。在一种实现方式中,第三3D卷积层路径是1×1×1卷积,其从输入放射体中提取局部特征。
在动作1330,三个或更多个子网络是模块子网络,并且每个模块子网络被配置为接收由该序列中的先前子网络生成的先前输出表示,如上所述。
在动作1340,三个或更多个子网络是模块子网络,并且每个模块子网络被配置为通过变化卷积体的至少三个并行3D卷积层路径处理先前输出表示,如上所述。
在动作1350,三个或更多个子网络是模块子网络,并且每个模块子网络被配置为通过并行3D最大池化路径进一步处理先前输出表示,如上所述。
在动作1360,三个或更多个子网络是模块子网络,并且每个模块子网络被配置为将3D卷积层路径和3D最大池化路径的输出级联,以生成来自每个模块子网络的输出表示,如上所述。
在动作1370处,由3D批归一化来调节子网络中的3D卷积层路径的输出表示,如上所述。在一种实现方式中,3D批归一化被独立地应用于替代特征体表示中的各个特征并且基于分批应用。在一种实现方式中,对于批中的替代特征值表示,3D批归一化缩放并移位图像数据值,使得归一化的替代特征体表示具有图像数据值的零均值和单位方差。
在动作1380处,该过程包括通过具有可学习的缩放和移位参数的参数化非线性激活立即处理归一化的替代特征体表示,通过可学习的缩放和移位参数训练深度神经网络可以抵消3D批归一化,如上所述。
在动作1390,该过程包括在通过三个或更多个模块子网络处理数据之后,通过垂直最大池化层处理最高模块子网络的输出,以从输入放射体生成降低垂直维度的输出,如上所述。
本部分中描述的方法的其他实现方式可以包括存储指令的非暂时性计算机可读存储介质,所述指令可由处理器执行以执行上述任何方法。本部分中描述的方法的又一实现方式可以包括系统,该系统包括存储器和一个或更多个处理器,所述处理器可操作为执行存储在存储器中的指令,以执行上述任何方法。
图14是在深度神经网络中卷积3D数据的代表性方法1400。流程图1400可以至少部分地用计算机或其他数据处理系统实现,例如通过配置为接收或检索信息、处理信息、存储结果和传送结果的一个或更多个处理器。其他实现方式可以以不同的顺序和/或采用与图14中所示的那些动作不同的、更少的或附加的动作来执行动作。在一些实现方式中,可以组合多个动作。为了方便起见,参考执行方法的系统来描述该流程图。该系统不必是该方法的一部分。
所公开的技术的该部分和其他部分中描述的方法可以包括以下特征和/或结合所公开的附加方法描述的特征中的一个或更多个。为了简明,本申请中公开的特征的组合不单独枚举,并且不针对每个基本特征组重复。读者将理解如何将这种方法中识别的特征容易地与被识别为实现方式(诸如系统概述、3D CNN、3D数据/3D放射体、子网络模块、批归一化、示例性DCNNA、IH用例等)的基本特征组相结合。
图14包括过程1400,其开始于动作1410,其中接收表征输入放射体的三维(3D)数据。在一些实现方式中,输入放射体是每个点(x,y,z)被映射到离散体素坐标(i,j,k)的体表示。在一种实现方式中,3D输入数据具有设置为固定占用或表面曲率网格的D×D×D体素(例如,24×24×24、32×32×32、256×256×256、200×150×150、317×215×254、36×224×224)的体。在医学视觉背景下的一种实现方式中,3D训练和测试数据是表示从医学扫描生成的人体器官结构的3D解剖形状变化的3D放射体。在一种实现方式中,输入放射体表示人脑的3D模型。在其他实现方式中,输入放射体表示3D点云。在其他实现方式中,输入放射体的其他示例包括CAD(计算机辅助绘图)模型。
过程1400在动作1420处继续,其中使用深度神经网络处理表征输入放射体的3D数据,以生成输入放射体的替代特征体表示。在一种实现方式中,深度神经网络包括多个子网络。在一种实现方式中,子网络以从最低到最高的序列布置,并且使用深度神经网络处理表征输入放射体的数据包括通过序列中的每个子网络处理数据。在一种实现方式中,第一3D卷积层路径是3×3×3卷积,其从输入放射体中提取半全局特征。在一种实现方式中,第二3D卷积层路径是5×5×5卷积,其从输入放射体中提取全局特征。在一种实现方式中,第三3D卷积层路径是1×1×1卷积,其从输入放射体中提取局部特征。
在动作1430,对于变化的卷积体的至少三个并行的3D卷积层路径,以卷积值的多尺度在降维层上处理先前输出表示,如上所述。
在动作1440,三个或更多个子网络是模块子网络,并且每个模块子网络被配置为通过变化卷积体的至少三个并行3D卷积层路径来处理先前输出表示,如上所述。
在动作1450,三个或更多个子网络是模块子网络,并且每个模块子网络被配置为通过并行3D最大池化路径进一步处理先前输出表示,如上所述。
在动作1460,三个或更多个子网络是模块子网络,并且每个模块子网络被配置为级联3D卷积层路径和3D池化路径的输出,以从每个模块子网络生成输出表示,如上所述。3D池化路径包括最大、最小或平均池化操作。
在动作1470,由3D批量归一化来调节子网络中的3D卷积层路径的输出表示,如上所述。在一种实现方式中,3D批归一化被独立地应用于替代特征体表示中的各个特征并且基于分批应用。在一种实现方式中,对于批中的替代特征值表示,3D批归一化缩放和移位图像数据值,使得归一化的替代特征体表示具有图像数据值的零均值和单位方差。
在动作1480处,该过程包括通过具有可学习的缩放和移位参数的参数化非线性激活立即处理归一化的替代特征体表示,通过可学习的缩放和移位参数训练深度神经网络可以抵消3D批归一化,如上所述。
在动作1490,该过程包括在通过三个或更多个模块子网络处理数据之后,通过垂直最大池化层处理最高模块子网络的输出,以从输入放射体生成降低垂直维度的输出,如上所述。
本部分中描述的方法的其他实现方式可以包括存储指令的非暂时性计算机可读存储介质,所述指令可由处理器执行以执行上述任何方法。本部分中描述的方法的又一实现方式可以包括系统,该系统包括存储器和一个或更多个处理器,所述处理器可操作为执行存储在存储器中的指令,以执行上述任何方法。
多租户集成
图15是根据所公开技术的一种或更多种实现方式的、适用于与图1的系统集成的示例性多租户系统的框图。图1的系统100可以使用多租户系统来实现。在这方面,图15呈现了根据一种或更多种实现方式的、适合于与图1的系统100集成的示例性多租户系统的概念框图。
一般来说,所示的图15的多租户系统1500包括服务器1502,其基于来自共同数据库1530的数据1532动态地创建和支持虚拟应用程序1528A和1528B,所述共同数据库1530在多个租户之间共享,在此可选地称为“多租户数据库”。根据需要,由虚拟应用程序1528A和1528B生成的数据和服务经由网络1545被提供给任意数量的客户端设备1540A和1540B。虚拟应用程序1528A和1528B在运行时(或按需)使用公共的应用程序平台1510适当地生成,其为订阅多租户系统1500的各个租户中的每一个安全地提供对数据库1530中的数据1532的访问。根据一个非限制性示例,多租户系统1500以按需多租户客户关系管理(CRM)系统的形式实现,其可以支持任何数量的多租户的认证用户。
如本文所使用的,“租户”或“组织”是指一组一个或更多个用户,其共享对多租户数据库1530内的数据的公共子集的访问。在这方面,每个租户包括一个或更多与该各个租户相关联、分配给该各个租户或以其他方式属于该各个租户的用户。换句话说,多租户系统1500内的每个各个用户与多租户系统1500所支持的多个租户中的特定租户相关联、分配给该特定租户或以其他方式属于该特定租户。租户可表示用户、用户部门、工作或法律组织,和/或为多租户系统1500内的特定用户组维护数据的任何其他实体。虽然多个租户可以共享对服务器1502和数据库1530的访问,但是从服务器1502提供给每个租户的特定数据和服务可以与提供给其他租户的安全隔离。因此,多租户体系架构允许不同的用户组共享功能和硬件资源,而不必共享属于其他租户或与其他租户相关联的任何数据1532。
多租户数据库1530是能够存储和管理与任何数量的租户相关联的数据1532的任何类型的储存库或其他数据存储系统。数据库1530可以使用任何类型的常规数据库服务器硬件来实现。在各种实现方式中,数据库1530与服务器1502共享处理硬件。在其他实现方式中,使用与服务器1502通信以执行本文描述的各种功能的单独的物理和/或虚拟数据库服务器硬件来实现数据库1530。在示例性实现方式中,数据库1530包括数据库管理系统或其他能够确定最佳查询计划的等同软件,其用于响应于由虚拟应用程序1528A或1528B发起或以其他方式提供的查询来检索数据1532的特定子集并将其提供给虚拟应用程序1528A或1528B的实例。可选地,多租户数据库1530在此可以被称为按需数据库,因为多租户数据库1530在运行时向由应用程序平台1510生成的按需虚拟应用程序1528A和1528B提供(或可用于提供)数据。
实际上,数据1532可以以任何方式组织和格式化以支持应用程序平台1510。在各种实现方式中,数据1532被适当地组织成相对少数量的大数据表,以维持半无定形的“堆”型格式。然后,数据1532可以按照特定虚拟应用程序1528A或1528B的需要进行组织。在各种实现方式中,使用任何数量的数据透视表(pivot table)1534建立常规数据关系,其根据需要建立索引、唯一性、实体之间的关系和/或传统数据库组织的其他方面。进一步的数据操纵和报告格式化通常在运行时使用各种元数据结构来执行。例如,通用数据目录(UDD)1536中的元数据可用于描述多租户共用的任意数量的表单、报告、工作流、用户访问权限、工作逻辑和其他构造。根据需要,特定于租户的格式化、功能和其他结构可以作为每个租户的特定于租户元数据1538A-和1538B维护。数据库1530被组织成相对无定形的,其中数据透视表1534和元数据1538A和1538B根据需要提供附加结构,而不是将数据1532强制为租户和应用程序共用的不灵活的全局结构。为此,应用程序平台1510适当地使用数据透视表1534和/或元数据1538A和1538B来生成虚拟应用程序1528A和1528B的“虚拟”组件,以从逻辑上获得、处理和呈现来自数据库1530的相对无定形的数据1532。
服务器1502使用一个或更多个实际和/或虚拟计算系统来实现,所述一个或更多个实际和/或虚拟计算系统共同提供用于生成虚拟应用程序1528A和1528B的动态应用程序平台1510。例如,服务器1502可以使用通常与常规网络通信、集群管理、负载均衡和其他特征相关联的、相互联合操作的实际和/或虚拟服务器的集群来实现。服务器1502与任何类型的常规处理硬件(诸如处理器1505、存储器1506、输入/输出特征1507等)一起操作。输入/输出特征1507通常表示到网络(例如,到网络1545或任何其他局域网、广域网或其他网络)、大容量存储、显示装置、数据输入装置等的一个或更多个接口。处理器1505可以使用任何合适的处理系统(诸如一个或更多个处理器、控制器、微处理器、微控制器、处理核心和/或其他分布在任何数量的分布式系统或集成系统(包括任何数量的“基于云的”系统或其他虚拟系统)上的计算资源)来实现。存储器1506表示能够存储用于在处理器1505上执行的编程指令的任何非暂时性短期或长期存储或其他计算机可读介质,其包括任何种类的随机存取存储器(RAM)、只读存储器(ROM)、闪存、磁或光学大容量存储等。计算机可执行编程指令,当由服务器1502和/或处理器1505读取和执行时,使得服务器1502和/或处理器1505创建、生成或以其他方式辅助应用程序平台1510和/或虚拟应用程序1528A和1528B,并且执行本文描述的一个或更多个附加任务、操作、功能和/或过程。应该注意的是,存储器1506表示这种计算机可读介质的一个合适的实现方式,并且可选地或附加地,服务器1502可以接收被实现为便携式或移动组件或应用程序平台的外部计算机可读介质并且与其协作,例如便携式硬盘驱动器、USB闪存驱动器、光盘等。
应用程序平台1510是生成虚拟应用程序1528A和1528B的任何类型的软件应用程序或其他数据处理引擎,所述虚拟应用程序1528A和1528B向客户端设备1540A和1540B提供数据和/或服务。在典型的实现方式中,应用程序平台1510使用任何种类的传统或专有操作系统1508获得对处理硬件1502的处理资源、通信接口和其他特征的访问。通常在运行时响应于从客户端设备1540A和1540B接收到的输入来生成虚拟应用程序1528A和1528B。对于所示的实现方式,应用程序平台1510包括批数据处理引擎1512、查询生成器1514、提供文本索引和其他搜索功能的搜索引擎1516以及运行时间应用程序生成器1520。这些特征中的每一个可以被实现为单独的过程或其他模块,并且许多等效实现方式可以根据需要包括不同的和/或附加的特征、组件或其他模块。
运行时间应用程序生成器1520响应于从客户端设备1540A和1540B接收到的特定请求而动态地构建和执行虚拟应用程序1528A和1528B。通常根据特定于租户的元数据1538来构建虚拟应用程序1528A和1528B,特定于租户的元数据1538描述特定应用程序1528A和1528B的特定表格、报告、界面和/或其他特征。在各种实现方式中,视情况而定,每个虚拟应用程序1528A和1528B生成动态网页内容,其可以被提供给浏览器或与其客户端设备1540A和1540B相关联的其他客户端程序1542A和1542B。
运行时间应用程序生成器1520适当地与查询生成器1514进行交互,以响应于由客户端设备1540A和1540B的用户发起或以其他方式由其提供的输入查询,根据需要从数据库1530有效地获取多租户数据1532。在典型的实现方式中,查询生成器1514考虑请求特定功能的用户的身份(以及用户的关联租户),然后使用通用数据目录(UDD)1536、特定于租户的元数据1538、数据透视表1534和/或任何其他可用资源内的系统范围元数据来构建并执行对数据库1530的查询。因此,本示例中的查询生成器1514通过确保查询与授予发起请求的用户和/或租户的访问特权一致来维护公用数据库1530的安全性。以此方式,查询生成器1514根据需要从数据库1530适当地获得所请求的用户和/或租户可访问的数据1532的子集,以填充该用户和/或租户的特定虚拟应用程序1528A或1528B的表格、报告或其他特征。
仍然参考图15,数据处理引擎1512对数据1532执行批处理操作,例如上传或下载、更新、在线交易处理等。在许多实现方式中,数据1532的不紧急批处理可以被调度为在处理资源变得可用时发生,因此给予由查询生成器1514、搜索引擎1516、虚拟应用程序1528A和1528B等进行的更紧急的数据处理的优先权。
在示例性实现方式中,应用程序平台1510被用于为其支持的租户创建和/或生成数据驱动的虚拟应用程序1528A和1528B。这样的虚拟应用程序1528A和1528B可以利用界面特征,诸如定制(或特定于租户的)屏幕1524、标准(或通用)屏幕1522等。任何数量的定制和/或标准对象1526还可用于集成到租户开发的虚拟应用程序1528A和1528B中。如本文所使用的,“定制”应该被理解为意味着各自的对象或应用程序是特定于租户的(例如,仅可用于与多租户系统中的特定租户相关联的用户)或特定于用户的(例如,仅可用于多租户系统内的特定用户子集),而“标准”或“通用”应用程序或对象可用于多租户系统中的多个租户。与每个虚拟应用程序1528A和1528B相关联的数据1532,连同描述特定虚拟应用程序1528A和1528B的特定特征(例如报告、表格、功能、对象、字段、公式、代码等)的元数据1538一起,被酌情提供给数据库1530并且被存储,直到它被请求或者以其他方式需要。例如,虚拟应用程序1528A和1528B可以包括可由租户访问的多个对象1526,其中对于租户可访问的每个对象1526,与其对象类型有关的信息以及与该各自对象类型相关联的各个字段的值作为元数据1538而被保持在数据库1530中。就这一点而言,对象类型定义每个各自对象1526和与其相关联的各个字段的结构(例如,格式化、功能和其他构造)。
继续参考图15,可以使用网络1545上的任何种类的个人计算机、移动电话、平板电脑或其他启用网络的客户端设备1540A或1540B来检索由服务器1502提供的数据和服务。在示例性实现方式中,客户端设备1540A或1540B包括能够以图形方式呈现从多租户数据库1530检索的数据和/或信息的显示装置,诸如监视器、屏幕或另一常规电子显示器。通常,用户操作由客户端设备1540A和1540B执行的常规浏览器应用程序或其他客户端程序1542,以使用网络协议(诸如超文本传输协议(HTTP)等)经由网络1545联系服务器1502。用户通常向服务器1502认证他或她的身份,以获得会话标识符(“SessionID”),其在之后与服务器1502的通信中识别用户。当被识别的用户请求访问虚拟应用程序1528A或1528B时,运行时间应用程序生成器1520酌情基于元数据1538在运行时间适当地创建应用程序。如上所述,虚拟应用程序1528A或1528B可以包含Java、ActiveX或其他可以使用在客户端设备1540A或1540B上运行的传统客户端软件呈现的内容;根据需要,其他实现方式可以简单地提供动态网页或可由用户呈现和查看的其他内容。
前面的描述本质上仅仅是说明性的,并非旨在限制主题的实现方式或者这些实现方式的应用和使用。此外,不打算受到在技术领域、背景技术或详细描述中呈现的任何表达或暗示的理论的界定。如本文所使用的,词语“示例性”意味着“用作示例、实例或说明”。本文描述为示例性的任何实现方式不必被解释为比其他实现方式优选或有利,并且本文描述的示例性实现方式不旨在以任何方式限制主题的范围或适用性。
为了简明,与数据库、社交网络、用户界面以及系统的其他功能方面(以及系统的各个操作组件)有关的常规技术在本文可不被详细描述。另外,本领域的技术人员将认识到,可以结合任何数量的系统和/或网络体系架构、数据传输协议和设备配置来实践实现方式,并且本文描述的系统仅仅是一个合适的示例。此外,某些术语在本文中可能仅用于参考的目的,因此不旨在限制。例如,术语“第一”,“第二”和其他这样的数字术语并不暗示序列或顺序,除非上下文明确指出。
本文可以根据功能块和/或逻辑块组件并且参照可以由各种计算组件或设备执行的操作、处理任务和功能的符号表示来描述主题的实现方式。这种操作、任务和功能有时被称为计算机执行的、计算机化的、软件实现的或计算机实现的。实际上,一个或更多个处理系统或设备可通过操纵表示可访问存储器位置处的数据位的电信号以及信号的其他处理来执行所描述的操作、任务和功能。数据位被保持的存储器位置是具有与数据位相对应的特定电、磁、光或有机属性的物理位置。应该理解的是,附图中示出的各个块组件可以通过被配置为执行指定功能的任何数量的硬件、软件和/或固件组件来实现。例如,系统或组件的实现方式可以采用各种集成电路组件(例如存储器元件、数字信号处理元件、逻辑元件、查找表等),其可以在一个或更多个微处理器或其他控制设备的控制下执行各种功能。当以软件或固件实现时,本文描述的系统的各种元件实质上是执行各种任务的代码段或指令。程序或代码段可以存储在处理器可读介质中,或者通过传输介质或通信路径由载波中包含的计算机数据信号来传输。“处理器可读介质”或“机器可读介质”可以包括可以存储或传输信息的任何非暂时性介质。处理器可读介质的示例包括电子电路、半导体存储器器件、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤光学介质、射频(RF)链路等。计算机数据信号可以包括可以通过传输介质(诸如电子网络信道、光纤、空气、电磁路径或RF链路)传播的任何信号。代码段可以经由计算机网络(诸如因特网、内联网、LAN等)来下载。就这一点而言,可以在任何计算机可实现的系统的上下文中和/或与两个或更多个彼此协作和通信的独立且不同的计算机实现的系统结合实现本文描述的主题。在一个或更多个示例性实现方式中,本文描述的主题结合多租户环境中的虚拟用户关系管理(CRM)应用程序来实现。
上面描述或参考的任何数据结构和代码根据计算机可读存储介质上的许多实现方式被存储,计算机可读存储介质可以是能够存储由计算机系统使用的代码和/或数据的任何设备或介质。这包括但不限于易失性存储器、非易失性存储器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、磁和光存储设备(诸如磁盘驱动器)、磁带、CD(光盘)、DVD(数字通用光盘或数字视频盘)或能够存储现在已知或以后开发的计算机可读介质的其他介质。
呈现先前的描述是为了使得能够制造和使用所公开的技术。对所公开的实现方式的各种修改将是显而易见的,并且在不脱离所公开的技术的精神和范围的情况下,可将本文中定义的一般原理应用于其他实现方式和应用。因此,所公开的技术不旨在限于所示出的实现方式,而是应被赋予与本文公开的原理和特征一致的最宽范围。所公开的技术的范围由所附权利要求限定。

Claims (15)

1.一种在神经网络中对三维3D数据进行分类的计算机实现的方法,所述方法包括:
接收表征输入放射体的三维3D数据;
使用神经网络处理表征所述输入放射体的所述3D数据,其中所述神经网络包括以从最低到最高的序列布置的多个子网络,并且其中所述使用神经网络处理所述3D数据包括通过所述序列中的每个所述子网络处理所述数据;
其中每个所述子网络被配置为:
接收由所述序列中的先前子网络生成的先前输出表示;
通过变化的卷积体的多个并行3D卷积层路径来处理所述先前输出表示;
通过并行的池化路径进一步处理所述先前输出表示;以及
级联所述3D卷积层路径和所述并行的池化路径的输出,以生成来自每个所述子网络的输出表示;
在通过所述子网络处理所述数据之后,通过池化层处理最高子网络的输出,以从所述输入放射体生成降低垂直维度的输出;以及
基于所生成的降低垂直维度的输出对所接收到的3D数据进行分类。
2.根据权利要求1所述的方法,其中所述池化路径是3D最大池化路径。
3.根据权利要求1所述的方法,其中所述池化层是垂直最大池化层。
4.根据权利要求1所述的方法,其中所述3D数据表示3D模型数据、CAD(计算机辅助制图)模型数据或3D点云。
5.根据权利要求1所述的方法,其中第一3D卷积层路径是3×3卷积,其从所述3D数据提取半全局特征。
6.根据权利要求1所述的方法,其中第二3D卷积层路径是5×5卷积,其从所述3D数据提取全局特征。
7.根据权利要求1所述的方法,其中第三3D卷积层路径是1×1卷积,其从所述3D数据提取局部特征。
8.根据权利要求1所述的方法,还包括:在由所述子网络处理之前,将在先的一个或更多个3D和/或2D卷积应用于所述输入放射体。
9.根据权利要求1所述的方法,还包括:在由所述子网络处理之前,将在先的一个或更多个3D和/或2D池化操作应用于所述输入放射体。
10.根据权利要求1所述的方法,还包括:在由所述子网络处理之后,将后处理的一个或更多个3D和/或2D卷积应用于所述输入放射体。
11.根据权利要求1所述的方法,还包括:在由所述子网络处理之后,将后处理的一个或更多个3D和/或2D池化操作应用于所述输入放射体。
12.根据权利要求1所述的方法,还包括:
通过3D批归一化来调节所述子网络中的所述3D卷积层路径的所述输出表示,
其中所述3D批归一化独立地应用于由所述神经网络生成的替代特征体表示中的各个特征并且基于分批应用,
其中,对于批中的所述替代特征体表示,所述3D批归一化缩放和移位图像数据值,使得归一化的替代特征体表示具有所述图像数据值的零均值和单位方差。
13.根据权利要求12所述的方法,还包括通过具有可学习的缩放和移位参数的参数化的非线性激活立即处理所述归一化的替代特征体表示,通过所述可学习的缩放和移位参数训练所述神经网络可抵消所述3D批归一化。
14.一种非暂时性计算机可读存储介质,载有计算机程序指令,当在处理器上执行所述指令时,使得所述处理器实现权利要求1-13中任一项所述的方法。
15.一种系统,包括耦合到存储器的一个或更多个处理器,和用于实现权利要求1-13中任一项所述的方法的装置。
CN201910749196.7A 2015-08-15 2016-08-15 采用3d批归一化的三维(3d)卷积 Active CN110688891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910749196.7A CN110688891B (zh) 2015-08-15 2016-08-15 采用3d批归一化的三维(3d)卷积

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562205718P 2015-08-15 2015-08-15
US62/205,718 2015-08-15
CN201910749196.7A CN110688891B (zh) 2015-08-15 2016-08-15 采用3d批归一化的三维(3d)卷积
CN201680053094.6A CN108140141B (zh) 2015-08-15 2016-08-15 在深度神经网络中对表征输入放射体的三维3d数据进行分类的计算机实现的方法及系统
PCT/US2016/047104 WO2017031088A1 (en) 2015-08-15 2016-08-15 Three-dimensional (3d) convolution with 3d batch normalization

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201680053094.6A Division CN108140141B (zh) 2015-08-15 2016-08-15 在深度神经网络中对表征输入放射体的三维3d数据进行分类的计算机实现的方法及系统

Publications (2)

Publication Number Publication Date
CN110688891A true CN110688891A (zh) 2020-01-14
CN110688891B CN110688891B (zh) 2024-05-31

Family

ID=56802697

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201680053094.6A Active CN108140141B (zh) 2015-08-15 2016-08-15 在深度神经网络中对表征输入放射体的三维3d数据进行分类的计算机实现的方法及系统
CN201910749196.7A Active CN110688891B (zh) 2015-08-15 2016-08-15 采用3d批归一化的三维(3d)卷积

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201680053094.6A Active CN108140141B (zh) 2015-08-15 2016-08-15 在深度神经网络中对表征输入放射体的三维3d数据进行分类的计算机实现的方法及系统

Country Status (7)

Country Link
US (2) US10282663B2 (zh)
EP (2) EP3582151A1 (zh)
JP (3) JP6450053B2 (zh)
CN (2) CN108140141B (zh)
AU (2) AU2016308097B2 (zh)
CA (1) CA2994713C (zh)
WO (1) WO2017031088A1 (zh)

Families Citing this family (229)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10331852B2 (en) 2014-01-17 2019-06-25 Arterys Inc. Medical imaging and efficient sharing of medical imaging information
EP3767630A1 (en) 2014-01-17 2021-01-20 Arterys Inc. Methods for four dimensional (4d) flow magnetic resonance imaging
JP6706788B2 (ja) * 2015-03-06 2020-06-10 パナソニックIpマネジメント株式会社 画像認識方法、画像認識装置およびプログラム
US11113598B2 (en) 2015-06-01 2021-09-07 Salesforce.Com, Inc. Dynamic memory network
EP3380859A4 (en) 2015-11-29 2019-07-31 Arterys Inc. AUTOMATED SEGMENTATION OF CARDIAC VOLUME
JP7110098B2 (ja) * 2015-12-18 2022-08-01 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 頭部コンピュータ断層撮影における緊急性の特徴の解釈及び定量化
US10853449B1 (en) 2016-01-05 2020-12-01 Deepradiology, Inc. Report formatting for automated or assisted analysis of medical imaging data and medical diagnosis
US11237528B2 (en) * 2016-02-16 2022-02-01 Ademco Inc. System and method for handing off the configuration of a building device from a contractor to a customer using a hang tag or the like
US10565493B2 (en) 2016-09-22 2020-02-18 Salesforce.Com, Inc. Pointer sentinel mixture architecture
GB2555136A (en) * 2016-10-21 2018-04-25 Nokia Technologies Oy A method for analysing media content
US10839284B2 (en) 2016-11-03 2020-11-17 Salesforce.Com, Inc. Joint many-task neural network model for multiple natural language processing (NLP) tasks
US10963782B2 (en) 2016-11-04 2021-03-30 Salesforce.Com, Inc. Dynamic coattention network for question answering
US20180129937A1 (en) 2016-11-04 2018-05-10 Salesforce.Com, Inc. Quasi-recurrent neural network
US10565305B2 (en) 2016-11-18 2020-02-18 Salesforce.Com, Inc. Adaptive attention model for image captioning
EP3573520A4 (en) 2017-01-27 2020-11-04 Arterys Inc. AUTOMATED SEGMENTATION USING FULLY CONVOLUTIVE NETWORKS
KR101902883B1 (ko) 2017-02-22 2018-10-01 연세대학교 산학협력단 컴퓨터 단층촬영 영상에서 플라크를 분석하기 위한 방법 및 장치
US11164308B2 (en) * 2017-02-27 2021-11-02 The Regents Of The University Of California System and method for improved medical images
US11308391B2 (en) * 2017-03-06 2022-04-19 Baidu Usa Llc Offline combination of convolutional/deconvolutional and batch-norm layers of convolutional neural network models for autonomous driving vehicles
US10896367B2 (en) * 2017-03-07 2021-01-19 Google Llc Depth concatenation using a matrix computation unit
US11250311B2 (en) 2017-03-15 2022-02-15 Salesforce.Com, Inc. Deep neural network-based decision network
US11468318B2 (en) * 2017-03-17 2022-10-11 Portland State University Frame interpolation via adaptive convolution and adaptive separable convolution
US12089977B2 (en) 2017-03-24 2024-09-17 Pie Medical Imaging B.V. Method and system for assessing vessel obstruction based on machine learning
US10475214B2 (en) * 2017-04-05 2019-11-12 General Electric Company Tomographic reconstruction based on deep learning
JP2018175227A (ja) 2017-04-10 2018-11-15 富士フイルム株式会社 医用画像表示装置、方法およびプログラム
US10565318B2 (en) 2017-04-14 2020-02-18 Salesforce.Com, Inc. Neural machine translation with latent tree attention
EP3616120B1 (en) 2017-04-27 2024-09-04 Retinascan Limited System and method for automated funduscopic image analysis
CN108805261B (zh) * 2017-04-28 2021-11-12 微软技术许可有限责任公司 基于八叉树的卷积神经网络
CN107194559B (zh) * 2017-05-12 2020-06-05 杭州电子科技大学 一种基于三维卷积神经网络的工作流识别方法
US11386327B2 (en) 2017-05-18 2022-07-12 Salesforce.Com, Inc. Block-diagonal hessian-free optimization for recurrent and convolutional neural networks
US10817650B2 (en) 2017-05-19 2020-10-27 Salesforce.Com, Inc. Natural language processing using context specific word vectors
CN107133496B (zh) * 2017-05-19 2020-08-25 浙江工业大学 基于流形学习与闭环深度卷积双网络模型的基因特征提取方法
CN107067043B (zh) * 2017-05-25 2020-07-24 哈尔滨工业大学 一种农作物病虫害检测方法
CN107392097B (zh) * 2017-06-15 2020-07-07 中山大学 一种单目彩色视频的三维人体关节点定位方法
WO2019004350A1 (ja) * 2017-06-29 2019-01-03 株式会社 Preferred Networks データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法
JP2020525258A (ja) * 2017-06-30 2020-08-27 プロマトン・ホールディング・ベー・フェー 深層学習法を使用する3d歯顎顔面構造の分類および3dモデリング
EP3432263B1 (en) * 2017-07-17 2020-09-16 Siemens Healthcare GmbH Semantic segmentation for cancer detection in digital breast tomosynthesis
US10706534B2 (en) * 2017-07-26 2020-07-07 Scott Anderson Middlebrooks Method and apparatus for classifying a data point in imaging data
CN108022238B (zh) * 2017-08-09 2020-07-03 深圳科亚医疗科技有限公司 对3d图像中对象进行检测的方法、计算机存储介质和系统
US11514661B2 (en) * 2017-08-21 2022-11-29 Nokia Technologies Oy Method, system and apparatus for pattern recognition
US11373750B2 (en) * 2017-09-08 2022-06-28 The General Hospital Corporation Systems and methods for brain hemorrhage classification in medical images using an artificial intelligence network
US10692602B1 (en) * 2017-09-18 2020-06-23 Deeptradiology, Inc. Structuring free text medical reports with forced taxonomies
US10499857B1 (en) 2017-09-19 2019-12-10 Deepradiology Inc. Medical protocol change in real-time imaging
US10496884B1 (en) 2017-09-19 2019-12-03 Deepradiology Inc. Transformation of textbook information
US10482337B2 (en) * 2017-09-29 2019-11-19 Infineon Technologies Ag Accelerating convolutional neural network computation throughput
EP3462373A1 (en) 2017-10-02 2019-04-03 Promaton Holding B.V. Automated classification and taxonomy of 3d teeth data using deep learning methods
US11087211B2 (en) * 2017-10-05 2021-08-10 Salesforce.Com, Inc. Convolutional neural network (CNN)-based suggestions for anomaly input
US10803984B2 (en) 2017-10-06 2020-10-13 Canon Medical Systems Corporation Medical image processing apparatus and medical image processing system
US10635813B2 (en) 2017-10-06 2020-04-28 Sophos Limited Methods and apparatus for using machine learning on multiple file fragments to identify malware
US11517197B2 (en) 2017-10-06 2022-12-06 Canon Medical Systems Corporation Apparatus and method for medical image reconstruction using deep learning for computed tomography (CT) image noise and artifacts reduction
BR112020007105A2 (pt) * 2017-10-09 2020-09-24 The Board Of Trustees Of The Leland Stanford Junior University método para treinar um dispositivo de diagnóstico por imagem para realizar uma imagem para diagnóstico médico com uma dose reduzida de agente de contraste
US10083375B1 (en) * 2017-10-13 2018-09-25 StradVision, Inc. Method and device for performing activation and convolution operation at the same time and learning method and learning device for the same
US10049323B1 (en) * 2017-10-13 2018-08-14 StradVision, Inc. Method and device for performing activation and convolution operation at the same time and learning method and learning device for the same
CN109684901B (zh) * 2017-10-19 2023-06-06 富士通株式会社 图像处理装置和图像处理方法
EP3699863A4 (en) * 2017-10-24 2020-10-14 Toru Nagasaka IMAGE INTERPRETATION DEVICE
US11170287B2 (en) 2017-10-27 2021-11-09 Salesforce.Com, Inc. Generating dual sequence inferences using a neural network model
US10573295B2 (en) 2017-10-27 2020-02-25 Salesforce.Com, Inc. End-to-end speech recognition with policy learning
US11604956B2 (en) 2017-10-27 2023-03-14 Salesforce.Com, Inc. Sequence-to-sequence prediction using a neural network model
US11562287B2 (en) 2017-10-27 2023-01-24 Salesforce.Com, Inc. Hierarchical and interpretable skill acquisition in multi-task reinforcement learning
US10592767B2 (en) 2017-10-27 2020-03-17 Salesforce.Com, Inc. Interpretable counting in visual question answering
US11928600B2 (en) 2017-10-27 2024-03-12 Salesforce, Inc. Sequence-to-sequence prediction using a neural network model
US10783640B2 (en) * 2017-10-30 2020-09-22 Beijing Keya Medical Technology Co., Ltd. Systems and methods for image segmentation using a scalable and compact convolutional neural network
CN107817898B (zh) * 2017-10-31 2022-07-22 努比亚技术有限公司 操作模式识别方法、终端及存储介质
US10535001B2 (en) 2017-11-06 2020-01-14 International Business Machines Corporation Reducing problem complexity when analyzing 3-D images
US20200321130A1 (en) * 2017-11-13 2020-10-08 The Trustees Of Columbia University In The City Of New York System, method and computer-accessible medium for determining breast cancer risk
US10542270B2 (en) 2017-11-15 2020-01-21 Salesforce.Com, Inc. Dense video captioning
US11551353B2 (en) 2017-11-22 2023-01-10 Arterys Inc. Content based image retrieval for lesion analysis
CN107885464B (zh) * 2017-11-28 2021-11-02 北京小米移动软件有限公司 数据存储方法、装置及计算机可读存储介质
WO2019108252A1 (en) * 2017-12-03 2019-06-06 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping
US10565729B2 (en) 2017-12-03 2020-02-18 Facebook, Inc. Optimizations for dynamic object instance detection, segmentation, and structure mapping
US10796452B2 (en) 2017-12-03 2020-10-06 Facebook, Inc. Optimizations for structure mapping and up-sampling
US11276002B2 (en) 2017-12-20 2022-03-15 Salesforce.Com, Inc. Hybrid training of deep networks
CN108009634B (zh) * 2017-12-21 2021-05-25 美的集团股份有限公司 一种卷积神经网络的优化方法、装置及计算机存储介质
EP3503038A1 (en) 2017-12-22 2019-06-26 Promaton Holding B.V. Automated 3d root shape prediction using deep learning methods
CN108109102B (zh) * 2017-12-28 2021-11-23 珠海市君天电子科技有限公司 一种数据处理方法、装置、电子设备及存储介质
CN108280453B (zh) * 2018-01-08 2020-06-16 西安电子科技大学 基于深度学习的低功耗快速检测图像目标方法
US10664966B2 (en) 2018-01-25 2020-05-26 International Business Machines Corporation Anomaly detection using image-based physical characterization
WO2019145912A1 (en) 2018-01-26 2019-08-01 Sophos Limited Methods and apparatus for detection of malicious documents using machine learning
US11941491B2 (en) 2018-01-31 2024-03-26 Sophos Limited Methods and apparatus for identifying an impact of a portion of a file on machine learning classification of malicious content
US11164003B2 (en) * 2018-02-06 2021-11-02 Mitsubishi Electric Research Laboratories, Inc. System and method for detecting objects in video sequences
US10776581B2 (en) 2018-02-09 2020-09-15 Salesforce.Com, Inc. Multitask learning as question answering
US10393842B1 (en) * 2018-02-20 2019-08-27 The Board Of Trustees Of The Leland Stanford Junior University Highly-scalable image reconstruction using deep convolutional neural networks with bandpass filtering
US11227218B2 (en) 2018-02-22 2022-01-18 Salesforce.Com, Inc. Question answering from minimal context over documents
US10929607B2 (en) 2018-02-22 2021-02-23 Salesforce.Com, Inc. Dialogue state tracking using a global-local encoder
US10373022B1 (en) * 2018-02-28 2019-08-06 Konica Minolta Laboratory U.S.A., Inc. Text image processing using stroke-aware max-min pooling for OCR system employing artificial neural network
US11106182B2 (en) 2018-03-16 2021-08-31 Salesforce.Com, Inc. Systems and methods for learning for domain adaptation
US10783875B2 (en) 2018-03-16 2020-09-22 Salesforce.Com, Inc. Unsupervised non-parallel speech domain adaptation using a multi-discriminator adversarial network
CN108446730B (zh) * 2018-03-16 2021-05-28 推想医疗科技股份有限公司 一种基于深度学习的ct肺结节检测装置
US11030780B2 (en) * 2018-03-26 2021-06-08 The Board Of Trustees Of The Leland Stanford Junior University Ultrasound speckle reduction and image reconstruction using deep learning techniques
EP3547254A1 (de) 2018-03-29 2019-10-02 Siemens Healthcare GmbH Analyse-verfahren und analyseeinheit zur ermittlung radiologischer ergebnisdaten
US10699407B2 (en) 2018-04-11 2020-06-30 Pie Medical Imaging B.V. Method and system for assessing vessel obstruction based on machine learning
US11367222B2 (en) 2018-04-20 2022-06-21 Hewlett-Packard Development Company, L.P. Three-dimensional shape classification and retrieval using convolutional neural networks and majority vote
EP3561778A1 (en) 2018-04-26 2019-10-30 Promaton Holding B.V. Automated correction of metal affected voxel representations of x-ray data using deep learning techniques
CN108717869B (zh) * 2018-05-03 2021-08-13 中国石油大学(华东) 基于卷积神经网络的糖尿病视网膜并发症诊断辅助系统
CN110163834B (zh) * 2018-05-14 2023-08-25 腾讯科技(深圳)有限公司 对象识别方法和装置及存储介质
US11600194B2 (en) 2018-05-18 2023-03-07 Salesforce.Com, Inc. Multitask learning as question answering
US10909157B2 (en) 2018-05-22 2021-02-02 Salesforce.Com, Inc. Abstraction of text summarization
US11631009B2 (en) 2018-05-23 2023-04-18 Salesforce.Com, Inc Multi-hop knowledge graph reasoning with reward shaping
CN108960053A (zh) * 2018-05-28 2018-12-07 北京陌上花科技有限公司 归一化处理方法及装置、客户端
CN108959728B (zh) * 2018-06-12 2023-04-07 杭州法动科技有限公司 基于深度学习的射频器件参数优化方法
CN108921283A (zh) * 2018-06-13 2018-11-30 深圳市商汤科技有限公司 深度神经网络的归一化方法和装置、设备、存储介质
US11625609B2 (en) * 2018-06-14 2023-04-11 International Business Machines Corporation Integration of external applications into deep neural networks
JP7020312B2 (ja) * 2018-06-15 2022-02-16 日本電信電話株式会社 画像特徴学習装置、画像特徴学習方法、画像特徴抽出装置、画像特徴抽出方法、及びプログラム
EP3814981A4 (en) * 2018-06-26 2022-01-26 Nokia Technologies OY METHOD AND DEVICE FOR COMPUTER VIEWING
US11690551B2 (en) 2018-07-30 2023-07-04 Biosense Webster (Israel) Ltd. Left atrium shape reconstruction from sparse location measurements using neural networks
CN109102070B (zh) * 2018-08-22 2020-11-24 地平线(上海)人工智能技术有限公司 卷积神经网络数据的预处理方法和装置
US11436481B2 (en) 2018-09-18 2022-09-06 Salesforce.Com, Inc. Systems and methods for named entity recognition
US10970486B2 (en) * 2018-09-18 2021-04-06 Salesforce.Com, Inc. Using unstructured input to update heterogeneous data stores
US11514915B2 (en) 2018-09-27 2022-11-29 Salesforce.Com, Inc. Global-to-local memory pointer networks for task-oriented dialogue
US11645509B2 (en) 2018-09-27 2023-05-09 Salesforce.Com, Inc. Continual neural network learning via explicit structure learning
US11029694B2 (en) 2018-09-27 2021-06-08 Salesforce.Com, Inc. Self-aware visual-textual co-grounded navigation agent
US11087177B2 (en) 2018-09-27 2021-08-10 Salesforce.Com, Inc. Prediction-correction approach to zero shot learning
US11947668B2 (en) * 2018-10-12 2024-04-02 Sophos Limited Methods and apparatus for preserving information between layers within a neural network
CN113168499A (zh) * 2018-10-13 2021-07-23 伊普拉利技术有限公司 检索专利文档的方法
CN109448039B (zh) * 2018-10-22 2021-12-10 浙江科技学院 一种基于深度卷积神经网络的单目视觉深度估计方法
CN111144560B (zh) * 2018-11-05 2024-02-02 杭州海康威视数字技术股份有限公司 一种深度神经网络运算方法及装置
US11043005B2 (en) * 2018-11-23 2021-06-22 Volvo Car Corporation Lidar-based multi-person pose estimation
CN109711269B (zh) * 2018-12-03 2023-06-20 辽宁工程技术大学 一种基于3d卷积谱空特征融合的高光谱图像分类算法
CN109754389B (zh) * 2018-12-07 2021-08-24 北京市商汤科技开发有限公司 一种图像处理方法、装置及设备
US10963652B2 (en) 2018-12-11 2021-03-30 Salesforce.Com, Inc. Structured text translation
US11822897B2 (en) 2018-12-11 2023-11-21 Salesforce.Com, Inc. Systems and methods for structured text translation with tag alignment
US11995854B2 (en) * 2018-12-19 2024-05-28 Nvidia Corporation Mesh reconstruction using data-driven priors
CN109730656A (zh) * 2019-01-09 2019-05-10 中国科学院苏州纳米技术与纳米仿生研究所 用于脉搏波信号分类的神经网络系统、计算机设备
CN109784476B (zh) * 2019-01-12 2022-08-16 福州大学 一种改进dsod网络的方法
US11922323B2 (en) 2019-01-17 2024-03-05 Salesforce, Inc. Meta-reinforcement learning gradient estimation with variance reduction
US10325185B1 (en) * 2019-01-23 2019-06-18 StradVision, Inc. Method and device for online batch normalization, on-device learning, and continual learning applicable to mobile devices or IOT devices additionally referring to one or more previous batches to be used for military purpose, drone or robot, and testing method and testing device using the same
CN109799977B (zh) * 2019-01-25 2021-07-27 西安电子科技大学 指令程序开发调度数据的方法及系统
US20200242771A1 (en) * 2019-01-25 2020-07-30 Nvidia Corporation Semantic image synthesis for generating substantially photorealistic images using neural networks
US10372573B1 (en) * 2019-01-28 2019-08-06 StradVision, Inc. Method and device for generating test patterns and selecting optimized test patterns among the test patterns in order to verify integrity of convolution operations to enhance fault tolerance and fluctuation robustness in extreme situations
US11574052B2 (en) 2019-01-31 2023-02-07 Sophos Limited Methods and apparatus for using machine learning to detect potentially malicious obfuscated scripts
JP7433767B2 (ja) 2019-01-31 2024-02-20 潔 佐賀 マルチテナント管理装置、マルチテナント管理方法、及びプログラム
EP3690753A1 (en) * 2019-02-04 2020-08-05 Elektrobit Automotive GmbH Determination of the driving context of a vehicle
CN109919046B (zh) * 2019-02-19 2020-10-13 清华大学 一种基于关系特征的三维点云特征学习方法和装置
US11562201B2 (en) * 2019-02-25 2023-01-24 Microsoft Technology Licensing, Llc Neural network layer processing with normalization and transformation of data
US11568306B2 (en) 2019-02-25 2023-01-31 Salesforce.Com, Inc. Data privacy protected machine learning systems
US10839543B2 (en) * 2019-02-26 2020-11-17 Baidu Usa Llc Systems and methods for depth estimation using convolutional spatial propagation networks
US11003867B2 (en) 2019-03-04 2021-05-11 Salesforce.Com, Inc. Cross-lingual regularization for multilingual generalization
US11366969B2 (en) 2019-03-04 2022-06-21 Salesforce.Com, Inc. Leveraging language models for generating commonsense explanations
US11087092B2 (en) 2019-03-05 2021-08-10 Salesforce.Com, Inc. Agent persona grounded chit-chat generation framework
US11580445B2 (en) 2019-03-05 2023-02-14 Salesforce.Com, Inc. Efficient off-policy credit assignment
US11308639B2 (en) 2019-03-12 2022-04-19 Volvo Car Corporation Tool and method for annotating a human pose in 3D point cloud data
US20200293878A1 (en) * 2019-03-13 2020-09-17 Expedia, Inc. Handling categorical field values in machine learning applications
CN110060290B (zh) * 2019-03-14 2021-06-04 中山大学 一种基于3d卷积神经网络的双目视差计算方法
WO2020190870A1 (en) * 2019-03-15 2020-09-24 The Trustees Of Columbia University In The City Of New York System, method and computer-accessible medium for image reconstruction of non-cartesian magnetic resonance imaging information using deep learning
US11232308B2 (en) 2019-03-22 2022-01-25 Salesforce.Com, Inc. Two-stage online detection of action start in untrimmed videos
US11354573B2 (en) 2019-03-25 2022-06-07 International Business Machines Corporation Dynamically resizing minibatch in neural network execution
US11281863B2 (en) 2019-04-18 2022-03-22 Salesforce.Com, Inc. Systems and methods for unifying question answering and text classification via span extraction
WO2020223434A1 (en) * 2019-04-30 2020-11-05 The Trustees Of Columbia University In The City Of New York Classifying neurological disease status using deep learning
CN110045348A (zh) * 2019-05-05 2019-07-23 应急管理部上海消防研究所 一种基于改进卷积神经网络的人体运动状态分类方法
CN110222726A (zh) * 2019-05-15 2019-09-10 北京字节跳动网络技术有限公司 图像处理方法、装置及电子设备
US11487939B2 (en) 2019-05-15 2022-11-01 Salesforce.Com, Inc. Systems and methods for unsupervised autoregressive text compression
US11620572B2 (en) 2019-05-16 2023-04-04 Salesforce.Com, Inc. Solving sparse reward tasks using self-balancing shaped rewards
US11604965B2 (en) 2019-05-16 2023-03-14 Salesforce.Com, Inc. Private deep learning
US11562251B2 (en) 2019-05-16 2023-01-24 Salesforce.Com, Inc. Learning world graphs to accelerate hierarchical reinforcement learning
US11062183B2 (en) * 2019-05-21 2021-07-13 Wipro Limited System and method for automated 3D training content generation
US11687588B2 (en) 2019-05-21 2023-06-27 Salesforce.Com, Inc. Weakly supervised natural language localization networks for video proposal prediction based on a text query
US11775775B2 (en) 2019-05-21 2023-10-03 Salesforce.Com, Inc. Systems and methods for reading comprehension for a question answering task
US11669712B2 (en) 2019-05-21 2023-06-06 Salesforce.Com, Inc. Robustness evaluation via natural typos
US11657269B2 (en) * 2019-05-23 2023-05-23 Salesforce.Com, Inc. Systems and methods for verification of discriminative models
EP3751579A1 (en) 2019-06-13 2020-12-16 RaySearch Laboratories AB System and method for training a machine learning model and for providing an estimated interior image of a patient
WO2021002356A1 (ja) * 2019-07-02 2021-01-07 コニカミノルタ株式会社 放射線画像判定装置、検査システム及びプログラム
CN112215329B (zh) * 2019-07-09 2023-09-29 杭州海康威视数字技术股份有限公司 基于神经网络的卷积计算方法及装置
TWI702615B (zh) * 2019-07-26 2020-08-21 長佳智能股份有限公司 視網膜病變評估模型建立方法及系統
CN110516305B (zh) * 2019-07-26 2021-02-12 西安交通大学 基于注意机制元学习模型的小样本下故障智能诊断方法
US11443137B2 (en) 2019-07-31 2022-09-13 Rohde & Schwarz Gmbh & Co. Kg Method and apparatus for detecting signal features
US11615240B2 (en) 2019-08-15 2023-03-28 Salesforce.Com, Inc Systems and methods for a transformer network with tree-based attention for natural language processing
WO2021042124A1 (en) * 2019-08-28 2021-03-04 Visualize K.K. Methods and systems for predicting pressure maps of 3d objects from 2d phots using deep learning
CN110598852A (zh) * 2019-08-29 2019-12-20 北京小米移动软件有限公司 子网络采样方法、构建超网络拓扑结构的方法及装置
CN110826687B (zh) * 2019-08-30 2023-11-21 安谋科技(中国)有限公司 数据处理方法及其装置、介质和系统
CN110619359B (zh) * 2019-09-06 2020-11-27 上海杏脉信息科技有限公司 一种根据人体医学影像确定肺结核分级的方法与装置
CN110827208A (zh) * 2019-09-19 2020-02-21 重庆特斯联智慧科技股份有限公司 卷积神经网络的通用池化增强方法、装置、设备及介质
US11599792B2 (en) 2019-09-24 2023-03-07 Salesforce.Com, Inc. System and method for learning with noisy labels as semi-supervised learning
US11568000B2 (en) 2019-09-24 2023-01-31 Salesforce.Com, Inc. System and method for automatic task-oriented dialog system
US11640527B2 (en) 2019-09-25 2023-05-02 Salesforce.Com, Inc. Near-zero-cost differentially private deep learning with teacher ensembles
CN114531911A (zh) * 2019-09-27 2022-05-24 兄弟工业株式会社 机器学习模型、生成装置、计算机程序
CN110660074B (zh) * 2019-10-10 2021-04-16 北京同创信通科技有限公司 一种建立废钢等级划分神经网络模型方法
US11475283B2 (en) 2019-10-24 2022-10-18 Apple Inc. Multi dimensional convolution in neural network processor
US11410302B2 (en) * 2019-10-31 2022-08-09 Tencent America LLC Two and a half dimensional convolutional neural network for predicting hematoma expansion in non-contrast head computerized tomography images
US11620515B2 (en) 2019-11-07 2023-04-04 Salesforce.Com, Inc. Multi-task knowledge distillation for language model
CN112783890B (zh) * 2019-11-08 2024-05-07 珠海金山办公软件有限公司 一种生成数据透视表行的方法及装置
US11347708B2 (en) 2019-11-11 2022-05-31 Salesforce.Com, Inc. System and method for unsupervised density based table structure identification
US11334766B2 (en) 2019-11-15 2022-05-17 Salesforce.Com, Inc. Noise-resistant object detection with noisy annotations
US11288438B2 (en) 2019-11-15 2022-03-29 Salesforce.Com, Inc. Bi-directional spatial-temporal reasoning for video-grounded dialogues
US11922303B2 (en) 2019-11-18 2024-03-05 Salesforce, Inc. Systems and methods for distilled BERT-based training model for text classification
US11537899B2 (en) 2019-11-18 2022-12-27 Salesforce.Com, Inc. Systems and methods for out-of-distribution classification
KR20210062838A (ko) * 2019-11-22 2021-06-01 엘지전자 주식회사 인공지능 기반의 음성처리 방법
KR20210066207A (ko) * 2019-11-28 2021-06-07 엘지전자 주식회사 객체를 인식하는 인공 지능 장치 및 그 방법
JP7337675B2 (ja) 2019-12-04 2023-09-04 キヤノンメディカルシステムズ株式会社 医用データ処理装置
CN111105015A (zh) * 2019-12-06 2020-05-05 浪潮(北京)电子信息产业有限公司 一种通用cnn推理加速器及其控制方法、可读存储介质
US11416688B2 (en) 2019-12-09 2022-08-16 Salesforce.Com, Inc. Learning dialogue state tracking with limited labeled data
US11573957B2 (en) 2019-12-09 2023-02-07 Salesforce.Com, Inc. Natural language processing engine for translating questions into executable database queries
US11640505B2 (en) 2019-12-09 2023-05-02 Salesforce.Com, Inc. Systems and methods for explicit memory tracker with coarse-to-fine reasoning in conversational machine reading
US12086539B2 (en) 2019-12-09 2024-09-10 Salesforce, Inc. System and method for natural language processing using neural network with cross-task training
US11256754B2 (en) 2019-12-09 2022-02-22 Salesforce.Com, Inc. Systems and methods for generating natural language processing training samples with inflectional perturbations
US11487999B2 (en) 2019-12-09 2022-11-01 Salesforce.Com, Inc. Spatial-temporal reasoning through pretrained language models for video-grounded dialogues
US11514292B2 (en) 2019-12-30 2022-11-29 International Business Machines Corporation Grad neural networks for unstructured data
US11669745B2 (en) 2020-01-13 2023-06-06 Salesforce.Com, Inc. Proposal learning for semi-supervised object detection
US11562147B2 (en) 2020-01-23 2023-01-24 Salesforce.Com, Inc. Unified vision and dialogue transformer with BERT
JP7322358B2 (ja) * 2020-01-30 2023-08-08 富士通株式会社 情報処理プログラム、情報処理方法、及び情報処理装置
US11710042B2 (en) * 2020-02-05 2023-07-25 Adobe Inc. Shaping a neural network architecture utilizing learnable sampling layers
US20210249104A1 (en) 2020-02-06 2021-08-12 Salesforce.Com, Inc. Systems and methods for language modeling of protein engineering
US11663481B2 (en) 2020-02-24 2023-05-30 Adobe Inc. Neural network architecture pruning
CN111340964B (zh) * 2020-03-05 2023-03-24 长春中国光学科学技术馆 一种基于迁移学习的3d模型图像的构建方法
US11263476B2 (en) 2020-03-19 2022-03-01 Salesforce.Com, Inc. Unsupervised representation learning with contrastive prototypes
US11328731B2 (en) 2020-04-08 2022-05-10 Salesforce.Com, Inc. Phone-based sub-word units for end-to-end speech recognition
US20210350550A1 (en) * 2020-05-11 2021-11-11 Nvidia Corporation Gaze estimation using one or more neural networks
US11295430B2 (en) 2020-05-20 2022-04-05 Bank Of America Corporation Image analysis architecture employing logical operations
US11379697B2 (en) 2020-05-20 2022-07-05 Bank Of America Corporation Field programmable gate array architecture for image analysis
CN111797971B (zh) * 2020-05-27 2024-08-23 北京迈格威科技有限公司 应用卷积神经网络进行数据处理的方法、装置和电子系统
US11669699B2 (en) 2020-05-31 2023-06-06 Saleforce.com, inc. Systems and methods for composed variational natural language generation
US11720559B2 (en) 2020-06-02 2023-08-08 Salesforce.Com, Inc. Bridging textual and tabular data for cross domain text-to-query language semantic parsing with a pre-trained transformer language encoder and anchor text
CN111783570A (zh) * 2020-06-16 2020-10-16 厦门市美亚柏科信息股份有限公司 一种目标重识别的方法、装置、系统及计算机存储介质
US11694330B2 (en) 2020-07-13 2023-07-04 Canon Medical Systems Corporation Medical image processing apparatus, system, and method
US20220050877A1 (en) 2020-08-14 2022-02-17 Salesforce.Com, Inc. Systems and methods for query autocompletion
US11934952B2 (en) 2020-08-21 2024-03-19 Salesforce, Inc. Systems and methods for natural language processing using joint energy-based models
US11934781B2 (en) 2020-08-28 2024-03-19 Salesforce, Inc. Systems and methods for controllable text summarization
CN112182219A (zh) * 2020-10-09 2021-01-05 杭州电子科技大学 一种基于日志语义分析的在线服务异常检测方法
US11829442B2 (en) 2020-11-16 2023-11-28 Salesforce.Com, Inc. Methods and systems for efficient batch active learning of a deep neural network
US12080289B2 (en) * 2020-12-22 2024-09-03 Samsung Electronics Co., Ltd. Electronic apparatus, system comprising electronic apparatus and server and controlling method thereof
CN114881913A (zh) * 2021-02-05 2022-08-09 富泰华工业(深圳)有限公司 图像瑕疵检测方法、装置、电子设备及存储介质
US11842492B2 (en) 2021-04-16 2023-12-12 Natasha IRONSIDE Cerebral hematoma volume analysis
US11915829B2 (en) 2021-04-19 2024-02-27 Natasha IRONSIDE Perihematomal edema analysis in CT images
US12010129B2 (en) 2021-04-23 2024-06-11 Sophos Limited Methods and apparatus for using machine learning to classify malicious infrastructure
US11875898B2 (en) 2021-05-26 2024-01-16 Merative Us L.P. Automatic condition diagnosis using an attention-guided framework
US11830187B2 (en) 2021-05-26 2023-11-28 International Business Machines Corporation Automatic condition diagnosis using a segmentation-guided framework
CN113469427A (zh) * 2021-06-24 2021-10-01 国网山东省电力公司东营供电公司 基于卷积lstm的光伏电站日前发电量预测方法及系统
CN113627434B (zh) * 2021-07-07 2024-05-28 中国科学院自动化研究所 一种应用于自然图像的处理模型的搭建方法及装置
CN113568068B (zh) * 2021-07-22 2022-03-29 河南大学 一种基于mpi并行的三维神经网络的强对流天气预测方法
US12106045B2 (en) * 2021-10-13 2024-10-01 International Business Machines Corporation Self-learning annotations to generate rules to be utilized by rule-based system
CN117593610B (zh) * 2024-01-17 2024-04-26 上海秋葵扩视仪器有限公司 图像识别网络训练及部署、识别方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847210A (zh) * 2010-06-25 2010-09-29 哈尔滨工业大学 基于二维经验模态分解和小波降噪的多分组图像分类方法
CN103369303A (zh) * 2013-06-24 2013-10-23 深圳市宇恒互动科技开发有限公司 动作行为分析记录及重现的系统及方法
CN103366180A (zh) * 2013-06-14 2013-10-23 山东大学 一种基于自动特征学习的细胞图像分割方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125194A (en) * 1996-02-06 2000-09-26 Caelum Research Corporation Method and system for re-screening nodules in radiological images using multi-resolution processing, neural network, and image processing
JP5368687B2 (ja) * 2007-09-26 2013-12-18 キヤノン株式会社 演算処理装置および方法
WO2016033506A1 (en) 2014-08-29 2016-03-03 Google Inc. Processing images using deep neural networks
EP3065086A1 (en) * 2015-03-02 2016-09-07 Medizinische Universität Wien Computerized device and method for processing image data
WO2016161115A1 (en) * 2015-03-31 2016-10-06 Mayo Foundation For Medical Education And Research System and methods for automatic polyp detection using convolutional neural networks
JP6383321B2 (ja) * 2015-04-08 2018-08-29 株式会社エクスメディオ 診断支援システム
CA2982526C (en) * 2015-04-13 2020-04-14 Case Western Reserve University Dual energy x-ray coronary calcium grading
US11113598B2 (en) 2015-06-01 2021-09-07 Salesforce.Com, Inc. Dynamic memory network
US20160350653A1 (en) 2015-06-01 2016-12-01 Salesforce.Com, Inc. Dynamic Memory Network
WO2016194161A1 (ja) * 2015-06-03 2016-12-08 株式会社日立製作所 超音波診断装置、及び画像処理方法
US20170032280A1 (en) 2015-07-27 2017-02-02 Salesforce.Com, Inc. Engagement estimator

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847210A (zh) * 2010-06-25 2010-09-29 哈尔滨工业大学 基于二维经验模态分解和小波降噪的多分组图像分类方法
CN103366180A (zh) * 2013-06-14 2013-10-23 山东大学 一种基于自动特征学习的细胞图像分割方法
CN103369303A (zh) * 2013-06-24 2013-10-23 深圳市宇恒互动科技开发有限公司 动作行为分析记录及重现的系统及方法

Also Published As

Publication number Publication date
JP2018531648A (ja) 2018-11-01
US20190213482A1 (en) 2019-07-11
US11416747B2 (en) 2022-08-16
CA2994713C (en) 2019-02-12
AU2018229500A1 (en) 2018-10-04
EP3335158A1 (en) 2018-06-20
EP3335158B1 (en) 2019-07-24
JP2021093178A (ja) 2021-06-17
EP3582151A1 (en) 2019-12-18
JP6450053B2 (ja) 2019-01-09
CN110688891B (zh) 2024-05-31
AU2016308097B2 (en) 2018-08-02
JP7094407B2 (ja) 2022-07-01
US20170046616A1 (en) 2017-02-16
WO2017031088A1 (en) 2017-02-23
US10282663B2 (en) 2019-05-07
CN108140141B (zh) 2019-09-06
AU2016308097A1 (en) 2018-03-08
CN108140141A (zh) 2018-06-08
JP2019061710A (ja) 2019-04-18
AU2018229500B2 (en) 2020-01-16
JP6838038B2 (ja) 2021-03-03
CA2994713A1 (en) 2017-02-23

Similar Documents

Publication Publication Date Title
US11416747B2 (en) Three-dimensional (3D) convolution with 3D batch normalization
Arbabshirani et al. Advanced machine learning in action: identification of intracranial hemorrhage on computed tomography scans of the head with clinical workflow integration
Sethi et al. [Retracted] Classification of Alzheimer’s Disease Using Gaussian‐Based Bayesian Parameter Optimization for Deep Convolutional LSTM Network
US11751832B2 (en) CTA large vessel occlusion model
JP2021056995A (ja) 医用情報処理装置、医用情報処理システム及び医用情報処理方法
Naga Srinivasu et al. Variational Autoencoders‐BasedSelf‐Learning Model for Tumor Identification and Impact Analysis from 2‐D MRI Images
Jia et al. Alzheimer’s disease classification based on image transformation and features fusion
Cepa et al. Generative Adversarial Networks in Healthcare: A Case Study on MRI Image Generation
CN117616467A (zh) 训练并使用深度学习算法来基于降维表示比较医学图像的方法
Aggarwal et al. Privacy preserved collaborative transfer learning model with heterogeneous distributed data for brain tumor classification
Ma et al. Nonlocal atlas‐guided multi‐channel forest learning for human brain labeling
Tripathi et al. Generating OCT B-Scan DME images using optimized Generative Adversarial Networks (GANs)
Kharrat et al. Brain tumour diagnostic segmentation based on optimal texture features and support vector machine classifier
CN113707249A (zh) 医疗影像处理方法、装置和存储介质
Dos Santos et al. Unsupervised model for structure segmentation applied to brain computed tomography
US12039721B2 (en) Classification of organ of interest shapes for autosegmentation quality assurance
WO2023121510A1 (ru) Определение патологии органов грудной клетки на основе рентгеновских изображений
Uddin et al. Traumatic meningeal enhancement detection by deep learning-based biomedical image analysis and handcrafted features extraction
Xue et al. Unsupervised Domain Adaptation for Simultaneous Segmentation and Classification of the Retinal Arteries and Veins
Chaptoukaev et al. HyperMM: Robust Multimodal Learning with Varying-sized Inputs
Kanwal et al. A Novel Ensemble Framework for Breast Cancer Detection using Ultrasound Imaging and Advance Augmentation Techniques
CN118057449A (zh) 在线自适应放射疗法中的患者特异性自动分割
EA045328B1 (ru) Устройство и способ для определения патологии органов грудной клетки на основе рентгеновских изображений
Shafi et al. Ensemble self-attention technology for improving the accuracy and efficiency of lung disease diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: California, USA

Applicant after: Shuo Power Co.

Address before: California, USA

Applicant before: SALESFORCE.COM, Inc.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant