CN110110843A - 用于处理图像的方法和系统 - Google Patents

用于处理图像的方法和系统 Download PDF

Info

Publication number
CN110110843A
CN110110843A CN201910116683.XA CN201910116683A CN110110843A CN 110110843 A CN110110843 A CN 110110843A CN 201910116683 A CN201910116683 A CN 201910116683A CN 110110843 A CN110110843 A CN 110110843A
Authority
CN
China
Prior art keywords
subnet
output
input picture
layer
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910116683.XA
Other languages
English (en)
Other versions
CN110110843B (zh
Inventor
克里斯蒂安·塞盖迪
文森特·O·瓦努克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN110110843A publication Critical patent/CN110110843A/zh
Application granted granted Critical
Publication of CN110110843B publication Critical patent/CN110110843B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals

Abstract

本发明涉及用于处理图像的方法和系统。用于使用深度神经网络进行图像处理的方法、系统、和装置,其包括在计算机存储介质上编码的计算机程序。所述方法中的一种包括:接收表征输入图像的数据;使用深度神经网络来处理表征所述输入图像的该数据以生成所述输入图像的替选表示,其中,所述深度神经网络包括多个子网,其中,所述子网被布置在从最低到最高的序列中,并且其中,使用所述深度神经网络处理表征所述输入图像的所述数据包括通过所述序列中的所述子网络中的每一个来处理所述数据;以及通过输出层来处理所述输入图像的所述替选表示,以根据所述输入图像来生成输出。

Description

用于处理图像的方法和系统
分案说明
本申请属于申请日为2015年08月28日的中国发明专利申请201580035806.7的分案申请。
技术领域
本说明书涉及使用深度神经网络的图像处理,例如卷积神经网络。
背景技术
卷积神经网络一般包括两种神经网络层,卷积神经网络层和全连接神经网络层。卷积神经网络层具有稀疏的连接性,其中卷积层的每个节点接收来自更低一层的神经网络层的节点子集的输入。一些卷积神经网络层具有与层中其它节点共享权重的节点。然而,全连接层中的节点接收来自更低一层的神经网络层中的每个节点的输入。
发明内容
大体上,本说明书描述了用于使用深度神经网络处理图像的技术。
本说明书中所描述的主题的特定实施例能够被实现,以便实现以下优点中的一个或多个。通过在深度神经网络中包括子网并且具体包括模块子网,该深度神经网络能够更好地执行图像处理任务,例如对象识别或图像分类。此外,与不包含模块子网的深度神经网络相比,包括模块子网的深度神经网络能够更快且更有效率地训练,同时维持图像处理任务的提高的效能。
在附图以及下面的说明书中阐述了本说明书的主题的一个或多个实施例的细节。本主题的其它特征、方面、和优点将根据说明书、附图、和权利要求书而变得显而易见。
附图说明
图1示出了图像处理系统的示例图像。
图2是根据输入图像来生成输出的示例过程的流程图。
图3是使用模块子网来处理输入的示例过程的流程图。
各个附图中相似的附图标记和名称指示相似的元素。
具体实施方式
图1示出了示例图像处理系统100。所述图像处理系统100为一个系统的示例,该系统被实现为一个或多个位置中的一个或多个计算机上的计算机程序,在其中能够实现下文中描述的系统、组件、和技术。
图像处理系统100接收表征输入图像的数据,例如输入图像的像素信息或表征该输入图像的其它信息。例如,所述图像处理系统100能够接收输入图像数据102。图像处理系统100使用深度神经网络150和输出层152来处理所接收的数据以生成该输入图像的输出,例如来自输入图像数据102的输出154。
图像处理系统100能够被配置为接收输入图像数据并且基于该输入图像来生成任何种类的分值或分类输出,即能够被配置为执行任何种类的图像处理任务。由本系统生成的该分值或分类输出取决于图像处理系统已经被配置来确认的任务。例如,对于图像分类或识别任务而言,由图像处理系统100针对给定图像所生成的输出可以是对象类别集合中的每一个的分值,其中每个分值表示该图像包含属于该类别的对象的图像的可能性。作为另一示例,对于对象检测任务而言,由图像处理系统100生成的输出能够识别输入图像中的感兴趣对象的位置、大小,或者这两者。
深度神经网络150包括多个子网络的序列,其从序列中的最低子网到序列中的最高子网来布置,例如包括子网A104、子网B106、和子网C108的序列。深度神经网络150通过序列中的每个子网处理接收的输入图像数据,以生成输入图像的替选表示。一旦深度神经网络150已生成输入图像的替选表示,输出层152就处理该替选表示以生成输入图像的输出。如上所述,由输出层152生成的输出的类型取决于图像处理系统100已经被配置来确认的图像分类任务。类似的,被用于根据该替选表示生成输出的输出层152的类型也取决于该任务。具体的,输出层152是适合于该任务的输出层,即生成对于图像处理任务必要的种类的输出。例如,对于图像分类任务,该输出层可以是softmax输出层,其针对对象类别的集合中的每一个生成相应的分值。
序列中的子网包括多个模块子网以及可选地包括一个或多个其它子网,所述其他子网均由一个或多个常规神经网络层组成,例如,最大池化层、卷积层、全连接层、正则化层等。
在图1的示例中,子网B106被描绘为模块子网。虽然在图1的示例中仅示出了单个模块子网络,但是深度神经网路150一般将包括多个模块子网。模块子网一般包括直通(pass-through)卷积层,例如直通卷积层106、神经网络层的一个或多个群组、以及连结(concatenation)层——如连结层130。模块子网B106接收来自序列中在前的子网的输入,并根据接收的输入来生成输出表示。
连结层130接收由直通卷积层108生成的输出和由神经网络层的群组中的每一个生成的相应输出,并且对接收到的输出进行连结以生成单个输出,其作为子网B106的输出被提供给模块序列中的下一个模块或提供给输出层152。
模块子网络中的神经网络层的每个群组包括两个或更多神经网络层,其中初始神经网络层后面跟随有一个或多个其它神经网络层。例如,子网B106包括:包括第一卷积层110的一个群组,第一卷积层110后面跟随有第二卷积层112;包括卷积层114的另一个群组,卷积层114后面跟随有卷积层116;以及包括最大池化层118的第三群组,最大池化层118后面跟随有卷积层120。
一般,全连接层中的每个节点接收来自序列中的更低一层中的每个节点的输入,并且根据该节点的权重集合来从接收的输入产生激活。给定的全连接层中的每个节点所生成的激活作为输入来被提供给该序列中更高一个全连接层中的每个节点,或者如果该全连接层是序列中的最高层,则提供给输出层152。
与全连接层不同,卷积层一般是稀疏连接的神经网络层。也就是说,卷积层中的每个节点接收来自在前的神经网络层中的节点中的一部分——即少于全部节点的输入,或者如果卷积层是序列中的最低层,则接收对图像处理系统100的输入的一部分,并且根据该输入来产生激活。一般,卷积层具有节点,其通过根据每个节点的权重集合对接收的输入进行卷积来生成激活。在一些情况下,卷积层中的节点可以被配置成共享权重。也就是说,该层中的节点中的一部分可以被约束为总是具有与该层中的其它节点相同的权重值。
下面参照图3来更为详细地描述使用模块子网来处理输入以生成输出表示。
图2是用于根据接收的输入来生成输出的示例过程200的流程图。为了方便,过程200将被描述为由位于一个或多个位置的一个或多个计算机的系统来执行。例如,根据本说明书来适当地编程的图像处理系统——例如图1中的图像处理系统100,能够执行过程200。
该系统接收表征输入图像的数据(步骤202)。
该系统使用包括子网的深度神经网络——例如图1的深度神经网络150来处理数据,以生成替选表示(步骤204)。深度神经网络包括子网的序列,其从序列的最低子网到序列的最高子网来布置。该系统通过序列中的子网中国的每一个来处理数据以生成替选表示。序列中的子网包括多个模块子网,并且可选地包括一个或多个子网,其包括一个或多个常规神经网络层——例如最大池化层、卷积层、全连接层、正则化层等。下面参照图3描述通过模块子网来处理输入。
该系统通过输出层处理替选表示以生成输入图像的输出(步骤206)。一般,由系统生成的输入取决于系统被配置来执行的图像处理任务。例如,如果系统被配置来执行图像分类或识别任务,则由输出层生成的输出可以是预定的对象类别集合中的每一个的相应分值,其中给定对象类别的分值表示输入图像包含属于该对象类别的对象的图像的可能性。
图3是用于使用模块子网来处理输入的示例过程300的流程图。为了方便,过程300将被描述为由位于一个或多个位置中的一个或多个计算机的系统执行。例如,根据本说明书来适当地编程的图像处理系统——例如图1的图像处理系统100,能够执行过程300。
该系统接收输入(步骤302)。具体的,该输入是在前的输出表示,即由子网的序列中的在前的子网生成的输出表示。
该系统通过直通卷积层对该在前的输出表示进行处理,以生成直通输入(步骤304)。在一些实施方式中,该直通卷积层是1×1卷积层。一般地,k×k卷积层是使用k×k滤波器的卷积层。也就是说,k×k表示该卷积层所连接的前一层中的区块(patch)的大小。在这些实施方式中,该1×1直通卷积层一般被用作维度降低模块,以降低在前的输出表示的维度,并去除可能以其他方式限制深度神经网络的大小的计算瓶颈。在其它实施方式中,该直通卷积层能够使用不同大小的滤波器,如3×3卷积层或5×5卷积层。
该系统通过一个或多个神经网络层的群组来处理在前的输出表示(步骤306)。神经网络层的每个群组包括后面跟随有一个或多个附加神经网络层的初始神经网络层。通过利用给定群组中的神经网络层中的每一个来处理在前的输出表示,该系统利用该群组来处理在前的输出表示,以生成该群组的群组输出。
在一些实施方式中,该群组中的一个或多个群组包括后面跟随有另一卷积层的一个卷积层。例如,一个群组可能包括后面跟随有3×3卷积层的1×1卷积层。作为另一示例,另一群组可能包括后面跟随有5×5卷积层的1×1卷积层。如上所述,该1×1卷积层能够被用作维度降低模块,以在在前的输出表示被由1×1卷积层之后的其它卷积层处理之前降低其维度。无论如何,卷积层大小的其它组合也是可能的。
在一些实施方式中,所述群组中的一个或多个群组包括后面跟随有卷积层的最大池化层。例如,该最大池层可以是后面跟随有1×1卷积层的3×3卷积层。无论如何,最大池化层大小和卷积层大小的其它组合也是可能的。
系统将直通输出与群组输出连结,以生成输出表示(步骤308)。例如,系统能够将由直通卷积层和所述群组生成的向量进行连结以生成单个向量,即输出表示。然后,系统能够将该输出表示作为输入提供给序列中的下一个子网络或系统的输出层。
过程200和300能够被执行以针对图像生成分类数据,针对该图像的所期望分类——即系统针对图像应当生成的输入是未知的。过程200和300也能够在训练图像集合——即系统针对其应当预测出的输出是已知的图像集合中的文档上执行,以便训练深度神经网络,即为该深度神经网络中的层——即模块子网和其它子网中的层的参数确定经训练的值。具体的,过程200和300能够在从训练图像集合中选择的图像上重复执行,以作为反向传播训练技术的一部分,所述反向传播训练技术为深度神经网络的层的参数确定经训练的值。
在一些实施方式中,在训练期间,随着在深度神经网络被训练过之后去除了一个或多个其它训练子网,该深度神经网络得以增强。每个其它训练子网(也称为“边楼(sidetower)”)包括:一个或多个卷积神经网络层,例如能够包括平均池化层、全连接层、浅层(dropout layers)等中的一个或多个;以及输出层,其被配置为生成与系统的输出层相同的分类。每个其它训练子网被配置为接收由深度神经网络的子网中的一个生成的输出——即与已经接收子网输出的子网络并行来接收,并且处理该子网输出以针对训练图片来生成训练子网输出。该训练子网输出也被用于调整深度神经网络中的层的参数值,以作为反向传播训练技术的一部分。如上所述,一旦深度神经网络已被训练,训练子网就被去除。
本说明书中所描述的主题和功能操作的实施例能够以数字电子电路、以有形体现的计算机软件或固件、以计算机硬件——包括在本说明书中公开的结构及其结构等同物、或者它们中的一个或多个的组合来实现。本说明书中所描述的主题的实施例能够被实现为一个或多个计算机程序,即计算机程序指令的一个或多个模块,其被编码在有形非暂时性程序载体上,以用于由数据处理装置执行或控制数据处理装置的操作。替选地或另外地,程序指令能够被编码在人工生成的传播信号上,该信号例如机器生成的电、光、或电磁信号,其被生成以对信息进行编码以用于传输到合适的接收器装置,以用于由数据处理装置执行。计算机存储介质能够是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或者它们中的一个或多个的组合。
术语“数据处理装置”包含用于处理数据的各种装置、设备、和机器,其包括例如可编程处理器、计算机、或者多个处理器或多个计算机。该装置能够包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件之外,该装置还能够包括创建用于所讨论的计算机程序的执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统,或它们中的一个或多个的组合的代码。
计算机程序(其也可被称为或描述为程序、软件、软件应用、模块、软件模块、脚本或代码)能够以任何形式的编程语言编写,包括编译或解释语言、或者声明性或过程性语言,并且它能够以任何形式部署,包括作为独立程序或作为模块、组件、子程序、或适合在计算环境中使用的其它单元。计算机程序可以但不必对应于文件系统中的文件。程序能够被存储在保持其它程序或数据——如存储在标记语言文档中的一个或多个脚本——的文件的一部分中、专用于所讨论的程序的单个文件中或多个协同文件——如存储一个或多个模块、子程序、或代码部分的文件中。计算机程序能够被部署来在一个计算机或在位于一个站点或跨多个地点分布并通过通信网络互连的多个站点执行。
本说明书中描述的过程和逻辑流程能够由一个或多个可编程计算机来执行,所述计算机执行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也能够由专用逻辑电路——例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)执行,并且装置也能够被实现为专用逻辑电路。
适合于执行计算机程序的计算机包括:例如能够基于通用或专用微处理器或这两者,或者任何其它种类的中央处理单元。一般地,中央处理单元将从只读存储器或随机存取存储器或这两者接收指令和数据。计算机的必要元件是用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。一般地,计算机还将包括用于存储数据的一个或多个大容量存储设备——例如磁盘、磁光盘、或光盘,或者可操作地耦合以从其接收数据或向其传输数据,或者这两者。然而,计算机不需要具有这样的设备。此外,计算机能够被嵌入另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器、或便携式存储设备——例如通用串行总线(USB)闪存驱动器,仅举数例。
适合于存储计算机程序指令和数据的计算机可读介质包括:所有形式的非易失性存储器、介质及存储器设备,包括例如半导体存储器设备——例如EPROM、EEPROM和闪存设备;磁盘——例如内部硬盘或可移动磁盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器能够由专用逻辑电路补充或并入其中。
为了提供与用户的交互,本说明书所描述主题的实施例能够在具有显示设备、键盘及指示设备的计算机上实现,所述显示设备如CRT(阴极射线管)或LCD(液晶显示器)监视器,其用于向用户提供显示信息,所述指示设备例如鼠标或轨迹球,用户通过其能够提供输入给计算机。其它种类的设备也能够被用于提供与用户的交互;例如,提供给用户的反馈能够是任何形式的感官反馈——例如视觉反馈、听觉反馈、或触觉反馈;并且来自用户的输入能够以任何形式被接收,包括声音、语音、或触觉输入。此外,计算机能够通过以下方式与用户进行交互:向用户所使用的设备发送文档以及从用户所使用的设备接收文档,例如通过响应于从用户的客户端设备上的web浏览器接收的请求,将网页发送到该web浏览器。
本说明书所描述主题的实施例能够在计算系统中实现,该系统包括后端组件——如数据服务器,或包括中间件组件——如应用服务器,或包括前端组件——如具有图形用户界面或Web浏览器的客户端计算机——通过该Web浏览器用户能够与本说明书所描述主题的实施方式进行交互,或者包括一个或多个这样的后端、中间件、或前端组件的任何组合。该系统的组件能够通过例如通信网络的任何形式或介质的数字数据通信来进行互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”),如互联网。
计算机系统能够包括客户端和服务器。客户端和服务器一般彼此处于远程并且通常通过通信网络进行交互。客户端和服务器的关系依靠在相应计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生。
虽然本说明书包含许多具体实施方式细节,但是这些不应被解释为对任何发明或要求保护的范围的限制,应当被解释为可以是特定发明的特定实施例所特有的特征的描述。本说明书中在单独实施例的场境中所描述的某些特征也能够在单个实施例中以组合的方式来实现。相反,在单个实施例的场境中描述的各个特征也能够在多个实施例中单独地或以任何合适的子组合实现。此外,尽管可能将特征描述为在某些组合中起作用并且甚至最初如此要求保护,但是在一些情况下来自所要求保护的组合的一个或多个特征能够从组合中被删去,并且所要求保护的组合可以涉及子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这样的操作以所示的特定顺序或连续顺序执行,或者需要执行所有图示的操作才能达到期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述的实施例中的各个系统模块和组件的分离不应被理解为在所有实施例中都需要这样的分离,并且应当理解,所描述的程序组件和系统通常能够一起集成在单个软件产品中或者封装到多个软件产品中。
已经描述了本主题的特定实施例。其它实施例落入所附权利要求书的范围内。例如,权利要求中所记载的操作能够以不同的顺序执行并且仍然达到期望的结果。作为一个示例,附图中描绘的过程不一定需要所示的特定顺序或连续顺序来达到期望的结果。在某些实施方式中,多任务和并行处理可能是有利的。

Claims (20)

1.一种方法,包括:
在深度神经网络的训练期间,接收表征输入图像的数据;
使用所述深度神经网络来处理表征所述输入图像的所述数据,以生成所述输入图像的替选表示,其中,所述深度神经网络包括多个子网,其中,所述子网被布置在从最低到最高的序列中,其中每个子网接收相应的输入表示并且生成相应的输出表示,所述相应的输出表示被提供作为所述序列中下一个子网的输入,并且其中,使用所述深度神经网络处理表征所述输入图像的所述数据包括通过所述序列中的所述子网中的每一个来处理所述数据;
通过输出层来处理所述输入图像的所述替选表示,以根据所述输入图像生成输出;以及
使用一个或多个其它训练子网来处理来自所述多个子网中的一个或多个子网的所述输出表示,所述一个或多个其它训练子网增强所述深度神经网络以生成所述输入图像的训练子网输出,其中,所述一个或多个其它训练子网中的每一个包括一个或多个神经网络层,其中,所述一个或多个其它训练子网中的每一个与所述序列中的所述多个子网中的相应子网相对应,以及其中,所述训练子网中的每一个被配置成接收对应子网的输出作为该子网的输入。
2.根据权利要求1所述的方法,进一步包括,在所述深度神经网络已经被训练之后:
接收表征新输入图像的新数据;
使用所述深度神经网络来处理表征所述新输入图像的所述新数据,以生成所述新输入图像的替选表示,其中,使用所述深度神经网络处理表征所述新输入图像的所述新数据包括通过所述序列中的所述子网中的每一个来处理所述新数据;以及
通过所述输出层来处理所述新输入图像的所述替选表示以根据所述新输入图像生成新输出。
3.根据权利要求2所述的方法,进一步包括在不使用一个或多个其它训练子网的情况下执行所述新数据的所述处理。
4.根据权利要求1所述的方法,其中,生成被提供作为所述序列中下一个子网的输入的相应的输出表示包括:
通过神经网络层的第一群组中的每一层来处理所述相应的输出表示以生成第一群组输出,其中,所述第一群组包括第一卷积层,所述第一卷积层后面跟随有第二卷积层。
5.根据权利要求4所述的方法,其中,所述第一卷积层为1×1卷积层。
6.根据权利要求4所述的方法,其中,所述第二卷积层为3×3卷积层。
7.根据权利要求1所述的方法,其中,生成被提供作为所述序列中下一个子网的输入的相应的输出表示包括:
通过神经网络层的第二群组中的每一层来处理所述相应的输出表示以生成第二群组输出,其中,所述第二群组包括第三卷积层,所述第三卷积层后面跟随有第四卷积层。
8.根据权利要求7所述的方法,其中,所述第三卷积层为1×1卷积层。
9.根据权利要求7所述的方法,其中,所述第四卷积层为5×5卷积层。
10.根据权利要求1所述的方法,其中,生成被提供作为所述序列中下一个子网的输入的相应的输出表示包括:
通过神经网络层的第三群组中的每一层来处理所述相应的输出表示以生成第三群组输出,其中,所述第三群组包括第一最大池化层,所述第一最大池化层后面跟随有第五卷积层。
11.根据权利要求10所述的方法,其中,所述第一最大池化层为3×3最大池化层。
12.根据权利要求10所述的方法,其中,所述第五卷积层为1×1卷积层。
13.一种系统,包括一个或多个计算机和存储指令的一个或多个存储设备,所述指令在由所述一个或多个计算机执行时使得所述一个或多个计算机执行操作,所述操作包括:
在深度神经网络的训练期间,接收表征输入图像的数据;
使用所述深度神经网络来处理表征所述输入图像的所述数据,以生成所述输入图像的替选表示,其中,所述深度神经网络包括多个子网,其中,所述子网被布置在从最低到最高的序列中,其中每个子网接收相应的输入表示并且生成相应的输出表示,所述相应的输出表示被提供作为所述序列中下一个子网的输入,并且其中,使用所述深度神经网络处理表征所述输入图像的所述数据包括通过所述序列中的所述子网中的每一个来处理所述数据;
通过输出层来处理所述输入图像的所述替选表示,以根据所述输入图像生成输出;以及
使用一个或多个其它训练子网来处理来自所述多个子网中的一个或多个子网的所述输出表示,所述一个或多个其它训练子网增强所述深度神经网络以生成所述输入图像的训练子网输出,其中,所述一个或多个其它训练子网中的每一个包括一个或多个神经网络层,其中,所述一个或多个其它训练子网中的每一个与所述序列中的所述多个子网中的相应子网相对应,以及其中,所述训练子网中的每一个被配置成接收对应子网的输出作为该子网的输入。
14.根据权利要求13所述的系统,其中所述操作进一步包括,在所述神经网络已经被训练之后:
接收表征新输入图像的新数据;
使用所述深度神经网络来处理表征所述新输入图像的所述新数据,以生成所述新输入图像的替选表示,其中,使用所述深度神经网络处理表征所述新输入图像的所述新数据包括通过所述序列中的所述子网中的每一个来处理所述新数据;以及
通过所述输出层来处理所述新输入图像的所述替选表示以根据所述新输入图像生成新输出。
15.根据权利要求14所述的系统,所述操作进一步包括在不使用一个或多个其它训练子网的情况下执行所述新数据的所述处理。
16.根据权利要求13所述的系统,其中,生成被提供作为所述序列中下一个子网的输入的相应的输出表示包括:
通过神经网络层的第一群组中的每一层来处理所述相应的输出表示以生成第一群组输出,其中,所述第一群组包括第一卷积层,所述第一卷积层后面跟随有第二卷积层。
17.一种在一个或多个非暂时性计算机存储介质上编码的计算机程序产品,所述计算机程序产品包括指令,所述指令在由一个或多个计算机执行时使得所述一个或多个计算机执行操作,所述操作包括:
在深度神经网络的训练期间,接收表征输入图像的数据;
使用所述深度神经网络来处理表征所述输入图像的所述数据,以生成所述输入图像的替选表示,其中,所述深度神经网络包括多个子网,其中,所述子网被布置在从最低到最高的序列中,其中每个子网接收相应的输入表示并且生成相应的输出表示,所述相应的输出表示被提供作为所述序列中下一个子网的输入,并且其中,使用所述深度神经网络处理表征所述输入图像的所述数据包括通过所述序列中的所述子网中的每一个来处理所述数据;
通过输出层来处理所述输入图像的所述替选表示,以根据所述输入图像生成输出;以及
使用一个或多个其它训练子网来处理来自所述多个子网中的一个或多个子网的所述输出表示,所述一个或多个其它训练子网增强所述深度神经网络以生成所述输入图像的训练子网输出,其中,所述一个或多个其它训练子网中的每一个包括一个或多个神经网络层,其中,所述一个或多个其它训练子网中的每一个与所述序列中的所述多个子网中的相应子网相对应,以及其中,所述训练子网中的每一个被配置成接收对应子网的输出作为该子网的输入。
18.根据权利要求17所述的计算机程序产品,其中所述操作进一步包括,在所述神经网络已经被训练之后:
接收表征新输入图像的新数据;
使用所述深度神经网络来处理表征所述新输入图像的所述新数据,以生成所述新输入图像的替选表示,其中,使用所述深度神经网络处理表征所述新输入图像的所述新数据包括通过所述序列中的所述子网中的每一个来处理所述新数据;以及
通过所述输出层来处理所述新输入图像的所述替选表示以根据所述新输入图像生成新输出。
19.根据权利要求18所述的计算机程序产品,所述操作进一步包括在不使用一个或多个其它训练子网的情况下执行所述新数据的所述处理。
20.根据权利要求17所述的计算机程序产品,其中,生成被提供作为所述序列中下一个子网的输入的相应的输出表示的所述操作包括:
通过神经网络层的第一群组中的每一层来处理所述相应的输出表示以生成第一群组输出,其中,所述第一群组包括第一卷积层,所述第一卷积层后面跟随有第二卷积层。
CN201910116683.XA 2014-08-29 2015-08-28 用于处理图像的方法和系统 Active CN110110843B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462043865P 2014-08-29 2014-08-29
US62/043,865 2014-08-29
CN201580035806.7A CN106471526B (zh) 2014-08-29 2015-08-28 用于处理图像的方法和系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580035806.7A Division CN106471526B (zh) 2014-08-29 2015-08-28 用于处理图像的方法和系统

Publications (2)

Publication Number Publication Date
CN110110843A true CN110110843A (zh) 2019-08-09
CN110110843B CN110110843B (zh) 2020-09-25

Family

ID=54073023

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580035806.7A Active CN106471526B (zh) 2014-08-29 2015-08-28 用于处理图像的方法和系统
CN201910116683.XA Active CN110110843B (zh) 2014-08-29 2015-08-28 用于处理图像的方法和系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201580035806.7A Active CN106471526B (zh) 2014-08-29 2015-08-28 用于处理图像的方法和系统

Country Status (5)

Country Link
US (7) US9715642B2 (zh)
EP (1) EP3186753B1 (zh)
CN (2) CN106471526B (zh)
ES (1) ES2880316T3 (zh)
WO (1) WO2016033506A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929603A (zh) * 2019-11-09 2020-03-27 北京工业大学 一种基于轻量级卷积神经网络的天气图像识别方法

Families Citing this family (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106471526B (zh) 2014-08-29 2019-03-08 谷歌有限责任公司 用于处理图像的方法和系统
US11275747B2 (en) * 2015-03-12 2022-03-15 Yahoo Assets Llc System and method for improved server performance for a deep feature based coarse-to-fine fast search
JP6450053B2 (ja) 2015-08-15 2019-01-09 セールスフォース ドット コム インコーポレイティッド 3dバッチ正規化を伴う三次元(3d)畳み込み
US10387531B1 (en) * 2015-08-18 2019-08-20 Google Llc Processing structured documents using convolutional neural networks
US9760807B2 (en) 2016-01-08 2017-09-12 Siemens Healthcare Gmbh Deep image-to-image network learning for medical image analysis
CN108885683B (zh) * 2016-03-28 2020-05-22 北京市商汤科技开发有限公司 用于位姿估计的方法和系统
US10049307B2 (en) * 2016-04-04 2018-08-14 International Business Machines Corporation Visual object recognition
US10460747B2 (en) 2016-05-10 2019-10-29 Google Llc Frequency based audio analysis using neural networks
US10515429B2 (en) 2016-07-01 2019-12-24 Digimarc Corporation Image-based pose determination
US10643124B2 (en) * 2016-08-12 2020-05-05 Beijing Deephi Intelligent Technology Co., Ltd. Method and device for quantizing complex artificial neural network
US10802992B2 (en) 2016-08-12 2020-10-13 Xilinx Technology Beijing Limited Combining CPU and special accelerator for implementing an artificial neural network
US10810482B2 (en) 2016-08-30 2020-10-20 Samsung Electronics Co., Ltd System and method for residual long short term memories (LSTM) network
US11080591B2 (en) 2016-09-06 2021-08-03 Deepmind Technologies Limited Processing sequences using convolutional neural networks
EP3767547A1 (en) * 2016-09-06 2021-01-20 Deepmind Technologies Limited Processing sequences using convolutional neural networks
WO2018048934A1 (en) 2016-09-06 2018-03-15 Deepmind Technologies Limited Generating audio using neural networks
US20180077689A1 (en) * 2016-09-15 2018-03-15 Qualcomm Incorporated Multiple bandwidth operation
US11556779B2 (en) 2016-09-26 2023-01-17 Arizona Board Of Regents On Behalf Of Arizona State University Cascaded computing for convolutional neural networks
IE87469B1 (en) 2016-10-06 2024-01-03 Google Llc Image processing neural networks with separable convolutional layers
CN106530284A (zh) * 2016-10-21 2017-03-22 广州视源电子科技股份有限公司 基于图像识别的焊点类型检测和装置
WO2018081135A1 (en) * 2016-10-25 2018-05-03 Vmaxx Inc. Point to set similarity comparison and deep feature learning for visual recognition
WO2018081089A1 (en) 2016-10-26 2018-05-03 Deepmind Technologies Limited Processing text sequences using neural networks
US11250327B2 (en) 2016-10-26 2022-02-15 Cognizant Technology Solutions U.S. Corporation Evolution of deep neural network structures
US10360163B2 (en) * 2016-10-27 2019-07-23 Google Llc Exploiting input data sparsity in neural network compute units
US10175980B2 (en) 2016-10-27 2019-01-08 Google Llc Neural network compute tile
US10565305B2 (en) 2016-11-18 2020-02-18 Salesforce.Com, Inc. Adaptive attention model for image captioning
KR101879207B1 (ko) * 2016-11-22 2018-07-17 주식회사 루닛 약한 지도 학습 방식의 객체 인식 방법 및 장치
US10529088B2 (en) 2016-12-02 2020-01-07 Gabriel Fine Automatically determining orientation and position of medically invasive devices via image processing
US10373049B2 (en) 2016-12-20 2019-08-06 Google Llc Generating an output for a neural network output layer
CN108242046B (zh) * 2016-12-27 2022-02-18 阿里巴巴集团控股有限公司 图片处理方法及相关设备
US10660576B2 (en) 2017-01-30 2020-05-26 Cognizant Technology Solutions India Pvt. Ltd. System and method for detecting retinopathy
US10636141B2 (en) 2017-02-09 2020-04-28 Siemens Healthcare Gmbh Adversarial and dual inverse deep learning networks for medical image analysis
US11170897B2 (en) 2017-02-23 2021-11-09 Google Llc Method and system for assisting pathologist identification of tumor cells in magnified tissue images
US10896367B2 (en) 2017-03-07 2021-01-19 Google Llc Depth concatenation using a matrix computation unit
US11507844B2 (en) 2017-03-07 2022-11-22 Cognizant Technology Solutions U.S. Corporation Asynchronous evaluation strategy for evolution of deep neural networks
KR102061408B1 (ko) * 2017-03-24 2019-12-31 (주)제이엘케이인스펙션 가상 3차원 심층 신경망을 이용하는 영상 분석 장치 및 방법
US10408852B2 (en) * 2017-04-26 2019-09-10 Lawrence Livermore National Security, Llc Automated control of microfluidic devices based on machine learning
US10824904B2 (en) 2017-05-02 2020-11-03 BXB Digital Pty Limited Systems and methods for pallet identification
WO2018204507A1 (en) 2017-05-02 2018-11-08 BXB Digital Pty Limited Systems and methods for facility matching and localization
US10878366B2 (en) 2017-05-05 2020-12-29 BXB Digital Pty Limited Placement of tracking devices on pallets
CN111373415A (zh) * 2017-05-05 2020-07-03 阿里莫有限责任公司 使用神经网络分析序列数据
WO2018210796A1 (en) * 2017-05-15 2018-11-22 Deepmind Technologies Limited Neural network systems for action recognition in videos
EP3596665A1 (en) 2017-05-19 2020-01-22 Google LLC Depthwise separable convolutions for neural machine translation
WO2018213841A1 (en) 2017-05-19 2018-11-22 Google Llc Multi-task multi-modal machine learning model
CN110476101B (zh) 2017-06-13 2022-02-18 谷歌有限责任公司 用于病理学的增强现实显微镜
JP6883787B2 (ja) * 2017-09-06 2021-06-09 パナソニックIpマネジメント株式会社 学習装置、学習方法、学習プログラム、推定装置、推定方法、及び推定プログラム
US10692244B2 (en) 2017-10-06 2020-06-23 Nvidia Corporation Learning based camera pose estimation from images of an environment
KR101916347B1 (ko) * 2017-10-13 2018-11-08 주식회사 수아랩 딥러닝 기반 이미지 비교 장치, 방법 및 컴퓨터 판독가능매체에 저장된 컴퓨터 프로그램
CN107704923A (zh) * 2017-10-19 2018-02-16 珠海格力电器股份有限公司 卷积神经网络运算电路
AU2018353840B2 (en) * 2017-10-20 2021-09-16 BXB Digital Pty Limited Systems and methods for tracking goods carriers
US11380034B2 (en) * 2017-10-27 2022-07-05 Google Llc Semantically-consistent image style transfer
WO2019083553A1 (en) 2017-10-27 2019-05-02 Google Llc NEURONAL NETWORKS IN CAPSULE
US11250314B2 (en) 2017-10-27 2022-02-15 Cognizant Technology Solutions U.S. Corporation Beyond shared hierarchies: deep multitask learning through soft layer ordering
WO2019081781A1 (en) * 2017-10-27 2019-05-02 Deepmind Technologies Limited NEURAL GRAPH NETWORK SYSTEMS FOR GENERATING STRUCTURED REPRESENTATIONS OF OBJECTS
EP3676765A1 (en) 2017-10-27 2020-07-08 Deepmind Technologies Limited Using hierarchical representations for neural network architecture searching
US10555192B2 (en) * 2017-11-15 2020-02-04 Futurewei Technologies, Inc. Predicting received signal strength in a telecommunication network using deep neural networks
CN108009636B (zh) * 2017-11-16 2021-12-07 华南师范大学 深度学习神经网络进化方法、装置、介质和计算机设备
US11257217B2 (en) * 2017-11-20 2022-02-22 Google Llc Image segmentation using neural networks
CN107895192B (zh) * 2017-12-06 2021-10-08 广州方硅信息技术有限公司 深度卷积网络压缩方法、存储介质和终端
CA3085897C (en) 2017-12-13 2023-03-14 Cognizant Technology Solutions U.S. Corporation Evolutionary architectures for evolution of deep neural networks
US11836610B2 (en) * 2017-12-13 2023-12-05 Advanced Micro Devices, Inc. Concurrent training of functional subnetworks of a neural network
US10482600B2 (en) 2018-01-16 2019-11-19 Siemens Healthcare Gmbh Cross-domain image analysis and cross-domain image synthesis using deep image-to-image networks and adversarial networks
US11527308B2 (en) 2018-02-06 2022-12-13 Cognizant Technology Solutions U.S. Corporation Enhanced optimization with composite objectives and novelty-diversity selection
EP3776571A1 (en) 2018-03-29 2021-02-17 Google LLC Similar medical image search
CN110490295B (zh) * 2018-05-15 2022-04-05 华为技术有限公司 一种数据处理方法及处理装置
CN112188861A (zh) * 2018-05-17 2021-01-05 宝洁公司 用于毛发覆盖分析的系统和方法
US11172873B2 (en) 2018-05-17 2021-11-16 The Procter & Gamble Company Systems and methods for hair analysis
EP3776377A4 (en) 2018-05-28 2021-05-12 Samsung Electronics Co., Ltd. METHOD AND SYSTEM FOR DNN-BASED IMAGING
US11100633B2 (en) 2018-06-13 2021-08-24 Cosmo Artificial Intelligence—Al Limited Systems and methods for processing real-time video from a medical image device and detecting objects in the video
US10810460B2 (en) 2018-06-13 2020-10-20 Cosmo Artificial Intelligence—AI Limited Systems and methods for training generative adversarial networks and use of trained generative adversarial networks
EP3814981A4 (en) * 2018-06-26 2022-01-26 Nokia Technologies OY METHOD AND DEVICE FOR COMPUTER VIEWING
CN109002863B (zh) * 2018-06-27 2022-04-15 佛山市顺德区中山大学研究院 一种基于紧凑卷积神经网络的图像处理方法
WO2020005326A1 (en) 2018-06-29 2020-01-02 The Procter & Gamble Company Aptamers for personal care applications
US11126649B2 (en) 2018-07-11 2021-09-21 Google Llc Similar image search for radiology
US11775815B2 (en) * 2018-08-10 2023-10-03 Samsung Electronics Co., Ltd. System and method for deep memory network
CN110825311B (zh) * 2018-08-10 2023-04-18 昆仑芯(北京)科技有限公司 用于存储数据的方法和装置
KR20200023239A (ko) * 2018-08-23 2020-03-04 삼성전자주식회사 복수의 프로세서를 이용하여 신경망 모델을 처리하는 전자 장치 및 그 동작 방법
CN112639878A (zh) * 2018-09-05 2021-04-09 谷歌有限责任公司 无监督深度预测神经网络
EP3850423A4 (en) * 2018-09-13 2022-06-29 Spectrum Optix, Inc Photographic underexposure correction using a neural network
JP7402606B2 (ja) * 2018-10-31 2023-12-21 ソニーセミコンダクタソリューションズ株式会社 固体撮像装置及び電子機器
US20200226459A1 (en) * 2019-01-11 2020-07-16 International Business Machines Corporation Adversarial input identification using reduced precision deep neural networks
US10936160B2 (en) 2019-01-11 2021-03-02 Google Llc System, user interface and method for interactive negative explanation of machine-learning localization models in health care applications
CN111507362B (zh) * 2019-01-30 2023-12-19 中强光电股份有限公司 神经网络的训练方法、基于神经网络的分类方法及其装置
KR102576157B1 (ko) 2019-02-22 2023-09-07 한국전자통신연구원 인공 신경망을 이용한 고속 객체 검출 방법 및 장치
US11481639B2 (en) 2019-02-26 2022-10-25 Cognizant Technology Solutions U.S. Corporation Enhanced optimization with composite objectives and novelty pulsation
WO2020186061A1 (en) 2019-03-13 2020-09-17 Cognizant Technology Solutions U.S. Corporation System and method for implementing modular universal reparameterization for deep multi-task learning across diverse domains
EP4148684A1 (en) 2019-03-13 2023-03-15 Digimarc Corporation Digital marking
CN110046551B (zh) * 2019-03-18 2021-04-20 中国科学院深圳先进技术研究院 一种人脸识别模型的生成方法及设备
CA3131688A1 (en) 2019-03-27 2020-10-01 Olivier Francon Process and system including an optimization engine with evolutionary surrogate-assisted prescriptions
US11806419B2 (en) 2019-04-16 2023-11-07 The Procter & Gamble Company Aptamers for odor control applications
US11004216B2 (en) 2019-04-24 2021-05-11 The Boeing Company Machine learning based object range detection
CA3143172A1 (en) * 2019-06-12 2020-12-17 Carnegie Mellon University Deep-learning models for image processing
US10809936B1 (en) 2019-07-30 2020-10-20 EMC IP Holding Company LLC Utilizing machine learning to detect events impacting performance of workloads running on storage systems
EP4128027A1 (en) 2020-03-26 2023-02-08 Digimarc Corporation Arrangements for digital marking and reading of items, useful in recycling
US11775841B2 (en) 2020-06-15 2023-10-03 Cognizant Technology Solutions U.S. Corporation Process and system including explainable prescriptions through surrogate-assisted evolution
US20220178244A1 (en) * 2020-12-08 2022-06-09 Halliburton Energy Services, Inc. Deep learning methods for wellbore pipe inspection
CN112749707A (zh) * 2021-01-25 2021-05-04 北京百度网讯科技有限公司 利用神经网络进行目标分割的方法、设备和介质
CA3215397A1 (en) 2021-04-16 2022-10-20 Tomas FILLER Methods and arrangements to aid recycling
KR20230050127A (ko) * 2021-10-07 2023-04-14 삼성전자주식회사 디스플레이 장치 및 그 동작방법
US20230281770A1 (en) * 2022-03-04 2023-09-07 Wisconsin Alumni Research Foundation Systems, methods, and media for generating digital images using low bit depth image sensor data
WO2024015385A1 (en) 2022-07-14 2024-01-18 Digimarc Corporation Methods and arrangements to utilize end-of-life data generated during recycling and waste sortation for counterfeit deterrence and other actions

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993013487A1 (en) * 1991-12-27 1993-07-08 R & D Associates Rapidly converging projective neural network
US20080172349A1 (en) * 2007-01-12 2008-07-17 Toyota Engineering & Manufacturing North America, Inc. Neural network controller with fixed long-term and adaptive short-term memory
US7660774B2 (en) * 2005-05-31 2010-02-09 Honeywell International Inc. Nonlinear neural network fault detection system and method
US20130110752A1 (en) * 2011-11-02 2013-05-02 Sap Ag On Demand Multi-Objective Network Optimization
CN103529439A (zh) * 2013-10-23 2014-01-22 环境保护部卫星环境应用中心 一种神经网络系统的植被参数遥感反演方法和装置
CN103544705A (zh) * 2013-10-25 2014-01-29 华南理工大学 一种基于深度卷积神经网络的图像质量测试方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5288645A (en) * 1992-09-04 1994-02-22 Mtm Engineering, Inc. Hydrogen evolution analyzer
JP2002091505A (ja) * 2000-09-14 2002-03-29 Toshiba Corp モデル同定装置
JP2006285899A (ja) * 2005-04-05 2006-10-19 Sony Corp 学習装置および学習方法、生成装置および生成方法、並びにプログラム
US7747070B2 (en) * 2005-08-31 2010-06-29 Microsoft Corporation Training convolutional neural networks on graphics processing units
US9672811B2 (en) * 2012-11-29 2017-06-06 Sony Interactive Entertainment Inc. Combining auditory attention cues with phoneme posterior scores for phone/vowel/syllable boundary detection
US9508347B2 (en) * 2013-07-10 2016-11-29 Tencent Technology (Shenzhen) Company Limited Method and device for parallel processing in model training
EP3074918B1 (en) * 2013-11-30 2019-04-03 Beijing Sensetime Technology Development Co., Ltd. Method and system for face image recognition
US9665823B2 (en) * 2013-12-06 2017-05-30 International Business Machines Corporation Method and system for joint training of hybrid neural networks for acoustic modeling in automatic speech recognition
CN103824055B (zh) * 2014-02-17 2018-03-02 北京旷视科技有限公司 一种基于级联神经网络的人脸识别方法
CN106471526B (zh) 2014-08-29 2019-03-08 谷歌有限责任公司 用于处理图像的方法和系统
CN105894087A (zh) * 2015-01-26 2016-08-24 华为技术有限公司 用于神经网络中训练参数集的系统和方法
JP6620439B2 (ja) * 2015-07-01 2019-12-18 株式会社リコー 学習方法、プログラム及び学習装置
CN114386567A (zh) * 2016-02-18 2022-04-22 谷歌有限责任公司 图像分类神经网络

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993013487A1 (en) * 1991-12-27 1993-07-08 R & D Associates Rapidly converging projective neural network
US7660774B2 (en) * 2005-05-31 2010-02-09 Honeywell International Inc. Nonlinear neural network fault detection system and method
US20080172349A1 (en) * 2007-01-12 2008-07-17 Toyota Engineering & Manufacturing North America, Inc. Neural network controller with fixed long-term and adaptive short-term memory
US20130110752A1 (en) * 2011-11-02 2013-05-02 Sap Ag On Demand Multi-Objective Network Optimization
CN103529439A (zh) * 2013-10-23 2014-01-22 环境保护部卫星环境应用中心 一种神经网络系统的植被参数遥感反演方法和装置
CN103544705A (zh) * 2013-10-25 2014-01-29 华南理工大学 一种基于深度卷积神经网络的图像质量测试方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929603A (zh) * 2019-11-09 2020-03-27 北京工业大学 一种基于轻量级卷积神经网络的天气图像识别方法
CN110929603B (zh) * 2019-11-09 2023-07-14 北京工业大学 一种基于轻量级卷积神经网络的天气图像识别方法

Also Published As

Publication number Publication date
CN106471526B (zh) 2019-03-08
US9911069B1 (en) 2018-03-06
US20160063359A1 (en) 2016-03-03
EP3186753B1 (en) 2021-04-28
US20170316286A1 (en) 2017-11-02
US20230014634A1 (en) 2023-01-19
US9715642B2 (en) 2017-07-25
US20210201092A1 (en) 2021-07-01
US20180068207A1 (en) 2018-03-08
US9904875B2 (en) 2018-02-27
US11809955B2 (en) 2023-11-07
CN110110843B (zh) 2020-09-25
US10977529B2 (en) 2021-04-13
US11462035B2 (en) 2022-10-04
WO2016033506A1 (en) 2016-03-03
ES2880316T3 (es) 2021-11-24
US10650289B2 (en) 2020-05-12
US20200311491A1 (en) 2020-10-01
CN106471526A (zh) 2017-03-01
US20180137396A1 (en) 2018-05-17
EP3186753A1 (en) 2017-07-05

Similar Documents

Publication Publication Date Title
CN106471526B (zh) 用于处理图像的方法和系统
US11922288B2 (en) Image processing neural networks with separable convolutional layers
JP7157154B2 (ja) 性能予測ニューラルネットワークを使用したニューラルアーキテクチャ探索
US20190332944A1 (en) Training Method, Apparatus, and Chip for Neural Network Model
CN110443351B (zh) 生成映像的自然语言描述
US20210166693A1 (en) Man- machine interaction system and multi-task processing method in the man-machine interaction system
EP3583553A1 (en) Neural architecture search for convolutional neural networks
CN108604314B (zh) 使用强化学习选择动作名单
CN109844773A (zh) 使用卷积神经网络处理序列
JP7383803B2 (ja) 不均一モデルタイプおよびアーキテクチャを使用した連合学習
EP3688673A1 (en) Neural architecture search
US20190114541A1 (en) Method and system of controlling computing operations based on early-stop in deep neural network
EP4290824A1 (en) Task allocation method and apparatus based on internet-of-things device, and network training method and apparatus
US10748041B1 (en) Image processing with recurrent attention
CN109964238A (zh) 使用神经网络生成视频帧
CN112464497B (zh) 基于分布式系统的故障演练方法、装置、设备及介质
CN108259547A (zh) 消息推送方法、设备及可编程设备
CN116032663A (zh) 基于边缘设备的隐私数据处理系统、方法、设备及介质
KR20220121680A (ko) 딥러닝 네트워크 구성 방법, 딥러닝 자동화 플랫폼 서비스 시스템 및 이를 위한 컴퓨터 프로그램

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant