CN113537486A - 单调算子神经网络的系统和方法 - Google Patents
单调算子神经网络的系统和方法 Download PDFInfo
- Publication number
- CN113537486A CN113537486A CN202110405309.9A CN202110405309A CN113537486A CN 113537486 A CN113537486 A CN 113537486A CN 202110405309 A CN202110405309 A CN 202110405309A CN 113537486 A CN113537486 A CN 113537486A
- Authority
- CN
- China
- Prior art keywords
- neural network
- computer
- input
- implemented method
- propagation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Automation & Control Theory (AREA)
- Human Computer Interaction (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Image Analysis (AREA)
- Feedback Control In General (AREA)
Abstract
本公开涉及具有人工智能能力的计算机系统,包括神经网络。一种用于训练神经工作的系统,包括用于访问神经网络的输入数据的输入接口和与输入接口通信的处理器。处理器被编程为在神经网络处接收输入,并利用前向传播和后向传播输出经训练的神经网络,其中前向传播包括利用求根过程来标识与神经网络的一个或多个参数相关联的不动点,其中后向传播包括标识与网络的参数相关联的损失的导数。
Description
技术领域
本公开涉及具有人工智能能力的计算机系统,包括神经网络。
背景技术
发明内容
根据一个实施例,用于预测分类和训练神经工作的计算机实现的方法包括在神经网络处接收输入,利用前向传播对神经网络的输入进行分类,其中前向传播包括利用求根过程来标识与神经网络的一个或多个参数相关联的不动点,通过利用不动点的线性变换来计算向量,响应于向量的最大元素将输入的分类输出,以及利用后向传播来训练神经网络,其中后向传播包括标识与网络的参数相关联的损失的导数。
根据第二实施例,一种用于对神经网络的输入进行分类的计算机实现的方法,包括在神经网络处接收输入,利用前向传播在神经网络处标识输入的分类,其中前向传播包括利用求根过程来标识与神经网络的参数相关联的不动点,通过利用不动点的线性变换来计算向量,以及响应于向量的最大元素将输入的分类输出。
根据第三实施例,一种用于训练神经工作的系统包括用于访问神经网络的输入数据的输入接口和与输入接口通信的处理器。处理器被编程为在神经网络处接收输入,并利用前向传播和后向传播输出经训练的神经网络,其中前向传播包括利用求根过程来标识与神经网络的一个或多个参数相关联的不动点,其中后向传播包括标识与网络的参数相关联的损失的导数。
附图说明
图1示出了用于训练神经网络的系统100。
图2示出了用于训练神经网络的计算机实现的方法200。
图3描绘了单调网络的分类处理的流程图300。
图4描绘了单调网络的训练处理的流程图400。
图5描绘了计算机控制的机器10和控制系统12之间的交互的示意图。
图6描绘了图1的控制系统的示意图,该控制系统被配置为控制车辆,该车辆可以是部分自主车辆或部分自主机器人。
图7描绘了图1的控制系统的示意图,该控制系统被配置为控制制造系统(诸如生产线的一部分)的制造机器,诸如冲压刀具、刀具或枪钻。
图8描绘了图1的控制系统的示意图,该控制系统被配置为控制具有至少部分自主模式的电动工具,诸如电钻或驱动器。
图9描绘了被配置为控制自动化个人助理的图1的控制系统的示意图。
图10描绘了图1的控制系统的示意图,该控制系统被配置为控制监视系统,诸如控制访问系统或监督系统。
图11描绘了图1的控制系统的示意图,该控制系统被配置为控制成像系统,例如MRI装置、x光成像装置或超声波装置。
具体实施方式
本文描述了本公开的实施例。然而,应当理解,所公开的实施例仅仅是示例,并且其他实施例可以采取各种形式和替代形式。各图不一定是按比例的;一些特征可以被放大或最小化以示出特定组件的细节。因此,本文公开的具体结构和功能细节不应被解释为限制性的,而仅作为教导本领域技术人员以不同方式采用实施例的代表性基础。如本领域普通技术人员应当理解的那样,参考各图中的任何一个图示和描述的各种特征可以与一个或多个其他图中图示的特征相组合,以产生没有明确图示或描述的实施例。图示特征的组合为典型应用提供了代表性实施例。然而,与本公开的教导一致的特征的各种组合和修改对于特定的应用或实现可以是期望的。
在先前的DEQ模型中,定义具有不动点的函数可以通过使用网络结构来启发性地完成,所述网络结构从经验上看起来产生了稳定的不动点。这可以包括使用现有的转换器(transformer)式架构或现有的卷积架构,利用适当的层标准化来尝试提供稳定的系统。然而,这样的层没有不动点存在的正式保证。对于求根过程,DEQ可以使用非线性Broyden方法,该方法也不保证找到根(即使存在根或不动点)。此外,后向传递可以使用类似的Broyden方法进行线性求解,如果存在适当的逆,则可以保证乘以适当的逆,但是如果不存在不动点或者如果前向传递无法收敛,则雅可比将不对应于有意义的导数。
单调算子网络可以是DEQ模型的一种特定形式,它为以上标识的三个挑战提供了好得多的解决方案。具体地,为了定义具有不动点的函数,单调算子网络使用函数f的特定参数化形式,它可以保证不动点的存在和唯一性。通过应用单调算子理论的工具,该系统可以导出两个不同的迭代过程来寻找系统的平衡点。那些过程总是可以保证收敛到平衡点。系统可以制定类似的算法集来执行后向传递。
图1示出了用于训练神经网络的系统100。系统100可以包括用于访问神经网络的训练数据192的输入接口。例如,如图1中图示的,输入接口可以由数据存储接口180构成,数据存储接口180可以从数据存储装置190访问训练数据192。例如,数据存储接口180可以是存储器接口或永久存储接口30,例如,硬盘或SSD接口,也可以是个域网、局域网或广域网接口,诸如蓝牙、紫蜂或Wi-Fi接口或者以太网或光纤接口。数据存储装置190可以是系统100的内部数据存储装置、诸如硬盘驱动器或SSD,但是也可以是外部数据存储装置、例如网络可访问数据存储装置。
在一些实施例中,数据存储装置190可以进一步包括神经网络的未训练版本的数据表示194,其可以由系统100从数据存储装置190访问。然而,应当领会,未训练神经网络的训练数据192和数据表示194也可以每个都例如经由数据存储装置5接口180的不同子系统从不同的数据存储装置访问。每个子系统可以是如上所述的数据存储接口180的类型。在其他实施例中,未训练神经网络的数据表示194可以由系统100基于神经网络的设计参数在内部生成,并且因此可能没有明确地存储在数据存储装置190上。系统100可以进一步包括处理器子系统160,处理器子系统160可以被配置为在系统100的操作期间,提供迭代函数作为待训练的神经网络的层堆叠的替代。这里,被替代的层堆叠的相应层可以具有相互共享的权重,并且可以接收前一层的输出作为输入,或者对于层堆叠的第一层,接收初始激活和层堆叠的输入的一部分作为输入。处理器子系统160可以进一步被配置为使用训练数据192迭代地训练神经网络。这里,由处理器子系统160进行的训练迭代可以包括前向传播部分和后向传播部分。处理器子系统160可以被配置为通过除了其他操作之外还以如下操作来执行前向传播部分:定义可以执行的前向传播,确定迭代函数的平衡点,在该平衡点处,迭代函数收敛到不动点,其中确定平衡点包括使用数值求根算法来找到迭代函数减去其输入的根解,并且通过提供平衡点作为神经网络中的层堆叠的输出的替代。系统100可以进一步包括输出接口,用于输出经训练神经网络的数据表示196,该数据也可以被称为经训练模型数据196。例如,也如图1中图示的,输出接口可以由数据存储接口180构成,在这些实施例中,所述接口是输入/输出(“IO”)接口,经由该输入/输出(“IO”)接口,经训练模型数据196可以存储在数据存储装置190中。例如,定义“未训练的”神经网络的数据表示194可以在训练期间或训练之后至少部分地被经训练的神经网络的数据表示196替代,因为神经网络的参数——诸如权重、超参数和神经网络的其他类型的参数——可以被适配为反映训练数据192上的训练。这也在图1中由参考数字194、196图示,参考数字194、196指代数据存储装置190上的相同数据记录。在其他实施例中,数据表示196可以与定义“未训练”神经网络的数据表示194分离地存储。在一些实施例中,输出接口可以与数据存储接口180分离,但是通常可以是如上针对数据存储接口180所述的类型。
图2示出了用于训练神经网络的计算机实现的方法200。方法200可以对应于图1的系统100的操作,但是不需要,因为它也可以对应于另一种类型的系统、装置或设备的操作,或者因为它可以对应于计算机程序。
方法200被示出为包括,在题为“提供神经网络的数据表示”的步骤中,提供210神经网络,其中神经网络的提供包括提供迭代函数作为神经网络的层堆叠的替代,其中被替代的层堆叠的相应层具有相互共享的权重,并且接收前一层的输出作为输入,或者对于层堆叠的第一层,接收初始激活和层堆叠的输入的一部分作为输入。方法200进一步被示出为包括在题为“访问训练数据”的步骤中访问220神经网络的训练数据。方法200进一步被示出为包括在题为“使用训练数据迭代地训练神经网络”的步骤中使用训练数据迭代地230训练神经网络,该训练230可以包括前向传播部分和后向传播部分。通过方法200执行前向传播部分可以包括,在题为“使用求根算法确定平衡点”的步骤中,确定240迭代函数的平衡点,在该平衡点处迭代函数收敛到不动点,其中确定平衡点包括使用数值求根算法来寻找迭代函数减去其输入的根解,以及在题为“提供平衡点作为层堆叠的输出的替代”的步骤中,提供平衡点作为神经网络中层堆叠的输出的替代。方法200可以进一步包括,在训练之后,并且在题为“输出经训练的神经网络”的步骤中,输出260经训练的神经网络。下面的示例描述了神经网络,包括其训练,其中层堆叠由迭代函数代替,并且其中使用求根算法来确定平衡点,在该平衡点处迭代函数收敛到不动点,其中确定平衡点包括使用数值求根算法来找到迭代函数减去其输入的根解,并且在题为“提供平衡点作为层堆叠输出的替代”的步骤中,提供250平衡点作为神经网络中层堆叠的输出的替代。方法200可以进一步包括,在训练之后,并且在题为“输出经训练的神经网络”的步骤中,输出260经训练的神经网络。该神经网络可以在题为“具有平衡求解器的深度神经网络”的专利申请中进一步描述,该专利申请通过引用以其整体并入本文。
图3描绘了单调网络的分类处理的流程图300。在步骤301,系统可以从输入接口接收输入。输入接口可以是无线通信(例如,Wi-Fi、4G、5G、LTE等)或有线通信(USB、串口、CAN-BUS等)。输入接口可以允许网络与诸如相机、雷达、Lidar等之类的各种传感器通信。输入可以是任何输入数据,包括但不限于图像数据。输入可以例如包括图像的像素值。
在步骤303,网络可以经由前向传播计算不动点(例如,平衡点)。在单调算子网络中,网络可以利用特定形式的平衡函数,特别是参数化:
其中可以是一些非线性函数,并且其在特定实施例中可以是凸函数的邻近算子(实际上,这可以意味着是单调增加的,具有小于或等于一的李普希茨常数,例如,它是非膨胀的);W和U可以是诸如矩阵乘法或多层卷积之类的线性算子,并且b是常数。单调算子网络的关键方面在于W具有特定的形式,即
使用这样的参数化,系统可以使用两种不同的方法来计算平衡点。 网络可以利用求根过程来确定不动点。第一种方法可以是前向-后向(FB)分裂方法。第二种方法可以是Peaceman-Rachford(PR)分裂方法。针对单调算子网络的这些方法实现如下:
算法:FB-前向求解(例如,FB分裂方法)
重复直到收敛:
返回z
算法:PR-前向求解(例如,Peacean-Rachford分裂方法)
重复直到收敛:
返回z
对于这两种算法或方法,可以是类似于基于梯度的优化方法中的步长的自由参数。给定特定的网络,可以调谐自由参数以提高收敛速度。对于PR-前向求解算法,系统典型地可以设置,而对于FB-前向求解算法,可能没有在一般情况下效果最好的单个值,并且该参数可以针对特定的网络进行调谐。
在步骤305,神经网络可以计算预测向量。网络可以执行某些数学运算来获得预测向量。这些操作可以在神经网络的隐藏层(例如,在输入层和输出层之间)中执行。可以通过取平衡点并应用另一个线性运算来计算预测向量。预测向量可以计算为:
预测向量可以是神经网络的权重的函数。
在步骤307,系统可以输出预测的分类。输入的预测分类可以是的最大值的索引。在示例中,当y的第三个条目最大时,系统可以预测该分类是类的分类。分类步骤可以对输入数据进行分类。在一个示例中,输入数据可以是图像,并且基于分类,神经网络可以将图像分类为车辆或行人的图像。输入数据的分类也可以用于训练神经网络,如下面进一步解释的。
图4描绘了单调网络的训练处理的流程图400。在步骤401,网络可以接收包括输入数据的对应分类的输入。输入可以定义为:
在步骤403,网络可以确定预测是否需要重复。当参数的值收敛时,或者当损失停止减少时,系统可以停止重复。如果出现任一场景,则系统可能停止重复训练处理中的每个步骤。
在步骤405,网络可以选择完全训练数据的子集,称为迷你批(minibatch)B。
在步骤409,系统可以计算损失。可以利用交叉熵损失来计算损失。损失可经由以下等式计算:
交叉熵损失可以测量分类模型的性能,该分类模型的输出是两个值之间(例如在0和1之间)的概率值。随着预测的概率偏离实际标签,交叉熵损失可能增加。例如,完美的模型将具有零损失。
在步骤411,系统可以计算损失相对于网络参数的导数。后向传递的计算可能需要系统计算损失相对于网络参数的导数。也就是说,系统可能需要计算:
例如,系统可能需要左乘(现有的自动微分工具容易计算出剩余项)。在单调算子框架中,存在与前向传递类似的方法来执行该乘法。具体地,给定,下面的两个算法可以产生必要的乘积。针对单调算子网络的这些方法的实现可以如下:
算法:FB-前向求解(例如,FB分裂方法)
重复:
另一种算法:PR-后向求解(例如,Peacean-Rachford分裂方法)
重复:
如前所述,可以是超参数,其对于PR变量可以设置为,并且需要调谐到特定的架构,以最小化FB变量所需的迭代次数。保证这些算法收敛到后向传递的唯一解。再次,对于其中W是结构化卷积算子的情况,可以使用快速傅立叶变换来执行必要的求逆。
在步骤413,系统可以使用它们的梯度来调整它们的参数。梯度可以定义为:
图5描绘了计算机控制的机器10和控制系统12之间的交互的示意图。计算机控制的机器10包括致动器14和传感器16。致动器14可以包括一个或多个致动器,并且传感器16可以包括一个或多个传感器。传感器16被配置为感测计算机控制的机器10的状况。传感器16可以被配置为将感测到的状况编码成传感器信号18,并将传感器信号18传输到控制系统12。传感器16的非限制性示例包括视频、雷达、LiDAR、超声波和运动传感器。在一个实施例中,传感器16是被配置为感测计算机控制的机器10附近的环境的光学图像的光学传感器。
控制系统12被配置为从计算机控制的机器10接收传感器信号18。如下面阐述的,控制系统12可以进一步被配置为取决于传感器信号计算致动器控制命令20,并将致动器控制命令20传输到计算机控制的机器10的致动器14。
如图5中所示,控制系统12包括接收单元22。接收单元22可以被配置为从传感器30接收传感器信号18,并将传感器信号18变换成输入信号x。在替代实施例中,传感器信号18在没有接收单元22的情况下作为输入信号x被直接接收。每个输入信号x可以是每个传感器信号18的一部分。接收单元22可以被配置为处理每个传感器信号18以产生每个输入信号x。输入信号x可以包括对应于由传感器16记录的图像的数据。
控制系统12包括分类器24。分类器24可以被配置为使用诸如上述神经网络的机器学习(ML)算法来将输入信号x分类成一个或多个标签。分类器24被配置为由诸如上述那些(例如,参数)参数来参数化。参数可以被存储在非易失性存储装置26中或由非易失性存储装置26提供。分类器24被配置为从输入信号x确定输出信号y。每个输出信号y包括为每个输入信号x分派一个或多个标签的信息。分类器24可以将输出信号y传输到转换单元28。转换单元28被配置为将输出信号y转换成致动器控制命令20。控制系统12被配置为将致动器控制命令20传输到致动器14,致动器14被配置为响应于致动器控制命令20来致动计算机控制的机器10。在另一个实施例中,致动器14被配置为直接基于输出信号y来致动计算机控制的机器10。
当致动器14接收到致动器控制命令20时,致动器14被配置为执行对应于相关致动器控制命令20的动作。致动器14可以包括控制逻辑,该控制逻辑被配置为将致动器控制命令20变换成用于控制致动器14的第二致动器控制命令。在一个或多个实施例中,替代致动器或除致动器之外,致动器控制命令20还可以用于控制显示器。
在另一个实施例中,替代包括传感器16的计算机控制的机器10或除了包括传感器16的计算机控制的机器10之外,控制系统12还包括传感器16。替代包括传感器16的计算机控制的机器10或除了包括致动器10的计算机控制的机器10之外,控制系统12还可以包括致动器14。
如图5中所示,控制系统12还包括处理器30和存储器32。处理器30可以包括一个或多个处理器。存储器32可以包括一个或多个存储器设备。一个或多个实施例的分类器24(例如ML算法)可以由控制系统12实现,该控制系统12包括非易失性存储装置26、处理器30和存储器32。
非易失性存储装置26可以包括一个或多个持久数据存储设备,诸如硬盘驱动器、光驱、磁带驱动器、非易失性固态设备、云存储或能够持久存储信息的任何其他设备。处理器30可以包括从高性能计算(HPC)系统选择的一个或多个设备,包括高性能核心、微处理器、微控制器、数字信号处理器、微型计算机、中央处理单元、现场可编程门阵列、可编程逻辑设备、状态机、逻辑电路、模拟电路、数字电路或基于驻留在存储器32中的计算机可执行指令操纵信号(模拟或数字)的任何其他设备。存储器32可以包括单个存储器设备或多个存储器设备,包括但不限于随机存取存储器(RAM)、易失性存储器、非易失性存储器、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、闪速存储器、高速缓冲存储器或能够存储信息的任何其他设备。
处理器30可以被配置为读入存储器32,并执行驻留在非易失性存储装置26中并且体现一个或多个实施例的一个或多个ML算法和/或方法的计算机可执行指令。非易失性存储装置26可以包括一个或多个操作系统和应用。非易失性存储装置26可以存储从使用多种编程语言和/或技术创建的计算机程序编译和/或解释的数据,所述编程语言和/或技术在没有限制的情况下并且单独或组合地包括Java、C、C++、C#、Objective C、Fortran、Pascal、Java Script、Python、Perl和PL/SQL。
在由处理器30执行时,非易失性存储装置26的计算机可执行指令可以使得控制系统12实现本文公开的ML算法和/或方法中的一个或多个。非易失性存储装置26还可以包括支持本文描述的一个或多个实施例的功能、特征和处理的ML数据(包括数据参数)。
体现本文描述的算法和/或方法的程序代码能够以多种不同的形式作为程序产品单独或共同分发。程序代码可以使用其上具有用于使得处理器实行一个或多个实施例的方面的计算机可读程序指令的计算机可读存储介质来分发。本质上非暂时性的计算机可读存储介质可以包括易失性和非易失性的、以及可移除和不可移除的有形介质,其以诸如计算机可读指令、数据结构、程序模块或其他数据的用于存储信息的任何方法或技术实现。计算机可读存储介质可以进一步包括RAM、ROM、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、闪速存储器或其他固态存储技术、便携式光盘只读存储器(CD-ROM)或其他光存储装置、盒式磁带、磁带、磁盘存储装置或其他磁存储设备,或可以用于存储所期望信息并可以由计算机读取的任何其他介质。计算机可读程序指令可以从计算机可读存储介质下载到计算机、另一种类型的可编程数据处理装置或另一种设备,或者经由网络下载到外部计算机或外部存储设备。
存储在计算机可读介质中的计算机可读程序指令可以用于指导计算机、其他类型的可编程数据处理装置或其他设备以特定方式运转,使得存储在计算机可读介质中的指令产生包括实现流程图或示图中指定的功能、动作和/或操作的指令的制品。在一些替代实施例中,流程图和示图中指定的功能、动作和/或操作可以被重新排序、串行地处理和/或与一个或多个实施例一致地同时处理。此外,流程图和/或示图中的任何一个可以包括比与一个或多个实施例一致地图示的那些更多或更少的节点或框。
可以使用合适的硬件组件、诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、状态机、控制器或其他硬件组件或设备,或者硬件、软件和固件组件的组合,来整体或部分地实施处理、方法或算法。
图6描绘了被配置为控制车辆50的控制系统12的示意图,车辆50可以是至少部分自主的车辆或至少部分自主的机器人。如图5中所示,车辆50包括致动器14和传感器16。传感器16可以包括一个或多个视频传感器、雷达传感器、超声波传感器、LiDAR传感器和/或定位传感器(例如,GPS)。一个或多个特定传感器中的一个或多个可以集成到车辆50中。可替代地或除了以上标识的一个或多个特定传感器之外,传感器16可以包括软件模块,该软件模块被配置为在执行时确定致动器14的状态。软件模块的一个非限制性示例包括天气信息软件模块,其被配置为确定车辆50或其他位置附近的天气的当前或未来状态。
车辆50的控制系统12的分类器24可以被配置为取决于输入信号x检测车辆50附近的对象。在这样的实施例中,输出信号y可以包括表征车辆50附近对象的信息。可以根据该信息确定致动器控制命令20。致动器控制命令20可以用于避免与检测到的对象碰撞。
在其中车辆50是至少部分自主车辆的实施例中,致动器14可以体现在车辆50的制动器、推进系统、发动机、传动系统或转向系统中。可以确定致动器控制命令20,从而控制致动器14,使得车辆50避免与检测到的对象碰撞。检测到的对象也可以根据分类器24认为它们最有可能是什么来分类,诸如行人或树木。致动器控制命令20可以取决于分类来确定。
在其中车辆50是至少部分自主的机器人的其他实施例中,车辆50可以是移动机器人,其被配置为实行一个或多个功能,诸如飞行、游泳、潜水和行走。移动机器人可以是至少部分自主的割草机或至少部分自主的清洁机器人。在这样的实施例中,可以确定致动器控制命令20,使得可以控制移动机器人的推进单元、转向单元和/或制动单元,使得移动机器人可以避免与标识的对象碰撞。
在另一个实施例中,车辆50是园艺机器人形式的至少部分自主的机器人。在这样的实施例中,车辆50可以使用光学传感器作为传感器16来确定车辆50附近环境中植物的状态。致动器14可以是被配置为喷射化学品的喷嘴。取决于所标识的植物种类和/或所标识的植物状态,可以确定致动器控制命令20,以使得致动器14利用合适数量的合适化学品喷洒植物。
车辆50可以是家用电器形式的至少部分自主的机器人。家用电器的非限制性示例包括洗衣机、炉子、烤箱、微波炉或洗碗机。在这样的车辆50中,传感器16可以是光学传感器,其被配置为检测将经历由家用电器进行处理的对象的状态。例如,在家用电器是洗衣机的情况下,传感器16可以检测洗衣机内部衣物的状态。可以基于衣物的所检测状态来确定致动器控制命令20。
图7描绘了控制系统12的示意图,该控制系统12被配置为控制制造系统102(诸如生产线的一部分)的制造机器100,诸如冲压刀具、刀具或枪钻。控制系统12可以被配置为控制致动器14,致动器14被配置为控制制造机器100。
制造机器100的传感器16可以是被配置为捕捉制造产品104的一个或多个性质的光学传感器。分类器24可以被配置为根据一个或多个所捕捉的性质来确定制造产品104的状态。致动器14可以被配置为取决于制造产品104的所确定状态来控制制造机器100,以用于制造产品104的后续制造步骤。致动器14可以被配置为取决于制造产品104的所确定状态来控制制造机器100在制造机器100的后续制造产品106上的功能。
图8描绘了控制系统12的示意图,该控制系统12被配置为控制具有至少部分自主模式的动力工具150,诸如电钻或驱动器。控制系统12可以被配置为控制致动器14,致动器14被配置为控制电动工具150。
电动工具150的传感器16可以是光学传感器,该光学传感器被配置为捕捉工作表面152和/或被驱动到工作表面152中的紧固件154的一个或多个性质。分类器24可以被配置为根据所捕捉的性质中的一个或多个来确定工作表面152和/或紧固件154相对于工作表面152的状态。该状态可以是紧固件154与工作表面152齐平。可替代地,该状态可以是工作表面154的硬度。致动器14可被配置为控制动力工具150,使得动力工具150的驱动功能取决于紧固件154相对于工作表面152的确定状态或工作表面154的一个或多个所捕捉性质来调整。例如,如果紧固件154的状态相对于工作表面152齐平,则致动器14可以中断驱动功能。作为另一个非限制性示例,致动器14可以取决于工作表面152的硬度施加附加的或更小的扭矩。
图9描绘了被配置为控制自动化个人助理200的控制系统12的示意图。控制系统12可以被配置为控制致动器14,致动器14被配置为控制自动化个人助理200。自动化个人助理200可以被配置为控制家用电器,诸如洗衣机、炉子、烤箱、微波炉或洗碗机。
传感器16可以是光学传感器和/或音频传感器。光学传感器可以被配置为接收用户202的手势204的视频图像。音频传感器可以被配置为接收用户202的语音命令。
自动化个人助理200的控制系统12可以被配置为确定被配置为控制系统12的致动器控制命令20。控制系统12可以被配置为根据传感器16的传感器信号18来确定致动器控制命令20。自动化个人助理200被配置为向控制系统12传输传感器信号18。控制系统12的分类器24可以被配置为执行手势识别算法以标识用户202做出的手势204,确定致动器控制命令20,并将致动器控制命令20传输到致动器14。分类器24可以被配置为响应于手势204从非易失性存储装置检索信息,并且以适合由用户202进行接收的形式输出检索到的信息。
图10描绘了被配置为控制监视系统250的控制系统12的示意图。监视系统250可以被配置为物理地控制通过门252的访问。传感器16可以被配置为检测与决定是否准许访问相关的场景。传感器16可以是被配置为生成和传输图像和/或视频数据的光学传感器。控制系统12可以使用这样的数据来检测人员的面部。
监视系统250的控制系统12的分类器24可以被配置为通过匹配存储在非易失性存储装置26中的已知人员的身份来解释图像和/或视频数据,从而确定人员的身份。分类器12可以被配置为响应于图像和/或视频数据的解释而生成和致动器控制命令20。控制系统12被配置为将致动器控制命令20传输到致动器12。在该实施例中,致动器12可以被配置为响应于致动器控制命令20来锁定或解锁门252。在其他实施例中,非物理的逻辑访问控制也是可能的。
监视系统250也可以是监督系统。在这样的实施例中,传感器16可以是被配置为检测被监督的场景的光学传感器,并且控制系统12被配置为控制显示器254。分类器24被配置为确定场景的分类,例如传感器16检测到的场景是否可疑。控制系统12被配置为响应于分类向显示器254传输致动器控制命令20。显示器254可以被配置为响应于致动器控制命令20来调整显示的内容。例如,显示器254可以突出显示被分类器24认为可疑的对象。
图11描绘了控制系统12的示意图,控制系统12被配置为控制成像系统300,例如MRI装置、x光成像装置或超声波装置。传感器16例如可以是成像传感器。分类器24可以被配置为确定所感测图像的全部或部分的分类。分类器24可以被配置为响应于由经训练的神经网络获得的分类来确定或选择致动器控制命令20。例如,分类器24可以将所感测图像的区域解释为潜在异常。在该情况下,可以确定或选择致动器控制命令20,以使得显示器302显示成像并突出显示潜在异常区域。
本文公开的处理、方法或算法可以是可递送到处理设备、控制器或计算机/由处理设备、控制器或计算机实现的,处理设备、控制器或计算机可以包括任何现有的可编程电子控制单元或专用电子控制单元。类似地,处理、方法或算法可以以多种形式存储为可由控制器或计算机执行的数据和指令,包括但不限于永久存储在诸如ROM设备的不可写存储介质上的信息和可变更地存储在诸如软盘、磁带、CD、RAM设备以及其他磁性和光学介质的可写存储介质上的信息。处理、方法或算法也可以在软件可执行对象中实现。可替代地,处理、方法或算法可以使用合适的硬件组件、诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、状态机、控制器或其他硬件组件或设备,或者硬件、软件和固件组件的组合来整体或部分地体现。
虽然上面描述了示例性实施例,但是不旨在使这些实施例描述权利要求所包含的所有可能的形式。说明书中使用的词语是描述性的词语,而不是限制性的词语,并且应当理解,在不脱离本公开的精神和范围的情况下,可以进行各种改变。如先前所述,各种实施例的特征可以被组合以形成可能没有被明确描述或图示的本发明的进一步的实施例。虽然各种实施例可能已经被描述为在一个或多个期望的特性方面提供了优点或相对于其他实施例或现有技术实现是优选的,但是本领域的普通技术人员认识到,一个或多个特征或特性可以被折衷以实现期望的总体系统属性,这取决于具体的应用和实现。这些属性可以包括但不限于成本、强度、耐用性、生命周期成本、适销性、外观、包装、大小、适用性、重量、可制造性、组装容易性等。照此,到任何实施例就一个或多个特性而言被描述为不如其他实施例或现有技术实现合期望的程度上,这些实施例不在本公开的范围之外,并且对于特定应用是合期望的。
Claims (20)
1.一种用于预测分类和训练神经网络的计算机实现的方法,包括:
在神经网络处接收输入;
利用前向传播对神经网络的输入进行分类,其中前向传播包括利用求根过程来标识与神经网络的一个或多个参数相关联的不动点;
通过利用不动点的线性变换计算向量;
响应于向量的最大元素输出输入的分类;和
利用后向传播来训练神经网络,其中后向传播包括标识与神经网络的参数相关联的损失的导数。
2.根据权利要求1所述的计算机实现的方法,其中执行后向传播包括利用前向-后向分裂方法。
3.根据权利要求1所述的计算机实现的方法,其中执行后向传播包括利用Peaceman-Rachford分裂方法。
4.根据权利要求1所述的计算机实现的方法,其中所述输入包括图像数据。
5.根据权利要求1所述的计算机实现方法,其中所述前向传播包括利用前向-后向分裂方法来标识所述不动点。
6.根据权利要求1所述的计算机实现方法,其中所述前向传播包括利用所述前向传播直到收敛。
7.根据权利要求1所述的计算机实现的方法,其中所述前向传播包括利用Peaceman-Rachford分裂方法来标识所述不动点。
8.根据权利要求1所述的计算机实现的方法,其中所述后向传播包括乘以非线性函数的不动点的偏导数的雅可比。
9.根据权利要求1所述的计算机实现的方法,其中所述后向传播包括利用超参数。
10.一种用于对去到神经网络的输入进行分类的计算机实现方法,包括:
在神经网络处接收输入;
利用前向传播来标识神经网络处的输入的分类,其中前向传播包括利用求根过程来标识与神经网络的参数相关联的不动点;
通过利用不动点的线性变换计算预测向量;和
响应于预测向量的最大值,输出输入的分类。
11.根据权利要求10所述的计算机实现的方法,其中执行前向传播包括利用前向-后向分裂方法。
12.根据权利要求10所述的计算机实现的方法,其中执行前向传播包括利用Peaceman-Rachford分裂方法。
13.根据权利要求10所述的计算机实现的方法,其中,所述神经网络处的输入包括从一个或多个相机接收的图像数据。
14.根据权利要求10所述的计算机实现的方法,其中利用非线性函数来标识所述不动点。
15.一种用于训练神经网络的系统,包括:
输入接口,用于访问神经网络的输入数据;和
与输入接口通信的处理器,所述处理器被编程为:
在神经网络处接收输入数据;和
利用前向传播和后向传播输出经训练的神经网络,其中前向传播包括利用求根过程来标识与神经网络的一个或多个参数相关联的不动点,其中后向传播包括标识与网络的参数相关联的损失的导数。
16.根据权利要求15所述的系统,其中,执行后向传播包括利用前向-后向分裂方法。
17.根据权利要求15所述的系统,其中执行后向传播包括利用Peaceman-Rachford分裂方法。
18.根据权利要求15所述的系统,其中所述处理器进一步被编程为利用与所述参数相关联的梯度来调整所述神经网络的参数。
19.根据权利要求15所述的系统,其中所述处理器进一步被编程为响应于索引来运行每个迷你批的前向传播。
20.根据权利要求15所述的系统,其中所述神经网络是卷积神经网络。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/850,816 US11468276B2 (en) | 2020-04-16 | 2020-04-16 | System and method of a monotone operator neural network |
US16/850816 | 2020-04-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113537486A true CN113537486A (zh) | 2021-10-22 |
Family
ID=77920137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110405309.9A Pending CN113537486A (zh) | 2020-04-16 | 2021-04-15 | 单调算子神经网络的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11468276B2 (zh) |
CN (1) | CN113537486A (zh) |
DE (1) | DE102021109382A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023221407A1 (zh) * | 2022-05-18 | 2023-11-23 | 北京百度网讯科技有限公司 | 模型生成方法、装置和电子设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11610129B2 (en) * | 2020-06-08 | 2023-03-21 | Robert Bosch Gmbh | System and method for multiscale deep equilibrium models |
US11724707B2 (en) * | 2020-07-08 | 2023-08-15 | Magna Electronics Inc. | Vehicular control system with automatic stack clearing of stack frame |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10262259B2 (en) * | 2015-05-08 | 2019-04-16 | Qualcomm Incorporated | Bit width selection for fixed point neural networks |
JP6280997B1 (ja) * | 2016-10-31 | 2018-02-14 | 株式会社Preferred Networks | 疾患の罹患判定装置、疾患の罹患判定方法、疾患の特徴抽出装置及び疾患の特徴抽出方法 |
US9934364B1 (en) * | 2017-02-28 | 2018-04-03 | Anixa Diagnostics Corporation | Methods for using artificial neural network analysis on flow cytometry data for cancer diagnosis |
US11501429B2 (en) * | 2017-07-19 | 2022-11-15 | Altius Institute For Biomedical Sciences | Methods of analyzing microscopy images using machine learning |
US11102462B2 (en) * | 2017-09-27 | 2021-08-24 | University Of Miami | Vision defect determination via a dynamic eye characteristic-based fixation point |
US11562208B2 (en) * | 2018-05-17 | 2023-01-24 | Qualcomm Incorporated | Continuous relaxation of quantization for discretized deep neural networks |
US11062024B2 (en) * | 2018-11-15 | 2021-07-13 | Crowdstrike, Inc. | Computer-security event security-violation detection |
CN113287122A (zh) * | 2018-11-18 | 2021-08-20 | 因纳特拉纳米系统有限公司 | 脉冲神经网络 |
EP3899874A4 (en) * | 2018-12-20 | 2022-09-07 | Packsize, LLC | SYSTEMS AND METHODS FOR SIZING OBJECTS BASED ON PARTIAL VISUAL INFORMATION |
US20200218982A1 (en) * | 2019-01-04 | 2020-07-09 | Microsoft Technology Licensing, Llc | Dithered quantization of parameters during training with a machine learning tool |
US20200264876A1 (en) * | 2019-02-14 | 2020-08-20 | Microsoft Technology Licensing, Llc | Adjusting activation compression for neural network training |
WO2020170036A1 (en) * | 2019-02-22 | 2020-08-27 | Stratuscent Inc. | Systems and methods for learning across multiple chemical sensing units using a mutual latent representation |
US10646156B1 (en) * | 2019-06-14 | 2020-05-12 | Cycle Clarity, LLC | Adaptive image processing in assisted reproductive imaging modalities |
-
2020
- 2020-04-16 US US16/850,816 patent/US11468276B2/en active Active
-
2021
- 2021-04-14 DE DE102021109382.1A patent/DE102021109382A1/de active Pending
- 2021-04-15 CN CN202110405309.9A patent/CN113537486A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023221407A1 (zh) * | 2022-05-18 | 2023-11-23 | 北京百度网讯科技有限公司 | 模型生成方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
DE102021109382A1 (de) | 2021-10-21 |
US20210326663A1 (en) | 2021-10-21 |
US11468276B2 (en) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113537486A (zh) | 单调算子神经网络的系统和方法 | |
US20220100850A1 (en) | Method and system for breaking backdoored classifiers through adversarial examples | |
US12020166B2 (en) | Meta-learned, evolution strategy black box optimization classifiers | |
CN113962399A (zh) | 用于机器学习中学习扰动集的方法和系统 | |
US11687619B2 (en) | Method and system for an adversarial training using meta-learned initialization | |
KR102597787B1 (ko) | 멀티스케일 딥 평형 모델들을 위한 시스템 및 방법 | |
US12026621B2 (en) | Method and system for low-query black-box universal attacks | |
US20240070449A1 (en) | Systems and methods for expert guided semi-supervision with contrastive loss for machine learning models | |
CN116258865A (zh) | 使用机器学习的图像量化 | |
JP2024045070A (ja) | ロングテール分類用のマルチ教師グループ蒸留のためのシステム及び方法 | |
US20230102866A1 (en) | Neural deep equilibrium solver | |
US20230100765A1 (en) | Systems and methods for estimating input certainty for a neural network using generative modeling | |
US12079995B2 (en) | System and method for a hybrid unsupervised semantic segmentation | |
US20240143975A1 (en) | Neural network feature extractor for actor-critic reinforcement learning models | |
US20230101812A1 (en) | Monotone mean-field inference in deep markov random fields | |
US20230100132A1 (en) | System and method for estimating perturbation norm for the spectrum of robustness | |
CN116523952A (zh) | 利用2d和3d逐点特征估计6d目标姿态 | |
US20230107463A1 (en) | Method and system for probably robust classification with multiclass enabled detection of adversarial examples | |
CN115482428A (zh) | 针对对抗性攻击为预训练模型预置鲁棒器的系统和方法 | |
CN114332551A (zh) | 学习联合潜在对抗训练的方法和系统 | |
US20220101116A1 (en) | Method and system for probably robust classification with detection of adversarial examples | |
US20240062058A1 (en) | Systems and methods for expert guided semi-supervision with label propagation for machine learning models | |
US20220092466A1 (en) | System and method for utilizing perturbation in a multimodal environment | |
US20240037282A1 (en) | Method and system of crown based for adversarial attacks | |
JP2023153100A (ja) | 物体発見のために利用される複素オートエンコーダのための方法及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |