CN111488965B - 时间事件序列的卷积动态玻尔兹曼机 - Google Patents
时间事件序列的卷积动态玻尔兹曼机 Download PDFInfo
- Publication number
- CN111488965B CN111488965B CN202010054686.8A CN202010054686A CN111488965B CN 111488965 B CN111488965 B CN 111488965B CN 202010054686 A CN202010054686 A CN 202010054686A CN 111488965 B CN111488965 B CN 111488965B
- Authority
- CN
- China
- Prior art keywords
- computer
- time
- dybm
- convolution
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000004044 response Effects 0.000 claims abstract description 8
- 230000000704 physical effect Effects 0.000 claims abstract description 7
- 238000003860 storage Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 18
- 230000015654 memory Effects 0.000 claims description 10
- 210000002569 neuron Anatomy 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 9
- 238000011176 pooling Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 210000000225 synapse Anatomy 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001242 postsynaptic effect Effects 0.000 description 2
- 230000003518 presynaptic effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000009172 bursting Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 210000005215 presynaptic neuron Anatomy 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/153—Multidimensional correlation or convolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/3004—Arrangements for executing specific machine instructions to perform operations on memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Neurology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
提供了一种用于机器预测的计算机实现的方法。该方法包括由硬件处理器通过利用卷积运算扩展非卷积动态玻尔兹曼机(DyBM)来形成卷积动态玻尔兹曼机(C‑DyBM)。该方法还包括由硬件处理器使用C‑DyBM的卷积运算根据观察的时间序列的过去图块来生成时间t的未来事件的预测。该方法还包括由硬件处理器响应于时间t的未来事件的预测而执行物理动作。
Description
技术领域
本发明总体上涉及机器学习,并且更具体地涉及用于时间事件序列的卷积动态玻尔兹曼机(DyBM)。
背景技术
当前,没有好的方法可以应用于涉及时间事件序列的预测问题。时间事件序列是带有时间戳的事件的一组记录。例如,电子健康记录(EHR)、计算机性能跟踪中的实验室结果可能涉及时间事件序列。
为了对时间事件序列进行建模,与普通时间序列数据相比,存在一些技术障碍。例如,这些技术障碍中的一些包括但不限于:时间间隔彼此不同;并且并非总是观察到所有属性。障碍要求时移不变性和针对缺失值的鲁棒性。
尽管CNN的变体可以满足上述要求,但是它们不具有时间序列模型的理想功能。例如,所实现的建模在对时间序列数据进行建模的方式方面通常是多余的。同样,这样的变体不能处理具有无限长度的序列。因此,需要一种用于时间事件序列的改进的预测模型。
发明内容
根据本发明的一个方面,提供了一种用于机器预测的计算机实现的方法。该方法包括由硬件处理器通过利用卷积运算扩展非卷积动态玻尔兹曼机(DyBM)来形成卷积DyBM(C-DyBM)。该方法还包括由硬件处理器使用C-DyBM的卷积运算根据观察的时间序列的过去图块来生成时间t的未来事件的预测。该方法还包括由硬件处理器响应于时间t的未来事件的预测而执行物理动作。
根据本发明的另一方面,提供一种用于机器预测的计算机程序产品。该计算机程序产品包括非暂态计算机可读存储介质,该非暂态计算机可读存储介质具有利用其实现的程序指令,该程序指令由计算机可执行以引起计算机执行一种方法。该方法包括由硬件处理器通过利用卷积运算扩展非卷积动态玻尔兹曼机(DyBM)来形成卷积DyBM(C-DyBM)。该方法还包括由硬件处理器使用C-DyBM的卷积运算根据观察的时间序列的过去图块来生成时间t的未来事件的预测。该方法还包括由硬件处理器响应于时间t的未来事件的预测而执行物理动作。
根据本发明的又一方面,提供了一种用于机器预测的计算机处理系统。该计算机处理系统包括用于存储程序代码的存储器。该计算机处理系统还包括处理器,该处理器用于运行程序代码以通过利用卷积运算扩展非卷积动态玻尔兹曼机(DyBM)来形成卷积DyBM(C-DyBM)。处理器还运行程序代码以使用C-DyBM的卷积运算根据观察的时间序列的过去图块来生成时间t的未来事件的预测。处理器还运行程序代码以响应于时间t的未来事件的预测而执行物理动作。
根据以下对将结合附图来阅读的其说明性实施例的详细描述,这些和其他特征和优点将变得很清楚。
附图说明
以下描述将参考以下附图提供优选实施例的细节,在附图中:
图1是示出根据本发明的实施例的可以应用本发明的示例性处理系统的框图;
图2是示出根据本发明的实施例的可以应用本发明的一个示例性环境的框图;
图3是示出根据本发明的实施例的可以应用本发明的另一示例性环境的框图;
图4示出了根据本发明的实施例的被修改为卷积动态玻尔兹曼机(C-DyBM)的动态玻尔兹曼机(DyBM);
图5示出了根据本发明的实施例的示例性动态池化操作;
图6是示出根据本发明的实施例的用于使用卷积玻尔兹曼机(C-DyBM)根据时间事件序列生成预测的示例性方法的流程图;
图7是示出根据本发明的实施例的具有一个或多个云计算节点的说明性云计算环境的框图,云消费者使用的本地计算设备与该云计算节点进行通信;以及
图8是示出根据本发明的实施例的由云计算环境提供的一组功能抽象层的框图。
具体实施方式
本发明涉及用于时间事件序列的卷积动态玻尔兹曼机(DyBM)。
在一个实施例中,卷积结构被并入时间序列模型DyBM中。在一个实施例中,本发明被部署在如下的问题设置中:根据事件X的过去的时间序列来预测目标变量y(θ:模型参数)。在一个实施例中,y可以是未来事件本身(自回归)或未来的任何其他不可观察变量(回归或分类),使得:
其中
X是事件的过去的时间序列,
y是未来的事件,以及
θ是模型参数。
图1是示出根据本发明的实施例的可以应用本发明的示例性处理系统100的框图。处理系统100包括一组处理单元(例如,CPU)101、一组GPU 102、一组存储器设备103、一组通信设备104和一组外围设备105。CPU 101可以是单核或多核CPU。GPU 102可以是单核或多核GPU。一个或多个存储器设备103可以包括高速缓存、RAM、ROM和其他存储器(闪存、光学、磁性等)。通信设备104可以包括无线和/或有线通信设备(例如,网络(例如,WIFI等)适配器等)。外围设备105可以包括显示设备、用户输入设备、打印机、成像设备等。处理系统100的元件通过一个或多个总线或网络(由附图标记110共同表示)连接。
在一个实施例中,存储器设备103可以存储经过特殊编程的软件模块,以便在被配置为实现本发明的各个方面的专用计算机中变换计算机处理器系统。在一个实施例中,专用硬件(例如,专用集成电路等)可以用于实现本发明的各种元件。
当然,如本领域技术人员容易想到的,处理系统100还可以包括其他元件(未示出),并且也可以省略某些元件。例如,各种其他输入设备和/或输出设备可以被包括在处理系统100中,这取决于其特定实现,如本领域普通技术人员容易理解的。例如,可以使用各种类型的无线和/或有线输入和/或输出设备。此外,如本领域普通技术人员容易理解的,还可以使用各种配置的附加处理器、控制器、存储器等。此外,在另一实施例中,可以使用云配置(例如,参见图7-8)。鉴于本文中提供的本发明的教导,本领域普通技术人员容易想到处理系统100的这些和其他变型。
此外,应当理解,以下关于与本发明有关的各种元件和步骤所描述的各种附图可以全部或部分地由系统100的一个或多个元件来实现。
现在将根据本发明的实施例对DyBM操作进行描述。如这里所指出的,出于本发明的目的,DyBM被扩展为包括动态卷积结构。
动态玻尔兹曼机(DyBM)可以实现为人工循环神经网络的模型,该模型可以经由依赖于峰值定时的可塑性(STDP)进行训练,STDP是一种被假定并且在实验上被证实用于生物神经网络的学习规则。更具体地,诸如DyBM的权重和偏置等参数可以经由该学习规则进行优化以使得给定时间序列数据的可能性被最大化(即,最有可能根据由DyBM利用优化参数定义的概率分布来生成时间序列数据)。DyBM还具有需要调节的超参数。这些超参数可以包括例如资格痕迹的衰减率和先进先出(FIFO)队列的长度。
在一个实施例中,出于本发明的目的而扩展的DyBM包括经由先进先出(FIFO)队列连接到另一神经元的神经元。该神经元称为突触前,而该另一神经元称为突触后。注意,根据所考虑的连接,每个神经元可以称为突触前或突触后。在每个步骤t,突触前神经元i激发或不激发,并且该二进制信息沿着FIFO队列行进并且然后到达突触。从神经元i激发尖峰到尖峰到达与神经元j连接的突触之间的这个时间间隔称为从i到j的传导延迟dij。突触存储并且继续更新被称为突触资格痕迹的量的值,该量的值在每个步骤以速率λ衰减,但在尖峰/>到达突触时增加1。本发明将DyBM中的资格痕迹的求和和定义扩展到我们的模型中的一维卷积运算。
现在将给出根据本发明的各个实施例的关于可以应用本发明的两个示例性环境200和300的描述。下面分别参考图2和3描述环境200和300。更详细地,环境200包括可操作地耦合到受控系统的预测系统,而环境300包括作为受控系统的一部分的预测系统。此外,环境200和300中的任何一个可以是基于云的环境的一部分(例如,参见图7-8)。在保持本发明的精神的同时,鉴于本文中提供的本发明的教导,本领域普通技术人员可以容易地确定可以应用本发明的这些和其他环境。
图2是示出根据本发明的实施例的可以应用本发明的一个示例性环境200的框图。
环境200包括预测系统210和受控系统220。预测系统210和受控系统220被配置为使得能够在它们之间进行通信。例如,可以使用收发器和/或其他类型的通信设备,包括无线、有线及其组合。在一个实施例中,预测系统210和受控系统220之间的通信可以在一个或多个网络上执行,该网络由附图标记230共同表示。通信可以包括但不限于来自受控系统220的序列数据、以及来自预测系统210的预测和动作启动控制信号。受控系统220可以是任何类型的基于处理器的系统,例如但不限于银行系统、访问系统、监视系统、制造系统(例如,装配线)、高级驾驶员辅助系统(ADAS)等。
受控系统220向预测系统210提供数据(例如,序列数据),预测系统210使用该数据进行预测。
受控系统220可以基于由预测系统210生成的预测来控制。例如,基于对机器将在x个时间步长内发生故障的预测,可以在t<x时执行对应的动作(例如,关闭机器电源,启用机器安全防护措施以防止伤害等,等等),以避免实际发生故障。作为另一示例,基于入侵者的轨迹,被控制的监控系统可以锁定或解锁一个或多个门,以便将某人固定在某个地方(保持区域)和/或将他们引导到安全的地方(安全室)和/或将他们限制在受限的地方等等。可以提供口头(来自扬声器)或显示(在显示设备上)的指令以及门的锁定和/或解锁(或其他动作),以引导人。作为另外的示例,可以控制车辆(制动、转向、加速等),以响应于预报而避开被预测为在汽车的行驶线路上的障碍物。作为又一示例,本发明可以被并入计算机系统中,以便预报即将发生的故障并且在故障发生之前采取措施,诸如将很快将发生故障的组件与另一组件切换,路由通过不同的组件,使用不同的组件进行处理,等等。应当理解,前述动作仅是示例性的,因此,在保持本发明的精神的同时,还可以根据实现来执行其他动作,如本领域普通技术人员鉴于本文中提供的本发明的教导容易理解的。
在一个实施例中,预测系统210可以被实现为云计算布置中的节点。在一个实施例中,单个预测系统210可以被分配给单个受控系统或多个受控系统,例如,装配线中的不同机器人等。在保持本发明的精神的同时,鉴于本文中提供的本发明的教导,本领域普通技术人员可以容易地确定环境200的元件的这些和其他配置。
图3是示出根据本发明的实施例的可以应用本发明的另一示例性环境300的框图。
环境300包括受控系统320,该受控系统320又包括预测系统310。一个或多个通信总线和/或其他设备可以用于促进系统间以及系统内通信。受控系统320可以是任何类型的基于处理器的系统,例如但不限于银行系统、访问系统、监控系统、制造系统(例如,装配线)、高级驾驶员辅助系统(ADAS)等。
除了系统310被包括在系统320中,环境200和300中的这些元件的操作是相似的。因此,为了简洁起见,将不关于图3更详细地描述元件310和320,读者鉴于两个环境200和300中的这些元件的共同功能分别被引导到关于图2的环境200的元件210和220的描述。
在一个实施例中,可以使用以下预测模型:
其中
是在时间t-d的第i属性值/>的在时间τk上的第k卷积图的卷积参数,其中在第k卷积图中使用/>的以下定义之一(即,(1)或(2)):
(1)以及
(2)例如,可以在K个卷积图块中使用相同的比例,并且
其中
是在时间t之前发生的过去的观察,
U、V和b是K个卷积图的模型参数,
λ和μ是衰减率,
T是过去的观察的长度,以及
Tk是第k卷积图的图块的宽度。
预测模型利用动态卷积结构扩展DyBM以提供卷积DyBM(C-DyBM)。通过使用卷积运算,可以根据过去的图块而不是点来预测未来。
图4示出了根据本发明的实施例的被修改为卷积动态玻尔兹曼机(C-DyBM)450的动态玻尔兹曼机(DyBM)400。DyBM通过获取在时间t 411之前发生的过去的观察(包括时间t-1 422的观察/>和时间t-d 421的观察/>)的加权总和来预测时间t412的未来事件,其中时间t-d 421的观察/>的权重是/>C-DyBM 450通过获取在时间t 461之前发生的过去的观察/>(包括时间t-d-τk-1 471的观察时间t-d-τk 472的观察/>和时间t-d-τk+1 473的观察/>)的图块(包括时间t-d-τk 480的图块)的加权总和来预测时间t 462的未来事件,其中时间t-d 480的图块中的观察/>471、/>472和/>473的权重分别是 和/>
在一个实施例中,用于将DyBM 400扩展为C-DyBM 450的动态卷积结构将DyBM中的资格痕迹的求和和定义扩展到我们的模型中的一维卷积运算。C-DyBM 450具有跨时间的卷积结构,其中卷积图块的权重在每个时间点以指数方式衰减。
在一个实施例中,可以使用以下池化方法:动态池化。
在一个实施例中,根据本发明的动态池化可以涉及:通过在子时间区域上取最大值同时以指数方式增加窗口大小来动态地下采样潜在表示。动态池化通过在该取最大值操作中忽略缺失值来产生易于处理(tractable)的分析,并且在使最终窗口大小近似等于无穷大时,能够处理无限序列和具有不同长度的序列。
图5示出了根据本发明的实施例的示例性动态池化操作500。动态池化操作500通过在图块504中的子时间区域(例如,511、512和512)上取最大值同时以指数方式增加窗口大小来动态地下采样用于未来事件521的C-DyBM预测的预处理的观察或潜在表示,并且使用下采样的观察或潜在表示作为C-DyBM预测的输入。池化窗口根据从预测点t开始的时间增加,如503、502和501。
动态池化操作500可以通过以下方式实现:
其中l0是初始窗口大小,并且l是窗口的增长率。
现在将给出根据本发明的各种实施例的关于参数更新规则的描述。以下随机梯度下降(SGD)变体可以用于更新参数规则:
以下参数更新规则可以用于预测实际值:
以下参数更新规则可以用于预测离散值:
可以根据均方误差、交叉熵、对数似然和其他函数来为每个任务选择损失函数Lc。σ可以是softmax函数。
图6是示出根据本发明的实施例的用于使用卷积玻尔兹曼机(C-DyBM)根据时间事件序列生成预测的示例性方法的流程图。
在框610,由硬件处理器通过利用动态卷积结构扩展非卷积动态玻尔兹曼机(DyBM)来形成卷积DyBM(C-DyBM)。
在一个实施例中,C-DyBM可以如下实现:
其中
是在时间t-d的第i属性值/>的在时间τk上的第k卷积图的卷积参数,其中在第k卷积图中使用/>的以下定义之一:
(1)以及
(2)例如,可以在K个卷积图块中使用相同的比例,并且
其中
是在时间t之前发生的过去的观察,
U、V和b是K个卷积图的模型参数,
λ和μ是衰减率,
T是过去的观察的长度,以及
Tk是第k卷积图的图块的宽度。
在一个实施例中,框610可以包括框610A。
在框610A,通过在子时间区域上取最大值同时以指数方式增加窗口大小来动态地下采样潜在表示。
在一个实施例中,下采样可以如下进行;
其中l0是初始窗口大小,并且l是窗口的增长率。
在一个实施例中,动态下采样忽略缺失的序列值。在一个实施例中,子时间区域的长度是变化的。在一个实施例中,窗口大小最终增加到无穷大。
在框620,使用C-DyBM的卷积运算根据C-DyBM中的过去的图块来生成未来事件的预测。
在框630,响应于未来事件的预测执行物理动作。
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其它类型的计算环境而实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
现在参考图7,示出了示例性的云计算环境750。如图所示,云计算环境750包括由云计算消费者使用的本地计算设备可以与其进行通信的一个或者多个云计算节点710,本地计算设备诸如例如个人数字助理(PDA)或移动电话754A、台式计算机754B、笔记本计算机754C和/或汽车计算机系统754N。节点710可以彼此通信。它们可以在一个或多个网络中物理或虚拟地分组(图中未示出),诸如如上所述的私有云、共同体云、公共云或混合云或者其组合。这允许云计算环境750提供基础架构即服务、平台即服务和/或软件即服务,而云的消费者无需在本地计算设备上保持资源。应当理解,图7所示的类型的计算设备754A-N仅仅是示意性的,并且云计算节点710和云计算环境750可以通过任何类型的网络和/或网络可寻址连接来与任何类型的计算设备通信(例如,使用网络浏览器)。
现在参考图8,示出了由云计算环境750(图7)提供的一组功能抽象层。首先应当理解,图8所示的组件、层以及功能都仅仅是示意性的,并且本发明的实施例不限于此。如图所示,提供下列层和对应功能:
硬件和软件层860包括硬件和软件组件。硬件组件的示例包括:主机861;基于RISC(精简指令集计算机)架构的服务器862;服务器863;刀片服务器864;存储设备865;以及网络和网络组件866。在一些实施例中,软件组件包括网络应用服务器软件867和数据库软件868。
虚拟化层870提供抽象层,从该抽象层可以提供虚拟实体的以下示例:虚拟服务器871;虚拟存储装置872;虚拟网络873,包括虚拟专用网络;虚拟应用和操作系统874;以及虚拟客户端875。
在一个示例中,管理层880可以提供下面描述的功能。资源供应881提供用于在云计算环境内执行任务的计算资源和其他资源的动态获取。计量和定价882提供在资源在云计算环境中被利用时的成本跟踪,并且提供用于消费这些资源的计费或发票。在一个示例中,这些资源可以包括应用软件许可。安全性为云消费者和任务提供身份验证并且提供对数据和其他资源的保护。用户门户883为消费者和系统管理员提供对云计算环境的访问。服务级别管理884提供云计算资源分配和管理,使得能够满足所需要的服务级别。服务水平协议(SLA)规划和实现885提供根据SLA而预期其未来需求的云计算资源的预先布置和获取。
工作负载层890提供可以利用云计算环境的功能的示例。可以从该层提供的工作负载和功能的示例包括:映射和导航891;软件开发和生命周期管理892;虚拟教室教育传输893;数据分析处理894;事务处理895;使用DyBM 896进行预测。
本发明可以是处于任何可能的技术细节集成水平的系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有用于引起处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质。
计算机可读存储介质可以是可以保留和存储供指令执行设备使用的指令的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或前述各项的任何合适的组合。计算机可读存储介质的更具体示例的非穷举列表包括:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备(诸如其上记录有指令的打孔卡或凹槽中的凸起结构)、以及前述各项的任何合适的组合。如本文中使用的,计算机可读存储介质不应当被理解为暂态信号本身,诸如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如,穿过光纤电缆的光脉冲)或通过电线传输的电信号。
可以经由例如互联网、局域网、广域网和/或无线网络等网络将本文中描述的计算机可读程序指令从计算机可读存储介质下载到相应的计算/处理设备,或者下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令,并且转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本发明的操作的计算机可读程序指令可以是汇编程序指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者用一种或多种编程语言(包括诸如SMALLTALK、C++等面向对象的编程语言、以及诸如“C”编程语言或类似编程语言等常规过程编程语言)的任何组合编写的源代码或目标代码。计算机可读程序指令可以完全在用户的计算机上,部分地在用户的计算机上,作为独立软件包执行,部分地在用户的计算机上并且部分地在远程计算机上,或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户的计算机,或者可以与外部计算机建立连接(例如,使用互联网服务提供商通过互联网)。在一些实施例中,包括例如可编程逻辑电路系统、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路系统可以通过利用计算机可读程序指令的状态信息个性化电子电路系统来执行计算机可读程序指令,以执行本发明的方面。
本文中参考根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图描述了本发明的各方面。应当理解,流程图图示和/或框图的每个框以及流程图图示和/或框图中的框的组合可以由计算机可读程序指令来实现。
可以将这些计算机可读程序指令提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,使得这些指令在经由计算机或其他可编程数据处理装置的处理器执行时创建用于实现流程图和/或框图的一个或多个框中指定的功能/动作的装置。这些计算机可读程序指令还可以存储在计算机可读存储介质中,该计算机可读存储介质可以指导计算机、可编程数据处理装置和/或其他设备以特定方式起作用,使得其中存储有指令的计算机可读存储介质包括制品,该制品包括实现在流程图和/或框图的一个或多个框中指定的功能/动作的各方面的指令。
也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置或其他设备上,以引起一系列操作步骤在计算机、其他可编程装置或其他设备上被执行以产生计算机实现的过程,使得在计算机、其他可编程装置或其他设备上执行的指令实现在流程图和/或框图的一个或多个框中指定的功能/动作。
附图中的流程图和框图示出了根据本发明的各个实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。就这一点而言,流程图或框图中的每个框可以表示指令的模块、片段或部分,其包括用于实现一个或多个指定的逻辑功能的一个或多个可执行指令。在一些替代实现中,框中指出的功能可以不按图中指出的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。还应当注意,框图和/或流程图图示中的每个框以及框图和/或流程图图示中的框的组合可以由执行指定功能或动作或者执行专用硬件和计算机指令的组合的专用的基于硬件的系统来实现。
说明书中对本发明的“一个实施例”或“实施例”的引用以及其其他变型表示在本发明的至少一个实施例中包括结合该实施例描述的特定特征、结构、特性等。因此,在整个说明书中出现在各个地方的短语“在一个实施例中”或“在实施例中”以及任何其他变型的出现不一定都指代同一实施例。
应档理解,例如,在“A/B”、“A和/或B”和“A和B中的至少一个”的情况下,使用以下任何“/”、“和/或”和“至少一个”旨在包括仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或选择两个选项(A和B)。作为另一示例,在“A、B和/或C”和“A、B和C中的至少一个”的情况下,这种措辞旨在包括仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或仅选择第三列出的选项(C),或仅选择第一和第二列出的选项(A和B),或选择仅限第一和第三列出的选项(A和C),或仅选择第二和第三个列出的选项(B和C),或选择所有三个选项(A和B和C)。如本领域和相关领域的普通技术人员很清楚的,对于所列出的很多项目,这可以扩展。
已经描述了系统和方法的优选实施例(其旨在是说明性的而非限制性的),应当注意,本领域技术人员根据上述教导可以进行修改和变化。因此,应当理解,可以对所公开的特定实施例进行改变,这些改变在由所附权利要求概述的本发明的范围内。已经如此描述了本发明的各方面,具有专利法所要求的细节和特殊性,在所附权利要求中阐述了由专利证书所要求和期望保护的内容。
Claims (9)
1.一种用于机器预测碰撞的计算机实现的方法,包括:
由硬件处理器通过利用卷积运算、将神经元通过先进先出队列连接到另一神经元来扩展非卷积动态玻尔兹曼机DyBM来形成卷积动态玻尔兹曼机C-DyBM;
由所述硬件处理器使用所述C-DyBM的所述卷积运算根据观察的时间序列的过去图块来生成时间t的未来事件的预测,其中所述时间t的未来事件是通过使用具有模型参数θ∈[U,V,b,λ,μ,W]的如下预测模型f根据在所述时间t之前发生的过去的观察来预测的:
其中
i和j是神经元的编号,是在时间t-d的第i属性值/>的在时间τk上的第k卷积图的卷积参数,其中所述第k卷积图中的/>选自以下之一
以及
以及
其中
是在所述时间t之前发生的过去的观察,
U、V和b是K个卷积图的所述模型参数,
λ和μ是衰减率,
T是所述过去的观察的长度,以及
Tk是第k卷积图的图块的宽度;以及
由所述硬件处理器响应于所述时间t的未来事件的所述预测而执行物理动作,所述物理动作包括:响应于基于车辆的当前轨迹所述时间t处的未来事件的所述预测是与障碍物的碰撞,通过自动控制所述车辆的一个或多个驾驶相关功能来避开所述障碍物。
2.根据权利要求1所述的计算机实现的方法,还包括使用下采样函数同时以指数方式增加窗口大小来动态下采样观察和潜在表示中的任何一个,所述下采样函数在子时间区域上取最大值,所述下采样函数是其中l0是所述窗口的初始大小,并且l是所述窗口的增长率。
3.根据权利要求2所述的计算机实现的方法,其中缺失的序列值被所述动态下采样忽略。
4.根据权利要求2所述的计算机实现的方法,其中所述子时间区域具有变化的长度。
5.根据权利要求2所述的计算机实现的方法,其中最早的子时间区域的所述窗口大小是无穷大。
6.根据权利要求1所述的计算机实现的方法,其中用于扩展所述DyBM的所述卷积运算是一维卷积运算。
7.根据权利要求6所述的计算机实现的方法,其中所述一维卷积运算扩展所述C-DyBM中的资格痕迹的总和。
8.一种用于机器预测的计算机处理系统,包括:
存储器,用于存储程序代码;以及
处理器,用于运行所述程序代码以执行根据权利要求1至7中任一项所述的方法。
9.一种计算机可读存储介质,具有利用其实现的程序指令,所述程序指令由计算机可执行以引起所述计算机执行根据权利要求1至7中任一项所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/261,019 US11704542B2 (en) | 2019-01-29 | 2019-01-29 | Convolutional dynamic Boltzmann Machine for temporal event sequence |
US16/261,019 | 2019-01-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111488965A CN111488965A (zh) | 2020-08-04 |
CN111488965B true CN111488965B (zh) | 2024-02-02 |
Family
ID=71731434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010054686.8A Active CN111488965B (zh) | 2019-01-29 | 2020-01-17 | 时间事件序列的卷积动态玻尔兹曼机 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11704542B2 (zh) |
CN (1) | CN111488965B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200364508A1 (en) * | 2019-05-14 | 2020-11-19 | Nvidia Corporation | Using decay parameters for inferencing with neural networks |
CN113190632B (zh) * | 2020-12-23 | 2023-08-15 | 南京未来网络产业创新有限公司 | 一种轨迹复原算法的模型建立方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106940639A (zh) * | 2016-01-04 | 2017-07-11 | 国际商业机器公司 | 用于可配置代码指纹的方法、系统和计算机可读介质 |
CN107330908A (zh) * | 2017-06-28 | 2017-11-07 | 陕西师范大学 | 一种基于卷积受限玻尔兹曼机的形状建模方法及相关装置 |
WO2018229550A1 (en) * | 2017-06-16 | 2018-12-20 | Nauto Global Limited | System and method for adverse vehicle event determination |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5911834B2 (ja) | 2013-09-11 | 2016-04-27 | 株式会社東芝 | 不揮発性半導体記憶装置 |
US20160071211A1 (en) * | 2014-09-09 | 2016-03-10 | International Business Machines Corporation | Nonparametric tracking and forecasting of multivariate data |
US10223175B2 (en) * | 2016-10-10 | 2019-03-05 | International Business Machines Corporation | Modifying a device based on an annotated time series of sensor readings |
EP3378731B1 (en) * | 2017-03-20 | 2020-01-15 | Volvo Car Corporation | Apparatus and method for driver activity dependent (adas) wheel angle controller |
-
2019
- 2019-01-29 US US16/261,019 patent/US11704542B2/en active Active
-
2020
- 2020-01-17 CN CN202010054686.8A patent/CN111488965B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106940639A (zh) * | 2016-01-04 | 2017-07-11 | 国际商业机器公司 | 用于可配置代码指纹的方法、系统和计算机可读介质 |
WO2018229550A1 (en) * | 2017-06-16 | 2018-12-20 | Nauto Global Limited | System and method for adverse vehicle event determination |
CN107330908A (zh) * | 2017-06-28 | 2017-11-07 | 陕西师范大学 | 一种基于卷积受限玻尔兹曼机的形状建模方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
US11704542B2 (en) | 2023-07-18 |
CN111488965A (zh) | 2020-08-04 |
US20200242446A1 (en) | 2020-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111033523A (zh) | 用于图像分类任务的数据增强 | |
US20220051142A1 (en) | Runtime estimation for machine learning tasks | |
US20190385061A1 (en) | Closed loop model-based action learning with model-free inverse reinforcement learning | |
CN110782000B (zh) | 通过具有对抗强化学习的动作成形来进行模仿学习 | |
US11676013B2 (en) | Job-launch time reduction by node pre-configuration | |
CN111488965B (zh) | 时间事件序列的卷积动态玻尔兹曼机 | |
CN111191013B (zh) | 用于生成和执行最优对话策略的方法和系统 | |
US11188797B2 (en) | Implementing artificial intelligence agents to perform machine learning tasks using predictive analytics to leverage ensemble policies for maximizing long-term returns | |
US20200027032A1 (en) | Reducing computational costs to perform machine learning tasks | |
CN112417938B (zh) | 使用机器学习模型生成人类姿势的概念图像 | |
US20200034705A1 (en) | Action shaping from demonstration for fast reinforcement learning | |
US11551129B2 (en) | Quantum platform routing of a quantum application component | |
CN110732137B (zh) | 对深度学习网络的注意力的持续控制 | |
CN111489794B (zh) | 用于创建预测模型的方法 | |
US20200034704A1 (en) | Sequential learning of constraints for hierarchical reinforcement learning | |
CN112528678B (zh) | 基于上下文信息的对话系统 | |
US11182674B2 (en) | Model training by discarding relatively less relevant parameters | |
US11410023B2 (en) | Lexicographic deep reinforcement learning using state constraints and conditional policies | |
US11823039B2 (en) | Safe and fast exploration for reinforcement learning using constrained action manifolds | |
US20230177355A1 (en) | Automated fairness-driven graph node label classification | |
US20200097813A1 (en) | Deep learning model for probabilistic forecast of continuous manufacturing process | |
CN111046338B (zh) | 使用复值矢量自回归的多步提前预测 | |
US20190385091A1 (en) | Reinforcement learning exploration by exploiting past experiences for critical events | |
US20230124348A1 (en) | Recognizing social groups and identifying order in queues from rgb images | |
US20220036198A1 (en) | Fixed, random, recurrent matrices for increased dimensionality in neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |