CN113011555B - 一种数据处理方法、装置、设备及存储介质 - Google Patents
一种数据处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113011555B CN113011555B CN202110182052.5A CN202110182052A CN113011555B CN 113011555 B CN113011555 B CN 113011555B CN 202110182052 A CN202110182052 A CN 202110182052A CN 113011555 B CN113011555 B CN 113011555B
- Authority
- CN
- China
- Prior art keywords
- time step
- data
- processing units
- unit
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 457
- 230000004913 activation Effects 0.000 claims abstract description 257
- 239000013598 vector Substances 0.000 claims abstract description 225
- 238000012216 screening Methods 0.000 claims abstract description 88
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims abstract description 61
- 230000006870 function Effects 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 25
- 238000010586 diagram Methods 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 10
- 230000000306 recurrent effect Effects 0.000 description 8
- 230000006403 short-term memory Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000007787 long-term memory Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- YZCKVEUIGOORGS-IGMARMGPSA-N Protium Chemical compound [1H] YZCKVEUIGOORGS-IGMARMGPSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种数据处理方法、装置、设备及计算机可读存储介质。其中方法包括:获取第t个时间步的输入数据对应的K个投影向量,以及M个处理单元在第t‑1个时间步的状态信息,根据M个处理单元在第t‑1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元,获取目标激活单元的第一拼接数据,并根据第一拼接数据,计算目标激活单元在第t个时间步的隐藏状态。可见,通过相似度对处理单元进行筛选,可以使得各个处理单元处理与自身信息相关程度较高的数据(即使得各个处理单元处理与自身特性相关的数据),进而提高人工智能模型的处理结果的准确度。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种数据处理方法、装置、设备及计算机可读存储介质。
背景技术
网格长短期记忆(GridLSTM)是一种由多个长短期记忆(LSTM)网络单元构成的网络结构。在数据处理过程中,网格长短期记忆网络采用多个循环神经网络单元进行协作,相较于采用单一循环神经网络对数据进行处理更加高效,且在不同环境下(处理不同类型数据)的泛化性更好。
在实际应用中,网格长短期记忆网络中的各个LSTM又分别负责不同的功能,由于各个LSTM共享输入信息,输入信息的无差异性导致各个LSTM不能从多个角度提取出输入信息的数据特征,单一的数据特征导致后续识别结果的准确率较低。
发明内容
本发明实施例提供了一种数据处理方法、装置、设备及存储介质,能够提高人工智能模型的处理结果的准确度。
一方面,本申请实施例提供了一种数据处理方法,包括:
获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;
获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。
一方面,本申请实施例提供了一种数据处理装置,该数据处理装置包括:
获取单元,用于获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
处理单元,用于根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;
所述获取单元,还用于获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
所述处理单元,还用于根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。
在一个实施例中,所述处理单元用于,根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,具体用于:
将所述目标激活单元在第t-1个时间步的状态信息和所述第一拼接数据输入所述目标激活单元,得到中间状态数据;
获取所述目标激活单元的第二拼接数据,并根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,所述第二拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的。
在一个实施例中,所述处理单元用于,获取目标激活单元的第一拼接数据,具体用于:
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;
根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。
在一个实施例中,所述处理单元用于,根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据,具体用于:
调整所述K个投影向量中除P个投影向量以外的K-P个投影向量;
调整所述M-1个处理单元中除所述Q个处理单元外的M-1-Q个处理单元在第t-1个时间步的隐藏状态;
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第 t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第一拼接数据。
在一个实施例中,所述处理单元用于,获取所述目标激活单元的第二拼接数据,具体用于:
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第 t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第二拼接数据。
在一个实施例中,所述处理单元用于,根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,具体用于:
对所述目标激活单元在第t-1个时间步的隐藏状态和所述中间状态数据进行拼接,得到第三拼接数据;
采用分类函数对所述第二拼接数据和所述第三拼接数据进行计算,得到所述第三拼接数据对应的权重向量;
根据所述第三拼接数据对应的权重向量对所述第三拼接数据进行加权求和处理,得到所述目标激活单元在第t个时间步的隐藏状态。
在一个实施例中,所述M个处理单元为长短期记忆单元,所述状态信息还包括所述M个处理单元在第t-1个时间步的单元状态;所述中间状态数据包括所述目标激活单元在第t个时间步的单元状态;所述处理单元还用于:
将所述目标激活单元在第t个时间步的单元状态和所述目标激活单元在第t 个时间步的隐藏状态,组合为所述目标激活单元在第t个时间步的状态信息。
在一个实施例中,所述处理单元还用于:
将所述M个处理单元中除所述N个激活单元外的M-N个处理单元在第t-1 个时间步的状态信息,确定为所述M-N个处理单元在第t个时间步的状态信息。
在一个实施例中,所述第t个时间步的输入数据是输入数据序列中的一个输入数据,所述人工智能模型还包括识别单元,所述处理单元还用于:
将所述输入数据序列中的各个输入数据对应的隐藏状态组合为隐藏状态集合;
将所述隐藏状态集合输入所述识别单元,得到所述输入数据序列对应的识别结果。
在一个实施例中,所述处理单元用于,根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,具体用于:
计算每个处理单元在第t-1个时间步的隐藏状态与所述K个投影向量的内积,得到每个处理单元对应的K个内积;
对每个处理单元对应的K个内积进行求和处理,得到每个处理单元对应的相似度。
在一个实施例中,所述处理单元用于,根据各个处理单元的相似度从所述 M个处理单元中筛选出N个激活单元,具体用于:
将所述M个处理单元的相似度按照由大到小的顺序进行排序,并将前N个处理单元确定为激活单元;或者,
将所述M个处理单元中相似度大于激活阈值的N个处理单元确定为激活单元。
一方面,本申请提供了一种数据处理设备,该设备包括:
处理器,用于加载并执行计算机程序;
计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序被处理器执行时,实现上述数据处理方法。
一方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行上述数据处理方法。
一方面,本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述数据处理方法。
本申请实施例中,获取第t个时间步的输入数据对应的K个投影向量,以及M个处理单元在第t-1个时间步的状态信息,根据M个处理单元在第t-1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元,获取目标激活单元的第一拼接数据,并根据第一拼接数据,计算目标激活单元在第t个时间步的隐藏状态。可见,通过相似度对处理单元进行筛选,可以使得各个处理单元处理与自身信息相关程度较高的数据(即使得各个处理单元处理与自身特性相关的数据),进而提高人工智能模型的处理结果的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本申请实施提供的一种循环神经网络的结构示意图;
图1b为本申请实施例提供的一种人工智能模型的结构示意图;
图2为本申请实施例提供的一种数据处理方法的流程示意图;
图3为本申请实施例提供的另一种数据处理方法的流程示意图;
图4a为本申请实施例提供的一种投影向量筛选示意图;
图4b为本申请实施例提供的一种隐藏状态的计算过程示意图;
图4c为本申请实施例提供的一种人工智能模型的应用场景图;
图4d为本申请实施例提供的一种人工智能模型的应用示意图;
图4e为本申请实施例提供的另一种人工智能模型的应用示意图;
图4f为本申请实施例提供的又一种人工智能模型的应用示意图;
图5为本申请实施例提供的一种数据处理装置的结构示意图;
图6为本申请实施例提供的一种数据处理设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本申请实施例涉及区块链(Blockchain),区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。其本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。本申请实施例主要涉及采用人工智能模型对区块链中存储的(序列)数据进行处理,并将处理的结果存储在区块链网络中,从而确保处理结果是可验证、可追溯的。
本申请实施例还涉及人工智能(Artificial Intelligence,AI),AI是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
AI技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大应用程序的处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本申请实施例主要涉及对人工智能模型进行优化,通过相似度对人工智能模型中的处理单元进行筛选,可以使得各个处理单元处理与自身信息相关程度较高的数据(即使得各个处理单元处理与自身特性相关的数据),进而提高人工智能模型的处理结果的准确度。
本申请实施例提供的人工智能模型涉及长短期记忆(Long Short-Term Memory,LSTM):长短期记忆是一种常用的循环神经网络(Recurrent Neural Network,RNN)结构。图1a为本申请实施提供的一种循环神经网络的结构示意图。如图1a所示,a<0>为循环神经网络的初始状态,a<0>包括循环神经网络的单元状态c0和隐藏状态h0;为每一个时间的输入数据;如第一个时间步的数据为x<1>。为最后一个时间步的输出,最后一个时间步的输出包括循环神经网络在第Tx个时间步的隐藏状态具体地,循环神经网络在每个时间步接受该时间步对应的输入,并结合自身当前的单元状态和隐藏状态进行更新;以第t个时间步为例:LSTM在第t个时间步接受输入xt,结合自身当前的单元状态ct-1和隐藏状态ht-1进行更新,得到更新后的单元状态ct和隐藏状态ht。LSTM的更新公式可以表示为下述公式(1):
ht,ct=LSTM(Ht,ct-1;W) (1)
其中,t表示第t个时间步,W为LSTM内所有的参数矩阵。具体的更新公式可以表示为下述公式(2):
其中,Ht是由第t个时间步的输入xt和LSTM在第t-1个时间步的隐藏状态 ht-1拼接得到的;本申请中的拼接是指拼接维度,例如,假设第t个时间步的输入xt的维度为20维,LSTM在第t-1个时间步的隐藏状态ht-1的维度为30维,则xt和ht-1拼接得到的Ht的维度为50维。ft为遗忘门对应的遗忘函数,Wf为遗忘门的参数矩阵;it为输入门对应的输入函数,Wi为输入门的参数矩阵;ot为输出门对应的输出函数,Wo为输出门的参数矩阵;gt为输入门对应的补偿输出函数,Wg为输入门的补偿矩阵。
进一步地,网格长短期记忆(GridLSTM)是一种由多个长短期记忆(LSTM) 网络单元构成的网络结构,在网格长短期记忆中,各个LSTM的隐藏状态和输入拼接在一起构成共享的内容Ht,Ht可以表示为下述公式(3):
其中,N为网格长短期记忆网络结构中LSTM的数量;可见,在网格长短期记忆网络结构中,Ht是由第t个时间步的输入xt和网格长短期记忆网络结构中 N个LSTM在第t-1个时间步的隐藏状态ht-1(即)拼接得到的,也就是说在格长短期记忆网络结构中各个LSTM的隐藏状态是共享的。格长短期记忆网络结构中,第i个LSTM的更新公式可以表示为下述公式(4):
其中,i的取值范围为[1,N];Wi为第i个为LSTM内所有的参数矩阵。
本申请实施例提供的人工智能模型采用循环独立机制,所谓循环独立机制是指人工智能模型中的若干个处理单元(如单元,长短期记忆网络(LSTM,) 单元等)来进行协同合作,各个处理单元互相独立,只在特定的时刻(例如在各个处理单元需要根据当前输入信息更新自身状态信息之前)进行信息交流。在每个时间步中,采用确定性的方法来选取其中一部分处理单元(如选择与输入数据的相似度高于激活阈值的处理单元)进行更新,未被选择的处理单元保持上一时刻的状态(单元状态(cell state)和隐藏状态(hidden state))。通过采用循环独立机制,可以使得各个处理单元分别负责不同的功能(例如处理短视频时,图像处理单元用于处理短视频中的图像,音频处理单元用于处理短视频中的音频,文本处理单元用于处理短视频中的文本),而又共同进行决策,有利于人工智能模型中的信息流通,同时提高人工智能模型对不同的环境的泛化性 (即对不同的输入数据的适应性更强)。
图1b为本申请实施例提供的一种人工智能模型的结构示意图。如图1b所示,数据处理流程主要包括以下步骤:(1)人工智能模型获取第t个时间步的输入数据对应的K个投影向量(即在获取第t个时间步的输入数据后,通过K种线性投影方式对输入数据进行线性投影,得到输入数据对应的K个线性投影向量),以及人工智能模型中M个处理单元(如LSTM单元)在第t-1个时间步的状态信息(包括隐藏状态ht-1),t,K为正整数;(2)根据M个处理单元在第t-1个时间步的隐藏状态ht-1和K个投影向量分别计算各个处理单元的相似度 (计算每个处理单元在第t-1个时间步的隐藏状态ht-1与K个投影向量的内积,并对得到的K个内积进行求和,得到每个处理单元的相似度),并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元(如筛选相似度大于激活阈值的N个激活单元),N为正整数,且N小于等于M;(3)获取目标激活单元的第一拼接数据,第一拼接数据是根据目标激活单元在第t-1个时间步的隐藏状态(即ht-1),对K个投影向量和M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;其中,对K个投影向量进行筛选是指输入选择(计算每个处理单元在第t-1个时间步的隐藏状态ht-1与K个投影向量的内积,并根据得到的K个内积对K个投影向量进行筛选(如筛选相似度大于第一相似度阈值的P个投影向量));对M个处理单元在第t-1个时间步的隐藏状态进行筛选是指计算目标激活单元(第i个激活单元)在第t-1个时间步的隐藏状态与M 个处理单元中除目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的内积,并根据计算结果对M个处理单元中除目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选(如筛选相似度大于第二相似度阈值的Q个处理单元在第t-1个时间步的隐藏状态);(4) 根据第一拼接数据,计算目标激活单元在第t个时间步的隐藏状态(将目标激活单元在第t-1个时间步的状态信息和第一拼接数据输入目标激活单元,得到中间状态数据获取第二拼接数据(根据输入选择和隐藏状态选择的结果生成的),并根据第二拼接数据和中间状态数据(采用软更新机制)计算目标激活单元在第t个时间步的隐藏状态)。
本申请实施例中,获取第t个时间步的输入数据对应的K个投影向量,以及M个处理单元在第t-1个时间步的状态信息,根据M个处理单元在第t-1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元,获取目标激活单元的第一拼接数据,并根据第一拼接数据,计算目标激活单元在第t个时间步的隐藏状态。可见,通过相似度对处理单元进行筛选,可以使得各个处理单元处理与自身信息相关程度较高的数据(即使得各个处理单元处理与自身特性相关的数据),进而提高人工智能模型的处理结果的准确度。
下面结合附图,对本申请实施例提供的数据处理方案进行详细介绍。
请参见图2,图2为本申请实施例提供的一种数据处理方法的流程示意图。该数据处理方案可应用于人工智能模型,该人工智能模型包括M个处理单元, M为正整数该数据处理方案包括步骤S201-S204,其中:
S201、获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息。
第t个时间步的输入数据属于输入数据序列,该输入数据序列包括T个时间步的输入数据,t,T为正整数,且t小于等于T。第t个时间步的输入数据对应的K个投影向量是采用K种不同的线性投影方法,对第t个时间步的输入数据进行线性投影后得到的,K为正整数;即采用K种不同的线性投影方法对第t 个时间步的输入数据xt进行线性投影后,得到其中,各个投影向量的维度与各个处理单元在第t-1个时间步的隐藏状态的维度相同,各个处理单元在第t-1个时间步的隐藏状态的维度相同。M个处理单元在第t-1个时间步的状态信息包括M个处理单元在第t-1个时间步的隐藏状态ht-1。需要说明的是,当t=1时,获取的M个处理单元的状态信息中包括M个处理单元预设的隐藏状态h0。
S202、根据M个处理单元在第t-1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元。
相似度的计算方法可以包括但不限于:余弦相似度(Cosine Similarity)、皮尔森相关系数(Pearson Correlation Coefficient)、Jaccard相似系数(JaccardCoefficient)、 Tanimoto系数。
在一种实施方式中,计算每个处理单元在第t-1个时间步的隐藏状态ht-1与 K个投影向量的内积,得到该处理单元对应的K个内积,并对得到的K个内积进行求和,得到该处理单元的相似度。其中,第j个处理单元在第t-1个时间步的隐藏状态ht-1与第k个投影向量的内积的计算公式可以表示为下述公式(5):
其中,k属于[0,K],j属于[0,M];sk,j为第j个处理单元在第t-1个时间步的隐藏状态ht-1与第k个投影向量的内积。第j个处理单元对应的K个内积可表示为s1,j,s2,j…,sK,j。进一步地,对每个处理单元对应的K个内积进行求和处理,得到每个处理单元对应的相似度,第j个处理单元在第t-1个时间步的相似度的计算公式可以表示为下述公式(6):
其中,k属于[0,K],j属于[0,M];第j个处理单元在第t-1个时间步的相似度是对s1,j,s2,j…,sK,j进行求和得到的。
根据上述公式,分别计算M个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元;N为正整数,且N小于等于M。具体地,将M个处理单元的相似度按照由大到小的顺序进行排序,并将前N个处理单元确定为激活单元;或者,将M个处理单元中相似度大于激活阈值(该激活阈值可以是预设的,也可是根据M个处理单元中任一个处理单元的相似度确定的)的N个处理单元确定为激活单元。
S203、获取目标激活单元的第一拼接数据。
目标激活单元的第一拼接数据是根据目标激活单元在第t-1个时间步的隐藏状态,对K个投影向量和M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;目标激活单元是N个激活单元中的任一个激活单元。具体地,根据目标激活单元在第t-1个时间步的隐藏状态,分别计算K个投影向量对应的相似度,并从K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量, P为正整数,且P小于等于K。在一个实施例中,筛选是指保持K个投影向量中满足第一相似度筛选条件的P个投影向量不变,将K个投影向量中除P个投影向量外的K-P个投影向量设置(调整)为参考向量(如零向量)。
需要说明的是,若在步骤S202中已经计算得到目标激活单元对应的K个内积(即K个投影向量对应的相似度),则直接根据计算结果从K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量。在一种实施方式中,根据K 个投影向量的相似度,按照由大到小的顺序对K个投影向量进行排序,并将前 P个投影向量确定为满足第一相似度筛选条件的投影向量;或者,将K个投影向量中相似度大于第一相似度阈值(该第一相似度阈值可以是预设的,也可是根据K个投影向量中任一个投影向量的相似度确定的)的P个投影向量确定为满足第一相似度筛选条件的投影向量。
类似地,根据目标激活单元在第t-1个时间步的隐藏状态,分别计算M个处理单元中除目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q 小于等于M-1。在一个实施例中,筛选是指保持M-1个处理单元在第t-1个时间步的隐藏状态中满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态不变,将M-1个处理单元在第t-1个时间步的隐藏状态中,除Q个处理单元在第t-1个时间步的隐藏状态外的M-1-Q个处理单元在第t-1个时间步的隐藏状态设置(调整)为参考向量(如零向量)。
在一种实施方式中,根据M-1个处理单元在第t-1个时间步的隐藏状态的相似度,按照由大到小的顺序对M-1个处理单元在第t-1个时间步的隐藏状态进行排序,并将前Q个处理单元在第t-1个时间步的隐藏状态确定为满足第二相似度筛选条件的隐藏状态;或者,将M-1个处理单元在第t-1个时间步的隐藏状态的相似度大于第二相似度阈值(该第二相似度阈值可以是预设的,也可是根据M-1 个M-1个处理单元在第t-1个时间步的隐藏状态中任一个隐藏状态的相似度确定的)的Q个处理单元在第t-1个时间步的隐藏状态确定为满足第二相似度筛选条件的隐藏状态。
在筛选出P个投影向量和Q个处理单元在第t-1个时间步的隐藏状态后,根据P个投影向量,Q个处理单元在第t-1个时间步的隐藏状态和目标激活单元在第t-1个时间步的隐藏状态,生成目标激活单元的第一拼接数据。在一种实施方式中,对P个投影向量,调整后的K-P个投影向量,Q个处理单元在第t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到目标激活单元的第一拼接数据。
S204、根据第一拼接数据,计算目标激活单元在第t个时间步的隐藏状态。
在一种实施方式中,将目标激活单元在第t-1个时间步的状态信息(包括目标激活单元在第t-1个时间步的隐藏状态和目标激活单元在第t-1个时间步的单元状态)和第一拼接数据输入目标激活单元,得到中间状态数据。获取目标激活单元的第二拼接数据,第二拼接数据是根据目标激活单元在第t-1个时间步的隐藏状态,对K个投影向量和M个处理单元中除目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的,具体的筛选方式可参考步骤S203中的筛选方式,在此不再赘述。在一个实施例中,第二拼接数据是对P个投影向量,调整后的K-P个投影向量,Q个处理单元在第t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接 (维度)得到的。可以理解的是,在获取第一拼接数据时,已经得到筛选后的P 个投影向量和Q个处理单元在第t-1个时间步的隐藏状态;此时只需对筛选结果进行拼接,即可得到第二拼接数据,无需进行再次筛选。第一拼接数据和第二拼接数据的区别在于第二拼接数据中不包括目标激活单元在第t-1个时间步的隐藏状态。
在获取第二拼接数据后,根据第二拼接数据和中间状态数据计算目标激活单元在第t个时间步的隐藏状态。在一种实施方式中,对目标激活单元在第t-1 个时间步的隐藏状态和中间状态数据进行(维度)拼接,得到第三拼接数据。采用分类函数(如softmax函数)对第二拼接数据和第三拼接数据进行计算,得到第三拼接数据对应的权重向量,并根据第三拼接数据对应的权重向量对第三拼接数据进行加权求和处理,得到目标激活单元在第t个时间步的隐藏状态。
本申请实施例中,获取第t个时间步的输入数据对应的K个投影向量,以及M个处理单元在第t-1个时间步的状态信息,根据M个处理单元在第t-1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元,获取目标激活单元的第一拼接数据,并根据第一拼接数据,计算目标激活单元在第t个时间步的隐藏状态。可见,通过相似度对处理单元进行筛选,可以使得各个处理单元处理与自身信息相关程度较高的数据(即使得各个处理单元处理与自身特性相关的数据),进而提高人工智能模型的处理结果的准确度。
请参见图3,图3为本申请实施例提供的另一种数据处理方法的流程示意图。该数据处理方案可应用于人工智能模型,该人工智能模型包括M个处理单元, M为正整数该数据处理方案包括步骤S301-S306,其中:
S301、获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息。
S302、根据M个处理单元在第t-1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元。
步骤S301和步骤S302的具体实施方式可参考图2中步骤S201和步骤S202 中的实施方式,在此不再赘述。
S303、获取目标激活单元的第一拼接数据。
在一种实施方式中,根据目标激活单元在第t-1个时间步的隐藏状态,分别计算K个投影向量对应的相似度。在一个实施例中,目标激活单元为第j个处理单元,根据目标激活单元在第t-1个时间步的隐藏状态,计算K个投影向量中第k个投影向量的相似度的计算公式可以表示为下述公式(7):
其中,k属于[0,K],j属于[0,M];sk,j为第j个处理单元在第t-1个时间步的隐藏状态ht-1与第k个投影向量的内积。第j个处理单元对应的K个内积可表示为:s1,j,s2,j…,sK,j。进一步地,在得到K个投影向量对应的相似度后,从K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K。图4a为本申请实施例提供的一种投影向量筛选示意图。如图4a所示,每个激活单元从K个投影向量中,筛选出满足第一相似度筛选条件的P个投影向量,未被筛选出的投影向量是指K个投影向量中除参考向量集合外的K-P个投影向量;被筛选出的投影向量是指满足第一相似度筛选条件的P 个投影向量。
在一种实施方式中,将K个投影向量的相似度按照由大到小的顺序进行排序,并将前P个投影向量添加至参考向量集合中;在得到参考向量集合后,根据参考向量集合调整K个投影向量中除参考向量集合外的K-P个投影向量。具体地,判断第k个投影向量是否属于参考向量集合k为正整数,且k 小于等于K;若第k个投影向量属于参考向量集合则保留第k个投影向量;若第k个投影向量不属于参考向量集合则将第k个投影向量设置为第一向量(如零向量)。以第一向量为零向量为例,从K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量的筛选公式可以表示为下述公式(8):
需要说明的是,若步骤S302在计算处理单元的相似度的过程中已经根据目标激活单元在第t-1个时间步的隐藏状态,计算出K个投影向量对应的相似度;则无需再次计算K个投影向量对应的相似度,直接根据在步骤S302计算得到的 K个投影向量对应的相似度,从K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,具体实施方式可参考上一实施方式,在此不再赘述。
在得到筛选后的K个投影向量后,根据目标激活单元在第t-1个时间步的隐藏状态,分别计算M个处理单元中除目标激活单元外的M-1个处理单元在第t-1 个时间步的隐藏状态的相似度。在一个实施例中,目标激活单元为第j个处理单元,根据目标激活单元在第t-1个时间步的隐藏状态,计算M个处理单元中除目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度的计算公式可以表示为下述公式(9):
其中,i属于[0,M],且i不等于j;j属于[0,M]。ri,j为第j个处理单元(目标激活单元)在第t-1个时间步的隐藏状态与第i个处理单元在第t-1个时间步的隐藏状态的内积。目标激活单元在第t-1个时间步的隐藏状态与M个处理单元中除目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度(内积)可表示为:r1,j,r2,j…,rM-1,j。进一步地,根据r1,j,r2,j…,rM-1,j,从M-1 个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q 个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1。
在一种实施方式中,将M-1个处理单元在第t-1个时间步的隐藏状态的相似度按照由大到小的顺序进行排序,并将前Q个处理单元在第t-1个时间步的隐藏状态添加至参考单元集合中;在得到参考单元集合后,根据参考单元集合,调整M-1个处理单元中除参考单元集合外的M-1-Q个处理单元在第t-1个时间步的隐藏状态。具体地,判断第k个处理单元在第t-1个时间步的隐藏状态是否属于参考单元集合k为正整数,且k小于等于M-1;若第k个处理单元在第t-1个时间步的隐藏状态属于参考单元集合则保留第k个处理单元在第t-1 个时间步的隐藏状态;若第k个处理单元在第t-1个时间步的隐藏状态不属于参考单元集合则将第k个处理单元在第t-1个时间步的隐藏状态设置为第二向量。第二向量与第一向量可以相同,也可以不同,对此本申请不做限制。以第二向量为零向量为例,从M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态的筛选公式可以表示为下述公式(10):
其中,k不等于j,中包括满足第二相似度筛选条件的Q个处理单元在第 t-1个时间步的隐藏状态。根据上述公式对M-1个处理单元在第t-1个时间步的隐藏状态进行筛选,得到筛选后的M-1个处理单元在第t-1个时间步的隐藏状态 (即包括满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态)。
可见,每个处理单元根据自身的特性从当前输入数据的K个线性投影数据中,选择与自身的特性相关(相似度高于阈值)的P个线性投影数据作为实际输入数据,K,P为正整数,且P小于等于Y;使得实际输入每个处理单元的输入数据更加多样化。
下面通过一个例子进行说明,假设输入数据对应线性投影数据1-线性投影数据5,人工智能模型包括处理单元1-处理单元4,传统的人工智能模型将输入数据,或者输入数据对应线性投影数据1-线性投影数据5分别输入处理单元1- 处理单元4(即各个处理单元的输入相同),本申请提供的人工智能模型根据每个处理单元的特性(线性投影数据与处理单元的相似度)确定各个处理单元对应的实际输入数据,例如,处理单元1的实际输入数据为线性投影数据2和线性投影数据5;处理单元2的实际输入数据为线性投影数据1和线性投影数据2;处理单元3的实际输入数据为线性投影数据3和线性投影数据5;处理单元4的实际输入数据为线性投影数据2,线性投影数据4和线性投影数据5。
对P个投影向量,调整后的K-P个投影向量,Q个处理单元在第t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到目标激活单元的第一拼接数据。第一拼接数据可以表示为下述公式(11):
S304、将目标激活单元在第t-1个时间步的状态信息和第一拼接数据输入目标激活单元,得到中间状态数据。
在一种实施方式中,目标激活单元是第j个处理单元,通过目标激活单元对目标激活单元在第t-1个时间步的状态信息和第一拼接数据进行处理,得到中间状态数据的过程可以表示为下述公式(12):
S305、获取目标激活单元的第二拼接数据,并根据第二拼接数据和中间状态数据计算目标激活单元在第t个时间步的隐藏状态。
在一种实施方式中,目标激活单元是第j个处理单元,第二拼接数据是对P 个投影向量,调整后的K-P个投影向量,Q个处理单元在第t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接得到的。第二拼接数据可以表示为下述公式(13):
采用分类函数对第二拼接数据和第三拼接数据进行计算,得到第三拼接数据对应的权重向量;并根据该第三拼接数据对应的权重向量对第三拼接数据进行加权求和处理,得到目标激活单元在第t个时间步的隐藏状态。在一个实施例中,目标激活单元是第j个处理单元,目标激活单元在第t个时间步的隐藏状态的计算公式为下述公式(15):
其中,softmax为分类函数,Wq为对第二拼接数据的映射矩阵。图4b为本申请实施例提供的一种隐藏状态的计算过程示意图。如图4b所示,通过计算可以得到第三拼接数据的权重向量,该权重向量中包括与目标激活单元在第t-1个时间步的隐藏状态对应的第一权重向量,以及与中间状态数据对应的第二权重向量;采用第一权重向量对进行加权,采用第二权重向量对进行加权;并对加权结果进行求和,得到目标激活单元在第t 个时间步的隐藏状态
S306、将目标激活单元在第t个时间步的单元状态和目标激活单元在第t 个时间步的隐藏状态,组合为目标激活单元在第t个时间步的状态信息。
在一种实施方式中,在得到目标激活单元在第t个时间步的隐藏状态后,将目标激活单元在第t个时间步的隐藏状态与步骤S304中计算得到的目标激活单元在第t个时间步的单元状态组合为目标激活单元在第t个时间步的状态信息。
进一步地,将M个处理单元中除N个激活单元外的M-N个处理单元在第 t-1个时间步的状态信息,确定为M-N个处理单元在第t个时间步的状态信息(即未被激活的M-N个处理单元在第t个时间步的状态信息与在第t-1个时间步的状态信息相同(保持不变))。
本申请提供的人工智能模型用于处理序列问题,人工智能模型还包括识别单元。图4c为本申请实施例提供的一种人工智能模型的应用场景图。如图4c 所示,人工智能模型的应用场景中包括了终端设备401和服务器402。其中,终端设备401为用户所使用的设备,终端设备401可以包括但不限于:智能手机 (如Android手机、iOS手机等)、平板电脑、便携式个人计算机、移动互联网设备(Mobile Internet Devices,MID)等设备;终端设备往往配置有显示装置,显示装置也可为显示器、显示屏、触摸屏等等,触摸屏也可为触控屏、触控面板等等,本发明实施例不做限定。
服务器102是指能够为终端设备401提供数据处理服务(即对终端设备401 发送的输入序列进行处理,并返回预测结果)的后台设备。服务器402可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。此外,还可以将多个服务器组成为一个区块链网络,每个服务器为区块链网络中的一个节点。终端和服务器之间可以通过有线通信或者无线通信方式进行直接或间接地连接,本申请在此不做限制。
需要说明的是,图4c所示的人工智能模型的应用场景中终端设备和服务器的数量仅为举例,例如,终端设备和服务器的数量可以为多个,本申请并不对终端设备和服务器的数量进行限定。
可选的,人工智能模型的应用场景中也可以只包括搭载有人工智能模型的终端设备401,终端设备401在获取用户输入的输入序列后,通过搭载的人工智能模型对输入序列进行处理,并将输入序列对应的预测结果返回给用户(如通过显示屏显示结果)。
在一个实施例中,第t个时间步的输入数据是输入数据序列中的一个输入数据。服务器通过人工智能模型依次对终端设备发送的输入数据序列进行处理,得到各个输入数据对应的隐藏状态,将输入数据序列中的各个输入数据对应的隐藏状态组合为隐藏状态集合;并将隐藏状态集合输入识别单元,得到输入数据序列对应的识别结果。图4d为本申请实施例提供的一种人工智能模型的应用示意图。如图4d所示,在对视频进行分类打标签的场景中,输入数据序列为终端设备上传的一个短视频,设该短视频是由X帧图像组成的,X为正整数,服务器在接收终端设备上传的短视频后,对短视频进行预处理(如按照X帧图像的播放顺序,将第i帧图像作为第i个时间步的输入数据,i为正整数,且i小于等于X)。服务器将预处理后的短视频输入人工智能模型,具体的处理流程为:人工智能模型采用图2或图3实施例中的数据处理方法,将自身状态c0,隐藏状态h0和第1个时间步的输入数据(即短视频的第一帧图像(对应的特征向量)) 输入人工智能模型,人工智能模型基于自身状态c0,隐藏状态h0(人工智能模型自身状态c0和隐藏状态h0可以是根据需求预设的)和第1个时间步的输入数据,将自身隐藏状态更新为c1,并输出隐藏状态h1(即第1个时间步的处理结果),具体计算方式可参考图1a中的公式(2),在此不再赘述;接着,将自身状态c1,隐藏状态h1和第2个时间步的输入数据(即短视频的第二帧图像(对应的特征向量))输入人工智能模型,人工智能模型基于当前自身状态c1,隐藏状态h1和第2个时间步的输入数据,将自身隐藏状态更新为c2,并输出隐藏状态h2;按照上述方式进行迭代,可以得到短视频对应的X个隐藏状态,即h1,h2,…,hX。每个隐藏状态携带有对应的图像帧的特征,例如,h1携带有第1帧图像帧的特征。将h1,h2,…,hX组合为短视频的隐藏状态集合,并将隐藏状态集合输入识别单元(识别单元可以是全连接层+softmax函数),得到短视频对应的识别结果;例如,短视频A包括100帧图像,其中95帧图像的隐藏状态对应的识别结果为小狗,则短视频A对应的识别结果为“小狗短视频”。或者人工智能模型将所有的隐藏状态叠加,得到目标隐藏状态,识别单元识别目标隐藏状态所得到的分类结果即是整个短视频的分类结果,服务器在获取预测结果(如分类结果) 后,可以根据预测结果对短视频进行分类整理,并将短视频处理结果返回给终端设备。
在模型训练过程中,采用初始模型对训练数据进行处理得到隐藏状态集合,具体实施方式可参考图2或图3实施例中的数据处理方法,在此不再赘述。并通过识别单元对隐藏状态集合进行预测,得到预测结果,并将预测结果与训练数据的实际结果进行比较(如通过损失函数计算预测结果与实际结果的差异),根据比较的结果对初始化模型中的参数(如自身状态c0和隐藏状态h0)进行调整,使得优化后的人工智能模型对训练数据进行预测得到的预测结果与实际结果的差异最小。正是由于训练过程中,使得预测结果和实际结果之间的差异量最小,使得人工智能模型在多个时间步提取出来的隐藏状态可以丰富且准确地反映视频的隐藏特征,进而可以准确识别出视频内容的类别。
在另一种实施方式中,第t个时间步的输入数据是输入数据序列中的一个输入数据。服务器通过人工智能模型依次对终端设备发送的输入数据序列进行处理,得到各个输入数据对应的隐藏状态。人工智能模型将输入数据序列中最后一个时间步的隐藏状态输入识别单元,得到输入数据序列对应的识别结果。图 4e为本申请实施例提供的另一种人工智能模型的应用示意图。如图4e所示,在对文本进行情感分析的场景中,输入数据序列是一则新闻标题“热烈庆祝XXX 完成”,服务器在获取新闻标题后,对该新闻标题进行预处理(如将该新闻标题划分为Y个词组,Y为正整数),按照Y个词组在新闻标题中的排列顺序,将处理后的新闻标题输入人工智能模型(即将第j词组作为第j个时间步的输入数据, j为正整数,且j小于等于Y)。具体的处理流程为:人工智能模型采用图2或图3实施例中的数据处理方法,将自身状态c0,隐藏状态h0和第1个时间步的输入数据(即新闻标题的第一个词组(对应的特征向量))输入人工智能模型,人工智能模型基于自身状态c0,隐藏状态h0(人工智能模型自身状态c0和隐藏状态h0可以是根据需求预设的)和第1个时间步的输入数据,将自身隐藏状态更新为c1,并输出隐藏状态h1(即第1个时间步的处理结果),具体计算方式可参考图1a 中的公式(2),在此不再赘述;接着,将自身状态c1,隐藏状态h1和第2个时间步的输入数据(即新闻标题的第二个词组(对应的特征向量))输入人工智能模型,人工智能模型基于当前自身状态c1,隐藏状态h1和第2个时间步的输入数据,将自身隐藏状态更新为c2,并输出隐藏状态h2;按照上述方式进行迭代,可以得到新闻标题对应的Y个隐藏状态,即h1,h2,…,hY,其中,hY是根据h1,h2,…, hY-1得到的,可以理解为hY中携带了整个新闻标题的上下文特征。人工智能模型将隐藏状态hY输入识别单元,得到新闻标题对应的识别结果(如根据hY判断该新闻为正面新闻,或者负面新闻),服务器在获取预测结果(如分类结果)后,可以根据预测结果对新闻进行筛选(如过滤负面新闻),并将相应地处理结果返回给终端设备。
在再一种实施方式中,第t个时间步的输入数据是输入数据序列中的一个输 入数据。通过编解码结构的人工智能模型对应输入数序列进行编码处理,得到 输入数据对应的多个隐藏状态,对隐藏状态进行转换(此处的转换可以是直接 将最后一个隐藏状态作为状态向量a,也可以是将前述所有的隐藏状态h1,h2,…, hY进行叠加,得到状态向量a),得到转换后的状态向量a,并对转换后的状态 向量a进行解码处理,即可得到转换后的预测结果。图4f为本申请实施例提供 的又一种人工智能模型的应用示意图。如图4f所示,在对文本进行转换(如翻 译)的场景中,输入数据是一句待翻译的句子“How are you”,服务器在获取待 翻译的句子后,对该待翻译的句子进行预处理(如将该句子被划分为3个单词, 对3个单词转换为词向量),将预处理后的句子输入编解码结构的人工智能模型, 编解码结构的人工智能模型采用本申请的方案对这3个词向量循环编码,即可 得到3个单词对应的隐藏状态h1,h2和h3;然后对隐藏状态h1,h2和h3进行转 换,得到转换后的状态向量a,对状态向量a进行解码处理,解码处理和编码处 理的过程相同,也可以采用本申请的方案,依次确定多个时间步的隐藏状态h1′, h2′和h3′,最后分别对隐藏状态h1′,h2′和h3′进行全连接和归一化,即可以得到 预测结果(例如,待翻译句子“How are you”对应的预测结果为“你好吗”),服务器在获取预测结果后,将待翻译句子的翻译结果返回给终端设备。可以知 道,本实施例的输入是一个序列,输出也是一个序列,即本申请可以具体应用 到seq2seq场景上。
在又一种实施方式中,人工智能模型还可以搭载在区块链网络中的目标节点中,目标节点在通过人工智能模型对存储在区块链中的数据(输入序列)进行处理(处理过程可参见上述实施例,在此不再赘述)后,可将该输入序列对应的预测结果进行上链处理。可以理解的是,通过在区块链网络中进行数据处理(即通过人工智能模型对存储在区块链中的数据进行处理),并将处理的结果存储在区块链中,确保了整个数据处理流程是可以进行追溯、验证的,进而提高了数据处理结果的可信性。
本申请实施例中,通过对K个投影向量和各个处理单元的隐藏状态进行筛选,使得每个处理单元选取与自身相关性高(相似度高)的信息进行处理,从而使得不同功能的处理单元处理不同类型的信息,相比起同样容量的序列模型,对各种任务达到的精度更高。
上述详细阐述了本申请实施例的方法,为了便于更好地实施本申请实施例的上述方案,相应地,下面提供了本申请实施例的装置。
请参见图5,图5为本申请实施例提供的一种数据处理装置的结构示意图,数据处理装置500包括获取单元501和处理单元502,该装置可以搭载在智能设备上,智能设备可以包括终端设备、服务器。图5所示的数据处理装置可以用于执行上述图2和图3所描述的方法实施例中的部分或全部功能。其中,各个单元的详细描述如下:
获取单元501,用于获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
处理单元502,用于根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于 M;
所述获取单元501,还用于获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
所述处理单元502,还用于根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。
在一个实施例中,所述处理单元502用于,根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,具体用于:
将所述目标激活单元在第t-1个时间步的状态信息和所述第一拼接数据输入所述目标激活单元,得到中间状态数据;
获取所述目标激活单元的第二拼接数据,并根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,所述第二拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的。
在一个实施例中,所述处理单元502用于,获取目标激活单元的第一拼接数据,具体用于:
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;
根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。
在一个实施例中,所述处理单元502用于,根据所述P个投影向量,所述Q 个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据,具体用于:
调整所述K个投影向量中除P个投影向量以外的K-P个投影向量;
调整所述M-1个处理单元中除所述Q个处理单元外的M-1-Q个处理单元在第t-1个时间步的隐藏状态;
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第 t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第一拼接数据。
在一个实施例中,所述处理单元502用于,获取所述目标激活单元的第二拼接数据,具体用于:
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第 t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第二拼接数据。
在一个实施例中,所述处理单元502用于,根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,具体用于:
对所述目标激活单元在第t-1个时间步的隐藏状态和所述中间状态数据进行拼接,得到第三拼接数据;
采用分类函数对所述第二拼接数据和所述第三拼接数据进行计算,得到所述第三拼接数据对应的权重向量;
根据所述第三拼接数据对应的权重向量对所述第三拼接数据进行加权求和处理,得到所述目标激活单元在第t个时间步的隐藏状态。
在一个实施例中,所述M个处理单元为长短期记忆单元,所述状态信息还包括所述M个处理单元在第t-1个时间步的单元状态;所述中间状态数据包括所述目标激活单元在第t个时间步的单元状态;所述处理单元502还用于:
将所述目标激活单元在第t个时间步的单元状态和所述目标激活单元在第t 个时间步的隐藏状态,组合为所述目标激活单元在第t个时间步的状态信息。
在一个实施例中,所述处理单元502还用于:
将所述M个处理单元中除所述N个激活单元外的M-N个处理单元在第t-1 个时间步的状态信息,确定为所述M-N个处理单元在第t个时间步的状态信息。
在一个实施例中,所述第t个时间步的输入数据是输入数据序列中的一个输入数据,所述人工智能模型还包括识别单元,所述处理单元502还用于:
将所述输入数据序列中的各个输入数据对应的隐藏状态组合为隐藏状态集合;
将所述隐藏状态集合输入所述识别单元,得到所述输入数据序列对应的识别结果。
在一个实施例中,所述处理单元502用于,根据所述M个处理单元在第t-1 个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,具体用于:
计算每个处理单元在第t-1个时间步的隐藏状态与所述K个投影向量的内积,得到每个处理单元对应的K个内积;
对每个处理单元对应的K个内积进行求和处理,得到每个处理单元对应的相似度。
在一个实施例中,所述处理单元502用于,根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,具体用于:
将所述M个处理单元的相似度按照由大到小的顺序进行排序,并将前N个处理单元确定为激活单元;或者,
将所述M个处理单元中相似度大于激活阈值的N个处理单元确定为激活单元。
根据本申请的一个实施例,图2和图3所示的数据处理方法所涉及的部分步骤可由图5所示的数据处理装置中的各个单元来执行。例如,图2中所示的步骤S201和步骤S203可由图5所示的获取单元501执行,步骤S202和步骤 S204可由图5所示的处理单元502执行。图3中所示的步骤S301和步骤S303 可由图5所示的获取单元501执行,步骤S302和步骤S304-步骤S306可由图5 所示的处理单元502执行。图5所示的数据处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,数据处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的另一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算装置上运行能够执行如图2和图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图5中所示的数据处理装置,以及来实现本申请实施例的数据处理方法。所述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算装置中,并在其中运行。
基于同一发明构思,本申请实施例中提供的数据处理装置解决问题的原理与有益效果与本申请方法实施例中数据处理装置解决问题的原理和有益效果相似,可以参见方法的实施的原理和有益效果,为简洁描述,在这里不再赘述。
请参阅图6,图6为本申请实施例提供的一种数据处理设备的结构示意图,所述数据处理设备600至少包括处理器601、通信接口602和存储器603。其中,处理器601、通信接口602和存储器603可通过总线或其他方式连接。其中,处理器601(或称中央处理器(CentralProcessing Unit,CPU))是终端的计算核心以及控制核心,其可以解析终端内的各类指令以及处理终端的各类数据,例如: CPU可以用于解析用户向终端所发送的开关机指令,并控制终端进行开关机操作;再如:CPU可以在终端内部结构之间传输各类交互数据,等等。通信接口 602可选的可以包括标准的有线接口、无线接口(如WI-FI、移动通信接口等),受处理器601的控制可以用于收发数据;通信接口602还可以用于终端内部数据的传输以及交互。存储器603(Memory)是终端中的记忆设备,用于存放程序和数据。可以理解的是,此处的存储器603既可以包括终端的内置存储器,当然也可以包括终端所支持的扩展存储器。存储器603提供存储空间,该存储空间存储了终端的操作系统,可包括但不限于:Android系统、iOS系统、Windows Phone系统等等,本申请对此并不作限定。
在本申请实施例中,处理器601通过运行存储器603中的可执行程序代码,用于执行如下操作:
通过通信接口602获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;
获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。
作为一种可选的实施例,处理器601根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态的具体实施例为:
将所述目标激活单元在第t-1个时间步的状态信息和所述第一拼接数据输入所述目标激活单元,得到中间状态数据;
获取所述目标激活单元的第二拼接数据,并根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,所述第二拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的。
作为一种可选的实施例,处理器601获取目标激活单元的第一拼接数据的具体实施例为:
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;
根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。
作为一种可选的实施例,处理器601根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据的具体实施例为:
调整所述K个投影向量中除P个投影向量以外的K-P个投影向量;
调整所述M-1个处理单元中除所述Q个处理单元外的M-1-Q个处理单元在第t-1个时间步的隐藏状态;
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第 t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第一拼接数据。
作为一种可选的实施例,处理器601获取所述目标激活单元的第二拼接数据的具体实施例为:
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第 t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第二拼接数据。
作为一种可选的实施例,处理器601根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态的具体实施例为:
对所述目标激活单元在第t-1个时间步的隐藏状态和所述中间状态数据进行拼接,得到第三拼接数据;
采用分类函数对所述第二拼接数据和所述第三拼接数据进行计算,得到所述第三拼接数据对应的权重向量;
根据所述第三拼接数据对应的权重向量对所述第三拼接数据进行加权求和处理,得到所述目标激活单元在第t个时间步的隐藏状态。
作为一种可选的实施例,所述M个处理单元为长短期记忆单元,所述状态信息还包括所述M个处理单元在第t-1个时间步的单元状态;所述中间状态数据包括所述目标激活单元在第t个时间步的单元状态;处理器601还执行如下操作:
将所述目标激活单元在第t个时间步的单元状态和所述目标激活单元在第t 个时间步的隐藏状态,组合为所述目标激活单元在第t个时间步的状态信息。
作为一种可选的实施例,处理器601还执行如下操作:
将所述M个处理单元中除所述N个激活单元外的M-N个处理单元在第t-1 个时间步的状态信息,确定为所述M-N个处理单元在第t个时间步的状态信息。
作为一种可选的实施例,所述第t个时间步的输入数据是输入数据序列中的一个输入数据,所述人工智能模型还包括识别单元;处理器601还执行如下操作:
将所述输入数据序列中的各个输入数据对应的隐藏状态组合为隐藏状态集合;
将所述隐藏状态集合输入所述识别单元,得到所述输入数据序列对应的识别结果。
作为一种可选的实施例,处理器601根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度的具体实施例为:
计算每个处理单元在第t-1个时间步的隐藏状态与所述K个投影向量的内积,得到每个处理单元对应的K个内积;
对每个处理单元对应的K个内积进行求和处理,得到每个处理单元对应的相似度。
作为一种可选的实施例,处理器601根据各个处理单元的相似度从所述M 个处理单元中筛选出N个激活单元的具体实施例为:
将所述M个处理单元的相似度按照由大到小的顺序进行排序,并将前N个处理单元确定为激活单元;或者,
将所述M个处理单元中相似度大于激活阈值的N个处理单元确定为激活单元。
基于同一发明构思,本申请实施例中提供的数据处理设备解决问题的原理与有益效果与本申请方法实施例中数据处理方法解决问题的原理和有益效果相似,可以参见方法的实施的原理和有益效果,为简洁描述,在这里不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行上述方法实施例所述的数据处理方法。
本申请实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法实施例所述的数据处理方法。
本申请实施例还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述数据处理的方法。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,可读存储介质可以包括:闪存盘、只读存储器(Read-Only Memory, ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (13)
1.一种数据处理方法,其特征在于,所述方法包括:
获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;
获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,
其中,所述获取目标激活单元的第一拼接数据,包括:
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;
根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,包括:
将所述目标激活单元在第t-1个时间步的状态信息和所述第一拼接数据输入所述目标激活单元,得到中间状态数据;
获取所述目标激活单元的第二拼接数据,并根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,所述第二拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的。
3.如权利要求1所述的方法,其特征在于,所述根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据,包括:
调整所述K个投影向量中除P个投影向量以外的K-P个投影向量;
调整所述M-1个处理单元中除所述Q个处理单元外的M-1-Q个处理单元在第t-1个时间步的隐藏状态;
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第一拼接数据。
4.如权利要求2所述的方法,其特征在于,所述获取所述目标激活单元的第二拼接数据,包括:
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第二拼接数据。
5.如权利要求2所述的方法,其特征在于,所述根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,包括:
对所述目标激活单元在第t-1个时间步的隐藏状态和所述中间状态数据进行拼接,得到第三拼接数据;
采用分类函数对所述第二拼接数据和所述第三拼接数据进行计算,得到所述第三拼接数据对应的权重向量;
根据所述第三拼接数据对应的权重向量对所述第三拼接数据进行加权求和处理,得到所述目标激活单元在第t个时间步的隐藏状态。
6.如权利要求2所述的方法,其特征在于,所述M个处理单元为长短期记忆单元,所述状态信息还包括所述M个处理单元在第t-1个时间步的单元状态;所述中间状态数据包括所述目标激活单元在第t个时间步的单元状态;所述方法还包括:
将所述目标激活单元在第t个时间步的单元状态和所述目标激活单元在第t个时间步的隐藏状态,组合为所述目标激活单元在第t个时间步的状态信息。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
将所述M个处理单元中除所述N个激活单元外的M-N个处理单元在第t-1个时间步的状态信息,确定为所述M-N个处理单元在第t个时间步的状态信息。
8.如权利要求2所述的方法,其特征在于,所述第t个时间步的输入数据是输入数据序列中的一个输入数据,所述人工智能模型还包括识别单元,所述方法还包括:
将所述输入数据序列中的各个输入数据对应的隐藏状态组合为隐藏状态集合;
将所述隐藏状态集合输入所述识别单元,得到所述输入数据序列对应的识别结果。
9.如权利要求1所述的方法,其特征在于,所述根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,包括:
计算每个处理单元在第t-1个时间步的隐藏状态与所述K个投影向量的内积,得到每个处理单元对应的K个内积;
对每个处理单元对应的K个内积进行求和处理,得到每个处理单元对应的相似度。
10.如权利要求1所述的方法,其特征在于,所述根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,包括:
将所述M个处理单元的相似度按照由大到小的顺序进行排序,并将前N个处理单元确定为激活单元;或者,
将所述M个处理单元中相似度大于激活阈值的N个处理单元确定为激活单元。
11.一种数据处理装置,其特征在于,所述数据处理装置包括:
获取单元,用于获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
处理单元,用于根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;
所述获取单元,还用于获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
所述处理单元,还用于根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,
其中,所述获取目标激活单元的第一拼接数据,包括:
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;
根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。
12.一种数据处理设备,其特征在于,包括:存储装置和处理器;
所述存储装置中存储有计算机程序;
处理器,用于加载并执行所述计算机程序,以实现如权利要求1-10任一项所述的数据处理方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于被处理器加载并执行如权利要求1-10任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110182052.5A CN113011555B (zh) | 2021-02-09 | 2021-02-09 | 一种数据处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110182052.5A CN113011555B (zh) | 2021-02-09 | 2021-02-09 | 一种数据处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113011555A CN113011555A (zh) | 2021-06-22 |
CN113011555B true CN113011555B (zh) | 2023-01-31 |
Family
ID=76402072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110182052.5A Active CN113011555B (zh) | 2021-02-09 | 2021-02-09 | 一种数据处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011555B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107293288A (zh) * | 2017-06-09 | 2017-10-24 | 清华大学 | 一种残差长短期记忆循环神经网络的声学模型建模方法 |
CN110188348A (zh) * | 2019-05-07 | 2019-08-30 | 南京邮电大学 | 一种基于深度神经网络的中文语言处理模型及方法 |
CN110546653A (zh) * | 2017-02-24 | 2019-12-06 | 渊慧科技有限公司 | 使用神经网络的用于强化学习的动作选择 |
CN110825877A (zh) * | 2019-11-12 | 2020-02-21 | 中国石油大学(华东) | 一种基于文本聚类的语义相似度分析方法 |
CN111027595A (zh) * | 2019-11-19 | 2020-04-17 | 电子科技大学 | 双阶段语义词向量生成方法 |
CN111368996A (zh) * | 2019-02-14 | 2020-07-03 | 谷歌有限责任公司 | 可传递自然语言表示的重新训练投影网络 |
CN111587441A (zh) * | 2018-02-09 | 2020-08-25 | 渊慧科技有限公司 | 使用以比特值为条件的回归神经网络生成输出示例 |
CN112036546A (zh) * | 2020-08-24 | 2020-12-04 | 上海交通大学 | 序列处理方法及相关设备 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10783900B2 (en) * | 2014-10-03 | 2020-09-22 | Google Llc | Convolutional, long short-term memory, fully connected deep neural networks |
US10810494B2 (en) * | 2016-08-08 | 2020-10-20 | EyeEm Mobile GmbH | Systems, methods, and computer program products for extending, augmenting and enhancing searching and sorting capabilities by learning and adding concepts on the fly |
US10366292B2 (en) * | 2016-11-03 | 2019-07-30 | Nec Corporation | Translating video to language using adaptive spatiotemporal convolution feature representation with dynamic abstraction |
CN109460812B (zh) * | 2017-09-06 | 2021-09-14 | 富士通株式会社 | 神经网络的中间信息分析装置、优化装置、特征可视化装置 |
US11468262B2 (en) * | 2017-10-30 | 2022-10-11 | Nec Corporation | Deep network embedding with adversarial regularization |
CN110598779B (zh) * | 2017-11-30 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 摘要描述生成方法、装置、计算机设备和存储介质 |
US10853725B2 (en) * | 2018-05-18 | 2020-12-01 | Deepmind Technologies Limited | Neural networks with relational memory |
EP3788549B1 (en) * | 2018-09-27 | 2023-09-06 | DeepMind Technologies Limited | Stacked convolutional long short-term memory for model-free reinforcement learning |
CN110298361B (zh) * | 2019-05-22 | 2021-05-04 | 杭州未名信科科技有限公司 | 一种rgb-d图像的语义分割方法和系统 |
CN111339845B (zh) * | 2020-02-13 | 2022-06-10 | 福州大学 | 区分并增强时空特征的图卷积神经网络人体动作识别方法 |
CN111437608B (zh) * | 2020-03-24 | 2023-09-08 | 腾讯科技(深圳)有限公司 | 基于人工智能的游戏对局方法、装置、设备及存储介质 |
CN111539495B (zh) * | 2020-07-10 | 2020-11-10 | 北京海天瑞声科技股份有限公司 | 基于识别模型的识别方法、模型训练方法及装置 |
CN112052990B (zh) * | 2020-08-21 | 2021-05-04 | 杭州电子科技大学 | 一种基于CNN-BiLSTM混合模型的多角度业务流程下一活动预测方法 |
-
2021
- 2021-02-09 CN CN202110182052.5A patent/CN113011555B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110546653A (zh) * | 2017-02-24 | 2019-12-06 | 渊慧科技有限公司 | 使用神经网络的用于强化学习的动作选择 |
CN107293288A (zh) * | 2017-06-09 | 2017-10-24 | 清华大学 | 一种残差长短期记忆循环神经网络的声学模型建模方法 |
CN111587441A (zh) * | 2018-02-09 | 2020-08-25 | 渊慧科技有限公司 | 使用以比特值为条件的回归神经网络生成输出示例 |
CN111368996A (zh) * | 2019-02-14 | 2020-07-03 | 谷歌有限责任公司 | 可传递自然语言表示的重新训练投影网络 |
CN110188348A (zh) * | 2019-05-07 | 2019-08-30 | 南京邮电大学 | 一种基于深度神经网络的中文语言处理模型及方法 |
CN110825877A (zh) * | 2019-11-12 | 2020-02-21 | 中国石油大学(华东) | 一种基于文本聚类的语义相似度分析方法 |
CN111027595A (zh) * | 2019-11-19 | 2020-04-17 | 电子科技大学 | 双阶段语义词向量生成方法 |
CN112036546A (zh) * | 2020-08-24 | 2020-12-04 | 上海交通大学 | 序列处理方法及相关设备 |
Non-Patent Citations (1)
Title |
---|
一种针对机器阅读理解中答案获取的序列生成模型;霍欢 等;《计算机应用研究》;20200331;第37卷(第3期);第734页-第738页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113011555A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9990558B2 (en) | Generating image features based on robust feature-learning | |
US10127495B1 (en) | Reducing the size of a neural network through reduction of the weight matrices | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN111382555B (zh) | 数据处理方法、介质、装置和计算设备 | |
EP3885966B1 (en) | Method and device for generating natural language description information | |
CN112214604A (zh) | 文本分类模型的训练方法、文本分类方法、装置及设备 | |
CN116415654A (zh) | 一种数据处理方法及相关设备 | |
CN112259247B (zh) | 对抗网络训练、医疗数据补充方法、装置、设备及介质 | |
CN111428771B (zh) | 视频场景分类方法、装置和计算机可读存储介质 | |
CN113656563B (zh) | 一种神经网络搜索方法及相关设备 | |
CN113128478B (zh) | 模型训练方法、行人分析方法、装置、设备及存储介质 | |
CN114693624B (zh) | 一种图像检测方法、装置、设备及可读存储介质 | |
CN112463956B (zh) | 基于对抗学习和分层神经网络的文本摘要生成系统和方法 | |
CN112560456A (zh) | 一种基于改进神经网络的生成式摘要生成方法和系统 | |
WO2022246986A1 (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN117273074A (zh) | 一种数据处理方法及其装置 | |
CN114090401B (zh) | 处理用户行为序列的方法及装置 | |
CN113283388B (zh) | 活体人脸检测模型的训练方法、装置、设备及存储介质 | |
CN113850012B (zh) | 数据处理模型生成方法、装置、介质及电子设备 | |
CN110955765A (zh) | 智能助理的语料构建方法、装置、计算机设备和存储介质 | |
CN116758379B (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN117708698A (zh) | 一种类别确定方法、装置、设备及存储介质 | |
CN115292439A (zh) | 一种数据处理方法及相关设备 | |
CN111445545B (zh) | 一种文本转贴图方法、装置、存储介质及电子设备 | |
CN117473951A (zh) | 文本处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40047305 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |