CN111177493A - 数据处理方法、装置、服务器和存储介质 - Google Patents

数据处理方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN111177493A
CN111177493A CN202010003904.5A CN202010003904A CN111177493A CN 111177493 A CN111177493 A CN 111177493A CN 202010003904 A CN202010003904 A CN 202010003904A CN 111177493 A CN111177493 A CN 111177493A
Authority
CN
China
Prior art keywords
data
data segment
vector
vector corresponding
hidden
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010003904.5A
Other languages
English (en)
Other versions
CN111177493B (zh
Inventor
程哲豪
董井然
陈守志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010003904.5A priority Critical patent/CN111177493B/zh
Publication of CN111177493A publication Critical patent/CN111177493A/zh
Application granted granted Critical
Publication of CN111177493B publication Critical patent/CN111177493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种数据处理方法、装置、服务器和存储介质;本发明实施例可以获取数据序列,数据序列包括多个数据片段;基于数据片段的前一数据片段,预测数据片段对应的正向向量;基于数据片段的后一数据片段,预测数据片段对应的反向向量;对正向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量;对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果;基于局部数据分析结果确定数据序列的全局数据处理结果。在本发明实施例中,分别根据前一个数据片段和后一个数据片段对目标数据片段进行局部分析,综合这些分析局部的结果可以得到最终的全局数据处理结果。由此,本方案可以提升数据处理方法的准确度。

Description

数据处理方法、装置、服务器和存储介质
技术领域
本发明涉及计算机领域,具体涉及一种数据处理方法、装置、服务器和存储介质。
背景技术
数据序列是按照某种参数标准排序的数据序列,数据序列可以反映某一事物、现象等随该参数变换而产生的变化状态或程度,该参数标准可以为时间、编号、地址,等等;总之,数据序列中的某一数据片段总与其前一个数据片段息息相关,例如,数据序列可以是用户阅读的文章列表、用户的网址浏览记录、由不同句子构成的文章、由多个旋律构成的流行歌曲、气温变换图、视频数据等等。
为了找出数据序列的统计特性和发展规律,目前,可以通过多种数据处理的方式来对数据序列进行分析、预测等,然而,目前针对数据序列的数据处理方法效果不佳,数据处理的结果往往不够准确。
发明内容
本发明实施例提供一种数据处理方法、装置、服务器和存储介质,可以提升数据处理方法的准确度。
本发明实施例提供一种数据处理方法,包括:
获取数据序列,所述数据序列包括多个数据片段;
基于所述数据片段的前一数据片段,预测所述数据片段对应的正向向量;
基于所述数据片段的后一数据片段,预测所述数据片段对应的反向向量;
对所述正向向量和反向向量进行向量合并处理,得到所述数据片段对应的局部拼接向量;
对所述局部拼接向量进行向量分析处理,得到所述数据片段的局部数据分析结果;
基于所述局部数据分析结果确定所述数据序列的全局数据处理结果。
本发明实施例还提供一种数据处理装置,包括:
获取单元,用于获取数据序列,所述数据序列包括多个数据片段;
正向单元,用于基于所述数据片段的前一数据片段,预测所述数据片段对应的正向向量;
反向单元,用于基于所述数据片段的后一数据片段,预测所述数据片段对应的反向向量;
拼接单元,用于对所述正向向量和反向向量进行向量合并处理,得到所述数据片段对应的局部拼接向量;
局部单元,用于对所述局部拼接向量进行向量分析处理,得到所述数据片段的局部数据分析结果;
全局单元,用于基于所述局部数据分析结果确定所述数据序列的全局数据处理结果。
在一些实施例中,所述正向单元,包括:
提取子单元,用于对所述数据片段进行语义提取处理,得到所述数据片段对应的语义向量;
正向子单元,用于采用正向预测模型,根据所述数据片段对应的语义向量和所述数据片段对应的前一数据片段预测所述数据片段对应的正向向量,所述正向预测模型由预设正向预测模型训练而成;
在一些实施例中,所述反向单元,包括:
反向子单元,用于采用反向预测模型,根据所述数据片段对应的语义向量和所述数据片段对应的后一数据片段预测所述数据片段对应的反向向量,所述反向预测模型由预设反向预测模型训练而成。
在一些实施例中,所述正向预测模型包括正向输入层、正向隐藏层和正向输出层,采用正向预测模型,所述正向子单元,包括:
第一正向子模块,用于在正向输入层对所述语义向量进行第一次加权处理,得到所述数据片段的输入向量;
第二正向子模块,用于在正向隐藏层确定所述前一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量;
第三正向子模块,用于在正向输出层对所述数据片段对应的隐藏向量进行第三次加权处理,得到所述数据片段对应的正向向量。
在一些实施例中,所述第二正向子模块,用于:
确定所述前一数据片段对应的隐藏向量;
对所述前一数据片段对应的隐藏向量、数据片段的输入向量进行加权求和,得到所述数据片段对应的隐藏向量。
在一些实施例中,所述第二正向子模块,用于:
确定所述前一数据片段对应的隐藏向量,以及所述隐藏层上一时刻的层状态;
跟据所述前一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据所述隐藏层当前时刻的层状态和前一数据片段对应的隐藏向量,计算所述数据片段对应的隐藏向量。
在一些实施例中,所述反向预测模型包括反向输入层、反向隐藏层和反向输出层,所述反向子单元,包括:
反向第一子模块,用于在反向输入层对所述语义向量进行第一次加权处理,得到所述数据片段的输入向量;
反向第二子模块,用于在反向隐藏层确定所述后一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量;
反向第三子模块,用于在反向输出层对所述数据片段对应的隐藏向量进行第三次加权处理,得到所述数据片段对应的反向向量。
在一些实施例中,所述第二反向子模块,用于:
确定所述后一数据片段对应的隐藏向量;
对所述后一数据片段对应的隐藏向量、数据片段的输入向量进行加权求和,得到所述数据片段对应的隐藏向量。
在一些实施例中,所述第二反向子模块,用于:
确定所述后一数据片段对应的隐藏向量,以及所述隐藏层上一时刻的层状态;
跟据所述后一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据所述隐藏层当前时刻的层状态和后一数据片段对应的隐藏向量,计算所述数据片段对应的隐藏向量。
在一些实施例中,所述局部数据处理结果包括所述数据片段的局部概率结果,所述局部单元,包括:
获取子单元,用于取分析模型,所述分析模型为分类模型,所述分析模型包括多个分析权重值和分析偏置值;
加权求和子单元,用于采用所述分析权重值和分析偏置值对所述局部拼接向量进行加权求和计算,得到加权求和值;
归一化子单元,用于对所述加权求和值进行归一化处理,得到所述数据片段的局部概率结果。
在一些实施例中,所述获取子单元,用于:
获取预设分析模型和预设的训练样本,所述训练样本标注了真实局部概率结果;
采用所述训练样本训练所述预设分析模型,得到训练结果;
根据所述训练样本标注的真实局部概率结果,和所述训练结果计算所述预设分析模型的对数损失值;
基于所述对数损失值对所述预设分析模型进行参数调试,直至所述预设分析模型收敛,得到分析模型。
在一些实施例中,所述局部数据处理结果包括所述数据片段的局部概率结果,所述全局单元,用于:
对所述数据序列中所有数据片段相对应的局部概率结果进行均值处理,得到所述数据序列的全局概率结果;
基于所述全局概率结果确定所述数据序列的全局数据处理结果。
在一些实施例中,所述局部单元,还用于:
获取用户的局部展示指令;
基于所述局部展示指令,在数据序列中确定目标数据序列;
向用户展示所述目标数据序列对应的局部数据分析结果。
本发明实施例还提供一种服务器,包括存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本发明实施例所提供的任一种数据处理方法中的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种数据处理方法中的步骤。
本发明实施例可以获取数据序列,数据序列包括多个数据片段;基于数据片段的前一数据片段,预测数据片段对应的正向向量;基于数据片段的后一数据片段,预测数据片段对应的反向向量;对正向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量;对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果;基于局部数据分析结果确定数据序列的全局数据处理结果。
在本发明中,可以分别通过正向和反向的顺序依次对数据序列中的每个数据片段进行向量预测,得到数据片段的正向向量和反向向量,其中,该正向向量记录了该数据片段之前前一个数据片段的信息,该反向向量记录了该数据片段之后后一个数据片段的信息;然后,通过拼接该数据片段的正向向量和反向向量可以得到拼接向量,该拼接向量可以同时记录该数据片段前后文的信息,通过分析该拼接信息,可以得到该数据片段准确的局部结果,最终,根据所有的数据片段的局部结果可以得到该数据序列准确的全局结果。由此,本方案可以提升数据处理方法的准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的数据处理方法的场景示意图;
图1b是本发明实施例提供的数据处理方法的第一种流程示意图;
图1c是本发明实施例提供的数据处理方法的正向预测模型结构示意图;
图1d是本发明实施例提供的数据处理方法的反向预测模型结构示意图;
图1e是本发明实施例提供的RNN模型结构示意图;
图1f是本发明实施例提供的数据处理方法的LSTM结构示意图;
图1g是本发明实施例提供的数据处理方法的GRU结构示意图;
图2a是本发明实施例提供的数据处理方法第二种流程的示意图;
图2b是本发明实施例提供的数据处理方法的预测模型结构示意图;
图3是本发明实施例提供的数据处理装置的第一种结构示意图;
图4是本发明实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种数据处理方法、装置、服务器和存储介质。
其中,该数据处理装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(Personal Computer,PC)等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
在一些实施例中,该数据处理装置还可以集成在多个电子设备中,比如,数据处理装置可以集成在多个服务器中,由多个服务器来实现本发明的数据处理方法。
在一些实施例中,服务器也可以以终端的形式来实现。
例如,参考图1a,该电子设备可以为服务器,该服务器可以获取数据序列,其中,该数据序列可以包括任意数量的数据片段;基于数据片段的前一数据片段,可以预测该数据片段对应的正向向量;基于数据片段的后一数据片段,可以预测该数据片段对应的反向向量。
然后,对该数据片段的正向向量和反向向量进行向量合并处理,得到该数据片段对应的局部拼接向量,再对局部拼接向量进行向量分析处理,得到该数据片段的局部数据分析结果;
最后,将通过上述方法得到的数据序列中所有数据片段的局部数据分析结果,可以确定该数据序列的全局数据处理结果。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
人工智能(Artificial Intelligence,AI)是一种利用数字计算机来模拟人类感知环境、获取知识并使用知识的技术,该技术可以使机器具有类似于人类的感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习、深度学习等几大方向。
其中,机器学习(Machine Learning,ML)是基于对数据的初步认识以及学习目的所进行的一系列分析,对数学模型中的参数进行训练,最后运用训练后的模型对数据进行分析预测。机器学习的方法通常包括深度学习、决策树算法、贝叶斯算法、支持向量机算法、随机森林算法、人工神经网络算法、关联规则算法以及期望最大化算法,等等。
在本实施例中,提供了一种基于机器学习的数据处理方法,如图1b所示,该数据处理方法的具体流程可以如下:
101、获取数据序列,数据序列包括多个数据片段。
其中,数据序列是指有前后数据之间具有依赖关系的一组数据片段,数据序列可以反映某一事物、现象等随某些参数变换而产生的变化状态或程度。
数据片段可以以多种存储形式表现,比如,数据片段可以以文字、字符、符号、图像、声音等多种形式表现。
数据序列的类型具有多种,比如,数据序列可以分为时间数据序列(TimeSeries)、编号数据序列、位置数据序列,等等。例如,数据序列可以是用户阅读的文章列表、用户的网址浏览记录、由不同句子构成的文章、由多个旋律构成的流行歌曲、气温变换图、视频数据、分子生物的核苷酸碱基序列,等等。
其中,数据序列中的相邻的数据片段之间存在一定的依赖关系,例如,参考图1a所示的数据序列,数据片段A与其前一数据片段A1之间相邻且存在依赖关系,数据片段A与其后一数据片段A2之间相邻且存在依赖关系;其中,该依赖关系可以是相互依赖关系,也可以是单向的依赖关系,在此不做要求。
在一些实施例中,数据序列可以是时间数据序列,该时间数据序列是指在时间上前后数据之间存在依赖关系的数据,例如,数据序列中的目标数据片段依赖该目标数据片段的前一数据片段。
具体获取数据序列的方式具有多种,比如,可以从本地内存中读取数据序列,也可以通过传感器系统获取该传感器系统记录的数据序列,还可以通过网络获取数据序列,等等。
102、基于数据片段的前一数据片段,预测数据片段对应的正向向量。
数据片段的前一数据片段是指在数据序列中,位于该数据片段前一位的另一数据片段。例如,定义数据序列X={x1,x2,x3,x4...xn},其中xi是该数据序列X中的数据片段,数据片段x3的前一数据片段为x2,该数据片段x3和数据片段为x2之间可以具有某种依赖关系,比如,数据片段x3依赖数据片段x2
为了进对数据序列进行完整、准确分析,在本实施例中可以根据数据片段及其前一数据片段之间的依赖关系来分析该数据片段,具体地,可以基于数据片段的前一数据片段,预测数据片段对应的正向向量。
在一些实施例中,基于数据片段的前一数据片段,预测数据片段对应的正向向量,可以包括如下步骤:
对数据片段进行语义提取处理,得到数据片段对应的语义向量;
采用正向预测模型,根据数据片段对应的语义向量和数据片段对应的前一数据片段预测数据片段对应的正向向量,正向预测模型由预设正向预测模型训练而成。
当数据片段以文字、符号、图像、声音等形式表现时,需要对数据片段进行一系列的语义提取处理,得到该数据片段对应的语义向量,该语义向量可以视作该数据片段的特征。
具体地,语义提取方式具有多种,比如,可以通过降维、算子等方式进行语义提取。常用的特征提取方法可以包括主成分分析(Principal Component Analysis,PCA),独立成分分析(Independent Component Analysis,ICA),线性判别分析(Linear DiscriminantAnalysis,LDA),等等。
在一些实施例中,正向预测模型可以为任意一种单向的循环神经网络模型(Recurrent Neural Network,RNN),RNN是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络。
其中,参考图1c,该正向预测模型F-RNN可以依次对数据序列X={x1,x2,x3,x4...xn}中的数据片段进行由x1、x2、x3到xn-1、xn的顺序进预测,分别得到这些数据片段对应的正向向量,其中数据片段xi对应其正向向量为
Figure BDA0002354509230000091
在一些实施例中,正向预测模型包括正向输入层、正向隐藏层和正向输出层,步骤“采用正向预测模型,根据数据片段对应的语义向量和数据片段对应的前一数据片段预测数据片段对应的正向向量”可以包括以下步骤:
在正向输入层对语义向量进行第一次加权处理,得到数据片段的输入向量;
在正向隐藏层确定前一数据片段对应的隐藏向量,以及,对数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量;
在正向输出层对数据片段对应的隐藏向量进行第三次加权处理,得到数据片段对应的正向向量。
其中,正向预测模型作为一种RNN模型,其结构可以参考图1e,输入层具有第一权重U,隐藏层具有第二权重W,输出层具有第三权重V。
在正向输入层可以对语义向量xt进行第一次加权处理,得到数据片段的输入向量Uxt
在正向隐藏层可以确定前一数据片段xt-1对应的隐藏向量st-1,以及,对数据片段的输入向量Uxt、前一数据片段对应的隐藏向量st-1进行第二次加权处理,得到数据片段对应的隐藏向量st=Wst-1+Uxt
在正向输出层可以对数据片段对应的隐藏向量st进行第三次加权处理,得到数据片段对应的输出向量(即正向向量)ot=Vst
在一些实施例中,为了检测出数据序列中数据片段之间的长期依赖信息,可以采用长短期记忆网络(Long Short-Term Memory,LSTM)作为正向预测模型的循环单元,其中,LSTM包含了四个全连接层(一个用于输出,三个用于控制)、三个门(遗忘门,输入门,输出门)、两条状态向量(长期记忆,短期记忆),具体结构可以参考图1f,计算公式如下:
Figure BDA0002354509230000101
Figure BDA0002354509230000102
Figure BDA0002354509230000103
Figure BDA0002354509230000104
Figure BDA0002354509230000105
Figure BDA0002354509230000106
其中,h(t-1)是前一数据片段x(t-1)对应的正向向量,c(t-1)是前一数据片段x(t-1)对应的状态向量,h(t)是该数据片段x(t)对应的正向向量,c(t)是该数据片段x(t)对应的状态向量(也是长期记忆信息),i(t)是输入门的计算公式,f(t)是遗忘门的的计算公式,o(t)是输出门的计算公式,g(t)是计算的信息,y(t)是长期记忆信息。
其中,其中σ(x)=1/(1+e-x)是一个sigmoid函数。
故步骤“在正向隐藏层确定前一数据片段对应的隐藏向量,以及,对数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量”具体可以包括以下步骤:
确定前一数据片段对应的隐藏向量,以及隐藏层上一时刻的层状态;
跟据前一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据隐藏层当前时刻的层状态和前一数据片段对应的隐藏向量,计算数据片段对应的隐藏向量。
在一些实施例中,可以采用门控循环单元网络(gatedrecurrent unit,GRU)作为正向预测模型的循环单元,其中,GRU类似于LSTM结构,但GRU合并两条状态向量为一条状态向量,且合并了遗忘门和输入门,以及没有输出门,但是多了一个对状态输入进行过滤的门。具体结构可以参考图1g:
Figure BDA0002354509230000111
Figure BDA0002354509230000112
Figure BDA0002354509230000113
Figure BDA0002354509230000114
其中,h(t-1)是前一数据片段x(t-1)对应的正向向量,h(t)是该数据片段x(t)对应的正向向量,z(t)可以控制增删记忆信息,g(t)可以计算全连接层。
故步骤“在正向隐藏层确定前一数据片段对应的隐藏向量,以及,对数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量”具体可以包括以下步骤:
确定前一数据片段对应的隐藏向量;
对前一数据片段对应的隐藏向量、数据片段的输入向量进行加权求和,得到数据片段对应的隐藏向量。
103、基于数据片段的后一数据片段,预测数据片段对应的反向向量。
数据片段的后一数据片段是指在数据序列中,位于该数据片段后一位的另一数据片段。例如,定义数据序列X={x1,x2,x3,x4...xn},其中xi是该数据序列X中的数据片段,数据片段x3的后一数据片段为x4,该数据片段x3和数据片段为x4之间可以具有某种依赖关系,比如,数据片段x3对其后一数据片段x4具有影响,即,数据片段x4依赖该数据片段x3
在一些实施例中,基于数据片段的后一数据片段,预测数据片段对应的反向向量,可以包括如下步骤:
采用反向预测模型,根据数据片段对应的语义向量和数据片段对应的后一数据片段预测数据片段对应的反向向量,反向预测模型由预设反向预测模型训练而成。
在一些实施例中,反向预测模型可以为任意一种单向的循环神经网络模型,其中,参考图1d,该反向预测模型B-RNN可以依次对数据序列X={x1,x2,x3,x4...xn}中的数据片段进行由xn、xn-1、xn-2到x2、x1的顺序(即,反向顺序的相反顺序)进预测,分别得到这些数据片段对应的反向向量,其中数据片段xi对应其反向向量为
Figure BDA0002354509230000121
其中,反向预测模型可以包括反向输入层、反向隐藏层和反向输出层,故步骤“采用反向预测模型,根据数据片段对应的语义向量和数据片段对应的后一数据片段预测数据片段对应的反向向量”可以包括以下步骤:
在反向输入层对语义向量进行第一次加权处理,得到数据片段的输入向量;
在反向隐藏层确定后一数据片段对应的隐藏向量,以及,对数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量;
在反向输出层对数据片段对应的隐藏向量进行第三次加权处理,得到数据片段对应的反向向量。
在一些实施例中,为了检测出数据序列中数据片段之间的长期依赖信息,可以采用LSTM作为反向预测模型的循环单元,其计算公式和方法与正向预测模型相似,但计算数据片段的顺序与正向预测模型相反。
故步骤“在反向隐藏层确定后一数据片段对应的隐藏向量,以及,对数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量”具体可以包括以下步骤:
确定后一数据片段对应的隐藏向量,以及隐藏层上一时刻的层状态;
跟据后一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据隐藏层当前时刻的层状态和后一数据片段对应的隐藏向量,计算数据片段对应的隐藏向量。
在一些实施例中,可以采用GRU作为反向预测模型的循环单元,,其计算公式和方法与正向预测模型相似,但计算数据片段的顺序与正向预测模型相反。
故步骤“在反向隐藏层确定后一数据片段对应的隐藏向量,以及,对数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量”可以包括以下步骤:
确定后一数据片段对应的隐藏向量,以及隐藏层上一时刻的层状态;
跟据后一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据隐藏层当前时刻的层状态和后一数据片段对应的隐藏向量,计算数据片段对应的隐藏向量。
104、对反向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量。
最后,可以对步骤103得到的反向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量。
其中,向量合并处理的方式具有多种,比如,之间将反向向量和反向向量进行向量前后连接,再比如,对反向向量和反向向量进行均值处理,再比如,在反向向量和反向向量中随机选取向量信息并对这些随机选取的信息进行拼接,等等。
105、对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果。
在本实施例中,可以对步骤104得到的局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果。
其中,向量分析处理的方式具有多种,比如,可以采用分类模型、分割模型、预测模型等进行向量分析。
其中,分类模型可以包括多分类模型和二分类模型,比如,常见的分类模型包括随机森林、线性回归、逻辑回归、决策树,等等。
在一些实施例中,局部数据处理结果可以包括数据片段的局部概率结果,步骤105可以包括以下步骤:
获取分析模型,分析模型为分类模型,分析模型包括多个分析权重值和分析偏置值;
采用分析权重值和分析偏置值对局部拼接向量进行加权求和计算,得到加权求和值;
对加权求和值进行归一化处理,得到数据片段的局部概率结果。
其中,在一些实施例中,获取分析模型,可以包括以下步骤:
获取预设分析模型和预设的训练样本,训练样本标注了真实局部概率结果;
采用训练样本训练预设分析模型,得到训练结果;
根据训练样本标注的真实局部概率结果,和训练结果计算预设分析模型的对数损失值;
基于对数损失值对预设分析模型进行参数调试,直至预设分析模型收敛,得到分析模型。
在一些实施例中,还可以向用户展示每个数据序列对应的局部分析结果,以及,用户还可以指定展示某个数据序列对应的局部分析结果,在步骤105之后,还可以包括以下步骤:
获取用户的局部展示指令;
基于局部展示指令,在数据序列中确定目标数据序列;
向用户展示目标数据序列对应的局部数据分析结果。
该实施例可以向用户提供局部数据分析结果以便提供用户数据序列中的数据片段的预测信息,便于用户分析,从而可以提高用户体验。
106、基于局部数据分析结果确定数据序列的全局数据处理结果。
基于局部数据分析结果确定数据序列的全局数据处理结果,比如,可以直接对局部数据分析结果取均值,得到全局数据处理结果,再比如,可以对局部数据处理结果进行求和,得到全局数据处理结果,等等。
在一些实施例中,局部数据处理结果可以包括数据片段的局部概率结果,步骤“基于局部数据分析结果确定数据序列的全局数据处理结果”可以包括以下步骤:
对数据序列中所有数据片段相对应的局部概率结果进行均值处理,得到数据序列的全局概率结果;
基于全局概率结果确定数据序列的全局数据处理结果。
由上可知,本发明实施例可以获取数据序列,数据序列包括多个数据片段;基于数据片段的前一数据片段,预测数据片段对应的正向向量;基于数据片段的后一数据片段,预测数据片段对应的反向向量;对正向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量;对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果;基于局部数据分析结果确定数据序列的全局数据处理结果。
由此,本方案可以对数据序列中每一个数据片段进行分析预测,从而分析出整个数据序列。本方案可以从局部进行细节的分析,且分析时还可以考虑局部数据的前后文信息,从而使得最终的全局分析保存了更多的细节,以及前后文信息,从而提升数据处理方法的准确度。
根据上述实施例所描述的方法,以下将作进一步详细说明。
本发明实施例提供的数据处理方案可以应用在各种数据序列分析场景中,比如,以时序数据序列为例,目前常见的时序数据序列的分析方法有循环神经网络及其改进模型如长短期记忆神经网络、GRU等,这些模型无法解释时序数据序列中哪些数据片段影响了模型最终预测的结果,故目前的数据处理方法解释性较弱。
针对上述问题,本发明提出一种数据处理方法,能够解决目前的数据处理方法解释性较弱的问题,并能够量化其影响程度,以及,提升数据处理方法的准确度。
在本实施例中,将以通过分析用户的网页浏览数据序列来分析金融反欺诈场景为例,对本发明实施例的方法进行详细说明。
如图2a所示,一种数据处理方法具体流程如下:
201、获取用户的网页浏览数据序列,网页浏览数据序列包括多个网页信息。
定义用户的网页浏览数据序列X={x1,x2…xn},其中xi∈Rm,是一个m维的向量(特征),代表第i个时刻或者第i步的模型输入;n代表网页浏览数据序列的长度,也称为步长。
具体地,X代表一个用户浏览文章的列表,xi则是文章的抽象语义特征,可以通过多种特征提取网络分析得到,比如,特征提取网络可以是BERT(Bidirectional EncoderRepresentations from Transformers)等模型。
202、采用预测模型基于网页信息的前一数据片段,预测该网页信息的正向向量,以及基于网页信息的后一数据片段,预测该网页信息的反向向量。
参考图2b,图2b为预测模型的结构图,该预测模型包括正向循环单元F-NN和反向循环单元B-NN。
在本实施例中正向循环单元F-NN和反向循环单元B-NN可以为相同的循环单元,也可以为不同的循环单元,比如,F-NN可以是LSTM Cell,也可以是GRU Cell,B-NN可以是LSTMCell,也可以是GRU Cell,等等。
具体地,对正向向量
Figure BDA0002354509230000161
和反向向量的计算方式如下:
Figure BDA0002354509230000162
Figure BDA0002354509230000163
203、对正向向量和反向向量进行向量合并处理,得到网页信息对应的局部拼接向量。
局部拼接向量的计算公式如下:
Figure BDA0002354509230000164
其中,
Figure BDA0002354509230000165
指两个向量直接进行前后拼接。
204、对局部拼接向量进行向量分析处理,得到网页信息的诈骗概率。
将局部拼接向量放入一个逻辑回归(Logistic Regression,LR)模型就可以得到时刻i的诈骗概率ci,计算公式如下:
Figure BDA0002354509230000166
其中,Wl是逻辑回归模型的权重参数,bl是逻辑回归模型的偏置参数。
205、基于所有网页信息的诈骗概率确定用户受骗概率,并展示该用户受骗概率,以及,展示所有网页信息的诈骗概率。
最后,通过对所有网页的网页信息的诈骗概率取均值得到用户受骗概率,其计算公式如下:
Figure BDA0002354509230000167
展示该用户受骗概率,以及,展示所有网页信息的诈骗概率的效果如表1所示:
Figure BDA0002354509230000171
表1
在本实施例中,还可以使用AUC(Area Under Curve)作为评价指标,对比了本发明提出的预测模型以及传统的RNN模型、传统的自注意力模型、传统的统计模型、传统的DNN模型进行了对比,结果见表2,如下:
Figure BDA0002354509230000181
表2
可知,本发明提出的数据处理方法相对于传统方法更加准确。
由上可知,本发明可以获取用户的网页浏览数据序列,网页浏览数据序列包括多个网页信息;采用正向预测模型基于网页信息的前一数据片段,预测该网页信息的正向向量,以及采用反向预测模型基于网页信息的后一数据片段,预测该网页信息的反向向量;对正向向量和反向向量进行向量合并处理,得到网页信息对应的局部拼接向量;对局部拼接向量进行向量分析处理,得到网页信息的诈骗概率,并展示该网页信息的诈骗概率;基于所有网页信息的诈骗概率确定用户受骗概率,并展示该用户受骗概率。
本发明不光能给出一个用户可能受到欺诈概率,还能给出该用户的网页浏览数据序列中每个网页可能是诈骗网页的概率,从而解释用户的浏览的哪些网页最终导致了欺诈概率的上升。由此,本方案可以进一步地提升数据处理方法的准确度。
为了更好地实施以上方法,本发明实施例还提供一种数据处理装置,该数据处理装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
比如,在本实施例中,将以数据处理装置具体集成在XX为例,对本发明实施例的方法进行详细说明。
例如,如图3所示,该数据处理装置可以包括获取单元301、正向单元302、反向单元303、拼接单元304、局部单元305以及全局单元306,如下:
(一)获取单元301:
获取单元301可以用于获取数据序列,数据序列包括多个数据片段。
(二)正向单元302:
正向单元302可以用于基于数据片段的前一数据片段,预测数据片段对应的正向向量。
在一些实施例中,正向单元302可以包括提取子单元和正向子单元,如下:
(1)提取子单元
提取子单元可以用于对数据片段进行语义提取处理,得到数据片段对应的语义向量。
(2)正向子单元
正向子单元可以用于采用正向预测模型,根据数据片段对应的语义向量和数据片段对应的前一数据片段预测数据片段对应的正向向量,正向预测模型由预设正向预测模型训练而成。
其中,在一些实施例中,正向预测模型可以包括正向输入层、正向隐藏层和正向输出层,采用正向预测模型,正向子单元可以包括第一正向子模块、第二正向子模块、第三正向子模块,其中:
第一正向子模块可以用于在正向输入层对语义向量进行第一次加权处理,得到数据片段的输入向量;
第二正向子模块可以在正向隐藏层确定前一数据片段对应的隐藏向量,以及,对数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量;
第三正向子模块可以在正向输出层对数据片段对应的隐藏向量进行第三次加权处理,得到数据片段对应的正向向量。
在一些实施例中,第二正向子模块具体可以用于:
确定前一数据片段对应的隐藏向量;
对前一数据片段对应的隐藏向量、数据片段的输入向量进行加权求和,得到数据片段对应的隐藏向量。
在一些实施例中,第二正向子模块具体可以用于:
确定前一数据片段对应的隐藏向量,以及隐藏层上一时刻的层状态;
跟据前一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据隐藏层当前时刻的层状态和前一数据片段对应的隐藏向量,计算数据片段对应的隐藏向量。
(三)反向单元303:
反向单元303可以用于基于数据片段的后一数据片段,预测数据片段对应的反向向量。
在一些实施例中,反向单元303可以包括反向子单元,反向子单元可以用于采用反向预测模型,根据数据片段对应的语义向量和数据片段对应的后一数据片段预测数据片段对应的反向向量,反向预测模型由预设反向预测模型训练而成。
其中,在一些实施例中,反向预测模型包括反向输入层、反向隐藏层和反向输出层,反向子单元可以包括反向第一子模块、反向第二子模块以及反向第三子模块,其中:
反向第一子模块,用于在反向输入层对语义向量进行第一次加权处理,得到数据片段的输入向量;
反向第二子模块,用于在反向隐藏层确定后一数据片段对应的隐藏向量,以及,对数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到数据片段对应的隐藏向量;
反向第三子模块,用于在反向输出层对数据片段对应的隐藏向量进行第三次加权处理,得到数据片段对应的反向向量。
在一些实施例中,第二反向子模块具体可以用于:
确定后一数据片段对应的隐藏向量;
对后一数据片段对应的隐藏向量、数据片段的输入向量进行加权求和,得到数据片段对应的隐藏向量。
在一些实施例中,第二反向子模块具体可以用于:
确定后一数据片段对应的隐藏向量,以及隐藏层上一时刻的层状态;
跟据后一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据隐藏层当前时刻的层状态和后一数据片段对应的隐藏向量,计算数据片段对应的隐藏向量。
(四)拼接单元304:
拼接单元304可以用于对正向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量。
(五)局部单元305:
局部单元305可以用于对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果。
在一些实施例中,局部数据处理结果可以包括数据片段的局部概率结果,局部单元305,可以包括获取子单元、加权求和子单元以及归一化子单元,其中:
获取子单元可以用于取分析模型,分析模型为分类模型,分析模型包括多个分析权重值和分析偏置值;
加权求和子单元可以用于采用分析权重值和分析偏置值对局部拼接向量进行加权求和计算,得到加权求和值;
归一化子单元可以用于对加权求和值进行归一化处理,得到数据片段的局部概率结果。
在一些实施例中,获取子单元具体可以用于:
获取预设分析模型和预设的训练样本,训练样本标注了真实局部概率结果;
采用训练样本训练预设分析模型,得到训练结果;
根据训练样本标注的真实局部概率结果,和训练结果计算预设分析模型的对数损失值;
基于对数损失值对预设分析模型进行参数调试,直至预设分析模型收敛,得到分析模型。
在一些实施例中,局部单元具体还可以用于:
获取用户的局部展示指令;
基于局部展示指令,在数据序列中确定目标数据序列;
向用户展示目标数据序列对应的局部数据分析结果。
(六)全局单元306:
全局单元306可以用于基于局部数据分析结果确定数据序列的全局数据处理结果。
在一些实施例中,局部数据处理结果包括数据片段的局部概率结果,全局单元具体可以用于:
对数据序列中所有数据片段相对应的局部概率结果进行均值处理,得到数据序列的全局概率结果;
基于全局概率结果确定数据序列的全局数据处理结果。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本实施例的数据处理装置由获取单元获取数据序列,数据序列包括多个数据片段;由正向单元基于数据片段的前一数据片段,预测数据片段对应的正向向量;由反向单元基于数据片段的后一数据片段,预测数据片段对应的反向向量;由拼接单元对正向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量;由局部单元对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果;由全局单元基于局部数据分析结果确定数据序列的全局数据处理结果。
由此,本发明实施例可以提升数据处理方法的准确度。
本发明实施例还提供一种电子设备,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑,等等;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,等等。
在一些实施例中,该数据处理装置还可以集成在多个电子设备中,比如,数据处理装置可以集成在多个服务器中,由多个服务器来实现本发明的数据处理方法。在一些实施例中,xx服务器和xx服务器也可以由一台服务器来实现。
在本实施例中,将以本实施例的电子设备是服务器为例进行详细描述,比如,如图4所示,其示出了本发明实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403、输入模块404以及通信模块405等部件。本领域技术人员可以理解,图4中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。在一些实施例中,处理器401可包括一个或多个处理核心;在一些实施例中,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,在一些实施例中,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入模块404,该输入模块404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
该服务器还可包括通信模块405,在一些实施例中通信模块405可以包括无线模块,服务器可以通过该通信模块405的无线模块进行短距离无线传输,从而为用户提供了无线的宽带互联网访问。比如,该通信模块405可以用于帮助用户收发电子邮件、浏览网页和访问流式媒体等。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取数据序列,数据序列包括多个数据片段;
基于数据片段的前一数据片段,预测数据片段对应的正向向量;
基于数据片段的后一数据片段,预测数据片段对应的反向向量;
对正向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量;
对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果;
基于局部数据分析结果确定数据序列的全局数据处理结果。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本发明实施例可以提升数据处理的准确度。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种数据处理方法中的步骤。例如,该指令可以执行如下步骤:
获取数据序列,数据序列包括多个数据片段;
基于数据片段的前一数据片段,预测数据片段对应的正向向量;
基于数据片段的后一数据片段,预测数据片段对应的反向向量;
对正向向量和反向向量进行向量合并处理,得到数据片段对应的局部拼接向量;
对局部拼接向量进行向量分析处理,得到数据片段的局部数据分析结果;
基于局部数据分析结果确定数据序列的全局数据处理结果。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种数据处理方法中的步骤,因此,可以实现本发明实施例所提供的任一种数据处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种数据处理方法、装置、服务器和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种数据处理方法,其特征在于,包括:
获取数据序列,所述数据序列包括多个数据片段;
基于所述数据片段的前一数据片段,预测所述数据片段对应的正向向量;
基于所述数据片段的后一数据片段,预测所述数据片段对应的反向向量;
对所述正向向量和反向向量进行向量合并处理,得到所述数据片段对应的局部拼接向量;
对所述局部拼接向量进行向量分析处理,得到所述数据片段的局部数据分析结果;
基于所述局部数据分析结果确定所述数据序列的全局数据处理结果。
2.如权利要求1所述的数据处理方法,其特征在于,基于所述数据片段的前一数据片段,预测所述数据片段对应的正向向量,包括:
对所述数据片段进行语义提取处理,得到所述数据片段对应的语义向量;
采用正向预测模型,根据所述数据片段对应的语义向量和所述数据片段对应的前一数据片段预测所述数据片段对应的正向向量,所述正向预测模型由预设正向预测模型训练而成;
所述基于所述数据片段的后一数据片段,预测所述数据片段对应的反向向量,包括:
采用反向预测模型,根据所述数据片段对应的语义向量和所述数据片段对应的后一数据片段预测所述数据片段对应的反向向量,所述反向预测模型由预设反向预测模型训练而成。
3.如权利要求2所述的数据处理方法,其特征在于,所述正向预测模型包括正向输入层、正向隐藏层和正向输出层,采用正向预测模型,根据所述数据片段对应的语义向量和所述数据片段对应的前一数据片段预测所述数据片段对应的正向向量,包括:
在正向输入层对所述语义向量进行第一次加权处理,得到所述数据片段的输入向量;
在正向隐藏层确定所述前一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量;
在正向输出层对所述数据片段对应的隐藏向量进行第三次加权处理,得到所述数据片段对应的正向向量。
4.如权利要求3所述的数据处理方法,其特征在于,在正向隐藏层确定所述前一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量,包括:
确定所述前一数据片段对应的隐藏向量;
对所述前一数据片段对应的隐藏向量、数据片段的输入向量进行加权求和,得到所述数据片段对应的隐藏向量。
5.如权利要求3所述的数据处理方法,其特征在于,在正向隐藏层确定所述前一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、前一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量,包括:
确定所述前一数据片段对应的隐藏向量,以及所述隐藏层上一时刻的层状态;
跟据所述前一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据所述隐藏层当前时刻的层状态和前一数据片段对应的隐藏向量,计算所述数据片段对应的隐藏向量。
6.如权利要求2所述的数据处理方法,其特征在于,所述反向预测模型包括反向输入层、反向隐藏层和反向输出层,采用反向预测模型,根据所述数据片段对应的语义向量和所述数据片段对应的后一数据片段预测所述数据片段对应的反向向量,包括:
在反向输入层对所述语义向量进行第一次加权处理,得到所述数据片段的输入向量;
在反向隐藏层确定所述后一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量;
在反向输出层对所述数据片段对应的隐藏向量进行第三次加权处理,得到所述数据片段对应的反向向量。
7.如权利要求6所述的数据处理方法,其特征在于,在反向隐藏层确定所述后一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量,包括:
确定所述后一数据片段对应的隐藏向量;
对所述后一数据片段对应的隐藏向量、数据片段的输入向量进行加权求和,得到所述数据片段对应的隐藏向量。
8.如权利要求6所述的数据处理方法,其特征在于,在反向隐藏层确定所述后一数据片段对应的隐藏向量,以及,对所述数据片段的输入向量、后一数据片段对应的隐藏向量进行第二次加权处理,得到所述数据片段对应的隐藏向量,包括:
确定所述后一数据片段对应的隐藏向量,以及所述隐藏层上一时刻的层状态;
跟据所述后一数据片段对应的隐藏向量、数据片段的输入向量、隐藏层上一时刻的层状态更新隐藏层当前时刻的层状态;
根据所述隐藏层当前时刻的层状态和后一数据片段对应的隐藏向量,计算所述数据片段对应的隐藏向量。
9.如权利要求1所述的数据处理方法,其特征在于,所述局部数据处理结果包括所述数据片段的局部概率结果,对所述局部拼接向量进行向量分析处理,得到所述数据片段的局部数据分析结果,包括:
获取分析模型,所述分析模型为分类模型,所述分析模型包括多个分析权重值和分析偏置值;
采用所述分析权重值和分析偏置值对所述局部拼接向量进行加权求和计算,得到加权求和值;
对所述加权求和值进行归一化处理,得到所述数据片段的局部概率结果。
10.如权利要求9所述的数据处理方法,其特征在于,所述获取分析模型,包括:
获取预设分析模型和预设的训练样本,所述训练样本标注了真实局部概率结果;
采用所述训练样本训练所述预设分析模型,得到训练结果;
根据所述训练样本标注的真实局部概率结果,和所述训练结果计算所述预设分析模型的对数损失值;
基于所述对数损失值对所述预设分析模型进行参数调试,直至所述预设分析模型收敛,得到分析模型。
11.如权利要求1所述的数据处理方法,其特征在于,所述局部数据处理结果包括所述数据片段的局部概率结果,基于所述局部数据分析结果确定所述数据序列的全局数据处理结果,包括:
对所述数据序列中所有数据片段相对应的局部概率结果进行均值处理,得到所述数据序列的全局概率结果;
基于所述全局概率结果确定所述数据序列的全局数据处理结果。
12.如权利要求1所述的数据处理方法,其特征在于,对所述局部拼接向量进行向量分析处理,得到所述数据片段的局部数据分析结果之后,还包括:
获取用户的局部展示指令;
基于所述局部展示指令,在数据序列中确定目标数据序列;
向用户展示所述目标数据序列对应的局部数据分析结果。
13.一种数据处理装置,其特征在于,包括:
获取单元,用于获取数据序列,所述数据序列包括多个数据片段;
正向单元,用于基于所述数据片段的前一数据片段,预测所述数据片段对应的正向向量;
反向单元,用于基于所述数据片段的后一数据片段,预测所述数据片段对应的反向向量;
拼接单元,用于对所述正向向量和反向向量进行向量合并处理,得到所述数据片段对应的局部拼接向量;
局部单元,用于对所述局部拼接向量进行向量分析处理,得到所述数据片段的局部数据分析结果;
全局单元,用于基于所述局部数据分析结果确定所述数据序列的全局数据处理结果。
14.一种服务器,其特征在于,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行如权利要求1~12任一项所述的数据处理方法中的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1~12任一项所述的数据处理方法中的步骤。
CN202010003904.5A 2020-01-03 2020-01-03 数据处理方法、装置、服务器和存储介质 Active CN111177493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010003904.5A CN111177493B (zh) 2020-01-03 2020-01-03 数据处理方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010003904.5A CN111177493B (zh) 2020-01-03 2020-01-03 数据处理方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN111177493A true CN111177493A (zh) 2020-05-19
CN111177493B CN111177493B (zh) 2023-05-05

Family

ID=70656121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010003904.5A Active CN111177493B (zh) 2020-01-03 2020-01-03 数据处理方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN111177493B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114519610A (zh) * 2022-02-16 2022-05-20 支付宝(杭州)信息技术有限公司 信息预测方法以及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060256866A1 (en) * 2005-05-13 2006-11-16 Streaming Networks (Pvt.) Ltd. Method and system for providing bi-directionally predicted video coding
US20150149744A1 (en) * 2013-11-26 2015-05-28 Arm Limited Data processing apparatus and method for performing vector processing
CN105976056A (zh) * 2016-05-03 2016-09-28 成都数联铭品科技有限公司 基于双向rnn的信息提取系统
US20180137404A1 (en) * 2016-11-15 2018-05-17 International Business Machines Corporation Joint learning of local and global features for entity linking via neural networks
CN108985309A (zh) * 2017-05-31 2018-12-11 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN109766557A (zh) * 2019-01-18 2019-05-17 河北工业大学 一种情感分析方法、装置、存储介质及终端设备
CN110442707A (zh) * 2019-06-21 2019-11-12 电子科技大学 一种基于seq2seq的多标签文本分类方法
CN110472052A (zh) * 2019-07-31 2019-11-19 西安理工大学 一种基于深度学习的中文社交平台情感分析方法
CN110609897A (zh) * 2019-08-12 2019-12-24 北京化工大学 一种融合全局和局部特征的多类别中文文本分类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060256866A1 (en) * 2005-05-13 2006-11-16 Streaming Networks (Pvt.) Ltd. Method and system for providing bi-directionally predicted video coding
US20150149744A1 (en) * 2013-11-26 2015-05-28 Arm Limited Data processing apparatus and method for performing vector processing
CN105976056A (zh) * 2016-05-03 2016-09-28 成都数联铭品科技有限公司 基于双向rnn的信息提取系统
US20180137404A1 (en) * 2016-11-15 2018-05-17 International Business Machines Corporation Joint learning of local and global features for entity linking via neural networks
CN108985309A (zh) * 2017-05-31 2018-12-11 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN109766557A (zh) * 2019-01-18 2019-05-17 河北工业大学 一种情感分析方法、装置、存储介质及终端设备
CN110442707A (zh) * 2019-06-21 2019-11-12 电子科技大学 一种基于seq2seq的多标签文本分类方法
CN110472052A (zh) * 2019-07-31 2019-11-19 西安理工大学 一种基于深度学习的中文社交平台情感分析方法
CN110609897A (zh) * 2019-08-12 2019-12-24 北京化工大学 一种融合全局和局部特征的多类别中文文本分类方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
DUANE MERRILL 等: "Merge-based parallel sparse matrix-vector multiplication" *
GHASSEN CHNITI 等: "E-commerce Time Series Forecasting using LSTM Neural Network and Support Vector Regression", 《ACM》 *
刘阔;张宗华;: "基于多视图融合的闭环检测技术研究" *
曾蒸等: "用于情感分类的双向深度LSTM", 《计算机科学》 *
王毅等: "结合LSTM和CNN混合架构的深度神经网络语言模型", 《情报学报》 *
陶志勇;李小兵;刘影;刘晓芳;: "基于双向长短时记忆网络的改进注意力短文本分类方法" *
陶志勇等: "基于双向长短时记忆网络的改进注意力短文本分类方法", 《数据分析与知识发现》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114519610A (zh) * 2022-02-16 2022-05-20 支付宝(杭州)信息技术有限公司 信息预测方法以及装置

Also Published As

Publication number Publication date
CN111177493B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN110012356B (zh) 视频推荐方法、装置和设备及计算机存储介质
CN111294646B (zh) 一种视频处理方法、装置、设备及存储介质
CN109034203B (zh) 表情推荐模型的训练、表情推荐方法、装置、设备及介质
US11360927B1 (en) Architecture for predicting network access probability of data files accessible over a computer network
CN111563158B (zh) 文本排序方法、排序装置、服务器和计算机可读存储介质
CN111783903B (zh) 文本处理方法、文本模型的处理方法及装置、计算机设备
CN111340112B (zh) 分类方法、装置、服务器
CN113590948B (zh) 信息推荐方法、装置、设备以及计算机存储介质
CN111258593B (zh) 应用程序预测模型的建立方法、装置、存储介质及终端
CN111512299A (zh) 用于内容搜索的方法及其电子设备
WO2024002167A1 (zh) 一种操作预测方法及相关装置
CN111291618A (zh) 标注方法、装置、服务器和存储介质
Khan et al. Comparative analysis on Facebook post interaction using DNN, ELM and LSTM
CN110245310B (zh) 一种对象的行为分析方法、装置及存储介质
CN111522926A (zh) 文本匹配方法、装置、服务器和存储介质
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN111177493B (zh) 数据处理方法、装置、服务器和存储介质
CN116843022A (zh) 一种数据处理方法及相关装置
CN116204709A (zh) 一种数据处理方法及相关装置
CN116957006A (zh) 预测模型的训练方法、装置、设备、介质及程序产品
WO2023050143A1 (zh) 一种推荐模型训练方法及装置
CN112818084B (zh) 信息交互方法、相关装置、设备及计算机可读介质
CN115545738A (zh) 一种推荐方法及相关装置
CN111445545A (zh) 一种文本转贴图方法、装置、存储介质及电子设备
CN115497482B (zh) 一种语音对话方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant