CN111291824B - 时间序列的处理方法、装置、电子设备和计算机可读介质 - Google Patents

时间序列的处理方法、装置、电子设备和计算机可读介质 Download PDF

Info

Publication number
CN111291824B
CN111291824B CN202010114212.8A CN202010114212A CN111291824B CN 111291824 B CN111291824 B CN 111291824B CN 202010114212 A CN202010114212 A CN 202010114212A CN 111291824 B CN111291824 B CN 111291824B
Authority
CN
China
Prior art keywords
target
time sequence
character
probability
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010114212.8A
Other languages
English (en)
Other versions
CN111291824A (zh
Inventor
周骑骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202010114212.8A priority Critical patent/CN111291824B/zh
Publication of CN111291824A publication Critical patent/CN111291824A/zh
Application granted granted Critical
Publication of CN111291824B publication Critical patent/CN111291824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种时间序列的处理方法、装置、电子设备和计算机可读介质,涉及数据处理的技术领域,包括获取目标时间序列,其中,所述目标时间序列为游戏玩家操作游戏时生成的行为数据序列;将所述目标时间序列转换切分成多个子目标时间序列;根据多个子目标时间序列生成多个字符串,以形成目标字符串集合;基于所述目标字符串集合中的多个字符串确定每个字符串对应的目标分类向量;其中,目标分类向量表示所述目标时间序列为所述目标分类向量所对应的时序类别的概率;基于所述目标分类向量对所述目标时间序列进行分类,以在至少一个时序类别中确定所述目标时间序列的目标时序类别,本申请缓解了采用传统的时间序列的分类方法对时间序列进行分类时准确率较低的技术问题。

Description

时间序列的处理方法、装置、电子设备和计算机可读介质
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种时间序列的处理方法、装置、电子设备和计算机可读介质。
背景技术
时间序列是根据时间进行采集的数据。时间序列的数据在各个领域和行业都有涉及。时间序列数据为按照一定时间间隔采集到的数据,因而时间序列数据具有很强的时间相关性。
时间序列的分类作为时间序列处理重要的一部分,传统的距离测量方法有欧式距离,欧式距离需要两条时间序列长度一致,对于长度不一致的时间序列,欧式距离方法无法完成计算。基于此,进一步提出了DTW(Dynamic Time Warping,动态时间归整)的方法,该方法适用于对不同长度的时间序列进行距离测量。但是,该方法没有很好的利用时间序列点之间的关键信息;同时,计算复杂度也是相当的高。
综上,传统的时间序列的处理方法没有很好利用时间序列关键信息而导致分类效果不好。
发明内容
有鉴于此,本发明的目的在于提供一种时间序列的处理方法、装置、电子设备和计算机可读介质,以缓解了采用传统的时间序列的分类方法对时间序列进行分类时准确率较低的技术问题。
第一方面,本发明实施例提供了一种时间序列的处理方法,包括:获取目标时间序列,其中,所述目标时间序列为游戏玩家操作游戏时生成的行为数据序列;将所述目标时间序列切分成多个子目标时间序列;根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合;基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量,其中,所述目标分类向量表示所述目标时间序列为所述目标分类向量所对应的时序类别的概率;基于所述目标分类向量对所述目标时间序列进行分类,以在至少一个时序类别中确定所述目标时间序列的目标时序类别。
进一步地,根据所述多个子目标时间序列生成多个字符串包括:获取目标字符长度和目标字符范围,其中,所述目标字符长度用于表示每个子目标时间序列所对应的字符串的字符长度,所述目标字符范围用于表示每个子目标时间序列所对应字符串的字符范围;通过SFA算法按照所述目标字符长度和所述目标字符范围,将所述每个子目标时间序列转换为字符串,得到所述多个字符串。
进一步地,所述方法包括:在将所述目标时间序列转换为目标字符串集合之前,确定所述预设滑动窗口的目标窗口长度和/或所述目标字符长度,其中,所述目标窗口长度用于对所述目标时间序列进行切分。
进一步地,确定所述预设滑动窗口的窗口长度和/或所述目标字符长度包括:获取目标函数,其中,所述目标函数的自变量为关于窗口长度和字符长度的向量;采用矩形划分算法DIRECT计算使所述目标函数取最小值的目标自变量;并将所述目标自变量中所包含的窗口长度和字符长度,确定为所述目标窗口长度和所述目标字符长度。
进一步地,基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量包括:确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量;确定所述至少一个时序类别中每个时序类别所对应的概率向量,得到时序类别概率;基于所述第一概率向量和所述时序类别概率确定每个所述字符串对应的目标分类向量。
进一步地,确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量包括:获取训练数据集,其中,所述训练数据集中包含所属于所述至少一个时序类别的训练时间序列;将所述训练数据集中的每个训练时间序列转化为字符串集合,得到至少一个训练字符串集合;对所述至少一个训练字符串集合进行统计,得到所述第一概率向量。
进一步地,对所述至少一个训练字符串集合进行统计,得到所述第一概率向量包括:对所述至少一个训练字符串集合中的字符串进行去重处理,得到去重字符串集合;计算所述去重字符串集合中的字符串Ai在第j类训练时间序列中的出现次数;其中,i依次取1至I,I为所述去重字符串集合中字符串的数量,j依次取1至J,J为所述至少一个时序类别的数量;计算所述训练数据集中所属于所述第j类训练时间序列所包含的字符串类型的总数量,得到目标数量;基于所述目标数量和所述出现次数确定所述第一概率向量。
进一步地,基于所述目标分类向量对所述目标时间序列进行分类,得到所述目标时间序列的时序类别包括:确定所述目标分类向量中的最大向量;并将所述最大向量所对应的时序类别确定为所述目标时间序列的时序类别。
第二方面,本发明实施例还提供了一种时间序列的处理装置,包括:获取单元,用于获取目标时间序列,其中,所述目标时间序列为游戏玩家操作游戏时生成的行为数据序列;切分单元,用于将所述目标时间序列切分成多个子目标时间序列;转换单元,用于根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合,其中,所述目标字符串集合中包括至少一个字符串;确定单元,用于基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量,其中,所述目标分类向量表示所述目标时间序列为所述目标分类向量所对应的时序类别的概率;分类单元,用于基于所述目标分类向量对所述目标时间序列进行分类,以在至少一个时序类别中确定所述目标时间序列的目标时序类别。
第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述的方法的步骤。
第四方面,本发明实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述第一方面中任一项所述的方法的步骤。
在本发明实施例中,首先,获取目标时间序列;然后,将目标时间序列切分成多个子目标时间序列;之后,根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合,基于目标字符串集合中的多个字符串确定每个字符串对应的目标分类向量,其中,目标分类向量表示目标时间序列为目标分类向量所对应的时序类别的概率;最后,基于目标分类向量对目标时间序列进行分类,以在至少一个时序类别中确定目标时间序列的目标时序类别。通过上述描述可知,通过将目标时间序列转换为字符集合的方式,能够保留时间序列中的关键信息,基于此,在基于该字符集合来对时间序列进行分类时,就能够提高时间序列的准确率,进而缓解了采用传统的时间序列的分类方法对时间序列进行分类时准确率较低的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种时间序列的处理方法的流程图;
图2是根据本发明实施例的一种预设滑动窗口的示意图;
图3是根据本发明实施例的另一种时间序列的处理方法的流程图;
图4是根据本发明实施例的第一种可选的实验结果图;
图5是根据本发明实施例的第二种可选的实验结果图;
图6是根据本发明实施例的第三种可选的实验结果图;
图7是根据本发明实施例的第四种可选的实验结果图;
图8是根据本发明实施例的一种时间序列的处理装置的示意图;
图9是根据本发明实施例的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种时间序列的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种时间序列的处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取目标时间序列,其中,所述目标时间序列为游戏玩家操作游戏时生成的行为数据序列。
通过上述描述可知,目标时间序列可以为某个游戏玩家在操作某个游戏时生成的行为数据序列,该行为数据序列中包括该游戏玩家在各个时间点的游戏操作信息。其中,该游戏可以为网络游戏,或者体感游戏等各类游戏,本实施例对此不作具体限定。
例如,该游戏为某个网络游戏,那么可以将游戏玩家每天进行游戏副本的次数进行计算,然后基于该次数生成时间序列,该时间序列可以理解为步骤S102中的目标时间序列。在得到该目标时间序列之后,可以利用下述步骤S104至步骤S108所描述的方法对目标时间序列进行分类,之后,就可以根据时间序列的分类结果将生成相似时间序列玩家归为一类,然后根据玩家类型的多少动态的调配服务器资源。通过调配服务器资源能够实现服务器资源的合理利用和动态优化。
又例如,该游戏为某个体感游戏,体感游戏的传感器会生成高频的时间序列数据,该时间序列数据即为步骤S102中的目标时间序列。在得到该目标时间序列之后,可以利用下述步骤S104至步骤S110所描述的方法对目标时间序列进行分类,之后,可以根据时间序列的分类结果识别玩家的运动方向。
步骤S104,将所述目标时间序列切分成多个子目标时间序列;
步骤S106,根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合;
在本实施例中,在获取到目标时间序列之后,就可以将目标时间序列切分成多个子目标时间序列,然后,将每个子目标时间序列转换为字符串,得到目标字符串集合。
需要说明的是,在本实施例中,在将目标时间序列转换为目标字符串集合之后,保留了时间序列中的关键信息(例如,轮廓信息),通过基于包含关键信息的目标字符串集合确定目标时间序列的序列类型的方式,能够进一步提高时序数据的分类准确率。可选地,在本实施例中,轮廓信息为时间序列的趋势信息。
步骤S108,基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量,其中,所述目标分类向量表示所述目标时间序列为所述目标分类向量所对应的时序类别的概率。
若至少一个时序类别为:时序类别a1、时序类别a2和时序类别a3,那么在该目标分类向量中包含以下向量:b1表示目标时间序列为时序类别a1的概率、b2表示目标时间序列为时序类别a2的概率、b3表示目标时间序列为时序类别a3的概率。
步骤S110,基于所述目标分类向量对所述目标时间序列进行分类,以在至少一个时序类别中确定所述目标时间序列的目标时序类别。
在本发明实施例中,首先,获取目标时间序列;然后,将目标时间序列切分成多个子目标时间序列;之后,根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合,基于目标字符串集合中的多个字符串确定每个字符串对应的目标分类向量,其中,目标分类向量表示目标时间序列为目标分类向量所对应的时序类别的概率;最后,基于目标分类向量对目标时间序列进行分类,以在至少一个时序类别中确定目标时间序列的目标时序类别。通过上述描述可知,通过将目标时间序列转换为字符集合的方式,能够保留时间序列中的关键信息,基于此,在基于该字符集合来对时间序列进行分类时,就能够提高时间序列的准确率,进而缓解了采用传统的时间序列的分类方法对时间序列进行分类时准确率较低的技术问题。
通过上述描述可知,在本实施例中,首先,获取目标时间序列,该目标时间序列可以为游戏玩家操作游戏时生成的行为数据序列。
在获取到目标时间序列之后,就可以将目标时间序列切分成多个子目标时间序列。
在一个可选的实施方式中,可以通过如下方式将所述目标时间序列切分成多个子目标时间序列,具体包括如下步骤:
(1)、按照预设滑动窗口的窗口参数将所述目标时间序列划分为多个子目标时间序列;其中,所述窗口参数包括:目标窗口长度和/或滑动步长。
在将时间序列转换为字符集合时,可以将一条时间序列取对应傅里叶变换级数的条数,从而生成相应的字符个数。但对于一条拥有上百甚至上千条时间点数据的时间序列数据仅仅通过n次傅里叶变换,来生成一个长度为n的单词组来说,这种方式极大损失了时间序列的关键信息。对于一条时间序列如果要保留其特征信息,可以将使用滑动窗口将其切分成一个个时间序列子目标时间序列来进行处理。
基于此,在本申请中,可以预先设定一个预设滑动窗口,该预设滑动窗口的窗口参数包括目标窗口长度和滑动步长中的至少之一。在设定窗口参数之后,就可以按照预设滑动窗口的窗口参数将目标时间序列划分成多个子目标时间序列。
需要说明的是,在本实施例中,每一个预设滑动窗口代表了一条时间序列的子目标时间序列。如图2所示,展示了3个预设滑动窗口,w1,w2,w3为3个预设滑动窗口长度的子目标时间序列,其中,每个预设滑动窗口的长度一致,并且预设滑动窗口的滑动步长为1,如图2所示,3个预设滑动窗口部分重合。这样,一条时间序列就转化成了具有多个子目标时间序列的集合。
在得到至少一个子目标时间序列之后,就将多个子目标时间序列中每个子目标时间序列转换为字符串,从而得到多个字符串,该多个字符串即为目标字符串集合中的字符串。其中,目标字符串集合可以转变表示为如下形式T={ADBB,DDCB,··,CBBA}。其中,目标字符串集合中的元素个数就是预设滑动窗口的个数。
通过上述描述可知,通过将目标时间序列划分为多个子目标时间序列,并将每个子目标时间序列转换为字符串,从而得到字符串集合的方式,能够保留时间序列中的关键信息,基于此,在基于该字符集合来对时间序列进行分类时,就能够提高时间序列的准确率。
在本实施例中,根据所述多个子目标时间序列生成多个字符串的步骤,具体包括:
首先,获取目标字符长度和目标字符范围,其中,所述目标字符长度用于表示每个子目标时间序列所对应的字符串的字符长度,所述目标字符范围用于表示每个子目标时间序列所对应字符串的字符范围;
然后,通过SFA算法按照所述目标字符长度和所述目标字符范围,将所述多个子目标时间序列中的每个子目标时间序列转换为字符串,得到多个字符串。
具体地,在本实施例中,可以获取预先设定的目标字符长度和目标字符范围,其中,目标字符长度表示每个子目标时间序列所对应的字符串的长度,例如,上述目标字符串集合T={ADBB,DDCB,··,CBBA},针对任意一个字符串的字符长度均为4,也即,在该目标字符串集合中的每个字符串均包含4个字符。目标字符范围用于表示每个子目标时间序列所对应字符串的字符范围,例如,目标字符串集合T={ADBB,DDCB,··,CBBA},针对该集合中的任意一个字符串,由A、B、C、D这四个字符组成,也就是说,该目标字符串集合中字符串的目标字符范围为从A到D。
在本实施例中,在获取到预先设定的目标字符长度和目标字符范围之后,就可以通过SFA算法按照目标字符长度和目标字符范围,将多个子目标时间序列中的每个子目标时间序列转换为字符串,从而得到多个字符串。
例如,按照预先设立的目标字符长度,以及目标字符范围,对每一个预设滑动窗口内的子目标时间序列进行SFA方法变换。假设目标字符长度为4,目标字符范围为从A到D,目标时间序列经过SFA方法变换后,可以转变表示为如下形式T={ADBB,DDCB,…,CBBA}。其中字符串集合中的元素个数就是预设滑动窗口的个数。
需要说明的是,SFA方法是将时间序列根据其特征转化为单词的方法。首先将时间序列进行傅里叶变换,生成一系列傅里叶级数来近似该时间序列,将每一个傅里叶级数根据分布取值的方法转化为字符。每个字符代表了该级数经过离散傅里叶转换后傅里叶级数所代表的一个数值等级,从A到B代表了从低到高的一个顺序。因此一个时间序列片段可以化为ABBCD等类似形式。SFA方法主要由两个部分构成,一个是对时间序列进行傅里叶变换,生成傅里叶级数。一个是将傅里叶级数所表示的数值转化成为单个字符。
本申请采用SFA方法,将时间序列进行降维,提取出关键信息。也就是说,在使用了SFA方法后,最大程度的保留了时间序列的轮廓信息。基于此,在基于该字符集合来对时间序列进行分类时,就能够提高时间序列的准确率。
在本实施例一个可选实施方式中,在将所述目标时间序列转换为目标字符串集合之前,还可以确定所述预设滑动窗口的目标窗口长度和/或所述目标字符长度,其中,所述目标窗口长度用于对所述目标时间序列进行切分。
在本实施例中,主要包含以下几个参数:预设滑动窗口的窗口长度、目标字符长度和目标字符范围。由于目标字符范围不同量级之间的变化不大,并且目标字符范围越大训练所耗费的时间复杂度提升越大。因此对于目标字符范围这一超参,可以限制为固定值。
针对预设滑动窗口的窗口参数和目标字符长度,可以采用以下方式来进行确定,具体包括:
首先,获取目标函数,其中,所述目标函数的自变量为关于窗口长度和字符长度的向量;
然后,采用矩形划分算法DIRECT计算使所述目标函数取最小值的目标自变量;并将所述目标自变量中所包含的窗口长度和字符长度,确定为所述目标窗口长度和所述目标字符长度。
具体地,在本实施例中,对于预设滑动窗口的窗口长度和目标字符长度,可以使用DIRECT(矩形划分算法)方法训练得到预设滑动窗口的窗口长度以及目标字符长度。DIRECT是Lipschitzian全局优化的一种,通过对超空间不断划分超矩形来寻找极值点。主要优点是不需要知道目标函数的最优值,只要确认其存在这样一个极小值,因此,上述问题可以表示为极小值问题:min f(x);x,XS,XE∈R;XS≤x≤XE
其中,f(x)是目标函数,由于是计算的是错误率,因此,需要求得最小值。x是关于窗口长度和字符长度的一组向量。XS和XE是该向量X的两个端点,其中,XS和XE构成了一个矩形空间,窗口长度和字符长度是两个相互不影响的参数。
在本实施例中,可以通过反复执行以下两个操作来确定使目标函数取最小值的目标自变量:
第一步,将大的矩形空间通过中心点切分成多个小矩形;
第二步,计算每个小矩形中心的值,找出更接近优化目标的小矩形,作为下一轮的矩形。若目标函数收敛或者迭代限制时间达到,返回当前参数结果,并将当前参数结果确定为目标自变量中所包含的窗口长度和字符长度,否则继续将第二步中的矩形进行切分,直至结果收敛或者迭代限制时间达到。
在本实施例中,在按照上所描述的方法将目标时间序列转换为目标字符串集合之后,就可以基于目标字符串集合确定目标分类向量。
在一个可选的实施方式中,步骤S106,基于所述目标字符串集合确定目标分类向量包括如下步骤:
步骤S1061,确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量。
假设,至少一个时序类别的数量为J,目标字符串集合中字符串的数量为I,且目标字符串集合中字符串用符号Ai表示,表示为目标字符串集合中的第i个字符串,此时,第一概率向量中包含以下概率:
(1)、在J个时序类别下,字符串A1的条件概率:
p(A1|B1)p(A1|B2)…p(A1|Bi)…p(A1|BJ);
(2)、在J个时序类别下,字符串A2的条件概率:
p(A2|B1)p(A2|B2)…p(A2|Bi)…p(A2|BJ);
(3)、在J个时序类别下,字符串Ai的条件概率:
p(Ai|B1)p(Ai|B2)…p(Ai|Bi)…p(Ai|BJ);
(4)、在J个时序类别下,字符串AI的条件概率:
p(AI|B1)p(AI|B2)…p(AI|Bi)…p(AI|BJ)。
步骤S1062,确定所述至少一个时序类别中每个时序类别所对应的概率向量,得到时序类别概率。
假设,至少一个时序类别的数量为J,那么时序类别概率中包含以下概率:
时序类别B1的概率p(B2);时序类别B2的概率p(B3);时序类别Bj的概率p(Bj);时序类别BJ的概率。
步骤S1063,基于所述第一概率向量和所述时序类别概率确定每个所述字符串对应的目标分类向量。
在按照上述所描述的方式计算得到第一概率向量和时序类别概率之后,就可以利用公式计算目标分类向量,其中,在该公式中,P表示目标时间序列为时序类别Bj的概率。
在本实施例中,可以通过以下方式确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量,具体包括:
(1)、获取训练数据集,其中,所述训练数据集中包含所属于所述至少一个时序类别的训练时间序列;
(2)、将所述训练数据集中的每个训练时间序列转化为字符串集合,得到至少一个训练字符串集合;
(3)、对所述至少一个训练字符串集合进行统计,得到所述第一概率向量。
在本实施例中,首先获取训练数据集,其中,在该训练数据集中包含至少一个训练时间序列,且该至少一个训练时间序列的时序类别所属于上述至少一个时序类别。在获取到训练数据集之后,就可以将训练数据集中的每个训练时间序列转化为字符串集合,从而得到至少一个训练字符串集合。接下来,就可以对至少一个训练字符串集合中的字符串进行统计分析,从而得到第一概率向量。需要说明的是,在本实施例中,训练数据集中的每个训练时间序列为已知时序类别的时间序列。
在本实施例中,可以通过以下方式对所述至少一个训练字符串集合进行统计,得到所述第一概率向量,具体包括:
(1)、对所述至少一个训练字符串集合中的字符串进行去重处理,得到去重字符串集合;
(2)、计算所述去重字符串集合中的字符串Ai在第j类训练时间序列中的出现次数;其中,i依次取1至I,I为所述去重字符串集合中字符串的数量,j依次取1至J,J为所述至少一个时序类别的数量;
(3)、计算所述训练数据集中所述第j类训练时间序列所包含的字符串类型的总数量,得到目标数量;
(4)、基于所述目标数量和所述出现次数确定所述第一概率向量。
在本实施例中,在上一步生成的不同训练字符串集合中,找出所有种类的字符串,放入去重字符串集合;也即,对至少一个训练字符串集合中的字符串进行去重处理,得到去重字符串集合,去重字符串集合中的字符串是各不相同。
对去重字符串集合中每一个字符串,计算出训练时间序列中每一个时序类别的时间序列包含该字符串的词频数据,以及确定每个时序类别中所包含字符串类型的总数量,得到目标数量,从而根据该出现次数和目标数量计算出该字符串在该类别的训练时间时序中的占比,从而形成了对每一个字符串对每一个时间序列类的第一概率向量。
假设,训练数据集中包含N个属于第j类训练时间序列的训练时间序列,且在N个(即目标数量)训练时间序列中,M个(即出现频次)训练时间序列包含字符串Ai,M小于或者等于N,因此,可以根据M和N计算第一概率向量,例如,将M/N确定为第一概率向量。
需要说明的是,在本实施例中,可以根据训练数据集确定至少一个时序类别中每个时序类别所对应的概率向量,得到时序类别概率。例如,在训练数据集中包含P个训练时间时序,其中,第i个时序类别的训练时间时序的数量为R(R小于或者等于P)个,此时,第i个时序类别的训练时间时序对应的概率向量可以表示为R/P(即,时序类别概率)。
在本实施例中,在按照上述所描述的方式计算得到目标分类向量之后,就可以确定所述目标分类向量中的最大向量;并将所述最大向量所对应的时序类别确定为所述目标时间序列的时序类别。
通过上述描述可知,通过将目标时间序列转换为字符集合的方式,能够保留时间序列中的关键信息,基于此,在基于该字符集合来对时间序列进行分类时,就能够提高时间序列的准确率,进而缓解了采用传统的时间序列的分类方法对时间序列进行分类时准确率较低的技术问题。
实施例二:
图3是根据本发明实施例的另一种时间序列的处理方法的流程图,如图3所示,该方法描述如下:
(1)、获取时间序列。
(2)、SFA转化为字符串集合;在获取到时间序列之后,按照预设滑动窗口的窗口长度和滑动步长将时间序列切分成一个个小的时间序列子目标时间序列,然后使用SFA转换方法按照对每一个有着滑动窗口长度的子目标时间序列进行转换。一条时间序列将会转换成一个SFA字符集合。
(3)、确定时间序列的目标分类向量。
获取训练数据集,将训练数据集中的每个训练时间序列转化为字符串集合,得到至少一个训练字符串集合。将至少一个训练字符串集合中的字符串进行归纳,统计生成字符串词典;并对字符串词典中的字符串进行去重处理,得到去重字符串集合。计算去重字符串集合中每个字符串在每个类型的训练时间序列中的出现次数;以及计算每个类型的训练时间序列的目标数量,进而,根据该出现次数和目标数量确定第一概率向量。还可以根据训练数据集确定至少一个时序类别中每个时序类别所对应的概率向量,得到时序类别概率。进而,根据第一概率向量和时序类别概率确定目标分类向量。
(4)、时序分类过程。最后,通过目标分类向量对获取到的时间序列进行分类处理。
通过上述描述可知,通过将目标时间序列转换为字符集合的方式,能够保留时间序列中的关键信息,基于此,在基于该字符集合来对时间序列进行分类时,就能够提高时间序列的准确率,进而缓解了采用传统的时间序列的分类方法对时间序列进行分类时准确率较低的技术问题。
需要说明的是,发明人对上述所描述的时间序列的处理方法进行了实验分析,发明人所选用的实验数据集主要来源于UCR公开数据集,UCR公开数据集是用于时间序列聚类和分类,发明人主要在UCR公开数据集中选取了10种不同的数据。如图4至图7所示,分别展示了UCR公开数据集中前四种标签为1的时间序列分布情况,它们分别是Adiac、SwedishLeaf、beef以及SonyAIBORobotSurface。图4和图5分别是Adiac和SwedishLeaf数据,相同种类时间序列之间数据变化小,波动不大。图4和图5分别是beef以及SonyAIBORobotSurface数据,对于另外一类beef以及SonyAIBORobotSurface数据位移和扭曲情况较大,比较符合现实中的某些时间序列。
表1时间序列分类错误率
如表1所示,测试的是UCR数据集中的10种时间序列的分类结果,时间序列类别主要涵盖了从2类到37类,时间序列长度主要是从70到1882。对比的方法为对于图4、图5中的同种时间序列差别较小的数据,DFC的时间序列分类错误率远远小于DTW,在Adiac数据集中,DFC的错误率达到了0.31,DTW最近邻算法以及SAX-VSM的错误率都接近0.4。远远高于DFC算法,对于Adiac数据集来说,由不同种类的时间序列数据形状差别不大,因此很难判断正确,所有相对于种类的时间序列错误率偏高。对于SwedishLeaf数据同理,可以看出DFC方法错误率远远小于其他两种方法。而在数据位移和扭曲较大的数据,DFC方法也是好于传统的DTW最近邻以及SAX-VSM方法的。后面6种数据集合,主要是从不同类别数量以及不同长度方面来进行数据之间的对比的。实验数据表明DFC方法在不同时间序列长度以及不同类别数量分类错误率都是优于DTW最近邻以及SAX-VSM方法的。
实施例三:
本发明实施例还提供了一种时间序列的处理装置,该时间序列的处理装置主要用于执行本发明实施例上述内容所提供的时间序列的处理方法,以下对本发明实施例提供的时间序列的处理装置做具体介绍。
图8是根据本发明实施例的一种时间序列的处理装置的示意图,如图8所示,该时间序列的处理装置主要包括:
获取单元10,用于获取目标时间序列,其中,所述目标时间序列为游戏玩家操作游戏时生成的行为数据序列;
切分单元20,用于将所述目标时间序列切分成多个子目标时间序列;
转换单元30,用于根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合,其中,所述目标字符串集合中包括至少一个字符串;
确定单元40,用于基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量,其中,所述目标分类向量表示所述目标时间序列为所述目标分类向量所对应的时序类别的概率;
分类单元50,用于基于所述目标分类向量对所述目标时间序列进行分类,以在至少一个时序类别中确定所述目标时间序列的目标时序类别。
在本发明实施例中,首先,获取目标时间序列;然后,将目标时间序列切分成多个子目标时间序列;之后,根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合,基于目标字符串集合中的多个字符串确定每个字符串对应的目标分类向量,其中,目标分类向量表示目标时间序列为目标分类向量所对应的时序类别的概率;最后,基于目标分类向量对目标时间序列进行分类,以在至少一个时序类别中确定目标时间序列的目标时序类别。通过上述描述可知,通过将目标时间序列转换为字符集合的方式,能够保留时间序列中的关键信息,基于此,在基于该字符集合来对时间序列进行分类时,就能够提高时间序列的准确率,进而缓解了采用传统的时间序列的分类方法对时间序列进行分类时准确率较低的技术问题。
可选地,转换单元用于:获取目标字符长度和目标字符范围,其中,所述目标字符长度用于表示每个子目标时间序列所对应的字符串的字符长度,所述目标字符范围用于表示每个子目标时间序列所对应字符串的字符范围;通过SFA算法按照所述目标字符长度和所述目标字符范围,将所述每个子目标时间序列转换为字符串,得到所述多个字符串。
可选地,所述装置还用于:在将所述目标时间序列转换为目标字符串集合之前,确定所述预设滑动窗口的目标窗口长度和/或所述目标字符长度,其中,所述目标窗口长度用于对所述目标时间序列进行切分。
可选地,所述装置还用于:获取目标函数,其中,所述目标函数的自变量为关于窗口长度和字符长度的向量;采用矩形划分算法DIRECT计算使所述目标函数取最小值的目标自变量;并将所述目标自变量中所包含的窗口长度和字符长度,确定为所述目标窗口长度和所述目标字符长度。
可选地,确定单元用于:确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量;确定所述至少一个时序类别中每个时序类别所对应的概率向量,得到时序类别概率;基于所述第一概率向量和所述时序类别概率确定每个所述字符串对应的目标分类向量。
可选地,确定单元用于:获取训练数据集,其中,所述训练数据集中包含所属于所述至少一个时序类别的训练时间序列;将所述训练数据集中的每个训练时间序列转化为字符串集合,得到至少一个训练字符串集合;对所述至少一个训练字符串集合进行统计,得到所述第一概率向量。
可选地,确定单元用于:对所述至少一个训练字符串集合中的字符串进行去重处理,得到去重字符串集合;计算所述去重字符串集合中的字符串Ai在第j类训练时间序列中的出现次数;其中,i依次取1至I,I为所述去重字符串集合中字符串的数量,j依次取1至J,J为所述至少一个时序类别的数量;计算所述训练数据集中所属于所述第j类训练时间序列所包含的字符串类型的总数量,得到目标数量;基于所述目标数量和所述出现次数确定所述第一概率向量。
可选地,分类单元用于:确定所述目标分类向量中的最大向量;并将所述最大向量所对应的时序类别确定为所述目标时间序列的时序类别。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
实施例四:
参见图9,本发明实施例还提供一种电子设备100,包括:处理器90,存储器91,总线92和通信接口93,所述处理器90、通信接口93和存储器91通过总线92连接;处理器90用于执行存储器91中存储的可执行模块,例如计算机程序。
其中,存储器91可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口93(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线92可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器91用于存储程序,所述处理器90在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器90中,或者由处理器90实现。
处理器90可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器90中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器90可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器91,处理器90读取存储器91中的信息,结合其硬件完成上述方法的步骤。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种时间序列的处理方法,其特征在于,包括:
获取目标时间序列,其中,所述目标时间序列为游戏玩家操作游戏时生成的行为数据序列;
将所述目标时间序列切分成多个子目标时间序列;
根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合;
基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量,其中,所述目标分类向量表示所述目标时间序列为所述目标分类向量所对应的时序类别的概率;
基于所述目标分类向量对所述目标时间序列进行分类,以在至少一个时序类别中确定所述目标时间序列的目标时序类别;
基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量包括:
确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量;确定所述至少一个时序类别中每个时序类别所对应的概率向量,得到时序类别概率;基于所述第一概率向量和所述时序类别概率确定每个所述字符串对应的目标分类向量;
当至少一个时序类别的数量为J,目标字符串集合中字符串的数量为I,第一概率向量包括J个时序类别B J、I个字符串A I的条件概率: … />… />;时序类别概率中包括每个时序类别/>对应的概率p(/>)。
2.根据权利要求1所述的方法,其特征在于,根据所述多个子目标时间序列生成多个字符串包括:
获取目标字符长度和目标字符范围,其中,所述目标字符长度用于表示每个子目标时间序列所对应的字符串的字符长度,所述目标字符范围用于表示每个子目标时间序列所对应字符串的字符范围;
通过SFA算法按照所述目标字符长度和所述目标字符范围,将所述每个子目标时间序列转换为字符串,得到所述多个字符串。
3.根据权利要求1所述的方法,其特征在于,所述方法包括:
在将所述目标时间序列转换为目标字符串集合之前,确定预设滑动窗口的目标窗口长度和/或所述目标字符长度,其中,所述目标窗口长度用于对所述目标时间序列进行切分。
4.根据权利要求3所述的方法,其特征在于,确定所述预设滑动窗口的窗口长度和/或所述目标字符长度包括:
获取目标函数,其中,所述目标函数的自变量为关于窗口长度和字符长度的向量;
采用矩形划分算法DIRECT计算使所述目标函数取最小值的目标自变量;并将所述目标自变量中所包含的窗口长度和字符长度,确定为所述目标窗口长度和所述目标字符长度。
5.根据权利要求1所述的方法,其特征在于,确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量包括:
获取训练数据集,其中,所述训练数据集中包含所属于所述至少一个时序类别的训练时间序列;
将所述训练数据集中的每个训练时间序列转化为字符串集合,得到至少一个训练字符串集合;
对所述至少一个训练字符串集合进行统计,得到所述第一概率向量。
6.根据权利要求5所述的方法,其特征在于,对所述至少一个训练字符串集合进行统计,得到所述第一概率向量包括:
对所述至少一个训练字符串集合中的字符串进行去重处理,得到去重字符串集合;
计算所述去重字符串集合中的字符串在第j类训练时间序列中的出现次数;其中,i依次取1至I,I为所述去重字符串集合中字符串的数量,j依次取1至J,J为所述至少一个时序类别的数量;
计算所述训练数据集中所属于所述第j类训练时间序列所包含的字符串类型的总数量,得到目标数量;
基于所述目标数量和所述出现次数确定所述第一概率向量。
7.根据权利要求1所述的方法,其特征在于,基于所述目标分类向量对所述目标时间序列进行分类,得到所述目标时间序列的时序类别包括:
确定所述目标分类向量中的最大向量;并将所述最大向量所对应的时序类别确定为所述目标时间序列的时序类别。
8.一种时间序列的处理装置,其特征在于,包括:
获取单元,用于获取目标时间序列,其中,所述目标时间序列为游戏玩家操作游戏时生成的行为数据序列;
切分单元,用于将所述目标时间序列切分成多个子目标时间序列;
转换单元,用于根据所述多个子目标时间序列生成多个字符串,以形成目标字符串集合,其中,所述目标字符串集合中包括至少一个字符串;
确定单元,用于基于所述目标字符串集合中的所述多个字符串确定每个所述字符串对应的目标分类向量,其中,所述目标分类向量表示所述目标时间序列为所述目标分类向量所对应的时序类别的概率;
分类单元,用于基于所述目标分类向量对所述目标时间序列进行分类,以在至少一个时序类别中确定所述目标时间序列的目标时序类别;
所述确定单元,还用于确定在每个字符串出现的情况下各个时序类别出现的概率,得到第一概率向量;确定所述至少一个时序类别中每个时序类别所对应的概率向量,得到时序类别概率;基于所述第一概率向量和所述时序类别概率确定每个所述字符串对应的目标分类向量;
当至少一个时序类别的数量为J,目标字符串集合中字符串的数量为I,第一概率向量包括J个时序类别B J、I个字符串A I的条件概率: … />… />;时序类别概率中包括每个时序类别/>对应的概率p(/>)。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行上述权利要求1至7任一项所述的方法的步骤。
CN202010114212.8A 2020-02-24 2020-02-24 时间序列的处理方法、装置、电子设备和计算机可读介质 Active CN111291824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010114212.8A CN111291824B (zh) 2020-02-24 2020-02-24 时间序列的处理方法、装置、电子设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010114212.8A CN111291824B (zh) 2020-02-24 2020-02-24 时间序列的处理方法、装置、电子设备和计算机可读介质

Publications (2)

Publication Number Publication Date
CN111291824A CN111291824A (zh) 2020-06-16
CN111291824B true CN111291824B (zh) 2024-03-22

Family

ID=71020558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010114212.8A Active CN111291824B (zh) 2020-02-24 2020-02-24 时间序列的处理方法、装置、电子设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN111291824B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131322B (zh) * 2020-09-22 2023-10-10 腾讯科技(深圳)有限公司 时间序列分类方法及装置
CN112214533B (zh) * 2020-10-20 2024-06-14 上海船舶研究设计院(中国船舶工业集团公司第六0四研究院) 时序数据聚合方法及装置
CN117473494B (zh) * 2023-06-06 2024-06-25 兴华永恒(北京)科技有限责任公司 同源二进制文件的确定方法、装置、电子设备及存储介质
CN117113383B (zh) * 2023-10-19 2024-01-26 山东万世机械科技有限公司 一种设备本地生产数据隐私保护方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109754115A (zh) * 2018-12-04 2019-05-14 东软集团股份有限公司 数据预测的方法、装置、存储介质及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140074614A1 (en) * 2012-09-12 2014-03-13 Globys, Inc. Time series-based entity behavior classification
US11720814B2 (en) * 2017-12-29 2023-08-08 Samsung Electronics Co., Ltd. Method and system for classifying time-series data

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109754115A (zh) * 2018-12-04 2019-05-14 东软集团股份有限公司 数据预测的方法、装置、存储介质及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Patrick Schäfer.The BOSS is concerned with time series classification in the presence of noise.Data Mining and Knowledge Discovery.2014,第29卷第1505-1530页. *
Patrick Schäfer等.Fast and Accurate Time Series Classification with WEASEL.https://www2.informatik.hu-berlin.de/~schaefpa/weasel.pdf.2017,正文第1页摘要、第4-7页第3、4节部分. *

Also Published As

Publication number Publication date
CN111291824A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN111291824B (zh) 时间序列的处理方法、装置、电子设备和计算机可读介质
US11288314B2 (en) Method and apparatus for multi-dimensional content search and video identification
Zhao et al. shapeDTW: Shape dynamic time warping
US9202255B2 (en) Identifying multimedia objects based on multimedia fingerprint
JP6188976B2 (ja) 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体
Sonnleitner et al. Quad-Based Audio Fingerprinting Robust to Time and Frequency Scaling.
CN109783805B (zh) 一种网络社区用户识别方法、装置和可读存储介质
Jao et al. Music annotation and retrieval using unlabeled exemplars: correlation and sparse codes
CN111414868A (zh) 时序动作片段的确定方法、动作检测方法及装置
CN105678349B (zh) 一种视觉词汇的上下文描述子生成方法
CN116561230B (zh) 一种基于云计算的分布式存储与检索系统
CN112651424A (zh) 基于lle降维和混沌算法优化的gis绝缘缺陷识别方法及系统
CN117234029A (zh) 一种opc版图预处理方法及其修正方法和装置
Cope et al. Classifying plant leaves from their margins using dynamic time warping
CN111108516B (zh) 使用深度学习算法来评价输入数据
CN113260044A (zh) 基于双层字典学习的csi指纹定位方法、装置及设备
CN110490226A (zh) 一种识别方法及设备
WO2019127504A1 (zh) 一种相似度的度量方法、装置及存储装置
CN111291224A (zh) 视频流数据处理方法、装置、服务器及存储介质
CN115237739B (zh) 板卡运行环境的分析方法、装置、设备及可读存储介质
CN111785296B (zh) 基于重复旋律的音乐分段边界识别方法
US20240303543A1 (en) Model training method and model training apparatus
Rodrıguez Codebook-Based Near-Duplicate Video Detection
JP4215385B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Li Efficient and Effective Mining of Time Series

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant