CN116361355A - 一种基于弧度的时间序列数据的处理方法 - Google Patents
一种基于弧度的时间序列数据的处理方法 Download PDFInfo
- Publication number
- CN116361355A CN116361355A CN202310143225.1A CN202310143225A CN116361355A CN 116361355 A CN116361355 A CN 116361355A CN 202310143225 A CN202310143225 A CN 202310143225A CN 116361355 A CN116361355 A CN 116361355A
- Authority
- CN
- China
- Prior art keywords
- sequence
- time
- radian
- real
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
本申请提供了一种基于弧度的时间序列数据的处理方法,遍历计算时间序列中相邻数据变量之间的弧度值,以将实时时间序列转换为实时弧度序列、将历史时间序列转换为历史弧度序列;对实时弧度序列进行压缩,以生成实时压缩弧度序列,对历史弧度序列进行压缩,以生成历史压缩弧度序列;基于动态时间规整算法,确定出实时压缩弧度序列和历史压缩弧度序列之间的最佳路径;基于最佳路径,同时对实时压缩弧度序列和历史压缩弧度序列进行扩充,以对应地生成实时目标弧度序列和历史目标弧度序列;确定出与实时目标弧度序列匹配的至少一个历史目标弧度序列,以用于分析目标航天器的目标参数。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种基于弧度的时间序列数据的处理方法。
背景技术
航天器测控数据是地面控制系统判断航天器运行状态,保证航天器在轨可靠性和安全可靠运行的重要依据。测控数据大多随时间变化,利用数据挖掘方法对时序数据分析可捕捉测控数据中的动态特征。相似型号任务中的测控数据具有极强的相关性,利用时间序列相似性度量方法可对测控数据中的实时数据与历史数据进行对比,进而在有效检测异常的基础上对系统状态进行实时诊断,可帮助及时对航天器进行安全控制,降低故障造成的损害。
传统的欧式距离相似性度量方法要求时间序列完全匹配,无法应对历史数据与实时数据采样点与数据长度不同的问题,无法实现时间序列异步相关性比较。而目前通常使用的DTW算法,具有对时间序列偏移鲁棒性强的特点,虽可以解决上述问题,但由于该方法基于动态规整查找最优路径,时间复杂度非常高,无法满足测控数据处理的实时性要求。在不降低精度的前提下提高DTW的计算速率是目前有待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种基于弧度的时间序列数据的处理方法,以在不降低精度的前提下提高DTW的计算速率。
第一方面,本申请提供了一种基于弧度的时间序列数据的处理方法,方法包括:步骤一、分别获取目标航天器所产生的实时时间序列和历史时间序列,每个时间序列中包括多个按采集时序排列的数据变量,数据变量用于指示目标航天器执行任务时目标参数的参数值;步骤二、针对实时时间序列和历史时间序列中的每个时间序列,遍历计算时间序列中相邻数据变量之间的弧度值,以将实时时间序列转换为实时弧度序列、将历史时间序列转换为历史弧度序列;步骤三、对实时弧度序列进行压缩,以生成实时压缩弧度序列,对历史弧度序列进行压缩,以生成历史压缩弧度序列;步骤四、基于动态时间规整算法,确定出实时压缩弧度序列和历史压缩弧度序列之间的最佳路径,最佳路径用于指示实时压缩弧度序列和历史压缩弧度序列中的各时刻之间的最佳匹配关系;步骤五、基于最佳路径,同时对实时压缩弧度序列和历史压缩弧度序列进行扩充,以对应地生成实时目标弧度序列和历史目标弧度序列,实时目标弧度序列与历史目标弧度序列的长度相等;步骤六、计算实时目标弧度序列与多个历史目标弧度序列之间的相似度,确定出与实时目标弧度序列匹配的至少一个历史目标弧度序列,以用于分析目标航天器的目标参数。
优选的,在步骤三中,通过以下方式对每个弧度序列进行压缩:按采集时刻依次计算相邻弧度值之间的差值,并对差值进行累加求和;当累计弧度差大于预设值后,记录最近累加的差值所对应时刻及其对应弧度值,并清空当前的累计弧度差,从下一个差值开始重新进行累加求和,直到所有差值都遍历完毕;记录下时间序列中最后的时刻及其对应的弧度值,将记录的所有时刻及其对应的弧度值,作为对应的压缩弧度序列。
优选的,在步骤五中,通过以下方式进行扩充,以生成实时目标弧度序列和历史目标弧度序列:根据最佳路径中实时压缩弧度序列和历史压缩弧度序列各自对应的采集时刻,分别构建出实时时刻序列和历史时刻序列;同时遍历实时时刻序列和历史时刻序列,针对实时时刻序列中两个相邻的第一采集时刻,以及相同顺序上历史时刻序列中对应的两个相邻的第二采集时刻,确定是否满足扩充条件。若满足扩充条件,则在两个相邻的第一采集时刻以及两个相邻的第二采集时刻之间同时填充数量相等的缺失时刻;针对实时时刻序列和历史时刻序列中的每个时刻,基于其对应的实时弧度序列或历史弧度序列,确定出对应的弧度值并关联,以生成实时目标弧度序列和历史目标弧度序列。
优选的,通过以下方式确定是否满足扩充条件:确定两个相邻的第一采集时刻之间的差值的大小是否大于1,以及确定两个相邻的第二采集时刻之间的差值是否大于1;若确定其中的至少一个差值大于1,则确定满足扩充条件;若确定所有差值都不大于1,则确定不满足扩充条件。
优选的,当确定满足扩充条件后,通过以下方式确定缺失时刻的数量:比较两个相邻的第一采集时刻之间的差值与两个相邻的第二采集时刻之间的差值之间的大小;若两个相邻的第一采集时刻之间的差值大于两个相邻的第二采集时刻之间的差值,则将两个相邻的第一采集时刻之间的差值减1作为缺失时刻的数量,否则,将两个相邻的第二采集时刻之间的差值减1作为缺失时刻的数量。
优选的,当满足扩充条件后,通过以下方式填充缺失时刻:将两个相邻的第一采集时刻和两个相邻的第二采集时刻中差值较大的两个相邻的采集时刻,作为第一目标采集时刻对,另外两个相邻的采集时刻作为第二目标采集时刻对,针对第一目标采集时刻对,以采集时刻递增的方式填充缺失时刻;针对第二目标采集时刻对,确定该第二目标采集时刻对中两个采集时刻之间的差值是否小于第一目标采集时刻对中两个采集时刻之间的差值,若是,则先以采集时刻递增的方式填充预设缺失时刻,再以复制的方式填充剩余缺失时刻,若否,则以采集时刻递增的方式完成所有缺失时刻的填充。
优选的,在步骤二中,针对每个时间序列,通过以下方式计算出该时间序列中的相邻数据变量之间的弧度值;分别确定出该时间序列中时刻相邻的第一数据变量和第二数据变量,其中第二数据变量所对应的时刻位于第一数据变量所对应的时刻之后;计算第二数据变量与第一数据变量之间的差值;计算差值所对应的反正切函数的值,作为第二数据变量与第一数据变量之间的弧度值。
第二方面,本申请提供了一种基于弧度的时间序列数据的处理装置,装置包括:
获取模块,用于分别获取目标航天器所产生的实时时间序列和历史时间序列,每个时间序列中包括多个按采集时序排列的数据变量,所述数据变量用于指示目标航天器执行任务时目标参数的参数值;
转换模块,用于针对实时时间序列和历史时间序列中的每个时间序列,遍历计算时间序列中相邻数据变量之间的弧度值,以将实时时间序列转换为实时弧度序列、历史时间序列转换为历史弧度序列;
压缩模块,用于对实时弧度序列进行压缩,以生成实时压缩弧度序列,及对历史弧度序列进行压缩,以生成历史压缩弧度序列;
匹配模块,用于基于动态时间规整算法,确定出实时压缩弧度序列和历史压缩弧度序列之间的最佳路径,所述最佳路径用于指示所述实时压缩弧度序列和所述历史压缩弧度序列中的各时刻之间的最佳匹配关系;
扩充模块,用于基于所述最佳路径,同时对实时压缩弧度序列和历史压缩弧度序列进行扩充,以对应地生成实时目标弧度序列和历史目标弧度序列,所述实时目标弧度序列与所述历史目标弧度序列的长度相等;
输出模块,用于计算所述实时目标弧度序列与多个所述历史目标弧度序列之间的相似度,确定出与所述实时目标弧度序列匹配的至少一个历史目标弧度序列,以用于分析目标航天器的目标参数。
第三方面,本申请还提供一种电子设备,包括:处理器、存储器和总线,存储器存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储器之间通过总线通信,机器可读指令被处理器执行时执行如上所述的基于弧度的时间序列数据的处理方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上所述的基于弧度的时间序列数据的处理方法的步骤。
本申请提供的基于弧度的时间序列数据的处理,通过将原始数据转化为更能体现数据特征的弧度时序数据,利用累计弧度差对时间序列进行压缩,缩小数据维度,在保证度量准确性的前提下大幅降低了后续运算时间,减少了对系统资源的消耗,提升了相似性度量的效率。接着利用时间动态规整算法为降维后的时序数据寻找最优匹配路径,并提出一种改进的时刻对齐方法,根据该路径补齐压缩序列缺失时刻,从而使得压缩序列长度对等,进行快速且高效的弧度距离运算。同时,由于利用动态时间规整寻求到的路径突破了现实时间限制,相较原来序列,基于该路径补齐得到的序列匹配关系更为合理,能实现异步度量,解决了由于时间序列拉伸偏移造成的度量结果不够精准的问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种基于弧度的时间序列数据的处理方法的流程图;
图2为本申请实施例所提供的一种计算弧度值的步骤的流程图;
图3为本申请实施例所提供的一种标定软件刷新的流程图;
图4为本申请实施例所提供的一种基于弧度的时间序列数据的处理装置的结构示意图;
图5为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于航天发射测控数据挖掘中对测控时序数据之间的相似性的度量。
为解决传统欧式距离不适合用于不等长时序数据处理、无法实现异步度量,及传统DTW算法运算速度过慢,不适合进行实时相似度度量的问题,本申请中提出一种基于弧度DTW距离的时间序列相似性度量方法。
请参阅图1,图1为本申请实施例所提供的一种基于弧度的时间序列数据的处理方法的流程图,图3为本申请实施例所提供的一种标定软件刷新的流程图。所如图1中所示,本申请实施例提供的基于弧度的时间序列数据的处理方法,包括:
S101、分别获取目标航天器所产生的实时时间序列和历史时间序列,每个时间序列中包括多个按采集时序排列的数据变量,数据变量用于指示目标航天器执行任务时目标参数的参数值。
该步骤中,历史时间序列为目标航天器已经执行过的目标测试任务中,所产生的典型遥测数据。该部分数据被保存到历史数据库中,可供直接调取。而实时时间序列则来自于实时的遥测数据,为目标航天器执行相同的目标测试任务时所产生的。在实际的应用场景中,历史时间序列的数据数量通常远大于实时时间序列的数据数量。具体的,通过以下方式进行时间序列的提取:
根据遥测数据周期特性对遥测历史数据或遥测实时数据进行分段,得到数据遍历及时刻表示的时间序列集合S={S1,S2,S3,S4,…,Sn},其中,n为分段得到的数据条数,Si={(s1,i,t1,i),(s2,i,t2,i),(s3,i,t3,i),…,(sj,i,tj,i)},其中,s为数据变量,t为时刻,i=1,2,3,…,n,j为时刻的长度。
S102、针对实时时间序列和历史时间序列中的每个时间序列,遍历计算时间序列中相邻数据变量之间的弧度值,以将实时时间序列转换为实时弧度序列、将历史时间序列转换为历史弧度序列。
该步骤中,无论是实时时间序列还是历史时间序列,需要计算相邻两个数据变量之间的弧度值。如图2所示,图2为申请实施例所提供的一种计算弧度值的步骤的流程图。具体的,通过以下方式计算出该时间序列中的相邻数据变量之间的弧度值;
S1020、分别确定出该时间序列中时刻相邻的第一数据变量和第二数据变量,其中第二数据变量所对应的时刻位于第一数据变量所对应的时刻之后。
S1022、计算第二数据变量与第一数据变量之间的差值。
S1023、计算差值所对应的反正切函数的值,作为第二数据变量与第一数据变量之间的弧度值。
这里以实时时间序列为例,实时时间序列
首先,对x1,1=100、x2,1=80、x3,1=100、x4,1=90、x5,1=95进行归一化,归一化后得到x1,1=1、x2,1=0.80、x3,1=1、x4,1=0.90、x5,1=0.95。接着计算x2,1=0.80与x1,1=1之间的弧度值a1,1,计算x3,1与x2,1之间的弧度值a2,1,依次类推。
其中,通过以下公式计算弧度值:
ai,j-1=arctan(xi,j-xi,j-1),i∈[1,n-1]。
S103、对实时弧度序列进行压缩,以生成实时压缩弧度序列,对历史弧度序列进行压缩,以生成历史压缩弧度序列。
其中,通过以下方式对该时间序列进行压缩:
按采集时刻依次计算相邻弧度值之间的差值,并对差值进行累加求和。当累计弧度差大于预设值后,记录最近累加的差值所对应时刻及其对应弧度值,并清空当前的累计弧度差,从下一个差值开始重新进行累加求和,直到所有差值都遍历完毕。记录下时间序列中最后的时刻及其对应的弧度值,将记录的所有时刻及其对应的弧度值,作为对应的压缩弧度序列。对于任意一个实时时间序列Xi或历史时间序列Yk,都可以得到以弧度值表示的序列集合Ai或Ak。示例性的,上述实时时间序列X1则可以形成对应的第三目标时间序列表示为A1=={(a1,1,t1,1),(a2,1,t2,1),(a3,1,t3,1),(a4,1,t4,1)}。
按时序依次计算相邻弧度之间的差值。
以A1为例,分别计算a′1=a2,1-a1,1,a′2=a3,1-a2,1,a′3=a4,1-a3,1,a′4=a5,1-a4,1。
当累计弧度差值超过预设值后,记录最后一个累加的差值所对应时刻及其对应弧度值,并清空当前的累计弧度差值,基于下一个差值开始重新进行累加求和,直到所有差值都遍历完毕;记录下时间序列最后的时刻及弧度值,所有的记录共同组成一个经过压缩处理的新时间序列。
以A1为例,对a′i进行累加求和,每加一次,则将累计弧度差与预设好的阈值比较大小。如当a′1+a′2大于预设值时,则记录下a3,1对应的时刻t3,1,并从a′3开始重新累加求和,当a′3大于预设值时,则记录下a4,1对应的时刻t4,1,以此类推。最后获得到压缩后的弧度序列A′1={(a1,1,t1,1),(a3,1,t3,1),(a4,1,t4,1),(a5,1,t5,1)}。
步骤S102后,得压缩后的实时弧度序列可以表示为A′={A′1,A′2,A′3,A′4,...,A′n},压缩后的历史弧度序列可以表示为B′={B′1,B′2,B′3,B′4,...,B′m}。
在步骤S103中,对于每个A′n和一个B′m,通过DTW(Dynamic Time Warping,动态时间规整)算法,计算出两个时间序列之间的最佳路径。基于DTW算法计算最佳路径的步骤,以A′1={(a1,1,t1,1),(a3,1,t3,1),(a4,1,t4,1),(a5,1,t5,1)},B′1={(b1,1,t1,1),(b3,1,t3,1),(b5,1,t5,1)}为例,分别计算A′1中每个数据变量ai,1与B′1中每个数据变量bk,1之间的欧氏距离。进而获得所有的对齐路径P={P1,P2,P3,P4,......,Pl},其中l为对齐路径的长度,max(i+k)≤l≤i+k+1,Pl=(ti,1,tk,1)。这里的路径中每个坐标种的一个来自于A′1中的时刻,每个坐标中的另一个来自于B′1中的时刻。这里的最佳路径为使两序列间累计距离值最小的路径,可以表示为:
这里基于DTW计算出最佳路径的步骤在现有技术中已经有很多介绍,不再赘述。
S104、基于动态时间规整算法,确定出实时压缩弧度序列和历史压缩弧度序列之间的最佳路径,最佳路径用于指示实时压缩弧度序列和历史压缩弧度序列中的各时刻之间的最佳匹配关系。
S105、基于最佳路径,同时对实时压缩弧度序列和历史压缩弧度序列进行扩充,以对应地生成实时目标弧度序列和历史目标弧度序列,实时目标弧度序列与历史目标弧度序列的长度相等。
具体的,最佳路径包括多个坐标点,每个坐标点的横坐标为实时时间序列中的一个第一采集时刻,每个坐标点的纵坐标为历史时间序列中的一个第二采集时刻,通过以下方式进行扩充,以生成实时目标时间序列和历史目标时间序列:
(一)根据最佳路径的多个坐标点,确定出所有第一采集时刻,并按路径顺序排列,以及确定出所有第二采集时刻,并按路径顺序排列。
这里需要分别将对齐路径中分属各自序列的时刻取出,取出的两个序列长度一致,且组成元素两两对齐。
示例性的,设基于DTW算计得到的最优路径为(1,1),(1,2),(2,3),(3,3),(4,4),(5,5)。分别建立序列如下表1:
1 | 1 | 2 | 3 | 4 | 5 |
1 | 2 | 3 | 3 | 4 | 5 |
(二)通过以下方式进行扩充:
同时遍历实时时刻序列和历史时刻序列,针对实时时刻序列中两个相邻的第一采集时刻,以及相同顺序上历史时刻序列中对应的两个相邻的第二采集时刻,首先确定是否满足扩充条件;若满足扩充条件,则在两个相邻的第一采集时刻以及两个相邻的第二采集时刻之间同时填充数量相等的缺失时刻。根据该两个相邻的第一采集时刻之间的差值,以及该相邻的两个第二采集时刻之间的差值,确定是否满足扩充条件。若确定满足扩充条件,则在该两个相邻的第一采集时刻之间以及两个相邻的第二采集时刻之间同时填充数量相等的缺失时刻;针对实时时刻序列和历史时刻序列中的每个时刻,基于其对应的实时弧度序列或历史弧度序列,确定出该时刻对应的弧度值并关联,以生成实时目标弧度序列和历史目标弧度序列。
具体的,通过以下方式确定是否满足扩充条件:
确定两个相邻的第一采集时刻之间的差值的大小是否大于1,以及确定两个相邻的第二采集时刻之间的差值是否大于1;
若确定其中的至少一个差值大于1,则确定满足扩充条件;
若确定所有差值都不大于1,则确定不满足扩充条件。当确定满足扩充条件后,通过以下方式确定缺失时刻的数量:比较两个相邻的第一采集时刻之间的差值与两个相邻的第二采集时刻之间的差值之间的大小;若两个相邻的第一采集时刻之间的差值大于两个相邻的第二采集时刻之间的差值,则将两个相邻的第一采集时刻之间的差值减1作为缺失时刻的数量。
以上表中的两行序列为例,表中的数字表示的是时刻在压缩后的集合中的标号,转换为对应的时刻应为下表2:
1 | 1 | 5 | 6 | 8 | 9 |
1 | 4 | 5 | 5 | 7 | 8 |
上述表2可以对应于转换为
此时每个序列都不是连续的,为了提高对原始信息的利用率以保证计算的精确度,需要进行扩充。
表2中的前两列,其中第一行中的1-1=0(0≤1),第二行中的4-1=3(3>1),则需要在第二行的4和1之间插入缺失时刻2和3,同时在第一行的1和1之间填充1,此时获得下表3:
1 | 1 | 1 | 1 | 5 | 6 | 8 | 9 |
1 | 2 | 3 | 4 | 5 | 5 | 7 | 8 |
原始的第三列和第二列,即表3中的第五列和第四列。按照同样的填充方法,可以获得下表4:
1 | 1 | 1 | 1 | 2 | 3 | 4 | 5 | 6 | 8 | 9 |
1 | 2 | 3 | 4 | 4 | 4 | 4 | 5 | 5 | 7 | 8 |
依次类推,可以获得下表5:
1 | 1 | 1 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1 | 2 | 3 | 4 | 4 | 4 | 4 | 5 | 5 | 6 | 7 | 8 |
根据上述表5可以对应的获得
这里的A″1即为扩充后的实时目标弧度序列,B″1即为扩充后的历史目标弧度序列,二者的二元组数量是对齐的。
S106、计算实时目标弧度序列与多个历史目标弧度序列之间的相似度,确定出与实时目标弧度序列匹配的至少一个历史目标弧度序列,以用于分析目标航天器的目标参数。
这里的实时目标弧度序列与历史目标弧度序列之间的相似度,可以通过计算序列之间的欧式距离,获得对应的欧式距离值。针对每个实时目标弧度序列,基于该实时目标弧度序列与每个历史目标弧度序列之间的欧式距离值按照从小到大进行排序,其中的前一个或前几个历史目标弧度序列,可以作为与该实时目标弧度序列最相似的历史目标弧度序列。
例如,针对A″1,与A″1之间的DTW距离从小到大排列依次为B″1、B″9、B″5等等。
本申请实施例提供的数据的处理方法,首先将原始数据转化为更能体现数据特征的弧度时序数据;然后利用累计弧度差对时间序列进行压缩,缩小数据维度,在保证度量准确性的前提下大幅降低了后续运算时间,减少了对系统资源的消耗,提升了相似性度量的效率。接着利用时间动态规整算法为降维后的时序数据寻找最优匹配路径,并提出一种改进的时刻对齐方法,根据该路径补齐压缩序列缺失时刻,从而使得压缩序列长度对等,进行快速且高效的弧度距离运算。同时,由于利用动态时间规整寻求到的路径突破了现实时间限制,相较原来序列,基于该路径补齐得到的序列匹配关系更为合理,能实现异步度量,解决了由于时间序列拉伸偏移造成的度量结果不够精准的问题。
如图3所示,本申请的一个实施例中,可以通过标定程序执行上述数据的处理方法,参照步骤S101至S106,并将挑选出的序列进行关联或标记,以帮助对实时测控数据进行分析。
基于同一发明构思,本申请实施例中还提供了与基于弧度的时间序列数据的处理对应的基于弧度的时间序列数据的处理装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述基于弧度的时间序列数据的处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图4,图4为本申请实施例所提供的一种基于弧度的时间序列数据的处理装置的结构示意图。如图4中所示,处理装置400包括:
获取模块410,用于分别获取目标航天器所产生的实时时间序列和历史时间序列,每个时间序列中包括多个按采集时序排列的数据变量,数据变量用于指示目标航天器执行任务时目标参数的参数值;
转换模块420,用于针对实时时间序列和历史时间序列中的每个时间序列,遍历计算时间序列中相邻数据变量之间的弧度值,以将实时时间序列转换为实时弧度序列、将历史时间序列转换为历史弧度序列;
压缩模块430,用于对实时弧度序列进行压缩,以生成实时压缩弧度序列,对历史弧度序列进行压缩,以生成历史压缩弧度序列;
匹配模块440,用于基于动态时间规整算法,确定出实时压缩弧度序列和历史压缩弧度序列之间的最佳路径,最佳路径用于指示实时压缩弧度序列和历史压缩弧度序列中的各时刻之间的最佳匹配关系;
扩充模块450,用于基于最佳路径,同时对实时压缩弧度序列和历史压缩弧度序列进行扩充,以对应的生成实时目标弧度序列和历史目标弧度序列,实时目标弧度序列与历史目标弧度序列的长度相等;
输出模块460,用于计算实时目标弧度序列与多个历史目标弧度序列之间的相似度,确定出与实时目标弧度序列匹配的至少一个历史目标弧度序列,以用于分析目标航天器的目标参数。
在一优选实施例中,压缩模块430通过以下方式对每个弧度序列进行压缩:按采集时刻依次计算相邻弧度值之间的差值,并对差值进行累加求和;当累计弧度差大于预设值后,记录最近累加的差值所对应时刻及其对应弧度值,并清空当前的累计弧度差,从下一个差值开始重新进行累加求和,直到所有差值都遍历完毕;记录下时间序列中最后的时刻及其对应的弧度值,将记录的所有时刻及其对应的弧度值,作为对应的压缩弧度序列。
在一优选实施例中,扩充模块450通过以下方式进行扩充,以生成实时目标弧度序列和历史目标弧度序列:
根据最佳路径中实时压缩弧度序列和历史压缩弧度序列各自对应的采集时刻,分别构建出实时时刻序列和历史时刻序列;同时遍历实时时刻序列和历史时刻序列,针对实时时刻序列中两个相邻的第一采集时刻,以及相同顺序上历史时刻序列中对应的两个相邻的第二采集时刻,首先确定是否满足扩充条件。若满足扩充条件,则在两个相邻的第一采集时刻以及两个相邻的第二采集时刻之间同时填充数量相等的缺失时刻;针对实时时刻序列和历史时刻序列中的每个时刻,基于实时弧度序列或历史弧度序列,确定出该时刻对应的弧度值并关联,以生成实时目标弧度序列和历史目标弧度序列。
在一优选实施例中,扩充模块450通过以下方式确定是否满足扩充条件:确定两个相邻的第一采集时刻之间的差值的大小是否大于1,以及确定两个相邻的第二采集时刻之间的差值是否大于1;若确定其中的至少一个差值大于1,则确定满足扩充条件;若确定所有差值都不大于1,则确定不满足扩充条件。
在一优选实施例中,扩充模块450当确定满足扩充条件后,通过以下方式确定缺失时刻的数量:比较两个相邻的第一采集时刻之间的差值与两个相邻的第二采集时刻之间的差值之间的大小;若两个相邻的第一采集时刻之间的差值大于两个相邻的第二采集时刻之间的差值,则将两个相邻的第一采集时刻之间的差值减1作为缺失时刻的数量,否则,将两个相邻的第二采集时刻之间的差值减1作为缺失时刻的数量。
在一优选实施例中,当满足扩充条件后,扩充模块450通过以下方式填充缺失时刻:将两个相邻的第一采集时刻和两个相邻的第二采集时刻中差值较大的两个相邻的采集时刻,作为第一目标采集时刻对,另外两个相邻的采集时刻作为第二目标采集时刻对,针对第一目标采集时刻对,以采集时刻递增的方式填充缺失时刻;针对第二目标采集时刻对,确定该第二目标采集时刻对中两个采集时刻之间的差值是否小于第一目标采集时刻对中两个采集时刻之间的差值,若是,则先以采集时刻递增的方式填充预设缺失时刻,再以复制的方式填充剩余缺失时刻,若否,则以采集时刻递增的方式完成所有缺失时刻的填充。
在一优选实施例中,针对每个时间序列,转换模块420通过以下方式计算出该时间序列中的相邻数据变量之间的弧度值;分别确定出该时间序列中时刻相邻的第一数据变量和第二数据变量,其中第二数据变量所对应的时刻位于第一数据变量所对应的时刻之后;计算第二数据变量与第一数据变量之间的差值;计算差值所对应的反正切函数的值,作为第二数据变量与第一数据变量之间的弧度值。
请参阅图5,图5为本申请实施例所提供的一种电子设备的结构示意图。如图5中所示,所述电子设备500包括处理器510、存储器520和总线530。
所述存储器520存储有所述处理器510可执行的机器可读指令,当电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,所述机器可读指令被所述处理器510执行时,可以执行如上述图1所示方法实施例中的基于弧度的时间序列数据的处理方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的基于弧度的时间序列数据的处理方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于弧度的时间序列数据的处理方法,其特征在于,所述方法包括:
步骤一、分别获取目标航天器所产生的实时时间序列和历史时间序列,每个时间序列中包括多个按采集时序排列的数据变量,所述数据变量用于指示目标航天器执行任务时目标参数的参数值;
步骤二、针对实时时间序列和历史时间序列中的每个时间序列,遍历计算时间序列中相邻数据变量之间的弧度值,以将实时时间序列转换为实时弧度序列、历史时间序列转换为历史弧度序列;
步骤三、对实时弧度序列进行压缩,以生成实时压缩弧度序列,对历史弧度序列进行压缩,以生成历史压缩弧度序列;
步骤四、基于动态时间规整算法,确定出实时压缩弧度序列和历史压缩弧度序列之间的最佳路径,所述最佳路径用于指示所述实时压缩弧度序列和所述历史压缩弧度序列中的各时刻之间的最佳匹配关系;
步骤五、基于步骤四所述最佳路径,同时对实时压缩弧度序列和历史压缩弧度序列进行扩充,以对应地生成实时目标弧度序列和历史目标弧度序列,所述实时目标弧度序列与所述历史目标弧度序列的长度相等;
步骤六、计算所述实时目标弧度序列与多个所述历史目标弧度序列之间的相似度,确定出与所述实时目标弧度序列匹配的至少一个历史目标弧度序列,以用于分析目标航天器的目标参数。
2.根据权利要求1所述的方法,其特征在于,在步骤三中,通过以下方式对每个弧度序列进行压缩:
按采集时刻依次计算相邻弧度值之间的差值,并对差值进行累加求和;
当累计弧度差大于预设值后,记录最近累加的差值所对应时刻及其对应弧度值,并清空当前的累计弧度差,从下一个差值开始重新进行累加求和,直到所有差值都遍历完毕;
记录下时间序列中最后的时刻及其对应的弧度值,将记录的所有时刻及其对应的弧度值,作为对应的压缩弧度序列。
3.根据权利要求1所述的方法,其特征在于,在步骤五中,通过以下方式进行扩充,以生成实时目标弧度序列和历史目标弧度序列:
根据所述最佳路径中实时压缩弧度序列和历史压缩弧度序列各自对应的采集时刻,分别构建出实时时刻序列和历史时刻序列;
同时遍历实时时刻序列和历史时刻序列,针对实时时刻序列中两个相邻的第一采集时刻,以及相同顺序上历史时刻序列中对应的两个相邻的第二采集时刻,确定是否满足扩充条件;若满足扩充条件,则在两个相邻的第一采集时刻以及两个相邻的第二采集时刻之间同时填充数量相等的缺失时刻;针对实时时刻序列和历史时刻序列中的每个时刻,基于其对应的实时弧度序列或历史弧度序列,确定出该时刻对应的弧度值并关联,以生成实时目标弧度序列和历史目标弧度序列。
4.根据权利要求3所述的方法,其特征在于,通过以下方式确定是否满足扩充条件:
确定两个相邻的第一采集时刻之间的差值的大小是否大于1,以及确定两个相邻的第二采集时刻之间的差值是否大于1;
若确定其中的至少一个差值大于1,则确定满足扩充条件;
若确定所有差值都不大于1,则确定不满足扩充条件。
5.根据权利要求3所述的方法,其特征在于,当确定满足扩充条件后,通过以下方式确定所述缺失时刻的数量:
比较两个相邻的第一采集时刻之间的差值与两个相邻的第二采集时刻之间的差值之间的大小;
若两个相邻的第一采集时刻之间的差值大于两个相邻的第二采集时刻之间的差值,则将两个相邻的第一采集时刻之间的差值减1作为所述缺失时刻的数量,否则,将两个相邻的第二采集时刻之间的差值减1作为缺失时刻的数量。
6.根据权利要求3所述的方法,其特征在于,当满足扩充条件后,通过以下方式填充所述缺失时刻:
将两个相邻的第一采集时刻和两个相邻的第二采集时刻中差值较大的两个相邻的采集时刻,作为第一目标采集时刻对,另外两个相邻的采集时刻作为第二目标采集时刻对;
针对第一目标采集时刻对,以采集时刻递增的方式填充缺失时刻;
针对第二目标采集时刻对,确定该第二目标采集时刻对中两个采集时刻之间的差值是否小于第一目标采集时刻对中两个采集时刻之间的差值,若是,则先以采集时刻递增的方式填充预设缺失时刻,再以复制的方式填充剩余缺失时刻,若否,则以采集时刻递增的方式完成所有缺失时刻的填充。
7.根据权利要求1所述的方法,其特征在于,在步骤二中,针对每个时间序列,通过以下方式计算出该时间序列中的相邻数据变量之间的弧度值;
分别确定出该时间序列中时刻相邻的第一数据变量和第二数据变量,其中第二数据变量所对应的时刻位于第一数据变量所对应的时刻之后;
计算所述第二数据变量与所述第一数据变量之间的差值;
计算所述差值所对应的反正切函数的值,作为第二数据变量与第一数据变量之间的弧度值。
8.一种基于弧度的时间序列数据的处理装置,其特征在于,所述装置包括:
获取模块,用于分别获取目标航天器所产生的实时时间序列和历史时间序列,每个时间序列中包括多个按采集时序排列的数据变量,所述数据变量用于指示目标航天器执行任务时目标参数的参数值;
转换模块,用于针对实时时间序列和历史时间序列中的每个时间序列,遍历计算时间序列中相邻数据变量之间的弧度值,以将实时时间序列转换为实时弧度序列、历史时间序列转换为历史弧度序列;
压缩模块,用于对实时弧度序列进行压缩,以生成实时压缩弧度序列,及对历史弧度序列进行压缩,以生成历史压缩弧度序列;
匹配模块,用于基于动态时间规整算法,确定出实时压缩弧度序列和历史压缩弧度序列之间的最佳路径,所述最佳路径用于指示所述实时压缩弧度序列和所述历史压缩弧度序列中的各时刻之间的最佳匹配关系;
扩充模块,用于基于所述最佳路径,同时对实时压缩弧度序列和历史压缩弧度序列进行扩充,以对应地生成实时目标弧度序列和历史目标弧度序列,所述实时目标弧度序列与所述历史目标弧度序列的长度相等;
输出模块,用于计算所述实时目标弧度序列与多个所述历史目标弧度序列之间的相似度,确定出与所述实时目标弧度序列匹配的至少一个历史目标弧度序列,以用于分析目标航天器的目标参数。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一所述基于弧度的时间序列数据的处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述基于弧度的时间序列数据的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310143225.1A CN116361355A (zh) | 2023-02-08 | 2023-02-08 | 一种基于弧度的时间序列数据的处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310143225.1A CN116361355A (zh) | 2023-02-08 | 2023-02-08 | 一种基于弧度的时间序列数据的处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116361355A true CN116361355A (zh) | 2023-06-30 |
Family
ID=86931202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310143225.1A Pending CN116361355A (zh) | 2023-02-08 | 2023-02-08 | 一种基于弧度的时间序列数据的处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116361355A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390379A (zh) * | 2023-12-11 | 2024-01-12 | 博睿康医疗科技(上海)有限公司 | 在线信号测量装置、信号特征的置信度测量装置 |
-
2023
- 2023-02-08 CN CN202310143225.1A patent/CN116361355A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390379A (zh) * | 2023-12-11 | 2024-01-12 | 博睿康医疗科技(上海)有限公司 | 在线信号测量装置、信号特征的置信度测量装置 |
CN117390379B (zh) * | 2023-12-11 | 2024-03-19 | 博睿康医疗科技(上海)有限公司 | 在线信号测量装置、信号特征的置信度测量装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108595539A (zh) | 一种基于大数据的行迹相似对象识别方法与系统 | |
JP6183450B2 (ja) | システム分析装置、及び、システム分析方法 | |
US9865101B2 (en) | Methods for detecting one or more aircraft anomalies and devices thereof | |
CN116361355A (zh) | 一种基于弧度的时间序列数据的处理方法 | |
CN108932321B (zh) | 人脸图像检索方法、装置、计算机设备及存储介质 | |
CN114915478B (zh) | 基于多代理的分布式关联分析的智慧园区工控系统网络攻击场景识别方法、系统及存储介质 | |
CN105607631A (zh) | 间歇过程弱故障模型控制限建立方法及弱故障监测方法 | |
JPWO2014132611A1 (ja) | システム分析装置、及び、システム分析方法 | |
US11972334B2 (en) | Method and apparatus for generating a combined isolation forest model for detecting anomalies in data | |
CN115577248A (zh) | 风力发电机组的故障诊断系统及其方法 | |
CN109189840B (zh) | 一种流式在线日志解析方法 | |
Ye et al. | Scaling up discrete distribution clustering using ADMM | |
CN105281889A (zh) | 一种基于侧信道泄漏的算法还原方法和系统 | |
CN110990383A (zh) | 一种基于工业大数据集的相似度计算方法 | |
CN114120592B (zh) | 用于故障报警的方法及装置、电子设备、存储介质 | |
CN114019946A (zh) | 工控终端的监控数据处理方法及装置 | |
CN113420036A (zh) | 一种电网监控系统内存库关系库一致性校验方法 | |
Clark et al. | Perspective correction for improved visual registration using natural features. | |
Cao et al. | A Fast Randomized Algorithm for Finding the Maximal Common Subsequences | |
KR102481497B1 (ko) | 합성곱 신경망 모델을 이용한 기계 결함 감지 방법, 이를 수행하기 위한 기록 매체 및 장치 | |
Ren et al. | Parallel set determination and k-means clustering for data mining on telecommunication networks | |
CN115250231B (zh) | 应用配置方法及装置 | |
CN116150233B (zh) | 有源配电台区运行状态数据的最小映射处理方法及系统 | |
Arrigoni et al. | Viewing Graph Solvability in Practice | |
Kang et al. | Fine-grained pattern matching over streaming time series |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |