CN114860986A - 一种计算机非结构化数据存储方法 - Google Patents
一种计算机非结构化数据存储方法 Download PDFInfo
- Publication number
- CN114860986A CN114860986A CN202210785170.XA CN202210785170A CN114860986A CN 114860986 A CN114860986 A CN 114860986A CN 202210785170 A CN202210785170 A CN 202210785170A CN 114860986 A CN114860986 A CN 114860986A
- Authority
- CN
- China
- Prior art keywords
- time sequence
- data
- segment
- time
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013500 data storage Methods 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 367
- 239000013598 vector Substances 0.000 claims abstract description 247
- 230000008859 change Effects 0.000 claims abstract description 168
- 238000007906 compression Methods 0.000 claims abstract description 35
- 230000006835 compression Effects 0.000 claims abstract description 35
- 230000008569 process Effects 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 12
- 239000006185 dispersion Substances 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 description 4
- 239000002699 waste material Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及电数字数据处理技术领域,具体涉及一种计算机非结构化数据存储方法,包括:根据预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点和各个匹配角点,确定待存储时序矩阵之间的相似程度,得到多个标记时序矩阵数据段,所述多个标记时序矩阵数据段满足相邻时序矩阵相似条件;根据待存储时序矩阵中的各个匹配角点的坐标信息,确定各个时序矢量变化曲线及其对应的拟合直线,进而确定每个标记时序矩阵数据段内的各关联细分段;对预设时段内的待存储时序矩阵数据进行压缩存储处理,从而得到压缩存储后的待存储时序矩阵数据。本发明利用电数字数据处理技术对待存储时序矩阵进行处理,有效提高了非结构化数据存储的压缩率。
Description
技术领域
本发明涉及电数字数据处理技术领域,具体涉及一种计算机非结构化数据存储方法。
背景技术
信息社会化时代,各行各业在处理相关业务的过程中,都累积了海量的数据信息,随着IT应用的普及和发展,传统的纸质资料存储方式在不断缩减,更多的采用电子信息的存储方式存放在计算机中。对于非结构化数据存储来讲,类似于图片、图像以及视频等等,非结构化数据格式多样的特点使得不便于使用二维表结构来实现数据压缩存储的表达。
传统非结构化数据存储方法是将获取到的非结构化数据进行分级分类进行存储,但非结构化数据存在大量冗余信息,对该类数据信息进行存储时会造成大量存储空间的浪费,进而导致数据存储压缩效率低。
发明内容
为了解决上述现有非结构化数据存储的压缩率低的问题,本发明的目的在于提供一种计算机非结构化数据存储方法。
本发明提供了一种计算机非结构化数据存储方法,包括以下步骤:
获取预设时段内的待存储时序矩阵数据,并根据该预设时段内的待存储时序矩阵数据,确定预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点和各个匹配角点;
根据预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点的角点数目和各个匹配角点的匹配角点对数,确定任意两个相邻时刻的待存储时序矩阵之间的相似程度,进而确定多个标记时序矩阵数据段,所述多个标记时序矩阵数据段均满足相邻时序矩阵相似条件;
根据每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的坐标信息,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线,进而确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线对应的拟合直线;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各数据点的坐标信息以及各个时序矢量变化曲线对应的拟合直线,确定每个标记时序矩阵数据段内的各关联细分段;
根据每个标记时序矩阵数据段内的各关联细分段,对预设时段内的待存储时序矩阵数据进行压缩存储处理,从而得到压缩存储后的预设时段内的待存储时序矩阵数据。
进一步的,确定任意两个相邻时刻的待存储时序矩阵之间的相似程度的计算公式为:
其中,a为任意两个相邻时刻的待存储时序矩阵之间的相似程度,为任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的匹配角点对数,为任意两个相邻时刻中前一时刻的待存储时序矩阵中的各个角点的角点数目,为任意两个相邻时刻中后一时刻的待存储时序矩阵中的各个角点的角点数目。
进一步的,多个标记时序矩阵数据段均满足的相邻时序矩阵相似条件为:
每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵之间的相似程度不小于预设相似程度;
每个标记时序矩阵数据段内的最后一个时刻的待存储时序矩阵与该标记时序矩阵数据段的后一个标记时序矩阵数据段内的第一个时刻的待存储时序矩阵之间的相似程度小于预设相似程度。
进一步的,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线的步骤包括:
根据每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的坐标信息,确定每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向;
根据每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向,构建每个标记时序矩阵数据段对应的各个时序矢量变化曲线。
进一步的,确定每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值的计算公式为:
其中,B为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻的待存储时序矩阵中的横坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t+1个时刻的待存储时序矩阵中的横坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻的待存储时序矩阵中的纵坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t+1个时刻的待存储时序矩阵中的纵坐标。
进一步的,确定每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量方向的计算公式为:
其中,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量方向,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻的待存储时序矩阵中的横坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t+1个时刻的待存储时序矩阵中的横坐标,B为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值,为求反余弦函数。
进一步的,确定每个标记时序矩阵数据段内的各关联细分段的步骤包括:
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的前两个数据点的坐标信息,确定各个时序矢量变化曲线中的前两个数据点组成的初始关联细分段对应的渐变程度,若前两个数据点组成的初始关联细分段对应的渐变程度不小于预设渐变程度阈值,则将各个时序矢量变化曲线中的第三个数据点加入到前两个数据点组成的初始关联细分段中,并根据前三个数据点的坐标信息,确定前三个数据点组成的初始关联细分段对应的渐变程度,不断重复上述步骤,直至初始关联细分段对应的渐变程度小于预设渐变程度阈值,将小于预设渐变程度阈值的初始关联细分段作为每个标记时序矩阵数据段内的第一渐变关联细分段;以第一渐变关联细分段对应的下一个数据点为起始点重复第一渐变关联细分段的获取过程,得到每个标记时序矩阵数据段内的第二渐变关联细分段,不断重复获取渐变关联细分段的获取过程,直至每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各个数据点均有其对应的渐变关联细分段,从而得到每个标记时序矩阵数据段内的各个渐变关联细分段;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的前两个数据点的坐标信息,确定各个时序矢量变化曲线中的前两个数据点组成的初始关联细分段对应的离散程度,若前两个数据点组成的初始关联细分段对应的离散程度不小于预设离散程度阈值,则将各个时序矢量变化曲线中的第三个数据点加入到前两个数据点组成的初始关联细分段中,并根据前三个数据点的坐标信息,确定前三个数据点组成的初始关联细分段对应的离散程度,不断重复上述步骤,直至初始关联细分段对应的离散程度小于预设离散程度阈值,将小于预设离散程度阈值的初始关联细分段作为每个标记时序矩阵数据段内的第一离散关联细分段;以第一离散关联细分段对应的下一个数据点为起始点重复第一离散关联细分段的获取过程,得到每个标记时序矩阵数据段内的第二离散关联细分段,不断重复获取离散关联细分段的获取过程,直至每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各个数据点均有其对应的离散关联细分段,从而得到每个标记时序矩阵数据段内的各个离散关联细分段;
根据每个标记时序矩阵数据段内的各个渐变关联细分段和各个离散关联细分段,确定每个标记时序矩阵数据段内的各关联细分段,所述关联细分段内的待存储时序矩阵数目应大于两个。
进一步的,确定各个时序矢量变化曲线中的初始关联细分段对应的渐变程度和离散程度的步骤包括:
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息,确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变化指标,进而确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变换指标均值;
根据各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变化指标和变换指标均值,确定各个时序矢量变化曲线中的初始关联细分段对应的渐变程度;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息和各个时序矢量变化曲线对应的拟合直线,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离值,进而确定各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离均值;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离值和距离均值,确定各个时序矢量变化曲线中的初始关联细分段对应的离散程度。
进一步的,确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变化指标的计算公式为:
其中,C为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻和第t+1个时刻上的变化指标,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻上的矢量方向,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t+1个时刻上的矢量方向,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻上的矢量值,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t+1个时刻上的矢量值;
确定各个时序矢量变化曲线中的初始关联细分段对应的渐变程度的计算公式为:
其中,f为各个时序矢量变化曲线中的初始关联细分段对应的渐变程度,为各个时序矢量变化曲线中的初始关联细分段内的第k个变化指标,为第各个时序矢量变化曲线中的初始关联细分段内各个变化指标的均值,N为各个时序矢量变化曲线中的初始关联细分段内的各个变化指标的数目。
进一步的,确定各个时序矢量变化曲线中的初始关联细分段对应的离散程度的计算公式为:
其中,h为各个时序矢量变化曲线中的初始关联细分段对应的离散程度,为各个时序矢量变化曲线中的初始关联细分段内的第m个数据点与对应的拟合直线之间的距离值,为各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离均值,M为各个时序矢量变化曲线中的初始关联细分段内距离值的数目。
本发明具有如下有益效果:
本发明通过获取预设时段内的待存储时序矩阵数据,利用角点检测和角点匹配对预设时段内的待存储时序矩阵数据进行处理,确定任意两个相邻时刻的待存储时序矩阵之间的相似程度,从而得到多个标记时序矩阵数据段,根据每个标记时序矩阵数据段内的各个时序矢量变化曲线内的各数据点的位置信息,得到每个标记时序矩阵数据段内的各关联细分段,采用不同的压缩算法对预设时段内的待存储时序矩阵数据进行压缩处理。本发明通过电数字数据处理技术有效解决了数据冗余度大造成的压缩率低、存储空间浪费的问题,使得服务器可以存储更多的数据,同时也降低了数据备份的难度,达到提高非结构化数据存储的压缩率的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一种计算机非结构化数据存储方法的流程图;
图2为本发明实施例中的第i个标记时序矩阵数据段对应的时序矢量变化曲线示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一个实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
对于非结构化数据中的时序矩阵数据而言,时序矩阵数据会存在大量的冗余数据。以视频数据为例,通常情况一秒内会有24帧图像,也就是24个矩阵数据,部分矩阵数据的相似性很大,即相邻矩阵数据中只有少部分的角点数据会发生了变化,而其他数据基本上没有发生任何变化,此时对视频数据进行压缩时采用无损压缩会造成大量的冗余和存储空间的浪费。为了提高非结构化数据存储的压缩率,使得服务器可以存储更多的数据,本实施例提供了一种计算机非结构化数据存储方法,如图1所示,该方法包括以下步骤:
(1)获取预设时段内的待存储时序矩阵数据,并根据该预设时段内的待存储时序矩阵数据,确定预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点和各个匹配角点。
在本实施例中,获取预设时间段内的非结构化数据类型的待存储时序矩阵数据,如10秒钟的车联网监控视频数据。由于预设时间段内的待存储时序矩阵数据为一个动态过程,具有尺度上的变化,本实施例利用SIFT(Scale-invariant Feature Transform,尺度不变特征转换)角点匹配算法对每个时刻的待存储时序矩阵中的各个元素进行角点检测和特征描述,从而得到任意两个相邻时刻的待存储时序矩阵数据中的各个角点和各个匹配角点。角点匹配的过程为:对任意两个相邻时刻的待存储时序矩阵中的角点进行角点匹配,通过判断任意两个相邻时刻的待存储时序矩阵中各个角点对应的描述向量是否一致,可实现连续待存储时序矩阵内的同一角点匹配。SIFT角点匹配算法对待存储时序矩阵中的各个元素进行角点检测和特征描述的过程为现有技术,不在本发明保护范围内,此处不再进行详细阐述。
需要说明的是,SIFT角点匹配算法包括角点检测器和描述子,其中检测器用于判断待存储时序矩阵内的元素是否为角点,描述子用于描述角点形成的特征向量。
(2)根据预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点的角点数目和各个匹配角点的匹配角点对数,确定任意两个相邻时刻的待存储时序矩阵之间的相似程度,进而确定多个标记时序矩阵数据段,所述多个标记时序矩阵数据段均满足相邻时序矩阵相似条件。
需要说明的是,为了便于后续对相似性高的待存储矩阵数据进行有损压缩,增大非结构化数据的压缩率,需要先获取相似高的数据段,标记时序矩阵数据段为相似性较高的数据段,确定多个标记时序矩阵数据段的步骤包括:
(2-1)根据预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点的角点数目和各个匹配角点的匹配角点对数,确定任意两个相邻时刻的待存储时序矩阵之间的相似程度。
本实施例先通过预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点的角点数目和各个匹配角点的匹配角点对数,计算任意两个相邻时刻的待存储时序矩阵之间的相似程度,其计算公式为:
其中,a为任意两个相邻时刻的待存储时序矩阵之间的相似程度,为任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的匹配角点对数,为任意两个相邻时刻中前一时刻的待存储时序矩阵中的各个角点的角点数目,为任意两个相邻时刻中后一时刻的待存储时序矩阵中的各个角点的角点数目。
(2-2)根据任意两个相邻时刻的待存储时序矩阵之间的相似程度,确定多个标记时序矩阵数据段,所述多个标记时序矩阵数据段均满足相邻时序矩阵相似条件。
多个标记时序矩阵数据段均满足相邻时序矩阵相似条件,相邻时序矩阵相似条件为:每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵之间的相似程度不小于预设相似程度;每个标记时序矩阵数据段内的最后一个时刻的待存储时序矩阵与该标记时序矩阵数据段的后一个标记时序矩阵数据段内的第一个时刻的待存储时序矩阵之间的相似程度小于预设相似程度。
在本实施例中,预设相似程度为,按照经验值可取0.7,当预设时段内的任意两个相邻时刻的待存储时序矩阵之间的相似程度a大于等于预设相似程度时,将该两个相邻时刻的待存储时序矩阵合并初始时序矩阵数据段中,并对该初始时序矩阵数据段进行标记,后续将连续大于等于预设相似程度的相邻时刻的待存储时序矩阵也合并到该初始时序矩阵数据段中,直至出现小于预设相似程度的相邻时刻的待存储时序矩阵,将此时两个相邻时刻的待存储时序矩阵分割开,从而得到最终的标记时序矩阵数据段,并以最终的标记时序矩阵数据段的后一个待存储时序矩阵为起始点,再次确定下一个标记时序矩阵数据段,不断重复上述步骤,直至预设时段内的待存储时序矩阵均有其对应的标记时序矩阵数据段,从而得到多个标记时序矩阵数据段。
(3)根据每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的坐标信息,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线,进而确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线对应的拟合直线。
(3-1)根据每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的坐标信息,确定每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向。
在本实施例中,以确定第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值和矢量方向为例,根据第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的坐标信息,也就是根据第i个标记时序矩阵数据段内第t个时刻和第t+1个时刻两个相邻时刻的待存储时序矩阵中的第j个匹配角点的坐标信息,确定第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值和矢量方向,确定第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值的计算公式为:
其中,B为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻的待存储时序矩阵中的横坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t+1个时刻的待存储时序矩阵中的横坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻的待存储时序矩阵中的纵坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t+1个时刻的待存储时序矩阵中的纵坐标。
确定第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量方向的计算公式为:
其中,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量方向,为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻的待存储时序矩阵中的横坐标,为第i个标记时序矩阵数据段内的第j个匹配角点在第t+1个时刻的待存储时序矩阵中的横坐标,B为第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值,为求反余弦函数。
参考第i个标记时序矩阵数据段内的第j个匹配角点在第t个时刻和第t+1个时刻的待存储时序矩阵中的矢量值和矢量方向的确定步骤,得到每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向。需要说明的是,本实施例中的各个匹配角点是连续时序矩阵内的匹配成功的各个角点,如第j个匹配角点为连续时序矩阵内的匹配成功的角点。
(3-2)根据每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向,构建每个标记时序矩阵数据段对应的各个时序矢量变化曲线。
在本实施例中,根据每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向、时序矢量三维空间结构,构建生成时序矢量变化曲线。例如,第i个标记时序矩阵数据段对应的时序矢量变化曲线,第i个标记时序矩阵数据段对应的时序矢量变化曲线示意图如图2所示,图2中的B是指矢量值,矢量值B为时序矢量三维空间的y轴数值,T是指时序时刻,时序时刻T为时序矢量三维空间的z轴数值,是指矢量方向,矢量方向为时序矢量三维空间的x轴数值。第i个标记时序矩阵数据段对应的时序矢量变化曲线中共有T-1个数据点,第i个标记时序矩阵数据段内共有T个待存储时序矩阵,第i个标记时序矩阵数据段内的每个时刻均有其对应的待存储时序矩阵,每个待存储时序矩阵中均有j个匹配角点。在图2中,第i个标记时序矩阵数据段内共有12个待存储时序矩阵,每个待存储时序矩阵中有2个匹配角点,第i个标记时序矩阵数据段对应2个时序矢量变化曲线,分别为曲线j和曲线。
需要说明的是,时序矢量变化曲线上的数据点的坐标信息包括矢量值和矢量方向,由于数据点的坐标信息是根据匹配角点在各个相邻时刻的待存储时序矩阵中的坐标信息得到的,所以标记时序矩阵数据段对应的时序矢量变化曲线数目与标记时序矩阵数据段内的大多数待存储时序矩阵中的匹配角点数目保持一致。
(3-3)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线对应的拟合直线。
在本实施例中,采用最小二乘法对每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各数据点进行拟合,得到各个时序矢量变化曲线对应的拟合直线。采用最小二乘法拟合直线的过程为现有技术,不在本发明保护范围内,此处不再详细赘述。
(4)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各数据点的坐标信息以及各个时序矢量变化曲线对应的拟合直线,确定每个标记时序矩阵数据段内的各关联细分段。
(4-1)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各数据点的坐标信息,确定每个标记时序矩阵数据段内的各个渐变关联细分段,其步骤包括:
(4-1-1)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的前两个数据点的坐标信息,确定各个时序矢量变化曲线中的前两个数据点组成的初始关联细分段对应的渐变程度,若前两个数据点组成的初始关联细分段对应的渐变程度不小于预设渐变程度阈值,则将各个时序矢量变化曲线中的第三个数据点加入到前两个数据点组成的初始关联细分段中,并根据前三个数据点的坐标信息,确定前三个数据点组成的初始关联细分段对应的渐变程度,若前三个数据点组成的初始关联细分段对应的渐变程度不小于预设渐变程度阈值,则将各个时序矢量变化曲线中的第四个数据点加入到前三个数据点组成的初始关联细分段中,并根据前四个数据点的坐标信息,确定前四个数据点组成的初始关联细分段对应的渐变程度,不断重复上述步骤,直至初始关联细分段对应的渐变程度小于预设渐变程度阈值,将小于预设渐变程度阈值的初始关联细分段作为每个标记时序矩阵数据段内的第一渐变关联细分段。以第一渐变关联细分段对应的下一个数据点为起始点重复第一渐变关联细分段的获取过程,得到每个标记时序矩阵数据段内的第二渐变关联细分段,以第二渐变关联细分段对应的下一个数据点为起始点继续重复第一渐变关联细分段的获取过程,得到每个标记时序矩阵数据段内的第三渐变关联细分段,不断重复获取渐变关联细分段的获取过程,直至每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各个数据点均有其对应的渐变关联细分段,从而得到每个标记时序矩阵数据段内的各个渐变关联细分段。
在本实施例中,以渐变程度为参考对每个标记时序矩阵数据段进行细化分。例如,第i个标记时序矩阵数据段内共有12个待存储时序矩阵,从第i个标记时序矩阵数据段对应的第j个时序矢量变化曲线中的第一个数据点开始,也就是图2中的第j个时序矢量变化曲线中最底部的第一个黑色圆点开始,每次累加一个数据点,并计算此时的初始关联细分段对应的渐变程度,初始关联细分段对应的渐变程度的计算过程可参考本实施例中的步骤(4-1-2)至步骤(4-1-3),将获取的初始关联细分段对应的渐变程度记为f,设定预设渐变程度阈值为,当时,继续增加数据点,直至增加到某一个数据点时的初始关联细分段对应的渐变程度小于预设渐变程度阈值时停止,以下一个数据点为起始点继续上述操作,将第i个标记时序矩阵数据段分为多段,假设将12个待存储时序矩阵细分为5、1、1、1、4,此时得到的细分段为渐变关联细分段。
(4-1-2)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息,确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变化指标,进而确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变换指标均值。
需要说明的是,这里的初始关联细分段是在确定渐变关联细分段过程中得到的,例如,时序矢量变化曲线中的前两个数据点组成的初始关联细分段、前三个数据点组成的初始关联细分段、前四个数据点组成的初始关联细分段等。
在本实施例中,以确定各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻和第t+1个时刻上的变化指标为例,根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息,其坐标信息为时序矢量三维空间中各数据点的时序时刻对应的矢量值和矢量方向,确定各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻和第t+1个时刻上的变化指标,其计算公式为:
其中,C为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻和第t+1个时刻上的变化指标,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻上的矢量方向,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t+1个时刻上的矢量方向,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻上的矢量值,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t+1个时刻上的矢量值。
参考各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻和第t+1个时刻上的变化指标的确定过程,得到各个时序矢量变化曲线中的初始关联细分段在各个相邻时刻上的变化指标,通过各个时序矢量变化曲线中的初始关联细分段在各个相邻时刻上的变化指标,计算初始关联细分段在各个相邻时刻上的变换指标的平均值,从而得到各个时序矢量变化曲线中的初始关联细分段在各个相邻时刻上的变换指标均值。计算变换指标均值的过程为现有技术,不在本发明保护范围内,此处不再进行详细阐述。
(4-1-3)根据各个时序矢量变化曲线中的初始关联细分段在各个相邻时刻上的变化指标和变换指标均值,确定各个时序矢量变化曲线中的初始关联细分段对应的渐变程度。
其中,f为各个时序矢量变化曲线中的初始关联细分段对应的渐变程度,为各个时序矢量变化曲线中的初始关联细分段内的第k个变化指标,为各个时序矢量变化曲线中的初始关联细分段内的各个变化指标的均值,N为各个时序矢量变化曲线中的初始关联细分段内的各个变化指标的数目。
需要说明的是,对于标记时序矩阵数据段对应的时序矢量变化曲线而言,时序矢量变化曲线中数据点对应的矢量值和矢量方向变化的越均匀,说明时序矢量变化曲线的变化情况是渐变的,也就是时序矢量变化曲线的变化情况是符合规律变化规则,在本实施例中规律变化规则是指渐变规律。当时序矢量变化曲线中的初始关联细分段对应的变化幅度符合渐变规律时,说明该初始关联细分段对应的待存储时序矩阵的相似性好;当时序矢量变化曲线中的初始关联细分段对应的变化幅度不符合渐变规律时,说明该初始关联细分段对应的待存储时序矩阵的相似性差。
(4-2)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中各数据点的坐标信息和各个时序矢量变化曲线对应的拟合直线,确定每个标记时序矩阵数据段内的各个离散关联细分段,其步骤包括:
(4-2-1)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的前两个数据点的坐标信息,确定各个时序矢量变化曲线中的前两个数据点组成的初始关联细分段对应的离散程度,若前两个数据点组成的初始关联细分段对应的离散程度不小于对应预设离散程度阈值,则将各个时序矢量变化曲线中的第三个数据点加入到前两个数据点组成的初始关联细分段中,并根据前三个数据点的坐标信息,确定前三个数据点组成的初始关联细分段对应的离散程度,若前三个数据点组成的初始关联细分段对应的离散程度不小于对应预设离散程度阈值,则将各个时序矢量变化曲线中的第四个数据点加入到前三个数据点组成的初始关联细分段中,并根据前四个数据点的坐标信息,确定前四个数据点组成的初始关联细分段对应的离散程度,不断重复上述步骤,直至初始关联细分段对应的离散程度小于预设离散程度阈值,将小于预设离散程度阈值的初始关联细分段作为每个标记时序矩阵数据段内的第一离散关联细分段。以第一离散关联细分段的下一个数据点为起始点重复第一离散关联细分段的获取过程,得到每个标记时序矩阵数据段内的第二离散关联细分段,以第二离散关联细分段的下一个数据点为起始点继续重复第一离散关联细分段的获取过程,得到每个标记时序矩阵数据段内的第三离散关联细分段,不断重复获取离散关联细分段的获取过程,直至每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各个数据点均有其对应的离散关联细分段,从而得到每个标记时序矩阵数据段内的各个离散关联细分段。
在本实施例中,以离散程度为参考对每个标记时序矩阵数据段进行细分段。以第i个标记时序矩阵数据段为例,第i个标记时序矩阵数据段内共有12个待存储时序矩阵,从第i个标记时序矩阵数据段对应的第j个时序矢量变化曲线中的第一个数据点开始,每次累加一个数据点,并计算此时的初始关联细分段对应的离散程度,初始关联细分段对应的离散程度的计算过程可参考本实施例中的步骤(4-2-3)至步骤(4-2-4),将初始关联细分段对应的离散程度记为h,设定预设离散程度阈值为,当时,继续增加数据点,直至增加到某一个数据点时小于设定预设离散程度阈值时停止,以下一个数据点为起始点继续上述操作,将第i个标记时序矩阵数据段分为多段,假设将12个待存储时序矩阵细分为4、2、1、2、3,此时得到的细分段为离散关联细分段。
(4-2-2)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息和各个时序矢量变化曲线对应的拟合直线,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离值,进而确定各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离均值。
需要说明的是,这里的初始关联细分段是在确定离散关联细分段过程中得到的,例如,时序矢量变化曲线中的前两个数据点组成的初始关联细分段、前三个数据点组成的初始关联细分段、前四个数据点组成的初始关联细分段等。
在本实施例中,通过各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息和各个时序矢量变化曲线对应的拟合直线,计算各数据点与对应的拟合直线之间的距离值,进而计算各数据点与对应的拟合直线之间的距离均值,从而得到各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离值和距离均值。计算时序矢量变化曲线上的数据点到对应的拟合直线的过程为现有技术,不在本发明保护范围内,此处不再进行详细阐述。
需要说明的是,对于标记时序矩阵数据段对应的第j个时序矢量变化曲线而言,第j个时序矢量变化曲线的矢量值和矢量方向的变化越小,说明该时序矢量变化曲线的整体位置的变化程度越小。本实施例通过计算时序矢量变化曲线中各个数据点到对应的拟合直线之间的距离,来确定后续各个时序矢量变化曲线中的初始关联细分段对应的离散程度,也就是确定数据点在初始关联细分段内时的整体变化程度。
(4-2-3)根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离值和距离均值,确定各个时序矢量变化曲线中的初始关联细分段对应的离散程度。
其中,h为各个时序矢量变化曲线中的初始关联细分段对应的离散程度,为各个时序矢量变化曲线中的初始关联细分段内的第m个数据点与对应的拟合直线之间的距离值,为各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离均值,M为各个时序矢量变化曲线中的初始关联细分段内距离值的数目。
(4-3)根据每个标记时序矩阵数据段内的各个渐变关联细分段和各个离散关联细分段,确定每个标记时序矩阵数据段内的各关联细分段,所述关联细分段内的待存储时序矩阵数目应大于两个。
在本实施例中,将每个标记时序矩阵数据段内的各个渐变关联细分段和各个离散关联细分段按照时序时刻进行交集处理,获取交集部分的细分段对应的待存储时序矩阵。例如,对于第i个标记时序矩阵数据段对应的第j个时序矢量变化曲线来讲,第i个标记时序矩阵数据段内共有12个待存储时序矩阵,渐变程度将第j个时序矢量变化曲线对应的待存储时序矩阵细分为5、1、1、1、4,离散程度将第j个时序矢量变化曲线对应的待存储时序矩阵细分为4、2、1、2、3,在这12个待存储时序矩阵中待存储时序矩阵数量大于两个的交集部分为[1,4]与[10,12],具体为[1,4]对应的待存储时序矩阵和[10,12]对应的待存储时序矩阵。
此时得到的细分段仅考虑了第i个标记时序矩阵数据段对应的第j个时序矢量变化曲线,而第i个标记时序矩阵数据段对应多个时序矢量变化曲线,不同的时序矢量变化曲线能够将第i个标记时序矩阵数据段有不同的交集部分,获取多个交集部分的众数部分,来确定最终的关联细分段。例如,第i个标记时序矩阵数据段对应多个时序矢量变化曲线,其中,第j个时序矢量变化曲线的交集部分为[1,4]与[10,12],第个时序矢量变化曲线的交集部分为[1,3]与[9,12],第个时序矢量变化曲线的交集部分为[1,4]与[10,12],此时大多数的交集部分为[1,4]与[10,12],将[1,4]对应的待存储时序矩阵和[10,12]对应的待存储时序矩阵作为第i个标记时序矩阵数据段内的关联细分段。
参考第i个标记时序矩阵数据段内的各关联细分段的确定过程,得到每个标记时序矩阵数据段内的各关联细分段,最终得到预设时段内待存储时序矩阵数据中的多个关联细分段。这里的关联细分段对应的渐变程度和离散程度均满足预设阈值要求,并且关联细分段中的各个待存储时序矩阵的相似性较好,且存在强关联性。
需要说明的是,众数是指最大值,若只考虑众数的最大值会忽视其他细分段,例如,[1,4]对应的待存储时序矩阵出现了100次,[10,12]对应的待存储时序矩阵出现了98次,那么[1,4]对应的待存储时序矩阵与[10,12]对应的待存储时序矩阵均为关联细分段,而非仅选择[1,4]对应的待存储时序矩阵作为关联细分段,故本实施例通过设置众数阈值来避免出现上述情况,当众数大于众数阈值时获取对应细分段的待存储时序矩阵作为关联细分段。
(5)根据每个标记时序矩阵数据段内的各关联细分段,对预设时段内的待存储时序矩阵数据进行压缩存储处理,从而得到压缩存储后的预设时段内的待存储时序矩阵数据。
在本实施例中,根据获取的每个标记时序矩阵数据段内的各关联细分段,采用不同的压缩算法对预设时段内的待存储时序矩阵数据进行压缩存储处理。
对于每个标记时序矩阵数据段内的各关联细分段内的待存储时序矩阵来讲,各关联细分段内的待存储时序矩阵的数据关联程度高,相似性好,各关联细分段内第一个待存储时序矩阵之后的多个待存储时序矩阵的冗余度高、重要程度低,所以在存储时推荐采用有损压缩对各关联细分段内第一个待存储时序矩阵之后的多个待存储时序矩阵进行压缩存储,以损失第一个待存储时序矩阵之后的多个待存储时序矩阵来提高压缩率,对各关联细分段内第一个待存储时序矩阵进行无损压缩。在对各关联细分段内的待存储时序矩阵进行压缩存储时,记录关联细分段内的待存储时序矩阵中的各个匹配角点的变化情况,以便于后续恢复数据时采用风格迁移与匹配角点的变换情况进行数据还原。还原后的数据与原始数据存在一定的差异,例如模糊或部分细节丢失,但该类数据的重要程度低,故对待存储数据本身的影响不大。
对每个标记时序矩阵数据段内的各关联细分段之外的待存储时序矩阵来讲,采用无损压缩对各关联细分段之外的待存储时序矩阵进行存储,同时增加标识符记录数据的压缩类型,以便于后续对数据进行还原处理。例如,待存储时序矩阵为ABC,其中待存储时序矩阵A采用无损压缩,在压缩待存储时序矩阵A之前增加标识符,例如以00000000表示无损压缩。待存储时序矩阵B和待存储时序矩阵C采用有损压缩,在压缩待存储时序矩阵B和待存储时序矩阵C之前增加标识符,例如以11111111表示有损压缩,并且在待存储时序矩阵B和待存储时序矩阵C压缩之后增加标识位,即特征标记,例如以0000000000000000表示匹配角点数据的变化标记,通过特征标记记录关联细分段内的待存储时序矩阵。最后,本实施例得到了压缩存储后的预设时段内的待存储时序矩阵数据。
本发明通过获取预设时段内的待存储时序矩阵数据,利用角点检测和角点匹配对预设时段内的待存储时序矩阵数据进行初次分段,得到多个标记时序矩阵数据段。根据每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的坐标信息,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线,进而确定每个标记时序矩阵数据段内的各关联细分段。根据每个标记时序矩阵数据段内的各关联细分段,对预设时段内的待存储时序矩阵数据进行压缩存储处理,从而得到压缩存储后的待存储时序矩阵数据。本发明解决了非结构化数据存储的压缩率低、存储空间浪费的问题,使得服务器可以存储更多的数据,提高了非结构化数据存储的压缩率,也就是达到对非结构化数据高效存储的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种计算机非结构化数据存储方法,其特征在于,包括以下步骤:
获取预设时段内的待存储时序矩阵数据,并根据该预设时段内的待存储时序矩阵数据,确定预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点和各个匹配角点;
根据预设时段内的任意两个相邻时刻的待存储时序矩阵中的各个角点的角点数目和各个匹配角点的匹配角点对数,确定任意两个相邻时刻的待存储时序矩阵之间的相似程度,进而确定多个标记时序矩阵数据段,所述多个标记时序矩阵数据段均满足相邻时序矩阵相似条件;
根据每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的坐标信息,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线,进而确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线对应的拟合直线;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各数据点的坐标信息以及各个时序矢量变化曲线对应的拟合直线,确定每个标记时序矩阵数据段内的各关联细分段;
根据每个标记时序矩阵数据段内的各关联细分段,对预设时段内的待存储时序矩阵数据进行压缩存储处理,从而得到压缩存储后的预设时段内的待存储时序矩阵数据。
3.根据权利要求1所述的一种计算机非结构化数据存储方法,其特征在于,多个标记时序矩阵数据段均满足的相邻时序矩阵相似条件为:
每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵之间的相似程度不小于预设相似程度;
每个标记时序矩阵数据段内的最后一个时刻的待存储时序矩阵与该标记时序矩阵数据段的后一个标记时序矩阵数据段内的第一个时刻的待存储时序矩阵之间的相似程度小于预设相似程度。
4.根据权利要求1所述的一种计算机非结构化数据存储方法,其特征在于,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线的步骤包括:
根据每个标记时序矩阵数据段内的任意两个相邻时刻的待存储时序矩阵中的各个匹配角点的坐标信息,确定每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向;
根据每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值和矢量方向,构建每个标记时序矩阵数据段对应的各个时序矢量变化曲线。
5.根据权利要求4所述的一种计算机非结构化数据存储方法,其特征在于,确定每个标记时序矩阵数据段内的各个匹配角点在任意两个相邻时刻的待存储时序矩阵中的矢量值的计算公式为:
7.根据权利要求1所述的一种计算机非结构化数据存储方法,其特征在于,确定每个标记时序矩阵数据段内的各关联细分段的步骤包括:
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的前两个数据点的坐标信息,确定各个时序矢量变化曲线中的前两个数据点组成的初始关联细分段对应的渐变程度,若前两个数据点组成的初始关联细分段对应的渐变程度不小于预设渐变程度阈值,则将各个时序矢量变化曲线中的第三个数据点加入到前两个数据点组成的初始关联细分段中,并根据前三个数据点的坐标信息,确定前三个数据点组成的初始关联细分段对应的渐变程度,不断重复上述步骤,直至初始关联细分段对应的渐变程度小于预设渐变程度阈值,将小于预设渐变程度阈值的初始关联细分段作为每个标记时序矩阵数据段内的第一渐变关联细分段;以第一渐变关联细分段对应的下一个数据点为起始点重复第一渐变关联细分段的获取过程,得到每个标记时序矩阵数据段内的第二渐变关联细分段,不断重复获取渐变关联细分段的获取过程,直至每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各个数据点均有其对应的渐变关联细分段,从而得到每个标记时序矩阵数据段内的各个渐变关联细分段;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的前两个数据点的坐标信息,确定各个时序矢量变化曲线中的前两个数据点组成的初始关联细分段对应的离散程度,若前两个数据点组成的初始关联细分段对应的离散程度不小于预设离散程度阈值,则将各个时序矢量变化曲线中的第三个数据点加入到前两个数据点组成的初始关联细分段中,并根据前三个数据点的坐标信息,确定前三个数据点组成的初始关联细分段对应的离散程度,不断重复上述步骤,直至初始关联细分段对应的离散程度小于预设离散程度阈值,将小于预设离散程度阈值的初始关联细分段作为每个标记时序矩阵数据段内的第一离散关联细分段;以第一离散关联细分段对应的下一个数据点为起始点重复第一离散关联细分段的获取过程,得到每个标记时序矩阵数据段内的第二离散关联细分段,不断重复获取离散关联细分段的获取过程,直至每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的各个数据点均有其对应的离散关联细分段,从而得到每个标记时序矩阵数据段内的各个离散关联细分段;
根据每个标记时序矩阵数据段内的各个渐变关联细分段和各个离散关联细分段,确定每个标记时序矩阵数据段内的各关联细分段,所述关联细分段内的待存储时序矩阵数目应大于两个。
8.根据权利要求7所述的一种计算机非结构化数据存储方法,其特征在于,确定各个时序矢量变化曲线中的初始关联细分段对应的渐变程度和离散程度的步骤包括:
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息,确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变化指标,进而确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变换指标均值;
根据各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变化指标和变换指标均值,确定各个时序矢量变化曲线中的初始关联细分段对应的渐变程度;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点的坐标信息和各个时序矢量变化曲线对应的拟合直线,确定每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离值,进而确定各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离均值;
根据每个标记时序矩阵数据段对应的各个时序矢量变化曲线中的初始关联细分段内的各数据点与对应的拟合直线之间的距离值和距离均值,确定各个时序矢量变化曲线中的初始关联细分段对应的离散程度。
9.根据权利要求8所述的一种计算机非结构化数据存储方法,其特征在于,确定各个时序矢量变化曲线中的初始关联细分段内的数据点在各个相邻时刻上的变化指标的计算公式为:
其中,C为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻和第t+1个时刻上的变化指标,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻上的矢量方向,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t+1个时刻上的矢量方向,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t个时刻上的矢量值,为各个时序矢量变化曲线中的初始关联细分段内的数据点在第t+1个时刻上的矢量值;
确定各个时序矢量变化曲线中的初始关联细分段对应的渐变程度的计算公式为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210785170.XA CN114860986B (zh) | 2022-07-06 | 2022-07-06 | 一种计算机非结构化数据存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210785170.XA CN114860986B (zh) | 2022-07-06 | 2022-07-06 | 一种计算机非结构化数据存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114860986A true CN114860986A (zh) | 2022-08-05 |
CN114860986B CN114860986B (zh) | 2022-10-11 |
Family
ID=82625800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210785170.XA Active CN114860986B (zh) | 2022-07-06 | 2022-07-06 | 一种计算机非结构化数据存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114860986B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0211857A1 (en) * | 1985-02-05 | 1987-03-04 | British Telecomm | CODING OF IMAGES. |
US20100104184A1 (en) * | 2007-07-16 | 2010-04-29 | Novafora, Inc. | Methods and systems for representation and matching of video content |
CN102637302A (zh) * | 2011-10-24 | 2012-08-15 | 北京航空航天大学 | 一种图像编码方法 |
AU2015243117A1 (en) * | 2015-10-19 | 2017-05-04 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding image data |
CN107820083A (zh) * | 2017-10-20 | 2018-03-20 | 大连大学 | 基于角点检测和非局部相似性的视频压缩感知重构算法 |
CN208623757U (zh) * | 2018-06-22 | 2019-03-19 | 北京国艺中联文化艺术传播股份有限公司 | 一种图像拼接融合系统 |
CN112184843A (zh) * | 2020-11-09 | 2021-01-05 | 新相微电子(上海)有限公司 | 图像数据压缩的冗余数据去除系统及方法 |
CN112702592A (zh) * | 2020-12-28 | 2021-04-23 | 北京航空航天大学 | 端到端双目图像联合压缩方法、装置、设备和介质 |
CN113382263A (zh) * | 2021-06-10 | 2021-09-10 | 青岛海洋科学与技术国家实验室发展中心 | 一种基于人工智能的视频通讯数据高效压缩方法和系统 |
CN114547146A (zh) * | 2022-02-22 | 2022-05-27 | 哈尔滨工业大学 | 时序数据压缩查询方法、装置、计算设备及存储介质 |
CN114640355A (zh) * | 2022-03-30 | 2022-06-17 | 北京诺司时空科技有限公司 | 时序数据库的有损压缩及解压缩方法、系统、存储介质、设备 |
-
2022
- 2022-07-06 CN CN202210785170.XA patent/CN114860986B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0211857A1 (en) * | 1985-02-05 | 1987-03-04 | British Telecomm | CODING OF IMAGES. |
US20100104184A1 (en) * | 2007-07-16 | 2010-04-29 | Novafora, Inc. | Methods and systems for representation and matching of video content |
CN102637302A (zh) * | 2011-10-24 | 2012-08-15 | 北京航空航天大学 | 一种图像编码方法 |
AU2015243117A1 (en) * | 2015-10-19 | 2017-05-04 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding image data |
CN107820083A (zh) * | 2017-10-20 | 2018-03-20 | 大连大学 | 基于角点检测和非局部相似性的视频压缩感知重构算法 |
CN208623757U (zh) * | 2018-06-22 | 2019-03-19 | 北京国艺中联文化艺术传播股份有限公司 | 一种图像拼接融合系统 |
CN112184843A (zh) * | 2020-11-09 | 2021-01-05 | 新相微电子(上海)有限公司 | 图像数据压缩的冗余数据去除系统及方法 |
CN112702592A (zh) * | 2020-12-28 | 2021-04-23 | 北京航空航天大学 | 端到端双目图像联合压缩方法、装置、设备和介质 |
CN113382263A (zh) * | 2021-06-10 | 2021-09-10 | 青岛海洋科学与技术国家实验室发展中心 | 一种基于人工智能的视频通讯数据高效压缩方法和系统 |
CN114547146A (zh) * | 2022-02-22 | 2022-05-27 | 哈尔滨工业大学 | 时序数据压缩查询方法、装置、计算设备及存储介质 |
CN114640355A (zh) * | 2022-03-30 | 2022-06-17 | 北京诺司时空科技有限公司 | 时序数据库的有损压缩及解压缩方法、系统、存储介质、设备 |
Non-Patent Citations (4)
Title |
---|
LIN ZHOU: ""Achievable Moderate Deviations Asymptotics for Streaming Compression of Correlated Sources"", 《IEEE TRANSACTIONS ON INFORMATION THEORY 2018》 * |
许文丹: ""视频信号压缩及图像稳定性算法的研究"", 《中国博士学位论文全文数据库(电子期刊)信息科技辑》 * |
邹盼盼: ""海量图像高效重压缩与缩放算法的研究"", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 * |
郑瑾: "浅析关于矢量的时序图形图像处理技术", 《辽宁科技学院学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114860986B (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105025392B (zh) | 基于摘要空间特征学习的视频摘要关键帧提取方法 | |
US7295718B2 (en) | Non-linear quantization and similarity matching methods for retrieving image data | |
CN100388279C (zh) | 测量视觉相似性的设备和方法 | |
CN101859320B (zh) | 一种基于多特征签名的海量图像检索方法 | |
US20170026665A1 (en) | Method and device for compressing local feature descriptor, and storage medium | |
Diana Andrushia et al. | Saliency-based image compression using Walsh–Hadamard transform (WHT) | |
JP2006505075A (ja) | 複数のイメージフレームを有するビデオシーケンス検索のための非線形量子化及び類似度マッチング方法 | |
CN106503112B (zh) | 视频检索方法和装置 | |
CN106777159B (zh) | 一种基于内容的视频片段检索及定位方法 | |
JP5176175B2 (ja) | 品質制御パラメータの変更及びスケーリングによって変換される画像のファイルサイズを予想するシステム、方法及びプログラム | |
Fu et al. | Quality assessment of retargeted images using hand-crafted and deep-learned features | |
CN109391818B (zh) | 一种基于dct变换的快速搜索分形图像压缩方法 | |
Li et al. | Coverless Video Steganography Based on Frame Sequence Perceptual Distance Mapping. | |
CN114860986B (zh) | 一种计算机非结构化数据存储方法 | |
Zhang et al. | An inter-image redundancy measure for image set compression | |
Chen et al. | Eigen-patch: Position-patch based face hallucination using eigen transformation | |
CN107682699A (zh) | 一种近无损图像压缩方法 | |
Khmelevskiy et al. | Model of Transformation of the Alphabet of the Encoded Data as a Tool to Provide the Necessary Level of Video Image Qualityi in Aeromonitoring Systems. | |
KR20030059402A (ko) | 에지 검출 방법과 장치 | |
Wang et al. | Fractal image encoding with flexible classification sets | |
Nie et al. | Key-frame based robust video hashing using isometric feature mapping | |
CN107563391B (zh) | 一种基于专家模型的数字图像特征提取方法 | |
CN104683815A (zh) | 一种基于内容的h.264压缩域视频检索方法 | |
CN111160397A (zh) | 一种多尺度的视觉词字典生成方法及系统 | |
Luo et al. | Research and Application of Content-based Image Hash Retrieval Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |