具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
现有技术中,采用所述“基于数据项之间相对变化值的压缩存储方法”,在数据项的精度不一致的情况下,无法计算不同数据项之间的相对变化值,而导致数据压缩效率降低。
其中,造成数据项的精度不一致的情况可以有很多。例如,在香港证券交易市场,根据股价的不同,允许的最小报价单位也不同,这就造成了同一只证券在不同时期有着不同的最小报价单位,这里的最小报价单位可以是所述精度;或者,在不同的历史时期,各证券交易所给出的历史证券交易数据可能进行了舍入处理,而造成了的精度不统一等。
为解决上述技术问题,本说明书实施例提供了一种证券交易数据压缩方法,用于解决现有技术存在的在数据项精度不一致的情况下,无法实施基于数据项之间相对变化值的压缩存储,从而存在数据压缩效率较低的问题。需要说明的是,该方法的执行主体,既可以是各财经网站的服务器,也可以是证券交易所的服务器,还可以是其他需要存储或加载证券交易数据的设备,这均是合理的。本说明书实施例对实施上述方法的具体实施主体不做限定。
并且为了方便描述,本申请说明书中均以上海证券交易所和深圳证券交易所的股票数据为例进行说明。本领域技术人员应当理解,这并不构成对本申请要求保护的证券交易数据压缩方法及装置的应用及保护范围的限定,本说明书实施例提供的一种证券交易数据压缩方法及装置,还可以应用于其他证券交易所的证券交易数据压缩中。该方法的流程示意图如图1所示,包括下述步骤:
步骤11:获取多个时间点分别对应的原始证券交易数据。
上述原始证券交易数据可以是证券交易所实时产生的证券交易数据。具体可以是,证券交易所实时产生的股票日K线数据、股票分时数据等。
通常情况下,上述时间点,可以是单条原始证券交易数据产生的时间单位,例如,单条股票日K线数据产生的时间单位:天(也可以称为“日”)。时间点对应的原始证券交易数据,可以是指时间点所产生的原始证券交易数据。
上述多个时间点是从一指定时间点开始至另一指定时间点止,这一时段内的多个连续的时间点。例如,对于股票日K线数据,上述多个时间点可以是股票开始交易的第一个交易日至当前交易日内多个交易日。
在实际应用中,所述原始证券交易数据可以包含多个数据项,具体可以包含:类型为价格的数据项、类型为成交量的数据项、类型为成交额的数据项、类型为盘后成交额的数据项以及类型为盘后成交量的数据项中的至少一种。其中,对于股票日K线数据,类型为价格的数据项可以包含:开盘价、最高价、最低价、收盘价中的至少一项。所述盘后成交额和所述盘后成交量可以是获取的原始证券交易数据中为适应科创板的新规则所包含数据项。
步骤12:针对获取的原始证券交易数据包含的每种类型的数据项,分别执行:步骤13至步骤16;
步骤13:从获取的原始证券交易数据包含的该类型的数据项中选取目标数据项。
这里的原始证券交易数据可以是通过步骤11获取的。原始证券交易数据包含的各类型的数据项,比如可以包括但不限于类型为价格的数据项,或类型为成交量的数据项,或类型为成交额的数据项,或类型为盘后成交额的数据项,或类型为盘后成交量的数据项。
在本说明书实施例中,所述从获取的原始证券交易数据包含的该类型的数据项中选取目标数据项,可以具体包括:
确定多个时间点分别对应的该类型的各数据项的精度;
通过比较多个时间点中每对相邻时间点分别对应的该类型的各数据项的精度,判断是否存在相邻时间点分别对应的该类型的各数据项的精度不一致的情况;
若判断结果为存在,则根据精度不一致的该类型的数据项分别对应的相邻时间点的先后顺序,从获取的原始证券交易数据包含的该类型的数据项中选取数据项,作为目标数据项。
在实际应用中,这里的确定多个时间点分别对应的该类型的各数据项的精度,可以是通过解析获取到的该类型的各数据项的小数位数以及数据的末位数值的整除倍数而确定的。例如:某数据项为0.022,则该数据的小数位数是3位,末位是2的倍数,则该0.022对应的精度可以是0.002。可以理解的是,这里的多个时间点分别对应的该类型的各数据项的精度,可以同样根据小数位数以及数据的末位数值的整除倍数确定。
在实际应用中,所述多个时间可以是多个连续的时间点,例如:多个连续的交易日,可以具体包含:1月2日、1月3日、1月4日、1月5日,这里的每对相邻时间点可以是1月2日和1月3日、1月3日与1月4日等,依此类推。在确定出每个时间点分别对应的该类型的各数据项的精度后,可以通过比较多个时间点中每对相邻时间点分别对应的该类型的各数据项的精度,判断是否存在相邻时间点分别对应的该类型的各数据项的精度不一致的情况。举例来说,通过循环遍历,依次去比较多个连续的交易日中1月3日和1月2日、1月3日和1月4日、1月4日和1月5日的分别对应的类型为价格的数据项的精度,若判断出1月3日和1月2日、1月3日和1月4日、1月4日和1月5日中任一一对相邻时间点对应的数据项中有精度不一致的情况,则判断结果为存在。
在实际应用中,若判断结果为存在,则根据精度不一致的该类型的数据项分别对应的相邻时间点的先后顺序,从获取的原始证券交易数据包含的该类型的数据项中选取数据项,作为目标数据项,可以具体包括:根据所述先后顺序,从获取的原始证券交易数据包含的该类型的数据项中,选取对应的相邻时间点中的在后时间点对应的数据项,作为所述目标数据项。举例来说,针对均为交易日的相邻时间点:1月2日和1月3日,若判断出1月3日和1月2日的类型为价格的各数据项的精度不一致,则选取1月3日对应的类型为价格的数据项作为目标数据项。
在获取的原始证券交易数据中存在相邻时间点对应的数据项的精度不一致的情况下,对原始证券交易数据所有类型的数据项均执行步骤13,可以确定出所有类型的数据项中所有的目标数据项。
步骤14:确定目标数据项的精度作为目标精度。
这里的目标数据项可以是通过步骤13确定的。这里的目标数据项的精度可以是基于上述确定多个时间点分别对应的该类型的各数据项的精度时采用的相同方法确定。
这里将确定目标数据项的精度作为目标精度,以便于之后根据目标精度,将待处理数据项转换为具备目标精度的数据项。
步骤15:根据目标精度,将待处理数据项转换为具备目标精度的数据项。
这里的目标精度可以是通过步骤14确定的。
这里的待处理的数据项可以为目标数据项对应的时间点的基准在先时间点所对应的该类型的数据项。具体来说,针对每对存在数据项的精度不一致的情况的相邻时间点,该相邻时间点中的在先时间点对应的数据项可以是待处理数据项,例如,针对均为交易日的相邻时间点:1月2日和1月3日,若选取的1月3日对应的类型为价格的数据项为目标数据项,那么1月3日为目标数据项对应的时间点,则1月2日对应的类型为价格的数据项可以是待处理的数据项,那么1月2日可以是基准在先时间点。可以理解的是,通过步骤13确定出的目标数据项可以有多个,则相应的,待处理的数据项也可以有多个。
在实际应用中,由于在解压缩数据的过程中,通常可以存储确定出来的数据项对应的精度,但精度通常包含多位小数位数,例如:0.002,这就导致存储该精度可能要占用更多的存储空间,那么在本说明书实施例中,可以根据预先设置的精度与精度标识之间的对应关系,在数据项解压缩过程中,存储确定出来的精度标识,用以表征该数据项的精度,可以减少占用的存储空间长度。在实际应用中,精度标识可以用数值表示,例如,可以用数值“3”表示精度0.1,为了便于表述,可以用字符“L”代表精度标识,不同的“L”即为不同的精度标识,例如:L=3,代表精度标识为数值“3”。不同的精度标识可以表示不同的精度,从而特别地,在精度标识用数值表示的情况下,代表不同精度标识的不同数值就表示了不同的精度。
可以理解的是,对于不同的精度可以采用不用的数值表示,而对于数值所表示的精度,可以根据需求人为设定,也可以通过下述方式确定:
举例来说,确定数值所表示的精度的过程大致可以为:预设几个基础数值以及该基础数值表示的精度,如,考虑到股票的价格通常是小数形式,且变化步长通常是1或2或者5的倍数,例如,0.1、0.2、0.5等,这里可以预先设置数值“3”表示精度0.1,设置数值“1”表示精度0.5,设置数值“2”表示精度0.2,对于除0.1、0.2以及0.5以外的数据项的精度,可以通过预设的计算方式确定出表示该精度的精度标识。
所述预设的计算方式,具体可以包括:
将数据项的精度代入公式[1],以便从m的取值范围内,确定出使得公式[1]成立,且n为整数的m的值,同时也可以确定出n的值;
精度=m×10-n [1]
其中,m的取值范围为0.5、0.2、0.1。
例如,精度0.005代入公式[1],可以确定出m=0.5,n=2。
再根据确定出的n的值以及L0,根据公式[2]确定出表示精度的精度标识L。其中,L0表示预设的与m的取值范围内的各数值分别对应的参数。具体的,当m取值为0.5时L0的参数值为1,当m取值为0.2时L0的参数值为2,当m取值为0.1时L0的参数值为3。
L=3n+L0 [2]
举例来说,精度0.005根据公式[1]确定出n为2,m为0.5;由于与0.5对应的数值为“1”,则L0为1;根据公式[2]得到代表精度0.005的精度标识等于3×2+1=7。也就得到,精度0.005的精度标识为数值“7”。
当然,由于股票的成交量,往往是10、100、20、50、200、500等整数的倍数,为了实现压缩证券交易数据的目的,即减少数据的存储量,在实际应用中,还可以将较大数据项转换成较小数据项,用转换后的较小数据项表示较大的数据项,例如:某成交量为3000,表示3000的较小数据项可以是3,即1000的倍数,则可以用3代表3000。那么在本说明书实施例中,还可以设置用不同的数值表示不同的整数倍数,例如:用数值“-3”,表示10倍,用数值“-1”表示50倍,用数值“-2”表示20倍等,同样可以实现减少存储倍数所需占用的存储空间长度。
可以理解的是,同一数值可以根据不同的精度,将小数表示成不同的整数,例如,0.022,在精度0.002下用整数11表示,也可以在精度0.0002下用整数110表示。对于采用何种精度,可以是根据小数位置以及末位整除倍数,当然,也可以根据其它方式确定,对此本申请不做限制。
那么在确定出数据项的精度后,则可以根据预先设置的精度与精度标识之间的对应关系,确定出与该精度对应的精度标识,以便于之后对数据项的处理。
在本说明书实施例中,所述根据目标精度,将待处理数据项转换为具备目标精度的数据项,可以具体包括:
根据目标精度,以及预先设置的精度与精度标识之间的对应关系,确定出与目标精度对应的精度标识;
对待处理数据项添加所述与目标精度对应的精度标识,添加所述精度标识后的待处理数据项为所述具备目标精度的数据项。
其中,这里的目标精度可以通过步骤14确定的,在确定出目标精度后,可以根据预先设置的精度与精度标识之间的对应关系,确定出与目标精度对应的精度标识,例如,若目标精度为0.002,则对应的精度标识可以是数值“8”。
这里对该待处理数据项添加与目标精度对应的精度标识,以便于之后将待处理数据项转化成整数时,是根据目标精度转化成对应的整数,举例来说,待处理数据项的精度可以是0.002,该精度下的精度标识应该为数值“8”,而目标数据项的目标精度可以是0.005,对应的精度标识为数值“7”,那么对待处理数据项添加所述与目标精度对应的精度标识,可以具体包括将精度标识“7”赋值到表示待处理数据项的精度标识的变量上,在之后将待处理数据项转化成整数时,则可以根据精度0.005转化成对应的整数。
步骤16:基于目标数据项和转换得到的具备目标精度的数据项,执行基于数据项之间相对变化值的压缩存储。
这里的目标数据项可以是通过步骤13确定的,这里的具备目标精度的数据项可以是通过步骤15转换得到的。
这里的执行基于数据项之间相对变化值的压缩存储,可以是与所述“基于数据项之间相对变化值的压缩存储方法”中记载的方法相同,在此不做赘述。
在本说明书实施例中,所述基于目标数据项和转换得到的具备目标精度的数据项,执行基于数据项之间相对变化值的压缩存储,如图2所示,可以具体包括以下步骤:
步骤161:针对待处理数据项,基于为待处理数据项添加的精度标识,确定待处理数据项的精度。
在实际应用中,可以具体根据添加的精度标识,以及所述预设的精度与精度标识的对应关系,确定出待处理数据项的精度。举例来说,若待处理数据项添加的精度标识为数值“7”,那么根据预设的各精度与精度标识的对应关系可以得知,该精度标识对应的精度为0.005,则确定出待处理数据项的精度对应为0.005。
步骤162:根据步骤161确定出的待处理数据项的精度,将待处理数据项转换为与所述待处理数据项对应的第一整数。
将待处理数据项转换为与待处理数据项对应的第一整数,可以具体是将待处理数据项除以根据步骤161确定出的待处理数据项的精度得到的整数。
在实际应用中,由于计算机在执行除法运算的计算过程较为复杂,比如:采用浮点数运算的方式,这种方式还可能会产生浮点误差,而在执行乘法运算时更为容易,且计算效率较高,在本说明书实施例中,将待处理数据项转换成第一整数的运算可以具体包括:
计算待处理数据项的精度和预设数值的第一乘积;在实际应用中,由于如上所述的成交量或价格可以是1或者2或者5的倍数,这里的预设数值可以设置为2或者5,可以理解的是乘以2和乘以5不会同时发生。
根据计算得到的第一乘积,以及用于计算x的计算方式,计算所述x;所述用于计算x的计算方式为:10x=第一乘积;
计算待处理数据项和所述预设数值的第二乘积。
根据计算得到的x,以及用于计算第一整数的计算方式,计算得到所述第一整数;所述用于计算第一整数的计算方式为:所述第一整数=第二乘积×10-x。在一种实施方式中,若在执行第二部分得到的运算结果中产生小数部分,由于计算机通常只能存储整数,这里还可以按照“四舍六入五取偶”的算法取整,以得到第一整数。
在实际应用中,在计算所述第一整数=第二乘积×10-x时,相当于将第二乘积除以10x,在实际应用中,为了避免进行除法运算以及避免浮点误差的产生,可以使用字符串截取的方法截取字符串,再对截取的字符串移动小数点等方式实现除法运算,即,截取第二乘积,对截取的第二乘积移动x次小数点,并按需补零,可以理解的是,若x为正整数则可以是向左移动小数点,若x为负整数则可以是向右移动小数点。
举例来说,待处理数据项为0.022,确定出的精度为0.005,为了避免做除法运算,则将0.022和0.005同时乘以2,则对应转换为0.044和0.01,然后根据0.01,即10的-2次幂,将0.044乘以10的2次幂,即,向右移动两位小数点,得到4.4,即得到了0.022除以0.005的值,由于4.4包含小数部分,则按照所述“四舍六入五取偶”,最终结果为4。也就是说,在精度0.005下,表示0.022的整数为4,可以知晓,在该精度下实际值为0.02,这是由于精度降低产生的误差,在某些对数据的精度要求不高的情况下,这种误差可以被接受。
步骤163:针对目标数据项,根据目标精度将目标数据项转换为与目标数据项对应的第二整数。
这里的将目标数据项转换为与目标数据项对应的第二整数,可以具体是将目标数据项除以目标精度得到的数。得到的该数一般是整数,或者是具备的小数位数少于目标数据项所具备的小数位数的小数。
在实际应用中,这里的转换第二整数的方法可以与步骤163中转换第一整数的方法相同,在此不做赘述。
举例来说,目标数据项为0.022,目标精度为0.002,为了避免做除法运算,则将0.022和0.002同时乘以5,则对应转换为0.11和0.01,然后根据0.01,即,10的-2次幂,将0.11乘以10的2次幂,即得到了0.022除以0.002的值。也就是说,整数11代表目标数据项0.022。
步骤164:基于第一整数与第二整数,执行基于数据项之间相对变化值的压缩存储。
这里的第一整数可以通过步骤162计算出来的,这里的第二整数可以是通过步骤163计算出来的。
在实际应用中,基于第一整数与第二整数,执行基于数据项之间相对相对值的压缩存储可以采用与上文中称为“基于数据项之间相对变化值的压缩存储方法”中记载的相同的方法,在此不做赘述。
在本说明书实施例中,由于相较于所述“基于数据项之间相对变化值的压缩存储方法”,增加了类型为盘后成交量的数据项、类型为成交额的数据项、类型为盘后成交额的数据项,在计算相对变化值时,对于类型为盘后成交量的数据项可以是计算当前时间点的盘后成交量与在时间点的盘后成交量带符号的差值;对于类型为成交额的数据项,判断成交额是否等于收盘价与成交量的积,若不等于,则计算成交额与所述收盘价与成交量的积的带符号的差值,若等于,则计算当前时间点成交额与在先时间点的成交额的带符号的差值;对于类型为盘后成交额的数据项,可以与类型为成交额的数据项相同的相对变化值的计算方式,在此不再赘述。
在实际应用中,相对于目标数据项和待处理处理数据项来说,基于通过步骤161至步骤163计算出来的相邻时间点的第一整数和第二整数得到的相对变化值通常也较小,这里可以对计算出的相对变化值按位进行编码,具体来说可以包括:用若干个bit,最初一个bit表示符号位,之后用n+1个bit表示相对变化值的绝对值,最后用一个bit表示编码结束,例如:相对变化值为“-3”,则可以为编码“0110”,其中第一位0表示负号,之后2个1再加1表示3,最后一位0表示编码结束。
可以理解,在实际压缩的过程中,应将处理原始证券交易数据的一些规则写入压缩后的数据中,以方便解压缩。
在本说明书实施例中,通过将确定出的目标数据项的精度作为目标精度,根据确定出的目标精度,将待处理数据项转换为具备目标精度的数据项,基于目标数据项和转换得到的具备目标精度的数据项,执行基于数据项之间相对变化值的存储,针对现有技术中存在的缺陷,可以实现在数据项精度不一致的情况下,实施基于数据项之间相对变化值的压缩存储,提高了数据压缩的效率。
在本说明书一个或多个实施例中,相较于所述的“基于数据项之间相对变化值的压缩存储方法”,由于增加了精度标识、盘后成交量、盘后成交额等数据,以及为了应对获取的原始证券交易数据中可能出现的特殊情况,例如:价格独立、异常交易日等情况,还可以设置针对增加的数据和对应特殊情况的全局变量,例如,如表1中设置的各全局变量,以便于对各全局变量写入相应的数据,以及对各数据项执行相对变化值的存储处理。其中,所述价格独立,可以是获取到的原始证券交易数据中某个时间点的最高价低于其他价格或者最低价高于其他价格的情况,这种情况可能由于证券交易市场规定的收盘价不包含在最高价和最低价之内,或者只有收盘价而其余各价格均为0等造成的;所述异常交易日可以是非交易日变为交易日的日期,例如:由于股票市场通常只在周一至周五开盘,周末可以为非交易日,若在周末出现交易日,则出现交易日的周日或者周六可以是所述异常交易日。
表1:全局变量表
在本说明书一个或多个实施例中,由于精度变化、价格独立或者成交额的表现形式不同等情况,可能出现编码前一条数据的编码方式不能适配于编码后一条数据的情况,这里也将不能用编码前一数据的编码方式编码后一数据项的情况称为必要跳变,反之为不必要跳变。
在实际应用中,由于考虑到编码“必要跳变”或“不必要跳变”这个事件可能要额外消耗比特,或者说额外占用存储空间。对于必要跳变,可以理解为,要改变编码方式以编码后一条数据,则可以直接编码“必要跳变”这一事件。进一步的为了减少存储空间的占用,针对不必要跳变,可以理解为,可以用编码前一条数据的编码方式编码后一条数据。对于是否改变编码方式,则判断编码“不必要跳变”这个事件可能消耗的比特和直接用编码前一条数据的编码方式编码后一条数据可能消耗的比特,取消耗的比特较小的判断结果执行编码。
这里以精度发生变化做解释说明,按照时间顺序来说,可能出现后一时间点的精度低于前一时间点的精度的情况,即,精度减小,可以理解的是,通常情况下可以用与高精度对应的编码方式编码与低精度对应的数据,精度减小可以为不必要跳变。举例来说,有五个数据项的精度分别为:0.02、0.02、0.1、0.02、0.02。可以发现,由第二个精度0.02跳变到第三个精度0.1为不必要跳变,假设编码该不必要跳变这个事件可能消耗16bit,可以简单理解为,编码改变第二个数据的精度标识可能消耗16bit。而对于直接用与精度0.02对应的编码方式,编码与0.1对应的数据,消耗的比特可能只有3bit。那么取消耗比特较小的结果,可以是直接用与较高精度0.02对应的编码方式编码精度较低0.1对应的数据。
在本说明书实施例中,通过对不必要跳变,比较编码“不必要跳变”这一事件消耗的比特和用编码前一条数据的编码方式编码后一条数据分别消耗的比特,取消耗比特较小的判断结果执行编码,可以减少存储空间的占用,也可以实现压缩证券交易数据。
以上为本说明书实施例所提供的证券交易数据压缩方法,基于相同的发明构思,本说明书实施例还提供了相应的证券交易数据压缩装置。如图3所示,该装置具体包括:
获取模块21,用于获取多个时间点分别对应的原始证券交易数据;所述原始证券交易数据包括多个数据项;
触发模块22,用于针对获取的原始证券交易数据包含的每种类型的数据项,分别触发目标数据项选取模块23、目标精度确定模块24、转换模块25、执行存储压缩模块26;
所述目标数据项选取模块23,用于从获取的原始证券交易数据包含的该类型的数据项中选取目标数据项;
所述目标精度确定模块24,用于确定所述目标数据项的精度作为目标精度;
所述转换模块25,用于根据所述目标精度,将待处理数据项转换为具备目标精度的数据项;所述待处理数据项,为所述目标数据项对应的时间点的至少一个基准在先时间点所对应的该类型的数据项;
所述执行模块26,用于基于所述目标数据项和转换得到的具备目标精度的数据项,执行基于数据项之间相对变化值的压缩存储。
上述装置实施例的具体工作流程可以包括:获取模块21,获取多个时间点分别对应的原始证券交易数据;触发模块22,针对获取的原始证券交易数据包含的每种类型的数据项,分别触发目标数据项选取模块23、目标精度确定模块24、转换模块25、执行存储压缩模块26;目标数据项选取模块23,从获取的原始证券交易数据包含的该类型的数据项中选取目标数据项;目标精度确定模块24,确定目标数据项的精度作为目标精度;转换模块25,根据目标精度,将待处理数据项转换为具备目标精度的数据项;执行模块26,基于目标数据项和转换得到的具备目标精度的数据项,执行基于数据项之间相对变化值的压缩存储。
在一种实施方式中,所述目标数据项选取模块23,具体包括:
第一确定单元,用于确定所述多个时间点分别对应的该类型的各数据项的精度;
判断单元,用于通过比较所述多个时间点中每对相邻时间点分别对应的该类型的各数据项的精度,判断是否存在相邻时间点分别对应的该类型的各数据项的精度不一致的情况;
选取单元,用于若判断结果为存在,则根据精度不一致的该类型的数据项分别对应的相邻时间点的先后顺序,从获取的原始证券交易数据包含的该类型的数据项中选取数据项,作为目标数据项。
在一种实施方式中,所述选取单元具体用于:根据所述先后顺序,从获取的原始证券交易数据包含的该类型的数据项中,选取所述对应的相邻时间点中的在后时间点对应的数据项,作为所述目标数据项。
在一种实施方式中,所述多个数据项,具体包括类型为价格的数据项、类型为成交量的数据项、类型为成交额的数据项、类型为盘后成交额的数据项以及类型为盘后成交量的数据项中的至少一种。
在一种实施方式中,所述转换模块25,具体包括:
第二确定单元,用于根据所述目标精度,以及预先设置的精度与精度标识之间的对应关系,确定出与所述目标精度对应的精度标识;
添加标识单元,用于对所述待处理数据项添加所述与目标精度对应的精度标识,添加所述精度标识后的待处理数据项为所述具备目标精度的数据项。
在一种实施方式中,执行模块26,具体包括:
第三确定单元,用于针对所述待处理数据项,基于为所述待处理数据项添加的精度标识,确定所述待处理数据项的精度;
第一转换单元,用于根据确定出的待处理数据项的精度,将所述待处理数据项转换为与所述待处理数据项对应的第一整数;
第二转换单元,用于针对所述目标数据项,根据所述目标精度,将所述目标数据项转换为与所述目标数据项对应的第二整数;
执行单元,用于基于所述第一整数与所述第二整数,执行基于数据项之间相对变化值的压缩存储。
在一种实施方式中,所述第一转换单元,具体包括:
第一计算子单元,用于计算所述待处理数据项的精度和预设数值的第一乘积;所述预设数值为2或5;
第二计算子单元,用于根据计算得到的第一乘积,以及用于计算x的计算方式,计算所述x;所述用于计算x的计算方式为:10x=第一乘积;
第三计算子单元,用于计算所述待处理数据项和所述预设数值的第二乘积;
第四计算子单元,用于根据计算得到的x,以及用于计算第一整数的计算方式,计算得到所述第一整数;所述用于计算第一整数的计算方式为:所述第一整数=第二乘积×10-x。
在本说明书实施例中,通过将确定出的目标数据项的精度作为目标精度,根据确定出的目标精度,将待处理数据项转换为具备目标精度的数据项,基于目标数据项和转换得到的具备目标精度的数据项,执行基于数据项之间相对变化值的压缩存储,针对现有技术中存在的缺陷,可以实现在数据项精度不一致的情况下,实施基于数据项之间相对变化值的压缩存储,提高了数据压缩的效率。
本说明书实施例还提出了一种电子设备,示意图请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成应用证券交易数据压缩装置。处理器,执行存储器所存放的程序,并至少用于执行以下操作:获取多个时间点分别对应的原始证券交易数据;所述原始证券交易数据包括多个数据项;
针对获取的原始证券交易数据包含的每种类型的数据项,分别执行:
从获取的原始证券交易数据包含的该类型的数据项中选取目标数据项;
确定目标数据项的精度作为目标精度;
根据目标精度,将待处理数据项转换为具备目标精度的数据项;所述待处理数据项,为所述目标数据项对应的时间点的基准在先时间点所对应的该类型的数据项;
基于目标数据项和转换得到的具备目标精度的数据项,执行基于数据项之间相对变化值的压缩存储。
上述如本申请图1所示实施例揭示的证券交易数据压缩的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Fetwork Processor,FP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1中证券交易数据压缩的方法,并实现证券交易数据压缩的装置在图1所示实施例的功能,本说明书实施例在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述证券交易数据压缩的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。