CN116055008B - 一种用于云端服务器连接的路由器数据处理方法 - Google Patents

一种用于云端服务器连接的路由器数据处理方法 Download PDF

Info

Publication number
CN116055008B
CN116055008B CN202310334795.9A CN202310334795A CN116055008B CN 116055008 B CN116055008 B CN 116055008B CN 202310334795 A CN202310334795 A CN 202310334795A CN 116055008 B CN116055008 B CN 116055008B
Authority
CN
China
Prior art keywords
permutation
sequence
character
arrangement
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310334795.9A
Other languages
English (en)
Other versions
CN116055008A (zh
Inventor
戴凌斌
刘彦奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Magicwifi Technology Co ltd
Original Assignee
Shenzhen Magicwifi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Magicwifi Technology Co ltd filed Critical Shenzhen Magicwifi Technology Co ltd
Priority to CN202310334795.9A priority Critical patent/CN116055008B/zh
Publication of CN116055008A publication Critical patent/CN116055008A/zh
Application granted granted Critical
Publication of CN116055008B publication Critical patent/CN116055008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0006Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the transmission format
    • H04L1/0007Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the transmission format by modifying the frame length
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/04Protocols for data compression, e.g. ROHC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及数据压缩技术领域,具体涉及一种用于云端服务器连接的路由器数据处理方法,包括:获取路由器数据序列以及字符顺序序列,获得路由器数据序列的高频字符,获得所有字符区间,根据字符区间的所有排列长度对应的所有排列组合的优选度,获得字符区间的所有排列长度对应的最优排列组合,进而获得所有代表排列长度和代表排列组合,根据所有代表排列长度和代表排列组合,获得路由器数据序列的替换序列和补偿序列,对替换序列和补偿序列进行压缩,得到路由器数据序列的压缩结果。本发明根据代表排列组合将路由器数据序列转换为相关性较大的替换序列和游程较长的补偿序列,提高路由器数据的压缩效率,进而提高蓝牙路由器的传输效率。

Description

一种用于云端服务器连接的路由器数据处理方法
技术领域
本发明涉及数据压缩技术领域,具体涉及一种用于云端服务器连接的路由器数据处理方法。
背景技术
现有蓝牙路由器基本上是基于SPP协议(Serial Port Profile)与设备进行连接,使得蓝牙路由器向云端服务器传输数据时,消耗的功耗大,造成数据传输效率低;为了提高数据传输效率,通过LZ77编码对路由器数据进行压缩,减少路由器数据的数据量,基于压缩后的路由器数据进行传输,传输效率高。
但是LZ77编码本身是通过数据的相关性实现高效压缩,对于相关性较小的路由器数据,压缩率较低,需要通过增加路由器数据的相关性,进而增加路由器数据的压缩效率。
本专利提出了一种用于云端服务器连接的路由器数据处理方法,通过计算路由器数据序列中所有高频字符的排列组合的优选度,获得代表排列组合,根据代表排列组合将路由器数据序列转换为相关性较大的替换序列和游程长度较长的补偿序列,达到增大路由器数据相关性的目的,从而得到更高的压缩率。
发明内容
本发明提供一种用于云端服务器连接的路由器数据处理方法,以解决现有的问题。
本发明的一种用于云端服务器连接的路由器数据处理方法采用如下技术方案:
本发明一个实施例提供了一种用于云端服务器连接的路由器数据处理方法,该方法包括以下步骤:
将蓝牙路由器向云端服务器传输的数据包记为路由器数据序列,获取字符顺序序列;
根据获取高频字符的方法获得路由器数据序列的所有种高频字符,根据路由器数据序列的所有高频字符获得所有字符区间,根据获取高频字符的方法获得每个字符区间的所有种高频字符;
对于任意一个字符区间,根据最小数值以及字符区间的所有种高频字符的数量,获得字符区间的排列长度的取值范围,将排列长度的取值范围内的任意一个整数作为目标排列长度,根据字符区间的所有种高频字符获得目标排列长度对应的所有排列组合,根据字符顺序序列获取两个排列组合的位置差序列,根据位置差序列计算目标排列长度对应的每种排列组合的优选度,将最大的优选度对应的排列组合作为目标排列长度对应的最优排列组合;
获得字符区间的所有排列长度对应的最优排列组合,根据所有排列长度对应的最优排列组合获取字符区间的所有代表排列长度和代表排列组合,根据所有代表排列长度和代表排列组合获得字符区间的所有已匹配子串和待匹配子串;
重复获取待匹配子串的匹配排列组合操作,获取待匹配子串的所有匹配排列组合;获得每个待匹配子串的所有匹配排列组合与每个待匹配子串的位置差序列,获得每个已匹配子串与对应的最优排列组合的位置差序列,将所有待匹配子串的所有匹配排列组合与所有已匹配子串按照顺序组成的序列记为字符区间的替换序列,将所有待匹配子串和所有已匹配子串的位置差序列按照顺序组成的序列记为字符区间的补偿序列;
将所有字符区间的所有替换序列组成的序列记为路由器数据序列的替换序列,将所有字符区间的所有补偿序列组成的序列记为路由器数据序列的补偿序列,对替换序列和补偿序列进行压缩,得到路由器数据序列的压缩结果。
进一步地,所述获取高频字符的方法,包括的具体步骤如下:
统计得到序列中的所有种字符的频率,按照频率从小到大的顺序,根据所有种字符的频率获得序列的字符频率直方图,通过OTSU阈值分割方法对序列的字符频率直方图进行阈值分割,获得阈值,将字符频率直方图的横轴上的所有字符中,位于阈值右侧的每个字符作为序列的高频字符。
进一步地,所述根据路由器数据序列的所有高频字符获得所有字符区间,包括的具体步骤如下:
将任意一种高频字符作为目标高频字符,将路由器数据序列中所有目标高频字符设置为1,将路由器数据序列中除目标高频字符外的其他字符设置为0,获得目标高频字符对应的二值序列,对目标高频字符对应的二值序列进行密度聚类,获得目标高频字符的若干个密度区间;获得路由器数据序列中每种高频字符的若干个密度区间;
获得每个密度区间的第一个字符和最后一个字符在路由器数据序列中的位置,获得所有密度区间对应的位置按照从小到大的顺序组成的序列,对序列进行去重操作,将去重后的序列记为位置序列,根据位置序列将路由器数据序列划分为多个区间,将每个区间记为字符区间。
进一步地,所述根据字符区间的所有种高频字符获得目标排列长度对应的所有排列组合,包括的具体步骤如下:
将字符区间的所有种高频字符中的任意目标排列长度种高频字符组成的一种排列组合作为字符区间的目标排列长度对应的一种排列组合,获得字符区间的目标排列长度对应的所有排列组合。
进一步地,所述根据字符顺序序列获取两个排列组合的位置差序列,包括的具体步骤如下:
将第二个排列组合中第i个字符与第一个排列组合中第i个字符在字符顺序序列中的位置值的差,记为第二个排列组合中第i个字符与第一个排列组合中第i个字符的位置差,将第二个排列组合中所有字符与第一个排列组合中对应字符的位置差组成的序列记为位置差序列。
进一步地,所述根据位置差序列计算目标排列长度对应的每种排列组合的优选度,包括的具体步骤如下:
获得字符区间中所有相邻的目标排列长度个字符组成的子序列,将所有子序列组 成的集合记为字符区间的目标排列长度对应的子序列集合,字符区间的长度为L,目标排列 长度为
Figure SMS_1
,则子序列集合中共有
Figure SMS_2
个字序列;
目标排列长度对应的任意一种排列组合作为目标排列组合,将目标排列长度对应的所有排列组合中的剩余的排列组合作为非目标排列组合,目标排列组合的优选度的计算公式为:
Figure SMS_3
式中,
Figure SMS_4
表示目标排列组合的优选度,R表示目标排列长度对应的所有种排列组合 的数量,
Figure SMS_5
表示第i个非目标排列组合在字符区间的目标排列长度对应的子序列集合中的 频数,
Figure SMS_6
表示字符区间的长度,
Figure SMS_7
表示目标排列长度,
Figure SMS_8
表示目标排列组合与第i个非目标排列 组合的位置差序列的信息熵。
进一步地,所述根据所有排列长度对应的最优排列组合获取字符区间的所有代表排列长度和代表排列组合,包括的具体步骤如下:
按照排列长度从小到大的顺序,依次将字符区间的每个排列长度作为目标排列长度,将除目标排列长度外剩余所有排列长度作为非目标排列长度,判断目标排列长度对应的最优排列组合是否为任意一个非目标排列长度对应的最优排列组合的子集:如果目标排列长度对应的最优排列组合不是任意一个非目标排列长度对应的最优排列组合的子集,则将目标排列长度保留,对下一个排列长度进行判断;否则,将其中排列长度最长的非目标排列长度保留,将目标排列长度以及剩余多个非目标排列长度去除,对下一个排列长度进行判断;
将最终保留的多个排列长度记为代表排列长度,按照从大到小的顺序依次记为第一代表排列长度、第二代表排列长度、…、第s代表排列长度,s表示最终保留的多个排列长度的数量,将代表排列长度对应的最优排列组合记为代表排列组合。
进一步地,所述根据所有代表排列长度和代表排列组合获得字符区间的所有已匹配子串和待匹配子串,包括的具体步骤如下:
按照从左到右的顺序,获得字符区间中与所有代表排列长度对应的最优排列组合相同的所有已匹配子串,将字符区间中剩余的所有字符组成的所有子串记为待匹配子串;
根据所有代表排列长度和代表排列组合获得字符区间的所有已匹配子串和待匹配子串。
进一步地,所述获取待匹配子串的匹配排列组合操作,包括的具体步骤如下:
获取待匹配子串的匹配排列组合的方法为:获取字符区间中前第一代表排列长度个字符组成的序列,获取第一代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第一代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第一代表排列长度个字符;否则,获取字符区间中前第二代表排列长度个字符组成的序列,获取第二代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第二代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第二代表排列长度个字符;依次类推,获取字符区间中前第s代表排列长度个字符组成的序列,获取第二代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第s代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第s代表排列长度个字符,否则,将待匹配子串的第一个字符作为待匹配子串的匹配排列组合,去除待匹配子串中第一个字符。
本发明的技术方案的有益效果是:本发明通过获取路由器数据序列中所有高频字符,获得所有高频字符组成的不同排列长度对应的所有排列组合,结合排列组合的频率和对应的位置差序列的信息熵计算每个排列组合的优选度,进而获得代表排列组合,通过将字符区间中的所有字符串转换为代表排列组合和位置差序列,用代表排列组合组成的替换序列和位置差序列组成的补偿序列表示字符区间,根据优选度获得的代表排列组合保证了替换序列中代表排列组合组成的频率大,且补偿序列中的游程长,根据代表排列组合将路由器数据序列转换为相关性较大的替换序列和游程长度较长的补偿序列,达到增大路由器数据相关性的目的,则分别用LZ77和游程编码对替换序列和补偿序列进行压缩,提高路由器数据的压缩效率,进而提高蓝牙路由器的传输效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种用于云端服务器连接的路由器数据处理方法的步骤流程图;
图2为本发明提供的划分字符区间的示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于云端服务器连接的路由器数据处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种用于云端服务器连接的路由器数据处理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种用于云端服务器连接的路由器数据处理方法的步骤流程图,该方法包括以下步骤:
S001.获取路由器数据序列以及字符顺序序列。
需要说明的是,现有蓝牙路由器基本上是基于SPP协议(Serial Port Profile)与设备进行连接,使得蓝牙路由器向云端服务器传输数据时,消耗的功耗大,造成数据传输效率低;为了提高数据传输效率,通过LZ77编码对路由器数据进行压缩,减少路由器数据的数据量,提高传输效率。
蓝牙路由器传输的数据主要由目的IP地址、源IP地址、净载数据等构成,通过将蓝牙路由器需要传输的数据划分为多个数据包,将所有数据包沿着不同的路径在一个或多个网络中进行传输,并在云端服务器上进行重新组合。因此,将蓝牙路由器中每个待传输的数据包记为一个路由器数据序列,路由器数据序列由若干个字符组成。
路由器数据序列中包括的字符的种类为:26个大写英文字母、26个小写英文字母、阿拉伯数字中的10个计数符号以及符号“#”、符号“.”和空格符号“(space)”,其中,阿拉伯数字中的十个计数符号分别为0,1,2,3,4,5,6,7,8以及9;将所有种字符按照顺序组成的序列记为字符顺序序列,从左到右字符顺序序列中每种字符的位置值依次为[1,65]。
S002.获得路由器数据序列的高频字符,根据所有高频字符获得所有字符区间,根据字符区间的所有排列长度对应的所有排列组合的优选度,获得字符区间的所有排列长度对应的最优排列组合,进而获得所有代表排列长度和代表排列组合。
1、获得路由器数据序列的高频字符,根据所有高频字符获得所有字符区间。
需要说明的是,考虑到路由器数据序列中距离较近的字符之间的相关性较大,距离较远的字符之间的相关性较小,通过路由器数据序列中高频字符的分布情况,对路由器数据序列区间划分,同一个字符区间内字符相同的程度较大,可以得到更大的压缩率。
在本实施例中,获取高频字符的方法为:统计得到序列中的所有种字符的频率,按照频率从小到大的顺序,根据所有种字符的频率获得序列的字符频率直方图,通过OTSU阈值分割方法对序列的字符频率直方图进行阈值分割,获得阈值,将字符频率直方图的横轴上的所有字符中,位于阈值右侧的每个字符作为序列的高频字符。
根据获取高频字符的方法获得路由器数据序列的所有种高频字符;将任意一种高频字符作为目标高频字符,将路由器数据序列中所有目标高频字符设置为1,将路由器数据序列中除目标高频字符外的其他字符设置为0,获得目标高频字符对应的二值序列,对目标高频字符对应的二值序列进行密度聚类,获得目标高频字符的若干个密度区间;获得路由器数据序列中每种高频字符的若干个密度区间。
获得所有密度区间的第一个字符和最后一个字符在路由器数据序列中的位置按照从小到大的顺序组成的序列,对序列进行去重操作,将去重后的序列记为位置序列,根据位置序列将路由器数据序列划分为多个区间,将每个区间记为字符区间。
例如,如图2所示为划分字符区间的示意图,前3个轴上的区间分别为a、b、c三个高频字符对应的若干个密度区间,获得的位置序列为{0,2,7,9,10,13,15,19,21,23},最后1个轴上的区间为路由器数据序列的若干个字符区间。
与直接对整个路由器数据序列进行压缩相比,先将路由器数据序列划分为多个字符区间,再对每个字符区间进行压缩,由于是根据高频字符进行字符区间的划分,所以每个字符区间中字符的高频字符的种类数较少,字符区间中数据的相同的程度较大,可以用多个字符甚至一个字符来表示字符区间,进而得到更大的压缩率。
2.根据字符区间的所有排列长度对应的所有排列组合的优选度,获得字符区间的所有排列长度对应的最优排列组合。
需要说明的是,对于字符区间中的干个字符组成的字符串,可以用若干个高频字符组成的代表排列组合以及位置差序列来表示,例如,字符串def可以用代表排列组合abc和位置差序列333,位置差序列中的第1个3,是字符d和字符a在字符顺序序列中的位置值的差,同理,位置差序列中的第2个3,是字符e和字符b在字符顺序序列中的位置值的差,位置差序列中的第3个3,是字符f和字符c在字符顺序序列中的位置值的差。通过将字符区间中的所有字符串转换为代表排列组合和位置差序列,用代表排列组合组成的替换序列和位置差序列组成的补偿序列表示字符区间,只要保证替换序列中代表排列组合组成的频率大,且补偿序列中的游程长,则分别用LZ77和游程编码对替换序列和补偿序列进行压缩,能够获得较大的压缩率。
在本实施例中,对于任意一个字符区间,根据获取高频字符的方法获得字符区间的所有种高频字符,将[2,N]作为字符区间的排列长度的取值范围,N为字符区间中所有种高频字符的数量,将字符区间的排列长度的取值范围内的任意一个整数作为目标排列长度。
将字符区间的所有种高频字符中的任意目标排列长度种高频字符组成的一种排列组合作为字符区间的目标排列长度对应的一种排列组合,获得字符区间的目标排列长度对应的所有排列组合。
获取两个排列组合的位置差序列,包括:将第二个排列组合中第i个字符与第一个排列组合中第i个字符的位置值的差记为第二个排列组合中第i个字符与第一个排列组合中第i个字符的位置差,将第二个排列组合中所有字符与第一个排列组合中对应的字符的位置差组成的序列记为位置差序列。
获得字符区间中所有相邻的目标排列长度个字符组成的子序列,将所有子序列组 成的集合记为字符区间的目标排列长度对应的子序列集合,字符区间的长度为L,目标排列 长度为
Figure SMS_9
,则子序列集合中共有
Figure SMS_10
个字序列。
目标排列长度对应的任意一种排列组合作为目标排列组合,将目标排列长度对应的所有排列组合中的剩余的排列组合作为非目标排列组合,目标排列组合的优选度的计算公式为:
Figure SMS_11
式中,
Figure SMS_12
表示目标排列组合的优选度,R表示目标排列长度对应的所有种排列组合 的数量,
Figure SMS_13
表示第i个非目标排列组合在字符区间的目标排列长度对应的子序列集合中的 频数,
Figure SMS_14
表示字符区间的长度,
Figure SMS_15
表示目标排列长度,
Figure SMS_16
表示目标排列组合与第i个非目标排列 组合的位置差序列的信息熵。
目标排列组合与第i个非目标排列组合的位置差序列中,所有位置差越一致,则位 置差序列的信息熵
Figure SMS_17
越小,所有位置差越一致,则用游程编码对位置差序列进行压缩的压 缩率越大,则目标排列组合的优选度
Figure SMS_18
越大;
Figure SMS_19
表示第i个非目标排列组合在字符区间的 目标排列长度对应的子序列集合中的频率,目标排列组合与频率越大的第i个非目标排列 组合的位置差序列的信息熵越小,则目标排列组合的优选度
Figure SMS_20
越大。优选度越大的目标排列 组合越能够表示字符区间中更多的长度等于目标排列长度的字符串,且对应的位置差序列 的游程越长,分别用LZ77和游程编码对获得的替换序列和补偿序列进行压缩的压缩率越 大。
将最大的优选度对应的排列组合作为字符区间的目标排列长度对应的最优排列组合;获得字符区间的所有排列长度对应的所有排列组合的优选度,获得字符区间的所有排列长度对应的最优排列组合。
3. 获得所有代表排列长度和代表排列组合。
需要说明的是,上述步骤获得了所有排列长度对应的最优排列组合,越大的排列长度对应的最优排列组合对应的压缩率越高,因此对于较小的排列长度对应的最优排列组合,需要判断该最优排列组合是否是某个较长的排列长度对应的最优排列组合的子集,即该最优排列组合包含在某个较长的排列长度对应的最优排列组合中,如果是,则需要将较小的排列长度对应的最优排列组合去除,保留压缩率较高的较长的排列长度对应的最优排列组合。
在本实施例中,按照排列长度从小到大的顺序,依次将字符区间的每个排列长度作为目标排列长度,将除目标排列长度外剩余所有排列长度作为非目标排列长度,判断目标排列长度对应的最优排列组合是否为任意一个非目标排列长度对应的最优排列组合的子集:如果目标排列长度对应的最优排列组合不是任意一个非目标排列长度对应的最优排列组合的子集,则将目标排列长度保留,对下一个排列长度进行判断;如果目标排列长度对应的最优排列组合是一个或者多个非目标排列长度对应的最优排列组合的子集,将其中排列长度最长的非目标排列长度保留,将目标排列长度以及剩余多个非目标排列长度去除,对下一个排列长度进行判断。
将最终保留的多个排列长度记为代表排列长度,按照从大到小的顺序依次记为第一代表排列长度、第二代表排列长度、…、第s代表排列长度,s表示最终保留的多个排列长度的数量,即代表排列长度的数量,将代表排列长度对应的最优排列组合记为代表排列组合。
例如,字符区间的所有排列长度对应的最优排列组合分别为ab、def、ghtg和ghtgf,其中,排列长度2和3对应的最优排列组合ab、def不是任意一个非目标排列长度对应的最优排列组合的子集,则保留目标排列长度ab、def,排列长度4对应的最优排列组合ghtg是排列长度5对应的最优排列组合ghtgf的子集,则将最优排列组合ghtg去除,保留最优排列组合ghtgf;最终,代表排列长度分别为2、3和5,代表排列组合分别为ab、def和ghtgf。
S003.根据所有代表排列长度和代表排列组合,获得路由器数据序列的替换序列和补偿序列。
按照从左到右的顺序,获得字符区间中的与所有代表排列长度对应的最优排列组合相同的所有子串,分别作为已匹配子串,将字符区间中剩余的所有字符组成的每个子串分别记为待匹配子串。
获取待匹配子串的匹配排列组合的方法为:获取字符区间中前第一代表排列长度个字符组成的序列,获取第一代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第一代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第一代表排列长度个字符;否则,获取字符区间中前第二代表排列长度个字符组成的序列,获取第二代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第二代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第二代表排列长度个字符;依次类推,获取字符区间中前第s代表排列长度个字符组成的序列,获取第二代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第s代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第s代表排列长度个字符,否则,将待匹配子串的第一个字符作为待匹配子串的匹配排列组合,去除待匹配子串中第一个字符。
重复上述操作,获取待匹配子串的所有匹配排列组合。
获取每个待匹配子串的所有匹配排列组合,获得每个待匹配子串的所有匹配排列组合与每个待匹配子串的位置差序列,记为每个待匹配子串的位置差序列,获得每个已匹配子串与对应的最优排列组合的位置差序列,记为每个已匹配子串的位置差序列;将所有已匹配子串与所有待匹配子串的所有匹配排列组合按照顺序组成的序列记为字符区间的替换序列,将所有待匹配子串和所有已匹配子串的位置差序列按照顺序组成的序列记为字符区间的补偿序列。
获得所有字符区间的替换序列和补偿序列,将所有字符区间的所有替换序列组成的序列记为路由器数据序列的替换序列,将所有字符区间的所有补偿序列组成的序列记为路由器数据序列的补偿序列。
例如,根据代表排列长度2、3和5,以及代表排列组合ab、def和ghtgf,对字符区间{h,i,j,k,a,b,m,n,o,r,s,e,4,u,v,6,u,t}进行操作,获得的替换序列为{d,e,f,k,a,b,d,e,f,a,b,e,4,g,h,t,g,f},获得的补偿序列为{4,4,4,0,0,0,9,9,9,17,17,0,0,14,14,14,14,14}。
S004.对替换序列和补偿序列进行压缩,得到压缩结果。
通过LZ77编码对路由器数据序列的替换序列进行压缩,通过游程编码对路由器数据序列的补偿序列进行压缩,得到压缩后的替换序列和补偿序列,作为路由器数据序列的压缩结果。
本实施例通过获取路由器数据序列中所有高频字符,获得所有高频字符组成的不同排列长度对应的所有排列组合,结合排列组合的频率和对应的位置差序列的信息熵计算每个排列组合的优选度,进而获得代表排列组合,通过将字符区间中的所有字符串转换为代表排列组合和位置差序列,用代表排列组合组成的替换序列和位置差序列组成的补偿序列表示字符区间,根据优选度获得的代表排列组合保证了替换序列中代表排列组合组成的频率大,且补偿序列中的游程长,根据代表排列组合将路由器数据序列转换为相关性较大的替换序列和游程长度较长的补偿序列,达到增大路由器数据相关性的目的,则分别用LZ77和游程编码对替换序列和补偿序列进行压缩,提高路由器数据的压缩效率,进而提高蓝牙路由器的传输效率。
对压缩后的替换序列和补偿序列进行解压,获得路由器数据序列的步骤为:分别通过LZ77编码和游程编码对压缩后的替换序列和补偿序列进行解压,获得路由器数据序列的替换序列和补偿序列,获得替换序列中的每个字符的位置值和补偿序列中的每个位置差的和在字符顺序序列中对应的字符,获得的所有字符按照顺序组成的序列为路由器数据序列。
本发明通过获取路由器数据序列中所有高频字符,获得所有高频字符组成的不同排列长度对应的所有排列组合,结合排列组合的频率和对应的位置差序列的信息熵计算每个排列组合的优选度,进而获得代表排列组合,通过将字符区间中的所有字符串转换为代表排列组合和位置差序列,用代表排列组合组成的替换序列和位置差序列组成的补偿序列表示字符区间,根据优选度获得的代表排列组合保证了替换序列中代表排列组合组成的频率大,且补偿序列中的游程长,根据代表排列组合将路由器数据序列转换为相关性较大的替换序列和游程长度较长的补偿序列,达到增大路由器数据相关性的目的,则分别用LZ77和游程编码对替换序列和补偿序列进行压缩,提高路由器数据的压缩效率,进而提高蓝牙路由器的传输效率。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。

Claims (9)

1.一种用于云端服务器连接的路由器数据处理方法,其特征在于,该方法包括以下步骤:
将蓝牙路由器向云端服务器传输的数据包记为路由器数据序列,获取字符顺序序列;
根据获取高频字符的方法获得路由器数据序列的所有种高频字符,根据路由器数据序列的所有高频字符获得所有字符区间,根据获取高频字符的方法获得每个字符区间的所有种高频字符;
对于任意一个字符区间,根据最小数值以及字符区间的所有种高频字符的数量,获得字符区间的排列长度的取值范围,将排列长度的取值范围内的任意一个整数作为目标排列长度,根据字符区间的所有种高频字符获得目标排列长度对应的所有排列组合,根据字符顺序序列获取两个排列组合的位置差序列,根据位置差序列计算目标排列长度对应的每种排列组合的优选度,将最大的优选度对应的排列组合作为目标排列长度对应的最优排列组合;
获得字符区间的所有排列长度对应的最优排列组合,根据所有排列长度对应的最优排列组合获取字符区间的所有代表排列长度和代表排列组合,根据所有代表排列长度和代表排列组合获得字符区间的所有已匹配子串和待匹配子串;
重复获取待匹配子串的匹配排列组合操作,获取待匹配子串的所有匹配排列组合;获得每个待匹配子串的所有匹配排列组合与每个待匹配子串的位置差序列,获得每个已匹配子串与对应的最优排列组合的位置差序列,将所有待匹配子串的所有匹配排列组合与所有已匹配子串按照顺序组成的序列记为字符区间的替换序列,将所有待匹配子串和所有已匹配子串的位置差序列按照顺序组成的序列记为字符区间的补偿序列;
将所有字符区间的所有替换序列组成的序列记为路由器数据序列的替换序列,将所有字符区间的所有补偿序列组成的序列记为路由器数据序列的补偿序列,对替换序列和补偿序列进行压缩,得到路由器数据序列的压缩结果。
2.根据权利要求1所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述获取高频字符的方法,包括的具体步骤如下:
统计得到序列中的所有种字符的频率,按照频率从小到大的顺序,根据所有种字符的频率获得序列的字符频率直方图,通过OTSU阈值分割方法对序列的字符频率直方图进行阈值分割,获得阈值,将字符频率直方图的横轴上的所有字符中,位于阈值右侧的每个字符作为序列的高频字符。
3.根据权利要求1所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述根据路由器数据序列的所有高频字符获得所有字符区间,包括的具体步骤如下:
将任意一种高频字符作为目标高频字符,将路由器数据序列中所有目标高频字符设置为1,将路由器数据序列中除目标高频字符外的其他字符设置为0,获得目标高频字符对应的二值序列,对目标高频字符对应的二值序列进行密度聚类,获得目标高频字符的若干个密度区间;获得路由器数据序列中每种高频字符的若干个密度区间;
获得每个密度区间的第一个字符和最后一个字符在路由器数据序列中的位置,获得所有密度区间对应的位置按照从小到大的顺序组成的序列,对序列进行去重操作,将去重后的序列记为位置序列,根据位置序列将路由器数据序列划分为多个区间,将每个区间记为字符区间。
4.根据权利要求1所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述根据字符区间的所有种高频字符获得目标排列长度对应的所有排列组合,包括的具体步骤如下:
将字符区间的所有种高频字符中的任意目标排列长度种高频字符组成的一种排列组合作为字符区间的目标排列长度对应的一种排列组合,获得字符区间的目标排列长度对应的所有排列组合。
5.根据权利要求1所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述根据字符顺序序列获取两个排列组合的位置差序列,包括的具体步骤如下:
将第二个排列组合中第i个字符与第一个排列组合中第i个字符在字符顺序序列中的位置值的差,记为第二个排列组合中第i个字符与第一个排列组合中第i个字符的位置差,将第二个排列组合中所有字符与第一个排列组合中对应字符的位置差组成的序列记为位置差序列。
6.根据权利要求1所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述根据位置差序列计算目标排列长度对应的每种排列组合的优选度,包括的具体步骤如下:
获得字符区间中所有相邻的目标排列长度个字符组成的子序列,将所有子序列组成的集合记为字符区间的目标排列长度对应的子序列集合,字符区间的长度为L,目标排列长度为
Figure QLYQS_1
,则子序列集合中共有/>
Figure QLYQS_2
个字序列;
目标排列长度对应的任意一种排列组合作为目标排列组合,将目标排列长度对应的所有排列组合中的剩余的排列组合作为非目标排列组合,目标排列组合的优选度的计算公式为:
Figure QLYQS_3
式中,
Figure QLYQS_4
表示目标排列组合的优选度,R表示目标排列长度对应的所有种排列组合的数量,/>
Figure QLYQS_5
表示第i个非目标排列组合在字符区间的目标排列长度对应的子序列集合中的频数,
Figure QLYQS_6
表示字符区间的长度,/>
Figure QLYQS_7
表示目标排列长度,/>
Figure QLYQS_8
表示目标排列组合与第i个非目标排列组合的位置差序列的信息熵。
7.根据权利要求1所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述根据所有排列长度对应的最优排列组合获取字符区间的所有代表排列长度和代表排列组合,包括的具体步骤如下:
按照排列长度从小到大的顺序,依次将字符区间的每个排列长度作为目标排列长度,将除目标排列长度外剩余所有排列长度作为非目标排列长度,判断目标排列长度对应的最优排列组合是否为任意一个非目标排列长度对应的最优排列组合的子集:如果目标排列长度对应的最优排列组合不是任意一个非目标排列长度对应的最优排列组合的子集,则将目标排列长度保留,对下一个排列长度进行判断;否则,将其中排列长度最长的非目标排列长度保留,将目标排列长度以及剩余多个非目标排列长度去除,对下一个排列长度进行判断;
将最终保留的多个排列长度记为代表排列长度,按照从大到小的顺序依次记为第一代表排列长度、第二代表排列长度、…、第s代表排列长度,s表示最终保留的多个排列长度的数量,将代表排列长度对应的最优排列组合记为代表排列组合。
8.根据权利要求1所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述根据所有代表排列长度和代表排列组合获得字符区间的所有已匹配子串和待匹配子串,包括的具体步骤如下:
按照从左到右的顺序,获得字符区间中与所有代表排列长度对应的最优排列组合相同的所有已匹配子串,将字符区间中剩余的所有字符组成的所有子串记为待匹配子串;
根据所有代表排列长度和代表排列组合获得字符区间的所有已匹配子串和待匹配子串。
9.根据权利要求7所述的一种用于云端服务器连接的路由器数据处理方法,其特征在于,所述获取待匹配子串的匹配排列组合操作,包括的具体步骤如下:
获取待匹配子串的匹配排列组合的方法为:获取字符区间中前第一代表排列长度个字符组成的序列,获取第一代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第一代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第一代表排列长度个字符;否则,获取字符区间中前第二代表排列长度个字符组成的序列,获取第二代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第二代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第二代表排列长度个字符;依次类推,获取字符区间中前第s代表排列长度个字符组成的序列,获取第二代表排列长度对应的最优排列组合与该序列的位置差序列,如果位置差序列的熵为0,则将第s代表排列长度对应的最优排列组合作为待匹配子串的匹配排列组合,去除待匹配子串中前第s代表排列长度个字符,否则,将待匹配子串的第一个字符作为待匹配子串的匹配排列组合,去除待匹配子串中第一个字符。
CN202310334795.9A 2023-03-31 2023-03-31 一种用于云端服务器连接的路由器数据处理方法 Active CN116055008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310334795.9A CN116055008B (zh) 2023-03-31 2023-03-31 一种用于云端服务器连接的路由器数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310334795.9A CN116055008B (zh) 2023-03-31 2023-03-31 一种用于云端服务器连接的路由器数据处理方法

Publications (2)

Publication Number Publication Date
CN116055008A CN116055008A (zh) 2023-05-02
CN116055008B true CN116055008B (zh) 2023-06-02

Family

ID=86127635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310334795.9A Active CN116055008B (zh) 2023-03-31 2023-03-31 一种用于云端服务器连接的路由器数据处理方法

Country Status (1)

Country Link
CN (1) CN116055008B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116366069B (zh) * 2023-06-02 2023-08-08 菏泽鹏远混凝土有限公司 一种高性能混凝土配比数据处理方法
CN117195006B (zh) * 2023-11-06 2024-03-05 南通双和食品有限公司 一种鸡肉用兽药残留数据管理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104065976A (zh) * 2014-06-27 2014-09-24 西安空间无线电技术研究所 一种基于视频的图像压缩及保密传输方法
WO2018174868A1 (en) * 2017-03-22 2018-09-27 Hewlett-Packard Development Company, L.P. Compressed versions of image data based on relationships of data

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10334219B2 (en) * 2015-10-12 2019-06-25 Lumantek Co., Ltd Apparatus for switching/routing image signals through bandwidth splitting and reduction and the method thereof
US20180253559A1 (en) * 2017-03-01 2018-09-06 Intel Corporation Secured lossless data compression using encrypted headers
US10713265B2 (en) * 2017-06-20 2020-07-14 Vmware, Inc. Methods and systems to quantize and compress time series data
JP2019036810A (ja) * 2017-08-14 2019-03-07 富士通株式会社 データ圧縮装置、データ復元装置、データ圧縮プログラム、データ復元プログラム、データ圧縮方法、およびデータ復元方法
CN115391298A (zh) * 2021-05-25 2022-11-25 戴尔产品有限公司 基于内容的动态混合数据压缩

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104065976A (zh) * 2014-06-27 2014-09-24 西安空间无线电技术研究所 一种基于视频的图像压缩及保密传输方法
WO2018174868A1 (en) * 2017-03-22 2018-09-27 Hewlett-Packard Development Company, L.P. Compressed versions of image data based on relationships of data

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Biological sequence compression algorithm based on Variable length LUT and LZ 77;Rajendra Kumar Bharti 等;《IEEE》;全文 *
多领域物理系统关联规则数据无损压缩仿真;岳巧红;;计算机仿真(第04期);全文 *

Also Published As

Publication number Publication date
CN116055008A (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
CN116055008B (zh) 一种用于云端服务器连接的路由器数据处理方法
US9223765B1 (en) Encoding and decoding data using context model grouping
WO2011007956A2 (ko) 데이터의 압축방법
CN105207678B (zh) 一种改进型lz4压缩算法的硬件实现系统
CN108737976B (zh) 一种基于北斗短报文的压缩传输方法
CN108810553B (zh) 一种基于稀疏化处理的移动节点监测数据序列压缩方法
US11923875B2 (en) Sorting network-based dynamic Huffman encoding method, apparatus and device
CN108418683B (zh) 一种基于汉字结构特征的无载体文本隐写方法
CN109450452B (zh) 一种针对基因数据的取样字典树索引的压缩方法和系统
CN107066837A (zh) 一种有参考dna序列压缩方法和系统
CN107565970B (zh) 一种基于特征识别的混合无损压缩方法及装置
CN109979537B (zh) 一种面向多条序列的基因序列数据压缩方法
CN112887291A (zh) 基于深度学习的i2p流量识别方法及系统
CN107220333B (zh) 一种基于Sunday算法的字符搜索方法
CN107277109B (zh) 针对压缩流量的多字符串匹配方法
CN115801902A (zh) 一种网络访问请求数据的压缩方法
WO2018028335A1 (zh) 极化码的速率匹配方法和装置
CN107565975A (zh) Fastq格式文件无损压缩的方法
CN104052749A (zh) 一种链路层协议数据类型识别的方法
Köppl et al. HOLZ: high-order entropy encoding of Lempel-Ziv factor distances
CN116827354B (zh) 一种文件数据分布式存储管理系统
CN110021368A (zh) 比对型基因测序数据压缩方法、系统及计算机可读介质
CN110719105B (zh) 一种测试向量的无损压缩和解压缩方法
CN104682966B (zh) 列表数据的无损压缩方法
CN106027521A (zh) 压缩方法、解压方法、压缩装置和解压装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant