CN108470053A - 一种字符串压缩方法及装置 - Google Patents

一种字符串压缩方法及装置 Download PDF

Info

Publication number
CN108470053A
CN108470053A CN201810209314.0A CN201810209314A CN108470053A CN 108470053 A CN108470053 A CN 108470053A CN 201810209314 A CN201810209314 A CN 201810209314A CN 108470053 A CN108470053 A CN 108470053A
Authority
CN
China
Prior art keywords
character string
character
group
string group
established
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810209314.0A
Other languages
English (en)
Inventor
姜树宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Si Tech Information Technology Co Ltd
Original Assignee
Beijing Si Tech Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Si Tech Information Technology Co Ltd filed Critical Beijing Si Tech Information Technology Co Ltd
Priority to CN201810209314.0A priority Critical patent/CN108470053A/zh
Publication of CN108470053A publication Critical patent/CN108470053A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种字符串压缩方法及装置。该方法包括:获取第一字符串组,第一字符串组包含至少两个字符串,以及与至少两个字符串中的每一个字符串对应的key值;对第一字符串组进行格式转换,获取第二字符串组;获取在第二字符串组中数量高于预设阈值的第一字符串;根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符;将第二字符串组中所有第一字符串均替换为所述与所述第一字符串对应的字符,获取第三字符串组。通过上述方式,可以实现字符串的压缩,从而可以缩短字符串的字节所占用的内存空间,节省系统资源。而且保留了其他存储模式,对系统冲击较小,方便实施。

Description

一种字符串压缩方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种字符串压缩方法及装置。
背景技术
由于数据时代的来临,字符串长度越来越长,例如用户号码、套餐ID以及套餐优惠轨迹中的字符串等的长度都相对较长,数据统计分析过程中,在用户没有订购任何套餐的情况下,套餐优惠轨迹中的累积量就可以占用450字符左右,如果再加上订购的累积量,字符串的长度将会更大。就目前采用的技术而言,对于字符串长度的缩减是不能实现的,其原因在于以下两种:第一,现有系统套餐中的ID必须要主系统侧的套餐ID一致,以保证现有系统中与该套餐ID对应的资源数据和主系统侧该套餐ID对应的资源数据同步更新。所以系统套餐中的ID不能随意的缩减。第二,字符串中的每一个字符都可能表达一种含义,例如字符串0000000中,第一字符串“0”代表普通资费,第二字符“0”代表流量结转资费,第三字符“0”则表示是否插入bssuserfav,第四字符“0”代表共享资费等等。因此,字符串无法随意的缩减。因此,采用何种方式实现缩短字符串的长度成为亟待解决的技术问题。
发明内容
为解决上述技术问题,本发明提供了一种字符串压缩方法及装置。
第一方面,本发明提供了一种字符串压缩方法,该方法包括:
获取第一字符串组,第一字符串组包含至少两个字符串,以及与至少两个字符串中的每一个字符串对应的key值;
对第一字符串组进行格式转换,获取第二字符串组;
获取在第二字符串组中数量高于预设阈值的第一字符串;
根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符,其中预建立的字符映射表为包含key值和字符之间的映射关系的字符映射表;
将第二字符串组中所有第一字符串均替换为与第一字符串对应的字符,获取第三字符串组。
本发明的有益效果是:将第一字符串组中的字符串进行格式转换,获取第二字符串组其目的是在于方便格式转换的字符串可以被系统兼容,其他操作模块均可以识别。将第二字符串组中数量高的第一字符串替换为预设字符,获取第三字符串组,可以实现字符串的压缩,从而可以缩短字符串的字节所占用的内存空间,节省系统资源。而且保留了其他存储模式,对系统冲击较小,方便实施。而进行字符串的压缩并非是随意压缩,而是将其替换为预建立的字符串映射表中与该第一字符串对应的字符。而查找与第一字符串对应的字符则是根据与第一字符串对应的key值在预建立的字符串映射表中查找。
进一步,第二字符串组中的字符串均为十进制字符串,将第二字符串组中所有第一字符串均替换为与第一字符串对应的字符,获取第三字符串组之后,方法还包括:
获取第三字符串组中数量低于预设阈值的第二字符串,将第二字符串进行十六进制转换或三十二进制转换,获取第四字符串组。
采用上述进一步的方案的有益技术效果在于,将第三字符串组中的数量低于预设阈值的第二字符串,将其十进制的形式按照十六进制或者三十二进制进行转换,可以进一步缩减字符串所占用的字节数,节省系统资源。
进一步,对第一字符串组进行格式转换,获取第二字符串组,具体包括:
利用字符串转换STR_tranfer方法,对第一字符串组进行格式转换,获取第二字符串组。
采用上述进一步的技术方案的有益技术效果在于,通过字符串转换方法,对第一字符串组进行格式转换,可以实现系统兼容。
进一步的,预建立的字符映射表存储于分布式内存数据库中,根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符之前,方法还包括:建立与分布式内存数据库之间的链接,以便根据链接进入分布式内存数据库读取预建立的字符映射表。
采用上述进一步的技术方案的有益技术效果在于,预建立的字符映射表存储于分布式内存数据库中,存放于私有内存中,进一步的减少系统内存。
进一步的,根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符,具体包括:
根据第一字符串对应的key值,利用hashmap算法从预建立的字符映射表中查找与第一字符串对应的字符。
采用上述进一步的技术方案的有益技术效果在于,利用hashmap算法从预建立的字符映射表中查找与第一字符串对应的字符,可以更加快速反应,提升工作效率。
第二方面,本发明提供了一种字符串压缩装置,该装置包括:调用单元,用于获取第一字符串组,第一字符串组包含至少两个字符串,以及与至少两个字符串中的每一个字符串对应的key值;
格式转换单元,用于对第一字符串组进行格式转换,获取第二字符串组;
获取单元,用于获取在第二字符串组中数量高于预设阈值的第一字符串;
查找单元,根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符,其中预建立的字符映射表为包含key值和字符之间的映射关系的字符映射表;
处理单元,用于将第二字符串组中所有第一字符串均替换为与第一字符串对应的字符,获取第三字符串组。
本发明的有益效果是:将第一字符串组中的字符串进行格式转换,获取第二字符串组其目的是在于方便格式转换的字符串可以被系统兼容,其他操作模块均可以识别。将第二字符串组中数量高的第一字符串替换为预设字符,获取第三字符串组,可以实现字符串的压缩,从而可以缩短字符串的字节所占用的内存空间,节省系统资源。而且保留了其他存储模式,对系统冲击较小,方便实施。而进行字符串的压缩并非是随意压缩,而是将其替换为预建立的字符串映射表中与该第一字符串对应的字符。而查找与第一字符串对应的字符则是根据与第一字符串对应的key值在预建立的字符串映射表中查找。
进一步的,第二字符串组中的字符串均为十进制字符串,处理单元,具体用于获取第三字符串组中数量低于预设阈值的第二字符串,将第二字符串进行十六进制转换或三十二进制转换,获取第四字符串组。
采用上述进一步的方案的有益技术效果在于,将第三字符串组中的数量低于预设阈值的第二字符串,将其十进制的形式按照十六进制或者三十二进制进行转换,可以进一步缩减字符串所占用的字节数,节省系统资源。
进一步的,格式转换单元,具体用于利用字符串转换STR_tranfer方法,对第一字符串组进行格式转换,获取第二字符串组。
采用上述进一步的技术方案的有益技术效果在于,通过字符串转换方法,对第一字符串组进行格式转换,可以实现系统兼容。
进一步的,装置还包括:链接建立单元,用于建立与分布式内存数据库之间的链接,以便根据链接进入分布式内存数据库读取预建立的字符映射表。
采用上述进一步的技术方案的有益技术效果在于,预建立的字符映射表存储于分布式内存数据库中,存放于私有内存中,进一步的减少系统内存。
进一步的,查找单元具体用于,根据第一字符串对应的key值,利用hashmap算法从预建立的字符映射表中查找与第一字符串对应的字符。
采用上述进一步的技术方案的有益技术效果在于,利用hashmap算法从预建立的字符映射表中查找与第一字符串对应的字符,可以更加快速反应,提升工作效率。
附图说明
图1为本发明实施例提供的一种字符串压缩方法流程示意图;
图2为本发明实施例提供的另一种字符串压缩方法流程示意图;
图3为本发明实施例提供的一组原始的字符串组中的局部字符串构成的示意图;
图4为本发明实施例提供的将图3中的字符串组中第一字符串替换为相应字符后的字符串组示意图;
图5为本发明实施例提供的将图4中的第二字符串进一步转换为十六进制后的字符串组示意图;
图6为本发明实施例提供的一种字符串压缩装置结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透切理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
图1为本发明实施例提供的一种字符串压缩方法流程示意图。如图1所示,该方法包括:
步骤110,获取第一字符串组。
具体的,字符串组通常为与用户通信相关的信息,例如用户号码、套餐ID、套餐优惠轨迹等等。客户端可以通过调用STR_tranfer,来获取字符串组。其中,第一字符串组包含至少两个字符串,以及与至少两个字符串中每一个字符串对应的key值。
步骤120,对第一字符串组进行格式转换,获取第二字符串组。
具体的,将第一字符串组进行格式转换,转换为第二字符串组。格式进行统一转换后,方便系统识别,以便后续使用时,可以被系统中的各个模块兼容和识别。
步骤130,获取在第二字符串组中数量高于预设阈值的第一字符串。
步骤140,根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符。
其中,预建立的字符映射表为包含key值和字符之间的映射关系的字符映射表。
这个字符映射表实际是将“字典算法”和key-value算法相结合所建立的一个字符映射表,因此字符映射表中包含key值和字符之间的映射关系。
步骤150,将第二字符串组中所有第一字符串均替换为与第一字符串对应的字符,获取第三字符串组。
具体的,按照步骤140的方式,在字符映射表中查找到与第一字符串对应的字符,然后将第二字符串组中所有的第一字符串统一替换为与之对应的字符,从而实现字符串的压缩,缩短字符串的字节所占用的内存空间,节省系统资源。
本发明实施例提供的一种字符串压缩方法,将第一字符串组中的字符串进行格式转换,获取第二字符串组其目的是在于方便格式转换的字符串可以被系统兼容,其他操作模块均可以识别。将第二字符串组中数量高的第一字符串替换为预设字符,获取第三字符串组,可以实现字符串的压缩,从而可以缩短字符串的字节所占用的内存空间,节省系统资源。而且保留了其他存储模式,对系统冲击较小,方便实施。而进行字符串的压缩并非是随意压缩,而是将其替换为预建立的字符串映射表中与该第一字符串对应的字符。而查找与第一字符串对应的字符则是根据与第一字符串对应的key值在预建立的字符串映射表中查找。
为进一步的详细说明本发明实施例的技术方案,本发明实施例还提供了另一种字符串压缩方法流程示意图,具体如图2所示,该方法包括:
步骤110,获取第一字符串组。
具体的,字符串组通常为与用户通信相关的信息,例如用户号码、套餐ID、套餐优惠轨迹等等。客户端可以通过调用STR_tranfer,来获取字符串组。其中,第一字符串组包含至少两个字符串,以及与至少两个字符串中每一个字符串对应的key值。
步骤120,对第一字符串组进行格式转换,获取第二字符串组。
具体的,将第一字符串组进行格式转换,转换为第二字符串组。格式进行统一转换后,方便系统识别,以便后续使用时,可以被系统中的各个模块兼容和识别。
在本发明的一个具体例子中,可以采用STR_tranfer方法,对第一字符串组进行格式转换,获取第二字符串组。
步骤130,获取在第二字符串组中数量高于预设阈值的第一字符串。
步骤140,根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符。
其中,预建立的字符映射表为包含key值和字符之间的映射关系的字符映射表。
这个字符映射表实际是将“字典算法”和key-value算法相结合所建立的一个字符映射表,因此字符映射表中包含key值和字符之间的映射关系。
可选的,在查找字符映射表中与第一字符串相应的key值的字符时,可以采用优化hashmap算法做关联查找,从而加快查找的速度。
步骤150,将第二字符串组中所有第一字符串均替换为与第一字符串对应的字符,获取第三字符串组。
具体的,按照步骤140的方式,在字符映射表中查找到与第一字符串对应的字符,然后将第二字符串组中所有的第一字符串统一替换为与之对应的字符,从而实现字符串的压缩,缩短字符串的字节所占用的内存空间,节省系统资源。
需要说明的是,第一字符串并非指的是某一个固定的字符串,而是可以为任一个数量大于预设阈值的字符串。例如,在一个具体的例子中,例如:预设阈值为100,以下字符串为在第二字符串组中出现的频率大于100的字符串,即在第二字符串组中的数量大于100的“第一字符串”。按照key-value的方式设定每一个字符串对应一个key值,然后将其对应的key值和字符存储在字符映射表中。
将字符串“00000000,LLFXY^10CYCLE^3^1@”替换为“<1>”;
将字符串“00000000,LLFXY^60CYCLE^3^0@”替换为“<2>”;
将字符串“00000000,TWFD^twfd^3^1@”替换为“<3>”;
将字符串“00000000,LLFD^LLFD001^3^1@”替换为“<4>”;
将字符串“00000000,600FD^600fd^1^1@”替换为“<5>”;
将字符串“9999999999”替换为“<6>”等。
上述所说的字符映射表可以理解为是一个字典列表。该字典列表存放于分布式内存数据库中。程序可以一次性读取,分布式内存数据库中可以存放多张类似的字典列表,但是每一张字典列表都不建议存放过多的数据,避免在后续需要替换时,查找过程浪费更多的时间,降低工作效率。
可选的,因为字典列表存放于分布式内存数据库中,所以需要一个链接实现系统能够访问分布式内存数据库。因此,在执行步骤140之前,该方法还可以包括步骤135,建立与分布式内存数据库之间的链接。以便根据链接进入分布式内存数据库读取预建立的字符映射表。
图3给出了一组原始的字符串组中的局部字符串构成的示意图,图4为按照上述方法进行压缩后的示意图。通过上述方法,将字符串所占用的字节从525缩减到389。
进一步可选的,除了可以将第二字符串组中所有第一字符串均替换为与第一字符串对应的字符,实现字符压缩以外,该方法还可以包括步骤160:获取第三字符串组中数量低于预设阈值的第二字符串,将第二字符串进行十六进制转换或三十二进制转换,获取第四字符串组。
具体的,根据步骤110至步骤150虽然可以缩减一些字符串所占用的字节数。但是,还可以通过将其他的字符串按照十六进制或者三十二进制进行转换,由此实现进一步的字节缩减。
具体如图5所示,图5为将图4中的第二字符串进一步转换为十六进制后的示意图。当然,这里的“第二”同样是指任一种数量低于预设阈值的字符串,而并非是特指某一个字符串。
从图5可以看出,将其他字符串按照16进制进行转换后,字节进一步的从389缩减到364。
很明显,如果将图4中的第二字符串进一步转换为三十二进制,必然会更加缩减字符串所占用的字节数。
本发明实施例提供的一种字符串压缩方法,将第一字符串组中的字符串进行格式转换,获取第二字符串组其目的是在于方便格式转换的字符串可以被系统兼容,其他操作模块均可以识别。将第二字符串组中数量高的第一字符串替换为预设字符,获取第三字符串组,可以实现字符串的压缩,从而可以缩短字符串的字节所占用的内存空间,节省系统资源。而且保留了其他存储模式,对系统冲击较小,方便实施。而进行字符串的压缩并非是随意压缩,而是将其替换为预建立的字符串映射表中与该第一字符串对应的字符。而查找与第一字符串对应的字符则是根据与第一字符串对应的key值在预建立的字符串映射表中查找。
而且,正因为由于本申请文件中为每一个字符串设定唯一一个key值,在有新的字符串要加入时,可以不用将其加入到规定位置,比如原来有40个字符串,现有一个字符串需要加入到第37个字符串和第38个字符串之间,如果按照现有方法必然导致第38个字符串开始到后面的字符串按序串位处理,但是现在则只需要将新加入的字符串放在最后位置,而不需要移位,并且根据唯一的key值就可以精确确定其实际应该在的位置,从而方便字符串的后期拓展工作。
本发明实施例提供的一种字符串压缩方法,将第一字符串组中的字符串进行格式转换,获取第二字符串组其目的是在于方便格式转换的字符串可以被系统兼容,其他操作模块均可以识别。将第二字符串组中数量高的第一字符串替换为预设字符,获取第三字符串组,可以实现字符串的压缩,从而可以缩短字符串的字节所占用的内存空间,节省系统资源。而且保留了其他存储模式,对系统冲击较小,方便实施。而进行字符串的压缩并非是随意压缩,而是将其替换为预建立的字符串映射表中与该第一字符串对应的字符。而查找与第一字符串对应的字符则是根据与第一字符串对应的key值在预建立的字符串映射表中查找。
相应地,本发明实施例还提供了一种字符串压缩装置结构示意图。具体如图6所示,该装置包括:调用单元601、格式转换单元602、获取单元603、查找单元604以及处理单元605。
调用单元601,用于获取第一字符串组,第一字符串组包含至少两个字符串,以及与至少两个字符串中的每一个字符串对应的key值。
格式转换单元602,用于对第一字符串组进行格式转换,获取第二字符串组。
获取单元603,用于获取在第二字符串组中数量高于预设阈值的第一字符串。
查找单元604,根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符,其中预建立的字符映射表为包含key值和字符之间的映射关系的字符映射表。
处理单元605,用于将第二字符串组中所有第一字符串均替换为与第一字符串对应的字符,获取第三字符串组。
可选的,格式转换单元602,具体用于利用字符串转换STR_tranfer方法,对第一字符串组进行格式转换,获取第二字符串组。
可选的,该装置还可以包括:链接建立单元606,用于在查找单元604根据第一字符串对应的key值,从预建立的字符映射表中查找与第一字符串对应的字符之前,建立与分布式内存数据库之间的链接,以便根据链接进入分布式内存数据库读取预建立的字符映射表。
进一步可选的,查找单元604具体用于,根据第一字符串对应的key值,利用hashmap算法从预建立的字符映射表中查找与第一字符串对应的字符。
可选的,第二字符串组中的字符串均为十进制字符串,处理单元605,具体用于获取第三字符串组中数量低于预设阈值的第二字符串,将第二字符串进行十六进制转换或三十二进制转换,获取第四字符串组。
该装置中的各部件所执行的功能均已经在上述实施例一种字符串压缩方法中做了详细的介绍,这里不再赘述。
本发明实施例提供的一种字符串压缩装置,将第一字符串组中的字符串进行格式转换,获取第二字符串组其目的是在于方便格式转换的字符串可以被系统兼容,其他操作模块均可以识别。将第二字符串组中数量高的第一字符串替换为预设字符,获取第三字符串组,可以实现字符串的压缩,从而可以缩短字符串的字节所占用的内存空间,节省系统资源。而且保留了其他存储模式,对系统冲击较小,方便实施。而进行字符串的压缩并非是随意压缩,而是将其替换为预建立的字符串映射表中与该第一字符串对应的字符。而查找与第一字符串对应的字符则是根据与第一字符串对应的key值在预建立的字符串映射表中查找。
此外,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现上述任一方法实施例所述的方法步骤。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种字符串压缩方法,其特征在于,所述方法包括:
获取第一字符串组,所述第一字符串组包含至少两个字符串,以及与所述至少两个字符串中的每一个字符串对应的key值;
对所述第一字符串组进行格式转换,获取第二字符串组;
获取在所述第二字符串组中数量高于预设阈值的第一字符串;
根据所述第一字符串对应的key值,从预建立的字符映射表中查找与所述第一字符串对应的字符,其中所述预建立的字符映射表为包含key值和字符之间的映射关系的字符映射表;
将所述第二字符串组中所有第一字符串均替换为所述与所述第一字符串对应的字符,获取第三字符串组。
2.根据权利要求1所述的方法,其特征在于,所述第二字符串组中的字符串均为十进制字符串,所述将所述第二字符串组中所有第一字符串均替换为所述与所述第一字符串对应的字符,获取第三字符串组之后,所述方法还包括:
获取所述第三字符串组中数量低于预设阈值的第二字符串,将所述第二字符串进行十六进制转换或三十二进制转换,获取第四字符串组。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一字符串组进行格式转换,获取第二字符串组,具体包括:
利用字符串转换STR_tranfer方法,对所述第一字符串组进行格式转换,获取所述第二字符串组。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述预建立的字符映射表存储于分布式内存数据库中,根据所述第一字符串对应的key值,从预建立的字符映射表中查找与所述第一字符串对应的字符之前,所述方法还包括:建立与所述分布式内存数据库之间的链接,以便根据所述链接进入所述分布式内存数据库读取所述预建立的字符映射表。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一字符串对应的key值,从预建立的字符映射表中查找与所述第一字符串对应的字符,具体包括:
根据所述第一字符串对应的key值,利用hashmap算法从所述预建立的字符映射表中查找与所述第一字符串对应的字符。
6.一种字符串压缩装置,其特征在于,所述装置包括:
调用单元,用于获取第一字符串组,所述第一字符串组包含至少两个字符串,以及与所述至少两个字符串中的每一个字符串对应的key值;
格式转换单元,用于对所述第一字符串组进行格式转换,获取第二字符串组;
获取单元,用于获取在所述第二字符串组中数量高于预设阈值的第一字符串;
查找单元,根据所述第一字符串对应的key值,从预建立的字符映射表中查找与所述第一字符串对应的字符,其中所述预建立的字符映射表为包含key值和字符之间的映射关系的字符映射表;
处理单元,用于将所述第二字符串组中所有第一字符串均替换为所述与所述第一字符串对应的字符,获取第三字符串组。
7.根据权利要求6所述的装置,其特征在于,所述第二字符串组中的字符串均为十进制字符串,所述处理单元,具体用于获取所述第三字符串组中数量低于预设阈值的第二字符串,将所述第二字符串进行十六进制转换或三十二进制转换,获取第四字符串组。
8.根据权利要求6所述的装置,其特征在于,所述格式转换单元,具体用于利用字符串转换STR_tranfer方法,对所述第一字符串组进行格式转换,获取所述第二字符串组。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述装置还包括:链接建立单元,用于建立与所述分布式内存数据库之间的链接,以便根据所述链接进入所述分布式内存数据库读取所述预建立的字符映射表。
10.根据权利要求6-8任一项所述的装置,其特征在于,所述查找单元具体用于,根据所述第一字符串对应的key值,利用hashmap算法从所述预建立的字符映射表中查找与所述第一字符串对应的字符。
CN201810209314.0A 2018-03-14 2018-03-14 一种字符串压缩方法及装置 Pending CN108470053A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810209314.0A CN108470053A (zh) 2018-03-14 2018-03-14 一种字符串压缩方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810209314.0A CN108470053A (zh) 2018-03-14 2018-03-14 一种字符串压缩方法及装置

Publications (1)

Publication Number Publication Date
CN108470053A true CN108470053A (zh) 2018-08-31

Family

ID=63265291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810209314.0A Pending CN108470053A (zh) 2018-03-14 2018-03-14 一种字符串压缩方法及装置

Country Status (1)

Country Link
CN (1) CN108470053A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020259400A1 (zh) * 2019-06-25 2020-12-30 比亚迪股份有限公司 编码方法、装置、存储介质及计算机设备
CN112307035A (zh) * 2020-11-26 2021-02-02 深圳云天励飞技术股份有限公司 一种特征值id的管理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003152548A (ja) * 2001-11-14 2003-05-23 Canon Inc データ圧縮における文字列検索方法
CN105450712A (zh) * 2014-09-02 2016-03-30 阿里巴巴集团控股有限公司 一种数据传输方法及装置
CN105574021A (zh) * 2014-10-14 2016-05-11 北京神州泰岳软件股份有限公司 一种数据库的数据压缩方法和装置
CN105938489A (zh) * 2016-04-14 2016-09-14 北京思特奇信息技术股份有限公司 一种压缩详单的存储和展示方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003152548A (ja) * 2001-11-14 2003-05-23 Canon Inc データ圧縮における文字列検索方法
CN105450712A (zh) * 2014-09-02 2016-03-30 阿里巴巴集团控股有限公司 一种数据传输方法及装置
CN105574021A (zh) * 2014-10-14 2016-05-11 北京神州泰岳软件股份有限公司 一种数据库的数据压缩方法和装置
CN105938489A (zh) * 2016-04-14 2016-09-14 北京思特奇信息技术股份有限公司 一种压缩详单的存储和展示方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020259400A1 (zh) * 2019-06-25 2020-12-30 比亚迪股份有限公司 编码方法、装置、存储介质及计算机设备
US11750211B2 (en) 2019-06-25 2023-09-05 Byd Company Limited Encoding method and apparatus, storage medium, and computer device
CN112307035A (zh) * 2020-11-26 2021-02-02 深圳云天励飞技术股份有限公司 一种特征值id的管理方法、装置、电子设备及存储介质
CN112307035B (zh) * 2020-11-26 2024-01-05 深圳云天励飞技术股份有限公司 一种特征值id的管理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
JP6875557B2 (ja) サービス・データをブロックチェーン・システムに書き込むための方法およびデバイス
CN101551801B (zh) 数据同步的方法和系统
CN105760199B (zh) 一种应用资源加载方法及其设备
CN109684333A (zh) 一种数据存储及裁剪方法、设备和存储介质
CN101630323B (zh) 确定自动机的空间压缩方法
CN112131218B (zh) 一种基因对比的哈希查表方法、装置、设备及存储介质
CN105975502A (zh) 一种基于cdc方式实现增量抽取数据的方法
US10998918B2 (en) Reducing the amount of data stored in a sequence of data blocks by combining deduplication and compression
CN108470053A (zh) 一种字符串压缩方法及装置
CN110059129A (zh) 数据存储方法、装置及电子设备
CN103309893A (zh) 一种字符串的比较方法及装置
CN105589908A (zh) 用于事务集合的关联规则计算方法
CN114666212A (zh) 配置数据下发方法
CN104063377A (zh) 信息处理方法和使用其的电子设备
US8347055B2 (en) Method to defrag a memory of an IC card
US10761940B2 (en) Method, device and program product for reducing data recovery time of storage system
CN106341482A (zh) 基于文件类型的云渲染混合压缩传输系统与方法
CN111352769B (zh) 恢复数据库的方法、恢复服务器及计算机可读存储介质
CN110888863A (zh) 一种状态字段优化方法、装置、电子设备及存储介质
CN110825453A (zh) 基于大数据平台的数据处理方法及装置
WO2008047975A1 (en) Migration apparatus which convert sam/vsam files of mainframe system into sam/vsam files of open system and method for thereof
CN113779006A (zh) 一种区块链中交易间重复数据删除方法、装置、系统
CN115599838B (zh) 基于人工智能的数据处理方法、装置、设备及存储介质
CN115454356B (zh) 基于识别和聚合算法的数据文件处理方法、装置和设备
JP2014059867A (ja) 順序インデックス生成システム及びその方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180831