CN109450450A - 一种json数据实时无损压缩以及解压方法 - Google Patents

一种json数据实时无损压缩以及解压方法 Download PDF

Info

Publication number
CN109450450A
CN109450450A CN201811210828.4A CN201811210828A CN109450450A CN 109450450 A CN109450450 A CN 109450450A CN 201811210828 A CN201811210828 A CN 201811210828A CN 109450450 A CN109450450 A CN 109450450A
Authority
CN
China
Prior art keywords
compression
json data
character
dictionary
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811210828.4A
Other languages
English (en)
Other versions
CN109450450B (zh
Inventor
杨红飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huoshi Creation Technology Co ltd
Original Assignee
Hangzhou Firestone Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Firestone Technology Co Ltd filed Critical Hangzhou Firestone Technology Co Ltd
Priority to CN201811210828.4A priority Critical patent/CN109450450B/zh
Publication of CN109450450A publication Critical patent/CN109450450A/zh
Application granted granted Critical
Publication of CN109450450B publication Critical patent/CN109450450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/70Type of the data to be coded, other than image and sound
    • H03M7/707Structured documents, e.g. XML

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种JSON数据实时无损压缩以及解压方法,该方法包含JSON数据压缩以及解压流程;所述压缩流程通过清洗组件清洗JSON数据格式中不影响数据确定性的字符,通过提取组件提取压缩字典,通过编码组件形成初步的压缩字符,最终通过合成组件完成整个JSON数据的压缩;所述解压流程通过拆解组件拆分字典以及压缩字符,通过解析组件解析压缩字符中的占位符信息和重复次数信息并对字典中的字符进行还原,最终通过还原组件还原清洗组件清除的字符信息,得到原JSON数据。本发明有效提升JSON数据包的压缩率,JSON数据越大时,压缩率越高,压缩效果越好。

Description

一种JSON数据实时无损压缩以及解压方法
技术领域
本发明涉及字典索引、排序算法以及数据存储、数据解压缩领域,具体而言是一种JSON数据实时无损压缩以及解压方法。
背景技术
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript Programming Language,Standard ECMA-262 3rd Edition-December 1999的一个子集。JSON采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率,JSON目前已经普遍使用并且成为网络传输的主流数据格式。但是JSON本身定义之初的定位是一种易于阅读和编写的数据格式,JSON数据本身存在较大的压缩和优化空间,当传输的数据量过大的时候导致消耗的流量和带宽等网络资源也越加大。
针对以上的问题,特别是在网络发达的今天,数据传输压缩愈加重要。目前存在一些开源JSON压缩算法,大部分是将JSON数据当成普通的字符串进行压缩处理,或者仅仅对重复的key或者value进行处理,这样虽然也能对JSON压缩处理,但是当JSON中属性太多,或者连续重复的字符过多时,压缩效果并不理想。
发明内容
为了解决上述技术的缺陷,本发明技术方案吸取了现有开源算法的优点,同时针对JSON数据中属性太多,连续重复字符的情况,对现有算法进行的改进和优化,目的是为了提供一种压缩率更高、压缩速度更加快捷的JSON实时无损压缩以及解压方法。
本发明的目的是通过以下技术方案来实现的:一种JSON数据实时无损压缩以及解压方法,该方法包含JSON数据压缩以及解压流程;
所述压缩流程通过清洗组件清洗JSON数据格式中不影响数据确定性的字符,通过提取组件提取压缩字典,通过编码组件形成初步的压缩字符,最终通过合成组件完成整个JSON数据的压缩;
所述解压流程通过拆解组件拆分字典以及压缩字符,通过解析组件解析压缩字符中的占位符信息和重复次数信息并对字典中的字符进行还原,最终通过还原组件还原清洗组件清除的字符信息,得到原JSON数据。
进一步地,所述清洗组件清洗的不影响数据确定性的字符包括:
清除JSON数据格式中属性的引号;
清除JSON数据格式中非纯数字字符的引号,清除纯数字字符末尾的引号;
清除布尔型数据,使用特定字符串代替。
进一步地,所述提取组件根据清洗完成的数据格式,进行最大压缩率的相同字符串提取,并生成字典;再通过编码组件进行特定占位符替换,形成新的压缩字符串,如此往复最终完全压缩所有满足条件的相同字符串。
进一步地,在提取最大压缩率的相同字符串过程中,将原字符串的所有长度大于2的字符子集取出(少于或等于2个无法满足压缩要求),并且按照子串长度从小到大排序;从前往后穷举子串集合,统计子串在原字符串中的出现次数,出现次数与子串长度相乘,得到该子串在本轮提取中的票数;例如出现“abc”字符串共10次,则“abc”得票数为30;所有子串票数统计完毕,票数最高的子串成为一个字典。
进一步地,每次计票提取出一个最大压缩率的相同字符串时,均通过编码组件进行一次编码,编码的过程包括:替换原始字符串中的提取的相同字符串为特定占位符,并按照压缩率大小对相同字符串进行排序(压缩率越高排序越靠前)、分开存储。
进一步地,所述特定占位符采用双引号加字母递增的形式,排序第一位的对应小写字母a,第二位对应小写字母b以此类推;第二十七位对应大写字母A,二十八位对应大写字母B,以此类推;超过五十二叠加一个字母,五十三位对应字母aa,以此类推。
进一步地,所述合成组件包括:
扫描编码完成后的压缩字符,检测重复且连续的占位符,并合成一个占位符,在占位符后方依次标记重复次数及引号,对于只出现一次的占位符直接添加引号;
拼接压缩后的字符串以及字典,并且使用#连接;字典间按照压缩率由高到低排序,并使用单竖线连接(字典中的单引号、#号、单竖线均使用反斜杠进行转义)。
进一步地,所述拆解组件将压缩字符串以及字典使用#号拆解,将字典字符串按照单竖线分割,保持原有顺序。
进一步地,所述解析组件用于解析引号开头、字母占位符、数字重复次数(无重复则无数字标识)以及引号结尾的压缩数据。
进一步地,所述还原组件还原清洗组件清除的字符,需要还原的信息包括:
还原JSON数据格式中属性的引号;
还原JSON数据格式中非纯数字字符的引号,还原纯数字字符末尾的引号;
将特定字符串还原成布尔型数据。
本发明的有益效果是:本发明方法通过清洗组件、提取组件、编码组件、合成组件对JSON数据包进行压缩,以生成新的压缩数据包。本发明方法通过拆解组件、解析组件、还原组件对压缩的数据包进行JSON数据格式无损还原。本发明方法有效提升JSON数据包的压缩率,JSON数据越大时,压缩率越高,压缩效果越好。
附图说明
图1是本发明的整体结构示意图;
图2是本发明中对JSON数据的压缩工作流程图;
图3是本发明中对JSON数据的解压工作流程图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。
如图1所示,一种JSON数据实时无损压缩以及解压方法,本方法有清洗组件、提取组件、编码组件、合成组件、拆解组件、解析组件、还原组件。清洗组件会对原JSON数据中不影响数据确定性的字符进行清除,已达到部分压缩效果。提取组件对字符串中的相同字符串提取、记录,编码组件对提取的字典进行占位符替换,形成新的压缩字符串。合成组件对字典进行排序组合,最终将压缩字符串以及排序好的字典进行连接组合,形成能无损解压的压缩字符串。在拆解组件对压缩字符串进行拆解,提取出字典与需要还原的压缩字符串。解析组件将字典中的值解析进入压缩字符,还原组件还原由清洗组件清除的不影响确定性的字符,最终无损的解压出原JSON数据。
如图2所示:本方法在压缩JSON数据工作过程中通过清洗组件、提取组件、编码组件、合成组件得到压缩的字符串,其具体步骤如下:
步骤一:如S11所示,在准备发送JSON数据之前,首先经过清洗组件对无用数据进行清洗。首先清除JSON数据格式中属性的引号,清除JSON数据格式中非纯数字字符的引号、纯数字字符清除末尾的引号,清除布尔型数据、使用特定字符串代替(1"代表true,0"代表false),此时对JSON数据进行第一步的压缩。
步骤二:如S12所示,提取组件根据清洗完成的数据格式,进行最大压缩率的相同字符串提取。在提取最大压缩率的相同字符串过程中,按照字符的长度、出现次数进行计票,压缩一个字符计一票,一个相同字符串的总票数等于字符长度乘以出现次数,票数最高的字符成为一个字典。字符长度至少超过2个,少于或等于2个无法满足压缩要求,不能成为一个字典。
步骤三:如S13所示,每找出一个字典,编码组件即可使用占位符替换原始字符中的字典字符串成为特定的占位符(双引号加字母递增)。重复步骤二、步骤三,直至无满足条件的字符。字母占位符定义规则如下:排序第一位的对应小写字母a,第二位对应小写字母b以此类推;第二十七位对应大写字母A,二十八位对应大写字母B,以此类推;超过五十二叠加一个字母,五十三位对应字母aa,以此类推。
步骤四:如S14所示,合成组件组合字典排序按照压缩率越高的字典排在前面,字典与字典之间使用“|”单竖线进行连接,字典中的单引号、#号、单竖线均使用反斜杠(“\”)进行转义。并且合成组件会检测压缩字符中重复且连续的占位符,并合成一个占位符,在占位符后方增加数字以及引号进行标记。对于只出现一次的占位符直接添加引号。最终合成组件使用“#”号连接压缩字符以及字典,形成新的压缩字符。
如图3所示:本发明方法通过拆解组件、解析组件、还原组件对压缩的数据包进行JSON数据格式无损还原,其具体步骤如下:
步骤一:如S21所示,拆解组件将压缩字符串以及字典使用“#”号拆解,得到加密字符串与字典,并且将字典字符串按照单竖线(“|”)分割,保持原有顺序。因为还原过程中是根据字典顺序进行字符还原的,所以必须保证字典保持原有的顺序,否则无法做到无损还原。
步骤二:如S22所示,解析组件首先检测压缩字符串中带有引号开头,第二位是字母,并且引号结尾的字符。按照压缩时a、b、c以此类推的顺序,进行替换字典,并且找到引号结尾前的数字,按照数字标记的次数进行重复替换,结尾符号前无数字则只需要替换一次。
步骤三:如S23所示,还原组件进行还原JSON数据格式中属性的引号;还原JSON数据格式中非纯数字字符的引号,纯数字字符还原末尾的引号;还原布尔型数据,特定字符串还原布尔型数据。还原清除组件清除的不影响确定性的字符,最终无损的解压原JSON数据。
以下以一个具体实例详细说明本发明的实现过程:
原JSON字符串如下:
{"student":[{"name":"Tom","Grade":1,"age":11,"gender":"M","no":"100010","pass":true},{"name":"Jerry","Grade":1,"age":10,"gender":"M","no":"100011","pass":true},{"name":"Jane","Grade":1,"age":9,"gender":"F","no":"100012","pass":false}],"classroom":{"class1":"roomroom1","class2":"room2"}}
压缩流程如下:
一、清洗组件:
1-1.清除属性的引号
{student:[{name:"Tom",Grade:1,age:11,gender:"M",no:"100010",pass:true},{name:"Jerry",Grade:1,age:10,gender:"M",no:"100011",pass:true},{name:"Jane",Grade:1,age:9,gender:"F",no:"100012",pass:true}],classroom:{class1:"roomroom1",class2:"room2"}}
1-2.清除非全数字字符串的引号,纯数字使用单个引号特殊标记
{student:[{name:Tom,Grade:1,age:11,gender:M,no:"100010,pass:true},{name:Jerry,Grade:1,age:10,gender:M,no:"100011,pass:true},{name:Jane,Grade:1,age:9,gender:F,no:"100012,pass:false}],classroom:{class1:roomroom1,class2:room2}}
1-3.boolean型使用特殊标记符true=1",false=0"
{student:[{name:Tom,Grade:1,age:11,gender:M,no:"100010,pass:1"},{name:Jerry,Grade:1,age:10,gender:M,no:"100011,pass:1"},{name:Jane,Grade:1,age:9,gender:F,no:"100012,pass:0"}],classroom:{class1:roomroom1,class2:room2}}
二、提取组件以及编码组件
2-1获取字符串的所有长度大于2,出现次数大于1的子集
提取相同字符串
字符 出现次数 总票数
na 3 6
nam 3 9
name 3 12
name: 3 15
name:J 2 12
…….. …… ……
Grade:1,age: 3 36
Grade:1,age:1 2 26
gender: 3 21
no:"10001 3 27
pass: 3 15
class 3 15
room 3 12
找到票数最高的子串:“Grade:1,age:”作为一个字典。
2-2使用占位符替换原JSON字符串中子串
编码后的字符串:
{student:[{name:Tom,"a11,gender:M,no:"100010,pass:1"},{name:Jerry,"a10,gender:M,no:"100011,pass:1"},{name:Jane,"a9,gender:F,no:"100012,pass:0"}],classroom:{class1:room1,class2:room2}}
字典:Grade:1,age:
重复执行2-1以及2-2步骤直到无重复字符,得到初步压缩字符,以及字典:
初步压缩字符:
{student:[{"fTom,"a11,"cM,"b0,"d1"},{"fJerry,"a10,"cM,"b1,"d1"},{"fJane,"a9,"cF,"b2,"d0"}],"e"g:{"e1:"g"g1,"e2:"g2}}
字典列表:
1.Grade:1,age:
2.no:"10001
3.gender:
4.pass:
5.class
6.name:
7.room
三、合成组件
检测连续重复的占位符,标记重复次数,并完成占位符合成。
{student:[{"f"Tom,"a"11,"c"M,"b"0,"d"1"},{"f"Jerry,"a"10,"c"M,"b"1,"d"1"},{"f"Jane,"a"9,"c"F,"b"2,"d"0"}],"e""g":{"e"1:"g2"1,"e"2:"g"2}}
拼接字典,得到最终的压缩字符:
{student:[{"f"Tom,"a"11,"c"M,"b"0,"d"1"},{"f"Jerry,"a"10,"c"M,"b"1,"d"1"},{"f"Jane,"a"9,"c"F,"b"2,"d"0"}],"e""g":{"e"1:"g2"1,"e"2:"g"2}}#Grade:1,age:|no:"10001|gender:|pass:|class|name:|room
解压流程如下:
一、拆解组件
按照“#”号拆解得到初步压缩字符串以及字典:
压缩字符:
{student:[{"f"Tom,"a"11,"c"M,"b"0,"d"1"},{"f"Jerry,"a"10,"c"M,"b"1,"d"1"},{"f"Jane,"a"9,"c"F,"b"2,"d"0"}],"e""g":{"e"1:"g2"1,"e"2:"g"2}}
字典字符:Grade:1,age:|no:"10001|gender:|pass:|class|name:|room
按照“|”拆解得到字典列表
字典列表:
1.Grade:1,age:
2.no:"10001
3.gender:
4.pass:
5.class
6.name:
7.room
二、解析组件
解析占位符,以及重复次数,并替换字典:
{student:[{name:Tom,Grade:1,age:11,gender:M,no:"100010,pass:1"},{name:Jerry,Grade:1,age:10,gender:M,no:"100011,pass:1"},{name:Jane,Grade:1,age:9,gender:F,no:"100012,pass:0"}],classroom:{class1:roomroom1,class2:room2}}
三、还原组件
3-1.还原boolean属性:
{student:[{name:Tom,Grade:1,age:11,gender:M,no:"100010,pass:true},{name:Jerry,Grade:1,age:10,gender:M,no:"100011,pass:true},{name:Jane,Grade:1,age:9,gender:F,no:"100012,pass:false}],classroom:{class1:roomroom1,class2:room2}}
3-2.补全非全数字字符串的引号,补全纯数字末尾的引号:
{student:[{name:"Tom",Grade:1,age:11,gender:"M",no:"100010",pass:true},{name:"Jerry",Grade:1,age:10,gender:"M",no:"100011",pass:true},{name:"Jane",Grade:1,age:9,gender:"F",no:"100012",pass:true}],classroom:{class1:"roomroom1",class2:"room2"}}
3-3.还原属性的引号,得到原JSON字符:
{student:[{name:"Tom",Grade:1,age:11,gender:"M",no:"100010",pass:true},{name:"Jerry",Grade:1,age:10,gender:"M",no:"100011",pass:true},{name:"Jane",Grade:1,age:9,gender:"F",no:"100012",pass:true}],classroom:{class1:"roomroom1",class2:"room2"}}
以上所述,仅仅是本发明的技术设计方案,并非对本发明作任何形式上的限制,熟悉本专业的技术人员,在不脱离本发明原理的情况下,可以做出若干改进和修饰润色,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何的简单修改、等同变化与修饰,仍属于本发明技术方案的范围内。

Claims (10)

1.一种JSON数据实时无损压缩以及解压方法,其特征在于,该方法包含JSON数据压缩以及解压流程;
所述压缩流程通过清洗组件清洗JSON数据格式中不影响数据确定性的字符,通过提取组件提取压缩字典,通过编码组件形成初步的压缩字符,最终通过合成组件完成整个JSON数据的压缩;
所述解压流程通过拆解组件拆分字典以及压缩字符,通过解析组件解析压缩字符中的占位符信息和重复次数信息并对字典中的字符进行还原,最终通过还原组件还原清洗组件清除的字符信息,得到原JSON数据。
2.根据权利要求1所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,所述清洗组件清洗的不影响数据确定性的字符包括:
清除JSON数据格式中属性的引号;
清除JSON数据格式中非纯数字字符的引号,清除纯数字字符末尾的引号;
清除布尔型数据,使用特定字符串代替。
3.根据权利要求1所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,所述提取组件根据清洗完成的数据格式,进行最大压缩率的相同字符串提取,并生成字典;再通过编码组件进行特定占位符替换,形成新的压缩字符串,如此往复最终完全压缩所有满足条件的相同字符串。
4.根据权利要求3所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,在提取最大压缩率的相同字符串过程中,将原字符串的所有长度大于2的字符子集取出,并且按照子串长度从小到大排序;统计子串在原字符串中的出现次数,出现次数与子串长度相乘,得到该子串在本轮提取中的票数,所有子串票数统计完毕,票数最高的子串成为一个字典。
5.根据权利要求4所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,每次计票提取出一个最大压缩率的相同字符串时,均通过编码组件进行一次编码,编码的过程包括:替换原始字符串中的提取的相同字符串为特定占位符,并按照压缩率大小对相同字符串进行排序、分开存储。
6.根据权利要求5所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,所述特定占位符采用双引号加字母递增的形式,排序第一位的对应小写字母a,第二位对应小写字母b以此类推;第二十七位对应大写字母A,二十八位对应大写字母B,以此类推;超过五十二叠加一个字母,五十三位对应字母aa,以此类推。
7.根据权利要求1所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,所述合成组件包括:
扫描编码完成后的压缩字符,检测重复且连续的占位符,并合成一个占位符,在占位符后方依次标记重复次数及引号,对于只出现一次的占位符直接添加引号;
拼接压缩后的字符串以及字典,并且使用#连接;字典间按照压缩率由高到低排序,并使用单竖线连接。
8.根据权利要求7所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,所述拆解组件将压缩字符串以及字典使用#号拆解,将字典字符串按照单竖线分割,保持原有顺序。
9.根据权利要求1所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,所述解析组件用于解析引号开头、字母占位符、数字重复次数以及引号结尾的压缩数据。
10.根据权利要求1所述的一种JSON数据实时无损压缩以及解压方法,其特征在于,所述还原组件还原清洗组件清除的字符,需要还原的信息包括:
还原JSON数据格式中属性的引号;
还原JSON数据格式中非纯数字字符的引号,还原纯数字字符末尾的引号;
将特定字符串还原成布尔型数据。
CN201811210828.4A 2018-10-17 2018-10-17 一种json数据实时无损压缩以及解压方法 Active CN109450450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811210828.4A CN109450450B (zh) 2018-10-17 2018-10-17 一种json数据实时无损压缩以及解压方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811210828.4A CN109450450B (zh) 2018-10-17 2018-10-17 一种json数据实时无损压缩以及解压方法

Publications (2)

Publication Number Publication Date
CN109450450A true CN109450450A (zh) 2019-03-08
CN109450450B CN109450450B (zh) 2022-09-23

Family

ID=65547286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811210828.4A Active CN109450450B (zh) 2018-10-17 2018-10-17 一种json数据实时无损压缩以及解压方法

Country Status (1)

Country Link
CN (1) CN109450450B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110247665A (zh) * 2019-05-16 2019-09-17 芜湖智久机器人有限公司 Json数据的压缩方法、装置及计算机可读存储介质
CN112668033A (zh) * 2019-10-15 2021-04-16 北京字节跳动网络技术有限公司 数据处理方法、装置及电子设备
CN114116739A (zh) * 2021-11-10 2022-03-01 浪潮卓数大数据产业发展有限公司 键值对数据插入列式数据库的系统及实现方法
CN114665887A (zh) * 2022-05-24 2022-06-24 成都索贝视频云计算有限公司 一种基于整体压缩的json字符串数据压缩方法
CN114666406A (zh) * 2022-02-24 2022-06-24 国电南瑞科技股份有限公司 一种基于物模型的电力物联网数据压缩方法及装置
CN115941808A (zh) * 2023-03-02 2023-04-07 深圳依时货拉拉科技有限公司 基于自训练字典编码的json数据压缩方法及装置
CN116054840A (zh) * 2023-01-30 2023-05-02 北京中科江南信息技术股份有限公司 一种json字符串数据压缩方法、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5704060A (en) * 1995-05-22 1997-12-30 Del Monte; Michael G. Text storage and retrieval system and method
CN1928849A (zh) * 2006-08-11 2007-03-14 白杰 数据字典的生成方法、装置和数据字典的优化方法
CN103401562A (zh) * 2013-07-31 2013-11-20 北京华易互动科技有限公司 一种无损json数据压缩方法
CN103401561A (zh) * 2013-07-25 2013-11-20 百度在线网络技术(北京)有限公司 用于地图数据的压缩和解压缩的方法及装置
CN103605730A (zh) * 2013-11-19 2014-02-26 山西三恒自动化设备有限公司 一种基于不定长标识码的xml的压缩方法和装置
CN104331269A (zh) * 2014-10-28 2015-02-04 中国科学院自动化研究所 一种嵌入式系统可执行代码压缩方法及代码解压缩系统
CN104917786A (zh) * 2014-03-11 2015-09-16 杭州雾隐美地传媒有限公司 一种节省客户端和服务器交互时的传输流量的方法和模块
CN108156173A (zh) * 2018-01-09 2018-06-12 江苏徐工信息技术股份有限公司 一种json数据包的动态无损压缩方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5704060A (en) * 1995-05-22 1997-12-30 Del Monte; Michael G. Text storage and retrieval system and method
CN1928849A (zh) * 2006-08-11 2007-03-14 白杰 数据字典的生成方法、装置和数据字典的优化方法
CN103401561A (zh) * 2013-07-25 2013-11-20 百度在线网络技术(北京)有限公司 用于地图数据的压缩和解压缩的方法及装置
CN103401562A (zh) * 2013-07-31 2013-11-20 北京华易互动科技有限公司 一种无损json数据压缩方法
CN103605730A (zh) * 2013-11-19 2014-02-26 山西三恒自动化设备有限公司 一种基于不定长标识码的xml的压缩方法和装置
CN104917786A (zh) * 2014-03-11 2015-09-16 杭州雾隐美地传媒有限公司 一种节省客户端和服务器交互时的传输流量的方法和模块
CN104331269A (zh) * 2014-10-28 2015-02-04 中国科学院自动化研究所 一种嵌入式系统可执行代码压缩方法及代码解压缩系统
CN108156173A (zh) * 2018-01-09 2018-06-12 江苏徐工信息技术股份有限公司 一种json数据包的动态无损压缩方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王平等: "中文文本的LZSS算法实现及研究", 《微电子学与计算机》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110247665A (zh) * 2019-05-16 2019-09-17 芜湖智久机器人有限公司 Json数据的压缩方法、装置及计算机可读存储介质
CN112668033A (zh) * 2019-10-15 2021-04-16 北京字节跳动网络技术有限公司 数据处理方法、装置及电子设备
CN112668033B (zh) * 2019-10-15 2023-04-25 抖音视界有限公司 数据处理方法、装置及电子设备
CN114116739A (zh) * 2021-11-10 2022-03-01 浪潮卓数大数据产业发展有限公司 键值对数据插入列式数据库的系统及实现方法
CN114116739B (zh) * 2021-11-10 2023-06-20 浪潮卓数大数据产业发展有限公司 键值对数据插入列式数据库的系统及实现方法
CN114666406A (zh) * 2022-02-24 2022-06-24 国电南瑞科技股份有限公司 一种基于物模型的电力物联网数据压缩方法及装置
CN114666406B (zh) * 2022-02-24 2023-11-21 国电南瑞科技股份有限公司 一种基于物模型的电力物联网数据压缩方法及装置
CN114665887A (zh) * 2022-05-24 2022-06-24 成都索贝视频云计算有限公司 一种基于整体压缩的json字符串数据压缩方法
CN114665887B (zh) * 2022-05-24 2022-09-06 成都索贝视频云计算有限公司 一种基于整体压缩的json字符串数据压缩方法
CN116054840A (zh) * 2023-01-30 2023-05-02 北京中科江南信息技术股份有限公司 一种json字符串数据压缩方法、装置及存储介质
CN116054840B (zh) * 2023-01-30 2023-11-17 北京中科江南信息技术股份有限公司 一种json字符串数据压缩方法、装置及存储介质
CN115941808A (zh) * 2023-03-02 2023-04-07 深圳依时货拉拉科技有限公司 基于自训练字典编码的json数据压缩方法及装置

Also Published As

Publication number Publication date
CN109450450B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN109450450A (zh) 一种json数据实时无损压缩以及解压方法
CN107239801A (zh) 视频属性表示学习方法及视频文字描述自动生成方法
CN112000791A (zh) 一种电机故障知识抽取系统及方法
CN109376775B (zh) 在线新闻多模态情感分析方法
CN112084381A (zh) 一种事件抽取方法、系统、存储介质以及设备
CN107766571A (zh) 一种多媒体资源的检索方法和装置
CN101783788A (zh) 文件压缩、解压缩方法、装置及压缩文件搜索方法、装置
US20120089620A1 (en) Extracting data
CN110428820A (zh) 一种中英文混合语音识别方法及装置
CN107967250B (zh) 一种信息处理方法及装置
CN109582952A (zh) 诗歌生成方法、装置、计算机设备和介质
CN112257452B (zh) 情感识别模型的训练方法、装置、设备和存储介质
US20180246959A1 (en) Isa: a fast scalable and accurate algorithm for supervised opinion analysis
CN112541077B (zh) 一种用于电网用户服务评价的处理方法及系统
CN108345633A (zh) 一种自然语言处理方法及装置
CN101794378B (zh) 基于图片编码的垃圾图片过滤方法
CN113239290A (zh) 用于舆情监测的数据分析方法、装置和电子装置
CN110516125B (zh) 识别异常字符串的方法、装置、设备及可读存储介质
CN116208772A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN116306506A (zh) 一种基于内容识别的智能邮件模板方法
Pavelec et al. Author identification using compression models
CN111090996B (zh) 一种分词的方法、装置及存储介质
Xiang et al. Aggregating local and global text features for linguistic steganalysis
Liu et al. URM4DMU: An User Representation Model for Darknet Markets Users
Hankamer et al. Twitter Sentiment Analysis with Emojis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 7 / F, building B, 482 Qianmo Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province 310000

Patentee after: Huoshi Creation Technology Co.,Ltd.

Address before: 7 / F, building B, 482 Qianmo Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province 310000

Patentee before: HANGZHOU FIRESTONE TECHNOLOGY Co.,Ltd.