CN111866520A

CN111866520A - 编解码方法、编解码设备以及通信系统

Info

Publication number: CN111866520A
Application number: CN201910333287.2A
Authority: CN
Inventors: 毛安平
Original assignee: Bosch Automotive Products Suzhou Co Ltd
Current assignee: Bosch Automotive Products Suzhou Co Ltd
Priority date: 2019-04-24
Filing date: 2019-04-24
Publication date: 2020-10-30

Abstract

本发明涉及一种编码方法、解码方法、码表生成方法、编码装置、解码装置、码表生成装置、通信系统以及计算机可读存储介质。该编码方法将第一字符集通过静态概率码表编码成二进制码流；以及将所述二进制码流通过字符映射码表映射成第二字符集，其中，所述静态概率码表依照所述静态概率码表中的各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与二进制编码建立索引；所述字符映射码表将所述字符映射码表中的二进制编码与字符建立索引。

Description

编解码方法、编解码设备以及通信系统

技术领域

本发明涉及一种信息编解码的机制。更具体地，涉及一种编解码方法、编解码设备以及使用该编解码方法或包括该编解码设备的通信系统。

背景技术

文本压缩编码广泛应用于通信传输领域。传统的文本到文本压缩编码通常包括两个步骤：首先将文本压缩成二进制比特流；然后再将该二进制比特流编码成文本信息。对于第一个步骤而言，本领域中普遍采用诸如霍夫曼编码之类的熵编码或者LZ77、LZ78之类的编码算法实现信息的无损压缩。对于第二个步骤，Base64是一种流行的编码方法。此外，可以根据使用场景而使用Base16、Base32以及Base85来替代。步骤二一般会增加数据量。

值得一提的是，无论霍夫曼编码还是LZ77或LZ78都需要相对较高的硬件开销。这一方面需要发送端（编码端）具有较强计算能力和内存容量来生成编码信息，也需要接收端（解码端）具有较强计算能力和内存容量来解码信息。另一方面，传统的编码对数据量很大的传输才能起到较好的压缩作用，而诸如霍夫曼树或其他码书信息也会增加发送端到接收端的网络负荷。鉴于此，传统的文本压缩编码方式对loT等类型的网络并不适用，因为此类网络的节点通常不具备很强的计算能力，且此类网络一般只传输少量信息。

发明内容

根据本发明的一方面，提供一种编码方法，所述方法包括步骤：将第一字符集通过静态概率码表编码成二进制码流；将所述二进制码流通过字符映射码表映射成第二字符集；其中，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；所述字符映射码表将其中的字符与对应的二进制编码建立索引。

可选地，将第一字符集通过静态概率码表编码成二进制码流的步骤具体包括：根据与所述第一字符集对应的第一样本集形成所述静态概率码表；根据所述静态概率码表将所述第一字符集拆分成所述静态概率码表中的一个或多个字符/字符串，并将所述第一字符集中的所述一个或多个字符/字符串根据所述静态概率码表分别编码成二进制编码；将所述一个或多个字符/字符串对应的所述二进制编码组合成所述二进制码流。

可选地，根据与所述第一字符集对应的第一样本集形成所述静态概率码表的步骤具体包括：根据所述第一样本集中字符/字符串的复现概率形成所述字符/字符串到二进制编码的映射，并且将复现概率较高的字符/字符串映射为较短的二进制编码。

可选地，所述第一样本集为与所述第一字符集采用相同协议的训练数据。

可选地，所述第一样本集包括常用协议的训练数据，所述训练数据包括与所述第一字符集采用相同协议的数据。

可选地，将所述二进制码流通过字符映射码表映射成第二字符集的步骤具体为：根据字符映射码表按照预定长度将所述二进制码流映射成对应的字符；将所述对应的字符组合以形成所述第二字符集。

可选地，将所述一个或多个字符/字符串对应的所述二进制编码组合成所述二进制码流还包括：在所述二进制编码之间还插入间隔符，并将所述间隔符连同所述二进制编码组合成所述二进制码流。

可选地，所述字符映射码表中的字符为预定字符集的子集。

可选地，所述预定长度为7个字节，所述预定字符集的子集为从预定字符集选取的128个字符。

可选地：若编码端或解码端的机器字长为N，所述预定长度为（N-1）*N/8个字节，所述预定字符集的子集为从预定字符集选取的2^N-1个字符。

根据本发明的另一方面，提供一种编码方法，所述方法包括步骤：根据静态概率码表与字符映射码表形成所述索引映射码表；将第一字符集通过索引映射码表映射成第二字符集；其中，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；所述字符映射码表将其中的字符与对应的二进制编码建立索引；将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系，以及与所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

根据本发明的另一方面，提供一种解码方法，所述方法包括步骤：将第二字符集通过字符映射码表映射成二进制码流；将所述二进制码流通过静态概率码表解码成第一字符集；其中，所述字符映射码表将其中的字符与对应的二进制编码建立索引；所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将所述各个字符/字符串与对应的二进制编码建立索引。

可选地，将第二字符集通过字符映射码表映射成二进制码流具体为：根据字符映射码表将所述第二字符集中各个字符以预定数量为一组映射成对应的二进制码流。

可选地，所述字符映射码表中的字符为预定字符集的子集。

可选地，所述预定数量为7，所述预定字符集的子集为从预定字符集选取的128个字符。

可选地，所述预定数量比编码端或解码端的机器字长少1。

可选地，将所述二进制码流通过静态概率码表解码成第一字符集的步骤具体包括：根据与所述第一字符集对应的第一样本集形成所述静态概率码表；根据所述静态概率码表将所述二进制码流分别解码成一个或多个字符/字符串，并将所述一个或多个字符/字符串组合成所述第一字符集。

可选地，根据所述静态概率码表将所述二进制码流分别解码成一个或多个字符/字符串之前先删除所述二进制码流中的间隔符。

根据本发明的另一方面，提供一种解码方法，所述方法包括步骤：根据静态概率码表与字符映射码表形成所述索引映射码表；将第二字符集通过索引映射码表映射成第一字符集；其中，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；所述字符映射码表将其中的字符与对应的二进制编码建立索引；将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系，以及与所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

根据本发明的另一方面，提供一种编码装置，所述装置包括：第一编码模块，其用于将第一字符集通过静态概率码表编码成二进制码流；第二编码模块，其用于将所述二进制码流通过字符映射码表映射成第二字符集；其中，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；所述字符映射码表将其中的字符与对应的二进制编码建立索引。

可选地，所述第一编码模块根据所述静态概率码表将所述第一字符集拆分成所述静态概率码表中的一个或多个字符/字符串，并将所述第一字符集中的所述一个或多个字符/字符串根据所述静态概率码表分别编码成二进制编码，然后将所述一个或多个字符/字符串对应的所述二进制编码组合成所述二进制码流。

可选地，所述第二编码模块根据所述字符映射码表按照预定长度将所述二进制码流映射成对应的字符，进而将所述对应的字符组合以形成所述第二字符集。

可选地，所述第一编码模块还在所述二进制编码之间插入间隔符，并将所述间隔符连同所述二进制编码组合成所述二进制码流。

可选地，所述字符映射码表中的字符为预定字符集的子集。

可选地，若编码端或解码端的机器字长为N，所述预定长度为（N-1）*N/8个字节，所述预定字符集的子集为从预定字符集选取的2^N-1个字符。

根据本发明的另一方面，提供一种码表生成装置，所述装置包括：第一模块，其用于生成静态概率码表，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；第二模块，其用于生成字符映射码表，所述字符映射码表将其中的字符与对应的二进制编码建立索引。

可选地，所述装置还包括：第三模块，其用于生成索引映射码表，其中，所述第三模块将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系，以及与所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，进而形成所述索引映射码表。

可选地，所述第一模块根据与所述第一字符集对应的第一样本集形成所述静态概率码表。

可选地，所述第一模块根据所述第一样本集中字符/字符串的复现概率形成所述字符/字符串到二进制编码的映射，并且将复现概率较高的字符/字符串映射为较短的二进制编码。

根据本发明的另一方面，提供一种解码装置，所述装置包括：第一解码模块，其用于将第二字符集通过字符映射码表映射成二进制码流；第二解码模块，其用于将所述二进制码流通过静态概率码表解码成第一字符集；其中，所述字符映射码表将其中的字符与对应的二进制编码建立索引；所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将所述各个字符/字符串与对应的二进制编码建立索引。

可选地，所述第一解码模块根据字符映射码表将所述第二字符集中各个字符以预定数量为一组映射成对应的二进制码流。

可选地，所述字符映射码表中的字符为预定字符集的子集。

可选地，所述预定数量比编码端或解码端的机器字长少1。

可选地，所述第二解码模块根据所述静态概率码表将所述二进制码流分别解码成一个或多个字符/字符串，并将所述一个或多个字符/字符串组合成所述第一字符集。

可选地，所述第一解码模块根据所述静态概率码表将所述二进制码流分别解码成一个或多个字符/字符串之前先删除所述二进制码流中的间隔符之前先删除所述第二字符集中的间隔符。

根据本发明的另一方面，提供一种通信系统，其包括前述任一项所述的编码装置以及根前述任一项所述的解码装置，所述编码装置通信地耦合到所述解码装置，并且所述解码装置解码经由所述编码装置编码的信息。

可选地，所述系统还包括前述任一项所述的码表生成装置，所述码表生成装置通信地耦合到所述编码装置和/或所述解码装置，并向所述编码装置和/或所述解码装置发送所述静态概率码表、所述字符映射码表以及索引映射码表中的一个或多个。

根据本发明的另一方面，提供一种码表生成方法，所述方法包括步骤：生成静态概率码表，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；生成字符映射码表，所述字符映射码表将其中的字符与对应的二进制编码建立索引。

可选地，所述方法还包括步骤：生成索引映射码表，将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系，以及与所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，进而形成所述索引映射码表。

可选地，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引的步骤具体包括：根据与所述第一字符集对应的第一样本集形成所述静态概率码表。

根据本发明的另一方面，提供一种计算机可读存储介质，其用于存储指令，当所述指令被执行时由处理器执行前述任一项所述的方法。

根据本发明的另一方面，提供一种编码装置，所述编码装置包括：第三编码模块，其用于将第一字符集通过索引映射码表映射成第二字符集；其中，根据静态概率码表与字符映射码表形成所述索引映射码表；所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；所述字符映射码表将其中的字符与对应的二进制编码建立索引；将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系，以及与所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

根据本发明的另一方面，提供一种解码装置，所述解码装置包括：第三解码模块，其用于将第二字符集通过索引映射码表映射成第一字符集；其中，根据静态概率码表与字符映射码表形成所述索引映射码表；所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；所述字符映射码表将其中的字符与对应的二进制编码建立索引；将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系，以及与所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

附图说明

从结合附图的以下详细说明中，将会使本发明的上述和其他目的及优点更加完整清楚，其中，相同或相似的要素采用相同的标号表示。

图1是根据本发明的一个实施例的通信系统的图示；

图2是根据本发明的一个实施例的通信系统的图示；

图3是根据本发明的一个实施例的通信系统的图示；

图4是根据本发明的一个实施例的通信系统的图示；

图5是根据本发明的一个实施例的编码端（发送端）的图示；

图6是根据本发明的一个实施例的解码端（接收端）的图示；

图7是根据本发明的一个实施例的码表生成装置的图示；

图8示出了根据本发明的一个实施例采用Gzip算法实现压缩编码的压缩率和字符数量的关系；

图9示出了根据本发明的一个实施例的一种将字符/字符串按照其经验复现概率排列的示例；

图10示出了根据本发明的一个实施例的预定字符集的子集的实施例；

图11示出了根据本发明的一个实施例的编码方法；

图12示出了根据本发明的一个实施例的编码方法；

图13示出了根据本发明的一个实施例的解码方法；

图14示出了根据本发明的一个实施例的码表生成方法。

具体实施方式

出于简洁和说明性目的，本文主要参考其示范实施例来描述本发明的原理。但是，本领域技术人员将容易地认识到相同的原理可等效地应用于所有类型的用于视觉感知系统的性能测试系统和/或性能测试方法，并且可以在其中实施这些相同或相似的原理，任何此类变化不背离本专利申请的真实精神和范围。

物联网（Internet of Things，IoT）技术是工业互联网的基础技术之一，在第四次产业革命的背景下，物联网技术的地位以其能够提供物到物、物到人的联网能够而显得非常重要。

物联网技术现已广泛应用于各种生活场景中。参见图1，例如，在中国，人们已经广泛使用共享单车103作为解决出行最后一公里的方案。再如，车辆104自身可以配置有各种类型的传感器，使得用户可以远程获取这些传感器感测到的信息，以实现远程监控与控制。工业上，人们还使用各类传感器105获取各类感兴趣的信息。例如电网公司可以利用红外传感器来检测线路故障，石油化工企业可以利用压力传感器来检测管路的工作状态。此外，遍布全国/区域的气象感测网络的各个节点106可以为气象预报、灾害预防提供数据分析的基础。以上实体通过诸如物联网和/或其他网络结构的网络101将信息分享至用户108或服务器102，用户108或服务器102也可借助网络101向以上的实体下发诸如控制指令等的数据；另一方面，各个实体之间也可以通过网络101进行数据通信。

一般而言，嵌入共享单车103、车辆104的传感器，或者传感器105自身计算能力并不强。并且出于功耗控制的考虑，各类物联网的处理能力和硬件水平都不足以应付较复杂的数据处理。因而，各类物联网节点需要应用到其嵌入式系统中的一种简单高效的压缩编码技术。

参见图2，典型的物联网节点通信系统包括编码端（/解码端）203和解码端（/编码端）204。编码端203、解码端204可以是上文中的共享单车103、车辆104、气象感测网络节点106等功能实体，也可以是各类传感器105，还可以是服务器102或用户108的手持设备等。编码端203与解码端204可以透过各类总线、专用网、局域网、广域网、互联网进行通信，其形式也不限于有线或无线方式。

具体而言，作为编码端（发送端）203的一个示例的编码端（发送端）503可以包括第一编码模块5031和第二编码模块5032（图5）。其中，第一编码模块5031其用于将第一字符集通过静态概率码表编码成二进制码流，而第二编码模块5032将二进制码流通过字符映射码表映射成第二字符集。

具体而言，第一字符集是待编码的信息。如果编码端203是GPS位置接收机的话，那么第一字符集可以是诸如“125°E，45°N，13:33，2019/04/12”之类的坐标信息和时间信息的组合。如果编码端203是车辆104的传感器，其可以用来传递的第一字符集包括从车辆104的CAN总线获得的各种车辆状态诸元。当然，车辆104本身也可以包括GPS位置接收机，因而作为编码端203的车辆104要传递的第一字符集也可以包括坐标信息和时间信息的组合。

再如，如果编码端203是气象感测网络节点106，那么第一字符集可以是降雨量、温度、湿度以及节点编号等信息的组合。

可以想见的是，由于第一字符集通常是格式化的文本，其间存在信息的冗余。因而为了提高网络容量以及提升传输效率，通常需要对这类信息进行压缩。传统上对这类信息进行压缩需要两个步骤。首先，需要采用诸如霍夫曼编码之类的熵编码或者LZ77、LZ78、Gzip之类的编码实现信息的无损压缩。然而，无论霍夫曼编码还是LZ77、LZ78、Gzip之类的编码都不适合于传输小规模的字符集信息。如果使用霍夫曼编码，编码端203需要构建霍夫曼树，这对于诸如物联网节点来说是复杂的，而且传输动态的霍夫曼树本身也需要大量的网络开销。因而，在采用霍夫曼编码的情况下，编码后的二进制编码和霍夫曼树信息二者之和通常比原始的第一字符集还要大。鉴于此，霍夫曼编码并不适于用于诸如物联网节点。

另外，图8示出了采用Gzip算法实现压缩编码的压缩率和字符数量的关系。可见，在采用Gzip算法的情况下，字符数量越多其压缩率越高，在大约90000字符的情况下，其压缩率才保持稳定。这种方式显然也不适合单次传输仅为百字符左右的诸如物联网节点的数据压缩。

因此，本发明的一个实施例提出了利用静态概率码表实现文本到二进制编码的转换（编码、映射）。静态概率码表中根据各个字符/字符串的经验复现概率静态地将其中的各个字符/字符串与对应的二进制编码建立索引。在本发明的上下文中，术语“经验复现概率”表示根据经验（例如通过统计方式）所获得的某个字符或字符串重复出现的概率。

作为非限制性的示例的，图9示出了一种将字符/字符串按照其经验复现概率排列的一个示例。例如，空格符（blank）的经验复现概率为8.73%，数字“0”的经验复现概率为6.63%等等。由于经验复现概率不是随待编码的第一字符集变化的，因而其静态地体现了各个字符/字符串在第一字符集中可能出现的频率，这为对第一字符集进行压缩提供了可能性。作为非限制性的示例，各个字符/字符串的经验复现概率是可以通过统计的方式得到的。

为了尽可能消除待编码的第一字符集的信息冗余，静态概率码表根据各个字符/字符串的经验复现概率对这些字符/字符串进行二进制编码。可以预见的是，一般而言，静态概率码表中的字符/字符串涵盖了待编码的第一字符集中可能出现的全部字符/字符串。

进一步参见图9，尽管其中示出了将空格符（blank）编码为“0”，将数字“0”编码为“1”，……，将字符串“er”编码为“011”，但这种编码仅是示意性质的。通常来说，为了最大化地压缩原始数据，可以将复现概率较高的字符/字符串映射为较短的二进制编码，例如将空格符（blank）编码为“0”，而降字符串“er”编码为“011”。如果存在复现概率相同的字符/字符串，可以预设一规则将其指定为长度相同的二进制编码，也可以任意指定一者较另一者更短。总体而言，只要从字符/字符串到二进制编码的映射能够实现某种程度的编码压缩的效果，那么该种指定（映射）就可以被允许。

为了获得静态概率码表，可以根据训练数据（样本集）来得到静态概率码表中的字符/字符串及其出现的概率。该样本集可以为与待编码的第一字符集相对应的数据集，如可以为编码端203形成的历史待编码数据，也可以直接现场截取编码端203生成的数据。尽管不是必需的，为了实现压缩效果的最优化，样本集中的数据应当尽量涵盖编码端203所有工作场景下产生的数据。

可选地，如果编码端203为多用途类型的传感器器，但是其仅用在特定场景下，那么作为训练数据的样本集可以仅使用该特定场景下产生的数据。例如，气象感测网络节点106可以提供降雨量、温度、湿度以及节点编号等信息的组合。而气象部门在特定情况下可能仅对特定数据感兴趣（例如，在发布寒潮预报时可能仅对温度、时间、节点编号等信息感兴趣），也可以仅使用该特定场景下的数据作为样本集进行静态概率码表的编制。为了使得解码端204能够知晓编码端203使用的静态概率码表的类型，编码端203可以向解码端204发送关于该静态概率码表的版本信息。

作为应用场景的另一示例，编码端203可以编码不同协议的数据。因而样本集可以为与待编码的第一字符集采用相同协议的训练数据；另一方面，样本集也可以包括常用协议的训练数据，这时训练数据可以包括与待编码的第一字符集采用相同协议的训练数据。

根据以上本发明的实施例，编码端203可以根据静态概率码表直接编码二进制码流，因而仅需要简单的“查表”操作即可进行编码，降低了对编码端203的硬件需求，符合当今应用的需求。另外，由于该种编码是基于经验复现概率进行的，因而其区别于霍夫曼编码等现场编码技术而为静态的。

在编码时，编码端503（203）的第一编码模块5031根据静态概率码表将待编码的第一字符集拆分成静态概率码表中的一个或多个字符/字符串，并将其根据静态概率码表分别编码成二进制编码，然后将一个或多个字符/字符串对应的二进制编码组合成二进制码流。

例如，第一字符集“he is an”可以按如下编码：

he → 001

blank → 0

i → 010

s → 11

blank → 0

an → 101

那么该字符集可以编码为：001 0 010 11 0 101。

必要时，还可以在二进制编码之间间隔符。在编码时，编码端503（203）的第一编码模块5031将间隔符连同二进制编码组合成二进制码流。

如果以B表示间隔符的话，那么上述第一字符集可以编码成：001B0B010B11B0B101。间隔符是不同于以上任意一个字符/字符串所对应的二进制编码。一般而言，间隔符采用较短的二进制编码，且需要与字符/字符串所对应的二进制编码（或者对应的编码的任一部分）相区分。

传统上对这类信息进行压缩还包括第二个步骤，即采用诸如Base64、Base16、Base32、Base85等的方法实现二进制码流到字符的转换。以Base64为例，它利用1个字符表示6个位的数据。如果要对3个字节（共计24位）的数据进行编码，一共需要4个字符，因此，利用Base64进行编码将使得数据增加1/3。类似的，Base65将使得数据增加1/4。

根据本发明的一个实施例，编码端503（203）的第二编码模块5032根据字符映射码表将其中的字符与对应的二进制编码建立索引。根据本发明的另一实施例，具体地，编码端503（203）按照预定长度将二进制码流映射成对应的字符，并将对应的字符组合以形成编码后的第二字符集。

作为本发明的一个实施例，例如，编码端203和/或解码端204为8位机，这时可以设置预定长度为7个字节，即每7个字节（共计56位）的二进制码流为一组进行编码。参见图11，为了提升编码效率，可以将每个字节数据的后7位进行编码，再将最高位另外以一个字节编码。此时，为了以字符表示每个后7位数据，共需要2⁷个字符。作为非限制性示例的，可以从预定字符集中选取128个字符用来编码后7位数据（如图10所示）。以此方式，编码端203仅需以字节为单位进行移出操作，避免了码流的截断与重组。

在本发明的各个实施例中，预定字符集可以是扩展ASCII码、ISO-8859-1、UTF等中任一个字符编码。

第二字符集可以为预定字符集的子集。此外，在位字长为其他数字的编码端203和/或解码端204时，若编码端或解码端的机器字长为N（一般而言N取4、8、16、32、64等值，即为2的大于2整数次幂），所述预定长度为（N-1）*N/8个字节，所述预定字符集的子集为从预定字符集选取的2^N-1个字符。如果编码端和解码端机器位相同，那么在编码端和解码端可以同时实现数据的整块操作；如果编码端与解码端机器位不同，那么可以在编码端或解码端可以实现数据的整块操作。当预定字符集不足以表示时，还可以选择其他字符集（如汉字字符集）作为替代或补充。

参见图3和图4，可以利用PC机309来生成静态概率码表、字符映射码表并分别载入到编码端303和解码端304。此时，PC机309可以以串口等方式在本地写入各个码表。另一方面，PC机409生成静态概率码表、字符映射码表并分别通过网络401发送到编码端403）和解码端404。值得一提的是，两种写入码表的方式不是互斥的，而是可以互为备份。静态概率码表、字符映射码表可以根据训练数据的范围、协议、时间而不同，因而可以形成具有多个版本的静态概率码表、字符映射码表，这些静态概率码表、字符映射码表可以经由版本号来区分。

转至图1，气象感测网络节点106可以提供降雨量、温度、湿度以及节点编号等信息的组合。那么可以根据气象感测网络节点106的历史数据生成诸如版本号为“gen_sta_V_2019041401”的静态概率码表和版本号为“gen_char_V_2019041401”字符映射码表。如果气象部门在特定情况下可能仅对特定数据感兴趣（例如，在发布寒潮预报时可能仅对温度、时间、节点编号等信息感兴趣），也可以仅使用该特定场景下的数据作为样本集进行静态概率码表的编制。此时可以生成诸如版本号为“spe_sta_V_2019041401”的静态概率码表和版本号为“spe_char_V_2019041401”字符映射码表。

PC机309（409）可以根据需要向编码端303（403）和解码端304（404）发送各个码表，编码端303（403）和解码端304（404）对本地码表进行覆盖写入，并且编码端303（403）在发送数据时可以向解码端304（404）声明码表的版本号。

应当注意的是，虽然上文中将303（403）指定为编码端并将304（404）指定为解码端，但是在诸如图1的网络中，各个节点既可以根据需要充当编码端也可以充当解码端，且各个节点也可以同时充当编码端和解码端。

作为本发明的另一个实施方式，可以静态概率码表与字符映射码表形成索引映射码表。由于静态概率码表与字符映射码表都是静态映射的码表，因而可以将静态概率码表中各个字符/字符串与对应的二进制编码的索引关系，以及与字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成静态概率码表中字符/字符串到字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。参见图5，编码端（发送端）503可以包括第三编码模块5033（取代第一编码模块5031和第二编码模块5032）以用于将第一字符集通过索引映射码表直接映射成第二字符集。

图6是根据本发明的一个实施例的解码端（接收端）的图示。解码端（接收端）604包括第一解码模块6041，其用于将第二字符集通过字符映射码表映射成二进制码流；第二解码模块6042，其用于将二进制码流通过静态概率码表解码成第一字符集；其中，字符映射码表将其中的字符与对应的二进制编码建立索引；静态概率码表依照其中各个字符/字符串的经验复现概率静态地将各个字符/字符串与对应的二进制编码建立索引。

第一解码模块6041根据字符映射码表将第二字符集中各个字符以预定数量为一组映射成对应的二进制码流。可选地，第二字符集为预定字符集的子集。可选地，在机器字长为8位时，预定数量为7，预定字符集的子集为从预定字符集选取的128个字符。可选地，预定数量比编码端或解码端的机器字长少1。

另一方面，第二解码模块6042根据静态概率码表将二进制码流分别解码成一个或多个字符/字符串，并将一个或多个字符/字符串组合成第一字符集。可选地，第一解码模块6041根据静态概率码表将二进制码流分别解码成一个或多个字符/字符串之前先删除二进制码流中的间隔符之前先删除第二字符集中的间隔符。

作为本发明的另一实施例，解码端（接收端）604可以替代其中的第一解码模块6041和第二解码模块6042而设置第三解码模块6043，其用于将第二字符集通过索引映射码表映射成第一字符集；其中，根据静态概率码表与字符映射码表形成索引映射码表；静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的各个字符/字符串与对应的二进制编码建立索引；字符映射码表将其中的字符与对应的二进制编码建立索引；将静态概率码表中各个字符/字符串与对应的二进制编码的索引关系，以及与字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成静态概率码表中字符/字符串到字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

图7是根据本发明的一个实施例的码表生成装置的图示。如图所示，码表生成装置709包括第一模块7091和第二模块7092。第一模块7091用于生成静态概率码表，静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的各个字符/字符串与对应的二进制编码建立索引。第二模块7092用于生成字符映射码表，字符映射码表将其中的字符与对应的二进制编码建立索引。

码表生成装置709还可以包括第三模块7093。第三模块7093用于生成索引映射码表，其中，第三模块7093将静态概率码表中各个字符/字符串与对应的二进制编码的索引关系，以及与字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成静态概率码表中字符/字符串到字符映射码表中对应的字符的索引关系，进而形成索引映射码表。

其中，第一模块7091可以根据与第一字符集对应的第一样本集形成静态概率码表。此外，第一模块7091可以根据第一样本集中字符/字符串的复现概率形成字符/字符串到二进制编码的映射，并且将复现概率较高的字符/字符串映射为较短的二进制编码。第一样本集可以为与第一字符集采用相同协议的训练数据。作为替代的，第一样本集也可以包括常用协议的训练数据，训练数据包括与第一字符集采用相同协议的数据。

尽管未在附图中示出，作为本发明的一个实例的，可以使用计算机可读存储介质存储指令，当所述指令被执行时由处理器执行上文中的方法流程步骤。

需要说明的是，附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或者在一个或多个硬件模块或集成电路中实现这些功能实体，或者在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图12示出了根据本发明的一个实施例的编码方法。在步骤1201中将第一字符集通过静态概率码表编码成二进制码流；在步骤1202中将二进制码流通过字符映射码表映射成第二字符集；其中，静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的各个字符/字符串与对应的二进制编码建立索引；字符映射码表将其中的字符与对应的二进制编码建立索引。

在步骤1201中可以根据与第一字符集对应的第一样本集形成静态概率码表；根据静态概率码表将第一字符集拆分成静态概率码表中的一个或多个可以字符/字符串，并将第一字符集中的一个或多个字符/字符串根据静态概率码表分别编码成二进制编码；将一个或多个字符/字符串对应的二进制编码组合成二进制码流。其中，可以根据第一样本集中字符/字符串的复现概率形成字符/字符串到二进制编码的映射，并且将复现概率较高的字符/字符串映射为较短的二进制编码。其中，第一样本集可以为与第一字符集采用相同协议的训练数据。此外，第一样本集也可以包括常用协议的训练数据，训练数据包括与第一字符集采用相同协议的数据。

在步骤1202中可以根据字符映射码表按照预定长度将二进制码流映射成对应的字符；可以将对应的字符组合以形成第二字符集。将一个或多个字符/字符串对应的二进制编码组合成二进制码流之前还可以在二进制编码之间还插入间隔符，并将间隔符连同二进制编码组合成二进制码流。

字符映射码表中的字符可以为预定字符集的子集。例如，在预定长度为7个字节的情况下，预定字符集的子集为从预定字符集选取的128个字符。此外，若编码端或解码端的机器字长为N，预定长度为（N-1）*N/8个字节，预定字符集的子集为从预定字符集选取的2 ^N ^-1个字符。

作为上述实施例的替代方案，还可以根据静态概率码表与字符映射码表形成索引映射码表；将第一字符集通过索引映射码表映射成第二字符集；其中，静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的各个字符/字符串与对应的二进制编码建立索引；字符映射码表将其中的字符与对应的二进制编码建立索引；将静态概率码表中各个字符/字符串与对应的二进制编码的索引关系，以及与字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成静态概率码表中字符/字符串到字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

图13示出了根据本发明的一个实施例的解码方法。在步骤1301中将第二字符集通过字符映射码表映射成二进制码流；在步骤1302中将二进制码流通过静态概率码表解码成第一字符集；其中，字符映射码表将其中的字符与对应的二进制编码建立索引；静态概率码表依照其中各个字符/字符串的经验复现概率静态地将各个字符/字符串与对应的二进制编码建立索引。

在步骤1301中还可以根据字符映射码表将第二字符集中各个字符以预定数量为一组映射成对应的二进制码流。第二字符集可以为预定字符集的子集。在预定数量为7的情况下，预定字符集的子集为从预定字符集选取的128个字符。此外，预定数量可以比编码端或解码端的机器字长少1。

在步骤1302中可以根据与第一字符集对应的第一样本集形成静态概率码表；根据静态概率码表将二进制码流分别解码成一个或多个字符/字符串，并将一个或多个字符/字符串组合成第一字符集。其中，可以根据第一样本集中字符/字符串的复现概率形成字符/字符串到二进制编码的映射，并且将复现概率较高的字符/字符串映射为较短的二进制编码。第一样本集可以为与第一字符集采用相同协议的训练数据。第一样本集也可以包括常用协议的训练数据，训练数据包括与第一字符集采用相同协议的数据。

另一方面，可以根据静态概率码表将二进制码流分别解码成一个或多个字符/字符串之前先删除二进制码流中的间隔符。

作为上述实施例的替代方案，还可以根据静态概率码表与字符映射码表形成索引映射码表；将第二字符集通过索引映射码表映射成第一字符集；其中，静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的各个字符/字符串与对应的二进制编码建立索引；字符映射码表将其中的字符与对应的二进制编码建立索引；将静态概率码表中各个字符/字符串与对应的二进制编码的索引关系，以及与字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成静态概率码表中字符/字符串到字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

图14示出了根据本发明的一个实施例的码表生成方法。根据该方法，在步骤1401中生成静态概率码表，静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的各个字符/字符串与对应的二进制编码建立索引；在步骤1402中生成字符映射码表，字符映射码表将其中的字符与对应的二进制编码建立索引。

方法还可以包括步骤1403：生成索引映射码表，将静态概率码表中各个字符/字符串与对应的二进制编码的索引关系，以及与字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成静态概率码表中字符/字符串到字符映射码表中对应的字符的索引关系，进而形成索引映射码表。

其中，在步骤1401中可以根据与第一字符集对应的第一样本集形成静态概率码表。例如，可以根据第一样本集中字符/字符串的复现概率形成字符/字符串到二进制编码的映射，并且将复现概率较高的字符/字符串映射为较短的二进制编码。其中，第一样本集可以为与第一字符集采用相同协议的训练数据。此外，第一样本集也可以包括常用协议的训练数据，训练数据包括与第一字符集采用相同协议的数据。

以上例子主要说明了本公开的编解码方法、编解码设备以及使用该编解码方法或包括该编解码设备的通信系统。尽管只对其中一些本发明的实施方式进行了描述，但是本领域普通技术人员应当了解，本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此，所展示的例子与实施方式被视为示意性的而非限制性的，在不脱离如所附各权利要求所定义的本发明精神及范围的情况下，本发明可能涵盖各种的修改与替换。

Claims

1.一种编码方法，其特征在于，所述方法包括下列步骤：

将第一字符集通过静态概率码表编码成二进制码流；以及

将所述二进制码流通过字符映射码表映射成第二字符集，

其中，所述静态概率码表依照所述静态概率码表中的各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与二进制编码建立索引；

所述字符映射码表将所述字符映射码表中的二进制编码与字符建立索引。

2.根据权利要求1所述的方法，其中将第一字符集通过静态概率码表编码成二进制码流的步骤包括：

根据与所述第一字符集对应的第一样本集形成所述静态概率码表；

根据所述静态概率码表将所述第一字符集拆分成所述静态概率码表中的一个或多个字符/字符串，并将所述第一字符集中的所述一个或多个字符/字符串根据所述静态概率码表分别编码成二进制编码；

将所述一个或多个字符/字符串对应的所述二进制编码组合成所述二进制码流。

3.根据权利要求2所述的方法，其中根据与所述第一字符集对应的第一样本集形成所述静态概率码表的步骤包括：

根据所述第一样本集中字符/字符串的重复出现的概率形成所述字符/字符串到二进制编码的映射。

4.根据权利要求2或3所述的方法，其中，所述第一样本集为与所述第一字符集采用相同协议的训练数据。

5.根据权利要求1所述的方法，其中将所述二进制码流通过字符映射码表映射成第二字符集的步骤包括：

根据字符映射码表按照预定长度将所述二进制码流映射成对应的字符；

将所述对应的字符组合以形成所述第二字符集。

6.根据权利要求2所述的方法，其中将所述一个或多个字符/字符串对应的所述二进制编码组合成所述二进制码流包括：

在所述二进制编码之间还插入间隔符，并将所述间隔符连同所述二进制编码组合成所述二进制码流。

7.根据权利要求5所述的方法，其中，所述预定长度为7个字节，所述字符映射码表中的字符为从预定字符集中选取的128个字符。

8.一种编码方法，其特征在于，所述方法包括步骤：

根据静态概率码表与字符映射码表形成索引映射码表；以及

将第一字符集通过所述索引映射码表映射成第二字符集，

其中，所述静态概率码表依照所述静态概率码表中的各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与二进制编码建立索引；所述字符映射码表将所述字符映射码表中的二进制编码与字符建立索引。

9.如权利要求8所述的编码方法，其中，根据静态概率码表与字符映射码表形成索引映射码表包括：

将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系以及所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，并进一步形成索引映射码表。

10.一种解码方法，其特征在于，所述方法包括下列步骤：

将第二字符集通过字符映射码表映射成二进制码流；

将所述二进制码流通过静态概率码表解码成第一字符集；其中，

所述字符映射码表将其中的字符与对应的二进制编码建立索引；

所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将所述各个字符/字符串与对应的二进制编码建立索引。

11.一种解码方法，其特征在于，所述方法包括下列步骤：

根据静态概率码表与字符映射码表形成索引映射码表；以及

将第二字符集通过索引映射码表映射成第一字符集，

其中，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；所述字符映射码表将其中的字符与对应的二进制编码建立索引。

12.一种编码装置，其特征在于，所述装置包括：

第一编码模块，其用于将第一字符集通过静态概率码表编码成二进制码流；以及

第二编码模块，其用于将所述二进制码流通过字符映射码表映射成第二字符集，

13.根据权利要求12所述的装置，其中，

所述第一编码模块配置成根据所述静态概率码表将所述第一字符集拆分成所述静态概率码表中的一个或多个字符/字符串，并将所述第一字符集中的所述一个或多个字符/字符串根据所述静态概率码表分别编码成二进制编码，然后将所述一个或多个字符/字符串对应的所述二进制编码组合成所述二进制码流。

14.根据权利要求12所述的装置，其中，

所述第二编码模块根据所述字符映射码表按照预定长度将所述二进制码流映射成对应的字符，进而将所述对应的字符组合以形成所述第二字符集。

15.根据权利要求13所述的装置，其中，

所述第一编码模块进一步配置成在所述二进制编码之间插入间隔符，并将所述间隔符连同所述二进制编码组合成所述二进制码流。

16.根据权利要求14所述的装置，其特征在于：

所述预定长度为7个字节，所述字符映射码表中的字符为从预定字符集选取的128个字符。

17.一种码表生成装置，其特征在于，所述装置包括：

第一模块，其用于生成静态概率码表，所述静态概率码表依照其中各个字符/字符串的经验复现概率静态地将其中的所述各个字符/字符串与对应的二进制编码建立索引；

第二模块，其用于生成字符映射码表，所述字符映射码表将其中的字符与对应的二进制编码建立索引。

18.根据权利要求17所述的装置，其特征在于，所述装置还包括：

第三模块，其用于生成索引映射码表，其中，所述第三模块将所述静态概率码表中所述各个字符/字符串与对应的二进制编码的索引关系，以及与所述字符映射码表中各个二进制编码与对应的字符的索引关系以二进制编码为中间量形成所述静态概率码表中字符/字符串到所述字符映射码表中对应的字符的索引关系，进而形成所述索引映射码表。

19.一种解码装置，其特征在于，所述装置包括：

第一解码模块，其用于将第二字符集通过字符映射码表映射成二进制码流；

第二解码模块，其用于将所述二进制码流通过静态概率码表解码成第一字符集；其中，

20.一种通信系统，其包括根据权利要求12-16中任一项所述的编码装置以及根据权利要求19所述的解码装置。

21.根据权利要求20所述的通信系统，其特征在于，所述系统还包括根据权利要求17-18中任一项所述的码表生成装置。

22.一种计算机可读存储介质，其用于存储指令，当所述指令被执行时由处理器执行权利要求1-9中任一项所述的编码方法或权利要求10-11中任一项所述的解码方法。