CN103379457A - 文字编码与解码系统及方法 - Google Patents
文字编码与解码系统及方法 Download PDFInfo
- Publication number
- CN103379457A CN103379457A CN 201210126783 CN201210126783A CN103379457A CN 103379457 A CN103379457 A CN 103379457A CN 201210126783 CN201210126783 CN 201210126783 CN 201210126783 A CN201210126783 A CN 201210126783A CN 103379457 A CN103379457 A CN 103379457A
- Authority
- CN
- China
- Prior art keywords
- coding
- character
- module
- byte serial
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
一种文字编码与解码系统,包括创建模块、转换模块、编码模块、传送模块、接收模块、解码模块以及显示模块。利用上述模块可根据创建的编码表确认输入的字符相应的5位元编码,将确认的编码按顺序排列成位元队列,切分该位元队列使每8位元组成一个字节以生成字节串,加入预设的标识码,并且在标头填入编码方式以及信息长度。利用上述模块还可通过标识码识别接收到的字节串,将字节串切分成每5位元编码为一组的位元队列,并检索相应的字符进行解码。本发明还提供一种文字编码与解码方法。利用本发明可对文字信息进行编码与解码。
Description
技术领域
本发明涉及编码及解码技术,尤其涉及一种应用于通讯装置的文字编码与解码系统及方法。
背景技术
利用全球移动通信系统网络(GSM,Global System for Mobile Communications)发送短信息(SMS,Short Messaging Service)的服务提供了低载运量、低时效性之无连接传输模式(Connectionless)的讯息传送。短信息可以有多种格式,例如,纯文字的文本格式和协议数据单元(PDU,protocol data unit)格式,其中常用的短信息是采用PDU格式,该PDU格式由欧洲电信标准组织(ETSI,European Telecommunication Standards Institute)所定义。通过该PDU格式可以允许一条短信息的长度是利用8位元编码的140个字节,或是利用7位元编码的160个GSM的预设字符,例如,每条短信息可以包括160个英文和数字。
可见,利用常用的编码方式,无法使一条短信息承载更多的信息,即,无法增加每条短信息的长度。
发明内容
鉴于以上内容,有必要提供一种文字编码与解码系统及方法,可使用5位元编码,从而增加每条短信息可以传送的字数。
一种文字编码系统,应用于通讯装置中,该系统包括:创建模块,用于创建以5位元编码表示每个字符的编码表;转换模块,用于接收输入的文字信息,将所述文字信息中的大写字母转换成小写字母;编码模块,用于根据所述编码表确认文字信息中每个字符相应的5位元编码,将确认的所有编码按顺序排列成位元队列,切分该位元队列使每8位元组成一个字节以生成字节串,并在该位元队列最后的位元数不足8位时以预定字元补充至8位;所述的编码模块,还用于在生成的字节串前面加入预设的标识码,并且在所述文字信息的标头填入编码方式以及信息长度以完成对该文字信息的编码;及传送模块,用于发送该编码后的字节串。
一种文字解码系统,应用于通讯装置中,所述的通讯装置存储有以5位元编码表示每个字符的编码表,该系统包括:接收模块,用于接收编码后的字节串;解码模块,用于根据预设的标识码识别该字节串是否以预定方式进行的编码,所述的预定方式是指利用存储的编码表进行的编码;所述的解码模块,还用于在该字节串是以预定方式进行的编码时根据该字节串的标头提示的编码方式将该字节串转换为每5位元为一组编码的位元队列,并检索所述编码表并确定每5位元编码代表的字符;及显示模块,用于根据确定的字符在所述通讯装置的显示屏上显示相应的文字信息。
一种文字编码方法,应用于通讯装置中,该方法包括如下步骤:创建以5位元编码表示每个字符的编码表;接收输入的文字信息,将所述文字信息中的大写字母转换成小写字母;根据所述编码表确认文字信息中每个字符相应的5位元编码;将确认的所有编码按顺序排列成位元队列,切分该位元队列使每8位元组成一个字节以生成字节串,并在该位元队列最后的位元数不足8位时以预定字元补充至8位;在生成的字节串前面加入预设的标识码;在所述文字信息的标头填入编码方式以及信息长度,以完成对该文字信息的编码;及发送该编码后的字节串。
一种文字解码方法,应用于通讯装置中,所述通讯装置存储有以5位元编码表示每个字符的编码表,该方法包括如下步骤:接收编码后的字节串;根据预设的标识码识别该字节串是否以预定方式进行的编码,所述的预定方式是指利用存储的编码表进行的编码;若该字节串是以预定方式进行的编码,根据该字节串的标头提示的编码方式将该字节串转换为每5位元为一组编码的位元队列;检索所述编码表并确定每5位元编码代表的字符;及根据确定的字符在所述通讯装置的显示屏上显示相应的文字信息。
相较于现有技术,所述的文字编码与解码系统及方法可使用5位元编码,从而增加每条短信息可以传送的字数,不仅可以减少通讯成本,还可减少复杂的编译运算,提高通讯装置的使用效率。
附图说明
图1是本发明文字编码与解码系统的较佳实施方式的硬件结构图。
图2是本发明文字编码与解码系统的较佳实施方式的功能模块图。
图3是本发明文字编码与解码系统的编码表示意图。
图4是本发明文字编码与解码系统的编码过程示意图。
图5是本发明文字编码方法的较佳实施方式的流程图。
图6是本发明文字解码方法的较佳实施方式的流程图。
主要元件符号说明
通讯装置 | 1 |
文字编码与解码系统 | 10 |
创建模块 | 100 |
转换模块 | 101 |
编码模块 | 102 |
传送模块 | 103 |
接收模块 | 104 |
解码模块 | 105 |
显示模块 | 106 |
处理器 | 11 |
存储装置 | 12 |
显示屏 | 13 |
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
如图1所示,是本发明文字编码与解码系统的较佳实施方式的硬件结构图。所述的文字编码与解码系统10应用于通讯装置1中,用于实现对该通讯装置1的短信息进行编码与解码。在本较佳实施方式中,所述的文字编码与解码系统10用于对文字信息中的英文、数字及符号进行相应的编码及解码。
所述通讯装置1可以是手机、个人数字助理(PDA,Personal Digital Assistant)等装置。该通讯装置1包括所述处理器11、存储装置12以及显示屏13。
所述的处理器11用于执行所述文字编码与解码系统10以及所述通讯装置1内安装的各类软件,例如操作系统等。所述的存储装置12,可以是所述通讯装置1的内存,还可以是可外接于该通讯装置1的存储卡,如SM卡(Smart Media Card,智能媒体卡)、SD卡(Secure Digital Card,安全数字卡)等。所述的存储装置12用于存储各类数据,例如,短信息、邮件、利用所述文字编码与解码系统10设置、获取的数据等信息。
所述的显示屏13用于显示各类信息,例如,短信、照片、邮件等可视化信息。该显示屏13可以是液晶显示器(LCD,Liquid Crystal Display),LCD触摸屏或者其他类型的显示屏。
如图2所示,是本发明文字编码与解码系统的较佳实施方式的功能模块图。在本实施方式中,所述文字编码与解码系统10包括多个功能模块,分别是:创建模块100、转换模块101、编码模块102、传送模块103、接收模块104、解码模块105以及显示模块106。其中,所述的创建模块100、转换模块101、编码模块102以及传送模块103用于实现对文字信息进行编码以生成字节串,所述的接收模块104、解码模块105以及显示模块106用于实现对接收到的字节串进行解码以获取相关的文字信息。
所述的创建模块100,用于创建以5位元编码表示每个字符的编码表,并将该编码表存储于所述的存储装置12中。参考如图3所示的编码表示意图,每个字符对应5位元的编码,例如,字符“a”对应的编码是“01010”,空格符“Space”对应的编码是“11101”。
在本较佳实施方式中,所述创建模块100在创建所述编码表时参考英文字母出现的频率,将常用的字符放在所述编码表的首页。
所述创建模块100还用于设置页面编码,例如图3中的“Next page(下一页)”对应的页面编码是“11111”。在本较佳实施方式中,若字符在所述编码表的第2页,则该字符对应的编码前需要加上相应的页面编码,例如,字符“b”相应的编码是“1111100000”。
在本较佳实施方式中,为了提高编译效率,减少不必要的字符太多导致编码数目过多而影响短信息的长度,仅将英文字母的小写字母放入编码表中,如此,可精简所述编码表的内容,使得多数常用字符的编码都在编码表的首页,即,多数字符都采用5位元的编码表示,仅有少数不常用的在第2页或其他页面的字符采用10位编码表示。
图3所示的编码表仅为举例说明,在实际应用中,该编码表可包括更多的字符,例如,编码表可包括多页,除去首页外,每页都可以设置有相应的页面编码。
此外,所述的创建模块100还可以设置替代编码,所述替代编码用于在所述编码表中没有相应的字符及编码时表示该字符的编码。例如,所述编码表中没有中文字符“我”,在编码时,可使用所述的替代编码代表该中文字符“我”,例如,“11011”。
所述的转换模块101,用于接收用户通过所述通讯装置1的输入装置所输入的文字信息,将所述文字信息中的大写字母转换成小写字母。参考图4所示的子图(1),接收到的文字信息是“Please answer question ASAP.”,所述的转换模块101将该文字信息中的大写字母转换为如子图(2)所示的“please answer question asap.”。
所述的编码模块102,用于根据所述编码表确认文字信息中每个字符相应的5位元编码。参考图4中子图(3)所示,所述的编码模块102确认文字信息中的每个字符相应的编码,例如,字符“p”对应的编码是“10110”,又如字符“q”对应的编码是“1111100011”,其中“11111”是页面编码,表示字符“q”在编码表的第2页。
所述的编码模块102,还用于将确认的所有编码按顺序排列成位元队列(Bit array,参考如图4中的子图(4)所示),切分该位元队列使每8位元组成一个字节以生成字节串(参考如图4中的子图(5)所示)。若所述位元队列最后的位元数不足8位无法组成一个字节时,所述的编码模块102以预定字元将该字节的位元补充至8位,例如,该预定字元是“1”,参考如图4中的子图(5)所示的最后一个字节“01111111”,其中“1111111”为补充的位元。
所述的编码模块102,还用于在生成的字节串前面加入预设的标识码,并且在所述文字信息的标头填入编码方式以及信息长度以完成对该文字信息的编码。其中,所述的编码方式为8位编码,所述信息长度为所述字节串包括的字元的总数量。由于利用GSM传送的短信息通常使用7位编码的方式,而在本较佳实施方式中,是采用的8位编码方式,如上文所述的将5位元编码重新切分成8位元的多个字节,该8位编码方式为用户自定义的编码方式。
在本较佳实施方式中,该预设的标识码为ASCII(American Standard Code for Information Interchange 美国信息交换标准码)八进制的字符“5B”所对应的编码“[00011101][00100010]”(参考如图4中的子图(6)所示)。在其他实施方式中,该标识码可以根据编码或解码需求进行相应的设置和修改。
此外,所述的编码模块102还用于在所述文字信息中的字符出现在该编码表中非第一页的其他页面时,在该字符的编码前增加表示该字符所在页面的5位页面编码。
所述的编码模块102还用于在无法从所述编码表检索到字符的相应编码时,使用预设的替代编码表示该字符。
所述的传送模块103,用于发送该编码后的字节串至其他通讯装置。
所述的通讯装置1利用所述的解码模块105对接收到的短信息进行如下的解码。多个安装有所述文字编码与解码系统10的通讯装置之间可以对文字信息进行相应的编码及解码。
首先,所述的接收模块104,用于从其他通讯装置处接收编码后的字节串。
所述的解码模块105,用于根据预设的标识码识别该字节串是否以预定方式进行的编码,所述的预定方式是指利用存储的编码表进行的编码。例如,所述的解码模块105判断接收到的字节串中是否包括预设的标识码,若包括预设的标识码,则确定该字节串是以预定方式进行的编码。
所述的解码模块105,还用于在该字节串是以预定方式进行的编码时,根据该字节串的标头提示的编码方式将该字节串转换为每5位元为一组编码的位元队列。即,所述的解码模块105将8位元为一组的字节串切分成5位元为一组的位元队列,即图4中子图(5)至子图(4)的逆转。
所述的解码模块105,还用于检索所述编码表并确定每5位元编码代表的字符。若无法从所述编码表检索到编码相应的字符,所述的解码模块105忽略该编码,即,不对该编码进行解码。
所述的解码模块105,进一步用于在所述位元队列中包括预设的5位页面编码时,在该页面编码相应的编码表中的页面检索该页面编码后的5位元编码所代表的字符。
所述的显示模块106,用于根据确定的字符在所述通讯装置1的显示屏13上显示相应的文字信息。
如图5所示,是本发明文字编码方法的较佳实施方式的流程图。首先,步骤S2,所述的创建模块100创建以5位元编码表示每个字符的编码表,并将该编码表存储于所述的存储装置12中。
步骤S4,所述的转换模块101接收用户通过所述通讯装置1的输入装置所输入的文字信息,将所述文字信息中的大写字母转换成小写字母。
步骤S6,所述的编码模块102根据所述编码表确认文字信息中每个字符相应的5位元编码。
步骤S8,所述的编码模块102将确认的所有编码按顺序排列成位元队列,切分该位元队列使每8位元组成一个字节以生成字节串。若所述位元队列最后的位元数不足8位无法组成一个字节时,所述的编码模块102以预定字元将该字节的位元补充至8位。
步骤S10,所述的编码模块102在生成的字节串前面加入预设的标识码。
步骤S12,所述的编码模块102在所述文字信息的标头填入编码方式以及信息长度以完成对该文字信息的编码。
步骤S14,所述的传送模块103发送该编码后的字节串至其他通讯装置,然后,结束本流程。
如图6所示,是本发明文字解码方法的较佳实施方式的流程图。首先,步骤S20,所述的通讯装置1中存储有以5位元编码表示每个字符的编码表。
步骤S22,所述的接收模块104从其他通讯装置处接收编码后的字节串。
步骤S24,所述的解码模块105根据预设的标识码判断该字节串是否以预定方式进行的编码。若该字节串不是以预定方式进行的编码,则结束本流程。
若字节串是以预定方式进行的编码,于步骤S26,所述的解码模块105根据该字节串的标头提示的编码方式将该字节串转换为每5位元为一组编码的位元队列。
步骤S28,所述的解码模块105检索所述编码表并确定每5位元编码代表的字符。
步骤S30,所述的显示模块106根据确定的字符在所述通讯装置1的显示屏13上显示相应的文字信息,然后,结束本流程。
以上实施方式仅用以说明本发明的技术方案而非限制,尽管参照以上较佳实施方式对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换都不应脱离本发明技术方案的精神和范围。
Claims (12)
1.一种文字编码系统,应用于通讯装置中,其特征在于,该系统包括:
创建模块,用于创建以5位元编码表示每个字符的编码表;
转换模块,用于接收输入的文字信息,将所述文字信息中的大写字母转换成小写字母;
编码模块,用于根据所述编码表确认文字信息中每个字符相应的5位元编码,将确认的所有编码按顺序排列成位元队列,切分该位元队列使每8位元组成一个字节以生成字节串,并在该位元队列最后的位元数不足8位时以预定字元补充至8位;
所述的编码模块,还用于在生成的字节串前面加入预设的标识码,并且在所述文字信息的标头填入编码方式以及信息长度以完成对该文字信息的编码;及
传送模块,用于发送该编码后的字节串。
2.如权利要求1所述的文字编码系统,其特征在于,所述的编码模块还用于在所述编码表包括多页且字符出现在该编码表中非第一页的其他页面时,在该字符的编码前增加表示该字符所在页面的5位页面编码。
3.如权利要求1所述的文字编码系统,其特征在于,所述的编码模块还用于在无法从所述编码表检索到字符的相应编码时,使用预设的替代编码表示该字符。
4.如权利要求1所述的文字编码系统,其特征在于,所述的编码方式为8位编码,所述信息长度为所述字节串包括的字元的总数量。
5.一种文字解码系统,应用于通讯装置中,其特征在于,所述的通讯装置存储有以5位元编码表示每个字符的编码表,该系统包括:
接收模块,用于接收编码后的字节串;
解码模块,用于根据预设的标识码识别该字节串是否以预定方式进行的编码,所述的预定方式是指利用存储的编码表进行的编码;
所述的解码模块,还用于在该字节串是以预定方式进行的编码时根据该字节串的标头提示的编码方式将该字节串转换为每5位元为一组编码的位元队列,并检索所述编码表并确定每5位元编码代表的字符;及
显示模块,用于根据确定的字符在所述通讯装置的显示屏上显示相应的文字信息。
6.如权利要求5所述的文字解码系统,其特征在于,所述的解码模块还用于在所述位元队列中包括预设的5位页面编码时,在该页面编码相应的编码表中的页面检索该页面编码后的5位元编码所代表的字符。
7.一种文字编码方法,应用于通讯装置中,其特征在于,该方法包括如下步骤:
创建以5位元编码表示每个字符的编码表;
接收输入的文字信息,将所述文字信息中的大写字母转换成小写字母;
根据所述编码表确认文字信息中每个字符相应的5位元编码;
将确认的所有编码按顺序排列成位元队列,切分该位元队列使每8位元组成一个字节以生成字节串,并在该位元队列最后的位元数不足8位时以预定字元补充至8位;
在生成的字节串前面加入预设的标识码;
在所述文字信息的标头填入编码方式以及信息长度,以完成对该文字信息的编码;及
发送该编码后的字节串。
8.如权利要求7所述的文字编码方法,其特征在于,该方法还包括:
若所述编码表包括多页且字符出现在该编码表中非第一页的其他页面,在该字符的编码前增加表示该字符所在页面的5位页面编码。
9.如权利要求7所述的文字编码方法,其特征在于,该方法还包括:
若无法从所述编码表检索到字符的相应编码,使用预设的替代编码表示该字符。
10.如权利要求7所述的文字编码方法,其特征在于,所述的编码方式为8位编码,所述信息长度为所述字节串包括的字元的总数量。
11.一种文字解码方法,应用于通讯装置中,其特征在于,所述通讯装置存储有以5位元编码表示每个字符的编码表,该方法包括如下步骤:
接收编码后的字节串;
根据预设的标识码识别该字节串是否以预定方式进行的编码,所述的预定方式是指利用存储的编码表进行的编码;
若该字节串是以预定方式进行的编码,根据该字节串的标头提示的编码方式将该字节串转换为每5位元为一组编码的位元队列;
检索所述编码表并确定每5位元编码代表的字符;及
根据确定的字符在所述通讯装置的显示屏上显示相应的文字信息。
12.如权利要求11所述的文字解码方法,其特征在于,该方法还包括:
若所述位元队列中包括预设的5位页面编码,在该页面编码相应的编码表中的页面检索该页面编码后的5位元编码所代表的字符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210126783 CN103379457A (zh) | 2012-04-27 | 2012-04-27 | 文字编码与解码系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210126783 CN103379457A (zh) | 2012-04-27 | 2012-04-27 | 文字编码与解码系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103379457A true CN103379457A (zh) | 2013-10-30 |
Family
ID=49463921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201210126783 Pending CN103379457A (zh) | 2012-04-27 | 2012-04-27 | 文字编码与解码系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103379457A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017024978A1 (zh) * | 2015-08-13 | 2017-02-16 | 阿里巴巴集团控股有限公司 | 短信息的发送、接收方法及装置 |
CN111988297A (zh) * | 2020-08-13 | 2020-11-24 | 北京诚志重科海图科技有限公司 | 一种文字通信保密传输明密转换系统 |
-
2012
- 2012-04-27 CN CN 201210126783 patent/CN103379457A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017024978A1 (zh) * | 2015-08-13 | 2017-02-16 | 阿里巴巴集团控股有限公司 | 短信息的发送、接收方法及装置 |
CN111988297A (zh) * | 2020-08-13 | 2020-11-24 | 北京诚志重科海图科技有限公司 | 一种文字通信保密传输明密转换系统 |
CN111988297B (zh) * | 2020-08-13 | 2022-09-13 | 北京诚志重科海图科技有限公司 | 一种文字通信保密传输明密转换系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100495318C (zh) | 整型数据的压缩方法、装置及解压缩方法、装置 | |
CN101350858B (zh) | 一种短信解码的方法和用户终端 | |
CN101299857B (zh) | 一种输出通讯信息的方法及装置 | |
CN1655635A (zh) | 短消息菜单控制的格式 | |
CN104579360B (zh) | 一种数据处理的方法和设备 | |
US8473280B2 (en) | System and methods for cost-effective bilingual texting | |
EP2482231B1 (en) | Method for encoding and decoding data on a matrix code symbol | |
CN1041026C (zh) | 数字通信系统以及用于该系统的发射设备和接收设备 | |
CN105630755A (zh) | 北斗卫星短报文扩大信息量传输的信源编解码方法及装置 | |
CN103379457A (zh) | 文字编码与解码系统及方法 | |
CN101621771B (zh) | 短信编码处理方法、装置及系统 | |
CN101345952A (zh) | 客户身份识别卡的数据存储、读取方法、装置及系统 | |
CN101599264B (zh) | 移动终端上显示字符的方法及相关装置 | |
CN101116349B (zh) | 语境识别增强消息转换系统和方法 | |
CN101179798B (zh) | 在手机之间传输数据的操作方法及装置 | |
Affandi et al. | The application of text compression to short message service using huffman table | |
CN103138871A (zh) | 移动通讯系统中应用程序的服务器数据处理系统和方法 | |
CN101872409A (zh) | 调用数据卡中应用程序的方法及装置 | |
CN101110979B (zh) | 一种消息传送的方法、装置及系统 | |
CN102281516B (zh) | 一种短信处理方法及短信处理终端 | |
US20130288724A1 (en) | Communication device and text coding and decoding method | |
CN101352015A (zh) | 通过sms协议传送手写体 | |
CN101742441A (zh) | 压缩手机短信的通讯方法、短信发送终端和短信接收终端 | |
CN102790951A (zh) | 一种移动终端的信息输入方法、系统和移动终端 | |
CN102007786A (zh) | 用于提供不均等消息保护的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131030 |