CN104750695A - 智能字库文件转码系统及方法 - Google Patents
智能字库文件转码系统及方法 Download PDFInfo
- Publication number
- CN104750695A CN104750695A CN201310732862.9A CN201310732862A CN104750695A CN 104750695 A CN104750695 A CN 104750695A CN 201310732862 A CN201310732862 A CN 201310732862A CN 104750695 A CN104750695 A CN 104750695A
- Authority
- CN
- China
- Prior art keywords
- character
- encoded radio
- library
- current
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Controls And Circuits For Display Device (AREA)
Abstract
本发明提供一种智能字库文件转码方法。该方法包括步骤:通过查找编码类型表的索引将源字符编码格式字库的文件头转换成目标字符编码格式字库的文件头;以行为单位扫描源字符编码格式字库内的数据;在扫描到当前行数据为第一特征字段时,将其标记为当前字符点阵信息的开始并继续以行为单位扫描;提取所述当前字符点阵信息中的编码值,称其为第一编码值;将所述第一编码值通过查表及调用转化函数的方法将其转化成目标字符编码格式中对应字符点阵信息中的编码值,称其为第二编码值,将所述第二编码值回写至所述当前字符点阵信息中。本发明还提供一种智能字库文件转码系统。
Description
技术领域
本发明涉及一种智能字库文件转码系统及方法。
背景技术
BDF(Bitmap Distribution Format,Adobe公司制定的点阵字体文件格式)是一种广泛使用的字库标准,目前有很多开源的BDF字库可供使用,但是其编码格式一般只采用GB2312和UCS2中的一种。通常手机平台是不提供字符库的,若使用第三方的字符库,需要支付较昂贵的版权许可费用。虽然BDF字库已广泛使用在多种PC和手机操作系统上,但是有些手机操作系统因为性能原因要求BDF字库是特定某种编码格式,例如MTK feature phone使用的字库是BDF格式,只能使用UCS2编码格式。因此,当BDF字库采用的编码格式与手机操作系统所要求的编码格式不一致时,需要将其转化成所要求的格式。但是,字库文件包含了成千上万个字码字体数据,如果使用人工进行转换,显然不可实现。
发明内容
鉴于以上内容,有必要提供智能字库文件转码系统,通过动态扫描和识别字符点阵信息,实现源字符编码格式到目标字符编码格式的转换,从而形成新的字库文件。
所述智能字库文件转码系统,运行于电子装置中。该系统包括:初始化模块,用于通过查找编码类型表的索引将源字符编码格式字库的文件头转换成目标字符编码格式字库的文件头;扫描模块,用于以行为单位扫描源字符编码格式字库内的数据;所述的扫描模块,还用于在扫描到当前行数据为第一特征字段时,将其标记为当前字符点阵信息的开始并继续以行为单位扫描;处理模块,用于提取所述当前字符点阵信息中的编码值,称其为第一编码值;所述的处理模块,还用于将所述第一编码值通过查表及调用转化函数的方法将其转化成目标字符编码格式中对应字符点阵信息中的编码值,称其为第二编码值,并将所述第二编码值回写至所述当前字符点阵信息中。
此外,还有必要提供一种智能字库文件转码方法。
所述智能字库文件转码方法,应用于电子装置中。该码方法包括如下步骤:
初始化步骤,通过查找编码类型表的索引将源字符编码格式字库的文件头转换成目标字符编码格式字库的文件头;
扫描步骤一,以行为单位扫描源字符编码格式字库内的数据;
扫描步骤二,在扫描到当前行数据为第一特征字段时,将其标记为当前字符点阵信息的开始并继续以行为单位扫描;
处理步骤一,提取所述当前字符点阵信息中的编码值,称其为第一编码值;
处理步骤二,将所述第一编码值通过查表及调用转化函数的方法将其转化成目标字符编码格式中对应字符点阵信息中的编码值,称其为第二编码值,将所述第二编码值回写至所述当前字符点阵信息中。
相较于现有技术,所述的智能字库文件转码系统及方法,通过动态扫描和识别字符点阵信息,实现源字符编码格式到目标字符编码格式的转换来形成新的字库文件,从而可以处理人工无法处理的大规模的字库文件中字符编码格式之间的转换。
主要元件符号说明
电子装置 1
转码系统 10
初始化模块 101
扫描模块 102
处理模块 103
判断模块 104
存储设备 11
处理器 12
如下具体实施方式将结合上述附图进一步说明本发明。
附图说明
图1是本发明智能字库文件转码系统较佳实施例的运行环境图。
图2是本发明智能字库文件转码方法较佳实施例的流程图。
图3是本发明智能字库文件转码方法将GB2312编码格式转化成UCS2编码格式的具体实施例图。
图4是图3中的具体实施例转化完成后得到的UCS2编码格式字库示意图。
具体实施方式
参阅图1所示,是本发明智能字库文件转码系统较佳实施例的运行环境图,所述的智能字库文件转码系统10(以下简称“转码系统10”)安装并运行于电子装置1中。该电子装置1还包括,但不仅限于存储设备11及处理器12。所述的电子装置1可以是电脑、手机、PAD(Personal Digital Assistant,个人数字助理)等。
所述的转码系统10包括有初始化模块101、扫描模块102、处理模块103及判断模块104。本发明所称的功能模块是指一种能够被电子装置1的处理器12所执行并且能够完成固定功能的一系列程序指令段,其存储在电子装置1的存储设备11中。因此本发明以下对软件都用模块加以描述。关于各功能模块101-104将于图2的流程图中作详细描述。
参阅图2所示,是本发明智能字库文件转码方法较佳实施例的流程图。通过如下步骤S01至S08,可以处理人工无法处理的大规模字库文件的编码转换。
步骤S01,初始化模块101首先通过查找编码类型表的索引将源字符编码格式字库的文件头转换成目标字符编码格式字库的文件头。在本实施例中,字符编码格式字库内包含文件头、多个字符点阵信息和字库结束符“ENDFONT”。
步骤S02,扫描模块102以行为单位扫描源字符编码格式字库内的数据。
步骤S03,在扫描模块102扫描到当前行数据为第一特征字段时,将其标记为当前字符点阵信息的开始并继续以行为单位扫描。在本实施例中,所述的第一特征字段为“STARTCHAR”。
步骤S04,处理模块103提取所述当前字符点阵信息中的编码值,称其为第一编码值。
步骤S05,处理模块103将所述第一编码值通过查表及调用转化函数的方法将其转化成目标字符编码格式中对应字符点阵信息中的编码值,称其为第二编码值,并将所述第二编码值回写至所述当前字符点阵信息中。
步骤S06,扫描模块102扫描到当前行数据为第二特征字段时,将其标记为当前字符点阵信息的结束。在本实施例中,所述的第二特征字段为“ENDCHAR”。
步骤S07,判断模块104判断是否源字符编码格式字库内的所有字符点阵信息扫描完毕。在本实施例中所有字符点阵信息扫描完毕是指扫描模块102扫描到源字符编码格式字库内的结束符“ENDFONT”。当源字符编码格式字库内的所有字符点阵信息扫描完毕时,结束流程;否则,流程进入步骤S08。
步骤S08,扫描模块102继续以行为单位扫描源字符编码格式字库内的下一个字符点阵信息,再返回步骤S03。
上述步骤具体如图3和图4所示将GB2312编码格式转化成UCS2编码格式的具体实施例来说明。首先通过查找编码类型表的索引将GB2312编码格式的字库文件头:
STARTFONT2.1
FONT-CCLIB-Song-Delicate-R-Normal—16-150-78-78-c-160-GB2312.1980-0
SIZE167878
ENDPROPERTIES
CHARS7614
转换成UCS2编码格式的字库文件头:
STARTFONT2.1
FONT-CCLIB-Song-Delicate-R-Normal—16-150-78-78-c-160-ISO10646-1
SIZE167878
ENDPROPERTIES
CHARS7614
再以行为单位扫描GB2312编码格式字库内的数据;当当前扫描行内数据是特征字段“SHARTCHAR”时,将其标记为当前字符点阵信息的开始并继续以行为单位扫描;提取所述当前字符点阵信息中的编码值“ENCODING8481”;将所述编码值“ENCODING8481”通过查表以及调用转换函数charset-wchar-to-usc2将其转化成UCS2编码格式字库内对应字符点阵信息中的编码值“ENCODING12288”,并将所述编码值“ENCODING12288”回写至所述当前字符点阵信息中,当当前扫描行内数据是特征字段“ENDCHAR”时,将其标记为当前字符点阵信息的结束。判断是否GB2312编码格式字库内所有字符点阵信息扫描完毕,若扫描完毕则结束流程;否则,继续以行为单位扫描GB2312编码格式字库内的下一个字符点阵信息,并采用同样的方法将所述下一个字符点阵信息中的编码值转换成UCS2编码格式字库内对应点阵信息的编码值,直到GB2312编码格式字库内的所有字符点阵信息扫描完毕;得到如图4所示的转化完成后的UCS2编码格式字库示意图。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照以上较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换都不应脱离本发明技术方案的精神和范围。
Claims (10)
1.一种智能字库文件转码系统,其特征在于,该系统包括:
初始化模块,用于通过查找编码类型表的索引将源字符编码格式字库的文件头转换成目标字符编码格式字库的文件头;
扫描模块,用于以行为单位扫描源字符编码格式字库内的数据;
所述的扫描模块,还用于在扫描到当前行数据为第一特征字段时,将其标记为当前字符点阵信息的开始并继续以行为单位扫描;
处理模块,用于提取所述当前字符点阵信息中的编码值,称其为第一编码值;
所述的处理模块,还用于将所述第一编码值通过查表及调用转化函数的方法将其转化成目标字符编码格式中对应字符点阵信息中的编码值,称其为第二编码值,并将所述第二编码值回写至所述当前字符点阵信息中。
2.如权利要求1所述的智能字库文件转码系统,其特征在于,所述的扫描模块,还用于在扫描到当前行数据为第二特征字段时,将其标记为当前字符点阵信息的结束。
3.如权利要求1所述的智能字库文件转码系统,其特征在于,该系统还包括判断模块,用于判断源字符编码格式字库内的所有字符点阵信息是否扫描完毕。
4.如权利要求2所述的智能字库文件转码系统,其特征在于,所述的第一特征字段为“STARTCHAR”,第二特征字段为“ENDCHAR”。
5.如权利要求3所述的智能字库文件转码系统,其特征在于,所述的源字符编码格式字库内所有字符点阵信息扫描完毕是指扫描到源字符编码格式字库内的结束符“ENDFONT”。
6.一种智能字库文件转码方法,其特征在于,该方法包括如下步骤:
初始化步骤,通过查找编码类型表的索引将源字符编码格式字库的文件头转换成目标字符编码格式字库的文件头;
扫描步骤一,以行为单位扫描源字符编码格式字库内的数据;
扫描步骤二,在扫描到当前行数据为第一特征字段时,将其标记为当前字符点阵信息的开始并继续以行为单位扫描;
处理步骤一,提取所述当前字符点阵信息中的编码值,称其为第一编码值;
处理步骤二,将所述第一编码值通过查表及调用转化函数的方法将其转化成目标字符编码格式中对应字符点阵信息中的编码值,称其为第二编码值,将所述第二编码值回写至所述当前字符点阵信息中。
7.如权利要求6所述的智能字库文件转码方法,其特征在于,该方法还包括扫描步骤三,在扫描到当前行数据为第二特征字段时,将其标记为当前字符点阵信息的结束。
8.如权利要求6所述的智能字库文件转码方法,其特征在于,该方法还包括重复步骤,当源字符编码格式字库内还有字符点阵信息没有扫描时,以行为单位扫描下一个字符点阵信息,然后重复执行上述扫描步骤二至处理步骤二,直到源字符编码格式字库内所有字符点阵信息扫描完毕。
9.如权利要求7所述的智能文件转码方法,其特征在于,所述的第一特征字段为“STARTCHAR”,第二特征字段为“ENDCHAR”。
10.如权利要求8所述的智能字库文件转码方法,其特征在于,所述的源字符编码格式字库内所有字符点阵信息扫描完毕是指扫描到源字符编码格式字库内的结束符“ENDFONT”。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310732862.9A CN104750695A (zh) | 2013-12-26 | 2013-12-26 | 智能字库文件转码系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310732862.9A CN104750695A (zh) | 2013-12-26 | 2013-12-26 | 智能字库文件转码系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104750695A true CN104750695A (zh) | 2015-07-01 |
Family
ID=53590405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310732862.9A Pending CN104750695A (zh) | 2013-12-26 | 2013-12-26 | 智能字库文件转码系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104750695A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110826005A (zh) * | 2019-11-13 | 2020-02-21 | 北大方正集团有限公司 | 文件生成方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101008939A (zh) * | 2007-01-25 | 2007-08-01 | 深圳创维-Rgb电子有限公司 | 一种嵌入式系统的点阵字库的实现方法 |
CN101324880A (zh) * | 2007-06-13 | 2008-12-17 | 英华达(上海)电子有限公司 | 一种文字编码的转换方法及转换系统 |
CN101325758A (zh) * | 2007-06-15 | 2008-12-17 | 英华达(南京)科技有限公司 | 可显示多种语言的移动通讯装置及方法 |
CN101655836A (zh) * | 2009-09-03 | 2010-02-24 | 厦门敏讯信息技术股份有限公司 | 嵌入式终端及其utf-8、gb2312编码转换方法 |
CN101963954A (zh) * | 2009-07-24 | 2011-02-02 | 康佳集团股份有限公司 | 一种文字显示的方法及装置 |
CN102141916A (zh) * | 2011-01-19 | 2011-08-03 | 深圳创维数字技术股份有限公司 | 嵌入式设备及其在osd界面显示语言文字的方法 |
CN103399843A (zh) * | 2013-08-20 | 2013-11-20 | 烽火通信科技股份有限公司 | 一种Linux VFAT文件系统模块支持GB18030字符集的方法 |
-
2013
- 2013-12-26 CN CN201310732862.9A patent/CN104750695A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101008939A (zh) * | 2007-01-25 | 2007-08-01 | 深圳创维-Rgb电子有限公司 | 一种嵌入式系统的点阵字库的实现方法 |
CN101324880A (zh) * | 2007-06-13 | 2008-12-17 | 英华达(上海)电子有限公司 | 一种文字编码的转换方法及转换系统 |
CN101325758A (zh) * | 2007-06-15 | 2008-12-17 | 英华达(南京)科技有限公司 | 可显示多种语言的移动通讯装置及方法 |
CN101963954A (zh) * | 2009-07-24 | 2011-02-02 | 康佳集团股份有限公司 | 一种文字显示的方法及装置 |
CN101655836A (zh) * | 2009-09-03 | 2010-02-24 | 厦门敏讯信息技术股份有限公司 | 嵌入式终端及其utf-8、gb2312编码转换方法 |
CN102141916A (zh) * | 2011-01-19 | 2011-08-03 | 深圳创维数字技术股份有限公司 | 嵌入式设备及其在osd界面显示语言文字的方法 |
CN103399843A (zh) * | 2013-08-20 | 2013-11-20 | 烽火通信科技股份有限公司 | 一种Linux VFAT文件系统模块支持GB18030字符集的方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110826005A (zh) * | 2019-11-13 | 2020-02-21 | 北大方正集团有限公司 | 文件生成方法、装置、电子设备及存储介质 |
CN110826005B (zh) * | 2019-11-13 | 2022-12-16 | 北大方正集团有限公司 | 文件生成方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101996160B (zh) | 一种字体数据的处理方法及系统 | |
CN101441713B (zh) | 一种pdf文件的光学字符识别方法及装置 | |
CN107688789B (zh) | 文档图表抽取方法、电子设备及计算机可读存储介质 | |
CN108038093B (zh) | Pdf文字提取方法和装置 | |
CN101526963A (zh) | 网页编码识别方法、装置和终端设备 | |
CN101782896A (zh) | 结合ocr技术的pdf文字提取方法 | |
CN101202976A (zh) | 移动通信终端字符转换装置及方法 | |
RU2406142C2 (ru) | Система и способ для сохранения документа в последовательном двоичном формате | |
CN104615585A (zh) | 处理文本信息的方法及装置 | |
CN101815086A (zh) | 一种用于移动通讯设备终端的浏览器字体优化方法 | |
CN109992221B (zh) | 一种用于矢量字库运算的处理器芯片的实现方法 | |
CN101345952B (zh) | 客户身份识别卡的数据存储、读取方法、装置及系统 | |
CN103699314A (zh) | 实现手写签字的方法及终端 | |
CN104750695A (zh) | 智能字库文件转码系统及方法 | |
JP2012085274A (ja) | テキストをマトリクスコードシンボルに符号化するコンピュータ実行方法、マトリクスコードシンボルを復号化するコンピュータ実行方法、テキストをマトリクスコードシンボルに符号化するためのエンコーダ、およびマトリクスコードシンボルを復号化するためのデコーダ | |
CN102063416A (zh) | 向pdf文件内嵌双字节字体的方法及其系统 | |
CN112395529A (zh) | 页面加载方法、装置、设备及存储介质 | |
CN101840483B (zh) | 一种计算机文档内容保护的方法和系统 | |
CN115525260A (zh) | 一种基于protobuf的代码生成方法和装置 | |
CN109614592A (zh) | 文本的处理方法、装置、存储介质和电子设备 | |
CN111611756B (zh) | 一种电路板文字设计方法、设计装置及终端设备 | |
CN113326677A (zh) | 字幕渲染方法及装置、设备、计算机可读存储介质 | |
CN113296827A (zh) | 不同语言的转换方法、装置及终端设备 | |
CN112383888A (zh) | 一种短信系统、方法以及设备 | |
CN1941751B (zh) | 一种船载自动识别系统换码收发含汉字的信息的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150701 |