CN101122911A - 已知格式字库的对比系统及方法 - Google Patents
已知格式字库的对比系统及方法 Download PDFInfo
- Publication number
- CN101122911A CN101122911A CNA2007100186443A CN200710018644A CN101122911A CN 101122911 A CN101122911 A CN 101122911A CN A2007100186443 A CNA2007100186443 A CN A2007100186443A CN 200710018644 A CN200710018644 A CN 200710018644A CN 101122911 A CN101122911 A CN 101122911A
- Authority
- CN
- China
- Prior art keywords
- character
- contrast
- library
- unit
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Controls And Circuits For Display Device (AREA)
Abstract
一种已知格式字库的对比系统及方法,该系统包括记忆单元、格式转换单元、对比单元及显示单元,记忆单元包括可储存复数个字库的第一储存区以及可储存对比结果的第二储存区,字库中储存有二进制字符位图数据;本发明方法包括:选择需要进行格式对比的字库;设定对比格式;读取第N个字符资料;将字符数据转换为同一对比格式;对比字符数据并记录对比结果;显示对比结果;储存对比结果。本发明解决了现有对比系统及方法执行二进制档案数据对比的作业过程极为繁琐且无法对比压缩后的档案的技术问题,具有方便使用者查找出不同字库的差异所在、有效改善和提高字库对比工作的作业效率、适用范围广的优点。
Description
技术领域
本发明涉及一种可应用于电子辞典字库间的对比系统及方法,尤其涉及一种针对已知格式的字库之间进行对比的系统及方法。
背景技术
电子辞典已成为人们最快捷的语言查询工具,尤其成为一种使用者自学的语言学习装置。但是,为满足不同使用者的需求,电子辞典中通常需要建立许多字库供使用者选择自己所喜爱的字符来显示字型。然而,在这些字库的开发过程中,开发人员必须经常修改字库中数量庞大的字符数据。因为这些字库里的字符数据是以二进制档案(binary files)形式储存,必要时这些字符数据还是经过压缩的档案,所以研发人员迫切需要一种可以处理二进制档案的字库对比程序。但是,目前用来作为字库对比的软件,如VSS(Visual SourceSafe),只能处理单纯的文字文件(text files)数据,而无法应用于二进制档案的数据处理;另一种对比工具如UE(ultra edit),虽可执行二进制档案的数据对比,但其作业过程极为繁琐且无法对比压缩后的档案,所以仍然无法解决研发人员的对比问题。
发明内容
本发明的目的是提供一种可应用于电子辞典已知格式字库的对比系统及方法,其解决了现有对比系统及方法无法应用于二进制档案的数据处理、或者执行二进制档案数据对比的作业过程极为繁琐且无法对比压缩后的档案的技术问题。
本发明的技术解决方案是:
一种已知格式字库的对比系统,包括记忆单元100、格式转换单元130、对比单元160以及显示单元170,所述记忆单元100包括可储存复数个字库111的第一储存区110以及可储存对比结果的第二储存区120,所述每个字库111中按字符编码顺序储存有复数个字符数据,所述字符数据是二进制字符位图;所述格式转换单元130与记忆单元100的复数个字库111分别连接,用以转换字库111中二进制字符位图的像素格式;所述对比单元160与记忆单元100的第二存储区120及格式转换单元130相连接,用以对比经格式转换后的字符位图并将对比结果储存于第二储存区120;所述显示单元170与对比单元160相连接,用以显示对比结果。
上述对比系统还包括解压缩单元140,所述解压缩单元140设置在第一存储区110和格式转换单元130之间,用以解压缩字库中经压缩的字符数据。
上述对比系统还包括设定单元150,所述设定单元150分别与第一储存区110及格式转换单元130及解压缩单元140相连接,用以设定待对比的字库、字符数据的像素格式及是否解压缩字符数据。
一种已知格式字库的对比方法,依次包括以下步骤:
步骤200]选择需要进行格式对比的第一字库及第二字库;
步骤210]设定第一字库及第二字库中字符数据的对比格式;
步骤220]读取第一字库及第二字库中的第N个字符资料,N≥1;
步骤240]将第一字库及第二字库中的第N个字符数据转换为同一对比格式;
步骤250]对比第一字库及第二字库中的第N个字符数据并记录对比结果;
步骤260]判断是否对比完毕,如果对比完毕,进行步骤270,如果对比没有完毕,重复步骤220至步骤250进行第N+1个字符的对比;
步骤270]显示对比结果;
步骤280]储存对比结果。
上述步骤220和步骤240之间还可包括以下步骤:
步骤230]解压缩字符数据。
本发明的优点是:通过本发明已知格式字库的对比系统及方法,使用者可以在进行电子辞典字库修改的过程中,方便查找出不同字库的差异所在,并可记录此差异字符的字符编码、储存位置、字符位图差异等相关信息以备日后查看,有效改善和提高字库对比工作的作业效率。另外,无论字库中的字符数据是否为压缩档案,本发明系统及方法无须经过复杂的数据处理程序即可直接对比二进制的字符数据及经压缩的字符数据,适用范围广。
附图说明
图1是本发明已知格式字库的对比系统的结构示意图;
图2是本发明已知格式字库的对比方法的流程图;
其中:100-记忆单元,110-第一储存区,111-字库,120-第二储存区,130-格式转换单元,140-解压缩单元,160-对比单元,170-显示单元,150-设定单元;
步骤200-选择需要进行格式对比的一第一字库及一第二字库;
步骤210-设定第一字库及第二字库中字符数据的对比格式;
步骤220-读取第一字库及第二字库中第N个字符资料;
步骤230-解压缩字符数据;
步骤240-将第一字库及第二字库中第N个字符数据转换为同一对比格式;
步骤250-对比第一字库及第二字库中第N个字符数据并纪录对比结果;
步骤260-是否对比完毕?
步骤270-显示对比结果;
步骤280-储存对比结果;
步骤290-是否对比其它字库?
具体实施方式
本发明已知格式字库对比系统的结构示意图参见图1,应用于电子辞典的字库对比工作,此系统包含有记忆单元100、格式转换单元130、解压缩单元140、对比单元160、显示单元170及设定单元150。
记忆单元100包括一个可储存至少两个字库111的第一储存区110以及一个可储存对比结果的第二储存区120,其中各字库111中储存有依字符的字符编码顺序存放的复数个字符数据,该字符数据为二进制档案所组成的字符位图。格式转换单元130与记忆单元100相连接,用于转换字符位图的像素格式;解压缩单元140设置在第一存储区110和格式转换单元130之间,用于解压缩字库中经压缩的字符数据;对比单元160与记忆单元100、解压缩单元140及格式转换单元130相连接,用于对比经格式转换或经解压缩的字符数据并将对比结果储存于记忆单元100中的第二储存区120;显示单元170与对比单元160相连接,可显示对比结果以供使用者查看,其中对比结果记录有字符相异总数、字符位图差异、字符数据储存位置及相异字符的字符编码;设定单元150与记忆单元100、格式转换单元130及解压缩单元140相连接,用于设定待对比的字库、字符数据的像素格式及是否解压缩字符数据。
本发明已知格式字库对比方法的步骤流程图参见图2,应用于电子辞典的字库对比系统中,其中储存于各字库中的字符数据是二进制的字符位图数据。
首先,利用设定单元150选择需要进行格式对比的第一字库及第二字库(步骤200),例如第一字库中各字符数据是压缩档案且其格式为15×16像素大小的位图,而第二字库中各字符数据是非压缩档案且其格式为11×12像素大小的位图;选取待对比的字库完毕后,再通过设定单元150设定第一字库及第二字库共同的字符数据对比格式(步骤210),也就是设定像素格式大小(即字体大小)及字符数据是否为压缩档案,例如可设定共同的像素格式为12×12(即字体大小12);完成设定条件后,接着从记忆单元100的第一储存区110中读取第一字库及第二字库中第N个字符数据(步骤220),例如读取第一字库及第二字库中的第1个字符数据;经压缩的字符数据通过解压缩单元140进行解压缩(步骤230),例如,将第一字库中第1个字符数据解压缩;按据设定单元150所设定的条件,格式转换单元130将第一字库及第二字库中的第N个字符数据转换为相同格式(步骤240),例如将第一字库及第二字库中的第1个字符数据皆转换为具有12×12像素格式(即字体大小为12)的位图;此时对比单元160将进行第一字库及第二字库中第1个字符数据的对比工作(步骤250),对比构成两字符数据位图的二进制档案内容并记录差异处的相关信息;接下来,判断是否完成最后一笔数据的对比工作(步骤260),如果还没有完成所有字符数据的对比,则重复步骤230至步骤260,对比第N+1个字符数据,例如对比第一字库及第二字库中的第2个字符数据,如果已经完成全部字符数据对比则执行下一步骤;当所有对比工作完成后,显示单元170显示对比结果(步骤270),使用者可从所显示的对比结果中获得两个字库中相异字符的数目、字符图形差异、储存位置及字符编码等相关信息;接着,使用者可将对比结果储存于记忆单元100的第二储存区120中(步骤280),并可选择储存成文字文件或字符数据类型;最后,决定是否进行另一组字库的对比工作(步骤290),如果不再进行对比则结束整个字库对比流程,若选择继续其它字库对比工作,则重复步骤210至步骤290。
Claims (6)
1.一种已知格式字库的对比系统,其特征在于:所述对比系统包括记忆单元(100)、格式转换单元(130)、对比单元(160)以及显示单元(170),所述记忆单元(100)包括可储存复数个字库(111)的第一储存区(110)以及可储存对比结果的第二储存区(120),所述每个字库(111)中按字符编码顺序储存有复数个字符数据,所述字符数据是二进制字符位图;所述格式转换单元(130)与记忆单元(100)的复数个字库(111)分别连接,用以转换字库(111)中二进制字符位图的像素格式;所述对比单元(160)与记忆单元(100)的第二存储区(120)及格式转换单元(130)相连接,用以对比经格式转换后的字符位图并将对比结果储存于第二储存区(120);所述显示单元(170)与对比单元(160)相连接,用以显示对比结果。
2.根据权利要求1所述的已知格式字库的对比系统,其特征在于:所述对比系统还包括设定单元(150),所述设定单元(150)分别与第一储存区(110)及格式转换单元(130)相连接,用以设定待对比的字库、字符数据的像素格式。
3.根据权利要求1所述的已知格式字库的对比系统,其特征在于:所述对比系统还包括解压缩单元(140),所述解压缩单元(140)设置在第一存储区(110)和格式转换单元(130)之间,用以解压缩字库中经压缩的字符数据。
4.根据权利要求3所述的已知格式字库的对比系统,其特征在于:所述对比系统还包括设定单元(150),所述设定单元(150)分别与第一储存区(110)及格式转换单元(130)及解压缩单元(140)相连接,用以设定待对比的字库、字符数据的像素格式及是否解压缩字符数据。
5.一种已知格式字库的对比方法,其特征在于:所述对比方法依次包括以下步骤:
步骤200]选择需要进行格式对比的第一字库及第二字库;
步骤210]设定第一字库及第二字库中字符数据的对比格式;
步骤220]读取第一字库及第二字库中的第N个字符资料,N≥1;
步骤240]将第一字库及第二字库中的第N个字符数据转换为同一对比格式;
步骤250]对比第一字库及第二字库中的第N个字符数据并记录对比结果;
步骤260]判断是否对比完毕,如果对比完毕,进行步骤270,如果对比没有完毕,重复步骤220至步骤250进行第N+1个字符的对比;
步骤270]显示对比结果;
步骤280]储存对比结果。
6.根据权利要求5所述的已知格式字库的对比方法,其特征在于:所述步骤220和步骤240之间还包括以下步骤:
步骤230]解压缩字符数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710018644A CN100580673C (zh) | 2007-09-13 | 2007-09-13 | 已知格式字库的对比系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710018644A CN100580673C (zh) | 2007-09-13 | 2007-09-13 | 已知格式字库的对比系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101122911A true CN101122911A (zh) | 2008-02-13 |
CN100580673C CN100580673C (zh) | 2010-01-13 |
Family
ID=39085247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200710018644A Expired - Fee Related CN100580673C (zh) | 2007-09-13 | 2007-09-13 | 已知格式字库的对比系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100580673C (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685617B (zh) * | 2008-09-26 | 2014-05-07 | 辉达公司 | 选择像素输出格式的系统和方法 |
CN103902532A (zh) * | 2012-12-24 | 2014-07-02 | 北京大学 | 用于字库的查库方法和装置 |
-
2007
- 2007-09-13 CN CN200710018644A patent/CN100580673C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685617B (zh) * | 2008-09-26 | 2014-05-07 | 辉达公司 | 选择像素输出格式的系统和方法 |
CN103902532A (zh) * | 2012-12-24 | 2014-07-02 | 北京大学 | 用于字库的查库方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN100580673C (zh) | 2010-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100405370C (zh) | 本地与远程语音呈现之间的动态转换方法和装置 | |
CN1928865B (zh) | 用于同步合成,显示及处理文本和图象文件的方法和设备 | |
US5033106A (en) | Information registering and retrieval system | |
US20070061353A1 (en) | User interface options of a data lineage tool | |
US7149760B1 (en) | Method for handling of different versions of a document in a computer system | |
CN106095261B (zh) | 一种在电子设备上添加笔记的方法和装置 | |
KR100490240B1 (ko) | 데이타압축장치,데이타복원장치,데이타압축방법,데이타복원방법및프로그램기록매체 | |
CN109948518B (zh) | 一种基于神经网络的pdf文档内容文本段落聚合的方法 | |
US7120867B2 (en) | System and method for conversion of directly-assigned format attributes to styles in a document | |
US20080052619A1 (en) | Spell Checking Documents with Marked Data Blocks | |
US11803581B2 (en) | System for identifying and linking entity relationships in documents | |
CN100580673C (zh) | 已知格式字库的对比系统 | |
JP5709903B2 (ja) | データレコードを圧縮し圧縮されたデータレコードを処理するための方法、システム、コンピュータプログラム、その記録媒体、データコレクションを記憶したデータ記憶媒体、並びに通話データ記録システム | |
CN110377561A (zh) | 一种文件管理方法及装置 | |
CN100587663C (zh) | 数据提示装置以及数据提示方法 | |
CN102346771A (zh) | 信息展现方法及装置 | |
CN101533396A (zh) | 一种记录查询历程的查询系统及其方法 | |
KR100418349B1 (ko) | 데이터 압축 및 복원 방법 | |
CN114528944A (zh) | 一种医疗文本编码方法、装置、设备及可读存储介质 | |
US6262727B1 (en) | Method of compressing and expanding large lists of data | |
CN112925817A (zh) | 图书馆书籍检索方法及检索系统 | |
CN103238148A (zh) | 数据转换装置、数据转换方法及数据转换用的程序 | |
CN1169073C (zh) | 图文编辑方法以及系统 | |
CN117112616A (zh) | 标签查询方法、装置、设备及存储介质 | |
CN105045409A (zh) | 输入方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100113 Termination date: 20120913 |