CN103902532A - 用于字库的查库方法和装置 - Google Patents

用于字库的查库方法和装置 Download PDF

Info

Publication number
CN103902532A
CN103902532A CN201210567463.7A CN201210567463A CN103902532A CN 103902532 A CN103902532 A CN 103902532A CN 201210567463 A CN201210567463 A CN 201210567463A CN 103902532 A CN103902532 A CN 103902532A
Authority
CN
China
Prior art keywords
character
library
character library
font
compared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210567463.7A
Other languages
English (en)
Inventor
唐英敏
王玉欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University
Priority to CN201210567463.7A priority Critical patent/CN103902532A/zh
Publication of CN103902532A publication Critical patent/CN103902532A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明提供了一种用于字库的查库方法,包括:将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;采用图像分析技术,对从基准字库中输出的字符与从待比较字库中输出的字符进行字形比较;将字形不一致的字符予以提示。本发明还提供了一种用于字库的查库装置,包括:输出模块,用于将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;字形比较模块,用于采用图像分析技术,对从基准字库中输出的字符与从待比较字库中输出的字符进行字形比较;字形提示模块,用于将字形不一致的字符予以提示。本发明提高了字库查库的准确率。

Description

用于字库的查库方法和装置
技术领域
本发明涉及字库技术领域,具体而言,涉及用于字库的查库方法和装置。
背景技术
大家都将字库中的字符字形作为标准,因此字库字形的正确性很重要。每一个字库产品都要经过测试部门的严格检测,查库是检测的一个重要环节,用来检查字库中字形是否正确,是否缺字等等。目前多数字库厂商处理的方式,打印测试样张,里面有编码,正确字形,当前字库字形的一个对照关系,需要人工核对字形是否正确,是否缺失字等等。
由于查库的单调性容易使人疲劳,不仅耗时,耗力,在字符字形的正确性上,也不能保证,通常由不同的人查好几遍,即便这样,字库厂商也不能保证字库没有错字,只能保证常见字符没有错字,不常用字符某个水平错误率之内。
例如,当某款字库进行升级(更新、添加或者删除某些字符字形等因素字库发生变化)后,升级字库的查库,不仅需要检查修改过的字库,还需要人工核查一下未修改的字符,因为可能存在某个环节引起未修改的字符字形与原来字库字符字形不一致。传统的检查方法是将升级后的字库字符以及升级前的字库字符,同时打印在样张上,人工进行对比;当某款字体字库例如从GB2312扩充到GBK或者GBl8030,如果前面GB2312已经检查通过,如何测试保证相同字符的字形没有变化;同一厂商,相同字体不同存储格式的曲线字库(TrueType字库,OpenType字库,CID字库),字符字形是否有差异。
发明内容
本发明旨在提供用于字库的查库方法和装置,以解决上述的问题。
在本发明的实施例中,提供了一种用于字库的查库方法,包括:将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;采用图像分析技术,对从基准字库中输出的字符与从待比较字库中输出的字符进行字形比较;将字形不一致的字符予以提示。
在本发明的实施例中,提供了一种用于字库的查库装置,包括:输出模块,用于将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;字形比较模块,用于采用图像分析技术,对从基准字库中输出的字符与从待比较字库中输出的字符进行字形比较;字形提示模块,用于将字形不一致的字符予以提示。
本发明上述实施例的用于字库的查库方法和装置因为采用图像分析技术来比较字形,所以克服了人工查库容易出错的问题,提高了字库查库的准确率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例的用于字库的查库方法的流程图;
图2示出了根据本发明优选实施例的用于字库的查库方法的流程图;
图3示出了根据本发明实施例的用于字库的查库装置的示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了根据本发明实施例的用于字库的查库方法的流程图,包括:
步骤S10,将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;
步骤S20,采用图像分析技术,对从基准字库中输出的字符与从待比较字库中输出的字符进行字形比较;
步骤S30,将字形不一致的字符予以提示。
现有技术中,采用人工肉眼观察的方式来逐一地检查字库中的每个字形。而本方法采用了图像分析技术,这可以通过计算机编程来实现自动化地查库,排除了因人为因素漏掉的字形错误,提高了查库精准度。
另外,计算机自动查库显然效率更高,缩短了字库产品制作发布周期,省事省力,同时节约成本。
本方法从图像角度比对字形差异性,要求将字形输出为单色位图格式再进行图像匹配,这样做的好处如下:
一、获取字符位图和在计算机中同字号下的最终显示效果是一致的,排除了字库中由于添加了指令引起的字符字形显示效果差异,以及由于字库基线不同引起的差异;二、扩大了字库可比较的范围,由于比较的是图像,因此既可以比较相同格式的字库,也可以比较不同存储格式的字库。比如比较两个.ttf字库,两个.otf,或者一个是.ttf,另一个是.otf,甚至是.otf与CID字库的比较。三、可以采用的匹配度算法比较多,而且比较成熟,这个可以依据实际需要选择。
优选地,预先设定匹配度,将字形比较的图像相似度小于匹配度的字符确定为字形不一致。通过设定匹配度,可以根据用户的需求控制图像匹配的精确度。
优选地,本方法还包括:预先将基准字库和待比较字库设置为以相同的字号进行输出。两款字库生成的位图是在相同字号下生成,这样生成的字符位图的尺寸一样,从而避免了归一化处理,提高自动比对的精准度。
优选地,字号设置为48磅。由于是从位图角度出发,位图的大小影响匹配效果,位图尺寸越大匹配的精度越高,准确率也越高,但是会导致字形比对效率下降,因此设置的字号也不是越大越好,发明人经过大量的测试发现,字号选用48磅时比较通用,转化为位图尺寸64*64,匹配效果较好。
优选地,本方法还包括:预先将基准字库的所有字符编码和待比较字库的所有字符编码进行比较,判断是否一致;将字符编码不一致的字符予以提示。
有一款基准字库,另外一款与其比较的字库为待比较字库。如果是升级字库查库,使用本方法,原字库便是基准字库,升级后的字库便是待比较字库,如果是同字体,不同格式的曲线字库字形比较,选其他任一个为基准字库,另一个为待比较字库即可。
图2示出了根据本发明优选实施例的用于字库的查库方法的流程图,其步骤如下:
步骤S15:对基准字库和待比较字库设置字号。由于是从位图角度出发,位图的大小影响匹配效果,位图尺寸越大匹配的精度越高,准确率也越高,但是会导致字形比对效率下降,因此设置的字号也不是越大越好,测试发现选用48磅时比较通用,转化为位图尺寸64*64。
步骤S25:基准字库字符生成相应的单色位图图像格式,获取该字库中所有字符编码信息。这里获取的字符显示图像,是字库在这个字号下的在屏幕显示或打印纸上实际显示效果图。
步骤S35:待比较字库字符生成相应的单色位图图像格式,获取该字库中所有字符编码信息。两款字库生成位图时设置相同字号;这样生成的字符位图的尺寸一样,从而避免了归一化处理,提高自动比对的精准度。
步骤S45:比较两款字库包含的字符编码是否一致。如果待比较字库与基准字库相比,缺失某些字符或者包含更多字符,则直接进行提示,该部分字符需要人工核查。
步骤S55:设定两个字符位图匹配度。如果满足设定的匹配度,则可认定两个字符字形一致,反之两个字符字形不一致。设定字符位图的匹配度算法比较多,而且比较成熟,这个可以依据实际需要选择。
步骤S65:比较相同编码字符对应的位图,将不能匹配的字符结果输出,同时保留相应的位图,便于查看问题。
如果待测试字库是升级字库,或者是从某个字库扩充后的新字库,那么该测试字库便存在基准字库,此时可以使用本方法自动检测出待测试字库与原字库不一致的字形,编码不一致的也将输出,只需人工核对有差异的那部分字形。
特别的,本方法可用于同一字体不同曲线字库格式间的字形比较,查看相同字符字形是否一致。
图3示出了根据本发明实施例的用于字库的查库装置的示意图,包括:
输出模块10,用于将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;
字形比较模块20,用于采用图像分析技术,对从基准字库中输出的字符与从待比较字库中输出的字符进行字形比较;
字形提示模块30,用于将字形不一致的字符予以提示。
优选地,预先设定匹配度,将字形比较的图像相似度小于匹配度的字符确定为字形不一致。
优选地,还包括:预先将基准字库和待比较字库设置为以相同的字号进行输出。
优选地,字号设置为48磅。
优选地,本装置还包括:编码比较模块,用于预先将基准字库的所有字符编码和待比较字库的所有字符编码进行比较,判断是否一致;编码提示模块,用于将字符编码不一致的字符予以提示。
本装置排除了因人为因素漏掉的字形错误,提高了查库精准度。
从以上的描述可以看出,本发明消除了因为字库添加指令引起最终字形显示的差异,可以比较相同字体不同格式曲线字库间的字形差异,提高了查库精准度,省事省力,同时节约成本。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于字库的查库方法,其特征在于,包括:
将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;
采用图像分析技术,对从所述基准字库中输出的字符与从所述待比较字库中输出的字符进行字形比较;
将字形不一致的字符予以提示。
2.根据权利要求1所述的方法,其特征在于,预先设定匹配度,将字形比较的图像相似度小于所述匹配度的字符确定为字形不一致。
3.根据权利要求1所述的方法,其特征在于,还包括:
预先将所述基准字库和所述待比较字库设置为以相同的字号进行输出。
4.根据权利要求3所述的方法,其特征在于,所述字号设置为48磅。
5.根据权利要求1所述的方法,其特征在于,还包括:
预先将所述基准字库的所有字符编码和所述待比较字库的所有字符编码进行比较,判断是否一致;
将字符编码不一致的字符予以提示。
6.一种用于字库的查库装置,其特征在于,包括:
输出模块,用于将基准字库中以及待比较字库中的字符编码一致的字符,分别均以单色位图格式输出;
字形比较模块,用于采用图像分析技术,对从所述基准字库中输出的字符与从所述待比较字库中输出的字符进行字形比较;
字形提示模块,用于将字形不一致的字符予以提示。
7.根据权利要求6所述的装置,其特征在于,预先设定匹配度,将字形比较的图像相似度小于所述匹配度的字符确定为字形不一致。
8.根据权利要求6所述的装置,其特征在于,还包括:
预先将所述基准字库和所述待比较字库设置为以相同的字号进行输出。
9.根据权利要求8所述的装置,其特征在于,所述字号设置为48磅。
10.根据权利要求6所述的装置,其特征在于,还包括:
编码比较模块,用于预先将所述基准字库的所有字符编码和所述待比较字库的所有字符编码进行比较,判断是否一致;
编码提示模块,用于将字符编码不一致的字符予以提示。
CN201210567463.7A 2012-12-24 2012-12-24 用于字库的查库方法和装置 Pending CN103902532A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210567463.7A CN103902532A (zh) 2012-12-24 2012-12-24 用于字库的查库方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210567463.7A CN103902532A (zh) 2012-12-24 2012-12-24 用于字库的查库方法和装置

Publications (1)

Publication Number Publication Date
CN103902532A true CN103902532A (zh) 2014-07-02

Family

ID=50993862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210567463.7A Pending CN103902532A (zh) 2012-12-24 2012-12-24 用于字库的查库方法和装置

Country Status (1)

Country Link
CN (1) CN103902532A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1383516A (zh) * 2000-07-05 2002-12-04 八万系统有限公司 采用一对一比较的汉字校对系统
CN101122911A (zh) * 2007-09-13 2008-02-13 无敌科技(西安)有限公司 已知格式字库的对比系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1383516A (zh) * 2000-07-05 2002-12-04 八万系统有限公司 采用一对一比较的汉字校对系统
CN101122911A (zh) * 2007-09-13 2008-02-13 无敌科技(西安)有限公司 已知格式字库的对比系统及方法

Similar Documents

Publication Publication Date Title
US6490696B1 (en) System and method for printer output regression testing using display lists
US9164874B1 (en) Testing conversion and rendering of digital content
US8379027B2 (en) Rendering engine test system
US20090300588A1 (en) Method and apparatus for acquiring definitions of debug code of basic input/output system
US8387024B2 (en) Multilingual software testing tool
US20150347270A1 (en) Automatic test system and test method for computer, record medium, and program product
US7293204B2 (en) Computer peripheral connecting interface system configuration debugging method and system
CN110287098A (zh) 自动创建测试脚本方法、服务器及计算机可读存储介质
US10698803B1 (en) Computer code test script generating tool using visual inputs
CN110990053A (zh) 机器学习方案模板的创建方法、使用方法及装置
US11288169B2 (en) Method of, and apparatus for, handling reference images for an automated test of software with a graphical user interface
CN105320553A (zh) 一种基于国产处理器平台更新网卡固件的方法及系统
US20230297774A1 (en) Demand conformity analysis method and system, and electronic device and storage medium
CN104346035A (zh) 对自动地更正的单词的指示
CN106855835B (zh) 一种基于xml技术的飞控系统上电启动自检测方法
CN112463633B (zh) 一种片上存储器的地址译码校验方法、装置、设备及介质
CN104809053A (zh) 一种针对控件样式的测试方法和装置
CN109343844B (zh) 一种基于Flex票据数据对比纠正的方法
CN111078529A (zh) 客户端写入模块测试方法、装置、电子设备
CN112446189A (zh) 一种数据处理方法
CN112446199A (zh) 一种基于可视化模板的报表生成方法
CN103902532A (zh) 用于字库的查库方法和装置
CN105306928A (zh) 一种测试机顶盒浏览器的方法及装置
CN115687146A (zh) Bios测试方法、装置、计算机设备和存储介质
CN110415756B (zh) 一种测试ssd标签信息的方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140702

RJ01 Rejection of invention patent application after publication