CN1172981A - 可手写的数字图形编码及其识别方法 - Google Patents
可手写的数字图形编码及其识别方法 Download PDFInfo
- Publication number
- CN1172981A CN1172981A CN 97112586 CN97112586A CN1172981A CN 1172981 A CN1172981 A CN 1172981A CN 97112586 CN97112586 CN 97112586 CN 97112586 A CN97112586 A CN 97112586A CN 1172981 A CN1172981 A CN 1172981A
- Authority
- CN
- China
- Prior art keywords
- skeleton
- stroke
- numeral
- zone
- line segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明是一种数字图形编码,称为Guo-数字符号,及其自动识别方法。Guo-数字符号书写简便,每个数字符号只需在其骨架的特定位置上画一笔。它解决了条码不直观,可读性差,不能人工书写,必须印刷的问题,而是既直观,又可读性好,人人都可以书写。它解决了手写阿拉伯数字符号虽直观,但机器自动识别正确率低,可靠性差的问题,而是算法简单,识别时可以达到100%的正确率。这就为社会提供了一种人人都能使用,方法简便,成本低廉,可靠性高,适宜于自动输入的独特的数字符号及识别方法。它可以广泛地应用于票据处理、商业、物流、工业生产、办公自动化等领域。
Description
数字,是人类使用最多的一种信息。许多民族都创造了数字符号,如阿拉伯数字0、1、2、3、4、5、6、7、8、9,中文一、二、三、四、五、六、七、八、九,中文壹、贰、叁、肆、伍、陆、柒、捌、玖等。数字符号的出现,对人类社会进步起了极其重要的作用。
随着社会的高速发展,尤其是有了电子计算机以后,原有的数字符号不能满足人们的需要了。商业、物流、工业生产、办公自动化……大量的数据需要及时处理,这就必须对数据进行自动采集和识别。阿拉伯数字容易书写,可读性好,是世界上使用最广泛的数字符号,人们发明了多种光电字符阅读机(OCR)识别它。然而由于手写阿拉伯数字的不规范性及复杂性,加上干扰等影响,实施自动识别的成本高而识别率低,可靠性差,因而使得很多领域不能使用自动识别技术。条码是为自动识别而发明的一种图形码,这种已经公开的专利技术,由于方法简便,成本低,可靠性高,现在已被大量使用,获得了极大的经济效益。不过条码的应用也有其局限性。它只能使用在数字固定不变的场合,如商品的标签。它必须由激光或喷墨印字机印制,而不能由人即时书写。这使得它不能在大量随机产生数据的场合使用,如各种财务报表等。由于条码还有其不足之处,条码是由宽窄不一,黑白相间的线条组成,对印刷质量要求严格,污染和干扰容易影响其识别的正确率。加之它不直观,可读性差,这也进一步影响了它的使用范围。
为了实现机器自动读取数据的需要,能不能有一种数字符号,它即简单,人人都可以手写,而且又直观、规范、可读性好,并且抗干扰能力强,适宜于自动识别,有很高的可靠性呢?本发明正是为了满足这些要求,创造了Guo-数字图形编码及其识别方法。
Guo-数字图形编码,简称Guo-数字符号,由骨架和笔画二部分组成。骨架形如h,是Guo-数字符号的固定组成部分。它的左侧是一垂直线段,由该线段的中点向右是一水平线段,水平线段的右端点向下是一垂直线段,长度等于左侧垂直线段的一半。笔画是一垂直线段。它的长度等于左侧骨架垂直线段的一半,或者与左侧骨架垂直线段相等。h型骨架决定了字符的大小,其中水平线段将字符图形分为上区和下区两部分,若把两条垂线间的距离分为四等分,在水平线段上得到三个等分点,从垂直线段长的一边到垂直线段短的一边依次为D1、D2、D3点,以D1、D2、D3点为中,将两垂线间分为3个区域。点D1、D2、D3上面和下面的6个区域是笔画的特定区域。Guo-数字符号的骨架和3个区域如图1所示。
Guo-数字图形编码是按如下方法进行编码的。1-9的9个字符都由一个垂直笔画和骨架组成,其中D1、D2、D3的上面区域有笔画分别为数字1、2、3的图形编码,D1、D2、D3的下面区域有笔画分别为数字4、5、6的图形编码,D1、D2、D3区有贯穿上下区域的笔画分别为数字7、8、9的图形编码,只有骨架而无笔画是数字0的图形编码。0-9的数字图形编码如图2所示。
从图2可以看出,本发明Guo-数字图形编码的一个显著特点是直观、规范、可读性好,人人都可以书写。除0以外,每个数字都只有一个笔画,按照″先上后下,从左到右″的规则,依次为数字1、2、3、4、5、6、7、8、9,即使一个不会写甚至不认识阿拉伯数字的人,也很容易学会识别Guo-数字符号,并能书写它,因为它们简单到只需画一直笔。
本发明Guo-数字符号的另一个显著特点是容易自动识别,抗干扰能力强,有很高的可靠性,机器自动识别可以达到100%的正确率。一般供机器自动读取的Guo-数字符号的骨架由印字机印出。为了进一步增加可靠性,可以采取把书写笔画的地方用光电阅读机不能感知的其它颜色印刷,或者在应该书写笔画的外端加印标志点,这样书写时会更加规范。图3是印有笔画标志点及手写的0-9Guo-数字符号。对书写的要求不高,笔画粗细不限,允许用斜笔,只要不出其所在的区域即可。Guo-数字符号只所以抗干扰能力强,是因为它与笔画的粗细无关,在它的上下半区都最多只能有一笔。如果有干扰点,只要干扰点的面积大小不超过笔画的面积,识别就不会发生错误。Guo-数字符号的识别很简单,识别时首先根据h型骨架计算各区域,然后逐个区域判定有无笔画存在,只要确定了笔画的位置,数字即可得到确认。Guo-数字符号的识别框图如图4所示。
Guo-数字符号的另一个显著特点是它不仅有上面所说的抗干扰能力,而且即使将符号旋转一个任意角度,甚至以镜象出现,也能获得正确的识别。这是因为h型骨架具有定向作用,识别时可以先找到骨架,旋转使它成为垂直,然后从骨架垂线长的一侧向短的一侧分D1、D2、D3区,上下区的确定是根据两侧的垂线,上区只有一侧有垂线,而下区的两侧都有垂线,显然,识别可以绝对正确。
上面介绍的Guo-数字符号笔画是垂直的,我们把它称为垂直型Guo-数字符号。由于各民族书写习惯的不同,或应用环境的不同,Guo-数字符号也可以使用水平笔画,为此设计了水平型Guo-数字符号。水平型0-9的数字图形编码如图5所示。实际上,它是由垂直型Guo-数字符号的镜象再旋转一个角度后得到的。
有些时候,并不需要用到0-9的全部数字符号。这时可以使用以下简易的Guo-数字符号,使得编码图形更简单,自动识别更快速。将h型骨架两垂线间作为一个区域或分为二个区域,按照上面所述相同的编码方法,可以组成0-3共4个数字,或0-6共7个数字的图形编码。分别称为简易4数字Guo-数字符号和简易7数字Guo-数字符号。这些简易Guo-数字图形编码如图6所示。某些从几种事件中选择其一的统计报表常会用到这种简易的Guo-数字符号,如考卷中的单选题等。
附图说明如下:
图1是本发明Guo-数字图形编码的骨架和3个笔画区域。
图2是本发明0-9数字的图形编码。
图3是本发明印有笔画标志点及手写的0-9Guo-数字符号。
图4是本发明Guo-数字符号的识别框图。
图5是本发明水平型0-9数字的图形编码。
图6是本发明简易4数字和7数字Guo-数字图形编码。
下面是本发明的一个实施例。这是一个财务自动核查系统。财务表中有用Guo-数字符号逐项填写的单项金额,同时在表格的最下一栏有用Guo-数字符号填写的总金额。自动核查系统通过扫描获取图象,图象经过处理、切分后得到每个数据的一组Guo-数字符号图象,然后利用上述的识别方法识别每一个Guo-数字符号,得到一个个单项数据。系统累加单项金额数据,并与表中的总金额数据进行对比,如果相同则通过,如果发现不相同,则说明该报表有问题。所有这一切都是自动进行的。该系统速度快,可靠性高,可排除人工输入时精神不集中造成的差错,大大降低脑力劳动强度。
Claims (8)
1.一种数字图形编码及其自动识别方法,其特征在于数字图形编码是由骨架和在骨架特定位置上的一个笔画组成,自动识别时只要判别出笔画及其位置,即可得到其数字。
2.根据权利要求1所述的骨架,其特征在于该数字图形编码有一个形如h的固定组成部分,其左侧是一垂直线段,由该线段的中点向右是一水平线段,水平线段的右端点向下是一垂直线段,长度等于左侧垂直线段的一半。
3.根据权利要求1所述的骨架的特定位置,其特征是指h型骨架的水平线段将编码图形分为上区和下区两部分,若把两条垂线间的距离分为四等分,在水平线段上得到三个等分点,从垂直线段长的一边到垂直线段短的一边依次为D1、D2、D3点,以D1、D2、D3点为中,将两垂线间分为3个区域,点D1、D2、D3上面和下面的6个区域便是骨架的特定位置。
4.根据权利要求1所述的笔画,其特征是指权利要求3中D1、D2、D3区域中的线段,它的长度等于左侧骨架垂直线段的一半,或者与左侧骨架垂直线段相等,笔画的宽度只要不超过各自区域的边界,不加其他限制。
5.根据权利要求1所述的数字图形编码是由骨架和在骨架特定位置上的一个笔画组成,其特征在于是按照″先上后下,从左到右″的规则,由骨架和D1上面区域中的笔画组成数字1的图形编码,依次,骨架和D2、D3上面区域中的笔画分别组成数字2和3的图形编码,骨架和D1、D2、D3下面区域中的笔画分别组成数字4、5和6的图形编码,骨架和贯穿D1、D2、D3上下区域中的笔画分别组成数字7、8和9的图形编码,这时,其它的区域无笔画,1-9每个数字的图形编码只有一个笔画,只有骨架而无笔画是数字0的图形编码。
6.根据权利要求1所述的判别出笔画及其位置,即可得到其数字,其特征在于自动识别时,先按权利要求3中所述的方法确定h型骨架的6个区域,然后逐个区域判定有无笔画,笔画的位置确定后,即可判别出数字。
7.根据权利要求1所述的数字图形编码是由骨架和在骨架特定位置上的一个笔画组成,其特征在于将权利要求2、3、4、5所述方法得到的数字图形编码旋转任意一个角度,或者是其镜象,它仍然属于本发明的数字图形编码。
8.根据权利要求1所述的数字图形编码是由骨架和在骨架特定位置上的一个笔画组成,其特征在于将h型骨架两垂线间作为一个区域或分为二个区域,按照权利要求5所述规则,分别组成0-3共4个数字或0-6共7个数字的简易图形编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN97112586A CN1065972C (zh) | 1997-06-27 | 1997-06-27 | 可手写的数字图形编码及其识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN97112586A CN1065972C (zh) | 1997-06-27 | 1997-06-27 | 可手写的数字图形编码及其识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1172981A true CN1172981A (zh) | 1998-02-11 |
CN1065972C CN1065972C (zh) | 2001-05-16 |
Family
ID=5172374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97112586A Expired - Fee Related CN1065972C (zh) | 1997-06-27 | 1997-06-27 | 可手写的数字图形编码及其识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1065972C (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1332348C (zh) * | 2005-09-23 | 2007-08-15 | 清华大学 | 印刷体阿拉伯字符集文本切分方法 |
CN106529620A (zh) * | 2016-11-02 | 2017-03-22 | 努比亚技术有限公司 | 一种样机及其安全管控方法和安全管控系统 |
CN111144532A (zh) * | 2020-01-16 | 2020-05-12 | 中国美术学院 | 一种资产码元素、资产码以及资产码的构建方法 |
CN111275049A (zh) * | 2020-01-19 | 2020-06-12 | 佛山市国方识别科技有限公司 | 一种文字图像骨架特征描述符获取的方法及装置 |
-
1997
- 1997-06-27 CN CN97112586A patent/CN1065972C/zh not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1332348C (zh) * | 2005-09-23 | 2007-08-15 | 清华大学 | 印刷体阿拉伯字符集文本切分方法 |
CN106529620A (zh) * | 2016-11-02 | 2017-03-22 | 努比亚技术有限公司 | 一种样机及其安全管控方法和安全管控系统 |
CN111144532A (zh) * | 2020-01-16 | 2020-05-12 | 中国美术学院 | 一种资产码元素、资产码以及资产码的构建方法 |
CN111144532B (zh) * | 2020-01-16 | 2023-08-22 | 中国美术学院 | 一种资产码元素、资产码以及资产码的构建方法 |
CN111275049A (zh) * | 2020-01-19 | 2020-06-12 | 佛山市国方识别科技有限公司 | 一种文字图像骨架特征描述符获取的方法及装置 |
CN111275049B (zh) * | 2020-01-19 | 2023-07-21 | 佛山市国方识别科技有限公司 | 一种文字图像骨架特征描述符获取的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN1065972C (zh) | 2001-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4975109B2 (ja) | 2次元コード及びそのデコード方法、その2次元コードを適用する印刷出版物 | |
US8162220B2 (en) | Product provided with a coding pattern and apparatus and method for reading the pattern | |
US5298731A (en) | Method for printing and reading for orthogonal bar code patterns | |
US5814801A (en) | Maxicode data extraction using spatial domain features exclusive of fourier type domain transfer processing | |
CN103946869B (zh) | 用于在表面上编码数字信息的图案、以及标记和读取方法 | |
US5392130A (en) | Analyzing an image showing a row/column representation | |
US7864986B2 (en) | Optical mark reading that uses a disregard state as part of an unambiguous symbology of marks to fill into response bubbles | |
CN107031033B (zh) | 一种可3d打印的镂空二维码模型生成方法及系统 | |
DE19736202A1 (de) | Strichcode-Symbolisierung mit der Fähigkeit, 16-Bit-Zeichen zu codieren, und Verfahren und Apparat zum Drucken und zum Lesen derselben | |
US20080175483A1 (en) | Pattern separating extraction program, pattern separating extraction device, and pattern separating extraction method | |
CN114897120B (zh) | 一种点阵码、点码解码方法、系统及电子设备 | |
CN104268615A (zh) | 一种彩色二维码的编码与解码方法 | |
US7878414B2 (en) | Code and a method for coding and encoding information | |
CN1065972C (zh) | 可手写的数字图形编码及其识别方法 | |
CN106626845B (zh) | 灰度二维码的印制方法 | |
CN115841671B (zh) | 一种书法字骨架矫正方法、系统及存储介质 | |
DE69425009T2 (de) | Zeichenerkennung | |
Dongre et al. | Segmentation of printed Devnagari documents | |
CN118429353A (zh) | 一种印刷标签缺陷检测方法及系统 | |
CN1073026A (zh) | 复杂表格智能处理方法 | |
JPS63292283A (ja) | 手書きバ−コ−ド読取方法及び装置 | |
CN114169483A (zh) | 一种Dot点集码的设计与识别系统 | |
DE19607106A1 (de) | Verfahren zur Verbesserung der Maschinenlesbarkeit von Schriftträgern, Schriftträger und Schablone | |
CN1122470A (zh) | 印制手写标准数码输入计算机的日字图形 | |
JPH06150042A (ja) | 枡目コードの読み取り方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20010516 |