JPS6279582A - 文字認識用辞書作成方式 - Google Patents

文字認識用辞書作成方式

Info

Publication number
JPS6279582A
JPS6279582A JP60220973A JP22097385A JPS6279582A JP S6279582 A JPS6279582 A JP S6279582A JP 60220973 A JP60220973 A JP 60220973A JP 22097385 A JP22097385 A JP 22097385A JP S6279582 A JPS6279582 A JP S6279582A
Authority
JP
Japan
Prior art keywords
character
characters
dictionary
inclination
ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60220973A
Other languages
English (en)
Inventor
Kiyohiko Kobayashi
清彦 小林
Akira Sakurai
彰 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60220973A priority Critical patent/JPS6279582A/ja
Priority to US06/915,285 priority patent/US4757551A/en
Priority to DE19863633743 priority patent/DE3633743A1/de
Publication of JPS6279582A publication Critical patent/JPS6279582A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [技術分野〕 本発明は、手書き文字認識のための辞書の作成方式に関
する。
〔従来技術〕
手書き文字の認識装置では、文字の変形に対応できなけ
ればならない。文字変形のうちで、文字の傾きは特に個
人差が激しいものであるから、文字の傾きについて充分
な留意が必要とされる。
このような文字の傾きに対応する方法として、入力文字
の傾きを補正し、字形をII:、期化する方法がある。
このような正規化の方法としては、株式会社オーム社刊
r文字認識概論」 (橋本他)の117頁に記述されて
いるように、文字パターンの2次モーメントによる正規
化方法などが知られている。しかし、このような正規化
は、処理が複雑であるなどの問題がある。
文字の傾きに対応する他の方法として、傾いた文字の辞
書を予め含めた文字認識用辞書を用意しておく方法があ
る。しかし、そのような従来の辞書は、傾きのある文字
の辞書と傾きのない文字の辞書とが文字ごとにまとめら
れて一体化された構成となっており、文字を認識する際
に辞書全体を検索する必要があって、認識時間の増大を
招いていた。
〔目 的〕 −1−述のような辞書編成の問題点を解決するために、
本出願人は、文字の傾きの有無に応じて2グループに分
割編成された辞書を備え、両方のグループの辞書を用い
てt字認識を行った結果から一方のグループの辞Jトを
選択し、その後はその選択したグループの辞書を用いて
文字認識を行う方式を既に提案している。
本発明の目的は、そのような文字の傾きの有無に応じて
2つのグループに分割編成した構成の文字認識用辞書を
効率的に作成するための方式を提供することにある。
〔構 成〕
本発明の文字認識用辞書作成方式は、既知の入力文字の
輪郭に付られた全方向コードの総数および特定の斜め方
向コートの個数をそれぞれMl数する第1の手段と、こ
の第1の手段により計数された者数の比を求める第2の
手段と、この第2の手段により求められた比に基づき前
記文字の傾きの有無を判定する第3の手段と、この第3
の手段により傾きありと判定された場合に前記入力文字
の辞書を傾きのある文字のグループに登録し、傾きなし
と判定された場合に前記入力を字の辞書も・傾きなしの
文字のグループに登録する第4の手段とを備え、文字認
識用辞書を傾きのある文字のグループと傾きのない文字
のグループとに分けて編成することを特徴とするもので
ある。
〔実施例〕
以下、図面を参照して本発明を一実施例に基づき詳細に
説明する。
第1図は本発明の一実施例を示す概略ブロック図である
。この実施例は、入力文字の輪郭画素に方向コードを付
与し、文字枠の分割領域毎に方向コードのヒストグラム
を求め、そのヒストグラムを特徴パラメータとして利用
して文字を認識する形式の文字認識装置などに適用し得
るものである。
か\る文字認識装置に適用された場合を想定し、以下説
明するが、独立した辞書作成処理装置にも適用できるこ
とは当然である。
第1図において、10は1文字分のフレームメモリであ
る。文字認識装置の特徴抽出部12において、入力文字
の輪郭画素、例えば輪郭白画素に第2図に示す方向コー
ド1〜8が付与される。この図に示す各パターンの中央
の格子が注目する輪郭白画素であり、その輪郭白画素の
1;下左右の画素のパターンに応じて方向コードが決定
される。
方向コード6.8は右上がりの斜線部に付与される斜め
方向コードであり、後述のように、本実施例において文
字の傾きの判定に利用される。
このような方向コード付けパターンデータの例を第3図
と第4図に示す。第3図のものは、傾きのない文字「7
」の方向コード付けパターンデータの例であり、第4図
のものは、傾きのある文字「7」の方向コード付けパタ
ーンデータの例である。
このような文字の方向コード付けパターンデータが、制
御部14の制御によりフレームメモリ10に書き込まれ
る。
前記特徴抽出部12において、文字枠の分割領域毎の方
向コードのヒストグラムからなる入力文字の辞書が作成
され、制御部14に入力される。
このような領域分割毎の方向コードヒストグラムの作成
は、特願昭59−21.7760号「文字認織方式」の
明細書に詳述されているような方式により行うことがで
きる。
人力文字の方向コード付けパターンデータがフレームメ
モリ10に書き込まれると、制御部14の制御によりフ
レームメモリ10の記憶データが順次読み出され、デコ
ーダ16に入力される。このデコーダ16は、方向コー
ド1〜8のいずれかが入力された時に、カウンタ18に
対するインクリメント信号を出力し、また、斜め方向コ
ード6または8が入力された時には、別のカウンタ20
に対するインクリメント信号も出力する。なお、フレー
ムメモリ10の読み出し開始に先立ち、カウンタ1.8
.20は制御部14によってクリアされる。
このようにして、フレームメモリ10の読み出しを完了
すると、入力文字に付与された全方向コードの総数がカ
ウンタ18に求められ、斜め方向コード6.8の個数が
カウンタ20に求められる。
22は比率演算器であり、カウンタ20の値のカウンタ
18の値に対する比を計算する。この比は、入力文字の
傾きの程度を示すパラメータとして利用できる。
例えば第3図に示した傾きのない[7]の場合、方向コ
ードの総数は135で、傾き方向コート6および8の個
数はI9であるから、その比は0.14となるが、第4
図に示した傾きのある「7」の場合、方向コー1〜の総
数は121で傾き方向コード6および8の個数は48で
あるから、その比は0.40となる。
このような比の大小から文字の傾きの有無を判定するた
めの判定閾値が、文字毎にテーブル24に格納されてい
る。制御部14は、入力文字に対応した判定閾値をテー
ブル24から読み込み、比率演算器22から出力されろ
入力文字の比の値と比較し、比が判定閾値より小さけれ
ば、傾きなしと判定し、判定閾値以−1;ならば傾きあ
りと判定する。
そして、傾きなしと判定した場合、制御部14は入力文
字の辞書(特徴抽出部12より入力されている)を辞書
メモリ26の傾きなし文字グループのエリア26Aに登
録する。傾きありと判定した場合、制御部14は辞書メ
モリ26の傾きあり文字グループのエリア26Bに、入
力文字の辞書を登録する。
以上のような動作によって、入力文字の辞書が、その傾
きの有無に応じてグループ分けされて辞書メモリ26に
順次登録され、文字の有無により2グループに分割編成
された文字認識用辞書が辞書メモリ26に作成される。
本実施例に係る文字認識装置にあっては、例えば以下に
述べるような効率的な文字認識装置が可能となる。
初めに、辞書全体を用いた文字認識が行われ、入力文字
に対する候補文字が傾きなしグループの辞書から選ばれ
た回数と傾きありグループの辞書から選ばられた回数と
が計数される。両方の回数の差が所定値を越えるまで、
この動作モードにて文字認識が続けられる。
回数の差が所定値を越えると、動作モードが切り替わり
、回数の多い方のグループの辞書だけが選択され、以後
、その一方のグループの辞書だけを用いて文字認識が行
オ〕れる。このように、2グループに分割編成された一
方のグループの辞書だけを用いるから、候補文字の検索
時間が短縮して認識時間が短かくなるとへもに、類似文
字の減少により誤認識の確率も減少する。
なお、前記実施例において、傾きの影響の少ない文字(
縦線のない文字など)については、傾き判定処理をスキ
ップするよもにしてもよい。
また、傾き判定の閾値については、例えば、各文字ごと
に、傾きに関連した前記比を横軸としたヒストグラムを
とり、そのヒストグラムから傾き判定閾値を決定するこ
とができる。
〔効 果〕
以上の説明から明らかなように、本発明によれば、文字
の傾きに応じて2グループに分割構成された文字認識用
辞書を簡!トな回路構成により効率的に作成することが
できるため、手書き文字を高速に認識可能な文字認識装
置殻実現する上で大きな効果を奏することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す概略ブロック図、第2
図は方向コードの説明図、第3図は傾きのない文字「7
」の方向コード付けパターンデータの一例を示す図、第
4図は傾いた文字「7」の方向コード付けパターンデー
タの一例を示す図である。 10・・・フレームメモリ、  12・・・特徴抽出部
、14・・・制御部、  16・・・デコーダ、18.
20・・・カウンタ、 22・・・比率演算器、24・
・・テーブル、 26・・・辞書メモリ、26 A・・
・傾きなし文字グループエリア、2613・・・傾き文
字グループエリア。 第  1  図 コード1   、−ト2 コーL″5    コード′6 コード3     コーF゛4 コーH゛7     コー)”8 ・  e O)α”’l  l’n rつ α)  −
・  ・  ・  ・  ・ψ Φ σ)II#  Φ
  ・  ・ Uつ  ・  ・  O・・  ・ −
−−α〕 ・ ・  −・04 Φ  O・・  −―
  ―  ・  IOD ・  ・  @m+++Ia
・  ・  ・  ―  ・  ・  ・  争 −−
一−−醗  ・−豐・・φ―#ψ・伊・・−・−−m−
−・  ・ 0)0)  ・  ・  ・  ・  ・
  ・  嗜  ・  ・・ σつ  ・  ・  ・
  ・  ・  ・  ・ ・  ・  ・  Q・\
1・・・・噂−・・嗜・・ ―ゞく1争寺・・(【〕〔メ〕・・−e−・ e  +
+J  11  @  ・ −・ ・ ・ ・ e −
・・  0  ・ −−−−−−CC)  ・  ・ 
 ・  ・・  ・  e  ・  ・  ・  ・ 
 @  嗜  ・−−一一一−@嗜、・Φ拳・・・・・
争・・−龜・・−曝・嗜−・、−・―・拳・・拳・・C
\J−−OO・  ・  −・  ・  ・  ・  
も  ψ  @@@all  い−・・・−−−00I
−・・・・@−・・C\4・e・・・*−j@11@l
l’11m1lllaC\−1・ ・ Φ ・ @  
@    −−−−(ト) ・ ・ ・ 囚η  争 
 ・  11@   ・  ・  ・  −・  ・ 
 1 −  ・  ・  ・  ・  ・・(f)・・
・・・ee・−・争・Φ・・Φ・ ・ω  e ・  
・  ・ ・ ・ ・  @ e @ ・ −・ e 
・・1・へ@@@@・・・−・―・・・−・  ・  
・ C1・  e  @  Φ  ・  ・  ・  
・  拳  −・  −−−−−−−*   e   
*   嗜  ・  −・  ・  11@  ・  
−・  骨  ・手続t10i’lミ甲)(一方式) 昭和61年2J42711 1、事件の表示 昭和60年特許願第220973号 2、発明の名称 文字認識用辞書作成方式 3、補正をする者 事件との関係  出願人 住所  東京都人111区中馬込1丁1173番6号名
称  (674)  株式会社 リ コ −代表者  
    浜 )fl    広4、代理人 5、補正命令の日付 昭和61年1月8日(発送日昭和61年I Jl 29
 I+)−1= 8、補正の内容 第73図及び第4図を別紙の通り、図面中の文字を拡大
したものに補正する。 9、添付書類の11録

Claims (3)

    【特許請求の範囲】
  1. (1)既知の入力文字の輪郭に付られた全方向コードの
    総数および特定の斜め方向コードの個数をそれぞれ計数
    する第1の手段と、この第1の手段により計数された各
    数の比を求める第2の手段と、この第2の手段により求
    められた比に基づき前記文字の傾きの有無を判定する第
    3の手段と、この第3の手段により傾きありと判定され
    た場合に前記入力文字の辞書を傾きのある文字のグルー
    プに登録し、傾きなしと判定された場合に前記入力文字
    の辞書を傾きなしの文字のグループに登録する第4の手
    段とを備え、文字認識用辞書を傾きのある文字のグルー
    プと傾きのない文字のグループとに分けて編成すること
    を特徴とする文字認識用辞書作成方式。
  2. (2)第1の手段は、入力文字の方向コード付けパター
    ンデータを記憶するメモリと、このメモリの記憶データ
    を順次読み出す手段と、この手段により方向コードが読
    み出される度に第1のカウンタをインクリメントし、そ
    の方向コードが特定の斜め方向コードの時に第2のカウ
    ンタをもインクリメントする回路とからなることを特徴
    とする特許請求の範囲第1項記載の文字認識用辞書作成
    方式。
  3. (3)第3の手段は、第2の手段により求められた比と
    、文字毎の判定閾値を記憶している第2のメモリに記憶
    されている入力文字に対応する判定閾値との比較により
    傾きの有無を判定するようにしてなることを特徴とする
    特許請求の範囲第1項記載の文字認識用辞書作成方式
JP60220973A 1985-10-03 1985-10-03 文字認識用辞書作成方式 Pending JPS6279582A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60220973A JPS6279582A (ja) 1985-10-03 1985-10-03 文字認識用辞書作成方式
US06/915,285 US4757551A (en) 1985-10-03 1986-10-03 Character recognition method and system capable of recognizing slant characters
DE19863633743 DE3633743A1 (de) 1985-10-03 1986-10-03 Zeichenerkennungssystem

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60220973A JPS6279582A (ja) 1985-10-03 1985-10-03 文字認識用辞書作成方式

Publications (1)

Publication Number Publication Date
JPS6279582A true JPS6279582A (ja) 1987-04-11

Family

ID=16759465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60220973A Pending JPS6279582A (ja) 1985-10-03 1985-10-03 文字認識用辞書作成方式

Country Status (3)

Country Link
US (1) US4757551A (ja)
JP (1) JPS6279582A (ja)
DE (1) DE3633743A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4903313A (en) * 1986-07-03 1990-02-20 Ricoh Company, Ltd. Character recognition method
US4905295A (en) * 1986-11-13 1990-02-27 Ricoh Company, Ltd. Code sequence matching method and apparatus
US4961231A (en) * 1987-01-20 1990-10-02 Ricoh Company, Ltd. Pattern recognition method
DE3815869A1 (de) * 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens
DE3720489A1 (de) * 1987-06-20 1988-12-29 Sood Ralf A Verfahren zum lesen von text- und druckvorlagen
JPH07120385B2 (ja) * 1987-07-24 1995-12-20 シャープ株式会社 光学的読取り方法
JPH0229886A (ja) * 1988-07-20 1990-01-31 Ricoh Co Ltd 特徴量抽出方法
US5625710A (en) * 1988-07-20 1997-04-29 Fujitsu Limited Character recognition apparatus using modification of a characteristic quantity
US5287275A (en) * 1988-08-20 1994-02-15 Fujitsu Limited Image recognition apparatus and method for recognizing a pattern within an image
US5228097A (en) * 1989-02-07 1993-07-13 Ezel, Inc. Method for registering image data
US5195147A (en) * 1989-05-02 1993-03-16 Ricoh Company, Ltd. Image forming apparatus
US5402504A (en) * 1989-12-08 1995-03-28 Xerox Corporation Segmentation of text styles
US5105470A (en) * 1990-03-12 1992-04-14 International Business Machines Corporation Method and system for recognizing characters
US5303311A (en) * 1990-03-12 1994-04-12 International Business Machines Corporation Method and apparatus for recognizing characters
JPH03288196A (ja) * 1990-04-04 1991-12-18 Canon Inc 文字処理装置
JP2774662B2 (ja) * 1990-04-04 1998-07-09 キヤノン株式会社 文字処理装置
US5267332A (en) * 1991-06-19 1993-11-30 Technibuild Inc. Image recognition system
KR930002973A (ko) * 1991-07-17 1993-02-23 다니이 아끼오 패턴인식장치
DE4135881C2 (de) * 1991-10-31 1998-04-02 Eldin Hassan Prof Nour Verfahren und Vorrichtung zur Extraktion der Konturen von Objekten
GB2273383A (en) * 1992-12-10 1994-06-15 Ibm Character recognition
JPH07129720A (ja) * 1993-11-04 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置
US5642288A (en) * 1994-11-10 1997-06-24 Documagix, Incorporated Intelligent document recognition and handling
KR100454541B1 (ko) * 1998-04-27 2004-11-03 산요덴키가부시키가이샤 수기 문자 인식 방법 및 시스템
US7010166B2 (en) * 2000-11-22 2006-03-07 Lockheed Martin Corporation Character recognition system and method using spatial and structural feature extraction
US8682077B1 (en) 2000-11-28 2014-03-25 Hand Held Products, Inc. Method for omnidirectional processing of 2D images including recognizable characters
US6824671B2 (en) * 2001-05-17 2004-11-30 Exxonmobil Chemical Patents Inc. Low noack volatility poly α-olefins
WO2003023696A1 (en) * 2001-09-12 2003-03-20 Auburn University System and method of handwritten character recognition
US6869917B2 (en) * 2002-08-16 2005-03-22 Exxonmobil Chemical Patents Inc. Functional fluid lubricant using low Noack volatility base stock fluids
US7095894B2 (en) * 2002-09-04 2006-08-22 Lockheed Martin Corporation Method and computer program product for recognizing italicized text
EP1667054A1 (en) * 2003-09-17 2006-06-07 Tsube Sangyou Kabushiki Kaisha Recognition code based on combination of element cells and recognition code sheet
US7620244B1 (en) 2004-01-06 2009-11-17 Motion Computing, Inc. Methods and systems for slant compensation in handwriting and signature recognition
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8620083B2 (en) * 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US20050276482A1 (en) * 2004-05-26 2005-12-15 Chengshing Lai [portable electric apparatus with character recognition function]
US7416125B2 (en) * 2005-03-24 2008-08-26 Hand Held Products, Inc. Synthesis decoding and methods of use thereof
US20060284851A1 (en) * 2005-06-15 2006-12-21 Pittman John S Programmable orientation handwriting recognition system and method
DE102006059659B4 (de) * 2006-12-18 2009-12-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild
US8121414B2 (en) 2007-06-13 2012-02-21 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, and image forming apparatus
US8175388B1 (en) 2009-01-30 2012-05-08 Adobe Systems Incorporated Recognizing text at multiple orientations

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1171627A (en) * 1966-10-07 1969-11-26 Post Office Improvements in or relating to Character Recognition Machines
JPS596421B2 (ja) * 1978-08-28 1984-02-10 肇産業株式会社 パタ−ン情報処理方法
GB2108306B (en) * 1981-10-16 1985-05-15 Tokyo Shibaura Electric Co Pattern recognition apparatus and method
JPS58214974A (ja) * 1982-06-09 1983-12-14 Nec Corp 文字分類方式
JPS61125688A (ja) * 1984-11-22 1986-06-13 Matsushita Electric Ind Co Ltd 文字認識装置

Also Published As

Publication number Publication date
DE3633743A1 (de) 1987-04-09
US4757551A (en) 1988-07-12
DE3633743C2 (ja) 1990-03-29

Similar Documents

Publication Publication Date Title
JPS6279582A (ja) 文字認識用辞書作成方式
US6366696B1 (en) Visual bar code recognition method
JP3343864B2 (ja) 語体の分離方法
US5410611A (en) Method for identifying word bounding boxes in text
JP2009211178A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP3099797B2 (ja) 文字認識装置
JP2940974B2 (ja) マッチング方法
JP3090928B2 (ja) 文字認識装置
JPH0225985A (ja) 筆跡鑑定装置
JPH07160824A (ja) 文字認識装置
JP2001338263A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JPH0850631A (ja) 文字認識装置
JP2868533B2 (ja) 図面読み取り装置
JPS6222186A (ja) 図面読取り装置
CN116416133A (zh) 一种生成缩略图的方法、装置、终端设备及可读存储介质
JP2972443B2 (ja) 文字認識装置
JPH0830717A (ja) 文字認識方法とその装置
JPH0746363B2 (ja) 図面読取装置
JP2005275820A (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
WO2002069266A1 (fr) Procede d'extraction de l'image d'un visage et dispositif, support d'enregistrement et programme a cet effet
JPH0520489A (ja) 文字認識装置
JPS63131287A (ja) 文字認識方式
JPH11353414A (ja) 文字画像認識装置
JPH02242391A (ja) 文字認識方式
JPH02125384A (ja) 画像信号処理装置