JPS63182793A - 文字切り出し方式 - Google Patents

文字切り出し方式

Info

Publication number
JPS63182793A
JPS63182793A JP62015576A JP1557687A JPS63182793A JP S63182793 A JPS63182793 A JP S63182793A JP 62015576 A JP62015576 A JP 62015576A JP 1557687 A JP1557687 A JP 1557687A JP S63182793 A JPS63182793 A JP S63182793A
Authority
JP
Japan
Prior art keywords
character
candidate
line
individual
individual character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62015576A
Other languages
English (en)
Other versions
JPH0564834B2 (ja
Inventor
Morihiro Katsurada
守啓 桂田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62015576A priority Critical patent/JPS63182793A/ja
Priority to US07/142,867 priority patent/US4811412A/en
Publication of JPS63182793A publication Critical patent/JPS63182793A/ja
Publication of JPH0564834B2 publication Critical patent/JPH0564834B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字イメージ情報より文字を切り出し、文字
コード情報へ変換する光学的文字読取装置などにおける
文字切り出しに関する。
(従来の技術と発明が解決しようとする問題点)文字イ
メージ情報より文字を切り出す文字認識法において、入
力文字パターンと辞書パターンの距離を計算して候補文
字を決定するパターンマツチング法が用いられる。
文字の切り出しには、画像イメージメモリ上の文字画像
情報より行イメージ情報を抽出した後、行イメージバッ
ファメモリに格納しその行イメージ情報より行方向に垂
直な方向にスペースを検出しそのスペースをもって文字
分離位置と定める手法がある。
しかし、この手法において入力文章より正しく!文字が
切り出せなかった場合、辞書パターンに登録されていな
いため誤認識になってしまう。たとえば、文字には偏と
労の場合の様に1文字が左右に分離できる文字(連続し
ていない文字)、漢字の「二」、「三」のような上、下
に分離できる文字が存在する。スペースの検出で文字分
離位置を定める場合、このような分離可能な文字におい
ては、たとえば、偏と労が個別の文字として抽出されて
しまう。
本発明の目的は、このような分離可能な文字をひとまと
まりに正確に取り出仕る文字切り出し方式を提供するこ
とである。
(問題点を解決するための手段) 本発明に係る文字切り出し方式は、画像イメージメモリ
上の文字画像情報より行イメージ情報°を抽出して行イ
メージバッファメモリに格納し、その行イメージ情報よ
りさらに個別文字を切り出し、その1文字より抽出した
特徴とあらかじめ記憶されている特徴情報とのマツチン
グをとり文字を判定する文字認識装置において、行イメ
ージバッファメモリに格納された行イメージ情報より、
行方向に垂直な方向にスペースがあるか文字情報がある
かを判別し、その判別結果よりスペースで区切られる文
字情報の先頭位置と最終位置を判別し記憶する候補位置
検出手段と、行の先頭側より先頭位置を指定し、その先
頭位置から所定の範囲内で最も離れた最終位置を判別し
、該先頭位置から該最終位置までを個別文字位置候補と
判別し、この手順を行の最後まで繰り返す第1文字位置
判別手段と、行の最後側より最終位置を指定し、その最
終位置から所定の範囲内で最も離れた先頭位置を判別し
、該最終位置から該先頭位置までを個別文字位置候補と
判別し、この手順を行の先頭まで繰り返す第2文字位置
判別手段と、第1文字位置判別手段と第2文字位置判別
手段により判別された個別文字位置候補が一致する場合
は、その個別文字位置候補を個別文字位置として決定し
、一致しない場合は、各々の候補位置で特徴抽出を行い
、マツチングにより登録辞書に存在すると判別される個
別文字位置候補を個別文字位置と決定する文字位置決定
手段とを備えたことを特徴とする。
(作 用) ラインイメージ情報より行方向に垂直な方向に候補文字
位置を検出し、次に、この候補文字位置から行の先頭側
と最後側の双方向から個別文字候補位置を判別する。双
方向で個別文字候補位置が一致する場合は、個別文字位
置と決定し、不一致の場合は、各々の候補位置で特徴抽
出を行い、辞書マツチングにより登録辞書に存在する方
の位置を個別文字位置とする。
(実施例) 以下、添付の図面を参照して本発明の詳細な説明する。
第1図は、認識制御部3(第2図)の文字認識制御のフ
ローを示す。
第2図に、本実施例に係るOCRのブロック図を示す。
スキャナ!においては、原稿ガラス上に載置された原稿
をラインセンサで読み取り、A/D変換を行い、次に、
2値データに変換する。ラインセンサを副走査方向に駆
動して全原稿を読み取る(ステップSl)。スキャナ1
で読み取られた画像の2値データは、イメージバッファ
2に一旦格納する。認識制御部(マイクロプロセッサを
含む)3は、イメージバッファに格納された2値パター
ンからラインを抽出し、ラインバッファ4に格納する(
ステップS2)。次に、認識制御部3は、ラインバッフ
ァ4に格納された2値パターンから個別文字を抽出しく
ステップ83〜S 10)、1文字バッファ5に格納す
る(ステップ5ll)。次に認識制御部3は、抽出した
1文字の2値パターンから特徴を抽出し、1文字特徴バ
ッファ6に格納する(ステップ512)。次に認識制御
部3は、■文字特徴バッファ6に格納された特徴を認識
部7に送り、認識部7は、この特徴を辞書メモリ8に予
め記憶しである辞書パターンとマツチングを行い、文字
を認識する(ステップ813)。そして、この文字を文
字コード情報に変換して、外部機器に送る(ステップ5
14)。なお、ラインバッファ4と1文字バッファ5は
省略してすべてイメージバッファ2上で処理することも
可能である。
行イメージメモリ上より個別文字を切り出す手法におい
て、スペース検出のみでは本来1文字である文字が分離
してしまうことがある。本実施例では、この分離文字が
発生するのを候補位置座標の統合により防ぎ、高速に個
別文字候補位置を検出する。
以下、順をおって説明する。
第3図に、ラインバッファ4上に格納されたラインイメ
ージの例を示す(ステップS2)。2値化により、文字
の黒点部を1、白点部をOとして、各々Iビットに割り
付ける。
この例では、イメージ中に「は玉「ご」のような分離可
能文字が存在する。本実施例では、分離可能文字を候補
文字位置の統合によって検出する。
候補文字位置とはスペースでくぎられる文字の位置であ
る。
まず候補文字位置の検出方法(ステップS4)について
説明する。第3図に示すラインイメージに・おいて、ラ
インは、中LHの中に存在する。第4図に示すように、
この中LHの中のイメージについて、8ビツトをひとか
たまりにしてアドレスを割りつけた配列をA(7,6)
とする。そして、ラインに垂直な方向にスペースを検出
する(ステップS3)。すなわち、B(i)=A(i、
 1 )VA(i、2)VA(i、3)■・−・・= 
VA (i、 6 )なる演算(ココテ、記号Vをビッ
トごとの論理和とする。)を行い(i’=t〜7)、第
5図に示す配列B(i)(i=1〜7)のメモリ上に1
またはOのパターンをうめこむ。
この様にして求められた配列Bについて、各ビットの位
置座標りを配列Bを通じてB(1)の第1ビツト(0)
からB(7)の第8ビツト(55)まで連続的に番号付
ける。
次に、このように番号付けられた配列Bにおいて、白、
黒(0,1)になる位置を文字候補スタート部(UP)
とし、黒、白(1,0)になる位置を文字候補エンド部
(DOWN)として記憶する(第5図の矢印参照、ステ
ップS4)。
第1表に、この様にして求められた文字候補スタート部
と文字候補エンド部の対の位置座標りを示す。
次に、個別文字位置候補を検出する。
第3図に示すイメージ上によりライン中(LH)を求め
ておき、このLHの値と第1表の座標値より第2表を作
成する。すなわち、k=0よりスタートシて を満たすjmaxの値を求め、U P (k)よりD 
OWN”” jlllaX)までを1文字とする(ステ
ップS5)。(第2表では、この条件を満たすUPとD
OWNをそれぞれUP’とDOWN’で表わす。)。
したがって、「は」、「ご」は1文字として認識された
。この時に求めた個別文字の個数をmとして記憶する。
今度はに=mよりスタートして OW N (k)までを1文字とする。第3表に、この
条件を満たすUPとDOWNをそれぞれUP”とDOW
N”で表わす(ステップS6)。
このようにして双方向から求められた個別文字位置候補
(第2表と第3表)より個別文字位置を検出する。すな
わち、個別文字位置候補で座標値の一致する所は(ステ
ップS7)、個別文字位置として決定しくステップS8
)、また不一致の個所は、各々の特徴パターンと辞書マ
ツチングにより登録辞書の存在する場合の位置を個別文
字位置とする(ステップS9)。第3図の例では、すべ
ての個別文字位置候補の座標か一致するので、全個別文
字が決定される(ステップ5IO)。
第1表 候補位置 第2表 第1個別文字位置候補 第3表 第2個別文字位置候補 不一致の場合(ステップS7)とは、第6図(a)。
(b)に示すように、文字位置の検出を行う方向によっ
て異なる個別文字位置候補が現われる場合をいう。第6
図(a)の場合は、「と」の左端から矢印で示す3箇所
の文字候補エンド部が存在し、図に示すように個別文字
位置候補が決定される。第6図(b)の場合は、「は」
の右端から矢印で示す3箇所の文字候補エンド部が存在
し、図に示すように個別文字位置候補が決定される。各
々の候補位置で特徴抽出を行い、登録辞書とのマツチン
グにより、第6図(b)の文字切り出しが正しいと決定
する。この様に個別文字位置候補の統合を双方向から行
う事によって、より高精度の個別文字検出が行える様に
なった。
(発明の効果) 分離可能な文字の検出が高精度で行える。また、偏と労
の様に分離可能文字の特徴を別々に登録しておき、個々
の部分の認識結果の組み合わせによって1文字を決定し
ようとする手法に比べ、辞書メモリ容量の削減がはかれ
る。
【図面の簡単な説明】 第1図は、文字認識のフローチャートである。 第2図は、光学的文字認識装置のブロック図である。 第3図は、ラインバッファ上のラインイメージの図であ
る。 第4図は、文字認識の対象となるラインイメージの配列
の図である。 第5図は、スペース検出の図である。 第6図(a) 、 (b)は、個別文字候補位置が双方
向で異なる例を示す図である。 3・・・認識制御部、4・・・ラインバッファ、7・・
・認識部、  訃・・辞書メモ1几特許出願人    
 シャープ株式会社代  理  人 弁理士 前出 葆
ばか2名第1 図

Claims (1)

    【特許請求の範囲】
  1. (1)画像イメージメモリ上の文字画像情報より行イメ
    ージ情報を抽出して行イメージバッファメモリに格納し
    、その行イメージ情報よりさらに個別文字を切り出し、
    その1文字より抽出した特徴とあらかじめ記憶されてい
    る特徴情報とのマッチングをとり文字を判定する文字認
    識装置において、行イメージバッファメモリに格納され
    た行イメージ情報より、行方向に垂直な方向にスペース
    があるか文字情報があるかを判別し、その判別結果より
    スペースで区切られる文字情報の先頭位置と最終位置を
    判別し記憶する候補位置検出手段と、行の先頭側より先
    頭位置を指定し、その先頭位置から所定の範囲内で最も
    離れた最終位置を判別し、該先頭位置から該最終位置ま
    でを個別文字位置候補と判別し、この手順を行の最後ま
    で繰り返す第1文字位置判別手段と、 行の最後側より最終位置を指定し、その最終位置から所
    定の範囲内で最も離れた先頭位置を判別し、該最終位置
    から該先頭位置までを個別文字位置候補と判別し、この
    手順を行の先頭まで繰り返す第2文字位置判別手段と、 第1文字位置判別手段と第2文字位置判別手段により判
    別された個別文字位置候補が一致する場合は、その個別
    文字位置候補を個別文字位置として決定し、一致しない
    場合は、各々の候補位置で特徴抽出を行い、マッチング
    により登録辞書に存在すると判別される個別文字位置候
    補を個別文字位置と決定する文字位置決定手段とを備え
    たことを特徴とする文字切り出し方式。
JP62015576A 1987-01-26 1987-01-26 文字切り出し方式 Granted JPS63182793A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62015576A JPS63182793A (ja) 1987-01-26 1987-01-26 文字切り出し方式
US07/142,867 US4811412A (en) 1987-01-26 1988-01-11 Method of a system for analyzing characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62015576A JPS63182793A (ja) 1987-01-26 1987-01-26 文字切り出し方式

Publications (2)

Publication Number Publication Date
JPS63182793A true JPS63182793A (ja) 1988-07-28
JPH0564834B2 JPH0564834B2 (ja) 1993-09-16

Family

ID=11892556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62015576A Granted JPS63182793A (ja) 1987-01-26 1987-01-26 文字切り出し方式

Country Status (2)

Country Link
US (1) US4811412A (ja)
JP (1) JPS63182793A (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5050218A (en) * 1986-08-26 1991-09-17 Nec Corporation Apparatus for recognizing address appearing on mail article
JPH0634256B2 (ja) * 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
JPH01112388A (ja) * 1987-10-26 1989-05-01 Ricoh Co Ltd 文字認識処理方法
JP2812982B2 (ja) * 1989-04-05 1998-10-22 株式会社リコー 表認識方法
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
US5121440A (en) * 1990-08-30 1992-06-09 Monolithic Resources Corporation Analog video character recognition system
US5307422A (en) * 1991-06-25 1994-04-26 Industrial Technology Research Institute Method and system for identifying lines of text in a document
EP0548571A1 (en) * 1991-11-25 1993-06-30 Eastman Kodak Company System and method for bidirectional adaptive thresholding
US6330358B1 (en) * 1993-01-14 2001-12-11 Atr Auditory And Visual Perception Research Laboratories Apparatus for character segmentation and apparatus for character recognition using the same
US5444793A (en) * 1993-06-15 1995-08-22 Ncr Corporation Method for detecting machine printed monetary amounts in binary images
US5737443A (en) * 1994-11-14 1998-04-07 Motorola, Inc. Method of joining handwritten input
JPH09507937A (ja) * 1994-11-14 1997-08-12 モトローラ・インコーポレーテッド 手書き入力を分割する方法
US5894525A (en) * 1995-12-06 1999-04-13 Ncr Corporation Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
US6246794B1 (en) * 1995-12-13 2001-06-12 Hitachi, Ltd. Method of reading characters and method of reading postal addresses
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
CN1145872C (zh) * 1999-01-13 2004-04-14 国际商业机器公司 手写汉字自动分割和识别方法以及使用该方法的系统
JP2009070226A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd マッチング装置
JP5699570B2 (ja) * 2010-11-30 2015-04-15 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3199080A (en) * 1961-02-21 1965-08-03 Control Data Corp Line reading machine
US3201751A (en) * 1961-06-06 1965-08-17 Control Data Corp Optical character reading machine with a photocell mosaic examining device
US4003023A (en) * 1975-07-09 1977-01-11 International Business Machines Corporation Post-recognition segmentation for pattern-recognition machines
US4408342A (en) * 1981-04-16 1983-10-04 Ncr Corporation Method for recognizing a machine encoded character
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム

Also Published As

Publication number Publication date
US4811412A (en) 1989-03-07
JPH0564834B2 (ja) 1993-09-16

Similar Documents

Publication Publication Date Title
JPS63182793A (ja) 文字切り出し方式
US9262699B2 (en) Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP2713622B2 (ja) 表形式文書読取装置
US7106904B2 (en) Form identification method
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
JPH04195692A (ja) 文書読取装置
RU2707320C1 (ru) Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
JP2538543B2 (ja) 文字情報認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPS6095689A (ja) 光学的文字読取装置
JPH01265378A (ja) 欧文文字認識方式
JP2578767B2 (ja) 画像処理方法
JP3151866B2 (ja) 英文字認識方法
Hwang et al. Segmentation of a text printed in Korean and English using structure information and character recognizers
JPH01201789A (ja) 文字読取装置
JPH04216171A (ja) 輪郭ベクトルの抽出方法
JP2578768B2 (ja) 画像処理方法
KR900005141B1 (ko) 문자인식장치
JP2570311B2 (ja) 文字列認識装置
JP2972443B2 (ja) 文字認識装置
JPH03123989A (ja) 文字認識装置
JP2851102B2 (ja) 文字切出し方法
JPH04199454A (ja) 文書入力装置
JPS62262194A (ja) 光学式文字読取装置