JPS61220081A - パタ−ン切り出し及び認識方式 - Google Patents

パタ−ン切り出し及び認識方式

Info

Publication number
JPS61220081A
JPS61220081A JP60060681A JP6068185A JPS61220081A JP S61220081 A JPS61220081 A JP S61220081A JP 60060681 A JP60060681 A JP 60060681A JP 6068185 A JP6068185 A JP 6068185A JP S61220081 A JPS61220081 A JP S61220081A
Authority
JP
Japan
Prior art keywords
pattern
character
recognition
unit
language processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60060681A
Other languages
English (en)
Inventor
Yasuaki Nakano
中野 康明
Hiromichi Fujisawa
藤沢 浩道
Akizo Kadota
門田 彰三
Kiyomichi Kurino
栗野 清道
Osamu Kunisaki
国崎 修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60060681A priority Critical patent/JPS61220081A/ja
Publication of JPS61220081A publication Critical patent/JPS61220081A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明はパターン切り出し及び認識方式に関し、たとえ
ば光学文字読み取り装置において、自然な筆記条件で書
かれた帳票のパターンを切り出す方式及びそれを認識す
る方式に関するものである。
〔発明の背景〕
従来の文学読み取り装置(以下、OCRと略する)に読
ませる文字は、第1図に示すように1文字枠間ギャップ
5において文字ごとに設定された文字枠11内に正しく
筆記する必要がある。その場合、多少の枠からのはみ出
しは許容されているが、上下方向については1.0〜1
.51程度、左右方向については隣の枠に入らない程度
である。
ところで、OCRを益々普及させるためには、上記のよ
うにOCR独特な文字枠内部に文字を筆記させることな
く、第2図、第3図に示すように文字枠の設計条件をゆ
るめて、通常状々が記入しているような筆記条件を可能
にすることが必要である。
従来の文字枠は1寸法が大きいだけでなく文字枠間ギャ
ップ5が1.0〜1.5■であるのに対し。
条件の緩和された文字枠は第2図の12で示すように、
寸法が小さくなるとともに、文字枠間ギャップ6がO■
となったり、第3図のように文字枠自身が全くなくなっ
たりする。その結果として。
文字相互間の境界が分かり難くなり、文字読取上困難な
問題を発生する。
従来技術では1例えば(特開59−9823)において
、−文字パターンへ〇切り出しの際に、−文字パターン
を区切る境界の判断に曖昧性が生じている場合には、パ
ターン間の境界に複数の仮説を作って、各仮説の単位パ
ターンを認識部に送り、該認識部では各仮説の単位パタ
ーンの認識結果を総合的に判断して各仮説の中から単一
の仮説を選択する方法が開示され、英字・数字・仮名の
範囲では有効であることが知られている。
しかし、認識対象が自由枠の中に漢字と英字・数字・仮
名とが混在して書かれたものであるとき、漢字と英字・
数字・仮名とでは文字ピッチが大きく異なるため、文字
ピッチを漢字用に設定すると複数の英字・数字・仮名を
一つにまとめてしまい。
逆に、文字ピッチを英字・数字・仮名用に設定すると一
個の漢字を複数個に分割してしまうという問題点があり
、従来の手法では文字パターンの切り出しに際して立て
る複数の仮説の中に正しいものが含まれず1文字切り出
し、従って文字認識に失敗する場合があった。
【発明の目的〕
本発明の目的は、このような従来の問題を解決するため
、自然な筆記条件で漢字と英字・数字・仮名とが混在し
て書かれた帳票上の文字パターンを切り出し、認識する
手段を提供することにある。
〔発明の概要〕
かかる目的を達成するため1本発明は、電気的信号に変
換された映像パターンから所定の単位パターンを抽出し
て認識部に供給し、認識部では供給された映像パターン
から連続した部分映像パターンを抽出した後、適当な文
字ピッチの仮定の下にこれらを組み合わせて入カバター
ンとするパターン切り出し及び認識方式において、文字
ピッチとして複数個の値を用いて複数の仮説を作り、各
仮説ごとに文字切り出しを行って得られた単位パターン
を認識部に供給し、認識部で部分表示と本来のカテゴリ
を表示する信号、完備表示と入カバターンのカテゴリ表
示の信号、あるいは接触表示と各々のパターンのカテゴ
リ表示の信号を言語処理部に送り、該言語処理部におい
て複数の仮説の結果を統合して最終結果を出力すること
を特徴とする。
〔発明の実施例〕
以下、本発明の原理及び実施例を図面により説明する。
本発明の原理は、次の四つの点にある。すなわち、(1
)文字ピッチとして複数個の推定値を用いて文字パター
ンを切り出す、(2)パターンの切り出しにおいて、曖
昧性が生じた場合は、無理に判断をすることなく、まず
複数の仮説を立てて。
各々の仮説による単位パターンを認識部に送る。
(3)認識部では部分パターンや接触パターンの識別を
行い、総合的判断にもとづいて認識し、単一の候補カテ
ゴリが決定できない場合は各単位パターンに対して複数
の候補カテゴリを言語処理部に送る。(4)言語処理部
では文字パターンの切り出しにmmいた文字ピッチと、
複数の候補カテゴリの複数の仮説の系列とから言語知識
を用いて総合判断を行い、その結果から切り出し及び認
識の妥当性のチェックを行い曖昧性を解消する。
第4図は、切り出しに用いて文字ピッチと、文字パター
ンの種々の状態を示す図である。
まず、第4図(、)のパターン31〜34、(b)のパ
ターン35〜40は、連続した領域からなるパターン成
分である(図においては斜線で示しである)、連続した
領域をパターン成分として抽出する方法は従来より知ら
れている。このとき、最小文字ピッチとして21のよう
に短い値を仮定すれば、(a)で31.32はそれぞれ
独立した文字、33と34は合わせて一つの文字として
切り出される。また、(b)で35.38゜39.40
はそれぞれ独立した文字、36と37は合わせて一つの
文字として切り出される。
次に、第4図(c)、(d)のように、最小文字ピッチ
として22のように長い値を仮定すれば、(c)で31
と32及び33と34とは合わせて一つの文字として切
り出される。また、(d)で35.36.37及び39
と40は合わせて一つの文字として、38は独立した文
字として切り出される。
以上のように切り出されたパターンの認識結果が、例え
ば第4図(a)、(b)で、それぞれ「イヒ学」、「オ
ペレータ」となり、 (C)。
(d)で、それぞれ「化学」、「?し汐」となったとす
る、ここで「?」は認識不能(リジェクト)を表す、そ
して、双方のケースを別個に言語処理部に送って、単語
辞書との照合あるいは文法チェックなどの言語処理を行
って、その結果からどちらの仮説が正しかったかを決定
する。上記の例では、「化学」、「オペレータ」のみが
単語辞書と照合するので、「化学」については長い文字
ピッチ22の仮説が、「オペレータ」については短い文
字ピッチ21の仮説を採用すればよいことが分かる。
以上の説明では、文字ピッチとしである値を設定したと
き、切り出し部は一種類の切り出し結果を出力するとし
たが、切り出し部が複数の仮説を立てた場合にも本発明
は適用でき、認識部あるいは言語処理部で最適な仮説を
選択すればよい。
次に1本発明の実施例について説明する。
第5図は本発明の実施例を示す文字読み取り装置のブロ
ック図である。
この文字読み取り装置は、パターン観測部800゜文字
ピッチ推定部850、切り出し部900.帳票フォーマ
ット辞書950、パターン認識部200゜パターン辞書
100、認識結果最終判定部400、認識結果書換え規
則辞書300、言語処理部50G、言語辞書600から
構成される。
帳票75には、第2,3図に示すような自然な筆記条件
で文字が記入されている。帳票75がパターン観測部8
00に入力され、光電変換及び前処理(二値化、帳票ス
キュー補正など)を受けると、二次元映像パターンが電
気的信号としてパターン切り出し部900及び文字ピッ
チ推定部850に送出される0文字ピッチ推定部850
では帳票フォーマット辞書950中の文字記入領域パラ
メータを参照して、一枚の帳票の映像から一領域に相当
すると判断されるパターン領域を抽出し、その中で文字
ピッチを推定する。そのとき、帳票フォーマット辞書9
50において該領域が漢字と英字・数字・仮名との混在
領域であると指定されている場合には、複数のピッチ推
定値を出力する。
パターン切り出し部900では、帳票フォーマット辞書
950中の枠位置パラメータと上記のピッチ推定値の出
力を参照して、一枚の帳票の映像から一文字に該当する
と判断されるパターンを一組ずつ切り出してパターン認
識部200に送出する。
パターン認識部200では、入力された一文字分のパタ
ーン(部分パターンの場合や複数パターンを統合した場
合もある)と、第5図に示したパターン辞書100に記
憶されている各パターンと比較照合し、認識結果を最終
判定部400に送出する。最終判定部400は、認識結
果に対して書換え規則辞書300内の各書換え規則を適
用できる書換え規則がなくなるまで順次適用し、書換え
の結果に応じた処理を行う、ここで書換え規則は、複数
のパターン切り出しとパターン認識の結果に対して、あ
らかじめ定められた規則により、妥当な仮説を選択する
処理である。言語処理部500は、認識結果に対して言
語辞書600を参照し。
複数候補あるいは認識不能を含む文字連系について最適
な決定を行う1文字ピッチ推定部850で複数のピッチ
推定値が出力された場合、上記のパターン切り出し、パ
ターン認識と言語処理の操作を繰り返し最良のものを選
ぶ。
第5図のうち、パターンI!測部800は公知の技術で
実現できるので説明を省略する。
文字ピッチ推定部850以降の処理を、さらに詳しく説
明する。
第6図は、文字ピッチ推定、文字切り出し及びパターン
認識の処理の流れ図である。
第6図のステップ601では、帳票1枚分の映像パター
ン611より1行分の映像パターン612を切り出す0
次に、ステップ602では、黒地パターンの連続性を利
用して、黒地ごとのパターン成分を抽出し、横方向に関
して順序付けを行った後、成分リスト613を作成する
。さらに、各成分の属性を計算し、成分属性リスト61
4を作成する。なお、成分の属性とは、各成分の上下端
左右端の座標、輪郭総長等である。
次に、ステップ603では文字ピッチの推定を行う。
次に、ステップ604では、成分属性リスト614と、
文字ピッチ推定値及び帳票フォーマット辞書950の情
報から文字間の境界の仮説を立て1文字リスト615を
作成する。このリスト615は各文字パターンがどの成
分から構成されているかを示す、第6図で615が二段
になっているが、上段は1回目の文字ピッチ推定に対応
し、下段は2回目の文字ピッチ推定に対応する(以下6
16〜618も同様である)。
次に、ステップ605の認識部では、成分リスト613
.成分属性リスト614及び文字リスト615を入力し
1文字リスト615に含まれる成分を集めてパターン整
合を行い、その結果を結果リスト616に書き込む、整
合結果を表す結果コードは、 (SP、a)、  (S
C,a、b)。
(SS、a、b)、(CG、a、b)、(AC。
a)、(RJ、a)等の記号形式をとる。これらの意味
は、それぞれ、カテゴリaのサブ・パターン、カテゴリ
aのサブ・パターンとカテゴリbのサブ・パターンの接
触したもの、カテゴリaとbのサブ・パターン相互が接
触したもの、カテゴリaとbの接触したもの、カテゴリ
aのパターン、候補はカテゴリaであるがリジェクト、
という意味を持っている。
ステップ606では、結果リスト616に対して、書換
え規則辞書300内部のすべての規則を参照し、適用で
きる規則がなくなるまで順次適用し、最終的に得られた
結果に応じた処理を行い。
その結果を結果リスト617に書き込む。
ここで書換え規則とは1例えば(SP、a)、(SP、
a)が連続したとき、これを(AC,a)に書換えるよ
うな処理: (SP、a)(SP、a)+ (AC,a)で、切り出
し部における曖昧性を認識結果により確定するものであ
る。
ステップ607では、結果リスト617の内容と言語辞
書500との照合を行って、照合した結果を結果リスト
618に書き込む、照合した結果を結果リスト618に
書き込む際、従来の結果との比較を行い、前回の文字ピ
ッチ推定値を用いた場合よりもよく照合する場合にのみ
結果リスト618に書き込む。
ステップ608は文字ピッチ推定値の個数だけステップ
603〜607の処理を繰り返し行うための判定部であ
る。
ステップ609では、帳票上のすべての行が終了したか
否かを判断し、終了していなければステップ601に戻
って、以上の処理を繰り返し行う。
ステップ609を終了したときの結果リスト618が最
終出力となる。
以上の説明では、必ず複数個の文字ピッチ推定値を用い
て、文字切り出し、パターン認識及び言語処理を繰り返
すとしたが、その他にある領域がまず英字・数字・仮名
の領域であると仮定して処理し、言語処理の結果照合し
ない文字連系を抽出して、この文字連系について漢字の
領域と仮定して処理する方式、あるいはその逆の方式を
採用することもできる。
また以上の説明では、書換え判定ステップ606と言語
処理ステップ607とは別であるとしたが、両者を統合
してもよく、書換え判定機能を言語処理ステップ607
の中に含めることもできる0例えば、数字「12」を統
合して平仮名「に」に誤認識することも生じ得、このと
き結果コードは短い文字ピッチ:  (RJ、1)(A
C,2)長い文字ピッチ:  (AC,に) となったりする、このとき、書換え規則(RJ、1)(
AC,2)/ (AC,に)→(AC,1)(AC,2
) を言語処理ステップ6d7の中に含めることができる(
/は文字ピッチを変えたことを示す)、逆に漢字「職」
を分解して「耳」 「哉」と誤認識したとすれば、書換
え規則 (AC,耳)(AC,哉)/ (AC,職)→(AC,
職) を言語処理ステップ607の中に含めることができる。
〔発明の効果〕
以上説明したごとく1本発明によれば帳票の筆記条件が
緩和され、仕切り線のない枠の中に自由な文字ピッチで
文字を記入した場合も、文字読取装置において妥当なパ
ターンの切出し及び認識ができるので、ユーザにとりき
わめて便利なOCRを実現することが可能となる。
【図面の簡単な説明】
第1図は従来のOCR用帳票の文字枠を示す図、第2,
3図は制限を緩和したときの文字枠を示す図、第4図は
文字パターンの切り出し状態を示す図、第5図は本発明
の実施例を示す文字読取装置の機能ブロック図、第6図
は第5図の切出し及び認識処理のブローチヤードである
。 75・・・帳票、100・・・パターン辞書、200・
・・パターン認識部、300・・・認識結果書換え規則
辞書、400・・・認識結果最終判定部、500・・・
言語辞書。 600・・・言語処理部、800・・・パターン観測部
。 850・・・文字ピッチ推定部、900・・・パターン
切出し部、950・・・帳票フォーマット辞書。

Claims (1)

  1. 【特許請求の範囲】 1、電気的信号に変換された2次元映像パターンから1
    文字の単位パターンを切り出して認識部に送り、該認識
    部では入力された映像パターンをパターン辞書内部の各
    パターンと比較して認識し認識結果を言語処理部に送り
    、該当言語処理部では複数個の文字系列を言語知識と比
    較して誤読あるいは不読を検出あるいは修正するパター
    ン切り出し及び認識方式において、1単位パターンへの
    切り出しの際に文字ピッチとして複数の仮説を設けて文
    字切り出しを行い、各仮説に対する単位パターン群を認
    識部に送り、該認識部では各仮説の単位パターン群の認
    識結果を言語処理部に送り、該言語処理部において言語
    処理を行つて上記複数の仮説を統合して最終決定を下す
    ことを特徴とするパターン切り出し及び認識方式。 2、特許請求の範囲第1項記載のパターン切り出し及び
    認識方式において、1単位パターンへの切り出しの際に
    文字ピッチとして第1の仮説を設けて文字切り出しを行
    い、切り出された単位パターン群を認識部に送り、該認
    識部では上記の単位パターン群の認識結果を言語処理に
    送り、該言語処理において言語処理を行つた結果、言語
    処理が失敗した場合文字ピッチを変更して再試行し、上
    記の複数の結果を統合して最終結果を得ることを特徴と
    するパターン切り出し及び認識方式。
JP60060681A 1985-03-27 1985-03-27 パタ−ン切り出し及び認識方式 Pending JPS61220081A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60060681A JPS61220081A (ja) 1985-03-27 1985-03-27 パタ−ン切り出し及び認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60060681A JPS61220081A (ja) 1985-03-27 1985-03-27 パタ−ン切り出し及び認識方式

Publications (1)

Publication Number Publication Date
JPS61220081A true JPS61220081A (ja) 1986-09-30

Family

ID=13149295

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60060681A Pending JPS61220081A (ja) 1985-03-27 1985-03-27 パタ−ン切り出し及び認識方式

Country Status (1)

Country Link
JP (1) JPS61220081A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63311492A (ja) * 1987-06-12 1988-12-20 Matsushita Electric Ind Co Ltd 文字認識装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
JPS59197971A (ja) * 1983-04-23 1984-11-09 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置
JPS59216285A (ja) * 1983-05-25 1984-12-06 Toshiba Corp 文字認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
JPS59197971A (ja) * 1983-04-23 1984-11-09 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置
JPS59216285A (ja) * 1983-05-25 1984-12-06 Toshiba Corp 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63311492A (ja) * 1987-06-12 1988-12-20 Matsushita Electric Ind Co Ltd 文字認識装置

Similar Documents

Publication Publication Date Title
TWI435276B (zh) 用以辨識手寫符號之方法及設備
JPH055146B2 (ja)
CN105184292A (zh) 自然场景图像中手写体数学公式结构分析与识别方法
US20010051965A1 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
RU2259592C2 (ru) Способ распознавания графических объектов с использованием принципа целостности
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
JPS61220081A (ja) パタ−ン切り出し及び認識方式
JP2550012B2 (ja) パタ−ン切り出し及び認識方法
Amano et al. DRS: A workstation-based document recognition system for text entry
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP2675303B2 (ja) 文字認識方法
Airphaiboon et al. Recognition of handprinted Thai characters using loop structures
Jayarathna et al. New segmentation algorithm for offline handwritten connected character segmentation
JPH09245120A (ja) 文字切出し方法
JPH0773273A (ja) パターン切出しおよび認識方法とそのシステム
KR100367580B1 (ko) 획순독립의온라인문자인식장치
JPS62281082A (ja) 文字認識装置
JPH06162266A (ja) オンライン手書き文字認識の方法及びその装置
Hwang et al. Segmentation of a text printed in Korean and English using structure information and character recognizers
Saeed et al. Intelligent feature extract system for cursive-script recognition
JPH0792818B2 (ja) パターン切出しおよび認識方法とそのシステム
JPH0348379A (ja) 文字認識方式
JP2000200323A (ja) オンライン手書き漢字認識装置
JPS6318483A (ja) 光学的情報入力装置用文字認識方法
JPH02292691A (ja) 文字認識装置