JP2548579B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2548579B2
JP2548579B2 JP62235953A JP23595387A JP2548579B2 JP 2548579 B2 JP2548579 B2 JP 2548579B2 JP 62235953 A JP62235953 A JP 62235953A JP 23595387 A JP23595387 A JP 23595387A JP 2548579 B2 JP2548579 B2 JP 2548579B2
Authority
JP
Japan
Prior art keywords
character
character width
projected
width
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62235953A
Other languages
English (en)
Other versions
JPS6478395A (en
Inventor
篤 霜山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62235953A priority Critical patent/JP2548579B2/ja
Publication of JPS6478395A publication Critical patent/JPS6478395A/ja
Application granted granted Critical
Publication of JP2548579B2 publication Critical patent/JP2548579B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔概要〕 OCR装置(文字認識装置)に関し、 文字フィールド左右位置や文字フィールド内の文字数
が指定されていなくても、文字認識を正しく行い得るこ
とを目的とし、 イメージ格納エリアを,行方向に所定の幅を持ち且つ
行方向と直角な方向に延びる複数のエリアに分割し、各
エリア毎に画素を行方向に重畳し、行方向と直角な方向
に測定した黒の長さをヒストグラム化し、ヒストグラム
の最大値付近のみについて平均黒長を求め、この平均黒
長を文字行の高さとする高さ算出手段と、 文字行の高さにより文字の幅の最大最小範囲を設定
し、行方向と直角な方向に投影した文字行の投影結果か
ら投影文字幅のヒストグラムを作成し、最大最小範囲内
における投影文字幅のヒストグラムのピーク値を求め、
ピーク値に対応する投影文字幅を文字幅の推定値とする
文字幅推定値算出手段と、 求めた文字幅の推定値に基づいて、文字の切出し及び
認識を行う認識手段と を具備することを構成要件としている。
〔産業上の利用分野〕
本発明は、印刷漢字認識を行い得るOCR装置(文字認
識装置)の改良に関するものである。
〔従来の技術〕
従来は文字フィールドの左右の位置がマニュアルによ
り指定されていたため、文字を切り出す位置が実際の文
字位置に非常に近い値となっており、補正を行うのみ
で、そのまま文字切出しを行うことができた。しかしな
がら、従来技術では、文字フィールドの左右位置がマニ
ュアルにより指定されていない場合には、文字を切出す
ことが出来ない。
また、従来技術では、フィールド内文字数をマニュア
ルにより指定していたため、文字フィールド内から1文
字を切出すことは容易であったが、マニュアル指定がな
いと、文字切出し処理において、結合した2文字が1文
字になったり、分離しているストロークが2以上からな
る1文字が2文字以上になったりする場合があった。第
10図は2文字が1文字になる例を示し、第11図は1文字
が2文字になる例を示す。また、第12図はマニュアル指
定ありの場合を示し、第13図は単純に上下方向投影を行
った結果を示している。第13図の投影結果にしたがって
文字切出しを行うと、正しい文字切出しを行うことが出
来ない。
〔発明が解決しようとする問題点〕
上述のように、従来の技術は、マニュアルなどによっ
て文字フィールドの左右位置や文字フィールド内の文字
数が指定されていない場合には、文字認識を正確に行う
ことが出来ないと言う欠点を有している。
本発明は、この点に鑑みて創作されたものであって、
文字フィールドの左右位置や文字フィールド内の文字数
がマニュアル等によって指定されていなくても、文字認
識を正しく行い得るようになった文字認識装置を提供す
ることを目的としている。
〔問題点を解決するための手段〕
第1図は本発明の原理図である。本発明の文字認識装
置は、高さ算出手段100と、文字幅推定値算出手段200
と、第1の認識手段310と、第2の認識手段320と、第3
の認識手段330を有している。
高さ算出手段100は、イメージ格納エリアを,行方向
に所定の幅を持ち且つ行方向と直角な方向に延びる複数
のエリアに分割し、各エリア毎に画素を行方向に重畳
し、行方向と直角な方向に測定した黒の長さをヒストグ
ラム化し、ヒストグラムの最大値付近のみについて平均
黒長を求め、この平均黒長を文字行の高さとする。
文字幅推定値算出手段200は、文字行の高さにより文
字の幅の最大最小範囲を設定し、行方向と直角な方向に
投影した文字行の投影結果から投影文字幅のヒストグラ
ムを作成し、最大最小範囲内における投影文字幅のヒス
トグラムのピーク値を求め、ピーク値に対応する投影文
字幅を文字幅の推定値とする。
第1の認識手段310は、文字幅の推定値を基準にして
投影文字幅が3/4倍以下の場合には、次の投影文字幅と
統合し、統合する前の投影文字幅に基づいて文字の切出
し及び認識を行うと共に、統合した投影文字幅に基づて
文字の切出し及び認識を行い、統合する前と統合した後
での認識結果の内から正読に近い方を選択して出力す
る。
第2の文字認識手段320は、文字幅の推定値を基準に
投影文字幅が3/4乃至1.2倍の場合には、投影文字幅に従
って文字を切り出し、認識し、出力する。
第3の認識手段330は、文字幅の推定値を基準に投影
文字幅が1.2倍以上の場合には、オーバハング処理を行
い、分離できた場合は分離して認識し出力し、オーバハ
ング処理で分離できなかった場合には、強制分離できる
か否かを調べ、強制分離処理で分離できる場合は分離し
て認識し、出力する。
〔実施例〕
本発明においては、文字の高さから文字の幅を推定し
ている。文字の高さの求め方を第2図および第3図を参
照しつつ説明する。第2図に示すように、行方向に所定
の幅を持ち且つ列方向(行方向と直角な方向)に延びる
エリアで入力したイメージ・エリアを分割し、所定の幅
の各エリアについて画素を行方向に重畳する。なお、文
字が横書きの場合には、行方向とは横方向である。重畳
したデータの行方向と直角方向に測定した黒の長さ(第
2図では垂直方向の長さで、図の右側に示しているも
の)を全エリアについて求め、その集合の中に同じ長さ
のものが何個あるかを調べ、ヒストグラムを作成する。
作成されたヒストグラムを第3図に示す。このヒストグ
ラムの最大のものを中心として所定長範囲に存在する黒
の長さの平均値を求め、これを文字の高さとする。
文字の高さから幅を推定するには、表に従って推定範
囲を決定し、その範囲内の最適値を抽出する。表の例を
表1に示す。
最適値は次のようにして求める。第4図に示すよう
に、各行毎に行と直角方向に単純投影を行う。ここで各
行とは、第2図に示す黒の長さを高さとした重畳前の元
のイメージ・データを言う。単純投影とは、第4図の例
では上下に各行の箱内について論理和(黒を1,白を0と
したとき)した結果を求めることである。第4図に示す
ように、単純投影を行うと、黒線の列が出来るが、黒線
の長さを測定し、ヒストグラムを作成し、先に求めた幅
の推定範囲内で最多となる値を示す黒線の長さを求め
る。求まった長さが幅の最適値である。これを文字幅の
推定値とする。各黒線を投影文字幅と言う。
このようにして求めた推定値を用いて、投影文字幅の
長さが推定値の1.2倍以上のであるならば2個の文字が
結合していると判断し、オーバハング分離を行う。オー
バハング分離が出来なかった場合で且つ投影文字幅の長
さが推定値の2倍以上ならば、強制的に左側から推定文
字幅の所及びその前後で分離し、認識を行い、3つの候
補から最適な答を出力する。オーバハング分離が出来ず
且つ投影文字幅の長さが推定値の2倍以上の値でない場
合は、認識不能とする。オーバハング分離とは、第5図
のように、上下の単純投影では結合しているが元のイメ
ージでは分離している場合に、これを分離させる処理で
ある。投影文字幅の長さが推定値の3/4以下の幅である
ならば、次の投影文字幅と結合してみる。そして、結合
したものの長さが推定値の1.2倍以下の値となったなら
ば、結合前と結合後について認識を行い、2つの候補か
ら最適な答を出力する。
第6図は文字認識処理全体における本発明の位置付け
を示す図である。文字認識処理全体は、イメージの入
力、文字ブロックの抽出(写真ブロックと文字ブロック
の分離)、全ブロックについての文字認識終了判定、NO
の場合における本発明の処理、文章の後処理、文章の確
認修正、終了判定と言う順序で行われる。
第7図は本発明による認識処理の流れを示す図であ
る。
128ドットの投影による行の抽出を行う。
黒の長さのヒストグラムを作成する。
ヒストグラムにより行の高さを求める。
行の高さより変換テーブルを使用し、文字幅の上限
と下限を求める。
全行について単純投影を行う。
投影結果得られる投影文字幅のヒストグラムを作成
する。
投影文字幅のヒストグラムにおいて、文字幅の上限
と下限の範囲内に存在する個数のピーク値を求め、この
ピーク値に対応する投影文字幅の長さを文字幅の推定値
として決定する。
全行について文字認識が終了したか否かを調べる。
NOのときはの処理を行い、YESのときは終了とする。
未処理の行について行内単純投影を行う。
その行の全文字についての文字認識が終了したか否
かを調べる。YESのときはの処理に戻り、NOのときは
の処理を行う。
投影文字幅の長さが推定幅の3/4〜1.2倍の範囲にあ
るか否かを調べ、YESのときはの処理を行い、NOの場
合にはの処理を行う。
投影文字幅の長さが推定幅の3/4以下か否かを調べ
る。YESの場合にはの処理を行い、NOの場合にはの
処理を行う。
オーバハング分離を行う。
分離できたか否かを調べる。YESのときはの処理
を行い、NOの場合にはの処理を行う。
強制分離による認識を行う。
投影文字幅より文字幅を求め、文字を切り出す。
認識を行う。
答を出力する。
一文字として認識し、不一致度を一時記憶する。
右側の文字と結合する。
推定文字幅の3/4〜1.2倍の範囲にあるか否かを調べ
る。YESのときはの処理を行い、NOのときはの処理
を行う。
結合して認識する。
不一致度は一時記憶の方が小か否かを調べる。YES
のときはの処理を行い、NOのときはの処理を行う。
一時記憶側の答を出力する。
結合した結果の答を出力する。
分離した左側の認識を行う。
答を出力する。
分離した右側の認識を行う。
答を出力する。
第8図は本発明のハードウェア構成例を示す図であ
る。同図において、1はイメージ処理プロセッサ、2は
スキャナ、3はスキャナ・アダプタ、4はプログラム・
メモリ、5は答出力メモリ、6はイメージ格納用メモ
リ、7は文字幅の上下限決定用テーブル・メモリ、8は
ヒストグラム用メモリ(ワーク)、9は投影結果格納メ
モリ、10は重畳結果格納メモリをそれぞれ示している。
プログラム・メモリ4の中には、投影処理やヒストグラ
ム処理、テーブル作成処理、テーブル参照処理、黒長カ
ウント処理を行うプログラムが格納されている。
第9図は第8図の装置におけるデータの流れを示す図
である。スキャナ2によって読み取られたイメージ・デ
ータは、イメージ格納用メモリ6に格納される。全イメ
ージ・データの格納が終了した後、イメージ・エリアを
列方向に延びる複数のエリアに分割し、各エリアの画素
を行方向に重畳する。重畳結果は重畳結果格納メモリ10
に格納される。重畳結果の中に同じ長さの黒が何個存在
するかを調べることにより、黒の長さのヒストグラムを
作成し、作成したヒストグラムをヒストグラム用メモリ
8に格納する。ヒストグラム用メモリとしては、ワーク
・メモリの一部が割り当てられる。このヒストグラムに
より文字の高さを決定し、決定した文字の高さを基にし
て文字幅の上下限決定用テーブル7を索引し、文字幅の
最大値と最小値を決定する。
重畳結果により、行の上下範囲が判るので、イメージ
格納用メモリ6から1行分のイメージ・データを取り出
し、単純投影を行う。単純投影の結果は投影結果格納メ
モリ9に格納される。同様な処理を全ての行について行
う。投影の結果得られる投影文字幅の中に同じ長さのも
のが何個存在するかを調べることにより、投影文字幅の
ヒストグラムを作成し、投影文字幅のヒストグラムをヒ
ストグラム用ワーク・メモリ8に格納する。この投影文
字幅のヒストグラム及び文字幅の最大値・最小値から文
字幅の推定値を求める。求めた文字幅の推定値を使用し
て、イメージ格納用メモリ6から文字を切り出し、文字
認識を行い、そして答を出力する。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、文
字の高さを求め、求めた文字の高さから文字幅を推定
し、この推定値を使用して文字を切出し、認識を行って
いるので、マニュアルによる左右のフィールド位置およ
び文字数指定が不要となる。なお、第2図および第3図
には説明の都合上文字の大きさが異なる数種の文字が混
在しているが、第6図のフローのように文字ブロックを
抽出すると、文字の大きさが大きく異なっている文字列
は別ブロックとして扱われ、同一ブロック内での処理で
は、第3図のヒストグラムのピークに近い所以外の多く
はノイズ等の場合である。
【図面の簡単な説明】
第1図は本発明の原理図、第2図はイメージ・エリアを
列方向に延びる複数のエリアに分割し各エリア毎に画素
を行方向に重畳した例を示す図、第3図は重畳結果を基
にして作成された黒の長さのヒストグラムの例を示す
図、第4図は各行毎の行と直角方向への単純投影の例を
示す図、第5図はオーバハング分離の説明のための図、
第6図は認識処理全体における本発明の位置付けを示す
図、第7図は本発明における処理の流れを示す図、第8
図は本発明のハードウェア構成例を示す図、第9図は本
発明におけるデータの流れを示す図、第10図は2文字が
1文字になる例を示す図、第11図は1文字が2文字にな
る例を示す図、第12図は文字フィールドの左右位置と文
字数がマニュアルにより指定されている例を示す図、第
13図は文字列を上下方向に単純投影した結果の例を示す
図である。 1……イメージ処理プロセッサ、2……スキャナ、3…
…スキャナ・アダプタ、4……プログラム・メモリ、5
……答出力メモリ、6……イメージ格納用メモリ、7…
…文字幅の上下限決定用テーブル・メモリ、8……ヒス
トグラム用メモリ、9……投影結果格納メモリ、10……
重畳結果格納メモリ。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】(a) イメージ格納エリアを,行方向に
    所定の幅を持ち且つ行方向と直角な方向に延びる複数の
    エリアに分割し、各エリア毎に画素を行方向に重畳し、
    行方向と直角な方向に測定した黒の長さをヒストグラム
    化し、ヒストグラムの最大値付近のみについて平均黒長
    を求め、この平均黒長を文字行の高さとする高さ算出手
    段(100)と、 (b) 文字行の高さにより文字の幅の最大最小範囲を
    設定し、行方向と直角な方向に投影した文字行の投影結
    果から投影文字幅のヒストグラムを作成し、最大最小範
    囲内における投影文字幅のヒストグラムのピーク値を求
    め、ピーク値に対応する投影文字幅を文字幅推定値とす
    る文字幅推定値算出手段(200)と、 (c) 求めた文字幅の推定値を基準にして投影文字幅
    が3/4倍以下の場合には、次の投影文字幅と統合し、統
    合する前の投影文字幅に基づいて文字の切出し及び認識
    を行うと共に、統合した投影文字幅に基づいて文字の切
    出し及び認識を行い、統合する前と統合した後での認識
    結果の内から正読に近い方を選択して出力する第1の認
    識手段(310)と、 (d) 求めた文字幅の推定値を基準に投影文字幅が3/
    4乃至1.2倍の場合には、投影文字幅に従って文字を切り
    出し、認識し、出力する第2の認識手段(320)と、 (e) 求めた文字幅の推定値を基準に投影文字幅が1.
    2倍以上の場合には、オーバハンク処理を行い、分離で
    きた場合は分離して認識し出力し、オーバハング処理で
    分離できなかった場合には、強制分離できるか否かを調
    べ、強制分離できる場合は分離して認識し、出力する第
    3の認識手段(330)と を具備することを特徴とする文字認識装置。
JP62235953A 1987-09-19 1987-09-19 文字認識装置 Expired - Fee Related JP2548579B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62235953A JP2548579B2 (ja) 1987-09-19 1987-09-19 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62235953A JP2548579B2 (ja) 1987-09-19 1987-09-19 文字認識装置

Publications (2)

Publication Number Publication Date
JPS6478395A JPS6478395A (en) 1989-03-23
JP2548579B2 true JP2548579B2 (ja) 1996-10-30

Family

ID=16993657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62235953A Expired - Fee Related JP2548579B2 (ja) 1987-09-19 1987-09-19 文字認識装置

Country Status (1)

Country Link
JP (1) JP2548579B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05210759A (ja) * 1992-01-30 1993-08-20 Omron Corp 文字認識装置
DE19522394C2 (de) * 1995-06-23 1997-04-17 Licentia Gmbh Verfahren und Vorrichtung zur Bestimmung der Teilung bei Schriften mit fester Teilung
US6188790B1 (en) 1996-02-29 2001-02-13 Tottori Sanyo Electric Ltd. Method and apparatus for pre-recognition character processing
CN100492403C (zh) 2001-09-27 2009-05-27 佳能株式会社 文字图像分行方法和装置以及文字图像识别方法和装置
JP5146190B2 (ja) 2008-08-11 2013-02-20 オムロン株式会社 文字認識装置、文字認識プログラム、および文字認識方法

Also Published As

Publication number Publication date
JPS6478395A (en) 1989-03-23

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
JP2822189B2 (ja) 文字認識装置及び方法
JP3170299B2 (ja) 画像読取処理装置
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
JP2548579B2 (ja) 文字認識装置
CN112329641B (zh) 一种表格识别方法、装置、设备及可读存储介质
JP2926066B2 (ja) 表認識装置
JP2868134B2 (ja) 画像処理方法及び装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPS62121589A (ja) 文字切出し方法
JP3135290B2 (ja) 画像処理方法及び装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2851087B2 (ja) 表処理方法
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP2821303B2 (ja) 掠れ文字結合方式
JP2813601B2 (ja) 表形式文書認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH07120392B2 (ja) 文字パターン切り出し装置
JPS63101983A (ja) 文字列抽出方式
JPH05274472A (ja) 画像認識装置
JP2827227B2 (ja) 文字認識方法
JPH04291478A (ja) 罫線認識方法及び表処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees