JP2615153B2 - 切断分離を伴う文字認識方法 - Google Patents

切断分離を伴う文字認識方法

Info

Publication number
JP2615153B2
JP2615153B2 JP63209881A JP20988188A JP2615153B2 JP 2615153 B2 JP2615153 B2 JP 2615153B2 JP 63209881 A JP63209881 A JP 63209881A JP 20988188 A JP20988188 A JP 20988188A JP 2615153 B2 JP2615153 B2 JP 2615153B2
Authority
JP
Japan
Prior art keywords
character
image
segment
character image
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63209881A
Other languages
English (en)
Other versions
JPH0258186A (ja
Inventor
央 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63209881A priority Critical patent/JP2615153B2/ja
Publication of JPH0258186A publication Critical patent/JPH0258186A/ja
Application granted granted Critical
Publication of JP2615153B2 publication Critical patent/JP2615153B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [概要] 文字イメージをヘンとツクリ等の左右の部分イメージ
に分離して認識する切断分離を伴う文字認識方法に関
し、 部分イメージが接触した文字イメージであっても正確
に部分イメージに分離して認識することを目的とし、 文字イメージにつき縦方向のヒストグラムを作成して
部分イメージ毎の最大値位置及びその中間位置を求め、
ヒストグラム最大値位置の範囲内で文字イメージを縦方
向に等間隔で分割して各分割区域の横切る文字本数及び
文字幅を検出し、文字本数が最小で且つ文字幅が所定値
に以下で、更にヒストグラム中間位置になるべく近い位
置を切断区域に設定し、この切断区域を中心に所定範囲
で文字イメージをラベリングして複数のセグメントに区
分し、切断区域を横切る区分セグメントについてラベリ
ング範囲で連続しているか分断しているか判定し、連続
していると判定されたセグメントについてのみ切断区域
の通過位置で分断して左右の部分イメージに分離するよ
うに構成する。
[産業上の利用分野] 本発明は、文字イメージをヘンとツクリ等の左右の部
分イメージに分離して文字を認識する切断分離を伴う文
字認識方法に関する。
光学文字読取装置における文字認識方法にあっては、
漢字、仮名等の字種を問わず、1つの文字全体のイメー
ジについて認識する方法が取られている。
一方、漢字認識については、1つの漢字が例えばヘン
とツクリで構成されている場合には、1つの文字イメー
ジを左右に分離してヘンとツクリの部分イメージを作成
し、部分イメージ毎に文字認識を行ない、部分イメージ
の認識結果の統合により1つの漢字としての文字イメー
ジを認識する方法が取られ、部分イメージに細分化する
ことでより精密な認識処理を可能にしている。
この部分イメージに分離して認識する方法は、文字イ
メージが左右の部分イメージに明確に分離されている場
合に精密な認識結果を得ることができるが、実際に処理
する文字イメージにあっては、左右に分離しようとする
ヘンとツクリが接触している場合が多く見られ、ヘンと
ツクリが接触した文字イメージであっても、部分イメー
ジに分離して認識精度を向上することが望まれる。
[従来の技術] 第9図はヘンとツクリが接触した文字イメージを部分
イメージに分離して認識する従来方法を示した説明図で
ある。
第9図において、例えば「林」の文字イメージ10を例
にとると、まず文字イメージ10に対する縦方向のヒスト
グラム12を作成し、ヒストグラム12が最小値となる位置
Aを求め、この検出位置Aに切断線14を縦方向に設定し
て文字イメージ10を左右の部分イメージ10−1,10−2、
即ちヘンとツクリに分離し、分離された部分イメージ10
−1,10−2のそれぞれを認識し、この認識結果の統合に
より最終的に1つの文字イメージ10を認識する。
[発明が解決しようとする課題] しかしながら、このような従来の文字イメージをヒス
トグラムに基づいて左右の部分イメージに分離する方法
にあっては、文字イメージ10を切断線14の設定により部
分イメージ10−1,10−2に分離した場合、ヘンを示す部
分イメージ10−1の中にツクリを示す部分イメージ10−
2の一部分がノイズ18として含まれ、正確に文字イメー
ジをヘンとツクリの部分イメージに分離することができ
ず、このようなノイズを含む部分イメージを認識しても
精密な認識結果は期待できず、部分イメージに細分化し
て認識しても精密な認識結果が得られない問題があっ
た。
本発明は、このような従来の問題点に鑑みてなされた
もので、部分イメージが接触していても正確に部分イメ
ージに分離して認識処理できる切断分離を伴う文字認識
方法を提供することを目的とする。
[課題を解決するための手段] 第1図は本発明の原理説明図である。
第1図において、まず本発明は、入力された文字イメ
ージ10を少なくとも左右の部分イメージ10−1,10−2に
分離し、該部分イメージ10−1,10−2毎の認識結果を統
合して文字を認識する文字認識方法を対象とする。
このような文字認識方法について本発明にあっては、
部分イメージ10−1,10−2が接触した文字イメージ10に
ついて縦方向の画素密度分布を示すヒストグラム12を作
成し、ヒストグラム12における左右の部分イメージ毎の
最大値位置(Max1,Max2)及びその中間位置M1を求め
る。
次に、ヒストグラム最大値位置(Max1,Max2)の範囲
内で文字イメージ10を所定の等間隔で縦方向に分割し、
各分割区域を文字イメージ10が横切る文字本数及び文字
幅を検出する。
続いて、文字イメージ10が横切る本数が最小で、且つ
前記文字幅が所定値H以下で、更に前記ヒストグラム中
間位置M1になるべく近い分割区域の位置Bを検索して切
断区域に設定する。
次に、切断区域(位置B)を中心に所定範囲で文字イ
メージ10をラベリングして複数のセグメント16a〜16dに
区分し、区分セグメント16a〜16dのうち切断区域を通過
するセグメント16b,16dを抽出してラベリング範囲で連
続しているか分断されているかを判定し、連続している
と判定されたセグメント16bについてのみ切断線14の通
過位置C、即ち切断区域Bの通過位置でセグメント16b
を分断して左右の部分イメージ10−1,10−2に分離す
る。
[作用] このような処理を行なう本発明の切断分離を伴う文字
認識方法によれば、ヘンとツクリが接触した文字イメー
ジであっても、接触部分又はその近傍で正確にヘンとツ
クリに切断分離した部分イメージを作り出すことがで
き、部分イメージに細分化して認識処理する文字イメー
ジの割合を高め、全体的な文字認識の精度を向上するこ
とができる。
[実施例] 第2図は本発明の切断分離を伴う文字認識方法が採用
された光学式文字読取装置の一実施例を示した実施例構
成図である。
第2図において、22はマイクロプロセッサであり、マ
イクロプロセッサ22の指示によりイメージスキャナ24で
光学的に読み取られた文字イメージが画像格納用共用メ
モリ26に転送される。画像格納用共用メモリ26に対する
文字イメージの格納が終了するとマイクロプロセッサ22
は文字切出し処理部28を起動し、文字切出し処理部28に
よって画像格納用共用メモリ26内の文字イメージについ
て個々の文字イメージが切出され、文字イメージメモリ
30に転送される。
続いて、マイクロプロセッサ22は認識処理部32を起動
し、文字イメージメモリ30に格納されている個々の文字
イメージについて文字認識処理を行なう。この認識処理
部32による文字認識の処理中に、部分イメージに分離不
能な文字イメージを判定した場合には、マイクロプロセ
ッサ22は切断・分離プログラム34を起動し、この切断・
分離プログラム34によって本発明の切断分離を伴う文字
認識方法に従った処理が行なわれる。即ち、切断・分離
プログラム34は部分イメージに分離不能な文字イメージ
をワークメモリ36に格納し、このワークメモリ36に格納
した文字イメージに対し、後の説明で明らかにする本発
明の文字認識方法に従った処理を実行して文字イメージ
を部分イメージに切断分離し、切断分離した部分イメー
ジを再び文字イメージメモリ30に転送し、文字イメージ
メモリ30に転送された部分イメージについて認識処理部
32による文字認識処理を実行し、部分イメージの認識結
果の統合により最終的な文字認識結果を得るようにな
る。
次に、第3図乃至第7図を参照して本発明の文字認識
方法による処理ステップを説明する。
今、第3図に示すように文字イメージ10として、ヘン
とツクリの「木」のそれぞれの部分イメージが接点Aで
接触した分離不能な文字イメージ「林」を処理対象とし
て取り出したものとする。
このようなヘンとツクリの部分イメージに分離不能な
文字イメージ10につき、まず本発明にあっては、文字イ
メージ10の縦方向の画素分布密度を示すヒストグラム12
を作成する。このようにヒストグラム12が作成されたな
らば、ヘンの部分イメージ10−1とツクリの部分イメー
ジ10−2の各範囲について、それぞれの画素密度が最大
値となる位置を求める。即ち、ヘンの部分イメージの範
囲におけるヒストグラム最大値の位置をMax1、ツクリの
部分イメージの範囲におけるヒストグラム最大値の位置
をMax2として求める。更に、部分イメージ10−1,10−2
におけるヒストグラム最大値の位置Max1とMax2の中間位
置をM1として求める。
次に、第4図に示すように、ヘンの部分イメージ10−
1におけるヒストグラム最大値の位置Max1からツクリの
部分イメージ10−2のヒストグラム最大値の位置Max2の
範囲内で縦方向に等間隔で分割し、各分割区域を文字イ
メージ10が横切る本数及び分割区域を横切る文字イメー
ジの文字幅を求める。尚、各分割区域を文字イメージ10
が横切る文字幅は、各分割区域内における第3図に示し
たヒストグラム12の平均値で表すことができる。
次に、第4図に示すように文字イメージ10に対する分
割区域に対する本数及び文字幅が求められたならば、次
の3つの条件を満足する位置Bを検索する。
(1)文字イメージ10を横切る分割線の本数が最小とな
る位置; (2)分割区域を横切る文字幅、即ち縦方向の画素密度
が予め設定した所定値Hよりも小さくなる位置; (3)第3図で求めたヒストグラム中間位置M1になるべ
く近い位置; このような前記(1)〜(3)の条件を全て満足する
位置として、第4図の場合には矢印で示す位置Bを検索
することができる。
次に、第5図に示すように第4図で求めた位置Bを中
心に左右の一定の範囲についてラベリング処理を行な
い、このラベリング処理によりラベリング範囲に属する
各セグメントを区分する。第5図の場合には位置Bを中
心に左右に設定したラベリング範囲におけるラベリング
処理により、この場合には16a,16b,16c及び16dの4つの
セグメントに区分することができる。
このようにして、位置Bを中心とした左右のラベリン
グ範囲に対するラベリング処理によりセグメント16a〜1
6dの区分ができたならば、位置Bに仮想的に設定した切
断線14が通過するセグメント16bと16dについて切断の有
無を判定する。
この切断線14の設定によるセグメント16bと16dの切断
有無の判定は、セグメント16b,16dがラベリング範囲内
で連続してまたがっているか、ラベリング範囲の途中で
分断されているかによって判断する。即ち、 (イ)切断線14が通過するセグメントがラベリング範囲
で連続してまたがっているときには、切断対象セグメン
トと判定; (ロ)切断線14が通過するセグメントがラベリング範囲
の途中で分断されているときには切断対象外セグメント
と判定; とする。このため第5図の場合には切断線14が通過する
上側のセグメント16bは、ラベリング範囲で連続してま
たがっていることから切断対象セグメントとして判定さ
れ、セグメント16bを通る切断線14の位置でセグメント1
6bを左右のセグメントに分断する。
一方、下側のセグメント16dにあっては、セグメント
の左下側がラベリング範囲の途中で分断されていること
から、切断対象セグメントから除外される。
第6図は、第5図の判定処理によりセグメント16bを
切断線14の通過位置で切断位置Cに示すように左右のセ
グメントに分断した状態を示しており、この結果、第3
図に示したヘンとツクリの部分イメージ10−1,10−2が
接触していた文字イメージ10は正常に分離可能な文字イ
メージに変換することができる。
続いて、第6図のように左右の部分イメージ10−1,10
−2に分断された文字イメージ10についてラベリング処
理を施すことにより、第7図に示すように文字イメージ
10をヘンの部分イメージ10−1とツクリの部分イメージ
10−2に分離することができ、各部分イメージ10−1,10
−2について文字認識処理を適用することでヘンの部分
となる認識結果が得られ、一方、ツクリの部分は「木」
となる認識結果が得られ、この認識結果の統合により文
字イメージ10は「林」であることを最終的に認識するこ
とができる。
次に、第2図の実施例構成図を付図とし、第8A,8B,8
C,8D図の動作フロー図を参照して本発明の文字認識方法
による制御処理を詳細に説明する。
まず、第8A図において、ステップS1でイメージスキャ
ナ24から文字イメージを入力して画像格納用共用メモリ
26に格納し、続いてステップS2で文字切出し処理部28が
画像格納用共用メモリ26から一文字づつ切出して文字イ
メージメモリ30に転送する。
続いて、ステップS3で全ての文字切出しが終了したか
否かチェックしており、全ての文字切出しが終了すれ
ば、一連の処理は終了する。一方、全ての文字切出しが
終了していなければ文字切出し毎にステップS3からステ
ップS4に進み、文字イメージメモリ30から1つの文字イ
メージを入力し、認識処理部32においてステップS5で入
力文字について認識処理が行なわれる。この文字認識処
理において、ステップS6で認識結果が左右に分離できる
文字か否か判別し、左右に分離できる文字であれば、ス
テップS7に進み、左右に分離可能な文字イメージについ
て縦方向のヒストグラムを第3図に示したように作成す
る。続いて、ステップS8でヒストグラムについてのヘン
の部分とツクリの部分のそれぞれの最大値を求め、各最
大値の位置をMAX1,MAX2とする。続いて、ステップS9で
ヒストグラム最大値の位置MAX1とMAX2の中間位置をM1と
して検出する。以上が第3図に示した処理である。
続いて、第8B図のステップS10に進み、ヒストグラム
の中にゼロとなる位置があるか否か、即ちヘンとツクリ
が離れているか否かをチェックする。即ち、ヒストグラ
ムの中にゼロとなる位置があれば、ヘンとツクリは左右
に離れていることからステップS18に進み、ヘンとツク
リの部分イメージにそれぞれ分離する。一方、ヒストグ
ラムの値がゼロとなる位置がない場合はヘンとツクリが
接触しているか、あるいは縦方向で交差していることか
ら、ステップS11に進んでラベリング処理を行ない、ヘ
ンとツクリの分離を試みてステップS12でヘンとツクリ
が分離できるか否かチェックする。即ち、ヘンとツクリ
が縦方向で接触せずに交差している場合には、ラベリン
グ処理によりヘンとツクリの分離ができることから、こ
の場合にはステップS12からステップS18に進んでヘンと
ツクリの部分イメージにそれぞれ分離する。一方、ラベ
リングによりヘンとツクリに分離できない場合にはヘン
とツクリが接触していることから、ステップS13に進ん
でヘンの部分のヒストグラムの最大値から切出し条件を
決める所定値を変数Hとして設定する。例えば、変数H
としてはヘンの部分のヒストグラム最大値の3分の1程
度の値を設定すれば良い。
次に、ステップS14に進んでヘンの部分のヒストグラ
ム最大値の位置MAX1からツクリの部分のヒストグラム最
大値の位置MAX2までの範囲を第4図に示したように縦方
向に等分割する。続いて、ステップS15で各区分された
範囲で縦方向について文字イメージの線の本数(線密
度)と各線の幅を全ての縦分割された区分について調べ
る。
次に、ステップS16でステップS15で検索された縦方向
の分割範囲に属する文字イメージの線の本数が最小で且
つヒストグラム中間位置M1の位置になるべく近い区分、
即ち位置Bを選ぶ。これは第4図の位置Bとなる。
続いて、ステップS17において、位置Bのヒストグラ
ムの値(画素密度)がステップS13で設定した変数Hよ
り小さいか否かを判定する。位置Bのヒストグラムの値
が変数Hより大きければ切出し不能として一連の処理を
終了する。一方、位置Bのヒストグラムが変数Hより小
さいときにはステップS19に進み、位置Bから左右方向
にある範囲でラベリング処理を行なう。即ち、第5図に
示すラベリング範囲でラベリング処理を行なう。続い
て、ステップS20で位置Bの縦方向について存在するセ
グメント、即ち位置Bを通過するセグメントを調べる。
続いて、ステップS21において位置Bを通過するセグ
メントを1つ調べる毎にステップS22に進み、ラベリン
グした範囲内においてセグメントが横方向に連続してま
たがって存在しているかどうかを調べる。ステップS23
で、例えば第5図のセグメント16dのように連続してま
たがっていない場合には、ステップS25に進んで次のセ
グメントを調べる。一方、第5図のセグメント16bのよ
うにセグメントがラベリングした範囲内に連続してまた
がっている場合にはステップS24に進み、セグメントを
位置B、即ち切断線14を設定した箇所で切断する。
ステップS22〜S25による全てのセグメントについての
処理が終了するとステップS21からステップS26に進み、
切断したセグメントがあるか否かチェックする。切断し
たセグメントがなければ分離不能として一連の処理を終
了し、一方、切断したセグメントがあれば第8D図のステ
ップS27に進み、セグメントを切断した文字イメージに
ついてラベリング処理を行なう。そして、次のステップ
S28でラベリングした文字イメージについてヘンとツク
リの分離を試行し、ステップS29でヘンとツクリの部分
に分離できれば、ステップS30に進んでヘンとツクリの
部分イメージをそれぞれ認識し、ステップS31で最終的
にヘンとツクリのそれぞれの認識結果を統合して元の文
字イメージの認識結果とし、ステップS32で次の文字イ
メージの処理へ進み、第8A図のステップS3に戻る。
尚、上記の実施例はヘンとツクリでなる左右の部分イ
メージに分離可能な漢字イメージを例にとるものであっ
たが、左右の部分イメージによって構成される文字であ
れば、適宜の文字イメージにつき本発明をそのまま適用
することができる。
[発明の効果] 以上説明してきたように本発明によれば、文字イメー
ジを構成する左右の文字イメージ、例えばヘンとツクリ
が接触していても、正確に左右の部分イメージに切断分
離して各部分イメージの認識結果の統合によって文字イ
メージを正確に認識することができ、文字認識精度を大
幅に向上することができる。
【図面の簡単な説明】
第1図は本発明の原理説明図; 第2図は本発明の方法が適用される光学文字読取装置の
実施例構成図; 第3図は本発明のヒストグラム作成処理説明図; 第4図は本発明の縦分割処理説明図; 第5図は本発明のセグメント区分処理説明図; 第6図は本発明の分断処理説明図; 第7図は本発明の部分イメージ分離認識の処理説明図; 第8A乃至8D図は本発明の動作フロー図; 第9図は従来方法の説明図である。 図中、 10:文字イメージ 10−1:部分イメージ(ヘン) 10−2:部分イメージ(ツクリ) 12:ヒストグラム 14:切断線 22:マイクロプロセッサ 24:イメージスキャナ 26:画像格納用共用メモリ 28:文字切出し処理部 30:文字イメージメモリ 32:認識処理部 44:切断・分離プログラム 36:ワークメモリ

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された文字イメージ(10)を少なくと
    も左右の部分イメージ(10-1,10-2)に分離し、該部分
    イメージ(10-1,10-2)毎の認識結果を統合して文字を
    認識する文字認識方法に於いて、 部分イメージ(10-1,10-2)が接触した文字イメージ(1
    0)について縦方向の画素密度分布を示すヒストグラム
    (12)を作成して左右の部分イメージ(10-1,10-2)毎
    の最大値位置(Max1,Max2)及び該最大値位置(Max1,Ma
    x2)の中間位置(M1)を求め、 前記ヒストグラム最大値位置(Max1,Max2)の範囲内で
    前記文字イメージ(10)を所定等間隔で縦方向に分割
    し、該分割区分毎に含まれる文字イメージ(10)の本数
    及び文字幅を検出し、 前記本数が最小で且つ前記文字幅が所定値(H)以下で
    更に前記ヒストグラム中間位置(M1)になるべく近い分
    割区分位置(B)を検索し、 該検索位置(B)を中心に所定範囲で前記文字イメージ
    (10)をラベリングして複数のセグメント(16a〜16d)
    に区分し、 該区分セグメント(16a〜16d))のうち前記検索位置
    (B)を横切るセグメント(16b,16c)を抽出して前記
    ラベリング範囲で連続しているか分断されているかを判
    定し、連続していると判定されたセグメント(16b)に
    ついてのみ前記検索位置(B)で該セグメント(16b)
    を切断して左右の部分イメージ(10-1,10-2)に分離す
    ることを特徴とする切断分離を伴う文字認識方法。
JP63209881A 1988-08-24 1988-08-24 切断分離を伴う文字認識方法 Expired - Lifetime JP2615153B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63209881A JP2615153B2 (ja) 1988-08-24 1988-08-24 切断分離を伴う文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63209881A JP2615153B2 (ja) 1988-08-24 1988-08-24 切断分離を伴う文字認識方法

Publications (2)

Publication Number Publication Date
JPH0258186A JPH0258186A (ja) 1990-02-27
JP2615153B2 true JP2615153B2 (ja) 1997-05-28

Family

ID=16580192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63209881A Expired - Lifetime JP2615153B2 (ja) 1988-08-24 1988-08-24 切断分離を伴う文字認識方法

Country Status (1)

Country Link
JP (1) JP2615153B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4392907B2 (ja) * 1999-07-30 2010-01-06 株式会社東芝 文字切出し方法
KR100926823B1 (ko) * 2007-12-05 2009-11-12 황병익 문자 인식 방법

Also Published As

Publication number Publication date
JPH0258186A (ja) 1990-02-27

Similar Documents

Publication Publication Date Title
CN106940799B (zh) 文本图像处理方法和装置
Lu et al. Salient object detection using concavity context
US5872870A (en) Machine vision methods for identifying extrema of objects in rotated reference frames
EP3686798B1 (en) Learning method and learning device for objet detector based on cnn
US5859929A (en) System for character preserving guidelines removal in optically scanned text
JPH0620092A (ja) 文書画像の領域識別方法
CN106815824B (zh) 一种提高大规模三维重建效率的图像近邻优化方法
JPH06348896A (ja) 文字の切り出し方法及びその装置
JPH05225378A (ja) 文書画像の領域分割システム
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
JP2615153B2 (ja) 切断分離を伴う文字認識方法
JP2926066B2 (ja) 表認識装置
Mithila et al. CNN and Fuzzy Rules Based Text Detection and Recognition from Natural Scenes.
Tehsin et al. A caption text detection method from images/videos for efficient indexing and retrieval of multimedia data
Wang et al. Fine-grained remote sensing semantic segmentation method under multi-stage supervision learning
JPS6257069A (ja) 文字列抽出方式
Soni et al. Text region extraction from scene images using agf and mser
KR950011065B1 (ko) 문자 인식방법
US20230245208A1 (en) System and method for validating product photography
JP2792655B2 (ja) 手書き数字認識における下線処理方法
Chithra et al. Extraction of exclusive video content from one shot video
JPS62271190A (ja) セグメント数字認識方式
CN115471830A (zh) 一种基于计算机视觉的图书馆典藏方法
KR20230062164A (ko) 이미지 기반 테이블 구조 분석 방법, 장치 및 컴퓨터 프로그램
JPH0259979A (ja) 文書画像処理装置