JPH05182027A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05182027A
JPH05182027A JP4018274A JP1827492A JPH05182027A JP H05182027 A JPH05182027 A JP H05182027A JP 4018274 A JP4018274 A JP 4018274A JP 1827492 A JP1827492 A JP 1827492A JP H05182027 A JPH05182027 A JP H05182027A
Authority
JP
Japan
Prior art keywords
character
cut
line
cutout
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4018274A
Other languages
English (en)
Inventor
Yoshimasa Asougawa
佳誠 麻生川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP4018274A priority Critical patent/JPH05182027A/ja
Publication of JPH05182027A publication Critical patent/JPH05182027A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 文字認識装置に関し、特に入力文書画像デー
タの1行分の文書画像データから1文字を切り出し認識
する際、1文字の切り出し位置を決定する処理速度を向
上する。 【構成】 制御装置1は1行分の文書画像から1文字を
切り出し認識する時に、切り出し・制御プログラムRO
M5の切り出し・制御プログラムに従い、抽出した複数
の切り出し位置候補の中で最も重要度の高い切り出し位
置候補から順に1文字認識部7に認識処理させる。制御
装置1は1文字としての可能性が十分に高い切り出し位
置候補を認識した時点で切り出し位置を決定し、次の文
字の切り出しに入る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に関し、
特に入力文書画像データの1行分の文書画像データから
1文字を切り出し認識する際、1文字の切り出し位置を
決定する処理速度を向上させた文字認識装置に関する。
【0002】
【従来の技術】従来の文字認識装置では、英文に多い文
字ピッチが一定でない文書や、文字が接触している文書
画像、および文字中にとぎれなどの不連続部が存在する
文書画像を認識する方法として、切り出し位置の候補を
複数抽出し、候補点までの画像を1文字と仮定して認識
処理を行ない、1文字として最もよい結果が得られた候
補点を切り出し位置として決定し認識を進めていく方法
が知られている。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た方法では、抽出された切り出し位置候補の数だけ認識
処理を繰返すことになり処理速度が遅くなるという問題
点ある。
【0004】本発明の目的は、このような従来の問題点
に鑑み、入力された文書画像の品質にかかわらずに処理
速度を向上できる文字認識装置を提供することにある。
【0005】
【課題を解決するための手段】本発明の文字認識装置
は、入力文書画像データの1行分の文書画像データ毎に
行内の文字認識処理を行なうため、1行分の文書画像デ
ータから1文字を切り出し認識する際、抽出手段として
の制御装置1、制御装置演算用RAM4および切り出し
・制御プログラムROM5と、優先順位決定手段として
の制御装置1、制御装置演算用RAM4および切り出し
・制御プログラムROM5と、認識・判定手段としての
制御装置1、切り出し・制御プログラムROM5および
1文字認識部7とを備えることを特徴とする。
【0006】
【作用】上記構成の文字認識装置においては、入力文書
画像データの1行分の文書画像データ毎に行内の文字認
識処理を行なうため、1行分の文書画像データから1文
字を切り出し認識する際、制御装置1は切り出し・制御
プログラムROM5の切り出し・制御プログラムに従
い、制御装置演算用RAM4を用いて、切り出し位置候
補と切り出し位置候補までの画像の図形特徴を抽出す
る。次に、制御装置1は切り出し・制御プログラムRO
M5の切り出し・制御プログラムに従い、制御装置演算
用RAM4を用いて、抽出された前記図形特徴から、フ
ァジィ推論を用いて切り出し位置候補の重要度を算出
し、算出した重要度に従って切り出し位置候補の優先順
位を決定する。次に、制御装置1は決定された切り出し
位置候補の優先順位に従って、切り出し位置候補までの
画像を1文字と仮定して1文字認識部7に認識処理を行
なわせる。制御装置1は、切り出し・制御プログラムR
OM5の切り出し・制御プログラムに従い、1文字認識
部7より受け取ったその認識結果より文字らしさが十分
であると判断した場合はその時点でその切り出し位置候
補を切り出し位置として決定し、次の文字の切り出しへ
進む。
【0007】このように1行分の文書画像から1文字を
切り出し認識するときに、抽出した複数の切り出し位置
候補の中で最も重要度の高い切り出し位置候補から認識
処理を行ない、1文字としての可能性が十分に高い切り
出し候補を認識した時点で、切り出し位置、認識結果を
決定し、次の文字の切り出しに入ることにより、入力さ
れた文書画像の品質にかかわらずに、処理速度を向上さ
せることができる。
【0008】
【実施例】次に本発明の実施例につき図面を用いて説明
する。図1は、本発明による文字認識装置の一実施例を
示す構成図である。同図において、1は制御装置であっ
て、この制御装置1はバス2を介して通信制御装置3、
制御装置演算用RAM4、切り出し・制御プログラムR
OM5、画像保存用RAM6、1文字認識部7に接続さ
れている。ここに、通信制御装置3は図示しない入力手
段からの1行文字画像を受取り、1行認識結果を出力す
るものである。切り出し・制御プログラムROM5は、
切り出し・制御プログラムが格納されたROMである。
画像保存用RAM6は、1行文字画像などをを保存して
おくRAMである。1文字認識部7は1文字としての切
り出し候補点までの画像に対し認識処理を行なうもので
ある。
【0009】次に全体の動作について図2を用いて説明
する。なお、図2は、本発明の文字認識装置の一実施例
を示す全体の動作フローチャートである。
【0010】文字認識装置では、切り出し・制御プログ
ラムに従い、入力された文書画像データに対し、行の切
り出しを行なう(ステップS1)。切り出したある行領
域の行の高さが大きすぎるか否かをチェックし、大きす
ぎるときは次の行の切り出しを行ない(ステップS2、
S6、S1)、大きすぎないときは行内認識を行なう
(ステップS3)。ステップS3では、切り出し・制御
プログラムに従って、切り出したある行領域(1行文字
画像データ)に対する行内認識処理を行なう。次に所定
の後処理を行ない(ステップS4)、1行認識結果を表
示装置に表示させる(ステップS5)。この後、次の行
の切り出しを行なう(ステップS6、S1)。
【0011】以下、入力文書画像データのすべての行に
つき、前述したと同様の動作を繰返す(ステップS1〜
S6)。
【0012】次に図2のステップS3の行内認識につい
て図3を用いて説明する。なお、図3は本発明の文字認
識装置の一実施例を示す要部動作フローチャートであ
り、特に図2のステップS3の行内認識の一実施例を示
す動作フローチャートである。
【0013】図示しない入力手段により切り出した1行
分の文書画像(1行文字画像)データが通信制御装置3
に供給される(ステップS11)。制御装置1は文書画
像データを通信制御装置3より取り込み画像保存用RA
M6に格納する。
【0014】次に、入力された1行分の文書画像データ
(ここでは、水平方向の行を例にとるものとする。)に
対し行内の文字認識処理を行なうため、1行分の文書画
像データから1文字を切り出し認識する際、制御装置1
は切り出し・制御プログラムROM5の切り出し・制御
プログラムに従い、切り出し位置候補と切り出し位置候
補までの画像の図形特徴を抽出する(ステップS1
2)。制御装置1は、切り出し位置候補を抽出に当り、
画像保存用RAM6に格納された1行分の文書画像デー
タに対して、まず左端から一定範囲内の切り出し位置候
補を抽出する。ここでは、切り出し位置候補を、候補画
像の濃度投影値が周辺よりも小さいところとしている。
【0015】次に、制御装置1は、切り出し・制御プロ
グラムROM5の切り出し・制御プログラムに従い、抽
出された切り出し位置候補までの画像の図形特徴から、
ファジィ測度によりそれぞれの切り出し位置候補の重要
度を算出し、切り出し位置候補の優先順位、有効候補数
(ここでは、有効候補数を4個とする。)を決定する
(ステップS13)。ここでは、切り出し位置候補まで
の画像の図形特徴として、行高さに対する切り出し位置
候補までの画像の幅、切り出し候補点(切り出し位置候
補)での投影値、切り出し位置候補の左側からの順番を
用いている。
【0016】次に、制御装置1は切り出し位置候補(切
り出し候補点)の優先順位に従って、切り出し位置候補
までの画像を、それぞれ1文字と仮定して1文字認識部
7に渡す。1文字認識部7は、制御装置1より切り出し
位置候補(切り出し候補点)の優先順位に従って渡され
る切り出し位置候補までの画像の認識処理をする(ステ
ップS14)。
【0017】制御装置1は、切り出し・制御プログラム
ROM5の切り出し・制御プログラムに従い、1文字認
識部7より認識結果を受取り、認識した結果の文字らし
さ(類似度、距離)が十分に高い可能性を与えた場合は
その切り出し位置候補(切り出し候補点)を切り出し位
置として決定し、次の文字切り出しに進む(ステップS
15、S18、S12)。
【0018】また、制御装置1は切り出し・制御プログ
ラムROM5の切り出し・制御プログラムに従い、ステ
ップS15で認識結果の文字らしさが十分に高い可能性
を与えない場合は、認識結果の文字らしさが十分に高い
可能性を与えるまで、切り出し位置候補(切り出し候補
点)の優先順位に従って、切り出し位置候補までの画像
を1文字認識部7に与え認識処理させる。そして、制御
装置1は切り出し・制御プログラムROM5の切り出し
・制御プログラムに従い、1文字認識部7より認識結果
を受取りその認識結果の文字らしさが十分に高い可能性
を与えるならば、次の文字切り出しへ進む(ステップS
15、更にS16、S14、S15の繰返し、S18、
S12)。
【0019】また、制御装置1は切り出し・制御プログ
ラムROM5の切り出し・制御プログラムに従い、有効
候補(有効な切り出し位置候補)のすべて(ここでは、
4個の有効候補)を認識評価しても、十分な可能性を与
える有効候補が得られなかった場合は(ステップS14
〜16の繰返し)、有効候補の中で最も高い可能性を与
えた有効候補を切り出し位置として決定し(ステップS
17)、次の文字切り出しへ進む(ステップS18、S
12)。
【0020】以下同様に図3の処理の流れに従って、順
次、行内の文字の切り出し処理を行なう(ステップS1
2〜S18の繰返し)。そして、1行分の文字画像の文
末まで文字の切り出し処理を終ったら、制御装置1は1
行の認識結果を通信制御装置3を介して表示装置などへ
出力する(ステップS18、S19)。
【0021】次に、図3のステップS13で切り出し位
置候補(切り出し候補点)までの画像の図形特徴から、
ファジィ推論を用いてそれぞれの切り出し位置候補の重
要度を算出し、優先順位を決定しているが、この優先順
位の決定について、図4を例に取って具体的に説明す
る。なお、、図4は1行分の文字画像の一部について切
り出し位置候補抽出範囲の画像と濃度投影データ、およ
び切り出し位置の候補の一例を示す図である。
【0022】ここで、切り出し位置候補までの画像の図
形特徴に対するメンバーシップ関数のグラフ例を図5〜
図7に示す。図5は切り出し候補点の左側からの順番
(「順番」と略称する)に対するメンバーシップ関数の
グラフの一例を示す図、図6は切り出し候補点の投影値
(「投影値」と略称する)に対するメンバーシップ関数
のグラフの一例を示す図、図7は行高さに対する切り出
し候補点までの横幅(「幅/行高さ」と略称する)への
評価を与えるメンバーシップ関数のグラフの一例を示す
図である。
【0023】制御装置1は、図3のステップS12で、
図4に示す文字画像に対して7つの切り出し候補点A〜
Gに対する特徴量(図形特徴)を、図8に示す如く抽出
する。なお、図8は、図4で示した7つの切り出し候補
点A〜Gに対する特徴量、即ち左側からの順番(「順
番」と略称する)、切り出し候補点での投影値(「投影
値」と略称する)、行高さに対する切り出し候補点まで
の幅(「幅/行高さ」と略称する)を示す図である。
【0024】制御装置1は、切り出し・制御プログラム
ROM5の切り出し・制御プログラムに従い、図8で示
した特徴量を図5〜図7のメンバーシップ関数で評価
し、図9に示すようなメンバーシップ値(評価値)を得
る。なお、図9は図8で示した特徴量を図5〜図7のメ
ンバーシップ関数で評価した結果を示す図である。
【0025】制御装置1は、切り出し・制御プログラム
ROM5の切り出し・制御プログラムに従い、図9で示
したメンバーシップ値を図10で示した重みを使用して
下記の(1)式により合成し、図11に示す如くそれぞ
れの切り出し候補点A〜Gに対する評価値を算出する。
なお、図10は図9で示したメンバーシップ値を合成す
るための重みを示す図、図11は図9で示したメンバー
シップ値(評価値)を、図10で示した重みを使用して
合成したそれぞれの切り出し候補点に対する評価値(総
合評価値)を示す図である。
【0026】ここに、ある切り出し候補点について、図
11の評価値(総合評価値)をX、また図9の順番、投
影値、幅/行高さの評価値をそれぞれa、b、c、また
図10の順番、投影値、幅/行高さの重みをw1 、w
2 、w3 とすると、図11の評価値(総合評価値)X
は、 X=(a×w1+b×w2+c×w3)/(w1+w2+w3) ・・・(1) より算出される。
【0027】切り出し候補点F、Gは、図9から分かる
ように切り出し候補点での投影値に対する評価値では最
も高いが、総合評価では図11から分かるように5番
目、6番目となって有効候補(ここでは、有効候補を4
個としている。)にならない。また、切り出し候補点B
は図9から分かるように切り出し候補点での投影値に対
する評価値と左からの順番に対する評価で、1番高い評
価を得ているが、総合評価ででは図11から分かるよう
に2番目になっている。
【0028】図11の総合評価の結果によれば、優先順
位は切り出し候補点C、B、A、Dの順番(ここまで
が、有効候補となる。)になり、1番初めに選択すべき
切り出し候補点C(図4参照)がきていることになる。
ステップS14で切り出し候補点Cまでの画像を1文字
と仮定して認識処理をし、その認識処理の結果が、もし
十分に高い評価を与えなくても、有効候補数を4個とし
ているので、最悪でも4回の認識処理で切り出し位置の
決定、認識が終了する(ステップS14〜16を4回、
ステップS17)。
【0029】以上の説明から分かるように、1行分の文
書画像から1文字を切り出し認識するときに、抽出した
複数の切り出し位置候補の中で最も重要度の高い切り出
し位置候補から認識処理を行ない、1文字としての可能
性が十分に高い切り出し位置候補を認識した時点で、切
り出し位置、認識結果を決定し、次の文字の切り出しに
入ることにより、入力された文書画像の品質にかかわら
ずに、処理速度を向上させることができる。
【0030】本発明は、本実施例に限定されることなく
本発明の要旨を逸脱しない範囲で種々の応用および変形
が考えられる。例えば、本発明は、図3のステップS1
2で切り出し位置候補の抽出に当り、本実施例のほか
に、上下から文字画像までの距離データを特徴としてそ
の極大値を与える場所を切り出し位置候補とする方法や
行の上から下まで白画素を追跡した結果パスが見つかっ
た点を切り出し位置候補とする方法などを用いた場合
や、これらの方法を組合わせた場合にも適用できる。
【0031】また、例えば、本発明は、図3のステップ
S13で切り出し位置候補までの画像の図形特徴とし
て、本実施例以外の特徴を用いた場合でも2以上の特徴
を使用する場合には適用できる。
【0032】また、例えば、本実施例においては、図3
のステップS13でファジィ測度により算出したそれぞ
れの切り出し位置候補の重要度に従って有効候補数を4
個としているが、本発明はこれに限定されることなく、
切り出し位置候補の重要度の評価に対してしきい値を設
定することにより有効候補数を決めても(絞っても)よ
い。
【0033】
【発明の効果】上述したように本発明の文字認識装置に
よれば、1行分の文書画像データから1文字を切り出し
認識するときに、優先順位決定手段で決定された切り出
し位置候補の優先順位に従って切り出し位置候補までの
画像を1文字と仮定して認識処理を行ない、その認識結
果により1文字としての可能性が十分に高い切り出し位
置候補を得た時点で、切り出し位置、認識結果を決定
し、次の文字の切り出しに入るようにしたので、入力さ
れた文書画像の品質にかかわらずに、処理速度を向上さ
せることができるなどの効果を奏する。
【図面の簡単な説明】
【図1】本発明による文字認識装置の一実施例を示す構
成図である。
【図2】本発明の文字認識装置の一実施例を示す全体の
動作フローチャートである。
【図3】図3は本発明の文字認識装置の一実施例を示す
要部動作フローチャートである。
【図4】切り出し位置候補抽出範囲の画像と濃度投影デ
ータ、および切り出し位置の候補の一例を示す図であ
る。
【図5】切り出し候補点の左側からの順番に対するメン
バーシップ関数のグラフの一例を示す図である。
【図6】切り出し候補点の投影値に対するメンバーシッ
プ関数のグラフの一例を示す図である。
【図7】行高さに対する切り出し候補点までの横幅への
評価を与えるメンバーシップ関数のグラフの一例を示す
図である。
【図8】図4で示した7つの切り出し候補点A〜Gに対
する特徴量を示す図である。
【図9】図8で示した特徴量を図5〜図7のメンバーシ
ップ関数で評価した結果を示す図である。
【図10】図9で示したメンバーシップ値を合成するた
めの重みを示す図である。
【図11】図9で示したメンバーシップ値を、図10で
示した重みを使用して合成したそれぞれの切り出し候補
点に対する評価値を示す図である。
【符号の説明】
1 制御装置 4 制御装置演算用RAM 5 切り出し・制御プログラムROM 6 画像保存用RAM 7 1文字認識部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力文書画像データの1行分の文書画像
    データ毎に行内の文字認識処理を行なう行内認識手段を
    有する文字認識装置において、 前記行内認識手段は、 前記1行分の文書画像データから1文字を切り出し認識
    する際、切り出し位置候補と切り出し位置候補までの画
    像の図形特徴を抽出する抽出手段と、 前記抽出手段で抽出された前記図形特徴から、ファジィ
    推論を用いて切り出し位置候補の重要度を算出し、算出
    した重要度に従って切り出し位置候補の優先順位を決定
    する優先順位決定手段と、 前記優先順位決定手段で決定された切り出し位置候補の
    優先順位に従って切り出し位置候補までの画像を1文字
    と仮定して認識処理を行ない、その認識結果により切り
    出し位置候補を決定する認識・判定手段とを備えたこと
    を特徴とする文字認識装置。
JP4018274A 1992-01-06 1992-01-06 文字認識装置 Pending JPH05182027A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4018274A JPH05182027A (ja) 1992-01-06 1992-01-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4018274A JPH05182027A (ja) 1992-01-06 1992-01-06 文字認識装置

Publications (1)

Publication Number Publication Date
JPH05182027A true JPH05182027A (ja) 1993-07-23

Family

ID=11967070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4018274A Pending JPH05182027A (ja) 1992-01-06 1992-01-06 文字認識装置

Country Status (1)

Country Link
JP (1) JPH05182027A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01277989A (ja) * 1988-04-28 1989-11-08 Nippon Telegr & Teleph Corp <Ntt> 文字列パターン読み取り装置
JPH03225579A (ja) * 1990-01-31 1991-10-04 Mitsubishi Electric Corp 文字パターン切り出し装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01277989A (ja) * 1988-04-28 1989-11-08 Nippon Telegr & Teleph Corp <Ntt> 文字列パターン読み取り装置
JPH03225579A (ja) * 1990-01-31 1991-10-04 Mitsubishi Electric Corp 文字パターン切り出し装置

Similar Documents

Publication Publication Date Title
US6385338B1 (en) Image processing method and apparatus
US20160125275A1 (en) Character recognition device, image display device, image retrieval device, character recognition method, and computer program product
US7609847B2 (en) Methods and systems for determining object layouts
CN111582021A (zh) 场景图像中的文本检测方法、装置及计算机设备
CN109948533B (zh) 一种文本检测方法、装置、设备及可读存储介质
JPH1139428A (ja) 文書映像の方向修正方法
JP3814320B2 (ja) 画像処理方法及び装置
JP2991779B2 (ja) 文字認識方法及び装置
CN111652141A (zh) 基于题号和文本行的题目分割方法、装置、设备和介质
CN108446702A (zh) 一种图像字符分割方法、装置、设备及存储介质
CN112434640B (zh) 确定文档图像的旋转角度方法、装置及存储介质
JP3009078B2 (ja) 文字認識装置
EP0471472A2 (en) Image processing method and apparatus therefor
JPH05182027A (ja) 文字認識装置
CN113326844A (zh) 视频字幕添加方法、装置、计算设备及计算机存储介质
CN112183253A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
JP3026751B2 (ja) 画像切出方法及び装置
CN112749599A (zh) 图像增强方法、装置和服务器
JP2812391B2 (ja) パターン処理方法
JP2675303B2 (ja) 文字認識方法
JP3462960B2 (ja) 画像処理方法
CN114764916A (zh) 文本识别处理方法、装置及相关设备
US10878271B2 (en) Systems and methods for separating ligature characters in digitized document images
JPH0816719A (ja) 文字切り出し方法とこれを用いた文字認識方法及び装置
JP3074691B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19971216