JPH064703A - 文字認識方法および文字認識装置 - Google Patents

文字認識方法および文字認識装置

Info

Publication number
JPH064703A
JPH064703A JP4166294A JP16629492A JPH064703A JP H064703 A JPH064703 A JP H064703A JP 4166294 A JP4166294 A JP 4166294A JP 16629492 A JP16629492 A JP 16629492A JP H064703 A JPH064703 A JP H064703A
Authority
JP
Japan
Prior art keywords
character string
character
image
upright
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4166294A
Other languages
English (en)
Inventor
Minoru Takakura
穂 高倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4166294A priority Critical patent/JPH064703A/ja
Publication of JPH064703A publication Critical patent/JPH064703A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 斜字文字列を含む文書でも文字列から正しく
文字を切り出すことができると共に、斜字の認識誤りを
防止できる文字認識方法および文字認識装置を提供す
る。 【構成】 正立文字列判定部4は、文字列切り出し部3
により切り出された文字列画像の全部または一部を文字
列方向と垂直に走査して文字部を形成する画素のヒスト
グラムを抽出し、抽出したヒストグラムを用いて正立文
字列であるか否かを判定する。文字列傾斜部5は、正立
文字列判定部4により正立文字列でないと判断された文
字列画像をずらし変形させて文字の傾斜角度が相互に異
なる複数の文字列画像を得る。正立文字列選択部6は、
文字列傾斜部5によりずらし変形された複数の文字列画
像に対し、文字列方向と垂直に文字列画像を走査して文
字部を形成する画素のヒストグラムを抽出し、抽出した
ヒストグラムを用いて複数の文字列画像から正立文字列
を選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識方法および文
字認識装置に関するものである。
【0002】
【従来の技術】従来の文字認識装置は、例えば秋山他
「印刷物の記事領域における文字の切り出し」PRL8
0−70に開示されているように、切り出した文字列画
像に対して、文字列方向に垂直に文字列画像を走査して
文字部を形成する画素のヒストグラムを抽出し、そのヒ
ストグラムを用いて文字間の余白を検出し、その位置で
文字列に垂直な直線に沿って文字列画像を分離して文字
の切り出しを行う構成であった。
【0003】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、文字列画像を文字列方向と垂直に走査して
得た文字部を形成する画素のヒストグラムを用いて文字
列から文字の切り出しを行うので、斜字で構成された文
字列の場合、各文字を構成する画素のヒストグラムに重
なりがあるため文字の区切りが不明確となり、文字の切
り出しに誤りを生じ易いという問題があった。さらに、
切り出された文字は斜字であるため、辞書の標準字形と
大きく異なっており、認識誤りを起こし易いという問題
もあった。
【0004】本発明はかかる事情に鑑みて成されたもの
であり、斜字文字列を含む文書でも文字列から正しく文
字を切り出すことができると共に、斜字の認識誤りを防
止できる文字認識方法および文字認識装置を提供するこ
とを目的とする。
【0005】
【課題を解決するための手段】請求項1の発明は、入力
された画像から認識対象文字を含む文字列を切り出す文
字列切り出しステップと、この文字列切り出しステップ
において切り出された文字列画像の全部または一部を文
字列方向と垂直に走査して文字部を形成する画素のヒス
トグラムを抽出し、抽出したヒストグラムを用いて正立
文字列であるか否かを判定する正立文字列判定ステップ
と、この正立文字列判定ステップにおいて正立文字列で
ないと判断された文字列画像をずらし変形させて文字の
傾斜角度が相互に異なる複数の文字列画像を得る文字列
斜傾ステップと、この文字列斜傾ステップにおいてずら
し変形された複数の文字列画像に対し、文字列方向と垂
直に文字列画像を走査して文字部を形成する画素のヒス
トグラムを抽出し、抽出したヒストグラムを用いて複数
の文字列画像から正立文字列を選択する正立文字列選択
ステップと、前記正立文字列判定ステップにおいて正立
文字列であると判断された文字列画像および前記正立文
字列選択ステップにおいて選択された文字列画像に対
し、文字列方向と垂直に文字列画像を走査して文字部を
形成する画素のヒストグラムを抽出し、抽出したヒスト
グラムを用いて文字列画像から認識対象文字を切り出す
文字切り出しステップと、この文字列切り出しステップ
において切り出された認識対象文字を辞書と照合するこ
とにより認識候補を決定する認識ステップとを実行する
ことを特徴としている。
【0006】請求項2の発明は、入力された画像から認
識対象文字を含む文字列を切り出す文字列切り出し部
と、この文字列切り出し部により切り出された文字列画
像の全部または一部を文字列方向と垂直に走査して文字
部を形成する画素のヒストグラムを抽出し、抽出したヒ
ストグラムを用いて正立文字列であるか否かを判定する
正立文字列判定部と、この正立文字列判定部により正立
文字列でないと判断された文字列画像をずらし変形させ
て文字の傾斜角度が相互に異なる複数の文字列画像を得
る文字列斜傾部と、この文字列斜傾部によりずらし変形
された複数の文字列画像に対し、文字列方向と垂直に文
字列画像を走査して文字部を形成する画素のヒストグラ
ムを抽出し、抽出したヒストグラムを用いて複数の文字
列画像から正立文字列を選択する正立文字列選択部と、
前記正立文字列判定部により正立文字列であると判断さ
れた文字列画像および前記正立文字列選択部により選択
された文字列画像に対し、文字列方向と垂直に文字列画
像を走査して文字部を形成する画素のヒストグラムを抽
出し、抽出したヒストグラムを用いて文字列画像から認
識対象文字を切り出す文字切り出し部と、この文字列切
り出し部により切り出された認識対象文字を辞書と照合
することにより認識候補を決定する認識部とを備えたこ
とを特徴としている。
【0007】請求項3の発明は、入力された画像から認
識対象文字を含む文字列を切り出す文字列切り出しステ
ップと、指定された領域の文字列画像をずらし変形させ
て文字の傾斜角度が相互に異なる複数の文字列画像を得
る文字列斜傾ステップと、この文字列斜傾ステップにお
いてずらし変形された複数の文字列画像に対し、文字列
方向と垂直に文字列画像を走査して文字部を形成する画
素のヒストグラムを抽出し、抽出したヒストグラムを用
いて複数の文字列画像から正立文字列を選択する正立文
字列選択ステップと、指定された領域以外の領域の文字
列画像および前記正立文字列選択ステップにおいて選択
された文字列画像に対し、文字列方向と垂直に文字列画
像を走査して文字部を形成する画素のヒストグラムを抽
出し、抽出したヒストグラムを用いて文字列画像から認
識対象文字を切り出す文字切り出しステップと、この文
字列切り出しステップにおいて切り出された認識対象文
字を辞書と照合することにより認識候補を決定する認識
ステップとを実行することを特徴としている。
【0008】請求項4の発明は、入力された画像のうち
斜字文字で構成されている領域を使用者が指定するため
の斜字領域指定手段と、入力された画像から認識対象文
字を含む文字列を切り出す文字列切り出し部と、前記斜
字領域指定手段により指定された領域の文字列画像をず
らし変形させて文字の傾斜角度が相互に異なる複数の文
字列画像を得る文字列斜傾部と、この文字列斜傾部によ
りずらし変形された複数の文字列画像に対し、文字列方
向と垂直に文字列画像を走査して文字部を形成する画素
のヒストグラムを抽出し、抽出したヒストグラムを用い
て複数の文字列画像から正立文字列を選択する正立文字
列選択部と、前記斜字領域指定手段により指定されなか
った領域の文字列画像および前記正立文字列選択部によ
り選択された文字列画像に対し、文字列方向と垂直に文
字列画像を走査して文字部を形成する画素のヒストグラ
ムを抽出し、抽出したヒストグラムを用いて文字列画像
から認識対象文字を切り出す文字切り出し部と、この文
字列切り出し部により切り出された認識対象文字を辞書
と照合することにより認識候補を決定する認識部とを備
えたことを特徴としている。
【0009】
【作用】請求項1の発明においては、文字列切り出しス
テップで、入力された画像から認識対象文字を含む文字
列を切り出し、正立文字列判定ステップで、文字列切り
出しステップにおいて切り出された文字列画像の全部ま
たは一部を文字列方向と垂直に走査して文字部を形成す
る画素のヒストグラムを抽出し、抽出したヒストグラム
を用いて正立文字列であるか否かを判定し、文字列斜傾
ステップで、正立文字列判定ステップにおいて正立文字
列でないと判断された文字列画像をずらし変形させて文
字の傾斜角度が相互に異なる複数の文字列画像を得、正
立文字列選択ステップで、文字列斜傾ステップにおいて
ずらし変形された複数の文字列画像に対し、文字列方向
と垂直に文字列画像を走査して文字部を形成する画素の
ヒストグラムを抽出し、抽出したヒストグラムを用いて
複数の文字列画像から正立文字列を選択し、文字切り出
しステップで、正立文字列判定ステップにおいて正立文
字列であると判断された文字列画像および正立文字列選
択ステップにおいて選択された文字列画像に対し、文字
列方向と垂直に文字列画像を走査して文字部を形成する
画素のヒストグラムを抽出し、抽出したヒストグラムを
用いて文字列画像から認識対象文字を切り出し、認識ス
テップで、文字列切り出しステップにおいて切り出され
た認識対象文字を辞書と照合することにより認識候補を
決定する。
【0010】請求項2の発明において、文字列切り出し
部は、入力された画像から認識対象文字を含む文字列を
切り出す。正立文字列判定部は、文字列切り出し部によ
り切り出された文字列画像の全部または一部を文字列方
向と垂直に走査して文字部を形成する画素のヒストグラ
ムを抽出し、抽出したヒストグラムを用いて正立文字列
であるか否かを判定する。文字列斜傾部は、正立文字列
判定部により正立文字列でないと判断された文字列画像
をずらし変形させて文字の傾斜角度が相互に異なる複数
の文字列画像を得る。正立文字列選択部は、文字列斜傾
部によりずらし変形された複数の文字列画像に対し、文
字列方向と垂直に文字列画像を走査して文字部を形成す
る画素のヒストグラムを抽出し、抽出したヒストグラム
を用いて複数の文字列画像から正立文字列を選択する。
文字切り出し部は、正立文字列判定部により正立文字列
であると判断された文字列画像および正立文字列選択部
により選択された文字列画像に対し、文字列方向と垂直
に文字列画像を走査して文字部を形成する画素のヒスト
グラムを抽出し、抽出したヒストグラムを用いて文字列
画像から認識対象文字を切り出す。認識部は、文字列切
り出し部により切り出された認識対象文字を辞書と照合
することにより認識候補を決定する。
【0011】請求項3の発明においては、文字列切り出
しステップで、入力された画像から認識対象文字を含む
文字列を切り出し、文字列斜傾ステップで、指定された
領域の文字列画像をずらし変形させて文字の傾斜角度が
相互に異なる複数の文字列画像を得、正立文字列選択ス
テップで、文字列斜傾ステップにおいてずらし変形され
た複数の文字列画像に対し、文字列方向と垂直に文字列
画像を走査して文字部を形成する画素のヒストグラムを
抽出し、抽出したヒストグラムを用いて複数の文字列画
像から正立文字列を選択し、文字切り出しステップで、
指定された領域以外の領域の文字列画像および正立文字
列選択ステップにおいて選択された文字列画像に対し、
文字列方向と垂直に文字列画像を走査して文字部を形成
する画素のヒストグラムを抽出し、抽出したヒストグラ
ムを用いて文字列画像から認識対象文字を切り出し、認
識ステップで、文字列切り出しステップにおいて切り出
された認識対象文字を辞書と照合することにより認識候
補を決定する。
【0012】請求項4の発明において、斜字領域指定手
段は、入力された画像のうち斜字文字で構成されている
領域を使用者が指定するためのものである。文字列切り
出し部は、入力された画像から認識対象文字を含む文字
列を切り出す。文字列斜傾部は、斜字領域指定手段によ
り指定された領域の文字列画像をずらし変形させて文字
の傾斜角度が相互に異なる複数の文字列画像を得る。正
立文字列選択部は、文字列斜傾部によりずらし変形され
た複数の文字列画像に対し、文字列方向と垂直に文字列
画像を走査して文字部を形成する画素のヒストグラムを
抽出し、抽出したヒストグラムを用いて複数の文字列画
像から正立文字列を選択する。文字切り出し部は、斜字
領域指定手段により指定されなかった領域の文字列画像
および正立文字列選択部により選択された文字列画像に
対し、文字列方向と垂直に文字列画像を走査して文字部
を形成する画素のヒストグラムを抽出し、抽出したヒス
トグラムを用いて文字列画像から認識対象文字を切り出
す。認識部は、文字列切り出し部により切り出された認
識対象文字を辞書と照合することにより認識候補を決定
する。
【0013】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。 (実施例1)図1は本発明の実施例1における文字認識
装置の構成図で、この文字認識装置は、画像入力部1
と、画像メモリ2と、文字列切り出し部3と、正立文字
列判定部4と、文字列傾斜部5と、正立文字列選択部6
と、文字切り出し部7と、認識部8と、辞書9と、表示
部10とを備えている。画像入力部1は、認識対象文字
を含む画像を入力するためのものである。画像メモリ2
は、画像入力部1に入力された入力画像を、文字部を形
成する画素を1、文字以外の背景画素を0とした、2値
データとして蓄える。文字列切り出し部3は、画像メモ
リ2に蓄積された入力画像から認識対象文字を含む文字
列画像を切り出す。正立文字列判定部4は、文字列切り
出し部3により切り出された文字列画像が正立文字で構
成される文字列か否かを判定する。文字列傾斜部5は、
正立文字列判定部4により正立文字列でないと判定され
た文字列画像のずらし変形を行なう。正立文字列選択部
6は、文字列傾斜部5によるずらし変形の結果得られた
複数の傾斜文字列画像から最も正立に近い文字列画像を
選択する。文字切り出し部7は、文字列切り出し部3に
より切り出された文字列画像あるいは正立文字列選択部
6により選択された文字列画像から認識対象文字を切り
出す。認識部8は、文字切り出し部7により切り出され
た認識対象文字のストロークなどの特徴量を求め、あら
かじめ辞書9に登録されている文字の特徴量と照合し、
最も類似した文字を選択する。辞書9は、認識対象の特
徴量を格納している。表示部10は、認識結果を表示す
る。
【0014】次に動作を説明する。画像入力部1に入力
された例えば図2に示すような画像Pは、文字部を形成
する画素を「1」、文字以外の背景画素を「0」とした
2値データとして画像メモリ2に格納される。そして文
字列切り出し部3が、画像メモリ2に蓄えられた画像P
を走査し、画像P全体における文字部を形成する画素の
垂直方向ヒストグラムHv と水平方向ヒストグラムHh
とを求め、それぞれに対し、ヒストグラムの値が1画素
以上である文字部領域の開始座標及び終了座標を求め
る。図2のys1,ys2及びxs1が文字部領域開始座標、
ye1,ye2及びxe1が文字部領域終了座標である。これ
らの座標から、垂直方向の文字間隔長(ysi+1−ysi)
の平均値Ave(ysi+1−ysi)と水平方向の文字間隔
長(xsi+1−xsi)の平均値Ave(xsi+1−xsi)と
を求めて両者を比較し、Ave(ysi+1−ysi)≧Av
e(xsi+1−xsi)の場合は水平方向文字列であると判
断し、Ave(ysi+1−ysi)<Ave(xsi+1−xs
i)の場合は垂直方向文字列であると判断する。図2の
画像Pの場合、Ave(xsi+1−xsi)=0なので水平
方向文字列と判断される。このようにして文字列方向を
決定し、文字列に垂直な方向のヒストグラムから得られ
た文字部領域開始座標および文字部領域終了座標を用い
て、文字列画像Lを取り出して順次正立文字列判定部4
に供給する。図3に切り出した第1の文字列画像L1を
示す。
【0015】これにより正立文字列判定部4が、文字列
画像Lを文字列方向と垂直に走査して、文字部を形成す
る画素のヒストグラムHcを求め、ヒストグラムの値が
1画素以上である文字部領域の開始座標Cs1,Cs2,C
s3,‥,Csn及び終了座標Ce1,Ce2,Ce3,‥,Cen
を求める。これらの座標から水平方向の文字領域長(C
si+1−Csi)の平均値Ave(Csi+1−Csi)を求め、
文字領域長平均値Ave(Csi+1−Csi)が文字列画像
の高さhから求めた基準文字幅Wsと同程度よりも小さ
い場合に、正立文字列であると判断する。すなわち、下
記数1が成立すれば正立文字列であると判断し、成立し
なければ斜字文字列であると判断する。
【0016】
【数1】
【0017】なお上記数1において、kは1より小さい
正の定数である。また基準文字幅Wsは、例えばWs=
文字列の高さhである。図3の文字列画像L1の場合に
は、Ave(Csi+1−Csi)=W≫Wsなので、文字列
画像L1は斜字文字列と判断される。一方、図4の文字
列画像L2の場合には、Ave(Csi+1−Csi)≒Ws
なので、文字列画像L2は正立文字列と判断される。そ
して、正立文字列であると判断した文字列画像Lを文字
切り出し部7に供給し、斜字文字列であると判断した文
字列画像Lを文字列傾斜部5に供給する。
【0018】これにより文字列傾斜部5が、図5のよう
に、斜字文字列からなる文字列画像L1に対し、予め定
められている最大傾斜角Θ(0<Θ<π/2)まで、予
め定められている最小傾斜角θ(0<θ<π/2)毎に
傾斜文字列L1nを生成する。すなわち傾斜角φ=n*
θは下記数2を満足する。
【0019】
【数2】
【0020】図6は文字列傾斜部5が傾斜角φ=n*θ
の傾斜文字列を生成する原理の説明図で、文字列画像L
1のi行目にi*tan(φ)画素の余白を挿入するこ
とにより、文字列画像L1の傾斜角φの傾斜文字列L1
n を生成する。このように生成された図7のL1-2〜L
12 のような傾斜文字列画像は、正立文字列選択部6に
供給される。
【0021】これにより正立文字列選択部6が、供給さ
れた傾斜文字列画像L1n のそれぞれに対し、正立文字
列判定部4と同じ処理を行なう。この段階で、正立文字
列と判断されるものが一つだけであれば、その傾斜文字
列画像を文字切り出し部7に渡す。図7のHc-2 〜Hc2
は、入力された傾斜文字列画像L1n のそれぞれに対し
求めた文字列に垂直な方向のヒストグラムであり、この
場合には、正立文字列判定部4における定数kが充分小
さい場合、傾斜文字列画像L11 のみが正立文字列と判
断される。一方、定数kがある程度大きいと、L11 と
L12 とが正立文字列と判断される。また、文字列の形
態および文字列傾斜部5における定数θによっては、傾
斜文字列画像L1n 中に正立文字列と判断される文字列
画像がないこともある。これらの場合には、傾斜文字列
画像L1n 中から最も正立した文字列画像を選択して文
字切り出し部7に渡す。図8のL’1は、傾斜文字列画
像L1n の内の一つである。すなわち、傾斜文字列画像
に対し、ヒストグラムの値が1画素以上である文字部領
域Cn の数をn(図8の場合には3)、各文字部領域の
開始座標をCs1,Cs2,Cs3,‥,Csn、終了座標をC
e1,Ce2,Ce3,‥,Cenとし、(文字部領域最大座標
Cen−文字部領域最小座標Cs1)の値をW、座標iにお
けるヒストグラムの値をH’ci としたときに、差分の
絶対値の最大値Max(|H’ci −H’ci-1 |)な
どの値を求める。これらの値を全傾斜文字列画像に対し
て求め、以下の条件のいずれか一つあるいはそれらを組
み合わせた条件で最も正立した文字列画像を選択する。
【0022】(1)文字部領域数nが傾斜文字列画像L
1n 中で最も大きい。 (2)(文字部領域最大座標−文字部領域最小座標)の
値Wが傾斜文字列画像L1n 中で最も小さい。 (3)差分の絶対値の最大値Max(|H’ci −H’
ci-1 |)が傾斜文字列画像L1n 中で最も大きい。
【0023】文字切り出し部7には、正立文字列判定部
4により正立文字列と判定された文字列画像、および正
立文字列選択部6により選ばれた最も正立している文字
列画像が順次入力される。図9のL11は文字切り出し
部7に入力される文字列画像である。これにより文字切
り出し部7が、正立文字列選択部6により求められた文
字部領域の開始座標Cs1,Cs2,Cs3,‥,Csnと終了
座標Ce1,Ce2,Ce3,‥,Cenとを用いて、開始座標
と終了座標とにより挟まれた領域を認識対象文字として
切り出す。このとき、文字幅Cei−Csiが基準文字幅W
sと同程度よりも大きい場合には、隣接する文字が接触
していると判断し、個々の文字を切り離す。図10のL
2に接触文字画像を示す。すなわち、接触文字画像で
は、先ず画像の幅wと基準文字幅Wsとの比を求め、最
も近い整数値nを接触文字画像中の文字数とする。開始
座標のより小さい文字からC1,C2,‥,Cnとする
とき、Cs+w*i/nを中央とする予め文字列画像の
高さhから求めた分離領域幅rの領域内で、Hcが最小
となる座標Cciを求め、既に求めたCci-1を開始座標と
し、Cciを終了座標とする領域をi番目の文字画像とし
て切り出す。なお分離領域幅rは、例えばr=接触文字
画像高さh/2とする。認識部8には、切り出された認
識対象文字の画像が順次入力される。図11に切り出さ
れた認識対象文字「方」の画像を示す。
【0024】これにより認識部8が、切り出された
「方」の各画素について、図12の矢印方向に、着目画
素を含んで予め設定された値M以上画素が連なっている
か否かを調べ、方向コードを設定する。そして方向コー
ド毎に各画素の連結性を調べてストロークを抽出し、ス
トロークの数や位置や長さの特徴量を抽出する。図11
に認識対象文字「方」のストローク抽出結果を示す。そ
して抽出した特徴量を辞書9に登録されている文字の特
徴量と照合し、最も類似した文字を認識結果とし、表示
部10で表示する。
【0025】このように、文字列切り出し部3により切
り出された文字列画像の全部または一部を文字列方向と
垂直に走査して文字部を形成する画素のヒストグラムを
抽出し、抽出したヒストグラムを用いて正立文字列であ
るか否かを判定する正立文字列判定部4と、正立文字列
判定部4により正立文字列でないと判断された文字列画
像をずらし変形させて文字の傾斜角度が相互に異なる複
数の文字列画像を得る文字列傾斜部5と、文字列傾斜部
5によりずらし変形された複数の文字列画像に対し、文
字列方向と垂直に文字列画像を走査して文字部を形成す
る画素のヒストグラムを抽出し、抽出したヒストグラム
を用いて複数の文字列画像から正立文字列を選択する正
立文字列選択部6とを備えたので、斜字文字列を含む文
書でも文字列から正しく文字を切り出すことができると
共に、斜字の認識誤りを良好に防止できる。 (実施例2)図13は本発明の実施例2における文字認
識装置の構成図で、この文字認識装置は、画像入力部1
1と、画像メモリ12と、文字列切り出し部13と、斜
字領域指定手段14と、文字列傾斜部15と、正立文字
列選択部16と、文字切り出し部17と、認識部18
と、辞書19と、表示部20とを備えている。画像入力
部11は、認識対象文字を含む画像を入力するためのも
のである。画像メモリ12は、入力画像を2値データと
して蓄える。文字列切り出し部13は、画像メモリ12
の入力画像から認識対象文字を含む文字列画像を切り出
す。斜字領域指定手段14は、ポインティングデバイス
などからなり、オペレータが画像メモリ12の入力画像
を参照して、斜字で構成される領域を指定するためのも
のである。文字列傾斜部15は、斜字領域指定手段14
に指定された領域の文字列画像のずらし変形を行なう。
正立文字列選択部16は、文字列傾斜部15によりずら
し変形を行った結果得られた複数の傾斜文字列画像から
最も正立に近い文字列画像を選択する。文字切り出し部
17は、文字列切り出し部13により切り出された文字
列画像、および正立文字列選択部16により選択された
文字列画像から認識対象文字を切り出す。認識部18
は、文字切り出し部17により切り出された認識対象文
字のストロークなどの特徴量を求め、予め辞書19に登
録されている文字の特徴量と照合して、最も類似した文
字を選択する。辞書19は、認識対象の特徴量を格納し
ている。表示部20は、認識結果を表示する。この実施
例2は、実施例1における正立文字列判定部4の代わり
に斜字領域指定手段14を設けたものであり、他の構成
は実施例1と同様である。
【0026】次に動作を説明する。画像入力部11に入
力された画像は、実施例1の場合と同様に、2値データ
として画像メモリ12に蓄えられる。オペレータが、画
像メモリ12に蓄えられた入力画像を参照し、斜字領域
指定手段14により斜字で構成されている領域を指定す
ると、指定された座標は文字列切り出し部13に渡され
る。オペレータによる斜字領域指定作業が終了すると、
文字列切り出し部13が、実施例1の場合と同様に、文
字列画像の切り出しを行なう。その後、切り出した文字
列画像が斜字領域指定手段14で指定された斜字領域に
含まれるか否かを判断し、斜字領域に含まれる場合に
は、切り出した文字列画像を文字列傾斜部15に渡す。
一方、切り出した文字列画像が斜字領域に含まれない場
合には、切り出した文字列画像を文字切り出し部17に
渡す。以下、文字列傾斜部15と正立文字列選択部16
と文字切り出し部17と認識部18と表示部20とによ
り、実施例1と同様に処理される。
【0027】このように、オペレータが画像メモリ12
の内容を見て斜字で構成される領域を指定するための斜
字領域指定手段14を設けたので、実施例1のように正
立文字列判定部4が判定誤りをした場合に正立文字列に
対しても文字列傾斜処理を行うということがなく、高速
に斜字文字列を含む文書の認識を行なうことができる。
【0028】
【発明の効果】以上説明したように本発明によれば、入
力された画像から認識対象文字を含む文字列を切り出
し、その文字列画像の全部または一部を文字列方向と垂
直に走査して文字部を形成する画素のヒストグラムを抽
出し、そのヒストグラムを用いて正立文字列であるか否
かを判定し、正立文字列でない文字列画像をずらし変形
させて文字の傾斜角度が相互に異なる複数の文字列画像
を得、その文字列画像に対し、文字列方向と垂直に文字
列画像を走査して文字部を形成する画素のヒストグラム
を抽出し、抽出したヒストグラムを用いて複数の文字列
画像から正立文字列を選択し、正立文字列であると判断
した文字列画像および選択した文字列画像に対し、文字
列方向と垂直に文字列画像を走査して文字部を形成する
画素のヒストグラムを抽出し、そのヒストグラムを用い
て文字列画像から認識対象文字を切り出し、その認識対
象文字を辞書と照合することにより認識候補を決定する
ので、斜字文字列を含む文書でも文字列から正しく文字
を切り出すことができると共に、斜字の認識誤りを良好
に防止できる。
【0029】また、オペレータが斜字で構成される領域
を指定するようにすれば、傾斜文字を判断する必要がな
いので、高速に斜字文字列を含む文書の認識を行なうこ
とができる。
【図面の簡単な説明】
【図1】本発明の実施例1における文字認識装置の構成
図である。
【図2】文字列切り出し方法の説明図である。
【図3】正立文字列判定方法の説明図である。
【図4】正立文字列判定方法の説明図である。
【図5】傾斜文字列生成方法の説明図である。
【図6】傾斜文字列生成方法の説明図である。
【図7】正立文字列選択方法の説明図である。
【図8】正立文字列選択方法の説明図である。
【図9】文字切り出し方法の説明図である。
【図10】文字切り出し方法の説明図である。
【図11】文字認識方法の説明図である。
【図12】文字認識方法の説明図である。
【図13】本発明の実施例2における文字認識装置の構
成図である。
【符号の説明】
3 文字列切り出し部 4 正立文字列判定部 5 文字列傾斜部 6 正立文字列選択部 7 文字切り出し部 8 認識部 9 辞書 13 文字列切り出し部 14 斜字領域指定手段 15 文字列傾斜部 16 正立文字列選択部 17 文字切り出し部 18 認識部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力された画像から認識対象文字を含む
    文字列を切り出す文字列切り出しステップと、 前記文字列切り出しステップにおいて切り出された文字
    列画像の全部または一部を文字列方向と垂直に走査して
    文字部を形成する画素のヒストグラムを抽出し、抽出し
    たヒストグラムを用いて正立文字列であるか否かを判定
    する正立文字列判定ステップと、 前記正立文字列判定ステップにおいて正立文字列でない
    と判断された文字列画像をずらし変形させて文字の傾斜
    角度が相互に異なる複数の文字列画像を得る文字列斜傾
    ステップと、 前記文字列斜傾ステップにおいてずらし変形された複数
    の文字列画像に対し、文字列方向と垂直に文字列画像を
    走査して文字部を形成する画素のヒストグラムを抽出
    し、抽出したヒストグラムを用いて複数の文字列画像か
    ら正立文字列を選択する正立文字列選択ステップと、 前記正立文字列判定ステップにおいて正立文字列である
    と判断された文字列画像および前記正立文字列選択ステ
    ップにおいて選択された文字列画像に対し、文字列方向
    と垂直に文字列画像を走査して文字部を形成する画素の
    ヒストグラムを抽出し、抽出したヒストグラムを用いて
    文字列画像から認識対象文字を切り出す文字切り出しス
    テップと、 前記文字列切り出しステップにおいて切り出された認識
    対象文字を辞書と照合することにより認識候補を決定す
    る認識ステップとを実行することを特徴とする文字認識
    方法。
  2. 【請求項2】 入力された画像から認識対象文字を含む
    文字列を切り出す文字列切り出し部と、 前記文字列切り出し部により切り出された文字列画像の
    全部または一部を文字列方向と垂直に走査して文字部を
    形成する画素のヒストグラムを抽出し、抽出したヒスト
    グラムを用いて正立文字列であるか否かを判定する正立
    文字列判定部と、 前記正立文字列判定部により正立文字列でないと判断さ
    れた文字列画像をずらし変形させて文字の傾斜角度が相
    互に異なる複数の文字列画像を得る文字列斜傾部と、 前記文字列斜傾部によりずらし変形された複数の文字列
    画像に対し、文字列方向と垂直に文字列画像を走査して
    文字部を形成する画素のヒストグラムを抽出し、抽出し
    たヒストグラムを用いて複数の文字列画像から正立文字
    列を選択する正立文字列選択部と、 前記正立文字列判定部により正立文字列であると判断さ
    れた文字列画像および前記正立文字列選択部により選択
    された文字列画像に対し、文字列方向と垂直に文字列画
    像を走査して文字部を形成する画素のヒストグラムを抽
    出し、抽出したヒストグラムを用いて文字列画像から認
    識対象文字を切り出す文字切り出し部と、 前記文字列切り出し部により切り出された認識対象文字
    を辞書と照合することにより認識候補を決定する認識部
    とを備えたことを特徴とする文字認識装置。
  3. 【請求項3】 入力された画像から認識対象文字を含む
    文字列を切り出す文字列切り出しステップと、 指定された領域の文字列画像をずらし変形させて文字の
    傾斜角度が相互に異なる複数の文字列画像を得る文字列
    斜傾ステップと、 前記文字列斜傾ステップにおいてずらし変形された複数
    の文字列画像に対し、文字列方向と垂直に文字列画像を
    走査して文字部を形成する画素のヒストグラムを抽出
    し、抽出したヒストグラムを用いて複数の文字列画像か
    ら正立文字列を選択する正立文字列選択ステップと、 指定された領域以外の領域の文字列画像および前記正立
    文字列選択ステップにおいて選択された文字列画像に対
    し、文字列方向と垂直に文字列画像を走査して文字部を
    形成する画素のヒストグラムを抽出し、抽出したヒスト
    グラムを用いて文字列画像から認識対象文字を切り出す
    文字切り出しステップと、 前記文字列切り出しステップにおいて切り出された認識
    対象文字を辞書と照合することにより認識候補を決定す
    る認識ステップとを実行することを特徴とする文字認識
    装置。
  4. 【請求項4】 入力された画像のうち斜字文字で構成さ
    れている領域を使用者が指定するための斜字領域指定手
    段と、 入力された画像から認識対象文字を含む文字列を切り出
    す文字列切り出し部と、 前記斜字領域指定手段により指定された領域の文字列画
    像をずらし変形させて文字の傾斜角度が相互に異なる複
    数の文字列画像を得る文字列斜傾部と、 前記文字列斜傾部によりずらし変形された複数の文字列
    画像に対し、文字列方向と垂直に文字列画像を走査して
    文字部を形成する画素のヒストグラムを抽出し、抽出し
    たヒストグラムを用いて複数の文字列画像から正立文字
    列を選択する正立文字列選択部と、 前記斜字領域指定手段により指定されなかった領域の文
    字列画像および前記正立文字列選択部により選択された
    文字列画像に対し、文字列方向と垂直に文字列画像を走
    査して文字部を形成する画素のヒストグラムを抽出し、
    抽出したヒストグラムを用いて文字列画像から認識対象
    文字を切り出す文字切り出し部と、 前記文字列切り出し部により切り出された認識対象文字
    を辞書と照合することにより認識候補を決定する認識部
    とを備えたことを特徴とする文字認識装置。
JP4166294A 1992-06-24 1992-06-24 文字認識方法および文字認識装置 Pending JPH064703A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4166294A JPH064703A (ja) 1992-06-24 1992-06-24 文字認識方法および文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4166294A JPH064703A (ja) 1992-06-24 1992-06-24 文字認識方法および文字認識装置

Publications (1)

Publication Number Publication Date
JPH064703A true JPH064703A (ja) 1994-01-14

Family

ID=15828680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4166294A Pending JPH064703A (ja) 1992-06-24 1992-06-24 文字認識方法および文字認識装置

Country Status (1)

Country Link
JP (1) JPH064703A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194779A (ja) * 1995-01-18 1996-07-30 Nec Corp 文字および単語の認識方式、並びに文字認識方式
JP2007102702A (ja) * 2005-10-07 2007-04-19 Institute Of National Colleges Of Technology Japan 文字列の傾斜補正方法及び装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194779A (ja) * 1995-01-18 1996-07-30 Nec Corp 文字および単語の認識方式、並びに文字認識方式
JP2007102702A (ja) * 2005-10-07 2007-04-19 Institute Of National Colleges Of Technology Japan 文字列の傾斜補正方法及び装置
JP4696239B2 (ja) * 2005-10-07 2011-06-08 独立行政法人国立高等専門学校機構 文字列の傾斜補正方法及び装置

Similar Documents

Publication Publication Date Title
US6640010B2 (en) Word-to-word selection on images
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US5410611A (en) Method for identifying word bounding boxes in text
EP0543593B1 (en) Method for determining boundaries of words in text
US4813078A (en) Character recognition apparatus
US5276742A (en) Rapid detection of page orientation
JPH05242298A (ja) 記号列の認識方法
JP2006031546A (ja) 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
EP0241259A2 (en) Optical character recognition by detecting geographical features
EP0750415B1 (en) Image processing method and apparatus
JPH06301781A (ja) コンピュータによるパターン認識のためのイメージ変換方法及び装置
WO2013121647A1 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JPH064703A (ja) 文字認識方法および文字認識装置
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
US11270146B2 (en) Text location method and apparatus
JPH0773271A (ja) 領域分割方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
US10878271B2 (en) Systems and methods for separating ligature characters in digitized document images
JP2537973B2 (ja) 文字認識装置
JPH09305707A (ja) 画像抽出方式
JPH0797390B2 (ja) 文字認識装置
JP2000207491A (ja) 文字列読取方法及び装置
JPH06195519A (ja) 文字認識装置および文字認識方法