JP3135290B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JP3135290B2
JP3135290B2 JP03190238A JP19023891A JP3135290B2 JP 3135290 B2 JP3135290 B2 JP 3135290B2 JP 03190238 A JP03190238 A JP 03190238A JP 19023891 A JP19023891 A JP 19023891A JP 3135290 B2 JP3135290 B2 JP 3135290B2
Authority
JP
Japan
Prior art keywords
histogram
horizontal
vertical
rectangle
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03190238A
Other languages
English (en)
Other versions
JPH0535910A (ja
Inventor
忠則 中塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP03190238A priority Critical patent/JP3135290B2/ja
Priority to EP91307105A priority patent/EP0472313B1/en
Priority to DE69130469T priority patent/DE69130469T2/de
Publication of JPH0535910A publication Critical patent/JPH0535910A/ja
Priority to US08/135,129 priority patent/US5696841A/en
Application granted granted Critical
Publication of JP3135290B2 publication Critical patent/JP3135290B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、縦書きか横書きか不明
な文書画像情報を入力し、該文書画像情報の文字等を認
識する画像処理方法及び装置に関するものである。
【0002】
【従来の技術】従来の文字認識装置は、文書画像等を読
取って入力する入力部と、入力画像に対して1文字のパ
ターンを切出して各種の正規化を施す前処理部と、この
正規化されたパターンから幾何学的特徴を抽出し、予め
辞書に格納されている標準パターンと照合してその文書
画像の文字部分を認識する認識部から構成されている。
特に、日本語の文字認識を行う文字認識装置では、邦文
には横書き文書以外に縦書きの文書が存在するため、1
文字のパターンを切出す前処理部では、横書き文書画像
の場合には水平方向の射影をとって文字行を抽出し、抽
出された1行あるいは複数行毎に垂直方向の射影をとる
ことにより1文字を切出している。また、縦書き文書画
像の場合には、垂直方向の射影をとって文字行を抽出
し、抽出された1行あるいは複数行毎に水平方向の射影
を取ることにより1文字の切出しを行なっている。
【0003】また、一つの文書画像情報の中の縦書き領
域及び横書き領域の指定は、ユーザーが入力した画像情
報が表示されている表示上で、範囲指定とその範囲内が
縦書きであるのか横書きであるのかの指定をするものが
あった。
【0004】
【発明が解決しようとしている課題】しかしながら、上
記従来の技術では、邦文の文字認識を行う文字認識装置
では、横書きの文書の場合と、縦書きの文書の場合とで
は処理が異なる。このため、横書き文書或いは縦書き文
書専用の文字認識装置を用意するか、もしくは文字認識
を行う前に、オペレータが画像に含まれる文字列の方向
を視認して横書き文書であるか、縦書き文書であるかを
指示する操作が必要があり、オペレータに負担を負わせ
るものであった。また、上記従来の技術では、例えば新
聞や雑誌のように縦書きと横書きの文章が一つの画像情
報の中に混在している場合には、オペレータが処理対象
の画像に対して、縦書き文章の領域及び横書き文章の領
域を区別して範囲指定し、各々の領域に含まれる文章が
縦書きであるのか横書きであるのかを指示する操作が必
要であり、オペレータに負担を負わせるものであった。
【0005】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、入力された画像情報に対して水平方向の
ヒストグラムをとって、前記水平方向のヒストグラムが
所定の閾値以上の領域毎に矩形を切り出し、前記水平方
向のヒストグラムに基づいて切り出した矩形内で垂直方
向のヒストグラムをとって、前記垂直方向のヒストグラ
ムが所定の閾値以上の領域毎に矩形を切り出すことによ
り、少なくとも1つの文字画像を含む第1矩形領域を抽
出し、前記画像情報に対して垂直方向のヒストグラムを
とって、前記垂直方向のヒストグラムが所定の閾値以上
の領域毎に矩形を切り出し、前記垂直方向のヒストグラ
ムに基づいて切り出した矩形内で水平方向のヒストグラ
ムをとって、前記水平方向のヒストグラムが所定の閾値
以上の領域毎に矩形を切り出すことにより、少なくとも
1つの文字画像を含む第2矩形領域を抽出し、前記抽出
した第1矩形領域及び第2矩形領域それぞれの縦横比を
算出し、前記算出した縦横比が1:1に近い方の矩形領
域を抽出した際に、最初にとったヒストグラムの方向
を、前記画像情報に含まれる文字列の方向であると判定
することを特徴とする画像処理方法及び装置を提供す
る。また、好ましくは、前記画像情報は、スキャナを用
いて読み取られた画像情報である。
【0006】
【0007】
【0008】
【0009】
【0010】
【0011】
【0012】
【0013】
【0014】
【0015】
【0016】
【0017】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0018】〔文字認識装置の説明(図1)〕図1は本
発明の実施例の文字認識装置の概略構成を示すブロック
図であり、本発明の実施例全てに共通の構成である。
【0019】図1において、1は本実施例の文字認識装
置を示している。2は文書画像を読取って入力する入力
部で、例えばスキャナ等により構成され原稿画像データ
をデジタルで入力している。3は装置1全体を制御する
演算処理用の中央処理装置(以下、CPUという)を示
している。4はROMで、CPU3の後述するフローチ
ャートで示された制御プログラムや各種データを格納し
ている。5はメモリ(RAM)で、CPU3のワークエ
リアとして使用されるとともに、入力部2より入力され
た文書画像データを記憶する領域をも備えている。
【0020】6は文字行判定部で、メモリ5に記憶され
た文書画像の文字行の方向、即ち文書画像の文書が縦書
きか横書きかを判定し、図18に示すようにそれらが混
在している場合はそれぞれの領域を抽出している。7は
前処理部で、メモリ5に記憶された文書画像の1文字の
パターンを切出し、各種の正規化を実行している。8は
認識部で、前処理部7によって前処理されたパターンか
ら幾何学的特徴を抽出し、予め認識用辞書9に格納され
ている標準パターンと照合して文書画像の文字認識を行
っている。10は表示部で、入力された文書画像の認識
結果等を表示している。11はシステムバスで、CPU
3よりのデ−タバス、アドレスバス及び制御信号バス等
を含んでいる。12は外部の出力装置、例えばプリンタ
13等とのインターフェース制御を行うインターフェー
ス部を示している。
【0021】〔文書画像の説明(図2)〕図2は実施例
の文字認識装置1に入力される文書画像の一例を示す図
である。
【0022】図2において、21は入力部2で読取られ
る文書画像を示している。そして、22は文書画像21
を水平方向に走査したときの文字画像の射影(黒画素の
計数値)を示し、23は同じく文書画像21を垂直方向
に走査したときの文字画像の射影を示している。24、
25のそれぞれは基準値αを示す線分を示している。
【0023】図2の例では、入力された文書画像21は
横書きの文書であり、各ライン毎に黒画素数をカウント
した計数値が基準値αを越えているライン数が、垂直方
向に比べて水平方向の方が多いことがわかる。
【0024】(1−1) 基準値αを用い、水平方向の黒画素を1行ごとにカウン
トする例。
【0025】図3は本実施例のCPU3の動作を説明す
るフローチャートで、この処理を実行する制御プログラ
ムはROM4に記憶されている。
【0026】まずステップS0で、操作者によりセット
された文書画像を入力部2(スキャナ)により読取って
入力し、メモリ5に記憶する。次にステップS2に進
み、文字行判定部6において、メモリ5に記憶された文
書画像が横書きか縦書きかを判定する。これはメモリ5
に記憶されている文書画像の水平方向、垂直方向の射影
(黒画素数)を求め、その黒画素数が基準値α以上とな
るライン数が、文書画像全体のライン数と比較してどれ
くらいの割合になるかを求め、水平方向に関して求めた
割合と垂直方向に関して求めた割合とを比較した結果に
応じて判定する処理である。
【0027】この文字行判定部6で実行されるステップ
S2の詳細は図4に示す通りである。図4に従って説明
すると、まずステップS11で水平方向の1ライン毎に
黒画素の数をカウントし、ステップS12でその計数値
が基準値α以上となるライン数を求める。これを文書画
像の水平方向の全ライン(THとする)に対して行な
い、基準値α以上となったライン数UHを求める。そし
て、全ライン数THに対して、基準値α以上となったラ
イン数UHを基に、その割合RHを求める。このRH
は、以下に示す式により求められる。
【0028】RH=UH/TH
【0029】次にステップS13に進み、同様にして垂
直方向の射影を考える。ここでは、文書画像の垂直方向
の1ライン毎に黒画素の数をカウントする。ステップS
14では、この計数値が基準値α以上であるかチェック
し、これを垂直方向の全ライン(TVとする)に対して
行ない、基準値α以上となったライン数UVを求める。
そして、全ライン数TVに対する基準値α以上となった
ライン数UVを基に、基準値α以上となったライン数の
割合RVを求める。このRVは、以下に示す式で求めら
れる。
【0030】RV=UV/TV こうして、ステップS15に進み、基準値α以上となっ
た水平方向及び垂直方向のライン数の全ライン数に対す
る割合RH、RVを比較する。ここで、RH≧RVを満
たせば、文書画像は横書きであると判定される。
【0031】再び、図3のフローチャートに戻り、横書
き文書のときはステップS3に進み、前処理部7におい
て横書き用の前処理を行なう。この横書き用の前処理と
は、まず水平方向の射影をとって文字行を抽出し、抽出
された1行あるいは複数行毎に垂直方向の射影を取るこ
とにより1文字を切出す文字切出し処理、位置、傾き、
線幅、濃度等の正規化処理、雑音除去処理等である。
【0032】また、ステップS2において、RH≧RV
を満たさなかった場合は、メモリ5に記憶されている文
書画像は縦書きであると判定してステップS4に進み、
前処理部7において縦書き用の前処理を行なう。この縦
書き用の前処理とは、まず垂直方向の射影をとって文字
行を抽出し、抽出された1行あるいは複数行毎に水平方
向の射影をとることにより1文字を切り出す文字切出し
処理、位置、傾き、線幅、濃度等の正規化処理、雑音除
去処理等である。
【0033】次にステップS5に進み、前処理部7にお
いて前処理された1文字毎の未知文字パターンに対し
て、認識部8で輪郭線特徴等の抽出を行なう。この認識
用辞書9には、認識対象となっている全ての文字の標準
パターンの特徴が記憶されている。この未知文字パター
ンの特徴と、辞書9に記憶されている標準パターンの特
徴をマッチングさせて最も確からしいものを認識結果と
してメモリ5に記憶し、入力された文書画像内の全文字
を同様に認識してメモリ5に記憶する。次にステップS
6に進み、メモリ5に記憶された認識結果を表示部10
に表示する。尚、プリンタ13より文字等を出力する処
理については説明を省略している。
【0034】以上の説明により、第1の実施例によれ
ば、横書き文書にも縦書き文書にも対応できる、ユーザ
にとって使い易い文字認識装置を実現することができ
る。
【0035】(1−2) 先に説明した1−1の処理の変形処理で、垂直方向から
先に黒画素をカウントする例。
【0036】図5は図3のステップS2の横書きか縦書
きを判別する実施例の処理を示すフローチャートで、こ
こでは1.1の実施例のステップS11とS12と、ス
テップS13とS14を実行する順序を逆にしている。
即ち、1.1の実施例では水平方向の次に垂直方向の画
素数を計数するようにしているが、本実施例では最初に
垂直方向の黒画素数を計数し、その後水平方向の黒画素
数を計数するようにしている。尚、本実施例における文
字認識装置の構成は図1に示す構成と同様である。
【0037】以上の説明により、本実施例においても、
前述の1.1の実施例と同様の作用・効果を得ることが
できる。
【0038】(1−3) 先に説明した1−1の処理の変形処理で、黒画素に替え
て白画素をカウントする例。
【0039】図6は本実施例を示すフローチャートであ
る。ここでは、1.1の実施例のステップS2における
黒画素のカウントを白画素のカウントに置換えている。
尚、この実施例における文字認識装置の構成及びステッ
プS2以外のフローチャートは、1.1の実施例(図1
と図3)と同じである。
【0040】まずステップS31で、水平方向の1ライ
ン毎に白画素の数をカウントする。次にステップS32
で、その画素数が基準値α以上であるかチェックし、こ
のカウント数が入力画像全域で何ライン基準値α以上と
なったかカウントする。そして、基準値α以上となった
ライン数の全ライン数に対する割合をRHとする。
【0041】次にステップS33に進み、同様にして、
垂直方向の1ライン毎に白画素の数をカウントする。次
にステップS34で、その画素数が基準値α以上である
かチェックし、このカウント数が入力画像全域で何ライ
ン基準値α以上となったかカウントする。そして、基準
値α以上となったライン数の全ライン数に対する割合を
RVとする。
【0042】次にステップS35に進み、前述のRHと
RVを比較し、RH≦RVを満たせば横書きと判定し、
満たさなければ縦書きと判定する。
【0043】以上の説明により、本実施例においても前
述の実施例と同様の作用・効果を得ることができる。
【0044】(1−4) 先に説明した1−1の処理の変形処理で、黒画素をカウ
ントする行を複数行にする例。
【0045】図7は本実施例を示すフローチャートであ
る。ここでは、1.1の実施例のステップS2における
1ライン毎の黒画素のカウントを複数ライン毎の黒画素
のカウントに置換えている。この実施例における文字認
識装置の構成及びステップS2以外のフローチャートは
1.1の実施例(図1と図3)と同じである。
【0046】まずステップS41で水平方向の複数ライ
ン毎に黒画素の数をカウントする。そしてステップS4
2で、このカウンタ数が基準値α以上であるかチェック
し、入力画像全域で何ラインが基準値α以上となったか
をみる。そして、基準値α以上となったライン数の、全
ライン数に対する割合をRHとする。
【0047】同様にして、ステップS43で垂直方向に
黒画素数を計数し、ステップS44で基準値α以上とな
ったライン数の、全ライン数に対する割合をRVとす
る。
【0048】こうして求めたRHとRVとをステップS
45で比較して、RH≧RVを満たせば横書きと判定
し、満たされなければ縦書きと判定する。
【0049】以上の説明により本実施例においても前述
の実施例と同様の作用・効果を得ることができる。
【0050】(1−5) 先に説明した1−3の処理の変形処理で、垂直方向から
先に白画素をカウントする例。
【0051】前述した1.3の実施例において、前述の
1.2の実施例の如く水平方向と垂直方向の順序を入れ
換えても、1.1の実施例と同様の作用・効果を得るこ
とができる。なお、このときの文字認識装置のブロック
図、フローチャートは1.1の実施例(図1と図3)と
同様であり、フローチャートのステップS2は図6のS
31、S32と、S33、S34とを入れ換えて、ステ
ップS33、S34、S31そしてS32の順に実行す
る。
【0052】(1−6) 先に説明した1−3の処理の変形処理で、白画素をカウ
ントする行を複数行にする例。
【0053】前述の1.3の実施例において、前述の
1.4の実施例の如く1ライン毎のカウントを複数ライ
ン毎にしても第1の実施例と同様の効果が得られる。
尚、このときの文字認識装置のブロック図、フローチャ
ートは1.1の実施例(図1と図3)と同じであり、フ
ローチャートのステップS2は図6のS31とS33の
「1ライン毎」を「複数ライン毎」に入れ換えたものと
同じである。
【0054】(1−7) 先に説明した1−4の処理の変形処理で、垂直方向から
先に黒画素をカウントする例。
【0055】前述の1.4の実施例において、1.2の
実施例の如く水平方向と垂直方向の順序を入れ換えて
も、1.1の実施例と同様の作用・効果を得ることがで
きる。尚、このときの文字認識装置のブロック図、フロ
ーチャートは1.1の実施例(図1と図3)と同じであ
る。そして、1.7の実施例のフローチャートのステッ
プS2(図3)は図7のS43、S44とS41、S4
2とを入れ換えて、ステップS43、S44、S41そ
してS42の順で実行したものと同じである。
【0056】(1−8) 先に説明した1−1の処理の変形処理で、カウント結果
が基準値α以上の行に替えてα以下の行に注目する例。
【0057】1.1の実施例のステップS2(図4)に
おける「黒画素数が基準値α以上」を「黒画素数が基準
値α以下」におきかえても良い。この実施例における文
字認識装置の構成及びステップS2以外のフローチャー
トは1.1の実施例(図1と図3)と同じである。
【0058】1.8の実施例のフローチャートのステッ
プS2の詳細を図8に示す。
【0059】ステップS51で水平方向の1ライン毎に
黒画素の数をカウントし、基準値α以下であるかチェッ
クする。そして、ステップS52で、入力画像全域で何
ラインが基準値α以下となったかカウントし、そのライ
ン数の全ライン数に対する割合をRHとする。
【0060】次にステップS53で、垂直方向の1ライ
ン毎に黒画素の数をカウントする。ステップS54で
は、基準値α以下であるかチェックして、入力画像全域
で何ラインが基準値α以下となったかカウントし、その
ライン数の割合をRVとする。次にステップS55に進
み、この求めたRHとRVを比較してRH≦RVを満た
せば、文書画像が横書きの文章画像と判定し、満たさな
ければ縦書きと判定する。
【0061】以上の説明により、1.8の実施例におい
ても前述の1.1の実施例と同様の作用・効果を得るこ
とができる。
【0062】以上説明したように本実施例によれば、文
書の文字列の方向を自動的に判定して、文書画像が横書
き文書或は縦書き文書であるかを認識できるようにな
る。このため、文書原稿を読取って認識する際、ユーザ
が一々縦書き文書か横書き文書かを指示しなくて良くな
り、文字認識の操作性が向上する効果がある。
【0063】(2−1) 垂直方向と水平方向の基準値に、異なる値を用いる例。
【0064】図9に示すように、1.1で説明した図2
に代えて、水平方向の基準値としてα、垂直方向の基準
値としてβを定めることとする。
【0065】この、α、βの決定は、図10のフローチ
ャートに示すように、画像情報を入力した後に行う。図
10のフローチャートにおいて図3のフローチャートと
異るのはS1のみなのでここだけ説明する。
【0066】S1における基準値α、βの決定は、以下
のように行われる。
【0067】初期基準値をB、文書画像の指定領域にお
ける水平方向の全ラインをTH、垂直方向の全ラインを
TVとすると、水平方向の基準値αは
【0068】
【外1】 垂直方向の基準値βは
【0069】
【外2】 ここにおいて、SH,SV,tH,tVはそれぞれα、βを
補正する補正値である(SH≠0,SV≠0)。
【0070】このように文書画像の指定領域の高さや幅
を用いることにより、指定領域の縦横比に影響されずに
正確に縦書き、横書きを判定可能となった。
【0071】なお、図9は縦書き、横書きを判定する領
域として文書画像すべてを選んでいる。
【0072】S1において定められたα、βを、1.1
から1.8で説明した図4から図8の処理における基準
値に用いることができる(図示せず)。
【0073】(2−2) 黒画素をカウントした結果、最大値を用いて文字列方向
を判定する例。
【0074】図11は図3のS2の横書きか縦書きかを
判別する処理を示すフローチャートである。
【0075】ステップS61で水平方向、垂直方向それ
ぞれ黒画素数の最大値を求め、ステップS62でそれら
の最大値を水平方向のライン数TH、垂直方向のライン
数TV、補正計数を用いて補正する。ステップS63で
それぞれ補正された水平方向、垂直方向の黒画素の最大
値を比較して、水平方向の方が大きければ横書き、小さ
ければ縦書きと判定する。
【0076】尚、本実施例における画像処理装置の構成
は図1に示す構成と同様である。
【0077】(3−1) 縦書き及び横書きの両方を仮定して文字認識し、各々に
おける認識結果の類似度により文字列方向を判定する
例。
【0078】図12は図3のステップS2の横書きか縦
書きを判別する実施例の処理を示すフローチャートであ
る。
【0079】ステップS71で水平方向のヒストグラム
により矩形を切り出し(図13)、その中で垂直方向の
ヒストグラムをとり、ひとつまたは複数個の矩形を抽出
する(図14)。なお、図14は1行目から抽出した矩
形のみ表示している。
【0080】次にステップS72で垂直方向のヒストグ
ラムにより矩形を切り出し(図15)、その中で水平方
向のヒストグラムをとり、ひとつまたは複数個の矩形を
抽出する(図16)。
【0081】次にステップS73でステップS71、ス
テップS72で抽出した矩形を認識し、ステップS74
でその類似度の高さにより横書きか縦書きかを判定して
いる。
【0082】(3−2) 縦書き及び横書きの両方を仮定して文字領域を抽出し、
各々において抽出された文字領域の縦横比により文字列
方向を判定する例。
【0083】図17は図3のステップS2の横書きか縦
書きを判別する実施例の処理を示すフローチャートであ
る。ステップS81で水平方向のヒストグラムにより矩
形を切り出し(図13)、その中で垂直方向のヒストグ
ラムをとり、ひとつまたは複数個の矩形を抽出する(図
14)。なお、図14は1行目から抽出した矩形のみ表
示している。
【0084】次にステップS82で垂直方向のヒストグ
ラムにより矩形を切り出し、(図15)、その中で水平
方向のヒストグラムをとり、ひとつまたは複数個の矩形
を抽出する(図16)。
【0085】次にステップS83でステップS81、ス
テップS82で抽出した矩形の縦横比を計算する。
【0086】図14、図16の例では明らかにステップ
S81で抽出した矩形の方が縦:横=1:1に近い。
【0087】ステップS84で、縦横比が1:1に近い
方がステップS81で求めたものであれば横書き、そう
でなければ縦書きと判定している。
【0088】(4−1) 一つの文書画像に縦書き文章と横書き文章が混在する
例。
【0089】図18は実施例の文字認識装置1に入力さ
れる縦書きと横書きの領域が混在する文書画像の一例を
示す図である。
【0090】図18において、31は入力部2で読み取
られる文書画像を示している。そして、32は文書画像
21を水平方向に走査したときの文字画像の射影(黒画
素の計数値)を示し、33は同じく文書画像31を垂直
方向に走査したときの文字画像の射影を示している。3
4、35のそれぞれは基準値α、βを示す線分を示して
いる。
【0091】36、42は文字行判定部6により判定さ
れた横書き文章領域、37は同じく文字行判定部6によ
り判定された縦書き領域を示している。38〜40はそ
れぞれ文字がそこにあることを示している。41は文字
がないと判定された領域を示す。
【0092】図18の例では、入力された文書画像31
は横書き、縦書き混在の文書である。
【0093】図19は第1の実施例のCPU3の動作を
説明するフローチャートで、この処理を実行する制御プ
ログラムはROM4に記憶されている。
【0094】まずステップS100で、操作者によりセ
ットされた原稿の文書画像を入力部2(スキャナ)によ
り読取って入力し、メモリ5に記憶する。次にステップ
S101に進み、文字行判定部6において、メモリ5に
記憶された文書画像の横書き文章領域と縦書き文章領域
とを抽出する。これはメモリ5に記憶されている文書画
像の水平方向及び垂直方向の射影(黒画素数)を求め、
その画素数がそれぞれ基準値α、βとなるライン数が、
どれくらいになるかを比較した結果に応じて求められ
る。
【0095】この文字行判定部6で実行されるステップ
S101の詳細は図20に示す通りである。図20に従
って説明すると、まずステップS111で水平方向の1
ライン毎に黒画素の数をカウントし、その計数値が基準
値α以上となる領域を求める。図18の例では36及び
42を合わせた領域がその領域である。
【0096】同様に垂直方向に関してステップS112
で領域を求める。図18の36、37がその領域にあた
る。
【0097】ステップS113で文書画像中の横書き領
域、縦書き領域を決定する。
【0098】ステップS111、S112により文書画
像は図21に示す4領域に分けられる。
【0099】領域A…水平・垂直共に基準値以上 領域A内だけで再度ヒストグラムをとり、ヒストグラム
の水平・垂直各々の最大値から基準値を引いた値が、水
平の方が大きければ横書き領域とする。そうでなければ
縦書き領域とする。
【0100】領域B…水平のみ基準値以上 横書き領域とする。図18の領域42は横書き領域とな
る。尚、領域36と42は隣り合っていて文書方向が同
一なので、2つの領域を結合して一つの領域とする。
【0101】領域C…垂直のみ基準値以上 縦書き領域とする。図18の領域37は縦書き領域とな
る。
【0102】領域D…水平・垂直共に基準値未満 この領域内で、再度水平・垂直方向のヒストグラムをと
り、基準値を引いてその値の大きい方が水平なら横書き
と判定する。そうでなければ縦書き領域。尚、領域内の
ヒストグラムが0であれば文字がないということであ
り、図18の領域41がそうである。
【0103】また前記基準値は文書画像の幅、高さによ
って補正する。
【0104】縦書き、横書きの領域が判定されたら、ス
テップS114で領域の認識順序を決定する。例えば、
座標が上のものから順序をつける。
【0105】再び、図19のフローチャートに戻り、横
書き領域のときはステップS103に進み、前処理部7
において横書き用の前処理を行なう。この横書き用の前
処理とは、まず水平方向の射影をとって文字行を抽出
し、抽出された1行あるいは複数行毎に垂直方向の射影
を取ることにより1文字を切出す文字切出し処理、位
置、傾き、線幅、濃度等の正規化処理、雑音除去処理等
である。
【0106】また、ステップS102において、縦書き
と判定された場合は、ステップS104に進み、前処理
部7において縦書き用の前処理を行なう。この縦書き用
の前処理とは、まず垂直方向の射影をとって文字行を抽
出し、抽出された1行あるいは複数行毎に水平方向の射
影をとることにより、1文字を切り出す文字切出し処
理、位置、傾き、線幅、濃度等の正規化処理、雑音除去
処理等である。
【0107】次にステップS105に進み、前処理部7
において前処理された1文字毎の未知文字パターンに対
して、認識部8で輪郭線特徴等の抽出を行なう。この認
識用辞書9には、認識対象となっている全ての文字の標
準パターンの特徴が記憶されている。この未知文字パタ
ーンの特徴と、辞書9に記憶されている標準パターンの
特徴をマッチングさせて最も確からしいものを認識結果
としてメモリ5に記憶し、入力された文書画像内の全文
字を同様に認識してメモリ5に記憶する。
【0108】次にステップS106に進み、認識してい
ない領域があればステップS102に戻り、すべての領
域の認識が終了したらステップS107へ進む。次にス
テップS107では、メモリ5に記憶された認識結果を
表示部10に表示する。尚、プリンタ13より文字等を
出力する処理については説明を省略している。
【0109】以上の説明により、本実施例によれば、横
書き文書にも縦書き文書にも両方の混在文書にも対応で
きる、ユーザにとって使い易い文字認識装置を実現する
ことができる。
【0110】(4−2) 縦書きと横書きの判定及び認識順序を報知し、オペレー
タの確認を可能とする例。
【0111】図22は本実施例を示すフローチャートで
図19のステップS101の詳細を示している。
【0112】ステップS111〜S114で縦書き領
域、横書き領域を4.1の実施例と同様に求める。次に
ステップS115において、抽出した領域の属性(縦、
横書き)、認識順序が正しいか確認をユーザーに求めて
確定する。
【0113】
【発明の効果】以上説明したように、本発明によれば、
入力された画像情報に対して水平方向のヒストグラムを
とって、前記水平方向のヒストグラムが所定の閾値以上
の領域毎に矩形を切り出し、前記水平方向のヒストグラ
ムに基づいて切り出した矩形内で垂直方向のヒストグラ
ムをとって、前記垂直方向のヒストグラムが所定の閾値
以上の領域毎に矩形を切り出すことにより、少なくとも
1つの文字画像を含む第1矩形領域を抽出し、前記画像
情報に対して垂直方向のヒストグラムをとって、前記垂
直方向のヒストグラムが所定の閾値以上の領域毎に矩形
を切り出し、前記垂直方向のヒストグラムに基づいて切
り出した矩形内で水平方向のヒストグラムをとって、前
記水平方向のヒストグラムが所定の閾値以上の領域毎に
矩形を切り出すことにより、少なくとも1つの文字画像
を含む第2矩形領域を抽出し、前記抽出した第1矩形領
域及び第2矩形領域それぞれの縦横比を算出し、前記算
出した縦横比が1:1に近い方の矩形領域を抽出した際
に、最初にとったヒストグラムの方向を、前記画像情報
に含まれる文字列の方向であると判定することにより、
入力画像の文字列方向の判定を簡単且つ確実に行なうこ
とができ、また、オペレータによる文字列方向の指示操
作の負担を軽減することができる。
【0114】また、さらに、本発明によれば、前記画像
情報はスキャナを用いて読み取られた画像情報とするこ
とにより、スキャナを用いて読み取られた画像の文字列
方向の判定を簡単且つ確実に行なうことができる。以上
説明したように、本発明によれば、想定し得る複数の文
字列方向の中から、より好ましいものを判定することが
できる。
【0115】
【図面の簡単な説明】
【図1】本発明の実施例の画像処理装置の構成を示すブ
ロック図。
【図2】本実施例で入力される文書画像情報の射影を取
った第1の例示図。
【図3】本実施例の文字認識処理を示す第1のフローチ
ャート。
【図4】本実施例の文字列の方向を検知する処理を示す
第1のフローチャート。
【図5】本実施例の文字列の方向を検知する処理を示す
第2のフローチャート。
【図6】本実施例の文字列の方向を検知する処理を示す
第3のフローチャート。
【図7】本実施例の文字列の方向を検知する処理を示す
第4のフローチャート。
【図8】本実施例の文字列の方向を検知する処理を示す
第5のフローチャート。
【図9】本実施例で入力される文書画像情報の射影を取
った第2の例示図。
【図10】本実施例の文字認識処理を示す第2のフロー
チャート。
【図11】本実施例の文字列の方向を検知する処理を示
す第6のフローチャート。
【図12】本実施例の文字列の方向を検知する処理を示
す第7のフローチャート。
【図13】3.1の実施例を説明する為の第1の図。
【図14】3.1の実施例を説明する為の第2の図。
【図15】3.1の実施例を説明する為の第3の図。
【図16】3.1の実施例を説明する為の第4の図。
【図17】本実施例の文字列の方向を検知する処理を示
す第8のフローチャート。
【図18】本実施例で入力される文書画像情報の射影を
取った第3の例示図。
【図19】本実施例の文字認識処理を示す第3のフロー
チャート。
【図20】本実施例の文字列の方向を検知する処理を示
す第9のフローチャート。
【図21】ヒストグラムの結果と基準値との比較による
領域の分離を説明する為の図。
【図22】本実施例の文字列の方向を検知する処理を示
す第10のフローチャート。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 320 G06K 9/62

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された画像情報に対して水平方向の
    ヒストグラムをとって、前記水平方向のヒストグラムが
    所定の閾値以上の領域毎に矩形を切り出し、前記水平方
    向のヒストグラムに基づいて切り出した矩形内で垂直方
    向のヒストグラムをとって、前記垂直方向のヒストグラ
    ムが所定の閾値以上の領域毎に矩形を切り出すことによ
    り、少なくとも1つの文字画像を含む第1矩形領域を抽
    出し、 前記画像情報に対して垂直方向のヒストグラムをとっ
    て、前記垂直方向のヒストグラムが所定の閾値以上の領
    域毎に矩形を切り出し、前記垂直方向のヒストグラムに
    基づいて切り出した矩形内で水平方向のヒストグラムを
    とって、前記水平方向のヒストグラムが所定の閾値以上
    の領域毎に矩形を切り出すことにより、少なくとも1つ
    の文字画像を含む第2矩形領域を抽出し、 前記抽出した第1矩形領域及び第2矩形領域それぞれの
    縦横比を算出し、 前記算出した縦横比が1:1に近い方の矩形領域を抽出
    した際に、最初にとったヒストグラムの方向を、前記画
    像情報に含まれる文字列の方向であると判定することを
    特徴とする画像処理方法。
  2. 【請求項2】 前記画像情報は、スキャナを用いて読み
    取られた画像情報であることを特徴とする請求項1に記
    載の画像処理方法。
  3. 【請求項3】 入力された画像情報に対して水平方向の
    ヒストグラムをとって、前記水平方向のヒストグラムが
    所定の閾値以上の領域毎に矩形を切り出し、前記水平方
    向のヒストグラムに基づいて切り出した矩形内で垂直方
    向のヒストグラムをとって、前記垂直方向のヒストグラ
    ムが所定の閾値以上の領域毎に矩形を切り出すことによ
    り、少なくとも1つの文字画像を含む第1矩形領域を抽
    出する第1抽出手段と、 前記画像情報に対して垂直方向のヒストグラムをとっ
    て、前記垂直方向のヒストグラムが所定の閾値以上の領
    域毎に矩形を切り出し、前記垂直方向のヒストグラムに
    基づいて切り出した矩形内で水平方向のヒストグラムを
    とって、前記水平方向のヒストグラムが所定の閾値以上
    の領域毎に矩形を切り出すことにより、少なくとも1つ
    の文字画像を含む第2矩形領域を抽出する第2抽出手段
    と、 前記抽出した第1矩形領域及び第2矩形領域それぞれの
    縦横比を算出する算出手段と、 前記算出した縦横比が1:1に近い方の矩形領域を抽出
    した際に、最初にとったヒストグラムの方向を、前記画
    像情報に含まれる文字列の方向であると判定する判定手
    段とを有することを特徴とする画像処理装置。
  4. 【請求項4】 前記画像情報は、スキャナを用いて読み
    取られた画像情報であることを特徴とする請求項3に記
    載の画像処理装置。
JP03190238A 1990-08-03 1991-07-30 画像処理方法及び装置 Expired - Fee Related JP3135290B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP03190238A JP3135290B2 (ja) 1991-07-30 1991-07-30 画像処理方法及び装置
EP91307105A EP0472313B1 (en) 1990-08-03 1991-08-02 Image processing method and apparatus therefor
DE69130469T DE69130469T2 (de) 1990-08-03 1991-08-02 Gerät und Verfahren zur Bildverarbeitung
US08/135,129 US5696841A (en) 1990-08-03 1993-10-12 Image processing method and apparatus for extracting vertically and horizontally written text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03190238A JP3135290B2 (ja) 1991-07-30 1991-07-30 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH0535910A JPH0535910A (ja) 1993-02-12
JP3135290B2 true JP3135290B2 (ja) 2001-02-13

Family

ID=16254801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03190238A Expired - Fee Related JP3135290B2 (ja) 1990-08-03 1991-07-30 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP3135290B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3795238B2 (ja) * 1998-10-01 2006-07-12 シャープ株式会社 文書画像処理装置及び文書画像処理方法
JP2001282785A (ja) * 2000-03-30 2001-10-12 Sharp Corp 文書画像処理装置およびそのための方法、ならびに文書画像処理プログラムを記録したコンピュータで読取可能な記録媒体

Also Published As

Publication number Publication date
JPH0535910A (ja) 1993-02-12

Similar Documents

Publication Publication Date Title
US5696841A (en) Image processing method and apparatus for extracting vertically and horizontally written text
US5889897A (en) Methodology for OCR error checking through text image regeneration
EP0834826B1 (en) Positioning templates in optical character recognition systems
US6385338B1 (en) Image processing method and apparatus
US7305619B2 (en) Image processing method, device and storage medium therefor
JPH1139428A (ja) 文書映像の方向修正方法
EP0457534A2 (en) Image processing method and apparatus
JP3135290B2 (ja) 画像処理方法及び装置
JPH0490083A (ja) 文字認識装置
JP2868134B2 (ja) 画像処理方法及び装置
JP3548234B2 (ja) 文字認識方法及び装置
JP3086653B2 (ja) 文字認識方法及び文字認識装置
JP3348224B2 (ja) 表枠線の交点補正装置および表認識装置および光学文字読取装置
JP3345246B2 (ja) 文字認識装置及び文字認識方法
JP4056745B2 (ja) 文字認識方法および文字認識装置
JP2939985B2 (ja) 画像処理装置
JPH0969136A (ja) 文書方向判定方法及び装置及び文字認識装置、及びコンピュータ制御装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JPH0728935A (ja) 文書画像処理装置
JP3090928B2 (ja) 文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JPH03217993A (ja) 文字サイズ認識装置
JP3157534B2 (ja) 表認識方法
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101201

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees