JPH0535910A - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JPH0535910A
JPH0535910A JP3190238A JP19023891A JPH0535910A JP H0535910 A JPH0535910 A JP H0535910A JP 3190238 A JP3190238 A JP 3190238A JP 19023891 A JP19023891 A JP 19023891A JP H0535910 A JPH0535910 A JP H0535910A
Authority
JP
Japan
Prior art keywords
horizontal
vertical
image information
counting
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3190238A
Other languages
English (en)
Other versions
JP3135290B2 (ja
Inventor
Tadanori Nakatsuka
忠則 中塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP03190238A priority Critical patent/JP3135290B2/ja
Priority to EP91307105A priority patent/EP0472313B1/en
Priority to DE69130469T priority patent/DE69130469T2/de
Publication of JPH0535910A publication Critical patent/JPH0535910A/ja
Priority to US08/135,129 priority patent/US5696841A/en
Application granted granted Critical
Publication of JP3135290B2 publication Critical patent/JP3135290B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 (修正有) 【目的】画像情報内に文字が縦書きと横書きが混在して
いてもオペレータの手を煩わすことなく判定できる。 【構成】文書画像を入力部2で読取りメモリ5に記憶す
る。文字判定部6でこの文書画像の水平及び垂直方向の
射影(黒画素数)を求め、画素数が基準値α以上となる
ライン数を文書画像全体のライン数と比較して文書画像
が横書きか縦書きかを判別する。前処理部7において判
別の結果に対して横書き用又は縦書き用夫々の前処理を
行なう。前処理された1文字毎の未知文字パターンに対
して認識部8で輪郭特徴等の抽出を行なう。この未知文
字パターンの特徴と辞書9に記憶されている標準パター
ンの特徴をマッチングさせて最も確からしいものを認識
結果としてメモリ5に記憶する。文書画像内の全文字を
同様に認識した結果を表示部10に表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、縦書きか横書きか不明
な文書画像情報を入力し、該文書画像情報の文字等を認
識する画像処理方法及び装置に関するものである。
【0002】
【従来の技術】従来の文字認識装置は、文書画像等を読
取って入力する入力部と、入力画像に対して1文字のパ
ターンを切出して各種の正規化を施す前処理部と、この
正規化されたパターンから幾何学的特徴を抽出し、予め
辞書に格納されている標準パターンと照合してその文書
画像の文字部分を認識する認識部から構成されている。
特に、日本語の文字認識を行う文字認識装置では、邦文
には横書き文書以外に縦書きの文書が存在するため、1
文字のパターンを切出す前処理部では、横書き文書画像
の場合には水平方向の射影をとって文字行を抽出し、抽
出された1行あるいは複数行毎に垂直方向の射影をとる
ことにより1文字を切出している。また、縦書き文書画
像の場合には、垂直方向の射影をとって文字行を抽出
し、抽出された1行あるいは複数行毎に水平方向の射影
を取ることにより1文字の切出しを行なっている。
【0003】また、一つの文書画像情報の中の縦書き領
域及び横書き領域の指定は、ユーザーが入力した画像情
報が表示されている表示上で、範囲指定とその範囲内が
縦書きであるのか横書きであるのかの指定をするものが
あった。
【0004】
【発明が解決しようとしている課題】しかしながら、上
記従来の技術では、このため、邦文の文字認識を行う文
字認識装置では、横書きの文書の場合と、縦書き文書の
場合とでは処理が異なる。このため、横書文書或は縦書
文書専用の文字認識装置を用意するか、もしくは文字認
識を行う前に、ユーザにより横書き文書であるか、縦書
き文書であるかを指示する必要があった。
【0005】
【課題を解決する為の手段】上記課題を解決するため
に、本発明は入力した画像情報の水平及び垂直方向のイ
メージデータを計数し、該イメージデータの計数結果を
しきい値と比較し、該比較結果に応じて前記入力した画
像情報の文字列の方向を決定することを特徴とする画像
処理方法を提供する。
【0006】上記課題を解決する為に、本発明は入力し
た画像情報の水平及び垂直方向のイメージデータを計数
する計数手段と、該計数手段によるイメージデータの計
数結果をしきい値と比較する比較手段と、該比較手段に
よる比較結果に応じて前記入力した画像情報の文字列の
方向を決定する方向決定手段とを有することを特徴とす
る画像処理装置を提供する。
【0007】上記課題を解決する為に、好ましくは前記
しきい値を、水平方向用の第1のしきい値と、垂直方向
用の第2のしきい値とを含むものとする。
【0008】上記課題を解決する為に、好ましくは前記
しきい値を、前記画像情報の領域の大きさに対応するも
のとする。
【0009】上記課題を解決する為に、本発明は入力し
た画像情報の水平及び垂直方向のイメージデータを計数
し、該計数したイメージデータの水平及び垂直方向にお
ける最大値を比較し、該比較結果に応じて前記入力した
画像情報の文字列の方向を決定することを特徴とする画
像処理方法を提供する。
【0010】上記課題を解決する為に、本発明は入力し
た画像情報の水平及び垂直方向のイメージデータを計数
する計数手段と、該計数手段により計数したイメージデ
ータの水平及び垂直方向における最大値を比較する比較
手段と、該比較手段による比較結果に応じて前記入力し
た画像情報の文字列の方向を決定する決定手段とを有す
ることを特徴とする画像処理装置を提供する。
【0011】上記課題を解決する為に、好ましくは前記
イメージデータの計数結果を前記画像情報の領域に応じ
て補正するものとする。
【0012】上記課題を解決する為に、本発明は入力し
た画像情報の水平及び垂直方向のイメージデータを計数
し、該計数結果に応じて切り出された文字情報の矩形領
域の縦横比を導出し、該導出される縦横比に従って前記
画像情報の文字列の方向を決定することを特徴とする画
像処理方法を提供する。
【0013】上記課題を解決する為に、本発明は入力し
た画像情報の水平及び垂直方向のイメージデータを計数
する計数手段と、該計数手段による計数結果に応じて切
り出された文字情報の矩形領域の縦横比を導出する導出
手段と、該導出手段により導出される縦横比に従って前
記画像情報の文字列の方向を決定する決定手段とを有す
ることを特徴とする画像処理装置を提供する。
【0014】上記課題を解決する為に、本発明は入力し
た画像情報の水平及び垂直方向のイメージデータを計数
し、該計数結果に応じて前記画像情報における部分領域
の文字列の方向を導出することを特徴とする画像処理方
法を提供する。
【0015】上記課題を解決する為に、本発明は入力し
た画像情報の水平及び垂直方向のイメージデータを計数
する計数手段と、該計数手段による計数結果に応じて前
記画像情報における部分領域の文字列の方向を導出する
導出手段とを有することを特徴とする画像処理装置を提
供する。
【0016】上記従来の技術では、例えば雑誌のように
縦書きと横書きの文書が一つの画像情報の中に混在して
いる場合には、ユーザーが縦書き領域・横書き領域ごと
に領域を範囲指定し、縦書き文書であるか横書き文書で
あるかの指示をしなければならず、面倒であった。
【0017】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0018】〔文字認識装置の説明(図1)〕図1は本
発明の実施例の文字認識装置の概略構成を示すブロック
図であり、本発明の実施例全てに共通の構成である。
【0019】図1において、1は本実施例の文字認識装
置を示している。2は文書画像を読取って入力する入力
部で、例えばスキャナ等により構成され原稿画像データ
をデジタルで入力している。3は装置1全体を制御する
演算処理用の中央処理装置(以下、CPUという)を示
している。4はROMで、CPU3の後述するフローチ
ャートで示された制御プログラムや各種データを格納し
ている。5はメモリ(RAM)で、CPU3のワークエ
リアとして使用されるとともに、入力部2より入力され
た文書画像データを記憶する領域をも備えている。
【0020】6は文字行判定部で、メモリ5に記憶され
た文書画像の文字行の方向、即ち文書画像の文書が縦書
きか横書きかを判定し、図18に示すようにそれらが混
在している場合はそれぞれの領域を抽出している。7は
前処理部で、メモリ5に記憶された文書画像の1文字の
パターンを切出し、各種の正規化を実行している。8は
認識部で、前処理部7によって前処理されたパターンか
ら幾何学的特徴を抽出し、予め認識用辞書9に格納され
ている標準パターンと照合して文書画像の文字認識を行
っている。10は表示部で、入力された文書画像の認識
結果等を表示している。11はシステムバスで、CPU
3よりのデ−タバス、アドレスバス及び制御信号バス等
を含んでいる。12は外部の出力装置、例えばプリンタ
13等とのインターフェース制御を行うインターフェー
ス部を示している。
【0021】〔文書画像の説明(図2)〕図2は実施例
の文字認識装置1に入力される文書画像の一例を示す図
である。
【0022】図2において、21は入力部2で読取られ
る文書画像を示している。そして、22は文書画像21
を水平方向に走査したときの文字画像の射影(黒画素の
計数値)を示し、23は同じく文書画像21を垂直方向
に走査したときの文字画像の射影を示している。24、
25のそれぞれは基準値αを示す線分を示している。
【0023】図2の例では、入力された文書画像21は
横書きの文書であり、各ライン毎に黒画素数をカウント
した計数値が基準値αを越えているライン数が、垂直方
向に比べて水平方向の方が多いことがわかる。
【0024】1.1基準値αを用い、水平方向の黒画素
を1行ごとにカウントする例。
【0025】図3は本実施例のCPU3の動作を説明す
るフローチャートで、この処理を実行する制御プログラ
ムはROM4に記憶されている。
【0026】まずステップS0で、入力部2において、
操作者によりセットされた文書画像を入力部2(スキャ
ナ)により読取って入力し、メモリ5に記憶する。次に
ステップS2に進み、文字判定部6において、メモリ5
に記憶された文書画像が横書きか縦書きかを判別する。
これはメモリ5に記憶されている文書画像の水平方向、
垂直方向の射影(黒画素数)を求め、その画素数が基準
値α以上となるライン数が、文書画像全体のライン数の
どれくらいになるかを求めて比較する。
【0027】この文字行判定部6で実行されるステップ
S2の詳細は図4に示す通りである。図4に従って説明
すると、まずステップS11で水平方向の1ライン毎に
黒画素の数をカウントし、ステップS12でその計数値
が基準値α以上となるライン数を求める。これを文書画
像の水平方向の全ライン(THとする)に対して行な
い、基準値α以上となったライン数UHを求める。そし
て、全ライン数THに対して、基準値α以上となったラ
イン数UHを基に、その割合RHを求める。このRH
は、以下に示す式により求められる。
【0028】RH=UH/TH
【0029】次にステップS13に進み、同様にして垂
直方向の射影を考える。ここでは、文書画像の垂直方向
の1ライン毎に黒画素の数をカウントする。ステップS
14では、この計数値が基準値α以上であるかチェック
し、これを垂直方向の全ライン(TVとする)に対して
行ない、基準値α以上となったライン数UVを求める。
そして、全ライン数TVに対する基準値α以上となった
ライン数UVを基に、基準値α以上となったライン数の
割合RVを求める。このRVは、以下に示す式で求めら
れる。
【0030】RV=UV/TV こうして、ステップS15に進み、基準値α以上となっ
た水平方向及び垂直方向のライン数の全ライン数に対す
る割合RH、RVを比較する。ここで、RH≧RVを満
たせば、文書画像は横書きであると判定される。
【0031】再び、図3のフローチャートに戻り、横書
き文書のときはステップS3に進み、前処理部7におい
て横書き用の前処理を行なう。この横書き用の前処理と
は、まず水平方向の射影をとって文字行を抽出し、抽出
された1行あるいは複数行毎に垂直方向の射影を取るこ
とにより1文字を切出す文字切出し処理、位置、傾き、
線幅、濃度等の正規化処理、雑音除去処理等である。
【0032】また、ステップS2において、RH≧RV
を満たさなかった場合は、メモリ5に記憶されている文
書画像は縦書きであると判定してステップS4に進み、
前処理部7において縦書き用の前処理を行なう。この縦
書き用の前処理とは、まず垂直方向の射影をとって文字
行を抽出し、抽出された1行あるいは複数行毎に水平方
向の射影をとることにより1文字を切り出す文字切出し
処理、位置、傾き、線幅、濃度等の正規化処理、雑音除
去処理等である。
【0033】次にステップS5に進み、前処理部7にお
いて前処理された1文字毎の未知文字パターンに対し
て、認識部8で輪郭線特徴等の抽出を行なう。この認識
用辞書9には、認識対象となっている全ての文字の標準
パターンの特徴が記憶されている。この未知文字パター
ンの特徴と、辞書9に記憶されている標準パターンの特
徴をマッチングさせて最も確からしいものを認識結果と
してメモリ5に記憶し、入力された文書画像内の全文字
を同様に認識してメモリ5に記憶する。次にステップS
6に進み、メモリ5に記憶された認識結果を表示部10
に表示する。尚、プリンタ13より文字等を出力する処
理については説明を省略している。
【0034】以上の説明により、第1の実施例によれ
ば、横書き文書にも縦書き文書にも対応できる、ユーザ
にとって使い易い文字認識装置を実現することができ
る。
【0035】1.2 1.1の変形で、垂直方向からカ
ウントする例。
【0036】図5は図3のステップS2の横書きか縦書
きを判別する実施例の処理を示すフローチャートで、こ
こでは1.1の実施例のステップS11とS12と、ス
テップS13とS14を実行する順序を逆にしている。
即ち、1.1の実施例では水平方向の次に垂直方向の画
素数を計数するようにしているが、本実施例では最初に
垂直方向の黒画素数を計数し、その後水平方向の黒画素
数を計数するようにしている。尚、本実施例における文
字認識装置の構成は図1に示す構成と同様である。
【0037】以上の説明により、本実施例においても、
前述の1.1の実施例と同様の作用・効果を得ることが
できる。
【0038】1.3 1.1の変形で、白画素をカウン
トする例。
【0039】図6は本実施例を示すフローチャートであ
る。ここでは、1.1の実施例のステップS2における
黒画素のカウントを白画素のカウントに置換えている。
尚、この実施例における文字認識装置の構成及びステッ
プS2以外のフローチャートは、1.1の実施例(図1
と図3)と同じである。
【0040】まずステップS31で、水平方向の1ライ
ン毎に白画素の数をカウントする。次にステップS32
で、その画素数が基準値α以上であるかチェックし、こ
のカウント数が入力画像全域で何ライン基準値α以上と
なったかカウントする。そして、基準値α以上となった
ライン数の全ライン数に対する割合をRHとする。
【0041】次にステップS33に進み、同様にして、
垂直方向の1ライン毎に白画素の数をカウントする。次
にステップS34で、その画素数が基準値α以上である
かチェックし、このカウント数が入力画像全域で何ライ
ン基準値α以上となったかカウントする。そして、基準
値α以上となったライン数の全ライン数に対する割合を
RVとする。
【0042】次にステップS35に進み、前述のRHと
RVを比較し、RH≦RVを満たせば横書きと判定し、
満たさなければ縦書きと判定する。
【0043】以上の説明により、本実施例においても前
述の実施例と同様の作用・効果を得ることができる。
【0044】1.4 1.1の変形で複数行をカウント
する例。
【0045】図7は本実施例を示すフローチャートであ
る。ここでは、1.1の実施例のステップS2における
1ライン毎の黒画素のカウントを複数ライン毎の黒画素
のカウントに置換えている。この実施例における文字認
識装置の構成及びステップS2以外のフローチャートは
1.1の実施例(図1と図3)と同じである。
【0046】まずステップS41で水平方向の複数ライ
ン毎に黒画素の数をカウントする。そしてステップS4
2で、このカウンタ数が基準値α以上であるかチェック
し、入力画像全域で何ラインが基準値α以上となったか
をみる。そして、基準値α以上となったライン数の、全
ライン数に対する割合をRHとする。
【0047】同様にして、ステップS43で垂直方向に
黒画素数を計数し、ステップS44で基準値α以上とな
ったライン数の、全ライン数に対する割合をRVとす
る。
【0048】こうして求めたRHとRVとをステップS
45で比較して、RH≧RVを満たせば横書きと判定
し、満たされなければ縦書きと判定する。
【0049】以上の説明により本実施例においても前述
の実施例と同様の作用・効果を得ることができる。
【0050】1.5 1.3の変形で垂直方向からカウ
ントする例。
【0051】前述した1.3の実施例において、前述の
1.2の実施例の如く水平方向と垂直方向の順序を入れ
換えても、1.1の実施例と同様の作用・効果を得るこ
とができる。なお、このときの文字認識装置のブロック
図、フローチャートは1.1の実施例(図1と図3)と
同様であり、フローチャートのステップS2は図6のS
31、S32と、S33、S34とを入れ換えて、ステ
ップS33、S34、S31そしてS32の順に実行す
る。
【0052】1.6 1.3の変形で複数行のカウント
をする例。
【0053】前述の1.3の実施例において、前述の
1.4の実施例の如く1ライン毎のカウントを複数ライ
ン毎にしても第1の実施例と同様の効果が得られる。
尚、このときの文字認識装置のブロック図、フローチャ
ートは1.1の実施例(図1と図3)と同じであり、フ
ローチャートのステップS2は図6のS31とS33の
「1ライン毎」を「複数ライン毎」に入れ換えたものと
同じである。
【0054】1.7 1.4の変形で垂直方向からカウ
ントする例。
【0055】前述の1.4の実施例において、1.2の
実施例の如く水平方向と垂直方向の順序を入れ換えて
も、1.1の実施例と同様の作用・効果を得ることがで
きる。尚、このときの文字認識装置のブロック図、フロ
ーチャートは1.1の実施例(図1と図3)と同じであ
る。そして、1.7の実施例のフローチャートのステッ
プS2(図3)は図7のS43、S44とS41、S4
2とを入れ換えて、ステップS43、S44、S41そ
してS42の順で実行したものと同じである。
【0056】1.8 1.1の変形で、カウント結果が
基準値α以下の行に注目する例。
【0057】1.1の実施例のステップS2(図4)に
おける「黒画素数が基準値α以上」を「黒画素数が基準
値α以下」におきかえても良い。この実施例における文
字認識装置の構成及びステップS2以外のフローチャー
トは1.1の実施例(図1と図3)と同じである。
【0058】1.8の実施例のフローチャートのステッ
プS2の詳細を図8に示す。
【0059】ステップS51で水平方向の1ライン毎に
黒画素の数をカウントし、基準値α以下であるかチェッ
クする。そして、ステップS52で、入力画像全域で何
ラインが基準値α以下となったかカウントし、そのライ
ン数の全ライン数に対する割合をRHとする。
【0060】次にステップS53で、垂直方向の1ライ
ン毎に黒画素の数をカウントする。ステップS54で
は、基準値α以下であるかチェックして、入力画像全域
で何ラインが基準値α以下となったかカウントし、その
ライン数の割合をRVとする。次にステップS55に進
み、この求めたRHとRVを比較してRH≦RVを満た
せば、文書画像が横書きの文章画像と判定し、満たさな
ければ縦書きと判定する。
【0061】以上の説明により、1.8の実施例におい
ても前述の1.1の実施例と同様の作用・効果を得るこ
とができる。
【0062】以上説明したように本実施例によれば、文
書の文字列の方向を自動的に判定して、文書画像が横書
き文書或は縦書き文書であるかを認識できるようにな
る。このため、文書原稿を読取って認識する際、ユーザ
が一々縦書き文書か横書き文書かを指示しなくて良くな
り、文字認識の操作性が向上する効果がある。
【0063】2.1垂直方向と水平方向の基準値を変え
る方法。
【0064】図9に示すように、1.1で説明した図2
に代えて、水平方向の基準値としてα、垂直方向の基準
値としてβを定めることとする。
【0065】この、α、βの決定は、図10のフローチ
ャートに示すように、画像情報を入力した後に行う。図
10のフローチャートにおいて図3のフローチャートと
異るのはS1のみなのでここだけ説明する。
【0066】S1における基準値α、βの決定は、以下
のように行われる。
【0067】初期基準値をB、文書画像の指定領域にお
ける水平方向の全ラインをTH、垂直方向の全ラインを
TVとすると、水平方向の基準値αは
【0068】
【外1】 垂直方向の基準値βは
【0069】
【外2】 ここにおいて、SH,SV,tH,tVはそれぞれα、βを
補正する補正値である(SH≠0,SV≠0)。
【0070】このように文書画像の指定領域の高さや幅
を用いることにより、指定領域の縦横比に影響されずに
正確に縦書き、横書きを判定可能となった。
【0071】なお、図9は縦書き、横書きを判定する領
域として文書画像すべてを選んでいる。
【0072】S1において定められたα、βを、1.1
から1.8で説明した図4から図8の処理における基準
値に用いることができる(図示せず)。
【0073】2.2黒画素カウント数の最大値を用いる
例。
【0074】図11は図3のS2の横書きか縦書きかを
判別する処理を示すフローチャートである。
【0075】ステップS61で水平方向、垂直方向それ
ぞれ黒画素数の最大値を求め、ステップS62でそれら
の最大値を水平方向のライン数TH、垂直方向のライン
数TV、補正計数を用いて補正する。ステップS63で
それぞれ補正された水平方向、垂直方向の黒画素の最大
値を比較して、水平方向の方が大きければ横書き、小さ
ければ縦書きと判定する。
【0076】尚、本実施例における画像処理装置の構成
は図1に示す構成と同様である。
【0077】3.1縦書き・横書き両方を仮定し、認識
結果の類似度により判断する例。
【0078】図12は図3のステップS2の横書きか縦
書きを判別する実施例の処理を示すフローチャートであ
る。
【0079】ステップS71で水平方向のヒストグラム
により矩形を切り出し(図13)、その中で垂直方向の
ヒストグラムをとり、ひとつまたは複数個の矩形を抽出
する(図14)。なお、図14は1行目から抽出した矩
形のみ表示している。
【0080】次にステップS72で垂直方向のヒストグ
ラムにより矩形を切り出し(図15)、その中で水平方
向のヒストグラムをとり、ひとつまたは複数個の矩形を
抽出する(図16)。
【0081】次にステップS73でステップS71、ス
テップS72で抽出した矩形を認識し、ステップS74
でその類似度の高さにより横書きか縦書きかを判定して
いる。
【0082】3.2縦書き・横書き両方を仮定し、抽出
された矩形領域の縦横比により判断する例。
【0083】図17は図3のステップS2の横書きか縦
書きを判別する実施例の処理を示すフローチャートであ
る。ステップS81で水平方向のヒストグラムにより矩
形を切り出し(図13)、その中で垂直方向のヒストグ
ラムをとり、ひとつまたは複数個の矩形を抽出する(図
14)。なお、図14は1行目から抽出した矩形のみ表
示している。
【0084】次にステップS82で垂直方向のヒストグ
ラムにより矩形を切り出し、(図15)、その中で水平
方向のヒストグラムをとり、ひとつまたは複数個の矩形
を抽出する(図16)。
【0085】次にステップS83でステップS81、ス
テップS82で抽出した矩形の縦横比を計算する。
【0086】図14、図16の例では明らかにステップ
S81で抽出した矩形の方が縦:横=1:1に近い。
【0087】ステップS84で、縦横比が1:1に近い
方がステップS81で求めたものであれば横書き、そう
でなければ縦書きと判定している。
【0088】4.1 1つの文書に縦書きと横書きの領
域が混在する例。
【0089】図18は実施例の文字認識装置1に入力さ
れる縦書きと横書きの領域が混在する文書画像の一例を
示す図である。
【0090】図18において、31は入力部2で読み取
られる文書画像を示している。そして、32は文書画像
21を水平方向に走査したときの文字画像の射影(黒画
素の計数値)を示し、33は同じく文書画像31を垂直
方向に走査したときの文字画像の射影を示している。3
4、35のそれぞれは基準値α、βを示す線分を示して
いる。
【0091】36、42は文字行・領域判定部において
判定された横書き領域、37は同じく縦書き領域を示し
ている。38〜40はそれぞれ文字がそこにあることを
示している。41は文字がないと判定された領域を示
す。
【0092】図18の例では、入力された文書画像31
は横書き、縦書き混在の文書である。
【0093】図19は第1の実施例のCPU3の動作を
説明するフローチャートで、この処理を実行する制御プ
ログラムはROM4に記憶されている。
【0094】まずステップS100で、入力部2におい
て、操作者によりセットされた文書画像を入力部2(ス
キャナ)により読み取って入力し、メモリ5に記憶す
る。次にステップS101に進み、文字判定部6におい
て、メモリ5に記憶された文書画像の横書き領域と縦書
き領域を抽出する。これはメモリ5に記憶されている文
書画像の水平方向、垂直方向の射影(黒画素数)を求
め、その画素数がそれぞれ基準値α、β以上となるライ
ン数が、どれくらいになるかを求めて比較する。
【0095】この文字行判定部6で実行されるステップ
S101の詳細は図20に示す通りである。図20に従
って説明すると、まずステップS111で水平方向の1
ライン毎に黒画素の数をカウントし、その計数値が基準
値α以上となる領域を求める。図18では36がその領
域である。
【0096】同様に垂直方向に関してステップS112
で領域を求める。図18の36、37がその領域にあた
る。
【0097】ステップS113で文書画像中の横書き領
域、縦書き領域を決定する。
【0098】ステップS111、S112により文書画
像は図21に示す4領域に分けられる。
【0099】領域A…水平・垂直共に基準値以上 領域A内だけで再度ヒストグラムをとり、ヒストグラム
の水平・垂直各々の最大値から基準値を引いた値が、水
平の方が大きければ横書き領域とする。そうでなければ
縦書き領域とする。
【0100】領域B…水平のみ基準値以上 横書き領域とする。図18の領域32は横書き領域とな
る。尚、領域36と42は隣合っていて文書方向が同一
なので、2つの領域を結合して一つの領域とする。
【0101】領域C…垂直のみ基準値以上 縦書き領域とする。図18の領域37は縦書き領域とな
る。
【0102】領域D…水平・垂直共に基準値未満 この領域内で、再度水平・垂直方向のヒストグラムをと
り、基準値を引いてその値の大きい方が水平なら横書き
と判定する。そうでなければ縦書き領域。尚、領域内の
ヒストグラムが0であれば文字がないということであ
り、図18の領域41がそうである。
【0103】また前記基準値は文書画像の幅、高さによ
って補正する。
【0104】縦書き、横書きの領域が判定されたら、ス
テップS114で領域の認識順序を決定する。例えば、
座標が上のものから順序をつける。
【0105】再び、図19のフローチャートに戻り、横
書き領域のときはステップS103に進み、前処理部7
において横書き用の前処理を行なう。この横書き用の前
処理とは、まず水平方向の射影をとって文字行を抽出
し、抽出された1行あるいは複数行毎に垂直方向の射影
を取ることにより1文字を切出す文字切出し処理、位
置、傾き、線幅、濃度等の正規化処理、雑音除去処理等
である。
【0106】また、ステップS102において、縦書き
と判定された場合は、ステップS104に進み、前処理
部7において縦書き用の前処理を行なう。この縦書き用
の前処理とは、まず垂直方向の射影をとって文字行を抽
出し、抽出された1行あるいは複数行毎に水平方向の射
影をとることにより、1文字を切り出す文字切出し処
理、位置、傾き、線幅、濃度等の正規化処理、雑音除去
処理等である。
【0107】次にステップS105に進み、前処理部7
において前処理された1文字毎の未知文字パターンに対
して、認識部8で輪郭線特徴等の抽出を行なう。この認
識用辞書9には、認識対象となっている全ての文字の標
準パターンの特徴が記憶されている。この未知文字パタ
ーンの特徴と、辞書9に記憶されている標準パターンの
特徴をマッチングさせて最も確からしいものを認識結果
としてメモリ5に記憶し、入力された文書画像内の全文
字を同様に認識してメモリ5に記憶する。
【0108】次にステップS106に進み、認識してい
ない領域があればステップS102に戻り、すべての領
域の認識が終了したらステップS107へ進む。次にス
テップS107では、メモリ5に記憶された認識結果を
表示部10に表示する。尚、プリンタ13より文字等を
出力する処理については説明を省略している。
【0109】以上の説明により、本実施例によれば、横
書き文書にも縦書き文書にも両方の混在文書にも対応で
きる、ユーザにとって使い易い文字認識装置を実現する
ことができる。
【0110】4.2縦書きと横書きの判定及び認識順序
をオペレータに確認させる例。
【0111】図22は本実施例を示すフローチャートで
図19のステップS101の詳細を示している。
【0112】ステップS111〜S114で縦書き領
域、横書き領域を4.1の実施例と同様に求める。次に
ステップS115において、抽出した領域の属性(縦、
横書き)、認識順序が正しいか確認をユーザーに求めて
確定する。
【0113】
【発明の効果】以上説明したように、本発明によれば、
入力した画像情報のイメージデータを水平方向と垂直方
向で各々カウントし、このデータの大きさによってその
画像情報における文字列の方向を判定することができる
為、オペレータがわざわざ方向情報を付加したり、指示
したりする必要がなくなり、処理が簡便になるという効
果がある。
【0114】また、画像情報の方向を判定する際に、イ
メージデータをカウントした結果を比較する為のしきい
値を画像情報の大きさに対応した値を用いることによ
り、対象とする画像情報に制限を作らない自在な処理が
可能となる。
【0115】以上説明したように、本発明によれば、イ
メージデータをカウントした結果から、一つの画像情報
の中の部分的に文字列が、縦書きになっている領域や横
書きになっている領域を検出できる。これにより、一つ
の画像情報内に縦書きと横書きが混在していてもオペレ
ータの手を煩わすことなく判定できるという効果があ
る。
【図面の簡単な説明】
【図1】本発明の実施例の画像処理装置の構成を示すブ
ロック図。
【図2】本実施例で入力される文書画像情報の射影を取
った第1の例示図。
【図3】本実施例の文字認識処理を示す第1のフローチ
ャート。
【図4】本実施例の文字列の方向を検知する処理を示す
第1のフローチャート。
【図5】本実施例の文字列の方向を検知する処理を示す
第2のフローチャート。
【図6】本実施例の文字列の方向を検知する処理を示す
第3のフローチャート。
【図7】本実施例の文字列の方向を検知する処理を示す
第4のフローチャート。
【図8】本実施例の文字列の方向を検知する処理を示す
第5のフローチャート。
【図9】本実施例で入力される文書画像情報の射影を取
った第2の例示図。
【図10】本実施例の文字認識処理を示す第2のフロー
チャート。
【図11】本実施例の文字列の方向を検知する処理を示
す第6のフローチャート。
【図12】本実施例の文字列の方向を検知する処理を示
す第7のフローチャート。
【図13】3.1の実施例を説明する為の第1の図。
【図14】3.1の実施例を説明する為の第2の図。
【図15】3.1の実施例を説明する為の第3の図。
【図16】3.1の実施例を説明する為の第4の図。
【図17】本実施例の文字列の方向を検知する処理を示
す第8のフローチャート。
【図18】本実施例で入力される文書画像情報の射影を
取った第3の例示図。
【図19】本実施例の文字認識処理を示す第3のフロー
チャート。
【図20】本実施例の文字列の方向を検知する処理を示
す第9のフローチャート。
【図21】ヒストグラムの結果と基準値との比較による
領域の分離を説明する為の図。
【図22】本実施例の文字列の方向を検知する処理を示
す第10のフローチャート。

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 入力した画像情報の水平及び垂直方向の
    イメージデータを計数し、該イメージデータの計数結果
    をしきい値と比較し、 該比較結果に応じて前記入力した画像情報の文字列の方
    向を決定することを特徴とする画像処理方法。
  2. 【請求項2】 前記しきい値は、水平方向用の第1のし
    きい値と、垂直方向用の第2のしきい値とを含むことを
    特徴とする請求項1に記載の画像処理方法。
  3. 【請求項3】 前記しきい値は、前記画像情報の領域の
    大きさに対応することを特徴とする請求項1に記載の画
    像処理方法。
  4. 【請求項4】 入力した画像情報の水平及び垂直方向の
    イメージデータを計数し、該計数したイメージデータの
    水平及び垂直方向における最大値を比較し、 該比較結果に応じて前記入力した画像情報の文字列の方
    向を決定することを特徴とする画像処理方法。
  5. 【請求項5】 前記イメージデータの計数結果を前記画
    像情報の領域に応じて補正することを特徴とする請求項
    4に記載の画像処理方法。
  6. 【請求項6】 入力した画像情報の水平及び垂直方向の
    イメージデータを計数し、 該計数結果に応じて切り出された文字情報の矩形領域の
    縦横比を導出し、 該導出される縦横比に従って前記画像情報の文字列の方
    向を決定することを特徴とする画像処理方法。
  7. 【請求項7】 入力した画像情報の水平及び垂直方向の
    イメージデータを計数し、 該計数結果に応じて前記画像情報における部分領域の文
    字列の方向を導出することを特徴とする画像処理方法。
  8. 【請求項8】 入力した画像情報の水平及び垂直方向の
    イメージデータを計数する計数手段と、 該計数手段によるイメージデータの計数結果をしきい値
    と比較する比較手段と、 該比較手段による比較結果に応じて前記入力した画像情
    報の文字列の方向を決定する方向決定手段とを有するこ
    とを特徴とする画像処理装置。
  9. 【請求項9】 前記しきい値は、水平方向用の第1のし
    きい値と、垂直方向用の第2のしきい値とを含むことを
    特徴とする請求項8に記載の画像処理装置。
  10. 【請求項10】 前記しきい値は、前記画像情報の領域
    の大きさに対応することを特徴とする請求項8に記載の
    画像処理装置。
  11. 【請求項11】 入力した画像情報の水平及び垂直方向
    のイメージデータを計数する計数手段と、 該計数手段により計数したイメージデータの水平及び垂
    直方向における最大値を比較する比較手段と、 該比較手段による比較結果に応じて前記入力した画像情
    報の文字列の方向を決定する決定手段とを有することを
    特徴とする画像処理装置。
  12. 【請求項12】 前記イメージデータの計数結果を前記
    画像情報の領域に応じて補正する補正手段を有すること
    を特徴とする請求項11に記載の画像処理装置。
  13. 【請求項13】 入力した画像情報の水平及び垂直方向
    のイメージデータを計数する計数手段と、 該計数手段による計数結果に応じて切り出された文字情
    報の矩形領域の縦横比を導出する導出手段と、 該導出手段により導出される縦横比に従って前記画像情
    報の文字列の方向を決定する決定手段とを有することを
    特徴とする画像処理装置。
  14. 【請求項14】 入力した画像情報の水平及び垂直方向
    のイメージデータを計数する計数手段と、 該計数手段による計数結果に応じて前記画像情報におけ
    る部分領域の文字列の方向を導出する導出手段とを有す
    ることを特徴とする画像処理装置。
JP03190238A 1990-08-03 1991-07-30 画像処理方法及び装置 Expired - Fee Related JP3135290B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP03190238A JP3135290B2 (ja) 1991-07-30 1991-07-30 画像処理方法及び装置
EP91307105A EP0472313B1 (en) 1990-08-03 1991-08-02 Image processing method and apparatus therefor
DE69130469T DE69130469T2 (de) 1990-08-03 1991-08-02 Gerät und Verfahren zur Bildverarbeitung
US08/135,129 US5696841A (en) 1990-08-03 1993-10-12 Image processing method and apparatus for extracting vertically and horizontally written text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03190238A JP3135290B2 (ja) 1991-07-30 1991-07-30 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH0535910A true JPH0535910A (ja) 1993-02-12
JP3135290B2 JP3135290B2 (ja) 2001-02-13

Family

ID=16254801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03190238A Expired - Fee Related JP3135290B2 (ja) 1990-08-03 1991-07-30 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP3135290B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112599A (ja) * 1998-10-01 2000-04-21 Sharp Corp 文書画像処理装置及び文書画像処理方法
JP2001282785A (ja) * 2000-03-30 2001-10-12 Sharp Corp 文書画像処理装置およびそのための方法、ならびに文書画像処理プログラムを記録したコンピュータで読取可能な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112599A (ja) * 1998-10-01 2000-04-21 Sharp Corp 文書画像処理装置及び文書画像処理方法
JP2001282785A (ja) * 2000-03-30 2001-10-12 Sharp Corp 文書画像処理装置およびそのための方法、ならびに文書画像処理プログラムを記録したコンピュータで読取可能な記録媒体

Also Published As

Publication number Publication date
JP3135290B2 (ja) 2001-02-13

Similar Documents

Publication Publication Date Title
US5696841A (en) Image processing method and apparatus for extracting vertically and horizontally written text
US6385338B1 (en) Image processing method and apparatus
EP0834826B1 (en) Positioning templates in optical character recognition systems
US5889897A (en) Methodology for OCR error checking through text image regeneration
US5799115A (en) Image filing apparatus and method
US5557689A (en) Optical word recognition by examination of word shape
US5640466A (en) Method of deriving wordshapes for subsequent comparison
US7305619B2 (en) Image processing method, device and storage medium therefor
JPH1139428A (ja) 文書映像の方向修正方法
JP4553241B2 (ja) 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
US6275608B1 (en) Image processing method and apparatus and memory medium
US6771842B1 (en) Document image skew detection method
US6947596B2 (en) Character recognition method, program and recording medium
EP0457534A2 (en) Image processing method and apparatus
US5271067A (en) Optical character recognition apparatus
JP3135290B2 (ja) 画像処理方法及び装置
JP2868134B2 (ja) 画像処理方法及び装置
JPH06103411A (ja) 文書読取装置
JPH0490083A (ja) 文字認識装置
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP3787377B2 (ja) 文書方向判定方法及び装置及び文字認識方法及び装置
JP3086653B2 (ja) 文字認識方法及び文字認識装置
JP3548234B2 (ja) 文字認識方法及び装置
JP4056745B2 (ja) 文字認識方法および文字認識装置
JP3345246B2 (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101201

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees