JPH08305792A

JPH08305792A - 画像処理装置及び方法

Info

Publication number: JPH08305792A
Application number: JP7108534A
Authority: JP
Inventors: Yukari Toda; ゆかり戸田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1995-05-02
Filing date: 1995-05-02
Publication date: 1996-11-22
Anticipated expiration: 2020-10-26
Also published as: JP3710164B2

Abstract

(57)【要約】【目的】入力された原稿画像中の文字種を効率良く判
定することで、下位の処理、例えば文字認識処理におけ
る処理精度を上げることを可能にする。【構成】入力した原稿画像中の文字列パターンの行が
判別されると、その行領域を文字列の並び方向に沿って
４つの領域に分割し、それぞれの領域内の黒画素数Ｂ１
〜Ｂ４を計数する（Ｓ１０６）。そして、その計数した
各領域における中央部分或いは下部分に対するドット数
の存在する割合が所定以上であるかどうかを判定し（Ｓ
１０７）、そのいずれかの条件を満足する場合には注目
行は英語文字であると判定し（Ｓ１０８）、満足しない
場合には日本語文字と判定する（Ｓ１０９）。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は画像処理装置及び方法、
詳しくは入力された原稿画像中の文字種を判定し下位の
処理に渡す画像処理装置及び方法に関するものである。

【０００２】

【従来の技術】情報が溢れる現代社会において情報管
理、検索が容易になる情報の電子化が早急に望まれてい
る。情報の電子化には、スキャナなどの入力装置で読み
取った画像である文字を文字コードに変換するＯＣＲ
（光学的文字認識）が必須であり、その精度はどんどん
向上してきている。

【０００３】ＯＣＲは日本語（漢字、ひらがな、カタカ
ナ）と英語その他（アルファベット）の特性の違いのた
め、アルファベット（特に小文字）を日本語ＯＣＲで認
識するのは困難であることから、それぞれ別の認識アル
ゴリズムを用いたり、アルゴリズムは同じでも辞書の切
り替えを行ったりする。従って、アルファベットと日本
語を判別するための技術が必要になる。

【０００４】従来、アルファベットと日本語を判別する
方法はなかったため、ユーザがオペレーションパネルや
キーボード或いはポインティングデバイス等を操作し
て、それらを区別するための指示を行っていた。

【０００５】

【発明が解決しようとする課題】しかしながら、これで
はユーザの手間が多大であるし、さらに以下のような問
題点がある。

【０００６】複数枚のデータを読み込む際、ＡＤＦ（オ
ートドキュメントフィーダ）がユーザに原稿指し替え作
業を削減するが、その複数ページ中に英語のドキュメン
ト、日本語のドキュメントが入り混じっている可能性が
ある。一枚読み込む毎にユーザの指示を待っていたので
は、ＡＤＦの利点が台無しになってしまう。また、全ペ
ージ読み込んだ後にユーザの指示を受ける形式にするに
は大量のメモリが必要になる。

【０００７】

【課題を解決するための手段】及び

【作用】本発明はかかる問題点に鑑みなされたものであ
り、入力された原稿画像中の文字種を効率良く判定する
ことで、下位の処理、例えば文字認識処理における処理
精度を上げることを可能にする画像処理装置及び方法を
提供しようとするものである。

【０００８】この課題を解決するため、例えば本発明の
画像処理装置は以下の構成を備える。すなわち、原稿画
像を入力して、当該原稿中の文字の種別を判定し下位の
処理に渡す画像処理装置であって、入力された原稿画像
中の文字列パターンを含む行を判別する判別手段と、判
別された行の領域を、当該行に含まれる文字列の並び方
向に平行な複数領域に分割する分割手段と、分割された
各領域中の有意なドットを計数する計数手段と、該計数
手段で計数された値に基づいて、ドット分布を算出する
算出手段と、算出されたドット分布に基づいて注目行の
文字種を判定する判定手段とを備える。

【０００９】また、本発明の好適な実施態様に従えば、
前記下位処理は文字認識処理であって、前記判定手段で
判定された結果に応じて認識処理するときに使用する認
識アルゴリズム、又は、認識アルゴリズムと認識辞書、
或いは任磁気辞書を選択させることが望ましい。これに
よって、認識処理で使用される認識アルゴリズム又は認
識辞書を予め選択できるので認識速度及び認識の精度を
高めることが可能になる。

【００１０】また、算出手段は、分割された各領域のほ
ぼ中央の領域に対するドットの存在割合を算出し、前記
判定手段は、算出された割合が所定以上の場合には、注
目行はアルファベット文字であると判定し、所定以下の
場合には漢字圏文字であると判定することが望ましい。
これによって、漢字圏の文字とアルファベットの文字を
精度良く判定することが可能になる。

【００１１】また、前記判別手段は、文字列パターンの
並び方向に投影したドット分布に基づいて行を判別する
ことが望ましい。これによって、精度良く行を判別する
ことが可能になる。

【００１２】また、更に、前記入力された原稿画像中の
ノイズ除去するノイズ除去手段を備えることが望まし
い。この結果、ノイズによる影響をなくすことができる
ので、行の判別をより精度良く行なえる。

【００１３】また、更に、前記入力された画像を所定角
度だけ回転させて、正立画像としての方向を決定する手
段を備えることが望ましい。これによって、原稿画像の
入力方向に応じて判定することが可能になる。

【００１４】また、更に、前記入力された画像が傾いて
いるときに、傾きを補正する手段を備えることが望まし
い。これによって、傾いて入力された原稿画像もより精
度良く処理できる。

【００１５】

【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。

【００１６】実施例における文字認識装置のブロック構
成を図１２に示す。図中、１は装置全体の制御を司るＣ
ＰＵ、２はブートプログラム等を記憶しているＲＯＭ、
３はＣＰＵ１が実行処理するプログラムやオペレーティ
ングシステム（ＯＳ）を記憶するＲＡＭである。４は例
えばハードディスク装置等の外部記憶装置であって、こ
こにＯＳ、文字認識処理に係るプログラム、更には認識
辞書（日本語文字用と英語文字用）が格納されている。
５はキーボードやポインティングデバイス等で構成され
る入力装置、６は原稿画像を読み取るイメージスキャナ
である。７は読み取った画像を一時的に記憶する画像メ
モリ、８は各種メッセージや認識された情報を表示する
表示装置である。

【００１７】上記の構成における実施例の処理を説明す
る前に、まず、日本語と英語の文字列について考察す
る。

【００１８】日本語における文字は、概して、その文字
高さ一杯に書かれているのに対して、英語ではｌやｙな
どが存在するため高さを数等分した真ん中の部分にその
線分（すなわちドット）が集中する。そのため、この集
中の度合でもって、認識対象の文字列が日本語であるの
か英語であるのかを判別できる。

【００１９】日本語と英語の一例を図７に示す。図７
（ａ）は日本語の一例であり、同図（ｂ）が英語の一例
であるが、英語（ｂ）が４等分した場合の領域（２）
（３）に黒画素が集中しているのに対して、同図（ａ）
の如く日本語では比較的全体的に分布している。同図
（ｃ）はｙのような下に出っ張る文字が存在しない場合
の英語である。この場合は領域（３）（４）に黒画素が
集中する。

【００２０】以上の原理に基づいて、第１の実施例の動
作処理を図１のフローチャートに従って説明する。尚、
同フローチャートに基づくプログラムは外部記憶装置４
に格納されていて、それをＲＡＭ３上にロードすること
で実行する。

【００２１】本実施例では、１行を小領域に分ける時の
その分割数ｎを４とし、その黒画素分布の比の計算を黒
画素分布Ｒ１、Ｒ２を以下のようにして決定する。

【００２２】Ｒ１＝（Ｂ２＋Ｂ３）／（Ｂ１＋Ｂ４）Ｒ２＝（Ｂ３＋Ｂ４）／（Ｂ１＋Ｂ２）尚、Ｂ１〜Ｂ４は、それぞれの領域における黒画素数を
示している。従って、黒画素分布Ｒ１は領域（２）、
（３）が領域（１）、（４）に対してどの程度の黒画素
を有しているのかを示す値を、Ｒ２は領域（３）、
（４）が領域（１）、（２）に対してどの程度の黒画素
を有しているのかを示す値を意味することになる。尚、
特定の領域が占める黒画素の多さを算出するものとして
は、上記に限定されるものではなく、それ以外の尺度で
もって算出しても良いのは勿論である。さて、スキャナ
などの画像入力装置により入力されたビットマップ画像
は、ステップＳ１０１でブロック分けが行われる。

【００２３】１画素１ビットの２値ビットマップ画像の
一例を図２（ａ）に示す。本実施例では単純２値化され
た２値画像が好ましい。そのビットマップ画像を図２
（ｂ）の形にするのが、ステップＳ１０１の領域分離処
理である。

【００２４】領域分離処理の一例のフローチャートを図
３に示す。ステップＳ３０１でビットマップ画像にｍ×
ｍ画素サイズのウインドウを定義し、このウインドウ内
に所定数（実施例では“１”とした）の黒画素があった
ら、該当するウインドウを黒とし、解像度を大幅に減ら
し文字部分を連結させる。ステップＳ３０１の解像度変
換した様子を図４に示す。次にステップＳ３０２で輪郭
線追跡をすると、文字特有の細長いパターンとその他の
図形を区別することができる。最後のステップＳ３０３
では、同一グループ連結処理で、隣接するテキスト部を
結合させることによって図２（ｂ）のように領域分離す
ることができる。

【００２５】実施例においては、各ブロックを定義する
ために、ブロック定義用のデータ構造体を決めた。図５
（ａ）がその構造体であり、ブロックの種別を定義する
要素“type”（short 型）、ブロックの左上隅位置ｘ座
標及びｙ座標を定義する要素“startx”,“starty”
（各々をshort 型）、ブロックの幅と高さを定義する
要素“width”,“height”（各々short型）、そして、
次のブロックのアドレスを記憶するための要素“next_a
ddress”で構成される。

【００２６】ここで、要素“type”は、０〜２のいずれ
かの数値が割り当てられ、“０”が該当するブロックは
“タイトル”であることを、“１”は“テキスト”、
“２”は“その他（図形や写真等）”であることを示
す。

【００２７】尚、各ブロックの種別を判定する手法であ
るが、実施例では図４に示すように解像度を下げて処理
した場合（このとき文字パターンどうしは互いに連結さ
れてしまい一塊の黒画素領域になる）、その領域の輪郭
を追跡していって、細長い連なりかどうかを判定し、細
長い（縦横比が所定条件を満たしている）とき該当する
領域は文字列領域であると判定する。ここで、文字列に
は、タイトル（見出し）と本文のテキストの二種類に分
けられるが、前者（タイトル）は一般にその文字サイズ
が大きい。そこで、文字領域であると判定された細長い
黒画素領域の長手方向にほぼ直角な断面の長さが所定以
上のとき、タイトルとして判定するようにした。また、
一般にタイトルは、本文の上方にある場合が多いので、
その存在位置に従ってタイトルかテキストかを判断する
ようにしても良い。但し、ブロックの判定そのものは本
発明の主要な部分ではないので、これ以上の説明は省略
する。

【００２８】図５（ｂ）は、上記の構造体で表されるデ
ータの例を示している。各ブロックの要素next_address
には、次のブロックのアドレスが格納され、最後はＮＵ
ＬＬを代入しておくことでそれ以降のデータは存在しな
いことを明示させておく。

【００２９】図１の説明に戻る。ステップＳ１０１でブ
ロックデータが抽出されると、処理はステップＳ１０２
に進み、未処理のブロックがなくなるまで（構造体のne
xt_addressがＮＵＬＬになるまで）ループする。もし、
未処理のブロックがなくなったら本処理を終了するが、
未処理のブロックがあるならばステップＳ１０３に移
る。

【００３０】ステップＳ１０３では現在処理しようとす
るブロックが文字を含んでいれば（要素ｔｙｐｅが０又
は１）、ステップＳ１０４に進み、含んでいなければ１
０２に戻る。

【００３１】ステップＳ１０４ではブロック内のデータ
をＹ軸に斜影を行い文字の存在するＹ軸（行）抽出を行
う。Ｙ軸への斜影を例として図２（ｂ）のテキスト２に
対して行うと図６に示すようになる。Ｙ軸への斜影をも
っと具体的に説明するために図９にフローチャートを示
す。

【００３２】尚、以下の説明に先立ち、変数ｌｉｎｅ＿
ｈ［］、ｌｉｎｅ＿ｓｙ［］は共にＲＡＭに確保された
配列変数であり、ｌｉｎｅ＿ｈ［］は１行分の文字列の
高さ情報を格納し、ｌｉｎｅ＿ｓｙ［］は各行の左上隅
の、注目ブロックの左上隅座標からの相対的なｙ座標を
記憶する。また、変数ｉはブロック内における相対的な
ｘ座標を、変数ｊは同ｙ座標を示す。また、ｆｌａｇ
は、１行分の切り出し処理を行っている最中か否かを示
す変数ものであり、ｋｕｒｏは着目している１ドットラ
イン中に黒画素があるか否かの情報を記憶する変数であ
る。また、ｎｌｉｎｅは、注目ブロック中に何行分の文
字列行があるかをカウントする変数である。

【００３３】さて、ステップＳ９０１においては、変数
ｎｌｉｎｅ、ｆｌａｇ，ｊをそれぞれ“０”クリアす
る。そして、ステップＳ９０２で変数ｉ，ステップＳ９
０３で変数ｋｕｒｏをそれぞれ“０”クリアする。

【００３４】次いで、ステップＳ９０４に進んで、変数
ｊが注目ブロックの高さ（注目ブロックがｋ番目である
場合には、ＢＬＫ［Ｋ］．ｈｅｉｇｈｔで得られる）を
越えたか否かを判断する。もし、超えていれば、注目ブ
ロック内の全てのラインに対しての処理が完了したこと
になるから、本処理を終える。

【００３５】従って、ここでは変数ｊの値が注目ブロッ
クの高さに満たないとして、説明を続ける。

【００３６】この場合、処理はステップＳ９０５に進
み、画像メモリ７に格納された画像データのｘ座標がｓ
ｔａｒｔｘ＋ｉ，ｙ座標がｓｔａｒｔｙ＋ｊの位置の画
素データを読み出し、それが黒画素かどうかを判断す
る。ここで、ｓｔａｒｔｘ、ｓｔａｒｔｙは注目ブロッ
クの構造体の要素名であることは理解できよう。

【００３７】さて、変数ｉ，ｊで示される位置の画素が
黒画素でないと判断した場合には、ステップＳ９０６に
進み、その時の変数ｉと注目ブロックの横幅ｗｉｄｔｈ
を比較する。この結果、ｉ＜ｗｉｄｔｈであると判断し
た場合には、ステップＳ９０７に進んで、変数ｉを
“１”だけインクリメントする。

【００３８】こうして、注目ブロックの第ｊラインにお
いて、変数ｉが順次インクメントさせていって注目画素
が黒画素であると判断されると、処理はステップＳ９０
８に進み、変数ｋｕｒｏを“１”を代入し、注目ライン
（変数ｊで示されるライン）には少なくとも黒画素が存
在したことを示すようにする。

【００３９】この後、処理はステップＳ９０９に進み、
ｆｌａｇが“０”であるかどうかを判断する。ｆｌａｇ
が“０”というのは、直前までのラインは空白部分であ
って、変数ｊで示されるラインになってはじめて黒画素
が発生したことを意味する。従って、この場合には、ス
テップＳ９１０に進み、文字列パターンの発生を検出し
たことになるから、その時点での変数ｊを配列変数ｌｉ
ｎｅ＿ｓｙ［ｎｌｉｎｅ］に代入する。文字パターンは
複数のドットラインに存在するから、次のラインでステ
ップＳ９１０の処理を行なわないように、ｆｌａｇに
“１”を代入させておく。

【００４０】また、変数ｊで示されるライン中に黒画素
の存在を検出した場合には、同ラインにおけるそれより
右側に位置する画素の状態を検出することは不要になる
のでステップＳ９０７の処理を行わず、注目ラインの処
理を終えたものとして、ステップＳ９１２に進む。

【００４１】ステップＳ９１２では、ｋｕｒｏ＝０、且
つ、ｆｌａｇ＝１であるかどうかを判断する。

【００４２】つまり、黒画素が存在するラインが連続し
て検出されている最中に、空白ラインが検出されたかど
うかを判断する。より分かりやすく説明すると、１行分
の文字列パターンの領域が決定したかどうかを判断す
る。

【００４３】否の場合には、ステップＳ９１３に進ん
で、変数ｊを“１”だけインクリメントし、ステップＳ
９０２以降の処理を繰り返す。

【００４４】こうして、１行分の文字列パターンの検出
がなされたと判断した場合には、ステップＳ９１４に進
んで、配列変数ｌｉｎｅ＿ｈ［ｎｌｉｎｅ］に、そのと
きの変数ｊからｌｉｎｅ＿ｓｙ［ｎｌｉｎｅ］を引いた
値をセットする。先に説明したように、ｌｉｎｅ＿ｓｙ
［ｎｌｉｎｅ］には文字列パターンの左上隅のｙ座標が
格納されているから、ｌｉｎｅ＿ｈ［ｎｌｉｎｅ］には
黒画素が連続するラインの本数、すなわち、文字列パタ
ーンの高さ情報が格納されることになる。

【００４５】次いで、ステップＳ９１５で、次の文字列
パターン（文字列行）の検出に備えて変数ｆｌａｇを
“０”クリアし、ｎｌｉｎｅを“１”だけインクリメン
トする。

【００４６】以上の結果、最終的に変数ｊが注目ブロッ
クの高さｈｅｉｇｈｔを越えることになり、その時点で
本処理を終了する。このとき、ｎｌｉｎｅは注目ブロッ
クにおいて検出された文字列行数が格納され、ｌｉｎｅ
＿ｓｙ［０］〜ｌｉｎｅ＿ｓｙ［ｎｌｉｎｅ］には各文
字列パターンの左上隅のｙ座標値が、ｌｉｎｅ＿ｈ
［０］〜ｌｉｎｅ［ｎｌｉｎｅ］には各文字列パターン
の高さ情報が格納されることになる。

【００４７】以上の図９の処理により各ブロックの文字
画像から行数、各行のスタート点および高さを抽出する
ことができる。

【００４８】図１の説明に戻る。ステップＳ１０５では
抽出された行データの処理のためにループを回す。全て
の行の処理が終わっていない場合にはステップＳ１０２
に戻り、それ以外はステップＳ１０６に進む。

【００４９】ステップＳ１０６では図１１のように、ス
テップＳ１０４で抽出された行をラスタ順次に見て、領
域（１）内の黒画素数を数えＢ１を得、続いて領域
（２）内の黒画素数を数えＢ２を得、領域（３）内の黒
画素数を数えＢ３を得、最後に領域（４）内の黒画素数
を数えＢ４を得る（領域１から４の定義は図７参照）。

【００５０】ここで各領域は、先に説明したように、行
の高さ情報ｌｉｎｅ＿ｈ［］で示される高さを４分割し
た領域を意味する。

【００５１】その処理の一例のフローチャートを図１０
に示す。図７に示すようにステップＳ１０４の行抽出処
理で抽出された行画像の左上を座標（０，０）とし、行
画像の幅をＷ、画素高さをＨとする。従って右下の座標
は（Ｗ−１，Ｈ−１）となる。尚、以下の示す各変数も
ＲＡＭ３に確保されているものである。

【００５２】ステップＳ１００１で黒画素カウンタｃｏ
ｕｎｔｅｒ（０）〜ｃｏｕｎｔｅｒ（３）を“０”クリ
アする。ここでｃｏｕｎｔｅｒ[0]がＢ１を、ｃｏｕｎ
ｔｅｒ[1]がＢ２を、ｃｏｕｎｔｅｒ[2]がＢ３を、ｃｏ
ｕｎｔｅｒ[3]がＢ４をそれぞれ係数する変数である。

【００５３】ステップＳ１００２で、二次元の画像を処
理するための縦座標カウンタｊをリセットする。ステッ
プＳ１００３で縦座標カウンタｊが行画像高さＨを超え
ていないかどうかチェックし、超えていたらｅｎｄに進
み本処理を終える。また、超えていなかったらステップ
Ｓ１００４に進む。

【００５４】ステップＳ１００４で二次元の画像を処理
するための横座標カウンタｉをリセットする。ステップ
Ｓ１００５で横座標カウンタｉが行画像幅Ｗを超えてい
ないかどうかチェックし、超えていたらステップＳ１０
０９に進み、超えていなかったらステップＳ１００６に
進む。ステップＳ１００６でｐｉｘｅｌ[i][j]が黒かど
うかチェックし、黒ならばステップＳ１００７に進み、
白ならばステップＳ１００８に進む。

【００５５】ステップＳ１００７ではｐｉｘｅｌ[i][j]
が黒ということでｃｏｕｎｔｅｒ[j/4]をインクリメン
トする。

【００５６】但し、“ｊ／４”は整数部分のみを有効す
る。従って、ｊ／４は０、１、２、３の４つの値のいず
れかであり、それでもって、ｃｏｕｎｔｅｒ［０］〜
［３］のいずれか１つがインクリメントする。

【００５７】つまり、小領域（１）中の黒画素はｃｏｕ
ｎｔｅｒ[0]に加算され、小領域２中の黒画素はｃｏｕ
ｎｔｅｒ[1]に加算され、小領域３中の黒画素はｃｏｕ
ｎｔｅｒ[2]に加算され、小領域４中の黒画素はｃｏｕ
ｎｔｅｒ[3]に加算されていく。

【００５８】ステップＳ１００８では、横座標カウンタ
ｉをインクリメントし、ステップＳ１００５に戻る。ス
テップＳ１００９で縦座標カウンタｊをインクリメント
し、ステップＳ１００３に戻る。

【００５９】以上の処理の結果、Ｂ１＝ｃｏｕｎｔｅｒ
[0]，Ｂ２＝ｃｏｕｎｔｅｒ[1]，Ｂ３＝ｃｏｕｎｔｅｒ
[2]，Ｂ４＝ｃｏｕｎｔｅｒ[3]として各小領域中の黒画
素がカウントされる。

【００６０】図１の説明に戻る。ステップＳ１０７で
は、（Ｂ２＋Ｂ３）／（Ｂ１＋Ｂ４）が予め設定されて
いる閾値Ｔ１以上であるか否か、或いは、（Ｂ３＋Ｂ
４）が予め設定されている閾値Ｔ２以上であるかを判定
する。これらいずれかのを判定が肯定されれば、注目ブ
ロックの注目行は英文字列と判断されるので、ステップ
Ｓ１０８で、その行に対しての属性を“英語”にする。
また、いずれの判定も否定された場合には、注目行は日
本語であると判定されるので、その旨の属性を与える。

【００６１】以上説明したように本実施例によれば、行
単位に英語か日本語かを判断できるので、後の文字認識
処理においては、適正な認識辞書が選択させることが可
能となり、認識率を向上させることが可能になる。ま
た、場合によっては、認識アルゴリズム自身を切り替え
るようにしても良い。

【００６２】＜第２の実施例の説明＞上記第１の実施例
においてアルファベット／日本語判別を文字画像の１行
毎に行ったがその限りではない。

【００６３】例えば、文字画像の１行目を抽出し、その
１行目の黒画素分布を算出しアルファベット日本語判別
を行ったらその結果をその画像全体の判別結果としても
よい。

【００６４】または文字画像をＹ軸への斜影により行切
りを行ない、Ｘ軸への斜影により文字切りを行ったあ
と、任意にｍ文字分選びだし、ｍ文字の黒目分布の平均
を算出しその文字画像全体のアルファベット日本語判別
を行う方法もある。

【００６５】これらの方法により、計算時間の短縮が計
れる。

【００６６】また、上述の第１の実施例において行抽出
手段は文字画像に対するＹ軸への斜影としたが、その限
りではなく、例えば、図１におけるステップＳ１０１の
領域分離により行っても良い。具体的には図３のステッ
プＳ３０１の解像度変換、ステップＳ３０２の輪郭線追
跡を行った後、輪郭線追跡により抽出されたオブジェク
トのうち細長いものを文字と判定するが、ステップＳ３
０３の同一グループ結合を行わずに、行として領域分離
をする。この処理により図２（ａ）を実行した結果は図
８の様になり、Ｙ軸への斜影は必要なくなる。しかし、
解像度変換の影響で抽出された行の精度が低いのでそれ
を考慮して閾値Ｔの値をチューニングする必要がある。
この閾値Ｔは原稿画像にもよるので、入力装置５から適
宜調整するようにする。

【００６７】また、入力した原稿画像中にノイズとし
て、本来空白部分に１画素だけの孤立画素が存在する
と、上記処理は正常に行われない可能性がある。そこ
で、孤立画素については、それを判別し、それを除去す
る処理を設ける処理が望まれる。孤立画素の判定は、黒
画素のまわりの所定距離以内に他の黒画素があるかどう
かを判断すれば良いだろう。または、画像をウインドリ
ングしパターンマッチングで消去する方法などを用いて
も良い。

【００６８】また、第１の実施例では、ステップＳ１０
１の領域分離処理を施す画像は１画素１ビットの画像と
したがその限りでなく、例えば１画素８ビットの多値画
像でもよい。その場合、領域分離は微分フィルタをかけ
て高周波成分を抽出し、文字部、写真部に分ける方法が
ある。本アルファベット日本語判別を実施するには上記
１画素８ビットの多値画像を一定の閾値で２値化すれば
良い。

【００６９】また、本アルファベット／日本語自動判別
法を施す前に、文字画像の傾きを補正することによっ
て、原稿が傾いた画像に対してより良好な結果を得るこ
とができる。傾き補正は例えば抽出した行の傾きを求め
て、座標変換することによって実現できるので、その説
明は省略する。

【００７０】また、本アルファベット／日本語自動判別
法を施す前に、文字画像の方向を検出することによっ
て、原稿の方向に依存しない結果を得ることができる。
文字画像方向の検出は例えば領域分割によって抽出した
文字画像を行抽出、文字抽出を実行し、抽出した数画像
を０°回転、９０°回転、１８０°回転、２７０°回転
を行いＯＣＲを行う。ＯＣＲの確信度が得られるのでそ
れを利用して文字画像の方向を検出し原画像を行えば良
い。

【００７１】また、各小領域中の黒画素数カウントを行
画像を抽出した後に行ったが、その限りでなく、例え
ば、Ｙ軸方向の斜影を行って行画像を抽出する時に同時
にカウントしてもよい。その場合、行画像の高さがまだ
未明であるのでその行の黒画素数を保持しておいて高さ
が判明した後に小領域中の黒画素を加算して求めること
ができる。

【００７２】＜第３の実施例の説明＞上記実施例では、
文字列の行を４等分に、その中の黒画素の個数比でもっ
て該当する行が日本語か英語かを判別するものであった
が、本第３の実施例では、一般に日本語の文字パターン
は単位面積当たりのドット数が英語より多いという点に
着目し、文字種を判定する例を説明する。

【００７３】尚、装置構成は先に説明した第１の実施例
と同様であるものとし、ここではその処理内容について
説明する。

【００７４】図１３のフローチャートに従って本第３の
実施例における処理手順を説明する。

【００７５】図１３のフローチャート中、ステップＳ３
１０１〜Ｓ３１０５までは、図１のステップＳ１０１〜
Ｓ１０５と同じである。すなわち、ブロック化、及び各
ブロック内のテキストもしくは見出しの行数の検出にか
かる処理は同じであるものとする。

【００７６】ステップＳ３１０１〜Ｓ３１０５では、原
稿画像の入力からブロック分け、そして、着目している
ブロックがタイトルもしくはテキストであって、その行
の抽出処理を行う。未処理の行が存在すると判断された
場合には、ステップＳ３１０６に進む。

【００７７】ステップＳ３１０６では図１４のように行
中の黒画素を見て、文字幅を検出するとともに黒画素数
をカウントする。

【００７８】図１５にステップＳ３１０６の処理内容の
フローチャートを示し、以下説明する。

【００７９】尚、図１４に示すように、ステップＳ３１
０４（図９参照）の行抽出処理で抽出された行画像の左
上位置を座標（０，０）とし、行画像の画素幅をＩＷ、
画素高さをＨとする。従って右下の座標は（ＩＷ−１，
Ｈ−１）となる。また、本処理の詳細は以下の説明から
明らかになるが、要するに、着目している行の実際に文
字列パターンその存在する位置の開始位置（行頭）と、
終了位置（行末）の座標及び、それらの間にあるドット
数を計数する処理を行うものである。

【００８０】ステップＳ４００１で、黒画素の開始位置
を検出した際に、その位置を記憶保持する変数ｓｔａｒ
ｔｘ（ｘ座標）を更新し、それ以降の処理で当該変数ｓ
ｔａｒｔｘを更新しないように制御する変数ｆｌａｇ＿
ｂｌｋを“０”クリアする。そして、ステップＳ４００
２では、黒画素数を計数する変数ｃｏｎｔｅｒを“０”
クリアする。次いで、ステップＳ４００３では、注目画
素位置のｘ座標位置を特定するための変数ｉを“０”ク
リアする。次の、ステップＳ４００４では、ｆｌａｇ＿
ｌｉｎｅ２にｆｌａｇ＿ｌｉｎｅの内容を代入し、次い
で、ｆｌａｇ＿ｌｉｎｅを“０”クリアする。尚、最初
の段階では、ｆｌａｇ＿ｌｉｎｅには“０”が格納され
ているものとする。従って、ｆｌａｇ＿ｌｉｎｅ２は、
最初の段階では“０”クリアされることになる。

【００８１】また、ｆｌａｇ＿ｌｉｎｅは現在の変数ｉ
で示される縦１ドット列に黒画素があったかどうかを示
す情報が格納され、ｆｌａｇ＿ｌｉｎｅ２には直前の縦
１ドット列に黒画素があったかどうかを示す情報が格納
される。従って、黒画素が連続して検出されている最中
に、文字パターンが途絶えた場合にはｆｌａｇ＿ｌｉｎ
ｅ２＝１（直前の縦１ドット列に黒画素有り）で、且
つ、ｆｌａｇ＿ｌｉｎｅ＝０（注目している縦１ドット
列に黒画素無し）の場合であることを判定すれば良い。

【００８２】さて、ステップＳ４００５では、抽出する
画素位置のｙ座標を記憶保持する変数ｊを“０”クリア
する。

【００８３】次いで、ステップＳ４００６で、注目行中
の変数ｉ，ｊで示される位置の画素を画像メモリ７から
読み出し、それが黒画素がどうかを判定する。白画素で
あった場合には、ステップＳ４０１２にジャンプし、変
数ｊ、すなわち、ｙ座標を１つインクリメントし、ステ
ップＳ４０１３で変数ｊが注目行の高さ以下であると判
断されるまで上記ステップＳ４００５以下の処理を繰り
返す。

【００８４】こうして、変数ｊで示される縦１ドット列
につき、１つも黒画素が発見できなかった場合、ステッ
プＳ４０１３の判定は“ＮＯ”になるので、ステップＳ
４０１４に進み、ｆｌａｇ＿ｌｉｎｅ２が“１”で、且
つ、ｆｌａｇ＿ｌｉｎｅが“０”か否かを判断する。す
なわち、文字パターンの終端を見つけたか否かを判断す
る。否の場合には、変数ｉをインクリメントし、次の列
位置に備える。そして、ステップＳ４０１７で変数ｉと
行幅とを比較し、行幅分の処理が終えていないと判断し
た場合には、ステップＳ４００４の処理に戻り、上記処
理を繰り返す。

【００８５】さて、この過程で、最初に黒画素が検出さ
れると、ステップＳ４００７でｆｌａｇ＿ｂｌｋが
“０”であると判断されるので、処理はステップＳ４０
０８に進み、そのときの変数ｉの値を変数ｓｔａｒｔｘ
に代入する。これにより、文字列パターンの最初のドッ
ト位置のｘ座標がｓｔａｒｔｘに格納されることにな
る。

【００８６】次いで、このｓｔａｒｔｘに代入する処理
は、これ以降行なわないようにするため、変数ｆｌａｇ
＿ｂｌｋに“１”を代入する。

【００８７】次いで、黒画素が１つ検出されたことにな
るから、変数ｃｏｕｎｔｅｒを“１”インクリメント
し、且つ、注目縦１ドット列中に黒画素が検出されたわ
けであるから、ｆｌａｇ＿ｌｉｎｅに“１”を代入し、
ステップＳ４０１２に進む。

【００８８】以上の結果、注目行中の最初の黒画素が検
出された場合には変数ｓｔａｒｔｘにそのときのｘ座標
値である変数ｉを代入し、後はこの処理は行わない。そ
して、黒画素が検出される度に変数ｃｏｕｎｔｅｒが
“１”ずつインクリメントされることになる。

【００８９】さて、１つの文字の黒画素を検出していく
過程で、その隣の文字パターンとの間に処理は移ると、
当然、その間には空白部分があるので、黒画素は検出さ
れなくなる。

【００９０】このとき、ステップＳ４０１４の判断は、
“Ｙｅｓ”になる。つまり、その時の変数ｉの値が注目
している文字パターンの終わり位置になるから、その位
置を仮の行末位置であるとしてｅｎｄｘにその値を代入
する。従って、ｅｎｄｘの内容は、注目行中に含まれる
文字数分だけ更新させるが（図１４参照）、最終的に注
目行の行末位置にある文字の終わりのｘ座標値がｅｎｄ
ｘに格納されることになる。

【００９１】以上の結果、注目ブロック内の注目行の行
頭文字パターンの開始位置がｓｔａｒｔｘに、行末文字
パターンの終わりがｅｎｄｘに格納され、ｃｏｕｎｔｅ
ｒにはその間の黒画素数が格納されることになる。

【００９２】図１３の説明に戻る。

【００９３】ステップＳ３１０７で白画素数（ＷＮ）をＷＮ＝行高さ（Ｈ）×行幅（Ｗ）−黒画素数（ＢＮ）により求め、黒画素比ＲをＲ＝黒画素数（ＢＮ）／白画素数（ＷＮ）によって求める。

【００９４】ここで、行の高さは、先の第１の実施例で
説明した通りであり、行幅はｅｎｄｘ−ｓｔａｒｔｘで
得られる値である。

【００９５】ステップＳ４１０８であらかじめ決めたあ
ったしきい値ＴよりＲが大きいかどうか（黒画素が多い
かどうか）チェックし、Ｒ＞Ｔの時はステップＳ３１０
９に進み、Ｒ＜＝Ｔの時はステップＳ３１１０に進む。
ステップＳ３１０９ではその文字画像は日本語であると
判定し、ステップＳ３１０５に戻る。また、ステップＳ
３１１０ではその文字画像はアルファベットであると判
定し、ステップＳ３１０５に戻る。

【００９６】以上説明したように本第３の実施例によれ
ば、文字パターンは日本語の場合、そのドット数が多
く、逆に英語の場合にはドット数が少ないという特徴を
利用して、各ブロック内の行単位の字種を判別できる。
従って、文字認識処理に移る場合には、その認識辞書を
予め決めておく、もしくは優先する辞書を決めておくこ
とが可能になり、文字認識率を高めることが可能にな
る。

【００９７】＜第４の実施例の説明＞第３の実施例にお
いてアルファベット日本語判別を文字画像の１行毎に行
ったがその限りではない。例えば、文字画像の１行目を
抽出し、その１行目の黒画素分布を算出しアルファベッ
ト日本語判別を行ったらその結果をその画像全体の判別
結果としてもよい。

【００９８】または文字画像をＸ軸への斜影により行切
りを行い、Ｙ軸への斜影により文字切りを行ったあと、
任意にｍ文字分選びだし、ｍ文字のＲの平均を算出しそ
の文字画像全体のアルファベット日本語判別を行う方法
もある。これらの方法により、計算時間の短縮が計れ
る。

【００９９】また、先に説明した第１の実施例と第３の
実施例とを組み合わせて字種を判定するようにしても良
い。このようにすると、字種判定に関する精度を向上さ
せることが可能になる。

【０１００】また、文字には様々なフォントや、スタイ
ルがある。そのため、日本語のほうが文字幅の細いフォ
ントで英語のほうが太いフォントだった場合誤判別のお
それが出てくる。そこで、第１の実施例のような処理を
行う前に文字の細線処理を行えば、そのような誤判別の
危険はなくなる。但し、厳密な細線化処理は、非常に複
雑な処理を伴う。しかし、本第３の実施例では、単純に
文字の種別を一義的な状態にさせすれば良いので、単純
な細線化処理を行なえば良い。

【０１０１】以下、簡単な細線処理について説明する。

【０１０２】簡単な細線処理はパターンマッチングによ
る黒画素消去によって可能である。２画像を例えば３×
３画素単位に着目し、あらかじめ決めてある消去パター
ンとウィンドウ中の画像パターンが一致した場合、その
注目画素（ウィンドウ中の中央の画素）を黒から白に強
制変換する。その処理を反復して細線処理を行う。消去
パターンの一例は例えば図１６の通りである。

【０１０３】また、第３の実施例において、行抽出手段
は文字画像に対するＹ軸への斜影としたが、その限りで
なく、例えば、図１３のステップＳ３１０１の領域分離
により行ってもいい。

【０１０４】具体的には、先の第１の実施例と同様に、
解像度変換、輪郭線追跡を行った後、輪郭線追跡により
抽出されたオブジェクトのうち細長いものを文字と判定
するが、同一グループ結合を行わずに、行として領域分
離をする。この処理により図２（ａ）を実行した結果は
図８の様になり、Ｙ軸への斜影は必要なくなく。しか
し、解像度変換の影響で抽出された行の精度が低いので
それを考慮してしきい値Ｔの値をチューニングしなけれ
ばならない。

【０１０５】また、上述の第３の実施例において、本処
理を施す１画素１ビットの画像にノイズが存在していて
は本アルファベット日本語判別の能力を生かせられな
い。従って明らかにノイズとわかる孤立ドットなどを除
去すると良いだろう。孤立ドット除去の方法としては画
像をウインドリングしパターンマッチングで消去する方
法などがある。

【０１０６】また、上述の第３の実施例において、図１
３のステップＳ３１０１の領域分離処理を施す画像は１
画素１ビットの画像としたがその限りでなく例えば１画
素８ビットの多値画像でもよい。その場合、領域分離は
微分フィルタをかけて高周波成分を抽出し、文字部、写
真部に分ける方法がある。本アルファベット日本語判別
を実施するには上記１画素８ビットの多値画像を一定し
きい値で二値化する必要がある。

【０１０７】また、本アルファベット日本語自動判別法
を施す前に、文字画像の傾きを補正することによって、
原稿が傾いた画像に対してより良好な結果を得ることが
できる。傾き補正は例えば抽出した行の傾きを求めて、
座標変換することによって実現できる。

【０１０８】また、本アルファベット日本語自動判別法
を施す前に、文字画像の方向を検出することによって、
原稿の方向に依存しない結果を得ることができる。文字
画像方向の検出は例えば領域分割によって抽出した文字
画像を行抽出、文字抽出を実行し、抽出した数画像を０
°回転、９０°回転、１８０°回転、２７０°回転を行
いＯＣＲを行う。ＯＣＲの確信度が得られるのでそれを
利用して文字画像の方向を検出し原画像を行う。

【０１０９】以上説明したように本第１〜第４の実施例
に従えば、日本語と英語の文字パターンの分布あるいは
密度に応じて文字種を判定することが可能になる。従っ
て、文字認識する前処理として認識するときに使用する
辞書を予め決める、もしくはその優先順位を決めること
が可能になるので、文字認識率を向上させることが可能
になる。

【０１１０】尚、第１〜第４の実施例では、いずれも日
本語と英語について説明したが、英語の代わりにドイツ
語やフランス語を用いても同様であり、且つ、日本語の
代わりに漢字圏（例えば中国語）にしても同様であるの
で、上記例によって本発明が限定されるものではない。

【０１１１】また、実施例ではイメージスキャナ６から
入力される画像に対して処理を行なったが、画像は例え
ば通信回線を介して送られてきても良いし、例えば所定
の記憶媒体（例えばフロッピーディスク等）に記憶させ
ておいて、そこから画像を読出しても同様に処理できる
ので、上記実施例によって限定されるものではない。

【０１１２】更に、本発明は、複数の機器から構成され
るシステムに適用しても、１つの機器から成る装置に適
用しても良い。また、本発明はシステム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることはいうまでもない。

【０１１３】

【発明の効果】以上説明したように本発明によれば、入
力された原稿画像中の文字種を効率良く判定すること
で、下位の処理、例えば文字認識処理における処理精度
を上げることが可能になる。

【０１１４】また、本発明の好適な実施態様に従えば、
前記下位処理は文字認識処理であって、前記判定手段で
判定された結果に応じて認識処理するときに使用する認
識アルゴリズム、又は、認識アルゴリズムと認識辞書、
或いは認識辞書を選択させるので、認識速度及び認識の
精度を高めることが可能になる。

【０１１５】また、分割された各領域のほぼ中央の領域
に対するドットの存在割合を算出し、前記判定手段は、
算出された割合が所定以上の場合には、注目行はアルフ
ァベット文字であると判定し、所定以下の場合には漢字
圏文字であると判定するので、漢字圏の文字とアルファ
ベットの文字を精度良く判定することが可能になる。

【０１１６】また、文字列パターンの並び方向に投影し
たドット分布に基づいて行を判別するので、精度良く行
を判別することが可能になる。

【０１１７】また、更に、前記入力された原稿画像中の
ノイズ除去するノイズ除去手段を備えることにより、ノ
イズによる影響をなくすことができるので、行の判別を
より精度良く行なえる。

【０１１８】また、更に、前記入力された画像を所定角
度だけ回転させて、正立画像としての方向を決定する手
段を備えることにより、原稿画像の入力方向に応じて判
定することが可能になる。

【０１１９】また、前記入力された画像が傾いていると
きに、傾きを補正するので、傾いて入力された原稿画像
もより精度良く処理できる。

【０１２０】

【図面の簡単な説明】

【図１】実施例における処理手順を示すフローチャート
である。

【図２】原稿画像とブロック分け処理の関係を示す図で
ある。

【図３】実施例のブロック分け処理の一例を示すフロー
チャートである。

【図４】図３における解像度変換処理を施した様子を示
す図である。

【図５】実施例におけるブロック変数の構造体の構造及
びそのデータの例を示す図である。

【図６】行判別の概念を示す図である。

【図７】日本語と英語の文字列の一例と、文字識別の原
理を説明するための図である。

【図８】実施例におけるブロック分け処理後の各ブロッ
クの属性の一例を示す図である。

【図９】実施例の行識別処理のフローチャートである。

【図１０】実施例の画素計数処理内容を示すフローチャ
ートである。

【図１１】実施例の画素計数処理の走査内容を示す図で
ある。

【図１２】実施例における文字認識装置のブロック構成
を示す図である。

【図１３】第３の実施例の動作処理手順を示すフローチ
ャートである。

【図１４】第３の実施例における処理過程の概要を示す
図である。

【図１５】第３の実施例における黒画素分布算出処理を
示すフローチャートである。

【図１６】細線化処理で使用されるパターンの例を示す
図である。

【符号の説明】

１ＣＰＵ２ＲＯＭ３ＲＡＭ４外部記憶装置５入力装置６イメージスキャナ７画像メモリ８表示装置

Claims

【特許請求の範囲】

【請求項１】原稿画像を入力して、当該原稿中の文字
の種別を判定し下位の処理に渡す画像処理装置であっ
て、入力された原稿画像中の文字列パターンを含む行を判別
する判別手段と、判別された行の領域を、当該行に含まれる文字列の並び
方向に平行な複数領域に分割する分割手段と、分割された各領域中の有意なドットを計数する計数手段
と、該計数手段で計数された値に基づいて、ドット分布を算
出する算出手段と、算出されたドット分布に基づいて注目行の文字種を判定
する判定手段とを備えることを特徴とする画像処理装
置。
【請求項２】前記下位処理は文字認識処理であって、
前記判定手段で判定された結果に応じて認識処理すると
きに使用する認識辞書を選択させることを特徴とする請
求項第１項に記載の画像処理装置。
【請求項３】前記下位処理は文字認識処理であって、
前記判定手段で判定された結果に応じて認識処理すると
きに使用する認識アルゴリズムを選択させることを特徴
とする請求項第１項に記載の画像処理装置。
【請求項４】算出手段は、分割された各領域のほぼ中
央の領域に対するドットの存在割合を算出し、前記判定手段は、算出された割合が所定以上の場合に
は、注目行はアルファベット文字であると判定し、所定
以下の場合には漢字圏文字であると判定することを特徴
とする請求項第１項に記載の画像処理装置。
【請求項５】算出手段は、分割された複数領域のうち
特定の領域に対するドットの存在割合を算出し、前記判定手段は、算出された割合に基づいて、注目行が
アルファベット文字か、漢字圏文字であると判定するこ
とを特徴とする請求項第１項に記載の画像処理装置。
【請求項６】前記判別手段は、文字列パターンの並び
方向に投影したドット分布に基づいて行を判別すること
を特徴とする請求項第１項に記載の画像処理装置。
【請求項７】更に、前記入力された原稿画像中のノイ
ズ除去するノイズ除去手段を備えることを特徴とする請
求項第１項に記載の画像処理装置。
【請求項８】更に、前記入力された画像を所定角度だ
け回転させて、正立画像としての方向を決定する手段を
備えることを特徴とする請求項第１項に記載の画像処理
装置。
【請求項９】更に、前記入力された原稿画像が傾いて
いると判断された場合に画像の傾きを補正する補正手段
を備えることを特徴とする請求項第１項に記載の画像処
理装置。
【請求項１０】原稿画像を入力して、当該原稿中の文
字の種別を判定し下位の処理に渡す画像処理方法であっ
て、入力された原稿画像中の文字列パターンを含む行を判別
する判別工程と、判別された行の領域を、当該行に含まれる文字列の並び
方向に平行な複数領域に分割する分割工程と、分割された各領域中の有意なドットを計数する計数工程
と、該計数工程で計数された値に基づいて、ドット分布を算
出する算出工程と、算出されたドット分布に基づいて注目行の文字種を判定
する判定工程とを備えることを特徴とする画像処理方
法。
【請求項１１】前記下位処理は文字認識処理であっ
て、前記判定工程で判定された結果に応じて認識処理す
るときに使用する認識辞書を選択させることを特徴とす
る請求項第１０項に記載の画像処理方法。
【請求項１２】前記下位処理は文字認識処理であっ
て、前記判定工程で判定された結果に応じて認識処理す
るときに使用する認識アルゴリズムを選択させることを
特徴とする請求項第１０項に記載の画像処理方法。
【請求項１３】算出工程は、分割された各領域のほぼ
中央の領域に対するドットの存在割合を算出し、前記判定工程は、算出された割合が所定以上の場合に
は、注目行はアルファベット文字であると判定し、所定
以下の場合には漢字圏文字であると判定することを特徴
とする請求項第７項に記載の画像処理方法。
【請求項１４】算出工程は、分割された複数領域のう
ち特定の領域に対するドットの存在割合を算出し、前記判定工程は、算出された割合に基づいて、注目行が
アルファベット文字か、漢字圏文字であると判定するこ
とを特徴とする請求項第１０項に記載の画像処理方法。
【請求項１５】前記判別工程は、文字列パターンの並
び方向に投影したドット分布に基づいて行を判別するこ
とを特徴とする請求項第１０項に記載の画像処理方法。
【請求項１６】更に、前記入力された原稿画像中のノ
イズ除去するノイズ除去工程を備えることを特徴とする
請求項第１０項に記載の画像処理方法。
【請求項１７】更に、前記入力された画像を所定角度
だけ回転させて、正立画像としての方向を決定する工程
を備えることを特徴とする請求項第１０項に記載の画像
処理方法。
【請求項１８】更に、前記入力された原稿画像が傾い
ていると判断された場合に画像の傾きを補正する補正工
程を備えることを特徴とする請求項第１０項に記載の画
像処理方法。
【請求項１９】原稿画像を入力して、当該原稿中の文
字の種別を判定し下位の処理に渡す画像処理装置であっ
て、入力された原稿画像中の文字列パターンを含む行を判別
する判別手段と、判別された行の行頭文字パターンと行末文字パターンの
文字列行長に対する優位なドット数を計数する計数手段
と、該計数手段で計数されたドット数の、前記行中の非有意
ドットに対する割合を算出する算出手段と、算出された割合でもって注目行の文字種を判定する判定
手段とを備えることを特徴とする画像処理装置。
【請求項２０】前記下位処理は文字認識処理であっ
て、前記判定手段で判定された結果に応じて認識処理す
るときに使用する認識辞書を選択させることを特徴とす
る請求項第１９項に記載の画像処理装置。
【請求項２１】前記下位処理は文字認識処理であっ
て、前記判定手段で判定された結果に応じて認識処理す
るときに使用する認識アルゴリズムを選択させることを
特徴とする請求項第１９項に記載の画像処理装置。
【請求項２２】前記判定手段は、算出された割合が所
定以上の場合には、注目行は漢字圏文字であると判定
し、所定以下の場合にはアルファベット文字であると判
定することを特徴とする請求項第１９項に記載の画像処
理装置。
【請求項２３】前記算出手段は、分割された複数領域
のうち特定の領域に対するドットの存在割合を算出し、前記判定手段は、算出された割合に基づいて、注目行が
アルファベット文字か、漢字圏文字であると判定するこ
とを特徴とする請求項第１９項に記載の画像処理装置。
【請求項２４】前記判別手段は、文字列パターンの並
び方向に投影したドット分布に基づいて行を判別するこ
とを特徴とする請求項第１９項に記載の画像処理装置。
【請求項２５】更に、前記入力された原稿画像中のノ
イズ除去するノイズ除去手段を備えることを特徴とする
請求項第１９項に記載の画像処理装置。
【請求項２６】更に、前記入力された画像を所定角度
だけ回転させて、正立画像としての方向を決定する手段
を備えることを特徴とする請求項第１９項に記載の画像
処理装置。
【請求項２７】更に、前記入力された原稿画像が傾い
ていると判断された場合に画像の傾きを補正する補正手
段を備えることを特徴とする請求項第１９項に記載の画
像処理装置。
【請求項２８】原稿画像を入力して、当該原稿中の文
字の種別を判定し下位の処理に渡す画像処理方法であっ
て、入力された原稿画像中の文字列パターンを含む行を判別
する判別工程と、判別された行の行頭文字パターンと行末文字パターンの
文字列行長に対する優位なドット数を計数する計数工程
と、該計数工程で計数されたドット数の、前記行中の非有意
ドットに対する割合を算出する算出工程と、算出された割合でもって注目行の文字種を判定する判定
工程とを備えることを特徴とする画像処理方法。
【請求項２９】前記下位処理は文字認識処理であっ
て、前記判定工程で判定された結果に応じて認識処理す
るときに使用する認識辞書を選択させることを特徴とす
る請求項第２８項に記載の画像処理方法。
【請求項３０】前記下位処理は文字認識処理であっ
て、前記判定工程で判定された結果に応じて認識処理す
るときに使用する認識アルゴリズムを選択させることを
特徴とする請求項第２８項に記載の画像処理方法。
【請求項３１】前記判定工程は、算出された割合が所
定以上の場合には、注目行は漢字圏文字であると判定
し、所定以下の場合にはアルファベット文字であると判
定することを特徴とする請求項第２８項に記載の画像処
理方法。
【請求項３２】前記算出工程は、分割された複数領域
のうち特定の領域に対するドットの存在割合を算出し、前記判定工程は、算出された割合に基づいて、注目行が
アルファベット文字か、漢字圏文字であると判定するこ
とを特徴とする請求項第２８項に記載の画像処理方法。
【請求項３３】前記判別工程は、文字列パターンの並
び方向に投影したドット分布に基づいて行を判別するこ
とを特徴とする請求項第２８項に記載の画像処理方法。
【請求項３４】更に、前記入力された原稿画像中のノ
イズ除去するノイズ除去工程を備えることを特徴とする
請求項第２８項に記載の画像処理方法。
【請求項３５】更に、前記入力された画像を所定角度
だけ回転させて、正立画像としての方向を決定する工程
を備えることを特徴とする請求項第２８項に記載の画像
処理方法。
【請求項３６】更に、前記入力された原稿画像が傾い
ていると判断された場合に画像の傾きを補正する補正工
程を備えることを特徴とする請求項第２８項に記載の画
像処理方法。