JP5337194B2

JP5337194B2 - 画像処理装置

Info

Publication number: JP5337194B2
Application number: JP2011097195A
Authority: JP
Inventors: 毅九津見
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2011-04-25
Filing date: 2011-04-25
Publication date: 2013-11-06
Anticipated expiration: 2031-04-25
Also published as: CN102760233B; CN102760233A; JP2012230480A; US8705862B2; US20120269438A1

Description

本発明は、文書読取装置で読み取られた文書画像の処理において、文書画像中の文字認識された文字列の傾きを取得する画像処理装置に関するものである。

近年、文書を光学文字認識（ＯＣＲ：Optical Character Recognition）により読み込み、その読み取った画像における文書中の原文の訳語（以下「ルビ」と呼ぶ。）を行間に付与する技術が知られている。当該技術の典型的な文献としては、本願と同一の出願人により出願された特許文献１がある。
このような、文書画像へのルビふりシステムにおいて、例えば図１７に示すように、原文書がわずかに傾いてスキャンされ文字列Ｌ１１が傾いているような場合や、原文書中に傾いた文字列Ｌ１１が存在する場合でも、ルビの美観上、その傾いた文字列に沿って傾けてルビを生成するために、文書画像中の各文字列の正しい傾き値を取得することが必要である。このルビ生成以外の処理でも、正しい文字列の傾き値が必要である。

傾き値を求める方法として、従来は、例えば、文字列の各文字に外接する矩形の座標、例えば、各矩形の左下の座標とか、各矩形の中心の座標、というふうに基準を決めて、回帰する直線を文字列単位で求めて、その直線の傾きを文字列の傾き値としていた。
また、回帰計算をしない方法としては、文字列の始端の文字と終端の文字の座標から、この２個の文字の間の傾きを求め、上記文字列の傾き値とする方法がある。

特願２００９−２５５３７３号

前記した、文書画像の文字列の傾き値を求める方法には、例えば次のような問題がある。
例えば原文書の文字が英字だと、図１８に示すように文字に外接する矩形Ｂ１１の上端や下端の高さが揃っておらず、文字配置によっては、これらの座標を回帰するだけでは、図１９に示すように真の傾きＫ１１と求められた傾きＫ１２とで異なる場合がある。さらに、回帰計算が必要なので、計算量が多い。
また、回帰計算をせずに文字列の始端の文字と終端の文字のみから文字列の傾きを求める方法では、始端の文字および終端の文字次第で、真の傾きと求められた傾きとがより大きく異なる場合がある。

本発明は、上述のような実情に鑑みてなされ、文書読取装置で読み取られた文書画像の処理において、文書画像中の文字認識された文字列の傾きがより正確に求められる画像処理装置を提供するものである。

上記課題を解決するために、本発明の第１の技術手段は、文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、前記類似文字抽出部が、前記文字列を構成する文字のうちで最も多い文字からなる文字群を抽出することを特徴とする画像処理装置である。

本発明の第２の技術手段は、文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、前記類似文字抽出部が、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群を抽出することを特徴とする画像処理装置である。

本発明の第３の技術手段は、文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、前記類似文字抽出部が、前記文字列を構成する文字のうちで最も多い文字からなる文字群と、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群とのうち、前記文字列内において文字間隔がより均等である文字群を抽出することを特徴とする画像処理装置である。

本発明の第４の技術手段は、第１〜第３のいずれか１の技術手段において、前記類似文字抽出部が、抽出した前記文字群中から抜粋した文字からなる文字群を出力することを特徴としたものである。

本発明の第５の技術手段は、第１〜第４のいずれか１の技術手段において、前記傾き算出部が、前記類似文字抽出部から出力された文字群の文字のうち傾き増減方向の座標の差が最も小さい２つの文字の間の傾き値を算出し、該傾き値を前記文字列の傾き値とすることを特徴としたものである。

本発明の第６の技術手段は、第１〜第４のいずれか１の技術手段において、前記傾き算出部が、前記類似文字抽出部から出力された文字群における全ての隣接する２つの文字間の傾き値を算出し、該算出された文字間の傾き値の群のうち統計的に外れ値であるものを除いた前記文字間の傾き値の群から、前記文字列の傾き値を算出することを特徴としたものである。

本発明の第７の技術手段は、第１〜第６のいずれか１の技術手段において、文書読取装置における文書の読取態様によらず、前記傾き算出部で算出される前記文字列の傾き値が所定の範囲内となるように、当該文字列を構成する文字を含む画像の座標系が予め変換されることを特徴としたものである。

本発明の第８の技術手段は、第１〜第７のいずれか１の技術手段において、前記傾き算出部で算出した前記文字列の傾き値が所定値以下の場合は、前記文字列の傾き値として０を出力することを特徴としたものである。

本発明によれば、文書読取装置で読み取られた文書画像の処理において、文書画像中の文字認識された文字列の傾きがより正確に求められる画像処理装置を提供することができる。

本発明の画像処理装置の一例のブロック図である。類似文字抽出部が傾き値算出用に抽出する文字群の一例を説明する図である。文字列の言語において一般的に出現頻度が高く且つ文字の外接矩形が揃っている文字のリストの例を説明する図である。類似文字抽出部が傾き値算出用に抽出する文字群の他の例を説明する図である。類似文字抽出部が傾き値算出用に出力する文字群の他の例を説明する図である。図７で説明する方法により解決可能な問題を説明する図である。傾き算出部の文字列の傾き値の算出方法の一例を説明する図である。傾き算出部の文字列の傾き値の算出方法の他の例を説明する図である。図２，図４，図５のような場合の各文字の座標変換後の座標値の例を示した表である。図７のような場合の各文字の座標変換後の座標値の例を示した表である。図８のような場合の各文字の座標変換後の座標値の例を示した表である。図１の画像処理装置の処理例を説明するフローチャートである。図１２のステップＳ４の文字群選択抽出処理の一例を説明するフローチャートである。図１２のステップＳ５の文字抜粋処理の一例を説明するフローチャートである。図１２のステップＳ１２の傾き値算出処理の一例を説明するフローチャートである。図１２のステップＳ１２の傾き値算出処理の他の例を説明するフローチャートである。本発明の課題を説明する図である。本発明の課題を説明する図である。本発明の課題を説明する図である。

図１は、本発明の画像処理装置の一例のブロック図である。
本発明の画像処理装置は、図１の参照符号１０で例示するように、光学文字認識部１１と、翻訳部１２と、傾き取得部１３と、画像処理部１４とを備える。

光学文字認識部１１は、文書をスキャナにより読み取った文書画像データを光学文字認識処理し、処理結果として文字と該文字の座標情報とを文字列毎に取得する。なお、文字の座標情報とは、Ｘ座標が「外接矩形の左端」「外接矩形の右端」「外接矩形の中央」、Ｙ座標が「外接矩形の上端」「外接矩形の下端」「外接矩形の中央」、などの中から統一基準を決めればよい。ここでは、ＸＹ座標とも「外接矩形の中央」とする。
翻訳部１２は、不図示の記憶部に格納された翻訳辞書に基づいて、光学文字認識部１１で認識した文字を翻訳し翻訳文データを作成する。
傾き取得部１３は、光学文字認識部１１で取得した文字列の傾き値を取得し画像処理部１４に出力する。傾き取得部１３が有する類似文字抽出部１３ａと傾き算出部１３ｂについては後述する。
画像処理部１４は、光学文字認識部１１から出力された文字列の情報と翻訳部１２からの翻訳文データと傾き算出部１３からの傾きとに基づいて、画像処理を行い、文字列に沿って翻訳文が付与された画像データを作成する。

本画像処理装置１０の特徴部に係る傾き取得部１３は、光学文字認識部１１で取得した文字列を構成する文字のうち互いに形及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部１３ａと、類似文字抽出部１３ａから出力された文字群の文字の位置情報に基づいて直線回帰等により文字列の傾き値を算出する傾き算出部１３ｂとを有する。
このように画像処理装置１０では、文字列を構成する同一または類似の文字からなる文字群だけ利用して文字列の傾き値を算出するので、文字に外接する矩形形状のばらつきに起因する問題が生じず、正しい（文字配置意図どおりの）傾きが算出できる。

図２は、類似文字抽出部１３ａが傾き値算出用に抽出する文字群の一例を説明する図である。
類似文字抽出部１３ａは、上述のように、光学文字認識部１１で取得した文字列を構成する文字のうち互いに形が同一または類似の文字からなる文字群を抽出するものであり、より具体的には、例えば、光学文字認識部１１で取得した文字列を構成する文字のうちで最も多い文字からなる実頻出文字群を抽出する。

例えば、図２に示すように、文字列Ｌ１が「Users’ Documents.」である場合、類似文字抽出部１３ａが２つの文字「ｓ」からなる文字群を抽出する。
この文字群に基づいて文字列の傾き値を算出する場合、同一の文字だけ利用するので、文字に外接する矩形形状のばらつきに起因する問題が生じず、正しい（傾き値が算出できる。

図３及び図４は、類似文字抽出部１３ａが傾き値算出用に抽出する文字群の他の例を説明する図である。
類似文字抽出部１３ａは、図２の例の他に、例えば、光学文字認識部１１で取得した文字列の言語の種別を翻訳辞書に基づいて判定し、当該言語において一般的に出現頻度が高く且つ当該文字の外接矩形が揃っている文字（以下、一般頻出文字）を取得する。なお、一般頻出文字は、例えば、不図示の記憶部に言語毎にリストとして格納されており、図３のリストＴ１には、英語の一般頻出文字である「ａ」，「ｃ」，「ｅ」，「ｏ」，「ｓ」が記載されている。そして、類似文字抽出部１３ａは、取得した一般頻出文字であって文字認識した文字列を構成する文字からなる文字群（一般頻出文字群）を抽出する。

例えば、図４に示すように、文字列Ｌ２が「Users’ Documents.」である場合、類似文字抽出部１３ａは、文字列Ｌ２の言語を英語と判定し、英語の一般頻出文字であって文字列Ｌ２に含まれる文字「ｓ」「ｅ」「ｏ」「ｃ」からなる一般頻出文字群を抽出する。
この一般頻出文字群に基づいて文字列の傾き値を算出する場合、文字の外接矩形の寸法や、文字列の進行方向に対し垂直な方向へのオフセット量がほぼ揃っている文字だけを利用するので、文字の外接矩形形状のばらつきに起因する問題の影響を最小限にすることができ、正しい傾きが算出できる。また、図２の方法では文字列の傾き値を算出するために十分な数の文字データが利用できない場合に、本例では、上記十分な数の文字データが利用できる可能性がある。

また、類似文字抽出部１３ａは、一般頻出文字群と、実頻出文字群との両方を一旦取得し、これらのうち、文字認識した文字列内における文字の分布の偏りが少ない方を選択抽出するようにしてもよい。この場合、より正しい傾き値が得られる。分布の偏りの判定方法については後述する。

図５は、類似文字抽出部１３ａが傾き値算出用に出力する文字群の他の例を説明する図である。
類似文字抽出部１３ａは、傾き値算出用に抽出した文字群を構成する全ての文字を傾き算出部１３ｂに出力してもよいが、構成する文字数が多い場合などは、一部の文字を抜粋して出力するようにしてもよい。

例えば、文字列「Users’ Documents.」について文字「ｓ」「ｅ」「ｏ」「ｃ」の計７字（図４参照）からなる一般頻出文字群を抽出した場合に、類似文字抽出部１３ａは、図５に示すように、文字「ｓ」「ｃ」からなる文字群を抜粋し、傾き算出部１３ｂに出力する。傾き算出部１３ｂでは、該抜粋した文字群の座標情報に基づいて文字列の傾き値を算出する。
この方法では、少ない計算量で適切な傾き値が得られる。

なお、図６に示すように、原文書において高さがズレて横に隣接した２本の文字列Ｌ４，Ｌ５を、光学文字認識部１１が１本の文字列として認識する場合がある。この場合、従来のように、認識した文字列の全ての文字、あるいは始端と終端の文字を使って文字列の傾き値を算出すると、真の傾きＫ１と算出された傾きＫ２とで大きく異なってしまう。

図７は、上述の問題を解決する傾き算出部１３ｂの文字列の傾き値の算出方法の一例を説明する図である。
２本の文字列Ｌ４，Ｌ５（図６参照）が１本の文字列として認識された場合、傾き算出部１３ｂは、類似文字抽出部１３ａから出力された文字群の中から、傾き増減方向に関わる座標の差が最も小さい組み合わせの文字を取得し、該取得した文字についての座標情報のみに基づいて文字列の傾き値を算出する。

例えば、傾き算出部１３ｂは、図７に示すように、文字列「Users’ Documents.」が１本の文字列として認識されている場合に、類似文字抽出部１３ａから出力された文字「ｓ」「ｃ」（文字Ｍ１１〜Ｍ１４）のうち傾き増減方向に関わる用紙の垂直方向の座標（Ｙ座標）の差が最も小さい文字Ｍ１１とＭ１２を取得する。そして、該文字Ｍ１１とＭ１２の文字間の傾き値を文字列の傾き値として算出する。
このように文字列の傾き値を算出することにより以下の効果がある。すなわち、原文書画像において又は読み込み時にあまり傾いていない２本の文字列Ｌ４，Ｌ５が１本の文字列として文字認識された場合に、正しい傾きＫ１（図６参照）に近い傾きＫ３を少ない計算量で算出することができる。

図８は、２本の文字列Ｌ６，Ｌ７が１本の文字列として文字認識された場合における傾き算出部１３ｂの文字列の傾き値の算出方法の他の例を説明する図である。
２本の文字列Ｌ６，Ｌ７が１本の文字列として認識された場合、傾き算出部１３ｂは、類似文字抽出部１３ａから出力された文字群の全ての隣接する２つの文字間の傾き値を取得し、取得した文字間の傾き値群のうち統計的に外れ値である傾き値（他と大きく異なる傾き値）を除いたものから文字列の傾き値を算出する。

例えば、傾き算出部１３ｂは、図８に示すように、文字列「Users’ Documents.」が１本の文字列として認識されている場合に、類似文字抽出部１３ａから出力された文字「ｓ」「ｃ」（文字Ｍ１１〜Ｍ１４）について、全ての隣接する２つのも時間の傾き値を取得する。すなわち、文字Ｍ１１と文字Ｍ１２との間の傾き値、文字Ｍ１２と文字Ｍ１３との間の傾き値、文字Ｍ１３と文字Ｍ１４との間の傾き値を取得する。取得した傾きのうち、文字Ｍ１２と文字Ｍ１３との間の傾きは他と大きく異なる外れ値なので除き、文字Ｍ１１と文字Ｍ１２との間の傾き、文字Ｍ１３と文字Ｍ１４との間の傾きに基づいて、例えば平均して、文字列の傾き値を算出する。
このように文字列の傾き値を算出することにより以下の効果がある。すなわち、原文書画像において又は読み込み時に傾いていない２本の文字列が１本の文字列として文字認識された場合だけでなく、原文書において又は読み込み時に傾いている２本の文字列Ｌ６，Ｌ７が一本の文字列として文字認識された場合でも、正しい文字列の傾き値を算出することができる。

以上のような方法で傾き算出部１３ｂは文字列の傾き値を算出するが、算出された文字列の傾き値が所定値以下の場合は、傾き取得部１３は、文字列の傾き値として０を出力するようにしてもよい。
このように傾きが微小な場合は傾いていないと扱うことによって以下のような効果がある。すなわち、例えば、原文に対応する訳語等のルビをその原文に沿わせる形態で出力する際に、出力媒体（例えば、表示装置やプリンタや、あるいはそれらのドライバ）の解像度によっては出力文字列（ルビ）において微小な傾きがうまく表現されずに段差があるように表示される問題が解消され、美しく出力される。また、ルビ配置の際の計算量も削減される。本例のようなルビではなく、原文のテキストデータを原文書の傾きを再現して出力するような場合でも、同様に美しく出力され且つ計算量が削減される。

なお、本発明でいう「傾き値」は、文字列に沿う仮想的な直線の、Ｘ座標（用紙の幅方向の座標）の変位に対するＹ座標（用紙の縦方向の座標）の変位の比率とする。つまり、この仮想的な直線の、水平に対する角度をθとすると、傾き値はtanθである。なお、「傾き値」をこれ以外の方法で定義してもよい。

また、傾き取得部１３は、傾き算出部１３ｂでの算出結果が所定の範囲内（例えば、水平方向に対して−４５度〜＋４５度）に収まるように、対象の文字列を含む画像全体または一部の座標系を、当該座標系から９０度、１８０度または２７０度回転させた状態の座標系に予め変換しておくことが好ましい。このような構成をとると、例えば、原文書が縦書きであっても横書きであっても統一的な手法で文字列の傾き値を算出することができる。また、９０度単位での座標変換であるので座標値の単純な加減算で変換できる。図９は、図２，図４，図５のような文字列の座標変換後の座標値の例を示した表、図１０は、図７のような文字列の座標変換後の座標値の例を示した表、図１１は、図８のような文字列の座標変換後の座標値の例を示した表である。

図１２は、図１の画像処理装置１０の処理例を説明するフローチャートである。
画像処理装置１００は、図示するように、光学文字認識部１１で文字列と該文字列を構成する文字の座標情報を取得すると、傾き取得部１３が文字列の座標系が当初より９０度、１８０度または２７０度回転した状態の座標系になるよう座標変換し（ステップＳ１）、上記座標情報を再取得する。これにより、例えば、図９〜図１１に示す、文字列の座標値が取得される。

そして、類似文字抽出部１３ａが、光学文字認識部１１で取得した文字列を構成する文字から実頻出文字群を取得する（ステップＳ２）。例えば、図２の例では、文字列Ｌ１の「Users’ Documents.」うち最も多く３つある文字「ｓ」を取得する。図９では、文字番号２，５，１５の文字を取得する。

また、類似文字抽出部１３ａが、光学文字認識部１１で取得した文字列を構成する文字から一般頻出文字群を取得する（ステップＳ３）。例えば、図５の例に対し図４のリストＴ１があった場合、図１０の文字番号２，３，５，８，９，１２，１５の文字を取得する。
ステップＳ４では、類似文字抽出部１３ａが、取得した実頻出文字群と一般頻出文字群のいずれかを選択抽出する。
続いて、類似文字抽出部１３ａが、選択抽出した文字群のうちから全部または一部の文字を抜粋し、文字群として傾き算出部１３ｂに出力する（ステップＳ５）。そして、傾き算出部１３ｂが文字列の傾き値を算出する（ステップＳ６）。

さらに、傾き値取得部１３は、算出された文字列の傾き値が微小であるかすなわち閾値以下か否か判定し（ステップＳ７）、閾値以上の場合（Ｎｏの場合）は処理をステップＳ９に進め、閾値以下の場合（ＹＥＳの場合）は、算出された文字列の傾き値を０に書き換え（ステップＳ８）、その後、処理をステップＳ９に進める。閾値は例えば０.０１である。ステップＳ９では、算出された文字列の傾き値を、ステップＳ１での座標変換前の座標系に適合するよう座標変換を行う。

図１３は、図１２のステップＳ４の文字群選択抽出処理の一例を説明するフローチャートである。
まず、類似文字抽出部１３ａが、傾き値を取得する対象の文字列が２字以下か否か判定する（ステップＳ１１）。２字以下の場合（ＮＯの場合）は、従来と同様の方法で文字列の傾き値を取得するので処理を終了し、２字より多い場合（ＹＥＳの場合）は、実頻出文字群が１字以下か否か判定する（ステップＳ１２）。

実頻出文字群が１字以下の場合（ＹＥＳの場合）、一般頻出文字群が１字以下か否か判定し（ステップＳ１３）、１字以下の場合（ＹＥＳの場合）は、処理を終了し、２字より多い場合（ＹＥＳの場合）は一般頻出文字群を選択抽出する（ステップＳ１４）。
ステップＳ１２において実頻出文字群が１字より多い場合（ＮＯの場合）、一般頻出文字群が１字以下か否かを判定し（ステップＳ１５）、１字以下の場合（ＹＥＳの場合）は、実頻出文字を選択抽出する（ステップＳ２１）。１字より多い場合（ＮＯの場合）は、ステップＳ１６に処理を進める。

ステップＳ１６では、実頻出文字群と一般頻出文字群とについて、両端の文字間の距離が一方より他方の方が長いか否か判定し、長い場合（ＹＥＳの場合）は、長い方の文字群を選択抽出する（ステップＳ１７）。短い場合（ＮＯの場合）は、実頻出文字群と一般頻出文字群とで字数に差があるか否か判定する（ステップＳ１８）。

ステップＳ１８において、字数に差があると判定された場合（ＹＥＳの場合）は、字数の多い方の文字群を選択抽出する（ステップＳ１９）。字数に差がないと判定された（ＮＯの場合）、文字の部分の偏りが少ない方の文字群、具体的には、文字群の中央の文字のＸ座標（文字群の文字数が偶数なら、中央の２個の文字の座標の平均）が、両端の文字のＸ座標の平均に近い方）の文字群を選択抽出する（ステップＳ２０）。
なお、詳細は省略するが、対象の文字列が２字の場合や、実頻出文字群が１字で一般頻出文字群が１字以下の場合は、従来と同様、文字列を構成する全ての文字や両端の文字の座標情報に基づいて文字列の傾き値を算出する。

図１４は、図１２のステップＳ５の文字抜粋処理の一例を説明するフローチャートである。本例は、選択抽出した文字群の文字数が４より大きい場合に、４つの文字を抜粋する例である。
まず、類似文字抽出部１３ａが、選択抽出した文字群の文字数が４以下であるか否か判定する（ステップＳ３１）。４字以下の場合（ＹＥＳの場合）は、全ての文字を抜粋し、文字群として、傾き算出部１３ｂに出力し（ステップＳ３２）、４字より多い場合（ＮＯの場合）、選択抽出した文字群の文字数を３で割った結果の整数値ａを取得する（ステップＳ３３）。そして、選択抽出した文字群のうち、両端の文字と、両端の文字からａ字内側の文字を抜粋し、文字群として、傾き算出部１３ｂに出力する（ステップＳ３４）。

図１５は、図１２のステップＳ１２の傾き値算出処理の一例を説明するフローチャートである。なお、ここでは、文字列として、図７及び図１０で示される文字列が入力されているものとし、この場合、ステップＳ５までの処理で、図１０の文字番号２，５，９，１５の文字が抜粋されている。

傾き算出部１３ｂは、まず、抜粋された文字について、全ての２つの文字間でＹ座標の差を算出する（ステップＳ４１）。
そして、Ｙ座標の差が最も小さい文字間の傾き値を文字列の傾き値として算出する（ステップＳ４２）。図１０の例では、抜粋された文字のうち、文字番号２の文字「ｓ」と文字番号５の文字「ｓ」の差が最も小さい「２.０」であることが分かるので、この２つの文字間の傾き値が（４０９.０−４０７.０／２０９・０−１６０.５）＝０.０４１が文字列の傾き値として算出される。

図１６は、図１２のステップＳ１２の傾き値算出処理の他の例を説明するフローチャートである。なお、ここでは、文字列として、図７及び図１０で示される文字列が入力されているものとし、この場合、ステップＳ５までの処理で、図１０の文字番号２，５，９，１５の文字が抜粋されている。

傾き算出部１３ｂは、まず、抜粋された文字において全ての隣接する２つの文字間で傾き値を算出する（ステップＳ５１）。図１０の例では、文字番号２の文字「ｓ」と文字番号５の文字「ｓ」の間の傾き値、文字番号５の文字「ｓ」と文字番号９の文字「ｃ」の間の傾き値、文字番号９の文字「ｃ」と文字番号１５の文字「ｓ」の間の傾き値を算出し、それぞれ、０.１８７５、−０.２４５８、０.１８６７である。

続いて、傾き算出部１３ｂは、算出した傾き値群の平均値と統計的分散を算出し（ステップＳ５２）、算出した平均値と統計的分散に基づいて外れ値である傾き値を除く（ステップＳ５３）。図１０の例では、傾き値「−０.２４５７」が外れ値として除かれる。
そして、傾き算出部１３ｂは、残った文字間の傾き値から文字列の傾き値を算出する（ステップＳ５４）。例えば、図１０の例では、残った傾き値「０.１８７５」，「０.１８６７」の平均値「０.１８７１」を文字列の傾き値として算出する。

１０…画像処理装置、１１…光学文字認識部、１２…翻訳部、１３…傾き取得部、１３ａ…類似文字抽出部、１３ｂ…傾き算出部、１４…画像処理部。

Claims

文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
前記類似文字抽出部は、前記文字列を構成する文字のうちで最も多い文字からなる文字群を抽出することを特徴とする画像処理装置。
文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
前記類似文字抽出部は、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群を抽出することを特徴とする画像処理装置。
文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
前記類似文字抽出部は、前記文字列を構成する文字のうちで最も多い文字からなる文字群と、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群とのうち、前記文字列内において文字間隔がより均等である文字群を抽出することを特徴とする画像処理装置。
前記類似文字抽出部は、抽出した前記文字群中から抜粋した文字からなる文字群を出力することを特徴とする請求項１〜３のいずれか１項に記載の画像処理装置。
前記傾き算出部は、前記類似文字抽出部から出力された文字群の文字のうち傾き増減方向の座標の差が最も小さい２つの文字の間の傾き値を算出し、該傾き値を前記文字列の傾き値とすることを特徴とする請求項１〜４のいずれか１項に記載の画像処理装置。
前記傾き算出部は、前記類似文字抽出部から出力された文字群における全ての隣接する２つの文字間の傾き値を算出し、該算出された文字間の傾き値の群のうち統計的に外れ値であるものを除いた前記文字間の傾き値の群から、前記文字列の傾き値を算出することを特徴とする請求項１〜４のいずれか１項に記載の画像処理装置。
文書読取装置における文書の読取態様によらず、前記傾き算出部で算出される前記文字列の傾き値が所定の範囲内となるように、当該文字列を構成する文字を含む画像の座標系が予め変換されることを特徴とする請求項１〜６のいずれか１項に記載の画像処理装置。
前記傾き算出部で算出した前記文字列の傾き値が所定値以下の場合は、前記文字列の傾き値として０を出力することを特徴とする請求項１〜７のいずれか１項に記載の画像処理装置。