JP5337194B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP5337194B2
JP5337194B2 JP2011097195A JP2011097195A JP5337194B2 JP 5337194 B2 JP5337194 B2 JP 5337194B2 JP 2011097195 A JP2011097195 A JP 2011097195A JP 2011097195 A JP2011097195 A JP 2011097195A JP 5337194 B2 JP5337194 B2 JP 5337194B2
Authority
JP
Japan
Prior art keywords
character
characters
inclination
character string
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011097195A
Other languages
English (en)
Other versions
JP2012230480A (ja
Inventor
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2011097195A priority Critical patent/JP5337194B2/ja
Priority to US13/417,446 priority patent/US8705862B2/en
Priority to CN201210119225.XA priority patent/CN102760233B/zh
Publication of JP2012230480A publication Critical patent/JP2012230480A/ja
Application granted granted Critical
Publication of JP5337194B2 publication Critical patent/JP5337194B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文書読取装置で読み取られた文書画像の処理において、文書画像中の文字認識された文字列の傾きを取得する画像処理装置に関するものである。
近年、文書を光学文字認識(OCR:Optical Character Recognition)により読み込み、その読み取った画像における文書中の原文の訳語(以下「ルビ」と呼ぶ。)を行間に付与する技術が知られている。当該技術の典型的な文献としては、本願と同一の出願人により出願された特許文献1がある。
このような、文書画像へのルビふりシステムにおいて、例えば図17に示すように、原文書がわずかに傾いてスキャンされ文字列L11が傾いているような場合や、原文書中に傾いた文字列L11が存在する場合でも、ルビの美観上、その傾いた文字列に沿って傾けてルビを生成するために、文書画像中の各文字列の正しい傾き値を取得することが必要である。このルビ生成以外の処理でも、正しい文字列の傾き値が必要である。
傾き値を求める方法として、従来は、例えば、文字列の各文字に外接する矩形の座標、例えば、各矩形の左下の座標とか、各矩形の中心の座標、というふうに基準を決めて、回帰する直線を文字列単位で求めて、その直線の傾きを文字列の傾き値としていた。
また、回帰計算をしない方法としては、文字列の始端の文字と終端の文字の座標から、この2個の文字の間の傾きを求め、上記文字列の傾き値とする方法がある。
特願2009−255373号
前記した、文書画像の文字列の傾き値を求める方法には、例えば次のような問題がある。
例えば原文書の文字が英字だと、図18に示すように文字に外接する矩形B11の上端や下端の高さが揃っておらず、文字配置によっては、これらの座標を回帰するだけでは、図19に示すように真の傾きK11と求められた傾きK12とで異なる場合がある。さらに、回帰計算が必要なので、計算量が多い。
また、回帰計算をせずに文字列の始端の文字と終端の文字のみから文字列の傾きを求める方法では、始端の文字および終端の文字次第で、真の傾きと求められた傾きとがより大きく異なる場合がある。
本発明は、上述のような実情に鑑みてなされ、文書読取装置で読み取られた文書画像の処理において、文書画像中の文字認識された文字列の傾きがより正確に求められる画像処理装置を提供するものである。
上記課題を解決するために、本発明の第1の技術手段は、文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、前記類似文字抽出部が、前記文字列を構成する文字のうちで最も多い文字からなる文字群を抽出することを特徴とする画像処理装置である。
本発明の第の技術手段は、文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、前記類似文字抽出部が、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群を抽出することを特徴とする画像処理装置である。
本発明の第3の技術手段は、文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、前記類似文字抽出部が、前記文字列を構成する文字のうちで最も多い文字からなる文字群と、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群とのうち、前記文字列内において文字間隔がより均等である文字群を抽出することを特徴とする画像処理装置である。
本発明の第の技術手段は、第1〜第のいずれか1の技術手段において、前記類似文字抽出部が、抽出した前記文字群中から抜粋した文字からなる文字群を出力することを特徴としたものである。
本発明の第の技術手段は、第1〜第のいずれか1の技術手段において、前記傾き算出部が、前記類似文字抽出部から出力された文字群の文字のうち傾き増減方向の座標の差が最も小さい2つの文字の間の傾き値を算出し、該傾き値を前記文字列の傾き値とすることを特徴としたものである。
本発明の第の技術手段は、第1〜第のいずれか1の技術手段において、前記傾き算出部が、前記類似文字抽出部から出力された文字群における全ての隣接する2つの文字間の傾き値を算出し、該算出された文字間の傾き値の群のうち統計的に外れ値であるものを除いた前記文字間の傾き値の群から、前記文字列の傾き値を算出することを特徴としたものである。
本発明の第の技術手段は、第1〜第のいずれか1の技術手段において、文書読取装置における文書の読取態様によらず、前記傾き算出部で算出される前記文字列の傾き値が所定の範囲内となるように、当該文字列を構成する文字を含む画像の座標系が予め変換されることを特徴としたものである。
本発明の第の技術手段は、第1〜第のいずれか1の技術手段において、前記傾き算出部で算出した前記文字列の傾き値が所定値以下の場合は、前記文字列の傾き値として0を出力することを特徴としたものである。
本発明によれば、文書読取装置で読み取られた文書画像の処理において、文書画像中の文字認識された文字列の傾きがより正確に求められる画像処理装置を提供することができる。
本発明の画像処理装置の一例のブロック図である。 類似文字抽出部が傾き値算出用に抽出する文字群の一例を説明する図である。 文字列の言語において一般的に出現頻度が高く且つ文字の外接矩形が揃っている文字のリストの例を説明する図である。 類似文字抽出部が傾き値算出用に抽出する文字群の他の例を説明する図である。 類似文字抽出部が傾き値算出用に出力する文字群の他の例を説明する図である。 図7で説明する方法により解決可能な問題を説明する図である。 傾き算出部の文字列の傾き値の算出方法の一例を説明する図である。 傾き算出部の文字列の傾き値の算出方法の他の例を説明する図である。 図2,図4,図5のような場合の各文字の座標変換後の座標値の例を示した表である。 図7のような場合の各文字の座標変換後の座標値の例を示した表である。 図8のような場合の各文字の座標変換後の座標値の例を示した表である。 図1の画像処理装置の処理例を説明するフローチャートである。 図12のステップS4の文字群選択抽出処理の一例を説明するフローチャートである。 図12のステップS5の文字抜粋処理の一例を説明するフローチャートである。 図12のステップS12の傾き値算出処理の一例を説明するフローチャートである。 図12のステップS12の傾き値算出処理の他の例を説明するフローチャートである。 本発明の課題を説明する図である。 本発明の課題を説明する図である。 本発明の課題を説明する図である。
図1は、本発明の画像処理装置の一例のブロック図である。
本発明の画像処理装置は、図1の参照符号10で例示するように、光学文字認識部11と、翻訳部12と、傾き取得部13と、画像処理部14とを備える。
光学文字認識部11は、文書をスキャナにより読み取った文書画像データを光学文字認識処理し、処理結果として文字と該文字の座標情報とを文字列毎に取得する。なお、文字の座標情報とは、X座標が「外接矩形の左端」「外接矩形の右端」「外接矩形の中央」、Y座標が「外接矩形の上端」「外接矩形の下端」「外接矩形の中央」、などの中から統一基準を決めればよい。ここでは、XY座標とも「外接矩形の中央」とする。
翻訳部12は、不図示の記憶部に格納された翻訳辞書に基づいて、光学文字認識部11で認識した文字を翻訳し翻訳文データを作成する。
傾き取得部13は、光学文字認識部11で取得した文字列の傾き値を取得し画像処理部14に出力する。傾き取得部13が有する類似文字抽出部13aと傾き算出部13bについては後述する。
画像処理部14は、光学文字認識部11から出力された文字列の情報と翻訳部12からの翻訳文データと傾き算出部13からの傾きとに基づいて、画像処理を行い、文字列に沿って翻訳文が付与された画像データを作成する。
本画像処理装置10の特徴部に係る傾き取得部13は、光学文字認識部11で取得した文字列を構成する文字のうち互いに形及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部13aと、類似文字抽出部13aから出力された文字群の文字の位置情報に基づいて直線回帰等により文字列の傾き値を算出する傾き算出部13bとを有する。
このように画像処理装置10では、文字列を構成する同一または類似の文字からなる文字群だけ利用して文字列の傾き値を算出するので、文字に外接する矩形形状のばらつきに起因する問題が生じず、正しい(文字配置意図どおりの)傾きが算出できる。
図2は、類似文字抽出部13aが傾き値算出用に抽出する文字群の一例を説明する図である。
類似文字抽出部13aは、上述のように、光学文字認識部11で取得した文字列を構成する文字のうち互いに形が同一または類似の文字からなる文字群を抽出するものであり、より具体的には、例えば、光学文字認識部11で取得した文字列を構成する文字のうちで最も多い文字からなる実頻出文字群を抽出する。
例えば、図2に示すように、文字列L1が「Users’ Documents.」である場合、類似文字抽出部13aが2つの文字「s」からなる文字群を抽出する。
この文字群に基づいて文字列の傾き値を算出する場合、同一の文字だけ利用するので、文字に外接する矩形形状のばらつきに起因する問題が生じず、正しい(傾き値が算出できる。
図3及び図4は、類似文字抽出部13aが傾き値算出用に抽出する文字群の他の例を説明する図である。
類似文字抽出部13aは、図2の例の他に、例えば、光学文字認識部11で取得した文字列の言語の種別を翻訳辞書に基づいて判定し、当該言語において一般的に出現頻度が高く且つ当該文字の外接矩形が揃っている文字(以下、一般頻出文字)を取得する。なお、一般頻出文字は、例えば、不図示の記憶部に言語毎にリストとして格納されており、図3のリストT1には、英語の一般頻出文字である「a」,「c」,「e」,「o」,「s」が記載されている。そして、類似文字抽出部13aは、取得した一般頻出文字であって文字認識した文字列を構成する文字からなる文字群(一般頻出文字群)を抽出する。
例えば、図4に示すように、文字列L2が「Users’ Documents.」である場合、類似文字抽出部13aは、文字列L2の言語を英語と判定し、英語の一般頻出文字であって文字列L2に含まれる文字「s」「e」「o」「c」からなる一般頻出文字群を抽出する。
この一般頻出文字群に基づいて文字列の傾き値を算出する場合、文字の外接矩形の寸法や、文字列の進行方向に対し垂直な方向へのオフセット量がほぼ揃っている文字だけを利用するので、文字の外接矩形形状のばらつきに起因する問題の影響を最小限にすることができ、正しい傾きが算出できる。また、図2の方法では文字列の傾き値を算出するために十分な数の文字データが利用できない場合に、本例では、上記十分な数の文字データが利用できる可能性がある。
また、類似文字抽出部13aは、一般頻出文字群と、実頻出文字群との両方を一旦取得し、これらのうち、文字認識した文字列内における文字の分布の偏りが少ない方を選択抽出するようにしてもよい。この場合、より正しい傾き値が得られる。分布の偏りの判定方法については後述する。
図5は、類似文字抽出部13aが傾き値算出用に出力する文字群の他の例を説明する図である。
類似文字抽出部13aは、傾き値算出用に抽出した文字群を構成する全ての文字を傾き算出部13bに出力してもよいが、構成する文字数が多い場合などは、一部の文字を抜粋して出力するようにしてもよい。
例えば、文字列「Users’ Documents.」について文字「s」「e」「o」「c」の計7字(図4参照)からなる一般頻出文字群を抽出した場合に、類似文字抽出部13aは、図5に示すように、文字「s」「c」からなる文字群を抜粋し、傾き算出部13bに出力する。傾き算出部13bでは、該抜粋した文字群の座標情報に基づいて文字列の傾き値を算出する。
この方法では、少ない計算量で適切な傾き値が得られる。
なお、図6に示すように、原文書において高さがズレて横に隣接した2本の文字列L4,L5を、光学文字認識部11が1本の文字列として認識する場合がある。この場合、従来のように、認識した文字列の全ての文字、あるいは始端と終端の文字を使って文字列の傾き値を算出すると、真の傾きK1と算出された傾きK2とで大きく異なってしまう。
図7は、上述の問題を解決する傾き算出部13bの文字列の傾き値の算出方法の一例を説明する図である。
2本の文字列L4,L5(図6参照)が1本の文字列として認識された場合、傾き算出部13bは、類似文字抽出部13aから出力された文字群の中から、傾き増減方向に関わる座標の差が最も小さい組み合わせの文字を取得し、該取得した文字についての座標情報のみに基づいて文字列の傾き値を算出する。
例えば、傾き算出部13bは、図7に示すように、文字列「Users’ Documents.」が1本の文字列として認識されている場合に、類似文字抽出部13aから出力された文字「s」「c」(文字M11〜M14)のうち傾き増減方向に関わる用紙の垂直方向の座標(Y座標)の差が最も小さい文字M11とM12を取得する。そして、該文字M11とM12の文字間の傾き値を文字列の傾き値として算出する。
このように文字列の傾き値を算出することにより以下の効果がある。すなわち、原文書画像において又は読み込み時にあまり傾いていない2本の文字列L4,L5が1本の文字列として文字認識された場合に、正しい傾きK1(図6参照)に近い傾きK3を少ない計算量で算出することができる。
図8は、2本の文字列L6,L7が1本の文字列として文字認識された場合における傾き算出部13bの文字列の傾き値の算出方法の他の例を説明する図である。
2本の文字列L6,L7が1本の文字列として認識された場合、傾き算出部13bは、類似文字抽出部13aから出力された文字群の全ての隣接する2つの文字間の傾き値を取得し、取得した文字間の傾き値群のうち統計的に外れ値である傾き値(他と大きく異なる傾き値)を除いたものから文字列の傾き値を算出する。
例えば、傾き算出部13bは、図8に示すように、文字列「Users’ Documents.」が1本の文字列として認識されている場合に、類似文字抽出部13aから出力された文字「s」「c」(文字M11〜M14)について、全ての隣接する2つのも時間の傾き値を取得する。すなわち、文字M11と文字M12との間の傾き値、文字M12と文字M13との間の傾き値、文字M13と文字M14との間の傾き値を取得する。取得した傾きのうち、文字M12と文字M13との間の傾きは他と大きく異なる外れ値なので除き、文字M11と文字M12との間の傾き、文字M13と文字M14との間の傾きに基づいて、例えば平均して、文字列の傾き値を算出する。
このように文字列の傾き値を算出することにより以下の効果がある。すなわち、原文書画像において又は読み込み時に傾いていない2本の文字列が1本の文字列として文字認識された場合だけでなく、原文書において又は読み込み時に傾いている2本の文字列L6,L7が一本の文字列として文字認識された場合でも、正しい文字列の傾き値を算出することができる。
以上のような方法で傾き算出部13bは文字列の傾き値を算出するが、算出された文字列の傾き値が所定値以下の場合は、傾き取得部13は、文字列の傾き値として0を出力するようにしてもよい。
このように傾きが微小な場合は傾いていないと扱うことによって以下のような効果がある。すなわち、例えば、原文に対応する訳語等のルビをその原文に沿わせる形態で出力する際に、出力媒体(例えば、表示装置やプリンタや、あるいはそれらのドライバ)の解像度によっては出力文字列(ルビ)において微小な傾きがうまく表現されずに段差があるように表示される問題が解消され、美しく出力される。また、ルビ配置の際の計算量も削減される。本例のようなルビではなく、原文のテキストデータを原文書の傾きを再現して出力するような場合でも、同様に美しく出力され且つ計算量が削減される。
なお、本発明でいう「傾き値」は、文字列に沿う仮想的な直線の、X座標(用紙の幅方向の座標)の変位に対するY座標(用紙の縦方向の座標)の変位の比率とする。つまり、この仮想的な直線の、水平に対する角度をθとすると、傾き値はtanθである。なお、「傾き値」をこれ以外の方法で定義してもよい。
また、傾き取得部13は、傾き算出部13bでの算出結果が所定の範囲内(例えば、水平方向に対して−45度〜+45度)に収まるように、対象の文字列を含む画像全体または一部の座標系を、当該座標系から90度、180度または270度回転させた状態の座標系に予め変換しておくことが好ましい。このような構成をとると、例えば、原文書が縦書きであっても横書きであっても統一的な手法で文字列の傾き値を算出することができる。また、90度単位での座標変換であるので座標値の単純な加減算で変換できる。図9は、図2,図4,図5のような文字列の座標変換後の座標値の例を示した表、図10は、図7のような文字列の座標変換後の座標値の例を示した表、図11は、図8のような文字列の座標変換後の座標値の例を示した表である。
図12は、図1の画像処理装置10の処理例を説明するフローチャートである。
画像処理装置100は、図示するように、光学文字認識部11で文字列と該文字列を構成する文字の座標情報を取得すると、傾き取得部13が文字列の座標系が当初より90度、180度または270度回転した状態の座標系になるよう座標変換し(ステップS1)、上記座標情報を再取得する。これにより、例えば、図9〜図11に示す、文字列の座標値が取得される。
そして、類似文字抽出部13aが、光学文字認識部11で取得した文字列を構成する文字から実頻出文字群を取得する(ステップS2)。例えば、図2の例では、文字列L1の「Users’ Documents.」うち最も多く3つある文字「s」を取得する。図9では、文字番号2,5,15の文字を取得する。
また、類似文字抽出部13aが、光学文字認識部11で取得した文字列を構成する文字から一般頻出文字群を取得する(ステップS3)。例えば、図5の例に対し図4のリストT1があった場合、図10の文字番号2,3,5,8,9,12,15の文字を取得する。
ステップS4では、類似文字抽出部13aが、取得した実頻出文字群と一般頻出文字群のいずれかを選択抽出する。
続いて、類似文字抽出部13aが、選択抽出した文字群のうちから全部または一部の文字を抜粋し、文字群として傾き算出部13bに出力する(ステップS5)。そして、傾き算出部13bが文字列の傾き値を算出する(ステップS6)。
さらに、傾き値取得部13は、算出された文字列の傾き値が微小であるかすなわち閾値以下か否か判定し(ステップS7)、閾値以上の場合(Noの場合)は処理をステップS9に進め、閾値以下の場合(YESの場合)は、算出された文字列の傾き値を0に書き換え(ステップS8)、その後、処理をステップS9に進める。閾値は例えば0.01である。ステップS9では、算出された文字列の傾き値を、ステップS1での座標変換前の座標系に適合するよう座標変換を行う。
図13は、図12のステップS4の文字群選択抽出処理の一例を説明するフローチャートである。
まず、類似文字抽出部13aが、傾き値を取得する対象の文字列が2字以下か否か判定する(ステップS11)。2字以下の場合(NOの場合)は、従来と同様の方法で文字列の傾き値を取得するので処理を終了し、2字より多い場合(YESの場合)は、実頻出文字群が1字以下か否か判定する(ステップS12)。
実頻出文字群が1字以下の場合(YESの場合)、一般頻出文字群が1字以下か否か判定し(ステップS13)、1字以下の場合(YESの場合)は、処理を終了し、2字より多い場合(YESの場合)は一般頻出文字群を選択抽出する(ステップS14)。
ステップS12において実頻出文字群が1字より多い場合(NOの場合)、一般頻出文字群が1字以下か否かを判定し(ステップS15)、1字以下の場合(YESの場合)は、実頻出文字を選択抽出する(ステップS21)。1字より多い場合(NOの場合)は、ステップS16に処理を進める。
ステップS16では、実頻出文字群と一般頻出文字群とについて、両端の文字間の距離が一方より他方の方が長いか否か判定し、長い場合(YESの場合)は、長い方の文字群を選択抽出する(ステップS17)。短い場合(NOの場合)は、実頻出文字群と一般頻出文字群とで字数に差があるか否か判定する(ステップS18)。
ステップS18において、字数に差があると判定された場合(YESの場合)は、字数の多い方の文字群を選択抽出する(ステップS19)。字数に差がないと判定された(NOの場合)、文字の部分の偏りが少ない方の文字群、具体的には、文字群の中央の文字のX座標(文字群の文字数が偶数なら、中央の2個の文字の座標の平均)が、両端の文字のX座標の平均に近い方)の文字群を選択抽出する(ステップS20)。
なお、詳細は省略するが、対象の文字列が2字の場合や、実頻出文字群が1字で一般頻出文字群が1字以下の場合は、従来と同様、文字列を構成する全ての文字や両端の文字の座標情報に基づいて文字列の傾き値を算出する。
図14は、図12のステップS5の文字抜粋処理の一例を説明するフローチャートである。本例は、選択抽出した文字群の文字数が4より大きい場合に、4つの文字を抜粋する例である。
まず、類似文字抽出部13aが、選択抽出した文字群の文字数が4以下であるか否か判定する(ステップS31)。4字以下の場合(YESの場合)は、全ての文字を抜粋し、文字群として、傾き算出部13bに出力し(ステップS32)、4字より多い場合(NOの場合)、選択抽出した文字群の文字数を3で割った結果の整数値aを取得する(ステップS33)。そして、選択抽出した文字群のうち、両端の文字と、両端の文字からa字内側の文字を抜粋し、文字群として、傾き算出部13bに出力する(ステップS34)。
図15は、図12のステップS12の傾き値算出処理の一例を説明するフローチャートである。なお、ここでは、文字列として、図7及び図10で示される文字列が入力されているものとし、この場合、ステップS5までの処理で、図10の文字番号2,5,9,15の文字が抜粋されている。
傾き算出部13bは、まず、抜粋された文字について、全ての2つの文字間でY座標の差を算出する(ステップS41)。
そして、Y座標の差が最も小さい文字間の傾き値を文字列の傾き値として算出する(ステップS42)。図10の例では、抜粋された文字のうち、文字番号2の文字「s」と文字番号5の文字「s」の差が最も小さい「2.0」であることが分かるので、この2つの文字間の傾き値が(409.0−407.0/209・0−160.5)=0.041が文字列の傾き値として算出される。
図16は、図12のステップS12の傾き値算出処理の他の例を説明するフローチャートである。なお、ここでは、文字列として、図7及び図10で示される文字列が入力されているものとし、この場合、ステップS5までの処理で、図10の文字番号2,5,9,15の文字が抜粋されている。
傾き算出部13bは、まず、抜粋された文字において全ての隣接する2つの文字間で傾き値を算出する(ステップS51)。図10の例では、文字番号2の文字「s」と文字番号5の文字「s」の間の傾き値、文字番号5の文字「s」と文字番号9の文字「c」の間の傾き値、文字番号9の文字「c」と文字番号15の文字「s」の間の傾き値を算出し、それぞれ、0.1875、−0.2458、0.1867である。
続いて、傾き算出部13bは、算出した傾き値群の平均値と統計的分散を算出し(ステップS52)、算出した平均値と統計的分散に基づいて外れ値である傾き値を除く(ステップS53)。図10の例では、傾き値「−0.2457」が外れ値として除かれる。
そして、傾き算出部13bは、残った文字間の傾き値から文字列の傾き値を算出する(ステップS54)。例えば、図10の例では、残った傾き値「0.1875」,「0.1867」の平均値「0.1871」を文字列の傾き値として算出する。
10…画像処理装置、11…光学文字認識部、12…翻訳部、13…傾き取得部、13a…類似文字抽出部、13b…傾き算出部、14…画像処理部。

Claims (8)

  1. 文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
    前記類似文字抽出部は、前記文字列を構成する文字のうちで最も多い文字からなる文字群を抽出することを特徴とする画像処理装置。
  2. 文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
    前記類似文字抽出部は、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群を抽出することを特徴とする画像処理装置。
  3. 文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
    前記類似文字抽出部は、前記文字列を構成する文字のうちで最も多い文字からなる文字群と、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群とのうち、前記文字列内において文字間隔がより均等である文字群を抽出することを特徴とする画像処理装置。
  4. 前記類似文字抽出部は、抽出した前記文字群中から抜粋した文字からなる文字群を出力することを特徴とする請求項1〜のいずれか1項に記載の画像処理装置。
  5. 前記傾き算出部は、前記類似文字抽出部から出力された文字群の文字のうち傾き増減方向の座標の差が最も小さい2つの文字の間の傾き値を算出し、該傾き値を前記文字列の傾き値とすることを特徴とする請求項1〜のいずれか1項に記載の画像処理装置。
  6. 前記傾き算出部は、前記類似文字抽出部から出力された文字群における全ての隣接する2つの文字間の傾き値を算出し、該算出された文字間の傾き値の群のうち統計的に外れ値であるものを除いた前記文字間の傾き値の群から、前記文字列の傾き値を算出することを特徴とする請求項1〜のいずれか1項に記載の画像処理装置。
  7. 文書読取装置における文書の読取態様によらず、前記傾き算出部で算出される前記文字列の傾き値が所定の範囲内となるように、当該文字列を構成する文字を含む画像の座標系が予め変換されることを特徴とする請求項1〜のいずれか1項に記載の画像処理装置。
  8. 前記傾き算出部で算出した前記文字列の傾き値が所定値以下の場合は、前記文字列の傾き値として0を出力することを特徴とする請求項1〜のいずれか1項に記載の画像処理装置。
JP2011097195A 2011-04-25 2011-04-25 画像処理装置 Active JP5337194B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011097195A JP5337194B2 (ja) 2011-04-25 2011-04-25 画像処理装置
US13/417,446 US8705862B2 (en) 2011-04-25 2012-03-12 Image processing apparatus
CN201210119225.XA CN102760233B (zh) 2011-04-25 2012-04-20 图像处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011097195A JP5337194B2 (ja) 2011-04-25 2011-04-25 画像処理装置

Publications (2)

Publication Number Publication Date
JP2012230480A JP2012230480A (ja) 2012-11-22
JP5337194B2 true JP5337194B2 (ja) 2013-11-06

Family

ID=47021389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011097195A Active JP5337194B2 (ja) 2011-04-25 2011-04-25 画像処理装置

Country Status (3)

Country Link
US (1) US8705862B2 (ja)
JP (1) JP5337194B2 (ja)
CN (1) CN102760233B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5624671B2 (ja) * 2011-03-04 2014-11-12 グローリー株式会社 文字列切出方法及び文字列切出装置
US9165363B2 (en) * 2011-08-03 2015-10-20 Hitachi Medical Corporation Image diagnostic device and image correction method
CN104298982B (zh) * 2013-07-16 2019-03-08 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
US10089411B2 (en) * 2014-01-02 2018-10-02 Neustar Inc. Method and apparatus and computer readable medium for computing string similarity metric
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
CN110032996B (zh) * 2018-01-11 2021-06-04 台达电子工业股份有限公司 分类基础式的字符倾斜校正装置及其方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2669661B2 (ja) * 1988-08-05 1997-10-29 日本電信電話株式会社 文書画像処理方法
JP3260979B2 (ja) * 1994-07-15 2002-02-25 株式会社リコー 文字認識方法
US5638466A (en) * 1995-08-30 1997-06-10 Horizon Marketing Corporation Aka Wordwand Method and apparatus for deskewing images of symbols having a non-linear baseline
JP3541093B2 (ja) * 1995-10-12 2004-07-07 株式会社リコー 文書画像の傾き検出方法および装置
JPH1069520A (ja) * 1996-06-18 1998-03-10 Nippon Steel Corp 文字認識方法及びプログラムを記録した記録媒体
US7050632B2 (en) * 2002-05-14 2006-05-23 Microsoft Corporation Handwriting layout analysis of freeform digital ink input
JP4553241B2 (ja) * 2004-07-20 2010-09-29 株式会社リコー 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JP4909216B2 (ja) * 2006-09-13 2012-04-04 株式会社キーエンス 文字切り出し装置、方法およびプログラム
TWI319547B (en) * 2006-12-01 2010-01-11 Compal Electronics Inc Method for generating typographical line
TWI385584B (zh) * 2008-11-05 2013-02-11 Avermedia Information Inc 自動排列手寫字串之裝置及方法
JP4948586B2 (ja) 2009-11-06 2012-06-06 シャープ株式会社 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体

Also Published As

Publication number Publication date
CN102760233B (zh) 2015-04-15
CN102760233A (zh) 2012-10-31
JP2012230480A (ja) 2012-11-22
US8705862B2 (en) 2014-04-22
US20120269438A1 (en) 2012-10-25

Similar Documents

Publication Publication Date Title
JP5337194B2 (ja) 画像処理装置
JP3343864B2 (ja) 語体の分離方法
Berg-Kirkpatrick et al. Unsupervised transcription of historical documents
JP4741977B2 (ja) 手書文字処理装置及び手書文字処理方法
EP3940589B1 (en) Layout analysis method, electronic device and computer program product
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
US8208726B2 (en) Method and system for optical character recognition using image clustering
CN107330430B (zh) 藏文字符识别装置与方法
Calvo-Zaragoza et al. Avoiding staff removal stage in optical music recognition: application to scores written in white mensural notation
US7929772B2 (en) Method for generating typographical line
US20130287300A1 (en) Defining a layout of text lines of cjk and non-cjk characters
JP2011141749A (ja) 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
JP5343617B2 (ja) 文字認識プログラム、文字認識方法および文字認識装置
CN108052936A (zh) 一种盲文图像自动倾斜校正方法及系统
US8989485B2 (en) Detecting a junction in a text line of CJK characters
JP2013254321A (ja) 画像処理装置、画像処理方法及びプログラム
CN104850819B (zh) 信息处理方法及电子设备
CN103489268A (zh) 一种用于pos平台的阿拉伯语显示方法
US20210303842A1 (en) Information processing device and non-transitory computer readable medium
JP4087191B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5604276B2 (ja) 文書画像生成装置および文書画像生成方法
JP2021152735A (ja) 情報処理装置及びプログラム
JP5531493B2 (ja) 文字認識装置、文字認識方法、プログラム及び記録媒体
JP7034823B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
Zheng et al. A new method for baseline extraction of Manchu word

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130802

R150 Certificate of patent or registration of utility model

Ref document number: 5337194

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150