JP5847062B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP5847062B2
JP5847062B2 JP2012258800A JP2012258800A JP5847062B2 JP 5847062 B2 JP5847062 B2 JP 5847062B2 JP 2012258800 A JP2012258800 A JP 2012258800A JP 2012258800 A JP2012258800 A JP 2012258800A JP 5847062 B2 JP5847062 B2 JP 5847062B2
Authority
JP
Japan
Prior art keywords
pixel set
character
connected pixel
image
rectangular area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012258800A
Other languages
English (en)
Other versions
JP2014107685A (ja
Inventor
敏明 六尾
敏明 六尾
政樹 馬場
政樹 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2012258800A priority Critical patent/JP5847062B2/ja
Priority to US14/086,346 priority patent/US9064175B2/en
Priority to EP13005465.3A priority patent/EP2735998B1/en
Priority to CN201310596613.1A priority patent/CN103841295B/zh
Publication of JP2014107685A publication Critical patent/JP2014107685A/ja
Application granted granted Critical
Publication of JP5847062B2 publication Critical patent/JP5847062B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、画像処理装置に関するものである。
ある画像処理装置では、原画像から文字と背景画像とを分離し、文字の画像データと背景画像の画像データとを別々に圧縮する(例えば特許文献1参照)。
原画像内の文字を検出する際、ラベリング処理により得られる黒画素集合に外接する矩形領域を特定し、その矩形領域のサイズが小さい場合、その矩形領域を、文字検出の対象とし、その矩形領域のサイズが大きい場合、ラベリング率、周辺長率などに基づいて、その矩形領域を、文字検出の対象とするか否かを判定している(例えば特許文献2参照)。ラベリング率とは、矩形領域内の全画素数に対する黒画素集合内の画素数の割合であり、周辺長率とは、矩形領域内の全画素数に対する、白画素に隣接する黒画素数の割合である。
特表2005−500709号公報 特開2007−336000号公報
しかしながら、上述のようにして文字を検出する場合、矩形領域のサイズが大きい場合、ラベリング率、周辺長率などを計算する必要があり、高速に文字の検出を行うことが困難である。
本発明は、上記の問題に鑑みてなされたものであり、文字の検出を、正確かつ高速に行う画像処理装置を得ることを目的とする。
上記の課題を解決するために、本発明では以下のようにした。
本発明に係る画像処理装置は、原画像におけるエッジを検出し、検出した前記エッジで構成されるエッジ画像を生成するエッジ画像生成部と、前記エッジ画像内の連結画素集合を抽出する連結画素抽出部と、前記連結画素集合を、前記連結画素集合の色ごとに分類し、前記色のそれぞれについて、2値画像である文字画像を生成する2値画像生成部と、前記文字画像に基づいて前記原画像の背景画像を生成する背景画像生成部と、前記文字画像の画像データと前記背景画像の画像データとを互いに異なる圧縮方式で圧縮する画像圧縮部とを備える。そして、前記2値画像生成部は、前記連結画素集合に外接する矩形内の領域である矩形領域内の前記連結画素集合以外の画素の、前記原画像での色と、前記連結画素集合内の画素の、前記原画像での色との差である色差について、前記色差のばらつきに関する所定の指標の値と色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定し、前記矩形領域のサイズが所定の閾値に基づき小さいか大きいかを判定し、前記矩形領域のサイズが小さい場合と前記矩形領域のサイズが大きい場合とで異なる値を、前記色差閾値に設定する。
これにより、矩形領域のサイズが大きい場合でも文字の誤検出が低減され、文字の検出が、正確かつ高速に行われる。
また、本発明に係る画像処理装置は、上記の画像処理装置に加え、次のようにしてもよい。この場合、前記2値画像生成部は、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度の差が所定の閾値以上である場合、前記指標の値と前記色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定し、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度の差が所定の閾値より小さい場合、前記連結画素集合が非文字であると判定する。
また、本発明に係る画像処理装置は、上記の画像処理装置に加え、次のようにしてもよい。この場合、前記2値画像生成部は、前記色差の最大値と最小値との差と、前記色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定する。
また、本発明に係る画像処理装置は、上記の画像処理装置に加え、次のようにしてもよい。この場合、前記2値画像生成部は、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度および色の差の最大値と最小値との差と、前記色差閾値との比較結果に基づいて、前記連結画素集合が文字であるか非文字であるかを判定する。
また、本発明に係る画像処理装置は、上記の画像処理装置に加え、次のようにしてもよい。この場合、前記2値画像生成部は、前記色差の分散値と前記色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定する。
また、本発明に係る画像処理装置は、上記の画像処理装置に加え、次のようにしてもよい。この場合、前記2値画像生成部は、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度および色の差の分散値と前記色差閾値との比較結果に基づいて、前記連結画素集合が文字であるか非文字であるかを判定する。
また、本発明に係る画像処理装置は、上記の画像処理装置に加え、次のようにしてもよい。この場合、前記2値画像生成部は、前記色差の平均値に応じて、前記色差閾値を変更する。
また、本発明に係る画像処理装置は、上記の画像処理装置に加え、次のようにしてもよい。この場合、画像処理装置は、前記連結画素集合に外接する矩形が互いに近接している前記連結画素集合を検出し、1つの前記連結画素集合としてグループ化する連結画素結合部をさらに備える。
本発明によれば、文字の検出が、正確かつ高速に行われる。
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。 図2は、図1に示す画像処理装置において抽出される連結画素集合の例を示す図である。 図3は、図1における2値画像生成部による文字判定処理について説明するフローチャートである。
以下、図に基づいて本発明の実施の形態を説明する。
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。図1に示す画像処理装置は、例えば、ASIC(Application Specific Integrated Circuit)、コンピューターなどで実現され、原画像などの各種画像の画像データは、RAM(Random Access Memory)、不揮発性メモリーなどに適宜記憶され、ASICやコンピューター内のプロセッサーで以下の処理部が実現される。
エッジ画像生成部1は、原画像におけるエッジを検出し、検出した前記エッジで構成されるエッジ画像を生成する。この実施の形態では、エッジ画像は、検出されたエッジの高濃度側の画素の位置を示す画像であり、2値画像である。つまり、検出されたエッジの高濃度側の画素の値が1であり、それ以外の画素の値が0である。
この実施の形態では、原画像は、多値のカラー画像であり、エッジ画像生成部1は、原画像の輝度成分のみの画像を生成し、その画像においてエッジを検出し、検出したエッジで構成されるエッジ画像を生成する。
連結画素抽出部2は、エッジ画像内の連結画素集合を抽出し、ひと繋がりの連結画素を、1つの集合として識別可能に管理する。つまり、連結画素集合と別の連結画素集合とが、連結していない場合、それらは、2つの集合として、それぞれ識別可能に管理される。なお、連結画素集合は、上述の高濃度側の画素(画素値が1である画素)のうち、1つの単独の画素、または互いに連結している複数の画素からなる。
連結画素結合部3は、連結画素集合に外接する矩形が互いに近接している複数の連結画素集合を検出し、それらを1つの連結画素集合としてグループ化する。つまり、2つの連結画素集合がグループ化されると、1つの連結画素集合として管理される。例えば、連結画素集合に外接する矩形の一部が重なっている場合、連結画素集合に外接する矩形の間の距離が所定値より短い場合などの所定の条件が成立すると、それらの連結画素集合がグループ化される。
2値画像生成部4は、連結画素集合を、連結画素集合の色(つまり、原画像内での色)ごとに分類し、その色のそれぞれについて文字画像を生成する。文字画像は2値画像である。このとき、文字に該当しない連結画素集合を除いた連結画素集合に基づいて文字画像が生成される。
例えば、5つの連結画素集合A〜Eが存在し、原画像での連結画素集合A,Bが第1の色であり、原画像での連結画素集合Cが第2の色(第1の色とは別の色)であり、原画像での連結画素集合D,Eが第3の色(第1,第2の色とは別の色)である場合、第1の色について、連結画素集合A,Bの位置の画素値が1であり、その他の位置の画素値が0である文字画像が生成され、第2の色について、連結画素集合Cの位置の画素値が1であり、その他の位置の画素値が0である文字画像が生成され、第3の色について、連結画素集合D,Eの位置の画素値が1であり、その他の位置の画素値が0である文字画像が生成される。
また、2値画像生成部4は、連結画素集合に外接する矩形内側の領域である矩形領域内の連結画素集合以外の画素の色(原画像での色であって、YUV色空間でのU座標とV座標の値)と、その連結画素集合内の画素の色(原画像での色であって、YUV色空間でのU座標とV座標の値)との差を色差(つまり、UV平面での両者の距離)とし、の色差のばらつきに関する所定の指標の値と色差閾値とを比較して、その連結画素集合が文字であるか非文字であるかを判定する。
なお、上述の色差のばらつきは、連結画素集合以外の各画素と連結画素集合内の各画素との色差のばらつきとしてもよいし、連結画素集合以外の画素の色の平均値と連結画素集合内の各画素の色との差のばらつきとしてもよい。
このとき、2値画像生成部4は、その矩形領域のサイズが、所定の閾値に基づき小さいか大きいかを判定し、矩形領域のサイズが小さい場合と矩形領域のサイズが大きい場合とで異なる値を、その色差閾値に設定する。
ここでは、主走査方向における矩形領域の幅および副走査方向における矩形領域の幅の少なくとも一方が、所定の閾値以上である場合、矩形領域のサイズが大きいと判定され、そうではない場合、矩形領域のサイズが小さいと判定される。
なお、2値画像生成部4は、上述の色差の最大値と最小値との差を上述の指標として、連結画素集合が文字であるか非文字であるかを判定するようにしてもよい。
また、2値画像生成部4は、上述の色差の分散値を上述の指標として、連結画素集合が文字であるか非文字であるかを判定するようにしてもよい。
さらに、この実施の形態では、2値画像生成部4は、その矩形領域内の連結画素集合の画素と矩形領域内の連結画素集合以外の画素との輝度の差が所定の閾値以上である場合、その指標の値と色差閾値とを比較して、その連結画素集合が文字であるか非文字であるかを判定し、矩形領域内の連結画素集合の画素と矩形領域内の連結画素集合以外の画素との輝度の差が所定の閾値より小さい場合、その連結画素集合が非文字であると判定する。
背景画像生成部5は、上述の文字画像に基づいて、原画像の背景画像を生成する。具体的には、背景画像生成部5は、文字画像に基づいて、上述の文字画像における文字の位置(つまり、画素値が1である画素の位置)を特定し、原画像におけるその位置の画素値を次のように置き換えて、背景画像を生成する。
例えば、背景画像生成部5は、原画像における、文字画像の位置(つまり、文字画像内で画素値が1である画素の位置)の画素値を、連結画素集合に外接する矩形の周囲の少なくとも一部の画素の、原画像での値の平均値として、背景画像を生成する。
図2は、図1に示す画像処理装置において抽出される連結画素集合の例を示す図である。
図2(A)に示す例は、原画像に「エ」という文字がある場合のものであり、この例では、連結画素集合101が検出され、連結画素集合101に外接する矩形102が特定されている。この例において、矩形102の周囲の星印を付した画素の、原画像での画素値に基づいて、背景画像における、この連結画素集合101の位置の画素値が決定される。なお、矩形102の内側の画素領域が、この場合の上述の矩形領域となる。
図2(B)に示す例は、原画像に「E」という文字がある場合のものであり、この例では、連結画素集合111が検出され、連結画素集合111に外接する矩形112が特定されている。この例において、矩形112の周囲の星印を付した画素の、原画像での画素値に基づいて、背景画像における、この連結画素集合111の位置の画素値が決定される。
図2(C)に示す例は、原画像に「つ」という文字がある場合のものであり、この例では、連結画素集合121が検出され、連結画素集合121に外接する矩形122が特定されている。この例において、矩形122の周囲の星印を付した画素の、原画像での画素値に基づいて、背景画像における、この連結画素集合121の位置の画素値が決定される。
なお、背景画像生成部5は、例えば、原画像における、文字画像の位置の画素値を、上述の矩形の周囲のすべての画素の、原画像での値の平均値として、背景画像を生成するようにしてもよい。また、背景画像生成部5は、原画像における、文字画像の位置の画素値を、上述の矩形の周囲の4つの頂点に位置する4つの画素(図2における黒色の星印の画素)の、原画像での値の平均値として、背景画像を生成するようにしてもよい。
なお、グループ化された連結画素集合が存在する場合、2値画像生成部4は、グループ化された連結画素集合については、その連結画素集合のグループの色ごとに分類し、それらの色のそれぞれについて文字画像を生成する。このとき、グループ化されていない連結画素集合の色と、グループ化された連結画素集合の色とが同一である場合、それらは同一の文字画像に含められる。
画像圧縮部6は、上述の文字画像の画像データと背景画像の画像データとを互いに異なる圧縮方式で圧縮する。例えば、文字画像の画像データは、MMR(Modified Modified READ)方式で圧縮され、背景画像の画像データは、JPEG(Joint Photographic Experts Group)方式で圧縮される。なお、文字画像の画像データは、色の数と同数のデータがあり、それぞれが圧縮される。また、各色の値は、その色の文字画像の圧縮後の画像データに関連付けて管理される。
次に上記画像処理装置の動作について説明する。
まず、エッジ画像生成部1が、原画像におけるエッジを検出し、検出したエッジで構成されるエッジ画像を生成する。
次に、連結画素抽出部2は、エッジ画像内の連結画素集合を抽出し、ひと繋がりの連結画素を、1つの集合として識別可能に管理する。
このとき、連結画素結合部3は、連結画素抽出部2により抽出された連結画素集合に外接する矩形の位置およびサイズを特定し、その矩形が互いに近接している連結画素集合が存在する場合、その矩形が互いに近接している連結画素集合を検出し、1つの連結画素集合としてグループ化する。
そして、2値画像生成部4は、連結画素集合を、連結画素集合の色(つまり、原画像内での色)ごとに分類し、その色のそれぞれについて文字画像を生成する。
このようにして、文字画像が、色ごとに生成される。
ここで、2値画像生成部4による文字判定処理について説明する。図3は、図1における2値画像生成部4による文字判定処理について説明するフローチャートである。
まず、2値画像生成部4は、矩形領域内の連結画素集合の輝度値(例えば、連結画素集合内の画素の輝度値の平均値)と、矩形領域内の連結画素集合以外の部分の輝度値(例えば、その部分における画素の輝度値の平均値)との差が所定の第1閾値以上であるか否かを判定する(ステップS1)。
上述の輝度値の差が所定の第1閾値以上ではない場合、2値画像生成部4は、その連結g画素集合を非文字であると判定する(ステップS2)。
一方、上述の輝度値の差が所定の第1閾値以上である場合、2値画像生成部4は、以下のようにして、その連結画素集合が文字であるか否かを判定する。
まず、2値画像生成部4は、その矩形領域内の連結画素集合の色差の平均値が所定の第2閾値以上であるか否かを判定する(ステップS3)。
その色差の平均値が所定の第2閾値以上ではない場合、2値画像生成部4は、その矩形領域のサイズが所定の第3閾値以上であるか否かを判定し(ステップS4)、その矩形領域のサイズが所定の第3閾値以上である場合、連結画素集合の色差のばらつきが第4閾値以上であるか否かを判定し(ステップS5)、その矩形領域のサイズが所定の第3閾値以上ではない場合、連結画素集合の色差のばらつきが、第4閾値とは異なる第5閾値以上であるか否かを判定する(ステップS6)。ステップS5において連結画素集合の色差のばらつきが第4閾値以上である場合には、この連結画素集合は非文字であると判定され(ステップS7)、そうではない場合には、この連結画素集合は文字であると判定される(ステップS8)。また、ステップS6において連結画素集合の色差のばらつきが第5閾値以上である場合には、この連結画素集合は非文字であると判定され(ステップS9)、そうではない場合には、この連結画素集合は文字であると判定される(ステップS10)。
一方、上述の色差の平均値が所定の第2閾値以上である場合、2値画像生成部4は、その矩形領域のサイズが所定の第3閾値以上であるか否かを判定し(ステップS11)、その矩形領域のサイズが所定の第3閾値以上である場合、連結画素集合の色差のばらつきが、第4閾値とは異なる第6閾値以上であるか否かを判定し(ステップS12)、その矩形領域のサイズが所定の第3閾値以上ではない場合、連結画素集合の色差のばらつきが、第6閾値とは異なる第7閾値以上であるか否かを判定する(ステップS13)。ステップS12において連結画素集合の色差のばらつきが第6閾値以上である場合には、この連結画素集合は非文字であると判定され(ステップS14)、そうではない場合には、この連結画素集合は文字であると判定される(ステップS15)。また、ステップS13において連結画素集合の色差のばらつきが第7閾値以上である場合には、この連結画素集合は非文字であると判定され(ステップS16)、そうではない場合には、この連結画素集合は文字であると判定される(ステップS17)。
ここで、第5閾値は、第4閾値より大きい値とされ、第7閾値は、第6閾値より大きい値とされ、第6閾値は、第4閾値より大きい値とされ、第7閾値は、第5閾値より大きい値とされる。
例えば、YUVの各座標が255階調である場合、第1閾値が8とされ、第2閾値が16とされ、第3閾値が115(10ミリメートル)とされ、第4閾値が40とされ、第5閾値が80とされ、第6閾値が60とされ、第7閾値が255とされる。
このようにして、連結画素集合が文字であるか非文字であるかが判定される。これにより、連結画素集合の色が均一でなくても、正確に文字検出が行われる。
また、背景画像生成部5は、上述の文字画像に基づいて、原画像の背景画像を生成する。このとき、上述したように、背景画像生成部5は、原画像における、文字画像の位置の画素値を、連結画素集合に外接する矩形の周囲の少なくとも一部の画素の、原画像での値の平均値として、背景画像を生成する。
このようにして、背景画像が生成される。
そして、画像圧縮部6は、上述の文字画像の画像データと背景画像の画像データとを互いに異なる圧縮方式で圧縮する。
このようにして、原画像から文字画像と背景画像とが分離され、別々に画像データの圧縮が行われる。
以上のように、上記実施の形態によれば、2値画像生成部4は、連結画素集合に外接する矩形内側の領域である矩形領域内の連結画素集合以外の画素の色と、その連結画素集合内の画素の色との差である色差について、その色差のばらつきに関する所定の指標の値と色差閾値とを比較して、その連結画素集合が文字であるか非文字であるかを判定する。このとき、2値画像生成部4は、その矩形領域のサイズが所定の閾値に基づき小さいか大きいかを判定し、矩形領域のサイズが小さい場合と矩形領域のサイズが大きい場合とで異なる値を、その色差閾値に設定する。


これにより、矩形領域のサイズが大きい場合でも文字の誤検出が低減され、文字の検出が、正確かつ高速に行われる。
例えばスキャナーで生成された画像データの場合、スキャナーの光学系などの要因で文字エッジ付近に偽色が生じることがあり、その場合、文字が非文字と判定されやすくなるが、上述のように文字を検出することで、文字か非文字かの判定の誤りが低減される。
なお、上述の実施の形態は、本発明の好適な例であるが、本発明は、これらに限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変形、変更が可能である。
例えば、上記実施の形態において、2値画像生成部4は、矩形領域内の連結画素集合の画素と矩形領域内の連結画素集合以外の画素との輝度および色の差(つまり、YUV空間内での両者の距離)の最大値と最小値との差と、色差閾値との比較結果に基づいて、連結画素集合が文字であるか非文字であるかを判定するようにしてもよい。
また、上記実施の形態において、2値画像生成部4は、矩形領域内の連結画素集合の画素と矩形領域内の連結画素集合以外の画素との輝度および色の差の分散値(つまり、YUV空間内での分散値)と色差閾値との比較結果に基づいて、連結画素集合が文字であるか非文字であるかを判定するようにしてもよい。
さらに、上記実施の形態において、矩形領域のサイズが第3閾値より小さい連結画素集合については、一律に、文字と判定するようにしてもよい。
本発明は、例えば、画像データの圧縮に適用可能である。
1 エッジ画像生成部
2 連結画素抽出部
3 連結画素結合部
4 2値画像生成部
5 背景画像生成部
6 画像圧縮部
101,111,121 連結画素集合

Claims (8)

  1. 原画像におけるエッジを検出し、検出した前記エッジで構成されるエッジ画像を生成するエッジ画像生成部と、
    前記エッジ画像内の連結画素集合を抽出する連結画素抽出部と、
    前記連結画素集合を、前記連結画素集合の色ごとに分類し、前記色のそれぞれについて、2値画像である文字画像を生成する2値画像生成部と、
    前記文字画像に基づいて前記原画像の背景画像を生成する背景画像生成部と、
    前記文字画像の画像データと前記背景画像の画像データとを互いに異なる圧縮方式で圧縮する画像圧縮部とを備え、
    前記2値画像生成部は、前記連結画素集合に外接する矩形内の領域である矩形領域内の前記連結画素集合以外の画素の、前記原画像での色と、前記連結画素集合内の画素の、前記原画像での色との差である色差について、前記色差のばらつきに関する所定の指標の値と色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定し、前記矩形領域のサイズが所定の閾値に基づき小さいか大きいかを判定し、前記矩形領域のサイズが小さい場合と前記矩形領域のサイズが大きい場合とで異なる値を、前記色差閾値に設定すること、
    を特徴とする画像処理装置。
  2. 前記2値画像生成部は、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度の差が所定の閾値以上である場合、前記指標の値と前記色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定し、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度の差が所定の閾値より小さい場合、前記連結画素集合が非文字であると判定することを特徴とする請求項1記載の画像処理装置。
  3. 前記2値画像生成部は、前記色差の最大値と最小値との差と、前記色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定することを特徴とする請求項1記載の画像処理装置。
  4. 前記2値画像生成部は、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度および色の差の最大値と最小値との差と、前記色差閾値との比較結果に基づいて、前記連結画素集合が文字であるか非文字であるかを判定することを特徴とする請求項1記載の画像処理装置。
  5. 前記2値画像生成部は、前記色差の分散値と前記色差閾値とを比較して、前記連結画素集合が文字であるか非文字であるかを判定することを特徴とする請求項1記載の画像処理装置。
  6. 前記2値画像生成部は、前記矩形領域内の前記連結画素集合の画素と前記矩形領域内の前記連結画素集合以外の画素との輝度および色の差の分散値と前記色差閾値との比較結果に基づいて、前記連結画素集合が文字であるか非文字であるかを判定することを特徴とする請求項1記載の画像処理装置。
  7. 前記2値画像生成部は、前記色差の平均値に応じて、前記色差閾値を変更することを特徴とする請求項1から請求項6のうちのいずれか1項記載の画像処理装置。
  8. 前記連結画素集合に外接する矩形が互いに近接している前記連結画素集合を検出し、1つの前記連結画素集合としてグループ化する連結画素結合部をさらに備えることを特徴とする請求項1から請求項7のうちのいずれか1項記載の画像処理装置。
JP2012258800A 2012-11-27 2012-11-27 画像処理装置 Active JP5847062B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012258800A JP5847062B2 (ja) 2012-11-27 2012-11-27 画像処理装置
US14/086,346 US9064175B2 (en) 2012-11-27 2013-11-21 Image processing apparatus
EP13005465.3A EP2735998B1 (en) 2012-11-27 2013-11-21 Image processing apparatus
CN201310596613.1A CN103841295B (zh) 2012-11-27 2013-11-22 图像处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012258800A JP5847062B2 (ja) 2012-11-27 2012-11-27 画像処理装置

Publications (2)

Publication Number Publication Date
JP2014107685A JP2014107685A (ja) 2014-06-09
JP5847062B2 true JP5847062B2 (ja) 2016-01-20

Family

ID=49641465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012258800A Active JP5847062B2 (ja) 2012-11-27 2012-11-27 画像処理装置

Country Status (4)

Country Link
US (1) US9064175B2 (ja)
EP (1) EP2735998B1 (ja)
JP (1) JP5847062B2 (ja)
CN (1) CN103841295B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5730274B2 (ja) * 2012-11-27 2015-06-03 京セラドキュメントソリューションズ株式会社 画像処理装置
JP5697649B2 (ja) * 2012-11-27 2015-04-08 京セラドキュメントソリューションズ株式会社 画像処理装置
JP6091400B2 (ja) * 2013-06-28 2017-03-08 京セラドキュメントソリューションズ株式会社 画像処理装置
JP6977425B2 (ja) * 2017-09-14 2021-12-08 セイコーエプソン株式会社 画像処理装置、二値画像生産方法および画像処理プログラム
US10909406B2 (en) * 2018-01-08 2021-02-02 Newgen Software Technologies Limited Image processing system and method
CN114022403A (zh) * 2020-07-16 2022-02-08 京东方科技集团股份有限公司 检测显示面板不良的方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0677811A1 (en) * 1994-04-15 1995-10-18 Canon Kabushiki Kaisha Image processing system with on-the-fly JPEG compression
US7145676B2 (en) 2001-01-31 2006-12-05 Hewlett-Packard Development Company, L.P. Compound document image compression using multi-region two layer format
JP4047192B2 (ja) * 2003-02-24 2008-02-13 キヤノン株式会社 画像圧縮装置及び方法、画像伸張装置及び方法、プログラム
JP2005020227A (ja) * 2003-06-25 2005-01-20 Pfu Ltd 画像圧縮装置
JP4259310B2 (ja) * 2003-12-18 2009-04-30 富士ゼロックス株式会社 画像処理装置及びプログラム
AU2004242419A1 (en) * 2004-12-21 2006-07-06 Canon Kabushiki Kaisha Analysing digital image of a document page
ATE501487T1 (de) * 2004-12-21 2011-03-15 Canon Kk Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation
JP4135752B2 (ja) 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US7899247B2 (en) * 2007-01-24 2011-03-01 Samsung Electronics Co., Ltd. Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system
US7894689B2 (en) * 2007-05-31 2011-02-22 Seiko Epson Corporation Image stitching
JP5082637B2 (ja) * 2007-07-10 2012-11-28 富士通株式会社 画像処理プログラム、画像処理方法及び画像処理装置
JP5005732B2 (ja) * 2008-06-26 2012-08-22 株式会社東芝 画像形成装置及び画像処理方法
US8254694B2 (en) * 2009-06-08 2012-08-28 Xerox Corporation Thin line detection in scanned image data
JP2011013899A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、その制御方法、コンピュータプログラム

Also Published As

Publication number Publication date
JP2014107685A (ja) 2014-06-09
US20140147036A1 (en) 2014-05-29
CN103841295A (zh) 2014-06-04
US9064175B2 (en) 2015-06-23
EP2735998B1 (en) 2016-06-29
EP2735998A1 (en) 2014-05-28
CN103841295B (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
JP5847062B2 (ja) 画像処理装置
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
US10699110B2 (en) Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
JP5697649B2 (ja) 画像処理装置
JP5730274B2 (ja) 画像処理装置
US8300927B2 (en) Mouth removal method for red-eye detection and correction
US9437007B2 (en) Image processing device
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
US9858512B2 (en) Image processing apparatus with an improved detection of ruled lines
US8903170B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP6573124B2 (ja) 画像処理装置
CN107680046A (zh) 影像矫正方法、装置、存储介质和计算机设备
US10375261B2 (en) Image scanning apparatus
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JP2002262074A (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
US9704219B2 (en) Image processing apparatus with improved image reduction processing
JP2018116644A (ja) 画像処理装置
JP6194677B2 (ja) 画像処理装置およびプログラム
KR101601755B1 (ko) 영상 특징 추출 방법 및 장치 및 이를 구현한 프로그램을 기록한 기록 매체
JP2012244261A (ja) 画像処理装置
JP2002279419A (ja) 図形認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151124

R150 Certificate of patent or registration of utility model

Ref document number: 5847062

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150