JP2014164485A - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2014164485A
JP2014164485A JP2013034594A JP2013034594A JP2014164485A JP 2014164485 A JP2014164485 A JP 2014164485A JP 2013034594 A JP2013034594 A JP 2013034594A JP 2013034594 A JP2013034594 A JP 2013034594A JP 2014164485 A JP2014164485 A JP 2014164485A
Authority
JP
Japan
Prior art keywords
pixel
image data
parameter
image processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013034594A
Other languages
English (en)
Other versions
JP6076773B2 (ja
Inventor
Akio Furuhata
彰夫 古畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2013034594A priority Critical patent/JP6076773B2/ja
Publication of JP2014164485A publication Critical patent/JP2014164485A/ja
Application granted granted Critical
Publication of JP6076773B2 publication Critical patent/JP6076773B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

【課題】実際の入力パターンの傾向に近い画像データのパターンを容易に生成する画像処理装置、画像処理方法及びプログラムを提供する。
【解決手段】実施形態の画像処理装置は、画像データ毎に、当該画像データの画素値の変更方法を表す第1パラメータを決定する第1決定部と、当該画像データの画素毎に、当該画素の1以上の周辺画素に応じて、当該画像データの画素値の変更方法を表す第2パラメータを決定する第2決定部と、当該第1パラメータが表す変更方法及び当該第2パラメータが表す変更方法によって、当該画像データの当該画素毎に当該画素値を変更する変更部とを備える。
【選択図】図1

Description

本発明の実施形態は、画像処理装置、画像処理方法及びプログラムに関する。
光学式文字読取装置などの装置で、文字の認識率を向上させるための技術が利用されている。例えば、当該装置では、想定される入力パターンを収集し、これらを認識することのできる認識辞書を装置内に構築することで、文字の認識率を向上させている。高精度な文字認識を行うためには、これらの収集された文字パターンが文字認識システムへの入力として想定されるパターンのどの程度の範囲を網羅しているかが重要である。一般には、網羅度が低いほど文字認識の精度は低下するが、その一方で全パターンを網羅して収集することは極めてコストが高く、現実的ではない。
本発明に関連する文献公知発明としては、特許文献1がある。特許文献1には、乱数的に文字の変形を行う方法が記載されている。特許文献1には、ランダムに選ばれた着目画素に対し、その周辺8画素に着目画素と異なる画素値を持つ画素が事前に定める個数以上存在すれば画素値を反転するという方法が開示されている。
特開2002−298084号公報
これを解決する方法としては、例えば、インターネットなどからデータを収集し、半教師学習などの技術を用いて学習を行うなどの手法がある。しかしながら、そのようにして得られたデータが、必ずしも想定される入力パターンとして使用できるとは限らない。特に、漢字文化圏においては極めて類似した文字が多く、このような手法では、想定される入力パターンをうまく扱えない場合があった。
また、別の方法として、既に得られている画像に、ランダムノイズを付加する方法がある。例えば、スキャナなどによるスキャンによって引き起こされる劣化の過程をシミュレートする処理を加え、類似した文字パターンを生成する方法がある。しかしながら、ランダムノイズを加える処理は、必ずしも実際の環境で起こる画像の劣化に合致せず、適切な入力パターンを生成できるとは限らない。また、劣化過程をシミュレートする方法では、スキャン方法が固定されている場合など、発生する劣化が限定できる場合には有効であるが、そうでない場合には対応しきれない。また、劣化過程を定義することが必ずしも簡単ではなかった。
従来の技術では、実際の入力パターンの傾向に近い画像データのパターンを容易に生成することができなかった。
実施形態の画像処理装置は、画像データ毎に、前記画像データの画素値の変更方法を表す第1パラメータを決定する第1決定部と、前記画像データの画素毎に、前記画素の1以上の周辺画素に応じて、前記画像データの画素値の変更方法を表す第2パラメータを決定する第2決定部と、前記第1パラメータが表す変更方法及び前記第2パラメータが表す変更方法によって、前記画像データの前記画素毎に前記画素値を変更する変更部とを備える。
また、実施形態の画像処理方法は、第1決定部が、画像データ毎に、前記画像データの画素値の変更方法を表す第1パラメータを決定するステップと、第2決定部が、前記画像データの画素毎に、前記画素の1以上の周辺画素に応じて、前記画像データの画素値の変更方法を表す第2パラメータを決定するステップと、変更部が、前記第1パラメータが表す変更方法及び前記第2パラメータが表す変更方法によって、前記画像データの前記画素毎に前記画素値を変更するステップとを含む。
また、実施形態のプログラムは、コンピュータを、画像データ毎に、前記画像データの画素値の変更方法を表す第1パラメータを決定する第1決定部と、前記画像データの画素毎に、前記画素の1以上の周辺画素に応じて、前記画像データの画素値の変更方法を表す第2パラメータを決定する第2決定部と、前記第1パラメータが表す変更方法及び前記第2パラメータが表す変更方法によって、前記画像データの前記画素毎に前記画素値を変更する変更部として機能させる。
図1は、第1実施形態の画像処理装置のブロック図の一例を示す図である。 図2は、画像データの一例を示す図である。 図3は、第1実施形態の画像処理装置の第2決定部が抽出する周辺画素(4画素の場合)の一例である。 図4は、第1実施形態の画像処理装置の第2決定部が抽出する周辺画素(8画素の場合)の一例である。 図5は、第1実施形態の画像処理装置の第2決定部が抽出する周辺画素(15画素の場合)の一例である。 図6は、第1実施形態の画像処理装置の第2決定部が決定する第2パラメータの一例である。 図7は、第1実施形態の画像処理方法の一例を説明するためのフローチャートである。 図8は、第1実施形態の画像処理装置が画像データの画素値を変更した場合の一例である。 図9は、第1実施形態の画像処理装置により画像処理された画像データの一例である。 図10は、第2実施形態の画像処理装置の変更部のブロック図の一例である。 図11は、第2実施形態の画像処理装置の第2決定部が決定する第2パラメータの一例である。 図12は、第2実施形態の画像処理装置の第2決定部が抽出する周辺画素のパターン(回転は省略する場合)の一例である。 図13は、第2実施形態の画像処理装置の第2決定部が抽出する周辺画素のパターン(縦方向と横方向を区別する場合)の一例である。 図14は、第2実施形態の画像処理方法の一例を説明するためのフローチャートである。 図15は、第2実施形態の画像処理装置が画像データの画素値を変更した場合の一例である。 図16は、第3実施形態の画像処理装置のブロック図の一例を示す図である。 図17は、第3実施形態の画像処理方法の一例を説明するためのフローチャートである。 図18は、第3実施形態の画像処理装置が処理する画像データの画素値の一例である。 図19は、第3実施形態の画像処理装置のノイズパターンの例を示す図である。 図20は、第3実施形態の画像処理装置のノイズマスクの一例を示す図である。 図21は、第1〜3実施形態の画像処理装置のハードウェア構成の一例を示す図である。
スキャンなどの画像入力処理により認識される文字の理想状態からの劣化は、画像データの全体的な劣化及び局所的な劣化の2種類がある。全体的な劣化は、例えば、ぼけやレンズの感度などによるものである。局所的な劣化は、例えば、レンズの傷や汚れや、撮影対象上における周辺の状態によるものである。
例えば、レンズの感度を上げれば文字は全体的に濃くなってくる。しかしながら、このような場合であっても、文字の輪郭部分においてドット欠けが起こるなど、局所的には薄くなることもある。入力パターンの生成においては、このような状況に応じた処理を行う必要がある。以下、各実施形態について説明する。
(第1の実施形態)
図1は、第1実施形態の画像処理装置10のブロック図の一例を示す図である。本実施形態の画像処理装置10は、入力部11、第1決定部12、第2決定部13及び変更部14を備える。
入力部11は、画像処理装置10に画像データを入力する。入力部11は、例えば、スキャナやカメラなどである。画像処理装置10は、入力部11によって紙面上に印刷された文字をスキャンしたり、画面上に表示されている文字を撮影したりすることにより画像データを取得する。図2は、画像データの一例を示す図である。図2の例では、画像データが文字「亜」である場合の例である。
第1決定部12は、画像データ毎に、画像データの画素値の変更方法を表す第1パラメータを決定する。第1パラメータは、画像データの大域的な情報に応じて決まるパラメータである。例えば、第1パラメータは、画像データの画素の画素値を上げる(下げる)などを表し、画像全体の傾向に作用するパラメータである。第1パラメータは、オペレータが定義するなどして事前に定めてもよいし、画像処理の実行ごとにランダムに決定してもよい。また、第1決定部12は、画像データ全体に対してではなく、画像データの領域を複数に分割した分割領域毎に、第1パラメータを決定してもよい。
第2決定部13は、画像データの画素毎に、当該画素の1以上の周辺画素に応じて、画像データの画素値の変更方法を表す第2パラメータを決定する。第2パラメータは、画像データの局所的な情報に応じて決まるパラメータである。第2決定部13は、第1パラメータに応じて第2パラメータの決定の仕方(処理後の画像データを全体的に濃くする又は薄くするなどの傾向)を変える。
図3は、第1実施形態の画像処理装置10の第2決定部13が抽出する周辺画素(4画素の場合)の一例である。図3の例は、着目画素の上下左右4画素を周辺画素と定義した場合の例である。
図4は、第1実施形態の画像処理装置10の第2決定部13が抽出する周辺画素(8画素の場合)の一例である。図4の例は、着目画素の周囲8画素を周辺画素と定義した場合の例である。
図5は、第1実施形態の画像処理装置10の第2決定部13が抽出する周辺画素(15画素の場合)の一例である。図5の例は、着目画素の周囲15画素を周辺画素と定義した場合の例である。
なお、第2決定部13は、着目画素に作用させる第2パラメータを決定する際には、周辺画素の位置に応じて、個々の周辺画素毎に影響を与える度合いを変えるための重みを付けてもよい。例えば、第2決定部13は、着目画素と周辺画素との距離に応じて重みを付けてもよい。また、第2決定部13は、着目画素に作用させる第2パラメータを決定する際には、画像処理装置10のユーザの操作などに応じて、周辺画素の形状を図3〜図5のように、様々な形状に変更できるようにしてもよい。なお、周辺画素の形状は、図3〜図5の形状に限られず、任意の形状でよい。例えば、周辺画素の形状を、縦方向の画素を考慮せずに、着目画素から横方向だけ2画素ずつ(右に2画素、左に2画素)とすると、横方向のぼけやかすれなどをシミュレートすることができる。
図1に戻り、変更部14は、第1パラメータが表す変更方法及び第2パラメータが表す変更方法によって、画像データの画素毎に画素値を変更する。
図6は、第1実施形態の画像処理装置10の第2決定部13が決定する第2パラメータの一例である。図6は、画像データが2値画像である場合の例である。例えば、着目画素が黒画素である場合は、周辺画素に含まれる黒画素の数に応じて、着目画素を反転させる度合い(以下、「反転確率」という。)を変えている。図6の例は、例えば、着目画素が黒画素であり、周辺画素に黒画素が3つある場合は、着目画素を5%の反転確率で反転させることを示す。ここで、画素の反転は、着目画素が黒画素であれば白画素にし、着目画素が白画素であれば黒画素にすることを表す。画素の反転処理は、(反転後の画素値)=1−(反転前の画素値)により実現することができる。図6の例では、着目画素が白画素である場合には、周辺画素の状況が同じ場合であっても、着目画素が黒画素である場合とは異なる反転確率が定義されている。また、図6の例では、周辺画素の画素値に応じて、5段階に反転確率を変更している。
図6の第2パラメータの例を数式により表すと以下のようになる。
Figure 2014164485
Figure 2014164485
式(1)は、着目画素が黒画素である場合の数式である。また、式(2)は、着目画素が白画素である場合の数式である。また、nは、周辺画素に含まれる白画素の数を表す。なお、第2パラメータ(本実施形態では反転確率)を決定する数式は、式(1)及び(2)に限られず、適宜定めてよい。
なお、本実施形態の画像処理装置10では、第1パラメータに応じて第2パラメータの決定の仕方が変わる。例えば、図6のように第2パラメータが決定される場合は、第1パラメータが、画像データを全体的に濃くする傾向に画像処理を行うことを示している。この傾向は、図6の例では、周辺画素の黒画素の数と白画素の数が同じ場合(黒画素の数が2つの場合)に顕著に現れている。すなわち、着目画素が黒画素である場合の反転確率が15%であるのに対して、着目画素が白画素である場合の反転確率が85%であることから明らかである。第2決定部13は、着目画素及び周辺画素に応じて反転確率を決定する図6のような反転確率のテーブルを、第1パラメータによって切り換えてもよい。
図7は、第1実施形態の画像処理方法の一例を説明するためのフローチャートである。まず、画像処理の対象となる画像データについて説明する。ここでは、画像データを、2値画像で表される文字である場合を例にして説明する。また、本実施形態の画像処理装置10は、画面上に表示されている文字を、1画素1ビットの2値画像として扱うものであるとする。この際、文字である画素(画像データ上で黒である画素)が1であり、文字ではない画素(画像データ上で白である画素)が0であるとする。また、本実施形態の画像処理装置10は、図3の例の周辺画素の定義(着目画素の周囲4画素が周辺画素)を使用するものとする。また、第2決定部13は、図6の第2パラメータを使用するものとする。
入力部11は、画像処理装置10に画像データを入力する(ステップS1)。変更部14は、画像データの全画素を処理したか否かを判定する(ステップS2)。全画素を処理した場合(ステップS2、Yes)は、処理を終了する。全画素を処理していない場合(ステップS2、No)は、ステップS3に進む。
第2決定部13は、着目画素の周囲4画素の画素値の和を算出する(ステップS3)。画像データが2値画像であることから、ステップS3により、着目画素の周辺画素に含まれる黒画素の数を算出できる。第2決定部13は、ステップS3の処理結果に応じて、当該画素の反転確率を決定する(ステップS4)。変更部14は、乱数を取得する(ステップS5)。なお、本実施形態の画像処理装置10では、乱数の値の範囲を0−100とする。画像処理装置10は、例えば、画像処理装置10の現在時刻のms部分から、この乱数を取得してもよい。また、画像処理装置10は、事前に乱数テーブルを用意することにより、この乱数を取得してもよい。なお、本実施例の場合、例えば5の倍数回目の場合のみ0、ほかの場合には100を与えるような乱数を定義すれば、事前に定めた間隔、この場合であれば5画素おきに反転処理を行うようにすることもできる。
変更部14は、ステップS4で決定した反転確率を%で表した場合の値と、ステップS5で取得した乱数を比較する(ステップS6)。乱数の方が大きい、又は乱数と反転確率が同じ場合(ステップS6、No)は、画素値を反転せずにステップS2に戻る。乱数の方が小さい場合(ステップS6、Yes)は、変更部14が、画素値を反転する(ステップS7)。変更部14が、ステップS7で乱数との比較を行うことで、画素値を反転する処理に、ランダムな要素を加えることができる。
以上のようにして、本実施形態の画像処理装置10は、画像データを処理する。なお、本実施形態の画像処理装置10が、画像データから処理対象となる着目画素を選択するときは、画像データの左上から右下方向に順番に選択していくものとするが、順番はこれに限らない。また、全画素を処理する必要もなく、例えば、ランダムサンプリングを行って決定してもよい。なお、ランダムサンプリングを行う場合には、着目画素の選択数が予め定める既定の数に達した時点で終了する。また、反転処理の実行数が既定の数に達したら処理を打ち切るなどしてもよい。既定の数は、予め定義してもよいし、ランダムに決定してもよい。
図8は、第1実施形態の画像処理装置10が画像データの画素値を変更した場合の一例である。図8の例では、着目画素が白画素であり、当該着目画素の周辺画素に含まれる黒画素の数が2つである。これにより、第2決定部13は、反転確率を85%と決定する。図8の例では、変更部14が、乱数73を取得している。73<85であるため、変更部14は、着目画素を反転する。
図9は、第1実施形態の画像処理装置10により画像処理された画像データの一例である。図9より明らかであるように、処理された画像データは、全体的には濃くなっている(黒画素が増えている)。しかし、主に周辺画素に白画素の多い文字の角などには欠けが発生している部分(白画素に反転されている部分)もある。また、例えば、図9中、丸で囲んだ中央の縦線2本が横線と交差する部分、すなわち、着目画素と周辺画素の画素値の関係が類似した部分においても、箇所によって異なる画像の劣化が発生している。
なお、本実施形態の画像処理装置10の説明では、画像データが2値画像である場合について説明したが、画素値が2値ではない画像データの場合は、画素値が所定の値以上である画素(以下「第1画素」という)を抽出し、第1画素の位置や数に応じて異なる第2パラメータを決定するようにしてもよい。
(第2実施形態)
次に、第2実施形態の画像処理装置10について説明する。本実施形態の画像処理装置10の機能ブロックの全体の構成は、第1実施形態の画像処理装置10(図1参照)と同じであるため説明を省略する。第2実施形態の画像処理装置10は、変更部14と第2決定部13により参照される反転確率のテーブルが、第1実施形態の画像処理装置10と異なる。
図10は、第2実施形態の画像処理装置10の変更部14のブロック図の一例である。変更部14は、比較部21、変更バッファ22及び実行部23を備える。比較部21は、乱数と反転確率の値を比較する。変更バッファ22は、画像データの各画素の位置毎に、反転を行うか否かを一時的に記憶する。実行部23は、画像データの全画素について変更バッファ22に反転を行うか否かを記録が終わった後に、変更バッファ22を参照して反転処理を実行する。
図11は、第2実施形態の画像処理装置10の第2決定部13が決定する第2パラメータの一例である。本実施形態の第2決定部13は、第1実施形態の画像処理装置10とは異なり、周辺画素のうち黒画素が2つである場合に、黒画素の位置によって反転確率を変更している。
なお、周辺画素のパターンの区別の仕方は、適宜どのように考えてもよい。ここで、2つの例を挙げる。図12は、第2実施形態の画像処理装置10の第2決定部13が抽出する周辺画素のパターン(回転は省略する場合)の一例である。なお、図12では、周辺画素に黒画素が1つもない場合を紙面の都合上、図示していない(省略している)。図11の反転確率の定義は、図12の周辺画素のパターンの区別の仕方を利用している。図13は、第2実施形態の画像処理装置10の第2決定部13が抽出する周辺画素のパターン(縦方向と横方向を区別する場合)の一例である。なお、図13では、周辺画素に黒画素が1つもない場合を紙面の都合上、図示していない(省略している)。
図14は、第2実施形態の画像処理方法の一例を説明するためのフローチャートである。まず、画像処理の対象となる画像データについて説明する。ここでは、画像データを、2値画像で表される文字である場合を例にして説明する。また、本実施形態の画像処理装置10は、画面上に表示されている文字を、1画素1ビットの2値画像として扱うものであるとする。この際、文字である画素(画像データ上で黒である画素)が1であり、文字ではない画素(画像データ上で白である画素)が0であるとする。また、本実施形態の画像処理装置10は、図3の例の周辺画素の定義(着目画素の周囲4画素が周辺画素)を使用するものとする。また、第2決定部13は、図11の第2パラメータを使用するものとする。
変更部14は、変更バッファ22を初期化する(ステップS11)。ここでは、変更部14は、画像データの全ての画素について、当該画素を反転しないことを示す情報を変更バッファ22の初期値として設定するものとする。入力部11は、画像処理装置10に画像データを入力する(ステップS12)。変更部14は、画像データの全画素を処理したか否かを判定する(ステップS13)。全画素を処理した場合(ステップS13、Yes)は、ステップS19に進む。全画素を処理していない場合(ステップS13、No)は、ステップS14に進む。
第2決定部13は、着目画素の周囲4画素の状態(黒画素の位置及び数)を算出する(ステップS14)。第2決定部13は、ステップS14の処理結果に応じて、当該画素の反転確率を決定する(ステップS15)。変更部14は、乱数を取得する(ステップS16)。なお、本実施形態の画像処理装置10では、乱数の値の範囲を0−100とする。画像処理装置10は、例えば、画像処理装置10の現在時刻のms部分から、この乱数を取得してもよい。また、画像処理装置10は、事前に乱数テーブルを用意することにより、この乱数を取得してもよい。なお、本実施例の場合、例えば5の倍数回目の場合のみ0、ほかの場合には100を与えるような乱数を定義すれば、事前に定めた間隔、この場合であれば5画素おきに反転処理を行うようにすることもできる。
変更部14(比較部21)は、ステップS15で決定した反転確率を%で表した場合の値と、ステップS16で取得した乱数を比較する(ステップS17)。乱数の方が大きい、又は乱数と反転確率が同じ場合(ステップS17、No)は、ステップS13に戻る。乱数の方が小さい場合(ステップS17、Yes)は、変更部14が、当該画素を反転することを示す情報を変更バッファ22に記録する(ステップS18)。変更部14(比較部21)が、ステップS17で乱数との比較を行うことで、画素値を反転する処理に、ランダムな要素を加えることができる。変更部14(実行部23)は、変更バッファ22を参照し、画像データの画素値の反転処理を実行する(ステップS19)。
図15は、第2実施形態の画像処理装置10が画像データの画素値を変更した場合の一例である。図15の例では、着目画素が白画素であり、当該着目画素の周辺画素に含まれる黒画素の数が2つである。また、当該黒画素は、直線状に並んでいない。これにより、第2決定部13は、反転確率を80%と決定する。図15の例では、変更部14が、乱数73を取得している。73<80であるため、変更部14は、当該着目画素を反転することを示す情報を変更バッファ22に記録する。変更部14(実行部23)は、画像データの全ての画素について、変更バッファ22に反転処理を行うか否かを示す情報が記録された後に、画像データの画素値の反転処理を実行する。
(第3実施形態)
次に、第3実施形態の画像処理装置10について説明する。図16は、第3実施形態の画像処理装置10のブロック図の一例を示す図である。本実施形態の画像処理装置10は、入力部11、第1決定部12、第2決定部13、変更部14、第3決定部15及びノイズパターンDB16を備える。本実施形態の画像処理装置10は、第1実施形態の画像処理装置10の構成に第3決定部15及びノイズパターンDB16が追加されている。
入力部11は、第1実施形態の画像処理装置10と同じであるため説明を省略する。
第1決定部12は、画像データ毎に第1パラメータを決定する。本実施形態の画像処理装置10では、第1パラメータをAとし、Aを−25〜25の範囲の乱数とする。または、第1パラメータAを画像データの色彩(濃淡)に応じて決定してもよい。例えば、第1パラメータAを(所定の値以上の画素値を有する画素の数)/(画像データに含まれる画素の数)に応じて決定してもよい。
第2決定部13は、画像データの画素毎に、当該画素の1以上の周辺画素に応じて第2パラメータを決定する。本実施形態の画像処理装置10は、第2パラメータをγとし、γ=(着目画素の画素値)−(周辺画素の画素値の平均値)とする。
変更部14は、第1パラメータA及び第2パラメータγに応じて、画像データの画素毎に、画素値の補正値Xを求める計算式を決定する。変更部14は、画像データの画素毎に当該画素の画素値に補正値Xを加算して、画像データの画素値を変更する。当該計算式は、例えば、次式(3)である。
Figure 2014164485
なお、abs()は、絶対値をとる関数である。また、f(γ)は、次式(4)により定義する。
Figure 2014164485
α及びβについて説明する。まず、αについて説明する。変更部14は、0〜1の範囲の実数をとる乱数rと、次式(5)により定義される数pを比較する。そして、変更部14は、r>pであれば、α=1とし、r≦pであれば、α=−1とする。
Figure 2014164485
次に、βについて説明する。変更部14は、画像データ毎に、βを0〜2の範囲の値をとる乱数により決定する。なお、変更部14は、画像データ毎ではなく、画像データの領域を複数に分割した分割領域毎、又は着目画素毎にβを決定してもよい。
以上により、変更部14は、補正値Xを、f(γ)の絶対値の0〜2倍の正又は負の値として算出する。
変更部14は、r>pであれば、着目画素の画素値に正の値を加える。すなわち、着目画素を白の側に寄せる(薄くする)。r≦pであれば、着目画素の画素値に負の値を加える。すなわち、着目画素を黒の側に寄せる(濃くする)。つまり、f(γ)=0の場合にp=0.5となり、濃くする処理と薄くする処理が等確率で起こることとなる。γは着目画素の画素値から周辺画素の画素値の平均値を引いた値であるので、Aが正であればf(γ)の値は負の値をとりやすくなる。すなわち、p<0.5となりやすくなるため、濃くする処理のほうが起こりやすくなる。
第3決定部15は、画像データの画素毎のノイズを表す第3パラメータを決定する。ノイズパターンDB16は、画像データの画素毎のノイズの決定方法を表すノイズのパターンである。第3パラメータ及びノイズパターンの詳細については後述する。
図17は、第3実施形態の画像処理方法の一例を説明するためのフローチャートである。まず、画像処理の対象となる画像データについて説明する。ここでは、画像データを、1画素8ビットのグレースケール画像で表される文字である場合を例にして説明する。すなわち、画素値は0〜255の値を取る。なお、画像データは、文字が黒く背景が白いものであるとする。すなわち、文字である画素が、文字ではない画素に比べて画素値が小さいとする。また、本実施形態の画像処理装置10は、図3の例の周辺画素の定義(着目画素の周囲4画素が周辺画素)を使用するものとする。また、第1パラメータAを0とし、βを0.1とする。
変更部14は、変更バッファ22を0(変更しないことを示す値)で初期化する(ステップS21)。入力部11は、画像処理装置10に画像データを入力する(ステップS22)。変更部14は、画像データの全画素を処理したか否かを判定する(ステップS23)。全画素を処理した場合(ステップS23、Yes)は、ステップS29に進む。全画素を処理していない場合(ステップS23、No)は、ステップS24に進む。
第2決定部13は、着目画素の周囲4画素の画素値の平均値を算出する(ステップS24)。第2決定部13は、ステップS24の処理結果に応じて、式(3)に基づいて補正値Xを決定する(ステップS25)。ここで、ステップS25について具体例に基づいて説明する。
図18は、第3実施形態の画像処理装置10が処理する画像データの画素値の一例である。まず、変更部14は、次式(6)によりf(γ)を求める。
Figure 2014164485
次に、式(6)により求めた値に応じて決定される数pと、乱数r(ここでは、乱数rとして0.25が得られたものとする)を比較する(次式(7))。
Figure 2014164485
変更部14は、r≦pであるためα=−1とする。β=0.1及びf(γ)=127.5より、変更部14は、補正値Xを次式(8)により算出する。
Figure 2014164485
図17に戻り、第3決定部15は、画像データの画素毎のノイズを表す第3パラメータを決定するため、ノイズパターンDB16からノイズパターンを選択する(ステップS26)。図19は、第3実施形態の画像処理装置10のノイズパターンの例を示す図である。ノイズパターンには、補正値Xを作用させる度合いを変更するためのノイズとして画素の位置毎に倍率(第3パラメータ)が定義されている。なお、本実施形態の第3決定部15は、事前に定めたパターンからノイズパターンを1つ選択しているが、ノイズパターンに含まれる各値を乱数により0又は1にするなどランダムに生成したりしてもよい。また、第3決定部15は、複数のノイズパターンを選択して、値を加算(減算)することにより新しいノイズパターンを生成して使用してもよい。
変更部14は、ステップS25で算出した補正値X及びステップS26で選択したノイズパターンにより、ノイズマスクを生成する(ステップS27)。図20は、第3実施形態の画像処理装置10のノイズマスクの一例を示す図である。変更部14は、補正値X=−12.75に、各画素の位置に対応するノイズパターンの値を乗算することによりノイズマスクを得る。なお、図20のノイズマスクの例は、3×3の9画素となっているが、ノイズマスクの形状は、任意の形状でよい。また、変更部14は、周辺画素の形状に応じて、ノイズマスクの形状を決定してもよい。変更部14は、変更バッファ22に当該ノイズマスクの値を加算する(ステップS28)。ステップS23に戻り、変更部14は、全画素を処理した場合(ステップS23、Yes)に、変更バッファ22に記録された値を、画像データの画素値に加算(減算)する(ステップS29)。
なお、本実施形態の画像処置装置10は、変更バッファ22に補正値Xを必ず加算する。しかしながら、第1又は2実施形態の画像処置装置10で求めた反転確率に従って変更バッファ22に補正値Xを加算するなどして、一部の着目画素のみに補正値Xが加算されるようにしてもよい。その場合、画像データを2値化すれば、第1又は第2実施形態の画像処理装置10と同様の方法で反転確率を算出できる。
図21は、第1〜3実施形態の画像処理装置10のハードウェア構成の一例を示す図である。本実施の形態の画像処理装置10は、制御装置21、主記憶装置22、補助記憶装置23、表示装置24、入力装置25及び通信装置26を備える。制御装置21、主記憶装置22、補助記憶装置23、表示装置24、入力装置25及び通信装置26は、バス27を介して互いに接続されている。
制御装置21は、補助記憶装置23から主記憶装置22に読み出されたプログラムを実行する。主記憶装置22は、ROM(Read Only Memory)やRAM(Random Access Memory)等のメモリである。補助記憶装置23は、例えば、ハードディスクやメモリカード等である。表示装置24は、画像処理装置10の状態等を表示する画面である。表示装置24は、例えば、液晶ディスプレイ等である。入力装置25は、画像処理装置10を操作するためのインタフェースである。入力装置25は、例えば、キーボードやマウス等である。通信装置26は、ネットワークに接続するためのインタフェースである。
本実施形態の画像処理装置10で実行されるプログラムを、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、メモリカード、CD−R及びDVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録し、コンピュータ・プログラム・プロダクトとして提供してもよい。また、本実施形態の画像処理装置10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供してもよい。また、本実施形態の画像処理装置10で実行されるプログラムをダウンロードさせずに、インターネット等のネットワーク経由で提供、又は配布してもよい。また、本実施形態の画像処理装置10のプログラムを、ROM等に予め組み込んで提供してもよい。
本実施形態の画像処理装置10で実行されるプログラムは、上述した画像処理装置10の各機能ブロックのうち、プログラムとしても実現可能な機能ブロックを含むモジュール構成となっている。当該モジュールは、実際のハードウェアとしては、制御装置21が上記記憶媒体からプログラムを読み出して実行することにより、上記各モジュールが主記憶装置22上にロードされる。すなわち、上記各モジュールは、主記憶装置22上に生成される。なお、画像処理装置10の各機能ブロックの一部、又は全部を、プログラムにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
以上のように、第1〜3実施形態の画像処理装置10は、画像データ毎に画像データの画素の画素値の変更の仕方を表す第1パラメータを決定する第1決定部12と、画素毎に、画素の1以上の周辺画素に応じて、画像データの画素の画素値の変更の仕方を表す第2パラメータを決定する第2決定部13を備える。
第1〜3実施形態の画像処理装置10は、画像データに劣化を加えた当該画像データのパターンを生成する場合において、全体的な傾向及び局所的な画素の状況を考慮する。すなわち、濃くする薄くするなどに応じた第1パラメータと、着目画素及びその周辺画素の状況に応じた第2パラメータとの2つの観点から着目画素の画素値の変更処理を決定する。第1〜3実施形態の画像処理装置10は、当該変更処理に従って画像データに劣化を加えることで、より実際に入力されるものに近い画像データのパターンを生成することができる。なお、第1〜3実施形態の画像処理装置10に入力される画像データの形式は、2値画像や1画素8ビットのグレースケールの画像に限られず、どのようなものであってもよい。例えば、2値画像の場合の反転処理等は、画素値の最大値との差分をとるなどの処理に適宜変更してよい。
第1〜3実施形態の画像処理装置10によれば、限られた画像データから、実際に入力され得る様々な劣化が加えられた文字パターンを容易に得ることができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10 画像処理装置
11 入力部
12 第1決定部
13 第2決定部
14 変更部
15 第3決定部
16 ノイズパターンDB
21 比較部
22 変更バッファ
23 実行部

Claims (13)

  1. 画像データ毎に、前記画像データの画素値の変更方法を表す第1パラメータを決定する第1決定部と、
    前記画像データの画素毎に、前記画素の1以上の周辺画素に応じて、前記画像データの画素値の変更方法を表す第2パラメータを決定する第2決定部と、
    前記第1パラメータが表す変更方法及び前記第2パラメータが表す変更方法によって、前記画像データの前記画素毎に前記画素値を変更する変更部と
    を備える画像処理装置。
  2. 前記第2決定部は、
    前記画像データの画素毎に、前記画素の1以上の周辺画素の画素値に応じて、n段階(nは2以上の整数)の値をとり得る第2パラメータを決定する
    請求項1に記載の画像処理装置。
  3. 前記第2決定部は、
    前記第2パラメータを決定する際に、前記周辺画素の形状を変更することができる
    請求項1又は2に記載の画像処理装置。
  4. 前記画像データの画素毎のノイズを表す第3パラメータを決定する第3決定部を更に備え、
    前記変更部は、更に前記第3パラメータに応じて、前記画像データの前記画素毎に前記画素値を変更する
    請求項1乃至3のいずれか1項に記載の画像処理装置。
  5. 前記第3決定部は、
    前記第3パラメータを、複数の画素に適用するマスクパターンに応じて決定し、前記マスクパターンは、前記周辺画素の形状に応じて変更することができる
    請求項4に記載の画像処理装置。
  6. 前記第1決定部は、
    前記画像データの領域を複数に分割した分割領域毎に、前記第1パラメータを決定する
    請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 前記第2決定部は、
    前記周辺画素のうち、画素値が所定の値以上である画素を表す第1画素を抽出し、前記第1画素の位置に応じて異なる第2パラメータを決定する
    請求項1乃至6のいずれか1項に記載の画像処理装置。
  8. 前記第2決定部は、
    前記周辺画素のうち、画素値が所定の値以上である画素を表す第1画素を抽出し、前記第1画素の数に応じて異なる第2パラメータを決定する
    請求項1乃至7のいずれか1項に記載の画像処理装置。
  9. 前記第2決定部は、
    前記画像データの画素毎に、前記画素の画素値と、前記周辺画素の画素値の平均値との差に応じて異なる第2パラメータを決定する
    請求項1乃至6のいずれか1項に記載の画像処理装置。
  10. 前記画像データは、2値画像であり、
    前記第2パラメータは、前記画像データの画素の1以上の前記周辺画素に応じて決定される前記画像データの画素値を反転する確率である
    請求項1乃至8のいずれか1項に記載の画像処理装置。
  11. 前記変更部は、
    前記第2パラメータと乱数とを比較することにより、前記画素毎の画素値を変更するか否かを判定する
    請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 第1決定部が、画像データ毎に、前記画像データの画素値の変更方法を表す第1パラメータを決定するステップと、
    第2決定部が、前記画像データの画素毎に、前記画素の1以上の周辺画素に応じて、前記画像データの画素値の変更方法を表す第2パラメータを決定するステップと、
    変更部が、前記第1パラメータが表す変更方法及び前記第2パラメータが表す変更方法によって、前記画像データの前記画素毎に前記画素値を変更するステップと
    を含む画像処理方法。
  13. コンピュータを、
    画像データ毎に、前記画像データの画素値の変更方法を表す第1パラメータを決定する第1決定部と、
    前記画像データの画素毎に、前記画素の1以上の周辺画素に応じて、前記画像データの画素値の変更方法を表す第2パラメータを決定する第2決定部と、
    前記第1パラメータが表す変更方法及び前記第2パラメータが表す変更方法によって、前記画像データの前記画素毎に前記画素値を変更する変更部
    として機能させるためのプログラム。
JP2013034594A 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム Active JP6076773B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013034594A JP6076773B2 (ja) 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013034594A JP6076773B2 (ja) 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014164485A true JP2014164485A (ja) 2014-09-08
JP6076773B2 JP6076773B2 (ja) 2017-02-08

Family

ID=51615041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013034594A Active JP6076773B2 (ja) 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6076773B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0554195A (ja) * 1991-08-29 1993-03-05 Matsushita Electric Ind Co Ltd 文字認識装置
JPH09102050A (ja) * 1995-10-04 1997-04-15 Ricoh Co Ltd 画像形成装置
JP2002298084A (ja) * 2001-03-30 2002-10-11 Ricoh Co Ltd 文字変形方法、文字変形装置、プログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0554195A (ja) * 1991-08-29 1993-03-05 Matsushita Electric Ind Co Ltd 文字認識装置
JPH09102050A (ja) * 1995-10-04 1997-04-15 Ricoh Co Ltd 画像形成装置
JP2002298084A (ja) * 2001-03-30 2002-10-11 Ricoh Co Ltd 文字変形方法、文字変形装置、プログラム及び記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
新垣 晃一 外3名: "遺伝的アルゴリズムによる blind deconvolution", 電子情報通信学会技術研究報告 画像工学 IE96−14〜34, vol. 第96巻 第116号, JPN6016036991, June 1996 (1996-06-01), JP, pages 51 - 56, ISSN: 0003457493 *

Also Published As

Publication number Publication date
JP6076773B2 (ja) 2017-02-08

Similar Documents

Publication Publication Date Title
JP6581068B2 (ja) 画像処理装置、画像処理方法、プログラム、運転制御システム、および、車両
WO2017076040A1 (zh) 应用于连拍过程中的图像处理方法和装置
CN109005368B (zh) 一种高动态范围图像的生成方法、移动终端及存储介质
US20210319537A1 (en) Image processing method, image processing apparatus, image processing system, and memory medium
KR20110065997A (ko) 영상처리장치 및 영상처리방법
CN112785507A (zh) 图像处理方法及装置、存储介质、终端
CN109035147B (zh) 图像处理方法及装置、电子装置、存储介质和计算机设备
US9613405B2 (en) Scalable massive parallelization of overlapping patch aggregation
JP2013175003A (ja) Psf推定方法とそれを用いた劣化画像の復元方法およびこれらを記録したプログラムとそれを実行するコンピュータ装置
CN111553290A (zh) 文本识别方法、装置、设备及存储介质
JP5617841B2 (ja) 画像処理装置、画像処理方法および画像処理用プログラム
JP6076773B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4868139B2 (ja) 画像処理装置及び画像処理プログラム
JPWO2014002811A1 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN113628192B (zh) 图像模糊检测方法、装置、设备、存储介质及程序产品
JP5737387B2 (ja) 画像処理装置
CN115496673A (zh) 图像处理方法、图像处理装置、图像处理系统、以及存储介质
CN107103321B (zh) 道路二值化图像的生成方法及生成系统
CN117409285B (zh) 图像检测方法、装置及电子设备
CN111985510B (zh) 生成模型训练方法、图像生成方法及装置、介质、终端
JP2013192094A (ja) 映像拡大装置及び映像拡大方法
JP7377661B2 (ja) 画像の意味的領域分割装置、領域検知感度向上方法、及びプログラム
CN109214317B (zh) 一种信息量确定方法及装置
RU190639U1 (ru) Система генерации изображений, содержащих текст
JP2017076291A (ja) 認識プログラム、認識方法及び認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150914

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170111

R150 Certificate of patent or registration of utility model

Ref document number: 6076773

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350