JP4806230B2 - 劣化辞書生成プログラム、方法および装置 - Google Patents

劣化辞書生成プログラム、方法および装置 Download PDF

Info

Publication number
JP4806230B2
JP4806230B2 JP2005234860A JP2005234860A JP4806230B2 JP 4806230 B2 JP4806230 B2 JP 4806230B2 JP 2005234860 A JP2005234860 A JP 2005234860A JP 2005234860 A JP2005234860 A JP 2005234860A JP 4806230 B2 JP4806230 B2 JP 4806230B2
Authority
JP
Japan
Prior art keywords
deterioration
dictionary
sample set
dictionaries
test character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005234860A
Other languages
English (en)
Other versions
JP2006059351A (ja
Inventor
俊 孫
裕 勝山
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2006059351A publication Critical patent/JP2006059351A/ja
Application granted granted Critical
Publication of JP4806230B2 publication Critical patent/JP4806230B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)

Description

本発明は、自動的に劣化辞書を生成する劣化辞書生成プログラム、方法および装置、特に光学式文字認識用の劣化辞書を自動的に生成する劣化辞書生成プログラム、方法および装置に関するものである。
劣化文字パターンおよび辞書生成は光学式文字認識(OCR)に非常に有用である。現在のOCRエンジンは比較的良質な文字を認識するにはよく機能するが、劣化した文字に関してはよく機能しない。文字が劣化する理由は非常にこみいっている。読取り(スキャンニング)、ファックス、ビデオ画像化等はすべて文字パターンにさまざまな種類の劣化を生じる。たいていのOCRエンジンは良質の文字サンプルを認識することに限定されているので、劣化文字パターンについての認識率は低い。
劣化文字パターンについての認識性能を改善するとともにOCRエンジンを強力にするには、トレーニングデータを増強してOCR辞書を改訂するのに多くの劣化文字パターンが必要である。しかしながら、現実の劣化文字パターンを手動で多数収集するのは費用と時間がかかる。従って、自動的パターン生成方法の必要度は非常に高い。
劣化文字パターン生成方法は多くの文献および特許、例えば特許文献1および非特許文献1に記載されている。
これらの方法は、種々のタイプの物理的劣化モデルを形成することにより、種々のタイプの劣化文字パターンを生成することができる。これらの合成劣化文字パターンから作成した辞書を劣化辞書と呼ぶ。
さらに、上記劣化モデルには多数のパラメータがあり、種々のパラメータ値について種々の劣化レベルを有する劣化辞書を生成する。通常、現実の劣化サンプルと同じ劣化レベルを有する辞書だけが認識性能を改善するのに有効である。従って、合成劣化文字パターンと現実の劣化文字パターンとの間の類似度をどのように測定するかが現実のOCR用途にとって非常に重要である。この問題はまた辞書選択の問題、すなわち、一群の辞書の1つであって、与えられたテスト文字サンプルセットの劣化レベルにもっともよく合致する辞書をどのように選択するかの問題と見ることができる。
辞書選択方法には多くの応用がある。まず、辞書選択方法はOCRの認識性能を改善するのに使用することができる。大量の劣化文字を認識する場合、これらの文字の劣化レベルが似ていれば、少量のテスト文字サンプルセットがあれば最適の劣化辞書を選択するのに十分であり、そしてこの最適の辞書を用いて残りの文書を認識する。この方法はまたフォントタイプの認識にも使用することができる。その理由は、異なったフォントは異なったレベルの劣化とみなすことができるからである。フォントタイプごとに対応する辞書があれば、上述の辞書選択方法でテスト文字サンプルのフォントに合致するフォントの辞書が選択されることになる。
さらに、テスト文字サンプルセットが2種類以上のフォントタイプを含む場合、従来のフォント認識方法の多くのものはうまく機能しない。従って、複数フォント環境をどのように有効に検知するかも現実の応用において非常に重要である。
米国特許第5、796、410号明細書、エッチ.エス.バイルド(H.S.Baird)、「画像分析における欠陥画像の生成と使用(Generation and use of defective images in image analysis)」 ピー.サルカール(P.Sarkar)、ジー.ナジ(G.Nagy)、ジェイ.ジョウ(J.Zhou)、および、ディー.ロプレスティ(D.Lopresti)、「印刷されたパターンの空間的なサンプリング(Spatial sampling of printed patterns)」、IEEE PAMI、1998年、20(3)、p.344−351 ティー.カヌンゴ(T.Kanungo)、アール.エム.ハラリック(R.M.Haralick)、アイ.フィリップス(I.Philips)、 「全体的・部分的な文書劣化モデル(Global and Local Document Degradation Models)」、文書の分析と認識に関するIAPR第2回国際会議の議事録(Proceedings of IARP 2nd International Conference on Document Analysis and Recognition)、筑波、日本、1993年、p.730−734
本発明は、上記に鑑みてなされたものであって、劣化辞書を簡単にかつ有効に生成することができる劣化辞書生成プログラム、方法および装置を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、一態様において、コンピュータに、複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、および前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップを実行させることを特徴とする劣化辞書生成プログラムを提供する。
別の態様において、本発明は、コンピュータが、複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、および前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップを実行することを特徴とする劣化辞書生成方法を提供する。
オリジナル文字画像を拡大縮小処理し、拡大縮小処理された文字画像をぼかし処理し、ぼかし処理された画像を二値化処理するのが好ましい。これにより、劣化文字パターンを簡単に生成することができる。
本発明では、拡大縮小処理とぼかし処理を2回以上行うことができる。
劣化辞書を選択するステップでは、上述の抽出された特徴に基づいて、複数の劣化辞書のそれぞれとテスト文字サンプルセットの間の平均認識距離を計算し、かつ複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択することが好ましい。
本発明では、上述の選択された最終劣化辞書の劣化レベルに基づいて、テスト文字サンプルセットの劣化レベルを決定することができる。
本発明の方法においては、テスト文字サンプルセットが単一フォント環境にあるか否かを決定し、単一フォント環境のテスト文字サンプルセットを用いることにより最終劣化辞書を選択するのが好ましい。
予め作成された複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を計算し、正確に認識されたサンプルと複数のフォント辞書のそれぞれとの間の平均認識距離を計算し、かつ、テスト文字サンプルセットが唯一のフォントを備えるか否かを上述の2つの平均認識距離に基づいて決定することが好ましい。
さらに別の態様において、本発明は、複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成する劣化文字パターン生成手段、前記複数の劣化パラメータに基づいて、複数の劣化辞書をそれぞれ生成する劣化辞書生成手段、および前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択する辞書適合化手段を備えることを特徴とする劣化辞書生成装置を提供する。
上述の劣化文字パターン生成手段は、さらに、オリジナル文字画像を拡大縮小処理し、かつ拡大縮小処理された文字画像をぼかし処理する拡大縮小手段、および拡大縮小処理およびぼかし処理された文字画像を二値化処理する二値化手段を備えることが好ましい。
上述の拡大縮小手段は、オリジナル文字画像の拡大縮小処理を2回以上行い、かつその回数に対応して2回以上、拡大縮小処理された文字画像のぼかし処理を行う。
本発明の装置は、さらに、入力された画像パターンから特徴を抽出する特徴抽出手段を備えていてもよい。
本発明の装置は、上述の特徴抽出手段により抽出された特徴に基づいて、複数の劣化辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を、計算する平均認識距離計算手段を備えていてもよい。
上述の辞書適合化手段は、複数の劣化辞書の1つであってテスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択する。
本発明の劣化辞書生成装置を用いることにより、選択された最終劣化辞書の劣化レベルに基づいて、テスト文字サンプルセットの劣化レベルを決定することができる。
本発明の劣化辞書生成装置を用いることにより、予め作成された複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離、および正確に認識されたサンプルと複数のフォント辞書のそれぞれとの間の平均認識距離に基づいて、テスト文字サンプルセットが唯一のフォントを備えているか否かを決定することができる。
上述の辞書適合化手段は、単一フォント環境のテスト文字サンプルセットを用いることにより最終劣化辞書を選択するのが好ましい。
本発明の劣化辞書生成方法および装置は文字認識の分野だけでなく、他の分野、例えば音声認識および顔面認識にも使用することができる。その利点は実施が容易であることである。
以下に、本発明の劣化辞書生成方法および装置の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
図1は本発明の劣化辞書生成装置のブロック図である。図1に示すように、本発明の第一の実施の形態による劣化辞書生成装置は、複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成する劣化文字パターン生成手段100、上記複数の劣化パラメータに基づいて、複数の劣化辞書をそれぞれ生成する劣化辞書生成手段200、および上記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択する辞書適合化手段300を備える。
上述した本発明の劣化辞書生成装置および以下に説明する本発明の劣化辞書生成装置の各手段は適切にプログラムされたプロセッサおよび関連するメモリから構成することができる。本発明によれば、当業者はそのような劣化辞書生成装置を容易に構築することができる。従って、この劣化辞書生成装置の各手段についてこれ以上の説明は、明瞭性の観点から、省略する。
本発明において、オリジナル文字画像の劣化文字パターンは任意の適切な方法により生成することができる。以下に、劣化文字パターン生成手段100を例示として説明する。
図2は劣化文字パターン生成手段100の構造の概略を示す。図2に示すように、劣化文字パターン生成手段100はオリジナル文字画像を拡大縮小し、かつ拡大縮小された文字画像についてぼかし処理する拡大縮小部110、および拡大縮小処理およびぼかし処理された文字画像を二値化処理する二値化部120を備える。
本発明において、拡大縮小部110は縮小劣化部111およびズーム劣化部112を備える。縮小劣化部111は画像を縮小するが、この処理においては若干の情報が捨てられる。ズーム劣化部112は画像を拡大するが、この処理においては若干の情報が追加される。これら2つの操作のいずれもオリジナル文字画像を変形し、オリジナル文字画像に劣化を導入する。ぼかし(blurring)は主にカメラレンズのピンぼけ(defocusing)により引き起こされるが、これもオリジナル文字画像に劣化を導入する。
縮小劣化部111は、一連のm回の縮小およびぼかし操作を含む、ビデオ画像化の現実の縮小およびぼかし操作をシミュレーションする。縮小およびぼかし操作毎に入力された画像はまず目標サイズに縮小する。次いで、縮小された画像に平滑化フィルタを用いてぼかし効果を追加する。縮小劣化のパラメータは縮小操作およびぼかし操作のレベル、各縮小操作の目標サイズ、各ぼかし操作のぼかしパラメータ等を含む。
図3は図2の縮小劣化部111により行われる処理のフローチャートを示す。この処理はm回の縮小操作とぼかし操作を含む。オリジナル文字画像は、まず第1の縮小操作(S301)および第1のぼかし操作(S302)により処理され、引き続き、第2の縮小操作(S303)および第2のぼかし操作(S304)により処理される。このプロセスは最終の第mの縮小操作(S305)および第mのぼかし操作(S306)まで続けられる。縮小劣化部111の出力は縮小された劣化文字画像である。
ズーム劣化部112は、一連のn回のズームおよびぼかし操作を含む、ビデオ画像化の現実のズームおよびぼかし操作をシミュレーションする。ズームおよびぼかし操作毎に入力された画像はまず目標サイズにズームされる。次いで、ズームされた画像に平滑化フィルタを用いてぼかし効果を追加する。ズーム劣化のパラメータはズーム操作およびぼかし操作のレベル、各ズーム操作の目標サイズ、各ぼかし操作のぼかしパラメータ等を含む。
図4は図2に示すズーム劣化部112により行われる処理のフローチャートである。この処理はn回のズーム操作とぼかし操作を含む。ズーム劣化部112の入力は縮小された劣化文字画像である。縮小された劣化文字画像は、まず、第1のズーム操作(S401)および第1のぼかし操作(S402)により処理され、引き続き、第2のズーム操作(S403)および第2のぼかし操作(S404)により処理される。このプロセスは最終のn番目のズーム操作(S405)およびn番目のぼかし操作(S406)まで続けられる。ズーム劣化部112の出力はズームされた劣化文字画像である。
最終的なぼかされた画像はグレースケール画像であり、それ故、最終的なバイナリ画像を得るためには、二値化ステップを必要とする。従って、拡大縮小され、ぼかされた画像を二値化部120を使用することにより二値化する。二値化部120の出力はピクセル値0または255を有する画像である。この二値化処理のパラメータは二値化に用いられる閾値である。
以下に、本発明における拡大縮小操作をさらに詳細に説明する。
縮小操作は大サイズ画像を小サイズ画像に変換する処理である。本発明においては、4つの縮小方法、すなわち最近傍補間法、線形補間法、三次元補間法およびスーパーサンプリング法を使用することができる。本明細書において、下記の表記法を使用する。
(xD,yD)−ターゲット画像のピクセル座標(整数値)
(xS,yS)−(xD,yD)に正確に位置付けられるソース画像中の点の計算された座標
S(x,y)−ソース画像におけるピクセル値(強度)
D(x,y)−ターゲット画像におけるピクセル値(強度)
最近傍補間法では、ターゲット画像におけるピクセル値を、その点に最も近いソース画像のピクセルの値に設定する。

(xS,yS):D(xD,yD)=S(round(xS),round(yS))
線形補間法は、ソース画像における(xS、yS)に最も近い4つの画素におけるソース画像強度を用いる。これら4つの画素は
(xS0,yS0),(xS1,yS0),(xS0,yS1),(xS1,yS1):
S0=int(xS),xS1=xS0+1,yS0=int(yS),yS1=yS0+1
である。
図5に示すように、まず、強度値をx軸に沿って補間して2つの中間結果I0およびI1を得る。

0=S(xS,yS0)=S(xS0,yS0*(xS1−xS)+S(xS1、yS0*(xS−xS0

1=S(xS、yS1)=S(xS0,yS1*(xS1−xS)+S(xS1,yS1*(xS−xS0
次いで、y軸に沿って中間値I0およびI1を補間することによりターゲット強度D(xD,yD)を計算する。

D(xD,yD)=I0 *(yS1−yS)+I1 *(yS−yS0
図6に示すように、三次元補間法はソース画像の点(xS,yS)の近傍の16ピクセルにおけるソース画像強度を用いる。

S0=int(xS)−1 xS1=xS0+1 xS2=xS0+2 xS3=xS0+3

S0=int(yS)−1 yS1=yS0+1 yS2=xS0+2 yS3=yS0+3
まず、各ySkについて、アルゴリズムにより4つの三次多項式F0(x)、F1(x)、F2(x)およびF3(x)が決定される。

0(x)=ak3+bk2+ckx+dk 0≦k≦3

ただし、
k(xS0)=S(xS0,ySk
k(xS1)=S(xS1,ySk
k(xS2)=S(xS2,ySk
k(xS3)=S(xS3,ySk
である。
図6において、これらの多項式は実線曲線で示されている。次いで、三次多項式Fy(y)が下記のように決定される。
y(yS0)=F0(xS)、
y(yS1)=F1(xS)、
y(yS2)=F2(xS
y(yS3)=F3(xS
多項式Fy(y)は図6において破線で表されている。最後に、ターゲット強度D(xD,yD)を値Fy(yS)に設定する。
スーパーサンプリングのアルゴリズムは下記のステップ(1)〜(3)に示す通りである。
(1)ソース画像の矩形画像領域(ROI)(または、ROIが存在しなければ、画像全体)を分割して複数の等しい矩形とし、それぞれターゲット画像の若干の画素に対応するようにする。なお、各ソース画素は1×1の正方形により表される。
(2)各矩形に含まれるか、または矩形とゼロでない交点を有するすべての画素についてソース画素のピクセル値の重み付け合計を計算する。ソース画素が矩形内に完全に含まれているならば、そのピクセルの値に重み1を割り当てる。矩形とソース画素の正方形がa<1の交差領域を有するならば、そのピクセルの値に重みaを割り当てる。矩形と交差する各ソース画素をこのようにして計算する。
(3)ターゲット画像のピクセル値を計算するには、ステップ(2)の重み付け合計を矩形面積で割り算する。
ズームは縮小の逆処理である。ズームは小サイズの画像を大サイズの画像に変換する。本発明では3つのズーム方法、すなわち、最近傍補間法、線形補間法および三次元補間法を使用することができる。なお、本発明では、最終ズーム画像のサイズは明瞭なオリジナル文字画像のサイズと同じでなければならない。
縮小劣化部におけるぼかし操作は縮小された画像にぼかし効果を加える。ガウス・フィルタを用いて、拡大縮小された文字画像にぼかし効果を加えることができる。ガウス・フィルタの連続形は
G(x,y)=exp((x2+y2)/2/σ2
である。
このフィルタを二値化して7*7マスク領域とし、拡大縮小された画像と合わせてぼかされた画像を得る。
図7は生成された劣化文字パターンの一例を示す。上方の画像はオリジナルのバイナリ・パターンである。下方の画像は生成された劣化文字画像である。劣化文字パターンはレベル1の縮小操作とレベル2のズーム操作を用いて生成される。オリジナル文字画像のサイズと生成された劣化文字画像のサイズはすべて64*64である。左上から右下まで、縮小操作の縮小サイズは20から64に増加している。縮小サイズが小さいほど、画像の劣化が大きい。
上述のように、本発明では、拡大縮小部110は縮小劣化部111とズーム劣化部112を備える。しかしながら、拡大縮小部110は縮小劣化部111とズーム劣化部112のいずれか一方のみを備えていてもよいことが了解される。さらに、縮小劣化とズーム劣化の回数は何ら制限されない。特に、縮小劣化および/またはズーム劣化を1回だけ行うようにすることができる。
拡大縮小操作およびぼかし操作の後、生成された劣化文字パターンを用いて特徴抽出方法により劣化辞書を作成する。本発明による劣化辞書生成手段は、さらに、入力された文字パターンから特徴を抽出する特徴抽出手段400を備える。特徴抽出手段400は既存の任意の特徴抽出方法を行うことができる。例えば、下記の文献に記載された方法を採用することができる。詳細についてはこれらの文献を参照されたい。
キムラフミタカ、タカシマケンジ、ツルオカシンジ、「修正二次判別関数と漢字識別への応用」IEEE、PAMI 第PAMI−9巻、1987年1月(”Modified Quadratic Discriminant Functions and the Application to Chinese Character Recognition”、FUMITAKA KIMURA、KENJI TAKASHIMA、SHINJI TSURUOKA,IEEE,PAMI vol.PAMI−9,NO.1,January 1987)
ゴヴィンダン、ヴィー.ケー.およびシヴァパラサド、エイ.ピー.、「文字認識:概説」パターン認識、第23巻第7号、第671〜683頁1,990年(”Character recognition:review”,Pattern REcognition,Govindan,V.K. and Shivaprasad,A.P.,Vol.23,No.7,pp.671−683,1990)
従って、それぞれの劣化パラメータを変化させることにより、種々の劣化パラメータに対応する複数の劣化辞書を確立するために多数の劣化文字パターンを生成することができる。
本発明において、種々の劣化パラメータに対応する複数の劣化辞書を生成した後、劣化辞書の実地応用状況に対応するテスト文字サンプルセットを使用することにより最適の劣化辞書を選択する。
図8に示すように、まず、劣化辞書の実地応用状況に従ってテスト文字サンプルセットを決定する。特徴抽出手段を400を用いて各テスト文字サンプルの特徴を抽出する。図8に示すように、辞書適合化手段300はそれぞれの劣化辞書とテスト文字サンプルセットとの間の平均認識距離を計算する平均認識距離計算部310を有する。従って、平均認識距離の計算結果に基づいて最も合致した劣化辞書を選択することができる。
図9は、図8の辞書適合化手段300により行われる処理のフローチャートである。図9において、平均計算部310はテスト文字サンプルセット(Ftest)と第1の劣化辞書(Fdict(1))との間の平均認識距離(MRD)を計算する(第1の平均認識距離計算ステップ、S901)。計算値を最小MRD(MRDmin)として記憶する。第2の劣化辞書(Dict(2))を指定し、辞書のインデックス1を記録し、これから出発して(出発劣化辞書指定ステップ、S902)、テスト文字サンプルセット(Ftest)とi番目である現在の劣化辞書(Fdict(i))のMRD(MRD(Ftest,Fdict(i))を再度計算する(現在の平均認識距離計算ステップ、S903)。計算値を最初のMRDminと比較し(平均認識距離比較ステップ、S904)、計算値がMRDminよりも小さい場合、最初のMRDminを新しいMRD値に更新し(平均認識距離更新ステップ、S905)、辞書のインデックスを記録する(インデックス更新ステップ、S906)。そして、次の劣化辞書を指定する(次の劣化辞書指定ステップ、S907)。計算値がMRDminよりも小さくない場合、直ちに次の劣化辞書を指定する(S907)。このプロセスを全ての辞書が計算され比較されるまで繰り返す。すなわち、計算値が最初のMRDminよりも小さくない場合は、直ちに次の劣化辞書を指定する(S907)。次いで、平均認識距離の計算を行った辞書の番号(i)と辞書の総数Ndとを比較し(計算済み劣化辞書個数比較ステップ、S908)、iがNよりも小さいときは現在の平均認識距離計算ステップ(S903)に戻り、i=Nのときはプロセスを終了する。辞書適合化手段300の最終出力は最小のMRDを持つ辞書のインデックスである。
テスト文字サンプルセットと辞書との間の平均認識距離を以下のようにして計算する。
まず、テスト文字サンプルセットiと1つの辞書jとの間の距離を下式(1)のように計算する。
j(i)=min(Dist(i,k)) k=1,2,..,m (1)

(式中、iはテスト文字サンプルのインデックスであり、jは辞書のインデックスである。Dist()は2つのテスト文字サンプルの間の計算された距離であり、kは辞書に含まれるサンプルのインデックスであり、mは辞書に含まれるサンプルの数である。)
次いで、テスト文字サンプルセットと辞書jの間の平均認識距離を、下式(2)のように、テスト文字サンプルセットのあらゆるサンプルの辞書との認識距離の平均として得る。
Figure 0004806230
図10は、平均認識距離計算部310により行われる処理のフローチャートである。1つのテスト文字サンプルセットについて、第1のテスト文字サンプルを指定し、合計を0に設定する(第1のテストサンプル指定ステップ、S1001)。これから出発して、現在のテスト文字サンプルとj番目の辞書(Fdict(j))との間の認識距離(RD(i))をそれぞれ計算する(認識距離計算ステップ、S1002)。次に計算値を合計する(計算値合計ステップ、S1003)。全てのテスト文字サンプルの認識距離を計算して合計するまで、この処理を繰り返す。すなわち、次のテスト文字サンプルを指定し(次のテスト文字サンプル指定ステップ、S1004)、認識距離計算済みテスト文字サンプルの個数(i)とテスト文字サンプルの総数Ntestとを比較し、大小を判断する(テスト文字サンプル個数比較ステップ、S1005)。iがNtestよりも小さい場合、認識距離計算ステップ(S1002)に戻り、iがNtestに等しい場合、所与のテスト文字サンプルセットとj番目の辞書との間の平均認識距離(MRD(FDict(j))を、すべてのテスト文字サンプルの認識距離の合計(sum)をテスト文字サンプルの総数(Ntest)で除した平均(sum/Ntest)として測定する(平均認識距離計算ステップ、S1006)。
図11は、認識距離計算処理のフローチャートである。まず、テスト文字サンプル(Ftest)と辞書中の第1のサンプル(トレーニングデータサンプル)(Ftrain(1))の間の距離(Dist(Ftest,Ftrain(1))を計算し、これをDminとして記憶する(第1のサンプル距離計算ステップ、S1101)。次いで、辞書中の第2のサンプルを指定する(第2のサンプル指定ステップ、S1102)。これから出発して、辞書中の現在のサンプル(トレーニングデータサンプル)((Frain(i))とテスト文字サンプル(Ftest)との間の距離(Dist(Ftest,Ftrain(i))を計算する(現在のサンプル距離計算ステップ、S1103)。計算された距離DとDminを比較する(サンプル距離比較ステップ、S1104)。DがDminよりも小さければ、Dminの値を現在の距離の値Dに置き替え(サンプル距離更新ステップ、S1105)、次のサンプルを指定する(次のサンプル指定ステップ、S1106)。DがDminより小さくない場合は、直ちに次のサンプルを指定する(S1106)。すべての辞書サンプルが計算されるまで、この処理を繰り返す。すなわち、サンプル間距離計算済みサンプルの個数iとサンプルの総数Ntrainとを比較する(サンプル個数比較ステップ、S1107)。iがNtrainに等しい場合、認識距離をDminとする(認識距離決定ステップ、S1108)。iがNtrainよりも小さい場合、現在のサンプル距離計算ステップS1103に戻る。最終出力は最小距離値Dminである(S1108)。
これにより、劣化辞書の実地応用状況に対応するテスト文字サンプルセットに従って最適の劣化辞書が選択される。加えて、本発明においては、辞書適合化手段300を用いることによりテスト文字サンプルセットの劣化レベルを決定することができる。
実地応用では、種々の劣化レベルまたは劣化パラメータの種々の値に従って多数の劣化辞書を生成する。1つの劣化辞書中のすべてのサンプルが同じ劣化パラメータ値を持つ。所与のテスト文字サンプルセットについて、辞書適合化手段300は1つの最も適合化された劣化辞書を選択する。適合化された劣化辞書の劣化レベルはテスト文字サンプルセットの劣化レベルと同じである。これにより、辞書適合化手段300を使用することによりテスト文字サンプルセットの劣化レベルを決定することができる。
図12は、テスト文字サンプルセットの劣化レベルを決定する処理のフローチャートである。まず、一群のN個の劣化辞書を作成する。テスト文字サンプルについて、辞書適合化手段300はこれらN個の劣化辞書から最適の辞書を選択する。選択された適合化辞書の劣化レベルをテスト文字サンプルセットの劣化レベルとみなす。
さらに、本発明では、辞書適合化手段300を用いることにより、テスト文字サンプルのフォントタイプを決定することができる。
フォント認識の実地応用では、サンプル間のフォントタイプが異なる場合、異なる辞書を作成する。1つの辞書中の全てのサンプルは同じフォントタイプを持つ。
図13は、本発明によるテスト文字サンプルセットのフォントタイプを決定する処理のフローチャートである。まず、異なるフォントタイプの、一群のN個のフォント辞書を作成する。テスト文字サンプルセットについて、辞書適合化手段300がN個のフォント辞書から最適の辞書を選択する。選択された、適合化された劣化辞書のフォントタイプをテスト文字サンプルセットのフォントタイプとみなす。
実地応用では、異なるフォントタイプを異なるレベルの劣化とみなすことができるので、テスト文字サンプルセットが多数のフォントを含む場合は、辞書適合化手段300は誤動作をするかもしれない。従って、テスト文字サンプルセット中の全てのサンプルが同じフォントタイプであることを確認する必要がある。
従って、テスト文字サンプルセットのフォント環境を検知する機能が本発明に備えられている。特定のサンプルセットについて、所与のサンプルセットが1種類だけのフォントタイプを含む(単一フォント環境)か、2種類以上のフォントタイプを含む(複数フォント環境)か、を決定することができる。
図14は、フォント環境検知のフローチャートである。図示のように、まず、異なるフォントタイプの、一群のN個のフォント辞書を予め作成する(フォント辞書作成ステップ、1409)。テスト文字サンプルセットを選択する(テスト文字サンプルセット選択ステップ、S1401)。各辞書について、すべてのテスト文字サンプルを使用して平均認識距離を計算する(全体的平均認識距離計算ステップ、S1402)。次いで、光学式文字認識方法を用いてテスト文字サンプルセットを認識し、正確に認識された文字サンプルを選択する(正確認識文字サンプル選択ステップ、S1403)。その後、N個のフォント辞書のそれぞれについて、正確に認識された文字を用いて、第2の平均認識距離を計算する(平均認識距離計算ステップ、S1404)。これら2つの平均認識距離の差を計算する(平均認識距離差計算ステップ、S1405)。次に、平均認識距離の差を予め定義された閾値と比較する(平均認識距離差比較ステップ、S1406)。この差が予め定義された閾値よりも大きい場合(差比較ステップ、S1406)、テスト文字サンプルセットは2種類以上のフォントを含むと判断される(複数フォント環境判断ステップ、S1408)。他の場合、テスト文字サンプルセットは1種類のフォントだけを含み、単一フォント環境であると判断される(単一フォント環境判断ステップ、S1407)。
これにより、辞書適合化手段300は、1種類のフォントだけを含むテスト文字サンプルセットを用いることにより、最適の辞書を選択することができる。
上述のように、本発明を好適な実施の形態により説明したが、本発明は特定の詳細な内容に限定されないことが了解される。本発明の劣化辞書生成方法および装置の形態と詳細は添付の特許請求の範囲内で変更することができる。
以上のように、本発明にかかる劣化辞書生成プログラム、方法および装置は、光学式文字認識(OCR)に有用であり、特に、複数フォント環境における光学式文字認識に適している。本発明はまた、音声認識、顔面認識等の分野にも利用可能である。
(付記1)コンピュータに、
複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、および
前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
を実行させることを特徴とする劣化辞書生成プログラム。
(付記2)前記コンピュータに更に、
前記オリジナル文字画像を拡大縮小処理するステップ、
前記拡大縮小処理された文字画像をぼかし処理するステップ、および
前記ぼかし処理された画像を二値化処理するステップ
を実行させることを特徴とする付記1に記載の劣化辞書生成プログラム。
(付記3)前記コンピュータに更に
前記拡大縮小処理および前記ぼかし処理を2回以上行わせることを特徴とする付記2に記載の劣化辞書生成プログラム。
(付記4)前記コンピュータに前記劣化辞書を選択するステップを実行させる際、
前記テスト文字サンプルの特徴を抽出するステップ、
前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
を実行させることを特徴とする付記1から付記3のいずれか一項に記載の劣化辞書生成プログラム。
(付記5)前記コンピュータに更に、
前記選択された最終劣化辞書の劣化レベルに基づいて、前記テスト文字サンプルセットの劣化レベルを決定するステップ
を実行させることを特徴とする付記4に記載の劣化辞書生成プログラム。
(付記6)前記コンピュータに更に、
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップを実行させるとともに、
前記コンピュータに
前記最終劣化辞書を選択する処理を実行させる際、前記唯一のフォントを含むテスト文字サンプルセットを用いることにより劣化辞書の選択を行わせる
ことを特徴とする付記1から付記5のいずれか一項に記載の劣化辞書生成プログラム。
(付記7)前記コンピュータに更に、
異なるフォントの複数のフォント辞書を作成するステップ、
前記複数のフォント辞書のそれぞれと前記テスト文字サンプルセットとの間の平均認識距離を計算するステップ、
前記テスト文字サンプルセットから正確に認識されたサンプルを選択するステップ、
前記正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、および
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを前記2つの平均認識距離に基づいて決定するステップ
を実行させることを特徴とする付記6に記載の劣化辞書生成プログラム。
(付記8)コンピュータが、
複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、および
前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
を実行することを特徴とする劣化辞書生成方法。
(付記9)前記コンピュータが、更に、
前記オリジナル文字画像を拡大縮小処理するステップ、
前記拡大縮小処理された文字画像をぼかし処理するステップ、および
前記ぼかし処理された画像を二値化処理するステップ
を実行することを特徴とする付記8に記載の劣化辞書生成方法。
(付記10)前記コンピュータが更に
前記拡大縮小処理および前記ぼかし処理を2回以上行うことを特徴とする付記9に記載の劣化辞書生成方法。
(付記11)前記コンピュータが、前記劣化辞書を選択するステップを実行する際、
前記テスト文字サンプルの特徴を抽出するステップ、
前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
を実行することを特徴とする付記8から付記10のいずれか一項に記載の劣化辞書生成方法。
(付記12)前記コンピュータが、更に、
前記選択された最終劣化辞書の劣化レベルに基づいて、前記テスト文字サンプルセットの劣化レベルを決定するステップ
を実行することを特徴とする付記11に記載の劣化辞書生成方法。
(付記13)前記コンピュータが、更に、
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップを実行するとともに、
前記コンピュータが前記最終劣化辞書を選択する処理を実行する際、前記唯一のフォントを含むテスト文字サンプルセットを用いることにより劣化辞書の選択を行う
ことを特徴とする付記8から付記12のいずれか一項に記載の劣化辞書生成方法。
(付記14)前記コンピュータが、更に
異なるフォントの複数のフォント辞書を作成するステップ、
前記複数のフォント辞書のそれぞれと前記テスト文字サンプルセットとの間の平均認識距離を計算するステップ、
前記テスト文字サンプルセットから正確に認識されたサンプルを選択するステップ、
前記正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、および
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを前記2つの平均認識距離に基づいて決定するステップ
実行することを特徴とする付記13に記載の劣化辞書生成方法。
(付記15)複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成する劣化文字パターン生成手段、
前記複数の劣化パラメータに基づいて、複数の劣化辞書をそれぞれ生成する劣化辞書生成手段、および
前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択する辞書適合化手段
を備えることを特徴とする劣化辞書生成装置。
(付記16)前記劣化文字パターン生成手段は、さらに、
前記オリジナル文字画像を拡大縮小処理し、かつ前記拡大縮小処理された文字画像をぼかし処理する拡大縮小手段、および
前記拡大縮小処理およびぼかし処理された文字画像を二値化処理する二値化手段
を備えることを特徴とする付記15に記載の劣化辞書生成装置。
(付記17)前記拡大縮小手段は、前記オリジナル文字画像の拡大縮小処理を2回以上行い、かつそれに応じて前記拡大縮小処理された文字画像のぼかし処理を2回以上行う
ことを特徴とする付記16に記載の劣化辞書生成装置。
(付記18)入力された画像パターンから特徴を抽出する特徴抽出手段をさらに備え、
前記劣化辞書生成手段は、前記特徴抽出手段により抽出された特徴から前記複数の劣化辞書を生成する
ことを特徴とする付記15から付記17のいずれか一項に記載の劣化辞書生成装置。
(付記19)辞書とテスト文字サンプルセットとの間の平均認識距離を計算する平均認識距離計算手段をさらに備え、
前記平均認識距離計算手段は、前記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットとの間の平均認識距離を、前記特徴抽出手段により抽出された特徴に基づいて計算し、
前記辞書適合化手段は、前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択する
ことを特徴とする付記15から付記18のいずれか一項に記載の劣化辞書生成装置。
本発明の劣化辞書生成装置を示すブロック図である。 劣化文字パターン生成手段の処理フローチャートである。 縮小劣化部の処理のフローチャートである。 ズーム劣化部の処理のフローチャートである。 線形補間法の説明図である。 三次元補間法の説明図である。 オリジナルパターンと、異なる劣化パラメータ値を使用することにより生成された対応する劣化文字パターンのサンプルを示す図である。 辞書適合化手段の処理の概略フローチャートである。 辞書適合化処理の詳細なフローチャートである。 平均認識距離計算手段の処理フローチャートである。 認識距離計算処理のフローチャートである。 劣化レベル見積もり処理のフローチャートである。 フォント認識処理のフローチャートである。 単一フォント環境検知処理のフローチャートである。
符号の説明
100 劣化文字パターン生成手段
110 拡大縮小部
111 縮小劣化部
112 ズーム劣化部
120 二値化部
200 劣化辞書生成手段
300 辞書適合化手段
310 平均認識距離計算部
400 特徴抽出手段
S301 第1の縮小操作
S302 第1のぼかし操作
S303 第2の縮小操作
S304 第2のぼかし操作
S305 第mの縮小操作
S306 第mのぼかし操作
S401 第1のズーム操作
S402 第1のぼかし操作
S403 第2のズーム操作
S404 第2のぼかし操作
S405 第nのズーム操作
S406 第nのぼかし操作
S901 第1の平均認識距離計算ステップ
S902 出発劣化辞書指定ステップ
S903 現在の平均認識距離計算ステップ
S904 平均認識距離比較ステップ
S905 平均認識距離更新ステップ
S906 インデックス更新ステップ
S907 次の劣化辞書指定ステップ
S908 計算済み劣化辞書個数比較ステップ
S1001 第1のテストサンプル指定ステップ
S1002 認識距離計算ステップ
S1003 計算値合計ステップ
S1004 次のテスト文字サンプル指定ステップ
S1005 テスト文字サンプル個数比較ステップ
S1006 平均認識距離計算ステップ
S1101 第1のサンプル距離計算ステップ
S1102 第2のサンプル指定ステップ
S1103 現在のサンプル距離計算ステップ
S1104 サンプル距離比較ステップ
S1105 サンプル距離更新ステップ
S1106 次のサンプル指定ステップ
S1107 サンプル個数比較ステップ
S1108 認識距離決定ステップ
S1401 テスト文字サンプルセット選択ステップ
S1402 全体的平均認識距離計算ステップ
S1403 正確認識文字サンプル選択ステップ
S1404 平均認識距離計算ステップ
S1405 平均認識距離差計算ステップ
S1406 差比較ステップ
S1407 単一フォント環境判断ステップ
S1408 複数フォント環境判断ステップ
S1409 フォント辞書作成ステップ

Claims (12)

  1. コンピュータに、
    異なるフォントの複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を計算するステップ、
    前記テスト文字サンプルセットから正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、
    前記2つの平均認識距離の差に基づいて、前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップ、および
    前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、複数の劣化パラメータに対応する複数の劣化辞書のなかから、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
    を実行させることを特徴とする劣化辞書生成プログラム。
  2. 前記コンピュータに更に、
    複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
    前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、
    を実行させ、
    前記選択するステップは、前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択することを特徴とする請求項1に記載の劣化辞書生成プログラム。
  3. 前記コンピュータに更に、
    前記オリジナル文字画像を拡大縮小処理するステップ、
    前記拡大縮小処理された文字画像をぼかし処理するステップ、および
    前記ぼかし処理された画像を二値化処理するステップ
    を実行させることを特徴とする請求項に記載の劣化辞書生成プログラム。
  4. 前記コンピュータに前記劣化辞書を選択するステップを実行させる際、
    前記テスト文字サンプルの特徴を抽出するステップ、
    前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
    前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
    を実行させることを特徴とする請求項または請求項に記載の劣化辞書生成プログラム。
  5. コンピュータが、
    異なるフォントの複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を計算するステップ、
    前記テスト文字サンプルセットから正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、
    前記2つの平均認識距離の差に基づいて、前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップ、および
    前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、複数の劣化パラメータに対応する複数の劣化辞書のなかから、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
    を実行することを特徴とする劣化辞書生成方法。
  6. 前記コンピュータが、更に、
    複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
    前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、
    を実行し、
    前記選択するステップは、前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択することを特徴とする請求項5に記載の劣化辞書生成方法。
  7. 前記コンピュータが、更に、
    前記オリジナル文字画像を拡大縮小処理するステップ、
    前記拡大縮小処理された文字画像をぼかし処理するステップ、および
    前記ぼかし処理された画像を二値化処理するステップ
    を実行することを特徴とする請求項に記載の劣化辞書生成方法。
  8. 前記コンピュータが、前記劣化辞書を選択するステップを実行する際、
    前記テスト文字サンプルの特徴を抽出するステップ、
    前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
    前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
    を実行することを特徴とする請求項または請求項に記載の劣化辞書生成方法。
  9. 異なるフォントの複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を計算する第一の平均認識距離計算手段、
    前記テスト文字サンプルセットから正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算する第二の平均認識距離計算手段、
    前記2つの平均認識距離の差に基づいて、前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定する決定手段、および
    前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、複数の劣化パラメータに対応する複数の劣化辞書のなかから、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択する辞書適合化手段
    を備えることを特徴とする劣化辞書生成装置。
  10. 複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成する劣化文字パターン生成手段、
    前記複数の劣化パラメータに基づいて、複数の劣化辞書をそれぞれ生成する劣化辞書生成手段、
    をさらに備え、
    前記辞書適合化手段は、前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択することを特徴とする請求項9に記載の劣化辞書生成装置。
  11. 前記劣化文字パターン生成手段は、さらに、
    前記オリジナル文字画像を拡大縮小処理し、かつ前記拡大縮小処理された文字画像をぼかし処理する拡大縮小手段、および
    前記拡大縮小処理およびぼかし処理された文字画像を二値化処理する二値化手段
    を備えることを特徴とする請求項10に記載の劣化辞書生成装置。
  12. 前記辞書適合化手段は、さらに、
    前記テスト文字サンプルの特徴を抽出する抽出手段、
    前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算する計算手段、および
    前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択する選択手段
    を備えることを特徴とする請求項10または請求項11に記載の劣化辞書生成装置。
JP2005234860A 2004-08-18 2005-08-12 劣化辞書生成プログラム、方法および装置 Expired - Fee Related JP4806230B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200410058588.2 2004-08-18
CNB2004100585882A CN100373399C (zh) 2004-08-18 2004-08-18 建立劣化字典的方法和装置

Publications (2)

Publication Number Publication Date
JP2006059351A JP2006059351A (ja) 2006-03-02
JP4806230B2 true JP4806230B2 (ja) 2011-11-02

Family

ID=36033999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005234860A Expired - Fee Related JP4806230B2 (ja) 2004-08-18 2005-08-12 劣化辞書生成プログラム、方法および装置

Country Status (3)

Country Link
US (1) US7480408B2 (ja)
JP (1) JP4806230B2 (ja)
CN (1) CN100373399C (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US8825682B2 (en) * 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US9373029B2 (en) * 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7970171B2 (en) 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8156427B2 (en) * 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US10192279B1 (en) 2007-07-11 2019-01-29 Ricoh Co., Ltd. Indexed document modification sharing with mixed media reality
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8201076B2 (en) * 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
RU2445699C1 (ru) * 2007-11-28 2012-03-20 Люмэкс Ас Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US20120134595A1 (en) * 2009-08-11 2012-05-31 Koninklijke Philips Electronics N.V. Method and apparatus for providing an image for display
JP5505007B2 (ja) * 2010-03-18 2014-05-28 富士通株式会社 画像処理装置、画像処理方法及び画像処理用コンピュータプログラム
US8792748B2 (en) * 2010-10-12 2014-07-29 International Business Machines Corporation Deconvolution of digital images
CA2826079A1 (en) 2011-01-31 2012-08-09 Walter Rosenbaum Method and system for information recognition
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
CN104392015A (zh) * 2014-08-07 2015-03-04 贵阳朗玛信息技术股份有限公司 一种图像处理方法及装置
JP6341059B2 (ja) * 2014-10-31 2018-06-13 オムロン株式会社 文字認識装置、文字認識方法、およびプログラム
CN106156766B (zh) 2015-03-25 2020-02-18 阿里巴巴集团控股有限公司 文本行分类器的生成方法及装置
EP3343432B1 (en) * 2016-12-29 2024-03-20 Elektrobit Automotive GmbH Generating training images for machine learning-based object recognition systems

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60138688A (ja) * 1983-12-26 1985-07-23 Ricoh Co Ltd 文字認識方法
JPS62282385A (ja) * 1986-05-31 1987-12-08 Fujitsu Ltd 文字識別装置
US5796410A (en) * 1990-06-12 1998-08-18 Lucent Technologies Inc. Generation and use of defective images in image analysis
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US6389163B1 (en) * 1994-11-18 2002-05-14 Xerox Corporation Method and apparatus for automatic image segmentation using template matching filters
JPH08241378A (ja) * 1995-03-03 1996-09-17 Fuji Electric Co Ltd 低品質文字の認識方法
JPH096922A (ja) * 1995-06-20 1997-01-10 Sony Corp 手書き文字認識装置
JP3716519B2 (ja) * 1996-11-15 2005-11-16 オムロン株式会社 カメラおよび外部装置ならびに画像処理装置
US6453069B1 (en) * 1996-11-20 2002-09-17 Canon Kabushiki Kaisha Method of extracting image from input image using reference image
US6671404B1 (en) * 1997-02-14 2003-12-30 Hewlett-Packard Development Company, L.P. Method and apparatus for recognizing patterns
JPH10240869A (ja) * 1997-03-03 1998-09-11 Nippon Steel Corp 文字認識辞書作成装置及び文字認識辞書作成方法
JP3574562B2 (ja) * 1998-03-19 2004-10-06 日本電信電話株式会社 画像内の一連パターンの認識および変形検出方法及びそのプログラムを記録した記録媒体
JP3868637B2 (ja) * 1998-07-01 2007-01-17 株式会社リコー 文字認識装置および辞書作成方法および記録媒体
US6782129B1 (en) * 1998-09-23 2004-08-24 Xerox Corporation Image segmentation apparatus and method
US6493463B1 (en) * 1999-09-09 2002-12-10 Xerox Corporation Segmentation tag cleanup using neighborhood tags
JP2001331766A (ja) * 2000-05-23 2001-11-30 Oki Electric Ind Co Ltd パタン認識辞書の作成方法、コンピュータ読取可能な記録媒体、パタン認識辞書作成装置および文字認識装置
US6735337B2 (en) * 2001-02-02 2004-05-11 Shih-Jong J. Lee Robust method for automatic reading of skewed, rotated or partially obscured characters
US6778700B2 (en) * 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
JP2003242445A (ja) * 2002-02-19 2003-08-29 Fujitsu Ltd ナンバープレート読取装置
JP3933496B2 (ja) * 2002-02-28 2007-06-20 日本電信電話株式会社 文字パターン認識方法及びその認識装置、並びに文字パターン認識プログラム及びそのプログラムを記録した記録媒体
US7079686B2 (en) * 2002-08-20 2006-07-18 Lexmark International, Inc. Systems and methods for content-based document image enhancement

Also Published As

Publication number Publication date
CN1737824A (zh) 2006-02-22
JP2006059351A (ja) 2006-03-02
CN100373399C (zh) 2008-03-05
US7480408B2 (en) 2009-01-20
US20060056696A1 (en) 2006-03-16

Similar Documents

Publication Publication Date Title
JP4806230B2 (ja) 劣化辞書生成プログラム、方法および装置
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
CN111723585B (zh) 一种风格可控的图像文本实时翻译与转换方法
CN109377445B (zh) 模型训练方法、替换图像背景的方法、装置和电子系统
CN113435240B (zh) 一种端到端的表格检测和结构识别方法及系统
CN116994140A (zh) 基于遥感影像的耕地提取方法、装置、设备和介质
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
CN112070649B (zh) 一种去除特定字符串水印的方法及系统
JP2008033424A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
CN111553349B (zh) 一种基于全卷积网络的场景文本定位与识别方法
CN115331245B (zh) 一种基于图像实例分割的表格结构识别方法
CN116645592B (zh) 一种基于图像处理的裂缝检测方法和存储介质
CN112597998A (zh) 一种基于深度学习的扭曲图像矫正方法、装置和存储介质
CN116740528A (zh) 一种基于阴影特征的侧扫声呐图像目标检测方法及系统
CN103455816B (zh) 一种笔画宽度提取方法、装置及一种文字识别方法、系统
JPH0256708B2 (ja)
CN114863431A (zh) 一种文本检测方法、装置及设备
CN112733857B (zh) 自动分割字符区域的图像文字检测模型训练方法及装置
CN114494786A (zh) 一种基于多层协调卷积神经网络的细粒度图像分类方法
CN113033559A (zh) 一种基于目标检测的文本检测方法及装置、存储介质
CN116030472A (zh) 文字坐标确定方法及装置
CN113657214B (zh) 一种基于Mask RCNN的建筑损伤评估方法
JP2007052782A (ja) 認識距離を調整するプログラム、装置および方法、ならびに文字列を認識するプログラム
CN112232390A (zh) 一种高像素大图像的识别方法和系统
CN117576416B (zh) 工件边缘区域的检测方法、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110809

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110812

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees