JP4806230B2 - 劣化辞書生成プログラム、方法および装置 - Google Patents
劣化辞書生成プログラム、方法および装置 Download PDFInfo
- Publication number
- JP4806230B2 JP4806230B2 JP2005234860A JP2005234860A JP4806230B2 JP 4806230 B2 JP4806230 B2 JP 4806230B2 JP 2005234860 A JP2005234860 A JP 2005234860A JP 2005234860 A JP2005234860 A JP 2005234860A JP 4806230 B2 JP4806230 B2 JP 4806230B2
- Authority
- JP
- Japan
- Prior art keywords
- deterioration
- dictionary
- sample set
- dictionaries
- test character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
- Image Processing (AREA)
Description
(xD,yD)−ターゲット画像のピクセル座標(整数値)
(xS,yS)−(xD,yD)に正確に位置付けられるソース画像中の点の計算された座標
S(x,y)−ソース画像におけるピクセル値(強度)
D(x,y)−ターゲット画像におけるピクセル値(強度)
(xS,yS):D(xD,yD)=S(round(xS),round(yS))
(xS0,yS0),(xS1,yS0),(xS0,yS1),(xS1,yS1):
xS0=int(xS),xS1=xS0+1,yS0=int(yS),yS1=yS0+1
である。
I0=S(xS,yS0)=S(xS0,yS0)*(xS1−xS)+S(xS1、yS0)*(xS−xS0)
I1=S(xS、yS1)=S(xS0,yS1)*(xS1−xS)+S(xS1,yS1)*(xS−xS0)
D(xD,yD)=I0 *(yS1−yS)+I1 *(yS−yS0)
xS0=int(xS)−1 xS1=xS0+1 xS2=xS0+2 xS3=xS0+3
yS0=int(yS)−1 yS1=yS0+1 yS2=xS0+2 yS3=yS0+3
F0(x)=akx3+bkx2+ckx+dk 0≦k≦3
ただし、
k(xS0)=S(xS0,ySk)
Fk(xS1)=S(xS1,ySk)
Fk(xS2)=S(xS2,ySk)
Fk(xS3)=S(xS3,ySk)
である。
Fy(yS0)=F0(xS)、
Fy(yS1)=F1(xS)、
Fy(yS2)=F2(xS)
Fy(yS3)=F3(xS)
(1)ソース画像の矩形画像領域(ROI)(または、ROIが存在しなければ、画像全体)を分割して複数の等しい矩形とし、それぞれターゲット画像の若干の画素に対応するようにする。なお、各ソース画素は1×1の正方形により表される。
(2)各矩形に含まれるか、または矩形とゼロでない交点を有するすべての画素についてソース画素のピクセル値の重み付け合計を計算する。ソース画素が矩形内に完全に含まれているならば、そのピクセルの値に重み1を割り当てる。矩形とソース画素の正方形がa<1の交差領域を有するならば、そのピクセルの値に重みaを割り当てる。矩形と交差する各ソース画素をこのようにして計算する。
(3)ターゲット画像のピクセル値を計算するには、ステップ(2)の重み付け合計を矩形面積で割り算する。
G(x,y)=exp((x2+y2)/2/σ2)
である。
キムラフミタカ、タカシマケンジ、ツルオカシンジ、「修正二次判別関数と漢字識別への応用」IEEE、PAMI 第PAMI−9巻、1987年1月(”Modified Quadratic Discriminant Functions and the Application to Chinese Character Recognition”、FUMITAKA KIMURA、KENJI TAKASHIMA、SHINJI TSURUOKA,IEEE,PAMI vol.PAMI−9,NO.1,January 1987)
ゴヴィンダン、ヴィー.ケー.およびシヴァパラサド、エイ.ピー.、「文字認識:概説」パターン認識、第23巻第7号、第671〜683頁1,990年(”Character recognition:review”,Pattern REcognition,Govindan,V.K. and Shivaprasad,A.P.,Vol.23,No.7,pp.671−683,1990)
Dj(i)=min(Dist(i,k)) k=1,2,..,m (1)
(式中、iはテスト文字サンプルのインデックスであり、jは辞書のインデックスである。Dist()は2つのテスト文字サンプルの間の計算された距離であり、kは辞書に含まれるサンプルのインデックスであり、mは辞書に含まれるサンプルの数である。)
複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、および
前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
を実行させることを特徴とする劣化辞書生成プログラム。
前記オリジナル文字画像を拡大縮小処理するステップ、
前記拡大縮小処理された文字画像をぼかし処理するステップ、および
前記ぼかし処理された画像を二値化処理するステップ
を実行させることを特徴とする付記1に記載の劣化辞書生成プログラム。
前記拡大縮小処理および前記ぼかし処理を2回以上行わせることを特徴とする付記2に記載の劣化辞書生成プログラム。
前記テスト文字サンプルの特徴を抽出するステップ、
前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
を実行させることを特徴とする付記1から付記3のいずれか一項に記載の劣化辞書生成プログラム。
前記選択された最終劣化辞書の劣化レベルに基づいて、前記テスト文字サンプルセットの劣化レベルを決定するステップ
を実行させることを特徴とする付記4に記載の劣化辞書生成プログラム。
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップを実行させるとともに、
前記コンピュータに
前記最終劣化辞書を選択する処理を実行させる際、前記唯一のフォントを含むテスト文字サンプルセットを用いることにより劣化辞書の選択を行わせる
ことを特徴とする付記1から付記5のいずれか一項に記載の劣化辞書生成プログラム。
異なるフォントの複数のフォント辞書を作成するステップ、
前記複数のフォント辞書のそれぞれと前記テスト文字サンプルセットとの間の平均認識距離を計算するステップ、
前記テスト文字サンプルセットから正確に認識されたサンプルを選択するステップ、
前記正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、および
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを前記2つの平均認識距離に基づいて決定するステップ
を実行させることを特徴とする付記6に記載の劣化辞書生成プログラム。
複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、および
前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
を実行することを特徴とする劣化辞書生成方法。
前記オリジナル文字画像を拡大縮小処理するステップ、
前記拡大縮小処理された文字画像をぼかし処理するステップ、および
前記ぼかし処理された画像を二値化処理するステップ
を実行することを特徴とする付記8に記載の劣化辞書生成方法。
前記拡大縮小処理および前記ぼかし処理を2回以上行うことを特徴とする付記9に記載の劣化辞書生成方法。
前記テスト文字サンプルの特徴を抽出するステップ、
前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
を実行することを特徴とする付記8から付記10のいずれか一項に記載の劣化辞書生成方法。
前記選択された最終劣化辞書の劣化レベルに基づいて、前記テスト文字サンプルセットの劣化レベルを決定するステップ
を実行することを特徴とする付記11に記載の劣化辞書生成方法。
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップを実行するとともに、
前記コンピュータが前記最終劣化辞書を選択する処理を実行する際、前記唯一のフォントを含むテスト文字サンプルセットを用いることにより劣化辞書の選択を行う
ことを特徴とする付記8から付記12のいずれか一項に記載の劣化辞書生成方法。
異なるフォントの複数のフォント辞書を作成するステップ、
前記複数のフォント辞書のそれぞれと前記テスト文字サンプルセットとの間の平均認識距離を計算するステップ、
前記テスト文字サンプルセットから正確に認識されたサンプルを選択するステップ、
前記正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、および
前記テスト文字サンプルセットが唯一のフォントを備えるか否かを前記2つの平均認識距離に基づいて決定するステップ
実行することを特徴とする付記13に記載の劣化辞書生成方法。
前記複数の劣化パラメータに基づいて、複数の劣化辞書をそれぞれ生成する劣化辞書生成手段、および
前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択する辞書適合化手段
を備えることを特徴とする劣化辞書生成装置。
前記オリジナル文字画像を拡大縮小処理し、かつ前記拡大縮小処理された文字画像をぼかし処理する拡大縮小手段、および
前記拡大縮小処理およびぼかし処理された文字画像を二値化処理する二値化手段
を備えることを特徴とする付記15に記載の劣化辞書生成装置。
ことを特徴とする付記16に記載の劣化辞書生成装置。
前記劣化辞書生成手段は、前記特徴抽出手段により抽出された特徴から前記複数の劣化辞書を生成する
ことを特徴とする付記15から付記17のいずれか一項に記載の劣化辞書生成装置。
前記平均認識距離計算手段は、前記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットとの間の平均認識距離を、前記特徴抽出手段により抽出された特徴に基づいて計算し、
前記辞書適合化手段は、前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択する
ことを特徴とする付記15から付記18のいずれか一項に記載の劣化辞書生成装置。
110 拡大縮小部
111 縮小劣化部
112 ズーム劣化部
120 二値化部
200 劣化辞書生成手段
300 辞書適合化手段
310 平均認識距離計算部
400 特徴抽出手段
S301 第1の縮小操作
S302 第1のぼかし操作
S303 第2の縮小操作
S304 第2のぼかし操作
S305 第mの縮小操作
S306 第mのぼかし操作
S401 第1のズーム操作
S402 第1のぼかし操作
S403 第2のズーム操作
S404 第2のぼかし操作
S405 第nのズーム操作
S406 第nのぼかし操作
S901 第1の平均認識距離計算ステップ
S902 出発劣化辞書指定ステップ
S903 現在の平均認識距離計算ステップ
S904 平均認識距離比較ステップ
S905 平均認識距離更新ステップ
S906 インデックス更新ステップ
S907 次の劣化辞書指定ステップ
S908 計算済み劣化辞書個数比較ステップ
S1001 第1のテストサンプル指定ステップ
S1002 認識距離計算ステップ
S1003 計算値合計ステップ
S1004 次のテスト文字サンプル指定ステップ
S1005 テスト文字サンプル個数比較ステップ
S1006 平均認識距離計算ステップ
S1101 第1のサンプル距離計算ステップ
S1102 第2のサンプル指定ステップ
S1103 現在のサンプル距離計算ステップ
S1104 サンプル距離比較ステップ
S1105 サンプル距離更新ステップ
S1106 次のサンプル指定ステップ
S1107 サンプル個数比較ステップ
S1108 認識距離決定ステップ
S1401 テスト文字サンプルセット選択ステップ
S1402 全体的平均認識距離計算ステップ
S1403 正確認識文字サンプル選択ステップ
S1404 平均認識距離計算ステップ
S1405 平均認識距離差計算ステップ
S1406 差比較ステップ
S1407 単一フォント環境判断ステップ
S1408 複数フォント環境判断ステップ
S1409 フォント辞書作成ステップ
Claims (12)
- コンピュータに、
異なるフォントの複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を計算するステップ、
前記テスト文字サンプルセットから正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、
前記2つの平均認識距離の差に基づいて、前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップ、および
前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、複数の劣化パラメータに対応する複数の劣化辞書のなかから、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
を実行させることを特徴とする劣化辞書生成プログラム。 - 前記コンピュータに更に、
複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、
を実行させ、
前記選択するステップは、前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択することを特徴とする請求項1に記載の劣化辞書生成プログラム。 - 前記コンピュータに更に、
前記オリジナル文字画像を拡大縮小処理するステップ、
前記拡大縮小処理された文字画像をぼかし処理するステップ、および
前記ぼかし処理された画像を二値化処理するステップ
を実行させることを特徴とする請求項2に記載の劣化辞書生成プログラム。 - 前記コンピュータに前記劣化辞書を選択するステップを実行させる際、
前記テスト文字サンプルの特徴を抽出するステップ、
前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
を実行させることを特徴とする請求項2または請求項3に記載の劣化辞書生成プログラム。 - コンピュータが、
異なるフォントの複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を計算するステップ、
前記テスト文字サンプルセットから正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算するステップ、
前記2つの平均認識距離の差に基づいて、前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定するステップ、および
前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、複数の劣化パラメータに対応する複数の劣化辞書のなかから、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択するステップ
を実行することを特徴とする劣化辞書生成方法。 - 前記コンピュータが、更に、
複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成するステップ、
前記劣化文字パターンの特徴を抽出することにより、前記複数の劣化パラメータに対応する複数の劣化辞書をそれぞれ確立するステップ、
を実行し、
前記選択するステップは、前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択することを特徴とする請求項5に記載の劣化辞書生成方法。 - 前記コンピュータが、更に、
前記オリジナル文字画像を拡大縮小処理するステップ、
前記拡大縮小処理された文字画像をぼかし処理するステップ、および
前記ぼかし処理された画像を二値化処理するステップ
を実行することを特徴とする請求項6に記載の劣化辞書生成方法。 - 前記コンピュータが、前記劣化辞書を選択するステップを実行する際、
前記テスト文字サンプルの特徴を抽出するステップ、
前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算するステップ、および
前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択するステップ
を実行することを特徴とする請求項6または請求項7に記載の劣化辞書生成方法。 - 異なるフォントの複数のフォント辞書のそれぞれとテスト文字サンプルセットとの間の平均認識距離を計算する第一の平均認識距離計算手段、
前記テスト文字サンプルセットから正確に認識されたサンプルと前記複数のフォント辞書のそれぞれとの間の平均認識距離を計算する第二の平均認識距離計算手段、
前記2つの平均認識距離の差に基づいて、前記テスト文字サンプルセットが唯一のフォントを備えるか否かを決定する決定手段、および
前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、複数の劣化パラメータに対応する複数の劣化辞書のなかから、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択する辞書適合化手段
を備えることを特徴とする劣化辞書生成装置。 - 複数の劣化パラメータに基づいて、オリジナル文字画像から複数の劣化文字パターンを生成する劣化文字パターン生成手段、
前記複数の劣化パラメータに基づいて、複数の劣化辞書をそれぞれ生成する劣化辞書生成手段、
をさらに備え、
前記辞書適合化手段は、前記唯一のフォントを備えると決定されたテスト文字サンプルセットを用いて、前記複数の辞書の1つであって、テスト文字サンプルセットの劣化レベルにもっともよく合致する辞書を最終劣化辞書として選択することを特徴とする請求項9に記載の劣化辞書生成装置。 - 前記劣化文字パターン生成手段は、さらに、
前記オリジナル文字画像を拡大縮小処理し、かつ前記拡大縮小処理された文字画像をぼかし処理する拡大縮小手段、および
前記拡大縮小処理およびぼかし処理された文字画像を二値化処理する二値化手段
を備えることを特徴とする請求項10に記載の劣化辞書生成装置。 - 前記辞書適合化手段は、さらに、
前記テスト文字サンプルの特徴を抽出する抽出手段、
前記抽出された特徴に基づいて、記複数の劣化辞書のそれぞれと前記テスト文字サンプルセットの間の平均認識距離を計算する計算手段、および
前記複数の劣化辞書の1つであって前記テスト文字サンプルセットからの平均認識距離が最小である劣化辞書を最終劣化辞書として選択する選択手段
を備えることを特徴とする請求項10または請求項11に記載の劣化辞書生成装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200410058588.2 | 2004-08-18 | ||
CNB2004100585882A CN100373399C (zh) | 2004-08-18 | 2004-08-18 | 建立劣化字典的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006059351A JP2006059351A (ja) | 2006-03-02 |
JP4806230B2 true JP4806230B2 (ja) | 2011-11-02 |
Family
ID=36033999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005234860A Expired - Fee Related JP4806230B2 (ja) | 2004-08-18 | 2005-08-12 | 劣化辞書生成プログラム、方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7480408B2 (ja) |
JP (1) | JP4806230B2 (ja) |
CN (1) | CN100373399C (ja) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8856108B2 (en) | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US8825682B2 (en) * | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US8838591B2 (en) | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US8195659B2 (en) | 2005-08-23 | 2012-06-05 | Ricoh Co. Ltd. | Integration and use of mixed media documents |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8332401B2 (en) | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US8521737B2 (en) | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US8184155B2 (en) | 2007-07-11 | 2012-05-22 | Ricoh Co. Ltd. | Recognition and tracking using invisible junctions |
US8276088B2 (en) | 2007-07-11 | 2012-09-25 | Ricoh Co., Ltd. | User interface for three-dimensional navigation |
US8335789B2 (en) | 2004-10-01 | 2012-12-18 | Ricoh Co., Ltd. | Method and system for document fingerprint matching in a mixed media environment |
US8369655B2 (en) | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8385589B2 (en) | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US8510283B2 (en) | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US9373029B2 (en) * | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US7970171B2 (en) | 2007-01-18 | 2011-06-28 | Ricoh Co., Ltd. | Synthetic image and video generation from ground truth data |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US8156427B2 (en) * | 2005-08-23 | 2012-04-10 | Ricoh Co. Ltd. | User interface for mixed media reality |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US8144921B2 (en) | 2007-07-11 | 2012-03-27 | Ricoh Co., Ltd. | Information retrieval using invisible junctions and geometric constraints |
US10192279B1 (en) | 2007-07-11 | 2019-01-29 | Ricoh Co., Ltd. | Indexed document modification sharing with mixed media reality |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8600989B2 (en) | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US8201076B2 (en) * | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US8676810B2 (en) | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
RU2445699C1 (ru) * | 2007-11-28 | 2012-03-20 | Люмэкс Ас | Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью |
US8385660B2 (en) | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
US20120134595A1 (en) * | 2009-08-11 | 2012-05-31 | Koninklijke Philips Electronics N.V. | Method and apparatus for providing an image for display |
JP5505007B2 (ja) * | 2010-03-18 | 2014-05-28 | 富士通株式会社 | 画像処理装置、画像処理方法及び画像処理用コンピュータプログラム |
US8792748B2 (en) * | 2010-10-12 | 2014-07-29 | International Business Machines Corporation | Deconvolution of digital images |
CA2826079A1 (en) | 2011-01-31 | 2012-08-09 | Walter Rosenbaum | Method and system for information recognition |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
CN104392015A (zh) * | 2014-08-07 | 2015-03-04 | 贵阳朗玛信息技术股份有限公司 | 一种图像处理方法及装置 |
JP6341059B2 (ja) * | 2014-10-31 | 2018-06-13 | オムロン株式会社 | 文字認識装置、文字認識方法、およびプログラム |
CN106156766B (zh) | 2015-03-25 | 2020-02-18 | 阿里巴巴集团控股有限公司 | 文本行分类器的生成方法及装置 |
EP3343432B1 (en) * | 2016-12-29 | 2024-03-20 | Elektrobit Automotive GmbH | Generating training images for machine learning-based object recognition systems |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60138688A (ja) * | 1983-12-26 | 1985-07-23 | Ricoh Co Ltd | 文字認識方法 |
JPS62282385A (ja) * | 1986-05-31 | 1987-12-08 | Fujitsu Ltd | 文字識別装置 |
US5796410A (en) * | 1990-06-12 | 1998-08-18 | Lucent Technologies Inc. | Generation and use of defective images in image analysis |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
US6389163B1 (en) * | 1994-11-18 | 2002-05-14 | Xerox Corporation | Method and apparatus for automatic image segmentation using template matching filters |
JPH08241378A (ja) * | 1995-03-03 | 1996-09-17 | Fuji Electric Co Ltd | 低品質文字の認識方法 |
JPH096922A (ja) * | 1995-06-20 | 1997-01-10 | Sony Corp | 手書き文字認識装置 |
JP3716519B2 (ja) * | 1996-11-15 | 2005-11-16 | オムロン株式会社 | カメラおよび外部装置ならびに画像処理装置 |
US6453069B1 (en) * | 1996-11-20 | 2002-09-17 | Canon Kabushiki Kaisha | Method of extracting image from input image using reference image |
US6671404B1 (en) * | 1997-02-14 | 2003-12-30 | Hewlett-Packard Development Company, L.P. | Method and apparatus for recognizing patterns |
JPH10240869A (ja) * | 1997-03-03 | 1998-09-11 | Nippon Steel Corp | 文字認識辞書作成装置及び文字認識辞書作成方法 |
JP3574562B2 (ja) * | 1998-03-19 | 2004-10-06 | 日本電信電話株式会社 | 画像内の一連パターンの認識および変形検出方法及びそのプログラムを記録した記録媒体 |
JP3868637B2 (ja) * | 1998-07-01 | 2007-01-17 | 株式会社リコー | 文字認識装置および辞書作成方法および記録媒体 |
US6782129B1 (en) * | 1998-09-23 | 2004-08-24 | Xerox Corporation | Image segmentation apparatus and method |
US6493463B1 (en) * | 1999-09-09 | 2002-12-10 | Xerox Corporation | Segmentation tag cleanup using neighborhood tags |
JP2001331766A (ja) * | 2000-05-23 | 2001-11-30 | Oki Electric Ind Co Ltd | パタン認識辞書の作成方法、コンピュータ読取可能な記録媒体、パタン認識辞書作成装置および文字認識装置 |
US6735337B2 (en) * | 2001-02-02 | 2004-05-11 | Shih-Jong J. Lee | Robust method for automatic reading of skewed, rotated or partially obscured characters |
US6778700B2 (en) * | 2001-03-14 | 2004-08-17 | Electronics For Imaging, Inc. | Method and apparatus for text detection |
JP4421134B2 (ja) * | 2001-04-18 | 2010-02-24 | 富士通株式会社 | 文書画像検索装置 |
JP2003242445A (ja) * | 2002-02-19 | 2003-08-29 | Fujitsu Ltd | ナンバープレート読取装置 |
JP3933496B2 (ja) * | 2002-02-28 | 2007-06-20 | 日本電信電話株式会社 | 文字パターン認識方法及びその認識装置、並びに文字パターン認識プログラム及びそのプログラムを記録した記録媒体 |
US7079686B2 (en) * | 2002-08-20 | 2006-07-18 | Lexmark International, Inc. | Systems and methods for content-based document image enhancement |
-
2004
- 2004-08-18 CN CNB2004100585882A patent/CN100373399C/zh not_active Expired - Fee Related
-
2005
- 2005-08-10 US US11/200,194 patent/US7480408B2/en not_active Expired - Fee Related
- 2005-08-12 JP JP2005234860A patent/JP4806230B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1737824A (zh) | 2006-02-22 |
JP2006059351A (ja) | 2006-03-02 |
CN100373399C (zh) | 2008-03-05 |
US7480408B2 (en) | 2009-01-20 |
US20060056696A1 (en) | 2006-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4806230B2 (ja) | 劣化辞書生成プログラム、方法および装置 | |
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
CN111723585B (zh) | 一种风格可控的图像文本实时翻译与转换方法 | |
CN109377445B (zh) | 模型训练方法、替换图像背景的方法、装置和电子系统 | |
CN113435240B (zh) | 一种端到端的表格检测和结构识别方法及系统 | |
CN116994140A (zh) | 基于遥感影像的耕地提取方法、装置、设备和介质 | |
JP2002024836A (ja) | ディジタルイメージから表題を抽出する方法 | |
CN112070649B (zh) | 一种去除特定字符串水印的方法及系统 | |
JP2008033424A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
CN111553349B (zh) | 一种基于全卷积网络的场景文本定位与识别方法 | |
CN115331245B (zh) | 一种基于图像实例分割的表格结构识别方法 | |
CN116645592B (zh) | 一种基于图像处理的裂缝检测方法和存储介质 | |
CN112597998A (zh) | 一种基于深度学习的扭曲图像矫正方法、装置和存储介质 | |
CN116740528A (zh) | 一种基于阴影特征的侧扫声呐图像目标检测方法及系统 | |
CN103455816B (zh) | 一种笔画宽度提取方法、装置及一种文字识别方法、系统 | |
JPH0256708B2 (ja) | ||
CN114863431A (zh) | 一种文本检测方法、装置及设备 | |
CN112733857B (zh) | 自动分割字符区域的图像文字检测模型训练方法及装置 | |
CN114494786A (zh) | 一种基于多层协调卷积神经网络的细粒度图像分类方法 | |
CN113033559A (zh) | 一种基于目标检测的文本检测方法及装置、存储介质 | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
CN113657214B (zh) | 一种基于Mask RCNN的建筑损伤评估方法 | |
JP2007052782A (ja) | 認識距離を調整するプログラム、装置および方法、ならびに文字列を認識するプログラム | |
CN112232390A (zh) | 一种高像素大图像的识别方法和系统 | |
CN117576416B (zh) | 工件边缘区域的检测方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080619 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110812 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |