JP4418726B2 - 文字列探索装置、探索方法およびこの方法のプログラム - Google Patents
文字列探索装置、探索方法およびこの方法のプログラム Download PDFInfo
- Publication number
- JP4418726B2 JP4418726B2 JP2004289881A JP2004289881A JP4418726B2 JP 4418726 B2 JP4418726 B2 JP 4418726B2 JP 2004289881 A JP2004289881 A JP 2004289881A JP 2004289881 A JP2004289881 A JP 2004289881A JP 4418726 B2 JP4418726 B2 JP 4418726B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- characters
- search
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
・長さLの文字列から抽出される文字ペアの個数:A=LC2
・M個の候補文字集合中に存在する、文字ペアと文字カテゴリが一致する全ての2個の候補文字の組の数の期待値:B=(M/全認識対象カテゴリ数)2
の積に比例するため、従来の探索方法での処理量がMCLに比例するのに比べて処理量を非常に小さくするもので、以下の装置、方法およびプログラムを特徴とする。
(1)画像に対する注目位置および注目サイズを変更しながら、注目する領域と複数カテゴリの文字認識辞書との距離を算出する文字走査処理を行い、この文字走査処理により得られた候補文字集合に対して、探索を指定された文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索処理する文字列探索装置において、
前記探索を指定された文字列の任意の2個の文字に対応する候補文字のペアについて、2個の文字の文字位置から前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票手段と、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納手段と、
前記投票空間格納手段によりまとまったもののうち、探索文字列の文字数から定まる所定数以上の候補文字があるものを抽出する候補点群作成手段と、
前記候補点群作成手段で抽出された候補文字の中から、なるべく直線的に並ぶ候補文字に絞る候補点選択手段とを備えたことを特徴とする。
前記候補文字集合に含まれる候補文字を互いに比較し、解像度と空間的距離が近い候補文字の集合を選択し、該集合の中で相対的に認識結果の距離値が大きい候補文字を削除する候補文字絞込み手段と、
前記探索を指定された文字列から、該文字列の前から後の方向に存在する全ての2個の文字の組である文字ペアを選び、各々の文字ペアに対して前記候補文字集合中から文字カテゴリが一致する全ての2個の候補文字の組を探索する処理を行い、該処理の結果探索された全ての2個の候補文字の組に対して、前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票手段と、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納手段と、
前記投票空間格納手段によりまとまった固まりのうち、記録された回数が探索を指定された文字列の長さ別に指定された閾値を越える固まりを抽出し、各抽出された固まりに対して、当該固まりに含まれる全ての候補文字の情報のリストである候補文字・文字位置リストを作成し、当該固まりに含まれる全ての候補文字の前記先頭文字の座標位置、および前記文字間ピッチの平均値を算出して候補文字・文字位置リストに記入する処理を行う候補点群作成手段と、
前記候補点群作成手段が作成した候補文字・文字位置リストに対して、それに含まれる前記平均値から、探索を指定された文字列の全ての文字位置に該当する画像中の座標を仮想座標として算出し、該候補文字・文字位置リストに、同一の文字位置の複数の候補文字が含まれる場合には、該文字位置に該当する前記仮想座標とのユークリッド距離が最小の候補文字を残して他を削除する処理を行なう候補点選択手段とを備えたことを特徴とする。
複数の単語を含む単語辞書と、
前記候補文字絞込み手段によって得られる候補文字集合について、前記単語辞書中の単語の各々に対して、該単語を探索文字列として該探索文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索する処理を行い、該処理結果に該単語の文字数から定まる所定数以上の候補文字が存在する全ての単語について、各々の該探索処理における前記候補点選択手段の処理結果の情報を該単語と共にまとめて出力する単語辞書制御手段とを備えたことを特徴とする。
(4)画像に対する注目位置および注目サイズを変更しながら、注目する領域と複数カテゴリの文字認識辞書との距離を算出する文字走査処理を行い、この文字走査処理により得られた候補文字集合に対して、探索を指定された文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索処理する文字列探索方法において、
前記探索を指定された文字列の任意の2個の文字に対応する候補文字のペアについて、2個の文字の文字位置から前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票ステップと、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納ステップと、
前記投票空間格納ステップによりまとまったもののうち、探索文字列の文字数から定まる所定数以上の候補文字があるものを抽出する候補点群作成ステップと、
前記候補点群作成ステップで抽出された候補文字の中から、なるべく直線的に並ぶ候補文字に絞る候補点選択ステップとを備えたことを特徴とする。
前記候補文字集合に含まれる候補文字を互いに比較し、解像度と空間的距離が近い候補文字の集合を選択し、該集合の中で相対的に認識結果の距離値が大きい候補文字を削除する候補文字絞込みステップと、
前記探索を指定された文字列から、該文字列の前から後の方向に存在する全ての2個の文字の組である文字ペアを選び、各々の文字ペアに対して前記候補文字集合中から文字カテゴリが一致する全ての2個の候補文字の組を探索する処理を行い、該処理の結果探索された全ての2個の候補文字の組に対して、前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票ステップと、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納ステップと、
前記投票空間格納ステップによりまとまった固まりのうち、記録された回数が探索を指定された文字列の長さ別に指定された閾値を越える固まりを抽出し、各抽出された固まりに対して、当該固まりに含まれる全ての候補文字の情報のリストである候補文字・文字位置リストを作成し、当該固まりに含まれる全ての候補文字の前記先頭文字の座標位置、および前記文字間ピッチの平均値を算出して候補文字・文字位置リストに記入する処理を行う候補点群作成ステップと、
前記候補点群作成ステップが作成した候補文字・文字位置リストに対して、それに含まれる前記平均値から、探索を指定された文字列の全ての文字位置に該当する画像中の座標を仮想座標として算出し、該候補文字・文字位置リストに、同一の文字位置の複数の候補文字が含まれる場合には、該文字位置に該当する前記仮想座標とのユークリッド距離が最小の候補文字を残して他を削除する処理を行なう候補点選択ステップとを備えたことを特徴とする。
複数の単語を含む単語辞書と、
前記候補文字絞込みステップによって得られる候補文字集合について、前記単語辞書中の単語の各々に対して、該単語を探索文字列として該探索文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索する処理を行い、該処理結果に該単語の文字数から定まる所定数以上の候補文字が存在する全ての単語について、各々の該探索処理における前記候補点選択ステップの処理結果の情報を該単語と共にまとめて出力する単語辞書制御ステップとを備えたことを特徴とする。
(プログラムの発明)
(7)上記の(1)〜(6)のいずれか1項に記載の文字列探索装置または探索方法における処理手順をコンピュータで実行可能に構成したことを特徴とする。
・M個の候補文字集合中に存在する、文字ペアと文字カテゴリが一致する全ての2個の候補文字の組の数の期待値:B=(M/全認識対象カテゴリ数)2
また、請求項3等によれば、画像に対してメタデータとして単語及び該単語が存在する場所の情報を付与することが可能となる。
(1)候補文字絞込み手段
文字列探索には、最初に、候補文字絞込み手段1での処理が行なわれる。候補文字絞込み手段1は様々な構成が考えられるが、本実施形態では説明のために、図2に示す構成をとる。単一解像度候補文字絞込み手段11は、候補文字集合を画像の解像度別に分け、各々の候補文字集合の中で絞込みを行なう処理である。それに対して、複数解像度候補文字絞込み手段12は、全ての解像度の候補文字集合に対して絞込みを行なう処理である。本実施形態ではこの2つの手段を直列に接続して候補文字を絞込む。
(1)2つの候補文字の文字カテゴリが一致するか否か
(2)2つの候補文字の中心座標のユークリッド距離の近さ
(3)2つの候補文字の大きさの近さ
の3つの「近さ」を総合判断して決定する。総合判断の方法は様々に考えられるが、ここでは例として、(3)は無視して、(1)の文字カテゴリが一致し、かつ(2)のユークリッド距離が一定の閾値(この例では40)以下である場合に、F1は「近い」と判断し、それ以外の場合は「遠い」と判断するものとし、その結果が図14と図15であり、途中経過を示すのが図13である。
(2)投票手段
候補文字絞込みの終了で、投票手段2の処理に移る。投票手段2は、探索キー(探索文字列)の2つの文字要素を取り出して、文字要素と候補のカテゴリが一致する組み合わせを求める。そして、文字の方向(縦書き、横書き)や文字間隔から適切な候補の組み合わせだけを残す。この処理はあらゆる2つの文字要素について行う。
(A1)文字列の中心位置座標の配列を規定する4つのパラメータ値(a,b,c,d)の計算。
(B1)パラメータ値(a,b,c,d)から、投票空間格納手段3に登録するための座標ベクトル(Ra,Rb,Rc,Rd)を算出。
(C1)各々の候補点R1とR2の組み合わせの可否を判定する関数(組み合わせ判定関数)を適用。
(D1)組み合わせ判定関数が合格と判定した組み合わせを投票空間格納手段3に追加。
の4つの処理を行なう。なお(B1)におけるRa,Rb,Rc,Rdは、それぞれa,b,c,dの概値として算出される値である。また、(C1)における「R1とR2」は、集合PGMから抽出した1個の「候補点」と、集合PGNから抽出した1個の「候補点」を意味する。
b:仮想的な開始点のY座標
c:仮想的なX方向のピッチ(仮想的ピッチベクトルのX成分)
d:仮想的なY方向のピッチ(仮想的ピッチベクトルのY成分)
これらを説明する模式図を図18に示す。これは図17における番号=11、(m,n)=(2、3)のレコードを用いた時の模式図である。このレコードには、集合PGMから取り出した候補点R1=(カテゴリ=話、X1=160、Y1=190、窓の大きさ=50、距離374、単語内文字位置=2、PID=9)と、集合PGNから取り出した候補点R2=(カテゴリ=会、X2=230、Y2=170、窓の大きさ=50、距離=450、単語内文字位置=3、PID=5)が存在する。
d=(Y2−Y1)/(j−i)
a=X1−c×(i−1)
b=Y1−d×(i−1)
図18の各レコードに対して上記の式により(a,b,c,d)を計算した結果を図19に示す。
Ra=a/Ca (Caは定数) 小数点1位を四捨五入
Rb=b/Cb (Cbは定数) 小数点1位を四捨五入
Rc=c/Cc (Ccは定数) 小数点1位を四捨五入
Rd=d/Cd (Cdは定数) 小数点1位を四捨五入
の演算で算出する。Ca,Cb,Cc,Cdは例として、60、60、90、90を用いる。ここで、Ca,Cb,Cc,Cdはそれぞれ、a,b,c,dを概値にするための値であり、同一文字列上に存在する候補文字のペアができるだけ同一の(Ra,Rb,Rc,Rd)ベクトルの値をとるように、かつ同一文字列上に存在しない候補文字のペアができるだけ同一の(Ra,Rb,Rc,Rd)ベクトルの値をとらないような大きさに調整する。図19に対してこの処理を行なった結果を図20に示す。
・α=仮想ピッチベクトルの角度(角度の取り方については図22(a)を参照)
・Ps=(c×c+d×d)0.5/{0.5×(R2の「大きさ」+R1の「大きさ」)}
そして、組み合わせ判定関数は、
s1<s<s2 かつ α∈α1 かつ Ps1<ps<Ps2
の条件を満足した時に「組み合わせ可」、満足しない時に「組み合わせ不可」とする。上式において、s1とs2はsの範囲を表す数値で、本実施形態ではs1=0.8、s2=1.2を用いる。また、Ps1とPs2はPsの範囲を表す数値で、本実施形態ではPs1=0.9、Ps2=3.0を用いる。
(3)投票空間格納手段
投票空間格納手段3は、2つの候補の組み合わせを、さらに組み合わせて整合するものを選択する。つまり、始点位置の概数(Ra,Rb)とピッチの概数(Rc,Rd)が一致すれば整合すると判定する。
・(1、0、1、2)、(0、0、1、2)、(2、0、1、2)、(1、−1、1、2)、(1、1、1、2)
・(0、0、1、2)、(−1、0、1、2)、(1、0、1、2)(0、−1、1、2)、(0、1、1、2)
に投票し、(0、0、1、2)と(1、0、1、2)の(Rc,Rd,Ra,Rb)を持つインデクスには、正しい組み合わせのレコードの「アドレス格納部」のアドレスが全て書き込まれることとなる。
(4)候補点群作成手段
投票空間格納処理の終了で、候補点群作成手段4の処理に移る。候補点群作成手段4は、探索キー(探索文字列)の文字数により、投票空間格納手段3の処理で所定文字数以上の固まりになったものを選択する。
単語長=1は扱わない。
単語長=3の場合:許容する最大欠落文字数=0
単語長=4の場合:許容する最大欠落文字数=1
単語長=5の場合:許容する最大欠落文字数=1
単語長=6の場合:許容する最大欠落文字数=2
単語長=7の場合:許容する最大欠落文字数=2
単語長≧8の場合:許容する最大欠落文字数=単語長×一定数(例:0.2)を小数点1位切り上げ(例えば単語長=8では、8×0.2=1.6→2)
とする。
(単語長−許容する最大欠落文字数)×(単語長−許容する最大欠落文字数−1)÷2
で計算する。すると、本実施形態における「電話会社」の単語長は4なので、閾値は「3」となる。すなわち、インデクス格納手段の中から「投票数」が3以上のインデクスを残らず抽出する。この場合、図25のインデクス格納手段において「投票数」が3以上のインデクスは、(Rc,Rd,Ra,Rb)=(1、0、1、2)のレコードだけでありこれが抽出される。
(5)候補点選択手段
候補点群作成手段4の処理の終了で、候補点選択手段5の処理に移る。候補点選択手段5は、候補点で重複するものは除いて、最後は候補の座標位置から1つに絞り込む。
Xei=a0+c0(i−1)、Yei=b0+d0(i−1)
で計算する。従って、i=1の場合には、Xel=81.3、Yel=195となる。
(6)他の実施形態
図31に本発明の請求項3等に対応する実施形態例を示す。図31の中で、個別の要素1〜5は図1の実施形態のものと同一である。以下、図31の動作を具体的に説明する。
単語長=3の場合:許容する最大欠落文字数=0
単語長=4の場合:許容する最大欠落文字数=1
単語長=5の場合:許容する最大欠落文字数=1
単語長=6の場合:許容する最大欠落文字数=2
単語長=7の場合:許容する最大欠落文字数=2
単語長≧8の場合:許容する最大欠落文字数=単語長×一定数(例:0.2)を小数点1位切り上げ(例えば単語長=8では、8×0.2=1.6→2)
単語番号=1である単語「電話会社」の単語長は4であり、この場合の最大欠落文字数は1であるが、図30(a)の結果では欠落文字数は0であることから、この単語は採用される。
2 投票手段
3 投票空間格納手段
4 候補点群作成手段
5 候補点選択手段
11 単一解像度候補文字絞込み手段
12 複数解像度候補文字絞込み手段
61 単語辞書
62 単語辞書制御手段
100 キーワード付与手段
200 画像蓄積手段
201 画像撮影手段
300 文字走査処理手段
400 キーワード検索手段
401 機械翻訳手段
402 キーワードによる情報検索手段
500 キーワード蓄積手段
501 結果表示手段
Claims (7)
- 画像に対する注目位置および注目サイズを変更しながら、注目する領域と複数カテゴリの文字認識辞書との距離を算出する文字走査処理を行い、この文字走査処理により得られた候補文字集合に対して、探索を指定された文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索処理する文字列探索装置において、
前記探索を指定された文字列の任意の2個の文字に対応する候補文字のペアについて、2個の文字の文字位置から前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票手段と、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納手段と、
前記投票空間格納手段によりまとまったもののうち、探索文字列の文字数から定まる所定数以上の候補文字があるものを抽出する候補点群作成手段と、
前記候補点群作成手段で抽出された候補文字の中から、なるべく直線的に並ぶ候補文字に絞る候補点選択手段と、
を備えたことを特徴とする文字列探索装置。 - 画像に対する注目位置および注目サイズを変更しながら、注目する領域と複数カテゴリの文字認識辞書との距離を算出する文字走査処理を行い、この文字走査処理により得られた候補文字集合に対して、探索を指定された文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索処理する文字列探索装置において、
前記候補文字集合に含まれる候補文字を互いに比較し、解像度と空間的距離が近い候補文字の集合を選択し、該集合の中で相対的に認識結果の距離値が大きい候補文字を削除する候補文字絞込み手段と、
前記探索を指定された文字列から、該文字列の前から後の方向に存在する全ての2個の文字の組である文字ペアを選び、各々の文字ペアに対して前記候補文字集合中から文字カテゴリが一致する全ての2個の候補文字の組を探索する処理を行い、該処理の結果探索された全ての2個の候補文字の組に対して、前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票手段と、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納手段と、
前記投票空間格納手段によりまとまった固まりのうち、記録された回数が探索を指定された文字列の長さ別に指定された閾値を越える固まりを抽出し、各抽出された固まりに対して、当該固まりに含まれる全ての候補文字の情報のリストである候補文字・文字位置リストを作成し、当該固まりに含まれる全ての候補文字の前記先頭文字の座標位置、および前記文字間ピッチの平均値を算出して候補文字・文字位置リストに記入する処理を行う候補点群作成手段と、
前記候補点群作成手段が作成した候補文字・文字位置リストに対して、それに含まれる前記平均値から、探索を指定された文字列の全ての文字位置に該当する画像中の座標を仮想座標として算出し、該候補文字・文字位置リストに、同一の文字位置の複数の候補文字が含まれる場合には、該文字位置に該当する前記仮想座標とのユークリッド距離が最小の候補文字を残して他を削除する処理を行なう候補点選択手段と、
を備えたことを特徴とする文字列探索装置。 - 請求項2に記載の文字列探索装置において、
複数の単語を含む単語辞書と、
前記候補文字絞込み手段によって得られる候補文字集合について、前記単語辞書中の単語の各々に対して、該単語を探索文字列として該探索文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索する処理を行い、該処理結果に該単語の文字数から定まる所定数以上の候補文字が存在する全ての単語について、各々の該探索処理における前記候補点選択手段の処理結果の情報を該単語と共にまとめて出力する単語辞書制御手段と、
を備えたことを特徴とする文字列探索装置。 - 画像に対する注目位置および注目サイズを変更しながら、注目する領域と複数カテゴリの文字認識辞書との距離を算出する文字走査処理を行い、この文字走査処理により得られた候補文字集合に対して、探索を指定された文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索処理する文字列探索方法において、
前記探索を指定された文字列の任意の2個の文字に対応する候補文字のペアについて、2個の文字の文字位置から前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票ステップと、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納ステップと、
前記投票空間格納ステップによりまとまったもののうち、探索文字列の文字数から定まる所定数以上の候補文字があるものを抽出する候補点群作成ステップと、
前記候補点群作成ステップで抽出された候補文字の中から、なるべく直線的に並ぶ候補文字に絞る候補点選択ステップと、
を備えたことを特徴とする文字列探索方法。 - 画像に対する注目位置および注目サイズを変更しながら、注目する領域と複数カテゴリの文字認識辞書との距離を算出する文字走査処理を行い、この文字走査処理により得られた候補文字集合に対して、探索を指定された文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索処理する文字列探索方法において、
前記候補文字集合に含まれる候補文字を互いに比較し、解像度と空間的距離が近い候補文字の集合を選択し、該集合の中で相対的に認識結果の距離値が大きい候補文字を削除する候補文字絞込みステップと、
前記探索を指定された文字列から、該文字列の前から後の方向に存在する全ての2個の文字の組である文字ペアを選び、各々の文字ペアに対して前記候補文字集合中から文字カテゴリが一致する全ての2個の候補文字の組を探索する処理を行い、該処理の結果探索された全ての2個の候補文字の組に対して、前記候補文字のペアで想定される文字列における先頭文字の座標位置と文字間ピッチを求め、2つの候補文字の大きさの関係が所定の範囲内で、かつ、前記文字間ピッチで定まる文字の並びの方向が決められた方向の範囲内で、かつ、候補文字の大きさと前記文字間ピッチの関係が所定の範囲内という条件を満足するものだけを選ぶ投票ステップと、
前記候補文字のペアについて、その先頭文字の座標位置を定数で調整した始点の概値が一致し、かつ、文字間ピッチを定数で調整したピッチの概値が一致するものをまとめる投票空間格納ステップと、
前記投票空間格納ステップによりまとまった固まりのうち、記録された回数が探索を指定された文字列の長さ別に指定された閾値を越える固まりを抽出し、各抽出された固まりに対して、当該固まりに含まれる全ての候補文字の情報のリストである候補文字・文字位置リストを作成し、当該固まりに含まれる全ての候補文字の前記先頭文字の座標位置、および前記文字間ピッチの平均値を算出して候補文字・文字位置リストに記入する処理を行う候補点群作成ステップと、
前記候補点群作成ステップが作成した候補文字・文字位置リストに対して、それに含まれる前記平均値から、探索を指定された文字列の全ての文字位置に該当する画像中の座標を仮想座標として算出し、該候補文字・文字位置リストに、同一の文字位置の複数の候補文字が含まれる場合には、該文字位置に該当する前記仮想座標とのユークリッド距離が最小の候補文字を残して他を削除する処理を行なう候補点選択ステップと、
を備えたことを特徴とする文字列探索方法。 - 請求項5に記載の文字列探索方法において、
複数の単語を含む単語辞書と、
前記候補文字絞込みステップによって得られる候補文字集合について、前記単語辞書中の単語の各々に対して、該単語を探索文字列として該探索文字列を構成する文字が一定のピッチで直線状に並んでいる個所を探索する処理を行い、該処理結果に該単語の文字数から定まる所定数以上の候補文字が存在する全ての単語について、各々の該探索処理における前記候補点選択ステップの処理結果の情報を該単語と共にまとめて出力する単語辞書制御ステップと、
を備えたことを特徴とする文字列探索方法。 - 請求項1〜6のいずれか1項に記載の文字列探索装置または探索方法における処理手順をコンピュータで実行可能に構成したことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004289881A JP4418726B2 (ja) | 2004-10-01 | 2004-10-01 | 文字列探索装置、探索方法およびこの方法のプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004289881A JP4418726B2 (ja) | 2004-10-01 | 2004-10-01 | 文字列探索装置、探索方法およびこの方法のプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006106931A JP2006106931A (ja) | 2006-04-20 |
JP4418726B2 true JP4418726B2 (ja) | 2010-02-24 |
Family
ID=36376629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004289881A Expired - Fee Related JP4418726B2 (ja) | 2004-10-01 | 2004-10-01 | 文字列探索装置、探索方法およびこの方法のプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4418726B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8611661B2 (en) * | 2007-12-26 | 2013-12-17 | Intel Corporation | OCR multi-resolution method and apparatus |
JP5414631B2 (ja) * | 2010-06-28 | 2014-02-12 | 日本電信電話株式会社 | 文字列探索方法、文字列探索装置、記録媒体 |
US8611662B2 (en) * | 2011-11-21 | 2013-12-17 | Nokia Corporation | Text detection using multi-layer connected components with histograms |
JP5831420B2 (ja) | 2012-09-28 | 2015-12-09 | オムロン株式会社 | 画像処理装置および画像処理方法 |
CN113792739B (zh) * | 2021-08-25 | 2023-05-30 | 电子科技大学 | 一种通用型车牌文本识别方法 |
-
2004
- 2004-10-01 JP JP2004289881A patent/JP4418726B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006106931A (ja) | 2006-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
US20200065601A1 (en) | Method and system for transforming handwritten text to digital ink | |
JP7044898B2 (ja) | ナンバープレート認識方法、および、そのシステム | |
CN110032998B (zh) | 自然场景图片的文字检测方法、系统、装置和存储介质 | |
EP1598770B1 (en) | Low resolution optical character recognition for camera acquired documents | |
JPH05217019A (ja) | ビジネスフォーム識別システム及び画像処理システム | |
WO2010092952A1 (ja) | パターン認識装置 | |
JP2012123845A (ja) | 連続する記事部分の媒体資料解析 | |
JP3943638B2 (ja) | Ocrを利用しない文書画像中のドロップワードの自動認識方法 | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN113011144B (zh) | 表单信息的获取方法、装置和服务器 | |
CN103577818A (zh) | 一种图像文字识别的方法和装置 | |
CN110852311A (zh) | 一种三维人手关键点定位方法及装置 | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
WO2001054054A9 (en) | Word recognition using silhouette bar codes | |
CN115240213A (zh) | 表格图像识别方法、装置、电子设备及存储介质 | |
CN111090817A (zh) | 书籍扩展信息的展示方法、电子设备及计算机存储介质 | |
CN111488732A (zh) | 一种变形关键词检测方法、系统及相关设备 | |
US20150139547A1 (en) | Feature calculation device and method and computer program product | |
JP4418726B2 (ja) | 文字列探索装置、探索方法およびこの方法のプログラム | |
CN115131693A (zh) | 文本内容识别方法、装置、计算机设备和存储介质 | |
JP5414631B2 (ja) | 文字列探索方法、文字列探索装置、記録媒体 | |
CN110689063B (zh) | 一种基于神经网络的证件识别的训练方法及装置 | |
CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JP5278093B2 (ja) | 記事関連情報提供方法、装置、プログラム、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070214 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090925 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091130 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121204 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121204 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131204 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |