JP2007042097A - キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法 - Google Patents
キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法 Download PDFInfo
- Publication number
- JP2007042097A JP2007042097A JP2006207066A JP2006207066A JP2007042097A JP 2007042097 A JP2007042097 A JP 2007042097A JP 2006207066 A JP2006207066 A JP 2006207066A JP 2006207066 A JP2006207066 A JP 2006207066A JP 2007042097 A JP2007042097 A JP 2007042097A
- Authority
- JP
- Japan
- Prior art keywords
- place name
- character
- key character
- recognition
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】住所認識装置、住所認識方法および住所認識プログラムである。当該住所認識処理は、文字分離処理と、キー文字抽出処理と、一括地名認識処理と、住所決定処理とを含む。キー文字抽出処理は、複数の単一文字領域からキー文字を抽出する。単一文字領域の各々に対するキー文字抽出処理は、単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出処理と、特徴ベクトル抽出処理により抽出された特徴ベクトルと、すべてのあり得るキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、すべてのあり得るキー文字候補を検索する照合処理と、照合処理により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定処理と、を含む。
【選択図】 図14
Description
[文字1]
、「路」など)であるか否かを決定する。当該単一文字領域の文字に対する認識候補文字(すなわち、予備的にその領域の文字である可能性があると判断された文字)として、複数のキー文字があった場合、照合距離が最小のキー文字のみを選択して当該単一文字領域を認識する。なお、照合距離とは、入力文字の画像から文字の特徴を抽出した特徴ベクトル(数値列)とあらかじめ特徴辞書に持つ各文字の特徴ベクトルとを比較して得られる距離値を言う。完全一致すれば0になるので、小さいほど両者が近い。照合距離が小さいほど、キー文字と当該文字領域内の画像との類似性が高い。
[文字2]
はキー文字パスである。他方、
[文字1]
は「市」の上位行政単位ではなく、逆に、行政的な意味では「市」が
[文字1]
の上位にあるため、
[文字3]
はキー文字パスではない。地名語領域候補切り出し手段606は、キー文字パスにおける二つのキー文字によって区切られる地名語領域を抽出する。地名語一括認識手段607は、地名語認識辞書608を参照して、地名語を一括認識する。一文字認識手段609は、まず、一文字認識辞書610を参照して、地名でもキー文字でもない部分を入力画像から抽出する。例えば、
[文字4]
という住所からは、建物の名称と建物内での番号、つまり
[文字5]
を抽出する。そして、抽出した部分から複数の文字を切り出し、切り出した文字一つ一つを認識する。住所決定手段611は、住所知識部612内に入力された住所知識を使用し、認識結果と実際の住所とを比較して両者が一致するか否かを調べ、住所の全照合距離が所定の閾値よりも大きいか否かを調べる。所定の閾値よりも大きい場合、この住所の認識結果は信頼できないと判断され、システムはこの認識をリジェクトする。所定の閾値以下の場合、実際の住所と一致した認識結果が最終的に出力される。
[文字6]
であれば、キー文字パスは、「市−区−路」である。この場合、第1のキー文字「市」によって区切られる第1レベル地名領域は「北京」と認識される。次に、第1および第2のキー文字「市−区」によって区切られる地名領域が抽出される。そして、抽出された地名領域全体と、地名語認識辞書608中に記憶されている北京市内の全ての「区」とを照合することで地名領域が認識される。さらに、第3レベル地名照合処理107において、まず、(もし第2および第3のキー文字があれば)第2および第3のキー文字によって区切られる地名領域を切り出す。次に、第2レベルの地名照合結果と地名語認識辞書608とを参照して、切り出された地名領域を認識する。そして、最後のレベルになるまで同様の処理を繰り返す。第Nレベルの地名照合処理108においては、(もし第N−1のキー文字および第Nのキー文字があれば)第N−1のキー文字と第Nのキー文字とによって区切られる地名領域を抽出し、第N−1レベルの地名照合結果と地名語認識辞書608とを参照して、抽出した地名領域を認識する。
[文字7]
となるような状況下では、上記従来方法では、「市」ではなく、
[文字8]
の方が当該単一文字領域のキー文字であると認識される可能性が高いため、システムの精度を低下させる。
[文字6]
という住所文字列が入力されたときに、「市」で区切られた第1レベルの地名が誤って
[文字9]
と照合されてしまうと、第1のキー文字「市」と第2のキー文字「区」とで区切られる実際の地名
[文字10]
は、誤った第1レベルの地名
[文字9]
に含まれる行政単位ではないため、第2レベルの照合結果は常に誤りとなってしまう。さらに、住所が手書き入力された場合、地名の字体は様々に変形し、大きさもまちまちであるため、認識された単語が実際の住所と常に一致するとは限らない。このため、システムの精度が著しく低下してしまう。
(2)Width(CCk) > WCCmedian+ Thwidth_low
(3)Height(CCk) < HCCmedian− Thheight_low
(4)Height(CCk) > HCCmedian+ Thheight_low
ここで、WCCmedianは、全てのWidth(CCi)(i=1,2,...,mcc)から得られる中央値であり、HCCmedianは、全てのHeight(CCi)(i=1,2,...,Mcc)から得られる中央値であり、Thwidth_lowおよびThheight_lowは、予め定められた2つの正の閾値である。中央値の計算の詳細については、非特許文献2を参照されたい。
(条件2)当該位置ポイント上の黒い画素の数は、所定の閾値Thsegよりも少ない。
Pi - Thdelta < C <= Thdelta + Pi
を満足する分離ポイントCおよびiが存在すれば、Cが分離ポイントであると決定される。そして、当該結合要素は、ポイントCにおいて、二つの新しい結合要素に縦方向に切断される。
Pi - Thdelta < C <= Thdelta + Pi
を満足する分離ポイントCおよびiが存在すれば、Cが分離ポイントであると決定される。そして、当該結合要素は、ポイントCにおいて、二つの新しい結合要素に横方向に切断される。
[文字2]
はキー文字パスであるが、
[文字1]
は「市」の上位行政単位ではなく、「市」は行政上の意味で
[文字1]
を包含するものであるから、
[文字3]
はキー文字パスではない。次に、キー文字パスフィルタ手段22が、認識結果中の各キー文字の平均照合距離を抽出する。各キー文字パスは、順次順位付けられる。地名領域抽出および認識においては、平均照合距離が最も小さいK個の文字パスのみについて評価を行う。ここで、Kは、あらかじめ定められた正の整数である。例えば、入力された住所が
[文字11]
である場合、”京”および”市”に対応する画像領域について、「市」がキー文字と認識され、かつ、”区”に対応する画像領域について、「区」がキー文字と認識された場合、キー文字パスは、「市」(”京”)−「区」(”区”)、「市」(”市”)−「区」(”区”)となる。この場合、「市」(”京”)−「区」(”区”)において”京”および”区”が「市」および「区」として認識された場合の平均照合距離と、「市」(”市”)−「区」(”区”)において”市”および”区”が「市」および「区」として認識された場合の平均照合距離とが計算される。キー文字の平均照合距離が大きいほど、それが正しいキー文字パスである可能性は低いため、可能な限り除去せねばならない。このように、本発明の地名領域抽出・認識においては、従来の方法のように全てのキー文字パスを評価する必要はなく、平均照合距離が最小である高順位のK個のキー文字パスを選択するのみでよいため、住所認識の効率および正確性を高めることができる(ただし、Kはあらかじめ定められた正の整数である)。
[文字12]
である。結合要素との照合距離Dis(CCi,Kc)が所定の閾値Thkeyよりも小さいキー文字Kcが存在する場合、当該結合要素は、キー文字の可能性がある候補Kcであると決定される。照合距離Dis(CCi,Kc)は、fCCiとfkeyKcとの間のユークリッド距離と定義される。すなわち、
[Dis(CCi, Kn) − Dis(CCi, K1)] / Dis(CCi, K1) < Thdis_k
ここで、Dis(CCi,Kn)は、キー文字Knと結合要素CCiとの間の照合距離を表し、Thdis_kは、正の定数であり、あらかじめ定められた閾値を表す。このようなキー文字除去方法を用いることにより、第1の文字候補に近いキー文字が保持され、その後のキー文字パス決定および地名照合において評価がなされる。上記の条件を満たさないキー文字がある場合、かかるキー文字の照合距離は第1候補の照合距離とはかなり遠いことを示しているので、当該キー文字が正しいキー文字である可能性は低く、そのようなキー文字は除去される。これにより、キー文字抽出の後は、可能性のある全てのキー文字について評価を行うために地名領域抽出および認識を行う必要はなく、住所認識の効率性および正確性が高められる。
[Dis(cand1k) − Dis(cand11)]/ Dis(cand11) < Thdis
が成立するか、または、その時点での候補が最後の候補であると判定された場合には、ステップSF7に進み、次のレベルの地名認識で使用するために1からk番目の候補を上位の行政単位として保持する。ここで、Dis(Cand1k)は、第1レベルの地名認識におけるk番目の候補の照合距離を表し、照合距離は、キー文字によって区切られた画像と候補との間の非類似度を表す。照合距離の値が小さいほど、その時点で確定されている画像と候補との間の相違は小さい。すなわち、両者はより近い。照合距離の計算については後述する。Thdisは正の定数であり、あらかじめ定められた閾値である。照合距離の値がこの閾値を上回る場合は、すべてその時点で確定されている画像が候補とは著しく異なっていることを示しており、さらに比較する必要はない。さらに、地名候補は照合距離に基づいて並べられているため、その時点の候補について計算された比がThdisを上回れば、続く候補の比も必然的に当該閾値を上回ることになるため、それ以上評価する必要はない。他方、ステップSF5において比が所定の閾値Thdisを上回らないと決定され、かつ、当該候補が最後の候補ではないと判定されれば、ステップSF6においてkの値を増分し、ステップSF4に戻る。
[文字9]
であり、第1のキー文字が「市」、第2のキー文字が「区」である場合、第1のキー文字および第2のキー文字の間の画像と、「北京」市に包含される全ての名前とが可能性のある住所の一つとして照合される。さらに、他の可能性のある住所として、第1のキー文字および第2のキー文字の間の画像と、
[文字9]
市に包含される全ての名前とが照合される。そして、1からNc番目までの可能性のある候補が出力される。
[文字11]
であると仮定する。この場合、キー文字パスは、「市−区」となる。そして、キー文字抽出手段2を用いて、入力された画像から「市−区」パスに含まれるキー文字を抽出する。
[文字9]
、「北京」、
[文字13]
のそれぞれと比較され、それぞれ照合距離は、230、240、310となる。したがって、R1は、「北京」および
[文字13]
よりも
[文字9]
である可能性が高く、かつ、
[文字13]
よりも「北京」である可能性が高いことになる。
[文字13]
と
[文字9]
との照合距離の間の差の
[文字9]
の照合距離に対する比は、(310−230)/230であり、比較的大きい。他方、「北京」と
[文字9]
との照合距離の間の差の
[文字9]
の照合距離に対する比は、(240−230)/230であり、比較的小さい。この場合、
[文字13]
が、R1の実際の地名である可能性は低いため、SR2で除外される。具体的には、あらかじめ定められた閾値が0.25であるとすれば、(310−230)/230>0.25、かつ、(240−230)/230<0.25であるため、
[文字13]
は除外され、
[文字9]
および「北京」はそのまま上位行政単位として使用される。
[文字9]
であれば、地名辞書にもとづいて
[文字9]
に包含されるすべての地区の実際の地名パターンを地名領域R2中の地名と比較し、Nc個の候補を出力する。これらの候補およびその照合距離をSR3に示す。前のレベルが「北京」であれば、地名辞書にもとづいて「北京」に包含されるすべての地区の実際の地名パターンを地名領域R2中の地名と比較し、Nc個の候補を出力する。これらの候補およびその照合距離をSR4に示す。
[文字9]
+
[文字14]
)をそれ以外の他の候補パスと比較した場合、平均照合距離の平均値が最短となるのは「北京」+
[文字10]
であり、その平均照合距離は(240+160)/2=200となる。したがって、
[文字11]
が認識結果として出力される。
Weight(Ai) = (1 − t1) × Rank_ED(Ai)+ t1 × i (2)
式(2)において、Aiは一括地名認識手段4により取得されたi番目の地名候補であり、ED(Ai)はAiの編集距離であり、Rank_ED(Ai)はAiと個別文字認識候補行列との間の編集距離の順位であり、t1はround(ED(Ai))/kに等しく、round(ED(Ai))はED(Ai)を四捨五入することを示す。
[文字15]
である。ここで、第1レベルの地名
[文字16]
がすでに認識され、キー文字
[文字17]
もすでに認識されていると仮定する。(A)に、「二盛一」の画像領域から単一文字領域検出手段1により得られた単一文字領域の個別文字認識結果の例を示す。W1、W2、およびW3は、それぞれ、単一文字領域「二」、「盛」、「一」に対応する認識候補列を示す。候補の数は3と仮定する。(B)に、「二盛一」の画像領域を一括認識することによって得られた地名候補の例を示す。ここで、
[文字16]
市には、
[文字17]
がつく地名は3つしかなく、それらはそれぞれ「二盛」、「二盛一」、「二旺一」であると仮定する。
[文字16]
市の領域に包含され、かつ、
[文字17]
によって区切られるすべての地名(すなわち、「二盛」、「二盛一」、「二旺一」)との間の編集距離を計算する。たとえば、「二盛」とWとの間の最小編集距離は、ダイナミック・プログラミングによって、「二」をW1と照合し、「盛」をW2と照合し、無効文字(NULLとラベリングする)を追加してこれをW3と照合することで計算される。この場合の照合コストは以下のようになる。
Cost("盛", W2) = (1 − 1) / (3 × 3) = 0;
Cost(NULL, W3) = 1.
Cost("二", W1) = (2 − 1) / (3 × 3) = 1 / 9;
Cost("盛", W2) = (1 − 1) / (3 × 3) = 0;
Cost("一", W3) = (2 − 1) / (3 × 3) = 1 / 9.
したがって、Wと「二盛一」との間の編集距離は、1/9+0+1/9=2/9となる。
Cost("二", W1) = (2 − 1) / (3 × 3) = 1 / 9;
Cost("旺", W2) = 1;
Cost("一", W3) = (2 − 1) / (3 × 3) = 1 / 9.
したがって、Wと「二旺一」との間の編集距離は、1/9+1+1/9=11/9となる。
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手順と、
前記特徴ベクトル抽出手順により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手順と、
前記照合手順により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手順と、
をコンピュータに実行させることを特徴とするキー文字抽出プログラム。
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、
前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、
前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、
を含んだことを特徴とするキー文字抽出方法。
前記単一文字領域の各々に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手段と、
あり得るすべてのキー文字のみを記憶するキー文字辞書部と、
前記特徴ベクトル抽出手段により抽出された特徴ベクトルと、前記キー文字辞書部に記憶されたあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手段と、
前記照合手段により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手段と、
を備えたことを特徴とするキー文字抽出装置。
前記一括地名認識手順は、
前記地名画像から特徴ベクトルを抽出する抽出手順と、
前記抽出手順により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合手順と、
をコンピュータに実行させ、
前記地名辞書に記憶された地名のうち、前記抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識手順と、
前記個別文字認識手順により得られた認識結果に基づいて、前記一括地名認識手順により決定された地名候補のフィルタリングをおこなう地名検証手順と、
をコンピュータに実行させることを特徴とする一括地名認識プログラム。
前記一括地名認識工程は、
前記地名画像から特徴ベクトルを抽出する抽出工程と、
前記抽出工程により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合工程と、
を含み、
前記地名辞書に記憶された地名のうち、前記抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識工程と、
前記個別文字認識工程により得られた認識結果に基づいて、前記一括地名認識工程により決定された地名候補のフィルタリングをおこなう地名検証工程と、
を含んだことを特徴とする一括地名認識方法。
入力された地名画像から特徴ベクトルを抽出する抽出手段と、
地名を記憶する地名辞書部と、
前記地名辞書部に記憶された地名の特徴ベクトルと前記抽出手段により抽出された特徴ベクトルとを照合し、あり得るすべての地名候補および照合距離を求め、地名辞書に記憶された地名のうち、前記抽出手段により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定する照合手段と、
降順に並んだ行政レベルの地名を含む複数の地名画像が入力され、当該地名画像の認識により行政レベルの地名を降順に含む複数の住所パスが形成される場合に、複数の住所パス候補の評価および決定をおこなう照合評価手段と、
をさらに備えたことを特徴とする一括地名認識装置。
前記キー文字抽出工程は、
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、
前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、すべてのあり得るキー文字を記憶したキー文字辞書におけるあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、
前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、
を含んだことを特徴とする住所認識方法。
Weight(Ai) = (1 − t1) × Rank_ED(Ai)+ t1 × i
を用いることにより重みを算出する工程と、算出された重みに基づいて前記一括地名認識工程により得られた地名候補をフィルタリングする工程とを含み、Aiは前記一括地名認識工程により得られたi番目の地名候補であり、ED(Ai)はAiの編集距離であり、Rank_ED(Ai)は編集距離の順位であり、t1はround(ED(Ai))/kに等しく、round(ED(Ai))はED(Ai)の四捨五入演算を意味し、kは前記地名画像における単一文字領域の総数であり、weight(Ai)はi番目の地名候補の重みを意味することを特徴とする付記40に記載の住所認識方法。
2 キー文字抽出手段
3 地名領域抽出手段
4 一括地名認識手段
5 地名検証手段
6 リジェクト手段
16 キー文字パス選択手段
20 キー文字候補抽出手段
21 キー文字パス決定手段
22 キー文字パスフィルタ手段
24 住所階層構造知識部
27 地名照合手段
28 地名候補評価手段
29 再帰的照合評価手段
34 結合要素ラベリング手段
35 単一文字領域候補決定手段
36 平均文字サイズ計算手段
37 画素投影手段
38 一時的分離ポイント候補抽出手段
39 一時的分離ポイント候補決定手段
41 キー文字辞書部
42 特徴抽出手段
43 辞書照合手段
44 キー文字候補決定手段
54 地名辞書部
55 編集距離計算手段
58 一括認識・個別文字認識組み合わせ手段
59 単一文字辞書部
61 特徴抽出手段
62 辞書照合手段
63 特徴抽出手段
64 リジェクト決定手段
65 リジェクト学習手段
69 個別文字認識手段
E1 単一文字地名認識手段
Claims (10)
- 複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出プログラムであって、
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手順と、
前記特徴ベクトル抽出手順により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手順と、
前記照合手順により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手順と、
をコンピュータに実行させることを特徴とするキー文字抽出プログラム。 - 前記キー文字辞書は、行政区域レベルを表す文字の組を記憶したことを特徴とする請求項1に記載のキー文字抽出プログラム。
- 前記照合手順は、前記キー文字辞書に含まれるあり得るキー文字であって、前記特徴ベクトル抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応するあり得るキー文字をキー文字候補として決定することを特徴とする請求項1に記載のキー文字抽出プログラム。
- 複数の単一文字領域からキー文字を抽出するキー文字抽出装置であって、
前記単一文字領域の各々に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手段と、
あり得るすべてのキー文字のみを記憶するキー文字辞書部と、
前記特徴ベクトル抽出手段により抽出された特徴ベクトルと、前記キー文字辞書部に記憶されたあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手段と、
前記照合手段により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手段と、
を備えたことを特徴とするキー文字抽出装置。 - 複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出方法であって、
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、
前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、
前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、
を含んだことを特徴とするキー文字抽出方法。 - ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識手順をコンピュータに実行させる一括地名認識プログラムであって、
前記一括地名認識手順は、
前記地名画像から特徴ベクトルを抽出する抽出手順と、
前記抽出手順により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合手順と、
をコンピュータに実行させ、
前記地名辞書に記憶された地名のうち、前記抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識手順と、
前記個別文字認識手順により得られた認識結果に基づいて、前記一括地名認識手順により決定された地名候補のフィルタリングをおこなう地名検証手順と、
をコンピュータに実行させることを特徴とする一括地名認識プログラム。 - 前記一括地名認識手順は、前記照合手順によりあり得る地名候補が複数得られた場合に、所定のルールに従って複数のあり得る地名候補をフィルタリングする地名候補評価手順をさらにコンピュータに実行させることを特徴とする請求項6に記載の一括地名認識プログラム。
- 前記所定のルールは、複数のあり得る地名候補を照合距離に基づいて順位付けし、順位付けにより第1位となったあり得る地名候補を第1地名候補とした場合に、地名候補の照合距離と第1地名候補の照合距離との間の差の第1地名候補の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離である地名候補のみを選択するルールであることを特徴とする請求項7に記載の一括地名認識プログラム。
- 一括地名認識装置であって、
入力された地名画像から特徴ベクトルを抽出する抽出手段と、
地名を記憶する地名辞書部と、
前記地名辞書部に記憶された地名の特徴ベクトルと前記抽出手段により抽出された特徴ベクトルとを照合し、あり得るすべての地名候補および照合距離を求め、地名辞書に記憶された地名のうち、前記抽出手段により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定する照合手段と、
降順に並んだ行政レベルの地名を含む複数の地名画像が入力され、当該地名画像の認識により行政レベルの地名を降順に含む複数の住所パスが形成される場合に、複数の住所パス候補の評価および決定をおこなう照合評価手段と、
をさらに備えたことを特徴とする一括地名認識装置。 - ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識工程を含む一括地名認識方法であって、
前記一括地名認識工程は、
前記地名画像から特徴ベクトルを抽出する抽出工程と、
前記抽出工程により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合工程と、
を含み、
前記地名辞書に記憶された地名のうち、前記抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識工程と、
前記個別文字認識工程により得られた認識結果に基づいて、前記一括地名認識工程により決定された地名候補のフィルタリングをおこなう地名検証工程と、
を含んだことを特徴とする一括地名認識方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100895370A CN100555308C (zh) | 2005-07-29 | 2005-07-29 | 地址识别装置和方法 |
CN200510089537.0 | 2005-07-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007042097A true JP2007042097A (ja) | 2007-02-15 |
JP5217127B2 JP5217127B2 (ja) | 2013-06-19 |
Family
ID=37674166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006207066A Expired - Fee Related JP5217127B2 (ja) | 2005-07-29 | 2006-07-28 | 一括地名認識プログラム、一括地名認識装置および一括地名認識方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5217127B2 (ja) |
CN (1) | CN100555308C (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008243208A (ja) * | 2007-03-27 | 2008-10-09 | Fujitsu Ltd | 住所認識装置 |
JP2018060474A (ja) * | 2016-10-07 | 2018-04-12 | 富士通株式会社 | 地名抽出プログラム、地名抽出装置および地名抽出方法 |
JP2020187622A (ja) * | 2019-05-16 | 2020-11-19 | 株式会社Pfu | 情報処理装置、制御方法及び制御プログラム |
CN113111229A (zh) * | 2020-02-13 | 2021-07-13 | 北京明亿科技有限公司 | 基于正则表达式的接处警文本轨迹地地址提取方法和装置 |
CN113111230A (zh) * | 2020-02-13 | 2021-07-13 | 北京明亿科技有限公司 | 基于正则表达式的接处警文本户籍地地址提取方法和装置 |
JP2021149531A (ja) * | 2020-03-19 | 2021-09-27 | 株式会社Pfu | 情報処理装置、修正候補表示方法、及びプログラム |
JP2022533065A (ja) * | 2020-04-16 | 2022-07-21 | シェンチェン センスタイム テクノロジー カンパニー リミテッド | 文字認識方法及び装置、電子機器並びに記憶媒体 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101359254B (zh) * | 2007-08-03 | 2011-06-15 | 北京搜狗科技发展有限公司 | 一种提高姓名词条输入效率的字符输入方法和系统 |
US8275600B2 (en) * | 2008-10-10 | 2012-09-25 | Google Inc. | Machine learning for transliteration |
US20140037219A1 (en) * | 2011-05-17 | 2014-02-06 | Panasonic Corporation | Character string extraction method and character string extraction device |
CN103854021A (zh) * | 2012-11-29 | 2014-06-11 | 北京千橡网景科技发展有限公司 | 词语识别方法及装置 |
CN104731978B (zh) * | 2015-04-14 | 2018-03-09 | 海量云图(北京)数据技术有限公司 | 中文姓名数据的发现与分类方法 |
CN107133215A (zh) * | 2017-05-20 | 2017-09-05 | 复旦大学 | 一种脱机手写中文规范地址识别方法 |
CN109359186B (zh) * | 2018-10-25 | 2020-12-08 | 杭州时趣信息技术有限公司 | 一种确定地址信息的方法、装置和计算机可读存储介质 |
CN113111233B (zh) * | 2020-02-13 | 2024-04-12 | 北京明亿科技有限公司 | 基于正则表达式的接处警文本居住地地址提取方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03257693A (ja) * | 1990-03-08 | 1991-11-18 | N T T Data Tsushin Kk | 文字認識結果修正方式 |
JPH08129614A (ja) * | 1994-10-28 | 1996-05-21 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH08287188A (ja) * | 1995-04-17 | 1996-11-01 | Nec Corp | 文字列認識装置 |
JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
JPH11272803A (ja) * | 1998-01-22 | 1999-10-08 | Fujitsu Ltd | 住所認識装置及び住所認識方法 |
JP2000306045A (ja) * | 1999-04-21 | 2000-11-02 | Fujitsu Ltd | 単語認識装置 |
-
2005
- 2005-07-29 CN CNB2005100895370A patent/CN100555308C/zh not_active Expired - Fee Related
-
2006
- 2006-07-28 JP JP2006207066A patent/JP5217127B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03257693A (ja) * | 1990-03-08 | 1991-11-18 | N T T Data Tsushin Kk | 文字認識結果修正方式 |
JPH08129614A (ja) * | 1994-10-28 | 1996-05-21 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH08287188A (ja) * | 1995-04-17 | 1996-11-01 | Nec Corp | 文字列認識装置 |
JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
JPH11272803A (ja) * | 1998-01-22 | 1999-10-08 | Fujitsu Ltd | 住所認識装置及び住所認識方法 |
JP2000306045A (ja) * | 1999-04-21 | 2000-11-02 | Fujitsu Ltd | 単語認識装置 |
Non-Patent Citations (2)
Title |
---|
JPN6011062242; 'セグメンテーションの負荷を軽減した手書き住所認識' 信学技報 PRMU98-161(1998-12) , 19981218 * |
JPN6012031292; CHRISTOPHER J.C. BURGES: 'A Tutorial on Support Vector Machines for Pattern Recognition' Data Mining and Knowledge Discovery 第2巻, 1998, 第121〜167頁, Kluwer Academic Publishers * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008243208A (ja) * | 2007-03-27 | 2008-10-09 | Fujitsu Ltd | 住所認識装置 |
JP2018060474A (ja) * | 2016-10-07 | 2018-04-12 | 富士通株式会社 | 地名抽出プログラム、地名抽出装置および地名抽出方法 |
JP2020187622A (ja) * | 2019-05-16 | 2020-11-19 | 株式会社Pfu | 情報処理装置、制御方法及び制御プログラム |
CN113111229A (zh) * | 2020-02-13 | 2021-07-13 | 北京明亿科技有限公司 | 基于正则表达式的接处警文本轨迹地地址提取方法和装置 |
CN113111230A (zh) * | 2020-02-13 | 2021-07-13 | 北京明亿科技有限公司 | 基于正则表达式的接处警文本户籍地地址提取方法和装置 |
CN113111230B (zh) * | 2020-02-13 | 2024-04-12 | 北京明亿科技有限公司 | 基于正则表达式的接处警文本户籍地地址提取方法和装置 |
CN113111229B (zh) * | 2020-02-13 | 2024-04-12 | 北京明亿科技有限公司 | 基于正则表达式的接处警文本轨迹地地址提取方法和装置 |
JP2021149531A (ja) * | 2020-03-19 | 2021-09-27 | 株式会社Pfu | 情報処理装置、修正候補表示方法、及びプログラム |
JP7421384B2 (ja) | 2020-03-19 | 2024-01-24 | 株式会社Pfu | 情報処理装置、修正候補表示方法、及びプログラム |
JP2022533065A (ja) * | 2020-04-16 | 2022-07-21 | シェンチェン センスタイム テクノロジー カンパニー リミテッド | 文字認識方法及び装置、電子機器並びに記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
CN100555308C (zh) | 2009-10-28 |
CN1904906A (zh) | 2007-01-31 |
JP5217127B2 (ja) | 2013-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5217127B2 (ja) | 一括地名認識プログラム、一括地名認識装置および一括地名認識方法 | |
US20210034849A1 (en) | System and method of character recognition using fully convolutional neural networks with attention | |
US10936862B2 (en) | System and method of character recognition using fully convolutional neural networks | |
JP3639126B2 (ja) | 住所認識装置及び住所認識方法 | |
EP1362322B1 (en) | Holistic-analytical recognition of handwritten text | |
CN109800414B (zh) | 语病修正推荐方法及系统 | |
Awal et al. | First experiments on a new online handwritten flowchart database | |
KR100249055B1 (ko) | 문자인식장치및방법 | |
KR100716594B1 (ko) | 문자 식별 | |
JP2008532176A (ja) | 認識グラフ | |
US20120070073A1 (en) | Searching document images | |
WO2018090011A1 (en) | System and method of character recognition using fully convolutional neural networks | |
CN101645134B (zh) | 整体地名识别方法和整体地名识别装置 | |
CN115510500B (zh) | 一种文本内容的敏感分析方法及系统 | |
Pal et al. | A lexicon driven method for unconstrained Bangla handwritten word recognition | |
JP2003524258A (ja) | 電子ドキュメントを処理する方法および装置 | |
JP5003051B2 (ja) | 郵便自動区分機及び郵便自動区分方法 | |
CN113642320A (zh) | 文档目录结构的提取方法、装置、设备和介质 | |
JPH11203415A (ja) | 類似パターンカテゴリ識別辞書作成装置および方法 | |
Pal et al. | Handwritten street name recognition for Indian postal automation | |
JPH11328317A (ja) | 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体 | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
JP2020102207A (ja) | 受取人アドレスを認識する装置及び方法 | |
JP3975825B2 (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
CN112651590A (zh) | 一种指令处理流程推荐的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090409 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160315 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |