JP2007042097A - キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法 - Google Patents

キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法 Download PDF

Info

Publication number
JP2007042097A
JP2007042097A JP2006207066A JP2006207066A JP2007042097A JP 2007042097 A JP2007042097 A JP 2007042097A JP 2006207066 A JP2006207066 A JP 2006207066A JP 2006207066 A JP2006207066 A JP 2006207066A JP 2007042097 A JP2007042097 A JP 2007042097A
Authority
JP
Japan
Prior art keywords
place name
character
key character
recognition
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006207066A
Other languages
English (en)
Other versions
JP5217127B2 (ja
Inventor
Shochiku Ko
▲升▼竹 黄
Shun Son
俊 孫
Yoshinobu Hotta
悦伸 堀田
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2007042097A publication Critical patent/JP2007042097A/ja
Application granted granted Critical
Publication of JP5217127B2 publication Critical patent/JP5217127B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】効率よく、高い精度で、信頼性ある住所認識を行うこと。
【解決手段】住所認識装置、住所認識方法および住所認識プログラムである。当該住所認識処理は、文字分離処理と、キー文字抽出処理と、一括地名認識処理と、住所決定処理とを含む。キー文字抽出処理は、複数の単一文字領域からキー文字を抽出する。単一文字領域の各々に対するキー文字抽出処理は、単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出処理と、特徴ベクトル抽出処理により抽出された特徴ベクトルと、すべてのあり得るキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、すべてのあり得るキー文字候補を検索する照合処理と、照合処理により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定処理と、を含む。
【選択図】 図14

Description

本発明は、キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法に関し、特に、枠のない領域内に手書きされた文字から住所を読み取って認識するキー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法に関する。
従来、二つの手書き住所認識方法が提案されている。
第1の従来方法においては、まず、入力された住所画像から複数の単一文字領域(すなわち、文字を一つだけ含む領域)を抽出する。次に、当該複数の単一文字領域からキー文字を抽出する(手書き住所認識においては、キー文字とは、省、区、州、市、町、郡、丁、村等の、行政区域を表すことができる一文字を指す。)。そして、連続したキー文字二つで区切られる地名領域を検出した後、地名領域内の文字を一つ一つ切り出し、切り出した文字を一つずつ認識する。これによって、地名領域内の地名が認識される。
しかし、上記第1の従来方法では、手書きされた住所の文字を一つ一つ分離する際、しばしばエラーが発生するという問題があった。特に、枠のない領域内に、文字が互いに接触した状態で住所が書かれている場合、この方法では認識ができない可能性があった。手書き文字は形が整えられておらず、また、ばらつきも大きいため、かかる不都合がしばしば発生していた。
第2の従来方法においても、まず切り出し文字を抽出し、連続したキー文字二つで区切られる地名領域を検出する。第2の従来方法が第1の従来方法と異なるのは、地名領域内の地名を一括認識する点である。
図1は、第2の従来方法の処理を詳細に示すブロック図である。図1に示すように、文字切り出し手段601は、入力された住所画像からすべてのあり得る単一文字領域を切り出す。キー文字抽出手段602は、キー文字辞書603を参照して、あり得る単一文字領域の各々を認識し、当該単一文字領域内の文字がキー文字(例えば、「省」、「市」、
[文字1]
Figure 2007042097
、「路」など)であるか否かを決定する。当該単一文字領域の文字に対する認識候補文字(すなわち、予備的にその領域の文字である可能性があると判断された文字)として、複数のキー文字があった場合、照合距離が最小のキー文字のみを選択して当該単一文字領域を認識する。なお、照合距離とは、入力文字の画像から文字の特徴を抽出した特徴ベクトル(数値列)とあらかじめ特徴辞書に持つ各文字の特徴ベクトルとを比較して得られる距離値を言う。完全一致すれば0になるので、小さいほど両者が近い。照合距離が小さいほど、キー文字と当該文字領域内の画像との類似性が高い。
キー文字組決定手段604は、住所階層構造知識部605に基づいて、すべての可能性のあるキー文字候補をキー文字パスとして組み合わせる。各キー文字パスにおいては、前にあるキー文字は後ろにあるどのキー文字よりも法的に上位にある行政単位である、という要件が満たされねばならない。例えば、
[文字2]
Figure 2007042097
はキー文字パスである。他方、
[文字1]
Figure 2007042097
は「市」の上位行政単位ではなく、逆に、行政的な意味では「市」が
[文字1]
Figure 2007042097
の上位にあるため、
[文字3]
Figure 2007042097
はキー文字パスではない。地名語領域候補切り出し手段606は、キー文字パスにおける二つのキー文字によって区切られる地名語領域を抽出する。地名語一括認識手段607は、地名語認識辞書608を参照して、地名語を一括認識する。一文字認識手段609は、まず、一文字認識辞書610を参照して、地名でもキー文字でもない部分を入力画像から抽出する。例えば、
[文字4]
Figure 2007042097
という住所からは、建物の名称と建物内での番号、つまり
[文字5]
Figure 2007042097
を抽出する。そして、抽出した部分から複数の文字を切り出し、切り出した文字一つ一つを認識する。住所決定手段611は、住所知識部612内に入力された住所知識を使用し、認識結果と実際の住所とを比較して両者が一致するか否かを調べ、住所の全照合距離が所定の閾値よりも大きいか否かを調べる。所定の閾値よりも大きい場合、この住所の認識結果は信頼できないと判断され、システムはこの認識をリジェクトする。所定の閾値以下の場合、実際の住所と一致した認識結果が最終的に出力される。
図2は、地名語一括認識処理を示す。第1レベル地名照合処理105において、まず、第1のキー文字により区切られた地名領域を切り出し、地名語認識辞書608を使用して切り出された地名領域の地名を一括認識する。次に、第2レベル地名照合処理106で、第1のキー文字および(もし第2のキー文字があれば)第2のキー文字によって区切られた地名領域を切り出し、第1レベルの地名照合結果と図1に示す地名語認識辞書608とを参照して切り出された地名領域を認識する。例えば、実際に入力された住所が
[文字6]
Figure 2007042097
であれば、キー文字パスは、「市−区−路」である。この場合、第1のキー文字「市」によって区切られる第1レベル地名領域は「北京」と認識される。次に、第1および第2のキー文字「市−区」によって区切られる地名領域が抽出される。そして、抽出された地名領域全体と、地名語認識辞書608中に記憶されている北京市内の全ての「区」とを照合することで地名領域が認識される。さらに、第3レベル地名照合処理107において、まず、(もし第2および第3のキー文字があれば)第2および第3のキー文字によって区切られる地名領域を切り出す。次に、第2レベルの地名照合結果と地名語認識辞書608とを参照して、切り出された地名領域を認識する。そして、最後のレベルになるまで同様の処理を繰り返す。第Nレベルの地名照合処理108においては、(もし第N−1のキー文字および第Nのキー文字があれば)第N−1のキー文字と第Nのキー文字とによって区切られる地名領域を抽出し、第N−1レベルの地名照合結果と地名語認識辞書608とを参照して、抽出した地名領域を認識する。
米国特許第6535619(B1)号明細書 Bob Fisher, Simon Perkins, Ashley Walker and Erik Wolfart, "Hypermedia Image Processing Reference",[online], Department of Artificial Intelligence, University of Edinburgh, UK, インターネット<URL: http://www.cee.hw.ac.uk/hipr/html/label.html> Qiuqi RUAN, "Mathematical ImageProcessing", the Publishing House of the Electronics Industry, page 325 E. Ukkonen, "On approximate atring matching", Proc. Int. Conf. on Foundations ofComp. Theory, Springer-Verlag, LNCS 158 p 487-495,1983 S.B.Needleman and C.D.Wunsch,"A general method applicable to the search for similarities in the aminoacid sequence of two proteins", Journal Molec.Biol. 48 p 443-453, 1970 Christopher J.C. Burges, "A Tutorialon Support Vector Machines for Pattern Recognition, Data Mining and KnowledgeDiscovery", volume 2, No 2, pages 121-167, 1998.
上に説明した従来方法の問題点の一つは、正しいキー文字が全く抽出されなかった場合には認識も失敗するため、システムの精度が低下するという点である。具体的には、キー文字抽出においては、上記従来方法には二つの問題点が存在する。まず、(1)図1の一文字認識手段609は、全ての単一文字領域と一文字認識辞書中の全ての文字(中国語の単語に関する限り、使用される漢字は数千個存在する)とを照合するため、キー文字認識において不可避的にエラーが発生し、それによってシステムの認識精度が低下する。次に、(2)キー文字抽出手段602は、認識候補中に出現した照合距離が最小の切り出し文字をキー文字として認識するにすぎないため、一定の状況下ではキー文字認識において不可避的にエラーが発生する。例えば、ある単一文字領域内の画像が実際には「市」に対応するものの、照合距離に従って単語を並べると認識候補列が
[文字7]
Figure 2007042097
となるような状況下では、上記従来方法では、「市」ではなく、
[文字8]
Figure 2007042097
の方が当該単一文字領域のキー文字であると認識される可能性が高いため、システムの精度を低下させる。
さらに、従来方法には次のような問題点もある。従来方法のような順次処理構造は、先行するいずれかの地名認識が失敗している場合には機能しない。より具体的には、後続のモジュールは先行するモジュールに大幅に依存する。先行するレベルでの地名認識が失敗すると、それに続く地名認識は常に誤りとなる。例えば、第1レベル地名照合105で正しい結果が出力されなかった場合、仮に、
[文字6]
Figure 2007042097
という住所文字列が入力されたときに、「市」で区切られた第1レベルの地名が誤って
[文字9]
Figure 2007042097
と照合されてしまうと、第1のキー文字「市」と第2のキー文字「区」とで区切られる実際の地名
[文字10]
Figure 2007042097
は、誤った第1レベルの地名
[文字9]
Figure 2007042097
に含まれる行政単位ではないため、第2レベルの照合結果は常に誤りとなってしまう。さらに、住所が手書き入力された場合、地名の字体は様々に変形し、大きさもまちまちであるため、認識された単語が実際の住所と常に一致するとは限らない。このため、システムの精度が著しく低下してしまう。
さらに、上記従来方法には次のような問題点もある。手書き入力住所の質がまちまちであるという特異な性質のために、固定された閾値を用いて認識結果をリジェクトすると、住所の読み取りエラーが発生する。具体的には、閾値として小さな値を設定すると、上記従来方法では、質が低い住所に対する認識結果の大部分が拒絶されてしまう一方、閾値として大きな値を設定すると、質が高い住所に対する認識結果の大部分が承認されてしまう。このためシステムの信頼性が著しく損なわれる。
本発明の第1の目的は、効率よく住所認識を行うことができる住所認識装置を提供することである。
本発明の第2の目的は、高い精度で住所認識を行うことができる住所認識装置を提供することである。
本発明の第3の目的は、信頼性のある住所認識を行うことができる住所認識装置を提供することである。
上記の目的を達成するため、本発明は、複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出プログラムであって、前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手順と、前記特徴ベクトル抽出手順により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手順と、前記照合手順により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手順と、をコンピュータに実行させることを特徴とする。
また、本発明は、複数の単一文字領域からキー文字を抽出するキー文字抽出装置であって、前記単一文字領域の各々に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手段と、あり得るすべてのキー文字のみを記憶するキー文字辞書部と、前記特徴ベクトル抽出手段により抽出された特徴ベクトルと、前記キー文字辞書部に記憶されたあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手段と、前記照合手段により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手段と、を備えたことを特徴とする。
また、本発明は、複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出方法であって、前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、を含んだことを特徴とする。
また、本発明は、ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識手順をコンピュータに実行させる一括地名認識プログラムであって、前記一括地名認識手順は、前記地名画像から特徴ベクトルを抽出する抽出手順と、前記抽出手順により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合手順と、をコンピュータに実行させ、前記地名辞書に記憶された地名のうち、前記抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識手順と、前記個別文字認識手順により得られた認識結果に基づいて、前記一括地名認識手順により決定された地名候補のフィルタリングをおこなう地名検証手順と、をコンピュータに実行させることを特徴とする。
前記一括地名認識手順は、個別文字認識手順と、地名検証手順とを含むことが望ましい。
また、本発明は、ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識工程を含む一括地名認識方法であって、前記一括地名認識工程は、前記地名画像から特徴ベクトルを抽出する抽出工程と、前記抽出工程により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合工程と、を含み、前記地名辞書に記憶された地名のうち、前記抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識工程と、前記個別文字認識工程により得られた認識結果に基づいて、前記一括地名認識工程により決定された地名候補のフィルタリングをおこなう地名検証工程と、を含んだことを特徴とする。
前記一括地名認識方法は、個別文字認識工程と、地名検証工程とを含むことが望ましい。
また、本発明は、一括地名認識装置であって、入力された地名画像から特徴ベクトルを抽出する抽出手段と、地名を記憶する地名辞書部と、前記地名辞書部に記憶された地名の特徴ベクトルと前記抽出手段により抽出された特徴ベクトルとを照合し、あり得るすべての地名候補および照合距離を求め、地名辞書に記憶された地名のうち、前記抽出手段により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定する照合手段と、降順に並んだ行政レベルの地名を含む複数の地名画像が入力され、当該地名画像の認識により行政レベルの地名を降順に含む複数の住所パスが形成される場合に、複数の住所パス候補の評価および決定をおこなう照合評価手段と、をさらに備えたことを特徴とする。
また、本発明は、ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識工程を含む一括地名認識方法であって、前記一括地名認識工程は、前記地名画像から特徴ベクトルを抽出する抽出工程と、前記抽出工程により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合工程と、を含み、前記地名辞書に記憶された地名のうち、前記抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識工程と、前記個別文字認識工程により得られた認識結果に基づいて、前記一括地名認識工程により決定された地名候補のフィルタリングをおこなう地名検証工程と、を含んだことを特徴とする。
また、本発明は、単一文字領域を分離する文字分離工程、前記文字分離工程により分離された単一文字領域の各々に対してキー文字を抽出するキー文字抽出工程、前記キー文字抽出工程によるキー文字の抽出結果に基づいて地名を一括して認識する一括地名認識工程、前記一括地名認識工程による地名認識結果に基づいて住所を決定する住所決定工程、を含んだ住所認識方法であって、前記キー文字抽出工程は、前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、すべてのあり得るキー文字を記憶したキー文字辞書におけるあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、を含んだことを特徴とする。
本発明の特徴の一つによれば、キー文字認識において、本発明は(M個のキー文字のみを含む)キー文字辞書とのみ比較を行う。これにより処理量が減り、認識精度が高まる。さらに、キー文字認識時に、結合パターンの評価結果の候補リストに一つだけキー文字がある場合には、あり得るキー文字候補の1つとして当該結合パターンを出力する。さらに、結合パターンがL(L<=M)個のあり得るキー文字候補を含んでいる場合には、L個のあり得るキー文字候補が出力される。したがって、例えば、結合パターンに二つのキー文字候補(「省」および「市」)が含まれている場合、当該結合パターンについては、「省」および「市」という二つの可能性のあるキー文字が出力される。これによって、正しいキー文字が失われる危険性が減り、住所認識の正確性が高まる。また、1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するので、従来の方法のように全てのキー文字パスを評価する必要はなく、平均照合距離が最小である高順位のK個のキー文字パスを選択するのみでよいため、住所認識の効率および正確性を高めることができる。
本発明の他の特徴によれば、地名検証方法が提供され、この地名検証方法では、一括地名認識による地名領域の認識結果と、当該地名から単一文字を切り出して一つ一つを認識した結果とが組み合わされ、一括地名認識の結果がフィルタリングされる。この方法では、個別文字認識の結果と実際の地名との間の編集距離を定義することにより、一括地名認識結果と個別文字認識結果とを効率的に組み合わせて検証をおこなう。一括地名認識が多数の同様の地名を区別できない場合に通常の認識では両者を別々に扱っており、住所認識の正確性が高まる。
本発明のさらに他の特徴によれば、あるレベルの地名認識を行う場合、第1の候補から第Mの候補にいたる候補が生成され得る。当該レベルの認識結果が実際の地名と一致しなかった場合、後続のレベルの地名認識もエラーとなり、照合距離の大きいM個の候補を出力してしまう。したがって、地名認識によって照合距離の大きい候補が生成された場合、その前のレベルの地名認識が誤っている可能性が極めて高い。よって、最終レベルから第1レベルへのフィードバック処理がおこなわれる。すなわち、後のレベルの認識結果を前のレベルで発生したエラーを訂正するために使用する。これにより、住所認識の精度が高まる。本発明のさらに他の特徴によれば、全ての候補を評価しなくとも、フィードバック処理を伴う地名認識を行うことができるため、地名認識の効率および正確性が著しく高まる。また、降順に並んだ行政レベルの地名を含む複数の地名画像が入力され、当該地名画像の認識により行政レベルの地名を降順に含む複数の住所パスが形成される場合に、複数の住所パス候補の評価および決定をおこなうので、住所認識の信頼性を高めることができる。
以下に、図面を参照して、本発明の住所認識方法および住所認識装置を詳細に説明する。図面中、同一または類似の構成要素には同一の参照番号を付す。
図3は、本発明の実施例に係る住所認識装置を示すブロック図である。図3において、単一文字領域検出手段1は、入力された住所画像から単一文字を1つずつ切り出す。単一文字の各画像領域を、単一文字領域と呼ぶ。キー文字抽出手段2は、単一文字領域検出手段1の結果に従い、キー文字を抽出する。次に、地名領域抽出手段3は、キー文字抽出手段2により抽出されたキー文字にもとづき、地名領域を抽出する。一括地名認識手段4は、地名領域抽出手段3が抽出した地名領域を再帰的に一括認識する。単一文字地名認識手段E1は、単一文字領域検出手段1から出力された文字を、地名領域抽出手段3が抽出した地名領域内の地名と対応付けて認識する。地名検証手段5は、一括地名認識手段4および単一文字地名認識手段E1が出力した地名認識結果を検証し決定する。リジェクト手段6は、地名認識結果をリジェクトするか承認するかを決定する。
具体的には、認識対象である住所画像が入力されると、まず、単一文字領域検出手段1が、入力された住所画像から複数の単一文字領域を切り出す。単一文字領域を切り出した後、キー文字抽出手段2が単一文字領域の各々を認識し、キー文字を抽出する。キー文字を抽出した後、地名領域抽出手段3が、キー文字によって区切られた領域を入力画像から分離し、次に、一括地名認識手段4が、キー文字によって区切られた領域の特徴ベクトルと、地名辞書中の地名の特徴ベクトルとを照合し、照合距離が所定の閾値よりも小さい地名候補を地名候補列としてそれぞれ取得する。ここで、照合距離とは、キー文字により区切られた画像と、地名候補との非類似度を示すものである。照合距離の値が小さいほど、その時点で決定されている画像と地名候補との相違が少ないことになる。すなわち、両者はより類似していることになる。照合距離の計算については後述する。同時に、地名候補列中の各地名候補の照合距離と地名候補の最小の照合距離との間の差の、地名候補の最小の照合距離に対する比を順次見積もる。見積もった比が所定の閾値よりも大きい場合、その地名候補は当該画像と著しく相違すると判断され、その地名候補は除外される。したがって、本発明では、すべての地名候補を評価する必要がない。すなわち、決定されている画像と地名候補とが著しく異なっていれば、さらに比較を行う必要はないため(詳しくは図5および図6の説明を参照)、認識時間が短縮される。この時、単一文字地名認識手段E1および地名検証手段5を使用し、個別文字認識結果と一括地名認識結果とを組み合わせることにより、一括認識された地名をフィルタリングすることができる。同様に、異なったレベルの地名領域が一つずつ認識される。多くの場合、地名認識における第1地名候補は通常誤りであり、他の地名候補が正しい結果となる。したがって、対応する各パスの照合距離を順次計算し、平均照合距離が最も小さいパスを見つけ、当該パスを最終的な地名パスと決定する。このように、本発明において用いられる多候補再帰認識によって、認識の正確さが向上する。加えて、平均照合距離が最も小さいパスに近いパスが複数ある場合には、単一文字地名認識手段E1と地名検証手段5とを使用し、個別文字認識結果と一括地名認識結果とを組み合わせることにより、当該地名画像に対して一括認識された地名候補のうち当該複数のパスと食い違う地名候補をフィルタリングすることができる。
単一文字地名認識手段E1は、キー文字により区切られた領域内に存在し、かつ、単一文字領域検出手段1により得られた単一文字領域の特徴を抽出し、抽出した特徴と単一文字辞書内の文字の特徴とを順次比較して認識する。地名が認識された後、地名検証手段5は、一括地名認識結果と個別文字認識結果とを組み合わせ、認識結果を最終的にチェックする。これによって、単一文字領域認識結果と再帰的一括認識結果とが組み合わされ、認識の正確さが向上する。
図3の各手段を以下順番に説明する。
図4は、図3の単一文字領域検出手段1を示すブロック図である。
図4において、結合要素ラベリング手段34は、結合要素検出アルゴリズムによって、入力画像中の結合要素をすべてラベリングする(非特許文献1を参照)。結合要素とは、画像中の(通常、黒である)文字表示色の画素ポイントの集合である。当該集合中の画素によって、当該集合中の任意の2つの画素ポイントを結合することができる。
単一文字領域候補決定手段35は、ラベリングされた結合要素のサイズ、ラベリングされた結合要素の位置、および隣接する要素からの距離等に基づいて、対応する結合要素を統合して、新しい結合要素にする。新しい結合要素は、単一文字領域候補である。例えば、入力された住所画像が横向きに書かれていた場合、結合要素Aが結合要素Bの上に位置していれば、BとAとは同一の文字に属するはずであるので、BとAとは新しい結合要素に統合されねばならない。結合要素の統合の詳細については、特許文献1の図11A、図11B、および図11Cならびに特許文献1の記述を参照されたい。
平均文字サイズ計算手段36は、単一文字領域候補決定手段35により得られた新しい結合要素中、明らかに異常なサイズの結合要素を除去し、残りの結合要素および文字の平均サイズを計算する。ここで、CCi(i=1,2,...,mcc)が、単一文字領域候補決定手段35により得られたmcc個の結合要素のすべてを表し、Width(CCi)が、結合要素CCiの幅を表し、Height(CCi)がその高さを表すとすれば、以下の条件(1)〜(4)のいずれか一つを満たすCCkはすべて除去される。
(1)Width(CCk) < WCCmedian− Thwidth_low
(2)Width(CCk) > WCCmedian+ Thwidth_low
(3)Height(CCk) < HCCmedian− Thheight_low
(4)Height(CCk) > HCCmedian+ Thheight_low
ここで、WCCmedianは、全てのWidth(CCi)(i=1,2,...,mcc)から得られる中央値であり、HCCmedianは、全てのHeight(CCi)(i=1,2,...,Mcc)から得られる中央値であり、Thwidth_lowおよびThheight_lowは、予め定められた2つの正の閾値である。中央値の計算の詳細については、非特許文献2を参照されたい。
画素投影手段37は、(画像が横方向に書かれている場合は)入力された住所画像を縦方向に投影し、(画像が縦方向に書かれている場合は)入力された住所画像を横方向に投影する。縦方向(または横方向)画像投影によって、横方向(または縦方向)の画像の各ポイントの黒い画素の数が得られる。
一時的分離ポイント候補抽出手段38および一時的分離ポイント候補決定手段39は、単一文字領域候補決定手段35から出力された新しい結合要素を実際の文字領域に分離するために使用される。すなわち、結合文字を個々の単一文字に分離するために使用される。
画素投影手段37により得られる黒い画素の数にしたがって、一時的分離ポイント候補抽出手段38は、以下の二つの条件を満たす位置ポイントを一時的分離ポイント候補として抽出する。これらの位置ポイントは、結合文字の分離ポイントとなる可能性のあるポイントである。
(条件1)位置ポイントは、投影によって得られた黒い画素の数のヒストグラムにおいて最小値をとるポイントである。
(条件2)当該位置ポイント上の黒い画素の数は、所定の閾値Thsegよりも少ない。
分離ポイント候補の抽出は、例えば、特許文献1に記載の方法を用いて行うことができる。
一時的分離ポイント候補決定手段39は、一時的分離ポイント候補抽出手段38から得られる一時的分離ポイントが隣りあった文字領域の真の分離ポイントであるか否かを決定する。
入力された文字パターンが横向きに書かれている場合は、分離される結合要素のいずれについても、当該結合要素の開始位置から平均文字幅の2分の1の倍数に相当する位置に隣接する領域内に位置する一時的分離ポイント候補が、分離ポイントとして決定される。具体的には、Pi(0<i<s:iは正の整数)を当該結合要素の開始位置から平均文字幅の2分の1の倍数に相当する地点にある位置ポイントとした場合に、
Pi - Thdelta < C <= Thdelta + Pi
を満足する分離ポイントCおよびiが存在すれば、Cが分離ポイントであると決定される。そして、当該結合要素は、ポイントCにおいて、二つの新しい結合要素に縦方向に切断される。
入力された文字パターンが縦向きに書かれている場合は、分離される結合要素のいずれについても、当該結合要素の開始位置から平均文字幅の2分の1の倍数に相当する位置に隣接する領域内に位置する一時的分離ポイント候補が、分離ポイントとして決定される。具体的には、Pi(0<i<s:iは正の整数)を当該結合要素の開始位置から平均文字幅の2分の1の倍数に相当する地点にある位置ポイントとした場合に、
Pi - Thdelta < C <= Thdelta + Pi
を満足する分離ポイントCおよびiが存在すれば、Cが分離ポイントであると決定される。そして、当該結合要素は、ポイントCにおいて、二つの新しい結合要素に横方向に切断される。
図5は、本発明の実施の形態に係るキー文字抽出手段2を示すブロック図である。
図5において、キー文字候補抽出手段20は、単一文字領域検出手段1から入力された単一文字領域(または結合要素)からキー文字候補を抽出する。キー文字パス決定手段21は、住所階層構造知識部24を参照し、妥当なキー文字パスを決定する。ここで、住所階層構造知識部24とは、地名の階層知識を提供することができるデータベースまたはプログラム等である。キー文字パスフィルタ手段22は、複数のキー文字パスを記憶し、各パス中のキー文字の平均照合距離(すなわち、様々なレベルの地名の照合距離の合計と住所レベルの数との比)を計算し、全てのパスを昇順に(小さいものから大きいものの順に)並べ、最後に、より高順位のK個のキー文字パスを最終キー文字パスとして選択する。ここで、Kはあらかじめ定められた正の整数である。
具体的には、認識のために住所画像が入力されたとき、まず入力された住所画像から結合要素が抽出され、次にキー文字候補抽出手段20が、当該結合要素からキー文字を抽出する(詳細については、以下の図6の説明を参照)。キー文字を抽出した後、キー文字パス決定手段21が、地名階層知識と適合するキー文字パスを決定する。決定されたキー文字パスは、キー文字の順序を記述するもので、先行するキー文字は後続のキー文字の上位の行政単位となっている。例えば、
[文字2]
Figure 2007042097
はキー文字パスであるが、
[文字1]
Figure 2007042097
は「市」の上位行政単位ではなく、「市」は行政上の意味で
[文字1]
Figure 2007042097
を包含するものであるから、
[文字3]
Figure 2007042097
はキー文字パスではない。次に、キー文字パスフィルタ手段22が、認識結果中の各キー文字の平均照合距離を抽出する。各キー文字パスは、順次順位付けられる。地名領域抽出および認識においては、平均照合距離が最も小さいK個の文字パスのみについて評価を行う。ここで、Kは、あらかじめ定められた正の整数である。例えば、入力された住所が
[文字11]
Figure 2007042097
である場合、”京”および”市”に対応する画像領域について、「市」がキー文字と認識され、かつ、”区”に対応する画像領域について、「区」がキー文字と認識された場合、キー文字パスは、「市」(”京”)−「区」(”区”)、「市」(”市”)−「区」(”区”)となる。この場合、「市」(”京”)−「区」(”区”)において”京”および”区”が「市」および「区」として認識された場合の平均照合距離と、「市」(”市”)−「区」(”区”)において”市”および”区”が「市」および「区」として認識された場合の平均照合距離とが計算される。キー文字の平均照合距離が大きいほど、それが正しいキー文字パスである可能性は低いため、可能な限り除去せねばならない。このように、本発明の地名領域抽出・認識においては、従来の方法のように全てのキー文字パスを評価する必要はなく、平均照合距離が最小である高順位のK個のキー文字パスを選択するのみでよいため、住所認識の効率および正確性を高めることができる(ただし、Kはあらかじめ定められた正の整数である)。
図6は、本発明の実施の形態に係るキー文字候補抽出手段20のブロック図である。
特徴抽出手段42は、単一文字領域検出手段1から入力された結合要素(すなわち、単一文字領域)に対応する画像から特徴ベクトルを抽出する。辞書照合手段43は、キー文字辞書部41を参照して、特徴抽出手段42から出力された特徴ベクトルと、キー文字辞書部41中のキー文字の特徴ベクトルとを照合し、可能性のあるキー文字を候補として出力する。キー文字候補決定手段44は、これら選択されたキー文字候補が真のキー文字であるか否かを決定する。
具体的には、単一文字領域検出手段1から結合要素が入力されると、まず、特徴抽出手段42が、結合要素の特徴を抽出する。次に、辞書照合手段43が、これらの結合要素の画像から抽出された(fCCiとラベリングされた)特徴ベクトルと、キー文字辞書部41中の全てのキー文字の特徴ベクトルとを照合する。キー文字辞書部41中のキー文字は、fkeykとラベリングされており(ただし、k=1,2,3,...,22)、中国の住所における全22のキー文字に対応する。すなわち、
[文字12]
Figure 2007042097
である。結合要素との照合距離Dis(CCi,Kc)が所定の閾値Thkeyよりも小さいキー文字Kcが存在する場合、当該結合要素は、キー文字の可能性がある候補Kcであると決定される。照合距離Dis(CCi,Kc)は、fCCiとfkeyKcとの間のユークリッド距離と定義される。すなわち、
Figure 2007042097
である。
上記のように、fCCiおよびfkeyKcの次元はmである。
このように、キー文字候補抽出手段20は、単一文字領域と限られた数(中国語の場合は22個)のキー文字のみとを照合し、従来方法の場合のように数千の漢字すべてとの照合を行う必要がない。これによって、システムの効率性が高められ、同時に、キー文字の認識精度が上がる。
加えて、結合要素の認識において、L個(L<=22)の候補との照合距離が所定の閾値Thkeyよりも小さい場合には、当該結合要素は、L個のキー文字の可能性があるものと認識される。したがって、例えば、結合要素の可能性があるキー文字が「省」および「市」であれば、当該結合要素は二つのキー文字「省」および「市」であると認識される。これによって、正しい文字が失われる危険性が減るとともに、住所認識の正確性が高まる。
さらに、結合要素CCiのキー文字候補がL個のキー文字(K1,K2,・・・,KL)(ただし、K1,K2,・・・,KLは、照合距離にしたがって昇順に並べられている)を含む場合、キー文字候補決定手段44は、当該結合要素を、次式を満たすキー文字のみを含むものとして認識する。
[Dis(CCi, Kn) − Dis(CCi, K1)] / Dis(CCi, K1) < Thdis_k
ここで、Dis(CCi,Kn)は、キー文字Knと結合要素CCiとの間の照合距離を表し、Thdis_kは、正の定数であり、あらかじめ定められた閾値を表す。このようなキー文字除去方法を用いることにより、第1の文字候補に近いキー文字が保持され、その後のキー文字パス決定および地名照合において評価がなされる。上記の条件を満たさないキー文字がある場合、かかるキー文字の照合距離は第1候補の照合距離とはかなり遠いことを示しているので、当該キー文字が正しいキー文字である可能性は低く、そのようなキー文字は除去される。これにより、キー文字抽出の後は、可能性のある全てのキー文字について評価を行うために地名領域抽出および認識を行う必要はなく、住所認識の効率性および正確性が高められる。
図7は、本発明の実施の形態に係る一括地名認識手段4を示すブロック図である。図7に示すように、地名照合手段27は、地名領域抽出手段3から入力された様々なレベルの地名に対応する画像から特徴を抽出し、(地名データベースおよび地名辞書等を記憶する)地名辞書部54に記憶された地名特徴と照合し、それによって、1からNc番目までの候補を出力する。地名候補評価手段28は、1からNc番目までの候補を評価し、それによって数個の候補を下位の住所に対する上位の行政単位として決定する。再帰的照合評価手段29は、すべての住所候補の平均照合距離を計算し、そこから平均照合距離が最も小さい住所を選択する。地名照合手段27は、地名画像中の特徴ベクトルを抽出するための特徴抽出手段(図示せず)と、抽出された特徴ベクトルと地名辞書中の地名の特徴ベクトルとを照合して可能性のある地名候補全てを見つけるための照合手段とを備える。
地名認識においては第1候補は通常正しい地名ではないため、本発明の多候補再帰的認識方法によって、システムの認識精度が著しく向上する。さらに、地名の評価において、全ての候補を調べる必要がなく、システムの認識効率が向上する。
図8に、本発明の実施の形態に係る一括地名認識手段4がおこなう処理のフローチャートを例として示す。
入力された住所画像中にNレベルのキー文字が存在すると仮定する。ステップSF1において、住所認識はレベル1(i=1)から始まる。ステップSF2において、iレベルの地名照合が行われる。地名照合において、上位の住所が存在する場合、当該iレベルの地名に対応する地名画像から抽出された特徴が、当該iレベルの地名のキー文字によって区切られ、かつ、地名辞書中にある上位の住所に包含される地名と照合される。1からNc番目までの地名候補が生成され、照合距離に基づいて昇順に並べられる。ステップSF3において、候補連続番号カウンタkを2からカウントが始まるように設定する。ステップSF4において、k番目の地名候補の照合距離と第1の候補の照合距離との差の第1の候補の照合距離に対する比を計算する。ステップSF5で、当該比が、所定の閾値Thdisよりも大きいか否か、または、当該候補が最後の候補であるか否かを判定する。具体的には、
[Dis(cand1k) − Dis(cand11)]/ Dis(cand11) < Thdis
が成立するか、または、その時点での候補が最後の候補であると判定された場合には、ステップSF7に進み、次のレベルの地名認識で使用するために1からk番目の候補を上位の行政単位として保持する。ここで、Dis(Cand1k)は、第1レベルの地名認識におけるk番目の候補の照合距離を表し、照合距離は、キー文字によって区切られた画像と候補との間の非類似度を表す。照合距離の値が小さいほど、その時点で確定されている画像と候補との間の相違は小さい。すなわち、両者はより近い。照合距離の計算については後述する。Thdisは正の定数であり、あらかじめ定められた閾値である。照合距離の値がこの閾値を上回る場合は、すべてその時点で確定されている画像が候補とは著しく異なっていることを示しており、さらに比較する必要はない。さらに、地名候補は照合距離に基づいて並べられているため、その時点の候補について計算された比がThdisを上回れば、続く候補の比も必然的に当該閾値を上回ることになるため、それ以上評価する必要はない。他方、ステップSF5において比が所定の閾値Thdisを上回らないと決定され、かつ、当該候補が最後の候補ではないと判定されれば、ステップSF6においてkの値を増分し、ステップSF4に戻る。
全ての地名候補について評価を行った後、1からk番目までの地名候補を下位の地名とマッチする上位住所として保持する。各レベルの住所照合において保持される地名候補の数kは動的に変化し、各レベルにおいて異なる数となりうることがわかる。当該地名候補の照合距離が第1候補の照合距離と著しく異なっている場合、当該地名候補が正しい地名である可能性は低く、最終的なkは比較的小さな数となる。それ以外の場合には、比較的大きい数となる。
ステップSF8においては、N個の地名レベル全てが認識されたか否かを決定する。全てのレベルが認識されていない場合には、ステップSF9でiの値を増分した後、次のレベルの地名照合を行う。例えば、第2レベルの地名照合においては、第1レベルの地名候補から出力された上位行政単位の範囲内で、第1および第2のキー文字間のパターンを、上位の地名により包含され、かつ、第2のキー文字によって区切られる行政単位の地名と照合する必要がある。例えば、第1レベルの地名候補が、「北京」と
[文字9]
Figure 2007042097
であり、第1のキー文字が「市」、第2のキー文字が「区」である場合、第1のキー文字および第2のキー文字の間の画像と、「北京」市に包含される全ての名前とが可能性のある住所の一つとして照合される。さらに、他の可能性のある住所として、第1のキー文字および第2のキー文字の間の画像と、
[文字9]
Figure 2007042097
市に包含される全ての名前とが照合される。そして、1からNc番目までの可能性のある候補が出力される。
さまざまなレベルでの地名の照合が終わると、つまり、SF8において「はい」であると判定されると(最後のレベルの地名については、それより下位の地名がないため、地名候補の評価を行う必要はなく、地名候補を他の地名を包含する上位地名として出力する必要はない)、SF10において、各住所候補におけるすべての地名の照合距離を累積的に加算する。SF11で、SF10で得られた累積的に加算された照合距離にしたがって住所候補を順位付けし、累積的に加算された照合距離が最も小さい住所を認識結果として出力する。
上述した処理は再帰的処理である。すなわち、iレベルの地名照合は、i−1レベルから上位住所として得られたk個の候補すべてについてそれぞれ行わねばならない。同様に、ステップSF7の後にiレベルの地名照合から得られたk個の地名候補は、次のレベルの地名照合において上位住所としてすべて処理されねばならない。
照合距離Dis(Candi)は、i番目の地名候補の特徴ベクトルfiと、地名画像から抽出されたそれに対応する特徴ベクトルviとの間のユークリッド距離と定義される。すなわち、次式が成立する。
Figure 2007042097
上記のとおり、特徴ベクトルfiおよび特徴ベクトルviの次元はmである。
図8は、一括地名認識の動作フローの一例を示しているに過ぎない。一括地名認識処理においては、ステップSF2における照合結果はさらに単一文字地名認識結果と組み合わされ、得られた住所候補を地名検証手段を用いてフィルタリングすることができる。その後、ステップSF3以降の処理を行うことで、地名認識の精度が高められる。同様に、ステップSF7の認識結果を単一文字地名認証結果と組み合わせ、得られた住所候補を地名検証手段を用いてフィルタリングすることができる。地名検証手段5および単一文字地名認証手段E1については後述する。
図9に、本発明の実施の形態にかかる再帰的一括住所認識方法を例示的に示す。
図9では、はじめに入力された手書き文字画像が
[文字11]
Figure 2007042097
であると仮定する。この場合、キー文字パスは、「市−区」となる。そして、キー文字抽出手段2を用いて、入力された画像から「市−区」パスに含まれるキー文字を抽出する。
次に、第1のキー文字によって区切られた画像を抽出することにより、地名領域R1およびR2を切り出す。図8に示すように、ステップSF2において地名領域R1が一括認識され、Nc個(この例では3個)の候補SR1が出力される。さらに、各候補について、照合距離が出力される。照合距離は、地名領域R1と地名辞書中の地名との非類似度を示す。地名領域R1は、
[文字9]
Figure 2007042097
、「北京」、
[文字13]
Figure 2007042097
のそれぞれと比較され、それぞれ照合距離は、230、240、310となる。したがって、R1は、「北京」および
[文字13]
Figure 2007042097
よりも
[文字9]
Figure 2007042097
である可能性が高く、かつ、
[文字13]
Figure 2007042097
よりも「北京」である可能性が高いことになる。
次に、Nc個の候補すべてについて、次のレベルの地名(たとえば、第2レベルの地名)に対して上位の行政単位とみなしうるか否かを評価する。
[文字13]
Figure 2007042097

[文字9]
Figure 2007042097
との照合距離の間の差の
[文字9]
Figure 2007042097
の照合距離に対する比は、(310−230)/230であり、比較的大きい。他方、「北京」と
[文字9]
Figure 2007042097
との照合距離の間の差の
[文字9]
Figure 2007042097
の照合距離に対する比は、(240−230)/230であり、比較的小さい。この場合、
[文字13]
Figure 2007042097
が、R1の実際の地名である可能性は低いため、SR2で除外される。具体的には、あらかじめ定められた閾値が0.25であるとすれば、(310−230)/230>0.25、かつ、(240−230)/230<0.25であるため、
[文字13]
Figure 2007042097
は除外され、
[文字9]
Figure 2007042097
および「北京」はそのまま上位行政単位として使用される。
次に、上記のステップを繰り返して、第2レベルの地名認識を行う。前のレベルが
[文字9]
Figure 2007042097
であれば、地名辞書にもとづいて
[文字9]
Figure 2007042097
に包含されるすべての地区の実際の地名パターンを地名領域R2中の地名と比較し、Nc個の候補を出力する。これらの候補およびその照合距離をSR3に示す。前のレベルが「北京」であれば、地名辞書にもとづいて「北京」に包含されるすべての地区の実際の地名パターンを地名領域R2中の地名と比較し、Nc個の候補を出力する。これらの候補およびその照合距離をSR4に示す。
結果として、SR5に示すように、すべての候補パス(たとえば、
[文字9]
Figure 2007042097

[文字14]
Figure 2007042097
)をそれ以外の他の候補パスと比較した場合、平均照合距離の平均値が最短となるのは「北京」+
[文字10]
Figure 2007042097
であり、その平均照合距離は(240+160)/2=200となる。したがって、
[文字11]
Figure 2007042097
が認識結果として出力される。
図10は、本発明の実施の形態に係る単一文字地名認識手段を示すブロック図である。
上述のとおり、単一文字地名認識手段および地名検証手段は、一括地名認識により取得された、可能性のある複数の地名候補をフィルタリングすることができる。加えて、単一文字地名認識手段および地名検証手段は、一括地名認識手段4の照合評価手段の評価結果(すなわち地名パス)における最短の平均照合距離により近い結果(もしあれば)をフィルタリングして決定することができる。
図10に示すように、単一文字地名認識手段E1は、特徴抽出手段61、辞書照合手段62、および単一文字辞書部59を備える。
特徴抽出手段61は、地名領域抽出手段3により抽出された地名領域内に含まれ、かつ、単一文字領域検出手段1によって出力された単一の文字領域の特徴をひとつずつ抽出する。次に、辞書照合手段62が、特徴抽出手段61により得られた単一文字領域の各々の特徴を、単一文字辞書部59内に記憶された単一文字の中国語単語の特徴と照合する。そして、各単一文字領域の1からN番目までの候補が出力される。
図11は、本発明の実施の形態に係る地名検証手段5を示すブロック図である。
単一文字地名認識手段E1の地名認識結果、および、一括地名認識手段4により得られた地名認識結果に基づいて、地名検証手段5は、これらの検証および組み合わせを行う。図11は、本発明の実施の形態に係る地名検証手段5を示すブロック図である。図11に示すように、地名検証手段5は、編集距離計算手段55と、一括認識・個別文字認識組み合わせ手段58とを備える。
編集距離計算手段55は、単一文字地名認識手段E1により得られた地名結果と、キー文字の定義に合致し、かつ、前レベルの地名から認識された住所に包含されるすべての地名との編集距離を計算する。一括認識・個別文字認識組み合わせ手段58は、一括地名認識手段4により得られた結果と、単一文字地名認識手段E1により得られた結果とを、編集距離計算手段55を用いて組み合わせる。一括地名認識手段4により得られた候補シーケンスまたは候補列に従い、一括認識・個別文字認識組み合わせ手段58は、各地名の全体的順位を計算し、最終的に第1位の地名を出力する。なお、編集距離とは、2つの文字列間がどの程度異なっているかを表わす数値であり、例えば「東京都」と「東束都」の間の編集距離は「京」を「束」の違いのみなので「1」となる。編集距離はレーベンシュタイン距離とも呼ばれる。この場合も小さいほど両者が近いことになる。
地名検証の具体的処理は以下のとおりである。
まず、編集距離計算手段55は、ダイナミック・プログラミングを用いて(非特許文献3および4を参照)、キー文字により区切られた合理的な地名であり、かつ、上位レベルにおいて得られた地名領域に包含される地名と、単一文字地名認識手段E1により得られた結果Wとの間の(以下に定義する)式(1)により定義される編集距離を計算する。編集距離とは、挿入、置換、削除等の操作による単一文字部の認識結果から合理的な地名のオペランドへの変換を意味する(オペランドについては後述する)。したがって、合理的な地名の編集距離が小さい場合、地名と個別文字認識結果との差はきわめて小さく、他方、合理的な地名の編集距離が大きい場合、地名と個別文字認識結果との差は大きい。
本発明では、編集距離を以下のように定義する。
Sはn次元ベクトルであり、n個の文字を含む地名を指し、WはN×mの行列であり、Wijは入力された地名画像中のi番目の単一文字領域または結合要素のj番目の認識候補を指し、Wiはi番目の単一文字領域または結合要素の認識結果、すなわち、m次元の認識候補リストを指すものとする。SとWとの間の編集距離は、挿入、削除、置換等によって候補を調整することを考慮すれば、WをSに変換した場合に、もっとも小さいコストとなる。SkとWiとの間のコストは、以下のように計算される。
Figure 2007042097
式(1)において、kは入力された地名画像中の単一文字領域の総数であり、wは当該地名画像中の各単一文字領域の認識候補の数である。
したがって、結合要素の認識候補Wi中に照合すべき地名Sの文字Skが存在する場合、候補列Wi中においてその文字が位置づけられる順位が高ければ高いほど(すなわち、照合距離がWij=Skを満たす小さなjが存在すれば)、照合コストは小さくなり、WiがSkである可能性が高くなる。逆に、候補列Wi中においてその文字が位置づけられる順位が低ければ低いほど(すなわち、照合距離がWij=Skを満たす大きなjが存在すれば)、照合コストは大きくなり、WiがSkである可能性が低くなる。
一括認識・個別文字認識組み合わせ手段58は、編集距離計算手段55を利用して、一括認識結果と、単一文字地名認識結果とを以下のステップによって組み合わせる。
(1)上位レベルの地名に包含され、かつ、現時点でのキー文字によって区切られる、各地名Aiの重み付け値を計算する。重み付け値は、以下の式(2)によって計算される。
Weight(Ai) = (1 − t1) × Rank_ED(Ai)+ t1 × i (2)
式(2)において、Aiは一括地名認識手段4により取得されたi番目の地名候補であり、ED(Ai)はAiの編集距離であり、Rank_ED(Ai)はAiと個別文字認識候補行列との間の編集距離の順位であり、t1はround(ED(Ai))/kに等しく、round(ED(Ai))はED(Ai)を四捨五入することを示す。
(2)上位レベルの地名に包含され、かつ、現時点でのキー文字によって区切られるすべての地名Aiの重み付け値を昇順で順位付けし、重み付け値が最小のAiを現時点で認識された地名とする。
iの編集距離が著しく小さい場合には、個別文字認識結果の信頼性が高いこととなり、より大きな重み付け値(1−t1)がRank_ED(Ai)に割り当てられる。Aiの編集距離が著しく大きい場合には、t1が著しく大きくなり、一括認識部から得られた候補順位iが重み付け計算において重要な役割を果たすようになる。つまり、Aiの編集距離が十分に小さければ個別文字認識の結果は信頼でき、他方、すべての合理的な住所の編集距離が十分大きければ個別文字認識結果はあまり信頼できない。この場合には、一括地名認識手段から得られた認識結果を組み合わされた地名として出力する必要がある。このように、一括地名認識手段から得られる認識結果と、個別文字認識の結果とが組み合わされるため、システムの正確性が著しく向上する。
図12に、本発明に係る住所検証の一例を示す。
図12において、(A)および(B)に示される入力された住所画像の実際の住所は、
[文字15]
Figure 2007042097
である。ここで、第1レベルの地名
[文字16]
Figure 2007042097
がすでに認識され、キー文字
[文字17]
Figure 2007042097
もすでに認識されていると仮定する。(A)に、「二盛一」の画像領域から単一文字領域検出手段1により得られた単一文字領域の個別文字認識結果の例を示す。W1、W2、およびW3は、それぞれ、単一文字領域「二」、「盛」、「一」に対応する認識候補列を示す。候補の数は3と仮定する。(B)に、「二盛一」の画像領域を一括認識することによって得られた地名候補の例を示す。ここで、
[文字16]
Figure 2007042097
市には、
[文字17]
Figure 2007042097
がつく地名は3つしかなく、それらはそれぞれ「二盛」、「二盛一」、「二旺一」であると仮定する。
地名検証によって、(A)における行列W={W1,W2,W3}と、
[文字16]
Figure 2007042097
市の領域に包含され、かつ、
[文字17]
Figure 2007042097
によって区切られるすべての地名(すなわち、「二盛」、「二盛一」、「二旺一」)との間の編集距離を計算する。たとえば、「二盛」とWとの間の最小編集距離は、ダイナミック・プログラミングによって、「二」をW1と照合し、「盛」をW2と照合し、無効文字(NULLとラベリングする)を追加してこれをW3と照合することで計算される。この場合の照合コストは以下のようになる。
Cost("二", W1) = (2 − 1) / (3 × 3) = 1 / 9;
Cost("盛", W2) = (1 − 1) / (3 × 3) = 0;
Cost(NULL, W3) = 1.
したがって、Wと「二盛」との間の編集距離は、1/9+0+1=10/9となる。
同様に、Wと「二盛一」との間の編集距離は以下のように計算される。
Cost("二", W1) = (2 − 1) / (3 × 3) = 1 / 9;
Cost("盛", W2) = (1 − 1) / (3 × 3) = 0;
Cost("一", W3) = (2 − 1) / (3 × 3) = 1 / 9.
したがって、Wと「二盛一」との間の編集距離は、1/9+0+1/9=2/9となる。
同様に、Wと「二旺一」との間の編集距離は以下のように計算される。
Cost("二", W1) = (2 − 1) / (3 × 3) = 1 / 9;
Cost("旺", W2) = 1;
Cost("一", W3) = (2 − 1) / (3 × 3) = 1 / 9.
したがって、Wと「二旺一」との間の編集距離は、1/9+1+1/9=11/9となる。
したがって、
[文字16]
Figure 2007042097
市に包含されるすべての地名
[文字17]
Figure 2007042097
の編集距離の順位付けシーケンスは、「二盛一」、「二盛」、「二旺一」となる。
このとき「二盛一」の編集距離1/9が最も小さいため、検証ルール(1)により「二盛一」が正しい地名であると検証される。
図13は、本発明の実施の形態に係るリジェクト手段を示すブロック図である。
図13に示すように、リジェクト手段6は、特徴抽出手段63と、リジェクト決定手段64と、リジェクト学習手段65とを備える。
具体的には、特徴抽出手段63は、地名画像領域のさまざまなレベルから特徴{v1,v2,v3,…,vN}を抽出する。ここで、vi(0<i<N+1)は、iレベルの地名から抽出された特徴であり、Nは地名レベルの総数である。リジェクト決定手段64は、特徴抽出手段63により得られた特徴を、リジェクト学習手段65により得られたマッピング関数fに代入し、関数f(v1,v2,v3,…,vN)の関数値を計算する。この値がゼロより大きければ、認識結果は正しい住所とされる。この値がゼロ以下の場合は、認識結果はリジェクトされる。
リジェクト学習手段65は、実際の住所画像から集められた学習セットを用いて学習を行う。各住所サンプルに対する各レベルの地名認識の照合距離が特徴として集められる。住所サンプルが正しく認識される場合、住所画像には承認のラベリングがされるか、+1のラベリングがされる。それ以外の場合には、住所画像にはリジェクトのラベリングがされるか、−1のラベリングがされる。
上記の処理は、非特許文献5に基づく。マッピング関数(以下、分類子と呼ぶ)を構築するのは、学習データにおける特徴に基づいて自動的に分類を実行するためである。この分類子は、新しい住所を評価し、関数出力が正である(>0)か負である(<0)かによって認識結果をリジェクトするか承認するかを決定するためのリジェクトルールとして用いられる。この関数は、住所の質に適応的に適合するリジェクトルールを自動的に構築できるため、住所認識の信頼性が高まる。
図14は、本発明の実施の形態に係る住所認識装置を示す詳細なブロック図である。
図14に示すように、本発明に係る住所認識装置は、単一文字領域検出手段1と、キー文字候補抽出手段20と、キー文字パス選択手段15と、地名領域抽出手段3と、単一文字地名認識手段E1と、一括地名認識手段4と、地名検証手段5と、個別文字認識手段69と、リジェクト手段6とを備える。単一文字領域検出手段1は、結合要素ラベリング手段34と、単一文字領域候補決定手段35と、平均文字サイズ計算手段36と、画素投影手段37と、一時的分離ポイント候補抽出手段38と、一時的分離ポイント候補決定手段39とを備えてなる。
結合要素ラベリング手段34は、入力された二値画像から結合要素をラベリングする。単一文字領域候補決定手段35は、ラベリングされた要素のサイズ、ラベリングされた要素の位置、隣りあう要素からの距離等に基づいて結合要素各々を統合し、最終的に単一文字領域候補を決定する。
平均文字サイズ計算手段36は、他の結合要素とサイズが合致しないパターンを除去し、文字の平均サイズを計算する。
画素投影手段37は、入力された住所画像を(画像が横向きに書かれている場合は)縦向きに、または、(画像が縦向きに書かれている場合は)横向きに投影する。縦向き(または横向き)の画像投影によって、横(または縦)方向における画像の各ポイントにある黒画素数が得られる。
一時的分離ポイント候補抽出手段38および一時的分離ポイント候補決定手段39は、単一文字領域決定手段35によって出力された新しい結合要素を、実際の文字領域へと分離するために使用される。すなわち、両者は、結合された文字を個々の単一文字へと分離するために用いられる。
一時的分離ポイント候補決定手段39は、一時的分離ポイント候補抽出手段38によって得られた一時的分離ポイントが隣りあう文字領域の真の分離ポイントであるか否かを決定する。
キー文字辞書41は、すべてのキー文字の特徴を記録および記憶する。
キー文字候補抽出手段20は、特徴抽出手段42、辞書照合手段43、およびキー文字候補決定手段44を備える。
特徴抽出手段42は、単一文字領域検出手段1により分離された領域の特徴を抽出する。辞書照合手段43は、特徴抽出手段42により抽出された特徴と、キー文字辞書41に記憶された特徴とを照合し、1からN番目の文字候補を出力する。次に、キー文字候補決定手段44は、キー文字候補が真のキー文字であるか否かを決定する。当該キー文字候補の照合距離の第1文字候補の照合距離に対する比が所定の閾値よりも小さい場合、当該キー文字候補は真のキー文字である。
住所階層構造知識部24は、住所階層構造の知識を記憶する。たとえば、キー文字「省」はキー文字「市」を包含し得るが、キー文字「市」はキー文字「省」を包含し得ない。
キー文字パス選択手段15は、キー文字パス決定手段21とキー文字パスフィルタ手段22とを備える。
キー文字パス決定手段21は、住所階層構造知識部24を参照して、合理的なキー文字パスを決定する。キー文字パスフィルタ手段22は、複数のキー文字パスを記憶し、各パスにおけるキー文字間の平均照合距離を計算し、最終的にK個の主要パスを出力する。ここで、Kは所定の正の定数である。
地名領域抽出手段3は、特定のキー文字パス内のキー文字によって区切られた地名領域を抽出する。
地名辞書部54は、住所中の各地名の特徴ベクトルを記憶する。
一括地名認識手段4は、地名抽出手段3により抽出された地名を順次一括認識する。一括地名認識手段4は、地名照合手段27と、地名候補評価手段28と、再帰的照合評価手段29とを備える。
地名照合手段27は、さまざまなレベルの地名に対応する画像から特徴を抽出し、地名辞書部54に記憶された地名特徴と照合し、それによって1からNc番目の候補を出力する。地名候補評価手段28は、1からNc番目の候補を評価し、下位の住所に対して上位の行政単位となるいくつかの候補を決定する。再帰的照合評価手段29は、すべての住所候補の平均距離を計算し、そこから平均照合距離が最小である住所を最終的な認識結果として選択する。
単一文字辞書部59は、住所内の各文字の特徴ベクトルを記憶する。
単一文字地名認識手段E1は、単一文字領域検出手段1から出力された単一文字領域を順次認識する。これらの単一文字領域は、地名領域抽出手段3により抽出された地名領域内に含まれるものである。単一文字地名認識手段E1は、特徴抽出手段61と辞書照合手段62とを備える。
特徴抽出手段61は、単一文字領域検出手段1により得られた単一文字領域の特徴ベクトルを抽出する。これらの単一文字領域は、地名領域抽出手段3により抽出された地名領域内に含まれるものである。辞書照合手段62は、次に、特徴抽出手段61により得られた特徴ベクトルと単一文字辞書部59に記憶された特徴ベクトルとを照合し、各単一文字領域の1からN番目の候補を出力する。
地名検証手段5は、単一文字地名認識手段E1により得られた地名認識結果と、一括地名認識手段4により取得された地名認識結果とを検証し、組み合わせる。地名検証手段68は、編集距離計算手段55と一括認識・個別文字認識組み合わせ手段58とを備える。
編集距離計算手段55は、単一文字地名認識手段E1により得られた地名結果と、キー文字の定義に合致し、かつ、前のレベルの地名から認識された住所に包含されるすべての地名との間の編集距離を計算する。一括認識・個別文字認識組み合わせ手段58は、一括地名認識手段4により得られた結果と、単一文字地名認識手段E1により得られた結果とを組み合わせる。一括認識・個別文字認識組み合わせ手段58は、計算した各地名を順位付けし、最終的に第1位の地名を出力する。
個別文字認識手段69は、地名でもキー文字でもないパターンを認識する。個別文字認識手段69は、特徴抽出手段61と辞書照合手段62とを備える。
リジェクト学習手段65は、ひとまとまりの住所に基づいてサポートベクターマシーン分類子の学習を行う。なお、サポートベクターマシーンとは、2クラスの分類に優れた方式であり、住所が4階層(省−市−区−街)あるときは、全部で4単語あるので、正しい4単語の距離値の並びとそうでないものの距離値の並びをあらかじめ学習しておく。次に入力された4階層の文字列から4単語の距離の並びを算出し、それが学習したうちの正しい側かそうでない側のどちらに属するかを判定する、というものである。
リジェクト手段6は、認識結果を承認するか否かを決定するものであり、特徴抽出手段63と、リジェクト決定手段64とを備える。特徴抽出手段63は特徴ベクトルを抽出する。リジェクト決定手段64は、リジェクト学習手段65から出力されるサポートベクターマシーン分類子に基づき、認識結果を承認するか否かを決定し出力する。
最後に、結果がリジェクトされなかった場合、リジェクト手段6は認識結果を出力する。結果がリジェクトされた場合は、リジェクト手段6はエラーを出力する。
これまでの本発明の実施の形態の説明は例示的なものであり、本質的に他の例を排除するものではなく本願を明確化するものであり、開示される特定の形態に本発明を限定するものではない。多くの変更および変形が可能であることはこの分野の通常の技術を有する者には明らかであろう。実施の形態の選択および説明は、本発明の実際の原理および応用例をよりよく説明することを意図するものであり、それによってこの分野の技術を有する他の者が、本発明のさまざまな実施例への応用および特殊な応用のための本発明の変更を理解できるようにすること意図するものである。たとえば、本発明は、日本語または韓国語で書かれた手書きの地名の認識にも適用できる。さらに、本発明は、類似度の決定に照合距離を利用しているが、類似度は照合距離以外の方法を用いて決定することもできる。たとえば、特徴ベクトル間のコサイン傾斜、特徴ベクトル間のブロック距離等を用いることができる。したがって、本発明における照合距離は、この分野の技術を有する者が想起できる類似度の明確な量の表現として広義に捉えられねばならない。
(付記1)複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出プログラムであって、
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手順と、
前記特徴ベクトル抽出手順により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手順と、
前記照合手順により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手順と、
をコンピュータに実行させることを特徴とするキー文字抽出プログラム。
(付記2)前記キー文字辞書は、行政区域レベルを表す文字の組を記憶したことを特徴とする付記1に記載のキー文字抽出プログラム。
(付記3)前記照合手順は、前記キー文字辞書に含まれるあり得るキー文字であって、前記特徴ベクトル抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応するあり得るキー文字をキー文字候補として決定することを特徴とする付記1に記載のキー文字抽出プログラム。
(付記4)複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出方法であって、
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、
前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、
前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、
を含んだことを特徴とするキー文字抽出方法。
(付記5)前記キー文字辞書は、行政区域レベルを表す文字の組を記憶したことを特徴とする付記4に記載のキー文字抽出方法。
(付記6)前記照合工程は、前記キー文字辞書に含まれるあり得るキー文字であって、前記特徴ベクトル抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応するあり得るキー文字をキー文字候補として決定することを特徴とする付記4に記載のキー文字抽出方法。
(付記7)前記照合工程により単一文字領域に対するあり得るキー文字候補が決定され、照合距離に基づいてキー文字候補の順位付けをおこなうことにより第1位となったあり得るキー文字候補が第1キー文字候補とされた場合に、キー文字候補の照合距離と第1キー文字候補の照合距離との間の差の第1キー文字の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離であるキー文字候補をキー文字候補結果として決定するキー文字候補決定工程をさらに含んだことを特徴とする付記6に記載のキー文字抽出方法。
(付記8)前記キー文字パス決定工程により正当なキー文字パスが複数決定された場合に、所定のルールに従って複数の正当なキー文字パスから一部の正当なキー文字パスをフィルタリングするキー文字パスフィルタリング工程をさらに含んだことを特徴とする付記4〜7のいずれか1つに記載のキー文字抽出方法。
(付記9)前記所定のルールは、妥当なキー文字パスに含まれるキー文字候補の平均照合距離を算出し、すべてのキー文字パスを平均照合距離が昇順となるように順位付けし、第1の所定数のキー文字パスのみを選択するルールであることを特徴とする付記8に記載のキー文字抽出方法。
(付記10)複数の単一文字領域からキー文字を抽出するキー文字抽出装置であって、
前記単一文字領域の各々に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手段と、
あり得るすべてのキー文字のみを記憶するキー文字辞書部と、
前記特徴ベクトル抽出手段により抽出された特徴ベクトルと、前記キー文字辞書部に記憶されたあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手段と、
前記照合手段により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手段と、
を備えたことを特徴とするキー文字抽出装置。
(付記11)前記キー文字辞書部に記憶されるあり得るキー文字は、行政区域レベルを表す文字であることを特徴とする付記10に記載のキー文字抽出装置。
(付記12)前記照合手段は、前記キー文字辞書部に記憶されたあり得るキー文字であって、前記特徴ベクトル抽出手段により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応するあり得るキー文字をキー文字候補として決定することを特徴とする付記10に記載のキー文字抽出装置。
(付記13)前記照合手段により単一文字領域に対するあり得るキー文字候補が決定され、照合距離に基づいてキー文字候補の順位付けをおこなうことにより第1位となったあり得るキー文字候補が第1キー文字候補とされた場合に、キー文字候補の照合距離と第1キー文字候補との間の差の第1キー文字の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離であるキー文字候補をキー文字候補結果として決定するキー文字候補決定手段をさらに備えたことを特徴とする付記12に記載のキー文字抽出装置。
(付記14)前記キー文字パス決定手段により正当なキー文字パスが複数決定された場合に、所定のルールに従って複数の正当なキー文字パスから一部の正当なキー文字パスをフィルタリングするキー文字パスフィルタリング手段をさらに備えたことを特徴とする付記10〜13のいずれか1つに記載のキー文字抽出装置。
(付記15)前記所定のルールは、妥当なキー文字パスに含まれるキー文字候補の平均照合距離を算出し、すべてのキー文字パスを平均照合距離が昇順となるように順位付けし、第1の所定数のキー文字パスのみを選択するルールであることを特徴とする付記14に記載のキー文字抽出装置。
(付記16)ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識手順をコンピュータに実行させる一括地名認識プログラムであって、
前記一括地名認識手順は、
前記地名画像から特徴ベクトルを抽出する抽出手順と、
前記抽出手順により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合手順と、
をコンピュータに実行させ、
前記地名辞書に記憶された地名のうち、前記抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識手順と、
前記個別文字認識手順により得られた認識結果に基づいて、前記一括地名認識手順により決定された地名候補のフィルタリングをおこなう地名検証手順と、
をコンピュータに実行させることを特徴とする一括地名認識プログラム。
(付記17)前記一括地名認識手順は、前記照合手順によりあり得る地名候補が複数得られた場合に、所定のルールに従って複数のあり得る地名候補をフィルタリングする地名候補評価手順をさらにコンピュータに実行させることを特徴とする付記16に記載の一括地名認識プログラム。
(付記18)前記所定のルールは、複数のあり得る地名候補を照合距離に基づいて順位付けし、順位付けにより第1位となったあり得る地名候補を第1地名候補とした場合に、地名候補の照合距離と第1地名候補の照合距離との間の差の第1地名候補の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離である地名候補のみを選択するルールであることを特徴とする付記17に記載の一括地名認識プログラム。
(付記19)ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識工程を含む一括地名認識方法であって、
前記一括地名認識工程は、
前記地名画像から特徴ベクトルを抽出する抽出工程と、
前記抽出工程により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合工程と、
を含み、
前記地名辞書に記憶された地名のうち、前記抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識工程と、
前記個別文字認識工程により得られた認識結果に基づいて、前記一括地名認識工程により決定された地名候補のフィルタリングをおこなう地名検証工程と、
を含んだことを特徴とする一括地名認識方法。
(付記20)前記一括地名認識工程は、前記照合工程によりあり得る地名候補が複数得られた場合に、所定のルールに従って複数のあり得る地名候補をフィルタリングする地名候補評価工程を含んだことを特徴とする付記19に記載の一括地名認識方法。
(付記21)前記所定のルールは、複数のあり得る地名候補を照合距離に基づいて順位付けし、順位付けにより第1位となったあり得る地名候補を第1地名候補とした場合に、地名候補の照合距離と第1地名候補の照合距離との間の差の第1地名候補の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離である地名候補のみを選択するルールであることを特徴とする付記20に記載の一括地名認識方法。
(付記22)前記地名検証工程は、前記一括地名認識工程により決定された地名候補の各々と、前記個別文字認識工程により得られた認識結果との間の編集距離を算出する工程と、各編集距離の順位を算出する工程と、前記編集距離の順位に基づいて、重みを算出する工程と、算出された重みに基づいて前記一括地名認識工程により得られた地名候補をフィルタリングする工程とを含むことを特徴とする付記19、20または21に記載の一括地名認識方法。
(付記23)前記一括地名認識工程は、地名の行政レベルが降順となっている複数の地名画像のそれぞれについて1つ以上の地名候補を認識した場合に、最上位レベルから最下位レベルまでの住所候補により形成されるパスの各々の平均照合距離を算出し、平均照合距離が最小のパスのみを住所パス候補として選択する照合評価工程をさらに含んだことを特徴とする付記19、20または21に記載の一括地名認識方法。
(付記24)前記一括地名認識工程は、地名の行政レベルが降順となっている複数の地名画像のそれぞれについて1つ以上の地名候補を認識した場合に、最上位レベルから最下位レベルまでの住所候補により形成されるパスの各々の平均照合距離を算出し、平均照合距離が最小のパスのみを住所パス候補として選択する照合評価工程をさらに含んだことを特徴とする付記19に記載の一括地名認識方法。
(付記25)最小平均照合距離に近い平均照合距離を有するパスが複数ある場合に、複数のパスにおいて複数のあり得る地名候補を有する地名画像について個別文字認識を実行するパス個別文字認識工程と、前記パス個別文字認識工程において得られた認識結果に基づいて、地名画像のあり得る地名候補をフィルタリングするパス地名検証工程と、をさらに含み、前記地名検証工程は、地名画像のあり得る地名候補の各々と、前記個別文字認識工程により得られた認識結果との間の編集距離を算出する工程と、各編集距離の順位を算出する工程と、前記編集距離の順位に基づいて、重みを算出する工程と、算出された重みに基づいて地名を決定する工程とを含むことを特徴とする付記24に記載の一括地名認識方法。
(付記26)前記照合評価工程により選択された住所パス候補を承認あるいはリジェクトする地名リジェクト工程をさらに含み、前記地名リジェクト工程は、各レベルの地名領域から特徴を抽出する工程と、各レベルの地名領域から抽出された特徴をリジェクト学習により得られたマッピング関数を用いて分析する工程と、分析の結果に基づいて住所パス候補を承認あるいはリジェクトする工程とを含んだことを特徴とする付記25に記載の一括地名認識方法。
(付記27)一括地名認識装置であって、
入力された地名画像から特徴ベクトルを抽出する抽出手段と、
地名を記憶する地名辞書部と、
前記地名辞書部に記憶された地名の特徴ベクトルと前記抽出手段により抽出された特徴ベクトルとを照合し、あり得るすべての地名候補および照合距離を求め、地名辞書に記憶された地名のうち、前記抽出手段により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定する照合手段と、
降順に並んだ行政レベルの地名を含む複数の地名画像が入力され、当該地名画像の認識により行政レベルの地名を降順に含む複数の住所パスが形成される場合に、複数の住所パス候補の評価および決定をおこなう照合評価手段と、
をさらに備えたことを特徴とする一括地名認識装置。
(付記28)前記照合手段によりあり得る地名候補が複数得られた場合に、所定のルールに従って複数のあり得る地名候補をフィルタリングする地名候補評価手段をさらに備えたことを特徴とする付記27に記載の一括地名認識装置。
(付記29)前記所定のルールは、複数のあり得る地名候補を照合距離に基づいて順位付けし、順位付けにより第1位となったあり得る地名候補を第1地名候補とした場合に、地名候補の照合距離と第1地名候補の照合距離との間の差の第1地名候補の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離である地名候補のみを選択するルールであることを特徴とする付記28に記載の一括地名認識装置。
(付記30)前記照合評価手段は、住所パスの各々について平均照合距離を計算し、平均照合距離が最小の住所パスを住所パス候補として決定することを特徴とする付記27、28または29に記載の一括地名認識装置。
(付記31)前記照合評価手段により決定された住所パス候補を承認あるいはリジェクトするリジェクト手段をさらに備えたことを特徴とする付記30に記載の一括地名認識装置。
(付記32)前記リジェクト手段は、各地名領域から特徴を抽出する特徴抽出手段と、リジェクト学習を実行してマッピング関数を得るリジェクト学習手段と、前記マッピング関数を用い、各レベルの地名領域の抽出された特徴に基づいて前記住所パス候補を承認するかまたはリジェクトするかを決定するリジェクト決定手段とを備えたことを特徴とする付記31に記載の一括地名認識装置。
(付記33)最小平均照合距離に近い平均照合距離を有する住所パスが複数存在する場合に、複数の住所パス中に複数のあり得る地名候補を有する地名画像に対して個別文字認識を実行し、または、前記照合手段が地名画像に対して複数のあり得る地名候補を決定した場合に、あり得る地名候補を複数有する地名画像に対して個別文字認識を実行する個別文字認識手段と、前記個別文字認識手段により得られた認識結果、および、前記照合評価手段による決定結果に基づいて、複数のあり得る地名候補を有する地名画像の地名候補をフィルタリングする地名検証手段と、をさらに備えたことを特徴とする付記27〜32のいずれか1つに記載の一括地名認識装置。
(付記34)前記地名検証手段は、複数のあり得る地名候補を有する地名画像の地名候補の各々と、前記個別文字認識手段による認識結果との間の編集距離を計算する編集距離計算手段と、前記編集距離計算手段により計算された編集距離に基づいて複数のあり得る地名候補を有する地名画像の住所を決定する一括認識・個別文字認識組み合わせ手段と、を備えたことを特徴とする付記33に記載の一括地名認識装置。
(付記35)単一文字領域を分離する文字分離工程、前記文字分離工程により分離された単一文字領域の各々に対してキー文字を抽出するキー文字抽出工程、前記キー文字抽出工程によるキー文字の抽出結果に基づいて地名を一括して認識する一括地名認識工程、前記一括地名認識工程による地名認識結果に基づいて住所を決定する住所決定工程、を含んだ住所認識方法であって、
前記キー文字抽出工程は、
前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、
前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、すべてのあり得るキー文字を記憶したキー文字辞書におけるあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、
前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、
を含んだことを特徴とする住所認識方法。
(付記36)前記キー文字抽出工程は、前記キー文字辞書に含まれるあり得るキー文字であって、前記特徴ベクトル抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応するあり得るキー文字をキー文字候補として決定することを特徴とする付記35に記載の住所認識方法。
(付記37)前記照合工程により単一文字領域に対するあり得るキー文字候補が決定され、照合距離に基づいてキー文字候補の順位付けをおこなうことにより第1位となったあり得るキー文字候補が第1キー文字候補とされた場合に、キー文字候補の照合距離と第1キー文字候補の照合距離との間の差の第1キー文字の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離であるキー文字候補をキー文字候補結果として決定するキー文字候補決定工程をさらに含んだことを特徴とする付記35に記載の住所認識方法。
(付記38)前記キー文字抽出工程は、前記キー文字パス決定工程により正当なキー文字パスが複数決定された場合に、所定のルールに従って複数の正当なキー文字パスから一部の正当なキー文字パスをフィルタリングするキー文字パスフィルタリング工程をさらに含んだことを特徴とする付記35、36または37に記載の住所認識方法。
(付記39)前記一括地名認識工程は、ある行政レベルの地名を含む地名画像の地名を認識する一括認識工程を含み、前記一括認識工程は、前記地名画像から特徴ベクトルを抽出する抽出工程と、前記抽出工程により抽出された特徴ベクトルと地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合工程とを含み、前記地名辞書に記憶された地名のうち、前記抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定することを特徴とする付記38に記載の住所認識方法。
(付記40)前記一括認識工程は、前記照合工程によりあり得る地名候補が複数得られた場合に、所定のルールに従って複数のあり得る地名候補をフィルタリングする地名候補評価工程をさらに含み、前記所定のルールは、複数のあり得る地名候補を照合距離に基づいて順位付けし、順位付けにより第1位となったあり得る地名候補を第1地名候補とした場合に、地名候補の照合距離と第1地名候補の照合距離との間の差の第1地名候補の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離である地名候補のみを選択するルールであることを特徴とする付記39に記載の住所認識方法。
(付記41)前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識工程と、前記個別文字認識工程により得られた認識結果に基づいて、前記一括地名認識工程により決定された地名候補のフィルタリングをおこなう地名検証工程とをさらに含み、前記地名検証工程は、前記一括地名認識工程により決定された地名候補の各々と、前記個別文字認識工程により得られた認識結果との間の編集距離を算出する工程と、各編集距離の順位を算出する工程と、前記編集距離の順位に基づいて、式
Weight(Ai) = (1 − t1) × Rank_ED(Ai)+ t1 × i
を用いることにより重みを算出する工程と、算出された重みに基づいて前記一括地名認識工程により得られた地名候補をフィルタリングする工程とを含み、Aiは前記一括地名認識工程により得られたi番目の地名候補であり、ED(Ai)はAiの編集距離であり、Rank_ED(Ai)は編集距離の順位であり、t1はround(ED(Ai))/kに等しく、round(ED(Ai))はED(Ai)の四捨五入演算を意味し、kは前記地名画像における単一文字領域の総数であり、weight(Ai)はi番目の地名候補の重みを意味することを特徴とする付記40に記載の住所認識方法。
(付記42)前記一括地名認識工程により地名の行政レベルが降順となっている複数の地名画像のそれぞれについて1つ以上の地名候補が認識された場合に、最上位レベルから最下位レベルまでの住所候補により形成されるパスの各々の平均照合距離を算出し、平均照合距離が最小のパスのみを住所パス候補として選択する照合評価工程を含んだことを特徴とする付記41に記載の住所認識方法。
(付記43)前記照合評価工程により選択された住所パス候補を承認あるいはリジェクトする地名リジェクト工程をさらに含み、前記地名リジェクト工程は、各レベルの地名領域から特徴を抽出する工程と、各レベルの地名領域から抽出された特徴をリジェクト学習により得られたマッピング関数を用いて分析する工程と、分析の結果に基づいて住所パス候補を承認あるいはリジェクトする工程とを含んだことを特徴とする付記42に記載の住所認識方法。
以上のように、本発明は、キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法に関し、特に、枠のない領域内に手書きされた文字から住所を読み取り認識するキー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法に有用である。
図1は、従来の住所認識装置を示すブロック図である。 図2は、図1の従来の住所認識装置に備えられ、一括地名認識を行う一括地名認識手段の処理を示す概略図である。 図3は、本発明の実施例に係る住所認識装置を示すブロック図である。 図4は、単一文字領域検出手段の一例を示すブロック図である。 図5は、本発明の実施例に係るキー文字抽出手段を示すブロック図である。 図6は、本発明の実施例に係るキー文字候補抽出手段を示すブロック図である。 図7は、本発明の実施例に係る一括住所認識手段を示すブロック図である。 図8は、本発明の実施例に係る一括地名認識手段を示すフローチャートである。 図9は、本発明の実施例に係る一括住所認識方法を例示的に示す図である。 図10は、本発明の実施例に係る単一文字地名認識手段を示すブロック図である。 図11は、本発明の実施例に係る地名検証手段を示すブロック図である。 図12は、本発明に係る地名検証方法を例示的に示す図である。 図13は、本発明の実施例に係るリジェクト手段を示すブロック図である。 図14は、本発明の実施例に係る住所認識装置を示す詳細なブロック図である。
符号の説明
1 単一文字領域検出手段
2 キー文字抽出手段
3 地名領域抽出手段
4 一括地名認識手段
5 地名検証手段
6 リジェクト手段
16 キー文字パス選択手段
20 キー文字候補抽出手段
21 キー文字パス決定手段
22 キー文字パスフィルタ手段
24 住所階層構造知識部
27 地名照合手段
28 地名候補評価手段
29 再帰的照合評価手段
34 結合要素ラベリング手段
35 単一文字領域候補決定手段
36 平均文字サイズ計算手段
37 画素投影手段
38 一時的分離ポイント候補抽出手段
39 一時的分離ポイント候補決定手段
41 キー文字辞書部
42 特徴抽出手段
43 辞書照合手段
44 キー文字候補決定手段
54 地名辞書部
55 編集距離計算手段
58 一括認識・個別文字認識組み合わせ手段
59 単一文字辞書部
61 特徴抽出手段
62 辞書照合手段
63 特徴抽出手段
64 リジェクト決定手段
65 リジェクト学習手段
69 個別文字認識手段
E1 単一文字地名認識手段

Claims (10)

  1. 複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出プログラムであって、
    前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手順と、
    前記特徴ベクトル抽出手順により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手順と、
    前記照合手順により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手順と、
    をコンピュータに実行させることを特徴とするキー文字抽出プログラム。
  2. 前記キー文字辞書は、行政区域レベルを表す文字の組を記憶したことを特徴とする請求項1に記載のキー文字抽出プログラム。
  3. 前記照合手順は、前記キー文字辞書に含まれるあり得るキー文字であって、前記特徴ベクトル抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応するあり得るキー文字をキー文字候補として決定することを特徴とする請求項1に記載のキー文字抽出プログラム。
  4. 複数の単一文字領域からキー文字を抽出するキー文字抽出装置であって、
    前記単一文字領域の各々に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出手段と、
    あり得るすべてのキー文字のみを記憶するキー文字辞書部と、
    前記特徴ベクトル抽出手段により抽出された特徴ベクトルと、前記キー文字辞書部に記憶されたあり得るキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合手段と、
    前記照合手段により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定手段と、
    を備えたことを特徴とするキー文字抽出装置。
  5. 複数の単一文字領域からのキー文字の抽出を複数の単一文字領域の各々について実行するキー文字抽出方法であって、
    前記単一文字領域に対応する画像から特徴ベクトルを抽出する特徴ベクトル抽出工程と、
    前記特徴ベクトル抽出工程により抽出された特徴ベクトルと、あり得るすべてのキー文字を記憶したキー文字辞書におけるキー文字の特徴ベクトルとを照合し、あり得るすべてのキー文字候補を検索する照合工程と、
    前記照合工程により検索された1つ以上のキー文字候補をそれぞれ有する複数の単一文字領域を認識する場合に、正当なキー文字パスを決定するキー文字パス決定工程と、
    を含んだことを特徴とするキー文字抽出方法。
  6. ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識手順をコンピュータに実行させる一括地名認識プログラムであって、
    前記一括地名認識手順は、
    前記地名画像から特徴ベクトルを抽出する抽出手順と、
    前記抽出手順により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合手順と、
    をコンピュータに実行させ、
    前記地名辞書に記憶された地名のうち、前記抽出手順により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
    さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識手順と、
    前記個別文字認識手順により得られた認識結果に基づいて、前記一括地名認識手順により決定された地名候補のフィルタリングをおこなう地名検証手順と、
    をコンピュータに実行させることを特徴とする一括地名認識プログラム。
  7. 前記一括地名認識手順は、前記照合手順によりあり得る地名候補が複数得られた場合に、所定のルールに従って複数のあり得る地名候補をフィルタリングする地名候補評価手順をさらにコンピュータに実行させることを特徴とする請求項6に記載の一括地名認識プログラム。
  8. 前記所定のルールは、複数のあり得る地名候補を照合距離に基づいて順位付けし、順位付けにより第1位となったあり得る地名候補を第1地名候補とした場合に、地名候補の照合距離と第1地名候補の照合距離との間の差の第1地名候補の照合距離に対する比を算出し、当該比が所定の閾値よりも小さくなる照合距離である地名候補のみを選択するルールであることを特徴とする請求項7に記載の一括地名認識プログラム。
  9. 一括地名認識装置であって、
    入力された地名画像から特徴ベクトルを抽出する抽出手段と、
    地名を記憶する地名辞書部と、
    前記地名辞書部に記憶された地名の特徴ベクトルと前記抽出手段により抽出された特徴ベクトルとを照合し、あり得るすべての地名候補および照合距離を求め、地名辞書に記憶された地名のうち、前記抽出手段により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定する照合手段と、
    降順に並んだ行政レベルの地名を含む複数の地名画像が入力され、当該地名画像の認識により行政レベルの地名を降順に含む複数の住所パスが形成される場合に、複数の住所パス候補の評価および決定をおこなう照合評価手段と、
    をさらに備えたことを特徴とする一括地名認識装置。
  10. ある行政レベルの地名を含む地名画像の地名を認識する一括地名認識工程を含む一括地名認識方法であって、
    前記一括地名認識工程は、
    前記地名画像から特徴ベクトルを抽出する抽出工程と、
    前記抽出工程により抽出された特徴ベクトルと、地名辞書に記憶された地名の特徴ベクトルとを照合し、あり得るすべての地名候補を検索する照合工程と、
    を含み、
    前記地名辞書に記憶された地名のうち、前記抽出工程により抽出された特徴ベクトルとの間の照合距離が所定の閾値よりも小さい特徴ベクトルに対応する地名をあり得る地名候補として決定し、
    さらに前記地名画像の単一文字領域の各々に含まれる文字の文字候補を認識する個別文字認識工程と、
    前記個別文字認識工程により得られた認識結果に基づいて、前記一括地名認識工程により決定された地名候補のフィルタリングをおこなう地名検証工程と、
    を含んだことを特徴とする一括地名認識方法。
JP2006207066A 2005-07-29 2006-07-28 一括地名認識プログラム、一括地名認識装置および一括地名認識方法 Expired - Fee Related JP5217127B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CNB2005100895370A CN100555308C (zh) 2005-07-29 2005-07-29 地址识别装置和方法
CN200510089537.0 2005-07-29

Publications (2)

Publication Number Publication Date
JP2007042097A true JP2007042097A (ja) 2007-02-15
JP5217127B2 JP5217127B2 (ja) 2013-06-19

Family

ID=37674166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006207066A Expired - Fee Related JP5217127B2 (ja) 2005-07-29 2006-07-28 一括地名認識プログラム、一括地名認識装置および一括地名認識方法

Country Status (2)

Country Link
JP (1) JP5217127B2 (ja)
CN (1) CN100555308C (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243208A (ja) * 2007-03-27 2008-10-09 Fujitsu Ltd 住所認識装置
JP2018060474A (ja) * 2016-10-07 2018-04-12 富士通株式会社 地名抽出プログラム、地名抽出装置および地名抽出方法
JP2020187622A (ja) * 2019-05-16 2020-11-19 株式会社Pfu 情報処理装置、制御方法及び制御プログラム
CN113111229A (zh) * 2020-02-13 2021-07-13 北京明亿科技有限公司 基于正则表达式的接处警文本轨迹地地址提取方法和装置
CN113111230A (zh) * 2020-02-13 2021-07-13 北京明亿科技有限公司 基于正则表达式的接处警文本户籍地地址提取方法和装置
JP2021149531A (ja) * 2020-03-19 2021-09-27 株式会社Pfu 情報処理装置、修正候補表示方法、及びプログラム
JP2022533065A (ja) * 2020-04-16 2022-07-21 シェンチェン センスタイム テクノロジー カンパニー リミテッド 文字認識方法及び装置、電子機器並びに記憶媒体

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359254B (zh) * 2007-08-03 2011-06-15 北京搜狗科技发展有限公司 一种提高姓名词条输入效率的字符输入方法和系统
US8275600B2 (en) * 2008-10-10 2012-09-25 Google Inc. Machine learning for transliteration
US20140037219A1 (en) * 2011-05-17 2014-02-06 Panasonic Corporation Character string extraction method and character string extraction device
CN103854021A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 词语识别方法及装置
CN104731978B (zh) * 2015-04-14 2018-03-09 海量云图(北京)数据技术有限公司 中文姓名数据的发现与分类方法
CN107133215A (zh) * 2017-05-20 2017-09-05 复旦大学 一种脱机手写中文规范地址识别方法
CN109359186B (zh) * 2018-10-25 2020-12-08 杭州时趣信息技术有限公司 一种确定地址信息的方法、装置和计算机可读存储介质
CN113111233B (zh) * 2020-02-13 2024-04-12 北京明亿科技有限公司 基于正则表达式的接处警文本居住地地址提取方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03257693A (ja) * 1990-03-08 1991-11-18 N T T Data Tsushin Kk 文字認識結果修正方式
JPH08129614A (ja) * 1994-10-28 1996-05-21 Oki Electric Ind Co Ltd 文字認識装置
JPH08287188A (ja) * 1995-04-17 1996-11-01 Nec Corp 文字列認識装置
JPH11120293A (ja) * 1997-10-16 1999-04-30 Fujitsu Ltd 文字認識/修正方式
JPH11272803A (ja) * 1998-01-22 1999-10-08 Fujitsu Ltd 住所認識装置及び住所認識方法
JP2000306045A (ja) * 1999-04-21 2000-11-02 Fujitsu Ltd 単語認識装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03257693A (ja) * 1990-03-08 1991-11-18 N T T Data Tsushin Kk 文字認識結果修正方式
JPH08129614A (ja) * 1994-10-28 1996-05-21 Oki Electric Ind Co Ltd 文字認識装置
JPH08287188A (ja) * 1995-04-17 1996-11-01 Nec Corp 文字列認識装置
JPH11120293A (ja) * 1997-10-16 1999-04-30 Fujitsu Ltd 文字認識/修正方式
JPH11272803A (ja) * 1998-01-22 1999-10-08 Fujitsu Ltd 住所認識装置及び住所認識方法
JP2000306045A (ja) * 1999-04-21 2000-11-02 Fujitsu Ltd 単語認識装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6011062242; 'セグメンテーションの負荷を軽減した手書き住所認識' 信学技報 PRMU98-161(1998-12) , 19981218 *
JPN6012031292; CHRISTOPHER J.C. BURGES: 'A Tutorial on Support Vector Machines for Pattern Recognition' Data Mining and Knowledge Discovery 第2巻, 1998, 第121〜167頁, Kluwer Academic Publishers *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243208A (ja) * 2007-03-27 2008-10-09 Fujitsu Ltd 住所認識装置
JP2018060474A (ja) * 2016-10-07 2018-04-12 富士通株式会社 地名抽出プログラム、地名抽出装置および地名抽出方法
JP2020187622A (ja) * 2019-05-16 2020-11-19 株式会社Pfu 情報処理装置、制御方法及び制御プログラム
CN113111229A (zh) * 2020-02-13 2021-07-13 北京明亿科技有限公司 基于正则表达式的接处警文本轨迹地地址提取方法和装置
CN113111230A (zh) * 2020-02-13 2021-07-13 北京明亿科技有限公司 基于正则表达式的接处警文本户籍地地址提取方法和装置
CN113111230B (zh) * 2020-02-13 2024-04-12 北京明亿科技有限公司 基于正则表达式的接处警文本户籍地地址提取方法和装置
CN113111229B (zh) * 2020-02-13 2024-04-12 北京明亿科技有限公司 基于正则表达式的接处警文本轨迹地地址提取方法和装置
JP2021149531A (ja) * 2020-03-19 2021-09-27 株式会社Pfu 情報処理装置、修正候補表示方法、及びプログラム
JP7421384B2 (ja) 2020-03-19 2024-01-24 株式会社Pfu 情報処理装置、修正候補表示方法、及びプログラム
JP2022533065A (ja) * 2020-04-16 2022-07-21 シェンチェン センスタイム テクノロジー カンパニー リミテッド 文字認識方法及び装置、電子機器並びに記憶媒体

Also Published As

Publication number Publication date
CN100555308C (zh) 2009-10-28
CN1904906A (zh) 2007-01-31
JP5217127B2 (ja) 2013-06-19

Similar Documents

Publication Publication Date Title
JP5217127B2 (ja) 一括地名認識プログラム、一括地名認識装置および一括地名認識方法
US20210034849A1 (en) System and method of character recognition using fully convolutional neural networks with attention
US10936862B2 (en) System and method of character recognition using fully convolutional neural networks
JP3639126B2 (ja) 住所認識装置及び住所認識方法
EP1362322B1 (en) Holistic-analytical recognition of handwritten text
CN109800414B (zh) 语病修正推荐方法及系统
Awal et al. First experiments on a new online handwritten flowchart database
KR100249055B1 (ko) 문자인식장치및방법
KR100716594B1 (ko) 문자 식별
JP2008532176A (ja) 認識グラフ
US20120070073A1 (en) Searching document images
WO2018090011A1 (en) System and method of character recognition using fully convolutional neural networks
CN101645134B (zh) 整体地名识别方法和整体地名识别装置
CN115510500B (zh) 一种文本内容的敏感分析方法及系统
Pal et al. A lexicon driven method for unconstrained Bangla handwritten word recognition
JP2003524258A (ja) 電子ドキュメントを処理する方法および装置
JP5003051B2 (ja) 郵便自動区分機及び郵便自動区分方法
CN113642320A (zh) 文档目录结构的提取方法、装置、设备和介质
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
Pal et al. Handwritten street name recognition for Indian postal automation
JPH11328317A (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JP2020102207A (ja) 受取人アドレスを認識する装置及び方法
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
CN112651590A (zh) 一种指令处理流程推荐的方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees