JPH11272803A - 住所認識装置及び住所認識方法 - Google Patents

住所認識装置及び住所認識方法

Info

Publication number
JPH11272803A
JPH11272803A JP10279931A JP27993198A JPH11272803A JP H11272803 A JPH11272803 A JP H11272803A JP 10279931 A JP10279931 A JP 10279931A JP 27993198 A JP27993198 A JP 27993198A JP H11272803 A JPH11272803 A JP H11272803A
Authority
JP
Japan
Prior art keywords
character
key character
pattern
address
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10279931A
Other languages
English (en)
Other versions
JP3639126B2 (ja
Inventor
Misako Suwa
美佐子 諏訪
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP27993198A priority Critical patent/JP3639126B2/ja
Priority to US09/229,329 priority patent/US6535619B1/en
Priority to KR1019990001820A priority patent/KR100339446B1/ko
Priority to CNB991013549A priority patent/CN100483450C/zh
Publication of JPH11272803A publication Critical patent/JPH11272803A/ja
Application granted granted Critical
Publication of JP3639126B2 publication Critical patent/JP3639126B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字同士が接触している場合においても、住
所認識を精度良く行う。 【解決手段】 住所の認識対象となるパターンが入力さ
れると、接触文字の接触位置を判定してから、接触文字
の切断を行い、切断された文字ごとに文字認識を行うこ
とにより、キー文字を抽出する。キー文字が抽出される
と、キー文字で区切られるパターンを一体的に取り出
し、キー文字によって区切られるパターン全体の特徴ベ
クトルを、地名単語の特徴ベクトルと照合することによ
り、地名単語の認識を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は住所認識装置に関
し、特に、フリーピッチ領域に書かれた手書き文字から
住所を読み取る場合などに適用して好適なものである。
【0002】
【従来の技術】従来の光学的文字認識装置(OCR)で
は、一文字ごとの認識結果から地名階層の区切りとなる
文字(以下、キー文字と称す。)を抽出することによ
り、地名領域を特定し、住所を読み取るものがあった。
【0003】図28は、従来の住所認識装置の構成を示
すブロック図である。図28において、文字切り出し部
501では、入力画像の可能な切り出し方の全てを切り
出し候補として、一文字の切り出しが行われる。文字認
識部502では、一文字として切り出し可能な全ての候
補について、第1位の候補から第N位の候補までの認識
結果が出力される。キー文字抽出部503では、第1位
の候補から第N位の候補の中に、「都」、「道」、
「府」、「県」、「市」、「郡」、「区」、「町」、
「村」、「字」等のキー文字が1つでも含まれる場合、
その切り出し候補がキー文字として抽出される。
【0004】地名領域候補検索部504では、キー文字
とキー文字との間に挟まれる領域が地名領域候補として
検索される。地名検索部506では、文字認識部502
で得られた第1位の候補から第M位(M≦N)の候補ま
での文字と地名辞書505とのマッチングを一文字ごと
に行い、地名辞書505と一文字でもマッチングする地
名が地名候補として検索される。地名候補評価値演算部
507では、地名候補の評価値を計算することにより、
地名検索部506で検索された地名候補の中から、最も
確からしい地名候補が求められる。地名候補選択部50
9では、地名階層辞書508を参照することにより、地
名検索部506で検索された地名候補が、前後に接続す
る地名候補と矛盾が生じていないかどうかを調べ、矛盾
が生じていない地名候補が得られたら、この地名候補を
住所として出力する。
【0005】この従来の住所認識装置は、例えば、特開
平7−262320号公報に記載されている。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
住所認識装置では、フリーピッチ領域に書かれた手書き
文字列から住所を読み取る場合、読み取り対象となる文
字同士が接触していると、接触している複数の文字が一
文字として扱われるため、誤読が生じるという問題があ
った。
【0007】また、フリーピッチ領域から切り出し可能
な候補の全てに対して認識が行われるため、認識の対象
となるパターンの数が増加し、処理が膨大になるという
問題があった。。
【0008】また、第1位の候補から第N位の候補の中
にキー文字が1つでも含まれる場合、その切り出し候補
の全てがキー文字として抽出される。このため、キー文
字でないものがキー文字として抽出され、地名領域を区
切るためのキー文字の組み合わせが多数出現し、処理が
膨大になるという問題があった。。
【0009】また、第1位の候補から第M位の候補の中
に、地名辞書505に登録されている地名と一文字でも
マッチングする地名がある場合、それらの地名は全て地
名候補として検索されるので、地名候補が多数出現し、
住所を特定するための処理が膨大になるという問題があ
った。。
【0010】そこで、本発明の第1の目的は、文字同士
が接触している場合においても、住所認識を精度良く行
うことが可能な住所認識装置を提供することである。ま
た、本発明の第2の目的は、住所認識を効率よく行うこ
とが可能な住所認識装置を提供することである。
【0011】
【課題を解決するための手段】上述した課題を解決する
ために、本発明によれば、接触文字の切断結果に基づい
て、キー文字の抽出を行うキー文字抽出手段と、前記キ
ー文字の位置に基づいて、地名領域を抽出する地名領域
抽出手段と、前記接触文字の切断前の状態に基づいて、
前記地名領域の地名の認識を行う地名認識手段とを備え
ている。
【0012】このことにより、住所を表す文字列が接触
している場合においても、キー文字を抽出することが可
能となり、地名を表す文字列を一体的に抽出することが
可能となるとともに、地名を表す文字列を一体的に処理
して地名の認識を行うことが可能となることから、地名
を表す文字列を一文字ごとに切り分ける際の処理を省略
して、住所の認識を効率的に行うことが可能となる。ま
た、地名を表す文字列を切り分ける必要がなくなること
から、地名を表す文字列が間違った位置で切断されるこ
とをなくすことができ、住所認識の正確性を向上させる
ことが可能となる。
【0013】また、本発明の一態様によれば、キー文字
によって区切られるパターン全体の特徴ベクトルを、地
名登録辞書に登録された地名の特徴ベクトルと照合する
ことにより、地名の認識を行うようにしている。
【0014】このことにより、地名を表す文字列を一文
字ごとに切り分けることなく、認識処理を一体的に行う
ことが可能となり、住所認識の効率性及び正確性を向上
させることが可能となる。
【0015】また、本発明の一態様によれば、キー文字
で特定される属性ごとに地名を登録しておき、キー文字
によって区切られるパターンの特徴ベクトルを、キー文
字で特定される属性を有する地名と照合するようにして
いる。
【0016】このことにより、例えば、キー文字によっ
て区切られるパターンの属性が「県」ならば、「県」に
関する地名を登録した辞書を用いて照合を行うことが可
能となり、キー文字で特定される属性に対応した照合が
可能となるため、認識精度を向上させることが可能とな
る。
【0017】また、本発明の一態様によれば、入力パタ
ーンから抽出された連結パターンを切断する際に、入力
パターンのサイズに基づいて、切断位置の評価を行うよ
うにしている。
【0018】このことにより、入力パターンからキー文
字を抽出する際に、キー文字を抽出するのに適した大き
さに連結パターンを分離することが可能となり、連結パ
ターンの切断位置の数を減らして、認識処理の回数を減
らすことが可能となることから、住所の認識を効率的に
行うことが可能となる。
【0019】また、本発明の一態様によれば、連結パタ
ーンのサイズに基づいて、切断位置の検出を行う連結パ
ターンを選択するようにしている。このことにより、接
触文字の可能性のある比較的大きな連結パターンについ
てだけ切断位置の検出を行い、接触文字とは認められな
い小さな連結パターンについては、切断位置の検出を省
略することが可能となり、住所認識の効率性を向上させ
ることが可能となる。
【0020】また、本発明の一態様によれば、入力パタ
ーンについての黒画素数ヒストグラムの極小点の値が所
定値以下の点を切断点候補としている。このことによ
り、文字自体のくびれ部分と他の文字との接触部分とを
識別することが可能となり、文字同士の接触点のみを精
度良く検出することが可能となることから、連結パター
ンを文字同士の接触点で切断することが可能となる。
【0021】また、本発明の一態様によれば、連結パタ
ーンを切断した時の縦横比が所定の範囲外の領域にある
切断位置を、切断点候補から除外するようにしている。
このことにより、連結パターンがキー文字を抽出するの
に不適当な大きさに切断されることを防止して、キー文
字の対象とならないパターンが生成されることを防止す
ることが可能となり、キー文字の対象とならないパター
ンについて無駄な処理が行われることを防止することが
可能となることから、住所認識を効率的に行うことが可
能となる。
【0022】また、本発明の一態様によれば、横書きな
ら、平均文字サイズの文字幅の1/2の大きさの倍数の
位置、縦書きなら、平均文字サイズの文字高の1/2の
大きさの倍数の位置を算出し、黒画素数ヒストグラムの
極小点のうち、算出された位置の前後一定範囲内にある
極小点だけを仮切断点候補とする。
【0023】このことにより、横書きなら、キー文字の
「偏」または「旁」のみ、縦書きなら、キー文字の
「冠」、「連火」または「脚」のみが他の文字と接触す
る場合においても、これらのキー文字の一部分を接触文
字から効率的に抽出することが可能となり、元のキー文
字を効率的に復元することが可能となる。
【0024】また、本発明の一態様によれば、仮切断候
補点は、平均文字サイズの1/2の大きさの倍数の位置
から一定範囲内の点のうち、黒画素数ヒストグラムの値
が最も小さい極小点である。
【0025】このことにより、平均文字サイズの1/2
の大きさの倍数の位置から一定範囲内の中に、黒画素数
ヒストグラムの極小点が複数存在している場合において
も、仮切断候補点を1つだけに絞り込むことができ、連
結パターンが文字の切れ目でないところで細かく切断さ
れて、処理が複雑になることを防止することが可能とな
る。
【0026】また、本発明の一態様によれば、仮切断候
補点は、黒画素数ヒストグラムの値が最も小さい極小点
のうち、平均文字サイズの1/2の大きさの倍数の位置
に最も近い点である。
【0027】このことにより、平均文字サイズの1/2
の大きさの倍数の位置から一定範囲内の中に、黒画素数
ヒストグラムの値が最も小さい極小点が複数存在してい
る場合においても、仮切断候補点を1つだけに絞り込む
ことができ、連結パターンが文字の切れ目でないところ
で細かく切断されて、処理が複雑になることを防止する
ことが可能となる。
【0028】また、本発明の一態様によれば、切断され
たパターンについての統合結果に基づいて、キー文字を
抽出するようにしている。このことにより、文字の一部
分のみが他の文字と接触している場合においても、文字
の一部分を他の文字と切り離し、切り離された文字の一
部分を本来の文字の残りの部分と合体させることが可能
となり、キー文字の誤認識を防止することが可能とな
る。
【0029】また、本発明の一態様によれば、入力パタ
ーンから抽出されたキー文字候補のうち、上位にランク
されたキー文字候補を優先的に使用することにより、地
名領域を抽出するようにしている。
【0030】このことにより、キー文字候補として誤っ
て抽出された文字が、地名領域の抽出に使用されること
を減らすことが可能となり、地名領域として抽出される
候補の数を減らして、地名の認識処理の回数を減らすこ
とが可能となることから、住所認識の効率性を向上させ
ることが可能となる。
【0031】また、本発明の一態様によれば、キー文字
候補のキー文字らしさ、キー文字種、階層レベル、位置
座標、隣接するパターンと統合するか否かの情報を記述
したパターン情報テーブルを生成する。
【0032】このことにより、パターン情報テーブルを
参照して、処理を迅速に行うことが可能となり、住所認
識の効率性を向上させることが可能となる。また、本発
明の一態様によれば、キー文字の配置順序及び配置位
置、またはキー文字同士の組み合わせが住所の表示に用
いられるものとして適当であるかどうかを判定するよう
にしている。
【0033】このことにより、地名を表す文字の中に住
所のキー文字が含まれている場合においても、地名を表
す文字の中に含まれているキー文字をキー文字の抽出対
象から除去し、地名の階層を表すために用いられている
文字のみをキー文字として抽出することが可能となり、
地名領域の誤抽出を防止して、住所認識を効率的に行う
ことが可能となる。
【0034】また、本発明の一態様によれば、一部選択
項目により指定されたキー文字が存在する場合、そのキ
ー文字の階層レベルより下の階層レベルから、キー文字
候補の組の決定を行うようにしている。
【0035】このことにより、アンケート葉書などのよ
うに、住所の一部選択項目が設けられている場合におい
ても、キー文字抽出の精度を向上させることが可能とな
る。また、本発明の一態様によれば、上位にランクされ
たキー文字候補を用いただけでは、住所の表示として適
当なキー文字同士の組み合わせが得られない場合、下位
にランクされたキー文字候補を追加するようにしてい
る。
【0036】このことにより、地名領域を抽出する際の
正確性を損なうことなく、キー文字候補の数を必要最小
限に抑えることが可能となる。また、本発明の一態様に
よれば、下位にランクされたキー文字候補のうち、住所
の表示に使用されるキー文字の組に欠けているものだけ
を追加するようにしている。
【0037】このことにより、下位にランクされたキー
文字候補の中から必要なものだけを選択して、キー文字
候補とすることができ、キー文字抽出を効率的に行うこ
とが可能となる。
【0038】また、本発明の一態様によれば、住所の文
字列から抽出されたキー文字候補のキー文字らしさを算
出し、キー文字らしさの大きいキー文字候補を優先的に
用いてキー文字候補の組を決定するようにしている。
【0039】このことにより、抽出されたキー文字候補
の組み合わせの中から、住所階層構造知識及び住所中キ
ー文字位置知識に矛盾しないキー文字候補の組を決定す
る場合、キー文字候補の組み合わせの数を減らして処理
時間を短縮することが可能となり、住所認識を効率よく
行うことが可能となる。
【0040】また、本発明の一態様によれば、住所表示
に用いられる地名同士の組み合わせ、または住所表示に
用いられる地名の配列順序が適当であるかどうかを判定
するようにしている。
【0041】このことにより、地名領域のパターンに対
して複数の地名候補が提示され、それらの地名候補を組
み合わせることにより複数の住所候補が得られる場合に
おいても、住所の表示として現存しない地名の組み合わ
せを除去して、実在する住所のだけを識別することが可
能となり、住所認識の精度を向上させることが可能とな
る。
【0042】また、本発明の一態様によれば、住所の文
字列から抽出されたパターンを一文字ずつ照合した住所
の認識結果も出力するようにしている。このことによ
り、キー文字抽出に失敗した場合においても、住所の認
識を行うことが可能となり、住所認識の信頼性を向上さ
せることが可能となる。
【0043】また、本発明の一態様によれば、キー文字
認識用辞書に登録される文字種がキー文字種及び前記キ
ー文字種の類似文字種のみに字種限定されている。この
ことにより、入力画像から切り出されたパターンの中か
らキー文字を抽出する場合、キー文字認識用辞書に全て
の文字種が登録されている場合に比べて、入力画像から
切り出されたパターンとキー文字認識用辞書に登録され
ている文字種との比較回数を低減させることが可能とな
り、住所認識の処理時間を短縮することが可能となる。
【0044】一方、キー文字認識用辞書にキー文字種の
みが登録されている場合には、どのようなパターンを認
識させた場合においても、キー文字種の出現順位が常に
第1位となり、認識対象のパターンがキー文字と類似し
ていると、キー文字でないパターンがキー文字として誤
って抽出されることがある。これに対し、キー文字種の
類似文字種を登録しておくことにより、キー文字に類似
しているが、キー文字でないパターンについては、キー
文字種の類似文字種の出現順位が第1位となり、キー文
字種の出現順位が下がることから、キー文字種の出現順
位を調べることにより、キー文字に類似しているキー文
字でないパターンがキー文字種かどうかを判別すること
が可能となり、キー文字に類似しているキー文字でない
パターンがキー文字として誤って抽出されることを防止
することが可能となる。
【0045】また、本発明の一態様によれば、ある文字
種についての文字認識を行ったサンプルパターンの個数
Mに対し、前記文字認識の結果のN位以内にキー文字種
を含むサンプルパターンの個数Kの割合が一定値以上の
場合、前記文字種を前記キー文字種の類似文字種とする
ようにしている。
【0046】このことにより、様々な手書き文字につい
て、キー文字として誤って抽出される頻度の大きいキー
文字でないパターンを特定することが可能となり、キー
文字種の類似文字種を精度よく判別することが可能とな
る。
【0047】
【発明の実施の形態】以下、本発明の一実施例に係わる
住所認識装置について図面を参照しながら説明する。
【0048】図1は、本発明の第1実施例に係わる住所
認識装置の構成を示すブロック図である。図1におい
て、キー文字抽出手段101は、入力画像からキー文字
の抽出を行う。一括認識手段10は、キー文字抽出手段
101により抽出されたキー文字で区切られるパターン
の認識を一括して行う。この一括認識は、例えば、キー
文字で区切られるパターンをそれぞれひとまとまりとし
て、そのパターンから抽出された特徴ベクトルと、地名
単語を表す文字または文字列をひとまとまりとした特徴
ベクトルとを比較することにより行うことができる。
【0049】このように、入力画像からキー文字を抽出
し、入力画像のパターンをキー文字の位置で区切ること
により、1つの地名単語に対応するパターンを入力画像
から一括して切り出すことが可能となり、さらに、一括
して切り出されたパターンを一括して認識するようにし
たので、住所の認識を効率よく行うことが可能となる。
【0050】図2は、本発明の一実施例に係わる住所認
識方法を示す図である。図2において、手書き文字で
「栃木県下都賀郡壬生町」と書かれた原画像が入力され
たものとすると、「栃木県下都賀郡壬生町」という原画
像のパターンの中から、キー文字候補を抽出する。この
結果、「県」、「都」、「郡」、「町」というキー文字
候補が抽出される。
【0051】なお、キー文字候補の抽出は、「栃木県下
都賀郡壬生町」という原画像のパターンから一文字切り
出しを行い、切り出したパターンを一文字づつ認識させ
ることにより行うことができる。
【0052】次に、「県」、「都」、「郡」、「町」と
いうキー文字候補を組み合わせた場合、実際の住所に使
用される組み合わせだけを取り出す。この結果、
「県」、「都」、「郡」、「町」というキー文字候補の
組み合わせとして、{県、郡、町}というキー文字組候
補、{都、郡、町}というキー文字組候補、及び{郡、
町}というキー文字組候補が得られる。
【0053】次に、「栃木県下都賀郡壬生町」という原
画像のパターンを、キー文字組候補の各キー文字の位置
で区切り、キー文字の位置で区切られたパターンを原画
像から切り出す。
【0054】この結果、{県、郡、町}というキー文字
組候補については、「栃木」という原画像のパターンを
含む切り出し領域R1、「下都賀」という原画像のパタ
ーンを含む切り出し領域R2、及び「壬生」という原画
像のパターンを含む切り出し領域R3が得られる。
【0055】また、{都、郡、町}というキー文字組候
補については、「栃木県下」という原画像のパターンを
含む切り出し領域R4、「賀」という原画像のパターン
を含む切り出し領域R5、及び「壬生」という原画像の
パターンを含む切り出し領域R6が得られる。
【0056】また、{郡、町}というキー文字組候補に
ついては、「栃木県下都賀」という原画像のパターンを
含む切り出し領域R7、及び「壬生」という原画像のパ
ターンを含む切り出し領域R8が得られる。
【0057】次に、{県、郡、町}というキー文字組候
補について、原画像から切り出された切り出し領域R1
〜R3に含まれるパターンの認識処理をそれぞれ一括し
て行う。この一括認識処理では、地名単語を表す文字ま
たは文字列をひとまとまりとした特徴ベクトルを地名単
語辞書103に登録しておく。そして、原画像の各切り
出し領域R1〜R3のパターンをそれぞれひとまとまり
として、そのパターンから抽出された特徴ベクトルと、
地名単語辞書103に登録されている特徴ベクトルとが
比較される。
【0058】例えば、地名単語辞書103には、「栃
木」という地名単語に対応する特徴ベクトル、「下都
賀」という地名単語に対応する特徴ベクトル、「壬生」
という地名単語に対応する特徴ベクトルが登録されてい
るものとすると、切り出し領域R1〜R3に含まれる原
画像のパターンの特徴ベクトルが、地名単語辞書103
に登録されている特徴ベクトルと比較される。この結
果、切り出し領域R1に含まれる原画像のパターンの特
徴ベクトルと距離が近いものとして、「栃木」という地
名単語が地名単語辞書103から検索され、切り出し領
域R1に含まれる原画像のパターンの認識結果として、
「栃木」という地名単語が出力される。また、切り出し
領域R2に含まれる原画像のパターンの特徴ベクトルと
距離が近いものとして、「下都賀」という地名単語が地
名単語辞書103から検索され、切り出し領域R2に含
まれる原画像のパターンの認識結果として、「下都賀」
という地名単語が出力される。また、切り出し領域R3
に含まれる原画像のパターンの特徴ベクトルと距離が近
いものとして、「壬生」という地名単語が地名単語辞書
103から検索され、切り出し領域R3に含まれる原画
像のパターンの認識結果として、「壬生」という地名単
語が出力される。
【0059】また、{都、郡、町}というキー文字組候
補について、原画像から切り出された切り出し領域R4
〜R6に含まれるパターンの認識処理がそれぞれ一括し
て行われる。すなわち、切り出し領域R4〜R6に含ま
れる原画像のパターンの特徴ベクトルが、地名単語辞書
103に登録されている特徴ベクトルと比較される。こ
こで、切り出し領域R4に含まれる「栃木県下」という
地名は、実際には存在しないため、地名単語辞書103
には、「栃木県下」という地名単語に対応する特徴ベク
トルは登録されていない。この結果、切り出し領域R4
に含まれる原画像のパターンの特徴ベクトルと距離が近
いものは、地名単語辞書103から検索されないため、
認識不能という結果が出力される。
【0060】また、切り出し領域R5に含まれる「賀」
という地名は、実際には存在しないため、地名単語辞書
103には、「賀」という地名単語に対応する特徴ベク
トルは登録されていない。この結果、切り出し領域R5
に含まれる原画像のパターンの特徴ベクトルと距離が近
いものは、地名単語辞書103から検索されないため、
認識不能という結果が出力される。
【0061】また、切り出し領域R6に含まれる原画像
のパターンの特徴ベクトルと距離が近いものとして、
「壬生」という地名単語が地名単語辞書103から検索
され、切り出し領域R6に含まれる原画像のパターンの
認識結果として、「壬生」という地名単語が出力され
る。
【0062】また、{郡、町}というキー文字組候補に
ついて、原画像から切り出された切り出し領域R7、R
8に含まれるパターンの認識処理がそれぞれ一括して行
われる。すなわち、切り出し領域R7、R8に含まれる
原画像のパターンの特徴ベクトルが、地名単語辞書10
3に登録されている特徴ベクトルと比較される。ここ
で、切り出し領域R7に含まれる「栃木県下都賀」とい
う地名は、実際には存在しないため、地名単語辞書10
3には、「栃木県下都賀」という地名単語に対応する特
徴ベクトルは登録されていない。この結果、切り出し領
域R7に含まれる原画像のパターンの特徴ベクトルと距
離が近いものは、地名単語辞書103から検索されない
ため、認識不能という結果が出力される。
【0063】また、切り出し領域R8に含まれる原画像
のパターンの特徴ベクトルと距離が近いものとして、
「壬生」という地名単語が地名単語辞書103から検索
され、切り出し領域R8に含まれる原画像のパターンの
認識結果として、「壬生」という地名単語が出力され
る。
【0064】地名単語の一括認識処理を行った結果、
{都、郡、町}というキー文字組候補、及び{郡、町}
というキー文字組候補については、地名単語の認識不能
という結果が出力されたので、これらのキー文字組候補
を却下し、{県、郡、町}というキー文字組候補を選択
する。この結果、手書き文字で書かれた「栃木県下都賀
郡壬生町」という原画像のパターンについて、「栃木県
下都賀郡壬生町」という住所の認識結果を出力すること
が可能となる。図3は、本発明の第2実施例に係わる住
所認識装置の構成を示すブロック図である。図3におい
て、接触位置判定手段1は、接触文字の接触位置を判定
する。接触文字切断手段2は、接触位置判定手段1で判
定された接触位置で接触文字を切断する。キー文字抽出
手段3は、接触文字切断手段2による接触文字の切断結
果に基づいて、キー文字の抽出を行う。地名領域抽出手
段4は、キー文字抽出手段3で抽出されたキー文字の位
置に基づいて、地名領域を抽出する。地名認識手段5
は、接触文字の切断前の状態に基づいて、地名領域抽出
手段4で抽出された地名領域の地名の認識を行う。
【0065】住所の認識対象となるパターンが入力され
ると、接触文字の接触位置が判定され、接触文字の切断
が行われる。接触文字が切断されると、切断された文字
ごとに文字認識が行われ、キー文字が抽出される。キー
文字が抽出されると、キー文字で区切られるパターンを
一体的に取り出し、キー文字によって区切られるパター
ン全体の特徴ベクトルを、地名の特徴ベクトルと照合す
ることにより、地名の認識を行う。
【0066】このように、接触文字のパターンの切断処
理をキー文字抽出処理に用いることにより、キー文字領
域以外の領域で入力パターンが細切れにされることを防
止することが可能となり、認識処理の対象となるパター
ンが多数生成されることを防止して、認識処理の回数を
減らし、キー文字の抽出を効率的に行うことが可能とな
る。
【0067】また、キー文字によって区切られるパター
ン全体を一体的に認識することにより、キー文字によっ
て区切られるパターンを一文字ごとに切り分ける必要が
なくなり、処理を簡略化できるとともに、パターンの切
断位置を間違えることによる誤認識をなくすことが可能
となり、住所認識の正確性を向上させることが可能とな
る。
【0068】さらに、キー文字によって区切られるパタ
ーン全体が一体的に処理されるので、キー文字によって
区切られるパターンの中の一文字でも一致する地名を全
て検索する場合に比べて、地名候補の数を減らすことが
可能となり、処理の効率化を図ることが可能となる。
【0069】図4は、本発明の第3実施例に係わる住所
認識装置の構成を示すブロック図である。図4におい
て、切断位置検出手段11は、連結パターンの切断位置
を検出する。切断位置評価手段12は、入力パターンの
サイズに基づいて、切断位置検出手段11で検出された
切断位置の評価を行う。連結パターン切断手段13は、
切断位置評価手段12での評価結果に基づいて、連結パ
ターンを切断する。キー文字抽出手段14は、連結パタ
ーン切断手段13による連結パターンの切断結果に基づ
いて、キー文字を抽出する。地名領域抽出手段15は、
キー文字抽出手段14で抽出されたキー文字の位置に基
づいて、地名領域を抽出する。地名認識手段16は、地
名領域抽出手段15で抽出された地名領域の地名の認識
を行う。
【0070】住所の認識対象となるパターンが入力され
ると、切断対象となるパターンを特定する。そして、切
断対象となるパターンについて、黒画素数ヒストグラム
を算出し、黒画素数ヒストグラムの極小点のうち、極小
点での値が所定値以下の点を切断点候補とする。ここ
で、これらの切断点候補の全ての位置でパターンを切断
すると、キー文字抽出に関係のない位置でパターンが細
切れにされ、その後の処理が増加する。このため、これ
らの切断点候補の中から、キー文字抽出と関係のある点
を選別する。具体的には、パターンを切断した時の縦横
比が所定の範囲内にある領域を検出し、この領域外にあ
る切断点候補を切断位置から除外する。この結果、キー
文字のサイズに対応した領域を一文字領域として切り出
すことができ、処理の効率化を図ることが可能となる。
【0071】図5は、本発明の第4実施例に係わる住所
認識装置の構成を示すブロック図である。図5におい
て、キー文字候補抽出手段21は、入力パターンからキ
ー文字候補を抽出する。ランク付け手段22は、キー文
字候補抽出手段21で抽出されたキー文字候補の認識結
果に基づいて、キー文字候補のランク付けを行う。地名
領域抽出手段23は、ランク付け手段22により上位に
ランクされたキー文字候補の位置に基づいて、地名領域
を抽出する。地名認識手段24は、地名領域抽出手段2
3で抽出された地名領域の地名の認識を行う。
【0072】住所の認識対象となるパターンが入力され
ると、入力されたパターンからキー文字候補を抽出す
る。このキー文字候補の抽出では、手書き文字が誤認識
された結果、キー文字でないものがキー文字候補として
抽出される場合があり、このような誤認識があると、キ
ー文字候補として抽出されるパターンの数が増加し、処
理時間が増加する。このため、認識結果の距離や順位な
どに基づいて、キー文字らしさを定義し、キー文字らし
さが大きいものを優先的にキー文字候補として使用す
る。この結果、キー文字候補として誤って抽出されたパ
ターンをキー文字候補から除外し、地名領域の候補に挙
がる数を減らすことができるので、処理を効率よく行う
ことが可能となる。
【0073】図6は、本発明の第5実施例に係わる住所
認識装置の構成を示すブロック図である。この住所認識
装置は、光学的文字認識装置(OCR)により、アンケ
ート葉書やユーザ登録葉書、通信販売等の発注用葉書な
どの横書きの一文字枠のない自由手書き文字の住所を読
み取る場合などに使用することができる。
【0074】図6において、ラベリング部31は、スキ
ャナ等で読み込まれた二値化された画像から住所領域を
抽出して切り出しを行ったパターンに対し、各連結成分
ごとにラベル付けを行う。
【0075】一文字領域決定部32は、ラベル付けされ
た連結パターンのサイズや隣接するパターンとの距離な
どから、連結パターンの統合を行い、一文字領域を求め
る。平均文字サイズ計算部33は、接触文字などの他の
パターンと比べて大きなパターン、及び他のパターンと
比べて小さなパターンを除くなどして平均文字サイズを
計算する。
【0076】接触箇所判定・切断部34は、ヒストグラ
ム作成部35、仮切断点候補抽出部36及び仮切断点候
補決定部37を備えている。ヒストグラム作成部35
は、横書きなら、平均文字幅に対するパターンの幅の
比、縦書きなら、平均文字高に対するパターンの高さの
比、及び、パターンの外接矩形の縦横比等を用いてパタ
ーンの接触の可能性を判定する。そして、接触文字と判
定されたパターンに対して、文字列と垂直方向に黒画素
数をカウントし、移動平均を用いて平滑化した黒画素数
ヒストグラムを作成する。
【0077】仮切断点候補抽出部36は、ヒストグラム
作成部35により作成された黒画素数ヒストグラムから
極小点を検出し、黒画素数ヒストグラムの極小点の値が
しきい値以下の点を仮切断点候補とする。
【0078】仮切断点候補決定部37は、対象パターン
において、横書きなら、パターンの外接矩形の端点から
水平方向に平均文字幅の1/2の整数倍の点が最も接触
個所である可能性の高い点として、これらの点から一定
の範囲内にある仮切断点候補を、仮切断点として決定す
る。平均文字幅の1/2の整数倍の点から一定の範囲内
に仮切断点候補が複数あった場合、黒画素数ヒストグラ
ムの値が最も小さい点を、仮切断点として決定する。黒
画素数ヒストグラムの値が最も小さい点が複数あった場
合、平均文字幅の1/2の整数倍の点からの距離が最も
小さい点を、仮切断点として決定する。
【0079】また、対象パターンにおいて、縦書きな
ら、パターンの外接矩形の端点から垂直方向に平均文字
高の1/2の整数倍の点が最も接触個所である可能性の
高い点として、これらの点から一定の範囲内にある仮切
断点候補を、仮切断点として決定する。平均文字高の1
/2の整数倍の点から一定の範囲内に仮切断点候補が複
数あった場合、黒画素数ヒストグラムの値が最も小さい
点を、仮切断点として決定する。黒画素数ヒストグラム
の値が最も小さい点が複数あった場合、平均文字高の1
/2の整数倍の点からの距離が最も小さい点を、仮切断
点として決定する。
【0080】仮切断点が得られたら、仮切断点を通る直
線または曲線でパターンを仮切断する。キー文字認識用
辞書38は、住所に関係している文字の特徴ベクトルを
格納する。
【0081】キー文字候補抽出部39は、パターン統合
判定・統合部40、特徴抽出部41、辞書照合部42及
びパターン情報テーブル作成部43を備えている。パタ
ーン統合判定・統合部40は、文字列の端のパターンか
ら順に、互いに隣接するパターンを統合した場合、統合
パターンが文字である可能性があるか否かを、統合後の
パターンの幅と高さに基づいて判定する。そして、文字
である可能性があると判定された統合パターンが得られ
た場合、統合可能なパターンを隣接するパターンと仮統
合することにより、仮統合パターンを生成する。
【0082】特徴抽出部41は、統合不可のパターンに
対しては、単独パターンのみについて特徴抽出を行い、
統合可能なパターンに対しては、単独パターンと統合パ
ターンの双方について特徴抽出を行う。
【0083】辞書照合部42は、統合不可のパターンに
対しては、単独パターンの特徴ベクトルとキー文字認識
用辞書38に登録されている文字の特徴ベクトルとを照
合することにより、第1位〜第N位までの候補文字種を
出力する。また、統合可能なパターンに対しては、単独
パターンと統合パターンのそれぞれの特徴ベクトルとキ
ー文字認識用辞書38に登録されている文字の特徴ベク
トルとを照合することにより、単独パターンと統合パタ
ーンのそれぞれについて、第1位〜第N位までの候補文
字種を出力する。
【0084】パターン情報テーブル作成部43は、第1
位〜第N位までの候補文字種の距離を求め、第N位まで
の候補文字種内にキー文字が含まれている場合、キー文
字に対応する候補文字種の距離または出現順位などによ
って、キー文字らしさを計算する。
【0085】例えば、このキー文字らしさは、パターン
を認識させた時の相違度または類似度で定義することが
できる。キー文字らしさの度合いを相違度を使って定義
すると、以下のような関数で表現することができる。
【0086】認識対象のパターンの特徴ベクトルと辞書
に登録されている文字種の特徴ベクトルとの間の距離の
ように、一般に値が大きくなると、辞書に登録されてい
る文字種である可能性が低くなる尺度を、相違度とい
う。あるパターンのキー文字種kに対するキー文字らし
さの度合いをfkとする。fkは、あるパターンとキー
文字種kとの相違度dの関数である。fkに期待される
性質は以下の通りである。
【0087】a.あるパターンがキー文字種kに対し
て、最もキー文字らしい時1、最もキー文字らしくない
時0の値をとる。すなわち、fkは、あるパターンとキ
ー文字種kとの相違度dが最小値dminの時1、最大
値dmaxの時1をとることから、以下の条件を満た
す。
【0088】fk(dmin)=1 fk(dmax)=0 0≦fk(d)≦1 ただし、dmin≦d≦dmaxである。
【0089】b.相違度dが一定の場合、対象とするキ
ー文字種の認識候補中の出現順位が低いほど、そのキー
文字らしさの度合いは低くなる。c.相違度と認識候補
中の出現順位が同一の場合で、かつ、対象とするキー文
字種の認識候補中の出現順位が第1位でない場合、第1
位文字種との相違度と、キー文字種との相違度との差が
大きいほど、キー文字らしさの度合いは低くなる。
【0090】以上の3つの性質を満たす関数は、例え
ば、次式のように実現できる。 fk(di)=1/{1+i×((d1−di)/d
c)×(di/dc)} ただし、0≦di<∞である。
【0091】ここで、iは、あるパターンを認識させた
時、認識結果候補文字種にキー文字種kが出現した順位
であり、diはその時の相違度、dcは実験によって適
切に決定される定数である。
【0092】また、キー文字らしさの度合いを類似度を
使って定義すると、以下のような関数で表現することが
できる。一般に、値が小さくなると、あるパターンが文
字種kである可能性が低くなる尺度を、類似度という。
類似度を使った場合、fkは、あるパターンとキー文字
種kとの類似度sの関数となり、以下の性質を持つ。
【0093】a.あるパターンがキー文字種kに対して
最もキー文字らしい時1、最もキー文字らしくない時0
の値をとる。すなわち、あるパターンのキー文字種kと
の類似度sが最大値の時smax1、最小値sminの
時0となることから、fkは、以下の条件を満足する。
【0094】fk(smax)=1 fk(smin)=0 0≦fk(s)≦1 b.類似度が一定の場合、対象とするキー文字種の認識
候補中の出現順位が低いほど、そのキー文字らしさの度
合いは低くなる。
【0095】c.類似度と候補順位が同一の場合で、か
つ、対象とするキー文字種の認識候補中の出現順位が第
1位でない場合、第1位文字種との類似度と、キー文字
種との類似度との差が大きいほど、キー文字らしさの度
合いは低くなる。
【0096】以上の3つの性質を満たす関数は、例え
ば、次式のように実現できる。 fk(di)=(si/sc)/{1+i×((si−
s1)/sc)} ただし、0≦fk≦1,0≦si<1である。
【0097】ここで、iは、あるパターンを認識させた
時、認識結果候補文字種にキー文字種kが出現した順位
であり、siはその時の類似度、scは実験によって適
切に決定される定数である。
【0098】キー文字らしさが計算されると、キー文字
らしさがしきい値以上のものをキー文字候補とし、しき
い値より小さく、0でないものを準キー文字候補とす
る。以上のようにして求めたキー文字らしさ、キー文字
らしさが0でないキー文字種、仮切断・仮統合の有無、
画像中の外接矩形座標等の情報をパターン情報テーブル
に登録する。
【0099】住所知識部44は、住所階層構造知識部4
5及び住所中キー文字位置知識部46を備えている。住
所階層構造知識部45は、「都」、「道」、「府」、
「県」、「市」、「町」、「村」及び「郡」等のキー文
字の階層構造に関する住所階層構造知識を登録する。例
えば、キー文字の「群」の後の住所の中には、キー文字
の「町」、「村」のみが存在し、キー文字の「区」、
「市」などが存在することはないという情報などが登録
される。なお、住所階層構造知識では、最上階層の
「都」、「道」、「府」または「県」が省略された場合
も考慮される。
【0100】住所中キー文字位置知識部46は、キー文
字の住所中での可能な配置位置に関する住所中キー文字
位置知識を登録する。例えば、キー文字は住所の先頭に
配置されることはないという情報や、キー文字が隣接し
て出現することはないという情報、キー文字として
「県」が最後にくる地名の文字数は、3文字または4文
字であるという情報などが登録される。
【0101】キー文字組候補決定部47は、住所階層構
造知識部45及び住所中キー文字位置知識部46から、
住所階層構造知識と住所中キー文字位置知識とを呼び出
す。そして、抽出したキー文字の全ての組み合わせにつ
いて、住所階層構造知識及び住所中キー文字位置知識に
矛盾しないものを、キー文字候補の組として決定する。
キー文字候補の組が決定されなかった場合は、不足キー
文字再抽出部48に対し、不足するキー文字の階層及び
文字種の情報を送り、キー文字候補の再抽出を要求す
る。キー文字候補の再抽出が成功した場合は、再抽出さ
れたキー文字候補も含めて、キー文字候補の組を決定す
る。キー文字候補の組が決定されると、仮切断・仮統合
していたものを切断・統合することに決定する。
【0102】不足キー文字再抽出部48は、パターン情
報テーブルに登録されているキー文字候補を用いただけ
では、住所階層構造知識及び住所中キー文字位置知識と
矛盾しないキー文字候補の組み合わせが見つからず、キ
ー文字候補の組を決定できなかった場合、パターン情報
テーブルに登録されている準キー文字候補のうち、不足
する階層のキー文字種を認識結果の第N位までに含むパ
ターンを、キー文字候補として再抽出する。
【0103】地名単語領域切り出し部49は、キー文字
組候補決定部47により決定されたキー文字候補の組を
用いることにより、住所の最初の文字から最初のキー文
字の直前の全パターン、及び2番目以降のキー文字の間
に挟まれれている全パターンのそれぞれを、1つの地名
単語として切り出す。
【0104】地名単語認識用辞書50は、日本全国の地
名の特徴ベクトルを登録する。ここで、地名単語認識用
辞書50に登録される地名の特徴ベクトルは、地名を表
す文字または文字列を1つの地名ごとにひとまとまりに
表現したものである。なお、地名の特徴ベクトルは、学
習パターンから抽出することができる。
【0105】地名単語一括認識部51は、特徴抽出部5
2及び辞書照合部53を備えている。特徴抽出部52
は、行頭からキー文字までの間に存在する地名単語パタ
ーン、及びキー文字の間に存在する地名単語パターンを
それぞれから特徴ベクトルを抽出する。
【0106】辞書照合部53は、特徴抽出部52で抽出
された地名単語パターンの特徴ベクトルと、地名単語認
識用辞書50に登録されている地名の特徴ベクトルとを
照合することにより、地名候補を出力する。
【0107】一文字認識用辞書54は、文字の特徴ベク
トルを一文字ごとに登録する。一文字認識部55は、一
文字切り出し部56、特徴抽出部57及び辞書照合部5
8を備えている。なお、「丁目」、「番地」、「方書」
などの地名でもなく、キー文字でもないパターンを読み
取る場合、これらのパターンを一文字ずつ切り離して、
一文字認識を行う。
【0108】一文字切り出し部56は、入力パターンか
ら一文字ずつ切り出しを行う。特徴抽出部57は、一文
字切り出し部56で切り出されたパターンの特徴ベクト
ルを抽出する。
【0109】辞書照合部58は、特徴抽出部57で抽出
された特徴ベクトルと、一文字認識用辞書部54に登録
されている文字の特徴ベクトルとを照合することによ
り、文字認識を行う。
【0110】住所知識部59は、住所表示に用いられる
地名同士の組み合わせの可否、または住所表示に用いら
れる地名の配列順序が適当であるかどうかの地名知識を
登録する。なお、住所知識部59には、実存する地名を
コード化して格納することができる。
【0111】住所決定部60は、住所知識部59を参照
することにより、地名単語一括認識部51から出力され
た地名候補が、前後に接続する地名候補と矛盾しないか
どうかを調べ、矛盾しない地名候補の組を住所読取り結
果として出力する。
【0112】このように、第1位〜第N位までの間にキ
ー文字種を含む全てのパターンを、キー文字候補として
考慮するのではなく、認識結果の距離とキー文字の順位
の双方から「キー文字らしさ」を定義する。そして、キ
ー文字らしさが高いものだけを対象として、住所階層構
造知識及び住所中キー文字位置知識に矛盾しないキー文
字候補の組を求める。そして、キー文字が不足するた
め、住所階層構造知識及び住所中キー文字位置知識に矛
盾しないキー文字候補の組を求めることができなかった
場合にのみ、キー文字らしさのより低いパターンの中か
ら、不足している階層のキー文字種を認識結果に持つパ
ターンを再抽出することにより、候補数を少なくして誤
マッチングの可能性を低減させ、効率の良い処理を行う
ことが可能となる。
【0113】また、接触処理、切断処理及び統合処理を
キー文字抽出処理だけに適用し、地名単語パターンを認
識する場合には、地名単語パターンを一体的に扱って処
理を行うことにより、キー文字が他の文字と接触してい
る場合でも、キー文字を正確に抽出することが可能とな
るとともに、地名単語パターンについては接触処理、切
断処理及び統合処理を省略して、認識処理を行うことが
可能となり、処理を効率よく行うことが可能となる。
【0114】また、地名単語パターンを認識する場合、
一文字ごとに切り離して認識するのでなく、地名単語パ
ターンを一体的に扱って特徴抽出及び辞書照合を行うこ
とにより、地名単語パターンを切り離すことによる誤切
り出し及び誤認識を避けることが可能となり、認識率を
向上させることが可能となる。例えば、住所の中に
「川」などの分離文字が使用されている場合において
も、誤切り出しによる誤認識を避けることができる。こ
の結果、ユーザ登録カードやアンケート葉書などのよう
に、フリーピッチ手書きの住所画像に文字間接触がある
場合においても、住所読取りの精度を向上させることが
可能となる。
【0115】また、キー文字が癖字で読み取れなかった
場合、一文字認識部55を作動させて素読みの結果を出
力させることにより、住所認識の信頼性を向上させるこ
とができる。
【0116】図7は、本発明の一実施例に係わる切断箇
所判定・切断処理を示すフローチャートである。図7に
おいて、切断箇所判定・切断部34は、一文字領域決定
部32で決定された一文字領域のパターンについて、縦
横比の計算を行う(ステップS1)。そして、パターン
の縦横比がしきい値より小さい場合、そのパターンにつ
いては他の文字との接触の可能性がないものとみなし
て、パターンの切断対象の候補から除外する(ステップ
S2)。
【0117】一方、パターンの縦横比がしきい値以上の
場合、ヒストグラム作成部35は、パターンの縦横比に
基づいて接触文字数の推定を行い(ステップS3)、そ
のパターンについての黒画素数ヒストグラムを作成する
(ステップS4)。
【0118】次に、仮切断点候補抽出部36は、ヒスト
グラム作成部35により作成された黒画素数ヒストグラ
ムの極小点を検出し(ステップS5)、黒画素数ヒスト
グラムの極小点の値がしきい値以下の点を仮切断点候補
とする。
【0119】次に、仮切断点候補決定部37は、仮切断
点候補が検出されたパターンについて、横書きなら、パ
ターンの外接矩形の端点から水平方向に平均文字幅の1
/2の整数倍の点、縦書きなら、パターンの外接矩形の
端点から垂直方向に平均文字高の1/2の整数倍の点を
抽出する。そして、これらの点から一定の範囲内にある
仮切断点候補を、仮切断点として決定する(ステップS
6)。
【0120】次に、切断箇所判定・切断部34は、仮切
断点候補決定部37で決定された仮切断点の数が0より
大きい場合(ステップS7)、仮切断点を通る直線また
は曲線でパターンを仮切断し(ステップS8)、仮切断
点候補決定部37で決定された仮切断点の数が0の場
合、仮切断を行わない。
【0121】図8は、本発明の一実施例に係わるキー文
字候補抽出処理を示すフローチャートである。図8にお
いて、キー文字候補抽出部39は、仮切断により得られ
たパターンを個々に処理することにより、単独パターン
の認識を行う(ステップS11)。単独パターンの認識
では、キー文字認識用辞書38が参照され、仮切断によ
り得られたパターンと、キー文字認識用辞書38に登録
されているパターンとを照合することにより、第1位〜
第N位までの候補文字種を出力する。
【0122】次に、単独パターンについての認識結果を
用いることにより、単独パターンのキー文字らしさを計
算する(ステップS12)。次に、単独パターンのキー
文字らしさに基づいて、単独パターンがキー文字候補、
準キー文字候補、及び非キー文字のいずれに属するかを
判定する(ステップS13)。
【0123】次に、パターン統合判定・統合部40は、
隣接するパターンを単独パターンに統合した場合、統合
パターンが文字である可能性があるか否かを、統合後の
パターンの幅と高さに基づいて判定する(ステップS1
4)。そして、統合パターンが文字である可能性がある
場合、単独パターンを隣接するパターンと仮統合するこ
とにより、統合パターンを生成する(ステップS1
5)。
【0124】次に、統合パターンとキー文字認識用辞書
38に登録されているパターンとを照合することによ
り、統合パターンについて、第1位〜第N位までの候補
文字種を出力する(ステップS16)。
【0125】次に、統合パターンについての認識結果を
用いることにより、統合パターンのキー文字らしさを計
算する(ステップS17)。次に、統合パターンのキー
文字らしさに基づいて、統合パターンがキー文字候補、
準キー文字候補、及び非キー文字のいずれに属するかを
判定する(ステップS18)。
【0126】次に、パターン情報テーブル作成部43
は、単独パターンと統合パターンのそれぞれについて、
キー文字らしさ、キー文字らしさが0でないキー文字
種、仮切断・仮統合の有無、画像中の外接矩形座標等の
情報をパターン情報テーブルに登録する(ステップS1
9)。
【0127】以上の処理が、仮切断後の全てのパターン
について行われたかどうかを判断し、全てのパターンの
処理が終了していない場合は、ステップS11に戻って
処理を繰り返す(ステップS20)。
【0128】図9は、本発明の一実施例に係わるキー文
字組候補決定処理及びキー文字再抽出処理を示すフロー
チャートである。図9において、キー文字組候補決定部
47は、住所階層構造知識部45の住所階層構造知識6
1及び住所中キー文字位置知識部46の住所中キー文字
位置知識62を参照する。そして、キー文字候補抽出部
39で抽出されたキー文字候補の全ての組み合わせにつ
いて、住所階層構造知識61及び住所中キー文字位置知
識62に矛盾しないものキー文字セットとして抽出する
(ステップS21)。
【0129】次に、キー文字セットの候補数が0より大
きい場合(ステップS22)、抽出成功とする。一方、
キー文字セットが抽出されなかった場合、住所階層構造
知識61及び住所中キー文字位置知識62を参照するこ
とにより、不足するキー文字の階層及び文字種を推定し
(ステップS23)、不足キー文字再抽出部48に送
る。
【0130】次に、不足キー文字再抽出部48は、パタ
ーン情報テーブル63を参照し、パターン情報テーブル
63に登録されている準キー文字候補のうち、不足する
階層のキー文字種を認識結果の第N位までに含むパター
ンを、キー文字候補として再抽出する(ステップS2
4)。
【0131】次に、不足キー文字再抽出部48で再抽出
された準キー文字候補を含めたキー文字候補の全ての組
み合わせについて、住所階層構造知識61及び住所中キ
ー文字位置知識62に矛盾しないものキー文字セットと
して抽出する。
【0132】次に、キー文字セットの候補数が0より大
きい場合(ステップS25)、再抽出成功とする。一
方、キー文字セットが抽出されなかった場合、キー文字
抽出失敗として、エラーコードを出力する。ただし、キ
ー文字セットが抽出されなかった場合でも、一文字認識
部55を起動することにより、一文字ごとの認識結果を
出力することができる。このため、キー文字抽出の失敗
によって住所の読み取りが不可能になることが救済でき
る。
【0133】以下、本発明の実施例に係わる住所認識装
置について、実際の手書き文字列を例にとってより具体
的に説明する。図10(a)は、文字間接触を有する手
書き住所文字列の第1の例を示す図である。
【0134】図10(a)において、アンケート葉書等
のフリーピッチ欄に「余市郡余市町」という住所が手書
きにより記入されているものする。この手書きされた住
所の文字列はスキャナ等で読み取られ、二値化された画
像データから行抽出が行われる。この文字列画像に対
し、ラベリング部31によるラベル付けが異なる連結成
分ごとに行われる。
【0135】この結果、最初の「余」の一部と最初の
「市」と「郡」の左半分は互いに接触しているため、こ
れらのパターンは1つの連結成分として、ラベル1が付
される。最初の「余」の残りの部分にはラベル2及びラ
ベル3が付され、「群」の右半分にはラベル4が付され
る。2番目の「余」は3つの分離パターンを含んでいる
ため、ラベル5〜ラベル7が付され、2番目の「市」は
2つの分離パターンを含んでいるため、ラベル8及びラ
ベル9が付され、「町」にはラベル10が付される。ラ
ベル1〜10が付された連結成分が抽出されると、各連
結成分を囲む外接矩形が生成される。
【0136】図10(b)は、外接矩形で囲まれたラベ
ル画像を示す図である。図10(b)において、ラベル
1〜10が付された連結成分のそれぞれに対応して、各
連結成分を囲む外接矩形K1〜K10が生成されてい
る。外接矩形K1〜K10が生成されると、外接矩形K
1〜K10の重なり度を判定し、重なり度が大きいもの
は、統合する。
【0137】図10(c)は、外接矩形の統合結果を示
す図である。図10(c)において、外接矩形K2、K
3は、外接矩形K1の中に含まれているので、外接矩形
K2、K3は外接矩形K1と統合する。また、外接矩形
K6、K7は、外接矩形K5の中に含まれているので、
外接矩形K6、K7は外接矩形K5と統合する。
【0138】このように、重なり度が大きい外接矩形同
士を統合することにより、文字の構成部分が分離してい
るために、同一の文字の各部分パターンに異なるラベル
が付された場合においても、同一の文字の構成部分とし
て一緒に処理することが可能となる。
【0139】一文字領域抽出部32は、統合により得ら
れた外接矩形K1、K4、K5、K8、K10の位置に
基づいて、一文字領域を求める。一文字領域が求まる
と、平均文字サイズ計算部33は、極端に大きいかまた
は小さいサイズの外接矩形を一文字領域から除くなどし
て、平均文字幅Weと平均文字高Whを計算する。例え
ば、外接矩形K1、K4を除外し、外接矩形K5、K
8、K10だけを用いることにより、平均文字幅Weと
平均文字高Whを計算する。
【0140】接触文字判定・切断部34は、外接矩形K
1、K4、K5、K8、K10内のパターンのそれぞれ
について、接触文字か否かの判定を行い、接触文字と判
定されたパターンの切断を行う。すなわち、外接矩形K
1、K4、K5、K8、K10のそれぞれについて幅W
及び高さHを求める。そして、幅/高さのしきい値をR
th、横書きならば、幅のしきい値をWth、縦書きな
らば、高さのしきい値をHthとした時、 W>Wth、かつ、W/H>Rth (横書きの場合) H>Hth、かつ、W/H<Rth (縦書きの場合) を満たす外接矩形が存在する場合、その外接矩形内のパ
ターンを接触文字とみなす。
【0141】図10(c)の例において、外接矩形K
1、K4、K5、K8、K10のうち、外接矩形K1が
上記の条件を満たしているものとし、外接矩形K1内の
パターンが接触文字とみなされたものとして、以下の説
明を行う。
【0142】図11(a)は、接触文字列の抽出結果を
示す図である。図11(a)において、接触文字の候補
として、外接矩形K1内のパターンが示されている。接
触文字の候補が抽出されると、横書きなら、We/2、
縦書きなら、He/2をもとに、接触文字数を計算す
る。すなわち、接触文字数は、1.5個、2.0個、
2.5個・・・というように、0.5文字ごとに誤差を
丸めて計算する。この結果、図11(a)の接触文字で
は、接触文字数=2.5と計算される。
【0143】このように、接触文字数を半文字単位で計
算することにより、横書きなら、文字の「偏」または
「旁」のみ、縦書きなら、文字の「冠」、「連火」また
は「脚」のみが接触していても、接触文字を効率よく切
断することができる。接触文字数が計算されると、接触
文字列の黒画素数ヒストグラム上における仮切断点候補
の位置を求める。
【0144】図11(b)は、接触文字列の黒画素数ヒ
ストグラム上における仮切断点候補の位置を示す図であ
る。図11(b)において、ヒストグラム作成部35
は、図11(a)のパターンを垂直方向に走査すること
により、黒画素数ヒストグラムを求め、移動平均等で平
滑化する。
【0145】仮切断点候補抽出部36は、黒画素数ヒス
トグラムの極小点のうち、黒画素数ヒストグラム値のし
きい値Hthより小さい点を全て求め、この点を仮切断
点候補とする。図10(b)の例では、黒画素数ヒスト
グラムのしきい値Hth=13に設定され、仮切断点候
補として点P1〜P6が求まる。なお、黒画素数ヒスト
グラムのしきい値Hthは、入力画像の解像度に基づい
て設定してもよく、解像度が大きい画像では、黒画素数
ヒストグラムのしきい値Hthを大きく設定するように
してもよい。
【0146】仮切断点候補決定部37は、黒画素数ヒス
トグラムの横軸上において、横書きなら、文字幅W、縦
書きなら、文字高Hを、半文字ごとに分割した点Ci
(i=1,2,・・・)を求める。図11(b)の例で
は、接触文字数が2.5と計算されているので、C1〜
C4の4個の分割点が得られる。
【0147】次に、各分割点Ciに対して、黒画素数ヒ
ストグラムの横軸方向の距離Dthの範囲内にある仮切
断点候補から、最大でも1つとなるように仮切断点を決
定する。すなわち、分割点Ciから距離Dthの範囲内
にある仮切断点候補の数が1つだけの場合は、その点を
仮切断点として決定する。分割点Ciから距離Dthの
範囲内にある仮切断点候補の数が複数ある場合は、黒画
素数ヒストグラム値が最小の点を仮切断点として決定す
る。すなわち、分割点Ciから距離Dthの範囲内にあ
る仮切断点候補がm(m>1)個だけあるとし、それぞ
れの点における黒画素数ヒストグラム値がhk(k=
1,・・・,m)とすると、 min(hk) (k=1,・・・,m) となる仮切断点候補Pkを仮切断点とする。
【0148】ただし、この条件を満たす仮切断点候補P
kも複数ある場合には、分割点Ciからの横軸方向にお
ける距離Dthが最小の点を、仮切断点とする。図11
(b)の例では、仮切断点候補P1は、分割点C2から
距離Dthの範囲内に存在し、仮切断点候補P1〜P6
のうち、分割点C2から距離Dthの範囲内にあるの
は、仮切断点候補P1のみである。従って、仮切断点候
補P1は、仮切断点として決定される。
【0149】仮切断点候補P2は、分割点C1、C2、
C3、C4から距離Dthのいずれの範囲内にも存在し
ないため、仮切断点とはされない。仮切断点候補P3、
P4は、分割点C3からの距離Dthの範囲内に存在
し、分割点C3から距離Dthの範囲内にある仮切断点
候補は複数ある。このため、仮切断点候補P3、P4の
黒画素数ヒストグラム値hkを調べ、黒画素数ヒストグ
ラム値hkの小さい方の点を仮切断点として決定する。
ところが、仮切断点候補P3、P4の黒画素数ヒストグ
ラム値hkは同じである。このため、仮切断点候補P
3、P4のそれぞれについて、分割点C3からの距離D
thを調べ、分割点C3からの距離Dthが小さい方を
仮切断点として決定する。この結果、仮切断点候補P4
よりも仮切断点候補P3の方が、分割点C3からの距離
Dthが小さいため、仮切断点候補P4が仮切断点とし
て決定される。
【0150】仮切断点候補P5は、分割点C1、C2、
C3、C4から距離Dthのいずれの範囲内にも存在し
ないため、仮切断点とはされない。仮切断点候補P6
は、分割点C4から距離Dthの範囲内に存在し、仮切
断点候補P1〜P6のうち、分割点C4から距離Dth
の範囲内にあるのは、仮切断点候補P4のみである。従
って、仮切断点候補P4は、仮切断点として決定され
る。
【0151】図11(c)は、接触文字列の黒画素数ヒ
ストグラム上における仮切断点の位置を示す図である。
図11(c)において、仮切断点P1,P4,P6が決
定すると、この点で、図11(a)のパターンが仮切断
される。
【0152】このように、半文字単位で仮切断箇所を判
定することにより、誤った箇所でパターンが切断されて
も、1文字が高々半分になる程度で済み、誤切断を低減
することが可能となるとともに、後の隣接する矩形との
統合を考えることにより誤切断を救済することが可能と
なる。
【0153】図12(a)は、図11(a)の文字列の
仮切断結果を示す図である。図12(a)において、図
11(c)の仮切断点P1,P4,P6で図11(a)
のパターンが切断されると、この切断により得られた各
パターンが、外接矩形K11〜K14で囲まれる。
【0154】図12(b)は仮切断により得られた単独
パターンの統合可否の判定結果を示す図である。図12
(b)において、パターン統合判定・統合部40は、仮
切断後の文字列パターンについて、先頭のパターンから
順に隣の外接矩形K11〜K14、K4、K5、K8、
K10内のパターンとの統合可能性の判定を行う。そし
て、統合可能と判定されたものは、仮統合パターンを生
成する。統合判定では、対象パターンをそのすぐ隣のパ
ターン(横書きなら右隣、縦書きなら下)と統合をする
ものと仮定した場合、以下の条件を満たすかどうかを調
べる。
【0155】 WI<WIth, WI/HI<RIth (横書きの場合) HI<HIth, WI/HI>RIth (縦書きの場合) そして、上記の条件を満たす場合を統合可能と判定す
る。
【0156】ただし、HIは統合後のパターンの高さ、
WIは統合後のパターンの幅、RIthは高さに対する
幅の比のしきい値、WIthは横書きでの幅のしきい
値、HIthは縦書きでの高さのしきい値である。図1
2(b)の例では、外接矩形K11内のパターンと外接
矩形K12内のパターンとを統合すると、統合後のパタ
ーンの高さに対する幅の比がしきい値RIthより大き
くなるため、外接矩形K11内のパターンは外接矩形K
12内のパターンと統合不可と判定されている。また、
外接矩形K12内のパターンと外接矩形K13内のパタ
ーンとを統合すると、統合後のパターンの高さに対する
幅の比がしきい値RIthより小さく、かつ、統合後の
パターンの幅もしきい値WIthより小さいため、外接
矩形K12内のパターンは外接矩形K13内のパターン
と統合可と判定されている。
【0157】同様に、外接矩形K13内のパターンは外
接矩形K14内のパターンと統合可と判定され、外接矩
形K14内のパターンは外接矩形K4内のパターンと統
合可と判定され、外接矩形K4内のパターンは外接矩形
K5内のパターンと統合不可と判定され、外接矩形K5
内のパターンは外接矩形K8内のパターンと統合不可と
判定され、外接矩形K8内のパターンは外接矩形K10
内のパターンと統合不可と判定されている。
【0158】キー文字候補抽出部39は、統合可能と判
定されたものについては、単独パターンと仮統合パター
ンのそれぞれに対して特徴抽出及び辞書照合を行うこと
により、第1位〜第N位までの文字種を認識結果として
出力する。また、統合不可と判定されたものについて
は、単独パターンのみに対して特徴抽出及び辞書照合を
行うことにより、第1位〜第N位までの文字種を認識結
果として出力する。
【0159】図13(a)は、仮切断により得られた単
独パターンの認識結果を示す図である。なお、図13の
例では、第1位〜第10位までの文字種が認識結果とし
て出力された場合を示されている。
【0160】図13(a)において、図12(b)の外
接矩形K12内のパターンを単独パターンとして処理し
た場合の認識結果が示されている。この単独パターンの
認識結果では、第1位〜第10位までの文字種の候補と
して、「付」、「竹」、「甘」、「対」、「行」、
「所」、「氏」、「科」、「杵」、「同」が提示されて
いる。また、外接矩形K12内の単独パターンと各文字
種の候補との距離として、506、518、536、5
38、551、554、559、561、572、57
4と算出されている。
【0161】図13(b)は、仮切断により得られた単
独パターンを仮統合した統合パターンの認識結果を示す
図である。図13(b)において、図12(b)の外接
矩形K12内のパターンに外接矩形K13内のパターン
を統合した結果、仮統合パターンが生成され、この仮統
合パターンについて、外接矩形K15が生成されてい
る。この外接矩形K15内の仮統合パターンの認識結果
では、第1位〜第10位までの文字種の候補として、
「市」、「布」、「府」、「弟」、「巾」、「右」、
「虎」、「防」、「古」、「街」が提示されている。ま
た、外接矩形K15内の仮統合パターンと各文字種の候
補との距離として、253、351、398、406、
413、432、435、436、446、451と算
出されている。
【0162】この仮統合パターンの第1位〜第10位ま
での文字種の候補の中で、「市」というキー文字が第1
位の文字種として提示されている。第1位〜第10位ま
での文字種の候補の中にキー文字が存在したとき、キー
文字らしさを計算して、キー文字候補及び準キー文字候
補を求める。
【0163】キー文字らしさは、例えば、着目パターン
の第i位にキー文字が出現した場合、その時の距離をd
iとすると、 キー文字らしさ=1/{1+di×[1+(i−1)×
wi]/dth} (i=1,2,・・・,N) と定義することができる。ここで、wiは1より小さい
正の数で、候補順位の重みである。この重みwiは、距
離diが無限大の時、キー文字らしさが0、距離diが
0の時、キー文字らしさが1、距離diがdth程度の
時、キー文字らしさが0.5となるよう定義される。キ
ー文字らしさが、0.5以上のパターンをキー文字候
補、0.5より小さく0でないものを準キー文字候補、
キー文字らしさが0のものをキー文字以外の文字種とす
る。
【0164】図13の例では、wi=0.2、dth=
480とすると、単独パターンはキー文字らしさが0と
なるため、キー文字以外の文字種とされる。一方、仮統
合パターンはキー文字らしさが0.65となるため、文
字種が「市」のキー文字候補とされる。
【0165】このように、各パターンに対する隣接パタ
ーンとの統合可否、キー文字らしさ、キー文字である場
合はその文字種や階層等の情報が求まると、これらの情
報をパターン情報テーブルに格納する。
【0166】図14は、図10(a)の文字列について
作成されたパターン情報テーブルの例を示す図である。
図14において、パターン情報テーブルには、図12
(b)の外接矩形K11〜K14、K4、K5、K8、
K10内の単独パターン、及び外接矩形K11〜K1
4、K4、K5、K8、K10内の単独パターンを右隣
の単独パターンと統合した時の仮統合パターンのそれぞ
れについて、フラグ情報、階層情報、文字種、キー文字
らしさ、所属行、行内通番を記入する欄が設けられてい
る。なお、フラグ1はキー文字候補、フラグ2は準キー
文字候補、フラグ0はキー文字以外のその他の文字種を
表している。また、図13の例では、キー文字らしさ
は、百分率で示されている。階層情報には、住所に使用
されるキー文字の階層レベルが記入される。
【0167】図15は、住所に使用されるキー文字の階
層レベルを示す表である。図15において、「都」、
「道」、「府」及び「県」というキー文字の階層レベル
は1、「市」及び「郡」というキー文字の階層レベルは
2、「区」というキー文字の階層レベルは3、「町」及
び「村」というキー文字の階層レベルは4であることが
示されている。
【0168】図14のパターン情報テーブルにおいて、
外接矩形K11、K4、K5、K8、K10における仮
統合パターンについては、パターン統合判定・統合部4
0により統合不可と判定されたため、これらの欄は空欄
とされている。
【0169】また、外接矩形K12、K14、K5にお
ける単独パターン、外接矩形K13における単独パター
ン及び仮統合パターンについてはフラグが0となってお
り、これらのパターンがキー文字以外の文字種であるこ
とが示されるとともに、キー文字らしさが0.0%とな
っている。
【0170】外接矩形K11内の単独パターンについて
はフラグが2となっており、このパターンは準キー文字
候補であることが示されている。また、準キー文字候補
の文字種として「村」という文字が示され、「村」とい
う文字の階層レベルは4で、キー文字らしさが25.4
%であることが示されている。
【0171】外接矩形K12における仮統合パターンに
ついてはフラグが1となっており、このパターンはキー
文字候補であることが示されている。また、キー文字候
補の文字種として「市」という文字が示され、「市」と
いう文字の階層レベルは2で、キー文字らしさが65.
5%であることが示されている。
【0172】外接矩形K14における仮統合パターンに
ついてはフラグが1となっており、このパターンはキー
文字候補であることが示されている。また、キー文字候
補の文字種として「郡」という文字が示され、「郡」と
いう文字の階層レベルは2で、キー文字らしさが63.
4%であることが示されている。
【0173】外接矩形K4内の単独パターンについては
フラグが2となっており、このパターンは準キー文字候
補であることが示されている。また、準キー文字候補の
文字種として「区」という文字が示され、「区」という
文字の階層レベルは3で、キー文字らしさが45.8%
であることが示されている。
【0174】外接矩形K8内の単独パターンについては
フラグが1となっており、このパターンはキー文字候補
であることが示されている。また、キー文字候補の文字
種として「市」という文字が示され、「市」という文字
の階層レベルは2で、キー文字らしさが60.0%であ
ることが示されている。
【0175】外接矩形K10内の単独パターンについて
はフラグが1となっており、このパターンはキー文字候
補であることが示されている。また、キー文字候補の文
字種として「町」という文字が示され、「町」という文
字の階層レベルは4で、キー文字らしさが67.9%で
あることが示されている。
【0176】図14のパターン情報テーブルが作成され
ると、フラグ1が付与された単独パターン及び仮統合パ
ターンをキー文字候補として抽出する。そして、パター
ン情報テーブルで示されるキー文字候補についての組み
合わせを考え、これらの組み合わせの中に住所階層構造
知識及び住所中キー文字位置知識に矛盾しないものがあ
るかどうかを判別する。図16は、図10(a)の文字
列から抽出されたキー文字候補を示す図である。
【0177】図16において、図12の外接矩形K12
内のパターンと外接矩形K13内のパターンとを仮統合
した仮統合パターンが、1つのキー文字候補として抽出
され、外接矩形K15で囲まれている。この外接矩形K
15で囲まれている「市」というパターンは、図6の切
断箇所判定・切断部34で半分づつに仮切断されたもの
だが、キー文字候補抽出部39での統合・認識処理によ
って1つに統合され、「市」であると判定されたもので
ある。
【0178】このように、連結パターンを切断する際に
キー文字が2つの部分パターンに切断された場合におい
ても、互いに隣接するパターンの統合して認識処理を行
うことにより、キー文字を正しく抽出することが可能と
なる。
【0179】また、図12の外接矩形K14内のパター
ンと外接矩形K4内のパターンとを仮統合した仮統合パ
ターンが、1つのキー文字候補として抽出され、外接矩
形K16で囲まれている。この外接矩形K16で囲まれ
ている「郡」というパターンは、元々2つの分離したパ
ターンで構成されており、「郡」というパターンの左半
分と右半分とは、別々のパターンとして抽出されてい
る。しかも、図10(a)に示すように、「郡」という
パターンの左半分は、「郡」というパターンの左に隣接
する「市」という文字と接触している。この結果、図1
0(c)に示すように、「郡」というパターンの左半分
は、外接矩形K1内のパターンとみなされ、「郡」とい
うパターンの右半分は、外接矩形K4内のパターンとみ
なされている。
【0180】ここで、「郡」というパターンの左半分
は、図6の切断箇所判定・切断部34で外接矩形K1内
のパターンから切断され、切断により切り出された
「郡」というパターンの左半分は、キー文字候補抽出部
39での統合・認識処理によって外接矩形K4内のパタ
ーンと1つに統合されて、「郡」というパターンがキー
文字候補として抽出されている。
【0181】また、図16において、図12の外接矩形
K8内のパターンが、「市」というキー文字候補として
抽出され、図12の外接矩形K10内のパターンが、
「町」というキー文字候補として抽出されている。
【0182】キー文字候決定部47は、キー文字候補が
抽出されると、住所階層構造知識部45及び住所中キー
文字位置知識部46から、住所階層構造知識及び住所中
キー文字位置知識を取り出し、キー文字候補の組み合わ
せの中に住所階層構造知識及び住所中キー文字位置知識
に矛盾しないものがあるかどうかを調べる。
【0183】図17(a)は、住所に使用されるキー文
字の階層構造を示す図である。図17(a)において、
住所階層構造は、{都}と、{道}、{府}及び{県}
とで異なっている。{都}については、{都}の後に続
くことができるキー文字は、{区}、{区、町}、
{市}、{市、町}、{郡、町}、{郡、村}、
{町}、または{村}であることが示されている。
{道}、{府}及び{県}については、{道}、
{府}、または{県}の後に続くことができるキー文字
は、{市}、{市、区}、{市、区、町}、{市、
町}、{郡、町}、または{郡、村}であることが示さ
れている。
【0184】また、住所中キー文字位置知識は、「行頭
にキー文字は来ない」、「キー文字が連続して出現する
ことはない」などのキー文字が出現する位置に関する知
識である。
【0185】住所階層構造知識及び住所中キー文字位置
知識を参照することにより、これらのルールを満たさな
いキー文字候補は、地名中のキー文字種又は切り出しミ
スパターンによる誤認識として除去できる。なお、住所
階層構造知識及び住所中キー文字位置知識のみでは判断
できない紛らわしい地名中のキー文字がある場合は、複
数のキー文字の組をキー文字セット候補とし、後の地名
単語一括認識部51における処理により、正しいキー文
字の組を決定することができる。
【0186】図17(b)は、図16のキー文字候補に
ついて使用可能なキー文字セットを示す図である。図1
7(b)において、図16のキー文字候補の組み合わせ
のうち、住所階層構造知識及び住所中キー文字位置知識
の矛盾しないキー文字セット候補は以下の3つある。
【0187】第一セット {市、町} ○市○○○町 第二セット {群、町} ○○郡○○町 第三セット {市} ○○○○市○ 住所階層構造知識及び住所中キー文字位置知識の矛盾し
ないキー文字セット候補が見つかった場合、キー文字セ
ット候補に対応するパターンの仮切断位置及び仮統合結
果を、入力パターンについての切断位置及び統合結果と
して決定する。
【0188】キー文字セット候補が決定されると、各キ
ー文字群候補についての情報が地名単語切り出し部49
に送られる。地名単語切り出し部49は、キー文字の位
置情報に基づいて、各々のキー文字セット候補に対し、
地名単語候補の切り出しを行う。
【0189】例えば、図17(b)の{市、町}をキー
文字セット候補として使用した場合、図12のパターン
から、{市}の前のパターンと、{市}と{町}との間
に挟まれるパターンとがそれぞれ1つの地名単語として
一括して抽出される。この結果、「余」に対応するパタ
ーン及び「郡余市」に対応するパターンがそれぞれ1つ
の地名単語パターンとして抽出される。
【0190】また、図17(b)の{郡、町}をキー文
字セット候補として使用した場合、図12のパターンか
ら、{郡}の前のパターンと、{郡}と{町}との間に
挟まれるパターンとがそれぞれ1つの地名単語として一
括して抽出される。この結果、最初の「余市」に対応す
るパターン及び2番目の「余市」に対応するパターンが
それぞれ1つの地名単語パターンとして抽出される。
【0191】また、図17(b)の{市}をキー文字セ
ット候補として使用した場合、図12のパターンから、
{市}の前のパターンと、{市}の後のパターンとがそ
れぞれ1つの地名単語として一括して抽出される。この
結果、「余市郡余」に対応するパターン及び「町」に対
応するパターンがそれぞれ1つの地名単語パターンとし
て抽出される。
【0192】特徴抽出部52は、地名単語切り出し部4
9で切り出された地名単語パターンに対し、画像特徴の
抽出を行う。例えば、図17(b)の{市、町}をキー
文字セット候補として使用した場合、地名単語として抽
出された「余」に対応するパターン及び「郡余市」に対
応するパターンのそれぞれの特徴ベクトルを抽出する。
ここで、「郡余市」というパターンの特徴ベクトルを抽
出する場合、「郡余市」を一文字ごとに切り離し、
「郡」、「余」及び「市」の特徴ベクトルを個別に抽出
するのではなく、「郡余市」というパターンを一体的に
扱って、「郡余市」という文字列全体の特徴ベクトルを
抽出する。
【0193】また、図17(b)の{郡、町}をキー文
字セット候補として使用した場合、地名単語として抽出
された最初の「余市」に対応するパターン及び2番目の
「余市」に対応するパターンのそれぞれの特徴ベクトル
を抽出する。ここで、「余市」というパターンの特徴ベ
クトルを抽出する場合、「余市」を一文字ごとに切り離
し、「余」及び「市」の特徴ベクトルを個別に抽出する
のではなく、「余市」というパターンを一体的に扱っ
て、「余市」という文字列全体の特徴ベクトルを抽出す
る。
【0194】また、図17(b)の{市}をキー文字セ
ット候補として使用した場合、地名単語として抽出され
た「余市郡余」に対応するパターン及び「町」に対応す
るパターンのそれぞれの特徴ベクトルを抽出する。ここ
で、「余市郡余」というパターンの特徴ベクトルを抽出
する場合、「余市郡余」を一文字ごとに切り離し、
「余」、「市」、「郡」及び「余」の特徴ベクトルを個
別に抽出するのではなく、「余市郡余」というパターン
を一体的に扱って、「余市郡余」という文字列全体の特
徴ベクトルを抽出する。
【0195】地名単語認識用辞書50には、地名の属性
ごとに、日本全国の地名を表すパターンの特徴ベクトル
を登録しておくことができる。例えば、地名の属性が
「県」ならば、「千葉」、「神奈川」、「埼玉」などの
地名を表すパターンの特徴ベクトルを「県」という属性
に対応させて登録し、地名の属性が「区」ならば、「世
田谷」、「千代田」、「中央」などの地名を表すパター
ンの特徴ベクトルを「区」という属性に対応させて登録
しておく。
【0196】そして、例えば、「県」というキー文字の
直前のパターンを認識する場合、「県」という属性に対
応する地名を表すパターンとだけ照合を行うようにす
る。このことにより、地名を認識する際の照合回数を減
らすことが可能となり、処理を高速化することが可能と
なる。
【0197】辞書照合部53は、キー文字に基づいて、
そのキー文字の直前の地名単語の属性を調べる。そし
て、地名単語認識用辞書50に登録されている地名の特
徴ベクトルのうち、地名の属性に対応した地名単語パタ
ーンの特徴ベクトルと、特徴抽出部52で抽出された地
名単語パターンの特徴ベクトルとを照合する。
【0198】例えば、図17(b)の{市、町}をキー
文字セット候補として使用した場合、地名単語パターン
として抽出された「余」及び「郡余市」の各特徴ベクト
ルが、地名単語認識用辞書50に登録されている地名の
特徴ベクトルと照合される。ここで、地名単語パターン
として抽出された「余」の属性は{市}であるので、地
名単語認識用辞書50に登録されている地名の特徴ベク
トルのうち、{市}の属性を有する地名の特徴ベクトル
と照合される。また、地名単語パターンとして抽出され
た「郡余市」の属性は{町}であるので、地名単語認識
用辞書50に登録されている地名の特徴ベクトルのう
ち、{町}の属性を有する地名の特徴ベクトルと照合さ
れる。
【0199】「余」という地名の{市}や「郡余市」と
いう地名の{町}が、日本の地名の中に存在しないもの
とすると、「余」というパターンに対応する特徴ベクト
ルや「郡余市」というパターンに対応する特徴ベクトル
が地名単語認識用辞書50に登録されていないため、
「余」という地名単語パターンや「郡余市」という地名
単語パターンの認識結果が出力されないか、または認識
率が非常に低くなり、{市、町}をキー文字セット候補
から除外することができる。
【0200】また、図17(b)の{郡、町}をキー文
字セット候補として使用した場合、地名単語パターンと
して抽出された最初の「余市」及び2番目の「余市」の
各特徴ベクトルが、地名単語認識用辞書50に登録され
ている地名の特徴ベクトルと照合される。ここで、地名
単語パターンとして抽出された最初の「余市」の属性は
{郡}であるので、地名単語認識用辞書50に登録され
ている地名の特徴ベクトルのうち、{郡}の属性を有す
る地名の特徴ベクトルと照合される。また、地名単語パ
ターンとして抽出された2番目の「余市」の属性は
{町}であるので、地名単語認識用辞書50に登録され
ている地名の特徴ベクトルのうち、{町}の属性を有す
る地名の特徴ベクトルと照合される。
【0201】「余市」という地名の{郡}や「余市」と
いう地名の{町}が、日本の地名の中に存在しているも
のとすると、「余市」という地名単語パターンの認識結
果として、地名単語認識用辞書50に登録されている地
名が地名候補として出力される。なお、1つの地名単語
パターンに対して複数の地名候補が出力された場合、地
名知識部59の地名知識を参照することにより、正しい
地名候補を選択することができる。
【0202】また、図17(b)の{市}をキー文字セ
ット候補として使用した場合、地名単語パターンとして
抽出された「余市郡余」及び「町」の各特徴ベクトル
が、地名単語辞書部50に登録されている地名の特徴ベ
クトルと照合される。ここで、地名単語パターンとして
抽出された「余市郡余」の属性は{市}であるので、地
名単語辞書部50に登録されている地名の特徴ベクトル
のうち、{市}の属性を有する地名の特徴ベクトルと照
合される。
【0203】「余市郡余」という地名の{市}や「町」
という地名が、日本の地名の中に存在しないものとする
と、「余市郡余」というパターンに対応する特徴ベクト
ルや「町」というパターンに対応する特徴ベクトルが地
名単語認識用辞書50に登録されていないため、「余市
郡余」という地名単語パターンや「町」という地名単語
パターンの認識結果が出力されないか、または認識率が
非常に低くなり、{市}をキー文字セット候補から除外
することができる。
【0204】住所知識部59は、地名同士の接続関係に
関する住所知識を格納している。例えば、「余市郡」と
いう地名の後に「余市町」という地名がくる場所が日本
に存在しているかどうかという知識や、「横浜市」とい
う地名の後にくることができる{区}の地名などに関す
る知識などである。
【0205】住所決定部60は、住所知識部59から住
所知識を取り出し、住所一括認識部51から出力された
地名候補の中から、住所知識に矛盾しないものを住所読
取り結果として出力する。
【0206】例えば、「余市」という名称の{郡}の後
に「余市」という名称の{町}がくることが、住所知識
に矛盾しないと判断されると、住所読取り結果として
「余市郡余市町」と出力される。
【0207】なお、住所知識に矛盾しない地名の組が存
在しなかった場合は、住所読取り結果は出力されず、エ
ラーコードが出力される。図18は、文字間接触を有す
る手書き住所文字列の第2の例を示す図である。
【0208】図18において、アンケート葉書等のフリ
ーピッチ欄に「北葛城郡王寺町明神」という住所が手書
きにより記入されているものする。この手書きされた住
所の文字列はスキャナ等で読み取られ、二値化された画
像データから行抽出が行われる。この文字列画像に対
し、ラベリング部31によるラベル付けが異なる連結成
分ごとに行われる。
【0209】そして、各連結成分ごとに外接矩形が生成
され、重なり度が大きい外接矩形同士を統合することに
より、外接矩形K21〜K33が生成される。外接矩形
K21〜K33が生成されると、切断対象となるパター
ンがあるかどうかが判定され、切断対象となるパターン
がないものとすると、先頭のパターンから順に隣の外接
矩形内のパターンとの統合可能性の判定を行う。そし
て、統合可能と判定されたものは、仮統合パターンが生
成される。
【0210】次に、外接矩形K21〜K33内の単独パ
ターン及び統合可能と判定された仮統合パターンについ
て認識処理を行い、この認識処理結果に基づいてキー文
字らしさを計算する。
【0211】そして、各パターンに対する隣接パターン
との統合可否、キー文字らしさ、キー文字である場合は
その文字種や階層等の情報が求まると、これらの情報を
パターン情報テーブルに格納する。
【0212】図19は、図18(a)の文字列について
作成されたパターン情報テーブルの例を示す図である。
図19において、パターン情報テーブルには、図18の
外接矩形K21〜K33内の単独パターン、及び外接矩
形K21〜K33内の単独パターンを右隣の単独パター
ンと統合した時の仮統合パターンのそれぞれについて、
フラグ情報、階層情報、文字種、キー文字らしさ、所属
行、行内通番を記入する欄が設けられている。なお、フ
ラグ1はキー文字候補、フラグ2は準キー文字候補、フ
ラグ0はー文字以外のその他の文字種を表している。ま
た、キー文字らしさは、百分率で示されている。階層情
報には、住所に使用されるキー文字の階層レベルが記入
される。
【0213】外接矩形K24、K26〜、K29におけ
る仮統合パターンについては、パターン統合判定・統合
部40により統合不可と判定され、これらの欄は空欄と
なっている。
【0214】また、外接矩形K21〜K23、K30〜
K33における単独パターン及び仮統合パターン、外接
矩形K24、K25、K28における単独パターンにつ
いてはフラグが0となっており、これらのパターンがキ
ー文字以外の文字種であることが示されているととも
に、キー文字らしさが0.0%となっている。
【0215】外接矩形K25における仮統合パターンに
ついてはフラグが1となっており、このパターンはキー
文字候補であることが示されている。また、キー文字候
補の文字種として「郡」という文字が示され、「郡」と
いう文字の階層レベルは2で、キー文字らしさが67.
6%であることが示されている。
【0216】外接矩形K26内の単独パターンについて
はフラグが2となっており、このパターンは準キー文字
候補であることが示されている。また、準キー文字候補
の文字種として「市」という文字が示され、「市」とい
う文字の階層レベルは2で、キー文字らしさが21.8
%であることが示されている。
【0217】外接矩形K27内の単独パターンについて
はフラグが2となっており、このパターンは準キー文字
候補であることが示されている。また、準キー文字候補
の文字種として「区」という文字が示され、「区」とい
う文字の階層レベルは3で、キー文字らしさが29.6
%であることが示されている。
【0218】外接矩形K29内の単独パターンについて
はフラグが2となっており、このパターンは準キー文字
候補であることが示されている。また、準キー文字候補
の文字種として「町」という文字が示され、「町」とい
う文字の階層レベルは4で、キー文字らしさが47.9
%であることが示されている。
【0219】パターン情報テーブルが作成されると、フ
ラグ1が付与された単独パターン及び仮統合パターンを
キー文字候補として抽出する。そして、パターン情報テ
ーブルで示されるキー文字候補についての組み合わせを
考え、これらの組み合わせの中に住所階層構造知識及び
住所中キー文字位置知識に矛盾しないものがあるかどう
かを判別する。
【0220】図20(a)は、図18の文字列から抽出
されたキー文字候補を示す図である。図20(a)にお
いて、図18の外接矩形K25内のパターンと外接矩形
K26内のパターンとを仮統合した仮統合パターンが、
1つのキー文字候補として抽出され、外接矩形K34で
囲まれている。この外接矩形K34で囲まれている
「郡」というパターンは、元々2つの分離したパターン
で構成されており、2つの部分パターンが別々のパター
ンとして抽出されたものが、キー文字候補抽出部39で
の統合・認識処理によって1つに統合され、「郡」であ
ると判定されたものである。
【0221】「郡」というキー文字が抽出されると、住
所階層構造知識及び住所中キー文字位置知識が参照され
るが、図17(a)に示すように、「郡」だけが単独で
キー文字として使用されることはなく、「郡」の後には
必ず「町」というキー文字または「村」というキー文字
が存在することがわかる。
【0222】このため、キー文字候補決定部47は、パ
ターン情報テーブルに登録されているフラグ1のキー文
字候補を用いただけでは住所を表すのに必要なキー文字
が不足するため、キー文字セット候補が1つも抽出でき
なかった場合には、不足キー文字再抽出部48に足りな
いキー文字を再抽出するよう要請し、再抽出すべきキー
文字の情報を送る。
【0223】例えば、キー文字候補決定部47は、
「郡」のキー文字候補だけしか抽出できなかった場合、
「郡」の後には、「町」か「村」の文字が存在している
ことを、不足キー文字再抽出部48に伝える。そして、
「郡」の後の文字列の中から、「町」か「村」のキー文
字を再抽出するように要請する。
【0224】不足キー文字再抽出部48は、キー文字の
再抽出の要請があると、パターン情報テーブルを呼ん
で、準キー文字候補の中から、要請されたキー文字を再
抽出する。この場合、住所中キー文字位置知識を参照
し、これに矛盾しないようにする。
【0225】例えば、図19のパターン情報テーブルに
は、準キー文字候補として、外接矩形K26内の単独パ
ターン、外接矩形K27内の単独パターン及び外接矩形
K29内の単独パターンが登録されているが、文字種が
「町」か「村」に一致しているのは、外接矩形K29内
の単独パターンだけであるので、外接矩形K29内の単
独パターンが、キー文字候補として再抽出される。
【0226】図20(b)は、図18の文字列から再抽
出されたキー文字候補を示す図である。図20(b)に
おいて、キー文字候補の再抽出が行われた結果、図18
の外接矩形K34内のパターンが「郡」というキー文字
候補として抽出され、図18の外接矩形K29内のパタ
ーンが「町」というキー文字候補として抽出されてい
る。
【0227】キー文字候補が抽出されると、キー文字候
補の組み合わせのうち、住所階層構造知識及び住所中キ
ー文字位置知識に矛盾しないものを選択する。図20
(c)は、図18の文字列について使用可能なキー文字
セットを示す図である。
【0228】図20(c)において、図18のパターン
から抽出されたキー文字候補の組み合わせのうち、住所
階層構造知識及び住所中キー文字位置知識の矛盾しない
キー文字セット候補は以下の1つだけである。
【0229】第一セット {郡、町} 住所階層構造知識及び住所中キー文字位置知識の矛盾し
ないキー文字セット候補が見つかった場合、各キー文字
セット候補についての情報が地名単語切り出し部49に
送られる。地名単語切り出し部49は、キー文字の位置
情報に基づいて、各々のキー文字セット候補に対し、地
名単語候補の切り出しを行う。 例えば、図20(c)
の{郡、町}をキー文字セット候補として使用した場
合、図18のパターンから、{郡}の前のパターンと、
{郡}と{町}との間に挟まれるパターンと、{町}の
後のパターンとが地名単語パターンとして抽出される。
この結果、「北葛城」に対応するパターン、「王寺」に
対応するパターン及び「明神」に対応するパターンが地
名単語パターンとしてそれぞれ抽出される。
【0230】地名単語パターンとして、「北葛城」に対
応するパターン、「王寺」に対応するパターン及び「明
神」に対応するパターンが抽出されると、「北葛城」に
対応するパターン、「王寺」に対応するパターン及び
「明神」に対応するパターンのそれぞれの特徴ベクトル
が抽出される。ここで、「北葛城」に対応するパターン
の特徴ベクトルを抽出する場合、「北葛城」に対応する
パターンを一文字ごとに切り離し、「北」に対応するパ
ターン、「葛」に対応するパターン及び「城」に対応す
るパターンの特徴ベクトルを個別に抽出するのではな
く、「北葛城」に対応するパターンを一体的に扱って、
「北葛城」という文字列全体の特徴ベクトルを抽出す
る。
【0231】また、「王寺」に対応するパターンの特徴
ベクトルを抽出する場合、「王寺」に対応するパターン
を一文字ごとに切り離し、「王」に対応するパターン及
び「寺」に対応するパターンの特徴ベクトルを個別に抽
出するのではなく、「王寺」に対応するパターンを一体
的に扱って、「王寺」という文字列全体の特徴ベクトル
を抽出する。
【0232】また、「明神」に対応するパターンの特徴
ベクトルを抽出する場合、「明神」に対応するパターン
を一文字ごとに切り離し、「明」に対応するパターン及
び「神」に対応するパターンの特徴ベクトルを個別に抽
出するのではなく、「明神」に対応するパターンを一体
的に扱って、「明神」という文字列全体の特徴ベクトル
を抽出する。
【0233】「北葛城」に対応するパターン、「王寺」
に対応するパターン及び「明神」に対応するパターンの
特徴ベクトルが抽出されると、「北葛城」に対応するパ
ターン、「王寺」に対応するパターン及び「明神」に対
応するパターンの各特徴ベクトルが、地名単語辞書部5
0に登録されている地名の特徴ベクトルと照合される。
ここで、地名単語パターンとして抽出された「北葛城」
に対応するパターンの属性は{郡}であるので、地名単
語辞書部50に登録されている地名の特徴ベクトルのう
ち、{郡}の属性を有する地名の特徴ベクトルと照合さ
れる。また、地名単語パターンとして抽出された「王
寺」に対応するパターンの属性は{町}であるので、地
名単語辞書部50に登録されている地名の特徴ベクトル
のうち、{町}の属性を有する地名の特徴ベクトルと照
合される。
【0234】「北葛城」という地名の{郡}や「王寺」
という地名の{町}や「明神」という地名が、日本の地
名の中に存在しているものとすると、「北葛城」という
地名単語パターン、「王寺」という地名単語パターン及
び「明神」という地名単語パターンの認識結果として、
地名単語辞書部50に登録されている地名が地名候補と
して出力される。なお、1つの地名単語パターンに対し
て複数の地名候補が出力された場合、住所知識部59の
住所知識を参照することにより、正しい地名候補を選択
することができる。
【0235】「北葛城」という地名の{郡}と「王寺」
という地名の{町}と「明神」という地名とが、住所知
識に矛盾しないと判断されると、住所読取り結果とし
て、「北葛城郡王寺町明神」の文字コードなどが出力さ
れる。
【0236】次に、本発明の一実施例に係わるキー文字
認識用辞書について説明する。図6において、キー文字
候補抽出部39は、原画像のパターンからキー文字候補
を抽出するため、キー文字認識辞書38を参照し、各ラ
ベルパターン及び統合ラベルパターンの文字認識を実行
している。ここで、キー文字認識辞書38に登録する文
字種の限定を行わないようにすると、JIS第1水準漢
字文字種で約3000、地名漢字でも約1000あるた
め、照合回数が膨大となり、多くの処理時間が必要とな
る。
【0237】一方、キー文字認識辞書38に登録する文
字種を限定し、例えば、キー文字認識辞書38に、
「都」、「道」、「府」、「県」、「市」、「郡」、
「区」、「町」、「村」などのキー文字のみを登録して
おくと、キー文字だけでなくキー文字に類似しているパ
ターンもキー文字候補として抽出される場合が増え、キ
ー文字候補が抽出過多となる。
【0238】図21は、本発明の一実施例に係わるキー
文字認識用辞書を使い分けた場合のキー文字種の認識結
果を示す図である。図21において、文字種が「見」の
サンプルパターン61及び文字種が「県」のサンプルパ
ターン62のそれぞれについて、全文字種が登録されて
いるキー文字認識辞書38を用いた認識結果(第N位ま
で候補文字種と距離)と、「都」、「道」、「府」、
「県」、「市」、「群」、「区」、「町」、「村」の9
つのキー文字種のみが登録されているキー文字認識辞書
38を用いた認識結果(第N位まで候補文字種と距離)
とが示されている。
【0239】サンプルパターン61の認識結果として、
全文字種が登録されているキー文字認識辞書38を用い
た場合、第1位候補の文字種として「見」、第2位候補
の文字種として「貝」、第3位候補の文字種として
「県」が出力されている。また、サンプルパターン61
と各文字種の距離として、それぞれ210、250、3
20と出力されている。キー文字種のみが登録されてい
るキー文字認識辞書38を用いた場合、第1位候補の文
字種として「県」、第2位候補の文字種として「道」が
出力されている。また、サンプルパターン61と各文字
種の距離として、それぞれ320、640と出力されて
いる。
【0240】また、サンプルパターン62の認識結果と
して、全文字種が登録されているキー文字認識辞書38
を用いた場合、第1位候補の文字種として「県」、第2
位候補の文字種として「見」、第3位候補の文字種とし
て「貝」が出力されている。また、サンプルパターン6
1と各文字種の距離として、それぞれ320、480、
590と出力されている。キー文字種のみが登録されて
いるキー文字認識辞書38を用いた場合、第1位候補の
文字種として「県」、第2位候補の文字種として「道」
が出力されている。また、サンプルパターン62と各文
字種の距離として、それぞれ320、640と出力され
ている。
【0241】ここで、全文字種が登録されているキー文
字認識辞書38を用いた場合、サンプルパターン61に
ついても、サンプルパターン62についても、キー文字
種「県」との距離は、320で同一である。従って、キ
ー文字種「県」との距離を評価しただけでは、キー文字
でないサンプルパターン61をキー文字でないと判別
し、かつ、キー文字であるサンプルパターン62をキー
文字であると判別することはできない。ところが、キー
文字種「県」の出現順位は、サンプルパターン61につ
いては第3位であるのに対し、サンプルパターン62に
ついては第1位であることから、キー文字種「県」の出
現順位を評価することにより、キー文字でないサンプル
パターン61をキー文字でないと判別し、かつ、キー文
字であるサンプルパターン62をキー文字であると判別
することが可能となる。
【0242】一方、キー文字種のみが登録されているキ
ー文字認識辞書38を用いた場合、サンプルパターン6
1についても、サンプルパターン62についても、キー
文字種「県」との距離は、320で同一である。また、
キー文字種「県」の出現順位も、サンプルパターン61
についても、サンプルパターン62についても、第1位
であり同一である。従って、キー文字種のみが登録され
ているキー文字認識辞書38を用いた場合には、キー文
字種「県」との距離を評価しても、キー文字種「県」の
出現順位を評価しても、キー文字でないサンプルパター
ン61をキー文字でないと判別し、かつ、キー文字であ
るサンプルパターン62をキー文字であると判別するこ
とはできない。
【0243】この例から、キー文字認識辞書38の文字
種を限定しすぎると、キー文字候補が過抽出されること
が予測される。キー文字候補の過抽出が起きると、住所
の読み取り誤りを生じる可能性が高くなる。
【0244】一方、キー文字認識辞書38の文字種が多
すぎると、処理時間がかかりすぎて実用的でない。よっ
て、キー文字認識辞書38の文字種を適切に限定する必
要がある。
【0245】図22は、本発明の一実施例に係わるキー
文字認識用辞書の構成を示すブロック図である。図22
において、キー文字認識用辞書201は、キー文字種格
納部202及び類似文字種格納部203を備え、キー文
字認識用辞書201に登録される文字種を、キー文字字
種とその類似文字種に字種限定する。
【0246】この結果、キー文字認識用辞書に全ての文
字種が登録されている場合に比べて、認識対象となるパ
ターンとキー文字認識用辞書に登録されている文字種と
の比較回数を低減させることが可能となることから、住
所認識の処理時間を短縮することが可能となる。また、
キー文字認識用辞書にキー文字種のみが登録されている
場合に比べて、認識対象となるパターンに対するキー文
字種の出現順位を考慮して、認識対象となるパターンが
キー文字かどうかを判別することが可能となることか
ら、認識対象となるパターンとキー文字種との距離を評
価しただけでは、キー文字なのかキー文字でないのかが
判別できないようなパターンに対しても、キー文字かど
うかを精度よく判別することが可能となる。
【0247】図23は、キー文字認識用辞書201に登
録されるキー文字種及びその類似文字種の一例を示す図
である。図23において、キー文字種「都」に対し、そ
の類似文字種として、例えば、「郡」、「部」、
「祁」、「郎」がキー文字認識用辞書に登録され、キー
文字種「道」に対し、その類似文字種として、例えば、
「追」、「造」、「迫」、「通」がキー文字認識用辞書
に登録され、キー文字種「府」に対し、その類似文字種
として、例えば、「麻」、「狩」、「有」、「碕」がキ
ー文字認識用辞書に登録され、キー文字種「県」に対
し、その類似文字種として、例えば、「呉」、「具」、
「貝」、「見」がキー文字認識用辞書に登録され、キー
文字種「市」に対し、その類似文字種として、例えば、
「布」、「巾」、「希」、「帝」がキー文字認識用辞書
に登録され、キー文字種「郡」に対し、その類似文字種
として、例えば、「都」、「邦」、「部」、「郎」がキ
ー文字認識用辞書に登録され、キー文字種「区」に対
し、その類似文字種として、例えば、「匹」、「巨」、
「匠」、「医」がキー文字認識用辞書に登録され、キー
文字種「町」に対し、その類似文字種として、例えば、
「野」、「財」、「時」、「肝」がキー文字認識用辞書
に登録され、キー文字種「村」に対し、その類似文字種
として、例えば、「付」、「対」、「杖」、「打」がキ
ー文字認識用辞書に登録されている。
【0248】図24は、図23のキー文字種及びその類
似文字種に字種限定されたキー文字認識用辞書を用いた
場合のキー文字認識結果を示す図である。図24におい
て、文字種が「見」のサンプルパターン61について、
第1位の文字種の候補として「見」が出力され、第2位
の文字種の候補として「貝」が出力され、第3位の文字
種の候補として「県」が出力されている。また、文字種
が「県」のサンプルパターン62について、第1位の文
字種の候補として「県」が出力され、第2位の文字種の
候補として「見」が出力され、第3位の文字種の候補と
して「貝」が出力されている。
【0249】ここで、サンプルパターン61の特徴ベク
トルとキー文字種「県」の特徴ベクトルとの距離は、サ
ンプルパターン62の特徴ベクトルとキー文字種「県」
の特徴ベクトルとの距離と同じであり、距離のみを用い
たのではサンプルパターン61はキー文字ではないと判
定できない。ところが、サンプルパターン62について
は、キー文字種「県」の出現順位は第1位であるにもか
かわらず、サンプルパターン61については、キー文字
種「県」の出現順位は第3位となっている。このため、
例えば、キー文字種の出現順位が第1位のパターンのみ
をキー文字候補として抽出し、キー文字種の出現順位が
第2位以下のパターンはキー文字ではないとすることに
より、サンプルパターン62はキー文字候補として抽出
することが可能となるとともに、サンプルパターン61
はキー文字候補として抽出されないようにすることが可
能となる。
【0250】この結果、キー文字であるサンプルパター
ン62をキー文字として正しく抽出することが可能とな
るとともに、キー文字でないサンプルパターン61をキ
ー文字として誤って抽出することを防止することが可能
となる。また、照合回数についても、JIS第1水準漢
字文字種が全て登録されている辞書を用いると、サンプ
ルパターン61、62のそれぞれに対して約3000回
づつ必要になるの比べ、図23の文字種が登録されてい
る辞書を用いると、サンプルパターン61、62のそれ
ぞれに対して45回で済ませることが可能となり、処理
時間を短縮することが可能となる。
【0251】図25は、本発明の第6実施例に係わる住
所認識装置の構成を示すブロック図である。図25にお
いて、301は住所認識装置全体である。観測部303
では、スキャナやCCDなどによって帳票302から住
所画像が読み込まれ、電子データ化されて、白黒の二値
化データに変換される。文字列切出部304では、住所
画像を一文字列ごとに切り出す。ラベリング部305で
は、各行画像に対して連結成分ごとにラベリングを行
い、横書き文字に対しては、上下方向の重なりラベル統
合を行う。接触箇所判定・切断部306では、文字間接
触のある箇所を判定し、これらの文字の分離を行う。
【0252】キー文字候補抽出部308では、キー文字
用辞書307及びキー文字らしさの度合いを用いて、文
字列中のキー文字候補を抽出する。ここで、キー文字候
補を抽出する場合、隣接するラベル画像との統合可能性
を判定しながら、自分自身と統合後のラベル画像に文字
認識を実行し、N位まで認識結果を求める。そして、認
識結果の上位N位中に、キー文字種を含むものをキー文
字候補として決定、あるいは、キー文字らしさがしきい
値以上のものをキー文字候補として決定する。キー文字
用辞書307に登録されている文字種は、キー文字種及
びその類似文字種のみに字種限定されており、キー文字
の抽出精度を損なうことなく、キー文字抽出を高速化す
ることが可能となる。
【0253】キー文字組候補決定部310では、キー文
字候補抽出部308で抽出されたキー文字候補の中か
ら、住所階層構造知識部309に登録されている住所階
層構造知識に矛盾しないキー文字の組の候補を決定す
る。地名単語領域切出部311では、キー文字に挟まれ
た地名単語領域を切り出す。地名単語一括認識部313
では、地名単語認識用辞書312を参照することによ
り、各地名単語の認識を一括して行い、各キー文字組候
補の中から、正しいものを1つ決定する。一文字認識部
315では、丁目・番地・方書き部などを、一文字づつ
切り出して文字認識を実行する。住所決定部317で
は、住所知識部316に登録されている住所知識を使っ
て、読み取った結果が現実の住所に合致するかを調べ、
現実の住所に合致するものを出力する。
【0254】図26は、本発明の一実施例に係わるキー
文字認識用辞書の作成方法を示すフローチャートであ
る。図26において、十分多くのサンプルパターンの各
文字種の組に対し、全文字種が登録されている辞書で文
字認識を実行し(ステップS31)、第N位まで候補文
字種を求める。この第N位まで候補文字種の中に、キー
文字種のいずれかが含まれていた場合(ステップS3
2)、そのキー文字種の含有数を1だけ加算する(ステ
ップS33)。文字認識を実行した文字種のサンプルパ
ターン数をNs、k番目のキー文字を第N位までに含む
サンプルパターン数をNkとした時、k番目のキー文字
種の含有率としてNk/Nsを計算し(ステップS3
4)、 Nk/Ns>Rth の条件を満たすかどうかを調べる(ステップS35)。
そして、この条件を満たす文字種を、そのキー文字の類
似文字種と判定し(ステップS36)、全文字種の辞書
から、キー文字に類似する文字種に対応する部分を取り
出す(ステップS37)。ここで、Rthは比のしきい
値で、実験によって適切な値を設定する。
【0255】例えば、「見」という文字種のサンプルパ
ターン数が2000で、この各サンプルパターンについ
て文字認識を実行した結果、第N位までにキー文字種
「県」を含むサンプルパターン数が1500だけあった
ものとし、Rth=0.5と仮定すると、Nk=150
0、Ns=2000であるので、 Nk/Ns=0.75>0.5 となり、「見」という文字種をキー文字種「県」の類似
文字種として判定することができる。
【0256】図27は、本発明の一実施例に係わる住所
認識装置のシステム構成を示すブロック図である。図2
7において、401は全体的な処理を行う中央演算処理
ユニット(CPU)、402はリードオンリメモリ(R
OM)、403はランダムアクセスメモリ(RAM)、
404は通信インターフェイス、405は通信ネットワ
ーク、406は入出力インターフェイス、407は住所
の認識結果などを表示するディスプレイ、408は住所
の認識結果などを印刷するプリンタ、409はスキャナ
410により読み取られたデータを一時的に格納するメ
モリ、410は入力画像などを読み取るスキャナ、41
1はキーボード、412は記憶媒体を駆動するドライ
バ、413はハードディスク、414はICメモリカー
ド、415は磁気テープ、416はフロッピーディス
ク、417はCD−ROMやDVD−ROMなどの光デ
ィスク、418はバスである。
【0257】住所認識処理を行うプログラム、キー文字
認識用辞書の内容、地名辞書の内容、住所階層構造知
識、住所中キー文字位置知識、及び地名知識などは、ハ
ードディスク413、ICメモリカード414、磁気テ
ープ415、フロッピーディスク416、光ディスク4
17などの記憶媒体に格納される。そして、住所認識処
理を行うプログラム、キー文字認識用辞書の内容、地名
辞書の内容、住所階層構造知識、住所中キー文字位置知
識、及び地名知識などを、これらの記憶媒体からRAM
403に読み出すことにより、住所認識処理を行うこと
ができる。また、住所認識処理を行うプログラム、キー
文字認識用辞書の内容、地名辞書の内容、住所階層構造
知識、住所中キー文字位置知識、及び地名知識などを、
ROM402に格納しておくこともできる。
【0258】さらに、住所認識処理を行うプログラム、
キー文字認識用辞書の内容、地名辞書の内容、住所階層
構造知識、住所中キー文字位置知識、及び地名知識など
を、通信インターフェイス404を介して通信ネットワ
ーク405から取り出すこともできる。通信インターフ
ェイス404に接続される通信ネットワーク405とし
て、例えば、LAN(Local Area Netw
ork)、WAN(WideArea Networ
k)、インターネット、アナログ電話網、デジタル電話
網(ISDN:Integral Service D
igital Network)、PHS(パーソナル
ハンディシステム)や衛星通信などの無線通信網を用い
ることができる。
【0259】CPU401は、住所認識処理を行うプロ
グラムが起動されると、スキャナ410により読み取ら
れた入力画像から住所領域を抽出し、住所領域のパター
ンからキー文字を抽出する。そして、抽出されたキー文
字が、住所階層構造知識及び住所中キー文字位置知識に
矛盾しないかどうかを調べ、住所階層構造知識及び住所
中キー文字位置知識に矛盾しないキー文字を用いること
により、地名領域を抽出する。地名領域が抽出される
と、地名領域のパターンを一体的に照合して地名を抽出
する。そして、抽出された地名が、住所知識に矛盾しな
いかどうかを調べ、住所知識に矛盾しない地名を、住所
の読み取り結果としてディスプレイ407やプリンタ4
08に出力する。
【0260】以上、本発明の一実施例について説明した
が、本発明は上述した実施例に限定されることなく、本
発明の技術的思想の範囲内で他の様々の変更が可能であ
る。例えば、上述した実施例では、「県」、「市」、
「町」、「村」などの地名の区切りとなる文字をキー文
字として抽出して、住所を認識する場合について説明し
たが、「部」、「課」、「係」などの部署の区切りとな
る文字をキー文字として抽出して、会社での所属名を認
識する場合に適用してもよい。
【0261】
【発明の効果】以上説明したように、本発明によれば、
接触文字の切断前の状態に基づいて、キー文字の位置で
区切られる地名領域の地名の認識を行うことにより、住
所を表す文字列が接触している場合においても、地名を
表す文字列を一体的に抽出し、その文字列を一体的に処
理して地名の認識を行うことが可能となることから、地
名を表す文字列を一文字ごとに切り分ける際の処理を省
略して、住所の認識を効率的に行うことが可能となると
ともに、地名を表す文字列が間違った位置で切断される
ことを防止して、住所認識の正確性を向上させることが
可能となる。
【0262】また、本発明の一態様によれば、キー文字
によって区切られるパターン全体の特徴ベクトルを、地
名登録辞書に登録された地名の特徴ベクトルと照合する
ことにより、地名を表す文字列を一文字ごとに切り分け
ることなく、認識処理を一体的に行うことが可能とな
り、住所認識の効率性及び正確性を向上させることが可
能となる。
【0263】また、本発明の一態様によれば、キー文字
によって区切られるパターンの属性が「県」ならば、
「県」に関する地名を登録した辞書を用いて照合を行う
ことにより、キー文字で特定される属性に対応した照合
が可能となるため、認識精度を向上させることが可能と
なる。
【0264】また、本発明の一態様によれば、入力パタ
ーンのサイズに基づいて、切断位置の評価を行うことに
より、入力パターンからキー文字を抽出する際に、キー
文字を抽出するのに適した大きさに連結パターンを分離
することが可能となり、連結パターンの切断位置の数を
減らして、認識処理の回数を減らすことが可能となるこ
とから、住所の認識を効率的に行うことが可能となる。
【0265】また、本発明の一態様によれば、連結パタ
ーンのサイズに基づいて、切断位置の検出を行う連結パ
ターンを選択することにより、接触文字の可能性のある
比較的大きな連結パターンについてだけ切断位置の検出
を行い、接触文字とは認められない小さな連結パターン
については、切断位置の検出を省略することが可能とな
り、住所認識の効率性を向上させることが可能となる。
【0266】また、本発明の一態様によれば、入力パタ
ーンについての黒画素数ヒストグラムの極小点の値が所
定値以下の点を切断点候補とすることにより、文字同士
の接触点を検出することが可能となり、連結パターンを
文字同士の接触点で切断することが可能となる。
【0267】また、本発明の一態様によれば、連結パタ
ーンを切断した時の縦横比が所定の範囲内の領域で切断
することにより、連結パターンがキー文字を抽出するの
に不適当な大きさに切断されることを防止して、キー文
字の対象とならないパターンが生成されることを防止す
ることが可能となり、キー文字の対象とならないパター
ンについて無駄な処理が行われることを防止して、住所
認識を効率的に行うことが可能となる。
【0268】また、本発明の一態様によれば、半文字単
位で仮切断点候補を設定可能とすることにより、横書き
なら、キー文字の「偏」または「旁」のみ、縦書きな
ら、キー文字の「冠」、「連火」または「脚」のみが他
の文字と接触する場合においても、パターンを必要以上
に細切れに切断することなく、これらのキー文字の一部
分を接触文字から効率的に抽出することが可能となり、
元のキー文字を効率的に復元することが可能となる。
【0269】また、本発明の一態様によれば、平均文字
サイズの1/2の大きさの倍数の位置から一定範囲内の
中に、黒画素数ヒストグラムの極小点が複数存在してい
る場合、黒画素数ヒストグラムの値が最も小さい極小点
を選択することにより、仮切断候補点を1つだけに絞り
込むことができ、連結パターンが文字の切れ目でないと
ころで細かく切断されて、処理が複雑になることを防止
することが可能となる。
【0270】また、本発明の一態様によれば、平均文字
サイズの1/2の大きさの倍数の位置から一定範囲内の
中に、黒画素数ヒストグラムの値が最も小さい極小点が
複数存在している場合、平均文字サイズの1/2の大き
さの倍数の位置に最も近い点を選択することにより、仮
切断候補点を1つだけに絞り込むことができ、連結パタ
ーンが文字の切れ目でないところで細かく切断されて、
処理が複雑になることを防止することが可能となる。
【0271】また、本発明の一態様によれば、切断され
たパターンについての統合結果に基づいて、キー文字を
抽出することにより文字の一部分のみが他の文字と接触
している場合においても、文字の一部分を他の文字と切
り離し、切り離された文字の一部分を本来の文字の残り
の部分と合体させることが可能となり、キー文字の誤認
識を防止することが可能となる。
【0272】また、本発明の一態様によれば、上位にラ
ンクされたキー文字候補を優先的に使用することによ
り、キー文字候補として誤って抽出された文字が、地名
領域の抽出に使用されることを減らすことが可能とな
り、地名領域として抽出される候補の数を減らして、地
名の認識処理の回数を減らすことが可能となることか
ら、住所認識の効率性を向上させることが可能となる。
【0273】また、本発明の一態様によれば、キー文字
候補のキー文字らしさを登録しておくことにより、キー
文字らしさが大きいキー文字候補を優先的に使用するこ
とが可能となるとともに、優先的に使用したキー文字候
補を用いただけでは、住所の表示に用いることが可能な
キー文字同士の組み合わせが得られない場合は、追加す
るキー文字候補を容易に選ぶことが可能となり、処理を
迅速に行うことが可能となりる。
【0274】また、本発明の一態様によれば、キー文字
の配置順序及び配置位置、またはキー文字同士の組み合
わせが住所の表示に用いられるものとして適当であるか
どうかを判定することにより、地名の中に住所のキー文
字が含まれている場合においても、地名の中に含まれて
いるキー文字を除去し、地名の階層を表すために用いら
れている文字をキー文字と特定することが可能となり、
地名領域の誤抽出を防止して、住所認識を効率的に行う
ことが可能となる。
【0275】また、本発明の一態様によれば、一部選択
項目により指定されたキー文字が存在する場合、そのキ
ー文字の階層レベルより下の階層レベルから、キー文字
候補の組の決定を行うことにより、アンケート葉書など
のように、住所の一部選択項目が設けられている場合に
おいても、キー文字抽出の精度を向上させることが可能
となる。
【0276】また、本発明の一態様によれば、上位にラ
ンクされたキー文字候補を用いただけでは、住所の表示
として適当なキー文字同士の組み合わせが得られない場
合、下位にランクされたキー文字候補を追加することに
より、地名領域を抽出する際の正確性を損なうことな
く、キー文字候補の数を必要最小限に抑えることが可能
となる。
【0277】また、本発明の一態様によれば、下位にラ
ンクされたキー文字候補のうち、住所の表示に使用され
るキー文字の組に欠けているものだけを追加することに
より、下位にランクされたキー文字候補の中から必要な
ものだけを選択して、キー文字候補とすることができ、
キー文字抽出を効率的に行うことが可能となる。
【0278】また、本発明の一態様によれば、キー文字
らしさの大きいキー文字候補を優先的に用いてキー文字
候補の組を決定することにより、抽出されたキー文字候
補の組み合わせの中から、住所階層構造知識及び住所中
キー文字位置知識に矛盾しないキー文字候補の組を決定
する場合、キー文字候補の組み合わせの数を減らして処
理時間を短縮することが可能となり、住所認識を効率よ
く行うことが可能となる。
【0279】また、本発明の一態様によれば、住所表示
に用いられる地名同士の組み合わせ、または住所表示に
用いられる地名の配列順序が適当であるかどうかを判定
することにより、地名領域のパターンに対して複数の地
名候補が提示され、それらの地名候補を組み合わせるこ
とにより複数の住所候補が得られる場合においても、住
所の表示として現存しない地名の組み合わせを除去し
て、実在する住所のだけを識別することが可能となり、
住所認識の精度を向上させることが可能となる。
【0280】また、本発明の一態様によれば、一文字ず
つ照合した住所の認識結果も出力することにより、キー
文字抽出に失敗した場合においても、住所の認識を行う
ことが可能となり、住所認識の信頼性を向上させること
が可能となる。
【0281】また、本発明の一態様によれば、キー文字
認識用辞書に登録される文字種をキー文字種及びキー文
字種の類似文字種のみに字種限定することにより、入力
画像から切り出されたパターンの中からキー文字を抽出
する場合、キー文字認識用辞書に全ての文字種が登録さ
れている場合に比べて、入力画像から切り出されたパタ
ーンとキー文字認識用辞書に登録されている文字種との
比較回数を低減させることが可能となることから、住所
認識の処理時間を短縮することが可能となる。また、キ
ー文字認識用辞書にキー文字種のみが登録されている場
合に比べて、認識対象となるパターンに対するキー文字
種の出現順位を考慮して、認識対象となるパターンがキ
ー文字かどうかを判別することが可能となることから、
キー文字でないパターンがキー文字に類似している場合
でも、キー文字かどうかを精度よく判別することが可能
となり、キー文字に類似しているキー文字でないパター
ンがキー文字として誤って抽出され、住所の認識精度が
悪化することを防止することが可能となる。
【0282】また、本発明の一態様によれば、ある文字
種についての文字認識を行ったサンプルパターンの個数
Mに対し、前記文字認識の結果のN位以内にキー文字種
を含むサンプルパターンの個数Kの割合が一定値以上の
場合、前記文字種を前記キー文字種の類似文字種とする
ようにしている。
【0283】このことにより、キー文字種の類似文字種
を精度よく判別することが可能となる。
【図面の簡単な説明】
【図1】本発明の第1実施例に係わる住所認識装置の構
成を示すブロック図である。
【図2】本発明の一実施例に係わる住所認方法を説明す
る図である。
【図3】本発明の第2実施例に係わる住所認識装置の構
成を示すブロック図である。
【図4】本発明の第3実施例に係わる住所認識装置の構
成を示すブロック図である。
【図5】本発明の第4実施例に係わる住所認識装置の構
成を示すブロック図である。
【図6】本発明の第5実施例に係わる住所認識装置の構
成を示すブロック図である。
【図7】本発明の一実施例に係わる切断箇所判定・切断
処理を示すフローチャートである。
【図8】本発明の一実施例に係わるキー文字候補抽出処
理を示すフローチャートである。
【図9】本発明の一実施例に係わるキー文字候補決定処
理及びキー文字再抽出処理を示すフローチャートであ
る。
【図10】(a)は、文字間接触を有する手書き住所文
字列の第1の例を示す図、(b)は、外接矩形で囲まれ
たラベル画像を示す図、(c)は、外接矩形の統合結果
を示す図である。
【図11】(a)は、接触文字列の抽出結果を示す図、
(b)は、接触文字列の黒画素数ヒストグラム上におけ
る切断点候補の位置を示す図、(c)は、接触文字列の
黒画素数ヒストグラム上における仮切断点の位置を示す
図である。
【図12】(a)は、図9(a)の文字列の仮切断結果
を示す図、(b)は仮切断により得られた単独パターン
の統合可否の判定結果を示す図である。
【図13】(a)は、仮切断により得られた単独パター
ンの認識結果を示す図、(b)は、仮切断により得られ
た単独パターンを仮統合したパターンの認識結果を示す
図である。
【図14】図9(a)の文字列について作成されたパタ
ーン情報テーブルの例を示す図である。
【図15】住所に使用されるキー文字の階層レベルを示
す表である。
【図16】図9(a)の文字列から抽出されたキー文字
候補を示す図である。
【図17】(a)は、住所に使用されるキー文字の階層
構造を示す図、(b)は、図15のキー文字候補につい
て使用可能なキー文字セットを示す図である。
【図18】文字間接触を有する手書き住所文字列の第2
の例を示す図である。
【図19】図17(a)の文字列について作成されたパ
ターン情報テーブルの例を示す図である。
【図20】(a)は、図17(a)の文字列から抽出さ
れたキー文字候補を示す図、(b)は、図17(a)の
文字列から再抽出されたキー文字候補を示す図、(c)
は、図17(a)の文字列について使用可能なキー文字
セットを示す図である。
【図21】本発明の一実施例に係わるキー文字認識用辞
書を使い分けた場合のキー文字種の認識結果を示す図で
ある。
【図22】本発明の一実施例に係わるキー文字認識用辞
書の構成を示すブロック図である。
【図23】本発明の一実施例に係わるキー文字種及び類
似文字種を示す図である。
【図24】本発明の一実施例に係わるキー文字種及びそ
の類似文字種に字種限定されたキー文字認識用辞書を用
いた場合のキー文字認識結果を示す図である。
【図25】本発明の第6実施例に係わる住所認識装置の
構成を示すブロック図である。
【図26】本発明の一実施例に係わるキー文字認識用辞
書の作成方法を示すフローチャートである。
【図27】本発明の一実施例に係わる住所認識装置のシ
ステム構成を示すブロック図である。
【図28】従来の住所認識装置の構成を示すブロック図
である。
【符号の説明】
1 接触位置判定手段 2 接触文字切断手段 3、14 キー文字抽出手段 4、15、23 地名領域抽出手段 5、16、24 地名認識手段 11 切断位置検出手段 12 切断位置評価手段 13 連結パターン切断手段 21 キー文字候補抽出手段 22 ランク付け手段 31、305 ラベリング部 32 一文字領域決定部 33 平均文字サイズ計算部 34、306 切断箇所判定・切断部 35 ヒストグラム作成部 36 仮切断点候補抽出部 37 仮切断点候補決定部 38、307 キー文字認識用辞書 39、308 キー文字候補抽出部 40 パターン統合判定・統合部 41、52、57 特徴抽出部 42、53、58 辞書照合部 43 パターン情報テーブル作成部 44 キー文字知識部 45、309 住所階層構造知識部 46 住所中キー文字位置知識部 47、310 キー文字組候補決定部 48 不足キー文字再抽出部 49、311 地名単語領域切り出し部 50、312 地名単語認識用辞書 51、313 地名単語一括認識部 54、314 一文字認識用辞書 55、315 一文字認識部 59、316 住所知識部 60、317 住所決定部 61 住所階層構造知識 62 住所中キー文字位置知識 63 パターン情報テーブル 101 キー文字抽出手段 102 一括認識手段 103 地名単語辞書 201 キー文字認識用辞書 202 キー文字書格納部 203 類似文字書格納部 301 住所認識装置 302 帳票 303 観測部 303 文字列切り出し部 401 CPU 402 ROM 403 RAM 404 通信インターフェイス 405 通信ネットワーク 406 入出力インターフェイス 407 ディスプレイ 408 プリンタ 409 メモリ 410 スキャナ 411 キーボード 412 ドライバ 413 ハードディスク 414 ICメモリカード 415 磁気テープ 416 フロッピーディスク 417 光ディスク 418 バス

Claims (48)

    【特許請求の範囲】
  1. 【請求項1】 接触文字の切断結果に基づいて、キー文
    字の抽出を行うキー文字抽出手段と、 前記キー文字の位置に基づいて、地名単語領域を抽出す
    る地名単語領域抽出手段と、 前記接触文字の切断前の状態に基づいて、前記地名単語
    領域の地名単語の認識を行う地名単語認識手段とを備え
    ることを特徴とする住所認識装置。
  2. 【請求項2】 前記地名単語認識手段は、 地名単語パターンの代表的特徴ベクトルを登録した地名
    単語辞書と、 前記キー文字によって区切られるパターンの特徴ベクト
    ルと前記地名単語辞書に登録された地名単語の特徴ベク
    トルとを照合する照合手段と、 前記照合結果に基づいて、地名単語の認識結果を出力す
    る出力手段とを備えることを特徴とする請求項1に記載
    の住所認識装置。
  3. 【請求項3】 前記地名単語辞書は、前記キー文字で特
    定される属性ごとに前記地名単語パターンの代表的特徴
    ベクトルが登録され、 前記照合手段は、前記キー文字によって区切られるパタ
    ーンの特徴ベクトルを、前記キー文字で特定される属性
    を有する地名単語と照合することを特徴とする請求項2
    に記載の住所認識装置。
  4. 【請求項4】 入力パターンから連結パターンを抽出す
    る連結パターン抽出手段と、 前記連結パターンの切断位置を検出する切断位置検出手
    段と、 前記入力パターンのサイズに基づいて、前記切断位置の
    評価を行う切断位置評価手段と、 前記評価結果に基づいて、前記連結パターンを切断する
    連結パターン切断手段と、 連結パターンの切断結果に基づいて、キー文字を抽出す
    るキー文字抽出手段と、 前記キー文字の位置に基づいて、地名単語領域を抽出す
    る地名単語領域抽出手段と、 前記地名単語領域の地名単語の認識を行う地名単語認識
    手段とを備えることを特徴とする住所認識装置。
  5. 【請求項5】 前記切断位置検出手段は、 前記連結パターンのサイズに基づいて、切断位置の検出
    を行う連結パターンを選択する選択手段を備えることを
    特徴とする請求項4に記載の住所認識装置。
  6. 【請求項6】 前記切断位置検出手段は、 前記入力パターンについての黒画素数ヒストグラムを算
    出するヒストグラム算出手段と、 前記黒画素数ヒストグラムの極小点を検出する極小点検
    出手段と、 前記極小点での黒画素数ヒストグラムの値が所定値以下
    の点を切断点候補とする切断点候補検出手段とを備える
    ことを特徴とする請求項4または5に記載の住所認識装
    置。
  7. 【請求項7】 前記切断位置評価手段は、 前記連結パターンを切断した時の縦横比が所定の範囲内
    にある領域を検出する領域検出手段と、 前記切断位置検出手段により検出された切断位置のう
    ち、前記領域検出手段により検出された領域外にある切
    断位置を除外する除外手段とを備えることを特徴とする
    請求項4〜6のいずれか1項に記載の住所認識装置。
  8. 【請求項8】 統合後のパターンのサイズに基づいて、
    統合前のパターンの統合判定を行う統合判定手段と、 前記統合判定結果に基づいて、統合前のパターンの統合
    を行う統合手段とをさらに備え、 前記キー文字抽出手段は、前記統合手段による統合後の
    パターンに基づいて、キー文字を抽出することを特徴と
    する請求項4〜7のいずれか1項に記載の住所認識装
    置。
  9. 【請求項9】 入力パターンからキー文字候補を抽出す
    るキー文字候補抽出手段と、 前記キー文字候補の認識結果に基づいて、前記キー文字
    候補のランク付けを行うランク付け手段と、 前記ラン
    ク付け手段により上位にランクされたキー文字候補の位
    置に基づいて、地名単語領域を抽出する地名単語領域抽
    出手段と、 前記地名単語領域の地名単語の認識を行う地名単語認識
    手段とを備えることを特徴とする住所認識装置。
  10. 【請求項10】 前記地名単語領域抽出手段は、 キー文字の配置順序及び配置位置、またはキー文字同士
    の組み合わせが、住所の表示に使用可能であるかを判定
    する判定手段と、 前記上位にランクされたキー文字候補を用いただけで
    は、住所の表示に使用可能なものを得ることができない
    場合、下位にランクされたキー文字候補を追加する追加
    手段とを備えることを特徴とする請求項9に記載の住所
    認識装置。
  11. 【請求項11】 前記追加手段は、下位にランクされた
    キー文字候補のうち、住所の表示に使用されるキー文字
    の組に欠けているものだけを追加することを特徴とする
    請求項10に記載の住所認識装置。
  12. 【請求項12】 入力パターンの各連結成分にラベル付
    けを行うラベリング部と、 連結成分を囲む外接矩形の重なり度が所定値以上の連結
    パターンを統合した結果に基づいて、一文字領域を決定
    する一文字領域決定部と、 前記一文字領域のサイズに基づいて、平均文字サイズを
    計算する平均文字サイズ計算部と、 前記平均文字サイズに基づいて、前記連結パターン内に
    おける文字同士の接触箇所を判定する接触個所判定部
    と、 文字の接触箇所の判定結果に基づいて、前記連結パター
    ンを切断する切断部と、 前記連結パターンの切断結果に基づいて、照合単位とな
    る矩形領域を生成する矩形領域生成手段と、 住所の表
    示に用いられる文字を登録したキー文字認識用辞書部
    と、 前記矩形領域で囲まれるパターンを前記キー文字認識用
    辞書部に登録されている文字と照合することにより、キ
    ー文字候補を抽出するキー文字候補抽出部と、 キー文字の住所中での可能な組み合わせと配置順序に関
    する住所階層構造知識を登録した住所階層構造知識部
    と、 キー文字の住所中での可能な配置位置に関する住所中キ
    ー文字位置知識を登録した住所中キー文字位置知識部
    と、 前記住所階層構造知識及び前記住所中キー文字位置知識
    を参照することにより、前記キー文字候補の中から住所
    に用いられる可能な組み合わせを決定するキー文字候補
    決定部と、 前記キー文字候補決定部で決定されたキー文字候補で区
    切られる領域から地名単語を切り出す地名単語切り出し
    部と、 前記地名単語の特徴ベクトルを抽出する住所単語特徴抽
    出部と、 地名単語の特徴ベクトルを登録した地名単語辞書部と、 前記地名単語特徴抽出部で抽出された地名単語の特徴ベ
    クトルと、前記地名単語辞書部に登録された地名単語の
    特徴ベクトルを照合することにより、前記地名単語の認
    識を行う地名単語一括認識部と、 住所表示に用いられる地名同士の組み合わせの可否、ま
    たは住所表示に用いられる地名の配列順序が適当である
    かどうかの地名知識を登録した地名知識部と、 前記地名単語の認識結果が前記地名知識に矛盾しないか
    どうかを調べることにより、住所の決定を行う住所決定
    部とを備えることを特徴とする住所認識装置。
  13. 【請求項13】 前記キー文字候補決定部は、前記キー
    文字候補抽出部で抽出されたキー文字候補の組み合わせ
    が前記住所階層構造知識に矛盾せず、かつ、前記キー文
    字候補の配置位置及び配置順序が住所中キー文字位置知
    識と矛盾しないものを、キー文字候補の組として決定す
    ることを特徴とする請求項12に記載の住所認識装置。
  14. 【請求項14】 前記キー文字候補決定部は、一部選択
    項目により指定されたキー文字が存在する場合、前記キ
    ー文字の階層レベルより下の階層レベルから、キー文字
    候補の組の決定を行うことを特徴とする請求項13に記
    載の住所認識装置。
  15. 【請求項15】 前記接触個所判定部は、 前記一文字領域のパターンの外接矩形の縦横比を算出す
    る縦横比算出部と、 前記外接矩形の縦横比に基づいて、前記連結パターンに
    接触文字が含まれるかどうかをを判定する接触文字判定
    部と、 接触文字が含まれると判定された連結パターンについ
    て、文字列と垂直方向の黒画素数を計数した黒画素数ヒ
    ストグラムを生成する黒画素数ヒストグラム生成部と、 前記黒画素数ヒストグラムに対して移動平均を施すこと
    により、前記黒画素数ヒストグラムを平滑化する平滑化
    部と、 平滑化された黒画素数ヒストグラムに基づいて、前記連
    結パターンについての仮切断候補点を算出する仮切断候
    補点算出部とを備えることを特徴とする請求項12〜1
    4のいずれか1項に記載の住所認識装置。
  16. 【請求項16】 前記仮切断候補点は、前記黒画素数ヒ
    ストグラムの極小点のうち、所定のしきい値以下の値の
    点であることを特徴とする請求項15に記載の住所認識
    装置。
  17. 【請求項17】 前記仮切断候補点は、横書きなら、前
    記平均文字サイズの文字幅の1/2の大きさの倍数の位
    置、縦書きなら、前記平均文字サイズの文字高の1/2
    の大きさの倍数の位置から、前後一定範囲内の点である
    ことを特徴とする請求項15または16に記載の住所認
    識装置。
  18. 【請求項18】 前記仮切断候補点は、前記一定範囲内
    の点のうち、前記黒画素数ヒストグラムの値が最も小さ
    い極小点であることを特徴とする請求項17に記載の住
    所認識装置。
  19. 【請求項19】 前記仮切断候補点は、前記黒画素数ヒ
    ストグラムの値が最も小さい極小点のうち、前記1/2
    の大きさの倍数の位置に最も近い点であることを特徴と
    する請求項18に記載の住所認識装置。
  20. 【請求項20】 前記キー文字候補抽出部は、 互いに隣接する連結パターンの統合結果についての幅、
    高さ、または縦横比に基づいて、連結パターンについて
    の統合判定を行う統合判定部と、 前記統合判定結果に基づいて、前記連結パターンの仮統
    合を行う仮統合部とを備えることを特徴とする請求項1
    2〜19のいずれか1項に記載の住所認識装置。
  21. 【請求項21】 仮統合した仮統合パターンについて、
    キー文字認識を行う統合パターン認識部と、 仮統合前の単独パターンについて、キー文字認識を行う
    単独パターン認識部とを備えることを特徴とする請求項
    20に記載の住所認識装置。
  22. 【請求項22】 前記統合パターン認識部は、 前記仮統合パターンの特徴ベクトルと前記キー文字認識
    用辞書に登録されているキー文字種の特徴ベクトルとの
    距離、及び前記キー文字種が出現する順位に基づいて、
    キー文字らしさを算出する第1のキー文字らしさ算出部
    を備えることを特徴とする請求項21に記載の住所認識
    装置。
  23. 【請求項23】 前記単独パターン認識部は、前記単独
    パターンの特徴ベクトルと前記キー文字認識用辞書に登
    録されているキー文字種の特徴ベクトルとの距離、及び
    前記キー文字種が出現する順位に基づいて、キー文字ら
    しさを算出する第2のキー文字らしさ算出部を備えるこ
    とを特徴とする請求項21または22に記載の住所認識
    装置。
  24. 【請求項24】 前記キー文字候補抽出部は、 キー文字候補のキー文字らしさ、キー文字種、階層レベ
    ル、位置座標、隣接するパターンと統合するか否かの情
    報を記述したパターン情報テーブルを生成するパターン
    情報テーブル生成部を備えることを特徴とする請求項2
    2または23に記載の住所認識装置。
  25. 【請求項25】 前記キー文字候補抽出部は、 前記キー文字らしさがしきい値以上のパターンをキー文
    字候補として検出するキー文字候補検出部と、 前記キー文字らしさが前記しきい値より小さく0でない
    パターンを準キー文字候補として検出する準キー文字候
    補検出部とを備えることを特徴とする請求項22〜24
    のいずれか1項に記載の住所認識装置。
  26. 【請求項26】 前記住所階層構造知識及び前記住所中
    キー文字位置知識に矛盾しないキー文字候補の組が存在
    しない場合、必要な階層レベルまたは必要な文字種のキ
    ー文字を、前記準キー文字候補の中から抽出する不足キ
    ー文字再抽出部を備えることを特徴とする請求項25に
    記載の住所認識装置。
  27. 【請求項27】 前記住所階層構造知識及び前記住所中
    キー文字位置知識に矛盾しないキー文字候補の組が決定
    した場合、前記キー文字候補を生成する仮切断候補点を
    切断点として決定することを特徴とする請求項12〜2
    6のいずれか1項に記載の住所認識装置。
  28. 【請求項28】 前記住所階層構造知識及び前記住所中
    キー文字位置知識に矛盾しないキー文字候補の組が決定
    した場合、前記キー文字候補を生成する仮統合結果を統
    合結果として決定することを特徴とする請求項19〜2
    7のいずれか1項に記載の住所認識装置。
  29. 【請求項29】 前記地名単語切り出し部は、住所の最
    初の文字から最初のキー文字の直前の全パターン、及び
    2番目以降のキー文字の間に挟まれれている全パターン
    のそれぞれを、1つの地名単語として切り出すことを特
    徴とする請求項12〜28のいずれか1項に記載の住所
    認識装置。
  30. 【請求項30】 前記住所決定部は、地名単語一括認識
    部で得られた複数の地名候補の組み合わせのうち、地名
    知識部に登録されている地名の組み合わせを住所の読取
    り結果として出力することを特徴とする請求項12〜2
    9のいずれか1項に記載の住所認識装置。
  31. 【請求項31】 前記住所階層構造知識及び前記住所中
    キー文字位置知識に矛盾しないキー文字候補の組が決定
    されなかった場合、または地名知識に矛盾しない住所が
    得られなかった場合、エラーコードを出力することを特
    徴とする請求項12〜30のいずれか1項に記載の住所
    認識装置。
  32. 【請求項32】 一文字ごとの特徴ベクトルを登録した
    一文字認識用辞書と、 前記一文字領域のパターンの特徴ベクトルと前記一文字
    認識用辞書に登録された特徴ベクトルとを照合すること
    により、一文字認識を行う一文字認識部をさらに備える
    ことを特徴とする請求項12〜31のいずれか1項に記
    載の住所認識装置。
  33. 【請求項33】 入力画像からキー文字の抽出を行うキ
    ー文字抽出手段と、前記キー文字で区切られるパターン
    の認識を一括して行う一括認識手段とを備えることを特
    徴とする住所認識装置。
  34. 【請求項34】 登録される文字種がキー文字種及び前
    記キー文字種の類似文字種のみに字種限定されたキー文
    字認識用辞書をさらに備えることを特徴とする請求項3
    3に記載の住所認識装置。
  35. 【請求項35】 文字認識を行ったある文字種のサンプ
    ルパターンの個数Mに対し、前記文字認識の結果のN位
    以内にキー文字種を含むサンプルパターンの個数Kの割
    合が一定値以上の場合、前記文字種を前記キー文字種の
    類似文字種とすることを特徴とする請求項34に記載の
    住所認識装置。
  36. 【請求項36】 前記キー文字抽出手段は、 前記入力画像から切り出されたパターンと前記キー文字
    認識用辞書に登録されている文字種とを比較する比較手
    段と、 前記入力画像から切り出されたパターンのうち、前記比
    較手段で得られたキー文字種の出現順位が上位のものを
    キー文字候補として決定するキー文字候補決定手段とを
    備えることを特徴とする請求項34または35に記載の
    住所認識装置。
  37. 【請求項37】 前記比較手段は、前記入力画像から切
    り出されたパターンと前記キー文字認識用辞書に登録さ
    れている文字種との相違度または類似度に基づいて、前
    記キー文字種の出現順位を定義することを特徴とする請
    求項36に記載の住所認識装置。
  38. 【請求項38】 前記キー文字候補決定手段は、キー文
    字種との相違度または類似度が等しく、前記キー文字種
    の出現順位が等しい2つのパターンが存在する場合、前
    記2つのパターンのそれぞれについて第1位候補との相
    違度または類似度との差を検出し、前記第1位候補との
    相違度または類似度との差の小さい方のパターンのキー
    文字としての優先順位を上げることを特徴とする請求項
    37に記載の住所認識装置。
  39. 【請求項39】 登録される文字種がキー文字種及び前
    記キー文字種の類似文字種のみに字種限定されているこ
    とを特徴とするキー文字認識用辞書。
  40. 【請求項40】 キー文字の位置に基づいて地名単語領
    域を抽出するステップと、 前記地名単語領域に含まれるパターン全体を一体的に照
    合することにより、地名単語の認識を行うステップと、 前記地名単語の認識結果に基づいて、住所の認識を行う
    ステップとを備えることを特徴とする住所認識方法。
  41. 【請求項41】 キー文字のサイズに基づいて、連結パ
    ターンから矩形領域を切り出すステップと、 前記矩形領域に含まれるパターンに基づいて、キー文字
    の抽出を行うステップと、 前記キー文字の抽出結果に基づいて、住所の認識を行う
    ステップとを備えることを特徴とする住所認識方法。
  42. 【請求項42】 入力パターンからキー文字領域を抽出
    するステップと、 前記キー文字領域に含まれるパターンの認識結果に基づ
    いて、キー文字領域の選別を行うステップと、 選別されたキー文字領域の位置に基づいて、地名単語領
    域を抽出するステップと、 前記地名単語領域の抽出結果に基づいて、住所の認識を
    行うステップとを備えることを特徴とする住所認識方
    法。
  43. 【請求項43】 キー文字を抽出することにより、住所
    の認識を行う住所認識方法において、 前記キー文字によって区切られる地名単語の認識を、前
    記地名単語を構成する文字ごとに分離することなく、前
    記地名単語を構成する文字列を一体的に処理して行うこ
    とを特徴とする住所認識方法。
  44. 【請求項44】 入力画像からキー文字を抽出すること
    により住所の認識を行う住所認識方法において、 前記入力画像から切り出されたパターンをキー文字種及
    び前記キー文字種の類似文字種に字種限定して照合する
    ことにより、前記キー文字の抽出を行うことを特徴とす
    る住所認識方法。
  45. 【請求項45】 キー文字の位置に基づいて地名単語領
    域を抽出する機能と、 前記地名単語領域に含まれるパターン全体を一体的に照
    合することにより、地名単語の認識を行う機能と、 前記地名単語の認識結果に基づいて、住所の認識を行う
    機能とをコンピュータに実行させるプログラムを格納し
    たコンピュータ読み取り可能な記憶媒体。
  46. 【請求項46】 キー文字のサイズに基づいて、連結パ
    ターンから矩形領域を切り出す機能と、 前記矩形領域に含まれるパターンに基づいて、キー文字
    の抽出を行う機能と、 前記キー文字の抽出結果に基づいて、住所の認識を行う
    機能とをコンピュータに実行させるプログラムを格納し
    たコンピュータ読み取り可能な記憶媒体。
  47. 【請求項47】 入力パターンからキー文字領域を抽出
    する機能と、 前記キー文字領域に含まれるパターンの認識結果に基づ
    いて、キー文字領域の選別を行う機能と、 選別されたキー文字領域の位置に基づいて、地名単語領
    域を抽出する機能と、 前記地名単語領域の抽出結果に基づいて、住所の認識を
    行う機能とをコンピュータに実行させるプログラムを格
    納したコンピュータ読み取り可能な記憶媒体。
  48. 【請求項48】 入力画像から切り出されたパターンを
    キー文字種及びキー文字の類似文字種に字種限定して照
    合する機能と、 キー文字で区切られるパターンの認識を一括して行う機
    能とをコンピュータに実行させるプログラムを格納した
    コンピュータ読み取り可能な記憶媒体。
JP27993198A 1998-01-22 1998-10-01 住所認識装置及び住所認識方法 Expired - Fee Related JP3639126B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP27993198A JP3639126B2 (ja) 1998-01-22 1998-10-01 住所認識装置及び住所認識方法
US09/229,329 US6535619B1 (en) 1998-01-22 1999-01-13 Address recognition apparatus and method
KR1019990001820A KR100339446B1 (ko) 1998-01-22 1999-01-21 주소 인식 장치 및 주소 인식 방법
CNB991013549A CN100483450C (zh) 1998-01-22 1999-01-22 地址识别设备和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP1064398 1998-01-22
JP10-10643 1998-01-22
JP27993198A JP3639126B2 (ja) 1998-01-22 1998-10-01 住所認識装置及び住所認識方法

Publications (2)

Publication Number Publication Date
JPH11272803A true JPH11272803A (ja) 1999-10-08
JP3639126B2 JP3639126B2 (ja) 2005-04-20

Family

ID=26345950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27993198A Expired - Fee Related JP3639126B2 (ja) 1998-01-22 1998-10-01 住所認識装置及び住所認識方法

Country Status (4)

Country Link
US (1) US6535619B1 (ja)
JP (1) JP3639126B2 (ja)
KR (1) KR100339446B1 (ja)
CN (1) CN100483450C (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007042097A (ja) * 2005-07-29 2007-02-15 Fujitsu Ltd キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法
JP2007272348A (ja) * 2006-03-30 2007-10-18 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
JP2008243208A (ja) * 2007-03-27 2008-10-09 Fujitsu Ltd 住所認識装置
JP2008250754A (ja) * 2007-03-30 2008-10-16 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
JP2009080635A (ja) * 2007-09-26 2009-04-16 Canon Inc 画像検出装置及び方法

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000070549A1 (de) * 1999-05-12 2000-11-23 Siemens Aktiengesellschaft Verfahren zum adresslesen
DE19933984C2 (de) * 1999-07-20 2001-05-31 Siemens Ag Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen
JP2001134716A (ja) * 1999-11-09 2001-05-18 Toshiba Corp 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置
JP2001137788A (ja) * 1999-11-12 2001-05-22 Hitachi Ltd 地名表記辞書作成方法および地名表記辞書作成装置
US6876765B2 (en) * 2000-03-30 2005-04-05 Ricoh Company, Ltd. Character recognition method and computer-readable storage medium
JP4136316B2 (ja) * 2001-01-24 2008-08-20 富士通株式会社 文字列認識装置
JP4846924B2 (ja) * 2001-05-31 2011-12-28 キヤノン株式会社 パターン認識装置
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents
US7756337B2 (en) * 2004-01-14 2010-07-13 International Business Machines Corporation Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition
US7298904B2 (en) * 2004-01-14 2007-11-20 International Business Machines Corporation Method and apparatus for scaling handwritten character input for handwriting recognition
US20050152600A1 (en) * 2004-01-14 2005-07-14 International Business Machines Corporation Method and apparatus for performing handwriting recognition by analysis of stroke start and end points
US7490033B2 (en) * 2005-01-13 2009-02-10 International Business Machines Corporation System for compiling word usage frequencies
KR100599141B1 (ko) * 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법
JP2007004584A (ja) * 2005-06-24 2007-01-11 Toshiba Corp 情報処理装置
CN101645134B (zh) * 2005-07-29 2013-01-02 富士通株式会社 整体地名识别方法和整体地名识别装置
WO2007139039A1 (ja) * 2006-05-26 2007-12-06 Nec Corporation 情報分類装置、情報分類方法、及び情報分類プログラム
JP4860574B2 (ja) * 2006-09-13 2012-01-25 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP4774390B2 (ja) * 2006-09-13 2011-09-14 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP4909216B2 (ja) * 2006-09-13 2012-04-04 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP5011508B2 (ja) * 2007-04-27 2012-08-29 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
US7925046B2 (en) * 2007-05-02 2011-04-12 Lockheed Martin Corporation Implicit video coding confirmation of automatic address recognition
US9261979B2 (en) * 2007-08-20 2016-02-16 Qualcomm Incorporated Gesture-based mobile interaction
CN101836207B (zh) * 2007-08-20 2017-03-01 高通股份有限公司 超出词汇的词的增强的拒绝
JP5338063B2 (ja) * 2007-10-31 2013-11-13 富士通株式会社 画像認識プログラム、画像認識装置および画像認識方法
US8005260B2 (en) * 2008-05-15 2011-08-23 Graham Packaging Company L.P. Correcting video coding errors using an automatic recognition result
JP5146190B2 (ja) * 2008-08-11 2013-02-20 オムロン株式会社 文字認識装置、文字認識プログラム、および文字認識方法
US9002051B2 (en) * 2010-08-25 2015-04-07 Siemens Industry, Inc. Mail exchange tracking and analysis
JP5647919B2 (ja) * 2011-03-07 2015-01-07 株式会社Nttドコモ 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
US8942484B2 (en) 2011-09-06 2015-01-27 Qualcomm Incorporated Text detection using image regions
JP6078953B2 (ja) * 2012-02-17 2017-02-15 オムロン株式会社 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム
JP5831420B2 (ja) * 2012-09-28 2015-12-09 オムロン株式会社 画像処理装置および画像処理方法
CN105308554B (zh) * 2013-04-10 2019-08-06 惠普深蓝有限责任公司 数据传输系统、传输数据的方法、以及系统
US9524440B2 (en) 2014-04-04 2016-12-20 Myscript System and method for superimposed handwriting recognition technology
US9384403B2 (en) 2014-04-04 2016-07-05 Myscript System and method for superimposed handwriting recognition technology
CN105704258B (zh) * 2014-11-28 2019-11-29 方正国际软件(北京)有限公司 一种地址识别的方法和设备
US9659213B2 (en) * 2015-07-03 2017-05-23 Cognizant Technology Solutions India Pvt. Ltd. System and method for efficient recognition of handwritten characters in documents
US10373103B2 (en) 2015-11-11 2019-08-06 International Business Machines Corporation Decision-tree based address-station matching
CN108073564B (zh) * 2016-11-09 2021-05-14 北京国双科技有限公司 法院名称的统计方法及装置
US11036976B2 (en) * 2018-05-17 2021-06-15 Hasan Mirjan Methods and systems of handwriting recognition in virtualized-mail services
JP2021144307A (ja) * 2020-03-10 2021-09-24 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
US5050218A (en) * 1986-08-26 1991-09-17 Nec Corporation Apparatus for recognizing address appearing on mail article
JPS63182793A (ja) * 1987-01-26 1988-07-28 Sharp Corp 文字切り出し方式
JP2859307B2 (ja) 1989-07-31 1999-02-17 沖電気工業株式会社 文字切出し装置
US5825920A (en) * 1991-01-28 1998-10-20 Hitachi, Ltd. Method and unit for binary processing in image processing unit and method and unit for recognizing characters
US5293429A (en) * 1991-08-06 1994-03-08 Ricoh Company, Ltd. System and method for automatically classifying heterogeneous business forms
JPH0581477A (ja) 1991-09-18 1993-04-02 Sumitomo Electric Ind Ltd 文字切出し方法
KR960009280B1 (ko) 1993-06-11 1996-07-16 박경식 터널의 시공방법
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
JP2937729B2 (ja) * 1993-12-21 1999-08-23 株式会社バーズ情報科学研究所 パターン認識方法及び装置及び辞書作成方法
JP3453422B2 (ja) 1994-02-10 2003-10-06 キヤノン株式会社 文字パターンのユーザ辞書への登録方法及び該ユーザ辞書を有する文字認識装置
JPH07262320A (ja) 1994-03-18 1995-10-13 Matsushita Electric Ind Co Ltd 住所認識装置
KR970004539A (ko) 1995-06-07 1997-01-29 조종호 숫자-모음 결합 버튼 체계
KR970002740A (ko) 1995-06-09 1997-01-28 구자홍 문자인식장치의 접촉문자 분리 및 특징추출방법
JP3232991B2 (ja) 1995-12-13 2001-11-26 株式会社日立製作所 文字読取り方法及び住所読取り方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007042097A (ja) * 2005-07-29 2007-02-15 Fujitsu Ltd キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法
JP2007272348A (ja) * 2006-03-30 2007-10-18 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
JP4658848B2 (ja) * 2006-03-30 2011-03-23 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
US7949187B2 (en) 2006-03-30 2011-05-24 Nidec Sankyo Corporation Character string recognition method and device
JP2008243208A (ja) * 2007-03-27 2008-10-09 Fujitsu Ltd 住所認識装置
JP2008250754A (ja) * 2007-03-30 2008-10-16 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
JP2009080635A (ja) * 2007-09-26 2009-04-16 Canon Inc 画像検出装置及び方法

Also Published As

Publication number Publication date
KR19990068054A (ko) 1999-08-25
CN1225484A (zh) 1999-08-11
CN100483450C (zh) 2009-04-29
JP3639126B2 (ja) 2005-04-20
KR100339446B1 (ko) 2002-06-03
US6535619B1 (en) 2003-03-18

Similar Documents

Publication Publication Date Title
JPH11272803A (ja) 住所認識装置及び住所認識方法
US6341176B1 (en) Method and apparatus for character recognition
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5217127B2 (ja) 一括地名認識プログラム、一括地名認識装置および一括地名認識方法
KR100412317B1 (ko) 문자인식/수정방법및장치
JP3294995B2 (ja) 帳票読取装置
CN111563495A (zh) 一种图像中字符的识别方法、装置及电子设备
JP2000285190A (ja) 帳票識別方法および帳票識別装置および記憶媒体
JP2012141670A (ja) 帳票認識装置、方法およびプログラム
JP3589007B2 (ja) 文書ファイリングシステムおよび文書ファイリング方法
WO2000036530A1 (fr) Methode de recherche et dispositif correspondant, support enregistre
CN109101973B (zh) 文字识别方法、电子设备、存储介质
CN115050025A (zh) 基于公式识别的知识点抽取方法及装置
JP4228592B2 (ja) 文字認識装置
JPH07319880A (ja) キーワード抽出・検索装置
CN111753840A (zh) 一种同城物流配送名片下单技术
JPH06223121A (ja) 情報検索装置
JPH11328315A (ja) 文字認識装置
US20120011434A1 (en) Method for Object Recognition and Describing Structure of Graphical objects
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JPH06180771A (ja) 英文字認識装置
JP2004005761A (ja) キーワード抽出・検索装置
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JPH07271921A (ja) 文字認識装置および文字認識方法
JP6024118B2 (ja) 文字読取装置及び文字認識方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050113

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100121

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120121

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees