JP2001134716A - 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置 - Google Patents

所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置

Info

Publication number
JP2001134716A
JP2001134716A JP31881999A JP31881999A JP2001134716A JP 2001134716 A JP2001134716 A JP 2001134716A JP 31881999 A JP31881999 A JP 31881999A JP 31881999 A JP31881999 A JP 31881999A JP 2001134716 A JP2001134716 A JP 2001134716A
Authority
JP
Japan
Prior art keywords
word
location information
recognition
area
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP31881999A
Other languages
English (en)
Inventor
Akihiko Nakao
昭彦 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP31881999A priority Critical patent/JP2001134716A/ja
Priority to KR10-2000-0064171A priority patent/KR100401685B1/ko
Publication of JP2001134716A publication Critical patent/JP2001134716A/ja
Priority to US11/003,426 priority patent/US20050094850A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/424Postal images, e.g. labels or addresses on parcels or postal envelopes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1473Recognising objects as potential recognition candidates based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1918Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 この発明は、、わずかな修正を加えるだけで
各国の所在情報認識を実行できる。 【解決手段】 この発明は、国によって住所の記載書式
が異なる場合でも、各国用専用の住所認識装置を設計す
ること無く、同一のハードウェアで構成するようにした
ものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、所在情報として
の住所を認識する所在情報認識方法と認識アプリケーシ
ョンと記録媒体と所在情報認識装置に関する。
【0002】
【従来の技術】一般に、葉書や名刺などに書かれている
住所情報(所在情報)を光学式文字読取装置(OCR装
置)によって光学的に読み取る場合、まずその書状の画
像を取りこんでから住所の記載されている領域を指定ま
たは推定し、その領域内から行や文字を切り出す。
【0003】OCR装置内には認識対象地域内の地名辞
書が用意してあり、住所領域内に書かれている文字をこ
の辞書と照らし合わせながら読んでいくことによって住
所認識を行う。
【0004】住所認識の方式としては、日本の場合だと
まず都道府県名や市名といったおおまかな地域情報の文
字列を検出し、その続きの文字列を町名などのより細か
い地域情報として読んでいく方法が一般的である。この
後、特定の文字や文字列を検出するなど、住所認識率を
上げるためにさまざまな工夫が考案されている。
【0005】以下では、探索パターン列が文字認識処理
によって得られた文字列、辞書パターン列が単語辞書に
登録されている住所名文字列候補である場合について、
具体的に述べる。
【0006】まず、装置の汎用性について説明する。
【0007】たとえば、国が異なると住所の記載書式は
全く違っていることが多い。例えば日本では大まかな地
域名から順番に書くのが普通であるが、欧米では細かい
地域情報から順に書くことが多く、最初にストリート名
を書き、その後に都市名や州名を書く。そのため国が変
わると住所認識を行うための地名辞書が変わるだけでな
く、住所認識の手順も変える必要がある。
【0008】国による住所認識手順の違いは、汎用的な
住所認識装置を開発する際に大きな問題となる。例えば
英語圏用に開発した住所認識装置でフランス語圏の住所
を認識しようとして、地名辞書だけをフランス語圏用に
修正しても十分な性能を得られない。フランス語圏用の
住所認識手順を導入する必要があるが、装置の回路を各
国用に調整することはコスト高の要因となる。
【0009】次に、類似地名の誤認識について説明す
る。
【0010】たとえば、ある地域に「YORK」「NO
RTH YORK」「EAST YOPK」いう都市名
が存在した場合を考える。その地域の住所を認識する際
に、住所行の一部が「YORK」と認識できたとして
も、実際にそこに書かれている都市名は「NORTH
YORK」かも知れない。
【0011】逆に「EAST YORK」と認識した場
合でも、「EAST」の部分は別の単語を誤認識してい
る可能性がある。
【0012】次に、単語絞り込み辞書サイズの肥大化に
ついて説明する。
【0013】たとえば、1つの国の国内住所を全て認識
できるようにするには、当然国内の全地名を住所認識用
の単語辞書に登録する必要がある。しかし高速に住所認
識を行うにはさらに単語辞書に情報を追加する必要があ
る。
【0014】例えば「ABC」という大都市に1000
以上のストリートが存在したとする。この場合、ABC
という都市のストリート名を認識するためには、ストリ
ート名の探索パターン列の位置が分かっていても100
0回以上、辞書パターン列との比較処理を実行する必要
となる。
【0015】比較回数を減らす方法の1つとして、探索
パターン列の特徴から比較対象とする辞書パターン列を
ある程度絞り込み、絞り込んだ辞書パターン列と探索パ
ターン列を比較する方法がある。
【0016】探索パターンがアルファベットなど文字種
数が少ない場合によく用いられるのがbigram(N
−gramという手法で、N=2とした場合を示してい
る)と呼ばれる手法である。これはAB、BC、…、Z
Zといった2文字の並びのそれぞれについて、その2文
字の並びを含む辞書パターン列のリストをあらかじめ作
成しておく方法である。
【0017】このbigramは、 ・文字種数が少なく、 ・文字間にゴミが入りやすい 場合の文字認識に有効である。
【0018】例えば「JOHNSON」という辞書パタ
ーン列は「JO」「OH」「HN」「NS」「SO」
「ON」のリストに登録される全ての2文字の並びにつ
いて辞書パターン列のリストを作成したもののことを以
下では単語絞り込み辞書と呼ぶことにする。
【0019】探索パターン列と単語辞書に登録された辞
書パターン列の比較を実行する前に、探索パターン列に
含まれる2文字の並びを調べ、それらを含む辞書パター
ン列に得点を与えていく。そして総得点の高い辞書パタ
ーン列を選択し、それらと探索パターン列とを比較する
ことによって単語認識を行う。例えば総得点上位10位
までを使用することにすると、ストリート数が1000
以上ある都市のストリート名を認識する場合だと探索パ
ターン列と辞書パターン列の比較処理の回数は1/10
0以下となる。
【0020】ただし、認識対象地域内の全ての都市やス
トリート名について単語絞り込み辞書を用意した場合、
単語辞書の総容量より単語絞り込み辞書の総容量の方が
はるかに多くなることが多い。
【0021】
【発明が解決しようとする課題】この発明は、上記欠点
を除去するもので、わずかな修正を加えるだけで各国の
所在情報認識を実行できる所在情報認識方法と認識アプ
リケーションと記録媒体と所在情報認識装置を提供する
ことを目的としている。
【0022】
【課題を解決するための手段】この発明の所在情報認識
方法は、紙葉類上に記載され、種々の国ごとに異なる複
数段の階層構造のカテゴリーにより構成されている所在
情報を認識するものにおいて、種々の国ごとに対応して
設けられ、上記所在情報を認識するための複数の辞書
と、上記種々の国ごとに異なり、所在情報の複数段の階
層構造の各カテゴリーに対する種々の認識手順とを有
し、上記辞書を選択し、上記認識手順を選択する選択
し、上記紙葉類上に記載されている所在情報を読取り、
この読取った所在情報を上記選択されている認識手順に
そって、かつ上記選択されている辞書を用いて認識する
ものである。
【0023】この発明の認識アプリケーションは、種々
の国ごとに異なる複数段の階層構造のカテゴリーにより
構成されている所在情報を認識するものにおいて、種々
の国ごとに対応して設けられ、上記所在情報を認識する
ための複数の辞書と、上記種々の国ごとに異なり、所在
情報の複数段の階層構造の各カテゴリーに対する種々の
認識手順とを有し、上記所在情報を認識する際に、上記
辞書の1つが選択され、上記認識手順の1つが選択さ
れ、この選択された辞書と認識手順に基づいて、認識処
理が行われるものである。
【0024】この発明の記録媒体は、種々の国ごとに異
なる複数段の階層構造のカテゴリーにより構成されてい
る所在情報を認識するものに用いられるものにおいて、
種々の国ごとに対応し、上記所在情報を認識するための
複数の辞書と、上記種々の国ごとに異なり、所在情報の
複数段の階層構造の各カテゴリーに対する種々の認識手
順とが記録されているものである。
【0025】この発明の所在情報認識装置は、所在情報
画像を読取る読取手段と、この読取手段により読取った
所在情報画像から文字行を検出する行検出手段と、上記
読取手段により読取った所在情報画像から所在情報が記
載されている領域を検出する領域検出手段と、上記行検
出手段で検出した文字行のうち上記領域検出手段で検出
した所在情報領域内に含まれる文字行を1つまたは複数
の単語領域に分割する所在情報単語検出手段と、この所
在情報単語検出手段で得られた第1の単語領域内に含ま
れる文字情報を認識対象である地域内に存在する地名を
登録した単語辞書の内容と照合することにより単語を認
識するとともに、認識結果の単語評価値を出力する第1
の単語認識手段と、この第1の単語認識手段で処理した
第1の単語領域と、この第1の単語領域と同一行内で隣
接する第2の単語領域とを結合した第3の単語領域内に
含まれる文字情報を上記単語辞書の内容と照合すること
により単語を認識するとともに、認識結果の単語評価値
を出力する第2の単語認識手段と、上記第1の単語認識
手段による認識結果の単語評価値と上記第2の単語認識
手段による認識結果の単語評価値を比較し、単語評価値
の高い方の認識結果を出力する出力手段とからなる。
【0026】この発明の所在情報認識装置は、所在情報
画像を読取る読取手段と、この読取手段により読取った
所在情報画像から文字行を検出する行検出手段と、上記
読取手段により読取った所在情報画像から所在情報が記
載されている領域を検出する領域検出手段と、上記行検
出手段で検出した文字行のうち上記領域検出手段で検出
した所在情報領域内に含まれる文字行を1つまたは複数
の単語領域に分割する所在情報単語検出手段と、この所
在情報単語検出手段で得られた第1の単語領域内に含ま
れる文字情報を認識対象である地域内に存在する地名を
登録した単語辞書の内容と照合することにより単語を認
識するとともに、認識結果の単語評価値を出力する第1
の単語認識手段と、この第1の単語認識手段で処理した
第1の単語領域内に含まれる文字情報が第1の単語領域
を複数の単語に分割する条件を満たしているか否かを判
断する判断手段と、この判断手段により複数の単語に分
割する条件を満たしていると判断された際に、上記分割
された各単語を上記単語辞書の内容と照合することによ
り単語を認識するとともに、認識結果の単語評価値を出
力する第2の単語認識手段と、上記第1の単語認識手段
による認識結果の単語評価値と上記第2の単語認識手段
による各単語の認識結果の単語評価値を比較し、単語評
価値の高い方の認識結果を出力する出力手段とからな
る。
【0027】この発明の所在情報認識装置は、複数段の
階層構造のカテゴリーにより構成されている所在情報画
像を読取る読取手段と、この読取手段により読取った所
在情報画像から文字行を検出する行検出手段と、上記読
取手段により読取った所在情報画像から所在情報が記載
されている領域を検出する領域検出手段と、上記行検出
手段で検出した文字行のうち上記領域検出手段で検出し
た所在情報領域内に含まれる少なくとも1つの文字行を
1つまたは複数の単語領域に分割する所在情報単語検出
手段と、上記所在情報を構成する複数段の階層構造の各
カテゴリーに対応する上記所在情報単語検出手段で得ら
れた各単語領域での単語を認識する順序を設定する設定
手段と、この設定手段により設定される各単語領域に対
する認識の順序にしたがって、上記所在情報単語検出手
段で得られた単語領域内に含まれる文字情報を、認識対
象である地域内に存在する上記カテゴリーごとに異なる
地名を登録した複数の単語辞書の1つの単語辞書の内容
と照合することにより単語を認識する単語認識手段と、
この単語認識手段による各カテゴリーに対応する認識結
果を上記所在情報の認識結果として出力する出力手段と
からなる。
【0028】この発明の所在情報認識装置は、複数段の
階層構造のカテゴリーにより構成されている所在情報画
像を読取る読取手段と、この読取手段により読取った所
在情報画像から文字行を検出する行検出手段と、上記読
取手段により読取った所在情報画像から所在情報が記載
されている領域を検出する領域検出手段と、上記行検出
手段で検出した文字行のうち上記領域検出手段で検出し
た所在情報領域内に含まれる少なくとも1つの文字行を
1つまたは複数の単語領域に分割する所在情報単語検出
手段と、上記所在情報を構成する複数段の階層構造の各
カテゴリーに対応する上記所在情報単語検出手段で得ら
れた各単語領域での単語を認識する順序があらかじめ記
憶されているICと、このICに記憶されている各単語
領域に対する認識の順序にしたがって、上記所在情報単
語検出手段で得られた単語領域内に含まれる文字情報
を、認識対象である地域内に存在する上記カテゴリーご
とに異なる地名を登録した複数の単語辞書の1つの単語
辞書の内容と照合することにより単語を認識する単語認
識手段と、この単語認識手段による各カテゴリーに対応
する認識結果を上記所在情報の認識結果として出力する
出力手段とからなる。
【0029】この発明の所在情報認識装置は、複数段の
階層構造のカテゴリーにより構成されている所在情報画
像を読取る読取手段と、この読取手段により読取った所
在情報画像から文字行を検出する行検出手段と、上記読
取手段により読取った所在情報画像から所在情報が記載
されている領域を検出する領域検出手段と、上記行検出
手段で検出した文字行のうち上記領域検出手段で検出し
た所在情報領域内に含まれる少なくとも1つの文字行を
1つまたは複数の単語領域に分割する所在情報単語検出
手段と、認識対象である地域内に存在する上記カテゴリ
ーごとに異なる地名を登録した複数の単語辞書の1つに
対応し、上記所在情報単語検出手段で得られた単語領域
内に含まれる文字情報で構成する複数の文字列の組み合
わせの少なくとも一部が一致する上記単語辞書内の1個
または複数個の単語を抽出する単語抽出手段と、上記所
在情報単語検出手段で得られた単語領域内に含まれる文
字情報を、上記単語抽出手段により抽出した1個または
複数個の単語と照合することにより単語を認識する単語
認識手段と、この単語認識手段による各カテゴリーに対
応する認識結果を上記所在情報の認識結果として出力す
る出力手段とからなる。
【0030】この発明の所在情報認識装置は、複数段の
階層構造のカテゴリーにより構成されている所在情報画
像を読取る読取手段と、この読取手段により読取った所
在情報画像から文字行を検出する行検出手段と、上記読
取手段により読取った所在情報画像から所在情報が記載
されている領域を検出する領域検出手段と、上記行検出
手段で検出した文字行のうち上記領域検出手段で検出し
た所在情報領域内に含まれる少なくとも1つの文字行を
1つまたは複数の単語領域に分割する所在情報単語検出
手段と、この所在情報単語検出手段で得られた単語領域
内に含まれる文字情報を、認識対象である地域内に存在
する上記カテゴリーごとに異なる地名を登録した複数の
単語辞書の1つの単語辞書の内容と照合することにより
単語を認識する単語認識手段と、この単語認識手段によ
る各カテゴリーに対応する認識結果を上記所在情報の認
識結果として出力する出力手段とを具備し、上記単語認
識手段が、所定のカテゴリーに対応する上記単語辞書の
登録単語数が所定数以上の際に、上記文字情報を構成す
る複数の文字列の組み合わせの少なくとも一部が一致す
る上記単語辞書内の単語を1個または複数個抽出する単
語抽出手段と、この単語抽出手段により抽出した1個ま
たは複数個の単語と上記文字情報を照合することにより
単語を認識する第1の認識手段と、所定のカテゴリーに
対応する上記単語辞書の登録単語数が所定数未満の際
に、上記単語辞書の内容と上記文字情報を照合すること
により単語を認識する第2の認識手段とからなる。
【0031】
【発明の実施の形態】以下、図面を参照してこの発明の
実施形態を説明する。
【0032】すなわち、まずわずかな修正を加えるだけ
で各国の住所認識(所在情報認識)を実行できる汎用的
な住所認識装置(所在情報認識装置)の一例について説
明する。
【0033】図1は、この発明の住所認識装置の概略構
成を示している。
【0034】上記住所認識装置は、所在情報としての住
所情報が記載されている郵便物等の書状(紙葉類)Sか
ら表面の画像を光電変換によって取り込む(読取る)画
像取り込み部(読取手段)1、この画像取り込み部1に
より取り込んだ画像により住所の記載されている領域を
検出する領域検出部2、この領域検出部2により検出し
た住所の記載領域から住所の単語を検出する住所単語検
出部3、この住所単語検出部3からの住所の単語と住所
辞書4に記憶されている住所との比較により単語の認識
処理する単語認識処理部5、この単語認識処理部5にお
ける認識処理の手順と使用する住所辞書4が設定されて
いる住所書式設定部6、上記各部を制御する住所認識制
御部7、この住所認識制御部7に得られた住所認識の結
果を出力する住所認識結果出力部8により構成されてい
る。
【0035】上記領域検出部2は、領域を1つだけ検出
してもよいし、複数の領域を検出して可能性の高い順に
処理してもよい。
【0036】上記住所単語検出部3は、領域検出部2が
検出した領域内から住所行を見つけ、さらに行から文字
を切り出したり行から単語を切り出すなどの処理を行う
ものである。
【0037】上記住所認識制御部7は、住所書式設定部
6から与えられたルールに従って認識したい単語を順
次、単語認識処理部5に送り、単語認識処理部5から返
ってきた認識結果を見ながら、次に認識するべき単語を
決めたり単語の読み直しを行ったりするものである。
【0038】上記住所の記載方法としては、日本等にお
いて、郵便番号、都道府県名、市区名、町名、街区の順
に、たとえば1番上の行から順にしかも左から右へ記載
されるようになっている。住所の地域を示す階層構造の
上位のカテゴリーのものから順に記載されるようになっ
ている。
【0039】これに対して、カナダ(欧米)等では、上
記住所の記載方法として、1番下の行から順にしかも右
側から順に郵便番号、州名、都市名、ストリート名、ス
トリート番号の順に記載されるようになっている。
【0040】たとえば、図1に示すように、「123
ABC STREET TORONTO ONTARl
O Z9Z 9Z9」となっている。
【0041】上記住所書式設定部6により設定される認
識処理の手順としては、認識対象としている国や地域の
住所記載書式に関する情報や住所領域の検出するための
テクニック、または住所認識処理時のテクニックなどを
ルールとして設定するものである。この設定としては切
替えスイッチ等のハードウェアで行う方法もあるし、設
定ファイルを用意しておいてそれを装置が読み取る方式
も考えられる。住所書式設定部6が読み込んだ情報は住
所認識制御部7に送られる。
【0042】このように、上記住所書式設定部6で与え
る情報を変えることにより、同じ住所認識装置で異なる
国の住所を扱うことが可能となる。
【0043】上記住所書式設定部6により設定される認
識処理の手順としての日本用の住所認識ルールの例につ
いて説明する。
【0044】すなわち、 ・単語は行の前から読んでいく ・単語をたどる順は行頭から行末へ ・一番最初に郵便番号を読む ・郵便番号の単語の続きから都道府県名単語を探す ・都道府県名単語の続きから市区名単語を探す ・市区名単語の続きから町名単語を探す ・町名単語の続きの単語を街区情報として認識する また、上記住所書式設定部6により設定される認識処理
の手順としてのカナダ用の住所認識ルールの例について
説明する。
【0045】すなわち、 ・単語は行の後ろから読んでいく ・単語をたどる順は行末から行頭へ ・一番最初に郵便番号を読む ・郵便番号の単語の続きから州名単語を探す ・州名単語の続きから都市名単語を探す ・都市名単語の続きからストリート名単語を探す ・ストリート名単語の続きの単語をストリート番号とし
て認識する 上記住所書式設定部6の構成としては、図2のように、
あらかじめ住所読み取りルールを記述したファイルを用
意しておき、そのファイルを読取ることで住所認識装置
に読み取りルールを教える方式がまず考えられる。この
場合、住所書式設定部6は、住所認識ルールファイル6
aとこれを読取る住所認識ファイル読取部6bにより構
成されている。
【0046】しかしこの方式だと、 ・工場から出荷する時に住所認識装置1台ごとに住所認
識ルールファイルをロードする手間が面倒。
【0047】・ファイル情報のセキュリティが甘く、第
3者が住所書式設定ルールを盗み出すことが容易。
【0048】といった問題が発生する。
【0049】各国用の住所単語辞書4は、引越し、家屋
の新築、市区町村名の統廃合などの理由で頻繁に変更が
必要である。しかし住所書式設定情報というものは、一
度設定してしまうと大きな修正を加える必要はほとんど
ない。そこで図3のように住所書式設定ルールをICに
焼き、そのICからルールを読み出す方式にしてもよ
い。この場合、住所書式設定部6は、住所認識ルールI
C6cとこのIC6cの読取りを行う住所認識ファイル
IC読取部6dにより構成されている。
【0050】この際、ルールの解析は、ファイルで持つ
よりははるかに困難になるためセキュリティが高まる。
またICを住所認識装置の住所認識ファイルIC読取部
に刺す(装填する)だけで住所書式設定情報をロードす
ることが可能になる。また住所設定ルールを焼き込んだ
ICを交換するだけで、各国の住所認識用に住所認識装
置に設定できるようにしても良い。この場合、住所設定
ルールと住所辞書とを国ごとにペアで交換することがで
きる。
【0051】上記住所辞書4としては、日本用の住所辞
書4aと、カナダ用の住所辞書4bとが用意されてい
る。
【0052】日本用の住所辞書4aとしては、都道府県
名の単語辞書、各都道府県ごとの市区名の単語辞書、各
市区ごとの町名の単語辞書が用意されている。
【0053】カナダ用の住所辞書4bとしては、図4か
ら図6に示すように、州名の単語辞書11、各州ごとの
都市名の単語辞書12、…、各都市ごとのストリート名
の単語辞書13、…が用意されている。
【0054】上記したように、住所書式設定部により住
所書式設定ルールと住所辞書を設定することができる。
すなわち、所定の国に対応した、住所書式設定ルールと
住所辞書を選択することができる。
【0055】また、画像取り込み部1、領域検出部2、
住所単語検出部3、単語認識処理部5、住所認識制御部
7、住所認識結果出力部8が、認識処理のアプリケーシ
ョンと、住所書式設定部と住所辞書のアプリケーション
とからなり、住所書式設定部で設定された住所書式設定
ルールと住所辞書に基づいて認識処理のアプリケーショ
ンが認識処理を実行するようにしても良い。
【0056】また、住所書式設定部と住所辞書とがC
D、DVD等の記録媒体に記録されており、上記画像取
り込み部1、領域検出部2、住所単語検出部3、単語認
識処理部5、住所認識制御部7、住所認識結果出力部8
からなる認識処理装置に、記録媒体再生部を設け、この
記録媒体再生部により再生された住所書式設定部の内容
に基づいて、住所書式設定ルールと住所辞書とを設定
し、この設定された内容で認識処理装置が認識処理を実
行するようにしても良い。
【0057】次に、類似地名の誤認識の防止について説
明する。
【0058】ある地域に「YORK」「NORTH Y
ORK」「EAST YORK」の3つの都市が存在し
た場合を考える。その地域の住所を認識する際に、住所
行の一部が「YORK」と認識できたとしても、実際に
そこに書かれている都市名は「NORTH YORK」
かも知れない。
【0059】「YORK」と「NORTH YORK」
の両方を区別することが可能な住所単語認識処理の一例
を図7のフローチャートに示す。基本的には住所認識制
御部7から教えられた単語認識処理の開始位置から1単
語ずつ住所単語辞書4を使って認識していく。しかしこ
れだけでは「YORK」は読めても複数単語から成る
「NORTH YORK」は読めないため、図8に示す
ように、現在処理中の単語(「YORK」)W1と単語
W1に隣接する単語(「NORTH」)W2をくっつけ
て新しい単語(「NORTH YORK」)W3を作成
し、単語W3を認識してみる。図7では2単語を接続す
る場合のみを取り上げているが、3単語以上を接続する
場合もありうる。
【0060】そして、1単語だけで単語認識した場合
と、複数単語をくっつけて作成した単語を単語認識にか
けた場合を比較し、結果の良かった方を採用する。認識
結果の評価値があらかじめ設定してあるしきい値より低
い場合はどちらの単語認識結果も採用せず、単語W1の
次に書かれている単語を新たな単語W1として上記の処
理を繰り返す。
【0061】上記住所認識制御部7による住所単語認識
処理について、図7に示すフローチャートを参照しつつ
説明する。
【0062】すなわち、住所認識制御部7は、住所単語
認識処理を開始し、住所単語探索開始位置へ移動する
(ST1)。たとえば、カナダ用の住所認識方法に設定
されている場合、最終行の後ろから順に読んでいく。
【0063】この際、住所認識制御部7は、認識処理に
かけていない単語が存在しなかった場合(ST2)、単
語認識エラー処理へ移行する。
【0064】上記住所認識制御部7は、ステップ2によ
り認識処理にかけていない単語が存在した場合、単語を
1つ選択し、選択した単語W1を与えられた地名辞書
(11、12、13)を用いて単語認識処理する(ST
3)。たとえば、選択した単語W1が州名に対応する単
語の場合、単語辞書11を用い、選択した単語W1が都
市名に対応する単語の場合、上記州名に対応する単語辞
書12を用い、選択した単語W1がストリート名に対応
する単語の場合、上記都市名に対応する単語辞書13を
用いる。
【0065】この結果、住所認識制御部7は、単語認識
結果A1、単語評価値Slとを算出する(ST3)。
【0066】次に、住所認識制御部7は、単語W1の続
きの位置にまだ認識処理にかけていない単語W2が存在
するか否かを判断する(ST4)。
【0067】住所認識制御部7は、単語W2が存在する
と判断した場合、単語W1と単語W2を接続して新しい
単語W3を作成し(ST5)、この作成した単語W3を
対応する地名辞書(11、12、13)を用いて単語認
識処理する(ST6)。
【0068】この結果、住所認識制御部7は、単語認識
結果A3、単語評価値S3とを算出する(ST6)。
【0069】これにより、住所認識制御部7は、単語W
1に対する一番高い単語評価値Slと、単語W3に対す
る単語評価値S3が一番高い単語評価値S3とを比較
し、単語W3に対する一番大きな単語評価値S3が単語
W1に対する一番大きな単語評価値S1よりも大きいか
同じで、かつ単語W3に対する一番大きな単語評価値S
3が所定のしきい値以上の際に(ST7)、単語W3に
対する単語認識結果A3を認識結果として出力する。
【0070】また、上記住所認識制御部7は、上記比較
により単語W1に対する一番大きな単語評価値S1が単
語W3に対する一番大きな単語評価値S3よりも大き
く、かつ単語W1に対する一番大きな単語評価値S1が
所定のしきい値以上の際に(ST8)、単語W1に対す
る単語認識結果A1を認識結果として出力する。
【0071】また、上記住所認識制御部7は、上記ステ
ップ7、8を満足しなかった場合、ステップ2に戻る。
【0072】また、上記住所認識制御部7は、上記ステ
ップ4において、単語W2が存在しないと判断した場
合、単語W3に対する単語評価値S3を「0」とし(S
T9)、ステップ7に進む。
【0073】この場合の例を図8を用いて説明する。
【0074】すなわち、都市名の単語(「YORK」)
W1と単語W1に隣接する単語(「NORTH」)W2
をくっつけて新しい単語(「NORTH YORK」)
W3を作成し、単語W1と単語W3の認識結果を比較す
る。この際、単語W3の認識結果の単語評価値S3が単
語W1に対する単語評価値S1よりも大きく、閾値以上
と判断され、「NORTH YORK」が都市名と認識
される。
【0075】次に、本来複数の単語として切り出される
べきものが、1単語として切り出されることにより生じ
る誤認識の防止について説明する。
【0076】すなわち、本来複数の単語として切り出さ
れるべきものが、1単語として切り出されることによ
り、単語認識に失敗する場合がある。図9は、「TOR
ONTO」「ON」と2単語に切り出されるべきものが
1単語として切り出された例である。この場合オンタリ
オ州に「TORONTOON」という都市は存在しない
ため都市名認識に失敗する。
【0077】このような単語の接触が発生している場合
でも単語認識が行える住所単語認識処理の一例を図10
のフローチャートに示す。住所認識制御部7から教えら
れた単語認識処理の開始位置から1単語ずつ住所単語辞
書を使って認識していく。現在処理中の単語(オンタリ
オ州に続く都市名として「TORONTOON」)W1
についてその単語W1がある基準を満たしているか否か
を調べ、満たしている場合は単語W1を複数の単語
(「TORONTO」)W2、単語(「ON」)W3に
分割する。単語分割の基準としては、例えば単語を構成
する各文字の間隔を用いる。図11に示す例では、「T
ORONTO,」の直後が他と比べて文字間隔が大きく
なっているので、その位置で単語を2つに分割してい
る。例えば、垂直射影等により得られる単語ブロックに
より文字間の距離が判別される。図9〜図11では説明
を簡単にするため2単語を接続する場合のみを取り上げ
ているが、3単語以上に分割する場合もありうる。そし
て分割処理後にできた各単語に対して単語認識処理を行
い、もっとも結果の良いものを選択する。
【0078】そして、1単語だけで単語認識した場合
と、複数単語分割してから単語認識にかけた場合を比較
し、結果の良かった方を採用する。認識結果の評価値が
あらかじめ設定してあるしきい値より低い場合はどちら
の単語認識結果も採用せず、単語W1の次に書かれてい
る単語を新たな単語W1として上記の処理を繰り返す。
【0079】上記住所認識制御部7による住所単語認識
処理について、図10に示すフローチャートを参照しつ
つ説明する。
【0080】すなわち、住所認識制御部7は、住所単語
認識処理を開始し、住所単語探索開始位置へ移動する
(ST11)。たとえば、カナダ用の住所認識方法に設
定されている場合、最終行の後ろから順に読んでいく。
【0081】この際、住所認識制御部7は、認識処理に
かけていない単語が存在しなかった場合(ST12)、
単語認識エラー処理へ移行する。
【0082】上記住所認識制御部7は、ステップ12に
より認識処理にかけていない単語が存在した場合、単語
を1つ選択し、選択した単語W1を与えられた地名辞書
(11、12、13)を用いて単語認識処理する(ST
13)。たとえば、選択した単語W1が州名に対応する
単語の場合、単語辞書11を用い、選択した単語W1が
都市名に対応する単語の場合、上記州名に対応する単語
辞書12を用い、選択した単語W1がストリート名に対
応する単語の場合、上記都市名に対応する単語辞書13
を用いる。
【0083】この結果、住所認識制御部7は、単語認識
結果A1、単語評価値Slとを算出する(ST13)。
【0084】次に、住所認識制御部7は、単語W1が分
割可能か否かを判断する(ST14)。
【0085】住所認識制御部7は、単語W1が2つに分
割可能と判断した場合、単語W1を単語W2と単語W3
を作成し(ST15)、この作成した単語W2、W3を
対応する地名辞書(11、12、13)を用いて単語認
識処理する(ST16)。
【0086】この結果、住所認識制御部7は、単語認識
結果A3、単語評価値S3とを算出する(ST16)。
【0087】これにより、住所認識制御部7は、単語W
1に対する一番高い単語評価値Slと、単語W2、W3
に対する単語評価値S3が一番高い単語評価値S3とを
比較し、単語W2、W3に対する一番大きな単語評価値
S3が単語W1に対する一番大きな単語評価値S1より
も大きいか同じで、かつ単語W2、W3に対する一番大
きな単語評価値S3が所定のしきい値以上の際に(ST
17)、単語W2、W3に対する単語認識結果A3を認
識結果として出力する。
【0088】また、上記住所認識制御部7は、上記比較
により単語W1に対する一番大きな単語評価値S1が単
語W2、W3に対する一番大きな単語評価値S3よりも
大きく、かつ単語W1に対する一番大きな単語評価値S
1が所定のしきい値以上の際に(ST18)、単語W1
に対する単語認識結果A1を認識結果として出力する。
【0089】また、上記住所認識制御部7は、上記ステ
ップ17、18を満足しなかった場合、ステップ12に
戻る。
【0090】また、上記住所認識制御部7は、上記ステ
ップ14において、単語W1が分割不可と判断した場
合、単語W3に対する単語評価値S3を「0」とし(S
T19)、ステップ17に進む。
【0091】この場合の例を図9を用いて説明する。
【0092】すなわち、単語(「TORONTOO
N」)W1と、この単語W1を分割して単語(「TOR
ONTO」)W2と単語(「ON」)W3を作成し、単
語W1と単語W2、W3の認識結果を比較する。この
際、単語W2の認識結果の単語評価値S3が単語W1に
対する単語評価値S1よりも大きく、閾値以上と判断さ
れ、「TORONTO」がオンタリオ州に続く都市名と
して認識される。
【0093】次に、単語絞り込み辞書のコンパクト化に
ついて説明する。
【0094】すなわち、認識対象地域に存在する地名数
が非常に多い場合、認識しようとする単語の文字認識結
果の並びと地名単語辞書に登録されている地名単語との
比較回数が増えて1単語当たりの単語認識時間が長くな
る。この問題を解決する方法の1つとして、単語絞り込
み辞書を用いて地名単語の数を減らす方法があることは
すでに述べた。この単語絞り込み辞書は、上記単語辞書
4あるいは住所認識制御部7に設けられる。
【0095】この方式の難点は、認識対象地域内の全て
の都市やストリート名について単語絞り込み辞書を用意
した場合、単語絞り込み辞書の総容量が非常に大きくな
ることである。以下にこの問題を解決するための方法を
説明する。
【0096】例えば各都市ごとに、都市内に存在するス
トリート名の辞書を作成した場合、ストリート名辞書に
登録される単語数は都市によって大きく異なる。図12
に都市ごとのストリート数の一例を示す。このストリー
ト数は、例えば上記都市名の各辞書ごとに付与されてい
る。
【0097】ところで、単語絞り込み辞書を用いた単語
候補の絞り込みは辞書に登録されている単語数が多い場
合は有効であるが、単語数が少ない場合は意味がないだ
けでなく単語絞り込み処理に要する時間が無駄となる
し、また単語絞り込み辞書そのものが不要である。例え
ば、単語絞り込み処理で得点の高い単語上位20位まで
を選択することにしていた場合、図12に示す都市A,
Dは都市内に存在するストリート数が20未満なので絞
り込みを実行しなくても探索パターン列と辞書パターン
列の比較処理の回数は20未満で済む。
【0098】上記単語辞書4に登録された単語数によっ
て単語絞り込み処理を行うか否かを切替える処理の一例
を図13のフローチャートに示す。
【0099】すなわち、住所認識制御部7は、住所単語
認識処理を開始し、認識対象とする地域および単語の種
類によって単語辞書4を選択する(ST21)。つい
で、住所認識制御部7は、選択した単語辞書4の登録単
語数がしきい値T1(20)より多いか否かを判断する
(ST22)。
【0100】次に、住所認識制御部7は、登録単語数が
しきい値T1より多いと判断した場合、単語絞り込み処
理で評価値の高い辞書登録単語の上位T2位までを選択
する(ST23)。
【0101】ついで、住所認識制御部7は、単語絞り込
み処理で選択した辞書単語と認識しようとする単語の比
較処理を行う(ST24)。この結果、住所認識制御部
7は、単語認識結果A、単語評価値Sとを算出する(S
T24)。
【0102】これにより、住所認識制御部7は、単語評
価値Sが所定のしきい値S1以上の際に(ST25)、
単語認識結果Aを認識結果として出力し、単語評価値S
が所定のしきい値S1以下の際に(ST25)、単語認
識エラー処理となる。
【0103】また、住所認識制御部7は、ステップ22
において、登録単語数がしきい値T1より多いと判断し
た場合、単語辞書4に登録された全単語を選択する(S
T26)。
【0104】ついで、住所認識制御部7は、選択した辞
書単語の全単語と認識しようとする単語の比較処理を行
う(ST27)。この結果、住所認識制御部7は、単語
認識結果A、単語評価値Sとを算出する(ST27)。
この後、住所認識制御部7は、ステップ25に進む。
【0105】また、単語絞り込み辞書の総容量をできる
だけ小さくするためには、登録単語数が少ない単語辞書
用の絞り込み辞書を最初から用意しないことにすれば良
い。
【0106】そして、絞り込み辞書が存在する場合は絞
り込み処理を行ってから単語認識処理を行い、絞り込み
辞書が存在しない場合は絞り込み処理を行わずに単語認
識処理を行うことにすれば良い。単語絞り込み辞書の有
無によって単語絞り込み処理を行うか否かを切替える処
理の一例を図14のフローチャートに示す。図13のフ
ローチャートと同一部位には同一ステップを付与する。
【0107】上記単語絞り込み辞書の有無によって単語
絞り込み処理を行うか否かを切替える処理の一例を図1
4のフローチャートに示す。
【0108】すなわち、住所認識制御部7は、住所単語
認識処理を開始し、認識対象とする地域および単語の種
類によって単語辞書4を選択する(ST21)。つい
で、住所認識制御部7は、選択した単語辞書4用の単語
絞り込み辞書が存在するか否かを判断する(ST2
2’)。
【0109】次に、住所認識制御部7は、単語絞り込み
辞書が存在すると判断した場合、単語絞り込み処理で評
価値の高い辞書登録単語の上位T1位までを選択する
(ST23’)。
【0110】ついで、住所認識制御部7は、単語絞り込
み処理で選択した辞書単語と認識しようとする単語の比
較処理を行う(ST24)。この結果、住所認識制御部
7は、単語認識結果A、単語評価値Sとを算出する(S
T24)。
【0111】これにより、住所認識制御部7は、単語評
価値Sが所定のしきい値S1以上の際に(ST25)、
単語認識結果Aを認識結果として出力し、単語評価値S
が所定のしきい値S1以下の際に(ST25)、単語認
識エラー処理となる。
【0112】また、住所認識制御部7は、ステップ2
2’において、選択した単語辞書4用の単語絞り込み辞
書が存在しないと判断した場合、単語辞書4に登録され
た全単語を選択する(ST26)。
【0113】ついで、住所認識制御部7は、選択した辞
書単語の全単語と認識しようとする単語の比較処理を行
う(ST27)。この結果、住所認識制御部7は、単語
認識結果A、単語評価値Sとを算出する(ST27)。
この後、住所認識制御部7は、ステップ25に進む。
【0114】上記したように、国によって住所の記載書
式が異なる場合でも、各国用専用の住所認識装置を設計
すること無く、同一のハードウェアで構成するようにし
たものである。
【0115】これにより、ごくわずかな設定変更を行う
だけで、世界各国の住所認識を行うことができる。
【0116】
【発明の効果】以上詳述したように、この発明によれ
ば、わずかな修正を加えるだけで各国の所在情報認識を
実行できる所在情報認識方法と認識アプリケーションと
記録媒体と所在情報認識装置を提供できる。
【図面の簡単な説明】
【図1】この発明の実施形態の住所認識装置の概略構成
を示すブロック図。
【図2】住所書式設定部の概略構成を示す図。
【図3】住所書式設定部の概略構成を示す図。
【図4】州名の単語辞書の例を示す図。
【図5】都市名の単語辞書の例を示す図。
【図6】ストリート名の単語辞書の例を示す図。
【図7】住所単語認識処理を説明するためのフローチャ
ート。
【図8】住所単語認識処理において複数単語を接続して
作成した単語を説明するための図。
【図9】住所単語認識処理において本来複数の単語とし
て切り出されるべきものが、1単語として切り出された
例を説明するための図。
【図10】単語の接触が発生している場合でも単語認識
が行える住所単語認識処理の一例を説明するためのフロ
ーチャート。
【図11】単語の分割を説明するための図。
【図12】都市ごとのストリート数の一例を示す図。
【図13】単語辞書に登録された単語数によって単語絞
り込み処理を行うか否かを切替える処理の一例を説明す
るためのフローチャート。
【図14】単語絞り込み辞書の有無によって単語絞り込
み処理を行うか否かを切替える処理の一例を説明するた
めのフローチャート。
【符号の説明】
S…書状(紙葉類) 1…画像取り込み部 2…領域検出部 3…住所単語検出部 4…住所辞書 5…単語認識処理部 6…住所書式設定部 7…住所認識制御部 8…住所認識結果出力部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 紙葉類上に記載され、種々の国ごとに異
    なる複数段の階層構造のカテゴリーにより構成されてい
    る所在情報を認識するものにおいて、 種々の国ごとに対応して設けられ、上記所在情報を認識
    するための複数の辞書と、 上記種々の国ごとに異なり、所在情報の複数段の階層構
    造の各カテゴリーに対する種々の認識手順とを有し、 上記辞書を選択し、 上記認識手順を選択する選択し、 上記紙葉類上に記載されている所在情報を読取り、 この読取った所在情報を上記選択されている認識手順に
    そって、かつ上記選択されている辞書を用いて認識す
    る、 ことを特徴とする所在情報認識方法。
  2. 【請求項2】 種々の国ごとに異なる複数段の階層構造
    のカテゴリーにより構成されている所在情報を認識する
    認識アプリケーションにおいて、 種々の国ごとに対応して設けられ、上記所在情報を認識
    するための複数の辞書と、 上記種々の国ごとに異なり、所在情報の複数段の階層構
    造の各カテゴリーに対する種々の認識手順とを有し、 上記所在情報を認識する際に、上記辞書の1つが選択さ
    れ、上記認識手順の1つが選択され、この選択された辞
    書と認識手順に基づいて、認識処理が行われることを特
    徴とする認識アプリケーション。
  3. 【請求項3】 種々の国ごとに異なる複数段の階層構造
    のカテゴリーにより構成されている所在情報を認識する
    ものに用いられる記録媒体において、 種々の国ごとに対応し、上記所在情報を認識するための
    複数の辞書と、 上記種々の国ごとに異なり、所在情報の複数段の階層構
    造の各カテゴリーに対する種々の認識手順とが記録され
    ていることを特徴とする記録媒体。
  4. 【請求項4】 所在情報画像を読取る読取手段と、 この読取手段により読取った所在情報画像から文字行を
    検出する行検出手段と、 上記読取手段により読取った所在情報画像から所在情報
    が記載されている領域を検出する領域検出手段と、 上記行検出手段で検出した文字行のうち上記領域検出手
    段で検出した所在情報領域内に含まれる文字行を1つま
    たは複数の単語領域に分割する所在情報単語検出手段
    と、 この所在情報単語検出手段で得られた第1の単語領域内
    に含まれる文字情報を認識対象である地域内に存在する
    地名を登録した単語辞書の内容と照合することにより単
    語を認識するとともに、認識結果の単語評価値を出力す
    る第1の単語認識手段と、 この第1の単語認識手段で処理した第1の単語領域と、
    この第1の単語領域と同一行内で隣接する第2の単語領
    域とを結合した第3の単語領域内に含まれる文字情報を
    上記単語辞書の内容と照合することにより単語を認識す
    るとともに、認識結果の単語評価値を出力する第2の単
    語認識手段と、 上記第1の単語認識手段による認識結果の単語評価値と
    上記第2の単語認識手段による認識結果の単語評価値を
    比較し、単語評価値の高い方の認識結果を出力する出力
    手段と、 を具備することを特徴とする所在情報認識装置。
  5. 【請求項5】 所在情報画像を読取る読取手段と、 この読取手段により読取った所在情報画像から文字行を
    検出する行検出手段と、 上記読取手段により読取った所在情報画像から所在情報
    が記載されている領域を検出する領域検出手段と、 上記行検出手段で検出した文字行のうち上記領域検出手
    段で検出した所在情報領域内に含まれる文字行を1つま
    たは複数の単語領域に分割する所在情報単語検出手段
    と、 この所在情報単語検出手段で得られた第1の単語領域内
    に含まれる文字情報を認識対象である地域内に存在する
    地名を登録した単語辞書の内容と照合することにより単
    語を認識するとともに、認識結果の単語評価値を出力す
    る第1の単語認識手段と、 この第1の単語認識手段で処理した第1の単語領域内に
    含まれる文字情報が第1の単語領域を複数の単語に分割
    する条件を満たしているか否かを判断する判断手段と、 この判断手段により複数の単語に分割する条件を満たし
    ていると判断された際に、上記分割された各単語を上記
    単語辞書の内容と照合することにより単語を認識すると
    ともに、認識結果の単語評価値を出力する第2の単語認
    識手段と、 上記第1の単語認識手段による認識結果の単語評価値と
    上記第2の単語認識手段による各単語の認識結果の単語
    評価値を比較し、単語評価値の高い方の認識結果を出力
    する出力手段と、 を具備することを特徴とする所在情報認識装置。
  6. 【請求項6】 上記判断手段により文字情報を複数の単
    語に分割する条件が、単語を構成する所定の文字間の距
    離が同一単語内の他の文字間の距離と比べて大きい場合
    に、満足するものであることを特徴とする請求項5に記
    載の所在情報認識装置。
  7. 【請求項7】 複数段の階層構造のカテゴリーにより構
    成されている所在情報画像を読取る読取手段と、 この読取手段により読取った所在情報画像から文字行を
    検出する行検出手段と、 上記読取手段により読取った所在情報画像から所在情報
    が記載されている領域を検出する領域検出手段と、 上記行検出手段で検出した文字行のうち上記領域検出手
    段で検出した所在情報領域内に含まれる少なくとも1つ
    の文字行を1つまたは複数の単語領域に分割する所在情
    報単語検出手段と、 上記所在情報を構成する複数段の階層構造の各カテゴリ
    ーに対応する上記所在情報単語検出手段で得られた各単
    語領域での単語を認識する順序を設定する設定手段と、 この設定手段により設定される各単語領域に対する認識
    の順序にしたがって、上記所在情報単語検出手段で得ら
    れた単語領域内に含まれる文字情報を、認識対象である
    地域内に存在する上記カテゴリーごとに異なる地名を登
    録した複数の単語辞書の1つの単語辞書の内容と照合す
    ることにより単語を認識する単語認識手段と、 この単語認識手段による各カテゴリーに対応する認識結
    果を上記所在情報の認識結果として出力する出力手段
    と、 を具備することを特徴とする所在情報認識装置。
  8. 【請求項8】 複数段の階層構造のカテゴリーにより構
    成されている所在情報画像を読取る読取手段と、 この読取手段により読取った所在情報画像から文字行を
    検出する行検出手段と、 上記読取手段により読取った所在情報画像から所在情報
    が記載されている領域を検出する領域検出手段と、 上記行検出手段で検出した文字行のうち上記領域検出手
    段で検出した所在情報領域内に含まれる少なくとも1つ
    の文字行を1つまたは複数の単語領域に分割する所在情
    報単語検出手段と、 上記所在情報を構成する複数段の階層構造の各カテゴリ
    ーに対応する上記所在情報単語検出手段で得られた各単
    語領域での単語を認識する順序があらかじめ記憶されて
    いるICと、 このICに記憶されている各単語領域に対する認識の順
    序にしたがって、上記所在情報単語検出手段で得られた
    単語領域内に含まれる文字情報を、認識対象である地域
    内に存在する上記カテゴリーごとに異なる地名を登録し
    た複数の単語辞書の1つの単語辞書の内容と照合するこ
    とにより単語を認識する単語認識手段と、 この単語認識手段による各カテゴリーに対応する認識結
    果を上記所在情報の認識結果として出力する出力手段
    と、 を具備することを特徴とする所在情報認識装置。
  9. 【請求項9】 複数段の階層構造のカテゴリーにより構
    成されている所在情報画像を読取る読取手段と、 この読取手段により読取った所在情報画像から文字行を
    検出する行検出手段と、 上記読取手段により読取った所在情報画像から所在情報
    が記載されている領域を検出する領域検出手段と、 上記行検出手段で検出した文字行のうち上記領域検出手
    段で検出した所在情報領域内に含まれる少なくとも1つ
    の文字行を1つまたは複数の単語領域に分割する所在情
    報単語検出手段と、 認識対象である地域内に存在する上記カテゴリーごとに
    異なる地名を登録した複数の単語辞書の1つに対応し、
    上記所在情報単語検出手段で得られた単語領域内に含ま
    れる文字情報で構成する複数の文字列の組み合わせの少
    なくとも一部が一致する上記単語辞書内の1個または複
    数個の単語を抽出する単語抽出手段と、 上記所在情報単語検出手段で得られた単語領域内に含ま
    れる文字情報を、上記単語抽出手段により抽出した1個
    または複数個の単語と照合することにより単語を認識す
    る単語認識手段と、 この単語認識手段による各カテゴリーに対応する認識結
    果を上記所在情報の認識結果として出力する出力手段
    と、 を具備することを特徴とする所在情報認識装置。
  10. 【請求項10】 複数段の階層構造のカテゴリーにより
    構成されている所在情報画像を読取る読取手段と、 この読取手段により読取った所在情報画像から文字行を
    検出する行検出手段と、 上記読取手段により読取った所在情報画像から所在情報
    が記載されている領域を検出する領域検出手段と、 上記行検出手段で検出した文字行のうち上記領域検出手
    段で検出した所在情報領域内に含まれる少なくとも1つ
    の文字行を1つまたは複数の単語領域に分割する所在情
    報単語検出手段と、 この所在情報単語検出手段で得られた単語領域内に含ま
    れる文字情報を、認識対象である地域内に存在する上記
    カテゴリーごとに異なる地名を登録した複数の単語辞書
    の1つの単語辞書の内容と照合することにより単語を認
    識する単語認識手段と、 この単語認識手段による各カテゴリーに対応する認識結
    果を上記所在情報の認識結果として出力する出力手段
    と、 を具備し、 上記単語認識手段が、 所定のカテゴリーに対応する上記単語辞書の登録単語数
    が所定数以上の際に、上記文字情報を構成する複数の文
    字列の組み合わせの少なくとも一部が一致する上記単語
    辞書内の単語を1個または複数個抽出する単語抽出手段
    と、 この単語抽出手段により抽出した1個または複数個の単
    語と上記文字情報を照合することにより単語を認識する
    第1の認識手段と、 所定のカテゴリーに対応する上記単語辞書の登録単語数
    が所定数未満の際に、上記単語辞書の内容と上記文字情
    報を照合することにより単語を認識する第2の認識手段
    とからなる、 ことを特徴とする所在情報認識装置。
JP31881999A 1999-11-09 1999-11-09 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置 Pending JP2001134716A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP31881999A JP2001134716A (ja) 1999-11-09 1999-11-09 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置
KR10-2000-0064171A KR100401685B1 (ko) 1999-11-09 2000-10-31 소재정보의 인식장치, 소재정보의 인식방법 및 기록매체
US11/003,426 US20050094850A1 (en) 1999-11-09 2004-12-06 Location information recognition apparatus and method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31881999A JP2001134716A (ja) 1999-11-09 1999-11-09 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置

Publications (1)

Publication Number Publication Date
JP2001134716A true JP2001134716A (ja) 2001-05-18

Family

ID=18103313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31881999A Pending JP2001134716A (ja) 1999-11-09 1999-11-09 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置

Country Status (3)

Country Link
US (1) US20050094850A1 (ja)
JP (1) JP2001134716A (ja)
KR (1) KR100401685B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7408327B2 (ja) 2019-09-20 2024-01-05 株式会社東芝 住所データベース生成装置及びプログラム

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7770102B1 (en) 2000-06-06 2010-08-03 Microsoft Corporation Method and system for semantically labeling strings and providing actions based on semantically labeled strings
US7716163B2 (en) * 2000-06-06 2010-05-11 Microsoft Corporation Method and system for defining semantic categories and actions
US7421645B2 (en) * 2000-06-06 2008-09-02 Microsoft Corporation Method and system for providing electronic commerce actions based on semantically labeled strings
US7712024B2 (en) 2000-06-06 2010-05-04 Microsoft Corporation Application program interfaces for semantically labeling strings and providing actions based on semantically labeled strings
US7788602B2 (en) 2000-06-06 2010-08-31 Microsoft Corporation Method and system for providing restricted actions for recognized semantic categories
US7778816B2 (en) * 2001-04-24 2010-08-17 Microsoft Corporation Method and system for applying input mode bias
US7707496B1 (en) 2002-05-09 2010-04-27 Microsoft Corporation Method, system, and apparatus for converting dates between calendars and languages based upon semantically labeled strings
US7742048B1 (en) 2002-05-23 2010-06-22 Microsoft Corporation Method, system, and apparatus for converting numbers based upon semantically labeled strings
US7827546B1 (en) 2002-06-05 2010-11-02 Microsoft Corporation Mechanism for downloading software components from a remote source for use by a local software application
US7281245B2 (en) * 2002-06-05 2007-10-09 Microsoft Corporation Mechanism for downloading software components from a remote source for use by a local software application
US7356537B2 (en) 2002-06-06 2008-04-08 Microsoft Corporation Providing contextually sensitive tools and help content in computer-generated documents
US7716676B2 (en) * 2002-06-25 2010-05-11 Microsoft Corporation System and method for issuing a message to a program
US20040001099A1 (en) * 2002-06-27 2004-01-01 Microsoft Corporation Method and system for associating actions with semantic labels in electronic documents
US7209915B1 (en) 2002-06-28 2007-04-24 Microsoft Corporation Method, system and apparatus for routing a query to one or more providers
US7783614B2 (en) 2003-02-13 2010-08-24 Microsoft Corporation Linking elements of a document to corresponding fields, queries and/or procedures in a database
US7711550B1 (en) 2003-04-29 2010-05-04 Microsoft Corporation Methods and system for recognizing names in a computer-generated document and for providing helpful actions associated with recognized names
US7739588B2 (en) 2003-06-27 2010-06-15 Microsoft Corporation Leveraging markup language data for semantically labeling text strings and data and for providing actions based on semantically labeled text strings and data
JP2007004584A (ja) * 2005-06-24 2007-01-11 Toshiba Corp 情報処理装置
US7992085B2 (en) 2005-09-26 2011-08-02 Microsoft Corporation Lightweight reference user interface
US7788590B2 (en) 2005-09-26 2010-08-31 Microsoft Corporation Lightweight reference user interface
US20100250562A1 (en) * 2009-03-24 2010-09-30 Mireo d.o.o. Recognition of addresses from the body of arbitrary text
US8380501B2 (en) * 2009-08-05 2013-02-19 Siemens Industry, Inc. Parcel address recognition by voice and image through operational rules
US20140279561A1 (en) * 2013-03-15 2014-09-18 Gilbarco, Inc. Alphanumeric keypad for fuel dispenser system architecture
JP6745465B1 (ja) * 2019-03-06 2020-08-26 パナソニックIpマネジメント株式会社 車両及びカメラモジュール

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5050218A (en) * 1986-08-26 1991-09-17 Nec Corporation Apparatus for recognizing address appearing on mail article
JP3275153B2 (ja) * 1993-03-03 2002-04-15 株式会社日立製作所 辞書分散システム及び辞書分散管理方法
KR100286163B1 (ko) * 1994-08-08 2001-04-16 가네꼬 히사시 주소인식방법, 주소인식장치 및 지엽류 자동처리 시스템
JP3441249B2 (ja) * 1995-07-24 2003-08-25 株式会社東芝 コーディングシステム及び郵便物処理システム
US6246794B1 (en) * 1995-12-13 2001-06-12 Hitachi, Ltd. Method of reading characters and method of reading postal addresses
DE19718805C2 (de) * 1997-05-03 1999-11-04 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen
DE19742771C1 (de) * 1997-09-27 1998-12-10 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
JPH11226513A (ja) * 1998-02-18 1999-08-24 Toshiba Corp 郵便物宛先読取装置及び郵便物区分装置
JPH11238097A (ja) * 1998-02-20 1999-08-31 Toshiba Corp 郵便物宛先読取装置及び宛先読取方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7408327B2 (ja) 2019-09-20 2024-01-05 株式会社東芝 住所データベース生成装置及びプログラム

Also Published As

Publication number Publication date
KR20010051346A (ko) 2001-06-25
US20050094850A1 (en) 2005-05-05
KR100401685B1 (ko) 2003-10-17

Similar Documents

Publication Publication Date Title
JP2001134716A (ja) 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置
US6327373B1 (en) Mail address reading apparatus and mail sorting apparatus
KR100412317B1 (ko) 문자인식/수정방법및장치
JPH09231291A (ja) 帳票読取方法及びその装置
JP3232991B2 (ja) 文字読取り方法及び住所読取り方法
JPS6336037B2 (ja)
JPH06215184A (ja) 抽出領域のラベリング装置
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JPH1078997A (ja) 文字認識装置及びその方法並びにその方法を記録した記録媒体
JP2985813B2 (ja) 文字列認識装置および知識データベース学習方法
JP3151866B2 (ja) 英文字認識方法
JP2570703B2 (ja) 文字読取装置
JP3069771B2 (ja) パターン認識方法及び装置
JP2000210624A (ja) 郵便宛名認識装置
JPH04309B2 (ja)
JP2980059B2 (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JPH0793467A (ja) 住所読取システム
JP2991594B2 (ja) 郵便物の宛名読取装置
JPH09190507A (ja) 住所読取装置
JP3557720B2 (ja) プリンタ装置
JP2002074269A (ja) 文字認識方法
JPS6160184A (ja) 光学的文字読取装置
JPH11316801A (ja) 文字読取り方法及び住所読取り方法
JPH041882A (ja) 文字認識方法およびその装置
JPS61131091A (ja) 文字読取装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061027

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100309