JP2002157553A - 住所認識装置、記録媒体及びプログラム - Google Patents

住所認識装置、記録媒体及びプログラム

Info

Publication number
JP2002157553A
JP2002157553A JP2001260805A JP2001260805A JP2002157553A JP 2002157553 A JP2002157553 A JP 2002157553A JP 2001260805 A JP2001260805 A JP 2001260805A JP 2001260805 A JP2001260805 A JP 2001260805A JP 2002157553 A JP2002157553 A JP 2002157553A
Authority
JP
Japan
Prior art keywords
building
character string
address
recognition
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001260805A
Other languages
English (en)
Other versions
JP4584507B2 (ja
Inventor
Misako Suwa
美佐子 諏訪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001260805A priority Critical patent/JP4584507B2/ja
Publication of JP2002157553A publication Critical patent/JP2002157553A/ja
Application granted granted Critical
Publication of JP4584507B2 publication Critical patent/JP4584507B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】本発明は住所認識装置、記録媒体及びプログラ
ムに関し、建物部中に最も出現する可能性が大きく、か
つ、位置が推定し易い部分から先に読み取ることで、特
に、自由に記入された住所中の建物部を精度良く効率的
に認識できるようにする。 【解決手段】郵便物、アンケート、書類などの住所欄に
記入された住所を読み取る住所認識装置において、建物
末尾文字列知識データベース7と、入力画像から切り出
された文字列画像の文字認識を実行し、該認識結果の候
補文字列から、前記建物末尾文字列知識保持手段のデー
タと照合して建物部に固有な建物末尾文字列の検出を行
い、複数の建物末尾文字列候補が検出された場合は順位
付けを行い、残りの建物名候補部分の読み取り結果が成
功するか否かによって、最終的に建物部の読み取り結果
を決定して出力する建物認識部5とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、郵便物、アンケー
ト、書類などの住所欄に記入された住所を読み取る住所
認識機能を持つOCR(光学的文字認識装置)等に利用
可能な住所認識装置、記録媒体及びプログラムに関す
る。
【0002】
【従来の技術】以下、従来例について説明する。
【0003】(1) :従来例1(特開平9−38585号
公報参照) 図12は従来例1の説明図である。従来例1は、宛名認
識装置に関するものであり、辞書容量の縮小を図り、認
識処理時間を短縮する、というものである。
【0004】図12に示したように、宛名認識装置は、
光電変換部40、宛名領域検出部41、行検出部42を
用いて出力される宛名領域の行から、文字検出部43で
宛名の各文字を検出して切り出し、文字認識部44で文
字辞書45を参照して文字を認識し、宛名認識部46で
住所辞書47を参照して町名を認識し、街区文字検出部
48と、街区文字認識部49とで、文字辞書50を参照
して町名の後ろの丁目、番地を認識し、住所編集部51
で住所情報を制御部52へ出力する。
【0005】この場合、アパート名、或いはマンション
名が記載されていれば、宛名認識部46で「アパー
ト」、「マンション」等のキーワードの認識を行い、街
区文字検出部48と、街区文字認識部49とで認識され
たアパート、マンション等のキーワードの後ろに記載さ
れた文字として棟番号、部屋番号を認識して住所編集部
51で住所情報を制御部52へ出力する、というもので
ある。
【0006】(2) :従来例2(特開平5−54198号
公報) 図13は従来例2の説明図である。従来例2は、文字認
識処理装置に関するものであり、集合住宅を含む住所の
文字認識処理において、集合住宅参照単語格納数を少な
くして、正確な住所認識を可能にするものである。
【0007】図13に示したように、文字認識処理装置
では、文字認識結果は入力文字コード61として入力さ
れる。この入力文字コード61に対して、住所照合部6
2において、住所部の照合、確認、補正が行われ、住所
部が決定される。更に、集合住宅が記載されていると判
断される場合は、集合住宅照合部63で集合住宅部の照
合、確認、補正が行われ、その結果が照合結果64とし
て出力される。
【0008】この場合、集合住宅照合部63では、入力
文字コードの集合住宅部のうち、先ず地名部の照合が住
所部の照合結果を利用して地名照合部71で実施され
る。次に、未照合の入力集合住宅部の末尾部の照合が末
尾照合部72においてなされる。次に、未照合の末尾か
ら連続したアルファベット、数字の文字列検索が数字照
合部73において実行され、最後に残された入力文字コ
ード部分と予め格納された集合住宅単語群との照合が集
合住宅単語照合部74において実施される、というもの
である。
【0009】
【発明が解決しようとする課題】前記従来例において
は、次のような課題があった。
【0010】(1) :従来例1は、住所文字列内のマンシ
ョン、アパートなどのキーワードを文字列中から最初に
探索して、見つかった場合はその単語の後ろを部屋番号
部や階数として認識するといった手法である。
【0011】この従来例1においては、キーワードが建
物前接語である場合、その後ろに地名、人名等が記され
ることが一般的であり、必ずしも建物を表すキーワード
の直ぐ後ろに部屋番号部、階数が来るとは限らない。実
際に言えるのは、建物部の最後に、部屋番号部や階数等
の末尾文字列が出現する、ということだけである。従っ
て、確実な住所の読み取りは困難である。
【0012】(2) :従来例2は、建物部の文字認識結果
から、先ず地名を探索し、その後、末尾文字の「号」、
「号室」を探索している。そのため、一文字枠が印刷さ
れている帳票や印字など、一文字領域が特定できる場合
は良いが、従来例2の公報の図3に示すように、一文字
枠の無い帳票に自由に記入された住所では、切り出しパ
スが一意に決定できないため、可能な限り切り出しの組
み合わせを全て考えなければならず、そのため、探索範
囲が大変広くて、或る建物部中に地名を含まない場合で
も地名がたまたま誤って探索され、建物部読み取りが失
敗してしまう可能性が大きくなる。
【0013】本発明は、このような従来の課題を解決
し、建物部中に最も出現する可能性が大きく、かつ、位
置が推定し易い部分から先に読み取ることで、自由に記
入された住所中の建物部を精度良く効率的に認識できる
ようにすると共に、特に、手書き住所における建物部の
認識率を向上させることを目的とする。
【0014】
【課題を解決するための手段】図1は本発明の原理説明
図であり、図1中、4は住所認識部、6は住所地名D
B、7は建物末尾文字列知識DB、9は文字認識辞書、
8は建物名DB、5は建物認識部を示す(DB:データ
ベース)。本発明は前記の目的を達成するため、次のよ
うに構成した。
【0015】(1) :取り扱い対象物(郵便物、アンケー
ト、書類など)の住所欄に記入された住所を読み取る住
所認識装置において、住所中の建物部末尾に存在する、
部屋番号、階数、などの建物部に固有な建物末尾文字列
タイプに関する知識を保持する建物末尾文字列知識保持
手段(建物末尾文字列知識DB7)と、入力画像から切
り出された文字列画像の文字認識を実行し、該認識結果
の候補文字列から、前記建物末尾文字列知識保持手段の
データと照合して建物部に固有な建物末尾文字列の検出
を行い、複数の建物末尾文字列候補が検出された場合は
順位付けを行い、残りの建物名候補部分の読み取り結果
が成功するか否かによって、最終的に建物部の読み取り
結果を決定して出力する建物認識手段(建物認識部5)
とを備えている。
【0016】(2) :前記(1) の住所認識装置において、
前記建物認識手段は、存在する可能性が高く、出現する
位置が建物部後部と決まっている、部屋番号、階数など
の建物部固有な建物末尾文字列検出を、建物部認識処理
の最初に実行することで、残りの建物名を構成する単語
の探索範囲を狭める機能を備えている。
【0017】(3) :前記(1) の住所認識装置において、
前記建物認識手段は、複数の建物末尾文字列候補が検出
された場合、文字認識結果を使って点数を定義し、各建
物末尾文字列候補に対して計算された得点や文字数によ
って順位付けを行う機能と、複数の末尾文字列候補が検
出された場合、建物末尾文字列の各得点と、残された建
物名の認識が成功するか否かで、最終的な建物部の認識
結果が決定される機能とを備えている。
【0018】(4) :前記(2) の住所認識装置において、
前記建物認識手段は、予め、建物部文字列の文字認識を
実行しておき、その認識結果から、建物末尾文字列が最
も確かに存在する建物部の末尾から前方に向かって、建
物末尾文字列を探索する機能を備えている。
【0019】(5) :コンピュータに、入力画像から切り
出された文字列画像の文字認識を実行し、該文字認識結
果の候補文字列から、建物末尾文字列知識保持手段のデ
ータと照合して建物部に固有な建物末尾文字列の検出を
行い、複数の建物末尾文字列候補が検出された場合は順
位付けを行い、残りの建物名候補部分の読み取り結果が
成功するか否かによって最終的に建物部の読み取り結果
を決定して出力する建物認識手段の機能を実現させるた
めのプログラムを記録したコンピュータ読み取り可能な
記録媒体。
【0020】(6) :コンピュータに、入力画像から切り
出された文字列画像の文字認識を実行し、該文字認識結
果の候補文字列から、建物末尾文字列知識保持手段のデ
ータと照合して建物部に固有な建物末尾文字列の検出を
行い、複数の建物末尾文字列候補が検出された場合は順
位付けを行い、残りの建物名候補部分の読み取り結果が
成功するか否かによって最終的に建物部の読み取り結果
を決定して出力する建物認識手段の機能を実現させるた
めのプログラム。
【0021】(作用)前記構成に基づく本発明の作用
を、図1に基づいて説明する。
【0022】(a) :前記(1) 、(5) 、(6) では、建物認
識手段は、入力画像から切り出された文字列画像の文字
認識を実行し、該認識結果の候補文字列から、前記建物
末尾文字列知識保持手段のデータと照合して建物部に固
有な建物末尾文字列の検出を行い、複数の建物末尾文字
列候補が検出された場合は順位付けを行い、残りの建物
名候補部分の読み取り結果が成功するか否かによって、
最終的に建物部の読み取り結果を決定して出力する。
【0023】このようにすれば、建物部中に最も出現す
る可能性が大きく、かつ、位置が推定し易い部分から先
に読み取ることで、自由に記入された住所中の建物部を
精度良く効率的に認識できるようにすると共に、特に、
手書き住所における建物部の認識率を向上させることが
できる。(なお、前記(4) の作用も実質的に同じであ
る。) (b) :前記(2) では、建物認識手段は、存在する可能性
が高く、出現する位置が建物部後部と決まっている、部
屋番号、階数などの建物部固有な建物末尾文字列検出
を、建物部認識処理の最初に実行することで、残りの建
物名を構成する単語の探索範囲を狭める。このようにす
れば、残りの単語検索を正確、かつ、高速に実行させる
ことができる。
【0024】(c) :前記(3) では、建物認識手段は、複
数の建物末尾文字列候補が検出された場合、文字認識結
果を使って点数を定義し、各建物末尾文字列候補に対し
て計算された得点や文字数によって順位付けを行う機能
と、複数の末尾文字列候補が検出された場合、建物末尾
文字列の各得点と、残された建物名の認識が成功するか
否かで、最終的な建物部の認識結果が決定される。
【0025】このようにすれば、自由に記入された住所
中の建物部を精度良く効率的に認識できるようにすると
共に、特に、手書き住所における建物部の認識率を向上
させることができる。
【0026】(d) :前記(4) では、建物認識手段は、予
め、建物部文字列の文字認識を実行しておき、その認識
結果から、建物末尾文字列が最も確かに存在する建物部
の末尾から前方に向かって、建物末尾文字列を探索す
る。このようにすれば、自由に記入された住所中の建物
部を精度良く効率的に認識できるようにすると共に、特
に、手書き住所における建物部の認識率を向上させるこ
とができる。
【0027】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて詳細に説明する。
【0028】§1:住所認識装置の説明 図2は住所認識装置のブロック図、図3は建物認識部の
ブロック図である。図2に示したように、住所認識装置
は、郵便物、アンケート、各種書類などの取り扱い対象
物の住所欄に記入された住所を含む文字列画像を光学的
に走査して二値化する(二値のイメージデータを入力す
る)画像入力部(例えば、イメージスキャナ)1と、画
像入力部1により入力した文字列画像から一文字列ずつ
切り出す文字列切り出し部2と、文字列切り出し部2が
切り出した一文字列ずつの文字列画像から、一文字ずつ
(一文字領域ずつ)切り出す文字切り出し部3と、一文
字を認識するための文字認識辞書9と、住所地名データ
を格納した住所地名データベース(以下、「住所地名D
B」と記す)6と、住所地名DB6によって住所の丁目
まで認識を実行する住所認識部4と、建物に固有な部屋
番号、階数などの建物末尾文字列に関する知識を格納し
た建物末尾文字列知識データベース(以下、「建物末尾
文字列知識DB」と記す)7と、建物名を格納した建物
名データベース(以下「建物名DB」と記す)8と、前
記建物末尾文字列知識DB7と建物名DB8を使って
(参照して)建物部を認識する建物認識部5を備えてい
る。
【0029】また、図3に示したように、前記建物認識
部5は、文字認識辞書9を使って、可能な一文字領域に
対し文字認識を実行し、文字候補ラティスを作成する文
字候補ラティス作成部11と、文字候補ラティス作成部
11が作成した文字候補ラティスの末端から、建物末尾
文字列知識DB7を使って、建物末尾文字列タイプに合
致する箇所を求める(すなわち、建物文字列の最後尾か
ら前方に向かって建物に固有な建物末尾文字列を探索
し、建物末尾文字列候補を求める)建物末尾文字列探索
部12と、建物末尾文字列探索部12が探索した建物末
尾文字列候補に対し、得点を計算する建物末尾文字列得
点計算部13と、建物末尾文字列候補が複数の場合は、
それらの得点の大きさや文字数によって順位付けを行う
建物末尾文字列候補順位付部14と、既存の手法を使っ
て、建物末尾文字列候補を除いた残りの部分から建物名
を構成する建物前接続語、建物後接語、建物修飾語、地
名、人名、その他名詞等の単語を探索する建物名認識部
16と、或る建物末尾文字列候補を採用した時、残りの
ラティスを建物名認識部16に渡して、建物名認識が成
功した場合は最終的な建物部認識結果を決定し、成功し
なかった場合は次の候補を採用し、同様な処理を繰り返
す建物判定部15を備えている。
【0030】前記住所認識装置の特徴をまとめると次の
通りである。
【0031】(1) :住所中の建物部末尾に存在する、部
屋番号、階数、などの建物部に固有な建物末尾文字列タ
イプに関する知識を保持する建物末尾文字列知識DB7
と、入力画像から切り出された文字列画像の文字認識を
実行し、該認識結果の候補文字列から、前記建物末尾文
字列知識DB7のデータと照合して建物部に固有な建物
末尾文字列の検出を行い、複数の建物末尾文字列候補が
検出された場合は順位付けを行い、残りの建物名候補部
分の読み取り結果が成功するか否かによって、最終的に
建物部の読み取り結果を決定して出力する建物認識部5
とを備えている。
【0032】(2) :前記(1) の建物認識部5は、存在す
る可能性が高く、出現する位置が建物部後部と決まって
いる、部屋番号、階数などの建物部固有な建物末尾文字
列検出を、建物部認識処理の最初に実行することで、残
りの建物名を構成する単語の探索範囲を狭める機能を備
えている。
【0033】(3) :前記(1) の建物認識部5は、複数の
建物末尾文字列候補が検出された場合、文字認識結果を
使って点数を定義し、各建物末尾文字列候補に対して計
算された得点や文字数によって順位付けを行う機能と、
複数の末尾文字列候補が検出された場合、建物末尾文字
列の各得点と、残された建物名の認識が成功するか否か
で、最終的な建物部の認識結果が決定される機能とを備
えている。
【0034】(4) :前記(2) の建物認識部5は、予め、
建物部文字列の文字認識を実行しておき、その認識結果
から、建物末尾文字列が最も確かに存在する建物部の末
尾から前方に向かって、建物末尾文字列を探索する機能
を備えている。
【0035】§2:住所認識処理の説明 図4〜図8は、住所認識処理の説明図(その1)〜(そ
の5)であり、図4のA図は住所における建物部例、図
4のB図は建物前接続語、建物修飾語を含む方書例、図
4のC図は建物後接語、人名を含む方書例、図5のA図
は自由手書き文字候補ラティス例、図6のA図は建物末
尾文字列が抽出された場合の文字候補ラティス例、図7
のA図は方書固有文字列タイプ知識例、図8のA図は建
物末尾文字列探索例である。図9は建物認識部の処理フ
ローチャートである。以下、これらの図を参照しながら
住所認識処理を詳細に説明する。
【0036】(1) :用語の説明 前記住所認識処理における用語の意味は次の通りであ
る。
【0037】:建物部 建物部は、建物名+建物末尾文字列(部屋番号、階数)
から構成される。図4のA図の例では「サンハイツ横浜
802号」全体を言う。
【0038】:建物末尾文字列 建物末尾文字列は、建物の末尾にくる、階数、部屋番号
部を言う。図4のA図の例では「802号」が建物末尾
文字列である。
【0039】:建物名 建物名は、建物部から階数、部屋番号を除いた、建物の
名前を表す部分を建物名と言う。図4のA図の例では
「サンハイツ横浜」が建物名である。
【0040】:建物前接語 建物前接語は、地名、人名、その他名詞に前接し、建物
名を構成するものである。図4のA図の例では、「ハイ
ツ」が、建物前接語である。その他、「ハイム」、「メ
ゾン」等多数あるが建物名中に必ず存在するとは限らな
い。但し、建物前接語が建物名中に存在しない場合は、
建物後接語が必ず存在する。
【0041】:建物後接語 地名、人名、その他名詞に後接し、建物名を構成するも
のであり、図4のA図の例では存在しない。例えば、図
4のC図に示した「山田アパート」の「アパート」や、
「荘」、「寮」等多数あるが、建物名中に必ず存在する
とは限らない。但し、建物後接語が建物名中に存在しな
い場合は、建物前接語が必ず存在する。
【0042】:建物修飾語 建物修飾語は、建物前接語、建物後接語を修飾する単語
で、必ず、建物前接語、建物後接語を伴って建物名を構
成するものであり、建物名中に必ず存在するとは限らな
い。図4のA図、B図の例では、「サン」が建物修飾語
である。
【0043】:地名、人名、その他名詞 地名、人名、その他名詞は、通常の意味で、地名や人名
を表す語、及び「清風」、「若葉」のように、地名、人
名以外の普通名詞や固有名詞があり、建物名中に必ずあ
るとは限らない。図4のA図の例では、「横浜」が地名
である。なお、「マンション」、「コーポ」のように、
同一単語でも、出現位置によっては、建物前接語にも、
建物後接語にもなりうる場合がある。建物前接語、建物
後接語を含む建物部の例を図4のB図、図4のC図に示
す。
【0044】(2) :住所例と、住所認識処理に必要なデ
ータ等の説明 住所中の建物部は、図4に示すように、建物名(例え
ば、図4のA図の「サンハイツ横浜」)と、部屋番号や
階数などの建物部に固有な建物末尾文字列(例えば、図
4のA図の「802号」)から構成される。建物末尾文
字列は、ほぼ確実に住所の建物部中の最後に出現する。
【0045】また、建物名は、建物前接語、建物後接
語、建物修飾語、地名、人名、その他名詞から構成され
る。建物前接語、建物後接語は、何れか一方のみが建物
部中にほぼ確実に出現する。建物前接語、建物後接語を
修飾する建物修飾語は、建物部中に出現する場合としな
い場合がある。
【0046】また、地名、人名、その他の名詞も、出現
する場合としない場合がある。この中で、ほぼ確実に建
物部中に出現し、かつ、その末端が建物部文字列の末端
と一致するということが分かっている。建物前接語、建
物後接語はいずれかが建物部中にほぼ確実に出現する
が、その建物部中における始端と終端は、様々なケース
があり、予め明言できない。
【0047】その他の単語は、始端と終端だけでなく、
出現するか否かも予め明言できない。よって、前記住所
認識装置では、出現する可能性の高い部分から、かつ、
その出現する位置がだいたい分かっている建物末尾文字
列から検出することで、効率的、かつ、精度良く建物部
を読み取る手段を提供する。
【0048】図5のA図に、自由手書き文字に対する文
字候補ラティスの例をあげる。この場合、「文字候補ラ
ティス」とは、可能な一文字領域(この例では、「コー
ポ森脇305号」の各一文字領域)を全て求め、それら
に対して文字認識を実行して文字認識結果を付与したも
のである。なお、図5のA図において、例えば、「森:
29」の「森」は、「森」の一文字領域に対する認識結
果の候補文字であり、「29」は前記候補文字を構成す
る文字コードに対応する距離(距離が小さいほど、認識
文字としての確信度が高い)を示す。
【0049】この場合、図6のA図に示すように、予
め、建物末尾文字列(この例では「305号」)を抽出
しておけば、後の単語を探索する範囲が非常に狭くな
り、処理時間も少なく、検索ミスも少なくなることが分
かる。また、抽出対象とする建物固有末尾文字列のタイ
プの例を図7のA図にあげる。建物固有末尾文字列の各
タイプの記述ルール(文字数、文字種コードなどの情
報)は、予め、建物末尾文字列知識DB7として用意し
ておく。
【0050】図7のA図に示した例では、建物末尾文字
列タイプが「数字1〜4ケタ」の例としては「201」
があり、建物末尾文字列タイプが「数字1〜4ケタ+
号」の例としては「201号」があり、建物末尾文字列
タイプが「数字1〜4ケタ+号室」の例としては「20
1号室」があり、建物末尾文字列タイプが「英字+数字
1〜3ケタ」の例としては「A302」があり、建物末
尾文字列タイプが「英字+数字1〜3ケタ+号」の例と
しては「A302号」がある。このようにして、図7の
A図に示したような建物末尾文字列とその例を格納した
建物末尾文字列知識DB7を、予め用意しておく。
【0051】(3) :住所認識装置全体の処理概要 住所認識処理装置全体の処理概要は次の通りである。先
ず、画像入力部1では、郵便物、アンケート、各種書類
などの住所欄に記入された住所を含む文字列画像を光学
的に走査して二値化する。次に、文字列切り出し部2
は、画像入力部1により二値化した文字列画像から一文
字列ずつ切り出し(一文字列領域を切り出し)、文字切
り出し部3は、文字列切り出し部2が切り出した一文字
列ずつの文字列画像から、一文字ずつ(一文字領域ず
つ)切り出す。
【0052】続いて、住所認識部4は、文字切り出し部
3が切り出した文字領域のデータを基に、文字認識辞書
9を使って一文字ずつの文字認識を実行し、その認識し
た文字を基に、住所地名DB6を使って住所の丁目まで
認識を実行する。次に、建物認識部5は、住所認識部4
が認識した住所を基に、文字認識辞書9と、建物末尾文
字列知識DB7と、建物名DB8を使って建物部全体の
認識処理を実行し、該認識結果を出力する。
【0053】(4) :建物部認識処理の詳細な説明 前記住所認識処理における建物部の認識処理は次のよう
にして行う。
【0054】建物認識部5の文字候補ラティス作成部1
1は、建物部文字列の可能な一文字領域全てに対し、文
字認識辞書9を参照して文字認識を実行し、文字候補ラ
ティスを作成する。次に、建物末尾文字列探索部12
は、前記作成した文字候補ラティスの末端から、建物末
尾文字列知識DB7を使って建物末尾文字列タイプに合
致する箇所を探索して求める。
【0055】次に、建物末尾文字列得点計算部13は、
建物末尾文字列タイプに合致する各建物末尾文字列候補
に対し、候補に対応するパターンの認識結果を使って点
数を定義し、各候補に対する得点を計算する。
【0056】その後、建物末尾文字列候補順位付部14
は、それらの値と、各候補を構成する文字数などにより
順位付け(建物末尾文字列の順位付け)を行う。この場
合の建物末尾文字列探索の例を図8に示す。ここでは、
簡単化の為に、一文字領域の分かっているデータを使っ
ている。認識結果は2位まで求めてある。
【0057】すなわち、この例では、建物部が「小田中
アパート802号」であり、この文字列画像から各文字
を認識処理すると、「小」の一文字領域に対する認識結
果1位は「小」であり、その候補文字を構成する文字コ
ードに対応する距離は「18」である。また、「小」の
一文字領域に対する認識結果2位は「子」であり、その
候補文字を構成する文字コードに対応する距離は「5
4」である。
【0058】この例では、各候補文字に対する点数を、
各候補文字を構成する文字コードに対応する距離の総和
を、各候補文字を構成するパターン数で割ったものとし
て定義している。すなわち、各候補に対する点数(得
点)Pj=(各候補を構成する文字コードに対応する距
離の総和)/(各候補を構成するパターン数)として求
める。
【0059】よって、この定義では、点数(得点)が低
いほど、建物末尾文字列であるという確信度が高い。こ
の例では、建物固有文字列知識に合致する候補として、
「2号」、「802号」、「602号」、「1802
号」、「1602号」の5つが探索されている。
【0060】これらに対するj番目の順位の点数(得
点)Pj(j=1、2、3、・・・)は、次のように計
算される(なお、以下の計算例では、小数点以下は、四
捨五入してある)。ここで、順位付けの一例として、文
字数の異なる場合には、文字数の多い順に、文字数の等
しい場合は、点数の低い順に順位付けを行っている。
【0061】「1802号」:P1=(30+19+1
8+21+24)/5=22 「1602号」:P2=(30+37+18+21+2
4)/5=26 「802号」:P3=(19+18+21+24)/4
=21 「602号」:P4=(37+18+21+24)/4
=25 「2号」:P5=(21+24)/2=23 次に、第1位の建物末尾文字列候補を採用し、建物部か
ら第1位の末尾文字列候補に対応する部分を除いた文字
候補ラティスから、既存の手法(例えば、特開平11−
167607号公報に記載された手法であり、詳細は後
述する)を使って、建物前接語、建物後接語、建物修飾
語、地名、人名、その他名詞を探索し、建物名を認識し
て決定する。
【0062】建物名認識に成功すれば、第1位の建物固
有末尾文字列の認識結果と、残りの建物名部分の認識結
果を、建物部の認識結果として出力する。建物名認識に
失敗した場合は、その候補と同一文字数の候補は棄却す
る。
【0063】図8のA図に示した例では、建物末尾文字
列は、先ず最大文字数を持ち、同一文字数では最も点数
の低い「1802号」が先ず採用され、残りの部分が建
物名候補部とし、建物名の決定が行われる。しかし、
「ト」の部分が建物末尾文字列部と見なされているた
め、「アパート」が検索されず建物名認識は失敗する。
【0064】もし、第1位に対応する部分を除いた文字
候補ラティスから建物名が決定できなければ、第1位と
文字数の異なるもので、最も高い順位の候補を採用し、
建物部からその建物末尾文字列候補に対応する部分を除
いた文字候補ラティスから、同様に、建物前接語、建物
後接語、建物修飾語、地名、人命、その他名詞を探索し
て建物名を決定する。
【0065】無事決定できれば処理を終了し、その候補
の建物固有末尾文字列の認識結果と、残りの建物名部分
の認識結果が、建物部の認識結果として出力される。こ
こで、建物名が決定できない場合は、更に、下位の文字
数の異なる建物末尾文字列候補として、建物部全体の認
識結果が決定できるまで繰り返す。
【0066】図8のA図の例では、次に文字数が多く、
かつ、同一文字数では、最も点数が低い「802号」が
採用され、残りの部分を建物名候補として、既存の方法
で建物名が決定できる。この場合、無事に建物名が決定
され、最終的に「小田中アパート802号」が建物部認
識結果として出力される。
【0067】(5) :フローチャートにより建物認識部の
処理説明 図9は建物認識部の処理フローチャートである。以下、
図9に基づいて、建物認識部の処理を説明する。なお、
S1〜S10は各処理ステップを示す。
【0068】建物認識部5は、建物部文字列の可能な一
文字領域全てに対し文字認識を実行し、文字候補ラティ
スを作成する(S1)。そして、文字候補ラティスの末
端から、建物末尾文字列知識DBを使って建物末尾文字
列タイプに合致する箇所を求める(S2)。次に、建物
末尾文字列タイプに合致する各建物末尾文字列候補に対
し、候補に対応するパターンの認識結果を使って点数を
定義し、各候補に対する得点を計算する(S3)。
【0069】その後、それらの値と、各候補を構成する
文字数などにより順位付けを行う(S4)。次に、建物
末尾文字列候補のラティスから建物末尾文字列候補を除
いた部分に対する建物名の認識処理を行う(S5)。そ
して、前記建物名認識処理が成功したか否かを判断し
(S6)、成功したら認識結果を出力し(S9)、この
処理を終了する。
【0070】しかし、S6の判断で、建物名の認識処理
が成功しない場合は、文字数の異なる残りの候補がある
か否かを判断し(S7)、残りの候補があれば、次の建
物末尾文字列候補を採用して(S8)、S5の処理から
繰り返して行う。しかし、S7の処理で残りの候補がな
ければ、エラー出力を行い(S10)、この処理を終了
する。
【0071】§3:住所認識装置の具体的な装置例と記
録媒体の説明 図10は具体的な装置例である。前記住所認識装置は、
パーソナルコンピュータ、ワークステーション等の任意
のコンピュータにより実現することができる。この装置
は、コンピュータ本体21と、該コンピュータ本体21
に接続されたディスプレイ装置22、入力装置(キーボ
ード/マウス等)23、リムーバブルディスクドライブ
(「RDD」という)24、ハードディスク装置(「H
DD」という)25等を備えている。
【0072】そして、コンピュータ本体21には、内部
の各種制御や処理を行うCPU26と、プログラムや各
種データを格納しておくためのROM27(不揮発性メ
モリ)と、メモリ28と、インタフェース制御部(「I
/F制御部」という)29と、通信制御部30等が設け
てある。なお、リムーバブルディスクドライブには、フ
レキシブルディスクドライブ(フロッピィディスクドラ
イブ)や光ディスクドライブ等が含まれる。
【0073】前記構成の装置において、例えば、ハード
ディスク装置25のハードディスク(記録媒体)に、前
記住所認識装置の処理を実現するためのプログラムを格
納しておき、このプログラムをCPU26が読み出して
実行することにより、前記住所認識装置の処理を実行す
る。
【0074】しかし、本発明は、このような例に限ら
ず、例えば、ハードディスク装置25のハードディスク
(記録媒体)に、次のようにしてプログラムを格納し、
このプログラムをCPU26が実行することで前記住所
認識装置の処理を行うことも可能である。
【0075】:他の装置で作成されたリムーバブルデ
ィスクに格納されているプログラム(他の装置で作成し
たプログラムデータ)を、リムーバブルディスクドライ
ブ24により読み取り、ハードディスク装置25のハー
ドディスク(記録媒体)に格納する。
【0076】:ネットワーク(インターネット、LA
N等)を介して他の装置から伝送されたプログラム等の
データを、通信制御部30を介して受信し、そのデータ
をハードディスク装置25のハードディスク(記録媒
体)に格納する。
【0077】§4:文字候補ラティスから建物名を決定
する処理(特開平11−167607号公報参照)の概
要説明 図11は、文字候補ラティスから建物名を決定する処理
の説明図である。以下、図11に基づいて、文字候補ラ
ティスから建物名を決定する処理の概要を説明する。な
お、S21〜S26は各処理ステップを示す。
【0078】住所認識処理 S21で実行する住所認識処理では、イメージメモリか
ら読み込んだ加入者情報の画像データの中から住所部分
を抽出し、規定の認識アルゴリズムに従ってそれを文字
コードに変換する処理を行う。この住所部分の抽出方法
としては、加入申込用紙に記入枠が設けられているとき
には、その記入枠を検出することで行う。一方、記入枠
が設けられていないときには、画像データ内の黒領域の
分布から文字ブロックを推定して、それらの文字ブロッ
クの位置関係より住所の書かれている文字ブロックを推
定することなどにより行う。
【0079】このとき、追加情報検索プログラムを呼び
出し、この追加情報検索プログラムを使ってユーザと対
話することで、住所部分を抽出するという方法を採るこ
とも可能である。現在の認識技術では、100%の正確
な認識は不可能であるので、住所を構成する各文字毎
に、正解の可能性の高い順に複数個の正解候補の文字コ
ードを求める。これから、認識結果は、候補文字のラテ
ィスを構成することになる。
【0080】住所文字列分割処理 S22で実行する住所文字列分割処理では、住所認識処
理の出力する認識結果の候補文字ラティスを、住所を構
成する行政区分、建物名、部屋番号の3つの要素に分割
する処理を行う。
【0081】この分割方法としては、加入申込用紙に設
けられる記入枠のフォーマット情報を利用することで行
ったり、住所部分の抽出に用いた画像データのレイアウ
ト情報を利用することで行う。また、認識結果の文字数
や、認識結果の文字で分割する方法(例えば、認識文字
「番地」で行政区分と建物名とを分割したり、認識文字
「荘」で建物名と部屋番号とを分割する)を採ることも
可能である。
【0082】このとき、追加情報検索プログラムを呼び
出し、この追加情報検索プログラムを使ってユーザと対
話することで、行政区分/建物名/部屋番号に分割する
という方法を採ることも可能である。
【0083】行政区分抽出処理 S23で実行する行政区分抽出処理では、住所文字列分
割処理で分割された行政区分部分の候補文字ラティスか
ら、行政区分の正解文字列を抽出する処理を行う。この
抽出処理は、追加情報検索プログラムを呼び出し、この
追加情報検索プログラムを使って行政区分データベース
にアクセスして、行政区分データベースの管理データと
整合性のとれるものを探し出すことで行う。
【0084】例えば、候補文字ラティスに、「川崎市中
原区」と「川崎市中源区」とがある場合には、行政区分
データベースの管理データと整合性のとれる「川崎市中
原区」を正解文字列として抽出するのである。
【0085】このとき、正解文字列を抽出できないとき
は、追加情報検索プログラムに対して、郵便番号や電話
番号(加入申込用紙に記入されているときには、認識結
果のものを使い、記入されていないときには、追加情報
検索プログラムを使ってユーザに問い合わせることで入
手する)を通知して、最も整合性のあるものを探し出す
ことで行う。
【0086】このような処理に従っても正解文字列を抽
出できないときには、追加情報検索プログラムを介して
外部データベースにアクセスしたり、ユーザに問い合わ
せることで、行政区分の正解文字列を抽出していくこと
になる。
【0087】建物名抽出処理 S24で実行する建物名抽出処理では、住所文字列分割
処理で分割された建物名部分の候補文字ラティスから、
建物名の正解文字列を抽出する処理を行う。この抽出処
理は、「アパート」や「ハイツ」のように建物名を構成
する単語リスト(図示しないデータベースなどに管理さ
れる)を参照することで行ったり、行政区分の正解文字
列を参照することで行ったり、追加情報検索プログラム
を呼び出し、この追加情報検索プログラムを使って地図
情報データベースや印象度データベースや出現頻度デー
タベースにアクセスすることで、建物名として用いられ
る可能性の高い単語名を取得してそれを参照することで
行う。
【0088】例えば、建物名の認識結果として「中原ハ
イツ」と「中原ハイシ」とがある場合には、建物名を構
成する単語リストから「中原ハイツ」を正解文字列とし
て抽出する。
【0089】また、例えば、行政区分の正解文字列が
「川崎市中原区上小田中4丁目1番1号」であり、建物
名の認識結果として「中原アパート」と「中源アパー
ト」とがある場合には、行政区分の正解文字列から「中
原アパート」を正解文字列として抽出する。
【0090】また、例えば、行政区分の正解文字列が
「川崎市中原区上小田中4丁目1番1号」であり、建物
名の認識結果として「富士山ハイツ」と「富士川ハイ
ツ」とがある場合には、地図情報データベースから近く
に「富士山神社」があることを考慮して、「富士山ハイ
ツ」を正解文字列として抽出する。
【0091】また、例えば、行政区分の正解文字列が
「川崎市中原区上小田中4丁目1番1号」であり、建物
名の認識結果として人名を使う「山田ハイツ」と「仙田
ハイツ」とがある場合には、地図情報データベースから
「山田太郎」が所有者であることを考慮して、「山田ハ
イツ」を正解文字列として抽出する。
【0092】また、例えば、建物名の認識結果として
「清風荘」と「清嵐荘」とがある場合には、印象度デー
タベースから「清風」や「風」が快適さや清潔さを持つ
単語名や文字であることを考慮して、「清風荘」を正解
文字列として抽出する。立地条件や所有者条件に依存し
ないような場合には、快適さや清潔さを持つ単語名や文
字が建物名に使われることが多いことを考慮して、その
ような単語名や文字に従って建物名の正解文字列を抽出
するのである。
【0093】また、例えば、建物名の認識結果として
「常盤荘」と「常磐荘」とがある場合には、出現頻度デ
ータベースから建物名として「常盤」の出現頻度が大き
いことを考慮して、「常盤荘」を正解文字列として抽出
する。この出現頻度を用いる方式は、印象度データベー
スを用いるときに比べて、印象度の良い単語や文字の設
定が不要であるという利点がある。
【0094】このような処理に従っても正解文字列を抽
出できないときには、追加情報検索プログラムを介して
外部データベースにアクセスしたり、ユーザに問い合わ
せることで、建物名の正解文字列を抽出していくことに
なる。
【0095】部屋番号抽出処理 S25で実行する部屋番号抽出処理では、住所文字列分
割処理で分割された部屋番号部分の候補文字ラティスか
ら、部屋番号の正解文字列を抽出する処理を行う。
【0096】この抽出処理は、追加情報検索プログラム
を呼び出し、この追加情報検索プログラムを使って部屋
番号データベースにアクセスすることで、抽出された建
物名の指す建物種別の持つ部屋番号属性を取得してそれ
を参照することで行う。
【0097】例えば、建物種別が団地やマンションであ
れば、3階建て以上の階数を持つ場合が多く、更に、団
地である場合には、先頭に棟番号を表すアルファベット
の付くことがあるといったことを考慮して、部屋番号の
正解文字列を抽出していくことになる。例えば、アパー
トの部屋番号が“81”か“21”か分からないときに
は、アパートが3階建て以下であることを考慮して、
“21”を正解文字として抽出する。また、例えば、団
地の先頭に付く文字が“L”か“し”か分からないとき
には、団地の先頭に付く棟番号はアルファベットである
ことが多いので、“L”を正解文字として抽出する。
【0098】このような処理に従っても正解文字列を抽
出できないときには、追加情報検索プログラムを介して
外部データベースにアクセスしたり、ユーザに問い合わ
せることで、部屋番号の正解文字列を抽出していくこと
になる。
【0099】このようにして、加入者情報認識プログラ
ムは、図11の処理フローチャートに従って、先ず最初
に、S21で、住所認識処理を実行すると、続いて、S
22で、住所文字列分割処理を実行し、続いて、S23
で、行政区分抽出処理を実行し、続いて、S24で、建
物名抽出処理を実行し、続いて、S25で、部屋番号抽
出処理を実行することで、住所情報の正解文字列を得る
と、最後に、S26で、それらの正解文字列を合成して
住所情報の認識結果を得て、それを加入者情報データベ
ースに出力する。なお、このS26では、認識結果の出
力処理に合わせて、出現頻度データベースの管理データ
を更新する処理を行う。
【0100】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。
【0101】(1) :請求項1、5、6では、建物認識手
段は、入力画像から切り出された文字列画像の文字認識
を実行し、該認識結果の候補文字列から、前記建物末尾
文字列知識保持手段のデータと照合して建物部に固有な
建物末尾文字列の検出を行い、複数の建物末尾文字列候
補が検出された場合は順位付けを行い、残りの建物名候
補部分の読み取り結果が成功するか否かによって、最終
的に建物部の読み取り結果を決定して出力する。
【0102】このようにすれば、建物部中に最も出現す
る可能性が大きく、かつ、位置が推定し易い部分から先
に読み取ることで、自由に記入された住所中の建物部を
精度良く効率的に認識できるようにすると共に、特に、
手書き住所における建物部の認識率を向上させることが
できる。
【0103】(2) :請求項2では、建物認識手段は、存
在する可能性が高く、出現する位置が建物部後部と決ま
っている、部屋番号、階数などの建物部固有な建物末尾
文字列検出を、建物部認識処理の最初に実行すること
で、残りの建物名を構成する単語の探索範囲を狭める。
このようにすれば、残りの単語検索を正確、かつ、高速
に実行させることができる。
【0104】(3) :請求項3では、建物認識手段は、複
数の建物末尾文字列候補が検出された場合、文字認識結
果を使って点数を定義し、各建物末尾文字列候補に対し
て計算された得点や文字数によって順位付けを行う機能
と、複数の末尾文字列候補が検出された場合、建物末尾
文字列の各得点と、残された建物名の認識が成功するか
否かで、最終的な建物部の認識結果が決定される。
【0105】このようにすれば、自由に記入された住所
中の建物部を精度良く効率的に認識できるようにすると
共に、特に、手書き住所における建物部の認識率を向上
させることができる。
【0106】(4) :請求項4では、建物認識手段は、予
め、建物部文字列の文字認識を実行しておき、その認識
結果から、建物末尾文字列が最も確かに存在する建物部
の末尾から前方に向かって、建物末尾文字列を探索す
る。このようにすれば、自由に記入された住所中の建物
部を精度良く効率的に認識できるようにすると共に、特
に、手書き住所における建物部の認識率を向上させるこ
とができる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の実施の形態における住所認識装置のブ
ロック図である。
【図3】本発明の実施の形態における建物認識部のブロ
ック図である。
【図4】本発明の実施の形態における住所認識処理の説
明図(その1)であり、A図は住所における建物部例、
B図は建物前接語、建物修飾語を含む方書例、C図は建
物後接語、人名を含む方書例である。
【図5】本発明の実施の形態における住所認識処理の説
明図(その2)であり、A図は自由手書き文字候補ラテ
ィス例である。
【図6】本発明の実施の形態における住所認識処理の説
明図(その3)であり、A図は建物末尾文字列が抽出さ
れた場合の文字候補ラティス例である。
【図7】本発明の実施の形態における住所認識処理の説
明図(その4)であり、A図は方書固有文字列タイプ知
識例である。
【図8】本発明の実施の形態における住所認識処理の説
明図(その5)であり、A図は建物末尾文字列探索例で
ある。
【図9】本発明の実施の形態における建物認識部の処理
フローチャートである。
【図10】本発明の実施の形態における具体的な装置例
である。
【図11】本発明の実施の形態における文字候補ラティ
スから建物名を決定する処理の説明図である。
【図12】従来例1の説明図である。
【図13】従来例2の説明図である。
【符号の説明】
1 画像入力部 2 文字列切り出し部 3 文字切り出し部 4 住所認識部 5 建物認識部 6 住所地名データベース(住所地名DB) 7 建物末尾文字列知識データベース(建物末尾文字列
知識DB) 8 建物名データベース(建物名DB) 9 文字認識辞書 11 文字候補ラティス作成部 12 建物末尾文字列探索部 13 建物末尾文字列得点計算部 14 建物末尾文字列候補順位付部 15 建物判定部 16 建物名認識部 21 コンピュータ本体 22 ディスプレイ装置 23 入力装置 24 リムーバブルディスクドライブ(RDD) 25 ハードデイスク装置(HDD) 26 CPU 27 ROM 28 メモリ 29 インタフェース制御部(I/F制御部) 30 通信制御部 40 光電変換部 41 宛名領域検出部 42 行検出部 43 文字検出部 44 文字認識部 45 文字辞書 46 宛名認識部 47 住所辞書 48 街区文字検出部 49 街区文字認識部 50 文字辞書 51 住所編集部 52 制御部 61 入力文字コード 62 住所照合部 63 集合住宅照合部 64 照合結果 71 地名照合部 72 末尾照合部 73 数字照合部 74 集合住宅単語照合部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】取り扱い対象物の住所欄に記入された住所
    を読み取る住所認識装置において、 住所中の建物部末尾に存在する、建物部に固有な建物末
    尾文字列タイプに関する知識を保持する建物末尾文字列
    知識保持手段と、 入力画像から切り出された文字列画像の文字認識を実行
    し、該認識結果の候補文字列から、前記建物末尾文字列
    知識保持手段のデータと照合して建物部に固有な建物末
    尾文字列の検出を行い、複数の建物末尾文字列候補が検
    出された場合は順位付けを行い、残りの建物名候補部分
    の読み取り結果が成功するか否かによって、最終的に建
    物部の読み取り結果を決定して出力する建物認識手段
    と、 を備えていることを特徴とする住所認識装置。
  2. 【請求項2】前記建物認識手段は、 存在する可能性が高く、出現する位置が建物部後部と決
    まっている、部屋番号、階数などの建物部固有な建物末
    尾文字列検出を、建物部認識処理の最初に実行すること
    で、残りの建物名を構成する単語の探索範囲を狭める機
    能を備えていることを特徴とする請求項1記載の住所認
    識装置。
  3. 【請求項3】前記建物認識手段は、 複数の建物末尾文字列候補が検出された場合、文字認識
    結果を使って点数を定義し、各建物末尾文字列候補に対
    して計算された得点や文字数によって順位付けを行う機
    能と、 複数の末尾文字列候補が検出された場合、建物末尾文字
    列の各得点と、残された建物名の認識が成功するか否か
    で、最終的な建物部の認識結果が決定される機能と、 を備えていることを特徴とする請求項1記載の住所認識
    装置。
  4. 【請求項4】前記建物認識手段は、 予め、建物部文字列の文字認識を実行しておき、その認
    識結果から、建物末尾文字列が最も確かに存在する建物
    部の末尾から前方に向かって、建物末尾文字列を探索す
    る機能を備えていることを特徴とする請求項2記載の住
    所認識装置。
  5. 【請求項5】コンピュータに、 入力画像から切り出された文字列画像の文字認識を実行
    し、該文字認識結果の候補文字列から、建物末尾文字列
    知識保持手段のデータと照合して建物部に固有な建物末
    尾文字列の検出を行い、複数の建物末尾文字列候補が検
    出された場合は順位付けを行い、残りの建物名候補部分
    の読み取り結果が成功するか否かによって最終的に建物
    部の読み取り結果を決定して出力する建物認識手段の機
    能を実現させるためのプログラムを記録したコンピュー
    タ読み取り可能な記録媒体。
  6. 【請求項6】コンピュータに、 入力画像から切り出された文字列画像の文字認識を実行
    し、該文字認識結果の候補文字列から、建物末尾文字列
    知識保持手段のデータと照合して建物部に固有な建物末
    尾文字列の検出を行い、複数の建物末尾文字列候補が検
    出された場合は順位付けを行い、残りの建物名候補部分
    の読み取り結果が成功するか否かによって最終的に建物
    部の読み取り結果を決定して出力する建物認識手段の機
    能を実現させるためのプログラム。
JP2001260805A 2000-09-11 2001-08-30 住所認識装置、記録媒体及びプログラム Expired - Fee Related JP4584507B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001260805A JP4584507B2 (ja) 2000-09-11 2001-08-30 住所認識装置、記録媒体及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-274644 2000-09-11
JP2000274644 2000-09-11
JP2001260805A JP4584507B2 (ja) 2000-09-11 2001-08-30 住所認識装置、記録媒体及びプログラム

Publications (2)

Publication Number Publication Date
JP2002157553A true JP2002157553A (ja) 2002-05-31
JP4584507B2 JP4584507B2 (ja) 2010-11-24

Family

ID=26599631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001260805A Expired - Fee Related JP4584507B2 (ja) 2000-09-11 2001-08-30 住所認識装置、記録媒体及びプログラム

Country Status (1)

Country Link
JP (1) JP4584507B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929113A (zh) * 2018-09-19 2020-03-27 珠海金山办公软件有限公司 一种对混合型字符串表格的排序方法、系统和终端

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62284481A (ja) * 1986-05-31 1987-12-10 Ricoh Co Ltd 文字認識後処理方式
JPH0433186A (ja) * 1990-05-30 1992-02-04 Mitsubishi Electric Corp 単語読取装置
JPH0554198A (ja) * 1991-08-28 1993-03-05 Nec Corp 文字認識処理装置
JPH06295309A (ja) * 1993-04-06 1994-10-21 Ricoh Co Ltd 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JPH0934889A (ja) * 1995-07-19 1997-02-07 Toshiba Syst Kaihatsu Kk 住所認識処理システム
JPH0938585A (ja) * 1995-07-28 1997-02-10 Toshiba Corp 宛名認識装置および宛名認識方法
JPH11316802A (ja) * 1998-04-30 1999-11-16 Canon Inc 単語認識装置及びその住所地名登録方法並びに記録媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62284481A (ja) * 1986-05-31 1987-12-10 Ricoh Co Ltd 文字認識後処理方式
JPH0433186A (ja) * 1990-05-30 1992-02-04 Mitsubishi Electric Corp 単語読取装置
JPH0554198A (ja) * 1991-08-28 1993-03-05 Nec Corp 文字認識処理装置
JPH06295309A (ja) * 1993-04-06 1994-10-21 Ricoh Co Ltd 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JPH0934889A (ja) * 1995-07-19 1997-02-07 Toshiba Syst Kaihatsu Kk 住所認識処理システム
JPH0938585A (ja) * 1995-07-28 1997-02-10 Toshiba Corp 宛名認識装置および宛名認識方法
JPH11316802A (ja) * 1998-04-30 1999-11-16 Canon Inc 単語認識装置及びその住所地名登録方法並びに記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929113A (zh) * 2018-09-19 2020-03-27 珠海金山办公软件有限公司 一种对混合型字符串表格的排序方法、系统和终端

Also Published As

Publication number Publication date
JP4584507B2 (ja) 2010-11-24

Similar Documents

Publication Publication Date Title
JP4421134B2 (ja) 文書画像検索装置
EP0844583A2 (en) Method and apparatus for character recognition
JPH086945A (ja) 文書の論理構造の解析方法及びシステム
WO2005064490A1 (en) System for recognising and classifying named entities
US7046847B2 (en) Document processing method, system and medium
Sinha et al. Visual text recognition through contextual processing
US8411958B2 (en) Apparatus and method for handwriting recognition
Pal et al. OCR error correction of an inflectional indian language using morphological parsing
US6360010B1 (en) E-mail signature block segmentation
WO2000036530A1 (fr) Methode de recherche et dispositif correspondant, support enregistre
JP2001175661A (ja) 全文検索装置及び全文検索方法
JP3309174B2 (ja) 文字認識方法及び装置
JP2002063548A (ja) 手書き文字認識方法
JP4584507B2 (ja) 住所認識装置、記録媒体及びプログラム
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JP2681663B2 (ja) 日本文訂正候補文字抽出方法
KR20000035325A (ko) 문서 인식 장치 및 우편 구분기
JPH06124364A (ja) 文字切り出し装置
CN115410207B (zh) 一种针对竖排文本的检测方法及装置
JP3712831B2 (ja) 文書理解装置および郵便区分機
JP2002056357A (ja) 文字認識装置、その方法および記録媒体
JPH0256086A (ja) 文字認識の後処理方法
JP2004178044A (ja) 属性抽出方法及びその装置及び属性抽出プログラム
JPH113401A (ja) 情報処理装置及びその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060926

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20091210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100513

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100831

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100902

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees