JP5251205B2 - 住所認識装置 - Google Patents
住所認識装置 Download PDFInfo
- Publication number
- JP5251205B2 JP5251205B2 JP2008084615A JP2008084615A JP5251205B2 JP 5251205 B2 JP5251205 B2 JP 5251205B2 JP 2008084615 A JP2008084615 A JP 2008084615A JP 2008084615 A JP2008084615 A JP 2008084615A JP 5251205 B2 JP5251205 B2 JP 5251205B2
- Authority
- JP
- Japan
- Prior art keywords
- address
- character
- recognition
- candidate
- place name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
[文字1]
等)を抽出し、2つの隣接するキー文字で限定された地名区域を検出する。本方法では、地名区域内の地名を認識するために、この地名区域を個別の文字に分割し、次にそれら個別の文字を一つずつ認識する。
[文字2]
」とすると、まず、「市」と「区」と「路」というようなキー文字が抽出され認識される。次に、それらキー文字の間の画像(または一つ目のキー文字の直前の画像)が切り取られる。即ち、「北京」、「
[文字3]
」、「
[文字4]
」に対応する画像が切り取られる。そして、それらの画像が全体として認識される。
[文字2]
では、「市」または「区」が省略されてもよく、かつ住所への解読にも影響を与えない。この場合、全体認識による方法であれば、認識に成功しない可能性がある。地名区域、即ちキー文字の間の画像領域が特定できないからである。
[文字5]
」は「木」と「又」と「寸」から構成される。図3−2に示すように、隣接する2つの連結領域は単一文字領域候補として組合わせられ、即ち、AB、BC、CDとなる。図3−3に示すように、隣接する3つの連結領域も単一文字領域候補として組合わせられ、即ち、ABC、BCDとなる。以上の連結領域の組み合わせにおいて、組合わせられた連結領域の幅がある所定の閾値Thcより大きくなると、連結領域の組み合わせは行わない。
[文字7]
または
[文字7]
市、湖北または湖北省等)を、この認識候補文字列と照合することにより、認識距離が最も小さい住所列を認識結果として算出する。
[文字7]
または
[文字7]
市、湖北または湖北省等)を、この認識候補文字列と照合することにより、認識距離が最も小さい住所列を認識結果として算出する。
[文字7]
市を、E13は湖北省をそれぞれ示している。
[文字8]
)−E33(沙市区)−E41(
[文字9]
)である。
ルール1:
Dist(Ciq)>Thr1とすれば、Ciq、Ci(q+1)、・・・、Cinを候補文字列から削除する。
ルール2:
[Dist(Ciq)−Dist(Cil)]/Dist(Cil)>Thr2とすれば、Ciq、Ci(q+1)、・・・、Cinを候補文字列から削除する。
前記住所非欠如照合手段(ステップ)により決定された住所が信頼できるか否かを判定する判定手段(ステップ)、前記判定手段(ステップ)は前記住所非欠如照合手段(ステップ)により決定された住所が信頼できないと判定した場合に、住所を抜いた照合、即ち、所属関係において、所属関係のうちの第2層または第3層から所属関係の最終層まで高い順に照合を順次行う住所欠如照合手段(ステップ)、及び、前記住所非欠如照合手段(ステップ)による結果の信頼性と前記住所欠如照合手段(ステップ)による結果の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段(ステップ)。
前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していないと判定された場合、前記キー文字の間に位置する住所区域を全体認識する住所全体認識手段と、
前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していると判定された場合、前記入力された住所画像に関して住所を語彙別に認識する住所語彙別認識手段と、
前記住所全体認識手段により認識された住所の信頼性を判定する信頼性判定手段と、
を備え、
前記信頼性判定手段は前記住所全体認識手段により認識された住所が信頼できないと判定した場合、前記住所語彙別認識手段は前記入力された住所画像に対して住所を語彙別に認識することを特徴とする住所認識装置。
前記入力された住所画像における単一文字候補を抽出する単一文字抽出手段と、
抽出された各単一文字候補をキー文字辞書におけるキー文字とそれぞれ比較する比較手段と、
抽出された前記単一文字候補のそれぞれと前記キー文字辞書における全部のキー文字との照合距離が所定の閾値より大きい場合、或いは照合距離が所定の閾値より小さい前記単一文字候補はあるものの、適正なキー文字の順序がない場合に、前記入力された住所画像にキー文字が欠如していると判定するキー文字判定手段と
を備えたことを特徴とする付記1に記載の住所認識装置。
画像から連結領域を分割する連結領域分割手段と、
各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かを判定する単一文字領域候補判定手段と、
単一文字領域候補判定手段により判定された単一文字領域候補に関して文字を抽出する文字抽出手段と
を備えたことを特徴とする付記3に記載の住所認識装置。
前記住所区域に係わる特徴ベクトルを抽出する抽出手段と、
前記抽出手段により抽出された特徴ベクトルを地名辞書における地名に係わる特徴ベクトルと照合して、可能な全ての地名候補を求める照合手段と
を備えたことを特徴とする付記1に記載の住所認識装置。
各単一文字領域候補を認識して、認識候補文字列を取得する認識候補文字列取得手段と、
住所辞書における住所を前記認識候補文字列と照合して、認識距離の最も小さい住所を認識結果とする照合手段と
を備えたことを特徴とする付記1に記載の住所認識装置。
住所非欠如照合を行う、即ち、所属関係に従って住所辞書における住所を前記認識候補文字列と一層ずつ照合する住所非欠如照合手段、
を備えたことを特徴とする付記7に記載の住所認識装置。
前記住所非欠如照合手段により決定された住所は信頼できるか否かを判定する判定手段と、
前記判定手段は前記住所非欠如照合手段により決定された住所が信頼できないと判定された場合に、住所欠如照合を行う、即ち、所属関係のうちの第2層または第3層から所属関係の最終層まで所属関係の層の高い順から照合を行う住所欠如照合手段と、
前記住所非欠如照合手段による結果の信頼性と前記住所欠如照合手段による結果の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段と
を備えたことを特徴とする付記8に記載の住所認識装置。
(1)単一文字候補は、絶対認識距離が第1の閾値より大きければ、それを前記認識候補文字列から削除する、
(2)単一文字候補は、相対認識距離が第2の閾値より大きければ、それを前記認識候補文字列から削除する、
というルールのいずれかに従って単一文字候補を減らすことを特徴とする付記12に記載の住所認識装置。
前記文字画像を連結領域に分割する連結領域分割手段と、
各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域の幅が閾値より小さいか否かを判定し、閾値より小さい各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域を単一文字領域候補として判定する単一文字領域候補判定手段と、
を備えたことを特徴とする装置。
前記住所画像における各単一文字領域候補を認識して文字認識候補を取得する単一文字認識手段と、
前記単一文字領域候補における全ての文字認識候補からなる認識候補文字列を取得する認識候補文字列取得手段と、
住所辞書における住所を前記認識候補文字列と照合して、認識距離の最も小さい住所を認識結果として認識する照合手段と、
を備えたことを特徴とする装置。
前記住所非欠如照合手段により決定された住所が信頼できるか否かを判定する判定手段と、
前記判定手段は前記住所非欠如照合手段により決定された住所が信頼できないと判定した場合に、住所非欠如照合を行う、即ち、所属関係のうちの第2層または第3層から所属関係の最終層まで所属関係の高い順に照合を行う住所欠如照合手段と、
前記住所非欠如照合手段による住所の信頼性と前記住所欠如照合手段による住所の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段と
を備えたことを特徴とする付記16に記載の装置。
(1)単一文字候補は、絶対認識距離が第1の閾値より大きければ、それを前記認識候補文字列から削除する、
(2)単一文字候補は、相対認識距離が第2の閾値より大きければ、それを前記認識候補文字列から削除する、
というルールのいずれかに従って単一文字候補を減らすことを特徴とする付記20に記載の装置。
12 住所全体認識手段
13 判定手段
14 住所語彙別認識手段
301 単一文字認識手段
302 住所語彙チャート記憶手段
303 候補文字列取得手段
304 語彙モデル照合手段
701 住所非欠如照合手段
702 判定手段
703 住所欠如照合手段
704 決定手段
Claims (6)
- 入力された住所画像にキー文字が欠如しているか否かを判定するキー文字欠如判定手段と、
前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していないと判定された場合、前記キー文字の間に位置する住所区域を全体認識する住所全体認識手段と、
各単一文字領域候補を認識して、認識候補文字列を取得する認識候補文字列取得手段と、住所辞書における住所を前記認識候補文字列と照合して、認識距離を基に前記認識候補文字列を絞り込み、前の第k−1層の住所が決定された後、地名Tiの出現確率を算出して、算出された出現確率に地名Tiに認識された地名の信頼度を乗算し、それらの積が最も大きい地名Tiを第k層の地名候補に決定する(ここで、iは1以上の整数で、Tiは第k層の地名候補のうち第i個の候補を表す)ことにより前記第k層の地名候補を判定する照合手段とを有し、前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していると判定された場合、前記認識候補文字列取得手段と前記照合手段により前記入力された住所画像に関して住所を語彙別に認識する住所語彙別認識手段と、
前記住所全体認識手段により認識された住所の信頼性を判定する信頼性判定手段と、
を備え、
前記信頼性判定手段が前記住所全体認識手段により認識された住所が信頼できないと判定した場合、前記住所語彙別認識手段は前記入力された住所画像に対して住所を語彙別に認識することを特徴とする住所認識装置。 - 前記キー文字欠如判定手段は、
前記入力された住所画像における単一文字候補を抽出する単一文字抽出手段と、
抽出された各単一文字候補をキー文字辞書におけるキー文字とそれぞれ比較する比較手段と、
抽出された前記単一文字候補のそれぞれと前記キー文字辞書における全部のキー文字との照合距離が所定の閾値より大きい場合、或いは照合距離が所定の閾値より小さい前記単一文字候補はあるものの、適正なキー文字の順序がない場合に、前記入力された住所画像にキー文字が欠如していると判定するキー文字判定手段と
を備えたことを特徴とする請求項1に記載の住所認識装置。 - 前記単一文字抽出手段は、
画像から連結領域を分割する連結領域分割手段と、
各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かを判定する単一文字領域候補判定手段と、
単一文字領域候補判定手段により判定された単一文字領域候補に関して文字を抽出する文字抽出手段と
を備えたことを特徴とする請求項2に記載の住所認識装置。 - 前記照合手段は、
住所非欠如照合を行う、即ち、所属関係に従って住所辞書における住所を前記認識候補文字列と一層ずつ照合する住所非欠如照合手段、
を備えたことを特徴とする請求項1に記載の住所認識装置。 - 前記地名の信頼度は、地名画像と認識された前記地名Tiとの類似度の重みであり、地名Tiにおける最後の認識領域候補がキー文字に認識されれば、前記類似度に大きい重みをかけ、地名Tiにおける最後の認識領域候補がキー文字に認識されなければ、前記類似度に小さい重みをかけることを特徴とする請求項1に記載の住所認識装置。
- 前記照合手段は更に、
前記住所非欠如照合手段により決定された住所は信頼できるか否かを判定する判定手段と、
前記判定手段は前記住所非欠如照合手段により決定された住所が信頼できないと判定された場合に、住所欠如照合を行う、即ち、所属関係のうちの第2層または第3層から所属関係の最終層まで所属関係の層の高い順から照合を行う住所欠如照合手段と、
前記住所非欠如照合手段による結果の信頼性と前記住所欠如照合手段による結果の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段と
を備えたことを特徴とする請求項4に記載の住所認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100915392A CN101276327B (zh) | 2007-03-27 | 2007-03-27 | 地址识别装置 |
CN200710091539.2 | 2007-03-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008243208A JP2008243208A (ja) | 2008-10-09 |
JP5251205B2 true JP5251205B2 (ja) | 2013-07-31 |
Family
ID=39914393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008084615A Expired - Fee Related JP5251205B2 (ja) | 2007-03-27 | 2008-03-27 | 住所認識装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5251205B2 (ja) |
CN (1) | CN101276327B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120072013A1 (en) * | 2010-09-16 | 2012-03-22 | Kabushiki Kaisha Toshiba | Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method |
CN103186524B (zh) * | 2011-12-30 | 2016-04-13 | 高德软件有限公司 | 一种地名识别方法和装置 |
CN103854021A (zh) * | 2012-11-29 | 2014-06-11 | 北京千橡网景科技发展有限公司 | 词语识别方法及装置 |
CN103473289A (zh) * | 2013-08-30 | 2013-12-25 | 深圳市华傲数据技术有限公司 | 一种通信地址补全的装置及方法 |
CN107430601B8 (zh) * | 2014-11-14 | 2022-03-22 | 大众汽车(中国)投资有限公司 | 用于导航系统的控制方法和控制装置 |
CN104731976B (zh) * | 2015-04-14 | 2018-03-30 | 海量云图(北京)数据技术有限公司 | 数据表中隐私数据的发现与分类方法 |
CN107133215A (zh) * | 2017-05-20 | 2017-09-05 | 复旦大学 | 一种脱机手写中文规范地址识别方法 |
CN109013360A (zh) * | 2018-07-09 | 2018-12-18 | 安徽云图信息技术有限公司 | 一种快递入库分拣管理系统 |
CN110334162B (zh) * | 2019-05-09 | 2021-11-09 | 德邦物流股份有限公司 | 地址识别方法及装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2635155B2 (ja) * | 1989-03-20 | 1997-07-30 | 富士通株式会社 | ベた書き住所認識装置 |
JPH07271920A (ja) * | 1994-03-31 | 1995-10-20 | Toshiba Corp | 文字認識装置 |
JP3639126B2 (ja) * | 1998-01-22 | 2005-04-20 | 富士通株式会社 | 住所認識装置及び住所認識方法 |
JP2001283156A (ja) * | 2000-03-31 | 2001-10-12 | Glory Ltd | 住所認識装置、住所認識方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002183119A (ja) * | 2000-12-19 | 2002-06-28 | Riso Kagaku Corp | 宛名作成装置、宛名作成プログラム、及び宛名作成システム |
JP4136316B2 (ja) * | 2001-01-24 | 2008-08-20 | 富士通株式会社 | 文字列認識装置 |
CN1169073C (zh) * | 2001-02-23 | 2004-09-29 | 无敌科技(西安)有限公司 | 图文编辑方法以及系统 |
JP2006031099A (ja) * | 2004-07-12 | 2006-02-02 | Fujitsu Ltd | 文字認識をコンピュータに行なわせるためのコンピュータ実行可能なプログラム |
CN100555308C (zh) * | 2005-07-29 | 2009-10-28 | 富士通株式会社 | 地址识别装置和方法 |
-
2007
- 2007-03-27 CN CN2007100915392A patent/CN101276327B/zh not_active Expired - Fee Related
-
2008
- 2008-03-27 JP JP2008084615A patent/JP5251205B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008243208A (ja) | 2008-10-09 |
CN101276327B (zh) | 2010-06-23 |
CN101276327A (zh) | 2008-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5251205B2 (ja) | 住所認識装置 | |
US8180160B2 (en) | Method for character recognition | |
KR101312804B1 (ko) | 텍스트 인식을 용이하게 하는 시스템 및 텍스트 인식 방법 | |
TWI321294B (en) | Method and device for determining at least one recognition candidate for a handwritten pattern | |
US9665768B2 (en) | Process of handwriting recognition and related apparatus | |
US7596272B2 (en) | Handling of diacritic points | |
US9711117B2 (en) | Method and apparatus for recognising music symbols | |
JP5217127B2 (ja) | 一括地名認識プログラム、一括地名認識装置および一括地名認識方法 | |
CN110363049B (zh) | 图形元素检测识别和类别确定的方法及装置 | |
Kour et al. | Real-time segmentation of on-line handwritten arabic script | |
WO2007082271A2 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
JP7268198B2 (ja) | 画像解析装置、画像解析方法、及びプログラム | |
CN111695527A (zh) | 一种蒙古文在线手写体识别方法 | |
US8934716B2 (en) | Method and apparatus for sequencing off-line character from natural scene | |
Inkeaw et al. | Recognition-based character segmentation for multi-level writing style | |
WO2023272994A1 (zh) | 基于深度学习网络的行人重识别方法、装置、设备及介质 | |
CN107533671B (zh) | 模式识别装置、模式识别方法以及记录介质 | |
WO2021131324A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2006260311A (ja) | マッチング方法およびマッチング装置ならびにプログラム | |
CN111475648A (zh) | 一种文本分类模型生成方法、文本分类方法及装置、设备 | |
KR20210137808A (ko) | 단어 추출 장치 및 방법 | |
Uzair et al. | Electronet: An enhanced model for small-scale object detection in electrical schematic diagrams | |
Das et al. | Handwritten word spotting in Indic scripts using foreground and background information | |
JP5841418B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN116958981B (zh) | 一种文字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130401 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |