JP5251205B2 - 住所認識装置 - Google Patents

住所認識装置 Download PDF

Info

Publication number
JP5251205B2
JP5251205B2 JP2008084615A JP2008084615A JP5251205B2 JP 5251205 B2 JP5251205 B2 JP 5251205B2 JP 2008084615 A JP2008084615 A JP 2008084615A JP 2008084615 A JP2008084615 A JP 2008084615A JP 5251205 B2 JP5251205 B2 JP 5251205B2
Authority
JP
Japan
Prior art keywords
address
character
recognition
candidate
place name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008084615A
Other languages
English (en)
Other versions
JP2008243208A (ja
Inventor
開竹 黄
俊 孫
悦伸 堀田
克仁 藤本
聡 直井
▲ちょん▼ 龍
麗 庄
小燕 朱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2008243208A publication Critical patent/JP2008243208A/ja
Application granted granted Critical
Publication of JP5251205B2 publication Critical patent/JP5251205B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は住所認識装置に関する。より詳しくは、任意な間隔である領域内の手書き文字による住所を認識する住所認識装置に関する。
従来、手書きによる住所を認識する方法は大別すると2種類ある。
1つ目の従来の方法では、まず、入力住所画像から単一文字の領域(即ち1文字しか含まない領域)を抽出し、これら単一文字の領域からキー文字(手書きによる住所を認識する場合に、キー文字とは行政地域を認識できる単一文字を示す。例えば、
[文字1]
Figure 0005251205
等)を抽出し、2つの隣接するキー文字で限定された地名区域を検出する。本方法では、地名区域内の地名を認識するために、この地名区域を個別の文字に分割し、次にそれら個別の文字を一つずつ認識する。
ところで、このような従来の住所認識方法では、住所を個別の文字に分割する時に間違いが発生し易いという欠点がある。特に、任意な間隔である領域内の住所同士が互いに密に繋がっている場合に、より間違い易くなる。また、一般的に、手書き文字はあまり模範となるものではなく、形態もそれぞれ異なっているので、このように密に繋がっているケースはよく見られる。
2つ目の従来の方法においても、まず、文字の一部を抽出し、2つの隣接するキー文字で限定された地名区域を検出する。なお、地名区域内の地名を全体として認識するというのが一つ目の方法と異なる点である。例えば、入力住所画像の実際の住所が「
[文字2]
Figure 0005251205
」とすると、まず、「市」と「区」と「路」というようなキー文字が抽出され認識される。次に、それらキー文字の間の画像(または一つ目のキー文字の直前の画像)が切り取られる。即ち、「北京」、「
[文字3]
Figure 0005251205
」、「
[文字4]
Figure 0005251205
」に対応する画像が切り取られる。そして、それらの画像が全体として認識される。
特開平11−272803号公報
このような従来の方法の主な問題点は、実際の住所においてキー文字がよく省略されることである。例えば、住所である
[文字2]
Figure 0005251205
では、「市」または「区」が省略されてもよく、かつ住所への解読にも影響を与えない。この場合、全体認識による方法であれば、認識に成功しない可能性がある。地名区域、即ちキー文字の間の画像領域が特定できないからである。
本発明は上記課題に鑑みてなされたものである。本発明は、一つ以上の従来技術の問題点を解決するために、住所を認識する住所認識装置を提供することを目的とする。
本発明の目的を達成するために、住所認識装置を提供しており、前記装置は下記の手段を含む:入力された住所画像にキー文字が欠如しているか否かを判定するキー文字欠如判定手段、前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していないと判定した場合、前記キー文字の間に位置する住所区域を全体認識する住所全体認識手段、及び、各単一文字領域候補を認識して、認識候補文字列を取得する認識候補文字列取得手段と、住所辞書における住所を前記認識候補文字列と照合して、認識距離を基に前記認識候補文字列を絞り込み、前の第k−1層の住所が決定された後、地名Tiの出現確率を算出して、算出された出現確率に地名Tiに認識された地名の信頼度を乗算し、それらの積が最も大きい地名Tiを第k層の地名候補に決定する(ここで、iは1以上の整数で、Tiは第k層の地名候補のうち第i個の候補を表す)ことにより前記第k層の地名候補を判定する照合手段とを有し、前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していると判定された場合、前記認識候補文字列取得手段と前記照合手段により前記入力された住所画像に関して住所を語彙別に認識する住所語彙別認識手段。
また、文字画像における単一文字の領域を判定する装置を提供しており、前記装置は下記の手段を含む:前記文字画像を連結領域に分割する連結領域分割手段、及び、各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域の幅が閾値より大きいか否かを判定し、閾値より大きい各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域を単一文字領域候補として判定する単一文字領域候補判定手段。
また、住所画像における住所を認識する装置を提供しており、前記装置は下記の手段を含む:前記住所画像における各単一文字領域候補を認識して文字認識候補を取得する単一文字認識手段、前記単一文字領域候補における全ての文字認識候補からなる認識候補文字列を取得する認識候補文字列取得手段、及び、住所辞書における住所を前記認識候補文字列に照合して、認識距離の最も小さい住所を認識結果として認識する照合手段。
この装置では、文字を分割するにあたって、各連結ユニット、隣接する各2つの連結ユニット及び隣接する各3つの連結ユニットが共に可能な文字領域として個別に認識される。
語彙チャート検索による方法では、得られた認識序列候補から最適な認識住所を検索する。複数の連結ユニットの組み合わせを利用することにより、システムのロバスト性を向上でき、それによって、正確な文字が抜けるリスクを低減して、住所認識の正確度を向上することができる。
また、この装置では、キー文字がある及びキー文字がない住所を効果的に認識できる。
また、語彙チャート検索による地名照合方法では、語彙チャートに重みを付与する検索方法が適用されている。一般には、キー文字は普通の文字と比べてより多くの情報を提供できる。キー文字がある場合に、この方法では、キー文字の作用がより際立っている。換言すると、キー文字を含む地名に重みを大きく与える。
また、中国語による住所では、ランクの低い地名には普通ではキー文字が省かれない。例えば、
[文字2]
Figure 0005251205
という地名では、「市」及び「区」が省かれる可能性があるが、「路」は一般には省かれない。重み付け有りのキー文字を考慮すると、住所認識の効果及び正確率を向上することができる。
以上の全般的な説明及び以下の詳細な説明は共に本発明を説明するための例示であり、かつ本発明をさらに説明するものである。以下、図面を参照しながら本発明による住所認識装置及び方法を詳しく説明する。図面では、共通の符号は共通または類似する部分を示す。
図1は、本発明の一実施例による住所認識装置のブロック図である。図1に示すように、本発明による住所認識装置は、キー文字欠如判定手段11と、住所全体認識手段12と、判定手段13と、住所語彙別認識手段14とを備える。
図2は、本発明の一実施例による住所認識方法を示すフローチャートである。図2に示すように、ステップS201で、キー文字欠如判定手段11によって入力された住所画像を可能な単一文字の領域に分割すると共に、キー文字が欠如するか否かの判定を行う。
キー文字が欠如しないと判定した場合に(ステップS202がYES)、ステップS203で、住所全体認識手段12は住所に関して全体認識を行う。次に、ステップS204で、判定手段13は住所全体認識手段12によりステップS203で出力された住所の照合距離が所定の閾値を越えたか否かを判定する。
所定の閾値を越えていなければ、住所全体認識手段による認識結果は信頼できることを意味しており、この結果を最終の認識結果として出力する。この照合距離がこの閾値を越えれば、住所全体認識手段による認識結果は信頼できず、入力された住所画像にキー文字が欠如する可能性が高いことを意味するので、処理がステップS205に移行し、住所語彙別認識手段14で認識を行う。
住所全体認識手段12は住所に関して全体認識を行う場合に、まず、単一文字領域候補からキー文字を抽出し、次にキー文字の間に位置する地名区域を抽出して、住所に関して全体認識を行う。全体認識による方法及びそのステップについては、中国特許出願第200510089537.0号に詳しく記載されている。現在、当該出願は本明細書に引用されて、本明細書で完全に記載されたと見なされる。
簡単に言うと、前記住所全体認識ステップは、前記住所区域に係わる特徴ベクトルを抽出する抽出ステップと、抽出された特徴ベクトルを地名辞書における地名に係わる特徴ベクトルと照合して、可能な全ての地名候補を求める照合ステップとを含む。
実際には、前記地名辞書における地名に係わる特徴ベクトルと抽出された特徴ベクトルとの照合距離が所定の閾値より小さければ、この地名を可能な地名候補と判定する。一方、前記照合ステップで可能な地名候補が複数取得されると、所定のルールに従って前記可能な複数の地名候補を選定する。
入力住所画像にキー文字が欠如すると、全体認識による出力結果が正しくないことになる。この場合、その照合距離も大きい。従って、判定手段13は住所全体認識手段による全体認識の結果を評価する。判定手段13を設置することにより、本発明による住所認識方法の信頼性を更に向上して、キー文字欠如判定手段11の誤判定による影響を避けられる。
以下、図3−1から図3−4を参照してキー文字欠如判定手段11及びステップS201の動作を説明する。図3−1から図3−4は、本発明のキー文字欠如判定手段11による単一文字領域候補の分割を説明する例(1)から(4)である。
本発明によるキー文字欠如判定手段11は、まず単一文字領域候補を分割する。具体的には、まず、画像から連結領域を分割して、次に連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かを判定する。
図3−1から図3−4では、入力された住所を「河北...」と仮定する。例示として、「河北」の画像のみについて説明する。図3−1に示すように、まず、画像から連結領域であるA、B、C、Dを取得する。そのうち、Aは2つの連結領域を組合わせてなるものである。連結領域は画像の前景色(通常は黒色である)の画素ドットの集合であり、この集合において、如何なる2つの画素ドットも当該集合内の画素を通して連結することができる。
連結領域を検出する具体的な方法については、連結領域検出アルゴリズム(Hypermedia Image Processing Reference, Bob Fisher, Simon Perkins, Ashley Walker and Erik Wolfart, Department of Artificial Intelligence University of Edinburgh, UK. http://www.cee.hw.ac.uk/hipr/html/label.htmlを参照)が報告されており、連結領域の合併については、米国特許第6535619B1号明細書の図11A、11B、11C及びその記載を参照すれば理解できる。ここでは、説明を省略する。
中国語漢字では、横方向に多くとも3つの独立な構成しか有り得ないことを考慮する。例えば、「
[文字5]
Figure 0005251205
」は「木」と「又」と「寸」から構成される。図3−2に示すように、隣接する2つの連結領域は単一文字領域候補として組合わせられ、即ち、AB、BC、CDとなる。図3−3に示すように、隣接する3つの連結領域も単一文字領域候補として組合わせられ、即ち、ABC、BCDとなる。以上の連結領域の組み合わせにおいて、組合わせられた連結領域の幅がある所定の閾値Thcより大きくなると、連結領域の組み合わせは行わない。
一実施例では、Thcを推定する場合に、まず、全ての連結領域から平均高さを取得し、それをThhとする。中国語漢字としては、漢字の平均幅と高さとの比は一般には安定な範囲内に入っているので、ThcはThh×cofに設定される。ただし、cofは通常2〜3をとる。
図3−4に示すように、BCDの幅はThcより大きく、即ちWidth(BCD)>Thcである。従って、BCDは単一文字領域の候補として判定されない。そこで、最終的な単一文字領域候補はA、B、C、Dと、AB、BC、CD及びABCとなる。
単一文字領域候補が決定された後、決定された単一文字領域候補における単一文字がキー文字であるか否かを判定する。前記単一文字領域候補における単一文字をキー文字辞書におけるキー文字と比較して、キー文字であるか否かを判定する。
一実施例では、前記単一文字とキー文字辞書におけるキー文字との照合距離が所定の閾値より小さければ、キー文字と判定する。一実施例では、前記入力された画像にキー文字があると判定したら、更に認識されたキー文字で形成された経路が適正であるか否かを判定する。
例えば、「省・・・市」は適正で、「市・・・省」は不適正である。本発明の一実施例では、前記キー文字辞書手段に保存された可能なキー文字は、「
[文字6]
Figure 0005251205
」という中国語漢字の文字のみが含まれている。
キー文字があると判定したら、上述したように、ステップS203で全体認識を行う。キー文字がないまたはキー文字の経路が所定のルールに合致しない(ある実施例の場合)と判定したら、ステップS205で住所語彙別認識を行う。
図4は、本発明の実施例による住所語彙別認識手段(語彙チャート検索認識手段)13のブロック図である。図4に示すように、一実施例では、本発明の住所語彙別認識手段13は、住所語彙チャート記憶手段302、単一文字認識手段301、候補文字列取得手段303、語彙モデル照合手段304を備える。
住所語彙別認識手段13では、まず、入力された単一文字領域候補に関して単一文字を認識すると、単一文字領域候補毎に長さがN個の認識候補を取得し、候補文字列取得手段303によって全ての単一文字領域候補における認識候補を単に並べることにより、一つの認識候補文字列を取得する。
照合手段では、住所語彙チャート記憶手段302に記憶された地名(例えば、北京または北京市、
[文字7]
Figure 0005251205
または
[文字7]
Figure 0005251205
市、湖北または湖北省等)を、この認識候補文字列と照合することにより、認識距離が最も小さい住所列を認識結果として算出する。
詳しく言えば、図4の単一文字認識手段301は単一文字領域候補を認識するものである。単一文字認識手段301は各単一文字領域候補を認識することで文字認識候補を取得する。
この場合、単一文字領域候補は前述の各連結領域と隣接する各2つ及び3つの連結領域であり、また所定のいずれかの分類方法(例えば、テンプレートマッチング、二次判別分析(Quadratic Discriminant Analysis)、サポートベクターマシン(Support Vector Machine: SVM)等)により前記各連結領域を分類し認識する。
全ての単一文字領域候補の認識候補は、一つのアレイ(認識候補文字列)として組合わせられる。このような組み合わせは候補文字列取得手段303により行われる。照合手段304では、住所語彙チャート記憶手段302に記憶された地名(例えば、北京または北京市、
[文字7]
Figure 0005251205
または
[文字7]
Figure 0005251205
市、湖北または湖北省等)を、この認識候補文字列と照合することにより、認識距離が最も小さい住所列を認識結果として算出する。
図5は、本発明のツリー構成による住所の語彙チャートの説明図である。図5では、地名はその所属関係に基づきツリー構成に形成されている。E0はルートノードを示し、第1層の住所、即ち直轄市または省レベルの住所に繋がっている、例えば、E11は北京市を、E12は
[文字7]
Figure 0005251205
市を、E13は湖北省をそれぞれ示している。
キー文字の抜けた住所を効果的に認識するために、この語彙チャートのツリー構成における各ノードには、キー文字のある地名だけでなく、キー文字のない地名も記憶されている。
例えば、E11では、北京と北京市とは共にノードに記憶されている。所属関係により、中国語住所としては多くとも四層構成しか含まれていない。例えば、E13(湖北省)−E23(
[文字8]
Figure 0005251205
)−E33(沙市区)−E41(
[文字9]
Figure 0005251205
)である。
図6は、本発明の照合手段304の動作フローチャートである。図6に示すように、ステップS1ではデータが読み込まれる。即ち、各単一文字領域候補を認識して認識候補文字列を取得する。
仮に、単一文字候補を合計m個として、かつ{A、A、・・・、A}と表し、各領域候補Aを認識してn個の候補を取得して、それをCij(0<i<m、0<j<n+1、ただし、i、jは共に正整数である)で表すと、各認識候補の認識距離はDist(Cij)で記述される。各候補が認識距離の小さい順で並べられる、即ち、j>kとすれば、Dist(Cij)>Dist(Cik)となる。
ステップS2では、次のルールで文字候補の数を減らす:
ルール1:
Dist(Ciq)>Thr1とすれば、Ciq、Ci(q+1)、・・・、Cinを候補文字列から削除する。
ルール2:
[Dist(Ciq)−Dist(Cil)]/Dist(Cil)>Thr2とすれば、Ciq、Ci(q+1)、・・・、Cinを候補文字列から削除する。
認識候補は絶対距離が大きければ大きいほど、該当候補は正確な単一文字認識結果となる可能性が低くなるので、ルール1は絶対距離が大きい認識候補を除去するものである。同様な理由により、ルール2は、第1の認識候補との相対値により正確の認識結果となる可能性が低い単一文字候補を除去するものである。ルール1及びルール2によれば、候補の数を減らすことができるので、システムの検索速度及び認識精度を向上することができる。
ステップS3において、認識候補文字列に対して第1層の住所を抜かないで照合を実施する。即ち、まず、住所語彙チャート記憶手段302の全ての第1層の住所(T1、T2、T3、・・・、Tk)を、先頭にあるいくつかの単一文字領域候補における認識候補と照合することで、地名候補X1を取得する。詳しく言えば、この語彙候補X1は次の式により得られる。
Figure 0005251205
ここで、P(Ti)は地名Tiが出現した確率であり、多量の住所語彙ライブラリからTiの出現頻度を算出して得られる。
CF(Ti)は複数の単一文字領域候補がTiと認識された信頼度であり、次のようにして算出される。
仮にTi={Ti1,Ti2,・・・,Tip}とすると、ここで、Tij(0<j<p+1、かつjは正整数である)は地名Tiにおける第j個の文字を表す。
例えば、Ti=北京市の場合、Ti1=北、Ti2=京、Ti3=市、となる。また、仮に単一文字領域Aw1、Aw2、AwpにTが照合されると、{Cwk1,Cwk2,・・・・,Cwkl}はAwkを認識して得たl個の候補である。文字TikとAwjとの類似度Sim(Tik,Awj)を次のように定義する。
Figure 0005251205
上記の定義では、文字TikがAwjの認識候補文字列に含まれれば、Awjは文字Tikである可能性がある。同時に、Awjが文字Tikに認識される距離は小さければ小さいほど、Awjが文字Tikに認識される可能性は高くなって、Sim(Tik,Awj)は大きくなるべきであり、それも上記の式(1)で表す意味である。文字TikがAwjの認識候補文字列に含まれなければ、文字TikとAwjとの類似度はとても小さいので、Sim(Tik,Awj)に非常に小さい値δを付与する。それも上記の式(2)で表す意味である。最後に、CF(Ti)は次のように定義される。
Figure 0005251205
Figure 0005251205
ここで、wkは1より大きい定数で、wcは1より小さい定数である。
式(3)では、当該地名Tiの信頼度は、そのうちの各文字Tiaと文字画像の類似度との積の重みとして定義された。同時に、Tiの最終の文字はキー文字であり、かつ当該キー文字が文字画像の認識候補に現れたら、この文字図形候補は正確な地名である可能性が高いことを意味しており、従って、値の大きい重みwkを付与する。そうでなければ、値の小さい重みwcを付与する。ここで言う「大きい」及び「小さい」はそれぞれ、ある所定の値より「大きい」及び「小さい」と理解できる。
第1層の地名が照合されると、第2層の地名照合を確定する。これに準じて類推して、第2層の地名の照合を終えると、照合が完了するまで、次の層の地名の照合を実施する。第k層の地名Xは次の式により得られる。
Figure 0005251205
ここで、P(Ti|X...Xk−1)はその前の第k-1層の住所が決定された後、地名Tiが出現した確率を表す。その値は次のように定義される。
Figure 0005251205
ここで、fTiはTiが語彙ライブラリに出現した頻度である。信頼度であるCF(Ti)は式(3)により算出して得られる。
即ち、前記照合では、前記第k層の地名候補は次のように特定される。直前の第k-1層の住所が決定された後、地名Tiの出現した確率を算出して、算出された確率に地名画像がその地名Tiと認識された信頼度を乗算して、それらの積が最も大きい地名Tiを第k層の地名候補に決定する、ここで、iは1以上の整数で、Tiは第k層の地名候補のうちの第i個の候補を表す。
前記地名の信頼度は、地名画像と認識された前記地名Tiとの類似度の重みである。地名Tiにおける最後の認識領域候補はキー文字と認識されれば、前記類似度に大きい重みをかける。地名Tiにおける最後の認識領域候補はキー文字と認識されなければ、前記類似度に小さい重みをかける。
ステップS4では、第1層の住所を抜いた照合S3の結果が十分良いか否かを判定する。詳しく言えば、第1層の住所を抜いた照合の結果はX...X、E=logP(Xa|X...Xa−1)+logCF(Xa)、a=1,...,kとすると、
Figure 0005251205
となる。ここで、Thは所定の閾値である。
Figure 0005251205
の場合、照合の結果であるX...Xの総合信頼性は高いことを示している。従って、この照合の結果を最終の認識結果として認める。
Figure 0005251205
の場合、照合の結果であるX...Xの総合信頼性は低いことを示している。従って、この照合の結果には第1層の住所が含まれない可能性がある。
例えば、「
[文字10]
Figure 0005251205
」の場合では、「湖北省」が抜けた可能性がある。そこで、ステップS5では、住所を抜いた照合を行い、まず第1層の住所を抜いた照合を実施する。
第1層の住所を抜いた照合S5では、住所語彙チャート記憶手段302の第2層の住所から文字領域候補の認識候補文字列との照合を開始するが、その照合の動作はS3とほぼ同じである。異なるのは、第1層の住所から始まるのではない点にのみにある。このステップでも照合の総合信頼性を示す
Figure 0005251205
が得られる。
ステップS6では、住所を抜いた照合の総合信頼性と住所を抜かない照合の総合信頼性を比較し、そのうちの信頼性が高いほうを最終の認識結果とする。
入力住所に第1層の住所が含まれる場合、S3-S4-S5-S6で第1層の住所を抜かない照合と第1層の住所を抜いた照合を区分する方法によれば、S3では、第1層の住所を抜いた照合をせずに認識結果を直接出力できるので、システムの効率及び精度を向上することができる。
以上の説明では、実情に応じて上記の構成を活用するように留意すること。例えば、入力住所に第1、第2層の住所が共に抜けているケースが頻繁に発生する場合では、上記のブロック図を参考して、住所欠如照合ステップにおいて第1、第2層の住所を抜いた照合ステップを実施しても良い。それによって、システムの効率及び精度を向上するという効果を達成する。
図7は、本発明の一実施例による照合手段の構成図である。図7に示すように、本発明の一実施例による照合手段304は、前記の住所を抜かない照合を行う。即ち、所属関係に従って住所辞書内の住所を認識候補文字列と層ずつに順次比較する住所非欠如照合手段701と、前記住所非欠如照合手段701による照合結果が十分良いか否かを判定する判定手段702と、前記判定手段により前記照合結果が十分良くないと判定された場合に、住所を抜いた照合、即ち、所属関係において、所属関係のうちの第2層または第3層から所属関係の最終層まで高い順に照合を順次行う住所欠如照合手段703と、前記住所非欠如照合手段701と住所欠如照合手段703によるそれぞれの照合結果から良い方を選択する決定手段704とを備える。
上述したように、本発明は下記の住所認識装置(または方法)を提供しており、前記装置(または方法)は下記の手段(またはステップ)を含む:入力された住所画像にキー文字が欠如しているか否かを判定するキー文字欠如判定手段(ステップ)、前記キー文字欠如判定手段(ステップ)により前記入力された住所画像にキー文字が欠如していないと判定された場合、前記キー文字の間に位置する住所区域を全体認識する住所全体認識手段(ステップ)、及び、前記キー文字欠如判定手段(ステップ)により前記入力された住所画像にキー文字が欠如していると判定された場合、前記入力された住所画像に関して住所を語彙別に認識する住所語彙別認識手段(ステップ)。
本発明は更に文字画像における単一文字の領域を特定する装置(方法)を提供しており、前記装置(方法)は下記の手段(ステップ)を含む:前記文字画像を連結領域に分割する連結領域分割手段(ステップ)、及び、各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域の幅が閾値より小さいか否かを判定し、前記閾値より小さい各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域を単一文字領域候補として判定する単一文字領域候補判定手段(ステップ)。
一実施例では、前記装置(方法)は下記の手段(ステップ)を含む:前記住所全体認識手段(ステップ)により認識された住所の信頼性を判定する信頼性判定手段(ステップ)。ここで、前記信頼性判定手段(ステップ)は前記住所全体認識手段(ステップ)により認識された住所が信頼できないと判定した場合、前記住所語彙別認識手段(ステップ)により前記入力された住所画像に対して住所を語彙別に認識する。
一実施例では、前記住所全体認識手段(ステップ)により認識された住所の照合距離が所定の閾値より大きい場合、前記信頼性判定手段(ステップ)は前記住所全体認識手段(ステップ)により認識された住所が信頼できないものと判定する。
一実施例では、前記キー文字欠如判定手段(ステップ)は下記の手段(ステップ)を含む:前記入力された住所画像における単一文字候補を抽出する単一文字抽出手段(ステップ)、抽出された各単一文字候補をキー文字辞書におけるキー文字とそれぞれ比較する比較手段(ステップ)、及び、前記各単一文字候補と前記キー文字辞書における全てのキー文字との照合距離が共に所定の閾値より大きい場合、或いは照合距離が所定の閾値より小さい前記単一文字候補はあるものの、適正なキー文字の順序を有するものではない場合に、前記入力された住所画像にキー文字が欠如していると判定するキー文字判定手段(ステップ)。
一実施例では、前記単一文字抽出手段(ステップ)は下記の手段(ステップ)を含む:画像から連結領域を分割する連結領域分割手段(ステップ)、各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かを判定する単一文字領域候補判定手段(ステップ)、及び、決定された単一文字領域候補に関して文字を抽出する文字抽出手段(ステップ)。
一実施例では、前記単一文字領域候補判定手段(ステップ)は、各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域の幅が所定の閾値より大きいか否かを判定することにより、前記各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かをそれぞれ判定する。
一実施例では、前記文字全体認識手段(ステップ)は下記の手段(ステップ)を含む:前記住所区域に係わる特徴ベクトルを抽出する抽出手段(ステップ)、及び、抽出された特徴ベクトルを地名辞書における地名に係わる特徴ベクトルと照合して、可能な全ての地名候補を求める照合手段(ステップ)。
一実施例では、前記住所語彙別認識手段(ステップ)は下記の手段(ステップ)を含む:単一文字認識領域における単一文字候補からなる認識候補文字列を取得する認識候補文字列取得手段(ステップ)、及び、住所辞書における住所を前記認識候補文字列と照合して、認識距離の最も小さい住所を認識結果として認識する照合手段(ステップ)。
一実施例では、前記照合手段(ステップ)は、住所を抜かない照合を行う、即ち、所属関係に従って住所辞書における住所を前記認識候補文字列と層毎に順次照合する住所非欠如照合手段(ステップ)を含む。
一実施例では、前記照合手段(ステップ)は更に下記の手段(ステップ)を含む:
前記住所非欠如照合手段(ステップ)により決定された住所が信頼できるか否かを判定する判定手段(ステップ)、前記判定手段(ステップ)は前記住所非欠如照合手段(ステップ)により決定された住所が信頼できないと判定した場合に、住所を抜いた照合、即ち、所属関係において、所属関係のうちの第2層または第3層から所属関係の最終層まで高い順に照合を順次行う住所欠如照合手段(ステップ)、及び、前記住所非欠如照合手段(ステップ)による結果の信頼性と前記住所欠如照合手段(ステップ)による結果の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段(ステップ)。
一実施例では、前記照合手段(ステップ)では、前記第k層の地名候補は次のように特定される:直前の第k-1層の住所が決定された後、地名Tiの出現した確率を算出して、算出された確率に地名画像がこの地名Tiと認識された信頼度を乗算して、それらの積が最も大きい地名Tiを第k層の地名候補に決定する、ここで、iは1以上の整数で、Tiは第k層の地名候補のうちの第i個の候補を表す。
一実施例では、前記地名の信頼度は、地名画像と認識された前記地名Tiとの類似度の重みであり、地名Tiにおける最後の認識領域候補がキー文字に認識されれば、前記類似度に大きい重みをかけ、地名Tiにおける最後の認識領域候補がキー文字に認識されなければ、前記類似度に小さい重みをかける。
一実施例では、前記住所語彙別認識手段(ステップ)は更に、前記候補文字列における単一文字候補を減らす文字候補減少手段(ステップ)を含む。
一実施例では、前記文字候補減少手段(ステップ)は、(1)単一文字候補は、絶対認識距離が第1の閾値より大きければ、それを前記候補文字列から削除する、(2)単一文字候補は、相対認識距離が第2の閾値より大きければ、それを前記候補文字列から削除する、というルールのいずれかに従って単一文字候補を減らす。
また、本発明はコンピュータプログラムを提供しており、このコンピュータプログラムがコンピュータで実行されるときに、特許請求の範囲のうちの独立請求項及び従属請求項に記載の住所認識方法及びその各構成手段をコンピュータにて実現させる。本発明は更に前記プログラムを記憶したコンピュータ読取り可能な記憶媒体を提供している。
また、本発明はコンピュータプログラムを提供しており、このコンピュータプログラムがコンピュータで実行されるときに、特許請求の範囲のうちの独立請求項及び従属請求項に記載の住所認識装置及びその各構成手段をコンピュータに実現させる。本発明は更に前記プログラムを記憶したコンピュータ読取り可能な記憶媒体を提供している。
また、本発明はコンピュータプログラムを提供しており、このコンピュータプログラムがコンピュータで実行されるときに、特許請求の範囲のうちの独立請求項及び従属請求項に記載の文字画像における単一文字の領域を特定する方法及びその各構成手段をコンピュータに実現させる。本発明は更に前記プログラムを記憶したコンピュータ読取り可能な記憶媒体を提供している。
また、本発明はコンピュータプログラムを提供しており、このコンピュータプログラムがコンピュータで実行されるときに、特許請求の範囲のうちの独立請求項及び従属請求項に記載の文字画像における単一文字の領域を特定する装置及びその各構成手段をコンピュータに実現させる。本発明は更に前記プログラムを記憶したコンピュータ読取り可能な記憶媒体を提供している。
また、本発明はコンピュータプログラムを提供しており、このコンピュータプログラムがコンピュータで実行されるときに、特許請求の範囲のうちの独立請求項及び従属請求項に記載の住所画像における住所を認識する方法及びその各構成手段をコンピュータに実現させる。本発明は更に前記プログラムを記憶したコンピュータ読取り可能な記憶媒体を提供している。
また、本発明はコンピュータプログラムを提供しており、このコンピュータプログラムがコンピュータで実行されるときに、特許請求の範囲のうちの独立請求項及び従属請求項に記載の住所画像における住所を認識する装置及びその各構成手段をコンピュータに実現させる。本発明は更に前記プログラムを記憶したコンピュータ読取り可能な記憶媒体を提供している。
前記コンピュータ読取り可能な記憶媒体は、ハードディスク、フラッシュメモリ、フレキシブルディスク、磁気ディスク、DVD、VCD、CD、Flash ROM、ROM、RAM等のように、当業者の周知した、コンピュータ実行可能なコマンドまたはコンピュータプログラムを記憶したあらゆる記憶媒体である。
以上の記載は本発明の実施例を例示的に説明するものであり、排他的なものではなく、本発明を上記開示した確定的な形態に限定するものでもない。明らかなことながら、当業者は様々な変更や変形を行えるのは自明なことである。以上の実施例を選択して説明したのは、本発明の原理及びその実際な適用をよりよく説明するためである。それによって、当業者は様々の実施例に適用される本発明及び本発明を特別な用途に適用するための変形を理解できる。
例えば、本発明を手書きによる日本語や韓国語地名の認識に適用することもできる。更に、本明細書では照合距離を用いて類似度を判定したが、類似度を判定するには照合距離以外の方法を用いても良い。例えば、特徴ベクトル同士によるコサイン角度、特徴ベクトル同士による街区距離などをを用いてもよく、従って、本発明の照合距離は幅広く解釈されるはずであり、当業者が思い付けられる類似度の定量表現と理解されること。
また、図面は本発明をよりよく理解するためになされたものであり、かつ明細書に組み込まれて明細書の一部を構成して、本発明の実施例を説明するものであり、明細書と共に本発明の原理を解釈するのに用いられている。
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)入力された住所画像にキー文字が欠如しているか否かを判定するキー文字欠如判定手段と、
前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していないと判定された場合、前記キー文字の間に位置する住所区域を全体認識する住所全体認識手段と、
前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していると判定された場合、前記入力された住所画像に関して住所を語彙別に認識する住所語彙別認識手段と、
前記住所全体認識手段により認識された住所の信頼性を判定する信頼性判定手段と、
を備え、
前記信頼性判定手段は前記住所全体認識手段により認識された住所が信頼できないと判定した場合、前記住所語彙別認識手段は前記入力された住所画像に対して住所を語彙別に認識することを特徴とする住所認識装置。
(付記2)前記住所全体認識手段により認識された住所の照合距離が所定の閾値より大きい場合、前記信頼性判定手段は前記住所全体認識手段により認識された住所が信頼できないものと判定することを特徴とする付記1に記載の住所認識装置。
(付記3)前記キー文字欠如判定手段は、
前記入力された住所画像における単一文字候補を抽出する単一文字抽出手段と、
抽出された各単一文字候補をキー文字辞書におけるキー文字とそれぞれ比較する比較手段と、
抽出された前記単一文字候補のそれぞれと前記キー文字辞書における全部のキー文字との照合距離が所定の閾値より大きい場合、或いは照合距離が所定の閾値より小さい前記単一文字候補はあるものの、適正なキー文字の順序がない場合に、前記入力された住所画像にキー文字が欠如していると判定するキー文字判定手段と
を備えたことを特徴とする付記1に記載の住所認識装置。
(付記4)前記単一文字抽出手段は、
画像から連結領域を分割する連結領域分割手段と、
各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かを判定する単一文字領域候補判定手段と、
単一文字領域候補判定手段により判定された単一文字領域候補に関して文字を抽出する文字抽出手段と
を備えたことを特徴とする付記3に記載の住所認識装置。
(付記5)前記単一文字領域候補判定手段は、各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域の幅が所定の閾値より大きいか否かを判定することにより、前記各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かをそれぞれ判定することを特徴とする付記4に記載の住所認識装置。
(付記6)前記住所全体認識手段は、
前記住所区域に係わる特徴ベクトルを抽出する抽出手段と、
前記抽出手段により抽出された特徴ベクトルを地名辞書における地名に係わる特徴ベクトルと照合して、可能な全ての地名候補を求める照合手段と
を備えたことを特徴とする付記1に記載の住所認識装置。
(付記7)前記住所語彙別認識手段は、
各単一文字領域候補を認識して、認識候補文字列を取得する認識候補文字列取得手段と、
住所辞書における住所を前記認識候補文字列と照合して、認識距離の最も小さい住所を認識結果とする照合手段と
を備えたことを特徴とする付記1に記載の住所認識装置。
(付記8)前記照合手段は、
住所非欠如照合を行う、即ち、所属関係に従って住所辞書における住所を前記認識候補文字列と一層ずつ照合する住所非欠如照合手段、
を備えたことを特徴とする付記7に記載の住所認識装置。
(付記9)前記照合手段は更に、
前記住所非欠如照合手段により決定された住所は信頼できるか否かを判定する判定手段と、
前記判定手段は前記住所非欠如照合手段により決定された住所が信頼できないと判定された場合に、住所欠如照合を行う、即ち、所属関係のうちの第2層または第3層から所属関係の最終層まで所属関係の層の高い順から照合を行う住所欠如照合手段と、
前記住所非欠如照合手段による結果の信頼性と前記住所欠如照合手段による結果の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段と
を備えたことを特徴とする付記8に記載の住所認識装置。
(付記10)前記照合手段は、前の第k−1層の住所が決定された後、地名Tiの出現確率を算出して、算出された出現確率に地名Tiに認識された地名の信頼度を乗算し、それらの積が最も大きい地名Tiを第k層の地名候補に決定する(ここで、iは1以上の整数で、Tiは第k層の地名候補のうち第i個の候補を表す)ことにより前記第k層の地名候補を判定することを特徴とする付記7に記載の住所認識装置。
(付記11)前記地名の信頼度は、地名画像と認識された前記地名Tiとの類似度の重みであり、地名Tiにおける最後の認識領域候補がキー文字に認識されれば、前記類似度に大きい重みをかけ、地名Tiにおける最後の認識領域候補がキー文字に認識されなければ、前記類似度に小さい重みをかけることを特徴とする付記10に記載の住所認識装置。
(付記12)前記住所語彙別認識手段は更に、前記認識候補文字列における単一文字候補を減らす文字候補減少手段を備えたことを特徴とする付記7に記載の住所認識装置。
(付記13)前記文字候補減少手段は、
(1)単一文字候補は、絶対認識距離が第1の閾値より大きければ、それを前記認識候補文字列から削除する、
(2)単一文字候補は、相対認識距離が第2の閾値より大きければ、それを前記認識候補文字列から削除する、
というルールのいずれかに従って単一文字候補を減らすことを特徴とする付記12に記載の住所認識装置。
(付記14)文字画像における単一文字の領域を判定する装置であって、
前記文字画像を連結領域に分割する連結領域分割手段と、
各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域の幅が閾値より小さいか否かを判定し、閾値より小さい各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域を単一文字領域候補として判定する単一文字領域候補判定手段と、
を備えたことを特徴とする装置。
(付記15)住所画像における住所を認識する装置であって、
前記住所画像における各単一文字領域候補を認識して文字認識候補を取得する単一文字認識手段と、
前記単一文字領域候補における全ての文字認識候補からなる認識候補文字列を取得する認識候補文字列取得手段と、
住所辞書における住所を前記認識候補文字列と照合して、認識距離の最も小さい住所を認識結果として認識する照合手段と、
を備えたことを特徴とする装置。
(付記16)前記照合手段は、住所非欠如照合を行う、即ち、所属関係に従って住所辞書における住所を前記認識候補文字列と一層ずつ照合する住所非欠如照合手段を備えたことを特徴とする付記15に記載の装置。
(付記17)前記照合手段は更に、
前記住所非欠如照合手段により決定された住所が信頼できるか否かを判定する判定手段と、
前記判定手段は前記住所非欠如照合手段により決定された住所が信頼できないと判定した場合に、住所非欠如照合を行う、即ち、所属関係のうちの第2層または第3層から所属関係の最終層まで所属関係の高い順に照合を行う住所欠如照合手段と、
前記住所非欠如照合手段による住所の信頼性と前記住所欠如照合手段による住所の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段と
を備えたことを特徴とする付記16に記載の装置。
(付記18)前記照合手段は、前のk−1層の住所が決定された後、地名Tiの出現確率を算出し、算出された出現確率に地名画像がこの地名Tiに認識された信頼度を乗算して、それらの積が最も大きい地名Tiを第k層の地名候補に決定する(ここで、iは1以上の整数で、Tiは第k層の地名候補のうち第i個の候補を表す)ことにより前記第k層の地名候補を判定することを特徴とする付記15に記載の装置。
(付記19)前記地名の信頼度は、地名画像と認識された前記地名Tiとの類似度の重みであり、地名Tiにおける最後の認識領域候補がキー文字として認識されれば、前記類似度に大きい重みをかけて、地名Tiにおける最後の認識領域候補がキー文字として認識されなければ、前記類似度に小さい重みをかけることを特徴とする付記18に記載の装置。
(付記20)前記認識候補文字列における単一文字候補を減らす文字候補減少手段を更に含むことを特徴とする付記15に記載の装置。
(付記21)前記文字候補減少手段は、
(1)単一文字候補は、絶対認識距離が第1の閾値より大きければ、それを前記認識候補文字列から削除する、
(2)単一文字候補は、相対認識距離が第2の閾値より大きければ、それを前記認識候補文字列から削除する、
というルールのいずれかに従って単一文字候補を減らすことを特徴とする付記20に記載の装置。
本発明の一実施例による住所認識装置のブロック図である。 本発明の一実施例による住所認識方法を示すフローチャートである。 本発明のキー文字欠如判定手段による単一文字領域候補の分割を説明する例(1)である。 本発明のキー文字欠如判定手段による単一文字領域候補の分割を説明する例(2)である。 本発明のキー文字欠如判定手段による単一文字領域候補の分割を説明する例(3)である。 本発明のキー文字欠如判定手段による単一文字領域候補の分割を説明する例(4)である。 本発明の実施例による住所語彙別認識手段のブロック図である。 本発明のツリー構成による住所の語彙チャートの説明図である。 本発明の語彙モデル照合手段の動作フローチャートである。 本発明の一実施例による住所認識装置の構成図である。
符号の説明
11 キー文字欠如判定手段
12 住所全体認識手段
13 判定手段
14 住所語彙別認識手段
301 単一文字認識手段
302 住所語彙チャート記憶手段
303 候補文字列取得手段
304 語彙モデル照合手段
701 住所非欠如照合手段
702 判定手段
703 住所欠如照合手段
704 決定手段

Claims (6)

  1. 入力された住所画像にキー文字が欠如しているか否かを判定するキー文字欠如判定手段と、
    前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していないと判定された場合、前記キー文字の間に位置する住所区域を全体認識する住所全体認識手段と、
    各単一文字領域候補を認識して、認識候補文字列を取得する認識候補文字列取得手段と、住所辞書における住所を前記認識候補文字列と照合して、認識距離を基に前記認識候補文字列を絞り込み、前の第k−1層の住所が決定された後、地名Tiの出現確率を算出して、算出された出現確率に地名Tiに認識された地名の信頼度を乗算し、それらの積が最も大きい地名Tiを第k層の地名候補に決定する(ここで、iは1以上の整数で、Tiは第k層の地名候補のうち第i個の候補を表す)ことにより前記第k層の地名候補を判定する照合手段とを有し、前記キー文字欠如判定手段により前記入力された住所画像にキー文字が欠如していると判定された場合、前記認識候補文字列取得手段と前記照合手段により前記入力された住所画像に関して住所を語彙別に認識する住所語彙別認識手段と、
    前記住所全体認識手段により認識された住所の信頼性を判定する信頼性判定手段と、
    を備え、
    前記信頼性判定手段前記住所全体認識手段により認識された住所が信頼できないと判定した場合、前記住所語彙別認識手段は前記入力された住所画像に対して住所を語彙別に認識することを特徴とする住所認識装置。
  2. 前記キー文字欠如判定手段は、
    前記入力された住所画像における単一文字候補を抽出する単一文字抽出手段と、
    抽出された各単一文字候補をキー文字辞書におけるキー文字とそれぞれ比較する比較手段と、
    抽出された前記単一文字候補のそれぞれと前記キー文字辞書における全部のキー文字との照合距離が所定の閾値より大きい場合、或いは照合距離が所定の閾値より小さい前記単一文字候補はあるものの、適正なキー文字の順序がない場合に、前記入力された住所画像にキー文字が欠如していると判定するキー文字判定手段と
    を備えたことを特徴とする請求項1に記載の住所認識装置。
  3. 前記単一文字抽出手段は、
    画像から連結領域を分割する連結領域分割手段と、
    各連結領域、隣接する各2つの連結領域及び隣接する各3つの連結領域が単一文字領域候補であるか否かを判定する単一文字領域候補判定手段と、
    単一文字領域候補判定手段により判定された単一文字領域候補に関して文字を抽出する文字抽出手段と
    を備えたことを特徴とする請求項2に記載の住所認識装置。
  4. 前記照合手段は、
    住所非欠如照合を行う、即ち、所属関係に従って住所辞書における住所を前記認識候補文字列と一層ずつ照合する住所非欠如照合手段、
    を備えたことを特徴とする請求項1に記載の住所認識装置。
  5. 前記地名の信頼度は、地名画像と認識された前記地名Tiとの類似度の重みであり、地名Tiにおける最後の認識領域候補がキー文字に認識されれば、前記類似度に大きい重みをかけ、地名Tiにおける最後の認識領域候補がキー文字に認識されなければ、前記類似度に小さい重みをかけることを特徴とする請求項1に記載の住所認識装置。
  6. 前記照合手段は更に、
    前記住所非欠如照合手段により決定された住所は信頼できるか否かを判定する判定手段と、
    前記判定手段は前記住所非欠如照合手段により決定された住所が信頼できないと判定された場合に、住所欠如照合を行う、即ち、所属関係のうちの第2層または第3層から所属関係の最終層まで所属関係の層の高い順から照合を行う住所欠如照合手段と、
    前記住所非欠如照合手段による結果の信頼性と前記住所欠如照合手段による結果の信頼性を比較して、信頼性が高い方を照合結果とする信頼性比較手段と
    を備えたことを特徴とする請求項4に記載の住所認識装置。
JP2008084615A 2007-03-27 2008-03-27 住所認識装置 Expired - Fee Related JP5251205B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2007100915392A CN101276327B (zh) 2007-03-27 2007-03-27 地址识别装置
CN200710091539.2 2007-03-27

Publications (2)

Publication Number Publication Date
JP2008243208A JP2008243208A (ja) 2008-10-09
JP5251205B2 true JP5251205B2 (ja) 2013-07-31

Family

ID=39914393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008084615A Expired - Fee Related JP5251205B2 (ja) 2007-03-27 2008-03-27 住所認識装置

Country Status (2)

Country Link
JP (1) JP5251205B2 (ja)
CN (1) CN101276327B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120072013A1 (en) * 2010-09-16 2012-03-22 Kabushiki Kaisha Toshiba Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method
CN103186524B (zh) * 2011-12-30 2016-04-13 高德软件有限公司 一种地名识别方法和装置
CN103854021A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 词语识别方法及装置
CN103473289A (zh) * 2013-08-30 2013-12-25 深圳市华傲数据技术有限公司 一种通信地址补全的装置及方法
CN107430601B8 (zh) * 2014-11-14 2022-03-22 大众汽车(中国)投资有限公司 用于导航系统的控制方法和控制装置
CN104731976B (zh) * 2015-04-14 2018-03-30 海量云图(北京)数据技术有限公司 数据表中隐私数据的发现与分类方法
CN107133215A (zh) * 2017-05-20 2017-09-05 复旦大学 一种脱机手写中文规范地址识别方法
CN109013360A (zh) * 2018-07-09 2018-12-18 安徽云图信息技术有限公司 一种快递入库分拣管理系统
CN110334162B (zh) * 2019-05-09 2021-11-09 德邦物流股份有限公司 地址识别方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2635155B2 (ja) * 1989-03-20 1997-07-30 富士通株式会社 ベた書き住所認識装置
JPH07271920A (ja) * 1994-03-31 1995-10-20 Toshiba Corp 文字認識装置
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
JP2001283156A (ja) * 2000-03-31 2001-10-12 Glory Ltd 住所認識装置、住所認識方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002183119A (ja) * 2000-12-19 2002-06-28 Riso Kagaku Corp 宛名作成装置、宛名作成プログラム、及び宛名作成システム
JP4136316B2 (ja) * 2001-01-24 2008-08-20 富士通株式会社 文字列認識装置
CN1169073C (zh) * 2001-02-23 2004-09-29 无敌科技(西安)有限公司 图文编辑方法以及系统
JP2006031099A (ja) * 2004-07-12 2006-02-02 Fujitsu Ltd 文字認識をコンピュータに行なわせるためのコンピュータ実行可能なプログラム
CN100555308C (zh) * 2005-07-29 2009-10-28 富士通株式会社 地址识别装置和方法

Also Published As

Publication number Publication date
JP2008243208A (ja) 2008-10-09
CN101276327B (zh) 2010-06-23
CN101276327A (zh) 2008-10-01

Similar Documents

Publication Publication Date Title
JP5251205B2 (ja) 住所認識装置
US8180160B2 (en) Method for character recognition
KR101312804B1 (ko) 텍스트 인식을 용이하게 하는 시스템 및 텍스트 인식 방법
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
US9665768B2 (en) Process of handwriting recognition and related apparatus
US7596272B2 (en) Handling of diacritic points
US9711117B2 (en) Method and apparatus for recognising music symbols
JP5217127B2 (ja) 一括地名認識プログラム、一括地名認識装置および一括地名認識方法
CN110363049B (zh) 图形元素检测识别和类别确定的方法及装置
Kour et al. Real-time segmentation of on-line handwritten arabic script
WO2007082271A2 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
JP7268198B2 (ja) 画像解析装置、画像解析方法、及びプログラム
CN111695527A (zh) 一种蒙古文在线手写体识别方法
US8934716B2 (en) Method and apparatus for sequencing off-line character from natural scene
Inkeaw et al. Recognition-based character segmentation for multi-level writing style
WO2023272994A1 (zh) 基于深度学习网络的行人重识别方法、装置、设备及介质
CN107533671B (zh) 模式识别装置、模式识别方法以及记录介质
WO2021131324A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2006260311A (ja) マッチング方法およびマッチング装置ならびにプログラム
CN111475648A (zh) 一种文本分类模型生成方法、文本分类方法及装置、设备
KR20210137808A (ko) 단어 추출 장치 및 방법
Uzair et al. Electronet: An enhanced model for small-scale object detection in electrical schematic diagrams
Das et al. Handwritten word spotting in Indic scripts using foreground and background information
JP5841418B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN116958981B (zh) 一种文字识别方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees