JP3360030B2 - 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 - Google Patents
文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体Info
- Publication number
- JP3360030B2 JP3360030B2 JP22291398A JP22291398A JP3360030B2 JP 3360030 B2 JP3360030 B2 JP 3360030B2 JP 22291398 A JP22291398 A JP 22291398A JP 22291398 A JP22291398 A JP 22291398A JP 3360030 B2 JP3360030 B2 JP 3360030B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- string
- character string
- recognition result
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
【0001】
【発明の属する技術分野】本発明は、街中や駅の看板に
書かれている文字を認識し、看板広告主を特定するよう
にした、文字認識装置および文字認識方法および文字認
識方法をプログラムの形で記録した記録媒体に関するも
のである。
書かれている文字を認識し、看板広告主を特定するよう
にした、文字認識装置および文字認識方法および文字認
識方法をプログラムの形で記録した記録媒体に関するも
のである。
【0002】
【従来の技術】従来の文字認識に当っては、認識対象の
文字列画像から文字を1文字づつ切出して認識するもの
であった。しかしながら、看板のように、文字が多種多
様な装飾文字で構成されている場合には、個々の文字の
認識精度は十分ではなかった。そこで、認識対象文字列
として出現しやすい文字列の単語テーブルを予め用意し
ておき、認識結果文字列との照合の結果、一致文字数の
多い文字列があれば、それを認識結果として出力する単
語照合処理がしばしば用いられてきた。
文字列画像から文字を1文字づつ切出して認識するもの
であった。しかしながら、看板のように、文字が多種多
様な装飾文字で構成されている場合には、個々の文字の
認識精度は十分ではなかった。そこで、認識対象文字列
として出現しやすい文字列の単語テーブルを予め用意し
ておき、認識結果文字列との照合の結果、一致文字数の
多い文字列があれば、それを認識結果として出力する単
語照合処理がしばしば用いられてきた。
【0003】
【発明が解決しようとする課題】単語照合処理の効果を
上げるためには、出現の可能性のある文字列を出来るだ
け多く単語テーブルに登録する必要がある。しかし、そ
の一方で登録文字列数を増やすほど類似した文字列が登
録され、単語照合処理では認識結果を確定できないとい
う問題があった。例えば、入力文字列画像として「A信
託銀行」が入力されたとき、たとえ「A信託銀行」が表
に登録されていても、他に「B信託銀行」が登録されて
いると、先頭文字「A」自体が誤認識されたときには、
それが「A信託銀行」なのか「B信託銀行」なのか決定
することができなかった。
上げるためには、出現の可能性のある文字列を出来るだ
け多く単語テーブルに登録する必要がある。しかし、そ
の一方で登録文字列数を増やすほど類似した文字列が登
録され、単語照合処理では認識結果を確定できないとい
う問題があった。例えば、入力文字列画像として「A信
託銀行」が入力されたとき、たとえ「A信託銀行」が表
に登録されていても、他に「B信託銀行」が登録されて
いると、先頭文字「A」自体が誤認識されたときには、
それが「A信託銀行」なのか「B信託銀行」なのか決定
することができなかった。
【0004】本発明は上記事情に鑑みてなされたもの
で、その目的とするところは、看板における広告主など
を認識するに当って高精度な認識を可能にすることにあ
る。
で、その目的とするところは、看板における広告主など
を認識するに当って高精度な認識を可能にすることにあ
る。
【0005】
【課題を解決するための手段】上記の課題を達成するた
めに、本発明は看板などから得られる複数文字列の文字
認識結果と電話番号などの文字認識結果とを用いて、認
識結果の信頼度を反映した照合結果の統合を図ることに
より、精度良く看板の広告などを認識する文字認識装置
を提供する。
めに、本発明は看板などから得られる複数文字列の文字
認識結果と電話番号などの文字認識結果とを用いて、認
識結果の信頼度を反映した照合結果の統合を図ることに
より、精度良く看板の広告などを認識する文字認識装置
を提供する。
【0006】即ち看板などの中に現れる複数の文字列
を、広告主の名称を表す文字列、または電話番号を表す
文字列として抽出し、それぞれの文字列で、あらかじめ
システムが有する単語テーブルに登録されている広告主
文字列、電話番号文字列とのマッチングを行う。広告主
の認識結果と電話番号の認識結果のどちらにより重みを
おいて判断するかの重みを、抽出した文字列から計算し
た信頼度によって看板画像ごとに動的に変動すること
で、より高い信頼度で広告主候補を確定する。
を、広告主の名称を表す文字列、または電話番号を表す
文字列として抽出し、それぞれの文字列で、あらかじめ
システムが有する単語テーブルに登録されている広告主
文字列、電話番号文字列とのマッチングを行う。広告主
の認識結果と電話番号の認識結果のどちらにより重みを
おいて判断するかの重みを、抽出した文字列から計算し
た信頼度によって看板画像ごとに動的に変動すること
で、より高い信頼度で広告主候補を確定する。
【0007】なお、以下看板の例を用いて説明する。よ
り詳細にはそのための手段として、広告主名文字コード
列と電話番号文字コード列との対が格納されている単語
テーブルと、広告主名と電話番号とを含む看板画像を入
力する画像入力部と、入力された看板画像から全ての分
断のない一行を文字列として切り出す文字列切り出し部
と、全文字列について、一文字ずつの文字画像領域を求
めて文字画像を切り出す文字切り出し部と、それぞれの
文字列に含まれる全ての文字画像の認識を行って認識結
果文字コード列を出力する文字認識部とを持つ。更に上
記そのための手段としての、文字列切り出し部で得られ
た全文字列について、認識結果文字コード列と単語テー
ブル内の全広告主名文字コード列との間の一致文字数を
計数して出力する広告主単語照合部と、文字列切り出し
部で得られた全文字列について、認識結果文字コード列
と単語テーブル内の全電話番号文字コード列との間の一
致文字数を計数して出力する電話番号単語照合部と、文
字列切り出し部で得られた全文字列について、文字切り
出し部より出力された文字画像の大きさのばらつきをも
とに、広告主文字列と見なしたときの認識結果信頼度を
算出する広告主文字列信頼度計算部と、文字列切り出し
部で得られた全文字列について、認識結果文字コード列
中の数字の割合をもとに、電話番号と見なしたときの認
識結果信頼度を算出する電話番号文字列信頼度計算部
と、文字列切り出し部で得られた全文字列について、広
告主文字列信頼度計算部により算出された認識結果信頼
度と、電話番号文字列信頼度計算部により算出された認
識結果信頼度とから、広告主文字列として見たときの重
み係数と電話番号として見たときの重み係数とを算出す
る重み計算部とを持つ。そして更に上記そのための手段
としての、文字列切り出し部により得られた文字列の全
ての対について、広告主単語照合部により得られた一致
文字数に、重み計算部により算出された広告主文字列と
して見たときの重み係数を乗じた値と、電話番号単語照
合部により得られた一致文字数に、重み計算部により算
出された電話番号文字列として見たときの重み係数を乗
じた値との和をスコアとして算出し、最大スコアを与え
る広告主名文字コード列を広告主候補として出力する重
み付け統合部とより構成される。
り詳細にはそのための手段として、広告主名文字コード
列と電話番号文字コード列との対が格納されている単語
テーブルと、広告主名と電話番号とを含む看板画像を入
力する画像入力部と、入力された看板画像から全ての分
断のない一行を文字列として切り出す文字列切り出し部
と、全文字列について、一文字ずつの文字画像領域を求
めて文字画像を切り出す文字切り出し部と、それぞれの
文字列に含まれる全ての文字画像の認識を行って認識結
果文字コード列を出力する文字認識部とを持つ。更に上
記そのための手段としての、文字列切り出し部で得られ
た全文字列について、認識結果文字コード列と単語テー
ブル内の全広告主名文字コード列との間の一致文字数を
計数して出力する広告主単語照合部と、文字列切り出し
部で得られた全文字列について、認識結果文字コード列
と単語テーブル内の全電話番号文字コード列との間の一
致文字数を計数して出力する電話番号単語照合部と、文
字列切り出し部で得られた全文字列について、文字切り
出し部より出力された文字画像の大きさのばらつきをも
とに、広告主文字列と見なしたときの認識結果信頼度を
算出する広告主文字列信頼度計算部と、文字列切り出し
部で得られた全文字列について、認識結果文字コード列
中の数字の割合をもとに、電話番号と見なしたときの認
識結果信頼度を算出する電話番号文字列信頼度計算部
と、文字列切り出し部で得られた全文字列について、広
告主文字列信頼度計算部により算出された認識結果信頼
度と、電話番号文字列信頼度計算部により算出された認
識結果信頼度とから、広告主文字列として見たときの重
み係数と電話番号として見たときの重み係数とを算出す
る重み計算部とを持つ。そして更に上記そのための手段
としての、文字列切り出し部により得られた文字列の全
ての対について、広告主単語照合部により得られた一致
文字数に、重み計算部により算出された広告主文字列と
して見たときの重み係数を乗じた値と、電話番号単語照
合部により得られた一致文字数に、重み計算部により算
出された電話番号文字列として見たときの重み係数を乗
じた値との和をスコアとして算出し、最大スコアを与え
る広告主名文字コード列を広告主候補として出力する重
み付け統合部とより構成される。
【0008】広告主の単語照合結果と電話番号の単語照
合結果の一致文字数に重み付けをし、和を取ることで単
語照合結果の統合を行うため、それぞれの文字列から十
分な文字認識結果が得られなかった場合も、両方の照合
結果で補完し合うことにより、高い広告主特定精度が得
られる。また、認識結果の信頼度でそれぞれの文字列の
照合結果に重み付けをすることによって、より確からし
い方の文字列の認識結果の重みを大きくすることにな
り、有効な照合結果の統合を行うことができる。なお、
本発明において、「文字列」とは例えば広告主を表す漢
字などの文字の列で示される「文字の列」であり、いわ
ゆるイメージ・データの列である。また「文字コード
列」とは例えば当該広告主を表す各文字を2値コードで
表現する形で示した「コードの列」であり、いわゆるコ
ード・データの列である。
合結果の一致文字数に重み付けをし、和を取ることで単
語照合結果の統合を行うため、それぞれの文字列から十
分な文字認識結果が得られなかった場合も、両方の照合
結果で補完し合うことにより、高い広告主特定精度が得
られる。また、認識結果の信頼度でそれぞれの文字列の
照合結果に重み付けをすることによって、より確からし
い方の文字列の認識結果の重みを大きくすることにな
り、有効な照合結果の統合を行うことができる。なお、
本発明において、「文字列」とは例えば広告主を表す漢
字などの文字の列で示される「文字の列」であり、いわ
ゆるイメージ・データの列である。また「文字コード
列」とは例えば当該広告主を表す各文字を2値コードで
表現する形で示した「コードの列」であり、いわゆるコ
ード・データの列である。
【0009】
【発明の実施の形態】〔実施例1〕図1は本発明の一実
施例構成を示す。
施例構成を示す。
【0010】実施例の文字認識装置は、単語テーブル
1、画像入力部2、文字列切り出し部3、文字切り出し
部4、文字認識部5、広告主文字列信頼度計算部6、電
話番号文字列信頼度計算部7、重み計算部8、広告主単
語照合部9、電話番号単語照合部10、重み付け統合部
11とで構成されている。
1、画像入力部2、文字列切り出し部3、文字切り出し
部4、文字認識部5、広告主文字列信頼度計算部6、電
話番号文字列信頼度計算部7、重み計算部8、広告主単
語照合部9、電話番号単語照合部10、重み付け統合部
11とで構成されている。
【0011】単語テーブル1には、広告主名と電話番号
が対になって格納されている。
が対になって格納されている。
【0012】画像入力部2では、広告主と電話番号とが
書かれている看板の画像(看板画像)の入力を行う。文
字列切り出し部3では、画像入力部2で入力された看板
画像から、区切れのないひとまとまりの行を文字列画像
として切り出す。ここで使用する方法としては、例え
ば、書式に依存しない文字の形状及び配置に関する制
約、および文字列の属性(文字サイズ、文字間隔等)に
関する制約を与え、マルチエージェントシステムを利用
して文字列を抽出する手法が提案されている(“マルチ
エージェントシステムを利用した文字領域抽出法”、隅
谷倫子、行天啓二他、1995年電子情報通信学会総合大
会、D-574,pp300)。
書かれている看板の画像(看板画像)の入力を行う。文
字列切り出し部3では、画像入力部2で入力された看板
画像から、区切れのないひとまとまりの行を文字列画像
として切り出す。ここで使用する方法としては、例え
ば、書式に依存しない文字の形状及び配置に関する制
約、および文字列の属性(文字サイズ、文字間隔等)に
関する制約を与え、マルチエージェントシステムを利用
して文字列を抽出する手法が提案されている(“マルチ
エージェントシステムを利用した文字領域抽出法”、隅
谷倫子、行天啓二他、1995年電子情報通信学会総合大
会、D-574,pp300)。
【0013】文字切り出し部4では、文字列切り出し部
3で切り出された文字列画像全てについて、一文字分ず
つ文字画像を切り出し、文字サイズの算出を行う。文字
認識部5では、全文字列について、切り出された各文字
画像の認識を行い、認識結果文字コード列を出力する。
文字切り出し部4および文字認識部5で使用する方法と
しては、例えば、文字線とその背景の濃度コンストラス
トが高い、文字の外接矩形が正方形に近いものが多い、
等の文字の普遍的な性質を利用することによって、雑音
が多く条件の変化の激しい情景画像から文字を抽出、認
識する方法が提案されている(“情景画像からの文字パ
ターン抽出と認識”、大谷 淳、塩 昭夫、電子情報通
信学会論文誌DVol.J71-DNo.6 pp.1037-1047 )。
3で切り出された文字列画像全てについて、一文字分ず
つ文字画像を切り出し、文字サイズの算出を行う。文字
認識部5では、全文字列について、切り出された各文字
画像の認識を行い、認識結果文字コード列を出力する。
文字切り出し部4および文字認識部5で使用する方法と
しては、例えば、文字線とその背景の濃度コンストラス
トが高い、文字の外接矩形が正方形に近いものが多い、
等の文字の普遍的な性質を利用することによって、雑音
が多く条件の変化の激しい情景画像から文字を抽出、認
識する方法が提案されている(“情景画像からの文字パ
ターン抽出と認識”、大谷 淳、塩 昭夫、電子情報通
信学会論文誌DVol.J71-DNo.6 pp.1037-1047 )。
【0014】広告主文字列信頼度計算部6では、全文字
列について、文字切り出し部4から出力された各文字の
文字サイズのばらつきを用いて、広告主文字列としての
認識結果の信頼度Raを求める。具体的には、文字列中
の全文字の文字サイズ(=MAX「文字幅、文字サイ
ズ」)の不偏標準偏差を平均で割った変動係数を算出す
る。変動係数は0〜1の値を取り、1に近いほどばらつ
きが大きい。信頼度としては、変動係数を1からひいた
ものを用いる。
列について、文字切り出し部4から出力された各文字の
文字サイズのばらつきを用いて、広告主文字列としての
認識結果の信頼度Raを求める。具体的には、文字列中
の全文字の文字サイズ(=MAX「文字幅、文字サイ
ズ」)の不偏標準偏差を平均で割った変動係数を算出す
る。変動係数は0〜1の値を取り、1に近いほどばらつ
きが大きい。信頼度としては、変動係数を1からひいた
ものを用いる。
【0015】電話番号文字列信頼度計算部7では、全文
字列について、電話番号文字列としての認識結果の信頼
度Rtを求める。具体的には、認識結果に含まれる数字
の割合(認識結果に含まれる数字の数を照合に使用する
文字数で割った値)を信頼度とする。
字列について、電話番号文字列としての認識結果の信頼
度Rtを求める。具体的には、認識結果に含まれる数字
の割合(認識結果に含まれる数字の数を照合に使用する
文字数で割った値)を信頼度とする。
【0016】重み計算部8では、広告主文字列信頼度計
算部6と電話番号文字列信頼度計算部7とで求めた、広
告主文字列候補の信頼度Raと電話番号文字列候補の信
頼度Rtとから、それぞれの照合結果に付ける重みW
a,Wtを、和が「1」になるように次式によって求め
る。
算部6と電話番号文字列信頼度計算部7とで求めた、広
告主文字列候補の信頼度Raと電話番号文字列候補の信
頼度Rtとから、それぞれの照合結果に付ける重みW
a,Wtを、和が「1」になるように次式によって求め
る。
【0017】 Wa=Ra/(Rt+Ra)・・・・・・・(1) Wt=Rt/(Rt+Ra)・・・・・・・(2) 広告主単語照合部9では、全文字列について、各文字列
の認識結果文字コード列と単語テーブルの広告主文字コ
ード列との単語照合を行い、電話番号単語照合部10で
は、全文字列について、各文字列の認識結果文字コード
列と単語テーブルの電話番号文字コード列との単語照合
を行い、それぞれ一致文字数を出力する。単語照合の方
法としては、例えば、連想処理と統合処理の組み合わせ
により、誤字・脱字・余剰時を許容できる連想統合型照
合法が提案されている(“連想統合型照合による単語あ
いまい検索法”、松尾、佐藤、津田、第34回情処全
大、4E-7,pp.1845-1846,1987)。
の認識結果文字コード列と単語テーブルの広告主文字コ
ード列との単語照合を行い、電話番号単語照合部10で
は、全文字列について、各文字列の認識結果文字コード
列と単語テーブルの電話番号文字コード列との単語照合
を行い、それぞれ一致文字数を出力する。単語照合の方
法としては、例えば、連想処理と統合処理の組み合わせ
により、誤字・脱字・余剰時を許容できる連想統合型照
合法が提案されている(“連想統合型照合による単語あ
いまい検索法”、松尾、佐藤、津田、第34回情処全
大、4E-7,pp.1845-1846,1987)。
【0018】重み付け統合部11では、広告主単語照合
部9および電話番号単語照合部10より出力された広告
主、電話番号それぞれの照合結果の一致文字数Na,N
tに、重み計算部8で計算された広告主、電話番号の重
みWa,Wtを付けて、統合結果のスコアSを次式で求
める。
部9および電話番号単語照合部10より出力された広告
主、電話番号それぞれの照合結果の一致文字数Na,N
tに、重み計算部8で計算された広告主、電話番号の重
みWa,Wtを付けて、統合結果のスコアSを次式で求
める。
【0019】 S=Na×Wa+Nt×Wt・・・・・・・(3) Sの値が最も高いものを、広告主候補として出力する。
【0020】このように構成した文字認識装置の動作お
よび作用を説明する。図2ないし図4は一緒になって1
つの図を構成し、図1に示した文字認識装置の動作を示
すフローチャートである。
よび作用を説明する。図2ないし図4は一緒になって1
つの図を構成し、図1に示した文字認識装置の動作を示
すフローチャートである。
【0021】まず、ステップ20において看板画像を読
み込む。
み込む。
【0022】次にステップ21では、看板内の全文字領
域について、1区切りのまとまった行を、文字列画像と
して切り出し、ステップ22では、文字列画像から一文
字分ずつ文字画像を切り出す。ステップ23で、ステッ
プ22で切り出された文字画像それぞれの文字サイズを
算出し、ステップ24で文字認識を行い、認識結果文字
コード列を生成する。ステップ25では、文字列として
切り出した画像中の全ての文字について処理が終わった
かどうかの判定を行い、ステップ26では、看板中の全
ての文字列について処理が終わったかどうかを判定す
る。
域について、1区切りのまとまった行を、文字列画像と
して切り出し、ステップ22では、文字列画像から一文
字分ずつ文字画像を切り出す。ステップ23で、ステッ
プ22で切り出された文字画像それぞれの文字サイズを
算出し、ステップ24で文字認識を行い、認識結果文字
コード列を生成する。ステップ25では、文字列として
切り出した画像中の全ての文字について処理が終わった
かどうかの判定を行い、ステップ26では、看板中の全
ての文字列について処理が終わったかどうかを判定す
る。
【0023】ステップ27では、照合結果を統合したス
コアの最大値Smax を0に設定しておく。
コアの最大値Smax を0に設定しておく。
【0024】ステップ28で、一つ目の文字列を広告主
文字列候補、ステップ29で2つ目の文字列を電話番号
文字列候補とする。
文字列候補、ステップ29で2つ目の文字列を電話番号
文字列候補とする。
【0025】ステップ30では、広告主文字列候補とし
た第m文字列の全文字のサイズを読込み、ステップ31
で第m文字列の認識結果文字コード列を読込む。ステッ
プ32では、電話番号文字列候補とした第n文字列の全
文字の認識結果文字コード列を読込む。
た第m文字列の全文字のサイズを読込み、ステップ31
で第m文字列の認識結果文字コード列を読込む。ステッ
プ32では、電話番号文字列候補とした第n文字列の全
文字の認識結果文字コード列を読込む。
【0026】次に、ステップ33で、広告主文字列候補
の信頼度Saとして、第m文字列の文字サイズの変動計
数を求める。変動計数とは、標準偏差を平均で割った値
で、ここでは全文字サイズの標準偏差と平均から求め
る。ステップ34では、電話番号文字列候補の信頼度S
tとして、第n文字列の認識結果文字コード列中に含ま
れる数字の割合を求める。具体的には、認識結果文字コ
ード列中の数字の数を求め。それを文字数で割った値を
Stとする。ステップ33とステップ34で求めた、広
告主と電話番号それぞれの信頼度から、式(1)、式
(2)により、それぞれの認識結果に掛ける重みをステ
ップ35、ステップ36で算出する。
の信頼度Saとして、第m文字列の文字サイズの変動計
数を求める。変動計数とは、標準偏差を平均で割った値
で、ここでは全文字サイズの標準偏差と平均から求め
る。ステップ34では、電話番号文字列候補の信頼度S
tとして、第n文字列の認識結果文字コード列中に含ま
れる数字の割合を求める。具体的には、認識結果文字コ
ード列中の数字の数を求め。それを文字数で割った値を
Stとする。ステップ33とステップ34で求めた、広
告主と電話番号それぞれの信頼度から、式(1)、式
(2)により、それぞれの認識結果に掛ける重みをステ
ップ35、ステップ36で算出する。
【0027】次に、ステップ37では、広告主mと電話
番号nの組み合わせでの最大スコアS(m,n)maxを0に初
期化する。ステップ38とステップ39で、単語テーブ
ル内の1対の広告主文字コード列と電話番号文字コード
列について、それぞれ広告主文字列候補である第m文字
列の認識結果文字コード列と単語テーブル内の広告主文
字コード列との一致文字数Na、電話番号文字列候補で
ある第n文字列の認識結果文字コード列と単語テーブル
内の電話番号文字コード列との一致文字数Ntを計数す
る。
番号nの組み合わせでの最大スコアS(m,n)maxを0に初
期化する。ステップ38とステップ39で、単語テーブ
ル内の1対の広告主文字コード列と電話番号文字コード
列について、それぞれ広告主文字列候補である第m文字
列の認識結果文字コード列と単語テーブル内の広告主文
字コード列との一致文字数Na、電話番号文字列候補で
ある第n文字列の認識結果文字コード列と単語テーブル
内の電話番号文字コード列との一致文字数Ntを計数す
る。
【0028】次にステップ40で、第m文字列と第n文
字列の重みWaとWt、広告主の一致文字数Naと電話
番号の一致文字数Ntから、式(3)によって統合した
結果のスコアSを算出し、ステップ41でそれがS(m,
n)maxより大きければ、ステップ42でS(m,n)maxと入
れ替え、ステップ43で広告主候補Adv(m,n) として
格納する。ステップ44で、単語テーブル内の全ての広
告主と電話番号の対についての照合が完了していれば、
ステップ45にすすみ、完了していなければ、次の文字
列対について、ステップ38からを繰り返す。
字列の重みWaとWt、広告主の一致文字数Naと電話
番号の一致文字数Ntから、式(3)によって統合した
結果のスコアSを算出し、ステップ41でそれがS(m,
n)maxより大きければ、ステップ42でS(m,n)maxと入
れ替え、ステップ43で広告主候補Adv(m,n) として
格納する。ステップ44で、単語テーブル内の全ての広
告主と電話番号の対についての照合が完了していれば、
ステップ45にすすみ、完了していなければ、次の文字
列対について、ステップ38からを繰り返す。
【0029】ステップ45では、広告主mと電話番号n
の組み合わせについて、今までの文字列の組み合わせよ
り高いスコアが得られたかどうかを判定する。今までよ
り高いスコアが得られていたら、ステップ46で最大ス
コアを書き換え、ステップ47で広告主候補を書き換え
る。
の組み合わせについて、今までの文字列の組み合わせよ
り高いスコアが得られたかどうかを判定する。今までよ
り高いスコアが得られていたら、ステップ46で最大ス
コアを書き換え、ステップ47で広告主候補を書き換え
る。
【0030】ステップ48で全ての文字列画像を電話番
号候補として照合したかどうかの判定を行い、まだであ
れば、ステップ49〜ステップ51で次の文字列を電話
番号文字列候補とする。その際、広告主文字列と同じ行
を除く。
号候補として照合したかどうかの判定を行い、まだであ
れば、ステップ49〜ステップ51で次の文字列を電話
番号文字列候補とする。その際、広告主文字列と同じ行
を除く。
【0031】ステップ52で全ての文字列画像を広告主
候補として照合したかどうかの判定を行い、まだであれ
ばステップ53で次の文字列を広告主文字列候補とす
る。全ての文字列について処理が終わっていれば、ステ
ップ54でAdvを広告主候補として出力し、処理を終
了する。
候補として照合したかどうかの判定を行い、まだであれ
ばステップ53で次の文字列を広告主文字列候補とす
る。全ての文字列について処理が終わっていれば、ステ
ップ54でAdvを広告主候補として出力し、処理を終
了する。
【0032】〔実施例2〕図5は本発明の他の一実施例
構成を示す。
構成を示す。
【0033】実施例の文字認識装置は、単語テーブル
1、画像入力部2、文字列切り出し部3、文字切り出し
部4、文字認識部5、広告主文字列信頼度計算部6、電
話番号文字列信頼度計算部7、重み計算部8、広告主単
語照合部9、電話番号単語照合部10、重み付け統合部
11、広告主文字列候補抽出部12、電話番号文字列候
補抽出部13とで構成されている。
1、画像入力部2、文字列切り出し部3、文字切り出し
部4、文字認識部5、広告主文字列信頼度計算部6、電
話番号文字列信頼度計算部7、重み計算部8、広告主単
語照合部9、電話番号単語照合部10、重み付け統合部
11、広告主文字列候補抽出部12、電話番号文字列候
補抽出部13とで構成されている。
【0034】画像入力部2では、広告主と電話番号とが
書かれている看板画像の入力を行う。文字列切り出し部
3では、画像入力部2で入力された看板画像から、区切
れのないひとまとまりの行を文字列画像として切り出
す。ここで使用する方法としては、例えば、書式に依存
しない文字の形状及び配置に関する制約、および文字列
の属性(文字サイズ、文字間隔等)に関する制約を与
え、マルチエージェントシステムを利用して文字列を抽
出する手法が提案されている(“マルチエージェントシ
ステムを利用した文字領域抽出法”、隅谷倫子、行天啓
二他、1995年電子情報通信学会総合大会、D-574,pp30
0)。
書かれている看板画像の入力を行う。文字列切り出し部
3では、画像入力部2で入力された看板画像から、区切
れのないひとまとまりの行を文字列画像として切り出
す。ここで使用する方法としては、例えば、書式に依存
しない文字の形状及び配置に関する制約、および文字列
の属性(文字サイズ、文字間隔等)に関する制約を与
え、マルチエージェントシステムを利用して文字列を抽
出する手法が提案されている(“マルチエージェントシ
ステムを利用した文字領域抽出法”、隅谷倫子、行天啓
二他、1995年電子情報通信学会総合大会、D-574,pp30
0)。
【0035】文字切り出し部4では、文字列切り出し部
3で切り出された文字列画像全てについて、一文字分ず
つ文字画像を切り出し、文字サイズの算出を行う。文字
認識部5では、全文字列について、切り出された各文字
画像の認識を行い、認識結果文字コード列を出力する。
文字切り出し部4および文字認識部5で使用する方法と
しては、例えば、文字線とその背景の濃度コンストラス
トが高い、文字の外接矩形が正方形に近いものが多い、
等の文字の普遍的な性質を利用することによって、雑音
が多く条件の変化の激しい情景画像から文字を抽出、認
識する方法が提案されている(“情景画像からの文字パ
ターン抽出と認識”、大谷 淳、塩 昭夫、電子情報通
信学会論文誌DVol.J71-DNo.6 pp.1037-1047 )。
3で切り出された文字列画像全てについて、一文字分ず
つ文字画像を切り出し、文字サイズの算出を行う。文字
認識部5では、全文字列について、切り出された各文字
画像の認識を行い、認識結果文字コード列を出力する。
文字切り出し部4および文字認識部5で使用する方法と
しては、例えば、文字線とその背景の濃度コンストラス
トが高い、文字の外接矩形が正方形に近いものが多い、
等の文字の普遍的な性質を利用することによって、雑音
が多く条件の変化の激しい情景画像から文字を抽出、認
識する方法が提案されている(“情景画像からの文字パ
ターン抽出と認識”、大谷 淳、塩 昭夫、電子情報通
信学会論文誌DVol.J71-DNo.6 pp.1037-1047 )。
【0036】広告主文字列信頼度計算部6では、全文字
列について、文字切り出し部4から出力された各文字の
文字サイズのばらつきを用いて、広告主文字列としての
認識結果の信頼度Raを求める。具体的には、文字列中
の全文字の文字サイズ(=MAX「文字幅、文字サイ
ズ」)の不偏標準偏差を平均で割った変動係数を算出す
る。変動係数は0〜1の値を取り、1に近いほどばらつ
きが大きい。信頼度としては、変動係数を1からひいた
ものを用いる。
列について、文字切り出し部4から出力された各文字の
文字サイズのばらつきを用いて、広告主文字列としての
認識結果の信頼度Raを求める。具体的には、文字列中
の全文字の文字サイズ(=MAX「文字幅、文字サイ
ズ」)の不偏標準偏差を平均で割った変動係数を算出す
る。変動係数は0〜1の値を取り、1に近いほどばらつ
きが大きい。信頼度としては、変動係数を1からひいた
ものを用いる。
【0037】電話番号文字列信頼度計算部7では、全文
字列について、電話番号文字列としての認識結果の信頼
度Rtを求める。具体的には、認識結果に含まれる数字
の割合(認識結果に含まれる数字の数を照合に使用する
文字数で割った値)を信頼度とする。
字列について、電話番号文字列としての認識結果の信頼
度Rtを求める。具体的には、認識結果に含まれる数字
の割合(認識結果に含まれる数字の数を照合に使用する
文字数で割った値)を信頼度とする。
【0038】重み計算部8では、広告主文字列信頼度計
算部6と電話番号文字列信頼度計算部7とで求めた、広
告主文字列候補の信頼度Raと電話番号文字列候補の信
頼度Rtとから、それぞれの照合結果に付ける重みW
a,Wtを、和が1になるように次式によって正規化を
行う。
算部6と電話番号文字列信頼度計算部7とで求めた、広
告主文字列候補の信頼度Raと電話番号文字列候補の信
頼度Rtとから、それぞれの照合結果に付ける重みW
a,Wtを、和が1になるように次式によって正規化を
行う。
【0039】 Wa=Ra/(Rt+Ra)・・・・・・・(1) Wt=Rt/(Rt+Ra)・・・・・・・(2) 広告主単語照合部9では、全文字列について、各文字列
の認識結果文字コード列と単語テーブルの広告主文字コ
ード列との単語照合を行い、電話番号単語照合部10で
は、全文字列について、各文字列の認識結果文字コード
列と単語テーブルの電話番号文字コード列との単語照合
を行い、それぞれ一致文字数を出力する。単語照合の方
法としては、例えば、連想処理と統合処理の組み合わせ
により、誤字・脱字・余剰時を許容できる連想統合型照
合法が提案されている(“連想統合型照合による単語あ
いまい検索法”、松尾、佐藤、津田、第34回情処全
大、4E-7,pp.1845-1846,1987)。
の認識結果文字コード列と単語テーブルの広告主文字コ
ード列との単語照合を行い、電話番号単語照合部10で
は、全文字列について、各文字列の認識結果文字コード
列と単語テーブルの電話番号文字コード列との単語照合
を行い、それぞれ一致文字数を出力する。単語照合の方
法としては、例えば、連想処理と統合処理の組み合わせ
により、誤字・脱字・余剰時を許容できる連想統合型照
合法が提案されている(“連想統合型照合による単語あ
いまい検索法”、松尾、佐藤、津田、第34回情処全
大、4E-7,pp.1845-1846,1987)。
【0040】重み付け統合部11では、広告主単語照合
部9および電話番号単語照合部10より出力された広告
主、電話番号それぞれの照合結果の一致文字数Na,N
tに、重み計算部8で計算された広告主、電話番号の重
みWa,Wtを付けて、統合結果のスコアSを次式で求
める。
部9および電話番号単語照合部10より出力された広告
主、電話番号それぞれの照合結果の一致文字数Na,N
tに、重み計算部8で計算された広告主、電話番号の重
みWa,Wtを付けて、統合結果のスコアSを次式で求
める。
【0041】 S=Na×Wa+Nt×Wt・・・・・・・(3) Sの値が最も高いものを、広告主候補として出力する。
【0042】広告主文字列候補抽出部12では、各文字
列のサイズを求め、サイズがもっとも大きい文字を含む
文字列を広告主文字列候補として抽出する。文字列のサ
イズは、各文字列の文字画像のサイズの最大値とする。
これは、看板に含まれる文字列の中で、広告主の文字列
のサイズが最大であることが多いためである。
列のサイズを求め、サイズがもっとも大きい文字を含む
文字列を広告主文字列候補として抽出する。文字列のサ
イズは、各文字列の文字画像のサイズの最大値とする。
これは、看板に含まれる文字列の中で、広告主の文字列
のサイズが最大であることが多いためである。
【0043】電話番号文字列候補抽出部13では、各文
字列の認識結果の中で最も数字が多く含まれる文字列を
電話番号文字列候補として抽出する。これは看板に含ま
れる文字列の中で数字を最も多く含む文字列が電話番号
であることが多いためである。
字列の認識結果の中で最も数字が多く含まれる文字列を
電話番号文字列候補として抽出する。これは看板に含ま
れる文字列の中で数字を最も多く含む文字列が電話番号
であることが多いためである。
【0044】このように構成した文字認識装置の動作お
よび作用を説明する。図6ないし図8は図5に示した文
字認識装置の動作を示すフローチャートである。
よび作用を説明する。図6ないし図8は図5に示した文
字認識装置の動作を示すフローチャートである。
【0045】まず、ステップ20において看板画像を読
み込む。
み込む。
【0046】次にステップ21では、看板内の全文字領
域について、1区切りのまとまった行を、文字列画像と
して切り出し、ステップ22では、文字列画像から一文
字分ずつ文字画像を切り出す。ステップ23で、ステッ
プ22で切り出された文字画像それぞれの文字サイズを
算出し、ステップ24で文字認識を行い、認識結果文字
コード列を生成する。ステップ25では、文字列として
切り出した画像中の全ての文字について処理が終わった
かどうかの判定を行い、ステップ26では、看板中の全
ての文字列について処理が終わったかどうかを判定す
る。
域について、1区切りのまとまった行を、文字列画像と
して切り出し、ステップ22では、文字列画像から一文
字分ずつ文字画像を切り出す。ステップ23で、ステッ
プ22で切り出された文字画像それぞれの文字サイズを
算出し、ステップ24で文字認識を行い、認識結果文字
コード列を生成する。ステップ25では、文字列として
切り出した画像中の全ての文字について処理が終わった
かどうかの判定を行い、ステップ26では、看板中の全
ての文字列について処理が終わったかどうかを判定す
る。
【0047】ステップ27では、照合結果を統合したス
コアの最大値Smax を0に設定しておく。
コアの最大値Smax を0に設定しておく。
【0048】ステップ28で、広告主文字列候補を抽出
する。広告主文字列候補は全文字列の中でサイズが最も
大きい文字を含む文字列とする。
する。広告主文字列候補は全文字列の中でサイズが最も
大きい文字を含む文字列とする。
【0049】ステップ29で電話番号文字列候補を抽出
する。全文字列の認識結果に含まれる数字の数が最も多
いものを電話番号文字列候補とする。
する。全文字列の認識結果に含まれる数字の数が最も多
いものを電話番号文字列候補とする。
【0050】ステップ30では、広告主文字列候補の第
m文字列の全文字のサイズを読込み、ステップ31で第
m文字列の認識結果文字コード列を読込む。ステップ3
2では、電話番号文字列候補の第n文字列の全文字の認
識結果文字コード列を読込む。
m文字列の全文字のサイズを読込み、ステップ31で第
m文字列の認識結果文字コード列を読込む。ステップ3
2では、電話番号文字列候補の第n文字列の全文字の認
識結果文字コード列を読込む。
【0051】次に、ステップ33で、広告主文字列候補
の信頼度Saとして、第m文字列の文字サイズの変動計
数を求める。変動計数とは、標準偏差を平均で割った値
で、ここでは全文字サイズの標準偏差と平均から求め
る。ステップ34では、電話番号文字列候補の信頼度S
tとして、第n文字列の認識結果文字コード列中に含ま
れる数字の割合を求める。具体的には、認識結果文字コ
ード列中の数字の数を求め。それを文字数で割った値を
Stとする。ステップ33とステップ34で求めた、広
告主と電話番号それぞれの信頼度から、式(1)、式
(2)により、それぞれの認識結果に掛ける重みをステ
ップ35、ステップ36で算出する。
の信頼度Saとして、第m文字列の文字サイズの変動計
数を求める。変動計数とは、標準偏差を平均で割った値
で、ここでは全文字サイズの標準偏差と平均から求め
る。ステップ34では、電話番号文字列候補の信頼度S
tとして、第n文字列の認識結果文字コード列中に含ま
れる数字の割合を求める。具体的には、認識結果文字コ
ード列中の数字の数を求め。それを文字数で割った値を
Stとする。ステップ33とステップ34で求めた、広
告主と電話番号それぞれの信頼度から、式(1)、式
(2)により、それぞれの認識結果に掛ける重みをステ
ップ35、ステップ36で算出する。
【0052】次に、ステップ37では、広告主mと電話
番号nの組み合わせでの最大スコアS(m,n)maxを0に初
期化する。ステップ38とステップ39で、単語テーブ
ル内の1対の広告主文字コード列と電話番号文字コード
列について、それぞれ広告主文字列候補である第m文字
列の認識結果文字コード列と単語テーブル内の広告主文
字コード列との一致文字数Na、電話番号文字列候補で
ある第n文字列の認識結果文字コード列と単語テーブル
内の電話番号文字コード列との一致文字数Ntを計数す
る。
番号nの組み合わせでの最大スコアS(m,n)maxを0に初
期化する。ステップ38とステップ39で、単語テーブ
ル内の1対の広告主文字コード列と電話番号文字コード
列について、それぞれ広告主文字列候補である第m文字
列の認識結果文字コード列と単語テーブル内の広告主文
字コード列との一致文字数Na、電話番号文字列候補で
ある第n文字列の認識結果文字コード列と単語テーブル
内の電話番号文字コード列との一致文字数Ntを計数す
る。
【0053】次にステップ40で、第m文字列と第n文
字列の重みWaとWt、広告主の一致文字数Naと電話
番号の一致文字数Ntから、式(3)によって統合した
結果のスコアSを算出し、ステップ41でそれがS(m,
n)maxより大きければ、ステップ42でS(m,n)maxと入
れ替え、ステップ43で広告主候補Adv(m,n) として
格納する。ステップ44で、単語テーブル内の全ての広
告主と電話番号の対についての照合が完了していれば、
ステップ45にすすみ、完了していなければ、次の文字
列対について、ステップ38からを繰り返す。
字列の重みWaとWt、広告主の一致文字数Naと電話
番号の一致文字数Ntから、式(3)によって統合した
結果のスコアSを算出し、ステップ41でそれがS(m,
n)maxより大きければ、ステップ42でS(m,n)maxと入
れ替え、ステップ43で広告主候補Adv(m,n) として
格納する。ステップ44で、単語テーブル内の全ての広
告主と電話番号の対についての照合が完了していれば、
ステップ45にすすみ、完了していなければ、次の文字
列対について、ステップ38からを繰り返す。
【0054】ステップ45では、広告主mと電話番号n
の組み合わせについて、今までの文字列の組み合わせよ
り高いスコアが得られたかどうかを判定する。今までよ
り高いスコアが得られていたら、ステップ46で最大ス
コアを書き換え、ステップ47で広告主候補を書き換え
る。
の組み合わせについて、今までの文字列の組み合わせよ
り高いスコアが得られたかどうかを判定する。今までよ
り高いスコアが得られていたら、ステップ46で最大ス
コアを書き換え、ステップ47で広告主候補を書き換え
る。
【0055】ステップ48でAdvを広告主候補として
出力し、処理を終了する。
出力し、処理を終了する。
【0056】発明者らは、本発明の効果を確かめるため
に実験を行い、次の結果を得た。
に実験を行い、次の結果を得た。
【0057】実験には、デジタルビデオカメラで撮影し
た駅看板静止画像35枚を使用した。駅看板画像からの
文字列切り出しと2値化とは、市販画像処理ソフトを用
いて目視により行った。また、文字認識は市販文字認識
ソフトを使用した。看板とタウンページ・データベース
との広告主には一部表記の不一致があるが、今回は照合
方法の評価のため、タウンページ・データベース側の表
記を看板に一致させて実験を行った。
た駅看板静止画像35枚を使用した。駅看板画像からの
文字列切り出しと2値化とは、市販画像処理ソフトを用
いて目視により行った。また、文字認識は市販文字認識
ソフトを使用した。看板とタウンページ・データベース
との広告主には一部表記の不一致があるが、今回は照合
方法の評価のため、タウンページ・データベース側の表
記を看板に一致させて実験を行った。
【0058】文字列抽出に関しては、広告主文字列を抽
出できたものが80%、電話番号文字列を抽出できたも
のが83%であった。
出できたものが80%、電話番号文字列を抽出できたも
のが83%であった。
【0059】表1に広告主特定の実験結果を示す。広告
主文字列の単文字認識精度は約40%であった。そのた
め広告主の単語照合のみを行っても特定精度は29%に
過ぎない。一方、重みなしの統合による特定精度は69
%であり、照合結果の統合により単語照合のみの場合に
くらべて特定精度が向上している。本発明の場合の特定
精度は80%で、さらに高い精度が得られた。
主文字列の単文字認識精度は約40%であった。そのた
め広告主の単語照合のみを行っても特定精度は29%に
過ぎない。一方、重みなしの統合による特定精度は69
%であり、照合結果の統合により単語照合のみの場合に
くらべて特定精度が向上している。本発明の場合の特定
精度は80%で、さらに高い精度が得られた。
【0060】
【表1】 広告主文字列では切り出し誤り等に起因する誤認識の場
合、認識結果に“・”や“−”が含まれるものが多く、
タウンページ・データベース照合の際、それらの文字を
含む広告主が上位になることが多い。また、電話番号文
字列の認識結果に数字が少ない場合、数字として認識さ
れた文字にも誤認識が多く、正しい照合結果が得難い。
本発明の場合では文字列認識結果の確からしさを重み付
けにより反映させたため、誤認識文字の照合結果の重み
が小さくなり、重みなしで統合した場合より高い特定精
度が得られている。
合、認識結果に“・”や“−”が含まれるものが多く、
タウンページ・データベース照合の際、それらの文字を
含む広告主が上位になることが多い。また、電話番号文
字列の認識結果に数字が少ない場合、数字として認識さ
れた文字にも誤認識が多く、正しい照合結果が得難い。
本発明の場合では文字列認識結果の確からしさを重み付
けにより反映させたため、誤認識文字の照合結果の重み
が小さくなり、重みなしで統合した場合より高い特定精
度が得られている。
【0061】上記において、本発明による文字認識装置
と文字認識方法とについて説明したが、当該本発明によ
る文字認識は、当該文字認識方法をデータ処理装置が実
行可能にしたプログラムの形で保持することができる。
このことから、本発明は当該プログラムを記録した記録
媒体をも権利範囲に含むことは言うまでもない。
と文字認識方法とについて説明したが、当該本発明によ
る文字認識は、当該文字認識方法をデータ処理装置が実
行可能にしたプログラムの形で保持することができる。
このことから、本発明は当該プログラムを記録した記録
媒体をも権利範囲に含むことは言うまでもない。
【0062】
【発明の効果】以上説明した如く、本発明によれば、看
板などに対する文字認識精度をより向上することが可能
となった。
板などに対する文字認識精度をより向上することが可能
となった。
【図1】本発明の一実施例構成を示す。
【図2】図1の構成に対応するフローチャートを示す。
【図3】図1の構成に対応するフローチャートを示す。
【図4】図1の構成に対応するフローチャートを示す。
【図5】本発明の他の一実施例構成を示す。
【図6】図5の構成に対応するフローチャートを示す。
【図7】図5の構成に対応するフローチャートを示す。
【図8】図5の構成に対応するフローチャートを示す。
1 単語テーブル 2 画像入力部 3 文字列切り出し部 4 文字切り出し部 5 文字認識部 6 広告主文字列信頼度計算部 7 電話番号文字列信頼度計算部 8 重み計算部 9 広告主単語照合部 10 電話番号単語照合部 11 重み付け統合部 12 広告主文字列候補抽出部 13 電話番号文字列候補抽出部
フロントページの続き (72)発明者 中村 修 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (72)発明者 杉村 利明 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平11−143984(JP,A) 特開 平6−180767(JP,A) 特開 平4−328692(JP,A) 特開2000−48169(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82
Claims (12)
- 【請求項1】 名称文字コード列と数字文字コード列の
対が格納されている単語テーブルと、 名称文字と数字文字とを含む画像を入力する画像入力部
と、 上記画像から全ての文字列画像を切り出す文字列切り出
し部と、 上記文字列画像の各々から全ての文字画像を切り出す文
字切り出し部と、 上記文字列画像に含まれる全ての文字画像の認識を行
い、認識結果文字コード列を出力する文字認識部と、 上記文字列切り出し部で得られた全文字列について、上
記認識結果文字コード列と、上記単語テーブル内の全名
称文字コード列との間の認識結果を出力する名称単語照
合部と、 上記文字列切り出し部で得られた全文字列について、上
記認識結果文字コード列と、上記単語テーブル内の全数
字文字コード列との間の認識結果を出力する数字単語照
合部と、 上記文字列切り出し部で得られた全文字列について、上
記文字切り出し部より出力された文字画像の大きさのば
らつきをもとに、名称文字列と見なしたときの認識結果
信頼度を算出する名称文字列信頼度計算部と、 上記文字列切り出し部で得られた全文字列について、上
記認識結果文字コード列中の数字の割合をもとに、数字
文字列と見なしたときの認識結果信頼度を算出する数字
文字列信頼度計算部と、 上記文字列切り出し部で得られた全文字列について、上
記名称文字列信頼度計算部により算出された認識結果信
頼度と、上記数字文字列信頼度計算部により算出された
認識結果信頼度とから、名称文字列として見たときの重
み係数と、数字文字列として見たときの重み係数とを算
出する重み計算部と、 名称文字列に対する認識結果と数字文字列に対する認識
結果とを、重みを加えて統合する重み付け統合部とを有
することを特徴とする文字認識装置。 - 【請求項2】 上記文字列切り出し部により得られた文
字列の全ての対について、上記名称単語照合部により得
られた一致文字数に、上記重み計算部により算出された
名称文字列として見たときの重み係数を乗じた値と、上
記数字単語照合部により得られた一致文字数に、上記重
み計算部により算出された数字文字列として見たときの
重み係数を乗じた値との和をスコアとして算出し、最大
スコアを与える名称文字コード列を名称候補として出力
する重み付け統合部とを有することを特徴とする請求項
1記載の文字認識装置。 - 【請求項3】 上記文字列切り出し部で得られた全文字
列の中で、大きさが最大の文字を含む文字列を名称文字
列候補として抽出し、その文字列の認識結果文字コード
列を名称文字列候補として出力する名称文字列候補抽出
部と、 上記文字列切り出し部で得られた全文字列の中で、上記
認識結果文字コード列中の数字の数が最も多いものを数
字文字列候補として抽出し、その文字列の認識結果文字
コード列を数字文字列候補として出力する数字文字列候
補抽出部とを有することを特徴とする請求項1記載の文
字認識装置。 - 【請求項4】 上記数字文字列候補抽出部より出力され
た上記数字文字列候補の上記認識結果文字コード列に対
して、数字文字列の書式を基に、単語照合に使用するた
めの数字部分のみを抽出する数字部分抽出部を有するこ
とを特徴とする請求項3記載の文字認識装置。 - 【請求項5】 名称文字コード列と数字文字コード列の
対が格納されている単語テーブルを用い、 名称文字と数字文字とを含む画像を入力する画像入力段
階と、 上記画像から全ての文字列画像を切り出す文字列切り出
し段階と、 上記文字列画像の各々から全ての文字画像を切り出す文
字切り出し段階と、 上記文字列画像に含まれる全ての文字画像の認識を行
い、認識結果文字コード列を出力する文字認識段階と、 上記文字列切り出し段階で得られた全文字列について、
上記認識結果文字コード列と、上記単語テーブル内の全
名称文字コード列との間の認識結果を出力する名称単語
照合段階と、 上記文字列切り出し段階で得られた全文字列について、
上記認識結果文字コード列と、上記単語テーブル内の全
数字文字コード列との間の認識結果を出力する数字単語
照合段階と、 上記文字列切り出し段階で得られた全文字列について、
上記文字切り出し段階より出力された文字画像の大きさ
のばらつきをもとに、名称文字列と見なしたときの認識
結果信頼度を算出する名称文字列信頼度計算段階と、 上記文字列切り出し段階で得られた全文字列について、
上記認識結果文字コード列中の数字の割合をもとに、数
字文字列と見なしたときの認識結果信頼度を算出する数
字文字列信頼度計算段階と、 上記文字列切り出し段階で得られた全文字列について、
上記名称文字列信頼度計算段階により算出された認識結
果信頼度と、上記数字文字列信頼度計算段階により算出
された認識結果信頼度とから、名称文字列として見たと
きの重み係数と、数字文字列として見たときの重み係数
とを算出する重み計算段階と、 名称文字列に対する認識結果と数字文字列に対する認識
結果とを、重みを加えて統合する重み付け統合段階とを
有することを特徴とする文字認識方法。 - 【請求項6】 上記文字列切り出し段階により得られた
文字列の全ての対について、上記名称単語照合段階によ
り得られた一致文字数に、上記重み計算段階により算出
された名称文字列として見たときの重み係数を乗じた値
と、上記数字単語照合段階により得られた一致文字数
に、上記重み計算段階により算出された数字文字列とし
て見たときの重み係数を乗じた値との和をスコアとして
算出し、最大スコアを与える名称文字コード列を名称候
補として出力する重み付け統合段階とを有することを特
徴とする請求項5記載の文字認識方法。 - 【請求項7】 上記文字列切り出し段階で得られた全文
字列の中で、大きさが最大の文字を含む文字列を名称文
字列候補として抽出し、その文字列の認識結果文字コー
ド列を名称文字列候補として出力する名称文字列候補抽
出段階と、 上記文字列切り出し段階で得られた全文字列の中で、上
記認識結果文字コード列中の数字の数が最も多いものを
数字文字列候補として抽出し、その文字列の認識結果文
字コード列を数字文字列候補として出力する数字文字列
候補抽出段階とを有することを特徴とする請求項5記載
の文字認識方法。 - 【請求項8】 上記数字文字列候補抽出段階より出力さ
れた上記数字文字列候補の上記認識結果文字コード列に
対して、数字文字列の書式を基に、単語照合に使用する
ための数字部分のみを抽出する数字部分抽出段階を有す
ることを特徴とする請求項7記載の文字認識方法。 - 【請求項9】 名称文字コード列と数字文字コード列の
対が格納されている単語テーブルを用い、 名称文字と数字文字とを含む画像を入力する画像入力段
階と、 上記画像から全ての文字列画像を切り出す文字列切り出
し段階と、 上記文字列画像の各々から全ての文字画像を切り出す文
字切り出し段階と、 上記文字列画像に含まれる全ての文字画像の認識を行
い、認識結果文字コード列を出力する文字認識段階と、 上記文字列切り出し段階で得られた全文字列について、
上記認識結果文字コード列と、上記単語テーブル内の全
名称文字コード列との間の認識結果を出力する名称単語
照合段階と、 上記文字列切り出し段階で得られた全文字列について、
上記認識結果文字コード列と、上記単語テーブル内の全
数字文字コード列との間の認識結果を出力する数字単語
照合段階と、 上記文字列切り出し段階で得られた全文字列について、
上記文字切り出し段階より出力された文字画像の大きさ
のばらつきをもとに、名称文字列と見なしたときの認識
結果信頼度を算出する名称文字列信頼度計算段階と、 上記文字列切り出し段階で得られた全文字列について、
上記認識結果文字コード列中の数字の割合をもとに、数
字文字列と見なしたときの認識結果信頼度を算出する数
字文字列信頼度計算段階と、 上記文字列切り出し段階で得られた全文字列について、
上記名称文字列信頼度計算段階により算出された認識結
果信頼度と、上記数字文字列信頼度計算段階により算出
された認識結果信頼度とから、名称文字列として見たと
きの重み係数と、数字文字列として見たときの重み係数
とを算出する重み計算段階と、 名称文字列に対する認識結果と数字文字列に対する認識
結果とを、重みを加えて統合する重み付け統合段階とを
有する文字認識方法をプログラムの形で記録したことを
特徴とする記録媒体。 - 【請求項10】 上記文字列切り出し段階により得られ
た文字列の全ての対について、上記名称単語照合段階に
より得られた一致文字数に、上記重み計算段階により算
出された名称文字列として見たときの重み係数を乗じた
値と、上記数字単語照合段階により得られた一致文字数
に、上記重み計算段階により算出された数字文字列とし
て見たときの重み係数を乗じた値との和をスコアとして
算出し、最大スコアを与える名称文字コード列を名称候
補として出力する重み付け統合段階とを有する文字認識
方法をプログラムの形で記録したことを特徴とする請求
項9記載の記録媒体。 - 【請求項11】 上記文字列切り出し段階で得られた全
文字列の中で、大きさが最大の文字を含む文字列を名称
文字列候補として抽出し、その文字列の認識結果文字コ
ード列を名称文字列候補として出力する名称文字列候補
抽出段階と、 上記文字列切り出し段階で得られた全文字列の中で、上
記認識結果文字コード列中の数字の数が最も多いものを
数字文字列候補として抽出し、その文字列の認識結果文
字コード列を数字文字列候補として出力する数字文字列
候補抽出段階とを有する文字認識方法をプログラムの形
で記録したことを特徴とする請求項9記載の記録媒体。 - 【請求項12】 上記数字文字列候補抽出段階より出力
された上記数字文字列候補の上記認識結果文字コード列
に対して、数字文字列の書式を基に、単語照合に使用す
るための数字部分のみを抽出する数字部分抽出段階を有
する文字認識方法をプログラムの形で記録したことを特
徴とする請求項11記載の記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22291398A JP3360030B2 (ja) | 1998-08-06 | 1998-08-06 | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22291398A JP3360030B2 (ja) | 1998-08-06 | 1998-08-06 | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000057257A JP2000057257A (ja) | 2000-02-25 |
JP3360030B2 true JP3360030B2 (ja) | 2002-12-24 |
Family
ID=16789835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP22291398A Expired - Fee Related JP3360030B2 (ja) | 1998-08-06 | 1998-08-06 | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3360030B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005066882A1 (ja) * | 2004-01-08 | 2005-07-21 | Nec Corporation | 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム |
WO2012121033A1 (ja) | 2011-03-07 | 2012-09-13 | 株式会社エヌ・ティ・ティ・ドコモ | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム |
-
1998
- 1998-08-06 JP JP22291398A patent/JP3360030B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005066882A1 (ja) * | 2004-01-08 | 2005-07-21 | Nec Corporation | 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム |
US7916948B2 (en) | 2004-01-08 | 2011-03-29 | Nec Corporation | Character recognition device, mobile communication system, mobile terminal device, fixed station device, character recognition method and character recognition program |
US8135218B2 (en) | 2004-01-08 | 2012-03-13 | Nec Corporation | Character recognition device, mobile communication system, mobile terminal device, fixed station device, character recognition method and character recognition program |
WO2012121033A1 (ja) | 2011-03-07 | 2012-09-13 | 株式会社エヌ・ティ・ティ・ドコモ | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム |
US8965126B2 (en) | 2011-03-07 | 2015-02-24 | Ntt Docomo, Inc. | Character recognition device, character recognition method, character recognition system, and character recognition program |
Also Published As
Publication number | Publication date |
---|---|
JP2000057257A (ja) | 2000-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019169769A1 (zh) | 广告图片鉴定方法、电子装置及可读存储介质 | |
JP3452774B2 (ja) | 文字認識方法 | |
JP4136316B2 (ja) | 文字列認識装置 | |
CN113094478B (zh) | 表情回复方法、装置、设备及存储介质 | |
CN113705468B (zh) | 基于人工智能的数字图像识别方法及相关设备 | |
JP3360030B2 (ja) | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 | |
CN113762160A (zh) | 一种日期提取方法、装置、计算机设备及存储介质 | |
JP2001022883A (ja) | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 | |
JP3727422B2 (ja) | 文字認識装置及びその方法 | |
CN116886992B (zh) | 一种视频数据的处理方法、装置、电子设备及存储介质 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
Slavin et al. | Matching Digital Copies of Documents Based on OCR | |
JP3188154B2 (ja) | 文字認識処理方法 | |
JPH09114926A (ja) | オンライン文字認識における入力文字大分類方法および装置 | |
JP3114446B2 (ja) | 文字認識装置 | |
JPH08287188A (ja) | 文字列認識装置 | |
JPH06103402A (ja) | 名刺認識装置 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
Maarouf et al. | Correcting optical character recognition result via a novel approach | |
JP2538543B2 (ja) | 文字情報認識装置 | |
JP2977244B2 (ja) | 文字認識方法及び文字認識装置 | |
JP3380850B2 (ja) | 文字認識装置 | |
CN117218673A (zh) | 票据识别方法、装置、计算机可读存储介质及电子设备 | |
CN114708100A (zh) | 一种数据交易合规检测系统及方法 | |
CN117057333A (zh) | 一种金融业务的话术模版挖掘方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071011 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081011 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091011 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101011 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |