JP3380850B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3380850B2
JP3380850B2 JP03271498A JP3271498A JP3380850B2 JP 3380850 B2 JP3380850 B2 JP 3380850B2 JP 03271498 A JP03271498 A JP 03271498A JP 3271498 A JP3271498 A JP 3271498A JP 3380850 B2 JP3380850 B2 JP 3380850B2
Authority
JP
Japan
Prior art keywords
character
code
graphic
recognition result
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03271498A
Other languages
English (en)
Other versions
JPH11232393A (ja
Inventor
信夫 宮本
照雄 秋山
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03271498A priority Critical patent/JP3380850B2/ja
Publication of JPH11232393A publication Critical patent/JPH11232393A/ja
Application granted granted Critical
Publication of JP3380850B2 publication Critical patent/JP3380850B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は,看板のようにコー
ポレートマークが付いた企業名文字列画像や,商品ラベ
ルのようにブランドマークの付いた商品名文字列画像を
認識する装置に関するものである。 【0002】 【従来の技術】従来の文字認識装置は,認識対象の文字
列画像から文字を1文字ずつ切り出して認識するもので
あった。しかしながら,看板や商品ラベルのように,文
字が多様な装飾文字で構成されている場合には,個々の
文字の認識精度は十分ではない。そこで,認識対象文字
列として出現しやすい文字列の表を予め用意しておき,
認識結果文字列との照合の結果,一致文字数の多い文字
列があれば,それを認識結果として出力する単語照合処
理がしばしば用いられてきた。 【0003】 【発明が解決しようとする課題】単語照合処理の効果を
上げるためには,出現の可能性のある文字列をできるだ
け多く表に登録する必要がある。しかし,その一方で登
録文字列数を増やせば増やすほど類似した文字列が登録
され,単語照合処理では認識結果を確定できないという
問題があった。例えば,入力文字列画像として「A信託
銀行」が入力されたとき,たとえ「A信託銀行」が表に
登録されていても,他に「B信託銀行」が登録されてい
ると,先頭文字「A」が誤認識されたときには,それが
「A信託銀行」なのか「B信託銀行」なのかを決定する
ことができなかった。 【0004】本発明は上記事情に鑑みてなされたもの
で,その目的とするところは,文字と図形が混在した画
像について高精度な認識が可能な文字認識装置を提供す
ることにある。 【0005】 【課題を解決するための手段】本発明は上記目的を達成
するため,認識対象文字列がしばしば伴うコーポレート
マークやブランドマーク等の図形から得られる情報を利
用する。具体的には,コーポレートマークやブランドマ
ークを認識して得られる認識結果文字コード列と,文字
列を認識して得られる認識結果文字コード列とを照合
し,一致文字数が多いときには,コーポレートマークや
ブランドマークから得られた認識結果文字コード列を出
力する。 【0006】そのための手段として,単文字図形切出し
手段により切り出された単文字図形画像をすべて図形と
して認識を行い,認識結果図形コードと類似度を出力す
る図形認識手段と,単文字図形画像の各々について,文
字認識手段により得られた類似度と,図形認識手段によ
り得られた類似度とを比較し,類似度の大きな方の認識
結果コードを選択することにより,統合された認識結果
コード列を生成する認識結果統合手段と,図形コード毎
に指定された文字コード列を格納する図形コード変換テ
ーブルと,認識結果統合手段により生成された統合認識
結果コード列の中の図形コードを選択し,図形コード変
換テーブルを用いて文字コード列に変換する図形コード
変換手段と,統合認識結果コード列からすべての図形コ
ードを除いた文字コード列と,図形コード変換手段によ
り図形コードから変換された文字コード列との照合を行
い,一致する文字コードが所定の割合以上存在すると
き,統合認識結果コード列を,図形コード変換手段によ
り得られた文字コード列で置換する認識結果置換手段と
を有することを主要な特徴とする。 【0007】一般に,文字列として類似した企業名や商
品名であっても,コーポレートマークやブランドマーク
は異なる場合が多い。そのため,従来の文字認識処理や
単語照合処理では区別することのできなかった類似文字
列の区別が可能となり,高い精度の文字認識が実現でき
る。 【0008】 【発明の実施の形態】以下,本発明の実施の形態を図面
を参照して詳細に説明する。図1は,本発明の一実施形
態である文字認識装置のブロック図である。 【0009】この文字認識装置は,文字図形画像格納部
1と,単文字図形切出し部2と,文字認識部3と,図形
認識部4と,認識結果統合部5と,図形コード変換部6
と,図形コード変換テーブル7と,認識結果置換部8と
で構成されている。図1において,文字図形画像格納部
1,単文字図形切出し部2,文字認識部3の部分が従来
技術と同様な部分で,図形認識部4,認識結果統合部
5,図形コード変換部6,図形コード変換テーブル7,
認識結果置換部8の部分が,本発明を実施するために新
たに追加した部分である。 【0010】文字図形画像格納部1には,複数の文字お
よび図形が混在した認識対象となる文字図形画像が格納
されている。単文字図形切出し部2は,文字図形画像格
納部1に格納されている文字図形画像を読み出し,1文
字分または1図形分ずつの単文字図形画像を切り出す。 【0011】文字認識部3は,単文字図形切出し部2で
切り出された単文字図形画像を,文字として認識を行
い,認識結果コード(文字コード)とそのときの認識に
用いた標準パターン等との類似度を出力する。 【0012】図形認識部4は,単文字図形切出し部2で
切り出された単文字図形画像を,図形として認識を行
い,認識結果コード(図形コード)とそのときの認識に
用いた標準パターン等との類似度を出力する。 【0013】認識結果統合部5は,同一の単文字図形画
像毎に,文字認識部3により得られた類似度と,図形認
識部4により得られた類似度とを比較し,類似度の大き
な方の認識結果コードを選択し,統合認識結果コード列
を生成する。 【0014】図形コード変換部6は,統合認識結果コー
ド列に含まれる図形コードを,図形コード変換テーブル
7を用いて文字コード列に変換する。認識結果置換部8
は,統合認識結果コード列からすべての図形コードを除
いた文字コード列と,図形コード変換部6により変換さ
れた文字コード列との照合を行い,一致する文字コード
が所定の割合以上存在するとき,統合認識結果コード列
を図形コード変換部6により変換された文字コード列で
置換し,出力する。 【0015】図2は,図形コード変換テーブル7の一例
を示す図である。図形に割り当てられるコードは,文字
に割り当てられたコード(シフトJISコード等)の部
分を除いた領域で,図2の例ではF180〜F1EF
(16進表現)の範囲を使用している。例えばF180
という図形コードが入力されると,F180をアドレス
としてテーブルが参照され,対応する“A信託銀行”と
いう文字列が出力される。 【0016】このように構成した文字認識装置の動作お
よび作用を説明する。図3は,図1に示した文字認識装
置の動作を示すフローチャートである。また,図4は,
図1に示した文字認識装置による認識の例を示す。 【0017】まず,ステップ101において,例えば図
4(a)に示すような文字と図形とが混在した文字図形
画像を読み込む。続いて,ステップ102で読み込んだ
文字図形画像から1文字分または1図形分ずつ単文字図
形画像を切り出す。これにより,図4(a)の文字図形
画像から図4(b)に示すような単文字図形画像が切り
出される。 【0018】切り出された単文字図形画像は,ステップ
103では文字として認識され,各々を文字として見た
場合の認識結果文字コードと類似度が出力される。図4
(c)は,図4(b)の単文字図形を文字認識した結果
の認識結果文字コードと類似度の例を示す。 【0019】また,ステップ104では,切り出された
単文字図形画像を図形として認識する。図4(d)は,
図4(b)の単文字図形を図形認識した結果の認識結果
図形コードと類似度の例を示す。 【0020】ステップ103,104の処理により得ら
れた認識結果文字コードと認識結果図形コードは,ステ
ップ105でその類似度の大きな方の認識結果コードを
残して統合される。ステップ102からステップ105
までの処理を,ステップ101で読み込まれた文字図形
画像中の全単文字図形画像について完了するまで繰り返
す。この結果,図4(e)に示すような統合認識結果コ
ード列が得られる。 【0021】次に,ステップ107で統合認識結果コー
ド列の先頭から順次認識結果コードを読み出し,ステッ
プ108でそれが図形コードか否かを判定する。図形コ
ードでないときは,ステップ114に進み,そのコード
が最終の統合認識結果コードならば処理を完了し,そう
でなければステップ107に戻って次の統合認識結果コ
ードの処理に進む。図形コードのときは,ステップ10
9で認識結果図形コードを図形コード変換テーブル7で
指定される文字コード列に変換する。図4(e)の統合
認識結果コード列の場合,図形コード変換テーブル7の
参照により,先頭の図形“◎”の図形コードが“あいう
えお”の文字コード列に変換されることになる。 【0022】続いて,ステップ110で統合認識結果コ
ード列から図形コードを除去する。図4(e)の統合認
識結果コード列から図形コードを除去すると,“まいう
えお”となる。 【0023】ステップ111では,,ステップ109で
変換された文字コード列“あいうえお”と,ステップ1
10で作成された文字コード列“まいうえお”との照合
を行って,一致したコードの割合を算出する。図4の例
では,一致コードの割合は,80%である。 【0024】ステップ112では,一致した文字コード
の割合が予め設定された閾値θ以上か否かの判定を行
う。閾値θ未満のときは,ステップ114に進み,その
コードが最終の統合認識結果コードならば処理を完了
し,そうでなければステップ107に戻って次の統合認
識結果コードの処理に進む。閾値θ以上のときは,統合
認識結果コード列を図形コード変換部6により変換され
た文字コード列で置換・出力して処理を終了する。 【0025】図4の例の場合,閾値θは50%としてい
る。図4(f)に示すように,一致コードの割合は80
%であり,これは閾値θ=50%より大きいので,認識
結果コード列が図形コード変換部6により変換された文
字コード列で置換され,出力文字コード列は,図4
(g)に示すように“あいうえお”となる。 【0026】なお,図形コードを文字コード列に変換し
た結果について,一致コードの割合がすべて閾値θ未満
であり,ステップ113での認識結果コード列置換が行
われなかった場合には,例えば以下のものを認識結果と
して出力する。 【0027】 統合認識結果コード列 統合認識結果コード列から図形コードを除いたもの すべて文字として認識した結果の認識結果文字コー
ド列 認識結果文字コード列と認識結果図形コード列の両
方 この中のどれを出力するかは,ユーザに選択させるよう
にしてもよいし,認識対象となる画像の特性からあらか
じめ決めておくようにしてもよい。 【0028】 【発明の効果】以上説明したように,本発明によれば,
文字列だけではなく,コーポレートマークやブランドマ
ーク等の図形から得られる情報を認識に利用するため,
従来の文字認識処理や単語照合処理では区別することの
できなかった類似文字列の区別が可能となり,高い精度
の文字認識が実現できる。
【図面の簡単な説明】 【図1】本発明の一実施形態である文字認識装置のブロ
ック図である。 【図2】図形コード変換テーブルの一例を示す図であ
る。 【図3】図1に示した文字認識装置の動作を示すフロー
チャートである。 【図4】図1に示した文字認識装置による認識の例を示
す図である。 【符号の説明】 1 文字図形画像格納部 2 単文字図形切出し部 3 文字認識部 4 図形認識部 5 認識結果統合部 6 図形コード変換部 7 図形コード変換テーブル 8 認識結果置換部 101〜114 動作フローにおける各ステップ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−116720(JP,A) 特開 平8−83320(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/76

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 文字領域と図形領域との区別のない一つ
    の認識対象画像内に文字および図形が混在した文字図形
    画像が表す文字列を認識する文字認識装置であって, 前記 文字および図形が混在した文字図形画像を格納する
    文字図形画像格納手段と, 上記文字図形画像格納手段から文字図形画像を読み出
    し,単文字図形画像をすべて切り出す単文字図形切出し
    手段と, 上記単文字図形切出し手段により切り出された単文字図
    形画像をすべて文字として認識を行い,認識結果文字コ
    ードと類似度を出力する文字認識手段と, 上記単文字図形切出し手段により切り出された単文字図
    形画像をすべて図形として認識を行い,認識結果図形コ
    ードと類似度を出力する図形認識手段と, 上記単文字図形画像の各々について,上記文字認識手段
    により得られた類似度と,上記図形認識手段により得ら
    れた類似度とを比較し,類似度の大きな方の認識結果コ
    ードを選択することにより,統合された認識結果コード
    列を生成する認識結果統合手段と, 図形コード毎に指定された文字コード列を格納する図形
    コード変換テーブルと, 上記認識結果統合手段により生成された統合認識結果コ
    ード列の中の図形コードを選択し,上記図形コード変換
    テーブルを用いて文字コード列に変換する図形コード変
    換手段と, 上記統合認識結果コード列からすべての図形コードを除
    いた文字コード列と,上記図形コード変換手段により変
    換された文字コード列との照合を行い,一致する文字コ
    ードが所定の割合以上存在するとき,上記統合認識結果
    コード列を,上記図形コード変換手段により得られた文
    字コード列で置換する認識結果置換手段とを有すること
    を特徴とする文字認識装置。
JP03271498A 1998-02-16 1998-02-16 文字認識装置 Expired - Fee Related JP3380850B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03271498A JP3380850B2 (ja) 1998-02-16 1998-02-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03271498A JP3380850B2 (ja) 1998-02-16 1998-02-16 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11232393A JPH11232393A (ja) 1999-08-27
JP3380850B2 true JP3380850B2 (ja) 2003-02-24

Family

ID=12366515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03271498A Expired - Fee Related JP3380850B2 (ja) 1998-02-16 1998-02-16 文字認識装置

Country Status (1)

Country Link
JP (1) JP3380850B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3952129B2 (ja) 1999-02-18 2007-08-01 セイコーエプソン株式会社 半導体装置、実装基板及びその製造方法、回路基板並びに電子機器

Also Published As

Publication number Publication date
JPH11232393A (ja) 1999-08-27

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JP3425408B2 (ja) 文書読取装置
US5724597A (en) Method and system for matching names and addresses
US6884075B1 (en) System and method for communication of character sets via supplemental or alternative visual stimuli
US7200811B1 (en) Form processing apparatus, form processing method, recording medium and program
US6535652B2 (en) Image retrieval apparatus and method, and computer-readable memory therefor
JP3380850B2 (ja) 文字認識装置
JPH06103402A (ja) 名刺認識装置
JP3188154B2 (ja) 文字認識処理方法
JPH0991371A (ja) 文字表示装置
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
JPH10198688A (ja) 定型文書読み取り装置
JP2842263B2 (ja) 住所読み取り装置
JP3548372B2 (ja) 文字認識装置
US7349846B2 (en) Information processing apparatus, method, program, and storage medium for inputting a pronunciation symbol
JP2000132635A (ja) 認識データ確認方法
JPS63282586A (ja) 文字認識装置
JP3292595B2 (ja) 文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JP3251704B2 (ja) 認識処理装置
JP2851865B2 (ja) 文字認識装置
JPH01166187A (ja) 文字認識方法
JP2784004B2 (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JP2000099631A (ja) パターン認識装置及びパターン認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081213

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091213

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees