JPH11232393A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH11232393A
JPH11232393A JP10032714A JP3271498A JPH11232393A JP H11232393 A JPH11232393 A JP H11232393A JP 10032714 A JP10032714 A JP 10032714A JP 3271498 A JP3271498 A JP 3271498A JP H11232393 A JPH11232393 A JP H11232393A
Authority
JP
Japan
Prior art keywords
character
graphic
code
recognition result
code string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10032714A
Other languages
English (en)
Other versions
JP3380850B2 (ja
Inventor
Nobuo Miyamoto
信夫 宮本
Teruo Akiyama
照雄 秋山
Kenji Ogura
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03271498A priority Critical patent/JP3380850B2/ja
Publication of JPH11232393A publication Critical patent/JPH11232393A/ja
Application granted granted Critical
Publication of JP3380850B2 publication Critical patent/JP3380850B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】看板のようにコーポレートマークが付いた企業
名文字列画像や,商品ラベルのようにブランドマークの
付いた商品名文字列画像等を認識する装置に関し,従来
の文字認識処理や単語照合処理では区別することのでき
なかった類似文字列の区別を可能とし,高い精度の文字
認識を実現する。 【解決手段】認識対象の文字図形画像から切り出した各
単文字図形画像について文字認識を行うとともに,図形
としての認識も行う。類似度の大きな方の認識結果コー
ドを選択して,統合認識結果コード列を生成し,その中
の図形コードを文字コード列に変換する。統合認識結果
コード列から図形コードを除いた文字コード列と図形コ
ード変換で得られた文字コード列とを照合し,一致する
文字コードが所定の割合以上存在するとき,統合認識結
果コード列を図形コード変換で得られた文字コード列で
置換する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,看板のようにコー
ポレートマークが付いた企業名文字列画像や,商品ラベ
ルのようにブランドマークの付いた商品名文字列画像を
認識する装置に関するものである。
【0002】
【従来の技術】従来の文字認識装置は,認識対象の文字
列画像から文字を1文字ずつ切り出して認識するもので
あった。しかしながら,看板や商品ラベルのように,文
字が多様な装飾文字で構成されている場合には,個々の
文字の認識精度は十分ではない。そこで,認識対象文字
列として出現しやすい文字列の表を予め用意しておき,
認識結果文字列との照合の結果,一致文字数の多い文字
列があれば,それを認識結果として出力する単語照合処
理がしばしば用いられてきた。
【0003】
【発明が解決しようとする課題】単語照合処理の効果を
上げるためには,出現の可能性のある文字列をできるだ
け多く表に登録する必要がある。しかし,その一方で登
録文字列数を増やせば増やすほど類似した文字列が登録
され,単語照合処理では認識結果を確定できないという
問題があった。例えば,入力文字列画像として「A信託
銀行」が入力されたとき,たとえ「A信託銀行」が表に
登録されていても,他に「B信託銀行」が登録されてい
ると,先頭文字「A」が誤認識されたときには,それが
「A信託銀行」なのか「B信託銀行」なのかを決定する
ことができなかった。
【0004】本発明は上記事情に鑑みてなされたもの
で,その目的とするところは,文字と図形が混在した画
像について高精度な認識が可能な文字認識装置を提供す
ることにある。
【0005】
【課題を解決するための手段】本発明は上記目的を達成
するため,認識対象文字列がしばしば伴うコーポレート
マークやブランドマーク等の図形から得られる情報を利
用する。具体的には,コーポレートマークやブランドマ
ークを認識して得られる認識結果文字コード列と,文字
列を認識して得られる認識結果文字コード列とを照合
し,一致文字数が多いときには,コーポレートマークや
ブランドマークから得られた認識結果文字コード列を出
力する。
【0006】そのための手段として,単文字図形切出し
手段により切り出された単文字図形画像をすべて図形と
して認識を行い,認識結果図形コードと類似度を出力す
る図形認識手段と,単文字図形画像の各々について,文
字認識手段により得られた類似度と,図形認識手段によ
り得られた類似度とを比較し,類似度の大きな方の認識
結果コードを選択することにより,統合された認識結果
コード列を生成する認識結果統合手段と,図形コード毎
に指定された文字コード列を格納する図形コード変換テ
ーブルと,認識結果統合手段により生成された統合認識
結果コード列の中の図形コードを選択し,図形コード変
換テーブルを用いて文字コード列に変換する図形コード
変換手段と,統合認識結果コード列からすべての図形コ
ードを除いた文字コード列と,図形コード変換手段によ
り図形コードから変換された文字コード列との照合を行
い,一致する文字コードが所定の割合以上存在すると
き,統合認識結果コード列を,図形コード変換手段によ
り得られた文字コード列で置換する認識結果置換手段と
を有することを主要な特徴とする。
【0007】一般に,文字列として類似した企業名や商
品名であっても,コーポレートマークやブランドマーク
は異なる場合が多い。そのため,従来の文字認識処理や
単語照合処理では区別することのできなかった類似文字
列の区別が可能となり,高い精度の文字認識が実現でき
る。
【0008】
【発明の実施の形態】以下,本発明の実施の形態を図面
を参照して詳細に説明する。図1は,本発明の一実施形
態である文字認識装置のブロック図である。
【0009】この文字認識装置は,文字図形画像格納部
1と,単文字図形切出し部2と,文字認識部3と,図形
認識部4と,認識結果統合部5と,図形コード変換部6
と,図形コード変換テーブル7と,認識結果置換部8と
で構成されている。図1において,文字図形画像格納部
1,単文字図形切出し部2,文字認識部3の部分が従来
技術と同様な部分で,図形認識部4,認識結果統合部
5,図形コード変換部6,図形コード変換テーブル7,
認識結果置換部8の部分が,本発明を実施するために新
たに追加した部分である。
【0010】文字図形画像格納部1には,複数の文字お
よび図形が混在した認識対象となる文字図形画像が格納
されている。単文字図形切出し部2は,文字図形画像格
納部1に格納されている文字図形画像を読み出し,1文
字分または1図形分ずつの単文字図形画像を切り出す。
【0011】文字認識部3は,単文字図形切出し部2で
切り出された単文字図形画像を,文字として認識を行
い,認識結果コード(文字コード)とそのときの認識に
用いた標準パターン等との類似度を出力する。
【0012】図形認識部4は,単文字図形切出し部2で
切り出された単文字図形画像を,図形として認識を行
い,認識結果コード(図形コード)とそのときの認識に
用いた標準パターン等との類似度を出力する。
【0013】認識結果統合部5は,同一の単文字図形画
像毎に,文字認識部3により得られた類似度と,図形認
識部4により得られた類似度とを比較し,類似度の大き
な方の認識結果コードを選択し,統合認識結果コード列
を生成する。
【0014】図形コード変換部6は,統合認識結果コー
ド列に含まれる図形コードを,図形コード変換テーブル
7を用いて文字コード列に変換する。認識結果置換部8
は,統合認識結果コード列からすべての図形コードを除
いた文字コード列と,図形コード変換部6により変換さ
れた文字コード列との照合を行い,一致する文字コード
が所定の割合以上存在するとき,統合認識結果コード列
を図形コード変換部6により変換された文字コード列で
置換し,出力する。
【0015】図2は,図形コード変換テーブル7の一例
を示す図である。図形に割り当てられるコードは,文字
に割り当てられたコード(シフトJISコード等)の部
分を除いた領域で,図2の例ではF180〜F1EF
(16進表現)の範囲を使用している。例えばF180
という図形コードが入力されると,F180をアドレス
としてテーブルが参照され,対応する“A信託銀行”と
いう文字列が出力される。
【0016】このように構成した文字認識装置の動作お
よび作用を説明する。図3は,図1に示した文字認識装
置の動作を示すフローチャートである。また,図4は,
図1に示した文字認識装置による認識の例を示す。
【0017】まず,ステップ101において,例えば図
4(a)に示すような文字と図形とが混在した文字図形
画像を読み込む。続いて,ステップ102で読み込んだ
文字図形画像から1文字分または1図形分ずつ単文字図
形画像を切り出す。これにより,図4(a)の文字図形
画像から図4(b)に示すような単文字図形画像が切り
出される。
【0018】切り出された単文字図形画像は,ステップ
103では文字として認識され,各々を文字として見た
場合の認識結果文字コードと類似度が出力される。図4
(c)は,図4(b)の単文字図形を文字認識した結果
の認識結果文字コードと類似度の例を示す。
【0019】また,ステップ104では,切り出された
単文字図形画像を図形として認識する。図4(d)は,
図4(b)の単文字図形を図形認識した結果の認識結果
図形コードと類似度の例を示す。
【0020】ステップ103,104の処理により得ら
れた認識結果文字コードと認識結果図形コードは,ステ
ップ105でその類似度の大きな方の認識結果コードを
残して統合される。ステップ102からステップ105
までの処理を,ステップ101で読み込まれた文字図形
画像中の全単文字図形画像について完了するまで繰り返
す。この結果,図4(e)に示すような統合認識結果コ
ード列が得られる。
【0021】次に,ステップ107で統合認識結果コー
ド列の先頭から順次認識結果コードを読み出し,ステッ
プ108でそれが図形コードか否かを判定する。図形コ
ードでないときは,ステップ114に進み,そのコード
が最終の統合認識結果コードならば処理を完了し,そう
でなければステップ107に戻って次の統合認識結果コ
ードの処理に進む。図形コードのときは,ステップ10
9で認識結果図形コードを図形コード変換テーブル7で
指定される文字コード列に変換する。図4(e)の統合
認識結果コード列の場合,図形コード変換テーブル7の
参照により,先頭の図形“◎”の図形コードが“あいう
えお”の文字コード列に変換されることになる。
【0022】続いて,ステップ110で統合認識結果コ
ード列から図形コードを除去する。図4(e)の統合認
識結果コード列から図形コードを除去すると,“まいう
えお”となる。
【0023】ステップ111では,,ステップ109で
変換された文字コード列“あいうえお”と,ステップ1
10で作成された文字コード列“まいうえお”との照合
を行って,一致したコードの割合を算出する。図4の例
では,一致コードの割合は,80%である。
【0024】ステップ112では,一致した文字コード
の割合が予め設定された閾値θ以上か否かの判定を行
う。閾値θ未満のときは,ステップ114に進み,その
コードが最終の統合認識結果コードならば処理を完了
し,そうでなければステップ107に戻って次の統合認
識結果コードの処理に進む。閾値θ以上のときは,統合
認識結果コード列を図形コード変換部6により変換され
た文字コード列で置換・出力して処理を終了する。
【0025】図4の例の場合,閾値θは50%としてい
る。図4(f)に示すように,一致コードの割合は80
%であり,これは閾値θ=50%より大きいので,認識
結果コード列が図形コード変換部6により変換された文
字コード列で置換され,出力文字コード列は,図4
(g)に示すように“あいうえお”となる。
【0026】なお,図形コードを文字コード列に変換し
た結果について,一致コードの割合がすべて閾値θ未満
であり,ステップ113での認識結果コード列置換が行
われなかった場合には,例えば以下のものを認識結果と
して出力する。
【0027】 統合認識結果コード列 統合認識結果コード列から図形コードを除いたもの すべて文字として認識した結果の認識結果文字コー
ド列 認識結果文字コード列と認識結果図形コード列の両
方 この中のどれを出力するかは,ユーザに選択させるよう
にしてもよいし,認識対象となる画像の特性からあらか
じめ決めておくようにしてもよい。
【0028】
【発明の効果】以上説明したように,本発明によれば,
文字列だけではなく,コーポレートマークやブランドマ
ーク等の図形から得られる情報を認識に利用するため,
従来の文字認識処理や単語照合処理では区別することの
できなかった類似文字列の区別が可能となり,高い精度
の文字認識が実現できる。
【図面の簡単な説明】
【図1】本発明の一実施形態である文字認識装置のブロ
ック図である。
【図2】図形コード変換テーブルの一例を示す図であ
る。
【図3】図1に示した文字認識装置の動作を示すフロー
チャートである。
【図4】図1に示した文字認識装置による認識の例を示
す図である。
【符号の説明】
1 文字図形画像格納部 2 単文字図形切出し部 3 文字認識部 4 図形認識部 5 認識結果統合部 6 図形コード変換部 7 図形コード変換テーブル 8 認識結果置換部 101〜114 動作フローにおける各ステップ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字および図形が混在した文字図形画像
    を格納する文字図形画像格納手段と,上記文字図形画像
    格納手段から文字図形画像を読み出し,単文字図形画像
    をすべて切り出す単文字図形切出し手段と,上記単文字
    図形切出し手段により切り出された単文字図形画像をす
    べて文字として認識を行い,認識結果文字コードと類似
    度を出力する文字認識手段と,上記単文字図形切出し手
    段により切り出された単文字図形画像をすべて図形とし
    て認識を行い,認識結果図形コードと類似度を出力する
    図形認識手段と,上記単文字図形画像の各々について,
    上記文字認識手段により得られた類似度と,上記図形認
    識手段により得られた類似度とを比較し,類似度の大き
    な方の認識結果コードを選択することにより,統合され
    た認識結果コード列を生成する認識結果統合手段と,図
    形コード毎に指定された文字コード列を格納する図形コ
    ード変換テーブルと,上記認識結果統合手段により生成
    された統合認識結果コード列の中の図形コードを選択
    し,上記図形コード変換テーブルを用いて文字コード列
    に変換する図形コード変換手段と,上記統合認識結果コ
    ード列からすべての図形コードを除いた文字コード列
    と,上記図形コード変換手段により変換された文字コー
    ド列との照合を行い,一致する文字コードが所定の割合
    以上存在するとき,上記統合認識結果コード列を,上記
    図形コード変換手段により得られた文字コード列で置換
    する認識結果置換手段とを有することを特徴とする文字
    認識装置。
JP03271498A 1998-02-16 1998-02-16 文字認識装置 Expired - Fee Related JP3380850B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03271498A JP3380850B2 (ja) 1998-02-16 1998-02-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03271498A JP3380850B2 (ja) 1998-02-16 1998-02-16 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11232393A true JPH11232393A (ja) 1999-08-27
JP3380850B2 JP3380850B2 (ja) 2003-02-24

Family

ID=12366515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03271498A Expired - Fee Related JP3380850B2 (ja) 1998-02-16 1998-02-16 文字認識装置

Country Status (1)

Country Link
JP (1) JP3380850B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6798058B1 (en) 1999-02-18 2004-09-28 Seiko Epson Corporation Semiconductor device, mounting and method of manufacturing mounting substrate, circuit board, and electronic instrument

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6798058B1 (en) 1999-02-18 2004-09-28 Seiko Epson Corporation Semiconductor device, mounting and method of manufacturing mounting substrate, circuit board, and electronic instrument
US7163613B2 (en) 1999-02-18 2007-01-16 Seiko Epson Corporation Method of manufacturing a semiconductor device by forming plating layers having differing thicknesses
US8110245B2 (en) 1999-02-18 2012-02-07 Seiko Epson Corporation Semiconductor device, mounting substrate and method of manufacturing mounting substrate, circuit board, and electronic instrument

Also Published As

Publication number Publication date
JP3380850B2 (ja) 2003-02-24

Similar Documents

Publication Publication Date Title
US5031225A (en) Character recognition method for recognizing character in an arbitrary rotation position
US7200811B1 (en) Form processing apparatus, form processing method, recording medium and program
US6535652B2 (en) Image retrieval apparatus and method, and computer-readable memory therefor
JPH07152774A (ja) 文書検索方法および装置
JP3380850B2 (ja) 文字認識装置
JP3727422B2 (ja) 文字認識装置及びその方法
JPH07168913A (ja) 文字認識システム
JPH06103402A (ja) 名刺認識装置
JPH0991371A (ja) 文字表示装置
JPH10198688A (ja) 定型文書読み取り装置
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JP2004086846A (ja) 情報区分装置、方法及びプログラム、並びに、情報区分プログラムを記録した記録媒体
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
JPH10124615A (ja) 文字認識方法
JPS63282586A (ja) 文字認識装置
JPH07152856A (ja) 光学的文字読取装置
JP2000132635A (ja) 認識データ確認方法
JPH01166187A (ja) 文字認識方法
JPH05217017A (ja) 光学式文字読取装置
JP2570571B2 (ja) 光学文字読取装置
US20040199377A1 (en) Information processing apparatus, information processing method and program, and storage medium
JPH0944604A (ja) 文字認識処理方法
JP2784004B2 (ja) 文字認識装置
JPH03163681A (ja) 文字認識装置
JPH08241314A (ja) 文書ファイリングシステム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081213

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091213

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees