JPH1021334A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH1021334A
JPH1021334A JP8172615A JP17261596A JPH1021334A JP H1021334 A JPH1021334 A JP H1021334A JP 8172615 A JP8172615 A JP 8172615A JP 17261596 A JP17261596 A JP 17261596A JP H1021334 A JPH1021334 A JP H1021334A
Authority
JP
Japan
Prior art keywords
image
character
template
binarized
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8172615A
Other languages
English (en)
Inventor
Tatsuya Aoyama
達也 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP8172615A priority Critical patent/JPH1021334A/ja
Publication of JPH1021334A publication Critical patent/JPH1021334A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字を含む画像から精度良くかつ迅速に文字
を認識する。 【解決手段】 文字を含む画像中から文字を認識する文
字認識装置10において、2値化画像生成手段20により原
画像を2値化して2値化画像を生成し、選択手段40によ
り文字を含む画像を生成する各種装置毎の固有の文字の
テンプレート5を備えた辞書35から、外部入力手段50に
より入力された認識すべき文字を含む画像を生成した装
置の情報に応じて装置固有の文字のテンプレート5を選
択し、この選択手段40によって選択されたテンプレート
5を用いて、マッチング手段30により2値化画像生成手
段20によって生成された2値化画像に対して文字パター
ンマッチングさせることにより文字を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字を含む画像中
から文字を認識する装置に関するものであり、詳細には
テンプレートを用いた文字のパターンマッチングによる
文字認識装置に関するものである。
【0002】
【従来の技術】従来より、人体等の被写体をCT、MR
I等によって撮影して得られた医用画像の画像データ
を、各画像データに適切な画像処理を施した後、画像を
再生記録することが行われており、これらの画像データ
に基づき被写体の画像を写真感光材料等の記録材料、C
RT等に可視像として出力させる画像記録再生システム
がすでに実用化されている。
【0003】通常医用画像には、患者名、ID番号、撮
影日、生年月日等のID情報が付されており、これらの
ID情報は、一般に漢字、かな、英文字、数字、記号等
(以下「文字」と総称する)から構成されている。従っ
て、医用画像には絵柄と文字とが混在している。この絵
柄と文字が混在した医用画像から自動的に文字のみを識
別する、あるいは文字と絵柄を分離すること等が望まれ
る場合がある。それは、例えば以下のような場合であ
る。
【0004】通常、画像記録再生システムにおいては、
撮影された画像データが検索情報となるID情報と関連
づけてファイリング装置に記憶されている。このファイ
リング装置への画像データファイリング時の画像データ
とID情報との関連づけは、外部入力により行われてお
り操作者側の負担となっていた。そのため、撮影時に画
像中に付されたID情報を自動的に認識できるようにす
ることが望まれている。
【0005】また、画像記録再生システムにおいて、上
記のように画像データを得てこの画像データに基づいて
可視画像を再生する場合、その可視画像のうち観察対象
となる関心領域をより詳細に観察するため、その関心領
域を拡大して再生することがある。この拡大再生画像
は、原画像を読み取って得られた原画像データに対して
所定の補間演算処理を施して原画像データ数とは異なる
データ数の2次元的な画像データである補間画像データ
を求め、この補間画像データに基づいて画像再生を行う
ことにより得ることができる。画像にはID情報等の文
字と絵柄が同時に存在するが、拡大に際しては文字と絵
柄は別々の補間処理を行い、文字はより鮮鋭に、また絵
柄は絵柄の性質にあった補間方法を施して拡大補間する
ことが望ましい。この場合、まず、画像から文字を認識
して文字と絵柄を分離する必要がある。
【0006】従来、文字を含む画像から文字を認識する
ための方法としては、認識すべき文字のテンプレートを
用意し、画像と比較して認識を行うテンプレートマッチ
ングという方法が知られている。この方法は、画像上の
認識対象領域と全てのテンプレートとを順次マッチング
させ、マッチング結果が最も良いテンプレートを認識結
果とするものであり、認識対象領域が指定されていない
場合は画像上での認識対象領域を順次ずらして、画像全
面に対してマッチングをとっていく必要がある。
【0007】以下、一般的なテンプレートマッチングに
よる認識方法を説明する。画像パターンfとテンプレー
トパターンgが、それぞれ図5に示すような大きさと位
置関係にあるとき、画像の点(m,n)における画像パタ
ーンfと、テンプレートパターンgの類似度は、以下に
示す評価関数で表される。
【0008】
【数1】
【0009】ここで通常、R(m,n)は相互相関係数と呼
ばれ、領域Dは、|i-m|<M/2,|j-n|<N/2を満たす
(i,j) の範囲である。画像上でテンプレートを動か
して順次、画像とテンプレートとの類似度を上記の相互
相関係数Rにより判別する。相互相関係数Rの値は大き
いほど画像の(m,n)を中心としてテンプレートに近い
図形が存在すること、すなわち、画像とテンプレートと
の相関が強いことを示し、画像とテンプレートとが完全
一致で1の値、全くの不一致で0の値をとる。通常、最
も相互相関係数Rの大きいものを認識結果とする。
【0010】
【発明が解決しようとする課題】しかしながら、上記の
テンプレートマッチング方法では、各種装置に使われて
いる文字のテンプレート全てとマッチングを行うとマッ
チング処理の回数が多くなること、上記式に示されるよ
うに2乗や平方根の計算が必要であること、また、通常
多階調の画像に対してマッチングを行うことから、計算
量が多くなり認識に時間がかかるという欠点がある。
【0011】そこで、本発明は上記事情に鑑み、文字を
含む画像から精度良く簡単にかつ迅速に文字を認識する
文字認識装置を提供することを目的とする。
【0012】
【課題を解決するための手段】本発明の文字認識装置
は、各種装置によって生成された文字を含む画像中から
該文字を認識する文字認識装置において、前記各種装置
毎の固有の文字のテンプレートを備えた辞書と、前記画
像を生成した装置の情報が入力され、入力された該情報
に応じて該装置に固有の文字のテンプレートを前記辞書
から選択する選択手段と、前記画像中の文字に対して前
記選択されたテンプレートを用いて文字パターンマッチ
ングさせることにより文字を認識するマッチング手段と
を備えてなることを特徴とするものである。
【0013】すなわち、画像を生成した装置の情報を入
力して、該装置が用いている文字のテンプレートについ
てのみマッチングさせるようにしたものである。
【0014】ここで、各種装置毎の固有の文字のテンプ
レートとは、各種装置が画像撮影時に該画像にID情報
等の文字情報を付するのに用いている文字の種類、大き
さ等を含む文字フォントについてのテンプレートのこと
をいう。
【0015】また、前記画像を2値化して、2値化画像
を生成する2値化画像生成手段を備え、前記マッチング
を前記2値化画像に対してマッチングさせる形態であっ
てもよい。
【0016】なお、前記2値化画像生成手段は、画像の
輪郭を抽出する手段を含むものであることが望ましい。
特に、前記2値化画像生成手段が、前記画像の各画素毎
に該画素の所定近傍範囲中の画素濃度の最大値と最小値
との差を求める演算手段と、前記濃度差と所定の閾値と
の比較により前記各画素を2値化して画像の輪郭を抽出
する2値化手段とから成るものとするのが望ましい。こ
れは、各画素毎に該画素の所定近傍範囲中の画素濃度の
最大値と最小値との差を所定の閾値と比較して2値化す
ることにより画像中の文字の輪郭を抽出し、その輪郭を
に対してパターンマッチングさせて文字認識を行うもの
である。
【0017】そのほか、輪郭の抽出方法としては、例え
ば一次微分フィルタ(ロバーツのフィルタ、ブレヴィッ
トのフィルタ、ソーベルのフィルタ等)あるいはラプラ
シアンフィルタ等を用いる方法が挙げられる。なお、こ
こで画像とは文字および絵柄が混在したものをいう。
【0018】
【発明の効果】本発明の文字認識装置は、辞書の有する
全てのテンプレートについてマッチングするのではな
く、画像を生成した装置の情報が入力され、その情報に
応じて装置固有の文字のテンプレートを選択することに
より、各装置に対応したテンプレートについてのみマッ
チングさせることができるので、計算量を大幅に低減す
ることができる。
【0019】また、画像を2値化した後に、文字パター
ンマッチングを行うことにより、マッチング時になされ
る演算を簡単化して、計算量を低減することができる。
このため、装置を簡便化することができ、また、高速な
マッチング処理を行うことができる。
【0020】また、2値化方法として、各画素の所定の
近傍範囲中の濃度の最大値と最小値の差と所定の閾値と
の比較による2値化を行った場合、画像中の近傍画素同
志の濃度差が大きい文字の輪郭を黒文字、白文字にかか
わらず明確に抽出することができる。このようにして抽
出された文字の輪郭とテンプレートをマッチングさせる
ことにより精度良く認識することができる。また、2値
化後にマッチングさせるため処理速度も速い。
【0021】
【発明の実施の形態】以下、本発明の文字認識装置の具
体的な実施の形態について説明する。
【0022】本発明の第一の実施の形態を図1に示す。
本文字認識装置10は、種々の撮影装置9からの原画像デ
ータSが入力され、該原画像データSに基づく原画像を
2値化して2値化画像を生成する2値化画像生成手段20
と、原画像を生成する各種装置の固有の文字フォントを
2値化したテンプレート5を備えた辞書35と、外部入力
手段50から入力された装置情報に応じた文字フォントの
テンプレート5を辞書35から選択する選択手段40と、2
値化画像生成手段20によって生成された2値化画像に対
して、選択手段40によって選択されたテンプレート5を
用いて文字パターンマッチングさせることにより文字を
認識するマッチング手段30とから成る。
【0023】2値化画像生成手段20は、詳しくは原画像
の各画素毎の濃度を検出する濃度検出手段22と、該濃度
検出手段22により検出された濃度と所定の閾値との比較
により前記各画素を2値化する2値化手段24とからな
る。
【0024】次に、本発明の第一の実施の形態における
作用を説明する。
【0025】文字認識装置10は撮影装置9から原画像デ
ータSを入力され、同時に外部入力手段50により認識す
べき文字を含む原画像A(原画像データSに対応する画
像)を生成した装置の情報が入力される。まず、2値化
画像生成手段20において、原画像Aから2値化画像Bが
生成される(図3(i) )。画像の2値化は、まず、濃度
検出手段22により原画像Aの各画素の濃度を検出し、そ
の後、2値化手段24において、検出された濃度と所定の
閾値との比較により各画素を2値化することによって行
われる。例えば、濃度を表す帯グラフ8に示すbの濃度
に閾値を設け、bより濃い部分を「1」薄い部分を
「0」として2値化する。その結果2値化画像Bが得ら
れる。
【0026】次に、選択手段40によって、外部入力手段
50により入力された装置情報に応じたテンプレート、す
なわち原画像Aを生成した装置が用いている文字フォン
トのテンプレート5が辞書35から選択され、マッチング
手段30において、該選択されたテンプレート5を用いて
2値化画像Bに対してマッチングが行われる。この時マ
ッチングはテンプレート5を2値化画像上で移動させて
行われる。なお、選択された、すなわち非常に限られた
数のテンプレートについてのみマッチングすればよいた
め、高速な識別が可能となる。また、2値化された画像
に対してマッチングを行うため、排他的積和(exclusiv
e or)による類似度評価関数R’を用いることができ、
計算時間をさらに短縮することができる。なおこの時、
画像上の点(m,n)における画像パターンfとテンプレ
ートgのR'(m,n)は、
【0027】
【数2】
【0028】で表されるものである。ただし領域Dは、
|i-m|<M/2,|j-n|<N/2を満たす(i,j)の範囲であ
る。前述の相互相関係数Rの場合とは逆に、R’が最も
小さいテンプレートが認識結果とされる。
【0029】なお、上述の2値化の際に、「1」,
「0」ではなく、「1」,「−1」に2値化して単純な
積和値を評価関数に用いてもよい。その場合の評価関数
R"(m,n)は、
【0030】
【数3】
【0031】で表され、R”が最も大きいテンプレート
が認識結果とされる。
【0032】このようにして、画像上における文字領域
と文字の認識が行われ、認識されたID番号等の文字情
報Iは、原画像データSと共にファイリング手段60や拡
大縮小手段等の画像データ処理手段へ出力される。
【0033】しかしながら、上記第一の実施の形態の文
字認識装置10においてなされる単なる閾値による2値化
方法では、文字と絵柄が重なった画像等において文字の
抽出がうまくいかず正確な文字認識が困難な場合があ
る。その一例として図4に示す黒文字1および白文字2
を含む原画像Dをある濃度閾値により2値化する場合に
ついて説明する。例えば、濃度を表す帯グラフ8に示す
eの濃度に閾値を設け、eより濃い部分を「1」薄い部
分を「0」として2値化する。その結果2値化画像Eが
得られる。また、fに閾値を設けて同様の処理を行うと
2値化画像Fが得られる。この時、2値化画像Eでは黒
文字1は明確に抽出されるが、白文字2はその一部が絵
柄の白い部分と重なり抽出不能になってしまう。一方、
2値化画像Fでは白文字2は明確に抽出されるが黒文字
1はその一部が絵柄と重なって抽出不能になってしま
う。このように、単に画像データを所定の濃度閾値で2
値化する従来の方法では黒文字1と白文字2を同時に明
確に抽出することができない。当然ながら、2値化によ
って画像中の文字を明確に抽出できない場合にはテンプ
レートマッチングの精度があがらず文字認識に支障をき
たすものとなる。
【0034】そこで、文字と絵柄が重なった画像や黒、
白文字を含む画像等においては、以下に説明する第二の
実施形態に係る文字認識装置が適する。
【0035】第二の実施の形態の文字認識装置10' を図
2に示す。上記の第一の実施の形態の文字認識装置10と
の相違点のみを説明する。
【0036】本文字認識装置10' の2値化画像生成手段
20' は、原画像の各画素毎に該画その所定近傍範囲中の
画素濃度の最大値と最小値との差を求める演算手段26
と、該演算手段26によって求められた濃度差と所定の閾
値との比較により各画素を2値化して画像の輪郭を抽出
する2値化手段28とから成る。
【0037】なお、辞書35’の有するテンプレートは各
種装置に固有の文字のフォントに対応する2値化された
中抜き文字のテンプレート5’である。
【0038】2値化画像生成手段20' においては、入力
された原画像データSについて、まず演算手段26におい
て画像の各画素の所定の近傍範囲中における濃度の最大
値と最小値との差が求められる。例えば注目画素を2×
2画素マスク中の左下に位置させた場合、その2×2画
素マスク(所定近傍範囲)中の計4画素における階調濃
度(原画像データS)の最大値および最小値を求め、こ
れを注目画素の濃度差とする。当然ながら、2×2とい
う範囲は一例であり、これに限る必要はない。次に、2
値化手段28において、前記演算手段26によって求められ
た前記濃度差を所定の閾値と比較して、例えば閾値より
濃度差が大きい場合を「1」、小さい場合を「0」とし
て注目画素を2値化する。この2値化を画像中の各画素
について行うことにより、画像中の近傍画素同志の濃度
差の大きい部分、すなわち画像の輪郭が抽出され、原画
像Aから2値化画像Cが生成される(図3(ii))。通
常、文字と周辺画像の濃度差は大きいため、文字の輪郭
が抽出される。
【0039】その後、選択手段40によって、外部入力手
段50により入力された装置の情報に応じたテンプレー
ト、すなわち原画像Aを生成した装置が用いている文字
フォントに対応するテンプレート5’が辞書35’から選
択され、マッチング手段30’において、2値化画像Cに
対してテンプレート5’を用いてマッチングが行われ
る。このようにして認識された文字情報Iは、原画像デ
ータSと共にファイリング手段60へ出力される。
【0040】このようにして、本発明の文字認識装置に
よる文字認識結果を、CT、MRI等の医用画像データ
のファイリングの際のID情報として用いることができ
る。また、本発明の文字認識装置を医用画像再生システ
ムに内包し、画像データに拡大縮小等の画像処理を施す
前に、画像中の文字と絵柄を分離するために用いても良
く、この場合、文字と絵柄に対してそれぞれ適切な補間
処理等の画像処理を施すことが可能となる。
【0041】なお、一次微分フィルタ、ラプラシアンフ
ィルタ等を用いて画像の輪郭を抽出し、抽出された輪郭
部分の画素を「1」、輪郭部分以外の画素を「0」とし
て各画素の2値化を行うことによっても、上記第二の実
施の形態において生成される2値化画像Cと同様の、輪
郭が抽出された2値化画像を生成することができる。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態の文字認識装置
【図2】本発明の第二の実施の形態の文字認識装置
【図3】第一および第二の実施の形態の文字認識装置に
よって生成される2値化画像を説明する図
【図4】第一の実施の形態の文字認識装置によって画像
の2値化を行った場合の問題点を説明する図
【図5】文字パターンマッチング方法を説明する図
【符号の説明】
5 テンプレート 10 文字認識装置 20 2値化画像生成手段 22 濃度検出手段 24 2値化手段 30 マッチング手段 35 辞書 40 選択手段 50 入力手段 I 文字情報 S 原画像データ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 各種装置によって生成された文字を含む
    画像中から該文字を認識する文字認識装置において、 前記各種装置毎の固有の文字のテンプレートを備えた辞
    書と、 前記画像を生成した装置の情報が入力され、入力された
    該情報に応じて該装置に固有の文字のテンプレートを前
    記辞書から選択する選択手段と、 前記画像中の文字に対して前記選択されたテンプレート
    を用いて文字パターンマッチングさせることにより文字
    を認識するマッチング手段とを備えてなることを特徴と
    する文字認識装置。
  2. 【請求項2】 前記画像を2値化して、2値化画像を生
    成する2値化画像生成手段を更に備え、 前記マッチングを前記2値化画像に対して行うことを特
    徴とする請求項1記載の文字認識装置。
  3. 【請求項3】 前記2値化画像生成手段が、画像の輪郭
    を抽出する手段を含むものであることを特徴とする請求
    項2記載の文字認識装置。
  4. 【請求項4】 前記2値化画像生成手段が、前記画像の
    各画素毎に該画素の所定近傍範囲中の画素濃度の最大値
    と最小値との差を求める演算手段と、 前記濃度の差と所定の閾値との比較により前記各画素を
    2値化して画像の輪郭を抽出する2値化手段とから成る
    ことを特徴とする請求項3記載の文字認識装置。
JP8172615A 1996-07-02 1996-07-02 文字認識装置 Pending JPH1021334A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8172615A JPH1021334A (ja) 1996-07-02 1996-07-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8172615A JPH1021334A (ja) 1996-07-02 1996-07-02 文字認識装置

Publications (1)

Publication Number Publication Date
JPH1021334A true JPH1021334A (ja) 1998-01-23

Family

ID=15945167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8172615A Pending JPH1021334A (ja) 1996-07-02 1996-07-02 文字認識装置

Country Status (1)

Country Link
JP (1) JPH1021334A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259595A (ja) * 1999-03-05 2000-09-22 Internatl Business Mach Corp <Ibm> Tcp/ipネットワークにおいてウェブ・ファイアウォールを最適に選択する方法およびシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259595A (ja) * 1999-03-05 2000-09-22 Internatl Business Mach Corp <Ibm> Tcp/ipネットワークにおいてウェブ・ファイアウォールを最適に選択する方法およびシステム
US6892235B1 (en) 1999-03-05 2005-05-10 International Business Machines Corporation Method and system for optimally selecting a web firewall in a TCB/IP network

Similar Documents

Publication Publication Date Title
US8606012B2 (en) Image processing method and image processor
EP3588364A1 (en) Within document face verification
KR20040059313A (ko) 치아영상으로부터 치아영역 추출방법 및 치아영상을이용한 신원확인방법 및 장치
CN105719243A (zh) 图像处理装置和方法
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
EP4405893A1 (en) A computer-implemented method of enhancing object detection in a digital image of known underlying structure, and corresponding module, data processing apparatus and computer program
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
CN114863431A (zh) 一种文本检测方法、装置及设备
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
Nguyen et al. Tensor voting based text localization in natural scene images
Elnabawy et al. Image based hieroglyphic character recognition
JP2017138743A (ja) 画像処理装置、画像処理方法及びプログラム
JP3819074B2 (ja) 文字認識装置
Valiente et al. A process for text recognition of generic identification documents over cloud computing
JPH1021334A (ja) 文字認識装置
Liao et al. Image segmentation of thyroid nodule and capsule for diagnosing central compartment lymph node metastasis
Pandey et al. Review of different binarization techniques used in different areas of image analysis
Prakash et al. An identification of abnormalities in dental with support vector machine using image processing
JPH1011536A (ja) 文字認識装置
WO2021192315A1 (ja) 縞模様画像照合装置、縞模様照合方法、及び、そのプログラムが格納されたコンピュータ可読媒体
JP2005031818A (ja) マンガの線画像成形方法、装置およびコンピュータプログラム
Rahman et al. Text Information Extraction from Digital Image Documents Using Optical Character Recognition
JPH1063779A (ja) 文字認識方法および装置
JP3786221B2 (ja) 画像データ管理装置
Harefa et al. ID Card Storage System using Optical Character Recognition (OCR) on Android-based Smartphone

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060606