JPH1125222A - 文字切り出し方法及び文字切り出し装置 - Google Patents

文字切り出し方法及び文字切り出し装置

Info

Publication number
JPH1125222A
JPH1125222A JP9182831A JP18283197A JPH1125222A JP H1125222 A JPH1125222 A JP H1125222A JP 9182831 A JP9182831 A JP 9182831A JP 18283197 A JP18283197 A JP 18283197A JP H1125222 A JPH1125222 A JP H1125222A
Authority
JP
Japan
Prior art keywords
character
image
characters
filtering
laplacian
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9182831A
Other languages
English (en)
Inventor
Shiyoubou Chiyou
小▲忙▼ 張
Koichi Hatakeyama
耕一 畠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP9182831A priority Critical patent/JPH1125222A/ja
Priority to US09/112,014 priority patent/US6289123B1/en
Publication of JPH1125222A publication Critical patent/JPH1125222A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】 (修正有) 【課題】 FA分野などの多くの雑音が含まれる可能性
のある文字の文字領域をほぼ正確に切り出す。 【解決手段】 ウエハー上の文字のある領域の画像を取
り込む照明と撮像カメラからなる照明撮影部1、原画像
のLaplacian演算を行うLaplacian演
算部2、Laplacian演算の演算結果に対して2
値化処理を行いIb[i][j]を算出する2値化部3、最
小値フィルタによってフィルタリングした2値画像If
を算出するフィルタリング部4、画像の論理積、膨張操
作、収縮操作等の各種の処理を行う画像処理部5、及び
画像を1文字ごとに区分する切り出し部6を有し、切り
出した結果を画像データとして出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識の前提と
なる文字切り出し方法及びその実施に使用する文字切り
出し装置に関し、より詳しくは、FA(Factory
Automation)分野における工業製品の品質
管理などを生産ライン上で自動的に行うための文字認識
の前処理として必要な、例えばウエハー生産の品質を管
理するために文字認識装置でウエハー上の文字を1文字
ごとに切り出す場合などに用いられる文字切り出し方法
及びその実施に使用する文字切り出し装置に関する。
【0002】
【従来の技術】OA(Office Automati
on)分野における文字認識技術については、認識対象
の書類から画像をきれいに取り込むことができるため、
認識率はすでに高い水準に達している。
【0003】しかし、FA分野における文字認識技術の
場合は、作業環境に応じて背景光のレベル等が変動する
ため、認識対象の背景が複雑である。このため、文字と
背景の差が不鮮明であり、文字認識を行なう前に多くの
前処理を行なわなければ認識が困難である。
【0004】そこで、通常のFA用文字認識装置では、
まず画像処理技術を用いて文字領域を背景から正しく切
り出して認識を行う。従って、もし認識部分がOA用文
字認識手法と同じであるとするならば、認識の成否は前
処理である文字切り出しで決定されることになる。よっ
て、文字領域を正しく抽出することができれば、OA用
の文字認識装置と同様の高い認識率を期待できる。
【0005】ここで、画像中のある特定領域(文字領
域)を抽出する(切り出す)方法としては、「領域情報
に基づく方法」と「エッジ情報に基づく方法」とが従来
より多用されている。そして、「領域情報に基づく方
法」の一例として、画像I(i,j)の局所特性を反映
する閾値を設定して行なう方法がある(例えば、河田他
著「科学計測のための画像データ処理」、1994年、
CQ出版社発行)。
【0006】この閾値処理のかぎは閾値を適切に選択す
ることであり、閾値Tは、一例として、下記(3)式で
与えられる。
【0007】
【数5】
【0008】但し、 P:領域 N:領域P内の画素数 I(i,j):画像を表す2次元関数 i,j:画素の位置 つまり、上記(3)式では、画素(i,j)ごとにその
点を中心とする領域Pを与え、その領域Pにおける濃度
の平均値を閾値Tとしている。
【0009】また、エッジ情報を用いる方法としては、
Marrの著名なzero−cross法(D.Mar
r著、「Vision」、1982、W.H.Free
man出版社発行)がよく知られている。このzero
−cross法は、下記(4)式に示すように、原画像
にLaplacian演算を行ない、その値が正から負
へと変化する(zero−cross)場所をエッジと
して抽出する方法である。
【0010】
【数6】
【0011】但し、 ▽2:Laplacian演算子 f:はx、yの2次元関数 なお、2次微分のLaplacian演算をいきなり原
画像に適用したのでは、雑音を強調しすぎるため、下記
(5)式に示すように、原画像をまずGaussian
関数でぼかしてからLaplacian演算を適用する
方法が良く使用されている。
【0012】
【数7】
【0013】但し、 G(x、y):2次元Gaussian関数 σ:Gaussian関数の空間定数
【0014】
【発明が解決しようとする課題】しかしながら、上記の
領域情報を用いる閾値Tの設定方法では、領域Pの画素
について、画素ごとの重要度は考慮せず、全て同じ重要
度と見なしている。しかも、全画面において同サイズの
領域Pを使用しているため、閾値Tとしては好ましくな
い。このような理由により、上記の領域情報を用いる閾
値Tの設定方法では、文字の切り出しを精度よく行えな
いため、OA用の文字認識装置と同様の高い認識率を期
待することができない。
【0015】また、上記のエッジ情報に基づいた領域分
割方法では、エッジだけを抽出することや、Gauss
ian関数で原画像をぼかすことはFA分野における文
字認識方式において以下のような問題点がある。
【0016】まず、FA分野における認識対象の画像の
多くは、文字のエッジと雑音のエッジが混在し、しかも
文字のエッジが不明瞭である。エッジ領域だけを抽出し
ようとしても文字のエッジが不完全に抽出されるため、
雑音のエッジと文字のエッジを区別することが非常に難
しくなる。
【0017】また、最適なσが分からないために、Ga
ussian関数で原画像をぼかすことにより、文字と
背景の差はもっと不鮮明になったり、文字同士又は文字
領域と雑音領域が接触する現象が起こってしまう。
【0018】この結果、雑音を拾ったり、Gaussi
an関数の幅σ、即ちGaussian関数の空間定数
によっては、文字の潰れなどが起こるといった問題があ
る。
【0019】このような理由により、FA分野の文字の
文字領域をほぼ正確に切り出せ、結果的にOA用の文字
認識装置と同様の高い認識率を期待できる方法の開発が
切に要請されているのが現状である。
【0020】本発明は、このような現状に鑑みてなされ
たものであり、FA分野などの多くの雑音が含まれる可
能性のある文字の文字領域をほぼ正確に切り出すことが
でき、結果的にOA用の文字認識処理と同様の高い認識
率を期待できる文字切り出し方法及びその実施に使用す
る文字切り出し装置を提供することを目的とする。
【0021】
【課題を解決するための手段】本発明の文字切り出し方
法は、対象物上の文字のある領域の画像を取り込み、こ
の原画像をLaplacian演算するステップと、L
aplacian演算の演算結果に対して、画像を25
6階調(0:黒、255:白)、切り出し文字を白で表
示すると、切り出すべき文字の描画部分が、その中心部
に行くほど明るくなる凸性を有する場合は、下記(1)
式に基づき、切り出すべき文字の描画部分が、その中心
部に行くほど暗くなる凹性を有する場合は、下記(2)
式に基づき2値化処理を行うステップと、
【0022】
【数8】
【0023】
【数9】
【0024】但し、 ▽2:Laplacian演算子、 i、j:画素位置、 Io:原画像 Ib:2値化画像 得られた2値化画像に基づき文字を1文字ずつ区分けし
て切り出すステップとを包含しており、そのことにより
上記目的が達成される。
【0025】好ましくは、文字から雑音を除去するフィ
ルタリング演算を行うステップを、前記2値化処理を行
うステップに引き続いて行う構成とする。
【0026】また、好ましくは、前記フィルタリング演
算は、画像データ中の或る特定の画素の周囲の複数画素
について行い、且つ全画素にわたって繰り返し行うもの
とする。
【0027】また、好ましくは、前記フィルタリング演
算は、最小値演算、AND演算又は平均値演算である。
【0028】また、好ましくは、潰れた文字の統合、描
画中の穴埋め等の整形のための膨張操作と収縮操作を行
うステップを、前記フィルタリング演算を行うステップ
に引き続いて行う構成とする。
【0029】また、好ましくは、前記膨張操作と収縮操
作を行うステップに先立って、1文字ごとの文字外接枠
を先に決定するステップを行い、該文字外接枠をそのま
ま使用して該膨張操作と収縮操作を行うステップを行う
構成とする。
【0030】また、好ましくは、得られた画像データ間
の間で論理積演算を実行するステップを更に包含する構
成とする。
【0031】また、本発明の文字切り出し装置は、対象
物上の文字のある領域の画像を取り込む撮像手段と、該
撮像手段によって取り込まれた原画像をLaplaci
an演算するLaplacian演算手段と、該Lap
lacian演算手段の演算結果に対して、画像を25
6階調(0:黒、255:白)、切り出し文字を白で表
示すると、切り出すべき文字の描画部分が、その中心部
に行くほど明るくなる凸性を有する場合は、下記(1)
式に基づき、切り出すべき文字の描画部分が、その中心
部に行くほど暗くなる凹性を有する場合は、下記(2)
式に基づき2値化処理を行う2値化手段と、
【0032】
【数10】
【0033】
【数11】
【0034】但し、 ▽2:Laplacian演算子、 i、j:画素位置、 Io:原画像 Ib:2値化画像 得られた2値化画像に基づき文字を1文字ずつ区分けし
て切り出す切り出し手段とを備えており、そのことによ
り上記目的が達成される。
【0035】好ましくは、文字から雑音を除去するフィ
ルタリング演算を行う演算手段であって、該フィルタリ
ング演算が、画像データ中の或る特定の画素の周囲の複
数画素について行い、且つ全画素にわたって繰り返し行
うものであるフィルタリング演算手段を更に備え、前記
2値化手段によって2値化された画像を該フィルタリン
グ演算手段がフィルタリング演算する構成とする。
【0036】また、好ましくは、前記フィルタリング演
算手段は、最小値演算、AND演算又は平均値演算を行
う構成とする。
【0037】また、好ましくは、潰れた文字の統合、描
画中の穴埋め等の整形のための膨張操作と収縮操作を行
う画像処理手段を更に備え、該画像処理手段は、前記フ
ィルタリング演算手段によって演算された画像に対して
膨張操作と収縮操作を行う構成とする。
【0038】以下に本発明の作用を図3〜図6を参照し
つつ説明する。
【0039】今、簡単のために、文字画像の明度断面の
1次元モデルを使用して説明する。図4において、横軸
は画素位置を示し、縦軸は画素の明度値を示す。図4中
の2つの大きい凸部は抽出すべき文字の描画部分を示
し、その他の部分は背景を示している。但し、ここでは
文字が白、背景は黒であると仮定している。なお、この
文字画像は、具体的にはFA用の文字を示しており、2
56階調のディジタル濃淡画像である。明度値(画素の
値)が0のとき最も暗く、255のとき最も明るくなっ
ている。
【0040】図5(a)に図4中の描画文字部分L1
みを拡大して示す。図5(a)に示すように、FA用の
文字の特徴は、一例として、描画文字部分の中心部に行
くほど明るくなる凸性を有している。即ち、描画文字部
分L1の中心部において明度値がピークとなり、その左
右両側において明度値が緩やかに下傾する凸性を有して
いる。
【0041】なお、FA用の文字の特徴は、上記とは逆
に、描画文字部分の中心部に行くほど暗くなる凹性を有
する場合もある。従って、いずれにしても、FA用の画
像中の文字領域(文字の描画部分)は背景(その他の部
分)と違って、明度値に関する規則的な凹凸を有してい
る。
【0042】本発明では、この特徴を利用して図5
(a)〜(d)に示す手順で文字領域を抽出する手法を
採用している。
【0043】ここで、図5(b)は描画文字部分L1
勾配を示す。即ち、図5(a)に示す描画文字部分L1
を微分したものである。また、同図(c)は描画文字部
分L1のLaplacianの演算結果(下記(6)式
参照)を示す。
【0044】
【数12】
【0045】但し、 I(i,j):画像を表す2次元関数 i,j:画像の位置 また、同図(d)はLaplacian演算の結果に対
して、負を255にし、他の値を0にする2値化処理を
示し、この2値化処理によって文字領域を抽出してい
る。この2値化処理は下記(1)式で表される。
【0046】
【数13】
【0047】但し、 i,j:画像の位置 IO:原画像 Ib:2値化画像 なお、凹性を有する文字画像の場合は、下記(2)式で
表される2値化処理を行う。
【0048】
【数14】
【0049】ここで、文字領域は描画文字部分の内側か
ら抽出することによって、文字領域と文字以外の不要領
域が接触する現象を抑制する効果がある。即ち、上記の
ように、凸性を有する文字画像にあっては、描画文字部
分L1の中心部になればなるほど明度値が大きくなり、
文字以外の不要領域との差別化が容易だからである。
【0050】なお、図5(c)で曲線と横軸が交差する
2つの点X1、X2はzero−cross法で求められ
たエッジ領域である。
【0051】上記の手法によれば、文字の描画部分を抽
出できるものの、原画像に直接Laplacian演算
を行なっているため、凸性を持つ高周波雑音領域が2値
画像に残っている。この高周波雑音領域は、2値化画面
において大きな面積の塊から構成されている文字領域と
違って、2値化画面において点のような小面積の塊から
構成されている(図3(c)参照)。
【0052】本発明では、一例として、この2値化画像
に対して2×2領域サイズでの最小値フィルタをかける
ことによって雑音領域を削除している。
【0053】ここで、2×2マスクサイズに対して、関
心画素(i,j)におけるマスク領域は、図6に示すよ
うに、可能な選択が4つある。4つのマスク領域の中か
ら任意に1つを選んでフィルタを定義する。ここで、図
6(a)のマスク領域に下記(7)式よりフィルタを定
義する。
【0054】
【数15】
【0055】但し、 If:フィルタリングした2値画像 このフィルタの処理領域は2×2画素のマスクである
が、通常の8又は4近傍の収縮処理領域は3×3画素の
マスクである(後述の実施形態ではそのような例を示
す)。
【0056】ここで、フィルタリングすることは、小面
積の雑音領域を削除する以外に、文字領域と大面積の不
要利用域の文字領域からの切断などにも効果がある。そ
の他の不要領域については、後述のように、その領域の
特徴を利用して画像間の論理演算や領域面積の値などに
より除去できる。
【0057】また、文字が潰れていたり、文字描画部分
に穴があいている場合は、上記の膨張操作と収縮操作を
行えば、文字の整形を行うことができる。
【0058】ここで、この膨張操作と収縮操作を行う
と、文字と文字同士の接触する確率が高くなるので、各
文字の文字外接枠は、これらの処理を行う前に決定して
おき、整形後にこの文字外接枠をそのまま使用すること
にすればよい。
【0059】
【発明の実施の形態】以下に本発明の実施の形態を図面
に基づき具体的に説明する。
【0060】図1は本発明方法の実施に使用する文字切
り出し装置のシステム構成を示す。この文字切り出し装
置は、対象物、例えば、ウエハー上の文字のある領域の
画像を取り込む照明と撮像カメラからなる照明撮影部1
と、原画像のLaplacian演算を行うLapla
cian演算部2と、Laplacian演算の演算結
果に対して2値化処理を行い前述のIb[i][j]を算出
する2値化部(2値化処理部)3と、最小値フィルタに
よってフィルタリングした2値画像Ifを算出するフィ
ルタリング部4と、画像の論理積、膨張操作、収縮操作
等の各種の処理を行う画像処理部5と、画像を1文字ご
とに区分する切り出し部6と、切り出した結果を画像デ
ータとして出力する出力部7と、CPUからなり、この
装置全体の制御中枢となる制御部8とで構成されてい
る。
【0061】なお、上記のLaplacian演算部
2、2値化部3、フィルタリング部4、画像処理部5及
び切り出し部6は、一例として、シャープ社製の汎用画
像処理ボードGPBによって実現される。この汎用画像
処理ボードGPBは、高速画像処理チップSALA(シ
ャープ社の商品名)を中心として構成されている。高速
演算のために、SALAでは、図2に示すように、演算
領域のサイズは3×3に限定されている。
【0062】ここで、図2(a)はSALAの演算領域
を示し、同図(a)中のA、B、…、H、Iはその位置
の画素値を示す。同図(b)はサイズは3×3のLap
lacian演算子を示している。
【0063】このLaplacian演算子、つまり図
1中のLaplacian演算部2は、照明撮影部1か
ら与えられるFA用の文字画像である原画像のLapl
acian演算を行う。この演算結果Ilは、下記
(8)式で表わされる。
【0064】
【数16】
【0065】但し、 i、j:同図(a)に示すEの画素位置 このLaplacian演算の結果Ilは、2値化部3
に与えられる。すると、2値化部3は、下記(1)式に
示すように、Ilを2値化処理し、2値画像Ibを算出す
る。
【0066】
【数17】
【0067】但し、 i、jは同図(a)中のEの画素位置 算出された2値画像Ibはフィルタリング部4に与えら
れる。すると、フィルタリング部4は、2値化画像Ib
に対し、下記(9)式に示すフィルタリングを行う。こ
れにより、雑音領域が削除された画像Ifが得られる。
【0068】
【数18】
【0069】 i、jは同図(a)中のEの画素位置続いて、フィルタ
リング部4は、このようなフィルタリング処理を全画素
について行い、雑音領域が削除された画像データを画像
処理部5に与える。すると、画像処理部5は、文字の認
識率を向上させるべく画像の論理積、膨張操作、収縮操
作等の各種の処理を実行し、切り出し部6に与える。切
り出し部6は画像処理部5から与えられた画像データを
1文字ごとに区分して切り出す。切り出された文字は出
力部7より不図示の文字認識部に出力される。
【0070】次に、図3(a)〜(i)に基づき、ウエ
ハー上の文字の切り出しを行う場合を例にとって、上記
処理手順を今少し具体的に説明する。
【0071】まず、同図(a)は、ウエハー上の文字領
域の原画像を示す。画像データは256階調の明度値配
列(0:黒、255:白)である。大きな面積の不要領
域を容易に消去できるようにするために、その領域が意
識的に画面枠に接するように、照明撮影部1の照明と撮
像カメラをセッティングする。
【0072】同図(b)は、Laplacian演算部
2によってLaplacian演算がなされ、続いて、
2値化部3によって2値化処理がなされた2値化画像を
示す。
【0073】同図(c)は、同図(b)中ににある小領
域の雑音に対して、フィルタリング部4によって上記の
最小値フィルタ処理を施し、これにより雑音を削除又は
雑音を文字領域から切断した画像を示す。
【0074】同図(d)は、同図(c)の2値画像に対
して、残った各々の不要な領域が繋がるように画像処理
部5で膨張操作を行った画像を示す。この膨張操作によ
り文字と文字又は文字領域と雑音領域が接触する不具合
を生じるおそれがあるが、この不具合は、後述の画像間
の論理積演算によって容易に解消することができる。
【0075】同図(e)は、同図(d)の画像に対し
て、照明撮影部1の照明と撮像カメラをセッティング
し、画面枠に接する領域を削除することより、大きな面
積の不要領域を除外した画像を示す。
【0076】同図(f)は、上記した膨張操作に伴う不
具合を無くすために、同図(c)と同図(e)に示す画
像間で論理積演算を行って、文字と文字又は文字領域と
雑音領域が接触する不具合を解消した画像を示す。
【0077】同図(g)は、同図(f)に示す画像中に
残っている雑音を除去するために、画像処理部5によ
り、ある閾値より小さい面積を持つ領域を削除すること
により得られた画像を示す。
【0078】この閾値は対象になる文字のフォントと文
字集合で容易に決定できる。本実施形態の文字集合は、
英大文字、数字及び‘−’(ハイフォン)しかなく、こ
のフォントに対して、最小面積の文字は‘−’なので、
文字‘−’の面積の画素数を閾値として使用すればよ
い。但し、欠けたり、潰れたりする文字があるので、文
字‘−’の面積の3分の2を閾値とすると、実施する上
で好ましいものになる。
【0079】同図(h)は、同図(g)に示す画像に対
して、切り出し部6が投影ヒストグラム等を用いて、文
字を1文字ずつ区分けした画像を示す。即ち、同図
(h)に示すように、各文字は区分けされた文字領域
(破線枠内)に位置している。なお、同図(h)中には
潰れた文字が存在している。
【0080】同図(i)は、図4(h)中の潰れた文字
の認識率をより向上するために、画像処理部5が膨張操
作と収縮操作を行って、潰れた文字を統合した、即ち修
復した画像を示す。なお、この膨張操作と収縮操作を実
行すると、潰れた文字のない場合にも文字の整形効果を
発揮することができる。
【0081】また、この膨張操作と収縮操作とにより、
文字と文字が接触する不具合を生じるおそれがあるの
で、ここでは、新たに文字領域の区分を行わず、同図
(h)の区分結果を使用する。そして、最終画像である
同図(i)に示す文字切り出し画像を文字認識部に出力
する。
【0082】なお、この実施形態では、フィルタリング
部4が最小値演算によるフィルタリング処理によって雑
音を除去しているが、AND演算や平均値演算によって
フィルタリング処理することも可能である。
【0083】
【発明の効果】以上の本発明によれば、エッジ以上に豊
富な文字の凹凸性を利用してLaplacian演算を
行い、Laplacian演算結果に対して2値化処理
を行うことにより文字の切り出しを行う構成をとるの
で、FA分野のような雑音の多い生産現場の画像などか
ら文字領域を精度よく切り出すことができる。これによ
り、従来の技術において文字領域を正確に切り出せない
ために発生した誤認識を大幅に減らすことができ、文字
認識率を向上させることができる。また、本発明は実施
形態で示したような極めて簡単なアルゴリズムで実現で
きるため、今まで利用できなかったような、より高速な
処理が要求される生産ライン上などで使用することが可
能になる。
【0084】また、特にフィルタリング処理を行う構成
によれば、雑音を除去できるので、文字領域を一層精度
よく切り出すことができる。
【0085】また、特に、膨張操作、収縮操作、画像間
の論理積演算等の種々の画像処理技術を併用すれば、更
に一層文字領域を精度よく切り出すことが可能になる。
【図面の簡単な説明】
【図1】本発明文字切り出し装置のシステム構成を示す
ブロック図。
【図2】(a)はSALAの演算領域を示す図、(b)
はサイズ3×3のLaplacian演算子を示す図。
【図3】ウエハー上の文字を対象とする文字切り出しの
一連の処理手順を説明する図であり、(a)は原画像の
図、(b)は原画像にLaplacian演算を行なっ
てから2値化した画像を示す図、(c)は最小値フィル
タにより(b)の画像に対してフィルタリングを施して
得られる画像を示す図、(d)は(c)の画像に対して
膨張操作を行って得られる画像を示す図、(e)は2値
画像(d)に対して、画面枠に接する領域を削除した画
像を示す図、(f)は画像(c)と画像(e)との論理
積画像を示す図、(g)は面積の閾値により(f)の画
像の小領域を削除した画像を示す図、(h)は(g)の
画像に対して文字領域を1文字ずつ区分した画像を示す
図、(i)は(h)の画像に対して膨張操作と収縮操作
を行って得られた画像を示す図。
【図4】文字画像の明度値断面の1次元モデルを示す
図。
【図5】Laplacian演算による文字の切り出し
手法を説明する図であり、(a)は文字画像の明度断面
図、(b)は(a)の勾配を示す図、(c)は(a)の
Laplacian演算結果を示す図、(d)は(c)
の2値化結果を示す図。
【図6】(a)〜(d)は2×2サイズの最小値フィル
タ処理におけるマスク候補を示す図。
【符号の説明】
1 照明撮影部 2 Laplacian演算部 3 2値化部 4 フィルタリング部 5 画像処理部 6 切り出し部 7 出力部 8 制御部

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 対象物上の文字のある領域の画像を取り
    込み、この原画像をLaplacian演算するステッ
    プと、 Laplacian演算の演算結果に対して、画像を2
    56階調(0:黒、255:白)、切り出し文字を白で
    表示すると、切り出すべき文字の描画部分が、その中心
    部に行くほど明るくなる凸性を有する場合は、下記
    (1)式に基づき、切り出すべき文字の描画部分が、そ
    の中心部に行くほど暗くなる凹性を有する場合は、下記
    (2)式に基づき2値化処理を行うステップと、 【数1】 【数2】 但し、 ▽2:Laplacian演算子、 i、j:画素位置、 Io:原画像 Ib:2値化画像 得られた2値化画像に基づき文字を1文字ずつ区分けし
    て切り出すステップとを包含する文字切り出し方法。
  2. 【請求項2】 文字から雑音を除去するフィルタリング
    演算を行うステップを、前記2値化処理を行うステップ
    に引き続いて行う請求項1記載の文字切り出し方法。
  3. 【請求項3】 前記フィルタリング演算は、画像データ
    中の或る特定の画素の周囲の複数画素について行い、且
    つ全画素にわたって繰り返し行う請求項2記載の文字切
    り出し方法。
  4. 【請求項4】 前記フィルタリング演算は、最小値演
    算、AND演算又は平均値演算である請求項2又は請求
    項3記載の文字切り出し方法。
  5. 【請求項5】 潰れた文字の統合、描画中の穴埋め等の
    整形のための膨張操作と収縮操作を行うステップを、前
    記フィルタリング演算を行うステップに引き続いて行う
    請求項2〜請求項4のいずれかに記載の文字切り出し方
    法。
  6. 【請求項6】 前記膨張操作と収縮操作を行うステップ
    に先立って、1文字ごとの文字外接枠を先に決定するス
    テップを行い、該文字外接枠をそのまま使用して該膨張
    操作と収縮操作を行うステップを行う請求項2〜請求項
    5のいずれかに記載の文字切り出し方法。
  7. 【請求項7】 得られた画像データ間の間で論理積演算
    を実行するステップを更に包含する請求項1〜請求項6
    のいずれかに記載の文字切り出し方法。
  8. 【請求項8】 対象物上の文字のある領域の画像を取り
    込む撮像手段と、 該撮像手段によって取り込まれた原画像をLaplac
    ian演算するLaplacian演算手段と、 該Laplacian演算手段の演算結果に対して、画
    像を256階調(0:黒、255:白)、切り出し文字
    を白で表示すると、切り出すべき文字の描画部分が、そ
    の中心部に行くほど明るくなる凸性を有する場合は、下
    記(1)式に基づき、切り出すべき文字の描画部分が、
    その中心部に行くほど暗くなる凹性を有する場合は、下
    記(2)式に基づき2値化処理を行う2値化手段と、 【数3】 【数4】 但し、 ▽2:Laplacian演算子、 i、j:画素位置、 Io:原画像 Ib:2値化画像 得られた2値化画像に基づき文字を1文字ずつ区分けし
    て切り出す切り出し手段とを備えた文字切り出し装置。
  9. 【請求項9】 文字から雑音を除去するフィルタリング
    演算を行う演算手段であって、該フィルタリング演算
    が、画像データ中の或る特定の画素の周囲の複数画素に
    ついて行い、且つ全画素にわたって繰り返し行うもので
    あるフィルタリング演算手段を更に備え、前記2値化手
    段によって2値化された画像を該フィルタリング演算手
    段がフィルタリング演算する請求項8記載の文字切り出
    し装置。
  10. 【請求項10】 前記フィルタリング演算手段は、最小
    値演算、AND演算又は平均値演算を行うものである請
    求項9記載の文字切り出し装置。
  11. 【請求項11】 潰れた文字の統合、描画中の穴埋め等
    の整形のための膨張操作と収縮操作を行う画像処理手段
    を更に備え、該画像処理手段は、前記フィルタリング演
    算手段によって演算された画像に対して膨張操作と収縮
    操作を行う請求項9又は請求項10記載の文字切り出し
    装置。
JP9182831A 1997-07-08 1997-07-08 文字切り出し方法及び文字切り出し装置 Pending JPH1125222A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9182831A JPH1125222A (ja) 1997-07-08 1997-07-08 文字切り出し方法及び文字切り出し装置
US09/112,014 US6289123B1 (en) 1997-07-08 1998-07-08 Character extracting method and its apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9182831A JPH1125222A (ja) 1997-07-08 1997-07-08 文字切り出し方法及び文字切り出し装置

Publications (1)

Publication Number Publication Date
JPH1125222A true JPH1125222A (ja) 1999-01-29

Family

ID=16125238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9182831A Pending JPH1125222A (ja) 1997-07-08 1997-07-08 文字切り出し方法及び文字切り出し装置

Country Status (2)

Country Link
US (1) US6289123B1 (ja)
JP (1) JPH1125222A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309772A (ja) * 2004-04-21 2005-11-04 Omron Corp 文字成分抽出装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163044A (ja) * 1998-11-30 2000-06-16 Sharp Corp 画像表示装置
US6674915B1 (en) * 1999-10-07 2004-01-06 Sony Corporation Descriptors adjustment when using steerable pyramid to extract features for content based search
JP3554271B2 (ja) * 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
KR101214772B1 (ko) * 2010-02-26 2012-12-21 삼성전자주식회사 문자의 방향성을 기반으로 한 문자 인식 장치 및 방법
JP5906788B2 (ja) * 2012-02-17 2016-04-20 オムロン株式会社 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP5834253B2 (ja) 2013-03-27 2015-12-16 パナソニックIpマネジメント株式会社 画像処理装置、画像処理方法、及び画像処理プログラム
JP5849206B2 (ja) 2013-03-27 2016-01-27 パナソニックIpマネジメント株式会社 画像処理装置、画像処理方法、及び画像処理プログラム
JP5899475B2 (ja) 2013-04-05 2016-04-06 パナソニックIpマネジメント株式会社 画像処理装置、画像処理方法、及び画像処理プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4905296A (en) * 1986-07-22 1990-02-27 Schlumberger Systems & Services, Inc. System for shape recognition
US4926251A (en) * 1987-04-07 1990-05-15 Kabushiki Kaisha Toshiba Color image processing apparatus with image corrector
US5172421A (en) * 1991-03-27 1992-12-15 Hughes Aircraft Company Automated method of classifying optical fiber flaws
GB9422738D0 (en) * 1994-11-10 1995-01-04 Univ Western Ontario Context-based, adaptive, progressive, lossless compression of still continuous -tone images
US5757953A (en) * 1996-02-29 1998-05-26 Eastman Kodak Company Automated method and system for region decomposition in digital radiographic images

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309772A (ja) * 2004-04-21 2005-11-04 Omron Corp 文字成分抽出装置

Also Published As

Publication number Publication date
US6289123B1 (en) 2001-09-11

Similar Documents

Publication Publication Date Title
CN109961049B (zh) 一种复杂场景下香烟品牌识别方法
US6263113B1 (en) Method for detecting a face in a digital image
JP2940936B2 (ja) 表領域識別方法
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JP4558232B2 (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05225378A (ja) 文書画像の領域分割システム
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JPH05166002A (ja) ソース画像を分析する方法
CN112818983A (zh) 一种利用图片相识度判断字符倒置的方法
JP2003256834A (ja) 顔領域抽出及び顔構成要素位置判定装置
JP2001209808A (ja) 物体抽出システムと方法並びに物体抽出用プログラムを記憶した記憶媒体
JP3462727B2 (ja) 文字列2値化装置
CN111414877A (zh) 去除颜色边框的表格裁切方法、图像处理设备和存储介质
JP4238074B2 (ja) 表面疵検査方法
JP4253265B2 (ja) 影検出装置、影検出方法及び影検出プログラム、影検出装置を用いた画像処理装置、影検出方法を用いた画像処理方法及び影検出プログラムを用いた画像処理プログラム
JPH09305707A (ja) 画像抽出方式
JPH05342412A (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
JP2800192B2 (ja) 高速文字図形分離装置
JP2001043312A (ja) 文書画像処理装置
Tribuzy et al. Vehicle License Plate Preprocessing Techniques Using Graphical Interface
CN112464963A (zh) 一种基于roberts算子的图像边缘提取的方法与系统
JP3051936B2 (ja) 画像解析方法
JPH02103683A (ja) 枠線抽出方式
CN112529017A (zh) 一种基于sobel算子的图像边缘提取的方法与系统
CN112464962A (zh) 一种基于Laplacian算子的图像边缘提取的方法与系统

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031117