JPH08339421A - 画像の文字領域決定方法 - Google Patents

画像の文字領域決定方法

Info

Publication number
JPH08339421A
JPH08339421A JP7145788A JP14578895A JPH08339421A JP H08339421 A JPH08339421 A JP H08339421A JP 7145788 A JP7145788 A JP 7145788A JP 14578895 A JP14578895 A JP 14578895A JP H08339421 A JPH08339421 A JP H08339421A
Authority
JP
Japan
Prior art keywords
character
image
area
candidates
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7145788A
Other languages
English (en)
Inventor
Hideo Katsumi
栄雄 勝見
Toshinori Tsubomoto
利紀 坪本
Yasushi Yoneda
康司 米田
Koji Nakada
浩司 中田
Shigehiro Mori
茂広 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP7145788A priority Critical patent/JPH08339421A/ja
Publication of JPH08339421A publication Critical patent/JPH08339421A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 画像データに文字列以外の背景画像が含ま
れ,また文字質が劣悪な場合であっても文字領域を正確
に決定できる画像の文字領域決定方法。 【構成】 本方法は,所定の配置をなし,且つ同じ大き
さの文字から成る文字列を含む画像を入力して2値化処
理し(S1,S2),上記処理データに含まれる全ての
連結画素の中から,その特徴が所定の条件を満足する文
字候補を抽出し(S3,S4),上記文字候補同士の位
置関係が上記所定の配置を成すような文字候補の全てを
含む外接矩形領域を上記画像の文字領域と決定する(S
5,S6)ように構成されている。上記構成により,常
に正確に文字領域を決定することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,画像の文字領域決定方
法に係り,詳しくは,画像認識の際に文字領域を決定す
る方法に関するものである。
【0002】
【従来の技術】工場における生産管理手段として,部材
に刻印やマーキング等をほどこすことが一般に行われて
いる。例えば製鉄所の製造ラインでは,スラブやビレッ
ト等に文字列が描かれることが多い。従来は,これらの
文字列を人間が読み取っていたが,近年における工場の
FA化やCIM化,及び省人化に伴い,これらの文字列
をCCDカメラ等により撮像し,コンピュータ上で認識
させることが試みられるようになった。その場合,撮像
画像の文字領域の決定は,画像データを適当なしきい値
で2値化処理を行い,先ず水平の射影データ分布から対
象とする文字列を抽出し,次に垂直方向の射影を求める
ことによって行う。そして文字の切り出しはこの決定さ
れた文字領域の途切れている部分を文字と文字との隙間
であるとして行う方法が一般的に用いられていた。
【0003】
【発明が解決しようとする課題】上記したような従来の
画像の文字領域決定方法では,2値化処理後の画像デー
タに背景画像やノイズ等の文字以外のパターンが存在す
る場合には,それらも射影に含まれてしまうため,その
ままでは正確に文字領域を決定しそこから文字を切り出
すことは困難である。このため,そのような場合には,
画像の文字列の存在範囲を予め固定し,その範囲内に文
字列が入るように印字面を移動して,その範囲のみの射
影をとる方法が一般的に用いられる。しかし,画像入力
の際に,印字面の位置変動が大きく,文字列を所定の位
置に配置できない場合には,このような方法を用いるこ
とはできない。また,一般に鋼材の表面(特に端面)は
平坦でない場合が多く,印字や刻印の際に文字のかすれ
やつぶれが生じやすい。さらに,文字の表示面の状態や
撮像条件の時間的変化等から,2値化処理の際に適当な
しきい値を設定することは困難である場合が多い。これ
らの理由から,文字欠けや複数文字の連結などが生じ,
画像データ上の文字質は劣悪なものとなりやすい。その
ため,文字列の射影に適切な位置で途切れが生じず,誤
った位置で文字を切り出してしまうことがあった。本発
明は,このような従来の技術における課題を解決するた
めに,画像の文字領域決定方法を改良し,画像データに
文字列以外の背景画像が含まれ,文字質が劣悪な場合に
も文字領域を正確に決定することのできる画像の文字領
域決定方法を提供することを目的とするものである。
【0004】
【課題を解決するための手段】上記目的を達成するため
に,本発明は,所定の配置をなし,かつ同じ大きさの文
字からなる文字列を含む画像を入力して2値化処理し,
上記処理データに含まれる全ての連結画素の中から,そ
の特徴が所定の条件を満足する文字候補を抽出し,上記
文字候補同士の位置関係が上記所定の配置をなすような
文字候補の全てを含む外接矩形領域を上記画像の文字領
域と決定する画像の文字領域決定方法として構成されて
いる。さらには,上記文字候補の抽出が,上記全ての連
結画素の中から,連結画素の外接矩形の大きさ,連結画
素の外接矩形の縦横比,連結画素の面積,連結画素とそ
の外接矩形との面積比,及び連結画素の周囲長の2乗と
その面積との比のうちの少なくとも1つが予め設定され
た範囲内にあるものを抽出することである画像の文字領
域決定方法である。さらには,上記所定の配置が,予め
設定された文字の幅と高さ,及び縦と横方向の文字間隔
よりなる画像の文字領域決定方法である。
【0005】
【作用】本発明によれば,所定の配置をなし,かつ同じ
大きさの文字からなる文字列を含む画像が入力されて2
値化処理される。上記処理データに含まれる全ての連結
画素の中から,その特徴が所定の条件を満足する文字候
補が抽出される。上記文字候補同士が所定の位置関係に
あるような文字候補の全てを含む外接矩形領域が上記画
像の文字領域と決定される。このように,上記所定の条
件及び所定の位置関係を満たさない背景画像等の文字以
外のパターンが排除される。また,文字欠けや複数文字
の連結などにより文字候補に入らなかった文字も,最終
的に文字領域に含まれるため,文字質が劣悪な文字が文
字列に含まれていた場合であっても,正確に文字領域を
決定することができる。
【0006】
【実施例】以下添付図面を参照して,本発明を具体化し
た実施例につき説明し,本発明の理解に供する。尚,以
下の実施例は,本発明を具体化した一例であって,本発
明の技術的範囲を限定する性格のものではない。ここ
に,図1は本発明の一実施例に係る画像の文字領域決定
方法を含む文字認識方法の概略構成を示す全体フロー
図,図2は上記文字認識方法を適用可能な装置の全体構
成を示す模式図,図3は2値化処理後の入力画像の一例
を示す説明図,図4はグループ作りの処理手順を示す部
分フロー図,図5はリーダーと他の文字候補との位置関
係を示す説明図,図6は文字列情報に対する予め設定さ
れた基準値を示す説明図,図7は文字質が劣悪な場合の
文字領域抽出結果の一例を示す説明図である。図1に示
すごとく,本実施例に係る画像の文字領域決定方法は,
所定の配置を成し,且つ同じ大きさの文字からなる文字
列を含む画像を入力して2値化処理し(S1,S2),
上記処理データに含まれる全ての連結画素の中からその
特徴が所定の条件を満足する文字候補を抽出し(S3,
S4),上記文字候補同士の位置関係が上記所定の配置
をなすような文字候補の全てを含む外接矩形領域を上記
画像の文字領域と決定する(S5,S6)ように構成さ
れている。また,この画像の文字領域決定方法を含む文
字認識方法は,上記画像の文字領域から文字を切り出し
(S7),パターン認識を行い(S8),その結果を出
力する(S9)ように構成されている。
【0007】上記文字認識方法は,例えば図2に示すよ
うな文字認識装置によって具現化される。即ち,図2は
ビレット端部のマーキング文字の認識を行う装置の一例
である。同図において,コンベア等の搬送機構1によ
り,ビレット2が撮影位置に搬送されてくる。ビレット
の端面3には予めスプレー式のマーキング装置(不図
示)によって所定の配置で文字列4が描かれている。こ
こで描かれている文字の大きさは全て同じであり,2行
×3列(所定の配置に相当)の文字列を成しているもの
とする。この文字列4をCCDカメラ等の撮影装置5に
より撮影する。撮影された文字列4を含む画像は画像処
理装置6に入力され,ここで文字認識等の処理がなさ
れ,認識結果がホストコンピュータ7に送られるように
なっている。この装置による文字認識の一連の流れを図
1,図2を用いてステップS1,S2,…順にさらに詳
述する。先ず,撮影装置5により画像処理装置6に画像
入力を行う(S1)。そして,得られた画像データを適
当なしきい値で2値化処理を行う(S2)。図3は2値
化処理を行った後の画像データの一例である。本実施例
では,撮影の際にビレット2が定位置から上下左右及び
前後にずれることも想定して,カメラ視野を広くとって
いる。そのため,図3中には文字列4以外にも天井照明
等の背景画像が含まれている。
【0008】次に,連結画素(以下パターンという)を
抽出し,それぞれに対して番号を付けるラベリング処理
を行う(S3)。そして,各パターンの内,予め設定し
てある文字の基準(所定の条件に相当)に当てはまるも
のを抽出し,文字候補とする(S4)。本実施例では,
パターンの外接矩形の大きさ及び縦横比が所定の範囲に
含まれるものを文字候補としている。この段階で,大き
さや縦横比などから明らかに文字でないと判断されるパ
ターンが削除される。尚,パターンの外接矩形の大きさ
と縦横比以外にも,例えばパターンの面積,パターンと
その外接矩形との面積比,並びにパターンの周囲長の2
乗と面積との比を持って文字候補の抽出の判断基準とす
ることもできる。次に,各文字候補をリーダーとするグ
ループ作りを行う(S5)。ここでグループとは,リー
ダーとの位置関係が予め設定してある文字列の情報(以
下文字列情報という)に合致していると判断された文字
候補の集合をいう。以下,このグループ作りについて,
図4を参照してステップS51,S52,…順に詳述す
る。
【0009】先ず,文字候補の中から順番に1つの文字
候補を選び,それをグループのリーダーとする(S5
1)。次に,リーダー以外の文字候補の中から順番に1
つの文字候補を選ぶ(S52)。このリーダー以外の文
字候補が,リーダーと同じグループに含まれるかどうか
を判定する(S53)。この判定は具体的には,次の
(1),(2)式を満たす文字候補を同じグループに含
めることによって行われる。 m−dm<dW/(W+W*(dFW/FW))<m+dm (m=−2,− 1,0,1,2) …(1) n−dn<dH/(H+H*(dFH/FH))<n+dn (n=−1,0 ,1) …(2) ここで,図5,図6に示すように,変数W,Hはそれぞ
れリーダー61の外接矩形の幅,高さであり,変数d
W,dHはそれぞれリーダー61と文字候補62とのそ
れぞれの外接矩形の左上の座標の縦,横方向の間隔であ
って,これらの変数が上記文字列情報をなす。また,各
変数FW,FH,dFW,dFHは文字列情報に基づい
て予め定められた値であり,それぞれマーキング文字の
幅,高さ,隣接するマーキング文字との縦,横方向の距
離の基準値である。さらに,m,nはリーダー61と文
字候補62との縦横の位置関係を示す値であり,ここで
は,mは−2〜+2,nは−1〜+1の間の整数値をと
る。また,dm,dnはそれぞれmとnとのマージン
(<0.5)である。
【0010】つまり,リーダーの左右1つ又は2つ,及
び上下1つずれた位置にある文字候補をグループに含め
ることになる。これにより,文字パターンと大きさと縦
横比が似ているため文字候補となってしまった背景パタ
ーンはこの段階で除外され,文字列情報に合致するパタ
ーンだけがグループに含まれる。そして,リーダー以外
の全ての文字候補がグループに含まれるかどうかを判定
し終わったら,次のステップに進む(S54)。判定が
終わっていない候補があれば,上記ステップS52に戻
る。次にグループに得点を付ける(S55)。得点は,
グループに含まれた文字候補の数が多く,さらに各文字
候補の座標と経験的に得られた文字領域の中心座標との
距離が近い程高得点となるようにしている。そして,全
ての文字候補がリーダーになったら終了する(S5
6)。リーダーになっていない文字候補があれば上記ス
テップS51に戻る。このようにグループ作りを行った
後,各グループの中で,一番得点の高いグループを選
び,そのグループに含まれる文字候補の最大外接矩形を
文字領域と決定する(S6)。これにより,例えば図7
(a)に示すような文字欠けや,あるいは図7(b)に
示すような文字の連結などの上記ステップS4において
文字候補として抽出されなかった文字も文字領域に含ま
れることになる。つまり,本実施例では,文字列の中に
低質な文字が含まれていても文字領域を正確に決定する
ことが可能となる。
【0011】次に,文字領域を文字列情報に沿って2行
×3列に6分割して切り出し,それぞれを文字とする
(S7)。そして,各文字に対してパターン認識を行い
(S8),その認識結果をホストコンピュータ7に出力
する(S9)。以上のように,本実施例によれば,文字
以外のパターンが多数含まれ,且つ文字列の位置が不定
であるような画像データからであっても,文字領域を抽
出することが可能である。よって,画像入力の際に文字
列を所定の範囲に配置する必要がないので,正確な位置
決めが不可能な印字面に書かれた文字列も抽出できる。
また,画像内から文字領域を抽出するための余分な目印
を付ける必要もない。さらに,従来の射影を用いた方法
では,正確な切出しが困難であった低質な文字が文字列
に含まれている場合であっても,本実施例では文字領域
を正確に抽出できる。従って,後は文字列情報に併せて
文字領域を分割する事によって文字を正確に切り出すこ
とが可能となる。文字切り出しの正確さは文字認識の正
確さに直結するため,本実施例によって文字認識の正解
率を大幅に向上させることができる。
【0012】
【発明の効果】本発明に係る画像の文字領域決定方法
は,上記したように構成されているため,画像データに
文字列以外の背景画像が含まれ,文字質が劣悪な場合に
も文字領域を正確に決定することができる。
【図面の簡単な説明】
【図1】 本発明の一実施例に係る画像の文字領域決定
方法を含む文字認識方法の概略構成を示す全体フロー
図。
【図2】 上記文字認識方法を適用可能な装置の全体構
成を示す模式図。
【図3】 2値化処理後の入力画像の一例を示す説明
図。
【図4】 グループ作りの処理手順を示す部分フロー
図。
【図5】 リーダーと他の文字候補との位置関係を示す
説明図。
【図6】 文字列情報に対する予め設定された基準値を
示す説明図。
【図7】 文字質が劣悪な場合の文字領域抽出結果の一
例を示す説明図。
【符号の説明】
S1…画像入力工程 S2…2値化処理工程 S3…ラベリング工程 S4…文字候補抽出工程 S5…グループ作り工程 S6…文字列領域判定工程
フロントページの続き (72)発明者 中田 浩司 兵庫県神戸市灘区灘浜東町2番地 株式会 社神戸製鋼所神戸製鉄所内 (72)発明者 森 茂広 兵庫県神戸市灘区灘浜東町2番地 株式会 社神戸製鋼所神戸製鉄所内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 所定の配置をなし,かつ同じ大きさの文
    字からなる文字列を含む画像を入力して2値化処理し,
    上記処理データに含まれる全ての連結画素の中から,そ
    の特徴が所定の条件を満足する文字候補を抽出し,上記
    文字候補同士の位置関係が上記所定の配置をなすような
    文字候補の全てを含む外接矩形領域を上記画像の文字領
    域と決定する画像の文字領域決定方法。
  2. 【請求項2】 上記文字候補の抽出が,上記全ての連結
    画素の中から,連結画素の外接矩形の大きさ,連結画素
    の外接矩形の縦横比,連結画素の面積,連結画素とその
    外接矩形との面積比,及び連結画素の周囲長の2乗とそ
    の面積との比のうちの少なくとも1つが予め設定された
    範囲内にあるものを抽出することである請求項1記載の
    画像の文字領域決定方法。
  3. 【請求項3】 上記所定の配置が,予め設定された文字
    の幅と高さ,及び縦と横方向の文字間隔よりなる請求項
    1記載の画像の文字領域決定方法。
JP7145788A 1995-06-13 1995-06-13 画像の文字領域決定方法 Pending JPH08339421A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7145788A JPH08339421A (ja) 1995-06-13 1995-06-13 画像の文字領域決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7145788A JPH08339421A (ja) 1995-06-13 1995-06-13 画像の文字領域決定方法

Publications (1)

Publication Number Publication Date
JPH08339421A true JPH08339421A (ja) 1996-12-24

Family

ID=15393182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7145788A Pending JPH08339421A (ja) 1995-06-13 1995-06-13 画像の文字領域決定方法

Country Status (1)

Country Link
JP (1) JPH08339421A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990235B2 (en) 1998-02-06 2006-01-24 Fujitsu Limited Color image processing apparatus and pattern extracting apparatus
US7280688B2 (en) 1998-12-09 2007-10-09 Fujitsu Limited Image processing apparatus and pattern extraction apparatus
JP2008204203A (ja) * 2007-02-20 2008-09-04 Kobe Steel Ltd 文字列画像の画像処理方法,そのプログラム及びその装置
JP6458239B1 (ja) * 2017-08-29 2019-01-30 株式会社マーケットヴィジョン 画像認識システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990235B2 (en) 1998-02-06 2006-01-24 Fujitsu Limited Color image processing apparatus and pattern extracting apparatus
US7280688B2 (en) 1998-12-09 2007-10-09 Fujitsu Limited Image processing apparatus and pattern extraction apparatus
US7349571B2 (en) 1998-12-09 2008-03-25 Fujitsu Limited Image processing apparatus and pattern extraction apparatus
JP2008204203A (ja) * 2007-02-20 2008-09-04 Kobe Steel Ltd 文字列画像の画像処理方法,そのプログラム及びその装置
JP6458239B1 (ja) * 2017-08-29 2019-01-30 株式会社マーケットヴィジョン 画像認識システム
JP2019045909A (ja) * 2017-08-29 2019-03-22 株式会社マーケットヴィジョン 画像認識システム

Similar Documents

Publication Publication Date Title
JP4822766B2 (ja) 路面標示認識装置及びシステム
JPH0844819A (ja) 画像処理方法および画像処理装置
US11244194B2 (en) System and method for object recognition using local binarization
CN114155527A (zh) 一种场景文本识别方法和装置
CN110598698A (zh) 基于自适应区域建议网络的自然场景文本检测方法和系统
CN111626145B (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
KR101793184B1 (ko) 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법
JPH0256708B2 (ja)
CN113610052A (zh) 一种基于深度学习的隧道渗漏水自动识别方法
JPH0418351B2 (ja)
JPH08339421A (ja) 画像の文字領域決定方法
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JP2006155126A (ja) 車両番号認識装置
JP2000030033A (ja) 人物検出方法
US8351102B2 (en) Image-processing device, image-reading device, image-forming device, image-processing program, and image-processing method
JP2868134B2 (ja) 画像処理方法及び装置
JPH09138837A (ja) 帳票認識装置
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
CN114612892B (zh) 一种pcb元器件表面3d字符分割方法
JP2008107946A (ja) 画像の文字列領域決定方法,画像の文字列領域決定装置
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP4409678B2 (ja) 罫線抽出方式
JP2003317107A (ja) 罫線抽出方法及び装置
JPH0573718A (ja) 領域属性識別方式