JP3066448B2 - 文字切り出し方法 - Google Patents

文字切り出し方法

Info

Publication number
JP3066448B2
JP3066448B2 JP8227180A JP22718096A JP3066448B2 JP 3066448 B2 JP3066448 B2 JP 3066448B2 JP 8227180 A JP8227180 A JP 8227180A JP 22718096 A JP22718096 A JP 22718096A JP 3066448 B2 JP3066448 B2 JP 3066448B2
Authority
JP
Japan
Prior art keywords
character
string
characters
reference point
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP8227180A
Other languages
English (en)
Other versions
JPH1069523A (ja
Inventor
祐二 安達
和樹 橋本
幸平 大槻
基 橋詰
暢 高橋
裕之 長谷川
仁 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JFE Steel Corp
Kobe Steel Ltd
JFE Engineering Corp
Nippon Steel Corp
Original Assignee
JFE Steel Corp
Kobe Steel Ltd
JFE Engineering Corp
Sumitomo Metal Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JFE Steel Corp, Kobe Steel Ltd, JFE Engineering Corp, Sumitomo Metal Industries Ltd filed Critical JFE Steel Corp
Priority to JP8227180A priority Critical patent/JP3066448B2/ja
Publication of JPH1069523A publication Critical patent/JPH1069523A/ja
Application granted granted Critical
Publication of JP3066448B2 publication Critical patent/JP3066448B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、物品に付けた数字
及び英字等の文字を撮像し、得られた画像内の文字を認
識する場合において、画像内の文字を一文字ずつ切り出
す方法に関する。
【0002】
【従来の技術】製造業にあっては、中間品及び製品にロ
ット番号,製造番号等を直接印字し、又はそれらを印字
したシートを貼着し、文字認識装置が備える撮像装置を
製造ライン又は入出庫ライン等に設置しておき、該撮像
装置によって中間品又は製品に付した文字を読み取り、
読み取った文字からロット番号又は製造番号を認識し、
認識したロット番号又は製造番号を管理用のコンピュー
タに与え、該コンピュータによって製造工程及び在庫の
集中管理が行われている。ロット番号,製造番号等の文
字は、中間品又は製品に直接印字されることが多いが、
かすれ,にじみ及び汚れ等によって印字品質は低い。ま
た、照明度が低く撮像環境が悪い。一方、製造業におけ
る文字認識は、高速・高率・高精度で文字を認識するこ
とが要求されている。そこで、これらの要求に対応すべ
く、次のような文字認識方法が採用されている。
【0003】撮像装置で認識対象文字を撮像して得たア
ナログ信号を所定階調のディジタル信号に変換し、それ
を画像メモリに記憶させる。画像メモリに記憶した文字
画像を2値化して2値化画像を生成し、この2値化画像
から一文字ずつ文字を切り出す。切り出したそれぞれの
文字について、辞書に予め登録した複数の基準文字パタ
ーンとのパターンマッチングを行って、各基準文字パタ
ーンと切り出した文字との一致度を次の(1)式に基づ
いてそれぞれ算出し、一致度が高いものから順番に第1
候補文字,第2候補文字とし、第1候補文字が次の
(2)式及び(3)式のいずれをも満足する場合、切り
出した文字は第1候補文字であると判断し、両式のいず
れか一方のみ満足する場合又はいずれも満足しない場
合、切り出した文字は不読であると判断する。 一致度=(一致した画素の総数)/(基準文字パターン を構成する画素の総数)…(1) 第1候補文字の一致度≧第1閾値 …(2) 第1候補文字の一致度と 第2候補文字の一致度との差≧第2閾値 …(3)
【0004】このような文字認識にあっては、文字を切
り出す際に、一文字ずつ正確に切り出すことが重要であ
る。
【0005】図5及び図6は従来の文字の切り出し方法
を説明する説明図である。図5(a)の如く、2値化画
像に“1,2,3,4,5”及び“6,7,8,9,
0”の文字列がある場合、2値化画像を構成する各2値
化値を文字列列方向に累計する操作を繰り返して文字列
方向の投影を生成すると、図5(b)の如く、各文字列
に応じて2つのピークが得られる。そして、各ピークの
中心を求めて切り出しのための第1基準点とし、各第1
基準点を中心に予め設定された列サイズになるように両
文字列を切り出す。
【0006】切り出した文字列の内、例えば“1,2,
3,4,5”について、文字列方向と直交する方向に2
値化値を累計する操作を繰り返してその方向の投影を生
成すると、図6(b)の如く、各文字に応じた5つのピ
ークが得られる。そして、各ピークの中心を求めて第2
基準点とし、各第2基準点を中心に予め設定された行サ
イズになるように各文字を切り出すことによって、図6
(a)の如く、“1”,“2”,“3”,“4”,
“5”の各文字を切り出していた。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
方法では次のような問題があった。図7は、従来の方法
によって、撮像された文字列が斜行している場合にそれ
に含まれる各文字を切り出した結果を説明する説明図で
あり、図7(a)は列サイズを略1文字の縦サイズに設
定した場合を、また、図7(b)は列サイズを1文字の
縦サイズより大きいサイズに設定した場合をそれぞれ示
している。従来の方法にあっては、図7(a)から明ら
かな如く、列サイズを略1文字の縦サイズに設定した場
合、認識対象文字が斜行しているため、文字列内のいく
つかの文字に欠けが発生し、文字認識率及び文字認識精
度が低下するという問題があった。そのため、列サイズ
を1文字の縦サイズより大きいサイズに設定した場合、
図7(b)の如く、文字欠けは防止されるが、切り出さ
れた文字が、列サイズ及び行サイズで定まる文字枠の上
端側又は下端側にかたよるため、基準文字パターンとの
一致度が低下し、文字認識率及び文字認識精度が低下す
る。同様の問題は、撮像された文字列が波状である場合
にも生じる。
【0008】本発明はかかる事情に鑑みてなされたもの
であって、その目的とするところは文字列方向に投影し
た結果に基づいて、それに含まれる複数の文字パターン
の全領域が切り出されるように文字列を切り出し、その
文字列から切り出した各文字パターンを文字列方向にそ
れぞれ投影し、得られた各投影結果に基づいて、各文字
パターンを更に切り出すことによって、撮像された文字
列が斜行している場合又は文字列が波状である場合でも
それに対応して文字を正しく切り出し、文字認識率及び
文字認識精度を向上させることができる文字切り出し方
法を提供することにある。
【0009】
【課題を解決するための手段】本発明に係る文字切り出
し方法は、1又は複数の文字列を撮像してディジタル画
像信号を得、これを処理して得た画像内の文字を認識す
べく画像内の文字を切り出す方法において、予め文字を
切り出すための文字の高さに相当する列サイズ、文字の
幅に相当する行サイズ、及び同じ文字列の高い位置にあ
る文字と低い位置にある文字との最大高低差を求めてお
き、文字列の画像を文字列の方向に投影して得た濃淡に
関連する値の文字高さ方向の中央に相当する位置である
第1基準点を求め、第1基準点を中心に前記列サイズと
前記最大高低差との和に相当する高さで文字列を切り出
すステップと、切り出した文字列に対して、文字列と
交する方向に投影して得た濃淡に関連する値の各文字幅
方向の中央に相当する位置である第2基準点をそれぞれ
求め、第2基準点を中心に、前記行サイズで各文字を
り出すステップと、切り出した各文字それぞれに対し
て、文字列方向投影して得た濃淡に関連する値の文
字高さ方向の中央に相当する位置である第3基準点を求
め、各第3基準点を中心に前記列サイズで各文字を切り
出すステップを備えることを特徴とする。
【0010】図3及び図4は、本発明に係る文字切り出
し方法を説明する説明図であり、図3は撮像した文字列
が斜行している場合を、また、図4は撮像した文字列が
波状である場合をそれぞれ示している。印字装置及び搬
送装置の作動状態によって、撮像された文字列は斜行し
たり、又は波状になったりする。そこで、複数のサンプ
ルを撮像し、文字列内の高い位置にある文字と低い位置
にある文字との差の最大値を予め求めておく。
【0011】いま、適正な文字切り出しが、列サイズが
20画素,行サイズが15画素の文字枠の中央に文字が
位置する場合であり、文字列内の高い位置にある文字と
低い位置にある文字との差の最大値が5画素であるとす
ると、文字列方向に投影して得られるピークの中央であ
る第1基準点を求め、図3(1)及び図4(1)のよう
に、第1基準点を中心に25画素の列サイズで文字列を
切り出す。切り出した文字列について、文字列方向と直
交する方向に投影し、該文字列に含まれる各文字に対応
する各ピークの中央である第2基準点をそれぞれ求め、
図3(2)及び図4(2)のように、各第2基準点を中
心に15画素の行サイズで各文字を切り出す。
【0012】そして、切り出した各文字それぞれについ
て、文字列方向の投影を生成して得られる各ピークの中
央を第3基準点とし、図3(3)及び図4(3)のよう
に、各第3基準点を中心に20画素の列サイズで切り出
す。これによって、文字列が斜行又は波状である場合で
あっても、各文字列に含まれる複数の文字は、文字欠け
及びかたよりが生じることなく、一文字ずつ適正に切り
出される。
【0013】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて具体的に説明する。図1は本発明の実施に使
用する文字認識装置の構成を示すブロック図であり、図
中Sは鋼板,鋼管等の被撮像物である。被撮像物Sは搬
送装置1によって矢符方向に搬送されるようになってお
り、該被撮像物Sの所定位置にはロット番号又は製品番
号等の認識対象文字が印字してある。被撮像物Sの搬送
領域には、被撮像物Sの認識対象文字が印字される部分
と対向して撮像装置2が設置してあり、該撮像装置2に
よって被撮像物Sの認識対象文字が撮像される。撮像装
置2が撮像した文字画像は、アナログ/ディジタル(A
/D)変換器3に与えられ、A/D変換器3によって所
定階調の濃淡画像に変換されて、コンピュータ4に備え
られた中央演算装置(CPU)41によって画像メモリ42
に与えられ、そこに記憶される。
【0014】画像メモリ42に記憶された濃淡画像は2値
化部43によって2値化処理される。得られた2値化画像
に基づいて、文字切り出し部44は後述するように一文字
ずつ文字を切り出し、切り出した各文字を前処理部45に
与える。コンピュータ4は、パターンマッチングに用い
る複数の基準文字パターンが登録してある辞書46を備え
ており、前処理部45は与えられた文字と辞書46内の基準
文字パターンとを比較できるように、切り出した文字の
方向,サイズ,線幅等を正規化し、それをパターンマッ
チング部47に与える。パターンマッチング部47は、正規
化された文字と辞書44内の各基準文字パターンとの一致
度を次の(1)式によってそれぞれ算出し、その算出結
果を判断部48に与える。 一致度=(一致した画素の総数)/(基準文字パターン を構成する画素の総数)…(1)
【0015】判断部48は辞書46の各基準文字パターンの
内、一致度が高いものから順番に第1候補文字,第2候
補文字,…として、第1候補文字の一致度M1 と第2候
補文字の一致度M2 との差を算出し、第1候補文字の一
致度M1 と予め設定された第1閾値D1 とを、また第1
候補文字の一致度と第2候補文字の一致度との差(M 1
−M2 )と予め設定された第2閾値D2 とをそれぞれ比
較する。
【0016】判断部48は、比較した結果、次の(2)式
かつ(3)式を満足するか否かを判断し、満足すると判
断した場合、切り出した文字は第1候補文字であると決
定し、満足しないと判断した場合、不読であると判断す
る。そして、出力部49はそれらの結果を出力する。 第1候補文字の一致度≧第1閾値 …(2) 第1候補文字の一致度と 第2候補文字の一致度との差≧第2閾値 …(3)
【0017】図2は図1に示した文字切り出し部44によ
る文字の切り出し手順を示すフローチャートである。い
ま、適正な文字切り出しが、列サイズが20画素,行サ
イズが15画素の文字枠の中央に文字が位置する場合で
あり、高い位置にある文字と低い位置にある文字との差
の最大値が5画素であるとすると、文字切り出し部44に
は文字列を切り出すための列サイズとして25画素、行
サイズとして15画素、文字を切り出すための列サイズ
として20画素が設定してある。
【0018】文字切り出し部44は、2値化画像を文字列
方向に投影し(ステップS1)、得られたピークの中央
である第1基準点を求め(ステップS2)、第1基準点
を中心に25画素の列サイズで文字列を切り出す(図3
(1)及び図4(1)参照)(ステップS3)。文字切
り出し部44は、切り出した文字列について、文字列方向
と直交する方向に投影し(ステップS4)、該文字列に
含まれる各文字に対応する各ピークの中央である第2基
準点をそれぞれ求め(ステップS5)、各第2基準点を
中心に15画素の行サイズで各文字を切り出す(図3
(2)及び図4(2)参照)(ステップS6)。
【0019】そして、文字切り出し部44は、切り出した
各文字それぞれについて、文字列方向の投影を生成し
(ステップS7)、得られる各ピークの中央を第3基準
点とし(ステップS8)、各第3基準点を中心に20画
素の列サイズで切り出す(図3(3)及び図4(3)参
照)(ステップS9)。これによって、斜行又は波状の
場合であっても、各文字列に含まれる複数の文字は、文
字欠け及びかたよりが生じることなく、一文字ずつ適正
に切り出される。
【0020】なお、本実施の形態にあっては、文字切り
出し部には文字列を切り出すための列サイズを予め設定
してあるが、本発明はこれに限らず、文字列に含まれる
複数の文字パターンを文字列方向に投影した結果に基づ
いて、投影のピークの両端が含まれるように文字列を切
り出すことによってよい。これによっても、文字列に含
まれる複数の文字パターンの全てを切り出すことができ
る。
【0021】
【発明の効果】本発明に係る文字切り出し方法にあって
は、第1〜第3基準点を求め、この基準点に基づいて切
り出しを行うこととしたから文字列が斜行し又は文字
列が波状である場合であっても、文字列に含まれる複数
の文字は、文字欠け及びかたよりが生じることなく、一
文字ずつ適正に切り出されるため、文字認識精度及び文
字認識率が向上する等、本発明は優れた効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施に使用する文字認識装置の構成を
示すブロック図である。
【図2】図1に示した文字切り出し部による文字の切り
出し手順を示すフローチャートである。
【図3】本発明に係る文字切り出し方法を説明する説明
図である。
【図4】本発明に係る文字切り出し方法を説明する説明
図である。
【図5】従来の文字の切り出し方法を説明する説明図で
ある。
【図6】従来の文字の切り出し方法を説明する説明図で
ある。
【図7】従来の方法によって、撮像された文字が斜行し
ている文字を切り出した結果を説明する説明図である。
【符号の説明】
2 撮像装置 4 コンピュータ 42 画像メモリ 44 文字切り出し部 47 パターンマッチング部 48 判断部
───────────────────────────────────────────────────── フロントページの続き (73)特許権者 000001199 株式会社神戸製鋼所 兵庫県神戸市中央区脇浜町1丁目3番18 号 (73)特許権者 390023928 日立エンジニアリング株式会社 茨城県日立市幸町3丁目2番1号 (72)発明者 安達 祐二 大阪府大阪市中央区北浜4丁目5番33号 住友金属工業株式会社内 (72)発明者 橋本 和樹 大阪府大阪市中央区北浜4丁目5番33号 住友金属工業株式会社内 (72)発明者 大槻 幸平 大阪府大阪市中央区北浜4丁目5番33号 住友金属工業株式会社内 (72)発明者 橋詰 基 東京都千代田区丸の内一丁目1番2号 日本鋼管株式会社内 (72)発明者 高橋 暢 岡山県倉敷市水島川崎通1丁目(番地な し) 川崎製鉄株式会社 水島製鉄所内 (72)発明者 長谷川 裕之 兵庫県加古川市金沢町1番地 株式会社 神戸製鋼所 加古川製鉄所内 (72)発明者 後藤 仁 茨城県日立市幸町三丁目2番1号 日立 エンジニアリング株式会社内 (56)参考文献 特開 昭62−80784(JP,A) 特開 平8−202820(JP,A) 特開 平8−55187(JP,A) 特開 平5−20498(JP,A) 特開 平3−126186(JP,A) 特開 昭63−82588(JP,A) 特開 昭56−149170(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 G06K 9/34

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 1又は複数の文字列を撮像してディジタ
    ル画像信号を得、これを処理して得た画像内の文字を認
    識すべく画像内の文字を切り出す方法において、 予め文字を切り出すための文字の高さに相当する列サイ
    ズ、文字の幅に相当する行サイズ、及び同じ文字列の高
    い位置にある文字と低い位置にある文字との最大高低差
    を求めておき、 文字列の画像を文字列の方向に投影して得た濃淡に関連
    する値の文字高さ方向の中央に相当する位置である第1
    基準点を求め、第1基準点を中心に前記列サイズと前記
    最大高低差との和に相当する高さで 文字列を切り出すス
    テップと、 切り出した文字列に対して、文字列と直交する方向に投
    影して得た濃淡に関連する値の各文字幅方向の中央に相
    当する位置である第2基準点をそれぞれ求め、第2基準
    点を中心に、前記行サイズで各文字を切り出すステップ
    と、 切り出した各文字それぞれに対して、文字列方向
    影して得た濃淡に関連する値の文字高さ方向の中央に相
    当する位置である第3基準点を求め、各第3基準点を中
    心に前記列サイズで各文字を切り出すステップを備え
    ることを特徴とする文字切り出し方法。
JP8227180A 1996-08-28 1996-08-28 文字切り出し方法 Expired - Fee Related JP3066448B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8227180A JP3066448B2 (ja) 1996-08-28 1996-08-28 文字切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8227180A JP3066448B2 (ja) 1996-08-28 1996-08-28 文字切り出し方法

Publications (2)

Publication Number Publication Date
JPH1069523A JPH1069523A (ja) 1998-03-10
JP3066448B2 true JP3066448B2 (ja) 2000-07-17

Family

ID=16856749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8227180A Expired - Fee Related JP3066448B2 (ja) 1996-08-28 1996-08-28 文字切り出し方法

Country Status (1)

Country Link
JP (1) JP3066448B2 (ja)

Also Published As

Publication number Publication date
JPH1069523A (ja) 1998-03-10

Similar Documents

Publication Publication Date Title
US7636483B2 (en) Code type determining method and code boundary detecting method
JP2822189B2 (ja) 文字認識装置及び方法
JP5334042B2 (ja) 文字列認識方法及び文字列認識装置
Chandran et al. Structural recognition of tabulated data
US7949187B2 (en) Character string recognition method and device
JP4945739B2 (ja) 文字列認識方法及び文字列認識装置
JP4011646B2 (ja) 行検出方法および文字認識装置
JP5011508B2 (ja) 文字列認識方法及び文字列認識装置
JP5630689B2 (ja) 文字認識方法及び文字認識装置
JP3066448B2 (ja) 文字切り出し方法
JPH08305795A (ja) 文字認識方法
US4769851A (en) Apparatus for recognizing characters
JPH1069524A (ja) 文字切り出し方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3170622B2 (ja) 文字認識方法及び装置
JP6039944B2 (ja) 帳票種類判別装置および帳票種類判別方法
JPH10171924A (ja) 文字認識装置
JP3645403B2 (ja) 文字読取装置および文字読取方法
Xiao et al. Staff lines detection and removal for camera-based music scores
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JPH0916715A (ja) 文字認識装置および方法
JPS6254380A (ja) 文字認識装置
JP3193573B2 (ja) かぎかっこ付文字認識装置
KR100540173B1 (ko) 주소기입형식 구분 장치 및 그 방법과 그를 이용한 주소인식 시스템
JP2959054B2 (ja) パターン認識装置における線種判別方式

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090519

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees