JPH08129611A - 文字識別方法及び検査基準文字登録方法 - Google Patents
文字識別方法及び検査基準文字登録方法Info
- Publication number
- JPH08129611A JPH08129611A JP6290538A JP29053894A JPH08129611A JP H08129611 A JPH08129611 A JP H08129611A JP 6290538 A JP6290538 A JP 6290538A JP 29053894 A JP29053894 A JP 29053894A JP H08129611 A JPH08129611 A JP H08129611A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- inspection
- shape
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Length Measuring Devices By Optical Means (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】本発明は、文字識別方法及び検査基準文字登録
方法において、文字列の画像を取り込んで、互いに接触
したそれぞれの文字をも容易に識別し得るようにする。 【構成】文字列(26)の画像を所定方向の濃度分布の
濃度が零となる位置で区切つた画像(26A)の高さ
(WY)を基準として、基準文字(25)の寸法を正規化
し、相関値を最大とさせる正規化基準文字の幅で区切つ
た画像(26A)から切り出した切出し画像に対応する
文字の形状を、切り出した正規化基準文字の形状と同一
と識別する。
方法において、文字列の画像を取り込んで、互いに接触
したそれぞれの文字をも容易に識別し得るようにする。 【構成】文字列(26)の画像を所定方向の濃度分布の
濃度が零となる位置で区切つた画像(26A)の高さ
(WY)を基準として、基準文字(25)の寸法を正規化
し、相関値を最大とさせる正規化基準文字の幅で区切つ
た画像(26A)から切り出した切出し画像に対応する
文字の形状を、切り出した正規化基準文字の形状と同一
と識別する。
Description
【0001】
【目次】以下の順序で本発明を説明する。 産業上の利用分野 従来の技術(図7) 発明が解決しようとする課題(図7) 課題を解決するための手段(図1、図2、図4及び図
6) 作用(図1、図2、図4及び図6) 実施例(図1〜図6) 発明の効果
6) 作用(図1、図2、図4及び図6) 実施例(図1〜図6) 発明の効果
【0002】
【産業上の利用分野】本発明は文字識別方法及び検査基
準文字登録方法に関し、例えばビデオテープカセツト上
の印刷文字の形状を検査する文字検査装置に、印刷形状
の標準とするマスター文字の形状を登録する際に適用し
得る。
準文字登録方法に関し、例えばビデオテープカセツト上
の印刷文字の形状を検査する文字検査装置に、印刷形状
の標準とするマスター文字の形状を登録する際に適用し
得る。
【0003】
【従来の技術】従来この種の文字検査装置には、英数字
及び記号のみで印刷された印刷文字を識別して検査する
ものがある。マスター文字の形状との類似度の大小によ
つて識別するいわゆるマツチング法によつて印刷文字を
識別する場合、マスター文字の形状は、印刷文字を検査
する前に文字検査装置に登録される。
及び記号のみで印刷された印刷文字を識別して検査する
ものがある。マスター文字の形状との類似度の大小によ
つて識別するいわゆるマツチング法によつて印刷文字を
識別する場合、マスター文字の形状は、印刷文字を検査
する前に文字検査装置に登録される。
【0004】マスター文字の形状を登録する際、文字検
査装置は、正常な形状に印刷された印刷文字列を例えば
CCD(Charge Coupled Device )カメラで撮影して、
印刷文字列の画像を取り込む。文字検査装置は、この印
刷文字列の画像の垂直方向(紙面の上下方向)の濃度ヒ
ストグラムいわゆるプロフアイルを求め、このプロフア
イルの谷の部分でそれぞれ切り出す。続いて、文字検査
装置は、切り出したプロフアイルに対応する画像をマス
ター文字の画像としてそれぞれ登録する。
査装置は、正常な形状に印刷された印刷文字列を例えば
CCD(Charge Coupled Device )カメラで撮影して、
印刷文字列の画像を取り込む。文字検査装置は、この印
刷文字列の画像の垂直方向(紙面の上下方向)の濃度ヒ
ストグラムいわゆるプロフアイルを求め、このプロフア
イルの谷の部分でそれぞれ切り出す。続いて、文字検査
装置は、切り出したプロフアイルに対応する画像をマス
ター文字の画像としてそれぞれ登録する。
【0005】
【発明が解決しようとする課題】ところが、文字同士が
接触している場合、文字検査装置はどの谷で切り出して
良いか分からず、切り出し位置を決定することが困難で
あつた。例えば、図7に示すように、識別対象文字「o
f」の画像1のプロフアイル2及び3と、識別対象文字
「pac 」の画像4のプロフアイル5及び6とには、谷の
部分が幾つか存在する。また水平棒を含む同一文字が接
触している識別対象文字「ff」の画像7のプロフアイル
8及び9には、ある範囲に亘つて同一高さのプロフアイ
ルの谷の部分が検出される。
接触している場合、文字検査装置はどの谷で切り出して
良いか分からず、切り出し位置を決定することが困難で
あつた。例えば、図7に示すように、識別対象文字「o
f」の画像1のプロフアイル2及び3と、識別対象文字
「pac 」の画像4のプロフアイル5及び6とには、谷の
部分が幾つか存在する。また水平棒を含む同一文字が接
触している識別対象文字「ff」の画像7のプロフアイル
8及び9には、ある範囲に亘つて同一高さのプロフアイ
ルの谷の部分が検出される。
【0006】このような場合、ユーザは登録したい文字
の文字種類を文字検査装置に入力していた。これにより
文字検査装置は文字の幅を識別して、切り出し位置の見
当を付けていた。またユーザがそれぞれの文字を識別し
て切り出し位置を決定することもあつた。これにより文
字検査装置は対象文字を別個に切り出すことができた。
ところが、これらの作業は登録文字の種類が多くなると
時間がかかり、登録作業の効率が低下するという問題が
あつた。
の文字種類を文字検査装置に入力していた。これにより
文字検査装置は文字の幅を識別して、切り出し位置の見
当を付けていた。またユーザがそれぞれの文字を識別し
て切り出し位置を決定することもあつた。これにより文
字検査装置は対象文字を別個に切り出すことができた。
ところが、これらの作業は登録文字の種類が多くなると
時間がかかり、登録作業の効率が低下するという問題が
あつた。
【0007】因みに、プロフアイル2、5及び8は、そ
れぞれ画像1、4及び7の濃淡画像のプロフアイルであ
る。またプロフアイル3、6及び9は、それぞれ画像
1、4及び7の2値画像のプロフアイルである。
れぞれ画像1、4及び7の濃淡画像のプロフアイルであ
る。またプロフアイル3、6及び9は、それぞれ画像
1、4及び7の2値画像のプロフアイルである。
【0008】本発明は以上の点を考慮してなされたもの
で、文字列の画像を取り込んで、互いに接触した文字を
もそれぞれ容易に識別し得る文字識別方法及び検査基準
文字登録方法を提案しようとするものである。
で、文字列の画像を取り込んで、互いに接触した文字を
もそれぞれ容易に識別し得る文字識別方法及び検査基準
文字登録方法を提案しようとするものである。
【0009】
【課題を解決するための手段】かかる課題を解決するた
め本発明においては、複数の文字が配列された文字列
(26)の画像を取り込み、画像を所定方向の濃度分布
の濃度が零となる位置で区切り、区切つた画像(26
A)の高さ(wy)を基準として、複数の基準文字(2
5)の寸法をそれぞれ正規化して、複数の正規化基準文
字を作成し、区切られた画像(26A)から正規化基準
文字の幅で切り出した切出し画像の形状と、当該正規化
基準文字の形状との相関値を算出し、相関値に基づい
て、切出し画像に対応する文字の形状を識別する。
め本発明においては、複数の文字が配列された文字列
(26)の画像を取り込み、画像を所定方向の濃度分布
の濃度が零となる位置で区切り、区切つた画像(26
A)の高さ(wy)を基準として、複数の基準文字(2
5)の寸法をそれぞれ正規化して、複数の正規化基準文
字を作成し、区切られた画像(26A)から正規化基準
文字の幅で切り出した切出し画像の形状と、当該正規化
基準文字の形状との相関値を算出し、相関値に基づい
て、切出し画像に対応する文字の形状を識別する。
【0010】また本発明においては、複数の検査対象文
字が配列された検査対象文字列の画像を取り込み、当該
検査対象文字の形状を検査基準文字の形状に基づいて検
査する文字検査装置(12)に、当該検査基準文字の形
状を識別して登録する際の検査基準文字登録方法におい
て、複数の検査対象文字とそれぞれほぼ同一形状でなる
複数の登録対象文字が配列された登録対象文字列(2
6)の画像を取り込み、登録対象文字列(26)の画像
を所定方向の濃度分布の濃度が零となる位置で区切り、
区切つた画像(26A)の高さ(wy)を基準として、複
数の識別基準文字(25)の寸法をそれぞれ正規化し
て、複数の正規化識別基準文字を作成し、区切られた画
像(26A)から正規化識別基準文字の幅で切り出した
切出し画像の形状と、当該正規化識別基準文字の形状と
の相関値を算出し、相関値に基づいて、切出し画像に対
応する登録対象文字の形状を識別して登録する。
字が配列された検査対象文字列の画像を取り込み、当該
検査対象文字の形状を検査基準文字の形状に基づいて検
査する文字検査装置(12)に、当該検査基準文字の形
状を識別して登録する際の検査基準文字登録方法におい
て、複数の検査対象文字とそれぞれほぼ同一形状でなる
複数の登録対象文字が配列された登録対象文字列(2
6)の画像を取り込み、登録対象文字列(26)の画像
を所定方向の濃度分布の濃度が零となる位置で区切り、
区切つた画像(26A)の高さ(wy)を基準として、複
数の識別基準文字(25)の寸法をそれぞれ正規化し
て、複数の正規化識別基準文字を作成し、区切られた画
像(26A)から正規化識別基準文字の幅で切り出した
切出し画像の形状と、当該正規化識別基準文字の形状と
の相関値を算出し、相関値に基づいて、切出し画像に対
応する登録対象文字の形状を識別して登録する。
【0011】
【作用】文字列(26)の画像を所定方向の濃度分布の
濃度が零となる位置で区切つた画像(26A)の高さ
(WY)を基準として、基準文字(25)の寸法を正規化
し、相関値を最大とさせる正規化基準文字の幅で区切つ
た画像(26A)から切り出した切出し画像に対応する
文字の形状を、切り出した正規化基準文字の形状と同一
と識別することにより、登録文字列(26)の画像を取
り込んで、互いに接触したそれぞれの文字をも一段と容
易に識別し得る。
濃度が零となる位置で区切つた画像(26A)の高さ
(WY)を基準として、基準文字(25)の寸法を正規化
し、相関値を最大とさせる正規化基準文字の幅で区切つ
た画像(26A)から切り出した切出し画像に対応する
文字の形状を、切り出した正規化基準文字の形状と同一
と識別することにより、登録文字列(26)の画像を取
り込んで、互いに接触したそれぞれの文字をも一段と容
易に識別し得る。
【0012】
【実施例】以下図面について、本発明の一実施例を詳述
する。
する。
【0013】図1において、10は全体として文字検査
システムを示し、ビデオテープカセツト11上の印刷文
字の形状をマスター文字の形状とマツチング法によつて
比較し、印刷文字の欠け、細り、にじみ等を検査する。
検査前に、文字検査システム10は、英数字及び記号を
正常に印刷した印刷文字の画像を取り込み、マスター文
字として文字検査装置12に登録する。
システムを示し、ビデオテープカセツト11上の印刷文
字の形状をマスター文字の形状とマツチング法によつて
比較し、印刷文字の欠け、細り、にじみ等を検査する。
検査前に、文字検査システム10は、英数字及び記号を
正常に印刷した印刷文字の画像を取り込み、マスター文
字として文字検査装置12に登録する。
【0014】すなわち文字検査システム10は、例えば
CCDカメラ13で印刷文字を撮影して、画像信号S1
を文字検査装置12の画像処理ボード12Aに入力す
る。画像処理ボード12Aは画像信号S1を処理して印
刷文字の画像データを検査処理ボード12Bに与える。
検査処理ボード12Bには、画像データに基づいて印刷
文字を検査する検査用マイクロコンピユータ(以下検査
CPUという)が配設されている。
CCDカメラ13で印刷文字を撮影して、画像信号S1
を文字検査装置12の画像処理ボード12Aに入力す
る。画像処理ボード12Aは画像信号S1を処理して印
刷文字の画像データを検査処理ボード12Bに与える。
検査処理ボード12Bには、画像データに基づいて印刷
文字を検査する検査用マイクロコンピユータ(以下検査
CPUという)が配設されている。
【0015】検査CPUは、トラツクボール14で指定
された領域の画像データに基づいて、印刷文字列のプロ
フアイルを作成し、マスター文字として登録を所望する
印刷文字(以下登録文字という)の画像をそれぞれ切り
出す。切り出した登録文字の画像が互いに接触している
場合、検査CPUは、複数の登録文字が接触して連なる
部分(以下登録文字部という)の画像をそのまま切り出
す。
された領域の画像データに基づいて、印刷文字列のプロ
フアイルを作成し、マスター文字として登録を所望する
印刷文字(以下登録文字という)の画像をそれぞれ切り
出す。切り出した登録文字の画像が互いに接触している
場合、検査CPUは、複数の登録文字が接触して連なる
部分(以下登録文字部という)の画像をそのまま切り出
す。
【0016】検査CPUは、切り出した登録文字や登録
文字部の高さを基準として英数字や記号の一定字体の文
字いわゆるフオント文字を垂直水平同率で正規化する。
続いて、検査CPUは、切り出した登録文字や登録文字
部の形状と正規化したフオント文字の形状との相関をと
るすなわち相関値を算出する。これにより検査CPU
は、相関値が最も高いフオント文字の種類(すなわち書
体、サイズ及び名称)を判定して、切り出した登録文字
の種類を識別する。
文字部の高さを基準として英数字や記号の一定字体の文
字いわゆるフオント文字を垂直水平同率で正規化する。
続いて、検査CPUは、切り出した登録文字や登録文字
部の形状と正規化したフオント文字の形状との相関をと
るすなわち相関値を算出する。これにより検査CPU
は、相関値が最も高いフオント文字の種類(すなわち書
体、サイズ及び名称)を判定して、切り出した登録文字
の種類を識別する。
【0017】因みに、書体は例えばゴシツク体、ボール
ド体等で指定されるものであり、サイズは例えばポイン
ト数で指定されるものとする。また名称はエー、ビー、
シー等で指定されるものとする。印刷文字は、数種の書
体及びサイズの英字(大文字及び小文字)、数字及び記
号でなり、これと同一書体及びサイズのフオント文字が
文字検査装置12のハードデイスク12Cに記憶されて
いる。マスター文字として識別したそれぞれの登録文字
もハードデイスク12Cに登録される。
ド体等で指定されるものであり、サイズは例えばポイン
ト数で指定されるものとする。また名称はエー、ビー、
シー等で指定されるものとする。印刷文字は、数種の書
体及びサイズの英字(大文字及び小文字)、数字及び記
号でなり、これと同一書体及びサイズのフオント文字が
文字検査装置12のハードデイスク12Cに記憶されて
いる。マスター文字として識別したそれぞれの登録文字
もハードデイスク12Cに登録される。
【0018】マスター文字を登録する際や印刷文字を検
査する際の任意のデータは、検査処理ボード12Bに接
続された入力用コンピユータ15のキーボード16より
入力される。トラツクボール14で指定された領域の画
像及びCCDカメラ13が撮影した画像は、入力用コン
ピユータ15のモニタ17や画像処理ボード12Aに接
続されたモニタ18の画面上に表示される。
査する際の任意のデータは、検査処理ボード12Bに接
続された入力用コンピユータ15のキーボード16より
入力される。トラツクボール14で指定された領域の画
像及びCCDカメラ13が撮影した画像は、入力用コン
ピユータ15のモニタ17や画像処理ボード12Aに接
続されたモニタ18の画面上に表示される。
【0019】以上の構成において、検査CPUは、マス
ター文字を登録するとき図2に示すマスター文字自動登
録処理手順に従つて動作する。すなわち検査CPUは、
マスター文字自動登録処理手順の開始ステツプSP0か
ら入り、ステツプSP1において、登録文字列の画像を
CCDカメラ13から取り込む。続いて検査CPUは、
ユーザのトラツクボール14の操作により登録処理する
領域を例えば図3(A)に示す文字列「OSNY」及び「Qu
ality 」を囲む領域20に決めてステツプSP2に移
る。
ター文字を登録するとき図2に示すマスター文字自動登
録処理手順に従つて動作する。すなわち検査CPUは、
マスター文字自動登録処理手順の開始ステツプSP0か
ら入り、ステツプSP1において、登録文字列の画像を
CCDカメラ13から取り込む。続いて検査CPUは、
ユーザのトラツクボール14の操作により登録処理する
領域を例えば図3(A)に示す文字列「OSNY」及び「Qu
ality 」を囲む領域20に決めてステツプSP2に移
る。
【0020】ステツプSP2において、検査CPUは、
この領域20内で水平方向プロフアイル21及び22を
作成し、画素数が0となるところを登録文字列の境界と
して区切る。これにより検査CPUは、2つの登録文字
列「OSNY」及び「Quality 」を抽出してステツプSP3
に移る。ステツプSP3において、図3(B)に示すよ
うに、検査CPUは、抽出された例えば登録文字列「Qu
ality 」に対して、垂直方向プロフアイル23を作成し
て画素数が0のところを文字境界とする。これにより検
査CPUは、登録文字列「Quality 」のそれぞれの登録
文字の区切りを抽出してステツプSP4に移る。
この領域20内で水平方向プロフアイル21及び22を
作成し、画素数が0となるところを登録文字列の境界と
して区切る。これにより検査CPUは、2つの登録文字
列「OSNY」及び「Quality 」を抽出してステツプSP3
に移る。ステツプSP3において、図3(B)に示すよ
うに、検査CPUは、抽出された例えば登録文字列「Qu
ality 」に対して、垂直方向プロフアイル23を作成し
て画素数が0のところを文字境界とする。これにより検
査CPUは、登録文字列「Quality 」のそれぞれの登録
文字の区切りを抽出してステツプSP4に移る。
【0021】ステツプSP4において、図3(C)及び
(D)に示すように、検査CPUは、区切つた登録文字
毎に再び水平方向プロフアイルを作成してそれぞれの登
録文字の高さを抽出するとステツプSP5に移る。ステ
ツプSP5において、検査CPUは、この高さを基準サ
イズとするように書体毎のフオント文字を垂直水平同率
に正規化する。続いて、検査CPUは、登録文字と正規
化したフオント文字との相関値を算出してステツプSP
6に移る。ステツプSP6において、検査CPUは、登
録文字と全てのフオント文字との相関値を算出したか否
かを判断する。
(D)に示すように、検査CPUは、区切つた登録文字
毎に再び水平方向プロフアイルを作成してそれぞれの登
録文字の高さを抽出するとステツプSP5に移る。ステ
ツプSP5において、検査CPUは、この高さを基準サ
イズとするように書体毎のフオント文字を垂直水平同率
に正規化する。続いて、検査CPUは、登録文字と正規
化したフオント文字との相関値を算出してステツプSP
6に移る。ステツプSP6において、検査CPUは、登
録文字と全てのフオント文字との相関値を算出したか否
かを判断する。
【0022】ステツプSP6において否定結果を得る
と、検査CPUは、ステツプSP5に戻つて上述の手順
を繰り返す。登録文字列中の最初の登録文字と最初に相
関値を算出したフオント文字との書体及び名称が一致す
るか否かは、一般に最初の相関値を得ただけでは判断で
きない。このため検査CPUは、最初の登録文字の相関
値を得るときに限り、全種類のフオント文字を正規化し
て、登録文字とこのフオント文字との相関値を全て算出
することになる。
と、検査CPUは、ステツプSP5に戻つて上述の手順
を繰り返す。登録文字列中の最初の登録文字と最初に相
関値を算出したフオント文字との書体及び名称が一致す
るか否かは、一般に最初の相関値を得ただけでは判断で
きない。このため検査CPUは、最初の登録文字の相関
値を得るときに限り、全種類のフオント文字を正規化し
て、登録文字とこのフオント文字との相関値を全て算出
することになる。
【0023】ステツプSP6において肯定結果を得る
と、検査CPUは登録文字と全てのフオント文字との相
関値を算出したと判断してステツプSP7に移る。ステ
ツプSP7において、検査CPUは、算出した全ての相
関値の大小を判定してステツプSP8に移る。ステツプ
SP8において、検査CPUは、最大の相関値を有する
フオント文字の種類を登録文字の種類と決定して登録す
るとステツプSP9に移る。
と、検査CPUは登録文字と全てのフオント文字との相
関値を算出したと判断してステツプSP7に移る。ステ
ツプSP7において、検査CPUは、算出した全ての相
関値の大小を判定してステツプSP8に移る。ステツプ
SP8において、検査CPUは、最大の相関値を有する
フオント文字の種類を登録文字の種類と決定して登録す
るとステツプSP9に移る。
【0024】但し、図3(E)に示すように、登録文字
列の先頭に英字「C,O,S,V,W,X,Z 」のいずれかが来た場
合、検査CPUは、大文字であるか小文字であるかの決
定を一時保留する。2文字目以降の登録文字の種類が決
定されたとき、検査CPUは、先頭の登録文字が大文字
であるか小文字であるかを決定する。
列の先頭に英字「C,O,S,V,W,X,Z 」のいずれかが来た場
合、検査CPUは、大文字であるか小文字であるかの決
定を一時保留する。2文字目以降の登録文字の種類が決
定されたとき、検査CPUは、先頭の登録文字が大文字
であるか小文字であるかを決定する。
【0025】ステツプSP9において、検査CPUは、
切り出した1つのプロフアイルに対応する1つの登録文
字を登録できたか否かを判断する。ステツプSP9にお
いて肯定結果を得ると、検査CPUは、プロフイルが相
互に分離している登録文字を登録したと判断してステツ
プSP10に移る。ステツプSP10において、検査C
PUは、次の登録文字が存在するか否かを判断する。ス
テツプSP10において肯定結果を得ると、検査CPU
は、1つの登録文字列の処理が完了していないと判断
し、ステツプSP4に戻つて上述の手順を繰り返す。
切り出した1つのプロフアイルに対応する1つの登録文
字を登録できたか否かを判断する。ステツプSP9にお
いて肯定結果を得ると、検査CPUは、プロフイルが相
互に分離している登録文字を登録したと判断してステツ
プSP10に移る。ステツプSP10において、検査C
PUは、次の登録文字が存在するか否かを判断する。ス
テツプSP10において肯定結果を得ると、検査CPU
は、1つの登録文字列の処理が完了していないと判断
し、ステツプSP4に戻つて上述の手順を繰り返す。
【0026】このようにして2文字目以降のフオント文
字の種類を決定するとき、検査CPUは、一般に1つの
登録文字列が同一書体で印刷されていることを利用し
て、先に決定した書体のフオント文字のみを使用する。
検査CPUは、正規化したこのフオント文字との相関値
を算出する処理を繰り返して、登録文字を順次切り出す
ことになる。
字の種類を決定するとき、検査CPUは、一般に1つの
登録文字列が同一書体で印刷されていることを利用し
て、先に決定した書体のフオント文字のみを使用する。
検査CPUは、正規化したこのフオント文字との相関値
を算出する処理を繰り返して、登録文字を順次切り出す
ことになる。
【0027】やがて1つの登録文字列を処理して登録を
完了すると、ステツプSP10において検査CPUはス
否定結果を得て、ステツプSP11に移る。ステツプS
P11において、検査CPUは、全ての登録文字列を処
理して登録を終了したか否かを判断する。ステツプSP
11において否定結果を得ると、検査CPUは、処理し
ていない登録文字列が存在すると判断し、ステツプSP
3に戻り、上述の手順を繰り返す。やがて全ての登録文
字列を処理して登録を完了すると、ステツプSP11に
おいて、検査CPUは肯定結果を得てステツプSP12
に移り、マスター文字自動登録処理手順を終了する。
完了すると、ステツプSP10において検査CPUはス
否定結果を得て、ステツプSP11に移る。ステツプS
P11において、検査CPUは、全ての登録文字列を処
理して登録を終了したか否かを判断する。ステツプSP
11において否定結果を得ると、検査CPUは、処理し
ていない登録文字列が存在すると判断し、ステツプSP
3に戻り、上述の手順を繰り返す。やがて全ての登録文
字列を処理して登録を完了すると、ステツプSP11に
おいて、検査CPUは肯定結果を得てステツプSP12
に移り、マスター文字自動登録処理手順を終了する。
【0028】一方、ステツプSP9において否定結果を
得ると、検査CPUは、登録文字部を切り出したため登
録できなかつたと判断してステツプSP13に移る。ス
テツプSP13において、検査CPUは、登録文字部を
それぞれ別個の登録文字に切り出して登録するとステツ
プSP9に戻つて上述の手順を繰り返す。
得ると、検査CPUは、登録文字部を切り出したため登
録できなかつたと判断してステツプSP13に移る。ス
テツプSP13において、検査CPUは、登録文字部を
それぞれ別個の登録文字に切り出して登録するとステツ
プSP9に戻つて上述の手順を繰り返す。
【0029】ここでステツプSP13において図4に示
すように、検査CPUが例えば書体をゴシツク体とする
フオント文字25に決定して、登録文字部を処理する場
合を考える。図5に示すように、このゴシツク体の英数
字の大文字、小文字及び数字は、それぞれの高さの大小
に従つて、高さが高い方から順に4つの文字グループに
グループ分けされる。
すように、検査CPUが例えば書体をゴシツク体とする
フオント文字25に決定して、登録文字部を処理する場
合を考える。図5に示すように、このゴシツク体の英数
字の大文字、小文字及び数字は、それぞれの高さの大小
に従つて、高さが高い方から順に4つの文字グループに
グループ分けされる。
【0030】すなわち図5(A)に示すように、第1の
文字グループには、小文字「j 」のみが属する。図5
(B)に示すように、第2の文字グループには、大文字
26文字、数字及び小文字「b,d,f,g,h,i,k,l,p,q,y 」
が属する。図5(C)に示すように、第3の文字グルー
プには、小文字「t 」のみが属する。図5(D)に示す
ように、第4の文字グループには、小文字「a,c,e,m,n,
o,r,s,u,v,w,x,z 」が属する。
文字グループには、小文字「j 」のみが属する。図5
(B)に示すように、第2の文字グループには、大文字
26文字、数字及び小文字「b,d,f,g,h,i,k,l,p,q,y 」
が属する。図5(C)に示すように、第3の文字グルー
プには、小文字「t 」のみが属する。図5(D)に示す
ように、第4の文字グループには、小文字「a,c,e,m,n,
o,r,s,u,v,w,x,z 」が属する。
【0031】これにより検査CPUは、水平方向プロフ
アイルを作成して抽出した登録文字部全体の高さを上述
した第1〜第4の文字グループのいずれかに分類するこ
とができる。続いて、検査CPUは、それぞれの文字グ
ループの高さを登録文字部全体の高さに合わせて正規化
して、相関値を算出することになる。
アイルを作成して抽出した登録文字部全体の高さを上述
した第1〜第4の文字グループのいずれかに分類するこ
とができる。続いて、検査CPUは、それぞれの文字グ
ループの高さを登録文字部全体の高さに合わせて正規化
して、相関値を算出することになる。
【0032】すなわち例えば図6(A)に示すように、
登録文字部を有する登録文字列26(ここでは「Qualit
y 」)が入力されると、図6(B)に示すように、検査
CPUは、まず登録文字部26A(ここでは「al」)の
高さwyを第1の文字グループの高さと仮定する。上述し
たように、第1〜第4の文字グループの文字の高さの相
対的な大小関係は既知である。
登録文字部を有する登録文字列26(ここでは「Qualit
y 」)が入力されると、図6(B)に示すように、検査
CPUは、まず登録文字部26A(ここでは「al」)の
高さwyを第1の文字グループの高さと仮定する。上述し
たように、第1〜第4の文字グループの文字の高さの相
対的な大小関係は既知である。
【0033】これにより、検査CPUは、第1の文字グ
ループの文字の高さを基準として、第2〜第4の文字グ
ループのそれぞれの文字の相対的な高さを算出する。続
いて、検査CPUは、それぞれの文字の高さでそれぞれ
のフオント文字25のサイズを垂直水平同率で正規化す
る。
ループの文字の高さを基準として、第2〜第4の文字グ
ループのそれぞれの文字の相対的な高さを算出する。続
いて、検査CPUは、それぞれの文字の高さでそれぞれ
のフオント文字25のサイズを垂直水平同率で正規化す
る。
【0034】この後、検査CPUは、第1の文字グルー
プに属するフオント文字25を登録文字部26Aの左上
に位置を合わせて、登録文字部26Aの先頭の登録文字
との相関値を算出する。図6(C)及び(D)に示すよ
うに、正規化したフオント文字25の高さが高さwyに比
して小さくなつた場合、検査CPUは、このフオント文
字25の位置を高さwyの範囲で上下に変更して先頭の登
録文字との相関値を算出する。
プに属するフオント文字25を登録文字部26Aの左上
に位置を合わせて、登録文字部26Aの先頭の登録文字
との相関値を算出する。図6(C)及び(D)に示すよ
うに、正規化したフオント文字25の高さが高さwyに比
して小さくなつた場合、検査CPUは、このフオント文
字25の位置を高さwyの範囲で上下に変更して先頭の登
録文字との相関値を算出する。
【0035】これにより、検査CPUは、相関値が一番
高かつたフオント文字25の種類を登録文字部26Aの
先頭の登録文字の種類と判定して、このフオント文字2
5(ここでは「a 」)の幅で先頭の登録文字(ここでは
「a 」)を切り出すことができる。検査CPUは、先頭
の登録文字を切り出して残つた範囲で上述の手順を繰り
返して、それぞれのフオント文字25と次の登録文字
(ここでは「l 」)との相関値を算出する。
高かつたフオント文字25の種類を登録文字部26Aの
先頭の登録文字の種類と判定して、このフオント文字2
5(ここでは「a 」)の幅で先頭の登録文字(ここでは
「a 」)を切り出すことができる。検査CPUは、先頭
の登録文字を切り出して残つた範囲で上述の手順を繰り
返して、それぞれのフオント文字25と次の登録文字
(ここでは「l 」)との相関値を算出する。
【0036】第1の文字グループのフオント文字25に
よつて高い相関値を得ることができない場合、検査CP
Uは、登録文字を切り離さない。また検査CPUは、登
録文字部の高さwyを順次第2〜第4の文字グループの高
さと仮定して、高い相関値が得られる迄上述した処理を
繰り返す。
よつて高い相関値を得ることができない場合、検査CP
Uは、登録文字を切り離さない。また検査CPUは、登
録文字部の高さwyを順次第2〜第4の文字グループの高
さと仮定して、高い相関値が得られる迄上述した処理を
繰り返す。
【0037】このように、検査CPUは、第1〜第4の
文字グループ相互間の相対的な高さを維持したままそれ
ぞれのフオント文字25を正規化して登録文字部26A
に適応する。これにより、検査CPUは、高さが異なる
登録文字が接触している状態で相関値をそれぞれ算出し
て、登録文字の種類をそれぞれ判定できる。因みに、登
録文字部26Aの高さwyが第2の文字グループの高さで
あると仮定したとき、登録文字サイズとフオント文字2
5サイズは等しくなる。
文字グループ相互間の相対的な高さを維持したままそれ
ぞれのフオント文字25を正規化して登録文字部26A
に適応する。これにより、検査CPUは、高さが異なる
登録文字が接触している状態で相関値をそれぞれ算出し
て、登録文字の種類をそれぞれ判定できる。因みに、登
録文字部26Aの高さwyが第2の文字グループの高さで
あると仮定したとき、登録文字サイズとフオント文字2
5サイズは等しくなる。
【0038】一方、図6(E)に示すように、登録文字
部26B(ここでは「ty」)の高さwyが第1〜第4の文
字グループのいずれの高さにも1回の判定で一致しない
場合、検査CPUは、先頭の登録文字の種類を判定する
ことが困難となる。この場合、図6(F)に示すよう
に、検査CPUは、ある閾値以上の相関値を得た複数の
フオント文字25(ここでは「1,L,i,l,t 」)につい
て、高さwyの範囲でさらに細かくサイズを変更して先頭
の登録文字の相関値を算出する。
部26B(ここでは「ty」)の高さwyが第1〜第4の文
字グループのいずれの高さにも1回の判定で一致しない
場合、検査CPUは、先頭の登録文字の種類を判定する
ことが困難となる。この場合、図6(F)に示すよう
に、検査CPUは、ある閾値以上の相関値を得た複数の
フオント文字25(ここでは「1,L,i,l,t 」)につい
て、高さwyの範囲でさらに細かくサイズを変更して先頭
の登録文字の相関値を算出する。
【0039】これにより、検査CPUは、この中で最も
相関値が高いフオント文字25(ここでは「t 」)の幅
で切り出すことができる。この後、図6(G)に示すよ
うに、検査CPUは、残つた範囲で水平方向のプロフア
イルを作成して次の登録文字(ここでは「y 」)の高さ
wy2 を抽出する。続いて、検査CPUは、上述と同様の
手順で次の登録文字と照合するフオント文字25を正規
化して相関値を算出する。
相関値が高いフオント文字25(ここでは「t 」)の幅
で切り出すことができる。この後、図6(G)に示すよ
うに、検査CPUは、残つた範囲で水平方向のプロフア
イルを作成して次の登録文字(ここでは「y 」)の高さ
wy2 を抽出する。続いて、検査CPUは、上述と同様の
手順で次の登録文字と照合するフオント文字25を正規
化して相関値を算出する。
【0040】以上の構成によれば、登録文字列26の画
像を垂直方向プロフアイルが途切れた位置で区切つた画
像26Aの高さWYを基準として、フオント文字25のサ
イズを正規化し、相関値を最大とさせる正規化フオント
文字の幅で区切つた画像26Aから切り出した画像に対
応する登録文字の形状を、切り出した正規化フオント文
字の形状と同一と識別することにより、登録文字列26
の画像を取り込んで、互いに接触した登録文字をもそれ
ぞれ一段と容易に識別することができる。
像を垂直方向プロフアイルが途切れた位置で区切つた画
像26Aの高さWYを基準として、フオント文字25のサ
イズを正規化し、相関値を最大とさせる正規化フオント
文字の幅で区切つた画像26Aから切り出した画像に対
応する登録文字の形状を、切り出した正規化フオント文
字の形状と同一と識別することにより、登録文字列26
の画像を取り込んで、互いに接触した登録文字をもそれ
ぞれ一段と容易に識別することができる。
【0041】またユーザの作業はマスター文字として登
録を所望する領域を指定するだけになることにより、従
来に比して煩雑な作業を格段的に減少させることができ
る。さらに登録文字の切り出しと識別が同時に行われる
ことにより、マスター文字として文字検査装置12に登
録する作業の効率を一段と高くすることができる。
録を所望する領域を指定するだけになることにより、従
来に比して煩雑な作業を格段的に減少させることができ
る。さらに登録文字の切り出しと識別が同時に行われる
ことにより、マスター文字として文字検査装置12に登
録する作業の効率を一段と高くすることができる。
【0042】なお上述の実施例においては、矩形の枠内
に納まる登録文字をマスター文字として登録する場合に
ついて述べたが、本発明はこれに限らず、斜体文字をマ
スター文字として登録する場合にも適用し得る。この場
合、垂直方向にプロフアイルを作成することに代えて、
斜体の傾斜方向のプロフアイルを作成することによつ
て、登録文字列からそれぞれの登録文字の画像を切り出
す。
に納まる登録文字をマスター文字として登録する場合に
ついて述べたが、本発明はこれに限らず、斜体文字をマ
スター文字として登録する場合にも適用し得る。この場
合、垂直方向にプロフアイルを作成することに代えて、
斜体の傾斜方向のプロフアイルを作成することによつ
て、登録文字列からそれぞれの登録文字の画像を切り出
す。
【0043】また上述の実施例においては、英数字及び
記号を印刷した印刷文字を識別する場合について述べた
が、本発明はこれに限らず、英数字及び記号に加えて、
ドイツ語、スペイン語等、他の欧文文字やこれに類似す
る言語の文字を印刷した印刷文字を識別する場合にも適
用できる。
記号を印刷した印刷文字を識別する場合について述べた
が、本発明はこれに限らず、英数字及び記号に加えて、
ドイツ語、スペイン語等、他の欧文文字やこれに類似す
る言語の文字を印刷した印刷文字を識別する場合にも適
用できる。
【0044】さらに上述の実施例においては、ビデオテ
ープカセツト上の印刷文字の形状を取り込んでマスター
文字の形状として登録する場合について述べたが、本発
明はこれに限らず、任意の基体上に表示した文字の形状
を取り込んでマスター文字の形状として登録する場合に
も広く適用できる。
ープカセツト上の印刷文字の形状を取り込んでマスター
文字の形状として登録する場合について述べたが、本発
明はこれに限らず、任意の基体上に表示した文字の形状
を取り込んでマスター文字の形状として登録する場合に
も広く適用できる。
【0045】
【発明の効果】上述のように本発明によれば、文字列の
画像を所定方向の濃度分布の濃度が零となる位置で区切
つた画像の高さを基準として、基準文字の寸法を正規化
し、相関値を最大とさせる正規化基準文字の幅で区切つ
た画像から切り出した切出し画像に対応する文字の形状
を、切り出した正規化基準文字の形状と同一と識別する
ことにより、登録文字列の画像を取り込んで、互いに接
触した文字をもそれぞれ一段と容易に識別し得る文字識
別方法及び検査基準文字登録方法を実現できる。
画像を所定方向の濃度分布の濃度が零となる位置で区切
つた画像の高さを基準として、基準文字の寸法を正規化
し、相関値を最大とさせる正規化基準文字の幅で区切つ
た画像から切り出した切出し画像に対応する文字の形状
を、切り出した正規化基準文字の形状と同一と識別する
ことにより、登録文字列の画像を取り込んで、互いに接
触した文字をもそれぞれ一段と容易に識別し得る文字識
別方法及び検査基準文字登録方法を実現できる。
【図1】本発明による文字識別方法及び検査基準文字登
録方法の一実施例による文字検査システムを示す接続図
である。
録方法の一実施例による文字検査システムを示す接続図
である。
【図2】マスター文字自動登録処理手順を示すフローチ
ヤートである。
ヤートである。
【図3】接触しない登録文字の切出しによるマスター文
字の自動登録例を示す略線図である。
字の自動登録例を示す略線図である。
【図4】相関値を算出するとき参照する英数字のフオン
ト文字を示す文字形状図である。
ト文字を示す文字形状図である。
【図5】図4の英数字の大文字、小文字及び数字を高さ
に応じてグループ分けしたときの相互の大小関係を示す
略線図である。
に応じてグループ分けしたときの相互の大小関係を示す
略線図である。
【図6】接触する登録文字の切出し処理例を示す略線図
である。
である。
【図7】接触する識別対象文字の画像及びそのプロフア
イルを示す略線図である。
イルを示す略線図である。
1、4、7……識別対象文字の画像、2、3、5、6、
8、9……プロフアイル、10……文字検査システム、
11……ビデオテープカセツト、12……文字検査装
置、12A……画像処理ボード、12B……検査処理ボ
ード、12C……ハードデイスク、13……CCDカメ
ラ、14……トラツクボール、15……入力用コンピユ
ータ、16……キーボード、17、18……モニタ、2
0……領域、21、22……水平方向プロフアイル、2
3、24……垂直方向プロフアイル、25……フオント
文字、26……登録文字列、26A、26B……登録文
字部。
8、9……プロフアイル、10……文字検査システム、
11……ビデオテープカセツト、12……文字検査装
置、12A……画像処理ボード、12B……検査処理ボ
ード、12C……ハードデイスク、13……CCDカメ
ラ、14……トラツクボール、15……入力用コンピユ
ータ、16……キーボード、17、18……モニタ、2
0……領域、21、22……水平方向プロフアイル、2
3、24……垂直方向プロフアイル、25……フオント
文字、26……登録文字列、26A、26B……登録文
字部。
Claims (8)
- 【請求項1】複数の文字が配列された文字列の画像を取
り込み、 上記画像を所定方向の濃度分布の濃度が零となる位置で
区切り、 上記区切つた画像の高さを基準として、複数の基準文字
の寸法をそれぞれ正規化して、複数の正規化基準文字を
作成し、 上記区切られた画像から上記正規化基準文字の幅で切り
出した切出し画像の形状と、当該正規化基準文字の形状
との相関値を算出し、 上記相関値に基づいて、上記切出し画像に対応する上記
文字の形状を識別することを特徴とする文字識別方法。 - 【請求項2】上記文字列は、基体面上に表示されている
ことを特徴とする請求項1に記載の文字識別方法。 - 【請求項3】上記基体は、記録媒体を収容する容器手段
であることを特徴とする請求項1又は請求項2に記載の
文字識別方法。 - 【請求項4】上記文字は、欧文文字であることを特徴と
する請求項1に記載の文字識別方法。 - 【請求項5】複数の検査対象文字が配列された検査対象
文字列の画像を取り込み、当該検査対象文字の形状を検
査基準文字の形状に基づいて検査する文字検査装置に、
当該検査基準文字の形状を識別して登録する際の検査基
準文字登録方法において、 複数の上記検査対象文字とそれぞれほぼ同一形状でなる
複数の登録対象文字が配列された登録対象文字列の画像
を取り込み、 上記登録対象文字列の画像を所定方向の濃度分布の濃度
が零となる位置で区切り、 上記区切つた画像の高さを基準として、複数の識別基準
文字の寸法をそれぞれ正規化して、複数の正規化識別基
準文字を作成し、 上記区切られた画像から上記正規化識別基準文字の幅で
切り出した切出し画像の形状と、当該正規化識別基準文
字の形状との相関値を算出し、 上記相関値に基づいて、上記切出し画像に対応する上記
登録対象文字の形状を識別して登録する。ことを特徴と
する検査基準文字登録方法。 - 【請求項6】上記文字列は、基体面上に表示されている
ことを特徴とする請求項5に記載の検査基準文字登録方
法。 - 【請求項7】上記基体は、記録媒体を収容する容器手段
であることを特徴とする請求項5又は請求項6に記載の
検査基準文字登録方法。 - 【請求項8】上記文字は、欧文文字であることを特徴と
する請求項5に記載の検査基準文字登録方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6290538A JPH08129611A (ja) | 1994-10-31 | 1994-10-31 | 文字識別方法及び検査基準文字登録方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6290538A JPH08129611A (ja) | 1994-10-31 | 1994-10-31 | 文字識別方法及び検査基準文字登録方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08129611A true JPH08129611A (ja) | 1996-05-21 |
Family
ID=17757328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6290538A Pending JPH08129611A (ja) | 1994-10-31 | 1994-10-31 | 文字識別方法及び検査基準文字登録方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08129611A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100383858B1 (ko) * | 1999-07-30 | 2003-05-14 | 가부시끼가이샤 도시바 | 문자인식장치의 문자추출방법 및 장치 |
-
1994
- 1994-10-31 JP JP6290538A patent/JPH08129611A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100383858B1 (ko) * | 1999-07-30 | 2003-05-14 | 가부시끼가이샤 도시바 | 문자인식장치의 문자추출방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Aradhye | A generic method for determining up/down orientation of text in roman and non-roman scripts | |
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
JP3576570B2 (ja) | 比較方法 | |
US6038351A (en) | Apparatus and method for multi-entity, mixed document environment document identification and processing | |
US20080069476A1 (en) | System and method of determining image skew using connected components | |
JPH0420226B2 (ja) | ||
JPH06348896A (ja) | 文字の切り出し方法及びその装置 | |
Le et al. | Automated borders detection and adaptive segmentation for binary document images | |
JP2926066B2 (ja) | 表認識装置 | |
JPS5991582A (ja) | 文字読取装置 | |
JPH08129611A (ja) | 文字識別方法及び検査基準文字登録方法 | |
Srinivas et al. | An overview of OCR research in Indian scripts | |
JP3798179B2 (ja) | パターン抽出装置及び文字切り出し装置 | |
JPH0410087A (ja) | 基本ライン抽出方法 | |
JP3466894B2 (ja) | 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
JP3090070B2 (ja) | 帳票識別方法及び装置 | |
JPH02116987A (ja) | 文字認識装置 | |
JPH09305701A (ja) | 帳票認識方法 | |
JP3412441B2 (ja) | 画像処理装置 | |
JP2995818B2 (ja) | 文字切り出し方法 | |
JP3220226B2 (ja) | 文字列方向判別方法 | |
JP2993252B2 (ja) | 同形異文字判別方法および装置 | |
Abdullah et al. | License plate detection and segmentation using cluster run length smoothing algorithm | |
JPS6227887A (ja) | 文字種分離方式 |