JP3039954B2 - 文字認識方法及びその装置 - Google Patents

文字認識方法及びその装置

Info

Publication number
JP3039954B2
JP3039954B2 JP02110045A JP11004590A JP3039954B2 JP 3039954 B2 JP3039954 B2 JP 3039954B2 JP 02110045 A JP02110045 A JP 02110045A JP 11004590 A JP11004590 A JP 11004590A JP 3039954 B2 JP3039954 B2 JP 3039954B2
Authority
JP
Japan
Prior art keywords
character
recognition
image
value
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02110045A
Other languages
English (en)
Other versions
JPH0373084A (ja
Inventor
英明 鈴木
吉衛 松崎
光庸 磯部
一雄 加藤
充夫 大野
茂 藤森
謙三 武市
良一 久富
光造 根本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPH0373084A publication Critical patent/JPH0373084A/ja
Application granted granted Critical
Publication of JP3039954B2 publication Critical patent/JP3039954B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像処理を用いた捺印や印刷や刻印文字な
どの文字認識方法及びその装置に係り、特に文字と背景
のコントラストが悪く印字品質に変動を生じる文字の認
識に好適な文字の認識方法及びその装置に関する。
〔従来の技術〕
従来の文字認識装置は、例えば特開昭61−255488号公
報に記載のように文字パターンを複数個に分割し、その
分割単位ごとに類似度を比較照合して認識判定を行うと
いったパターンマッチング法の応用によるものである。
この方法は2値画像を用いた認識アルゴリズムであり、
文字線に切れやかすれといった変化を生じる場合には、
この変動をアルゴリズムによって吸収するために処理が
複雑になり認識時間も増大する。例えば文字の印字品質
が変化する場合には2値化閾値も固定閾値では対応でき
なくなる。またこれらの認識アルゴリズムは抽出した特
徴を判定木にしたがって分類することで行われるが、最
適な判定を得るためのこの特徴の組合せ方は実験により
試行錯誤的に行われていた。
〔発明が解決しようとする課題〕
上記従来技術はパターンマッチング法の応用によるも
のであり、2値画像を用いた認識アルゴリズムのため、
印字品質のよい紙などの文字認識には良好な結果が得ら
れるが、認識したい文字のコントラストが悪く2値化を
すると切れやかすれを生じる場合には判別が難しく、そ
の認識アルゴリズムは複雑となって認識時間が増大する
と共に誤認識率が高くなるという問題があった。
本発明の目的は工業部品に印字された文字などのよう
にコントラストが悪く印字濃度に変化を生じるものに対
して、安定して高い精度で認識することができ、また字
体の変動に対しても自動的に適応できるような文字認識
方法を提供することにある。
〔課題を解決するための手段〕
本発明は、上記の目的を達成するために、文字画像に
設定された複数のウィンドウ領域内の画像に対して処理
を行い、その結果を出力する入力ユニット群と、入力ユ
ニット群からの出力値に閾値を加えた値に対して演算を
行う中間ユニット群と、中間ユニット群の各ユニットか
らの出力に結合係数をかけ、その総和に閾値を加えた値
に対して演算を行う、文字の種類に対した出力ユニット
群より構成される文字判別部により文字の認識を行う文
字認識装置において、認識を行う文字ごとに各ウィンド
ウ領域の中に文字線が有か無かそのどちらともいえない
かの3種類の指定を行うことにより結合係数の初期設定
を行う初期設定手段と、文字の認識を行った結果から閾
値と結合係数のいずれか一方または両方を調整する調整
手段と、可能となるように構成した。
また、本発明は、文字画像に設定された複数のウィン
ドウ領域内の画像に対して処理を行い、その結果を出力
する入力ユニット群と、入力ユニット群からの出力値に
閾値を加えた値に対して演算を行う中間ユニット群と、
中間ユニット群の各ユニットからの出力に結合係数をか
け、その総和に閾値を加えた値に対して演算を行う、文
字の種類に対応した出力ユニット群より構成される文字
判別部により文字の認識を行う文字認識装置において、
認識動作モードとして文字認識装置以外の装置からの認
識開始の指令で文字を認識して認識結果を他の装置に送
信する自動認識モードと、文字認識装置以外の装置から
の認識開始の指令で文字を認識して文字の判別結果を表
す出力ユニットの各出力値のうち最大の値があらかじめ
設定された半自動判別閾値以下の場合にはユーザに認識
結果の確認を求め誤っている時には対話型で認識結果を
修正した後に認識結果を他の修正装置に送信する半自動
認識モードと、認識開始の指令をキーボードより入力し
て文字を認識し認識結果をモニタ画面に表示する手動認
識モードとの3つのモードを有する構成とした。
また、本発明は、文字画像に設定された複数のウィン
ドウ領域内の画像に対して処理を行い、その結果を出力
する入力ユニット群と、入力ユニット群からの出力値に
閾値を加えた値に対して演算を行う中間ユニット手段
と、中間ユニット群の各ユニットからの出力に結合係数
をかけ、その総和に閾値を加えた値に対して演算を行
う、文字の種類に対応した出力ユニット群より構成され
る文字判別部により文字の認識を行う文字認識装置にお
いて、中間ユニット群の各中間ユニットに対して中間ユ
ニットの出力の取り得る最大値からその中間ユニットの
出力値を減算した値を出力する反転中間ユニットを設け
た構成とした。
また、本発明は、文字画像に設定された複数のウィン
ドウ領域内の画像に対して処理を行い、その結果を出力
する入力ユニット群と、入力ユニット群からの出力値に
閾値を加えた値に対して演算を行う中間ユニット群と、
中間ユニット群の各ユニットからの出力に結合係数をか
け、その総和に閾値を加えた値に対して演算を行う、文
字の種類に対応した出力ユニット群より構成される文字
判別部により文字の認識を行う文字認識装置において、
1つの入力ユニットの出力値と、あるいは複数の入力ユ
ニットの出力値の平均値のいずれかを求め、これら2つ
の値を組み合わせて演算し、この演算結果を中間ユニッ
トの入力値とするように構成した。
また、本発明は、文字認識装置を、認識対象文字の画
像を取り込む画像取り込み手段と、この画像取り込み手
段で取り込んだ画像を記憶する記憶手段と、この記憶手
段に記憶した認識対象文字を画面上に表示する表示手段
と、この表示手段上の画面上で複数のウィンドウを設定
するウィンドウ設定手段と、このウィンドウ設定手段で
設定した複数のウィンドウ毎に認識対象文字の明るさ情
報とエッジに関する情報とを抽出する情報抽出手段と、
この情報抽出手段で抽出した明るさ情報とエッジに関す
る情報とを重みを付けて組合わせる演算手段と、この演
算手段で重みを付けて組み合わせた明るさ情報とエッジ
に関する情報とを用いて認識対象文字を認識する文字判
別手段とを備えて構成した。
また、本発明は、文字認識装置を、認識対象文字の画
像を取り込む画像取り込み手段と、この画像取り込み手
段で取り込んだ画像を記憶する記憶手段と、この記憶手
段に記憶した認識対象文字の背景の明るさ情報と認識対
象文字の明るさ情報とエッジに関する情報とを抽出する
情報抽出手段と、この該情報抽出手段で抽出した認識対
象文字の明るさ情報とエッジに関する情報とを認識対象
文字の背景の明るさ情報に基づいて補正する補正手段
と、この補正手段で補正した認識対象文字の明るさ情報
とエッジに関する情報とを用いて認識対象文字を認識す
る文字判別手段とを備えて構成した。
更に、本発明は、文字認識方法を、認識対象文字の画
像を取り込んで記憶し、この記憶した認識対象文字を画
面上に表示して複数のウィンドウを設定し、この複数の
ウィンドウ毎に認識対象文字の明るさ情報とエッジに関
する情報とを抽出し、この抽出した明るさ情報とエッジ
に関する情報とを重みを付けて組合わせ、この重みを付
けて組み合わせた明るさ情報とエッジに関する情報とを
用いて認識対象文字を認識するようにした。
更に、本発明は、認識対象文字の画像を取り込んで記
憶し、この記憶した認識対象文字の背景の明るさ情報と
認識対象文字の明るさ情報とエッジに関する情報とを抽
出し、この抽出した認識対象文字の明るさ情報とエッジ
に関する情報とを背景の明るさ情報に基づいて補正し、
この補正した認識対象文字の明るさ情報とエッジに関す
る情報とを用いて認識対象文字を認識するようにした。
〔作用〕
上記文字認識装置は文字の特徴抽出を精度よく行い特
徴間の組合せを最適化するために多数の特徴の重みの付
け方を実際のサンプル文字から自動的に調整できる機構
を実現しており、文字の特徴としては文字領域に適切に
設けた複数個の各ウィンドウにおいて文字線の明るさ情
報のみでなく原画像の微分画像より検出したエッジ情報
の2種類を用いることにより、コントラストの悪い印字
文字に対しても高い信頼性をもって安定した特徴抽出を
可能とし、特徴の組合せ方を決定する方法としては実際
のサンプル画像を利用して自動調整することにより、安
定した認識を行うことが可能となる。
〔実施例〕
以下に本発明の実施例を第1図から第24図により説明
する。
第1図は本発明による文字認識装置の一実施例を示す
文字判別部の一構成図である。第1図において、認識対
象の文字画像はTVカメラ23(第2図)により文字判別部
1の画像メモリ2に取り込まれる。入力ユニット群3に
は各々の入力ユニット31,32,33,…ごとにウィンドウ位
置データを格納するウィンドウ位置データ格納部311,32
1,331,…と、画像処理部312,322,323,…とがあり、画像
メモリ2上における各々のウィンドウ領域201,202,203,
…に対して画像処理を行い処理結果を出力し、この処理
結果の値は中間ユニット群4に送られる。中間ユニット
群4の各々の中間ユニット41,42,43,…には閾値を格納
する閾値格納部411,421,431,…と,中間ユニット演算部
412,422,432,…とがあり、各入力ユニットからの出力値
に閾値を加えた値に対して演算を行ない演算結果を出力
する。この中間ユニット群4の各ユニットの出力値は結
合係数格納部5に格納されている結合係数がかけられ、
その値が出力ユニット群6に送られる。出力ユニット群
6には文字の種類に対応した出力ユニット61,62,63,…
があり、各々の出力ユニットには閾値を格納する出力閾
値格納部611,621,631,…と、出力ユニット演算部612,62
2,632,…とがあり、各中間ユニットからの出力値に結合
係数をかけた値の総和に閾値を加えた値に対して演算を
行い、演算結果を出力する。
第2図は第1図の文字認識装置のハードウェア構成図
である。第2図において、文字認識装置10はTVカメラ23
からの信号を入力して画像メモリ2へ格納すると共にモ
ニタテレビ12への出力を行う画像入出力回路13と、ワー
クステーションなどの文字認識装置以外の装置との外部
信号の入出力を行うための汎用入出力回路14と、プログ
ラムやデータを格納しておくプログラムデータメモリ15
と、画像処理を行う画像処理プロセッサ16と、各種デー
タの保存に用いるICカード17と接続するためのICカード
インタフェース18と、ティーチングなどの手動操作のた
めのティーチングボックス19と、上記の動作全体を制御
するCPU20とから構成される。ここで文字判別部1(第
1図)は画像メモリ2と、プログラムデータメモリ15
と、画像処理プロセッサ16と、CPU20とで実現される。
すなわち入力ユニットのウィンドウ位置データ格納部31
1,321,331と、中間ユニットの閾値格納部411,421,431
と、結合係数格納部5と、出力ユニットの出力閾値格納
部311,621,631とはプログラムデータメモリ15の中にあ
る。画像処理部312,322,332は画像処理プロセッサ16お
よびCPU20で実現され,中間ユニット演算部412,422,432
と出力ユニット演算部612,622,632とはCPU20で実現され
る。
つぎに文字判別部1が文字を判別する手順を説明す
る。第1図は文字“2"が画像メモリ2に入力されてお
り、各入力ユニットのウィンドウ位置データ格納部311,
321などにはウィンドウ位置が格納されており、また画
像処理の種類も指定されている場合を示している。した
がって入力ユニット31はウィンドウ領域301内の画像に
対して画像処理の種類として右方向からの微分が指定さ
れていればその微分処理を行い結果を出力する。同様に
入力ユニット32はウィンドウ領域202内の画像に対して
画像処理の種類として右方からの微分が指定されていれ
ばその微分処理を行い結果を出力する。この画像処理の
種類としては右方からの微分と、左方からの微分と、上
方からの微分と、下方からの微分と、濃度合計などがあ
る。この処理の方法は例えば左方からの微分の場合には
第3図のようになる。
第3図(a),(b),(c)は第1図の入力ユニッ
トの画像処理部312などの左方からの微分処理の例を示
す説明図である。第3図(a)は縦方向の文字線上にき
られたウィンドウの例であり、この図において斜線部分
は文字線を表す。第3図(b)は今このウィンドウ内で
x方向に左方から微分した時のx方向の★印のついたラ
インについての微分値を表したものである。第3図
(c)はこの微分値“1",“2",“3",“4"の総和を求め
たものであり、入力ユニットの出力値である。この第3
図(c)にあるようにウィンドウ内においてこのように
微分値を微分方向に加え合わせた値をラインごとに求
め、その平均値をそのウィンドウの出力とする。また画
像処理の種類が濃度合計のウィンドウについては、ウィ
ンドウ内の全画素の濃度を合成しそれを画素数で割って
平均を求めこの平均値をウィンドウの出力とする。また
ウィンドウ領域での画像処理において、画像処理結果の
値をウィンドウの大きさで正規化することによりウィン
ドウの大きさに依存しない入力ユニットの出力値を得る
ことができる。
この入力ユニット31,32,33の出力値は各々1つの中間
ユニット41,42,43に格納されており、その中間ユニット
はこの入力ユニットの出力値に閾値格納部411,421,431
に格納されている閾値を加えた値zに対し、次式のシグ
モイド関数で与えられる出力yを中間ユニット演算部41
2,422,432で求める。但しTは定数である。
この各中間ユニット41,42,43の出力値に対しては各出
力ユニット61,62,63ごとに結合係数格納部5に結合係数
が格納されており、各出力ユニットは次の式(2)の中
間ユニット出力値y1,jに結合係数w1,k,jをかけた値を合
計し、この値z2,kに出力閾値格納部611,621,631に格納
されている出力閾値を加えた値xに対して次の式(3)
の出力具も井戸関数で与えられる出力okを出力ユニット
演算部612,622,623で求める。但しT0は定数である。
各出力ユニットは文字の種類に対応して存在し、最大
の出力値をとった出力ユニットに対応する文字を判別結
果とする。
次に、文字の認識結果を用いて中間ユニット41,42,43
と出力ユニット61,62,63の閾値および結合係数格納部5
の結合係数を調整する手段を説明する。第4図は、第1
図の中間ユニットと出力ユニットの閾値および結合係数
の調整する手順を示す説明図である。第4図における反
転中間ユニットの出力値は式(6)により計算される。
第4図に示すように閾値及び結合係数の調整は、各出力
ユニットにそれぞれ教師信号を与えることにより、「中
間ユニット群4の中間ユニットと出力ユニット群6の出
力ユニットとの間の結合係数w1,k,jを修正し、次に入力
ユニット群3の入力ユニットと中間ユニット群4の中間
ユニットとの間の閾値w0,jを修正する。教師信号は各出
力ユニットの出力の最大値であり、正解の文字に対応す
る出力ユニットには1を与え、他の出力ユニットには0
を与える。第4図は、数字2について閾値および結合係
数を調整する場合の例を示している。正解は数字2であ
るので教師信号は数字2に対応する出力ユニットには1
を与え、他の出力ユニットには0を与える。この修正
は、各出力ユニットと対応する教師信号との差を求め、
調整信号Δw0,jおよびΔw1,k,jを生成する次式に示すよ
うなバックプロパゲーション法として知られる方法など
で行なうことができる。但しBk,Ckは定数である。
Δw1,k,j=Bk・(tk−ok)・f′(z2,k)・y1,j
(4) Δw0,j=Ck・W1,j,k(tk−ok)・f′(z2,k)・f′(z1,j) (5) 上記の中間ユニットと出力ユニットの閾値および結合
係数の調整において、調整に必要な試行回数は結合係数
の初期値が調整結果に近いか否かに依存する。本文字認
識装置10はこの結合係数の初期値をユーザが判断して設
定することができる。第5図は第4図の結合係数の初期
値をユーザが判断して設定する画面を示す説明図であ
る。これは文字の種類と入力ユニットの種類を縦横にも
つ表面画である。この表面画において、ユーザは文字ご
とに各入力ユニットのウィンドウ領域に文字線が有る場
合には○を設定し、無い場合には×を設定する。文字線
の有無がはっきりしない場合には○も×も設定しない。
ユーザがこのような設定を行なうと、文字認識装置10は
結合係数の初期値として、○と指定された文字に対応す
る出力ユニットと入力ユニットに接続された中間ユニッ
トの結合係数を“+1"に、×と指定されたものを“−1"
に、○も×も設定されなかったものを“0"にそれぞれ初
期設定する。このようにすると、ランダムに結合係数を
決めた場合より、調整の試行回数を減らすことができ
る。
次に入力ユニット31,32,33のウィンドウ領域201,202,
203の位置および大きさを設定する方法を説明する。ウ
ィンドウ領域の位置は文字領域を過程しその外枠の原点
を基準として表す。このため先ず文字の外枠を指定し、
つぎにウィンドウ領域を指定する。文字の外枠および各
ウィンドウ領域には番号が付けられ、この番号を指定し
て設定を開始する。第6図は第1図の入力ユニットのウ
ィンドウ領域の位置および大きさを設定する画面を示す
説明図である。まだ第7図は第6図の操作に用いるキー
ボード11の例を示す上面図である。ここで文字の外枠の
番号は“0"と決められており、各ウィンドウ領域の番号
は1,…9,A,…Zまで付けられる。この画面では常に生画
像が表示されるので登録しようとする文字を見ながらウ
ィンドウ領域を設定することができる。ウィンドウ領域
の番号指定は番号列が画面の下に並んでいるので、キー
ボード11の左右カーソルキーで指定しようとする番号の
所にカーソルを移動し、SETキーを押すことで行う。始
めに文字の外枠を設定する。ここで文字外枠の移動は文
字外枠すなわち“0"番を選択した状態でカーソルキーに
より上下左右に移動できるので、適切な位置に合わせて
文字外枠の位置を設定する。ウィンドウ領域の設定はこ
の状態でウィンドウ領域の番号をカーソルにより選択す
ることで行う。また文字外枠のサイズを設定および変更
する場合には、文字外枠を選択した状態で十字カーソル
が表示されるので、まず文字外枠の左上の点を設定し、
つぎに右下の点を決める。ここで文字外枠の右下の点を
動かしている時には、カーソルのΧ,Y位置を文字外枠の
左上を原点とする座標で表した値が表示されるので精密
な位置設定が可能である。つぎに各ウィンドウ領域の設
定はウィンドウ領域の番号を指定して始める。このウィ
ンドウ領域の場所の設定は画面にカーソルが表示される
ので、カーソルキーでカーソルを動かしながら位置を指
定する。このときカーソルのΧ,Y位置を文字外枠の左上
を原点とする座標で表した値が表示されるので精密な位
置設定が可能である。ウィンドウ領域は平行4辺形で表
せるので、位置の指定は左上と、左下と、右下の順に3
点を指定する。この平行4辺形の1組の辺は必ず水平も
しくは垂直でなければならない。この条件に合わないと
エラーとなって再びウィンドウ領域を指定する状態にな
る。
上記のウィンドウ領域の位置および大きさを設定した
ら、つぎにウィンドウ領域201,202,203において入力ユ
ニットの画像処理部312,322,332が行う画像処理の種類
を設定する。第8図は第1図の画像処理部の画像処理の
種類を設定する画面を示す説明図である。この設定は第
8図に示すようなメニュー画面において画像処理の種類
を選択することにより行う。この例では縦方向の文字線
の左方からの微分と、右方からの微分と、横方向の文字
線の上方からの微分と、下方からの微分と、全体の濃度
合計の5種類が選択できる。この選択結果は入力ユニッ
ト31,32,33の画像処理部312,322,332に格納され、文字
認識のさい選択された画像処理が行われる。ここでの微
分処理は画像の明るさが均一でない場合やコントラスト
が悪い場合に有効である。
つぎに画像の明るさ補正を第9図(a),(b)によ
り説明する。第9図(a),(b)は第1図の画像の明
るさ補正の方法を示す説明図である。一般に同じサンプ
ルに対して照明の明るさが異なると、画像の濃度および
画像の微分値は変化する。文字認識装置10はこの照明変
動の影響を除くため、入力ユニット31,32,33において第
9図(a)に示す関係式により明るさ補正を行う。この
処理はさきに第4図の中間ユニットと出力ユニットの閾
値および結合係数を調整する時に用いた文字の画像に対
して背景の濃度値と文字線の濃度値を保存しておき、こ
の値を用いて認識時の画像の濃度値および画像の微分値
を補正する。第9図(b)は第9図(a)による明るさ
補正方法の有効な理由となる実験結果を示す関係図であ
る。これは照明の明るさを変化させた同一の文字につい
て、背景の濃度値(明るさ)と、背景と文字線の濃度値
(コントラスト)との関係を調べたものである。この結
果は両者がほぼ比例関係にあるので、認識時の画像の濃
度および画像の微分値を第9図(a)の関係式により補
正すれば、調整時の照明条件における画像の濃度および
画像の微分値を推定した補正ができる。
つぎに複数文字よりなる文字列の認識をする場合に認
識率を向上させる方法を第10図により説明する。第10図
は本発明による文字認識装置の一実施例を示す文字判別
部の他の部分構成図である。第10図において、この文字
認識装置10の文字判定部1は第1図に示した基本要素に
加え、文字候補格納部7と、文字認識管理部8と、パラ
メタ格納部9とを備える。またパラメタ格納部9の中に
は絶対判別閾値格納部91と、相対判別閾値格納部92と、
チェックカラム数格納部93とを備える。この文字候補格
納部7と、パラメタ格納部9は第2図のプログラムデー
タメモリ15の中にある。文字認識管理部8はCPU20で実
現される。いま複数文字列よりなる文字列の認識をする
場合に、製品番号などでは各カラムごとに取り得る文字
が限定できることがある。例えば最初の文字(第1カラ
ムの文字)が年を示すとすれば、年が変らない限り同一
の文字になるし、数年間の範囲を考えても取り得る文字
の種類は数種類である。この場合にカラムごとに取り得
る文字候補を指定すると、上記構成の文字認識装置10の
文字判定部1の文字候補格納部7に格納しておく。文字
認識管理部8はこのカラムごとに文字候補格納部7に格
納されている文字候補を調べ、そこに指定されている文
字候補に対応する出力ユニット61,62,63についてだけ演
算を行う。そして演算した出力ユニットの中で最大の値
をとった出力ユニットに対応する文字であろうとする。
このようにすると例えば“I"と“1"のように類似した文
字がある場合でも、そのカラムは数字しか取り得ないこ
とが指定されていれば間違わずに“1"と判別できる。な
お文字候補が指定されていないカラムは、英数字全てを
文字候補とするといった約束を決めておけば、文字候補
の指定が繁雑だと思うユーザはこの指定を省略すること
ができる。
つぎに複数文字よりなる文字列の認識をする場合の認
識率を向上させるための結合係数の持ち方について説明
する。複数文字列よりなる例えば製品番号などでは各カ
ラムごとに取り得る文字が限定できることがある。この
ため第10図で説明したのは、カラムごとにそのカラムの
とりうる文字の候補を第10図の文字候補格納部7に格納
しておき、格納されている文字候補についてのみ認定判
定の処理計算を実行する方式である。このための結合係
数の方式として2つの方式が考えられる。1つは文字候
補に応じたカラムごとに異なる閾値と結合係数であり、
他の1つはすべてのカラム共通の閾値と結合係数であ
る。まずはじめに文字候補に応じたカラムごとに異なる
閾値と結合係数を用いる方式に関して、その調整方法と
その効果について説明する。各カラムに対する使用する
文字の種類は第10図の文字候補格納部7に格納されてい
る。この時各カラムの使用文字の種類が少なければその
カラムの認識率は向上する。カラムには使用文字種類が
例えば年を表すカラムのように2〜3種類で十分である
カラムもあり、また全文字を対象とするカラムもある。
そこで閾値と結合係数の調整のさいに調整を行うカラム
番号を指定し、このカラムの使用文字候補を文字候補格
納部7から参照して格納されている文字候補に関しての
み調整を行うようにすれば、使用文字候補が異なるカラ
ムに対して最適な閾値および結合係数を得ることができ
る。この結果認識率は向上し、誤認識率は下がり認識精
度を大幅に向上させることができる。また、例えば文字
候補格納部7に格納されている使用文字候補が1〜2種
類というように少ない場合には、その文字に対する確信
度の値を調べることで文字の印字品質を検査することが
できる。つぎにすべてのカラム対して共通の閾値と結合
係数を用いる方式に関して、その調整方法とその効果に
ついて説明する。上記のカラムごとに最適化を図った閾
値および結合係数を用いた場合には認識精度は大幅に向
上するが、使用文字候補の異なるカラムごとに閾値と結
合係数を調整しないでもよい場合がある。この場合には
すべてのカラムに対して共通の閾値および結合係数を用
いて文字判定部1が全文字の確信度を計算し、その結果
から文字候補格納部7に格納されている使用文字候補の
み認識判定の対象にする。すなわち文字候補格納部7に
格納されている使用文字候補に対応する出力ユニットの
確信度の値のみ参照して1文字の判定を行う。この方式
では閾値および結合係数の記憶量を減らすことができ、
また調整実行が高速に行えるという効果がある。
つぎに文字認識ができたか否かを返す方法を説明す
る。本文字認識装置10は入力された文字が最大の値をと
った出力ユニットに対応する文字であると認識する。こ
こで出力ユニットの値はその文字であるとみなす確信度
を示すので、たとえ最大の値をとっていても値が小さい
場合にはその認識が誤りである可能性がある。そこでユ
ーザは絶対判別閾値を設定し、出力ユニットの最大値が
それ以下であった場合には認識不可という結果を出力さ
せることができる。この機能を実現するため本文字認識
装置10は第10図のパラメタ格納部9の中に備えた絶対判
別閾値格納部91にユーザの指定した絶対判別閾値を格納
しておき、出力ユニットの演算が終了した後に文字認識
管理部8が出力ユニットの最大値がこの絶対判別閾値以
上であるかを確認し、これ以下の場合には認識不可とい
う結果を出力する。また出力ユニットの最大値と2番目
の値が近い場合には、その文字が最大値と2番目の値の
出力ユニットのどちらに対応する文字か判別するのが難
しい。このためユーザは相対判別閾値を設定し、出力ユ
ニットの最大値が絶対判別閾値をこえている場合でも、
出力ユニットの最大値と2番目の値の差が相対判別閾値
以下であった場合には認識不可という結果を出力させる
ことができる。この機能を実現させるため本文字認識装
置は第10図のパラメタ格納部9の中に備えた相対判別閾
値格納部92にユーザの指定した相対判別閾値を格納して
おき、出力ユニットの演算が終了した後に文字認識管理
部8が出力ユニットの最大値と2番目の値の差を求め、
その値がこの相対判別閾値以上であるかを確認し、これ
以下の場合には認識不可という結果を出力する。
つぎにあらかじめ文字数の決まっている文字列を認識
する場合に誤認識を減少させるサムチェックと呼ぶ方法
を説明する。第11図は第10図の文字認識装置10の文字判
別部1の誤認識を減少させる方法を示す説明図である。
このサムチェックと呼ぶ方法は第11図のように7カラム
で構成される番号があった場合に、第1カラムから第7
カラムまでの7つの数字を和を求め、その下1桁を第8
カラムにチェックデジットとして印字し、文字認識装置
は8カラムの番号として認識して認識結果を照合する方
法である。この第11図の場合には製品番号が“1234567"
であり、この和を求めると28となるので、第8カラムに
は8が印字され、文字認識装置は“12345678"といった
製品番号として認識する。このように番号を認識した後
に、文字認識装置で第1カラムから第7カラムまでの値
を加算し、その下1桁が第8カラムの値に一致している
かチェックしその整合性を判定する。このサムチェック
は後の第16図および第17図に示すように各文字の認識が
すべて終了した後に行われる。
上記のようなサムチェックは行う場合と行わない場合
があり、また行う場合もチェックに使うカラム数は一定
ではない。そこで第12図に示すようなメニュー画面を用
いてユーザはこのカラム数を入力する。第12図は第11図
の文字認識装置の文字鑑別部の誤認識を減少させるサム
チェックの方法を使用するさいのカラム数を設定する画
面を示す説明図である。ここでユーザが入力するカラム
数が、“0"はチェックしないこと意味し、“1"は最後の
1文字をチェックに使うことを意味する。ここで指定さ
れたチェックカラム数は第10図のパラメタ格納部9の中
に備えるチェックカラム数格納部93に格納され、文字認
識管理部8が全文字の認識が終了した後にここからチェ
ックカラム数を取り出しチェックする。
つぎに中間ユニット41,42,43と出力ユニット、61,62,
63の閾値および結合係数格納部5の結合係数の調整を文
字認識装置10以外の計算機を使用して行う方法を説明す
る。この閾値と結合係数の調整は処理時間がかかるので
文字認識装置本体でなく処理能力の高い計算機でやる方
がよい場合がある。第13図は第1図の中間ユニットと出
力ユニットの閾値と結合係数の調整を文字認識装置以外
の計算機を使用して行う手順を示すフロー図である。こ
の計算機上には先に第4図で説明した閾値と結合係数の
調整を行うプログラムおよび第10図のパラメタ格納部9
に格納されている文字数などの表示データや画像データ
をアップロードしたり、閾値と結合係数の調整結果をダ
ウンロードするプログラムがあり、これらのプログラム
により閾値と結合係数の調整を実行する。この他の計算
機を用いた調整はまず文字認識装置10から第10図のパラ
メタ格納部9に格納されている教示データおよび文字画
像データを計算機にアップロードする(ステップ13
1)。つぎにその教示データおよび文字画像データを用
いて閾値と結合係数を調整する。ここで文字数やカラム
ごとの文字候補等のパラメタが教示データとしてアップ
ロードされているので、これに合わせて最適な閾値と結
合係数の調整計算が行われる(ステップ132)。最後に
この調整結果を文字認識装置10にダウンロードすること
で終了する。ここで計算機には複数の調整結果のデータ
をファイルとして保存できるので、場合に応じて適切な
認識データをダウンロードすることができる(ステップ
133)。
つぎに本文字認識装置10が実行される動作モードを説
明する。第14図は本発明による文字認識装置10が製造ラ
インで他の機器と共に使用される場合の例を示すシステ
ム構成図である。第1図において、このシステムは本文
字認識装置10と、ワークステーション21と、ローダコン
トローラ22と、TVカメラ23と、照明光源24と、ワーク25
と、ローダ26と、モニタテレビ27とを備え、ワーク25の
表面に印字された製品番号の認識を本文字認識装置10に
接続されたワークステーション21からの認識開始の指令
で行うものである。この認識対象の文字は金属表面上の
刻印文字とかセラミック表面へのレーザマーキング文字
などのように、文字線に切れやかすれを生じやすい印字
品質の非常に悪い文字である。また製品番号にはその先
頭および最後尾に位置切出し用のマーカが印字されてい
るとする。
第15図は第14図の文字認識装置10の内部でのワーク25
の製品番号の読取り手順を示すフロー図である。この製
品番号の読取のフローは認識の動作モードが手動認識
と、半自動認識と、自動認識のいずれのモードであって
も共通である。この処理プログラムは第2図のプログラ
ムデータメモリ15に格納してある。まず第2図の汎用入
出力回路14を介して認識開始命令を外部のワークステー
ション21より受けたのち、画像入出力回路13を用いてす
でにTVカメラ23の視野内にあるワーク25の表面に印字さ
れた製品番号の画像を撮像して画像メモリ2に取り込む
(ステップ151)。ついでマーカ位置を検出してから文
字位置を検出して1文字ごとに認識を行う。このマーカ
位置の検出は2つのマーカの周囲にそれぞれウィンドウ
設定し、このウィンドウ内における濃度の投影分布の中
心位置を求めることにより行う(ステップ152)。つぎ
にマーカの位置が検出されたらこのマーカ間の距離を計
算する。このマーカ間の距離があらかじめわかっている
ので、この計算結果と比較することでマーカが正確に検
出できたかどうかが判定できる。すなわちこの距離が規
定値と大きく異なる場合には、マーカが正確に検出でき
なかったと判定して文字認識を中断する。またマーカの
位置が正しく検出できた場合には、マーカの位置と文字
位置との相対関係から1文字を切り出す。この相対関係
は文字のピッチと、文字の位置とマーカの位置との関係
を、ティーチング時に実物を用いて教示される(ステッ
プ153)。ついで切り出した1文字ごとに判定処理を行
い(ステップ154)、文字候補を決定する(ステップ15
5)。最後に全文字終了したか判断し(ステップ156)、
全文字終了であれば処理を終える。
まず自動認識モードの動作を説明する。ローダコント
ローラ22により制御されたローダ26が製品番号の印字さ
れているワーク25をTVカメラ23の視野内に入るように位
置決めし、ワークステーション21に対してロードの完了
を知らせる。この視野内に入ったワーク25は照明光源24
により均一に照明される。またロード完了の知らせを受
けたワークステーション21は文字認識装置10に対して認
識開始を指令し、この指令を受けた文字認識装置10は認
識対象の画像をTVカメラ23により撮像して画像メモリ2
に取り込む。ついで文字認識装置10は撮像した画像につ
いて文字の認識を実行し、その結果をワークステーショ
ン21に送信する。ワーク受ステーション21は認識結果を
受けた後に、その結果をさらに上位の計算機に転送して
1回の認識を終了する。第16図は第14図(第2図)の文
字認識装置10の自動認識モードのシーケンスを示すフロ
ー図である。まずこの自動認識モードが選択されると
(ステップ160)、文字認識装置10はワークステーショ
ン21からの認識指令のコマンド待ち状態にあり(ステッ
プ161)、ワークステーション21からの認識開始の指令
信号を受けた文字認識装置10は認識を実行し、ワークス
テーション21に対して認識結果と共に結果コードを送信
する(ステップ162)。このときサムチェックを行うこ
とが指定されているばこのチェックを行い、サムチェッ
クにより認識結果に不整合があれば結果コードにサムチ
ェックエラーコードがセットされる(ステップ163)。
最後にこのとき撮像した文字画像を使用して上記した閾
値と結合係数の調整を行うことが指定されているか判断
し(ステップ164)、調整が指定されていれば調整を開
始する(ステップ165)。
ついで半自動認識モードの動作を確認する。半自動認
識モードでは上位機器に認識結果を返す前にユーザに結
果の確認を求めたり、結果が誤っている時はその場で対
話型に結果を修正することができる。ここで常にユーザ
に確認を求めるようにすると繁雑になるので、認識の確
信度が低い時だけユーザに確認を求めるようにすること
ができる。この半自動確信度閾値は後の第20図の機能23
4のようにユーザが設定できる。第17図は第14図(第2
図)の文字認識装置10の半自動認識モードのシーケンス
を示すフロー図である。この半自動認識モードが選択さ
れると(ステップ170)、さきの自動認識モードと同様
にワークステーション21からの通信による制御状態とな
って認識指令のコマンド待ち状態にあり(ステップ17
1)。ワークステーション21からの認識開始の指令信号
を受けた文字認識装置10は認識を実行する(ステップ17
2)。この半自動認識モードの認識結果は第18図に示す
ように手動認識結果の画面と同様の形式で表示される。
第18図は第14図(第2図)の文字認識装置10の半自動認
識モードの認識結果の表示画面を示す説明図である。こ
こで得られた認識結果の確信度が指定した半自動確信度
閾値より低い時にはワークステーション21に認識結果を
返す前にユーザに結果結果の確認を求める。この場合に
認識結果が正しい時には、ここで送信の機能を持つキー
を押せば結果が返される。また認識結果が誤っている時
には、カーソル左右移動キー(→←)を用いてカーソル
を誤認識した文字の場所に移動し、画面下部に表示され
た英数字の中からカーソル左右移動キーによりカーソル
を正しい文字の場所に移動して修正する。ここで誤認識
が2文字以上ある場合には同様にカーソルを御認識した
文字の場所に移動して認識結果を修正し、ユーザがすべ
ての認識結果を認識したらその認識結果と結果コードを
ワークステーション21に送信する(ステップ173)。こ
の時にサムチェックが指定されていればサムチェックを
行い、このサムチェックにより認識結果に不整合があれ
ば結果コードにサムチェックエラーコードがセットされ
る(ステップ174)。最後にこのとき撮像した文字画像
を使用して閾値と結合係数の調整を行うことが指定され
ているか判断し(ステップ175)、指定されていればそ
の調整処理が行われる(ステップ176)。
ついで手動認識モードの動作を説明する。第19図は第
14図(第2図)の文字認識装置10の手動認識モードのシ
ーケンスを示すフロー図である。この手動認識モードは
自動認識を行う前に、ティーチングで調整した中間ユニ
ット41,42,43と出力ユニット61,62,63の閾値や結合係数
で正しく認識できるか判断するために認識実行を行うも
のである。まず手動認識モードが選択されると(ステッ
プ190)、認識開始の指令はワークステーション21では
なくティーチングボックス19からの操作で行う(ステッ
プ191)。これにより認識を実行し(ステップ192)、認
識結果を画面の上段に表示し、その下に確信度を表示す
る(ステップ193)。
つぎに文字認識装置10は、上記したワークステーショ
ン21からの認識指令により認識を開始して認識結果をワ
ークステーション21に送信する自動認識モードと、ワー
クステーション21からの認識指令により認識を開始して
認識結果を確認し訂正することが可能な半自動認識モー
ドと、ティーチングしたデータで認識実行し認識結果を
確認して認識性能を判断するための手動認識モードの他
に、認識および学習のためのフォントをウィンドウや候
補文字などの認識対象物の特性を入力するためのティー
チングモードと、画像評価やICカード入出力の操作やワ
ークステーションなどに対するデータ伝送仕様の設定等
を行うユーティリティーモードがあり、5つの動作モー
ドをもつ。このティーチングモードとユーティリティモ
ードをつぎに説明する。
第20図は第14図(第2図)文字認識装置10のティーチ
ングモードの各機能を示すブロック図である。ここで1
台の視覚センサのTVカメラ23をさまざまな環境で仕様す
る場合に、環境ごとに文字の配置や大きさが異なるので
ティーチングデータも環境ごとに設定する必要がある。
このティーチングモード200でティーチするものは認識
対象文字列に関する設定210と、その文字のフォント選
択220と、認識パラメータの設定230と、フォントの閾値
と結合係数の調整240である。まず認識対象文字列に対
する設定210としては、文字数の設定211と、画素数で表
される文字のサイズの設定212と、印字文字列の変動範
囲や位置切出しのための基準マーカの位置の設定213が
ある。つぎのフォント選択220では認識対象文字の字体
を指定する。これにはフォントの種類をOCR−Aのよう
に文字認識装置10があらかじめ備えている標準字体221
とするか、実際の文字パターンを登録するかを指定す
る。この標準字体221を指定するとあらかじめ内蔵して
いるその標準字体を認識対象文字の字体として登録す
る。また実物教示字体222を指定すると、その字体の判
定に適したウィンドウ領域の設定等の特徴領域設定223
と、特徴設定224を行う。つぎの認識パラメータの設定
には確信度閾値設定231と、チェックコードの桁数指定2
24と、半自動認識の確信度閾値設定234がある。この確
信度閾値設定231では確信度の差の閾値設定232があり、
半自動認識の確信度閾値設定234では確信度の差の閾値
設定235がある。
つぎのフォントの閾値と結合係数の調整240には文字
候補の設定241と、調整に使用するフォントの文字画像
登録242と、調整用パラメータの設定243と、調整実行24
8がある。フォントの文字画像登録242ではフォントの文
字の種類ごとに外枠を指定してその画像を取り込み、閾
値と結合係数の調整はこの登録されたフォントに対して
行われる。まず文字画像の入力の前にマーカ部の画像を
取り込んで背景の基準明るさを求め、これが終ると文字
画像の取り込みに移る。この文字画像の取込みはまず文
字の種類を指定して次に画像の取込み操作を行う。この
画像を取り込んでも生画像が表示され、続けて次の文字
の取込みが行える。文字の種類指定は文字列が画面下に
並んでいるので左右カーソルキーで指定しようとする文
字の所にカーソルを移動して行う。この文字の種類指定
を行うと文字外枠を示すボックスが画面中央に表示さ
れ、この文字外枠を文字の表示されている位置にカーソ
ルで動かした後に文字画像を入力する。この文字外枠の
移動は文字外枠を選択した状態でカーソルキーにより行
える。調整パラメータの設定243では、調整パラメータ
として収束を判定するための最小2乗誤差の制定244
と、調整演算回数の上限値の設定245と、調整の計算結
果の修正量が現時点の修正量に及ぼす係数(0≦係数≦
1)の設定246と、1つ前の調整の計算結果の修正量が
現時点の修正量に及ぼす係数(0≦係数≦1)の設定24
7の4つのパラメータを設定する。調整実行248ではこれ
まで設定したデータおよび画像を用いて実際に調整を実
行する。これにはまず第21図に示すようなこれまでの調
整結果を初期値としてさらに調整を行うか、またはリセ
ットして新しい初期値から始めるかの選択画面になる。
第21図は第20図の調整実行248の初期状態の選択画面を
示す説明図である。この選択を行うと調整結果を示すグ
ラフが表示される。そのグラフの縦軸は評価関数の誤差
を表し、縦軸の最大値は1.0であって誤差がこれ以上の
時には1.0の所に表示される。その横軸は調整回数を表
し、その最大値は調整パラメータの設定で収束回数とし
て指定した値になる。その指定した収束誤差はこのグラ
フの上に直線で表示される。調整はカラムごとに実行さ
れるのでここで、カラム番号を入力して調整を実行し、
調整の実行結果はこのグラフの上に10回ごとに計算され
表示される。調整パラメータの設定の所で設定した収束
誤差もしくは収束回数のいずれかの条件が成立すると調
整は終了する。
第22図は第14図(第2図)の文字認識装置10のユーテ
ィリティモードの機能を示すブロック図である。本文字
認識装置10は外部記憶装置としてICカード17を使用せ
ず、ティーチングデータや画像データを格納することが
できる。このユーティリティモード500にはポート設定5
10と、ICカードの入出力機能520と、画像評価530と、デ
ータ伝送機能540と、文字認識装置の設定550がある。ま
ずポート設定510には伝送速度設定511と、ストップビッ
ト設定512と、パリティ設定513がある。ICカードの入出
力機能520にはICカード17の画像をロードと消去しICカ
ードに画像をセーブする機能521と、ICカードの認識デ
ータをロードと消去しICカードに認識データをセーブす
る機能522と、ICカードのイニシャライズ機能523があ
る。これらの処理はいずれもメニューの指示に従って簡
単に実行でき、例えば画像のセーブ機能521を選択する
と生画像が表示されセーブする画像をTVカメラ23から入
力するメニュー画面になる。ここで入力する画像が見え
るようにしてキャリッジリターンを入力するとその画像
が取り込まれ、つぎにICカードを挿入し画像データの名
称を入力すると取り込んだ画像がセーブされる。つぎの
画像評価530の多値画像評価531では光学系の調整のため
生の多値画像を表示する。また断面輝度分布表示532を
選択するとTVカメラからの生画像が表示されるので適切
な画像がでたところで画像を取込む。その後にその取り
込んだ画像の上に断面位置を示す水平ラインカーソルが
表示されるので、上下カーソルキーを用い水平ラインカ
ーソルを動かして断面の位置を指定するとその場所の輝
度グラフが表示される。また2値画像評価機能533があ
る。データ伝送機能540にはティーチングデータのデー
タ伝送541と、画像データの伝送542がある。
つぎに中間ユニット41,42,43と出力ユニット61,62,63
の閾値と結合係数の調整処理を文字認識の処理をしなが
ら実行する方法を説明する。これは文字認識装置10の自
動認識モードと半自動認識モードにおいて可能である。
この自動認識モードと半自動認識モードのいずれにおい
ても、上記した第16図のサムチェック(ステップ163)
と第17図のサムチェック(ステップ174)を行った後
に、第16図のこの調整を実行するか否かの判断(ステッ
プ164)と第17図の調整を実行するか否かの判断(ステ
ップ175)を行っている。この判断は第22図に示すユー
ティリティ機能500のなかで文字認識装置の設定550の1
つとして認識中調整を指定したか否かで行われる。この
認識中調整を行うと文字の印字品質が変動するような対
象に対してもその変動に追従させて適応させることがで
き、また文字認識装置10が異なった環境で使用される場
合にも設置した環境において認識しながら調整をするこ
とにより、設置にさいして繁雑な操作を必要とせずに安
定した認識が実現可能となる。第23図は第14図(第2
図)の文字認識装置10が認識を行いながら閾値と結合係
数の調整を行う場合のタイムチャートを示す説明図であ
る。第23図において、文字の認識を実行している期間75
3,754,755にも、時分割処理により調整演算が可能であ
るが、認識演算に比較して調整演算は時間がかかるの
で、認識対象のワーク25のロードとアンロードの期間75
1,752に、調整を実行する期間756,757の調整を行う。こ
れにより文字認識装置10の実行を妨げることなくオンラ
イン調整が可能となる。また認識した結果で認識確信度
が低い場合には、その文字画像を使用した調整は行なわ
ないようにすることも可能である。
つぎに特別な中間ユニットの41,42,43構成を説明す
る。上記した中間ユニットの機能は入力ユニット31,32,
33からの出力値に閾値を加えた値に対して演算を行いそ
の結果を出力することであったが、他の機能の中間ユニ
ットとして上記した中間ユニットの出力の取り得る最大
値からその中間ユニットの出力値を減算した値を出力す
るような反転中間ユニットを設けることができる。この
意味は上記した中間ユニットが入力ユニットからの出力
値が大きいほど大きな出力を出すのに対して、反転中間
ユニットは入力ユニットからの出力値が小さいほど大き
な出力を出すことである。これは入力ユニットのウィン
ドウ領域になにもないことがその文字の特徴である場合
に有効な働きをする。この反転中間ユニットの出力y
は、先に式(1)で求めた中間ユニットの出力yを用い
て次式で表せる。
1,n+j=1−y1,j (6) この反転中間ユニットの計算は、次式のように変形す
ることができる。
1,k,j×y1,j+w1,k,j+n×y1,n+j =w1,k,j×y1,j+w1,k,j+n×(1−y1,j) =(w1,k,j−w1,k,j+n)×y1,j+w
1,k,j+n (7) したがってこの関係式から反転中間ユニットを設けな
くても出力ユニット61,62,63の閾値を適切に決めれば、
次の式(8)に示すように反転中間ユニットを設けたの
と同様の機能を実現できる。
これは反転中間ユニットを設けた場合に比べて中間ユ
ニットの数が半分になっており、それだけ文字認識の演
算が少なくなり高速になる。ただしこの出力ユニットの
閾値は反転中間ユニットがある状態で結合係数を調整し
た方が求めやすいので、調整時には反転中間ユニットを
設けて文字認識時には反転中間ユニットを取り除く方法
が有効である。
さいごに中間ユニットと出力ユニットの閾値と結合係
数を調整するためのサンプル文字画像について説明す
る。このサンプル文字画像は多ければ多いほど色々なケ
ースに対応できる調整をしたことになる。しかし各種の
文字画像をサンプルとして収集するには工数を要する。
そこで1つの文字画像に対して文字の位置ずれ範囲と明
るさの変動範囲を指定すると、そのサンプル画像から位
置ずれを生じた画像および明るさの変動した画像を自動
的に生成するようにすれば、あまり工数をかけずに各種
のサンプル画像を用いた調整ができることになる。第24
図(a),(b)は第14図(第2図)の文字認識装置10
がサンプル画像から位置ずれを生じた画像および明るさ
の変動した画像を自動的に生成する方法を示す説明図で
ある。第24図(a)に示すように位置の変動した画像の
自動生成はもとのサンプル画像があったらその原点Oか
らO′を変動範囲として指定された範囲でずらすことに
より実現できる。例えば変動範囲がプラスマイナス3画
素と指定されたら、サンプル画像の原点OをX,Y方向と
も+3,+2,+1,0,−1,−2,−3ずらした49種類の画像を
用いれば位置ずれのあるサンプル画像を得ることができ
る。同様にして第24図(b)に示すようにもとのサンプ
ル画像からの明るさの変動範囲を指定されれば、その範
囲だけ濃度を変化させた画像を生成することにより、明
るさ変動のあるコントラストのサンプル画像を得ること
ができる。
つぎに入力ユニットでの画像処理の種類について、他
の画像処理の方法の例について説明する。上記第3図で
説明した入力ユニット31,32,33で行われる画像処理は、
横の文字線に対する上方からの微分と、横の文字線に対
する下方からの微分と、縦の文字線に対する左方からの
微分と、縦の文字線に対する左右からの微分と、濃度合
計の5種類であった。この微分処理は第3図で説明した
ように文字線に対して垂直方向に微分値を加算していく
方式であり、濃度合計はウィンドウ内の濃度の平均値を
求める方式である。この画像処理の方法はセラミック表
面へのレーザ印字文字のようにコントラストの悪い文字
に対して有効である。本文字認識装置10はこの5種類の
画像処理の他にウィンドウ内での濃淡画像に対して1次
微分により微分値を求めてエッジを検出する4種類の画
像処理種類と、ウィンドウ内での濃淡画像に対して2次
微分により微分値を求めてエッジを検出する4種類の画
像処理種類と、ウィンドウ内を2値化してそのウィンド
ウ内での白領域(または黒領域)の面積をカウントする
2種類の画像処理種類と、ウィンドウ内を2値化して2
値画像に対してエッジを検出する2種類の画像処理種類
との12種類を備えている。つぎにこの12種類の画像処理
について順に説明する。
まずはじめに濃淡画像に対して1次微分または2次微
分によってエッジを検出する方式について第25図を用い
て説明する。第25図(a),(b),(c)はウィンド
ウ内画像処理の中で左方からの1次微分と2次微分によ
るエッジ検出方法の説明図である。第25図(a)は縦方
向の文字線上にきられたウィンドウの例であり、この図
において斜線部分は文字線を表す。第25図(b)は今こ
のウィンドウ内でx方向に左方から1次微分した時のx
方向の★印のついなランインについての1次微分値を表
したものであり、第25図(c)は同じく★印のついたラ
インについてウィンドウ内でのx方向への左方からの2
次微分値を表したものである。まず1次微分について説
明する。第25図(b)にあるようにウィンドウ内での1
次微分値をすべてのラインごとに計算する。そしてその
各ラインの1次微分値の最大値を求めてすべてのライン
についてその微分値の総和を計算し、その総和値をその
ウィンドウのライン数で除算した1次微分値の最大値の
平均値を計算してこの値を入力ユニットの出力値とす
る。つぎに2次微分について説明する。第25図(c)に
あるようにウィンドウ内での2次微分値をすべてのライ
ンごとに計算する。そして1次微分と同様にその各ライ
ンの2次微分値の最大値を求めてすべてのラインについ
てその微分値の総和を計算し、その総和値をそのウィン
ドウのライン数で除算した2次微分値の最大値の平均値
を計算してこの値を入力ユニット31,32,33の出力値とす
る。このように画像処理の結果をウィンドウの大きさで
正規化することによりウィンドウの大きさに依存しない
入力ユニットの出力値を得ることができる。
つぎにウィンドウ内を2値化してそのウィンドウ内で
の黒領域の面積をカウントする方式について説明する。
このウィンドウ内画像処理の方式は比較的コントラスト
がよく安定した2値画像が得られる場合に用途は限られ
る。まずウィンドウ内を2値化し、つぎに2値化したウ
ィンドウ内で黒に対応する画素数をカウントする。その
カウントした黒画素数をウィンドウの面積で除算して入
力ユニット31,32,33の出力値とする。ここでカウントす
る画素が黒画素でなく白画素をカウントしても反転ユニ
ット全く等価である。2値化の閾値は固定2値化閾値
や、例えばpタイル法や判別分析法などのアルゴリズム
によって決定した2値化閾値を用いればよい。但し対象
の文字のコントラストがよく安定した2値画像が得られ
る場合には例えば文字背景の明るさを参照してその明る
さに対して演算を行った結果を2値化閾値とする方法も
有効である。一例としては文字背景の明るさの85%を2
値化閾値とする方法などが考えられる。
つぎにウィンドウ内を2値化して2値画像に対してエ
ッジを検出する方式について説明する。このウィンドウ
内画像処理の方式も比較的コントラストがよく安定した
2値画像が得られる場合に用途は限られる。まずウィン
ドウ内を2値化し、2値化したウィンドウ内の各ライン
について白から黒に変わるところをエッジとして検出す
る。ここでのラインは第25図において説明した濃淡画像
に対する1次微分と2次微分のところのラインと同じ定
義で、文字線の方向に対して垂直な方向である。そのラ
インでエッジを検出したならば次のラインについても同
じエッジ検出方法を適用し、ウィンドウ内のすべてのラ
インについて検出を行う。そしてすべてのラインの処理
が終了した時にウィンドウ内でエッジを検出したライン
数を計算し、これをウィンドウの大きさで正規変して入
力ユニット31,32,33の出力値とする。
つぎに2つ以上のウィンドウを組合せた特別な中間ユ
ニット44について説明する。上記した中間ユニットは入
力ユニット31,32,33からの出力値に閾値を加えた値に対
して演算を行い演算結果を出力する中間ユニットとその
反転した結果を出力する中間ユニットである。これらの
中間ユニットの入力値はウィンドウ内の微分値の大きさ
と明るさの平均値である。このため印字の濃さが変動し
た時には、明るさが変動した時と異なり微分値の大きさ
と明るさの平均値が大きく変動して正確に特徴抽出を行
えない。この問題を解決するため他の中間ユニットとし
て、複数個の入力ユニットを組合せて入力ユニット31,3
2,33,34の出力値の相対値を入力値とする組合せ中間ユ
ニット44を設けた。この組合せ中間ユニットについて第
26図を用いて説明する。第26図は第14図(第2図)の文
字認識装置10の特別な中間ユニットである組合せ中間ユ
ニットの一例を示す説明図である。第26図の中間ユニッ
ト44は入力ユニット群3の入力ユニット32,34の出力値
を組合せて入力としている。まず上記の各入力ユニット
31,32,33,34はウィンドウ位置格納部311,321,331,341に
格納されているウィンドウ位置データに基いて画像処理
部312,322,332,342においてウィンドウ内で画像処理を
行いその画像処理結果を入力ユニットの出力値とする。
中間ユニット44は入力ユニット群3の入力ユニット32,3
4の出力値を組合せて入力としている。この場合入力ユ
ニット32,34の出力値が中間ユニット44に入力されると
中間ユニット44の演算部442は2つの入力ユニットの出
力値の差を求めこの差に閾値格納部441に格納されてい
る閾値を加えた値に対して演算を行い中間ユニット44の
出力値とする。入力ユニットの組合せはこのように2つ
の入力ユニット出力値の差を用いる場合だけでなく、3
つ以上の入力ユニットの出力値を用いることもある。こ
れを3つの入力ユニットを用いる場合を例にとって説明
すると、まず2つの入力ユニットの出力値の平均値を求
め、この平均値ともう1つの入力ユニットとの差を求め
て中間ユニット44の入力値とするものである。この平均
計算および差を求める演算は、中間ユニット演算部442
において実行され、閾値格納部441に格納されている閾
値を加えた値に対して演算を行い中間ユニット44の出力
値とする。この組合せユニットは通常のユニットとの混
在も可能であり、通常の中間ユニットに入力した入力ユ
ニットは組合せユニットに用いることも可能である。
つぎにこの入力ユニットの組合せの設定および変更に
ついて第27図を用いて説明する。第27図は上記の組合せ
中間ユニットに対して入力ユニットの設定および変更を
メニュー画面である。まず組合せを設定する中間ユニッ
トの番号を入力する。第27図は“1"を入力している例で
ある。つぎに組合せをおこなう第1項の入力ユニット数
を入力し、つぎに入力ユニット(ウィンドウ)の番号を
入力する。第2項についても入力ユニット数を入力し入
力ユニットの番号を入力する。入力ユニットが複数の場
合にはカンマで区切って入力する。そして最後に組合せ
の設定か削除かを番号で入力して設定または変更を行
う。ここで設定した第1項と第2項の値が中間ユニット
に入力される。つぎに中間ユニット演算部442で行って
いる演算について説明する。この組合せ中間ユニットの
演算部での計算は次のように画像処理種類にしたがって
行う。
1)画像処理種類が微分処理の場合 中間ユニット入力値=(組合せ第2項−組合せ第1
項)+閾値 2)画像処理種類が濃度合計処理の場合 中間ユニット入力値=(組合せ第2項−組合せ第1
項)/組合せ第2項+閾値 3)画像処理種類が2値化処理の場合 中間ユニット入力値=(組合せ第1項−組合せ第2
項)+閾値 上記1)〜3)で計算された中間ユニットの入力値が
算数されれば残りの処理は先に述べた中間ユニットと全
く同様であり、この中間ユニットに対する反転中間ユニ
ットも構成できる。すなわちこの組合せ中間ユニットは
中間ユニット演算部で行う演算が異なるだけで、その他
は組合せ中間ユニットでないこれまでの中間ユニットと
全く同じに扱うことができるという特徴をもち、組合せ
中間ユニットでない中間ユニットと共に同時に使うこと
も可能である。尚、入力ユニットの組合せの決定法すな
わちどの入力ユニットを組合せるべきかといった問題に
は、従来の多変量解析のなかで例えば主成分分析の手法
や変数選択法などの手法を用いて最適な入力ユニットの
組合せを決定する。
つぎに閾値と結合係数の他の調整方法に関して説明す
る。閾値と結合係数は第4図で説明したように逐次的に
調整する方法もあるが、重回帰モデルを用いて求めるこ
とができる。この方法によれば結合係数を簡単に計算で
きる。この重回帰モデルは中間ユニットの出力値をy1,
j,結合係数をw′1,k,jとすると、出力ユニットの出力
値をo2,kは次式のように表せる。
すなわちある画像を認識するためにまず中間ユニット
の出力値y1,jが計算できる。このとき出力ユニットの出
力値に相当するo2,kに対してその画像の文字の正解には
“1"、それ以外は“0"として、すべての文字種類に対し
て考えると式(9)で表される式中の添字kで表される
変数w′および式の数が出力ユニットの個数に等しい、
連立方程式を解くことで結合係数w′が簡単に計算でき
ることがわかる。中間ユニットの閾値については、入力
した画像について統計的な平均値を求めこれを中間ユニ
ット閾値にすればよい。上記の方法によって求めた閾値
と結合係数を用いても認識性能はある程度でるがさらに
認識精度を向上させるために、これを初期値として第4
図で説明した調整処理を行ってもよい。
本文字認識装置10は通信回線でデータを伝送すること
によりワークステーションを用いて上記のウィンドウの
設定やウィンドウ内画像処理種類の指定などを行うこと
ができる。そこで上述したウィンドウの設定やウィンド
ウ内画像処理種類の指定などをワークステーションのよ
うな他の計算機を用いるときの一例について第28図〜第
29図を用いて説明する。第28図は第14図(第2図)の文
字認識装置10に接続したワークステーションの処理メニ
ューを表した画面である。このようにワークステーショ
ンには、データ伝送と、調整パラメータ設定と、文字パ
ラメータ設定と、調整実行と、ウィンドウ評価と、ウィ
ンドウ設定と、結合係数データ設定と、文字種類変更
と、統計解析と、終了の機能をもつ。第29図は第14図
(第2図)の文字認識装置10に接続したワークステーシ
ョンの機能の一例を示すブロック図である。このワーク
ステーションの機能2900にはデータ伝送2910と、調整パ
ラメータ設定2920と、文字パラメータ設定2930と、調整
実行2940と、ウィンドウ評価2950と、ウィンドウ設定29
60と、結合係数データ設定2970と、文字種類変更2980
と、統計解析2990とがある。この機能は第28図の10個の
機能に対応している。第29図の各機能も同様に第28図に
示したような各機能に対応した処理メニューにより処理
番号を選ぶ。
まずデータ伝送2910には閾値および結合係数などの教
示データ伝送2911と画像データ伝送2912がある。調整パ
ラメータ設定2920では、まずパラメータ設定2921で上述
の調整の式(4),(5)での定数Bk,Ckの値をそれぞ
れ設定する。また2値化閾値設定2922では2値化閾値を
設定する。文字パラメータ設定2930では、教示データに
ある文字行数と、行ごとの文字数と、文字の縦,横のサ
イズと、文字の縦,横のピッチと、カラムごとの使用文
字候補を変更または設定することができる。まず文字行
数設定2931で認識すべき製品番号などが行列で構成され
ているかその行数を設定し、文字数設定2932において各
行の文字数を設定する。文字サイズ設定2933では認識対
象文字の文字の縦と横のサイズを画素単位で設定し、文
字ピッチ設定2934では文字の横方向のピッチを画素単位
で設定し、文字ピッチ設定2934では文字列が2行以上の
場合には縦ピッチすなわちその行のピッチも画像単位で
設定する。また文字候補設定2935では各カラムに対する
使用文字候補をカラムごとに設定する。調整実行2940で
は第13図で説明したような閾値および結合係数の調整を
実行する。調整実行2940は調整計算2941と重回帰分析29
42の2つのモードをもち、調整計算2941は上述の式
(4),(5)を用いる方法で、また重回帰分析2942は
式(9)を用いる方法である。調整計算2941ではまずど
のカラムについての計算かを指定してつぎに実行に移
る。カラムの指定は製品番号のようにカラムごとに使用
文字候補が決まっている場合にその文字候補を用いる。
この文字候補は上述したように文字候補設定2935で設定
および変更が可能である。調整計算の実行ではすべての
文字に対する文字ごとの確信度の最新の値を縦軸に取り
横軸を文字種類とした表示と、計算した直後の文字の確
信度の値と計算を開始してからの履歴を縦軸に取り横軸
を文字種類とした表示と、2乗誤差和の値を縦軸に取り
調整計算の回数を横軸にとった連続的な表示とを行う。
ウィンドウ評価2950ではウィンドウ入力値評価2951と、
入力ユニット組合せ評価2952と、フォントパターン評価
2953と、ウィンドウ位置評価2954と、全ウィンドウ入力
値評価2955とがある。ウィンドウ入力値評価9251ではウ
ィンドウの位置と上記の微分や濃度合計や2値化といっ
た画像処理の種類を指定してすべての文字のウィンドウ
の値を縦軸にとり、横軸に文字種類として表示する。ウ
ィンドウ位置の入力の方法はウィンドウは基本的に四角
形であるから、左上のx,y座標と、左下のx,y座標と、右
下のx,y座標の3点を入力する。入力ユニットの組合せ
評価2952では上述の入力ユニットを組合せた中間ユニッ
トの評価を行う。まず組合せる入力ユニット(ウィンド
ウ)の番号を入力してそのときの中間ユニットの出力値
を全文字について、横軸を文字種類,縦軸を中間ユニッ
トの出力値として表示する。フォントパターン評価2953
では設定してあるウィンドウの位置と画像処理種類に対
する中間ユニットの出力値を全文字に対して横軸を文字
種類、縦軸を入力ユニットの出力値として表示する。こ
のときまず2値化処理か濃淡処理かを入力し、つぎに文
字を指定してこの文字を拡大表示してウィンドウの位置
を表示し、つぎに表示したい中間ユニットの番号を指定
して中間ユニットの出力値を表示する。ウィンドウ位置
評価2954は文字枠に対するウィンドウの位置を確認する
ために使用し、まずウィンドウの番号を入力すると文字
枠に対するウィンドウの位置を表示する。全ウィンドウ
表記2955は文字の種類を入力して横軸をウィンドウの番
号、縦軸を入力ユニットの出力値として、各入力ユニッ
トの出力値を表示する。ウィンドウ設定2960ではウィン
ドウ設定296と入力ユニット組合せ設定2962の2つの項
目がある。ウィンドウ設定2961ではこのウィンドウを使
用しているかいないかの使用フラグと、ウィンドウに対
する上記で説明した画像処理の種類と、ウィンドウの位
置座標を入力して設定する。ウィンドウの位置の設定方
法はウィンドウ評価2950と同様である。入力ユニット組
合せ設定2962では第27図のメニューと同じで、組合せを
用いる中間ユニットの番号の指定と、組合せの設定また
は変更するかの指定と削除するかの指定との選択と、組
合せる入力ユニットの番号の指定とを行う。結合係数デ
ータ設定2970では中間ユニットと出力ユニットの間の結
合係数の初期値を手入力するための機能でデータ設定29
71と、データクリア2972と、データコピー2973と、デー
タ圧縮2974と、自動設定2975の機能をもっている。デー
タ設定2971では特定の出力ユニットに対する結合係数の
初期値を設定する場合や変更する場合で用いる機能でま
ず出力ユニットの番号を指定して、つぎに設定したい値
を入力する。データクリア2972は、特定の中間ユニット
に対する結合係数をすべて0にする機能で、例えば新し
い中間ユニットを増設したときに用いる。ここでまずク
リアしたい中間ユニットの番号を指定する。データコピ
ー2973ではカラム間で閾値および結合係数をコピーす
る。コピーする閾値および結合係数をもつカラムの番号
を指定してコピーしたいカラムの番号を指定してコピー
する。データ圧縮2974では中間ユニットと出力ユニット
間の結合係数を指定した値で除算し結合係数の値を全体
的に小さい値にする。これは値が大きくなりすぎオーバ
ーフローを生じたときなどに用いる。自動設定2975は閾
値と結合係数の初期値を決定する機能である。適切な文
字画像を用いてその中間ユニットの値を計算してその中
間ユニットの出力値から例えば出力値が0〜0.4のとき
には結合係数の初期値を−1とし、0.4〜0.6のときには
結合係数の初期値を0とし、0.6〜1.0のときには+1と
いうように初期値を決定する。文字種類変更2980では文
字の画像と文字種類の対応を変更または修正するための
機能で、調整計算2941において教師データを生成するた
めに用いる。また品質の悪い文字画像があった場合には
この画像を調整計算に入れると認識性能の劣化を招くこ
とがある。この場合にはこの画像をとばして調整計算に
使用しない方がよい。このときこの画像に対して文字種
類変更2980から使用しない文字の種類と指定することに
より調整計算は実行されず、全体的な認識性能の劣化も
起こらない。統計解析2990では変数選択法と呼ばれる方
法によりウィンドウ(入力ユニット)の最適な組合せを
決定する。これは入力ユニットのすべての組合せを計算
し変数選択法と呼ばれる方法によりどの入力ユニットを
組合せればよいかを選択する。まずこの選択の基準を入
力し、この基準の表す認識性能を確保できる組合せを出
力する機能であり、この組合せから調整実行2940の調整
計算を行える。この使用方法はまずデータ伝送2910の中
の教示データ伝送2911によって教示データをロードし、
画像データ伝送2912によって調整または評価に用いる画
像データをロードして各機能を実践する。
つぎにワークステーション21と文字認識装置10の他の
構成について説明する。第30図はワークステーション21
と文字認識装置10の機能ブロックの一例を示した図であ
る。ワークステーション21には設計モジュール3000が搭
載され、この設計モジュール3000は認識モデルジェネレ
ータ3001と、調整モニタ3002と、認識シミュレータ3003
と、認識パラメータ格納部3004と、サンプル画像格納部
3005から構成され。文字認識装置10には認識モジュルー
3006が搭載され、認識モニタ3007と、認識モジュール30
08と、パラメータ格納部3009より構成される。認識モデ
ルジェネレータ3001はユーザに認識対象に関する。質問
を出し、その回答と内蔵するパターン認識に関する知識
から入力ユニットでの画像処理の種類や中間ユニットの
組合せなどの認識モデルを生成し、認識パラメータを生
成する。調整モニタ3002はこのパラメータと、あらかじ
め文字認識装置10からアップロードしておいたサンプル
画像を認識シミュレータ3003のデータエリアにセット
し、認識シミュレータ3003を起動する。認識シミュレー
タ3003は文字認識装置10に搭載された認識モジュール30
08と同等のものであり、認識処理を行なうごとに調整計
算モニタ3002に結果を返す。調整計算モニタ3002は認識
結果に基づき認識パラメータを修正し、所定の認識性能
が得られるまで調整計算を繰り返す。調整計算が終了し
たら、その計算された認識パラメータを認識パラメータ
格納部3009に転送し、認識実行ができるようになる。こ
の設計モジュール3000は、エキスパートシステム構築シ
ェルで記述されワークステーションで実行される。
認識モデルジェネレータ3001は、ユーザが認識対象の
種類や特徴を指定すると、ユーザに質問を出しながら内
蔵する知識を用いて認識パラメータの初期値を生成す
る。ユーザが指定するものとしては、対象とする実物パ
ターンの他、特徴となりそうな部分、その範囲の特徴抽
出に適した画像処理の種類等である。このユーザ指定項
目については、ユーザの判断を容易にするためのユーテ
ィリティを備えている。この例としては、第29図におい
て説明した画像処理の種類を決定するために微分等の画
像処理を行い結果を表示したり、多変量解析により初期
値を決めるもの等がある。
調整計算モニタ3002はユーザからの調整計算実行に関
する指示を受け付け、短時間に適切な結果が得られるよ
うに認識シミュレータ3003を管理するものである。調整
計算の方法に認識パターンの特性に応じたノウハウがあ
り、学習モニタ3002はこの知識を備えている。調整計算
モニタ3002の主要な機能はまず、計算に必要な、温度、
計算の終了条件等、調整パラメータを設定したり、結果
をユーザに理解し易い形で出力する。
また、サンプル画像格納部3005に格納された画像か
ら、例えば第24図において説明した位置ずれや、明るさ
変動や、形状変形等、実際の認識環境にあわせた画像の
生成を行なう。更に計算のスジューリングによって計算
時間が大幅に短縮されるので計算の効率化のため、調整
モニタ3002はこのような計算のスケジューリングに関す
る知識を用い、誤りなくパターンの判別を行なう認識パ
ラメータをできるだけ速く得るものである。
パターン認識モジュール3009は第1図に示すような構
造である。パターン認識モニタ3007は認識対象パターン
に対して認識パラメータを設定することにより判別機能
を認識対象に応じて最適な状態に変更するものである。
この機能は、出現するパターンの候補が出現場所に対応
して特定の種類に限定できる場合の多い工業用文字/パ
ターン認識において特に有効である。例えば、第10図で
説明したように製品番号のような桁ごとにその桁に対し
て指定された候補文字だけの判別を行なう認識パラメー
タを使用すると、英数字全部の判別をおこなう認識パラ
メータを使用するより認識率が高くなる。認識パラメー
タ格納部3008はワークステーション上にある設計モジュ
ールの認識パラメータ格納部3004のパラメータをデータ
伝送により伝送した格納する。認識対象の文字が変われ
ば設計モジュール3000において対象に応じた認識パラメ
ータを求め、この認識パラメータ格納部3008のデータを
変更することで容易に対応できる。
〔発明の効果〕
本発明によれば、文字の印字品質や文字のフォントが
変動するようなものや文字の印字状態が悪いもので例え
ばコントラストの悪い画像や文字線の切れとかかすれと
いったものが生じた対象でも自動的に認識装置が変動に
対し適応してその影響を受けずに安定した認識が実現で
きる効果がある。
【図面の簡単な説明】
第1図は本発明による文字認識装置の1実施例を示す文
字判別部の一構成図、第2図は第1図の文字認識装置の
ハードウェア構成図、第3図(a),(b),(c)は
第1図の入力ユニットの画像処理部の処理の例を示す説
明図、第4図は第1図の閾値および結合係数を調整する
手順を示す説明図、第5図は第4図の結合係数の初期値
をユーザが判断して設定する画面を示す説明図、第6図
は第1図のウィンドウ領域の位置および大きさを設定す
る画面を示す説明図、第7図は第6図の操作に用いるキ
ーボードの例を示す上面図、第8図は第1図の画像処理
部の処理の種類を設定する画面を示す説明図、第9図
(a),(b)は第1図の画像の明るさ補正の方法を示
す説明図、第10図は本発明による文字認識装置の一実施
例を示す文字判別部の他の部分構成図、第11図は第10図
の誤認識を減少させる方法を示す説明図、第12図は第11
図の誤認識を減少させる方法を使用するさいのカラム数
を設定する画面を示す説明図、第13図は第1図の閾値と
結合係数の調整を文字認識装置以外の計算機を使用して
行う手順を示すフロー図、第14図は本発明による文字認
識装置が製造ラインで使用される場合の例を示すシステ
ム構成図、第15図は第14図の製品番号の読取り手順を示
すフロー図、第16図は本発明による文字認識装置の自動
認識モードのシーケンスを示すフロー図、第17図は同じ
く半自動認識モードのシーケンスを示すフロー図、第18
図は第17図の認識結果の表示画面を示す説明図、第19図
は本発明による文字認識装置の手動認識モードのシーケ
ンスを示すフロー図、第20図は本発明による文字認識装
置のティーチングモードの機能を示すブロック図、第21
図は第20図の調整実行の初期状態の選択画面を示す説明
図、第22図は本発明による文字認識装置のユーティリテ
ィモードの機能を示すブロック図、第23図は本発明によ
る文字認識装置が認識を行いながら閾値と結合係数の調
整を行う場合のタイムチャートを示す説明図、第24図
(a),(b)は同じくサンプル画像から位置ずれを生
じた画像および明るさの変動した画像を自動生成する方
法を示す説明図、第25図(a),(b),(c)は第1
図の入力ユニットの画像処理部の処理の例を示す説明
図、第26図は組合せ中間ユニットの説明図、第27図は組
合せ中間ユニットに対する組合せの設定の説明図、第28
図は文字認識装置に接続したワークステーションの処理
メニューの例を示す説明図、第29図は第28図のワークス
テーションの機能の説明図である。 1……文字判別部、2……画像メモリ、3……入力ユニ
ット群、4……中間ユニット群、5……結合係数格納
部、6……出力ユニット群、7……文字候補格納部、8
……文字認識管理部、9……パラメタ格納部、10……文
字認識装置、11……キーボード、12……モニタテレビ、
13……画像入出力回路、14……汎用入出力回路、15……
プログラムデータメモリ、16……画像処理プロセッサ、
17……ICカード、18……ICカードインタフェース、19…
…ティーチングボックス、20……CPU、21……ワークス
テーション、22……ローダコントローラ、23……TVカメ
ラ、25……ワーク、26……ローダ、27……モニタテレ
ビ、201,202,203……ウィンドウ領域、31,32,33……入
力ユニット、311,321,331……ウィンドウ位置データ格
納部、312,322,332……画像処理部、41,42,43……中間
ユニット、411,421,431……閾値格納部、412,422,432…
…中間ユニット演算部、61,62,63……出力ユニット、61
1,621,631……出力閾値格納部、612,622,632……出力ユ
ニット演算部、91……絶対判別閾値格納部、92……相対
判別閾値格納部、93……チェックカラム数格納部。
フロントページの続き (72)発明者 加藤 一雄 神奈川県秦野市堀山下1番地 株式会社 日立製作所神奈川工場内 (72)発明者 大野 充夫 神奈川県秦野市堀山下1番地 株式会社 日立製作所神奈川工場内 (72)発明者 藤森 茂 神奈川県秦野市堀山下1番地 株式会社 日立製作所神奈川工場内 (72)発明者 武市 謙三 栃木県下都賀郡大平町大字富田800番地 株式会社日立製作所栃木工場内 (72)発明者 久富 良一 栃木県下都賀郡大平町大字富田800番地 株式会社日立製作所栃木工場内 (72)発明者 根本 光造 栃木県下都賀郡大平町大字富田800番地 株式会社日立製作所栃木工場内 (56)参考文献 特開 昭62−166483(JP,A) 特開 昭63−36390(JP,A) 特開 昭63−37490(JP,A) 特開 平1−282692(JP,A) 特開 昭54−22728(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/66 G06K 9/68 G06F 15/70 G06F 9/28 JICSTファイル(JOIS)

Claims (18)

    (57)【特許請求の範囲】
  1. 【請求項1】文字画像に設定された複数のウィンドウ領
    域内の画像に対して処理を行い、その結果を出力する入
    力ユニット群と、入力ユニット群からの出力値に閾値を
    加えた値に対して演算を行う中間ユニット群と、中間ユ
    ニット群の各ユニットからの出力に結合係数をかけ、そ
    の総和に閾値を加えた値に対して演算を行う、文字の種
    類に対応した出力ユニット群より構成される文字判別部
    により文字の認識を行う文字認識装置であって、認識を
    行う文字ごとに前記各ウィンドウ領域の中に文字線が有
    か無かそのどちらともいえないかの3種類の指定を行う
    ことにより前記結合係数の初期設定を行う初期設定手段
    と、前記文字の認識を行った結果から前記閾値と前記結
    合係数のいずれか一方または両方を調整する調整手段と
    を備えたことを特徴とする文字認識装置。
  2. 【請求項2】前記ウィンドウ領域の位置と大きさを対話
    型で設定および変更でき、かつ前記ウィンドウ領域で行
    う画像処理の種類を設定および変更できるように構成さ
    れたことを特徴とする請求項1記載の文字認識装置。
  3. 【請求項3】前記ウィンドウ領域での画像処理において
    画像処理結果の値をウィンドウの大きさで正規化するこ
    とにより、ウィンドウの大きさに依存しない入力ユニッ
    トの出力値を得ることができるように構成されたことを
    特徴とする請求項2記載の文字認識装置。
  4. 【請求項4】複数文字よりなる文字列の認識をするさい
    に文字列のカラムごとに認識対象文字の種類を指定し、
    また文字列のカラムごとに閾値と再結合係数を別々に保
    持し、それを用いて文字認識をすることを特徴とする請
    求項1記載の文字認識装置。
  5. 【請求項5】文字認識装置から文字画像を他の計算機に
    転送し、そこで閾値と結合係数の調整を実行した後にそ
    の調整結果を再び文字認識装置に転送することが可能で
    あることを特徴とする請求項1記載の文字認識装置。
  6. 【請求項6】文字画像に設定された複数のウィンドウ領
    域内の画像に対して処理を行い、その結果を出力する入
    力ユニット群と、該入力ユニット群からの出力値に閾値
    を加えた値に対して演算を行う中間ユニット群と、該中
    間ユニット群の各ユニットからの出力に結合係数をかけ
    その総和に閾値を加えた値に対して演算を行う文字の種
    類に対応した出力ユニット群より構成される文字判別部
    により文字の認識を行う文字認識装置であって、認識動
    作モードとして前記文字認識装置以外の装置からの認識
    開始の指令で文字を認識して認識結果を他の装置に送信
    する自動認識モードと、前記文字認識装置以外の装置か
    らの認識開始の指令で文字を認識して文字の判別結果を
    表す出力ユニットの各出力値のうち最大の値があらかじ
    め設定された半自動判別閾値以下の場合にはユーザに認
    識結果の確認を求め誤っている時には対話型で前記認識
    結果を修正した後に該修正した認識結果を他の修正装置
    に送信する半自動認識モードと、認識開始の指令をキー
    ボードより入力して文字を認識し認識結果をモニタ画面
    に表示する手動認識モードとの3つのモードを有するこ
    とを特徴とする文字認識装置。
  7. 【請求項7】文字画像に設定された複数のウィンドウ領
    域内の画像に対して処理を行い、その結果を出力する入
    力ユニット手段と、該入力ユニット群からの出力値に閾
    値を加えた値に対して演算を行う中間ユニット群と、該
    中間ユニット群の各ユニットからの出力に結合係数をか
    け、その総和に閾値を加えた値に対して演算を行う、文
    字の種類に対応した出力ユニット群より構成される文字
    判別部により文字の認識を行う文字認識装置であって、
    該中間ユニット群の各中間ユニットに対して該各中間ユ
    ニットの出力の取り得る最大値からその中間ユニットの
    出力値を減算した値を出力する反転中間ユニットを設け
    たことを特徴とする文字認識装置。
  8. 【請求項8】前記中間ユニットと前記反転中間ユニット
    の結合係数から前記反転中間ユニットを取り除いた状態
    で前記反転中間ユニットを取り除かない状態と同様の結
    果を出力する結合係数を求め、文字の判別を行うさいに
    は前記反転ユニットを取り除いた状態で実行することを
    特徴とする請求項7記載の文字認識装置。
  9. 【請求項9】文字画像に設定された複数のウィンドウ領
    域内の画像に対して処理を行い、その結果を出力する入
    力ユニット群と、該入力ユニット群からの出力値に閾値
    を加えた値に対して演算を行う中間ユニット群と、該中
    間ユニット群の各ユニットからの出力に結合係数をかけ
    その総和に閾値を加えた値に対して演算を行う文字の種
    類に対応した出力ユニット群より構成される文字判別部
    により文字の認識を行う文字認識装置であって、1つの
    入力ユニットの出力値と、他の1つの入力ユニットの出
    力値あるいは他の複数の入力ユニットの出力値の平均値
    のいずれかを求め、これら2つの値を組み合わせて演算
    し、この演算結果を前記中間ユニットの入力値とするよ
    うに構成されたことを特徴とする文字認識装置。
  10. 【請求項10】前記入力ユニットの組合せについて、こ
    の組合わせを任意に設定あるいは変更が可能な機能を有
    することを特徴とする請求項9記載の文字認識装置。
  11. 【請求項11】前記ウィンドウ内領域での画像処理の種
    類として、前記ウィンドウ内での2次微分機能と、前記
    ウィンドウ内での二値化画像の白領域の面積あるいは黒
    領域の面積をカウントする画像処理機能を備えたことを
    特徴とする請求項2記載の文字認識装置。
  12. 【請求項12】認識対象文字の画像を取り込む画像取り
    込み手段と、該画像取り込み手段で取り込んだ画像を記
    憶する記憶手段と、該記憶手段に記憶した前記認識対象
    文字を画面上に表示する表示手段と、該表示手段上の画
    面上で複数のウィンドウを設定するウィンドウ設定手段
    と、該ウィンドウ設定手段で設定した複数のウィンドウ
    毎に前記認識対象文字の明るさ情報とエッジに関する情
    報とを抽出する情報抽出手段と、該該情報抽出手段で抽
    出した明るさ情報とエッジに関する情報とを重みを付け
    て組合わせる演算手段と、該演算手段で重みを付けて組
    み合わせた明るさ情報とエッジに関する情報とを用いて
    前記認識対象文字を認識する文字判別手段とを備えたこ
    とを特徴とする文字認識装置。
  13. 【請求項13】認識対象文字の画像を取り込む画像取り
    込み手段と、該画像取り込み手段で取り込んだ画像を記
    憶する記憶手段と、該記憶手段に記憶した前記認識対象
    文字の背景の明るさ情報と前記認識対象文字の明るさ情
    報とエッジに関する情報とを抽出する情報抽出手段と、
    該情報抽出手段で抽出した前記認識対象文字の明るさ情
    報とエッジに関する情報とを前記認識対象文字の背景の
    明るさ情報に基づいて補正する補正手段と、該補正手段
    で補正した前記認識対象文字の明るさ情報とエッジに関
    する情報とを用いて前記認識対象文字を認識する文字判
    別手段とを備えたことを特徴とする文字認識装置。
  14. 【請求項14】認識対象文字の画像を取り込んで記憶
    し、該記憶した認識対象文字を画面上に表示して複数の
    ウィンドウを設定し、該複数のウィンドウ毎に前記認識
    対象文字の明るさ情報とエッジに関する情報とを抽出
    し、該抽出した明るさ情報とエッジに関する情報とを重
    み付けて組合わせ、該重みを付けて組み合わせた明るさ
    情報とエッジに関する情報とを用いて前記認識対象文字
    を認識することを特徴とする文字認識方法。
  15. 【請求項15】前記画面上に表示した認識対象文字のウ
    ィンドウの設定を、前記画面上に表示したカーソルによ
    り行うことを特徴とする請求項14記載の文字認識方法。
  16. 【請求項16】認識対象文字の画像を取り込んで記憶
    し、該記憶した認識対象文字の背景の明るさ情報と前記
    認識対象文字の明るさ情報とエッジに関する情報とを抽
    出し、該抽出した認識対象文字の明るさ情報とエッジに
    関する情報とを前記背景の明るさ情報に基づいて補正
    し、該補正した認識対象文字の明るさ情報とエッジに関
    する情報とを用いて前記認識対象文字を認識することを
    特徴とする文字認識方法。
  17. 【請求項17】前記認識対象文字のエッジ情報が、該認
    識対象文字の画像データを微分してえた情報であること
    を特徴とする請求項14または16に記載の文字認識方法。
  18. 【請求項18】前記認識対象文字を認識することが不可
    能な場合には、認識不可の情報を出力することを特徴と
    する請求項14または16に記載の文字認識方法。
JP02110045A 1989-04-28 1990-04-27 文字認識方法及びその装置 Expired - Lifetime JP3039954B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1-107844 1989-04-28
JP10784489 1989-04-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP11077222A Division JPH11316799A (ja) 1989-04-28 1999-03-23 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0373084A JPH0373084A (ja) 1991-03-28
JP3039954B2 true JP3039954B2 (ja) 2000-05-08

Family

ID=14469495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02110045A Expired - Lifetime JP3039954B2 (ja) 1989-04-28 1990-04-27 文字認識方法及びその装置

Country Status (4)

Country Link
US (1) US5144683A (ja)
EP (1) EP0395068B1 (ja)
JP (1) JP3039954B2 (ja)
DE (1) DE69028337T2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69331518T2 (de) * 1993-02-19 2002-09-12 Ibm Neuronales Netz zum Vergleich von Merkmalen von Bildmustern
US5553168A (en) * 1994-01-21 1996-09-03 Texas Instruments Incorporated System and method for recognizing visual indicia
US5917942A (en) * 1995-12-28 1999-06-29 Motorla, Inc. Device and method for handwriting recognition with adaptive weighting of recognition data
US6292582B1 (en) 1996-05-31 2001-09-18 Lin Youling Method and system for identifying defects in a semiconductor
US6205239B1 (en) 1996-05-31 2001-03-20 Texas Instruments Incorporated System and method for circuit repair
US6091846A (en) * 1996-05-31 2000-07-18 Texas Instruments Incorporated Method and system for anomaly detection
US6246787B1 (en) 1996-05-31 2001-06-12 Texas Instruments Incorporated System and method for knowledgebase generation and management
US6208772B1 (en) * 1997-10-17 2001-03-27 Acuity Imaging, Llc Data processing system for logically adjacent data samples such as image data in a machine vision system
US6768560B1 (en) * 2000-05-19 2004-07-27 Xerox Corporation Assist channel coding with vertical block error correction
JP2002032751A (ja) * 2000-07-18 2002-01-31 Olympus Optical Co Ltd 学習型画像分類装置及び方法並びにその処理プログラムを記録した記録媒体
US6950555B2 (en) * 2001-02-16 2005-09-27 Parascript Llc Holistic-analytical recognition of handwritten text
US20020180752A1 (en) * 2001-04-02 2002-12-05 Pelco Device and method for displaying variable brightness characters
JP4241074B2 (ja) * 2003-02-12 2009-03-18 富士ゼロックス株式会社 画像探索装置
US20040169684A1 (en) * 2003-02-28 2004-09-02 Dave Orth Linking images for navigation
KR100584344B1 (ko) * 2003-06-10 2006-05-26 삼성전자주식회사 영상입력부를 가진 휴대용 단말기에서 문자를 인식하는 방법
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
US20080021831A1 (en) * 2006-07-19 2008-01-24 Andrew Blaikie Methods of processing a check in a payee positive pay system
JP4732391B2 (ja) * 2007-03-26 2011-07-27 三菱電機株式会社 投写型表示装置
CN109871521A (zh) * 2019-01-08 2019-06-11 平安科技(深圳)有限公司 一种电子文档的生成方法及设备
CN113505794B (zh) * 2021-07-13 2023-06-23 树蛙信息科技(南京)有限公司 文本识别方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH591726A5 (ja) * 1973-07-30 1977-09-30 Nederlanden Staat
JPS5952473B2 (ja) * 1977-07-21 1984-12-19 日本電気株式会社 可変文字セツトの読取に適した文字認識方式
US4566126A (en) * 1982-04-30 1986-01-21 Fuji Electric Company, Ltd. Pattern discriminator
FR2553013B1 (fr) * 1983-10-10 1986-09-05 Cegedur Procede et dispositif pour la realisation de bandes metalliques renforcees
US4783838A (en) * 1984-12-26 1988-11-08 Konishiroku Photo Industry Co., Ltd. Image processing method and apparatus therefor
DE3617774C2 (de) * 1985-05-27 1994-04-21 Fuji Electric Co Ltd Vorrichtung zur Verarbeitung serieller Daten
JPS62166483A (ja) * 1986-01-20 1987-07-22 Ricoh Co Ltd 文字認識装置の認識文字選択方法
JPH0715703B2 (ja) * 1986-05-16 1995-02-22 富士電機株式会社 文字読取方式
US4903313A (en) * 1986-07-03 1990-02-20 Ricoh Company, Ltd. Character recognition method
JPS6336390A (ja) * 1986-07-31 1988-02-17 Toshiba Corp チエツクデジツト処理方式
JPS6337490A (ja) * 1986-08-01 1988-02-18 Matsushita Electric Ind Co Ltd 文字認識装置
CA1318977C (en) * 1987-07-22 1993-06-08 Kazuhito Hori Image recognition system
JPH0664631B2 (ja) * 1987-09-09 1994-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字認識装置

Also Published As

Publication number Publication date
EP0395068A2 (en) 1990-10-31
US5144683A (en) 1992-09-01
DE69028337D1 (de) 1996-10-10
EP0395068B1 (en) 1996-09-04
DE69028337T2 (de) 1997-01-09
EP0395068A3 (en) 1992-09-02
JPH0373084A (ja) 1991-03-28

Similar Documents

Publication Publication Date Title
JP3039954B2 (ja) 文字認識方法及びその装置
CN110274908B (zh) 缺陷检查装置、缺陷检查方法以及计算机可读记录介质
US6385338B1 (en) Image processing method and apparatus
CN112567229A (zh) 缺陷检查装置、缺陷检查方法及其程序
EP0063454A2 (en) Method for recognizing machine encoded characters
US20150262030A1 (en) Image processing device, image processing method, and image processing program
US8358875B2 (en) Image display device, image display method, and computer readable medium
CN111461070B (zh) 文本识别方法、装置、电子设备及存储介质
US9710945B2 (en) Method for cutting out character, character recognition apparatus using this method, and program
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
US5271067A (en) Optical character recognition apparatus
CN111046770A (zh) 一种照片档案人物自动标注方法
JPH11306325A (ja) 対象物検出装置及び対象物検出方法
CN116432160A (zh) 基于rpa和lbp特征的滑块验证码识别方法及系统
JPH11316799A (ja) 文字認識装置
CN113792739B (zh) 一种通用型车牌文本识别方法
CN114926829A (zh) 一种证件检测方法、装置、电子设备及存储介质
CN114140620A (zh) 一种物体直线轮廓检测方法
JPH064669A (ja) 濃淡画像のパターンマッチング装置
JPH07271916A (ja) 学習パターン生成装置及びこれを用いた文字認識装置
CN111242047A (zh) 图像处理方法和装置、电子设备及计算机可读存储介质
JPH08122267A (ja) マーク認識装置およびマーク認識方法
CN117456542B (zh) 图像匹配方法、装置、电子设备及存储介质
CN111401246B (zh) 一种烟雾浓度检测方法、装置、设备及存储介质
CN109117844B (zh) 一种密码确定方法和装置