JPH0373084A - 文字認識方法及びその装置 - Google Patents

文字認識方法及びその装置

Info

Publication number
JPH0373084A
JPH0373084A JP2110045A JP11004590A JPH0373084A JP H0373084 A JPH0373084 A JP H0373084A JP 2110045 A JP2110045 A JP 2110045A JP 11004590 A JP11004590 A JP 11004590A JP H0373084 A JPH0373084 A JP H0373084A
Authority
JP
Japan
Prior art keywords
character
value
recognition device
character recognition
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2110045A
Other languages
English (en)
Other versions
JP3039954B2 (ja
Inventor
Hideaki Suzuki
英明 鈴木
Yoshie Matsuzaki
松崎 吉衛
Mitsunobu Isobe
磯部 光庸
Kazuo Kato
一雄 加藤
Mitsuo Ono
大野 充夫
Shigeru Fujimori
茂 藤森
Kenzo Takechi
武市 謙三
Ryoichi Hisatomi
久富 良一
Mitsuzo Nemoto
根本 光造
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPH0373084A publication Critical patent/JPH0373084A/ja
Application granted granted Critical
Publication of JP3039954B2 publication Critical patent/JP3039954B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像処理を用いた捺印や印刷や刻印文字など
の文字認識装置に係り、特に文字と背景のコントラスト
が悪く印字品質に変動を生じる文字の認識に好適な文字
の認識装置に関する。
〔従来の技術〕
従来の大字認識装置は、例えば特開昭61−25548
8号公報に記載のように文字パターンを複数個に分割し
、その分割単位ごとに類似度を比較照合して認識判定を
行うといったパターンマツチング法の応用によるもので
ある。この方法は2値画像を用いた認識アルゴリズムで
あり、文字線に切れやかすれといった変化を生じる場合
には、この変動をアルゴリズムによって吸収するために
処理が複雑になり認識時間も増大する。例えば文字の印
字品質が変化する場合には2値化閾値も固定閾値では対
応できなくなる。またこれらの認識アルゴリズムは抽出
した特徴を判定本にしたがって分類することで行われる
が、最適な判定を得るためのこの特徴の組合せ方は実験
により試行m誤的に行われていた。
〔発明が解決しようとする課題〕
上記従来技術はパターンマツチング法の応用によるもの
であり、2値画像を用いた認識アルゴリズムのため、印
字品質のよい紙などの文字認識には良好な結果が得られ
るが、認識したい文字のコントラストが悪く2値化をす
ると切れやかすれを生じる場合には判別が難しく、その
認識アルゴリズムは複雑となって認識時間が増大すると
共に誤認識率が高くなるという問題があった。
本発明の目的は工業部品に印字された文字などのように
コントラストが悪く印字濃度に変化を生じるものに対し
て、安定して高い精度で認識することができ、また字体
の変動に対しても自動的に適応できるような文字認識方
法を提供することにある。。
〔課題を解決するための手段〕
上記の目的を達成するために、本発明の文字認識装置は
文字画像に設定された複数のウィンドウ領域内の画像に
対して処理を行い結果を出力する入力ユニット群と、そ
こからの出力値に閾値を加えた値に対して演算を行う中
間ユニット群と、そこからの出力値に結合係数をかけそ
の総和に閾値を加えた値に対して演算を行う出力ユニッ
ト群より構成される文字判別部をもち、閾値と結合係数
を実物画像から自動調整できるようにしたものである。
また複数文字よりなる文字列の認識をするさいには、文
字列のカラムごとに認識対象文字の種類を指定し、また
文字列のカラムごとに閾値と結合係数を別々に保持し、
それを用いて文字認識を行うようにしたものである。
〔作用〕
上記文字認識装置は文字の特徴抽出を精度よく行い特徴
間の組合せを最適化するために多数の特徴の重みの付は
方を実際のサンプル文字から自動的に調整できる機構を
実現しており、文字の特徴としては文字領域に適切に設
けた複数個の各ウィンドウにおいて文字線の明るさ情報
のみでなく原画像の微分画像より検出したエツジ情報の
2種類を用いることにより、コントラストの悪い印字文
字に対しても高い信頼性をもって安定した特徴抽出を可
能とし、特徴の組合せ方を決定する方法としては実際の
サンプル画像を利用して自動調整することにより、安定
した認識を行うことが可能となる。
〔実施例〕
以下に本発明の実施例を第1図から第24図により説明
する。
第1図は本発明による文字認識装置の一実施例を示す文
字判別部の一構成図である。第1図において、認識対象
の文字画像はTVカメラ23(第2図)により文字判別
部1の画像メモリ2に取り込まれる。入力ユニット群3
には各々の入力ユニット31.32.33.・・・ごと
にウィンドウ位置データを格納するウィンドウ位置デー
タ格納部311.321゜331、・・・と、画像処理
部312.322.323.・・・とがあり、画像メモ
リ2上における各々のウィンドウ領域201.202.
203.・・・に対して画像処理を行い処理結果を出力
し、この処理結果の値は中間ユニット群4に送られる。
中間ユニット群4の各々の中間ユニット41.42.4
3.・・・には閾値を格納する閾値格納部411.42
1.431.・・・と、中間ユニット演0ff8412
.422.432.−、:がアリ、各入力ユニットから
の出力値に閾値を加えた値に対して演算を行ない演算結
果を出力する。この中間ユニット群4の各ユニットの出
力値は結合係数格納部5に格納されている結合係数がか
けられ、その値が出力ユニット群6に送られる。出方ユ
ニット群6には文字の種類に対応した出力ユニット61
.62゜63、・・・があり、各々の出力ユニットには
閾値を格納する出力閾値格納部611.621.631
.・・・と、出力ユニット演算部612.622.63
2.・・・とがあり、各中間ユニットからの出力値に結
合係数をかけた値の総和に閾値を加えた値に対して演算
を行い、?iL算結果を出力する。
第2図は第1図の文字認識装置のハードウェア構成図で
ある。第2図において、文字認識装置1゜はTVカメラ
23からの信号を入力して画像メモリ2へ格納すると共
にモニタテレビ12への出力を行う画像入出力回路13
と、ワークステーションなどの文字認識装置以外の装置
との外部信号の入出力を行うための汎用入出力@fi4
14と、プログラムやデータを格納しておくプログラム
データメモリ15と、画像処理を行う画像処理プロセッ
サ16と、各種データの保存に用いるICカード17と
接続するためのICカードインタフェース18と、ティ
ーチングなどの手動操作のためのティーチングボックス
19と、上記の動作全体を制御するCPU20とから構
成される。ここで文字判別部1(第1図)は画像メモリ
2と、プログラムデータメモリ15と、画像処理プロセ
ッサ16と、CPU20とで実現される。すなわち入力
ユニットのウィンドウ位置データ格納部311.321
.331と、中間ユニットの閾値格納部411.、42
1.431と、結合係数格納部5と、出力ユニットの出
力閾値格納部311.621.631とはプログラムデ
ータメモリ15の中にある。画像処理部312.322
.332は画像処理プロセッサ16およびCPU20で
実現され、中間ユニット演算部412、422.432
と出力ユニット演算部612.622゜632とはCP
U20で実現される。
つぎに文字判別部1が文字を判別する手順を説明する。
第工図は文字LL 2 I+が画像メモリ2に入力され
ており、各入力ユニットのウィンドウ位置データ格納部
311.321などにはウィンドウ位置が格納されてお
り、また画像処理の種類も指定されている場合を示して
いる。したがって入力ユニット31はウィンドウ領域3
(H内の画像に対して画像処理の種類として右方向から
の微分が指定されていればその微分処理を行い結果を出
力する。同様に入力ユニット32はウィンドウ領域20
2内の画像に対して画像処理の種類として右方からの微
分が指定されていればその微分処理を行い結果を出力す
る。この画像処理の種類としては右方からの微分と、左
方からの微分と、上方からの微分と、下方からの微分と
、濃度合計などがある。この処理の方法は例えば左方か
らの微分の場合には第3図のようになる。
第3図(a)、(b)、(c)は第1図の入力ユニット
の画像処理部312などの左方からの微分処理の例を示
す説明図である。第3図(a)は縦方向の文字線上にき
られたウィンドウの例であり、この図において斜線部分
は文字線を表す。第3図(b)は今このウィンドウ内で
X方向に左方から微分した時のX方向の★印のついたラ
インについての微分値を表したものである。第3図(c
)はこの微分値I+ 1“、“′2′”  11311
.′4″の総和を求めたものであり、人カニニットの出
力値である。この第3図(c)にあるようにウィンドウ
内においてこのように微分値を微分方向に加え合わせた
値をラインごとに求め、その平均値をそのウィンドウの
出力とする。また画像処理の種類が濃度合計のウィンド
ウについては、ウィンドウ内の全画素の濃度を合計しそ
れを画素数で割って平均を求めこの平均値をウィンドウ
の出力とする。またウィンドウ領域での画像処理におい
て、画像処理結果の値をウィンドウの大きさで正規化す
ることにより。
ウィンドウの大きさに依存しない入力ユニットの出力値
を得ることができる。
この入力ユニット31.32.33の出力値は各々1つ
の中間ユニット41.42.43に格納されており、そ
の中間ユニットはこの入力ユニットの出力値に閾値格納
部411.421.431に格納されている閾値を加え
た値2に対し、次式のシグモイド関数で与られる出力y
を中間ユニット演算部412.422゜432で求める
。但しTは定数である。
y =1/ (1+e   )      (1)この
各中間ユニット41.42.43の出力値に対しては各
出力ユニット61.62.63ごとに結合係数格納部5
に結合係数が格納されており、各出力ユニットlよ次の
式(2)の中間ユニット出力値yl、jに結合係数wl
、に、jをかけた値を合計し、この値z2.kに出力閾
値格納部611,621.631に格納されている出力
閾値を加えた値Xに対して次の式(3)の出力具も井戸
関数で与えられる出力Okを出力ユニット演算部612
.622.623で求める。但しT。は定数である。
rl ok=1/ (1+e    )          
(3)各出力ユニットは文字の種類に対応して存在し、
最大の出力値をとった出力ユニットに対応する文字を判
別結果とする。
次に、文字の認識結果を用いて中間ユニット41゜42
、43と出力ユニット61.62.63の閾値および結
合係数格納部5の結合係数を調整する手段を説明する。
第4図は、第1図の中間ユニットと出力ユニットの閾値
および結合係数の調整する手順を示す説明図である。第
4図における反転中間ユニットの出力値は式(6)によ
り計算される。第4図に示すように閾値及び結合係数の
調整は、各出力ユニットにそれぞれ教師信号を与えるこ
とにより。
中間ユニット群4の中間ユニットと出力ユニット群6の
出力ユニットとの間の結合係数wl、k。
jを修正し、次に入力ユニット群3の入力ユニットと中
間ユニット群4の中間ユニットとの間の閾値wo、jを
修正する。教師信号は各出力ユニットの出力の最大値で
あり、正解の文字に対応する出力ユニットには1を与え
、他の出力ユニットにはOを与える。第4図は、数字2
について閾値および結合係数を調整する場合の例を示し
ている。
正解は数字2であるので教師信号は数字2に対応する出
力ユニットには1を与え、他の出力ユニットには0を与
える。この修正は、各出力ユニットと対応する教師信号
との差を求め、調整信号ΔW○、jおよびΔW1+に+
 jを生成する次式に示すようなパックプロパゲーショ
ン法として知られる方法などで行なうことができる。但
しEk。
Ckは定数である。
Δtgl、に、j”Bk・(tk−ok)’f’ (z
2yk)・yLj    (4)Δ−0.j=ck−W
1.j、k(tk−ok)・f’ (z2.k)・f’
 (zLj)(5)上記の中間ユニットと出力ユニット
の閾値および結合係数の調整において、調整に必要な試
行回数は結合係数の初期値が調整結果に近いか否かに依
存する。本文字認識装置10はこの結合係数の初期値を
ユーザが判断して設定することができる。第5図は第4
図の結合係数の初期値をユーザが判断して設定する画面
を示す説明図である。これは文字の種類と入力ユニット
の種類を縦横にもつ表面画である。この表面画において
、ユーザは文字ごとに各入力ユニットのウィンドウ領域
に文字線が有る場合にはOを設定し、無い場合には×を
設定する。文字線の有無がはっきりしない場合にはOも
Xも設定しない。ユーザがこのような設定を行なうと、
文字認識装置!!ioは結合係数の初期値として、○と
指定された文字に対応する出力ユニットと入力ユニット
に接続された中間ユニットの結合係数を“+1”に、X
と指定されたものを“−1”に、0も×も設定されなか
ったものをII OIIにそれぞれ初期設定する。この
ようにすると、ランダムに結合係数を決めた場合より、
調整の試行回数を減らすことができる。
次に入力ユニット31.32.33のウィンドウ領域2
0]、、 202.203の位置および大きさを設定す
る方法を説明する5ウインドウ領域の位置は文字領域を
仮定しその外枠の原点を基準として表す。このため先ず
文字の外枠を指定し、つぎにウィンドウ領域を指定する
。文字の外枠および各ウィンドウ領域には番号が付けら
れ、この番号を指定して設定を開始する。第6図は第1
図の入力ユニットのウィンドウ領域の位置および大きさ
を設定する画面を示す説明図である。また第7図は第6
図の操作に用いるキーボード11の例を示す上面図であ
る。ここで文字の外枠の番号は0”と決められており、
各ウィンドウ領域の番号は1.・・・9.A。
・・2まで付けられる。この画面では常に生画像が表示
されるのでHDしようとする文字を見ながらウィンドウ
領域を設定することができる。ウィンドウ領域の番号指
定は番号列が画面の下に並んでいるので、キーボード1
1の左右カーソルキーで指定しようとする番号の所にカ
ーソルを移動し、SETキーを押すことで行う。始めに
文字の外枠を設定する。ここで文字外枠の移動は文字外
枠すなわち110”番を選択した状態でカーソルキーに
より上下左右に移動できるので、適切な位置に合わせて
文字外枠の位置を設定する。ウィンドウ領域の設定はこ
の状態でウィンドウ領域の番号をカーソルにより選択す
ることで行う。また文字外枠のサイズを設定および変更
する場合には1文字外枠を選択した状態で十字カーソル
が表示されるので、まず文字外枠の左上の点を設定し、
つぎに右下の点を決める。ここで文字外枠の右下の点を
動かしている時には、カーソルのX、Y位置を文字外枠
の左上を原点とする座標で表した値が表示されるので精
密な位置設定が可能である。つぎに各ウィンドウ領域の
設定はウィンドウ領域の番号を指定して始める。このウ
ィンドウ領域の場所の設定は画面にカーソルが表示され
るので、カーソルキーでカーソルを動かしながら位置を
指定する。このときカーソルのX、Y位置を文字外枠の
左上を原点とする座標で表した値が表示されるので精密
な位置設定が可能である。ウィンドウ領域は平行4辺形
で表せるので、位置の指定は左上と、左下と。
右下の順に3点を指定する。この平行4辺形の1組の辺
は必ず水平もしくは垂直でなければならない。この条件
に合わないとエラーとなって再びウィンドウ領域を指定
する状態になる。
上記のウィンドウ領域の位置および大きさを設定したら
、つぎにウィンドウ領域201.202,203におい
て入力ユニットの画像処理部312.322,332が
行う画像処理の種類を設定する。第8図は第1図の画像
処理部の画像処理の種類を設定する画面を示す説明図で
ある。この設定は第8図に示すようなメニュー画面にお
いて画像処理の種類を選択することにより行う。この例
では縦方向の文字線の左方からの微分と、右方からの微
分と、横方向の文字線の上方からの微分と、下方からの
微分と、全体の濃度合計の5種類が選択できる。この選
択結果は入力ユニット31.32.33の画像処理部3
12゜322、332に格納され1文字認識のさい選択
された画像処理が行われる。ここでの微分処理は画像の
明るさが均一でない場合やコントラストが悪い場合に有
効である。
つぎに画像の明るさ補正を第9図(a)、(b)により
説明する。第9図(a)、(b)は第1図の画像の明る
さ補正の方法を示す説明図である。一般に同じサンプル
に対して照明の明るさが異なると、画像の濃度および画
像の微分値は変化する。文字認識装置10はこの照明変
動の影響を除くため、入力ユニット31.32.33に
おいて第9図(、)に示す関係式により明るさ補正を行
う。この処理はさきに第4図の中間ユニットと出力ユニ
ットの閾値および結合係数を調整する時に用いた文字の
画像に対して背景の濃度値と文字線の濃度値を保存して
おき、この値を用いて認識時の画像のa度値および画像
の微分値を補正する。第9図(b)は第9図(、)によ
る明るさ補正方法の有効な理由となる実験結果を示す関
係図である。これは照明の明るさを変化させた同一の文
字について、背景の濃度値(明るさ)と、背景と文字線
の濃度値(コントラスト)との関係を調べたものである
。この結果は両者がほぼ比例関係にあるので、認識時の
画像の濃度および画像の微分値を第9図(a)の関係式
により補正すれば、調整時の照明条件における画像の濃
度および画像の微分値を推定した補正ができる。
つぎに複数文字よりなる文字列の認識をする場合に′L
1!P識率を向上させる方法を第10図により説明する
。第■0図は本発明による文字認識装置の一実施例を示
す文字判別部の他の部分構成図である。
第10図において、この文字認識装置10の文字判定部
1は第1図に示した基本要素に加え、文字候補格納部7
と、文字認識管理部8と、パラメタ格納部9とを備える
。またパラメタ格納部9の中には絶対判別閾値格納部9
1と、相対判別閾値格納部92と、チェックカラム数格
納部93とを備える。この文字候補格納部7と、パラメ
タ格納部9は第2図のプログラムデータメモリ15の中
にある。文字認識管理部8はCPU20で実現される。
いま複数文字列よりなる文字列の認識をする場合に、製
品番号などでは各カラムごとに取り得る文字が限定でき
ることがある。例えば最初の文字(第1カラムの文字)
が年を示すとすれば、年が変らない限り同一の文字にな
るし、数年間の範囲を考えても取り得る文字の種類は数
種類である。この場合にカラムごとに取り得る文字候補
を指定すると、上記構成の文学誌m装置1tloの文字
判定部1の文字候補格納部7に格納しておく。文字認識
管理部8はこの方ラムごとに文字候補格納部7に格納さ
れている文字候補を調べ、そこに指定されている文字候
補に対応する出力ユニット61.62.63についてだ
け演算を行う。そして演算した出力ユニットの中で最大
の値をとった出力ユニットに対応する文字であるとする
。このようにすると例えば゛′工″と1”のように類似
した文字がある場合でも、そのカラムは数字しか取り得
ないことが指定されていれば間違わずに“1”と判別で
きる。なお文字候補が指定されていないカラムは、英数
宇金てを文字候補とするといった約束を決めておけば、
文字候補の指定が繁雑だと思うユーザはこの指定を省略
することができる。
つぎに複数文字よりなる文字列の認識をする場合の認識
率を向上させるための結合係数の持ち方について説明す
る。複数文字列よりなる例えば製品番号などでは各カラ
ムごとに取り得る文字が限定できることがある。このた
め第1θ図で説明したのは、カラムごとにそのカラムの
とりうる文字の候補を第10図の文字候補格納部7に格
納しておき、格納されている文字候補についてのみ認識
判定の処理計算を実行する方式である。このための結合
係数の方式として2つの方式が考えられる。1つは文字
候補に応じたカラムごとに異なる閾値と結合係数であり
、他の1つはすべてのカラム共通の閾値と結合係数であ
る。まずはじめに文字候補に応したカラムごとに異なる
閾値と結合係数を用いる方式に関して、そのin’、i
方法とその効果について説明する。各カラムに対する使
用する文字の種類は第10図の文字候補格納部7に格納
されている。
この特番カラムの使用文字の種類が少なければそのカラ
ムの認識率は向上する。カラムには使用文字種類が例え
ば年を表すカラムのように2〜3種類で十分であるカラ
ムもあり、また全文字を対象とするカラムもある。そこ
で閾値と結合係数の調整のさいに:A整を行うカラム番
号を指定し、この方ラムの使用文字候補を文字候補格納
部7から参照して格納されている文字候補に関してのみ
調整を行うようにすれば、使用文字候補が異なるカラム
に対して最適な閾値および結合係数を得ることができる
。この結果認識率は向上し、誤認2率は下がり認識精度
を大幅に向上させることができる。
また、例えば文字候補格納部7に格納されている使用文
字候補が1〜2種類というように少ない場合には、その
文字に対する確信度の値を調べることで文字の印字品質
を検査することができる。つぎにすべてのカラム対して
共通の閾値と結合係数を用いる方式に関して、その調整
方法とその効果について説明する。上記のカラムごとに
最適化を図った閾値および結合係数を用いた場合には認
識精度は大幅に向上するが、使用文字候補の異なるカラ
ムごとに閾値と結合係数を調整しないでもよい場合があ
る。この場合にはすべてのカラムに対して共通の閾値お
よび結合係数を用いて文字判定部1が全文字の確信度を
計算し、その結果から文字候補格納部7に格納されてい
る使用文字候補のみ認識判定の対象にする。すなわち文
字候補格納部7に格納されている使用文字候補に対応す
る出力ユニットの確信度の値のみ参照して1文字の判定
を行う。この方式では閾値および結合係数の記憶量を減
らすことができ、また調整実行が高速に行えるという効
果がある。
つぎに文字認識ができたか否かを返す方法を説明する。
本文字認識装置10は入力された文字が最大の値をとっ
た出力ユニットに対応する文字であると認識する。ここ
で出力ユニットの値はその文字であるとみなす確信度を
示すので、たとえ最大の値をとっていても値が小さい場
合にはその認識が誤りである可能性がある。そこでユー
ザは絶対判別閾値を設定し、出力ユニットの最大値がそ
れ以下であった場合には認識不可という結果を出力させ
ることができる。この機能を実現するため本文字認識装
置10は第10図のパラメタ格納部9の中に備えた絶対
判別閾値格納部91にユーザの指定した絶対判別閾値を
格納しておき、出力ユニットの演算が終了した後に文字
認識管理部8が出力ユニットの最大値がこの絶対判別閾
値以上であるかを確認し、これ以下の場合には認識不可
という結果を出力する。また出力ユニットの最大値と2
番目の値が近い場合には、その文字が最大値と2番目の
値の出力ユニットのどちらに対応する文字か判別するの
が難しい。このためユーザは相対判別閾値を設定し、出
力ユニットの最大値が絶対判別閾値をこえている場合で
も、出力ユニットの最大値と2番目の値の差が相対判別
閾値以下であった場合には認識不可という結果を出力さ
せることができる。この機能を実現させるため本文字認
識装置は第10図のパラメタ格納部9の中に備えた相対
判別閾値格納部92にユーザの指定した相対判別閾値を
格納しておき、出力ユニットの)寅算が終了した後に文
字認識管理部8が出力ユニットの最大値と2番目の値の
差を求め、その値がこの相対判別閾値以上であるかを確
認し、これ以下の場合には認識不可という結果を出力す
る。
つぎにあらかじめ文字数の決まっている文字列を認識す
る場合に誤認識を減少させるサムチェックと呼ぶ方法を
説明する。第11図は第10図の文字認識装置IOの文
字判別部1の誤認識を減少させる方法を示す説明図であ
る。このサムチェックと呼ぶ方法(よ第11図のように
7カラムで構成される番号があった場合に、第1カラム
から第7カラムまでの7つの数字の和を求め、その下1
桁を第8カラムにチェックデジットとして印字し、文字
認識装置は8カラムの番号として認識して認識結果を照
合する方法である。この第11図の場合には製品番号が
“↓234567 ”であり、この和を求めると28と
なるので、第8カラムには8が印字され、文字認識装置
は” 12345678 ”といった製品番号として認
識する。このように番号を認識した後に、文字認識装置
で第エカラムから第7カラムまでの値を加算し、その下
1桁が第8カラムの値に一致しているかチェックしその
整合性を判定する。このサムチェックは後の第16図お
よび第17図に示すように各文字の認識がすべて終了し
た後に行われる。
上記のようなサムチェックは行う場合と行わない場合が
あり、また行う場合もチェックに使うカラム数は一定で
はない。そこで第12図に示すようなメニュー画面を用
いてユーザはこのカラム数を入力する。第12図は第1
1図の文字認識装置の文字鑑別部の誤認識を減少させる
サムチェックの方法を使用するさいのカラム数を設定す
る画面を示す説明図である。ここでユーザが入力するカ
ラム数が、′O”はチェックしないこと意味し、41″
は最後の1文字をチェックに使うことを意味する。
ここで指定されたチェックカラム数は第10図のパラメ
タ格納部9の中に備えるチェックカラム数格納部93に
格納され、文字認識管理部8が全文字の認識が終了した
後にここからチェックカラム数を取り出しチェックする
つぎに中間ユニット41.42.43と出力ユニット、
61、62.63の閾値および結合係数格納部5の結合
係数の調整を文字′Ly!P:JA装置10以外の計算
機を使用して行う方法を説明する。この閾値と結合係数
の調整は処理時間がかかるので文字認識装置本体でなく
処理能力の高い計算機でやる方がよい場合がある。第1
3図は第1図の中間ユニットと出力ユニットの閾値と結
合係数の調整を文字認識装置以外の計算機を使用して行
う手順を示すフロー図である。この計算機上には先に第
4図で説明した閾値と結合係数の調整を行うプログラム
および第10図のパラメタ格納部9に格納されている文
字数などの表示データや画像データをアップロードした
り、閾値と結合係数の、l整結果をダウンロードするプ
ログラムがあり、これらのプログラムにより閾値と結合
係数の!I!l整を実行する。この他の計算機を用いた
調整はまず文字認識装置10から第10図のパラメタ格
納部9に格納されている教示データおよび文字画像デー
タを計算機にアップロードする(ステップ131)。つ
ぎにその教示データおよび文字画像データを用いて閾値
と結合係数を調整する。
ここで文字数やカラムごとの文字候補等のパラメタが教
示データとしてアップロードされているので、これに合
わせて最適な閾値と結合係数の調整計算が行われる(ス
テップ132)。最後にこの調整結果を文字認識装置1
0にダウンロードすることで終了する。ここで計算機に
は複数の調整結果のデータをファイルとして保存できる
ので、場合に応じて適切な認識データをダウンロードす
ることができる(ステップ133)。
つぎに本文字認識装置10が実行される動作モードを説
明する。第14図は本発明による文字認識装置10が製
造ラインで他の機器と共に使用される場合の例、を示す
システム構成図である。第1図において、このシステム
は本文字認識装置10と、ワークステーション21と、
ローダコントローラ22と、TVカメラ23と、照明光
源24と、ワーク25と、ローダ26と、モニタテレビ
27とを備え、ワーク25の表面に印字された製品番号
の認識を本文字認識装置10に接続されたワークステー
ション21からの認識開始の指令で行うものである。こ
の認識対象の文字は金属表面上の刻印文字とかセラミッ
ク表面へのレーザマーキング文字などのように、文字線
に切れやかすれを生じやすい印字品質の非常に悪い文字
である。また製品番号にはその先頭および最後尾に位置
切出し用のマーカが印字されているとする。
第15図は第14図の文字認識装置10の内部でのワー
ク25の製品番号の読取り手順を示すフロー図である。
この製品番号の読取のフローは認識の動作モードが手動
認識と、半自動認識と、自動認識のいずれのモードであ
っても共通である。この処理プログラムは第2図のプロ
グラムデータメモリ15に格納しである。まず第2図の
汎用入出力回路14を介して認識開始命令を外部のワー
クステーション21より受けたのち、画像入出力回路1
3を用いてすでにTVカメラ23の視野内にあるワーク
25の表面に印字された製品番号の画像を撮像して画像
メモリ2に取り込む(ステップ151) 、ついでマー
カ位置を検出してから文字位置を検出して1文字ごとに
認識を行う。このマーカ位置の検出は2つのマーカの周
囲にそれぞれウィンドウ設定し、このウィンドウ内にお
ける濃度の投影分布の中心位置を求めることにより行う
(ステップ152)。つぎにマーカの位置が検出された
らこのマーカ間の距離を計算する。このマーカ間の距離
があらかじめわかっているので、この計算結果と比較す
ることでマーカが正確に検出できたかどうかが判定でき
る。
すなわちこの距離が規定値と大きく異なる場合には、マ
ーカが正確に検出できなかったと判定して文字認識を中
断する。またマーカの位置が正しく検出できた場合には
、マーカの位置と文字位置との相対関係から1文字を切
り出す。この相対関係は文字のピッチと2文字の位置と
マーカの位置との関係を、ティーチング時に実物を用い
て教示される(ステップ153)。ついで切り出した1
文字ごとに判定処理を行い(ステップ154)、文字候
補を決定する(ステップ155)。最後に全文字終了し
たか判断しくステップ156)、全文字終了であれば処
理を終える。
まず自動認識モードの動作を説明する。ローダコントロ
ーラ22により制御されたローダ26が製品番号の印字
されているワーク25をTVカメラ23の視野内に入る
ように位置決めし、ワークステーション21に対してロ
ードの完了を知らせる。この視野内に入ったワーク25
は照明光源24により均一に照明される。またロード完
了の知らせを受けたワークステーション21は文字認識
装置lOに対して認識開始を指令し、この指令を受けた
文字認識装置10は認識対象の画像をTVカメラ23に
より撮像して画像メモリ2に取り込む。ついで文字認識
装置10は撮像した画像について文字の認識を実行し、
その結果をワークステーション21に送信する。ワーク
ステーション21は認識結果を受けた後に、その結果を
さらに上位の計算機に転送して1回の認識を終了する。
第16図は第14図(第2図)の文字認識装置10の自
動認識モードのシーケンスを示すフロー図である。まず
この自’lJr認識モードが選択されると(ステップ1
60)、文字認識装置10はワークステーション21か
らの認識指令のコマンド待ち状態にあり(ステップ16
1) 、ワークステーション21からの認識開始の指令
信号を受けた文字認識装置10は認識を実行し、ワーク
ステーション21に対して認識結果と共に結果コードを
送信する(ステップ162)。このときサムチェックを
行うことが指定されているばこのチェックを行い、サム
チェックにより認識結果に不整合があれば結果コードに
サムチェックエラーコードがセットされる(ステップ1
63)。最後にこのとき撮像した文字画像を使用して上
記した閾値と結合係数の調整を行うことが指定されてい
るか判断しくステップ1.64)、調整が指定されてい
ればyA整を開始する(ステップ165)。
ついで半自動認識モードの動作を説明する。半自動認識
モードでは上位機器に認識結果を返す前にユーザに結果
の確認を求めたり、結果が誤っている時にはその場で対
話型に結果を修正することができる。ここで常にユーザ
に確認を求めるようにすると繁雑になるので、認識の確
信度が低い時だけユーザに確認を求めるようにすること
ができる。この半自動確信度閾値は後の第20図の機能
234のようにユーザが設定できる。第17図は第14
図(第2図)の文字認識装置10の半自動認識モードの
シーケンスを示すフロー図である。この半自動認識モー
ドが選択されると(ステップ170)、さきの自動認識
モードと同様にワークステーション21からの通信によ
る制御状態となって認識指令のコマンド待ち状態にあり
(ステップ171)。ワークステーション21からの認
識開始の指令4=号を受けた文字認識装置10は認識を
実行する(ステップ172)。この半自動認識モードの
認識結果は第18図に示すように手動認識結果の画面と
同様の形式で表示される。第18図は第14図(第2図
)の文字認識装置IOの半自動認識モードの認識結果の
表示画面を示す説明図である。ここで得られた認識結果
の確信度が指定した半自動確信度閾値より低い時にはワ
ークステーション21にP!識結果を返す前にユーザに
結果結果の確認を求める。この場合に認識結果が正しい
時には、ここで送信の機能を持つキーを押せば結果が返
される。また認識結果が誤っている時には、カーソル左
右移動キー(→←)を用いてカーソルを誤認識した文字
の場所に移動し、画面下部に表示された英数字の中から
カーソル左右移動キーによりカーソルを正しい文字の場
所に移動して修正する。ここで誤認識が2文字以上ある
場合には同様にカーソルをyA認識した文字の場所に移
動して認識結果を修正し、ユーザがすべての認識結果を
確認したらその認識結果と結果コードをワークステーシ
ョン21に送信する(ステップ173)。この時にサム
チェックが指定されていればサムチェックを行い、この
サムチェックによりvl識結果に不整合があれば結果コ
ードにサムチェックエラーコードがセットされる(ステ
ップ174)。最後にこのとき撮像した文字画像を使用
して閾値と結合係数のyA整を行うことが指定されてい
るか判断しくステップ175) 、指定されていればそ
の調整処理が行われる(ステップ176)。
ついで手動認識モードの動作を説明する。第19図は第
14図(第2図)の文字認識装置10の手動認識モード
のシーケンスを示すフロー図である。この手動、Iy!
識モードは自動認識を行う前に、ティーチングで調整し
た中間ユニット41.42.43と出力ユニット61.
62.63の閾値や結合係数で正しく認識できるか判断
するために認識実行を行うものである。まず手動認識モ
ードが選択されると(ステップ190)、認識開始の指
令はワークステーション21ではなくティーチングボッ
クス19からの操作で行う(ステップ191)。これに
より認識を実行しくステップ192)、認識結果を画面
の上段に表示し、その下に確信度を表示する(ステップ
193)。
つぎに文字認識装置lOは、上記したワークステーショ
ン21からの認識指令により認識を開始して認識結果を
ワークステーション21に送信する自動認識モードと、
ワークステーション21からの認識指令により認識を開
始して認識結果を確認し訂正することが可能な半自動認
識モードと、ティーチングしたデータで認識実行し認識
結果を確認して認識性能を判断するための手動認識モー
ドの他に。
認識および学習のためのフォントやウィンドウや候補文
字などの認識対象物の特性を入力するためのティーチン
グモードと、画像評価やICカード人出力の操作やワー
クステーションなどに対するデータ伝送仕様の設定等を
行うユーティリティーモードがあり、5つの動作モード
をもつ。このティーチングモードとユーティリティ−ド
をつぎに説明する。
第20図は第14図(第2図)文字認識装置】0のティ
ーチングモードの各機能を示すブロック図である。ここ
で1台の視覚センサのTVカメラ23をさまざまな環境
で使用する場合に、環境ごとに文字の配置や大きさが異
なるのでティーチングデータも環境ごとに設定する必要
がある。このティーチングモード200でティーチする
ものは認識対象文字列に関する設定210と、その文字
のフォント選択220と、認識パラメータの設定230
と、フォントの閾値と結合係数の1i整240である。
まず認識対象文字列に対する設定210としては、文字
数の設定211と、画素数で表される文字のサイズの設
定212と、印字文字列の変動範囲や位置切出しのため
の基準マーカの位置の設定213がある。つぎのフォン
ト選択220では認識対象文字の字体を指定する。これ
にはフォントの種類をOCR,−Aのように文字認識装
置10があらかじめ備えている標準字体221とするか
、実際の文字パターンを登録するかを指定する。この標
準字体221を指定するとあらかじめ内蔵しているその
標準字体を認識対象文字の字体として登録する。
また実物教示字体222を指定すると、その字体の判定
に適したウィンドウ領域の設定等の特徴領域設定223
と、特徴設定224を行う、つぎのL!!識パラメータ
の設定には確信度閾値設定231と、チェックコードの
桁数指定224と、半自動認識の確信度間f直股定23
4がある。この確信度閾値設定231では確信度の差の
閾値設定232があり、半自動認識の確信度閾値設定2
34では確信度の差の閾値設定235がある。
つぎのフォントの閾値と結合係数のyJ8整240には
文字候補の設定241と、調整に使用するフォントの文
字画像登録242と、調整用パラメータの設定243と
、調整実行248がある。フォントの文字画像登録24
2ではフォントの文字の種類ごとに外枠を指定してその
画像を取り込み、閾値と結合係数の調整はこの登録され
たフォントに対して行われる。まず文字画像の入力の前
にマーカ部の画像を取り込んで背景の基準明るさを求め
、これが終ると文字画像の取り込みに移る。この文字画
像の取込みはまず文字の種類を指定して次に画像の取込
み操作を行う。この画像を取り込んでも生画像が表示さ
れ、続けて次の文字の取込みが行える。文字の種類指定
は文字列が画面下に並んでいるので左右カーソルキーで
指定しようとする文字の所にカーソルを移動して行う。
この文字の種類指定を行うと文字外枠を示すボックスが
画面中央に表示され、この文字外枠を文字の表示されて
いる位置にカーソルで動かした後に文字画像を入力する
。この文字外枠の移動は文字外枠を選択した状態でカー
ソルキーにより行える。調整パラメータの設定243で
は、調整パラメータとして収束を判定するための最小2
乗誤差の設定244と、調整演算回数の上限値の設定2
45と、調整の計算結果の修正量が現時点の修正量に及
ぼす係数(0≦係数≦1)の設定246と、1つ前の調
整の計算結果の修正量が現時点の修正量に及ぼす係数(
0≦係数≦工)の設定247の4つのパラメータを設定
する。調整実行248ではこれまで設定したデータおよ
び画像を用いて実際に調整を実行する。
これにはまず第21図に示すようなこれまでの調整結果
を初期値としてさらに調整を行うか、またはリセツトし
て新しい初期値から始めるかの選択画面になる。第21
図は第20図の調整実行248の初期状態の選択画面を
示す説明図である。この選択を行うと調整結果を示すグ
ラフが表示される。そのグラフの縦軸は評価関数の誤差
を表し、縦軸の最大値は1.0であって誤差がこれ以上
の時には1.0の所に表示される。その横軸は調整回数
を表し、その最大値は調整パラメータの設定で収束回数
として指定した値になる。その指定した収束誤差はこの
グラフの上に直線で表示される。調整はカラムごとに実
行されるのでここで、カラム番号を入力して調整を実行
し、調整の実行結果はこのグラフの上に10回ごとに計
算され表示される。UR整パラメータの設定の所で設定
した収束誤差もしくは収束回数のいずれかの条件が成立
すると調整は終了する。
第22図は第14図(第2図)の文字認識装置10のユ
ーティリティモードの機能を示すブロック図である。本
文字認識装置10は外部記憶装置としてICカード17
を使用でき、ティーチングデータや画像データを格納す
ることができる。このユーティリティモード500には
ポート設定510と、ICカードの入出力機能520と
、画像評価530と、データ伝送機能540と、文字認
識装置の設定550がある。
まずポート設定510には伝送速度設定511と、スト
ップビット設定512と、パリティ設定513がある。
ICカードの入出力機能520にはICカード17の画
像をロートと消去しICカードに画像をセーブする機能
521と、ICカードの認識データをロードと消去しI
Cカードに認識データをセーブする機能522と、IC
カードのイニシャライズ機能523がある。これらの処
理はいずれもメニューの指示に従って簡単に実行でき、
例えばvfi像のセーブ機能521を選択すると生画像
が表示されセーブする画像をTVカメラ23から入力す
るメニュー画面になる。ここで入力する画像が見えるよ
うにしてキャリッジリターンを入力するとその画像が取
り込まれ、つぎにICカードを挿入し画像データの名称
を入力すると取り込んだ画像がセーブされる。つぎの画
像評価530の多値画像評価531では光学系の調整の
ため生の多値画像を表示する。また断面輝度分布表示5
32を選択するとTVカメラからの生画像が表示される
ので適切な画像がでたところで画像を取込む。その後に
その取り込んだ画像の上に断面位置を示す水平ラインカ
ーソルが表示されるので、上下カーソルキーを用い水平
ラインカーソルを動かして断面の位置を指定するとその
場所の輝度グラフが表示される。また2値画像評価機能
533がある。データ伝送機能540にはティーチング
データのデータ伝送541と、画像データの伝送542
がある。
つぎに中間ユニット41.42.43と出力ユニット6
1、、62.63の閾値と結合係数の調整処理を文字認
識の処理をしながら実行する方法を説明する。これは文
字認識装置10の自動認識モードと半自動認識モードに
おいて可能である。この自動認識モードと半自動認識モ
ードのいずれにおいても、上記した第16図のサムチェ
ック(ステップ163)と第17図のサムチェック(ス
テップ174)を行った後に、第16図のこの調整を実
行するか否かの判断(ステップ164)と第17図の調
整を実行するか否かの判断(ステップ175)を行って
いる。この判断は第22図に示すユーティリティ機能5
00のながで文字認識装置の設定550の1つとして認
識中調整を指定したか否かで行われる。この認識中調整
を行うと文字の印字品質が変動するような対象に対して
もその変動に追従させて適応させることができ、また文
字認識装置10が異なった環境で使用される場合にも設
置した環境において認識しながら調整をすることにより
、設置にさいして繁雑な操作を必要とせずに安定した認
識が実現可能となる。第23図は第14図(第2図)の
文字認識装置10が認識を行いながら閾値と結合係数の
調整を行う場合のタイムチャートを示す説明図である。
第23図において5文字の認識を実行している期間75
3.754゜755にも1時分割処理により調整演算が
可能であるが、認識演算に比較して調整演算は時間がか
かるので、認識対象のワーク25のロードとアンロード
の期間751.752に、調整を実行する期間756゜
757の調整を行う。これにより文字認識装置lOの実
行を妨げることなくオンライン調整が可能となる。また
認識した結果で認識確信度が低い場合には、その文字画
像を使用した調整は行なわないようにすることも可能で
ある。
つぎに特別な中間ユニットの41.42.43構成を説
明する。上記した中間ユニットの機能は入力ユニット3
1.32.33からの出力値に閾値を加えた値に対して
演算を行いその結果を出力することであったが、他の機
能の中間ユニットとして上記した中間ユニットの出力の
取り得る最大値からその中間ユニットの出力値を減算し
た値を出力するような反転中間ユニットを設けることが
できる。この意味は上記した中間ユニットが入力ユニッ
トからの出力値が大きいほど大きな出力を出すのに対し
て、反転中間ユニットは入力ユニットからの出力値が小
さいほど大きな出力を出すことである。これは入力ユニ
ットのウィンドウ領域になにもないことがその文字の特
徴である場合に有効な働きをする。この反転中間ユニッ
トの出力yは、先に式(1)で求めた中間ユニットの出
力yを用いて次式で表せる。
yl、 、、+j=l−y1.j(6)この反転中間ユ
ニットの計算は1次式のように変形することができる。
Xy  +w WL、に、J  1.J  1.に、J+++Xy1.
n+J”Wl、に、jxyl、j+W1.に、J+n×
(1’1.J)=(Wl、に、j−Wl、に、j+n)
Xyl、J+W1.に、j+n  (71したがってこ
の関係式から反転中間ユニットを設けなくても出力ユニ
ット61.62.63の閾値を適切に決めれば、次の式
(8)に示すように反転中間ユニットを設けたのと同様
の機能を実現できる。
これは反転中間ユニットを設けた場合に比べて中間ユニ
ットの数が半分になっており、それだけ文字認識の演算
が少なくなり高速になる。ただしこの出力ユニットの閾
値は反転中間ユニットがある状態で結合係数を調整した
方が求めやすいので、調整時には反転中間ユニットを設
けて文字認識時には反転中間ユニットを取り除く方法が
有効である。
さいごに中間ユニットと出力ユニットの閾イ直と結合係
数を調整するためのサンプル文字画像について説明する
。このサンプル文字画像は多ければ多いほど色々なケー
スに対応できる調整をしたことになる。しかし各種の文
字画像をサンプルとして収集するには工数を要する。そ
こで1つの文字画像に対して文字の位置ずれ範囲と明る
さの変動範囲を指定すると、そのサンプル画像から位置
ずれを生じた画像および明るさの変動した画像を自動的
に生成するようにすれば、あまり工数をかけずに各種の
サンプル画像を用いたguができることになる。第24
図(a)、(b)は第14図(第2図)の文字認識装置
10がサンプル画像から位置ずれを生じた画像および明
るさの変動した画像を自動的に生成する方法を示す説明
図である。第24図(a)に示すように位置の変動した
画像の自動生成はもとのサンプル画像があったらその原
点0から0′を変動範囲として指定された範囲でずらす
ことにより実現できる。例えば変動範囲がプラスマイナ
ス3画素と指定されたら、サンプル画像の原点OをX、
Y方向とも+3.+2.+1.O,−1゜2、−3ずら
した49種類の画像を用いれば位置ずれのあるサンプル
画像を得ることができる。同様にして第24図(b)に
示すようにもとのサンプル画像からの明るさの変動範囲
を指定されれば、その範囲だけ濃度を変化させた画像を
生成することにより、明るさ変動のあるコントラストの
サンプル画像を得ることができる。
つぎに入力ユニットでの画像処理の種類について、他の
画像処理の方法の例について説明する。
上記第3図で説明した入力ユニット31.32.33で
行われる画像処理は、横の文字線に対する上方からの微
分と5横の文字線に対する下方からの微分と、縦の文字
線に対する左方からの微分と、縦の文字線に対する右方
からの微分と、濃度合計の5種類であった。この微分処
理は第3図で説明したように文字線に対して垂直方向に
微分値を加算していく方式であり、濃度合計はウィンド
ウ内の濃度の平均値を求める方式である。この画像処理
の方法はセラミック表面へのレーザ印字文字のようにコ
ントラストの悪い文字に対して有効である。
本文字認識装置10はこの5種類の画像処理の他にウィ
ンドウ内での濃淡画像に対して1次微分により微分値を
求めてエツジを検出する4種類の画像処理種類と、ウィ
ンドウ内での濃淡画像に対して2次微分により微分値を
求めてエツジを検出する4種類の画像処理種類と、ウィ
ンドウ内を2値化してそのウィンドウ内での白領域(ま
たは黒領域)の面積をカウントする2種類の画像処理種
類と、ウィンドウ内を2値化して2値画像に対してエツ
ジを検出する2種類の画像処理種類との12種類を備え
ている。つぎにこの12種類の画像処理について1@に
説明する。
まずはじめに濃淡画像に対して1次微分または2次微分
によってエツジを検出する方式について第25図を用い
て説明する。第25図(a)、(b)。
(c)はウィンドウ内画像処理の中で左方からの1次微
分と2次微分によるエツジ検出方法の説明図である。第
25図(a)は縦方向の文字線上にきられたウィンドウ
の例であり、この図において斜線部分は文字線を表す、
第25図(b)は今このウィンドウ内でX方向に左方か
ら工水微分した時のX方向の★印のついたラインについ
ての1次微分値を表したものであり、第25図(c)は
同じく★印のついたラインについてウィンドウ内でのX
方向への左方からの2次微分値を表したものである。ま
ず1次微分について説明する。第25図(b)にあるよ
うにウィンドウ内での1次微分値をすべてのラインごと
に計算する。そしてその各ラインの1次微分値の最大値
を求めてすべてのラインについてその微分値の総和を計
算し、その総和値をそのウィンドウのライン数で除算し
た1次微分値の最大値の平均値を計算してこの値を入力
ユニットの出力値とする。つぎに2次微分について説明
する。第25図(c)にあるようにウィンドウ内での2
次微分値をすべてのラインごとに計算する。そして1次
微分と同様にその各ラインの2次微分値の最大値を求め
てすべてのラインについてその微分値の総和を計算し、
その総和値をそのウィンドウのライン数で除算した2次
微分値の最大値の平均値を計算してこの値を入力ユニッ
ト31.32.33の出力値とする。このように画像処
理の結果をウィンドウの大きさで正規化することにより
ウィンドウの大きさに依存しない入力ユニットの出力値
を得ることができる。
つぎにウィンドウ内を2値化してそのウインドウ内での
黒領域の面積をカウントする方式について説明する。こ
のウィンドウ内画像処理の方式は比較的コントラストが
よく安定した2値画像が得られる場合に用途は限られる
。まずウィンドウ内を2値化し、つぎに2値化したウィ
ンドウ内で黒に対応する画素数をカウントする。そのカ
ウントした黒画素数をウィンドウの面積で除算して入力
ユニット31.32.33の出力値とする。ここでカウ
ントする画素が黒画素でなく白画素をカウントしても反
転ユニット全く等価である。21m化の閾値は固淀2値
化閾値や、例えばpタイル法や判別分析法などのアルゴ
リズムによって決定した2値化閾値を用いればよい。但
し対象の文字のコントラストがよく安定した2値画像が
得られる場合には例えば文字背景の明るさを参照してそ
の明るさに対して演算を行った結果を2値化閾値とする
方法も有効である。−例としては文字背景の明るさの8
5%を2値化閾値とする方法などが考えられる。
つぎにウィンドウ内を2値化して2値画像に対してエツ
ジを検出する方式について説明する。このウィンドウ内
画像処理の方式も比較的コントラストがよく安定した2
値画像が得られる場合に用途は限られる。まずウィンド
ウ内を2値化し、2値化したウィンドウ内の各ラインに
ついて白から黒に変わるところをエツジとして検出する
。ここでのラインは第25図において説明した濃淡画像
に対する1次微分と2次微分のところのラインと同じ定
義で1文字線の方向に対して垂直な方向である。そのラ
インでエツジを検出したならば次のラインについても同
じエツジ検出方法を適用し、ウィンドウ内のすべてのラ
インについて検出を行う。
そしてすべてのラインの処理が終了した時にウィンドウ
内でエツジを検出したライン数を計算し、これをウィン
ドウの大きさで正規化して入力ユニット31.32.3
3の出力値とする。
つぎに2つ以上のウィンドウを組合せた特別な中間ユニ
ット44について説明する。上記した中間ユニットは入
力ユニット31.32.33からの出力値に閾値を加え
た値に対して演算を行い演算結果を出力する中間ユニッ
トとその反転した結果を出力する中間ユニットであった
。これらの中間ユニットの入力値はウィンドウ内の微分
値の大きさと明るさの平均値である。このため印字の濃
さが変動した時には、明るさが変動した時と異なり微分
値の大きさと明るさの平均値が大きく変動して正確に特
徴抽出を行えない。この問題を解決するため他の中間ユ
ニットとして、複数個の入力ユニットを組合せて入力ユ
ニット31.32.33.34の出力値の相対値を入力
値とする組合せ中間ユニット44を設けた。この組合せ
中間ユニットについて第26図を用いて説明する。第2
6図は第14図(第2図)の文字認識装置10の特別な
中間ユニットである組合せ中間ユニットの一例を示す説
明図である。第26図の中間ユニット44は入力ユニッ
ト群3の入力ユニット32.34の出力値を組合せて入
力としている。
まず上記の各入力ユニット31.32.33.34はウ
ィンドウ位置格納部311.321.331.341に
格納されているウィンドウ位置データに基いて画像処理
部312、322.332.342においてウィンドウ
内で画像処理を行いその画像処理結果を入力ユニットの
出力値とする。中間ユニット44は入力ユニット群3の
入力ユニット32.34の出力値を組合せて入力として
いる。この場合穴カニニット32.34の出力値が中間
ユニット44に入力されると中間ユニ シト44の演算
部442は2つの入力ユニットの出 力値の差を求めこ
の差に閾値格納部441に格納されている閾値を加えた
値に対して演算を行い中間ユニット44の出力値とする
。入力ユニットの組合せはこのように2つの入力ユニッ
ト出力値の差を用いる場合だけでなく、3つ以上の入力
ユニットの出力値を用いることもある。これを3つの入
力ユニットを用いる場合を例にとって説明すると、まず
2つの入力ユニットの出力値の平均値を求め、こ必平均
値ともう1つの入力ユニットとの差を求めて中間ユニッ
ト44の入力値とするものである。この平均計算および
差を求める演算は、中間ユニット演算部442において
実行され、閾値格納部441に格納されている閾値を加
えた値に対して演算を行い中間ユニット44の出力値と
する。この組合せユニットは通常のユニットとの混在も
可能であり、通常の中間ユニットに入力した入力ユニッ
トは組合せユニットに用いることも可能である。
つぎにこの入力ユニットの組合せの設定および変更につ
いて第27図を用いて説明する。第27図は上記の組合
せ中間ユニットに対して入力ユニットの設定および変更
をメニュー画面である。まず組合せを設定する中間ユニ
ットの番号を入力する。
第27図は1”を入力している例である。つぎに組合せ
をおこなう第1項の入力ユニット数を入力し、つぎに入
力ユニット(ウィンドウ)の番号を入力する。第2項に
ついても入力ユニット数を入力し入力ユニットの番号を
入力する。入力ユニットが複数の場合にはカンマで区切
って入力する。
そして最後に組合せの設定か削除かを番号で入力して設
定または変更を行う。ここで設定した第1項と第2項の
値が中間ユニットに入力される。つぎに中間ユニット演
算部442で行っている演算について説明する。この組
合せ中間ユニットの演算部での計算は次のように画像処
理種類にしたがって行う。
1)画像処理種類が微分処理の場合 中間ユニット入力値=(組合せ第2項一組合せ第1項)
十閾値 2)画像処理種類が濃度合計処理の場合中間ユニット入
力値=(組合せ第2項一組合せ第1項)7組合せ第2項
+閾値 3)画像処理種類が2値化処理の場合 中間ユニット入力値=(組合せ第1項一組合せ第2項)
十閾値 上記1)〜3)で計算された中間ユニットの入力値が算
出されれば残りの処理は先に述べた中間ユニットと全く
同様であり、この中間ユニットに対する反転中間ユニッ
トも構成できる。すなわちこの組合せ中間ユニットは中
間ユニット演算部で行う演、算が異なるだけで、その他
は組合せ中間ユニットでないこれまでの中間ユニットと
全く同じに扱うことができるという特徴をもち、組合せ
中間ユニットでない中間ユニットと共に同時に使うこと
も可能である。尚、入カユニッ1−の組合せの決定法す
なわちどの入力ユニットを組合せる入きかといった問題
には、従来の多変量解析のなかで例えば主成分分析の手
法や変数選択法などの手法を用いて最適な入力ユニット
の組合せを決定する。
つぎに閾値と結合係数の他の調整方法に関して説明する
。閾値と結合係数は第4図で説明したように逐次的に調
整する方法もあるが、重回帰モデルを用いて求めること
ができる。この方法によれば結合係数を簡単に計算でき
る。この重回帰モデルは中間ユニットの出力値を3’l
+ J+結合係数をW′ ↓+に+Jとすると、出力ユ
ニットの出力値をo2.には次式のように表せる。
n すなわちある画像を認識するためにまず中間ユニットの
出力値yl−+ Jが計算できる。このとき出力ユニッ
トの出力値に相当する02.kに対してその画像の文字
の正解には1”、それ以外は“O”として、すべての文
字種類に対して考えると式(9)で表される式中の添字
にで表される変数W′および式の数が出力ユニットの個
数に等しい、連立方程式を解くことで結合係数W′が簡
単に計算できることがわかる。中間ユニットの閾値につ
いては、入力した画像について統計的な平均値を求めこ
れを中間ユニット閾値にすればよい。
上記の方法によって求めた閾値と結合係数を用いても認
識性能はある程度でるがさらに認識精度を向上させるた
めに、これを初期値として第4図で説明した調整処理を
行ってもよい。
本文字認識装置10は通信回線でデータを伝送すること
によりワークステーションを用いて上記のウィンドウの
設定やウィンドウ内画像処理種類の指定などを行うこと
ができる。そこで上述したウィンドウの設定やウィンド
ウ内画像処理種類の指定などをワークステーションのよ
うな他の計算機を用いるときの一例について第28図〜
第29図を用いて説明する。第28図は第14図(第2
図)の文字認識装置10に接続したワークステーション
の処理メニューを表した画面である。このようにワーク
ステーションには、データ伝送と、調整パラメータ設定
と1文字パラメータ設定と、調整実行と、つイントウ評
価と、ウィンドウ設定と、結合係数データ設定と、文字
種類変更と、統計解析と、終了の機能をもつ。第29図
は第14図(第2図)の文字認識装置10に接続したワ
ークステーションの機能の一例を示すブロック図である
。このワークステーションの機能2900にはデータ伝
送2910と、調整パラメータ設定2920と、文字パ
ラメータ設定2930と、調整実行2940と、ウィン
ドウ評価2950と、ウィンドウ設定2960と、結合
係数データ設定2970と、文字種類変更2980と、
統計解析2990とがある。この機能は第28図の10
個の機能に対応している。第29図の各機能も同様に第
28図に示したような各機能に対応した処理メニューに
より処理番号を選ぶ。
まずデータ伝送2910には閾値および結合係数などの
教示データ伝送2911と画像データ伝送2912があ
る。調整パラメータ設定2920では、まずパラメータ
設定2921で上述の調整の式(4)、(5)での定数
Bk、Ckの値をそれぞれ設定する。また2値化閾値設
定2922では2値化閾値を設定する。文字パラメータ
設定2930では、教示データにある文字行数と、行ご
との文字数と、文字の縦、横のサイズと、文字の縦、横
のピッチと、カラムごとの使用文字候補を変更または設
定することができる。
まず文字行数設定2931で認識すべき製品番号などが
行列で構成されているかその行数を設定し、文字数設定
2932において各行の文字数を設定する。
文字サイズ設定2933では認識対象文字の文字の縦と
横のサイズを画素単位で設定し、文字ピッチ設定293
4では文字の横方向のピッチを画素単位で設定し、文字
ピンチ設定2934では文字列が2行以上の場合には縦
ピツチすなわちその行のピッチも画素単位で設定する。
また文字候補設定2935では各カラムに対する使用文
字候補をカラムごとに設定する。調整実行2940では
第13図で説明したような閾値および結合係数の調整を
実行する。調整実行2940は調整計算2941と重回
帰分析2942の2つのモードをもち、調整計算294
1は上述の式(4)、(5)を用いる方法で、また重回
帰分析2942は式(9)を用いる方法である。!I!
!整計算2941ではまずどのカラムについての計算か
を指定してつぎに実行に移る。カラムの指定は製品番号
のようにカラムごとに使用文字候補が決まっている場合
にその文字候補を用いる。この文字候補は上述したよう
に文字候補設定2935で設・定および変更が可能であ
る。調整計算の実行ではすべての文字に対する文字ごと
の確信度の最新の値を縦軸に取り横軸を文字種類とした
表示と、計算した直後の文字の確信度の値と計算を開始
してからの履歴を縦軸に取り横軸を文字種類とした表示
と、2乗誤差和の値を縦軸に取り調整計算の回数を横軸
にとった連続的な表示とを行う。ウィンドウ評価295
0ではウィンドウ入力値評価2951と、入力ユニット
組合せ評価2952と、フォントパターン評価2953
と、ウィンドウ位置評価2954と、全ウィンドウ入力
値評価2955とがある。
ウィンドウ入力値評価2951ではウィンドウの位置と
上記の微分や濃度合計や2値化といった画像処理の種類
を指定してすべての文字のウィンドウの値を縦軸にとり
、横軸に文字種類として表示する。
ウィンドウ位置の入力の方法はウィンドウは基本的に四
角形であるから、左上のXv’/座標と、左下のx、y
座標と、右下のX、y座標の3点を入力する。入力ユニ
ットの組合せ評価2952では上述の入力ユニットを組
合せた中間ユニットの評価を行う。まず組合せる入力ユ
ニット(ウィンドウ)の番号を入力してそのときの中間
ユニットの出力値を全文字について、横軸を文字種類、
縦軸を中間ユニットの出力値として表示する。フォント
パターン評価2953では設定しであるウィンドウの位
置と画像処理種類に対する中間ユニットの出力値を全文
字に対して横軸を文字種類、縦軸を入力ユニットの出力
値として表示する。このときまず2値化処理か濃淡処理
かを入力し、つぎに文字を指定してこの文字を拡大表示
してウィンドウの位置を表示し、つぎに表示したい中間
ユニットの番号を指定して中間ユニットの出力値を表示
する。ウィンドウ位置評価2954は文字枠に対するウ
ィンドウの位置を確認するために使用し、まずウィンド
ウの番号を入力すると文字枠に対するウィンドウの位置
を表示する。全ウィンドウ評価2955は文字の種類を
入力して横軸をウィンドウの番号、縦軸を入力ユニット
の出力値として、各入力ユニットの出力値を表示する。
ウィンドウ設定2960ではウィンドウ設定2961と
入力ユニット組合せ設定2962の2つの項目がある。
ウィンドウ設定2961ではこのウィンドウを使用して
いるかいないかの使用フラグと、ウィンドウに対する上
記で説明した画像処理の種類と、ウィンドウの位置座標
を入力して設定する。ウィンドウの位置の設定方法はウ
ィンドウ評価2950と同様である。入力ユニット組合
せ設定2962では第27図のメニューと同じで、組合
せを用いる中間ユニットの番号の指定と、組合せの設定
または変更するかの指定と削除するかの指定との選択と
1組合せる入力ユニットの番号の指定とを行う。結合係
数データ設定2970では中間ユニットと出力ユニット
の間の結合係数の初期値を手入力するための機能でデー
タ設定2971と、データクリア2972と、データコ
ピー2973と、データ圧縮2974と、自動設定29
75の機能をもっている。データ設定2971では特定
の出力ユニットに対する結合係数の初期値を設定する場
合や変更する場合で用いる機能でまず出力ユニットの番
号を指定して、つぎに設定したい値を入力する。データ
クリア2972は、特定の中間ユニットに対する結合係
数をすべてOにする機能で、例えば新しい中間ユニット
を増設したときに用いる。ここではまずクリアしたい中
間ユニットの番号を指定する。データコピー2973で
はカラム間で閾値および結合係数をコピーする。コピー
する閾値および結合係数をもつカラムの番号を指定して
コピーしたいカラムの番号を指定してコピーする。デー
タ圧縮2974では中間ユニットと出力ユニット間の結
合係数を指定した値で除算し結合係数の値を全体的に小
さい値にする。これは値が大きくなりすぎオーバーフロ
ーを生じたときなどに用いる。自動設定2975は閾値
と結合係数の初期値を決定する機能である。適切な文字
画像を用いてその中間ユニットの値を計算してその中間
ユニットの出力値から例えば出力値がO−0,4のとき
には結合係数の初期値を−1とし、0.4〜0.6のと
きには結合係数の初期値をOとし、0.6〜1.0のと
きには+1というように初期値を決定する。文字種類変
更2980では文字の画像と文字種類の対応を変更また
は修正するための機能で、調整計算2941において教
師データを生成するために用いる。また品質の悪い文字
画像があった場合にはこの画像を調整計算に入れると認
識性能の劣化を招くことがある。この場合にはこの画像
をとばして調整計算に使用しない方がよい。このときこ
の画像に対して文字種類変更2980から使用しない文
字の種類と指定することにより調整計算は実行されず、
全体的な認識性能の劣化も起こらない。統計解析299
0では変数選択法と呼ばれる方法によりウィンドウ(入
力ユニット)の最適な組合せを決定する。これは入力ユ
ニットのすべての組合せを計算し変数選択法と呼ばれる
方法によりどの入力ユニットを組合せればよいかを選択
する。
まずこの選択の基準を入力し、この基準の表す認識性能
を確保できる組合せを出力する機能であり、この組合せ
から調整実行2940の調整計算を行える。
この使用方法はまずデータ伝送2910の中の教示デー
タ伝送2911によって教示データをロードし、画像デ
ータ伝送2912によって調整または評価に用いる画像
データをロードして各機能を実践する。
つぎにワークステーション21と文字認識装置10の他
の構成について説明する。第30図はワークステーショ
ン21と文字認識装置10の機能ブロックの一例を示し
た図である。ワークステーション21には設計モジュー
ル3000が搭載され、この設計モジュール3000は
認識モデルジェネレータ3001と、調整モニタ300
2と、認識シミュレータ3003と、認識パラメータ格
納部3004と、サンプル画像格納部3005から構成
され。文字認識装置10には認識モジュール3006が
搭載され、認識モニタ3007と、認識モジュール30
08と、パラメータ格納部3009より構成される。認
識モデルジェネレータ3001はユーザに認識対象に関
する。質問を出し、その回答と内蔵するパターン認識に
関する知識から入力ユニットでの画像処理の種類や中間
ユニットの組合せなどの認識モデルを生成し、認識パラ
メータを生成する611整モニタ3002はこのパラメ
ータと、あらかじめ文字認識装置10からアップロード
しておいたサンプル画像を認識シミュレータ3003の
データエリアにセットし、認識シミュレータ3003を
起動する。認識シミュレータ3003は文字認識装置1
0に搭載された認識モジュール3008と同等のもので
あり、認識処理を行なうごとに調整計算モニタ3002
に結果を返す。調整計算モニタ3002は認識結果に基
づき認識パラメータを修正し、所定の認識性能が得られ
るまで調整計算を繰り返す。調整計算が終了したら、そ
の計算された認識パラメータを!!識パラメータ格納部
3009に転送し、認識実行ができるようになる。こ、
の設計モジュール3000は、エキスパートシステム構
築シェルで記述されワークステーションで実行される。
認識モデルジェネレータ3001は、ユーザが認識対象
の種類や特徴を指定すると、ユーザに質問を出しながら
内蔵する知識を用いて認識パラメータの初期値を生成す
る。ユーザが指定するものとしては、対象とする実物パ
ターンの他、特徴となりそうな部分、その範囲の特徴抽
出に適した画像処理の種類等である。このユーザ指定項
目については、ユーザの判断を容易にするためのユーテ
ィリティを備えている。この例としては、第29図にお
いて説明した画像処理の種類を決定するために微分等の
画像処理を行い結果を表示したり、多変量解析により初
期値を決めるもの等がある。
調整計算モニタ3002はユーザからの調整計算実行に
関する指示を受は付け、短時間に適切な結果が得られる
ように認識シミュレータ3003を管理するものである
。調整計算の方法に認識パターンの特性に応じたノウハ
ウがあり、学習モニタ3002はこの知識を備えている
。11整計算モニタ3002の主要な機能はまず、計算
に必要な、温度、計算の終了条件等、調整パラメータを
設定したり、結果をユーザに理解し易い形で出力する。
また、サンプル画像格納部3005に格納された画像か
ら、例えば第24図において説明した位置ずれや、明る
さ変動や、形状変形等、実際の認識環境にあわせた画像
の生成を行なう、更に計算のスケジューリングによって
計算時間が大幅に短縮されるので計算の効率化のため、
調整モニタ3002はこのような計算のスケジューリン
グに関する知識を用い、誤りなくパターンの判別を行な
う認識パラメータをできるだけ速く得るものである。
パターン認識モジュール3009は第工図に示すような
構造である。パターン認識モニタ3007は認識対象パ
ターンに対して認識パラメータを設定することにより判
別機能を認識対象に応じて最適な状態に変更するもので
ある。この機能は、出現するパターンの候補が出現場所
に対応して特定の種類に限定できる場合の多い工業用文
字/パターン認識において特に有効である。例えば、第
10図で説明したように製品番号のような桁ごとにその
桁に対して指定された候補文字だけの判別を行なう認識
パラメータを使用すると、英数字全部の判別をおこなう
認識パラメータを使用するより認識率が高くなる。認識
パラメータ格納部3008はワークステーション上にあ
る設計モジュールの認識パラメータ格納部3004のパ
ラメータをデータ伝送により伝送して格納する。認識対
象の文字が変われば設計モジュール3000において対
象に応じた認識パラメータを求め、この認識パラメータ
格納部3008のデータを変更することで容易に対応で
きる。
〔発明の効果〕
本発明によれば、文字の印字品質や文字のフォントが変
動するようなものや文字の印字状態が悪いもので例えば
コントラストの悪い画像や文字線の切れとかかすれとい
ったものが生じた対象でも自動的に認識装置が変動に対
し適応してその影響を受けずに安定した認識が実現でき
る効果がある。
【図面の簡単な説明】 第1図は本発明による文字認識装置の1実施例を示す文
字判別部の一構成図、第2図は第1図の文字認識装置の
ハードウェア構成国、第3図(a)。 (b)、(c)は第1図の入力ユニットの画像処理部の
処理の例を示す説明図、第4図は第1図の閾値および結
合係数を調整する手順を示す説明図、第5図は第4図の
結合係数の初期値をユーザが判断して設定する画面を示
す説明図、第6図は第1図のウィンドウ領域の位置およ
び大きさを設定する画面を示す説明図、第7図は第6図
の操作に用いるキーボードの例を示す上面図、第8図は
第1図の画像処理部の処理の種類を設定する画面を示す
説明図、第9図(a)、(b)は第(図の画像の明るさ
補正の方法を示す説明図、第10図は本発明による文字
認識装置の一実施例を示す文字判別部の他の部分構成図
、第11図は第10図の誤認識を減少させる方法を示す
説明図、第12図は第11図の誤認識を減少させる方法
を使用するさいのカラム数を設定する画面を示す説明図
、第13図は第1図の閾値と結合係数の調整を文字認識
装置以外の計算機を使用して行う手順を示すフロー図、
第14図は本発明による文字認識装置が製造ラインで使
用される場合の例を示すシステム構成図、第15図は第
14図の製品番号の読取り手順を示すフロー図、第16
図は本発明による文字認識装置の自動認識モードのシー
ケンスを示すフロー図、第17図は同じく半自動認識モ
ードのシーケンスを示すフロー図、第18図は第17図
の認識結果の表示画面を示す説明図、第19図は本発明
による文字認識装置の手動認識モードのシーケンスを示
すフロー図、第20図は本発明による文字認識装置のテ
ィーチングモードの機能を示すブロック図、第21図は
第20図の調整実行の初期状態の選択画面を示す説明図
、第22図は本発明による文字認識装置のユーティリテ
ィモードの機能を示すブロック図、第23図は本発明に
よる文字認識装置が認識を行いながら閾値と結合係数の
調整を行う場合のタイムチャートを示す説明図、第24
図(a)、(b)は同じくサンプル画像から位置ずれを
生じた画像および明るさの変動した画像を自動生成する
方法を示す説明図、第25図(a)。 (b)、(c)は第1図の入力ユニットの画像処理部の
処理の例を示す説明図、第26図は組合せ中間ユニット
の説明図、第27図は組合せ中間ユニットに対する組合
せの設定の説明図、第28図は文字認識装置に接続した
ワークステーションの処理メニューの例を示す説明図、
第29図は第28図のワークステーションの機能の説明
図である。 1・・・文字判別部、2・・・画像メモリ、3・・・入
力ユニット群、4・・・中間ユニット群、5・・・結合
係数格納部、6・・・出力ユニット群、7・・・文字候
補格納部、8・・・文字認識管理部、9・・・パラメタ
格納部、10・・文字認識装置、11・・・キーボード
、12・・・モニタテレビ、13・・・画像入出力回路
、14・・・汎用入出力回路、15・・・プログラムデ
ータメモリ、16・・・画像処理プロセッサ、17・・
・ICカード、18・・・ICカードインタフェース、
 19・・・ティーチングボックス、20・・・CPU
、21・・・ワークステーション、22・・・ローダコ
ントローラ、23・・・TVカメラ、25・・・ワーク
、26・・・ローダ、27・・・モニタテレビ、 20
1,202,203・・・ウィンドウ領域、31,32
.33・・・入力ユニット、311,321゜331・
・・ウィンドウ位置データ格納部、312,322,3
32・・・画像処理部、 41,42,43・・・中間
ユニット、411゜421.431・・・閾値格納部、
412,422,432・・・中間ユニット演算部、6
1,62.63・・・出力ユニット、611,621゜
631・・・出力閾値格納部、612,622,632
・・・出力ユニット演算部、91・・・絶対判別閾値格
納部、92・・・相対判別閾値格納部、93・・・チェ
ックカラム数格納部。 第70 4142.43−一市間エニーIト

Claims (1)

  1. 【特許請求の範囲】 1、文字画像を入力し、その入力した画像を処理して文
    字の種類を判別する文字認識装置において、文字画像に
    設定された複数のウィンドウ領域内の画像に対して処理
    を行い、その結果を出力する入力ユニット群と、入力ユ
    ニット群からの出力値に閾値を加えた値に対して演算を
    行う中間ユニット群と、中間ユニット群の各ユニットか
    らの出力に結合係数をかけ、その総和に閾値を加えた値
    に対して演算を行う、文字の種類に対応した出力ユニッ
    ト群より構成される文字判別部により文字の認識を行う
    ことを特徴とする文字認識装置。2、閾値と結合係数の
    いずれか一方または両方を認識結果を用いて調整可能で
    あることを特徴とする請求項1記載の文字認識装置。 3、認識対象文字ごとに各ウィンドウ領域の中に文字線
    が有か無しかそのどちらともいえないかの3種類の指定
    をユーザが行うことにより、結合係数の初期設定を行う
    ことを特徴とする請求項1または請求項2記載の文字認
    識装置。 4、ウィンドウ領域の位置と大きさを対話型で設定およ
    び変更することが可能なことと、ウィンドウ領域で行う
    画像処理の種類を設定および変更することが可能なこと
    を特徴とする請求項1または請求項2記載の文字認識装
    置。 5、ウィンドウ領域での画像処理において画像処理結果
    の値をウィンドウの大きさで正規化することにより、ウ
    ィンドウの大きさに依存しない入力ユニットの出力値を
    得ることを特徴とする請求項4記載の文字認識装置。 6、ウィンドウ領域での画像処理の種類として右方から
    の微分と、左方からの微分と、上方からの微分と、下方
    からの微分と、濃度合計とを備え、これらの種類を対話
    型に指定することが可能である請求項4記載の文字認識
    装置。 7、ウィンドウ領域での画像処理において微分を指定し
    た場合には、指定された微分方向の微分値をウィンドウ
    の奥行きだけ加算し、その値をウィンドウの幅で割った
    値を入力ユニットの出力値とする請求項6記載の文字認
    識装置。 8、ウィンドウ領域での画像処理において濃度合計を指
    定した場合には、ウィンドウ内の全画素の濃度を加算し
    、それを画素数で割った値を入力ユニットの出力値とす
    る請求項6記載の文字認識装置。 9、ウィンドウ領域での画像処理において閾値と結合係
    数の調整をしたさいの画像の濃度を保持し、その濃度と
    認識対象文字の濃度とを比較して文字画像の濃度を補正
    する機能を有する請求項4記載の文字認識装置。 10、複数文字よりなる文字列の認識をするさいに文字
    列のカラムごとに認識対象文字の種類を指定し、また文
    字列のカラムごとに閾値と結合係数を種別に保持し、そ
    れを用いて文字認識をする請求項2記載の文字認識装置
    。 11、文字の判別結果を表す出力ユニット群の各出力値
    のうちの最大の値があらかじめ設定された絶対判別閾値
    以下の場合には文字認識ができないという結果を出力す
    ることを特徴とする請求項1記載の文字認識装置。 12、文字の判別結果を表す出力ユニット群の各出力値
    のうちの最大の値と2番目の値との差があらかじめ設定
    された相対判別閾値以下の場合には文字認識ができない
    という結果を出力することを特徴とする請求項1記載の
    文字認識装置。 13、絶対判別閾値または相対判別閾値を対話型で設お
    よび変更することが可能である請求項11または請求項
    12項記載の文字認識装置。 14、あらかじめ文字数の決まっている文字列を認識す
    るさいに文字の値を総和した値を求め、この総和値も含
    めて印字した文字列を認識し、その認識した文字の値を
    総和して、印字された総和値と一致しているかをチェッ
    クし、一致していなければ文字認識ができないという結
    果を出力することを特徴とする請求項1記載の文字認識
    装置。 15、文字列の総和値を示すカラム数を対話型で設定お
    よび変更することが可能である請求項14記載の文字認
    識装置。 16、文字認識装置から文字画像を他の計算機に転送し
    、そこで閾値と結合係数の調整を実行した後にその調整
    結果を再び文字認識装置に転送することが可能であるこ
    とを特徴とする請求項2記載の文字認識装置。 17、認識動作モードとして文字認識装置以外の装置か
    らの認識開始の指令で文字を認識して認識結果を他の装
    置に送信する自動認識モードと、文字認識装置以外の装
    置からの認識開始の指令で文字を認識して文字の判別結
    果を表す出力ユニットの各出力値のうち最大の値があら
    かじめ設定された半自動判別閾値以下の場合にはユーザ
    に認識結果の確認を求め誤っている時には対話型で認識
    結果を修正した後に認識結果を他の装置に送信する半自
    動認識モードと、認識開始の指令をキーボードより入力
    して文字を認識し認識結果をモニタ画面に表示する手動
    認識モードとの3つのモードを有することを特徴とする
    請求項1記載の文字認識装置。 18、閾値と結合係数の調整処理を文字認識の処理をし
    ながら実行することが可能である請求項2記載の文字認
    識装置。 19、閾値と結合係数の調整処理を文字認識の処理をし
    ながら実行するかしないかを指定することが可能である
    請求項18記載の文字認識装置。 20、中間ユニット群の各中間ユニットに対して中間ユ
    ニットの出力の取り得る最大値からその中間ユニットの
    出力値を減算した値を出力する反転中間ユニットを設け
    た請求項1記載の文字認識装置。 21、中間ユニットと反転中間ユニットの結合係数から
    、反転中間ユニットを取り除いた状態で反転中間ユニッ
    トを取り除かない状態と同様の結果を出力する結合係数
    を求め、文字の判別を行うさいには反転ユニットを取り
    除いた状態で実行することを特徴とする請求項20記載
    の文字認識装置。 22、閾値と結合係数の調整処理をするさいに文字の位
    置ずれ範囲と明るさの変動範囲を指定すると、調整に用
    いるサンプル画像から位置ずれを生じた画像および明る
    さの変動した画像を自動的に生成して調整処理を行うよ
    うにした請求項2記載の文字認識装置。 23、1つの入力ユニットの出力値か、あるいは複数の
    入力ユニットの出力値の平均値のいずれかを2つ求め、
    この2つの値を組み合わせて演算し、この演算結果を中
    間ユニットの入力値とすることを特徴とする請求項1記
    載の文字認識装置。 24、入力ユニットの組合せについて、この組合せを任
    意に設定あるいは変更が可能な機能を有する請求項23
    記載の文字認識装置。 25、結合係数の初期値設定の方法に関して、1つのサ
    ンプリングした画像の入力ユニットの値を計算し、その
    値から結合係数の初期値を自動設定できる機能を持つこ
    とを特徴とする結合係数の初期値決定方法。 26、結合係数の初期値設定の方法に関して、あらかじ
    め多変量解析の手法により結合係数を求める結合係数の
    決定方法。 27、複数文字よりなる文字列を認識するさいに文字列
    のカラムごとに認識対象文字の種類の指定が可能な文字
    認識装置において、各カラムに対して閾値と結合係数は
    すべて共通で認識判定の時に指定された認識対象文字の
    中から文字判定することを特徴とする請求項2記載の文
    字認識装置。 28、請求項4記載のウィンドウ内領域での画像処理の
    種類として、第4項記載のウィンドウ内での画像処理の
    ほかに、ウィンドウ内での2次微分機能と、ウィンドウ
    内での二値化画像に対するエッジ抽出機能と、ウィンド
    ウ内での二値化画像の白領域の面積あるいは黒領域の面
    積をカウントする画像処理機能を備えていることを特徴
    とする文字認識装置。
JP02110045A 1989-04-28 1990-04-27 文字認識方法及びその装置 Expired - Lifetime JP3039954B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1-107844 1989-04-28
JP10784489 1989-04-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP11077222A Division JPH11316799A (ja) 1989-04-28 1999-03-23 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0373084A true JPH0373084A (ja) 1991-03-28
JP3039954B2 JP3039954B2 (ja) 2000-05-08

Family

ID=14469495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02110045A Expired - Lifetime JP3039954B2 (ja) 1989-04-28 1990-04-27 文字認識方法及びその装置

Country Status (4)

Country Link
US (1) US5144683A (ja)
EP (1) EP0395068B1 (ja)
JP (1) JP3039954B2 (ja)
DE (1) DE69028337T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002015277A (ja) * 2000-05-19 2002-01-18 Xerox Corp ハードコピー・ドキュメントのための画像データ生成方法及び同装置
JP2004246478A (ja) * 2003-02-12 2004-09-02 Fuji Xerox Co Ltd 画像探索装置
JP2008241908A (ja) * 2007-03-26 2008-10-09 Mitsubishi Electric Corp 投写型表示装置

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0612035B1 (en) * 1993-02-19 2002-01-30 International Business Machines Corporation Neural net for the comparison of image pattern features
US5553168A (en) * 1994-01-21 1996-09-03 Texas Instruments Incorporated System and method for recognizing visual indicia
US5917942A (en) * 1995-12-28 1999-06-29 Motorla, Inc. Device and method for handwriting recognition with adaptive weighting of recognition data
US6091846A (en) * 1996-05-31 2000-07-18 Texas Instruments Incorporated Method and system for anomaly detection
US6292582B1 (en) 1996-05-31 2001-09-18 Lin Youling Method and system for identifying defects in a semiconductor
US6205239B1 (en) 1996-05-31 2001-03-20 Texas Instruments Incorporated System and method for circuit repair
US6246787B1 (en) 1996-05-31 2001-06-12 Texas Instruments Incorporated System and method for knowledgebase generation and management
US6208772B1 (en) * 1997-10-17 2001-03-27 Acuity Imaging, Llc Data processing system for logically adjacent data samples such as image data in a machine vision system
JP2002032751A (ja) * 2000-07-18 2002-01-31 Olympus Optical Co Ltd 学習型画像分類装置及び方法並びにその処理プログラムを記録した記録媒体
US6950555B2 (en) * 2001-02-16 2005-09-27 Parascript Llc Holistic-analytical recognition of handwritten text
US20020180752A1 (en) * 2001-04-02 2002-12-05 Pelco Device and method for displaying variable brightness characters
US20040169684A1 (en) * 2003-02-28 2004-09-02 Dave Orth Linking images for navigation
KR100584344B1 (ko) * 2003-06-10 2006-05-26 삼성전자주식회사 영상입력부를 가진 휴대용 단말기에서 문자를 인식하는 방법
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
US20080021831A1 (en) * 2006-07-19 2008-01-24 Andrew Blaikie Methods of processing a check in a payee positive pay system
CN109871521A (zh) * 2019-01-08 2019-06-11 平安科技(深圳)有限公司 一种电子文档的生成方法及设备
CN113505794B (zh) * 2021-07-13 2023-06-23 树蛙信息科技(南京)有限公司 文本识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5422728A (en) * 1977-07-21 1979-02-20 Nec Corp Character identifying system suited for reading of variable character set
JPS62166483A (ja) * 1986-01-20 1987-07-22 Ricoh Co Ltd 文字認識装置の認識文字選択方法
JPS6336390A (ja) * 1986-07-31 1988-02-17 Toshiba Corp チエツクデジツト処理方式
JPS6337490A (ja) * 1986-08-01 1988-02-18 Matsushita Electric Ind Co Ltd 文字認識装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH591726A5 (ja) * 1973-07-30 1977-09-30 Nederlanden Staat
US4566126A (en) * 1982-04-30 1986-01-21 Fuji Electric Company, Ltd. Pattern discriminator
FR2553013B1 (fr) * 1983-10-10 1986-09-05 Cegedur Procede et dispositif pour la realisation de bandes metalliques renforcees
US4783838A (en) * 1984-12-26 1988-11-08 Konishiroku Photo Industry Co., Ltd. Image processing method and apparatus therefor
US4783827A (en) * 1985-05-27 1988-11-08 Fuji Electric Co., Ltd. Serial data processing apparatus
JPH0715703B2 (ja) * 1986-05-16 1995-02-22 富士電機株式会社 文字読取方式
US4903313A (en) * 1986-07-03 1990-02-20 Ricoh Company, Ltd. Character recognition method
CA1318977C (en) * 1987-07-22 1993-06-08 Kazuhito Hori Image recognition system
JPH0664631B2 (ja) * 1987-09-09 1994-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5422728A (en) * 1977-07-21 1979-02-20 Nec Corp Character identifying system suited for reading of variable character set
JPS62166483A (ja) * 1986-01-20 1987-07-22 Ricoh Co Ltd 文字認識装置の認識文字選択方法
JPS6336390A (ja) * 1986-07-31 1988-02-17 Toshiba Corp チエツクデジツト処理方式
JPS6337490A (ja) * 1986-08-01 1988-02-18 Matsushita Electric Ind Co Ltd 文字認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002015277A (ja) * 2000-05-19 2002-01-18 Xerox Corp ハードコピー・ドキュメントのための画像データ生成方法及び同装置
JP2004246478A (ja) * 2003-02-12 2004-09-02 Fuji Xerox Co Ltd 画像探索装置
JP2008241908A (ja) * 2007-03-26 2008-10-09 Mitsubishi Electric Corp 投写型表示装置

Also Published As

Publication number Publication date
EP0395068B1 (en) 1996-09-04
EP0395068A2 (en) 1990-10-31
JP3039954B2 (ja) 2000-05-08
US5144683A (en) 1992-09-01
DE69028337D1 (de) 1996-10-10
EP0395068A3 (en) 1992-09-02
DE69028337T2 (de) 1997-01-09

Similar Documents

Publication Publication Date Title
JPH0373084A (ja) 文字認識方法及びその装置
US20190266434A1 (en) Method and device for extracting information from pie chart
KR100248917B1 (ko) 패턴인식장치및방법
US20090169066A1 (en) Multidirectonal face detection method
US20070122036A1 (en) Information processing apparatus and control method therefor
US20150262030A1 (en) Image processing device, image processing method, and image processing program
CN108579094B (zh) 一种用户界面检测方法及相关装置、系统和存储介质
CN107609575A (zh) 书法评价方法、书法评价装置和电子设备
JP3795238B2 (ja) 文書画像処理装置及び文書画像処理方法
EP0457534A2 (en) Image processing method and apparatus
US11906441B2 (en) Inspection apparatus, control method, and program
CN115984875B (zh) 一种硬笔楷书临摹作品的笔画相似性评价方法及系统
CN111046770A (zh) 一种照片档案人物自动标注方法
CN107209862A (zh) 程序、信息存储介质以及识别装置
CN114187445A (zh) 识别图像中文本的方法、装置、电子设备及存储介质
JPH07271916A (ja) 学習パターン生成装置及びこれを用いた文字認識装置
JPH11316799A (ja) 文字認識装置
CN114116474A (zh) 一种软件校验方法、装置、电子设备及存储介质
TWM618756U (zh) 影像識別系統
WO1988002157A1 (en) Character and pattern recognition machine and method
CN115497106B (zh) 基于数据增强和多任务模型的电池激光喷码识别方法
JP3037727B2 (ja) Ocrシステム
JP2812391B2 (ja) パターン処理方法
CN116524304A (zh) 一种基于YOLOv7优化的答题卡填涂方式检测方法
JP2001282785A (ja) 文書画像処理装置およびそのための方法、ならびに文書画像処理プログラムを記録したコンピュータで読取可能な記録媒体