JPS6037957B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6037957B2
JPS6037957B2 JP55100296A JP10029680A JPS6037957B2 JP S6037957 B2 JPS6037957 B2 JP S6037957B2 JP 55100296 A JP55100296 A JP 55100296A JP 10029680 A JP10029680 A JP 10029680A JP S6037957 B2 JPS6037957 B2 JP S6037957B2
Authority
JP
Japan
Prior art keywords
feature
dictionary
character
circuit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55100296A
Other languages
English (en)
Other versions
JPS5725080A (en
Inventor
敬久 藤井
孝弥 藤田
栄一郎 山本
秀明 菅原
清徳 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP55100296A priority Critical patent/JPS6037957B2/ja
Publication of JPS5725080A publication Critical patent/JPS5725080A/ja
Publication of JPS6037957B2 publication Critical patent/JPS6037957B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、文字認識装置、特に認識対象文字についての
標準特徴パターン情報を複数個格納している特徴辞書に
分散比を計算するための平均辞書を分散辞書とをもうけ
、特徴辞書情報の標準辞書パターンと認識対象文字から
抽出された特徴パターンとを照合して選定された候補カ
テゴリに対し、上記分散比の重み付けを行なって再度照
合処理を実行するようにした文字認識装置に関するもの
である。
従来の文字認識装置における特徴照合部では次の如き照
合処理が行なわれている。
即ち認識対象文字から得られる多数の特徴値と標準辞書
内に予め用意されている各カテゴリの標準特徴パターン
との距離を求め、その距離から得られる不一致度の最も
小さいカテゴリを答とする方式が採用されている。上記
抽象的説明を具体的に説明すると、入力対象文字の特徴
ベクトルxとして入力特徴ベクトルx=(x,,杉,…
…,xN) ......
.・・{1}但しNは特徴の次元数を表わすまたカテゴ
リhについての標準特徴パターン辞書として平均をrh
と分散を。
hとを用意したとするとき平均辞書ムh=(r?,ムg
,・・・・・・ムb)・・・・・・【2’分散辞書oh
:(OT,r窒,・・・・・・,OQ).・・.・・‘
31で与えられる。
この場合の入力対象文字とカテゴリhの上記標準特徴パ
ターン辞書との不一致度D■は次の式で与えられる。不
一致度D ・….・【4} 不一致度として例えば d(力,rl,。
i)=l×i−ril/ひi等が用いられる。しかしな
がら認識対象文字の中に相似かよったカテゴリが多数あ
る場合には、不一致度D■の最も小さいもの以外のもの
もその値に非常に近くなるD■が存在する。
このような場合、不一致D■の最も4・さし、カテゴリ
hを答としたのでは誤認識が生じやすく、正解は上記最
4・一致度D■に近い次の最4・値D■のカテゴリPで
あることが起り得る。このような事態が起るのは入力対
象文字から抽出された特徴ベクトルxの各特徴要素幻を
均等に標準特徴パターン辞書と照合していることに起因
している。本発明は、上記の点を解決することを目的と
しており、上記の如く標準特徴パターン辞書との照合で
選出された候補カテゴリに対し、分散比を重みとする重
み付けを付した特徴と入力対象文字の特徴との照合を再
度実行し、認識精度の向上をかかった文字認識装置の提
供を目的としている。
そしてそのため本発明の文字認識装置は入力文字から特
徴パターンを抽出する特徴抽出回路をそなえ、認識対象
文字についての標準特徴パターン情報を複数個格納して
いる特徴辞書をそなえ、該特徴辞書から読出された特徴
パターン情報と認識対象文字から抽出された特徴パタ−
ンとを照合して入力対象文字を認識する文字認識装置に
おいて、上記特徴辞書が認識対象文字の平均値情報及び
分散値情報をそれぞれ格納している平均辞書及び分散辞
書とをそなえた構成をなし、これら辞書からの情報に基
づいて照合処理のなされた認識対象文字の候補カテゴリ
を選択する候補カテゴリ判定回路をもうけ、かつ選択さ
れた候補カテゴリに対応して再照合のための重みを計算
するための分散比計算回路をもうけ、特徴辞書情報と認
識対象文字から抽出された特徴パターンとを照合して選
出された候補カテゴリに対し、上記重み付けを行なった
上で再度照合処理を実行するようにしたことを特徴とし
ている。以下図面を参照しつつ説明する。第1図は入力
特徴ベクトルxの特徴次元xMに対する各認識対象文字
についての頻度分布曲線図、第2図は本発明の一実施例
構成を示している。
第1図において、藤軸は入力特徴ベクトルxの特徴次元
xMの特徴値を、縦軸は頻度をそれぞれ表わす。
式{4’の不一致度計算式を用いて選出されたn個候補
カテゴリについて入力特徴ベクトルxの特徴次元xMに
関する頻度曲線は一般に第1図の如く分布する。理解し
やすくするために具体的な例を挙げて説明すると、例え
ばn個の候補カテゴリが左の山から右の山への順に文字
「大ハ「大ハ「大ハ「夫」であり、入力特徴ベクトルx
の特徴次元xMに2値化信号の「黒」の数が特徴値に選
ばれている場合「各文字毎に第1図の如き分布をなすと
考えられる。そして山,は文字「大一に関する特徴「黒
」の数の平均値を表わし、。≧はその分散値を表わす。
同様にriは文字「大一に関する特徴「黒」の数の平均
値を表わし、。;はその分散値を表わしている。以下文
字「太一、「夫」についても同機である。ここで上記従
来の文字認識装置に用いられている特徴照合処理につい
て検討してみるに、式【41で選出された候補カテゴリ
は式【1}の入力特徴ベクトルxの各要素である特徴広
,,x2,・・・・・・,xNについて各々均等に評価
されて不一致度計算に関与している。
この候補カテゴリn個の中から入力対象文字に相当する
文字を認識するには、更に詳細な識別を行なうことが必
要となる。これら候補カテゴリ内での識別を行なうに当
っては、入力特徴ベクトルxの要素幻のうち識別に有効
に作用するものとそれ程有効性を持たないものとが存在
する。そこで上記候補カテゴリ内において、認識対象文
字を有効に識別するためには、自己の属するカテゴリ内
則ち級内の変動についてはそれを安定に吸収し「各カテ
ゴリ間即ち級間においてはその相違を明確にする特徴を
選択することが望まれる。第1図を用いて説明すると、
例えば左から2番目の山と左から3番号の山との間すな
わち級間が重なり合う度合が少なく、山と山とが明確に
区別できることであり、また山自身の広がりが挟く分布
していること則ち分散。;が小さければ隣接する山同志
が重なり合うことが少ないことを視覚的に表現している
。第1図は入力特徴ベクトルxの特徴xMについての頻
度曲線であるが、このような山と山とを明確に区別でき
る特徴次元については上記候補カテゴリ内での特徴照合
処理において、より重要な特徴次元として大きく評価す
れば認識精度の向上が期待される。
上記の如き評価の尺度として「分散**比」が知られて
おり、該分散比を入力特磯ベクトルxの重み付けを行な
って特徴照合処理に導入する。なお上記分散比は候補カ
テゴリ数をnとしてとき次式で与えられる。上式■から
求められた分散比のiを式{1}の入力特徴ベクトルx
の各特徴次元刈こ重みとして各特徴次元幻と辞書との距
離に掛け算を行なって積をとり、特徴次元xiの中から
有効な特徴を重視するようにして不一致度を求める。
候補カテゴリ数がnのときの上記分散比のiを重み付け
となしたカテゴリh‘こ対する不一致度D■は次式で与
えられる。不一致度D ….・・{6) 式{6)により得られる不一致度D■の中で最も値が小
さいカテゴリを答とすれば、式{4)で得られるカテゴ
リよりも精度の高い識別が可能となる。
第2図は本発明の−実施例構成を示しており、符号1は
観測回路、2は前処理回路、3は特徴抽出回路、4は識
別回路、5は候補カテゴリ判定回路、6は分散辞書、7
は平均辞書、8は分算比計算回路、9は識別回路をそれ
ぞれ表わしている。認識対象の入力文字が観測回路1に
入力され、該観測回路1で標本化。2値量子化等の処理
がなされたパターン信号が前処理回路2へ送られる。
該前処理回路2で雑音除去、切り出し、正規化等の処理
を経て特徴抽出回路3へ送られる。特徴抽出回路3では
入力文字の特徴ベクトル式【11の特徴次元xjが抽出
され、該抽出された特徴xが識別回路4に送られる。識
別回路4では平均辞書7および分散辞書6からそれぞれ
rhと。hとが得られ、式{4}により不一致度が計算
される。そしてカテゴリ名と不一致度とが出力され、候
補カテゴリ判定回路5に入力される。ここで不一致度が
閥値以下にあるカテゴリ名が1個のときは当該カテゴリ
が答A,として識別される。一方上記閥値より低い値を
もつ不一致度のカテゴリ名が複数個存在するときは候補
カテゴリとして上記説明の分散比を求めるため、辞書ア
ドレスが候補カテゴリ判定回路5で決定される。該辞書
アドレスに基づいて候補カテゴリの平均辞書7と分散辞
書6との格納辞書内容が謙出されて分散比計算回路8に
入力される。候補カテゴリについての平均辞書および分
散辞書とを受けた分散比計算回路8は式【5}に従がつ
て分散比を計算し、その結果を識別回路9に送出する。
また分散比計算回路8から特徴抽出回路3に対し入力特
徴ベクトルxを読出す特徴議出し信号を送り、入力特徴
ベクトルxを識別回路9に入力させる。また同時に平均
辞書7及び分散辞書6からそれぞれの平均値仏r、分散
値。rが入力されているから、該識別回路9では入力特
徴ベクトルxとの不一致度計算に当って上記分散比計算
回路8で計算された分散比を重み付けして再度照合処理
がなされる。即ち式6による不一致度を計算し、候補カ
テゴリの中から該不一致度の最も小さいカテゴリが答ん
として出力される。以上説明した如く、本発明によれば
、各特徴次元と辞書をの距離から得られる不一致度の値
が小さい複数の候補カテゴリに対し、各特徴次元に分散
比の重み付けをなして有効な特徴に大きい評価も与える
ようにして鎖度照合処理を実行するようにしたことによ
り、謀認識が低下して認識の精度の向上が可能となる。
【図面の簡単な説明】
第1図は入力特徴xの特徴次元xMに対する認識対象文
字の頻度分布曲線の一例、第2図は本発明の一実施例構
成を示す。 図中、1は観測回路、2は前処理回路、3は特徴抽出回
路、4は識別回路、5は候補カテゴリ判別回路、6は分
散辞書、7は平均辞書、8は分散比計算回路、9は識別
回路を各々表わしている。 多l図努Z図

Claims (1)

    【特許請求の範囲】
  1. 1 入力文字から特徴パターンを抽出する特徴抽出回路
    をそなえ、認識対象文字についての標準特徴パターン情
    報を複数個格納している特徴辞書をそなえ、該特徴辞書
    から読出された特徴パターン情報と認識対象文字から抽
    出された特徴パターンとを照合して入力対象文字を認識
    する文字認識装置において、上記特徴辞書が認識対象文
    字の平均値情報及び分散値情報をそれぞれ格能している
    平均辞書及び分散辞書とをそなえた構成をなし、これら
    辞書からの情報に基づいて照合処理のなされた認識対象
    文字の候補カテゴリを選択する候補カテゴリ判定回路を
    もうけ、かつ選択された候補カテゴリに対応して再照合
    のための重みを計算するための分散比計算回路をもうけ
    、特徴辞書情報と認識対象文字から抽出された特徴パタ
    ーンとを照合して選出された候補カテゴリに対し、上記
    重み付けを行なつた上で再度照合処理を実行するように
    したことを特徴とする文字認識装置。
JP55100296A 1980-07-22 1980-07-22 文字認識装置 Expired JPS6037957B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55100296A JPS6037957B2 (ja) 1980-07-22 1980-07-22 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55100296A JPS6037957B2 (ja) 1980-07-22 1980-07-22 文字認識装置

Publications (2)

Publication Number Publication Date
JPS5725080A JPS5725080A (en) 1982-02-09
JPS6037957B2 true JPS6037957B2 (ja) 1985-08-29

Family

ID=14270202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55100296A Expired JPS6037957B2 (ja) 1980-07-22 1980-07-22 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6037957B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58166490A (ja) * 1982-03-26 1983-10-01 Comput Basic Mach Technol Res Assoc 文字認識方式
JPS58169683A (ja) * 1982-03-31 1983-10-06 Fujitsu Ltd 類似パタ−ン識別処理方式
JPS59192A (ja) * 1982-06-25 1984-01-05 株式会社東芝 個人照合装置
JP2537251B2 (ja) * 1987-11-21 1996-09-25 株式会社日立製作所 原子炉炉心の運転方法

Also Published As

Publication number Publication date
JPS5725080A (en) 1982-02-09

Similar Documents

Publication Publication Date Title
US4651289A (en) Pattern recognition apparatus and method for making same
CN110569837B (zh) 优化损伤检测结果的方法及装置
US6259812B1 (en) Key character extraction and lexicon reduction cursive text recognition
Hassanpour et al. Feature extraction for paper currency recognition
US5917941A (en) Character segmentation technique with integrated word search for handwriting recognition
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
CN105023027A (zh) 基于多次反馈机制的现场鞋底痕迹花纹图像检索方法
CN110852364A (zh) 矿井突水水源识别方法、装置与电子设备
US5542518A (en) Method of identifying the denominations of pieces of paper
KR970022829A (ko) 지문카드 선택장치 및 지문카드 찾기장치
US6694054B1 (en) Pattern recognition process
JPS6037957B2 (ja) 文字認識装置
CN114168788A (zh) 音频审核的处理方法、装置、设备及存储介质
Wahlberg Gaussian process classification as metric learning for forensic writer identification
CN115470772A (zh) 一种用于事件检测的语义感知方法
JP2985893B2 (ja) パターン認識装置
KR100441706B1 (ko) 인식사전최적화방법
JP3174187B2 (ja) ガス識別装置
JP3359173B2 (ja) 媒体の真偽鑑別装置
Johannesen et al. Using weighted minutiae for fingerprint identification
Rashid et al. Convolutional Neural Network Approach for Precise Fingerprint Recognition
JPS6252912B2 (ja)
JPS60132281A (ja) 文字分離装置
JP3079202B2 (ja) 文字認識方法及び文字認識装置
JPH08212300A (ja) 文字認識方法及び文字認識装置