JPH0766423B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0766423B2
JPH0766423B2 JP58071372A JP7137283A JPH0766423B2 JP H0766423 B2 JPH0766423 B2 JP H0766423B2 JP 58071372 A JP58071372 A JP 58071372A JP 7137283 A JP7137283 A JP 7137283A JP H0766423 B2 JPH0766423 B2 JP H0766423B2
Authority
JP
Japan
Prior art keywords
character
word
similarity
registered
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58071372A
Other languages
English (en)
Other versions
JPS59197974A (ja
Inventor
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP58071372A priority Critical patent/JPH0766423B2/ja
Publication of JPS59197974A publication Critical patent/JPS59197974A/ja
Publication of JPH0766423B2 publication Critical patent/JPH0766423B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B31/00Arrangements for the associated working of recording or reproducing apparatus with related apparatus
    • G11B31/006Arrangements for the associated working of recording or reproducing apparatus with related apparatus with video camera or receiver

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、例えば手書入力された、あるいは音声入力さ
れたn文字からなる単語を簡易に且つ効果的に認識し得
る文字認識、あるいは音声認識装置に関する。なお、本
明細書では、手書入力されたパターン及び音声入力され
たパターンのいずれも文字として説明を行なう。
〔発明の技術的背景とその問題点〕
文字を認識する場合、基本的にはその文字の特徴を検出
して行なわれるが、n文字からなる単語を認識する時、
個々の文字をそれぞれ認識し、その結果を組み合せるだ
けでは不十分なことが多く、或る文字の認識が不十分な
場合にはその単語を認識することが困難となる。そこで
従来では、第1図3に示すように単語照合部を構成し、
有意の単語が格納されている単語辞書を検索することに
よつて個々の文字認識が不十分な場合であつても、その
単語を認識するような工夫が施されている。(特願昭56
−138163号参照)この場合、単語を構成するn文字が、
まず文字認識部1において認識され、その結果であるB
i,j(j=1,n;i=1,r)が5の候補文字レジスタに格納
される。ここでBi,jは単語内の文字位置jにある文字を
認識した時のi番目の候補文字の文字コードである。次
に単語辞書メモリ4に格納されている単語の文字コード
と、前記文字コードの比較がコンパレータ6にて行なわ
れ、その結果これらの一致出力が得られた時、その候補
順位に基づいて9の一致度計算部にて該単語と入力され
た単語との一致度計算が行なわれる。
しかしながらこの方式では文字コードの一致検査を行な
うために、文字ごとに候補文字レジスタ5を候補数K回
検索しなければならず、この為の時間を要し処理時間が
長くなり、また制御回路が複雑であり不具合が生じてい
た。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、簡易にかつ高速度に単語辞書と
入力単語の比較を行なつて単語認識を効果的に行なう事
のできる文字認識装置を提供することにある。
〔発明の概要〕
即ち本発明はn文字からなる入力単語の各文字Ai(i=
1,…,n)につきそれぞれ認識を行う。このとき、各文字
毎にその文字Aiと文字認識辞書にL個登録されている認
識対象文字Bk(k=1,…,L)との類似度Sk,i(または相
違度)を求める。この類似度Sk,iを類似度メモリの、Bk
(認識対象文字)とi(入力単語内文字位置)とによっ
て決まる格納位置に格納する。
一方単語辞書メモリには認識対象となる単語が登録され
ており、この単語の各文字Ciとi(単語内文字位置)と
によって決まる格納位置に格納されている類似度を、前
記の類似度メモリから得る。これを単語内の文字それぞ
れについて行って得られるn個の類似度に基づいて、入
力単語{Ai}と単語辞書の単語{Ci}との一致度を計算
する。この一致度の高いX個の単語を候補単語として選
び出すことによつて認識候補となる単語を厳選し、これ
によつて高速度で適確な認識を簡易に行なう事を可能と
して、上述した目的を効果的に達成したものである。
〔発明の効果〕
従つて本発明によれば単語の一致度計算における類似度
の検索が、文字Ciと文字位置iによつてあらかじめ決め
られるメモリ位置の参照だけであるので、制御回路が簡
単化され、また、認識処理時間も大幅に短縮される。従
つてきわめて効果的な実用性の高い文字認識が可能とな
り絶大なる効果を奏する。
〔発明の実施例〕
以下図面を参照して本発明の実施例につき説明する。第
3図は実施例装置の概略構成図である。
n文字からなる文字列として与えられる入力単語は文字
認識部20にて各文字につきそれぞれ認識される。ここで
の認識とは、たとえば入力された単語内文字Aiの特徴パ
ターンと認識対象文字Bkごとにあらかじめ作成されてい
る標準パターンとのマツチングを行なう等により、各i
各kについてそれぞれ類似度Sk,iを得る事により実現さ
れる。通常の文字認識においてはこの類似度Sk,iが最大
となる認識対象文字Bk,iを文字位置iごとに求め、これ
を認識結果として出力する事によつて認識を行なつてい
る。
本発明においてはこの類似度Sk,iを類似度メモリ17に格
納する。この時、メモリには文字Bkと文字位置iとに対
応してあらかじめ定められている格納位置があり、そこ
へSk,iを格納する。たとえば、このBkの文字コードに文
字位置iの値を加えあわせて、類似度メモリのアドレス
とし、このアドレスによつて類似度メモリをアクセスす
るようにすればよい。
また、単語辞書メモリ12には認識対象となる単語が複数
個登録されており、この単語と入力単語の一致度を計算
して、その一致度の高いものX個を認識結果として出力
する。以下この方法について述べる。単語辞書に登録さ
れている各単語内の文字を文字位置をiとしてCiで表わ
す。このCiとiによつて定まる類似度メモリ17の格納位
置を21と22の信号線によつて参照し、その結果を23の信
号線に得る。類似度メモリ17には、前述したように、文
字Bkと文字位置iとによって定まる格納位置に、入力単
語内文字Aiのパターンと認識対象文字Bkのパターンとの
類似度Sk,iが格納されているのであるから、単語辞書の
単語内の文字Ciと文字位置iとによって定まる類似度メ
モリ17の格納位置を参照すれば、入力単語内文字Aiのパ
ターンと文字Ciのパターンとの類似度が格納されている
はずである。すなわち、23の信号線に得られる結果は、
入力単語の文字位置iの文字AiとCiとの類似度(これを
Siと呼ぶ)である。このSiを各iごとに求めるように制
御部27はアドレスカウンタ25と文字位置カウンタ26をイ
ンクリメントする。この様子を第2図で説明すると、単
語辞書メモリ12にC1〜C3の文字からなる単語13が登録さ
れており、文字C1についてはC1とi=1によって定まる
類似度メモリ17の格納位置14を、文字C2についてはC2と
i=2によって定まる類似度メモリ17の格納位置15を、
文字C3についてはC3とi=3によって定まる類似度メモ
リ17の格納位置16を参照する。このようにして求められ
たn個の類似度は一致度計算部18へ送られて、入力単語
{Ai}i=1,nと辞書単語{Ci}i=1,nの一致度を計算
する。この一致度の例としてたとえば、 などがある。たとえば(1)式の場合には一致度計算部
18はアキユムレータになる。
第2図では、格納位置14の類似度Sk,1、格納位置15のS
k′,2、格納位置16のSk′,3を足し合わせることにな
る。
このようにして算出された一致度は単語辞書に登録され
ている単語のうち照合する必要のあるものすべてについ
て求められ、このうち一致度の大きなものX個が制御部
27でソート処理によつて選択され、24の信号線を介して
外部の文字認識装置の制御部19へ単語の認識結果として
出力される。
尚、本発明は上記した実施例以外に種々変形して実施す
る事が可能である。
たとえば上記の類似度メモリ17に、文字認識した際の類
似度のかわりに、この類似度を各認識対象文字について
大きい順にソートした時の順位を格納しても良い。な
お、この場合の順位は相違度となる。
また、類似度がすべての認識対象文字について求められ
ていないケースでは、その求められていない類似度のか
わりに一定値を類似度として付与して前記の単語の一致
度計算を行なつても良い。
前記の説明ではソートを制御部27で行なつていたが、こ
れを24を介した外部の文字認識装置の制御19で行なつて
も良いし、一致度計算部18の出力に閾値回路をもうけ
て、ここで一致度が閾値以下の単語を棄却してこの場合
にはソート処理を省略しても良い。
また、単語辞書メモリ12と類似度メモリ17を共有化する
事も可能である。
この他、単語認識部へ送るデータを前述した類似度だけ
でなく、分類等を示す属性データを付加したものとし、
単語辞書内を領域分割して分類項毎にその属性に属する
単語を登録しておけば、辞書の照合範囲をしぼることが
でき、認識処理の効率向上を図ることが可能となる。ま
た単語辞書に登録する単語ごとにその属性を付加してお
き、属性が一致しない単語については認識対象から除外
するようにしてもよい。このようにすれば単語選択の誤
りを減少させることが可能となる。
また、単語辞書に、単語の文字コードと共に、結果とし
て出力する単語の属性、例えば単語に対応して定められ
る特殊なコードを登録しておけば、文字認識対象外の文
字を含む単語の認識することが可能となる。即ち、単語
に含まれる認識対象外の文字をその文字に似た認識対象
の文字に置換え、この置換えられた単語を辞書に登録す
る。そして、この単語には本来の正しい単語を属性とし
て付加しておき、この単語が認識されたとき、上記属性
として付加された単語を出力するようにすればよい。こ
のようにすれば、見掛上、認識対象以外の文字を含む単
語をも幅広く認識することが可能となる。
更には、上記した属性のみならず、単語の図形としての
特徴、つまり複雑さ(ストローク数)やループ数(黒で
囲まれた領域数)等の情報を併用して認識処理するよう
にしてもよい。また単語の使用頻度の情報を登録して、
使用頻度の高い単語については高い一致度を得るように
して、実用的な照合を行なわせるようにしてもよい。た
とえば頻度に基づき設定された値を辞書に登録してお
き、一致度にこの値をさらに加算する等して、新たな一
致度を算出し、これに基づいて認識結果としての単語を
得れば良い。
要するに本発明は、その要旨を逸脱しない範囲で種々変
形して実施することができる。
【図面の簡単な説明】
第1図は従来装置の一例を示す概略構成図、第2図は本
発明の概念を説明する図、第3図は本発明の一実施例の
概略構成図である。 1,20……文字認識装置、2……編集部、 3,28……単語照合部、 4,12……単語辞書メモリ、5……候補文字レジスタ 6……コンパレータ、7……単語辞書レジスタ、 8……レジスタカウンタ、9,18……一致度計算部、 10,25……アドレスカウンタ、 11……ソート処理部、13……単語データ、 14,15,16……類似度格納位置、 17……類似度メモリ、19……文字認識制御部、 21,22,23,24……信号線、 26……文字位置カウンタ、27……制御部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】入力単語の各文字の特徴パターンと予め用
    意した複数個の認識対象文字の各標準パターンとの類似
    度を、入力文字毎に求める文字認識手段と、 この文字認識手段により求められた類似度をそれぞれ前
    記認識対象文字と前記文字の前記入力単語内での文字位
    置とによって定められる格納位置に格納する類似度記憶
    手段と、 単語辞書に予め登録された、前記認識対象文字のうちの
    必要な組み合わせからなる登録単語について、前記類似
    度記憶手段の、各登録単語内の各文字とその登録単語内
    での各文字位置とによって定められる格納位置に格納さ
    れた前記類似度を各文字対応に読み出し、前記登録単語
    毎に、前記各文字対応に読み出した類似度に基づいて前
    記入力単語と前記登録単語との一致度を算出する一致度
    計算手段とを具備し、 前記一致度計算手段により求められた一致度の高い登録
    単語を認識候補単語として選択するようにしたことを特
    徴とする文字認識装置。
  2. 【請求項2】前記類似度記憶手段に格納される類似度
    を、類似度が大きい順にソートした順位とするものであ
    る特許請求の範囲第1項記載の文字認識装置。
  3. 【請求項3】前記単語辞書は属性毎に単語を分類して登
    録しており、該当する属性の単語を認識対象とするもの
    である特許請求の範囲第1項記載の文字認識装置。
  4. 【請求項4】前記単語辞書は登録単語とともに使用頻度
    情報を記憶しており、前記一致度計算手段はこの使用頻
    度情報を併用して前記一致度を算出するものである特許
    請求の範囲第1項記載の文字認識装置。
JP58071372A 1983-04-25 1983-04-25 文字認識装置 Expired - Lifetime JPH0766423B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58071372A JPH0766423B2 (ja) 1983-04-25 1983-04-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58071372A JPH0766423B2 (ja) 1983-04-25 1983-04-25 文字認識装置

Publications (2)

Publication Number Publication Date
JPS59197974A JPS59197974A (ja) 1984-11-09
JPH0766423B2 true JPH0766423B2 (ja) 1995-07-19

Family

ID=13458600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58071372A Expired - Lifetime JPH0766423B2 (ja) 1983-04-25 1983-04-25 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0766423B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0640352B2 (ja) * 1984-12-29 1994-05-25 株式会社東芝 文字認識装置
JPS63116283A (ja) * 1986-11-04 1988-05-20 Mitsubishi Electric Corp 日本文読取り装置
JPH01156876A (ja) * 1987-12-14 1989-06-20 Toshiba Corp パターン認識装置
JP2739945B2 (ja) * 1987-12-24 1998-04-15 株式会社東芝 音声認識方法

Also Published As

Publication number Publication date
JPS59197974A (ja) 1984-11-09

Similar Documents

Publication Publication Date Title
US5267332A (en) Image recognition system
US20050074169A1 (en) Holistic-analytical recognition of handwritten text
US20230015054A1 (en) Text classification method, electronic device and computer-readable storage medium
JPH0664631B2 (ja) 文字認識装置
US6978044B2 (en) Pattern string matching apparatus and pattern string matching method
CN111930933A (zh) 一种基于人工智能的检务案件处理方法及装置
JPS6120038B2 (ja)
JPH0766423B2 (ja) 文字認識装置
US20230229683A1 (en) Document search device, document search system, document search program, and document search method
JP3602084B2 (ja) データベース管理装置
JP2002183667A (ja) 文字認識装置及び記録媒体
EP0519737A2 (en) Image recognition system
JP3374762B2 (ja) 文字認識方法及びその装置
JP2851865B2 (ja) 文字認識装置
JPH0795337B2 (ja) 単語認識方式
JP2622004B2 (ja) 文字認識装置
JP2982244B2 (ja) 文字認識後処理方式
JP2923295B2 (ja) パターン同定処理方式
JPH03154985A (ja) 最尤度単語認識方式
JPH1011543A (ja) パターン認識用辞書作成装置及びパターン認識装置
JPH0746373B2 (ja) 単語認識装置
JP2969751B2 (ja) 文字認識処理方式
JPH03189890A (ja) 複合語照合方法
JPS60147888A (ja) 文字認識後処理方法及びその装置
JPS5953986A (ja) 文字認識装置