JPH01161592A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01161592A
JPH01161592A JP62318999A JP31899987A JPH01161592A JP H01161592 A JPH01161592 A JP H01161592A JP 62318999 A JP62318999 A JP 62318999A JP 31899987 A JP31899987 A JP 31899987A JP H01161592 A JPH01161592 A JP H01161592A
Authority
JP
Japan
Prior art keywords
character
feature
group
features
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62318999A
Other languages
English (en)
Inventor
Seiichiro Yamaguchi
誠一郎 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62318999A priority Critical patent/JPH01161592A/ja
Publication of JPH01161592A publication Critical patent/JPH01161592A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概  要〕 イメージデータからそのイメージデータの文字を認識す
る文字読取位置に関し、 認識時間p短縮を行う文字読取装置を提供することを目
的とし、 読み取った文字画像データに対して、該文字画像データ
の特徴を抽出する特徴抽出手段と、文字単位で該文字の
特徴と該文字のコードとを1グループとして記憶する識
別辞書記憶手段と、該識別辞書記憶手段で記憶する文字
の特徴と文字のグループを記憶する前記識別辞書記憶手
段内の位置とを記憶する大分類辞書記憶手段と、該大分
類辞書記憶手段で記憶するグループの特徴と前記特徴抽
出手段より抽出した特徴とを比較して、より一致してい
るグループの位置を求め、該位置よりグループ内の各文
字の特徴と前記特徴抽出手段より抽出した特徴とを比較
して、より一致している文字を求める照合手段とより成
るように構成する。
〔産業上の利用分野〕
本発明はイメージデータからそのイメージデータの文字
を認識する文字読取装置に関する。
〔従来の技術〕
帳票等に書かれている文字を認識する装置は各方面で開
発され、実用化されている。。
−船釣に上述の文字を認識する装置は帳票上に書かれて
いる文字をイメージスキャナ等で読込んでイメージデー
タとし、2値化している。そしてこの2値化データを用
いて、認識対象文字の特徴を抽出し、予め求められてい
る各文字の特徴を記憶している辞書から順次1文字単位
でその特徴を読出すとともに、前述の認識対象文字の特
徴との距離を計算している。
この距離の計算は順次文字単位で行うものであり、ここ
で求めた距離の最小のものを認識文字としている。
〔発明が解決しようとする問題点〕
前述の従来の認識方式においては、辞書内にあらかじめ
記憶している全文字に対してその特徴の距離を求めなく
てはならない。アルファベットやかな等文字種が少ない
場合にはこの距離計算は単時間で済むが、漢字等をも認
識する場合には、距離計算を、辞書が有する特徴の漢字
分行わなくてはならない。このため漢字を含んで認識す
るのには多くの時間がかかるという問題を有していた。
本発明は上記従来の欠点に鑑み、距離計算を行う文字を
少なくして、認識時間の短縮を行う文字読取装置を提供
することを目的とする。
〔問題点を解決するための手段〕
第1図は本発明の機能ブロック図である。
特徴抽出手段lは入力する文字画像データからその入力
文字の特徴を抽出する回路である。識別辞書記19手段
2は文字単位で該文字の特徴と該文字のコードとを1つ
のグループとして記憶するメモリであり、認識すべき全
ての漢字の特徴を記憶している。大分類辞書記憶手段3
は前記識別辞書記憶手段2で記憶する文字の特徴とグル
ープの位置とを記憶するメモリであり、その構造は識別
辞書記憶手段2と同様の構成であり、識別辞書記憶手段
2で記憶する文字コードの位置に識別辞書内でのグルー
プの先頭アドレスが記憶されている。
照合手段4は特徴抽出手段1から加わった特徴と大分類
辞書記憶手段3内の特徴とを比較して、より一致してい
るグループの位置を前記大分類辞書記憶手段3から求め
、該位置よりグループ内の各文字の特徴と前記特徴抽出
手段lより抽出した特徴とを比較してより一致している
文字を求める回路である。
〔作   用〕
特徴抽出手段1で求めた入力文字データの特徴が加わる
と、照合手段4は大分類辞書記憶手段3で記憶するグル
ープ単位での特徴と特徴抽出手段1から加わわる特徴と
を比較する。この比較は例えば各特徴間の距離を計算す
ることであり、この比較によって最も広く一致している
すなわち距離の少ないグループが求められる。その求め
たグループのアドレスを、大分類辞書記憶手段3から読
出すとともに、識別辞書記憶手段2内の前記アドレス位
置からグループ内の各文字の特徴とを比較すなわち距離
を順次求め、最も良く一致すなわち最も距離の少ないも
のを認識結果とし、出力する。
大分類辞書記憶手段3を用いて大分類を行い、その結果
で詳細な比較を行っているので、全文字に対する比較と
較べその比較回数は少なくなる。
〔実  施  例〕
以下、図面・を用いて本発明の詳細な説明する。
第2図は本発明の実施例のシステム構成図である。パス
ライン5には主制御プロセッサ6、■10ボード7、イ
メージスキャナ8、照合部9、メモリ部10、特徴抽出
部11が接続している。主制御プロセッサ6は文字読取
装置としての後述する各回路や入出力装置の制御を行う
プロセッサであり、図示しないがプログラムを記憶して
いるメモリから順次前述のプログラムの命令を読出して
実行する。例えばパスライン5を介して、文字読取りの
要求が加わると、主制御プロセッサ6はイメージスキャ
ナ8を動作させ、オペレータ等によってセントされてい
る文書を読取る。イメージスキャナ8より読取った文書
のイメージデータは主制御プロセッサ6の制御によって
、パスライン5を介してメモリ部10に格納される。第
3図は主制御プロセッサ6が後述する各回路等を制御し
て処理させる全体の動作処理フローチャートである。
前述したように主制御プロセッサ6に文字の読取要求が
加わると、ビデオデータの読取り処理を行い(S’1)
、イメージスキャナ8から入力したデータをメモリ部l
Oに格納する。そして次には位置決め処理(S2)を行
う。この処理は主制御プロセッサ6が行うものである。
−船釣に文字は、文字が書込まれている領域よりはるか
に広い領域に書込まれる。この処理(S2)においては
、前述の広い領域内から各文字が存在する文字単位での
領域を決定する。
この位置決め処理(S2)が主制御プロセッサ6によっ
てなされると、次には特徴抽出処理(S3)を開始する
。この処理(S3)は主制御プロセ、ツサ6の制御によ
って特徴抽出部11が行うものである。主制御プロセッ
サ6から特徴抽出部11に特徴抽出要求が加わると、特
徴抽出部11は主制御プロセッサ6によって位置決めさ
れた範囲の各文字の特徴を抽出する。
イメージスキャナから読取った文字は複数存在するが、
特徴抽出部11は、位置決めされた範囲内に存在する個
々の文字に対してそれぞれ特徴を求める。この特徴の抽
出については従来と同様である。
特徴抽出部11において求められた特徴は主制御プロセ
ッサ6の制御によって照合部9に加わり、主制御プロセ
ッサ6は照合部9に対し、照合処理(S4)を実行させ
る。
第4図は照合部9の詳細な構成図である。照合部9は制
御部12、特徴用大分類メモリ13、辞書用メモリ14
より成る。前述した特徴抽出部11で求められた1個の
文字の特徴は制御部12内のバスインターフェース部1
5が有するメモリに格納される。そして格納された特徴
は先ず特徴メモリコントロール部16に読出されるとと
もに距離計算回路17に出力される。また、特徴メモリ
コントロール16は、これと同時に順次特徴用大分類メ
モリ13からグループの特徴を読出し、距離計算回路1
7に加える。
特徴用大分類メモリ13には、予め文字の特徴がまとめ
られて各類似した文字群の特徴単位で記憶されている。
第5図は辞書構成図であり、特徴用大分類メモリ13は
ヘッダ部、特徴辞書部の順に各グループの特徴が記憶さ
れている。第6図は特徴用大分類メモリ13内のヘッダ
部の構成図である。コントロール部は各種の状態等を制
御するコードが記憶されており、カテゴリ一部はとのカ
テゴリによって特徴を求めたかを指示するデータが記憶
されている。そして次には次のヘッダ部アドレス、さら
には対応する識別辞書ポインタデータが記憶されている
。本発明の実施例においては第5図に示したようにヘッ
ダ部、特徴辞書部、またヘッダ部と順次ヘッダ部と特徴
辞書部が繰り返されている。・そしてヘッダ部内には次
のヘッダ部アドレスが記憶されているため、前述したよ
うにこの次のヘッダ部アドレスを特徴メモリコン十ロー
ル部16は読出して順次各文字群(グループ)の特徴を
距離計算回路17に加える。
距離計算回路17は特徴用大分類メモリ13に記憶され
た特徴が前述した動作によって加わり、その特徴と先に
加わった入力文字の特徴との距離を求める回路である。
そして求めた相離は上位n個決定部18に出力される。
上位n個決定部18のを記憶する。例えば上位n個決定
部18は3個のグループの応対する識別辞書ポインタデ
ータとその距離とを記憶するレジスタと大小比較回路か
らなり、1個距離計算回路17から加わる結果すなわち
距離を前述のレジスタで記憶す・る距離とを比較し、距
離計算回路17から加わる距離がそのうちの少なくとも
1個より小さい時には、3個のうちの最大の距離を消し
て、距離計算回路17から加わる距離とその対応する識
別辞書ポインタデータとをその消去した位置に記憶する
特徴用大分類メモリ内の最後の特徴であった時にはヘッ
ダ部アドレスには例えば0が記憶されており、特徴メモ
リシントロール16はこの0を検出すると距離計算回路
17の動作を停止し、第1番目の上位n個決定部18で
記憶する対応する識別辞書ポインタデータをバスインタ
ーフェース部15を介して辞書メモリコントロール部1
9に加える。
辞書メモリコントロール部19はこの識別辞書ポインタ
データが加わると、そのポインタデータをもとに、辞書
用メモリ14内の各文字のデータを読出す。辞書用メモ
リ14は8Mbyteのメモリであり、第5図に示した
ようなヘッダ部と特徴辞書部が繰り返された辞書構成を
有している。そして、そのヘッダ部は第7図に示すよう
にコントロール部、カテゴリ一部、次のヘッダ部アドレ
ス、文字コードよりなっている。
そのヘッダ部は特徴用大分類メモリ13が記憶するヘッ
ダ部とほぼ同じ構成であり、異なる点は対応する識別辞
書ポインタデータのかわりに文字コードが記憶されてい
ることである。ヘッダ部の後につづく特徴部のデータが
その文字コードの特徴であることを表している。
辞書メモリコントロール部19は前述したようにポイン
タデータに接続される辞書用メモリ14の特徴を距離計
算回路17に加える。距離計算回路17は前述した動作
の時に入力文字の特徴が加わっているので、辞書用メ干
言月4から加わる特徴との距離を求め辞書メモリコント
ロール部19にこの距離を出力する。辞書メモリコント
。−2゜部19は順次距離計算回路17から加わる距離
の最小値とその文字コードを記憶しており、1個の特徴
文字グループ内での距離が最も小さい文字コードを求め
る。前述したように上位n個決定部18にはn個例えば
3個のグループが記憶されており、前述した動作によっ
て順次nグループ内の各文字の特徴の距離が求められて
最終時にはその3個のグループ内での最も距離の小さい
文字コードが求められる。
前述した照合はイメージスキャナで読取られた全ての文
字に対してなされ、その結果は文字単位でメモリ部10
に加わる。このメモリの格納によって照合処理(S4)
が終了する。
第3図にもどって説明する。この照合処理(S4)が終
了すると次には答えの編集処理(S5)を行って、例え
ば目的の構成としてI10ボード7を介して図示しない
印字装置等に出力する出力処理(S6)を行う。これら
の処理(S5.S6)は全て主制御プロセッサ6の制御
部によってなされる。
以上の動作によってイメージスキャナで読取られた文字
が認識され、文字コード化された後印字される。あるい
は、他の装置に読取結果として出力される。
第8図は特徴用大分類メモリ13に記憶されている大分
類辞書と辞書用メモリ14に記憶されている識別辞書と
の関係を説明する図である。前述ルたように大分類辞書
内のヘッダには、それぞれ共有の特徴のグループの先頭
アドレスが記憶されている。例えば各ヘッダにはポイン
タデータとして01234.0や0126FQが記憶さ
れている。
このヘッダ以後の特徴データには、各グループ内の文字
が共通する特徴データが記憶されており、詳細な特徴比
較の時には、これらのポインタデータ012340や0
126FOから各文字の特徴比較距離計算を行う。
本発明は実施例においては、特徴用大分類メモリ13と
辞書用メモリ14に記憶された構成が同一であるため特
徴用大分類メモリ13がら続出した特徴もまた辞書用メ
モリ14が読出した特徴も同一の回路で入力文字の特徴
との距離計算ができ、回路が簡単化され、また、その処
理も全ての文字に対して行うのではなく、類似している
文字グループ単位で行えるのでその距離を求める計算回
数も少なく、認識時間も短くなる。
本発明の実施例においては、特徴用大分類メモリ13か
らヘッダや特徴を読出す特徴メモリコントロール部16
と、辞書用メモリ14からヘッダや特徴を読出す辞書メ
モリコントロール部19とを別々に設けているが各メモ
リ13.14は同一の構成で記憶されているのでこれら
のコントロール部16.19は同一の回路で構成するこ
とも可能である。
〔発明の効果〕
以上述べたように本発明によれば、短時間で文字認識す
なわち文字読取りが可能となり、また記憶する回路も簡
単となる。
【図面の簡単な説明】
第1図は本発明の機能ブロック図、 第2図は本発明の実施例のシステム構成図、第3図は動
作処理フローチャート、 第4図は照合部の構成図、 第5図は辞書構成図、 第6図はヘッダ部構成図、 第7図はヘッダ部構成図、 第8図は大分類辞書と識別辞書の関係説明図である。 1・・・特徴抽出手段、 2・・・識別辞書記憶手段、 3・・・大分類辞書記憶手段、 4・・・照合手段。

Claims (1)

  1. 【特許請求の範囲】 1)読み取った文字画像データに対して、該文字画像デ
    ータの特徴を抽出する特徴抽出手段(1)と、 文字単位で該文字の特徴と該文字のコードとを文字の1
    グループとして記憶する識別辞書記憶手段(2)と、 該識別辞書記憶手段(2)で記憶する文字の特徴と文字
    のグループを記憶する前記識別辞書記憶手段(2)内の
    位置とを記憶する大分類辞書記憶手段(3)と、 該大分類辞書記憶手段(3)で記憶するグループの特徴
    と前記特徴抽出手段(1)より抽出した特徴とを比較し
    て、より一致しているグループの位置を求め、該位置よ
    りより一致しているグループ内の各文字の特徴と前記特
    徴抽出手段(1)より抽出した特徴とを比較して、より
    一致している文字を求める照合手段(4)とより成るこ
    とを特徴とする文字認識装置。 2)前記大分類辞書記憶手段(3)と、 前記識別辞書記憶手段(2)の記憶構成は同一であり、
    前記識別辞書記憶手段(2)で記憶する文字コードの位
    置に前記大分類辞書記憶手段(3)はグループの位置ア
    ドレスを記憶することを特徴とする特許請求の範囲第1
    項記載の文字認識装置。
JP62318999A 1987-12-18 1987-12-18 文字認識装置 Pending JPH01161592A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62318999A JPH01161592A (ja) 1987-12-18 1987-12-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62318999A JPH01161592A (ja) 1987-12-18 1987-12-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPH01161592A true JPH01161592A (ja) 1989-06-26

Family

ID=18105366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62318999A Pending JPH01161592A (ja) 1987-12-18 1987-12-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPH01161592A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08180138A (ja) * 1994-12-27 1996-07-12 Nagano Nippon Denki Software Kk 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08180138A (ja) * 1994-12-27 1996-07-12 Nagano Nippon Denki Software Kk 文字認識装置

Similar Documents

Publication Publication Date Title
EP0538038A2 (en) Character recognition method & apparatus
JPS60217477A (ja) 手書き文字認識装置
US4811412A (en) Method of a system for analyzing characters
JPH087033A (ja) 情報処理方法及び装置
JPH01161592A (ja) 文字認識装置
JP2904463B2 (ja) 指紋照合装置の辞書登録方式
JPH10269311A (ja) 帳票処理単位指定方法
JPS58144980A (ja) 文字認識処理用後処理システム
JP3037727B2 (ja) Ocrシステム
JP2848560B2 (ja) 画像認識方法及び装置
JPH01311390A (ja) 文字置換制御方式
JPH051512B2 (ja)
JPH0355874B2 (ja)
JPS6235989A (ja) 光学文字読み取り装置における認識方式
JPS63147287A (ja) 光学的文字認識装置
JPH0484380A (ja) 文字認識装置
JPH02212990A (ja) 文字読取装置
JPS63138479A (ja) 文字認識装置
JPH0318987A (ja) 辞書登録方法
JP2851865B2 (ja) 文字認識装置
JP2935533B2 (ja) 文字処理方法
JPS63233489A (ja) 文字読取装置
JP2000347995A (ja) データ複合識別方法およびその装置
JPH0573027A (ja) 個人筆跡辞書作成装置及び個人筆跡辞書を用いた文字出力処理装置
JPH07117995B2 (ja) 文字認識装置