JPH0298795A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0298795A
JPH0298795A JP63250891A JP25089188A JPH0298795A JP H0298795 A JPH0298795 A JP H0298795A JP 63250891 A JP63250891 A JP 63250891A JP 25089188 A JP25089188 A JP 25089188A JP H0298795 A JPH0298795 A JP H0298795A
Authority
JP
Japan
Prior art keywords
dictionary
character recognition
character
dedicated
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63250891A
Other languages
English (en)
Inventor
Toshiaki Yagasaki
矢ケ崎 敏明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63250891A priority Critical patent/JPH0298795A/ja
Publication of JPH0298795A publication Critical patent/JPH0298795A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識装置に関し、例えば個人辞書と専用辞
書とを有している文字認識装置に関するものである。
[従来の技術] 従来、この種の装置は、各種の事務処理分野において、
帳票の文字を読み取って認識したり、またすでに印刷さ
れた文章を用いて書籍、ワープロなどの活字文章の再利
用ということで広く用いられている。
また、このような装置においては、文字の認識結果が重
要となり、近年、文字認識するための各種アルゴリズム
が開発されている。ところが、すべての文字に対応でき
るように十分な性能を持つまでには至っていないために
、認識率の向上が得られない状態である。そこで、文字
認識を行う前に、文字が活字の場合にはフォントを、文
字が手書きの場合には個人辞書を、予め設定することで
認識率の向上が図られている。
そこで、従来の文字認識装置について説明する。
第4図は従来の文字認識装置の構成を示すブロック図で
あり、第5図は従来の文字認識装置の動作を説明するフ
ローチャートである。
第4図を用いて構成を説明すると、従来の文字3.3識
装置は、スキャナ(以下、「入力部」と称す)21.キ
ーボード22.CPU23.ROM24  RAM24
.2値化部1文字切り出し部27、特徴抽出部28.専
用辞書29〜32.認識辞書331文字認識部34.出
力部35.そしてパスライン36を備えている。
そして、第5図を用いて文字認識処理について簡単に説
明すると、まずオペレータによって、入力部21で読取
らせる原稿の文書から適応する辞書の指定を受ける(ス
テップ550)。例えば、専用辞書29をゴシック体、
専用辞書30を明朝体、専用辞書31を手書き個人辞書
A、専用辞書32を手書き個人辞書Bに対応していると
する。
ここで、オペレータは、対象の原稿の文書から手書き個
人辞書Aと判定し、キーボード22から設定する。この
ようにして文字認識装置が辞書の指定を受けると、認識
辞書33に専用辞書31の辞書データを転送する(ステ
ップ551)。これにより、入力部21より原稿画像が
読取られ(ステップ552)、画像データが2値化され
る(ステップ353)、そして1文字パターン毎に文字
が切り出され、その切り出された文字パターンには、所
定のアルゴリズムに従った特徴抽出が実行される(ステ
ップS54、ステップ555)。さらに抽出されたデー
タに基づいて、認識辞書34をアクセスし、認識処理が
実行される(ステップ555)。この文字認識処理では
、最も認識対象の文字に類似している文字が候補として
選出され、出力部35で外部に出力される(ステップ8
56)。
[発明が解決しようとする課題] しかしながら、上記の従来例においては、文章の入力の
際に、認識用の専用辞書(各々のフォントに対する標準
パターンが記憶されている辞書)或は個人辞書(手書き
の場合に用いる個人用の辞書)をアクセスするためにマ
ニュアルオペレーションが必要となってくる。この場合
、ユーザは文字認識させるための文章がどういう辞書を
必要としているか知っている必要があるとともに、キー
ボードのマウスなどの入力手段が不可欠となってくる。
またミスオペレーションなどで文章の再入力などが余儀
なくされる場合も往々にして発生する。
さらに、一般帳票などの文字認識時には、複数枚の原稿
をまとめて入力する入力装置として、オートドキュメン
トフィーダ等が用いられ、自動化、高速化などの要求に
応じたものが多い。この場合においても、上記専用辞書
にすると上述の如くエラーが発生し、フィーダとしての
効果が激減してしまうことになる。
そこで、以上の従来例の欠点をまとめてみると、 (1)専用辞書に頼らない場合、認識率が低下するため
専用辞書を使用すると、才一トドキュメントフィーダの
ような自動化、高速化のような一括入力に十分な対応が
できない。
(2)専用辞書を使用すると、マニュアルオペレーショ
ンとなるため、ミスオペレーションが伴う。
(3)操作性が悪い。
(4)オペレータは文字認識させようとする文字の種類
を把握している必要がある。
本発明は、上述の従来例の欠点に鑑みてなされたもので
あり、その目的とするところは、認識率を向上すると共
に、作業の簡易化及び高速化を図った文字認識装置を提
供する点にある。
[課題を解決するための手段] 上述した課題を解決し、目的を達成するため、本発明に
係わる文字認識装置は、文字の特徴に応じて分けられた
複数の文字認識用辞書を有している文字認識装置におい
て、前記文字認識用辞書の判別情報が付加されている画
像データを入力する入力手段と、前記入力画像データ中
より判別情報を検出する検出手段と、該検出手段で検出
した判別情報に基づいて文字認識用辞書を判定する判定
手段と、該判定手段で判定した文字認識用辞書に基づい
て文字認識を行う文字認識手段とを備えることを特徴と
する。
また、好ましくは、前記判別情報をバーコード情報とし
たことを特徴とする。
[作用コ 以上の構成によれば、入力手段により文字認識用辞書の
判別情報が付加されている画像データを入力し、検出手
段により入力手段で入力した画像データ中の判別情報を
検出し、判定手段により検出手段で検出した判別情報に
基づいて文字認識用辞書を判定し、文字認識手段により
判定手段で判定した文字認識用辞書に基づいて文字認識
を行うようにしている。
[実施例〕 以下、添付図面を参照して本発明に係わる好適な実施例
を詳細に説明する。
第1図は本実施例の文字認識装置の構成を示すブロック
図である。第1図において、1は原稿画像を光学的に読
取る入力部を示している。この入力部1にはフィーダ機
能が備わっている。2は本装置全体を制御するCPUを
示している。3はCPU2を動作させるための制御プロ
グラム、エラー処理プログラム、そして第3図に示すフ
ローチャートに従ったプログラム等を格納しているRO
Mを示している。4はROM3の各種プログラムを実行
させるためのワークエリア及びエラー処理時の一時退避
エリアとして用いるRAMを示している。このRAM4
は、入力部1で読取った画像データを2値化した後に一
時格納する機能も有している。5は入力部1で読取った
画像データをパターン化するための2値化部を示し、6
は本実施例で用いる原稿画像より後述のIDコードを検
出して後述の専用辞書群9から該当する専用辞書を一つ
判定する専用辞書判定部を示している。
そして、7はRAM4に格納されている画像データを一
文字分の文字パターンデータ毎に切り出す文字切り出し
部を示している。8は文字切り出し部7で切り出された
文字パターンデータより特徴点を抽出す”る特徴抽出部
を示している。9は専用辞書判定部6で文字認識用の辞
書として選定される専用辞書を備える専用辞書群を示し
ている。ここで、1oはゴシック体の辞書を配憶してい
る専用辞書、11は明朝体の辞書を記憶している専用辞
書、12は手書き個人辞書aを記憶している専用辞書、
そして13は手書き個人辞書すを記憶している専用辞書
をそれぞれ示している。
尚、専用辞書群9から専用辞書を判定した場合には、専
用辞書群9の該当する専用辞書の辞書のアドレスを決定
することとなる。
そして、14は専用辞書判定部6で判定した専用辞書を
参照して、特徴抽出部8で特徴点が抽出された対象文字
の文字認識を行う文字認識部を示している。15は文字
認識部14で文字認識して結果を外部に出力する出力部
を示している。16は本装置のアドレス信号、データ、
制御信号等を出力するためのパスラインを示している。
次に、本実施例の文字認識方法について説明する。
第2図は本実施例に用いる原稿のフォーマットを説明す
る図である。第2図において、1.01は原稿を示し、
102は専用辞書を判別するためのバーコードによる識
別用コードC以下、rIDコード」と称す)を示してい
る。そして103はrDコード102の指定する専用辞
書で文字認識しようとする文書を示している。
さて、本実施例によるIDコードには、次の■〜■の選
定情報が含まれている。
■英数字1日本語、混合文章(英数字1日本語。
記号等)等の文章に使われている情報が含まれている専
用辞書、 ■活字のときのフォント情報(明朝体、ゴシック体1毛
筆体、教科書体等)が含まれている専用辞書、 0手書きのときの個人専用辞書情報が含まれている専用
辞書、そして、 ■帳票のときの帳票情報が含まれている専用辞書(この
場合、フォーマット情報は、文字認識装置に格納されて
おり、それをアクセスするコード情報がIDコードの中
に設定される)。
以上の選定情報から、所定の専用辞書が判定される。
次に、本実施例の文字認識方法について説明する。
第3図は本実施例の文字認識装置のCPU2の動作を説
明するフローチャートである。
まず、入力部1で原稿上の画像が読み取られ(ステップ
Sl)、その読み取れれた画像データが2値化された状
態でRAM4に格納される(ステップS2)、この処理
が1枚分終了すると、専用辞書判定部6においてRAM
4に格納された画像データからバーコードからなるID
コードの検出処理が行わる(ステップS4)。専用辞書
判定部6では、IDコードが検出されると、専用辞書群
9からIDコードに対応する専用辞書が判定される(ス
テップS5、ステップS6)。この場合、専用辞書群9
での該当する専用辞書の先頭アドレスが指定されること
になる。また、専用辞書判定部6でIDコードが検出さ
れなかった場合、処理が終了する(ステップS5)。
次に、ステップS6で専用辞書が判定されると、−文字
分与の画像データ、即ち、文字パターンデータの切り出
しと切り出された文字パターンデータからの特徴点の抽
出とが文字切り出し部7及び特徴点抽出部8で行われる
(ステップS7)、そしてステップS6で判定した専用
辞書を参照し、文字認識部14で文字認識が行われる(
ステップ514)。このようにして−文字分の文字認識
が終了すると、出力部から外部のプリンタ等に認識結果
が出力され、原稿1枚分の文字認識処理が終了するまで
は、ステップS7に戻って次の文字パターンデータな切
り出して上記の処理を繰り返す(ステップ510)。
以上説明したように本実施例によれば、IDコードによ
り、迅速且つ確実に専用辞書を選択できるので、ミスオ
ペレーションで再入力するようなことはなく、認識率が
向上し、自動化による文字認識の高速化が実現できる。
例えば複雑な文書、或は種々な帳票等に良好に対応でき
る。
さて、前述の実施例によると、IDコードは専用辞書と
して、フォント別や手書き文字等を対象として分けてい
たが、細分化を図ることで同一フォントの中においても
英数字、漢字等の字種毎に設定することが可能である。
これによって、認識精度が向上し、認識処理の仕方も種
々変形可能である。このように、それぞれの字種1文字
(手書き、漢字等)に応じた最適な文字認識が可能とな
る。
また、前述の実施例においては、専用辞書の数を4つに
限定していたが本発明はこれに限定されるものではなく
、本発明の主旨を逸脱しない範囲であれば、専用辞書の
数を必要に応じて種々変形することができる。
[発明の効果] 以上説明したように本発明によれば、IDコードにより
、迅速且つ確実に専用辞書を選択できるので、認識率が
向上し、自動化による文字認識の高速化が実現できる。
【図面の簡単な説明】
第1図は本実施例の文字認識装置の構成を示すブロック
図、 第2図は本実施例に用いる原稿のフォーマットを説明す
る図、 第3図は本実施例の文字認識装置のCPU2の動作を説
明するフローチャート、 第4図は従来の文字認識装置の構成を示すブロック図、 第5図は従来の文字認識装置の動作を説明するフローチ
ャートである。 図中、1,21・・・入力部、2.23・・・CPU、
3゜24・・・ROM、4.25・・・RAM、5゜2
6・・・2値化部、6・・・専用辞書判定部、7゜27
・・・文字切り出し部、8.28・・・特徴抽出部、9
・・・専用辞書群、lO〜13.29〜32・・・専用
辞書、14.34・・・文字認識部、!5.35・・・
出力部、1.6.36・・・パスライン、33・・・認
識辞書である。

Claims (2)

    【特許請求の範囲】
  1. (1)文字の特徴に応じて分けられた複数の文字認識用
    辞書を有している文字認識装置において、前記文字認識
    用辞書の判別情報が付加されている画像データを入力す
    る入力手段と、前記入力画像データ中より判別情報を検
    出する検出手段と、該検出手段で検出した判別情報に基
    づいて文字認識用辞書を判定する判定手段と、該判定手
    段で判定した文字認識用辞書に基づいて文字認識を行う
    文字認識手段とを備えることを特徴とする文字認識装置
  2. (2)前記判別情報をバーコード情報としたことを特徴
    とする請求項第1項記載の文字認識装置。
JP63250891A 1988-10-06 1988-10-06 文字認識装置 Pending JPH0298795A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63250891A JPH0298795A (ja) 1988-10-06 1988-10-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63250891A JPH0298795A (ja) 1988-10-06 1988-10-06 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0298795A true JPH0298795A (ja) 1990-04-11

Family

ID=17214561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63250891A Pending JPH0298795A (ja) 1988-10-06 1988-10-06 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0298795A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020045039A1 (ja) * 2018-08-27 2020-03-05 京セラドキュメントソリューションズ株式会社 Ocrシステム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63137384A (ja) * 1986-11-28 1988-06-09 Matsushita Electric Ind Co Ltd 文字認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63137384A (ja) * 1986-11-28 1988-06-09 Matsushita Electric Ind Co Ltd 文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020045039A1 (ja) * 2018-08-27 2020-03-05 京セラドキュメントソリューションズ株式会社 Ocrシステム
JPWO2020045039A1 (ja) * 2018-08-27 2021-08-12 京セラドキュメントソリューションズ株式会社 Ocrシステム

Similar Documents

Publication Publication Date Title
US5717794A (en) Document recognition method and system
JPS63155386A (ja) 帳票デ−タ読取装置
EP0740245B1 (en) Handwritten data and command gesture input method and apparatus
JPH04195692A (ja) 文書読取装置
US11593591B2 (en) Optical character recognition systems and methods
JPH1125209A (ja) 情報入力装置、情報入力方法、記憶媒体、及び二次元バーコード印刷装置
JPH0298795A (ja) 文字認識装置
JP3159087B2 (ja) 文書照合装置および方法
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JP3457376B2 (ja) 光学式読み取り装置における文字修正方法
JP4759963B2 (ja) 複数の認識辞書を利用した文字認識装置
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JPH02282883A (ja) 手書き入力認識方式
JP2529421B2 (ja) 文字認識装置
JPH04293185A (ja) ファイリング装置
JP2578767B2 (ja) 画像処理方法
JP2887823B2 (ja) 文書認識装置
JPH10162103A (ja) 文字認識装置
JP3077580B2 (ja) 文字読取装置
JP2578768B2 (ja) 画像処理方法
JPS63155385A (ja) 光学文字読取装置
JPS63195783A (ja) 文字切出し方式
JPH03296883A (ja) 帳票認識装置の帳票認識方法
JPH0944593A (ja) 文字認識制御装置
JPH01217686A (ja) 文字読取装置