JPS59221773A

JPS59221773A - Ｏｃｒの文字読取方式

Info

Publication number: JPS59221773A
Application number: JP58096565A
Authority: JP
Inventors: Kiyohiko Kobayashi; 清彦小林
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1983-05-31
Filing date: 1983-05-31
Publication date: 1984-12-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】技術分前本発明は、ＯＣＲにおける文字Ｉｉ元数取方式関する。

従来技術一般に、漢字ＯＣＲにあっては読取対象となる文字が複
雑であることと種類が多いことからその辞書のためのメ
モリ容量が膨大となり、半纏体メモリ等の高速アクセス
可付目なメモリに全ての文字コードを収納させることが
不可能になっている。

そのため従来では、漢字をその使用頻度に応じて第１水
準と第２水準にグループ分げし、第１水学の辞書を半導
体メモリ等からなる内部メモリに常駐させ、その内部辞
書では認識不可という結果すなわちリジェクトが出たと
ぎには外部メモリに記憶させた第２水準の辞書を参照し
て文字の益取りを行なわせる方法が採用されている。

しかし、このよ５な従来のＯＣＲＫおける文字の読取り
の処理方法では、リジェクトが発生するたびにアクセス
時間の太ぎな外部メモリをそのつど参照するため、その
処理に長時間を要するものになってしまっている。

目的本発明は以上の点を考慮してなされたもので、ＯＣＲに
おける辞書参照の処理時間の短縮化を図るようにしたＯ
ＣＲの文字読取方式を提供するものである。

構成以下、本発明の一実施例について詳述する。

本発明によるＯＣＲの文字読取方式にあっては、基本的
には、文字の使用頻度に応じて辞書を第１水準と第２水
準とにグループ分げし、その第１水準および第２水準の
谷辞書を優先順位をもって順次参照しながら文字の読取
りを行なわせる工５にするものである。その際、ＯＣＲ
の内部メモリにセットされた第１水準の辞書を参照しな
がら１ページもしくは複数ページからなる帳票の文字読
取りを行なわせるときにリジェクトが複数発生するのが
普通である。しかして、特に本発明では、リジェクトが
発生するたびに第２水準の辞書を参照するようなことな
く、そのリジェクトが生じた文字に関するマツプデータ
を逐次記憶保持させていきながら帳票の第１水準の辞書
参照による文字読取りを通して行なわせ、その完了後に
内部メモリの内容を第２水準の辞書に書き換えたうえで
、前記マツプデータにしたがってリジェクトとなった各
文字の再読取りの処理を一括して行なわせる手段をとる
工うにしている。

第１図は本発明によるＯＣＲの文字読取方式を具体的に
実施するための一構成例を示すもので、コントローラ（
図示せず）の制御下において、帳票Ａ面をスキャナ１に
エリ走査してその画情報を読み取り、その読み取られ１
こ画情報の中から処理対象となる文字のパターンデータ
文字切出部２に工り順次切り出し、その切り出された文
字のパターンデータＣＰから特徴抽出部３において文字
の特徴パラメータＰを抽出させ、その抽出された特徴パ
ラメータＰにもとづいて辞書検索部４においてその内部
メモリ５に記憶されている辞書を参照しながらパターン
認識を行なわせ、その認識された文字のコードデータＣ
Ｄをファイルメモリ６にＩ＠欠送りてファイルさせてい
くようにしたものにあって、特に、第１水準、第２水準
の各辞書のデータエリア７１．７２およびワーキングエ
リア７３をもつ１こ外部メモリ７と、スキャナ１によっ
て読み取られる帳票Ａのページをカウントしていくペー
ジカウンタ８と、そのカウント内容および文字切出部２
かも与えられる現在切出中の文字の帳票Ａ上におけるマ
トリクス座標位置のデータＤ、その文字の特徴パラメー
タＰの各管理データを逐次更新しながら記憶していくと
ともに、辞書検索部４かもリジェクト信号Ｒが与えられ
たときの谷管理データが外部メモリ７のワーキングエリ
ア７３内にロードされる管理データ記憶部９とを設ける
ことによって構成されている。

このような構成にあって、本発明では、まずコントロー
ラの制御下において外部メモリ７内の第１水準の辞書の
データを辞書検索部４の内部メモリ５に転送して記憶さ
せたうえで、帳票Ａの文字読取りを開始させるようにす
る。その文字読取りは前述のようにスキャナ１１文字切
出部２．特徴抽出部３および辞書検索部４を通して行な
われ、その読み取られた文字のコードデータＣＤがファ
イルメモリ６に１喧次ファイルされていく。その際、辞
書検索部４において文字のパターン認識に不可能を生じ
たとぎ、そのとぎ出されるリジェクト信号Ｒに応じて管
理データ記憶部９内の管理ブータラ外部メモリ７のワー
キングエリア７３内にロードさせ、リジェクトとなった
文字に関するマツプを第２図に示す管理テーブルにした
がって作成していく。次に、１ページもしくは複数ペー
ジにわたる帳票Ａの第１水準の辞書参照による文字読取
りが完了すると、例えば自動原稿送り装置からの原稿終
了信号に応じて、コントローラの制御下において外部メ
モリ７内の第２水準の辞書のデータ全辞書検索部４の内
部メモリ５に転送して辞書の沓ぎ換えを行なわせる。し
かるのち、外部メモリ７のワーキングエリア７３内の管
理テーブルからりジエクトとなった文字の特徴パラメー
タを順次読み出して辞書検索部４に与え、そこで第２水
準の辞書参照によるパターン認識をなして先にリジェク
トとなった文字の再読取りを行なわせる。その際、コン
トローラにより管理テープ層の内容から再読取りがなさ
れている文字のページお工び行２列位１ｄ、をｇ哩させ
ながら、その再ａ取りがなされた文字のコードデータＣ
Ｄをファイルメモリ６内の相当するアドレスレζ逐欠書
き込ませていく。

しかして本発明によるＯＣＲの文字読取方式では、内部
メモリ５内の辞書の書換えを１回行なわせる必要がある
が、そのためのデータ転送時間をみてもリジエク）ｋ生
じている多数の文字の再読取りを一括して高速で行なわ
せるととができるため、ＯＣＲにおける辞書参照の処理
時間の短縮化を有効に図ることができ、特に膜数ページ
にわたる帳票の一括処理をなすうえでより効果的となる
。

ま１こ、リジェクトが生じ１こ文字をマツプ管理しなが
ら外部メモリ７に記憶させる際に、特徴抽出部３によっ
て抽出された文字の特徴パラメータを記憶させ、リジェ
クトとなった文字の再読取り時にその文字の特徴パラメ
ータを辞書検索部４に直接与える工５にしているため、
再読取りの処理を迅速に行なわせることができる。

効果以上、本発明によるＯＣＲの文字読取方式にあっては、
内部メモリにセットされた辞書を参照しながら帳票に記
載された文字を読み取るＯＣＲにおいて、文字の使用頻
度に応じて少なくとも２つにグループ分げされた第１水
準および第２水準の各辞書を選択的にＯＣＲの内部メモ
リにセットｇせる手段と、第１水準の辞書参照による文
字読取り時にリジェクトとなった文字の特徴量をマツプ
管理しながら記憶する手段とを用いて、第１水準の辞書
参照による帳票の文字読取り完了後に内部メモリ内の辞
書を第２水準の辞書ＶＣ曹ぎ換えて、リジェクトとなっ
ている文字の再読取りを一括して行なわせる工うにした
もので、従来の、ｃ５にリジェクトが発生するたびに外
部メモリにセットされた辞書を参照して文字の絖取りを
行１よりせる場合に比して辞書参照の処理時間が短縮さ
れて、帳票の文字読取りを高速で行なわせることができ
るという優れた利点を有している。

【図面の簡単な説明】

第１図は本発明によるＯＣＲの文字読取方式を具体的に
実砲するための一構成例を示すズロクク図、第２図はり
ジエクトを生じた文字の管理テーブルを示す図である。１・・・スキャナ　２・・・文字切出部　３・・・特徴
抽出部　４・・・辞書検索部　５・・・内部メモリ　６
・・・ファイルメモリ　７・・・外部メモリ　８・・・
ページカウンタ　９・・・管理データ記憶部出’ＱＲ人代理人　烏　井　　　清

Claims

【特許請求の範囲】

内部メモリにセットｇれた辞書を参照しながら帳票に記
載され１こ文字を読み取るＯＣＲにおいて、文字の朗用
頻度に応じて少なくとも２つにグループ分けされた第１
水準およびＭ′ｆＪ２水孕の各辞書を選択的にＯＣＲの
内部メモリｖこセットサせる手段と、第１水準の辞書参
照ＦＣ，１：る又字読取り時にリジェクトとなった文字
の特徴量をマツプ管理しながら記憶する手段と音用いて
、第１水準の辞書参照による（隈票の文字読取り完了後
に内部メモリ内の辞書を第２水ｉ鴨の辞書しこ舊ぎ換え
て、リジェクトとなっている文字の再読取りを一括して
行なわせるようにしたことを特徴とするＯＣＲの文字現
収方式。