JPS63155385A

JPS63155385A - 光学文字読取装置

Info

Publication number: JPS63155385A
Application number: JP61302897A
Authority: JP
Inventors: Yoshikazu Sato; 義和佐藤; Akiko Suzuki; 明子鈴木
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1986-12-19
Filing date: 1986-12-19
Publication date: 1988-06-28

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】且亙公団この発明は、一般に「○ＣＲＪと略称される光学文字読
取装置に関する。

盗米且生紙に文字を含む画情報が印刷あるいは手書きされた原稿
をイメージスキャナでスキャンして、原稿の画情報をイ
メージデータとして取り込み、そのイメージデータから
文字を認識して文字コードデータに変換する光学文字読
取装置が種々開発されている。

この光学文字読取装置をワードプロセッサや自動翻訳装
置、あるいは帳票集計装置や検索用データファイル作成
装置などの文字を扱う処理システムや文字データを伝送
するデータ通信などの通信システムへの文字情報の入力
手段として使用すれば、キーボード入力に比べて入力効
率を大幅に向上させることが可能である。

この光学文字読取置には１文字フォントのイメージデー
タが基準画情報としてあらかじめ登録された文字認識用
辞書が設けられており、文字認識手段がその文字認識用
辞書を参照して、入力された文字のイメージデータを辞
書のイメージデータと比較してパターンマツチングをと
ることによって、これを特定の文字として認識してそれ
に対応する文字コードデータを発生する。

一般に使用される活字等の文字種のデザイン、すなわち
フォントには様々な種類のものがある。

そのため、通常用いられる複数の文字種についてそのセ
ットごとに文字認識用辞書を備えている。

しかし、このような光学文字読取装置によって原稿の文
書を読み取る場合、同−原稿内に文字（キャラクタ）と
それ以外の画情報（イメージ）とが混在している場合、
あるいは異なる書体の文字が混在している場合や書体が
フォーマット化されていない場合には認識できなかった
。

また、同−原稿内に必要なデータと不要なデータとがあ
った時、不要なデータまで認識してしまうため、無駄な
処理に時間を費して読取速度が上がらないという間層も
あった。

１−血この発明は、このような従来の光学文字読取装置におけ
る問題点を解消し、原稿内の必要な部分の文字情報を迅
速に認識して読み取れるようにすることを目的とする。

構成この発明は上記の目的を達成するため、上述のような光
学文字読取装置において、第１図に示すように、スキャ
ナＡからイメージデータとして取り込んだ画情報の読取
エリアを指定する読取エリア指定手段Ｂと、その指定さ
れたエリア内の読取条件を指定する読取条件指定手段Ｃ
とからなる前処理装置りを設け、それによって前処理し
たデータを文字認識手段ＥΔ送るようにしたものである
。

以下、この発明の一実施例に基づいて具体的に説明する
。

第２図は、この発明による光学文字読取装置の機能を備
えたワードプロセッサ、オフィスコンピュータ、自動翻
訳装置、＠ＳＳ焙処理装置に使用できろ文書処理システ
ムの一例を示す外観斜視図である。

この文書処理システムは、入力装置として、英数字キー
、カナキーなどの文字キー及びカーソル移動キーや各種
ファンクションキー等を有し、操作者の指示を入力する
キーボード１と、原稿を光電的にスキャンして文字を含
む画情報をイメージデータとして入力するイメージスキ
ャナ２とを備えている。

また、出力装置として、操作者に対するガイダンスを含
む各種文字及び画情報を表示するための表示装置である
ＣＲＴディスプレイ装置（以下単にｒｃＲＴＪという）
３と、このシステムで処理した各種情報をプリントアウ
トするためのレーザプリンタ等のプリンタ４とを備えて
いる。

さらに１本体Ｓ内には第３図に示すように、イメージス
キャナ２で読み取ったイメージデータの前処理及び文字
認識を行なって、文字のイメ−ジデータを文字コードデ
ータに変換するＯＣＲ前処理・認識部６（第１図の前処
理装置りと文字認識手段Ｅに相当する）と、データ記憶
装置であるハードディスク′３Ａ置（ＨＤＤ）７と、こ
のシステム全体の動作を統括制御するマイクロコンピュ
ータ等からなる制御部（ＣＰＵ）１０と１画面メモリ（
ＶＲ７’、Ｍ）１１及び表示制御装置であるＣＲＴコン
トローラ１２等が設けられている。

ＯＣＲ前処理・認識部６には、イメージスキャナ２から
入力するイメージデータを一時格納するバッファメモリ
や、前述の文字認識用辞書を格納する辞書メモリ等も備
えている。

制御部１０は、キーボード１からコード変換指示を受け
るまでは、イメージスキャナ２が読み取った原稿画像の
イメージデータをＯＣＲ前処理・認識部６を介してその
まま入力してＨＤＤ７に格納する。

キーボード１からコード変換指示を受けた後は、ＯＣＲ
前処理・認識部Ｓを制御してイメージスキャナ２から入
力する文字のイメージデータをコードデータに変換して
、それをＨＤ　Ｄ　７に格納する。

また、このようにしてＨＤ　Ｄ　７に格納したイメージ
データあるいは文字コードデータを）ｌ　Ｄ　Ｄ　７か
ら読み出して、ビデオ信号発生用メモリであるＶＲＡＭ
１ｉに転送する。

それにより、ＣＲＴコントローラ１２がＶＲＡＭ１ｌに
よってドツトデータの形で展開さ九たビデオ信号を順次
ＣＲＴ３へ送って表示させる。

次に、この実施例の作用を第４図以降も参照して説明す
る。

第４図は、この実施例におけるＯＣＲ前処理・認識部６
のプリプロセッサによる前処理機能を示すブロック図で
ある。

この図に示すように、前処理機能としては、スキャナに
よる原稿読取り及びそのイメージデータに対して読取エ
リア及びそのエリア内の読取条件の指定等を行なう「編
集」と、その指定された各情報を表示するｒファイル一
覧」と、この機能を終了する「終了」がある６そのうち最も重要な編集機能には、「原稿読取り」　「
作成」　「修正」　「追加」　「削除」　「内容表示」
　［終了」がある。

このうち原稿読取り２作成、内容表示の機能によって、
読取エリア及び読取条件の指定を行ない、その指定内容
を修正、追加、あるいは削除する場合に、それぞれ修正
、追加、削除の各機能を用いる。

第３図におけるＯＣＲ前処理・認識部６の動作フローを
第５図に示すが、そのうちステップ■〜■がこの前処理
の編集機能に相当する。

すなわち、ステップのでイメージスキャナ２を動作させ
て原稿の文字を含む画情報を読み取らせ。

そのイメージデータを取り込む。この場合はイメージス
キャナの読取密度を粗くして、読取速度を速めるように
する。

ステップ■では、取り込んだイメージデータにより原稿
の画情報をＣＲＴ３に表示させる。

そして、ステップ■で表示画面上に枠を作成することに
よる読取エリアの指定、及びキーボード１からの入力に
より各エリア毎の読取条件の指定を行なう。

その読取条件には、活字か手書きかのモード指定、活字
モードの場合の活字種類（フォント）の指定１手書きモ
ードの場合の文字の種類の指定。

読取密度及び濃度の指定等があるが、その詳細は第６図
によって後述する。

このステップ■で指定された読取エリア及び読取条件の
情報を、ステップ■でＨＤＤ７のファイルに書き込んで
記憶する。

次に、この第５図のステップ■〜■は文字認識処理の動
作を示し、ステップ■でメモリのファイルから先に書き
込んだ読取エリア及び読取条件の情報を読み出す。

ステップ■で再びイメージスキャナ２を動作させ、指定
された読取密度で原稿の少なくとも指定されたエリア内
の画情報を読取る。

そして、その読み取ったイメージデータがＯＣＲデータ
（文字認識をすべきデータ）かどうかをステップ（Ｔで
判定し、ＯＣＲデータであればステップ（■へ進み、指
定された各種の読取条件に従って文字認識用辞書の選択
等を行なって、公知のパターンマツチング方式等によっ
て各文字を認識して文字コードデータに変換し、その後
ステップ■へ進む。

○ＣＲデータでなければ、ステップ■を飛ばしてステッ
プ（Ｄへ進む。ステップ■では他の指定データがあるか
否かを判断して、あればステップ■へ戻って文字認識の
ための上述の動作を繰り返えし、指定されたエリア内の
全てのＯＣＲデータの文字認識を完了すると、ステップ
（珈でアプリケーションプログラムの処理を行なって終
了する。

なお、ステップ■で文字認識を行なって文字コードに変
換したデータ、及び指定されたエリア内にＯＣＲデータ
でないイメージデータがあればそのデータも１例えば第
３図のＨＤＤ７に格納する。

アプリケーションプログラムは、この読取データを使用
して必要な処理を行なうプログラムであり、例えば文書
作成・編集、自動翻訳２表計算。

伝票処理等のプログラムである。

次に、前処理機能による読取エリア及び各種読取条件指
定の具体例を、第６図のフローチャートによって説明す
る。

この図には示していないが、まず前処理のシステムメニ
ュー（１，ファイル一覧　２１（ｉ集　９．終了）をＣ
ＲＴの画面に表示し、数字キーの「２」によって「編集
」が選択されると、第４図の右側に示した編集機能を選
択するための編集メニューケ表示する。そして、イメー
ジスキャナによる原稿読取りが終って、「作成」が選択
されると第６図の処理がスタートする。

まず終了か否かを判断をするが、終了キーが押されなけ
れば終了ではないので、（Ａ）で読取エリアの指定を行
なう。

それは、スキャナによって読み取った原稿の画情報をイ
メージデータによりＣＲＴの表示画面に表示し、必要な
エリアの始点（左上の角）と終点（右下の角）が指定さ
れると、Ｘ方向に平行な２辺とＹ方向に平行な２辺から
なる方形の枠を作成し、その枠内を読取エリアとして指
定する。

例えば、ＣＲＴの画面に第７図に示すような絵と文章を
含む原稿の画情報が表示されているとき、その文章の部
分だけを読取エリアとして指定したければ、始点と終点
としてａ点とｂ点を指定すると、長方形の枠Ｆ１が形成
されて読取エリアＡ１を指定できる。同様に、始点と終
点として０点とｄ点を指定すると、長方形の枠Ｆ２が形
成されて読取エリアＡ２を指定できる。

この始点と終点を指定する方法としては、キーボードか
らその各点の座標値（ｚ、　！Ｉ）を入力したり、カー
ソルを始点に合わせて実行キーを押した後終点に合わせ
て実行キーを押す方法、あるいはライトペンで画面上の
始点と終点の位置をタッチする方法など種々の方法があ
る。

また、カーソルを移動させる場合、キーボードのカーソ
ル移動キーを用いる方法の他にマウスを用いる方法など
もある。

このように、始点と終点の２点を指定するだけで１つの
方形エリアを読取エリアとして簡単に指定できる。この
読取エリアは何箇所でも指定することができる。

次に、ＣＢ）の「活字モード指定」に進むが、ここでは
「１．活字　２９手書き　３．イメージＪを表示して、
１〜３の数字キーでそのいずれかを指定できるようにし
、どのキーが押されたかによって「活字」と「手書き」
と「イメージ」の判別を行なう。

そして、「活字Ｊが指定されると（Ｃ）の「活字モード
設定」の処理に入る。

まず、活字種類指定のために「１．マルチフォント　２
．ｉＦ体指定」を表示して、いずれが指定されたかを判
断し、「マルチフォント」が指定されるとそれを活字モ
ードとして設定する。

マルチフォントに設定すると、書体が判らなくても、比
較的使用頻度の高い予め定めた６種類の書体のいずれか
であれば、それを自動的に判別して辞書を選択して文字
認識を行なう。

「書体指定」であれば、例えば第８図に示すように１８
種類の書体（フォント）のいずれかを数字キーによって
指定できるような書体指定の表示を行ない、指定された
書体を活字モードとして設定する。

また、「手書き」が指定されると（Ｄ）の「手書モード
設定」の処理に入る。

ここでは、まず手書き文字の種類を指定するために「１
．アルファベット　２．数字　３．記号　４．カタカナ
　５．漢字　６８手書活字　９．終了」を表示し。

数字キーによって指定された文字の種類をそれぞれ設定
する。

この場合は、同一エリア内に複数の文字の種類、例えば
アルファベットと数字と記号等が混在しているときには
、それを全部指定することができる。

なお、「手書き活字」とは、活字のように決められたフ
オームで書かれた手書き文字である。

さらに、「イメージ」が指定されたときは１文字認識の
ための条件指定は不要であるが、（Ｅ）の「イメージモ
ード設定」の処理を行なう。

すなわち、読取モードとして「２値」　「多値」「ハー
フトーン」のいずれかを数学キーによって選択できるよ
うに表示し１選択されたモードを設定する。

ここで、「２値」とはイメージデータをその信号レベル
がある閾値以上か未満かで白か黒か（１か０）の２値デ
ータとして読取るモード、「多値」とは例えば６４階調
のような多階調のデータとして読取るモード、「ハーフ
トーン」は例えばディザマトリックスを用いて２値化し
て疑似ハーフトーンのデータとして読取るモードである
。

前述の活字モード及び手書きモードの設定を行なった場
合には、読取モードを自動的に「２値」に設定する。

これらの各設定処理後、（Ｆ）の「読取密度設定」に進
む。

ココでは、読取密度として３００ｄｐｉ（ｄａｔ／１ｎ
ｃｈ）　。

２４０ｄｐｉ、　２００ｄｐｉ、　１８０ｄｐｉのいず
れかを数字キーによって選択できるように表示し１選択
された密度をモード設定する。

次に、（Ｇ）の「読取濃度設定」を行なうが、ここでは
読取濃度としてＨ（濃い）２Ｍ（普通）。

Ｌ（薄い）のいずれか、あるいはそれらの中間の濃度を
０〜Ｆの１６階調で選択できるようにし、選択された濃
度をモード設定する。

ここで、通常はＭに設定しておき、［稿の文字等が濃い
場合はＬに、薄い場合はＨに変更するようにしてもよい
。

このようにして、指定した読取エリア内の読取条件を全
て指定し終ると再び始めに戻る。そこで、別の読取エリ
アを指定して上述の各種読取条件の指定をすることがで
きるが、必要な全ての読取エリア及びその読取条件の指
定を完了し、終了キーが押されると、（Ｈ）のソート処
理へ進む。

ここでは、設定されたエリア情報（読取エリアの始点、
終点、の座標及びそのエリアに対してモード設定された
各読取条件の情報）をイメージスキャナによるスキャン
順序に従って並べかえ、その情報にファイル名等を付し
てメモリのファイルに書き込んだ後、Ｉｇ集ツメニュー
示に戻る。

その後、このファイルのエリア情報の内容を修正したい
場合は、編集メニューで「修正」を選択し、ファイル名
を指定してそのエリア情報の内容を表示させ、修正項目
を選択してその内容を修正することができる。

エリア情報を追加したい場合は、編集メニューで「追加
」を選択して、前述の「作成」の場合と同様にしてエリ
ア情報を追加し、それをファイルに書き込むことができ
る。

複数のエリア情報のうちの一部を削除したい場合には、
［削除Ｊを選択してＣＲＴの画面に指定されている全て
の読取エリアを表示させ、そのうちの削除したいエリア
内へ例えばマウスカーソルを移動してピックすると、そ
のエリアの情報が削除対象として指定され、確認後削除
される。

次に、上述のように設定したエリア情報を格納するファ
イルの構成を第９図に示す。

各ファイルにはヘッダ部（３２Ｂｙｔｅ）が設けられ、
ここにはファイル記号と１作成者が入力するファイル厘
毛及び作成者の名前を書き込む。それに続＜　１６Ｂｙ
ｔｅづつのエリア情報格納部に、各エリア情報をスキャ
ナによるエリアのスキャン類にｒ】個（ｎは指定された
読取エリアの数）書き込むようになっている。

その各エリア情報は、第１０図に示すように。

エリアの始点と終点の座標情報がそれぞれＸ、Ｖ。

２　ＢｙＬｅづつ、活字モード、活字種類、書体種類。

手書き文字毬類、読取モード、読取密度、読取濃度の各
条件指定情報がそれぞれ１１１ｙ？、ｅづつ、それにダ
ミー領域としての１　ｔ３ｙｔ、ｅから構成されている
。

〔他の実施例〕

次に、伝票や請求書、謂査票、その他室形の枠線が印刷
されていて、記入個所が指定されている用紙（この明細
書中ではこ九を「帳票」という）に記入された文字を読
み取って集計等の処理をするための帳票データ読取装置
に適した、この発明の他の実施例について、第１１図以
降を参照して説明する。

第１１図（Ａ）は、この実施例のフオーム情報（前述の
実施例における読取エリア及びその読取条件の指定情報
に相当する情報を含む）を登録するために必要な部分の
構成を示す機能ブロック図であり、同図（Ｂ）は帳票の
データを読み取るために必要な部分の構成を示す機能ブ
ロック図である。

この実施例では、データの読み取りを行なおうとする各
種帳票ごとのフオーム情報を登録しておく必要がある。

そこで、予め帳票のモデルをイメージスキャナ２０にセ
ラ１−シてスキャンし、そのイメージデータを入力して
枠線認識手段２１によってその帳票の枠線を認識して、
その枠線情報を枠線データメモリ２２に一時格納する。

このようにして認識された枠線を図示しないＣＲＴ等の
表示装置によって表示し、その枠線を基準にして、読取
エリア指定手段２３によってオペレータが読取エリアを
指定すると共に、読取条件設定手段２４によって各読取
エリアごとに読取条件を指定すると、これらの各情報す
なわち枠線情報とそれに関連する各読取エリア指定情報
と読取条件指定情報を、フオーム情報登録手段２５によ
ってこの帳票のフオーム情報としてフオームファイル２
日に登録する。

このようなフオーム情報の登録処理を、データの読み取
りを行なう予定の各種帳票のモデルについてそれぞれ実
行することにより、帳票の種類毎のフオーム情報を登録
する。

帳票データ読み取り時には、第１１図（Ｂ）に示すよう
に、イメージスキャナ２０に読み取る帳票をセットして
スキャンし、そのイメージデータを入力して画像ファイ
ル２７に一時格納すると共に。

枠線認識手段２１がそのイメージデータから枠線を認識
して枠線データメモリ２２に一時格納する。

そして、フオーム識別手段２８が多数のフオームファイ
ル２６からそこに登録されているフオーム情報中の枠線
情報を順次読出して枠線データメモリ２２の枠線情報と
比較し、マツチングをとることによってこの帳票のフオ
ームを識別して、そのフオームに対して指定されている
読取エリアの情報を出力する。

その識別情報（読取エリア指定情報を含む）と枠線デー
タメモリ２２の枠線情報の基準位置の情報によって、領
域切出手段２日が画像ファイルに格納されているイメー
ジデータから文字認識をすべきエリア（領域）のデータ
を切り出して、データ読取手段３０へ送出する。

データ読取手段３０は、多数のフオームファイル２６か
らフオーム識別手段２８によって識別されたフオームの
エリア情報を読み出して、その各エリアごとの読取条件
指定情報に応じて文字認識用辞書の選択等を行なって、
領域切出手段２日によって切り出されたイメージデータ
から文字を認識して順次文字コードデータに変換し、そ
れを読取結果ファイル３１に格納していく。

また、指定されている読取条件が「イメージ」の場合は
、その読取モード指定に応じて、そのエリアのイメージ
データを２値化、多値化、あるいは疑似２値化（ハーフ
トーン）して読取結果ファイル３１へ格納する。

これらの各機能は、前述の実施例における第３図のＯＣ
Ｒ前処理・認識部６及び制御部１０と同様な装置で実行
されるが、そのフオーム情報登録処理のフローチャート
を第１２図に、帳票データ読取処理のフローチャートを
第１３図に示す。

なお、これらのフローチャートでは、オペレータによる
作業とこの装置による処理とを併せて工程順に示してい
る。

まず、第１２図のフオーム情報登録処理について、第１
４乃至第２０図も参照しながら詳細に説明する。

この処理がスタートすると、まずオペレータがフオーム
ファイル名を入力することにより、登録するフオーム情
報を格納するファイル名を指定し、次いでＭｔ９する帳
票のモデルをスキャナにセットする。

その後、装置側でスキャナがセットされた帳票の画情報
を読み取り、そのイメージデータ（画像データ）から枠
線認識を行なう。

この枠線認識方法は１例えば特開昭５７−２１１６７２
号公報や特開昭５７−２１１６７４号公報等に見られる
ように、従来から種々の方法が提案されているが、ここ
では画面上の主走査方向（ｘ軸方向）の一対の線分と副
走査方向（ｙ軸方向）の一対の線分とによって囲まれた
矩形領域を構成する線分であって、その内部に矩形を含
まないものを枠線として認識する。

例えば、第１４図に示す例では■、■、■で示す矩形の
領域をそれぞれ取り囲む枠線を認識する。

ところで、イメージスキャナから取込んだ画像データに
スキューがある場合、原画の枠線を構成する各線分の画
像が、第１５図に破線で示すように画面に対して傾斜し
てしまう。

そこで、原画のこの破線で示す各線分をそれぞれ構成す
るドツトを全て取囲む４つの矩形ａ、、ｂ。

ｃ、ｄを発生して、その内側の領域Ａを取囲む図中に太
線で示す各線分ｕｐ（上側）、Ｑｗ（下側）。

Ｑｆ（左側）、及びｒｔ（右側）を枠線として認識する
。

なお、このスキューがある程度以上大きくなると文字の
認識が困難になるので、スキューが大き過ぎることを表
示して、オペレータに帳票をセットし直すように促す必
要がある。

また１画像データのスキューを検出して、それを補正し
た画像データを取出すことができるようにすることも、
例えば特開昭５８−８７６５２号公報に見られるように
知られているので、これを利用して、スキューによる読
取エリアの減少等の影響を防ぐようにすることも可能で
ある。

次に、第１２図のフローチャートにおける識別パラメー
タの計算を行なう、すなわち、帳票のフオームを識別す
るための識別パラメータを決定し、基準位置を見つける
。

基準位置は、例えば第１６図に示す点ｐｏの位置で、そ
の座標値を（ｘｓｔａｒｔ、、　！１ｓｔ、ａ’ｒｔ）
とする。

この点Ｐｏは、認識された各枠線（図示の例ではＦ１〜
Ｆｓ）のうち最も上位にある枠線（Ｆｌ）の上側線分ｕ
ｐの延長線と、最も人泣にある枠線（Ｆ２１Ｆ３）の左
側線分Ｒｆの延長線との交点である。

各線分及び領域の始点、終点等の座標値は、全てこの基
準位置からの値で表わされる。なお、以下の説明におい
て、線分の始点の座標値を（Ｍ　Ｓ　。

ｇｓ）、終点の座標値を（ｘ＠、ｙｅ）とし、エリア（
領域）の始点の座標値を（ａｘｓ、ａｙｓ）＋終点の座
標値を（ａｚｅ、ａｙｅ）とする。

識別パラメータとしては、次の（１）〜（６）を求める
。

（１）読取密度スキャナから画像データを取り込んだ時のスキャナによ
る読取密度（１８０，２００，２４０，３００ｄｉρの
いずれか）（２）　：ｃ方向幅第１６図に示すように、線分の終点のＸ方向の最大座標
値０Ｉａｘ（工ｅ　）と線分の始点のＸ方向の最小座標
値ｉｉｎ　（工Ｓ）の差謬ａｘ（工ｅ　）　−ｗｉｎ（：ｃｓ）（３）１方向幅第１６図に示すように、線分の終点のｙ方向の最大座標
値ｍａｘ（！Ｉｅ）と線分の始点のｙ方向の最小座標値
ｗｉｎ（ｙｓ）の差ｍａｘ（ｙ　ｅ　）　−ｍｉｎ（ｙ　ｓ　）（４）枠個
数枠認識処理で認識できた枠の個数（Ｑ個）（５）ｘ方向
線分数枠認識処理で認識できたＸ方向の線分数（ｍ本）（６）　ｙ方向線分数枠認識処理で認識できたｙ方向の線分数（１本）次に、第１２図のフローチャートにおける読取エリアの
指定及び読取条件の指定を行なう。

読取エリアの指定は、第１７図（Ａ）に示すように、認
識された枠Ｆによって囲まれたエリアＡｉｎを指定する
場合には１例えば第１６図に示したようにＣＲＴの画面
に表示している多数の枠の内部を１つずつ順次反転表示
してオペレータによるキー人力を待ち１例えばｒｌＪキ
ーと「０」キーあるいは「実行キー」と「キャンセル」
キー等によって１反転表示されているエリアを読取エリ
アとして指定するか否かを順次選択できるようにすれば
、いちいち読取エリアの始点と終点の座標を入力する必
要がなく、ｕ単に指定できる。

また、第１７図ＣＢ）に示すように、枠Ｆの外側で枠Ｆ
を植成する線分の１本を一辺とする矩形のエリアＡｏｕ
ｔを読取エリアとして指定する場合は。

そのエリアの枠外の始点又は終点の座標値のうち、−辺
となる線分の始点又は終点の座標値と異なる方の値（図
示の例では始点のｙ座！　ａ　！ｌ　Ｓ　）のみを入力
すれば指定できる。

さらに、第１７図（Ｃ）に示すように、忰以外に認識さ
れた線分りを一辺とする矩形のエリアＡ１１ｎを読取エ
リアとして指定する場合も、上述の場合と略同様である
。

但し、線分りは図示のように始点（り＝ｓ、、ｙｓ）。

とその対角点を終点（χｅ、！Ｉｅ）とする綱長い矩形
として認識される（幅ｄは線の振れや若干のスキュー及
びノイズによる）ので、読取エリアＡｌ１ｎの終点の座
標（ａｚｅ、　ａ　ｙ　ｅ）は線分りの終点の座標（ｘ
ｅ、　ｙｅ）とは若干具なるが、ａｚｅ＝ｚｅ、ａ！Ｉ
ｅ＝！Ｉｅ−ｄ＝ｙｓ　　であるから自動的に決定でき
る。

第１７図（Ｄ）に示すように、認識された枠Ｆあるいは
線分りと関係なく自由に読取エリアＡ　ｆｒｅｅを指定
する場合には、第６図のフローチャートの（Ａ）読取エ
リア指定のところで説明したように。

指定したいエリアの始点と終点の座標値（ａＺ　３　。

ａｙｓ）と（ＢｘＢ、ａ！ｆｅ）を入力することによっ
て指定できる。

読取条件の指定は、各読取エリアの指定後、第６図のフ
ローチャートによって説明したようにして、活字か手書
きのモード指定、活字モードの場合の書体（フォント）
指定９手書きモードの場合の文字種指定等を順次行なう
。なお、この場合は読取密度及び読取濃度の指定は行な
わない。

このようにして、第１２図における読取エリアの指定及
びそのエリアの読取条件の指定あるいは設定を必要な全
ての読取エリアに対して終了すると１次にヘッダ情報の
入力を行なう。

ヘッダ情報としては、バージョンＮｏ、、フオーム名称
１伴成者名、その他のメモ等を入力する。

そして、これらの各データすなわちフオーム情報を、フ
オームファイル・フォーマットに従ってフオームファイ
ルに格納し、フオーム情報登録処理を終了する。

フオームファイル・フォーマットは、第１８図に示すよ
うに、ヘッダ情報、原図面基準点、識別パラメータ、Ｍ
始データ、認識領域データの各エリアからなる。

ヘッダ情報は１作成者が入力した前述の情報であり、原
図面基準点は第１６図に示した例では点Ｐｏの座標、す
なわちＸ方向始点（ｘ　ｓｔ、ａｒｔ、）とｙ方向始点
（ｙ　５ｊａｒｔ、）のデータである。

識別パラメータも前述のとおりであるが、ここではＸ方
向幅とｙ方向幅をドツト数で格納する。

このドツト数と読取密度から良さを算出することができ
る。

原始データとしては、枠をＬ＆識した数（Ｑ個）の枠デ
ータ、Ｘ方向の線分を認識した本数（ｍ個）のＸ方向線
分データ、ｙ方向の線分を認識した本数（ｎ個）の！方
向線分データを、それぞれ枠ナンバ（Ｎｏ、）あるいは
線分ナンバ（Ｎｏ、）を付して格納し、枠データはｔや
を構成する４本の線分Ｑｆ、ｒｆ、ｕｐ、　Ｑｗのナン
バ（Ｎｏ、）で格納する。線分データは各線分の始点と
終点のＸ方向及びｙ方向の座標値で格納する。

認識領域データは、前述した読取エリアに関するデータ
であり、領域個数（読取エリアとして指定された領域の
数）と、その数（ｒ個）だけの読取条件及び領域座標を
格納する。

読取条件としては、原始データモードと原始データＮｏ
、、字種、辞書ファイル名、及び手書きフィールドファ
イル名等がある。

原始データモー１−は、その読取エリアが線分に付随す
るものか枠に付随するものか、あるいは全くフリーなエ
リアなのかを指定するデータであり。

原始データＮｏ、は、付随するデータの線分Ｎｏ、ある
いは枠Ｎｏ、である。

字種のデータは、第１Ｓ図に示すように、８ビツトのメ
モリエリアの最上位にビットを立てる（１”にする）こ
とにより「手書きモード」を指定し、最下位にビットを
立てることにより「イメージモード」を指定する。さら
に、最上位から２ビツト目がアルファベット（Ａ）、３
ビツト目が数字（Ｎ）、４ビツト目が記号（Ｓ）、５ビ
ツト目が片カナ（Ｋ）、６ビツト目が漢字、７ビツト目
がひらがなの指定用ビットであり、それぞれビットを立
てることにより指定し、複数の指定もできる。

なお、活字モードの場合は最上位及び最下位にはビット
を立てない。

辞書ファイル名は、活字モードの場合に指定された書体
に応じた辞書ファイル名を格納する。

手書きフィールド情報尋は１手書き文字の場合には認識
率を高めるために、第２０図に示すように各行を文字の
種類（アルファベット、数字、記号等）ごとに区切って
、その各区間の長さをフィールドデータとして順次格納
したファイルを別に作成するため、それを読み出すため
の情報である。

領域座標は、読取エリアの始点と終点の座標（ａｘｓ、
ａｙｓ）、（ａｚｅ、ａｙｅ）である。

次に、第１３図の帳票データ読取処理について、第２１
図乃至第２３図も参照して説明する。

第１３図のフローチャートに示す処理がスタートすると
、まず識別パラメータテーブルのセット。

すなわちフオームファイルから既に登録されているフオ
ームの識別パラメータをフオームファイル名と共に読み
出してテーブルに格納する。

その後、オペレータが読取対象の帳票をスキャナにセッ
トするが、オートフィーダ付きスキャナを使用すれば多
数の帳票を一度にセットすることができ、且つフオーム
情報を登録しである帳票であれば、異なるフオームの帳
票が混在していてもかまわない。

そして、そのセットされた帳票の最初の１枚をスキャナ
が所定の読取密度及び読取濃度でスキャンしてその画像
データを本体に入力するので、本体の枠線認識手段がそ
の画像データから前述したように線分を認識し、４本の
線分によって１つの矩形エリアを囲む枠線を認識する処
理を行なう。

そして５次に帳票のフオームを識別するフオーム識別処
理を行なうが、その詳細については第２１図及び第２２
図によって後述する。

次に１画像ファイルに格納しである入力画像データを枠
線認識の結果による基準位置に対して位置を正規化し、
読取エリアの画像データを切出す。

そして１個々の読取エリアの読取条件に合った読取方法
を選択し、活字ＡＮＳ　（アルファベット。

数字、記号）認識１手書きＡ　Ｎ　Ｓ　ｇＢ識、活字漢
字認識１手書き漢字認識等の文字認識処理、あるいはイ
メージデータの２値化あるいは多値化処理を行なう。

この文字認識は、活字の場合は指定された書体の文字認
識用辞書とのパターンマツチングによって行なわれ１手
書き文字の場合は、予め手書き文字用の辞書を作成して
おいて、その辞書と前述した手書きフィールドデータと
を用いて、パターンマツチングによって認識する。

二のようにして認識された文字は文字コードデータとし
て、イメージデータはビットマツプとして、それぞれ読
取結果ファイルに第２３図に示すようなフォーマットに
従って格納する。

そして、帳票１枚分の読み取りが終了するまで、順次読
取エリアの画像データ切出しから読取結果のファイルへ
の格納までの処理を繰り返し、帳票１枚分の読み取りが
終了すると１次の帳票をセットあるいはオートフィーダ
によって送り込んで、スキャナによる読み取りからの処
理を繰返す。　−こうして、全ての帳票の読み取りを終
了するまで上述の各処理を行なって、各帳票の指定され
た全ての読取エリアのデータを読み取って、その認識結
果を読取結果ファイルに格納する。

ここで、フオーム識別処理について第２１図及び第２２
図によって説明する。

フオーム識別処理は、第２１図のフローチャートに従っ
て行なうが、まずパラメータ評価を行う。

これは、登録しである各帳票のフオームの識別パラメー
タと今回枠線認識を行なった帳票の識別パラメータとを
比較し、読取密度と枠の個数は完全に一致し、他のパラ
メータは所定の許容誤差範囲内で一致するものを選択す
る（選択したフオームの数をｎｌとする）。

このパラメータ評価の例を第２２図にさらに詳しく示す
。

この例では、今回認識した帳票のフオームをフオームＡ
とし、登録しである帳票のフオームを順次フオームＢと
し、フオームＡの識別パラメータとフオームＢの識別パ
ラメータとを比較し、各パラメータの比較結果が全てＹ
ＥＳになった時にカウンタをカウントアツプするように
し、フオームＡと全ての登録フオームとの識別パラメー
タの比較を順次行なう。

図中、　Ａｄｅｎ、　Ｂｄｅｎは読取密度（Ａが付く方
はフオームＡ、Ｂが付く方はフオームＢの値を示す。

以下同じ）　、　　ｌ　Ａｘｗｄ　−Ｂｘｗｄ　ｌはＸ
方向幅の差。

ｌ　Ａｙｔ＋ｄ　−Ｂｙｗｄ　ｌはｙ方向幅の差、ｗｔ
ｈは幅の差のしきい値、Ａ　ｆｒａｍｅ　、　Ｂ　ｆｒ
ａｍｅは枠の個数。

１Ａｘｌ−ＢｘｌｌはＸ方向の線分本数の差、ｌ　Ａｙ
ｌ−１３ｙｌｌはｙ方向の線分本数の差、ｃｔｈは線分
本数の差のしきい値である。

第２１図に戻って、上述のパラメータ評価で選択された
フオームが少なくとも１つ以上あった（ｒｚ　≧１）か
否かを判断し、なければリジェクトする。

ｎ１≧１であれば、次に枠位置の評価を行なう。

すなわち、基準位置（第１６図の点Ｐａ）によって正規
化された各枠位置をその始点位置（；Ｉ　ＤＣｓ。

ａ、！／ｓ）と幅（；Ｉ　Ｚ　６−　ａ’１　ｓ）及び
（ａｙｅ−ａ！！ｓ）（第１７図参照）を用いて、パラ
メータ評価をパスした各登録フオームの各枠位置を示す
これらの値と順次比較して、その誤差の和が所定の範囲
内にあるものを選択する。

この枠位置の評価をｎ１個の登録フオームについて行な
って、選択したフオームの数をｎ２個とする。

そして、選択されたフオームが少なくとも１つ以上あっ
た（ｎ２≧１）か否かを判断し、なければリジェクトす
る。

ｎ２≧１であれば１次に線分位置の評価を行なう。すな
わち、基準位置によって正規化された各線分位置をその
始点（ｚｓ、！ｔｓ）と長さくｒ、６−　：ｘ：Ｓ　）
又は（ｙｅ−、ｙｓ）を用いて、ｎ２個の登録フオーム
の各線分位置を示すこれらの値を順次比較して、その誤
差の和が所定の範囲内にあるものを選択する。

この線分位置の評価をｎ２個の登録フオームについて行
なって１選択したフオームの数をｎ３とする。

ここで、ｎ３≧１でなければリジェクトし、ｎ３≧１で
あれば、その選択されたフオームの中でも最も近い（誤
差が少ない）ものを該当フオームとして選択するが、こ
こで通常はｎ３＝１になるはずであり、必然的に１つの
登録フオームを選択することができる。

この実施例によれば、伝票等の枠線によりフオームが定
められている帳票に記入された文字等の読取エリアの指
定が容易になると共に、そのフオームを予め登録したお
くことにより、フオームの異なる各種の帳票をオートフ
ィーダ付スキャナで連続的に取り込んで処理することも
可能になる。

また、枠線をＬｙ！、識してフオームの識別パラメータ
とすることにより、線分のみの場合に比してノイズの影
響が極めて少なくなり、ｒａ別精度が大幅に向上する。

匁−一米以上説明してきたように、この発明による光学文字読取
装置は、原稿内の必要な部分の文字情報を迅速に認識し
て読み取ることができる。

【図面の簡単な説明】

第１図はこの発明による光学文字読取”Ａ置の基本構成
を示す機能ブロック図、第２図はこの発明の一実施例である文書処理システムの
外観斜視図、第３図は同じくそのブロック構成図、第４図は第３図におけるＯＣＲ前処理・認識部６のプリ
プロセッサによる前処理機能を示すブロック図。第５図は同じ（この実施例による前処理及び文字認識動
作のフロー図、第６図は第５図における読取エリア及び読取条件指定処
理の詳細を示すフロー図、第７図は読取エリア指定時におけるＣＲＴの画面表示の
例を示す図、第８図は書体指定時におけるＣＲＴの画面表示の例を示
す図、第９図は設定したエリア情報を格納するファイルの構成
を示す図。第１０図は同じくそのエリア情報の構成を示す図。第１１図（Ａ、）　（Ｂ　）はこの発明の他の実施例の
フオーム情報を登録するために必要な部分と帳票のデー
タを読み取るために必要な部分の構成をそれぞれ示す機
能ブロック図。第１２図は第１１図（Ａ）の構成によるフオーム情報登
録処理のフロー図。第１３図は第１１図（Ｂ）の構成による帳票データ読取
処理のフロー図、第１４図乃至第２０図はそれぞれ第１２図のフオーム情
報登録処理の説明に供する説明図。第２１図は第１３図におけるフオーム識別処理の詳細を
示すフロー図、第２２図は第２１図におけるパラメータ評価処理の詳細
を示すフロー図、第２３図は読取結果ファイルのフォーマットを示°　　
す図である。Ａ・・・スキャナ　　Ｂ・・・読取エリア指定手段Ｃ・
・・読取条件指定手段　　Ｄ・・・前処理装置Ｅ・・・
文字認識手段１・・・キーボード　　２・・・イメージスキャナ３・
・・ＣＲＴディスプレイ装置　　４・・・プリンタ５・
・・本体　　６・・・ＯＣＲ前処理・認識部７・・・ハ
ードディスク装置　　１０・・・制御部１１・・・画面
メモリ　　１２・・・ＣＲＴコントローラ第１図第７図Ｍ４図ｇＢ図笛９図ファイルの構成第１０図エリア情報の構成Ｍ１４図第１５図第１６図ｍｉ　ｎ　（ｚｓ）　　　　　　　　　ｒｎｈｘ　＆ｅ
）第１７図しくＤ）第１９図第２１図

Claims

【特許請求の範囲】

１　スキャナによつて原稿をスキャンして文字を含む画
情報をイメージデータとして取り込み、そのイメージデ
ータから文字を認識して文字コードデータに変換する光
学文字読取装置において、イメージデータとして取り込
んだ画情報の読取エリアを指定する読取エリア指定手段
とその指定されたエリア内の読取条件を指定する読取条
件指定手段とからなる前処理装置を設けたことを特徴と
する光学文字読取装置。