JPS63257883A

JPS63257883A - 光学式文字読取装置

Info

Publication number: JPS63257883A
Application number: JP62091054A
Authority: JP
Inventors: Hikoshi Nagasawa; 長沢　彦士; Kazuo Ito; 伊藤　和郎; Shigeru Horii; 堀井　茂; Yoshikazu Kobayashi; 美和小林
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1987-04-15
Filing date: 1987-04-15
Publication date: 1988-10-25

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、光学的文字読取装置（以下ｏｃｎと略ず）に
関し、特に読取対象行の位置を検出する行検出方式に関
する。

（従来の技術）従来、ＯＣＲが読取対象とする文字は、英数、カナ文字
が主体であったが、最近では漢字も認識可能となり、こ
こに至って日本語入力用ツールとして脚光を浴びつつあ
る。ここで、日本語入力の対象としては、既存の文書は
もちろんのこと、今後発行される文書の大部分も対象と
なる。今後発行される文書については、発行元では確か
にＥＤＰ化されて保存されているが、その文書を受は取
フだ側としてはＦ、Ｄ　Ｐ化のためには新たな人力が必
要となってしまう訳である。

日本語の人力は、キーボードからかな漢字変換なとの手
段で行なフているが、マンパワー、人力時間等で膨大な
作業となり一般文書人力のネックとなっている。

第２図ないし第５図は、従来のこの種のＯＣＲに係る１
構成例を示した図である。

第２図は入力したい文とのモデルを示したもので、■は
本文占の１頁分の帳票を表わしている。

２は以下の文４Ｆを代表するタイトル行、３〜５は文、
ＩＦを構成する行位置を示している。また、６は木口の
に端位置を示している。

既存文書を含む日本語文書は当然ながらその頁ごとの行
配列か異なっているために、予め頁ごとに読取対象行位
置を頁上辺から距離で定義することは煩雑過ぎて到底実
用に耐えられるものではない。従って、この行位置を自
動的に検出し、検出した結果から文字認識を行なう自動
行検出方式が考えられている。

このような自動行検出方式を具備したＯＣＲの構成を第
３図に示す。同図において、帳票７には文章を構成する
行８か記載されており、９は帳票の始端である。この帳
票７はモータ１０から駆動されるローラ１１によって矢
印１２の方向へ搬送される。

１３は光電変換センサであり、ランプ１４によって帳票
７を照光し、該帳票紙面によって反射された光が結像レ
ンズ１５によって結像された光を人力とし、その出力は
走査線１６に対応する帳票７上の画像信号である。従っ
て、帳票７の１頁分を走査するためにはモータ１０を駆
動し、帳票７を矢印１２の方向へ移動することとなる。

１７は増幅回路器、ＡＤ変換器（必要な画像が２値化号
であれば量子化回路）などを含む演算回路であり、出力
は走査線１６上の文字の濃淡に比例したディジタル信号
列である（２値画像では黒を“１”、白を“０”とした
ディジタル信号）。以下の説明にあたフては、簡単のた
めに演算回路１７の出力は２値化画像信号とするが、濃
淡が像（いわゆる階調画像）でも動作としては同じでた
だ量子化回路を別途に設けるだけの違いである。

１８はイメージメモリであり、メモリ各容量としては帳
票１頁分を有する。１９は書き込みアドレス回路、２０
は読み出しアドレス回路であり、それぞれ・ｒメータメ
モリ１８のアドレス情報を与えるため切り替え回路２１
に接続され、さらに切り替え回路２１はアドレスカウン
タ２２に接続されている。２３は位置決め回路であり、
イメージ画像１８の出力を受は取って位置決め処理を具
体的に行なう。２４は端子であり、特定された行分の画
像信号を出力する役目を担っており、次段は図示しない
文字認識部となる。なお、２５は各回路を有機的に制御
する制御回路である。

次に、動作について説明する。

まず、各回路を初期化した後、帳票７を走行させ、図示
しない始点検出器（例えば発行受光ダイオード対）にて
帳票始端を検出し、これ以降の帳票画像をイメージメモ
リ１８へ格納する。そこで、１走査線８の画像列をイメ
ージそり１８へ格納するため、書き込みアドレス回路１
９の出力がアドレスカウンタ２２を経由してイメージメ
モリ１８のアドレスとして供給される。

光電変換センサ１３は通常自己走査型センサが使われて
いるため、制御回路２５の制御によってセンサ出力とし
て出力されることになり、この時系列のサンプル間隔に
合せて該アドレスカウンタ２２を更新し、１走査線分の
画像をイメージメモリへ格納する。

次に、制御回路２５はモータ１０を駆動し、１分解能分
だけ帳票を移動させ、同様の動作を実施し、これを帳票
全体に行なうことにより１頁分の画像を格納することが
できる。

帳票７の１頁分のイメージがすべて格納終了すると、制
御回路２５は切り替え回路２１に指令を発してアドレス
カウンタ２２と読み出しアドレス回路２０とを接続する
。そして、今度はイメージメモリ１８を読み出すことに
よりイメージ画像を基本的には１走査線分づつ順次位置
決め回路２３へ供給する。

位置決め回路２３では、この画像列を順次処理し、読取
り対象行位置を検出し、必要ならば図示せぬレジスタへ
これを登録して１行分のイメージメモリ上のアドレスを
算出する。その後、このアドレスから１文字行分の画像
を読み出し、端子２４から図示せぬ文字認識部へこの画
像を送出し、文字認識を行なう。

なお、書き込みアドレス回路１９と読み出しアドレス回
路２０とを用いているのは、イメージメモリ１８の書き
込み、読み出し動作をタイムシェアリング的に並列動作
を行なって処理速度を上げるための工夫であり、上述の
ように書き込みと読み出しをシリーズで行なうのであれ
ば、どちらか１方で兼用できる。また、位置決め回路２
３に検出した文字行アドレスのバッファメモリを設けれ
ば、次の位置決め動作と、当該決定性の画像を端子２４
に出力する動作とは、読み出しアドレス回路２０を時分
割使用することにより並列に行なうことができる。

第４は、文字行検出のアルゴリズムを説明する図、第５
図は位置決め回路のブロック図である。

第４図において、４１は帳票１頁分の画像がイメージメ
モリ１８に格納された状態を示したもので、４２．４３
．４４．４５．４６．４７は帳票上の文章を構成す　　
□る文字行の画像を格納状態を示したものである。

４２ａ、４３ａ、４４ａ、４５ａ、４６ａ、４７ａ、は
それぞれ行４２．４３．４４．４５．４６．４７に対応
した各行内の各走査線ごとの黒点数の加算結果であり、
これを生成する方法についてさらに第５図を参照して説
明する。

第５図において、５１．５２は第４図に対応した座標軸
である。１ドツトラインのイメージバッファ５３は、前
記イメージメモリ１８から供給される１走査線分の画像
を格納するバ・ソファメモリであるか、これはイメージ
メモリ１８の出力をそのまま使ってもよく、この場合に
は不要である。５４は１ドツトラインのイメージバッフ
ァ１８にＸアドレスを供給するＸアドレスカウンタであ
る。これも前述のようにイメージメモリのアドレスカウ
ンタ２２と兼用できる。５５は加算回路であり、１ドツ
トラインのイメージバッファ５３の出力（黒“１”、白
“０”の画像データ）と投影メモリ５７の出力を加算す
る機能を有する。投影メモリ５７は加算回路５５の出力
を格納する機能を有し、そのＹ方向（副走査方向）のア
ドレスとしてＹアドレスカウンタ５６から指定を受ける
。５８は位置決め制御回路であり、各回路を制御する。

次に、第５図の動作を説明する。

まず、制御回路２５の指令によりイメージメモリのアド
レスカウンタ２２および１ドツトラインイメージバツフ
ア５３のＸアドレスウンタ５４および投影メモリ５７の
内容を初期化する。この時点で、画像の読み出し走査位
置は上端４１ａ（第４図）を指示されている。この位置
をＹ＝Ｏとする。以下、アドレスカウンタ２２、Ｘアド
レスカウンタ５４、およびＹアドレスカウンタ５６は相
互に同期して動作するように制御する。この時点で、Ｙ
は固定（＝０）とし、Ｘアドレスカウンタ５４を歩進さ
せてゆきイメージメモリ１Ｂの内容を１ドツトラインの
イメージバッファ５３へ転送する。１走査線分について
転送を終了したら位置決め制御回路５８はＸアドレスカ
ウンタ５４を０とし、同時にＹ＝Ｏに相当する投影メモ
リ５７の内容とＸ＝０の１ドツトラインのイメージバッ
ファ５３の内容の加算を行ない、ざらにＸアドレスを歩
進させてこれに相当するイメージバッファ５３の内容と
前記加算結果を積算的に加算して１走査分につき終了す
る。この時点で、加算回路５５にはＹ＝０に相当する１
走査線分の黒点数の総和が完成しているので、これを投
影メモリ５７のＹ＝Ｏのアドレスに格納する。

次に同様に、アドレスカウンタ２２を次の走査線位置に
動かし、同時にＹ＋１、ｘ＝０となして」−記と同様に
動作を行ないイメージ下端４１ｂまで実施する。

これが終了した時点では、４２ａ、４３ａ、４４ａ、４
５ａ、４６ａ、４７ａに示すように各走査線（Ｙ方向）
ごとの黒点数の総和が投影メモリ５７内に書き込まれて
いることになる。

次に、これを用いた行検出のアルゴリズムについて説明
する。第４図に示すように、文字行４２の投影は４２ａ
に示すとおりであり、これは黒点数の総和となっている
ため、ある値りと比較し黒点数が０以上の走査線Ｙの１
番若いアドレスを行４２の開始Ｙアドレスとし、最大の
アドレスを終了アドレスとすることで検出できる。これ
らをそれぞれＹＯｌＹｌとする。同様の比較を行４３．
４４．４５．４６．４７についてもそれぞれ第４図に示
すようにＹ２、Ｙ３、・・・Ｙ２ｉ、Ｙ２ｉ＋１　（ｉ
＝０．１．２、・・・）を得る。これによって、イメー
ジメモリ１８の各行の開始アドレスＹ２ｉと終了アドレ
スＹ２ｉ＋１か求まったので１次はＹ２ｉ、Ｙ２ｉ＋１
間の画像を端子２４から出力し、文字認識を行なう。な
お、萌述したように、特定のＹ２ｉ、Ｙ２ｉ＋１のベア
か発見できた時点で次のベアをサーチする動作と、Ｙ２
ｉ、Ｙ２ｉ＋１間の画像を端子２４から出力する動作は
時分割制御によって行なえることは明らかである。

（発明か解決しようとする問題点）しかしながら上記構成のＯＣＲでは、第３図に示すよう
に、１頁分のイメージメモリを保有する必要があり、装
置の価格が高価になるという問題点があった。例えば、
Ａ４判１頁（２１０ｍｍ＊２９７１１１１１１）を分解
能１６本／ｍｍの１６階調画像として貯蔵するだめには
６０Ｍ　ｂ　ｉ　ｔという膨大なメモリを必要とし、ユ
ーザにとって負担となり、これが要因となってＯＣＲの
大幅な普及を妨げていた。

そこで、本発明は以上述べた問題点を解決し、手軽に文
書人力をすることができる安価なＯＣＲを提供すること
を目的とする。

（問題点を解決するための手段）本発明は、従来技術の問題点を解決するために、帳票上
に記載された読取対象を光学的に走査し、この走査デー
タに基づき読取対象の認識処理を行なうＯＣＲにおいて
、以下の手段を設けて構成される。

上記ＯＣＲは、帳票を走行させる走行手段と、帳票上の
読取対象行位置の検出のため前記走行手段を制御して帳
票上の読取対象を走査する第１の走査手段と、帳票上の
読取対象の認識処理のため前記走行手段を制御して帳票
上の読取対象を走査する第２の走査手段と、第１又は第
２の走査手段により走査された帳票の走査データを格納
する格納手段と、第１の走査手段により前記格納手段に
格納された走査テークに基づき帳票上の読取対象行位置
の検出を行なう検出手段と、第２の走査手段により前記
格納手段に格納された走査データおよび前記検出手段の
検出結果に基づき読取対象の認識処理を行なう認識手段
とを具備して構成される。

（作用）本発明によれば、以上のようにＯＣＲを構成したので各
技術的手段は次のように作用する。

本発明によるＯＣＲにおいて読取対象の認識処理を行な
う場合、まず第１の走査手段が帳票上の読取対象行位置
検出のため、走査手段を制御して読取対象の走査を行な
う。この走査により、検出手段は格納手段に格納された
走査データに基づき各読取対象行の位置を検出する。以
上のようにして、読取対象行の位置検出が終了すると、
第２の走査手段は今度は読取対象の認識処理のために走
行手段を制御して帳票上の走査を行なう。すると、認識
手段は、第２の走査手段により格納手段に格納された走
査データと検出手段の検出結果に基づき各読取対象行ご
との読取対象について順次認識処理を行なう。従って、
本発明によれば、従来のように一旦走査して得られた走
査データを格納し、この格納された走査データから読取
対象行の位置を検出し、かつ認識処理をするのではなく
、読取対象の行位置検出と認識処理とをそれぞれ別個に
走査して走査データを取得するようにしたので、帳票上
のすべての読取り対象の走査データを格納しておく必要
がなく、格納手段の格納容量を削減できる。よって、従
来技術の問題点を解決できるのである。

（実施例）以下、本発明の１実施例について図面を参照して詳細に
説明する。

第１図は、本発明の１実施例によるＯＣＲの構成を示す
ブロック図であり、図中従来技術の説明で用いた第３図
に示す構成要素と同一構成のものについては同一番号を
付しである。同図において、１２ａは駆動ローラ１１に
よって帳票７を副走査させるための移動方向であり、本
実施例の場合では図面に向かって上下方向に移動するよ
うになっている。１８ａはイメージメモリでありその容
量としは最小読取対象文章の１行ピッチ分である。２３
ａは位置決め回路２３に設けられた演算器であり、この
演算器２３ａは走査線アドレスＹの順逆逆転演算および
Ｑ　ｊ、）行アドレスＹ２ｉ、Ｙ２ｉ＋１との比較を主
に行なう。２５ａは、制御回路２５に設けられた走行制
御回路であり、主にモータ１０の駆動を制御してローラ
の正転、逆転、および間欠動作を行なう。

次に、本実施例の動作について説明する。この動作は２
つに大別でき、第１のステップは帳票を粗い分解能で走
査して文字行位置を求めるステップで、第２のステップ
は帳票を逆方向に移動させながら細かい分解能で画像を
採取しこれを文字認識に供するステップである。

第１のステップは、以下のとおりである。まず、制御回
路２５はすべての回路を初期化する。そして、モータ１
０を駆動し帳票７を走行方向（図中上側）１２ａに走行
させ、これと同時に書き込みアドレス回路１９を制御し
て各走査線ごとの画像をイメージメモリ１８ａへ書き込
む。帳票を走査する粗い分解能の選択は、例えば、通常
は細かい分解能の走査を行ない、電子的に再サンプリン
クすることにより走査を粗くするような公知な技術かあ
る。このようにして、イメージメモリ１８ａに書き込ま
れた画像は直ちに制御回路２５の指令に基づき読み出し
アドレス回路２０によって読み出され、位置決め回路２
３は送出される。イメージメモリへの書き込み、読み出
しは時分割的に並列して動作するように制御できるが、
本実施例の場合にはイメージメモリ１８ａは１頁分の格
納容量を持たないので、書き込み、読み出し処理の所要
時間により逆転しないで常に書き込みの後読み出しを行
なうこと、及び読み出していないうちに新たな占き込み
を行なわないように走行制御回路２５ａを前もって制御
することは搭載するイメージメモリの容量を知っている
ので、書き込みアドレス、読み出しアドレスを観測する
ことによって制御回路２５において容易に実施できる。

位置決め回路２３に供給された画像データは、従来技術
と同様の動作が行なわれる。登録される行位置開始アド
レスＹ２ｉ、終了アドレスＹ２ｉ＋１は文字認識のため
細かい分解能に対応したものが精度上好ましく、これを
行なうことは制御回路とのやりとりで実現することがで
きる。このようにして、帳票７の図示せぬ終端が光電変
換センサ１３の走査線】６を通過した時点で文字行位置
を示すＹ２ｉ、Ｙ２ｉ＋１が検出され、ざらに帳票上端
と下端との距離（第４図の左側）Ｙｍも測定できたこと
になる。なお、副走査された帳票７は当然ながら走査線
１６をこえた当初の帳票始端側に位置している。

次に、第２のステップについて説明する。

制御回路２５は書き込みアドレス回路１９、読み出しア
ドレス回路２０、アドレスカウンタ２２、および位置決
め回路２３の文字行位置Ｙ２ｉ、Ｙ２ｉ＋１を登録して
いるレジスタ以外を初期化する。さらに、走行制御回路
２３ａを制御しては第１のステップとは反対方向に帳票
７を走行させる。なお、制御回路２５には、走査線のサ
ンプリングレートを文字認識用の画像取得分解能に設定
する。これによって、帳票７は終端側から所定の細かい
分解能によって走査され、この走査データは書き込みア
ドレス回路１９によって順次イメージメモリ＋８Ａに書
き込まれ、また時分割的に読み出しアドレス回路２０に
よって読み出されて位置決め回路２３に画像が送出され
る。この並行動作において、書き込みと読み出しのタイ
ミングの逆転が起きないように制御することは第１のス
テップと同様である。

位置決め回路２３においては、読み出しアドレス回路１
９と登録されているＹ２ｉ、Ｙ２ｉ＋１のアドレスを比
較し、合致した範囲内を行位置としてこの間隔内の画像
を走査線単位に順次端子２４から文字認識画像として送
出する。なお、アドレス比較の際、Ｙ２ｉ、Ｙ２ｉ＋１
　（ｉ＝ｏ、１，２゜３・−−ｎ）アドレスは、Ｙｍ−
Ｙ２ｉ、Ｙｍ−Ｙ２ｉ＋１　（ｉ＝ｎ、ｎ−１，・−・
２，１゜０）の値、すなわち第４図に示すように帳票始
端からの距離に変換して行なう必要があり、これらの動
作は６１１算器２３ａによってなされる。

（発明の効果）以上、詳細に説明したように、本発明によれば、第１の
走査手段で得られた走査データにより読取対象行の位置
を検出し、第２の走査手段で得ら才また走査データによ
り読取対象の認識処理を行なうようにしたので、読取対
象行の位置検出あるいは認識処理を行うにあたって帳票
上のすべての読取対象についての走査データを格納して
おく必要はなく、その結果、格納手段の格納容量を大幅
に削減てき、ＯＣＲの価格の低下か期待できる。また、
第１、第２の走査が必要となフても、オペレータの負担
は全くなく手軽に自動的に読取対象の人力を行なえるＯ
ＣＲを提供することができる。

【図面の簡単な説明】

第１図は本発明の１実施例によるＯＣＲの構成を示すブ
ロック図、第２図は入力する文書モデルを示す図、第３
図は従来のＯＣＲの構成を示すブロック図、第４図は読
取り対象行の位置検出に係るアルゴリズム説明図、第５
図は位置決め回路の構成を示すブロック図である。１・・・巾長票、１０−・・モータ、ｌ　Ｉ−・・ロー
ラ、１８、　１８ａ・・・イメージメモリ、１９−・・
書込みアドレス回路、２０・・・読出しアドレス回路、２１・・・切替回路、２３・・・位置決め回路、２］ａ
・・・演算機、２５−・・制御回路、２５ａ・・・走行
制御回路。

Claims

【特許請求の範囲】帳票上に記載された読取対象を光学的に走査し、この走
査データに基づき読取対象の認識処理を行なう光学式文
字読取り装置において、帳票を走行させる走行手段と、帳票上の読取対象行位置の検出のため、前記走行手段を
制御して帳票上の読取対象を走査する第１の走査手段と
、帳票上の読取対象の認識処理のため、前記走行手段を制
御して帳票上の読取対象を走査する第２の走査手段と、第１又は第２の走査手段により走査された帳票の走査デ
ータを格納する格納手段と、第１の走査手段により前記格納手段に格納された走査デ
ータに基づき帳票上の読取対象行位置の検出を行なう検
出手段と、第２の走査手段により前記格納手段に格納された走査デ
ータおよび前記検出手段の検出結果に基づき読取対象の
認識処理を行なう認識手段とを具備することを特徴とす
る光学式読取装置。