JPS63257883A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPS63257883A
JPS63257883A JP62091054A JP9105487A JPS63257883A JP S63257883 A JPS63257883 A JP S63257883A JP 62091054 A JP62091054 A JP 62091054A JP 9105487 A JP9105487 A JP 9105487A JP S63257883 A JPS63257883 A JP S63257883A
Authority
JP
Japan
Prior art keywords
scanning
read
line
image
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62091054A
Other languages
English (en)
Inventor
Hikoshi Nagasawa
長沢 彦士
Kazuo Ito
伊藤 和郎
Shigeru Horii
堀井 茂
Yoshikazu Kobayashi
美和 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62091054A priority Critical patent/JPS63257883A/ja
Publication of JPS63257883A publication Critical patent/JPS63257883A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、光学的文字読取装置(以下ocnと略ず)に
関し、特に読取対象行の位置を検出する行検出方式に関
する。
(従来の技術) 従来、OCRが読取対象とする文字は、英数、カナ文字
が主体であったが、最近では漢字も認識可能となり、こ
こに至って日本語入力用ツールとして脚光を浴びつつあ
る。ここで、日本語入力の対象としては、既存の文書は
もちろんのこと、今後発行される文書の大部分も対象と
なる。今後発行される文書については、発行元では確か
にEDP化されて保存されているが、その文書を受は取
フだ側としてはF、D P化のためには新たな人力が必
要となってしまう訳である。
日本語の人力は、キーボードからかな漢字変換なとの手
段で行なフているが、マンパワー、人力時間等で膨大な
作業となり一般文書人力のネックとなっている。
第2図ないし第5図は、従来のこの種のOCRに係る1
構成例を示した図である。
第2図は入力したい文とのモデルを示したもので、■は
本文占の1頁分の帳票を表わしている。
2は以下の文4Fを代表するタイトル行、3〜5は文、
IFを構成する行位置を示している。また、6は木口の
に端位置を示している。
既存文書を含む日本語文書は当然ながらその頁ごとの行
配列か異なっているために、予め頁ごとに読取対象行位
置を頁上辺から距離で定義することは煩雑過ぎて到底実
用に耐えられるものではない。従って、この行位置を自
動的に検出し、検出した結果から文字認識を行なう自動
行検出方式が考えられている。
このような自動行検出方式を具備したOCRの構成を第
3図に示す。同図において、帳票7には文章を構成する
行8か記載されており、9は帳票の始端である。この帳
票7はモータ10から駆動されるローラ11によって矢
印12の方向へ搬送される。
13は光電変換センサであり、ランプ14によって帳票
7を照光し、該帳票紙面によって反射された光が結像レ
ンズ15によって結像された光を人力とし、その出力は
走査線16に対応する帳票7上の画像信号である。従っ
て、帳票7の1頁分を走査するためにはモータ10を駆
動し、帳票7を矢印12の方向へ移動することとなる。
17は増幅回路器、AD変換器(必要な画像が2値化号
であれば量子化回路)などを含む演算回路であり、出力
は走査線16上の文字の濃淡に比例したディジタル信号
列である(2値画像では黒を“1”、白を“0”とした
ディジタル信号)。以下の説明にあたフては、簡単のた
めに演算回路17の出力は2値化画像信号とするが、濃
淡が像(いわゆる階調画像)でも動作としては同じでた
だ量子化回路を別途に設けるだけの違いである。
18はイメージメモリであり、メモリ各容量としては帳
票1頁分を有する。19は書き込みアドレス回路、20
は読み出しアドレス回路であり、それぞれ・rメータメ
モリ18のアドレス情報を与えるため切り替え回路21
に接続され、さらに切り替え回路21はアドレスカウン
タ22に接続されている。23は位置決め回路であり、
イメージ画像18の出力を受は取って位置決め処理を具
体的に行なう。24は端子であり、特定された行分の画
像信号を出力する役目を担っており、次段は図示しない
文字認識部となる。なお、25は各回路を有機的に制御
する制御回路である。
次に、動作について説明する。
まず、各回路を初期化した後、帳票7を走行させ、図示
しない始点検出器(例えば発行受光ダイオード対)にて
帳票始端を検出し、これ以降の帳票画像をイメージメモ
リ18へ格納する。そこで、1走査線8の画像列をイメ
ージそり18へ格納するため、書き込みアドレス回路1
9の出力がアドレスカウンタ22を経由してイメージメ
モリ18のアドレスとして供給される。
光電変換センサ13は通常自己走査型センサが使われて
いるため、制御回路25の制御によってセンサ出力とし
て出力されることになり、この時系列のサンプル間隔に
合せて該アドレスカウンタ22を更新し、1走査線分の
画像をイメージメモリへ格納する。
次に、制御回路25はモータ10を駆動し、1分解能分
だけ帳票を移動させ、同様の動作を実施し、これを帳票
全体に行なうことにより1頁分の画像を格納することが
できる。
帳票7の1頁分のイメージがすべて格納終了すると、制
御回路25は切り替え回路21に指令を発してアドレス
カウンタ22と読み出しアドレス回路20とを接続する
。そして、今度はイメージメモリ18を読み出すことに
よりイメージ画像を基本的には1走査線分づつ順次位置
決め回路23へ供給する。
位置決め回路23では、この画像列を順次処理し、読取
り対象行位置を検出し、必要ならば図示せぬレジスタへ
これを登録して1行分のイメージメモリ上のアドレスを
算出する。その後、このアドレスから1文字行分の画像
を読み出し、端子24から図示せぬ文字認識部へこの画
像を送出し、文字認識を行なう。
なお、書き込みアドレス回路19と読み出しアドレス回
路20とを用いているのは、イメージメモリ18の書き
込み、読み出し動作をタイムシェアリング的に並列動作
を行なって処理速度を上げるための工夫であり、上述の
ように書き込みと読み出しをシリーズで行なうのであれ
ば、どちらか1方で兼用できる。また、位置決め回路2
3に検出した文字行アドレスのバッファメモリを設けれ
ば、次の位置決め動作と、当該決定性の画像を端子24
に出力する動作とは、読み出しアドレス回路20を時分
割使用することにより並列に行なうことができる。
第4は、文字行検出のアルゴリズムを説明する図、第5
図は位置決め回路のブロック図である。
第4図において、41は帳票1頁分の画像がイメージメ
モリ18に格納された状態を示したもので、42.43
.44.45.46.47は帳票上の文章を構成す  
□る文字行の画像を格納状態を示したものである。
42a、43a、44a、45a、46a、47a、は
それぞれ行42.43.44.45.46.47に対応
した各行内の各走査線ごとの黒点数の加算結果であり、
これを生成する方法についてさらに第5図を参照して説
明する。
第5図において、51.52は第4図に対応した座標軸
である。1ドツトラインのイメージバッファ53は、前
記イメージメモリ18から供給される1走査線分の画像
を格納するバ・ソファメモリであるか、これはイメージ
メモリ18の出力をそのまま使ってもよく、この場合に
は不要である。54は1ドツトラインのイメージバッフ
ァ18にXアドレスを供給するXアドレスカウンタであ
る。これも前述のようにイメージメモリのアドレスカウ
ンタ22と兼用できる。55は加算回路であり、1ドツ
トラインのイメージバッファ53の出力(黒“1”、白
“0”の画像データ)と投影メモリ57の出力を加算す
る機能を有する。投影メモリ57は加算回路55の出力
を格納する機能を有し、そのY方向(副走査方向)のア
ドレスとしてYアドレスカウンタ56から指定を受ける
。58は位置決め制御回路であり、各回路を制御する。
次に、第5図の動作を説明する。
まず、制御回路25の指令によりイメージメモリのアド
レスカウンタ22および1ドツトラインイメージバツフ
ア53のXアドレスウンタ54および投影メモリ57の
内容を初期化する。この時点で、画像の読み出し走査位
置は上端41a(第4図)を指示されている。この位置
をY=Oとする。以下、アドレスカウンタ22、Xアド
レスカウンタ54、およびYアドレスカウンタ56は相
互に同期して動作するように制御する。この時点で、Y
は固定(=0)とし、Xアドレスカウンタ54を歩進さ
せてゆきイメージメモリ1Bの内容を1ドツトラインの
イメージバッファ53へ転送する。1走査線分について
転送を終了したら位置決め制御回路58はXアドレスカ
ウンタ54を0とし、同時にY=Oに相当する投影メモ
リ57の内容とX=0の1ドツトラインのイメージバッ
ファ53の内容の加算を行ない、ざらにXアドレスを歩
進させてこれに相当するイメージバッファ53の内容と
前記加算結果を積算的に加算して1走査分につき終了す
る。この時点で、加算回路55にはY=0に相当する1
走査線分の黒点数の総和が完成しているので、これを投
影メモリ57のY=Oのアドレスに格納する。
次に同様に、アドレスカウンタ22を次の走査線位置に
動かし、同時にY+1、x=0となして」−記と同様に
動作を行ないイメージ下端41bまで実施する。
これが終了した時点では、42a、43a、44a、4
5a、46a、47aに示すように各走査線(Y方向)
ごとの黒点数の総和が投影メモリ57内に書き込まれて
いることになる。
次に、これを用いた行検出のアルゴリズムについて説明
する。第4図に示すように、文字行42の投影は42a
に示すとおりであり、これは黒点数の総和となっている
ため、ある値りと比較し黒点数が0以上の走査線Yの1
番若いアドレスを行42の開始Yアドレスとし、最大の
アドレスを終了アドレスとすることで検出できる。これ
らをそれぞれYOlYlとする。同様の比較を行43.
44.45.46.47についてもそれぞれ第4図に示
すようにY2、Y3、・・・Y2i、Y2i+1 (i
=0.1.2、・・・)を得る。これによって、イメー
ジメモリ18の各行の開始アドレスY2iと終了アドレ
スY2i+1か求まったので1次はY2i、Y2i+1
間の画像を端子24から出力し、文字認識を行なう。な
お、萌述したように、特定のY2i、Y2i+1のベア
か発見できた時点で次のベアをサーチする動作と、Y2
i、Y2i+1間の画像を端子24から出力する動作は
時分割制御によって行なえることは明らかである。
(発明か解決しようとする問題点) しかしながら上記構成のOCRでは、第3図に示すよう
に、1頁分のイメージメモリを保有する必要があり、装
置の価格が高価になるという問題点があった。例えば、
A4判1頁(210mm*297111111)を分解
能16本/mmの16階調画像として貯蔵するだめには
60M b i tという膨大なメモリを必要とし、ユ
ーザにとって負担となり、これが要因となってOCRの
大幅な普及を妨げていた。
そこで、本発明は以上述べた問題点を解決し、手軽に文
書人力をすることができる安価なOCRを提供すること
を目的とする。
(問題点を解決するための手段) 本発明は、従来技術の問題点を解決するために、帳票上
に記載された読取対象を光学的に走査し、この走査デー
タに基づき読取対象の認識処理を行なうOCRにおいて
、以下の手段を設けて構成される。
上記OCRは、帳票を走行させる走行手段と、帳票上の
読取対象行位置の検出のため前記走行手段を制御して帳
票上の読取対象を走査する第1の走査手段と、帳票上の
読取対象の認識処理のため前記走行手段を制御して帳票
上の読取対象を走査する第2の走査手段と、第1又は第
2の走査手段により走査された帳票の走査データを格納
する格納手段と、第1の走査手段により前記格納手段に
格納された走査テークに基づき帳票上の読取対象行位置
の検出を行なう検出手段と、第2の走査手段により前記
格納手段に格納された走査データおよび前記検出手段の
検出結果に基づき読取対象の認識処理を行なう認識手段
とを具備して構成される。
(作用) 本発明によれば、以上のようにOCRを構成したので各
技術的手段は次のように作用する。
本発明によるOCRにおいて読取対象の認識処理を行な
う場合、まず第1の走査手段が帳票上の読取対象行位置
検出のため、走査手段を制御して読取対象の走査を行な
う。この走査により、検出手段は格納手段に格納された
走査データに基づき各読取対象行の位置を検出する。以
上のようにして、読取対象行の位置検出が終了すると、
第2の走査手段は今度は読取対象の認識処理のために走
行手段を制御して帳票上の走査を行なう。すると、認識
手段は、第2の走査手段により格納手段に格納された走
査データと検出手段の検出結果に基づき各読取対象行ご
との読取対象について順次認識処理を行なう。従って、
本発明によれば、従来のように一旦走査して得られた走
査データを格納し、この格納された走査データから読取
対象行の位置を検出し、かつ認識処理をするのではなく
、読取対象の行位置検出と認識処理とをそれぞれ別個に
走査して走査データを取得するようにしたので、帳票上
のすべての読取り対象の走査データを格納しておく必要
がなく、格納手段の格納容量を削減できる。よって、従
来技術の問題点を解決できるのである。
(実施例) 以下、本発明の1実施例について図面を参照して詳細に
説明する。
第1図は、本発明の1実施例によるOCRの構成を示す
ブロック図であり、図中従来技術の説明で用いた第3図
に示す構成要素と同一構成のものについては同一番号を
付しである。同図において、12aは駆動ローラ11に
よって帳票7を副走査させるための移動方向であり、本
実施例の場合では図面に向かって上下方向に移動するよ
うになっている。18aはイメージメモリでありその容
量としは最小読取対象文章の1行ピッチ分である。23
aは位置決め回路23に設けられた演算器であり、この
演算器23aは走査線アドレスYの順逆逆転演算および
Q j、)行アドレスY2i、Y2i+1との比較を主
に行なう。25aは、制御回路25に設けられた走行制
御回路であり、主にモータ10の駆動を制御してローラ
の正転、逆転、および間欠動作を行なう。
次に、本実施例の動作について説明する。この動作は2
つに大別でき、第1のステップは帳票を粗い分解能で走
査して文字行位置を求めるステップで、第2のステップ
は帳票を逆方向に移動させながら細かい分解能で画像を
採取しこれを文字認識に供するステップである。
第1のステップは、以下のとおりである。まず、制御回
路25はすべての回路を初期化する。そして、モータ1
0を駆動し帳票7を走行方向(図中上側)12aに走行
させ、これと同時に書き込みアドレス回路19を制御し
て各走査線ごとの画像をイメージメモリ18aへ書き込
む。帳票を走査する粗い分解能の選択は、例えば、通常
は細かい分解能の走査を行ない、電子的に再サンプリン
クすることにより走査を粗くするような公知な技術かあ
る。このようにして、イメージメモリ18aに書き込ま
れた画像は直ちに制御回路25の指令に基づき読み出し
アドレス回路20によって読み出され、位置決め回路2
3は送出される。イメージメモリへの書き込み、読み出
しは時分割的に並列して動作するように制御できるが、
本実施例の場合にはイメージメモリ18aは1頁分の格
納容量を持たないので、書き込み、読み出し処理の所要
時間により逆転しないで常に書き込みの後読み出しを行
なうこと、及び読み出していないうちに新たな占き込み
を行なわないように走行制御回路25aを前もって制御
することは搭載するイメージメモリの容量を知っている
ので、書き込みアドレス、読み出しアドレスを観測する
ことによって制御回路25において容易に実施できる。
位置決め回路23に供給された画像データは、従来技術
と同様の動作が行なわれる。登録される行位置開始アド
レスY2i、終了アドレスY2i+1は文字認識のため
細かい分解能に対応したものが精度上好ましく、これを
行なうことは制御回路とのやりとりで実現することがで
きる。このようにして、帳票7の図示せぬ終端が光電変
換センサ13の走査線】6を通過した時点で文字行位置
を示すY2i、Y2i+1が検出され、ざらに帳票上端
と下端との距離(第4図の左側)Ymも測定できたこと
になる。なお、副走査された帳票7は当然ながら走査線
16をこえた当初の帳票始端側に位置している。
次に、第2のステップについて説明する。
制御回路25は書き込みアドレス回路19、読み出しア
ドレス回路20、アドレスカウンタ22、および位置決
め回路23の文字行位置Y2i、Y2i+1を登録して
いるレジスタ以外を初期化する。さらに、走行制御回路
23aを制御しては第1のステップとは反対方向に帳票
7を走行させる。なお、制御回路25には、走査線のサ
ンプリングレートを文字認識用の画像取得分解能に設定
する。これによって、帳票7は終端側から所定の細かい
分解能によって走査され、この走査データは書き込みア
ドレス回路19によって順次イメージメモリ+8Aに書
き込まれ、また時分割的に読み出しアドレス回路20に
よって読み出されて位置決め回路23に画像が送出され
る。この並行動作において、書き込みと読み出しのタイ
ミングの逆転が起きないように制御することは第1のス
テップと同様である。
位置決め回路23においては、読み出しアドレス回路1
9と登録されているY2i、Y2i+1のアドレスを比
較し、合致した範囲内を行位置としてこの間隔内の画像
を走査線単位に順次端子24から文字認識画像として送
出する。なお、アドレス比較の際、Y2i、Y2i+1
 (i=o、1,2゜3・−−n)アドレスは、Ym−
Y2i、Ym−Y2i+1 (i=n、n−1,・−・
2,1゜0)の値、すなわち第4図に示すように帳票始
端からの距離に変換して行なう必要があり、これらの動
作は611算器23aによってなされる。
(発明の効果) 以上、詳細に説明したように、本発明によれば、第1の
走査手段で得られた走査データにより読取対象行の位置
を検出し、第2の走査手段で得ら才また走査データによ
り読取対象の認識処理を行なうようにしたので、読取対
象行の位置検出あるいは認識処理を行うにあたって帳票
上のすべての読取対象についての走査データを格納して
おく必要はなく、その結果、格納手段の格納容量を大幅
に削減てき、OCRの価格の低下か期待できる。また、
第1、第2の走査が必要となフても、オペレータの負担
は全くなく手軽に自動的に読取対象の人力を行なえるO
CRを提供することができる。
【図面の簡単な説明】
第1図は本発明の1実施例によるOCRの構成を示すブ
ロック図、第2図は入力する文書モデルを示す図、第3
図は従来のOCRの構成を示すブロック図、第4図は読
取り対象行の位置検出に係るアルゴリズム説明図、第5
図は位置決め回路の構成を示すブロック図である。 1・・・巾長票、10−・・モータ、l I−・・ロー
ラ、18、 18a・・・イメージメモリ、19−・・
書込みアドレス回路、 20・・・読出しアドレス回路、 21・・・切替回路、23・・・位置決め回路、2]a
・・・演算機、25−・・制御回路、25a・・・走行
制御回路。

Claims (1)

  1. 【特許請求の範囲】 帳票上に記載された読取対象を光学的に走査し、この走
    査データに基づき読取対象の認識処理を行なう光学式文
    字読取り装置において、 帳票を走行させる走行手段と、 帳票上の読取対象行位置の検出のため、前記走行手段を
    制御して帳票上の読取対象を走査する第1の走査手段と
    、 帳票上の読取対象の認識処理のため、前記走行手段を制
    御して帳票上の読取対象を走査する第2の走査手段と、 第1又は第2の走査手段により走査された帳票の走査デ
    ータを格納する格納手段と、 第1の走査手段により前記格納手段に格納された走査デ
    ータに基づき帳票上の読取対象行位置の検出を行なう検
    出手段と、 第2の走査手段により前記格納手段に格納された走査デ
    ータおよび前記検出手段の検出結果に基づき読取対象の
    認識処理を行なう認識手段とを具備することを特徴とす
    る光学式読取装置。
JP62091054A 1987-04-15 1987-04-15 光学式文字読取装置 Pending JPS63257883A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62091054A JPS63257883A (ja) 1987-04-15 1987-04-15 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62091054A JPS63257883A (ja) 1987-04-15 1987-04-15 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPS63257883A true JPS63257883A (ja) 1988-10-25

Family

ID=14015790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62091054A Pending JPS63257883A (ja) 1987-04-15 1987-04-15 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPS63257883A (ja)

Similar Documents

Publication Publication Date Title
JP3641485B2 (ja) 記録方法および装置
EP0113410B1 (en) Image processors
NL8104942A (nl) Drukinrichting met seriebewerking, zingeheugen en weergeving.
JPH06101049B2 (ja) 文字列検出方法
JPS59149526A (ja) フイ−ルド内文書編集処理装置
JPS63257883A (ja) 光学式文字読取装置
US5247170A (en) Information scanner providing two separate digital images of a written text
CN1093297C (zh) 全像扫描装置与方法
CN101140621A (zh) 图文影像处理装置及其影像处理方法
JP2863671B2 (ja) 印字フォーマット作成装置
JPS6154575A (ja) 文字読取装置
JPS61147379A (ja) 光学式文字読取装置
KR100692986B1 (ko) 화상독취장치 및 화상독취방법
HU196008B (en) Method and device for digitizing information content of printed or written texts, figures, graphs on an information carrier favourably to the reading machines
JP2000293633A (ja) 画像読取装置と該画像読取装置の制御方法、及び文書管理システム
JPS6292080A (ja) 文字パターン認識修正装置
JPH09138678A (ja) 光学文字読取装置
JPS62123581A (ja) 文書画像入力装置
JP2001154797A (ja) ペン型光学式入力装置
Craig Interactive digital processing of optical data
JPH05225381A (ja) 光学式文字読み取り装置
JPH0820669B2 (ja) 画像情報記録・読取方法
JPS6015993B2 (ja) 文字の手動走査読取り法
JPH01230186A (ja) データ読み取り装置
JPS59160273A (ja) 文字読取装置