JPS6081687A - 文字切出方式 - Google Patents
文字切出方式Info
- Publication number
- JPS6081687A JPS6081687A JP58188784A JP18878483A JPS6081687A JP S6081687 A JPS6081687 A JP S6081687A JP 58188784 A JP58188784 A JP 58188784A JP 18878483 A JP18878483 A JP 18878483A JP S6081687 A JPS6081687 A JP S6081687A
- Authority
- JP
- Japan
- Prior art keywords
- column
- picture data
- counter
- memory
- buffer memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(技術分野)
複数個のコラムからなる原稿を光学的文字読取装置(O
CR)などで読取って得た画像データからの文字の切出
し方式に関する。
CR)などで読取って得た画像データからの文字の切出
し方式に関する。
(従来技術)
光学的文字読取装置(OCR)などで読取りの対象とさ
れる原稿の書式は、例えば、この明細書のように各頁が
単一のコラムからなる場合と、例えば公開特許公報のよ
うに複数個のコラムからなるものであったり種々雑多で
ある。
れる原稿の書式は、例えば、この明細書のように各頁が
単一のコラムからなる場合と、例えば公開特許公報のよ
うに複数個のコラムからなるものであったり種々雑多で
ある。
そして、従来から光学的文字読取装置(OCR)などで
行なわれる原稿の画像情報の読取り動作は、読取りの対
象とされる原稿が単一のコラムからな、る場合であって
も、あるいは原稿が複数個のコラムからなる場合であっ
ても、原稿における画像、領域の全体について行なわれ
る直交する二方向での走査によっている。
行なわれる原稿の画像情報の読取り動作は、読取りの対
象とされる原稿が単一のコラムからな、る場合であって
も、あるいは原稿が複数個のコラムからなる場合であっ
ても、原稿における画像、領域の全体について行なわれ
る直交する二方向での走査によっている。
それで、従来、複数個のコラムからなる原稿を光学的文
字読取装置(OCR)などで読取って得た画像データか
ら文字を切出す場合も、単一のコラムからなる原稿を光
学的文字読取装置(OCR)などで読取って得た画像デ
ータから文字を切出す場合と同様な切出し態様で行なわ
れていたが、文字の切出しに当って、複数個のコラムか
らなる原稿におけるコラム相互間の無記録領域は、空白
(スペース)文字として切出されるために、文字切、出
しに際して空白文字の抽出エラーがあった場合には、一
本の走査線について後から構成される装置コラムの先頭
位置が揃わない状態になることがあり、また、各コラム
における文字の大きさがコラム毎に異なっているような
場合には、文字の切出しが不可能になることもあり、さ
らに、水平方向についての射影の連続性を見て文字行の
抽出を1、行なうようになされた場合にも、従来は、複
数個のコラムからなるS稿の個々のコラムについて、前
記の方法によって文字行の抽出が行なわれるものではな
かったから、原稿の文字行の方向と走査の方向とがずれ
るようなs様で読取りが行なわれた場合における文字行
の抽出の難易度と原稿の傾斜の影響の度合との関係は、
単一のコラムからなる原稿についての原稿の読取りの場
合と同様であり、複数個のコラムからなる原稿における
各コラ11がそれぞれ個別に走査されたとした場合に得
られるべき利点は何も得られない。
字読取装置(OCR)などで読取って得た画像データか
ら文字を切出す場合も、単一のコラムからなる原稿を光
学的文字読取装置(OCR)などで読取って得た画像デ
ータから文字を切出す場合と同様な切出し態様で行なわ
れていたが、文字の切出しに当って、複数個のコラムか
らなる原稿におけるコラム相互間の無記録領域は、空白
(スペース)文字として切出されるために、文字切、出
しに際して空白文字の抽出エラーがあった場合には、一
本の走査線について後から構成される装置コラムの先頭
位置が揃わない状態になることがあり、また、各コラム
における文字の大きさがコラム毎に異なっているような
場合には、文字の切出しが不可能になることもあり、さ
らに、水平方向についての射影の連続性を見て文字行の
抽出を1、行なうようになされた場合にも、従来は、複
数個のコラムからなるS稿の個々のコラムについて、前
記の方法によって文字行の抽出が行なわれるものではな
かったから、原稿の文字行の方向と走査の方向とがずれ
るようなs様で読取りが行なわれた場合における文字行
の抽出の難易度と原稿の傾斜の影響の度合との関係は、
単一のコラムからなる原稿についての原稿の読取りの場
合と同様であり、複数個のコラムからなる原稿における
各コラ11がそれぞれ個別に走査されたとした場合に得
られるべき利点は何も得られない。
(目的)
本発明は、前記した従来技術で生じていた諸問題点を解
消しうる文字切出方式を提供することを目的とするもの
である。
消しうる文字切出方式を提供することを目的とするもの
である。
(構成)
以下、添付図面を参照しながら本発明の文字切出方式、
すなわち、原稿の一頁分の画像情報と対応する画像デー
タが記憶できるページバッファメモリと、原稿における
コラム間の無記録領域に関するデータを得る手段と、コ
ラム走査テーブルと、ページパップアメモリに記憶され
ている画像データから所定のコラムの画像データを抽出
する手段とからなる文字切出方式について具体的に説明
する。
すなわち、原稿の一頁分の画像情報と対応する画像デー
タが記憶できるページバッファメモリと、原稿における
コラム間の無記録領域に関するデータを得る手段と、コ
ラム走査テーブルと、ページパップアメモリに記憶され
ている画像データから所定のコラムの画像データを抽出
する手段とからなる文字切出方式について具体的に説明
する。
第1図は本発明の文字切出方式の一実施態様のブロック
図であって、この第1図において1は原稿の一貫分の画
他情報と対応する画像データが記憶できるページバッフ
ァメモリであり、また、2は切換スイッチ、3は垂直射
影メモリ、4は原稿におけるコラ11間の無記録領域の
中心位置の判定、部、5はコラム走査テーブル、6は水
平射影抽出回路、7は比較器、8はHカウンタ、9はV
カウンタ、10は一致回路、11は制御回路、12は画
像データの入力端子である。
図であって、この第1図において1は原稿の一貫分の画
他情報と対応する画像データが記憶できるページバッフ
ァメモリであり、また、2は切換スイッチ、3は垂直射
影メモリ、4は原稿におけるコラ11間の無記録領域の
中心位置の判定、部、5はコラム走査テーブル、6は水
平射影抽出回路、7は比較器、8はHカウンタ、9はV
カウンタ、10は一致回路、11は制御回路、12は画
像データの入力端子である。
画像データの入力端子12に供給される画像データは、
図示されていないイメージセンサで原稿力1ら読取られ
た画4#伯号が、図示されて%Nなし)信号処理回路に
よって2値化、その他の所定の信号処理が施こされるこ
とによって作られたものである。
図示されていないイメージセンサで原稿力1ら読取られ
た画4#伯号が、図示されて%Nなし)信号処理回路に
よって2値化、その他の所定の信号処理が施こされるこ
とによって作られたものである。
前記した入力端子12に供給された画像データは、ペー
ジバッファメモリ1に順次に記憶さJcて行くとともに
、切換スイッチ2の固定接点aと可動接点Cとを介して
垂直射影メモリ3にも供給される前記したページバッフ
ァメモリ1における画像データの記憶動作や、切換スイ
ッチ2の切換動作などは、制御回路11の制御の下に行
なわれるのであり、切換スイッチ2の切換えは制御端子
13に対して制御回路11から供給される切換制御信号
によって行なわれ、また、ページバッファメモリ1にお
ける記憶動作は、制御回路11から線W/Rを介して供
給される書込制御信号と、Hカウンタ8から供給される
水平アドレス信号と、Vカウンタ9から供給される垂直
アドレス信号とによって行なわれる。
ジバッファメモリ1に順次に記憶さJcて行くとともに
、切換スイッチ2の固定接点aと可動接点Cとを介して
垂直射影メモリ3にも供給される前記したページバッフ
ァメモリ1における画像データの記憶動作や、切換スイ
ッチ2の切換動作などは、制御回路11の制御の下に行
なわれるのであり、切換スイッチ2の切換えは制御端子
13に対して制御回路11から供給される切換制御信号
によって行なわれ、また、ページバッファメモリ1にお
ける記憶動作は、制御回路11から線W/Rを介して供
給される書込制御信号と、Hカウンタ8から供給される
水平アドレス信号と、Vカウンタ9から供給される垂直
アドレス信号とによって行なわれる。
前記した■1カウンタ8やvカウンタ9からそれぞれ出
力される水平アドレス信号のアドレスの範囲や、垂直ア
ドレス信号のアドレスの範囲は、制御回路11からコラ
ム走査テーブル5に対して線14を介して供給されてい
る主走査範囲の選択信号に従って選択された走査テーブ
ルT1によって定められる。図示の例において、走査テ
ーブルTIでは、Hカウンタ8とVカウンタ9とのスタ
ートアドレスは、共にゼロであり、また、Hカウンタ8
のストップアドレスは1728、Vカウンタ9のストッ
プアドレスは2400であるとされている。
力される水平アドレス信号のアドレスの範囲や、垂直ア
ドレス信号のアドレスの範囲は、制御回路11からコラ
ム走査テーブル5に対して線14を介して供給されてい
る主走査範囲の選択信号に従って選択された走査テーブ
ルT1によって定められる。図示の例において、走査テ
ーブルTIでは、Hカウンタ8とVカウンタ9とのスタ
ートアドレスは、共にゼロであり、また、Hカウンタ8
のストップアドレスは1728、Vカウンタ9のストッ
プアドレスは2400であるとされている。
コラム走査テーブル5から、■(カウンタ8とVカウン
タ9とに与えられるスタートアドレスとストップアドレ
スとは、図中の線15〜18によって供給されるのであ
る。
タ9とに与えられるスタートアドレスとストップアドレ
スとは、図中の線15〜18によって供給されるのであ
る。
前記したHカウンタ8には線19を介して制御回路11
からHイネーブル信号が与えられるとともに、線20を
介して水平走査クロックが供給されている。
からHイネーブル信号が与えられるとともに、線20を
介して水平走査クロックが供給されている。
さて、入力端子12に画像データが供給され始めて、コ
ラム走査テーブル5におけるテーブルT1が選択された
状態において、Hカウンタ8にHイネーブル信号が与え
られると、Hカウンタ8はスタートアドレスと対応する
計数値0がらストップアドレスと対応する割数値172
8までの計数を繰返えす。
ラム走査テーブル5におけるテーブルT1が選択された
状態において、Hカウンタ8にHイネーブル信号が与え
られると、Hカウンタ8はスタートアドレスと対応する
計数値0がらストップアドレスと対応する割数値172
8までの計数を繰返えす。
すなわち、Hカウンタ8の計数出力は、線26を介して
比較器7に与えられており、比較器7ではそれに対して
線16を介して供給されているストップアドレスと、前
記したHカウンタ8の計数値とを比較して、両者が一致
したときに線22に信号を出力する。線22の信号はH
カウンタ8の計数値を0に戻すと共に、Vカウンタ9を
インクリメントしてその計数値を1だけ上げる。そして
、上記の動作が繰返えして行なわれて、Vカウンタ9の
計数値がストップアドレスに達すると、Vカウンタ9の
計数値が線25を介して与えられると共に、線18を介
してストップアドレスが与えられている、一致回路10
から線30に一致出力が出方されて、それによって動作
が停止する。Hカウンタ8とVカウンタ9との前記のよ
うな動作によって、ページバッファメモリ1には、入力
端子12に供給された一頁分の画像データが記憶される
のである。
比較器7に与えられており、比較器7ではそれに対して
線16を介して供給されているストップアドレスと、前
記したHカウンタ8の計数値とを比較して、両者が一致
したときに線22に信号を出力する。線22の信号はH
カウンタ8の計数値を0に戻すと共に、Vカウンタ9を
インクリメントしてその計数値を1だけ上げる。そして
、上記の動作が繰返えして行なわれて、Vカウンタ9の
計数値がストップアドレスに達すると、Vカウンタ9の
計数値が線25を介して与えられると共に、線18を介
してストップアドレスが与えられている、一致回路10
から線30に一致出力が出方されて、それによって動作
が停止する。Hカウンタ8とVカウンタ9との前記のよ
うな動作によって、ページバッファメモリ1には、入力
端子12に供給された一頁分の画像データが記憶される
のである。
入力端子12に供給されたJfl、mの一頁分に対応し
ている画像データは、前記のようにしてページバッファ
メモリ1に記憶されるとともに、前記のようにして垂直
射影メモリ3にも与えられているが、垂直射影メモリ3
ではそれに与えられた画像データに基づいて垂直射影デ
ータが生成されて原稿に2おけるコラム間の無記録領域
の中心位置の判定部4と制御部とに供給される。
ている画像データは、前記のようにしてページバッファ
メモリ1に記憶されるとともに、前記のようにして垂直
射影メモリ3にも与えられているが、垂直射影メモリ3
ではそれに与えられた画像データに基づいて垂直射影デ
ータが生成されて原稿に2おけるコラム間の無記録領域
の中心位置の判定部4と制御部とに供給される。
第2図は、原稿の画像情報と、垂直射影データとの対応
関係を図示説明したものであり、第2図においてA、B
は原稿のコラムであり、また、VPaは原稿のコラムA
についての垂直射影を示し、vPbは原稿のコラムBに
ついての垂直射影を示しており、さらに、図中でCは原
稿におけるコラム間の無記録領域であシ、NRは前記し
た原稿におけるコラム間の無記録領域Cと対応している
垂直射影の部分である。
関係を図示説明したものであり、第2図においてA、B
は原稿のコラムであり、また、VPaは原稿のコラムA
についての垂直射影を示し、vPbは原稿のコラムBに
ついての垂直射影を示しており、さらに、図中でCは原
稿におけるコラム間の無記録領域であシ、NRは前記し
た原稿におけるコラム間の無記録領域Cと対応している
垂直射影の部分である。
第2図にV P a 、 V P b 、 N Rなど
で示されるような垂直射影のデータが与えられた原稿に
おけるコラム間の無記録領域の中心位置の判定部4では
、原稿におけるコラム間の無記録領域NRの中心位置N
Rcを判定して、その判定結果をコラム走査テーブル
5に供給する。垂直射影に無記録領域NRが存在しない
場合には、その原稿が単一のコラムのものであると判定
されることはいうまでもない。
で示されるような垂直射影のデータが与えられた原稿に
おけるコラム間の無記録領域の中心位置の判定部4では
、原稿におけるコラム間の無記録領域NRの中心位置N
Rcを判定して、その判定結果をコラム走査テーブル
5に供給する。垂直射影に無記録領域NRが存在しない
場合には、その原稿が単一のコラムのものであると判定
されることはいうまでもない。
原稿におけるコラム間の無記録領域の中心位置の判定部
4における判定結果によって、コラム走査テーブル5の
テーブルT2におけるHカウンタ8とVカウンタ9との
スタートアドレスとストップアドレスとが決定される。
4における判定結果によって、コラム走査テーブル5の
テーブルT2におけるHカウンタ8とVカウンタ9との
スタートアドレスとストップアドレスとが決定される。
第1図示の例においては、原稿が2個のコラム(第1.
第2のコラム)を有しており、第1のコラムにおけるH
カウンタのスタートアドレスとストップアドレスとが、
それぞれ0 、850であるとされ、また、第2のコラ
ムにおけるHカウンタのスタートアドレスとストップア
ドレスとが、それぞれ850.1728であるとされて
いる。
第2のコラム)を有しており、第1のコラムにおけるH
カウンタのスタートアドレスとストップアドレスとが、
それぞれ0 、850であるとされ、また、第2のコラ
ムにおけるHカウンタのスタートアドレスとストップア
ドレスとが、それぞれ850.1728であるとされて
いる。
原稿におけるどのコラムを走査するのかに応じて、制御
回路11から線14を介して主走査範囲の選択信号がコ
ラム走査テーブル5に与えられ、それによりコラム走査
テーブル5における特定なテーブルが決定される。Hカ
ウンタ8とVカウンタ9とは、前記した特定なテーブル
で指定されたスター1−アドレスとストップアドレスと
の間での計数動作を繰返えして、ページバッファメモリ
1から指定されたコラムを含む所定の範囲の画像データ
が読出される。切換スイッチ2は、それの可動接点Cが
固定接慮す側に切換えられ、垂直射影メモリ3に対して
ページバッファメモリ1から読出された画像データが与
えられ、−文字行づつの垂直射影データがめられる。
回路11から線14を介して主走査範囲の選択信号がコ
ラム走査テーブル5に与えられ、それによりコラム走査
テーブル5における特定なテーブルが決定される。Hカ
ウンタ8とVカウンタ9とは、前記した特定なテーブル
で指定されたスター1−アドレスとストップアドレスと
の間での計数動作を繰返えして、ページバッファメモリ
1から指定されたコラムを含む所定の範囲の画像データ
が読出される。切換スイッチ2は、それの可動接点Cが
固定接慮す側に切換えられ、垂直射影メモリ3に対して
ページバッファメモリ1から読出された画像データが与
えられ、−文字行づつの垂直射影データがめられる。
また、前記したページバッファメモリ1から読出された
画像データは、線27を介して後続の認識部に与えられ
るとともに、線28を介して水平射影抽出回路6に与え
られる。前記した認識部には、水平射影抽出回路6の出
力信号が929を介して供給されるとともに、線31を
介して垂直射影データが与えられる。前記した水平射影
抽出回路6では、−走査線毎の水平射影データをめて、
水平射影のつながり具合から一文字行を含む垂直方向の
範囲(文字行の巾)を決定する。
画像データは、線27を介して後続の認識部に与えられ
るとともに、線28を介して水平射影抽出回路6に与え
られる。前記した認識部には、水平射影抽出回路6の出
力信号が929を介して供給されるとともに、線31を
介して垂直射影データが与えられる。前記した水平射影
抽出回路6では、−走査線毎の水平射影データをめて、
水平射影のつながり具合から一文字行を含む垂直方向の
範囲(文字行の巾)を決定する。
垂直射影メモリ3内のデータを解析して一文字づつの範
囲を決定していき、順次、個々の文字をページバッファ
メモリ1から切出す。
囲を決定していき、順次、個々の文字をページバッファ
メモリ1から切出す。
以上の説明から判かるように、本発明の文字切出方式に
おいては、コラム毎に文字の切出しを行なっているから
、任意のフォーマットの原稿として合成することができ
る。すなわち第3図の(−a )と第3図の(b)とは
、コラムA、Bを単一のコラムの原稿として再生したり
、2つのコラムからなる原稿として再生したりすること
などが自在にできる。という点を図示説明した図である
。
おいては、コラム毎に文字の切出しを行なっているから
、任意のフォーマットの原稿として合成することができ
る。すなわち第3図の(−a )と第3図の(b)とは
、コラムA、Bを単一のコラムの原稿として再生したり
、2つのコラムからなる原稿として再生したりすること
などが自在にできる。という点を図示説明した図である
。
(効果)
本発明は、原稿の一頁分の画像情報と対応する画像デー
タが記憶できるページバッファメモリと。
タが記憶できるページバッファメモリと。
原稿におけるコラム間の無記録領域に関するデータを得
る手段と、コラム走査テーブルと、ページバッファメモ
リに記憶されている画像データから所定のコラムの画像
データを抽出する手段とからなる文字切出方式であるた
めに、簡単な構成であるのにも抱わらずに、原稿におけ
る処理がコラム毎に行なうことができ、それにより、コ
ラム毎の文字行の先頭の位置が正確に揃い、本発明によ
れば、既述した従来のものにおける諸問題点が良好に解
消でき、また、本発明ではコラム毎に編集して原稿を任
意のフォーマットのものとして再生することも可能であ
る。
る手段と、コラム走査テーブルと、ページバッファメモ
リに記憶されている画像データから所定のコラムの画像
データを抽出する手段とからなる文字切出方式であるた
めに、簡単な構成であるのにも抱わらずに、原稿におけ
る処理がコラム毎に行なうことができ、それにより、コ
ラム毎の文字行の先頭の位置が正確に揃い、本発明によ
れば、既述した従来のものにおける諸問題点が良好に解
消でき、また、本発明ではコラム毎に編集して原稿を任
意のフォーマットのものとして再生することも可能であ
る。
第1図は本発明の文字切出方式の一実施態様のブロック
図であり、また、第2図及び第3図は原稿におけるコラ
ムの配置例を示す図である。 1・・・原稿の一頁分の画像情報と対応する画像データ
が記憶できるページバッファメモリ、2・・・切換スイ
ッチ、3・・・垂直射影メモリ、4・・・原稿における
コラム間の無記録領域の中心位置の判定部、5・・・コ
ラム走査テーブル、6・・・水平射影抽出回路7・・・
比較器、8・・・Hカウンタ、9・・・Vカウンタ、I
O・・・−数回路、11・・・制御回路、12・・・画
像データの入力端子、
図であり、また、第2図及び第3図は原稿におけるコラ
ムの配置例を示す図である。 1・・・原稿の一頁分の画像情報と対応する画像データ
が記憶できるページバッファメモリ、2・・・切換スイ
ッチ、3・・・垂直射影メモリ、4・・・原稿における
コラム間の無記録領域の中心位置の判定部、5・・・コ
ラム走査テーブル、6・・・水平射影抽出回路7・・・
比較器、8・・・Hカウンタ、9・・・Vカウンタ、I
O・・・−数回路、11・・・制御回路、12・・・画
像データの入力端子、
Claims (1)
- 原稿の一貫分の画像情報と対応する画像データが記憶で
きるページバッファメモリと、M稿におけるコラム間の
無記録領域に関するデータを得る手段と、コラム走査テ
ーブルと、ページバッファメモリに記憶されている画像
データから所定のコラムの画像データを抽出する手段と
からなる文字切出方式
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58188784A JPS6081687A (ja) | 1983-10-09 | 1983-10-09 | 文字切出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58188784A JPS6081687A (ja) | 1983-10-09 | 1983-10-09 | 文字切出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6081687A true JPS6081687A (ja) | 1985-05-09 |
Family
ID=16229728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58188784A Pending JPS6081687A (ja) | 1983-10-09 | 1983-10-09 | 文字切出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6081687A (ja) |
-
1983
- 1983-10-09 JP JP58188784A patent/JPS6081687A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6081687A (ja) | 文字切出方式 | |
US4776028A (en) | Apparatus for and method of compressing form data | |
JPS62227260A (ja) | 画像格納装置 | |
JP2618468B2 (ja) | 文書処理装置 | |
JP3431267B2 (ja) | 表処理方法及び装置 | |
JP2876073B2 (ja) | 画像ファイル装置の画像格納方法 | |
JP2666931B2 (ja) | 光学的文字読取装置 | |
JPH0373916B2 (ja) | ||
JPS6331830B2 (ja) | ||
JPS5853272A (ja) | 画像デ−タ圧縮および再生方式 | |
JPH05284335A (ja) | 画像情報縮小方法 | |
JPS62243067A (ja) | 画像フアイル装置 | |
KR950004219B1 (ko) | 조합형 폰트의 저장 영역 개선방법 및 장치 | |
JPH0821037B2 (ja) | 画像ファイル装置における画像登録方法 | |
JPH0528316A (ja) | 光学文字読取装置 | |
JPS58123159A (ja) | 画像情報の登録方法 | |
JPH064711A (ja) | 電子黒板 | |
JPS5958965A (ja) | 画像処理装置 | |
JPH0589219A (ja) | 画像記録装置 | |
JPS62184666A (ja) | イメ−ジデ−タの記録方式 | |
JPH0123031B2 (ja) | ||
JPS5887648A (ja) | 画像処理装置 | |
JPH02163889A (ja) | 光学文字読取装置 | |
JPH05101159A (ja) | フアイリングシステム | |
JPS61214078A (ja) | 画像入力装置 |