JPS6252687A - 文字読取装置の文字検出切出し方式 - Google Patents

文字読取装置の文字検出切出し方式

Info

Publication number
JPS6252687A
JPS6252687A JP60191548A JP19154885A JPS6252687A JP S6252687 A JPS6252687 A JP S6252687A JP 60191548 A JP60191548 A JP 60191548A JP 19154885 A JP19154885 A JP 19154885A JP S6252687 A JPS6252687 A JP S6252687A
Authority
JP
Japan
Prior art keywords
character
address
memory
data
white data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60191548A
Other languages
English (en)
Inventor
Toyoshi Sato
佐藤 豊志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60191548A priority Critical patent/JPS6252687A/ja
Publication of JPS6252687A publication Critical patent/JPS6252687A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野1 本発明は、光学的文字読取装置等において文字Hil!
処理に必要な1文字分の文字パターンデータの検出切出
し処理を行なう際の文字読取装置の文字検出切出し方式
に関する。
[発明の技術的背景とその問題点] 近年、活字文字だけでなく、普及が増大しているドツト
プリンタにより印字されたドツト文字に対しても、光学
的文字読取袋!(OCR)による読取処理の要求が多く
なっている。
ところで、OCRでは、通常では用紙上に記録された文
字を光電変換し、この光電変換により得られる1行分の
文字パターンデータがラインバッファメモリに格納され
る。このラインバッファメモリから、1文字毎の文字パ
ターンデータが検出切出しく検切)された後に、文字認
識部へ転送されて認識処理されることになる。このため
、認識処理を高精度で行なうためには、検切処理が極め
て重要となる。
具体的には、第5図に示すように、4文字分の文字パタ
ーンデータがラインバッファメモリに格納された際、O
CRのコントロール回路は例えば検切アドレスKA2に
基づいて、を番目の文字パターンデータの検切処理を行
なう。コントロール回路は、予め設定されるフォーマッ
トコントロールデータ(以下FCデータと称す)から各
文字毎の基準検切アドレス(この例ではアドレスに2)
を求める。さらに、スキャン幅をmとした場合、基準検
切アドレスに2を中心としたm/2アドレスの位置から
水平射影データSを走査する。水平射影データSは、ラ
インバッファメモリに格納される1行分の文字パターン
データに対応する水平射影データで・あり、射影メモリ
に格納される。コントロール回路は、スキャン幅mの走
査で、最初に検出した白ビットからその白ビットがnビ
ット(通常では2,3ビツト)連続した位置のアドレス
を検切アドレスKA2として決定する。このとき、白ビ
ットが検出されない場合には、検切りジェツトとなる。
例えば、第5図に示すt+1番目及びt+2番目の各文
字が、検切りジェツトに該当する文字である。
次に、を番目の文字に隣接す8t−1番目の文字の検切
アドレスKA1から走査して、ラインバッファメモリの
白ビットから黒ビットに変化する際のアドレスBtを求
める。このアドレスBtから検切アドレスKA2に対応
するアドレスWtまでの文字パターンデータを、1文字
分の文字としてラインバッファメモリから切出すことに
なる。
これにより、水平方向しt分の文字パターンデータが検
切されて、文字認識部へ転送されることになる。
このような検切処理は、第6図に示すような活字文字の
読取処理、及び第7図に示すようなドツト文字の読取処
理の場合でも同様に行われる。しかしながら、読取対象
がドツト文字の場合、第8図に示すように、例えばt番
目の文字にドツト欠は部分DFが発生することがある。
このような場合、前記のような従来の検切処理では、第
9図に示すように、本来の文字とは異なるパターンが1
文字分として検切されるような事態が発生する問題があ
る。また、読取対象が活字文字の場合でも、文字の一部
が掠れているような際、前記のような問題が発生する。
[発明の目的] 本発明の目的は、一部がドツト欠は部のあるドツト文字
又は一部が掠れた活字文字等が読取対象の文字の場合で
も、1文字分の検出切出し処理を確実に行なうことがで
きる文字読取装置の文字検出切出し方式を提供すること
にある。
[発明の概要] 本発明は、読取対象である1行分の文字列の文字ピッチ
に応じて予め決定されるスキャン幅及びギャップスライ
ス値の各データを記憶する検切アドレス検出用メモリを
備えている。この検切アドレス検出用メモリから読出し
たスキャン幅データに応じて、白データカウンタ手段は
予め決定される基準アドレスから射影メモリ内を走査し
、水平射影データから最初の白データを検出してからカ
ウントして得られる白データカウント(直を出力する。
検切アドレス決定手段は、白データカウンタ手段により
得られる白データカウント値と検切アドレス検出用メモ
リから読出したギャップスライス値とを比較して、この
比較結果に基づいてラインバッファメモリから1文字分
の文字パターンデータを切出す際の検切アドレスを決定
するように構成されている。
このような構成により、読取対象の文字ピッチに応じた
検切アドレスを決定できるため、常に1文字分の検切処
理を確実に実行することが可能となる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わるOCRの部分的構成を示すブロッ
ク図である。第1図に示すように、OCRは、ラインバ
ッファメモリ(以下単にラインバッフ戸と称す)101
射影メモリ11、コントロール回路12、認識部13、
FCデータ用メモリ14及び検切アドレス用メモリ15
を備えている。 ラインバッファ10は、光電変換され
た後に得られる文字パターンデータ(以下単に文字パタ
ーンと称す)Pを1行分格納するメモリである。射影メ
モリ11は、ラインバッファ10に格納された1行分の
文字パターンPに対する水平射影データSを格納するメ
モリである。コントロール回路12は、ホストコンピュ
ータであるマイクロプロセッサ(CPLI)の制御に応
じて、ラインバッファ10から1文字分の文字パターン
Pの検切処理を行なう回路である。
認識部13は、ラインバッファ10から出力される1文
字分の文字パターンPに対する文字g!識処理を行なう
回路である。FCデータ用メモリ14は、前記CPLJ
から予め読取対象の文字に応じたFCデータを格納する
メモリである。FCデータには、検切処理に必要な基準
検切アドレス(計算アドレス)が含まれている。検切ア
ドレス用メモリ15は、第3図に示すような予め読取対
象である文字の文字ピッチに応じて決定されるスキャン
幅m及びギャップスライスαの各データからなるテーブ
ルを記憶している。
このような構成のOCRにおいて、同実施例の検切処理
の動作を第2図のフローチャートを参照して説明する。
先ず、用紙にドツト印字された文字が光電変換された後
に、第4阿に示すような1行分の文字パターンPがライ
ンバッファ10に格納される。さらに、ラインバッファ
10内の文字パターンPに対する水平射影データSが射
影メモリ11に格納される。コントロール回路12は、
CPUがらの制御信号Aにより検切処理を開始する。コ
ントロール回路12は、FCデータ用メモリ14がら基
準検切アドレスである計算アドレスAtを読出し、また
検切アドレス用メモリ15からスキャン幅mのデータを
読出す。ここで、コントロール回路12は、読取対象で
ある文字の文字番号NをCPUから与えられて、この文
字番号Nに対応する文字ピッチに応じたスキャン幅mを
検切アドレス用メモリ15から読出すことになる。
次に、コントロール回路12は、第2図のステップS1
に示すように、スキャン幅mにおいて計算アドレスAt
を中心とした走査開始アドレス(At−m/2)を算出
して、レジスタR1に記憶する。さらに、コントロール
回路12は、白ビットをカウントするカウンタWTを備
えており、このカウンタWTをクリアする。また、コン
トロール回路12は、スキャン幅mと同様に、読取対象
文字の文字ピッチに応じたギャップスライスαのデータ
を検切アドレス用メモリ15から読出し、「α−1」の
値をレジスタ■にセットする。さらに、ステップ82.
S3に示すように、レジスタR1(即ち、レジスタR1
〜R(α−1))の記憶内容をクリアする。ここで、レ
ジスタR1は、カウンタWTの値によりレジスタ番号が
決定されて、そのときの射影メモリ11のアドレスがそ
の番号のレジスタに記憶される。
コントロール回路12は、ステップS4に示すように、
レジスタR1の値を射影メモリ11の走査開始アドレス
とする。そして、走査開始アドレスからアドレス(At
+m/2)までのスキャン幅mを走査し、白ビットの検
出を行なう(ステップ85〜ステツプS8)、白ビット
が検出されると、ステップ815の処理に移行する。即
ち、コントロール回路12は、カウンタWTの値をイン
クリメントする。コントロール回路12は、ステップs
16に示すように、カウンタWTの値とギャップスライ
スαの値とを比較し、カウンタWTの値がα以上であれ
ばステップ817へ移行する。ステップ817では、レ
ジスタR1の値を検切アドレスKAとして設定する。
ここで、前記ステップ$5〜s8の処理において、走査
開始アドレスからアドレス(,6,t+m/2)までの
スキャン幅mを走査した際、白ビットが検出されずに、
文字間にギャップが無いとすれば、ステップS11のリ
ジェクト処理となる。このとき、0でないレジスタR1
があれば、ステップ814に示すように、そのレジスタ
R1の値を検切アドレスKAとして設定する。また、前
記ステップ816において、カウンタWTの1直がαよ
り小さい場合、カウンタWTの値に対応するレジスタR
Iを探し、そのレジスタRIにレジスタR1の値をセッ
トする(ステップ819〜522)。
そのレジスタRIが無い場合には、ステップS23に示
すように、エラー処理となる。
このようにして、計算アドレスAtから求めた走査開始
アドレスから水平射影データSを走査し、白ビットをカ
ウントする。この白ビツトカウント値が文字ピッチに応
じて設定されるギャップスライス値α以上であれば、そ
の白ビツトカウント値に対応するアドレスを検切アドレ
スKAとして設定する。この場合、ギャップスライス値
αは、例えば第3図に示すようなドツト文字のドツト欠
は部に対応する白ビツト数より十分に大きい値に設定さ
れている。また、白ピットカウント値がギャップスライ
ス値α以上となるアドレスを検出できない場合には、カ
ウンタWTの値と「α−1」を比較し、それ以上であれ
ばそのアドレスを検切アドレスKAとして設定する。さ
らに、そのアドレスを検出できなければ、同様にカウン
タWTと「α−2」、「α−3」のように段階的に比較
して、検切アドレスKAとして設定する。
検切アドレスKAを決定すると、前記と同様にt番目の
文字に隣接するt−1番目の文字の検切アドレスから走
査して、ラインバッファメモリの白ビットから黒ピット
に変化する際のアドレスBtを求める。このアドレスS
t−及び検切アドレスKAで指定される1文字分の文字
パターンPが、ラインバッファ10から検切されて認識
部13へ転送されることになる。これにより、第4図に
示すように、ドツト文字の中にドツト欠は部DFが存在
する場合でも、前記のように設定された検切アドレスK
A、Stにより、本来の1文字分に相当する文字パター
ンがラインバッファ10から検切されることになる。こ
の場合、ドツト欠は部DFが存在するドツト文字だけで
なく、読取対象が掠れの存在する活字文字のような文字
に対しても、同様の効果を得ることができる。
[発明の効果1 以上詳述したように本発明によれば、一部がドツト欠は
部、のあるドツト文字又は一部が掠れた活字文字等が読
取対象の文字の場合でも、本来の1文字の検切処理に必
要な検切アドレスを設定することが可能となる。したが
って、1文字分の検出切出し処理を確実に行なうことが
できることになり、結果的に1文字毎の文字認識処理を
高精度に行なうことができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わるOCRの部分的構成
を示すブロック図、第2図は同実施例の動作を説明する
ためのフローチャート、第3図は同実施例の検切アドレ
ス用メモリの記憶内容の一例を示す図、第4図は同実施
例の動作を説明するを説明するための図である。 10・・・ラインバッファ、11・・・射影メモリ、1
2・・・コントロール回路、14・・・FCデータ用メ
モリ、15・・・検切アドレス用メモリ。 第1 図 1        1◆1 第4図 第5図 1          1會1 に2 第6図 に2 第8図 tt”+ 第9図

Claims (1)

    【特許請求の範囲】
  1. 1行分の文字列に対応する文字パターンデータを格納す
    るラインバッファメモリと、このラインバッファメモリ
    内の前記1行分の文字パターンデータに対応する水平射
    影データを格納する射影メモリと、前記1行分の文字列
    の文字ピッチに応じて予め決定されるスキャン幅及びギ
    ャップスライス値の各データを記憶する検切アドレス検
    出用メモリと、この検切アドレス検出用メモリから読出
    した前記スキャン幅データに応じて予め決定される基準
    アドレスから前記射影メモリ内を走査し前記水平射影デ
    ータから最初の白データを検出してからカウントして得
    られる白データカウント値を出力する白データカウンタ
    手段と、この白データカウンタ手段により得られる前記
    白データカウント値と前記検切アドレス検出用メモリか
    ら読出した前記ギャップスライス値とを比較してこの比
    較結果に基づいて前記ラインバッファメモリから1文字
    分の文字パターンデータを切出す際の検切アドレスを決
    定する検切アドレス決定手段とを具備したことを特徴と
    する文字読取装置の文字検出切出し方式。
JP60191548A 1985-08-30 1985-08-30 文字読取装置の文字検出切出し方式 Pending JPS6252687A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60191548A JPS6252687A (ja) 1985-08-30 1985-08-30 文字読取装置の文字検出切出し方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60191548A JPS6252687A (ja) 1985-08-30 1985-08-30 文字読取装置の文字検出切出し方式

Publications (1)

Publication Number Publication Date
JPS6252687A true JPS6252687A (ja) 1987-03-07

Family

ID=16276505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60191548A Pending JPS6252687A (ja) 1985-08-30 1985-08-30 文字読取装置の文字検出切出し方式

Country Status (1)

Country Link
JP (1) JPS6252687A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5246729A (en) * 1975-10-09 1977-04-13 Fujitsu Ltd Type character discrimination system
JPS5735503A (en) * 1980-08-08 1982-02-26 Nitrokemia Ipartelepek Herbicidal composition
JPS57178574A (en) * 1981-04-25 1982-11-02 Toshiba Corp Character pattern detecting and segmenting device
JPS60142784A (ja) * 1983-12-29 1985-07-27 Fujitsu Ltd 文字分離方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5246729A (en) * 1975-10-09 1977-04-13 Fujitsu Ltd Type character discrimination system
JPS5735503A (en) * 1980-08-08 1982-02-26 Nitrokemia Ipartelepek Herbicidal composition
JPS57178574A (en) * 1981-04-25 1982-11-02 Toshiba Corp Character pattern detecting and segmenting device
JPS60142784A (ja) * 1983-12-29 1985-07-27 Fujitsu Ltd 文字分離方式

Similar Documents

Publication Publication Date Title
JPS6077279A (ja) 文字イメ−ジ切出し方法
JPH02293989A (ja) 文字認識装置
JPS6252687A (ja) 文字読取装置の文字検出切出し方式
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH10207978A (ja) 文字等パターン照合方法及び装置
JP3932201B2 (ja) 帳票種識別装置および記録媒体
JPH087031A (ja) 文字枠検出装置
JPH0373916B2 (ja)
JPH09179982A (ja) 特定パターン検出方法
JP2002366900A (ja) 光学式文字読取装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2542628B2 (ja) マ−ク読取装置
JPS59206987A (ja) 文字認識装置
JPS59180783A (ja) 光学的文字読取装置
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体
JPS58105385A (ja) 文字読取り認識装置
JPH0557632B2 (ja)
JPH04267494A (ja) 文字切り出し方法および文字認識装置
JPH03122786A (ja) 光学的文字読取装置
JPH0771170B2 (ja) フアクシミリを用いた文字認識方式
JPH01234985A (ja) 文字読取装置の文字切出し装置
JPH05314311A (ja) 光学式文字読取装置
JPH03296884A (ja) 文字画像抽出装置
JPS5920082A (ja) 文字認識方式
JPS61196382A (ja) 文字切出し方式