JPS60230277A - 文字検出切出し方式 - Google Patents

文字検出切出し方式

Info

Publication number
JPS60230277A
JPS60230277A JP59086357A JP8635784A JPS60230277A JP S60230277 A JPS60230277 A JP S60230277A JP 59086357 A JP59086357 A JP 59086357A JP 8635784 A JP8635784 A JP 8635784A JP S60230277 A JPS60230277 A JP S60230277A
Authority
JP
Japan
Prior art keywords
difference
character
pattern
memory
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59086357A
Other languages
English (en)
Inventor
Katsuhiko Furuya
古屋 勝彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59086357A priority Critical patent/JPS60230277A/ja
Publication of JPS60230277A publication Critical patent/JPS60230277A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、光学的文字読取装置で用いられる文字検出切
出し方式に関する。
[発明の技術的背景とその問題点コ 一般的に、光学的文字読取装置(OCR)では、用紙上
に記録された1行分の文字が光電変換された後、1文字
分毎の文字検出切出し処理が行われる。そして、文字検
出切出しく以下文字検切と称す)処理で得られた1文字
分の文字パターンに対する文字認識処理が行われる。
ところで、近年において自由手書き文字を読取るOCR
が開発されている。このようなOCRにおいても、1文
字毎の文字検切処理を必要とするが、自由手書き文書で
は前後の文字が接続されて記入されていることがある。
このような場合、OCRでは文字検切処理の精度が著し
く低下し、結果的に文字読取処理が不可能となる。
[発明の目的] 本発明は上記の点に鑑みてなされたもので、その目的は
、自由手書き文書において前後の文字が接続されている
場合でも、1文字毎の検切処理を確実に行なうことがで
きる文字検出切出し方式を提供することにある。
[発明の概要] 本発明では、パターンメモリに格納された文字パターン
に対して、副走査方向の射影ヒストグラムが作成される
。この射影ヒストグラムを利用して、差分マクロテーブ
ルを作成する。そして、差分マクロテーブルに基づいて
パターンメモリ内の文字の始端を検出し、この始端に基
づいて1文字毎の文字検切を行なう。
即ち、パターンメモリには、用紙上に記録された複数の
文字からなる文字列を光電変換した後に得られる文字パ
ターンが格納される。ヒストグラム作成手段は、パター
ンメモリ内の文字パターンに対して文字列方向を主走査
方向とした際に、上記文字パターンを主走査及び副走査
して黒ビット数を計数し、副走査方向の射影ヒストグラ
ムを作成する。このヒストグラム作成手段により作成さ
れた射影ヒストグラムに基づいて、差分テーブル手段が
その射影ヒストグラムの隣接するヒストグラム値の差を
計算し、その計算結果である差分値の差分テーブルを作
成する。そして差分マクロテーブル手段は、差分テーブ
ル手段により作成された差分テーブルで正または負の差
分値が連続する領域を検出してその領域の差分値の総和
を計算し、その計算結果である差分マクロテーブルを作
成する。
これにより、検切制御手段は、差分マクロテーブル手段
により作成されたテーブルで正の差分総和値が一定値以
上の部分に基づいて文字の始端を検出し、その始端に基
づいてパターンメモリから1文字分の文字検出切出し動
作を行なうものである。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わるOCRの構成を示すブロック図で
ある。第1図において、パターンメモリ10は1行分の
文字列からなる文字パターンPを格納する。OCRでは
、通常、光電変換回路(図示せず)が設けられており、
用紙上に記録された文字列は光電変挽回路により光電変
換されて2値化信号である文字パターンに変換される。
検切部11は、本発明の主たる構成部であり、パターン
メモリ10内の文字パターンに対して1文字毎の文字検
出切出し処理を行なう。認識部12は、パターンメモリ
10から検切部11により検切された1文字分の文字パ
ターンに対する認識処理を行なう。
このとき、認識部12は辞書メモリ13に予め記憶され
た標準パターンに基づいて、文字認識処理を行なう。ま
た、制御部14は、OCR全体の動作を制御し、認識部
12の認識処理に応じて最終的な読取結果を出力する。
第2図は検切部11の具体的構成を示すブロック図であ
る。第2図において、射影ヒストグラム作成回路(以下
ヒストグラム作成回路と称す)20はパターンメモリ1
0内を走査して、文字パターンに対する副走査方向の射
影ヒストグラムを作成する。
この場合、文字列方向(水平方向)の走査を主走査とし
、その垂直方向の走査を副走査とする。このヒストグラ
ム作成回路20で作成された射影ヒストグラム(以下ヒ
ストグラムと称す)は、射影ヒストグラムメモリ21に
格納される。検切制御部22は、メモリ21内のヒスト
グラムに基づいて隣接するヒストグラム短間の差を計算
し、その計算結果からなる差分テーブルを差分テーブル
メモリ23に記憶する。さらに検切制御部22は、差分
テーブルメモリ23の差分テーブル内で正または負の差
分値が連続する領域を検出してその領域の差分値の総和
を計算し、その計算結果からなる差分マクロテーブルを
差分マクロテーブルメモリ24に記憶する。
検切制御部22は、マクロテーブルメモリ24に記憶さ
れた差分マクロテーブルに基づいて、パターンメモリ1
0内の文字パターンに対する文字検切処理を行なう。
上記のような構成のOCRにおいて、第3図及び第4図
を参照して一実施例に係わる動作を説明する。先ず、第
3図に示すように文字パターン(数字の5と6が連続し
たパターン)がパターンメモリ10に格納されたとする
。検切部11のヒストグラム作成回路20は、パターン
メモリ10内を主走査(第3図の矢印30)及び副走査
(矢印31)シ、文字パターンの黒ピッ1−数を計数し
て第4図(a)に示すような副走査方向のヒストグラム
を作成する。このヒストグラムである計数値は、上記の
各走査に対応するアドレスを有するヒストグラムメモリ
21に記憶される。
検切制御部22は、ヒストグラムメモリ21内のヒスト
グラムを利用して、主走査方向において隣接するヒスト
グラムの計数値間の差を計算する。即ち、副走査方向の
計数値St と次の計数値3 i+1との差をめ、その
差分値を順次差分テーブルメモリ23に格納し、第4図
(b)に示すような差分テーブルを作成する。次に、検
切制御部22は、差分テーブルメモリ23の差分テーブ
ルを読出してその差分テーブルで正または負の差分値が
連続する領域を検出し、この領域内の正または負の差分
値の総和を計算する。この差分総和値を順次マクロテー
ブルメモリ24に格納し、第4図(C)に示すような差
分マクロテーブルを作成する。
検切制御部22は、上記のようにして各テーブルを作成
すると、差分マクロテーブルを参照して正の10!(差
分総和値)が一定値以上の部分42.43を検出する。
そして、検出した部分に対応する差分テーブルの領域を
検出し、この領域で計数値がOの以上の位置40.41
を文字パターンの始端とする。
即ち、差分テーブルでは正の領域が文字パターンの始端
の部分を示し、負の領域が文字パターンの終端の部分を
示す。従って、差分マクロテーブルにより、パターンメ
モリ10内の文字領域の概略的位置を検出することがで
き、文字以外の接続部(第3図の32)とを区別するこ
とができる。
このようにして、検切制御部22は文字パターンの始端
を検出すると、この始端から予め設定された文字幅に応
じた終端までの1文字分の文字パターンをパターンメモ
リ10から切出すことになる。
ここで、差分マクロテーブルにおける上記一定値とは、
文字パターン以外のパターンに対応する差分総和値より
大きい値である。そして、検切部11により1文字毎に
検切された文字パターンは、認識部12に送られる。こ
の認識部12において、文字認識処理がなされた後、制
御部14から最終的な読取結果が出力される。
[発明の効果] 以上詳述したように本発明によれば、自由手書き文書に
おいて前後に接続した文字列の場合でも、各文字の始端
を確実に検出できる。従って、1文字毎の文字検切処理
を確実に行なうことができ、結果的に自由手書き文字用
のOCRの性能を著しく向上することができるものであ
る。
【図面の簡単な説明】
第1図は本発明の一実施例に係わるOCRの構成を示す
ブロック図、第2図は第1図の検切部の具体的構成を示
すブロック図、第3図はパターンメモリに格納される文
字パターンの一例を示す図、第4図(a)乃至(C)は
それぞれ検切部11で作成される射影ヒストグラム、差
分テーブル、差分マクロテーブルの一例を示す図である
。 10・・・パターンメモリ、11・・・検切部、20・
・・射影ヒストグラム作成回路、21・・・射影ヒスト
グラムメモリ、22・・・検切制御部、23・・・差分
テーブルメモリ、24・・・差分マクロテーブルメモリ
。 出願人代理人 弁理士 鈴江武彦 第2図 第3図 第4図

Claims (1)

    【特許請求の範囲】
  1. 用紙上に記録された複数の文字からなる文字列を光電変
    換した後に得られる文字パターンを格納するパターンメ
    モリと、このパターンメモリ内の文字パターンに対して
    文字列方向を主走査方向とした際に上記文字パターンを
    主走査及び副走査して黒ビット数を計数し副走査方向の
    射影ヒストグラムを作成するヒストグラム作成手段と、
    このヒストグラム作成手段により作成された射影ヒスト
    グラムに基づいてその射影ヒストグラムの隣接するヒス
    トグラム値の差を計算しその計算結果である差分値の差
    分テーブルを作成する差分テーブル手段と、この差分テ
    ーブル手段により作成された差分テーブルで正または負
    の差分値が連続する領域を検出してその領域の差分値の
    総和を計算しその計算結果である差分マクロテーブルを
    作成する差分マクロテーブル手段と、この差分マクロテ
    ーブル手段により作成された差分マクロテーブルで一定
    filI以上の正の差分総和値及びこの差分総和値に対
    応する上記差分テーブルの差分値に基づいて文字の始端
    を検出しその始端に基づいて上記パターンメモリから1
    文字分の文字パターンの検出切出し動作を行なう検切制
    御手段とを具備してなることを特徴とする文字検出切出
    し方式。
JP59086357A 1984-04-28 1984-04-28 文字検出切出し方式 Pending JPS60230277A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59086357A JPS60230277A (ja) 1984-04-28 1984-04-28 文字検出切出し方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59086357A JPS60230277A (ja) 1984-04-28 1984-04-28 文字検出切出し方式

Publications (1)

Publication Number Publication Date
JPS60230277A true JPS60230277A (ja) 1985-11-15

Family

ID=13884639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59086357A Pending JPS60230277A (ja) 1984-04-28 1984-04-28 文字検出切出し方式

Country Status (1)

Country Link
JP (1) JPS60230277A (ja)

Similar Documents

Publication Publication Date Title
JPS60230277A (ja) 文字検出切出し方式
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH0548510B2 (ja)
JPS61296481A (ja) 文書読取装置
JPS6254380A (ja) 文字認識装置
JPH0564396B2 (ja)
JPH0119193B2 (ja)
JP2859307B2 (ja) 文字切出し装置
JPS61289476A (ja) 文字読取装置のフオ−マツト生成方式
JPS63115286A (ja) 文字行切出し方法
JPH10171924A (ja) 文字認識装置
JPH036552B2 (ja)
JPS60122474A (ja) 正規化方法
JPS60181880A (ja) 光学的文字入力装置
JPS61109181A (ja) 文字検出方式
JP2578768B2 (ja) 画像処理方法
JPS63101983A (ja) 文字列抽出方式
JP2812705B2 (ja) 文字切出し装置
JPH08202824A (ja) 文書画像認識装置
JPH0581477A (ja) 文字切出し方法
JPH027183A (ja) 文字切出装置
JPH0578068B2 (ja)
JPH05135204A (ja) 文字認識装置
JPS61166685A (ja) 文字切出し方法
JPH01234985A (ja) 文字読取装置の文字切出し装置