JP3162575B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3162575B2
JP3162575B2 JP15277994A JP15277994A JP3162575B2 JP 3162575 B2 JP3162575 B2 JP 3162575B2 JP 15277994 A JP15277994 A JP 15277994A JP 15277994 A JP15277994 A JP 15277994A JP 3162575 B2 JP3162575 B2 JP 3162575B2
Authority
JP
Japan
Prior art keywords
information
unit
mark
reference mark
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP15277994A
Other languages
English (en)
Other versions
JPH07334613A (ja
Inventor
賢 杉岡
晃治 伊東
浩一 樋口
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP15277994A priority Critical patent/JP3162575B2/ja
Publication of JPH07334613A publication Critical patent/JPH07334613A/ja
Application granted granted Critical
Publication of JP3162575B2 publication Critical patent/JP3162575B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、用紙に記載された文字
を所定のフォーマットに従って切り出して認識する文字
認識装置に関するものである。
【0002】
【従来の技術】一般に、ファクシミリを入力部に備える
文字認識装置では、入力される用紙に画像の伸縮や傾き
を検出したり、認識対象文字の位置や領域を検出するた
めの基準マークが記入されている。また、このような用
紙は、フォーマットの異なる数種類のものが用意されて
おり、各用紙には、その用紙のフォーマットを識別する
ためのID番号等の情報が記載されている。従って、文
字認識装置は、用紙に記載された文字を認識する際に、
このID番号を認識しなければならず、そのためにID
番号が用紙上のどの位置に記載されているかを検出する
必要がある。従来、この種のID番号は、前述した基準
マークから一定の距離の位置に記載されており、文字認
識装置は基準マークを検出した後、そこから一定距離に
あるID番号を検出していた(例えば、特開昭59−1
17366号公報参照)。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術には、次のような課題があった。即ち、フ
ォーマットの異なる複数種類の用紙のすべてについて、
基準マークとID番号との距離を一定に保たなければな
らなかった。従って、ID番号の部分において用紙のフ
ォーマットに制限が加えられることになり、ID番号が
邪魔になることがあった。例えば、用紙のサイズを小さ
くしたり、認識対象の文字数を多くしたりすると、必要
な認識対象文字を1枚の用紙に記載できなくなる場合が
あった。
【0004】
【課題を解決するための手段】本発明の文字認識装置
は、上述した課題を解決するため、以下の点を特徴とす
るものである。 (1) 用紙に表わされた画像情報を光電変換し、イメージデ
ータを出力する読取部を備える。 用紙に表わされた画像情報に含まれる文字の配置状態
を示すフォーマット情報を複数種類格納し、これらに対
応して各種類のフォーマット情報を識別する識別情報を
格納したフォーマット情報格納部を備える。
【0005】用紙の読み取り範囲を定める基準マーク
を読み取り、その特徴を抽出するマーク情報特徴抽出部
を備える。 当該マーク情報特徴抽出部により抽出された基準マー
クの特徴により識別情報の用紙上の位置を検出し、当該
位置に記入された識別情報を判定する識別情報判定部を
備える。 当該識別情報判定部により判定された識別情報により
フォーマット情報格納部から用紙のフォーマット情報を
取り出し、当該フォーマット情報に従ってイメージデー
タに含まれる文字を認識する認識部を備える。
【0006】(2) (1)において、マーク情報特徴抽出部により抽出され
る基準マークの特徴は、当該基準マークの形状、大き
さ、個数のうち、いずれか1つ又は2つ以上の組合せに
より構成される幾何学的特徴である。 (3)(1)に おいて、マーク情報特徴抽出部により抽出され
る基準マークの特徴は、当該基準マークの1色又は2色
以上の色彩である。
【0007】
【作用】
(1)読取部により読み取られた用紙の画像のイメージ
データは、画像メモリ部に格納される。認識部は、基準
マークの位置を基準位置としてイメージデータの切り出
し位置を定め、文字の切り出しを行なう。この場合、文
字領域の位置や大きさ、文字の大きさ、行数、1行内の
文字数、文字の間隔、行の間隔等のフォーマットに関す
る情報は、フォーマット情報格納部に格納されている。
文字の切り出しをいずれのフォーマットに従って行なう
かは、用紙に記載された識別情報により決定される。一
方、用紙に記載された基準マークの形状、大きさ等の幾
何学的特徴や色彩的特徴は、マーク情報特徴抽出部によ
り画像メモリ部13内のイメージデータから抽出され
る。このような基準マークの特徴に対応して識別情報の
記載位置が定められる。例えば、基準マークの形状が四
角ならば、識別情報の位置を用紙の上側にし、円なら
ば、用紙の右側にする等である。この結果、フォーマッ
トに応じて文字領域の範囲が変わる場合に、識別情報を
空いている任意の位置に設定することができる。
【0008】(2) (1)において、基準マークの特徴を、形状、大きさ、
数又はこれらの組合せから成る幾何学的特徴のみとする
ことにより、読取部や画像メモリ部等が白黒画像の読取
を行なうものである場合に、これに適した文字認識を行
なうことができる。 (3)(1)に おいて、基準マークの特徴に、色彩的特徴を含
めることにより、読取部や画像メモリ部等がカラー画像
の読取を行なうものである場合に、その特性を利用した
迅速且つ確実な識別情報の認識を行なうことができる。
【0009】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。図1は、本発明の文字認識装置の一実施例
のブロック図である。図示の装置は、読取部1、フォー
マット情報格納部2、マーク情報特徴抽出部3、識別情
報判定部4、認識部5から成る。読取部1は、光学式読
取入力部11と、光電変換部12とから成る。光学式読
取入力部11は、照明用のランプとレンズ等から成り、
用紙に記載されている文字及び基準マークを光学的に読
み取って光信号に変換する。光電変換部12は、CCD
とA/D変換器等から成り、光信号を電気信号に変換
し、ディジタル化してイメージデータを出力する。この
イメージデータは、画像メモリ部13に格納される。
【0010】フォーマット情報格納部2は、用紙のフォ
ーマットに関する情報を格納している。このような情報
には、文字の記載される領域の位置や範囲、文字の行数
や文字数、文字の大きさ等が含まれる。マーク情報特徴
抽出部3は、基準マークの形状、大きさ、色、個数等の
特徴を抽出する。このような基準マークは、用紙の所定
の位置に記載されている。識別情報判定部4は、基準マ
ークの特徴に応じてフォーマットを決定する。例えば、
基準マークの形状が四角ならば、横書きにし、円なら
ば、縦書きにする等である。認識部5は、決定されたフ
ォーマットに従って行を切り出し、各行から文字を切り
出し、切り出した各文字を予め用意された辞書データと
比較することにより認識する。制御部6は、プロセッサ
等から成り、各部の動作を制御する。
【0011】次に、上述した装置の動作を説明する。ま
ず、用紙14上の文字及びマーク情報は、光学式読取入
力部11で読み取られて、光信号に変換され、この光信
号が光電変換部12で2値の量子化された電気信号に変
換される。画像メモリ部13は、この電気信号をイメー
ジデータとして格納する。制御部6には、図2に示すよ
うなフローチャートに従ったプログラムが格納されてお
り、制御部6はこれを実行する。以下、このフローチャ
ートに従って動作を説明する。まず、ステップS1で、
制御部6は、フォーマット情報格納部2に蓄積されてい
る基準マーク領域を検出する。
【0012】次に、基準マーク領域と、画像メモリ部に
格納されている画像情報をマーク情報特徴抽出部に送信
する。マーク情報特徴抽出部3では、基準マーク領域内
にある黒画像の水平方向及び垂直方向のヒストグラムを
作成し、そのヒストグラムの形状から当該基準マークの
形状の特徴を導き出す(ステップS2)。ここで、図3
を用いて、ヒストグラムから基準マークの形状を判別す
る例を2種類示す。同図において、(a)は円、(b)
は四角である。垂直方向のヒストグラムの幅をd1、水
平方向のヒストグラムの幅をd2、基準マークの総ドッ
ト数をAとする。各形状において、(1)式により形状
特徴量Rを求める。 A/(d1×d2)=R (1)
【0013】次に、形状により予め定めた形状特徴閾値
RL、RHと形状特徴値Rとを比較し、そのときの形状
特徴閾値を持つ形状を基準マークの形状と判断する。図
3の実施例の場合は、(a)の円では、RH=85、R
L=70の形状特徴閾値を持ち、(b)の四角では、R
H=100、RL=90の形状特徴閾値を持つ。即ち、
(a)、(b)では、d1、d2が等しいため、d1×
d2が等しくなるが、Aが異なり、(b)でR=100
とすると(a)でRは約78となる。従って、RH、R
Lが上述のようになる。ステップS3では、マーク情報
特徴抽出部3で求めた基準マークの形状がフォーマット
情報格納部2に登録されているかを判断し、登録されて
いなければ動作を終了し、エラー信号を出力部に出力す
る。
【0014】基準マークの形状が登録されていれば、ス
テップS4でフォーマット情報格納部2から、当該基準
マーク形状に相当するID番号の位置を求める。このI
D番号の位置は、図4に示すように基準マーク42から
の水平方向及び垂直方向の距離x1、y1により定める
ことが望ましい。これは帳票端を基準にした場合に比べ
て、画像の伸縮や入力時の帳票の位置ずれに影響されな
いためである。尚、他の基準マーク41、43を原点と
するようにしてもよい。次に、ステップS5では、ID
番号の位置情報を認識部5に送信し、ID番号の文字切
出しと認識を行ない、ステップS6で認識結果をフォー
マット情報格納部2に送信し、当該入力用紙のフォーマ
ットを求める。
【0015】ステップS7では、ステップS6で求めた
フォーマットに従い、認識部5において、当該入力用紙
に記載された認識対象文字の切出しと認識を行ない、認
識結果を図示しないディスプレイ等の出力部又は外部へ
出力する。このようにして、図4において、基準マーク
42からの距離x1、y1を基準マークの形状等に応じ
て任意の値とすることにより、ID番号の位置をフォー
マットに応じた適切な位置とすることができる。例え
ば、図1に示す用紙14のフォーマット以外に図5に示
すような用紙50、60のフォーマットを作ることがで
き、それぞれ基準マーク51、61の特徴に応じて識別
情報52、62を文字領域53、63、64と重ならな
い場所に記載することができる。
【0016】尚、本発明は上述した実施例に限定される
ものではなく、種々の変形が可能であることはもちろん
である。例えば、基準マークの形状は、円や四角に限ら
ず、その他の幾何学的形状でもよい。また、形状等の判
別方法は、ヒストグラムを用いる方法に限らず、辞書デ
ータとの比較等の他のいかなる方法でもよい。また、基
準マークは形状を特徴とするものに限らず、大きさやマ
ークの数等の他の幾何学的特徴でもよい。更に、読取部
1及び画像メモリ部13をカラー画像の読み取りを可能
とする構成にしてもよく、その場合、基準マークを1色
又は2色以上の色彩を特徴とするものとしてもよい。こ
れにより、赤であれば赤の画像メモリに基準データが格
納され、青であれば青の画像メモリに基準データが格納
される等により、カラー画像の読取結果を利用して特徴
の識別を容易とすることができる。
【0017】
【発明の効果】以上説明したように、本発明の文字認識
装置によれば、基準マークの形状等の特徴からID番号
等の識別情報の位置を判定できるようにしたので、フォ
ーマットの異なる複数種類の用紙を用いた場合でも、そ
のフォーマットの種類ごとに自由に識別情報の位置を決
定できる。従って、フォーマットに応じて識別情報の位
置を変え、多様なフォーマットを提供することができ
る。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一実施例のブロック図
である。
【図2】図1の制御部の処理手順を説明するフローチャ
ートである。
【図3】基準データの特徴の判定例の説明図である。
【図4】基準マークと識別情報との関係の説明図であ
る。
【図5】用紙のフォーマットの設定例の説明図である。
【符号の説明】
1 読取部 2 フォーマット情報格納部 3 マーク情報特徴抽出部 4 識別情報判定部 5 認識部 6 制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山下 義征 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平1−199285(JP,A) 特開 平5−324904(JP,A) 特開 昭63−237184(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 用紙に表わされた画像情報を光電変換
    し、イメージデータを出力する読取部と、 前記用紙に表わされた画像情報に含まれる文字の配置状
    態を示すフォーマット情報を複数種類格納し、これらに
    対応して各種類のフォーマット情報を識別する識別情報
    を格納したフォーマット情報格納部と、 前記用紙の読み取り範囲を定める基準マークを読み取
    り、その特徴を抽出するマーク情報特徴抽出部と、 当該マーク情報特徴抽出部により抽出された基準マーク
    の特徴により前記識別情報の用紙上の位置を検出し、当
    該位置に記入された識別情報を判定する識別情報判定部
    と、 当該識別情報判定部により判定された識別情報により前
    記フォーマット情報格納部から前記用紙のフォーマット
    情報を取り出し、当該フォーマット情報に従って前記イ
    メージデータに含まれる文字を認識する認識部とから成
    ることを特徴とする文字認識装置。
  2. 【請求項2】 マーク情報特徴抽出部により抽出される
    基準マークの特徴は、当該基準マークの形状、大きさ、
    個数のうち、いずれか1つ又は2つ以上の組合せにより
    構成される幾何学的特徴であることを特徴とする請求項
    1記載の文字認識装置。
  3. 【請求項3】 マーク情報特徴抽出部により抽出される
    基準マークの特徴は、当該基準マークの1色又は2色以
    上の色彩であることを特徴とする請求項1記載の文字認
    識装置。
JP15277994A 1994-06-10 1994-06-10 文字認識装置 Expired - Fee Related JP3162575B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15277994A JP3162575B2 (ja) 1994-06-10 1994-06-10 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15277994A JP3162575B2 (ja) 1994-06-10 1994-06-10 文字認識装置

Publications (2)

Publication Number Publication Date
JPH07334613A JPH07334613A (ja) 1995-12-22
JP3162575B2 true JP3162575B2 (ja) 2001-05-08

Family

ID=15547969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15277994A Expired - Fee Related JP3162575B2 (ja) 1994-06-10 1994-06-10 文字認識装置

Country Status (1)

Country Link
JP (1) JP3162575B2 (ja)

Also Published As

Publication number Publication date
JPH07334613A (ja) 1995-12-22

Similar Documents

Publication Publication Date Title
US6148119A (en) Character recognition in input images divided into areas
JPS63158678A (ja) 単語間スペ−ス検出方法
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JP3162575B2 (ja) 文字認識装置
JPH0373914B2 (ja)
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPS61193277A (ja) 文書読取装置
JPH0728935A (ja) 文書画像処理装置
JP2877380B2 (ja) 光学的文字読取装置
JP3027232B2 (ja) 文字認識装置
JP2722550B2 (ja) 光学文字読取装置
JPS6160184A (ja) 光学的文字読取装置
JPH11161739A (ja) 文字認識装置
JPH08212296A (ja) 光学式文字読取装置
JP2823350B2 (ja) マルチメディア入力装置
JP2925270B2 (ja) 文字読取装置
JP2570571B2 (ja) 光学文字読取装置
JPH08202824A (ja) 文書画像認識装置
JPH0576674B2 (ja)
JPS6224378A (ja) 文字領域決定方式
JPH04239989A (ja) 電子辞書
JPS63184181A (ja) 光学文字認識装置
JPH01234985A (ja) 文字読取装置の文字切出し装置
JPH05298484A (ja) 光学的文字読取装置
JPH08227440A (ja) 文書画像処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees