JPH11250179A - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JPH11250179A
JPH11250179A JP10046652A JP4665298A JPH11250179A JP H11250179 A JPH11250179 A JP H11250179A JP 10046652 A JP10046652 A JP 10046652A JP 4665298 A JP4665298 A JP 4665298A JP H11250179 A JPH11250179 A JP H11250179A
Authority
JP
Japan
Prior art keywords
image data
inclination
mark
character recognition
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10046652A
Other languages
English (en)
Inventor
Katsuhisa Hashino
勝久 橋野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Information Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Information Systems Co Ltd filed Critical Matsushita Information Systems Co Ltd
Priority to JP10046652A priority Critical patent/JPH11250179A/ja
Publication of JPH11250179A publication Critical patent/JPH11250179A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Scanning Arrangements (AREA)

Abstract

(57)【要約】 【課題】 文字認識処理の速度と文字認識率を向上させ
た文字認識装置を提供する。 【解決手段】 本発明の文字認識装置は、元イメージデ
ータファイル11がマーク付き原稿より読み込まれた元
イメージデータを記憶し、傾き検出部2はマーク情報記
憶部13に記憶されたマーク領域に基づいて元イメージ
データからマークを検出してマークのイメージデータに
対する傾きを計算し、傾き補正部3は計算された傾きに
基づいて元イメージデータの傾きを補正した補正イメー
ジデータを作成して、文字認識部4が補正イメージデー
タ中の文字について文字認識を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、原稿中の印刷文字
あるいは手書き文字を認識して文字コードに変換する文
字認識装置および文字認識方法に関する。
【0002】
【従来の技術】近年、OCR(optical character reade
r/recognition)と呼ばれる文字認識装置の需要が高まっ
ている。文字認識装置は、伝票や契約申込書などの原稿
に記入された手書き文字、新聞や書類などの印刷文字を
読み取って、コンピュータに入力する装置である。この
装置は大量のデータを処理することができるので、デー
タ入力の手間を省くのに効果を発揮している。
【0003】図11は、文字認識装置を含む文字認識シ
ステムの一構成例を示す図である。同図において、文字
認識システムは、原稿に記録された手書き又は印刷文字
をコンピュータで扱える文字に変換して結果をホストコ
ンピュータ等に出力するシステムで、スキャナ部10
1、文字認識装置102、制御部103、記憶部10
4、CRT105、キーボード106より構成される。
【0004】スキャナ部101は、図12に示されるよ
うな原稿のイメージを読み取って電気信号で表わされる
イメージデータに変換し、制御部103を介して記憶部
104に記録する。文字認識装置102は、記憶部10
4のイメージデータからノイズを除去して1文字分の文
字パターンを切り出す前処理、切り出された文字から特
徴を抽出して特徴文字パターンに変換する特徴抽出処
理、特徴文字パターンから文字を識別し、辞書などを用
いて各文字パターンに対応する文字コードを決定する識
別処理を行って、出力結果の文字コードを制御部103
に出力する。
【0005】制御部103は、文字認識装置103から
入力される文字コードを記憶部104に記録する。また
制御部103は、記憶部104に記録された文字コード
をCRT105に出力する。ここで誤認識された文字コ
ードはキーボード106を介して操作者によって修正さ
れ、制御部103は修正済みの文字コードをホストコン
ピュータやプリンタ等に出力する。
【0006】以上が文字認識システムの大方の手順であ
るが、システムの処理量を増やすには、文字認識装置1
03における文字認識率を高めて誤認識を減らし、操作
者による修正の操作を減らすことが望ましい。文字認識
装置103で行われる前処理、特徴抽出処理、識別処理
のうち文字認識率への影響が顕著なのは前処理である。
前処理では、文字認識装置の形態によっても異なるが、
イメージデータの濃度値を適当なしきい値で2値に量子
化する2値化処理や、文字列のイメージデータから1文
字分の文字パターンを切り出す切り出し処理や、文字パ
ターンの位置や大きさを調節する正規化処理などが行わ
れる。
【0007】切り出し処理は、例えば横書き(縦書き)
の文字の場合、通常は文字と文字の間が空いているの
で、文字列部分の濃度のx軸(y軸)への正射影を見る
ことにより行われる。したがって切り出しが正確に行わ
れるためには、文字列がx軸(y軸)に平行であり、傾
いていないことが要求される。
【0008】
【発明が解決しようとする課題】しかしながら、従来の
文字認識処理システムにおいては、スキャナ部101に
原稿を読み込ませる時点で原稿が傾いて読み込まれるこ
とが多く、その結果切り出しの不成功率が増えるので文
字認識率が低下するという問題がある。また、文字認識
装置103は、識別処理の段階で文字コードの前後の単
語を見て文字コードの誤認識を検出し、切り出し処理に
フィードバックするという処理を行っているので、誤認
識が多いほどフィードバック量が多くなり処理速度が低
下するという問題がある。
【0009】上記の問題に鑑みて、本発明は、文字認識
処理の速度と文字認識率を向上させた文字認識装置の提
供を目的とする。
【0010】
【課題を解決するための手段】上記問題に鑑みて本発明
に係る文字認識装置は、原稿のイメージデータを記憶す
るイメージ記憶手段と、イメージデータ中から所定のマ
ークの位置を検出する検出手段と、検出されたマークの
位置からイメージデータ中の文字の傾きを計算する計算
手段と、計算された傾きに基づいてイメージデータ中の
文字の傾きを補正する補正手段と、補正されたイメージ
データ中の文字に対して文字認識を行う文字認識手段と
を備える。
【0011】また、前記検出手段は、イメージデータ中
のマークが存在する領域を予め記憶する記憶手段を有
し、イメージデータ中から記憶手段に記憶された領域内
を走査することによりマークの位置を検出するよう構成
してもよい。また、イメージデータ中のマークは2つの
図形から成り、前記検出手段は、イメージデータ中から
前記2つの図形の位置を検出し、前記計算手段は、2つ
の図形の位置からイメージデータ中の文字の傾きを計算
するよう構成してもよい。
【0012】また、イメージデータ中のマークは2つの
図形から成り、前記検出手段は、イメージデータ中の前
記2つの図形が存在する領域を予め記憶する記憶手段を
有し、イメージデータ中から記憶手段に記憶された領域
内を走査することにより前記2つの図形の位置を検出
し、前記計算手段は、2つの図形の位置からイメージデ
ータの傾きを計算するよう構成してもよい。
【0013】また、イメージデータ中のマークは線分で
あり、前記検出手段は、イメージデータ中から前記線分
の両端点の位置を検出し、前記計算手段は、前記線分の
両端点の位置からイメージデータ中の文字の傾きを計算
するよう構成してもよい。また、本発明に係る文字認識
装置は、所定のマーク付き原稿をイメージデータとして
読み取る読み取り手段と、読み取られたイメージデータ
を記憶するイメージ記憶手段と、記憶されているイメー
ジデータ中からマークの位置を検出する検出手段と、検
出されたマークの位置からイメージデータ中の文字の傾
きを計算する計算手段と、計算された傾きに基づいてイ
メージデータ中の文字の傾きを補正する補正手段と、補
正されたイメージデータ中の文字に対して文字認識を行
う文字認識手段とを備えてもよい。
【0014】また、本発明に係る文字認識装置は、ファ
クシミリ送信された所定のマーク付き原稿のイメージデ
ータを受信する受信手段と、受信されたイメージデータ
を記憶するイメージ記憶手段と、記憶されているイメー
ジデータ中からマークの位置を検出する検出手段と、検
出されたマークの位置からイメージデータ中の文字の傾
きを計算する計算手段と、計算された傾きに基づいてイ
メージデータ中の文字の傾きを補正する補正手段と、補
正されたイメージデータに対して文字認識を行う文字認
識手段とを備えてもよい。
【0015】また、本発明に係る文字認識方法は、マー
ク付きイメージデータをメモリに格納する格納ステップ
と、イメージデータ中の所定のマークの位置を検出する
検出ステップと、検出されたマークの位置からイメージ
データ中の文字の傾きを計算する計算ステップと、計算
された傾きに基づいてイメージデータ中の文字の傾きを
補正する補正ステップと、補正されたイメージデータ中
の文字に対して文字認識を行う文字認識ステップとから
構成される。
【0016】また、本発明に係る文字認識方法は、ファ
クシミリ送信されたマーク付きイメージデータを受信す
る受信ステップと、受信されたイメージデータをメモリ
に格納する格納ステップと、格納されているイメージデ
ータ中のマークの位置を検出する検出ステップと、検出
されたマークの位置からイメージデータ中の文字の傾き
を計算する計算ステップと、計算された傾きに基づいて
イメージデータ中の文字の傾きを補正する補正ステップ
と、補正されたイメージデータ中の文字に対して文字認
識を行う文字認識ステップとから構成してもよい。
【0017】
【発明の実施の形態】(第1実施形態)図1は、本発明の
第1実施形態における文字認識装置の構成を示すブロッ
ク図である。同図において本文字認識装置は、スキャナ
(図外)によって取り込まれた原稿のイメージデータ
(以下、元イメージデータと呼ぶ)についてイメージデ
ータ中の文字の傾きを算出する。ここで傾きとは、スキ
ャナによる水平方向の読み取り基準線に対するイメージ
データ中の文字や文字列の基線の傾きの度合いを指す。
次に、傾きを補正したイメージデータ(以下、補正イメ
ージデータと呼ぶ)を作成した後、本文字認識装置は補
正イメージデータについて文字認識を行って文字コード
に変換して図外のホストコンピュータやプリンタ、CR
Tディスプレイ等に出力する。
【0018】これを実現させるため、本文字認識装置
は、記憶部1、傾き検出部2、傾き補正部3、文字認識
部4から構成される。記憶部1は、元イメージデータフ
ァイル11、補正イメージデータファイル12、マーク
情報記憶部13から構成される。元イメージデータファ
イル11は、スキャナより入力される元イメージデータ
を記憶する。図2に元イメージデータの一例を示す。同
図の元イメージデータにおいて、領域201内が元イメ
ージデータであり、領域201を囲む実線枠は元イメー
ジデータのフレーム枠である。破線に囲まれた部分領域
202は文字認識の対象となる印刷文字や手書き文字の
部分で、同図の例では、部分領域202内の文字列の基
線がフレーム枠の底辺205に対して傾いていることを
示している。203及び204に示す2つの塗り潰し円
は、傾き補正のためのマークである。203及び204
のマークは、予め原稿に印刷されているマークであり、
2つを通る線分が部分領域202内の文字列の基線と平
行となるように配置されている。
【0019】補正イメージデータファイル12は、傾き
補正後の補正イメージを記憶する。補正イメージは、イ
メージ中の文字列の基線が補正イメージのフレーム枠の
底辺と平行になっている。マーク情報記憶部13は、後
述する傾き検出部2が元イメージデータ中のどの領域を
走査するべきかを示す座標データを記憶する。この領域
は、元イメージデータ中のマークが存在する領域(以
下、マーク領域と呼ぶ)を表わしている。マーク領域
は、マーク付き原稿の文字や文字列の基線がスキャナの
読み取り基準線に対して傾いて読み込まれたときに起こ
るマークの位置ずれを考慮して、その領域中にマーク含
まれるよう予め人為的に定められた領域である。マーク
領域は矩形の領域であり、座標データは矩形の1つの頂
点及び対向する頂点のイメージデータ上の位置座標で表
わされる。本実施形態におけるマークは2つの塗り潰し
円であるので、マーク情報記憶部13は、2つのマーク
領域に対する座標データを記憶する。
【0020】図3(a)は、図2の元イメージデータ上
のマーク領域を示す図である。図3において、破線30
1及び302の領域がそれぞれマーク領域1及び2であ
り、マーク情報記憶部13は、マーク領域1及び2の頂
点303、304及び305、306の座標データを記
憶する。図3(b)にマーク情報記憶部13の記憶内容
例を示す。
【0021】傾き検出部2は、元イメージデータファイ
ル11の元イメージデータから2つのマークを検出し
て、マークの座標を割り出し、割り出した座標から元イ
メージデータの傾きを算出し、その傾きを傾き補正部3
に出力する。図4は、元イメージデータのマーク部分
を、説明のためにxy座標上に配置した図である。傾き
検出部2は、マーク情報記憶部13より図3(b)に示
すマーク領域301、302の座標データを獲得する
と、図4の座標303から座標304までのマーク領域
301をxの正方向に順次走査して、塗り潰し円のxの
最小座標データx1と最大座標データx1'及びyの最
小座標データy1と最大座標データy1'を獲得する。
マーク領域302についても同様に、座標305から座
標306までをxの正方向に順次走査して、塗り潰し円
のxの最小座標データx2と最大座標データx2'及び
yの最小座標データy2及びy2'を獲得する。
【0022】次に傾き検出部2は、以下に示す計算を行
って各塗り潰し円の中心の座標c1(cx1、cy1)
及びc2(cx2、cy2)を求める。 (cx1、cy1)=((x1+x1')/2、(y1
+y1')/2) (cx2、cy1)=((x2+x2')/2、(y2
+y2')/2) 最後に、傾き検出部2は、c1及びc2を用いて、線分
c1−c2のxy座標上の傾きを算出して、その傾きを
傾き補正部3に出力する。
【0023】傾き補正部3は、傾き検出部2より傾きが
入力されると、傾きを用いて元イメージデータを回転さ
せ、線分c1−c2とフレーム枠の底辺とが平行になる
ようにデータ変換する。傾き補正部3は、変換後のイメ
ージデータを補正イメージデータとして補正イメージデ
ータファイル12に記憶させる。文字認識部4は、補正
イメージデータを用いて、前処理や特徴抽出処理や識別
処理等の文字認識処理を行って、補正イメージデータを
文字コードに変換する。この文字認識処理は、従来の文
字認識装置における処理とほぼ同様であるが、入力され
る補正イメージデータが従来の文字認識装置の場合とは
異なり、傾きが補正されているので、前処理で行われる
文字の切り出しがより正確に行われるため、文字認識率
が従来の文字認識装置よりも高い。
【0024】図5は、本実施形態の文字認識装置の動作
手順を表わすフローチャートである。傾き検出部2は、
マーク情報記憶部13より2つのマーク領域の情報を獲
得して、それらの領域を走査して各マークの位置を検出
する(ステップ501)。各マークが領域内に存在する
場合(ステップ502:yes)、傾き検出部2は、各
マークの中心座標c1及びc2を算出する(ステップ5
03)。
【0025】傾き検出部2は、線分c1−c2の傾きを
計算し、結果を傾き補正部3に出力する(ステップ50
4)。傾き補正部3は、傾きを用いて元イメージデータ
の傾きを回転により補正し、補正されたイメージデータ
を補正イメージデータとして補正イメージデータファイ
ル12に記憶させる(ステップ505)。
【0026】文字認識部4は、補正イメージデータファ
イル12の補正イメージデータを用いて文字認識処理を
行い、文字コードを出力する。以上のように本実施形態
の文字認識装置は、スキャナにより読み込まれた元イメ
ージデータ中のマークから元イメージデータの傾きを検
出して、傾きを補正した補正イメージデータを作成し、
補正イメージデータを用いて文字の認識を行うので、元
イメージデータを用いて文字認識を行う場合に比べて文
字認識率が高くなる。 (第2実施形態)図6は、本発明の第2実施形態におけ
る文字認識装置の構成を示すブロック図である。
【0027】同図において文字認識装置は、スキャナ
(図外)によって取り込まれた原稿の元イメージデータ
について傾きを検出し、傾きを補正した補正イメージデ
ータを作成した後、補正イメージデータについて文字認
識を行って文字コードに変換して図外のホストコンピュ
ータやプリンタ、CRTディスプレイ等に出力する。こ
のため、文字認識装置は、元イメージデータファイル1
1と補正イメージデータファイル12とマーク情報61
とからなる記憶部1、傾き検出部62、傾き補正部3、
文字認識部4から構成される。同図において図1の構成
要素と同じ符号の構成要素は同じものであるので説明を
省略し、以下異なる構成要素を中心に説明する。
【0028】マーク情報61は、イメージデータ中のマ
ークの端点が存在する2つのマーク領域(以下、マーク
領域と呼ぶ)を表わす座標データを記憶する。マーク領
域は矩形の領域であり、座標データは矩形の1つの頂点
及び対向する頂点のイメージデータ上の位置座標で表わ
される。本実施形態におけるマークは、文字認識の対象
となる文字列の基線に平行な、2つの端点を持つ線分で
あるので、マーク情報61は、2つの端点のマーク領域
に対する座標データを記憶する。
【0029】図7は、元イメージデータと元イメージデ
ータ上のマーク領域を示す図である。本発明の第2実施
形態における文字認識装置の構成を示すブロック図であ
る。同図において、破線701及び702の領域が2つ
のマーク領域であり、マーク情報61は、マーク領域の
頂点703、704及び705、706座標データを記
憶する。
【0030】傾き検出部62は、元イメージデータから
マークの2つの端点の座標を検出して、その座標から元
イメージデータの傾きを算出し、その傾きを傾き補正部
3に出力する。図8は、元イメージデータのマーク部分
を、説明のためにxy座標上に配置した図である。傾き
検出部62は、マーク情報61より座標データ703〜
706を獲得すると、図8の座標703から座標704
までxの正方向に順次走査して座標データAを獲得し、
同様に同図の座標705から座標706までをxの正方
向に順次走査して座標データBを獲得する。
【0031】傾き検出部62は、獲得したA、Bを用い
て、線分A−Bのxy座標上の傾きを算出して、その傾
きを傾き補正部3に出力する。図9は第2実施形態の文
字認識装置の動作手順を表わすフローチャートである。
傾き検出部62は、マーク情報61より2つの領域の座
標データを獲得し、それらの領域を走査して端点A、B
を検出する(ステップ901)。
【0032】端点A、Bが領域内に存在する場合(ステ
ップ902)、傾き検出部62は、線分A−Bの傾きを
計算し、結果を傾き補正部3に出力する(ステップ90
3)。傾き補正部3は、傾きを用いて元イメージデータ
の傾きを回転により補正し、補正された補正イメージデ
ータを補正イメージデータファイル12に記憶させる
(ステップ904)。
【0033】文字認識部4は、補正イメージデータファ
イル12の補正イメージデータを用いて文字認識処理を
行い、結果の文字コードをホストコンピュータやプリン
タやCRTディスプレイ等に出力する。以上のように本
実施形態の文字認識装置は、スキャナにより読み込まれ
た元イメージデータ中のマークの端点の座標データを獲
得して傾きを計算し、傾きを補正した補正イメージデー
タを作成し、補正イメージデータを用いて文字の認識を
行うので、元イメージデータを用いて文字認識を行う場
合に比べて文字認識率が高くなる。
【0034】なお、第1実施形態においてマークは、2
つの塗り潰し円から構成されるが、その他の図形を用い
て、例えば図10(a)に示すように、三角形、四角
形、多角形、円形、バツ印、星印、塗り潰した図形、白
抜きの図形、複数の図形を組み合わせたもの等でもよ
い。1ドットの点を2つ並べたものでもよい。また、第
2実施形態においてマークは、1本の線分であるが、そ
の他の線分を用いて、例えば図10(b)に示すように
線の太さ、種類、両端の形状などが異なる線を用いても
よい。要するに、原稿の文字や文字列の基線に対するマ
ークの傾きが予めわかるものであればよい。そうすれ
ば、本発明の文字認識装置の他の実施形態として、原稿
の基線に対するマークの傾きを予め記憶し、イメージデ
ータのフレーム枠に対するイメージ中のマークの傾きを
算出して、算出した傾きと記憶している傾きとが同値に
なるようにイメージデータを回転させて補正イメージデ
ータを作成するよう構成することもできる。
【0035】また、第1及び第2の実施形態において
は、元イメージデータは図外のスキャナより入力される
ものとしているが、スキャナに限ることはない。例え
ば、ファクシミリが本発明の文字認識装置を有するよう
に構成して、ファクシミリが受信したマーク付きのイメ
ージデータを文字認識装置の元イメージデータとして、
傾き検出、傾き補正、文字認識処理等を行い、文字コー
ドを出力するようにしてもよい。
【0036】また、本実施形態の文字認識装置は、原稿
等の紙に記録された文字を対象に処理を行っているが、
携帯型の電子手帳のようにタッチパネル等の上にペンタ
ブレットや手指等を用いて入力された文字や文字列を対
象に傾き検出、傾き補正及び文字認識を行うようにして
もよい。その場合、文字認識装置は、図1の構成のマー
ク情報記憶部13の代りに操作者にマークを入力するよ
う要求する要求部を備え、傾き検出部2の代りに入力さ
れたマークの座標に基づいてイメージデータの傾きを算
出する算出部を備えるようにすればよい。
【0037】また、第1及び第2の実施形態において、
マーク情報記憶部13及びマーク情報61は2つのマー
ク領域を記憶する構成としているが、2つのマーク領域
を含む1つのマーク領域を記憶する構成にしてもよい。
第1(第2)実施形態のマーク情報記憶部13(61)
の記憶内容を操作者によって書き換えられるよう構成し
てもよい。その場合、図1(図6)の構成にマーク情報
書き換え部を設けて、マーク情報書き換え部は、マーク
情報記憶部13(61)のマーク領域を、操作者より入
力されるマーク領域に書き換えるようにすればよい。
【0038】また第1及び第2の実施形態において、傾
き検出部及び傾き補正部の処理は、文字認識部による文
字認識処理より以前に行われるよう構成しているが、こ
の順番に限ることはない。例えば、文字認識部で最初の
段階に行われる、イメージデータの濃度値を適当なしき
い値で2値に量子化する2値化処理と、1文字分の文字
パターンを切り出す切り出し処理との間に傾き検出部及
び傾き補正部の処理を行うようにすればよい。
【0039】第1実施形態においては、図1の構成全体
を文字認識装置の構成としているが、例えば、記憶部
1、傾き検出部2、傾き補正部3からなる構成を傾き補
正装置として、一般の商用文字認識装置に接続して使用
する構成にしてもよい。その場合、一般の文字認識装置
へは、記憶部1に記憶された補正イメージデータファイ
ルの補正イメージデータを入力するようにすればよい。
【0040】
【発明の効果】上記の説明から明らかなように本発明に
係る文字認識装置は、原稿のイメージデータを記憶する
イメージ記憶手段と、イメージデータ中から所定のマー
クの位置を検出する検出手段と、検出されたマークの位
置からイメージデータ中の文字の傾きを計算する計算手
段と、計算された傾きに基づいてイメージデータ中の文
字の傾きを補正する補正手段と、補正されたイメージデ
ータ中の文字に対して文字認識を行う文字認識手段とを
備える。
【0041】これにより、本文字認識装置はイメージデ
ータ中のマークから傾きを計算し、その傾きに基づいて
補正されたイメージデータに対して文字認識を行うの
で、文字認識率が高くなるという効果がある。さらに文
字認識率が高くなれば、文字認識手段における誤認識文
字の修正量が減るので、結果として文字認識の処理速度
が速くなるという効果がある。さらにマークを用いるこ
とにより、イメージデータの傾きを簡単に計算できると
いう効果がある。
【0042】また、前記検出手段は、イメージデータ中
のマークが存在する領域を予め記憶する記憶手段を有
し、イメージデータ中から記憶手段に記憶された領域内
を走査することによりマークの位置を検出するよう構成
される。これにより、本文字認識装置のマーク検出手段
は、記憶手段に記憶されている領域のみを走査してマー
クを検出するので、イメージデータ全体を走査してマー
クを検出する場合に比べてマークが検出されるまでの時
間がより速くなり、その結果文字認識装置全体の処理速
度が速くなるという効果とともに、マークの検出誤りが
起こり難く、より文字認識率が向上するという効果があ
る。
【0043】また、イメージデータ中のマークは2つの
図形から成り、前記検出手段は、イメージデータ中から
前記2つの図形の位置を検出し、前記計算手段は、2つ
の図形の位置からイメージデータ中の文字の傾きを計算
するよう構成される。これにより、本文字認識装置は、
2つの図形から成るマークが印刷された原稿のイメージ
データに対してマークの検出と傾きの算出を行って文字
認識を行うことができる。例えば、原稿の余白部分にパ
ンチ穴用に印刷された2つの円形から成るマークを、本
文字認識装置の傾き検出、及び補正用として兼用するこ
とができる。
【0044】また、イメージデータ中のマークは2つの
図形から成り、前記検出手段は、イメージデータ中の前
記2つの図形が存在する領域を予め記憶する記憶手段を
有し、イメージデータ中から記憶手段に記憶された領域
内を走査することにより前記2つの図形の位置を検出
し、前記計算手段は、2つの図形の位置からイメージデ
ータの傾きを計算するよう構成される。
【0045】これにより、本文字認識装置は、2つの点
から成るマークが印刷された原稿のイメージデータに対
してマークの検出と傾きの算出を行って文字認識を行う
ことができる。また、イメージデータ中のマークは線分
であり、前記検出手段は、イメージデータ中から前記線
分の両端点の位置を検出し、前記計算手段は、前記線分
の両端点の位置からイメージデータ中の文字の傾きを計
算するよう構成される。
【0046】これにより、本文字認識装置は、線分が印
刷された原稿のイメージデータに対してマークの検出と
傾きの算出を行って文字認識を行うことができる。例え
ば、原稿中の罫線をマークとして兼用することができ
る。本発明に係る文字認識装置は、所定のマーク付き原
稿をイメージデータとして読み取る読み取り手段と、読
み取られたイメージデータを記憶するイメージ記憶手段
と、記憶されているイメージデータ中からマークの位置
を検出する検出手段と、検出されたマークの位置からイ
メージデータ中の文字の傾きを計算する計算手段と、計
算された傾きに基づいてイメージデータ中の文字の傾き
を補正する補正手段と、補正されたイメージデータ中の
文字に対して文字認識を行う文字認識手段とを備える。
【0047】これにより、本発明の文字認識装置は、読
み取り手段によってマーク付き原稿をイメージデータと
して読み取ることができ、読み取られたイメージデータ
中のマークから傾きを計算し、その傾きに基づいて補正
されたイメージデータに対して文字認識を行うので、傾
いたイメージデータに対して文字認識を行う場合に比べ
て文字認識率が高くなるという効果がある。さらに文字
認識率が高くなれば、文字認識手段における誤認識文字
の修正量が減るので、結果として文字認識の処理速度が
速くなるという効果がある。さらに、マークを用いるこ
とにより、イメージデータの傾きを簡単に計算できると
いう効果がある。
【0048】また、本発明に係る文字認識装置は、ファ
クシミリ送信された所定のマーク付き原稿のイメージデ
ータを受信する受信手段と、受信されたイメージデータ
を記憶するイメージ記憶手段と、記憶されているイメー
ジデータ中からマークの位置を検出する検出手段と、検
出されたマークの位置からイメージデータ中の文字の傾
きを計算する計算手段と、計算された傾きに基づいてイ
メージデータ中の文字の傾きを補正する補正手段と、補
正されたイメージデータに対して文字認識を行う文字認
識手段とを備える。
【0049】これにより、文字認識装置は、受信手段に
よりファクシミリ送信されたマーク付きイメージデータ
を受信することができ、受信されたイメージデータ中の
マークから傾きを計算し、その傾きに基づいて補正され
たイメージデータに対して文字認識を行うので、上記同
様に傾いたイメージデータに対して文字認識を行う場合
に比べて文字認識率が高くなるという効果がある。また
マークを用いることにより、イメージデータの傾きを簡
単に計算できるという効果がある。
【0050】また、本発明に係る文字認識方法は、マー
ク付きイメージデータをメモリに格納する格納ステップ
と、イメージデータ中の所定のマークの位置を検出する
検出ステップと、検出されたマークの位置からイメージ
データ中の文字の傾きを計算する計算ステップと、計算
された傾きに基づいてイメージデータ中の文字の傾きを
補正する補正ステップと、補正されたイメージデータ中
の文字に対して文字認識を行う文字認識ステップとから
構成される。
【0051】これにより、本文字認識方法はイメージデ
ータ中のマークから傾きを計算し、その傾きに基づいて
補正されたイメージデータに対して文字認識を行うの
で、上記同様に傾いたイメージデータに対して文字認識
を行う場合に比べて文字認識率が高くなるという効果が
ある。またマークを用いることにより、イメージデータ
の傾きを簡単に計算できるという効果がある。
【0052】また、本発明に係る文字認識方法は、ファ
クシミリ送信されたマーク付きイメージデータを受信す
る受信ステップと、受信されたイメージデータをメモリ
に格納する格納ステップと、格納されているイメージデ
ータ中のマークの位置を検出する検出ステップと、検出
されたマークの位置からイメージデータ中の文字の傾き
を計算する計算ステップと、計算された傾きに基づいて
イメージデータ中の文字の傾きを補正する補正ステップ
と、補正されたイメージデータ中の文字に対して文字認
識を行う文字認識ステップとから構成される。
【0053】これにより、本文字認識方法は、受信手段
によりファクシミリ送信されたマーク付きイメージデー
タを受信することができ、受信されたイメージデータ中
のマークから傾きを計算し、その傾きに基づいて補正さ
れたイメージデータに対して文字認識を行うので、上記
同様に傾いたイメージデータに対して文字認識を行う場
合に比べて文字認識率が高くなるという効果がある。さ
らに文字認識率が高くなれば、文字認識処理におけるフ
ィードバック量が減るので結果として文字認識の速度が
速くなるという効果もある。またマークを用いることに
より、イメージデータの傾きを簡単に計算できるという
効果がある。
【図面の簡単な説明】
【図1】本発明の第1実施形態における文字認識装置の
構成を示すブロック図である。
【図2】元イメージデータの一例を示す図である。
【図3】(a)元イメージデータ上のマーク領域を示す
図である。 (b)マーク情報記憶部13の記憶内容例を示す図であ
る。
【図4】元イメージデータのマーク部分をxy座標上に
配置した図である。
【図5】本発明の文字認識装置の動作手順を表わすフロ
ーチャートである
【図6】本発明の第2実施形態における文字認識装置の
構成を示すブロック図である。
【図7】元イメージデータと元イメージデータ上のマー
ク領域を示す図である。
【図8】元イメージデータのマーク部分をxy座標上に
配置した図である。
【図9】第2実施形態における文字認識装置の動作手順
を表わすフローチャートである。
【図10】(a)第1及び第2実施形態におけるマーク
の他の例を示す図である。 (b)第1及び第2実施形態におけるマークの他の例を
示す図である。
【図11】文字認識装置を含む文字認識システムの一構
成例を示す図である。
【図12】文字認識の対象となる原稿の一例を示す図で
ある。
【符号の説明】
1 記憶部 11 元イメージデータファイル 12 補正イメージデータファイル 13 マーク情報 2 傾き検出部 3 傾き補正部 4 文字認識部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 原稿のイメージデータを記憶するイメー
    ジ記憶手段と、 イメージデータ中から所定のマークの位置を検出する検
    出手段と、 検出されたマークの位置からイメージデータ中の文字の
    傾きを計算する計算手段と、 計算された傾きに基づいてイメージデータ中の文字の傾
    きを補正する補正手段と、 補正されたイメージデータ中の文字に対して文字認識を
    行う文字認識手段とを備えることを特徴とする文字認識
    装置。
  2. 【請求項2】 前記検出手段は、 イメージデータ中のマークが存在する領域を予め記憶す
    る記憶手段を有し、 イメージデータ中から記憶手段に記憶された領域内を走
    査することによりマークの位置を検出することを特徴と
    する請求項1記載の文字認識装置。
  3. 【請求項3】 イメージデータ中のマークは2つの図形
    から成り、 前記検出手段は、イメージデータ中から前記2つの図形
    の位置を検出し、 前記計算手段は、2つの図形の位置からイメージデータ
    中の文字の傾きを計算することを特徴とする請求項1記
    載の文字認識装置。
  4. 【請求項4】 イメージデータ中のマークは2つの図形
    から成り、 前記検出手段は、 イメージデータ中の前記2つの図形が存在する領域を予
    め記憶する記憶手段を有し、 イメージデータ中から記憶手段に記憶された領域内を走
    査することにより前記2つの図形の位置を検出し、 前記計算手段は、2つの図形の位置からイメージデータ
    の傾きを計算することを特徴とする請求項1記載の文字
    認識装置。
  5. 【請求項5】 イメージデータ中のマークは線分であ
    り、 前記検出手段は、イメージデータ中から前記線分の両端
    点の位置を検出し、 前記計算手段は、前記線分の両端点の位置からイメージ
    データ中の文字の傾きを計算することを特徴とする請求
    項1記載の文字認識装置。
  6. 【請求項6】所定のマーク付き原稿をイメージデータと
    して読み取る読み取り手段と、 読み取られたイメージデータを記憶するイメージ記憶手
    段と、 記憶されているイメージデータ中からマークの位置を検
    出する検出手段と、 検出されたマークの位置からイメージデータ中の文字の
    傾きを計算する計算手段と、 計算された傾きに基づいてイメージデータ中の文字の傾
    きを補正する補正手段と、 補正されたイメージデータ中の文字に対して文字認識を
    行う文字認識手段とを備えることを特徴とする文字認識
    装置。
  7. 【請求項7】 ファクシミリ送信された所定のマーク付
    き原稿のイメージデータを受信する受信手段と、 受信されたイメージデータを記憶するイメージ記憶手段
    と、 記憶されているイメージデータ中からマークの位置を検
    出する検出手段と、 検出されたマークの位置からイメージデータ中の文字の
    傾きを計算する計算手段と、 計算された傾きに基づいてイメージデータ中の文字の傾
    きを補正する補正手段と、 補正されたイメージデータに対して文字認識を行う文字
    認識手段とを備えることを特徴とする文字認識装置。
  8. 【請求項8】 マーク付きイメージデータをメモリに格
    納する格納ステップと、 イメージデータ中の所定のマークの位置を検出する検出
    ステップと、 検出されたマークの位置からイメージデータ中の文字の
    傾きを計算する計算ステップと、 計算された傾きに基づいてイメージデータ中の文字の傾
    きを補正する補正ステップと、 補正されたイメージデータ中の文字に対して文字認識を
    行う文字認識ステップとから成ることを特徴とする文字
    認識方法。
  9. 【請求項9】 ファクシミリ送信されたマーク付きイメ
    ージデータを受信する受信ステップと、 受信されたイメージデータをメモリに格納する格納ステ
    ップと、 格納されているイメージデータ中のマークの位置を検出
    する検出ステップと、 検出されたマークの位置からイメージデータ中の文字の
    傾きを計算する計算ステップと、 計算された傾きに基づいてイメージデータ中の文字の傾
    きを補正する補正ステップと、 補正されたイメージデータ中の文字に対して文字認識を
    行う文字認識ステップとから成ることを特徴とする文字
    認識方法。
JP10046652A 1998-02-27 1998-02-27 文字認識装置および文字認識方法 Pending JPH11250179A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10046652A JPH11250179A (ja) 1998-02-27 1998-02-27 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10046652A JPH11250179A (ja) 1998-02-27 1998-02-27 文字認識装置および文字認識方法

Publications (1)

Publication Number Publication Date
JPH11250179A true JPH11250179A (ja) 1999-09-17

Family

ID=12753257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10046652A Pending JPH11250179A (ja) 1998-02-27 1998-02-27 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JPH11250179A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100615058B1 (ko) * 2003-11-10 2006-08-22 히타치 오므론 터미널 솔루션즈 가부시키가이샤 휴대 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치
JP2012221372A (ja) * 2011-04-12 2012-11-12 Panasonic Corp 帳票、帳票処理装置、帳票処理方法及び記録媒体
CN111506348A (zh) * 2020-04-22 2020-08-07 广州光大教育软件科技股份有限公司 手写板校正多线程并行处理方法、装置、设备以及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100615058B1 (ko) * 2003-11-10 2006-08-22 히타치 오므론 터미널 솔루션즈 가부시키가이샤 휴대 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치
JP2012221372A (ja) * 2011-04-12 2012-11-12 Panasonic Corp 帳票、帳票処理装置、帳票処理方法及び記録媒体
CN111506348A (zh) * 2020-04-22 2020-08-07 广州光大教育软件科技股份有限公司 手写板校正多线程并行处理方法、装置、设备以及介质

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
JP6200040B1 (ja) 画像処理装置、画像処理方法、および、プログラム
US8139897B2 (en) Detecting tilt in an image having different resolutions in different directions
JP3727971B2 (ja) 文書処理装置、及び文書処理方法
US6959121B2 (en) Document image processing device, document image processing method, and memory medium
JP2835178B2 (ja) 文書読取装置
JPH01253077A (ja) 文字列検出方法
US6771842B1 (en) Document image skew detection method
JP2008071076A (ja) 画像抽出装置
JP3006466B2 (ja) 文字入力装置
JP3733310B2 (ja) 文書書式識別装置および識別方法
JPH11250179A (ja) 文字認識装置および文字認識方法
US11657632B2 (en) Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data
JP3604909B2 (ja) 画像間位置合わせ方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3709991B2 (ja) 楽譜認識装置
JP2000113106A (ja) 文書画像処理装置
JP4552757B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2824372B2 (ja) 帳票の認識装置
US20030002062A1 (en) Image processing apparatus, method and program, and storage medium
JP3055484B2 (ja) 文字認識装置および方法
JP3613356B2 (ja) 楽譜認識装置
JP2007011528A (ja) Ocr処理における認識対象項目の位置探索方法
JP3932201B2 (ja) 帳票種識別装置および記録媒体
JP4517667B2 (ja) 文書画像照合装置、文書画像位置合わせ方法及びプログラム