JP3099771B2 - 文字認識方法、装置及び文字認識プログラムを記録した記録媒体 - Google Patents

文字認識方法、装置及び文字認識プログラムを記録した記録媒体

Info

Publication number
JP3099771B2
JP3099771B2 JP09116978A JP11697897A JP3099771B2 JP 3099771 B2 JP3099771 B2 JP 3099771B2 JP 09116978 A JP09116978 A JP 09116978A JP 11697897 A JP11697897 A JP 11697897A JP 3099771 B2 JP3099771 B2 JP 3099771B2
Authority
JP
Japan
Prior art keywords
character
inclination
value
estimated
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09116978A
Other languages
English (en)
Other versions
JPH10307889A (ja
Inventor
孝文 越仲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP09116978A priority Critical patent/JP3099771B2/ja
Priority to US09/071,034 priority patent/US6115506A/en
Priority to EP98108255A priority patent/EP0877335B1/en
Priority to AU64764/98A priority patent/AU753499B2/en
Priority to DE69831032T priority patent/DE69831032T2/de
Publication of JPH10307889A publication Critical patent/JPH10307889A/ja
Application granted granted Critical
Publication of JP3099771B2 publication Critical patent/JP3099771B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙などに書かれた
文字行や単語などの手書き文字列を、光学センサで取り
込んで読み取る文字認識方法、装置及び文字認識プログ
ラムを記録した記録媒体に関する。
【0002】
【従来の技術】従来、この種の文字認識装置では、文字
列から文字を正しく切り出すため、また文字画像から安
定した特徴を抽出し、文字を正しく識別するため、文字
の変形の重要な要素の一つである文字の傾きを間接的に
示す何らかの評価値をもとに、文字の傾き補正処理を行
っている。例えば、傾き補正処理を行うこの種の文字認
識装置では、文字の方向性を方向コードヒストグラムに
より調べ、もっとも頻度の大きい方向をその文字の傾き
の方向として判定し、これにより傾きを補正している。
また、別の一例が、特開平5-114046号公報に記載されて
いる。この公報に記載された「手書き文字における特性
傾斜角を正規化する方法および装置」では、予測される
傾きの方向に関する入力画像の投影ヒストグラムのエン
トロピーを計算し、そのエントロピーが最小となる傾き
量を決定する。そして、その傾き量に等しい角度だけ入
力画像を位置転換することにより、文字の傾きを補正し
ている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
傾き補正補正処理は、基本的には、入力文字画像の中
に、文字列方向に対して垂直な方向(以下、縦方向と呼
ぶ)のストロークが多く存在するなどの仮定をおき、そ
れら多数存在する縦方向ストロークが鉛直方向を向くよ
うに画像を補正するという方針をとっている。すなわ
ち、縦方向において値が大きくなるような評価値を用い
て補正を行っている。
【0004】従って、縦方向のストロークが多い図2
示すような文字画像が入力された場合には、図3に示す
ように実際の傾き角X付近でのみ前記評価値が大きくな
るため、傾き角の推定が正確に行え、適正な補正を行う
ことができる。
【0005】ところが、図4に示すような縦方向のスト
ロークがそれほど多く存在しない文字画像が入力された
場合には、図5に示すように実際の傾き角X付近で前記
評価値が顕著な値を取るとは限らないため、傾き角の推
定を誤り、適正な補正を行うことができないという問題
がある。例えば図6に示すように、傾き角の推定を誤っ
た結果、傾きをより増長する補正を行ってしまう場合が
ある。
【0006】すなわち、文字の傾きを示す評価値が、特
定の角付近でのみ顕著な値を取るのではなく、角を変え
てもそれほど顕著な変動が現われないような場合には、
文字の傾き角を推定することが困難であり、しばしば見
当違いの傾き補正をしてしまうという問題点がある。こ
のような不適正な補正は、その後の文字切り出しや特徴
抽出や識別に悪影響を及ぼすことになる。
【0007】そこで、本発明の目的は、傾き補正処理に
おける誤補正を低減し、誤認識の少ない文字認識装置を
提供することにある。
【0008】
【課題を解決するための手段】上述した目的は、文字の
傾き角を推定し、その傾き角推定値の妥当性を示す評価
値、すなわち、傾き角推定値がどの程度信用することが
できるのかを示す評価値を求め、前記評価値に基づいて
傾き補正量を調整することにより達成される。前記評価
値が高い場合には、その傾き角推定値が信用できるとし
て傾き角推定値を補正量として用い、前記評価値が低い
場合には、その傾き角推定値が信用できないとして、前
記評価値の大小に応じて補正量を調整する。このように
して得られた補正量に基づき補正した後、文字認識を行
う。
【0009】
【発明の実施の形態】次に、本発明の第一の実施の形態
について図面を参照して詳細に説明する。
【0010】図1は、本発明の一実施例を示すブロック
図である。この実施例は、文字画像を格納する画像記憶
手段1と文字の傾き角の推定値を求め出力する文字傾き
推定手段21と、前記推定値の妥当性を示す評価値を計
算し出力する推定値評価手段22と、文字傾き推定手段
と推定値評価手段の出力をもとに文字傾き補正量を決定
し傾き補正を行う傾き補正手段23と、文字を認識し出
力する文字認識手段3とを有する。なお、一般に文字認
識を行う場合には、入力画像に対して前処理を行うのが
普通であり、前処理としては、多値画像をより扱いやす
い2値画像に変換する2値化処理、文字の大きさやスト
ロークの間隔等を整形する正規化処理、画像中の細かな
汚れやかすれを除くノイズ除去処理などが考えられ、こ
こでは図示していないが必要に応じて導入してもよい。
また、このような前処理は傾き補正処理の前後を問わ
ず、導入することができる。
【0011】画像はスキャナ等によって光学的に入力さ
れ、画像記憶手段1に格納され、さらに文字傾き角推定
手段21及び傾き補正手段23へと送られる。
【0012】文字傾き推定手段21は、文字列画像中の
文字列の傾き角をx1,x2,…,xnというように複
数個仮定し、それらの傾き角の正しさの度合を示す評価
値y1,y2,…,ynを計算し、前記評価値y1,y
2,…,ynを推定値評価手段22へ出力する。図3
たは図5は前記評価値y1,y2,…,ynをグラフ化
したものである。その後、評価値yiが最大となる傾き
角xiを選択し、前記xiを文字の傾き角の推定値xと
して、推定値評価手段22及び傾き補正手段23へ出力
する。
【0013】評価値yi の計算には、例えば、角度xi
からの投影ヒストグラムの自乗和を用いる。すなわち、
角度xi の方向からの文字画像の投影ヒストグラムを数
列h1 (xi ),h2 (xi ),…,hj (xi ),…
で表すとき、評価値yi は次式で表される。
【0014】
【数1】
【0015】この評価値y1 ,y2 ,…,yn が最大と
なる傾き角をx1 ,x2 ,…,xn の中から選び、文字
の傾き角の推定値Xとして出力する。
【0016】また別な評価値yi の計算方法として、例
えば、文字図形の輪郭線の方向の遷移系列を表現したチ
ェーンコードを用いる。チェーンコードから、輪郭線素
を方向別に計数し、方向ごとのヒストグラム(度数分布)
を作成する。このヒストグラムを傾き角の評価値y1
2 ,…,yn として用いる。すなわち、ヒストグラム
の値が最大となる傾き角をx1 ,x2 ,…,xn の中か
ら選び、文字の傾き角の推定値Xとして出力する。な
お、多値画像を扱う場合でも、「1988年、マイケル・カ
ス他、スネークス:アクティブ・コントゥア・モデル
ズ、インターナショナル・ジャーナル・オブ・コンピュ
ータ・ビジョン、321〜331頁(Michael Kasset al., Sn
akes: Active Contour Models, International Journal
of Computer Vision, pp.321-331, 1988)」に示され
ているスネークス法のような動的輪郭抽出法を用いるこ
とにより輪郭線を抽出することができるので、同様の評
価値計算を行うことが可能である。さらには、輪郭線か
らストロークの方向を計測する方法以外にも、縦、横、
斜め他種々の方向の連結黒画素のラン長の比率や差分に
より方向を特定する方法を用いることも可能である。
【0017】推定値評価手段22は、前記文字傾き推定
手段21より、傾き角推定値Xと、評価値y1 ,y2
…,yn のセットを受け取り、推定値Xの妥当性Rの値
を計算し、傾き補正手段23へ出力する。
【0018】ここで推定値Xの妥当性Rとして、例え
ば、前記評価値y1 ,y2 ,…,ynのセットが有する
情報量もしくはそれに準ずる量を用いる。例えば、推定
値Xの妥当性Rは、
【0019】
【数2】
【0020】と計算する。 Rが大きいほど、推定値X
の妥当性が高いと判断する。
【0021】ここでRの計算において、評価値y1 ,y
2 ,…,yn の値を適当に正規化する実現方法も可能で
ある。すなわち、推定値の妥当性Rの変動幅を大きく
し、より詳細に妥当性を検証するために、評価値y1
2 ,…,yn に適当な定数pを乗じ、適当な定数qを
減じてから推定値の妥当性を
【0022】
【数3】
【0023】で計算する。
【0024】またRは、例えば
【0025】
【数4】
【0026】と計算する。この場合もRが大きいほど、
推定値Xの妥当性が高いと判断する。
【0027】ここでRの計算において、評価値y1 ,y
2 ,…,yn の値を適当に正規化する実現方法も可能で
ある。すなわち、推定値の妥当性の変動幅を大きくし、
より詳細に妥当性を検証するために、評価値y1 ,y
2 ,…,yn に適当な定数pを乗じ、適当な定数qを減
じてから推定値の妥当性を
【0028】
【数5】
【0029】で計算する。
【0030】また、このほかRとして例えば、評価値の
分散を使用する実現形態も可能である。すなわち、平均
値をとる演算をE(・)で表すとすると
【0031】
【数6】R=E(yi 2)−E(yi2
【0032】によって推定値の妥当性を計算することが
できる。
【0033】傾き補正手段23は、前記画像記憶手段1
から文字画像を、前記文字傾き推定手段21から推定値
Xを、また前記推定値評価手段22から推定値の妥当性
Rを受け取る。傾き補正手段23はこれらの値を用いて
傾き補正量X* を計算し、傾き補正を行う。そして、補
正後の画像を文字認識手段3へ出力する。傾き補正の具
体的方法としては、例えば、文字画像を−X* だけせん
断変形させる方法がある。また、例えば、−X* だけ回
転変換する方法もある。これらを具体的に説明すると、
例えば画像をせん断変形させる場合は、正方形が平行四
辺形に変形するように、高い位置にある画素ほど多く横
方向に移動させる。位置(x,y)にある画素は、−X
* (画素)のせん断変形により(x−X×h/y,y)
に移動させればよい。一方、回転変換の場合は画像を回
転させればよい。この場合、位置(x,y)にある画素
は、−X* (角度)の回転により(x cosX* −y
sinX* ,y cosX* +x sinX* )に移動
させる。
【0034】傾き補正量X* は、
【0035】
【数7】X* =f(R)×X
【0036】で計算する。ここにf(R)は0から1ま
での値をとる単調非減少な関数で、例えば
【0037】
【数8】f(R)=1/(1+e(-aR+b)
【0038】(ただしa,bは定数かつa>0)という
シグモイド関数で実現される。また、例えば、
【0039】
【数9】f(R)=aR+b
【0040】(ただしa,bは定数かつa>0)という
1次関数で実現される。推定値の妥当性Rが高い場合
は、推定された傾き角にほぼ従って画像の傾きが補正さ
れるが、推定値の妥当性Rが低い場合には、少量の補正
を行うのみにとどめ、誤った補正を抑える。
【0041】文字認識手段3は画像に対して文字切り出
し、特徴抽出、識別等の処理を行い、文字の読み取り結
果を出力する。すなわち、文字切り出しにおいては、例
えば横書きの文字列であればその縦方向の投影ヒストグ
ラムを計算し、ヒストグラムの度数の低い位置をいくつ
か検出し、その位置で文字列を切断することにより文字
を切り出す。特徴抽出では、文字画像を文字の認識に必
要な特徴群に変換する。識別では、正解の分かっている
特徴群のセット、すなわちテンプレートをあらかじめ準
備しておき、それらと入力画像から抽出した特徴群とを
比較し、入力に近いテンプレートを選択し、そのテンプ
レートに対応する文字コードを出力する。
【0042】
【0043】
【0044】
【0045】
【0046】
【0047】
【0048】
【0049】
【0050】
【0051】次に、本発明の第二の実施の形態について
図面を参照して詳細に説明する。
【0052】図8を参照すると、本発明の第二の実施の
形態は、文字認識プログラムを記録した記録媒体5を備
える。この記録媒体5はCD−ROM、磁気ディスク、
半導体メモリその他の記録媒体であってよい
【0053】文字認識プログラムは記録媒体5からデー
タ処理装置6に読み込まれ、データ処理装置6の動作を
制御する。データ処理装置6は文字認識プログラムの制
御により、文字の傾き角を推定し、その傾き角推定値の
妥当性を評価し、前記傾き角推定値と前記妥当性評価値
から傾き補正量を決定し、前記補正量に基づいて傾き補
正をしてから文字認識を行う。本実施の形態の実施例
しては、データ処理装置6は文字認識プログラムの制御
により、第一の実施の形態における文字傾き推定手段2
1、推定値評価手段22、傾き補正手段23及び文字認
識手段3による処理と同一の処理を実行する。
【0054】
【発明の効果】以上説明したように、本発明によれば、
傾き角の正しさの度合いを示す評価値が有する情報量、
すなわち傾き角推定値の妥当性、に応じて傾き補正量を
適応的に調整することができ、図7に示すように、傾き
角を求めることが困難な場合においても誤った補正をし
てしまうことを防ぐことができ、文字切り出し、特徴抽
出、認識をより安定に行い、誤りの少ない文字認識を実
現できる。また、前記妥当性に基づき文字認識候補数を
減らすことにより、後段に続く言語知識を用いた認識候
補選択が容易となる。すなわち、言語的に適切な文字列
を探索するのにかかる時間を短縮することができ、また
誤った文字列を正解として選択してしまう危険も抑える
ことができる。
【図面の簡単な説明】
【図1】本発明の一実施例の機能的な構成を表したブロ
ック図
【図2】傾き補正処理が比較的容易な文字画像の例を示
す図
【図3】傾き補正処理が比較的容易な文字画像の例の評
価値計算結果を示す図
【図4】傾き補正処理が困難な文字画像の例を示す図
【図5】傾き補正処理が困難な文字画像の例の評価値計
算結果を示す図
【図6】従来技術が誤った傾き補正を行ってしまう例を
示す図
【図7】本発明により誤った傾き補正が抑制される例を
示す図
【図8】本発明の一実施例の機能的な構成を表したブロ
ック図

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値に基づいて傾き角
    推定値を求め、前記傾き角推定値に加え、前記正しさの
    度合を示す評価値をも出力し、 前記推定値評価手段が、前記文字傾き推定手段の出力す
    る前記正しさの度合を示す評価値の自乗和または分散
    を、前記文字傾き推定手段の出力する前記傾き角推定値
    の妥当性を示す評価値として求め、出力することを特徴
    とする文字認識装置。
  2. 【請求項2】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値の最大値を探索
    し、前記最大値に対応する傾き角候補を傾き角推定値と
    して求め、前記傾き角推定値に加え、前記正しさの度合
    を示す評価値をも出力し、 前記推定値評価手段が、前記文字傾き推定手段の出力す
    る前記正しさの度合を示す評価値の自乗和または分散
    を、前記文字傾き推定手段の出力する前記傾き角推定値
    の妥当性を示す評価値として求め、出力することを特徴
    とする文字認識装置。
  3. 【請求項3】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記傾き補正手段が、前記推定値評価手段の出力する前
    記妥当性を示す評価値を、単調非減少な関数によって0
    から1の間の数値に正規化し、前記正規化した数値を傾
    き補正量の大小を調整する係数として利用することを特
    徴とする文字認識装置。
  4. 【請求項4】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値に基づいて傾き角
    推定値を求め、前記傾き角推定値に加え、前記正しさの
    度合を示す評価値をも出力し、 前記傾き補正手段が、前記推定値評価手段の出力する前
    記妥当性を示す評価値を、単調非減少な関数によって0
    から1の間の数値に正規化し、前記正規化した数値を傾
    き補正量の大小を調整する係数として利用することを特
    徴とする文字認識装置。
  5. 【請求項5】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値の最大値を探索
    し、前記最大値に対応する傾き角候補を傾き角推定値と
    して求め、前記傾き角推定値に加え、前記正しさの度合
    を示す評価値をも出力し、 前記傾き補正手段が、前記推定値評価手段の出力する前
    記妥当性を示す評価値を、単調非減少な関数によって0
    から1の間の数値に正規化し、前記正規化した数値を傾
    き補正量の大小を調整する係数として利用することを特
    徴とする文字認識装置。
  6. 【請求項6】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値に基づいて傾き角
    推定値を求め、前記傾き角推定値に加え、前記正しさの
    度合を示す評価値をも出力し、 前記推定値評価手段が、前記文字傾き推定手段の出力す
    る前記正しさの度合を示す評価値全体が有する情報量
    を、前記文字傾き推定手段の出力する前記傾き角推定値
    の妥当性を示す評価値として求め、出力し、 前記傾き補正手段が、前記推定値評価手段の出力する前
    記妥当性を示す評価値を、単調非減少な関数によって0
    から1の間の数値に正規化し、前記正規化した数値を傾
    き補正量の大小を調整する係数として利用することを特
    徴とする文字認識装置。
  7. 【請求項7】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値の最大値を探索
    し、前記最大値に対応する傾き角候補を傾き角推定値と
    して求め、前記傾き角推定値に加え、前記正しさの度合
    を示す評価値をも出力し、 前記推定値評価手段が、前記文字傾き推定手段の出力す
    る前記正しさの度合を示す評価値全体が有する情報量
    を、前記文字傾き推定手段の出力する前記傾き角推定値
    の妥当性を示す評価値として求め、出力し、 前記傾き補正手段が、前記推定値評価手段の出力する前
    記妥当性を示す評価値を、単調非減少な関数によって0
    から1の間の数値に正規化し、前記正規化した数値を傾
    き補正量の大小を調整する係数として利用することを特
    徴とする文字認識装置。
  8. 【請求項8】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値に基づいて傾き角
    推定値を求め、前記傾き角推定値に加え、前記正しさの
    度合を示す評価値をも出力し、 前記推定値評価手段が、前記文字傾き推定手段の出力す
    る前記正しさの度合を示す評価値の自乗和または分散
    を、前記文字傾き推定手段の出力する前記傾き角推定値
    の妥当性を示す評価値として求め、出力し、 前記傾き補正手段が、前記推定値評価手段の出力する前
    記妥当性を示す評価値を、単調非減少な関数によって0
    から1の間の数値に正規化し、前記正規化した数値を傾
    き補正量の大小を調整する係数として利用することを特
    徴とする文字認識装置。
  9. 【請求項9】文字の傾き角を補正して認識を行う文字認
    識装置において、文字の傾き角の推定値を求め出力する
    文字傾き推定手段と、前記推定値の妥当性を示す評価値
    を計算し出力する推定値評価手段と、文字傾き推定手段
    と推定値評価手段の出力をもとに文字傾き補正量を決定
    し傾き補正を行う傾き補正手段とを有し、 前記文字傾き推定手段が、複数の傾き角候補を設定し、
    それぞれの傾き角候補の正しさの度合を示す評価値を計
    算し、前記正しさの度合を示す評価値の最大値を探索
    し、前記最大値に対応する傾き角候補を傾き角推定値と
    して求め、前記傾き角推定値に加え、前記正しさの度合
    を示す評価値をも出力し、 前記推定値評価手段が、前記文字傾き推定手段の出力す
    る前記正しさの度合を示す評価値の自乗和または分散
    を、前記文字傾き推定手段の出力する前記傾き角推定値
    の妥当性を示す評価値として求め、出力し、 前記傾き補正手段が、前記推定値評価手段の出力する前
    記妥当性を示す評価値を、単調非減少な関数によって0
    から1の間の数値に正規化し、前記正規化した数値を傾
    き補正量の大小を調整する係数として利用することを特
    徴とする文字認識装置。
  10. 【請求項10】前記単調非減少な関数として、シグモイ
    ド関数を用いることを特徴とする、請求項3〜9の何れ
    かの請求項に記載の文字認識装置。
  11. 【請求項11】前記単調非減少な関数として、線形関数
    または区分線形関数を用いることを特徴とする、請求項
    3〜9の何れかの請求項に記載の文字認識装置。
  12. 【請求項12】コンピュータ上で動作する文字認識プロ
    グラムを記録した記録媒体において、文字の傾き角を推
    定するステップと、その傾き角推定値の妥当性を評価す
    るステップと、前記傾き角推定値とその妥当性評価値か
    ら傾き補正量を決定するステップと、前記傾き補正量に
    基づいて傾き補正をしてから文字認識を行うステップを
    有し、 前記文字傾き角を推定するステップが、複数の傾き角候
    補を設定し、それぞれの傾き角候補の正しさの度合を示
    す評価値を計算し、前記正しさの度合を示す評価値に基
    づいて傾き角推定値を求め、前記傾き角推定値に加え、
    前記正しさの度合を示す評価値をも出力し、 前記傾き角推定値の妥当性を評価するステップが、前記
    文字傾き角を推定するステップの出力する前記正しさの
    度合を示す評価値の自乗和または分散を、前記文字傾き
    推定手段の出力する前記傾き角推定値の妥当性を示す評
    価値として求め、出力することを特徴とする、コンピュ
    ータ上で動作する文字認識プログラムを記録した記録媒
    体。
  13. 【請求項13】コンピュータ上で動作する文字認識プロ
    グラムを記録した記録媒体において、文字の傾き角を推
    定するステップと、その傾き角推定値の妥当性を評価す
    るステップと、前記傾き角推定値とその妥当性評価値か
    ら傾き補正量を決定するステップと、前記傾き補正量に
    基づいて傾き補正をしてから文字認識を行うステップを
    有し、 前記傾き補正量を決定するステップが、前記傾き角推定
    値の妥当性を評価するステップの出力する前記妥当性を
    示す評価値を、単調非減少な関数によって0から1の間
    の数値に正規化し、前記正規化した数値を傾き補正量の
    大小を調整する係数として利用することを特徴とする、
    コンピュータ上で動作する文字認識プログラムを記録し
    た記録媒体。
JP09116978A 1997-05-07 1997-05-07 文字認識方法、装置及び文字認識プログラムを記録した記録媒体 Expired - Fee Related JP3099771B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP09116978A JP3099771B2 (ja) 1997-05-07 1997-05-07 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
US09/071,034 US6115506A (en) 1997-05-07 1998-05-04 Character recognition method, character recognition apparatus and recording medium on which a character recognition program is recorded
EP98108255A EP0877335B1 (en) 1997-05-07 1998-05-06 Character recognition method, character recognition apparatus
AU64764/98A AU753499B2 (en) 1997-05-07 1998-05-06 Character recognition method, character recognition apparatus and recording medium on which a character recognition program is recorded
DE69831032T DE69831032T2 (de) 1997-05-07 1998-05-06 Verfahren und Vorrichtung zur Zeichenerkennung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09116978A JP3099771B2 (ja) 1997-05-07 1997-05-07 文字認識方法、装置及び文字認識プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH10307889A JPH10307889A (ja) 1998-11-17
JP3099771B2 true JP3099771B2 (ja) 2000-10-16

Family

ID=14700472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09116978A Expired - Fee Related JP3099771B2 (ja) 1997-05-07 1997-05-07 文字認識方法、装置及び文字認識プログラムを記録した記録媒体

Country Status (5)

Country Link
US (1) US6115506A (ja)
EP (1) EP0877335B1 (ja)
JP (1) JP3099771B2 (ja)
AU (1) AU753499B2 (ja)
DE (1) DE69831032T2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3196755B2 (ja) 1999-02-23 2001-08-06 日本電気株式会社 文字の傾き検出補正方法ならびに装置
US7119923B1 (en) * 1999-07-23 2006-10-10 Fuji Photo Film Co., Ltd. Apparatus and method for image processing
US7031553B2 (en) 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US6823084B2 (en) 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
AU2001293001A1 (en) * 2000-09-22 2002-04-02 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
JP3554271B2 (ja) * 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
US6721452B2 (en) 2001-09-12 2004-04-13 Auburn University System and method of handwritten character recognition
US8189961B2 (en) * 2010-06-09 2012-05-29 Microsoft Corporation Techniques in optical character recognition
KR101905426B1 (ko) * 2012-01-11 2018-10-10 한국전자통신연구원 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템
JP5821994B2 (ja) * 2014-04-21 2015-11-24 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
JP6624877B2 (ja) * 2015-10-15 2019-12-25 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
KR102622349B1 (ko) * 2018-04-02 2024-01-08 삼성전자주식회사 전자 장치 및 그 제어 방법

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59153268A (ja) * 1983-02-22 1984-09-01 Nec Corp 手書き文字認識方式
JPS6249593A (ja) * 1985-08-29 1987-03-04 Ricoh Co Ltd 文字認識装置
JPS6333195A (ja) * 1986-07-26 1988-02-12 Kobe Steel Ltd ろう付用高耐蝕性、高強度アルミニウム合金複合材
US4941189A (en) * 1987-02-25 1990-07-10 Lundy Electronics & Systems, Inc. Optical character reader with skew recognition
JPS6482286A (en) * 1987-09-25 1989-03-28 Toshiba Corp Image inclination detector
JPH03225578A (ja) * 1990-01-31 1991-10-04 Toshiba Corp 文字の検切り方法
US5101439A (en) * 1990-08-31 1992-03-31 At&T Bell Laboratories Segmentation process for machine reading of handwritten information
JPH04276888A (ja) * 1991-03-04 1992-10-01 Sumitomo Electric Ind Ltd 文字読取装置
US5452374A (en) * 1992-04-06 1995-09-19 Ricoh Corporation Skew detection and correction of a document image representation
JP3253356B2 (ja) * 1992-07-06 2002-02-04 株式会社リコー 文書画像の領域識別方法
JP3013618B2 (ja) * 1992-08-07 2000-02-28 株式会社デンソー サイン認識装置
JPH0668304A (ja) * 1992-08-17 1994-03-11 Fujitsu Ltd 手書き文字正規化方式
JPH0668302A (ja) * 1992-08-19 1994-03-11 Fujitsu Ltd 傾き正規化装置
GB2273383A (en) * 1992-12-10 1994-06-15 Ibm Character recognition
US5583956A (en) * 1993-01-12 1996-12-10 The Board Of Trustees Of The Leland Stanford Junior University Estimation of skew angle in text image
JPH0737103A (ja) * 1993-07-23 1995-02-07 Olympus Optical Co Ltd 傾き角度検出装置
JPH07192088A (ja) * 1993-12-27 1995-07-28 Toshiba Corp 画像処理方法及び装置
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
JPH07311814A (ja) * 1994-05-18 1995-11-28 Oki Electric Ind Co Ltd 文書画像傾き角推定方法
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
US5668891A (en) * 1995-01-06 1997-09-16 Xerox Corporation Methods for determining font attributes of characters
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms

Also Published As

Publication number Publication date
EP0877335B1 (en) 2005-08-03
AU6476498A (en) 1998-11-12
JPH10307889A (ja) 1998-11-17
AU753499B2 (en) 2002-10-17
EP0877335A3 (en) 2000-02-23
EP0877335A2 (en) 1998-11-11
DE69831032D1 (de) 2005-09-08
DE69831032T2 (de) 2006-07-13
US6115506A (en) 2000-09-05

Similar Documents

Publication Publication Date Title
US10552705B2 (en) Character segmentation method, apparatus and electronic device
US6674919B1 (en) Method for determining the skew angle of a two-dimensional barcode
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
EP1598770B1 (en) Low resolution optical character recognition for camera acquired documents
CN109118473B (zh) 基于神经网络的角点检测方法、存储介质与图像处理系统
JP2002516440A (ja) 画像認識および相関システム
US9613299B2 (en) Method of identifying pattern training need during verification of recognized text
JP3099771B2 (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JP3121717B2 (ja) テキスト中の未知テキスト要素を識別する方法およびテキスト中のキーワードの所在を突き止める方法
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
JP3428494B2 (ja) 文字認識装置及びその文字認識方法並びにその制御プログラムを記録した記録媒体
JP3099797B2 (ja) 文字認識装置
JP3248965B2 (ja) 2値化しきい値決定装置
JP3781324B2 (ja) 画像位置合わせ方法、ファックス文字認識方法および記録媒体
CN115578729B (zh) 数字员工ai智能流程编排方法
CN111161247B (zh) 用于可变码识读字符质量验证的检测方法
JPH11338975A (ja) 文字切り出し処理方式および文字切り出し処理プログラムを記録した記録媒体
JP4094359B2 (ja) 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム
JPH0581471A (ja) 画像上の文字の配列方向判定方法
JP3196755B2 (ja) 文字の傾き検出補正方法ならびに装置
JP3712825B2 (ja) 画像処理方法、装置および記録媒体
JP3006823B2 (ja) 文字および単語の認識方式
JP3046532B2 (ja) 物体の認識方法
CN116453145A (zh) 图片内容识别方法及装置
CN117237960A (zh) 一种文本校正方法、计算机可读存储介质

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000718

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070818

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080818

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080818

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090818

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090818

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100818

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110818

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110818

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120818

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130818

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees