JPH10187884A - 文字認識装置および記録媒体 - Google Patents

文字認識装置および記録媒体

Info

Publication number
JPH10187884A
JPH10187884A JP8350278A JP35027896A JPH10187884A JP H10187884 A JPH10187884 A JP H10187884A JP 8350278 A JP8350278 A JP 8350278A JP 35027896 A JP35027896 A JP 35027896A JP H10187884 A JPH10187884 A JP H10187884A
Authority
JP
Japan
Prior art keywords
recognition
noise
character
image
original image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8350278A
Other languages
English (en)
Inventor
Noriyuki Osuga
典之 大須賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP8350278A priority Critical patent/JPH10187884A/ja
Publication of JPH10187884A publication Critical patent/JPH10187884A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 活字、もしくは手書きの文字を含む画像デー
タから、文字部分を切り出し、文字認識を行って文字コ
ードに変換する文字認識装置において、ノイズ除去によ
る誤認識を防いで認識精度の高い文字認識を行い得るよ
うにする。 【解決手段】 制御部30は入力された原画像を原画像
認識部50に送る。また、ノイズ除去部40が入力され
た原画像のノイズを除去し、制御部30がノイズ除去さ
れた画像をノイズ除去画像認識部60に送る。原画像認
識部50、ノイズ除去画像認識部60では、それぞれ認
識用辞書70を参照しながら文字認識を行い、認識候補
を生成し認識候補生成部80に送る。認識候補生成部8
0は、原画像認識部50、ノイズ除去画像認識部60か
ら送られてきたそれぞれの候補を統合して最終的な認識
候補を生成し、ディスプレイ装置90に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字の画像データ
を文字コードに変換する文字認識装置に関する。
【0002】
【従来の技術】光学的読み取り装置(以下、スキャナと
呼ぶ)等から入力された活字、もしくは手書きの文字を
含む画像データから、文字部分を切り出し、文字認識を
行って文字コードに変換する文字認識装置において、文
字認識の精度を向上させる上で問題になることとして、
もとの画像データに含まれる文字以外のノイズをいかに
除去するかという問題がある。
【0003】ノイズ除去の手法としては、画像データの
中から孤立点を探し、その孤立点の大きさがある値以下
であれば、その孤立点をノイズと見なして除去する方法
がある。また、あるドットの近傍の領域の黒点数をカウ
ントし、黒点の数がある数以下であれば、そのドット自
体も黒点ではないとする方法もある。これらの手法によ
り、入力された画像データからノイズを除去し、ノイズ
除去した後の画像に対して文字認識を行うことにより、
ノイズ除去せずに文字認識を行ったときよりも認識率を
向上させることができる。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
たような装置では、ノイズ除去した画像に対し文字認識
を行うため、ノイズ除去が正しく行われないと、かえっ
て誤認識してしまうことがある。
【0005】例えば、図1(a)のように「犬」という
文字が入力されたとする。これを、孤立点の大きさが小
さいときにその孤立点をノイズと見なしてノイズ除去の
処理を行うと、図1(b)のようになる。つまり、
「犬」の右上の点が小さかったために、ノイズと間違え
て点を消してしまい、「大」のようになってしまったの
である。図1(b)の画像を文字認識すると、例えば、
「大、六、木」のような認識候補が得られ、正解である
「犬」が候補の中に入らないことがある。図1(a)の
ノイズ除去する前の画像を文字認識すれば、例えば、
「犬、大、R」のような認識候補が得られ、正解である
「犬」が第1候補となる可能性が高い。このように、ノ
イズ除去の処理を行ったために、正しく認識できなくな
るということがある。
【0006】本発明は、上述した問題点を解決するため
になされたものであり、活字、もしくは手書きの文字を
含む画像データから、文字部分を切り出し、文字認識を
行って文字コードに変換する文字認識装置において、ノ
イズ除去による誤認識を防いで認識精度の高い文字認識
を行うことができることを目的としている。
【0007】
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の文字認識装置は、画像デ
ータから文字以外のノイズを除去するためのノイズ除去
手段と、前記ノイズ除去手段でノイズ除去される前の原
画像を認識する原画像認識手段と、前記ノイズ除去手段
でノイズ除去された後のノイズ除去画像を認識するノイ
ズ除去画像認識手段と、前記原画像認識手段及び前記ノ
イズ除去画像認識手段から出力された認識候補を統合し
て、新たな認識候補を生成する認識候補生成手段とを備
えている。
【0008】上記の構成を有する請求項1に記載の文字
認識装置は、文字の画像データが入力されると、前記ノ
イズ除去手段がノイズ処理を行い、ノイズ除去前の画像
を前記原画像認識手段に、ノイズ除去後の画像を前記ノ
イズ除去画像認識手段に送る。原画像認識手段とノイズ
除去画像認識手段とは、それぞれで認識処理を行い、得
られた認識候補を前記認識候補生成手段に送る。認識候
補生成手段は、それぞれの認識候補を受け取ると、両方
の認識候補を統合して、最終的な認識候補を作成する。
【0009】また、請求項2に記載の文字認識装置は、
前記認識候補生成手段が、前記原画像認識手段及び前記
ノイズ除去画像認識手段から出力されたそれぞれの認識
候補に対して、その候補の有効性に応じた認識スコアに
よって重みづけし、かつ、それぞれの認識候補の認識ス
コアを算術演算して新たな認識スコアを算出し、新たな
認識スコアに従って新たな認識候補を生成する。
【0010】また、請求項3に記載の文字認識装置は、
前記ノイズ除去手段が、異なるノイズ除去手法により原
画像から複数個のノイズ除去画像を生成し、前記ノイズ
除去画像認識手段は、複数個のノイズ除去画像それぞれ
に対して文字認識を行う。
【0011】さらに、請求項4に記載の文字認識装置
は、前記ノイズ除去手段が、同一もしくは異なるノイズ
除去手法を原画像に繰り返し適用することにより複数個
のノイズ除去画像を生成し、前記ノイズ除去画像認識手
段は複数個のノイズ除去画像それぞれに対して文字認識
を行う。
【0012】また、さらに、請求項5に記載の記録媒体
は、活字、もしくは手書きの文字を含む画像データか
ら、文字部分を切り出し、文字以外のノイズを除去して
から文字認識を行って文字コードに変換する文字認識装
置を動作させるためのプログラムを格納した記録媒体で
あって、ノイズ除去される前の原画像データを認識する
原画像認識プログラムと、ノイズ除去された後のノイズ
除去画像データを認識するノイズ除去画像認識プログラ
ムと、それら両認識プログラムが実行されることにより
得られた認識候補を統合して新たな認識候補を生成する
認識候補生成プログラムとを格納している。
【0013】この記録媒体によれば、その内容をパーソ
ナルコンピュータ等の情報処理装置内にインストールす
ることにより、請求項1に記載の文字認識装置を構成で
きる。記録媒体としては、フレキシブルディスクが考え
られるが、これに限らず、例えばCD−ROM等であっ
てもよい。
【0014】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0015】本実施例の文字認識装置の概略的構成を示
すブロック図を図2に示す。図2に示すように、スキャ
ナ10が、1文字の画像データの切り出しを行う文字切
り出し部20に接続されている。文字切り出し部20
は、データ転送等の制御を行う制御部30に接続されて
いる。制御部30は原画像認識手段である原画像認識部
50と、ノイズ除去画像認識手段であるノイズ除去画像
認識部60にそれぞれ接続されている。さらに、原画像
認識部50と、ノイズ除去画像認識部60は、ともに文
字認識の際に参照する認識用辞書70に接続されてい
る。また、制御部30は、画像データから文字以外のノ
イズを除去するノイズ除去手段であるノイズ除去部4
0、原画像認識部50とノイズ除去画像認識部60から
送られてきた認識候補を統合して最終的な認識候補を生
成する認識候補生成手段である認識候補生成部80を含
んでいる。そして、制御部30はディスプレイ装置90
に接続されている。
【0016】上記のように構成された文字認識装置にお
いて、スキャナ10により文字画像が入力されると、文
字切り出し部20が1文字の画像データ(原画像)を切
り出して制御部30に送り、制御部30は、入力された
原画像を原画像認識部50に送る。また、ノイズ除去部
40が入力された原画像のノイズを除去し、制御部30
がノイズ除去された画像をノイズ除去画像認識部60に
送る。原画像認識部50、ノイズ除去画像認識部60で
はそれぞれ、認識用辞書70を参照しながら文字認識を
行い、認識候補を生成し認識候補生成部80に送る。認
識候補生成部80は、原画像認識部50、ノイズ除去画
像認識部60から送られてきたそれぞれの候補を統合し
て最終的な認識候補を生成し、ディスプレイ装置90に
表示する。
【0017】次に、文字切り出し部20により切り出さ
れた1文字の画像データが図1(a)であった場合を例
にして、図3のフローチャートを用いて本発明の動作を
説明する。
【0018】まず、ステップ1(以下、S1と略称す
る。他のステップも同様)で、スキャナ10から画像を
入力する。次に、S2で、入力した画像から1文字の画
像データを切り出す。このときの画像データ(原画像)
が図1(a)であったとする。S3で、原画像を原画像
認識部50に送り、それと同時に、S6で、ノイズ除去
部40が原画像のノイズを除去する。S3からS5まで
の処理と、S6からS9までの処理は並行して行うこと
ができる。S3で原画像が原画像認識部50に送られた
後、S4で、原画像認識部50が認識用辞書70を参照
しながら原画像の文字認識を行い、S5で、文字認識の
結果得られた認識候補を認識候補生成部80に送る。図
1(a)の例では、S4で、図1(a)の原画像を文字
認識した結果、「犬、大、R」という候補が得られたと
する。文字認識のときに得られる候補の確からしさを示
す認識スコアが、それぞれ「10、3、1」であったと
する。
【0019】なお、この認識スコアは認識する画像から
抽出した特徴と、認識用辞書70に格納された各文字の
標準的な特徴とを比較して得られる数値から算術演算し
て得られる値であり、大きな値ほど候補が確からしいこ
とを示している。S5で、認識候補と認識スコアとをペ
アにして、「犬(10)、大(3)、R(1)」という
認識候補を認識候補生成部80に送る。
【0020】一方、S6でノイズ除去した後、S7で、
ノイズ除去した画像をノイズ除去画像認識部60に送
る。S8で、ノイズ除去画像認識部60が認識用辞書7
0を参照しながらノイズ除去画像の文字認識を行い、S
9で、文字認識の結果得られた認識候補を認識候補生成
部80に送る。図1(a)の例では、S6でノイズ除去
した後に得られた画像が図1(b)であったとする。S
7で図1(b)の画像をノイズ除去画像認識部60に送
り、S8で、文字認識した結果、「大(6)、六
(2)、木(1)」という認識候補が得られたとする。
かっこ内の数字は上述した認識スコアである。S9で、
この認識候補を認識候補生成部80に送る。
【0021】次に、S10で、認識候補生成部80が、
原画像認識部50とノイズ除去画像認識部60から送ら
れてきた認識候補を統合して、最終的な認識候補を生成
して、S11で、その認識候補をディスプレイ装置90
に出力する。最後にS12で、スキャナから入力された
画像の中で、まだ文字認識していない領域があるかどう
か調べ、もしあれば、S2に戻って、1文字の画像デー
タを切り出し、上記の動作を繰り返す。図1の例では、
S10で、原画像認識部50から送られてきた認識候補
「犬(10)、大(3)、R(1)」と、ノイズ除去画
像認識部60から送られてきた認識候補「大(6)、六
(2)、木(1)」とを統合するのであるが、ここでは
単純に、認識スコアを加算することにする。同じ文字の
認識スコアを加算し、新たな認識スコアを算出し、新た
な認識スコアの大きい順に並べると、「犬(10)、大
(9)、六(2)、木(1)、R(1)」となる、S1
1で、上位3候補を出力するとすると、「犬、大、六」
という認識候補がディスプレイ装置90に出力されるこ
とになる。
【0022】このように、ノイズ除去した画像を文字認
識した結果だけを出力すると、「大、六、木」となり、
正解候補「犬」が含まれないが、本実施例では、ノイズ
除去する前の画像を文字認識した結果も考慮して、
「犬、大、六」という候補を出力しているので、ノイズ
除去による誤認識を防ぐことができる。
【0023】ところで、本実施例では、原画像の文字認
識と、ノイズ除去画像の文字認識を並行して行う例を説
明したが、原画像の文字認識が終わってから、ノイズ除
去をして、ノイズ除去画像の文字認識をするようにして
も良い。そのようにすれば、原画像認識部50と、ノイ
ズ除去画像認識部60とは、共通の文字認識部として一
つにまとめることができる。なお、制御部30、原画像
認識部50、ノイズ除去部40、ノイズ除去画像認識部
60、認識候補生成部80は、それぞれ専用の回路とし
て実現しても良いし、例えば、読み出し専用メモリ(R
OM)上に記憶されたプログラムとして実現して、マイ
クロプロセッサによって各プログラムを実行するように
しても良い。
【0024】あるいは、各機能を実現するためのプログ
ラムを、フレキシブルディスクやCD−ROM等の記録
媒体に格納しておき、その内容をパーソナルコンピュー
タ等の情報処理装置にインストールすることにより、文
字認識装置としての機能を発揮させるようにすることも
可能である。これによっても、上記実施例と同様の効果
を享受できる。
【0025】また、上記実施例では、最終的な認識候補
を生成するときに、それぞれの候補の認識スコアを加算
したが、他の演算によって新たな認識スコアを算出して
も良い。
【0026】さらに、上記実施例では認識候補を上位3
候補まで表示するようにしたが、最初は第1候補のみ表
示しておいて、使用者が次候補の表示を指示したとき
に、次候補以降を表示するようにしても良い。また、本
実施例では、認識候補の数を3候補までとしたが、記憶
領域に余裕がある場合は、候補の数をもっと増やしても
良い。
【0027】また、さらに、上記実施例では、1種類の
ノイズ除去しか行っていないが、異なるノイズ除去の手
法を用いて、原画像からそれぞれノイズ除去し、複数個
のノイズ除去画像を生成して、それぞれで文字認識を行
い、最終的に、原画像の文字認識結果と、複数個のノイ
ズ除去画像の文字認識結果とを統合しても良い。
【0028】また、上記実施例では、ノイズ除去を1度
しか行っていないが、同一もしくは異なるノイズ除去手
法を原画像に繰り返し適用することにより、途中経過の
画像を含めて複数個のノイズ除去画像を生成し、それぞ
れで文字認識を行い、最終的に、原画像の文字認識結果
と、複数個のノイズ除去画像の文字認識結果とを統合し
ても良い。
【0029】
【発明の効果】以上説明したことから明らかなように、
本発明の請求項1に記載の文字認識装置によれば、ノイ
ズ除去される前の画像を文字認識した結果と、ノイズ除
去した後の画像を文字認識した結果とを統合して、最終
的な文字認識候補を生成するので、ノイズ除去による誤
認識を防ぎ、より高い認識精度を得ることができる。
【0030】また、請求項2に記載の文字認識装置によ
れば、候補の有効性に応じて認識スコアをつけているの
で、より有効性の高い認識候補を得ることができる。
【0031】また、請求項3に記載の文字認識装置によ
れば、異なるノイズ除去手法を用いて複数個のノイズ除
去画像を生成し、それぞれで文字認識を行って、最終結
果に反映させるので、より精度が高く、誤認識の少ない
ノイズ除去を実現できる。
【0032】さらに、請求項4に記載の文字認識装置に
よれば、同一もしくは異なるノイズ除去手法を繰り返し
適用して、その途中経過を含めたノイズ除去画像を生成
し、それぞれで文字認識を行って、最終結果に反映させ
るので、ノイズがひどくて一度のノイズ除去処理だけで
はノイズが除去できない場合にも、高い認識精度を得る
ことができる。
【0033】また、さらに、請求項5に記載の記録媒体
によれば、その内容をパーソナルコンピュータ等の情報
処理装置内にインストールすることにより、請求項1に
記載の文字認識装置を構成できる。なお、記録媒体とし
ては、フレキシブルディスクが考えられるが、これに限
らず、例えばCD−ROM等であってもよい。
【図面の簡単な説明】
【図1】入力された1文字の画像データの一例を示す図
であり、(a)はノイズ除去する前の画像、(b)はノ
イズ除去した後の画像を示す図である。
【図2】本発明を具体化した一実施例の文字認識装置の
構成を示すブロック図である。
【図3】本実施例の動作を示すフローチャートである。
【符号の説明】
10 スキャナ 40 ノイズ除去部(ノイズ除去手段) 50 原画像認識部(原画像認識手段) 60 ノイズ除去画像認識部(ノイズ除去画像認識手
段) 80 認識候補生成部(認識候補生成手段) 90 ディスプレイ装置

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 活字、もしくは手書きの文字を含む画像
    データから、文字部分を切り出し、文字認識を行って文
    字コードに変換する文字認識装置において、 前記画像データから文字以外のノイズを除去するための
    ノイズ除去手段と、前記ノイズ除去手段でノイズ除去さ
    れる前の原画像を認識する原画像認識手段と、前記ノイ
    ズ除去手段でノイズ除去された後のノイズ除去画像を認
    識するノイズ除去画像認識手段と、前記原画像認識手段
    及び前記ノイズ除去画像認識手段から出力された認識候
    補を統合して、新たな認識候補を生成する認識候補生成
    手段とを備えていることを特徴とする文字認識装置。
  2. 【請求項2】 前記認識候補生成手段は、前記原画像認
    識手段及び前記ノイズ除去画像認識手段から出力された
    それぞれの認識候補に対して、その候補の有効性に応じ
    た認識スコアによって重みづけし、かつ、それぞれの認
    識候補の認識スコアを算術演算して新たな認識スコアを
    算出し、新たな認識スコアに従って新たな認識候補を生
    成することを特徴とする請求項1に記載の文字認識装
    置。
  3. 【請求項3】 前記ノイズ除去手段は、異なるノイズ除
    去手法により原画像から複数個のノイズ除去画像を生成
    し、前記ノイズ除去画像認識手段は複数個のノイズ除去
    画像それぞれに対して文字認識を行うことを特徴とする
    請求項1または2に記載の文字認識装置。
  4. 【請求項4】 前記ノイズ除去手段は、同一もしくは異
    なるノイズ除去手法を原画像に繰り返し適用することに
    より複数個のノイズ除去画像を生成し、前記ノイズ除去
    画像認識手段は複数個のノイズ除去画像それぞれに対し
    て文字認識を行うことを特徴とする請求項1または2に
    記載の文字認識装置。
  5. 【請求項5】 活字、もしくは手書きの文字を含む画像
    データから、文字部分を切り出し、文字以外のノイズを
    除去してから文字認識を行って文字コードに変換する文
    字認識装置を動作させるためのプログラムを格納した記
    録媒体において、 ノイズ除去される前の原画像データを認識する原画像認
    識プログラムと、 ノイズ除去された後のノイズ除去画像データを認識する
    ノイズ除去画像認識プログラムと、 それら両認識プログラムが実行されることにより得られ
    た認識候補を統合して新たな認識候補を生成する認識候
    補生成プログラムとを格納していることを特徴とする記
    録媒体。
JP8350278A 1996-12-27 1996-12-27 文字認識装置および記録媒体 Pending JPH10187884A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8350278A JPH10187884A (ja) 1996-12-27 1996-12-27 文字認識装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8350278A JPH10187884A (ja) 1996-12-27 1996-12-27 文字認識装置および記録媒体

Publications (1)

Publication Number Publication Date
JPH10187884A true JPH10187884A (ja) 1998-07-21

Family

ID=18409417

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8350278A Pending JPH10187884A (ja) 1996-12-27 1996-12-27 文字認識装置および記録媒体

Country Status (1)

Country Link
JP (1) JPH10187884A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017104805A1 (ja) * 2015-12-18 2017-06-22 国立大学法人東京農工大学 プログラム、情報記憶媒体及び文字列認識装置
JP2019139384A (ja) * 2018-02-07 2019-08-22 グローリー株式会社 文字認識システム、文字認識プログラム、文字認識方法、文字認識結果の表示装置、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP2020197915A (ja) * 2019-06-03 2020-12-10 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017104805A1 (ja) * 2015-12-18 2017-06-22 国立大学法人東京農工大学 プログラム、情報記憶媒体及び文字列認識装置
JPWO2017104805A1 (ja) * 2015-12-18 2018-10-04 国立大学法人東京農工大学 プログラム、情報記憶媒体及び文字列認識装置
JP2019139384A (ja) * 2018-02-07 2019-08-22 グローリー株式会社 文字認識システム、文字認識プログラム、文字認識方法、文字認識結果の表示装置、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP2020197915A (ja) * 2019-06-03 2020-12-10 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
US20080069447A1 (en) Character recognition method, character recognition device, and computer product
JPH10187884A (ja) 文字認識装置および記録媒体
JPH0520794B2 (ja)
JP4718699B2 (ja) 文字認識装置、文字認識方法、プログラム、およびコンピュータ読み取り可能な記録媒体
JP3074691B2 (ja) 文字認識装置
JP3187182B2 (ja) 光学的手書き文字列認識方法および装置
JP2976445B2 (ja) 文字認識装置
JPH10307888A (ja) 表処理方法、装置および記録媒体
JP3486246B2 (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JP2838850B2 (ja) 仮名漢字変換装置
JP2001134712A (ja) 画像処理装置及び画像処理方法
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JPS5852267B2 (ja) 文字解析方式
JPH10254997A (ja) 文字認識装置
JPH10162105A (ja) 光学式文字読取装置及び光学式文字読取方法
JPH11191143A (ja) 情報処理装置及びその方法、コンピュータ可読メモリ
JPH10334190A (ja) 文字認識方法、装置および記録媒体
JP2001052111A (ja) 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
JP2002236876A (ja) 解析方法及び解析装置
JPH11203400A (ja) 文字入力装置および文字入力方法,並びに文字入力方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JPH103518A (ja) 文字認識方法,記憶媒体および文字認識装置
JPH03217993A (ja) 文字サイズ認識装置
JPH06131466A (ja) パターン認識方法および装置