JP3320083B2 - 文字認識装置及び方法 - Google Patents
文字認識装置及び方法Info
- Publication number
- JP3320083B2 JP3320083B2 JP27222891A JP27222891A JP3320083B2 JP 3320083 B2 JP3320083 B2 JP 3320083B2 JP 27222891 A JP27222891 A JP 27222891A JP 27222891 A JP27222891 A JP 27222891A JP 3320083 B2 JP3320083 B2 JP 3320083B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- value
- character recognition
- appearance frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
特に文字画像部分を文字コードにコード化する文字認識
装置及び方法に関するものである。
ト画像データとして入力する入力部と、一般的には射影
ヒストグラムを応用した文字切り出し部と、その文字の
特徴を抽出し、数値化する特徴抽出部と、予め認識辞書
に納められている標準パターンと特徴抽出部で得た入力
文字パターンとを照合して、その文字画像を認識する認
識部とから構成されている。
ズムの一つに、文字の出現頻度を認識アルゴリズム中の
識別関数に取り入れた文字認識方法が提案されている
(電子通信学会論文1985年3月22日,高階,木
村,鶴岡,三宅、2次識別関数の改良と手書き漢字認識
への応用)。この方法では、入力パターンベクトルと学
習パターンベクトルの統計的な多次元距離計算を施し、
この演算値が高ければ類似度小、低ければ類似度大と見
なしている。更に、学習されている文字種の出現頻度確
率を対数化したものを加えており、最終的な演算値から
文字を識別している。
字出現頻度を識別演算に付加する方法には、次のような
欠点があった。
定する場合、取り扱う文字種の膨大な数量から、全文字
種についての出現頻度を正確に求めることは難しい。ま
た、出現頻度がある一定値以下の文字に対して、出現確
率を0にすることは前記出現頻度確率の対数化の点で演
算値の無限大を引き起こし、正しい識別結果を判別でき
なくなる。
鑑みなされたものであり、より自然で良好な認識結果を
得ることを可能にする文字認識装置及び方法を提供しよ
うとするものである。
文字認識装置は以下の構成を備える。すなわち、入力さ
れた原稿画像中の文字記号部分を切り出し、特徴量を抽
出して、辞書と比較して距離値を求め、且つ文字の出現
頻度確率に基づいた補正値を用いて該距離値を補正する
ことによって認識演算値を得て文字を認識する文字認識
手段を有する文字認識装置であって、予め、前記辞書に
は、サンプル文字に対する出現頻度個数が所定の値未満
の認識候補文字に対しては、予め設定した正の定数値を
出現頻度確率として格納しておき、サンプル文字に対す
る出現頻度個数が該所定の値以上の認識候補文字に対し
ては、前記出現頻度個数とサンプル文字数とから算出し
た値を出現頻度確率として格納しておき、入力された文
字記号部分の特徴量、前記辞書及び前記出現頻度確率に
基づいて文字認識することを特徴とする。
を詳細に説明する。
ック構成図を示す。同図において、101は文字認識装
置全体の制御を司るCPU、102はCPU101の処
理動作プログラム(後述する図2,図3で示される識別
演算フローチャートにかかるプログラム等)が格納され
ているROM、103はCPU101のワークエリアと
して使用されるRAMである。104は光学的に文書を
読みとるスキャナなどの読取部で、読み取られた文書は
画像データとして画像メモリ105に格納される。
メージデータ中より切り出された入力文字を認識する認
識部、107は認識処理の際、参照する学習文字の特徴
パラメータと各文字種の出現頻度を守り込んだ認識辞書
である。
を識別演算式に導入した論理式(前記電子通信学会論文
より抜粋)である。この式の右辺第1項と第2項をまと
め、この式を簡潔に表すと、次のようになる。
いる文字の平均パターンベクトルを照合させ、誤り率が
最小になるものを類似度大と見なして認識結果として出
力する手段の式である。
(W)=1として議論が進められている(すなわち、G
(x)=d(x))。
算式として用いる場合、出現頻度計算を使用する
(1)’式右辺第2項を計算する時、各文字に対する出
現頻度確率が全文字種において求められていなければな
らない。
において出現頻度を正確に推定することは難しい。
を定め、この閾値Nを下回る文字種Wni<Nついての出現
頻度確率P(Wni<N)を、 P(Wni<N)=C (C:定数) と設定する。
番号,N:出現頻度閾値である。
(X>=Yは、XはY以上を意味する)については、
率を求めることが可能となる。
分は認識辞書に含まれており、その様子を図3に示す。
この図3において、左側が実際に認識辞書の内容を示し
ており、右側が文字認識の処理行程を示している。
辞書中の文字インデックスである文字コードが格納して
あり、エリア306には該文字コードの文字特徴パラメ
ータ群が格納してある。またエリア307の部分に
(1)式の右辺第2項を計算した値が予め格納されてい
る。
4より文書画像が入力されると、ステップS301で文
字画像に相当する部分が切り出され、ステップS302
でその文字画像の特徴が抽出される。次いで、ステップ
S303において、入力文字画像の特徴と、認識辞書の
エリア306に格納されている学習文字特徴とを用いて
距離d(x)が計算される。更に、ステップS304に
おいて、エリア307の出現頻度を含んだ定数値をステ
ップS303で得られた値に加え、演算値が求める。こ
うした候補文字種全てにおいて同様の識別計算が行なわ
れ、演算結果をソーティングした後、一番演算値の低い
文字種を認識結果として出力する。
Nを下回る文字種におけるP(W ni<N)の値をC(定
数)の一つと固定したが、P(Wni<N)=Ck (k=
1,2,…)のように複数の出現頻度確率定数を用意
し、適宜選択するようにしても良い。また、実施例にお
いては、図2に示した識別関数式にマハラノビス距離を
応用した関数式を例にとったが、図1(1)′式のd
(x)はかならずしもマハラノビス系距離計算である必
要はなく、その他の距離演算式においても同様の効果を
得ることができる。これらは以下に説明する実施例にも
言える。
頻度効果を強めるため、(1)’式における右辺第2項
に(1)’式全体の重み付けを行う様にしても良い。つ
まり、 G(x)=d(x)−2・D・ln P(W) (D≧0) … (2) の式で表される様にD(定数)を設けるわけである。た
だし、この定数Dは固定でも良いが、操作者の指示によ
って可変にできることが望ましい。
になる。
は図3におけるエリア305〜307に対応している。
すなわち、エリア405には認識辞書中の文字インデッ
クスである文字コードが格納され、エリア406には該
文字コードの文字特徴パラメータ群が、エリア407の
部分には(2)式の右辺第2項を計算した値が予め格納
されている。
00〜404も図3のステップS300〜304に対応
している。説明すれば、以下の通りである。
4より文書画像が入力されると、ステップS401で文
字画像に相当する部分が切り出され、ステップS402
でその文字画像の特徴が抽出される。ステップS403
では、入力文字画像の特徴と、認識辞書のエリア406
に格納されている学習文字特徴とを用いて距離d(x)
が計算される。そして、ステップS404において、エ
リア407の出現頻度を含んだ定数値をステップS40
3で得られた値に加え、演算値が求める。こうした候補
文字種全てにおいて同様の識別計算が行なわれ、演算結
果をソーティングした後、一番演算値の低い文字種を認
識結果として出力する。
いて、右辺第2項の出現頻度導入項で、(2)式全体に
対する重み付けをDと設定したが、この出現頻度盛り込
み項の(2)式全体に対する重み付けの方法はこのDを
設定することに限らない。いずれの計算式であれ、この
右辺第2項に(2)式全体に対しての重み付けが行われ
れば良いからである。
字の出現頻度の導入を考慮したとき、全ての文字にたい
して出現頻度確率を正確に推定することが困難であり、
同時に理論的に文字の出現頻度を導入することが難しか
ったが、本第1、第2の実施例によれば、全ての文字種
において理論的に適う出現頻度確率が求まり、認識結果
としては、より文書に出現すべき文字が出力されて、認
識後の文章はよみやく、オペレータに与える印象も良く
なる。
の文字出現頻度導入項に重み付けを付加し、その重み付
けを可変にすることで、文字出現頻度の影響を段階的に
変化させ、認識結果を調整することが可能となる。
例を説明する。現在の文字認識処理装置を鑑みると、そ
の多くは、認識処理中では、単に画面の一部に認識処理
中であることを示すメッセージのみであり、実際に今ど
の文字を認識しているのかを知ることはできない。まし
てや、入力画像中に全く認識できないようなマーク等が
あった場合、そのマークの認識に費やす時間は多くな
り、そのようなマーク等が多数ある場合には全体の認識
が終了するまでにかかる時間は、通常の文字のみから成
る文書の認識と比較して長くなる。
る。
のブロック構成図を示す。同図において、501は文字
認識装置全体の制御を司るCPU、502はCPU50
1の処理動作プログラム及び認識処理に参照する辞書が
格納されているROM、503はCPU501のワーク
エリアとして使用されるRAMである。504は文書原
稿を読取るスキャナで、読取られた文書は画像データと
して画像メモリ505に格納される。506は認識結果
を出力する表示部(表示画像を展開するVRAMを有す
る)で、本発明における認識進行状況を知ると共に文書
画像を出力させる部分でもある。507はキーボード等
の入力部である。
況の表示に関する処理を説明する。尚、同時における各
処理部は実際にはCPU501が処理するものである。
り、スキャナ504から文書原稿が画像として読み取ら
れる。読み取られた画像は2値化されて文書画像データ
格納部602(画像メモリ505)に送られる。ここで
文書画像データは文書全体のレイアウトが図1の表示部
506に納まる様、文書画像変倍計算部608において
変倍処理され、その変倍画像を表示部506に転送する
ことで画面に読み込んだ画像全体が表示されるようにす
る。ここで原画像を変倍するのに用いた変倍定数をfと
する。ここでの変倍操作手順・方法は公知の技術を用い
て行うものとし、ここでの説明は割愛する。変倍された
文書画像は変倍後文書画像表示部609の処理で表示部
506に出力される。
文書ビット画像をY軸へ射影したヒストグラムの度数の
有無から文書内の行を抽出し、文書内文字座標抽出部6
04では、さらに文字の外接矩形座標を抽出する。引続
き文字特徴抽出部605において、文字矩形ワーク内の
文字画像を公知の方法により文字の特徴抽出を行い、特
徴ベクトルを得る。この特徴ベクトルを基に、識別部6
06において最終的な認識結果を得る。また認識結果は
認識結果格納部607に送られ、バッファリングされ
る。
1(x1,y1),c2(x2,y2),c3 (x3,y3),c4
(x4,y4)}が求まると、図3に示す如く、前記変倍
定数fとを掛け合わせ、変倍画像上の変倍文字座標C´
{c1´(fx1,fy1),c2´(fx2,fy2),c3´
(fx3,fy3),c4´(fx4,fy4)}を座標変換部
611で求める。尚、図3(a)が原画像の或文字の外
接矩形及びその四隅の座標を示し、同図(b)が変倍表
示された画像中の該当する文字の座標位置を示してい
る。わかりやすく説明すれば、図3(a)の座標位置が
画像メモリ505内の注目している文字の四隅の座標位
置(アドレス)を示し、同図(b)は表示部506内の
VRAMにおける座標位置(アドレス)を求めているこ
とになる。
元にその文字の認識結果が出た時点で、認識進行状況表
示部610により予め図8の表示部506に表示されて
いる変倍文書画像上に変換文字座標C´によって作られ
た文字矩形枠を出力する(図4参照)。尚、図示では文
字“が”まで文字認識が済んだことを示している。
確認できることになるが、その認識処理を中断させる様
にしても良い。理由は、例えばある文字(または行)ま
で認識処理が済めば良いという状況があったとき、適
宜、入力部507から認識を中断させる旨の指示を与
え、余分な部分の認識処理を行わせ内容にする。これに
よって、効率よく認識結果を得ることが可能になる。
ば、認識対象の文書を表示し、且つ、認識処理がどこま
で進んでいるのかを判断できるようになる。従って、レ
イアウト判断による指定の段落、行で認識を中止させる
等の割り込み処理を動作させることも可能である。
で進んでいるのかを視覚的に認識することに意義がある
ので、これ以外の表示形態であっても勿論構わない。
行矩形を参考にし、認識進行状況を行単位で視覚的に表
示させることも同様にして可能である。
ったとき、自動的に認識処理が開始されるものとして説
明したが、読み取り画像を表示し、ポインティングデバ
イス等を使用して、どこから認識を開始させるのかを指
示するようにしても良い。これを実現するためには、ポ
インティングデバイスで指示された画面上の座標と変倍
率fとで、画像メモリ505中の座標位置を逆算できる
ので問題はない。
実施例に適応させるようにしても良い。
るシステムに適用しても1つの機器から成る装置に適用
しても良い。また、本発明は、システム或は装置にプロ
グラムを供給することによつて達成される場合にも適用
できることは言うまでもない。
り自然で良好な認識結果を得ることが可能になる。
難しかった文字種に対しても、出現頻度確率を設定する
ことができる。
ある。
ある。
処理の流れ図である。
流れを示す図である。
構成図である。
明するための図である。
の座標との関係を示す図である。
Claims (8)
- 【請求項1】 入力された原稿画像中の文字記号部分を
切り出し、特徴量を抽出して、辞書と比較して距離値を
求め、且つ文字の出現頻度確率に基づいた補正値を用い
て該距離値を補正することによって認識演算値を得て文
字を認識する文字認識手段を有する文字認識装置であっ
て、予め、 前記辞書には、サンプル文字に対する出現頻度個
数が所定の値未満の認識候補文字に対しては、予め設定
した正の定数値を出現頻度確率として格納しておき、サ
ンプル文字に対する出現頻度個数が該所定の値以上の認
識候補文字に対しては、前記出現頻度個数とサンプル文
字数とから算出した値を出現頻度確率として格納してお
き、 入力された文字記号部分の特徴量、前記辞書及び前記出
現頻度確率に基づいて文字認識することを特徴とする文
字認識装置。 - 【請求項2】 前記認識候補文字の出現頻度個数が所定
の値未満の場合に出現頻度確率として用いる前記予め設
定した値は、複数の値を有し、適宜選択されることを特
徴とする請求項1に記載の文字認識装置。 - 【請求項3】 前記出現頻度確率に基づいた補正値は、
前記距離値を補正する際に重み付けされて用いられ、当
該重み付けは操作者の指示により可変であることを特徴
とする請求項1に記載の文字認識装置。 - 【請求項4】 更に、前記文字認識手段の文字認識の結
果を出力する出力手段を有することを特徴とする請求項
1に記載の文字認識装置。 - 【請求項5】 入力された原稿画像中の文字記号部分を
切り出し、特徴量を抽出して、辞書と比較して距離値を
求め、且つ文字の出現頻度確率に基づいた補正値を用い
て該距離値を補正することによって識別演算値を得て文
字認識する文字認識方法であって、予め、 前記辞書には、サンプル文字に対する出現頻度個
数が所定の値未満の認識候補文字に対しては、予め設定
した正の定数値を出現頻度確率として格納しておき、サ
ンプル文字に対する出現頻度個数が該所定の値以上の認
識候補文字に対しては、前記出現頻度個数とサンプル文
字とから算出した値を出現頻度確率として格納してお
き、 入力された文字記号部分の特徴量、前記辞書及び前記出
現頻度確率に基づいて文字認識することを特徴とする文
字認識方法。 - 【請求項6】 前記認識候補文字の出現頻度個数が所定
の値未満の場合に出現頻度確率として用いる前記予め設
定した値は、複数の値を有し、適宜選択されることを特
徴とする請求項5に記載の文字認識方法。 - 【請求項7】 前記出現頻度確率に基づいた補正値は、
前記距離値を補正する際に重み付けされて用いられ、当
該重み付けは操作者の指示により可変であることを特徴
とする請求項5に記載の文字認識方法。 - 【請求項8】 更に、前記文字認識の結果を出力するこ
とを特徴とする請求項5に記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27222891A JP3320083B2 (ja) | 1991-10-21 | 1991-10-21 | 文字認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27222891A JP3320083B2 (ja) | 1991-10-21 | 1991-10-21 | 文字認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05108884A JPH05108884A (ja) | 1993-04-30 |
JP3320083B2 true JP3320083B2 (ja) | 2002-09-03 |
Family
ID=17510905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27222891A Expired - Fee Related JP3320083B2 (ja) | 1991-10-21 | 1991-10-21 | 文字認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3320083B2 (ja) |
-
1991
- 1991-10-21 JP JP27222891A patent/JP3320083B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
「電子通信学会研究技術報告 PRL84−98」Vol.84 No.323 P.41−48(1985)"2次識別関数の改良と手書き漢字認識への応用" |
Also Published As
Publication number | Publication date |
---|---|
JPH05108884A (ja) | 1993-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4607633B2 (ja) | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 | |
EP0439951B1 (en) | Data processing | |
JP2940496B2 (ja) | パタンマッチング符号化装置及び方法 | |
JPH08305803A (ja) | 文字テンプレートセット学習マシン動作方法 | |
EP0576020B1 (en) | Character recognizing method and apparatus | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP3320083B2 (ja) | 文字認識装置及び方法 | |
JPH11272800A (ja) | 文字認識装置 | |
US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
EP3832544A1 (en) | Visually-aware encodings for characters | |
JP3548234B2 (ja) | 文字認識方法及び装置 | |
JP2000322514A (ja) | パターン抽出装置及び文字切り出し装置 | |
JP2740506B2 (ja) | 画像認識方法 | |
JPH08147314A (ja) | 認識型文書ファイリング装置及びその制御方法 | |
JP2812391B2 (ja) | パターン処理方法 | |
JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
JP2001338263A (ja) | 画像処理装置及び画像処理方法並びに記憶媒体 | |
JP3182694B2 (ja) | 図形編集方法および装置 | |
JPH0216068A (ja) | 像形成装置 | |
JP2976990B2 (ja) | 文字認識装置 | |
JP3757686B2 (ja) | 文字データ生成装置と文字出力装置 | |
JPH10214308A (ja) | 文字判別方法 | |
JPH10247221A (ja) | オンライン文字認識装置 | |
JPH03217993A (ja) | 文字サイズ認識装置 | |
JP2001344567A (ja) | 文字認識装置、その方法およびその方法を実施するためのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20000922 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080621 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090621 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090621 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100621 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110621 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |