JPS63237182A - 文字切出し方法 - Google Patents
文字切出し方法Info
- Publication number
- JPS63237182A JPS63237182A JP62071079A JP7107987A JPS63237182A JP S63237182 A JPS63237182 A JP S63237182A JP 62071079 A JP62071079 A JP 62071079A JP 7107987 A JP7107987 A JP 7107987A JP S63237182 A JPS63237182 A JP S63237182A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- width
- pattern
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 9
- 238000005520 cutting process Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 3
- 239000000872 buffer Substances 0.000 abstract description 9
- 238000000605 extraction Methods 0.000 description 11
- 238000010606 normalization Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000002411 adverse Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔技術分野〕
本発明は、文字認識装置における文字切出し方法に関す
る。
る。
従来、文字認識装置においては、行画像を切出し、その
垂直射影により行画像から文字のイメージを切り出して
いる。そして、日本語の認識を行う装置においては、「
い」、1月、「川」、「情」、「報」のように分離した
複数のパターンからなる文字があるため、垂直射影によ
り抽出したパターンを順次連結することにより、適切な
幅の連結パターン群を1文字のイメージとして切出して
いる。
垂直射影により行画像から文字のイメージを切り出して
いる。そして、日本語の認識を行う装置においては、「
い」、1月、「川」、「情」、「報」のように分離した
複数のパターンからなる文字があるため、垂直射影によ
り抽出したパターンを順次連結することにより、適切な
幅の連結パターン群を1文字のイメージとして切出して
いる。
しかし、文字の構成パターン以外のノイズパターンがそ
のまN文字イメージの一部として切出され、認識処理に
先立つ文字イメージの大きさのIF規化処理で、ノイズ
パターンが強調される結果、認識エラーが生じるという
問題があった。
のまN文字イメージの一部として切出され、認識処理に
先立つ文字イメージの大きさのIF規化処理で、ノイズ
パターンが強調される結果、認識エラーが生じるという
問題があった。
本発明の目的は、手書き漢字などの文字認識装置におい
て、ノイズの多い原稿の文字イメージを正確に切出すこ
とができる文字切出し方法を提供することにある。
て、ノイズの多い原稿の文字イメージを正確に切出すこ
とができる文字切出し方法を提供することにある。
本発明は1行画像からその垂直射影により分離したパタ
ーンを抽出し、抽出したパターンを順次連結して連結幅
が所定の最大文字幅を越える直前のパターンまでの連結
パターン群を1文字のイメージとして切出すが、ノイズ
の影響を排除するため、切出したイメージの最後のパタ
ーンの幅が所定の最小幅に達しない場合は当該最後のパ
ターンをノイズとして除去し、その直前のパターンまで
を改めて1文字のイメージとして切出すことを特徴とす
る。
ーンを抽出し、抽出したパターンを順次連結して連結幅
が所定の最大文字幅を越える直前のパターンまでの連結
パターン群を1文字のイメージとして切出すが、ノイズ
の影響を排除するため、切出したイメージの最後のパタ
ーンの幅が所定の最小幅に達しない場合は当該最後のパ
ターンをノイズとして除去し、その直前のパターンまで
を改めて1文字のイメージとして切出すことを特徴とす
る。
以下、図面を参照し本発明の一実施例について説明する
。
。
第1図は、本発明に係る文字認識装置の概略構成図であ
る。1はイメージスキャナなどから入力される2値の原
稿画像情報から行の画像を切出す行切出し部、2は行切
出し部1により切出された行画像情報を蓄積する行切出
しバッファ、3は行画像情報の垂直射影を作成する垂直
射影作成部である。
る。1はイメージスキャナなどから入力される2値の原
稿画像情報から行の画像を切出す行切出し部、2は行切
出し部1により切出された行画像情報を蓄積する行切出
しバッファ、3は行画像情報の垂直射影を作成する垂直
射影作成部である。
4は行画像から文字イメージを切出すと−もに文字イメ
ージの幅および高さの正規化を行う文字切出し正規化部
である。この実施例においては。
ージの幅および高さの正規化を行う文字切出し正規化部
である。この実施例においては。
この文字切出しIE規化部4は、マイクロプロセッサ5
、処理のためのプログラムおよびデータを格納するメモ
リ6および文字バッファ7からなる。
、処理のためのプログラムおよびデータを格納するメモ
リ6および文字バッファ7からなる。
8は文字認識部であり、これは文字バッファ7から文字
イメージを読込み、その特徴と辞書の特徴とを比較する
ことにより1文字認識を行う。
イメージを読込み、その特徴と辞書の特徴とを比較する
ことにより1文字認識を行う。
次に文字切出し正規化部4の処理を説明する。
第2図は、その処理の概略フローチャー1−である。
行切出し部1から1行分の行切出しの終了が割込みなど
によって文字切出し正規化部4に通知されると、以下の
処理が開始する。
によって文字切出し正規化部4に通知されると、以下の
処理が開始する。
まず、マイクロプロセッサ5はレジスタBとカウンタn
をクリアする(ステップ0))。
をクリアする(ステップ0))。
次にマイクロプロセッサ5は垂直射影作成部3から行の
最初のパターンPnの射影幅bnを読込み、レジスタB
の値に加える(ステップ■)。
最初のパターンPnの射影幅bnを読込み、レジスタB
の値に加える(ステップ■)。
マイクロプロセッサ5はレジスタBの値と予め設定した
最大文字幅りとの比較判定を行う(ステップ■)、B(
Lの場合、当該パターンPnに続くスペース部分の幅W
nを垂直射影作成部3から読込み、レジスタBの値に加
え(ステップ■)。
最大文字幅りとの比較判定を行う(ステップ■)、B(
Lの場合、当該パターンPnに続くスペース部分の幅W
nを垂直射影作成部3から読込み、レジスタBの値に加
え(ステップ■)。
カウンタ1、をインクリメントしくステップ■)、ステ
ップ■に戻り、次のパターンPnの幅bnを読込みレジ
スタBの値に加え、以下同様の処理を行う。
ップ■に戻り、次のパターンPnの幅bnを読込みレジ
スタBの値に加え、以下同様の処理を行う。
このようにして、垂直射影により抽出されたパターンが
順次連結され、その連結幅が最大文字幅りを越えB≧L
になると、処理はステップ■からステップ■に分岐する
。
順次連結され、その連結幅が最大文字幅りを越えB≧L
になると、処理はステップ■からステップ■に分岐する
。
マイクロプロセッサ5は連結したパターン群の最後の一
つ前までのパターンP、からPn−□の範囲の画像情報
を1文字のイメージとして行切出しバッファ2から切出
す(ステップ■)6次に切出した最後のパターンP。−
0の幅bn−□と、予め決定したノイズ以外の有効パタ
ーンの最小幅αとの比較判定を行う(ステップCI))
。bn−x≧Qの場合、最後のパターンP。−4は有効
パターンであるので、切出した文字イメージをそのまへ
最終的な切出し結果とし、正規化処理(ステップ■)を
・施したのち文字バッファ7に書出す。
つ前までのパターンP、からPn−□の範囲の画像情報
を1文字のイメージとして行切出しバッファ2から切出
す(ステップ■)6次に切出した最後のパターンP。−
0の幅bn−□と、予め決定したノイズ以外の有効パタ
ーンの最小幅αとの比較判定を行う(ステップCI))
。bn−x≧Qの場合、最後のパターンP。−4は有効
パターンであるので、切出した文字イメージをそのまへ
最終的な切出し結果とし、正規化処理(ステップ■)を
・施したのち文字バッファ7に書出す。
ステップ■です、、<Ωと判定した場合、マイクロプロ
セッサ5は最後のパターンp n+t をノイズパター
ンとして切出した文字イメージから除去しくステップ■
)、パターンP0からp n−zまでの範囲の画像情報
を最終的な文字イメージとして正規化処理を施し文字バ
ッファ7に書出す。なお、切出した文字イメージの最後
のパターンの位置は、マイクロプロセッサ5の内部レジ
スタまたはメモ ゛す6に格納される。
セッサ5は最後のパターンp n+t をノイズパター
ンとして切出した文字イメージから除去しくステップ■
)、パターンP0からp n−zまでの範囲の画像情報
を最終的な文字イメージとして正規化処理を施し文字バ
ッファ7に書出す。なお、切出した文字イメージの最後
のパターンの位置は、マイクロプロセッサ5の内部レジ
スタまたはメモ ゛す6に格納される。
1文字の切出しの後、マイクロプロセッサ5は切出し文
字の位置から切出し終了の判定を行い(ステップ[株]
)、残りの文字が存在する場合はステップのから次の文
字の切出し処理を再開する。
字の位置から切出し終了の判定を行い(ステップ[株]
)、残りの文字が存在する場合はステップのから次の文
字の切出し処理を再開する。
この場合、直前の文字の切出し処理を再開する。
この場合、直前の文字の次のパターンが最初のパターン
P0となる。
P0となる。
最後の文字まで切出されると、当該行の処理を終了し、
マイクロプロセッサ5は行切出し部1に次の行の切出を
指示する。
マイクロプロセッサ5は行切出し部1に次の行の切出を
指示する。
以上説明した処理により、例えば第3図に示す「い」と
「ま」の文字列の場合、パターンP0゜Pl、P、が順
次連結されるが、(bfl+W、+b1)<L< (b
、+W、+b、+W、+b2)であるため、パターンb
。からb□までの範囲が1文字のイメージとして切出さ
れる。そして、パターンP1の幅b1は最小幅2以上で
あるから、この文字イメージは最終的な切出し結果とな
る。このようにして、「い」を正しく切出すことができ
る。
「ま」の文字列の場合、パターンP0゜Pl、P、が順
次連結されるが、(bfl+W、+b1)<L< (b
、+W、+b、+W、+b2)であるため、パターンb
。からb□までの範囲が1文字のイメージとして切出さ
れる。そして、パターンP1の幅b1は最小幅2以上で
あるから、この文字イメージは最終的な切出し結果とな
る。このようにして、「い」を正しく切出すことができ
る。
他方、第4図に示す「月」と1日」の間ピノイズパター
ンPよがある文字列では、(ba+w0+−、b□)<
L< (bo+W、+b、+W1+b2)となるので、
パターンP、からP工の範囲が一応切出される。しかし
、パターンP□は、bl<Qであるためノイズパターン
として除去され、最終的にパターンP。たけが1文字の
イメージとして切出される。
ンPよがある文字列では、(ba+w0+−、b□)<
L< (bo+W、+b、+W1+b2)となるので、
パターンP、からP工の範囲が一応切出される。しかし
、パターンP□は、bl<Qであるためノイズパターン
として除去され、最終的にパターンP。たけが1文字の
イメージとして切出される。
このようにして、1月」が正しく切出される。なお、ノ
イズパターンP1は除去されるから、次の「日」の切出
しに悪影響を与えない。
イズパターンP1は除去されるから、次の「日」の切出
しに悪影響を与えない。
以上、一実施例について説明したが、本発明はそれだけ
に限定されるものではなく、様々に変形して実施し得る
ものである。
に限定されるものではなく、様々に変形して実施し得る
ものである。
以」−の説明から明らかなように1本発明によれば、ノ
イズの影響を排除して文字切出しを行うこができるため
、ノイズの多い原稿の文字認識率を改善できる。
イズの影響を排除して文字切出しを行うこができるため
、ノイズの多い原稿の文字認識率を改善できる。
第1図は本発明に係る文字認識装置の概略ブロック図、
第2図は文字切出しおよび正規化処理の概略フローチャ
ート、第315!lは文字切出し動作の説明図、第4図
はノイズパターンのある文字列からの文字切出し動作の
説明図である。 2・・・行切出しバッファ、 3・・・垂直射影作成部
。 4・・・文字切出し正規化部、 8・・・認識部。 “Σ・′ンV 第2図 第3図 $4図
第2図は文字切出しおよび正規化処理の概略フローチャ
ート、第315!lは文字切出し動作の説明図、第4図
はノイズパターンのある文字列からの文字切出し動作の
説明図である。 2・・・行切出しバッファ、 3・・・垂直射影作成部
。 4・・・文字切出し正規化部、 8・・・認識部。 “Σ・′ンV 第2図 第3図 $4図
Claims (1)
- (1)行画像からその垂直射影により分離したパターン
を抽出し、抽出したパターンを順次連結して連結幅が所
定の最大文字幅を越える直前のパターンまでの連結パタ
ーン群を1文字のイメージとして切出し、切出したイメ
ージの最後のパターンの幅が所定の最小幅に達しない場
合は当該最後のパターンをノイズとして除去するとゝも
に、その直前のパターンまでの連結パターン群を改めて
1文字のイメージとして切出すことを特徴とする文字切
出し方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62071079A JPS63237182A (ja) | 1987-03-25 | 1987-03-25 | 文字切出し方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62071079A JPS63237182A (ja) | 1987-03-25 | 1987-03-25 | 文字切出し方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63237182A true JPS63237182A (ja) | 1988-10-03 |
Family
ID=13450155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62071079A Pending JPS63237182A (ja) | 1987-03-25 | 1987-03-25 | 文字切出し方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63237182A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0689166A3 (en) * | 1994-06-22 | 1996-09-04 | Sharp Kk | Device for image quality control in an electronic copier |
-
1987
- 1987-03-25 JP JP62071079A patent/JPS63237182A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0689166A3 (en) * | 1994-06-22 | 1996-09-04 | Sharp Kk | Device for image quality control in an electronic copier |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3139521B2 (ja) | 自動言語決定装置 | |
JPH01112388A (ja) | 文字認識処理方法 | |
JPH0798765A (ja) | 方向検出方法および画像解析装置 | |
JPS63237182A (ja) | 文字切出し方法 | |
CN112784825A (zh) | 图片中文字的识别方法、关键字检索方法、装置及设备 | |
US8472719B2 (en) | Method of stricken-out character recognition in handwritten text | |
CN114386407A (zh) | 文本的分词方法及装置 | |
JPS62133585A (ja) | 単語切出方式 | |
JP2001022883A (ja) | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 | |
JP3348224B2 (ja) | 表枠線の交点補正装置および表認識装置および光学文字読取装置 | |
JP3140079B2 (ja) | 罫線認識方法及び表処理方法 | |
JP4129902B2 (ja) | 罫線消去方法、罫線消去装置、及び、記録媒体 | |
JPS62120586A (ja) | 文字認識装置 | |
JP2794042B2 (ja) | 表形式文書の認識装置 | |
JPS62257583A (ja) | 文字認識方式 | |
JP2969751B2 (ja) | 文字認識処理方式 | |
JP4350317B2 (ja) | 画像処理装置及び方法 | |
JP2890788B2 (ja) | 文書認識装置 | |
JP3243389B2 (ja) | 文書識別方法 | |
JPH0418352B2 (ja) | ||
JPH011086A (ja) | 文字切出し方法 | |
CN116955934A (zh) | 一种网络传输数据降噪方法、装置、计算设备和存储介质 | |
JP2917396B2 (ja) | 文字認識方式 | |
JPH113433A (ja) | 表枠線の交点補正装置 | |
JPS5949670A (ja) | 光学的文字読取装置 |