JP2006228232A - 文字分割プログラム、文字分割装置および文字分割方法 - Google Patents

文字分割プログラム、文字分割装置および文字分割方法 Download PDF

Info

Publication number
JP2006228232A
JP2006228232A JP2006041625A JP2006041625A JP2006228232A JP 2006228232 A JP2006228232 A JP 2006228232A JP 2006041625 A JP2006041625 A JP 2006041625A JP 2006041625 A JP2006041625 A JP 2006041625A JP 2006228232 A JP2006228232 A JP 2006228232A
Authority
JP
Japan
Prior art keywords
character image
character
unit
image
connection element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006041625A
Other languages
English (en)
Other versions
JP4761996B2 (ja
Inventor
Shun Son
俊 孫
Yoshinobu Hotta
悦伸 堀田
Yutaka Katsuyama
裕 勝山
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2006228232A publication Critical patent/JP2006228232A/ja
Application granted granted Critical
Publication of JP4761996B2 publication Critical patent/JP4761996B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

【課題】粗分割を行った後の低解像度灰色度文字行の単一の文字を精密分割する文字分割プログラム、装置および方法を提供する。
【解決手段】灰色度文字精密分割装置は、入力された、粗分割された低解像度灰色度文字行画像101の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割部102と、前記入力された調整および分割された文字画像から二値文字画像を生成する文字画像二値化部103と、前記文字画像二値化部により生成された前記二値文字画像においてノイズ情報を除去するノイズ除去部104と、前記ノイズ情報を除去した二値文字画像から精密分割された文字画像106を生成する最終文字画像分割部105を備えている。
【選択図】 図1

Description

本発明は、文字分割プログラム、文字分割装置および文字分割方法に関する。特に、本発明は粗分割を行った後の低解像度灰色度文字行の単一の文字を精密分割する、文字分割プログラム、文字分割装置および文字分割方法に関するものである。
文字分割は文字認識の予備処理工程の一つである。多くの文献および特許公報がこの技術に関して刊行されている。例えば、特許文献1(米国特許第6、327、385号明細書、Kamitani「文字分割装置および文字分割システム」XX出版 200X年)、特許文献2(ハンソン、「傾斜柱状グラフを用いた文字分割実行装置(Hanson,“Apparatus for performing character segmentation using slant histogram”)」,US Patent No.5,692,069)、および特許文献3(米国特許第5、172、422号明細書、タン「光学的文字認識のための傾きのあるテキスト行の高速文字認識の方法および装置」Tan,“Fast character segmetation of skewed text lines for optical character recognition”,US Patent No.5,172,422)並びに非特許文献1(ワイ.ルー著 「機械印刷文字分割−概観」、パターン認識、第28巻第1号第67−80行、 1,995年1月)および非特許文献2(エス.ダブリュ.リー、ディー.ジェイ.リー、エス.パク著 「灰色度文字分割および認識のための新しい方法論」パターン解析および機械知能に関するIEEE報告書、第18巻第10号第104501050頁、1996年10月(S.W.Lee,D.J.Lee,H.S.Park,”A New Methodology for Gray−Scale Character Segmentation and Recognition”, IEE transaction on pattern recognition and machine intelligence, Vol.18,no.10,pp1045−1050,Oct,1996))がある。
米国特許第6、327、385号明細書 米国特許第5、692、069号明細書 米国特許第5、172、422号明細書 ワイ.ルー著 「機械印刷文字分割−概観」、パターン認識、第28巻第1号第67−80行、 1995年1月 エス.ダブリュ.リー、ディー.ジェイ.リー、エス.パク著 「灰色度文字分割および認識のための新しい方法論」パターン解析および機械知能に関するIEEE報告書、第18巻第10号第1045−1050頁、1996年10月(S.W.Lee,D.J.Lee,H.S.Park,"A New Methodology for Gray−Scale Character Segmentation and Recognition", IEE transaction on pattern recognition and machine intelligence, Vol.18,no.10,pp1045−1050,Oct,1996)
上述の論文および特許明細書は接触する文字の処理方法を取り扱うものであり、これらの方法は2進文字画像を使用しているが、これらの方法を低解像度の画像の分割に適用すると解決するそばから誤りが生じる。これまで低解像度の灰色度文字の分割に関する論文または特許明細書は少なくない。
低解像度文字認識は非常に困難な仕事である。灰色度の特徴の使用はこの問題の一つの可能な解決策である。しかしながら、文字が背景から精密に分割されていないと、画像から抽出された特徴はそれほど有効ではなくなる。そのため、低解像度文字の精密な分割は灰色度特徴抽出方法の成功に導く必須要件である。
低解像度文字画像については、サイズは通常20×20ピクセルであり、文字の真の境界は通常1ピクセル内に位置している。従って、真の文字境界は引き続き行われる特徴抽出モジュールにとって非常に重要である。低解像度灰色度文字画像の精密分割を可能にする方法および装置に対する需要があることは明らかである。
本発明は上述の従来技術の欠点を考慮してなされたものであり、本発明の目的は灰色度文字を精密分割する文字分割プログラム、装置および方法を提供することにある。
本発明の一態様によれば、文字分割プログラムが提供される。この文字分割プログラムは、コンピュータを、入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割部と、前記入力された調整および分割された文字画像から二値文字画像を生成する文字画像二値化部と、前記文字画像二値化部により生成された前記二値文字画像においてノイズ情報を除去するノイズ除去部と、前記ノイズ情報を除去した二値文字画像から精密に分割された文字画像を生成する最終文字画像分割部として機能させることを特徴とする。
上記プログラムは、好ましくは、前記コンピュータを、さらに、前記調整・分割部と前記文字画像二値化部の間に介装され、前記調整および分割された文字画像が前記文字画像二値化部に入力される前に、前記調整・分割部により生成された調整および分割された文字画像を増幅する増幅部として機能させる。
上記プログラムは、好ましくは、前記コンピュータを、さらに、前記調整・分割部と前記文字画像二値化部の間に介装され、前記調整および分割された文字画像が前記文字画像二値化部に入力される前に、前記調整・分割部により生成された調整および分割された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強部として機能させる。
上記プログラムは、好ましくは、前記コンピュータを、さらに、前記増幅部と前記文字画像二値化部の間に介装され、前記調整および分割され、かつ増幅された文字画像が前記文字画像二値化部に入力される前に、前記増幅部により生成された調整および分割され、かつ増幅された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強部として機能させる。
好ましくは、前記調整・分割部は、前記文字行画像内の文字行の方向を検出する文字方向検出部と、前記文字画像のサイズを計算する文字画像サイズ計算部と、前記文字行方向検出部の前記検出結果および前記文字画像サイズ計算部の前記計算結果に応じて前記文字画像を調整して、前記文字のすべての線が前記調整および分割された文字画像に含まれるように調整する機能を有する。
好ましくは、前記文字画像増強部は、入力された文字画像の背景ピクセル値を推定する背景ピクセル値推定部と、前記背景ピクセル値推定部によって推定された前記背景ピクセル値に基づいて背景を除去する背景除去部と、前記背景を除去した前記文字画像のピクセル値を増強するピクセル値増強部として機能する。
好ましくは、前記ノイズ除去部は、前記二値文字画像の接続要素を解析して各接続要素のすべてのピクセル点を見出し、前記二値文字画像内の前記接続要素の総数を計算する接続要素解析部と、接続要素がノイズ接続要素であるか否かを決定するノイズ接続要素決定部と、前記ノイズ接続要素決定によりノイズ接続要素であると決定された前記二値文字画像内の前記接続要素を除去するノイズ接続要素除去部として機能する。
好ましくは、前記ノイズ接続要素決定部は、接続要素がノイズ接続要素であるか否かを前記接続要素のサイズ<前記二値文字画像のサイズ/縮尺比数、および前記接続要素の境界と前記二次文字画像の境界の距離<閾値を満たすか否かにより決定し、接続要素が前記条件の両方を満たすならば、前記接続要素はノイズ接続要素であると決定する。
本発明の一態様によれば、文字分割装置が提供される。この文字分割装置は、入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割部と、前記入力された調整および分割された文字画像から二値文字画像を生成する文字画像二値化部と、前記文字画像二値化部により生成された前記二値文字画像においてノイズ情報を除去するノイズ除去部と、前記ノイズ情報を除去した二値文字画像から精密に分割された文字画像を生成する最終文字画像分割部を備えたことを特徴とする。
上記装置は、好ましくは、さらに、前記調整・分割部と前記文字画像二値化部の間に介装され、前記調整および分割された文字画像が前記文字画像二値化部に入力される前に、前記調整・分割部により生成された調整および分割された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強部を備えている。
本発明の他の態様によれば、文字分割方法が提供される。この文字分割方法は、コンピュータが、入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割工程と、前記調整および分割工程により処理された文字画像二値化するする文字画像二値化工程と、前記文字画像二値化工程において生成された前記二値文字画像においてノイズ情報を除去するノイズ除去工程と、前記ノイズ情報を除去した二値文字画像から精密に分割された文字画像を生成する最終文字画像分割工程を実行することを特徴とする。
好ましくは、前記コンピュータは、さらに、前記調整および分割された文字画像が前記文字画像二値化工程により処理される前に、前記調整・分割工程において生成された前記調整および分割された文字画像を増幅する増幅工程を実行する。
好ましくは、前記コンピュータは、前記ノイズ除去工程として、前記二値文字画像の接続要素を解析して各接続要素のすべてのピクセル点を見出し、前記二値文字画像内の前記接続要素の総数を計算する接続要素解析工程と、接続要素がノイズ接続要素であるか否かを決定するノイズ接続要素決定工程と、前記ノイズ接続要素決定工程においてノイズ接続要素であると決定された前記二値文字画像内の前記接続要素を除去するノイズ接続要素除去工程を実行する。
好ましくは、前記コンピュータは、前記ノイズ接続要素決定工程において、接続要素がノイズ接続要素であるか否かを前記接続要素のサイズ<前記二値文字画像のサイズ/縮尺比数、および、前記接続要素の境界と前記二次文字画像の境界の距離<閾値を満たすか否かによって決定し、接続要素が前記条件の両方を満たすならば、前記接続要素はノイズ接続要素であると決定する。
本発明は低解像度文字画像において文字の境界を精密に得ることが可能であり、従って文字画像の有効な分割を実施することが可能であり、それにより文字認識の後続の手順(例えば文字特徴抽出)が有効に実施されることを保証する。
本発明の原理および好適な実施形態を添付の図面を参照して以下に詳細に説明する。
本発明は低解像度文字画像の粗分割をし、この文字行画像の文字のそれぞれが知られた後にそれらの文字を精密に分割することを対象としている。このようにして分割された文字は将来文字認識において特徴抽出のために使用することが可能である。粗分割は文字の境界を手動で、大雑把に枠で囲むことにより行うことが可能であるか、または画像の二値化の結果を用いて自動的に得ることが可能である。囲われた境界は多くの背景領域を含むことが可能である。さらに、文字の部分的な(不完全な)境界も分割によって単一化することが可能である。精密分割は文字の上下左右の境界を精密に見出すことを意味する。
図1は本発明の文字分割装置を示す概略ブロック図である。図1に示すように、本発明の文字分割装置は調整・分割・増幅部102、文字画像増強・二値化部103、ノイズ除去部104および最終文字画像分割部105を備えている。入力は粗分割された低解像度灰色度文字行画像101であり、出力は精密分割された文字画像106である。しかしながら、前述の各部は単なる例示に過ぎず、本発明を限定するものではないことに注意すべきである。調整・分割・増幅部102はさらに調整・分割部および増幅部に細分割することが可能である。一方、文字画像増強・二値化部103はさらに文字画像増強部および文字画像二値化部に細分割することが可能である。さらに、文字画像増強部はさらに背景ピクセル値推定部、背景ピクセル値除去部およびピクセル値増強部に細分割することが可能である。加えて、調整・分割・増幅部は文字方向検出部、文字サイズ計算部、文字画像調整部等に細分割することが可能である。
上述のように、文字画像の粗分割は手動で行っても、あるいは従来の二値化画像の自動的分割により得ても、いずれでもよい。次いで、調整・分割・増幅部102は入力された低解像度文字行画像の粗分割の結果を調整し、文字画像増強・二値化部103が文字画像を増強し、二値化し、得られた二値化画像はノイズ除去手段によりノイズを除去され、ノイズを含まない二値化文字画像を生成する。最後に、最終文字画像分割部105が文字画像の最終分割を実行し、ノイズ除去部に生成された二値化文字画像を見出し、増幅された灰色度画像において真の文字境界を表示し、抽出を実行する。最終文字画像分割部105から出力された結果は精密分割された文字画像106である。
以下の段落において、図2〜5を一緒に参照して上記各部102〜105の動作を詳細に説明する。
調整・分割・増幅部102において、最初に、入力された文字行画像(図6−1参照)の各文字のその前およびその次の文字の粗分割の結果を用いてこの文字の境界限界を調整し、次いで調整された画像内容を抽出(分割)し、増幅して、真の文字の画像のすべてが、出力され、増幅された灰色度文字画像内に入るようにする。
図2は図1の調整・分割・増幅部102の特定の動作のフローを示す。この調整・分割・増幅部102の入力は粗分割された低解像度灰色度文字行画像101である。具体的には、調整・分割・増幅部102は現在の文字画像の前にある文字画像S201、現在の文字画像S202および粗分割された現在の文字画像S202の次の文字画像S203を含む。現在の文字画像の境界調整はその前および後の両方の文字画像の境界がかかわっているので、調整・分割・増幅部102の(図示しない)文字行方向検出部がまず文字行方向検出(文字行方向検出工程S204)を実行する。文字行が横(水平)に続いているならば(縦横決定工程S205、Yes)、文字画像の左右の境界の調整において、調整された境界はその文字の左右の文字画像の境界限界を過度に越えてはならない。文字行が縦(垂直)に続いているならば(縦横決定工程S205、No)、文字画像の上下の境界の調整において、調整された境界は現在の文字画像の上下の文字画像の境界限界を過度に越えてはならない。
文字行方向検出、すなわち文字行の方向決定(S204)は以下のようにして実行される。
1)(例えば、上述の3つの文字の)文字行の粗分割の結果を用いてこの文字行のバウンディング・ボックスを決定する。粗分割の結果は各文字画像のバウンディング・ボックスである(図6−1参照)。バウンディング・ボックスは矩形の枠によって表され、その幅は矩形の幅であり、その高さは矩形の高さである。ここで、従来技術を利用してこれらの文字(例えば、上述の文字のバウンディング・ボックスの極左、極右、上限および下限の座標を見出して新しいバウンディング・ボックスを定義することが可能である。このバウンディング・ボックスは文字行バウンディング・ボックスである。
(2)上記文字行バウンディング・ボックスの幅と高さを計算する。
(3)幅>高さであるならば、文字行は水平文字行である。そうでなければ、文字行は垂直文字行である。
好適な一実施形態では、文字行画像内の文字行の方向が決定された後に、文字行の調整シーケンスが直ちに決定される。文字行の方向が水平である、すなわち入力されたものが水平文字行であるならば、まず文字境界が左右シーケンスに従って調整され、次いで上下シーケンスに従って調整される。文字行の方向が水平ではない場合、前述の調整シーケンスは変更されることに注意すべきである。
引き続き、文字画像のサイズが調整・分割・増幅部の(図示しない)文字画像サイズ計算部により計算される。粗分割後の前の文字画像の左右上下の境界をそれぞれxs_p、xe_p、ys_p、ye_pと定義し、粗分割後の前の文字の文字画像の左右上下の境界をxs_c、xe_c、ys_c、ye_cと定義し、かつ粗分割後の次の文字画像の左右上下の境界をxs_n、xe_n、ys_n、ye_nと定義する。粗分割後の現在の文字画像の幅と高さをwidth_c、height_cと定義する。現在の文字のサイズはsize_c(すなわち、画像サイズ)と定義される。
Figure 2006228232
次に、文字画像の境界が調整・分割・増幅部102の文字画像調整部によって調整される境界調整後の現在の文字画像の左右上下の境界をふたたびxs_c1、xe_c1、ys_c1、ye_c1と定義する。
調整の原理は次の通りである。すなわち、水平文字行については、文字画像の左境界と右境界を拡大する。しかし、この拡大はその文字画像の左右の文字を含むほどになってはならない。上下の境界の限界も、粗分割により1つの文字が2つの部分に切断されないように、ある程度拡大されるべきである。この拡大の程度は文字サイズsize_cのある比率により決定される。垂直文字行については、文字画像の上下の境界が拡大されるが、この拡大はその文字画像の上下の文字を含むほどになってはならない。左右の境界の限界も粗分割により1つの文字が2つの部分に切断されないように、ある程度拡大されるべきである。最終的に要求される効果は、粗分割が粗分割の限界外に1つの文字部分を誤って分割した場合でさえも、調整後のこの分割の結果が依然としてこの文字のすべての部分を完全に含んでいることである。
文字行が水平文字行であると検出されたならば、現在の文字の左右上下の境界は文字画像左側境界調整(S206)、文字画像右側境界調整(S207)、文字画像上側境界調整(S208)および文字画像下側境界調整(S209)により調整される。以下の説明では、画像の左上隅が座標の原点であるとし、y軸の方向は座標の原点に沿って下向きの方向であり、x軸の方向は座標の原点に沿って右向き方向であるとする。
S206における文字画像左側境界調整の規則は次の通りである。
Figure 2006228232
S207における文字画像右側境界調整の規則は次の通りである。
Figure 2006228232
S208における文字画像上側境界調整の規則は次の通りである。
Figure 2006228232
S209における文字画像下側境界調整の規則は次の通りである。
Figure 2006228232
S208およびS290において、rは調整を制御するパラメータである。rの例示的値は0.2であり得る。
同様に、文字行が垂直文字行であると検出されたならば、現在の文字の上下左右の境界は文字画像上側境界調整(S210)、文字画像下側境界調整(S211)、文字画像左側境界調整(S212)および文字画像右側境界調整(S213)により調整される。
S210における文字画像上側境界調整の規則は次の通りである。
Figure 2006228232
S211における文字画像下側境界調整の規則は次の通りである。
Figure 2006228232
S212における文字画像左側境界調整の規則は次の通りである。
Figure 2006228232
S213における文字画像右側境界調整の規則は次の通りである。
Figure 2006228232
S208およびS290において、rは調整を制御するパラメータである。rの例示的値は0.2であり得る。
調整後、xs_c1、xe_c1、ys_c1、ye_c1により定義された文字画像の画像コンテンツが文字行から切断される(S214)。これら4つの値は矩形の左右上下の境界を定義している。この矩形で定義された文字行画像における境界が要求されたセクションであり、このセクションのコンテンツをコピーすることが切断のプロセスである。次に、切断された文字画像を元のサイズのN倍に増幅する(S215)。画像増幅法のアルゴリズムは、ゴンザレス、ディジタル・イメージ・プロセシング、第2版、キュキ・ユアン、ユジ・ユアン他翻訳、第50頁、第1刷、2003年3月、電子産業発行館(Gonzalez,Digital Image Processing,second edition,translated by Qiuqi YUAN,Yuzhi YUAN et al,page50, first printed in March 2003,Publishing House of Electronic Industry)を参照することができる。Nの例示的値は4であり得る。調整、分割および増幅の出力は増幅された灰色度文字画像S216である(図6−3参照)。
注意すべきは、上述の調整方法は単なる例示であり、当業者に知られた他の調整方法も、それらの方法が文字の真の境界がその文字の調整されたバウンディング・ボックス内に完全に入ることを可能にする限り、使用可能である。
図3は図1の文字画像増強・二値化部を示す動作フローチャートである。文字画像増強の目的は文字画像における低解像度下の文字の滲んだ線(blurred strokes)をより明瞭にすることである。文字画像増強を実行しなかったならば、引き続き行われる認識は効果が思わしくないであろう。図3に示すように、文字画像増強・二値化部において、背景ピクセル値推定部がまず背景ピクセル値を推定する(背景ピクセル値推定工程S301)。これは増幅された文字画像S216の灰色度柱状グラフ(ヒストグラム)を用いることにより得ることが可能である。画像における灰色度柱状グラフの計算方法は、ユジン・ツァング編著「画像処理および解析」清華大学出版、1991年3月(Image Processing and University Press,compiled and written by Yujin ZHANG, March 1991, Tsinghua University Press)を参照することができる。この柱状グラフの最大値に対応するピクセル値を背景ピクセル値とする。次いで、背景はS302において背景除去部により除去される。文字ピクセル点の理想的なピクセル値は255であるとすると、背景の除去はすべての背景ピクセル点を見出すことになり、背景ピクセル点のピクセル値を0に設定することになる。詳しくは、例えば背景色が比較的に明るい状況下で、背景ピクセル値がVbkであると仮定すると、入力された画像内のすべてのピクセル値をチェックする。あるピクセル点の灰色度値がVbkよりも大きいならば、このピクセル点の灰色度値はVbkに設定される。あるピクセル点の灰色度値がVbkよりも小さいならば、このピクセル点の灰色度値は変わらない。先に仮定した状況下では、文字のピクセル値は背景のピクセル値よりも小さい。しかしながら、背景ピクセル点のピクセル値が文字ピクセル点のピクセル値よりも小さいならば、すなわち背景色が比較的にうす暗い(dim)状況下では、同様の処理を用いて灰色度値がVbkより小さいピクセル点の灰色度値をVbkに設定し、灰色度値がVbkよりも大きいピクセル点を維持して背景除去(背景除去工程S302)(図6−3)を達成することが可能である。その後、背景を除去した灰色度画像のピクセル値をシグモイド関数により増強する(ピクセル値増強工程S303)。この増強のアルゴリズムは次のように規定される。
1.ピクセル点の灰色度値がgであるとし、画像の各ピクセル点の灰色度について以下の変形をまず実行する。

f(g)=(exp((g−off)/t)−1)/(exp((g−off)/t)+1)

ここで、offおよびtは変形のパラメータである。例えば、off=0、t=6に設定することができる。
この関数はS字状をしているので、シグモイド関数とも呼ばれる。
2.変形後、この関数値の最大値maxおよび最小値minを見出す。
3.各点の関数値に関して下記を実行する。

g1=(f(g)−min)×255/(max−min)
次に、g1の整数値を選択する。この整数値は、画像増強後の新しい画像におけるこの点の灰色度値である。
文字が増強された後、増強された灰色度画像は所与の閾値Thを用いて二値化される(画像二値化工程S304)。新しい画像がまず生成され、そのサイズは元の灰色度画像と一致する。新しい画像におけるピクセル点の値の設定は以下の規則により決定される。
増強された画像の各ピクセル点の灰色度値を決定する。灰色度値がThよりも大きいならば、新しい画像における対応する点の灰色度値は255に設定される。そうでなければ、0に設定される。新しい画像のピクセル点の値の設定において2つの選択肢、すなわち0または255だけしか存在することができないので、このプロセスは二値化と呼ばれている。二値化の結果は、二値文字画像S305を取得することである(図6−4も参照)。
通常、二値文字画像は文字境界の近くでは若干のノイズを含む。これらのノイズは背景ピクセルまたは不正確な粗分割を原因とする前のまたは次の文字の文字線であることがある。そこで、本発明の方法はノイズ除去工程を実行してこれらのノイズを除去する。換言すると、分割及び調整の後、文字自体は調整された境界内に完全に含まれているが、隣接する文字のある線もこの境界内に含まれることもあり得よう。これらの線はノイズ情報であり、従ってノイズを除去する必要がある。
図4は図1のノイズ除去部104のノイズ除去工程を示す詳細なフローチャートである。図4に示すように、まず、ノイズ除去部の接続要素解析部が、入力された二値文字画像(S305)の接続された要素(CC)(以下、「接続要素」という)を解析して、各接続要素に含まれるピクセル点を見出し、接続要素の総数を得る(接続要素の総数取得工程S401)。接続要素は、二値画像の相互に接続する一群のピクセルである。例えば、アラビア数字の2に相当する「二」という漢数字野場合、2つの接続要素が存在する。画像の接続要素解析アルゴリズムに関してはゴンザレス、ディジタル・イメージ・プロセシング、第2版、キュキ・ユアン、ユジ・ユアン他翻訳、第535頁、第1刷、2003年3月、電子産業発行館(Gonzalez,Digital Image Processing,second edition,translated by Qiuqi YUAN,Yuzhi YUAN et al,page535, first printed in March 2003,Publishing House of Electronic Industry)を参照することができる。
次に、ノイズ接続要素決定部が、接続された要素がノイズを接続された要素(以下、「ノイズ接続要素」という)であるか否かを決定する。ノイズ接続要素であるか否かの決定を実行するには、まず接続された要素のサイズと文字境界からの距離を計算する必要がある。具体的には、i=0と設定する(距離計算工程S402)。ここで、iは画像中の接続要素の符号であり、i=0は第1の接続要素から開始することを表す。続いて、各接続要素の外側バウンディング・ボックスを第1の接続要素から得る。この接続要素の全てのピクセルの上下左右の境界がこの接続要素の外側バウンディング・ボックスを構成している。次いで、接続要素のサイズを推定する。すなわち、接続要素の外側バウンディング・ボックスの幅の値と高さの値の間でどちらが大きいかを推定する(サイズ推定工程S403)。i番目の接続要素(i番目のCC)の外側バウンディング・ボックスと文字画像の境界の距離を得て、「距離」(Distance)と定義する(距離推定工程S404)。さらに、文字画像のサイズ、すなわち上述の文字画像のサイズ幅の値と高さの値のうち大きい方の文字画像のサイズを「画像サイズ(imagesize)」と定義する。次いで、この接続要素がノイズ接続要素であるか否かを決定する(ノイズ接続要素決定工程S405)。そして、ノイズ接続要素であると決定された場合は、この接続要素を除去する(ノイズ接続要素除去工程S406)。すなわち、接続要素が下記の2つの条件を満たすならば、この接続要素はノイズ接続要素とみなされ、二値文字画像から除去される。
2つの条件は以下の通りである。
1.サイズ<画像サイズ/N1
2.距離<N2
ここで、N1は縮尺比数(scale number)であり、例えばN1=3である。N2は距離の閾値である。すなわち、接続要素のサイズは非常に小さい(例えば、文字画像のサイズの3分の1未満である)。文字画像と文字境界の距離は所定の閾値よりも小さく、従ってこの接続要素はノイズ接続要素である。
ノイズ接続要素はノイズ接続要素除去部により除去される。その動作は以下の通りである。
1.元の二値画像のサイズと同じサイズの新しい画像を作成し、この新しい画像のすべてのピクセル点の値を0(ゼロ)に設定する。そして、
2.元の二値画像の非ノイズ接続要素(まだ決定がなされていないものを含む)におけるピクセル点のそれぞれに関して、新しい画像における対応するピクセル点の灰色度値を255に設定する。
新しい画像はノイズ接続要素を除去した文字画像である。
二値文字画像の接続要素はすべて上述のサイズ計算、距離推定、ノイズ接続要素の決定およびノイズ接続要素であると決定した際の除去の上述の工程を実行し、最終的にノイズのない二値化文字画像を出力する(S409)(図6−5参照)。
詳しくは、ノイズ接続要素の決定および除去の工程は以下の通りである。すなわち、接続要素のサイズをサイズ推定工程S403で推定し、この接続要素と境界の距離を距離推定工程S404で推定し、次いでノイズ接続要素決定工程S405でこの接続要素が前述の2つの条件を満たすか否かを見る。2つの条件が満たされていなければ、手順は工程次の接続要素指定工程S407に移り、1をi番目の値に加えて次の接続要素を指定し、次いでノイズ接続要素決定工程S408に進む。2つの条件が満たされているならば、この接続要素はノイズ接続要素であると決定され、ノイズ接続要素除去工程S406において除去され、手順は次の接続要素指定工程S407に進んで次の接続要素を指定し、ノイズ接続要素決定工程S408に進む。工程S408では、接続要素がすべて解析されたか否かを決定する(図4のnCCは接続要素の総数を表す)。すべて解析されているわけではないならば、手順は工程S403に進み、指定された接続要素の解析が開始される。すべて解析されているならば、ノイズを除去した二値文字画像が出力される(二値化画像出力工程S409)。
図5は最終文字画像分割部105の詳細な動作フローチャートである。まず、ノイズを除去した二値化文字画像を入力し(S409)、i=0と設定する(開始接続要素指定工程S501)。ここで、iは画像中の接続要素の符号であり、i=0は第1の接続要素から開始することを表す。続いて、各接続要素の外側バウンディング・ボックスを計算する(外側バウンディング・ボックス計算工程S502)、すなわちこの接続要素のすべてのピクセル点の最上端、極左、極右、および最下端の境界を見出す。次いで、i=0か否かを決定する(開始接続要素決定工程S503)。i=0である(S503において、yes)ならば、この接続要素の外側バウンディング・ボックスは仮の文字バウンディング・ボックスであると設定する(仮の文字バウンディング・ボックス設定工程S504)。そうでなければ(S503において、no)、この接続要素のバウンディング・ボックスは仮のバウンディング・ボックス統合工程S505において仮の文字バウンディング・ボックスと統合される。換言すると、最初の仮の文字バウンディング・ボックスは第1の接続要素の外側バウンディング・ボックスであり、第2の接続要素から開始して2つのバウンディング・ボックスが統合される。その1つはすべての現在の要素(第1の接続要素から現在の接続要素の1つ前の接続要素の一群、すなわち仮の文字バウンディング・ボックス)であり、もう1つは現在の接続要素の外側バウンディング・ボックスであり、このようにして新しい仮の文字バウンディング・ボックスを得る。この統合工程は2つのバウンディング・ボックスの最上端、最下端、極左および極右、すなわち統合後の外側バウンディング・ボックスを見出すことである(新しい仮の文字バウンディング・ボックス取得工程S506)。工程S506に続いて、次の接続要素がi番目の値に1を加えることにより指定され、接続要素処理完了決定工程S507において、すべての接続要素が処理されたかが決定される。すべての接続要素が処理されたわけではない(S507において、no)ならば手順は工程S502に戻り、すべての接続要素が処理されるまで前述の工程を繰り返す。今回得られた仮の文字バウンディング・ボックスが要求された文字バウンディング・ボックスである。そして、次に、増幅された灰色度文字画像S216において、この文字バウンディング・ボックス内に囲まれた灰色度コンテンツを抽出する(灰色度コンテンツ抽出工程S508).すなわち、文字バウンディング・ボックスによって画成された囲まれた画像を増幅された灰色度画像からコピーする。これは精密に分割された文字画像であり、この分割された文字画像は本発明の最終的出力である(図6−6も参照)。
図6−1〜図6−6は、前述の各部の出力結果を示す。図6−1は入力された粗分割を示す。図6−2は調整、分割および増幅後の結果である。図6−3は背景ピクセルの除去後の結果を示す。図6−5はノイズ除去後の結果を示す。図6−6は最終的な分割された文字画像を示す。
本発明は低解像度画像における文字の境界を精密に得ることを可能にし、文字を有効に分割し、文字認識における以降の工程、例えば文字特徴抽出が有効に実行される保証を与えることを可能にする。
当業者には了解されるべきであるように、本発明の精神および範囲を逸れることなく、本発明に種々の改訂および変更を行うことが可能である。従って、本発明は添付の特許請求の範囲に含まれるすべての改訂および変更およびそれらの均等物に及ぶべきものである。
以上のように、本発明にかかる灰色度文字精密分割装置および方法、特に粗分割を行った後の低解像度灰色度文字行の単一の文字の精密分割装置および方法は、文字認識に有用であり、特に、低解像度文字画像において文字の境界を精密に得ること、従って文字画像の有効な分割を実施すること、それにより文字認識の後続の手順(例えば文字特徴抽出)を有効に実施することに適している。
(付記1)コンピュータを、
入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割部と、
前記入力された調整および分割された文字画像から二値文字画像を生成する文字画像二値化部と、
前記文字画像二値化部により生成された前記二値文字画像においてノイズ情報を除去するノイズ除去部と、
前記ノイズ情報を除去した二値文字画像から精密分割された文字画像を生成する最終文字画像分割部
として機能させることを特徴とする文字分割プログラム。
(付記2)前記コンピュータを、
さらに、
前記調整・分割部と前記文字画像二値化部の間に介装され、前記調整および分割された文字画像が前記文字画像二値化部に入力される前に、前記調整・分割部により生成された調整および分割された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強部
として機能させることを特徴とする付記1に記載の文字分割プログラム。
(付記3)前記調整・分割部は、
前記文字行画像内の文字行の方向を検出する文字方向検出部と、
前記文字画像のサイズを計算する文字画像サイズ計算部と、
前記文字行方向検出部の前記検出結果および前記文字画像サイズ計算部の前記計算結果に応じて前記文字画像を調整して、前記文字のすべての線が前記調整および分割された文字画像に含まれるように調整する機能を
有することを特徴とする付記1または2に記載の文字分割プログラム。
(付記4)前記文字画像増強部は、
入力された文字画像の背景ピクセル値を推定する背景ピクセル値推定部と、
前記背景ピクセル値推定部によって推定された前記背景ピクセル値に基づいて背景を除去する背景除去部と、
前記背景を除去した前記文字画像のピクセル値を増強するピクセル値増強部
として機能することを特徴とする付記2に記載の文字分割プログラム。
(付記5)前記ノイズ除去部は
前記二値文字画像の接続要素を解析して各接続要素のすべてのピクセル点を見出し、前記二値文字画像内の前記接続要素の総数を計算する接続要素解析部と、
接続要素がノイズ接続要素であるか否かを決定するノイズ接続要素決定部と、
前記ノイズ接続要素決定によりノイズ接続要素であると決定された前記二値文字画像内の前記接続要素を除去するノイズ接続要素除去部
として機能することを特徴とする付記1または2に記載の文字分割プログラム。
(付記6)前記ノイズ接続要素決定部は、接続要素がノイズ接続要素であるか否かを前記接続要素のサイズ<前記二値文字画像のサイズ/縮尺比数、および、前記接続要素の境界と前記二次文字画像の境界の距離<閾値を満たすか否かにより決定し、接続要素が前記条件の両方を満たすならば、前記接続要素はノイズ接続要素であると決定することを特徴とする付記5に記載の文字分割プログラム。
(付記7)入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割部と、
前記入力された調整および分割された文字画像から二値文字画像を生成する文字画像二値化部と、
前記文字画像二値化部により生成された前記二値文字画像においてノイズ情報を除去するノイズ除去部と、
前記ノイズ情報を除去した二値文字画像から精密分割された文字画像を生成する最終文字画像分割部
を備えたことを特徴とする文字分割装置。
(付記8)前記調整・分割部と前記文字画像二値化部の間に介装され、前記調整および分割された文字画像が前記文字画像二値化部に入力される前に、前記調整・分割部により生成された調整および分割された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強部
を備えたことを特徴とする付記7に記載の文字分割装置。
(付記9)前記調整・分割部は、
前記文字行画像内の文字行の方向を検出する文字方向検出部と、
前記文字画像のサイズを計算する文字画像サイズ計算部と、
前記文字行方向検出部の前記検出結果および前記文字画像サイズ計算部の前記計算結果に応じて前記文字画像を調整して、前記文字のすべての線が前記調整および分割された文字画像に含まれるように調整する機能を
有することを特徴とする請求項7または8に記載の文字分割装置。
(付記10)前記文字画像増強部は、
入力された文字画像の背景ピクセル値を推定する背景ピクセル値推定部と、
前記背景ピクセル値推定部によって推定された前記背景ピクセル値に基づいて背景を除去する背景除去部と、
前記背景を除去した前記文字画像のピクセル値を増強するピクセル値増強部
を有することをする請求項8に記載の文字分割装置。
(付記11)前記ノイズ除去部は
前記二値文字画像の接続要素を解析して各接続要素のすべてのピクセル点を見出し、前記二値文字画像内の前記接続要素の総数を計算する接続要素解析部と、
接続要素がノイズ接続要素であるか否かを決定するノイズ接続要素決定部と、
前記ノイズ接続要素決定によりノイズ接続要素であると決定された前記二値文字画像内の前記接続要素を除去するノイズ接続要素除去部
を有することを特徴とする請求項7または8に記載の文字分割装置。
(付記12)前記ノイズ接続要素決定部は、接続要素がノイズ接続要素であるか否かを前記接続要素のサイズ<前記二値文字画像のサイズ/縮尺比数、および、前記接続要素の境界と前記二次文字画像の境界の距離<閾値を満たすか否かにより決定し、
接続要素が前記条件の両方を満たすならば、前記接続要素はノイズ接続要素であると決定する
ことを特徴とする付記11に記載の文字分割装置。
(付記13)コンピュータが、
入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して、調整および分割された文字画像を生成する調整・分割工程と、
前記調整および分割工程により処理された文字画像二値化するする文字画像二値化工程と、
前記文字画像二値化工程において生成された前記二値文字画像においてノイズ情報を除去するノイズ除去工程と、
前記ノイズ情報を除去した二値文字画像から精密に分割された文字画像を生成する最終文字画像分割工程
を実行することを特徴とする文字分割方法。
(付記14)前記コンピュータが、
さらに、
前記調整および分割された文字画像が前記文字画像二値化工程により処理される前に、前記調整・分割工程において生成された前記調整および分割された文字画像を増幅する増幅工程
を実行することを特徴とする付記13に記載の文字分割方法。
(付記15)前記コンピュータが、
さらに、
前記文字画像二値化工程の前に、前記増幅工程において増幅された前記調整および分割された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強工程
を実行することを特徴とする付記13に記載の方法。
(付記16)前記コンピュータが、前記調整・分割工程において、
前記文字行画像内の文字行の方向を検出する文字方向検出工程と、
前記文字画像のサイズを計算する文字画像サイズ計算工程と、
前記文字行方向検出工程の前記検出結果および前記文字画像サイズ計算工程の前記計算結果に応じて前記文字画像を調整して、前記文字のすべての線が前記調整および分割された文字画像に含まれるように調整する機能を実行することを特徴とする付記13に記載の方法。
(付記17)前記コンピュータが、前記文字画像増強工程において、
入力された文字画像の背景ピクセル値を推定する背景ピクセル値推定工程と、
前記背景ピクセル値推定工程によって推定された前記背景ピクセル値に基づいて背景を除去する背景除去工程と、
前記背景を除去した前記文字画像のピクセル値を増強する機能を実行することを特徴とする付記14に記載の方法。
(付記18)前記コンピュータが、前記ノイズ除去工程において、
前記二値文字画像の接続要素を解析して各接続要素のすべてのピクセル点を見出し、前記二値文字画像内の前記接続要素の総数を計算する接続要素解析工程と、
接続要素がノイズ接続要素であるか否かを決定するノイズ接続要素決定工程と、
前記ノイズ接続要素決定工程においてノイズ接続要素であると決定された前記二値文字画像内の前記接続要素を除去するノイズ接続要素除去工程
を実行することを特徴とする付記13〜17のいずれか一項に記載の方法。
(付記19)前記コンピュータが、前記ノイズ接続要素決定工程において、接続要素がノイズ接続要素であるか否かを、前記接続要素のサイズ<前記二値文字画像のサイズ/縮尺比数、および前記接続要素の境界と前記二次文字画像の境界の距離<閾値を満たすか否かによって決定し、接続要素が前記条件の両方を満たすならば、前記接続要素はノイズ接続要素であると決定することを特徴とする付記18に記載の方法。
本発明の文字分割装置を示す概略ブロック図である。 図1の調整、分割および増幅部の動作を示すフローチャートである。 図1の文字画像増強および二値化部の動作を示すフローチャートである。 図1のノイズ除去部詳細な動作を示すフローチャートである。 本発明の一実施形態による、最終的文字画像分割部の詳細な動作を示すフローチャートである。 本発明の一実施形態による、入力された、粗分割された文字画像を示す図である。 本発明の一実施形態による、粗分割および調整の結果を示す図である。 本発明の一実施形態による、背景ピクセルの除去の結果を示す図である。 本発明の一実施形態による、二値化の結果を示す図である。 本発明の一実施形態による、ノイズの除去の結果を示す図である。 本発明の一実施形態による、最終的に分割された文字画像の結果を示す図である。
符号の説明
101 低解像度灰色度文字行画像
102 調整・分割・増幅部
103 文字画像増強・二値化部
104 ノイズ除去部
105 最終文字画像分割部
106 精密分割された文字画像
S201 現在の文字画像の前にある文字画像
S202 現在の文字画像
S203 粗分割された現在の文字画像の次の文字画像
S204 文字行方向検出(方向決定)工程
S205 縦横決定工程
S206 文字画像左側境界調整工程
S207 文字画像右側境界調整工程
S208 文字画像上側境界調整工程
S209 文字画像下側境界調整工程
S210 文字画像上側境界調整工程
S211 文字画像下側境界調整工程
S212 文字画像左側境界調整工程
S213 文字画像右側境界調整工程
S301 背景ピクセル値推定工程
S302 背景除去工程
S303 ピクセル値増強工程
S304 画像二値化工程
S305 二値化文字画像
S401 接続要素の総数取得工程
S402 距離計算工程
S403 接続要素のサイズ推定工程
S404 距離推定工程
S405 ノイズ接続要素決定工程
S406 ノイズ接続要素除去工程
S407 次の接続要素指定工程
S408 ノイズ接続要素決定工程
S409 二値化文字画像出力工程
S501 開始接続要素指定工程
S502 外側バウンディング・ボックス計算工程
S503 開始接続要素決定工程
S504 仮の文字バウンディング・ボックス設定工程
S505 仮の文字バウンディング・ボックス統合工程
S506 新しい仮の文字バウンディング・ボックス取得工程
S507 接続要素処理完了決定工程
S508 灰色度コンテンツ抽出工程

Claims (10)

  1. コンピュータを、
    入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割部と、
    前記入力された調整および分割された文字画像から二値文字画像を生成する文字画像二値化部と、
    前記文字画像二値化部により生成された前記二値文字画像においてノイズ情報を除去するノイズ除去部と、
    前記ノイズ情報を除去した二値文字画像から精密分割された文字画像を生成する最終文字画像分割部
    として機能させることを特徴とする文字分割プログラム。
  2. 前記コンピュータを、さらに、
    前記調整・分割部と前記文字画像二値化部の間に介装され、前記調整および分割された文字画像が前記文字画像二値化部に入力される前に、前記調整・分割部により生成された調整および分割された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強部
    として機能させることを特徴とする請求項1に記載の文字分割プログラム。
  3. 前記調整・分割部は、
    前記文字行画像内の文字行の方向を検出する文字方向検出部と、
    前記文字画像のサイズを計算する文字画像サイズ計算部と、
    前記文字行方向検出部の前記検出結果および前記文字画像サイズ計算部の前記計算結果に応じて前記文字画像を調整して、前記文字のすべての線が前記調整および分割された文字画像に含まれるように調整する機能を
    有することを特徴とする請求項1または2に記載の文字分割プログラム。
  4. 前記文字画像増強部は、
    入力された文字画像の背景ピクセル値を推定する背景ピクセル値推定部と、
    前記背景ピクセル値推定部によって推定された前記背景ピクセル値に基づいて背景を除去する背景除去部と、
    前記背景を除去した前記文字画像のピクセル値を増強するピクセル値増強部
    として機能することを特徴とする請求項2に記載の文字分割プログラム。
  5. 前記ノイズ除去部は
    前記二値文字画像の接続要素を解析して各接続要素のすべてのピクセル点を見出し、前記二値文字画像内の前記接続要素の総数を計算する接続要素解析部と、
    接続要素がノイズ接続要素であるか否かを決定するノイズ接続要素決定部と、
    前記ノイズ接続要素決定によりノイズ接続要素であると決定された前記二値文字画像内の前記接続要素を除去するノイズ接続要素除去部
    として機能することを特徴とする請求項1または2に記載の文字分割プログラム。
  6. 前記ノイズ接続要素決定部は、接続要素がノイズ接続要素であるか否かを前記接続要素のサイズ<前記二値文字画像のサイズ/縮尺比数、および、前記接続要素の境界と前記二次文字画像の境界の距離<閾値を満たすか否かにより決定し、
    接続要素が前記条件の両方を満たすならば、前記接続要素はノイズ接続要素であると決定する
    ことを特徴とする請求項5に記載の文字分割プログラム。
  7. 入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して調整および分割された文字画像を生成する調整・分割部と、
    前記入力された調整および分割された文字画像から二値文字画像を生成する文字画像二値化部と、
    前記文字画像二値化部により生成された前記二値文字画像においてノイズ情報を除去するノイズ除去部と、
    前記ノイズ情報を除去した二値文字画像から精密分割された文字画像を生成する最終文字画像分割部
    を備えたことを特徴とする文字分割装置。
  8. 前記調整・分割部と前記文字画像二値化部の間に介装され、前記調整および分割された文字画像が前記文字画像二値化部に入力される前に、前記調整・分割部により生成された調整および分割された文字画像を増強して前記文字画像内の線をより明瞭にする文字画像増強部
    を備えたことを特徴とする請求項8に記載の文字分割装置。
  9. コンピュータが、
    入力された、粗分割された低解像度灰色度文字行画像の単一文字画像を調整および分割して、調整および分割された文字画像を生成する調整・分割工程と、
    前記調整および分割工程により処理された文字画像二値化するする文字画像二値化工程と、
    前記文字画像二値化工程において生成された前記二値文字画像においてノイズ情報を除去するノイズ除去工程と、
    前記ノイズ情報を除去した二値文字画像から精密に分割された文字画像を生成する最終文字画像分割工程
    を実行することを特徴とする文字分割方法。
  10. 前記コンピュータが、さらに、
    前記調整および分割された文字画像が前記文字画像二値化工程により処理される前に、前記調整・分割工程において生成された前記調整および分割された文字画像を増幅する増幅工程
    を実行することを特徴とする請求項9に記載の文字分割方法。
JP2006041625A 2005-02-18 2006-02-17 文字分割プログラム、文字分割装置および文字分割方法 Expired - Fee Related JP4761996B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CNB2005100085123A CN100369049C (zh) 2005-02-18 2005-02-18 灰度字符的精确分割装置及方法
CN200510008512.3 2005-02-18

Publications (2)

Publication Number Publication Date
JP2006228232A true JP2006228232A (ja) 2006-08-31
JP4761996B2 JP4761996B2 (ja) 2011-08-31

Family

ID=36923381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006041625A Expired - Fee Related JP4761996B2 (ja) 2005-02-18 2006-02-17 文字分割プログラム、文字分割装置および文字分割方法

Country Status (3)

Country Link
US (1) US7715628B2 (ja)
JP (1) JP4761996B2 (ja)
CN (1) CN100369049C (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8782551B1 (en) * 2006-10-04 2014-07-15 Google Inc. Adjusting margins in book page images
CN101354746B (zh) * 2007-07-23 2011-08-31 夏普株式会社 文字图像抽出装置及文字图像抽出方法
US8155442B2 (en) * 2008-02-04 2012-04-10 The Neat Company, Inc. Method and apparatus for modifying the histogram of an image
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8023741B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8144986B2 (en) * 2008-09-05 2012-03-27 The Neat Company, Inc. Method and apparatus for binarization threshold calculation
US9563811B2 (en) * 2012-07-31 2017-02-07 Lg Cns Co., Ltd. Character recognition method, character recognition apparatus and financial apparatus
JPWO2014102876A1 (ja) * 2012-12-27 2017-01-12 パナソニックIpマネジメント株式会社 画像処理装置、および、画像処理方法
CN103531176B (zh) * 2013-05-10 2016-08-17 Tcl集团股份有限公司 一种Android终端的字体显示优化方法及系统
CN104700362A (zh) * 2013-12-06 2015-06-10 富士通株式会社 文档图像处理装置和方法
US9251614B1 (en) * 2014-08-29 2016-02-02 Konica Minolta Laboratory U.S.A., Inc. Background removal for document images
CN107590447B (zh) * 2017-08-29 2021-01-08 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置
CN109378279B (zh) * 2018-11-12 2020-12-18 武汉新芯集成电路制造有限公司 晶圆检测方法及晶圆检测系统
CN110210316B (zh) * 2019-05-07 2022-08-12 南京理工大学 基于灰度图像的交通信号灯数字识别方法
CN110659645B (zh) * 2019-08-05 2023-01-31 沈阳工业大学 一种数字仪表字符识别方法
CN114677683B (zh) * 2022-04-06 2023-04-25 电子科技大学 应用于光通信激光器芯片显微字符识别的背景预处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256688A (ja) * 1988-08-23 1990-02-26 Toyota Central Res & Dev Lab Inc 文字切出し装置
JPH0394393A (ja) * 1989-09-07 1991-04-19 Canon Inc 文字認識装置
JPH08265753A (ja) * 1994-12-21 1996-10-11 Eastman Kodak Co 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置
JPH08305793A (ja) * 1995-04-28 1996-11-22 Nec Corp 宛名行抽出装置
JP2001043313A (ja) * 1999-07-30 2001-02-16 Toshiba Corp 文字切出し方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4092631A (en) * 1974-04-30 1978-05-30 Sharp Kabushiki Kaisha Pattern recognition systems
FR2672565B1 (fr) * 1991-02-12 1993-06-04 Intertechnique Sa Equipement de tete a bras articule.
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition
JPH07105312A (ja) * 1993-10-07 1995-04-21 Fujitsu Ltd 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP3027321B2 (ja) * 1994-09-27 2000-04-04 財団法人工業技術研究院 拘束のない手書き英数字のオンライン認識の方法及び装置
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
US5689585A (en) * 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
JP3008908B2 (ja) * 1997-11-10 2000-02-14 日本電気株式会社 文字切り出し装置および文字切り出し方式
DE19917725B4 (de) * 1999-04-20 2005-02-24 Sms Demag Ag Kühlverfahren für Walzgut und Kühlbett
CN1183436C (zh) * 2002-04-03 2005-01-05 摩托罗拉公司 用于手写字符的方向确定及其识别
US20030198386A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for identifying and extracting character strings from captured image data
US7010488B2 (en) * 2002-05-09 2006-03-07 Oregon Health & Science University System and method for compressing concatenative acoustic inventories for speech synthesis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256688A (ja) * 1988-08-23 1990-02-26 Toyota Central Res & Dev Lab Inc 文字切出し装置
JPH0394393A (ja) * 1989-09-07 1991-04-19 Canon Inc 文字認識装置
JPH08265753A (ja) * 1994-12-21 1996-10-11 Eastman Kodak Co 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置
JPH08305793A (ja) * 1995-04-28 1996-11-22 Nec Corp 宛名行抽出装置
JP2001043313A (ja) * 1999-07-30 2001-02-16 Toshiba Corp 文字切出し方法

Also Published As

Publication number Publication date
US20060245650A1 (en) 2006-11-02
US7715628B2 (en) 2010-05-11
JP4761996B2 (ja) 2011-08-31
CN100369049C (zh) 2008-02-13
CN1822027A (zh) 2006-08-23

Similar Documents

Publication Publication Date Title
JP4761996B2 (ja) 文字分割プログラム、文字分割装置および文字分割方法
US10817559B2 (en) Image processing apparatus with document similarity processing, and image processing method and storage medium therefor
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US20120099792A1 (en) Adaptive optical character recognition on a document with distorted characters
JP2003132358A (ja) 画像処理方法、装置およびシステム
JP2011048816A (ja) 識別方法、識別装置およびコンピュータプログラム
JP7244223B2 (ja) 電子文書における強調テキストの識別
US10455163B2 (en) Image processing apparatus that generates a combined image, control method, and storage medium
US11568623B2 (en) Image processing apparatus, image processing method, and storage medium
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
JP2006227768A (ja) 携帯端末における文字認識のための方法およびプログラム
US7130085B2 (en) Half-tone dot elimination method and system thereof
JP2008011135A (ja) 画像処理装置および画像処理プログラム
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2861860B2 (ja) 宛名行抽出装置
US8432555B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP4974794B2 (ja) 文書認識装置、文書認識方法、コンピュータプログラム
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JP2017076291A (ja) 認識プログラム、認識方法及び認識装置
CN113033360A (zh) 文档图像识别装置及方法
JPH06215181A (ja) 文字・文字列切り出し方法および文字認識装置
JPH0535914A (ja) 画像傾き検出方法
JP2008052468A (ja) 細線除去処理装置,細線除去処理方法,文字認識処理装置及び文字認識処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110607

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4761996

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees