JPWO2017094156A1 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法 Download PDF

Info

Publication number
JPWO2017094156A1
JPWO2017094156A1 JP2017553564A JP2017553564A JPWO2017094156A1 JP WO2017094156 A1 JPWO2017094156 A1 JP WO2017094156A1 JP 2017553564 A JP2017553564 A JP 2017553564A JP 2017553564 A JP2017553564 A JP 2017553564A JP WO2017094156 A1 JPWO2017094156 A1 JP WO2017094156A1
Authority
JP
Japan
Prior art keywords
character string
line
histogram
boundary
string region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017553564A
Other languages
English (en)
Other versions
JP6493559B2 (ja
Inventor
裕介 伊谷
裕介 伊谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2017094156A1 publication Critical patent/JPWO2017094156A1/ja
Application granted granted Critical
Publication of JP6493559B2 publication Critical patent/JP6493559B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

文字認識装置において、入力された画像データから抽出した文字列領域抽出部で抽出された文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成し、生成されたヒストグラムから行判定閾値を算出し、算出された行判定閾値に基づいて文字列領域における異なる行の境界を判定するようにした。本発明により、行の境目を判断するための閾値を行方向全体から得られる特徴を踏まえて適切に設定され、文字列領域内の文字列を適切な行に分離することができる。

Description

本発明は、文字認識装置及び文字認識方法に関するものである。
紙で作成されていた文書等を、例えばスキャナで読み込むことにより画像データとして電子化し保存する需要があり、これらの電子化された文書を活用する際には、キーワードで文書を検索することができるようにした文書検索及び管理システムがある。このようなシステムにおいて文書等を電子化する際に、文書内の文字を自動的に認識してキーワード化するため、文字認識技術が使用される。従来の文字認識技術においては、まず、画像データのどこに文字列が存在するかを大まかな範囲で特定し、その範囲の中で異なる行があるか否かを判別し、複数の行がある場合に適切に行を切り分ける処理を行うことにより文字認識の精度を向上させていた。
特許文献1の文字認識装置では、二値化された画像データから行方向に黒画素の頻度を示すヒストグラムを作成し、ヒストグラムの谷となる位置を行の境目の候補である行間位置として推定する。また、文字認識装置は予め1文字と認識されると思われる文字の領域を矩形で示す文字矩形領域を推定し、それぞれの文字矩形領域内の画像の文字らしさを示す確信度Cを算出する。そして、上記のように推定した行間位置が上記確信度Cの高い文字矩形を分断しなければその行間位置を行の境目と判定することで、複数の行がある場合に行を切り分けている。
特開2009−211432号公報
上記のような行の切り分け方法では、行の境目を決定する際に推定した文字矩形領域内の画像の文字らしさを示す確信度Cを用いているが、行間が狭い場合などに確信度Cの高い文字矩形領域が行間を跨いでいると、行間位置を行の境目として判定できず、適切に行を分断することができない。
本発明は、上記課題を解決するためになされたものであり、精度よく行を切り分けられる文字認識装置1を得ることを目的とする。
この発明に係る文字認識装置においては、入力された画像データから抽出した文字列領域抽出部で抽出された文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成し、生成されたヒストグラムから行判定閾値を算出し、算出された行判定閾値に基づいて文字列領域における異なる行の境界を判定するようにしたものである。
本発明によれば、画像データから文字列領域を抽出し、行方向の黒画素の頻度を示すヒストグラムから行判定閾値を設定するので、行の境目を判断するための閾値を行方向全体から得られる特徴を踏まえて適切に設定され、文字列領域内の文字列を適切な行に分離することができる。
実施の形態1に係る文字認識装置の構成図である。 本実施の形態1にかかる文字認識装置の文字列領域抽出部が文字列領域を抽出する動作の例を示す説明図である。 (a)は実施の形態1に係る文字式領域の例を示す説明図、(b)は実施の形態1に係る文字認識装置のヒストグラム生成部が生成するヒストグラムの例を示す説明図である。 実施の形態1に係る文字認識装置が領域ごとに重み係数ρを変更することが有用である場合の画像の例の説明図である。 実施の形態1に係る文字認識装置の動作を示すフローチャートである。 実施の形態1に係る文字認識装置の閾値算出部が行判定閾値を算出する動作を示す詳細フローチャートである。 実施の形態1に係る文字認識装置の行境界判定部における行の境目を推定する動作を示す詳細フローチャートである。 実施の形態2に係る文字認識装置の行境界判定部における行の境目を推定する動作を示す詳細フローチャートである。 実施の形態3に係る2行の長さが異なる場合の文字列領域のヒストグラムを生成した場合の画像及びヒストグラムの例の説明図である。 実施の形態3に係る文字認識装置の行境界判定部における行の境目を推定する動作を示す詳細フローチャートである。 実施の形態4に係る文字認識装置の行境界判定部における行の境目を推定する動作を示す詳細フローチャートである。 実施の形態1に係る文字認識装置をハードウェアで実現するためのハードウェア構成図である。 実施の形態1に係る文字認識装置をソフトウェアで実現する場合のハードウェア構成図である。
実施の形態1.
図1は、実施の形態1に係る文字認識装置1の構成図である。文字認識装置1は、画像データを二値化処理して二値化データを生成する二値化処理部2と、前記二値化データをもとに文字列領域を抽出して文字列領域データを生成する文字列領域抽出部3と、前記二値化データと前記文字列領域データから行方向の黒画素の頻度を示すヒストグラムを生成するヒストグラム生成部4と、前記ヒストグラムから行判定閾値を算出する閾値算出部5と、前記行判定閾値を用いて前記文字列領域における異なる行の境界を判定する行境界判定部6と、前記行境界判定部6が判定した行の境界に基づいて文字列領域の文字を認識する文字認識部7とを有して構成されている。
ここで、二値化処理部2は、スキャナやカメラなどの画像取り込み装置から送られてくる画像データの二値化処理を行い二値化データを生成する。二値化処理とは、濃淡のある画像を白と黒の2階調の画像に変換する処理であり、例えば二値化データのあるビット位置の画素値をα(x,y)とすると、α(x,y)は黒画素である場合に1、白画素である場合に0と変換する。具体的にはある閾値を定めて、各画素の値が閾値を上回っていれば白、下回っていれば黒に置き換えるという処理を行う。二値化処理の方法については上述したように1つの閾値を設定する方法に限らず、画像を輝度の範囲に応じて複数に分け、領域ごとに異なる閾値を設けることで二値化する等してもよい。文字認識のために、背景を含む画像データの余白を白画素に変換し、余白以外の文字、罫線、シンボル図形などを黒画素に変換する二値化処理も存在する。なお、二値化処理部2に入力する二値化対象の画像データは、画像や文字を表す種々のフォーマットで表されているものであればよく、例えばJPEG(Joint Photographic Experts Group)、TIFF(Tagged Image File Format)、BMP(Bit MaP)などの画像や文字に関するデータフォーマットで表される画像である。
文字列領域抽出部3では、二値化処理部2で生成された二値化データから文字列領域を抽出する。文字列とは、文字があると推定される二値化データの黒画素の集合を指すものである。また、文字列領域を抽出するとは、二値化データの中で黒画素の集合が検出された場合にその辺りに文字が存在すると推定し、検出した黒画素の集合を含む範囲であるx軸上の最初xstartから最後xendまでとy軸上の最初ystartから最後yendまでの位置情報を含む矩形状の領域を文字列領域として抽出することである。文字列領域抽出部3は文字列領域を抽出し、抽出した文字列領域の位置情報を含む矩形状の範囲を示すデータ、すなわち前記xstart、xend、ystart、yendの座標データ及び二値化データを文字列領域データとして生成する。
図2は、本実施の形態1にかかる文字認識装置1の文字列領域抽出部3が文字列領域3bを抽出する動作の例を示す説明図である。二値化処理部2で生成された二値化データが図2に示すような二値化画像3aを表している場合、文字列領域抽出部3は、この二値化画像3aの中で黒画素の集合を検出し、検出した黒画素の集合を含む矩形状の範囲を文字列領域3bとして抽出し、抽出した文字列領域3bの矩形状の範囲を示すデータを文字領域データとして生成する。文字列領域データは、例えば二値化画像3aにおける文字列領域3bのx軸上の最初の座標xstartから最後の座標xend及びy軸上の最初の座標ystartから最後の座標yendを示すデータである。上述した文字列領域3bの抽出方法は一例であり、文字列領域が抽出されるものであれば他の方法を用いてもよい。
また、文字列領域抽出部3は、抽出した文字列領域3bの形状、あるいは二値化画像の属性情報等から、抽出した文字列領域内の行の方向を推定する。
ヒストグラム生成部4では、文字列領域抽出部3で抽出された文字列領域を用いてヒストグラムを生成する。具体的には、ヒストグラム生成部4は、二値化処理部2で生成された二値化データと文字列領域抽出部3で生成された文字列領域データから、文字列領域を抽出する際に推定した行の方向において黒画素が出現する頻度を示すヒストグラムを生成する。図3(a)は文字式領域の例を示す説明図、図3(b)は実施の形態1に係る文字認識装置1のヒストグラム生成部4が生成するヒストグラムの例を示す説明図である。図3(a)では、二値化データのx軸と文字列領域3bのx軸の方向は一致しているが、文字式領域の推定した行の方向は二値化データのx軸と合わせるようにしてもよい。ヒストグラム生成部4はy軸の画素単位の座標ごとにx軸方向の黒画素数の合計を求め、ヒストグラムを生成する。このヒストグラムH(y)を生成する式の例を以下に示す。α(x,y)は座標(x,y)における二値化データの値を表しており、黒画素である場合に1、白画素である場合に0となっている。座標yの関数であるH(y)は、各座標yにおいて、文字列領域の行方向(=x軸方向)の座標の最初xstartから最後xendまでの範囲における黒画素の合計である。
Figure 2017094156
図3の例では、図3(a)に示す文字列領域3b内において文字が存在する部分では図(b)のヒストグラムにおいてy軸方向の黒画素頻度が多く、点線で挟まれる行境界領域4aでは、y軸方向の黒画素頻度が20程度と小さい様子がわかる。
閾値算出部5は、ヒストグラム生成部4で生成された文字列領域内におけるヒストグラムから、行の境目を判断するための閾値を算出する。文字が存在する場合はH(y)の値は大きく、行の境目ではH(y)は小さくなるため、H(y)の値をもって行の境目を判定することができる。この判定のための閾値を個別の認識対象画像それぞれのヒストグラムから求めることで、画像ごとの特徴を踏まえた閾値、特に文字単位のような微視的な判断基準でない、行方向全体から得られる特徴に基づいた閾値を設定することができる。この実施の形態1では、ヒストグラム生成部4で生成されたヒストグラムのピーク値Pを検出し、ピーク値Pから行判定閾値th1を算出する。閾値算出部5が、行判定閾値th1を算出する際に使用する式を以下に示す。ここでρは重み係数を示すパラメータである。
Figure 2017094156
重み係数ρは、ユーザまたは自動的に設定されるパラメータである。処理対象の画像における文字列の行間が狭い場合は、文字が存在する箇所と行の境目と推定される箇所との間でH(y)の値の差が小さく、行の境目付近のH(y)の値が十分小さくならない可能性があるため、適切な判定のために閾値を高めに設定する必要があり、このために重み係数ρを大きくする。一方、行間が広い場合は、文字が存在する箇所でH(y)のばらつきにより多少H(y)が低くなる部分があっても、そこを行の境目とみなしてしまわないよう閾値を低めに設定する必要があり、このために重み係数ρを小さくする。重み係数ρの設定は、画像全体で一定でも良いし、画像を領域に分割し、領域ごとに変更させてもよい。重み係数ρを領域ごとに変更する場合の領域の分け方としては、例えば、罫線で囲まれた領域や空白で囲まれた領域などがある。これらの領域を自動的に検出するために、罫線検出や空白検出、およびシンボル検出等をすることも可能であり、その手法は、従来より種々の方法が存在する。例えば、罫線検出及び空白検出には下記参考文献1の手法が、シンボル検出には下記参考文献2の手法がある。
参考文献1:平野敬、岡田康裕、依田文夫、“文書画像からの罫線抽出方式”、電子情報通信学会総合大会、1998年3月
参考文献2:米山昇吾、平野敬、岡田康裕、“図面画像内シンボル抽出方式の検討”、電子情報通信学会総合大会、2006年3月
領域ごとに重み係数ρを変更することが有用である場合の画像の例を図4に示す。図4のような画像の場合、行間が狭くなり行境界の行判定が難しいと推定される行判定難領域5aと、行間は広く行境界の行判定が容易であると推定される行判定容易領域5bがある。この場合、ユーザが予め行判定難領域5aの重み係数ρを大きくし、行判定容易領域5bの重み係数ρを小さく設定する。このような重み係数ρの設定により、文字の行間の広さによって行の境界を判定しやすい領域と判定しにくい領域など領域に合わせて適切な行判定閾値を設定することができる。なお、重み係数ρの設定は領域における黒画素の頻度や分布の傾向から自動的に設定されても良い。
上述した図3の例では、ヒストグラムのピーク値Pが102であり、重み係数ρを0.22とした結果、行判定閾値th1が22となった場合を示している。
行境界判定部6では、閾値算出部5によって算出された行判定閾値th1をもとに文字列領域における異なる行の境界を判定する。判定した行の境界は、行の境界が存在すると判定された行の位置情報を示すものである。行境界判定部6が行の境界とする判定条件は、以下の式である。H(y)が行判定閾値th1よりも小さい場合は座標yに行の境界があると推定し、H(y)が行判定閾値th1以上である場合は座標yに行の境界がないと推定する。
Figure 2017094156
そして、行の境界があると推定された座標yが1つの場合はその座標yを、また推定された座標が複数隣り合って存在する場合は、複数の座標yのうち中央に位置する座標yを行の境界であると判定する。行の境界があると判定された隣り合う複数の座標yのどこを行の境界と判定するかについては、中央に限らず、隣り合う複数の座標yの中から選定されれば良い。また、行の境界があると判定された座標yが隣り合わない場合にはその座標yを行境界であると判定する。行境界は1つの文字列領域に1つとは限らず複数存在する場合がある。
文字認識部7では、行境界判定部6が判定した行の境界判定と文字列領域抽出部3が抽出した文字列領域に基づいて文字列領域内の文字認識処理を行う。文字認識を行う方法として、従来より種々の方法が存在する。例えばランレングス補正を用いて画像劣化に対するロバスト性を向上させた下記参考文献の手法がある。
参考文献3:森稔、澤木美奈子、萩田紀博、村瀬洋、武川直樹、“ランレングス補正を用いた画像劣化にロバストな特徴抽出”、電子情報通信学会論文誌、Vol.J86−D2、No.7、pp.1049−1057、2003年7月
文字認識部7は文字認識処理が完了すると、文字認識結果を出力する。以上が文字認識装置1に係る構成である。
次に、本実施の形態1に係る文字認識装置1の動作について説明する。図5は、本実施の形態に係る文字認識装置1の動作を示すフローチャートである。
まず、ステップS1にて、二値化処理部2は画像データの二値化処理を行い二値化データを生成する。生成された二値化データは、文字列領域抽出部3に送られる。
ステップS2にて、文字列領域抽出部3はステップS1で生成された二値化データから文字列領域を抽出し、抽出した文字列領域を示す文字列領域データを生成する。また、文字列領域抽出部3は、抽出した文字列領域の形状、あるいは二値化画像の属性情報から、抽出した文字列領域内の行の方向を推定する。文字列領域抽出部3で生成された文字列領域データは入力した二値化データ及び推定した行方向を示すデータとともに文字認識部7に送られる。ここで、文字列領域は一つの二値化データに対して1つのみとは限らず、複数抽出される場合もある。以下のステップでは、ステップS2で抽出された文字列領域のうちの1つの文字認識処理について記載する。
ステップS3にて、ヒストグラム生成部4はステップS2で抽出された文字列領域を用いてヒストグラムを生成する。ヒストグラム生成部4は、ステップS1にて生成された二値化データとステップS2にて抽出された文字列領域データから、文字列領域を抽出する際に推定した行の方向において黒画素が出現する頻度を示すヒストグラムを生成する。図3(a)は推定した行の方向をx軸として正規化した画像の例であり、この画像に基づいて生成されるヒストグラムの例が図3(b)に示したものである。
ヒストグラム生成部4で生成されたヒストグラムを示すデータは、ステップS2にて生成された文字列領域データと共に閾値算出部5に送られる。
ステップS4にて、閾値算出部5はステップS3にて生成されたヒストグラムを用いて、行の境目を判断するための行判定閾値th1を算出する。算出された行判定閾値th1は、ステップS2にて生成された文字列領域データ及びステップS3で生成されたヒストグラムデータと共に行境界判定部6へ送られる。
ここで、この行判定閾値th1を算出するためのステップS4の詳細の動作について説明する。図6は、閾値算出部5が行判定閾値を算出する動作を示す詳細フローチャートである。
ステップS41にて、閾値算出部5はステップS3のヒストグラム生成部4で生成されたヒストグラム内のピーク値Pを検出する。
ステップS42にて、閾値算出部5はステップS41にて算出したピーク値Pと重み係数ρを用いて行判定閾値th1を算出する。
図3に示した例では、ヒストグラムのピーク値Pが102であり、重み係数ρを0.22とした結果、行判定閾値th1が22となった場合を示している。図3(b)においてH(y)がth1としての22より小さい行境界領域4aに対応して、図3(a)に示す文字領域の行境界領域4aのあたりに行の境界がある様子がわかる。重み係数ρは、上述したとおり、画像の種類ごと、あるいは画像内の領域ごとに適した値に調整することで、より適切な行判定を行うことができる。
ステップS5にて、行境界判定部6はステップS4で算出した行判定閾値th1を用いて文字列領域内における異なる行の境界を判定する。行境界判定部6は、行境界閾値th1とヒストグラムの値H(y)の値を比較することにより行の境目であると推定される座標yを1つまたは複数記憶する。
この行境界判定部6における行の境目を推定する動作を示す詳細フローチャートを図7に示す。
まず、ステップS51−1にて文字列領域データに含まれるystartすなわち文字列領域が始まる座標yを初期値として設定する。
次に、ステップS51−2にて行判定閾値th1と現在の座標yに対応するヒストグラムの値H(y)とを比較する。H(y)が行判定閾値th1よりも小さい場合(H(y)<th1)はこの座標yに行の境目がある可能性が高く、この場合はステップS51−3に進む。一方、H(y)が行判定閾値th1以上(H(y)≧th1)の場合はこの座標yには文字列が存在する可能性が高く、この場合はステップS54に進む。
ステップS51−3では、座標yを行の境界が存在すると推定される座標として記憶して、ステップS51−4に進む。
ステップS51−3終了後あるいはステップS51−2でH(y)が行判定閾値th1以上である場合は、ステップS51−4に進み、yをインクリメントして次の座標yとし、ステップS51−5でyが文字列領域32が終わる座標yendと判定されるまで、ステップS51−2からステップS51−5までの動作を繰り返す。
このような動作により、文字列領域内において行の境目と推定される座標yが1つまたは複数抽出され、記憶される。
そして、行境界判定部6はステップS51−6で、行の境目があると推定された座標yが1つの場合はその座標yを、また推定された座標が複数隣り合って存在する場合は、複数の座標yのうち中央に位置する座標yを行の境界であると判定する。
行の境界であると判定したy座標は行境界データとして、ステップS2にて生成された文字列領域データと共に文字認識部7に送られる。
ステップS6にて、文字列認識部はステップS2にて生成された文字列領域データ及びステップS5にて判定した行境界データに基づいて文字認識処理を行う。文字認識部7は文字認識処理が完了すると、文字認識結果を出力する。以上のようにして本実施の形態に係る文字認識装置1により、行の境界の判定、文字認識が行われる。
以上のように、実施の形態1に係る文字認識装置1によれば、入力された画像データから抽出した文字列領域抽出部3で抽出された文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成し、生成されたヒストグラムから行判定閾値を算出し、算出された行判定閾値に基づいて文字列領域における異なる行の境界を判定する。これにより、行の境目を判断するための閾値を行方向全体から得られる特徴を踏まえて適切に設定され、文字列領域内の文字列を適切な行に分離することができる。
実施の形態2.
次に、実施の形態2に係る文字認識装置1について説明する。実施の形態1では、行境界判定部6の判定基準として、黒画素の頻度を対象とした行判定閾値th1を用いて行判定を行ったが、実施の形態2では黒画素の頻度に加え、ヒストグラムの傾きg(y)を行判定基準として用いることで行境界判定を行う。
この実施の形態2では、閾値算出部5と行境界判定部6の詳細構成及び動作が実施の形態1と異なり、他の部分は実施の形態1と同様である。
閾値算出部5は、実施の形態1と同様にしてヒストグラム生成部4で生成された文字列領域内におけるヒストグラムから、行の境目を判断するための行判定閾値th1を算出する。また、閾値算出部5には、ヒストグラムの傾きg(y)に関する行判定閾値th2があらかじめ記憶されている。ヒストグラムの傾きg(y)は、dH(y)/dyである。ヒストグラムの傾きg(y)は、行の境目では急になるので数値が大きくなり、文字が存在する領域では緩やかになるので数値が小さくなるため、ヒストグラムの傾きに関する閾値を設定することにより行の境目を判定することができる。
個別の認識対象画像それぞれのヒストグラムから求めた行判定閾値th1を用いるとともに、ヒストグラムの傾きg(y)に関する行判定閾値th2をも用いることで、画像ごとの特徴を踏まえた閾値、特に文字単位のような微視的な判断基準でない、行方向全体から得られる特徴に基づいた閾値を設定するとともに、黒画素の頻度によって行の境目であると推定される座標yについて、さらにヒストグラムの傾きg(y)を対象とした行判定閾値th2を用いることにより、行の境界でない可能性が高い座標yを除去し、より精度のよい行の境目を推定することができる。
行境界判定部6では、閾値算出部5によって算出された行判定閾値th1に加え、行判定閾値th2をもとに文字列領域における異なる行の境界を判定する。
行境界判定部6では、閾値算出部5によって算出された行判定閾値th1に基づいて行境界があると推定された座標yについて、さらに以下の式による判断を行い、この式が成り立つ場合、座標yに行境界があると推定し、これ以外の場合は座標yに行の境界がないと推定する。
Figure 2017094156
H(y)が行判定閾値th1よりも小さい、かつ、H(y)―H(y―1)が行判定閾値th2よりも大きい場合は座標yに行の境界があると推定し、それ以外の場合は位置yに行の境界がないと推定する。なお、ここではヒストグラムの傾きg(y)は、以下の式により、H(y)とH(y―1)の差分値を準用している。
Figure 2017094156
そして、行境界判定部6は行の境目があると推定された座標yが1つの場合はその座標yを、行の境界があると推定された座標yが複数隣り合って存在する場合は、複数の座標yのうち中央の位置を行の境界であると判定する。行の境界があると判定された隣り合う複数の座標yのどこを行の境界と判定するかについては、中央に限らず、隣り合う複数の座標yの中から選定されれば良い。また、行の境界があると判定された座標yが隣り合わない場合にはその座標yを行の境界であると判定する。行の境界は1つの文字列領域に1つとは限らず複数存在する場合がある。
判定した行の境界は、行の境界が存在すると判定された行の位置情報を示すものであり、行境界データとして、文字列領域データと共に文字認識部7に送られる。
その他の構成については実施の形態1と同様である。
次に、本実施の形態2に係る文字認識装置1の動作について説明する。動作についてはステップS4とステップS5の詳細動作が実施の形態1と異なる。
ステップS4では、閾値算出部5はステップS3にて生成されたヒストグラムを用いて、行の境目を判断するための行判定閾値th1を算出する。行判定閾値th1の算出方法については実施の形態1と同様である。閾値算出部5は、行判定閾値th1の他に行判定閾値th2を持つ。行判定閾値th2は、ユーザによって予め設定された固定値であり、閾値算出部5に予め記憶されている。閾値算出部5は、行判定閾値th1及びth2を行境界判定部6に送る。
この行境界判定部6における行の境目を推定する動作を示す詳細フローチャートを図8に示す。
まず、ステップS52−1にて文字列領域データに含まれるystartすなわち文字列領域が始まる座標yを初期値として設定する。
次に、ステップS52−2にて行判定閾値th1と現在の座標yに対応するヒストグラムの値H(y)とを比較する。H(y)が行判定閾値th1よりも小さい場合(H(y)<th1)はこの座標yに行の境目がある可能性が高く、この場合はステップS52−3に進む。一方、H(y)が行判定閾値th1以上(H(y)≧th1)の場合はこの座標yには文字列が存在する可能性が高く、この場合はステップS52−5に進む。
ステップS52−3にて行判定閾値th2と現在の座標yに対応するヒストグラムの傾きH(y)―H(y―1)とを比較する。H(y)―H(y―1)が行判定閾値th2よりも大きい場合(H(y)―H(y―1)>th2)は、ヒストグラムの傾きが急であることからこの座標yに行の境目がある可能性が高いと推定でき、この場合はステップS52−4に進む。一方、H(y)―H(y―1)が行判定閾値th2以下(H(y)―H(y―1)≦th2)の場合は、この座標yには行判定閾値th1より黒画素数が少ないものの、ヒストグラムの傾きが緩やかであることから行の境目ではない可能性が高く、この場合はステップS52−5に進む。
ステップS52−4では、座標yを行の境界が存在すると推定される座標として記憶して、ステップS52−5に進む。
ステップS52−4終了後、あるいはステップS52−2でH(y)が行判定閾値th1以上と判断、あるいはステップS52−3でH(y)―H(y―1)が行判定閾値th2以下と判断された場合は、ステップS52−5に進み、yをインクリメントして次の座標yとし、ステップS52−6でyの文字列領域32が終わる座標yendと判定されるまで、ステップS52−2からステップS52−5までの動作を繰り返す。
このような動作により、文字列領域内において行の境目と推定される座標yが1つまたは複数抽出され、記憶される。
そして、行境界判定部6はステップS52−7で、行の境目があると推定された座標yが1つの場合はその座標yを、また推定された座標が複数隣り合って存在する場合は、複数の座標yのうち中央に位置する座標yを行の境界であると判定する。
なお、ステップS52−2で行った黒画素数による推定と、ステップS52−3で行ったヒストグラムの傾きによる推定は、入れ替えて行っても良い。この場合、まずヒストグラムの傾きにより行の境目の候補の座標を推定し、その推定された候補についてさらに黒画素数による推定を行うことで、行の境目の候補の座標が決まる。
また、ステップS52−2で行った黒画素数による推定と、ステップS52−3で行ったヒストグラムの傾きによる推定とを統合し、以下のコスト関数Cの式を判定用の式として用いることも可能である。
Figure 2017094156
以上のように、実施の形態2に係る文字認識装置1によれば、入力された画像データから抽出した文字列領域抽出部3で抽出された文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成し、生成されたヒストグラムから行判定閾値を算出し、算出された行判定閾値th1に基づいて文字列領域における異なる行の境界を推定する。さらに、ヒストグラムの傾きに基づいて行の境界を推定することにより、より行の境目を判断するための閾値を行方向全体から得られる特徴を踏まえて適切に設定され、文字列領域内の文字列を適切な行に分離することができる。
実施の形態3.
次に、実施の形態3に係る文字認識装置1について説明する。実施の形態1では、行境界判定部6の判定基準として、黒画素の頻度を対象とした行判定閾値th1を用いて行判定を行ったが、実施の形態3では黒画素の頻度に加え、ヒストグラムから検出されるピーク値P(n)を行判定基準として用いることで行境界判定を行う。
この実施の形態3では、閾値算出部5と行境界判定部6の詳細構成及び動作が実施の形態1と異なり、他の部分は実施の形態1と同様である。
閾値算出部5は、実施の形態1と同様にしてヒストグラム生成部4で生成された文字列領域内におけるヒストグラムから、行の境目を判断するための行判定閾値th1を算出する。また、閾値算出部5には、ヒストグラムのピーク値の差P(n)−P(n−1)に関する行判定閾値th3があらかじめ記憶されている。
図9に、2行の長さが異なる場合の文字列領域のヒストグラムを生成した場合の画像及びヒストグラムの例を示す。複数の行が存在し、かつ、その長さが異なる場合、ヒストグラムのピーク値の差P(n)−P(n−1)が大きくなる。この性質を利用して、ヒストグラムのピーク値の差に関する閾値を設定することにより、異なる長さの複数の行が存在する場合に行の境目を判定することができる。
個別の認識対象画像それぞれのヒストグラムから求めた行判定閾値th1を用いるとともに、ヒストグラムのピーク値の差P(n)―P(n−1)に関する行判定閾値th3をも用いることで、画像ごとの特徴を踏まえた閾値、特に文字単位のような微視的な判断基準でない、行方向全体から得られる特徴に基づいた閾値を設定するだけでなく、複数行の長さがそれぞれ異なる場合にも精度のよい行の境目を推定することができる。
行境界判定部6では、閾値算出部5によって算出された行判定閾値th1に加え、行判定閾値th3をもとに文字列領域における異なる行の境界を判定する。
まず、行境界判定部6は、H(y)が行判定閾値th1よりも小さい場合は座標yに行の境界があると推定し、H(y)が行判定閾値th1以上である場合は座標位置yに行の境界がないと推定する。
そして、行境界判定部6は、行境界判定部6は行の境目があると推定された座標yが1つの場合はその座標yを、行の境目があると推定された座標yが1つの場合は、複数の座標yのうち中央の位置を行の境界であると判定する。行の境界があると判定された隣り合う複数の座標yのどこを行の境界と判定するかについては、中央に限らず、隣り合う複数の座標yの中から選定されれば良い。また、行の境界があると判定された座標yが隣り合わない場合にはその座標yを行の境界であると判定する。行の境界は1つの文字列領域に1つとは限らず複数存在する場合がある。
一方、行境界判定部6は、ピーク差P(n)―P(n−1)を算出する。図9に示すように、行境界判定部6は生成したヒストグラムのピークを全て検出し、ピーク値P(n)と隣り合うピーク値P(n−1)との差を算出する。そして、行境界判定部6は以下の式により、ピーク値の差P(n)―P(n−1)が行判定閾値th3よりも大きい場合はそのP(n)とP(n−1)をとるそれぞれのy座標の間に行の境界があると推定し、差P(n)―P(n−1)が行判定閾値th3よりも小さい場合はそのP(n)とP(n−1)をとるそれぞれのy座標の間に行の境界がないと推定する。ピーク値の差P(n)―P(n−1)が行判定閾値th3よりも大きい場合は、P(n)とP(n−1)の間に行の境界があると推定されるため、ピーク値P(n)をとる座標yとピーク値P(n−1)をとる座標yn−1の中央の位置を行の境界であると判定する。P(n)の座標yとP(n−1)の座標yn−1との間でどこを行の境界と判定するかについては、中央に限らず、隣り合う複数の座標yの中から選定されれば良い。
Figure 2017094156
判定した行の境界は、行の境界が存在すると判定された行の位置情報を示すものであり、行境界データとして、文字列領域データと共に文字認識部7に送られる。
その他の構成については実施の形態1と同様である。
次に、本実施の形態2に係る文字認識装置1の動作について説明する。動作についてはステップS4とステップS5の詳細動作が実施の形態1と異なる。
ステップS4では、閾値算出部5はステップS3にて生成されたヒストグラムを用いて、行の境目を判断するための行判定閾値th1を算出する。行判定閾値th1の算出方法については実施の形態1と同様である。閾値算出部5は、行判定閾値th1の他に行判定閾値th3を持つ。行判定閾値th3は、ユーザによって予め設定された固定値であり、閾値算出部5に予め記憶されている。閾値算出部5は、行判定閾値th1及びth3を行境界判定部6に送る。
この行境界判定部6における行の境目を推定する動作を示す詳細フローチャートを図10に示す。
行境界閾値th1を用いた行境界判定は、実施の形態1と同様である。行境界判定部は実施の形態1で説明した図7のフローチャートによる動作を終えると、図10に記載したフローチャートによる動作を行う。
まず、ステップS53−1にて文字列領域データに含まれるピーク値のカウント初期値としてn=1を設定する。
次に、ステップS53−2にて行判定閾値th3と隣り合うピーク値の差P(n)−P(n−1)とを比較する。ピーク値の差P(n)−P(n−1)が行判定閾値th3よりも大きい場合(P(n)−P(n−1)>th3)はピーク値P(n)、P(n−1)をとるそれぞれのy座標の間に行の境目がある可能性が高く、この場合はステップS53−3に進む。一方、ピーク値の差P(n)−P(n−1)が行判定閾値th3以下(P(n)−P(n−1)≦th3)の場合はピーク値の差P(n)―P(n−1)からは行の有無を判断できず、この場合はステップS53−4に進む。
ステップS53−3では、ピーク値P(n)、P(n−1)をとるそれぞれのy座標の間を、行の境界が存在すると推定される座標として記憶して、ステップS53−4に進む。
ステップS53−3終了後、あるいはステップS53−2でP(n)−P(n−1)が行判定閾値th3以下と判断された場合は、ステップS53−4に進んで、nをインクリメントし、ステップS53−5でnがヒストグラムの最後のピーク値P(nend)のカウント値であるnendと判定されるまで、ステップS53−2からステップS53−5までの動作を繰り返す。
このような動作により、文字列領域内において行の境目と推定される座標yが1つまたは複数抽出され、記憶される。
そして、行境界判定部6はステップS53−6にて、行の境目があると推定された座標yが1つの場合はその座標yを、またピーク値P(n)からピーク値P(n−1)までの座標yが複数存在する場合は、複数の座標yのうち中央に位置する座標yを行の境界であると判定する。
以上のようにして、図7のフローチャートにより行境界閾値th1に基づいた判定で得られた行境界データと、図10のフローチャートにより行境界閾値th3に基づいた判定で得られた行境界データは、文字認識部7に送られる。文字認識部7では、これら両方の行境界データを用いて、実施の形態1と同様に文字認識を行う。
なお、行判定閾値th1を用いる図7のフローチャートの動作と行判定閾値th3を用いる図10のフローチャートの動作の順序は逆でも良い。
このほかの動作については実施の形態1と同様である。
以上のように、実施の形態3に係る文字認識装置1によれば、入力された画像データから抽出した文字列領域抽出部3で抽出された文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成し、生成されたヒストグラムから行判定閾値を算出し、算出された行判定閾値th1に基づいて文字列領域における異なる行の境界を推定する。さらに、ヒストグラムの隣り合うピーク値の差に基づいて行の境界を推定することにより、行の長さが異なる場合に、より明確に、文字列領域内の文字列を適切な行に分離することができる。
なお、本実施の形態では行判定閾値th3とピーク値の差P(n)−P(n−1)を比較して行の境界を判定した。しかし、行判定閾値th3を用いる図10のフローチャートの動作から得られた行境界データは、座標のみを示すのではなく、その座標に行の境界がある確率を示す情報も含めたデータとしてもよい。この確率は、例えば、行判定閾値th3からピーク値の差P(n)−P(n−1)を引いて行判定閾値th3で割ることによって算出する。文字認識部7では、この確率に基づいて、行境界データに示された座標を行の境目として採用するか否かを選択することが可能となる。
実施の形態4.
次に、実施の形態4に係る文字認識装置1について説明する。実施の形態2では、行境界判定部6の判定基準として、黒画素の頻度を対象とした行判定閾値th1及びヒストグラムの傾きg(y)を行判定基準として用いることで行境界判定を行ったが、本実施の形態ではヒストグラムの傾きg(y)のみを行判定基準として行の境界を判定する。
この実施の形態4では、閾値算出部5と行境界判定部6の詳細構成及び動作が実施の形態2と異なり、他の部分は実施の形態2と同様である。
閾値算出部5は、ヒストグラムの傾きg(y)に関する行判定閾値th2があらかじめ記憶されている。ヒストグラムの傾きg(y)は、dH(y)/dyである。ヒストグラムの傾きg(y)は、行の境目では急になるので数値が大きくなり、文字が存在する領域では緩やかになるので数値が小さくなるため、ヒストグラムの傾きに関する閾値を設定することにより行の境目を判定することができる。
行境界判定部6では、行判定閾値th2をもとに文字列領域における異なる行の境界を判定する。
まず、行境界判定部6では、H(y)−H(y−1)がth2よりも大きい場合に座標yに行境界があると推定し、H(y)−H(y−1)がth2よりも小さい場合は座標yに行の境界がないと推定する。
Figure 2017094156
ヒストグラムの傾きg(y)は、H(y)とH(y―1)の差分値として仮定して算出することができる。
Figure 2017094156
そして、行境界判定部6は行の境目があると推定された座標yが1つの場合はその座標yを、行の境界があると推定された座標yが複数隣り合って存在する場合は、複数の座標yのうち中央の位置を行の境界であると判定する。行の境界があると判定された隣り合う複数の座標yのどこを行の境界と判定するかについては、中央に限らず、隣り合う複数の座標yの中から選定されれば良い。また、行の境界があると判定された座標yが隣り合わない場合にはその座標yを行の境界であると判定する。行の境界は1つの文字列領域に1つとは限らず複数存在する場合がある。
判定した行の境界は、行の境界が存在すると判定された行の位置情報を示すものであり、行境界データとして、文字列領域データと共に文字認識部に送られる。
その他の構成については実施の形態1と同様である。
次に、本実施の形態4に係る文字認識装置1の動作について説明する。動作についてはステップS4とステップS5の詳細動作が実施の形態1と異なる。
ステップS4では、閾値算出部5は、行判定閾値th2を行境界判定部6に送る。行判定閾値th2は、ユーザによって予め設定された固定値であり、閾値算出部5に予め記憶されている。
この行境界判定部6における行の境目を推定する動作を示す詳細フローチャートを図11に示す。
まず、ステップS54−1にて文字列領域データに含まれるystartすなわち文字列領域が始まる座標yを初期値として設定する。
次に、ステップS54−2にて行判定閾値th2と現在の座標yに対応するヒストグラムの傾きH(y)―H(y―1)とを比較する。H(y)―H(y―1)が行判定閾値th2よりも大きい場合(H(y)―H(y―1)>th2)は、ヒストグラムの傾きが急であることからこの座標yに行の境目がある可能性が高いと推定でき、この場合はステップS54−3に進む。一方、H(y)―H(y―1)が行判定閾値th2以下(H(y)―H(y―1)≦th2)の場合は、この座標yには行判定閾値th2より黒画素数が少ないものの、ヒストグラムの傾きが緩やかであることから、行の境目ではない可能性が高く、この場合はステップS54−4に進む。
ステップS54−3では、座標yを行の境界が存在すると推定される座標として記憶して、ステップS54−4に進む。
ステップS54−3終了後、あるいはステップS54−2でP(n)―P(n−1)が行判定閾値th2以下と判断された場合は、ステップS54−4に進み、yをインクリメントして次の座標yとし、ステップS54−5でyの文字列領域32が終わる座標yendと判定されるまで、ステップS54−2からステップS54−5までの動作を繰り返す。
このような動作により、文字列領域内において行の境目と推定される座標yが1つまたは複数抽出され、記憶される。
そして、行境界判定部6はステップS54−6にて、行の境目があると推定された座標yが1つの場合はその座標yを、また推定された座標が複数隣り合って存在する場合は、複数の座標yのうち中央に位置する座標yを行の境界であると判定する。
このほかの動作については実施の形態1と同様である。
以上のように、実施の形態4に係る文字認識装置1によれば、入力された画像データから抽出した文字列領域抽出部3で抽出された文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成し、生成されたヒストグラムからヒストグラムの傾きに基づいて行の境界を推定することにより、行の境目を判断するための閾値を行方向全体から得られる特徴を踏まえて適切に設定され、文字列領域内の文字列を適切な行に分離することができる。
なお、上記実施の形態はいずれも、二値化処理部2にて二値化データを生成して用いているが、対象データは二値化データに限らず、文字部分と行の境界部分が区別できるデータであれば、例えば画素を多値で表す多値化データ、あるいは色度を示すデータを用いることも可能である。
また、上記実施の形態はいずれも、文字式領域抽出部にて文字列領域データは二値化データを含むものとした。しかし、二値化データは二値化処理部2からそれぞれ二値化データを必要とする各部へ直接送ってもよい。二値化データに限らず、他のデータも各部からそのデータを必要とする各部へ直接送ってよい。
また、上記実施の形態はいずれも、行境界判定部6にて行の境目があると推定された座標yが複数隣り合って存在する場合のみ、複数の座標yのうち中央の位置を行の境界であると判定した。しかし、一定の範囲を設け、行の境目があると推定された座標yが一定の範囲内であるならば座標yが隣り合って存在すると推定し、中央の位置を行の境界であると判定してもよい。
なお、上記実施の形態はいずれも、図12及び図13に示す構成において実現される。図12は、実施の形態1に係る文字認識装置をハードウェアで実現するためのハードウェア構成図である。スキャナやカメラで構成される画像取り込み装置8で画像の入力が行われる。二値化処理部2、文字列抽出部3、ヒストグラム生成部4、閾値算出部5、行境界判定部6及び文字認識部7は処理回路9により実現される。処理回路9は、例えば単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサまたはこれらを組み合わせた各種電子回路で実現してもよい。ディスプレイ10は処理の途中経過などを表示するものである。また、それぞれのプログラムはハードディスク11に格納される。
図13は、実施の形態1に係る文字認識装置をソフトウェアで実現する場合のハードウェア構成図である。このように文字認識装置1をコンピュータで構成した場合は、プロセッサ12を二値化処理部2、文字列抽出部3、ヒストグラム生成部4、閾値算出部5、行境界判定部6及び文字認識部7として機能させる。プロセッサ12は、ソフトウェアやファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。これらのソフトウェアやファームウェアはハードディスク11に格納され、実行する際にはハードディスク11からメモリ13に取り出されることにより機能する。

1.文字認識装置
2.二値化処理部
3.文字列領域抽出部
3a.二値化画像
3b文字列領域
4.ヒストグラム生成部
4a.行境界領域
5.閾値算出部
5a.行判定難領域
5b.行判定容易領域
6.行境界判定部
7.文字認識部
8.画像取り込み装置
9.処理回路
10.ディスプレイ
11.ハードディスク
この発明に係る文字認識装置は、入力された画像データから文字列領域を抽出する文字列領域抽出部と、文字列領域抽出部で抽出された文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成するヒストグラム生成部と、ヒストグラム生成部で生成されたヒストグラムから行判定閾値を算出する閾値算出部と、閾値算出部で算出された行判定閾値に基づいて文字列領域における異なる行の境界を判定する行境界判定部と、文字列領域抽出部で抽出された文字列領域と行境界判定部で判定された行の境界に基づいて文字列領域の文字を認識する文字認識部とを備え、閾値算出部により前記ヒストグラムから算出される行判定閾値は、ヒストグラムの傾きに対する閾値、または、ヒストグラムの複黒画素の頻度の数のピーク値の差分に対する閾値であることを特徴とする。

Claims (6)

  1. 入力された画像データから文字列領域を抽出する文字列領域抽出部と、
    前記文字列領域抽出部で抽出された前記文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成するヒストグラム生成部と、
    前記ヒストグラム生成部で生成された前記ヒストグラムから行判定閾値を算出する閾値算出部と、
    前記閾値算出部で算出された前記行判定閾値に基づいて前記文字列領域における異なる行の境界を判定する行境界判定部と、
    前記文字列領域抽出部で抽出された前記文字列領域と前記行境界判定部で判定された行の境界に基づいて前記文字列領域の文字を認識する文字認識部と、
    を備えた文字認識装置。
  2. 前記閾値算出部により前記ヒストグラムから算出される前記行判定閾値は、黒画素の頻度に対する閾値であることを特徴とする請求項1に記載の文字認識装置。
  3. 前記黒画素の頻度の閾値は、前記ヒストグラムのピーク値に係数をかけて求めることを特徴とする請求項2に記載の文字認識装置。
  4. 前記閾値算出部により前記ヒストグラムから算出される前記行判定閾値は、前記ヒストグラムの傾きに対する閾値であることを特徴とする請求項1に記載の文字認識装置。
  5. 前記閾値算出部により前記ヒストグラムから算出される前記行判定閾値は、前記ヒストグラムの複黒画素の頻度の数のピーク値の差分に対する閾値であることを特徴とする請求項1に記載の文字認識装置。
  6. 入力された画像データから文字列領域を抽出する文字列領域抽出ステップと、
    前記文字列領域抽出ステップで抽出された前記文字列領域の行方向の黒画素の頻度を示すヒストグラムを生成するヒストグラム生成ステップと、
    前記ヒストグラム生成ステップで生成された前記ヒストグラムから行判定閾値を算出する閾値算出ステップと、
    前記閾値算出ステップで算出された前記行判定閾値に基づいて前記文字列領域における異なる行の境界を判定する行境界判定ステップと、
    前記文字列領域抽出ステップで抽出された前記文字列領域と前記行境界判定ステップで判定された行の境界に基づいて前記文字列領域の文字を認識する文字認識ステップと、
    を備えた文字認識方法。
JP2017553564A 2015-12-03 2015-12-03 文字認識装置及び文字認識方法 Active JP6493559B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/083948 WO2017094156A1 (ja) 2015-12-03 2015-12-03 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JPWO2017094156A1 true JPWO2017094156A1 (ja) 2018-02-08
JP6493559B2 JP6493559B2 (ja) 2019-04-03

Family

ID=58796627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017553564A Active JP6493559B2 (ja) 2015-12-03 2015-12-03 文字認識装置及び文字認識方法

Country Status (2)

Country Link
JP (1) JP6493559B2 (ja)
WO (1) WO2017094156A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195462A (ja) * 1992-12-22 1994-07-15 Fujitsu Ltd 画像の傾き角度計測方式
JP2004171560A (ja) * 2002-11-21 2004-06-17 Nariyuki Motoi 合成画像提供システム、合成画像生成プログラム、情報処理装置及びデータキャリア
JP2004341977A (ja) * 2003-05-19 2004-12-02 Mitsubishi Electric Corp 文字認識装置及び携帯情報端末
JP2007165983A (ja) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> メタデータ自動生成装置、メタデータ自動生成方法、メタデータ自動生成プログラムおよびプログラムを記録した記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195462A (ja) * 1992-12-22 1994-07-15 Fujitsu Ltd 画像の傾き角度計測方式
JP2004171560A (ja) * 2002-11-21 2004-06-17 Nariyuki Motoi 合成画像提供システム、合成画像生成プログラム、情報処理装置及びデータキャリア
JP2004341977A (ja) * 2003-05-19 2004-12-02 Mitsubishi Electric Corp 文字認識装置及び携帯情報端末
JP2007165983A (ja) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> メタデータ自動生成装置、メタデータ自動生成方法、メタデータ自動生成プログラムおよびプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP6493559B2 (ja) 2019-04-03
WO2017094156A1 (ja) 2017-06-08

Similar Documents

Publication Publication Date Title
CN107067389B (zh) 一种图像篡改盲取证方法
JP5844783B2 (ja) テキスト領域を含むグレースケール文書画像を処理する方法、グレースケール文書画像の少なくともテキスト領域を二値化する方法、グレースケール文書画像においてグリッドを形成するテーブルの抽出方法及びプログラム
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
JP6569500B2 (ja) 画像処理装置及び画像処理方法
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
WO2014131339A1 (zh) 字符识别方法和字符识别装置
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
TW201437925A (zh) 物體識別裝置、方法及電腦程式產品
US20180184012A1 (en) Image processing apparatus, control method, and storage medium
JP6177541B2 (ja) 文字認識装置、文字認識方法及びプログラム
JP2011248702A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体
JP6338429B2 (ja) 被写体検出装置、被写体検出方法及びプログラム
US9167129B1 (en) Method and apparatus for segmenting image into halftone and non-halftone regions
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
JP2008011484A (ja) 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体
JP5984880B2 (ja) 画像処理装置
JP2021111228A (ja) 学習装置、学習方法、及びプログラム
JP6493559B2 (ja) 文字認識装置及び文字認識方法
JP2010225047A (ja) ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体
JP6580201B2 (ja) 被写体検出装置、被写体検出方法及びプログラム
JP2019021085A (ja) 画像処理プログラム、画像処理方法及び画像処理装置
JP2014127763A (ja) 画像処理装置、画像処理方法及びプログラム
US11778122B2 (en) Apparatus, method, and storage medium for removing shading dots
WO2017088478A1 (zh) 数字分离方法及装置
JP2017207837A (ja) 画像検査装置、画像検査方法、およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171004

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190218

R151 Written notification of patent or utility model registration

Ref document number: 6493559

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250