JP2023505663A

JP2023505663A - 文字分割方法、装置、および、コンピュータ可読記憶媒体

Info

Publication number: JP2023505663A
Application number: JP2022533643A
Authority: JP
Inventors: 霍成海; 張楠▲ゲン▼
Original assignee: Canaan Bright Sight Co Ltd
Current assignee: Canaan Bright Sight Co Ltd
Priority date: 2019-12-05
Filing date: 2020-09-29
Publication date: 2023-02-10
Anticipated expiration: 2040-09-29
Also published as: EP4071665A1; JP7508556B2; EP4071665A4; JP2024050880A; WO2021109697A1; US20230009564A1; KR20220139292A

Abstract

本発明は、文字分割方法、装置、および、コンピュータ可読記憶媒体を提供する。文字分割方法の一態様では、文字領域画像を階調画像に変換するステップ（ステップ１０１）、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換するステップ（ステップ１０２）、投影法により、エッジ二値画像から、文字枠分割ブロックを取得するステップ（ステップ１０３）、および、輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するとともに、目標文字領域に応じて、文字領域画像に対して文字分割を行うステップ（ステップ１０４）を含む。文字分割方法の別の一態様では、文字領域画像を階調画像に変換するステップ（ステップ７０１）、ファジィＣ－平均クラスタリングアルゴリズムにより、階調画像に対してクラスタ分析を行うとともに、クラスタ分析の結果から、階調画像に対して二値化処理を行うステップ（ステップ７０２）、投影法により、二値画像から、文字位置決めブロックを取得するステップ（ステップ７０３）、および、文字位置決めブロックの位置情報に基づき、文字領域画像に対して文字分割を行うステップ（ステップ７０４）、を含む。これらの方法及び装置によれば、質が低い画像に対しても文字分割を行うことができる。

Description

本発明は、デジタル画像処理の技術分野に属するものであり、具体的に、文字分割方法、装置、および、コンピュータ可読記憶媒体に関する。

本部分は、特許請求の範囲に記載の本発明の実施形態のために、背景又は上下文を提供することを意図したものである。ここでの記載は、本部分に含まれることが原因で従来技術として認められるものではない。

現在、新型電子系メーターは既に幅広く応用されているが、工業環境下では、中断されることを許容しない生産環境において、新型電子系メーターへの交換ができないため、従来型の数字系メーターが依然として、多く使用されている。上記場合に対して、従来型メーターにカメラを取り付けることで、画像の収集後、遠隔メーター読み取りを行うという汎用的な解決手段が挙げられる。ここで、文字分割機能は、遠隔メーター読み取りシステムのベースとコアとして、システムの良し悪し判断の決め手となる。

従来の文字分割方法では、メーターの文字領域画像を二値化処理した後、投影の方式により、分割された文字を取得することが一般的である。ここで、二値化の方法として、通常、１、エッジ検出法、２、ヒストグラム閾値法、３、クラスタ技術が挙げられる。

発明者は、上記方案を実現する過程では、以下の技術的課題を見出した。

実際な生産環境において、ダイヤルには、錆、汚れ、光反射等の問題が発生して、図２に示すような画像を収集してしまう場合がある。さらに、文字分割を行う際、上記エッジ検出法が用いられると、（より完全な文字エッジを取得することができるように）緩いパラメータ設定を選択すれば、汚れ又は光反射などの要素に起因した偽エッジが多く混入されるようになるが、一方、厳しいパラメータ設定の場合、目標文字のエッジ情報が失われてしまう可能性が非常に高い。また、上記他の２種類の方法が用いられると、深刻な文字固着問題が起こる。以上により、文字分割の効果に対して直接に影響を与え、さらに、後続の文字識別の精度に対しても影響を及ぼすこととなる。

上述したように、従来技術では、質がよくない画像に対する文字分割の実行が困難であったという問題に対し、文字分割方法、装置、及び、コンピュータ可読記憶媒体を提案しており、このような方法及び装置によって、上記問題を解決することが可能である。

本発明では、以下の方案が提供される。

第１の態様では、少なくとも１つの文字枠を含む文字領域画像を取得するとともに、文字領域画像を階調画像に変換するステップ、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換するステップ、投影法により、エッジ二値画像から、文字枠分割ブロックを取得するステップ、および、輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するとともに、目標文字領域に応じて、文字領域画像に対して文字分割を行うステップを含む、文字分割方法を提供する。

好ましくは、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換する前に、階調画像をフィルタリング処理するステップをさらに含み、フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である。

好ましくは、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換するステップは、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行うとともに、エッジ検出の結果から、階調画像をエッジ二値画像に変換するステップを含む。

好ましくは、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行う前に、階調画像の画質特徴を検出するステップ、および、階調画像の画質特徴により、ｃａｎｎｙ演算子のパラメータを適応的に調整するステップをさらに含み、画質特徴は、大局コントラスト、大局階調平均値のうちの１つまたは複数を含む。

好ましくは、投影法により、エッジ二値画像から、文字枠分割ブロックを取得するステップは、垂直投影法により、エッジ二値画像に対して分割処理を行うことで、少なくとも１つの文字枠に対応する関係をもつ少なくとも１つの文字枠分割ブロックを取得するステップを含む。

好ましくは、輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するステップは、輪郭検出アルゴリズムにより、文字枠分割ブロックにおける文字輪郭を特定するステップ、および、文字枠分割ブロックにおける文字輪郭の最小外接矩形領域により、目標文字領域を特定するステップを含む。

第２の態様では、少なくとも１つの文字枠を含む文字領域画像を取得するとともに、文字領域画像を階調画像に変換するための取得モジュールと、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換するためのエッジ検出モジュールと、投影法により、エッジ二値画像から、文字枠分割ブロックを取得するための投影モジュールと、輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するとともに、目標文字領域に応じて、文字領域画像に対して文字分割を行うための輪郭検出モジュールと、を備えた文字分割装置を提供する。
好ましくは、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換する前に、階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに備え、フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である。

好ましくは、エッジ検出モジュールは、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行うとともに、エッジ検出の結果から、階調画像をエッジ二値画像に変換するためのものでもある。

好ましくは、エッジ検出モジュールは、階調画像の画質特徴を検出し、階調画像の画質特徴により、ｃａｎｎｙ演算子のパラメータを適応的に調整するためのものでもあり、画質特徴は、大局コントラスト、大局階調平均値のうちの１つまたは複数を含む。

好ましくは、投影モジュールは、垂直投影法により、エッジ二値画像に対して分割処理を行うことで、少なくとも１つの文字枠に対応する関係をもつ少なくとも１つの文字枠分割ブロックを取得するためのものでもある。

好ましくは、輪郭検出モジュールは、輪郭検出アルゴリズムにより、文字枠分割ブロックにおける文字輪郭を特定し、文字枠分割ブロックにおける文字輪郭の最小外接矩形領域により、目標文字領域を特定するためのものでもある。

第３の態様では、ダイヤルには、読値を表示するための少なくとも１つの文字枠が含まれるメーターと、メーターのダイヤルを撮影して文字領域画像を取得するための撮像装置と、撮像装置に電気的に接続され、請求項１～７のいずれか１項に記載の方法を実行するための文字分割装置と、を備えた、スマートメーター読み取りシステムをさらに提供する。

第４の態様では、１つまたは複数のマルチコアプロセッサと、１つまたは複数のプログラムを記憶するためのメモリと、を含み、１つまたは複数のプログラムが１つまたは複数のマルチコアプロセッサによって実行されると、少なくとも１つの文字枠を含む文字領域画像を取得するとともに、文字領域画像を階調画像に変換するステップ、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換するステップ、投影法により、エッジ二値画像から、文字枠分割ブロックを取得するステップ、および、輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するとともに、目標文字領域に応じて、文字領域画像に対して文字分割を行うステップ、を１つまたは複数のマルチコアプロセッサに実現させる、文字分割装置をさらに提供する。

第５の態様では、プログラムが記憶されており、プログラムがマルチコアプロセッサによって実行されると、上記方法をマルチコアプロセッサに実行させる、コンピュータ可読記憶媒体をさらに提供する。

本願の実施例に用いられる上記第１～第５の態様に記載の少なくとも１つの技術案によれば、以下のような有益な効果が得られる。本発明における文字分割案では、エッジ検出アルゴリズムを輪郭検出アルゴリズムと組み合わせて、文字領域画像に対して複数回の検出を行うことで、質が低い画像に対しても文字分割を行うことができ、文字分割過程における分割限度を確定しにくい問題を回避した。

第６の態様では、文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するステップ、ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行って二値画像を取得するステップ、投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得するステップ、および、前記文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行うステップ、を含む、文字分割方法を提供する。

好ましくは、ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行う前に、ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行って、エッジ画像を取得するステップ、ハフ変換方程式により、前記エッジ画像に対して直線検出を行って、前記エッジ画像の境界線を取得するステップ、および、前記境界線から、前記階調画像の境界部分を除去するステップをさらに含む。

好ましくは、ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行う前に、前記階調画像の画質特徴を検出するステップ、および、前記階調画像の画質特徴により、前記ｃａｎｎｙ演算子のパラメータを適応的に調整するステップをさらに含み、前記画質特徴は、大局コントラスト及び／又は大局階調平均値を含む。

好ましくは、ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行う前に、前記方法は、前記階調画像をフィルタリング処理するステップをさらに含み、前記フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理を含む。

好ましくは、ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行う前に、前記階調画像に対して対数変換を行うステップをさらに含む。

好ましくは、ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行うステップは、前記ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像をクラスタリングして、Ｃ個のクラスタを取得するステップ、前記Ｃ個のクラスタのクラスタセンターから、前記Ｃ個のクラスタの属性をそれぞれ、特定するステップ、前記階調画像の任意１つの画素点の、前記Ｃ個のクラスタの各々に対応するＣ個のメンバーシップを特定するステップ、前記メンバーシップに応じて前記Ｃ個のクラスタを整列して、その中のＮ個のクラスタを特定するとともに、前記Ｎ個のクラスタの属性に応じて、前記階調画像の任意１つの画素点の属性を特定するステップ、および、前記階調画像の任意１つの画素点の属性に応じて、前記階調画像に対して二値化処理を行うステップ、を含み、ただし、前記Ｃ、前記Ｎが正の整数であり、且つ、前記Ｃが前記Ｎよりも大きい。

好ましくは、投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得した後、前記方法は、前記少なくとも１つの文字位置決めブロックの各々の前景画素面積を検出するステップ、および、前記前景画素面積に基づき、前記少なくとも１つの文字位置決めブロックの中から干渉ブロックを検出するとともに、前記少なくとも１つの文字位置決めブロックから、前記干渉ブロックを除去するステップを含み、前記干渉ブロックの前記前景画素面積は、少なくとも、前記少なくとも１つの文字位置決めブロックの中のＭ個の文字位置決めブロックの前記前景画素面積よりも小さく、ただし、前記Ｍが予め設定された文字の数である。

好ましくは、垂直投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得した後、前記方法は、非最近傍抑制アルゴリズムにより、前記少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するステップを含む。

好ましくは、前記少なくとも１つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行うステップは、前記少なくとも１つの文字位置決めブロックの平均幅を特定するステップ、および、前記少なくとも１つの文字位置決めブロックにおいて、幅が前記平均幅よりも小さい目標文字位置決めブロックがあれば、前記目標文字位置決めブロックの位置情報と前記平均幅とに基づき、前記文字領域画像に対して文字分割を行うステップを含む。

第７の態様では、文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するための取得モジュールと、ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行って二値画像を取得するためのクラスタリングモジュールと、投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得するための位置決めモジュールと、前記少なくとも１つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行うための分割モジュールと、を備えた文字分割装置を提供する。

好ましくは、ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行って、エッジ画像を取得するためのエッジ検出モジュールと、ハフ変換方程式により、前記エッジ画像に対して直線検出を行って、前記エッジ画像の境界線を取得するための直線検出モジュールと、前記境界線から、前記階調画像の境界部分を除去するための境界除去モジュールと、をさらに備えた。

好ましくは、前記エッジ検出モジュールは、前記階調画像の画質特徴を検出するための画質検出モジュールと、前記階調画像の画質特徴により、前記ｃａｎｎｙ演算子のパラメータを適応的に調整するためのパラメータ調整モジュールと、をさらに備え、前記画質特徴は、少なくとも、大局コントラスト及び／又は大局階調平均値を含む。

好ましくは、前記装置は、前記階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに備え、前記フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理を含む。

好ましくは、前記階調画像に対して対数変換を行うための対数変換モジュールをさらに備えた。

好ましくは、前記クラスタリングモジュールは、前記ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像をクラスタリングして、Ｃ個のクラスタを取得し、前記Ｃ個のクラスタのクラスタセンターから、前記Ｃ個のクラスタの属性をそれぞれ、特定し、前記階調画像の任意１つの画素点の、前記Ｃ個のクラスタの各々に対応するＣ個のメンバーシップを特定し、前記メンバーシップに応じて前記Ｃ個のクラスタを整列して、その中のＮ個のクラスタを特定するとともに、前記Ｎ個のクラスタの属性に応じて、前記階調画像の任意１つの画素点の属性を特定し、前記階調画像の任意１つの画素点の属性に応じて、前記階調画像に対して二値化処理を行うためのものでもあり、ただし、前記Ｃ、前記Ｎが正の整数であり、且つ、前記Ｃが前記Ｎよりも大きい。

好ましくは、前記装置は、前記少なくとも１つの文字位置決めブロックの各々の前景画素面積を検出し、前記前景画素面積に基づき、前記少なくとも１つの文字位置決めブロックの中から干渉ブロックを検出するとともに、前記少なくとも１つの文字位置決めブロックから、前記干渉ブロックを除去するための第１の除去モジュールを備え、前記干渉ブロックの前記前景画素面積は、少なくとも、前記少なくとも１つの文字位置決めブロックの中のＭ個の文字位置決めブロックの前記前景画素面積よりも小さく、ただし、前記Ｍが予め設定された文字の数である。

好ましくは、非最近傍抑制アルゴリズムにより、前記少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するための第２の除去モジュールを備えた。

好ましくは、前記分割モジュールは、前記少なくとも１つの文字位置決めブロックの平均幅を特定し、前記少なくとも１つの文字位置決めブロックにおいて、幅が前記平均幅よりも小さい目標文字位置決めブロックがあれば、前記目標文字位置決めブロックの位置情報と前記平均幅とに基づき、前記文字領域画像に対して文字分割を行うためのものでもある。

第８の態様では、１つまたは複数のマルチコアプロセッサと、１つまたは複数のプログラムを記憶するためのメモリと、を含み、前記１つまたは複数のプログラムが前記１つまたは複数のマルチコアプロセッサによって実行されると、文字分割方法の別の一態様では、文字領域画像を階調画像に変換するステップ、ファジィＣ－平均クラスタリングアルゴリズムにより、階調画像に対してクラスタ分析を行うとともに、クラスタ分析の結果から、階調画像に対して二値化処理を行うステップ、投影法により、二値画像から、文字位置決めブロックを取得するステップ、および、文字位置決めブロックの位置情報に基づき、文字領域画像に対して文字分割を行うステップを前記１つまたは複数のマルチコアプロセッサに実現させる文字分割装置を提供する。

第９の態様では、プログラムが記憶されており、前記プログラムがマルチコアプロセッサによって実行されると、上記方法を前記マルチコアプロセッサに実行させる、コンピュータ可読記憶媒体を提供する。

第１０の態様では、ダイヤルに文字を表示するためのメーターと、メーターのダイヤルを撮影して文字領域画像を取得するための撮像装置と、撮像装置に電気的に接続され、上記第６の態様に記載の方法を実行するための文字分割装置と、を備えた、スマートメーター読み取りシステムをさらに提供する。

本願の実施例に用いられる上記第６～１０の態様に記載の少なくとも１つの技術案によれば、以下のような有益な効果が得られる。本発明における文字分割案では、ファジィＣ－平均クラスタリングアルゴリズムにより、オリジナル文字領域画像に対して二値化処理を行うことで、汚れや光反射などの複数の干渉が除去された二値画像を取得することができ、さらに、投影法により、当該二値画像から、更に正確な文字分割位置を取得することができる。それにより、画質が良くない文字領域画像に対しても、更に正確な文字分割効果を実現させることができる。本願の実施例に用いられる上記少なくとも１つの技術案によれば、以下のような有益な効果が得られる。本発明における文字分割案では、エッジ検出アルゴリズムを輪郭検出アルゴリズムと組み合わせて、文字領域画像に対して複数回の検出を行うことで、質が低い画像に対しても文字分割を行うことができ、文字分割過程における分割限度を確定しにくい問題を回避した。

理解すべきなのは、上記説明は、本発明の技術手段をより明瞭に理解してもらうための、本発明の技術案の概要に過ぎず、明細書の内容を基にして実施することが可能である。また、本発明の上記目的及び他の目的、特徴、及びメリットをさらに明瞭的で分かりやすくするために、以下は、特に、本発明の具体的な実施の形態を例示して説明する。

以下の例示的な実施例の詳細を閲覧したうえで、当業者は、本明細書に記載の利点や有益な効果、および、他の利点や有益な効果を理解できるだろう。添付図面は、例示的な実施例の目的を示すためのものに過ぎず、本発明を制限するものとして見なされない。しかも、全ての添付図面において、同一の部材は同一の記号で示される。添付図面において、
本発明の一実施例に係る文字分割方法のフロー概略図である。本発明の実施例における文字領域画像の概略図である。図３ａは、本発明の実施例における１つのエッジ二値画像の概略図である。図３ｂは、もう１つのエッジ二値画像の概略図である。本発明の実施例における文字枠分割ブロックの概略図である。本発明の実施例における目標文字領域の概略図である。本発明の一実施例に係る文字分割装置の構造概略図である。本発明の別の一実施例に係る文字分割方法のフロー概略図である。本発明の実施例における１つの階調画像の概略図である。本発明の実施例における１つの二値画像の概略図である。本発明の実施例における複数の文字位置決めブロックの概略図である。本発明の実施例における文字分割後に取得した文字画像の概略図である。本発明の実施例に係る１つの上下境界を有する階調画像の概略図である。本発明の実施例に係る１つのエッジ画像の概略図である。本発明の別の一実施例に係る文字分割装置の構造概略図である。本発明のさらに別の一実施例に係る文字分割装置の構造概略図である。

添付図面において、同一又は対応な部分は、同一または対応な記号で示される。

以下は、添付図面を参照しながら、本開示の例示的な実施例をより詳しく説明する。添付図面には、本開示の例示的な実施例が示されたが、本開示は、種々な形式で実現することができ、ここに記載の実施例により限られたものではないと、理解すべきである。逆に、それらの実施例を提供する目的は、本開示をさらに明瞭に理解できるようにすることであって、本開示の範囲を当業者に完全に伝えることができることである。

本発明では、理解すべきなのは、例えば、「含む」や「備える」のような用語は、本発明により開示された特徴、数字、工程、行為、部材、部分又はそれらの組み合わせの存在を示すためのものであり、１つまたは複数の他の特徴、数字、工程、行為、部材、部分又はそれらの組み合わせの存在の可能性を排除することを意図しない。

なお、説明すべきなのは、衝突しない場合、本発明における実施例及び実施例に記載の特徴は互いに組み合わされてもよい。以下は、添付図面を参照しながら、実施例を組み合わせて本願発明を詳しく説明する。

図１は、本願の一実施例に係る文字分割方法１００のフロー概略図であり、当該文字分割方法１００は、メーターの文字領域画像を文字識別が実行されやすい文字画像に分割するためのものである。当該フローでは、機器の角度からすれば、実行主体は、１つまたは複数の電子機器であってもよく、更に詳細的に、これらの機器におけるカメラに関連付けられた処理モジュールであってもよい。また、プログラムの角度からすれば、実行主体は、相応に、これらの電子機器に搭載されるプログラムであってもよい。

図１におけるフローでは、以下のステップ１０１～１０４が含まれてもよい。

ステップ１０１：文字領域画像を取得するとともに、文字領域画像を階調画像に変換すること。

ここで、文字領域画像は、少なくとも１つの文字枠を含み、具体的に、当該文字領域画像は、メーターのダイヤル画像であってもよく、当該メーターのダイヤルには、複数の文字枠が含まれ、当該複数の文字枠は、サイズが同じで、規則的に配列されているとともに、ユーザによる数値の読取のために文字枠ごとに単一の文字が展示される。選択的に、文字枠は、矩形、円形など、任意１つの規則的な形状に形成されてもよい。選択的に、当該メーターは、日常生活でよく見られる水道メーター、電気メーター、ガスメーターを含むが、これらに限らず、例えば、キャラクターホイール型水道メーターであってもよい。さらに、当該文字領域画像は、当該メーターのダイヤルに向かって設けられた撮像装置によって取得されてもよい。勿論、当該文字領域画像は、他の出所からのものであってもよく、例えば、他の機器からのものであってもよいし、又は、既存の画像であってもよいが、本実施例では、制限されていない。さらに、取得される文字領域画像は、ＲＧＢ形式のものであってもよい。文字領域画像の取得後、文字領域画像における各画素点の階調値を、浮動小数点アルゴリズム、整数化方法、シフト方法、平均化方法など、様々な方式によって特定し、画素点における赤、緑、青という３チャネルの画素値の代わりに、当該階調値を用いることが可能である。選択的に、他のよく見られるカラー形式の文字領域画像を取得して用いるとともに、相応な階調画像に変換してもよい。

例を挙げると、図２を参照して、文字領域画像の階調画像が示され、当該文字領域画像に含まれる５つの文字「０」、「０」、「１」、「５」、「８」は、当該メーターの５つの文字枠における展示数値を示すものである。ここから分かるように、表面の汚れや撮影時の光線などに起因して、当該メーターに表示される文字は曖昧なものであり、正確な文字分割が困難である問題が存在する。

ステップ１０２：エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換すること。

具体的に、上述したように、エッジ検出アルゴリズムが用いられる目的は、階調画像における文字を展示するための複数の文字枠の境界を位置決めすることである。ここで、所謂エッジ（ｅｄｇｅ）とは、画像における局部強度の変化が最も著しい部分を指し、主に目標と背景の間に存在するものであり、各画素点の階調値勾配データから検索されることが可能である。また、一般的に、境界には目立つエッジがあるので、この特徴を活用して画像を分割してもよい。エッジの検出は、常にエッジ検出演算子を用いて行われる。ここでよく用いられるエッジ検出演算子は、Ｒｏｂｅｒｔｓ演算子、Ｌａｐｌａｃｅ演算子、Ｐｒｅｗｉｔｔ演算子、Ｓｏｂｅｌ演算子、Ｒｏｓｏｎｆｅｌｄ演算子、Ｋｉｒｓｃｈ演算子、および、Ｃａｎｎｙ演算子などを含む。さらに、上記１つまたは複数のエッジ検出演算子を用いて、階調画像に対してエッジ検出を行うことでエッジ画素点を抽出するとともに、エッジ画素点を検出された場合、二値化処理を行ってもよい。注意すべきなのは、エッジが複雑なものであって強いノイズ点がある画像に対し、エッジの検出には、耐ノイズ性と検出精度を両立できない問題があり、検出精度が高められると、ノイズによる偽エッジに起因して不合理な輪郭が生じてしまうが、耐ノイズ性が高められると、輪郭の検出漏れの問題が生じてしまう。本実施例では、当該エッジ検出の目的は、階調画像における文字を展示するための文字枠を位置決めすることであるため、耐ノイズ性が高いエッジ検出パラメータを用いることで、検出の結果として考えられる偽エッジが多すぎることを回避した。理解すべきなのは、文字そのものと比べて、文字枠は滑らかで連続した境界を有するため、一部のエッジへの検出が漏れたとしても、その輪郭が依然として示されることができる。しかも、立体効果を有する文字枠（例えば、よく見られるキャラクターホイール型水道メーターの文字枠）について、撮影時の光・影投射の作用により、当該文字枠における画素点は、他の画素点と比べて、高い勾配を有することが一般的である。選択的に、上述したように耐ノイズ性が高いエッジ検出パラメータをさらに取得するために、複数のエッジ検出パラメータを予め設定するとともに、エッジ検出を実行し、且つ、文字枠の基本的な輪郭を保ちながら、ノイズ点を最大限に低減することができるエッジ二値画像を選択してもよい。選択的に、上述したように耐ノイズ性が高いエッジ検出パラメータをさらに取得するために、さらに、異なる質の階調画像に対してエッジ検出パラメータを適応的に調整して耐ノイズ性を高く保つできるように、エッジ検出パラメータモデルを予めトレーニングしてもよい。例えば、階調画像の大局コントラストが低いときに、大量のノイズ点が生じるが、その場合、大局コントラストに応じて、耐ノイズ性が更に高いエッジ検出パラメータを適応的に調整してもよい。選択的に、分水嶺アルゴリズムにより、当該エッジ二値画像を取得してもよい。

例えば、図３（ａ）と図３（ｂ）を参照して、異なるエッジ検出パラメータを用いて、図２に示される階調画像に対してエッジ検出を行うことで得られたエッジ二値画像が示される。図３（ａ）中のエッジ二値画像には、輪郭の検出漏れが発生し、図３（ｂ）中のエッジ二値画像には、偽エッジが多くあることが明らかになる。本実施例では、図３（ａ）に示される耐ノイズ性が更に高いエッジ二値画像が用いられ、最も左側にある文字枠内の数字、最も右側にある文字枠内の境界に発生した検出漏れが考慮されていない。

ステップ１０３：投影法により、エッジ二値画像から、文字枠分割ブロックを取得すること。

具体的に、上記投影法は、二値画像の画素点の分布ヒストグラムを用いて分析することで、隣り合う文字枠の境界点を見出して分割することであり、投影法には、具体的に、垂直投影と水平投影が含まれる。当該複数の文字枠分割ブロックは、具体的に、垂直投影図における投影値が谷にあるときの投影位置によって決められる。例を挙げると、図４を参照して、図３（ａ）に示されるエッジ二値画像を垂直方向に投影して垂直投影図を取得し、垂直投影図における投影値が０である投影位置から、左から右へとの５つの文字枠分割ブロックが得られる。

ステップ１０４：輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するとともに、目標文字領域に応じて、文字領域画像に対して文字分割を行うこと。

具体的に、輪郭検出アルゴリズムを利用する目的は、各文字枠分割ブロック内の文字に対して輪郭検出を行うことで輪郭情報を取得するとともに、当該文字の輪郭情報に基づいて、更に明確な目標文字領域を位置決めして見出すことである。さらに、文字領域画像から、当該目標文字領域に対応する文字画像に対して文字分割を行うとともに、当該文字画像に基づいて更なる文字識別作業を行ってもよい。

例を挙げると、図５を参照して、図４に示される文字枠分割ブロックから得られた目標文字領域、すなわち、当該矩形枠の内部領域が示される。

本発明では、エッジ検出により、階調画像を粗分割して、文字枠に対応する粗分割の結果、すなわち、文字枠分割ブロックを取得した後、当該文字枠分割ブロックに対して輪郭検出アルゴリズムによって更に正確な目標文字領域を取得し、エッジ検出と輪郭検出を組み合わせたことで、質が低い画像に対しても文字分割を行うことができ、文字分割過程における分割限度を確定しにくい問題を回避した。

図１に示す文字分割方法を基にして、本願における幾つかの実施例では、当該文字分割方法の幾つかの具体的な実施方案及び拡張方案がさらに提供される。以下は、これらの方案を説明する。

一実施の形態では、ステップ１０２の前に、方法１００は、階調画像をフィルタリング処理するステップをさらに含んでもよく、ここで、フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である。

具体的に、エッジもノイズも階調不連続点であり、周波数領域においても高周波成分であるため、微分演算が直接に行われると、ノイズからの影響を抑制しがたいので、微分演算子を用いたエッジ検出の前に、画像を平滑化フィルタリング処理しなければならない。従って、本実施例では、ガウスフィルタリング及び／又はメディアンフィルタリングを用いて、階調画像を畳み込むことで、明らかなノイズによる影響を低減して、画像を平滑化する。ここで、ガウスフィルタリングは、線形平滑化フィルタリング処理であり、ガウスノイズの除去に適する。メディアンフィルタリングは、非線形平滑化フィルタリング処理であり、処理される画像における各画素点の階調値を、当該点のある隣り合う領域のウィンドウ内の全ての画素点階調値のメディアンに設定するものである。メディアンフィルタリングは、パルスノイズに対して良好な濾過・除去作用を有するとともに、ノイズを濾過・除去すると同時に、信号のエッジを、ぼやけないように保護することができる。

理解すべきなのは、本実施例で提供される技術案は、上述した実施例と比べて、階調画像に対してガウスフィルタリング処理及び／又はメディアンフィルタリング処理を行うことにより、メーター上の汚れ又は光反射に起因したノイズからの影響を低減することができ、後続のエッジ検出の正確度を向上させる。

一実施の形態では、ステップ１０２は、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行うとともに、エッジ検出の結果から、階調画像をエッジ二値画像に変換するステップをさらに含んでもよい。

具体的に、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行うことは、（１）画像における各画素点の勾配強度及び方向を計算するステップ、（２）非極大値（Ｎｏｎ－ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）で抑制することで、エッジ検出によるスプリアス・レスポンスを消去するステップ、（３）二重閾値（Ｄｏｕｂｌｅ－Ｔｈｒｅｓｈｏｌｄ）検出を用いて真のエッジと潜在エッジを特定するステップ、および、（４）孤立した弱エッジを抑制することで最終的にエッジ検出を完成するステップを含んでもよい。ここで、二重閾値とは、ｃａｎｎｙエッジ検出アルゴリズムでは、高い閾値と低い閾値の２閾値を設定し、高い閾値が画像における目標と背景を区別させるためのものであり、低い閾値がエッジを平滑化して、不連続のエッジの輪郭を接続するためのものである。具体的に、１つの画素は、勾配が高い閾値よりも大きいものであれば、エッジ画素点として見なされるが、低い閾値よりも小さいものであれば、非エッジ画素点として見なされ、また、当該画素点の勾配が両者の間のものであれば、エッジ画素に接続された場合に限って、エッジ画素点として見なされる。

さらに、上述したように、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行う前に、階調画像の画質特徴を検出するステップ、および、階調画像の画質特徴により、ｃａｎｎｙ演算子のパラメータを適応的に調整するステップをさらに含んでもよい。

ここで、画質特徴は、大局コントラスト、大局階調平均値のうちの１つまたは複数を含む。具体的に、エッジ検出の過程における耐ノイズ性と検出精度を両立できない問題を解決するために、本実施例では、階調画像の画質特徴により、当該ｃａｎｎｙエッジ検出アルゴリズムにおけるパラメータを適応的に特定するようにし、当該画質特徴は、例えば、大局コントラストと、当該ｃａｎｎｙエッジ検出アルゴリズムにおけるパラメータであり、例えば、高い閾値及び／又は低い閾値である。さらに、現在、文字分割が行われている文字領域画像の質に応じて高い閾値及び／又は低い閾値を適応的に調整できるように、閾値モデルを予めトレーニングしてもよい。

例を挙げると、階調画像の大局コントラストがより低いことを検出されると、当該階調画像の鮮明度が低いと推測し、更に高い、高い閾値及び／又は低い閾値を用いることとなり、階調画像の大局コントラストがより高いことを検出されると、当該階調画像の大局コントラストが高いと推測し、より低い、高い閾値及び／又は低い閾値を用いることとなる。

理解すべきなのは、従来のｃａｎｎｙエッジ検出アルゴリズムでは、高い閾値と低い閾値は人為的に設定されるものであり、且つ、高い閾値／低い閾値の割合が一定のものである。そうすると、ｃａｎｎｙ演算子の応用方面では、局限性がある。一方、本実施例では、高い閾値と低い閾値を適応的に調整する方法が用いられたことで、上述した実施例と比べて、周辺の大量かつ無用の偽の境界情報が低減され、欠陥エッジへの識別に対するノイズからの影響が抑えられ、後続の輪郭抽出に対しても極めて重要な作用を奏する。

一実施の形態では、ステップ１０３は、垂直投影法により、エッジ二値画像に対して分割処理を行うことで、少なくとも１つの文字枠に対応する関係をもつ少なくとも１つの文字枠分割ブロックを取得するステップをさらに含んでもよい。

具体的に、上述した分割処理の目的は、上述したエッジ二値画像における異なる文字枠に対応する画像領域を互いに切り離して、各画像領域における背景領域をなるべく、多く除去することであり、それにより、ステップ１０４における輪郭検出の計算量を低減することが可能である。

一実施の形態では、ステップ１０４は、輪郭検出アルゴリズムにより、文字枠分割ブロックにおける文字輪郭を特定し、文字枠分割ブロックにおける文字輪郭の最小外接矩形領域により、目標文字領域を特定するステップをさらに含んでもよい。

具体的に、各文字枠分割ブロックについて、特定された最小外接領域は、当該文字枠分割ブロック内の全ての文字輪郭を収容することができる。選択的に、階調画像を、より多くのエッジ情報を有する二値画像に変換してから、当該二値画像から、複数の文字枠分割ブロックの位置に対応する複数の最適文字枠分割ブロックを切り出し、その後、当該複数の最適文字枠分割ブロックに対して輪郭検出を行うことで最適目標文字領域を取得してもよい。

図６は、本願の一実施例に係る文字分割装置６０の構造概略図であり、図１に示される文字分割方法を実施するためのものである。

図６に示されるように、文字分割装置６０は、
文字領域画像を取得するとともに、文字領域画像を階調画像に変換するための取得モジュール６０１を含み、ここで、文字領域画像は、少なくとも１つの文字枠を含み、具体的に、当該文字領域画像は、メーターのダイヤル画像であってもよく、当該メーターのダイヤルには、複数の文字枠が含まれ、当該複数の文字枠は、サイズが同じで、規則的に配列されているとともに、ユーザによる数値の読取のために文字枠ごとに単一の文字が展示される。選択的に、文字枠は、矩形、円形など、任意１つの規則的な形状に形成されてもよい。選択的に、当該メーターは、日常生活でよく見られる水道メーター、電気メーター、ガスメーターを含むが、これらに限らず、例えば、キャラクターホイール型水道メーターであってもよい。さらに、当該文字領域画像は、当該メーターのダイヤルに向かって設けられた撮像装置によって取得されてもよい。勿論、当該文字領域画像は、他の出所からのものであってもよく、例えば、他の機器からのものであってもよいし、又は、既存の画像であってもよいが、本実施例では、制限されていない。さらに、取得される文字領域画像は、ＲＧＢ形式のものであってもよい。文字領域画像の取得後、文字領域画像における各画素点の階調値を、浮動小数点アルゴリズム、整数化方法、シフト方法、平均化方法など、様々な方式によって特定し、画素点における赤、緑、青という３チャネルの画素値の代わりに、当該階調値を用いることが可能である。

例を挙げると、図２を参照して、１枚の文字領域画像の階調画像が示され、当該文字領域画像に含まれる５つの文字「０」、「０」、「１」、「５」、「８」は、当該メーターの５つの文字枠における展示数値を示すものである。ここから分かるように、表面の汚れや撮影時の光線などに起因して、当該メーターに表示される文字は曖昧なものであり、正確な文字分割が困難である問題が存在する。

一実施の形態では、文字分割装置６０は、
エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換するためのエッジ検出モジュール６０２をさらに含み、具体的に、上述したように、エッジ検出アルゴリズムが用いられる目的は、階調画像における文字を展示するための複数の文字枠の境界を位置決めすることである。ここで、所謂エッジ（ｅｄｇｅ）とは、画像における局部強度の変化が最も著しい部分を指し、主に目標と背景の間に存在するものであり、各画素点の階調値勾配データから検索されることが可能である。また、一般的に、境界には目立つエッジがあるので、この特徴を活用して画像を分割してもよい。エッジの検出は、常にエッジ検出演算子を用いて行われる。ここでよく用いられるエッジ検出演算子は、Ｒｏｂｅｒｔｓ演算子、Ｌａｐｌａｃｅ演算子、Ｐｒｅｗｉｔｔ演算子、Ｓｏｂｅｌ演算子、Ｒｏｓｏｎｆｅｌｄ演算子、Ｋｉｒｓｃｈ演算子、および、Ｃａｎｎｙ演算子などを含む。さらに、上記１つまたは複数のエッジ検出演算子を用いて、階調画像に対してエッジ検出を行うことでエッジ画素点を抽出するとともに、エッジ画素点を検出された場合、二値化処理を行ってもよい。注意すべきなのは、エッジが複雑なものであって強いノイズ点がある画像に対し、エッジの検出には、耐ノイズ性と検出精度を両立できない問題があり、検出精度が高められると、ノイズによる偽エッジに起因して不合理な輪郭が生じてしまうが、耐ノイズ性が高められると、輪郭の検出漏れの問題が生じてしまう。本実施例では、当該エッジ検出の目的は、階調画像における文字を展示するための文字枠を位置決めすることであるため、耐ノイズ性が高いエッジ検出パラメータを用いることで、検出の結果として考えられる偽エッジが多すぎることを回避した。理解すべきなのは、文字そのものと比べて、文字枠は滑らかで連続した境界を有するため、一部のエッジへの検出が漏れたとしても、その輪郭が依然として示されることができる。しかも、立体効果を有する文字枠（例えば、よく見られるキャラクターホイール型水道メーターの文字枠）について、撮影時の光・影投射の作用により、当該文字枠における画素点は、他の画素点と比べて、高い勾配を有することが一般的である。選択的に、上述したように耐ノイズ性が高いエッジ検出パラメータをさらに取得するために、複数のエッジ検出パラメータを予め設定するとともに、エッジ検出を実行し、且つ、文字枠の基本的な輪郭を保ちながら、ノイズ点を最大限に低減することができるエッジ二値画像を選択してもよい。選択的に、上述したように耐ノイズ性が高いエッジ検出パラメータをさらに取得するために、さらに、異なる質の階調画像に対してエッジ検出パラメータを適応的に調整して耐ノイズ性を高く保つできるように、エッジ検出パラメータモデルを予めトレーニングしてもよい。例えば、階調画像の大局コントラストが低いときに、大量のノイズ点が生じるが、その場合、大局コントラストに応じて、耐ノイズ性が更に高いエッジ検出パラメータを適応的に調整してもよい。選択的に、分水嶺アルゴリズムにより、当該エッジ二値画像を取得してもよい。

一実施の形態では、文字分割装置６０は、
投影法により、エッジ二値画像から、文字枠分割ブロックを取得するための投影モジュール６０３をさらに含み、具体的に、上記投影法は、二値画像の画素点の分布ヒストグラムを用いて分析することで、隣り合う文字枠の境界点を見出して分割することであり、投影法には、具体的に、垂直投影と水平投影が含まれる。当該複数の文字枠分割ブロックは、具体的に、垂直投影図における投影値が谷にあるときの投影位置によって決められる。例を挙げると、図４を参照して、図３（ａ）に示されるエッジ二値画像を垂直方向に投影して垂直投影図を取得し、垂直投影図における投影値が０である投影位置から、左から右へとの５つの文字枠分割ブロックが得られる。

一実施の形態では、文字分割装置６０は、
輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するとともに、目標文字領域に応じて、文字領域画像に対して文字分割を行うための輪郭検出モジュール６０４をさらに含む。具体的に、輪郭検出アルゴリズムを利用する目的は、各文字枠分割ブロック内の文字に対して輪郭検出を行うことで輪郭情報を取得するとともに、当該文字の輪郭情報に基づいて、更に明確な目標文字領域を位置決めして見出すことである。さらに、文字領域画像から、当該目標文字領域に対応する文字画像に対して文字分割を行うとともに、当該文字画像に基づいて更なる文字識別作業を行ってもよい。

例を挙げると、図５を参照して、図４に示される文字枠分割ブロックから得られた目標文字領域、すなわち、当該矩形枠の内部領域が示される。
本発明では、エッジ検出により、階調画像を粗分割して、文字枠に対応する粗分割の結果、すなわち、文字枠分割ブロックを取得した後、当該文字枠分割ブロックに対して輪郭検出アルゴリズムによって更に正確な目標文字領域を取得し、エッジ検出と輪郭検出を組み合わせたことで、質が低い画像に対しても文字分割を行うことができ、文字分割過程における分割限度を確定しにくい問題を回避した。

一実施の形態では、分割装置６０は、
エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換する前に、階調画像をフィルタリング処理するフィルタリングモジュールをさらに含んでもよく、ここで、フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である。具体的に、エッジもノイズも階調不連続点であり、周波数領域においても高周波成分であるため、微分演算が直接に行われると、ノイズからの影響を抑制しがたいので、微分演算子を用いたエッジ検出の前に、画像を平滑化フィルタリング処理しなければならない。従って、本実施例では、ガウスフィルタリング及び／又はメディアンフィルタリングを用いて、階調画像を畳み込むことで、明らかなノイズによる影響を低減して、画像を平滑化する。ここで、ガウスフィルタリングは、線形平滑化フィルタリング処理であり、ガウスノイズの除去に適する。メディアンフィルタリングは、非線形平滑化フィルタリング処理であり、処理される画像における各画素点の階調値を、当該点のある隣り合う領域のウィンドウ内の全ての画素点階調値のメディアンに設定するものである。メディアンフィルタリングは、パルスノイズに対して良好な濾過・除去作用を有するとともに、ノイズを濾過・除去すると同時に、信号のエッジを、ぼやけないように保護することができる。

一実施の形態では、エッジ検出モジュール６０２は、
ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行うとともに、エッジ検出の結果から、階調画像をエッジ二値画像に変換するためのものであってもよい。具体的に、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行うことは、（１）画像における各画素点の勾配強度及び方向を計算するステップ、（２）非極大値（Ｎｏｎ－ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）で抑制することで、エッジ検出によるスプリアス・レスポンスを消去するステップ、（３）二重閾値（Ｄｏｕｂｌｅ－Ｔｈｒｅｓｈｏｌｄ）検出を用いて真のエッジと潜在エッジを特定するステップ、および、（４）孤立した弱エッジを抑制することで最終的にエッジ検出を完成するステップを含んでもよい。ここで、二重閾値とは、ｃａｎｎｙエッジ検出アルゴリズムでは、高い閾値と低い閾値の２閾値を設定し、高い閾値が画像における目標と背景を区別させるためのものであり、低い閾値がエッジを平滑化して、不連続のエッジの輪郭を接続するためのものである。具体的に、１つの画素は、勾配が高い閾値よりも大きいものであれば、エッジ画素点として見なされるが、低い閾値よりも小さいものであれば、非エッジ画素点として見なされ、また、当該画素点の勾配が両者の間のものであれば、エッジ画素に接続された場合に限って、エッジ画素点として見なされる。

一実施の形態では、上述したように、ｃａｎｎｙエッジ検出アルゴリズムにより、階調画像に対してエッジ検出を行う前に、階調画像の画質特徴を検出するステップ、および、階調画像の画質特徴により、ｃａｎｎｙ演算子のパラメータを適応的に調整するステップをさらに含んでもよい。

一実施の形態では、投影モジュール６０３は、
垂直投影法により、エッジ二値画像に対して分割処理を行うことで、少なくとも１つの文字枠に対応する関係をもつ少なくとも１つの文字枠分割ブロックを取得するためのものであってもよい。具体的に、上述した分割処理の目的は、上述したエッジ二値画像における異なる文字枠に対応する画像領域を互いに切り離して、各画像領域における背景領域をなるべく、多く除去することであり、それにより、ステップ１０４における輪郭検出の計算量を低減することが可能である。

一実施の形態では、輪郭検出モジュール６０４は、
輪郭検出アルゴリズムにより、文字枠分割ブロックにおける文字輪郭を特定し、文字枠分割ブロックにおける文字輪郭の最小外接矩形領域により、目標文字領域を特定するためのものであってもよい。具体的に、各文字枠分割ブロックについて、特定された最小外接領域は、当該文字枠分割ブロック内の全ての文字輪郭を収容することができる。選択的に、階調画像を、より多くのエッジ情報を有する二値画像に変換してから、当該二値画像から、複数の文字枠分割ブロックの位置に対応する複数の最適文字枠分割ブロックを切り出し、その後、当該複数の最適文字枠分割ブロックに対して輪郭検出を行うことで最適目標文字領域を取得してもよい。

図７は、本願の一実施例に係る文字分割方法７００のフロー概略図であり、当該文字分割方法７００は、メーターの文字領域画像を後続の処理（例えば、文字識別）が実行されやすい文字画像に分割するためのものである。当該フローでは、機器の角度からすれば、実行主体は、１つまたは複数の電子機器であってもよく、更に詳細的に、これらの機器におけるカメラに関連付けられた処理モジュールであってもよい。また、プログラムの角度からすれば、実行主体は、相応に、これらの電子機器に搭載されるプログラムであってもよい。

図７におけるフローでは、以下のステップ７０１～７０４が含まれてもよい。

ステップ７０１：文字領域画像を取得するとともに、文字領域画像を階調画像に変換すること。

具体的に、当該メーターは、日常生活でよく見られる水道メーター、電気メーター、ガスメーターを含むが、これらに限らず、例えば、キャラクターホイール型水道メーターであってもよい。さらに、当該メーターの文字領域画像は、単一文字画像又は複数文字画像であってもよく、当該メーターのダイヤルに向かって設けられた撮像装置によって取得されてもよい。勿論、当該文字領域画像は、他の出所からのものであってもよく、例えば、他の機器からのものであってもよいし、又は、既存の画像であってもよいが、本実施例では、制限されていない。さらに、取得される文字領域画像は、ＲＧＢ形式のものであってもよい。そして、文字領域画像の取得後、文字領域画像における各画素点の階調値を、浮動小数点アルゴリズム、整数化方法、シフト方法、平均化方法など、様々な方式によって特定するとともに、画素点における赤、緑、青という３チャネルの画素値の代わりに、当該階調値を用いることが可能である。

例を挙げると、図８を参照して、１枚の文字領域画像の階調画像が示され、当該文字領域画像には、左から右へと、７つの文字「０」、「０」、「０」、「０」、「１」、「１」、「１」が順次に表示される。上述した複数の文字間の境界が十分に明瞭なものではないことが明らかになり、また、カメラの感光素子の解像度が足りないので、文字領域画像に横縞が生じてしまい、さらに、各文字が接続された状態となり、そのため、正確な文字分割が困難となる。

ステップ７０２：ファジィＣ平均値により、階調画像に対してクラスタ分析を行うとともに、クラスタ分析の結果から、階調画像に対して二値化処理を行って二値画像を取得すること。

具体的に、ファジィＣ－平均クラスタリング（ｆｕｚｚｙｃ－ｍｅａｎｓ、以下は、ＦＣＭと略称）アルゴリズムは、教師なしファジィクラスタリング法であり、同一のクラスに分けられた対象間の類似度を最大にして、異なるクラス間の類似度を最小にするという構想によるものである。本実施例では、ファジィ集合の概念により、クラスタリングして生成されたクラスをファジィ集合として見なし、さらに、階調画像における各画素点の各クラスに該当するメンバーシップを取得し、各画素点のクラスに該当するメンバーシップが［０，１］区間内の値であり、且つ、各画素点の複数のクラスに該当するメンバーシップの総和が１に等しい。理解すべきなのは、ＦＣＭアルゴリズムは、一般的なＣ平均化アルゴリズムを改良したものであり、一般的なＣ平均化アルゴリズムでは、データの分割が押し付けられるもので、ハードクラスタリングすることにより、識別される対象をあるクラスに該当するように厳しく分割するので、「二つに一つ」という特性を有するが、一方、ＦＣＭでは、柔軟性のあるファジィクラスタリングであり、このようなファジィクラスタリングすることにより、クラスに対するサンプルの不確定記述を構築して、客観的な世界をより客観的に反応することができる。

例を挙げると、図９には、上記方案に従って、図８中の階調画像をクラスタ分析し、二値化処理して得られた二値画像が示される。ここで、上述したクラスタリングした後、各クラスタのクラスタセンターを用いて、各クラスと２つの予め設定されたクラスタのうちの１つとを関連付けることができ、当該２つの予め設定されたクラスが前景と背景であってもよい。その後、各画素点ごとに、メンバーシップが最も高いＮ個のクラスを選択するとともに、当該Ｎ個のクラスに関連付けられた予め設定されたクラスに応じて、当該画素点が前景画素点か背景画素点かを判断する。さらに、上記クラスタ分析して各画素点が前景画素点か背景画素点かに関する情報を取得した後、それによって、階調画像を二値化処理して、目標輪郭が目立つ二値画像を取得する。

ステップ７０３：投影法により、二値画像から、少なくとも１つの文字位置決めブロックを取得すること。

具体的に、上記投影法では、二値画像の画素点の分布ヒストグラムを分析することで、隣り合う文字の境界点を見出して、それを基にして分割し、上記二値画像における異なる文字に対応する画像領域を互いに切り離して、各画像領域における背景領域をなるべく、多く除去するものである。ここで、上記投影法は、具体的に、垂直投影と水平投影を含むが、本実施例では、垂直投影が優先的に用いられるとともに、垂直投影図における投影値が０である投影位置に基づいて当該少なくとも１つの文字位置決めブロックを特定する。

例を挙げると、図１０を参照して、図９中の二値画像を垂直投影してから、分割して得られた複数の文字位置決めブロックが示される。ここで、当該複数の文字位置決めブロックのうちに、ノイズ点に起因した干渉ブロックが存在する可能性がある。そのため、本実施例では、文字幅閾値を設定して、幅が当該文字幅閾値よりも小さい文字位置決めブロックを干渉ブロックとして除去してもよく、他の方案をとって当該干渉ブロックを除去してもよいが、本願では、具体的に限定されていない。

ステップ７０４：少なくとも１つの文字位置決めブロックの位置情報に基づき、文字領域画像に対して文字分割を行うこと。

図１１を参照して、図１０に得られた複数の文字位置決めブロックの位置情報に基づいて、図８に示される文字領域画像から文字分割が行われた後、得られた複数の文字画像が示される。

本発明では、ファジィＣ－平均クラスタリングアルゴリズムにより、オリジナル文字領域画像に対して二値化処理を行うことで、汚れや光反射などの複数の干渉が除去された二値画像を取得することができ、さらに、投影法により、当該二値画像から、更に正確な文字分割位置を取得することができる。それにより、画質が良くない文字領域画像に対しても、更に正確な文字分割効果を実現させることができる。

図７に示す文字分割方法を基にして、本願における幾つかの実施例では、当該文字分割方法の幾つかの具体的な実施方案及び拡張方案がさらに提供される。以下は、これらの方案を説明する。

一実施の形態では、ステップ７０２の前に、方法７００は、ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行って、エッジ画像を取得するステップと、ハフ変換方程式により、エッジ画像に対して直線検出を行って、エッジ画像の境界線を取得するステップと、境界線から、階調画像の境界部分を除去するステップと、をさらに含んでもよい。

具体的に、図１２を参照して、１枚の長い矩形文字枠を含む階調画像が示され、当該階調画像には、左から右へと、７つの文字「０」、「０」、「０」、「０」、「１」、「１」、「１」が順次に表示されるとともに、文字の上側と下側に当該メーターの長い矩形文字枠が示される。そのため、本実施例では、ｃａｎｎｙ演算子を用いて当該階調画像に対してエッジ検出を行って、エッジ画像を取得することができ、その目的は、階調画像における文字を展示するための文字枠の境界を位置決めすることである。選択的に、上記ｃａｎｎｙ演算子は、Ｒｏｂｅｒｔｓ演算子、Ｌａｐｌａｃｅ演算子、Ｐｒｅｗｉｔｔ演算子、Ｓｏｂｅｌ演算子、Ｒｏｓｏｎｆｅｌｄ演算子、および、Ｋｉｒｓｃｈ演算子のうちの１つまたは複数に置き換えられてもよい。選択的に、本実施例では、エッジ検出の目的は、階調画像における文字を展示するための文字枠を位置決めすることであるため、本実施例では、耐ノイズ性が高いエッジ検出パラメータを用いることで、検出の結果として考えられる偽エッジが多すぎることを回避した。さらに、当該文字枠は、はっきりとした境界を有する長い直線を形成するため、本実施例では、ハフ変換方程式により、エッジ画像に対して直線検出を行って、対応する文字枠の境界線を取得してもよい。さらに、当該文字枠は、後続の文字分割ステップに対して不利な影響を与えるため、本実施例では、当該階調画像における境界線に対応する位置以外の部分を除去することで、後続の文字分割過程において分割効果に対して影響を与えるのを回避してもよい。

例を挙げると、図１３を参照して、図１２中の長い矩形文字枠を含む階調画像に対してエッジ検出を行うことで得られたエッジ画像が示される。図７に示されるエッジ画像の上下側のエッジには、明らかな直線があることが明らかになり、さらに、ハフ変換方程式により、境界線を容易に検出することができる。さらに、図１２において、検出された境界線の位置に応じて相応な境界部分を除去することで、図８に示される階調画像を取得することができる。選択的に、ステップ７０３の前に、当該二値画像を水平投影するとともに、水平投影図における投影値が０である投影位置に基づいて、当該文字枠に対応する上側エッジと下側エッジを切り出して除去してもよい。

上述した実施の形態と比べて、本実施の形態では、エッジ検出及び直線検出により、文字領域画像に文字枠が含まれたことに起因した文字分割の誤りを回避することができ、さらに、文字分割の正確度が向上した。

一実施の形態では、ｃａｎｎｙ演算子により、階調画像に対してエッジ検出を行っているところに、階調画像の画質特徴を検出するステップ、および、階調画像の画質特徴により、ｃａｎｎｙ演算子のパラメータを適応的に調整するステップをさらに含んでもよい。

具体的に、上記画質特徴は、大局コントラスト、大局階調平均値などの画質を表すための特徴値を含んでもよい。具体的に、エッジ検出の過程における耐ノイズ性と検出精度を両立できない問題をさらに解決するために、本発明の実施例では、階調画像の画質特徴により、当該ｃａｎｎｙ演算子におけるパラメータを適応的に特定するようにし、当該画質特徴は、例えば、大局コントラストであってもよく、当該ｃａｎｎｙ演算子におけるパラメータは、例えば、高い閾値及び／又は低い閾値であってもよい。例を挙げると、階調画像の大局コントラストがより低いことを検出されると、当該階調画像の鮮明度が低いと推測し、更に高い、高い閾値及び／又は低い閾値を用いることとなり、階調画像の大局コントラストがより高いことを検出されると、当該階調画像の大局コントラストが高いと推測し、より低い、高い閾値及び／又は低い閾値を用いることとなる。

理解すべきなのは、当該ｃａｎｎｙ演算子は、二重閾値（Ｄｏｕｂｌｅ－Ｔｈｒｅｓｈｏｌｄ）検出を用いて真のエッジと潜在エッジを特定する必要がある。例を挙げると、１つの画素は、勾配が高い閾値よりも大きいものであれば、エッジ画素点として見なされるが、低い閾値よりも小さいものであれば、非エッジ画素点として見なされ、また、当該画素点の勾配が両者の間のものであれば、エッジ画素に接続された場合に限って、エッジ画素点として見なされる。しかし、従来のｃａｎｎｙ演算子では、高い閾値と低い閾値は人為的に設定されるものであり、且つ、高い閾値／低い閾値の割合が一定のものである。そうすると、ｃａｎｎｙ演算子の応用方面では、局限性がある。それを基にして、本実施例では、階調画像の画質特徴により、高い閾値と低い閾値を適応的に調整する方法が用いられたことで、上述した実施の形態と比べて、周辺の大量かつ無用の偽の境界情報が低減され、欠陥エッジへの識別に対するノイズからの影響が抑えられ、後続のハフ変換過程に対しても極めて重要な作用を奏する。選択的に、現在、文字分割が行われている文字領域画像の質に応じてパラメータを適応的に調整できるように、パラメータモデルを予めトレーニングしてもよい。

一実施の形態では、エッジ検出に対するノイズからの影響を低減するために、ｃａｎｎｙ演算子を用いて階調画像に対してエッジ検出を行う前に、方法７００は、階調画像をフィルタリング処理するステップをさらに含んでもよく、ここで、フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である。

具体的に、エッジ検出の結果に対するノイズからの影響をなるべく低減するために、ノイズを濾過・除去することでノイズによる誤検出を防止しなければならない。従って、本実施例では、ガウスフィルタリング及び／又はメディアンフィルタリングを用いて、階調画像を畳み込むことで、明らかなノイズによる影響を低減して、画像を平滑化する。ここで、ガウスフィルタリングは、線形平滑化フィルタリング処理であり、ガウスノイズの除去に適する。メディアンフィルタリングは、非線形平滑化フィルタリング処理であり、処理される画像における各画素点の階調値を、当該点のある隣り合う領域のウィンドウ内の全ての画素点階調値のメディアンに設定するものである。メディアンフィルタリングは、パルスノイズに対して良好な濾過・除去作用を有するとともに、ノイズを濾過・除去すると同時に、信号のエッジを、ぼやけないように保護することができる。

上述した実施の形態と比べて、本実施の形態では、階調画像に対してガウスフィルタリング処理及び／又はメディアンフィルタリング処理を行うことにより、メーター上の汚れ又は光反射に起因したノイズからの影響を低減することができ、後続のエッジ検出の正確度を向上させる。

一実施の形態では、クラスに対するノイズ点からの不利な影響をさらに消去するために、ステップ７０２の実行前に、方法７００は、階調画像に対して対数変換を行うことをさらに含んでもよい。ここで、上述したように、階調画像に対して対数変換を行う目的は、階調画像におけるコントラストを高めることである。具体的に、当該対数変換によれば、階調画像における階調値が低い部分を拡張して、階調値が高い部分を圧縮することで、画像における階調値が低い部分を強調する目的を達成することができる。そのため、全体的にコントラストが低く、階調値が低い画像に対して、良好な強調効果がある。

一実施の形態では、汚れや光反射などの複数の干渉がさらに除去された二値画像を取得するために、ステップ７０２は、Ｃ個のクラスタのクラスタセンターから、Ｃ個のクラスタの属性をそれぞれ、特定するステップ、階調画像の任意１つの画素点の、Ｃ個のクラスタの各々に対応するＣ個のメンバーシップを特定するステップ、さらに、メンバーシップに応じてＣ個のクラスタを整列して、その中のＮ個のクラスタを特定するとともに、Ｎ個のクラスタの属性に応じて、階調画像の任意１つの画素点の属性を特定し、ここで、ＣとＮが正の整数であるステップ、および、階調画像の任意１つの画素点の属性に応じて、階調画像に対して二値化処理を行うステップを含んでもよい。

具体的に、上記ＣとＮは、調整可能な動的なパラメータであり、種々の異なる閾値を組み合わせることができる。さらに、Ｃ個のクラスタのクラスタセンターから、当該Ｃ個のクラスタの属性をそれぞれ、特定することは、具体的に、各クラスタのクラスタセンターの階調値が予め設定された閾値を超えたか否かを判断することで、各クラスタの属性が前景か背景かを特定してもよい。さらに、メンバーシップに応じてＣ個のクラスタを整列して、その中のＮ個のクラスタを特定することは、具体的に、メンバーシップが最も高いＮ個のクラスタを選択してもよい。さらに、Ｎ個のクラスタの属性に応じて、階調画像の任意１つの画素点の属性を特定することは、当該Ｎ個のクラスタの属性を総合的に考慮して階調画像の任意１つの画素点の属性を判断することを意味している。例えば、ある画素点について、それに対応する当該Ｎ個のクラスタの属性が全部、前景である場合に限って、当該画素点を前景画素点として判断するが、さもなければ、当該画素点を背景画素点として判断する。さらに、例えば、ある画素点について、それに対応する当該Ｎ個のクラスタのうち、クラスタの属性が前景であるものが所定の割合を超えた場合、当該画素点を前景画素点として判断するが、さもなければ、当該画素点を背景画素点として判断する。

例を挙げると、Ｃ＝５、Ｎ＝２として予め設定し、また、ある画素点に対応する当該Ｎ個のクラスタの属性が全部、前景である場合に限って、当該画素点を前景画素点として判断するが、さもなければ、当該画素点を背景画素点として判断することをルールとして予め設定する。それを基にして、ＦＣＭにより、当該階調画像における各画素点の５つのクラスタ（Ｃ_１、Ｃ_２、Ｃ_３、Ｃ_４、Ｃ_５）に対するメンバーシップ及び各クラスタのクラスタセンターを出力してもよい。さらに、当該クラスタセンターは、各クラスタの平均的特徴を表すものであり、当該クラスタセンターにより、各クラスタが背景系に対応するか、前景系に対応するかを判断してもよい。例えば、Ｃ_１が前景に該当し、Ｃ_２が前景に該当し、Ｃ_３が背景に該当し、Ｃ_４が背景に該当し、Ｃ_５が背景に該当する。さらに、当該階調画像における画素点Ａについて、この５つのクラスタ（Ｃ_１、Ｃ_２、Ｃ_３、Ｃ_４、Ｃ_５）に対するメンバーシップがそれぞれ、（ｂ_１、ｂ_２、ｂ_３、ｂ_４、ｂ_５）であることが得られ、ここで、ｂ_２＞ｂ_３＞ｂ_１＞ｂ_４＞ｂ_５の場合、その中から、上位２位として整列されたメンバーシップｂ_２とｂ_３を選択するとともに、選択したメンバーシップに対応する２つのクラスタＣ２とＣ３に応じて、当該画素点Ａが前景画素点から背景画素点かを総合的に判断する。そのため、上記予め設定されたルールに従うと、画素点Ａを背景画素点として判断する。

上述した実施の形態と比べて、本実施の形態では、文字の基本的な輪郭を保留したままで、二値画像におけるノイズ点をさらに低減することができ、文字分割の効果をさらに最適化した。

一実施の形態では、図１０を参照して、得られた少なくとも１つの文字位置決めブロックのうちに、ノイズ点に起因した干渉ブロックが若干ある。上記干渉ブロックをさらに正確に除去するために、ステップ７０３の後、方法７００は、少なくとも１つの文字位置決めブロックの各々の前景画素面積を検出するステップと、前景画素面積に基づき、少なくとも１つの文字位置決めブロックの中から干渉ブロックを検出するとともに、少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するステップとをさらに含んでもよく、ここで、干渉ブロックの前景画素面積は、少なくとも、少なくとも１つの文字位置決めブロックの中のＭ個の文字位置決めブロックの前景画素面積よりも小さく、ただし、Ｍが予め設定された文字の数である。

具体的には、当該前景画素面積とは、文字位置決めブロックにおける前景画素点が占める面積を指す。選択的に、計算量をさらに省くために、各文字位置決めブロックに対して、水平投影を行うことで文字高さを取得するとともに、当該文字位置決めブロックの幅と当該文字高さとに基づいて当該前景画素面積を推算してもよい。さらに、当該予め設定された文字の数Ｍは、当該メーターのダイヤルに応じて予め確認されたものである。さらに、図１０に示されるように、ノイズ点に起因した干渉ブロックには、通常、前景画素点が少ないので、前景画素面積に基づいて少なくとも１つの文字位置決めブロックに対して大きい順に整列するとともに、上位Ｍ個の文字位置決めブロックを選択して後続のステップ７０４に用いて、残りの文字位置決めブロックを干渉ブロックとして除去してもよい。

上述した実施の形態と比べて、本実施の形態では、各文字位置決めブロックの前景画素面積に基づいて、ノイズ点に起因した干渉ブロックを特定することにより、真の文字に対応する、文字の幅が小さい文字位置決めブロックを干渉ブロックとして誤検出してしまうのを回避し、更に正確な除去効果を実現することができ、文字分割の効果をさらに最適化した。

一実施の形態では、図１０を参照して、得られた少なくとも１つの文字位置決めブロックのうちに、ノイズ点に起因した干渉ブロックが若干ある。上記干渉ブロックをさらに正確に除去するために、ステップ７０３の後、方法７００は、非最近傍抑制アルゴリズム（ＮｏｎＮｅａｒｅｓｔＳｕｐｐｒｅｓｓｉｏｎ、以下はＮＮＳと略称）により、少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するステップをさらに含んでもよい。

具体的に、上述したように、ＮＭＳアルゴリズムにより、少なくとも１つの文字位置決めブロックから、干渉ブロックを除去することは、具体的に、上記二値画像における最も左側の前景画素点と最も右側の前景画素点を見出して、両者の位置情報及び両者間の幅に基づいて、各文字に対応する文字黄金センターを特定し、さらに、各文字の文字黄金センターとの距離が最も近い文字位置決めブロックを選択して後続のステップ７０４に用いるとともに、残りの文字位置決めブロックを干渉ブロックとして除去することを含んでもよい。

上述した実施の形態と比べて、本実施の形態では、ノイズ点に起因した干渉ブロックを正確かつ簡単に除去することができ、文字分割の効果をさらに最適化した。

一実施の形態では、幾つかの文字（例えば、数字の「１」または「７」）の幅が小さいため、不完全な文字分割となりやすい。それを基にして、ステップ７０４は、少なくとも１つの文字位置決めブロックの平均幅を特定し、前記少なくとも１つの文字位置決めブロックにおいて、幅が平均幅よりも小さい目標文字位置決めブロックがあれば、目標文字位置決めブロックの位置情報と平均幅とに基づき、文字領域画像に対して文字分割を行うことをさらに含んでもよい。それにより、不完全な文字分割の発生を回避した。

図１４は、本願の一実施例に係る文字分割装置１４０の構造概略図であり、図７に示される文字分割方法を実施するためのものである。

図１４に示されるように、文字分割装置１４０は、
文字領域画像を取得するとともに、文字領域画像を階調画像に変換するための取得モジュール１４１を含む。具体的に、当該メーターは、日常生活でよく見られる水道メーター、電気メーター、ガスメーターを含むが、これらに限らず、例えば、キャラクターホイール型水道メーターであってもよい。さらに、当該メーターの文字領域画像は、単一文字画像又は複数文字画像であってもよく、当該メーターのダイヤルに向かって設けられた撮像装置によって取得されてもよい。勿論、当該文字領域画像は、他の出所からのものであってもよく、例えば、他の機器からのものであってもよいし、又は、既存の画像であってもよいが、本実施例では、制限されていない。さらに、取得される文字領域画像は、ＲＧＢ形式のものであってもよい。そして、文字領域画像の取得後、文字領域画像における各画素点の階調値を、浮動小数点アルゴリズム、整数化方法、シフト方法、平均化方法など、様々な方式によって特定するとともに、画素点における赤、緑、青という３チャネルの画素値の代わりに、当該階調値を用いることが可能である。

例を挙げると、図８を参照して、１枚の文字領域画像の階調画像が示され、当該文字領域画像には、左から右へと、７つの文字「０」、「０」、「０」、「０」、「１」、「１」、「１」が順次に表示される。上述した複数の文字間の境界が十分に明瞭なものではないことが明らかになり、また、カメラの感光素子の解像度が足りないので、文字領域画像に横縞が生じてしまい、さらに、各文字が接続された状態となり、そのため、正確な文字分割が困難である問題がある。

図８に示されるように、文字分割装置１４０は、
ファジィＣ平均値により、階調画像に対してクラスタ分析を行うとともに、クラスタ分析の結果から、階調画像に対して二値化処理を行って二値画像を取得するためのクラスタリングモジュール１４２を含む。具体的に、ファジィＣ－平均クラスタリング（ｆｕｚｚｙｃ－ｍｅａｎｓ、以下は、ＦＣＭと略称）アルゴリズムは、教師なしファジィクラスタリング法であり、同一のクラスに分けられた対象間の類似度を最大にして、異なるクラス間の類似度を最小にするという構想によるものである。本実施例では、ファジィ集合の概念により、クラスタリングして生成されたクラスをファジィ集合として見なし、さらに、階調画像における各画素点の各クラスに該当するメンバーシップを取得し、ここで、各画素点のクラスに該当するメンバーシップが［０，１］区間内の値であり、且つ、各画素点の複数のクラスに該当するメンバーシップの総和が１に等しい。理解すべきなのは、ＦＣＭアルゴリズムは、一般的なＣ平均化アルゴリズムを改良したものであり、一般的なＣ平均化アルゴリズムでは、データの分割が押し付けられるもので、ハードクラスタリングすることにより、識別される対象をあるクラスに該当するように厳しく分割するので、「二つに一つ」という特性を有するが、一方、ＦＣＭでは、柔軟性のあるファジィクラスタリングであり、このようなファジィクラスタリングすることにより、クラスに対するサンプルの不確定記述を構築して、客観的な世界をより客観的に反応することができる。

図１４に示されるように、文字分割装置１４０は、
投影法により、二値画像から、少なくとも１つの文字位置決めブロックを取得するための位置決めモジュール１４３を含む。具体的に、上記投影法では、二値画像の画素点の分布ヒストグラムを分析することで、隣り合う文字の境界点を見出して、それを基にして分割し、上記二値画像における異なる文字に対応する画像領域を互いに切り離して、各画像領域における背景領域をなるべく、多く除去するものである。ここで、上記投影法は、具体的に、垂直投影と水平投影を含むが、本実施例では、垂直投影が優先的に用いられるとともに、垂直投影図における投影値が０である投影位置に基づいて当該少なくとも１つの文字位置決めブロックを特定する。

図１４に示されるように、文字分割装置１４０は、
少なくとも１つの文字位置決めブロックの位置情報に基づき、文字領域画像に対して文字分割を行うための分割モジュール１４４を含む。図１１を参照して、図１０に得られた複数の文字位置決めブロックの位置情報に基づいて、図８に示される文字領域画像から文字分割が行われた後、得られた複数の文字画像が示される。

図１４に示す文字分割装置を基にして、本願における幾つかの実施例では、当該文字分割装置の幾つかの具体的な実施方案及び拡張方案がさらに提供される。以下は、これらの方案を説明する。

一実施の形態では、文字分割装置１４０は、
ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行って、エッジ画像を取得するためのエッジ検出モジュールと、ハフ変換方程式により、エッジ画像に対して直線検出を行って、エッジ画像の境界線を取得するための直線検出モジュールと、境界線から、階調画像の境界部分を除去するための境界除去モジュールと、をさらに含んでもよい。

例を挙げると、図１３を参照して、図１２中の長い矩形文字枠を含む階調画像に対してエッジ検出を行うことで得られたエッジ画像が示される。図１３に示されるエッジ画像の上下側のエッジには、明らかな直線があることが明らかになり、さらに、ハフ変換方程式により、境界線を容易に検出することができる。さらに、図１２において、検出された境界線の位置に応じて相応な境界部分を除去することで、図８に示される階調画像を取得することができる。選択的に、当該二値画像を水平投影するとともに、水平投影図における投影値が０である投影位置に基づいて、当該文字枠に対応する上側エッジと下側エッジを切り出して除去してもよい。

上述した実施の形態と比べて、本実施の形態では、エッジ検出モジュール、直線検出モジュール、および、境界除去モジュールが用いられたことで、文字領域画像に文字枠が含まれたことに起因した文字分割の誤りを回避することができ、さらに、文字分割の正確度が向上した。

一実施の形態では、上記エッジ検出モジュールは、画質検出モジュールとパラメータ調整モジュールをさらに含んでもよい。ここで、画質検出モジュールは、階調画像の画質特徴を検出するためのものであってもよく、パラメータ調整モジュールは、階調画像の画質特徴により、ｃａｎｎｙ演算子のパラメータを適応的に調整するためのものであってもよい。具体的に、上記画質特徴は、大局コントラスト、大局階調平均値などの画質を表すための特徴値を含んでもよい。具体的に、エッジ検出の過程における耐ノイズ性と検出精度を両立できない問題をさらに解決するために、本発明の実施例では、階調画像の画質特徴により、当該ｃａｎｎｙ演算子におけるパラメータを適応的に特定するようにし、当該画質特徴は、例えば、大局コントラストであってもよく、当該ｃａｎｎｙ演算子におけるパラメータは、例えば、高い閾値及び／又は低い閾値であってもよい。例を挙げると、階調画像の大局コントラストがより低いことを検出されると、当該階調画像の鮮明度が低いと推測し、更に高い、高い閾値及び／又は低い閾値を用いることとなり、階調画像の大局コントラストがより高いことを検出されると、当該階調画像の大局コントラストが高いと推測し、より低い、高い閾値及び／又は低い閾値を用いることとなる。

一実施の形態では、エッジ検出に対するノイズからの影響を低減するために、文字分割装置１４０は、
ｃａｎｎｙ演算子を用いて、階調画像に対してエッジ検出を行う前に、階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに含んでもよく、ここで、フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である。具体的に、エッジ検出の結果に対するノイズからの影響をなるべく低減するために、ノイズを濾過・除去することでノイズによる誤検出を防止しなければならない。従って、本実施例では、ガウスフィルタリング及び／又はメディアンフィルタリングを用いて、階調画像を畳み込むことで、明らかなノイズによる影響を低減して、画像を平滑化する。ここで、ガウスフィルタリングは、線形平滑化フィルタリング処理であり、ガウスノイズの除去に適する。メディアンフィルタリングは、非線形平滑化フィルタリング処理であり、処理される画像における各画素点の階調値を、当該点のある隣り合う領域のウィンドウ内の全ての画素点階調値のメディアンに設定するものである。メディアンフィルタリングは、パルスノイズに対して良好な濾過・除去作用を有するとともに、ノイズを濾過・除去すると同時に、信号のエッジを、ぼやけないように保護することができる。

一実施の形態では、クラスに対するノイズ点からの不利な影響をさらに消去するために、文字分割装置１４０は、
階調画像に対して対数変換を行うための対数変換モジュールをさらに含んでもよい。ここで、上述したように、階調画像に対して対数変換を行う目的は、階調画像におけるコントラストを高めることである。具体的に、当該対数変換によれば、階調画像における階調値が低い部分を拡張して、階調値が高い部分を圧縮することで、画像における階調値が低い部分を強調する目的を達成することができる。そのため、全体的にコントラストが低く、階調値が低い画像に対して、良好な強調効果がある。

一実施の形態では、汚れや光反射などの複数の干渉がさらに除去された二値画像を取得するために、クラスタリングモジュール１４２は、さらに、
Ｃ個のクラスタのクラスタセンターから、Ｃ個のクラスタの属性をそれぞれ、特定し、階調画像の任意１つの画素点の、Ｃ個のクラスタの各々に対応するＣ個のメンバーシップを特定し、さらに、メンバーシップに応じてＣ個のクラスタを整列して、その中のＮ個のクラスタを特定するとともに、Ｎ個のクラスタの属性に応じて、階調画像の任意１つの画素点の属性を特定し、ここで、ＣとＮが正の整数であり、階調画像の任意１つの画素点の属性に応じて、階調画像に対して二値化処理を行うためのものであってもよい。具体的に、上記ＣとＮは、調整可能な動的なパラメータであり、種々の異なる閾値を組み合わせることができる。さらに、Ｃ個のクラスタのクラスタセンターから、当該Ｃ個のクラスタの属性をそれぞれ、特定することは、具体的に、各クラスタのクラスタセンターの階調値が予め設定された閾値を超えたか否かを判断することで、各クラスタの属性が前景か背景かを特定してもよい。さらに、メンバーシップに応じてＣ個のクラスタを整列して、その中のＮ個のクラスタを特定することは、具体的に、メンバーシップが最も高いＮ個のクラスタを選択してもよい。さらに、Ｎ個のクラスタの属性に応じて、階調画像の任意１つの画素点の属性を特定することは、当該Ｎ個のクラスタの属性を総合的に考慮して階調画像の任意１つの画素点の属性を判断することを意味している。例えば、ある画素点について、それに対応する当該Ｎ個のクラスタの属性が全部、前景である場合に限って、当該画素点を前景画素点として判断するが、さもなければ、当該画素点を背景画素点として判断する。さらに、例えば、ある画素点について、それに対応する当該Ｎ個のクラスタのうち、クラスタの属性が前景であるものが所定の割合を超えた場合、当該画素点を前景画素点として判断するが、さもなければ、当該画素点を背景画素点として判断する。

一実施の形態では、図１０を参照して、得られた少なくとも１つの文字位置決めブロックのうちに、ノイズ点に起因した干渉ブロックが若干ある。上記干渉ブロックをさらに正確に除去するために、文字分割装置１４０は、
少なくとも１つの文字位置決めブロックの各々の前景画素面積を検出し、前景画素面積に基づき、少なくとも１つの文字位置決めブロックの中から干渉ブロックを検出するとともに、少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するための第１の除去モジュールをさらに含んでもよく、ここで、当該干渉ブロックの前景画素面積は、少なくとも、少なくとも１つの文字位置決めブロックの中のＭ個の文字位置決めブロックの前景画素面積よりも小さく、ただし、Ｍが予め設定された文字の数である。具体的には、当該前景画素面積とは、文字位置決めブロックにおける前景画素点が占める面積を指す。選択的に、計算量をさらに省くために、各文字位置決めブロックに対して、水平投影を行うことで文字高さを取得するとともに、当該文字位置決めブロックの幅と当該文字高さとに基づいて当該前景画素面積を推算してもよい。さらに、当該予め設定された文字の数Ｍは、当該メーターのダイヤルに応じて予め確認されたものである。さらに、図１０に示されるように、ノイズ点に起因した干渉ブロックには、通常、前景画素点が少ないので、前景画素面積に基づいて少なくとも１つの文字位置決めブロックに対して大きい順に整列するとともに、上位Ｍ個の文字位置決めブロックを選択して分割モジュール１４４に入力して、残りの文字位置決めブロックを干渉ブロックとして除去してもよい。

一実施の形態では、図１０を参照して、得られた少なくとも１つの文字位置決めブロックのうちに、ノイズ点に起因した干渉ブロックが若干ある。上記干渉ブロックをさらに正確に除去するために、文字分割装置１４０は、
非最近傍抑制アルゴリズム（ＮｏｎＮｅａｒｅｓｔＳｕｐｐｒｅｓｓｉｏｎ、以下はＮＮＳと略称）により、少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するための第２の除去モジュールをさらに含んでもよい。具体的に、上述したように、ＮＭＳアルゴリズムにより、少なくとも１つの文字位置決めブロックから、干渉ブロックを除去することは、具体的に、上記二値画像における最も左側の前景画素点と最も右側の前景画素点を見出して、両者の位置情報及び両者間の幅に基づいて、各文字に対応する文字黄金センターを特定し、さらに、各文字の文字黄金センターとの距離が最も近い文字位置決めブロックを選択して分割モジュール１４４に入力するとともに、残りの文字位置決めブロックを干渉ブロックとして除去することを含んでもよい。

上述した実施の形態と比べて、本実施例では、ノイズ点に起因した干渉ブロックを正確かつ簡単に除去することができ、文字分割の効果をさらに最適化した。

一実施の形態では、幾つかの文字（例えば、数字の「１」または「７」）の幅が小さいため、不完全な文字分割となりやすい。それを基にして、上記分割モジュール１４４は、さらに、
少なくとも１つの文字位置決めブロックの平均幅を特定し、前記少なくとも１つの文字位置決めブロックにおいて、幅が平均幅よりも小さい目標文字位置決めブロックがあれば、目標文字位置決めブロックの位置情報と平均幅とに基づき、文字領域画像に対して文字分割を行うためのものであってもよい。それにより、不完全な文字分割の発生を回避した。

図１５は、本発明の一実施例に係る文字分割装置を示し、当該装置は、少なくとも１つのプロセッサと、少なくとも１つのプロセッサと通信接続されるメモリと、を含み、メモリには、少なくとも１つのプロセッサによって実行されることができるコマンドが記憶されており、コマンドが少なくとも１つのプロセッサによって実行されることにより、図１に示される文字分割方法、及び／又は、図７に示される別の文字分割方法を少なくとも１つのプロセッサに実行させることができる。

本願の幾つかの実施例によれば、コンピュータが実行可能なコマンドが記憶されており、当該コンピュータが実行可能なコマンドは、プロセッサによって運行されると、図１に示される文字分割方法、及び／又は、図７に示される文字分割方法を実行するように設置された、文字分割方法の不揮発性コンピュータ記憶媒体を提供する。

本願の幾つかの実施例によれば、ダイヤルには、読値を表示するための少なくとも１つの文字枠が含まれるメーターと、当該メーターのダイヤルを撮影して文字領域画像を取得するための撮像装置と、撮像装置に電気的に接続され、図１に示される文字分割方法、及び／又は、図７に示される文字分割方法を実行するための文字分割装置と、を備えた、スマートメーター読み取りシステムを提供する。

本願における各実施例は、漸進的な方式により記述されており、各実施例間における同一や類似した部分について、相互参照すればよく、各実施例では、他の実施例との相違点に重点を置いて説明されている。特に、装置、機器及びコンピュータ可読記憶媒体の実施例について、それらが方法実施例と基本的に同じなので、それらに対する記述は簡素化され、関連部分について、方法実施例における一部の説明を参照すればよい。

本願の実施例で提供される装置、機器及びコンピュータ可読記憶媒体は、方法と一対一で対応するものである。そのため、装置、機器及びコンピュータ可読記憶媒体は、それらに対応する方法と類似した有益な技術的効果を有するものである。以上は、方法による有益な技術的効果について詳しく説明されているので、ここでは、装置、機器及びコンピュータ可読記憶媒体による有益な技術的効果の説明を省略する。

当業者であれば分かるように、本発明の実施例は、方法、システム、または、コンピュータプログラム製品として提供されてもよい。そのため、本発明は、完全ハードウェアの実施例、完全ソフトウェアの実施例、または、ソフトウェアとハードウェアを組み合わせた方面の実施例の形式が用いられてもよい。しかも、本発明は、１つまたは複数の、コンピュータ利用可能なプログラムコードを含むコンピュータ利用可能な記憶媒体（ディスクメモリ、ＣＤ－ＲＯＭ、光学メモリなどを含むが、それらに限られないもの）に実施されるコンピュータプログラム製品の形式が用いられてもよい。

本発明は、本発明の実施例に係る方法、デバイス（システム）およびコンピュータプログラム製品のフローチャートおよび／またはブロック図を参照して説明していた。理解すべきなのは、コンピュータプログラムコマンドによって、フローチャート及び／又はブロック図における各プロセス及び／又はブロックや、フローチャート及び／又はブロック図におけるプロセス及び／またはブロックの組み合わせが実現されてもよい。これらのコンピュータプログラムコマンドを、汎用コンピュータ、専用コンピュータ、埋込型プロセッサ、または、他のプログラマブルデータ処理装置のプロセッサに提供することにより、機器を発生させ、それにより、コンピュータ又は他のプログラマブルデータ処理装置のプロセッサによって実行されるコマンドによれば、フローチャートにおける１つのフローまたは複数のフロー及び／又はブロック図の１つのブロックまたは複数のブロックに指定された機能を実現するための装置を発生させる。

これらのコンピュータプログラムコマンドは、コンピュータ又は他のプログラマブルデータ処理装置を特定の方式で作動するようにガイドできるコンピュータ可読メモリに記憶されてもよい。それにより、当該コンピュータ可読メモリに記憶されたコマンドは、コマンド装置を含む製品を発生させ、当該コマンド装置によれば、フローチャートにおける１つのフローまたは複数のフロー及び／又はブロック図の１つのブロックまたは複数のブロックに指定された機能が実現される。

これらのコンピュータプログラムコマンドは、コンピュータ又は他のプログラマブルデータ処理装置にロードされてもよい。それにより、コンピュータ又は他のプログラマブル装置において、一連の操作を実行してコンピュータによって実現される処理を発生させ、さらに、コンピュータ又は他のプログラマブル装置によって実行されるコマンドは、フローチャートにおける１つのフローまたは複数のフロー及び／又はブロック図の１つのブロックまたは複数のブロックに指定された機能を実現するためのステップを提供する。

典型的な配置では、コンピュータ機器には、１つ以上のプロセッサ（ＣＰＵ）、入出力インターフェース、ネットワークインターフェース及びメモリが含まれる。
メモリは、コンピュータ可読媒体における非永久的メモリ、ランダムアクセスメモリ（ＲＡＭ）及び／又は不揮発性メモリなどの形式を有するものを含んでもよく、例えば、リードオンリーメモリ（ＲＯＭ）又はフラッシュメモリ（ｆｌａｓｈＲＡＭ）が考えられる。メモリは、コンピュータ可読媒体の一例である。

コンピュータ可読媒体は、永久的・非永久的、移動可能・移動不可能な媒体を含み、任意の方法又は技術によって情報の記憶が実現されてもよい。情報は、コンピュータ可読コマンド、データ構成、プログラムのモジュール又は他のデータであってもよい。コンピュータの記憶媒体の例として、コンピュータ機器によってアクセスされ得る情報を記憶することができるような、相変化メモリ（ＰＲＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、他の種類のランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、電気的消去可能プログラマブル読み出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュメモリまたは他のメモリ技術、コンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）または他の光学記憶装置、磁気カセット、磁気テープ磁気ディスク記憶装置または他の磁気記憶装置または任意の他の非伝送媒体を含んでもよいが、それらによって制限されない。また、添付図面には、本発明方法の操作が特定の順序に従って記述されているが、しかし、それらの操作が当該特定の順序に従って実行されなければならないこと、または、示された全ての操作が実行されないと、所望の結果が実現されないことを要求したり、非明示に開示したりするためのものではない。付加的または選択的に、いくつかのステップを省略したり、複数のステップを１つのステップに合併して実行したり、及び／または、１つのステップを複数のステップに分割して実行したりすることができる。

本発明の精神と原理は、若干の具体的な実施の形態を参照して説明されているが、理解すべきなのは、本発明は、開示されている具体的な実施の形態によって限定されず、各態様の分割は、単に説明の便宜のためのものに過ぎず、これらの態様の特徴を組み合わせて利益を得ることができないことを意味しない。本発明は、添付の請求項の精神や範囲に含まれる様々な修正や同等の構成を包含することが意図される。

Claims

少なくとも１つの文字枠を含む文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するステップ、
エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換するステップ、
投影法により、前記エッジ二値画像から、文字枠分割ブロックを取得するステップ、および、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックから、目標文字領域を特定するとともに、前記目標文字領域に応じて、前記文字領域画像に対して文字分割を行うステップを含む、ことを特徴とする文字分割方法。
エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換する前に、
前記階調画像をフィルタリング処理するステップをさらに含み、
前記フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である、ことを特徴とする請求項１に記載の文字分割方法。
エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換する前記ステップは、
ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行うとともに、前記エッジ検出の結果から、前記階調画像を前記エッジ二値画像に変換するステップを含む、ことを特徴とする請求項１に記載の文字分割方法。
ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行う前に、
前記階調画像の画質特徴を検出するステップ、および、
前記階調画像の画質特徴により、前記ｃａｎｎｙ演算子のパラメータを適応的に調整するステップを含み、
前記画質特徴は、大局コントラスト、大局階調平均値のうちの１つまたは複数を含む、ことを特徴とする請求項３に記載の文字分割方法。
投影法により、前記エッジ二値画像から、文字枠分割ブロックを取得する前記ステップは、
垂直投影法により、前記エッジ二値画像に対して分割処理を行うことで、前記少なくとも１つの文字枠に対応する関係をもつ少なくとも１つの前記文字枠分割ブロックを取得するステップを含む、ことを特徴とする請求項１に記載の文字分割方法。
輪郭検出アルゴリズムにより、前記文字枠分割ブロックから、目標文字領域を特定する前記ステップは、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックにおける文字輪郭を特定するステップ、および、
前記文字枠分割ブロックにおける前記文字輪郭の最小外接矩形領域により、前記目標文字領域を特定するステップ、を含む、ことを特徴とする請求項１に記載の文字分割方法。
少なくとも１つの文字枠を含む文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するための取得モジュールと、
エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換するためのエッジ検出モジュールと、
投影法により、前記エッジ二値画像から、文字枠分割ブロックを取得するための投影モジュールと、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックから、目標文字領域を特定するとともに、前記目標文字領域に応じて、前記文字領域画像に対して文字分割を行うための輪郭検出モジュールと、を備えた、ことを特徴とする文字分割装置。
エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換する前に、前記階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに備え、
前記フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理である、ことを特徴とする請求項７に記載の文字分割装置。
前記エッジ検出モジュールは、
ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行うとともに、前記エッジ検出の結果から、前記階調画像を前記エッジ二値画像に変換するためのものでもある、ことを特徴とする請求項７に記載の文字分割装置。
前記エッジ検出モジュールは、
前記階調画像の画質特徴を検出し、
前記階調画像の画質特徴により、前記ｃａｎｎｙ演算子のパラメータを適応的に調整するためのものでもあり、
前記画質特徴は、大局コントラスト、大局階調平均値のうちの１つまたは複数を含む、ことを特徴とする請求項９に記載の文字分割装置。
前記投影モジュールは、
垂直投影法により、前記エッジ二値画像に対して分割処理を行うことで、前記少なくとも１つの文字枠に対応する関係をもつ少なくとも１つの前記文字枠分割ブロックを取得するためのものでもある、ことを特徴とする請求項７に記載の文字分割装置。
前記エッジ検出モジュールは、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックにおける文字輪郭を特定し、
前記文字枠分割ブロックにおける前記文字輪郭の最小外接矩形領域により、前記目標文字領域を特定するためのものでもある、ことを特徴とする請求項７に記載の文字分割装置。
１つまたは複数のマルチコアプロセッサと、
１つまたは複数のプログラムを記憶するためのメモリと、を含み、
前記１つまたは複数のプログラムが前記１つまたは複数のマルチコアプロセッサによって実行されると、前記１つまたは複数のマルチコアプロセッサに請求項１～７のいずれか１項に記載の方法を実現させる、ことを特徴とする文字分割装置。
プログラムが記憶されており、前記プログラムがマルチコアプロセッサによって実行されると、請求項１～７のいずれか１項に記載の方法を前記マルチコアプロセッサに実行させる、ことを特徴とするコンピュータ可読記憶媒体。
文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するステップ、
ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行って二値画像を取得するステップ、
投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得するステップ、および、
前記少なくとも１つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行うステップ、を含む、ことを特徴とする文字分割方法。
ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行う前に、
ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行って、エッジ画像を取得するステップ、
ハフ変換方程式により、前記エッジ画像に対して直線検出を行って、前記エッジ画像の境界線を取得するステップ、および、
前記境界線から、前記階調画像の境界部分を除去するステップをさらに含む、ことを特徴とする請求項１５に記載の文字分割方法。
ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行う前に、
前記階調画像の画質特徴を検出するステップ、および、
前記階調画像の画質特徴により、前記ｃａｎｎｙ演算子のパラメータを適応的に調整するステップをさらに含み、
前記画質特徴は、大局コントラスト及び／又は大局階調平均値を含む、ことを特徴とする請求項１６に記載の文字分割方法。
ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行う前に、
前記階調画像をフィルタリング処理するステップをさらに含み、
前記フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理を含む、ことを特徴とする請求項１６に記載の文字分割方法。
ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行う前に、
前記階調画像に対して対数変換を行うステップをさらに含む、ことを特徴とする請求項１５に記載の文字分割方法。
ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行う前記ステップは、
前記ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像をクラスタリングして、Ｃ個のクラスタを取得するステップ、
前記Ｃ個のクラスタのクラスタセンターから、前記Ｃ個のクラスタの属性をそれぞれ、特定するステップ、
前記階調画像の任意１つの画素点の、前記Ｃ個のクラスタの各々に対応するＣ個のメンバーシップを特定するステップ、
前記メンバーシップに応じて前記Ｃ個のクラスタを整列して、その中のＮ個のクラスタを特定するとともに、前記Ｎ個のクラスタの属性に応じて、前記階調画像の任意１つの画素点の属性を特定するステップ、および、
前記階調画像の任意１つの画素点の属性に応じて、前記階調画像に対して二値化処理を行うステップ、を含み、
ただし、前記Ｃ、前記Ｎが正の整数であり、且つ、前記Ｃが前記Ｎよりも大きい、ことを特徴とする請求項１５に記載の文字分割方法。
投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得した後、
前記少なくとも１つの文字位置決めブロックの各々の前景画素面積を検出するステップ、および、
前記前景画素面積に基づき、前記少なくとも１つの文字位置決めブロックの中から干渉ブロックを検出するとともに、前記少なくとも１つの文字位置決めブロックから、前記干渉ブロックを除去するステップを含み、
前記干渉ブロックの前記前景画素面積は、少なくとも、前記少なくとも１つの文字位置決めブロックの中のＭ個の文字位置決めブロックの前記前景画素面積よりも小さく、ただし、前記Ｍが予め設定された文字の数である、ことを特徴とする請求項１５に記載の文字分割方法。
垂直投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得した後、
非最近傍抑制アルゴリズムにより、前記少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するステップを含む、ことを特徴とする請求項１５に記載の文字分割方法。
前記少なくとも１つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行う前記ステップは、
前記少なくとも１つの文字位置決めブロックの平均幅を特定するステップ、および、
前記少なくとも１つの文字位置決めブロックにおいて、幅が前記平均幅よりも小さい目標文字位置決めブロックがあれば、前記目標文字位置決めブロックの位置情報と前記平均幅とに基づき、前記文字領域画像に対して文字分割を行うステップ、を含む、ことを特徴とする請求項２１または２２に記載の文字分割方法。
文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するための取得モジュールと、
ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行って二値画像を取得するためのクラスタリングモジュールと、
投影法により、前記二値画像から、少なくとも１つの文字位置決めブロックを取得するための位置決めモジュールと、
前記少なくとも１つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行うための分割モジュールと、を備えた、ことを特徴とする文字分割装置。
ｃａｎｎｙ演算子を用いて、前記階調画像に対してエッジ検出を行って、エッジ画像を取得するためのエッジ検出モジュールと、
ハフ変換方程式により、前記エッジ画像に対して直線検出を行って、前記エッジ画像の境界線を取得するための直線検出モジュールと、
前記境界線から、前記階調画像の境界部分を除去するための境界除去モジュールと、をさらに備えた、ことを特徴とする請求項２４に記載の文字分割装置。
前記エッジ検出モジュールは、
前記階調画像の画質特徴を検出するための画質検出モジュールと、
前記階調画像の画質特徴により、前記ｃａｎｎｙ演算子のパラメータを適応的に調整するためのパラメータ調整モジュールと、をさらに備え、
前記画質特徴は、少なくとも、大局コントラスト及び／又は大局階調平均値を含む、ことを特徴とする請求項２５に記載の文字分割装置。
前記階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに備え、
前記フィルタリング処理は、メディアンフィルタリング処理及び／又はガウスフィルタリング処理を含む、ことを特徴とする請求項２５に記載の文字分割装置。
前記階調画像に対して対数変換を行うための対数変換モジュールをさらに備えた、ことを特徴とする請求項２４に記載の文字分割装置。
前記クラスタリングモジュールは、
前記ファジィＣ－平均クラスタリングアルゴリズムにより、前記階調画像をクラスタリングして、Ｃ個のクラスタを取得し、
前記Ｃ個のクラスタのクラスタセンターから、前記Ｃ個のクラスタの属性をそれぞれ、特定し、
前記階調画像の任意１つの画素点の、前記Ｃ個のクラスタの各々に対応するＣ個のメンバーシップを特定し、
前記メンバーシップに応じて前記Ｃ個のクラスタを整列して、その中のＮ個のクラスタを特定するとともに、前記Ｎ個のクラスタの属性に応じて、前記階調画像の任意１つの画素点の属性を特定し、
前記階調画像の任意１つの画素点の属性に応じて、前記階調画像に対して二値化処理を行うためのものでもあり、
ただし、前記Ｃ、前記Ｎが正の整数であり、且つ、前記Ｃが前記Ｎよりも大きい、ことを特徴とする請求項２４に記載の文字分割装置。
前記少なくとも１つの文字位置決めブロックの各々の前景画素面積を検出し、
前記前景画素面積に基づき、前記少なくとも１つの文字位置決めブロックの中から干渉ブロックを検出するとともに、前記少なくとも１つの文字位置決めブロックから、前記干渉ブロックを除去するための第１の除去モジュールを備え、
前記干渉ブロックの前記前景画素面積は、少なくとも、前記少なくとも１つの文字位置決めブロックの中のＭ個の文字位置決めブロックの前記前景画素面積よりも小さく、ただし、前記Ｍが予め設定された文字の数である、ことを特徴とする請求項２４に記載の文字分割装置。
非最近傍抑制アルゴリズムにより、前記少なくとも１つの文字位置決めブロックから、干渉ブロックを除去するための第２の除去モジュールを備えた、ことを特徴とする請求項２４に記載の文字分割装置。
前記分割モジュールは、
前記少なくとも１つの文字位置決めブロックの平均幅を特定し、
前記少なくとも１つの文字位置決めブロックにおいて、幅が前記平均幅よりも小さい目標文字位置決めブロックがあれば、前記目標文字位置決めブロックの位置情報と前記平均幅とに基づき、前記文字領域画像に対して文字分割を行うためのものでもある、ことを特徴とする請求項２４に記載の文字分割装置。
１つまたは複数のマルチコアプロセッサと、
１つまたは複数のプログラムを記憶するためのメモリと、を含み、
前記１つまたは複数のプログラムが前記１つまたは複数のマルチコアプロセッサによって実行されると、
前記１つまたは複数のマルチコアプロセッサに請求項１５～２３のいずれか１項に記載の方法を実現させる、ことを特徴とする文字分割装置。
プログラムが記憶されており、
前記プログラムがマルチコアプロセッサによって実行されると、
請求項１５～２３のいずれか１項に記載の方法を前記マルチコアプロセッサに実行させる、ことを特徴とするコンピュータ可読記憶媒体。