JP2023505663A - 文字分割方法、装置、および、コンピュータ可読記憶媒体 - Google Patents
文字分割方法、装置、および、コンピュータ可読記憶媒体 Download PDFInfo
- Publication number
- JP2023505663A JP2023505663A JP2022533643A JP2022533643A JP2023505663A JP 2023505663 A JP2023505663 A JP 2023505663A JP 2022533643 A JP2022533643 A JP 2022533643A JP 2022533643 A JP2022533643 A JP 2022533643A JP 2023505663 A JP2023505663 A JP 2023505663A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- grayscale image
- edge
- positioning block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 169
- 230000011218 segmentation Effects 0.000 title claims abstract description 149
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 238000003708 edge detection Methods 0.000 claims abstract description 135
- 238000001514 detection method Methods 0.000 claims abstract description 70
- 238000007621 cluster analysis Methods 0.000 claims abstract description 27
- 238000001914 filtration Methods 0.000 claims description 89
- 230000002452 interceptive effect Effects 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 37
- 230000015654 memory Effects 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000001629 suppression Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 26
- 238000003384 imaging method Methods 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 230000009286 beneficial effect Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000012935 Averaging Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 235000020061 kirsch Nutrition 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
Description
好ましくは、エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換する前に、階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに備え、フィルタリング処理は、メディアンフィルタリング処理及び/又はガウスフィルタリング処理である。
文字領域画像を取得するとともに、文字領域画像を階調画像に変換するための取得モジュール601を含み、ここで、文字領域画像は、少なくとも1つの文字枠を含み、具体的に、当該文字領域画像は、メーターのダイヤル画像であってもよく、当該メーターのダイヤルには、複数の文字枠が含まれ、当該複数の文字枠は、サイズが同じで、規則的に配列されているとともに、ユーザによる数値の読取のために文字枠ごとに単一の文字が展示される。選択的に、文字枠は、矩形、円形など、任意1つの規則的な形状に形成されてもよい。選択的に、当該メーターは、日常生活でよく見られる水道メーター、電気メーター、ガスメーターを含むが、これらに限らず、例えば、キャラクターホイール型水道メーターであってもよい。さらに、当該文字領域画像は、当該メーターのダイヤルに向かって設けられた撮像装置によって取得されてもよい。勿論、当該文字領域画像は、他の出所からのものであってもよく、例えば、他の機器からのものであってもよいし、又は、既存の画像であってもよいが、本実施例では、制限されていない。さらに、取得される文字領域画像は、RGB形式のものであってもよい。文字領域画像の取得後、文字領域画像における各画素点の階調値を、浮動小数点アルゴリズム、整数化方法、シフト方法、平均化方法など、様々な方式によって特定し、画素点における赤、緑、青という3チャネルの画素値の代わりに、当該階調値を用いることが可能である。
エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換するためのエッジ検出モジュール602をさらに含み、具体的に、上述したように、エッジ検出アルゴリズムが用いられる目的は、階調画像における文字を展示するための複数の文字枠の境界を位置決めすることである。ここで、所謂エッジ(edge)とは、画像における局部強度の変化が最も著しい部分を指し、主に目標と背景の間に存在するものであり、各画素点の階調値勾配データから検索されることが可能である。また、一般的に、境界には目立つエッジがあるので、この特徴を活用して画像を分割してもよい。エッジの検出は、常にエッジ検出演算子を用いて行われる。ここでよく用いられるエッジ検出演算子は、Roberts演算子、Laplace演算子、Prewitt演算子、Sobel演算子、Rosonfeld演算子、Kirsch演算子、および、Canny演算子などを含む。さらに、上記1つまたは複数のエッジ検出演算子を用いて、階調画像に対してエッジ検出を行うことでエッジ画素点を抽出するとともに、エッジ画素点を検出された場合、二値化処理を行ってもよい。注意すべきなのは、エッジが複雑なものであって強いノイズ点がある画像に対し、エッジの検出には、耐ノイズ性と検出精度を両立できない問題があり、検出精度が高められると、ノイズによる偽エッジに起因して不合理な輪郭が生じてしまうが、耐ノイズ性が高められると、輪郭の検出漏れの問題が生じてしまう。本実施例では、当該エッジ検出の目的は、階調画像における文字を展示するための文字枠を位置決めすることであるため、耐ノイズ性が高いエッジ検出パラメータを用いることで、検出の結果として考えられる偽エッジが多すぎることを回避した。理解すべきなのは、文字そのものと比べて、文字枠は滑らかで連続した境界を有するため、一部のエッジへの検出が漏れたとしても、その輪郭が依然として示されることができる。しかも、立体効果を有する文字枠(例えば、よく見られるキャラクターホイール型水道メーターの文字枠)について、撮影時の光・影投射の作用により、当該文字枠における画素点は、他の画素点と比べて、高い勾配を有することが一般的である。選択的に、上述したように耐ノイズ性が高いエッジ検出パラメータをさらに取得するために、複数のエッジ検出パラメータを予め設定するとともに、エッジ検出を実行し、且つ、文字枠の基本的な輪郭を保ちながら、ノイズ点を最大限に低減することができるエッジ二値画像を選択してもよい。選択的に、上述したように耐ノイズ性が高いエッジ検出パラメータをさらに取得するために、さらに、異なる質の階調画像に対してエッジ検出パラメータを適応的に調整して耐ノイズ性を高く保つできるように、エッジ検出パラメータモデルを予めトレーニングしてもよい。例えば、階調画像の大局コントラストが低いときに、大量のノイズ点が生じるが、その場合、大局コントラストに応じて、耐ノイズ性が更に高いエッジ検出パラメータを適応的に調整してもよい。選択的に、分水嶺アルゴリズムにより、当該エッジ二値画像を取得してもよい。
投影法により、エッジ二値画像から、文字枠分割ブロックを取得するための投影モジュール603をさらに含み、具体的に、上記投影法は、二値画像の画素点の分布ヒストグラムを用いて分析することで、隣り合う文字枠の境界点を見出して分割することであり、投影法には、具体的に、垂直投影と水平投影が含まれる。当該複数の文字枠分割ブロックは、具体的に、垂直投影図における投影値が谷にあるときの投影位置によって決められる。例を挙げると、図4を参照して、図3(a)に示されるエッジ二値画像を垂直方向に投影して垂直投影図を取得し、垂直投影図における投影値が0である投影位置から、左から右へとの5つの文字枠分割ブロックが得られる。
輪郭検出アルゴリズムにより、文字枠分割ブロックから、目標文字領域を特定するとともに、目標文字領域に応じて、文字領域画像に対して文字分割を行うための輪郭検出モジュール604をさらに含む。具体的に、輪郭検出アルゴリズムを利用する目的は、各文字枠分割ブロック内の文字に対して輪郭検出を行うことで輪郭情報を取得するとともに、当該文字の輪郭情報に基づいて、更に明確な目標文字領域を位置決めして見出すことである。さらに、文字領域画像から、当該目標文字領域に対応する文字画像に対して文字分割を行うとともに、当該文字画像に基づいて更なる文字識別作業を行ってもよい。
本発明では、エッジ検出により、階調画像を粗分割して、文字枠に対応する粗分割の結果、すなわち、文字枠分割ブロックを取得した後、当該文字枠分割ブロックに対して輪郭検出アルゴリズムによって更に正確な目標文字領域を取得し、エッジ検出と輪郭検出を組み合わせたことで、質が低い画像に対しても文字分割を行うことができ、文字分割過程における分割限度を確定しにくい問題を回避した。
エッジ検出アルゴリズムにより、階調画像をエッジ二値画像に変換する前に、階調画像をフィルタリング処理するフィルタリングモジュールをさらに含んでもよく、ここで、フィルタリング処理は、メディアンフィルタリング処理及び/又はガウスフィルタリング処理である。具体的に、エッジもノイズも階調不連続点であり、周波数領域においても高周波成分であるため、微分演算が直接に行われると、ノイズからの影響を抑制しがたいので、微分演算子を用いたエッジ検出の前に、画像を平滑化フィルタリング処理しなければならない。従って、本実施例では、ガウスフィルタリング及び/又はメディアンフィルタリングを用いて、階調画像を畳み込むことで、明らかなノイズによる影響を低減して、画像を平滑化する。ここで、ガウスフィルタリングは、線形平滑化フィルタリング処理であり、ガウスノイズの除去に適する。メディアンフィルタリングは、非線形平滑化フィルタリング処理であり、処理される画像における各画素点の階調値を、当該点のある隣り合う領域のウィンドウ内の全ての画素点階調値のメディアンに設定するものである。メディアンフィルタリングは、パルスノイズに対して良好な濾過・除去作用を有するとともに、ノイズを濾過・除去すると同時に、信号のエッジを、ぼやけないように保護することができる。
canny演算子を用いて、階調画像に対してエッジ検出を行うとともに、エッジ検出の結果から、階調画像をエッジ二値画像に変換するためのものであってもよい。具体的に、canny演算子を用いて、階調画像に対してエッジ検出を行うことは、(1)画像における各画素点の勾配強度及び方向を計算するステップ、(2)非極大値(Non-MaximumSuppression)で抑制することで、エッジ検出によるスプリアス・レスポンスを消去するステップ、(3)二重閾値(Double-Threshold)検出を用いて真のエッジと潜在エッジを特定するステップ、および、(4)孤立した弱エッジを抑制することで最終的にエッジ検出を完成するステップを含んでもよい。ここで、二重閾値とは、cannyエッジ検出アルゴリズムでは、高い閾値と低い閾値の2閾値を設定し、高い閾値が画像における目標と背景を区別させるためのものであり、低い閾値がエッジを平滑化して、不連続のエッジの輪郭を接続するためのものである。具体的に、1つの画素は、勾配が高い閾値よりも大きいものであれば、エッジ画素点として見なされるが、低い閾値よりも小さいものであれば、非エッジ画素点として見なされ、また、当該画素点の勾配が両者の間のものであれば、エッジ画素に接続された場合に限って、エッジ画素点として見なされる。
垂直投影法により、エッジ二値画像に対して分割処理を行うことで、少なくとも1つの文字枠に対応する関係をもつ少なくとも1つの文字枠分割ブロックを取得するためのものであってもよい。具体的に、上述した分割処理の目的は、上述したエッジ二値画像における異なる文字枠に対応する画像領域を互いに切り離して、各画像領域における背景領域をなるべく、多く除去することであり、それにより、ステップ104における輪郭検出の計算量を低減することが可能である。
輪郭検出アルゴリズムにより、文字枠分割ブロックにおける文字輪郭を特定し、文字枠分割ブロックにおける文字輪郭の最小外接矩形領域により、目標文字領域を特定するためのものであってもよい。具体的に、各文字枠分割ブロックについて、特定された最小外接領域は、当該文字枠分割ブロック内の全ての文字輪郭を収容することができる。選択的に、階調画像を、より多くのエッジ情報を有する二値画像に変換してから、当該二値画像から、複数の文字枠分割ブロックの位置に対応する複数の最適文字枠分割ブロックを切り出し、その後、当該複数の最適文字枠分割ブロックに対して輪郭検出を行うことで最適目標文字領域を取得してもよい。
文字領域画像を取得するとともに、文字領域画像を階調画像に変換するための取得モジュール141を含む。具体的に、当該メーターは、日常生活でよく見られる水道メーター、電気メーター、ガスメーターを含むが、これらに限らず、例えば、キャラクターホイール型水道メーターであってもよい。さらに、当該メーターの文字領域画像は、単一文字画像又は複数文字画像であってもよく、当該メーターのダイヤルに向かって設けられた撮像装置によって取得されてもよい。勿論、当該文字領域画像は、他の出所からのものであってもよく、例えば、他の機器からのものであってもよいし、又は、既存の画像であってもよいが、本実施例では、制限されていない。さらに、取得される文字領域画像は、RGB形式のものであってもよい。そして、文字領域画像の取得後、文字領域画像における各画素点の階調値を、浮動小数点アルゴリズム、整数化方法、シフト方法、平均化方法など、様々な方式によって特定するとともに、画素点における赤、緑、青という3チャネルの画素値の代わりに、当該階調値を用いることが可能である。
ファジィC平均値により、階調画像に対してクラスタ分析を行うとともに、クラスタ分析の結果から、階調画像に対して二値化処理を行って二値画像を取得するためのクラスタリングモジュール142を含む。具体的に、ファジィC-平均クラスタリング(fuzzyc-means、以下は、FCMと略称)アルゴリズムは、教師なしファジィクラスタリング法であり、同一のクラスに分けられた対象間の類似度を最大にして、異なるクラス間の類似度を最小にするという構想によるものである。本実施例では、ファジィ集合の概念により、クラスタリングして生成されたクラスをファジィ集合として見なし、さらに、階調画像における各画素点の各クラスに該当するメンバーシップを取得し、ここで、各画素点のクラスに該当するメンバーシップが[0,1]区間内の値であり、且つ、各画素点の複数のクラスに該当するメンバーシップの総和が1に等しい。理解すべきなのは、FCMアルゴリズムは、一般的なC平均化アルゴリズムを改良したものであり、一般的なC平均化アルゴリズムでは、データの分割が押し付けられるもので、ハードクラスタリングすることにより、識別される対象をあるクラスに該当するように厳しく分割するので、「二つに一つ」という特性を有するが、一方、FCMでは、柔軟性のあるファジィクラスタリングであり、このようなファジィクラスタリングすることにより、クラスに対するサンプルの不確定記述を構築して、客観的な世界をより客観的に反応することができる。
投影法により、二値画像から、少なくとも1つの文字位置決めブロックを取得するための位置決めモジュール143を含む。具体的に、上記投影法では、二値画像の画素点の分布ヒストグラムを分析することで、隣り合う文字の境界点を見出して、それを基にして分割し、上記二値画像における異なる文字に対応する画像領域を互いに切り離して、各画像領域における背景領域をなるべく、多く除去するものである。ここで、上記投影法は、具体的に、垂直投影と水平投影を含むが、本実施例では、垂直投影が優先的に用いられるとともに、垂直投影図における投影値が0である投影位置に基づいて当該少なくとも1つの文字位置決めブロックを特定する。
少なくとも1つの文字位置決めブロックの位置情報に基づき、文字領域画像に対して文字分割を行うための分割モジュール144を含む。図11を参照して、図10に得られた複数の文字位置決めブロックの位置情報に基づいて、図8に示される文字領域画像から文字分割が行われた後、得られた複数の文字画像が示される。
canny演算子を用いて、階調画像に対してエッジ検出を行って、エッジ画像を取得するためのエッジ検出モジュールと、ハフ変換方程式により、エッジ画像に対して直線検出を行って、エッジ画像の境界線を取得するための直線検出モジュールと、境界線から、階調画像の境界部分を除去するための境界除去モジュールと、をさらに含んでもよい。
canny演算子を用いて、階調画像に対してエッジ検出を行う前に、階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに含んでもよく、ここで、フィルタリング処理は、メディアンフィルタリング処理及び/又はガウスフィルタリング処理である。具体的に、エッジ検出の結果に対するノイズからの影響をなるべく低減するために、ノイズを濾過・除去することでノイズによる誤検出を防止しなければならない。従って、本実施例では、ガウスフィルタリング及び/又はメディアンフィルタリングを用いて、階調画像を畳み込むことで、明らかなノイズによる影響を低減して、画像を平滑化する。ここで、ガウスフィルタリングは、線形平滑化フィルタリング処理であり、ガウスノイズの除去に適する。メディアンフィルタリングは、非線形平滑化フィルタリング処理であり、処理される画像における各画素点の階調値を、当該点のある隣り合う領域のウィンドウ内の全ての画素点階調値のメディアンに設定するものである。メディアンフィルタリングは、パルスノイズに対して良好な濾過・除去作用を有するとともに、ノイズを濾過・除去すると同時に、信号のエッジを、ぼやけないように保護することができる。
階調画像に対して対数変換を行うための対数変換モジュールをさらに含んでもよい。ここで、上述したように、階調画像に対して対数変換を行う目的は、階調画像におけるコントラストを高めることである。具体的に、当該対数変換によれば、階調画像における階調値が低い部分を拡張して、階調値が高い部分を圧縮することで、画像における階調値が低い部分を強調する目的を達成することができる。そのため、全体的にコントラストが低く、階調値が低い画像に対して、良好な強調効果がある。
C個のクラスタのクラスタセンターから、C個のクラスタの属性をそれぞれ、特定し、階調画像の任意1つの画素点の、C個のクラスタの各々に対応するC個のメンバーシップを特定し、さらに、メンバーシップに応じてC個のクラスタを整列して、その中のN個のクラスタを特定するとともに、N個のクラスタの属性に応じて、階調画像の任意1つの画素点の属性を特定し、ここで、CとNが正の整数であり、階調画像の任意1つの画素点の属性に応じて、階調画像に対して二値化処理を行うためのものであってもよい。具体的に、上記CとNは、調整可能な動的なパラメータであり、種々の異なる閾値を組み合わせることができる。さらに、C個のクラスタのクラスタセンターから、当該C個のクラスタの属性をそれぞれ、特定することは、具体的に、各クラスタのクラスタセンターの階調値が予め設定された閾値を超えたか否かを判断することで、各クラスタの属性が前景か背景かを特定してもよい。さらに、メンバーシップに応じてC個のクラスタを整列して、その中のN個のクラスタを特定することは、具体的に、メンバーシップが最も高いN個のクラスタを選択してもよい。さらに、N個のクラスタの属性に応じて、階調画像の任意1つの画素点の属性を特定することは、当該N個のクラスタの属性を総合的に考慮して階調画像の任意1つの画素点の属性を判断することを意味している。例えば、ある画素点について、それに対応する当該N個のクラスタの属性が全部、前景である場合に限って、当該画素点を前景画素点として判断するが、さもなければ、当該画素点を背景画素点として判断する。さらに、例えば、ある画素点について、それに対応する当該N個のクラスタのうち、クラスタの属性が前景であるものが所定の割合を超えた場合、当該画素点を前景画素点として判断するが、さもなければ、当該画素点を背景画素点として判断する。
少なくとも1つの文字位置決めブロックの各々の前景画素面積を検出し、前景画素面積に基づき、少なくとも1つの文字位置決めブロックの中から干渉ブロックを検出するとともに、少なくとも1つの文字位置決めブロックから、干渉ブロックを除去するための第1の除去モジュールをさらに含んでもよく、ここで、当該干渉ブロックの前景画素面積は、少なくとも、少なくとも1つの文字位置決めブロックの中のM個の文字位置決めブロックの前景画素面積よりも小さく、ただし、Mが予め設定された文字の数である。具体的には、当該前景画素面積とは、文字位置決めブロックにおける前景画素点が占める面積を指す。選択的に、計算量をさらに省くために、各文字位置決めブロックに対して、水平投影を行うことで文字高さを取得するとともに、当該文字位置決めブロックの幅と当該文字高さとに基づいて当該前景画素面積を推算してもよい。さらに、当該予め設定された文字の数Mは、当該メーターのダイヤルに応じて予め確認されたものである。さらに、図10に示されるように、ノイズ点に起因した干渉ブロックには、通常、前景画素点が少ないので、前景画素面積に基づいて少なくとも1つの文字位置決めブロックに対して大きい順に整列するとともに、上位M個の文字位置決めブロックを選択して分割モジュール144に入力して、残りの文字位置決めブロックを干渉ブロックとして除去してもよい。
非最近傍抑制アルゴリズム(NonNearestSuppression、以下はNNSと略称)により、少なくとも1つの文字位置決めブロックから、干渉ブロックを除去するための第2の除去モジュールをさらに含んでもよい。具体的に、上述したように、NMSアルゴリズムにより、少なくとも1つの文字位置決めブロックから、干渉ブロックを除去することは、具体的に、上記二値画像における最も左側の前景画素点と最も右側の前景画素点を見出して、両者の位置情報及び両者間の幅に基づいて、各文字に対応する文字黄金センターを特定し、さらに、各文字の文字黄金センターとの距離が最も近い文字位置決めブロックを選択して分割モジュール144に入力するとともに、残りの文字位置決めブロックを干渉ブロックとして除去することを含んでもよい。
少なくとも1つの文字位置決めブロックの平均幅を特定し、前記少なくとも1つの文字位置決めブロックにおいて、幅が平均幅よりも小さい目標文字位置決めブロックがあれば、目標文字位置決めブロックの位置情報と平均幅とに基づき、文字領域画像に対して文字分割を行うためのものであってもよい。それにより、不完全な文字分割の発生を回避した。
メモリは、コンピュータ可読媒体における非永久的メモリ、ランダムアクセスメモリ(RAM)及び/又は不揮発性メモリなどの形式を有するものを含んでもよく、例えば、リードオンリーメモリ(ROM)又はフラッシュメモリ(flash RAM)が考えられる。メモリは、コンピュータ可読媒体の一例である。
Claims (34)
- 少なくとも1つの文字枠を含む文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するステップ、
エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換するステップ、
投影法により、前記エッジ二値画像から、文字枠分割ブロックを取得するステップ、および、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックから、目標文字領域を特定するとともに、前記目標文字領域に応じて、前記文字領域画像に対して文字分割を行うステップを含む、ことを特徴とする文字分割方法。 - エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換する前に、
前記階調画像をフィルタリング処理するステップをさらに含み、
前記フィルタリング処理は、メディアンフィルタリング処理及び/又はガウスフィルタリング処理である、ことを特徴とする請求項1に記載の文字分割方法。 - エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換する前記ステップは、
canny演算子を用いて、前記階調画像に対してエッジ検出を行うとともに、前記エッジ検出の結果から、前記階調画像を前記エッジ二値画像に変換するステップを含む、ことを特徴とする請求項1に記載の文字分割方法。 - canny演算子を用いて、前記階調画像に対してエッジ検出を行う前に、
前記階調画像の画質特徴を検出するステップ、および、
前記階調画像の画質特徴により、前記canny演算子のパラメータを適応的に調整するステップを含み、
前記画質特徴は、大局コントラスト、大局階調平均値のうちの1つまたは複数を含む、ことを特徴とする請求項3に記載の文字分割方法。 - 投影法により、前記エッジ二値画像から、文字枠分割ブロックを取得する前記ステップは、
垂直投影法により、前記エッジ二値画像に対して分割処理を行うことで、前記少なくとも1つの文字枠に対応する関係をもつ少なくとも1つの前記文字枠分割ブロックを取得するステップを含む、ことを特徴とする請求項1に記載の文字分割方法。 - 輪郭検出アルゴリズムにより、前記文字枠分割ブロックから、目標文字領域を特定する前記ステップは、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックにおける文字輪郭を特定するステップ、および、
前記文字枠分割ブロックにおける前記文字輪郭の最小外接矩形領域により、前記目標文字領域を特定するステップ、を含む、ことを特徴とする請求項1に記載の文字分割方法。 - 少なくとも1つの文字枠を含む文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するための取得モジュールと、
エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換するためのエッジ検出モジュールと、
投影法により、前記エッジ二値画像から、文字枠分割ブロックを取得するための投影モジュールと、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックから、目標文字領域を特定するとともに、前記目標文字領域に応じて、前記文字領域画像に対して文字分割を行うための輪郭検出モジュールと、を備えた、ことを特徴とする文字分割装置。 - エッジ検出アルゴリズムにより、前記階調画像をエッジ二値画像に変換する前に、前記階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに備え、
前記フィルタリング処理は、メディアンフィルタリング処理及び/又はガウスフィルタリング処理である、ことを特徴とする請求項7に記載の文字分割装置。 - 前記エッジ検出モジュールは、
canny演算子を用いて、前記階調画像に対してエッジ検出を行うとともに、前記エッジ検出の結果から、前記階調画像を前記エッジ二値画像に変換するためのものでもある、ことを特徴とする請求項7に記載の文字分割装置。 - 前記エッジ検出モジュールは、
前記階調画像の画質特徴を検出し、
前記階調画像の画質特徴により、前記canny演算子のパラメータを適応的に調整するためのものでもあり、
前記画質特徴は、大局コントラスト、大局階調平均値のうちの1つまたは複数を含む、ことを特徴とする請求項9に記載の文字分割装置。 - 前記投影モジュールは、
垂直投影法により、前記エッジ二値画像に対して分割処理を行うことで、前記少なくとも1つの文字枠に対応する関係をもつ少なくとも1つの前記文字枠分割ブロックを取得するためのものでもある、ことを特徴とする請求項7に記載の文字分割装置。 - 前記エッジ検出モジュールは、
輪郭検出アルゴリズムにより、前記文字枠分割ブロックにおける文字輪郭を特定し、
前記文字枠分割ブロックにおける前記文字輪郭の最小外接矩形領域により、前記目標文字領域を特定するためのものでもある、ことを特徴とする請求項7に記載の文字分割装置。 - 1つまたは複数のマルチコアプロセッサと、
1つまたは複数のプログラムを記憶するためのメモリと、を含み、
前記1つまたは複数のプログラムが前記1つまたは複数のマルチコアプロセッサによって実行されると、前記1つまたは複数のマルチコアプロセッサに請求項1~7のいずれか1項に記載の方法を実現させる、ことを特徴とする文字分割装置。 - プログラムが記憶されており、前記プログラムがマルチコアプロセッサによって実行されると、請求項1~7のいずれか1項に記載の方法を前記マルチコアプロセッサに実行させる、ことを特徴とするコンピュータ可読記憶媒体。
- 文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するステップ、
ファジィC-平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行って二値画像を取得するステップ、
投影法により、前記二値画像から、少なくとも1つの文字位置決めブロックを取得するステップ、および、
前記少なくとも1つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行うステップ、を含む、ことを特徴とする文字分割方法。 - ファジィC-平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行う前に、
canny演算子を用いて、前記階調画像に対してエッジ検出を行って、エッジ画像を取得するステップ、
ハフ変換方程式により、前記エッジ画像に対して直線検出を行って、前記エッジ画像の境界線を取得するステップ、および、
前記境界線から、前記階調画像の境界部分を除去するステップをさらに含む、ことを特徴とする請求項15に記載の文字分割方法。 - canny演算子を用いて、前記階調画像に対してエッジ検出を行う前に、
前記階調画像の画質特徴を検出するステップ、および、
前記階調画像の画質特徴により、前記canny演算子のパラメータを適応的に調整するステップをさらに含み、
前記画質特徴は、大局コントラスト及び/又は大局階調平均値を含む、ことを特徴とする請求項16に記載の文字分割方法。 - canny演算子を用いて、前記階調画像に対してエッジ検出を行う前に、
前記階調画像をフィルタリング処理するステップをさらに含み、
前記フィルタリング処理は、メディアンフィルタリング処理及び/又はガウスフィルタリング処理を含む、ことを特徴とする請求項16に記載の文字分割方法。 - ファジィC-平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行う前に、
前記階調画像に対して対数変換を行うステップをさらに含む、ことを特徴とする請求項15に記載の文字分割方法。 - ファジィC-平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行う前記ステップは、
前記ファジィC-平均クラスタリングアルゴリズムにより、前記階調画像をクラスタリングして、C個のクラスタを取得するステップ、
前記C個のクラスタのクラスタセンターから、前記C個のクラスタの属性をそれぞれ、特定するステップ、
前記階調画像の任意1つの画素点の、前記C個のクラスタの各々に対応するC個のメンバーシップを特定するステップ、
前記メンバーシップに応じて前記C個のクラスタを整列して、その中のN個のクラスタを特定するとともに、前記N個のクラスタの属性に応じて、前記階調画像の任意1つの画素点の属性を特定するステップ、および、
前記階調画像の任意1つの画素点の属性に応じて、前記階調画像に対して二値化処理を行うステップ、を含み、
ただし、前記C、前記Nが正の整数であり、且つ、前記Cが前記Nよりも大きい、ことを特徴とする請求項15に記載の文字分割方法。 - 投影法により、前記二値画像から、少なくとも1つの文字位置決めブロックを取得した後、
前記少なくとも1つの文字位置決めブロックの各々の前景画素面積を検出するステップ、および、
前記前景画素面積に基づき、前記少なくとも1つの文字位置決めブロックの中から干渉ブロックを検出するとともに、前記少なくとも1つの文字位置決めブロックから、前記干渉ブロックを除去するステップを含み、
前記干渉ブロックの前記前景画素面積は、少なくとも、前記少なくとも1つの文字位置決めブロックの中のM個の文字位置決めブロックの前記前景画素面積よりも小さく、ただし、前記Mが予め設定された文字の数である、ことを特徴とする請求項15に記載の文字分割方法。 - 垂直投影法により、前記二値画像から、少なくとも1つの文字位置決めブロックを取得した後、
非最近傍抑制アルゴリズムにより、前記少なくとも1つの文字位置決めブロックから、干渉ブロックを除去するステップを含む、ことを特徴とする請求項15に記載の文字分割方法。 - 前記少なくとも1つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行う前記ステップは、
前記少なくとも1つの文字位置決めブロックの平均幅を特定するステップ、および、
前記少なくとも1つの文字位置決めブロックにおいて、幅が前記平均幅よりも小さい目標文字位置決めブロックがあれば、前記目標文字位置決めブロックの位置情報と前記平均幅とに基づき、前記文字領域画像に対して文字分割を行うステップ、を含む、ことを特徴とする請求項21または22に記載の文字分割方法。 - 文字領域画像を取得するとともに、前記文字領域画像を階調画像に変換するための取得モジュールと、
ファジィC-平均クラスタリングアルゴリズムにより、前記階調画像に対してクラスタ分析を行うとともに、前記クラスタ分析の結果から、前記階調画像に対して二値化処理を行って二値画像を取得するためのクラスタリングモジュールと、
投影法により、前記二値画像から、少なくとも1つの文字位置決めブロックを取得するための位置決めモジュールと、
前記少なくとも1つの文字位置決めブロックの位置情報に基づき、前記文字領域画像に対して文字分割を行うための分割モジュールと、を備えた、ことを特徴とする文字分割装置。 - canny演算子を用いて、前記階調画像に対してエッジ検出を行って、エッジ画像を取得するためのエッジ検出モジュールと、
ハフ変換方程式により、前記エッジ画像に対して直線検出を行って、前記エッジ画像の境界線を取得するための直線検出モジュールと、
前記境界線から、前記階調画像の境界部分を除去するための境界除去モジュールと、をさらに備えた、ことを特徴とする請求項24に記載の文字分割装置。 - 前記エッジ検出モジュールは、
前記階調画像の画質特徴を検出するための画質検出モジュールと、
前記階調画像の画質特徴により、前記canny演算子のパラメータを適応的に調整するためのパラメータ調整モジュールと、をさらに備え、
前記画質特徴は、少なくとも、大局コントラスト及び/又は大局階調平均値を含む、ことを特徴とする請求項25に記載の文字分割装置。 - 前記階調画像をフィルタリング処理するためのフィルタリングモジュールをさらに備え、
前記フィルタリング処理は、メディアンフィルタリング処理及び/又はガウスフィルタリング処理を含む、ことを特徴とする請求項25に記載の文字分割装置。 - 前記階調画像に対して対数変換を行うための対数変換モジュールをさらに備えた、ことを特徴とする請求項24に記載の文字分割装置。
- 前記クラスタリングモジュールは、
前記ファジィC-平均クラスタリングアルゴリズムにより、前記階調画像をクラスタリングして、C個のクラスタを取得し、
前記C個のクラスタのクラスタセンターから、前記C個のクラスタの属性をそれぞれ、特定し、
前記階調画像の任意1つの画素点の、前記C個のクラスタの各々に対応するC個のメンバーシップを特定し、
前記メンバーシップに応じて前記C個のクラスタを整列して、その中のN個のクラスタを特定するとともに、前記N個のクラスタの属性に応じて、前記階調画像の任意1つの画素点の属性を特定し、
前記階調画像の任意1つの画素点の属性に応じて、前記階調画像に対して二値化処理を行うためのものでもあり、
ただし、前記C、前記Nが正の整数であり、且つ、前記Cが前記Nよりも大きい、ことを特徴とする請求項24に記載の文字分割装置。 - 前記少なくとも1つの文字位置決めブロックの各々の前景画素面積を検出し、
前記前景画素面積に基づき、前記少なくとも1つの文字位置決めブロックの中から干渉ブロックを検出するとともに、前記少なくとも1つの文字位置決めブロックから、前記干渉ブロックを除去するための第1の除去モジュールを備え、
前記干渉ブロックの前記前景画素面積は、少なくとも、前記少なくとも1つの文字位置決めブロックの中のM個の文字位置決めブロックの前記前景画素面積よりも小さく、ただし、前記Mが予め設定された文字の数である、ことを特徴とする請求項24に記載の文字分割装置。 - 非最近傍抑制アルゴリズムにより、前記少なくとも1つの文字位置決めブロックから、干渉ブロックを除去するための第2の除去モジュールを備えた、ことを特徴とする請求項24に記載の文字分割装置。
- 前記分割モジュールは、
前記少なくとも1つの文字位置決めブロックの平均幅を特定し、
前記少なくとも1つの文字位置決めブロックにおいて、幅が前記平均幅よりも小さい目標文字位置決めブロックがあれば、前記目標文字位置決めブロックの位置情報と前記平均幅とに基づき、前記文字領域画像に対して文字分割を行うためのものでもある、ことを特徴とする請求項24に記載の文字分割装置。 - 1つまたは複数のマルチコアプロセッサと、
1つまたは複数のプログラムを記憶するためのメモリと、を含み、
前記1つまたは複数のプログラムが前記1つまたは複数のマルチコアプロセッサによって実行されると、
前記1つまたは複数のマルチコアプロセッサに請求項15~23のいずれか1項に記載の方法を実現させる、ことを特徴とする文字分割装置。 - プログラムが記憶されており、
前記プログラムがマルチコアプロセッサによって実行されると、
請求項15~23のいずれか1項に記載の方法を前記マルチコアプロセッサに実行させる、ことを特徴とするコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024018589A JP2024050880A (ja) | 2019-12-05 | 2024-02-09 | 文字分割方法、装置、および、コンピュータ可読記憶媒体 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911233988.5A CN111046862B (zh) | 2019-12-05 | 2019-12-05 | 一种字符分割方法、装置以及计算机可读存储介质 |
CN201911233988.5 | 2019-12-05 | ||
CN201911234826.3 | 2019-12-05 | ||
CN201911234826.3A CN111027546B (zh) | 2019-12-05 | 2019-12-05 | 一种字符分割方法、装置以及计算机可读存储介质 |
PCT/CN2020/118675 WO2021109697A1 (zh) | 2019-12-05 | 2020-09-29 | 字符分割方法、装置以及计算机可读存储介质 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024018589A Division JP2024050880A (ja) | 2019-12-05 | 2024-02-09 | 文字分割方法、装置、および、コンピュータ可読記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023505663A true JP2023505663A (ja) | 2023-02-10 |
JP7508556B2 JP7508556B2 (ja) | 2024-07-01 |
Family
ID=76221415
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022533643A Active JP7508556B2 (ja) | 2019-12-05 | 2020-09-29 | 文字分割方法、装置、および、コンピュータ可読記憶媒体 |
JP2024018589A Pending JP2024050880A (ja) | 2019-12-05 | 2024-02-09 | 文字分割方法、装置、および、コンピュータ可読記憶媒体 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024018589A Pending JP2024050880A (ja) | 2019-12-05 | 2024-02-09 | 文字分割方法、装置、および、コンピュータ可読記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230009564A1 (ja) |
EP (1) | EP4071665A4 (ja) |
JP (2) | JP7508556B2 (ja) |
KR (1) | KR20220139292A (ja) |
WO (1) | WO2021109697A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984863B (zh) * | 2023-03-17 | 2023-05-26 | 中化现代农业有限公司 | 图像处理方法、装置、设备及存储介质 |
CN116128877B (zh) * | 2023-04-12 | 2023-06-30 | 山东鸿安食品科技有限公司 | 一种基于温度检测的排汽回收智能监测系统 |
CN116168027B (zh) * | 2023-04-24 | 2023-07-04 | 山东交通学院 | 基于视觉定位的木工机械智能切割方法 |
CN116777845B (zh) * | 2023-05-26 | 2024-02-13 | 浙江嘉宇工程管理有限公司 | 基于人工智能的建筑工地安全风险智能评估方法及系统 |
CN116681628B (zh) * | 2023-08-03 | 2023-10-24 | 湖南华菱电子商务有限公司 | 一种基于深度学习的营业执照数据处理方法及系统 |
CN116843687A (zh) * | 2023-09-01 | 2023-10-03 | 山东东方智光网络通信有限公司 | 一种通信光缆表面瑕疵检测方法及装置 |
CN117095423B (zh) * | 2023-10-20 | 2024-01-05 | 上海银行股份有限公司 | 一种银行单据字符的识别方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08264591A (ja) * | 1995-03-28 | 1996-10-11 | Oki Electric Ind Co Ltd | Tab接続方法 |
JPH1196292A (ja) * | 1997-09-22 | 1999-04-09 | Nec Corp | 光学式文字読取方法および装置 |
US20150039637A1 (en) * | 2013-07-31 | 2015-02-05 | The Nielsen Company (Us), Llc | Systems Apparatus and Methods for Determining Computer Apparatus Usage Via Processed Visual Indicia |
JP2017027201A (ja) * | 2015-07-17 | 2017-02-02 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
US20180012101A1 (en) * | 2016-07-08 | 2018-01-11 | Xerox Corporation | Shadow detection and removal in license plate images |
US20180068196A1 (en) * | 2016-09-05 | 2018-03-08 | Ingenico Group | Method for the recognition of raised characters, corresponding computer program and device |
JP2019057174A (ja) * | 2017-09-21 | 2019-04-11 | キヤノン株式会社 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7302098B2 (en) * | 2004-12-03 | 2007-11-27 | Motorola, Inc. | Character segmentation method and apparatus |
CN102426649B (zh) * | 2011-10-13 | 2013-08-21 | 石家庄开发区冀科双实科技有限公司 | 一种简单的高准确率的钢印数字自动识别方法 |
CN104156704A (zh) * | 2014-08-04 | 2014-11-19 | 胡艳艳 | 一种新的车牌识别方法及系统 |
CN105373794B (zh) * | 2015-12-14 | 2018-02-06 | 河北工业大学 | 一种车牌识别方法 |
CN105825212A (zh) * | 2016-02-18 | 2016-08-03 | 江西洪都航空工业集团有限责任公司 | 一种基于Hadoop的分布式车牌识别方法 |
CN109522889A (zh) * | 2018-09-03 | 2019-03-26 | 中国人民解放军国防科技大学 | 一种基于图像分析的水文尺水位识别估算方法 |
CN109543688A (zh) * | 2018-11-14 | 2019-03-29 | 北京邮电大学 | 一种新型的基于多层卷积神经网络的水表读数检测与识别的方法 |
CN109598271B (zh) * | 2018-12-10 | 2021-02-09 | 北京奇艺世纪科技有限公司 | 一种字符分割方法及装置 |
CN109726717B (zh) * | 2019-01-02 | 2022-03-01 | 西南石油大学 | 一种车辆综合信息检测系统 |
CN111027546B (zh) * | 2019-12-05 | 2024-03-26 | 嘉楠明芯(北京)科技有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
CN111046862B (zh) * | 2019-12-05 | 2023-10-27 | 嘉楠明芯(北京)科技有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
-
2020
- 2020-09-29 US US17/782,683 patent/US20230009564A1/en active Pending
- 2020-09-29 WO PCT/CN2020/118675 patent/WO2021109697A1/zh unknown
- 2020-09-29 KR KR1020227022859A patent/KR20220139292A/ko unknown
- 2020-09-29 JP JP2022533643A patent/JP7508556B2/ja active Active
- 2020-09-29 EP EP20895306.7A patent/EP4071665A4/en active Pending
-
2024
- 2024-02-09 JP JP2024018589A patent/JP2024050880A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08264591A (ja) * | 1995-03-28 | 1996-10-11 | Oki Electric Ind Co Ltd | Tab接続方法 |
JPH1196292A (ja) * | 1997-09-22 | 1999-04-09 | Nec Corp | 光学式文字読取方法および装置 |
US20150039637A1 (en) * | 2013-07-31 | 2015-02-05 | The Nielsen Company (Us), Llc | Systems Apparatus and Methods for Determining Computer Apparatus Usage Via Processed Visual Indicia |
JP2017027201A (ja) * | 2015-07-17 | 2017-02-02 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
US20180012101A1 (en) * | 2016-07-08 | 2018-01-11 | Xerox Corporation | Shadow detection and removal in license plate images |
US20180068196A1 (en) * | 2016-09-05 | 2018-03-08 | Ingenico Group | Method for the recognition of raised characters, corresponding computer program and device |
JP2019057174A (ja) * | 2017-09-21 | 2019-04-11 | キヤノン株式会社 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP4071665A1 (en) | 2022-10-12 |
JP7508556B2 (ja) | 2024-07-01 |
EP4071665A4 (en) | 2023-11-22 |
JP2024050880A (ja) | 2024-04-10 |
WO2021109697A1 (zh) | 2021-06-10 |
US20230009564A1 (en) | 2023-01-12 |
KR20220139292A (ko) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023505663A (ja) | 文字分割方法、装置、および、コンピュータ可読記憶媒体 | |
CN111027546B (zh) | 一种字符分割方法、装置以及计算机可读存储介质 | |
CN109636732B (zh) | 一种深度图像的空洞修复方法以及图像处理装置 | |
CN113781402B (zh) | 芯片表面划痕缺陷的检测方法、装置和计算机设备 | |
CN109507192B (zh) | 一种基于机器视觉的磁芯表面缺陷检测方法 | |
CN106934803B (zh) | 电子器件表面缺陷的检测方法及装置 | |
TWI655586B (zh) | 用於檢測預定區域中特定標識圖像的方法及裝置 | |
CN111046862B (zh) | 一种字符分割方法、装置以及计算机可读存储介质 | |
CN115222741A (zh) | 一种电缆表面缺陷检测方法 | |
CN106780486B (zh) | 一种钢板表面缺陷图像提取方法 | |
CN110415208B (zh) | 一种自适应目标检测方法及其装置、设备、存储介质 | |
CN113610774B (zh) | 一种玻璃划痕缺陷检测方法、系统、装置及存储介质 | |
Lo et al. | Joint trilateral filtering for depth map super-resolution | |
CN115082451B (zh) | 一种基于图像处理的不锈钢汤勺缺陷检测方法 | |
CN116542982B (zh) | 一种基于机器视觉的出发判断器缺陷检测方法及装置 | |
CN116503388B (zh) | 缺陷检测方法、装置及存储介质 | |
CN113610772B (zh) | 易拉罐瓶底喷码缺陷检测方法、系统、装置及存储介质 | |
CN112017109B (zh) | 一种在线铁谱视频图像气泡的消除方法 | |
CN115546232A (zh) | 一种肝脏超声图像工作区域提取方法、系统及电子设备 | |
AlAzawee et al. | Using morphological operations—Erosion based algorithm for edge detection | |
CN113538500B (zh) | 图像分割方法、装置、电子设备和存储介质 | |
CN112288780B (zh) | 多特征动态加权的目标跟踪算法 | |
CN115809999A (zh) | 器件上目标对象检测方法、装置、电子设备及存储介质 | |
CN112329572B (zh) | 一种基于边框和闪光点的快速静态活体检测方法及装置 | |
CN115830049A (zh) | 角点检测的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220603 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230627 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240213 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7508556 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |