JP2014535101A - 画像中のテキストの検出を容易にする方法及び装置 - Google Patents
画像中のテキストの検出を容易にする方法及び装置 Download PDFInfo
- Publication number
- JP2014535101A JP2014535101A JP2014536303A JP2014536303A JP2014535101A JP 2014535101 A JP2014535101 A JP 2014535101A JP 2014536303 A JP2014536303 A JP 2014536303A JP 2014536303 A JP2014536303 A JP 2014536303A JP 2014535101 A JP2014535101 A JP 2014535101A
- Authority
- JP
- Japan
- Prior art keywords
- text
- image
- alpha
- distribution
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
Description
・ 線幅(Stroke width)は、通常、テキスト全体を通じて比較的一定である。
・ 文字の高さ(Character height)は、通常、テキスト全体を通じて比較的一定である。
・ 文字間隔(Character spacing)は、通常、テキスト全体を通じて比較的一定である。
・ あるテキスト高さについて、対応する線幅や文字間隔は当該高さに比例することは、可読性の観点から求められることである。例えば、線幅及び文字間隔は大きすぎても小さすぎてもならない。
・ テキストの下層には何らかの背景が存在することを考えれば、画像中でテキストを囲む境界領域(例えばボックス)は、明度(intensity)の点で二峰性(bimodal)を有しうる。
・ H : 文字の高さ(図4におけるノード408)
・ L=λH : 文字の一次元的な長さ。例えば、湾曲した文字の骨格の全長として定義されうる。
・ B=βH : 文字の幅(図4におけるノード416)
・ S=ψH : 文字の線幅(図4におけるノード412)
・ D=δH : 文字間隔(図4におけるノード414)
・ m : 単語又はテキスト片の文字数(図4におけるノード418)
μ=(間隔長/テキスト高)分布の平均値
σ=(間隔長/テキスト高)分布の標準偏差
γ=σ/μ
Claims (38)
- 仮定されたテキスト片を含む画像領域に関連するアルファ値を計算すること、ここで前記アルファ値は、前記仮定されたテキスト片についての曲線的な文字長分布と、文字幅分布と、文字間隔分布との関数として定義される、前記計算することと;
前記仮定されたテキスト片についての間隔長分布に少なくとも一部基づいて、ガンマ値を計算することと;
前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類することと;
を含む、方法。 - 前記仮定されたテキスト片についての前記曲線的な文字長分布、前記文字幅分布と、前記文字間隔分布のいずれかを直接計算せずに、前記アルファ値を計算することを含む、請求項1に記載の方法。
- 前記画像領域において前記仮定されたテキスト片が占める面積の、前記画像領域の全面積に対する比として定義される占有比と、前記仮定されたテキスト片の線幅とに基づいて、前記アルファ値を計算することを含む、請求項1又は2に記載の方法。
- 前記画像領域の全面積と、
前記仮定されたテキスト片における少なくとも一つの仮定された文字を通る、互いに実質的に平行な複数の線であって、線同士の間隔により特徴付けられる複数の線による交点の数と、
に少なくとも一部基づいて前記アルファ値を計算することを含む、請求項1又は2に記載の方法。 - 前記間隔長分布に少なくとも一部基づいて前記ガンマ値を計算することは、前記間隔長をテキスト高で割ったものの分布の平均と、前記間隔長をテキスト高で割ったものの分布の標準偏差との比に基づいて、前記ガンマ値を計算することを含む、請求項1から4のいずれかに記載の方法。
- 前記仮定されたテキスト片を横切る少なくとも一つの走査線を適用することと;
前記適用された少なくとも1つの走査線に少なくとも部分的に基づいて、前記仮定されたテキスト片の少なくとも1つの特性を決定することと;
を含み、ここで前記アルファ値及びガンマ値を計算することは、前記仮定されたテキスト片の前記決定された少なくとも一つの特性に基づいて、該アルファ値及びガンマ値を計算することを含む、請求項1から5のいずれかに記載の方法。 - 前記画像領域をバイナリ化することによりバイナリ画像を生成することと;
前記バイナリ画像に少なくとも一部基づいて、前記画像領域が二つの確率分布だけで記述可能であるかどうかを判断することと;
前記画像領域が二つの確率分布だけで記述可能であると判断された場合にのみ、前記バイナリ画像を用いて前記アルファ値及びガンマ値を計算することと;
前記画像領域が二つの確率分布だけでは記述可能ではないと判断された場合は、前記画像領域を、テキストを含まない領域であると分類することと;
を含む、請求項1から6のいずれかに記載の方法。 - 前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類することは:
前記計算したアルファ値及びガンマ値が、期待されるアルファ値及びガンマ値に関する定められた閾値関係を満たすかどうかを判断することと;
前記閾値関係を満たすと判断した場合は、前記画像領域を、テキストを含む領域であると分類することと;
前記閾値関係を満たさないと判断した場合は、前記画像領域を、テキストを含まない領域であると分類することと;
を含む、請求項を1から7のいずれかに記載の方法。 - 前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類することは:
ガウシアン分布関数を適用することと;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たす場合は、前記画像領域を、テキストを含む領域であると分類することと;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たさない場合は、前記画像領域を、テキストを含まない領域であると分類することと;
を含む、請求項1から8のいずれかに記載の方法。 - 請求項1から9のいずれかに記載の方法を装置に実行させるように構成された命令を含むコンピュータプログラム。
- 少なくとも一つのプロセッサと、コンピュータプログラムコードを格納する少なくとも一つのメモリとを備える装置であって、前記少なくとも一つのメモリおよび前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に少なくとも:
仮定されたテキスト片を含む画像領域に関連するアルファ値を計算すること、ここで前記アルファ値は、前記仮定されたテキスト片についての曲線的な文字長分布と、文字幅分布と、文字間隔分布との関数として定義される、前記計算することと;
前記仮定されたテキスト片についての間隔長分布に少なくとも一部基づいて、ガンマ値を計算することと;
前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類することと;
を実行させるように構成される、装置。 - 請求項11に記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に、
前記仮定されたテキスト片についての前記曲線的な文字長分布、前記文字幅分布と、前記文字間隔分布のいずれかを直接計算せずに、前記アルファ値を計算することを実行させるように構成される、装置。 - 請求項11又は12に記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に、
前記画像領域において前記仮定されたテキスト片が占める面積の、前記画像領域の全面積に対する比として定義される占有比と、前記仮定されたテキスト片の線幅とに基づいて、前記アルファ値を計算することを実行させるように構成される、装置。 - 請求項11又は12に記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に、
前記画像領域の全面積と、
前記仮定されたテキスト片における少なくとも一つの仮定された文字を通る、互いに実質的に平行な複数の線であって、線同士の間隔により特徴付けられる複数の線による交点の数と、
に少なくとも一部基づいて前記アルファ値を計算させるように構成される、装置。 - 請求項11から14のいずれかに記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に、
前記間隔長をテキスト高で割ったものの分布の平均と、前記間隔長をテキスト高で割ったものの分布の標準偏差との比を計算することにより、前記間隔長分布に少なくとも一部基づいて前記ガンマ値を計算させるように構成される、装置。 - 請求項11から15のいずれかに記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に、
前記仮定されたテキスト片を横切る少なくとも一つの走査線を適用することと;
前記適用された少なくとも1つの走査線に少なくとも部分的に基づいて、前記仮定されたテキスト片の少なくとも1つの特性を決定することと;
前記仮定されたテキスト片の前記決定された少なくとも一つの特性に基づいて、前記アルファ値及びガンマ値を計算することと;
を実行させるように構成される、装置。 - 請求項11から16のいずれかに記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に、
前記画像領域をバイナリ化することによりバイナリ画像を生成することと;
前記バイナリ画像に少なくとも一部基づいて、前記画像領域が二つの確率分布だけで記述可能であるかどうかを判断することと;
前記画像領域が二つの確率分布だけで記述可能であると判断された場合にのみ、前記バイナリ画像を用いて前記アルファ値及びガンマ値を計算することと;
前記画像領域が二つの確率分布だけでは記述可能ではないと判断された場合は、前記画像領域を、テキストを含まない領域であると分類することと;
を実行させるように構成される、装置。 - 請求項11から17のいずれかに記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に:
前記計算したアルファ値及びガンマ値が、期待されるアルファ値及びガンマ値に関する定められた閾値関係を満たすかどうかを判断することと;
前記閾値関係を満たすと判断した場合は、前記画像領域を、テキストを含む領域であると分類することと;
前記閾値関係を満たさないと判断した場合は、前記画像領域を、テキストを含まない領域であると分類することと;
に少なくとも一部依って、前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類するように構成される、装置。 - 請求項11から18のいずれかに記載の装置であって、前記少なくとも一つのメモリ及び前記格納されたコンピュータプログラムコードは、前記少なくとも一つのプロセッサと共に、前記装置に:
ガウシアン分布関数を適用することと;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たす場合は、前記画像領域を、テキストを含む領域であると分類することと;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たさない場合は、前記画像領域を、テキストを含まない領域であると分類することと;
に少なくとも一部依って、前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類させるように構成される、装置。 - 請求項11から19のいずれかに記載の装置であって、携帯型コンピューティングデバイスとして具現化され、ユーザインタフェース回路と、一つ又は複数のメモリに格納されたユーザインタフェースソフトウェアとを備え、前記ユーザインタフェース回路及び前記ユーザインタフェースソフトウェアは、
ディスプレイの使用を通じて前記携帯型コンピューティングデバイスの少なくともいずれかの機能のユーザ制御を容易にし、
前記携帯型コンピューティングデバイスの少なくともいずれかの機能のユーザ制御を容易にすべく、前記ディスプレイに、前記携帯型コンピューティングデバイスの幽斎インタフェースの少なくとも一部を表示させるように構成される、装置。 - コンピュータ可読命令を格納するコンピュータ読み取り可能な記憶媒体を含むコンピュータプログラム製品であって、前記コンピュータ可読命令は:
仮定されたテキスト片を含む画像領域に関連するアルファ値を計算するように構成されるプログラム命令であって、ここで前記アルファ値は、前記仮定されたテキスト片についての曲線的な文字長分布と、文字幅分布と、文字間隔分布との関数として定義される、前記プログラム命令と;
前記仮定されたテキスト片についての間隔長分布に少なくとも一部基づいて、ガンマ値を計算するように構成されるプログラム命令と;
前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類するように構成されるプログラム命令と;
を含む、コンピュータプログラム製品。 - 前記アルファ値を計算するように構成されるプログラム命令は、前記仮定されたテキスト片についての前記曲線的な文字長分布、前記文字幅分布と、前記文字間隔分布のいずれかを直接計算せずに、前記アルファ値を計算するように構成されるプログラム命令を備える、請求項21に記載のコンピュータプログラム製品。
- 前記アルファ値を計算するように構成されるプログラム命令は、前記画像領域において前記仮定されたテキスト片が占める面積の、前記画像領域の全面積に対する比として定義される占有比と、前記仮定されたテキスト片の線幅とに基づいて、前記アルファ値を計算するように構成されるプログラム命令を備える、請求項21または22に記載のコンピュータプログラム製品。
- 前記アルファ値を計算するように構成されるプログラム命令は、
前記画像領域の全面積と、
前記仮定されたテキスト片における少なくとも一つの仮定された文字を通る、互いに実質的に平行な複数の線であって、線同士の間隔により特徴付けられる複数の線による交点の数と、
に少なくとも一部基づいて前記アルファ値を計算ように構成されるプログラム命令を備える、請求項21または22に記載のコンピュータプログラム製品。 - 前記間隔長分布に少なくとも一部基づいて、ガンマ値を計算するように構成されるプログラム命令は、前記間隔長をテキスト高で割ったものの分布の平均と、前記間隔長をテキスト高で割ったものの分布の標準偏差との比を計算するように構成されるプログラム命令を備える、請求項21から24のいずれかに記載のコンピュータプログラム製品。
- 前記仮定されたテキスト片を横切る少なくとも一つの走査線を適用するように構成されるプログラム命令と;
前記適用された少なくとも1つの走査線に少なくとも部分的に基づいて、前記仮定されたテキスト片の少なくとも1つの特性を決定するように構成されるプログラム命令と;
を含み、ここで前記アルファ値及びガンマ値を計算するように構成されるプログラム命令は、前記仮定されたテキスト片の前記決定された少なくとも一つの特性に基づいて、該アルファ値及びガンマ値を計算するように構成されるプログラム命令を含む、請求項21から25のいずれかに記載のコンピュータプログラム製品。 - 前記画像領域をバイナリ化することによりバイナリ画像を生成するように構成されるプログラム命令と;
前記バイナリ画像に少なくとも一部基づいて、前記画像領域が二つの確率分布だけで記述可能であるかどうかを判断するように構成されるプログラム命令と;
前記画像領域が二つの確率分布だけで記述可能であると判断された場合にのみ、前記バイナリ画像を用いて前記アルファ値及びガンマ値を計算するように構成されるプログラム命令と;
前記画像領域が二つの確率分布だけでは記述可能ではないと判断された場合は、前記画像領域を、テキストを含まない領域であると分類するように構成されるプログラム命令と;
を更に備える、請求項21から26のいずれかに記載のコンピュータプログラム製品。 - 前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類するように構成されるプログラム命令は:
前記計算したアルファ値及びガンマ値が、期待されるアルファ値及びガンマ値に関する定められた閾値関係を満たすかどうかを判断するように構成されるプログラム命令と;
前記閾値関係を満たすと判断した場合は、前記画像領域を、テキストを含む領域であると分類するように構成されるプログラム命令と;
前記閾値関係を満たさないと判断した場合は、前記画像領域を、テキストを含まない領域であると分類するように構成されるプログラム命令と;
を備える、請求項21から27のいずれかに記載のコンピュータプログラム製品。 - 前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類するように構成されるプログラム命令は:
ガウシアン分布関数を適用するように構成されるプログラム命令と;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たす場合は、前記画像領域を、テキストを含む領域であると分類するように構成されるプログラム命令と;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たさない場合は、前記画像領域を、テキストを含まない領域であると分類するように構成されるプログラム命令と;
を備える、請求項21から28のいずれかに記載のコンピュータプログラム製品。 - 仮定されたテキスト片を含む画像領域に関連するアルファ値を計算すること、ここで前記アルファ値は、前記仮定されたテキスト片についての曲線的な文字長分布と、文字幅分布と、文字間隔分布との関数として定義される、前記計算する手段と;
前記仮定されたテキスト片についての間隔長分布に少なくとも一部基づいて、ガンマ値を計算する手段と;
前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類する手段と;
を備える、装置。 - 前記アルファ値を計算する手段は、前記仮定されたテキスト片についての前記曲線的な文字長分布、前記文字幅分布と、前記文字間隔分布のいずれかを直接計算せずに、前記アルファ値を計算する手段を備える、請求項30に記載の装置。
- 前記アルファ値を計算する手段は、前記画像領域において前記仮定されたテキスト片が占める面積の、前記画像領域の全面積に対する比として定義される占有比と、前記仮定されたテキスト片の線幅とに基づいて、前記アルファ値を計算する手段を備える、請求項30又は31に記載の装置。
- 前記アルファ値を計算する手段は、
前記画像領域の全面積と、
前記仮定されたテキスト片における少なくとも一つの仮定された文字を通る、互いに実質的に平行な複数の線であって、線同士の間隔により特徴付けられる複数の線による交点の数と、
に少なくとも一部基づいて前記アルファ値を計算する手段を備える、請求項30又は31に記載の装置。 - 前記間隔長分布に少なくとも一部基づいて前記ガンマ値を計算する手段は、前記間隔長をテキスト高で割ったものの分布の平均と、前記間隔長をテキスト高で割ったものの分布の標準偏差との比に基づいて、前記ガンマ値を計算する手段を備える、請求項30から33のいずれかに記載の装置。
- 前記仮定されたテキスト片を横切る少なくとも一つの走査線を適用する手段と;
前記適用された少なくとも1つの走査線に少なくとも部分的に基づいて、前記仮定されたテキスト片の少なくとも1つの特性を決定する手段と;
を備え、ここで前記アルファ値及びガンマ値を計算する手段は、前記仮定されたテキスト片の前記決定された少なくとも一つの特性に基づいて、該アルファ値及びガンマ値を計算する手段を備える、請求項30から34のいずれかに記載の装置。 - 前記画像領域をバイナリ化することによりバイナリ画像を生成する手段と;
前記バイナリ画像に少なくとも一部基づいて、前記画像領域が二つの確率分布だけで記述可能であるかどうかを判断する手段と;
前記画像領域が二つの確率分布だけで記述可能であると判断された場合にのみ、前記バイナリ画像を用いて前記アルファ値及びガンマ値を計算する手段と;
前記画像領域が二つの確率分布だけでは記述可能ではないと判断された場合は、前記画像領域を、テキストを含まない領域であると分類する手段と;
を備える、請求項30から35のいずれかに記載の装置。 - 前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類する手段は:
前記計算したアルファ値及びガンマ値が、期待されるアルファ値及びガンマ値に関する定められた閾値関係を満たすかどうかを判断する手段と;
前記閾値関係を満たすと判断した場合は、前記画像領域を、テキストを含む領域であると分類する手段と;
前記閾値関係を満たさないと判断した場合は、前記画像領域を、テキストを含まない領域であると分類する手段と;
を備える、請求項30から36のいずれかに記載の装置。 - 前記計算したアルファ値及びガンマ値に少なくとも一部基づいて、前記画像領域がテキストを含む領域であるか否かを分類する手段は:
ガウシアン分布関数を適用する手段と;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たす場合は、前記画像領域を、テキストを含む領域であると分類する手段と;
前記計算したアルファ値及びガンマ値が、前記分布関数についての閾値関係を満たさない場合は、前記画像領域を、テキストを含まない領域であると分類する手段と;
を備える、請求項30から37のいずれかに記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/300,972 | 2011-11-21 | ||
US13/300,972 US8494284B2 (en) | 2011-11-21 | 2011-11-21 | Methods and apparatuses for facilitating detection of text within an image |
PCT/FI2012/050961 WO2013076356A1 (en) | 2011-11-21 | 2012-10-08 | Methods and apparatuses for facilitating detection of text within an image |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014535101A true JP2014535101A (ja) | 2014-12-25 |
JP5832656B2 JP5832656B2 (ja) | 2015-12-16 |
Family
ID=48427028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014536303A Expired - Fee Related JP5832656B2 (ja) | 2011-11-21 | 2012-10-08 | 画像中のテキストの検出を容易にする方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8494284B2 (ja) |
EP (1) | EP2783326A4 (ja) |
JP (1) | JP5832656B2 (ja) |
KR (1) | KR101602591B1 (ja) |
CN (1) | CN103946865B (ja) |
WO (1) | WO2013076356A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440486A (zh) * | 2013-08-29 | 2013-12-11 | 方正国际软件有限公司 | 一种图像中标牌尺度的检测方法及系统 |
US9460357B2 (en) * | 2014-01-08 | 2016-10-04 | Qualcomm Incorporated | Processing text images with shadows |
US10372981B1 (en) | 2015-09-23 | 2019-08-06 | Evernote Corporation | Fast identification of text intensive pages from photographs |
CN107403179B (zh) * | 2016-05-20 | 2020-10-23 | 株式会社理光 | 一种物品包装信息的注册方法及装置 |
CN112789623A (zh) * | 2018-11-16 | 2021-05-11 | 北京比特大陆科技有限公司 | 文本检测方法、装置及存储介质 |
CN112380899A (zh) * | 2020-09-30 | 2021-02-19 | 深圳点猫科技有限公司 | 一种广告图像内的文本识别方法、装置及设备 |
CN112232345B (zh) * | 2020-10-10 | 2022-10-04 | 安徽淘云科技股份有限公司 | 配置信息确定和图像有效区域提取方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07271911A (ja) * | 1994-03-28 | 1995-10-20 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
US20090285482A1 (en) * | 2008-05-19 | 2009-11-19 | Microsoft Corporation | Detecting text using stroke width based text detection |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3361124B2 (ja) | 1991-07-30 | 2003-01-07 | ゼロックス・コーポレーション | テキストを含む2次元画像上での画像処理方法と画像処理装置 |
JPH05210759A (ja) * | 1992-01-30 | 1993-08-20 | Omron Corp | 文字認識装置 |
JP2005038137A (ja) * | 2003-07-18 | 2005-02-10 | Ricoh Co Ltd | 画像処理方法、プログラム及び記録媒体 |
JP4788106B2 (ja) * | 2004-04-12 | 2011-10-05 | 富士ゼロックス株式会社 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
JP5088329B2 (ja) * | 2007-02-13 | 2012-12-05 | 日本電気株式会社 | 細胞特徴量算出装置および細胞特徴量算出方法 |
JP5146190B2 (ja) * | 2008-08-11 | 2013-02-20 | オムロン株式会社 | 文字認識装置、文字認識プログラム、および文字認識方法 |
US8320674B2 (en) | 2008-09-03 | 2012-11-27 | Sony Corporation | Text localization for image and video OCR |
-
2011
- 2011-11-21 US US13/300,972 patent/US8494284B2/en active Active
-
2012
- 2012-10-08 WO PCT/FI2012/050961 patent/WO2013076356A1/en active Application Filing
- 2012-10-08 EP EP12851750.5A patent/EP2783326A4/en not_active Withdrawn
- 2012-10-08 JP JP2014536303A patent/JP5832656B2/ja not_active Expired - Fee Related
- 2012-10-08 CN CN201280057054.0A patent/CN103946865B/zh active Active
- 2012-10-08 KR KR1020147016841A patent/KR101602591B1/ko not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07271911A (ja) * | 1994-03-28 | 1995-10-20 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
US20090285482A1 (en) * | 2008-05-19 | 2009-11-19 | Microsoft Corporation | Detecting text using stroke width based text detection |
Also Published As
Publication number | Publication date |
---|---|
EP2783326A4 (en) | 2016-08-10 |
CN103946865B (zh) | 2017-03-29 |
JP5832656B2 (ja) | 2015-12-16 |
CN103946865A (zh) | 2014-07-23 |
WO2013076356A1 (en) | 2013-05-30 |
EP2783326A1 (en) | 2014-10-01 |
US8494284B2 (en) | 2013-07-23 |
KR20140091760A (ko) | 2014-07-22 |
KR101602591B1 (ko) | 2016-03-10 |
US20130129222A1 (en) | 2013-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5832656B2 (ja) | 画像中のテキストの検出を容易にする方法及び装置 | |
US20210264098A1 (en) | Live document detection in a captured video stream | |
JP6208383B2 (ja) | プレビューモードにおける画像キャプチャリングパラメータ調整 | |
WO2018010657A1 (zh) | 结构化文本检测方法和系统、计算设备 | |
CN108875540B (zh) | 图像处理方法、装置和系统及存储介质 | |
CN108229353B (zh) | 人体图像的分类方法和装置、电子设备、存储介质、程序 | |
US10062195B2 (en) | Method and device for processing a picture | |
CN107622504B (zh) | 用于处理图片的方法和装置 | |
CN108121982B (zh) | 面单图像的获取方法及装置 | |
CN109816694B (zh) | 目标跟踪方法、装置及电子设备 | |
EP2769335B1 (en) | Methods and apparatuses for gesture recognition | |
CN110619656B (zh) | 基于双目摄像头的人脸检测跟踪方法、装置及电子设备 | |
WO2017197593A1 (en) | Apparatus, method and computer program product for recovering editable slide | |
US10121088B2 (en) | System and method for straightening curved page content | |
CN110431563A (zh) | 图像校正的方法和装置 | |
CN114511041A (zh) | 模型训练方法、图像处理方法、装置、设备和存储介质 | |
WO2023147717A1 (zh) | 文字检测方法、装置、电子设备和存储介质 | |
CN112488095A (zh) | 印章图像识别方法、装置和电子设备 | |
US8824778B2 (en) | Systems and methods for depth map generation | |
CN111754414B (zh) | 一种图像处理方法、装置和用于图像处理的装置 | |
US11461924B1 (en) | Long distance QR code decoding | |
CN115330803B (zh) | 一种表面缺陷数据增强方法、装置、电子设备及存储介质 | |
US9836799B2 (en) | Service provision program | |
US10631050B2 (en) | Determining and correlating visual context on a user device with user behavior using digital content on the user device | |
CN108304840B (zh) | 一种图像数据处理方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151027 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5832656 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20151112 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |