JP2017138989A - 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 - Google Patents
画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2017138989A JP2017138989A JP2017018957A JP2017018957A JP2017138989A JP 2017138989 A JP2017138989 A JP 2017138989A JP 2017018957 A JP2017018957 A JP 2017018957A JP 2017018957 A JP2017018957 A JP 2017018957A JP 2017138989 A JP2017138989 A JP 2017138989A
- Authority
- JP
- Japan
- Prior art keywords
- text
- strong
- candidate
- weak
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000001514 detection method Methods 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/12—Bounding box
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
2.プリシジョン(precision):検出結果はノンテキスト(non-text)領域を含んでいてはならない。
3.ユニークネス(uniqueness):検出されたテキストは、一度だけ表示(mark)しなければならない。
4.コンパクトネス(compactness):検出された領域(バウンディングボックス)は、エキストラマージン(extra margin)を最小限に抑えるように、テキスト領域を含むべきである。
ここで、xとyは、シングルチャンネル(single channel)画像Iのピクセルのインデックスであり、tはテキスト候補領域を抽出するために使用されている閾値(threshold)であり、B(Rt)は、Rtの境界領域のピクセルの集合である。もちろん、逆の場合であって、入力画像から所定の領域に含まれるすべてのピクセルのフィーチャー値が前記所定の領域の外側の境界領域のフィーチャー値よりも小さいとき、前記所定の領域を1つのテキスト候補として検出したり、検出ようにサポートすることができる。
(数式2)
ここで、Rt−kはER木構造でRtの親ノードを指す。|R|はRのバウンディングボックス領域(テキスト候補が含まれる領域)を指す。
(数式3)
例えば、数式2でk=2に設定することができる。この場合、スタビリティは、特定のノードと特定のノードの祖父母ノードに対し考慮することができる。
110:通信部
120:プロセッサ
130:格納部
Claims (24)
- 画像に含まれるテキストを検出する方法であって、
(a)入力画像が取得されると、装置が、前記入力画像に含まれているピクセルのフィーチャー値を参照にして、前記入力画像の少なくとも1つのテキスト候補を検出したり、検出するようにサポートするステップ、
(b)前記装置が、前記検出されたテキスト候補が含まれる領域内で選択された少なくとも一つのピクセルのフィーチャー値またはこれを変換した値を参照して、(i)前記検出されたテキストの候補を第1閾値と比較して強いテキスト(strong text)または強くないテキスト(non-strong text)に分類したり、分類するようにサポートして、(ii)前記強くないテキスト(non-strong text)に分類されたテキスト候補を第2閾値と比較して、弱いテキスト(weak text)またはノンテキスト(non-text)に分類したり、分類するようにサポートしているステップ、及び
(c)前記装置が、前記強いテキスト(strong text)と前記弱いテキスト(weak text)の関連情報を参照して前記弱いテキスト(weak text)を前記強いテキスト(strong text)に分類したり、分類するようにサポートするかどうかを判断するステップを含み、
前記(c)ステップは、
前記装置が、前記強いテキスト(strong text)と前記弱いテキスト(weak text)の関連情報を参照して前記弱いテキスト(weak text)を前記強いテキスト(strong text)またはノンテキスト(non-text)に分類したり、分類するようにサポートすることを特徴とする、テキストを検出する方法。 - 前記検出されたテキストの候補が複数のとき、前記(a)ステップの後に、(a1)前記装置が、前記検出された複数のテキスト候補が含まれる領域が所定の割合以上重なり合うテキスト候補を含む少なくとも一つのテキスト候補セットを識別し、識別された各テキストの候補セットに対して所定の条件を満たしているテキストの候補を選択したり、選択するようにサポートするステップをさらに含み、
前記(b)ステップは、
前記所定の条件を満たしているテキスト候補が含まれている領域内で選択された少なくとも一つのピクセルのフィーチャー値またはこれを変換した値を参照して、(i)前記所定の条件を満たしているテキスト候補を前記第1閾値と比較して、前記強いテキスト(strong text)または前記強くないテキスト(non-strong text)に分類したり、分類するようにサポートして、(ii)前記強くないテキスト(non-strong text)に分類されたテキストの候補を前記第2しきい値と比較して、前記弱いテキスト(weak text)または前記ノンテキスト(non-text)に分類したり、分類するようにサポートすることを特徴とする、請求項1に記載のテキストを検出する方法。 - 前記(a)ステップで、
前記装置は、前記入力画像から所定の領域に含まれるすべてのピクセルのフィーチャー値が前記所定の領域の外側の境界領域のフィーチャー値よりも大きいまたは小さいとき、前記所定の領域を1つのテキスト候補として検出したり、検出するようにサポートしていることを特徴とする、請求項1に記載のテキストを検出する方法。 - 前記装置は、前記所定の領域のピクセル輝度レベルを変更しながら、前記少なくとも一つのテキスト候補を検出したり、検出するようにサポートして、
前記検出された少なくとも一つのテキスト候補から、(i)前記所定の領域のピクセル輝度レベルが相対的に大きい下位レベルのテキスト候補と(ii)前記下位レベルのテキスト候補の領域を含み、前記所定の領域のピクセル輝度レベルが比較的小さい上位レベルのテキスト候補のうち、前記所定の領域のピクセル輝度レベルが最大のテキスト候補を、それぞれ子ノードと親ノードに割り当て、木構造を構成したり、構成するようにサポートすることを特徴とする、請求項3に記載のテキストを検出する方法。 - 前記木構造から特定のノードに対して、前記特定のノードに対応するテキスト候補が含まれる領域と、前記特定のノードに対応するテキスト候補の領域を含み、前記所定の領域のピクセル輝度レベルが比較的小さい、祖先ノードに対応するテキスト候補が含まれる領域が所定割合以上に重なる場合が所定回数以上である場合、
前記装置は、自分の特定の祖先ノードに対しテキスト候補が含まれる領域の変化量が比較的最も小さなノードに対応するテキスト候補を選択したり、選択するようにサポートして、
前記(b)ステップは、
前記選択されたテキストの候補が含まれる領域内で選択された少なくとも一つのピクセルのフィーチャー値またはこれを変換した値を参照して、(i)前記所定の条件を満たしているテキストの候補を前記第1閾値と比較して、前記強いテキスト(strong text)または前記強くないテキスト(non-strong text)に分類したり、分類するようにサポートして、(ii)前記強くないテキスト(non-strong text)に分類されたテキスト候補を前記第2しきい値と比較して、前記弱いテキスト(weak text)または前記ノンテキスト(non-text)に分類したり、分類するようにサポートすることを特徴とする、請求項4に記載のテキストを検出する方法。 - (d)前記装置が、前記第1閾値と比較して分類された強いテキスト(strong text)及び前記弱いテキスト(weak text)から編入された強いテキスト(strong text)をグルーピングしたり、グルーピングするようサポートするステップをさらに含むことを特徴とする、請求項1に記載のテキストを検出する方法。
- 第1強いテキスト(strong text)及び第1弱いテキスト(weak text)から編入された第2強いテキスト(strong text)がグルーピングされて前記第2強いテキスト(strongtext)と第2弱いテキスト(weak text)の関連情報を参照して前記第2弱いテキスト(weak text)が第3強いテキスト(strong text)に分類されると、
前記装置は、前記第3強いテキスト(strong text)を前記第1強いテキスト(strong text)及び前記第2強いテキスト(strong text)と一緒にグルーピングしたり、グルーピングするようサポートすることを特徴とする、請求項6に記載のテキストを検出する方法。 - 前記(b)ステップは、
前記第1閾値と前記第2閾値の間に少なくとも一つの中間閾値があるとき、(i)前記強くないテキスト(non-strong text)に分類されたテキストの候補を、前記の中間閾値と比較して、前記強いテキスト(strong text)または次順位弱いテキスト(weak text)に分類したり、分類するようにサポートして、(ii)前記次順位弱いテキスト(weak text)を前記第2閾値と比較して、前記弱いテキスト(weak text)または前記non−textに分類したり、分類するようにサポートすることを特徴とする、請求項1に記載のテキストを検出する方法。 - 前記(b)ステップで、
前記装置は、前記検出されたテキスト候補が含まれる領域内で選択されたピクセルのフィーチャー値をMLBP(Mean Local Binary Pattern)で変換した値を参照して、前記(i)及び前記(ii)を実行したり、実行するようにサポートしていることを特徴とする、請求項1に記載のテキストを検出する方法。 - 前記(b)ステップで、
前記装置は、AdaBoostアルゴリズムでトレーニングされた分類機を用いて前記検出されたテキスト候補を分類したり、分類するようにサポートすることを特徴とする、請求項1に記載のテキストを検出する方法。 - 前記(c)ステップで、
前記の関連情報は、前記強いテキスト(strong text)と前記弱いテキスト(weak text)の位置情報、サイズ情報、カラー情報、ストローク幅情報の少なくとも一部を含むことを特徴とする、請求項1に記載のテキストを検出する方法。 - 前記検出されたテキスト候補が含まれる領域は、
エキストラ マージン(extra margin)を最小限に抑えながら前記検出されたテキストの候補を含むバウンディングボックスの領域であることを特徴とする、請求項1に記載のテキストを検出する方法。 - 画像に含まれるテキストを検出する装置において、
入力画像を取得する通信部、及び
前記入力画像が取得されると、(i)前記入力画像に含まれているピクセルのフィーチャー値を参照にして、前記入力画像の少なくとも1つのテキスト候補を検出したり、検出するようにサポートして、(ii)前記検出されたテキスト候補が含まれる領域内で選択された少なくとも一つのピクセルのフィーチャー値またはこれを変換した値を参照して、前記検出されたテキストの候補を第1閾値と比較して強いテキスト(strong text)または強くないテキスト(non-strong text)に分類したり、分類するようにサポートして、前記強くないテキスト(non-strong text)に分類されたテキスト候補を第2閾値と比較して弱いテキスト(weak text)またはノンテキスト(non-text)に分類したり、分類するようにサポートしており、(iii)前記強いテキスト(strong text)と前記弱いテキスト(weak text)の関連情報を参照して前記弱いテキスト(weak text)を前記強いテキスト(strong text)に分類したり、分類するようにサポートするかどうかを判断するプロセッサを含み、
前記(iii)で、
前記プロセッサは、前記強いテキスト(strong text)と前記弱いテキスト(weak text)の関連情報を参照して前記弱いテキスト(weak text)を前記強いテキスト(strong text)またはノンテキスト(non-text)に分類したり、分類するようにサポートしていることを特徴とする、テキストを検出する装置。 - 前記検出されたテキストの候補が複数のとき、前記(i)の後に、前記プロセッサが、前記検出された複数のテキスト候補が含まれる領域が所定割合以上に重なり合うテキスト候補を含む少なくとも一つのテキスト候補セットを識別し、識別された各テキストの候補セットに対して所定の条件を満たしているテキストの候補を選択したり、選択するようにサポートして、
前記所定の条件を満たしているテキスト候補が含まれる領域内で選択された少なくとも一つのピクセルのフィーチャー値またはこれを変換した値を参照して、(i)前記所定の条件を満たしているテキストの候補を前記第1閾値と比較して、前記強いテキスト(strong text)または前記強くないテキスト(non-strong text)に分類したり、分類するようにサポートして、(ii)前記強くないテキスト(non-strong text)に分類されたテキストの候補を前記第2閾値と比較して、前記弱いテキスト(weak text)または前記ノンテキスト(non-text)に分類したり、分類するようにサポートすることを特徴とする、請求項13に記載のテキストを検出する装置。 - 前記(i)で、
前記プロセッサは、前記入力画像から所定の領域に含まれるすべてのピクセルのフィーチャー値が前記所定の領域の外側の境界領域のフィーチャー値より大きいか小さいとき、前記所定の領域を1つのテキスト候補として検出したり、検出するようにサポートしていることを特徴とする、請求項13に記載のテキストを検出する装置。 - 前記プロセッサは、前記所定の領域のピクセル輝度レベルを変更しながら、前記少なくとも一つのテキスト候補を検出したり、検出するようにサポートして、
前記検出された少なくとも一つのテキスト候補から、(i)前記所定の領域のピクセル輝度レベルが相対的に大きい下位レベルのテキスト候補と(ii)前記下位レベルのテキスト候補の領域を含み、前記所定の領域のピクセル輝度レベルが比較的小さい上位レベルのテキスト候補のうち、前記所定の領域のピクセル輝度レベルが最大のテキスト候補を、それぞれ子ノードと親ノードに割り当て、木構造を構成したり、構成するようにサポートすることを特徴とする、請求項15に記載のテキストを検出する装置。 - 前記木構造から特定のノードに対して、前記特定のノードに対応するテキスト候補が含まれる領域と、前記特定のノードに対応するテキスト候補の領域を含み、前記所定の領域のピクセル輝度レベルが比較的小さい、祖先ノードに対応するテキスト候補が含まれる領域が所定割合以上に重なる場合が所定回数以上である場合、
前記プロセッサが、自分の特定の祖先ノードに対しテキスト候補が含まれる領域の変化量が比較的最も小さなノードに対応するテキスト候補を選択したり、選択するようにサポートして、
前記選択されたテキストの候補が含まれる領域内で選択された少なくとも一つのピクセルのフィーチャー値またはこれを変換した値を参照して、(i)前記所定の条件を満たすテキスト候補を前記第1閾値と比較して、前記強いテキスト(strong text)または前記強くないテキスト(non-strong text)に分類したり、分類するようにサポートして、(ii)前記強くないテキスト(non-strong text)に分類されたテキストの候補を前記第2閾値と比較して、前記弱いテキスト(weak text)または前記ノンテキスト(non-text)に分類したり、分類するようにサポートすることを特徴とする、請求項16に記載のテキストを検出する装置。 - 前記プロセッサが、前記(iii)の後に(iv)前記第1閾値と比較して分類された強いテキスト(strong text)及び前記弱いテキスト(weak text)から編入された強いテキスト(strong text)をグルーピングしたり、グルーピングするようにサポートしていることを特徴とする、請求項13に記載のテキストを検出する装置。
- 第1強いテキスト(strong text)及び第1弱いテキスト(weak text)から編入された第2強いテキスト(strong text)がグルーピングされて前記第2強いテキスト(strong text)と第2弱いテキスト(weak text)の関連情報を参照して前記第2弱いテキスト(weak text)が第3強いテキスト(strong text)に分類されると、
前記プロセッサは、前記第3強いテキスト(strong text)を前記第1強いテキスト(strong text)及び前記第2強いテキスト(strong text)と一緒にグルーピングしたり、グルーピングするようにサポートすることを特徴とする、請求項18に記載のテキストを検出する装置。 - 前記(ii)で、
前記第1閾値と前記第2閾値の間に少なくとも一つの中間閾値があるとき、(ii−1)前記強くないテキスト(non-strong text)に分類されたテキストの候補を、前記の中間閾値と比較して、前記強いテキスト(strong text)または次順位弱いテキスト(weak text)に分類したり、分類するようにサポートして、(ii−2)前記次順位弱いテキスト(weak text)を前記第2閾値と比較して、前記弱いテキスト(weak text)または前記ノンテキスト(non-text)に分類したり、分類するようにサポートすることを特徴とする、請求項13に記載のテキストを検出する装置。 - 前記(ii)で、
前記プロセッサは、前記検出されたテキスト候補が含まれる領域内で選択されたピクセルのフィーチャー値をMLBP(Mean Local Binary Pattern)に変換した値を参照にして、前記分類の作業を実行したり、実行するようにサポートしていることを特徴とする、請求項13に記載のテキストを検出する装置。 - 前記(ii)で、
前記プロセッサは、AdaBoostアルゴリズムでトレーニングされた分類機を用いて前記検出されたテキスト候補を分類したり、分類するようにサポートすることを特徴とする、請求項13に記載のテキストを検出する装置。 - 前記(iii)で、
前記の関連情報は、前記強いテキスト(strong text)と前記弱いテキスト(weak text)の位置情報、サイズ情報、カラー情報、ストローク幅情報の少なくとも一部を含むことを特徴とする、請求項13に記載のテキストを検出する装置。 - 前記検出されたテキスト候補が含まれる領域は、
エキストラ マージン(extra margin)を最小限に抑えながら前記検出されたテキストの候補を含むバウンディングボックスの領域であることを特徴とする、請求項13に記載のテキストを検出する装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/014,441 | 2016-02-03 | ||
US15/014,441 US9524430B1 (en) | 2016-02-03 | 2016-02-03 | Method for detecting texts included in an image and apparatus using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017138989A true JP2017138989A (ja) | 2017-08-10 |
JP6188976B2 JP6188976B2 (ja) | 2017-08-30 |
Family
ID=57538559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017018957A Active JP6188976B2 (ja) | 2016-02-03 | 2017-02-03 | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9524430B1 (ja) |
EP (1) | EP3203417B1 (ja) |
JP (1) | JP6188976B2 (ja) |
KR (1) | KR101782589B1 (ja) |
CN (1) | CN107038409B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9984305B2 (en) | 2016-04-19 | 2018-05-29 | Texas Instruments Incorporated | Efficient SIMD implementation of 3x3 non maxima suppression of sparse 2D image feature points |
US10496894B2 (en) | 2017-03-31 | 2019-12-03 | Tata Consultancy Services Limited | System and method for text localization in images |
CN107832202A (zh) * | 2017-11-06 | 2018-03-23 | 郑州云海信息技术有限公司 | 一种检测硬盘的方法、装置及计算机可读存储介质 |
WO2019095092A1 (en) * | 2017-11-14 | 2019-05-23 | Symbol Technologies, Llc | Methods and apparatus for detecting and recognizing graphical character representations in image data using symmetrically-located blank areas |
CN109460768B (zh) * | 2018-11-15 | 2021-09-21 | 东北大学 | 一种用于组织病理学显微图像的文本检测与去除方法 |
US10430691B1 (en) * | 2019-01-22 | 2019-10-01 | StradVision, Inc. | Learning method and learning device for object detector based on CNN, adaptable to customers' requirements such as key performance index, using target object merging network and target region estimating network, and testing method and testing device using the same to be used for multi-camera or surround view monitoring |
US10713948B1 (en) * | 2019-01-31 | 2020-07-14 | StradVision, Inc. | Method and device for alerting abnormal driver situation detected by using humans' status recognition via V2V connection |
CN110188622B (zh) * | 2019-05-09 | 2021-08-06 | 新华三信息安全技术有限公司 | 一种文字定位方法、装置及电子设备 |
WO2021070089A1 (en) * | 2019-10-11 | 2021-04-15 | Pepper Esports Inc. | Method and system for processing textual depictions in a computer game screenshot |
CN112418220A (zh) * | 2020-12-02 | 2021-02-26 | 浙江诺诺网络科技有限公司 | 一种单字检测方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000298725A (ja) * | 1999-04-15 | 2000-10-24 | Nec Corp | テキストデータ検出装置およびその方法 |
JP2001092921A (ja) * | 1999-09-17 | 2001-04-06 | Toshiba Corp | 文字行領域抽出方法と文字行領域検出に用いられる学習方法 |
JP2014530424A (ja) * | 2011-09-27 | 2014-11-17 | インテル・コーポレーション | Adaboost学習アルゴリズムを使用して顔特徴点の位置を検出するための方法、装置、およびコンピュータ可読記録媒体 |
JP2014229314A (ja) * | 2013-05-24 | 2014-12-08 | キヤノン株式会社 | テキスト検出の方法及び装置 |
JP2014228953A (ja) * | 2013-05-20 | 2014-12-08 | オムロン株式会社 | 画像処理装置および画像処理方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6778700B2 (en) * | 2001-03-14 | 2004-08-17 | Electronics For Imaging, Inc. | Method and apparatus for text detection |
US7236632B2 (en) * | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
WO2007028166A2 (en) * | 2005-09-02 | 2007-03-08 | Blindsight, Inc. | A system and method for detecting text in real-world color images |
KR100745753B1 (ko) * | 2005-11-21 | 2007-08-02 | 삼성전자주식회사 | 영상의 문자 영역 검출장치 및 방법 |
US8917935B2 (en) * | 2008-05-19 | 2014-12-23 | Microsoft Corporation | Detecting text using stroke width based text detection |
KR101645994B1 (ko) * | 2009-12-29 | 2016-08-05 | 삼성전자주식회사 | 문자 인식 영역 검출 장치 및 문자 인식 방법 |
US8867828B2 (en) * | 2011-03-04 | 2014-10-21 | Qualcomm Incorporated | Text region detection system and method |
CN104182722B (zh) * | 2013-05-24 | 2018-05-18 | 佳能株式会社 | 文本检测方法和装置以及文本信息提取方法和系统 |
CN103279753B (zh) * | 2013-06-09 | 2016-03-09 | 中国科学院自动化研究所 | 一种基于树结构指导的英文场景文本块识别方法 |
US20150039637A1 (en) * | 2013-07-31 | 2015-02-05 | The Nielsen Company (Us), Llc | Systems Apparatus and Methods for Determining Computer Apparatus Usage Via Processed Visual Indicia |
-
2016
- 2016-02-03 US US15/014,441 patent/US9524430B1/en active Active
-
2017
- 2017-02-03 KR KR1020170015453A patent/KR101782589B1/ko active IP Right Grant
- 2017-02-03 JP JP2017018957A patent/JP6188976B2/ja active Active
- 2017-02-03 EP EP17154710.2A patent/EP3203417B1/en active Active
- 2017-02-03 CN CN201710063689.6A patent/CN107038409B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000298725A (ja) * | 1999-04-15 | 2000-10-24 | Nec Corp | テキストデータ検出装置およびその方法 |
JP2001092921A (ja) * | 1999-09-17 | 2001-04-06 | Toshiba Corp | 文字行領域抽出方法と文字行領域検出に用いられる学習方法 |
JP2014530424A (ja) * | 2011-09-27 | 2014-11-17 | インテル・コーポレーション | Adaboost学習アルゴリズムを使用して顔特徴点の位置を検出するための方法、装置、およびコンピュータ可読記録媒体 |
JP2014228953A (ja) * | 2013-05-20 | 2014-12-08 | オムロン株式会社 | 画像処理装置および画像処理方法 |
JP2014229314A (ja) * | 2013-05-24 | 2014-12-08 | キヤノン株式会社 | テキスト検出の方法及び装置 |
Non-Patent Citations (1)
Title |
---|
宮本 一正、外4名: ""複数特徴量を用いた低品質定型文字の一認識手法"", 電子情報通信学会論文誌, vol. 82, no. 4, JPN6017010407, 25 April 1999 (1999-04-25), JP, pages 771 - 779, ISSN: 0003524447 * |
Also Published As
Publication number | Publication date |
---|---|
KR101782589B1 (ko) | 2017-09-27 |
EP3203417B1 (en) | 2023-09-27 |
KR20170092476A (ko) | 2017-08-11 |
EP3203417C0 (en) | 2023-09-27 |
CN107038409B (zh) | 2021-06-04 |
CN107038409A (zh) | 2017-08-11 |
EP3203417A2 (en) | 2017-08-09 |
JP6188976B2 (ja) | 2017-08-30 |
US9524430B1 (en) | 2016-12-20 |
EP3203417A3 (en) | 2017-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6188976B2 (ja) | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US9552536B2 (en) | Image processing device, information storage device, and image processing method | |
JP5570629B2 (ja) | 分類器の学習方法及び装置、並びに処理装置 | |
US8351691B2 (en) | Object extraction in colour compound documents | |
CN106687990B (zh) | 用于基于渐进式改良从视频序列选择帧的方法 | |
Du et al. | Online deformable object tracking based on structure-aware hyper-graph | |
JP5691953B2 (ja) | 文字を含む画像を処理する方法及び装置 | |
US20110295778A1 (en) | Information processing apparatus, information processing method, and program | |
JP4100885B2 (ja) | 帳票認識装置、方法、プログラムおよび記憶媒体 | |
JP2012073684A (ja) | 画像認識方法及び装置並びにプログラム | |
JP2020053073A (ja) | 学習方法、学習システム、および学習プログラム | |
US10614312B2 (en) | Method and apparatus for determining signature actor and identifying video based on probability of appearance of signature actor | |
KR20220149727A (ko) | 결함 검출 시스템 | |
Shivakumara et al. | Detection of curved text in video: Quad tree based method | |
Han et al. | Class-aware feature aggregation network for video object detection | |
US10296782B2 (en) | Processing device and method for face detection | |
CN107315984B (zh) | 一种行人检索的方法及装置 | |
JP2010102709A (ja) | 文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体 | |
JP2014197412A (ja) | 画像の類似検索システム及び方法 | |
CN104966109B (zh) | 医疗化验单图像分类方法及装置 | |
US9710703B1 (en) | Method and apparatus for detecting texts included in a specific image | |
Xu et al. | Robust seed localization and growing with deep convolutional features for scene text detection | |
CN111488400B (zh) | 数据分类方法、装置和计算机可读存储介质 | |
JP2011087144A (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
Guru et al. | An eigen value based approach for text detection in video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170801 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6188976 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S631 | Written request for registration of reclamation of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313631 |
|
S633 | Written request for registration of reclamation of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313633 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |