JP6106808B2 - 文書内バーコード配置特定 - Google Patents
文書内バーコード配置特定 Download PDFInfo
- Publication number
- JP6106808B2 JP6106808B2 JP2016524197A JP2016524197A JP6106808B2 JP 6106808 B2 JP6106808 B2 JP 6106808B2 JP 2016524197 A JP2016524197 A JP 2016524197A JP 2016524197 A JP2016524197 A JP 2016524197A JP 6106808 B2 JP6106808 B2 JP 6106808B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- generating
- barcode
- document
- bounding box
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012360 testing method Methods 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 12
- 230000035515 penetration Effects 0.000 claims description 3
- 238000009795 derivation Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241001149900 Fusconaia subrotunda Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1439—Methods for optical code recognition including a method step for retrieval of the optical code
- G06K7/1443—Methods for optical code recognition including a method step for retrieval of the optical code locating of the code in an image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Toxicology (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Electromagnetism (AREA)
- Health & Medical Sciences (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Input (AREA)
- Image Processing (AREA)
Description
本願は、この参照を以てその全内容が本願に繰り入れられるところの、「文書内バーコード配置特定」(DETERMINING BARCODE LOCATIONS IN DOCUMENTS)と題する2013年6月28日付米国特許出願第61/840541号に基づく優先権主張を伴う。
本発明は文書内バーコード配置導出の分野、より具体的にはバーコードを検知しその配置を特定することで良質に文書内バーコード領域を画定する方法に関する。
文書の原ディジタル画像を準備するステップと、
プロセッサを用い、
原ディジタル画像から正規化画像を生成し、
正規化画像から勾配画像を生成し、
勾配画像から複数個の境界ボックスを生成し、
バーコードの存否に関し各境界ボックスをテストすることで境界ボックステスト結果を生成する、
ステップと、
文書内でのバーコード配置を境界ボックステスト結果から導出するステップと、
を有する。
gray=kred×red+kgreen×green+kblue×blue
である;式中、red、green及びblueはその文書内位置における色値、kred、kgreen及びkblueは荷重係数、grayは出力グレースケール値である。典型的な荷重係数値はkred=0.25、kgreen=0.5及びkblue=0.25である。荷重係数は、いわゆる当業者にとって周知な他の値にすることもできる。フルスケールヒストグラムストレッチング動作の初めには、グレースケール画像における最小及び最大のグレースケール値が探索される。更に、それら限界値を使用することで、標準範囲例えば0〜255に亘り拡がるようにグレースケール値域が拡張(ストレッチング)される。標準範囲が0〜255であるならこの動作は例えば
graystretched=255×((gray−graymin)/(graymax−graymin))
となる;式中、grayは入力グレースケール値、grayminは最小グレースケール値、graymaxは最大グレースケール値、graystretchedは出力フルレンジヒストグラムストレッチング済値である。他の実施形態にあっては、最小及び最大のグレースケール値を探索するのに代え、グレースケール画像のヒストグラムが算出される。使用する方法はいわゆる当業者にとり周知のヒストグラムペネトレーションであり、ヒストグラムエネルギの小部分に対応するグレースケール値にgrayminが、またヒストグラムエネルギの大部分に対応するグレースケール値にgraymaxが設定される。例えば、累積ヒストグラムエネルギの5%に対応するようgrayminが、また累積ヒストグラムエネルギの95%に対応するようgraymaxが設定されうる。graystretchedは、これらgraymin及びgraymaxに係るヒストグラムストレッチング済値を用い、前記同様に算出される。このとき、ヒストグラムペネトレーションが原因でgraystretchが標準範囲からはみ出すこととなりうるので、graystretchは、ストレッチング演算の後に
graystretched=[255×((gray−graymin)/(graymax−graymin))]255 0
の如く標準範囲へとクリッピング(端切り)される。
gradstretched=255×((grad−gradmin)/(gradmax−gradmin))
である;式中、gradは方向性勾配画像値、gradmin及びgradmaxは限界値、gradstretchedはストレッチング済画像値である。二値化ブロック260では、ストレッチング済画像250のヒストグラムを算出した上で、累積ヒストグラムエネルギの80%に対応するストレッチング済画像値に等しくなるよう二値化しきい値を決定する。この二値化しきい値はストレッチング済画像250に適用され、それにより二値画像270が生成される。そして、クローズブロック280では、3×3構造化要素を用い二値画像270に対しモルフォロジ的クローズ演算を実行することで、勾配画像120(図1)が生成される。
Claims (13)
- 文書内でのバーコード配置を導出する方法であって、
(a)文書の原ディジタル画像を準備するステップと、
(b)プロセッサを用いて行われる、
(i)原ディジタル画像から正規化画像を生成するステップであって、原ディジタル画像からグレースケール画像を生成するステップと、グレースケール画像からフルスケールヒストグラムストレッチング済画像を生成するステップとを含むステップと、
(ii)正規化画像から勾配画像を生成するステップと、
(iii)勾配画像から複数個の境界ボックスを生成するステップと、
(iv)バーコードの存否に関し各境界ボックスをテストすることで境界ボックステスト結果を生成するステップと、
(c)文書内でのバーコード配置を境界ボックステスト結果から導出するステップと、
を有する方法。 - 請求項1記載の方法であって、更に、ヒストグラムペネトレーションを用いフルスケールヒストグラムストレッチング済画像を生成するステップを有する方法。
- 請求項1記載の方法であって、前記勾配画像を生成するステップが、正規化画像からダウンサンプリング版画像、ダウンサンプリング版画像から方向性勾配画像を生成するステップを含む方法。
- 請求項3記載の方法であって、更に、方向性勾配画像を対象にヒストグラムストレッチング及びしきい値適用を用いて勾配画像を生成するステップを有する方法。
- 請求項1記載の方法であって、前記複数個の境界ボックスを生成するステップが、勾配画像内の各特徴の周りで最小境界ボックスを探索するステップを含む方法。
- 請求項1記載の方法であって、前記境界ボックステスト結果を生成するステップが、正規化画像内の各境界ボックス領域につき最小バーコード画素値及び最大バーコード画素値の存否に関しテストするステップを含む方法。
- 請求項1記載の方法であって、前記境界ボックステスト結果を生成するステップが、勾配画像内の各境界ボックス領域につきバーコード内黒色画素比を算出するステップと、それをバーコード内黒色画素比しきい値と比較するステップと、を含む方法。
- より良質な文書内バーコード領域を導出する方法であって、
(a)文書の原ディジタル画像を準備するステップと、
(b)プロセッサを用いて行われる、
(i)原ディジタル画像から正規化画像を生成するステップであって、原ディジタル画像からグレースケール画像を生成するステップと、グレースケール画像からフルスケールヒストグラムストレッチング済画像を生成するステップと、を含むステップと、
(ii)正規化画像から勾配画像を生成するステップと、
(iii)勾配画像から複数個の境界ボックスを生成するステップと、
(iv)バーコードの存否に関し各境界ボックスをテストすることで境界ボックステスト結果を生成するステップと、
(c)境界ボックステスト結果から文書内でのバーコード配置を導出するステップと、
(d)バーコード配置から文書内のバーコード領域を導出するステップと、
(e)バーコード領域から改善されたバーコード領域を生成するステップと、
を有する方法。 - 請求項8記載の方法であって、前記改善されたバーコード領域を生成するステップが、更に、バーコード領域を文書の残り部分とは別様に処理するステップを含む方法。
- 請求項9記載の方法であって、更に、文書が処理されているときにバーコード領域を処理しないステップを有する方法。
- 文書内でのバーコード配置を導出する方法であって、
(a)文書の原ディジタル画像を準備するステップと、
(b)プロセッサを用いて行われる、
(i)原ディジタル画像から正規化画像を生成するステップと、
(ii)正規化画像から勾配画像を生成するステップであって、正規化画像からダウンサンプリング版画像、ダウンサンプリング版画像から方向性勾配画像を生成するステップを含むステップと、
(iii)勾配画像から複数個の境界ボックスを生成するステップと、
(iv)バーコードの存否に関し各境界ボックスをテストすることで境界ボックステスト結果を生成するステップと、
(c)文書内でのバーコード配置を境界ボックステスト結果から導出するステップと、
を有する方法。 - 文書内でのバーコード配置を導出する方法であって、
(a)文書の原ディジタル画像を準備するステップと、
(b)プロセッサを用いて行われる、
(i)原ディジタル画像から正規化画像を生成するステップと、
(ii)正規化画像から勾配画像を生成するステップと、
(iii)勾配画像から複数個の境界ボックスを生成するステップと、
(iv)バーコードの存否に関し各境界ボックスをテストすることで境界ボックステスト結果を生成するステップであって、正規化画像内の各境界ボックス領域につき最小バーコード画素値及び最大バーコード画素値の存否に関しテストするステップを含むステップと、
(c)文書内でのバーコード配置を境界ボックステスト結果から導出するステップと、
を有する方法。 - 文書内でのバーコード配置を導出する方法であって、
(a)文書の原ディジタル画像を準備するステップと、
(b)プロセッサを用いて行われる、
(i)原ディジタル画像から正規化画像を生成するステップと、
(ii)正規化画像から勾配画像を生成するステップと、
(iii)勾配画像から複数個の境界ボックスを生成するステップと、
(iv)バーコードの存否に関し各境界ボックスをテストすることで境界ボックステスト結果を生成するステップであって、勾配画像内の各境界ボックス領域につきバーコード内黒色画素比を算出するステップと、それをバーコード内黒色画素比しきい値と比較するステップとを含むステップと、
(c)文書内でのバーコード配置を境界ボックステスト結果から導出するステップと、
を有する方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361840541P | 2013-06-28 | 2013-06-28 | |
US61/840,541 | 2013-06-28 | ||
PCT/US2014/044353 WO2014210317A1 (en) | 2013-06-28 | 2014-06-26 | Determining barcode locations in documents |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016529598A JP2016529598A (ja) | 2016-09-23 |
JP2016529598A5 JP2016529598A5 (ja) | 2017-02-16 |
JP6106808B2 true JP6106808B2 (ja) | 2017-04-05 |
Family
ID=51225037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016524197A Active JP6106808B2 (ja) | 2013-06-28 | 2014-06-26 | 文書内バーコード配置特定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9378405B2 (ja) |
EP (1) | EP3014528B1 (ja) |
JP (1) | JP6106808B2 (ja) |
CN (1) | CN105359165B (ja) |
WO (1) | WO2014210317A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874818B (zh) * | 2016-08-30 | 2019-11-22 | 阿里巴巴集团控股有限公司 | 一种数字对象唯一标识符doi识别方法与装置 |
US10078790B2 (en) * | 2017-02-16 | 2018-09-18 | Honda Motor Co., Ltd. | Systems for generating parking maps and methods thereof |
CN111339797B (zh) * | 2020-02-25 | 2023-05-02 | 福州符号信息科技有限公司 | 一种能够准确识别受损一维条码的解码方法及终端 |
CN113034485A (zh) * | 2021-04-09 | 2021-06-25 | 浙江欧视电科技有限公司 | 融合Hough变换和卡尺聚类的圆检测方法 |
US11928550B2 (en) * | 2022-01-28 | 2024-03-12 | Zebra Technologies Corporation | Methods and apparatus to locate and decode an arranged plurality of barcodes in an image |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4988852A (en) | 1988-07-05 | 1991-01-29 | Teknekron Transportation Systems, Inc. | Bar code reader |
US4948955A (en) * | 1988-12-22 | 1990-08-14 | The Boeing Company | Barcode location determination |
US5487115A (en) * | 1992-05-14 | 1996-01-23 | United Parcel Service | Method and apparatus for determining the fine angular orientation of bar code symbols in two-dimensional CCD images |
US5438636A (en) * | 1992-05-14 | 1995-08-01 | United Parcel Service Of America, Inc. | Apparatus for simultaneously convolving multiple digital binary images using a single convolver with a binary mask to determine pixel densities |
US5384451A (en) * | 1993-01-29 | 1995-01-24 | United Parcel Service Of America, Inc. | Method and apparatus for decoding bar code symbols using composite signals |
US5304787A (en) | 1993-06-01 | 1994-04-19 | Metamedia Corporation | Locating 2-D bar codes |
US5974200A (en) | 1997-03-20 | 1999-10-26 | Matsushita Electric Industrial Company, Ltd. | Method of locating a machine readable two dimensional barcode within an image |
US6082619A (en) * | 1998-12-16 | 2000-07-04 | Matsushita Electric Industrial Co., Ltd. | Method for locating and reading a two-dimensional barcode |
JP4180497B2 (ja) * | 2003-12-05 | 2008-11-12 | 富士通株式会社 | コード種類判別方法、およびコード境界検出方法 |
US7506817B2 (en) * | 2004-12-14 | 2009-03-24 | Ricoh Co., Ltd. | Location of machine readable codes in compressed representations |
WO2008020899A2 (en) * | 2006-04-17 | 2008-02-21 | Cdm Optics, Inc. | Arrayed imaging systems and associated methods |
EP2093697B1 (en) * | 2008-02-25 | 2017-08-23 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for retrieving information comprised in a barcode |
-
2014
- 2014-06-26 CN CN201480036526.3A patent/CN105359165B/zh active Active
- 2014-06-26 US US14/316,323 patent/US9378405B2/en active Active
- 2014-06-26 WO PCT/US2014/044353 patent/WO2014210317A1/en active Application Filing
- 2014-06-26 JP JP2016524197A patent/JP6106808B2/ja active Active
- 2014-06-26 EP EP14742648.0A patent/EP3014528B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN105359165B (zh) | 2018-01-26 |
US9378405B2 (en) | 2016-06-28 |
EP3014528A1 (en) | 2016-05-04 |
JP2016529598A (ja) | 2016-09-23 |
US20150001303A1 (en) | 2015-01-01 |
CN105359165A (zh) | 2016-02-24 |
EP3014528B1 (en) | 2018-10-03 |
WO2014210317A1 (en) | 2014-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9355312B2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
JP6106808B2 (ja) | 文書内バーコード配置特定 | |
US9965695B1 (en) | Document image binarization method based on content type separation | |
US10748023B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
US10176395B2 (en) | Automatic correction of skewing of digital images | |
JP2014057306A (ja) | 画像位相一致を用いた文書画像の二値化及び分割 | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
US9245198B2 (en) | Object recognition by comparison of patterns against map of image | |
US8442327B2 (en) | Application of classifiers to sub-sampled integral images for detecting faces in images | |
US9251430B2 (en) | Apparatus, method, and program for character recognition using minimum intensity curve of image data | |
KR20140031742A (ko) | 이미지 특징 추출 장치 및 이미지 특징 추출 방법, 그를 이용한 영상 처리 시스템 | |
CN108960247B (zh) | 图像显著性检测方法、装置以及电子设备 | |
US9167129B1 (en) | Method and apparatus for segmenting image into halftone and non-halftone regions | |
US9922263B2 (en) | System and method for detection and segmentation of touching characters for OCR | |
Khalid et al. | Image de-fencing using histograms of oriented gradients | |
JP2010271792A (ja) | 画像処理装置及び画像処理方法 | |
US10360471B2 (en) | Image retrieving device, image retrieving method, and recording medium | |
EP2951781A1 (en) | Systems and methods for processing an image | |
JP2017041113A (ja) | 画像処理装置、画像処理システム、画像処理方法及びプログラム | |
CN114202665A (zh) | 一种图像相似度确定方法及装置、设备、存储介质 | |
JP7147828B2 (ja) | 画像処理システム、画像処理方法及びプログラム | |
AU2014277851A1 (en) | Detecting a gap between text columns from text line fragments | |
JP6226206B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
JP2018074368A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP6194677B2 (ja) | 画像処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170113 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170113 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20170201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170306 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6106808 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |