JP4753072B2 - 映像内の複数広告看板の認識方法 - Google Patents
映像内の複数広告看板の認識方法 Download PDFInfo
- Publication number
- JP4753072B2 JP4753072B2 JP2005329462A JP2005329462A JP4753072B2 JP 4753072 B2 JP4753072 B2 JP 4753072B2 JP 2005329462 A JP2005329462 A JP 2005329462A JP 2005329462 A JP2005329462 A JP 2005329462A JP 4753072 B2 JP4753072 B2 JP 4753072B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- recognizing
- advertising
- corresponding points
- projective transformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000009466 transformation Effects 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 42
- 230000008859 change Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- DQJCHOQLCLEDLL-UHFFFAOYSA-N tricyclazole Chemical compound CC1=CC=CC2=C1N1C=NN=C1S2 DQJCHOQLCLEDLL-UHFFFAOYSA-N 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Description
(非特許文献5,9,10,11参照)、エッジ抽出に基づく方法 (非特許文献11,12参照)等がある。また、記述子には、輝度の微分量 (非特許文献2,8参照)、局所領域形状を正規化した画像パッチ(非特許文献5参照)、モーメント特徴
(非特許文献9,10,11参照)、輝度勾配の方向ヒストグラム (非特許文献3,5,6,7,12参照)等が用いられる。これらの局所特徴量は、画像の幾何学的な相似変換もしくはアフィン変換、および輝度のアフィン変換に対して不変である。
〔1〕映像内の複数広告看板の認識方法において、映像のシーン画像と広告看板のモデル画像間の、(a)局所不変特徴量を用いた仮対応付けを行うステップと、(b)射影変換による仮位置合せを行うステップと、(c)探索領域を制約した対応付けを行うステップと、(d)最終的な位置合せと検証を行うステップとを有し、これらのステップを終了条件が満たされるまで逐次的に繰り返す処理を、複数の対応点数の仮説に対し行うことを特徴とする。
fm i ={pm i ,σm i ,dm
i },i=1,…,Nm
と表す。
i は記述子、Nm i は特徴量の個数である。同様に、シーン画像の局所不変特徴量を
fs j ={ps j ,σs j ,ds
j },j=1,…,Ns
とする。特徴量間の距離として、記述子間のユークリッド距離
dij=‖dm i −ds j ‖
を用いる。
最近傍法では、特徴量fm i に対し、j1NN =arg minj dijのインデックスを持つ特徴量fs
j1NNを対応付ける。しかし、図9に示すように、最近傍法では多くの誤対応が生じる。この誤対応を減少させるため、次式を満たす対応点のみを使用する(非特許文献7参照)。
ここで、j2NN =arg secondminj dij、つまり、2番目に近い特徴量のインデックスであり、tはしきい値である。上記式(1)は、最近傍の距離dij1NN
が、2番目に近い特徴量の距離dij2NN よりtで規定されるだけ離れていることを条件としている。
に達するまで、次式に従ってtを増加させた。
α=1.01,t(0)=0.80,k=0,1,2,…
ここで、kは繰り返し回数、αはtの増加を制御する係数である。Pmin をいくつにすれば最低限必要なinlierを確保できるかは、シーンによって異なる。そのため、いくつかのPmin
を用いて認識を行う。その詳細は、〔6〕項で述べる。
〔2〕射影変換による仮位置合せ
対応点をC={pm k , ps k },k=1,…,Pと表す。この対応点を関係付ける射影変換をH(3×3行列)とし、変換誤差を次式で定義する。
Hは、以下に示すRANSAC(非特許文献13参照)で計算できる。
(i)集合Cから、4つの対応点からなるサンプルをランダムに取り出す。
(ii)Direct Linear Transformation(DLT)アルゴリズム(非特許文献14参照)と上記式(3)の変換誤差の和を評価関数とする非線形最適化により、サンプルからHを求める。
(iii )全対応点に対して上記式(3)の変換誤差を計算し、次式を満たすinlierの数(投票数)Ni を求める。
ここで、εはしきい値である。
(iv)(i)〜(iii )の処理を繰り返し、最大の投票数をもつinlierを得る。
(v)上記(iv)で得られたinlierよりHを計算する。
(ii′)Hでモデル画像を変換した結果が、ねじれ四角形、もしくは、反転した四角形の場合には、上記(i)に戻る。そうでない場合は、(iii )に進む。
〔3〕探索領域を制約した対応付け
図3(b)に示すような仮位置合せの結果を用い、背景や他の広告看板の影響を排除した状態で、1つの認識対象の周辺のみから対応点を得ることができる。仮位置合せで得られた射影変換Hを用い、次の予測位置を求める。
,amax とし、それぞれに対応する半径をrmin ,rmax としている。
=80〔pixel〕(画像サイズは720×480〔pixel〕)として得た対応点を示す。図3(b)でa=1.65であったため、r=33〔pixel〕となった。この半径を使用した探索領域の制約により、背景や他の広告看板の影響が排除され、1つの認識対象のみから対応点が得られている。
〔4〕最終的な位置合せと検証
探索領域を制約した対応付けにより得られる対応点を用い、前述の〔2〕項と同様にして射影変換Hを求める。上記式(4)のしきい値εは、図5に示す関数により決定する。つまり、シーン画像内の認識対象が大きいほど、前記式(3)の変換誤差を許容する。得られた射影変換によってモデル画像を変換し、最終的な位置合せ結果を得る。
,l=1,…,Ni を求める(正規化相関は輝度のアフィン変換に対し不変であるので、処理全体において輝度不変性は保たれる)。そして、その平均値が次式を満たす場合に、最終的な位置合せは正しいと判断する。
=12〔pixel〕,γ=1.0(正規化相関はR,G,Bの各チャンネルで計算したため、〔0,3〕の値を持つ)として得た位置合せ結果を示す。より多くのinlierから射影変換が計算され、認識対象の位置が正しく得られている。上記式(6)のNCCl
の平均値は、2.32であった。
〔5〕アルゴリズムの終了条件
最終的な位置合せが正しいと判断された場合、認識済みの広告看板がある領域内〔図3(d)では、認識結果を表す四角形内〕に位置する局所不変特徴量を取り除く。他の認識対象を認識するため、残った特徴量に対し〔1〕項から〔4〕項の処理を行う。これを以下の終了条件が満たされるまで繰り返す。(a)対応付けにおいて、Pmin
個以上の対応点が得られない。(b)射影変換の計算において、4点以上のinlierが得られない。(c)上記式(6)の条件が満たされない。それぞれの条件は、局所的な類似性がない場合、大局的な拘束を満たさない場合、位置合せ結果が誤っている場合、に対応する。
〔6〕対応点数に対する複数仮説
対応点数をPmin 個確保するため、上記式(1)のしきい値tを上記式(2)により変化させる。Pmin をいくつにすれば4点以上のinlierが確保できるかはシーンに依存し、事前に予測できない。そのため、Pmin
=20,60,120の3つの場合に対し認識を行う。3つの認識結果を得た後、認識された広告看板の数が最も多い結果を選択する。広告看板の数が同じ場合には、上記式(3)の変換誤差の平均が最も小さい結果を選択する。このように、対応点数に対する複数の仮説を使用することにより、同一認識対象の数や隠れの度合いが異なる種々のシーンに対応できる。
Claims (5)
- 映像内の複数広告看板の認識方法において、映像のシーン画像と広告看板のモデル画像間の、
(a)局所不変特徴量を用いた仮対応付けを行うステップと、
(b)射影変換による仮位置合せを行うステップと、
(c)探索領域を制約した対応付けを行うステップと、
(d)前記(c)ステップで得られた対応点から射影変換を計算し、最終的な位置合せ結果を得て、かつ、その結果をモデル画像とシーン画像間の局所的な相関を用いて検証するステップとを有し、
これらのステップを必要な対応点数が得られない、射影変換が計算できない、最終的な位置合わせが正しくない、のうちいずれか一つの終了条件が満たされるまで逐次的に繰り返す処理を、対応点の数の仮説を複数設定してそれぞれに対して行い、その結果のうち認識された広告看板の数が最も多い結果を最終的な認識結果として選択することを特徴とする映像内の複数広告看板の認識方法。 - 請求項1記載の映像内の複数広告看板の認識方法において、前記(a)ステップでは、局所不変特徴量を用いて前記映像のシーン画像と前記広告看板のモデル間の対応点を得ると共に、設定された局所領域内の特徴量を表す記述子間の距離の比に基づく誤対応の除去を行う際、距離の比のしきい値をある特定の数の対応点が得られるまで段階的に大きくすることを特徴とする映像内の複数広告看板の認識方法。
- 請求項1記載の映像内の複数広告看板の認識方法において、前記(b)ステップでは、射影変換によるモデル画像の変形を評価し、視点位置や認識対象の姿勢の変化では生じ得ない変形を投票より除去する機構を組み込んだRANSACにより射影変換を計算し、1つの認識対象のシーン画像内での大まかな位置を得ることを特徴とする映像内の複数広告看板の認識方法。
- 請求項1記載の映像内の複数広告看板の認識方法において、前記(c)ステップでは、前記(b)の仮位置合せの結果に基づき適応的に大きさが変化する探索領域を設定し、その探索領域内での対応付けにより1つの認識対象のみから前記対応点を得ることを特徴とする映像内の複数広告看板の認識方法。
- 請求項1記載の映像内の複数広告看板の認識方法において、前記(b)ステップでは、さらに、前記射影変換による変換誤差を計算し、
認識された広告看板の数が同じ結果が複数存在する場合は、変換誤差の平均が最も小さい結果を最終的な認識結果として選択することを特徴とする映像内の複数広告看板の認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005329462A JP4753072B2 (ja) | 2005-11-14 | 2005-11-14 | 映像内の複数広告看板の認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005329462A JP4753072B2 (ja) | 2005-11-14 | 2005-11-14 | 映像内の複数広告看板の認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007140613A JP2007140613A (ja) | 2007-06-07 |
JP4753072B2 true JP4753072B2 (ja) | 2011-08-17 |
Family
ID=38203432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005329462A Expired - Fee Related JP4753072B2 (ja) | 2005-11-14 | 2005-11-14 | 映像内の複数広告看板の認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4753072B2 (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10192279B1 (en) | 2007-07-11 | 2019-01-29 | Ricoh Co., Ltd. | Indexed document modification sharing with mixed media reality |
US8838591B2 (en) | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8335789B2 (en) | 2004-10-01 | 2012-12-18 | Ricoh Co., Ltd. | Method and system for document fingerprint matching in a mixed media environment |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US8825682B2 (en) | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8144921B2 (en) * | 2007-07-11 | 2012-03-27 | Ricoh Co., Ltd. | Information retrieval using invisible junctions and geometric constraints |
US8521737B2 (en) | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US8369655B2 (en) | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8332401B2 (en) | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
US8856108B2 (en) | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US8510283B2 (en) | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US8600989B2 (en) | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US8385589B2 (en) | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US8676810B2 (en) | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
JP5365969B2 (ja) * | 2007-11-13 | 2013-12-11 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP2012501011A (ja) * | 2008-08-22 | 2012-01-12 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | 画像解析方法及びシステム |
US8385660B2 (en) | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
JP5604923B2 (ja) * | 2010-03-23 | 2014-10-15 | 大日本印刷株式会社 | 注視点計測装置、注視点計測方法、プログラムおよび記憶媒体 |
JP5476264B2 (ja) * | 2010-09-22 | 2014-04-23 | 日本放送協会 | カメラトラッキング装置およびそのプログラム |
US8792728B2 (en) | 2010-09-27 | 2014-07-29 | Hewlett-Packard Development Company, L.P. | Near-duplicate image detection |
WO2012061134A2 (en) * | 2010-10-25 | 2012-05-10 | Lockheed Martin Corporation | Estimating position and orientation of an underwater vehicle relative to underwater structures |
US8942062B2 (en) * | 2010-10-25 | 2015-01-27 | Lockheed Martin Corporation | Detecting structural changes to underwater structures |
JP5549605B2 (ja) * | 2011-01-13 | 2014-07-16 | 新日鐵住金株式会社 | 視線位置検出装置、視線位置検出方法、及びコンピュータプログラム |
JP5519556B2 (ja) * | 2011-03-09 | 2014-06-11 | Kddi株式会社 | 解析対象画像の中から参照画像に基づく物体を認識する画像解析装置、サーバ、プログラム及び方法 |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
JP6248647B2 (ja) | 2014-01-22 | 2017-12-20 | 富士通株式会社 | 画像照合方法、画像処理システム、及びプログラム |
JP6832268B2 (ja) * | 2017-11-15 | 2021-02-24 | 日本電信電話株式会社 | 検証装置、方法、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4492036B2 (ja) * | 2003-04-28 | 2010-06-30 | ソニー株式会社 | 画像認識装置及び方法、並びにロボット装置 |
-
2005
- 2005-11-14 JP JP2005329462A patent/JP4753072B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007140613A (ja) | 2007-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4753072B2 (ja) | 映像内の複数広告看板の認識方法 | |
US11288823B2 (en) | Logo recognition in images and videos | |
US11210797B2 (en) | Systems, methods, and devices for image matching and object recognition in images using textures | |
EP3975123A1 (en) | Map constructing method, positioning method and system, wireless communication terminal, and computer-readable medium | |
Huang et al. | Copy-move forgery detection for image forensics using the superpixel segmentation and the Helmert transformation | |
Zhu et al. | Logo matching for document image retrieval | |
US9530218B2 (en) | Method for classification and segmentation and forming 3D models from images | |
Pang et al. | Training-based object recognition in cluttered 3d point clouds | |
US20230099984A1 (en) | System and Method for Multimedia Analytic Processing and Display | |
Abidin et al. | Copy-move image forgery detection using deep learning methods: a review | |
Uchiyama et al. | Toward augmenting everything: Detecting and tracking geometrical features on planar objects | |
CN110852311A (zh) | 一种三维人手关键点定位方法及装置 | |
Hinterstoisser et al. | N3m: Natural 3d markers for real-time object detection and pose estimation | |
CN114863464B (zh) | 一种pid图纸图件信息的二阶识别方法 | |
KR101753360B1 (ko) | 시점 변화에 강인한 특징점 정합 방법 | |
Wang et al. | Spatially prioritized and persistent text detection and decoding | |
Bibissi et al. | Dual spin-image: A bi-directional spin-image variant using multi-scale radii for 3D local shape description | |
JP5004082B2 (ja) | 文書画像検索方法、文書画像登録方法、そのプログラムおよび装置 | |
Avazov et al. | Automatic moving shadow detection and removal method for smart city environments | |
Diaa | A Deep Learning Model to Inspect Image Forgery on SURF Keypoints of SLIC Segmented Regions | |
Mignotte | Symmetry detection based on multiscale pairwise texture boundary segment interactions | |
US8928815B1 (en) | System and method for outdoor scene change detection | |
Denton et al. | An algorithm for projective point matching in the presence of spurious points | |
Anvaripour et al. | Accurate object detection using local shape descriptors | |
Yang et al. | Robust random dot markers: Towards augmented unprepared maps with pure geographic features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110216 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110511 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140603 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140603 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |