JP6858650B2 - 画像レジストレーションの方法及びシステム - Google Patents
画像レジストレーションの方法及びシステム Download PDFInfo
- Publication number
- JP6858650B2 JP6858650B2 JP2017111652A JP2017111652A JP6858650B2 JP 6858650 B2 JP6858650 B2 JP 6858650B2 JP 2017111652 A JP2017111652 A JP 2017111652A JP 2017111652 A JP2017111652 A JP 2017111652A JP 6858650 B2 JP6858650 B2 JP 6858650B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- binary descriptor
- weighted
- binary
- descriptor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 68
- 239000013598 vector Substances 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 230000004807 localization Effects 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 13
- 238000003384 imaging method Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 238000005259 measurement Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000859 sublimation Methods 0.000 description 1
- 230000008022 sublimation Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
- G06T7/337—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Description
マージン最大化ネットワーク学習アルゴリズム508は、重み509及び閾値510の双方を同時に推定するのに用いることもできる。重み及び閾値の学習の双方を組み合わせるために、幾つかの実施形態は、最適化を次のように定式化する。トレーニングデータD={di1,di2},i={1,...,n}が与えられると、重みベクトルw∈R256及び閾値T∈Rを学習する。ここで、di1及びdi2は、2つの異なるマッチングキーポイントにおけるバイナリー記述子を作成するのに用いられる256個のピクセルペアの強度値を記憶する256×2行列を指す。
図6は、本発明の1つの実施形態によるシステムの概略図を示している。本システムは、シーンを測定してシーンの第1の測定値のセット603を生成する第1のセンサー601と、シーンを測定してシーンの第2の測定値のセット604を生成する第2のセンサー602とを備える。例えば、第1のセンサー601はLIDARであり、第2のセンサー602はカメラである。本システムは、LIDAR画像からキーポイント及び記述子を抽出する(605)。同様に、本システムは、強度画像からキーポイント及び記述子を抽出する(606)。本システムは、重み付きハミング距離を用いて、LIDAR画像と強度画像とをマッチングする(607)。これらのマッチを用いて、本システムは、センサー融合608を取得することができる。
Claims (18)
- 画像レジストレーションの方法であって、
第1の画像内の第1のキーポイントの第1のバイナリー記述子を求めることであって、前記第1のバイナリー記述子における少なくとも1つの要素は、前記第1の画像の少なくとも2つのピクセルの強度の差と閾値との比較の結果であることと、
第2の画像内の第2のキーポイントの第2のバイナリー記述子を求めることであって、前記第2のバイナリー記述子における少なくとも1つの要素は、前記第2の画像の少なくとも2つのピクセルの強度の差と前記閾値との比較の結果であることと、
前記第1のバイナリー記述子と前記第2のバイナリー記述子との間の重み付き距離を求めることであって、前記第1のバイナリー記述子及び前記第2のバイナリー記述子の少なくとも2つの要素を比較する前記重み付き距離の少なくとも2つの重みはメモリに記憶された異なる値であることと、
前記重み付き距離が雑音閾値よりも小さいとき、前記第1のキーポイントを前記第2のキーポイントとレジスタリングすることと、
前記画像レジストレーションに基づいてコンピュータービジョン動作を実行すること、
を含み、
前記コンピュータービジョン動作は、ビジュアルオドメトリー、3D再構成、物体検出、物体認識、センサー融合、及び画像ベースのローカライゼーションのうちの1つ又は組み合わせを含み、
前記方法の少なくとも幾つかのステップは、プロセッサを用いて実行され、
方法。 - HARRISキーポイント検出法、FASTキーポイント検出法、又はSURFキーポイント検出法のうちの少なくとも1つ又は組み合わせを用いて、前記第1の画像内の第1のキーポイントのセットと、前記第2の画像内の第2のキーポイントのセットとを選択することと、
前記第1のセット及び前記第2のセットからのキーポイントのペアの各組み合わせについて前記求めるステップを繰り返して、前記雑音閾値よりも小さな前記重み付き距離を有する前記キーポイントのペアをレジスタリングすることと、
を更に含む、請求項1に記載の方法。 - 前記第1のキーポイントを含む前記第1の画像の第1のパッチを選択することと、
前記第2のキーポイントを含む前記第2の画像の第2のパッチを選択することと、
前記第1のパッチからの少なくとも幾つかのピクセルの強度を比較することによって前記第1のバイナリー記述子を求めることと、
前記第2のパッチからの少なくとも幾つかのピクセルの強度を比較することによって前記第2のバイナリー記述子を求めることと、
を更に含む、請求項2に記載の方法。 - Nは256に等しく、前記閾値は0よりも大きい、
請求項4に記載の方法。 - 異なる時点においてカメラを用いて捕捉された前記第1の画像及び前記第2の画像を取得することと、
前記プロセッサと作動的に接続されたメモリから、前記時点の関数に基づいて、前記閾値、前記雑音閾値、及び重み付きハミング距離の重みのうちの少なくとも1つを選択することと、
を更に含む、請求項1に記載の方法。 - 前記メモリは、1年の異なる季節における異なる日時に、異なる照明条件で、異なるタイプのシーンについて捕捉された画像の前記閾値、前記雑音閾値、及び前記重み付きハミング距離の前記重みのうちの少なくとも1つの異なる値を記憶する、
請求項7に記載の方法。 - 重み付きハミング距離の重みは、マージン最大化ネットワーク学習を用いてトレーニングデータから学習される、
請求項1に記載の方法。 - 前記閾値は、前記マージン最大化ネットワーク学習中に異なる整数値を列挙することによって学習される、
請求項9に記載の方法。 - 画像レジストレーションのシステムであって、
第1の画像及び第2の画像を取得する入力インターフェースと、
第1の画像内の第1のキーポイントの第1のバイナリー記述子を求め、第2の画像内の第2のキーポイントの第2のバイナリー記述子を求め、前記第1のバイナリー記述子と前記第2のバイナリー記述子との間の重み付きハミング距離を求め、前記重み付きハミング距離が雑音閾値よりも小さいとき、前記第1のキーポイントを前記第2のキーポイントとレジスタリングするプロセッサであって、前記第1のバイナリー記述子又は前記第2のバイナリー記述子における少なくとも1つの要素は、前記第1の画像又は前記第2の画像の少なくとも2つのピクセルの強度の差と非ゼロの閾値との比較の結果であり、前記第1のバイナリー記述子又は前記第2のバイナリー記述子の少なくとも2つの要素を比較する前記重み付きハミング距離の少なくとも2つの重みはメモリに記憶された異なる値である、プロセッサと、
前記画像レジストレーションに基づいてコンピュータービジョン動作を実行する出力インターフェースと、
を備え、
前記コンピュータービジョン動作は、ビジュアルオドメトリー、3D再構成、物体検出、物体認識、センサー融合、及び画像ベースのローカライゼーションのうちの1つ又は組み合わせを含む
システム。 - 請求項11に記載のシステムを備えるカメラ。
- 1年の異なる季節における異なる日時に、異なる照明条件で、異なるタイプのシーンについて捕捉された画像の前記閾値、前記雑音閾値、及び前記重み付きハミング距離の前記重みのうちの少なくとも1つの異なる値を記憶するメモリ、
を更に含む、請求項11に記載のシステム。 - 前記プロセッサは、
前記第1の画像及び前記第2の画像を捕捉する時点を決定し、
前記メモリから、前記時点の関数に基づいて、前記閾値、前記雑音閾値、及び前記重み付きハミング距離の前記重みのうちの少なくとも1つを選択する、
ように構成されている、請求項13に記載のシステム。 - Nは256に等しい、
請求項15に記載のシステム。 - 方法を実行するプロセッサによって実行可能なプログラムを具現化する非一時的コンピューター可読記憶媒体であって、
前記方法は、
第1の画像内の第1のキーポイントの第1のバイナリー記述子を求めることであって、前記第1のバイナリー記述子における少なくとも1つの要素は、前記第1の画像の少なくとも2つのピクセルの強度の差と閾値との比較の結果であることと、
第2の画像内の第2のキーポイントの第2のバイナリー記述子を求めることであって、前記第2のバイナリー記述子における少なくとも1つの要素は、前記第2の画像の少なくとも2つのピクセルの強度の差と前記閾値との比較の結果であることと、
前記第1のバイナリー記述子と前記第2のバイナリー記述子との間の重み付きハミング距離を求めることであって、前記第1のバイナリー記述子及び前記第2のバイナリー記述子の少なくとも2つの要素を比較する前記重み付きハミング距離の少なくとも2つの重みはメモリに記憶された異なる値であることと、
前記重み付きハミング距離が雑音閾値よりも小さいとき、前記第1のキーポイントを前記第2のキーポイントとレジスタリングすることと、
前記画像レジストレーションに基づいてコンピュータービジョン動作を実行すること、
を含み、
前記コンピュータービジョン動作は、ビジュアルオドメトリー、3D再構成、物体検出、物体認識、センサー融合、及び画像ベースのローカライゼーションのうちの1つ又は組み合わせを含む
非一時的コンピューター可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/241,118 | 2016-08-19 | ||
US15/241,118 US10013765B2 (en) | 2016-08-19 | 2016-08-19 | Method and system for image registrations |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018028899A JP2018028899A (ja) | 2018-02-22 |
JP2018028899A5 JP2018028899A5 (ja) | 2020-05-28 |
JP6858650B2 true JP6858650B2 (ja) | 2021-04-14 |
Family
ID=61191998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017111652A Active JP6858650B2 (ja) | 2016-08-19 | 2017-06-06 | 画像レジストレーションの方法及びシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10013765B2 (ja) |
JP (1) | JP6858650B2 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9972121B2 (en) * | 2014-04-22 | 2018-05-15 | Google Llc | Selecting time-distributed panoramic images for display |
US9934222B2 (en) | 2014-04-22 | 2018-04-03 | Google Llc | Providing a thumbnail image that follows a main image |
USD781317S1 (en) | 2014-04-22 | 2017-03-14 | Google Inc. | Display screen with graphical user interface or portion thereof |
USD780777S1 (en) | 2014-04-22 | 2017-03-07 | Google Inc. | Display screen with graphical user interface or portion thereof |
US9754182B2 (en) * | 2015-09-02 | 2017-09-05 | Apple Inc. | Detecting keypoints in image data |
US10839226B2 (en) * | 2016-11-10 | 2020-11-17 | International Business Machines Corporation | Neural network training |
US10547871B2 (en) * | 2017-05-05 | 2020-01-28 | Disney Enterprises, Inc. | Edge-aware spatio-temporal filtering and optical flow estimation in real time |
US10554957B2 (en) * | 2017-06-04 | 2020-02-04 | Google Llc | Learning-based matching for active stereo systems |
CN109008909B (zh) * | 2018-07-13 | 2024-01-26 | 宜宾学院 | 一种低功耗胶囊内窥镜图像采集及三维重建系统 |
CN109272537B (zh) * | 2018-08-16 | 2021-08-13 | 清华大学 | 一种基于结构光的全景点云配准方法 |
CN110009549B (zh) * | 2019-03-14 | 2020-08-21 | 北京航空航天大学 | 一种旋转对称描述子的计算方法及硬件加速器 |
CN110134803B (zh) * | 2019-05-17 | 2020-12-11 | 哈尔滨工程大学 | 基于哈希学习的图像数据快速检索方法 |
CN112307243B (zh) * | 2019-07-23 | 2023-11-03 | 北京京东振世信息技术有限公司 | 用于检索图像的方法和装置 |
US11354883B2 (en) * | 2019-12-30 | 2022-06-07 | Sensetime International Pte. Ltd. | Image processing method and apparatus, and electronic device |
SG10201913798WA (en) * | 2019-12-30 | 2021-07-29 | Sensetime Int Pte Ltd | Image processing method and apparatus, and electronic device |
CN111223133B (zh) * | 2020-01-07 | 2022-10-11 | 上海交通大学 | 一种异源图像的配准方法 |
JP7446903B2 (ja) * | 2020-04-23 | 2024-03-11 | 株式会社日立製作所 | 画像処理装置、画像処理方法及び画像処理システム |
JP7093935B2 (ja) * | 2020-09-02 | 2022-07-01 | 株式会社サイバーエージェント | 推定システム、推定装置、推定方法及びコンピュータプログラム |
CN112560858B (zh) * | 2020-10-13 | 2023-04-07 | 国家计算机网络与信息安全管理中心 | 一种联合轻量化网络和个性化特征提取的字符图片检测及快速匹配方法 |
CN112926593A (zh) * | 2021-02-20 | 2021-06-08 | 温州大学 | 一种用于动态图像增强呈现中的图像特征处理方法及装置 |
CN113679327B (zh) * | 2021-10-26 | 2022-02-18 | 青岛美迪康数字工程有限公司 | 内镜检查图像采集方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711293B1 (en) | 1999-03-08 | 2004-03-23 | The University Of British Columbia | Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image |
EP1850270B1 (en) | 2006-04-28 | 2010-06-09 | Toyota Motor Europe NV | Robust interest point detector and descriptor |
US8687892B2 (en) | 2012-06-21 | 2014-04-01 | Thomson Licensing | Generating a binary descriptor representing an image patch |
KR101677559B1 (ko) * | 2013-03-22 | 2016-11-18 | 한국전자통신연구원 | 영상 정합 장치 및 그것의 동작 방법 |
KR101491461B1 (ko) | 2013-08-02 | 2015-02-23 | 포항공과대학교 산학협력단 | 공분산 기술자를 이용하는 물체 인식 방법 및 장치 |
US20160092727A1 (en) * | 2014-09-30 | 2016-03-31 | Alcatel-Lucent Usa Inc. | Tracking humans in video images |
-
2016
- 2016-08-19 US US15/241,118 patent/US10013765B2/en active Active
-
2017
- 2017-06-06 JP JP2017111652A patent/JP6858650B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20180053293A1 (en) | 2018-02-22 |
JP2018028899A (ja) | 2018-02-22 |
US10013765B2 (en) | 2018-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6858650B2 (ja) | 画像レジストレーションの方法及びシステム | |
KR102662201B1 (ko) | 콘볼루셔널 이미지 변환을 사용하여 동시 로컬화 및 맵핑을 수행하기 위한 방법 및 시스템 | |
US11145083B2 (en) | Image-based localization | |
US10659768B2 (en) | System and method for virtually-augmented visual simultaneous localization and mapping | |
JP6862584B2 (ja) | 画像処理システム及び画像処理方法 | |
US9406137B2 (en) | Robust tracking using point and line features | |
EP2941736B1 (en) | Mobile device based text detection and tracking | |
US9747516B2 (en) | Keypoint detection with trackability measurements | |
CN111382613B (zh) | 图像处理方法、装置、设备和介质 | |
US10554957B2 (en) | Learning-based matching for active stereo systems | |
US11842504B2 (en) | Systems and methods for image processing based on optimal transport and epipolar geometry | |
CN108335329B (zh) | 应用于飞行器中的位置检测方法和装置、飞行器 | |
CN116704111A (zh) | 图像处理方法和设备 | |
CN112750157B (zh) | 一种深度图像生成方法及装置 | |
Piasco et al. | Geometric camera pose refinement with learned depth maps | |
US20240177329A1 (en) | Scaling for depth estimation | |
US20240161337A1 (en) | Matching between 2d and 3d for direct localization | |
JP7495546B2 (ja) | 畳み込み画像変換を使用して同時位置特定およびマッピングを実施する方法およびシステム | |
EP4250231A1 (en) | Cloud-based training and camera correction | |
WO2024112458A1 (en) | Scaling for depth estimation | |
Based Swift | PRN-SORB-SLAM | |
Nongmeikapam et al. | Prn-Sorb-Slam: A Parallelized Region Proposal Network-Based Swift ORB SLAM System for Stereo Vision-Based Local Path Planning | |
Kusram et al. | Two-Phase Multimodal Image Fusion Using Convolutional Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200420 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200420 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200909 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20201002 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210324 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6858650 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |