JP2021093117A - 連帯的な検出と記述システムおよび方法 - Google Patents
連帯的な検出と記述システムおよび方法 Download PDFInfo
- Publication number
- JP2021093117A JP2021093117A JP2020101352A JP2020101352A JP2021093117A JP 2021093117 A JP2021093117 A JP 2021093117A JP 2020101352 A JP2020101352 A JP 2020101352A JP 2020101352 A JP2020101352 A JP 2020101352A JP 2021093117 A JP2021093117 A JP 2021093117A
- Authority
- JP
- Japan
- Prior art keywords
- output
- convolution layer
- pixels
- score
- generate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000001514 detection method Methods 0.000 title description 47
- 238000010606 normalization Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 description 34
- 238000011156 evaluation Methods 0.000 description 11
- 230000000007 visual effect Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000004807 localization Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000003252 repetitive effect Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- ZLIBICFPKPWGIZ-UHFFFAOYSA-N pyrimethanil Chemical compound CC1=CC(C)=NC(NC=2C=CC=CC=2)=N1 ZLIBICFPKPWGIZ-UHFFFAOYSA-N 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
- G06V20/38—Outdoor scenes
- G06V20/39—Urban scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Biodiversity & Conservation Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
Description
図4は、例示的な学習および評価システムの機能的なブロック図である。学習モジュール(404)は、学習データセット(408)に格納されたデータを使用して記述および検出モジュール(116)を学習させる。反復性は、自己−教師ありタスク(self−supervised task)として扱われ、学習モジュール(404)は、記述および検出モジュール(116)を学習させてSにおける局部最大値(反復性マッピング)の位置が、視点または照明の変化のような自然イメージ変換に共変されるようにする。
104:カメラ
108:推進装置
112:制御モジュール
116:記述および検出モジュール
Claims (26)
- イメージ内の特徴点を検出し、記述するためのシステムであって、
複数のピクセルを含むイメージをキャプチャするように構成されたカメラと、
連帯的で同時にそれぞれのピクセルの記述子を生成し、前記それぞれのピクセルの信頼性スコアを生成し、前記それぞれのピクセルの反復性スコアを生成するように構成された全層畳み込みネットワークと、
前記ピクセルの前記信頼性スコアおよび前記反復性スコアに基づいて、前記それぞれのピクセルのスコアを生成するように構成されたスコアリングモジュールと、
上位X個のスコアを有する前記ピクセルのうちX個を選択し、ここで、前記Xは、1より大きい整数であり、前記選択されたX個のピクセルの位置および前記選択されたX個のピクセルの記述子を含む特徴点リストを生成するように構成された特徴点リストモジュールとを含む、システム。 - 前記スコアリングモジュールは、前記ピクセルのうち1つのピクセルのスコアを、前記ピクセルのうち前記1つのピクセルの反復性スコアと前記ピクセルのうち前記1つのピクセルの信頼性スコアを乗じたものと同一に設定する、請求項1に記載のシステム。
- 前記全層畳み込みネットワークは、前記信頼性スコアおよび前記反復性スコアを0と1の間に制限するように構成された、請求項2に記載のシステム。
- 前記Xは、1,000以上の整数である、請求項1に記載のシステム。
- 前記全層畳み込みネットワークは、
前記イメージを受信し、前記イメージに基づいて第1の出力を生成するように構成された第1の畳み込み層と、
前記第1の出力を受信し、前記第1の出力に基づいて第2の出力を生成するように構成された第2の畳み込み層と、
前記第2の出力を受信し、前記第2の出力に基づいて第3の出力を生成するように構成された第3の畳み込み層と、
前記第3の出力を受信し、前記第3の出力に基づいて第4の出力を生成するように構成された第4の畳み込み層と、
前記第4の出力を受信し、前記第4の出力に基づいて第5の出力を生成するように構成された第5の畳み込み層と、
前記第5の出力を受信し、前記第5の出力に基づいて第6の出力を生成するように構成された第6の畳み込み層と、
前記第6の出力を受信し、前記第6の出力に基づいて第7の出力および第8の出力を生成するように構成された第7の畳み込み層とを含み、
前記全層畳み込みネットワークは、
前記第7の出力に基づいて前記それぞれのピクセルの記述子を生成し、
前記第8の出力に基づいて前記それぞれのピクセルの信頼性スコアを生成し、
前記第8の出力に基づいて前記それぞれのピクセルの反復性スコアを生成するように構成された、請求項1に記載のシステム。 - 前記第1の畳み込み層は、3x3畳み込み層を含む、請求項5に記載のシステム。
- 前記第2の畳み込み層は、少なくとも1つの拡張層を有する3x3畳み込み層を含む、請求項5に記載のシステム。
- 前記第3の畳み込み層は、3x3畳み込み層を含む、請求項5に記載のシステム。
- 前記第4の畳み込み層は、少なくとも1つの拡張層を有する3x3畳み込み層を含む、請求項5に記載のシステム。
- 前記第5の畳み込み層は、2x2畳み込み層を含む、請求項5に記載のシステム。
- 前記第6の畳み込み層は、2x2畳み込み層を含む、請求項5に記載のシステム。
- 前記第7の畳み込み層は、2x2畳み込み層を含む、請求項5に記載のシステム。
- 前記第7の出力を受信し、前記第7の出力を正規化して、第9の出力を生成するように構成された正規化モジュールをさらに含む、請求項5に記載のシステム。
- 前記正規化モジュールは、L2正規化を使用して前記第7の出力を正規化するように構成された、請求項13に記載のシステム。
- 前記第9の出力に基づいて前記それぞれのピクセルの記述子を生成するように構成された記述子モジュールをさらに含み、
前記それぞれのピクセルの記述子は、該当のピクセル内の特徴点の数学的表現を含む、請求項13に記載のシステム。 - 前記第8の出力を要素別に2乗し、第10の出力を生成するように構成された2乗モジュールと、
前記第10の出力を受信し、前記第10の出力に基づいて第11の出力および第12の出力を生成するように構成された第8の畳み込み層と、
前記第11の出力を受信し、前記第11の出力に基づいて第13の出力を生成するように構成された第9の畳み込み層と、
前記第13の出力に基づいて信頼性スコアを生成するように構成された第10の畳み込み層と、
前記第12の出力を受信し、前記第12の出力に基づいて第14の出力を生成するように構成された第11の畳み込み層と、
前記第14の出力に基づいて反復性スコアを生成するように構成された第12の畳み込み層とをさらに含む、請求項5に記載のシステム。 - 前記第8の畳み込み層は、3x3畳み込み層を含む、請求項16に記載のシステム。
- 前記第8の畳み込み層は、少なくとも1つの拡張層をさらに含む、請求項17に記載のシステム。
- 前記第9の畳み込み層は、1x1畳み込み層および3x3畳み込み層のうち1つの層または他の適切なタイプの層を含む、請求項16に記載のシステム。
- 前記第10の畳み込み層は、1x1畳み込み層および3x3畳み込み層のうち1つを含む、請求項16に記載のシステム。
- 前記第11の畳み込み層は、1x1畳み込み層および3x3畳み込み層のうち1つを含む、請求項16に記載のシステム。
- 前記第12の畳み込み層は、1x1畳み込み層および3x3畳み込み層のうち1つを含む、請求項16に記載のシステム。
- 学習データセットを使用して平均精度(AP)を最大化することによって、前記全層畳み込みネットワークを学習させるように構成された学習モジュールをさらに含む、請求項1に記載のシステム。
- イメージから特徴点を検出し、記述する方法であって、
複数のピクセルを含むイメージを受信するステップと、
連帯的で同時に、それぞれのピクセルの記述子を生成し、前記それぞれのピクセルの信頼性スコアを生成し、前記それぞれのピクセルの反復性スコアを生成するステップと、
前記ピクセルの前記信頼性スコアおよび前記反復性スコアに基づいて、前記それぞれのピクセルのスコアを生成するステップと、
上位X個のスコアを有する前記ピクセルのうちX個を選択するステップ−前記Xは、1より大きい整数である−と、
前記選択されたX個のピクセルの位置および前記選択されたX個のピクセルの記述子を含む特徴点リストを生成するステップとを含む、方法。 - 前記位置および前記記述子に基づいて前記イメージ内のオブジェクトを識別するステップをさらに含む、請求項24に記載の方法。
- イメージ内の特徴点を検出し、記述するためのシステムであって、
複数のピクセルを含むイメージを受信し、連帯的で同時に、それぞれのピクセルの記述子を生成し、前記それぞれのピクセルの信頼性スコアを生成し、前記それぞれのピクセルの反復性スコアを生成する手段と、
前記ピクセルの前記信頼性スコアおよび前記反復性スコアに基づいて、前記それぞれのピクセルのスコアを生成する手段と、
上位X個のスコアを有する前記ピクセルのうちX個を選択し、ここで、前記Xは、1より大きい整数であり、前記選択されたX個のピクセルの位置および前記選択されたX個のピクセルの記述子を含む特徴点リストを生成する手段とを含む、システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/710,547 US11176425B2 (en) | 2019-12-11 | 2019-12-11 | Joint detection and description systems and methods |
US16/710,547 | 2019-12-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021093117A true JP2021093117A (ja) | 2021-06-17 |
Family
ID=76313210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020101352A Pending JP2021093117A (ja) | 2019-12-11 | 2020-06-11 | 連帯的な検出と記述システムおよび方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11176425B2 (ja) |
JP (1) | JP2021093117A (ja) |
KR (1) | KR20210074163A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288511B (zh) * | 2019-05-10 | 2023-04-07 | 台州宏达电力建设有限公司台州经济开发区运检分公司 | 基于双相机图像的最小化误差拼接方法、装置、电子设备 |
US11176182B2 (en) * | 2020-03-13 | 2021-11-16 | International Business Machines Corporation | Applying approximate measure values from dissimilar maps |
US20220406005A1 (en) * | 2021-06-17 | 2022-12-22 | Faro Technologies, Inc. | Targetless tracking of measurement device during capture of surrounding data |
CN114067100A (zh) * | 2021-10-29 | 2022-02-18 | 厦门大学 | 一种在困难条件下检测子和描述符同时生成的特征点匹配方法 |
EP4254354A1 (en) | 2022-03-28 | 2023-10-04 | Naver Corporation | System and method using pyramidal and uniqueness matching priors for identifying correspondences between images |
CN116563583B (zh) * | 2023-07-07 | 2023-10-10 | 腾讯科技(深圳)有限公司 | 一种图像匹配的方法、地图信息的更新方法以及相关装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8369593B2 (en) * | 2007-12-21 | 2013-02-05 | Siemens Medical Solutions Usa, Inc. | Systems and methods for robust learning based annotation of medical radiographs |
US10242455B2 (en) * | 2015-12-18 | 2019-03-26 | Iris Automation, Inc. | Systems and methods for generating a 3D world model using velocity data of a vehicle |
US10380853B1 (en) * | 2017-05-22 | 2019-08-13 | Amazon Technologies, Inc. | Presence detection and detection localization |
US10796452B2 (en) * | 2017-12-03 | 2020-10-06 | Facebook, Inc. | Optimizations for structure mapping and up-sampling |
US11246527B2 (en) * | 2018-08-31 | 2022-02-15 | Seno Medical Instruments, Inc. | Method and system for managing feature reading and scoring in ultrasound and/or optoacoustice images |
CN113892127A (zh) * | 2019-05-17 | 2022-01-04 | 奇跃公司 | 使用神经网络和角点检测器进行角点检测的方法和装置 |
-
2019
- 2019-12-11 US US16/710,547 patent/US11176425B2/en active Active
-
2020
- 2020-06-09 KR KR1020200069669A patent/KR20210074163A/ko unknown
- 2020-06-11 JP JP2020101352A patent/JP2021093117A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20210182626A1 (en) | 2021-06-17 |
US11176425B2 (en) | 2021-11-16 |
KR20210074163A (ko) | 2021-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021093117A (ja) | 連帯的な検出と記述システムおよび方法 | |
CN114782691B (zh) | 基于深度学习的机器人目标识别与运动检测方法、存储介质及设备 | |
JP5778237B2 (ja) | ポイントクラウド内の埋め戻しポイント | |
US7409108B2 (en) | Method and system for hybrid rigid registration of 2D/3D medical images | |
Li et al. | Automatic targetless LiDAR–camera calibration: a survey | |
JP2010238226A (ja) | 物体を追跡するための方法及びシステム | |
CN108416385A (zh) | 一种基于改进图像匹配策略的同步定位与建图方法 | |
KR20210049655A (ko) | 특징맵 생성방법 및 특징맵 생성장치 | |
Huang et al. | S3: Learnable sparse signal superdensity for guided depth estimation | |
Hall et al. | The robotic vision scene understanding challenge | |
CN115984637A (zh) | 时序融合的点云3d目标检测方法、系统、终端及介质 | |
CN110428461B (zh) | 结合深度学习的单目slam方法及装置 | |
Dai et al. | RGB‐D SLAM with moving object tracking in dynamic environments | |
Yang et al. | Research on Edge Detection of LiDAR Images Based on Artificial Intelligence Technology | |
JP2023145404A (ja) | イメージ間の対応関係を識別するためにピラミッド及び固有性マッチングフライアを使用するシステム及び方法 | |
Cortés et al. | Improving the correspondence establishment based on interactive homography estimation | |
Merras et al. | Camera self-calibration with varying parameters based on planes basis using particle swarm optimization | |
Wan et al. | A performance comparison of feature detectors for planetary rover mapping and localization | |
KR20230111010A (ko) | 관절 예측을 위한 학습 데이터 생성 방법 및 장치 | |
CN114511631A (zh) | 摄像机视觉物体高度测量方法、装置及计算机可读存储介质 | |
CN106651950A (zh) | 一种基于二次曲线透视投影不变性的单相机位姿估计方法 | |
CN111899284A (zh) | 一种基于参数化esm网络的平面目标跟踪方法 | |
Kim et al. | A high quality depth map upsampling method robust to misalignment of depth and color boundaries | |
Yang et al. | Efficient Passive Sensing Monocular Relative Depth Estimation | |
KR102298098B1 (ko) | Rgb-d 카메라의 트래킹을 통한 3d 모델의 생성 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20200703 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240730 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240806 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20240820 |