JP6575638B2 - パノラマ画像を用いる再位置決め方法、装置及び電子機器 - Google Patents
パノラマ画像を用いる再位置決め方法、装置及び電子機器 Download PDFInfo
- Publication number
- JP6575638B2 JP6575638B2 JP2018109129A JP2018109129A JP6575638B2 JP 6575638 B2 JP6575638 B2 JP 6575638B2 JP 2018109129 A JP2018109129 A JP 2018109129A JP 2018109129 A JP2018109129 A JP 2018109129A JP 6575638 B2 JP6575638 B2 JP 6575638B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- sub
- processed
- region image
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 63
- 238000010586 diagram Methods 0.000 claims description 87
- 238000013527 convolutional neural network Methods 0.000 claims description 59
- 238000011176 pooling Methods 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 43
- 230000015654 memory Effects 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 25
- 238000013528 artificial neural network Methods 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 20
- 238000013507 mapping Methods 0.000 claims description 9
- 239000010410 layer Substances 0.000 description 30
- 238000012360 testing method Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 11
- 238000013480 data collection Methods 0.000 description 9
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Stereoscopic And Panoramic Photography (AREA)
- Image Processing (AREA)
Description
パノラマ画像を取得する画像取得モジュールと、前記パノラマ画像をプレ処理して処理すべきサブ画像を取得する画像プレ処理モジュールと、前記処理すべきサブ画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得する第一画像処理モジュールと、前記深層特徴図に対して回転不変プーリング処理を行う第二画像処理モジュールと、回転不変プーリング処理後の深層特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とする再位置決めモジュールと、を含むことを特徴とする装置を提供する。
Access Memory、略してRAM)、フロッピーディス又は光ディスクなどのプログラムコードを保存できる様々な媒体を含む。
Claims (12)
- パノラマ画像を用いる再位置決め方法であって、
パノラマ画像を取得することと、
前記パノラマ画像をプレ処理して処理すべきサブ画像を取得することと、
前記処理すべきサブ画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得することと、
前記深層特徴図に対して回転不変プーリング処理を行うことと、
回転不変プーリング処理後の深層特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とすることと、を含むことを特徴とする方法。 - 前記パノラマ画像をプレ処理して処理すべきサブ画像を取得することは、
前記パノラマ画像の正距円筒投影を単位球面にマッピングすることと、
前記単位球面の球面中心点から、前記単位球面を外接立方体にマッピングすることと、
前記外接立方体を展開して処理すべきサブ画像を取得することと、を含み、
前記処理すべきサブ画像は、少なくとも前記パノラマ画像の中間領域画像を含むことを特徴とする請求項1に記載の方法。 - 前記処理すべきサブ画像は、前記パノラマ画像の上部領域画像をさらに含み、或いは、前記処理すべきサブ画像は、前記パノラマ画像の上部領域画像と下部領域画像をさらに含むことを特徴とする請求項2に記載の方法。
- 前記処理すべきサブ画像が前記パノラマ画像の中間領域画像のみを含む場合、前記処理すべき画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得することは、
前記中間領域画像を前記複数経路の畳み込みニューラルネットワークの入力とし、前記複数経路の畳み込みニューラルネットワークの畳み込み層加重値をロードし、前記複数経路の畳み込みニューラルネットワークの出力を前記中間領域画像の深層特徴図とすること、を含むことを特徴とする請求項2に記載の方法。 - 前記処理すべきサブ画像が前記パノラマ画像の中間領域画像及び上部領域画像を含む場合、前記処理すべき画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得することは、
前記中間領域画像及び前記上部領域画像をそれぞれ前記複数経路の畳み込みニューラルネットワークの二つの経路の入力とし、前記複数経路の畳み込みニューラルネットワークの畳み込み層加重値をロードし、前記二つの経路に対応する出力をそれぞれ前記中間領域画像及び前記上部領域画像の深層特徴図とすること、を含むことを特徴とする請求項3に記載の方法。 - 前記処理すべきサブ画像が前記パノラマ画像の中間領域画像、上部領域画像及び下部領域画像を含む場合、前記処理すべき画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得することは、
前記中間領域画像、前記上部領域画像及び前記下部領域画像をそれぞれ前記複数経路の畳み込みニューラルネットワークの三つの経路の入力とし、前記複数経路の畳み込みニューラルネットワークの畳み込み層加重値をロードし、前記三つの経路に対応する出力をそれぞれ前記中間領域画像、前記上部領域画像及び前記下部領域画像の深層特徴図とすること、を含むことを特徴とする請求項3に記載の方法。 - 前記処理すべきサブ画像が前記パノラマ画像の中間領域画像を含む場合、前記深層特徴図に対して回転不変プーリング処理を行うことは、前記中間領域画像に対応する深層特徴図の行最大値を、前記パノラマ画像の中間領域画像に対応する新しい特徴図として抽出することを含み、
前記処理すべきサブ画像が前記パノラマ画像の上部領域画像及び/又は前記パノラマ画像の下部領域画像を含む場合、前記深層特徴図に対して回転不変プーリング処理を行うことは、前記上部領域画像及び/又は前記下部領域画像の深層特徴図の最大値を、前記上部領域画像及び/又は前記下部領域画像に対応する新しい特徴図として抽出することを含むことを特徴とする請求項3に記載の方法。 - 前記処理すべきサブ画像が前記パノラマ画像の中間領域画像及び上部領域画像を含む場合、前記回転不変プーリング処理後の深層特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とすることは、
前記中間領域画像の新しい特徴図及び前記上部領域画像の新しい特徴図を繋ぎ合わせ、繋ぎ合わせた後の特徴図を取得することと、
前記繋ぎ合わせた後の特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とすることと、を含むことを特徴とする請求項5に記載の方法。 - 前記処理すべきサブ画像が前記パノラマ画像の中間領域画像、上部領域画像及び下部領域画像を含む場合、前記回転不変プーリング処理後の深層特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とすることは、
前記中間領域画像の新しい特徴図、前記上部領域画像の新しい特徴図及び前記下部領域画像の新しい特徴図を繋ぎ合わせ、繋ぎ合わせた後の特徴図を取得することと、
前記繋ぎ合わせた後の特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とすることと、を含むことを特徴とする請求項6に記載の方法。 - パノラマ画像を用いる再位置決め装置であって、
パノラマ画像を取得する画像取得モジュールと、
前記パノラマ画像をプレ処理して処理すべきサブ画像を取得する画像プレ処理モジュールと、
前記処理すべきサブ画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得する第一画像処理モジュールと、
前記深層特徴図に対して回転不変プーリング処理を行う第二画像処理モジュールと、
回転不変プーリング処理後の深層特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とする再位置決めモジュールと、を含むことを特徴とする装置。 - プロセッサーと、
コンピュータプログラムコマンドが格納されるメモリと、を含み、
前記コンピュータプログラムコマンドが前記プロセッサーにより実行された時に、前記プロセッサーに、
パノラマ画像を取得するステップと、
前記パノラマ画像をプレ処理して処理すべきサブ画像を取得するステップと、
前記処理すべきサブ画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得するステップと、
前記深層特徴図に対して回転不変プーリング処理を行うステップと、
回転不変プーリング処理後の深層特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とするステップと、を実行させることを特徴とする電子機器。 - コンピューターで読み取り可能な記録媒体にコンピュータプログラムが格納され、前記コンピュータプログラムがプロセッサーにより実行された時に、前記プロセッサーに、
パノラマ画像を取得するステップと、
前記パノラマ画像をプレ処理して処理すべきサブ画像を取得するステップと、
前記処理すべきサブ画像を複数経路の畳み込みニューラルネットワークに入力し、前記処理すべきサブ画像の深層特徴図を取得するステップと、
前記深層特徴図に対して回転不変プーリング処理を行うステップと、
回転不変プーリング処理後の深層特徴図を全結合モデルに入力し、前記全結合モデルの出力を再位置決め後の位置情報とするステップと、を実行させることを特徴とするコンピューター読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710631246.2 | 2017-07-28 | ||
CN201710631246.2A CN109308678B (zh) | 2017-07-28 | 2017-07-28 | 利用全景图像进行重定位的方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019029002A JP2019029002A (ja) | 2019-02-21 |
JP6575638B2 true JP6575638B2 (ja) | 2019-09-18 |
Family
ID=65205161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018109129A Active JP6575638B2 (ja) | 2017-07-28 | 2018-06-07 | パノラマ画像を用いる再位置決め方法、装置及び電子機器 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6575638B2 (ja) |
CN (1) | CN109308678B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112258561B (zh) * | 2019-07-22 | 2023-08-25 | 复旦大学 | 针对图像拼接的匹配点获取方法 |
KR102059305B1 (ko) * | 2019-09-09 | 2019-12-24 | 최한성 | 엘리베이터용 패널 제조 공정의 제어 방법 및 장치 |
KR102056030B1 (ko) | 2019-09-16 | 2019-12-16 | 박근표 | 막구조물 제조 공정을 위한 제어 방법 및 장치 |
KR102051974B1 (ko) * | 2019-09-20 | 2019-12-04 | 박흥용 | 금속 탱크 제조 공정의 제어 방법 및 장치 |
CN110910344B (zh) * | 2019-10-12 | 2022-09-13 | 上海交通大学 | 一种全景图片无参考质量评价方法、系统及设备 |
CN111091491B (zh) * | 2019-12-20 | 2023-05-05 | 知鱼科技丹阳有限公司 | 一种等距圆柱投影的全景视频像素再分配方法及系统 |
CN113128662A (zh) * | 2020-01-16 | 2021-07-16 | 波音公司 | 卷积神经网络及基于卷积神经网络的图像处理方法 |
CN111382696A (zh) * | 2020-03-06 | 2020-07-07 | 北京百度网讯科技有限公司 | 用于检测目标的边界点的方法和装置 |
WO2021237443A1 (zh) * | 2020-05-26 | 2021-12-02 | 蜂图志科技控股有限公司 | 一种视觉定位方法、装置、设备及可读存储介质 |
CN113516155A (zh) * | 2021-04-12 | 2021-10-19 | 佛山市顺德区美的洗涤电器制造有限公司 | 用于处理图像的方法、处理器、控制装置及家用电器 |
CN114972267A (zh) * | 2022-05-31 | 2022-08-30 | 腾讯音乐娱乐科技(深圳)有限公司 | 全景视频评价方法、计算机设备和计算机程序产品 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000048187A (ja) * | 1998-07-29 | 2000-02-18 | Fuji Photo Film Co Ltd | 画像変換方法 |
JP2004015766A (ja) * | 2002-06-12 | 2004-01-15 | Nippon Telegr & Teleph Corp <Ntt> | 全方位カメラパラメータ・姿勢検出方法、全方位カメラパラメータ・姿勢検出装置、全方位カメラパラメータ・姿勢検出プログラム、及びそのプログラムを記録した記録媒体 |
US7565029B2 (en) * | 2005-07-08 | 2009-07-21 | Seiko Epson Corporation | Method for determining camera position from two-dimensional images that form a panorama |
US8711206B2 (en) * | 2011-01-31 | 2014-04-29 | Microsoft Corporation | Mobile camera localization using depth maps |
US20120300020A1 (en) * | 2011-05-27 | 2012-11-29 | Qualcomm Incorporated | Real-time self-localization from panoramic images |
CN108604383A (zh) * | 2015-12-04 | 2018-09-28 | 奇跃公司 | 重新定位系统和方法 |
US10002313B2 (en) * | 2015-12-15 | 2018-06-19 | Sighthound, Inc. | Deeply learned convolutional neural networks (CNNS) for object localization and classification |
CN105678250B (zh) * | 2015-12-31 | 2019-10-11 | 北京迈格威科技有限公司 | 视频中的人脸识别方法和装置 |
CN106529446A (zh) * | 2016-10-27 | 2017-03-22 | 桂林电子科技大学 | 基于多分块深层卷积神经网络的车型识别方法和系统 |
CN106776548B (zh) * | 2016-12-06 | 2019-12-13 | 上海智臻智能网络科技股份有限公司 | 一种文本的相似度计算的方法和装置 |
CN106875446B (zh) * | 2017-02-20 | 2019-09-20 | 清华大学 | 相机重定位方法及装置 |
CN106875450B (zh) * | 2017-02-20 | 2019-09-20 | 清华大学 | 用于相机重定位的训练集优化方法及装置 |
CN106934404A (zh) * | 2017-03-10 | 2017-07-07 | 深圳市瀚晖威视科技有限公司 | 一种基于cnn卷积神经网络的图像火焰识别系统 |
-
2017
- 2017-07-28 CN CN201710631246.2A patent/CN109308678B/zh active Active
-
2018
- 2018-06-07 JP JP2018109129A patent/JP6575638B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019029002A (ja) | 2019-02-21 |
CN109308678A (zh) | 2019-02-05 |
CN109308678B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6575638B2 (ja) | パノラマ画像を用いる再位置決め方法、装置及び電子機器 | |
JP7453470B2 (ja) | 3次元再構成及び関連インタラクション、測定方法及び関連装置、機器 | |
JP6946831B2 (ja) | 人物の視線方向を推定するための情報処理装置及び推定方法、並びに学習装置及び学習方法 | |
CN109815770B (zh) | 二维码检测方法、装置及系统 | |
CN108875537B (zh) | 对象检测方法、装置和系统及存储介质 | |
Cai et al. | Smpler-x: Scaling up expressive human pose and shape estimation | |
CN108711144B (zh) | 增强现实方法及装置 | |
CN110349082A (zh) | 图像区域的裁剪方法和装置、存储介质及电子装置 | |
CN113807361B (zh) | 神经网络、目标检测方法、神经网络训练方法及相关产品 | |
CN110363817A (zh) | 目标位姿估计方法、电子设备和介质 | |
WO2020186385A1 (zh) | 图像处理方法、电子设备及计算机可读存储介质 | |
CN111833457A (zh) | 图像处理方法、设备及存储介质 | |
CN111626163A (zh) | 一种人脸活体检测方法、装置及计算机设备 | |
CN108053447A (zh) | 基于图像的重定位方法、服务器及存储介质 | |
US11100617B2 (en) | Deep learning method and apparatus for automatic upright rectification of virtual reality content | |
CN111507288A (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
WO2022247126A1 (zh) | 视觉定位方法、装置、设备、介质及程序 | |
CN111105351A (zh) | 一种视频序列影像拼接方法及装置 | |
Zhu et al. | Mipi 2023 challenge on rgb+ tof depth completion: Methods and results | |
JP7396076B2 (ja) | 番号認識装置、方法及び電子機器 | |
JP7177280B2 (ja) | 画像認識装置、画像認識方法、及び、画像認識プログラム | |
CN115829975A (zh) | 掌静脉图像质量检测方法、系统、介质及电子设备 | |
CN114998743A (zh) | 一种视觉地图点的构建方法、装置、设备及介质 | |
CN111723610B (zh) | 图像识别方法、装置及设备 | |
KR20210091033A (ko) | 객체 정보 추정과 가상 객체 생성을 위한 전자 장치 및 전자 장치의 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190805 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6575638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |