JP7031511B2 - 信号処理装置、畳み込みニューラルネットワーク、信号処理方法及び信号処理プログラム - Google Patents
信号処理装置、畳み込みニューラルネットワーク、信号処理方法及び信号処理プログラム Download PDFInfo
- Publication number
- JP7031511B2 JP7031511B2 JP2018119299A JP2018119299A JP7031511B2 JP 7031511 B2 JP7031511 B2 JP 7031511B2 JP 2018119299 A JP2018119299 A JP 2018119299A JP 2018119299 A JP2018119299 A JP 2018119299A JP 7031511 B2 JP7031511 B2 JP 7031511B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- filter
- spherical
- unit
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Complex Calculations (AREA)
Description
(概要)
上下左右斜め等の全方向の情報(信号)は、各方向を単位ベクトルで表現すると、単位球面上に値を割り当てた信号(単位球面から信号値の集合への写像)と見なすことができる。以下、各方向の信号を「球面信号」という。離散的な球面信号のフィルタ処理は、信号とフィルタのカーネルの畳み込み(或いは相関)演算である。正方格子上の信号値のフィルタ処理であれば、フィルタを1グリッドずつずらして畳み込み演算を行えば良い。しかし、2次以上の球面にそのようなグリッドを構成することは大変困難である。
図2に、第1の実施の形態の信号処理装置の構成図を示す。この図2に示すように、信号処理装置は、信号処理部1(信号処理装置の一例)及び記憶部2を有している。また、信号処理部1は、信号取得部11、軸分解部12、平面フィルタ処理部13(フィルタ処理部の一例)、軸統合部14及び出力部15を有している。記憶部2としては、例えばRAM(Random Access Memory)又はROM(Read Only Memory)等の半導体記憶装置、HDD(Hard Disk Drive)、又は、光記憶媒体等を用いることができる。信号取得部11~出力部15は、ハードウェア又はソフトウェアで実現できる。ソフトウェアで実現する場合、例えば記憶部2に記憶されている信号処理プログラムを、信号処理部が読み出し、RAM等に信号取得部11~出力部15を展開して実行する。
図3は、第1の実施の形態の信号処理装置の信号処理の流れを示すフローチャートである。この図3のフローチャートを用いて、入力された正距円筒形式(図1)の球面信号に対してフィルタ処理を行う例を説明する。まず、ステップS1では、信号取得部11が記憶部2から処理対象の球面信号(図5(a))を取得する。この時、球面信号は、図1(b)に示すように、正距円筒形式での正方格子グリッド上の値で表現されているものとする。図1の例は、図1(a)に示す球面信号「P」が、図1(b)に示す正距円筒形式での正方格子グリッド上の値「P´」で表現された例を示している。
第1の実施の形態の信号処理装置は、正距円筒形式の球面信号に対して少ない計算量でフィルタ処理を行うことができる。入力信号形式としては、説明上の便宜上、一例として正距円筒形式を示したが、軸分解処理及び軸統合処理の際に、極座標を反映すれば良いので任意の球面信号の表現形式を用いてもよい。
次に、第2の実施の形態の信号処理装置の説明をする。この第2の実施の形態の信号処理装置は、球面信号に対してフィルタ処理を行う際に、インテグラルイメージを内包し、大きいサイズのフィルタに対しても計算量の削減を可能とした例である。なお、この第2の実施の形態と上述の第1の実施の形態とでは、図2に示した軸分解部12における、図3のフローチャートのステップS2の軸分解処理が異なる。このため、以下、両者の差異の説明のみ行い、重複説明は省略する。
第2の実施の形態の信号処理装置は、正距円筒形式の球面信号に対して少ない計算量でフィルタ処理を行うことができる。特に、インテグラルイメージを用いて軸分解を行う際の計算量を削減することができ、また、大きいカーネルサイズのフィルタ処理も少ない計算量で可能とすることができる。
次に、第2の実施の形態の第1の変形例を説明する。インテグラルイメージとしては、以下の(5)式の漸化式で生成されるインテグラルイメージを用いることもできる。
インテグラルイメージを用いることで、マルチスケールのフィルタ処理を高速化することができる。例えば、画像信号において、カメラの近くで撮影された物体と遠くで撮影された物体は、大きさが違うが相似形である等のように、信号の中にスケールの異なる相似形の信号が含まれていることがある。そのような信号に対して、マルチスケールのフィルタ処理を施す応用が存在する。
次に、第3の実施の形態の信号処理装置の説明をする。この第3の実施の形態の信号処理装置は、入力された球面信号に対して、フィルタのカーネルを水平及び垂直方向に分解して、フィルタ処理を施す例である(フィルタのカーネル分解)。
このような第3の実施の形態の信号処理装置は、フィルタのカーネルを水平方向及び垂直方向に1次元分解して用いる。これにより、図10のフローチャートのステップS2における軸分解処理を、1次元の信号への分解処理とすることができ、計算量の低減を図ることができる。また、フィルタのカーネルを水平方向及び垂直方向に1次元分解して用いることで、部分信号に幾何学的な歪みが発生する不都合を防止できる。
このように第3の実施の形態の信号処理装置は、フィルタを1次元分解することで、部分信号を1次元信号とすることができる。また、幾何学的な歪みの発生を防止でき、また、計算回数を低減できるため、高い近似精度で高速な球面フィルタ処理を可能とすることができる。特に、フィルタサイズが大きいほど、このような効果が顕著となる。
次に、第4の実施の形態の信号処理装置の説明をする。第1~第3の実施の形態の信号処理装置は、2次球面上の球面信号の信号処理を行う例であった。これに対して、第4の実施の形態の信号処理装置は、入力されたp次の球面信号に対して、フィルタ処理を施す例である。
図14は、3次(p=3)の単位球面に対する一連の処理の流れを示す模式図である。軸分解部12は、図14(a)に示す3次単位球面S3の正距円筒形式の3個の軸θ1~θ3に沿って3次球面信号を分解する。まず、軸分解部12は、θ3の方向で3次球面信号を分解する。そして、軸分解部12は、分解した3次球面信号を、図14(b)に示すように|sinθ3|の比率で縮小する。
このような第4の実施の形態の信号処理装置は、p次の球面信号のフィルタ処理を少ない計算量、及び、高い近似精度で実現することができる。なお、上述の第1の実施の形態に基づいて、この第4の実施の形態を行ったが、第2の実施の形態で説明したインテグラルイメージ処理も単位球面Spに適用可能である。第2の実施の形態で説明したインテグラルイメージ処理を単位球面Spに適用する場合、p次元のインテグラルイメージへの拡張が必要となる。これは(1)式の代わりに、以下の漸化式である(13)式に基づいてインテグラルイメージを作成すれば良い。
次に、第5の実施の形態の信号処理装置の説明をする。この第5の実施の形態の信号処理装置は、入力された正距円筒形式の球面信号に対する多段階の球面フィルタ処理を、畳み込みニューラルネットワークの畳み込み層として用いる例である。
図15に、第5の実施の形態の信号処理部1の構成図を示す。この図15に示すように、第5の実施の形態の信号処理部1は、上述の信号取得部11と共に、球面フィルタ部31、活性化関数適用部32、出力部33及び学習部34を有する。
このように、第5の実施の形態の信号処理装置は、球面フィルタ処理を用いた球面信号用のニューラルネットワークを実現することができる。
上述の各実施の形態の効果を、以下に示す。
2 記憶部
11 信号取得部
12 軸分解部
13 平面フィルタ処理部
14 軸統合部
15 出力部
21 水平フィルタ処理部
22 垂直フィルタ処理部
31 球面フィルタ部
32 活性化関数適用部
33 出力部
34 学習部
Claims (8)
- 球面上の点に値が割り当てられた球面信号に対してフィルタ処理を行う信号処理装置であって、
球面信号を極座標の1つの軸方向について、球面上の距離を反映して伸縮し、複数の部分信号に分解する軸分解処理を行う軸分解部と、
前記部分信号に対してフィルタ処理を行うフィルタ処理部と、
フィルタ処理された前記部分信号を、球面上の距離を反映して伸縮して統合する軸統合処理を行う軸統合部と、
を有することを特徴とする信号処理装置。 - 前記軸分解部は、分解する方向に対して対応するフィルタのカーネルの幅を持たせて分解すること
を特徴とする請求項1に記載の信号処理装置。 - 前記軸分解部は、インテグラルイメージを用いて球面上の距離を反映した伸縮を行うこと
を特徴とする請求項1に記載の信号処理装置。 - フィルタのカーネルを極座標の各軸方向に沿って1次元分解し、前記軸統合部の後段に、統合した軸方向の1次元フィルタを適用する1次元フィルタ処理部を更に備えること
を特徴とする請求項1に記載の信号処理装置。 - 前記軸分解部、前記フィルタ処理部及び前記軸統合部は、p次元(pは任意の自然数)の超球面上の点に値の割り当てられた球面信号に対して、前記軸分解処理、前記フィルタ処理及び前記軸統合処理をp-1回ずつ順次繰り返すこと
を特徴とする請求項1から請求項4のうち、いずれか一項に記載の信号処理装置。 - 請求項1から請求項5のうち、いずれか一項に記載の信号処理装置を畳み込み層として用いたこと
を特徴とする畳み込みニューラルネットワーク。 - 球面上の点に値が割り当てられた球面信号に対してフィルタ処理を行う信号処理装置の信号処理方法であって、
軸分解部が、球面信号を極座標の1つの軸方向について、球面上の距離を反映して伸縮し、複数の部分信号に分解する軸分解処理を行う軸分解ステップと、
フィルタ処理部が、前記部分信号に対してフィルタ処理を行うフィルタ処理ステップと、
軸統合部が、フィルタ処理された前記部分信号を、球面上の距離を反映して伸縮して統合する軸統合処理を行う軸統合ステップと、
を有することを特徴とする信号処理方法。 - コンピュータに、球面上の点に値が割り当てられた球面信号に対してフィルタ処理を行わせるための信号処理プログラムであって、
前記コンピュータを、
球面信号を極座標の1つの軸方向について、球面上の距離を反映して伸縮し、複数の部分信号に分解する軸分解処理を行う軸分解部と、
前記部分信号に対してフィルタ処理を行うフィルタ処理部と、
フィルタ処理された前記部分信号を、球面上の距離を反映して伸縮して統合する軸統合処理を行う軸統合部として機能させること、
を特徴とする信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018119299A JP7031511B2 (ja) | 2018-06-22 | 2018-06-22 | 信号処理装置、畳み込みニューラルネットワーク、信号処理方法及び信号処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018119299A JP7031511B2 (ja) | 2018-06-22 | 2018-06-22 | 信号処理装置、畳み込みニューラルネットワーク、信号処理方法及び信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019220114A JP2019220114A (ja) | 2019-12-26 |
JP7031511B2 true JP7031511B2 (ja) | 2022-03-08 |
Family
ID=69096800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018119299A Active JP7031511B2 (ja) | 2018-06-22 | 2018-06-22 | 信号処理装置、畳み込みニューラルネットワーク、信号処理方法及び信号処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7031511B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102420895B1 (ko) * | 2019-12-31 | 2022-07-13 | 연세대학교 산학협력단 | 다중 경로 혼합 기반 학습 데이터 획득 장치 및 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016103089A (ja) | 2014-11-27 | 2016-06-02 | 株式会社リコー | 情報処理装置、信号処理方法、プログラム |
JP2017207960A (ja) | 2016-05-19 | 2017-11-24 | 株式会社リコー | 画像解析装置、画像解析方法およびプログラム |
JP2018022360A (ja) | 2016-08-04 | 2018-02-08 | 株式会社リコー | 画像解析装置、画像解析方法およびプログラム |
-
2018
- 2018-06-22 JP JP2018119299A patent/JP7031511B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016103089A (ja) | 2014-11-27 | 2016-06-02 | 株式会社リコー | 情報処理装置、信号処理方法、プログラム |
JP2017207960A (ja) | 2016-05-19 | 2017-11-24 | 株式会社リコー | 画像解析装置、画像解析方法およびプログラム |
JP2018022360A (ja) | 2016-08-04 | 2018-02-08 | 株式会社リコー | 画像解析装置、画像解析方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2019220114A (ja) | 2019-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Nonlocal tensor-ring decomposition for hyperspectral image denoising | |
US11354537B2 (en) | Image processing apparatus, imaging apparatus, image processing method, and storage medium | |
JP5294343B2 (ja) | 画像位置合わせ処理装置、領域拡張処理装置及び画質改善処理装置 | |
US7558709B2 (en) | Methods and apparatus for computing the input and output signals of a linear shift-variant system | |
Liu et al. | Hierarchical back projection network for image super-resolution | |
Zhang et al. | Two-direction nonlocal model for image denoising | |
Qi et al. | Multi-dimensional sparse models | |
Lefkimmiatis et al. | Nonlocal structure tensor functionals for image regularization | |
Kerola et al. | Spectral graph skeletons for 3D action recognition | |
US20120182442A1 (en) | Hardware generation of image descriptors | |
US20200293857A1 (en) | Cnn processing device, cnn processing method, and program | |
CN110458788A (zh) | 单应性校正 | |
CN114641790A (zh) | 红外图像的超分辨率的处理方法及系统 | |
Armando et al. | Mesh denoising with facet graph convolutions | |
Hlavac | Fundamentals of Image Processing | |
JPH04299469A (ja) | 画像内の物体の認識法および一連の画像内の物体のトラッキングへの応用 | |
JP7031511B2 (ja) | 信号処理装置、畳み込みニューラルネットワーク、信号処理方法及び信号処理プログラム | |
Xie et al. | Color and direction-invariant nonlocal self-similarity prior and its application to color image denoising | |
Ji et al. | Wavelet frame based scene reconstruction from range data | |
Clark et al. | Texture Deconvolution for the Fourier-Based Analysis of Non-Rectangular Regions. | |
Stork | Toward a signal-processing foundation for computational sensing and imaging: electro-optical basis and merit functions | |
Kiani et al. | Solving robust regularization problems using iteratively re-weighted least squares | |
CN112862718A (zh) | 一种基于功率谱密度约束的模式分解滤波方法 | |
US8953875B2 (en) | Multiscale modulus filter bank and applications to pattern detection, clustering, classification and registration | |
Bhayani et al. | Sparse Resultant-Based Minimal Solvers in Computer Vision and Their Connection with the Action Matrix |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220207 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7031511 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |