KR102388760B1 - Image convolution method in hyperbolic space - Google Patents

Image convolution method in hyperbolic space Download PDF

Info

Publication number
KR102388760B1
KR102388760B1 KR1020210096529A KR20210096529A KR102388760B1 KR 102388760 B1 KR102388760 B1 KR 102388760B1 KR 1020210096529 A KR1020210096529 A KR 1020210096529A KR 20210096529 A KR20210096529 A KR 20210096529A KR 102388760 B1 KR102388760 B1 KR 102388760B1
Authority
KR
South Korea
Prior art keywords
hyperbolic
feature vector
hierarchical
space
image
Prior art date
Application number
KR1020210096529A
Other languages
Korean (ko)
Inventor
전해곤
박진휘
배인환
Original Assignee
광주과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광주과학기술원 filed Critical 광주과학기술원
Priority to KR1020210096529A priority Critical patent/KR102388760B1/en
Application granted granted Critical
Publication of KR102388760B1 publication Critical patent/KR102388760B1/en
Priority to US17/813,963 priority patent/US20230043037A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • G06F17/153Multidimensional correlation or convolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)

Abstract

The present invention relates to a method for performing an image convolution in consideration of a hierarchical relationship between hyperbolic feature vectors in a hyperbolic space. The image convolution method in the hyperbolic space according to one embodiment of the present invention comprises: a step of embedding an image feature vector in a Euclidean space into a hyperbolic feature vector in a hyperbolic space; a step of allocating a hierarchical weight for the hyperbolic feature vector based on a hierarchical property of the hyperbolic feature vector; and a step of performing convolution of the hyperbolic feature vector by applying the hierarchical weight. Therefore, the present invention is capable of greatly improving a learning accuracy.

Description

쌍곡 공간에서의 이미지 컨볼루션 방법{IMAGE CONVOLUTION METHOD IN HYPERBOLIC SPACE}IMAGE CONVOLUTION METHOD IN HYPERBOLIC SPACE

본 발명은 쌍곡 공간 내에서 쌍곡 특징 벡터의 계층적 관계를 고려하여 이미지 컨볼루션을 수행하는 방법에 관한 것이다.The present invention relates to a method for performing image convolution in consideration of the hierarchical relationship of hyperbolic feature vectors in a hyperbolic space.

최근 컨볼루션 신경망(Convolutional Neural Network; CNN)을 이용한 딥 러닝 분야에서, 계층적 관계를 효과적으로 형성할 수 있음을 이유로 쌍곡 공간(hyperbolic space)에서의 데이터 학습 방법이 조명되고 있다.Recently, in the field of deep learning using a convolutional neural network (CNN), a data learning method in a hyperbolic space has been highlighted because it can effectively form a hierarchical relationship.

특히, 데이터간의 관계성을 나타낼 수 있는 그래프 구조 데이터(Graph-Structured Data)에 대한 딥러닝의 필요성이 대두되면서, 계층적 관계를 고려한 데이터 학습 방법은 AI분야의 폭발적 성장에 발맞추는 핵심 연구분야로 떠오르고 있다.In particular, as the need for deep learning for graph-structured data that can represent relationships between data emerges, data learning methods that consider hierarchical relationships have become a key research field to keep pace with the explosive growth of the AI field. is rising

그러나 지금까지 연구된 쌍곡 공간에서의 데이터 학습 방법은, 지식 그래프(knowledge graph)나 동의어 계층(synonym hierarchy)과 같이 데이터 자체가 계층적 구조를 갖도록 설계된 분야에만 적용될 수 있다는 한계가 있어 컴퓨터 비전 분야에서 활용성이 낮은 문제점이 있었다.However, the data learning method in the hyperbolic space studied so far has limitations in that it can be applied only to fields where data itself is designed to have a hierarchical structure, such as a knowledge graph or a synonym hierarchy. There was a problem of low usability.

본 발명은 쌍곡 공간 상에 임베딩된 쌍곡 특징 벡터의 계층적 관계를 고려하여 쌍곡 특징 벡터를 구성하는 각 픽셀에 중요도를 할당할 수 있는 이미지 컨볼루션 방법을 제공하는 것을 목적으로 한다.An object of the present invention is to provide an image convolution method capable of assigning importance to each pixel constituting a hyperbolic feature vector in consideration of a hierarchical relationship between a hyperbolic feature vector embedded in a hyperbolic space.

본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.The objects of the present invention are not limited to the above-mentioned objects, and other objects and advantages of the present invention not mentioned may be understood by the following description, and will be more clearly understood by the examples of the present invention. It will also be readily apparent that the objects and advantages of the present invention may be realized by the means and combinations thereof indicated in the appended claims.

본 발명의 일 실시예에 따른 쌍곡 공간에서의 컨볼루션 방법은 유클리디언 공간 상의 이미지 특징 벡터를 쌍곡 공간 상의 쌍곡 특징 벡터로 임베딩하는 단계, 상기 쌍곡 특징 벡터의 계층적 속성에 기초하여 상기 쌍곡 특징 벡터에 대한 계층적 가중치를 할당하는 단계 및 상기 계층적 가중치를 적용하여 상기 쌍곡 특징 벡터를 컨볼루션하는 단계를 포함하는 것을 특징으로 한다.A convolution method in a hyperbolic space according to an embodiment of the present invention comprises the steps of embedding an image feature vector in Euclidean space into a hyperbolic feature vector in hyperbolic space, and the hyperbolic feature based on a hierarchical property of the hyperbolic feature vector. Allocating a hierarchical weight to a vector and applying the hierarchical weight to convolute the hyperbolic feature vector.

일 실시예에서, 상기 임베딩하는 단계는 매핑함수를 통해 상기 이미지 특징 벡터를 구성하는 각 픽셀을 상기 쌍곡 공간 상에 임베딩하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, the embedding comprises embedding each pixel constituting the image feature vector in the hyperbolic space through a mapping function.

일 실시예에서, 상기 임베딩하는 단계는 상기 유클리디언 공간과 푸앵카레 공(Poincare ball)을 연결하는 일대일 대응 함수를 통해 상기 이미지 특징 벡터를 상기 푸앵카레 공 상의 쌍곡 특징 벡터로 임베딩하는 단계를 포함하는 것을 특징으로 한다.In one embodiment, the embedding comprises embedding the image feature vector into a hyperbolic feature vector on the Poincare ball through a one-to-one correspondence function connecting the Euclidean space and a Poincare ball. characterized.

일 실시예에서, 상기 계층적 가중치를 할당하는 단계는 상기 쌍곡 특징 벡터의 지오데식 거리에 기초하여 계층적 가중치를 할당하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, the assigning the hierarchical weights comprises assigning the hierarchical weights based on a geodesic distance of the hyperbolic feature vector.

일 실시예에서, 상기 계층적 가중치를 할당하는 단계는 상기 쌍곡 특징 벡터의 지오데식 거리에 반비례하는 계층적 가중치를 할당하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, the assigning the hierarchical weights comprises assigning the hierarchical weights inversely proportional to the geodesic distance of the hyperbolic feature vector.

일 실시예에서, 상기 계층적 가중치를 할당하는 단계는 상기 쌍곡 특징 벡터를 구성하는 기준 픽셀과 나머지 픽셀간의 거리에 기초하여 계층적 가중치를 할당하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, allocating the hierarchical weights may include allocating the hierarchical weights based on a distance between a reference pixel constituting the hyperbolic feature vector and the remaining pixels.

일 실시예에서, 상기 계층적 가중치를 할당하는 단계는 상기 계층적 가중치로 구성된 계층적 가중치 벡터를 생성하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, allocating the hierarchical weights may include generating a hierarchical weight vector composed of the hierarchical weights.

일 실시예에서, 상기 계층적 가중치를 할당하는 단계는 상기 계층적 가중치에 따라 상기 쌍곡 특징 벡터를 재배치하는 단계와, 상기 재배치 순서에 따라 상기 계층적 가중치를 배열하여 계층적 가중치 벡터를 생성하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, the allocating the hierarchical weights comprises: rearranging the hyperbolic feature vector according to the hierarchical weights; arranging the hierarchical weights according to the rearrangement order to generate a hierarchical weight vector; It is characterized in that it includes.

일 실시예에서, 상기 계층적 가중치를 할당하는 단계는 상기 계층적 가중치의 크기 순서대로 상기 쌍곡 특징 벡터를 재배치하는 단계와, 상기 계층적 가중치의 크기 순서대로 배열된 계층적 가중치 벡터를 생성하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, the allocating the hierarchical weights includes: rearranging the hyperbolic feature vector in an order of magnitude of the hierarchical weights; generating a hierarchical weight vector arranged in an order of magnitude of the hierarchical weights; It is characterized in that it includes.

일 실시예에서, 상기 컨볼루션하는 단계는 상기 계층적 가중치로 구성된 계층적 가중치 벡터와 상기 쌍곡 특징 벡터를 곱하는 단계와, 상기 계층적 가중치 벡터가 곱해진 쌍곡 특징 벡터를 컨볼루션하는 단계를 포함하는 것을 특징으로 한다.In an embodiment, the convolution includes multiplying a hierarchical weight vector composed of the hierarchical weights by the hyperbolic feature vector, and convolving the hyperbolic feature vector multiplied by the hierarchical weight vector. characterized in that

본 발명은 쌍곡 특징 벡터를 구성하는 각 픽셀에 계층적 가중치를 할당함으로써, 딥러닝을 수행함에 있어 어피니티가 높은 픽셀에 중요도를 부여할 수 있다. 이에 따라, 공간 전파 신경망의 학습 효과 및 학습 효율성을 증대시킬 수 있을 뿐만 아니라 딥러닝에 이용되는 러너블 파라미터에 대한 학습 정확도를 크게 향상시킬 수 있다. In the present invention, by assigning a hierarchical weight to each pixel constituting a hyperbolic feature vector, it is possible to give importance to a pixel having a high affinity in performing deep learning. Accordingly, it is possible not only to increase the learning effect and learning efficiency of the spatial propagation neural network, but also to significantly improve the learning accuracy for the runner parameters used in deep learning.

또한, 본 발명은 쌍곡 특징 벡터에 가중치를 할당함에 있어서 쌍곡 특징 벡터를 중요도에 따라 재배치할 수 있다. 이에 따라, 쌍곡 특징 벡터 내 픽셀의 배치가 경향성을 가질 수 있고, 이를 컨볼루션 신경망에 적용하는 경우, 학습 일관성, 학습 정확도가 향상되어 강인한 모델을 구축할 수 있다.In addition, the present invention can rearrange the hyperbolic feature vector according to importance in assigning a weight to the hyperbolic feature vector. Accordingly, the arrangement of pixels in the hyperbolic feature vector may have a tendency, and when this is applied to a convolutional neural network, learning consistency and learning accuracy are improved, and a robust model can be built.

상술한 효과와 더불어 본 발명의 구체적인 효과는 이하 발명을 실시하기 위한 구체적인 사항을 설명하면서 함께 기술한다.In addition to the above-described effects, the specific effects of the present invention will be described together while describing specific details for carrying out the invention below.

도 1은 본 발명의 이미지 컨볼루션 방법을 개략적으로 도시한 순서도.
도 2는 유클리디언 공간 상의 두 벡터가 쌍곡 공간 상에 임베딩되는 모습을 도시한 도면.
도 3은 유클리디언 공간 상의 두 벡터가 푸앵카레 공에 임베딩되는 모습을 도시한 도면.
도 4는 쌍곡 공간 상에서 지오데식 거리를 설명하기 위한 도면.
도 5는 본 발명의 일 실시예에 따른 쌍곡 공간에서의 이미지 컨볼루션 방법을 도시한 순서도.
도 6은 본 발명의 다른 실시예에 따른 쌍곡 공간에서의 이미지 컨볼루션 방법을 도시한 순서도.
도 7은 본 발명과 종래 기술의 이미지 재현 정확도를 비교하기 위한 도면.
1 is a flowchart schematically illustrating an image convolution method of the present invention;
2 is a diagram illustrating a state in which two vectors in a Euclidean space are embedded in a hyperbolic space.
3 is a diagram illustrating a state in which two vectors on a Euclidean space are embedded in a Poincare ball.
4 is a diagram for explaining a geodesic distance in a hyperbolic space.
5 is a flowchart illustrating an image convolution method in a hyperbolic space according to an embodiment of the present invention.
6 is a flowchart illustrating an image convolution method in a hyperbolic space according to another embodiment of the present invention.
7 is a diagram for comparing the image reproduction accuracy of the present invention and the prior art.

전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다. 도면에서 동일한 참조부호는 동일 또는 유사한 구성요소를 가리키는 것으로 사용된다.The above-described objects, features and advantages will be described below in detail with reference to the accompanying drawings, and accordingly, those of ordinary skill in the art to which the present invention pertains will be able to easily implement the technical idea of the present invention. In describing the present invention, if it is determined that a detailed description of a known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description will be omitted. Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the accompanying drawings. In the drawings, the same reference numerals are used to indicate the same or similar components.

본 명세서에서 "상부 (또는 하부)" 또는 구성요소의 "상 (또는 하)"에 임의의 구성이 배치된다는 것은, 임의의 구성이 상기 구성요소의 상면 (또는 하면)에 접하여 배치되는 것뿐만 아니라, 상기 구성요소와 상기 구성요소 상에 (또는 하에) 배치된 임의의 구성 사이에 다른 구성이 개재될 수 있음을 의미할 수 있다.In the present specification, “upper (or lower)” or “above (or lower)” of a component means that any component is disposed in contact with the upper surface (or lower surface) of the component, as well as that any component is disposed in contact with the component. , may mean that another component may be interposed between the component and any component disposed on (or under) the component.

또한, 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서 상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.Also, as used herein, the singular expression includes the plural expression unless the context clearly dictates otherwise. In the present application, terms such as “consisting of” or “comprising” should not be construed as necessarily including all of the various components or various steps described in the specification, some of which components or some steps are It should be construed that it may not include, or may further include additional components or steps.

또한, 본 명세서에서, "A 및/또는 B" 라고 할 때, 이는 특별한 반대되는 기재가 없는 한, A, B 또는 A 및 B 를 의미하며, "C 내지 D" 라고 할 때, 이는 특별한 반대되는 기재가 없는 한, C 이상이고 D 이하인 것을 의미한다.In addition, in this specification, when "A and / or B" is said, unless otherwise stated, it means A, B or A and B, and when said "C to D", it is Unless otherwise specified, it means C or more and D or less.

본 발명은 쌍곡 공간 내에서 쌍곡 특징 벡터간의 계층적 관계를 고려하여 이미지 컨볼루션을 수행하는 방법에 관한 것이다. 보다 구체적으로, 본 발명은 공간 전파(spatial propagation)를 이용하는 신경망(neural network)에 적용되는 방법으로서, 희소 입력(sparse input)을 공간 전파하여 밀집 출력(dense output)을 생성하는데 이용될 수 있다.The present invention relates to a method of performing image convolution in consideration of a hierarchical relationship between hyperbolic feature vectors in a hyperbolic space. More specifically, the present invention is a method applied to a neural network using spatial propagation, and may be used to spatially propagate a sparse input to generate a dense output.

이하, 도 1 내지 도 7을 참조하여 본 발명의 이미지 컨볼루션 방법에 대해 구체적으로 설명하도록 한다.Hereinafter, the image convolution method of the present invention will be described in detail with reference to FIGS. 1 to 7 .

도 1은 본 발명의 이미지 컨볼루션 방법을 개략적으로 도시한 순서도이다.1 is a flowchart schematically illustrating an image convolution method of the present invention.

도 2는 유클리디언 공간 상의 두 벡터가 쌍곡 공간 상에 임베딩되는 모습을 도시한 도면이고, 도 3은 유클리디언 공간 상의 두 벡터가 푸앵카레 공에 임베딩되는 모습을 도시한 도면이다.2 is a diagram illustrating a state in which two vectors in the Euclidean space are embedded in a hyperbolic space, and FIG. 3 is a diagram illustrating a state in which two vectors in the Euclidean space are embedded in a Poincare ball.

도 4는 쌍곡 공간 상에서 지오데식 거리를 설명하기 위한 도면이다.4 is a diagram for explaining a geodesic distance in a hyperbolic space.

도 5는 본 발명의 일 실시예에 따른 쌍곡 공간에서의 이미지 컨볼루션 방법을 도시한 순서도이고, 도 6은 본 발명의 다른 실시예에 따른 쌍곡 공간에서의 이미지 컨볼루션 방법을 도시한 순서도이다.5 is a flowchart illustrating an image convolution method in a hyperbolic space according to an embodiment of the present invention, and FIG. 6 is a flowchart illustrating an image convolution method in a hyperbolic space according to another embodiment of the present invention.

도 7은 본 발명과 종래 기술의 이미지 재현 정확도를 비교하기 위한 도면이다.7 is a diagram for comparing the image reproduction accuracy of the present invention and the prior art.

도 1을 참조하면, 후술되는 쌍곡 공간에서의 이미지 컨볼루션 방법은, 유클리디언 공간(Euclidean space) 상의 이미지 특징 벡터(image feature vector)를 쌍곡 공간(Hyperbolic space) 상의 쌍곡 특징 벡터(hyperbolic feature vector)로 임베딩(embedding)하는 단계를 포함할 수 있다(S110).Referring to FIG. 1 , an image convolution method in a hyperbolic space, which will be described later, converts an image feature vector on an Euclidean space to a hyperbolic feature vector on a hyperbolic space. ) may include the step of embedding (S110).

또한, 이미지 컨볼루션 방법은 쌍곡 특징 벡터의 계층적 속성(hierarchical property)에 기초하여 쌍곡 특징 벡터에 대한 계층적 가중치(hierarchical weight)를 할당하는 단계를 포함할 수 있다(S120). 또한, 이미지 컨볼루션 방법은 앞서 할당된 계층적 가중치를 적용하여 쌍곡 특징 벡터를 컨볼루션하는 단계를 포함할 수 있다(S130).In addition, the image convolution method may include allocating a hierarchical weight to the hyperbolic feature vector based on a hierarchical property of the hyperbolic feature vector ( S120 ). In addition, the image convolution method may include the step of convolving the hyperbolic feature vector by applying the previously assigned hierarchical weight ( S130 ).

앞서 기술된 각 단계(S110 내지 S130)는 프로그래밍되어 소프트웨어를 통해 구현될 수도 있고, GPU(Graphic Processing Unit), CPU(Central Processing Unit) 등의 처리장치를 포함한 하드웨어를 통해 구현될 수도 있다. 이하에서는, 설명의 편의를 위해 발명을 이루는 각 단계(S110 내지 S130)가 컨볼루션 모듈에 의해 수행되는 것으로 가정하여 설명하도록 한다.Each of the steps S110 to S130 described above may be programmed and implemented through software, or may be implemented through hardware including a processing unit such as a GPU (Graphic Processing Unit) and CPU (Central Processing Unit). Hereinafter, for convenience of description, it is assumed that each step (S110 to S130) of the invention is performed by a convolution module.

이하에서는 도 1에 도시된 각 단계에 대해 구체적으로 설명하도록 한다.Hereinafter, each step shown in FIG. 1 will be described in detail.

컨볼루션 모듈은 유클리디언 공간 상의 이미지 특징 벡터를 입력받아 쌍곡 공간 상에 임베딩할 수 있다(S110). 보다 구체적으로, 컨볼루션 모듈은 유클리디언 공간 상에 위치한 이미지 특징 벡터를 쌍곡 공간 상에 위치한 쌍곡 특징 벡터로 변환할 수 있다.The convolution module may receive the image feature vector in the Euclidean space and embed it in the hyperbolic space (S110). More specifically, the convolution module may convert an image feature vector located on the Euclidean space into a hyperbolic feature vector located on the hyperbolic space.

쌍곡 공간은 비-유클리디언(non-euclidean) 공간으로서, 공간 상의 모든 점에서 균일한 음의 곡률을 갖는 동차 공간(homogeneous space)일 수 있다. 쌍곡 공간은 형상화하기 어려운 다차원의 벡터를 포함할 수 있다.The hyperbolic space is a non-euclidean space, and may be a homogeneous space having a uniform negative curvature at all points in the space. A hyperbolic space may contain multidimensional vectors that are difficult to shape.

이하의 도면에서는 쌍곡 공간을 형상화 하기 위해 쌍곡 공간이 3차원으로 표현되는 것으로 가정한다. 다만, 전술한 바와 같이 쌍곡 공간은 4차원 이상의 다차원 벡터를 포함할 수 있다.In the following drawings, it is assumed that the hyperbolic space is expressed in three dimensions in order to shape the hyperbolic space. However, as described above, the hyperbolic space may include a multidimensional vector of four or more dimensions.

도 2를 참조하면, 컨볼루션 모듈은 2차원의 유클리디언 공간에 위치한 두 이미지 특징 벡터(F1, F2)를 쌍곡 공간에 위치한 두 쌍곡 특징 벡터(H1, H2)로 임베딩할 수 있다. 이를 위해, 컨볼루션 모듈은 매핑함수(mapping function, M)를 이용할 수 있다.Referring to FIG. 2 , the convolution module can embed two image feature vectors (F 1 , F 2 ) located in a two-dimensional Euclidean space into two hyperbolic feature vectors (H 1 , H 2 ) located in a hyperbolic space. there is. To this end, the convolution module may use a mapping function (M).

매핑함수(M)는 유클리디언 공간을 쌍곡 공간으로 매핑하거나 쌍곡 공간을 유클리디언 공간으로 매핑하기 위한 일대일 대응함수일 수 있다. 예컨대, 매핑함수(M)는 선형 함수(linear function)로 정의될 수 있고, 이 때 선형 함수를 구성하는 각 계수는 러너블 파라미터(learnable parameter)일 수 있다.The mapping function M may be a one-to-one correspondence function for mapping the Euclidean space to the hyperbolic space or for mapping the hyperbolic space to the Euclidean space. For example, the mapping function M may be defined as a linear function, and in this case, each coefficient constituting the linear function may be a learnable parameter.

한편, 도 3을 참조하면, 전술한 쌍곡 공간은 푸앵카레 공(Poincar

Figure 112021084948808-pat00001
ball)으로 모델링될 수 있다. 이 때, 컨볼루션 모듈은 유클리디언 공간과 푸앵카레 공을 연결하는 매핑함수(M), 구체적으로 일대일 대응함수를 통해 두 이미지 특징 벡터(F1, F2)를 푸앵카레 공 상의 쌍곡 특징 벡터(H1, H2)에 임베딩할 수 있다. 여기에서도 매핑함수(M)는 선형 함수로 정의될 수 있고, 이 때 선형 함수를 구성하는 각 계수는 러너블 파라미터일 수 있다.Meanwhile, referring to FIG. 3 , the aforementioned hyperbolic space is a Poincaré ball (Poincar
Figure 112021084948808-pat00001
ball) can be modeled. At this time, the convolution module converts the two image feature vectors (F 1 , F 2 ) to the hyperbolic feature vector (H 1 , H 2 ) can be embedded. Here again, the mapping function M may be defined as a linear function, and in this case, each coefficient constituting the linear function may be a runnerable parameter.

한편, 매핑함수(M)를 구성하는 곱 연산과 합 연산은 쌍곡 공간 상에서 수행되므로 뫼비우스(

Figure 112021084948808-pat00002
) 합 연산 및 곱 연산이 이용될 수 있다. 보다 구체적으로, 뫼비우스 곱 연산은 하기 [수학식 1]과 같이 표현될 수 있고, 뫼비우스 합 연산은 하기 [수학식 2]와 같이 표현될 수 있다.On the other hand, since the multiplication and sum operations constituting the mapping function (M) are performed in hyperbolic space, the Möbius (
Figure 112021084948808-pat00002
) sum operation and multiplication operation may be used. More specifically, the Möbius product operation may be expressed as in [Equation 1], and the Möbius sum operation may be expressed as [Equation 2] below.

Figure 112021084948808-pat00003
Figure 112021084948808-pat00003

(M 은 매트릭스(matrix), u는 벡터, k는 푸앵카레 공의 곡률(curvature),

Figure 112021084948808-pat00004
는 유클리디언 놈(norm))(M is the matrix, u is the vector, k is the curvature of the Poincare ball,
Figure 112021084948808-pat00004
is the Euclidean norm)

Figure 112021084948808-pat00005
Figure 112021084948808-pat00005

(u, v는 벡터, k는 푸앵카레 공의 곡률,

Figure 112021084948808-pat00006
는 유클리디언 내적(inner product))(u, v are vectors, k is the curvature of the Poincare ball,
Figure 112021084948808-pat00006
is the Euclidean inner product)

전술한 바와 같이 임베딩이 완료되면 컨볼루션 모듈은 쌍곡 특징 벡터의 계층적 속성에 기초하여 쌍곡 특징 벡터에 대한 계층적 가중치를 할당할 수 있다(S120).As described above, when embedding is completed, the convolution module may allocate a hierarchical weight to the hyperbolic feature vector based on the hierarchical property of the hyperbolic feature vector (S120).

여기서 계층적 속성은 쌍곡 특징 벡터간의 유사성(similarity) 및/또는 어피니티(affinity)에 관한 속성이다. 보다 구체적으로, 계층적 속성은 쌍곡 공간 상의 벡터가 갖는 유사성 및/또는 어피니티에 관한 임의의 값(value)이나 정도(degree)를 나타내는 임의의 파라미터를 포함할 수 있다.Here, the hierarchical property is a property related to similarity and/or affinity between hyperbolic feature vectors. More specifically, the hierarchical attribute may include any parameter indicating an arbitrary value or degree regarding the similarity and/or affinity of vectors in the hyperbolic space.

단계(S110)에서 설명한 매핑함수(M)는, 이미지 특징 벡터가 유클리디언 공간 상에서 규칙적인 격자(regular grid) 상에 배치되는 것과 같이 쌍곡 특징 벡터가 쌍곡 공간 상에서 균일하게 분산되는 것을 전제한다. 다만, 쌍곡 특징 벡터는 데이터 시각화를 위한 차원 축소를 통해 매니폴드(manifold) 공간으로 투영되므로 전술한 전제가 만족되지 않을 수 있다. 이에 따라, 추가적인 데이터 가공 없이 쌍곡 특징 벡터를 컨볼루션하는 경우 비-유클리디언 공간 특성을 충실히 반영하지 못하는 문제가 있다.The mapping function M described in step S110 assumes that the hyperbolic feature vectors are uniformly distributed in the hyperbolic space just as the image feature vectors are arranged on a regular grid in the Euclidean space. However, since the hyperbolic feature vector is projected into a manifold space through dimensionality reduction for data visualization, the above premise may not be satisfied. Accordingly, when a hyperbolic feature vector is convolved without additional data processing, there is a problem in that non-Euclidean spatial characteristics cannot be faithfully reflected.

이러한 문제점을 완화시키기 위해, 컨볼루션 모듈은 쌍곡 특징 벡터의 지오데식(geodesic) 거리에 기초하여 각 쌍곡 특징 벡터에 계층적 가중치를 할당할 수 있다.To alleviate this problem, the convolution module may assign a hierarchical weight to each hyperbolic feature vector based on the geodesic distance of the hyperbolic feature vector.

도 4를 참조하면, 쌍곡 공간에서의 지오데식 거리는 유클리디언 공간에서의 유클리디언 거리와 다를 수 있다. 유클리디언 거리는 두 픽셀(H(x1, y1), H(x2, y2))사이의 직선 거리를 의미하는 반면, 지오데식 거리는 쌍곡면의 표면을 지나는 곡선 거리를 의미할 수 있다.Referring to FIG. 4 , the geodesic distance in the hyperbolic space may be different from the Euclidean distance in the Euclidean space. Euclidean distance means a straight line distance between two pixels (H(x 1 , y 1 ), H(x 2 , y 2 )), whereas geodesic distance can mean a curved distance through the surface of a hyperbolic surface. .

컨볼루션 모듈은 쌍곡 공간상에 임베딩된 쌍곡 특징 벡터, 구체적으로 쌍곡 특징 벡터를 구성하는 각 픽셀 간의 지오데식 거리를 산출할 수 있고, 산출된 거리에 따라 계층적 가중치를 할당할 수 있다.The convolution module may calculate a hyperbolic feature vector embedded in a hyperbolic space, specifically, a geodesic distance between pixels constituting the hyperbolic feature vector, and may assign a hierarchical weight according to the calculated distance.

도 5를 예로 들어 설명하면, 유클리디언 공간 상의 이미지 특징 벡터는 매핑함수(M)에 의해 푸앵카르 공 상의 쌍곡 특징 벡터(

Figure 112021084948808-pat00007
)로 임베딩될 수 있다. 이에 따라, 인접 픽셀과의 거리가 정규화되어 있던 이미지 특징 벡터는, 인접 픽셀과의 거리가 각기 다른 쌍곡 특징 벡터(
Figure 112021084948808-pat00008
)로 매핑될 수 있다.Taking Fig. 5 as an example, the image feature vector on the Euclidean space is converted to the hyperbolic feature vector on the Poincar ball by the mapping function (M).
Figure 112021084948808-pat00007
) can be embedded. Accordingly, the image feature vector in which the distance to the adjacent pixel is normalized is a hyperbolic feature vector (
Figure 112021084948808-pat00008
) can be mapped to

컨볼루션 모듈은 쌍곡 특징 벡터(

Figure 112021084948808-pat00009
) 내의 각 픽셀간의 지오데식 거리를 산출하고, 산출된 거리에 기초하여 각 픽셀에 계층적 가중치를 할당할 수 있다.The convolution module is a hyperbolic feature vector (
Figure 112021084948808-pat00009
) may be calculated, and a hierarchical weight may be assigned to each pixel based on the calculated distance.

지오데식 거리는 하기 [수학식 3]에 따라 산출될 수 있다.The geodesic distance may be calculated according to Equation 3 below.

Figure 112021084948808-pat00010
Figure 112021084948808-pat00010

(dk는 지오데식 거리, u, v는 푸앵카레 공 상의 두 점, k는 푸앵카레 공의 곡률,

Figure 112021084948808-pat00011
는 유클리디언 놈)(d k is the geodesic distance, u and v are two points on the Poincare ball, k is the curvature of the Poincare ball,
Figure 112021084948808-pat00011
is a Euclidian

쌍곡 공간에서 쌍곡 특징 벡터간의 지오데식 거리가 가까울수록 각 픽셀간의 어피니티(affinity)가 높을 수 있다. 공간 전파를 이용하는 신경망에서는 이러한 어피니티를 고려하여 신경망 학습을 수행할 수 있다.The closer the geodesic distance between hyperbolic feature vectors in the hyperbolic space is, the higher the affinity between each pixel may be. In a neural network using spatial propagation, neural network learning can be performed in consideration of such affinity.

본 발명의 컨볼루션 모듈은 공간 전파 신경망(Spatial Propagation Neural Network; SPN)의 학습 효율성을 향상시키기 위해서 어피니티가 높은 픽셀에 더 높은 중요도를 부여할 수 있다. 이를 위해, 컨볼루션 모듈은 쌍곡 특징 벡터(

Figure 112021084948808-pat00012
) 간의 지오데식 거리에 반비례하는 계층적 가중치를 할당할 수 있다. 이 때, 계층적 가중치는 지오데식 거리에 반비례하도록 정규화(normalize)될 수 있다.The convolution module of the present invention may give higher importance to pixels having high affinity in order to improve the learning efficiency of a spatial propagation neural network (SPN). To this end, the convolution module uses a hyperbolic feature vector (
Figure 112021084948808-pat00012
) can be assigned a hierarchical weight that is inversely proportional to the geodesic distance between them. In this case, the hierarchical weight may be normalized to be inversely proportional to the geodesic distance.

이하에서는 도 5를 참조하여 쌍곡 특징 벡터(

Figure 112021084948808-pat00013
)에 계층적 가중치를 할당하는 단계(S120)를 구체적으로 설명하도록 한다.Hereinafter, with reference to FIG. 5, a hyperbolic feature vector (
Figure 112021084948808-pat00013
) of allocating hierarchical weights ( S120 ) will be described in detail.

컨볼루션 모듈은 쌍곡 특징 벡터(

Figure 112021084948808-pat00014
)를 구성하는 기준 픽셀(rf)와 나머지 픽셀(nf)간의 거리에 기초하여 계층적 가중치를 할당할 수 있다. 예컨대, 컨볼루션 모듈은 도 5에 도시된 붉은색 픽셀을 기준 픽셀(rf)로 설정할 수 있고, 기준 픽셀(rf)와 나머지 픽셀(nf)간의 거리를 산출할 수 있다.The convolution module is a hyperbolic feature vector (
Figure 112021084948808-pat00014
), a hierarchical weight may be assigned based on the distance between the reference pixel rf and the remaining pixels nf. For example, the convolution module may set the red pixel shown in FIG. 5 as the reference pixel rf, and may calculate a distance between the reference pixel rf and the remaining pixels nf.

푸앵카레 공에 임베딩된 픽셀의 위치를 참고하면, 붉은색 기준 픽셀(rf)와 초록색 픽셀(nf1)간의 지오데식 거리가 가장 짧을 수 있고, 붉은색 기준 픽셀(rf)와 오렌지색 픽셀(nf2)간의 지오데식 거리가 가장 길 수 있다.Referring to the position of the pixel embedded in the Poincare ball, the geodesic distance between the red reference pixel (rf) and the green pixel (nf1) may be the shortest, and the geodesic distance between the red reference pixel (rf) and the orange pixel (nf2) may be the shortest. The desicing distance may be the longest.

붉은색 기준 픽셀(rf)는 자신과의 지오데식 거리가 0이므로, 컨볼루션 모듈은 붉은색 기준 픽셀(rf)에 대한 계층적 가중치를 최대값으로 설정할 수 있고, 초록색 픽셀(nf1)과의 거리가 오렌지색 픽셀(nf2)과의 거리보다 가까우므로 초록색 픽셀(nf1)에 대한 계층적 가중치를 오랜지색 픽셀(nf2)에 대한 계층적 가중치보다 높게 설정할 수 있다.Since the red reference pixel (rf) has a geodesic distance of 0, the convolution module can set the hierarchical weight for the red reference pixel (rf) to the maximum value, and the distance from the green pixel (nf1) Since is closer than the distance to the orange pixel nf2, the hierarchical weight of the green pixel nf1 may be set higher than the hierarchical weight of the orange pixel nf2.

컨볼루션 모듈은 각 픽셀에 대한 계층적 가중치로 구성된 계층적 가중치 벡터(

Figure 112021084948808-pat00015
)를 생성할 수 있다.The convolution module constructs a hierarchical weight vector (
Figure 112021084948808-pat00015
) can be created.

다시 도 5를 참조하여 계층적 가중치 벡터(

Figure 112021084948808-pat00016
)를 생성하는 방법에 대해 설명하도록 한다. 도 5에서는 설명의 편의를 위해 계층적 가중치의 크기를, 계층적 가중치의 크기에 비례하여 짙어지는 음영으로 표현하였다.Referring back to Fig. 5, the hierarchical weight vector (
Figure 112021084948808-pat00016
) to explain how to create it. In FIG. 5, for convenience of explanation, the size of the hierarchical weight is expressed as a shade that becomes darker in proportion to the size of the hierarchical weight.

컨볼루션 모듈은 쌍곡 특징 벡터(

Figure 112021084948808-pat00017
)와 크기(width, height)가 동일한 계층적 가중치 벡터(
Figure 112021084948808-pat00018
)를 생성할 수 있다. 예컨대, 도 5에 도시된 바와 같이 쌍곡 특징 벡터(
Figure 112021084948808-pat00019
)가 3 x 3 매트릭스 형태일 때, 계층적 가중치 벡터(
Figure 112021084948808-pat00020
) 역시 3 x 3 매트릭스 형태를 가질 수 있다. 이 때, 계층적 가중치 벡터(
Figure 112021084948808-pat00021
)는 쌍곡 특징 벡터(
Figure 112021084948808-pat00022
) 내 각 픽셀에 대한 계층적 가중치를 나타내는 픽셀 값으로 구성될 수 있다.The convolution module is a hyperbolic feature vector (
Figure 112021084948808-pat00017
) and a hierarchical weight vector (
Figure 112021084948808-pat00018
) can be created. For example, as shown in Fig. 5, the hyperbolic feature vector (
Figure 112021084948808-pat00019
) is in the form of a 3 x 3 matrix, the hierarchical weight vector (
Figure 112021084948808-pat00020
) may also have a 3 x 3 matrix form. In this case, the hierarchical weight vector (
Figure 112021084948808-pat00021
) is the hyperbolic feature vector (
Figure 112021084948808-pat00022
) may consist of a pixel value representing a hierarchical weight for each pixel in

앞서 설명한 바와 같이 붉은색 기준 픽셀(rf)(2행 2열)에 대한 계층적 가중치가 최대이므로 도 5에서 계층적 가중치 벡터(

Figure 112021084948808-pat00023
)의 2행 2열의 픽셀 값이 가장 높게 설정될 수 있다. 또한, 초록색 픽셀(nf1)(3행 2열)에 대한 계층적 가중치가 다음으로 높으므로 계층적 가중치 벡터(
Figure 112021084948808-pat00024
)의 3행 2열의 픽셀 값이 다음으로 높게 설정될 수 있다. 한편, 오렌지색 픽셀(nf2)(1행 3열)에 대한 계층적 가중치가 최소이므로 계층적 가중치 벡터(
Figure 112021084948808-pat00025
)의 1행 3열의 픽셀 값이 가장 낮게 설정될 수 있다.As described above, since the hierarchical weight for the red reference pixel rf (2 rows, 2 columns) is the maximum, in FIG.
Figure 112021084948808-pat00023
) may be set to the highest pixel value in row 2, column 2, and so on. Also, since the hierarchical weight for the green pixel (nf1) (3 rows, 2 columns) is the next highest,
Figure 112021084948808-pat00024
), the pixel value in row 3, column 2 may be set to the next highest value. On the other hand, since the hierarchical weight for the orange pixel (nf2) (1 row 3 column) is minimal,
Figure 112021084948808-pat00025
), a pixel value in row 1, column 3, and column 1 may be set to the lowest value.

전술한 바와 같이, 컨볼루션 모듈은 지오데식 거리에 기초하여 할당된 계층적 가중치를 이용하여 각 쌍곡 특징 벡터(

Figure 112021084948808-pat00026
)에 대응하는 계층적 가중치 벡터(
Figure 112021084948808-pat00027
)를 생성할 수 있다.As described above, the convolution module uses the hierarchical weights assigned based on the geodesic distance to calculate each hyperbolic feature vector (
Figure 112021084948808-pat00026
) corresponding to the hierarchical weight vector (
Figure 112021084948808-pat00027
) can be created.

본 발명은 전술한 방법으로 쌍곡 특징 벡터(

Figure 112021084948808-pat00028
)에 계층적 가중치를 할당함으로써 지오데식 거리가 가까운, 다시 말해, 어피니티가 높은 픽셀의 중요도를 더 높게 설정할 수 있다. 이에 따라, 본 발명에 의하면 공간 전파 신경망의 학습 효과 및 학습 효율성을 증대시킬 수 있을 뿐만 아니라 컨볼루션에 이용되는 필터 및/또는 커널(kernel)내 러너블 파라미터에 대한 학습 정확도 또한 크게 향상시킬 수 있다.The present invention is a hyperbolic feature vector (
Figure 112021084948808-pat00028
) by assigning a hierarchical weight, it is possible to set the importance of pixels having a close geodesic distance, that is, having a high affinity, to be higher. Accordingly, according to the present invention, it is possible to not only increase the learning effect and learning efficiency of the spatial propagation neural network, but also greatly improve the learning accuracy of the filter used for convolution and/or the runner parameter in the kernel. .

한편, 도 5를 참조하여 설명한 계층적 가중치 할당 방법에 의하면 계층적 가중치 벡터(

Figure 112021084948808-pat00029
) 내 각 픽셀 값들이 쌍곡 특징 벡터(
Figure 112021084948808-pat00030
)의 계층적 속성에 따라 무작위로(randomly) 배치될 수 있다. 구체적으로, 도 5에 도시된 것과는 달리 만약 붉은색 기준 픽셀(rf)와 초록색 픽셀(nf1)간의 지오데식 거리가 가장 멀다고 가정하면, 계층적 가중치 벡터(
Figure 112021084948808-pat00031
)의 3행 2열의 픽셀 값이 가장 낮게 설정될 수 있다. 이와 같은 계층적 가중치 벡터(
Figure 112021084948808-pat00032
)의 무작위성(randomness)에 의해 딥러닝의 학습 일관성이 다소 떨어질 수 있다는 한계가 있다.Meanwhile, according to the hierarchical weight allocation method described with reference to FIG. 5, the hierarchical weight vector (
Figure 112021084948808-pat00029
) is a hyperbolic feature vector (
Figure 112021084948808-pat00030
) may be randomly arranged according to the hierarchical property of . Specifically, unlike shown in FIG. 5, if it is assumed that the geodesic distance between the red reference pixel rf and the green pixel nf1 is the longest, the hierarchical weight vector (
Figure 112021084948808-pat00031
), the pixel value of 3 rows and 2 columns may be set to the lowest value. A hierarchical weight vector like this (
Figure 112021084948808-pat00032
), there is a limit that the learning consistency of deep learning may be somewhat lowered due to the randomness of it.

전술한 잠재적인 문제점까지 해결하기 위하여, 컨볼루션 모듈은 계층적 가중치에 따라 쌍곡 특징 벡터(

Figure 112021084948808-pat00033
)를 재배치할 수 있고(S121), 재배치 순서에 따라 계층적 가중치를 배열하여 계층적 가중치 벡터(
Figure 112021084948808-pat00034
)를 생성할 수 있다(S122).In order to solve the above-mentioned potential problems, the convolution module uses the hyperbolic feature vector (
Figure 112021084948808-pat00033
) can be rearranged (S121), and the hierarchical weight vector (
Figure 112021084948808-pat00034
) can be generated (S122).

이하에서는 도 6을 참조하여 계층적 가중치 벡터(

Figure 112021084948808-pat00035
)를 생성하는 또 다른 방법에 대해 설명하도록 한다. 도 6에서도 설명의 편의를 위해 계층적 가중치의 크기를, 계층적 가중치의 크기에 비례하여 짙어지는 음영으로 표현하였다.Hereinafter, with reference to FIG. 6, a hierarchical weight vector (
Figure 112021084948808-pat00035
), another way to create Also in FIG. 6, for convenience of explanation, the size of the hierarchical weight is expressed as a shade that becomes darker in proportion to the size of the hierarchical weight.

도 5를 참조하여 설명한 바와 같이, 컨볼루션 모듈은 쌍곡 특징 벡터(

Figure 112021084948808-pat00036
)를 구성하는 픽셀간의 계층적 속성, 예컨대 지오데식 거리에 기초하여 각 픽셀에 대한 계층적 가중치를 결정할 수 있다.As described with reference to FIG. 5, the convolution module is a hyperbolic feature vector (
Figure 112021084948808-pat00036
), a hierarchical weight for each pixel may be determined based on a hierarchical property between pixels constituting the pixel, for example, a geodesic distance.

이어서, 컨볼루션 모듈은 계층적 가중치의 크기 순서대로 쌍곡 특징 벡터(

Figure 112021084948808-pat00037
)를 재배치할 수 있다. 보다 구체적으로, 컨볼루션 모듈은 계층적 가중치가 큰 순서대로 또는 작은 순서대로 쌍곡 특징 벡터(
Figure 112021084948808-pat00038
) 내 픽셀의 위치를 재배치할 수 있다.Then, the convolution module constructs a hyperbolic feature vector (
Figure 112021084948808-pat00037
) can be rearranged. More specifically, the convolution module calculates hyperbolic feature vectors (
Figure 112021084948808-pat00038
) to reposition my pixels.

도 6을 참조하면, 앞서 푸앵카레 공 상의 지오데식 거리에 기초하여 붉은색 기준 픽셀(rf)에 대한 가중치는 가장 크게 설정될 수 있고, 초록색 픽셀(nf1)에 대한 가중치는 두번째로 크게 설정될 수 있다. 한편, 오렌지색 픽셀(nf2)에 대한 가중치는 가장 작게 설정될 수 있다.Referring to FIG. 6 , based on the geodesic distance on the Poincare ball, the weight for the red reference pixel rf may be set the largest, and the weight for the green pixel nf1 may be set to the second largest. . Meanwhile, the weight of the orange pixel nf2 may be set to the smallest value.

이 때, 컨볼루션 모듈은 3행 3열로 구성된 쌍곡 특징 벡터(

Figure 112021084948808-pat00039
)의 각 픽셀을 계층적 가중치가 큰 순서대로 1행 1열부터 1행 3열, 2행 1열부터 2행 3열, 3행 1열부터 3행 3열에 배치할 수 있다. 이에 따라, 도 6에 도시된 바와 같이 계층적 가중치가 가장 큰 붉은색 기준 픽셀(rf)는 1행 1열에 배치될 수 있고, 계층적 가중치가 그 다음으로 큰 초록색 픽셀(nf1)는 1행 2열에 배치될 수 있으며, 계층적 가중치가 가장 작은 오렌지색 픽셀(nf2)는 3행 3열에 배치될 수 있다.At this time, the convolution module is a hyperbolic feature vector (
Figure 112021084948808-pat00039
) may be arranged in the order of increasing the hierarchical weight in the order of increasing the hierarchical weight: 1 row 1 column 1 row 3 columns, 2 rows 1 column 2 rows 3 columns, 3 rows 1 column 3 rows 3 columns. Accordingly, as shown in FIG. 6 , the red reference pixel rf having the largest hierarchical weight may be arranged in row 1, column 1, and the green pixel nf1 having the next largest hierarchical weight is row 1, 2 It may be arranged in a column, and the orange pixel nf2 having the smallest hierarchical weight may be arranged in 3 rows and 3 columns.

전술한 바와 달리, 컨볼루션 모듈은 각 픽셀을 계층적 가중치가 작은 순서대로 재배치할 수 있고, 1행 1열부터 3행 1열, 1행 2열부터 3행 2열, 1행 3열부터 3행 3열 순서대로 픽셀을 배치할 수도 있다.Unlike the above, the convolution module can rearrange each pixel in the order of the smallest hierarchical weight, and from 1 row 1 column to 3 row 1 column, 1 row 2 column to 3 row 2 column, 1 row 3 column to 3 Pixels may be arranged in the order of rows and columns.

이어서, 컨볼루션 모듈은 계층적 가중치가 큰 순서대로 또는 작은 순서대로 배열된 계층적 가중치 벡터(

Figure 112021084948808-pat00040
)를 생성할 수 있다. 다시 말해, 컨볼루션 모듈은 계층적 가중치 벡터(
Figure 112021084948808-pat00041
)를 생성하되, 내부 각 픽셀 값(계층적 가중치)이 크기 순서대로 배열되도록 할 수 있다. 이 때, 계층적 가중치 벡터(
Figure 112021084948808-pat00042
) 내 픽셀의 배열 방향은 전술한 쌍곡 특징 벡터(
Figure 112021084948808-pat00043
)의 재배치 방향과 동일할 수 있다.Then, the convolution module constructs a hierarchical weight vector (
Figure 112021084948808-pat00040
) can be created. In other words, the convolution module is a hierarchical weight vector (
Figure 112021084948808-pat00041
), but with each inner pixel value (hierarchical weight) arranged in size order. In this case, the hierarchical weight vector (
Figure 112021084948808-pat00042
) the arrangement direction of the pixels in the above-mentioned hyperbolic feature vector (
Figure 112021084948808-pat00043
) can be the same as the rearrangement direction.

다시 도 6을 참조하면, 컨볼루션 모듈은 3행 3열로 구성된 계층적 가중치 벡터(

Figure 112021084948808-pat00044
)의 각 픽셀을 그 값(계층적 가중치)이 큰 순서에 따라 배열할 수 있다. 이에 따라, 붉은색 기준 픽셀(rf)에 대응하는 계층적 가중치는 1행 1열에 배열될 수 있고, 초록색 픽셀(nf1)에 대응하는 계층적 가중치는 1행 2열에 배치될 수 있으며, 오렌지색 픽셀(nf2)에 대응하는 계층적 가중치는 3행 3열에 배치될 수 있다.Referring back to Figure 6, the convolution module is a hierarchical weight vector (
Figure 112021084948808-pat00044
) can be arranged according to the order of the largest value (hierarchical weight). Accordingly, the hierarchical weights corresponding to the red reference pixel rf may be arranged in one row and one column, the hierarchical weights corresponding to the green pixel nf1 may be arranged in the first row and second column, and the orange pixel ( Hierarchical weights corresponding to nf2) may be arranged in 3 rows and 3 columns.

전술한 바와 같이 계층적 가중치 할당 및/또는 계층적 가중치 벡터(

Figure 112021084948808-pat00045
) 생성이 완료되면 컨볼루션 모듈은 계층적 가중치를 적용하여 쌍곡 특징 벡터(
Figure 112021084948808-pat00046
)를 컨볼루션할 수 있다(S130). 보다 구체적으로, 컨볼루션 모듈은 먼저 쌍곡 특징 벡터(
Figure 112021084948808-pat00047
)에 계층적 가중치를 적용한 후, 계층적 가중치가 적용된 쌍곡 특징 벡터(
Figure 112021084948808-pat00048
)를 컨볼루션할 수 있다.Hierarchical weight assignment and/or hierarchical weight vector (
Figure 112021084948808-pat00045
), the convolution module applies hierarchical weights to create hyperbolic feature vectors (
Figure 112021084948808-pat00046
) can be convolved (S130). More specifically, the convolution module first constructs a hyperbolic feature vector (
Figure 112021084948808-pat00047
) is hierarchically weighted, and then the hierarchically weighted hyperbolic feature vector (
Figure 112021084948808-pat00048
) can be convolved.

도 5 및 도 6을 참조하면, 앞서 설명한 바와 같이 계층적 가중치 벡터(

Figure 112021084948808-pat00049
)가 생성된 경우, 컨볼루션 모듈은 계층적 가중치 벡터(
Figure 112021084948808-pat00050
)와 쌍곡 특징 벡터(
Figure 112021084948808-pat00051
)를 곱함으로써 쌍곡 특징 벡터(
Figure 112021084948808-pat00052
)에 계층적 가중치를 적용할 수 있다. 여기서 곱 연산에는 전술한 [수학식 1]로 표현되는 뫼비우스 곱 연산이 이용될 수 있다.5 and 6, as described above, the hierarchical weight vector (
Figure 112021084948808-pat00049
) is generated, the convolution module
Figure 112021084948808-pat00050
) and the hyperbolic feature vector (
Figure 112021084948808-pat00051
) by multiplying the hyperbolic feature vector (
Figure 112021084948808-pat00052
) can be applied with hierarchical weights. Here, the Möbius product operation expressed by the above-mentioned [Equation 1] may be used for the multiplication operation.

이어서, 컨볼루션 모듈은 계층적 가중치가 적용된 쌍곡 특징 벡터(

Figure 112021084948808-pat00053
)를 컨볼루션할 수 있다. 이 때, 컨볼루션에는 해당 기술분야에서 이용되는 다양한 기법들이 적용될 수 있으며, 특히 공간 전파 신경망(SPN)에서 이용되는 기법이 이용될 수 있다.Then, the convolution module constructs a hierarchically weighted hyperbolic feature vector (
Figure 112021084948808-pat00053
) can be convolved. In this case, various techniques used in the relevant technical field may be applied to convolution, and in particular, a technique used in a spatial propagation neural network (SPN) may be used.

도 6을 참조하여 설명한 계층적 가중치 적용 방법에 의하면 쌍곡 특징 벡터(

Figure 112021084948808-pat00054
)와 계층적 가중치 벡터(
Figure 112021084948808-pat00055
) 내 각 픽셀 값들은 크기에 따라 규칙적으로(regularly) 배치될 수 있다. 이에 따라, 쌍곡 특징 벡터(
Figure 112021084948808-pat00056
)에 계층적 가중치 벡터(
Figure 112021084948808-pat00057
)를 곱한 출력 역시 그 픽셀이 중요도 순으로 배치될 수 있다.According to the hierarchical weighting method described with reference to FIG. 6, the hyperbolic feature vector (
Figure 112021084948808-pat00054
) and the hierarchical weight vector (
Figure 112021084948808-pat00055
) in each pixel value may be arranged regularly according to the size. Accordingly, the hyperbolic feature vector (
Figure 112021084948808-pat00056
) in the hierarchical weight vector(
Figure 112021084948808-pat00057
) multiplied by the pixel may also be arranged in order of importance.

출력의 픽셀의 배치가 중요도에 따른 경향성을 가질 수 있고, 이를 컨볼루션 신경망에 적용하는 경우, 학습 일관성, 학습 정확도가 향상되어 강인한(robustness) 모델을 구축할 수 있다.The arrangement of pixels in the output may have a tendency according to importance, and when this is applied to a convolutional neural network, learning consistency and learning accuracy are improved, so that a robust model can be built.

도 7을 참조하면, 본 발명은 공간 전파 신경망(SPN)을 통해 희소한 뎁스 정보를 이용하여 밀집한 뎁스 정보를 생성할 수 있다. 이를 위해, 본 발명은 이미지 특징 벡터로서 깊이 샘플(depth sample)을 입력받고, 이를 쌍곡 공간 상에 임베딩할 수 있다.Referring to FIG. 7 , according to the present invention, dense depth information may be generated using sparse depth information through a spatial propagation neural network (SPN). To this end, the present invention may receive a depth sample as an image feature vector and embed it in a hyperbolic space.

이어서, 본 발명은 임베딩된 깊이 샘플내 픽셀 간의 지오데식 거리에 기초하여 각 픽셀에 가중치를 적용할 수 있고, 가중치가 적용된 쌍곡 특징 벡터(

Figure 112021084948808-pat00058
)를 컨볼루션할 수 있다.Then, the present invention can apply a weight to each pixel based on the geodesic distance between pixels in the embedded depth sample, and apply a weighted hyperbolic feature vector (
Figure 112021084948808-pat00058
) can be convolved.

도 7에 도시된 본 발명의 컨볼루션 결과에 비추어보면, 최근의 공간 전파 신경망(SPN) 분야에서 괄목할만한 연구 성과인 『Xinjing Cheng, Peng Wang, and Ruigang Yang. Depth estimation via affinity learned with convolutional spatial propagation network. In Proceedings of European Conference on Computer Vision (ECCV), 2018.』에 소개된 컨볼루셔널 공간 전파 네트워크(Convolutional Spatial Propagation Network; CSPN)와 본 발명을 비교하였을 때, 본 발명의 콘볼루션 방법을 이용하여 복원된 이미지가 GT(Ground Truth)와 더 유사한 모습을 확인할 수 있다.In light of the convolution result of the present invention shown in FIG. 7, a remarkable research achievement in the field of recent spatial propagation neural networks (SPN), 『Xinjing Cheng, Peng Wang, and Ruigang Yang. Depth estimation via affinity learned with convolutional spatial propagation network. When the present invention is compared with the Convolutional Spatial Propagation Network (CSPN) introduced in In Proceedings of European Conference on Computer Vision (ECCV), 2018., restoration using the convolutional method of the present invention It can be seen that the image obtained is more similar to GT (Ground Truth).

이상과 같이 본 발명에 대해서 예시한 도면을 참조로 하여 설명하였으나, 본 명세서에 개시된 실시 예와 도면에 의해 본 발명이 한정되는 것은 아니며, 본 발명의 기술사상의 범위 내에서 통상의 기술자에 의해 다양한 변형이 이루어질 수 있음은 자명하다. 아울러 앞서 본 발명의 실시 예를 설명하면서 본 발명의 구성에 따른 작용 효과를 명시적으로 기재하여 설명하지 않았을 지라도, 해당 구성에 의해 예측 가능한 효과 또한 인정되어야 함은 당연하다.As described above, the present invention has been described with reference to the illustrated drawings, but the present invention is not limited by the embodiments and drawings disclosed in the present specification. It is obvious that variations can be made. In addition, although the effects according to the configuration of the present invention have not been explicitly described and described while describing the embodiments of the present invention, it is natural that the effects predictable by the configuration should also be recognized.

Claims (10)

컨볼루션 모듈에 의해 수행되는 이미지 컨볼루션 방법에 있어서,
유클리디언 공간 상의 이미지 특징 벡터를 쌍곡 공간 상의 쌍곡 특징 벡터로 임베딩하는 단계;
상기 쌍곡 특징 벡터의 계층적 속성에 기초하여 상기 쌍곡 특징 벡터에 대한 계층적 가중치를 설정하는 단계;
상기 계층적 가중치의 크기 순서대로 상기 쌍곡 특징 벡터를 재배치하는 단계;
상기 계층적 가중치가 크기 순서대로 배열된 계층적 가중치 벡터를 생성하는 단계; 및
상기 쌍곡 특징 벡터에 상기 계층적 가중치 벡터를 적용한 후 상기 쌍곡 특징 벡터를 컨볼루션하는 단계를 포함하는
쌍곡 공간에서의 이미지 컨볼루션 방법.
In the image convolution method performed by the convolution module,
embedding an image feature vector in Euclidean space into a hyperbolic feature vector in hyperbolic space;
setting a hierarchical weight for the hyperbolic feature vector based on a hierarchical property of the hyperbolic feature vector;
rearranging the hyperbolic feature vectors in an order of magnitude of the hierarchical weights;
generating a hierarchical weight vector in which the hierarchical weights are arranged in order of magnitude; and
Convolving the hyperbolic feature vector after applying the hierarchical weight vector to the hyperbolic feature vector
Image convolution method in hyperbolic space.
제1항에 있어서,
상기 임베딩하는 단계는
매핑함수를 통해 상기 이미지 특징 벡터를 구성하는 각 픽셀을 상기 쌍곡 공간 상에 임베딩하는 단계를 포함하는
쌍곡 공간에서의 이미지 컨볼루션 방법.
According to claim 1,
The embedding step
and embedding each pixel constituting the image feature vector in the hyperbolic space through a mapping function.
Image convolution method in hyperbolic space.
제1항에 있어서,
상기 임베딩하는 단계는
상기 유클리디언 공간과 푸앵카레 공(Poincar
Figure 112021084948808-pat00059
ball)을 연결하는 일대일 대응 함수를 통해 상기 이미지 특징 벡터를 상기 푸앵카레 공 상의 쌍곡 특징 벡터로 임베딩하는 단계를 포함하는
쌍곡 공간에서의 이미지 컨볼루션 방법.
According to claim 1,
The embedding step
The Euclidean space and the Poincaré ball
Figure 112021084948808-pat00059
and embedding the image feature vector into a hyperbolic feature vector on the Poincare ball through a one-to-one correspondence function connecting balls)
Image convolution method in hyperbolic space.
제1항에 있어서,
상기 계층적 가중치를 설정하는 단계는
상기 쌍곡 특징 벡터의 지오데식 거리에 기초하여 계층적 가중치를 설정하는 단계를 포함하는
쌍곡 공간에서의 이미지 컨볼루션 방법.
According to claim 1,
The step of setting the hierarchical weight is
setting a hierarchical weight based on the geodesic distance of the hyperbolic feature vector
Image convolution method in hyperbolic space.
제1항에 있어서,
상기 계층적 가중치를 설정하는 단계는
상기 쌍곡 특징 벡터의 지오데식 거리에 반비례하는 계층적 가중치를 설정하는 단계를 포함하는
쌍곡 공간에서의 이미지 컨볼루션 방법.
According to claim 1,
The step of setting the hierarchical weight is
Setting a hierarchical weight inversely proportional to the geodesic distance of the hyperbolic feature vector
Image convolution method in hyperbolic space.
제1항에 있어서,
상기 계층적 가중치를 설정하는 단계는
상기 쌍곡 특징 벡터를 구성하는 기준 픽셀과 나머지 픽셀 간의 거리에 기초하여 계층적 가중치를 설정하는 단계를 포함하는
쌍곡 공간에서의 이미지 컨볼루션 방법.
According to claim 1,
The step of setting the hierarchical weight is
setting a hierarchical weight based on a distance between a reference pixel constituting the hyperbolic feature vector and the remaining pixels
Image convolution method in hyperbolic space.
삭제delete 삭제delete 삭제delete 제1항에 있어서,
상기 컨볼루션하는 단계는
상기 계층적 가중치로 구성된 계층적 가중치 벡터와 상기 쌍곡 특징 벡터를 곱하는 단계와,
상기 계층적 가중치 벡터가 곱해진 쌍곡 특징 벡터를 컨볼루션하는 단계를 포함하는
쌍곡 공간에서의 이미지 컨볼루션 방법.
According to claim 1,
The convolution step is
multiplying the hierarchical weight vector composed of the hierarchical weights and the hyperbolic feature vector;
Convolving a hyperbolic feature vector multiplied by the hierarchical weight vector
Image convolution method in hyperbolic space.
KR1020210096529A 2021-07-22 2021-07-22 Image convolution method in hyperbolic space KR102388760B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210096529A KR102388760B1 (en) 2021-07-22 2021-07-22 Image convolution method in hyperbolic space
US17/813,963 US20230043037A1 (en) 2021-07-22 2022-07-21 Image convolution method in hyperbolic space

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210096529A KR102388760B1 (en) 2021-07-22 2021-07-22 Image convolution method in hyperbolic space

Publications (1)

Publication Number Publication Date
KR102388760B1 true KR102388760B1 (en) 2022-04-20

Family

ID=81395576

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210096529A KR102388760B1 (en) 2021-07-22 2021-07-22 Image convolution method in hyperbolic space

Country Status (2)

Country Link
US (1) US20230043037A1 (en)
KR (1) KR102388760B1 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ines Chami et al., "Hyperbolic Graph Convolutional Neural Networks," arXiv:1910.12933v1 [cs.LG] (2019.10.28.)* *

Also Published As

Publication number Publication date
US20230043037A1 (en) 2023-02-09

Similar Documents

Publication Publication Date Title
Du et al. Centroidal Voronoi tessellations: Applications and algorithms
US4941193A (en) Methods and apparatus for image compression by iterated function system
Carlen et al. Extremals of functionals with competing symmetries
CN103810744B (en) It is backfilled a little in cloud
Hyun U-duality between three and higher dimensional black holes
Du et al. Meshfree, probabilistic determination of point sets and support regions for meshless computing
US20180144545A1 (en) Method of simplifying a geometry model
Monro et al. Rendering algorithms for deterministic fractals
CN114255313B (en) Three-dimensional reconstruction method and device for mirror surface object, computer equipment and storage medium
CN1926558A (en) System and method for applying accurate three-dimensional volume textures to arbitrary triangulated surfaces
CN107301643B (en) Well-marked target detection method based on robust rarefaction representation Yu Laplce's regular terms
WO2021223262A1 (en) Method and apparatus for generating object transfer and encasement process policy, and computer device
CN114511440A (en) Adaptive convolution in neural networks
CN111985597B (en) Model compression method and device
CA2495277A1 (en) Evaluating integrals using stratification of integration domain using rank-1 lattices
Ou et al. Real-time tone mapping: A survey and cross-implementation hardware benchmark
Nikiel Iterated function systems for real-time image synthesis
US10475238B2 (en) Hölder adaptive image synthesis
CN116310111A (en) Indoor scene three-dimensional reconstruction method based on pseudo-plane constraint
KR102388760B1 (en) Image convolution method in hyperbolic space
CN110110132A (en) A kind of method, apparatus that establishing space lattice system and remote sensing image processing system
Wang et al. An improved capsule network based on capsule filter routing
KR100414058B1 (en) Remeshing optimizing method and apparatus for polyhedral surface
US8164593B2 (en) Systems and methods for graphical rendering
Wiens et al. Gentropy: Evolutionary 2D texture generation

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant