KR101580045B1 - Apparatus and method for generating hash code using acquired discriminative components based on unsupervised learning - Google Patents

Apparatus and method for generating hash code using acquired discriminative components based on unsupervised learning Download PDF

Info

Publication number
KR101580045B1
KR101580045B1 KR1020140060895A KR20140060895A KR101580045B1 KR 101580045 B1 KR101580045 B1 KR 101580045B1 KR 1020140060895 A KR1020140060895 A KR 1020140060895A KR 20140060895 A KR20140060895 A KR 20140060895A KR 101580045 B1 KR101580045 B1 KR 101580045B1
Authority
KR
South Korea
Prior art keywords
components
result
classification
hash code
generating
Prior art date
Application number
KR1020140060895A
Other languages
Korean (ko)
Other versions
KR20150134471A (en
Inventor
김준모
손성열
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020140060895A priority Critical patent/KR101580045B1/en
Publication of KR20150134471A publication Critical patent/KR20150134471A/en
Application granted granted Critical
Publication of KR101580045B1 publication Critical patent/KR101580045B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

자율학습을 통해 획득한 분류 성분들을 이용하여 해시 코드를 생성하는 장치 및 방법이 개시된다. 해시 코드 생성 장치는, 미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여 결과 성분들을 획득하는 주성분분석 수행부, 결과 성분들 중 적어도 둘 이상의 결과 성분들을 선형 결합하여 변환 행렬을 생성하는 선형 결합부, 및 변환 행렬을 이용하여 해시 코드를 생성하는 해시 코드 생성부를 포함할 수 있다.An apparatus and method for generating a hash code using classification components obtained through autonomous learning are disclosed. The hash code generation apparatus includes a principal component analysis unit that performs principal component analysis on predetermined learning data to obtain result components, a linear combination unit that linearly combines at least two result components of the result components to generate a transformation matrix, And a hash code generation unit for generating a hash code using the transformation matrix.

Description

자율학습을 통해 획득한 분류 성분들을 이용하여 해시 코드를 생성하는 장치 및 방법{APPARATUS AND METHOD FOR GENERATING HASH CODE USING ACQUIRED DISCRIMINATIVE COMPONENTS BASED ON UNSUPERVISED LEARNING}[0001] APPARATUS AND METHOD FOR GENERATING HASH CODE USING ACQUIRED DISCRIMINATIVE COMPONENTS [0002] BASED ON UNSUPERVISED LEARNING [0003]

본 발명의 실시예들은 미리 주어진 학습 데이터들의 자율학습을 통해 획득한 분류력이 높은 성분들을 이용하여 해시 코드를 생성하는 기술에 관한 것이다.Embodiments of the present invention relate to a technique for generating a hash code using components having high classification power obtained through autonomous learning of given learning data.

보다 자세하게는, 학습 데이터들을 대상으로 주성분분석을 수행하여 해시 코드를 생성하는 기술에 관한 것이다. More specifically, the present invention relates to a technique for generating a hash code by performing principal component analysis on learning data.

인터넷이 발달함에 따라, 다루게 되는 정보의 양이 점차 방대해지고 있다. 이로 인해, 대용량 정보 처리 기술의 필요성은 더욱 커지고 있다. 특히, 대용량 최단 이웃점 탐색(Large-Scale Nearest Neighbor Searching) 문제는 대용량 정보 처리 기술의 가장 근본이 되는 문제 중의 하나이다.As the Internet develops, the amount of information being handled is increasing. As a result, the need for a large-capacity information processing technology is increasing. In particular, the problem of large-scale nearest neighbor searching is one of the most fundamental problems of large-capacity information processing technology.

최근 들어, 정보를 이진화 코드로 변환하고 해시 테이블(hash table)을 이용한 방법, 또는 트리 구조로 이루어진 색인(indexing) 기법을 이용하여 정보를 검색하거나 분류한다. 예를 들어, 미국 특허 US2009/216755에서는 Locality Sensitive Hashing 기법을 이용하여 데이터를 색인(indexing)하는 방법을 제안하고 있다. 이러한 종래의 방법들은, 오검출률과 검출율을 직접적으로 최적화시키지 못한다. 더욱이, 검색 속도가 매우 느린 단점이 존재한다.Recently, information is converted into binarization codes, and information is searched or classified using a hash table method or an indexing method using a tree structure. For example, U.S. Patent No. US2009 / 216755 suggests a method of indexing data using Locality Sensitive Hashing. These conventional methods do not directly optimize the false positives and detection rates. Moreover, there is a disadvantage that the search speed is very slow.

이에 따라, 정보의 검색 또는 분류의 정확도를 높이면서 검색 속도를 증가시킬 수 있는 기술이 요구된다.Accordingly, there is a need for a technique capable of increasing the retrieval speed while improving the accuracy of retrieval or classification of information.

본 발명은 보다 정확하고 빠르게 정보를 검색 또는 분류하기 위한 것으로서, 학습 데이터들을 대상으로 자율학습을 통해 획득된 분류력이 높은 성분들을 이용하여 해시 코드를 생성하기 위한 것이다.The present invention is for more precisely and quickly searching or classifying information, and is for generating a hash code using components having high classification power obtained through autonomous learning on learning data.

본 발명의 일실시예에 따른 해시 코드 생성 장치는, 미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여 결과 성분들을 획득하는 주성분분석 수행부, 상기 결과 성분들 중 적어도 둘 이상의 결과 성분들을 선형 결합하여 변환 행렬을 생성하는 선형 결합부, 및 상기 변환 행렬을 이용하여 입력 데이터로부터 해시 코드를 생성하는 해시 코드 생성부를 포함할 수 있다.The hash code generation apparatus according to an embodiment of the present invention includes a principal component analysis performing unit for performing principal component analysis on predetermined learning data to obtain result components, A linear combination unit for generating a transformation matrix, and a hash code generation unit for generating a hash code from the input data using the transformation matrix.

일측면에 따르면, 상기 선형 결합부는, 상기 결과 성분들 중 기설정된 범위 내에서 서로 인접한 적어도 둘 이상의 결과 성분들 각각에 가중치를 적용하여 선형 결합할 수 있다.According to an aspect of the present invention, the linear combination unit may linearly combine the result components by applying a weight to each of at least two result components adjacent to each other within a predetermined range of the result components.

다른 측면에 따르면, 상기 선형 결합부는, 상기 결과 성분들을 대상으로, 서로 인접한 두 개의 결과 성분들을 한 쌍으로 하는 복수의 쌍으로 분류하고, 복수의 쌍 각각을 선형 결합할 수 있다.According to another aspect of the present invention, the linear combination unit may classify the result components into a plurality of pairs of two result components adjacent to each other, and linearly combine each of the plurality of pairs.

또 다른 측면에 따르면, 상기 선형 결합부는, 상기 결과 성분들 중 각각에 해당하는 급간 분산을 이용하여 가중치를 생성하는 가중치 생성부, 및 상기 결과 성분들 각각과 상기 가중치를 곱한 값을 선형 결합하여 상기 학습 데이터들의 검색 또는 분류력이 높은 분류 성분들을 획득하고, 상기 분류 성분들로 이루어진 변환 행렬을 생성하는 변환 행렬 생성부를 포함할 수 있다.According to another aspect of the present invention, the linear combination unit may include: a weight generation unit that generates a weight using the instant variance corresponding to each of the result components; and a linear combination unit that linearly combines values obtained by multiplying the result components by the weight, And a transformation matrix generator for obtaining classification elements having high retrieval or classification power of learning data and generating a transformation matrix composed of the classification elements.

또 다른 측면에 따르면, 상기 선형 결합부는, 상기 결과 성분들 각각과 상기 결과 성분들 각각의 표준편차의 역수를 곱하여 성분들의 크기를 조정할 수 있다.According to another aspect, the linear combination unit may adjust the size of the components by multiplying each of the result components by an inverse number of the standard deviation of each of the result components.

또 다른 측면에 따르면, 상기 선형 결합부는, 상기 결과 성분에 해당하는 급내 공분산 행렬의 고유행렬과 상기 결과 성분들을 행렬 곱셈함에 따라 상기 학습 이터들의 검색 또는 분류력이 높은 분류 성분들을 획득할 수 있다.According to another aspect of the present invention, the linear combination unit may obtain classification components having a high search or classification power of the learning data by performing matrix multiplication of the matrixes of the in-vivo covariance matrix corresponding to the result component and the resultant components.

본 발명의 일실시예에 따른 해시 코드 생성 방법은, 미리 주어진 학습 데이터들로부터 자율학습을 통해 상기 학습 데이터들의 검색 또는 분류력이 높은 적어도 둘 이상의 분류 성분들을 획득하는 단계, 및 상기 적어도 둘 이상의 분류 성분들을 이용하여 해시 코드를 생성하는 단계를 포함할 수 있다.A method of generating a hash code according to an embodiment of the present invention includes the steps of obtaining at least two classification components having high retrieval or classifying power of the learning data through autonomous learning from given learning data, And generating the hash code using the components.

일측면에 따르면, 상기 분류 성분들을 획득하는 단계는, 미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여 결과 성분들을 획득하는 단계, 및 상기 결과 성분들 중 적어도 둘 이상의 결과 성분들을 선형 결합하여 상기 변환 행렬을 생성하는 단계를 포함할 수 있다.According to an aspect, the step of acquiring the classification components includes performing principal component analysis on predetermined learning data to obtain result components, and linearly combining at least two result components of the result components, And generating a matrix.

다른 측면에 따르면, 상기 분류 성분들을 획득하는 단계는, 상기 결과 성분들 중 기설정된 범위 내에서 서로 인접한 적어도 둘 이상의 결과 성분들 각각에 가중치를 적용하고, 가중치가 적용된 각 결과 성분들을 선형 결합함에 따라 상기 분류 성분들을 획득할 수 있다.According to another aspect, the step of acquiring the classification components may include applying a weight to each of at least two result components adjacent to each other within a predetermined range of the result components, and linearly combining the weighted result components It is possible to obtain the classification components.

또 다른 측면에 따르면, 상기 분류 성분들을 획득하는 단계는, 상기 결과 성분들을 대상으로, 서로 인접한 두 개의 결과 성분들을 한 쌍으로 하는 복수의 쌍으로 분류하고, 복수의 쌍 각각을 선형 결합함에 따라 상기 분류 성분들을 획득할 수 있다.According to another aspect of the present invention, the step of acquiring the classification components may include classifying the resultant components into a plurality of pairs of two resultant components adjacent to each other, linearly combining each of the plurality of pairs, To obtain the classification components.

또 다른 측면에 따르면, 상기 분류 성분들을 획득하는 단계는, 상기 결과 성분들 중 각각에 해당하는 급간 분산을 이용하여 가중치를 생성하는 단계, 상기 결과 성분들 각각과 상기 가중치를 곱한 값을 선형 결합하여 상기 학습 데이터들의 검색 또는 분류력이 높은 분류 성분들을 획득하는 단계, 및 상기 분류 성분들로 이루어진 변환 행렬을 생성하는 단계를 포함할 수 있다According to another aspect, the step of acquiring the classification components may include generating a weight using the instant variance corresponding to each of the result components, linearly combining values obtained by multiplying each of the result components by the weight, Acquiring classification components with high retrieval or classifying power of the learning data, and generating a transformation matrix of the classification components

본 발명의 다른 실시예에 따른 해시 코드 생성 방법은, 미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여, 이미지 검색 또는 분류를 위한 결과 성분들을 획득하는 단계, 상기 결과 성분들 중 적어도 둘 이상의 결과 성분들을 선형 결합하여 변환 행렬을 생성하는 단계, 및 상기 변환 행렬을 이용하여 해시 코드를 생성하는 단계를 포함할 수 있다.A hash code generation method according to another embodiment of the present invention includes performing principal component analysis on predetermined learning data to obtain result components for image retrieval or classification, To generate a transform matrix, and generating the hash code using the transform matrix.

본 발명에 의하면, 비트레이트 레벨 별로 검출된 블록 아티팩트를 이용하여 입력 영상을 구성하는 복수의 프레임들 각각에 해당하는 비트레이트를 결정하고, 결정된 각 비트레이트로 해당 프레임을 인코딩하여 영상의 화질 저하를 감소 또는 최소화할 수 있다. According to the present invention, a bit rate corresponding to each of a plurality of frames constituting an input image is determined using the block artifacts detected for each bit rate level, and the corresponding frame is encoded at each determined bit rate, Can be reduced or minimized.

도 1은 본 발명의 일실시예에 따른 해시 코드 생성 장치의 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 따른 도 1의 해시 코드 생성 장치에서 선형 결합을 통해 해시 코드를 생성하는 동작을 설명하기 위해 제공되는 도면이다.
도 3은 본 발명의 일실시예에 따른 도 1의 선형 결합부의 세부 구성을 도시한 블록도이다.
도 4는 본 발명의 일실시예에 따른 해시 코드 생성 방법을 설명하기 위해 제공되는 흐름도이다.
도 5는 본 발명의 일실시예에 따른 이미지 검색 기반의 해시 코드 생성 방법을 설명하기 위해 제공되는 흐름도이다.
1 is a block diagram illustrating a configuration of a hash code generation apparatus according to an embodiment of the present invention.
2 is a diagram for explaining an operation of generating a hash code by linear combination in the hash code generating apparatus of FIG. 1 according to an embodiment of the present invention.
3 is a block diagram illustrating a detailed configuration of the linear coupling unit of FIG. 1 according to an embodiment of the present invention.
4 is a flowchart illustrating a hash code generation method according to an embodiment of the present invention.
5 is a flowchart illustrating an image search based hash code generation method according to an embodiment of the present invention.

이하, 본 발명에 따른 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

이하에서는, 해시 코드 생성 장치가 학습 데이터들을 대상으로 자율학습(Unsupervised learning)을 통해 해시 코드를 생성하는 동작에 대해 상세히 설명하기로 한다.Hereinafter, an operation of the hash code generation apparatus for generating a hash code through unsupervised learning with respect to learning data will be described in detail.

도 1은 본 발명의 일실시예에 따른 해시 코드 생성 장치의 구성을 도시한 블록도이다.1 is a block diagram illustrating a configuration of a hash code generation apparatus according to an embodiment of the present invention.

도 1에 따르면, 해시 코드 생성 장치(100)는, 주성분분석 수행부(101), 선형 결합부(102), 및 해시 코드 생성부(103)를 포함할 수 있다.1, the hash code generation apparatus 100 may include a principal component analysis execution unit 101, a linear combination unit 102, and a hash code generation unit 103. [

주성분분석 수행부(101)는, 미리 주어진 학습 데이터들(training data set)을 대상으로 주성분분석(Principal Component Analysis)을 수행하여 결과 성분들을 획득할 수 있다. 여기서, 주성분분석은, 많은 변수의 분산 방식(분산ㆍ공분산)의 패턴을 간결하게 ‘표현’하는 주성분을 원래 변수의 선형 결합(무게에 대한 평균점)으로 추출하는 통계 기법으로서, 설명으로는 n차원 공간의 축을 회전시켜 많은 변수의 분산을 가장 잘 ‘반영’한 소수의 새로운 축을 찾아내는 기술이다.The principal component analysis performing unit 101 may perform Principal Component Analysis on predetermined training data sets to obtain the resultant components. Here, the principal component analysis is a statistical technique for extracting a principal component that concisely expresses a pattern of a dispersion method (variance and covariance) of many variables as a linear combination (average point with respect to weight) of the original variable. It is a technology that rotates the axis of space and finds a small number of new axes that best reflects the variance of many variables.

일례로, 주성분분석 수행부(101)는 주성분 추출 행렬을 이용하여 학습 데이터들로부터 결과 성분들을 획득할 수 있다. 예를 들어, 학습 데이터들 각각은 하나의 벡터(vector)일 수 있다. 그러면, 주성분분석 수행부(101)는 각 학습 데이터와 주성분 추출 행렬 W1을 곱하여 결과 성분들을 획득할 수 있다.For example, the principal component analysis performing unit 101 may obtain the result components from the learning data using the principal component extraction matrix. For example, each of the training data may be a vector. Then, the principal component analysis performing unit 101 can obtain the result components by multiplying each learning data by the principal component extraction matrix W1 .

선형 결합부(102)는 주성분분석을 수행함에 따라 획득된 결과 성분들을 중 적어도 둘 이상의 결과 성분들을 선형 결합(linear combination)하여 변환 행렬을 생성할 수 있다.The linear combination unit 102 may linearly combine at least two result components among result components obtained by performing principal component analysis to generate a transformation matrix.

일례로, 주성분분석 수행부(101)는 상위 d개의 결과 성분들을 획득할 수 있다. 그러면, 선형 결합부(102)는 d개의 결과 성분들 중 기설정된 범위 내에서 서로 인접한 적어도 둘 이상의 결과 성분들 각각에 가중치를 적용할 수 있다. 이어, 선형 결합부(102)는 가중치가 적용된 각 결과 성분을 선형 결합하여 분류 성분들을 획득할 수 있다. 여기서, 분류 성분은, 결과 성분들 중 데이터의 검색 또는 분류력이 높은 성분을 나타낼 수 있다.For example, the principal component analysis performing unit 101 may obtain the top d result components. Then, the linear combiner 102 may apply a weight to each of at least two result components adjacent to each other within a predetermined range out of the d result components. The linear combination unit 102 may then linearly combine the weighted result components to obtain the classification components. Here, the classification component may represent a component having high retrieval or classification power of data among the result components.

예를 들어, 선형 결합부(102)는, 상위 d개의 결과 성분들 중 서로 인접한 두 개의 결과 성분들을 한 쌍(pair)으로 하는 복수의 쌍(d/2개)으로 분류할 수 있다. 그리고, 선형 결합부(102)는 분류된 복수의 쌍 각각을 선형 결합할 수 있다. 이어, 선형 결합부(102)는 상기 선형 결합을 수행하는 변환 행렬 W2를 생성할 수 있다.For example, the linear combiner 102 can classify a plurality of pairs (d / 2) of pairs of two result components adjacent to each other among upper d result components. And, the linear coupling unit 102 can linearly couple each of the plurality of sorted groups. The linear combination unit 102 may then generate a transformation matrix W2 that performs the linear combination.

이때, 선형 결합부(102)는, 하나의 쌍을 이루는 결과 성분들 각각에 가중치를 적용하고, 가중치가 적용된 결과 성분들을 선형 결합하여 분류 성분들을 획득할 수 있다. 예를 들어, 선형 결합부(102)는, d/2개의 쌍을 이루는 각 결과 성분을 이용하여 각 결과 성분에 해당하는 d개의 가중치를 생성할 수 있다. At this time, the linear combining unit 102 may apply weights to each of the pair of result components, and linearly combine the weighted result components to obtain the classification components. For example, the linear combiner 102 may generate d weight values corresponding to the respective result components using each result component of d / 2 pairs.

그리고, 선형 결합부(102)는 각 쌍에 해당하는 가중치를 각 쌍의 결과 성분들과 곱한 후, 각 쌍의 결과 성분들을 선형 결합함에 따라 d개의 분류 성분들을 획득할 수 있다. 이어, 선형 결합부(102)는 분류 성분들로 이루어진 변환 행렬 W2를 생성할 수 있다. 여기서, 가중치를 생성하는 자세한 동작은 아래의 도 3 및 수학식 1을 참조하여 후술하기로 한다.Then, the linear combination unit 102 may multiply the weight corresponding to each pair by the resultant components of each pair, and then obtain the d classification components by linearly combining the resultant components of each pair. The linear combination unit 102 may then generate a transformation matrix W2 of the classification components. Here, the detailed operation of generating the weight value will be described later with reference to FIG. 3 and Equation 1 below.

예를 들어, 선형 결합부(102)는, 주성분분석을 수행하여 획득한 상위 d개의 결과 성분들 각각의 표준편자를 계산할 수 있다. 이어, 선형 결합부(102)는 각 쌍의 결과 성분들에 상기 계산된 표준편차의 역수를 곱하여 결과 성분들의 크기를 조정할 수 있다.For example, the linear combination unit 102 can calculate the standard deviation of each of the upper d result components obtained by performing the principal component analysis. The linear combination unit 102 may then adjust the size of the resultant components by multiplying the resultant components of each pair by the inverse of the calculated standard deviation.

또한, 선형 결합부(102)는, 주성분분석을 수행하여 획득한 상위 d개의 결과 성분들 각각에 해당하는 급내 공분산 행렬의 고유행렬과 결과 성분들 각각을 행렬 곱셈할 수 있다. 이처럼, 선형 결합부(102)는 행렬 곱셈을 통해 학습 데이터들의 검색 또는 분류력이 높은 분류 성분들을 획득할 수 있다. 이어, 순서대로 주성분분석 변환 행렬, 상기 고유행렬, 크기조정행렬을 곱하여 최종 변환 행렬인 W2를 생성할 수 있다. 그러면, 해시 코드 생성부(103)는, 상기 선형 결합부(102)에서 생성한 변환 행렬 W2를 이용하여 입력 데이터에 대한 해시 코드(Hash Code)를 생성할 수 있다.The linear combination unit 102 may perform matrix multiplication of each of the eigenmatrix and the resultant components of the in-line covariance matrix corresponding to each of the upper d result components obtained by performing the principal component analysis. As such, the linear combination unit 102 can acquire classification components having high retrieval or classification power of learning data through matrix multiplication. Then, the final principal transformation matrix W2 can be generated by sequentially multiplying the principal component analysis conversion matrix, the eigenmatrix, and the size adjustment matrix. The hash code generation unit 103 may generate a hash code for the input data using the transformation matrix W2 generated by the linear combination unit 102. [

이때, 해시 코드 생성부(103)는, 미리 주어진 학습 데이터들(training data set)을 이용하여 학습된 평균 벡터를 생성할 수 있다. 예를 들어, 해시 코드 생성부(103)는, 학습 데이터들의 평균을 계산하여 학습된 평균 벡터를 생성할 수 있다.At this time, the hash code generation unit 103 may generate the learned average vector using training data sets previously given. For example, the hash code generation unit 103 may generate the learned mean vector by calculating an average of the training data.

그리고, 해시 코드 생성부(103)는 입력 데이터로부터 학습된 평균 벡터를 감산할 수 있다. 해시 코드 생성부(103)는 감산된 결과값에 변환 행렬을 행렬 곱셈한 후, 부호화함으로써 해시 코드를 생성할 수 있다.Then, the hash code generation unit 103 can subtract the learned mean vector from the input data. The hash code generation unit 103 can generate a hash code by performing matrix multiplication of the transformation matrix on the subtracted result value and then encoding.

도 2는 본 발명의 일실시예에 따른 도 1의 해시 코드 생성 장치에서 선형 결합을 통해 해시 코드를 생성하는 동작을 설명하기 위해 제공되는 도면이다.2 is a diagram for explaining an operation of generating a hash code by linear combination in the hash code generating apparatus of FIG. 1 according to an embodiment of the present invention.

도 2를 참고하면, 주성분분석 수행부(101)는 대량의 학습 데이터들(201) 각각에 주성분 추출 행렬 W1(202)을 곱함으로써 주성분분석을 수행할 수 있다. 그러면, 주성분분석의 결과로서 결과 성분들이 획득될 수 있다.Referring to FIG. 2, the principal component analysis performing unit 101 may perform principal component analysis by multiplying each of a large amount of learning data 201 by a principal component extraction matrix W1 202. The resultant components can then be obtained as a result of principal component analysis.

선형 결합부(102)는 결과 성분들 중 기설정된 범위 내에서 서로 인접한 적어도 둘 이상의 결과 성분들을 선형 결합(linear combination)하여 변환 행렬 W2(203)을 생성할 수 있다. The linear combination unit 102 may generate a transformation matrix W2 203 by linear combination of at least two result components adjacent to each other within a predetermined range of the resultant components.

일례로, 선형 결합부(102)는 적어도 둘 이상의 결과 성분들의 급간 분산(interclass variance)에 기초하여 생성된 가중치를 이용하여 변환 행렬 W2(203)을 생성할 수 있다. 예를 들어, 선형 결합부(102)는 아래의 수학식 1에 기초하여 가중치를 생성할 수 있다.In one example, the linear combination unit 102 may generate the transformation matrix W2 203 using the weights generated based on the interclass variance of at least two result components. For example, the linear combination unit 102 may generate a weight based on Equation (1) below.

Figure 112014047724654-pat00001
Figure 112014047724654-pat00001

수학식 1에서, x1 및 x2 각각은 주성분분석을 통해 획득한 결과 성분들 중 서로 인접한 결과 성분을 나타낼 수 있다. 예를 들어, x1 및 x2는 한 쌍을 이루는 결과 성분일 수 있다. 그리고, σ1은 결과 성분 x1의 급간 분산(interclass variance)이고, σ2는 x2의 급간 분산(interclass variance)을 나타낼 수 있다. y1, y2 각각은 선형 결합을 통해 획득한 분류 성분들로서, 데이터의 검색 또는 분류력이 높은 성분을 나타낼 수 있다.In Equation (1), x 1 and x 2 each may represent a result component adjacent to each other among the result components obtained through principal component analysis. For example, x 1 and x 2 may be a resultant component of a pair. And, σ 1 is the interclass variance of the resultant component x 1 , and σ 2 can represent the interclass variance of x 2 . y is 1 , y 2 Each of the classification components obtained through the linear combination can represent a component having high retrieval or classification power of data.

수학식 1에 따르면, 선형 결합부(102)는 상위 d개의 결과 성분들 중 서로 인접한 결과 성분 x1 및 x2를 한 쌍으로 분류할 수 있다. 이어, 선형 결합부(102)는, 결과 성분 x1의 급간 분산 σ1을 계산하고, 결과 성분 x2의 급간 분산 σ2을 계산할 수 있다. 그리고, 선형 결합부(102)는 계산된 급간 분산 σ1 및 급간 분산 σ2을 이용하여 각 결과 성분에 해당하는 가중치를 생성할 수 있다.According to Equation (1), the linear combination unit 102 can classify the resultant components x 1 and x 2 that are adjacent to each other among the upper d resultants into a pair. Then, the linear combination unit 102, and calculates the result geupgan variance σ 1 of the components x 1, you can calculate the variance σ 2 of the result geupgan components x 2. The linear combination unit 102 can generate a weight corresponding to each result component using the calculated instantaneous variance? 1 and the instantaneous variance? 2 .

예를 들어, 선형 결합부(102)는, 급간 분산 σ1 및 급간 분산 σ2의 합의 루트(root)를 계산하고, 급간 분산 σ2을 상기 계산된 루트로 나누어 줌에 따라 결과 성분 x1에 해당하는 가중치1를 생성할 수 있다. 그리고, 선형 결합부(102)는, 결과 성분 x1에 상기 생성된 가중치1를 곱할 수 있다. For example, the linear combination unit 102 geupgan variance σ 1 and geupgan result component x in accordance with the zoom dividing the calculated consensus root (root) of the variance σ 2, and wherein the geupgan variance σ 2 calculated route 1 The corresponding weight 1 can be generated. Then, the linear combination unit 102 can multiply the resultant component x 1 by the generated weight 1.

동일한 방법으로, 선형 결합부(102)는, 급간 분산 σ1 및 급간 분산 σ2의 합의 루트(root)를 계산하고, 급간 분산 σ1을 상기 계산된 루트로 나누어 줌에 따라 결과 성분 x2에 해당하는 가중치2를 생성할 수 있다. 그리고, 선형 결합부(102)는, 결과 성분 x2에 상기 생성된 가중치2를 곱할 수 있다.In the same way, the linear combination unit 102, the geupgan variance σ 1 and geupgan result component x in accordance with the zoom dividing the calculated consensus root (root) of the variance σ 2, and wherein the geupgan variance σ 1 calculated route 2 The corresponding weight 2 can be generated. Then, the linear combination unit 102 may multiply the resultant component x 2 by the generated weight 2.

그리고, 선형 결합부(102)는, 가중치1 및 가중치2가 각각 곱해진 결과 성분 x1 및 x2를 감산하여 분류 성분 y1을 획득할 수 있다. 마찬가지로, 선형 결합부(102)는, 가중치1 및 가중치2가 각각 곱해진 결과 성분 x1 및 x2를 합산하여 분류 성분 y2를 획득할 수 있다.Then, the linear combination unit 102 can obtain the classification component y 1 by subtracting the resultant components x 1 and x 2 obtained by multiplying the weight 1 and the weight 2, respectively. Likewise, the linear combination unit 102 can obtain the classification component y 2 by summing the resultant components x 1 and x 2 , which are obtained by multiplying the weight 1 and the weight 2, respectively.

이때, d개의 결과 성분들이 존재하는 경우, 선형 결합부(102)는 위의 수학식 1에 기초하여 d개의 분류 성분들을 획득할 수 있다. 그리고, 선형 결합부(102)는 d개의 분류 성분들로 이루어진 변환 행렬 W2(203)을 생성할 수 있다.At this time, when there are d result components, the linear combination unit 102 may obtain d classification components based on Equation (1) above. The linear combination unit 102 may generate a transformation matrix W2 203 consisting of d classification components.

그러면, 해시 코드 생성부(103)는, 변환 행렬 W2(203)을 이용하여 해시 코드를 생성할 수 있다.Then, the hash code generation unit 103 can generate the hash code using the transformation matrix W2 203. [

일례로, 해시 코드 생성부(103)는, 미리 주어진 학습 데이터들(201)의 평균을 계산하여 학습된 평균 벡터 v(204)를 생성할 수 있다.For example, the hash code generation unit 103 may generate the learned average vector v (204) by calculating an average of the learning data 201 given in advance.

그리고, 해시 코드 생성부(103)는 입력 데이터(205)로부터 학습된 평균 벡터 v(204)를 감산할 수 있다. 이어, 해시 코드 생성부(103)는 입력 데이터 벡터(205)에서 학습된 평균 벡터 v(204)를 감산한 결과 벡터와 변환 행렬 W2를 곱한 후, 부호화함에 따라 해시 코드를 생성할 수 있다.Then, the hash code generation unit 103 can subtract the learned mean vector v (204) from the input data (205). The hash code generation unit 103 may generate a hash code by multiplying the result vector obtained by subtracting the learned mean vector v (204) from the input data vector 205 by the transformation matrix W2, and then encoding the hash code.

도 3은 본 발명의 일실시예에 따른 도 1의 선형 결합부의 세부 구성을 도시한 블록도이다.3 is a block diagram illustrating a detailed configuration of the linear coupling unit of FIG. 1 according to an embodiment of the present invention.

도 3에 따르면, 선형 결합부(300)는 가중치 생성부(301) 및 변환 행렬 생성부(302)를 포함할 수 있다.3, the linear combination unit 300 may include a weight generation unit 301 and a transformation matrix generation unit 302.

가중치 생성부(301)는, 위의 수학식 1에 기초하여 각 결과 성분에 해당하는 가중치를 생성할 수 있다. 예를 들어, 가중치 생성부(301)는 각 결과 성분의 급간 분산(interclass variance)을 계산하고, 계산된 급간 분산을 이용하여 각 결과 성분에 해당하는 가중치를 생성할 수 있다. 여기서, 가중치를 생성하는 동작은 위의 수학식 1에서 자세히 설명하였으므로, 중복되는 설명은 생략하기로 한다. The weight generation unit 301 can generate a weight corresponding to each result component based on Equation (1) above. For example, the weight generation unit 301 may calculate the interclass variance of each result component, and generate a weight corresponding to each result component using the calculated weighted variance. Here, the operations of generating the weights are described in detail in Equation (1), and therefore duplicate descriptions will be omitted.

그러면, 변환 행렬 생성부(302)는, 각 결과 성분에 해당하는 가중치과 결과 성분들을 각각 곱할 수 있다. 예를 들어, 변환 행렬 생성부(302)는, 가중치1와 결과 성분 x1을 곱하고, 가중치2와 결과 성분 x2를 곱할 수 있다. Then, the transformation matrix generator 302 may multiply the weights and the result components corresponding to the respective result components, respectively. For example, the transformation matrix generator 302 may multiply the weight 1 by the resultant component x 1, and multiply the weight 2 by the resultant component x 2 .

이어, 변환 행렬 생성부(302)는, 가중치 1이 곱해진 결과 성분 x1과 가중치2가 곱해진 결과 성분 x2를 선형 결합하여 분류 성분 y1 및 y2를 획득할 수 있다. 예를 들어, 변환 행렬 생성부(302)는, 가중치 1이 곱해진 결과 성분 x1과 가중치2가 곱해진 결과 성분 x2를 감산하여 분류 성분 y1을 획득하고, 가중치 1이 곱해진 결과 성분 x1과 가중치2가 곱해진 결과 성분 x2를 합산하여 분류 성분 y2를 획득할 수 있다.Subsequently, the transformation matrix generator 302 may obtain the classification components y 1 and y 2 by linearly combining the resultant component x 2 obtained by multiplying the resultant component x 1 multiplied by the weight 1 with the weight 2. For example, the transformation matrix generator 302 subtracts the resultant component x 2 multiplied by the resultant product x 1 multiplied by the weight 1 and the weight 2 to obtain the classified component y 1 , and outputs the resultant component multiplied by the weight 1 the resultant component x 2 multiplied by x 1 and the weight 2 can be added to obtain the classified component y 2 .

그리고, 변환 행렬 생성부(302)는 획득한 분류 성분들로 이루어진 변환 행렬 W2를 생성할 수 있다.Then, the transformation matrix generator 302 may generate a transformation matrix W2 including the obtained classification components.

도 4는 본 발명의 일실시예에 따른 해시 코드 생성 방법을 설명하기 위해 제공되는 흐름도이다.4 is a flowchart illustrating a hash code generation method according to an embodiment of the present invention.

도 4의 해시 코드 생성 방법은, 도 1의 해시코드 생성 장치에 의해 수행될 수 있다. 도 4에서, 가중치를 생성하고, 변환 행렬을 생성하는 동작은 위의 도2 내지 도 3, 그리고 수학식 1에서 상세히 설명하였으므로, 중복되는 설명은 생략하기로 한다.The hash code generation method of FIG. 4 can be performed by the hash code generation apparatus of FIG. In FIG. 4, the operation of generating a weight and generating a transformation matrix has been described in detail with reference to FIGS. 2 to 3 and Equation 1, and thus a duplicate description will be omitted.

먼저, 401 단계에서, 주성분분석 수행부(101)는, 미리 주어진 학습 데이터들로부터 자율학습을 통해 학습 데이터들의 검색 또는 분류력이 높은 적어도 둘 이상의 분류 성분들을 획득할 수 있다.First, in step 401, the principal component analysis performing unit 101 may acquire at least two classification components having a high retrieval or classification power of learning data from self-learning from learning data given in advance.

일례로, 주성분분석 수행부(101)는 미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여 결과 성분들을 획득할 수 있다. 예를 들어, 주성분분석 수행부(101)는, 미리 주어진 학습 데이터들 각각을 주성분 추출 행렬 W1과 곱함으로써, 결과 성분들을 획득할 수 있다.For example, the principal component analysis performing unit 101 may perform principal component analysis on predetermined learning data to obtain result components. For example, the principal component analysis performing unit 101 can obtain the resultant components by multiplying each of the previously given learning data by the principal component extraction matrix W1 .

그러면, 선형 결합부(102)는 결과 성분들 중 서로 인접하는 적어도 둘 이상의 결과 성분들을 선형 결합하여 분류 성분들을 획득할 수 있다.Then, the linear combination unit 102 can linearly combine at least two resultant components adjacent to each other among the resultant components to obtain the classification components.

일례로, 선형 결합부(102)는 결과 성분들 중 서로 인접하는 두 개의 결과 성분들을 한 쌍(pair)으로 하는 복수의 쌍으로 분류할 수 있다. 이어, 선형 결합부(102)는 한 쌍을 이루는 결과 성분들 각각에 해당하는 가중치를 생성하고, 생성된 가중치들을 이용하여 분류 성분들을 생성할 수 있다. For example, the linear combiner 102 may classify the result components into a plurality of pairs of two adjacent result components as a pair. Then, the linear combiner 102 generates weights corresponding to the pair of result components, and generates the classification components using the generated weights.

예를 들어, 선형 결합부(102)는 위의 수학식 1에 기초하여 각 결과 성분에 해당하는 가중치를 생성할 수 있다. 그리고, 선형 결합부(102)는 생성된 가중치와 해당 결과 성분을 곱한 후 선형 결합함으로써 분류 성분들을 생성할 수 있다. 이때, d개의 결과 성분들이 d/2쌍으로 분류된 경우, 선형 결합부(102)는 각 쌍에 해당하는 결과 성분들의 급간 분산을 이용하여 d개의 가중치를 생성하고, d개의 가중치를 이용하여 d개의 분류 성분들을 생성할 수 있다.For example, the linear combination unit 102 can generate a weight corresponding to each result component based on Equation (1) above. The linear combination unit 102 may generate the classification components by multiplying the generated weight by the corresponding result component, and then performing linear combination. In this case, when d result components are classified into d / 2 pairs, the linear combiner 102 generates d weight values using the inter-variance of the result components corresponding to each pair, and calculates d Lt; / RTI >

이어, 402 단계에서, 해시 코드 생성부(103)는, 적어도 둘 이상의 분류 성분들을 이용하여 해시 코드를 생성할 수 있다.In step 402, the hash code generation unit 103 may generate a hash code using at least two classification components.

일례로, 해시 코드 생성부(103)는, 입력 데이터 벡터에서 학습된 평균 벡터 v를 감산한 결과 벡터와 변환 행렬 W2를 곱한 후, 부호화함에 따라 해시 코드를 생성할 수 있다. 여기서, 해시 코드 생성부(103)는, 미리 주어진 학습 데이터들의 평균을 계산하여 학습된 평균 벡터 v(204)를 생성할 수 있다.For example, the hash code generation unit 103 may generate a hash code by multiplying the result vector obtained by subtracting the learned mean vector v from the input data vector by the transformation matrix W2, and then encoding the hash code. Here, the hash code generation unit 103 may generate the learned mean vector v (204) by calculating an average of the learning data given in advance.

도 5는 본 발명의 일실시예에 따른 이미지 검색 기반의 해시 코드 생성 방법을 설명하기 위해 제공되는 흐름도이다.5 is a flowchart illustrating an image search based hash code generation method according to an embodiment of the present invention.

도 5의 해시 코드 생성 방법은, 도 1의 해시코드 생성 장치에 의해 수행될 수 있다. The hash code generation method of FIG. 5 can be performed by the hash code generation apparatus of FIG.

먼저, 501 단계에서, 주성분분석 수행부(103)는 미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여, 이미지 검색 또는 분류를 위한 결과 성분들을 획득할 수 있다. First, in step 501, the principal component analysis performing unit 103 may perform principal component analysis on predetermined learning data to obtain result components for image retrieval or classification.

여기서, 이미지 검색 또는 분류는, 검색어가 텍스트가 아닌 사진, 그림 등의 이미지인 경우에 이미지에 해당하는 데이터를 검색 또는 분류하여 제공하는 것을 나타낼 수 있다. Here, the image search or classification may indicate that data corresponding to an image is searched or categorized and provided when the search word is an image such as a photograph, a picture, etc., rather than text.

예를 들어, 검색 또는 분류하고자 하는 데이터가 선풍기 이미지인 경우, 주성분분석 수행부(103)는 해당 선풍기를 판매하는 적어도 하나의 웹 사이트, 해당 선풍기를 판매하는 업체들 간의 가격 비교 정보, 및 해당 선풍기의 최저가 정보 등을 제공하기 위한 결과 성분들을 획득할 수 있다.For example, when the data to be searched or classified is a fan image, the principal component analysis performing unit 103 stores at least one website for selling the fan, price comparison information between the companies that sell the fan, And the like.

이어, 502 단계에서, 선형 결합부(103)는, 결과 성분들 중 적어도 둘 이상의 결과 성분들을 선형 결합하여 학습 데이터에 대한 변환 행렬을 생성할 수 있다.Next, in step 502, the linear combination unit 103 may linearly combine at least two result components among the result components to generate a transformation matrix for the learning data.

일례로, 선형 결합부(103)는, 위의 수학식 1에 기초하여 결과 성분에 해당하는 가중치를 생성할 수 있다. 그리고, 선형 결합부(103)는, 생성된 가중치를 이용하여 분류 성분을 획득할 수 있다. 그러면, 선형 결합부(103)는 분류 성분들로 이루어진 변환 행렬 W2를 생성할 수 있다. 여기서, 가중치 생성 및 분류 성분을 획득하는 동작은 위의 도2 내지 도 4, 그리고 수학식 1에서 상세히 설명하였으므로, 중복되는 설명은 생략하기로 한다.For example, the linear combination unit 103 can generate a weight corresponding to a result component based on Equation (1) above. Then, the linear combination unit 103 can obtain the classification component using the generated weight. Then, the linear combination unit 103 can generate the transformation matrix W2 of the classification components. Here, the operation of acquiring the weight value and obtaining the classification component has been described in detail with reference to FIG. 2 to FIG. 4 and the formula 1, and thus a duplicated description will be omitted.

그리고, 503 단계에서, 해시 코드 생성부(103)는, 변환 행렬을 이용하여 입력 데이터에 대한 해시 코드를 생성할 수 있다.In step 503, the hash code generation unit 103 may generate a hash code for the input data using the transformation matrix.

일례로, 해시 코드 생성부(103)는, 입력 데이터 벡터에서 학습된 평균 벡터 v를 감산한 결과 벡터와 변환 행렬 W2를 곱한 후, 부호화함에 따라 해시 코드를 생성할 수 있다. 여기서, 학습된 평균 벡터 v(204)는, 미리 주어진 학습 데이터들의 평균을 계산함에 따라 생성될 수 있다.For example, the hash code generation unit 103 may generate a hash code by multiplying the result vector obtained by subtracting the learned mean vector v from the input data vector by the transformation matrix W2, and then encoding the hash code. Here, the learned mean vector v (204) may be generated by calculating an average of the learning data given in advance.

이상의 도 4에서는, 가중치를 생성하고, 가중치를 이용하여 생성된 분류 성분들을 이용하여 해시 코드를 생성하는 것으로 설명하였으나, 이는 실시예에 해당되며, 실질적으로, 도 4에서 설명한 해시 코드 생성 장치는 도 5에서 설명한 바와 마찬가지로, 분류 성분들을 이용하여 변환 행렬을 생성하고, 변환 행렬을 이용하여 입력 데이터에 대한 해시 코드를 생성할 수 있다. 이는 도 5와 동일하므로 중복되는 설명은 생략하기로 한다.4, a hash code is generated using the classification components generated by using the weight values. However, the hash code generation apparatus described in FIG. 4 corresponds to the embodiment. As described in 5, a transformation matrix may be generated using the classification components, and a hash code for the input data may be generated using the transformation matrix. This is the same as that of FIG. 5, so duplicate descriptions are omitted.

다만, 도 5의 해시 코드 생성 장치는, 501 단계에서 주성분분석을 수행하기 이전에 학습 데이터 및 입력 데이터에 대한 특징점을 추출할 수 있다는 점에서 도 4의 해시 코드 생성 장치와 상이하다. However, the hash code generation apparatus of FIG. 5 is different from the hash code generation apparatus of FIG. 4 in that feature points for learning data and input data can be extracted before performing principal component analysis in step 501. FIG.

또한, 도 5에서, 해시 코드 생성 장치는, 변환 행렬을 최초 한번 생성한 이후, 사용자가 입력 데이터를 입력할 때 마다 미리 생성한 변환 행렬을 이용하여 해시 코드를 생성할 수도 있고, 사용자가 입력 데이터를 입력할 때 마다 변환 행렬을 생성하여 해시 코드를 생성할 수도 있다.5, the hash code generation apparatus may generate a hash code using a transformation matrix previously generated each time the user inputs input data after generating the transformation matrix for the first time, It is possible to generate a hash code by generating a transformation matrix.

지금까지 도 1 내지 도 5에서 설명한 바와 같이, 해시 코드 생성 장치는, 각 결과 성분에 해당하는 가중치를 생성하고, 각 가중치를 적용한 선형 결합을 수행함에 따라 검색 또는 분류력이 높은 분류 성분들을 획득할 수 있다. 이처럼, 해시 코드 생성장치는, 분류 성분들로 이루어진 변환 행렬을 이용하여 해시 코드를 생성함으로써, 보다 빠르고 정확하게 데이터를 검색 또는 분류할 수 있다. 다시 말해, 본 발명의 일실시예에 따른 해시 코드 생성 장치는, 수신자 조작 특성 곡선(receiver operating characteristic curve: ROC curve)의 성능을 향상시킬 수 있다. As described with reference to Figs. 1 to 5, the hash code generation apparatus generates weights corresponding to the respective result components, and acquires classification components having a high search or classification power by performing linear combination using each weight value . As described above, the hash code generation apparatus can search or classify data more quickly and accurately by generating a hash code using a transformation matrix composed of classification components. In other words, the hash code generation apparatus according to an embodiment of the present invention can improve the performance of the receiver operating characteristic curve (ROC curve).

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to an embodiment may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions to be recorded on the medium may be those specially designed and configured for the embodiments or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. For example, it is to be understood that the techniques described may be performed in a different order than the described methods, and / or that components of the described systems, structures, devices, circuits, Lt; / RTI > or equivalents, even if it is replaced or replaced.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.

Claims (12)

미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여 결과 성분들을 획득하는 주성분분석 수행부;
상기 결과 성분들 중 적어도 둘 이상의 결과 성분들을 선형 결합하여 변환 행렬을 생성하는 선형 결합부; 및
상기 변환 행렬을 이용하여 입력 데이터로부터 해시 코드를 생성하는 해시 코드 생성부
를 포함하고,
상기 선형 결합부는,
상기 결과 성분들 각각과 상기 결과 성분들 각각의 표준편차의 역수를 곱하여 성분들의 크기를 조정하는 해시 코드 생성 장치.
A principal component analysis performing unit for performing principal component analysis on predetermined learning data to obtain result components;
A linear combination unit for linearly combining at least two result components among the result components to generate a transformation matrix; And
A hash code generation unit for generating a hash code from the input data using the transformation matrix,
Lt; / RTI >
The linear coupling unit includes:
And adjusts the size of the components by multiplying each of the result components by an inverse number of the standard deviation of each of the result components.
제1항에 있어서,
상기 선형 결합부는,
상기 결과 성분들 중 기설정된 범위 내에서 서로 인접한 적어도 둘 이상의 결과 성분들 각각에 가중치를 적용하여 선형 결합하는 해시 코드 생성 장치.
The method according to claim 1,
The linear coupling unit includes:
And applying a weight to each of at least two result components adjacent to each other within a predetermined range among the result components to perform linear combination.
제1항에 있어서,
상기 선형 결합부는,
상기 결과 성분들을 대상으로, 서로 인접한 두 개의 결과 성분들을 한 쌍으로 하는 복수의 쌍으로 분류하고, 복수의 쌍 각각을 선형 결합하는 해시 코드 생성 장치.
The method according to claim 1,
The linear coupling unit includes:
And divides the result components into a plurality of pairs of two resultant components that are adjacent to each other and linearly combines each of the plurality of pairs.
제1항에 있어서,
상기 선형 결합부는,
상기 결과 성분들 중 각각에 해당하는 급간 분산을 이용하여 가중치를 생성하는 가중치 생성부; 및
상기 결과 성분들 각각과 상기 가중치를 곱한 값을 선형 결합하여 상기 학습 데이터들의 검색 또는 분류력이 기설정된 기준값 보다 높은 분류 성분들을 획득하고, 상기 분류 성분들로 이루어진 변환 행렬을 생성하는 변환 행렬 생성부
를 포함하는 해시 코드 생성 장치.
The method according to claim 1,
The linear coupling unit includes:
A weight generating unit for generating a weight using the instantaneous variance corresponding to each of the result components; And
A transformation matrix generation unit for linearly combining each of the result components and a value obtained by multiplying the resultant components by a weight to obtain a classification component having a search or classification power of the learning data higher than a preset reference value,
And a hash code generator.
삭제delete 제1항에 있어서,
상기 선형 결합부는,
상기 결과 성분에 해당하는 급내 공분산 행렬의 고유행렬과 상기 결과 성분들을 행렬 곱셈함에 따라 상기 학습 데이터들의 검색 또는 분류력이 기설정된 기준값 보다 높은 분류 성분들을 획득하는 해시 코드 생성 장치.
The method according to claim 1,
The linear coupling unit includes:
Wherein the retrieval or classification of the learning data acquires classification components higher than a preset reference value by performing matrix multiplication of the eigen matrix of the in-class covariance matrix corresponding to the result component and the result components.
미리 주어진 학습 데이터들로부터 자율학습을 통해 상기 학습 데이터들의 검색 또는 분류력이 기설정된 기준값 보다 높은 적어도 둘 이상의 분류 성분들을 획득하는 단계; 및
상기 적어도 둘 이상의 분류 성분들을 이용하여 해시 코드를 생성하는 단계
를 포함하고,
상기 분류 성분들을 획득하는 단계는,
미리 주어진 학습 데이터들을 대상으로 주성분분석을 수행하여 결과 성분들을 획득하는 단계; 및
상기 결과 성분들 중 적어도 둘 이상의 결과 성분들을 선형 결합하여 변환 행렬을 생성하는 단계
를 포함하며,
상기 변환 행렬을 생성하는 단계는
상기 결과 성분들 각각과 상기 결과 성분들 각각의 표준편차의 역수를 곱하여 성분들의 크기를 조정하는 해시 코드 생성 방법.
Acquiring at least two classification components whose search or classification power of the learning data is higher than a preset reference value through autonomous learning from previously given learning data; And
Generating a hash code using the at least two classification components
Lt; / RTI >
Wherein obtaining the classification components comprises:
Performing principal component analysis on predefined learning data to obtain result components; And
Generating a transformation matrix by linearly combining at least two outcome components of the result components
/ RTI >
The step of generating the transformation matrix
And multiplying each of the result components by a reciprocal of a standard deviation of each of the result components to adjust the size of the components.
삭제delete 제7항에 있어서,
상기 분류 성분들을 획득하는 단계는,
상기 결과 성분들 중 기설정된 범위 내에서 서로 인접한 적어도 둘 이상의 결과 성분들 각각에 가중치를 적용하고, 가중치가 적용된 각 결과 성분들을 선형 결합함에 따라 상기 분류 성분들을 획득하는 해시 코드 생성 방법.
8. The method of claim 7,
Wherein obtaining the classification components comprises:
Applying a weight to each of at least two result components adjacent to each other within a predetermined range of the result components, and linearly combining the weighted result components to acquire the classification components.
제7항에 있어서,
상기 분류 성분들을 획득하는 단계는,
상기 결과 성분들을 대상으로, 서로 인접한 두 개의 결과 성분들을 한 쌍으로 하는 복수의 쌍으로 분류하고, 복수의 쌍 각각을 선형 결합함에 따라 상기 분류 성분들을 획득하는 해시 코드 생성 방법.
8. The method of claim 7,
Wherein obtaining the classification components comprises:
And classifying the resultant components into a plurality of pairs of two resultant components adjacent to each other and linearly combining each of the plurality of pairs to acquire the classification components.
제7항에 있어서,
상기 분류 성분들을 획득하는 단계는,
상기 결과 성분들 중 각각에 해당하는 급간 분산을 이용하여 가중치를 생성하는 단계;
상기 결과 성분들 각각과 상기 가중치를 곱한 값을 선형 결합하여 상기 학습 데이터들의 검색 또는 분류력이 상기 기설정된 기준값 보다 높은 분류 성분들을 획득하는 단계; 및
상기 분류 성분들로 이루어진 변환 행렬을 생성하는 단계
를 포함하는 해시 코드 생성 방법.
8. The method of claim 7,
Wherein obtaining the classification components comprises:
Generating a weight using the instant variance corresponding to each of the result components;
Combining the resultant components with the weighted values to obtain classification components whose search or classification power of the learning data is higher than the preset reference value; And
Generating a transformation matrix of the classification components
≪ / RTI >
삭제delete
KR1020140060895A 2014-05-21 2014-05-21 Apparatus and method for generating hash code using acquired discriminative components based on unsupervised learning KR101580045B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140060895A KR101580045B1 (en) 2014-05-21 2014-05-21 Apparatus and method for generating hash code using acquired discriminative components based on unsupervised learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140060895A KR101580045B1 (en) 2014-05-21 2014-05-21 Apparatus and method for generating hash code using acquired discriminative components based on unsupervised learning

Publications (2)

Publication Number Publication Date
KR20150134471A KR20150134471A (en) 2015-12-02
KR101580045B1 true KR101580045B1 (en) 2015-12-24

Family

ID=54882917

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140060895A KR101580045B1 (en) 2014-05-21 2014-05-21 Apparatus and method for generating hash code using acquired discriminative components based on unsupervised learning

Country Status (1)

Country Link
KR (1) KR101580045B1 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101213156B1 (en) * 2006-12-21 2012-12-17 삼성전자주식회사 Distributed rivest shamir adleman signature method and signature generative node

Also Published As

Publication number Publication date
KR20150134471A (en) 2015-12-02

Similar Documents

Publication Publication Date Title
US10796244B2 (en) Method and apparatus for labeling training samples
US9053358B2 (en) Learning device for generating a classifier for detection of a target
US20130148881A1 (en) Image Classification
US20160034821A1 (en) Information conversion method, information conversion device, and recording medium
WO2019026104A1 (en) Information processing device, information processing program, and information processing method
JP2013206187A (en) Information conversion device, information search device, information conversion method, information search method, information conversion program and information search program
CN104915673A (en) Object classification method and system based on bag of visual word model
US8571255B2 (en) Scalable media fingerprint extraction
WO2016095068A1 (en) Pedestrian detection apparatus and method
JP2010123000A (en) Web page group extraction method, device and program
CN112052451A (en) Webshell detection method and device
JP7393472B2 (en) Display scene recognition method, device, electronic device, storage medium and computer program
Qiu et al. A new approach to multimedia files carving
KR101717377B1 (en) Device and method for head pose estimation
CN114548274A (en) Multi-modal interaction-based rumor detection method and system
CN111666965B (en) Multi-level depth feature and multi-matcher fusion for improved image recognition
CN111488400B (en) Data classification method, device and computer readable storage medium
KR101580045B1 (en) Apparatus and method for generating hash code using acquired discriminative components based on unsupervised learning
CN110019096A (en) The generation method and device of index file
JP2015184743A (en) Image processor and object recognition method
CN110263196B (en) Image retrieval method, image retrieval device, electronic equipment and storage medium
KR20230065443A (en) Point cloud data augmentation method and learning method using the same
CN109299260B (en) Data classification method, device and computer readable storage medium
Ji et al. An effective pipeline for a real-world clothes retrieval system
Zhao et al. A Lightweight Generalizable Evaluation and Enhancement Framework for Generative Models and Generated Samples

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181203

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191126

Year of fee payment: 5