KR20150105193A - 분류 방법, 분류 장치 및 기록 매체 - Google Patents

분류 방법, 분류 장치 및 기록 매체 Download PDF

Info

Publication number
KR20150105193A
KR20150105193A KR1020150013498A KR20150013498A KR20150105193A KR 20150105193 A KR20150105193 A KR 20150105193A KR 1020150013498 A KR1020150013498 A KR 1020150013498A KR 20150013498 A KR20150013498 A KR 20150013498A KR 20150105193 A KR20150105193 A KR 20150105193A
Authority
KR
South Korea
Prior art keywords
parameter
point
stereoscopic projection
generalized inverse
space
Prior art date
Application number
KR1020150013498A
Other languages
English (en)
Other versions
KR101662938B1 (ko
Inventor
유이 노마
마키코 고노시마
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20150105193A publication Critical patent/KR20150105193A/ko
Application granted granted Critical
Publication of KR101662938B1 publication Critical patent/KR101662938B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06F17/30705
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • G06F17/30324
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/0643Hash functions, e.g. MD5, SHA, HMAC or f9 MAC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3226Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
    • H04L9/3231Biological data, e.g. fingerprint, voice or retina
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Power Engineering (AREA)
  • General Health & Medical Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Image Generation (AREA)

Abstract

본 발명은 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행하는 것을 목적으로 한다.
일반화 역입체 사영 파라미터 설정부(111)는, 일반화 역입체 사영을 행할 때에 이용하는 사영점의 위치 및 초구(S)의 위치에 관한 파라미터를 설정한다. 일반화 역입체 사영부(112a)는, m차원의 특징량 공간(V)에 대하여 역입체 사영을 행함으로써, m차원보다 g차원 높은 공간(W)에 매립된 (m+g-1)차원의 초구(S)와 특징량 공간(V)을 대응시킨다. 초평면 배치부(113)는, 초평면수 기억부(121)에 기억되어 있는 초평면수 n을 기초로, (m+g-1)차원의 초구(S)를 가로지르는 초평면을 n개, 초구(S)에 배치한다. 변환 규칙 생성부(114)는, 법선 벡터의 정보 및 오프셋 좌표의 정보를 기초로 하여, 변환 규칙의 정보를 생성한다. 비트열 생성부(115a)는, 일반화 역입체 사영부(112a)로부터 취득한 좌표를 기초로 하여, 비트열을 생성한다.

Description

분류 방법, 분류 장치 및 기록 매체{CLASSIFICATION METHOD, CLASSIFICATION DEVICE, AND RECORDING MEDIUM}
본 발명은 분류 방법 등에 관한 것이다.
예컨대, 각종 시스템에서 이용자를 인증하는 경우에는, 이용자의 생체 정보를 취득하고, 취득한 생체 정보와 일치하는 생체 정보가 미리 등록된 데이터베이스에 존재하는지의 여부를 판정하는 처리를 행한다. 여기서, 인증시에 취득하는 생체 정보는, 등록시에 취득한 생체 정보와 완전히 일치하는 경우는 적기 때문에, 유사 검색이 유효하다.
유사 검색을 행하는 경우의 유사 정도의 표현으로서, 생체 정보의 특징량을 해시 벡터로 변환하는 기술이 있고, 해시 벡터의 해밍 거리가 가까운 각 생체 정보를, 유사한 생체 정보로서 특정한다.
종래 기술에서는, 초평면(超平面)을 이용하여 특징량을 해시 벡터로 변환하는 처리를 행하고 있지만, 초구(超球)를 이용하여 특징량을 해시 벡터로 변환하는 처리도 존재하며, 초구를 이용하는 쪽이 정밀도의 향상을 기대할 수 있다.
특허문헌 1 : 일본 특허 공개 평성10-247243호 공보 특허문헌 2 : 일본 특허 공개 제2009-133798호 공보
비특허문헌 1 : M. Datar, N. Immorlica, P. Indyk, V. S. Mirrokni : Locality-Sensitive Hashing Scheme Based on p-Stable Distributions, Proceedings of the twentieth annual symposium on Computational geometry(SCG) 2004 비특허문헌 2 : Jae-Pil Heo, Youngwoon Lee, Junfeng He, Shih-Fu Chang, and Sung-Eui Yoon. "Spherical hashing", In CVPR, pp. 2957-2964, 2012. 비특허문헌 3 : Kengo Terasawa and Yuzuru Tanaka. "Spherical lsh for approximate nearest neighbor search on unit hyper-sphere", In Frank K. H. A. Dehne, Jorg-Rudiger Sack, and Norbert Zeh, editors, WADS, Vol. 4619 of Lecture Notes in Computer Sciene, pp. 27-38. Springer, 2007.
그러나, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 없다는 문제가 있다.
초구(S)의 특징량 공간에 대향하는 측의 면에만 특징량 데이터가 역입체 사영되도록, 사영점의 위치를 조정해도, 조정 후에 특징량 데이터가 들어오는 경우가 있다. 이러한 경우, 초구(S)의 특징량 공간과 반대측의 면에도 특징량 데이터가 역입체 사영되고, 역입체 사영된 특징량 데이터 사이에서 무한원점(無限遠点)의 쇼트커트가 발생하는 경우가 있다.
도 29는, 무한원점의 쇼트커트를 설명하기 위한 도면이다. 특징량 공간(V)의 무한원점이, 초구(S)의 북극에 1점 사영된다. 이 때문에, 예컨대, 특징량 공간(V)의 점 X0으로부터 충분히 먼 점 p를 역입체 사영하면, 초구(S) 상의 점 p'에 대응시켜진다. 또한, 특징량 공간(V)의 점 q를 역입체 사영하면, 초구(S) 상의 점 q'에 대응시켜진다. 이러한 역입체 사영이 행해지면, 쇼트커트가 발생한다. 예컨대, 특징량 공간(V)의 원점 부근을 통과하는 경로(10a)보다, 무한원점 부근을 통과하는 경로(10b)가 가까워져 버리는 경우가 있다. 그렇게 하면, 특징량 공간(V) 상에서는 거리(10c)만큼 떨어져 있는 점끼리더라도, 초구(S) 상에서는, 거리가 가까워져 버리는 경우가 있고, 이에 따라, 점 p의 비트열과, 점 q의 비트열의 해밍 거리가 가까워져 버리는 경우가 있다.
일측면에서는, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 있는 분류 방법, 분류 장치 및 기록 매체를 제공하는 것을 목적으로 한다.
제1 안에서는, 컴퓨터가 하기의 처리를 실행한다. 컴퓨터가, 특징량 공간의 정의역의 정보에 기초하여 사영점의 위치를 설정한다. 컴퓨터가, 설정된 상기 사영점의 위치를 이용하여, 상기 특징량 공간에 존재하는 벡터를, 특징량 공간의 차원보다 1차원 이상 큰 차원의 공간에 존재하는 구에 사영한다.
본 발명의 일실시양태에 의하면, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 있다는 효과를 나타낸다.
도 1은, 실시예 1에 관련된 분류 장치의 시스템 구성을 도시한 도면이다.
도 2는, 특징량 기억부의 데이터 구조의 일례를 도시한 도면이다.
도 3은, 비트열 기억 영역의 데이터 구조의 일례를 도시한 도면이다.
도 4는, 사영점의 위치를 설정하는 제1 예를 설명하기 위한 도면이다.
도 5는, 사영점의 위치를 설정하는 제2 예를 설명하기 위한 도면이다.
도 6은, 사영점의 위치를 설정하는 제3 예를 설명하기 위한 도면이다.
도 7은, 사영점이 초구(S)의 내측에 있는 경우의 일반화 입체 사영을 도시한 도면이다.
도 8은, 사영점이 초구(S) 상에 있는 경우의 일반화 입체 사영을 도시한 도면이다.
도 9는, 사영점이 초구(S)의 외측에 있는 경우의 일반화 입체 사영을 도시한 도면이다.
도 10은, 사영점이 초구(S)의 외측이며 또한 Z 성분이 [-1, 1]인 경우의 일반화 입체 사영을 도시한 도면이다.
도 11은, 초구(S)의 단면을 일반화 입체 사영한 경우의 제1 예를 도시한 도면이다.
도 12는, 초구(S)의 단면을 일반화 입체 사영한 경우의 제2 예를 도시한 도면이다.
도 13은, 초구(S)의 단면을 일반화 입체 사영한 경우의 제3 예를 도시한 도면이다.
도 14는, 초구(S)의 단면을 일반화 입체 사영한 경우의 제4 예를 도시한 도면이다.
도 15는, 일반화 역입체 사영을 설명하기 위한 제1 도이다.
도 16은, 일반화 역입체 사영을 설명하기 위한 제2 도이다.
도 17은, 일반화 역입체 사영을 설명하기 위한 제3 도이다.
도 18은, 특징량 공간(V)과 초구(S)의 관계를 도시한 도(1)이다.
도 19는, 특징량 공간(V)과 초구(S)의 관계를 도시한 도(2)이다.
도 20은, 파라미터를 설정하는 제1 플로우의 예를 도시한 도면이다.
도 21은, 파라미터를 설정하는 제2 플로우의 예를 도시한 도면이다.
도 22는, 실시예 2에 관련된 분류 장치의 시스템 구성을 도시한 도면이다.
도 23은, 파라미터를 설정하는 제3 플로우의 예를 도시한 도면이다.
도 24는, 실시예 3에 관련된 분류 장치의 시스템 구성을 도시한 도면이다.
도 25는, 파라미터를 설정하는 제4 플로우의 예를 도시한 도면이다.
도 26은, 파라미터를 설정하는 제5 플로우의 예를 도시한 도면이다.
도 27은, 파라미터를 설정하는 제6 플로우의 예를 도시한 도면이다.
도 28은, 목적 함수의 처리 플로우의 일례를 도시한 도면이다.
도 29는, 무한원점의 쇼트커트를 설명하기 위한 도면이다.
도 30은, 분류 장치의 하드웨어 구성을 도시한 도면이다.
이하에, 본원이 개시하는 분류 방법, 분류 장치 및 기록 매체의 실시예를 도면에 기초하여 상세히 설명한다. 한편, 이 실시예에 의해 이 권리 범위가 한정되는 것은 아니다. 각 실시예는, 처리 내용을 모순시키지 않는 범위에서 적절히 조합하는 것이 가능하다.
실시예 1
도 1을 이용하여, 분류 장치(100)의 시스템 구성에 관해 설명한다. 도 1은, 실시예 1에 관련된 분류 장치의 시스템 구성을 도시한 도면이다. 도 1의 예에 도시한 바와 같이, 분류 장치(100)는, 초평면수 기억부(121), 특징량 기억부(122), 특징량 공간의 정의역 기억부(123), 쿼리 기억부(124) 및 비트열 기억 영역(132)을 갖는다. 각 기억부는, 예컨대, RAM(Random Access Memory), ROM(Read Only Memory), 플래시 메모리(Flash Memory) 등의 반도체 메모리 소자, 하드디스크나 광 디스크 등의 기억 장치에 대응한다.
또한, 분류 장치(100)는, 일반화 역입체 사영 파라미터 설정부(111), 일반화 역입체 사영부(112a), 초평면 배치부(113), 변환 규칙 생성부(114) 및 비트열 생성부(115a)를 갖는다. 또한, 분류 장치(100)는, 일반화 역입체 사영부(112b), 비트열 생성부(115b) 및 해밍 거리 계산부(133)를 갖는다. 각 처리부의 기능은 예컨대, ASIC(Application Specific Integrated Circuit)나 FPGA(Field Programmable Gate Array) 등의 집적 회로에 의해 실현할 수 있다. 또한, 각 처리부의 기능은 예컨대, CPU(Central Processing Unit)가 정해진 프로그램을 실행함으로써 실현할 수 있다. 또, 일반화 역입체 사영 파라미터 설정부(111)는, 설정부의 일례이다. 일반화 역입체 사영부(112a)는, 사영부의 일례이다.
이하, 각 기억부에 관해 설명한다. 초평면수 기억부(121)는, 배치하는 초평면의 수를 기억하는 기억부이다.
특징량 기억부(122)는, 복수의 특징량 벡터를 기억하는 기억부이다. 도 2는, 특징량 기억부의 데이터 구조의 일례를 도시한 도면이다. 도 2에 도시된 예와 같이, 이 특징량 기억부(122)는, 식별 정보와 특징량 벡터를 대응시켜 기억한다. 식별 정보는, 특징량 벡터를 일의적으로 식별하는 정보이다. 특징량 벡터는, 예컨대, 사용자의 생체 정보로부터 얻어지는 m차원의 특징량 데이터이다. 생체 정보로부터 특징량 벡터를 구하는 수법은, 어떠한 종래 기술을 이용해도 좋다.
특징량 공간의 정의역 기억부(123)는, 특징량 공간에 설정되는 특징량의 정의역의 정보를 기억하는 기억부이다. 특징량의 정의역은, 외부로부터 주어진 것이어도 좋고, 유지하고 있는 데이터로부터 추측하는 것이어도 좋다.
쿼리 기억부(124)는, 쿼리가 되는 특징량 벡터를 기억하는 기억부이다. 분류 장치(100)는, 쿼리가 되는 특징량 벡터에 유사한 특징량 벡터를, 특징량 기억부(122)로부터 검색한다.
비트열 기억 영역(132)은, 후술하는 비트열 생성부(115a)로부터 취득하는 비트열(바이너리열)을 기억하는 기억 영역이다. 도 3은, 비트열 기억 영역의 데이터 구조의 일례를 도시한 도면이다. 도 3에 도시한 바와 같이, 이 비트열 기억 영역(132)은, 식별 정보와 비트열을 대응시켜 기억한다. 식별 정보는, 비트열의 생성원이 된 특징량 벡터를 일의적으로 식별하는 정보이다. 비트열은, 특징량 벡터를 기초로 하여 생성되는 비트열이다.
일반화 역입체 사영 파라미터 설정부(111)는, 일반화 역입체 사영을 행할 때에 이용하는 사영점의 위치 및 초구(S)의 위치에 관한 파라미터를 설정하는 처리부이다. 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 공간의 정의역 기억부(123)로부터 특징량의 정의역의 정보를 취득한다. 특징량의 정의역의 정보란, 예컨대, 특징량 데이터의 통계량 및 특징량 공간의 이론적 정의역 정보이다. 일반화 역입체 사영 파라미터 설정부(112a, 112b)는, 취득한 특징량의 정의역의 정보를 기초로 정의역을 설정한다.
일반화 역입체 사영 파라미터 설정부(111)는, 설정한 정의역을 기초로, 사영점의 위치 p=(p1, p2, ... , pm+1), 북극과 남극을 연결하는 직선과 특징량 공간의 교점 좌표 xo=(xo1, ... , xom) 및 파라미터 d를 정한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 공간의 정의역의 정보에 기초하여, 일반화 입체 사영의 상(像)이 정의역 전체를 포함하도록 파라미터 p, x0, d에 대하여 제약 조건을 설정하고, 정해진 방법으로 파라미터를 설정해도 좋다. 또, 파라미터 x0은, 초구(S)의 남극(SS)에 사상(寫像)되는 특징량 공간(V)의 점의 좌표이다. 파라미터 d는, 입체 사영의 스케일을 조정하는 파라미터이고, 초구(S)의 적도가 특징량 공간(V)에 사상되었을 때의 초구(S)의 반경에 상당하는 것이다.
특징량이라고 불리는 양의 정의역은 다방면에 걸친다. 예컨대 실수 전부, 양의 실수만, [0, 1]의 실수만, 어떤 선형 부등식으로 둘러싸인 영역 등이 있다. 일반화 역입체 사영의 정의역은, 사영점의 위치(p)에 따라 크게 상이하다. 이 때문에, 일반화 역입체 사영의 정의역이 특징량의 정의역을 포함하지 않는 점 p의 위치에서는, 사상을 할 수 없는 사태가 된다. 그와 같은 문제점이 발생하지 않도록, 파라미터 p, x0, d에 제한을 부여한다.
초구(S)가 공간(W)에 설정되어 있는 경우에 있어서, 사영점의 위치(p)는, 특징량의 정의역에 따라, 크게 나눠 이하의 3가지 제한에 기초하여 설정된다.
제1 제한으로서, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량의 정의역이 타원에 포함되는 경우에, 공간(W)에서 사영점(P)을 초구(S)의 상측에 설정하는 제한을 부여한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(111)는, 사영점(P)의 존재 범위를 초구(S)의 외부로 하는 제한을 부여한다. 또한, 일반화 역입체 사영 파라미터 설정부(111)는, 사영점(P)의 m+1 성분을 1 이상으로 하는 제한을 부여한다. 또, 실시예 1에 있어서 초구(S)는, m차원보다 1차원 이상 높은 공간(W)에 매립되어 있는 것으로 한다.
일반화 역입체 사영 파라미터 설정부(111)는, 제1 제한에 기초하여 초구(S)의 상측에 사영점의 위치(p)를 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 초구(S)의 일반화 입체 사영의 상이, 특징량의 정의역을 포함하도록 초구(S)의 상측에 사영점의 위치(p)를 설정한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 데이터를 전부 포함하는 특징량 공간 상의 구 중, 반경이 최소가 되는 구를 구하고, 일반화 입체 사영의 상이 그 최소 반경을 갖는 구를 포함하도록 사영점의 위치(p), 교점(x0) 및 파라미터(d)를 설정한다.
도 4는, 사영점의 위치를 설정하는 제1 예를 설명하기 위한 도면이다. 도 4와 같이, 일반화 역입체 사영 파라미터 설정부(111)는, 정의역(O)이 타원에 포함되는 경우에, 일반화 입체 사영의 상(Vs)이 정의역(O)을 포함하도록, 사영점의 위치(P)를 초구(S)의 상측에 설정하고, 초구(S)를 배치한다. 일반화 역입체 사영 파라미터 설정부(111)는, 설정된 사영점(P)의 좌표를 파라미터 p로 하고, 초구(S)의 북극(SN)과 남극(SS)을 연결하는 직선과 특징량 공간의 교점 좌표를 x0으로 하고, 초구(S)의 북극(SN)의 높이를 d로 한다.
사영점의 위치(P)를 초구(S)의 상측에 설정하는 경우에 설정되는 각 파라미터의 구체예에 관해 설명한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(111)는, x0을 (μ1, …, μm), d를 1로 한다. 또한, 일반화 역입체 사영 파라미터 설정부(111)는, 모든 특징량 데이터를 포함하는 구(S1)에서, 최소의 반경이 되는 구(S1)를 구하고, 그 중심을 μ, 반경을 r1로 한다. 이 때, 사영점의 위치(p)를 (μ1, …, μm, r1/{r1 2-1}1/2)로 설정한다. 또, x0의 좌표는, 예컨대, 모든 특징량 데이터를 포함하는 구(S1)에서 최소의 반경이 되는 구(S1)의 중심의 좌표여도 좋고, 특징량 데이터의 평균치여도 좋다.
또한, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 데이터의 모멘트를 계산하고, 모멘트에 기초하여 데이터의 존재 범위를 추정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 일반화 입체 사영의 상이 추정된 데이터의 존재 범위를 포함하도록 사영점의 위치(p), 교점(x0) 및 파라미터(d)를 설정해도 좋다.
도 4를 이용하여 특징량 데이터의 모멘트를 이용하여 사영점의 위치(p)를 설정하는 경우에 관해 설명한다. 도 4와 같이, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 데이터의 모멘트에 기초하여 정의역(O)을 추정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 추정한 정의역(O)이, 초구(S)의 일반화 입체 사영의 상(Vs)을 포함하도록, 사영점(P)을 초구(S)의 상측에 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 이 때, 초구(S)의 상측에 설정된 사영점(P)의 좌표를 파라미터 p로 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 공간(W)에 설정된 초구(S)의 북극(SN)과 남극(SS)을 연결하는 직선과 특징량 공간의 교점 좌표(x0), 및 파라미터(d)의 각각을 파라미터 x0, d로 설정한다.
또, 일반화 역입체 사영 파라미터 설정부(111)는, 이하의 식(1)을 기초로 하여 2차 모멘트(ν)를 산출한다. 식(1)에 있어서, xi (k)는, k번째의 특징량 벡터의 제i 성분에 대응한다. 또한, u는, 특징량 벡터의 평균치 벡터에 대응한다. K는 특징량 벡터의 개수에 대응한다.
Figure pat00001
‥‥ (1)
제2 제한으로서, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 공간(V)을 하나의 초평면(H)으로 분할했을 때에 정의역이 한쪽의 영역에 포함되는 경우에, 사영점(P)을 초구(S)의 표면에 설정하는 제한을 부여한다.
일반화 역입체 사영 파라미터 설정부(111)는, 제2 제한에 기초하여 사영점의 위치를 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 초구(S)의 어떤 점의 접평면과 특징량 공간의 공통 집합이 초평면(H)이 되는 초구(S) 상의 점이며, 또한 그 점을 사영점으로 했을 때, 모든 특징량 데이터를 포함하는 구(S1)가 일반화 입체 사영의 상에 포함되는 초구(S) 상의 점을 사영점(P)으로 한다.
도 5는, 사영점의 위치를 설정하는 제2 예를 설명하기 위한 도면이다. 도 5와 같이, 일반화 역입체 사영 파라미터 설정부(111)는, 초구(S)의 표면에 접하는 접평면 중, 특징량 공간(V)의 초평면(H)을 통과하는 접평면을 탐색한다. 일반화 역입체 사영 파라미터 설정부(111)는, 탐색된 초평면(H)을 통과하는 접평면과, 초구(S)와의 접점의 위치를 사영점의 위치(P)로 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 접평면과 초구(S)가 접하는 위치에 있는 사영점(P)의 좌표를 파라미터 p로 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 공간(W)에 설정된 초구(S)의 북극(SN)과 남극(SS)을 연결하는 직선과 특징량 공간의 교점 좌표(x0), 및 초구(S)의 북극(SN)에 관련된 d의 각각을 파라미터 x0, d로 설정한다.
제3 제한으로서, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 공간(V)에서 정의역을 특정할 수 없는 경우에, 사영점(P)을 초구(S)의 내측에 설정하는 제한을 부여한다. 일반화 역입체 사영 파라미터 설정부(111)는, 제3 제한에 기초하여 초구(S)의 내측에 사영점의 위치(p)를 설정한다.
도 6은, 사영점의 위치를 설정하는 제3 예를 설명하기 위한 도면이다. 도 6과 같이, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 공간(V)에서 정의역(O)을 특정할 수 없는 경우에, 초구(S)의 내측에 사영점(P)을 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 이 때, 초구(S)의 내측에 설정된 사영점(P)의 좌표를 파라미터 p로 설정한다. 일반화 역입체 사영 파라미터 설정부(111)는, 공간(W)에 설정된 초구(S)의 북극(SN)과 남극(SS)을 연결하는 직선과 특징량 공간의 교점 좌표(x0), 및 초구(S)의 북극(SN)에 관련된 d의 각각을 파라미터 x0, d로 설정한다.
일반화 역입체 사영 파라미터 설정부(111)는, 설정한 사영점의 위치에 기초하여 파라미터 p, x0, d를 일반화 역입체 사영부(112a) 및 초평면 배치부(113)에 출력한다. 이와 같이, 일반화 역입체 사영 파라미터 설정부(111)는, 초구(S)의 일반화 입체 사영의 상이 정의역 전체를 포함하도록 파라미터 p, x0, d를 설정한다.
여기서, 일반화 입체 사영이란, 사영점을, 원점을 중심으로 하는 초구(S)의 북극 이외의 점이어도 좋은 것으로 한 사상이다. 예컨대, 원점을 중심으로 하는 초구(S)를 설정하고, 초구(S)의 북극 이외의 점을 사영점으로 설정한 경우에, 설정된 사영점에 기초하여 초구(S) 상의 점을 특징량 공간(V) 상의 점에 대응시킴으로써 일반화 입체 사영이 행해진다.
m차원보다 1차원 높은 공간(W)에 m차원의 초구(S)가 매립되는 경우의 일반화 입체 사영에 관해 설명한다. 이 경우에 제m+1 성분을 z축 방향이라고 부르기로 하면, 일반화 입체 사영으로 사영하는 초구(S) 상의 점은, 그 z 성분이 사영점의 z 성분 이하의 점으로 한다. 다만, 혹시 초구(S) 상의 사영점과는 상이한 2점이 특징량 공간의 동일한 1점에 사영될 때에는, 초구(S) 상의 2점 중 사영점보다 먼 쪽을 사영되는 점으로 하고, 사영점에 가까운 쪽의 점은 일반화 입체 사영의 정의역으로 하지 않기로 한다.
일반화 입체 사영의 상은 특징량 공간(V)이 아니기 때문에, 일반화 역입체 사영의 정의역은 일반화 입체 사영의 상으로 한다. 예컨대, 초구(S)의 북극 이외에 설정된 사영점(P)에 기초하여, 초구(S)를 특징량 공간(V)에 일반화 입체 사영한 경우의 상이 일반화 입체 사영의 정의역이 된다.
초구(S)에 대하여 이루어지는 일반화 입체 사영은, 사영점의 위치에 따라 크게 4가지로 나누어진다. 이하, 초구(S)를 일반화 입체 사영하는 경우의 4가지의 예에 관해 설명한다. 도 7을 이용하여, 일반화 입체 사영의 제1 예에 관해 설명한다. 도 7은, 사영점이 초구(S)의 내측에 있는 경우의 일반화 입체 사영을 도시한 도면이다. 일반화 입체 사영의 상이 특징량 공간(V) 전체인 경우, 일반화 입체 사영의 상이 특징량 공간(V) 전체가 되도록 사영점(P)을 초구(S)의 내부에 설정한다. 이에 따라, 예컨대, 공간(W)에서, 사영점(P) 및 특징량 공간 상의 점(V1)을 연결하는 직선과 초구(S)와의 교점(S1)과, 특징량 공간 상의 점(V1)이 대응시켜진다.
도 8을 이용하여, 일반화 입체 사영의 제2 예에 관해 설명한다. 도 8은, 사영점이 초구(S) 상에 있는 경우의 일반화 입체 사영을 도시한 도면이다. 도 8과 같이 일반화 입체 사영의 상이 특징량 공간(V)을 하나의 초평면으로 분할한 영역에 포함되는 경우, 일반화 입체 사영의 상이 특징량 공간(V)의 일부이고, 한쪽 방향에 대하여 무한원을 포함하고 한쪽 방향에 대하여 유한해지도록, 사영점(P)이 초구(S) 상에 설정된다.
도 9를 이용하여, 일반화 입체 사영의 제3 예에 관해 설명한다. 도 9는, 사영점이 초구(S)의 외측에 있는 경우의 일반화 입체 사영을 도시한 도면이다. 도 9와 같이 일반화 입체 사영의 상이 타원에 포함되는 경우, 사영점(P)이, 초구(S)의 외측이며 그 z 성분이 1보다 큰 위치에 설정된다.
도 10을 이용하여, 일반화 입체 사영의 제4 예에 관해 설명한다. 도 10은, 사영점이 초구(S)의 외측 또한 z 성분이 [-1, 1]인 경우의 일반화 입체 사영을 도시한 도면이다. 도 10과 같이 일반화 입체 사영의 상이 한쪽 방향에 대하여 무한원을 포함하고 한쪽 방향에 대하여 유한해지는 경우, 사영점(P)이, 초구(S)의 외측이며 그 z 성분이 [-1, 1]의 범위가 되는 위치에 설정된다.
초구(S)를 초평면으로 절단했을 때의 단면을 입체 사영을 이용하여 특징량 공간에 사상하면 초구 혹은 초평면이다. 동일한 것을 일반화 입체 사영을 이용하여 행하면, 그 상은 m 변수의 최대 4차의 다항식의 제로점으로 표시되는 대수(代數) 다양체가 된다. 최대 4차식의 제로점으로 표시되는 대수 다양체는 4차 초곡면이라고 불린다. 사영점이 초구(S)의 중심에 있는 경우에는 일반적으로 최대 4차 곡면이 된다. m 변수의 2차의 항의 계수를 행렬을 이용하여 표시했을 때, 이 행렬을 A로 한다. 행렬 A의 고유치에 의해 나타나는 최대 2차 초곡면이 상이하다. 간단하게 하기 위해, m=2의 경우이며 또한 사영점이 초구(S)의 중심에 있는 경우의 단면과 최대 2차 초곡면의 관계를, 도 11, 도 12, 도 13, 도 14에 나타냈다. 이 경우 초구(S)의 적도는 특징량 공간의 무한원점에 대응하고, 단면이 적도와 교차하는 점이, 최대 2차 초곡면의 무한원에서의 거동을 나타내고 있다.
이하, 초구(S)를 초평면으로 절단했을 때의 단면을 이용한 일반화 입체 사영의 예에 관해 설명한다. 도 11은, 초구(S)의 단면을 일반화 입체 사영한 경우의 제1 예를 도시한 도면이다. 도 11과 같이, 초구(S)의 중심점(M)을 통과하는 초평면에 의해 생성된 초구(S)의 단면(Ts)을, 특징량 공간(V)에 일반화 입체 사영함으로써, 한쪽 방향에 대하여 무한원을 포함하고 한쪽 방향에 대하여 유한해지는 영역(Vs)이 설정된다. 또, 초평면에 의한 상은, 직선이 된다.
도 12는, 초구(S)의 단면을 일반화 입체 사영한 경우의 제2 예를 도시한 도면이다. 도 12와 같이, 특징량 공간(V)에 대하여 수직인 초평면에 의해 생성된 초구(S)의 단면(Ts)을, 특징량 공간(V)에 일반화 입체 사영함으로써, 한쪽 방향에 대하여 무한원을 포함하고 한쪽 방향에 대하여 유한해지는 영역(Vs)이 설정된다. 또, 초평면에 의한 상은, 쌍곡선이 된다.
도 13은, 초구(S)의 단면을 일반화 입체 사영한 경우의 제3 예를 도시한 도면이다. 도 13과 같이, 초구(S)의 특징량 공간(V)에 대향하는 측의 반구의 구면을, 특징량 공간(V)에 대하여 90°보다 작은 각도를 갖는 초평면에 의해 절단함으로써, 초구(S)의 단면(Ts)이 생성된다. 또한, 초구(S)의 단면(Ts)을 특징량 공간(V)에 일반화 입체 사영함으로써, 한쪽 방향에 대하여 무한원을 포함하고 한쪽 방향에 대하여 유한해지는 영역(Vs)이 설정된다. 또, 초평면에 의한 상은, 포물선이 된다.
도 14는, 초구(S)의 단면을 일반화 입체 사영한 경우의 제4 예를 도시한 도면이다. 도 14와 같이, 초구(S)의 특징량 공간(V)에 대향하는 측의 반구의 구면을, 특징량 공간(V)에 대하여 평행한 초평면에 의해 절단함으로써, 초구(S)의 단면(Ts)이 생성된다. 또한, 초구(S)의 단면(Ts)을 특징량 공간(V)에 일반화 입체 사영함으로써, 양방향에 대하여 유한해지는 영역(Vs)이 설정된다. 또, 초평면에 의한 상은, 타원이 된다.
일반화 역입체 사영부(112a, 112b)는, m차원의 특징량 공간(V)에 대하여 일반화 역입체 사영을 행함으로써, m차원보다 g차원 높은 공간(W)에 매립된 (m+g-1)차원의 초구(S)와 특징량 공간(V)을 대응시키는 처리부이다. g는, 1 이상의 정수이다. 이하의 설명에서는, 일반화 역입체 사영부(112a, 112b)를 통합하여 적절히, 일반화 역입체 사영부(112)라고 표기한다. 또, 이하의 설명에 있어서는 g가 1인 것으로 한다.
일반화 역입체 사영부(112a)는, 설정된 파라미터 p, x0 및 d를 기초로 하여, 특징량 벡터의 일반화 역입체 사영을 행한다. 일반화 역입체 사영부(112a)는, 일반화 역입체 사영된 특징량 벡터의 각 좌표를, 초평면 배치부(113)에 출력한다.
여기서, 사영점(P)을 초구(S)의 상측에 설정한 경우의 일반화 역입체 사영에 관해 설명한다. 도 15는, 일반화 역입체 사영을 설명하기 위한 제1 도이다. 도 15의 예에 도시한 바와 같이, 일반화 역입체 사영을 행하면, 특징량 공간(V) 상의 점과, 초구(S) 상의 점이 대응시켜진다. 도 15에 도시한 예에서는, 사영점(P)과 V1을 통과하는 직선과 초구(S)와의 교점은, S1 및 S2이지만, 2점의 교점 중 사영점보다 먼 쪽의 S1을 사영되는 점으로 한다. 이에 따라, 특징량 공간(V) 상의 점 V1과, 초구(S) 상의 점 S1이 대응시켜진다. 이와 같이 하여, 일반화 역입체 사영부(112a)는, 특징량 공간(V) 상의 점 V1을, 초구(S) 상의 점 S1에 일반화 역입체 사영한다. 또, 초구(S)의 북극(SN)과 남극(SS)을 연결하는 직선과, 특징량 공간(V)과의 교점을 x0으로 정의한다. 또한, 예컨대 북극(SN)의 좌표는, (xO1, xO2, …, xOm, 1)이 되고, 남극의 좌표는, (xO1, xO2, …, xOm, -1)이 된다. 특징량 공간(V)으로부터 초구(S)의 북극(SN)까지의 높이를 d로 정의한다.
다음으로, 사영점(P)을 초구(S)의 표면에 설정한 경우의 일반화 역입체 사영에 관해 설명한다. 도 16은, 일반화 역입체 사영을 설명하기 위한 제2 도이다. 도 16의 예에 도시한 바와 같이, 일반화 역입체 사영을 행하면, 특징량 공간(V) 상의 점과, 초구(S) 상의 점이 대응시켜진다. 예컨대, 사영점(P)과 V1을 통과하는 직선과 초구(S)와의 교점(S1)이, 사영되는 점이다. 이에 따라, 특징량 공간(V) 상의 점 V1과, 초구(S) 상의 점 S1이 대응시켜진다. 이와 같이 하여, 일반화 역입체 사영부(112a)는, 특징량 공간(V) 상의 점 V1을, 초구(S) 상의 점 S1에 일반화 역입체 사영한다.
다음으로, 사영점(P)을 초구(S)의 내부에 설정한 경우의 일반화 역입체 사영에 관해 설명한다. 도 17은, 일반화 역입체 사영을 설명하기 위한 제3 도이다. 도 17의 예에 도시한 바와 같이, 일반화 역입체 사영을 행하면, 특징량 공간(V) 상의 점과, 초구(S) 상의 점이 대응시켜진다. 예컨대, 사영점(P)과 V1을 통과하는 직선과 초구(S)와의 교점(S1)이, 사영되는 점이다. 이에 따라, 특징량 공간(V) 상의 점 V1과, 초구(S) 상의 점 S1이 대응시켜진다. 이와 같이 하여, 일반화 역입체 사영부(112a)는, 특징량 공간(V) 상의 점 V1을, 초구(S) 상의 점 S1에 일반화 역입체 사영한다.
일반화 역입체 사영의 예에 관해 설명한다. 예컨대, 사영점(P)이 초구(S)의 중심이고, 특징량 공간(V)의 특징량 벡터(좌표)를 (x1, x2, …, xm)으로 하는 경우, 일반화 역입체 사영 「f-1 : V→W」를, 식(2)로 한다. 「r2」는, 식(3)으로 정의된다. 또한, 식(2)의 α는, 식(4)로 정의된다.
Figure pat00002
‥‥ (2)
Figure pat00003
‥‥(3)
α=(d-1)/r ‥‥(4)
또, 입체 사영은, 원점을 중심으로 하는 초구(S)를 설정하고, 초구(S)의 북극을 사영점으로 한 경우의 사상이다. 도 18 및 도 19는, 특징량 공간(V)과 초구(S)의 관계를 도시한 도면이다. 도 18에 도시한 바와 같이, 역입체 사영을 행하면, 특징량 공간(V) 상의 점과, 초구(S) 상의 점이 대응시켜진다. 도 18에 도시한 예에서는, 특징량 공간(V) 상의 점 V1과, 초구(S) 상의 점 S1이 대응시켜진다. 북극(SN)과 점 V1을 통과하는 직선과, 초구(S)의 표면과의 교점이, S1에 대응한다. 또한, 예컨대, 도 19에 도시한 바와 같이, 초구(S)의 단면(SA)은, 특징량 공간(V)의 영역(VA)에 대응한다.
또한, 역입체 사영은, 입체 사영의 역사상이다. 입체 사영은, 도 18과 같이 초구(S)와 특징량 공간(V)을 배치하고, 북극(SN)으로부터 초구(S)와 교차하는 직선을 그었을 때, 초구(S)와 직선의 교점(S1)으로부터 직선과 특징량 공간(V)의 교점(V1)으로의 사상으로 정의된다.
특징량 공간(V)의 특징량 벡터(좌표)를 (x1, x2, …, xm)으로 할 때, 역입체 사영 「f-1 : V→W」를, 식(5)로 한다. 다만, 식(5)의 r2는, 식(6)으로 정의된다.
Figure pat00004
‥‥(5)
Figure pat00005
‥‥(6)
식(5) 및 식(6)에 있어서, x0 및 d는 파라미터이다. 파라미터 x0 및 d는, 도 18에 도시한 x0 및 d에 대응하는 것이다.
초평면 배치부(113)는, 초평면수 기억부(121)에 기억되어 있는 초평면수 n을 기초로, (m+g-1)차원의 초구(S)를 가로지르는 초평면을 n개, 초구(S)에 배치하는 처리부이다. 초평면 배치부(113)는, 초구(S)를 가로지르는 초평면이면, 랜덤으로 n 개의 초평면을 배열해도 좋고, 미리 설정된 위치에 n개의 초평면을 배열해도 좋다. 초평면 배치부(113)는, 각 초평면의 법선 벡터 및 오프셋 좌표를 특정하고, 특정한 법선 벡터의 정보 및 오프셋 좌표의 정보를 변환 규칙 생성부(114)에 출력한다. 법선 벡터를 (v1, v2, …, vn)으로 하고, 오프셋 좌표를 (c1, c2, … cn)으로 한다.
변환 규칙 생성부(114)는, 법선 벡터의 정보 및 오프셋 좌표의 정보를 기초로 하여, 변환 규칙의 정보를 생성하는 처리부이다. 변환 규칙 생성부(114)는, n개의 법선 벡터를 배열함으로써, n×(m+1) 행렬의 정보 「W11, W12, …, Wn(m+1)」을 생성한다. 예컨대, 식(7)의 n×(m+1) 행렬의 각 행이 각각, 법선 벡터에 대응한다. 또, 변환 규칙 생성부(114)는, n×(m+1) 행렬의 정보 중, 부족한 차원의 값에는, 랜덤치를 할당한다. 또한, 변환 규칙 생성부(114)는, 오프셋 좌표를, n×1의 정보로서 생성한다.
Figure pat00006
‥‥(7)
변환 규칙 생성부(114)는, n×(m+1) 행렬의 정보 및 n×1의 정보를, 비트열 생성부(115a)에 출력한다.
일반화 역입체 사영부(112b)는, 쿼리 기억부(124)에 기억된 특징량 벡터와, 설정된 파라미터 p, x0 및 d를 기초로 하여 역입체 사영을 행하고, 특징량 벡터에 대응하는 초구(S) 상의 좌표를 산출한다. 일반화 역입체 사영부(112b)는, 비트열 생성부(115b)에 출력한다.
비트열 생성부(115a)는, 식(7)을 계산함으로써, 「b1, b2, b3, …, bn」을 산출한다.
비트열 생성부(115a)는, 「b1, b2, b3, …, bn」을 산출한 후에, bN의 값이 플러스이면, bN을 「1」로 변환하고, bN의 값이 플러스가 아닌 경우에는, bN을 「0」으로 변환함으로써, 비트열을 산출한다. 예컨대, 「b1, b2, b3, …, bn」의 값이 각각 플러스, 마이너스, 플러스, …, 플러스인 경우에는, 비트열 생성부(115a)는, 비트열 「1, 0, 1, …, 1」을 생성한다.
비트열 생성부(115a)는, 일반화 역입체 사영부(112a)로부터 취득한 좌표를 기초로 하여, 비트열을 생성하고, 비트열 기억 영역(132)에 출력한다.
또한, 일반화 역입체 사영부(112b)는, 쿼리 기억부(124)에 기억된 특징량 벡터와, 설정된 파라미터 p, x0 및 d를 기초로 하여, 역입체 사영을 행하고, 특징량 벡터에 대응하는 초구(S) 상의 좌표를 산출한다. 일반화 역입체 사영부(112b)는, 산출한 좌표를, 비트열 생성부(115b)에 출력한다.
비트열 생성부(115b)는, 일반화 역입체 사영부(112b)로부터 취득하는 각 좌표를 기초로 하여, 복수의 비트열을 생성하고, 생성한 복수의 비트열을 비트열 기억 영역(132)에 출력한다.
해밍 거리 계산부(133)는, 비트열 생성부(115a)에 의해 생성된 각 비트열과, 비트열 생성부(115b)에 의해 생성된 비트열을, 비트열 기억 영역(132)으로부터 추출하고, 비트열 사이의 해밍 거리를 산출한다. 해밍 거리란, 자릿수가 동일한 2개의 2진수를 비교한 경우의, 상이한 자릿수의 개수이다. 해밍 거리 계산부(133)는, 해밍 거리의 산출 결과에 기초하여, 쿼리 비트열과의 해밍 거리가 가까운 순으로, 각 비트열에 대하여 순위 매김을 행한다. 해밍 거리 계산부(133)는, 순위 매김한 각 비트열 중, 상위의 비트열을, 쿼리 비트열에 대응하는 비트열로서 출력해도 좋고, 순위 매김의 결과를 출력해도 좋다.
일반화 역입체 사영 파라미터 설정부(111)가 사영점의 위치(p), 교점(x0) 및 파라미터(d)를 설정하는 처리의 흐름에 관해 설명한다. 도 20은, 파라미터를 설정하는 제1 플로우의 예를 도시한 도면이다. 도 20에 도시된 처리에 있어서, 일반화 역입체 사영 파라미터 설정부(111)는, 사영점(P)의 존재 범위에 조건을 부여한다.
도 20과 같이, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량 공간의 정의역의 정보를 얻는다(스텝 S10). 일반화 역입체 사영 파라미터 설정부(111)는, 특징량의 정의역의 정보가 없는 경우(스텝 S11 No), 사영점(P)의 존재 범위에 조건을 부여하지 않고(스텝 S17) 처리를 종료시킨다.
한편, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량의 정의역의 정보가 있으며(스텝 S11 Yes), 또한 정의역이 타원에 포함되는 경우(스텝 S12 Yes), 사영점(P)의 존재 범위를 초구(S)의 외부이며, 또한 그 제m+1 성분이 1 이상인 것으로 한다(스텝 S13). 한편, 일반화 역입체 사영 파라미터 설정부(111)는, 특징량의 정의역의 정보가 있으며(스텝 S11 Yes), 또한 정의역이 타원에 포함되지 않는 경우(스텝 S12 No), 스텝 S14의 처리로 이행한다.
일반화 역입체 사영 파라미터 설정부(111)는, 스텝 S14에 있어서, 정의역이 특징량 공간(V)을 하나의 초평면으로 분할한 영역에 포함되는 경우(스텝 S14 Yes), 사영점(P)의 존재 범위를 초구(S) 상으로 한다(스텝 S15). 한편, 일반화 역입체 사영 파라미터 설정부(111)는, 정의역이 특징량 공간(V)을 하나의 초평면으로 분할한 영역에 포함되지 않는 경우(스텝 S14 No), 사영점(P)의 존재 범위를 초구(S)의 내부로 한다(스텝 S16).
다음으로, 도 21을 이용하여, 도 20에 도시된 처리에 의해 조건이 부여된 사영점(P)의 존재 범위에 기초하여 사영점을 설정하는 처리의 흐름에 관해 설명한다. 도 21은, 파라미터를 설정하는 제2 플로우의 예를 도시한 도면이다. 일반화 역입체 사영 파라미터 설정부(111)는, 모든 특징량 데이터를 포함하는 구(S1)에서, 최소의 반경이 되는 구(S1)를 구하고, 그 중심을 μ, 반경을 r1로 한다(스텝 S20).
일반화 역입체 사영 파라미터 설정부(111)는, 사영점의 존재 범위의 조건이 초구(S)의 외부인 경우(스텝 S21 Yes), 파라미터 X0=μ, d=1, p=(μ1, …, μm, r1/{r1 2-1}1/2)로 한다(스텝 S22). 한편, 일반화 역입체 사영 파라미터 설정부(111)는, 사영점의 존재 범위의 조건이 초구(S)의 외부가 아닌 경우(스텝 S21 No), 스텝 S23의 처리로 이행한다.
일반화 역입체 사영 파라미터 설정부(111)는, 사영점의 존재 범위의 조건이 초구(S) 상인 경우(스텝 S23 Yes), 특징량 공간(V)을 하나의 초평면으로 분할했을 때에 정의역이 한쪽의 영역에 포함되는 것과 같은 초평면(H)을 정한다(스텝 S24). 또한, 일반화 역입체 사영 파라미터 설정부(111)는, 초구(S)의 어떤 점의 접평면과 특징량 공간의 공통 집합이 초평면(H)이 되는 것과 같은 초구(S) 상의 점이며, 또한 그 점을 사영점으로 했을 때 구(S1)가 일반화 입체 사영의 상에 포함되는 초구(S) 상의 점을 탐색한다. 일반화 역입체 사영 파라미터 설정부(111)는, 유일하게 존재하는 초구(S) 상의 점을 사영점으로 정한다(스텝 S25). 일반화 역입체 사영 파라미터 설정부(111)는, 이 때, 접평면과 초구(S)가 접하는 위치에 있는 사영점(P)의 좌표와, 공간(W)에 설정된 초구(S)의 교점(x0) 및 초구(S)의 북극(SN)에 관련된 d를, 각각 파라미터 p, x0, d로 설정한다.
한편, 일반화 역입체 사영 파라미터 설정부(111)는, 사영점의 존재 범위의 조건이 초구(S) 상이 아닌 경우(스텝 S23 No), 파라미터 X0=μ, d=r1, p=(μ1, …, μm, 0)으로 한다(스텝 S26).
이와 같이, 컴퓨터가 실행하는 분류 방법으로서, 특징량 공간의 정의역의 정보에 기초하여 사영점의 위치를 설정하고, 설정된 사영점의 위치를 이용하여, 특징량 공간에 존재하는 벡터를, 특징량 공간의 차원보다 1차원 이상 큰 차원의 공간에 존재하는 구에 사영하는 처리를 실행한다. 정의역에 따라 사영점을 설정하고, 설정된 사영점을 기초로 일반화 역입체 사영을 함으로써, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 있다.
설정하는 처리는, 특징량 공간의 정의역의 정보에 기초하여 구의 위치를 설정한다. 이에 따라, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 있다.
설정하는 처리는, 특징량 공간의 정의역이 타원형의 영역에 포함되는 경우에, 구의 외부이며, 또한 특징량 공간과 반대측의 위치에 사영점을 설정한다. 또한, 설정하는 처리는, 특징량 공간의 정의역이, 상기 특징량 공간을 하나의 평면으로 분할한 영역에 포함되는 경우에, 구의 표면에 사영점을 설정한다. 이에 따라, 정의역의 형상에 따라 사영점을 설정함으로써, 특징량 공간(V)의 필요한 범위만을 구면에 사영할 수 있다.
실시예 2
도 22를 이용하여, 분류 장치(200)의 시스템 구성에 관해 설명한다. 도 22는, 실시예 2에 관련된 분류 장치의 시스템 구성을 도시한 도면이다. 도 22의 예에 도시한 바와 같이, 분류 장치(200)는, 초평면수 기억부(221), 특징량 기억부(222), 특징량 공간의 정의역 기억부(223), 쿼리 기억부(224) 및 비트열 기억 영역(232)을 갖는다. 각 기억부는, 예컨대, RAM(Random Access Memory), ROM(Read Only Memory), 플래시 메모리(Flash Memory) 등의 반도체 메모리 소자, 하드디스크나 광디스크 등의 기억 장치에 대응한다.
또한, 분류 장치(200)는, 일반화 역입체 사영 파라미터 설정부(211), 일반화 역입체 사영부(212a), 초평면 배치부(213), 변환 규칙 생성부(214) 및 비트열 생성부(215a)를 갖는다. 또한, 분류 장치(200)는, 일반화 역입체 사영부(212b), 비트열 생성부(215b) 및 해밍 거리 계산부(233)를 갖는다. 각 처리부의 기능은 예컨대, ASIC(Application Specific Integrated Circuit)나 FPGA(Field Programmable Gate Array) 등의 집적 회로에 의해 실현할 수 있다. 또한, 각 처리부의 기능은 예컨대, CPU(Central Processing Unit)가 정해진 프로그램을 실행함으로써 실현할 수 있다. 또, 일반화 역입체 사영 파라미터 설정부(211)는, 설정부의 일례이다. 일반화 역입체 사영부(212a)는, 사영부의 일례이다.
각 기억부의 데이터 구조는, 실시예 1과 동일하기 때문에 설명을 생략한다.
일반화 역입체 사영 파라미터 설정부(211)는, 설정한 정의역을 기초로, 사영점의 위치(p), 북극과 남극을 연결하는 직선과 특징량 공간의 교점 좌표(xo) 및 파라미터(d)를 정한다.
공간(W)에서 사영점의 위치는, 정의역에 따라, 크게 나눠 이하의 3가지 제한에 기초하여 설정된다.
제1 제한으로서, 일반화 역입체 사영 파라미터 설정부(211)는, 특징량의 정의역이 타원에 포함되는 경우에, 공간(W)에서 사영점(P)을 초구(S)의 상측에 설정하는 제한을 부여한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(211)는, 사영점(P)의 존재 범위를 초구(S)의 외부로 하는 제한을 부여한다. 또한, 일반화 역입체 사영 파라미터 설정부(211)는, 사영점(P)의 m+1 성분을 1 이상으로 하는 제한을 부여한다. 또, 사영점(P)을 초구(S)의 상측에 설정하는 제한을 부여하는 예는, 예컨대, 도 4에 도시된다.
일반화 역입체 사영 파라미터 설정부(211)는, 제1 제한에 기초하여 초구(S)의 상측에 사영점의 위치(P)를 설정한다. 일반화 역입체 사영 파라미터 설정부(211)는, 초구(S)의 일반화 입체 사영의 상이, 특징량의 정의역을 포함하도록 초구(S)의 상측에 사영점의 위치(P)를 이하와 같이 하여 설정한다.
일반화 역입체 사영 파라미터 설정부(211)는, 특징량 데이터의 평균치 μ와 분산 공분산 행렬의 최대 고유치의 평방근 σ를 구한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(211)는, x0을 μ, d를 1로 했을 때, 사영점(P)을 (μ1, …, μm, 5σ/{(5σ)2-1}1/2)로 설정한다.
제2 제한으로서, 일반화 역입체 사영 파라미터 설정부(211)는, 특징량 공간(V)을 하나의 초평면(H)으로 분할했을 때에 정의역이 한쪽의 영역에 포함되는 경우에, 사영점(P)을 초구(S)의 표면에 설정하는 제한을 부여한다. 사영점(P)을 초구(S)의 표면에 설정하는 제한을 부여하는 예는, 예컨대, 도 5에 도시된다.
일반화 역입체 사영 파라미터 설정부(211)는, 제2 제한에 기초하여 사영점의 위치를 설정한다. 일반화 역입체 사영 파라미터 설정부(211)는, 초구(S)의 어떤 점의 접평면과 특징량 공간의 공통 집합이 초평면(H)이 되는 초구(S) 상의 점이며, 또한 그 점을 사영점으로 했을 때, 모든 특징량 데이터를 포함하는 구(S1)가 일반화 입체 사영의 상에 포함되는 초구(S) 상의 점을 사영점(P)으로 한다. 일반화 역입체 사영 파라미터 설정부(211)는, 이 때, 접평면과 초구(S)가 접하는 위치에 있는 사영점(P)의 좌표를 파라미터 p로 설정한다. 일반화 역입체 사영 파라미터 설정부(211)는, 공간(W)에 설정된 초구(S)의 북극(SN)과 남극(SS)을 연결하는 직선과 특징량 공간의 교점 좌표(x0), 및 초구(S)의 북극(SN)에 관련된 d의 각각을 파라미터 x0, d로 설정한다.
제3 제한으로서, 일반화 역입체 사영 파라미터 설정부(211)는, 특징량 공간(V)에서 정의역을 특정할 수 없는 경우에, 사영점(P)을 초구(S)의 내측에 설정하는 제한을 부여한다. 일반화 역입체 사영 파라미터 설정부(211)는, 제3 제한에 기초하여 초구(S)의 내측에 사영점의 위치(P)를 설정한다. 사영점(P)을 초구(S)의 내측에 설정하는 제한을 부여하는 예는, 예컨대, 도 6에 도시된다. 일반화 역입체 사영 파라미터 설정부(211)는, 사영점의 위치(P)를 이하와 같이 하여 설정한다.
일반화 역입체 사영 파라미터 설정부(211)는, 특징량 데이터의 평균치 μ와 분산 공분산 행렬의 최대 고유치의 평방근 σ를 구한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(211)는, x0을 μ, d를 5σ로 했을 때, 사영점(P)을 (μ1, …, μm, 0)으로 설정한다. 일반화 역입체 사영 파라미터 설정부(211)는, 설정한 파라미터 p, x0, d를 일반화 역입체 사영부(212)에 출력한다. 또, 다른 처리부에서 행해지는 처리에 관해서는 실시예 1과 동일하기 때문에 생략한다.
도 23을 이용하여 실시예 2에 관련된 분류 장치(200)의 처리의 흐름에 관해 설명한다. 사영점(P)의 존재 범위에 조건을 부여하는 처리는, 실시예 1과 동일하기 때문에 생략한다. 도 23은, 파라미터를 설정하는 제3 플로우의 예를 도시한 도면이다. 일반화 역입체 사영 파라미터 설정부(211)는, 특징량 데이터의 평균치 μ, 분산 공분산 행렬의 최대 고유치의 평방근 σ를 구한다(스텝 S30).
일반화 역입체 사영 파라미터 설정부(211)는, 사영점의 존재 범위의 조건이 초구(S)의 외부인 경우(스텝 S31 Yes), 파라미터 X0=μ, d=1, p=(μ1, …, μm, 5σ/{(5σ)2-1}1/2)로 한다(스텝 S32). 한편, 일반화 역입체 사영 파라미터 설정부(211)는, 사영점의 존재 범위의 조건이 초구(S)의 외부가 아닌 경우(스텝 S31 No), 스텝 S33의 처리로 이행한다.
일반화 역입체 사영 파라미터 설정부(211)는, 사영점의 존재 범위의 조건이 초구(S) 상인 경우(스텝 S33 Yes), 특징량 공간(V)을 하나의 초평면으로 분할했을 때에 정의역이 한쪽의 영역에 포함되는 것과 같은 초평면(H)을 정한다(스텝 S34). 또한, 일반화 역입체 사영 파라미터 설정부(211)는, 초구(S)의 어떤 점의 접평면과 특징량 공간의 공통 집합이 초평면(H)이 되는 것과 같은 초구(S) 상의 점이며, 또한 그 점을 사영점으로 했을 때 특징량 공간의 정의역이 일반화 입체 사영의 상에 포함되는 초구(S) 상의 점을 탐색한다. 일반화 역입체 사영 파라미터 설정부(211)는, 상기 조건을 만족하는 유일하게 존재하는 초구(S) 상의 점을 사영점으로 정한다(스텝 S35). 일반화 역입체 사영 파라미터 설정부(211)는, 이 때, 접평면과 초구(S)가 접하는 위치에 있는 사영점(P)의 좌표와, 공간(W)에 설정된 초구(S)의 교점(x0) 및 초구(S)의 북극(SN)에 관련된 d를, 각각 파라미터 p, x0, d로 설정한다.
한편, 일반화 역입체 사영 파라미터 설정부(211)는, 사영점의 존재 범위의 조건이 초구(S) 상이 아닌 경우(스텝 S33 No), 파라미터 X0=μ, d=5σ, p=(μ1, …, μm, 0)으로 한다(스텝 S36).
이와 같이, 분산 공분산 행렬의 최대 고유치의 평방근 σ에 기초하여 파라미터 p, x0, d를 설정함으로써, 특징량 공간의 정의역을 특정할 수 있고, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 있다.
실시예 3
도 24를 이용하여, 분류 장치(300)의 시스템 구성에 관해 설명한다. 도 24는, 실시예 3에 관련된 분류 장치의 시스템 구성을 도시한 도면이다. 도 24의 예에 도시한 바와 같이, 분류 장치(300)는, 초평면수 기억부(321), 특징량 기억부(322), 특징량 공간의 정의역 기억부(323), 쿼리 기억부(324) 및 비트열 기억 영역(332)을 갖는다. 각 기억부는, 예컨대, RAM(Random Access Memory), ROM(Read Only Memory), 플래시 메모리(Flash Memory) 등의 반도체 메모리 소자, 하드디스크나 광디스크 등의 기억 장치에 대응한다.
또한, 분류 장치(300)는, 일반화 역입체 사영 파라미터 설정부(311), 일반화 역입체 사영부(312a), 초평면 배치부(313), 변환 규칙 생성부(314), 비트열 생성부(315a) 및 산출부(316)를 갖는다. 또한, 분류 장치(300)는, 일반화 역입체 사영부(312b), 비트열 생성부(315b) 및 해밍 거리 계산부(333)를 갖는다. 각 처리부의 기능은, 예컨대, ASIC(Application Specific Integrated Circuit)나 FPGA(Field Programmable Gate Array) 등의 집적 회로에 의해 실현할 수 있다. 또한, 각 처리부의 기능은 예컨대, CPU(Central Processing Unit)가 정해진 프로그램을 실행함으로써 실현할 수 있다. 또, 일반화 역입체 사영 파라미터 설정부(311)는, 설정부의 일례이다. 일반화 역입체 사영부(312a)는, 사영부의 일례이다. 이하, 각 처리부에 관해 설명한다.
일반화 역입체 사영 파라미터 설정부(311)는, 사영점의 위치(p), 북극과 남극을 연결하는 직선과 특징량 공간의 교점 좌표(xo), 파라미터(d)를 포함하는 복수의 파라미터열 중, 근사 정밀도가 가장 높은 파라미터열 A를 정한다. 일반화 역입체 사영 파라미터 설정부(311)가 근사 정밀도가 높은 파라미터열을 설정하는 처리에 관해 3가지의 구체예를 들어 설명한다. 일반화 역입체 사영 파라미터 설정부(311)가 「언덕 오르기 탐색」을 이용하여, 근사 정밀도가 높은 파라미터열을 설정하는 예에 관해 설명한다.
일반화 역입체 사영 파라미터 설정부(311)는, 실시예 1에 관련된 순서에 기초하여 파라미터열 A의 초기값을 특정한다. 산출부(316)는, 이 초기값에 기초하여 산출되는 각 특징량 벡터의 비트열을, 비트열 생성부(315a)로부터 취득한다. 산출부(316)는, 각 특징량 벡터와 비트열을 기초로 근사 정밀도를 계산한다. 예컨대, 근사 정밀도는, 식(8) 또는 식(9)에 의해 산출된다.
Figure pat00007
‥‥(8)
Figure pat00008
‥‥(9)
여기서, 근사 정밀도를 산출하는 처리의 일례에 관해 설명한다. 산출부(316)는, 특징량 기억부(322)로부터, 어떤 특징량 벡터 va를 선출하고, 특징량 벡터 va와의 거리가, 특징량 공간 상에서 가장 가까운 특징량 벡터를, 제1위부터 제M위까지 특정한다. 특징량 벡터 va와의 거리가, 특징량 공간 상에서 가장 가까운 특징량 벡터를 특징량 벡터 va1∼vaM으로 한다. 예컨대, 식(8)에 있어서, 특징량 벡터의 수 M이, |Rk|에 대응한다.
산출부(316)는, 비트열 생성부(315a)로부터 특징량 벡터 va에 대응하는 비트열과의 거리가, 가장 가까운 비트열을, 제1위부터 제M위까지 특정하고, 특정한 비트열에 대응하는 특징량 벡터 vb1∼vbM을 특정한다. 산출부(316)는, 특징량 벡터 vb1∼vbM 중, 몇개의 특징량 벡터가, 특징량 벡터 va1∼vaM과 동일한 것인지를 계수한다. 이 계수한 수가, 식(8)의 |Rk∩Qk'|에 대응한다.
일반화 역입체 사영 파라미터 설정부(311)는, 파라미터열 A의 파라미터 공간에서의 근방치 Bi를 I개 설정한다. 산출부(316)는, 각 근방치 Bi에 대한 각각의 근사 정밀도를 산출한다. 일반화 역입체 사영 파라미터 설정부(311)는, 근사 정밀도가 가장 높은 파라미터열을, 파라미터열 A로 설정한다. 일반화 역입체 사영 파라미터 설정부(311)는, 상기 처리를 반복 실행하여, 근사 정밀도가 가장 높은 파라미터열을 특정한다.
일반화 역입체 사영 파라미터 설정부(311)가 상기 처리를 정해진 횟수 반복한 후에 얻어지는 최종적인 파라미터열 A에 기초하여 비트열이 생성되고, 해밍 거리 계산부(333)는, 비트열 기억 영역(332)에 기억되어 있는 비트열 사이의 해밍 거리를 계산한다.
다음으로, 일반화 역입체 사영 파라미터 설정부(311)가 「마르코프 연쇄 몬테카를로법」을 이용하여, 근사 정밀도가 높은 파라미터열을 설정하는 예에 관해 설명한다. 일반화 역입체 사영 파라미터 설정부(311)는, 실시예 1에 관련된 순서에 기초하여 파라미터열 A를 특정한다. 산출부(316)는, 파라미터열 A를 기초로 생성되는 각 특징량 벡터의 비트열을, 비트열 생성부(315a)로부터 취득한다.
산출부(316)는, 각 특징량 벡터와 비트열을 기초로 하여, 근사 유사 검색을 실행하여, 파라미터열 A의 근사 정밀도 X1을 계산한다. 예컨대, 근사 정밀도는, 언덕 오르기 탐색과 동일하게 하여, 식(8)에 의해 산출된다.
일반화 역입체 사영 파라미터 설정부(311)는, 파라미터열 A에 근방인 근방치 B를 설정한다. 산출부(316)는, 각 특징량 벡터와 비트열을 기초로 하여, 근사 유사 검색을 실행하여, 근방치 B에서의 근사 정밀도 X2를 계산한다.
일반화 역입체 사영 파라미터 설정부(311)는, 난수를 생성하고, 난수의 값이 X2/X1보다 작은 경우에, 근방치 B를 파라미터열 A로 설정한다. 한편, 일반화 역입체 사영 파라미터 설정부(311)는, 난수를 생성하고, 난수의 값이 X2/X1보다 작지 않은 경우에, 파라미터열의 위치를 그대로 한다. 또한, 일반화 역입체 사영 파라미터 설정부(311)는, 정해진 횟수 상기 처리를 실행한다.
다음으로, 일반화 역입체 사영 파라미터 설정부(311)가 「군 지능」을 이용하여, 근사 정밀도가 높은 파라미터열을 설정하는 예에 관해 설명한다. 일반화 역입체 사영 파라미터 설정부(311)는, 복수의 파라미터열을 특정한다. 예컨대, 일반화 역입체 사영 파라미터 설정부(311)는, 실시예 1과 동일한 수법에 의해, 파라미터열을 구하고, 또한, 이 파라미터열의 위치에 근방인 위치를 복수 구함으로써, 복수의 파라미터열의 위치를 특정한다.
일반화 역입체 사영 파라미터 설정부(311)는, 복수의 파라미터열의 위치를 기초로 산출되는 각 특징량 벡터의 비트열을, 비트열 생성부(315a)로부터 취득한다. 일반화 역입체 사영 파라미터 설정부(311)는, 각 파라미터열의 위치를, 하전 입자의 위치로 간주하고, 목적 함수를 사용하여, 하전계 탐색을 실행함으로써, 근사 정밀도가 가장 높은 파라미터열의 위치를 특정한다.
각 파라미터열을 하전 입자의 위치로 간주함으로써, 파라미터 공간 내에서 각 파라미터열을 이동시키는 경우에, 각 파라미터열이, 서로 근접하지 않는 것과 같은 제약을 형성할 수 있다. 그리고, 정해진 거리 떨어진 위치에서, 근사 정밀도가 가장 커지는 파라미터열 A를, 특정할 수 있다. 이러한 파라미터열 A를 사용하여, 해밍 거리 계산부(333)는, 해밍 거리를 계산한다.
또, 하전계 탐색의 목적 함수는, 파라미터열의 위치가 주어진 경우에, 근사 정밀도를 산출하는 함수이고, 근사 정밀도를 산출하는 처리의 내용은, 전술한 언덕 오르기 검색 및 마르코프 연쇄 몬테카를로법과 동일하다.
다음으로, 실시예 3에 관련된 분류 장치(300)의 처리 순서에 관해 설명한다. 이하에서는, 파라미터열을 특정하는 처리를, 언덕 오르기 탐색을 이용한 파라미터열 특정 처리, 마르코프 연쇄 몬테카를로법을 이용한 파라미터열 특정 처리, 군 지능을 이용한 파라미터열 특정 처리에 관해 순서대로 설명한다.
우선, 언덕 오르기 탐색을 이용한 파라미터열 특정 처리의 처리 순서의 일례에 관해 설명한다. 도 25는, 파라미터를 설정하는 제4 플로우의 예를 도시한 도면이다. 도 25에 도시한 바와 같이 일반화 역입체 사영 파라미터 설정부(311)에 있어서 파라미터열 A를 정하고 일반화 역입체 사영부(312a)에 출력한다(스텝 S40). 일반화 역입체 사영부(312a)에서, 일반화 역입체 사영 파라미터 설정부(311)의 출력 파라미터열 A를 이용하여 특징량 데이터에 대하여, 일반화 역입체 사영을 실시하고, 초평면 배치부(313)에 출력한다(스텝 S41).
일반화 역입체 사영 파라미터 설정부(311)는, 스텝 S43∼S49까지의 처리를 정해진 횟수 반복한 경우(스텝 S42 Yes), 처리를 종료시킨다. 한편, 일반화 역입체 사영 파라미터 설정부(311)는, 스텝 S43∼S49까지의 처리를 반복한 횟수가 정해진 값 이하인 경우(스텝 S42 No), 스텝 S43의 처리로 이행한다.
초평면 배치부(313)는 초평면을 배치하고, 변환 규칙 생성부(314)는 변환 규칙을 생성한다(스텝 S43). 산출부(316)는, 변환 규칙 생성부(314)의 출력을 기초로, 근사 유사 검색의 근사 정밀도를 계산한다(스텝 S44). 일반화 역입체 사영 파라미터 설정부(311)에 있어서 파라미터열 A의 파라미터 공간에서의 근방치 Bi를 복수 생성하고, 각각을 일반화 역입체 사영부(312a)에 출력한다(스텝 S45).
일반화 역입체 사영부(312a)에서, 각각의 파라미터열을 이용하여 특징량 데이터에 대하여, 일반화 역입체 사영을 실시하고, 각각을 초평면 배치부(313)에 출력한다(스텝 S46). 초평면 배치부(313)는 초평면을 배치하고, 변환 규칙 생성부(314)는 변환 규칙을 생성한다(스텝 S47). 산출부(316)는, 변환 규칙 생성부(314)의 출력을 기초로, 각 근방치 Bi에서의 근사 정밀도를 계산한다(스텝 S48). 일반화 역입체 사영 파라미터 설정부(311)는, 파라미터열 A 및 상기 근방치 Bi 중, 근사 정밀도가 가장 좋은 위치를 파라미터열 A로 한다(스텝 S49).
다음으로, 마르코프 연쇄 몬테카를로법을 이용한 파라미터열 특정 처리의 처리 순서의 일례에 관해 설명한다. 도 26은, 파라미터를 설정하는 제5 플로우의 예를 도시한 도면이다. 도 26에 도시한 바와 같이 일반화 역입체 사영 파라미터 설정부(311)에 있어서 파라미터열 A를 정하고 일반화 역입체 사영부(312a)에 출력한다(스텝 S50). 일반화 역입체 사영부(312a)에서, 일반화 역입체 사영 파라미터 설정부(311)의 출력 파라미터열 A를 이용하여 특징량 데이터에 대하여, 일반화 역입체 사영을 실시하고, 초평면 배치부(313)에 출력한다(스텝 S51).
일반화 역입체 사영 파라미터 설정부(311)는, 스텝 S53∼S59까지의 처리를 정해진 횟수 반복한 경우(스텝 S52 Yes), 처리를 종료시킨다. 한편, 일반화 역입체 사영 파라미터 설정부(311)는, 스텝 S53∼S59까지의 처리를 반복한 횟수가 정해진 값 이하인 경우(스텝 S52 No), 스텝 S53의 처리로 이행한다.
초평면 배치부(313)는 초평면을 배치하고, 변환 규칙 생성부(314)는 변환 규칙을 생성한다(스텝 S53). 산출부(316)는, 변환 규칙 생성부(314)의 출력을 기초로, 근사 유사 검색의 근사 정밀도 X1을 계산한다(스텝 S54). 일반화 역입체 사영 파라미터 설정부(311)에 있어서 파라미터열 A의 파라미터 공간에서의 근방치 B를 생성하고, 그것을 일반화 역입체 사영부(312a)에 출력한다(스텝 S55).
일반화 역입체 사영부(312a)에서, 상기 파라미터열을 이용하여 특징량 데이터에 대하여, 일반화 역입체 사영을 행하고, 그것을 초평면 배치부(313)에 출력한다(스텝 S56). 초평면 배치부(313)는 초평면을 배치하고, 변환 규칙 생성부(314)는 변환 규칙을 생성한다(스텝 S57). 산출부(316)는, 변환 규칙 생성부(314)의 출력을 기초로, 근방치 B에서의 근사 정밀도 X2를 계산한다(스텝 S58). 일반화 역입체 사영 파라미터 설정부(311)는, [0, 1]의 난수를 생성하고, 그 난수가 X2/X1보다 작으면 상기 근방치 B를 파라미터열 A로 하고, 그렇지 않으면 그대로 한다(스텝 S59).
다음으로, 군 지능을 이용한 파라미터열 특정 처리의 처리 순서의 일례에 관해 설명한다. 도 27은, 파라미터를 설정하는 제6 플로우의 예를 도시한 도면이다. 도 27에 도시한 바와 같이 일반화 역입체 사영 파라미터 설정부(311)에 있어서 파라미터열을 복수 정하고, 일반화 역입체 사영부(312a)에 출력한다(스텝 S60). 일반화 역입체 사영부(312a)에서, 일반화 역입체 사영 파라미터 설정부(311)의 출력 파라미터열을 이용하여 특징량 데이터에 대하여, 일반화 역입체 사영을 실시하고, 초평면 배치부(313)에 출력한다(스텝 S61).
일반화 역입체 사영 파라미터 설정부(311)는, 스텝 S63의 처리를 정해진 횟수 반복한 경우(스텝 S62 Yes), 처리를 종료시킨다. 한편, 일반화 역입체 사영 파라미터 설정부(311)는, 스텝 S63의 처리를 반복한 횟수가 정해진 값 이하인 경우(스텝 S62 No), 재차 스텝 S63의 처리를 행한다.
일반화 역입체 사영 파라미터 설정부(311)는, 각각의 파라미터열을 파라미터 공간 중의 하전 입자의 위치로 간주하고, 목적 함수를 사용하여 하전 입자 탐색을 행한다(스텝 S63).
도 28의 처리 플로우에서 사용되는 목적 함수에 관해 설명한다. 도 28은, 목적 함수의 처리 플로우의 일례를 도시한 도면이다. 도 28과 같이, 분류 장치(300)의 일반화 역입체 사영 파라미터 설정부(311)는, 목적 함수를 개시시킨다(스텝 S70). 초평면 배치부(313)는, 초평면을 배치하고, 변환 규칙 생성부(314)는, 변환 규칙의 생성을 행한다(스텝 S71). 산출부(316)는, 변환 규칙 생성부(314)의 출력을 기초로, 근사 유사 검색의 근사 정밀도 X1을 계산한다(스텝 S72). 산출부(316)는, 근사 정밀도 X1을 출력한다(스텝 S73). 일반화 역입체 사영 파라미터 설정부(311)는, 목적 함수를 종료시킨다(스텝 S74).
이와 같이, 설정하는 처리는, 구 내에 설정된 사영점의 위치, 구의 위치에 관한 1 이상을 포함하는 제1 파라미터와, 파라미터 공간에서 제1 파라미터에 근방인 1 이상의 제2 파라미터 중, 근사 정밀도가 가장 높은 파라미터를 제1 파라미터로 설정하는 처리를 1회 이상 행함으로써, 제1 파라미터를 설정한다. 이와 같이, 보다 적절한 사영점의 위치를 탐색함으로써, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 있다.
설정하는 처리는, 구 내에 설정된 사영점의 위치, 구의 위치에 관한 1 이상을 포함하는 제1 파라미터에, 파라미터 공간에서 근방인 제2 파라미터의 근사 정밀도를, 제1 파라미터의 근사 정밀도로 나눈 수치가 난수보다 큰 경우에, 제2 파라미터를 제1 파라미터로 설정하는 처리를 1회 이상 행함으로써, 제1 파라미터를 설정한다. 이와 같이, 보다 근사 정밀도가 높은 사영점의 위치를 탐색함으로써, 특징량 벡터를 이용한 유사 검색을 양호한 정밀도로 실행할 수 있다.
설정하는 처리는, 구 내에 하전 입자로 간주하여 배치된 복수의 사영점 중, 근사 정밀도가 가장 높은 사영점을 설정한다. 사영점을 하전 입자로 간주함으로써, 각 사영점이 분산되어 배치되기 때문에 탐색 횟수를 줄일 수 있다.
도 30은, 분류 장치의 하드웨어 구성을 도시한 도면이다. 도 30이 나타내는 바와 같이, 컴퓨터(400)는, 각종 연산 처리를 실행하는 CPU(401)와, 사용자로부터의 데이터 입력을 접수하는 입력 장치(402)와, 모니터(403)를 갖는다. 또한, 컴퓨터(400)는, 기억 매체로부터 프로그램 등을 판독하는 매체 판독 장치(404)와, 다른 장치와 접속하기 위한 인터페이스 장치(405)와, 다른 장치와 무선에 의해 접속하기 위한 무선 통신 장치(406)를 갖는다. 또한, 컴퓨터(400)는, 각종 정보를 일시 기억하는 RAM(Random Access Memory)(407)과, 하드디스크 장치(408)를 갖는다. 또한, 각 장치(401∼408)는, 버스(409)에 접속된다.
하드디스크 장치(408)에는, 예컨대, 도 1, 도 22 및 도 24에 도시한 각 처리부와 동일한 기능을 갖는 정보 처리 프로그램이 기억된다. 혹은, 하드디스크 장치(408)에는, 도 1, 도 22 및 도 24에 도시한 각 처리부와 동일한 기능을 갖는 정보 처리 프로그램이 기억된다. 또한, 하드디스크 장치(408)에는, 정보 처리 프로그램을 실현하기 위한 각종 데이터가 기억된다.
CPU(401)는, 하드디스크 장치(408)에 기억된 각 프로그램을 판독하여, RAM(407)에 전개하여 실행함으로써, 각종 처리를 행한다. 이들 프로그램은, 컴퓨터(400)를 도 1, 도 22 및 도 24에 도시한 각 처리부로서 기능시킬 수 있다.
또, 상기한 정보 처리 프로그램은, 반드시 하드디스크 장치(408)에 기억되어 있을 필요는 없다. 예컨대, 컴퓨터(400)가 판독 가능한 기억 매체에 기억된 프로그램을, 컴퓨터(400)가 판독하여 실행하도록 해도 좋다. 컴퓨터(400)가 판독 가능한 기억 매체는, 예컨대, CD-ROM이나 DVD 디스크, USB(Universal Serial Bus) 메모리 등의 휴대형 기록 매체, 플래시 메모리 등의 반도체 메모리, 하드디스크 드라이브 등이 대응한다. 또한, 공중 회선, 인터넷, LAN(Local Area Network) 등에 접속된 장치에 이 프로그램을 기억시켜 놓고, 컴퓨터(400)가 이들로부터 프로그램을 판독하여 실행하도록 해도 좋다.
100 : 분류 장치, 111 : 일반화 역입체 사영 파라미터 설정부, 112a, 112b : 일반화 역입체 사영부, 113 : 초평면 배치부, 114 : 변환 규칙 생성부, 115a, 115b : 비트열 생성부, 121 : 초평면수 기억부, 122 : 특징량 기억부, 123 : 특징량 공간의 정의역 기억부, 124 : 쿼리 기억부, 132 : 비트열 기억 영역, 133 : 해밍 거리 계산부

Claims (9)

  1. 컴퓨터가 실행하는 분류 방법으로서,
    특징량 공간의 정의역의 정보에 기초하여 사영점(射影点)의 위치를 설정하고,
    설정된 상기 사영점의 위치를 이용하여, 상기 특징량 공간에 존재하는 벡터를, 특징량 공간의 차원보다 1차원 이상 큰 차원의 공간에 존재하는 구(球)에 사영하는 처리를 실행하는 것을 특징으로 하는 분류 방법.
  2. 제1항에 있어서, 상기 설정하는 처리는, 상기 특징량 공간의 정의역의 정보에 기초하여 상기 구의 위치를 설정하는 것을 특징으로 하는 분류 방법.
  3. 제1항에 있어서, 상기 설정하는 처리는, 상기 특징량 공간의 정의역이 타원형의 영역에 포함되는 경우에, 상기 구의 외부이며, 또한 상기 특징량 공간과 반대측의 위치에 사영점을 설정하는 것을 특징으로 하는 분류 방법.
  4. 제1항에 있어서, 상기 설정하는 처리는, 상기 특징량 공간의 정의역이, 상기 특징량 공간을 하나의 평면으로 분할한 영역에 포함되는 경우에, 상기 구의 표면에 사영점을 설정하는 것을 특징으로 하는 분류 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 설정하는 처리는, 상기 구 내에 설정된 상기 사영점의 위치, 상기 구의 위치에 관한 1 이상을 포함하는 제1 파라미터와, 파라미터 공간에서 상기 제1 파라미터에 근방인 1 이상의 제2 파라미터 중, 근사 정밀도가 가장 높은 파라미터를 제1 파라미터로 설정하는 처리를 1회 이상 행함으로써, 제1 파라미터를 설정하는 것을 특징으로 하는 분류 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 설정하는 처리는, 상기 구 내에 설정된 상기 사영점의 위치, 상기 구의 위치에 관한 1 이상을 포함하는 제1 파라미터에, 파라미터 공간에서 근방인 제2 파라미터의 근사 정밀도를, 상기 제1 파라미터의 근사 정밀도로 나눈 수치가 난수보다 큰 경우에, 상기 제2 파라미터를 상기 제1 파라미터로 설정하는 처리를 1회 이상 행함으로써, 제1 파라미터를 설정하는 것을 특징으로 하는 분류 방법.
  7. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 설정하는 처리는, 상기 구 내에 하전 입자로 간주하여 배치된 복수의 사영점 중, 근사 정밀도가 가장 높은 사영점을 설정하는 것을 특징으로 하는 분류 방법.
  8. 특징량 공간의 정의역의 정보에 기초하여 사영점의 위치를 설정하는 설정부와,
    설정된 상기 사영점의 위치를 이용하여, 상기 특징량 공간에 존재하는 벡터를, 특징량 공간의 차원보다 1차원 이상 큰 차원의 공간에 존재하는 구에 사영하는 사영부를 갖는 것을 특징으로 하는 분류 장치.
  9. 컴퓨터에,
    특징량 공간의 정의역의 정보에 기초하여 사영점의 위치를 설정하고,
    설정된 상기 사영점의 위치를 이용하여, 상기 특징량 공간에 존재하는 벡터를, 특징량 공간의 차원보다 1차원 이상 큰 차원의 공간에 존재하는 구에 사영하는 처리를 실행시키는 것을 특징으로 하는 분류 프로그램을 저장하는 기록 매체.
KR1020150013498A 2014-03-07 2015-01-28 분류 방법, 분류 장치 및 기록 매체 KR101662938B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2014-045575 2014-03-07
JP2014045575A JP6269186B2 (ja) 2014-03-07 2014-03-07 分類方法、分類装置および分類プログラム

Publications (2)

Publication Number Publication Date
KR20150105193A true KR20150105193A (ko) 2015-09-16
KR101662938B1 KR101662938B1 (ko) 2016-10-05

Family

ID=52102578

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150013498A KR101662938B1 (ko) 2014-03-07 2015-01-28 분류 방법, 분류 장치 및 기록 매체

Country Status (5)

Country Link
US (1) US10134176B2 (ko)
EP (1) EP2916481B1 (ko)
JP (1) JP6269186B2 (ko)
KR (1) KR101662938B1 (ko)
CN (1) CN104899901B (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017149598A1 (ja) * 2016-02-29 2017-09-08 三菱電機株式会社 機器分類装置
JP7137064B2 (ja) * 2018-10-19 2022-09-14 富士通株式会社 最適化装置及び最適化装置の制御方法
US11853891B2 (en) 2019-03-11 2023-12-26 Sharecare AI, Inc. System and method with federated learning model for medical research applications
CN110321942A (zh) * 2019-06-25 2019-10-11 华中科技大学 一种基于球形特征的细粒度图像分类方法与装置
US11915802B2 (en) 2019-08-05 2024-02-27 Sharecare AI, Inc. Accelerated processing of genomic data and streamlined visualization of genomic insights
US11177960B2 (en) * 2020-04-21 2021-11-16 Sharecare AI, Inc. Systems and methods to verify identity of an authenticated user using a digital health passport

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10247243A (ja) 1997-03-04 1998-09-14 Mitsubishi Heavy Ind Ltd 識別装置
JP2009133798A (ja) 2007-12-03 2009-06-18 Furuno Electric Co Ltd 位置検出方法および位置検出装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5014327A (en) * 1987-06-15 1991-05-07 Digital Equipment Corporation Parallel associative memory having improved selection and decision mechanisms for recognizing and sorting relevant patterns
US5276771A (en) * 1991-12-27 1994-01-04 R & D Associates Rapidly converging projective neural network
US6167390A (en) * 1993-12-08 2000-12-26 3M Innovative Properties Company Facet classification neural network
EP1709442A4 (en) * 2003-12-11 2010-01-20 Correlogic Systems Inc METHOD FOR DIAGNOSING BIOLOGICAL CONDITIONS BY USING A CENTRALIZED ADAPTIVE MODEL AND SAMPLE PREPARATION
CN102037676B (zh) * 2008-03-20 2015-02-25 日内瓦大学 基于不可克隆特征的安全物品识别以及认证系统和方法
CN101710388A (zh) * 2009-12-28 2010-05-19 哈尔滨工业大学 基于直方图特征核优化判别分析的三维碎片的类别检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10247243A (ja) 1997-03-04 1998-09-14 Mitsubishi Heavy Ind Ltd 識別装置
JP2009133798A (ja) 2007-12-03 2009-06-18 Furuno Electric Co Ltd 位置検出方法および位置検出装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
비특허문헌 1 : M. Datar, N. Immorlica, P. Indyk, V. S. Mirrokni : Locality-Sensitive Hashing Scheme Based on p-Stable Distributions, Proceedings of the twentieth annual symposium on Computational geometry(SCG) 2004
비특허문헌 2 : Jae-Pil Heo, Youngwoon Lee, Junfeng He, Shih-Fu Chang, and Sung-Eui Yoon. "Spherical hashing", In CVPR, pp. 2957-2964, 2012.
비특허문헌 3 : Kengo Terasawa and Yuzuru Tanaka. "Spherical lsh for approximate nearest neighbor search on unit hyper-sphere", In Frank K. H. A. Dehne, Jorg-Rudiger Sack, and Norbert Zeh, editors, WADS, Vol. 4619 of Lecture Notes in Computer Sciene, pp. 27-38. Springer, 2007.

Also Published As

Publication number Publication date
US20150254890A1 (en) 2015-09-10
US10134176B2 (en) 2018-11-20
CN104899901B (zh) 2018-01-05
KR101662938B1 (ko) 2016-10-05
EP2916481B1 (en) 2016-12-28
JP2015170217A (ja) 2015-09-28
EP2916481A1 (en) 2015-09-09
JP6269186B2 (ja) 2018-01-31
CN104899901A (zh) 2015-09-09

Similar Documents

Publication Publication Date Title
KR101662938B1 (ko) 분류 방법, 분류 장치 및 기록 매체
KR101662904B1 (ko) 검색 방법, 기억 매체 및 검색 장치
CN103631928A (zh) 一种基于局部敏感哈希的聚类索引方法及系统
Zhou et al. Octr: Octree-based transformer for 3d object detection
He et al. Machine learning in physics and geometry
KR101642597B1 (ko) 공간 분할 방법, 공간 분할 장치 및 기록 매체
Chen et al. Polydiffuse: Polygonal shape reconstruction via guided set diffusion models
KR101642598B1 (ko) 공간 분할 방법, 공간 분할 장치 및 기억 매체
CN105550208A (zh) 基于谱哈希的相似性存储设计方法
Lou et al. Gravitational co-evolution and opposition-based optimization algorithm
Nguyen et al. Improve performance of Pareto corner search-based objective reduction in many-objective optimization
Węgrzyn et al. A genetic algorithm-evolved 3D point cloud descriptor
CN116664645B (zh) 一种点云匹配方法、装置、电子装置和存储介质
Chandar et al. Enhancing cluster compactness using genetic algorithm initialized K-means
Ghorbani et al. Continuous Mutual Nearest Neighbour Processing on Moving Objects in Spatiotemporal Datasets
Hu et al. Generalized trajectory fuzzy clustering based on the multi-objective mixed function
Buck et al. Object set matching with an evolutionary algorithm
CN115687996A (zh) 一种车道线分类拟合方法及系统
Kukin The Big Valley conjecture for the flow Steiner tree problem

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant