KR101639502B1 - 클러스터링 방법, 관련장치, 프로그램 및 기록매체 - Google Patents

클러스터링 방법, 관련장치, 프로그램 및 기록매체 Download PDF

Info

Publication number
KR101639502B1
KR101639502B1 KR1020147026522A KR20147026522A KR101639502B1 KR 101639502 B1 KR101639502 B1 KR 101639502B1 KR 1020147026522 A KR1020147026522 A KR 1020147026522A KR 20147026522 A KR20147026522 A KR 20147026522A KR 101639502 B1 KR101639502 B1 KR 101639502B1
Authority
KR
South Korea
Prior art keywords
distance
cluster
objects
clusters
obtaining
Prior art date
Application number
KR1020147026522A
Other languages
English (en)
Other versions
KR20150117201A (ko
Inventor
지준 첸
보 장
타오 장
린 왕
Original Assignee
시아오미 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시아오미 아이엔씨. filed Critical 시아오미 아이엔씨.
Publication of KR20150117201A publication Critical patent/KR20150117201A/ko
Application granted granted Critical
Publication of KR101639502B1 publication Critical patent/KR101639502B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

본 발명의 실시예는 오브젝트 사이의 거리에 대응되는, 두 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 클러스터 사이의 가중거리를 획득하는 바, 즉 오브젝트 사이의 거리에 중량을 부여하는 단계와, 가중거리가 병합조건에 부합되는 클러스터를 병합하다가 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때에 중지하여 클러스터링 결과를 획득하는 단계를 포함하는 클러스터링 방법, 관련장치, 프로그램 및 기록매체를 공개한다. 상기 가중거리와 두 오브젝트의 유사성이 서로 관련되기 때문에 서로 다른 오브젝트 사이의 거리의 기여가 다르고 유사성이 클수록 대응되는 기여도 더욱 크므로 클러스터링 결과의 정확도를 제고하였다.

Description

클러스터링 방법, 관련장치, 프로그램 및 기록매체{CLUSTERING METHOD AND DEVICE RELATED TO THE SAME}
본원 발명은 출원번호가 201410096608.9이고, 출원일자가 2014년 3월 14일인중국특허출원에 기반하여 제출하였고, 상기 중국특허출원의 우선권을 주장하는 바,상기 중국특허출원의 모든 내용은 본원 발명에 원용된다.
본 발명은 컴퓨터 기술분야에 관한 것으로서, 특히 클러스터링 방법, 관련장치, 프로그램 및 기록매체에 관한 것이다.
클러스터링은 물리적 또는 추상적 오브젝트의 집합을 유사한 오브젝트로 이루어진 다수의 클러스터로 나뉘는 과정, 즉 오브젝트를 서로 다른 클러스터 또는 무리에 분류시키는과정인 바, 동일 클러스터에서의 오브젝트는 아주 큰 유사성을 갖고있고 서로 다른 클러스터에서의 오브젝트는 아주 큰 상이성을 갖고있다. 계층적 클러스터링 방법(hierarchical clustering method)은 주어진 오브젝트에 대하여 어느 중지조건을 만족시킬 때까지 계층적 분해를 하는 것이다. 응집된 계층적 클러스터링 방법은 아래로부터 위로의 책략으로서, 우선 매 오브젝트를 하나의 클러스터로 하고 그후 이러한 클러스터를 병합하여 어느 중지조건을 만족시킬 때까지 더욱더 큰 클러스터가 되도록 하는 것이다. 대다수의 계층적 클러스터링 방법이 이런 류에 속하는 바 단지 클러스터 사이의 유사도에 대한 정의가 다를 뿐이다.
예를 들어, 클러스터링 방법이 이미지의 분류에 사용될 경우, 동일인에 속하는 이미지를 하나의 클러스터로 나누고, 관련된 클러스터링 방법은 단지 클러스터와 클러스터 사이의 거리를 이용하여 두 얼굴 간의 유사도를 측정하는 바, 각 오브젝트 사이의 거리가 유사도 측정에 대한 기여가 기본적으로 같으므로 이러한 클러스터링 방법의 클러스터링 결과의 정확도가 비교적 낮다.
기술적 과제
관련 기술 중, 존재하는 문제를 극복하기 위해, 본 발명은 클러스터링 방법, 관련장치, 프로그램 및 기록매체를 제공한다.
과제 해결 수단
상기의 기술적 과제를 해결하기 위해, 본 발명의 실시예는 하기와 같은 기술적 해결방법을 공개한다.
본 발명의 실시예의 제1양태에 따르면,
모든 병합하고자 하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는, 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중된 거리(이하 가중거리라 약함)를 획득하는 단계와, 두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하는 단계와, 병합가능한 클러스터가 존재할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때까지 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 것을 수행하는 단계로 되돌아가 클러스터링 결과를 획득하는 단계를 포함하는 클러스터링 방법을 제공한다.
제1양태를 결부시키면, 제1양태의 첫번째 실시가능한 형태에 있어서, 상기 방법은, 샘플 오브젝트 통계치에 따라 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득하는 단계와, 상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑관계를 결정하는 단계를 더 포함한다.
제1양태의 첫번째 실시가능한 형태를 결부시키면, 제1양태의 두번째 실시가능한 형태에 있어서, 상기 대응관계에 따라 상기 오브젝트 사이의 거리와 가중치 간의 매핑관계를 결정하는 단계는,
상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률을 획득하는 방식과, 상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하는 방식을 사용한다.
제1양태 또는 제1양태의 첫번째 실시가능한 형태를 결부시키면, 제1양태의 세번째 실시가능한 형태에 있어서, 상기 가중거리가 제1클러스터와 제2클러스터 사이의 가중거리이고, 상기 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계는,
상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 방식과, 상기 제2클러스터로부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 획득하는 방식과, 상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라 상기 제1클러스터와 상기 제2클러스터의 가중거리를 획득하는 방식을 사용한다.
제1양태의 세번째 실시가능한 형태를 결부시키면, 제1양태의 네번째 실시가능한 형태에 있어서, 상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 단계는,
상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하는 방식과, 상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 최소 가중거리를 획득하는 방식과, 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터에서 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 획득하는방식과,
상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터에서의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 획득하는 방식과, 상기 제1클러스터에서의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 가중거리에 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 방식을 사용한다.
본 발명의 실시예의 제2양태에 따르면,
모든 병합하고자 하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는, 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하기 위한 획득유닛과,
두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하기 위한 판정유닛과,
병합가능한 클러스터가 존재할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 상기 획득유닛이 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때까지 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의의 가중거리를 획득하는 단계를 수행하도록 하여 클러스터링 결과를 획득하기 위한 병합유닛을 포함하는 클러스터링 장치를 제공한다.
제2양태를 결부시키면, 제2양태의 첫번째 실시가능한 형태에 있어서, 상기 장치는,
샘플 오브젝트 통계치에 따라 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득하기 위한 통계유닛과,
상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑관계를 결정하기 위한 결정유닛을 더 포함한다.
제2양태의 첫번째 실시가능한 형태를 결부시키면, 제2양태의 두번째 실시가능한 형태에 있어서, 상기 결정유닛은,
상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일인의 확률인지를 획득하기 위한 검색 서브유닛과,
상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하기 위한 결정 서브유닛을 포함한다.
제2양태의 첫번째 실시가능한 형태 또는 제2양태의 두번째 실시가능한 형태를 결부시키면, 제2양태의 세번째 실시가능한 형태에 있어서, 상기 가중거리가 제1클러스터와 제2클러스터 사이의 가중거리이고, 상기 획득유닛은,
상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터 내의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하기 위한 제1획득 서브유닛과,
상기 제1클러스터의 모든 오브젝트에 대해, 상기 유사성이 가장 큰 거리 및 대응되는 제1가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하기 위한 제2획득 서브유닛과,
상기 제2클러스터로부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 획득하기 위한 제3획득 서브유닛과,
상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라 상기 제1클러스터와 상기 제2클러스터의 가중거리를 획득하기 위한 제4획득 서브유닛을 포함한다.
제2양태의 세번째 실시가능한 형태를 결부시키면, 제2양태의 네번째 실시가능한 형태에 있어서, 상기 제2획득 서브유닛은,
상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하기 위한 제5획득 서브유닛과,
상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 최소 가중거리를 획득하기 위한 제6획득 서브유닛과,
상기 제1클러스터에서의 오브젝트와 상기 제2클러스터에서 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 획득하기 위한 제7획득 서브유닛과,
상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터에서의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 획득하기 위한 제8획득 서브유닛과,
상기 제1클러스터에서의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 가중거리에 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하기 위한 제9획득 서브유닛을 포함한다.
본 발명의 실시예의 제3양태에 따르면,
모든 병합하고자 하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는, 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 얻고,
두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하며,
두 클러스터가 병합가능할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때까지 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계로 되돌아가 클러스터링 결과를 얻도록 배치되는 프로세서와;
프로세서에 의해 수행가능한 인스트럭션을 저장하기 위한 메모리를 포함하는 단말기기를 제공한다.
본 발명의 제4양태에 따르면, 프로세서에 의해 실행되는 것을 통하여 상기전원 충전 방법을 실현하는 프로그램을 제공한다.
본 발명의 제5양태에 따르면, 상기 프로그램이 기록된 기록매체를 제공한다.
발명의 효과
본 발명의 실시예에서 제공되는 기술적 해결방법은 하기와 같은 유리한 효과를 포함할 수 있다. 상기 클러스터링 방법은, 오브젝트 사이의 거리에 대응되는, 두 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 클러스터 사이의 가중거리를 획득하는 바, 즉 오브젝트 사이의 거리에 중량을 부여하는 단계와, 가중거리가 병합조건에 부합되는 클러스터를 병합하다가 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때에 중지하여 클러스터링 결과를 획득하는 단계를 포함한다. 상기 가중거리와 두 오브젝트의 유사성이 서로 관련되기때문에 서로 다른 오브젝트 사이의 거리의 기여가 다르고 유사성이 클수록 대응되는 기여도 더욱 크므로 클러스터링 결과의 정확도를 제고하였다.
상기 일반적인 설명과 후술할 세부사항에 대한 설명은 단지 예시적인 것일 뿐 본 발명을 제한하는 것이 아님을 이해해야 할 것이다.
아래의 도면은 명세서의 일부분으로서 명세서 전체를 구성하며 본 발명에 맞는 실시예를 예시하여 본 발명의 원리를 해석하기 위한 것이다.
도1은 일 예시적 실시예에 따라 보여준 클러스터링 방법의 흐름도이다.
도2는 일 예시적 실시예에 따라 보여준 도1에서의 단계S110의 흐름도이다.
도3은 일 예시적 실시예에 따라 보여준 도2에서의 단계S111의 흐름도이다.
도4는 일 예시적 실시예에 따라 보여준 가중치를 획득하는 흐름도이다.
도5는 일 예시적 실시예에 따라 보여준 클러스터링 장치의 설명도이다.
도6은 일 예시적 실시예에 따라 보여준 다른 클러스터링 장치의 설명도이다.
도7은 일 예시적 실시예에 따라 보여준 단말기기의 블록도이다.
도8은 일 예시적 실시예에 따라 보여준 서버의 블록도이다.
상기 도면을 통하여 본 발명의 명확한 실시예를 도시하였고 하기 내용에서 더욱 상세히 설명한다. 이러한 도면과 문자 설명은 그 어떤 방식으로 본 발명의 취지의 범위를 한정하려는 것이 아니라 특정된 실시예를 참고로 하여 본 기술 분야의 당업자로 하여금 본 발명의 개념을 이해하도록 하기 위한 것이다.
도1은 일 예시적 실시예에 따라 보여준 클러스터링 방법의 흐름도이다.도1에 도시된 바와 같이, 상기 클러스터링 방법은 하기와 같은 단계를 포함할 수 있다.
단계S110에서, 모든 병합하고자 하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는, 상기 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득한다.
오브젝트를 얼굴 이미지라고 가정하면, 본 발명에서 제공되는 상기 클러스터링방법은 동일인에 속하는 이미지를 한데 응집하여 하나의 클러스터링을 형성할 수 있다. 얼굴 이미지에서의 특정을 한조의 벡터로 변환시키므로 오브젝트 사이의 거리가 바로 벡터 간 거리이다. 물론, 본 발명에서 제공되는 클러스터링 방법은또한 이미지 외의 기타 데이터에 적용될 수 있다.
클러스터링전에, 우선 초기화하여 매 오브젝트를 하나의 클러스터로 분류시키고 클러스터와 클러스터 사이의 거리 즉 클러스터에 포함되는 오브젝트 사이의 거리(예를 들어, 코사인 유사도, 유클리드 거리 등)를 산출한다.
오브젝트 사이의 유사성이 클수록 대응되는 가중치가 더욱 크고; 반면, 오브젝트 사이의 유사성이 작을수록 대응되는 가중치가 더욱 작다. 예를 들어, 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일 오브젝트의 확률인지에 따라 상기 가중치를 결정할 수 있다. 또는, 가중 핵함수 w=f(d)를 이용하여 가중치를 획득하는데여기서, w는 가중치이고 d는 오브젝트 사이의 거리이며, 예를 들어,
Figure 112014090003494-pct00001
이며; 또는, 미리 설정 임계값를 이용하여 가중치를 얻을 수도 있는데 이에 대해서는 일일이 예를 들지 않기로 한다.
본 발명의 일 실시예에 있어서, 도2에 도시된 바와 같이, 단계S110은 하기와 같은 단계S111~단계S113을 포함할 수 있다.
단계S111에서, 상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득한다.
본 발명의 일 실시예에 있어서, 도3에 도시된 바와 같이, 상기 단계S111은 하기와 같은 단계S1111~단계S1115를 포함할 수 있다.
단계S1111에서, 상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터내의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득한다.
제1클러스터를 A로, 제2클러스터를 B로 표기하여 클러스터A와 클러스터B 간의 가중거리를 산출한다고 가정하면, 우선 A에서의 임의의 하나의 오브젝트Ai와 클러스터B에서의 모든 오브젝트 사이의 거리d(Ai, B)를 산출하고, 오브젝트Ai와 클러스터B 중 모든 오브젝트 사이의 유사성이 가장 큰 거리를 획득한다. 본 실시예는 코사인 유사도를 이용하므로 최대 코사인 유사도
Figure 112014090003494-pct00002
에 대응되는 오브젝트 사이의 유사성이 가장 크다.
본 발명의 일 예시적 실시예에 있어서, 상기 가중치는 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일 오브젝트의 확률인지에 따라 얻어질 수 있고, 도4에 도시된 바와 같이, 하기와 같은 단계를 포함할 수 있다.
단계S100에서, 샘플 오브젝트 통계치에 따라 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득한다.
예를 들어, 얼굴 인식에 있어서, 고차원 특징에 따라 산출된 두 얼굴 이미지의 코사인 유사도 cosθ의 범위는 [0,1]이고, 대량의 얼굴 이미지 통계 데이터에 따라 코사인 유사도가 [0.45,1]범위내에 있을 경우, 두 오브젝트가 동일인일 확률이 기본상98%이고; 코사인 유사도가 [0.35, 0.45]범위내에 있을 경우, 두 오브젝트가 동일인일 확률이 기본상 70%이고; 코사인 유사도가 [0.25, 0.35]범위내에 있을 경우, 두 오브젝트가 동일인일 확률이 기본상 40%이고; 코사인 유사도가 [0.15, 0.25]범위내에 있을 경우, 두 오브젝트가 동일인일 확률이 기본상 10%이며; 코사인 유사도가 [0, 0.15]범위내에 있을 경우, 두 오브젝트가 동일인일 확률이 기본상 0.1%이라는 것을 획득한다.
상기의 통계결과에 따르면, 하기와 같은 공식(1)을 이용하여 가중치와 코사인 유사도 간의 관계를 설명할 수 있다.
Figure 112014090003494-pct00003
공식(1)은 코사인 유사도와 두 오브젝트가 동일인의 확률 간의 대응관계인지에 따른 것이다. 기타 유형의 거리는 거리와 거리에 대응되는 확률 간의 관계에 따라 도출된 것이고 이에 대해서는 더는 반복 설명하지 않는다.
단계S200에서, 상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑관계를 결정한다.
오브젝트 사이의 거리를 얻은후 상기 오브젝트 사이의 거리가 공식(1) 중 어느 구간 내에 있는지를 판정하고 마지막으로 공식(1)에 따라 상기 오브젝트 사이의 거리 및 가중치 간의 매핑관계를 결정하며; 상기 방식에 따라
Figure 112014090003494-pct00004
에 대응되는 가중치가
Figure 112014090003494-pct00005
로 얻어진다.
단계S1112에서, 상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 최소 가중거리(최대 코사인 유사도)를 획득한다.
공식(2)에 따라 Ai와 클러스터B 간의 최소 가중거리
Figure 112014090003494-pct00006
를 획득한다.
Figure 112014090003494-pct00007
단계S1113에서, 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터에서 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 획득한다.
클러스터A에서의 오브젝트Ai와 클러스터B에서의 오브젝트b 간의 거리가 최대라고 가정하면, 공식(3)에 따라 오브젝트Ai와 클러스터B에서의 오브젝트b 외의 기타 각 오브젝트 사이의 평균 가중거리
Figure 112014090003494-pct00008
를 획득한다.
Figure 112014090003494-pct00009
단계S1114에서, 상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터에서의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 획득한다.
Ai와 클러스터B 간의 최소 가중거리
Figure 112014090003494-pct00010
와 평균 가중거리
Figure 112014090003494-pct00011
로부터, 공식(4)에 따라 오브젝트Ai로부터 클러스터B까지의 가중거리
Figure 112014090003494-pct00012
를 획득한다.
Figure 112014090003494-pct00013
단계S1115에서, 상기 제1클러스터에서의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 유사성이 가장 큰 거리에 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득한다.
공식(5)에 따라 클러스터A와 클러스터B 간의 제1 단방향의 가중거리S(A,B)를 획득한다.
Figure 112014090003494-pct00014
공식(5)에서,
Figure 112014090003494-pct00015
는 클러스터A에서의 오브젝트Ai와 클러스터B에서의모든 오브젝트 사이의 최대 코사인 유사도(최소 거리)
Figure 112014090003494-pct00016
에 대응되는 가중치를 나타낸다.
단계S112에서, 상기 제2클러스터로부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 획득한다.
클러스터B로부터 클러스터A까지의 제2 단방향의 가중거리S(B, A)를 산출하여 얻고, 산출에 의하면 클러스터A로부터 클러스터B까지의 제1 단방향의 가중거리가 비슷하여 이에 대해서는 더는 반복 설명하지 않는다.
단계S113에서, 상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라 상기 제1클러스터와 상기 제2클러스터의 가중거리를 획득한다.
공식(6)에 따라 클러스터A와 클러스터B 간의 가중거리H(A,B)를 산출하여 획득한다.
Figure 112014090003494-pct00017
단계S120에서, 두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정한다. 병합가능한 클러스터가 존재할 경우, 단계S130을 수행하고; 병합가능한 클러스터가 존재하지 않을 경우, 단계S140을 수행한다.
상기 소정의 거리 임계값은 서로 다른 오브젝트의 데이터 유형에 따라 설정될 수 있고, 또한 산출되어 얻어진 오브젝트 사이의 거리의 유형(예를 들어, 코사인 유사도, 유클리드 거리등)에 따라 설정되며, 예를 들어, 오브젝트는 얼굴 이미지이고, 또한 오브젝트 사이의 거리는 코사인 유사도이며 거리 임계값은 0.3~0.35로 설정될 수 있다.
가중거리를 산출할 때 이용되는 클러스터 사이의 거리의 유형은 다르고 두 클러스터가 병합가능한지를 판정하는 조건도 다르다.
클러스터 사이의의 코사인 유사도에 따라 클러스터의 가중거리를 얻을 경우, 두 클러스터 사이의 가중거리가 상기 소정의 거리 임계값보다 작지 않은지를 판정하고, 두 클러스터 사이의 가중거리가 상기 소정의 거리 임계값보다 작지 않을 경우, 두 클러스터의 유사성이 비교적 커 병합할 수 있음을 표명한다.
클러스터 사이의 가중거리가 유클리드 거리 또는 기타 거리에 의해 산출되어 얻어질 경우, 두 클러스터 사이의 가중거리가 소정의 거리 임계값보다 크지 않은지를 판정하고, 두 클러스터 사이의 가중거리가 상기 소정의 거리 임계값보다 크지 않을 경우, 두 클러스터의 유사성이 비교적 커 병합할 수 있음을 표명한다.
본 발명의 실시예에서 제공되는 가중거리는 클러스터 사이의 최소 가중거리와 평균 가중거리를 이용하여 얻어지고, 이렇게 오브젝트가 비교적 많은 클러스터를 고려하는 동시에 오브젝트가 적은 클러스터도 고려할 수 있어 얼굴 클러스터링의 특점에 매우 부합되므로 상기 가중거리를 이용하여 클러스터링을 함으로써클러스터링 정확도를 제고할 수 있다.
두 클러스터가 병합가능할 경우, 단계S130에서, 모든 병합가능한 클러스터를 각각 병합시킨다.
단계S140에서, 병합 후의 클러스터 개수가 병합 전의 클러스터 개수보다 적은지를 판정하는 바, 적을 경우, 단계S110을 수행하고, 그렇지 않을 경우, 단계S150에 진입한다.
병합 후의 클러스터 개수가 병합 전의 클러스터 개수보다 적을 경우, 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때까지 즉 병합가능한 클러스터가 없을 때까지, 모든 병합하고자하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 것을 수행하는 단계로 되돌아가 클러스터링 결과를 획득한다.
단계S150에서, 클러스터링 결과를 획득한다.
하나의 클러스터에 응집될 경우, 오브젝트의 유사성이 아주 크고 상이성이 아주 작다. 얼굴 이미지를 오브젝트로, 하나의 클러스터에 응집된 얼굴 이미지는 동일인의 이미지이다.
본 발명의 실시예에서 제공되는 클러스터링 방법에 따르면, 오브젝트 사이의 거리에 대응되는, 두 오브젝트의 유사성에 의해 결정되는 가중치에 따라 클러스터 사이의 가중거리를 획득하는 바, 즉 오브젝트 사이의 거리에 중량을 부여하고, 가중거리가 병합조건에 부합되는 클러스터를 병합하다가 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때에 중지하여 클러스터링 결과를 획득한다. 상기 가중거리와 두 오브젝트의 유사성이 서로 관련되어 오브젝트의 유사성이 서로 다르고 대응되는 클러스터링 결과에 대한 기여도 다르며, 유사성이 클수록 대응되는 기여도 더욱 크므로 클러스터링 결과의 정확도를 제고하였다.
도5는 일 예시적 실시예에 따라 보여준 클러스터링 장치의설명도이다. 도5를 참조하면, 이 장치는 획득유닛(100), 판정유닛(200)과 병합유닛(300)을 포함한다.
상기 획득유닛(100)은 모든 병합하고자 하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는, 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 얻도록 배치된다.
상기 획득유닛(100)은 상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터 내의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 얻도록 배치된 제1획득 서브유닛과, 상기 제1클러스터의 모든 오브젝트에 대해, 상기 유사성이 가장 큰 거리 및 대응되는 제1가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 얻도록 배치된 제2획득 서브유닛과, 상기 제2클러스터로부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 얻도록 배치된 제3획득 서브유닛과, 상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라 상기 제1클러스터와 상기 제2클러스터의 가중거리를 얻도록 배치된 제4획득 서브유닛을 포함할 수 있다.
본 발명의 일 실시예에 있어서, 상기 제2획득 서브유닛은 상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 얻도록 배치된 제5획득 서브유닛과, 상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 최소 가중거리를 얻도록 배치된 제6획득 서브유닛과, 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터에서 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 얻도록 배치된 제7획득 서브유닛과, 상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터에서의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 얻도록 배치된 제8획득 서브유닛과, 상기 제1클러스터에서의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 가중거리에 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 얻도록 배치된 제9획득 서브유닛을 포함할 수 있다.
상기 판정유닛(200)은 두 클러스터 사이의 가중거리 및 미리설정 거리 임계값에 따라 두 클러스터가 병합가능한 클러스터인지를 판정하도록 배치된다.
상기 병합유닛(300)은 두 클러스터가 병합가능할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때까지 즉 병합가능한 클러스터가 없을 때까지, 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계를 수행하여 클러스터링 결과를 얻도록 배치된다.
본 발명의 실시예에서 제공되는 클러스터링 장치에 따르면, 획득유닛이 오브젝트 사이의 거리에 대응되는, 두 오브젝트의 유사성에 의해 결정되는 가중치에 따라 클러스터 사이의 가중거리를 획득하는 바, 즉 오브젝트 사이의 거리에 중량을 부여하고; 판정유닛이 가중거리에 따라 병합가능한 클러스터를 판정한후, 병합유닛이 가중거리가 병합조건에 부합되는 클러스터를 병합하다가 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때에 중지하여 클러스터링 결과를 획득한다. 상기 가중거리와 두 오브젝트의 유사성이 서로 관련되어 오브젝트의 유사성이 다르고, 대응되는 클러스터링 결과에 대한 기여도 다르며, 유사성이 클수록 대응되는 기여도 더욱 크므로 클러스터링 결과의 정확도를 제고하였다.
도6은 일 예시적 실시예에 따라 보여준 다른 클러스터링 장치의 설명도이다. 도6을 참조하면, 상기 장치는 통계유닛(400), 결정유닛(500), 획득유닛(100), 판정유닛(200)과 병합유닛(300)을 포함한다. 여기서, 명칭 및 부호에 있어서, 도5에 도시된 실시예와 같은 유닛의 기능도 같으므로 본 실시예에서는 더는 반복 설명하지 않는다.
통계유닛(400)은 샘플 오브젝트 통계치에 따라 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 얻도록 배치된다,
결정유닛(500)은 상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑관계를 결정하도록 배치된다.
상기 결정유닛은 검색 서브유닛과 결정 서브유닛을 포함할 수 있다.
상기 검색 서브유닛은 상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일인인지 여부에 대한 확률을 얻도록 배치된다.
상기 결정 서브유닛은 상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하도록 배치된다.
상기 결정유닛(500)에 연결된 상기 획득유닛(300)은 오브젝트 사이의 거리에 대응되는 가중거리에 따라 두 클러스터 사이의 가중거리를 획득한다.
본 발명의 실시예에서 제공되는 클러스터링 장치에 따르면, 우선, 대량의 샘플 오브젝트에 따라 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률을 얻어 대응되는 가중치를 결정하고, 그후 클러스터 사이의 가중거리를 얻고 가중거리에 따라 병합가능한 클러스터를 판정하며 상기 병합가능한 클러스터를 병합 전후의 클러스터 개수가 변하지 않을 때까지 병합하여 클러스터링 결과를 획득한다. 상기 가중거리와 두 오브젝트가 동일 오브젝트일 확률이 서로 관련되기때문에 두 오브젝트가 동일 오브젝트일 확률이 두 오브젝트 사이의 거리에 따라 변화하는 경우를 고려할 수 있어 서로 다른 오브젝트 사이의 거리의 기여가 다르고, 확률값이 클수록 대응되는 기여도 크므로 상기 클러스터링 방법은 클러스터링 결과의 정확도를 제고할 수 있다.
상기 실시예의 장치에 있어서, 각 모듈이 조작을 수행하는 구체적인 형태는 이미 당해 방법 관련 실시예에서 상세하게 설명되었는 바, 여기서는 상세하게 설명하지 않는다.
도7은 일 예시적 실시예에 따라 보여준 클러스터링을 위한 단말기기(800)의 블록도이다. 예를 들어, 단말기기(800)는 휴대폰,컴퓨터,디지털 방송 단말,메세지 송수신 기기,게임 콘솔,태블릿기기,의료기기,휘트니스기기,휴대 정보 단말기기 등일 수 있다.
도7을 참조하면, 단말기기(800)는 프로세싱 어셈블리(802), 메모리(804), 전원 어셈블리(806), 멀티미디어 어셈블리(808), 오디오 어셈블리(810), 입력/출력(I/O)의 인터페이스(812), 센서 어셈블리(814) 및 통신 어셈블리(816)와 같은 하나 또는 다수의 어셈블리를 포함할 수 있다.
프로세싱 어셈블리(802)는 통상적으로 표시, 전화 통화, 데이터 통신, 카메라 동작 및 기록동작과 관련한 단말기기(800)의 전체 동작을 제어한다.프로세싱 어셈블리(802)는 상기 방법의 전부 또는 일부 단계를 완성하도록 하나 또는 다수의 프로세서(820)를 포함하여 인스트럭션을 실행할 수 있다. 이 외에 프로세싱 어셈블리(802)는프로세싱 어셈블리(802)와 기타 어셈블리사이의 대화가 편리하도록 하나 또는 다수의 모듈을 포함한다.예를 들어 프로세싱 어셈블리(802)는 멀티미디어 어셈블리(808)와 프로세싱 어셈블리(802)사이의 대화가 편리하도록 멀티미디어 모듈을 포함할 수 있다.
메모리(804)는 단말기기(800)에서의 작동을 지지하도록 각종 유형의 데이터를 저장하도록 배치된다.
이러한 데이터의 예시는 단말기기(800)에서 작동하기 위한 그 어떤 응용 프로그램 또는 방법의 인스트럭션, 연락처 데이터, 전화번호부 데이터, 메시지, 이미지, 비디오 등을 포함한다. 메모리(804)는 스태틱 랜덤 액세스 메모리(SRAM), 전기적 소거 가능한 프로그램 가능 판독가능 기록 장치(EEPROM), 소거 및 프로그램 가능 판독가능 기록 장치(EPROM), 프로그램 가능 판독가능 기록 장치(PROM), 판독 전용 기록 장치(ROM), 자기 기록 장치, 플래시 메모리, 디스크 또는 CD와 같은 모든 유형의 휘발성 또는 비휘발성 메모리 기기 또는 그들의 조합으로 이루어질 수 있다.
전원 어셈블리(806)는 단말기기(800)의 각종 어셈블리에 전력을 제공한다. 전원 어셈블리(806)는 전원관리시스템, 하나 또는 다수의 전원, 단말기기(800)에 전원을 생성, 관리 및 분배하는 것과 관련되는 기타 어셈블리를 포함할 수 있다.
멀티미디어 어셈블리(808)는 상기 단말기기(800)와 사용자 사이에 하나의 출력 인터페이스를 제공하는 스크린을 포함한다. 일부 실시예에서 스크린은 액정 표시 장치(LCD)와 터치패널(TP)을 포함할 수 있다. 만약 스크린이 터치패널을 포함하면, 스크린은 사용자가 입력한 신호를 수신하도록 터치스크린으로 실현될 수 있다. 터치패널은 터치, 슬라이딩과 터치패널상의 손동작을 감지하도록 하나 또는 다수의 터치센서를 포함한다. 상기 터치센서는 터치 또는 슬라이딩동작의 경계를 감지할 수 있을 뿐만아니라 상기 터치 또는 슬라이딩동작과 관련한 지속시간과 압력도 검출할 수 있다. 일부 실시예에서, 멀티미디어 어셈블리(808)는 하나의 프론트 카메라 및/또는 리어 카메라를 포함한다. 단말기기(800)가 작동모드, 예를 들어 촬영모드 또는 비디오모드 일 때, 프론트 카메라 및/또는 리어 카메라는 외부의 멀티미디어 데이터를 수신할 수 있다. 매개 프론트 카메라 및/또는 리어 카메라는 하나의 고정된 광학렌즈 시스템이거나 초점 거리와 광학 줌 능력을 구비할 수 있다.
오디오 어셈블리(810)는 오디오신호를 출력 및/또는 입력하도록 배치된다. 예를 들어, 오디오 어셈블리(810)는 하나의 마이크(MIC)를 포함하는 바, 단말기기(800)가 작동모드, 예를 들어 호출모드, 기록모드 및 음성모드 일 때, 마이크는 외부의 오디오신호를 수신하도록 배치된다. 수신된 오디오신호는 진일보로 메모리(804)에 저장되거나 통신 어셈블리(816)를 거쳐 발송된다. 일부 실시예에서 오디오 어셈블리(810)는 하나의 스피커를 포함하여 오디오신호를 출력한다.
I/O 인터페이스(812)는 프로세싱 어셈블리(802)와 주변 인터페이스모듈사이에 인터페이스를 제공하되 상기 주변 인터페이스모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈버튼, 음량버튼, 작동버튼과 잠금버튼을 포함하나 이에 한정하지는 않는다.
센서 어셈블리(814)는 하나 또는 다수의 센서를 포함하여 단말기기(800)에 여러 방면의 상태평가를 제공한다. 예를 들어, 센서 어셈블리(814)는 단말기기(800)의 온오프상태, 어셈블리의 상대위치, 예를 들어, 상기 어셈블리는 단말기기(800)의 모니터와 키패드를 검출할 수 있고, 센서 어셈블리(814)는 단말기기(800) 또는 단말기기(800)의 한 어셈블리의 위치변화, 사용자와 단말기기(800)의 접촉여부, 단말기기(800) 방위 또는 가속/감속과 단말기기(800)의 온도변화를 검출할 수 있다. 센서 어셈블리(814)는 아무런 물리접촉이 없을 때 주변 물체의 존재를 검출하도록 배치된 근접센서를 포함할 수 있다. 센서 어셈블리(814)는 COMS 또는 CCD 영상 센서와 같은 광센서를 더 포함하여 영상응용에 사용한다. 일부 실시예에서, 상기 센서 어셈블리(814)는 가속도센서, 자이로센서, 자기센서, 압력센서 또는 온도센서를 더 포함할 수 있다.
통신 어셈블리(816)는 단말기기(800)와 기타 기기사이의 유선 또는 무선방식의 통신이 편리하도록 배치된다. 단말기기(800)는 통신표준에 의한 무선인터넷, 예를 들어, WiFi, 2G 또는3G 또는 이들의 조합을 접입할 수 있다. 일 예시적 실시예에서, 통신 어셈블리(816)는 방송신호를 거쳐 외부방송관리시스템의 방송신호 또는 방송과 관련한 정보를 수신한다. 일 예시적 실시예에서, 상기 통신 어셈블리(816)는 근거리 통신을 촉진하도록 근거리 자기장 통신(NFC)모듈을 더 포함할 수 있다. 예를 들어, 무선 주파수 식별(RFID)기술, 적외선 통신 규격(IrDA)기술, 초광대역(UWB)기술, 블루투스(BT)기술과 기타 기술에 기반하여 실현할 수 있다.
예시적 실시예에서 단말기기(800)는 상기 방법을 실행하도록 하나 또는 다수의 응용 주문형 집적 회로(ASIC), 디지털신호 프로세스(DSP), 디시털 신호 처리기기(DSPD), 프로그램 가능 논리 소자(PLD), 필드 프로그램 가능 게이트 어레이(FPGA), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 기타 전자 부품에 의해 실현될 수 있다.
예시적 실시예에서는 인스트럭션을 포함하는 비일시적 컴퓨터 판독 가능한 기록 매체, 예를 들어 상기 방법을 완성하도록 단말기기(800)의 프로세서(820)가 실행하는 인스트럭션을 포함하는 메모리(804)를 더 제공한다. 예를 들어 상기 비일시적 컴퓨터 판독 가능한 기록 매체는 ROM, 랜덤 액세스 메모리(RAM), CD-ROM, 테이프, 플로피 디스켓과 광 데이터 저장기기 등일 수 있다.
상기 저장매체 중의 인스트럭션이 이동 단말기기의 프로세서에 의해 수행될 경우, 비일시적 컴퓨터 판독가능 저장매체는 이동 단말기기가 클러스터링 방법을 수행할 수 있도록 하는 바, 상기 방법은,
모든 병합하고자 하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는, 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계와, 두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하는 단계와, 병합가능한 클러스터가 존재할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때까지 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계로 되돌아가 클러스터링 결과를 획득하는 단계를 포함한다.
상기 방법은, 샘플 오브젝트 통계치에 따라 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득하는 단계와, 상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑관계를 결정하는 단계를 더 포함하는 것이 바람직하다.
상기 대응관계에 따라 상기 오브젝트 사이의 거리와 가중치 간의 매핑관계를 결정하는 단계는,
상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률을 획득하는 방식과,
상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하는 방식을 사용하는 것이 바람직하다.
상기 가중거리가 제1클러스터와 제2클러스터 사이의 가중거리이고, 상기 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계는,
상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 방식과, 상기 제2클러스터로부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 획득하는 방식과, 상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라 상기 제1클러스터와 상기 제2클러스터의 가중거리를 획득하는 방식을 사용하는 것이 바람직하다.
상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 단계는,
상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하는 방식과, 상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 최소 가중거리를 획득하는 방식과, 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터에서 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 획득하는 방식과, 상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터에서의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 획득하는 방식과, 상기 제1클러스터에서의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 가중거리에 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 방식을 사용하는 것이 바람직하다.
도13은 본 발명의 실시예에 있어서의 서버의 구조 설명도이다. 예를 들어, 이 서버(1900)는 배치 또는 성능이 다름에 따라 비교적 큰 차이를 나타낼 수 있는 바, 하나 또는 하나이상의 중앙처리장치(CPU, central processing units)(1922)(예를 들어, 하나 또는하나이상의 프로세서)와 메모리(1932), 하나 또는 하나이상의 애플리케이션 프로그램(1942) 또는 데이터(1944)를 저장하기 위한 저장매체(1930)(예를 들어, 하나 또는 하나이상의 대용량 기록매체)를 포함할 수 있다. 여기서, 메모리(1932)와 저장매체(1930)는 잠시 또는 오래도록 저장하는 것일 수 있다. 저장매체(1930)에 저장되는프로그램은 하나 또는 하나이상의 모듈(미도시)을 포함할 수 있는 바, 매 모듈은 단말기기에서의 일련의 인스트럭션조작을 포함할 수 있다. 더욱 진일보로, 중앙처리장치(1922)는 저장매체(1930)와 통신하고 서버(1900)에서 저장매체(1930)에서의 일련의 인스트럭션조작을 수행하도록 설치될 수 있다.
서버(1900)는 하나 또는 하나이상의 전원(1926), 하나 또는 하나이상의 유선 또는 무선 네트워크 인터페이스(1950), 하나 또는 하나이상의 입력/출력 인터페이스(1958), 하나 또는 하나이상의 키보드(1956) 및/또는 하나 또는 하나이상의 운영체제(1941)를 더 포함할 수 있는 바, 예를 들어, Windows ServerTM, Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM등이다.
예시적 실시예에 있어서, 인스트럭션을 포함하는 비일시적 컴퓨터 판독가능 저장매체를 더 제공하는 바, 예를 들어, 메모리(1932) 또는 저장매체(1930)이다. 상기 인스트럭션은 단말기기의 프로세서(1922)에 의해 수행됨으로써 상기 방법을 완성한다. 예를 들어, 상기 비일시적 컴퓨터 판독가능 저장매체는 ROM, 임의 접근 기록장치(RAM), CD-ROM, 자기 테이프, 플로피 디스크와 광 데이터 기록매체 등일 수 있다.
상기 저장매체 중의 인스트럭션이 단말기기의 프로세서에 의해 수행될 경우, 비일시적 컴퓨터 판독가능 저장매체는 단말기기가 클러스터링 방법을 수행할 수 있도록 하는 바, 상기 방법은,
모든 병합하고자 하는 클러스터에 대해, 오브젝트 사이의 거리에 대응되는, 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계와,
두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하는 단계와,
병합가능한 클러스터가 존재할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터 개수와 병합 전의 클러스터 개수가 같을 때까지 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계로 되돌아가 클러스터링 결과를 획득하는 단계를 포함한다.
상기 방법은, 샘플 오브젝트 통계치에 따라 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득하는 단계와, 상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑관계를 결정하는 단계를 더 포함하는 것이 바람직하다.
상기 대응관계에 따라 상기 오브젝트 사이의 거리와 가중치 간의 매핑관계를 결정하는 단계는,
상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률을 획득하는 방식과, 상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하는 방식을 사용하는 것이 바람직하다.
상기 가중거리가 제1클러스터와 제2클러스터 사이의 가중거리이고, 상기 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계는,
상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 방식과, 상기 제2클러스터로부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 획득하는 방식과, 상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라 상기 제1클러스터와 상기 제2클러스터의 가중거리를 획득하는 방식을 사용하는 것이 바람직하다.
상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의거리 및 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 단계는,
상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하는 방식과, 상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 최소 가중거리를 획득하는 방식과, 상기 제1클러스터에서의 오브젝트와 상기 제2클러스터에서 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 획득하는 방식과, 상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터에서의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 획득하는 방식과, 상기 제1클러스터에서의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 가중거리에 대응되는 가중치에 따라 상기 제1클러스터로부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 방식을 사용하는 것이 바람직하다.
본 발명은 이상에서 이미 묘사되어 도면에 도시된 정확한 구조에 한정되지 않고, 또한 그 범위를 벗어나지 않는 한 다양하게 수정 및 개변시킬 수 있다는 것을 이해해야 할 것이다. 본 발명의 범위는 첨부된 청구범위에 의해서만 한정된다.
설명해야 할 것은, 본문에서 “제1”과 “제2”와 같은 관련 용어는 단지 하나의 실체 또는 동작을 다른 실체 또는 동작과 구분하려는 것일 뿐, 이러한 실체 또는 동작의 사이에 이러한 실제적인 관계 도는 순서가 존재한다는 것을 반드시 요구하거나 암시하는 것이 아니다. 또한, 용어 “포괄”, “포함” 또는 그의 기타 변체는 비배타성적인 포함을 포괄하여 일련의 요소의 과정, 방법, 물품 또는 이동설비로 하여금 이러한 요소를 포괄함과 동시에 명확히 열거되지 않은 기타 요소를 포괄하거나, 또는 이러한 과정, 방법, 물품 또는 이동설비의 고유한 요소를 더 포함한다는 것을 설명하는 바이다. 더욱 많은 한정이 없는 상황에서 “하나의 …을/를 포함”이라는 구절이 한정하는 요소는 상기 요소를 포함하는 과정, 방법, 물품 또는 이동설비에 다른 동일한 요소가 더 존재하는 경우를 배제하지 않는다.
이상은 단지 본 발명의 발명을 실시하기 위한 구체적인 내용이고, 이는 당업자로 하여금 본 발명을 이해 또는 실현할 수 있도록 한다. 이러한 실시예에 대한 다양한 수정은 당업자에게 있어서 자명한 것이고, 본문에서 정의되는 일반적인 원리는 본 발명의 정신 또는 범위를 벗어나지 않는 전제하에서 기타 실시예에서 실현될 수 있다. 따라서, 본 발명은 본문에서 보여준 이러한 실시예에 한정되지 않고 본문에서 공개된 원리 및 신규특징과 일치한 가장 넓은 범위에 부합되어야 한다.

Claims (13)

  1. 단말기기가, 모든 병합하고자 하는 클러스터(cluster)에 대해 오브젝트 사이의 거리에 대응되며 상기 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터사이의 가중거리를 획득하는 단계와,
    상기 단말기기가, 두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하는 단계와,
    상기 단말기기가, 병합가능한 클러스터가 존재할 경우 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터의 개수가 병합 전의 클러스터의 개수와 같을 때까지, 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계로 되돌아 가서 당해 단계를 수행하며, 클러스터링 결과를 획득하는 단계를 포함하고,
    상기 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되며 상기 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터사이의 가중거리를 획득하는 단계는,
    상기 단말기기가 샘플 오브젝트 통계치에 따라, 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득하는 단계와,
    상기 단말기기가 상기 대응관계에 따라, 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑(mapping)관계를 결정하는 단계를 더 포함하고,
    상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 가중치 간의 매핑관계를 결정하는 단계는,
    상기 단말기기가, 상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률을 획득하는 단계와,
    상기 단말기기가 상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하는 단계를 포함하는 것을 특징으로 하는
    클러스터링(clustering) 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 가중거리는 제1클러스터와 제2클러스터 사이의 가중거리이고,
    상기 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 단계는,
    상기 단말기기가, 상기 제1클러스터내의 모든 오브젝트와 상기 제2클러스터내의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라, 상기 제1클러스터로 부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 단계와,
    상기 단말기기가, 상기 제2클러스터로부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 획득하는 단계와,
    상기 단말기기가, 상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라, 상기 제1클러스터와 상기 제2클러스터 사이의 가중거리를 획득하는 단계를 포함하는 것을 특징으로 하는
    클러스터링 방법.
  5. 제4항에 있어서,
    상기 제1클러스터의 모든 오브젝트와 상기 제2클러스터의 모든 오브젝트 사이의 거리 및 대응되는 가중치에 따라, 상기 제1클러스터로 부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 단계는,
    상기 단말기기가, 상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터내의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하는 단계와,
    상기 단말기기가, 상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라, 상기 제1클러스터내의 상기 오브젝트와 상기 제2클러스터내의 모든 오브젝트 사이의 최소 가중거리를 획득하는 단계와,
    상기 단말기기가, 상기 제1클러스터내의 상기 오브젝트와 상기 제2클러스터내의 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 획득하는 단계와,
    상기 단말기기가, 상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터내의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 획득하는 단계와,
    상기 단말기기가, 상기 제1클러스터내의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 가중거리에 대응되는 가중치에 따라 상기 제1클러스터로 부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하는 단계를 포함하는 것을 특징으로 하는
    클러스터링 방법.
  6. 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되며 상기 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하기 위한 획득유닛과,
    두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하기 위한 판정유닛과,
    병합가능한 클러스터가 존재할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터의 개수가 병합 전의 클러스터의 개수와 같을 때까지, 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 것을 수행하도록 상기 획득유닛을 제어하며, 클러스터링 결과를 획득하기 위한 병합유닛을 포함하고,
    상기 획득유닛은,
    샘플 오브젝트 통계치에 따라, 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득하기 위한 통계유닛과,
    상기 대응관계에 따라, 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑관계를 결정하기 위한 결정유닛을 더 포함하고,
    상기 결정유닛은,
    상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일인인지 여부에 대한 확률을 획득하기 위한 검색 서브유닛과,
    상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하기 위한 결정 서브유닛을 포함하는 것을 특징으로 하는
    클러스터링 장치.
  7. 삭제
  8. 삭제
  9. 제6항에 있어서,
    상기 가중거리가 제1클러스터와 제2클러스터 사이의 가중거리이고,
    상기 획득유닛은,
    상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터 내의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하기 위한 제1획득 서브유닛과,
    상기 유사성이 가장 큰 거리 및 대응되는 제1가중치에 따라 상기 제1클러스터로 부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하기 위한 제2획득 서브유닛과,
    상기 제2클러스터로 부터 상기 제1클러스터까지의 제2 단방향의 가중거리를 획득하기 위한 제3획득 서브유닛과,
    상기 제1 단방향의 가중거리와 상기 제2 단방향의 가중거리에 따라 상기 제1클러스터와 상기 제2클러스터 사이의 가중거리를 획득하기 위한 제4획득 서브유닛을 포함하는 것을 특징으로 하는
    클러스터링 장치.
  10. 제9항에 있어서,
    상기 제2획득 서브유닛은,
    상기 제1클러스터 내의 임의의 하나의 오브젝트와 상기 제2클러스터내의 모든 오브젝트 사이의 유사성이 가장 큰 거리 및 상기 유사성이 가장 큰 거리에 대응되는 제1가중치를 획득하기 위한 제5획득 서브유닛과,
    상기 유사성이 가장 큰 거리와 그에 대응되는 제1가중치의 곱에 따라, 상기 제1클러스터내의 상기 오브젝트와 상기 제2클러스터내의 모든 오브젝트 사이의 최소 가중거리를 획득하기 위한 제6획득 서브유닛과,
    상기 제1클러스터내의 상기 오브젝트와 상기 제2클러스터내의 유사성이 가장 큰 거리에 대응되는 오브젝트 외의 기타 오브젝트 사이의 거리의 평균 가중거리를 획득하기 위한 제7획득 서브유닛과,
    상기 최소 가중거리와 상기 평균 가중거리에 따라 상기 제1클러스터내의 상기 오브젝트와 상기 제2클러스터 사이의 가중거리를 획득하기 위한 제8획득 서브유닛과,
    상기 제1클러스터내의 모든 오브젝트와 상기 제2클러스터 사이의 가중거리 및 상기 가중거리에 대응되는 가중치에 따라 상기 제1클러스터로 부터 상기 제2클러스터까지의 제1 단방향의 가중거리를 획득하기 위한 제9획득 서브유닛을 포함하는 것을 특징으로 하는
    클러스터링 장치.
  11. 프로세서와,
    상기 프로세서에 의해 수행가능한 인스트럭션을 저장하기 위한 메모리를 포함하고,
    상기 프로세서는
    모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되며 상기 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하고,
    두 클러스터 사이의 가중거리 및 소정의 거리 임계값에 따라 병합가능한 클러스터의 존재여부를 판정하며,
    두 클러스터가 병합가능할 경우, 모든 병합가능한 클러스터를 각각 병합시키고, 병합 후의 클러스터의 개수가 병합 전의 클러스터의 개수와 같을 때까지, 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되는 가중치에 따라 두 클러스터 사이의 가중거리를 획득하는 동작으로 되돌아 가서 당해 동작을 수행하며, 클러스터링 결과를 획득하도록 구성되고,
    상기 모든 병합하고자 하는 클러스터에 대해 오브젝트 사이의 거리에 대응되며 상기 오브젝트 사이의 유사성에 의해 결정되는 가중치에 따라 두 클러스터사이의 가중거리를 획득하는 것은,
    단말기기가 샘플 오브젝트 통계치에 따라, 오브젝트 사이의 거리와 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률 간의 대응관계를 획득하는 것과,
    상기 단말기기가 상기 대응관계에 따라, 상기 오브젝트 사이의 거리와 상기 확률에 의해 결정되는 가중치 간의 매핑(mapping)관계를 결정하는 것을 더 포함하고,
    상기 대응관계에 따라 상기 오브젝트 사이의 거리와 상기 가중치 간의 매핑관계를 결정하는 것은,
    상기 단말기기가, 상기 대응관계를 검색하여 상기 오브젝트 사이의 거리에 대응되는 두 오브젝트가 동일 오브젝트인지 여부에 대한 확률을 획득하는 것과,
    상기 단말기기가 상기 확률을 상기 오브젝트 사이의 거리에 대응되는 가중치로 결정하는 것을 포함하는 것을 특징으로 하는
    단말기기.
  12. 프로세서에 의해 실행되는 것을 통하여 청구항 제1항에 기재된 클러스터링 방법을 실현하는 것을 특징으로 하는 컴퓨터 판독가능한 기록매체에 기록된 컴퓨터 프로그램.
  13. 청구항 제12항에 기재된 컴퓨터 프로그램이 기록된 컴퓨터 판독가능한 기록매체.
KR1020147026522A 2014-03-14 2014-07-24 클러스터링 방법, 관련장치, 프로그램 및 기록매체 KR101639502B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410096608.9A CN103927545B (zh) 2014-03-14 2014-03-14 聚类方法及相关装置
CN201410096608.9 2014-03-14
PCT/CN2014/082884 WO2015135277A1 (zh) 2014-03-14 2014-07-24 聚类方法及相关装置

Publications (2)

Publication Number Publication Date
KR20150117201A KR20150117201A (ko) 2015-10-19
KR101639502B1 true KR101639502B1 (ko) 2016-07-22

Family

ID=51145761

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147026522A KR101639502B1 (ko) 2014-03-14 2014-07-24 클러스터링 방법, 관련장치, 프로그램 및 기록매체

Country Status (7)

Country Link
EP (1) EP2919136A1 (ko)
JP (1) JP6051336B2 (ko)
KR (1) KR101639502B1 (ko)
CN (1) CN103927545B (ko)
MX (1) MX346698B (ko)
RU (1) RU2630373C2 (ko)
WO (1) WO2015135277A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927545B (zh) * 2014-03-14 2017-10-17 小米科技有限责任公司 聚类方法及相关装置
CN105488467B (zh) * 2015-11-26 2019-07-23 小米科技有限责任公司 图片分类方法及装置
CN107092618A (zh) * 2016-10-27 2017-08-25 北京小度信息科技有限公司 一种信息处理方法及装置
CN109469919B (zh) * 2018-11-12 2020-07-28 南京工程学院 一种基于权重聚类的电站空预器堵灰监测方法
CN111310834B (zh) * 2020-02-19 2024-05-28 深圳市商汤科技有限公司 数据处理方法及装置、处理器、电子设备、存储介质
CN111415151A (zh) * 2020-03-10 2020-07-14 支付宝(杭州)信息技术有限公司 连锁商户的识别方法、装置、电子设备及存储介质
CN112132111A (zh) * 2020-10-10 2020-12-25 安徽江淮汽车集团股份有限公司 泊车典型场景的提取方法、设备、存储介质及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120321193A1 (en) 2010-12-30 2012-12-20 Nokia Corporation Method, apparatus, and computer program product for image clustering

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100312331B1 (ko) * 1998-02-14 2001-12-28 이계철 내용기반영상검색방법및장치
US7664735B2 (en) * 2004-04-30 2010-02-16 Microsoft Corporation Method and system for ranking documents of a search result to improve diversity and information richness
US7809192B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for recognizing objects from images and identifying relevancy amongst images and information
KR100824698B1 (ko) * 2006-08-25 2008-04-24 인하대학교 산학협력단 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반영역 가중치 방법
KR100804678B1 (ko) * 2007-01-04 2008-02-20 삼성전자주식회사 비디오 인물별 신 분류 방법 및 그 시스템
RU2345414C1 (ru) * 2007-08-10 2009-01-27 Общество с ограниченной ответственностью "Рекогмишн" Способ построения системы индексирования для поиска объектов на цифровых изображениях
JP5526955B2 (ja) * 2010-04-09 2014-06-18 ソニー株式会社 顔クラスタリング装置、顔クラスタリング方法、及びプログラム
US9317783B2 (en) * 2010-06-01 2016-04-19 Hewlett-Packard Development Company, L.P. Clustering images
US20120294540A1 (en) * 2011-05-17 2012-11-22 Microsoft Corporation Rank order-based image clustering
CN102881032B (zh) * 2012-09-14 2015-09-09 北京理工大学 一种基于改进算法的图片拼接方法
CN103136355B (zh) * 2013-03-05 2016-01-06 电子科技大学 一种基于自动阈值鱼群算法的文本聚类方法
CN103544255B (zh) * 2013-10-15 2017-01-11 常州大学 基于文本语义相关的网络舆情信息分析方法
CN103927545B (zh) * 2014-03-14 2017-10-17 小米科技有限责任公司 聚类方法及相关装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120321193A1 (en) 2010-12-30 2012-12-20 Nokia Corporation Method, apparatus, and computer program product for image clustering

Also Published As

Publication number Publication date
MX346698B (es) 2017-03-28
WO2015135277A1 (zh) 2015-09-17
CN103927545A (zh) 2014-07-16
MX2014011016A (es) 2016-02-19
RU2630373C2 (ru) 2017-09-07
JP2016517110A (ja) 2016-06-09
RU2015129671A (ru) 2017-04-27
CN103927545B (zh) 2017-10-17
KR20150117201A (ko) 2015-10-19
JP6051336B2 (ja) 2016-12-27
EP2919136A1 (en) 2015-09-16

Similar Documents

Publication Publication Date Title
KR101639502B1 (ko) 클러스터링 방법, 관련장치, 프로그램 및 기록매체
US20210133563A1 (en) Method and apparatus for training neural network, and storage medium
KR101852284B1 (ko) 경보 방법 및 장치
US10115019B2 (en) Video categorization method and apparatus, and storage medium
JP6101399B2 (ja) クラスタリング方法、クラスタリング装置、端末装置、プログラム及び記録媒体
KR101646887B1 (ko) 클러스터링 방법, 장치 및 단말 장치
US20170193399A1 (en) Method and device for conducting classification model training
US20170154206A1 (en) Image processing method and apparatus
US11455491B2 (en) Method and device for training image recognition model, and storage medium
RU2638154C2 (ru) Способы и устройства для присваивания метки номеру
WO2020088126A1 (zh) 视频推荐方法、装置和计算机可读存储介质
JP2016517110A5 (ko)
CN105824955B (zh) 短信聚类方法及装置
US11475879B2 (en) Method and device for evaluating quality of content, electronic equipment, and storage medium
WO2018133681A1 (zh) 搜索结果排序方法、装置、服务器及存储介质
CN109670077A (zh) 视频推荐方法、装置和计算机可读存储介质
CN110532345A (zh) 一种未标注数据的处理方法、装置及存储介质
KR20160150635A (ko) 클라우드 카드를 추천하기 위한 방법 및 장치
WO2021147949A1 (zh) 视频推荐方法及装置
CN111241844A (zh) 一种信息推荐方法及装置
US20150262033A1 (en) Method and terminal device for clustering
CN107515853B (zh) 一种细胞词库推送方法及装置
JP2023519755A (ja) 画像レジストレーション方法及び装置
CN107992893B (zh) 压缩图像特征空间的方法及装置
US20150248472A1 (en) Clustering method, apparatus, and terminal apparatus

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant