KR20080030922A - 정보처리 장치 및 방법, 프로그램, 및 기록 매체 - Google Patents

정보처리 장치 및 방법, 프로그램, 및 기록 매체 Download PDF

Info

Publication number
KR20080030922A
KR20080030922A KR1020070091308A KR20070091308A KR20080030922A KR 20080030922 A KR20080030922 A KR 20080030922A KR 1020070091308 A KR1020070091308 A KR 1020070091308A KR 20070091308 A KR20070091308 A KR 20070091308A KR 20080030922 A KR20080030922 A KR 20080030922A
Authority
KR
South Korea
Prior art keywords
content
contents
feature amount
function
similar
Prior art date
Application number
KR1020070091308A
Other languages
English (en)
Inventor
마리 사이토
요시유키 고바야시
타카오미 기무라
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20080030922A publication Critical patent/KR20080030922A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

변환 수단과 검색 수단을 구비하는 정보처리 장치가 기재되어 있다. 상기 변환수단은, 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 이용하여, 콘텐츠 특징량을 변환하며, 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑하며, 상기 검색 수단은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
Figure P1020070091308
특징량, 유사 관계, 검색 수단, 변환 수단, 분류도

Description

정보처리 장치 및 방법, 프로그램, 및 기록 매체{Information processing apparatus, method, program and recording medium}
본 발명은 2006년 10월 2일 일본 특허청에 제출된 일본특허 JP2006-270962호에 기재된 주제와 관련되며, 그 전체 내용은 참조로서 여기에 포함되어 있다.
본 발명은 정보처리 장치 및 방법, 프로그램, 및 기록 매체에 관한 것이며, 특히, 콘텐츠를 취급하는 정보처리 장치 및 방법, 프로그램, 및 기록 매체에 관한 것이다.
하드 디스크나 플래쉬 메모리에, 다수의 악곡을 기록하고, 기록된 악곡들을 재생하는 장치가 점점 널리 사용되고 있다. 다수의 악곡을 기록할 수 있게 됨에 따라, 기록되어 있는 악곡중에서 비슷한 악곡을 찾고 싶다고 하는 요구가 생겨나기 시작했다.
악곡의 특징량에 근거하여, 악곡간의 거리를 측정하여 유사한 악곡을 찾는 종래의 기술이 있다(예를 들면, 일본 특허 공개 번호 2004-171096호 공보 참조).
그러나, 통상, 이 기술은, 악곡간의 특징량의 상관성이나 거리에 근거하여 유사성이 정의되면, 한 쌍으로된 악곡들이 존재하므로, 많은 계산이 필요하다. 근래에는, 천곡 이상의 악곡을 보존할 수 있는 기기가 일반적으로 되어 있다. 악곡이 많으면 많을 수록, 유사한 악곡을 찾는 처리 시간은 더욱 길어지게 되므로, 그 처리 시간은 방대하게 된다.
한편, 서로 인접한 특징량의 유클리드 거리를 가지는 악곡을 단순히 선택하는 일은, 의도하지 않는 악곡을 선택할 수 있다. 즉, 사용자가 비슷하다고 인지하지 않은 악곡이 유사한 악곡으로 여겨져 버리는 일이 있다.
사용자가 비슷하다고 느끼는 악곡을 유클리드 거리를 이용해 구하는 방법은, 사용자의 실험에 의해 얻을 수 있는 각 악곡간의 유사도로부터, 주좌표 분석 또는 증가하는 갱신의 방법을 통해 유사도를 잘 나타내는 공간을 만들고, 그 후에 악곡의 특징량으로부터, 예를 들어, 회귀 해석을 통해 각각의 축의 좌표를 추정하는 것이다.
그런데, 이러한 방법을 적용하기 위해서는, 악곡간의 유사도를 나타내는 데이터인, 사용자의 실험의 데이터를 수집하는 것은 매우 어렵고, 현실적이지 않다.예를 들면, 주좌표 분석을 적용하려고 했을 경우, 1450곡에 대한 유사도의 실험의 데이터를 얻으려면, 1450곡×1450곡, 즉 210만 패턴에 대해서, 유사도 또는 비유사도(dissimilarity) 데이터를 입력해야 한다.
본 발명은, 이러한 상황을 참작하여 이루어진 것이며, 보다 간단하게, 보다 신속히, 또한, 보다 정확하게 유사한 콘텐츠를 특정할 수 있도록 하는 것이다.
본 발명의 한 실시예의 정보처리 장치는, 변환 수단과 검색 수단을 포함한다. 변환 수단은, 함수를 이용하여 콘텐츠 특징량을 변환한다. 상기 함수들은 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 상기 검색 수단은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
콘텐츠의 특징량을 추출하는 추출 수단을 추가로 구비될 수 있다.
상기 검색 수단은, 상기 함수에 의해 변환된 특징량에 의한 콘텐츠의 그룹 가운데, 같은 그룹에 속하는 콘텐츠를 검색하여, 유사한 콘텐츠를 검색할 수 있다.
상기 변환 수단은, 상술한 함수들을 적용하여 콘텐츠의 특징량을 변환시킬 수 있다. 상기 함수들은, 평가치가 소정의 기간로 더 이상 갱신되지 않을 될 때까지, 유전적 수법의 반복 생성에 의해 얻어진다. 상기 평가치는, 두 개의 값으로부터 산출된 정보 기준이 된다. 상기 두개의 값중, 한 개의 값은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계에서 유사하다고 여겨진 콘텐츠와 유사하지 않다고 여겨진 콘텐츠와의 유클리드 거리에 근거하는 분류의 정도를 나타내는 값이 되며, 다른 값은, 상기 함수의 자유 파라미터의 수가 된다.
상기 변환 수단은, 상술한 함수들을 적용하여 콘텐츠의 특징량을 변환시킬 수 있다. 상기 함수들은, 평가치가 소정의 기간로 더 이상 갱신되지 않을 될 때까지, 유전적 수법의 반복 생성에 의해 얻어진다. 상기 평가치는, 분류의 정도를 나타내는 FDR(Fisher discriminant ratio)로부터 산출된다.
유전적 수법에 따라 상기 함수를 생성하는 생성 수단을 추가로 구비할 수 있다. 그러므로, 생성된 상기 함수를 적용하여, 콘텐츠의 특징량을 변환할 수 있다.
정보 기준이 되는 평가치를 두 개의 값으로부터 산출하는 산출 수단을 추가로 구비할 수 있다. 그러므로, 상기 생성 수단이 평가치가 소정의 기간로 더 이상 갱신되지 않을 될 때까지, 유전적 수법의 반복 생성에 상기 함수를 생성할 수 있다. 상기 두개의 값중, 한 개의 값은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계에서 유사하다고 여겨진 콘텐츠와 유사하지 않다고 여겨진 콘텐츠와의 유클리드 거리에 근거하는 분류의 정도를 나타내는 값이 되며, 다른 값은, 상기 함수의 자유 파라미터의 수가 된다.
상기 산출 수단은, 분류의 정도를 나타내는 FDR로부터 상기 평가치를 산출할 수 있다.
사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계를 나타내는 데이터를 취득하는 취득 수단을 추가로 구비할 수 있다. 그러므로, 상기 산출 수단은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계를 나타내는 데이터를 이용하여, 평가치를 산출할 수 있다.
변환된 특징량에 의해, 콘텐츠의 클러스터링을 실행하는 클러스터링 수단을 추가로 구비할 수 있다.
변환된 특징량에 근거하는 콘텐츠와 클러스터와의 거리로부터, 콘텐츠가 속하는 그룹을 특정하는 특정 수단을 추가로 구비할 수 있다.
본 발명의 정보처리 방법은, 변환 스텝과 검색 스텝을 포함한다. 변환 스텝은, 함수를 이용하여 콘텐츠 특징량을 변환한다. 상기 함수들은 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 상기 검색 스텝은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
본 발명의 한 실시예의 프로그램은 컴퓨터가 변환 및 검색 스텝을 실행하도록 제어한다. 변환 스텝은, 함수를 이용하여 콘텐츠 특징량을 변환한다. 상기 함수들은 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 상기 검색 스텝은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
본 발명의 한 실시예의 기록매체에 저장된 프로그램은, 컴퓨터가 변환 및 검 색 스텝을 포함하는 정보 처리를 실행하도록 제어한다. 변환 스텝은, 함수를 이용하여 콘텐츠 특징량을 변환한다. 상기 함수들은 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 상기 검색 스텝은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
본 발명의 한 실시예에서는, 유사한 콘텐츠 특징량이 변환된다. 함수들은 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 변환된 특징량에 의해, 유사한 콘텐츠가 검색된다.
상술한 바와 같이, 본 발명의 한 실시예에 따르면, 유사한 콘텐츠가 특정될 수 있다.
상술한 바와 같이, 본 발명의 한 실시예에 따르면, 보다 간단하게, 보다 신속히, 또한, 보다 정확하게 유사한 콘텐츠를 특정할 수 있다.
본 발명의 양호한 실시예를 설명하기 전에, 본 발명과 여기에 기재된 실시예 들 간의 구성요소들의 관계들이 다음과 같이 기술된다. 이 기재는, 청구된 본 발명을 지지하는 실시예들이 발명의 상세한 설명에 기재되어 있다는 것을 확인하기 위한 것이다. 따라서, 본 발명의 어느 구성 요소와 관련된 실시예가 기재되어 있지 않더라도, 그것은 그 실시예가 본 발명의 구성 요소와 관련되지 않는다는 것을 반드시 의미하는 것은 아니다. 반대로, 본 발명의 어느 구성 요소와 관련된 실시예가 기재되어 있더라도, 그것은 그 실시예가 본 발명의 다른 구성 요소와 관련되지 않는다는 것을 반드시 의미하는 것은 아니다.
본 발명의 한 실시예의 정보처리 장치는, 변환 수단(예를 들면, 도 25의 특징량 변환부(131))과 검색 수단(예를 들면, 도 25의 검색 처리부(127))을 갖춘다.변환 수단은, 함수를 이용하여 콘텐츠 특징량을 변환한다. 상기 함수들은 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 상기 검색 수단은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
콘텐츠의 특징량을 추출하는 추출 수단(예를 들면, 도 25의 특징량 추출부 (122))을 추가로 구비될 수 있다.
유전적 수법에 따라 상기 함수를 생성하는 생성 수단(예를 들면, 도 28의 공간 변형부(26)에 제공된 도 2의 변환 함수 생성부(41))을 추가로 구비할 수 있으므 로, 상기 변환 수단은 생성된 상기 함수를 적용하여, 콘텐츠의 특징량을 변환시킬 수 있다.
정보 기준이 되는 평가치를 두 개의 값으로부터 산출하는 산출 수단(예를 들면, 도 28의 공간 변형부(26)에 제공되는 도 2의 함수 평가치 산출부(42))을 추가로 구비할 수 있다. 그러므로, 상기 생성 수단이 평가치가 소정의 기간로 더 이상 갱신되지 않을 될 때까지, 유전적 수법의 반복 생성에 상기 함수를 생성할 수 있다. 상기 두개의 값중, 한 개의 값은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계에서 유사하다고 여겨진 콘텐츠와 유사하지 않다고 여겨진 콘텐츠와의 유클리드 거리에 근거하는 분류의 정도를 나타내는 값이 되며, 다른 값은, 상기 함수의 자유 파라미터의 수가 된다.
사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계를 나타내는 데이터를 취득하는 취득 수단(예를 들면, 도 28의 사용자 평가 취득부(25))을 추가로 구비할 수 있다. 그러므로, 상기 산출 수단은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계를 나타내는 데이터를 이용하여, 평가치를 산출할 수 있다.
변환된 특징량에 의해, 콘텐츠의 클러스터링을 실행하는 클러스터링 수단(예를 들면, 도 28의 클러스터링부(27))을 추가로 구비할 수 있다.
변환된 특징량에 근거하는 콘텐츠와 클러스터와의 거리로부터, 콘텐츠가 속하는 그룹을 특정하는 특정 수단(예를 들면, 도 25의 콘텐츠 그룹 특정부(125))을 추가로 구비할 수 있다.
본 발명의 정보처리 방법은, 변환 스텝(예를 들면, 도 26의 스텝(S54))과 검 색 스텝(예를 들면, 도 27의 스텝(S72))을 포함한다. 변환 스텝은, 함수를 이용하여 콘텐츠 특징량을 변환한다. 상기 함수들은 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 상기 검색 스텝은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
도 1은, 콘텐츠의 특징량의 공간을 변형하여, 변형된 공간에 있어서의 특징량을 얻기 위한 변환 함수를 생성하는 정보처리 장치(11)의 구성의 예를 나타내는 블럭도이다. 정보처리 장치(11)는, 샘플 콘텐츠 혼잡부(21), 콘텐츠 데이터베이스(22), 특징량 추출부(23), 특징량 취득부(24), 사용자 평가 취득부(25), 공간 변형부(26), 클러스터링부(27), 및 출력부(28)로 구성된다.
샘플 콘텐츠 로딩부(21)는, 콘텐츠의 특징량의 공간을 변형하기 위한 콘텐츠의 샘플이 되는 샘플 콘텐츠를 로드한다. 샘플 콘텐츠 로딩부(21)는, 샘플 콘텐츠를 콘텐츠 데이터베이스(22)에 공급한다.
콘텐츠 데이터베이스(22)는, 샘플 콘텐츠 로딩부(21)로부터 공급된 샘플 콘텐츠를 저장한다.
여기서, 콘텐츠는, 악곡(그들의 데이터) 또는 동화상 혹은 정지화상(그들의 데이터) 등이다.
이하, 악곡이 콘텐츠가 되는 예를 설명한다.
특징량 추출부(23)는, 콘텐츠 데이터베이스(22)에 저장되어 있는 샘플 콘텐츠로부터, 그 샘플 콘텐츠의 특징량을 추출한다. 예를 들면, 특징량 추출부(23)는, 악곡인 샘플 콘텐츠의 음성의 파형을 분석하여 샘플 콘텐츠의 특징량을 추출한다. 특징량 추출부(23)는, 추출한 특징량을 콘텐츠 데이터베이스(22)에 공급한다.
특징량 취득부(24)는, 샘플 콘텐츠의 특징량을 취득한다. 예를 들면, 특징량 취득부(24)는, 사용자의 조작에 따라 입력된 특징량을 취득한다. 한편, 도시하지 않는 네트워크를 통해 접속되어 있는 서버로부터의 판독을 통해, 그 콘텐츠에 대한 평가와 같은 샘플 콘텐츠의 특징량을 취득한다. 특징량 취득부(24)는, 취득한 특징량을 콘텐츠 데이터베이스(22)에 공급한다.
사용자 평가 취득부(25)는, 콘텐츠 데이터베이스(22)로부터 사용자의 평가를 취득한다. 사용자의 평가는, 콘텐츠 데이터베이스(22)에 저장되어 있는 샘플 콘텐츠에 대한, 사용자의 주관적인 평가로부터 판단했을 경우에 샘플 콘텐츠의 유사한 정도를 나타낸다. 예를 들면, 사용자 평가 취득부(25)는, 사용자의 조작에 따라 입력된 평가를 취득한다. 그리고, 도시하지 않는 네트워크를 통해 접속되어 있는 서버로부터의 판독을 통해 샘플 콘텐츠에 대한 평가를 취득한다. 사용자 평가 취득부(25)는, 취득한 평가를 콘텐츠 데이터베이스(22)에 공급한다.
공간 변형부(26)는, 샘플 콘텐츠의 특징량의 공간을 변형한다. 공간 변형부(26)는, 샘플 콘텐츠의 특징량의 공간의 변형을 위한 변환 함수를 콘텐츠 데이터베이스(22)에 공급한다.
클러스터링부(27)는, 변형된 공간에 있어서의 샘플 콘텐츠의 클러스터링을 실행한다. 클러스터링부(27)는, 클러스터의 중심을 구하고, 변형된 공간에 있어서의 중심의 위치를 콘텐츠 데이터베이스(22)에 공급한다. 클러스터의 중심(위치)은, 콘텐츠의 그룹의 대표치가 된다. 여기서, "콘텐츠의 그룹"이란, 서로 유사한 콘텐츠의 그룹이다.
콘텐츠 데이터베이스(22)는, 샘플 콘텐츠와 함께, 특징량 추출부(23)에 의해 추출된 샘플 콘텐츠의 특징량, 특징량 취득부(24)에 의해서 취득된 샘플 콘텐츠의 특징량, 사용자 평가 취득부(25)에 의해서 취득된 평가, 공간 변형부(26)에 의해 얻어지는 변환 함수, 및 클러스터링부(27)에 의해 얻어지는 클러스터의 중심 위치를 저장한다.
출력부(28)는, 외부로부터의 요구에 따라, 콘텐츠 데이터베이스(22)에 저장되어 있는 변환 함수 및 클러스터의 중심의 위치를 외부에 출력한다.
도 2는, 공간 변형부(26)의 구성을 나타내는 블럭도이다. 공간 변형부(26)는, 변환 함수 생성부(41) 및 함수 평가치 산출부(42)로 구성된다.
변환 함수 생성부(41)는, 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 생성한다. 상기 함수는, 상기 복수의 특징량 변환에 의해, 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 즉, 변환 함수 생성부(41)는, 각각의 복수의 콘텐츠 특징량이 차원 축으로 작용하는 공 간을, 콘텐츠의 복수의 특징량의 각각에 의해 결정되는 위치들 간의 거리가 사용자의 주관에 의한 콘텐츠의 유사한 정도에 따라 설정되는 공간으로 변형하는 변환 함수들을 유전적 수법에 따라 생성한다. 즉, 변환 함수 생성부(41)는, 콘텐츠 데이터베이스(22)에 저장되어 있는 샘플 콘텐츠의 복수의 특징량의 각각이 차원의 축으로 여겨지는 공간을, 복수의 샘플 콘텐츠 마다의 특징량의 사이의 거리가, 샘플 콘텐츠에 대한 사용자의 평가에 대응하는 길이로 여겨지는 공간으로 변형하는 변환 함수를 유전적 수법에 따라 생성한다.
함수 평가치 산출부(42)는, 두 개의 값으로부터, 정보 기준이 되는 평가치를 산출한다. 상기 두개의 값중, 한 개의 값은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계에서 유사하다고 여겨진 콘텐츠와 유사하지 않다고 여겨진 콘텐츠와의 유클리드 거리에 근거하는 분류의 정도를 나타내는 값이 되며, 다른 값은, 상기 함수의 자유 파라미터의 수가 된다. 즉, 함수 평가치 산출부(42)는, 두 개의 값으로부터, 정보 기준, 즉 평가치를 산출한다. 상기 두개의 값중, 한 개의 값은, 사용자의 평가에 의해서 유사한 정도가 미리 평가된 샘플 콘텐츠중, 주관적으로 유사하다고 여겨진 샘플 콘텐츠의 특징량과, 주관적으로 유사하지 않다고 여겨진 샘플 콘텐츠의 특징량과의 유클리드 거리에 근거하는 분류의 정도를 나타내는 값이다. 다른 값은 변환 함수의 자유 파라미터의 수이다.
변환 함수 생성부(41)는, 산출된 평가치에 따라, 유전적 수법을 통해 함수의 생성을 반복한다.
도 3 내지 도 15를 참조하여, 공간 변형부(26)에 있어서의 샘플 콘텐츠의 특 징량의 공간의 변형에 대해 설명한다.
"특징량의 공간"이란, 특징량인 변수의 각각이 차원의 축으로 여겨지는 공간을 말한다. 한편, "공간의 변형"이란, 소정의 목적을 위해서, 원래의 공간을 다른 공간으로 변형하는 것을 말한다. 즉, 공간의 변형이란, 공간의 차원의 축의 적어도 1개를, 원래와는 다른 변수로 변경하는 것을 의미한다.
여기서, 변수(X)를, n차원(n은, 정의 정수)으로 구성되는 원래의 공간의 차원을 구성하는 변수로 가정한다. 변수(X')는, m차원(m은, 정의 정수)으로 구성되는 변형된 공간의 차원을 구성하는 변수로 가정한다.
예를 들면, 도 3에 도시된 바와 같이, 원래의 공간의 변수(X)가 되는 변수 (X1) 및 변수(X2)는, 변수(X1') 및 변수(X2')로 변환되도록, 공간이 변형된다. 도 3에서는, 각각의 검은 원은, 1개의 콘텐츠에 대한 특징량에 의해 정해지는 공간상의 위치를 나타낸다. 도 3에 있어서의 검은 원들 간의 각 라인은, 사용자의 주관에 의해서 콘텐츠의 유사한 정도를 나타내는 사용자의 평가시에, 유사하다고 여겨진 콘텐츠에 대한 특징량에 의해 정해지는 공간상의 위치에서 검은 원들을 연결하고 있다.
변형 후의 공간의 각 차원은, 원래의 공간의 변수가 소정의 처리를 거치도록 함으로써 생성된다.
즉, 식 (1)에 표시한 바와 같이, 원래의 공간의 변수(X)로 구성되는 벡터(X)에 변환 함수(fj)를 적용함으로써, 변형 후의 공간의 차원을 구성하는 변수(X')로 구성되는 벡터(Xj')가 구해진다.
벡터(Xj')=fj(벡터 X)···(1)
변환 함수(fj)는, m개의 변환 함수(f1 내지 fm)를 포함한다.
식 (2)는 선형 변환인 변환 함수(f1)의 예를 나타내는 식이다.
f1(벡터 X)=X1×0.5···(2)
식 (3)은, 선형 변환인 변환 함수(f2)의 예를 나타내는 식이다.
f2(벡터 X)=X1×0.1+X2×0.3···(3)
또, 식 (4)는, 커넬 함수를 이용한 비선형 변환인 변환 함수(f3)의 예를 나타내는 식이다.
f3(벡터 X)=K(벡터 X,θ)···(4)
예를 들면, 도 4로 기재한 바와 같이, n차원의 원래의 공간의 축인 변수(X1) 내지 변수(Xn)에, m개의 변환 함수(f1 내지 fm)로 구성되는 변환 함수(fj)가 적용된다. 도 4의 예에서, 변환 함수(fm)는, 식 (5)로 나타내진다.
fm(벡터 X)=X4×0.1+X2×1.5···(5)
변형 후의 m차원의 공간의 축인 변수(X1') 내지 변수(Xm')는, 식 (6)으로 나타내진다.
X1'=f1(벡터 X)
X2'=f2(벡터 X)
X3'=f3(벡터 X)
.......
Xm'=fm(벡터 X)···(6)
변환 함수(fj)는, 유전적 수법으로 최적화되어, 변형 후의 공간이 보다 목적에 적합한 공간이 된다.
예를 들면, 변환 함수(fj)가 랜덤적으로 생성되어, 소정의 수의 공간이 생성된다. 즉, 복수의 변환 함수(fj)가 생성된다. 생성된 공간 모두가, 함수 평가 함수로부터 구해지는 함수 평가치에 의해서 평가된다. 함수 평가치가 높은 공간, 즉, 보다 목적에 적합한 공간의 몇 개가 선택된다. 또는, 그 공간의 변환 함수(fj)의 일부와 다른 공간의 변환 함수(fj)의 일부가 서로 대체되도록 서로 교차하게 된다. 또는, 그 공간의 변환 함수(fj)의 일부가 랜덤하게 변경되도록 돌연변이된다. 또는, 변환 함수(f1 내지 fm)중 어느 한 쪽이 새롭고 랜덤하게 생성되도록, 공간이 새로운 세대에 남겨진다.
선택, 교차, 돌연변이, 또는 랜덤 생성에 의한, 다음의 세대의 공간의 생성 및 함수 평가치에 의한 평가는, 함수 평가치가 더 이상 증가하지 않을 때까지 반복된다.
함수 평가치에는, AIC(Akaike Information Criterion) 또는 BIC(Schwarz's Bayesian Information Criterion) 등의 정보 기준이 이용되어 과학습이 방지된다.
예를 들면, 정보 기준인 AIC는, 식 (7)에 의해 구해진다.
AIC=-2×최대 로그-확률(log-likelihood)+2×자유 파라미터의 수··(7)
또, 예를 들면, 정보 기준인 BIC는, 식 (8)에 의해 구해진다.
BIC=-2×최대 로그-확률+로그(샘플 콘텐츠의 평가의 수)×자유 파라미터의 수···(8)
도 5에 도시된 바와 같이, 유클리드 거리(A)를 단순하게 측정하여, 사용자의 주관에 적합한 측정에 근거하여 콘텐츠간의 유사도를 계산할 수 있도록 공간이 변형된다. 즉, 생성된 공간은 2개의 콘텐츠의 각각의 특징량으로 나타나는 위치간의 유클리드 거리(A)가, 사용자의 주관에 적합하도록 2개의 콘텐츠의 유사도를 나타내도록 공간이 변형된다.
여기서 한층 더 상세하게, 샘플 콘텐츠, 샘플 콘텐츠에 대한 사용자의 평가, 특징량, 변환 함수, 및 함수 평가치에 대해 설명한다.
우선, 사용자의 실험에 의해, 교사 데이터가 되는, 샘플 콘텐츠 및 샘플 콘텐츠에 대한 사용자의 평가가 준비된다. 예를 들면, 샘플 콘텐츠에 대한 사용자의 평가로서 콘텐츠의 유사도 데이터(S)가 준비된다.
실험에 이용된 샘플 콘텐츠를 M으로 표시하며, 실험에 이용된 샘플 콘텐츠의 수를 O(예를 들면, 1400)으로 나타낸다.
샘플 콘텐츠인 콘텐츠(M1)와 콘텐츠(M2)가 사용자에 의해 비슷하다고 평가된 경우, 콘텐츠(M1)와 콘텐츠(M2)의 유사도를 나타내는 유사도 데이터(S)는, 그들이 비슷하다는 것을 나타내는 0으로 설정된다.
샘플 콘텐츠인 콘텐츠(M1)와 콘텐츠(M3)가 사용자에 의해 비슷하지 않다고 평가된 경우, 콘텐츠(M1)와 콘텐츠(M3)의 유사도를 나타내는 유사도 데이터(S)는, 그들이 비슷하지 않다는 것을 나타내는 1로 설정된다.
이와 같이, 샘플 콘텐츠인 콘텐츠(M4)와 콘텐츠(M6)가 사용자에 의해 비슷하다고 평가된 경우, 콘텐츠(M4)와 콘텐츠(M6)의 유사도를 나타내는 유사도 데이 터(S)는, 그들이 비슷하다는 것을 나타내는 0으로 설정된다.
여기서, 준비되는 샘플 콘텐츠 및 샘플 콘텐츠에 대한 사용자의 평가가 되는, 교사 데이터의 수는, 종래의 수법의 경우와 비교해 보면, 더욱 적어진다. 또, 예를 들면, 1400개인 샘플 콘텐츠의 수 O중에서 모든 샘플 콘텐츠의 쌍에 대해서, 유사도 데이터(S)를 준비할 필요는 없다.
다음에, 샘플 콘텐츠의 특징을 잘 나타내는 특징량이 준비되며, 특징량은, 원fp의 공간(변형되기 전의 공간)을 구성하는 변수로 여겨진다. 예를 들면, 샘플 콘텐츠로부터 미리 추출된 특징량을 취득하거나, 또는 샘플 콘텐츠로부터 특징량을 추출함으로써 준비된다.
원래의 공간을 구성하는 변수로서의 특징량을 특징량(Fki)으로 나타낸다. 여기서, k는, 1 내지 O(샘플 콘텐츠의 수)의 어느 수이다.
예를 들면, 특징량(Fk1)은, BPM(Beat Per Minute)과 같은 연주의 속도, 즉 템포(tempo)를 나타낸다. 예를 들면, 특징량(Fk2)는, 악곡이 빠른가 늦은가를 나타내는 스피드(Speed)를 나타낸다. 스피드는, 악곡의 주관적인 속도, 즉 악곡을 듣고 있는 사용자가 느끼는 속도이며, 예를 들면, 16분 음표가 많을 수록, 그 악곡은 빠르게 느껴진다.
특징량(Fk3)은, 디스퍼션(dispersion), 즉 템포의 흔들림의 크기를 나타낸다. 또, 특징량(Fk4)은, 메이저(major), 즉 메이저 코드의 비율을 나타낸다. 특징량(Fk5)은, 노트(notes), 즉 단위시간 당의 소리가 많음을 나타낸다.
또한, 특징량(Fkn)은, LoMid, 즉 음성의 주파수 대역중 중대역에 대한 저대 역의 에너지의 비율을 나타낸다.
도 6에 도시한 바와 같이, 특징량(Fk1) 내지 특징량(Fkn)의 각각을 각 축으로 하는 원래의 공간은, 유클리드 거리가 콘텐츠의 유사도를 나타내는 공간으로 조금씩 변형된다.
변환 함수(fj)가 갱신된 결과 공간이 변형되는 경우, 함수 평가치가 산출된다. 정보 기준은, 함수 평가치로서 이용된다. 정보 기준은 두 개의 값으로부터 산출된다. 그들중 한 개는, 변형된 공간에 있어서 유클리드 거리를 이용해 비슷한 콘텐츠와 닮지 않은 콘텐츠간의 분류도를 나타내는 FDR(Fisher discriminant ratio)이다. 다른 값은, 변환 함수의 자유 파라미터의 수이다.
도 7은, 유전적 수법을 통해 공간의 변형의 개념을 나타내는 도면이다. 예를 들면, 원래의 공간내의 원래의 특징량의 각각이 차원으로 여겨지므로, 이 차원들은, {Tempo, Speed, Dispersion, Major, Notes, PitchMove,···, LoMid}로 나타내진다.
유전적 수법에 의해 원래의 공간은 다음의 세대(이하, 제 2세대로 칭한다)로 발전하면, 제 2세대에 있어서의 차원은, 예를 들면,{Tempo, Speed, Dispersion×1.35, Major, Notes,···, LoMid}로 표시된다. 원래의 공간의 세대부터 제 2세대로의 발전시에, "Dispersion"이 확장되며, "PitchMove"가 삭제된다.
게다가, 유전적 수법에 의해 제 2세대의 다음의 세대인 제 3세대로 공간이 발전하면, 제 3세대에 있어서의 차원은, 예를 들면,{Tempo, Speed, Dispersion×1.35, K(Major, 35), Notes,···, LoMid}로 표시된다. 제 2세대부터 제 3세대 로의 발전시에, "Major"가, 커넬 함수에 의해 비선형 변환되어, "K(Major,35)"로 변환된다.
생성된 공간을 평가하는 경우, 새롭게 생성된 공간에 있어서의, 교사 데이터로서 주어진, 샘플 콘텐츠 쌍의 특징량 간의 유클리드 거리(D)가 계산된다. 예를 들면, 샘플 콘텐츠(Mk)와 샘플 콘텐츠(Mi)와의 유클리드 거리(D)가 식 (9)에 의해 계산된다.
Figure 112007065361013-PAT00001
....(9)
식 (9)에서, 벡터(Fk)는, 샘플 콘텐츠(Mk)의 특징량의 벡터를 나타내며, 벡터 Fi는, 샘플 콘텐츠(Mi)의 특징량의 벡터를 나타내며, T는, 전치(transposition)를 나타낸다. 또, 유클리드 거리(D)는, 유사도 데이터(S)가 준비된 샘플 콘텐츠(Mk)와 샘플 콘텐츠(Mi)와의 쌍에 대해서만 계산된다.
도 8은, 변형된 공간에 있어서의 특징량의 유클리드 거리와 콘텐츠의 유사도와의 관계를 나타내는 도면이다. 도 8에서, 실선은, 유사한 콘텐츠의 특징량의, 변형된 공간에 있어서의 유클리드 거리의 확률 분포를 나타내며, 점선은, 유사하지 않는 콘텐츠의 특징량의, 변형된 공간에 있어서의 유클리드 거리의 확률 분포를 나타낸다.
유사한 콘텐츠와 유사하지 않은 콘텐츠 간의 거리가 차이가 더욱 커지면, 그 공간은, 콘텐츠의 유사도를 더욱 잘 나타낸다고 말할 수 있다.
유사한 콘텐츠의 특징량의 거리와 유사하지 않는 콘텐츠의 특징량의 거리와의 차이를 측정하기 위해서, 식 (10)에 의해, 유사한 콘텐츠의 클래스와 유사하지 않는 콘텐츠의 클래스와의 FDR(Fisher discriminant ratio)이 계산된다.
FDR=(유사한 악곡간의 평균 거리-유사하지 않는 악곡간의 평균 거리)2/유사한 악곡간의 거리의 표준 편차+유사하지 않는 악곡간의 거리의 표준 편차....(10)
도 9 내지 도 11은, 변형된 공간에 있어서의, 유사한 콘텐츠의 특징량 또는 유사하지 않는 콘텐츠의 특징량에 대한 유클리드 거리와 FDR 값과의 관계를 나타내는 도면이다. 도 9 내지 도 11에서, 실선은, 변형된 공간에 있어서의, 유사한 콘텐츠의 특징량의 유클리드 거리의 확률 분포를 나타내며, 점선은, 변형된 공간에 있어서의, 유사하지 않는 콘텐츠의 특징량의 유클리드 거리의 확률 분포를 나타낸다.
도 9에 도시한 바와 같이, 유사한 콘텐츠의 특징량의 유클리드 거리와 유사하지 않는 콘텐츠의 특징량의 유클리드 거리와의 차이가 짧은 경우, FDR이 작다. 도 10과 도 11에 도시한 바와 같이, 유사한 콘텐츠의 특징량의 유클리드 거리와 유사하지 않는 콘텐츠의 특징량의 유클리드 거리와의 차이가, 길어지면, FDR이 보다 커진다. 즉, 유사한 콘텐츠의 특징량의 유클리드 거리가, 유사하지 않는 콘텐츠의 특징량의 유클리드 거리보다 더욱 뚜렸하면, FDR의 값은 커진다.
예를 들면, 정보 기준인 AIC를 산출하는 식 (7)에서는, 로그-확률로서, FDR 이 이용된다.
도 12는, 자유 파라미터의 예를 나타내는 도면이다. 도 12에서, 점선의 동원으로 둘러싸이는 값이, 자유 파라미터이다. 식 (7)에 있어서의 자유 파라미터의 수는, 예를 들면, 도 12에 도시된 자유 파라미터의 수로 설정된다.
예를 들면, 변환 함수, "f1(벡터 X)=X1×0.5"에 있어서의 0.5는, 자유 파라미터이며, 변환 함수 "f2(벡터 X)=X3×0.4-X4×0.2"에 있어서의, 0.4 및 0.2는, 자유 파라미터이며, 변환 함수 "f3(벡터 X)=exp(-sq r(X3×0.5)/0.5)×0.6"에 있어서의, X3에 곱셈되는 0.5, 제수(divisor)인 0.5, 및 0.6은, 자유 파라미터이며, 변환 함수 "fm(벡터 X)=X4×0.1+X2×1.5"에 있어서의, 0.1 및 1.5는, 자유 파라미터이다.
정보 기준인 AIC의 값이 낮으면 낮을 수록 더욱 좋다. 다음의 세대의 공간의 생성, 즉, 다음의 세대의 변환 함수를 생성하는 경우에 있어서의, 유전적 조작에서는, AIC의 값이 낮으면, 선택되기가 더욱 쉽게 된다.
함수 평가치로서 정보 기준인 BIC를 이용하는 경우도 동일하며, 이하, 그 설명은 생략한다.
이상과 같이, 변환 함수 생성부(41)는, 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 생성한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한 다. 결과적으로, 공간 변형부(26)는 샘플 콘텐츠의 특징량의 공간을 변형한다.
공간을 변형하는 함수는, 두 개의 값으로부터 산출된 정보 기준이 되는 평가치에 따라 유전적 수법을 통해 반복 생성된다. 상기 두 개의 값들중 한 개는, 함수 평가치 산출부(42)에 의해 계산되며, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대해 유사하고 여겨진 콘텐츠와 유사하지 않다고 여겨진 콘텐츠와의 유클리드 거리에 의한 분류의 정도를 나타내는 값이다. 다른 한 개는, 함수의 자유 파라미터의 수이다.
콘텐츠의 유사도 데이터(S)는, 콘텐츠가 유사한지 아닌지를 나타내는 데이터하고 설명했지만, 그 데이터(s)는 유사도를 나타내는 연속적인 수치가 될 수 있다. 예를 들면, 콘텐츠의 유사도 데이터(S)는, 완전하게 같은 것을 나타내는 0으로부터, 완전히 다른 것을 나타내는 1중 어느 실수이다.
예를 들면, 콘텐츠(M1)와 콘텐츠(M2)가 사용자에 의해 약간 비슷하게 평가되었을 경우, 콘텐츠(M1)와 콘텐츠(M2)에 대한 유사도 데이터(S)는, 그들이 약간 비슷하다는 것을 나타내는 0.3으로 설정된다.
콘텐츠(M1)와 콘텐츠(M3)가 사용자에 의해 유사하지 않다고 평가되었을 경우, 콘텐츠(M1)와 콘텐츠(M3)에 대한 유사도 데이터(S)는, 그들이 유사하지 않다는 것을 가리키는 0.9로 설정된다.
이와 같이, 콘텐츠(M4)와 콘텐츠(M6)가 비슷하거나 또는 비슷하지 않다고 사용자에 의해 평가되었을 경우, 콘텐츠(M4)와 콘텐츠(M6)에 대한 유사도 데이터(S )는, 그들이 서로 비슷하거나 또는 비슷하지 않다는 것을 의미하는 0.5로 설정 된다.
이 경우, 유사도 데이터(S)와 유클리드 거리와의 상관성을 이용해 계산한 AIC 즉, 정보 기준의 값이 함수 평가치로 여겨진다. 예를 들면, 식 (7)에 의해 계산되는 정보 기준인 AIC에 있어서의, 최대 로그-확률은, 상관치로부터 계산된다.
도 13은, 상관치가 0.0인 경우에, 유사도 데이터(S)와 콘텐츠의 특징량의 사이의 거리와의 관계를 나타내는 도면이다. 도 14는, 상관치가 0.5인 경우에, 유사도 데이터(S)와 콘텐츠의 특징량의 사이의 거리와의 관계를 나타내는 도면이다. 도 15는, 상관치가 1.0인 경우에, 유사도 데이터(S)와 콘텐츠의 특징량의 사이의 거리와의 관계를 나타내는 도면이다.
도 13 내지 도 15에 도시한 바와 같이, 콘텐츠의 유사도 데이터(S)가 유사도를 나타내는 연속적인 수치인 경우에, 공간에 있어서의 특징량의 거리와 유사도 데이터(S)의 상관이 높을 정도, 그 공간이 콘텐츠의 유사도를 더욱 잘 나타내고 있는 공간이라고 말할 수 있다. 즉, 도 13에 도시되고, 상관치가 0.0인 경우의 공간과 비교하면, 도 14에 도시되고, 상관치가 0.5인 경우의 공간이, 콘텐츠의 유사도를 더욱 잘 나타내고 있다. 게다가, 도 14에 도시된되고, 상관치가 0.5인 경우의 공간과 비교하면, 도 15에 도시되고 상관치가 1.0인 경우의 공간이, 콘텐츠의 유사도를 한층 더 잘 나타내고 있다고 말할 수 있다.
게다가, 샘플 콘텐츠의 특징량의 변형된 공간에서, 클러스터링부(27)는, 샘플 콘텐츠의 클러스터링을 실시한다.
클러스터링부(27)는, K-means법과 같은 콘텐츠의 특징량의 사이의 유클리드 거리에 근거하는 분류에 의해서, 샘플 콘텐츠의 클러스터링을 실시한다.
샘플 콘텐츠의 클러스터링에서는, 클러스터수가 변화된다. 유사도 데이터(S)와 가장 합치하는, 가장 적은 클러스터수가 선택된다. 즉, 유사도 데이터( S)와 합치하는 클러스터의 수중, 가장 적은 클러스터가 선택된다.
예를 들면, 도 16에 도시된 바와 같이, 클러스터수가, 샘플 콘텐츠의 클러스터링을 위해, 1, 2, 3,···, 35, 36,....그리고 그 이상으로 연속적으로 증가된다.
클러스터수의 각각에 대해, 유사도 데이터(S)와의 일치율이 구해진다. 도 16에 도시된 예에서는, 클러스터수가 1인 경우에 유사도 데이터(S)와의 일치율은, 0.45이며, 클러스터수가 2인 경우애, 유사도 데이터(S)와의 일치율은, 0.48이다. 이와 같이, 클러스터수가 35인 경우에, 유사도 데이터(S)와의 일치율은, 0.95이며, 클러스터수가 36인 경우에, 유사도 데이터(S)와의 일치율은, 0.88이다.
예를 들면, 클러스터수가 52인 경우에, 유사도 데이터(S)와의 일치율은, 0.95이며(도시하지 않음), 클러스터수가 35인 경우에, 유사도 데이터(S)와의 일치율은, 0.95가 된다고 가정한다. 이 경우, 일치율이 최대의 0.95인 클러스터수 가운데, 52인 클러스터수에 비해 더욱 작은 클러스터수인 35의 클러스터가 선택된다.
여기서, 도 17 및 도 18을 참조하여, 클러스터와 유사도 데이터(S)와의 일치율을 설명한다.
예를 들면, 일치율을 얻기 위해서, 두 개의 값들이 먼저 함께 추가되었다. 이러한 값들은 유사도 데이터(S)에 의해서 유사하다고 평가된 콘텐츠가 같은 클러스터에 속하는 경우의 수와, 유사도 데이터(S)에 의해서 유사하지 않다고 평가된 콘텐츠가 다른 클러스터에 속하는 경우의 수이다. 그 합계는, 유사도 데이터(S)에 근거한 평가의 수로 나누어진다.
도 17에서는, 원으로 나타나는 사용자 평가는, 그 콘텐츠가 사용자에 의해 비슷하다고 평가된 것을 가리키며, 십자가로 나타나는 사용자 평가는, 그 콘텐츠가 사용자에 의해 유사하지 않다는 것을 가리킨다.
다음의 경우에 대한 설명이 기술될 것이다. 즉, 예를 들면, 도 17에 도시한 바와 같이, content_A와 content_B가 사용자에 의해 비슷하다고 평가된다. 결과적으로, (content_A와 content_B)에 대한 유사도 데이터(S)가, 그들이 비슷하다는 것을 나타내는 0으로 설정된다. content_A와 content_C가 사용자에 의해 유사하지 않다고 평가된다. 결과적으로, (content_A와 content_C)에 대한 유사도 데이터(S)는 그들이 유사하지 않다는 것을 나타내는 1로 설정된다. content_A와 content_D가 사용자에 의해 유사하지 않다고 평가된다. 결과적으로, (content_A와 content_D)에 대한 유사도 데이터(S)는, 그들이 유사하지 않다는 것을 나타내는 1로 설정된다. content_B와 content_C가 사용자에 의해 유사하지 않다고 평가된다. 결과적으로, (content_A와 content_C)에 대한 유사도 데이터(S)는, 그들이 유사하지 않다는 것을 나타내는 1로 설정된다. content_B와 content_D가 사용자에 의해 유사하지 않다고 평가된다. 결과적으로, (content_A와 content_D)에 대한 유사도 데이터(S)는, 그들이 유사하지 않다는 것을 나타내는 1 로 설정된다. content_C와 content_D가 사용자에 의해 비슷하다고 평가된다. 결과적으로, (content_C와 content_D)에 대한 유사도 데이터(S)가, 그들이 비슷하다는 것을 나타내는 0으로 설정된다.
도 17에 도시된 보기에서는, 유사도 데이터(S)에 의한 평가의 수는, 6이다.
이 경우, 도 18에 도시된 보기에서는, 클러스터수가 단지 한 개이다. 도 19에 도시한 바와 같이, content_A내지 content_D의 모든 콘텐츠는, 1개의 클러스터에 속한다. 두 개의 쌍 즉, content_A와 content_B와 content_C와 content_D에 대한 유사도 데이터(S)에 근거하는 평가는, 클러스터링의 결과와 일치한다. 한편, 4개의 쌍들, 즉 content_A와 content_C, content_A와 content_D, content_B와 content_C, 및 content_B와 content_D에 대한 유사도 데이터(S)에 근거하는 평가들은 클러스터링의 결과와 일치하지 않는다. 결과적으로, 일치율은, 2/6=33.3%가 된다.
도 20에 도시된 보기에서는, 클러스터수가 2이며, content_A와 content_B가 1개 클러스터에 속하며, content_C와 content_D가 다른 클러스터에 속한다. content_A는 content_C 및 content_D와는 다른 클러스터에 속하며, content_B는 content_C 및 content_D와는 다른 클러스터에 속한다. 모든 쌍들에 대한 유사도 데이터(S)의 평가들은 클러스터링의 결과와 일치하므로, 일치율은, 6/6=100%가 된다.
도 21에 도시된 보기에서는, 클러스터수가 3이며, content_A와 content_B가 1개 클러스터에 속하며, content_C가 다른 클러스터에 속한다. content_D는 또 다른 클러스터에 속한다. content_C는 content_A 및 content_B와는 다른 클러스터에 속하며, content_D는 content_A 및 content_B와는 다른 클러스터에 속한다. content_C와 content_D가 다른 클러스터에 속한다. 이 경우, content_A와 content_B, content_A와 content_C, content_A와 content_D, content_B와 content_C, 및 content_B와 con tent_D에 대한 유사도 데이터(S)의 평가들은 클러스터링의 결과와 일치한다. 한편, content_C와 content_D와에 대한 유사도 데이터(S)가 클러스터링의 결과와 일치하지 않기 때문에, 일치율은, 5/6=83.3%가 된다.
도 22에 도시한 바와 같이, 클러스터수가 4개이다. content_A 내지 content_D가 각각 다른 클러스터에 속한다. 이 경우, 4개의 쌍들, 즉 content_A와 content_C, content_A와 content_D, content_B와 content_C, 및 content_B와 content_D에 대한 유사도 데이터(S)의 평가들이 클러스터링의 결과와 일치한다. 한편, 두 개의 쌍들, 즉 content_A와 content_B 및 content_C와 content_D에 대한 유사도 데이터(S)의 평가가 클러스터링의 결과와 일치하지 않기 때문에, 일치율은, 4/6=66.6%가 된다.
도 17 및 도 18에 도시된 보기들에서는, 그 보기들이 유사도 데이터(S)와 가장 합치하는 일치율이 100%가 되므로, 클러스터의 수가 2인 클러스터링의 결과가 선택된다.
일치율은 다음에 의해 얻어지는 값이 반드시 되는 것은 아니다. 즉, 유사도 데이터(S)에 의해서 유사하다고 평가된 두 개의 콘텐츠가 같은 클러스터에 속하 는 경우의 수와, 유사도 데이터(S)에 의해서 유사하지 않다고 평가된 콘텐츠가 다른 클러스터에 속하는 경우의 수에 가산된다. 그 후에, 그 합은, 유사도 데이터(S)에 의한 평가의 수로 분할된다. 일치율은, 유사도 데이터(S)와, 클러스터에 근거하는 콘텐츠의 분류와 일치한다는 것을 나타내는 단순한 기준이 된다. 예를 들면, 복수의 사용자로부터의 유사도 데이터(S)가 이용되는 경우, 복수의 사용자로부터 동일한 평가가 얻어지는 콘텐츠, 즉 많은 이용자들이 동일한 평가를 하는 콘텐츠에 대한 가중치를 이용하여 일치율이 계산된다.
또, 비슷한 콘텐츠의 쌍에 대한 재현율 및 정밀도, 또는 유사하지 않는 콘텐츠의 쌍에 대한 재현율 및 정밀도를 이용하여, 클러스터링의 결과가 선택될 수 있다.
다음에, 도 23의 플로차트를 참조하여, 공간 변형 이전의 사전 처리에 대해 설명한다. 스텝(S11)에서, 샘플 콘텐츠 로딩부(21)는, 샘플 콘텐츠를 로드한다. 샘플 콘텐츠 로딩부(21)는, 로드한 샘플 콘텐츠를 콘텐츠 데이터베이스 (22)에 공급한다. 콘텐츠 데이터베이스(22)는, 샘플 콘텐츠를 기록한다.
스텝(S12)에서, 특징량 추출부(23)는, 샘플 콘텐츠에 대한 특징량을 추출한다. 특징량 추출부(23)는, 추출한 특징량을 콘텐츠 데이터베이스(22)에 공급한다. 콘텐츠 데이터베이스(22)는, 추출된 특징량을 기록한다.
특징량 취득부(24)가, 샘플 콘텐츠에 대한 특징량이 되는 특징량을 미리 추출하여도 괜찮다는 것을 명심하자. 예를 들면, 특징량 취득부(24)는, 소정의 서버로부터 제공되는 특징량을 취득하든가 또는 소정의 기록 매체에 기록되어 있는 특징량을 판독하여, 샘플 콘텐츠에 대한 특징량을 미리 추출한다.
스텝(S13)에서, 사용자 평가 취득부(25)는, 사용자에 의한 샘플 콘텐츠의 평가를 취득한다. 즉, 예를 들면, 사용자 평가 취득부(25)는, 사용자에 의한 샘플 콘텐츠의 평가인 유사도 데이터(S)를 취득한다. 보다 구체적으로는, 예를 들면, 사용자 평가 취득부(25)는, 키보드 또는 터치 패널과 같은 조작부로부터의 사용자 조작에 대응하는 신호를 취득하여, 유사도 데이터(S)를 취득한다. 또, 예를 들면, 사용자 평가 취득부(25)는, 소정의 서버로부터 제공되는 유사도 데이터(S)를 취득하든가 또는 소정의 기록 매체에 기록되어 있는 유사도 데이터(S)를 판독하여, 사용자에 의한 샘플 콘텐츠의 평가를 취득한다.
사용자 평가 취득부(25)는, 사용자에 의한 샘플 콘텐츠의 평가인 유사도 데이터(S)를 콘텐츠 데이터베이스(22)에 공급한다. 콘텐츠 데이터베이스(22)는, 유사도 데이터(S)를 기록한다.
스텝(S14)에서, 공간 변형부(26)는, 공간의 변형의 처리를 실행한다.
도 24는, 공간의 변형의 처리를 설명하는 플로차트이다. 스텝(S31)에서, 공간 변형부(26)의 변환 함수 생성부(41)는, 변환 함수를 랜덤하게 생성하여, 몇 개의 공간을 생성한다. 즉, 변환 함수 생성부(41)는, 복수의 변환 함수(fj)를 랜덤하게 생성한다.
스텝(S32)에서, 공간 변형부(26)의 함수 평가치 산출부(42)는, 생성한 모든 공간을 평가 함수로 평가한다. 즉, 함수 평가치 산출부(42)는, 함수 평가치를 산출하여, 생성한 모든 공간의 각각을 평가 함수로 평가한다. 한수 평가치는, 두 개의 값으로부터 산출된 정보 기준이다. 한 개는, 사용자의 주관에 의해 유사한 정도가 미리 평가된 샘플 콘텐츠 중, 주관적으로 유사하다고 여겨진 샘플 콘텐츠와 주관적으로 유사하지 않다고 여겨진 샘플 콘텐츠와의 유클리드 거리에 의한 분류의 정도를 나타낸다. 다른 하나는, 변환 함수(fj)의 자유 파라미터의 수이다.
스텝(S33)에서, 변환 함수 생성부(41)는, 유전적 수법을 통해, 선택, 교차, 또는 돌연변이에 의해서, 새로운 변환 함수를 랜덤하게 생성하여, 차세대의 공간을 몇 개 생성한다. 즉, 스텝(S33)에서, 변환 함수 생성부(41)는, 유전적 수법에 의해서, 차세대의 복수의 변환 함수(fj)를 생성한다.
스텝(S34)에서, 함수 평가치 산출부(42)는, 스텝(S33)에서 생성한 모든 공간을 평가 함수로 평가한다.
스텝(S35)에서, 함수 평가치 산출부(42)는, 스텝(S32)에서 산출된 함수 평가치와 스텝(S34)에서 산출된 함수 평가치를 비교하여, 함수 평가치가 증가하는 것을 멈추었는지를 판정한다. 함수 평가치 산출부(42)가 함수 평가치가 증가했다고 판정할 경우, 스텝(S33)으로 돌아와, 다음의 세대의 공간이 생성되도록, 상술한 처리가 반복된다. 보다 구체적으로는, 함수 평가치 산출부(42)는, 전회의 함수 평가치와 이번 함수 평가치에 차이가 있는지를 판정한다. 평가치가 미리 정해진 기간로 갱신되어 있는지를 판단하여, 함수 평가치가 오르지 않게 되었는지를 판정한다.
스텝(S352)의 두 번째 반복 이후에서는, 함수 평가치 산출부(42)가, 전회의 스텝(S34)에서 산출된 함수 평가치와 이번 스텝(S34)에서 산출된 함수 평가치를 비 교하여, 함수 평가치가 증가하는 것이 중단되었는지를 판정한다. 즉, 스텝(S35)서, 이전의 세대의 공간에 대한 함수 평가치와 다음의 세대의 공간에 대한 함수 평가치가 비교되고, 함수 평가치가 오르지 않게 되었는지가 판정된다.
스텝(S35)에서, 함수 평가치가 오르지 않게 되었다고 판정되었을 경우, 공간 변형부(26)는, 생성된 변환 함수, 즉, 함수 평가치가 변하지 않게 될 때까지, 유전적 수법에 의해 반복 생성되는 변환 함수를 콘텐츠 데이터베이스(22)에 출력한다. 그 후에, 공간 변형부(26)는, 공간의 변형의 처리를 종료한다.
상술한 보기에서는, 평가치가 더 이상 1세대 동안 갱신되지 않을 될 때까지, 생성된다. 그러나, 예를 들면, 2세대 또는 3세대와 같은 소정의 기간 동안에 갱신되지 않을 될 때까지, 함수가 생성된다.
콘텐츠 데이터베이스(22)는, 공간 변형부(26)로부터 공급된 변환 함수를 저장한다.
도 23으로 돌아오면, 스텝(S15)에서, 출력부(28)는, 콘텐츠 데이터베이스 (22)로부터 생성된 변환 함수를 출력한다. 즉, 출력부(28)는, 함수 평가치가 더 이상 변화하지 않게 될 때까지 유전적 수법의 반복 생성에 의해 얻어지는 변환 함수를 판독하고, 판독된 변환 함수를 출력한다.
또, 공간 변형부(26)는, 콘텐츠 데이터베이스(22)에 출력되는 변환 함수에 의해서 변환된 특징량을 콘텐츠 데이터베이스(22)에 출력한다. 콘텐츠 데이터베이스(22)는, 공간 변형부(26)로부터 출력된 특징량을 저장한다.
스텝(S16)에서, 클러스터링부(27)는, 변형된 공간에 있어서의 샘플 콘텐츠의 클러스터링을 실행하여, 클러스터와 유사도 데이터(S)로부터 일치율을 산출한다.즉, 이 경우, 클러스터링부(27)는, 변환된 특징량에 의해서 샘플 콘텐츠를 클러스터링한다.
클러스터링부(27)는, 콘텐츠 데이터베이스(22)에 저장되어 있는 변환 함수를 이용하여, 샘플 콘텐츠에 대한 특징량을 변환할 수 있다.
스텝(S17)에서, 클러스터링부(27)는, 소정의 범위에서 변화되는 클러스터수로 클러스터링이 실행되었는지를 판정한다. 클러스터링부(27)가, 상술한 바와 같이, 클러스터링이 아직 실행되어 있지 않다고 판정하면, 제어는 스텝(S16)으로 돌아오며, 다음의 클러스터수로 클러스터링을 실행하여 일치율을 산출한다. 소정의 범위에서 변화되는 클러스터수로 클러스터링을 실행할 때까지, 스텝(S16) 및 스텝(S17)의 처리가 반복된다.
스텝(S17)에서, 클러스터링부(27)가, 소정의 범위에서 변화되는 클러스터수로 클러스터링이 실행되었다고 판정할 경우, 스텝(S18)으로 제어가 진행된다. 스텝(S18)에서, 클러스터링부(27)는, 가장 높은 일치율을 가지는 클러스터수중에서 가장 작은 클러스터수를 특정한다. 그 후에, 클러스터링부(27)가, 특정된 클러스터수에 있어서의 클러스터의 중심을 특정한다. 클러스터링부(27)는, 클러스터의 중심의 위치를 콘텐츠 데이터베이스(22)에 공급한다. 콘텐츠 데이터베이스 (22)는, 중심의 위치를 저장한다.
스텝(S19)에서, 출력부(28)는, 콘텐츠 데이터베이스(22)로부터, 변형된 공간의 좌표상의 중심의 위치를 판독하고, 그 중심의 위치를 출력하고, 처리는 종료한 다.
이와 같이, 변환 함수 및 중심의 위치는, 콘텐츠 데이터베이스 22)에 저장되는 동시에, 출력부(28)에 의해서, 외부로 출력된다.
출력부(28)로부터 출력된, 변환 함수 및 중심의 위치를 나타내는 정보는, 다음에 설명하는, 사용자에 의해 사용되는 정보처리 장치(101)에서 이용된다.
다음에, 콘텐츠를 기록하고 재생하며, 유사한 콘텐츠를 특정하는 정보처리 장치(101)에 대해 설명한다.
도 25는, 정보처리 장치(101)의 구성의 예를 나타내는 블럭도이다. 정보처리 장치(101)는, 콘텐츠 로딩부(121), 특징량 추출부(122), 콘텐츠 데이터베이스 (123), 평가 데이터 저장부(124), 콘텐츠 그룹 특정부(125), 조작부(126), 검색 처리부(127), 제시부(128), 및 재생부((129))로 구성된다.
콘텐츠 로딩부(121)는, CD(Compact Disc)로부터의 판독에 의해, 또는 네트워크를 통해 서버로부터의 다운로드에 의해, 콘텐츠를 로드한다.
특징량 추출부(122)는, 콘텐츠 로딩부(121)에 의해서 로드된 콘텐츠의 특징량을 추출한다. 특징량 추출부(122)는, 특징량 추출부(23)에 대해 추출되는 특징량과 같은 특징량을 추출한다. 특징량 추출부(122)는, 로드된 콘텐츠와 함께, 추출한 특징량을 콘텐츠 데이터베이스(123)에 공급한다.
조작부(126)는, 사용자의 조작에 따라 입력된 특징량을 취득한다는 것을 명심하자. 즉, 도시하지 않는 취득부가, 도시하지 않는 네트워크를 통해 접속된 서버로부터 특징량을 판독하여 특징량을 취득하도록 할 수 있다.
콘텐츠 데이터베이스(123)는, 로드된 콘텐츠와 함께, 추출된 특징량을 저장한다.
콘텐츠 그룹 특정부(125)는, 평가 데이터 저장부(124)에 미리 저장되어 있는 변환 함수 및 중심의 위치를 기본으로 하여, 로드된 콘텐츠가 속하는 콘텐츠의 그룹을 특정한다.
콘텐츠 그룹 특정부(125)는, 특징량 변환부(131)를 포함한다. 특징량 변환부(131)는, 로드된 콘텐츠로부터 추출된 특징량을 판독하고, 평가 데이터 저장부 (124)에 미리 저장되어 있는 변환 함수를 이용하여 특징량을 변환한다.
콘텐츠 그룹 특정부(125)는, 변환된 특징량에 의해 표시되는 위치와, 평가 데이터 저장부(124)에 미리 저장되어 있는 중심의 위치를 비교한다. 그리하여, 로드된 특징량과의 거리가 가장 가까운 중심의 그룹을 특정한다. 콘텐츠 그룹 특정부(125)는, 특정된 콘텐츠의 그룹을 나타내는 정보를 콘텐츠 데이터베이스(123)에 공급한다.
콘텐츠 데이터베이스(123)는, 콘텐츠 그룹 특정부(125)에 의해서 특정된 콘텐츠의 그룹을 나타내는 정보를, 로드된 콘텐츠 및 그 특징량과 함께 저장한다.
조작부(126)는, 키보드 또는 리모트 콘트롤러를 포함한다. 조작부(126)는,사용자에 의한 콘텐츠의 선택 또는 유사한 콘텐츠의 검색과 같은 조작 지령을 받아들인다. 조작부(126)는, 받아들인 지령에 대응하는 신호를 검색 처리부(127)에 공급한다.
검색 처리부(127)는, 조작부(126)로부터의 신호에 대응하여, 사용자가 콘텐 츠를 선택하거나 콘텐츠를 검색하는 경우에, 특정의 콘텐츠 그룹을 추출한다. 검색 처리부(127)는, 콘텐츠 데이터베이스(123)에 저장되어 있는 콘텐츠 가운데, 사용자에게 선택된 콘텐츠와 유사한 콘텐츠를 검색한다.
제시부(128)는, LCD(Liquid Crystal Display) 또는 유기 EL(Electro Luminescence) 디스플레이를 포함한다. 제시부(128)는, 검색 처리부(127)에 의해 검색되고, 사용자에 의해 선택된 콘텐츠와 유사한 콘텐츠의 리스트를 제시한다.
재생부(129)는, 사용자에 의해 선택된 콘텐츠를 재생한다. 예를 들면, 사용자가 악곡인 콘텐츠의 재생을 지령했을 경우, 재생부(129)는, 데이터로 되어 있는 콘텐츠를 복호하고, 그 악곡인 콘텐츠를 소리로서 출력하도록, 콘텐츠를 재생한다. 또, 예를 들면, 한 그룹의 콘텐츠의 재생이 사용자에 의해 지령되었을 경우, 재생부(129)는, 재생이 지령된 그룹의 콘텐츠를 재생한다.
콘텐츠 데이터베이스(123)는, 정보처리 장치(101) 또는 정보처리 장치(101)의 외부의 서버에 설치될 수 있다. 이 경우, 도시하지 않는 네트워크를 통해 정보처리 장치(101)로 콘텐츠 데이터베이스(123)가 접속된다.
다음에, 콘텐츠를 판독하는 경우에, 모든 콘텐츠에 대해서 실행되는 콘텐츠의 로딩 처리에 대해 설명한다. 콘텐츠의 로딩의 처리는, 콘텐츠를 추가하는 경우, 추가하는 콘텐츠에 대해서도 실행된다.
도 26은, 정보처리 장치(101)에 의한, 콘텐츠의 로딩의 처리를 설명하는 플로차트이다. 스텝(S51)에서, 콘텐츠 로딩부(121)는, CD로부터의 판독 또는 네 트워크를 통해 서버로부터의 다운로드에 의해, 콘텐츠를 로드한다. 스텝(S52)에 서, 특징량 추출부(122)는, 스텝(S51)애서 로드된 콘텐츠의 특징량을 추출한다. 예를 들면, 특징량 추출부(122)는, 악곡인 콘텐츠의, 템포, 스피드, 템포의 흔들림의 크기, 메이저 코드의 비율, 단위시간 당의 소리가 많음, 또는 주파수 대역중에서 중대역에 대한 저대역의 에너지의 비율과 같은 특징량을 추출한다.
스텝(S53)에서, 특징량 추출부(122)는, 콘텐츠와 함께, 콘텐츠의 특징량을 콘텐츠 데이터베이스(123)에 저장한다.
스텝(S54)에서, 콘텐츠 그룹 특정부(125)의 특징량 변환부(131)는, 로드된 콘텐츠의 특징량을 콘텐츠 데이터베이스(123)로부터 판독하고, 평가 데이터 저장부 (124)에 저장되어 있는 변환 함수를 이용하여 특징량을 변환한다.
스텝(S55)에서, 콘텐츠 그룹 특정부(125)는, 변환 함수에 의해 변환된 특징량과, 평가 데이터 저장부(124)에 저장되어 있는 정보로 표시되는 중심과의 거리를 계산한다. 스텝(S56)에서, 콘텐츠 그룹 특정부(125)는, 로드된 콘텐츠의 그룹이 특징량과의 거리의 가장 짧은 중심의 콘텐츠 그룹이 되도록, 콘텐츠가 소속하는 콘텐츠 그룹을 특정한다.
스텝(S57)에서, 콘텐츠 그룹 특정부(125)는, 콘텐츠 데이터베이스(123)를 제어하여 변환된 특징량과, 특정된 콘텐츠 그룹을 나타내는 정보를 저장시키며, 그 결과, 콘텐츠 데이터베이스(123)는 변환된 특징량과 콘텐츠 그룹을 등록하고, 처리는 종료한다.
이와 같이, 콘텐츠가 로드되면, 그 콘텐츠에 대해서, 변형된 공간에 있어서 의 특징량이 구해진다. 그 후에, 그 특징량에 의해 분류되는 콘텐츠 그룹 중에서, 로드된 콘텐츠가 소속하는 콘텐츠 그룹이 특정된다.
정보처리 장치(101)에 의해 콘텐츠가 지정되면, 지정된 콘텐츠와 유사한 콘텐츠가 검색된다.
다음에, 도 27의 플로차트를 참조하여, 유사 콘텐츠 검색의 처리를 설명한다. 스텝(S71)에서, 조작부(126)는, 사용자로부터 재생되는 콘텐츠의 지정을 받아들인다. 조작부(126)는, 사용자로부터의 조작에 대응하여, 지정된 콘텐츠를 나타내는 신호를 검색 처리부(127)에 공급한다.
스텝(S72)에서, 검색 처리부(127)는, 콘텐츠 데이터베이스(123)로부터, 지정된 콘텐츠의 콘텐츠 그룹과 동일한 그룹에 속하는 콘텐츠를 검색한다. 즉, 검색 처리부(127)는, 콘텐츠 데이터베이스(123)로부터, 지정된 콘텐츠가 속하는 콘텐츠 그룹에 속하는 다른 콘텐츠를 검색한다.
스텝(S72)에서, 검색 처리부(127)는, 다른 수법에 의해, 변환된 특징량을 기본으로 하여, 지정된 콘텐츠와 유사한 콘텐츠를 검색할 수 있다. 예를 들면, 검색 처리부(127)는, 콘텐츠 데이터베이스(123)에 기록되어 있는 변환된 특징량에 근거하여, 지정된 콘텐츠의 특징량과의 유클리드 거리가 가장 짧은 특징량의 콘텐츠를 검색할 수 있다.
스텝(S73)에서, 검색 처리부(127)는, 검색된 콘텐츠의 리스트를 생성한다. 예를 들면, 스텝(S73)에서, 검색 처리부(127)는, 검색된 콘텐츠의 이름이나 공연자 또는 작곡자의 이름을 나타내는 리스트를 생성한다. 검색 처리부(127)은, 생성한 리스트를, 콘텐츠 데이터베이스(123)을 통해 제시부(128)에 공급한다.
스텝(S74)에서, 제시부(128)는, 검색 처리부(127)에 의해서 생성된, 검색된 콘텐츠의 리스트를 제시한다. 이 리스트는, 지정된 콘텐츠와 유사한 콘텐츠의 리스트를 포함한다.
스텝(S75)에서, 재생부(129)는, 사용자에 의해 지정된 콘텐츠를 재생하고, 처리는 종료한다.
이와 같이, 사용자로부터 콘텐츠가 지정되면, 지정된 콘텐츠와 유사한 콘텐츠의 리스트가 제시된다.
사용자가 콘텐츠를 재생시키는 동안에, 재생되는 콘텐츠와 유사한 콘텐츠의 리스트가 콘텐츠의 후보로서 제시된다.
사용자가 콘텐츠를 지정하고, 지정한 콘텐츠와 유사한 콘텐츠의 리스트의 제시를 지령했을 경우, 스텝(S72) 내지 스텝(S74)과 비슷한 처리에 의해, 콘텐츠 데이터베이스(123)에 저장되어 있는 콘텐츠 가운데, 지정한 콘텐츠와 유사한 콘텐츠의 리스트가 제시될 수 있다.
또한, 유사한 콘텐츠를 특정하는 측에 의해 공간이 변형될 수 있다.
도 28은, 도 23의 플로차트를 참조하여 설명한 사전 처리를 실행함으로써 공간을 변형하는 정보처리 장치(151)의 구성을 나타내는 블럭도이다. 정보처리 장치(151)는, 유사한 콘텐츠를 특정할 수도 있다. 도 28에서는, 도 1에 도시된 유사한 부분에는 동일한 부호를 부여하고 있으므로, 그 설명은 생략한다.
또한, 도 28에서는, 도 25에 도시된 부분에 동일한 부호를 부여하고 있으므 로, 그 설명은 생략한다.
이용자에 의해서 이용되며, 도 28에 구성이 도시된 정보처리 장치(151)는, 사용자 평가 취득부(25), 공간 변형부(26), 클러스터링부(27), 특징량 추출부 (122), 콘텐츠 그룹 특정부(125), 조작부(126), 검색 처리부(127), 제시부(128), 재생부(129), 콘텐츠 로딩부(171), 콘텐츠 데이터베이스(172), 및 평가 데이터 취득부(173)로 구성된다.
콘텐츠 로딩부(171)는, 샘플 콘텐츠의 특징량의 공간을 변형하기 위해 콘텐츠 샘플로서 작용하는 샘플 콘텐츠를 로드한다. 콘텐츠 로딩부(171)는, CD로부터의 판독 또는 네트워크를 통해 서버로부터의 다운로드에 의해, 콘텐츠를 로드한다.
콘텐츠 데이터베이스(172)는, 샘플 콘텐츠, 콘텐츠, 샘플 콘텐츠 또는 콘텐츠의 특징량, 샘플 콘텐츠에 대한 사용자 평가인 유사도 데이터(S)를 저장한다.
평가 데이터 취득부(173)는, 공간 변형부(26)로부터 변환 함수를 취득함과 동시에, 클러스터링부(27)로부터 중심의 위치를 취득하고, 변환 함수 및 중심의 위치를 저장한다. 평가 데이터 취득부(173)는, 저장하고 있는 변환 함수 및 중심의 위치를 콘텐츠 그룹 특정부(125)에 공급한다.
정보처리 장치(151)에 의한 사전 처리는, 도 23의 플로차트를 참조해 설명한 처리와 같아서 그 설명은 생략한다.
정보처리 장치(151)에 의한 콘텐츠 로드 처리는, 도 26의 플로차트)를 참조해 설명한 처리와 같아서 그 설명은 생략한다.
정보처리 장치(151)에 의한 유사 콘텐츠 검색 처리는, 도 27의 플로차트를 참조해 설명한 처리와 같아서 그 설명은 생략한다.
이와 같이, 유사한 콘텐츠를 특정하는 정보처리 장치(151)는, 특징량의 공간을 변형하므로, 변환 함수 및 중심의 위치가 얻어지게 된다.
이 경우, 샘플 콘텐츠에 대한 사용자 평가인 유사도 데이터(S)는, 정보처리 장치(151)을 사용하는 사용자의 주관을 나타내고 있으므로, 정보처리 장치(151)를 사용하는 사용자의 주관에 따라, 특징량의 공간이 변형된다. 그 결과, 정보처리 장치(151)를 사용하는 사용자의 주관에 따라 콘텐츠가 클러스터링된다. 이에 의해, 사용자의 주관에 의한 유사 판단과 근사한 비교 판단에 근거하여, 유사하다고 여겨지는 콘텐츠가 검색된다.
이와 같이, 보다 간단하게, 보다 신속히, 또한, 보다 정확하게 유사한 콘텐츠를 특정할 수 있게 된다.
종래와 같이, 콘텐츠의 특징량의 사이의 거리를 유사도로 하는 경우에, 신규로 콘텐츠가 추가될 때마다, 추가된 콘텐츠의 특징량과 기존의 모든 콘텐츠의 특징량과의 거리를 계산할 필요가 있었다.
그러나, 본 발명에 의하면, 유사한 콘텐츠의 그룹을 특정한다, 그 결과, 1개의 콘텐츠에 대해서는, 단지 대표치와의 거리계산을 하는 것이 필요하므로, 처리의 부하가 큰 폭으로 저감된다.
또한, 종래의 콘텐츠의 쌍의 유사도를 구하기 위해서는, 콘텐츠가 추가될 때마다, 모든 쌍에 대한 특징량의 거리의 계산이 실행되지 않으면 안 되었다.
그러나, 본 발명에 의하면, 미리 그룹을 특정해 둔다. 이에 의해, 모든 쌍 에 대한 특징량의 거리의 계산을 재차 실시할 필요가 없어진다.
즉, 유사한 장르의 콘텐츠를 찾는 공간을 만들도록 할 수도 있다. 이것은, 동일한 장르에 있다고 분류된 콘텐츠가 서로 유사하고, 다른 장르에 속한 콘텐츠기 서로 비슷하지 않다고 판정함으로써 실행될 수 있다.
이와 같이, 악곡인 콘텐츠에 대해서, 유사한 악기의 조합에 의해 연주된 악곡을 찾는 공간을 만들 수도 있다. 이것은, 유사한 악기의 조합에 의해 연주된 악곡이 서로 유사하며, 가장 공통적이지 않는 악기들로 연주되는 악곡들이 서로 유사하지 않다고 판정함으로써 실행될 수 있다.
본 발명은, 콘텐츠의 특징량에 한정하지 않고, 소정의 목적을 위해 특징량을 가지는 콘텐츠 간의 유사도를 구하고 싶은 모든 케이스에 적용할 수 있다. 즉, 예를 들면, 본 발명은 콘텐츠의 유사도 판정에 한정하지 않고, 콘텐츠를 구성하는 요소간의 유사도를 판정할 수도 있다. 보다 구체적으로는, 본 발명은, 예를 들면, 악곡 구조 해석시에, 소절(measure)간의 유사도를 계산하는 경우에도 적용할 수 있다.
정보처리 장치 (11) 또는 정보처리 장치(151)는, 콘텐츠에 부여되어 있는 메타 데이터를 해석하여, 콘텐츠의 특징량을 추출할 수 있다. 즉, 정보처리 장치 (11) 또는 정보처리 장치(151)는, 콘텐츠의 특징량으로서 콘텐츠의 기존의 메타 데이터를 취득할 수 있다. 이 경우, 사용된 메타 데이터는, 수치의 메타 데이터 도또는 주성분 분석이나 PLSA(Probabilistic Latent Semantic Analysis)라고 하는 수치화의 수법을 이용하여, 수치 형태로 변환된 텍스트의 메타 데이터가 될 수 있 다.
한편, 정보처리 장치 (101)또는 정보처리 장치(151)는, 콘텐츠를 기록하고 재생하며 유사한 콘텐츠 데이터를 특정하는 고정 장치로서 기술되었다. 그러나,정보처리 장치 (11)또는 정보처리 장치(151)는 이에 한정되지 않고, 콘텐츠를 기록 및 재생하는 기기가 되어도 충분하다. 정보처리 장치 (11)또는 정보처리 장치(151)는 휴대형의 기기, 차재용의 기기, 또는 휴대 전화기로서 구성될 수 있다.
이와 같이, 특징량에 근거하여, 유사한 콘텐츠를 검색하도록 했을 경우에는, 정보처리 장치는 유사한 콘텐츠를 특정할 수 있다. 또한, 아래에 기술되도록 구성된 경우에, 정보처리 장치는 유사한 콘텐츠를 보다 간단하게, 보다 신속히, 또한, 보다 정확하게 특정할 수 있다. 즉, 정보처리 장치는 함수들을 이용하여 콘텐츠 특징량을 변환한다. 상기 함수들은, 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환한다. 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑한다. 정보처리 장치는, 변환된 특징량에 의해, 유사한 콘텐츠를 검색한다.
상술한 일련의 처리는, 하드웨어에 의해 실행시킬 수도 있고, 소프트웨어에 의해 실행시킬 수도 있다. 일련의 처리를 소프트웨어에 의해 실행시키는 경우에는, 그 소프트웨어를 구성하는 프로그램이, 프로그램 기록 매체로부터, 전용의 하드웨어에 내장되어 있는 컴퓨터, 또는, 각종 프로그램이 설치되어 있으므로, 여러 가지 기능을 실행하는 것이 가능한 범용의 퍼스널 컴퓨터내에 설치된다.
도 29는, 상술한 일련의 처리를 실행하는 퍼스널 컴퓨터의 구성의 예를 나타내는 블럭도이다. CPU(Central Processing Unit)(201)는, ROM(Read Only Memory)(202), 또는 저장부(208)에 저장되고 있는 프로그램에 따라서 각종의 처리를 실행한다. RAM(Random Access Memory)(203)에는, CPU(201)가 실행하는 프로그램과 데이터가 적절하게 저장된다. 이러한 CPU(201), ROM(202), 및 RAM(203)은, 버스(204)에 의해 서로 접속되어 있다.
CPU(201)에는 또, 버스(204)를 통해 입출력 인터페이스(205)가 접속되어 있다. 입출력 인터페이스(205)에는 그것에 접속된 입력부(206)와 출력부(207)를 포함한다. 입력부(206)는, 키보드, 마우스와 마이크로폰과 같은 장치를 포함한다. 출력부(207)는, 디스플레이와 스피커와 같은 장치를 포함한다. CPU(201)는, 입력부(206)로부터 입력되는 지령에 대응하여 각종의 처리를 실행한다. 그리고, CPU(201)는, 처리의 결과를 출력부(207)에 출력한다.
입출력 인터페이스(205)에 접속되어 있는 저장부(208)는, 예를 들면 하드 디스크를 포함한다. 저장부(208)는, CPU(201)가 실행하는 프로그램과 각종의 데이터를 저장한다. 통신부(209)는, 인터넷이나 근거리 통신망 등의 네트워크를 통해 외부의 장치와 통신한다.
또, 통신부(209)를 통해 프로그램을 취득하고, 저장부(208)에 저장될 수 있다.
입출력 인터페이스(205)에 접속되어 있는 드라이브(210)는, 매체(211)가 장 착되었을 때에, 자기 디스크, 광디스크, 광학 자기 디스크, 혹은 반도체 메모리와 같은 분리가능한 매체(211)를 구동한다. 그로 인해, 드라이브(210)는 매체(211)로부터 프로그램과 데이터를 취득한다. 취득된 프로그램과 데이터는, 필요에 따라서 저장부(208)에 전송되어 저장된다.
도 29에 도시된 바와 같이, 컴퓨터내에 설치되고, 실행 가능한 상태로 되어 있는 프로그램을 저장하는 프로그램 기록 매체는, 자기 디스크(flexible disk를 포함한다), 광디스크(CD-ROM(Compact Disc-Read Only Memory), DVD(Digital Versatile Disc)를 포함한다), 광학 자기 디스크를 포함한다), 혹은 반도체 메모리를 포함하며, 패키지 매체인 분리가능한 매체(211)를 포함한다. 또는, 프로그램 기록 매체는, 프로그램을 일시적 혹은 영구적으로 저장하는 ROM(202)을 포함한다.또는, 프로그램 기록 매체는, 저장부(208) 또는 다른 매체를 포함하는 하드 디스크로 구성된다. 프로그램 기록 매체내에 프로그램을 저장하는 작업은, 필요에 따라서 라우터 및 모뎀과 같은 인터페이스인 통신부(209)를 통해 이류어진다. 프로그램은, 근거리 통신망, 인터넷, 디지털 위성방송과 같은 유선 또는 무선 통신 매체를 이용하여 저장된다.
본 명세서에서는, 프로그램 기록 매체에 저장되는 프로그램을 기술하는 스텝이, 기재된 순서에 따라서 시계열적으로 행해지는 처리는 물론, 반드시 시계열적으로 처리되지 않아도, 병렬적 혹은 개별적으로 실행되는 처리도 포함한다는 것에 주목하자.
본 발명의 실시의 형태는, 상술한 실시의 형태로 한정되는 것이 아니고, 본 발명의 요지를 일탈하지 않는 범위내에서 여러 가지의 변경이 가능하다는 것을 주목하자.
도 1은, 콘텐츠의 특징량의 공간을 변형하는 정보처리 장치의 구성의 예를 나타내는 블럭도이다.
도 2는, 공간 변형부의 구성을 나타내는 블럭도이다.
도 3은, 공간의 변형을 설명하는 도면이다.
도 4는, 변환 함수를 설명하는 도면이다.
도 5는, 변형된 공간을 설명하는 도면이다.
도 6은, 유전적 수법에 의해, 변형되는 공간을 설명하는 도면이다.
도 7은, 유전적 수법에 따르는 공간의 변형의 개념을 나타내는 도면이다.
도 8은, 변형된 공간에 있어서의 유클리드 거리와 콘텐츠의 유사와의 관계를 나타내는 도면이다.
도 9는, 변형된 공간에 있어서의, 유사한 콘텐츠 또는 유사하지 않는 콘텐츠의 특징량에 대한 유클리드 거리와 FDR의 값과의 관계를 나타내는 도면이다.
도 10은, 변형된 공간에 있어서의, 유사한 콘텐츠 또는 유사하지 않는 콘텐츠의 특징량에 대한 유클리드 거리와 FDR의 값과의 관계를 나타내는 도면이다.
도 11은, 변형된 공간에 있어서의, 유사한 콘텐츠 또는 유사하지 않는 콘텐츠의 특징량에 대한 유클리드 거리와 FDR의 값과의 관계를 나타내는 도면이다.
도 12는, 자유 파라미터의 예를 나타내는 도면이다.
도 13은, 상관치와 유사도 데이터(S)와 콘텐츠의 특징량의 사이의 거리와의 관계를 나타내는 도면이다.
도 14는, 상관치와 유사도 데이터(S)와 콘텐츠의 특징량의 사이의 거리와의 관계를 나타내는 도면이다.
도 15는, 상관치와 유사도 데이터(S)와 콘텐츠의 특징량의 사이의 거리와의 관계를 나타내는 도면이다.
도 16은, 클러스터수 및 일치율의 예를 나타내는 도면이다.
도 17은, 유사도 데이터(S)에 의한 평가의 예를 나타내는 도면이다.
도 18은, 일치율의 예를 나타내는 도면이다.
도 19는, 클러스터의 예를 나타내는 도면이다.
도 20은, 클러스터의 예를 나타내는 도면이다.
도 21은, 클러스터의 예를 나타내는 도면이다.
도 22는, 클러스터의 예를 나타내는 도면이다.
도 23은, 사전 처리를 설명하는 플로차트(flow chart)이다.
도 24는, 공간의 변형의 처리를 설명하는 플로차트이다.
도 25는, 유사한 콘텐츠를 특정하는 정보처리 장치의 구성의 예를 나타내는 블럭도이다.
도 26은, 콘텐츠의 혼잡 처리를 설명하는 플로차트이다.
도 27은, 유사 콘텐츠 검색 처리를 설명하는 플로차트이다.
도 28은, 콘텐츠의 특징량의 공간을 변형하여, 유사한 콘텐츠를 특정하는 정보처리 장치의 구성의 예를 나타내는 블럭도이다.
도 29는, 퍼스널 컴퓨터의 구성의 예를 나타내는 블럭도이다.

Claims (15)

  1. 정보처리 장치에 있어서,
    복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 이용하여, 콘텐츠 특징량을 변환하며, 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑하는 변환 수단과,
    변환된 특징량에 의해, 유사한 콘텐츠를 검색하는 검색 수단을 갖추는 정보처리 장치.
  2. 제 1항에 있어서,
    콘텐츠의 특징량을 추출하는 추출 수단을 추가로 갖추는 정보처리 장치.
  3. 제 1항에 있어서,
    상기 검색 수단은, 특징량이 상기 함수에 의해 변환되어진 콘텐츠의 그룹들중 동일한 그룹에 속하는 콘텐츠를 검색하여, 유사한 콘텐츠를 검색하는 정보처리 장치.
  4. 제 1항에 있어서,
    상기 변환 수단은, 두 개의 값으로부터 산출된 정보 기준이 되는 평가치가, 소정의 기간로 더 이상 갱신되지 않을 될 때까지, 유전적 수법의 반복 생성에 의해 얻어진 함수를 적용하여, 콘텐츠의 특징량을 변환하며, 상기 두개의 값중, 한 개의 값은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계에서 유사하다고 여겨진 콘텐츠와 유사하지 않다고 여겨진 콘텐츠와의 유클리드 거리에 근거하는 분류의 정도를 나타내는 값이 되며, 다른 값은, 상기 함수의 자유 파라미터의 수가 되는 정보처리 장치.
  5. 제 4항에 있어서,
    상기 변환 수단은, 분류의 정도를 나타내는 FDR(Fisher discriminant ratio)로부터 산출된 평가치가 소정의 기간로 더 이상 갱신되지 않을 될 때까지, 유전적 수법의 반복 생성에 의해 얻어진 함수를 적용하여, 콘텐츠의 특징량을 변환하는 정보처리 장치.
  6. 제 1항에 있어서,
    유전적 수법에 따라 상기 함수를 생성하는 생성 수단을 추가로 구비하며,
    상기 변환 수단은, 생성된 상기 함수를 적용하여, 콘텐츠의 특징량을 변환하는 정보처리 장치.
  7. 제 6항에 있어서,
    사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계에서 유사하다고 여겨진 콘텐츠와 유사하지 않다고 여겨진 콘텐츠와의 유클리드 거리에 의한 분류의 정도를 나타내는 값과, 상기 함수의 자유 파라미터의 수를 나타내는 값들에 근거하여, 정보 기준이 되는 평가치를 산출하는 산출 수단을 추가로 구비하며,
    상기 생성 수단은, 상기 평가치가 소정의 기간 동안에 더 이상 갱신되지 않을 될 때까지, 유전적 수법에 따라 상기 함수를 생성하는 정보처리 장치.
  8. 제 7항에 있어서,
    상기 산출 수단은, 분류의 정도를 나타내는 FDR로부터 상기 평가치를 산출하는 정보처리 장치.
  9. 제 7항에 있어서,
    사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계를 나타내는 데이터를 취득하는 취득 수단을 추가로 구비하며,
    상기 산출 수단은, 사용자로부터 입력된 상기 복수의 콘텐츠간의 유사 관계를 나타내는 데이터를 이용하여, 평가치를 산출하는 정보처리 장치.
  10. 제 1항에 있어서,
    변환된 특징량에 의해, 콘텐츠의 클러스터링을 실행하는 클러스터링 수단을 추가로 구비하는 정보처리 장치.
  11. 제 1항에 있어서,
    변환된 특징량에 근거하는 콘텐츠와 클러스터와의 거리로부터, 콘텐츠가 속하는 그룹을 특정하는 특정 수단을 추가로 구비하는 정보처리 장치.
  12. 정보처리 방법에 있어서,
    복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 이용하여, 콘텐츠 특징량을 변환하며, 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑하는 변환 스텝과,
    변환된 특징량에 의해, 유사한 콘텐츠를 검색하는 검색 스텝을 갖추는 정보처리 방법.
  13. 컴퓨터가 변환 및 검색 스텝을 실행하도록 제어하는 프로그램에 있어서,
    상기 변환 스텝은, 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 이용하여, 콘텐츠 특징량을 변환하며, 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑 하며,
    상기 검색 스텝은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색하는 프로그램.
  14. 컴퓨터가 변환 및 검색 스텝을 실행하도록 제어하는 프로그램을 저장하는 기록매체에 있어서,
    상기 변환 스텝은, 복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 이용하여, 콘텐츠 특징량을 변환하며, 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑하며,
    상기 검색 스텝은, 변환된 특징량에 의해, 유사한 콘텐츠를 검색하는 기록매체.
  15. 정보처리 장치에 있어서,
    복수의 특징량에 의해 정의된 콘텐츠간의 거리가, 사용자로부터 입력된 복수의 콘텐츠간의 유사 관계에 대응하는 거리가 되도록, 상기 복수의 콘텐츠에 부여된 상기 복수의 특징량을 변환하는 함수를 이용하여, 콘텐츠 특징량을 변환하며, 상기 함수는, 상기 복수의 특징량의 변환에 의해 새로운 특징량 공간에, 상기 복수의 특 징량에 의해 정의되는 특징량 공간내에 배치된 콘텐츠를 매핑하는 변환부와,
    변환된 특징량에 의해, 유사한 콘텐츠를 검색하는 검색부를 갖추는 정보처리 장치.
KR1020070091308A 2006-10-02 2007-09-10 정보처리 장치 및 방법, 프로그램, 및 기록 매체 KR20080030922A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006270962A JP4274221B2 (ja) 2006-10-02 2006-10-02 情報処理装置および方法、プログラム、並びに記録媒体
JPJP-P-2006-00270962 2006-10-02

Publications (1)

Publication Number Publication Date
KR20080030922A true KR20080030922A (ko) 2008-04-07

Family

ID=38786928

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070091308A KR20080030922A (ko) 2006-10-02 2007-09-10 정보처리 장치 및 방법, 프로그램, 및 기록 매체

Country Status (5)

Country Link
US (1) US7805389B2 (ko)
EP (1) EP1909201A3 (ko)
JP (1) JP4274221B2 (ko)
KR (1) KR20080030922A (ko)
CN (1) CN101174407B (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7777122B2 (en) * 2008-06-16 2010-08-17 Tobias Hurwitz Musical note speedometer
JP4715898B2 (ja) 2008-10-03 2011-07-06 ソニー株式会社 情報処理装置、情報処理方法、情報処理プログラム、情報提供装置、情報提供方法、情報提供プログラムおよび情報処理システム
US8135739B2 (en) * 2008-12-29 2012-03-13 Microsoft Corporation Online relevance engine
US7953679B2 (en) * 2009-07-22 2011-05-31 Xerox Corporation Scalable indexing for layout based document retrieval and ranking
US20110270864A1 (en) * 2010-04-29 2011-11-03 Microsoft Corporation Comparisons between entities of a particular type
US9043296B2 (en) 2010-07-30 2015-05-26 Microsoft Technology Licensing, Llc System of providing suggestions based on accessible and contextual information
JP5465689B2 (ja) * 2011-02-28 2014-04-09 株式会社日立製作所 高精度な類似検索システム
US9665643B2 (en) 2011-12-30 2017-05-30 Microsoft Technology Licensing, Llc Knowledge-based entity detection and disambiguation
US9864817B2 (en) 2012-01-28 2018-01-09 Microsoft Technology Licensing, Llc Determination of relationships between collections of disparate media types
JP5994974B2 (ja) 2012-05-31 2016-09-21 サターン ライセンシング エルエルシーSaturn Licensing LLC 情報処理装置、プログラム及び情報処理方法
JP5866064B2 (ja) * 2013-04-09 2016-02-17 株式会社日立国際電気 画像検索装置、画像検索方法、および記録媒体
JP5952226B2 (ja) * 2013-06-26 2016-07-13 日本電信電話株式会社 情報処理装置、特徴量変換システム、変換ルール生成方法及び変換ルール生成プログラム
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
EP3716099A4 (en) * 2017-11-22 2021-07-14 Kao Corporation DEVICE FOR CLASSIFYING DOCUMENTS
CN111489721B (zh) * 2020-03-23 2022-05-03 天津大学 一种信号帧矩阵化的音乐信息记录方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07239938A (ja) * 1994-02-28 1995-09-12 Matsushita Electric Ind Co Ltd 検査方法
CA2172791C (en) * 1995-03-31 2000-11-14 Teruyoshi Washizawa Method and apparatus for processing visual information
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
JP3762835B2 (ja) * 1998-05-21 2006-04-05 富士通株式会社 データ分解装置、その方法、及び記録媒体
NO983175L (no) * 1998-07-10 2000-01-11 Fast Search & Transfer Asa Soekesystem for gjenfinning av data
JP4302799B2 (ja) 1998-09-16 2009-07-29 シャープ株式会社 文書検索装置、方法および記録媒体
US6578031B1 (en) * 1998-09-30 2003-06-10 Canon Kabushiki Kaisha Apparatus and method for retrieving vector format data from database in accordance with similarity with input vector
WO2000036530A1 (fr) * 1998-12-15 2000-06-22 Matsushita Electric Industrial Co., Ltd. Methode de recherche et dispositif correspondant, support enregistre
JP2000259198A (ja) * 1999-03-04 2000-09-22 Sony Corp パターン認識装置および方法、並びに提供媒体
JP2000339453A (ja) * 1999-05-28 2000-12-08 Olympus Optical Co Ltd 画像領域分割装置及びその方法と処理プログラムが記録された記録媒体
JP4302967B2 (ja) * 2002-11-18 2009-07-29 パイオニア株式会社 楽曲検索方法、楽曲検索装置及び楽曲検索プログラム
JP5059297B2 (ja) * 2005-05-09 2012-10-24 株式会社日立ハイテクノロジーズ 電子線式観察装置
JP4077869B2 (ja) * 2006-05-29 2008-04-23 松下電器産業株式会社 光源推定装置、光源推定システムおよび光源推定方法、並びに、画像高解像度化装置および画像高解像度化方法
US7664608B2 (en) * 2006-07-14 2010-02-16 Hitachi High-Technologies Corporation Defect inspection method and apparatus

Also Published As

Publication number Publication date
US20080082506A1 (en) 2008-04-03
CN101174407B (zh) 2011-06-08
JP4274221B2 (ja) 2009-06-03
EP1909201A3 (en) 2012-02-01
US7805389B2 (en) 2010-09-28
CN101174407A (zh) 2008-05-07
EP1909201A2 (en) 2008-04-09
JP2008090612A (ja) 2008-04-17

Similar Documents

Publication Publication Date Title
KR20080030922A (ko) 정보처리 장치 및 방법, 프로그램, 및 기록 매체
Raffel Learning-based methods for comparing sequences, with applications to audio-to-midi alignment and matching
US20170300567A1 (en) Media content items sequencing
Typke Music retrieval based on melodic similarity
CN111309965B (zh) 音频匹配方法、装置、计算机设备及存储介质
CN111400543B (zh) 音频片段的匹配方法、装置、设备及存储介质
KR20080075176A (ko) 비문자기반 정보를 저장하고 검색하는 시스템과 방법
CN111444967A (zh) 生成对抗网络的训练方法、生成方法、装置、设备及介质
KR20170136200A (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
KR100512143B1 (ko) 멜로디 기반 음악 검색방법과 장치
Hajj et al. Automated composer recognition for multi-voice piano compositions using rhythmic features, n-grams and modified cortical algorithms
Lerch Audio content analysis
WO2016102738A1 (en) Similarity determination and selection of music
US20180173400A1 (en) Media Content Selection
Tsai et al. Known-artist live song identification using audio hashprints
Gurjar et al. Comparative Analysis of Music Similarity Measures in Music Information Retrieval Systems.
JP2003316818A (ja) 情報検索方法及びその装置、コンピュータプログラム
Müller et al. Content-based audio retrieval
CN111445922A (zh) 音频匹配方法、装置、计算机设备及存储介质
JP4313343B2 (ja) 携帯端末装置および情報表示方法
JP4279274B2 (ja) 携帯端末装置および楽曲情報表示方法
KR20190009821A (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
EP4250134A1 (en) System and method for automated music pitching
KR20100042705A (ko) 오디오 컨텐츠 검색 방법 및 장치
KR102476120B1 (ko) 인공신경망을 이용하여 음악의 속성을 교차 비교하는 음악 분석 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application