KR20080031148A - 정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램 - Google Patents

정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램 Download PDF

Info

Publication number
KR20080031148A
KR20080031148A KR1020077006744A KR20077006744A KR20080031148A KR 20080031148 A KR20080031148 A KR 20080031148A KR 1020077006744 A KR1020077006744 A KR 1020077006744A KR 20077006744 A KR20077006744 A KR 20077006744A KR 20080031148 A KR20080031148 A KR 20080031148A
Authority
KR
South Korea
Prior art keywords
content
class
data
metadata
combination
Prior art date
Application number
KR1020077006744A
Other languages
English (en)
Inventor
미쯔히로 미야자끼
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20080031148A publication Critical patent/KR20080031148A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/64Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은, 복수의 요소를 분류한 클래스의 특징을 간단하고 또한 정확하게 추출할 수 있는 정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램에 관한 것이다. 조합 추출부(83)는, 콘텐츠 분류부(81)가 유저의 명령에 기초하여 복수의 콘텐츠를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 특징 추출 대상 클래스에 속하는 콘텐츠마다의 메타데이터의 모든 조합 중, 다른 클래스에 속하는 콘텐츠마다의 메타데이터의 조합에는 존재하지 않는 메타데이터의 조합을 추출한다. 본 발명은, 추천 시스템에 적용할 수 있다.
메타데이터, 클래스, 콘텐츠, 입출력 인터페이스, CPU, RAM, ROM

Description

정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램{INFORMATION PROCESSING DEVICE, FEATURE EXTRACTION METHOD, RECORDING MEDIUM, AND PROGRAM}
본 발명은, 정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램에 관한 것으로, 특히 복수의 요소를 분류한 클래스의 특징을 간단하고 또한 정확하게 추출할 수 있게 한 정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램에 관한 것이다.
종래, 시청자가 프로그램을 시청 중에 프로그램에 관련되는 정보를 서버에 요구하고, 시청 중인 프로그램에 미리 관련지어져 기억되어 있는 프로그램 관련 정보를 시청자에게 제공하는 시스템이 제안되어 있다(예를 들면, 특허 문헌 1 참조).
또한, 최근, 특허 문헌 1에 기재된 발명과 같이 유저의 요구에 따를뿐만 아니라, 상품의 구입, 콘텐츠(예를 들면, 텔레비전 프로그램이나 Web 페이지 등)의 시청 등의 과거의 유저의 실적에 기초하여, 유저의 기호에 맞춘 상품이나 콘텐츠를 추천하는 시스템이나 서비스가 보급되어 오고 있다.
예를 들면, 시청자가 선택한 프로그램 및 선택하지 않은 프로그램의 프로그램명을 구성하는 어구를 평가하고, 평가가 높은 어순을 프로그램명에 포함하는 프로그램 후보를 우선하여 표시하는 것이 제안되어 있다(예를 들면, 특허 문헌 2 참 조).
* 특허 문헌 1:일본 특개2005-102109호 공보
* 특허 문헌 2:일본 특개2001-275056호 공보
<발명의 개시>
<발명이 해결하고자 하는 과제>
그러나, 현상의 상품이나 콘텐츠를 추천하는 시스템이나 서비스에서는, 유저의 과거의 실적에 기초하여, 예를 들면, 유사한 구매 패턴을 갖는 다른 유저의 구매 이력을 이용하는 강조 필터링 등의 추천 알고리즘을 이용하는 경우가 많지만, 이 경우, 유저에게 명확한 추천 이유를 제시하는 것이 곤란하다.
또한, 예를 들면, 데이터 집합으로부터 규칙 또는 지식을 발견하기 위한 이론인 러프 집합 이론을 이용하여, 유저가 과거에 구입한 상품, 시청한 콘텐츠 등의 데이터 속성 중에서, 유저의 기호를 나타내는 데이터 속성의 조합을 추천 이유로서 추출하는 것이 생각되지만, 알고리즘이 복잡하고 또한 방대해지며, 계산량 및 계산에 필요한 기억 매체의 기억 용량이 방대해지게 된다. 그 때문에, 상품이나 콘텐츠 등에 관련짓는 데이터 속성의 수나 종류를 제한하거나, 혹은, 처리 능력이 높은 컴퓨터를 준비하는 등의 대응이 필요하게 된다.
또한, 특허 문헌 2에 기재된 발명에서는, 선택한 프로그램의 프로그램명을 구성하는 어구로부터, 선택하지 않은 프로그램명을 구성하는 어구를 단순하게 빼고, 남은 어구를 포함하는 프로그램을 추천하는 것으로서, 반드시 유저의 기호를 정확하게 추출하고, 반영하고 있다고는 할 수 없다.
본 발명은, 이러한 상황을 감안하여 이루어진 것으로, 복수의 요소를 분류한 클래스의 특징을 간단하고 또한 정확하게 추출할 수 있도록 하는 것이다.
<과제를 해결하기 위한 수단>
본 발명의 일 측면의 정보 처리 장치에는, 각 요소의 특징을 나타내는 데이터가 각각 관련지어져 있는 복수의 상기 요소를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 모든 조합 중, 다른 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 조합에는 존재하지 않는 상기 데이터의 조합을 추출하는 특징 추출 수단이 마련되어 있다.
추출된 상기 데이터의 조합 중 1개 이상을 상기 클래스의 특징으로 하여 유저에게 제시하도록 상기 클래스의 특징의 제시를 제어하는 특징 제시 제어 수단을 더 마련할 수 있다.
상기 클래스에 속하는 상기 요소와 상기 데이터와의 제1 관련도, 및 다른 상기 클래스에 속하는 상기 요소와 상기 데이터와의 제2 관련도와 상기 제1 관련도와의 차이에 기초하여, 상기 클래스에 속하는 상기 요소의 특징을 보다 명확하게 나타내고 있는 상기 데이터를, 상기 데이터의 조합을 추출하기 전에 추출하는 데이터 추출 수단을 더 마련하고, 상기 특징 추출 수단에는, 상기 데이터 추출 수단에 의해 추출된 상기 데이터의 조합을 추출시킬 수 있다.
상기 데이터 추출 수단에는, 상기 제1 관련도, 및 상기 제2 관련도와 상기 제1 관련도와의 차이에 기초하여, 상기 클래스에서의 상기 데이터의 가중치를 구하고, 상기 가중치의 값이 상위인 소정의 수의 상기 데이터, 또는 상기 가중치의 값이 소정의 임계값 이상인 상기 데이터를 추출시킬 수 있다.
상기 데이터 추출 수단에는, tfidf(term frequency with inverse document frequency), 상호 정보량, 정보 이득비, χ2승값, 또는 대수 우도비 중 어느 하나를 상기 클래스에서의 상기 데이터의 가중치로서 구할 수 있다.
추출된 상기 데이터의 조합에 기초하여, 상기 요소에 의해 구성되는 제1 그룹과는 서로 다른 제2 그룹에 속하는 요소 중에서, 상기 데이터의 조합이 추출된 상기 클래스에 속하는 상기 요소와 관련이 있는 요소를 추출하는 요소 추출 수단을 더 마련할 수 있다.
상기 요소 추출 수단에는, 추출된 상기 데이터의 조합을 포함하는 상기 데이터가 관련지어져 있는 상기 제2 그룹에 속하는 상기 요소를 추출시키도록 할 수 있다.
추출된 상기 요소의 유저에의 제시를 제어하는 요소 제시 제어 수단을 더 마련할 수 있다.
상기 요소 제시 제어 수단에는, 상기 요소를 추출한 근거로서, 상기 요소의 추출에 이용한 상기 데이터의 조합을 더 제시하도록 제어시킬 수 있다.
상기 요소는 콘텐츠이며, 상기 데이터는 상기 콘텐츠에 관한 메타데이터이도록 할 수 있다.
추출된 상기 데이터의 조합과 상기 데이터의 조합이 추출된 상기 클래스인 추출 대상 클래스에 속하는 상기 요소와의 관련도를 나타내는 평가 지표를 산출하는 평가 지표 산출 수단을 더 마련할 수 있다.
상기 평가 지표 산출 수단에는, 상기 추출 대상 클래스에 속하는 상기 요소 중, 상기 데이터의 조합을 포함하는 상기 데이터가 관련지어져 있는 상기 요소가 차지하는 비율인 재현율, 및 상기 데이터의 조합을 포함하는 상기 데이터가 관련지어져 있는 상기 요소 중, 상기 추출 대상 클래스에 속하는 상기 요소가 차지하는 비율인 적합율의 조화 평균인 F값을 상기 평가 지표로서 산출시킬 수 있다.
분류하는 대상으로 되는 요소에 관련지어져 있는 상기 데이터의 조합에 대한 상기 평가 지표에 기초하여, 상기 분류하는 대상으로 되는 요소를 상기 클래스로 분류하는 클래스 분류 수단을 더 마련할 수 있다.
분류하는 대상으로 되는 요소에 관련지어져 있는 상기 데이터의 조합 중, 각각의 상기 클래스로부터 추출된 상기 데이터의 조합에 일치하는 수에 기초하여, 상기 분류하는 대상으로 되는 요소를 상기 클래스로 분류하는 클래스 분류 수단을 더 마련할 수 있다.
특징을 제시하는 대상으로 되는 요소에 관련지어져 있는 상기 데이터의 조합 중, 각각의 상기 클래스로부터 추출된 상기 데이터의 조합에 일치하는 상기 데이터의 조합에 포함되는 상기 데이터, 및 일치하는 상기 데이터의 조합이 추출된 상기 클래스에 기초하여, 상기 특징을 제시하는 대상으로 되는 요소의 특징을 제시하는 특징 제시 수단을 더 마련할 수 있다.
본 발명의 일 측면의 특징 추출 방법 또는 프로그램은, 각 요소의 특징을 나타내는 데이터가 각각 관련지어져 있는 복수의 상기 요소를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 모든 조합 중, 다른 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 조합에는 존재하지 않는 상기 데이터의 조합을 추출하는 스텝을 포함한다.
본 발명의 일 측면에서는, 각 요소의 특징을 나타내는 데이터가 각각 관련지어져 있는 복수의 상기 요소를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 모든 조합 중, 다른 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 조합에는 존재하지 않는 상기 데이터의 조합이 추출된다.
<발명의 효과>
이상과 같이, 본 발명의 일 측면에 따르면, 복수의 요소를 분류한 클래스의 특징을 추출할 수 있다. 또한, 본 발명의 일 측면에 따르면, 복수의 요소를 분류한 클래스의 특징을 간단하고 또한 정확하게 추출할 수 있다.
도 1은 본 발명을 적용한 정보 처리 시스템의 제1 실시 형태를 도시하는 블록도.
도 2는 도 2의 클라이언트 연산부의 기능의 구성의 예를 도시하는 블록도.
도 3은 콘텐츠에 관련지어져 있는 메타데이터의 예를 도시하는 도면.
도 4는 도 1의 정보 처리 시스템에 의해 실행되는 키워드 추출 처리를 설명하기 위한 플로우차트.
도 5는 콘텐츠를 분류하는 시점을 설명하기 위한 도면.
도 6은 메타데이터의 추출의 예를 설명하기 위한 도면.
도 7은 도 4의 스텝 S3의 메타데이터 추출 처리의 상세 내용을 설명하기 위한 플로우차트.
도 8은 추출한 키워드를 유저에게 제시하는 화면의 예.
도 9는 추출한 키워드를 유저에게 제시하는 화면의 다른 예.
도 10은 도 1의 정보 처리 시스템에 의해 실행되는 콘텐츠 추천 처리를 설명하기 위한 플로우차트.
도 11은 본 발명을 적용한 정보 처리 시스템의 제2 실시 형태를 도시하는 블록도.
도 12는 도 11의 클라이언트 연산부의 기능의 구성의 예를 도시하는 블록도.
도 13은 도 11의 정보 처리 시스템에 의해 실행되는 콘텐츠 분류 처리의 제1 실시 형태를 설명하기 위한 플로우차트.
도 14는 콘텐츠를 분류하는 시점을 설명하기 위한 도면.
도 15는 메타데이터의 추출의 예를 설명하기 위한 도면.
도 16은 도 11의 정보 처리 시스템에 의해 실행되는 콘텐츠 분류 처리의 제2 실시 형태를 설명하기 위한 플로우차트.
도 17은 퍼스널 컴퓨터의 구성의 예를 도시하는 블록도.
<부호의 설명>
1, 201 : 정보 처리 시스템
11, 211 : 콘텐츠 시청 클라이언트
12, 212 : 컨텍스트 검출 단말기
13, 213 : 콘텐츠 배신 서버
14, 214 : 콘텐츠 추천 서버
21, 221 : 유저 입력부
22, 222 : 클라이언트 연산부
23, 223 : 클라이언트 기억부
24, 224 : 클라이언트 출력부
41, 241 : 콘텐츠 배신부
81, 281 : 콘텐츠 분류부
82, 282 : 메타데이터 추출부
83, 283 : 조합 추출부
84 : 키워드 제시부
85 : 추천 콘텐츠 추출부
86 : 추천 콘텐츠 제시부
291 : 콘텐츠 분류 룰 생성부
292 : 콘텐츠 자동 분류부
293 : 분류 결과 제시부
901 : CPU
902 : ROM
903 : RAM
908 : 기록부
910 : 드라이브
911 : 리무버블 미디어
<발명을 실시하기 위한 최량의 형태>
이하, 도면을 참조하여, 본 발명의 실시 형태에 대하여 설명한다.
도 1은, 본 발명을 적용한 정보 처리 시스템(1)의 일 실시 형태를 도시하는 블록도이다.
정보 처리 시스템(1)은, 콘텐츠 시청 클라이언트(11), 컨텍스트 검출 단말기(12), 콘텐츠 배신 서버(13), 및 콘텐츠 추천 서버(14)를 포함하도록 구성된다.
콘텐츠 시청 클라이언트(11)는, 예를 들면, 클라이언트 컴퓨터, 컨슈머 일렉트로닉스 기기(CE 기기), 휴대형 정보 단말기 등에 의해 구성된다. 콘텐츠 시청 클라이언트(11)는, 클라이언트 기억부(23)에 기억되어 있는 콘텐츠를 유저에게 제시하거나, 콘텐츠 배신 서버(13)로부터 배신되는 콘텐츠를 수신하여, 유저에게 제 시하거나 한다.
또한, 본 명세서에서, 콘텐츠는, 일반적으로 콘텐츠라고 칭해지고 있는, 예를 들면, 텔레비전 프로그램, 영화, 사진, 악곡 등(동화상, 정지 화상, 혹은 음성, 또는 그들의 조합 등) 외, 각종 정보, 문서, 상품(물품 포함), 회화 등의 유저가 사용 가능한 소프트웨어 또는 하드웨어의 전부를 가리키는 넓은 개념이다. 단, 콘텐츠가 물품(하드웨어)의 경우, 예를 들면, 그 물품이 동화상이나 정지 화상 등에 사영되어 데이터화된 것이, 콘텐츠 데이터로서 사용된다.
또한, 정보 처리 시스템(1)에 의해 취급되는 각 콘텐츠에는, 도 3을 참조하여 그 예를 나타내도록, 각 콘텐츠의 특징을 나타내는 메타데이터가 각각 관련지어져 있다.
콘텐츠 시청 클라이언트(11)는, 기능적 구성의 관점에 서면, 유저 입력부(21), 클라이언트 연산부(22), 클라이언트 기억부(23), 및 클라이언트 출력부(24)를 포함하도록 구성된다.
유저 입력부(21)는, 콘텐츠 시청 클라이언트(11)에 대한 조작을 유저가 행하기 위한 입력 기기로서, 예를 들면, 키보드, 마우스, 리모콘, 터치 패널, 마이크 등으로 구성된다. 유저 입력부(21)를 이용하여 유저가 입력한 조작 내용, 정확하게는, 그 조작 내용을 나타내는 정보는, 클라이언트 연산부(22)에 공급된다.
클라이언트 연산부(22)는, 예를 들면, 여기에서는, CPU(Central Processing Unit)와 그것이 실행하는 프로그램, 즉 하드웨어와 소프트웨어와의 조합에 의해 구성된다. 물론, 클라이언트 연산부(22)는, 소프트웨어 또는 하드웨어 단체로 구성 할 수도 있다.
클라이언트 연산부(22)는, 클라이언트 출력부(24)를 제어하여, 클라이언트 기억부(23)에 기억되어 있는 콘텐츠를 유저에게 제시한다. 또한, 클라이언트 연산부(22)는, 유저에 의해 지정된 시점에 기초하여, 클라이언트 기억부(23)에 기억되어 있는 콘텐츠의 일부 또는 전부를 복수의 클래스로 분류한다. 클라이언트 연산부(22)는, 도 7을 참조하여 후술하는 바와 같이, 필요에 따라, 컨텍스트 검출 단말기(12)로부터 공급되는 컨텍스트 정보, 또는 유저 입력부(21)로부터 공급되는 유저의 조작 내용을 나타내는 정보를 이용하여, 분류한 클래스의 특징을 나타내는 메타데이터의 조합을 추출한다. 클라이언트 연산부(22)는, 클라이언트 출력부(24)를 제어하여, 추출한 메타데이터의 조합을 그 클래스의 특징으로서 유저에게 제시한다.
또한, 클라이언트 연산부(22)는, 도 10을 참조하여 후술하는 바와 같이, 추출한 메타데이터의 조합에 기초하여, 클라이언트 기억부(23)에 기억되어 있는 콘텐츠 중에서, 유저에게 추천하는 콘텐츠를 추출한다. 클라이언트 연산부(22)는, 클라이언트 출력부(24)를 제어하여, 추출한 콘텐츠에 관한 정보를 유저에게 제시한다.
또한, 클라이언트 연산부(22)는, 추출한 메타데이터의 조합의 일부 또는 전부를 포함하고, 그 메타데이터의 조합에 기초하여 유저에게 추천하는 콘텐츠를 추출하도록 요구하는 정보(이하, 추천 콘텐츠 추출 요구 정보라고 칭함)를 클라이언트 기억부(23)에 기억시킨다. 클라이언트 연산부(22)는, 그에 대한 추출 결과를 나타내는 정보를 클라이언트 기억부(23)로부터 취득한다. 클라이언트 연산부(22)는, 추출 결과에 기초하여, 클라이언트 출력부(24)를 제어하여, 추출된 콘텐츠에 관한 정보를 유저에게 제시한다.
또한, 클라이언트 연산부(22)는, 유저에 의해 분류된 클래스에 관한 정보 및 그 클래스가 속하는 콘텐츠에 관한 메타데이터를 포함하고, 그 클래스의 특징을 나타내는 메타데이터의 조합의 추출을 요구하는 정보(이하, 조합 추출 요구 정보라고 칭함)를 클라이언트 기억부(23)에 기억시킨다. 클라이언트 연산부(22)는, 조합 추출 요구 정보에 대한 추출 결과를 나타내는 정보를 클라이언트 기억부(23)로부터 취득한다. 클라이언트 연산부(22)는, 추출 결과에 기초하여, 클라이언트 출력부(24)를 제어하여, 추출된 메타데이터의 조합을 유저에게 제시한다.
또한, 클라이언트 연산부(22)는, 콘텐츠의 배신(송신)을 요구하는 정보를 클라이언트 기억부(23)에 기억시킨다.
클라이언트 기억부(23)는, 예를 들면, 하드디스크나 RAM(Random Access Memory) 등의 기록 매체 또는 기억 매체를 포함하도록 구성된다. 클라이언트 기억부(23)는, 클라이언트 연산부(22)가 이용하는 컨텍스트 정보, 및 유저의 조작 명령을 나타내는 정보를 적절히 기억한다. 또한, 클라이언트 기억부(23)는, 컨텍스트 정보, 유저의 조작 내용을 나타내는 정보, 추천 콘텐츠 추출 요구 정보, 또는 조합 추출 요구 정보를, 필요에 따라, 콘텐츠 추천 서버(14)의 서버 기억부(51)에 송신한다. 또한, 클라이언트 기억부(23)는, 콘텐츠의 배신을 요구하는 정보를 콘텐츠 배신 서버(13)의 콘텐츠 배신부(41)에 송신한다.
또한, 클라이언트 기억부(23)는, 서버 기억부(51)로부터 송신되어 오는, 콘텐츠에 관한 메타데이터, 유저에게 추천하는 콘텐츠의 추출 결과를 나타내는 정보, 및 메타데이터의 조합의 추출 결과를 나타내는 정보를 기억한다. 또한, 클라이언트 기억부(23)는, 콘텐츠 배신부(41)로부터 송신되어 오는 콘텐츠를 기억한다. 또한, 클라이언트 기억부(23)는, 콘텐츠, 또는 콘텐츠에 관한 메타데이터를 수신한 것을 통지하는 정보를 클라이언트 연산부(22)에 공급한다. 또한, 클라이언트 기억부(23)는, 기억하고 있는 콘텐츠, 또는 콘텐츠의 메타데이터를 클라이언트 출력부(24)에 공급한다.
클라이언트 출력부(24)는, 예를 들면, 모니터 또는 프린터 등의 화상 출력 기기, 스피커 등의 음성 출력 기기 등에 의해 구성된다. 클라이언트 출력부(24)는, 클라이언트 기억부(23)에 기억되어 있는 콘텐츠를, 화상, 텍스트 정보, 혹은, 음성, 또는 화상 혹은 텍스트 정보를 인쇄한 매체 등의 형식에 의해 유저에게 제시한다. 또한, 클라이언트 출력부(24)는, 클라이언트 연산부(22)의 제어에 기초하여, 클라이언트 기억부(23)에 기억되어 있는 콘텐츠를 분류한 클래스의 특징을 나타내는 메타데이터의 조합, 또는 유저에게 추천하는 콘텐츠에 관한 정보를 유저에게 제시한다.
컨텍스트 검출 단말기(12)는, 기능적 구성의 관점에 서면, 컨텍스트 검출부(31), 및 컨텍스트 기억부(32)를 포함하도록 구성된다.
컨텍스트 검출부(31)는, 예를 들면, 유저의 상태나 감정, 유저가 놓여 있는 상황(예를 들면, 장소나 시간 등) 등에 관한 컨텍스트 정보를 검출한다. 구체적으 로는, 콘텐츠 검출부(31)는, 유저의 현재 위치 정보를 검출하는 GPS(Global Positioning System) 레시버, 현재 시각을 계시(검출)하는 전파 시계, 유저의 주변에 위치하는 사람이나 물체를 검출하는 무선 통신 기기, 유저의 맥박, 호흡수, 발한, 혹은, 동공의 열림 등을 검출하는 각종 생체 정보 센서, 카메라, 또는 각종 화상을 인식하는 화상 인식 장치 등에 의해 구성된다. 컨텍스트 검출부(31)는, 상술한 컨텍스트 정보를 리얼타임으로 검출하고, 검출한 컨텍스트 정보를 컨텍스트 기억부(32)에 기억시킨다. 또한, 컨텍스트 검출 단말기(12)는, 콘텐츠 시청 클라이언트(11)의 클라이언트 연산부(22)에, 검출한 컨텍스트 정보를 공급한다.
컨텍스트 기억부(32)는, 예를 들면, 하드디스크나 RAM 등의 기록 매체 또는 기억 매체를 포함하도록 구성되고, 컨텍스트 검출부(31)로부터 공급되는 시계열을 따른 컨텍스트 정보를 저장한다.
콘텐츠 배신 서버(13)는, 예를 들면, 콘텐츠를 배신하기 위한 방송 기기, 또는 서버 컴퓨터 등에 의해 구성된다. 콘텐츠 배신 서버(13)는, 기능적 구성의 관점에 서면, 콘텐츠 배신부(41), 및 콘텐츠 메타데이터 기억부(42)를 포함하도록 구성된다.
콘텐츠 배신부(41)는, 예를 들면, 여기에서는, CPU와 그것이 실행하는 프로그램, 즉, 하드웨어와 소프트웨어와의 조합에 의해 구성된다. 물론, 콘텐츠 배신부(41)는, 소프트웨어 또는 하드웨어 단체로 구성할 수도 있다. 구체적으로는, 예를 들면, 콘텐츠 배신부(41)는, 텔레비전 방송 시스템의 배신 서버, 또는 인터넷 상의 스트리밍 콘텐츠 서버 등에 의해 구성된다. 콘텐츠 배신부(41)는, 콘텐츠 시 청 클라이언트(11)의 클라이언트 기억부(23)에 콘텐츠를 배신(송신)한다.
콘텐츠 메타데이터 기억부(42)는, 예를 들면, 하드디스크나 RAM 등의 기록 매체 또는 기억 매체를 포함하도록 구성되고, 콘텐츠 배신 서버(13)가 배신 가능한 콘텐츠, 및 콘텐츠에 관한 데이터인 메타데이터를 기억한다. 또한, 콘텐츠 메타데이터 기억부(42)에 기억되어 있는 콘텐츠 또는 메타데이터는, 콘텐츠 배신원의 운용 룰 등에 따라서 적절히 갱신된다.
콘텐츠 추천 서버(14)는, 예를 들면, 서버 컴퓨터에 의해 구성된다. 콘텐츠 추천 서버(14)는, 기능적 구성의 관점에 서면, 서버 기억부(51), 및 서버 연산부(52)를 포함하도록 구성된다.
서버 기억부(51)는, 예를 들면, 하드디스크나, RAM 등의 기록 매체 또는 기억 매체를 포함하도록 구성된다. 서버 기억부(51)는, 콘텐츠 배신 서버(13)의 콘텐츠 메타데이터 기억부(42)에 기억되어 있는 각 콘텐츠의 메타데이터를, 적절히 취득해서 기억함과 함께, 필요에 따라, 콘텐츠 시청 클라이언트(11)의 클라이언트 기억부(23)에 송신한다. 또한, 서버 기억부(51)는, 클라이언트 기억부(23)로부터 송신되어 오는, 컨텍스트 정보, 유저의 조작 내용을 나타내는 정보, 추천 콘텐츠 추출 요구 정보, 또는 조합 추출 요구 정보를 기억한다. 또한, 서버 기억부(51)는, 서버 연산부(52)로부터 공급되는, 유저에게 추천하는 콘텐츠의 추출 결과를 나타내는 정보, 또는 메타데이터의 조합의 추출 결과를 나타내는 정보를 기억함과 함께, 클라이언트 기억부(23), 또는 콘텐츠 메타데이터 기억부(42)에 송신한다.
서버 연산부(52)는, 예를 들면, 여기에서는, CPU와 그것이 실행하는 프로그 램, 즉, 하드웨어와 소프트웨어와의 조합에 의해 구성된다. 물론, 서버 연산부(52)는, 소프트웨어 또는 하드웨어 단체로 구성할 수도 있다.
서버 연산부(52)는, 서버 기억부(51)에 기억되어 있는, 유저의 조작 내용을 나타내는 정보, 컨텍스트 정보, 또는 추천 콘텐츠 추출 요구 정보에 기초하여, 서버 기억부(51)에 메타데이터가 기억되어 있는 콘텐츠 중에서, 유저에게 추천하는 콘텐츠를 추출한다. 서버 연산부(52)는, 유저에게 추천하는 콘텐츠의 추출 결과를 나타내는 정보를 서버 기억부(51)에 기억시킨다.
또한, 서버 연산부(52)는, 서버 기억부(51)에 기억되어 있는, 유저의 조작 내용을 나타내는 정보, 컨텍스트 정보, 또는 조합 추출 요구 정보에 기초하여, 그 클래스의 특징을 나타내는 메타데이터의 조합을 추출한다. 서버 연산부(52)는, 메타데이터의 조합의 추출 결과를 나타내는 정보를 서버 기억부(51)에 기억시킨다.
그런데, 도 1은, 기능적 구성예를 나타내고 있기 때문에, 각 장치 간의 접속 형태, 즉, 콘텐츠 시청 클라이언트(11) 내지 콘텐츠 추천 서버(14)의 각각의 사이의 접속의 형태는 특히 도시되어 있지 않지만, 그 접속의 형태는 특별히 한정되지 않는다. 즉, 접속의 형태는, 유선이어도 되고 무선이어도 되고, 그 조합이어도 된다. 또한, 접속의 형태는, 네트워크를 개재하는 형태이어도 되고, 장치 간에서 직접 통신을 행하는 형태이어도 되고, 그 조합이어도 된다. 또한, 네트워크를 개재하는 형태의 경우에도, 네트워크의 형태는 한정되지 않고, 예를 들면, 인터넷이나 인트라네트 등에서도 된다. 이 경우에도, 네트워크는 단일인 네트워크에 한정되지 않고, 복수의 네트워크가 존재하여도 된다. 따라서, 도 1에는 도시되어 있지 않지 만, 실제로는, 콘텐츠 시청 클라이언트(11) 내지 콘텐츠 추천 서버(14)의 각각에는, 대응하는 접속 형태에 따른 통신부가 더 마련되게 된다.
또한, 컨텍스트 검출 단말기(12), 콘텐츠 배신 서버(13), 및 콘텐츠 추천 서버(14)는, 정보 처리 시스템(1)에서 필수적인 구성 요소는 아니다. 즉, 도 4 내지 도 10을 참조하여 후술하는 바와 같이, 정보 처리 시스템(1)에 의해 행해지는 키워드 추출 처리 및 콘텐츠 추천 처리는, 콘텐츠 시청 클라이언트(11)만으로 실현하는 것이 가능하다.
도 2는, 클라이언트 연산부(22)의 기능의 구성의 예를 도시하는 블록도이다. 클라이언트 연산부(22)는, 콘텐츠 분류부(81), 메타데이터 추출부(82), 조합 추출부(83), 키워드 제시부(84), 추천 콘텐츠 추출부(85), 및 추천 콘텐츠 제시부(86)를 포함하도록 구성된다.
콘텐츠 분류부(81)는, 유저 입력부(21)를 통해서 유저가 입력한 콘텐츠를 분류하는 시점을 나타내는 정보를 유저 입력부(21)로부터 취득한다. 콘텐츠 분류부(81)는, 도 4를 참조하여 후술하는 바와 같이, 지정된 시점에 기초하여, 콘텐츠 기억부(23)에 기억되어 있는 콘텐츠의 일부 또는 전부에 의해 구성되는 그룹을 복수의 클래스로 분류한다. 콘텐츠 분류부(81)는, 분류한 클래스에 관한 정보를 메타데이터 추출부(82)에 공급한다. 또한, 콘텐츠 분류부(81)는, 필요에 따라, 조합 추출 요구 정보를, 클라이언트 기억부(23) 및 서버 기억부(51)를 통하여, 서버 연산부(52)에 송신한다.
메타데이터 추출부(82)는, 도 4를 참조하여 후술하는 바와 같이, 대상으로 되는 클래스에 속하는 콘텐츠와 메타데이터와의 관련도, 및 다른 클래스에 속하는 콘텐츠와 메타데이터와의 관련도와 대상으로 되는 클래스에 속하는 콘텐츠와 메타데이터와의 관련도와의 차이에 기초하여, 대상으로 되는 클래스에 속하는 콘텐츠의 특징을 보다 명확하게 나타내고 있는 메타데이터를 추출한다. 메타데이터 추출부(82)는, 추출한 메타데이터를 나타내는 정보를 조합 추출부(83)에 공급한다.
조합 추출부(83)는, 도 7을 참조하여 후술하는 바와 같이, 특징을 추출하는 대상으로 되는 클래스에 속하는 각각의 콘텐츠에 대하여 콘텐츠에 관련지어져 있는 1개 이상의 메타데이터를 취출함으로써 구해지는 메타데이터의 모든 조합 중, 다른 클래스에 속하는 각각의 콘텐츠에 대하여, 콘텐츠에 관련지어져 있는 1개 이상의 메타데이터를 취출함으로써 구해지는 메타데이터의 조합에는 존재하지 않는 메타데이터의 조합으로서, 메타데이터 추출부(82)에 의해 추출된 메타데이터의 조합을 추출한다. 조합 추출부(83)는, 추출한 메타데이터의 조합을 나타내는 정보를, 키워드 제시부(84) 또는 추천 콘텐츠 추출부(85)에 공급한다.
또한, 조합 추출부(83)는, 콘텐츠 분류부(81)로부터 송신된 조합 추출 요구 정보에 대한 추출 결과를 나타내는 정보를, 서버 기억부(51) 및 클라이언트 기억부(23)를 통하여, 서버 연산부(52)로부터 수신한다. 조합 추출부(83)는, 추출된 메타데이터의 조합을 나타내는 정보를, 키워드 제시부(84) 또는 추천 콘텐츠 추출부(85)에 공급한다.
키워드 제시부(84)는, 도 4를 참조하여 후술하는 바와 같이, 추출된 메타데이터의 조합 중 1개 이상을, 메타데이터의 조합을 추출한 클래스의 특징으로서 유 저에게 제시하도록, 클라이언트 출력부(24)를 제어한다. 또한, 키워드 제시부(84)는, 유저 입력부(21)를 통하여 유저가 입력한 키워드의 결정 또는 변경을 명령하는 정보를 유저 입력부(21)로부터 취득한다.
추천 콘텐츠 추출부(85)는, 도 10을 참조하여 후술하는 바와 같이, 조합 추출부(83)에 의해 추출된 메타데이터의 조합에 기초하여, 메타데이터의 조합이 추출된 클래스에 속하는 콘텐츠와 관련이 있는 콘텐츠를, 유저에게 추천하는 콘텐츠로서 클라이언트 기억부(23)에 기억되어 있는 콘텐츠 중에서 추출한다. 추천 콘텐츠 추출부(85)는, 추출한 콘텐츠에 관한 정보를 추천 콘텐츠 제시부(86)에 공급한다.
또한, 추천 콘텐츠 추출부(85)는, 조합 추출부(83)에 의해 추출된 메타데이터의 조합에 기초하여, 유저에게 추천하는 콘텐츠를 추출하도록 요구하는 추천 콘텐츠 추출 요구 정보를, 클라이언트 기억부(23) 및 서버 기억부(51)를 통하여, 서버 연산부(52)에 송신한다. 추천 콘텐츠 추출부(85)는, 추천 콘텐츠 추출 요구 정보에 대응하는 추출 결과를 나타내는 정보를, 서버 기억부(51) 및 클라이언트 기억부(23)를 통하여, 서버 연산부(52)로부터 수신한다. 추천 콘텐츠 추출부(85)는, 추출된 콘텐츠에 관한 정보를 추천 콘텐츠 제시부(86)에 공급한다. 또한, 추천 콘텐츠 추출부(85)는, 콘텐츠, 또는 콘텐츠에 관한 메타데이터를 수신한 것을 통지하는 정보를 클라이언트 기억부(23)로부터 취득한다.
추천 콘텐츠 제시부(86)는, 추천 콘텐츠 추출부(85)에 의해 추출된 콘텐츠를 추천하는 콘텐츠로서 유저에게 제시함과 함께, 콘텐츠를 추천한 근거(이유)로서, 추천하는 콘텐츠의 추출에 이용한 메타데이터의 조합을 제시하도록, 클라이언트 출 력부(24)를 제어한다. 추천 콘텐츠 제시부(86)는, 유저 입력부(21)를 통하여 유저가 입력한 추천한 콘텐츠의 결정을 명령하는 정보를 유저 입력부(21)로부터 취득한다. 추천 콘텐츠 제시부(86)는, 유저에 의해 결정된 콘텐츠를 통지하는 정보를 클라이언트 기억부(23)에 공급한다.
다음으로, 도 3을 참조하여, 정보 처리 시스템(1)에서 취급되는 콘텐츠 및 콘텐츠에 관련지어져 있는 메타데이터의 예를 설명한다. 도 3은, 콘텐츠가 음악 데이터인 경우에서의 콘텐츠, 및 그 메타데이터의 예를 나타내고 있다. 또한, 도 3에는, 이후의 설명을 간단히 하기 위해서, 음악 데이터(악곡)를 연주하는 아티스트마다 메타데이터가 관련지어져 있는 예를 나타내고 있다. 즉, 동일 아티스트의 음악 데이터에는, 전부 동일한 메타데이터가 관련지어진다. 물론, 악곡 단위에서 메타데이터를 관련짓도록 하여도 된다.
또한, 이하, 콘텐츠 A에 메타데이터 B가 관련지어져 있는 경우, 콘텐츠 A가 메타데이터 B를 갖거나, 또는 콘텐츠 A에 메타데이터 B가 설정되어 있다고 하는 표현을 적절히 이용한다.
도 3의 예에서는, 각 콘텐츠(아티스트)에는, 색채, 여흥, 귀엽다, 붐, 겨울, 센티멘탈 등, 그 아티스트가 연주하는 악곡의 음악성을 나타내는 키워드가 메타데이터로서 관련지어져 있다. 또한, 이 키워드는, 예를 들면, 음악 평론가 등에 의해 전문가의 시점에서 설정되거나, 아티스트에 관한 평론문이나 소개 기사, 또는 악곡의 가사 등을 텍스트 해석함으로써 추출된다. 또한, 음악성을 나타내는 키워드 이외에, 음악 장르, 아티스트의 연대 및 출신지, 음악 데이터로부터 추출되는 특징량, 히트 차트 정보 등의 특징을 나타내는 데이터를 메타데이터에 이용하도록 하여도 된다.
또한, 각 콘텐츠에서의 메타데이터(키워드)의 유무는, 0 또는 1의 2값에 의해 나타나 있다. 0이 설정되어 있는 메타데이터는, 그 아티스트가 갖고 있지 않은 메타데이터, 즉, 그 아티스트의 특징을 나타내고 있지 않은 키워드이다. 1이 설정되어 있는 메타데이터는, 그 아티스트가 갖고 있는 메타데이터, 즉 그 아티스트의 특징을 나타내고 있는 키워드이다. 또한, 원래의 값이 0 또는 1 이외의 2값 이외의 값을 취하는 경우, 소정의 임계값을 기준으로 하여, 0 또는 1의 2값에 메타데이터가 변환되어 이용된다. 예를 들면, 아티스트의 데뷔일이 메타데이터에 설정되어 있는 경우, 소정의 일자를 기준으로 하여, 데뷔일이 그 일자보다 전인 경우, 메타데이터가 0으로 변환되고, 데뷔일이 그 일자 이후인 경우, 메타데이터가 1로 변환된다.
다음으로, 도 4 내지 도 10을 참조하여, 정보 처리 시스템(1)에 의해 실행되는 처리를 설명한다.
우선, 도 4의 플로우차트를 참조하여, 정보 처리 시스템(1)에 의해 실행되는 키워드 추출 처리를 설명한다. 또한, 이 처리는, 예를 들면, 유저 입력부(21)를 통하여, 유저가 키워드 추출 처리의 개시의 명령을 입력한 경우, 개시된다.
스텝 S1에서, 콘텐츠 분류부(81)는, 콘텐츠를 분류한다. 구체적으로는, 유저는, 유저 입력부(21)를 통하여, 콘텐츠를 분류하기 위한 시점을 나타내는 정보를 입력한다. 유저 입력부(21)는, 입력된 정보를 콘텐츠 분류부(81)에 공급한다.
도 5는, 콘텐츠를 분류하기 위한 시점의 예를 도시하는 도면이다. 또한, 도 5에 도시된 표에는, 도 3에 도시된 표와 비교하여, 분류의 시점의 항목이 추가되어 있다.
도 5에는, 콘텐츠를 분류하기 위한 시점으로서, 유저의 좋고 싫음, 및 플레이 리스트에 선택되어 있는 악곡인지 아닌지의 2개의 예가 나타나 있다. 또한, 플레이 리스트는, 유저가 임의로 선곡한 악곡에 의해 구성되는 그룹으로서, 예를 들면, 유저는, 플레이 리스트 단위로 악곡의 재생을 지시하고, 플레이 리스트에 등록되어 있는 악곡을 순서대로 재생시킬 수 있다.
유저의 좋고 싫음의 시점에 기초하여 콘텐츠(아티스트)를 분류하는 경우, 각 콘텐츠는, 「좋다」 「싫다」 「어느쪽도 아니다」의 3개의 클래스로 분류된다. 이 좋고 싫음의 평가는, 유저가 명시적으로 설정하도록 하여도 되고, 예를 들면, 유저가 인터넷에 접속되어 있는 서버 등으로부터 다운로드한 악곡을 연주하는 아티스트의 평가를 「좋다」로 설정하고, 유저가 삭제한 악곡을 연주하는 아티스트의 평가를 「싫다」로 설정하는 등, 유저의 조작 이력 등에 기초하여, 콘텐츠 시청 클라이언트(11)에 학습시키도록 하여도 된다.
플레이 리스트 선택곡의 시점에 기초하여 콘텐츠를 분류하는 경우, 각 콘텐츠는, 플레이 리스트에 선택되어 있다(선택), 플레이 리스트에 선택되어 있지 않다(비선택), 의 2개의 클래스로 분류된다.
콘텐츠 분류부(81)는, 유저에 의해 지정된 시점에 기초하여, 콘텐츠를 복수의 클래스로 분류한다. 콘텐츠 분류부(81)는, 분류한 콘텐츠의 클래스에 관한 정 보를 메타데이터 추출부(82)에 공급한다.
또한, 이하의 설명에서는, 플레이 리스트 선택곡의 시점에 기초하여 콘텐츠가 분류되고, 플레이 리스트에 선택되어 있는 콘텐츠의 메타데이터(키워드)를 추출하는 경우의 예에 대하여 설명한다. 또한, 이하, 도 5에 도시된 바와 같이, 플레이 리스트 선택곡의 클래스에 속하는 요소(콘텐츠)를 아티스트 1 내지 11로 하고, 플레이 리스트 비선택곡의 클래스에 속하는 요소(콘텐츠)를 아티스트 12 내지 24로 한다. 또한, 이하, 키워드를 추출하는 대상으로 되는 클래스를 추출 대상 클래스라고 하고, 그 이외의 클래스를 비교 대상 클래스라고 한다.
스텝 S2에서, 메타데이터 추출부(82)는, 메타데이터의 가중치 부여를 행하고, 메타데이터를 추출한다. 구체적으로는, 메타데이터 추출부(82)는, 각 콘텐츠가 갖는 메타데이터의 빈도 분포를 통계적 척도로 측정함으로써 메타데이터의 가중치 부여를 행한다. 이하에, 메타데이터의 가중치 부여를 행하기 위한 통계적 척도의 예에 대하여 설명한다.
우선, tfidf(term frequency with inverse document frequency)를 이용하는 방법에 대하여 설명한다.
tfidf를 이용하는 경우, 임의의 클래스 Ci에 속하는 콘텐츠 중, 메타데이터 Wj를 갖는 콘텐츠의 출현 빈도를 fij, 클래스의 총수를 n, 메타데이터 Wj를 갖는 콘텐츠가 속하는 클래스의 수를 nj라고 했을 때, 이하의 식 (1)에 의해 산출되는 tfidf(Ci, Wj)가, 클래스 Ci에서의 메타데이터 Wj의 가중치로 설정된다.
Figure 112007023229098-PCT00001
…(1)
또한, 식 (1)에서는, log의 밑을 e(자연대수)라고 했지만, tfidf의 값 그 자체는 그다지 중요하지 않기 때문에, 밑을 2 또는 10으로 하여도 된다.
예를 들면, 이하의 조건 (1) 내지 (3)이 성립하고 있는 경우, tfidf(Ci, Wj)는 아래와 같이 계산된다.
(1) 콘텐츠(아티스트)를 분류한 클래스수 n=9로 하고, 각각의 클래스를 C1 내지 C9로 한다.
(2) 메타데이터 W1(예를 들면, [센티멘탈])을 갖는 콘텐츠가 속하는 클래스의 수 n1=8로 한다.
(3) 클래스 C1이 속하는 콘텐츠 중, 메타데이터 W1 갖는 콘텐츠의 출현 빈도(클래스 C1에서의 메타데이터 W1을 갖는 아티스트수)f11=5로 한다.
이 경우, 클래스 C1에서의 메타데이터 W1의 가중치인 tfidf(C1, W1)은, 이하의 식 (2)와 같이 산출된다.
Figure 112007023229098-PCT00002
…(2)
즉, tfidf(C1, W1)은, 메타데이터 Wj의 빈도에 의한 국소적 가중치 fij에 대역적 가중치 {1+log(n/nj)}를 곱한 것이다. 또한, tfidf에는, 예를 들면, 이하와 같은 특징 또는 메리트가 있다.
·국소적 분포와 대역적 분포의 밸런스를 고려하여, 메타데이터의 중요성을 측정할 수 있다.
·가중치 부여의 계산식에 다양한 베리에이션이 있으며, 용도에 따라 구분하여 사용할 수 있다.
·문서 분류에서의 특징어의 가중치 부여에서 널리 이용되고 있다.
또한, fij를, 클래스 Ci에 속하는 콘텐츠에서의 메타데이터 Wj를 갖는 콘텐츠의 비율로 하거나, n/nj를 (콘텐츠의 총수/메타데이터 Wj를 갖는 콘텐츠 수)로 하도록 하여도 된다.
다음으로, 상호 정보량을 이용하는 방법에 대하여 설명한다.
상호 정보량을 이용하는 경우, 이하의 식 (3)에 의해 산출되는, 임의의 클래스 Ci 내에서의 메타데이터 Wj의 상호 정보량 MI(Ci, Wj)가, 클래스 Ci에서의 메타데이터 Wj의 가중치로 설정된다.
Figure 112007023229098-PCT00003
…(3)
또한, P()는, 괄호 내의 사상이 발생하는 확률을 나타낸다.
예를 들면, 이하의 조건 (1) 내지 (5)가 성립하고 있는 경우, MI(Ci, Wj)는 아래와 같이 계산된다.
(1) 콘텐츠(아티스트)를 분류한 클래스수 n=9로 하고, 각각의 클래스를 C1 내지 C9로 한다.
(2) 콘텐츠의 총수 numA=80으로 한다.
(3) 메타데이터 W1(예를 들면, [센티멘탈])을 갖는 콘텐츠의 총수 aFreqW=16으로 한다.
(4) 클래스 C1에 속하는 콘텐츠 중, 메타데이터 W1을 갖는 콘텐츠의 수 aFreqWC=3으로 한다.
(5)클래스 C1에 속하는 콘텐츠의 수 aFreqC=11로 한다.
이 경우, 식 (3)에 나오는 각 확률값은, 이하의 식 (4) 내지 식 (9)와 같이 된다.
Figure 112007023229098-PCT00004
…(4)
Figure 112007023229098-PCT00005
…(5)
Figure 112007023229098-PCT00006
…(6)
Figure 112007023229098-PCT00007
…(7)
Figure 112007023229098-PCT00008
…(8)
Figure 112007023229098-PCT00009
…(9)
따라서, 클래스 C1에서의 메타데이터 W1의 가중치인 MI(C1, W1)의 값은, 이하의 식 (10)에 나타낸 바와 같이, 식 (4) 내지 식 (9)에 의해 산출된 값을 식 (3)에 대입함으로써 구해진다.
Figure 112007023229098-PCT00010
…(10)
즉, 상호 정보량은, 클래스 Ci에의 귀속을 아는 것에 의한 메타데이터 Wj의 엔트로피의 감소량에 의해 계산된다. 또한, 상호 정보량에는, 예를 들면, 이하와 같은 특징 또는 메리트가 있다.
·사상의 불확실함을 나타내는 정보 이론의 엔트로피가 이용되고 있으며, 클래스 간의 차이가 강조되기 쉽다.
·가중치가 높은 어로 문서의 요약을 작성하고, 문서 간의 차이를 아는 용도에 강하다.
또한, 구체적인 계산예의 설명은 생략하지만, 이 외에도, 정보 이득비, χ2승값, 대수 우도비 등을, 메타데이터의 가중치 부여를 행하는 통계적 척도로서 이용하는 것도 가능하다.
정보 이득비를 이용하는 경우, 이하의 식 (11) 내지 식 (14)에 의해 산출되는, 임의의 클래스 Ci에서의 메타데이터 Wj의 정보 이득비 IGR(Ci, Wj)가, 클래스 Ci에서의 메타데이터 Wj의 가중치로 설정된다.
Figure 112007023229098-PCT00011
…(11)
Figure 112007023229098-PCT00012
…(12)
Figure 112007023229098-PCT00013
…(13)
Figure 112007023229098-PCT00014
…(14)
즉, 정보 이득비는, 클래스를 분할하기 전과 후의 메타데이터 Wj의 엔트로피의 감소량과, 클래스 분할에 관한 엔트로피와의 비율이다. 또한, 정보 이득비에는, 예를 들면, 이하와 같은 특징 또는 메리트가 있다.
·개개의 클래스에 대한 가중치가 아니라, 분류 전체(예를 들면, 좋고 싫음의 분류 그 자체)에 대하여 치우쳐서 분포되어 있는 메타데이터에 의해 큰 가중치가 부여된다.
·계층 구조로 되어 있는 데이터에 대하여, 예를 들면, 임의의 디렉토리 이하에서 특징적인 어를 아는 용도에 유용하다.
χ2승값을 이용하는 경우, 이하의 식 (15)에 의해 산출되는, 임의의 클래스 Ci에서의 메타데이터 Wj의 χ2승값인 χ2(Ci, Wj)가, 클래스 Ci에서의 메타데이터 Wj의 가중치로 설정된다.
Figure 112007023229098-PCT00015
…(15)
즉, χ2승값은, 클래스 Ci에 속하는 콘텐츠 중, 메타데이터 Wj를 갖는 콘텐츠의 수의 실수와 기대치와의 차에 기초하고 있으며, 클래스 Ci에 대한 메타데이터 Wj의 의존성을 나타내고 있다. 또한, χ2승값에는, 예를 들면, 이하와 같은 특징 또는 메리트가 있다.
·통계적 기대치로부터 메타데이터의 공기 관계에 기초하여 가중치 부여된다.
·인터넷 상에 존재하는 컴퓨터나 네트워크에 붙여지는 식별자인 도메인별 전문어의 추출 등에 널리 적용된다.
대수 우도비를 이용하는 경우, 이하의 식 (16)에 의해 산출되는, 임의의 클래스 Ci에서의 메타데이터 Wj의 대수 우도비인 LL(Ci, Wj)가, 클래스 Ci에서의 메타데이터 Wj의 가중치로 설정된다.
Figure 112007023229098-PCT00016
…(16)
즉, 대수 우도비는, 클래스 Ci에 속하는 콘텐츠가 메타데이터 Wj를 가질 확률의 실수와 기대치와의 비를 나타내고 있다. 또한, 대수 우도비에는, 예를 들면, 이하와 같은 특징 및 메리트가 있다.
·통계적 기대치로부터 메타데이터의 공기 관계에 기초하여 가중치 부여된다.
·인터넷 상에 존재하는 컴퓨터나 네트워크에 붙여지는 식별자인 도메인별 전문어의 추출 등에 널리 적용된다.
메타데이터 추출부(82)는, 이상의 방법 중 어느 하나의 방법을 이용하여, 각 클래스에서의 각 메타데이터의 가중치를 구한다. 즉, 임의의 클래스 A에서의 임의의 메타데이터 B의 가중치는, 클래스 A에 속하는 콘텐츠와 메타데이터 B와의 관련도(클래스 A에 속하는 콘텐츠와 메타데이터 B에 의해 나타내는 특징과의 관련의 깊이), 및 다른 클래스에 속하는 콘텐츠와 메타데이터 B와의 관련도와 클래스 A에 속하는 콘텐츠와 메타데이터 B와의 관련도의 차이에 기초하여 구해진다.
메타데이터 추출부(82)는, 예를 들면, 클래스마다, 설정된 가중치의 값이 상위인 소정의 수(예를 들면, 10)의 메타데이터, 또는 설정된 가중치가 소정의 임계 값 이상인 메타데이터를 추출한다. 즉, 클래스마다, 그 클래스에 속하는 콘텐츠의 특징을 보다 명확하게 나타내고 있는 메타데이터가 추출된다. 보다 상세하게 말하면, 클래스마다, 그 클래스에 속하는 콘텐츠와 관련이 깊은 특징을 나타냄과 함께, 다른 클래스에 속하는 콘텐츠와 비교하여 보다 관련이 깊은 특징을 나타내는 메타데이터가 추출된다.
메타데이터 추출부(82)는, 클래스마다 추출한 메타데이터를 나타내는 정보를 조합 추출부(83)에 공급한다. 또한, 이하, 클래스마다 추출된 메타데이터를 클래스별 중요 메타데이터라고 한다.
또한, 이하, 스텝 S2에서, 도 6에 도시된 바와 같이, 플레이 리스트 선택곡의 클래스, 즉, 추출 대상 클래스로부터는, [겨울][사랑][BGM][드라마][여름][파워풀][상쾌함][배우][기분좋음][여흥]의 10개의 메타데이터가 추출되고, 플레이 리스트 비선택곡의 클래스로부터는, [사랑][센티멘탈][여름][노스탤지어][타이업][기분좋음][드라마][댄스][장대함][온기]의 10개의 메타데이터가 추출된 것으로 하여 설명한다. 또한, 키워드의 추출을 행하지 않은 클래스에 대해서는, 메타데이터의 추출을 반드시 행할 필요는 없다.
스텝 S3에서, 조합 추출부(83)는, 메타데이터 조합 추출 처리를 행한다. 여기에서, 도 7의 플로우차트를 참조하여, 조합 추출부(83)에 의해 실행되는 메타데이터 조합 추출 처리의 상세 내용을 설명한다.
스텝 S21에서, 조합 추출부(83)는, 논리식 P를 초기화한다.
스텝 S22에서, 조합 추출부(83)는, 비교 대상 클래스의 콘텐츠와의 비교가 완료되어 있지 않은 추출 대상 클래스의 콘텐츠가 있는지의 여부를 판정한다. 비교 대상 클래스의 콘텐츠와의 비교가 완료되어 있지 않은 추출 대상 클래스의 콘텐츠가 있다고 판정된 경우, 처리는 스텝 S23으로 진행한다.
스텝 S23에서, 조합 추출부(83)는, 비교가 완료되어 있지 않은 추출 대상 클래스의 콘텐츠를 1개 선택한다. 또한, 이하, 스텝 S23에서 선택된 콘텐츠를 추출 대상 콘텐츠라고 칭한다.
스텝 S24에서, 조합 추출부(83)는, 논리식 Q를 초기화한다.
스텝 S25에서, 조합 추출부(83)는, 추출 대상 콘텐츠와의 비교가 완료되어 있지 않은 비교 대상 클래스의 콘텐츠가 있는지의 여부를 판정한다. 추출 대상 콘텐츠와의 비교가 완료되어 있지 않은 비교 대상 클래스의 콘텐츠가 있다고 판정된 경우, 처리는 스텝 S26으로 진행한다.
스텝 S26에서, 조합 추출부(83)는, 추출 대상 콘텐츠와의 비교가 완료되어 있지 않은 비교 대상 클래스의 콘텐츠를 1개 선택한다. 또한, 이하, 스텝 S26에서 선택된 콘텐츠를 비교 대상 콘텐츠라고 칭한다.
스텝 S27에서, 조합 추출부(83)는, 추출 대상 콘텐츠가 갖고 있어, 비교 대상 콘텐츠가 갖고 있지 않은 메타데이터를 추출한다. 구체적으로는, 조합 추출부(83)는, 추출 대상 클래스의 클래스별 중요 메타데이터 중, 추출 대상 콘텐츠가 갖고 있어, 비교 대상 콘텐츠가 갖고 있지 않은 메타데이터를 추출한다.
스텝 S28에서, 조합 추출부(83)는, 추출한 메타데이터를 or로 연결하여 논리식 R을 생성한다. 예를 들면, 추출 대상 클래스인 플레이 리스트 선택곡의 클래스 별 중요 메타데이터 중, 추출 대상 콘텐츠인 아티스트 1이 갖고 있고, 비교 대상 콘텐츠인 아티스트 12가 갖고 있지 않은 메타데이터로서, [겨울][사랑][파워풀][상쾌함] 및 [배우]가 추출된 경우, 논리식 R은, 이하의 식 (17)과 같이 된다.
Figure 112007023229098-PCT00017
…(17)
또한, 논리식 R에서 추출된 메타데이터를 or로 연결함으로써, 추출 대상 콘텐츠와 비교 대상 콘텐츠를 비교하는 경우, 논리식 R이 만족하는지의 여부에 의해, 추출 대상 콘텐츠와 비교 대상 콘텐츠를 구별할 수 있다.
스텝 S29에서, 조합 추출부(83)는, 논리식 R을 and로 연결하여 논리식 Q에 추가한다. 즉, 이하의 식 (18)에 나타내는 논리 연산이 행해진다.
Figure 112007023229098-PCT00018
…(18)
그 후, 처리는 스텝 S25로 되돌아가고, 스텝 S25에서, 추출 대상 콘텐츠와의 비교가 완료되어 있지 않은 비교 대상 클래스의 콘텐츠가 없다고 판정될 때까지, 스텝 S25 내지 S29의 처리가 반복 실행된다. 즉, 추출 대상 콘텐츠가 비교 대상 클래스(추출 대상 클래스 이외의 클래스)에 포함되는 모든 콘텐츠와 비교되고, 추출 대상 클래스의 클래스별 중요 메타데이터 중, 추출 대상 콘텐츠가 갖고 있고, 비교 대상 콘텐츠가 갖고 있지 않은 메타데이터가 추출되고, 논리식 Q에 추가된다. 예를 들면, 비교 대상 클래스에 속하는 콘텐츠가 m개 있으며, 추출 대상 콘텐츠와 비교 대상 클래스의 각 콘텐츠를 비교한 결과를 나타내는 논리식을 논리식 Ri(i=1, 2, …, m)라고 한 경우, 논리식 Q는, 이하의 식 (19)로 나타낸다.
Figure 112007023229098-PCT00019
…(19)
보다 구체적으로는, 예를 들면, 논리식 Q는, 이하의 식 (20)과 같이 된다.
Figure 112007023229098-PCT00020
…(20)
또한, 논리식 Q에서 각 논리식 Ri를 and로 연결함으로써, 추출 대상 콘텐츠와 비교 대상 클래스에 속하는 콘텐츠를 비교하는 경우, 논리식 Q가 만족하는지의 여부에 의해, 추출 대상 콘텐츠와 비교 대상 클래스에 속하는 모든 콘텐츠를 구별할 수 있다.
스텝 S25에서, 추출 대상 콘텐츠와의 비교가 완료되어 있지 않은 비교 대상 클래스의 콘텐츠가 없다고 판정된 경우, 즉, 추출 대상 콘텐츠와 비교 대상 클래스 의 모든 콘텐츠의 비교가 완료된 경우, 처리는 스텝 S30으로 진행한다.
스텝 S30에서, 조합 추출부(83)는, 논리식 Q를 간략화한다. 구체적으로는, 조합 추출부(83)는, 논리식 Q를 최대항의 곱으로 나타낸 표준 합곱형으로 변환한다. 예를 들면, 식 (20)의 최초의 항인 항 T1=([겨울]or[사랑]or[파워풀]or[상쾌함]or[배우])는, 이하의 식 (21)과 같이 변환된다.
Figure 112007023229098-PCT00021
…(21)
또한, ~은 부정을 나타내는 기호이다.
다음으로, 조합 추출부(83)는, 표준 합곱형으로 변환한 논리식 Q를, 표준 곱의 합 형으로 변환한다. 예를 들면, 항 T1은, 이하의 식 (22)와 같이 변환된다.
Figure 112007023229098-PCT00022
…(22)
또한, 조합 추출부(83)는, 표준 곱의 합 형으로 변환한 논리식 Q를 퀸·맥클러스키법 등을 이용하여 간략화한다. 예를 들면, 식 (20)의 논리식 Q는, 이하의 식 (23)과 같이 간략화된다.
Figure 112007023229098-PCT00023
…(23)
즉, 식 (23)의 논리식 Q에서 or로 연결되어 있는 각 항은, 추출 대상 클래스에 속하는 각각의 콘텐츠에 대하여 콘텐츠에 관련지어져 있는 1개 이상의 메타데이터를 취출함으로써 구해지는 메타데이터의 모든 조합 중, 비교 대상 클래스에 속하는 각각의 콘텐츠에 대하여 콘텐츠에 관련지어져 있는 1개 이상의 메타데이터를 취출함으로써 구해지는 메타데이터의 조합에는 존재하지 않는 메타데이터의 조합으로서, 추출 대상 클래스의 클래스별 중요 메타데이터의 조합을 나타내고 있다.
스텝 S31에서, 조합 추출부(83)는, 논리식 Q를 or로 연결하여 논리식 P에 추가한다. 즉, 이하의 식 (24)에 나타낸 논리 연산이 행해진다.
Figure 112007023229098-PCT00024
…(24)
그 후, 처리는 스텝 S22로 되돌아가고, 스텝 S22에서, 비교 대상 클래스의 콘텐츠와의 비교가 완료되어 있지 않은 추출 대상 클래스의 콘텐츠가 없다고 판정 될 때까지, 스텝 S22 내지 S31의 처리가 반복 실행된다. 즉, 추출 대상 클래스의 모든 콘텐츠가, 비교 대상 클래스의 모든 콘텐츠와 비교된다. 예를 들면, 추출 대상 클래스의 콘텐츠가 n개 있으며, 추출 대상 클래스의 각 콘텐츠의 비교 결과에 의해 구해진 논리식 Q를 Qi(i=1, 2, …, n)라고 한 경우, 논리식 P는, 이하의 식 (25)로 나타낸다.
Figure 112007023229098-PCT00025
…(25)
보다 구체적으로는, 예를 들면, 논리식 P는, 이하의 식 (26)과 같이 된다.
Figure 112007023229098-PCT00026
…(26)
또한, 논리식 P에서 각 논리식 Qi를 or로 연결함으로써, 논리식 P가 만족하는지의 여부에 의해, 추출 대상 클래스에 속하는 콘텐츠인지, 비교 대상 클래스에 속하는 콘텐츠인지를 구별할 수 있다.
스텝 S22에서, 비교 대상 클래스의 콘텐츠와의 비교가 완료되어 있지 않은 추출 대상 클래스의 콘텐츠가 없다고 판정된 경우, 즉, 추출 대상 클래스의 모든 콘텐츠에 대하여, 비교 대상 클래스의 콘텐츠와의 비교가 완료된 경우, 처리는 스텝 S32로 진행한다.
스텝 S32에서, 조합 추출부(83)는, 메타데이터의 조합을 추출한다. 구체적으로는, 조합 추출부(83)는, 논리식 P의 or로 연결되어 있는 각 항을, 추출 대상 클래스의 특징으로서 추출한다. 예를 들면, 논리식 P가 식 (26)에 나타내는 값인 경우, 이하에 기재하는 10조의 메타데이터의 조합이 추출된다.
·[BGM]
·[배우]
·[겨울]and[기분좋음]
·[사랑]and[기분좋음]
·[겨울]and[여흥]
·[사랑]and[여흥]
·[여름]and[여흥]
·[상쾌함]and[여흥]
·[드라마]and[상쾌함]and[기분좋음]
·[파워풀]and[상쾌함]and[기분좋음]
스텝 S33에서, 조합 추출부(83)는, 메타데이터의 조합을 클라이언트 기억부(23)에 기억시켜서, 메타데이터 조합 추출 처리는 종료한다. 구체적으로는, 조합 추출부(83)는, 추출한 메타데이터의 조합을 나타내는 데이터를 클라이언트 기억부(23)에 기억시킨다. 또한, 조합 추출부(83)는, 추출한 메타데이터의 조합을 나타내는 정보를 키워드 제시부(84) 및 추천 콘텐츠 추출부(85)에 공급한다.
도 4로 되돌아가고, 스텝 S4에서, 키워드 제시부(84)는, 키워드를 제시한다. 구체적으로는, 키워드 제시부(84)는, 스텝 S3에서 추출된 메타데이터의 조합 중 1개 이상을 선택한다. 예를 들면, 이하의 기준에 의해, 메타데이터의 조합이 선택 된다.
(1) 포함되는 메타데이터의 수가 가장 많은 조합(예를 들면, 스텝 S32에서 상술한 예의 경우, ([드라마]and[상쾌함]and[기분좋음])또는([파워풀]and[상쾌함]and[기분좋음]))
(2) 포함되는 메타데이터의 수가 가장 적은 조합(예를 들면, 스텝 S32에서 상술한 예의 경우, ([BGM]) 또는 ([배우]))
(3) 스텝 S2에서 설정된 메타데이터의 가중치의 합계치 또는 평균치가 가장 큰 조합
(4) 추출 대상 클래스에 속하는 가장 많은 콘텐츠가 갖는 조합
(5) 추출 대상 클래스에 속하는 특정의 콘텐츠가 갖는 조합
(6) 모든 조합
또한, 상술한 기준은, 예를 들면, 추출된 메타데이터의 조합을 사용하는 시스템 또는 어플리케이션 프로그램의 사양이나 목적 등에 따라 선택된다.
키워드 제시부(84)는, 클라이언트 출력부(24)를 제어하여, 선택한 메타데이터를 유저에게 제시한다. 예를 들면, 키워드 제시부(84)는, 선택한 메타데이터의 조합을 표시시키기 위한 화상 데이터를 생성한다. 키워드 제시부(84)는, 생성한 화상 데이터를 클라이언트 출력부(24)에 공급하고, 화상 데이터에 기초한 화상, 즉, 추출 대상 클래스인 플레이 리스트 선택곡 클래스의 특징을 나타내는 메타데이터(키워드)를 클라이언트 출력부(24)에 표시시킨다.
도 8은, 스텝 S4에서, 클라이언트 출력부(24)에 표시되는 화면의 예를 도시 하는 도면이다. 도 8의 예에서는, 상술한 도 5에 도시된 표와 함께, 팝업 윈도우(101)가 클라이언트 출력부(24)에 표시된다. 팝업 윈도우(101)에는, 플레이 리스트 선택곡에 대한(플레이 리스트 선택곡 클래스의 특징을 명확하게 나타냄) 키워드로서 추출된 메타데이터의 조합이 표시되어 있다. 또한, 팝업 윈도우(101)에는, 포함되는 메타데이터의 수가 많은 조합을 우선하여 메타데이터의 조합을 추출한 것을 통지하는 메시지가 표시되어 있다.
또한, 콘텐츠를 분류하는 시점으로서 플레이 리스트 선택곡이 선택되어 있는 것을 알 수 있도록, 예를 들면, 플레이 리스트 선택곡의 항목의 열의 배경이, 음영 또는 다른 열과 서로 다른 색으로 되어 있다. 또한, 팝업 윈도우(101)에 표시되어 있는 키워드가 대상으로 되는 클래스에 속하는 콘텐츠를 알 수 있도록, 예를 들면, 표의 좌단의 콘텐츠를 나타내는 열의 아티스트 1 내지 11의 란의 배경이, 음영 또는 다른 열과 상이한 색으로 되어 있다.
이에 의해, 유저는, 자신이 선택한 플레이 리스트의 특징(경향)을 간단하게 확인할 수 있다.
도 9는, 스텝 S4에서, 클라이언트 출력부(24)에 표시되는 화면의 다른 예를 도시하는 도면이다. 도 9에서는, 실제로 플레이 리스트를 작성하기 위한 화면 상에, 추출한 키워드를 표시하는 경우의 예를 나타내고 있다.
타이틀 바(111)에는, 이 화면을 표시시키고 있는 소프트웨어의 제품명 등이 표시된다. 메뉴 바(112)에는, 각종 조작을 표시하기 위한 메뉴 등이 표시된다. 윈도우(113)에는, 볼륨을 조정하거나, 동작의 모드를 절환하거나 하기 위한 GUI(Graphical User Interface) 등이 표시된다. 윈도우(114)에는, 콘텐츠의 재생, 정지, 스킵 등을 행하기 위한 GUI 등이 표시된다.
윈도우(115)에는, 플레이 리스트에 선택되어 있는 악곡의 일람 등이 표시된다. 악곡의 일람에는, 시리얼 No., 타이틀, 아티스트명, 연주 시간, 악곡이 속하는 장르, 악곡을 플레이 리스트에 등록한 일시, 악곡의 출전원으로 되는 앨범명, 출전원의 앨범에서의 악곡의 트랙 No. 등이 표시된다.
윈도우(116)에는, 윈도우(115)에 표시되어 있는 플레이 리스트의 특징을 나타내는 키워드 등이 표시된다. 유저는, 윈도우(116)를 보는 것에 의해, 자신이 작성한 플레이 리스트의 특징(경향)을 간단하게 확인할 수 있다. 또한, 유저는 버튼(121)을 누름으로써, 윈도우(116)에 표시되어 있는 키워드에 기초하여, 예를 들면, 「파워풀하고 상쾌하며 기분좋은 노래집」과 같이, 적절한 플레이 리스트의 타이틀을 자동적으로 작성시킬 수 있다. 버튼(122)이 눌러진 경우, 타이틀의 자동 작성은 행해지지 않고, 윈도우(116)가 닫혀진다.
스텝 S5에서, 키워드 제시부(84)는, 키워드를 변경하는지의 여부를 판정한다. 키워드를 변경하지 않는다고 판정된 경우, 처리는 스텝 S6으로 진행한다
스텝 S6에서, 콘텐츠 분류부(81)는, 콘텐츠를 분류하는 시점을 변경하는지의 여부를 판정한다. 콘텐츠를 분류하는 시점을 변경하지 않는다고 판정된 경우, 처리는 스텝 S7로 진행한다.
스텝 S7에서, 키워드 제시부(84)는, 키워드를 결정하는지의 여부를 판정한다. 키워드를 결정하지 않는다고 판정된 경우, 처리는 스텝 S5로 되돌아간다.
그 후, 스텝 S5에서, 키워드를 변경한다고 판정되거나, 스텝 S6에서, 콘텐츠를 분류하는 시점을 변경한다고 판정되거나, 스텝 S7에서, 키워드를 결정한다고 판정될 때까지, 스텝 S5 내지 S7의 처리가 반복 실행된다.
스텝 S5에서, 예를 들면, 유저가, 제시되어 있는 키워드를 변경하고 싶다고 생각하고, 유저 입력부(21)를 통하여 키워드의 변경을 명령하는 정보를 입력한 경우, 유저 입력부(21)는, 취득한 정보를 키워드 제시부(84)에 공급한다. 키워드 제시부(84)는, 키워드의 변경을 명령하는 정보를 취득한 경우, 키워드를 변경한다고 판정하고, 처리는 스텝 S4로 되돌아간다.
그 후, 스텝 S4에서, 스텝 S3에서 추출된 메타데이터의 조합 중에서 별도의 조합이 선택되고, 선택된 메타데이터가, 추출 대상 클래스의 특징을 나타내는 키워드로서 클라이언트 출력부(24)에 제시된다.
스텝 S6에서, 예를 들면, 유저가, 별도의 시점에서 콘텐츠를 분류한 클래스의 키워드를 추출하고 싶다고 생각하고, 유저 입력부(21)를 통하여, 콘텐츠를 분류하는 시점의 변경을 명령하는 정보를 입력한 경우, 유저 입력부(21)는, 취득한 정보를 콘텐츠 분류부(81)에 공급한다. 콘텐츠 분류부(81)는, 콘텐츠를 분류하는 시점의 변경을 명령하는 정보를 취득한 경우, 콘텐츠를 분류하는 시점을 변경한다고 판정하고, 처리는 스텝 S1로 되돌아간다.
그 후, 스텝 S1에서, 새로운 시점에서 콘텐츠가 분류되고(예를 들면, 좋고 싫음의 시점에서 콘텐츠가 분류되고), 새롭게 분류된 클래스에 대하여, 스텝 S2 이후의 처리가 실행된다. 또한, 콘텐츠를 분류하는 새로운 시점을, 유저가 명시적으 로 지정하도록 하여도 되고, 미리 정해진 설정에 기초하여, 콘텐츠 분류부(81)가 자동적으로 설정하도록 하여도 된다.
스텝 S7에서, 예를 들면, 유저가, 유저 입력부(21)를 통하여, 키워드의 결정을 명령하는 정보를 입력한 경우, 유저 입력부(21)는, 취득한 정보를 키워드 제시부(84)에 공급한다. 키워드 제시부(84)는, 키워드의 결정을 명령하는 정보를 취득한 경우, 키워드를 결정한다고 판정하고, 키워드 추출 처리는 종료한다.
또한, 키워드가 유저에게 제시된 후, 유저로부터의 반응이 없는 아이들 상태가 소정의 시간 계속한 경우, 예를 들면, 자동적으로 제시하는 키워드를 변경하거나, 콘텐츠를 분류하는 시점을 변경하도록 하여도 된다.
이와 같이 하여, 유저가 지정한 시점에 의해 분류된 클래스의 특징을 나타내는 메타데이터의 조합을 간단하게 추출할 수 있다. 또한, 추출된 메타데이터의 조합은, 상술한 바와 같이, 비교 대상 클래스에 대하여 추출 대상 클래스를 특징짓는 것으로서, 추출 대상 클래스의 특징을 정확하게 나타내고 있다. 또한, 간단한 논리 연산에 의해, 메타데이터의 조합을 추출할 수 있다. 또한, 메타데이터의 조합 추출하기 전에, 클래스별 중요 메타데이터를 추출하여, 메타데이터의 수를 좁혀 들어감으로써, 계산량 및 계산에 필요한 기억 매체의 기억 용량을 삭감할 수 있으며, 예를 들면, 휴대 음악 플레이어와 같은 처리 능력이 낮은 기기에서도, 용이하게 본 발명을 적용할 수 있다.
다음으로, 도 10의 플로우차트를 참조하여, 정보 처리 시스템(1)에 의해 실행되는 콘텐츠 추천 처리를 설명한다.
스텝 S41에서, 도 4의 스텝 S1의 처리와 마찬가지로, 콘텐츠가 분류된다.
스텝 S42에서, 도 4의 스텝 S2의 처리와 마찬가지로, 메타데이터의 가중치 부여가 행해지고, 클래스별 중요 메타데이터가 추출된다.
스텝 S43에서, 도 4의 스텝 S3의 처리와 마찬가지로, 즉, 도 7의 플로우차트에 따라, 메타데이터 조합 추출 처리가 실행된다.
스텝 S44에서, 추천 콘텐츠 추출부(85)는, 유저에게 추천하는 콘텐츠를 추출한다. 예를 들면, 추천 콘텐츠 추출부(85)는, 스텝 S43에서 추출된 메타데이터의 조합에 기초하여, 스텝 S1에서 분류한 콘텐츠에 의해 구성되는 그룹과는 서로 다른 그룹에 속하는 콘텐츠 중에서, 메타데이터의 조합이 추출된 추출 대상 클래스에 속하는 콘텐츠와 관련이 있는 콘텐츠를 유저에게 추천하는 콘텐츠로서 추출한다.
구체적으로는, 예를 들면, 신착의 콘텐츠(예를 들면, 신착의 영화, 프로그램, 악곡 등)에 관한 메타데이터가, 서버 기억부(51)로부터 클라이언트 기억부(23)에 송신되어 온 경우, 클라이언트 기억부(23)는, 송신되어 온 메타데이터를 기억함과 함께, 신착의 콘텐츠가 있는 것을 나타내는 정보를 추천 콘텐츠 추출부(85)에 공급한다. 추천 콘텐츠 추출부(85)는, 스텝 S43에서 추출된 메타데이터의 조합 중에서, 유저에게 추천하는 콘텐츠를 추출하기 위한 메타데이터의 조합을, 예를 들면, 상술한 스텝 S4에서 설명한 것과 마찬가지의 기준을 이용하여 선택한다. 추천 콘텐츠 추출부(85)는, 클라이언트 기억부(23)에 메타데이터가 기억되어 있는 신착의 콘텐츠 중에서, 선택한 메타데이터의 조합을 포함하는 메타데이터를 갖는 콘텐츠를 추출한다. 추천 콘텐츠 추출부(85)는, 추출한 콘텐츠에 관한 정보를 추천 콘 텐츠 제시부(86)에 공급한다.
또한, 추출된 메타데이터의 조합에 기초하여, 유저에게 추천하는 콘텐츠를 추출하도록 요구하는 추천 콘텐츠 추출 요구 정보를, 추천 콘텐츠 추출부(85)로부터, 클라이언트 기억부(23) 및 서버 기억부(51)를 통하여, 서버 연산부(52)에 송신하고, 서버 기억부(51)에 메타데이터가 기억되어 있는 콘텐츠 중에서 추출한 메타데이터의 조합을 포함하는 메타데이터를 갖는 콘텐츠를 서버 연산부(52)에 추출시키는 것도 가능하다.
또한, 유저에게 추천하는 콘텐츠를 추출하는 방법은 상술한 방법에 한정되는 것은 아니고, 예를 들면, 벡터 공간법에 의한 매칭을 행하거나, 상태 행동 함수를 이용하거나 하는 등, 다른 방법을 이용하여, 추출된 메타데이터에 기초하여, 추출 대상 클래스에 속하는 콘텐츠에 관한 콘텐츠, 즉, 유저에게 추천하는 콘텐츠를 추출하는 것도 가능하다.
스텝 S45에서, 추천 콘텐츠 제시부(86)는, 유저에게 콘텐츠를 추천한다. 구체적으로는, 추천 콘텐츠 제시부(86)는, 클라이언트 출력부(24)를 제어하여, 스텝 S44에서 추출된 콘텐츠를, 추천하는 콘텐츠로서 유저에게 제시한다. 예를 들면, 추천 콘텐츠 제시부(86)는, 스텝 S44에서 추출된 콘텐츠를 유저에게 추천하기 위한 화상 데이터를 생성한다. 추천 콘텐츠 제시부(86)는, 생성한 화상 데이터를 클라이언트 출력부(24)에 공급하고, 화상 데이터에 기초한 화상, 즉, 유저에게 콘텐츠를 추천하는 화상을 표시시킨다. 이 화상에는, 예를 들면, 추천하는 콘텐츠에 관한 정보(예를 들면, 타이틀, 개요 등)와 함께, 콘텐츠를 추천하는 근거(추천 이유) 가 표시된다. 콘텐츠의 추천 이유는, 예를 들면, 추천하는 콘텐츠의 추출에 이용한 메타데이터의 조합을 그대로 표시하도록 하여도 되고, 메타데이터의 조합에 기초한 추천문을 작성해서 표시하도록 하여도 된다.
스텝 S46에서, 추천 콘텐츠 제시부(86)는, 추천하는 콘텐츠를 변경하는지의 여부를 판정한다. 추천하는 콘텐츠를 변경하지 않는다고 판정된 경우, 처리는 스텝 S47로 진행한다.
스텝 S47에서, 도 4의 스텝 S47의 처리와 마찬가지로, 콘텐츠를 분류하는 시점을 변경하는지의 여부가 판정된다. 콘텐츠를 분류하는 시점을 변경하지 않는다고 판정된 경우, 처리는 스텝 S48로 진행한다.
스텝 S48에서, 추천 콘텐츠 제시부(86)는, 콘텐츠를 결정하는지의 여부를 판정한다. 콘텐츠를 결정하지 않는다고 판정한 경우, 처리는 스텝 S46으로 되돌아간다.
그 후, 스텝 S46에서, 추천하는 콘텐츠를 변경한다고 판정되거나, 스텝 S47에서, 콘텐츠를 분류하는 시점을 변경한다고 판정되거나, 스텝 S48에서, 콘텐츠를 결정한다고 판정될 때까지, 스텝 S46 내지 S48의 처리가 반복 실행된다.
스텝 S46에서, 예를 들면, 유저가, 추천되어 있는 콘텐츠를 변경하고 싶다고 생각하고, 유저 입력부(21)를 통하여 콘텐츠의 변경을 명령하는 정보를 입력한 경우, 유저 입력부(21)는, 취득한 정보를 추천 콘텐츠 제시부(86)에 공급한다. 추천 콘텐츠 제시부(86)는, 추천하는 콘텐츠의 변경을 명령하는 정보를 취득한 경우, 추천하는 콘텐츠를 변경한다고 판정하고, 처리는 스텝 S44로 되돌아간다.
그 후, 스텝 S44에서, 스텝 S43에서 추출된 메타데이터의 조합 중에서 별도의 조합이 선택되고, 선택된 메타데이터의 조합에 기초하여 추출된 콘텐츠가 유저에게 추천된다.
스텝 S47에서, 콘텐츠를 분류하는 시점을 변경한다고 판정된 경우, 처리는 스텝 S41로 되돌아간다.
그 후, 스텝 S41에서, 새로운 시점에서 콘텐츠가 분류되고(예를 들면, 좋고 싫음의 시점에서 콘텐츠가 분류되고), 새롭게 분류된 클래스에 대하여, 스텝 S2 이후의 처리가 실행된다.
스텝 S48에서, 예를 들면, 유저가, 추천된 콘텐츠를 마음에 들어해서, 콘텐츠를 시청하고 싶다고 생각하고, 유저 입력부(21)를 통하여, 콘텐츠의 결정을 명령하는 정보를 입력한 경우, 유저 입력부(21)는, 취득한 정보를 추천 콘텐츠 제시부(86)에 공급한다. 추천 콘텐츠 제시부(86)는, 콘텐츠의 결정을 명령하는 정보를 취득한 경우, 콘텐츠를 결정한다고 판정하고, 콘텐츠 추천 처리는 종료한다.
그 후, 추천 콘텐츠 제시부(86)는, 결정된 콘텐츠를 통지하는 정보를 클라이언트 기억부(23)에 공급한다. 예를 들면, 결정된 콘텐츠가 클라이언트 기억부(23)에 기억되어 있는 경우, 클라이언트 기억부(23)는, 그 콘텐츠를 클라이언트 출력부(24)에 공급한다. 클라이언트 출력부(24)는, 예를 들면, 콘텐츠에 기초한 화상을 표시하거나, 음성을 출력하거나 한다.
또한, 예를 들면, 결정된 콘텐츠가 클라이언트 기억부(23)에 기억되어 있지 않은 경우, 클라이언트 기억부(23)는, 결정된 콘텐츠의 배신을 요구하는 정보를, 콘텐츠 배신부(41)에 공급한다. 콘텐츠 배신부(41)는, 요구된 콘텐츠를, 클라이언트 기억부(23)에 배신한다. 클라이언트 기억부(23)는, 배신된 콘텐츠를 기억함과 함께, 그 콘텐츠를 클라이언트 출력부(24)에 공급한다. 클라이언트 출력부(24)는, 예를 들면, 콘텐츠에 기초한 화상을 나타내거나, 음성을 출력하거나 한다.
또한, 콘텐츠가 유저에게 추천된 후, 유저로부터의 반응이 없는 아이들 상태가 소정의 시간 계속된 경우, 예를 들면, 자동적으로 추천하는 콘텐츠를 변경하거나, 콘텐츠를 분류하는 시점을 변경하거나 하도록 하여도 된다.
이와 같이 하여, 유저가 지정한 시점에 의해 분류된 클래스의 특징을 나타내는 메타데이터의 조합에 기초하여 추출된 콘텐츠를 유저에게 추천함과 함께, 추천하는 근거(이유)를 유저에게 명확하게 제시할 수 있다. 예를 들면, 유저의 기호(예를 들면, 유저의 좋고 싫음 등에 기초한 시점에 의해 분류된 클래스로부터 추출된 메타데이터의 조합을 이용함으로써, 유저의 기호를 정확하게 반영한 콘텐츠를 유저에게 추천할 수 있다. 또한, 유저의 기호에 기초한 시점과는 서로 다른 시점에 의해 콘텐츠를 분류함으로써, 예를 들면, 콘텐츠 제공측의 판매 촉진을 겨냥한 콘텐츠 등, 유저의 기호에 웅거하지 않는 콘텐츠를 추천할 수도 있다.
다음으로, 도 11 내지 도 16을 참조하여, 본 발명의 제2 실시 형태에 대하여 설명한다.
도 11은, 본 발명을 적용한 정보 처리 시스템의 제2 실시 형태를 도시하는 블록도이다.
정보 처리 시스템(201)은, 콘텐츠 시청 클라이언트(211), 컨텍스트 검출 단 말기(212), 콘텐츠 배신 서버(213), 및 콘텐츠 추천 서버(214)를 포함하도록 구성된다. 콘텐츠 시청 클라이언트(211)는, 기능적 구성의 관점에 서면, 유저 입력부(221), 클라이언트 연산부(222), 클라이언트 기억부(223), 및 클라이언트 출력부(224)를 포함하도록 구성된다. 컨텍스트 검출 단말기(212)는, 기능적 구성의 관점에 서면, 컨텍스트 검출부(231), 및 컨텍스트 기억부(232)를 포함하도록 구성된다. 콘텐츠 배신 서버(213)는, 기능적 구성의 관점에 서면, 콘텐츠 배신부(241), 및 콘텐츠 메타데이터 기억부(242)를 포함하도록 구성된다. 콘텐츠 추천 서버(214)는, 기능적 구성의 관점에 서면, 서버 기억부(251), 및 서버 연산부(252)를 포함하도록 구성된다.
또한, 도면 중에서, 도 1과 대응하는 부분에 대해서는 아래 2자릿수가 동일 부호를 붙이고 있으며, 처리가 동일한 부분에 관해서는, 그 설명은 반복되므로, 생략한다.
클라이언트 연산부(222)는, 도 13 또는 도 16을 참조하여 후술하는 바와 같이, 클라이언트 기억부(223)에 기억되어 있는 콘텐츠 및 메타데이터에 관한 정보, 컨텍스트 검출 단말기(212)로부터 공급되는 컨텍스트 정보, 또는 유저 입력부(221)로부터 공급되는 유저의 조작 내용을 나타내는 정보에 기초하여, 콘텐츠를 소정의 클래스로 분류하기 위한 콘텐츠 분류 룰을 생성함과 함께, 생성한 콘텐츠 분류 룰의 신뢰도를 나타내는 평가 지표를 산출한다. 클라이언트 연산부(222)는, 생성한 콘텐츠 분류 룰에 기초하여, 유저 등에 의해 분류하는 대상으로서 지정된 콘텐츠를 분류한다. 클라이언트 연산부(222)는, 클라이언트 출력부(224)를 제어하여, 콘텐 츠를 분류한 결과, 콘텐츠의 특징 등을 유저에게 제시한다. 또한, 클라이언트 연산부(222)는, 생성한 콘텐츠 분류 룰 및 그 평가 지표를 나타내는 정보를 클라이언트 기억부(223)에 기억시킨다.
클라이언트 기억부(223)는, 콘텐츠 분류 룰 및 그 평가 지표를 나타내는 정보를 기억한다. 또한, 클라이언트 기억부(223)는, 콘텐츠 분류 룰 및 그 평가 지표를 나타내는 정보를, 필요에 따라, 콘텐츠 추천 서버(214)의 서버 기억부(251)에 송신한다.
클라이언트 출력부(224)는, 클라이언트 연산부(222)의 제어에 기초하여, 콘텐츠를 분류한 결과, 콘텐츠의 특징 등을 유저에게 제시한다.
서버 기억부(251)는, 클라이언트 기억부(223)로부터 송신되어 오는, 콘텐츠 분류 룰 및 그 평가 지표를 나타내는 정보를 기억한다. 또한, 서버 기억부(251)는, 서버 연산부(252)로부터 공급되는, 콘텐츠 분류 룰 및 그 평가 지표를 나타내는 정보, 또는 콘텐츠의 분류 결과를 나타내는 정보를 기억한다.
서버 연산부(252)는, 서버 기억부(251)에 기억되어 있는, 유저의 조작 내용을 나타내는 정보, 및 컨텍스트 정보에 기초하여, 서버 기억부(251)에 기억되어 있는 콘텐츠를 분류하기 위한 콘텐츠 분류 룰을 생성함과 함께, 생성한 콘텐츠 분류 룰의 신뢰도를 나타내는 평가 지표를 산출한다. 서버 연산부(252)는, 생성한 콘텐츠 분류 룰에 기초하여, 서버 기억부(251)에 기억되어 있는 콘텐츠를 분류한다. 서버 연산부(252)는, 생성한 콘텐츠 분류 룰 및 그 평가 지표를 나타내는 정보, 또는 콘텐츠의 분류 결과를 나타내는 정보를 서버 기억부(251)에 기억시킨다.
그런데, 도 11은, 기능적 구성예를 나타내고 있기 때문에, 각 장치 간의 접속 형태, 즉, 콘텐츠 시청 클라이언트(211) 내지 콘텐츠 추천 서버(214)의 각각의 사이의 접속의 형태는 특히 도시되어 있지 않지만, 그 접속의 형태는 특별히 한정되지 않는다. 즉, 접속의 형태는, 유선이어도 되고, 무선이어도 되고, 그 조합이어도 된다.
또한, 접속의 형태는, 네트워크를 개재하는 형태이어도 되고, 장치 간에서 직접 통신을 행하는 형태이어도 되고, 그 조합이어도 된다. 또한, 네트워크를 개재하는 형태의 경우에도, 네트워크의 형태는 한정되지 않고, 예를 들면, 인터넷이나 인트라네트 등에서도 무방하다. 이 경우에도, 네트워크는 단일인 네트워크에 한정되지 않고, 복수의 네트워크가 존재하여도 된다. 따라서, 도 11에는 도시되어 있지 않지만, 실제로는, 콘텐츠 시청 클라이언트(211) 내지 콘텐츠 추천 서버(214)의 각각에는, 대응하는 접속 형태에 따른 통신부가 더 마련되게 된다.
또한, 컨텍스트 검출 단말기(212), 콘텐츠 배신 서버(213), 및 콘텐츠 추천 서버(214)는, 정보 처리 시스템(201)에서 필수적인 구성 요소가 아니다. 즉, 도 13 또는 도 16을 참조하여 후술하는 바와 같이, 정보 처리 시스템(201)에 의해 행해지는 콘텐츠 분류 처리는, 콘텐츠 시청 클라이언트(211) 만으로 실현하는 것이 가능하다.
도 12는, 클라이언트 연산부(222)의 기능의 구성의 예를 도시하는 블록도이다. 클라이언트 연산부(222)는, 콘텐츠 분류부(281), 메타데이터 추출부(282), 조합 추출부(283), 콘텐츠 분류 룰 생성부(291), 콘텐츠 자동 분류부(292), 및 분류 결과 제시부(293)를 포함하도록 구성된다. 또한, 도면 중에서, 도 2와 대응하는 부분에 대해서는 아래 2자릿수가 동일 부호를 붙이고 있으며, 처리가 동일 부분에 관해서는, 그 설명은 반복되므로, 생략한다.
조합 추출부(283)는, 추출한 메타데이터의 조합을 나타내는 정보를, 콘텐츠 분류 룰 생성부(291)에 공급한다.
콘텐츠 분류 룰 생성부(291)는, 도 13을 참조하여 후술하는 바와 같이, 콘텐츠 분류 룰을 생성함과 함께, 생성한 콘텐츠 분류 룰의 평가 지표를 산출한다.
콘텐츠 분류 룰 생성부(291)는, 생성한 콘텐츠 분류 룰, 및 그 평가 지표를 나타내는 정보를, 콘텐츠 자동 분류부(292)에 공급함과 함께, 클라이언트 기억부(223)에 기억시킨다.
콘텐츠 자동 분류부(292)는, 유저 입력부(221)를 통하여 유저가 입력한, 자동 분류하는 대상으로 되는 콘텐츠를 지정하는 정보를, 유저 입력부(221)로부터 취득한다. 또한, 콘텐츠 자동 분류부(292)는, 신착 또는 추천 콘텐츠가 있는 것을 나타내는 정보를 클라이언트 기억부(223)로부터 취득한다. 콘텐츠 자동 분류부(292)는, 도 13 또는 도 16을 참조하여 후술하는 바와 같이, 콘텐츠 분류 룰에 기초하여, 유저에 의해 지정된 콘텐츠, 또는 클라이언트 기억부(223)로부터 통지된 신착 또는 추천 콘텐츠 등을 분류하는 대상으로 되는 콘텐츠를 소정의 클래스로 분류한다. 콘텐츠 자동 분류부(292)는, 콘텐츠를 분류한 결과를 나타내는 정보를 분류 결과 제시부(293)에 공급한다.
분류 결과 제시부(293)는, 콘텐츠를 분류한 결과, 콘텐츠의 특징 등을 유저 에게 제시하도록, 클라이언트 출력부(224)를 제어한다.
다음으로, 도 13 내지 도 16을 참조하여, 정보 처리 시스템(201)에 의해 실행되는 처리를 설명한다.
우선, 도 13의 플로우차트를 참조하여, 정보 처리 시스템(201)에 의해 실행되는 콘텐츠 분류 처리의 제1 실시 형태를 설명한다. 또한, 이 처리는, 예를 들면, 유저 입력부(221)를 통하여, 유저가 콘텐츠 분류 처리의 개시의 명령을 입력했을 때, 개시된다.
스텝 S101에서, 콘텐츠 분류부(281)는, 상술한 도 4의 스텝 S1과 마찬가지의 처리에 의해, 유저에 의해 지정된 시점에 기초하여, 콘텐츠를 복수의 클래스로 분류하고, 분류한 콘텐츠의 클래스에 관한 정보를 메타데이터 추출부(282)에 공급한다.
도 14는, 도 3에 도시된 콘텐츠를 분류하기 위한 시점의 예를 도시하는 도면이다. 또한, 도 14에 도시된 표에는, 도 3에 도시된 표와 비교하여, 분류의 시점의 항목이 추가되어 있다. 또한, 도 14에는, 콘텐츠를 분류하는 시점으로서, 유저의 좋고 싫음, 및 콘텐츠가 저장되어 있는 폴더의 2개의 예가 나타나 있다. 유저의 좋고 싫음의 시점에 대해서는, 도 5를 참조하여 상술한 예와 마찬가지이다.
또한, 이하, 콘텐츠가 저장되는 폴더를 「팝 음악」 및 「발라드」의 2종류라고 한 경우의 예에 대하여 설명한다. 예를 들면, 유저는, 콘텐츠(지금의 예의 경우, 악곡)의 곡조 등에 기초하여, 각 콘텐츠를 「팝 음악」 또는 「발라드」의 폴더로 분류하여 관리한다. 따라서, 콘텐츠가 저장되어 있는 폴더의 시점에 기초 하여 콘텐츠를 분류하는 경우, 각 콘텐츠는, 「팝 음악」 「발라드」의 2개의 클래스로 분류된다.
또한, 설명을 간단히 하기 위해서, 도 5의 예에서, 「플레이 리스트 선택곡」의 클래스에 속하는 콘텐츠가, 도 14의 예에서, 「팝 음악」의 클래스에 속하고, 즉, 「팝 음악」의 폴더에 저장되며, 도 5의 예에서, 「플레이 리스트 비선택곡」의 클래스에 속하는 콘텐츠가, 도 14의 예에서, 「발라드」의 클래스에 속하고, 즉, 「발라드」의 폴더에 저장되어 있는 것으로 한다.
또한, 이하에서는, 스텝 S101에서, 콘텐츠를 분류하는 시점으로서 콘텐츠가 저장되어 있는 폴더가 유저에 의해 지정된 경우의 예에 대하여 설명한다.
스텝 S102에서, 메타데이터 추출부(282)는, 상술한 도 4의 스텝 S2와 마찬가지의 처리에 의해, 메타데이터의 가중치 부여를 행하고, 클래스마다, 클래스별 중요 메타데이터를 추출한다. 메타데이터 추출부(282)는, 추출한 클래스별 중요 메타데이터를 나타내는 정보를 조합 추출부(283)에 공급한다.
또한, 이하, 스텝 S102에서, 도 15에 도시된 바와 같이, 팝 음악의 클래스로부터는, [겨울][사랑][BGM][드라마][여름][파워풀][상쾌함][배우][기분좋음][여흥]의 10개의 메타데이터가 클래스별 중요 메타데이터로서 추출되고, 발라드의 클래스로부터는, [사랑][센티멘탈][여름][노스탤지어][타이업][기분좋음][드라마][댄스][장대함][온기]의 10개의 메타데이터가 클래스별 중요 메타데이터로서 추출된 것으로 하여 설명한다.
스텝 S103에서, 조합 추출부(283)는, 상술한 도 4의 스텝 S3과 마찬가지의 처리에 의해, 각 클래스에 대하여, 메타데이터 조합 추출 처리를 행한다. 조합 추출부(283)는, 추출한 메타데이터의 조합을 나타내는 데이터를, 클라이언트 기억부(223)에 기억시킴과 함께, 콘텐츠 분류 룰 생성부(291)에 공급한다.
또한, 이하, 팝 음악의 클래스로부터는, 이하에 기재하는 10조의 메타데이터의 조합이 추출된 것으로 하여 설명한다.
·[BGM]
·[배우]
·[겨울]and[기분좋음]
·[사랑]and[기분좋음]
·[겨울]and[여흥]
·[사랑]and[여흥]
·[여름]and[여흥]
·[상쾌함]and[여흥]
·[드라마]and[상쾌함]and[기분좋음]
·[파워풀]and[상쾌함]and[기분좋음]
또한, 이하, 발라드의 클래스로부터는, 이하에 기재하는 10조의 메타데이터의 조합이 추출된 것으로 하여 설명한다.
·[여름]and[노스탤지어]
·[노스탤지어]and[타이업]
·[드라마]and[장대함]
·[기분좋음]and[장대함]
·[온기]and[장대함]
·[사랑]and[여름]and[드라마]
·[센티멘탈]and[여름]and[드라마]
·[사랑]and[노스탤지어]and[댄스]
·[센티멘탈]and[타이업]and[드라마]
·[여름]and[타이업]and[드라마]
스텝 S104에서, 콘텐츠 분류 룰 생성부(291)는, 콘텐츠 분류 룰을 생성한다. 구체적으로는, 우선, 콘텐츠 분류 룰 생성부(291)는, 스텝 S103에서 추출된 메타데이터의 조합을 조건부(If부), 그 메타데이터의 조합이 추출된 클래스를 결론부(then부)로 하는 콘텐츠 분류 룰을, 추출된 메타데이터의 조합마다 생성한다. 예를 들면, 팝 음악의 클래스를 결론부로 하는 콘텐츠 분류 룰(이하, 간단히, 팝 음악의 클래스의 콘텐츠 분류 룰이라고도 표현함)로서, 이하의 Rp1 내지 Rp10의 10개의 콘텐츠 분류 룰이 생성된다.
룰 Rp1:if([BGM]=true)then(클래스=「팝 음악」)
룰 Rp2:if([배우]=true)then(클래스=「팝 음악」)
룰 Rp3:if([겨울]=true and[기분좋음]=true)then(클래스=「팝 음악」)
룰 Rp4:if([사랑]=true and[기분좋음]=true)then(클래스=「팝 음악」)
룰 Rp5:if([겨울]=true and[여흥]=true)then(클래스=「팝 음악」)
룰 Rp6:if([사랑]=true and[여흥]=true)then(클래스=「팝 음악」)
룰 Rp7:if([여름]=true and[여흥]=true)then(클래스=「팝 음악」)
룰 Rp8:if([상쾌함]=true and[여흥]=true)then(클래스=「팝 음악」)
룰 Rp9:if([드라마]=true and[상쾌함]=true and[기분좋음]=true)then (클래스=「팝 음악」)
룰 Rp10:if([파워풀]=true and[상쾌함]=true and[기분좋음]=true)then(클래스=「팝 음악」)
예를 들면, 룰 Rp1은, 임의의 콘텐츠가 [BGM]이라는 메타데이터를 갖고 있는 경우, 그 콘텐츠가 분류되는 클래스는 「팝 음악」이라는 룰을 나타내고 있다.
마찬가지로, 발라드의 클래스를 결론부라고 하는 콘텐츠 분류 룰(이하, 간단히, 발라드의 클래스의 콘텐츠 분류 룰이라고도 표현함)로서, 이하의 Rb1 내지 Rb10의 10개의 콘텐츠 분류 룰이 생성된다.
룰 Rb1:if([여름]=true and[노스탤지어]=true)then(클래스=「발라드」)
룰 Rb2:if([노스탤지어]=true and[타이업]=true)then(클래스=「발라드」)
룰 Rb3:if([드라마]=true and[장대함]=true)then(클래스=「발라드」)
룰 Rb4:if([기분좋음]=true and[장대함]=true)then(클래스=「발라드」)
룰 Rb5:if([온기]=true and[장대함]=true)then(클래스=「발라드」)
룰 Rb6:if([사랑]=true and[여름]=true and[드라마]=true)then(클래스=「발라드」)
룰 Rb7:if([센티멘탈]=true and[여름]=true and[드라마]=true)then(클래스=「발라드」)
룰 Rb8:if([사랑]=true and[노스탤지어]=true and[댄스]=true)then(클래스=「발라드」)
룰 Rb9:if([센티멘탈]=true and[타이업]=true and[드라마]=true)then(클래스=「발라드」)
룰 Rb10:if([여름]=true and[타이업]=true and[드라마]=true)then(클래스=「발라드」)
또한, 이하, 콘텐츠 분류 룰의 조건부에 나타내는 메타데이터의 조합을, 간단히, 콘텐츠 분류 룰의 메타데이터의 조합이라고도 칭한다. 또한, 이하, 콘텐츠 분류 룰의 결론부에 나타내는 클래스를, 간단히, 콘텐츠 분류 룰의 클래스라고도 칭한다.
다음으로, 콘텐츠 분류 룰 생성부(291)는, 각 콘텐츠 분류 룰의 평가 지표를 산출한다.
여기서, 평가 지표의 산출 방법의 예에 대하여 설명한다.
제1 방법은, 이하의 식 (27)에 나타낸 바와 같이, 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터의 가중치의 합계값을 평가 지표로 하는 방법이다.
Figure 112007023229098-PCT00027
…(27)
또한, EI는, 평가 지표를 나타내고, Wi는, 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터를 나타내고, Weight(Wi)는, 콘텐츠 분류 룰의 클래스 에서의 메타데이터 Wi의 가중치를 나타낸다.
예를 들면, 룰 Rp3의 경우, 클래스 「팝 음악」에서의 메타데이터 [겨울]의 가중치와 클래스 「팝 음악」에서의 메타데이터 [기분좋음]의 가중치를 합계한 값이 평가 지표로 된다.
제1 방법에서는, 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터의 수가 많을수록, 또는 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터의 가중치가 클수록, 평가 지표가 커진다. 즉, 콘텐츠 분류 룰의 메타데이터의 조합이, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠와의 관련이 깊을수록, 환언하면, 콘텐츠 분류 룰의 메타데이터의 조합이, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠의 특징을 나타내는 정도가 클수록, 평가 지표가 커진다. 다시 환언하면, 콘텐츠 분류 룰의 클래스에서, 콘텐츠 분류 룰의 메타데이터의 조합을 포함하는 메타데이터를 갖는 콘텐츠가 차지하는 비율이 높을수록, 평가 지표가 커진다.
제2 방법은, 이하의 식 (28)에 나타낸 바와 같이, 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터의 가중치의 평균값을 평가 지표로 하는 방법이다.
Figure 112007023229098-PCT00028
…(28)
또한, Nc는, 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터의 수를 나타낸다.
예를 들면, 룰 Rp3의 경우, 클래스 「팝 음악」에서의 메타데이터 [겨울]의 가중치와 클래스 「팝 음악」에서의 메타데이터 [기분좋음]의 가중치를 합계한 값을, 조건부에 포함되는 메타데이터의 수인 2로 나눈 값이 평가 지표로 된다.
제2 방법에서는, 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터의 가중치가 클수록, 평가 지표가 커진다. 즉, 콘텐츠 분류 룰의 조건부에 포함되는 개개의 메타데이터가, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠와의 관련이 깊을수록, 환언하면, 콘텐츠 분류 룰의 조건부에 포함되는 개개의 메타데이터가, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠의 특징을 나타내는 정도가 클수록, 평가 지표가 커진다. 다시 환언하면, 콘텐츠 분류 룰의 클래스에서, 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터 중 적어도 하나를 갖는 콘텐츠가 차지하는 비율이 높을수록, 평가 지표가 커진다.
제3 방법은, 이하의 식 (29)에 나타낸 바와 같이, 모든 콘텐츠 중 콘텐츠 분류 룰의 조건부를 만족하는 콘텐츠가 차지하는 비율, 환언하면, 모든 콘텐츠 중 콘텐츠 분류 룰의 메타데이터의 조합에 포함되는 메타데이터를 갖는 콘텐츠가 차지하는 비율, 소위, 피복율을 평가 지표로 하는 방법이다. 또한, 여기서, 모든 콘텐츠는, 스텝 S1에서, 각 클래스로 분류된 콘텐츠의 것이다.
Figure 112007023229098-PCT00029
…(29)
또한, Count(Condition)는, 콘텐츠 분류 룰의 조건부를 만족하는 콘텐츠의 개수를 나타내고, N은, 콘텐츠의 전체 개수를 나타낸다.
예를 들면, 룰 Rp3의 경우, 전 콘텐츠 중, 메타데이터 [겨울]과 메타데이터 [기분좋음]을 갖는 콘텐츠가 차지하는 비율이 평가 지표로 된다.
제3 방법에서는, 전 콘텐츠 중, 콘텐츠 분류 룰의 조건부를 만족하는 콘텐츠가 차지하는 비율이 높을수록, 평가 지표가 커진다.
제4 방법은, 이하의 식 (30)에 나타낸 바와 같이, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠 중, 콘텐츠 분류 룰의 조건부를 만족하는 콘텐츠가 차지하는 비율, 소위, 재현율(Recall)을 평가 지표로 하는 방법이다.
Figure 112007023229098-PCT00030
…(30)
또한, Count(Condition&Decision)는, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠 중, 콘텐츠 분류 룰의 조건부를 만족하는 콘텐츠의 개수를 나타내고, Count(Decision)는, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠의 개수를 나타낸다.
예를 들면, 룰 Rp3의 경우, 클래스 「팝 음악」에 속하는 콘텐츠 중, 메타데이터 [겨울]과 메타데이터 [기분좋음]을 갖는 콘텐츠가 차지하는 비율이 평가 지표로 된다.
제4 방법에서는, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠가, 콘텐츠 분류 룰의 메타데이터의 조합을 포함하는 메타데이터를 갖는 비율이 높아질수록, 평가 지표가 커진다. 즉, 콘텐츠 분류 룰의 메타데이터의 조합이, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠와 관련이 깊을수록, 환언하면, 콘텐츠 분류 룰의 메타데이터의 조합이, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠의 특징을 나타내는 정도가 클수록, 평가 지표가 커진다.
제5 방법은, 이하의 식 (31)에 나타낸 바와 같이, 콘텐츠 분류 룰의 조건부를 만족하는 콘텐츠 중, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠가 차지하는 비율, 소위, 적합율(Precision)을 평가 지표로 하는 방법이다.
Figure 112007023229098-PCT00031
…(31)
예를 들면, 룰 Rp3의 경우, 메타데이터 [겨울]과 메타데이터 [기분좋음]을 갖는 콘텐츠 중, 클래스 「팝 음악」에 속하는 콘텐츠가 차지하는 비율이 평가 지표로 된다.
제5 방법에서는, 콘텐츠 분류 룰의 메타데이터의 조합을 포함하는 메타데이터를 갖는 콘텐츠가, 콘텐츠 분류 룰의 클래스에 속하는 비율이 높아질수록, 평가 지표가 커진다. 즉, 콘텐츠 분류 룰의 메타데이터의 조합이, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠와 관련이 깊을수록, 환언하면, 콘텐츠 분류 룰의 메타데이터의 조합이, 콘텐츠 분류 룰의 클래스에 속하는 콘텐츠의 특징을 나타내는 정도가 클수록, 평가 지표가 커진다.
제6 방법은, 이하의 식 (32)에 나타낸 바와 같이, 식 (30)에 의해 구해지는 재현율(Recall)과 식 (31)에 의해 구해지는 적합율(Precision)과의 조화 평균, 소위, F값을 평가 지표로 하는 방법이다.
Figure 112007023229098-PCT00032
…(32)
제6 방법에서는, 콘텐츠 분류 룰의 메타데이터의 조합을 포함하는 메타데이터를 갖는 콘텐츠의 집합과, 콘텐츠 분류 룰의 클래스가 가까워질수록, 평가 지표가 커진다.
제7 방법은, 이하의 식 (33)에 나타낸 바와 같이, 콘텐츠 분류 룰의 조건부와 결론부를 각각 1개의 사상으로서 파악하고, 조건부의 사상이 발생하는 확률과 결론부의 사상이 발생하는 확률의 의존성을 평가 지표로 하는 방법이다.
Figure 112007023229098-PCT00033
…(33)
또한, 식 (33)은, 이하와 같이 하여 도출된다.
Figure 112007023229098-PCT00034
…(34)
Figure 112007023229098-PCT00035
…(35)
Figure 112007023229098-PCT00036
…(36)
또한, Prob(Condition)은, 콘텐츠 분류 룰의 조건부의 사상이 발생하는 확률, Prob(Decision)은, 콘텐츠 분류 룰의 결론부의 사상이 발생하는 확률, Prob(Condition&Decision)은, 콘텐츠 분류 룰의 조건부의 사상과 결론부의 사상이 동시에 발생하는 확률을 나타낸다.
식 (34) 내지 식 (36)으로부터, 콘텐츠 분류 룰의 조건부의 사상이 발생하는 확률과 결론부의 사상이 발생하는 확률의 의존성 R은, 이하의 식 (37)에 의해 구해진다.
Figure 112007023229098-PCT00037
…(37)
그리고, 콘텐츠의 전체 개수 N은, 모든 콘텐츠 분류 룰에 공통인 값이므로, 의존성 R에 콘텐츠의 전체 개수 N을 곱합으로써, 식 (33)이 도출된다.
예를 들면, 룰 Rp3의 경우, 클래스 「팝 음악」에 속하고, 또한 메타데이터 [겨울]과 메타데이터 [기분좋음]을 갖는 콘텐츠의 수로부터, 메타데이터 [겨울]과 메타데이터 [기분좋음]을 갖는 콘텐츠의 수×클래스 「팝 음악」에 속하는 콘텐츠의 수÷N을 뺀 값이 평가 지표로 된다.
제7 방법에서는, 콘텐츠가, 콘텐츠 분류 룰의 메타데이터의 조합을 포함하는 메타데이터를 가질 확률과, 콘텐츠 분류 룰의 클래스에 속하는 확률의 의존성이 높을수록, 평가 지표가 커진다. 즉, 콘텐츠가, 콘텐츠 분류 룰의 메타데이터의 조합을 포함하는 메타데이터를 갖는 사상과, 콘텐츠 분류 룰의 클래스에 속하는 사상의 관련이 깊을수록, 평가 지표가 커진다. 또한, 콘텐츠 분류 룰의 조건부의 사상과 결론부의 사상이 독립하고 있는 경우, 이하의 식 (38)이 성립하므로, 평가 지표는 최소의 0으로 된다.
Figure 112007023229098-PCT00038
…(38)
이와 같이, 평가 지표는, 콘텐츠 분류 룰의 조건부에 포함되는 메타데이터 또는 그 조합이, 결론부의 클래스에 속하는 콘텐츠가 갖는 메타데이터에 출현하는 정도를 나타낸다. 특히, 제1, 제2, 제4 내지 제7 방법을 이용하여 산출한 평가 지표는, 콘텐츠 분류 룰의 조건부에 포함되는 메타데이터의 조합과, 결론부의 클래스에 속하는 콘텐츠의 관련도를 나타낸다. 즉, 제1, 제2, 제4 내지 제7 방법을 이용하여 산출한 평가 지표는, 콘텐츠 분류 룰의 조건부에 포함되는 메타데이터의 조합이, 결론부의 클래스에 속하는 콘텐츠의 특징을 나타내는 정도를 나타낸다.
또한, 이하, 평가 지표를 산출하는 방법으로서 제5 방법을 채용한 경우, 즉, 평가 지표를 F값으로 하는 경우의 예에 대하여 설명한다. 또한, 이하, 각 콘텐츠 분류 룰의 평가 지표 EI가 이하의 값으로 되는 것으로 하여 설명한다.
EI(Rp1)=0.429
EI(Rp2)=0.240
EI(Rp3)=0.167
EI(Rp4)=0.333
EI(Rp5)=0.167
EI(Rp6)=0.167
EI(Rp7)=0.167
EI(Rp8)=0.167
EI(Rp9)=0.167
EI(Rb10)=0.167
EI(Rb1)=0.267
EI(Rb2)=0.267
EI(Rb3)=0.267
EI(Rb4)=0.333
EI(Rb5)=0.143
EI(Rb6)=0.267
EI(Rb7)=0.143
EI(Rb8)=0.143
EI(Rb9)=0.143
EI(Rb10)=0.143
콘텐츠 분류 룰 생성부(291)는, 생성한 콘텐츠 분류 룰, 및 각 콘텐츠 분류 룰의 평가 지표를 나타내는 정보를, 클라이언트 기억부(223)에 기억시킴과 함께, 콘텐츠 자동 분류부(292)에 공급한다.
스텝 S105에서, 콘텐츠 자동 분류부(292)는, 자동 분류하는 콘텐츠를 설정한다. 구체적으로는, 예를 들면, 유저가, 유저 입력부(221)를 통하여, 클라이언트 기억부(223)에 기억되어 있는 콘텐츠 중에서, 아직 각 클래스에 분류되어 있지 않은 콘텐츠(예를 들면, 유저가 새롭게 구입한 악곡, 영화, 새롭게 녹화한 프로그램 등)를 1개 이상을 자동 분류하는 대상으로서 선택한 경우, 유저 입력부(221)는, 유저에 의해 선택된 콘텐츠를 나타내는 정보를 콘텐츠 자동 분류부(292)에 공급한다. 콘텐츠 자동 분류부(292)는, 유저에 의해 선택된 콘텐츠를 자동 분류하는 대상으로 정해진다.
또한, 예를 들면, 신착 콘텐츠(예를 들면, 신착의 영화, 프로그램, 악곡 등)에 관한 메타데이터, 또는 어떠한 추천 알고리즘에 의해 결정한 추천 콘텐츠에 관한 메타데이터가, 서버 기억부(251)로부터 클라이언트 기억부(223)에 송신되어 온 경우, 클라이언트 기억부(223)는, 송신되어 온 메타데이터를 기억함과 함께, 신착 또는 추천 콘텐츠가 있는 것을 나타내는 정보를 콘텐츠 자동 분류부(292)에 공급한다. 콘텐츠 자동 분류부(292)는, 그들 신착 또는 추천 콘텐츠를 자동 분류하는 대상으로 설정한다.
스텝 S106에서, 콘텐츠 자동 분류부(292)는, 콘텐츠를 자동 분류한다. 구체적으로는, 콘텐츠 자동 분류부(292)는, 콘텐츠 분류 룰에 기초하여, 스텝 S105에서 설정한 각 콘텐츠를 각 클래스에 분류하고, 분류한 결과를 나타내는 정보를 분류 결과 제시부(293)에 공급한다.
예를 들면, 콘텐츠 자동 분류부(292)는, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 그 콘텐츠가 갖는 메타데이터의 조합이, 조건부의 메타데이터의 조합을 포함하는 콘텐츠 분류 룰(이하, 콘텐츠에 적합한 콘텐츠 분류 룰이라고도 표현함)을 추출한다. 즉, 콘텐츠 자동 분류부(292)는, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 그 콘텐츠에 적합한 콘텐츠 분류 룰을 추출한다. 콘텐츠 자동 분류부(292)는, 추출된 콘텐츠 분류 룰을 결론부의 클래스마다 분류하고, 그 수를 집계한다. 콘텐츠 자동 분류부(292)는, 적합한 콘텐츠 분류 룰의 수가 최대로 되는 클래스에, 그 콘텐츠를 분류한다.
예를 들면, [BGM][사랑][여름][여흥][기분좋음][노스탤지어][댄스]의 7개의 메타데이터를 갖는 콘텐츠 X에 대하여 생각한 경우, 콘텐츠 X는, Rp1, Rp4, Rp7, Rb1, Rb8의 5개의 콘텐츠 분류 룰에 적합하다. 그리고, 적합한 콘텐츠 분류 룰의 수를, 결론부의 클래스마다 집계하면, 결론부가 「팝 음악」으로 되는 콘텐츠 분류 룰의 수가 3으로 되고, 결론부가 「발라드」로 되는 콘텐츠 분류 룰의 수가 2로 된다.
따라서, 이 경우, 결론부가 「팝 음악」으로 되는 콘텐츠 분류 룰의 수가 최대로 되기 때문에, 콘텐츠 X는 클래스 「팝 음악」으로 분류된다.
또한, 예를 들면, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 적합한 콘텐츠 분류 룰 중, 평가 지표가 최대로 되는 콘텐츠 분류 룰의 클래스에 그 콘텐츠를 분류하도록 하여도 된다.
예를 들면, 상술한 콘텐츠 X의 경우, 콘텐츠 X가 적합한 각 콘텐츠 분류 룰의 평가 지표는, 이하와 같이 된다.
EI(Rp1)=0.429
EI(Rp4)=0.333
EI(Rp7)=0.167
EI(Rb1)=0.267
EI(Rb8)=0.143
따라서, 이 경우, 콘텐츠 X는, 평가 지표가 최대의 0.429로 되는 콘텐츠 분 류 룰 Rp1의 결론부의 클래스 「팝 음악」으로 분류된다.
또한, 예를 들면, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 적합한 콘텐츠 분류 룰의 평가 지표를, 결론부의 클래스마다 집계하고, 평가 지표의 합계값이 최대로 되는 클래스에 그 콘텐츠를 분류하도록 하여도 된다.
예를 들면, 상술한 콘텐츠 X의 경우, 콘텐츠 X가 적합한 각 콘텐츠 분류 룰의 평가 지표를, 결론부의 클래스마다 집계하면, 이하와 같이 된다.
Figure 112007023229098-PCT00039
…(39)
Figure 112007023229098-PCT00040
…(40)
또한, ΣEI(Rp)는, 콘텐츠 X가 적합한 콘텐츠 분류 룰 중, 결론부가 클래스 「팝 음악」인 콘텐츠 분류 룰의 평가 지표의 합계값을 나타내고, ΣEI(Rb)는, 콘텐츠 X가 적합한 콘텐츠 분류 룰 중, 결론부가 클래스 「발라드」인 콘텐츠 분류 룰의 평가 지표의 합계값을 나타낸다.
따라서, 이 경우, 콘텐츠 X는, 평가 지표의 합계값이 최대로 되는 클래스 「팝 음악」으로 분류된다.
또한, 예를 들면, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 적합한 콘텐츠 분류 룰의 평가 지표의 평균값이 최대로 되는 클래스로 분류하도록 하여도 된다.
예를 들면, 상술한 콘텐츠 X의 경우, 콘텐츠 X가 적합한 콘텐츠 분류 룰의 평가 지표의, 결론부의 클래스마다의 평균값은, 이하와 같이 된다.
Figure 112007023229098-PCT00041
…(41)
Figure 112007023229098-PCT00042
…(42)
또한, EIav(Rp)는, 콘텐츠 X가 적합한 콘텐츠 분류 룰 중, 결론부가 클래스 「팝 음악」인 콘텐츠 분류 룰의 평가 지표의 평균값을 나타내고, EIav(Rp)는, 콘텐츠 X가 적합한 콘텐츠 분류 룰 중, 결론부가 클래스 「발라드」인 콘텐츠 분류 룰의 평가 지표의 평균값을 나타낸다.
따라서, 이 경우, 콘텐츠 X는, 평가 지표의 평균값이 최대로 되는 클래스 「팝 음악」으로 분류된다.
또한, 각 콘텐츠를 각각 단 1개의 클래스로 분류하는 것은 아니고, 각 콘텐츠를 1개 이상의 클래스로 분류함과 함께, 그 콘텐츠가 그 클래스에 적합한 정도를 나타내는 적합도를 설정하도록 하여도 된다.
예를 들면, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 적합한 콘텐츠 분류 룰의 결론부에 포함되는 모든 클래스에 콘텐츠를 분류하거나, 평가 지표의 합계값, 평가 지표의 평균값, 클래스 내에서의 평가 지표의 최대값 등이, 소정의 임계값 이상으로 되는 모든 클래스에 그 콘텐츠를 분류하도록 하여도 된다. 그리 고, 예를 들면, 콘텐츠가 분류된 각 클래스에 대하여, 적합한 콘텐츠 분류 룰 중 결론부가 그 클래스인 콘텐츠 분류 룰의 수, 또는 적합한 콘텐츠 분류 룰 중 결론부가 그 클래스인 콘텐츠 분류 룰의 평가 지표의 합계값, 평균값, 혹은, 최대값 등을 적합도로서 설정하도록 하여도 된다.
예를 들면, 상술한 콘텐츠 X의 경우, 적합한 콘텐츠 분류 룰의 결론부에 포함되는 「팝 음악」과 「발라드」의 양방의 클래스에 콘텐츠 X를 분류함과 함께, 클래스 「팝 음악」의 평가 지표의 합계값인 0.929를, 콘텐츠 X의 클래스 「팝 음악」에 대한 적합도로서 설정하고, 클래스 「발라드」의 평가 지표의 합계값인 0.410을, 콘텐츠 X의 클래스 「발라드」에 대한 적합도로서 설정하도록 하여도 된다.
스텝 S107에서, 분류 결과 제시부(293)는, 자동 분류의 결과를 제시한다. 구체적으로는, 분류 결과 제시부(293)는, 클라이언트 출력부(224)를 제어하여, 스텝 S106에서 콘텐츠를 자동 분류한 결과를 유저에게 제시한다.
예를 들면, 분류 결과 제시부(293)는, 클라이언트 출력부(224)를 제어하여, 이하의 정보를 표시시킨다.
콘텐츠 X:「팝 음악」키워드:BGM, 사랑, 여흥, 기분좋음
이에 의해, 유저는, 콘텐츠 X가, 메타데이터(지금의 경우, 유저에 대해서는 키워드로서 제시되어 있음)[BGM][사랑][여흥][기분좋음]에 기초하여, 그룹 「팝 음악」으로 분류된 것을 알 수 있다.
또한, 예를 들면, 콘텐츠 X를 실제로 분류하기 전에, 이 정보를 유저에게 제 시하고, 콘텐츠 X를 그룹 「팝 음악」으로 분류하는 것을 유저에게 추천하도록 하여도 된다.
또한, 각 콘텐츠가 갖는 메타데이터의 조합 중, 콘텐츠 분류 룰의 조건부와 일치하는 메타데이터의 조합에 포함되는 메타데이터, 및 조건부에 일치한 콘텐츠 분류 룰의 결론부의 클래스에 기초하여, 콘텐츠의 특징을 유저에게 제시하도록 하여도 된다. 예를 들면, 콘텐츠가 분류된 클래스명, 콘텐츠의 분류에 이용한 메타데이터에 기초하여, 콘텐츠의 특징을 유저에게 제시하도록 하여도 된다.
예를 들면, 상술한 콘텐츠 X의 경우, 분류 결과 제시부(293)는, 클라이언트 출력부(224)를 제어하여, 콘텐츠 X의 특징으로서, 이하의 정보를 표시시킨다.
콘텐츠 X:BGM풍의 「팝 음악」, 노스탤지어감이 있는 여름의 「발라드」
이에 의해, 유저는, 콘텐츠 X의 특징을, 용이하고 구체적으로 알 수 있다. 또한, 이 예는, 적합도를 설정하여, 1개 이상의 클래스에 콘텐츠를 분류하는 경우의 예를 나타내고 있다.
스텝 S108에서, 콘텐츠 자동 분류부(292)는, 자동 분류하는 콘텐츠를 변경하는지의 여부를 판정한다. 예를 들면, 유저가, 다른 콘텐츠를 자동 분류하고 싶다고 생각하고, 유저 입력부(221)를 통하여, 자동 분류하는 콘텐츠의 변경을 명령하는 정보를 입력한 경우, 유저 입력부(221)는, 취득한 정보를 콘텐츠 자동 분류부(292)에 공급한다. 콘텐츠 자동 분류부(292)는, 자동 분류하는 콘텐츠의 변경을 명령하는 정보를 취득한 경우, 자동 분류하는 콘텐츠를 변경한다고 판정하고, 처리는 스텝 S105로 되돌아간다. 그 후, 스텝 S108에서, 자동 분류하는 콘텐츠를 변경 하지 않는다고 판정될 때까지, 스텝 S105 내지 S108의 처리가 반복 실행되고, 유저에 의해 지정된 콘텐츠가 자동 분류된다.
스텝 S108에서, 자동 분류하는 콘텐츠를 변경하지 않는다고 판정된 경우, 처리는 스텝 S109로 진행한다.
스텝 S109에서, 콘텐츠 분류부(281)는, 상술한 도 4의 스텝 S6의 처리와 마찬가지로, 콘텐츠를 분류하는 시점을 변경하는지의 여부를 판정한다. 콘텐츠를 분류하는 시점을 변경한다고 판정된 경우, 처리는 스텝 S101로 되돌아가고, 그 후, 스텝 S109에서, 콘텐츠를 분류하는 시점을 변경하지 않는다고 판정될 때까지, 스텝 S101 내지 S109의 처리가 반복 실행된다. 즉, 새로운 시점(예를 들면, 좋고 싫음의 시점)에 기초하여, 콘텐츠가 자동 분류된다.
스텝 S109에서, 콘텐츠를 분류하는 시점을 변경하지 않는다고 판정된 경우, 콘텐츠 분류 처리는 종료한다.
이와 같이 하여, 메타데이터에 의존하지 않는 유저의 시점에 기초하여, 예를 들면, 상술한 좋고 싫음, 폴더 등의 시점에 기초하여, 유저가 콘텐츠를 분류하기 위한 메타데이터의 조건의 설정을 행하지 않고, 각 콘텐츠를 자동적으로 분류할 수 있다.
다음으로, 도 16의 플로우차트를 참조하여, 정보 처리 시스템(201)에 의해 실행되는 콘텐츠 분류 처리의 제2 실시 형태에 대하여 설명한다. 또한, 이 처리는, 예를 들면, 유저 입력부(221)를 통하여, 유저가 콘텐츠 분류 처리의 개시의 명령을 입력한 경우, 개시된다.
스텝 S151에서, 콘텐츠 분류부(281)는, 콘텐츠 분류 룰을 생성하는 시점을 선택한다. 구체적으로는, 콘텐츠 분류부(281)는, 아직 콘텐츠 분류 룰을 생성하지 않고 있는 시점 중 1개를 선택한다. 예를 들면, 상술한 도 14에 도시된 예의 경우, 유저의 좋고 싫음, 및 콘텐츠가 저장되어 있는 폴더의 2개의 시점 중, 아직 콘텐츠 분류 룰을 생성하지 않고 있는 시점이 1개 선택된다.
스텝 S152에서, 콘텐츠 분류부(281)는, 상술한 도 13의 스텝 S101과 마찬가지의 처리에 의해, 스텝 S151에서 선택한 시점에 기초하여, 콘텐츠를 복수의 클래스로 분류하고, 분류한 콘텐츠의 클래스에 관한 정보를 메타데이터 추출부(282)에 공급한다.
스텝 S153 내지 스텝 S155의 처리는, 상술한 도 13의 스텝 S102 내지 S104의 처리와 마찬가지로서, 그 설명은 반복되므로 생략하지만, 상술한 바와 같이, 이들 처리에 의해, 스텝 S151에서 선택된 시점에 대한, 콘텐츠 분류 룰이 생성됨과 함께, 각 콘텐츠 분류 룰에 대한 평가 지표가 산출된다.
스텝 S156에서, 콘텐츠 분류부(281)는, 모든 시점에 대하여 콘텐츠 분류 룰을 생성하였는지를 판정한다. 모든 시점에 대하여 콘텐츠 분류 룰을 생성하고 있지 않다고 판정된 경우, 처리는 스텝 S151로 되돌아가고, 스텝 S156에서, 모든 시점에 대하여 콘텐츠 분류 룰을 생성했다고 판정될 때까지, 스텝 S151 내지 S156의 처리가 반복 실행된다. 즉, 모든 시점에 대하여, 콘텐츠 분류 룰이 생성됨과 함께, 각 콘텐츠 분류 룰에 대한 평가 지표가 산출된다.
스텝 S156에서, 모든 시점에 대하여 콘텐츠 분류 룰이 생성되었다고 판정된 경우, 처리는 스텝 S157로 진행한다.
스텝 S157에서, 상술한 도 13의 스텝 S105의 처리와 마찬가지로, 자동 분류하는 콘텐츠가 설정된다.
스텝 S158에서, 콘텐츠 자동 분류부(292)는, 콘텐츠를 자동 분류한다. 구체적으로는, 예를 들면, 우선, 콘텐츠 자동 분류부(292)는, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 모든 콘텐츠 분류 룰 중에서, 그 콘텐츠에 적합한 콘텐츠 분류 룰을 추출한다. 콘텐츠 자동 분류부(292)는, 추출한 콘텐츠 분류 룰의 평가 지표를, 결론부의 클래스마다 집계한다.
다음으로, 콘텐츠 자동 분류부(292)는, 각 시점마다, 평가 지표의 합계값이 최대로 되는 클래스와 평가 지표의 합계값이 2번째로 큰 클래스 간의 평가 지표의 차를 산출하고, 산출한 차가 최대로 되는 시점, 즉, 그 콘텐츠의 특징이 가장 현저하게 나타나는 시점을 선택한다. 콘텐츠 자동 분류부(292)는, 선택한 시점에서의 클래스 중, 평가 지표의 합계값이 최대로 되는 클래스에, 그 콘텐츠를 분류한다.
또한, 예를 들면, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 시점에 관계없이, 적합한 콘텐츠 분류 룰의 평가 지표의 합계값, 평균값, 또는 최대값이 최대로 되는 클래스에 그 콘텐츠를 분류하도록 하여도 된다.
또한, 예를 들면, 자동 분류하는 대상으로 되는 각 콘텐츠에 대하여, 적합한 콘텐츠 분류 룰의 평가 지표의 합계값, 평균값, 또는 클래스 내에서의 평가 지표의 최대값이 소정의 임계값 이상으로 되는 모든 클래스에 그 콘텐츠를 분류함과 함께, 상술한 적합도를 설정하도록 하여도 된다. 이 경우, 1개의 콘텐츠가, 1개의 시점 내의 복수의 클래스에 속하거나, 복수의 시점의 클래스에 속하도록 분류되는 경우가 있다.
콘텐츠 자동 분류부(292)는, 각 콘텐츠를 분류한 결과를 나타내는 정보를 분류 결과 제시부(293)에 공급한다.
스텝 S159에서, 상술한 도 13의 스텝 S108의 처리와 마찬가지로, 자동 분류의 결과가 유저에게 제시된다.
스텝 S160에서, 상술한 도 13의 스텝 S109의 처리와 마찬가지로, 자동 분류하는 콘텐츠를 변경하는지의 여부가 판정된다. 자동 분류하는 콘텐츠를 변경한다고 판정된 경우, 처리는 스텝 S157로 되돌아가고, 스텝 S160에서, 자동 분류하는 콘텐츠를 변경하지 않는다고 판정될 때까지, 스텝 S157 내지 S160이 반복 실행된다.
스텝 S160에서, 콘텐츠를 분류하는 시점을 변경하지 않는다고 판정된 경우, 콘텐츠 분류 처리는 종료한다.
이와 같이 하여, 한번에 복수의 시점에 기초하여, 콘텐츠를 자동 분류할 수 있다.
이상과 같이, 각 요소의 특징을 나타내는 데이터가 각각 관련지어져 있는 복수의 요소를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 클래스에 속하는 각각의 요소에 대하여 요소에 관련지어져 있는 1개 이상의 데이터를 취출함으로써 구해지는 데이터의 모든 조합 중, 다른 클래스에 속하는 각각의 요소에 대하여 요소에 관련지어져 있는 1개 이상의 데이터를 취출함으로써 구해지는 데이 터의 조합에는 존재하지 않는 데이터의 조합을 추출하는 경우에는, 복수의 요소를 분류한 클래스의 특징을 추출할 수 있다. 또한, 복수의 요소를 분류한 클래스의 특징을 간단하고 또한 정확하게 추출할 수 있다.
또한, 이상의 설명에서는, 콘텐츠를 분류하는 시점을 1개로 하는 예를 나타냈지만, 2개 이상의 시점을 조합하도록 하여도 된다. 예를 들면, 도 5에 도시된 예를 이용하면, 유저의 좋고 싫음의 시점과 플레이 리스트 선택곡의 시점을 조합하여, 예를 들면, 유저가 좋아하고, 또한 플레이 리스트에 선택되어 있지 않은 콘텐츠가 속하는 클래스의 특징을 나타내는 메타데이터의 조합을 용이하게 추출할 수 있다.
또한, 복수의 시점을 조합하는 예로서, 콘텐츠를 관리하는 다층 구조의 디렉토리나 북 마크를, 콘텐츠를 분류하는 시점에 이용할 수 있다. 이 분류의 시점을 이용함으로써, 예를 들면, 유저가 행한 콘텐츠의 분류(디렉토리 또는 북 마크 등)의 입도나 상세도의 특징을 나타내는 메타데이터의 조합을 추출할 수 있다.
또한, 예를 들면, 콘텐츠가 속해 있는 디렉토리와, 유저의 좋고 싫음의 2개의 시점을 조합해서 분류한 클래스의 특징을 나타내는 메타데이터의 조합을 추출하는 것도 가능하다.
또한, 콘텐츠를 분류하는 시점이 증가해도, 콘텐츠를 복수의 클래스로 분류한 후의 처리에는 영향을 주지 않기 때문에, 도 4, 도 7, 도 10, 도 13, 또는 도 16을 참조하여 상술한 본 발명의 알고리즘을 그대로 적용할 수 있다. 또한, 콘텐츠를 분류하는 시점을 복수 조합함으로써, 유저의 기호 등을 보다 정밀하게 나타내 는 메타데이터의 조합을 추출할 수 있게 된다.
또한, 예를 들면, 메타데이터의 종류가 적은 경우, 또는 처리 능력이 높은 컴퓨터 등에 의해 처리를 행하는 경우, 클래스별 중요 메타데이터의 추출을 행하지 않도록 하여도 된다. 모든 메타데이터를 이용하여 메타데이터의 조합을 추출하는 경우, 클래스의 특징을 보다 정확하게 나타내는 메타데이터의 조합이 추출될 가능성이 높아진다.
또한, 이상의 설명에서는, 콘텐츠에 관련지어져 있는 메타데이터의 조합을 추출하는 예를 나타냈지만, 예를 들면, 임의의 학교의 클래스의 특징을, 각 클래스에 소속하는 생도에 관한 데이터(예를 들면, 성적, 신장, 체중 등)에 기초하여 추출하거나, 동일 상품을 제조하는 복수의 제조자의 특징을, 각 제조자가 제조하는 상품에 관한 데이터(예를 들면, 가격, 기능, 형태, 색 등)에 기초하여 추출하는 경우 등, 본 발명은, 각 요소의 특징을 나타내는 데이터가 관련지어져 있는 복수의 요소를 복수의 클래스로 분류하고, 각 요소가 갖는 데이터에 기초하여, 각 클래스의 특징을 추출하는 경우에 적용할 수 있다.
또한, 본 발명은, 예를 들면, 유저에게 콘텐츠나 상품 등을 추천하거나, 또는 콘텐츠나 상품 등을 분류한 클래스의 특징을 추출하거나 하는 장치나 시스템(예를 들면, 추천 시스템, 퍼스널 컴퓨터, 휴대 전화기, PDA(Personal Digital Assistant), 각종 AV(Audio Visual) 기기 등), 또는 소프트웨어 등에 적용할 수 있다.
예를 들면, 유저의 시청 이력을 학습하는 TV 프로그램 추천 기능을 갖는 장 치에 본 발명을 적용함으로써, 예를 들면, 추출된 탤런트 A와 버라이어티 프로그램이라는 메타데이터의 조합에 기초하여, 유저가 좋아하는 탤런트 A가 출연하는 버라이어티 프로그램을 추천하는 한편, 유저가 싫어하는 탤런트 A가 출연하는 노래 프로그램은 추천하지 않도록, 유저의 정밀한 기호 패턴에 기초하여, 유저에게 프로그램을 추천할 수 있음과 함께, 그 추천 이유를 제시하는 것이 가능해지고, 추천된 프로그램에 대한 유저의 수용도를 높일 수 있다.
또한, 예를 들면, 음악 플레이어와 제휴한 퍼스널 컴퓨터에서 실행되는 악곡 파일 열람 및 편집 소프트웨어에 본 발명을 적용함으로써, 플레이 리스트의 작성이나 열람 등의 조작에 따라서, 플레이 리스트의 특징을 나타내는 메타데이터의 조합을 유저에게 제시할 수 있으며, 파일을 열람하거나, 편집하거나 하는 작업을 쾌적하게 함과 함께, 그 작업을 행하는 즐거움을 줄 수 있다.
또한, 본 발명은, 예를 들면, 각종 콘텐츠를 분류하여 관리하는 장치나 시스템, 또는 소프트웨어 등에 적용할 수 있다. 예를 들면, 본 발명의 제2 실시 형태를 전자 메일의 소프트웨어에 적용함으로써, 종래의 메일의 발송인, 건명, 헤더 정보 등을 분류하는 조건으로서 설정하지 않고, 메일의 내용에 기초하여 자동적으로 메일을 분류할 수 있다.
상술한 일련의 처리는, 하드웨어에 의해 실행시킬 수도 있고, 소프트웨어에 의해 실행시킬 수도 있다. 일련의 처리를 소프트웨어에 의해 실행시키는 경우에는, 그 소프트웨어를 구성하는 프로그램이, 전용의 하드웨어에 조립되어 있는 컴퓨터, 또는 각종 프로그램을 인스톨함으로써, 각종 기능을 실행하는 것이 가능한, 예 를 들면 범용의 퍼스널 컴퓨터 등에, 프로그램 기록 매체로부터 인스톨된다.
도 17은, 상술한 일련의 처리를 프로그램에 의해 실행하는 퍼스널 컴퓨터의 구성의 예를 도시하는 블록도이다. CPU(Central Processing Unit)(901)는, ROM(Read Only Memory)(902), 또는 기록부(908)에 기억되어 있는 프로그램에 따라서 각종 처리를 실행한다. RAM(Random Access Memory)(903)에는, CPU(901)가 실행하는 프로그램이나 데이터 등이 적절히 기억된다. 이들 CPU(901), ROM(902), 및 RAM(903)은, 버스(904)에 의해 서로 접속되어 있다.
CPU(901)에는 또한, 버스(904)를 통해서 입출력 인터페이스(905)가 접속되어 있다. 입출력 인터페이스(905)에는, 키보드, 마우스, 마이크로폰 등으로 이루어지는 입력부(906), 디스플레이, 스피커 등으로 이루어지는 출력부(907)가 접속되어 있다. CPU(901)는, 입력부(906)로부터 입력되는 명령에 대응해서 각종 처리를 실행한다. 그리고, CPU(901)는, 처리의 결과를 출력부(907)에 출력한다.
입출력 인터페이스(905)에 접속되어 있는 기록부(908)는, 예를 들면 하드디스크로 이루어지고, CPU(901)가 실행하는 프로그램이나 각종 데이터를 기억한다. 통신부(909)는, 인터넷이나 로컬 에리어 네트워크 등의 네트워크를 통해서 외부의 장치와 통신한다.
또한, 통신부(909)를 통해서 프로그램을 취득하고, 기록부(908)에 기억하여도 된다.
입출력 인터페이스(905)에 접속되어 있는 드라이브(910)는, 자기 디스크, 광 디스크, 광 자기 디스크, 혹은 반도체 메모리 등의 리무버블 미디어(911)가 장착되 었을 때, 그들을 구동하고, 거기에 기록되어 있는 프로그램이나 데이터 등을 취득한다. 취득된 프로그램이나 데이터는, 필요에 따라 기록부(908)에 전송되고, 기억된다.
컴퓨터에 인스톨되고, 컴퓨터에 의해 실행 가능한 상태로 되는 프로그램을 저장하는 프로그램 기록 매체는, 도 17에 도시한 바와 같이, 자기 디스크(플렉시블 디스크를 포함함), 광 디스크(CD-ROM(Compact Disc-Read Only Memory), DVD(Digital Versatile Disc)를 포함함), 광 자기 디스크, 혹은 반도체 메모리 등으로 이루어지는 패키지 미디어인 리무버블 미디어(911), 또는 프로그램이 일시적 혹은 영속적으로 저장되는 ROM(902)이나, 기록부(908)를 구성하는 하드디스크 등에 의해 구성된다. 프로그램 기록 매체에의 프로그램의 저장은, 필요에 따라 라우터, 모뎀 등의 인터페이스인 통신부(909)를 통하여, 로컬 에리어 네트워크, 인터넷, 디지털 위성 방송 등의, 유선 또는 무선의 통신 매체를 이용하여 행해진다.
또한, 본 명세서에서, 프로그램 기록 매체에 저장되는 프로그램을 기술하는 스텝은, 기재된 순서를 따라 시계열적으로 행해지는 처리는 물론, 반드시 시계열적으로 처리되지 않더라도, 병렬적 혹은 개별로 실행되는 처리도 포함하는 것이다.
또한, 본 명세서에서, 시스템은, 복수의 장치에 의해 구성되는 장치 전체를 나타내는 것이다.
또한, 본 발명의 실시 형태는, 상술한 실시 형태에 한정되는 것은 아니고, 본 발명의 요지를 일탈하지 않는 범위에서 각종 변경이 가능하다.

Claims (18)

  1. 각 요소의 특징을 나타내는 데이터가 각각 관련지어져 있는 복수의 상기 요소를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 모든 조합 중, 다른 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 조합에는 존재하지 않는 상기 데이터의 조합을 추출하는 특징 추출 수단
    을 포함하는 정보 처리 장치.
  2. 제1항에 있어서,
    추출된 상기 데이터의 조합 중 1개 이상을 상기 클래스의 특징으로 하여 유저에게 제시하도록 상기 클래스의 특징의 제시를 제어하는 특징 제시 제어 수단
    을 더 포함하는 정보 처리 장치.
  3. 제1항에 있어서,
    상기 클래스에 속하는 상기 요소와 상기 데이터와의 제1 관련도, 및 다른 상기 클래스에 속하는 상기 요소와 상기 데이터와의 제2 관련도와 상기 제1 관련도와의 차이에 기초하여, 상기 클래스에 속하는 상기 요소의 특징을 보다 명확하게 나 타내고 있는 상기 데이터를, 상기 데이터의 조합을 추출하기 전에 추출하는 데이터 추출 수단
    을 더 포함하고,
    상기 특징 추출 수단은, 상기 데이터 추출 수단에 의해 추출된 상기 데이터의 조합을 추출하는 정보 처리 장치.
  4. 제3항에 있어서,
    상기 데이터 추출 수단은, 상기 제1 관련도, 및 상기 제2 관련도와 상기 제1 관련도와의 차이에 기초하여, 상기 클래스에서의 상기 데이터의 가중치를 구하고, 상기 가중치의 값이 상위인 소정의 수의 상기 데이터, 또는 상기 가중치의 값이 소정의 임계값 이상인 상기 데이터를 추출하는 정보 처리 장치.
  5. 제4항에 있어서,
    상기 데이터 추출 수단은, tfidf(term frequency with inverse document frequency), 상호 정보량, 정보 이득비, χ2승값, 또는 대수 우도비 중 어느 하나를 상기 클래스에서의 상기 데이터의 가중치로서 구하는 정보 처리 장치.
  6. 제1항에 있어서,
    추출된 상기 데이터의 조합에 기초하여, 상기 요소에 의해 구성되는 제1 그룹과는 서로 다른 제2 그룹에 속하는 요소 중에서, 상기 데이터의 조합이 추출된 상기 클래스에 속하는 상기 요소와 관련이 있는 요소를 추출하는 요소 추출 수단
    을 더 포함하는 정보 처리 장치.
  7. 제6항에 있어서,
    요소 추출 수단은, 추출된 상기 데이터의 조합을 포함하는 상기 데이터가 관련지어져 있는 상기 제2 그룹에 속하는 상기 요소를 추출하는 정보 처리 장치.
  8. 제6항에 있어서,
    추출된 상기 요소의 유저에의 제시를 제어하는 요소 제시 제어 수단
    을 더 포함하는 정보 처리 장치.
  9. 제8항에 있어서,
    상기 요소 제시 제어 수단은, 상기 요소를 추출한 근거로서, 상기 요소의 추출에 이용한 상기 데이터의 조합을 더 제시하도록 제어하는 정보 처리 장치.
  10. 제1항에 있어서,
    상기 요소는 콘텐츠이며, 상기 데이터는 상기 콘텐츠에 관한 메타데이터인 정보 처리 장치.
  11. 제1항에 있어서,
    추출된 상기 데이터의 조합과 상기 데이터의 조합이 추출된 상기 클래스인 추출 대상 클래스에 속하는 상기 요소와의 관련도를 나타내는 평가 지표를 산출하는 평가 지표 산출 수단
    을 더 포함하는 정보 처리 장치.
  12. 제11항에 있어서,
    상기 평가 지표 산출 수단은, 상기 추출 대상 클래스에 속하는 상기 요소 중, 상기 데이터의 조합을 포함하는 상기 데이터가 관련지어져 있는 상기 요소가 차지하는 비율인 재현율, 및 상기 데이터의 조합을 포함하는 상기 데이터가 관련지어져 있는 상기 요소 중, 상기 추출 대상 클래스에 속하는 상기 요소가 차지하는 비율인 적합율의 조화 평균인 F값을 상기 평가 지표로서 산출하는 정보 처리 장치.
  13. 제11항에 있어서,
    분류하는 대상으로 되는 요소에 관련지어져 있는 상기 데이터의 조합에 대한 상기 평가 지표에 기초하여, 상기 분류하는 대상으로 되는 요소를 상기 클래스에 분류하는 클래스 분류 수단
    을 더 포함하는 정보 처리 장치.
  14. 제1항에 있어서,
    분류하는 대상으로 되는 요소에 관련지어져 있는 상기 데이터의 조합 중, 각 각의 상기 클래스로부터 추출된 상기 데이터의 조합에 일치하는 수에 기초하여, 상기 분류하는 대상으로 되는 요소를 상기 클래스에 분류하는 클래스 분류 수단
    을 더 포함하는 정보 처리 장치.
  15. 제1항에 있어서,
    특징을 제시하는 대상으로 되는 요소에 관련지어져 있는 상기 데이터의 조합 중, 각각의 상기 클래스로부터 추출된 상기 데이터의 조합에 일치하는 상기 데이터의 조합에 포함되는 상기 데이터, 및 일치하는 상기 데이터의 조합이 추출된 상기 클래스에 기초하여, 상기 특징을 제시하는 대상으로 되는 요소의 특징을 제시하는 특징 제시 수단
    을 더 포함하는 정보 처리 장치.
  16. 각 요소의 특징을 나타내는 데이터가 각각 관련지어져 있는 복수의 상기 요소를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 모든 조합 중, 다른 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 조합에는 존재하지 않는 상기 데이터의 조합을 추출하는
    스텝을 포함하는 특징 추출 방법.
  17. 각 요소의 특징을 나타내는 데이터가 각각 관련지어져 있는 복수의 상기 요소를 분류한 클래스의 특징으로서, 특징을 추출하는 대상으로 되는 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 모든 조합 중, 다른 상기 클래스에 속하는 각각의 상기 요소에 대하여 상기 요소에 관련지어져 있는 1개 이상의 상기 데이터를 취출함으로써 구해지는 상기 데이터의 조합에는 존재하지 않는 상기 데이터의 조합을 추출하는 스텝
    을 컴퓨터에 실행시키는 프로그램.
  18. 제17항의 프로그램이 기록되어 있는 기록 매체.
KR1020077006744A 2005-07-26 2006-07-24 정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램 KR20080031148A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JPJP-P-2005-00215906 2005-07-26
JP2005215906 2005-07-26
JPJP-P-2006-00162419 2006-06-12
JP2006162419A JP2007058842A (ja) 2005-07-26 2006-06-12 情報処理装置、特徴抽出方法、記録媒体、および、プログラム

Publications (1)

Publication Number Publication Date
KR20080031148A true KR20080031148A (ko) 2008-04-08

Family

ID=37683287

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077006744A KR20080031148A (ko) 2005-07-26 2006-07-24 정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램

Country Status (4)

Country Link
EP (1) EP1909194A4 (ko)
JP (1) JP2007058842A (ko)
KR (1) KR20080031148A (ko)
WO (1) WO2007013390A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012128435A1 (en) * 2011-03-22 2012-09-27 Industry Academic Cooperation Foundation Keimyung University Significance parameter extraction method and its clinical decision support system for differential diagnosis of abdominal diseases based on entropy rough approximation technology
KR101280780B1 (ko) * 2011-06-30 2013-07-05 라쿠텐 인코포레이티드 평가 정보 특정 장치, 평가 정보 특정 방법, 평가 정보 특정 프로그램 및 그 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체
KR20150103443A (ko) 2014-03-03 2015-09-11 에스케이플래닛 주식회사 멀티클래스 분류 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR20220111602A (ko) * 2021-02-02 2022-08-09 주식회사 키리콘 컨텐츠를 분류 후 사용자에게 추천하는 방법 및 시스템

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4965322B2 (ja) * 2007-04-17 2012-07-04 日本電信電話株式会社 ユーザ支援方法、ユーザ支援装置およびユーザ支援プログラム
US9269090B2 (en) 2008-08-18 2016-02-23 Nokia Technologies Oy Method, apparatus and computer program product for providing indications regarding recommended content
JP4650552B2 (ja) 2008-10-14 2011-03-16 ソニー株式会社 電子機器、コンテンツ推薦方法及びプログラム
JP5545883B2 (ja) * 2011-05-16 2014-07-09 日本電信電話株式会社 推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラム
JP2013033376A (ja) 2011-08-02 2013-02-14 Sony Corp 情報処理装置、情報処理方法、および、プログラム
CN105812844B (zh) * 2014-12-29 2019-02-26 深圳市Tcl高新技术开发有限公司 一种电视的用户广告推送方法及系统
CN107251019A (zh) * 2015-02-23 2017-10-13 索尼公司 信息处理装置、信息处理方法和程序
JP7288319B2 (ja) * 2019-03-14 2023-06-07 株式会社radiko レコメンド情報を生成するための装置、方法、システム及びプログラム
CN111695353B (zh) * 2020-06-12 2023-07-04 百度在线网络技术(北京)有限公司 时效性文本的识别方法、装置、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3096353B2 (ja) * 1992-04-22 2000-10-10 株式会社戸上電機製作所 データの分類方法
JP3884520B2 (ja) * 1996-04-01 2007-02-21 富士通株式会社 非関連属性除去装置及び非関連属性を除去するプログログラムを格納した記憶媒体
JPH11259509A (ja) * 1998-03-12 1999-09-24 Hitachi Ltd 情報検索分類方法および情報検索分類システム
US20020165839A1 (en) * 2001-03-14 2002-11-07 Taylor Kevin M. Segmentation and construction of segmentation classifiers
JP3975768B2 (ja) * 2002-02-13 2007-09-12 松下電器産業株式会社 コンテンツ推薦装置、コンテンツ推薦方法、そのプログラム、および、そのプログラム記憶媒体
DE10210553B4 (de) * 2002-03-09 2004-08-26 Xtramind Technologies Gmbh Verfahren zum automatischen Klassifizieren eines Textes durch ein Computersystem
JP2005107688A (ja) * 2003-09-29 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> 情報表示方法及びシステム及び情報表示プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012128435A1 (en) * 2011-03-22 2012-09-27 Industry Academic Cooperation Foundation Keimyung University Significance parameter extraction method and its clinical decision support system for differential diagnosis of abdominal diseases based on entropy rough approximation technology
KR101280780B1 (ko) * 2011-06-30 2013-07-05 라쿠텐 인코포레이티드 평가 정보 특정 장치, 평가 정보 특정 방법, 평가 정보 특정 프로그램 및 그 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체
KR20150103443A (ko) 2014-03-03 2015-09-11 에스케이플래닛 주식회사 멀티클래스 분류 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR20220111602A (ko) * 2021-02-02 2022-08-09 주식회사 키리콘 컨텐츠를 분류 후 사용자에게 추천하는 방법 및 시스템

Also Published As

Publication number Publication date
EP1909194A4 (en) 2009-09-02
EP1909194A1 (en) 2008-04-09
WO2007013390A1 (ja) 2007-02-01
JP2007058842A (ja) 2007-03-08

Similar Documents

Publication Publication Date Title
KR20080031148A (ko) 정보 처리 장치, 특징 추출 방법, 기록 매체, 및 프로그램
US8611676B2 (en) Information processing apparatus, feature extraction method, recording media, and program
US8887058B2 (en) Media management for multi-user group
US8386935B2 (en) Content summary and segment creation
US8862691B2 (en) Media aggregation and presentation
US8463717B2 (en) Method and apparatus for predicting preference rating for content, and method and apparatus for selecting sample content
US7849092B2 (en) System and method for identifying similar media objects
US20090049082A1 (en) System and method for identifying similar media objects
WO2011136128A1 (ja) アイテム選択装置、アイテム選択方法、およびアイテム選択用プログラム
US20090089265A1 (en) Information processing apparatus, information processing method, and program
US20090055376A1 (en) System and method for identifying similar media objects
JP2011138197A (ja) 情報処理装置、関連度評価方法及びプログラム
JP2008165759A (ja) 情報処理装置及び方法並びにプログラム
JP5395729B2 (ja) 情報提示装置
JP4370850B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN102187338A (zh) 基于相似性数据的播放列表产生系统和方法
JP2010061600A (ja) 推薦装置および方法、プログラム、並びに記録媒体
US20090144226A1 (en) Information processing device and method, and program
US20130024547A1 (en) Information processing apparatus, information processing system, information processing method, and program
JPWO2010010654A1 (ja) 使い方推定装置
WO2011101527A1 (en) Method for providing a recommendation to a user
US9325754B2 (en) Information processing device and information processing method
JP2011145742A (ja) 情報処理装置、情報処理方法、およびプログラム
JP4253532B2 (ja) 情報推薦装置、情報推薦プログラム及び記録媒体
KR102386817B1 (ko) 사용자 선호 기반 음악 정렬 장치 및 이에 적용되는 단말기

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application