CN101044484A - 信息处理装置、方法以及程序 - Google Patents
信息处理装置、方法以及程序 Download PDFInfo
- Publication number
- CN101044484A CN101044484A CNA2006800008473A CN200680000847A CN101044484A CN 101044484 A CN101044484 A CN 101044484A CN A2006800008473 A CNA2006800008473 A CN A2006800008473A CN 200680000847 A CN200680000847 A CN 200680000847A CN 101044484 A CN101044484 A CN 101044484A
- Authority
- CN
- China
- Prior art keywords
- bunch
- melody
- content
- mentioned
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 title abstract description 151
- 238000003672 processing method Methods 0.000 claims abstract description 9
- 230000033764 rhythmic process Effects 0.000 claims abstract description 7
- 239000000203 mixture Substances 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 36
- 230000003750 conditioning effect Effects 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 23
- 238000009877 rendering Methods 0.000 claims description 7
- 101710114762 50S ribosomal protein L11, chloroplastic Proteins 0.000 abstract description 15
- 238000000605 extraction Methods 0.000 description 70
- 238000010586 diagram Methods 0.000 description 22
- 238000013507 mapping Methods 0.000 description 16
- 101710156159 50S ribosomal protein L21, chloroplastic Proteins 0.000 description 12
- 101710082414 50S ribosomal protein L12, chloroplastic Proteins 0.000 description 11
- 101710115003 50S ribosomal protein L31, chloroplastic Proteins 0.000 description 11
- 101710164994 50S ribosomal protein L13, chloroplastic Proteins 0.000 description 10
- 101710087140 50S ribosomal protein L22, chloroplastic Proteins 0.000 description 10
- 101710118399 50S ribosomal protein L24, chloroplastic Proteins 0.000 description 10
- 101100328077 Bos taurus CL43 gene Proteins 0.000 description 10
- 239000006185 dispersion Substances 0.000 description 9
- 238000002203 pretreatment Methods 0.000 description 6
- 239000012141 concentrate Substances 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 239000011435 rock Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006854 communication Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000001020 rhythmical effect Effects 0.000 description 2
- 101710142585 50S ribosomal protein 6, chloroplastic Proteins 0.000 description 1
- 101000725126 Spinacia oleracea 50S ribosomal protein L35, chloroplastic Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明涉及一种能够以更少的运算量对符合用户爱好信息的内容或与所指定的内容类似的内容进行检索并呈现给用户的信息处理装置、信息处理方法以及程序。将乐曲的元数据的各项目(标题、艺术家名、类型、查看文本、速度、拍子、节奏等)分类到簇层(第1至第n层)中的任一个,将各项目的实际信息分类(分簇)到设置在所分类的簇层的多个簇中的任一个。然后,代替元数据而作为表示乐曲特征的信息,对由将元数据的各项目的实际信息分类的簇的簇ID(图2中的CL11等)构成的簇信息进行数据库化。本发明可在建议购买像乐曲数据之类的内容的主页服务器、推荐电视节目的录像预约的录影机等中应用。
Description
技术领域
本发明涉及一种信息处理装置、信息处理方法以及程序,特别是涉及一种将内容分类到簇,使用内容所分类的簇来管理内容的特征,并在内容的检索、推荐中利用的信息处理装置、信息处理方法以及程序。
背景技术
以往,提出了用于根据用户的爱好来检索电视节目、乐曲等的内容并推荐给用户(所谓的内容个性化)的发明(例如参照专利文献1)。
在内容个性化中广泛地使用称为基于内容的过滤(CBF)的方法。在CBF方法中,将由发行方、销售方对内容预先赋予的元数据直接利用于爱好的提取、内容的推荐中。例如,在内容为乐曲的情况下,在各乐曲中作为元数据预先赋予标题、艺术家名、类型、查看文本等。除了预先赋予的信息之外,也有检测出乐曲的速度、节奏等而添加元数据的情况。
以往将乐曲的元数据看作特征向量,根据用户对乐曲的操作(播放、录音、跳过、删除等)对乐曲的特征向量进行求和,由此生成用户的爱好信息。例如,将所播放的乐曲的特征向量设为1倍、将录音的乐曲的特征向量设为2倍、将跳过的乐曲的特征向量设为-1倍、将删除的乐曲的特征向量设为-2倍,从而进行求和。
在推荐符合用户爱好的乐曲的情况下,算出表示用户爱好的特征向量与成为候补的各乐曲的特征向量之间的距离(余弦相关等),将算出的距离短的乐曲作为符合用户爱好的乐曲而进行推荐。
专利文献1:日本特开2004-194107号公报
发明内容
发明要解决的问题
然而,如上所述,在根据对乐曲的爱好向量进行求和来生成用户的爱好信息的情况下,爱好的特征会被埋没,产生所谓的由爱好的求和导致的舍入问题,导致推荐不符合用户爱好的乐曲。
例如,在用户喜欢快速、有节奏的摇滚乐曲,且还喜欢慢速、慢拍子的爵士乐的乐曲的情况下,当对这两个爱好求和时,快速和慢速、有节奏的和慢拍子、摇滚和爵士乐中的任何一个都成为爱好,存在推荐不符合用户爱好的快速的爵士乐的乐曲的可能性。
另外,通常对乐曲的元数据中的由数值表现的元数据进行额定标准化而作为特征向量的元素,但是在这种情况下,还有如下的问题:额定标准化时在阈值两侧的两个值分别变换成不同的值,导致变换前的两个值失去在数值上接近的关系。
而且,在计算表示用户爱好的特征向量与成为候补的各乐曲的特征向量之间的距离时,希望减少该计算量。
本发明鉴于这种状况而完成的,能够以更少的运算量对符合用户的爱好信息的内容或者与所指定的内容类似的内容进行检索,从而呈现给用户。
用于解决问题的手段
本发明一个侧面的信息处理装置,从内容群中选择满足规定条件的内容,其特征在于,包括:内容分类单元,其将构成上述内容群的各内容,分别在与内容的元数据相应的层次中分类到多个第1簇中的任一个;保持单元,其保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述第1簇之间的对应关系;确定单元,其对每个上述层次指定与上述规定条件对应的上述第1簇,确定与所指定的上述第1簇对应的内容;以及呈现单元,其呈现由上述确定单元确定的上述内容。
还包括存储单元,该存储单元将由上述内容分类单元对上述内容所分类的各第1簇、与表示用户的爱好程度的爱好值相对应地进行存储,在上述确定单元中,可根据由上述存储单元存储的爱好值来指定上述第1簇,确定与所指定的上述第1簇对应的内容。
在上述确定单元中,从与所指定的上述第1簇对应的内容中,以根据与上述爱好值相应的每个层次的权重进行了加权的、表示用户的内容爱好程度的评价值,可进一步确定内容。
还设置有:设定单元,其对由上述内容分类单元对上述内容所分类的各第1簇,设定关键词;以及生成单元,其使用由上述设定单元设定的关键词,生成表示内容呈现理由的理由文,在上述呈现单元中还可呈现上述理由文。
上述内容是乐曲,在上述元数据中可包括上述乐曲的速度、拍子或者节奏中的至少一个。
在上述元数据中可包括针对对应的内容的查看文本。
还包括元数据分类单元,该元数据分类单元将内容的元数据分类到多个第2簇的任一个,向第2簇分配上述层次,在上述内容分类单元中可在分配的上述各层次中分别将各内容分类到多个第1簇的任一个。
在上述确定单元中,可以从与成为类似源的内容所被分类的上述第1簇对应的内容中,利用表示与成为类似源的内容之间的类似程度的类似度,进一步确定内容。
在上述确定单元中,可利用根据与成为类似源的内容归属到上述第1簇的权重相应的每个层次的权重进行了加权的上述类似度,确定内容。
本发明一个侧面的信息处理方法,是从内容群中选择满足规定条件的内容的信息处理装置的信息处理方法,其特征在于,包括:分类步骤,将构成上述内容群的各内容,分别在与内容的元数据相应的层次中分类到多个簇中的任一个;保持步骤,保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述簇之间的对应关系;确定步骤,对每个上述层次指定与上述规定条件对应的上述簇,确定与所指定的上述簇对应的内容;以及呈现步骤,呈现所确定的上述内容。
本发明一个侧面的程序,是用于从内容群中选择满足规定条件的内容的程序,其特征在于,使计算机执行包括以下步骤的处理:分类步骤,将构成上述内容群的各内容,分别在与内容的元数据相应的层次中分类到多个簇中的任一个;保持步骤,保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述簇之间的对应关系;确定步骤,对每个上述层次指定与上述规定条件对应的上述簇,确定与所指定的上述簇对应的内容;以及呈现步骤,呈现所确定的上述内容。
在本发明一个侧面中,将构成内容群的各内容分别在与内容的元数据相应的层次中分类到多个簇中的任一个,保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述簇之间的对应关系,对每个上述层次指定与上述规定条件对应的上述簇,确定与所指定的上述簇对应的内容,呈现确定的上述内容。
发明的效果
根据本发明,能够以更少的运算量对符合用户爱好信息的内容或者与所指定的内容类似的内容进行检索,并呈现给用户。
附图说明
图1是表示应用本发明的推荐系统的结构例的框图。
图2是表示将元数据分类的簇和簇层的概念的图。
图3是表示簇信息的一例的图。
图4是表示簇-乐曲ID信息的一例的图。
图5是表示爱好信息的一例的图。
图6是用于说明从分簇第1至第4方法中选择两种方法的方法的图。
图7是用于说明从分簇第1至第4方法中选择两种方法的方法的图。
图8是用于说明从分簇第1至第4方法中选择两种方法的方法的图。
图9是用于说明从分簇第1至第4方法中选择两种方法的方法的图。
图10是用于说明从分簇第1至第4方法中选择两种方法的方法的图。
图11是说明第1类似乐曲检索处理的流程图。
图12是说明第2类似乐曲检索处理的流程图。
图13是说明第3类似乐曲检索处理的流程图。
图14是说明第1乐曲推荐处理的流程图。
图15是说明第2乐曲推荐处理的流程图。
图16是表示通用个人计算机的结构例的框图。
图17是表示本发明一个实施方式的推荐系统的其他结构例的框图。
图18是说明脱机时的前处理的示例的流程图。
图19是表示被软分簇的各乐曲的元数据的示例的图。
图20是表示各乐曲的元数据的示例的图。
图21是表示簇信息的示例的图。
图22是说明第4类似乐曲检索处理的流程图。
图23是表示簇信息的示例的图。
图24是表示类似度的示例的图。
图25是说明第5类似乐曲检索处理的流程图。
图26是说明第3乐曲推荐处理的流程图。
图27是表示爱好值的示例的图。
图28是表示簇信息的示例的图。
图29是表示类似度的示例的图。
图30是表示权重的示例的图。
图31是表示类似度的示例的图。
图32是说明第4乐曲推荐处理的流程图。
图33是表示爱好值的示例的图。
图34是表示类似度的示例的图。
附图标记说明
1:推荐系统;11:乐曲数据库;12:分簇部;13:关键词设定部;14:簇信息数据库;21:检索乐曲指定部;22:簇映射部;23:乐曲提取部;24:爱好信息数据库;25:爱好输入部;26:随机选择部;27:类似度算出部;28:选择理由生成部;29:乐曲呈现部;201:元数据分簇部;202:乐曲分簇部。
具体实施方式
下面,参照附图详细说明应用本发明的具体实施方式。
图1示出了作为本发明一个实施方式的推荐系统的结构例。该推荐系统1检索符合用户爱好的乐曲、或者与用户所指定的乐曲类似的乐曲,并呈现给用户。此外,推荐系统1也可应用于推荐乐曲以外的内容、例如推荐电视节目、电影、书籍等的情况。
推荐系统1由以下部分构成:乐曲数据库(DB)11,其记录有成为检索对象的数量多的乐曲的元数据;分簇部12,其根据乐曲的元数据将记录在乐曲数据库11中的各乐曲进行分簇从而生成各乐曲的簇信息;关键词设定部13,其设定分别表示各簇层及各簇的特征的关键词;以及簇信息数据库(DB)14,其保持各乐曲的簇信息。
并且,推荐系统1由以下部分构成:检索乐曲指定部21,其指定成为要检索的乐曲的类似源的乐曲(以下称为源乐曲);簇映射部22,其使用从以往就有的簇识别方法(分类方法),将源乐曲的元数据映射到最佳簇;乐曲提取部23,其提取一个以上的呈现给用户的乐曲;爱好信息数据库(DB)24,其记录有表示用户爱好的爱好信息;爱好输入部25,其输入用户的爱好;随机选择部26,其从所提取的乐曲中随机选择一个乐曲;类似度算出部27,其算出所提取的乐曲与源乐曲或用户爱好的类似度,选择类似度最高的乐曲;选择理由生成部28,其生成表示随机选择部26或者类似度算出部27中的选择的理由的选择理由文;以及乐曲呈现部29,向用户呈现所选择的乐曲和选择理由文。
乐曲数据库(DB)11相当于提供收录在音乐CD中的乐曲元数据的网络上的数据服务器即CDDB(CD Data Base:CD数据库)、Music Navi等。
分簇部12对乐曲数据库11的全部乐曲,将乐曲的元数据的各项目(标题、艺术家名、类型、查看文本、速度、拍子、节奏等)分类到如图2所示的簇层(第1至n层)中的任一个,将乐曲分类(分簇)到在将各项目的实际信息分类后的簇层中设置的多个簇中的任一个。
此外,也可以将一个乐曲分类到多个簇。假设在相同的簇层中存在的簇间的距离(表示类似程度)已知。关于该分簇的方法在后面叙述。并且,代替元数据,作为表示乐曲特征的信息,生成由将元数据的各项目的实际信息分类后的簇的簇ID(图2中的CL11等)构成的簇信息,输出到簇信息数据库14。
此外,当不存在适合分类的簇的情况下,也可以新设定簇。各簇的大小是任意的、可包含多个乐曲。此外,也可以设置只能分类单一乐曲的簇。在这种情况下,也可以对该簇的簇ID使用可唯一分类的乐曲的实际信息的ID(艺术家名ID、专辑ID、标题ID)。
簇信息数据库14保持着通过分簇部12生成的各乐曲的簇信息。另外,簇信息数据库14根据保持的簇信息,生成表示元数据被分类到各簇中的乐曲的乐曲ID的簇-乐曲ID信息,并将其保持。而且,簇信息数据库14还保持着由关键词设定部13对所设定的各簇层、各簇进行设定的关键词。
图3示出了簇信息的一例。在该图中,示出了例如乐曲ID=ABC123的乐曲的簇信息是(CL12,CL21,CL35,CL47、CL52,…,CLn2)。另外,示出了例如乐曲ID=CTH863的乐曲的簇信息是簇ID(CL11,CL25,CL31,CL42,CL53,…,CLn1)。
图4示出了与图3所示的簇信息对应的簇-乐曲ID信息的一例。在该图中,示出了例如乐曲ID=CTH863与簇ID=CL11对应。另外,示出了例如乐曲ID=ABC123与簇ID=CL21对应。
此外,需要在执行类似乐曲检索处理、乐曲推荐处理(后面叙述)之前预先执行分簇部12、关键词设定部13、以及簇信息数据库14的处理。
返回图1。检索乐曲指定部21向簇映射部22输出由用户指定的源乐曲的乐曲ID和元数据。簇映射部22使用现有的簇识别方法(分类方法),对从检索乐曲指定部21输入的源乐曲的元数据选择最佳簇。作为簇识别方法,可应用k-Nearest-Neighbor法等。此外,在簇信息数据库14中已经存在源乐曲的簇信息的情况下,也可以将其读出并提供给乐曲提取部23。
乐曲提取部23根据从簇映射部22提供的源乐曲的簇信息,参照簇信息数据库14,获取与源乐曲分类为相同簇的乐曲的乐曲ID并提供给随机选择部26或者类似度算出部27。另外,乐曲提取部23根据爱好信息数据库24的爱好信息,参照簇信息数据库14,获取符合用户爱好的乐曲的乐曲ID并提供给随机选择部26或者类似度算出部27。
爱好信息数据库24记录有表示用户爱好的爱好信息。在爱好信息中记录有表示用户对各簇的爱好程度的爱好值。该爱好值是被标准化的值,由爱好输入部25进行更新。另外,爱好信息数据库24运算各簇层中的爱好值的分散,检测出爱好值的分散最小(即,用户的爱好集中在特定的簇中)的簇层。
图5示出了爱好信息的一例。在该图中,例如示出了对簇CL11的爱好值为0.5的情形。另外,示出了例如对簇CL32的爱好值为0.1的情形。
爱好输入部25根据用户对乐曲的操作(播放、录音、跳过、删除等),更新分别对应于各簇的爱好值。另外,爱好输入部25根据来自用户的设定,向簇信息数据库14通知用户重视的簇层。
随机选择部26从由乐曲提取部23提取的乐曲之中,随机选择一个乐曲ID并输出到选择理由生成部28。类似度算出部27算出由乐曲提取部23提取的乐曲与源乐曲或用户爱好之间的类似度,选择类似度最高的乐曲并输出到选择理由生成部28。此外,随机选择部26和类似度算出部27,不需要双方都进行动作,而只要任一方进行动作即可。
选择理由生成部28从簇信息数据库14获取对应于簇层、簇的关键词,使用所获取的关键词等而生成表示选择理由的选择理由文,并与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29。
如下生成选择理由文。例如,当选择类似的乐曲、符合爱好的乐曲时,使用对优先的簇层中设定的关键词、簇的关键词。具体地说,在使对应于查看文本的簇层最优先的情况下,生成“不是喜欢在查看文本中出现的‘夏天’、‘海边’吗?”等的选择理由文。或者,将所选择的乐曲的查看文本直接作为选择理由文而引用、或者使用从所选择的乐曲的查看文本中提取的单词来生成选择理由文。此外,当从查看文本中提取使用于选择理由文的单词时,可应用Tf/idf法。
乐曲呈现部29由例如显示器等构成,向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文。
接着,说明分簇部12的元数据的分类(分簇)。
分簇方法可以是任何方法,但是对每个簇层选择最佳的分簇方法、距离尺度。例如,如果元数据的实际信息是数值,则直接使用该数值,在标题等的情况下使用主成分分析等数量化方法设为数值,定义欧几里德距离等的距离尺度来进行分簇。作为代表性的分簇方法,可以举出K-means法、层次分簇法等。
此时,最好实施反映爱好距离的分簇(例如带制约的分簇)。为此,通过预先调查制作部分正解集(接近爱好的实际信息的集合、不接近爱好的实际信息的集合等),使用适合它的数值表现、距离、分簇方法。另外,还希望选择使形成的各簇层的独立性变高的分簇方法(即,特性不同的分簇方法)。
参照图6至图10,说明例如从4种分簇方法(以下称为第1至第4方法)中选择特性不同的2种分簇方法的方法。
首先,根据第1至第4方法,对元数据的实际信息即艺术家A至J进行分簇。然后,假设得到如图6所示的结果。
即,通过第1方法将艺术家A至C分簇到簇CL1,将艺术家D至G分簇到簇CL2,将艺术家H至J分簇到簇CL3;通过第2方法将艺术家A、B分簇到簇CL1,将艺术家C至F分簇到簇CL2,将艺术家G至J分簇到簇CL3;通过第3方法将艺术家A、D、G、J分簇到簇CL1,将艺术家B、E、H分簇到簇CL2,将艺术家C、F、I分簇到簇CL3;通过第4方法将艺术家D、I、J分簇到簇CL1,将艺术家E至G分簇到簇CL2,将艺术家A至C以及H分簇到簇CL3。
在这种情况下,第1至第4方法的结果的重复率(%)如图7所示。即,第1方法与第2方法的重复率为0.8,第1方法与第3方法的重复率为0.3,第1方法与第4方法的重复率为0.4,第2方法与第3方法的重复率为0.3,第2方法与第4方法的重复率为0.3,第3方法与第4方法的重复率为0.4。
认为图7所示的重复率越小,两个方法的特性越不同,因此最好采用重复率为最小值0.3的第1方法和第3方法的组合、第2方法和第3方法的组合、或者第2方法和第4方法的组合。
另一方面,假设在由用户自身判断是否应该将艺术家A至J中的两人分类到相同的簇的情况下,得到了如图8所示的结果。其中,在该图中,1表示应该分类到相同的簇、0表示应该分类到不同的簇。即,在该图中,例如示出了判断为应该将艺术家A分类到与艺术家B、C、F、H、I相同的簇,示出了应该将艺术家B分类到与艺术家C、D、E、J相同的簇。
如果假设图8所示的结果是作为正解的理想的分簇结果,则上述的第1至第4方法的正解率如图9所示。即,第1方法的正解率为62.2%,第2方法的正解率为55.6%,第3方法的正解率为40.0%,第4方法的正解率为66.7%。
因而,如果重视正解率,则最好采用正解率高的第1方法和第4方法的组合。
并且,如果为了求出考虑重复率和正解率的分簇方法的组合,算出第1至第4方法的正解的重复率,则成为如图10所示。根据图9所示的结果确定正解率非常低的方法,只要采用在不包含所确定的该方法的组合之中正解率的重复率最低的组合即可。即,确定第3方法作为正解率非常低的方法,作为不包含第3方法的组合之中的正解的重复率最低的方法而选择第2方法和第4方法的组合。
此外,既可以关于上述的重复率、正解率,指定绝对的阈值,排除无法满足该阈值的方法,也可以为了采用平衡性好的方法,根据两个指标(重复率和正解率)例如制作如下所示的2个示例那样的综合指标,并根据综合指标来选择分簇方法的组合。
综合指标=正解率×(1-重复率)
综合指标=α·正解率×β(1-重复率)(α,β是规定的系数)
接着,说明呈现与源乐曲类似的乐曲的3种类似乐曲检索处理和呈现符合用户爱好的乐曲的2种乐曲推荐处理。
此外,作为进行以下说明的类似乐曲检索处理、乐曲推荐处理的前处理,分簇部12、关键词设定部13、以及簇信息数据库14进行动作,已经在簇信息数据库14中保持着由分簇部12生成的各乐曲的簇信息、由簇信息数据库14生成的簇-乐曲ID信息、以及由关键词设定部13对各簇层、各簇设定的关键词。
首先,说明类似乐曲检索处理。
图11是说明第1类似乐曲检索处理的流程图。作为第1类似乐曲检索处理的前处理,簇信息数据库14根据从爱好输入部25输入的、用户对各簇层的优先级,从优先级别高的簇层起,依次重新分配1,2,…,n的层编号。
在步骤S1中,检索乐曲指定部21向簇映射部22输出由用户指定的源乐曲的乐曲ID和元数据。簇映射部22使用以往的簇识别方法,将输入的源乐曲的元数据映射到最佳簇,将该结果(以下称为最佳簇信息)提供给乐曲提取部23。
在步骤S2中,乐曲提取部23参照簇信息数据库14,设想集合C,该集合C是将在簇信息数据库14中保存着簇信息的全部乐曲的乐曲ID设为元素的集合。在步骤S3中,乐曲提取部23将层编号i初始化为1。
在步骤S4中,乐曲提取部23判断层编号i是否为n(n是簇层的总数)以下。在判断为层编号i是n以下的情况下,处理进入步骤S5。在步骤S5中,乐曲提取部23根据从簇映射部22输入的源乐曲的最佳簇信息,确定源乐曲在第i层中属于哪个簇。将确定的簇称为CLix。
在步骤S6中,乐曲提取部23参照簇信息数据库14的簇-乐曲ID信息,获取属于确定的簇CLix的乐曲的乐曲ID。在步骤S7中,乐曲提取部23设想将由步骤S6的处理获取的乐曲ID设为元素的集合A。在步骤S8中,乐曲提取部23提取集合C和集合A中共同的元素(乐曲ID),在步骤S9中,判断是否存在共同的乐曲ID(即,通过步骤S8的处理是否提取出了集合C和集合A中共同的乐曲ID)。在判断为集合C和集合A中存在共同的乐曲ID的情况下,处理进入步骤S10,使集合C的元素的个数减少到由步骤S8提取的共同的乐曲ID的个数。在步骤S11中,乐曲提取部23将层编号i增加1,返回步骤S4,重复其后的处理。
此外,在步骤S9中,在判断为集合C和集合A中不存在共同的乐曲ID的情况下,跳过步骤S10,处理进入步骤S11。
通过重复该步骤S4至S11的处理,减少集合C的元素(乐曲ID)。然后在步骤S4中,在层编号i变得大于n而判断为不是n以下的情况下,处理进入步骤S12。
在步骤S12中,乐曲提取部23向随机选择部26输出集合C的元素(乐曲ID)。随机选择部26从集合C中随机地选择一个乐曲,输出到选择理由生成部28。此外,也可以将集合C的元素(乐曲ID)输出到类似度算出部27,而不是输出到随机选择部26,通过类似度算出部27选择一个乐曲。
在步骤S13中,选择理由生成部28生成表示由随机选择部26(或者类似度算出部27)选择的乐曲被选择的理由的选择理由文,与选择的乐曲的乐曲ID一起输出到乐曲呈现部29。在步骤S14中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文。
根据以上说明的第1类似乐曲检索处理,不需要算出源乐曲的特征向量与其他乐曲的特征向量之间的距离,可以考虑用户对各簇层的优先级别,来呈现类似于源乐曲的乐曲。
图12是说明第2类似乐曲检索处理的流程图。作为第2类似乐曲检索处理的前处理,爱好信息数据库24运算各簇层中的爱好值的分散,检测出爱好值的分散最小(即,用户的爱好集中在特定的簇中)的簇层,确定爱好集中的簇。将该簇层的层编号设为P、将该簇设为CLpp。
在步骤S31中,爱好信息数据库24运算各簇层中的爱好值的分散,检测出爱好值的分散最小(即,用户的爱好集中在特定的簇中)的簇层并设为第P层(P是1至n的整数)。而且,确定在第P层中爱好集中的簇并设为CLpp。
在步骤S32中,检索乐曲指定部21向簇映射部22输出由用户指定的源乐曲的乐曲ID和元数据。簇映射部22使用以往的簇识别方法,将所输入的源乐曲的元数据映射到最佳簇,生成该最佳簇信息并提供给乐曲提取部23。
在步骤S33中,乐曲提取部23参照簇信息数据库14,设想集合C,该集合C是将在簇信息数据库14中保存着簇信息的全部乐曲的乐曲ID设为元素的集合。在步骤S34中,乐曲提取部23将层编号i初始化为1。
在步骤S35中,乐曲提取部23判断层编号i是否为n(n是簇层的总数)以下。在判断为层编号i小于n的情况下,处理进入步骤S36。在步骤S36中,乐曲提取部23判断由步骤S31确定的P与层编号i是否一致,在判断为一致的情况下,进入步骤S37,将其次的步骤S39中的处理对象确定为簇CLpp。
另一方面,在步骤S36中,在判断为由步骤S31确定的P与层编号i不一致的情况下,进入步骤S38。在步骤S38中,乐曲提取部23根据从簇映射部22输入的源乐曲的最佳簇信息,确定源乐曲在第i层中属于哪个簇。将确定的簇称为CLix。
在步骤S39中,乐曲提取部23参照簇信息数据库14的簇-乐曲ID信息,取得属于由步骤S37的处理确定的簇CLpp或者由步骤S38的处理确定的簇CLix的乐曲的乐曲ID。
在步骤S40中,乐曲提取部23设想将由步骤S39的处理获取的乐曲ID设为元素的集合A。在步骤S41中,乐曲提取部23提取集合C和集合A中共同的元素(乐曲ID),在步骤S42中,判断是否存在共同的乐曲ID(即,通过步骤S41的处理是否提取出了集合C和集合A中共同的乐曲ID)。在判断为集合C和集合A中存在共同的乐曲ID的情况下,处理进入步骤S43,使集合C的元素的个数减少到由步骤S41提取的共同的乐曲ID的个数。在步骤S44中,乐曲提取部23将层编号i增加1,返回步骤S35,重复其后的处理。
此外,在步骤S42中,在判断为集合C和集合A中不存在共同的乐曲ID的情况下,跳过步骤S43,处理进入步骤S44。
通过重复该步骤S35至S44的处理,减少集合C的元素(乐曲ID)。然后在步骤S35中,在层编号i变得大于n而判断为不是n以下的情况下,处理进入步骤S45。
在步骤S45中,乐曲提取部23向随机选择部26输出集合C的元素(乐曲ID)。随机选择部26从集合C中随机地选择一个乐曲,输出到选择理由生成部28。此外,也可以将集合C的元素(乐曲ID)输出到类似度算出部27,而不是输出到随机选择部26,通过类似度算出部27选择一个乐曲。
在步骤S46中,选择理由生成部28生成选择理由文,与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29,其中,该选择理由文表示由随机选择部26(或者类似度算出部27)选择的乐曲被选择的理由。在步骤S47中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文。
根据以上说明的第2类似乐曲检索处理,不需要算出源乐曲的特征向量与其他乐曲的特征向量之间的距离,可以呈现属于表示用户爱好的爱好值高的簇且类似于源乐曲的乐曲。
图13是说明第3类似乐曲检索处理的流程图。
在步骤S61中,检索乐曲指定部21向簇映射部22输出由用户指定的源乐曲的乐曲ID和元数据。簇映射部22使用以往的簇识别方法,将所输入的源乐曲的元数据映射到最佳簇,向乐曲提取部23提供该最佳簇信息。
在步骤S62中,乐曲提取部23设想将带评价值的乐曲ID设为元素的集合C并进行初始化。即,在该时刻集合C是空集合。在步骤S63中,乐曲提取部23将层编号i初始化为1。
在步骤S64中,乐曲提取部23判断层编号i是否为n(n是簇层的总数)以下。在判断为层编号i是n以下的情况下,处理进入步骤S65。在步骤S65中,乐曲提取部23根据从簇映射部22输入的源乐曲的最佳簇信息,确定源乐曲在第i层中属于哪个簇。将确定的簇称为CLix。
在步骤S66中,乐曲提取部23参照爱好信息数据库24,获取用户对由步骤S65的处理确定的簇CLix的爱好值,根据所获取的爱好值,决定对属于簇CLix的乐曲赋予的评价值。
在步骤S67中,乐曲提取部23参照簇信息数据库14的簇-乐曲ID信息,获取属于所确定的簇CLix的乐曲的乐曲ID。在步骤S68中,乐曲提取部23向由步骤S67的处理获取的乐曲ID赋予由步骤S66的处理决定的评价值。并且,设想将带评价值的乐曲ID设为元素的集合A。
在步骤S69中,乐曲提取部23向集合C添加集合A的元素(带评价值的乐曲ID)。在步骤S70中,乐曲提取部23将层编号i增加1,返回步骤S64,重复其后的处理。
通过重复该步骤S64至S70的处理,增加集合C的元素(带评价值的乐曲ID)。然后在步骤S64中,在层编号i变得大于n而判断为不是n以下的情况下,处理进入步骤S71。
在步骤S71中,乐曲提取部23从集合C的元素(带评价值的乐曲ID)中选择评价值最高的元素,通过随机选择部26(或者类似度算出部27)输出到选择理由生成部28。
在步骤S72中,选择理由生成部28生成选择理由文,与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29,其中,该选择理由文表示由乐曲提取部23选择的乐曲被选择的理由。在步骤S73中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文。
根据以上说明的第3类似乐曲检索处理,不需要算出源乐曲的特征向量与其他乐曲的特征向量之间的距离,可呈现与源乐曲类似的乐曲之中根据用户爱好而赋予的评价值最高的乐曲。
此外,在上述第1至第3类似乐曲检索处理中,作为检索条件指定了乐曲,但也可以指定艺术家、专辑等来进行类似乐曲检索处理。在这种情况下,将图3、图4的乐曲ID换为另一措词艺术家ID或者专辑ID即可。例如在将艺术家设为检索条件的情况下,使用与图2的艺术家所相关的标题、专辑、类型等相当的簇层。
接着,说明乐曲推荐处理。
图14是说明第1乐曲推荐处理的流程图。作为第1乐曲推荐处理的前处理,簇信息数据库14根据从爱好输入部25输入的用户对各簇层的优先级,从优先级别高的簇层起,依次重新分配1、2、…、n的层编号。
在步骤S91中,乐曲提取部23参照簇信息数据库14,设想集合C,该集合C将在簇信息数据库14中保持着簇信息的全部乐曲的乐曲ID设为元素。在步骤S92中,乐曲提取部23将层编号i初始化为1。
在步骤S93中,乐曲提取部23判断层编号i是否为n(n是簇层的总数)以下。在判断为层编号i是n以下的情况下,处理进入步骤S94。在步骤S94中,乐曲提取部23参照爱好信息数据库24,确定第i层的簇之中用户的爱好值最大的簇。将确定的簇称为CLix。
在步骤S95中,乐曲提取部23参照簇信息数据库14的簇-乐曲ID信息,获取属于所确定的簇CLix的乐曲的乐曲ID。在步骤S96中,乐曲提取部23设想集合A,该集合A将由步骤S95的处理获取的乐曲ID设为元素。在步骤S97中,乐曲提取部23提取集合C和集合A中共同的元素(乐曲ID),在步骤S98中,判断是否存在共同的乐曲ID(即,通过步骤S97的处理是否提取出了集合C和集合A中共同的乐曲ID)。在判断为集合C和集合A中存在共同的乐曲ID的情况下,处理进入步骤S99,使集合C的元素的个数减少到由步骤S97提取的共同的乐曲ID的个数。在步骤S100中,乐曲提取部23将层编号i增加1,返回步骤S93,重复其后的处理。
此外,在步骤S98中,在判断为集合C和集合A中不存在共同的乐曲ID的情况下,跳过步骤S99,处理进入步骤S100。
通过重复该步骤S93至S100的处理,减少集合C的元素(乐曲ID)。然后在步骤S93中,在层编号i变得大于n而判断为不是n以下的情况下,处理进入步骤S101。
在步骤S101中,乐曲提取部23向随机选择部26输出集合C的元素(乐曲ID)。随机选择部26从集合C中随机地选择一个乐曲,输出到选择理由生成部28。此外,也可以将集合C的元素(乐曲ID)输出到类似度算出部27,而不是输出到随机选择部26,通过类似度算出部27来选择一个乐曲。
在步骤S102中,选择理由生成部28生成选择理由文,与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29,其中,该选择理由文表示由随机选择部26(或者类似度算出部27)选择的乐曲被选择的理由。在步骤S103中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文。
根据以上说明的第1乐曲推荐处理,不需要算出对应于用户爱好的特征向量与乐曲的特征向量之间的距离,可以考虑用户对各簇层的优先级别,向用户推荐符合用户爱好的乐曲。
图15是说明第2乐曲推荐处理的流程图。
在步骤S121中,乐曲提取部23设想将带评价值的乐曲ID设为元素的集合C并进行初始化。即,在该时刻集合C是空集合。在步骤S122中,乐曲提取部23将层编号i初始化为1。
在步骤S123中,乐曲提取部23判断层编号i是否为n(n是簇层的总数)以下。在判断为层编号i是n以下的情况下,处理进入步骤S124。在步骤S124中,乐曲提取部23参照爱好信息数据库24,确定第i层的簇之中对应于用户爱好的爱好值为规定值以上的簇。将确定的簇称为簇群CLix。
在步骤S125中,乐曲提取部23根据对由步骤S124的处理确定的簇群CLix的各簇的爱好值,决定对属于簇群CLix的各簇的乐曲赋予的评价值。
在步骤S126中,乐曲提取部23参照簇信息数据库14的簇-乐曲ID信息,获取属于所确定的簇群CLix的各簇的乐曲的乐曲ID。在步骤S127中,乐曲提取部23向由步骤S126的处理获取的乐曲ID赋予由步骤S125的处理决定的评价值。然后,设想将带评价值的乐曲ID设为元素的集合A。
在步骤S128中,乐曲提取部23向集合C添加集合A的元素(带评价值的乐曲ID)。此时,如果集合C中有相同的乐曲ID,则对评价值进行求和。在步骤S129中,乐曲提取部23将层编号i增加1,返回步骤S123,重复其后的处理。
通过重复该步骤S123至S129的处理,增加集合C的元素(带评价值的乐曲ID)。然后在步骤S123中,在层编号i变得大于n而判断为不是n以下的情况下,处理进入步骤S130。
在步骤S130中,乐曲提取部23从集合C的元素(带评价值的乐曲ID)中选择评价值最高的元素,通过随机选择部26(或者类似度算出部27)输出到选择理由生成部28。
在步骤S131中,选择理由生成部28生成选择理由文,与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29,其中,该选择理由文表示由乐曲提取部23选择的乐曲被选择的理由。在步骤S132中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文。
根据以上说明的第2乐曲推荐处理,不需要算出对应于用户爱好的特征向量与乐曲的特征向量之间的距离,能够向用户推荐根据用户的爱好赋予的评价值最高的乐曲。
根据以上说明的第1至第3类似乐曲检索处理、以及第1和第2乐曲推荐处理,不需要算出源乐曲或者对应于用户爱好的特征向量与检索对象的乐曲的特征向量之间的距离(余弦相关等),就可选择所呈现的乐曲。另外,在任一个处理中都能够使用户的爱好优先,因此可提高用户对检索、推荐的满意度。
由于对每个簇层选出用于呈现的成为候补的乐曲,因此有如下优点:即不产生所谓的由爱好的求和导致的舍入问题。
而且,由于为使在乐曲的元数据之中由数值表现的元数据反映到簇间的距离而将数值自身直接使用于分簇,因此可最大限度地有效使用信息。
另外,也可以将簇层分为组而使用簇层的一部分。例如也可以将{关联艺术家层、艺术家类型层、艺术家查看文本层}定义为艺术家检索推荐用组、将{乐曲特征量层(速度、节奏等)、乐曲类型层、乐曲查看文本层}定义为乐曲检索推荐用组。
另外,上述的一系列处理既可以通过硬件执行,但也可以通过软件执行。在通过软件执行一系列处理的情况下,可将构成该软件的程序从记录介质安装到装在专用的硬件中的计算机、或者通过安装各种程序而可执行各种功能的例如如图16所示构成的通用的个人计算机等中。
该个人计算机100中内置有CPU(Central Processing Unit:中央处理器)101。在CPU 101中通过总线104连接有输入输出接口105。在总线104上连接有ROM(Read Only Memory:只读存储器)102以及RAM(Random Access Memory:随机存取存储器)103。
在输入输出接口105上连接有:由用户输入操作命令的键盘、鼠标等输入设备构成的输入部106;由显示画面的CRT(CathodeRay Tube:阴极射线管)或者LCD(Liquid Crystal Display:液晶显示器)等设备构成的输出部107;由保存程序、各种数据的硬盘驱动器等构成的存储部108;以及通信部109,其由调制解调器、LAN(Local Area Network:局域网)适配器等构成,执行通过以因特网为代表的网络的通信处理。另外,连接有对记录介质111读写数据的驱动器110,其中,记录介质111是磁盘(包括软盘)、光盘(包括CD-ROM(Compact Disc Read Only Memory:光盘只读存储器)、DVD(Digital Versatile Disc:数字多功能光盘))、磁光盘(包括MD(Mini Disk:迷你光盘))、或者半导体存储器等存储介质。
使该个人计算机100执行上述一系列处理的程序,以保存在记录介质111中的状态提供给个人计算机100,并由驱动器110读出而安装到内置于存储部108中的硬盘驱动器。安装在存储部108中的程序根据与输入到输入部106的来自用户的命令对应的CPU 101的指令,从存储部108装入到RAM 103中而执行。
图17是表示本发明的一个实施方式的推荐系统1的其他结构例的框图。在图17中,在与图1所示的情况相同的部分标记相同的符号,省略其说明。
图17所示的推荐系统1由以下部分构成:乐曲DB11、关键词设定部13、簇信息DB14、检索乐曲指定部21、簇映射部22、乐曲提取部23、爱好信息数据库24、爱好输入部25、随机选择部26、类似度算出部27、选择理由生成部28、乐曲呈现部29、元数据分簇部201、以及乐曲分簇部202。
元数据分簇部201将记录在乐曲数据库11中的各乐曲的元数据进行分簇。即,元数据分簇部201将作为内容的乐曲的元数据分类到多个簇中的任一个,为簇分配层次。
元数据分簇部201向乐曲分簇部202提供各乐曲的元数据的分簇结果。
乐曲分簇部202根据元数据分簇部201的各乐曲的元数据的分簇结果,与分簇部12同样地将各乐曲进行分簇并生成各乐曲的簇信息。即,乐曲分簇部202生成与各乐曲的分簇结果相应的簇信息,输出到簇信息DB14。
接着,参照图18的流程图,说明图17所示的推荐系统1中的推荐乐曲的处理的准备即脱机时的前处理的示例。
在步骤S201中,元数据分簇部201从乐曲DB11获取乐曲的元数据,对获取的元数据的维度进行压缩。例如,在步骤S201中,元数据分簇部201利用LSA(the latent semantic analysis:潜在语义分析)、PLSA(the probabilistic latent semantic analysis:概率潜在语义分析)、或者数量化III类等方法,对从乐曲DB11获取的乐曲的元数据的维度进行压缩。
此外,在步骤S201中,元数据分簇部201也可以将乐曲的元数据进行向量化。
在步骤S202中,元数据分簇部201将各乐曲的元数据进行分簇。例如,在步骤S202中,元数据分簇部201对各乐曲的元数据进行软分簇。
更具体地说,例如如图19所示,元数据分簇部201在各个层次内对各乐曲的元数据进行软分簇,使得项目的归属到各簇的权重之和为1。
例如,由乐曲ID“ABC123”所确定的乐曲的元数据归属到第1层次(层编号1)中的第1簇、第2簇、第3簇、以及第4簇的权重,分别是0.0、0.8、0.0以及0.2。由乐曲ID“ABC123”所确定的乐曲的元数据归属到第2层次(层编号2)中的第5簇、第6簇、第7簇、以及第8簇的权重,分别是0.4、0.6、0.0以及0.0。由乐曲ID“ABC123”所确定的乐曲的元数据归属到第3层次(层编号3)中的第9簇、第10簇、以及第11簇的权重,分别是0.0、0.0以及1.0。另外,由乐曲ID“ABC123”所确定的乐曲的元数据归属到第n层次(层编号n)中的四个簇各自的权重,分别是1.0、0.0、0.0以及1.0。
例如,由乐曲ID“CTH863”所确定的乐曲的元数据归属到第1层次中的第1簇、第2簇、第3簇、以及第4簇的权重,分别是1.0、0.0、0.0、以及0.0。由乐曲ID“CTH863”所确定的乐曲的元数据归属到第2层次中的第5簇、第6簇、第7簇、以及第8簇的权重,分别是0.0、0.5、0.5、以及0.0。由乐曲ID“CTH863”所确定的乐曲的元数据归属到第3层次中的第9簇、第10簇、以及第11簇的权重,分别是0.7、0.3、以及0.0。另外,由乐曲ID“CTH863”所确定的乐曲的元数据归属到第n层次中的四个簇各自的权重分别是0.0、0.8、0.2、以及0.0。
例如,由乐曲ID“XYZ567”所确定的乐曲的元数据归属到第1层次中的第1簇、第2簇、第3簇、以及第4簇的权重,分别是0.0、0.4、0.6、以及0.0。由乐曲ID“XYZ567”所确定的乐曲的元数据归属到第2层次中的第5簇、第6簇、第7簇、以及第8簇的权重,分别是0.0、0.0、0.0、以及1.0。由乐曲ID“XYZ567”所确定的乐曲的元数据归属到第3层次中的第9簇、第10簇、以及第11簇的权重,分别是0.9、0.0、以及0.1。另外,由乐曲ID“XYZ567”所确定的乐曲的元数据归属到第n层次中的四个簇各自的权重,分别是0.3、0.0、0.0、以及0.7。
此外,各乐曲的元数据的软分簇,在各层次内不限于项目即乐曲的归属到各簇的权重之和为1。另外,也可以将各项目设为在各层次中不属于任一个簇。
在步骤S203中,元数据分簇部201分配簇层。
在此,参照图20以及图21说明元数据的分簇以及簇层的分配。图20是表示元数据的示例。为了简单起见将图20所示的元数据设为0或者1的值的分类数据(categorical data)。
元数据1、元数据2、以及元数据3属于作为高次分类的元组1,元数据4、元数据5、以及元数据6属于作为高次分类的元组2。例如,与艺术家有关的元数据属于元组1,元数据1表示艺术家的外观,元数据2表示组。另外,例如与类型有关的元数据属于元组2,元数据4表示流行音乐,元数据5表示摇滚。
在图20所示的示例中,由乐曲ID“ABC123”所确定的乐曲的元数据1至元数据6分别是1、1、1、1、1、1,由乐曲ID“CTH863”所确定的乐曲的元数据1至元数据6分别是0、1、0、0、1、1,由乐曲ID“XYZ567”所确定的乐曲的元数据1至元数据6分别是1、1、1、1、1、1。另外,由乐曲ID“EKF534”所确定的乐曲的元数据1至元数据6分别是1、0、1、0、0、1,由乐曲ID“OPQ385”所确定的乐曲的元数据1至元数据6分别是1、0、1、1、0、0。
此时,将关于由乐曲ID“ABC123”所确定的乐曲至由乐曲ID“OPQ385”所确定的乐曲的元数据1看作向量。同样地,将关于由乐曲ID“ABC123”所确定的乐曲至由乐曲ID“OPQ385”所确定的乐曲的元数据2至元数据6分别看作向量。即,将关于多个乐曲的一个元数据的值看作向量。
关注该向量彼此的距离。
在图20所示的示例中,将看作向量的元数据1、元数据3、元数据4汇集到曼哈顿距离1以内的簇中,另外,将元数据2、元数据5、元数据6汇集到曼哈顿距离1以内的其他簇中。
因此,将这些簇设成新的元数据的层次。即,向各层次的层分配更接近的元数据。
图21表示这样进行分簇、并分配了层的元数据的示例。在图21所示的示例中,元数据1、元数据3、以及元数据4属于第1层,元数据2、元数据5、以及元数据6属于第2层。
这样,由相关性高的元数据的集合形成各层,在其中进行乐曲的分簇,因此可以在簇中反映将类型、艺术家等直接作为层次那样的普通层次分配中所不能完全表现的乐曲间的微小的差。
返回图18,在步骤S204中,乐曲分簇部202按每个层对乐曲进行分簇,结束处理。即,乐曲分簇部202将各内容在分配的各层次中分类到多个簇中的任一个。
通过这样做,可以在保持元数据的乐曲的表现的详细度(表现的详细程度)情况下减少数据量和计算量而将乐曲进行分簇。
另外,如上所述通过将元数据进行层次化,将乐曲进行分簇使得很好地表现乐曲间的微小差异。
接着,参照图22的流程图说明第4类似乐曲检索处理。在步骤S221中,检索乐曲指定部21设定成为类似源的源乐曲。即,例如在步骤S221中,检索乐曲指定部21通过簇映射部22,根据用户的指定,向乐曲提取部23输出源乐曲的乐曲ID,由此设定源乐曲。
在步骤S222中,类似度算出部27根据各簇的归属权重,计算源乐曲与源乐曲以外的全部乐曲的各个之间的类似度。
例如,乐曲提取部23从簇信息数据库14读出由乐曲ID所确定的源乐曲的簇信息、以及源乐曲以外的全部乐曲的簇信息。然后,乐曲提取部23向类似度算出部27提供读出的簇信息。类似度算出部27根据由源乐曲与源乐曲以外的全部乐曲的簇信息表示的各簇的归属权重,计算源乐曲与源乐曲以外的全部乐曲的各个之间的类似度。
更具体地说,例如通过乐曲分簇部202,将各乐曲在各层次内进行软分簇,将表示各簇的归属权重的簇信息保存到簇信息数据库14中。
图23是示出表示簇的归属权重的簇信息的示例的图。
例如,由乐曲ID“ABC123”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.0、1.0、0.0、以及0.2。由乐曲ID“ABC123”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及簇ID“CL24”所确定的簇的权重,分别是0.6、0.8、0.0、以及0.0。
另外,由乐曲ID“ABC123”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是0.0、0.0、以及1.0。而且,由乐曲ID“ABC123”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是1.0、0.0、0.0、以及0.0。
例如,由乐曲ID“CTH863”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是1.0、0.0、0.0、以及0.0。由乐曲ID“CTH863”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.0、0.7、0.7、以及0.0。
另外,由乐曲ID“CTH863”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是0.9、0.4、以及0.0。而且,由乐曲ID“CTH863”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.0、1.0、0.3、以及0.0。
例如,由乐曲ID“XYZ567”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.0、0.6、0.8、以及0.0。由乐曲ID“XYZ567”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.0、0.0、0.0、以及1.0。
另外,由乐曲ID“XYZ567”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、由簇ID“CL33”所确定的簇的权重,分别是1.0、0.0、以及0.1。而且,由乐曲ID“XYZ567”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.5、0.0、0.0、以及0.9。
例如,由乐曲ID“EKF534”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.9、0.0、0.0、以及0.5。由乐曲ID“EKF534”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.0、0.6、0.0、以及0.8。
另外,由乐曲ID“EKF534”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、由簇ID“CL33”所确定的簇的权重,分别是0.7、0.0、以及0.7。而且,由乐曲ID“EKF534”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.0、0.9、0.4、以及0.3。
例如,由乐曲ID“OPQ385”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.7、0.2、0.6、以及0.0。由乐曲ID“OPQ385”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是1.0、0.0、0.0、以及0.0。
另外,由乐曲ID“OPQ385”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是0.0、1.0、以及0.0。而且,由乐曲ID“OPQ385”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.4、0.9、0.0、以及0.0。
例如,类似度算出部27根据各乐曲归属到簇的权重,通过式(1)所示的运算来计算由乐曲ID“i”所确定的源乐曲与由乐曲ID“j”所确定的乐曲之间的类似度sim(i,j)。
式1
在式(1)中,L是表示层次数量的值,l是确定层次的值。C(l)表示簇的全体,c是确定簇的值。Wilc是表示由乐曲ID“i”所确定的源乐曲归属到第l层的第c簇的权重。Wjlc是表示由乐曲ID“j”所确定的乐曲归属到第l层的第c簇的权重。
图24是示出根据表示归属到簇的权重的图23的簇信息,通过式(1)所示的运算所计算的类似度的示例的图。此外,在图24中,示出了由CTH863至OPQ385的各个乐曲ID所确定的各乐曲对于由乐曲ID“ABC123”所确定的源乐曲的类似度。
如图24所示,当根据图23的簇信息,对于由乐曲ID“ABC123”所确定的源乐曲,通过式(1)所示的运算计算由CTH863至OPQ385的各个的乐曲ID所确定的各个乐曲的类似度时,由CTH863至OPQ385的各个乐曲ID所确定的乐曲的各类似度是0.57、1.18、1.27、1.20。
例如,在步骤S222中,类似度算出部27通过式(1)所示的运算,计算分别为0.57、1.18、1.27、1.20的、由CTH863至OPQ385的各个乐曲ID所确定的乐曲的各自相对于由乐曲ID“ABC123”所确定的源乐曲的类似度。
在步骤S223中,类似度算出部27根据类似度,以类似于源乐曲的顺序,将源乐曲以外的全部乐曲排序。
更具体地说,类似度算出部27使计算结果得出的乐曲的类似度与乐曲的乐曲ID相对应,根据类似度按与源乐曲类似的顺序重新排列乐曲的乐曲ID,由此,按与源乐曲类似的顺序将源乐曲以外的全部乐曲排序。
在步骤S224中,类似度算出部27选择被排序的乐曲中的任意数量的上位乐曲。类似度算出部27向选择理由生成部28提供所选择的乐曲的乐曲ID。
在步骤S224中,例如类似度算出部27选择最上位的乐曲,向选择理由生成部28提供最上位的乐曲的乐曲ID。或者,在步骤S224中,例如类似度算出部27选择上位10曲的乐曲,向选择理由生成部28提供上位10曲的乐曲的乐曲ID。
在步骤S225中,选择理由生成部28生成选择理由文,与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29,其中,该选择理由文表示通过类似度算出部27选择的乐曲被选择的理由。在步骤S226中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文,结束处理。
接着,参照图25的流程图来说明第5类似乐曲检索处理。步骤S241至步骤S251分别与图11的步骤S1至步骤S11相同,因此省略其说明。
在步骤S252中,类似度算出部27根据从乐曲提取部23提供的集合C的元素(乐曲ID),根据各簇的归属权重来计算源乐曲与集合C的各乐曲的类似度。在步骤S252中,例如类似度算出部27通过式(1)所示的运算,计算源乐曲与集合C的各乐曲的类似度。
在步骤S253中,类似度算出部27根据类似度,按与源乐曲类似的顺序将集合C的乐曲排序。
更具体地说,类似度算出部27使计算结果得出的类似度与集合C的乐曲的乐曲ID相对应,根据类似度重新排列集合C的乐曲的乐曲ID,按与源乐曲类似的顺序将集合C的乐曲排序。
在步骤S224中,类似度算出部27选择被排序的乐曲中的任意数量的上位乐曲。类似度算出部27向选择理由生成部28提供所选择的乐曲的乐曲ID。
在步骤S224中,例如类似度算出部27选择最上位的乐曲,向选择理由生成部28提供最上位的乐曲的乐曲ID。或者,在步骤S224中,例如类似度算出部27选择上位10曲的乐曲,向选择理由生成部28提供上位10曲的乐曲的乐曲ID。
在步骤S225中,选择理由生成部28生成选择理由文,与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29,其中,该选择理由文表示通过类似度算出部27选择的乐曲被选择的理由。在步骤S226中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文,结束处理。
接着参照图26的流程图,说明第3乐曲推荐处理。步骤S261至步骤S270分别与图14的步骤S91至步骤S100相同,因此省略其说明。
在步骤S271中,类似度算出部27根据从乐曲提取部23提供的集合C的元素(乐曲ID),计算表示各簇的归属权重的用户的爱好值与集合C的各乐曲的表示各簇的归属权重的簇信息的类似度。
在此,参照图27至图31说明用户的爱好值与集合C的各乐曲的簇信息的类似度。
例如,爱好信息数据库24记录着被软分簇的、表示在各层次内各簇的归属权重的爱好值。
图27是示出表示各簇的归属权重的爱好值的示例的图。
例如,由用户ID“U001”所确定的用户的爱好值归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.0、0.8、0.0、以及0.6。由用户ID“U001”所确定的用户的爱好值归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.4、0.6、0.7、以及0.0。
另外,由用户ID“U001”所确定的用户的爱好值归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是0.7、0.5、以及0.5。而且,由用户ID“U001”所确定的用户的爱好值归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.0、0.5、0.4、以及0.0。
图28是示出表示各簇的归属权重的簇信息的示例的图。
例如,由乐曲ID“ABC123”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.0、1.0、0.0、以及0.2。由乐曲ID“ABC123”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.6、0.8、0.0、以及0.0。
另外,由乐曲ID“ABC123”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是0.0、0.0、以及1.0。而且,由乐曲ID“ABC123”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是1.0、0.0、0.0、以及0.0。
例如,由乐曲ID“CTH863”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是1.0、0.0、0.0、以及0.0。由乐曲ID“CTH863”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.0、0.7、0.7、以及0.0。
另外,由乐曲ID“CTH863”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是0.9、0.4、以及0.0。并且,由乐曲ID“CTH863”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.0、1.1、0.3、以及0.0。
例如,由乐曲ID“XYZ567”所确定的乐曲归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.0、0.6、0.8、以及0.0。由乐曲ID“XYZ567”所确定的乐曲归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.0、0.0、0.0、以及1.0。
另外,由乐曲ID“XYZ567”所确定的乐曲归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是1.0、0.0、以及0.1。而且,由乐曲ID“XYZ567”所确定的乐曲归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.4、0.0、0.0、以及0.7。
例如,类似度算出部27根据归属到用户爱好值中的簇的权重和归属到由乐曲ID“i”所确定的乐曲的簇信息中的簇的权重,通过式(2)所示的运算,计算类似度sim(u,i)。
式2
在式(2)中,L是表示层次数量的值,l是确定层次的值。C(l)表示簇的全体,c是确定簇的值。Wilc是表示由乐曲ID“i”所确定的乐曲的簇信息归属到第l层的第c簇的权重。hulc是表示用户u的爱好值归属到第l层的第c簇的权重。
图29是表示根据图27的表示簇的归属权重的爱好值和图28的表示簇的归属权重的簇信息,通过式(2)所示的运算来计算的类似度的示例。
将由用户ID“U001”所确定的用户的爱好值的归属权重之中的第1层的归属权重、与由乐曲ID“ABC123”所确定的乐曲的簇信息的归属权重之中的第1层的归属权重,按对应的归属权重彼此相乘,并累计相乘的结果时,可求出图29的对于乐曲ID“ABC123”的配置在第1层的值0.91。同样地,关于第2层、第3层以及第4层,将由用户ID“U001”所确定的用户的爱好值的归属权重、与由乐曲ID“ABC123”所确定的乐曲的簇信息的归属权重,按对应的归属权重彼此相乘,并累计相乘的结果时,可求出图29的对于乐曲ID“ABC123”的分别配置在第2层、第3层以及第4层的值0.67、0.53、0.00。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“ABC123”所确定的乐曲的簇信息的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.91、0.67、0.53、以及0.00相加得到的值2.11。
将由用户ID“U001”所确定的用户的爱好值的归属权重之中的第1层的归属权重、与由乐曲ID“CTH863”所确定的乐曲的簇信息的归属权重之中的第1层的归属权重,按对应的归属权重彼此相乘,并累计相乘的结果时,可求出图29的对于乐曲ID“CTH863”的、配置在第1层的值0.00。同样地,关于第2层、第3层以及第4层,将由用户ID“U001”所确定的用户的爱好值的归属权重、与由乐曲ID“CTH863”所确定的乐曲的簇信息的归属权重,按对应的归属权重彼此相乘,并累计相乘的结果时,可求出图29的对于乐曲ID“CTH863”的分别配置在第2层、第3层以及第4层的值0.92、0.82、0.63。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“CTH863”所确定的乐曲的簇信息的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.00、0.92、0.82、以及0.63相加得到的值2.37。
将由用户ID“U001”所确定的用户的爱好值的归属权重之中的第1层的归属权重、与由乐曲ID“XYZ567”所确定的乐曲的簇信息的归属权重之中的第1层的归属权重,按对应的归属权重彼此相乘,并累计相乘的结果时,可求出图29的对于乐曲ID“XYZ567”的、配置在第1层的值0.44。同样地,关于第2层、第3层以及第4层,将由用户ID“U001”所确定的用户的爱好值的归属权重、与由乐曲ID“XYZ567”所确定的乐曲的簇信息的归属权重,按对应的归属权重彼此相乘,并累计相乘的结果时,可求出图29的对于乐曲ID“XYZ567”的分别配置在第2层、第3层以及第4层的值0.00、0.72、0.00。
最终,将由用户ID“U001”所确定的用户的爱好值、与由乐曲ID“XYZ567”所确定的乐曲的簇信息的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.44、0.00、0.72、0.00相加得到的值1.15。
另外,也可以使用各层次中的基于用户的爱好值的归属权重的分布的权重,计算类似度。
例如,类似度算出部27根据归属到用户的爱好值中的簇的权重、以及归属到由乐曲ID“i”所确定的乐曲的簇信息中的簇的权重,通过式(3)所示的运算来计算类似度sim(u,i)。
式3
在式(3)中,L是表示层次数量的值,l是确定层次的值。C(l)表示簇的全体,c是确定簇的值。Wilc表示由乐曲ID“i”所确定的乐曲的簇信息的、第l层的第c簇的归属权重。hulc表示用户u的爱好值的第l层的第c簇的归属权重。bul表示用户u的爱好值关于第1层的权重。
图30是表示用户的爱好值的各层次的归属权重的分散、即每个层次的权重的示例的图。在图30所示的示例中,关于由用户ID“U001”所确定的用户的第1层的权重、第2层的权重、第3层的权重、以及第4层的权重,分别是0.17、0.10、0.01、以及0.06。
图31是表示根据图27的表示簇的归属权重的爱好值、图28的表示簇的归属权重的簇信息、图30的每个层次的权重,通过式(3)所示的运算所计算的类似度的示例的图。此外,图30所示的类似度是将通过式(3)所示的运算而计算出的结果设为10倍的值。
将由用户ID“U001”所确定的用户的爱好值的第1层的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“ABC123”所确定的乐曲的簇信息的第1层的归属权重、以及第1层的权重相乘,并累计相乘的结果时,可求出图31的对于乐曲ID“ABC123”的、配置在第1层的值1.27。同样地,关于第2层、第3层以及第4层,将由用户ID“U001”所确定的用户的爱好值的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“ABC123”所确定的乐曲的簇信息的归属权重、以及第2层、第3层或者第4层中的该层的权重相乘,并累计相乘的结果时,可求出图31的对于乐曲ID“ABC123”的分别配置在第2层、第3层以及第4层的值0.49、0.03、0.00。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“ABC123”所确定的乐曲的簇信息的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的1.27、0.49、0.03、以及0.00相加得到的值1.79。
将由用户ID“U001”所确定的用户的爱好值的第1层的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“CTH863”所确定的乐曲的簇信息的第1层的归属权重、以及第1层的权重相乘,并累计相乘的结果时,求出图31的对于由乐曲ID“CTH863”的、配置在第1层的值0.00。同样地,关于第2层、第3层以及第4层,将由用户ID“U001”所确定的用户的爱好值的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“CTH863”所确定的乐曲的簇信息的归属权重、以及第2层、第3层或者第4层中的该层的权重相乘,并累计相乘的结果时,可求出图31的对于乐曲ID“CTH863”的分别配置在第2层、第3层以及第4层的值0.65、0.04、0.27。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“CTH863”所确定的乐曲的簇信息的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.00、0.65、0.04、以及0.27相加得到的值0.96。
将由用户ID“U001”所确定的用户的爱好值的第1层的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“XYZ567”所确定的乐曲的簇信息的第1层的归属权重、以及第1层的权重相乘,并累计相乘的结果时,可求出图31的对于乐曲ID“XYZ567”的配置在第1层的值0.53。同样地,关于第2层、第3层以及第4层,将由用户ID“U001”所确定的用户的爱好值的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“XYZ567”所确定的乐曲的簇信息的归属权重、以及第2层、第3层或者第4层中的该层的权重相乘,并累计相乘的结果时,可求出图31的对于乐曲ID“XYZ567”的分别配置在第2层、第3层以及第4层的值0.00、0.04、0.00。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“XYZ567”所确定的乐曲的簇信息之间的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.53、0.00、0.04、以及0.00相加得到的值0.57。
当关注图27所示的爱好值时,关于由用户ID“U001”所确定的用户的爱好值的归属权重的值,与第2层至第4层相比,在第1层中较大的产生了变化,因此可以预测,与第2层至第4层相比,第1层的各元素的值与由用户ID“U001”所确定的用户的爱好值关系更密切。
这样,通过加权,与预测为和用户的爱好值不怎么有关系的值相比,利用预测为与用户的爱好关系更密切的值,可求出使该值发生更大变化的类似度,因此能够更正确地检测出用户喜欢的乐曲。
返回图26,在步骤S272中,类似度算出部27根据类似度,按与用户的爱好类似的顺序将集合C的乐曲排序。
更具体地说,类似度算出部27使计算结果得到的类似度与集合C的乐曲的乐曲ID相对应,根据类似度,通过重新排列集合C的乐曲的乐曲ID,按与用户的爱好类似的顺序将集合C的乐曲排序。
在步骤S273中,类似度算出部27从被排序的乐曲之中选择任意数量的上位乐曲。类似度算出部27向选择理由生成部28提供所选择的乐曲的乐曲ID。
例如,在通过式(2)所示的运算来计算类似度,将关于由乐曲ID“ABC123”所确定的乐曲的类似度设为2.11、将关于由乐曲ID“CTH863”所确定的乐曲的类似度设为2.37、将关于由乐曲ID“XYZ567”所确定的乐曲的类似度设为1.15的情况下,当选择一个乐曲时,选择类似度最大的、由乐曲ID“CTH863”所确定的乐曲。
另外,在例如通过式(3)所示的运算,使用各层次中的基于用户的爱好值的归属权重的分布的权重来计算类似度,将关于由乐曲ID“ABC123”所确定的乐曲的类似度设为1.79、将关于由乐曲ID“CTH863”所确定的乐曲的类似度设为0.96、将关于由乐曲ID“XYZ567”所确定的乐曲的类似度设为0.57的情况下,当选择一个乐曲时,选择类似度最大的、由乐曲ID“ABC123”所确定的乐曲。
在步骤S274中,选择理由生成部28生成选择理由文,与所选择的乐曲的乐曲ID一起输出到乐曲呈现部29,其中,该选择理由文表示由类似度算出部27选择的乐曲被选择的理由。在步骤S275中,乐曲呈现部29向用户呈现从选择理由生成部28输入的乐曲ID的乐曲和选择理由文。
接着,参照图32的流程图说明第4乐曲推荐处理。步骤S281至步骤S284分别与图15的步骤S121至步骤S124相同,因此省略其说明。
在步骤S285中,乐曲提取部23根据分别与所确定的各簇对应的爱好值和第i层的权重,决定评价值。
图33是表示图27所示的爱好值的归属权重之中的由0.6的阈值以上的归属权重构成的爱好值的示例。
即,通过将图27所示的爱好值的归属权重之中的不足0.6的归属权重替换为0.0,可求出图33所示的爱好值。
例如,由用户ID“U101”所确定的用户的爱好值归属到作为第1层次中的簇的由簇ID“CL11”所确定的簇、由簇ID“CL12”所确定的簇、由簇ID“CL13”所确定的簇、以及由簇ID“CL14”所确定的簇的权重,分别是0.0、0.8、0.0、以及0.6。由用户ID“U001”所确定的用户的爱好值归属到作为第2层次中的簇的由簇ID“CL21”所确定的簇、由簇ID“CL22”所确定的簇、由簇ID“CL23”所确定的簇、以及由簇ID“CL24”所确定的簇的权重,分别是0.0、0.6、0.7、以及0.0。
另外,由用户ID“U001”所确定的用户的爱好值归属到作为第3层次中的簇的由簇ID“CL31”所确定的簇、由簇ID“CL32”所确定的簇、以及由簇ID“CL33”所确定的簇的权重,分别是0.7、0.0、以及0.0。而且,由用户ID“U001”所确定的用户的爱好值归属到作为第4层次中的簇的由簇ID“CL41”所确定的簇、由簇ID“CL42”所确定的簇、由簇ID“CL43”所确定的簇、以及由簇ID“CL44”所确定的簇的权重,分别是0.0、0.0、0.0、以及0.0。
例如,在步骤S285中,乐曲提取部23根据归属到由阈值以上的归属权重构成的爱好值中的簇的权重、以及归属到由乐曲ID“i”所确定的乐曲的簇信息中的簇的权重,通过式(3)所示的运算来计算类似度。即,与原来的爱好值的归属权重之中的不到例如0.6即阈值的归属权重相乘而求出的值,不与类似度相加;与原来的爱好值的归属权重之中的阈值以上的归属权重相乘而求出的值,与类似度相加。
图34是表示根据图33的由阈值以上的归属权重构成的爱好值、图28的表示簇的归属权重的簇信息、以及图30的每个层次的权重,通过式(3)所示的运算所计算的类似度的示例的图。
将由阈值以上的归属权重构成的爱好值的第1层的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“ABC123”所确定的乐曲的簇信息的第1层的归属权重、以及第1层的权重相乘,并累计相乘的结果时,可求出图34的对于由乐曲ID“ABC123”的配置在第1层的值0.15,其中,所述爱好值是由用户ID“U001”所确定的用户的爱好值。同样地,关于第2层、第3层以及第4层,将由阈值以上的归属权重构成的爱好值的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“ABC123”所确定的乐曲的簇信息的归属权重、以及第2层、第3层或者第4层中该层的权重相乘,并累计相乘的结果时,求出图34的对于乐曲ID“ABC123”的分别配置在第2层、第3层以及第4层的值0.05、0.00、0.00,其中,所述爱好值是由用户ID“U001”所确定的用户的爱好值。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“ABC123”所确定的乐曲的簇信息之间的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.15、0.05、0.00、以及0.00相加得到的值0.20。
将由阈值以上的归属权重构成的爱好值的第1层的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“CTH863”所确定的乐曲的簇信息的第1层的归属权重、以及第1层的权重相乘,并累计相乘的结果时,可求出图34的对于乐曲ID“CTH863”的配置在第1层的值0.00,其中,所述爱好值是由用户ID“U001”所确定的用户的爱好值。同样地,关于第2层、第3层以及第4层,将由阈值以上的归属权重构成的爱好值的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“CTH863”所确定的乐曲的簇信息的归属权重、以及第2层、第3层或者第4层中该层的权重相乘,并累计相乘的结果时,求出图34的对于乐曲ID“CTH863”的分别配置在第2层、第3层以及第4层的值0.10、0.00、0.00,其中,所述爱好值是由用户ID“U001”所确定的用户的爱好值。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“CTH863”所确定的乐曲的簇信息之间的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.00、0.10、0.00、以及0.00相加得到的值0.10。
将由阈值以上的归属权重构成的爱好值的第1层的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“XYZ567”所确定的乐曲的簇信息的第1层的归属权重、以及第1层的权重相乘,并累计相乘的结果时,可求出图34的对于乐曲ID“XYZ567”的配置在第1层的值0.07,其中,所述爱好值是由用户ID“U001”所确定的用户的爱好值。同样地,关于第2层、第3层以及第4层,将由阈值以上的归属权重构成的爱好值的归属权重、对应于用户的爱好值的归属权重的由乐曲ID“XYZ567”所确定的乐曲的簇信息的归属权重、以及第2层、第3层或者第4层中该层的权重相乘,并累计相乘的结果时,可求出图34的对于乐曲ID“XYZ567”的分别配置在第2层、第3层以及第4层的值0.00、0.00、0.00,其中,所述爱好值是由用户ID“U001”所确定的用户的爱好值。
最终,将由用户ID“U001”所确定的用户的爱好值与由乐曲ID“XYZ567”所确定的乐曲的簇信息的类似度,设为将分别关于第1层、第2层、第3层以及第4层求出的0.07、0.00、0.00、以及0.00相加得到的值0.08。
步骤S286至步骤S292分别与图15的步骤S126至步骤S132相同,因此省略其说明。
此外,说明了使用作为属于各层次的归属权重的分散的权重,但是不限于此,在层次中的归属权重的偏差较大的情况下,只要计算具有较大值的权重即可,例如也可以通过式(4)算出熵H,计算作为从1减去熵H的结果得出的值的权重。
式4
这样,能够边将信息的欠缺抑制到最小限度,减少用于选择合适的内容的计算量。另外,可呈现确实地反映使用者着眼于什么样的信息而选择了内容的内容。
此外,在本说明书中,根据程序执行的步骤不仅包含按照记载的顺序按时间顺序进行的处理,而且包含未必按时间顺序进行处理、而并行或者单独执行的处理。
另外,程序可以通过一台计算机进行处理,也可以通过多个计算机进行分散处理。而且,程序也可以传送到远程计算机中而执行。
另外,在本说明书中,系统表示由多个装置构成的整个装置。
(按照条约第19条的修改)
1(补正后).一种信息处理装置,从内容群中选择满足规定条件的内容,其特征在于,包括:
内容分类单元,其分别在与内容的元数据的项目相应的层次中,按照基于对每个上述层次定义的上述元数据的距离尺度的上述元数据的分类,将构成上述内容群的各内容分类到多个第1簇中的任一个;
保持单元,其保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述第1簇之间的对应关系;
确定单元,其对每个上述层次指定与上述规定条件对应的上述第1簇,确定与所指定的上述第1簇对应的内容;以及
呈现单元,其呈现由上述确定单元确定的上述内容。
2.根据权利要求1所述的信息处理装置,其特征在于,
还包括存储单元,该存储单元将由上述内容分类单元对上述内容所分类的各第1簇、与表示用户的爱好程度的爱好值相对应地进行存储,
上述确定单元根据由上述存储单元存储的爱好值来指定上述第1簇,确定与所指定的上述第1簇对应的内容。
3.根据权利要求2所述的信息处理装置,其特征在于,
上述确定单元从与所指定的上述第1簇对应的内容中,根据与上述爱好值相应的每个层次的权重进行了加权的、表示用户的内容爱好程度的评价值,进一步确定内容。
4.根据权利要求1所述的信息处理装置,其特征在于,还包括:
设定单元,其对由上述内容分类单元对上述内容所分类的各第1簇,设定关键词;以及
生成单元,其使用由上述设定单元设定的关键词,生成表示内容呈现理由的理由文,
上述呈现单元还呈现上述理由文。
5(补正后).根据权利要求1所述的信息处理装置,其特征在于,
上述内容是乐曲,
在上述元数据的项目中,包括上述乐曲的速度、拍子或者节奏中的至少一个。
6(补正后).根据权利要求1所述的信息处理装置,其特征在于,
在上述元数据的项目中,包括针对对应的内容的查看文本。
7(补正后).根据权利要求1所述的信息处理装置,其特征在于,
还包括元数据分类单元,该元数据分类单元将关于多个内容的每个项目的元数据分类到多个第2簇的任一个,对第2簇分配上述层次,
上述内容分类单元在分配的上述各层次中分别将各内容分类到多个第1簇的任一个。
8.根据权利要求1所述的信息处理装置,其特征在于,
上述确定单元从与成为类似源的内容所被分类的上述第1簇对应的内容中,利用表示与成为类似源的内容之间的类似程度的类似度,进一步确定内容。
9.根据权利要求8所述的信息处理装置,其特征在于,
上述确定单元利用根据与成为类似源的内容归属到上述第1簇的权重相应的每个层次的权重进行了加权的上述类似度,确定内容。
10(补正后).一种信息处理方法,是从内容群中选择满足规定条件的内容的信息处理装置的信息处理方法,其特征在于,包括:
分类步骤,分别在与内容的元数据的项目相应的层次中,按照基于对每个上述层次定义的上述元数据的距离尺度的上述元数据的分类,将构成上述内容群的各内容分类到多个簇中的任一个;
保持步骤,保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述簇之间的对应关系;
确定步骤,对每个上述层次指定与上述规定条件对应的上述簇,确定与所指定的上述簇对应的内容;以及
呈现步骤,呈现所确定的上述内容。
11(补正后).一种程序,是用于从内容群中选择满足规定条件的内容的程序,其特征在于,使计算机执行包括以下步骤的处理:
分类步骤,分别在与内容的元数据的项目相应的层次中,按照基于对每个上述层次定义的上述元数据的距离尺度的上述元数据的分类,将构成上述内容群的各内容分类到多个簇中的任一个;
保持步骤,保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述簇之间的对应关系;
确定步骤,对每个上述层次指定与上述规定条件对应的上述簇,确定与所指定的上述簇对应的内容;以及
呈现步骤,呈现所确定的上述内容。
基于条约第19条(1)的规定的说明书
申请人通过补正明确了如下内容:在权利要求书中的权利要求1、权利要求10以及权利要求11中,构成内容群的各内容分别在与内容的元数据的项目相应的层次中,按照基于对每个层次定义的元数据的距离尺度的元数据的分类,分类到多个簇中的任一个。
在特愿2003-285030号(特开2004-206679号公报)中记载有如下内容:关于由按内容表示内容属性的项目构成的元数据,将规定的项目作为分组项目,将该项目的结构要素分类到规定的组,按组进行内容推荐。在特愿2002-278043号(特开2004-117587号公报)中记载了根据属性信息来推荐乐曲的内容。在特愿2003-152447号(特开2004-355340号公报)中,记载了呈现应推荐的内容、并且作为推荐理由呈现内容属性的内容。但是,在这些中都没有记载如下内容:分别在与内容的元数据的项目相应的层次中,按照基于对每个层次定义的元数据的距离尺度的元数据的分类,将构成内容群的各内容分类到多个簇中的任一个。
本发明根据上述特征,按照基于对每个层次定义的元数据的距离尺度的元数据的分类来进行内容向簇的分类,并基于该内容向簇的分类来确定内容,因此能够起到如下效果:能够用更少的运算量来检索与用户的爱好一致的内容或者与所指定的内容类似的内容,从而呈现给用户。
另外,按照权利要求1的补正,补正了权利要求书中的权利要求5、权利要求6以及权利要求7。
Claims (11)
1.一种信息处理装置,从内容群中选择满足规定条件的内容,其特征在于,包括:
内容分类单元,其将构成上述内容群的各内容,分别在与内容的元数据相应的层次中分类到多个第1簇中的任一个;
保持单元,其保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述第1簇之间的对应关系;
确定单元,其对每个上述层次指定与上述规定条件对应的上述第1簇,确定与所指定的上述第1簇对应的内容;以及
呈现单元,其呈现由上述确定单元确定的上述内容。
2.根据权利要求1所述的信息处理装置,其特征在于,
还包括存储单元,该存储单元将由上述内容分类单元对上述内容所分类的各第1簇、与表示用户的爱好程度的爱好值相对应地进行存储,
上述确定单元根据由上述存储单元存储的爱好值来指定上述第1簇,确定与所指定的上述第1簇对应的内容。
3.根据权利要求2所述的信息处理装置,其特征在于,
上述确定单元从与所指定的上述第1簇对应的内容中,根据与上述爱好值相应的每个层次的权重进行了加权的、表示用户的内容爱好程度的评价值,进一步确定内容。
4.根据权利要求1所述的信息处理装置,其特征在于,还包括:
设定单元,其对由上述内容分类单元对上述内容所分类的各第1簇,设定关键词;以及
生成单元,其使用由上述设定单元设定的关键词,生成表示内容呈现理由的理由文,
上述呈现单元还呈现上述理由文。
5.根据权利要求1所述的信息处理装置,其特征在于,
上述内容是乐曲,
在上述元数据中,包括上述乐曲的速度、拍子或者节奏中的至少一个。
6.根据权利要求1所述的信息处理装置,其特征在于,
在上述元数据中,包括针对对应的内容的查看文本。
7.根据权利要求1所述的信息处理装置,其特征在于,
还包括元数据分类单元,该元数据分类单元将内容的元数据分类到多个第2簇的任一个,向第2簇分配上述层次,
上述内容分类单元在分配的上述各层次中分别将各内容分类到多个第1簇的任一个。
8.根据权利要求1所述的信息处理装置,其特征在于,
上述确定单元从与成为类似源的内容所被分类的上述第1簇对应的内容中,利用表示与成为类似源的内容之间的类似程度的类似度,进一步确定内容。
9.根据权利要求8所述的信息处理装置,其特征在于,
上述确定单元利用根据与成为类似源的内容归属到上述第1簇的权重相应的每个层次的权重进行了加权的上述类似度,确定内容。
10.一种信息处理方法,是从内容群中选择满足规定条件的内容的信息处理装置的信息处理方法,其特征在于,包括:
分类步骤,将构成上述内容群的各内容,分别在与内容的元数据相应的层次中分类到多个簇中的任一个;
保持步骤,保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述簇之间的对应关系;
确定步骤,对每个上述层次指定与上述规定条件对应的上述簇,确定与所指定的上述簇对应的内容;以及
呈现步骤,呈现所确定的上述内容。
11.一种程序,是用于从内容群中选择满足规定条件的内容的程序,其特征在于,使计算机执行包括以下步骤的处理:
分类步骤,将构成上述内容群的各内容,分别在与内容的元数据相应的层次中分类到多个簇中的任一个;
保持步骤,保持数据库,该数据库表示各内容与各内容分别所被分类的上述层次中的上述簇之间的对应关系;
确定步骤,对每个上述层次指定与上述规定条件对应的上述簇,确定与所指定的上述簇对应的内容;以及
呈现步骤,呈现所确定的上述内容。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005176519 | 2005-06-16 | ||
JP176519/2005 | 2005-06-16 | ||
JP2006151011A JP4752623B2 (ja) | 2005-06-16 | 2006-05-31 | 情報処理装置、情報処理方法、およびプログラム |
JP151011/2006 | 2006-05-31 | ||
PCT/JP2006/311742 WO2006134866A1 (ja) | 2005-06-16 | 2006-06-12 | 情報処理装置、方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101044484A true CN101044484A (zh) | 2007-09-26 |
CN101044484B CN101044484B (zh) | 2010-05-26 |
Family
ID=37532228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800008473A Expired - Fee Related CN101044484B (zh) | 2005-06-16 | 2006-06-12 | 信息处理装置和信息处理方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7953735B2 (zh) |
EP (1) | EP1804182A4 (zh) |
JP (1) | JP4752623B2 (zh) |
KR (1) | KR20080011643A (zh) |
CN (1) | CN101044484B (zh) |
WO (1) | WO2006134866A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104376034A (zh) * | 2013-08-13 | 2015-02-25 | 索尼公司 | 信息处理设备,信息处理方法和程序 |
US9204200B2 (en) | 2010-12-23 | 2015-12-01 | Rovi Technologies Corporation | Electronic programming guide (EPG) affinity clusters |
CN109448684A (zh) * | 2018-11-12 | 2019-03-08 | 量子云未来(北京)信息科技有限公司 | 一种智能编曲方法和系统 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100850774B1 (ko) * | 2006-11-13 | 2008-08-06 | 삼성전자주식회사 | 컨텐츠 분류 방법 및 그 방법을 수행할 수 있는 컨텐츠재생 장치 |
US20080156173A1 (en) * | 2006-12-29 | 2008-07-03 | Harman International Industries, Inc. | Vehicle infotainment system with personalized content |
JP4979000B2 (ja) * | 2007-01-05 | 2012-07-18 | Kddi株式会社 | 情報検索方法、装置およびプログラム |
JP2008257414A (ja) * | 2007-04-04 | 2008-10-23 | Toyota Central R&D Labs Inc | 情報選択支援システム、端末装置、情報選択支援装置、情報選択支援方法、プログラム |
JP4389973B2 (ja) | 2007-06-26 | 2009-12-24 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP5135931B2 (ja) * | 2007-07-17 | 2013-02-06 | ヤマハ株式会社 | 楽曲加工装置およびプログラム |
JP4433326B2 (ja) | 2007-12-04 | 2010-03-17 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US9514472B2 (en) | 2009-06-18 | 2016-12-06 | Core Wireless Licensing S.A.R.L. | Method and apparatus for classifying content |
US20110060738A1 (en) | 2009-09-08 | 2011-03-10 | Apple Inc. | Media item clustering based on similarity data |
CN102088750B (zh) * | 2009-12-08 | 2014-08-06 | 中国移动通信集团公司 | 一种多入多出技术中的传播径分簇方法和装置 |
KR101469021B1 (ko) | 2010-03-26 | 2014-12-04 | 후지쯔 가부시끼가이샤 | 카테고리 생성 프로그램, 카테고리 생성 장치 및 카테고리 생성 방법 |
JP2012027845A (ja) * | 2010-07-27 | 2012-02-09 | Sony Corp | 情報処理装置、関連文提供方法、及びプログラム |
US8577876B2 (en) * | 2011-06-06 | 2013-11-05 | Met Element, Inc. | System and method for determining art preferences of people |
JP5551760B2 (ja) * | 2012-02-02 | 2014-07-16 | 株式会社コナミデジタルエンタテインメント | 情報提供システム、サーバ装置、コンピュータプログラムおよび制御方法 |
JP5551759B2 (ja) * | 2012-02-02 | 2014-07-16 | 株式会社コナミデジタルエンタテインメント | 情報提供システム、サーバ装置、コンピュータプログラムおよび制御方法 |
WO2013114755A1 (ja) * | 2012-02-02 | 2013-08-08 | 株式会社コナミデジタルエンタテインメント | 情報提供システム、サーバ装置、記録媒体および制御方法 |
AU2014219089B2 (en) | 2013-02-25 | 2019-02-14 | Nant Holdings Ip, Llc | Link association analysis systems and methods |
JP2015056139A (ja) * | 2013-09-13 | 2015-03-23 | 株式会社東芝 | 電子機器、番組推奨システム、番組推奨方法及び番組推奨プログラム |
KR20160051983A (ko) * | 2014-10-30 | 2016-05-12 | 현대자동차주식회사 | 차량의 음악 추천 시스템 및 그 방법 |
WO2016098589A1 (ja) * | 2014-12-15 | 2016-06-23 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム、および情報処理システム |
US10776333B2 (en) * | 2016-07-22 | 2020-09-15 | International Business Machines Corporation | Building of object index for combinatorial object search |
US10936653B2 (en) | 2017-06-02 | 2021-03-02 | Apple Inc. | Automatically predicting relevant contexts for media items |
US10922337B2 (en) * | 2019-04-30 | 2021-02-16 | Amperity, Inc. | Clustering of data records with hierarchical cluster IDs |
US11003643B2 (en) * | 2019-04-30 | 2021-05-11 | Amperity, Inc. | Multi-level conflict-free entity clusterings |
GB2585890B (en) * | 2019-07-19 | 2022-02-16 | Centrica Plc | System for distributed data processing using clustering |
CN114402389A (zh) * | 2019-09-27 | 2022-04-26 | 雅马哈株式会社 | 音响解析方法、音响解析装置及程序 |
CN113704597A (zh) * | 2020-05-21 | 2021-11-26 | 阿波罗智联(北京)科技有限公司 | 内容推荐方法、装置和设备 |
JP2022126099A (ja) * | 2021-02-18 | 2022-08-30 | 富士通株式会社 | 情報処理プログラム、情報処理方法及び情報処理装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2809341B2 (ja) * | 1994-11-18 | 1998-10-08 | 松下電器産業株式会社 | 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 |
US20050038819A1 (en) * | 2000-04-21 | 2005-02-17 | Hicken Wendell T. | Music Recommendation system and method |
US6411724B1 (en) | 1999-07-02 | 2002-06-25 | Koninklijke Philips Electronics N.V. | Using meta-descriptors to represent multimedia information |
US7162482B1 (en) * | 2000-05-03 | 2007-01-09 | Musicmatch, Inc. | Information retrieval engine |
EP1156430A2 (en) * | 2000-05-17 | 2001-11-21 | Matsushita Electric Industrial Co., Ltd. | Information retrieval system |
JP3707361B2 (ja) * | 2000-06-28 | 2005-10-19 | 日本ビクター株式会社 | 情報提供サーバ及び情報提供方法 |
US7073193B2 (en) * | 2002-04-16 | 2006-07-04 | Microsoft Corporation | Media content descriptions |
US7194527B2 (en) | 2002-06-18 | 2007-03-20 | Microsoft Corporation | Media variations browser |
JP4282278B2 (ja) | 2002-07-04 | 2009-06-17 | シャープ株式会社 | 基板、その基板を用いた板状体の製造方法、板状体およびその板状体から作製した太陽電池 |
JP4142925B2 (ja) * | 2002-09-24 | 2008-09-03 | 株式会社エクシング | 選曲支援装置 |
US7657907B2 (en) * | 2002-09-30 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Automatic user profiling |
JP2004206679A (ja) | 2002-12-12 | 2004-07-22 | Sony Corp | 情報処理装置および方法、記録媒体、並びにプログラム |
JP4003127B2 (ja) * | 2002-12-12 | 2007-11-07 | ソニー株式会社 | 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム |
JP2004199544A (ja) * | 2002-12-20 | 2004-07-15 | Mitsubishi Electric Corp | 商品提案支援装置及び商品提案支援方法及びプログラム及びプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7120619B2 (en) | 2003-04-22 | 2006-10-10 | Microsoft Corporation | Relationship view |
JP2004355340A (ja) * | 2003-05-29 | 2004-12-16 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP4305836B2 (ja) * | 2003-08-29 | 2009-07-29 | 日本ビクター株式会社 | コンテンツ検索表示装置およびコンテンツ検索表示方法 |
US7693827B2 (en) * | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
JP2006048286A (ja) * | 2004-08-03 | 2006-02-16 | Sony Corp | 情報処理装置および方法、並びにプログラム |
US7558769B2 (en) * | 2005-09-30 | 2009-07-07 | Google Inc. | Identifying clusters of similar reviews and displaying representative reviews from multiple clusters |
-
2006
- 2006-05-31 JP JP2006151011A patent/JP4752623B2/ja not_active Expired - Fee Related
- 2006-06-12 CN CN2006800008473A patent/CN101044484B/zh not_active Expired - Fee Related
- 2006-06-12 WO PCT/JP2006/311742 patent/WO2006134866A1/ja active Application Filing
- 2006-06-12 EP EP06766604A patent/EP1804182A4/en not_active Withdrawn
- 2006-06-12 KR KR1020077003694A patent/KR20080011643A/ko not_active Application Discontinuation
- 2006-06-12 US US11/660,313 patent/US7953735B2/en not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9204200B2 (en) | 2010-12-23 | 2015-12-01 | Rovi Technologies Corporation | Electronic programming guide (EPG) affinity clusters |
CN104376034A (zh) * | 2013-08-13 | 2015-02-25 | 索尼公司 | 信息处理设备,信息处理方法和程序 |
CN104376034B (zh) * | 2013-08-13 | 2019-06-25 | 索尼公司 | 信息处理设备,信息处理方法和程序 |
CN109448684A (zh) * | 2018-11-12 | 2019-03-08 | 量子云未来(北京)信息科技有限公司 | 一种智能编曲方法和系统 |
CN109448684B (zh) * | 2018-11-12 | 2023-11-17 | 合肥科拉斯特网络科技有限公司 | 一种智能编曲方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
US7953735B2 (en) | 2011-05-31 |
EP1804182A4 (en) | 2007-12-12 |
KR20080011643A (ko) | 2008-02-05 |
US20090043811A1 (en) | 2009-02-12 |
JP4752623B2 (ja) | 2011-08-17 |
JP2007026425A (ja) | 2007-02-01 |
EP1804182A1 (en) | 2007-07-04 |
CN101044484B (zh) | 2010-05-26 |
WO2006134866A1 (ja) | 2006-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101044484A (zh) | 信息处理装置、方法以及程序 | |
CN1109994C (zh) | 文件处理装置与记录媒体 | |
CN1194319C (zh) | 对表格式数据进行查找、列表及分类的方法和装置 | |
CN1144145C (zh) | 用于数据仓库的选择聚集层和交叉产品层的方法和装置 | |
CN101069184A (zh) | 信息处理装置和方法、及程序 | |
CN1558348A (zh) | 将基于模式的分级数据结构转换成平面数据结构的方法以及系统 | |
CN1276575A (zh) | 数据库存取系统 | |
CN1607527A (zh) | 信息处理设备、信息处理方法、程序、和记录媒体 | |
CN1967695A (zh) | 信息处理装置、再现装置、通信方法、再现方法及计算机程序 | |
CN1924777A (zh) | 信息处理设备和方法以及程序 | |
CN1902911A (zh) | 节目推荐装置、节目推荐装置的节目推荐方法以及计算机程序 | |
CN1656455A (zh) | 管理文件的方法、操作对象显示限制程序和记录介质 | |
CN1190477A (zh) | 修改现有数据库以反映相应对象模型变化的方法和装置 | |
CN1748214A (zh) | 信息处理装置和方法、及程序 | |
CN1321923A (zh) | 画面程序作成方法、记录媒体 | |
CN1728142A (zh) | 信息检索系统中的短语识别 | |
CN1768373A (zh) | 信息处理装置、信息处理方法、及计算机程序 | |
CN1892880A (zh) | 内容提供系统、装置及方法、内容分发服务器及接收终端 | |
CN1728140A (zh) | 信息检索系统中基于短语的索引编制 | |
CN1922605A (zh) | 辞典制作装置以及辞典制作方法 | |
CN1321277A (zh) | 数据库系统 | |
CN1959705A (zh) | 信息处理装置、方法和程序 | |
CN1476613A (zh) | 信息处理设备和方法 | |
CN1677399A (zh) | 分级数据库管理的系统、方法和程序 | |
CN1752963A (zh) | 文档信息处理设备、文档信息处理方法及处理程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100526 Termination date: 20150612 |
|
EXPY | Termination of patent right or utility model |