CN100594496C - 信息处理装置和方法 - Google Patents

信息处理装置和方法 Download PDF

Info

Publication number
CN100594496C
CN100594496C CN200680001299A CN200680001299A CN100594496C CN 100594496 C CN100594496 C CN 100594496C CN 200680001299 A CN200680001299 A CN 200680001299A CN 200680001299 A CN200680001299 A CN 200680001299A CN 100594496 C CN100594496 C CN 100594496C
Authority
CN
China
Prior art keywords
user
cluster
content
melody
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200680001299A
Other languages
English (en)
Other versions
CN101069184A (zh
Inventor
山本则行
馆野启
斋藤真里
角田智弘
宫嵜充弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2005281357 priority Critical
Priority to JP281357/2005 priority
Priority to JP151012/2006 priority
Priority to JP2006151012A priority patent/JP4378646B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to PCT/JP2006/318373 priority patent/WO2007037139A1/ja
Publication of CN101069184A publication Critical patent/CN101069184A/zh
Application granted granted Critical
Publication of CN100594496C publication Critical patent/CN100594496C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/916Audio

Abstract

本发明提供一种信息处理装置和方法,它们能够通过CF方法抑制推荐集中于内容的一部分,并且向具有少量历史信息的用户推荐内容。步骤S11检测向其推荐乐曲的用户A和具有最相似历史信息的另一用户X。步骤S12检测用户X拥有而用户A不拥有的乐曲。步骤S13识别每个集群层中乐曲“a”所属的集群。步骤S14提取被分类到全部所识别的集群的共同乐曲作为推荐候选。此外,步骤S15在推荐候选中选择与乐曲“a”具有最相似的集群信息的一个乐曲。将由此选择的乐曲推荐给用户A。例如,本发明可应用于在因特网上构建的内容销售站点。

Description

信息处理装置和方法
技术领域
本发明涉及一种信息处理装置、信息处理方法和程序,尤
其涉及一种将内容分类成集群(cluster)、使用将内容分类成的集群管理内容特征、并在检索或推荐内容时使用该内容特征的信息处理装置和信息处理方法。
背景技术
传统上,已经提出了一种用于基于用户的偏好检索和推荐电视节目和乐曲等内容(所谓的内容个性化)的发明(例如,参见专利文献l )。
对于内容个性化,普遍使用被称为协作过滤(collaborativefiltering, CF )的方法和净皮称为基于内容过滤(content-basedfiltering, CBF )的方法。
CF方法管理每个用户的购买历史,当向用户A推荐内容时,检测与用户A具有相似购买历史的其他用户X,并推荐其他用户X已购买而用户A未购买的内容。例如,因特网上的邮购销售站点采用CF方法。
CBF方法在提取偏好和推荐内容中直接使用由分发端或销售端预先给予内容的元数据。具体来说,计算表示用户偏好的特征矢量与作为候选的每个乐曲的特征矢量之间的距离(余弦相关等),并推荐计算出的距离短的乐曲作为适合于该用户偏好的乐曲。
[专利文献l〗
日本特开2004-194107号公报发明内容
本发明要解决的问题
上述CF方法有以下不便:
(1) 不能将没有用户购买的内容推荐给任何用户。因此,内容的推荐集中在已准备的大量内容中的一部分,而其余的大多数内容没有被推荐。
(2) 当向新用户推荐内容时,有关该用户的购买历史的信息很少。因此,不能检测到具有相似历史信息的其他用户,因而不能推荐内容(所谓的冷开始问题)。
(3) 通常,内容的数量和用户的数量在增加。在这种情况下,检测具有相似历史信息的其他用户时的操作量也增加,使得不能快速确定要推荐的内容。
鉴于以上考虑做出本发明,本发明防止了 CF方法中推荐集中于内容的一部分,并向具有很少历史信息的用户推荐内容。用于解决问题的手段
根据本发明的 一 个方面,提供 一种用于从一组内容中选择满足预定条件的内容并将该内容呈现给用户的信息处理装置,该信息处理装置包括:内容分类部件,用于将形成该组内容的每个内容分类成与该内容的元数据相对应的每层中的多个第一集群中的一个;保持部件,用于保持表示每个内容与每个内容
分类到的层中的第 一 集群之间的对应关系的数据库;管理部件,用于管理关于用户的内容的历史信息;生成部件,用于基于用户的历史信息和数据库,以第一集群为单位生成表示用户的偏好的偏好信息;选择部件,选择部件,用于基于所述历史信息和/或所述偏好信息来检测与第一用户具有相似的历史信息或偏好信息的第二用户,以基于所述第一用户和所述第二用户的历史信息和/或偏好信息来识别所述第 一 用户感兴趣的第 一 集群,并且用于选择被分类到所识别的所述第一集群的内容;其 中,当对于所述第 一 用户之外不能检测到具有相似历史信息的 所述第二用户时,所述选择部件基于所述第一用户的所述偏好 信息,将所述第 一 用户的所述历史信息中存在的内容所属的第 一集群设置为所述第一用户感兴趣的第一集群,并选择属于所 述第一用户感兴趣的第一集群且在所述第一用户的所述历史信 息中不存在的内容。
选择部件可以包括:检测部件,用于^^测具有与第一用户 的历史信息相似的历史信息的第二用户;识别部件,用于识别 第一用户的历史信息中不存在而第二用户的历史信息中存在的 内容被分类到的第一集群;以及提取部件,用于提取被分类到 所识別的第 一 集群的内容;以及呈现部件可以向第 一 用户呈现 所提取的内容。
根据本发明的一个方面的信息处理装置还包括:分组部件, 用于基于偏好信息对用户进行分组;其中,选择部件可以包括: 检测部件,用于检测与第一用户属于同一组的第二用户;识别 部件,用于识别第一用户的历史信息中不存在而第二用户的历 史信息中存在的内容被分类到第一集群;以及提取部件,用于 提取被分类至U所识别的第 一 集群的内容;以及呈现部件可以向 第一用户呈现所提取的内容。
根据本发明的一个方面的信息处理装置,选择部件可以包 括:检测部件,用于检测具有由偏好信息所表示的与第一用户 的偏好相似的偏好的第二用户;识别部件,用于基于第一用户 的偏好信息和第二用户的偏好信息,识别感兴趣的第一集群; 以及提取部件,用于提取被分类到所识别的第 一 集群的内容; 以及呈现部件可以向第一用户呈现所提取的内容。
检测部件可以包括:标准化部件,用于将用户的偏好信息标准化;权重计算部件,用于根据每个用户标准化后的偏好信 息计算针对每个用户每层的权重;以及相似程度计算部件,用
于根据每层的权重和偏好信息,计算表示用户中的第一用户和 用户中的其他用户之间的偏好相似程度的相似程度;以及根据 所计算出的相似程度检测具有与第一用户的偏好相似的偏好的
第二用户。
根据本发明的一个方面的信息处理装置还可以包括:分组 部件,用于基于偏好信息对用户进行分组;其中,选择部件可 以包括:检测部件,用于检测与第一用户属于同一组的第二用 户;识别部件,用于基于第一用户的偏好信息和第二用户的偏 好信息,识别感兴趣的第一集群;以及提取部件,用于提取被 分类到所识別的第 一集群的内容;并且呈现部件可以向第 一用 户呈现所提取的内容。
根据本发明的一个方面的信息处理装置还可以包括:设置 部件,用于对通过内容分类部件将元数据分类到的每一第一集 群设置关键词;以及原因生成部仵,用于生成表示使用通过设 置部件所设置的关键词呈现内容的原因的原因文本;其中,呈 现部件还可以呈现该原因文本。
该信息处理装置还可以包括元数据分类部件,该元数据分 类部件用于将内容的元数据分类到多个第二集群中的一个,并 将层分配到第二集群;其中,内容分类部件将每个内容分类到 每个所分配的层中的多个第一集群中的一个。
该信息处理装置中的选择部件可以选择被分类到全部层中 的全部第一集群当中由偏好信息表示的最大数量的第一集群的 内容。
根据本发明的一个方面,提供了一种用于从一组内容选择 满足预定条件的内容并将该内容呈现给用户的信息处理装置的信息处理方法,该信息处理方法包括以下步骤:将形成该组内
容的每个内容分类到与该内容的元数据相对应的每层中的多个
集群中的一个;保持表示每个内容与将每个内容分类到的层中 的集群之间的对应关系的数据库;管理关于用户的内容的历史 信息;基于用户的历史信息和数据库,以第一集群为单位生成 表示用户的偏好的偏好信息;基于历史信息和/或偏好信息来检 测与第一用户具有相似的历史信息或偏好信息的第二用户,以 基于所述第一用户和所述第二用户的历史信息和/或偏好信息 来识别所述第一用户感兴趣的集群,并选择被分类成所识别的 集群的内容;以及呈现所选择的内容;其中,当对于所述第一 用户之外不能检测到具有相似历史信息的所述第二用户时,基 于所述第一用户的所述偏好信息,将所述第一用户的所述历史 信息中存在的内容所属的第一集群设置为所述第一用户感兴趣 的第一集群,并选择属于所述第一用户感兴趣的第一集群且在 所述第一用户的所述历史信息中不存在的内容。
根据本发明的--个方面,提供了 一种用于从一组内容选择 满足预定条件的内容并向用户推荐该内容的程序,该程序使计 算机进行包括以下步骤的处理:将形成该组内容的每个内容分 类到与该内容的元数据相对应的每层中的多个集群中的一个; 保持表示每个内容与将每个内容分类到的层中的集群之间的对 应关系的数据库;管理关于用户的内容的历史信息;基于历史 信息识别感兴趣的集群,并选择被分类到所识别的集群的内容; 以及呈现所选择的内容。
本发明的一方面,将形成该组内容的每个内容分类成到与 该内容的元数据相对应的每层中的多个集群中的 一个。然后, 保持表示每个内容与每个内容被分类到的层中的集群之间的对 应关系的数据库。另外,管理关于用户的内容的历史信息。然后,基于历史信息识别感兴趣的集群,选择被分类到所识别的 集群的内容,并呈现所选择的内容。
如上所述,才艮据本发明的一方面,可以通过CF方法向用户 推荐内容。
另外,根据本发明的一方面,可以防止推荐集中于全部内 容的一部分。
而且,根据本发明的一方面,甚至可以向具有少量历史信 息的用户推荐内容。
附图说明
图1是示出应用本发明的推荐系统的结构的例子的框图。
图2是表示将乐曲的元数据分类成的集群和集群层的概念 的图。
12图3是示出乐曲-集群对应表的例子的图。
图4是示出集群-乐曲对应表的例子的图。 — 图5A和图5B是示出用户的偏好矢量的例子的图。 图6是辅助解释离线时的预处理的流程图。 图7是辅助解释第 一推荐处理的流程图。 图8是辅助解释第二和第三推荐处理的流程图; 图9是辅助解释第四推荐处理的流程图。— 图IO是辅助解释第五和第六推荐处理的流程图。 图ll是辅助解释第七推荐处理的流程图。 图12是示出通用个人计算机的结构的例子的框图。 图13是示出根据本发明实施例的推荐系统的结构的另 一例 子的框图。
图14是辅助解释离线时的预处理的另 一例子的流程图。 图15是示出乐曲的软聚类后的元数据的例子的图。 图16是示出乐曲的元数据的例子的图。 图17是示出聚类后的乐曲的元数据的例子的图。 图18是示出相似用户检测单元的结构的例子的框图。 图19是辅助解释用于检测具有相似偏好的用户X的处理的 流程图。
图20是示出偏好矢量的例子的图。 图21是示出标准化的偏好矢量的例子的图。 图22是示出权重的例子的图。
图23是示出在不进行加权的情况下计算出的相似程度的例 子的图。
图2 4是示出在进行加权的情况下计算出的相似程度的例子 的图。
附图标记的说明1推荐系统、11乐曲DB、 12聚类单元、13关键词设置 单元、14聚类DB、 15集群-乐曲对应表、16乐曲-集群对应
表、17用户历史信息DB、 18推荐候选选择单元、19偏好矢 量生成单元、20相似用户检测单元、21用户分组单元、22差 异检测单元、23推荐集群确定单元、24提取单元、25乐曲 选择单元、26新乐曲判断单元、27选择原因生成单元、28呈 现单元、100个人计算机、101 CPU、 111记录介质、100元 数据聚类单元、202乐曲聚类单元、203相似用户4全测单元、 231标准化单元、232权重计算单元、233相似程度计算单元
具体实施方式
以下参照附图详细说明应用本发明的具体实施例。
图l示出根据本发明实施例的推荐系统的结构的例子。例 如,在因特网上建立的乐曲数据销售站点中,推荐系统l管理用 户历史信息(关于乐曲数据的购买、试听、检索和拥有等的信 息),通过使用CF方法来选择要推荐的乐曲,并将乐曲呈现给 用户。顺便提及,推荐系统l还可应用于销售例如电^L节目、电 影和书籍等乐曲以外的内容的销售站'点。
推荐系统l包括:乐曲DB(DB)ll,其中记录有向用户推 荐和销售的众多乐曲数据(以下也简称为乐曲)的元数据;聚 类单元12,用于基于记录在乐曲DB ll中的乐曲的元数据来聚 类乐曲并生成乐曲的集群信息;关键词设置单元13,用于设置 表示每个集群层和集群层中每个集群的特征的关键词;以及聚 类DB(DB) 14,用于保持乐曲的聚类结果。
聚类DB 14保持作为聚类结果的用于示出属于每个集群的 乐曲的集群-乐曲对应表15和用于示出属于每个乐曲的集群的 乐曲-集群对应表16。推荐系统l还包括:用户历史信息数据库(DB ) 17,用于 管理每个用户的历史信息;推荐候选选择单元18,用于基于用 户信息选择多个乐曲作为推荐候选;乐曲选择单元25,用于从 所选择的多个乐曲中选择一个乐曲;新乐曲判断单元26,用于 判断所选择的乐曲对于向其推荐该乐曲的用户是否是新的;选 择原因生成单元27,用于在将所选择的乐曲呈现给用户时生成 推荐原因文本;以及呈现单元28,用于向用户呈现所选择的乐 曲和推荐原因文本。
推荐候选选择单元18包括偏好矢量生成单元19、用户分组 单元20、相似用户4企测单元21、差异4全测单元22、推荐集群确 定单元23、以及提取单元24。
象CDDB (CD数据库)和Music Navi等作为因特网上提供 记录在音乐CD上的乐曲的元数据的数据服务器一样,乐曲DB 1 l保持要推荐和销售的乐曲的元数据。
聚类单元12基于乐曲的元数据的每一项(艺术家名字、类 型、唱片集、艺术家评论、乐曲评论、标题、音乐速度、拍子、 以及节奏等)或它们(音乐速度、拍子和节奏等)的组合,为 乐曲DB 11中的全部乐曲创建图2所示的集群层(第一到第n 层),并将乐曲分类到每个集群层中所设置的多个集群中的一个
或多个集群(聚类)。
尽管以上以乐曲作为例子进行了说明,但是也使用许多元 数据将艺术家和唱片集类似地聚类到多个层。对于乐曲推荐、 艺术家推荐和唱片集推荐,分别使用乐曲的多层集群、艺术家
的多层集群和唱片集的多层集群。
尽管对于聚类可以使用任何方法,但是为每个集群层选择 最佳聚类方法和距离测量。例如,当元数据的实际信息是音乐 速度等数字属性时,按照原样使用实际信息,然而当实际信息是标题等名称属性时,使用主成分分析的定量方法等将实际信 息转换成数值。定义欧几里德距离等距离测量。然后进行聚类。
典型的聚类方法包括K均值(K-means)方法、层次聚类 (hierarchical clustering)方法(组平均(group average)方法、最远 邻居(furthest neighbor)方法和Ward方法)、以及软聚类(soft clustering)方法等。
此时,优选进行反映偏好距离的聚类(例如,约束聚类 (constrained clustering))。为此,通过初步学习做出正确响应的 部分集合(根据偏好等的一组近实际信息和一组远实际信息), 并使用适合于此的数值表达式、距离和聚类方法。而且,优选 选择增强所形成的每个集群层的独立性的聚类方法(即,具有 不同特征的聚类方法)。
顺便提及,可以将 一 条实际信息分类到同 一 集群层中的多 个集群中。假定已知同一集群层中存在的集群间的距离(表示 相似程度)。后面将说明该聚类方法。然后生成集群信息,并将 集群信息输出到聚类DB 14,该集群信息由将元数据的每一项 的实际信息分类到的集群的集群ID (图2中的CL11等)构成, 作为代替元数据表示乐曲的特征的信息。
顺便提及,当不存在适合于分类的集群时,可以设置新的 集群。每个集群具有任意大小,并可以包括多条实际信息。顺 便提及,可以设置仅将单条实际信息分类到的集群。在这种情 况下,可以使用单条可分类的实际信息的ID (艺术家ID、唱片 集ID、或标题ID)作为该集群的集群ID。
聚类DB 14基于聚类单元12生成的每个乐曲的集群信息, 生成集群-乐曲对应表15和乐曲-集群对应表16,并保持集群-乐 曲对应表15和乐曲-集群对应表16。聚类DB 14还保持通过关键 词设置单元13设置给每个集群层和每个集群的关键词。图3示出乐曲-集群对应表16的例子。例如,图3示出乐曲ID =ABC123的乐曲的集群信息为(CL12、 CL21、 CL35、 CL47、
CL52.....以及CLn2)。例如,图3还示出乐曲ID = CTH863的
乐曲的集群信息为集群ID( CL11 、 CL25、 CL31 、 CL42、 CL53.....
以及CLnl )。
. 图4示出与图3所示的乐曲-集群对应表16相对应的集群-乐 曲对应表15的例子。例如,图4示出乐曲ID = CTH863对应于集 群ID-CLll。例如,图4还示出乐曲ID = ABC123对应于集群ID =CL21。例如,图4还示出乐曲ID- XYZ567对应于集群ID^ CX32。
顺便提及,每一次向乐曲DB ll添加新的乐曲的元数据时, 必须进行聚类单元12、关键词设置单元13和聚类DB 14的处理。
返回图l,用户历史信息DB 17保持表示每个用户在销售站 点上购买、试听或检索过的乐曲、或声称要在某销售站点购买 和已拥有的乐曲的历史信息。用户历史信息DB 17还保持每个 用户的偏好矢量,通过偏好矢量生成单元19生成该偏好矢量。 此外,用户历史信息DB 17保持用户分组单元20对用户的分组 结果,即,表示每个用户属于哪一用户组的信息。
偏好矢量生成单元19基于在用户历史信息DB 17中保持的 每个用户的历史信息,以全部集群中的每一个作为一个维度, 为每个用户生成多维偏好矢量。偏好矢量生成单元19将该偏好 矢量输出到用户历史信息DB 17。具体地,针对包括在用户的 历史信息中的每个乐曲,参考聚类DB 14中的乐曲-集群对应表 16,对偏好矢量的对应于乐曲所属集群的维度添加预定值。在 用户历史信息DB 17中管理所生成的每个用户的偏好矢量。当 通过购买乐曲等更新用户的历史信息时,也更新偏好矢量。
为了便于说明,假定如图5A和5B所示,作为全部集群,在第一层中仅存在三个集群CLll、 CL12和CL13,第二层中存在 四个集群CL21、 CL22、 CL23和CL24,第三层中存在三个集群 CL31、 CL32和CL33,而第四层中存在三个集群CL41 、 CL42和 CL43。在这种情况下,偏好矢量具有13个维度。
例如,当在用户A的历史信息中记录有购买两个乐曲,并 且第一个乐曲所属的集群ID为CLll、 CL22、 CL33和CL41时, 与这些集群ID相对应的每一维度值增加i。当第二个乐曲所属 的集群ID为CL12、 CL24、 CL32和CL43时,与这些集群ID相对 应的每一维度值增加l。因而,生成用户A的偏好矢量(1、 1、
0、 0、 1、 0、 1、 0、 1、 1、 1、 0、 1 )。
例如,当在用户x的历史信息中记录有购买三个乐曲,并
且第一个乐曲所属的集群ID为CLll、 CL22、 CL32和CL43时' 与这些集群ID相对应的每一维度值增加l。当第二个乐曲所属 的集群ID为CL12、 CL22、 CL33和CL42时,与这些集群ID相对 应的每一维度值增加l。当第三个乐曲所属的集群ID为CL13、 CL24、 CL33和CL41时,与这些集群ID相对应的每一 维度值增 加l。因而,生成用户X的偏好矢量(1、 1、 1、 0、 2、 0、 1、 0、
1、 2、 1、 1、 1 )。
顺便提及,可以根据历史信息的类型(即,购买、试听、 检索或拥有)改变添加给每一维度的值。例如,对于购买或拥 有可以添加1 ,对于试听可以添加0.5 ,而对于检索可以添力口 0.3 。
返回图1,用户分组单元20基于保持在用户历史信息DB 17 中的用户的偏好矢量之间的相似性对全部用户进行分组。然而, 为了易于进行用于确定多维偏好矢量之间的相似性的处理,将 每个用户的偏好矢量的每一维度的值二值化。也就是说,当每 一维度的值等于或大于l时,以l代替该值,而当每一维度的值 为O时,该值保持为O。当如此将偏好矢量的每一维度的值二值化时,与未进行二值化的情况相比较,可以减少相似性确定所
需的计算量。因此可以容易地进行分组。在用户历史信息DB 17 中管理分组结果。
相似用户检测单元21通过比较保持在用户历史信息DB 17 中的每个用户的历史信息来检测与向其推荐乐曲的用户具有相 似历史信息的其他用户。另外,相似用户检测单元21通过比较 保持在用户历史信息DB 17中的每个用户的历史信息来检测与 向其推荐乐曲的用户具有相似的偏好矢量的其他用户。差异检
测单元22基于保持在用户历史信息DB 17中的每个用户的历史 信息来检测向其推荐乐曲的用户与相似用户检测单元21检测到 的其他用户之间的历史信息中的差异。推荐集群确定单元23基 于向其推荐乐曲的用户和相似用户检测单元21检测到的其他用 户的偏好矢量之间的差异来确定推荐集群。提取单元24基于相 似用户4全测单元21到推荐集群确定单元23和聚类DB 14的处理 结果提取乐曲,作为推荐候选。
乐曲选择单元25根据预定条件从多个所提取的乐曲中选择 一个乐曲。例如,乐曲选择单元25选择一个属于较大数量的推 荐集群的乐曲,选择一个属于具有预先设定的高优先级的集群 层中的推荐集群的乐曲,或随机选择一个乐曲。乐曲选择单元 25将选择结果输出到新乐曲判断单元26和选择原因生成单元 27。根据向其推荐乐曲的用户的偏好矢量,当偏好矢量与所选 择的乐曲所属的集群之间的重叠程度为预定率(例如,30%) 或更高时,新乐曲判断单元26判断为不存在新乐曲。当重叠程 度低于预定率时,新乐曲判断单元26判断为存在新乐曲。新乐 曲判断单元2 6将判断结果输出到选择原因生成单元2 7 。
选择原因生成单元2 7从聚类D B 14获得对应于所选择的乐 曲所属的集群层或集群的关键词,并使用所获得的关键词等生成表示选择原因的选择原因文本。另外,选择原因生成单元27 还基于来自新乐曲判断单元26的判断结果,通过例如包括针对 新的乐曲的"意外"等词、或针对非新的乐曲的"普通"或"常见" 等词来生成选择原因文本。然后,选择原因生成单元27将所生 成的选择原因文本和所选择的乐曲的乐曲ID —起输出到呈现 单元28。
顺《更提及,可以按照原样引用所选择的乐曲的评论文本作 为选择原因文本,也可以使用从所选择的乐曲的评论文本中提 取的词来生成选择原因文本。顺便提及,可以将Tf/idf方法应用 于从评论文本中提取选择原因文本中所使用的词。
呈现单元28从乐曲DB获得关于所选择的乐曲的信息,并将 该信息和所生成的选择原因文本一起呈现给用户端。
接着说明推荐系统l的操作。首先,参照图6的流程图说明 作为推荐乐曲的处理的准备的离线时的预处理。
在步骤Sl,聚类单元12针对乐曲的元数据的每一项将乐曲 DB ll中的全部乐曲分类到集群层(第一到第n层)中的一个, 并将每一项的实际信息分类到分类后的集群层中所设置的多个 集群中的一个(聚类)。然后,聚类单元12生成集群信息作为代 替元数据表示乐曲的特征的信息,该集群信息由将元数据的每 一项的实际信息分类到的集群的集群ID构成。聚类单元12将集 群信息输出到聚类DB 14。顺便提及,可以省略对已聚类的乐 曲的聚类,而仅对未聚类的乐曲进行聚类。聚类DB 14基于通 过聚类单元12生成的每个乐曲的集群信息,生成集群-乐曲对应 表15和乐曲-集群对应表16。
在步骤S2,推荐候选选择单元18中的偏好矢量生成单元l9 基于保持在用户历史信息DB 17中的每个用户的历史信息,生 成每个用户的偏好矢量。偏好矢量生成单元19将偏好矢量输出到用户历史信息DB 17。在步骤S3,用户分组单元20基于保持 在用户历史信息DB 17中的每个用户的偏好矢量的相似性,对 所有用户进行分组。然而,为了易于进行用于判断多维偏好矢 量之间的相似性的处理,将每个用户的偏好矢量的每一维度的 值二值化。然后,将分组结果输出到用户历史信息DB 17。经 过前述处理后,结束离线时的预处理。作为预处理,通过如此聚类保持在乐曲DB ll中的全部乐 曲,生成每个用户的偏好矢量,并对所有用户进行分组,可以 快捷地进行后述的第一到第七推荐处理。顺便提及,第一到第 七推荐处理中的某些不<吏用用户组信息。因此,当j又进4亍不4吏 用用户组信息的推荐处理时,可以省略步骤S3的处理。接着参照图7的流程图说明第一推荐处理。以下,将向其推 荐乐曲的用户描述为用户A。例如,当用户A访问销售站点时, 开始该处理。在步骤Sll,相似用户;f全测单元21比l^保4争在用户历史信 息DB 17中的用户A的历史信息和其他用户的历史信息,从而斥全 测具有与用户A的历史信息最相似的历史信息的其他用户X。在 步骤S12,差异检测单元22基于保持在用户历史信息DB 17中的 用户A和用户X的历史信息,检测用户X具有(过去购买了或拥 有的)而用户A不具有的乐曲。顺便提及,当存在多个满足该 条件的乐曲时,例如,随机选择乐曲中的一个。将所选择的乐 曲设置为乐曲a。在步骤S13,推荐集群确定单元23参考聚类DB 14中的乐曲 -集群对应表16,以识别该乐曲所属的每个集群层中的集群。在 步骤S14,提取单元24参考聚类DB 14中的集群-乐曲对应表15, 以提取被分类到步骤S13的处理中识别出的所有集群的共同乐 曲。将该步骤中提取的乐曲设置为推荐候选。可能存在多个推出的集群中尽可能多的集群的共同乐曲,并将其设置为推 荐候选。在步骤S15,乐曲选择单元25选择作为推荐候选的乐曲中 具有与在步骤S12中检测到的乐曲a的集群信息最相似的集群信 息的乐曲。乐曲选择单元25将选择结果输出到新乐曲判断单元 26和选择原因生成单元27。在步骤S16,新乐曲判断单元26基 于用户A的偏好矢量和所选择的乐曲所属的集群,判断是否存 在新乐曲。新乐曲判断单元26将判断结果输出到选择原因生成 单元27。选择原因生成单元27从聚类DB 14获得与所选择的乐 曲所属的集群层或集群相对应的关键词,并使用所获得的关键 词等生成表示选择原因的选择原因文本。另外,选择原因生成 单元27还基于来自新乐曲判断单元26的判断结果生成选择原因 文本。然后,选择原因生成单元27将所生成的选择原因文本和 所选择的乐曲的乐曲ID —起输出到呈现单元28。在步骤S17, 呈现单元28从乐曲DB获得关于所选择的乐曲的信息,并将该信 息和所生成的选择原因文本一起呈现到用户端。经过前述处理 后,结束第一推荐处理。接着参照图8的流程图说明第二和第三推荐处理。首先说明 第二推荐处理。例如,当用户A访问销售站点时,开始该处理。在步骤S21,相似用户检测单元21比较保持在用户历史信 息DB 17中的用户A的偏好矢量和其他用户的偏好矢量,从而检 测具有与用户A的偏好矢量最相似的偏好矢量的其他用户X。顺 便提及,例如,通过计算这两个偏好矢量之间的余弦相关值来 判断用户A的偏好矢量与其他用户的偏好矢量之间的相似性。在步骤S22,差异^r测单元22检测在用户A的偏好矢量中为o值而在用户x的偏好矢量中不为o值的偏好矢量维度,并将与 检测到的维度相对应的集群设置为推荐集群。例如,当用户A的偏好矢量为图5A所示的(1、 1、 0、 0、 1、 0、 1、 0、 1、 1、 1、 0、 1),而用户X的偏好矢量为图5B所示的 (1、 1、 1、 0、 2、 0、 1、 0、 1、 2、 1、 1、 1)时,将集群CL13 和CL42设置为推荐集群,如图5B中的阴影线所示。在步骤S23,参考用户历史信息DB 17和聚类DB 14中的集 群-乐曲对应表15,提取单元24从分类到推荐集群的全部乐曲中 提取用户X具有而用户A不具有的乐曲。提取单元24将所提取的 乐曲设置为推荐候选。在步骤S24,乐曲选择单元25通过以下三种方法中的一种 或作为这三种方法的组合的方法,从作为推荐候选的乐曲中选 择一个乐曲,然后将选择结果输出到新乐曲判断单元26和选择 原因生成单元27。第一种方法是选择属于较大数量的推荐集群 的共同乐曲。第二种方法是预先区分集群层的优先级,并选择 被分类到属于具有较高优先级的集群层的推荐集群的乐曲。第 三种方法是随机选择。在步骤S25,新乐曲判断单元26基于用户A的偏好矢量和所 选择的乐曲所属的集群,判断是否存在新乐曲。新乐曲判断单 元26将判断结果输出到选择原因生成单元27。选择原因生成单 元27从聚类DB 14获得与所选择的乐曲所属的集群层或集群相 对应的关键词,并使用所获得的关键词等生成表示选择原因的 选择原因文本。另外,选择原因生成单元27还基于来自新乐曲 判断单元26的判断结果,生成选择原因文本。然后,选择原因 生成单元27将所生成的选择原因文本和所选择的乐曲的乐曲 ID —起输出到呈现单元28。在步骤S26,呈现单元28从乐曲DB 获得关于所选择的乐曲的信息,并将该信息和所生成的选择原推荐处理。接着说明第三推荐处理。在上述第二推荐处理的步骤S23 的处理中,第三推荐处理从分类到推荐集群的全部乐曲中提取 用.户A不具有的乐曲,并将所提取的乐曲设置为推荐候选。也 就是说,可以将用户X不具有的乐曲设置为推荐候选。其它处 理与第二4侓荐处理中的相同,因此省略对其说明。接着参照图9的流程图说明第四推荐处理。例如,当用户A 访问销售站点时,开始该处理。在步骤S41,基于保持在用户历史信息DB 17中的用户A的 组信息,相似用户^^全测单元21随机确定与用户A属于同 一组的 其他用户X。在步骤S42,差异检测单元22基于保持在用户历史 信息DB 17中的用户A和用户X的历史信息,检测用户X具有而 用户A不具有的乐曲。顺便提及,当存在多个满足该条件的乐 曲时,例如,随机选择乐曲中的一个。将检测到的乐曲设置为 乐曲a。在步骤S43,推荐集群确定单元23参考聚类DB 14中的乐曲 -集群对应表16,以识别乐曲a所属的每个集群层中的集群。在 步骤S44,提取单元24参考聚类DB 14中的集群-乐曲对应表15, 以提取分类到步骤S43的处理中识别出的所有集群的共同乐 曲。将在该步骤中提取的乐曲设置为推荐候选。可能存在多个 推荐候选。顺便提及,当不存在分类到步骤S43的处理中识别 出的所有集群的共同乐曲时,提取分类到在步骤S43的处理中 识別出的集群中尽可能多的集群的共同乐曲,并将其设置为推 荐候选。在步骤S45,乐曲选择单元25选择作为推荐候选的乐曲中 具有最相似于在步骤S 4 2中检测到的乐曲a的集群信息的集群信息的 一个乐曲。乐曲选择单元25将选择结果输出到新乐曲判断
单元26和选择原因生成单元27。在步骤S46,新乐曲判断单元 26基于用户A的偏好矢量和所选择的乐曲所属的集群,判断是 否存在新乐曲。新乐曲判断单元26将判断结果输出到选择原因 生成单元27。选择原因生成单元27从聚类DB 14获得与所选择 的乐曲所属的集群层或集群相对应的关键词,并使用所获得的 关键词等生成表示选择原因的选择原因文本。另外,选择原因 生成单元27还基于来自新乐曲判断单元26的判断结杲生成选择 原因文本。然后,选择原因生成单元27将所生成的选择原因文 本和所选择的乐曲的乐曲ID —起输出到呈现单元28。在步骤 S47,呈现单元28从乐曲DB获得关于所选择的乐曲的信息,并 将该信息和所生成的选择原因文本一起呈现到用户端。经过前 述处理后,结束第四推荐处理。
在第四推荐处理中,使用通过离线时的预处理分组的用户 的组信息,因此,可以快速确定具有与用户A的历史相似的历 史的用户X。
接着参考图10的流程图说明第五和第六推荐处理。首先说 明第五推荐处理。例如,当用户A访问销售站点时,开始该处 理。
在步骤S51,基于保持在用户历史信息DB 17中的用户A的 组信息,相似用户检测单元21随机确定与用户A属于同一组的 其他用户X。
在步骤S 5 2 ,差异检测单元2 2检测在用户A的偏好矢量中为 0值而在用户X的偏好矢量中不为O值的偏好矢量维度,并将与 检测到的维度相对应的集群设置为推荐集群。
在步骤S53,参考用户历史信息DB 17和聚类DB 14中的集 群-乐曲对应表15,提取单元24从分类到推荐集群的全部乐曲中提取用户X具有而用户A不具有的乐曲。提取单元24将所提取的 乐曲设置为推荐候选。
在步骤S54,乐曲选择单元25通过以下三种方法中的一种 或作为这三种方法的组合的方法,从作为推荐候选的乐曲中选 择一个乐曲,然后将选择结果输出到新乐曲判断单元26和选择 原因生成单元27。第一种方法是选择属于较大数量的推荐集群 的共同乐曲。第二种方法是预先区分集群层的优先级,并选择 分类到属于具有较高优先级的集群层的推荐集群的乐曲。第三 种方法是随机选择。
在步骤S55,新乐曲判断单元26基于用户A的偏好矢量和所 选择的乐曲所属的集群判断是否存在新乐曲。新乐曲判断单元 26将判断结果输出到选择原因生成单元27。选择原因生成单元 27从聚类DB 14获得与所选择的乐曲所属的集群层或集群相对 应的关键词,并使用所获得的关键词等生成表示选择原因的选 择原因文本。另外,选择原因生成单元27还基于来自新乐曲判 断单元26的判断结果生成选择原因文本。然后,选择原因生成 单元27将所生成的选择原因文本和所选择的乐曲的乐曲ID — 起输出到呈现单元28。在步骤S56,呈现单元28从乐曲DB获得 关于所选择的乐曲的信息,并将该信息与所生成的选择原因文 本一起呈现到用户端。经过前述处理后,结束第五推荐处理。
接着说明第六推荐处理。在上述第五推荐处理的步骤S53 的处理中,第六推荐处理从分类到推荐集群的全部乐曲中提取 用户A不具有的乐曲,并将所提取的乐曲设置为推荐候选。也 就是说,可以将用户X不具有的乐曲设置为推荐候选。其它处 理与第五推荐处理中的相同,因此省略对其说明。
在第五和第六推荐处理中,使用通过离线时的预处理分组 的用户的组信息,因此可以快速确定具有与用户A的历史相似的历史的用户x。
接着参照图ll的流程图说明第七推荐处理。首先说明第七
推荐处理。该处理适合于存在非常少量的用户A的历史信息的 情况和存在小数量其他用户的情况等,例如,当用户A访问销 售站点时,开始该处理。
在步骤S61,差异检测单元22在用户A的偏好矢量的维度中 检测其值等于或大于预定值的维度,并将与该维度相对应的集 群设置为推荐集群。
在步骤S62,参考用户历史信息DB 17和聚类DB 14中的集 群-乐曲对应表15,提取单元24从分类到推荐集群的全部乐曲中 提取用户A不具有的乐曲。提取单元24将所提取的乐曲设置为 推荐候选。
在步骤S63,乐曲选择单元25在作为推荐候选的乐曲中选
择属于最大数量推荐集群的 一 个乐曲,然后将选择结果输出到
新乐曲判断单元26和选择原因生成单元27。顺便提及,当存在
多个属于最大数量推荐集群的乐曲时,例如,从乐曲中随机选 择一个乐曲。
在步骤S64,新乐曲判断单元26基于用户A的偏好矢量和所 选择的乐曲所属的集群,判断是否存在新乐曲。新乐曲判断单 元26将判断结果输出到选择原因生成单元27。选择原因生成单 元27从聚类DB 14获得与所选择的乐曲所属的集群层或集群相 对应的关键词,并使用所获得的关键词等生成表示选择原因的 选择原因文本。另外,选择原因生成单元27还基于来自新乐曲 判断单元26的判断结果生成选择原因文本。然后,选择原因生 成单元27将所生成的选择原因文本和所选择的乐曲的乐曲ID 一起输出到呈现单元28。在步骤S65,呈现单元28从乐曲DB获 得关于所选择的乐曲的信息,并将该信息和所生成的选择原因文本一起呈现到用户端。经过前述处理后,结束第七推荐处理。 根据上述第 一到第七推荐处理,以每个集群作为 一个维度,
以偏好矢量代替用户的历史信息,并且应用CF方法。因此可以 防止推荐给用户A的乐曲集中于乐曲DB 11中的全部乐曲中的 一部分。还可以向具有少量历史信息的用户推荐乐曲,因此避 免了所谓的冷开始问题。此外,还可以向用户A呈现选择所推 荐的乐曲的原因,并且,例如,可以告知用户A所推荐的乐曲 对于用户A是否是新的。
应该注意,本发明不仅可以应用于推荐乐曲的情况,还可 应用于销售例如电视节目、电影和书籍等乐曲以外的内容的销 售站点。
不4义可以通过石更件,而且还可以通过4欠件来实现上述系列 处理。当通过软件实现该系列处理时,将构成该软件的程序从 记录介质安装到专用设备所包含的计算机上或安装到例如如图 12所配置的可通过将各种程序安装在其上来执行各种功能的通 用个人计算机。
个人计算机100包括CPU (中央处理单元)101。 CPU 101 通过总线104与输入-输出接口 105连接。总线104与ROM (只读 存储器)102和RAM (随机存取存储器)103连接。
输入-输出接口 105与以下单元连接:输入单元106,其包括 键盘和鼠标等输入装置,用户向其输入操作命令;输出单元107, 其包括CRT (阴极射线管)和LCD (液晶显示器)等显示器, 用于屏幕显示;存储单元108,其包括用于存储程序和各种数据 的硬盘驱动器等;以及通信单元109,其包括调制解调器和LAN (局域网)适配器等,通信单元109通过以因特网为代表的网络 进行通信处理。输入-输出接口 105还与用于从记录介质lll读取 数据和将数据写到记录介质111的驱动器110连接,记录介质lll有磁盘(包括软盘)、光盘(包括CD-ROM ( Compact Disc-ReadOnly Memory,紧凑型盘-只读存储器)和DVD ( Digital VersatileDisc,数字通用盘))、磁光盘(包括MD ( Mini Disc,小型盘))、
或半导体存储器等。
'以以下状态将用于使个人计算机100执行上述系列处理的程序提供给个人计算机100:该程序存储在记录介质lll上,通过驱动器110读取,并安装在存储单元108中所包括的硬盘驱动器上。根据与输入到输入单元106的用户命令相对应的CPU 101的指令,从存储单元108将安装在存储单元108中的程序加载到RAM 103中,并扭j亍该程序。
图13示出根据本发明实施例的推荐系统1的结构的另 一例子的框图。在图13中,与图l所示相同的部分以相同附图标记来表示,并省略对其说明。
图13所示的推荐系统1包括乐曲DB 11、关键词设置单元13、聚类DB 14、用户历史信息DB17、推荐候选选择单元18、乐曲选择单元25、新乐曲判断单元26、选4奪原因生成单元27、呈现单元28、元数据聚类单元201、以及乐曲聚类单元202。
元数据聚类单元201对记录在乐曲DB 11中的每个集群的元数据进行聚类。也就是说,元数据聚类单元201将作为内容的乐曲的元数据分类到多个集群中的一个,并将层分配到集群。
元数据聚类单元201将对每个乐曲的元数据的聚类的结果提供给乐曲聚类单元202。
基于元数据聚类单元201对每个乐曲的元数据的聚类结果,象聚类单元12 —样,乐曲聚类单元202对每个乐曲进行聚类,并生成每个乐曲的集群信息。也就是说,乐曲聚类单元202根据每个乐曲的聚类结果生成集群信息。乐曲聚类单元202将集群信息输出到聚类DB 14。图13所示的推荐系统l中的推荐候选选择单元18包括偏好矢量生成单元19、用户分组单元20、差异^^测单元22、推荐集群确定单元23、提取单元24、以及相似用户检测单元203。
相似用户检测单元203通过比较保持在用户历史信息DB17中的每个用户的偏好矢量来检测具有与向其推荐乐曲的用户相似的偏好矢量的其他用户。更具体地,相似用户检测单元203将作为用户偏好信息的例子的偏好矢量标准化,根据每个用户的标准偏好矢量针对每个用户计算每层的权重,根据每层的权重和偏好矢量计算表示用户之间的偏好相似程度的相似程度,并检测与第一用户具有相似偏好的第二用户。
接着参照图14的流程图说明作为图13所示的推荐系统l中推荐乐曲处理的准备的离线时的预处理的另 一例子。
在步骤S201,元数据聚类单元201从乐曲DB ll获得乐曲的元数据,并压缩所获得的元数据的维度。例如,在步骤S201,元数据聚类单元201通过LSA( the latent semantic analysis,潜在语义分析)、PLSA ( the probabilistic latent semantic analysis, 概率潜在语义分析)、或量化方法III ( quantification method III)等方法来压缩从乐曲DB ll获得的乐曲的元数据的维度。
顺便提及,在步骤S201,元数据聚类单元201可以将乐曲的元数据矢量化。
在步骤S 20 2,元数据聚类单元2 01对每个乐曲的元数据聚类。例如,在步骤S202,元数据聚类单元201对每个乐曲的元数据进行软聚类。
更具体地,例如,如图15中所示,元数据聚类单元201对每个乐曲的元数据进行软聚类,使得对于每层内各集群的项目权重的总和为1。
例如,属于由乐曲ID ABC123识别的乐曲的元数据的第一层中的第一集群、第二集群、第三集群和第四集群的权重分别
为O.O、 0.8、 0.0和0.2。属于由乐曲ID ABC123识別的乐曲的元
数据的第二层中的第五集群、第六集群、第七集群和第八集群的权重分別为0.4、 0.6、 O.O和O.O。属于由乐曲ID ABC123识别的乐曲的元数据的第三层中的第九集群、第十集群和第十一集群的4又重分别为0.0、 O.O和l.O。属于由乐曲ID ABC123识别的乐曲的元数据的第n层中的四个集群的j又重分别为l.O、 0.0、 0.0
和o.o。
例如,属于由乐曲ID CTH863识別的乐曲的元数据的第一层中的第一集群、第二集群、第三集群和第四集群的权重分別为l.O、 0.0、 O.O和O.O。属于由乐曲ID CTH863识别的乐曲的元数据的第二层中的第五集群、第六集群、第七集群和第八集群的权重分别为O.O、 0.5、 0.5和0.0。属于由乐曲ID CTH863识別的乐曲的元数据的第三层中的第九集群、第十集群和第十 一 集群的权重分别为0.7、 0.3和0.0。属于由乐曲ID CTH863识别的乐曲的元数据的第n层中的四个集群的权重分别为O.O、 0.8、 0.2
和o.o。
例如,属于由乐曲ID XYZ567识别的乐曲的元凄t据的第一层中的第一集群、第二集群、第三集群和第四集群的权重分别为O.O、 0.4、 0.6和0.0。属于由乐曲ID XYZ567识別的乐曲的元数据的第二层中的第五集群、第六集群、第七集群和第八集群的权重分別为O.O、 0.0、 O.O和l.O。属于由乐曲ID XYZ567识别的乐曲的元数据的第三层中的第九集群、第十集群和第十一集群的权重分别为0.9、 O.O和O.l。属于由乐曲ID XYZ567识別的乐曲的元数据的第n层中的四个集群的权重分别为0.3、 0.0、 0.0和0.7。
顺便提及,每个乐曲的元数据的软聚类不局限于使得属于每层内的集群的项,即乐曲的权重的总和为l的软聚类。另夕卜, 项目可以不属于各层中的任何集群。
在步骤S203,元数据聚类单元201分配集群层。
以下参照图16和图17说明元数据的聚类和集群层的分配。 图16是示出元数据的例子的图。为了便于说明,图16中所示的 元数据是具有值0或1的分类数据。
元数据l、元数据2和元数据3属于作为较高次序分类的 meta-group 1。元数据4、元数据5和元数据6属于作为较高次序 分类的meta-group 2 。 例如,关于艺术家的元数据属于 meta-group 1 。元数据l代表艺术家的外貌。元数据2代表组。例 如,关于类型的元数据属于meta-group 2。元数据4代表流4亍音 乐。元数据5代表摇滚音乐。
在图16所示的例子中,由乐曲ID ABC123识別的乐曲的元 数据1〜6分別为1、 1、 1、 1、 l和l。由乐曲ID CTH863识別的 乐曲的元凄丈据l ~ 6分别为0、 1、 0、 0、 l和l。由乐曲IDXYZ567 识别的乐曲的元数据l ~ 6分别为1 、 1、 1、 1、 l和l。由乐曲ID EKF534识别的乐曲的元数据l ~ 6分别为1、 0、 1、 0、 0和1。由 乐曲ID OPQ385识别的乐曲的元数据l ~ 6分别为1 、 0、 1、 1、 0 和0。
将通过乐曲ID ABC 123 ~ OPQ3 85识别的乐曲的元数据l作 为矢量。类似地,将通过乐曲ID ABC123 ~ OPQ385识別的乐曲 的元数据2 ~ 6中的每一个作为矢量。也就是说,将多个乐曲的 一条元数据的值作为矢量。
讨-论矢量之间的距离。
在图16所示的例子中,将元数据l、元数据3和元数据4集合 到等于或小于一个Manhattan距离的集群中。将元数据2、元数 据5和元数据6集合到等于或小于 一 个Manhattan距离的另 一 集群中。
因此,将这些集群设置为新的元数据层次。也就是说,将 较近的元数据分配给该层次的每层。
图17示出如此聚类并分配到各层的元数据的例子。在图17 所示的例子中,元数据l、元数据3和元数据4属于第一层。元数 据2、元数据5和元数据6属于第二层。
因此,由一组高度相关的元数据形成每一层,并在所述层 中对内容进行聚类。因此可以反映集群中内容之间的细微差异, 这种差异不能通过按照原样将类型和艺术家等设置为层的普通
分层来表达。
返回图14,在步骤S204,乐曲聚类单元202聚类每一层中 的乐曲。也就是说,乐曲聚类单元202将每个内容分类到每个所 分配的层中的多个集群中的一个。
步骤S205和步骤S206分别与图6中的步骤S2和S3相同,因 此省略对其i^明。
因此,可以以减少的数据量和减少的计算量聚类内容,同 时维持元数据表达的内容细节(表达的细节的程度)。
从而很好地表达内容之间的细微差异。
接着详细说明相似用户检测单元203。
图1 8是示出相似用户4全测单元203的结构的例子的框图。相 似用户检测单元203包括标准化单元231、权重计算单元232和相 似程度计算单元233。
标准化单元231对作为用户偏好信息的例子的偏好矢量进 行标准化。权重计算单元232根据每个用户的标准偏好矢量针对 每个用户计算每层的权重。相似程度计算单元233根据每层的权 重和偏好矢量,计算表示向其推荐乐曲的用户与其他用户之间的偏好相似程度的相似程度。
接着参照图19的流程图说明用于通过相似用户检测单元 203检测具有相似偏好的用户X的处理,该处理对应于图8中的 步骤S21。
•在步骤S231,标准化单元231对每个用户的偏好矢量进行 标准化。
参照图20和图21说明偏好矢量的标准化。图20是示出在偏 好矢量生成单元19中生成的且保持在用户历史信息DB 17中的 用户的偏好矢量的例子的图。也就是说,图20示出标准化前的 偏好矢量的例子。
在图20中所示的偏好矢量的各元素中,前四个元素属于第 一层,其次的四个元素属于第二层,接着的三个元素属于第三 层,而最后的四个元素属于第四层。
在图20所示的例子中,由用户ID U001识別的用户的偏好 矢量为(0.0、 2.8、 0.0、 2.2、 0.4、 0.6、 0.8、 0.0、 0.5、 0.4、 0.4、 0.0、 0.5、 0.4和0.0)。在这种情况下,前四个元素O.O、 2.8、 0.0和2.2属于第一层,其次的四个元素0.4、 0.6、 0.8和0.0属于 第二层,接着的三个元素0.5、 0.4和0.4属于第三层,而最后的 四个元素O.O、 0.5、 0.4和0.0属于第四层。
在图20所示的例子中,由用户ID U002识別的用户的偏好 矢量为(0.2、 0.8、 0.5、 0.6、 0.0、 0.5、 0.5、 0.0、 0.7、 0.3、 0.6、 0.0、 0.6、 0.2和0.0)。在这种情况下,前四个元素0.2、 0.8、 0.5和0.6属于第一层,其次的四个元素O.O、 0.5、 0.5和0.0属于 第二层,接着的三个元素0.7、 0.3和0.6属于第三层,而最后的 四个元素O.O、 0.6、 0.2和0.0属于第四层。
在图20所示的例子中,由用户ID U003识别的用户的偏好 矢量为(0.0、 2.2、 0.1、 1.6、 0.0、 1,0、 2.0、 1.4、 0.0、 1.2、0.1、 0.3、 0.4、 0.6和0.7)。在这种情况下,前四个元素O.O、 2.2、 0.1和1.6属于第一层,其次的四个元素O.O、 1.0、 2.0和1.4属于 第二层,接着的三个元素O.O、 1.2和0.1属于第三层,而最后的 四个元素0.3、 0.4、 0.6和0.7属于第四层。
例如,在步骤S231,标准化单元231对每一偏好矢量进行 标准化,使得每层中的范数(norm)为1。
图21是示出通过标准化图2 0中的偏好矢量使得每层中的标 准为l所获得的偏好矢量的例子的图。
在图21所示的例子中,由用户ID U001识别的用户的标准 偏好矢量为(0.0、 0.8、 0.0、 0.6、 0.4、 0.6、 0.7、 0.0、 0.7、 0.5、 0.5、 0.0、 0.5、 0.4和0.0)。在这种情况下,前四个元素O.O、 0.8、 0.0和0.6属于第 一层,其次的四个元素0.4、 0.6、 0.7和0.0 属于第二层,接着的三个元素0.7、 0.5和0.5属于第三层,而最 后的四个元素O.O、 0.5、 0.4和0.0属于第四层。
在图21所示的例子中,由用户ID U002识別的用户的标准 偏好矢量为(0.2、 0.7、 0.4、 0.5、 0.0、 0.7、 0.7、 0.0、 0.7、 0.3、 0.6、 0.0、 0.8、 0.3和0.0)。在这种情况下,前四个元素0.2、 0.7、 0.4和0.5属于第一层,其次的四个元素O.O、 0.7、 0.7和0.0 属于第二层,接着的三个元素0.7、 0.3和0.6属于第三层,而最 后的四个元素O.O、 0.8、 0.3和0.0属于第四层。
在图21所示的例子中,由用户ID U003识别的用户的标准 偏好矢量为(0.0、 0.8、 0.0、 0.6、 0.0、 0.4、 0.8、 0.5、 0.0、 1.0、 0.1、 0.3、 0.2、 0.2和0.3)。在这种情况下,前四个元素O.O、 0.8、 0.0和0.6属于第一层,其次的四个元素O.O、 0.4、 0.8和0.5 属于第二层,接着的三个元素O.O、 l.O和O.l属于第三层,而最 后的四个元素0.3、 0.2、 0.2和0.3属于第四层。
返回图19,在步骤S232,权重计算单元232计算每个用户的偏好矢量的每层的权重。例如,在步骤S232,权重计算单元 232计算每一层的权重作为属于一个层的元素的变量。
图22是示出作为属于每层的元素的变量的权重的例子的 图,其中,针对每个用户的每层计算权重。在图22所示的例子 中,由用户ID U001识别的用户的第一层的权重、第二层的权 重、第三层的权重和第四层的权重为0.17、 0.10、 0.01和0.06。
由用户ID U002识别的用户的第一层的权重、第二层的权 重、第三层的权重和第四层的权重为O.O5、 0.17、 0.05和0.16。
由用户ID U003识别的用户的第一层的权重、第二层的权重、 笫三层的权重和第四层的权重为0.16、 0.10、 0J1和0.00。
在步骤S233,相似程度计算单元233计算每个用户加权偏 好的相似程度。在步骤S234,相似用户检测单元203从用户中 检测具有最高偏好相似程度的用户X。然后结束该处理。
假定在不加权的情况下通过等式(1 )计算用户u和用户v 的相似程度sim(u、 v),并假定用户X是由用户IDU001识别的 用户,则由用户ID U002识別的用户和由用户ID U003识別的用 户的相似程度如图23所示。
sim(u,v) = Z J]h由h、
kL ceC(l)
在等式(1 )中,L为表示偏好矢量的层数的值,l为识别偏 好矢量的层的值,C ( 1)表示偏好矢量的全部集群,c是识别集 群的值,而h表示标准偏好矢量的元素的值。
当由用户ID UO(H识别的用户的偏好矢量的元素中的第一 层的元素乘以由用户ID U002识别的用户的偏好矢量的元素中 的第一层的相应元素,并将相乘的结果相加时,获得作为图23 中的用户IDU002的第一层中所配置的值0.88。同样地,当由用户ID U001识别的用户的偏好矢量的元素中的第二层、第三层 和第四层的元素乘以由用户ID U002识别的用户的偏好矢量的 元素中的第二层、第三层和第四层的相应元素,并将相乘的结 果相加时,获得作为图23中的用户ID U002的第二层、第三层 和第四成中所配置的值0.92、 0.97和0.50。
最终,由用户ID U001识别的用户与由用户ID U002识别的 用户之间的偏好的相似程度为3.27,该值是通过相加分别针对 第一层、第二层、第三层和第四层所获得的0.88、 0.92、 0.97 和0.50而得到的值。
同样地,当由用户ID U001识別的用户的偏好矢量的元素 中的第一层的元素乘以由用户ID U003识别的用户的偏好矢量 的元素中的第一层的相应元素,并将相乘的结果相加时,获得 作为图23中的用户ID U003的第 一层中所配置的值l.OO。同样 地,当由用户ID U001识別的用户的偏好矢量的元素中的第二 层、第三层和第四层的元素乘以由用户ID U003识別的用户的 偏好矢量的元素中的第二层、第三层和第四层的相应元素,并 将相乘的结果相加时,获得作为图23中的用户ID U003的第二 层、第三层和第四成中所配置的值0.77、 0.57和0.15。
最终,由用户ID U001识别的用户与由用户ID U003识另li的 用户之间的偏好的相似程度为2.50,该值是通过相加分別4十对 第一层、第二层、第三层和第四层获得的1.00、 0.77、 0.57和0.15 而得到的值。
当在不进行加权的情况下如此计算相似程度时,由用户ID U001识别的用户与由用户ID U002识另'J的用户之间的相似程度 高于由用户ID U001识别的用户与由用户ID U003识别的用户之 间的相似程度。因此,将由用户ID U002识别的用户检测为具 有最高偏好相似程度的用户X。另一方面,在步骤S233,相似程度计算单元233计算用户u 和用户v的相似程度sim (u, v),通过等式(2)加权该相似程 度sim ( u, v )。
[等式2]
<formula>formula see original document page 38</formula>…(2)
在等式(2)中,L为表示偏好矢量的层数的值,l为识别偏 好矢量的层的值,C ( 1)表示偏好矢量的全部集群,c是识别集 群的值,h表示标准偏好矢量的元素的值,而b表示每层的权重。
图24是示出在用户X是由用户ID U001识另l1的用户时由用 户ID U002识别的用户和由用户ID U003识别的用户的加权相似 程度的例子的图。顺便提及,图24中所示的值是通过等式(2) 计算的相似程度sim ( u, v)的100倍。
当由用户ID U001识别的用户的偏好矢量的元素中的第一 层的每一元素乘以由用户ID U001识别的用户的第 一层的权重, 由用户ID U002识別的用户的偏好矢量的元素中的第一层的每 一元素乘以由用户ID U002识别的用户的第 一层的权重,相应 的元素一起相乘,并将相乘的结果相加时,获得图24中的用户 ID U002的第一层中所配置的值0.72。
同样地,当由用户ID U001识别的用户的偏好矢量的元素中的 第二层、第三层和第四层的每一元素乘以由用户ID U001识别的用 户的第一层、第二层、第三层和第四层的权重,由用户IDU002识 别的用户的偏好矢量的元素中的第二层、第三层和第四层的每一 元素乘以由用户IDU002识别的用户的第一层的权重,相应的元素 一起相乘,并将相乘的结果相加时,获得图24中的用户IDU002的 第二层、第三层和第四层中所配置的值l.54、 0.03和0.48。
最终,由用户ID U001识别的用户与由用户ID U002识别的用户之间的偏好的加权相似程度为2.76,该值是通过相加分别 针对第一层、第二层、第三层和第四层所获得的0.72、 1.54、 0.03和0.48而得到的值。
同样地,当由用户ID U001识别的用户的偏好矢量的元素中 的第一层的每一元素乘以由用户ID U001识别的用户的第一层的 权重,由用户ID U003识别的用户的偏好矢量的元素中的第一层 的每一元素乘以由用户ID U003识別的用户的第一层的4又重,相 应的元素一起相乘,并将相乘的结果相加时,获得图24中的用户 IDU003的第一层中所配置的值2.74。同样地,当由用户IDUOOl 识别的用户的偏好矢量的元素中的第二层、第三层和第四层的每 一元素乘以由用户ID U001识别的用户的第一层、第二层、第三 层和第四层的权重,由用户ID U003识别的用户的偏好矢量的元 素中的第二层、第三层和第四层的每一元素乘以由用户ID U003 识别的用户的第一层的权重,相应的元素一起相乘,并将相乘的 结果相加时,获得图24中的用户ID U003的第二层、第三层和第 四层中所配置的值0.79、 O.IO和O.OO。
最终,由用户ID U001识别的用户与由用户ID U003识别的 用户之间的偏好的加4又相似程度为3.6 4 ,该 <直是通过相加分别 针对第一层、第二层、第三层和第四层所获得的2.74、 0.79、 0,10和0.00而得到的值。
结果,当利用所进行的加权来计算相似程度时,由用户ID U001识别的用户与由用户ID U003识别的用户之间的相似程度 高于由用户ID U001识别的用户与由用户ID U002识别的用户之 间的相似程度。因此,将由用户ID U003识别的用户检测为具 有最高偏好相似程度的用户X。
注意图20中所示的偏好矢量,由用户ID U001识别的用户 的偏好矢量的元素的值在第一层中比在第二到第四层中变化更大。因此估计第 一层中的元素的值比第二到第四层中的元素的
值更紧密相关于由用户ID U001识别的用户的偏好。
注意由用户ID U002识别的用户的偏好矢量和由用户ID U003识另'j的用户的偏好矢量的第一层中的元素的值,与由用户 ID U002识别的用户的偏好矢量的第 一 层中的元素的值相比, 由用户ID U003识另U的用户的偏好矢量的第 一层中的元素的值 更接近于由用户ID U001识别的用户的偏好矢量的第一层中的 元素的值。因此估计与由用户ID U002识别的用户相比,由用 户ID U003识另l1的用户具有与由用户ID U001识另'J的用户更相似 的偏好。
因此,通过进行加权,基于与估计同用户的偏好关系疏远 的值相比、估计与用户偏好更紧密相关的值,可以利用变化更 大的紧密相关值获得偏好的相似程度。因此可以更准确地检测 具有相似偏好的用户。
应该注意,尽管在以上说明中,例如,在步骤S232,权重 计算单元232计算权重作为属于每层的元素的变量,但是本发明 不局限于此,并且由于增加了层中的元素的变化,因而本发明 足以计算具有更大值的权重。例如,可以通过等式(3)计算熵 H,并且可以计算从1减去熵H的结果获得的值,作为权重。 [等式3]
H(1)= JXloghk …(3)
csC(i)
因此,可以减少用于选择适当内容的计算量,同时使信息 损失最小。还可以在选择内容中呈现确保反映用户关注的信息 的内容。
应该注意,在本说明书中,基于程序执行的步骤不仅包括 以所述的次序按照时间序列执行的处理,而且还包括并行或单
40独执行而无需按照时间序列执行的处理。
可以通过单个计算机处理该程序,也可以由多个计算机分 布处理该程序。此外,还可以将该程序传送到远程计算^L,然 后执行该程序。
本说明书中的系统是指作为由多个装置形成的整体的设备。
应该注意,本发明的实施例不局限于上述实施例,在不脱 离本发明的精神的情况下,可以进行各种改变。

Claims (10)

1.一种信息处理装置,用于从一组内容中选择满足预定条件的内容并将该内容呈现给用户,所述信息处理装置包括: 内容分类部件,用于将形成所述一组内容的每个内容分类到与所述内容的元数据相对应的每层中的多个第一集群中的一个; 保持部件,用于保持表示每个内容与每个内容分类到的所述层中所述第一集群之间的对应关系的数据库; 管理部件,用于管理关于所述用户的内容的历史信息; 生成部件,用于基于用户的所述历史信息和所述数据库,以所述第一集群为单位生成表示所述用户的偏好的偏好信息; 选择部件,用于基于所述历史信息和/或所述偏好信息来检测与第一用户具有相似的历史信息或偏好信息的第二用户,以基于所述第一用户和所述第二用户的历史信息和/或偏好信息来识别所述第一用户感兴趣的第一集群,并且用于选择被分类到所识别的所述第一集群的内容;以及 呈现部件,用于呈现所选择的所述内容; 其中,当对于所述第一用户之外不能检测到具有相似历史信息的所述第二用户时,所述选择部件基于所述第一用户的所述偏好信息,将所述第一用户的所述历史信息中存在的内容所属的第一集群设置为所述第一用户感兴趣的第一集群,并选择属于所述第一用户感兴趣的第一集群且在所述第一用户的所述历史信息中不存在的内容。
2.根据权利要求l所述的信息处理装置,其特征在于,所述选择部件包括:检测部件,用于检测具有与所述第一用户的所述历史信息相似的所述历史信息的所述第二用户;识别部件,用于识别所述第一用户的所述历史信息中不存在而所述第二用户的所述历史信息中存在的内容被分类到的第一集群;以及提取部件,用于提取被分类到所识别的所述第一集群的内容;以及
3. 根据权利要求l所述的信息处理装置,其特征在于,还包括:分组部件,用于基于所述偏好信息对用户进行分组;其中,所述选择部件包括:检测部件,用于检测与所述第一用户属于同一组的所述第二用户;识别部件,用于识别所述第一用户的所述历史信息中不存在而所述第二用户的所述历史信息中存在的内容被分类到的第一集群;以及提取部件,用于提取被分类到所识别的所述第一集群的内容j 以及所述呈现部件将所提取的所述内容呈现给所述第一用户。
4. 根据权利要求l所述的信息处理装置,其特征在于,所述选择部件包括:检测部件,用于检测具有由所述偏好信息表示的与所述第一用户的偏好相似的偏好的所述第二用户;识别部件,用于基于所述第一用户的偏好信息和所述第二用户的偏好信息来识别感兴趣的第一集群;以及提取部件,用于提取被分类J !j所识别的所述第 一 集群的内容;以及所述呈现部件将所提取的所述内容呈现给所述第一用户。
5. 根据权利要求4所述的信息处理装置,其特征在于,所述^r测部件包括:标准化部件,用于将用户的偏好信息标准化;权重计算部件,用于根据每个用户的标准化后的偏好信息来计算针对每个用户每层的权重;以及相似程度计算部件,用于根据每层的4又重和所述偏好信息来计算表示用户中的所述第一用户和用户中的其他用户之间的偏好相似程度的相似程度;以及根据所计算出的相似程度检测具有与所述第一用户的偏好相似的偏好的所述第二用户。
6. 根据权利要求l所述的信息处理装置,其特征在于,还包括:分组部件,用于基于所述偏好信息对用户进行分组;其中,所述选择部件包括:检测部件,用于检测与所述第 一用户属于同 一组的所述第二用户;识别部件,用于基于所述第一用户的偏好信息和所述第二用户的偏好信息来识别感兴趣的第一集群;以及提取部件,用于提取被分类到所识別的所述第一集群的内容;以及所述呈现部件将所提取的所述内容呈现给所述第一用户。
7. 根据权利要求l所述的信息处理装置,其特征在于,还包括:设置部件,用于对通过所述内容分类部件将所述元数据分类到的每一第一集群设置关键词;以及原因生成部件,用于使用通过所述设置部件设置的所述关键词来生成表示呈现所述内容的原因的原因文本;其中,所述呈现部件还呈现所述原因文本。
8. 根据权利要求l所述的信息处理装置,其特征在于,还包括元数据分类部件,该元数据分类部件用于将内容的元数据分类到多个第二集群中的一个,并将所述层分配到所述第二集群;其中,所述内容分类部件将每个内容分类到每个分配的所述层中的多个第一集群中的一个。
9. 根据权利要求l所述的信息处理装置,其特征在于,所述选择部件选择被分类到全部所述层中的全部所述第 一 集群当中由所述偏好信息表示的最大数量的所述第一集群的内容。
10. —种信息处理装置的信息处理方法,用于从一组内容中选择满足预定条件的内容并将该内容呈现给用户,所述信息处理方法包括以下步骤:将形成所述一组内容的每个内容分类到与所述内容的元数据相对应的每层中的多个集群中的一个;保持表示每个内容与将每个内容分类到的所述层中的所述集群之间的对应关系的数据庠;管理关于所述用户的内容的历史信息;基于用户的所述历史信息和所述数据库,以所述第一集群为单位生成表示所述用户的偏好的偏好信息;基于所述历史信息和/或所述偏好信息来检测与第 一 用户具有相似的历史信息或偏好信息的第二用户,以基于所述第一用户和所述第二用户的历史信息和/或偏好信息来识别所述第一用户感兴趣的集群,并选择被分类到所识别的所述集群的内容;以及呈现所选择的所述内容;其中,当对于所述第一用户之外不能检测到具有相似历史信息的所述第二用户时,基于所述第一用户的所述偏好信息,将所述第一用户的所述历史信息中存在的内容所属的第一集群设置为所述第一用户感兴趣的第一集群,并选择属于所述第一用户感兴趣的第一集群且在所述第一用户的所述历史信息中不存在的内容。
CN200680001299A 2005-09-28 2006-09-15 信息处理装置和方法 Expired - Fee Related CN100594496C (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005281357 2005-09-28
JP281357/2005 2005-09-28
JP151012/2006 2006-05-31
JP2006151012A JP4378646B2 (ja) 2005-09-28 2006-05-31 情報処理装置、情報処理方法、およびプログラム
PCT/JP2006/318373 WO2007037139A1 (ja) 2005-09-28 2006-09-15 情報処理装置、方法、およびプログラム

Publications (2)

Publication Number Publication Date
CN101069184A CN101069184A (zh) 2007-11-07
CN100594496C true CN100594496C (zh) 2010-03-17

Family

ID=37899569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680001299A Expired - Fee Related CN100594496C (zh) 2005-09-28 2006-09-15 信息处理装置和方法

Country Status (6)

Country Link
US (1) US8117211B2 (zh)
EP (1) EP1835419A4 (zh)
JP (1) JP4378646B2 (zh)
KR (1) KR20080045659A (zh)
CN (1) CN100594496C (zh)
WO (1) WO2007037139A1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244673B2 (en) * 2006-08-30 2012-08-14 Panasonic Corporation Information presenting device, information presenting method, information presenting program, and integrated circuit
JP5392808B2 (ja) * 2007-11-27 2014-01-22 日本電気株式会社 コンテクスト対応情報推薦装置、コンテクスト対応情報推薦方法およびコンテクスト対応情報推薦プログラム
JP4538760B2 (ja) * 2007-12-04 2010-09-08 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP4538758B2 (ja) * 2007-12-04 2010-09-08 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
EP2068276A1 (en) 2007-12-04 2009-06-10 Sony Corporation Information processing device and method, program, and recording medium
JP4433326B2 (ja) 2007-12-04 2010-03-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20090198666A1 (en) * 2008-02-01 2009-08-06 Winston Ronald H Affinity matching system and method
CN101547167A (zh) * 2008-03-25 2009-09-30 华为技术有限公司 内容分类方法、装置及系统
JP5166949B2 (ja) * 2008-04-10 2013-03-21 株式会社エヌ・ティ・ティ・ドコモ レコメンド情報生成装置およびレコメンド情報生成方法
JP4790753B2 (ja) * 2008-04-28 2011-10-12 日本電信電話株式会社 情報推薦装置、情報推薦方法、プログラム及び記録媒体
US8386486B2 (en) * 2008-07-02 2013-02-26 Palo Alto Research Center Incorporated Method for facilitating social networking based on fashion-related information
CN101661483B (zh) * 2008-08-29 2012-10-03 株式会社理光 一种推荐系统及推荐方法
JP4650552B2 (ja) * 2008-10-14 2011-03-16 ソニー株式会社 電子機器、コンテンツ推薦方法及びプログラム
KR101111121B1 (ko) * 2009-06-29 2012-02-13 주식회사 모임 인공지능에 기반한 개인별 맞춤형 컨텐츠 제공 장치 및 방법, 그 기록 매체
US8635255B2 (en) * 2009-06-30 2014-01-21 Verizon Patent And Licensing Inc. Methods and systems for automatically customizing an interaction experience of a user with a media content application
CN102576438A (zh) * 2009-09-21 2012-07-11 瑞典爱立信有限公司 用于执行推荐的方法和设备
JP5609056B2 (ja) * 2009-10-14 2014-10-22 ソニー株式会社 コンテンツ関係可視化装置、表示制御装置、コンテンツ関係可視化方法およびプログラム
JP2011158980A (ja) * 2010-01-29 2011-08-18 Brother Industries Ltd 消費者情報処理装置
JP5527408B2 (ja) * 2010-04-28 2014-06-18 株式会社Jvcケンウッド アイテム選択装置、アイテム選択方法、およびアイテム選択用プログラム
CN102486926B (zh) * 2010-12-03 2015-04-08 上海博泰悦臻电子设备制造有限公司 个性化音乐媒体信息获取方法及系统
US8719248B2 (en) * 2011-05-26 2014-05-06 Verizon Patent And Licensing Inc. Semantic-based search engine for content
US8990208B2 (en) * 2011-09-22 2015-03-24 Fujitsu Limited Information management and networking
JP5727920B2 (ja) * 2011-11-21 2015-06-03 株式会社Nttドコモ レコメンドコンテンツ出力装置及びレコメンドコンテンツ出力方法
JP5696025B2 (ja) * 2011-11-22 2015-04-08 日本電信電話株式会社 商品情報推薦装置及び方法及びプログラム
JP5785864B2 (ja) * 2011-12-06 2015-09-30 株式会社日立製作所 製造ラインシミュレーション装置、データ入力支援装置、およびデータ入力支援方法
US9053185B1 (en) 2012-04-30 2015-06-09 Google Inc. Generating a representative model for a plurality of models identified by similar feature data
US8914500B1 (en) 2012-05-21 2014-12-16 Google Inc. Creating a classifier model to determine whether a network user should be added to a list
JP5846442B2 (ja) * 2012-05-28 2016-01-20 ソニー株式会社 情報処理装置、情報処理方法、および、プログラム
JP6127388B2 (ja) * 2012-06-13 2017-05-17 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US8886575B1 (en) 2012-06-27 2014-11-11 Google Inc. Selecting an algorithm for identifying similar user identifiers based on predicted click-through-rate
US8874589B1 (en) 2012-07-16 2014-10-28 Google Inc. Adjust similar users identification based on performance feedback
US8782197B1 (en) 2012-07-17 2014-07-15 Google, Inc. Determining a model refresh rate
US8886799B1 (en) 2012-08-29 2014-11-11 Google Inc. Identifying a similar user identifier
US9065727B1 (en) 2012-08-31 2015-06-23 Google Inc. Device identifier similarity models derived from online event signals
KR101464044B1 (ko) * 2012-09-28 2014-11-20 주식회사 엘지유플러스 관심 키워드 제공 장치 및 방법
US20150193821A1 (en) * 2012-09-28 2015-07-09 Rakuten, Inc. Information processing apparatus, information processing method, and information processing program
CN102917269B (zh) * 2012-09-29 2016-06-29 青岛海信电器股份有限公司 一种电视节目推荐系统及方法
JP6014515B2 (ja) * 2013-02-22 2016-10-25 株式会社エヌ・ティ・ティ・データ レコメンド情報提供システム、レコメンド情報生成装置、レコメンド情報提供方法、およびプログラム
KR101581917B1 (ko) * 2014-08-12 2016-01-04 네이버 주식회사 컨텐츠 표시 제어 장치, 컨텐츠 표시 제어 방법 및 이를 컴퓨터에서 실행하기 위한 컴퓨터 프로그램
CN104731954B (zh) * 2015-04-01 2018-01-26 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与系统
US20190050872A1 (en) * 2016-02-05 2019-02-14 Xiao-Feng YU User interest and relationship determination
CN108681919A (zh) * 2018-05-10 2018-10-19 苏州跃盟信息科技有限公司 一种内容推送方法及装置
CN108920630A (zh) * 2018-06-29 2018-11-30 联想(北京)有限公司 一种数据处理方法及电子设备
CN109086813B (zh) * 2018-07-23 2021-05-14 广州虎牙信息科技有限公司 主播相似度的确定方法、装置、设备及存储介质
KR101922725B1 (ko) * 2018-07-25 2018-11-27 (주)엔터랩 인공지능 과제매칭 방법, 장치 및 프로그램
JP7003088B2 (ja) * 2019-05-27 2022-01-20 楽天グループ株式会社 レコメンド装置、レコメンド方法、及びレコメンドプログラム
KR102284393B1 (ko) * 2020-08-26 2021-08-04 (주)인더스트리미디어 학습 콘텐츠 추천 장치 및 방법
CN113949931A (zh) * 2021-10-13 2022-01-18 深圳市视壮科技有限公司 一种iptv节目推荐方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1383328A (zh) * 2001-04-23 2002-12-04 日本电气株式会社 推荐节目的方法及其系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617127B2 (en) * 2000-04-28 2009-11-10 Netflix, Inc. Approach for estimating user ratings of items
US20030033370A1 (en) * 2001-08-07 2003-02-13 Nicholas Trotta Media-related content personalization
JP2003216636A (ja) * 2002-01-23 2003-07-31 Hitachi Ltd 最新記事推薦方法およびシステム
US9374451B2 (en) * 2002-02-04 2016-06-21 Nokia Technologies Oy System and method for multimodal short-cuts to digital services
JP2004178521A (ja) 2002-11-29 2004-06-24 Superstation Inc 推薦システム
JP2004194108A (ja) * 2002-12-12 2004-07-08 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4161701B2 (ja) 2002-12-12 2008-10-08 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4003127B2 (ja) 2002-12-12 2007-11-07 ソニー株式会社 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
WO2004054245A1 (ja) * 2002-12-12 2004-06-24 Sony Corporation 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP4547596B2 (ja) 2002-12-12 2010-09-22 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
EP1571278A1 (en) * 2002-12-13 2005-09-07 Matsushita Electric Industrial Co., Ltd. Onboard device control system, onboard device controller, and onboard device control method
JP2004355340A (ja) 2003-05-29 2004-12-16 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1383328A (zh) * 2001-04-23 2002-12-04 日本电气株式会社 推荐节目的方法及其系统

Also Published As

Publication number Publication date
JP4378646B2 (ja) 2009-12-09
EP1835419A1 (en) 2007-09-19
CN101069184A (zh) 2007-11-07
US8117211B2 (en) 2012-02-14
KR20080045659A (ko) 2008-05-23
WO2007037139A1 (ja) 2007-04-05
US20090077132A1 (en) 2009-03-19
JP2007122683A (ja) 2007-05-17
EP1835419A4 (en) 2009-09-16

Similar Documents

Publication Publication Date Title
CN100594496C (zh) 信息处理装置和方法
CN101044484B (zh) 信息处理装置和信息处理方法
US9576056B2 (en) Recommender system for identifying a new set of media items responsive to an input set of media items and knowledge base metrics
CN101408887B (zh) 推荐词条以指定本体空间
US6061658A (en) Prospective customer selection using customer and market reference data
EP1574969B1 (en) Method for the automated annotation of multi-dimensional database reports with information objects of a data repository
US20110004578A1 (en) Active metric learning device, active metric learning method, and program
US20190318407A1 (en) Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof
US8189963B2 (en) Matching advertisements to visual media objects
Ge A user-based collaborative filtering recommendation algorithm based on folksonomy smoothing
KR102099631B1 (ko) 하이브리드 추천 장치 및 방법, 이를 기록한 기록매체
CN111930967B (zh) 一种基于知识图谱的数据查询方法、装置及存储介质
US20220114624A1 (en) Digital Content Text Processing and Review Techniques
JP3452308B2 (ja) データ分析装置
CN114022086B (zh) 基于bom识别的采购方法、装置、设备及存储介质
KR102269425B1 (ko) 토픽 선정을 위한 자동화된 정보 처리 방법
WO2022093822A1 (en) Systems and method for dynamically updating materiality distributions and classifications in multiple dimensions
van Wezel et al. Choosing Attribute Weights for Item Dissimilarity Using Clikstream Data with an Application to a Product Catalog Map
Bulusu Transforming E-Commerce through Data Mining
JP2020109689A (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
CN111612583A (zh) 一种基于聚类的个性化导购系统
CN112800270A (zh) 基于音乐标签和时间信息的音乐推荐方法及系统
KR20210030808A (ko) 시장규모추정장치 및 그 동작 방법
Zhang et al. Item-based collaborative filtering with fuzzy vector cosine and item directional similarity
KR20080035371A (ko) 개인화 시스템에서 각 사용자에 대한 맞춤 학습을 위한순서 추천 방법 및 이를 구현할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100317

Termination date: 20150915

EXPY Termination of patent right or utility model