CN101452478A - 信息处理设备和方法、程序以及记录介质 - Google Patents

信息处理设备和方法、程序以及记录介质 Download PDF

Info

Publication number
CN101452478A
CN101452478A CN 200810180789 CN200810180789A CN101452478A CN 101452478 A CN101452478 A CN 101452478A CN 200810180789 CN200810180789 CN 200810180789 CN 200810180789 A CN200810180789 A CN 200810180789A CN 101452478 A CN101452478 A CN 101452478A
Authority
CN
China
Prior art keywords
user
user preference
vector
content
metamessage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200810180789
Other languages
English (en)
Inventor
高松慎吾
馆野启
角田智弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101452478A publication Critical patent/CN101452478A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开一种信息处理设备,包括:用户信息获取单元,配置以获取与用户已经使用的内容的数据相关的信息;元信息获取单元,配置以获取与用户已经使用的内容相对应的内容元信息;第一矢量产生单元,配置以使用获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;第二矢量产生单元,配置以产生第二用户偏爱性矢量,其中分析产生的第一用户偏爱性矢量并且压缩第一用户偏爱性矢量的元素的数量;以及用户识别单元,配置以识别与多个第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。

Description

信息处理设备和方法、程序以及记录介质
相关申请的交叉引用
本发明包含与2007年12月4日在日本专利局提交的日本专利申请JP
2007-313098和JP 2007-313099相关的、以及与2008年5月8日在日本专利局提交的日本专利申请JP 2008-122172相关的主题,在此引用其全部内容作为参考。
技术领域
本发明涉及一种信息处理设备和方法、程序以及记录介质,尤其涉及一种可以有效地确定用户之间或内容之间的相似性的信息处理设备和方法、程序以及记录介质。
背景技术
近年来,在因特网等上已经存在将某个用户介绍给另一个用户的网络服务。这些服务促进用户之间的会见或者经由其他用户的新内容的发现,并且提供新的用户经验。
使用这种服务,分析由使用网站的用户产生的用户信息,并且确定要介绍的用户。这里“用户信息”是例如网站使用的历史或者用户已经公开的内容信息的信息。例如,使用网站http://www.last.fm,提供一种服务,其中分析用户已经公开的收听音乐的历史,由此介绍类似的用户。
使用这种服务,例如介绍匹配用户的使用历史或由用户公开的内容(也就是用户信息)的一部分的用户的服务构成了大部分服务。
另外,已经提出一种技术,例如产生适当的用户偏爱性信息作为矢量以便推荐内容(例如日本未经审查专利申请公开第2005-165632号)。
发明内容
但是,关于根据相关技术的服务存在一个问题,即具有总体类似用户信息但是不具有用户信息特定元素匹配的部分的用户不会确定为类似用户,并且仅通过匹配或不匹配用户信息的特定元素来确定类似用户是不够的。另外,相关技术是不充分的,因为没有考虑内容相似性。
已经认识到能够更有效地确定用户之间或内容之间的相似性的需求。
根据本发明的一种实施方案,提供一种信息处理设备,包括:用户信息获取单元,配置以获取与用户已经使用的内容的数据相关的信息;元信息获取单元,配置以获取与用户已经使用的内容相对应的内容元信息;第一矢量产生单元,配置以使用获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;第二矢量产生单元,配置以产生第二用户偏爱性矢量,其中分析产生的第一用户偏爱性矢量并且压缩第一用户偏爱性矢量的元素的数量;以及用户识别单元,配置以识别与多个第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
第二矢量产生单元通过使用多主题模型执行关于第一用户偏爱性矢量的分析,压缩第一用户偏爱性矢量的元素的数量。
第二矢量产生单元执行PLSA(Probabilistie Latent Semantic Analysis,概率潜在语义分析)多主题模型的分析,并且预先读入多个第一用户偏爱性矢量且学习PLSA的概率模型的参数。
预先提供的预先确定的第二用户偏爱性矢量可以是请求介绍具有与自己类似偏爱性的用户的使用用户的第二用户偏爱性矢量,其中用户识别单元识别与预先存储的第二用户偏爱性矢量中预先确定的一个相对应的用户,作为介绍给使用用户的介绍用户。
用户识别单元可以基于使用用户的第一用户偏爱性矢量,提取与预先存储的第一用户偏爱性矢量中预先确定的一个相对应的用户,作为候选用户,其中与候选用户的第二用户偏爱性矢量中预先确定的一个相对应的用户作为介绍给使用用户的介绍用户。
可以基于使用用户的第二用户偏爱性矢量与每一个候选用户的第二用户偏爱性矢量之间的欧几里得距离计算相似性,其中用户识别单元识别与具有预先设置的阈值量或更大的相似性的第二用户偏爱性矢量相对应的用户作为介绍用户。
信息处理设备还可以包括介绍用户呈现单元,配置以产生将介绍用户的列表呈现给使用用户的屏幕数据;其中介绍用户呈现单元基于介绍用户的第一用户偏爱性矢量的元素,产生将介绍用户介绍给使用用户的介绍原因。
可以基于以值由大到小的次序,从介绍用户的第一用户偏爱性矢量的元素中提取的预先确定数量的元素名称而产生介绍原因。
介绍用户呈现单元可以进一步以值由大到小的次序提取使用用户的第一用户偏爱性矢量的元素中预先确定数量的元素,其中在提取以便产生介绍原因的介绍用户的第一用户偏爱性矢量元素中的元素的每一个与从使用用户的第一用户偏爱性矢量中提取的元素是相同元素的情况下,基于其中相同元素的名称产生的介绍原因以不同于基于其它元素名称产生的介绍原因的显示状态而显示。
根据本发明的一种实施方案,提供一种信息处理方法,包括步骤:获取与用户已经使用的内容的数据相关的信息;获取与用户已经使用的内容相对应的内容元信息;使用获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;产生第二用户偏爱性矢量,其中分析产生的第一用户偏爱性矢量并且压缩第一用户偏爱性矢量的元素的数量;以及识别与多个第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
根据本发明的一种实施方案,提供一种使得计算机用作信息处理设备的程序,包括:用户信息获取单元,配置以获取与用户已经使用的内容的数据相关的信息;元信息获取单元,配置以获取与用户已经使用的内容相对应的内容元信息;第一矢量产生单元,配置以使用获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;第二矢量产生单元,配置以产生第二用户偏爱性矢量,其中分析产生的第一用户偏爱性矢量并且压缩第一用户偏爱性矢量的元素的数量;以及用户识别单元,配置以识别与多个第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
根据上面的配置,获取与用户已经使用的内容数据相关的信息,获取与用户已经使用的内容相对应的内容元信息,产生其中所获取的内容元信息的每一个用作其元素的第一用户偏爱性矢量,分析产生的第一用户偏爱性矢量并且产生压缩第一用户偏爱性矢量的元素的数量的第二用户偏爱性矢量,以及识别与多个第二用户偏爱性矢量中与之前提供的预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
根据本发明的一种实施方案,提供一种信息处理设备,包括:用户信息获取单元,配置以获取与用户已经使用的内容的数据相关的信息;元信息获取单元,配置以获取与用户已经使用的内容相对应的内容元信息;第一矢量产生单元,配置以产生与获取的内容元信息具有相同元素数量的第一用户偏爱性矢量;第二矢量产生单元,配置以产生第二用户偏爱性矢量,其中分析产生的第一用户偏爱性矢量并且压缩第一用户偏爱性矢量的元素的数量;以及第三矢量产生单元,配置以产生压缩的元信息矢量,其中分析内容元信息作为矢量并且压缩内容元信息矢量的元素的数量;以及用户识别单元,配置以识别与多个第二用户偏爱性矢量中与预先确定的压缩元信息矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
信息处理设备还可以包括内容识别单元,配置以识别与多个压缩元信息矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的压缩元信息矢量相对应的内容。
信息处理设备还可以包括内容识别单元,配置以识别与多个压缩元信息矢量中与预先确定的压缩元信息矢量具有高度相似性的压缩元信息矢量相对应的内容。
根据本发明的一种实施方案,提供一种信息处理方法,包括步骤:获取与用户已经使用的内容的数据相关的信息;获取与用户已经使用的内容相对应的内容元信息;产生与获取的内容元信息具有相同元素数量的第一用户偏爱性矢量;产生第二用户偏爱性矢量,其中分析产生的第一用户偏爱性矢量并且压缩第一用户偏爱性矢量的元素的数量;产生压缩的元信息矢量,其中分析内容元信息作为矢量并且压缩内容元信息矢量的元素的数量;以及识别与多个第二用户偏爱性矢量中与预先确定的压缩元信息矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
根据上面的配置,获取与用户已经使用的内容数据相关的信息,获取与用户已经使用的内容相对应的内容元信息,产生与获取的内容元信息具有相同元素数量的第一用户偏爱性矢量,分析产生的第一用户偏爱性矢量并且产生压缩第一用户偏爱性矢量的元素的数量的第二用户偏爱性矢量,分析内容元信息作为矢量并且产生压缩内容元信息矢量的元素的数量的压缩元信息矢量,以及识别与多个第二用户偏爱性矢量中与预先提供的预先确定压缩元信息矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
根据上述配置,可以更有效地确定用户之间或内容之间的相似性。
附图说明
图1是根据本发明一种实施方案的用户介绍系统的配置实例的框图;
图2是根据图1中的用户介绍系统描述用户介绍处理的图;
图3是说明用户偏爱性信息A的配置实例的图;
图4是说明用户偏爱性信息A的另一种配置实例的图;
图5是说明用户1-3的用户偏爱性信息A的实例的图;
图6是说明基于图5中的用户偏爱性信息A产生的用户偏爱性信息B的实例的图;
图7是说明介绍用户列表的图;
图8是描述用户偏爱性信息A产生处理的实例的流程图;
图9是描述参数学习处理的实例的流程图;
图10是描述用户偏爱性信息B产生处理的实例的流程图;
图11是描述介绍列表产生显示处理的实例的流程图;
图12是描述在显示用户偏爱性特征以便能够直观理解的情况下,使用用户介绍系统的处理的图;
图13是说明根据本发明一种实施方案的用户介绍系统的另一种配置实例的框图;
图14是说明显示用户偏爱性特征的屏幕的实例的图;
图15是说明显示用户偏爱性特征的屏幕的另一个实例的图;
图16是说明显示用户偏爱性特征的屏幕的再一个实例的图;
图17是说明显示用户偏爱性特征的屏幕的再一个实例的图;
图18是说明显示用户偏爱性特征的屏幕的再一个实例的图;
图19是描述偏爱性表示屏幕显示产生处理的实例的流程图;
图20是说明根据本发明一种实施方案的用户介绍系统的另一种配置实例的框图;
图21是说明内容元信息的配置实例的图;
图22是说明压缩内容元信息的配置实例的图;
图23是描述压缩内容元信息产生处理的实例的流程图;
图24是描述介绍列表产生显示处理的另一个实例的流程图;
图25是描述介绍列表产生显示处理的再一个实例的流程图;
图26是说明介绍内容列表的实例的图;
图27是描述介绍列表产生显示处理的再一个实例的流程图;以及
图28是通用计算机的配置实例的框图。
具体实施方式
下面将参考附图描述本发明的一种实施方案。图1是显示根据本发明一种实施方案的用户介绍系统的配置实例的框图。用户介绍系统10配置成例如提供SNS(social networking service,社交网络服务)的内容网站。内容网站提供媒体内容例如音乐、电影、视频、电视节目和作品以及例如产品销售的内容,并且也提供将某个用户介绍给另一个用户的服务。
使用用户介绍系统10,例如可以提供经由安装在个人计算机上的浏览器访问内容网站的各个用户的个人主页。个人主页可能安排有用户公开的内容信息,例如最喜爱的音乐和电影。用户介绍系统10的用户使用安装在该用户的个人计算机上的浏览器,经由网络例如因特网访问内容网站,并且观看内容网站内的页面或链接到内容网站的网页。用户介绍系统10配置成连接到网络例如因特网的服务器等。注意,用户介绍系统10也可以配置有相互连接的多个服务器。
图1中的用户信息处理单元32是具有上述个人主页的用户,并且从安装在访问内容网站的用户的个人计算机等中的浏览器31获取用户信息。“用户信息”是例如由用户的内容网站使用历史(例如观看的网页)构成的信息以及关于由用户公开的内容的信息。
当从浏览器31获取用户信息时,用户信息处理单元32基于包括在获取的用户信息中的信息,从内容元信息DB(数据库)33读入内容元信息。这里,内容元信息表示与每个内容相关联的数据,例如音乐内容的流派和艺术家,出现在审阅文档中的单词,以及通过分析图片内容提取的特征量。
内容元信息数据库33具有例如与各个内容相关并存储在那里的各个ID和内容元信息,并且用户信息处理单元32识别包括在用户信息中的内容ID并且获取与这种内容相对应的内容元信息。内容元信息通过使用例如由公开该内容的供应公司(或制造商)提供的信息等产生,并且预先存储在内容元信息数据库33中。
用户信息处理单元32基于从浏览器31获取的用户信息以及从内容元信息数据库33获取的内容元信息产生用户偏爱性信息A。细节将随后描述,但是用户偏爱性信息A用作具有多个元素的高维矢量。用户偏爱性信息A针对多个用户的每一个产生,并且产生的用户偏爱性信息A存储在A偏爱性信息数据库34中。
用户信息分析单元35从A偏爱性信息数据库34读入并分析用户偏爱性信息A,并且产生用户偏爱性信息B。细节将随后描述,但是用户偏爱性信息B用作具有压缩(减少)了用户偏爱性信息A的元素的数量的矢量,并且用户信息分析单元35使用多主题模型执行分析,由此产生具有压缩的元素数量的矢量。
获取单词或文本的出现概率的方法可以包括随后描述的PLSA(概率潜在语义分析),LDA(Latent Dirichlet Allocation,潜在迪克莱特分配)等,作为使用多主题模型的分析方法的实例。用户信息分析单元35例如使用PLSA执行对于用户偏爱性信息A的分析,由此产生具有压缩元素数量的矢量。用户偏爱性信息B针对多个用户的每一个产生,并且产生的用户偏爱性信息B存储在B偏爱性信息数据库36中。
介绍用户确定单元37基于浏览器31的使用者的用户偏爱性信息A,对于用户介绍系统10中具有个人主页的多个用户的每一个,过滤用户偏爱性信息A或用户偏爱性信息B,并且识别与作为过滤结果而获取的用户偏爱性信息A或用户偏爱性信息B相对应的用户,同时提取所识别的用户的用户偏爱性信息B。介绍用户确定单元37计算提取的用户偏爱性信息B的每一个与浏览器31的使用者的用户偏爱性信息B之间的相似性,并且基于其相似性确定应当介绍给浏览器31的使用者的用户。
介绍用户呈现单元38基于使用介绍用户确定单元37确定的用户的用户偏爱性信息A创建如随后描述的介绍原因,并且显示与针对应当介绍的用户的介绍原因一起显示的介绍用户列表。
注意在下文,作为图1中浏览器31的使用者、期望使用用户介绍系统10介绍另一个用户的用户将称作“使用用户”,而用户介绍系统10已经选择作为应当介绍给使用用户的用户将称作“介绍用户”。
另外,这里给出描述,即在用户介绍系统10上具有个人主页的用户中的预先确定用户被选择作为介绍用户,但是,也可以执行如下方案,其中例如作为其地址例如URL(统一资源定位符)注册在用户介绍系统10中的所谓网络日志(blog)的管理者的用户可以作为介绍用户而被介绍。
图2是描述使用用户介绍系统10的用户介绍处理的图。如图2中所示,基于用户信息和内容元信息产生用户偏爱性信息A。通过使用PLSA执行针对用户偏爱性信息A的分析产生用户偏爱性信息B,其是具有压缩的元素数量的矢量。
作为应当介绍给使用用户的用户的介绍用户基于用户偏爱性信息A和用户偏爱性信息B来确定,并且呈现介绍用户。
接下来,将描述用户偏爱性信息A。图3是显示用户偏爱性信息A的配置实例的图。图3显示在用户通过观看/收听内容1-3来使用并记录的情况下用户偏爱性信息A的实例,其中内容1具有内容元信息a(图中表示为元信息a),内容2具有内容元信息c,并且内容3也具有内容元信息c(图中表示为元信息c)。在图3的实例中,通过在内容1的行与元信息a的列交叉的单元中插入“1”来表示具有元信息a的内容1。
执行如下方案,其中加权每个内容的内容元信息,加权是动作例如记录或观看/收听,并且与内容使用情况相对应地确定。例如,我们可以说在用户已经简单地观看/收听的内容和用户已经记录的内容中,对用户的重要性是不同的。也就是说,我们可以假定用户对于记录的内容比对于简单观看/收听的内容更感兴趣,并且在产生关于用户偏爱性的信息时,根据使用情况(记录,观看/收听等)来加权是期望的。
在图3的实例中,根据内容1的使用情况的加权是“0.4”,根据内容2的使用情况的加权是“0.9”,以及根据内容3的使用情况的加权是“0.4”。
关于每个内容元信息(在该情况下,元信息a至元信息c)的值(在该情况下“1”或“0”),用户偏爱性信息A矢量化用作根据每个内容的使用情况进行加权的元素的值。
在图3的实例中,用户偏爱性信息A的元信息a的元素的值是1×0.4=0.4,元信息b的元素的值是0,以及元信息c的元素的值是1×0.9+1×0.4=1.3,由此用户偏爱性信息A构造成三维实数值矢量(0.4,0,1.3)。
注意,可以执行如下方案,其中加权相同并且不依赖于使用情况。例如,在图3的实例中,如果所有加权都是“1”,则用户偏爱性信息A变成矢量(1,0,2)。
另外,可以执行如下方案,其中不使用内容元信息,并且内容自身用作用户偏爱性信息A的元素。图4是显示在使用内容自身作为元素的情况下的用户偏爱性信息A的配置实例的图。在图4的情况下,用户偏爱性信息A变成矢量(0.4,0.9,0.4)。
如图4中所示,在构造用户偏爱性信息A的情况下,可以执行如下方案,其中在图1中不提供内容元信息数据库33。关于图3或4中所示的用户偏爱性信息A的实例,矢量是3维的,但是实际上,元素数量变得巨大。这是因为存在大量数量(类型)的内容和内容元信息。实际的用户偏爱性信息A变成几千维至几万维的高维实值矢量。
另外,我们可以说用户实际观看/收听并记录的内容仅是大量现有内容的小部分。也就是说,大部分用户偏爱性信息A矢量的元素值变成“0”。对于大部分元素变成0称作稀疏,由此用户偏爱性信息A是稀疏高维矢量。
注意,不管由用户使用的内容,产生用户偏爱性信息A使得每个用户的用户偏爱性信息A矢量的元素数量相同。例如,可以执行方案,其中用户偏爱性信息A的表格作为具有预先确定元素数量的矢量存储在A偏爱性信息数据库34中,并且用户信息处理单元32通过与从浏览器31获取的用户信息相对应地,在用户偏爱性信息A的表格的每个元素中写入值来产生用户偏爱性信息A。
接下来,将描述用户偏爱性信息B。如所述,用户偏爱性信息B通过使用PLSA执行分析变成相对低维的矢量,其中压缩用户偏爱性信息A的元素数量。
图1中的用户信息分析单元35配置成可以执行多主题模型(例如PLSA)分析的处理的功能块,例如,根据提供的PLSA概率模型的参数,关于输入的用户偏爱性信息A执行PLSA分析的处理。另外,用户信息分析单元35关于多个用户偏爱性信息A执行PLSA分析的处理,由此可以学习最佳的PLSA概率模型的参数。
PLSA经常用于文本分析,例如,作为通过考虑一个或多个概率密度确定称作主题的单词的出现概率来计算单词的出现概率,并且以每个文本特有的主题出现概率将特征添加到文本的方法。关于PLSA,例如,使用大规模文本主体,使用EM(期望值最大化)算法预先识别主题单词出现概率和文本的主题出现概率。另外,关于PLSA,可以执行方案,其中主题单词出现概率作为参数提供,并且可以获取与输入文本相对应的测试的主题出现概率。注意,PLSA的细节在“Thomas Hofmann,Probabilistic Latent SemanticIndexing(概率潜在语义索引),第22届信息检索的研究与发展国际SIGIR年会会刊(SIGIR-99),1999”等中描述。
也可以使用LDA(潜在迪克莱特分配)执行与PLSA类似的操作。LDA是PLSA的扩展,并且LDA的细节在“David M.Blei,Andrew Y.Ng,MichaelI.Jordan,Latent Dirichlet Allocation(潜在迪克莱特分配),机器学习研究杂志3,2003”中描述。可以安排用户信息分析单元35执行LDA分析的处理,代替PLSA分析的处理。
这里将给出例如使用PLSA作为使用多主题模型的分析的情况下的描述。也就是说,准备设置与用户偏爱性信息B具有相同或更多元素数量的主题的PLSA概率模型,获取用户偏爱性信息A中每个元素的出现概率,并且基于用户偏爱性信息A中每个元素的出现概率确定用户偏爱性信息B的元素的值。
图5是显示用户1-3的用户偏爱性信息A的实例的图,图6是通过使用PLSA关于图5中的用户偏爱性信息A执行分析产生的用户偏爱性信息B的实例的图。为了简化说明,这里将描述一个实例,其中作为5维矢量的用户偏爱性信息A转换成作为3维矢量的用户偏爱性信息B,但是实际上,用户偏爱性信息A和用户偏爱性信息B都是高维矢量。
在该情况下,使用用户信息分析单元35,准备主题数为3且参数预先识别的PLSA概率模型,并且获取用户偏爱性信息A的元素A1-A5的出现概率。关于第一主题,元素A1和A2的出现概率高,并且关于第二主题,元素A3和A4的出现概率高。也就是说,我们可以说元素A1和A2是类似的元素,并且元素A3和A4是类似的元素。
在该情况下,第一至第三主题对应于图6中的元素B1-B3,所以对于元素A2的值相对大的用户1的用户偏爱性信息B,以及元素A1的值相对大的用户2的用户偏爱性信息B,元素B1的值是对于二者相对大的值。这是因为元素A1和A2是类似的元素。另外,对于元素A3的值相对大的用户1的用户偏爱性信息B,以及元素A4的值相对大的用户2的用户偏爱性信息B,元素B2的值是对于二者相对大的值。这是因为元素A3和A4是类似的元素。相反地,对于元素A1-A4的每一个都是相对小的值的用户3的用户偏爱性信息B,元素B1和B2是相对小的值。因此,高维稀疏矢量的用户偏爱性信息A可以转换(产生)成较低维矢量的用户偏爱性信息B。
另外,对于用户偏爱性信息A,如果用户1的元素A1的值是0,并且用户2的元素A1的值是1,并且仅参考用户偏爱性信息A,则两个值之间存在差距,由此容易错误地说用户1和用户2的偏爱性极大不同。但是,对于用户偏爱性信息B,如果用户1的元素B1的值是0.4并且用户2的元素B1的值是0.4,则错误地确定用户1和用户2的偏爱性极大不同的可能性减小。因此,通过产生用户偏爱性信息B,可以更简单且准确地比较用户偏爱性。
注意,不管用户偏爱性信息A,产生用户偏爱性信息B使得用户偏爱性信息B的矢量的元素数量对于每个用户相同。例如,可以执行方案,其中用户偏爱性信息B的表格作为具有预先设置元素数量的矢量存储在B偏爱性信息数据库36中,用户信息分析单元35分析从A偏爱性信息数据库34获取的用户偏爱性信息A,并且在用户偏爱性信息B的表格的每个元素中写入值,由此产生用户偏爱性信息B。
接下来,将更详细地描述介绍用户的确定。如上所述,介绍用户确定单元37对于在用户介绍系统10上具有个人主页的多个用户的每一个过滤用户偏爱性信息A,并且识别与作为过滤结果而获取的用户偏爱性信息A相对应的用户,提取识别用户的用户偏爱性信息B。
例如,介绍用户确定单元37从使用用户的用户偏爱性信息A中搜索具有最大值的元素,仅提取用户偏爱性信息A的元素值等于或高于阈值的用户,并且使得提取的用户经历随后的处理(候选用户)。例如,假设阈值是使用用户的用户偏爱性信息A中具有最大值的元素的值的1/2。例如,在图5的实例中,在用户3是使用用户的情况下,用户3的最大元素是元素A5。用户1的元素的值是0.8>(1.0/2),所以用户1变成候选用户。另一方面,用户2的元素A5的值是0<(1.0/2),所以用户2不变成候选用户。
这里描述基于使用用户的用户偏爱性信息A对于每个用户过滤用户偏爱性信息A的实例,但是可以执行方案,其中基于使用用户的用户偏爱性信息B对于每个用户过滤用户偏爱性信息B,或者其中使用该使用用户的用户偏爱性信息A和用户偏爱性信息B两者过滤每个用户。
注意,可以执行方案,其中不执行过滤,并且在用户介绍系统10上具有个人主页的多个用户都变成候选用户。
如上所述,介绍用户确定单元37计算候选用户的用户偏爱性信息B的每一个与使用用户的用户偏爱性信息B之间的相似性,并且基于其相似性确定介绍用户。
相似性计算为例如某个候选用户的用户偏爱性信息B的矢量与使用用户的用户偏爱性信息B的矢量之间的欧几里得距离的反符号值。例如在图6的实例中,用户1与用户2之间的相似性使用下面的表达式计算。
-{(0.4-0.4)2+(0.4-0.6)2+(0.2-0)2}=-0.08
注意,相似性并不局限于基于欧几里得距离的计算,例如可以计算为矢量的内积。只要输入两个用户的用户偏爱性信息B并且输出实数,可以使用任何计算方法。
这里给出描述,即计算候选用户的用户偏爱性信息B的每一个与使用用户的用户偏爱性信息B之间的相似性,但是可以执行方案,其中在相似性计算中不仅使用用户偏爱性信息B而且也使用用户偏爱性信息A。
因此,计算使用用户和候选用户之间的相似性,并且用户按照较大相似性的次序排序并且作为介绍用户列表显示在浏览器上。此时,如上所述,介绍用户呈现单元38基于介绍用户的用户偏爱性信息A创建介绍原因,并且与介绍原因一起显示应当介绍的用户。
介绍原因是介绍用户的偏爱性的特征,例如显示用户偏爱性信息A的各个元素中具有较大值的前3个元素的名称。例如,在图5中的用户1是介绍用户的情况下,元素A2、A5和A3的名称(例如内容元信息比如艺术家姓名和流派等)作为用户1的介绍原因而显示。
另外,选择使用用户的用户偏爱性信息A的各个元素中具有较大值的前10个元素的名称,并且与介绍用户的介绍原因的各个元素相比较。在从使用用户的用户偏爱性信息A的各个元素中选择的10个元素与从介绍用户的用户偏爱性信息A的各个元素中选择的3个元素之间存在公共元素的情况下,当作为介绍原因而显示时,改变这种公共元素的颜色。
图7显示介绍用户列表的实例。在该实例中,介绍用户显示为“Mr.AAA”、“Mr.BBB”、“Mr.CCC”等。介绍用户“Mr.AAA”的介绍原因是“元素A1”、“元素A10”和“元素A2”,介绍用户“Mr.BBB”的介绍原因是“元素A9”、“元素A2”和“元素A8”,以及介绍用户“Mr.CCC”的介绍原因是“元素A5”、“元素A8”和“元素A3”。在该情况下,假设使用用户的用户偏爱性信息A的各种元素中具有较大值的前十个元素是元素A2、元素A5、元素A6、元素A7、元素A10、元素A11、元素A12、元素A13、元素A14、以及元素A15。
在介绍原因中显示的元素中,与从使用用户的上述用户偏爱性信息A中选择的10个元素公共的那些是元素A2、元素A5和元素A10,由此改变这些元素的颜色并且显示在图7中的屏幕上。在该图中,颜色改变通过将元素下划线来指示。通过这种显示,介绍用户的特征、使用用户与介绍用户之间的偏爱性差异、以及使用用户与介绍用户之间相似性的相同部分可以一看就明白。
在图7中,为了简化说明,介绍原因列为“元素A1”、“元素A10”、“元素A2”等,但是实际上这些是各个元素的名称,并且艺术家名、流派等作为介绍原因显示。
另外,可以执行方案,其中用户偏爱性信息B的元素显示为介绍原因。
此外,可以执行方案,其中代替改变介绍原因的颜色而改变字体,或者改变文本大小,或者显示闪烁。
作为选择,可以执行方案,其中介绍原因不以文本显示,但是显示为图像例如与每个元素相对应的图标。在该情况下,例如代替改变介绍原因的颜色,图像可以显示为活动图像。
接下来,将参考图8中的流程图描述使用用户介绍系统10的用户偏爱性信息A的处理。当用户首次使用用户介绍系统10时或者当用户信息改变时,执行该处理。
在步骤S11中,图1中的用户信息处理单元32从安装在访问内容网站的用户的个人计算机上的浏览器31获取用户信息。用户信息包括关于用户的内容网站使用历史(例如观看的网页)以及用户已经公开的内容的信息。
在步骤S12中,用户信息处理单元32基于包括在获取的用户信息中的信息,从内容元信息数据库33读入内容元信息。此时,用户信息处理单元32识别包括在用户信息中的内容的ID,并且获取与内容相对应的内容元信息。
在步骤S13中,用户信息处理单元32从A偏爱性信息数据库34读入访问内容网站的用户的用户偏爱性信息A。注意,在用户首次使用用户介绍系统10的情况下,用户偏爱性信息A还没有创建,所以在步骤S13中,例如读入用户偏爱性信息A的表格。
在步骤S14中,用户信息处理单元32基于步骤S11中获取的用户信息以及步骤S12中获取的内容元信息更新用户偏爱性信息A。注意,在用户首次使用用户介绍系统10的情况下,在步骤S14中产生用户的用户偏爱性信息A。
在步骤S15中,在步骤S14的处理中更新或产生的用户偏爱性信息A存储在A偏爱性信息数据库34中。因此,产生用户偏爱性信息A。
接下来,将参考图9中的流程图描述使用用户介绍系统10的参数学习处理。该处理是为了学习上述PLSA概率模型的参数,例如当存储在A偏爱性信息数据库34中的用户偏爱性信息A达到预先确定的数量或更高时执行。
在步骤S31中,用户信息分析单元35从A偏爱性信息数据库34读入并分析多个用户偏爱性信息A,并且在步骤S32中为PLSA概率模型设置参数。由此执行参数学习。
接下来,参考图10中的流程图描述使用用户介绍系统10的用户偏爱性信息B产生处理。该处理在使用上面参考图9描述的处理学习参数之后使用参数执行。另外,可以执行方案,其中当更新用户信息时,通过执行上面参考图8描述的处理更新用户的用户偏爱性信息A时,执行这里的处理。
在步骤S51中,用户信息分析单元35确定用户偏爱性信息B的元素数量。元素数量可以安排为预先确定的值,或者可以例如基于来自系统管理员的指示确定。
在步骤S52中,用户信息分析单元35从A偏爱性信息数据库34读入用户偏爱性信息A。
在步骤S53中,用户信息分析单元35使用PLSA(概率潜在语义分析)执行使用步骤S52中的处理读入的用户偏爱性信息A的分析,由此压缩元素数量。
在步骤S54中,用户信息分析单元35从B偏爱性信息数据库36读入用户偏爱性信息B。注意,在用户的用户偏爱性信息B还没有创建的情况下,例如在步骤S54中读入用户偏爱性信息B的表格。
在步骤S55中,用户信息分析单元35基于步骤S53的处理结果更新用户偏爱性信息B。注意,在用户的用户偏爱性信息B还没有创建的情况下,在步骤S55中产生用户的用户偏爱性信息B。
在步骤S56中,将在步骤S55的处理中更新或产生的用户偏爱性信息B存储在B偏爱性信息数据库36中。由此产生用户偏爱性信息B。
注意,可以执行方案,其中与执行上面参考图10描述的处理一起,学习PLSA概率模型的参数。也就是说,可以执行方案,对于上面参考图9描述的处理,图10中的处理不在学习参数之后并通过使用这种参数来执行,而是在执行图10中处理的同时学习参数。
接下来,将参考图11中的流程图描述使用用户介绍系统10的介绍列表产生显示处理。当使用用户命令介绍列表显示时,执行该处理。
在步骤S71中,介绍用户确定单元37读入使用用户的用户偏爱性信息A。
在步骤S72中,介绍用户确定单元37基于步骤S71中读入的使用用户的用户偏爱性信息A执行用户过滤。此时,从使用用户的用户偏爱性信息A中搜索具有最大值的元素,并且仅提取具有用户偏爱性信息A中这种元素的值等于或大于阈值的用户并变成候选用户。注意,可以省略步骤S72中的处理。
在步骤S73中,介绍用户确定单元37从B偏爱性信息数据库36中提取通过步骤S72中的过滤而获取的候选用户的用户偏爱性信息B。
在步骤S74中,介绍用户确定单元37计算使用用户的用户偏爱性信息B与候选用户的用户偏爱性信息B之间的相似性。此时,例如,在用户偏爱性信息B是矢量的情况下,相似性计算为欧几里得距离的反符号值。
在步骤S75中,介绍用户确定单元37基于从步骤S74中的处理获取的相似性确定介绍用户。此时,例如,执行确定,使得与相似度等于或高于预先设置阈值的用户偏爱性信息B相对应的候选用户变成介绍用户。
在步骤S76中,介绍用户呈现单元38例如基于介绍用户的用户偏爱性信息A创建介绍原因。
在步骤S77中,介绍用户呈现单元38例如在使用用户的浏览器上显示介绍用户列表。此时,例如,屏幕例如上面参考图7描述的屏幕显示在个人计算机等的屏幕上。由此执行用户介绍。
使用上面的描述,描述了使用用户偏爱性信息A和用户偏爱性信息B主要用于识别介绍用户以介绍给使用用户的实例,但是可以执行方案,其中使用用户偏爱性信息A和用户偏爱性信息B以便能够以容易理解的方式表示各个用户偏爱性的特征。
例如,在存在大量介绍用户的情况下,观看介绍用户的每一个个人主页耗时且耗力。实际上,使用用户可能观看每个介绍用户的个人主页很短一段时间,并且确定哪个介绍用户个人主页具有花时间观看的价值,此后再次观看确定具有花时间观看的价值的少量介绍用户的个人主页。
另外,用户可能不仅对系统介绍的用户感兴趣,而且对于另一个用户的偏爱性特征与自身的偏爱性特征之间的匹配或差异的程度感兴趣,所以能够直观地理解用户偏爱性特征将是有帮助的。
通过使用上述用户偏爱性信息A和用户偏爱性信息B,可以变得直观地理解用户偏爱性特征。
图12是描述在显示用户偏爱性特征以便直观理解的情况下的处理的图。如图12中所示,基于用户信息和内容元信息产生用户偏爱性信息A。通过对用户偏爱性信息A执行PLSA分析,产生作为具有压缩元素数量的矢量的用户偏爱性信息B。至此,处理与上面参考图2描述的情况类似。
例如基于用户偏爱性信息A和用户偏爱性信息B,计算某个用户偏爱性表示值。偏爱性表示值是用于表示目的的值,使得可以直观地理解用户偏爱性特征。偏爱性表示值的细节将随后描述。
此外,基于计算的偏爱性表示值,表示用户偏爱性特征以便直观地理解和表示(显示)。
图13是显示在显示用户偏爱性特征以便直观理解的情况下,用户介绍系统20的配置实例的框图。图13是与图1相对应的图,并且与图1相对应的部分具有相同的参考数字表示。
与用户介绍系统10类似,用户介绍系统20也配置成例如连接到网络例如因特网的服务器。注意,可以执行方案,其中用户介绍系统20由互相连接的多个服务器构成。另外,用户介绍系统20的介绍用户和使用用户与用户介绍系统10的情况类似。
另外,在用户介绍系统20中没有提供图1的介绍用户确定单元37和介绍用户呈现单元38,但是可以执行方案,例如偏爱性表示值计算单元41作为介绍用户确定单元37的一部分安装,并且用户偏爱性表示单元42作为介绍用户呈现单元38的一部分安装。
图13中的浏览器31至B偏爱性信息数据库36与图1中的情况类似,所以将省略其详细描述。
偏爱性表示值计算单元41基于存储在B偏爱性信息数据库36中的用户偏爱性信息B或者存储在A偏爱性信息数据库34中的用户偏爱性信息A计算偏爱性表示值。
偏爱性表示值是例如对于用户偏爱性信息B的每一个元素的值。如上所述,用户偏爱性信息B是通过压缩作为高维稀疏矢量的用户偏爱性信息A的元素数量而产生的较低维矢量。因此,例如对于用户偏爱性信息A的元素,即使在两个值之间存在差距的情况下,可能存在如果参考用户偏爱性信息B,可以确定偏爱性类似的情况,从而能够更简单且准确地比较用户偏爱性。
例如,在某个用户的用户偏爱性信息A的元素A1-A3每一个对应于“爵士”、“古典”、“bosanova”的内容元信息的情况下,具有元素A1-A3的高出现概率的元素B1在用户偏爱性信息B中产生。在该情况下,例如代替表示用户偏爱性特征为“爵士1”、“古典2”、“bosanova 3”,命名元素B1为“成熟”并且表示为“成熟1.5”,可以使得用户偏爱性特征能够更直观地理解。
另外,例如在用户偏爱性信息B中存在大量元素的情况下,可以如下计算偏爱性表示值。例如,在偏爱性表示值产生为二维矢量(偏爱性表示值1,偏爱性表示值2)的情况下,可以执行方案,其中用户的偏爱性表示值1计算为用户偏爱性信息A的元素A1-A4与用户偏爱性信息B的元素B1和B2的总和,偏爱性表示值2计算为用户偏爱性信息A的元素A5-A8与用户偏爱性信息B的元素B3和B4的总和。
作为选择,可以执行方案,其中进一步对用户偏爱性信息B执行PLSA分析以产生具有更少元素的矢量,其中矢量的每个元素值变成构成偏爱性表示值的矢量的元素值。
此外,可以执行方案,其中提取用户偏爱性信息A的预先确定元素和用户偏爱性信息B的预先确定元素,并且元素值的每一个是构成偏爱性表示值的矢量的元素值。例如,在用户偏爱性信息A由元素A1-A8构成并且用户偏爱性信息B由元素B1-B4构成的情况下,偏爱性表示值的矢量可以是矢量(元素A1,元素B2,元素B3,元素B4)。
基于如此获取的偏爱性表示值,用户偏爱性表示单元42将表示用户偏爱性特征的屏幕显示在浏览器31上。
图14是显示使用用户偏爱性表示单元42产生的、显示用户偏爱性特征的屏幕的实例的图。在图14的实例中,实例是偏爱性表示值构造成5维矢量的情况,并且作为矢量元素的偏爱性表示值1至偏爱性表示值5的每一个是一个轴,由此偏爱性表示值显示为5边图。
图15是显示使用用户偏爱性表示单元42产生的表示用户偏爱性特征的屏幕的另一个实例的图。在图15的实例中,实例是偏爱性表示值构造成5维矢量的情况,并且作为矢量元素的偏爱性表示值1至偏爱性表示值5的每一个是一个轴,由此偏爱性表示值显示为柱状图。因此,可以更直观地理解用户偏爱性特征。
作为选择,可以执行方案,其中以分层方式显示多个用户的偏爱性表示值。图16是显示使用用户偏爱性表示单元42产生的、表示用户偏爱性特征的屏幕的另一个实例的图。在图16的实例中,实例是偏爱性表示值构造成5维矢量的情况,并且作为矢量元素的偏爱性表示值1至偏爱性表示值5的每一个是一个轴,由此两个用户的偏爱性表示值的每一个显示为5边图。
在图16中,例如,使用点线112显示的图表示使用用户(自身)的偏爱性特征,并且使用线111显示的图表示介绍用户(另一个人)的偏爱性特征。
图17是显示使用用户偏爱性表示单元42产生的、显示用户偏爱性特征的屏幕的再一个实例的图。在图17的实例中,实例是偏爱性表示值构造成5维矢量的情况,并且作为矢量元素的偏爱性表示值1至偏爱性表示值5的每一个是一个轴,由此两个用户的偏爱性表示值的每一个显示为柱状图。
在图17中,例如,使用白条显示的柱状图表示使用用户(自身)的偏爱性特征,并且使用阴影显示的柱状图表示介绍用户(另一个人)的偏爱性特征。因此,可以更直观地理解匹配每个用户偏爱性特征的程度或者偏爱性特征的差异。
此外,与如上所述用图表示偏爱性表示值的屏幕一起,有限数量的用户偏爱性信息A或用户偏爱性信息B的元素或者二者的具有较大值的元素的名称作为用户特征显示,由此可以更详细地执行偏爱性表示。
例如,从使用用户的用户偏爱性信息A中选择具有大值的10个元素,并且从介绍用户的用户偏爱性信息A中选择具有大值的6个元素。为了以更直观的方式表示介绍用户的偏爱性特征,根据元素值的大小按大小显示6个提取元素的名称是有效的。
在从使用用户的用户偏爱性信息A的各个元素中选择的10个元素与从介绍用户的用户偏爱性信息A的各个元素中选择的6个元素之间存在公共元素的情况下,显示为介绍原因的公共元素以不同的颜色显示。
图18是显示使用用户偏爱性表示单元42产生的、表示用户偏爱性特征的屏幕的再一个实例的图。在图18的情况下,例如,屏幕实例是将介绍用户的偏爱性特征呈现给使用用户的情况,其中图中的区域151将使用用户和介绍用户的偏爱性表示值显示为图,并且区域152以与区域151中的显示不同的方法显示介绍用户的偏爱性特征。
在图18的实例中,实例是偏爱性表示值构造成5维矢量的情况,并且作为矢量元素的偏爱性表示值1至偏爱性表示值5的每一个是一个轴,由此两个用户的偏爱性表示值在区域151中显示为5边图。而且在图18中,例如,使用点线172显示的图表示使用用户的偏爱性特征,并且使用线171显示的图表示介绍用户的偏爱性特征。
另外,对于图18中的实例,具有较大值的前6个元素从介绍用户的偏爱性信息A中提取,并且作为介绍用户特征显示在区域152中。在图18的实例中,显示“元素A1”、“元素A2”、“元素A5”、“元素A8”、“元素A9”和“元素A10”。为了简化描述,介绍原因描述为“元素A1”、“元素A2”等,但是实际上是每个元素的名称,并且介绍原因例如艺术家名和流派将被显示。
此外,对于图18中的实例,6个提取元素的名称根据元素值的大小按大小显示。对于该实例,“元素A8”的值最大并且“元素A1”的值最小。
另外,对于图18中的实例,在从使用用户的用户偏爱性信息A的各个元素中选择的10个元素与从介绍用户的用户偏爱性信息A的各个元素中选择的6个元素之间存在公共元素的情况下,在区域152中显示的公共元素改变其颜色而显示。在图18中,颜色改变显示通过使用下划线显示元素来表示。在该情况下,“元素A2”、“元素A5”和“元素A10”是从使用用户的用户偏爱性信息A的各个元素中选择的10个元素与从介绍用户的用户偏爱性信息A的各个元素中选择的6个元素的公共元素。
此外,可以执行方案,其中代替在区域152中改变颜色而改变字体,或者改变文本大小,或者显示闪烁。
作为选择,可以执行方案,其中区域152中的显示不以文本执行,而是显示为图像例如与每个元素相对应的图标。在该情况下,例如代替改变每个元素的颜色,图像可以显示为活动图像。
另外,这里已经使用以多边图或柱状图绘制偏爱性表示值作为表示用户偏爱性特征的屏幕的实例给出描述,但是表示用户偏爱性表示值的屏幕并不局限于这些图,并且偏爱性表示值不一定以图表示。
例如,作为表示用户偏爱性特征的屏幕,可以执行方案,其中显示人物的图像,并且根据偏爱性表示值矢量的每个元素的值改变显示的人物,或者根据偏爱性表示值矢量的每个元素的值改变人物的面部表情。另外,可以根据偏爱性表示值矢量的各个元素的值改变用作用户偏爱性特征的形状的形式、颜色或运动。
因此,介绍用户的偏爱性特征、使用用户与介绍用户之间偏爱性特征的差异、以及使用用户与介绍用户之间具有相同偏爱性特征的部分可以一看就明白。
接下来,将参考图19中的流程图描述使用用户介绍系统20的偏爱性表示屏幕产生显示处理。可以执行方案,其中当请求表示预先确定用户偏爱性特征的屏幕显示时执行该处理,或者当使用用户命令介绍列表显示时,与上面参考图11描述的处理一起执行该处理。
在步骤S91中,偏爱性表示值计算单元41从B偏爱性信息数据库36读入用户偏爱性信息B。注意,当存在应当为其显示表示偏爱性特征(偏爱性表示值)的屏幕的多个用户时,读入与多个用户相对应的用户偏爱性信息B。
在步骤S92中,偏爱性表示值计算单元41从A偏爱性信息数据库34读入用户偏爱性信息A。注意,当存在应当为其显示表示偏爱性特征(偏爱性表示值)的屏幕的多个用户时,读入与多个用户相对应的用户偏爱性信息A。注意,在偏爱性表示值计算中不使用用户偏爱性信息A的情况下,可以省略步骤S92中的处理。
在步骤S93中,偏爱性表示值计算单元41从使用步骤S91中的处理读入的用户偏爱性信息B的元素以及使用步骤S92中的处理读入的用户偏爱性信息A的元素中选择偏爱性表示值计算所必需的元素。
在步骤S94中,偏爱性表示值计算单元41基于步骤S93的处理中选择的元素计算偏爱性表示值。如上所述,可以执行方案,其中此时例如,构成偏爱性表示值矢量的元素值的每一个变成用户偏爱性信息B的元素的值,或者偏爱性表示值的一个元素(例如偏爱性表示值1)可以计算为用户偏爱性信息A的多个元素的总和、或者用户偏爱性信息B的多个元素的总和、或者用户偏爱性信息A的多个(或单个)元素与用户偏爱性信息B的多个(或单个)元素的总和。
作为选择,可以执行方案,其中使用用户信息分析单元35对用户偏爱性信息B执行PLSA分析,产生具有更少元素的矢量,并且矢量的元素的每一个值变成构成偏爱性表示值矢量的元素的值。
此外,可以执行方案,其中提取用户偏爱性信息A的预先确定元素和用户偏爱性信息B的预先确定元素,并且这些元素值的每一个变成构成偏爱性表示值矢量的元素的值。
在步骤S95中,用户偏爱性表示单元42将作为用于显示用户偏爱性特征的偏爱性表示屏幕的屏幕,例如参考图14-18描述的屏幕,显示在用户的个人计算机等的屏幕上。由此显示偏爱性表示屏幕。
使用上面的描述,描述了基于使用用户的用户偏爱性信息B和候选用户的每一个的用户偏爱性信息B之间的相似性确定介绍用户,并且显示介绍用户列表的情况的实例。也就是说,上面描述了基于用户偏爱性信息介绍用户的实例。
但是,通过应用本信息,可以例如基于内容元信息介绍用户。例如,如果内容元信息配置成具有高维实数值矢量,与使用用户偏爱性信息A类似,压缩其内容元信息,并且与上述实例类似,可以基于压缩的内容元信息与候选用户的每一个的用户偏爱性信息B之间的相似性确定介绍用户。
图20是显示根据本发明一种实施方案的用户介绍系统的另一个配置实例的框图。用户介绍系统200配置成提供SNS(社交网络服务)的内容网站。内容网站提供例如音乐、电影、视频、电视节目和作品的媒体内容以及例如产品销售的内容,并且也提供将某个用户介绍给另一个用户的服务。
用户介绍系统200不同于图1中的用户介绍系统10的情况,并且例如配置使得可以基于预先确定的内容元信息介绍用户。
对于用户介绍系统200,与图1中的用户介绍系统10的情况类似,例如对于经由安装在个人计算机等中的浏览器访问内容网站的每个用户提供个人主页。个人主页是用户公开的内容信息,并且例如列出内容信息例如最喜爱的音乐、电影等。用户介绍系统200的用户使用安装在用户的个人计算机上的浏览器,经由网络例如因特网访问内容网站,并且观看内容网站内的页面或链接到内容网站的网页。
用户介绍系统200配置成例如连接到网络例如因特网的服务器,与用户介绍系统10的情况类似。注意,可以执行方案,其中用户介绍系统200由相互连接的多个服务器构成。
用户信息处理单元232从安装在访问内容网站的用户(其是具有上述个人主页的用户)的个人计算机等中的浏览器231获取用户信息,与图1中的用户信息处理单元32类似。当从浏览器231获取用户信息时,用户信息处理单元232基于包括在获取的用户信息中的信息从内容元信息数据库233读入内容元信息。
每个内容的唯一ID和内容元信息相关并且存储在内容元信息数据库233中,与图1中的内容元信息数据库33类似,并且用户信息处理单元232识别包括在用户信息中的内容ID并且获取与这种内容相对应的内容元信息。
注意,存储在内容元信息数据库233中的内容元信息变成具有多个元素的高维矢量,与存储在A偏爱性信息数据库234中的用户偏爱性信息A类似。
另外,用户信息处理单元232基于从浏览器231获取的用户信息以及从内容元信息数据库233获取的内容元信息产生用户偏爱性信息A,与图1中的情况类似。用户偏爱性信息A对多个用户的每一个产生,并且产生的用户偏爱性信息A存储在A偏爱性信息数据库234中。
信息分析单元235从A偏爱性信息数据库234读入并分析用户偏爱性信息A,并且产生用户偏爱性信息B,与图1中的用户信息分析单元35类似。用户偏爱性信息B变成压缩(减少)了用户偏爱性信息A的元素数量的矢量,并且信息分析单元235通过使用多主题模型执行分析,产生具有压缩元素数量的矢量。用户偏爱性信息B对多个用户的每一个产生,并且产生的用户偏爱性信息B存储在B偏爱性信息数据库236中。
另外,信息分析单元235从内容元信息数据库233读入并分析内容元信息,并且产生压缩的内容元信息。压缩的内容元信息变成压缩(减少)了内容元信息的元素数量的矢量,并且信息分析单元235通过使用多主题模型执行分析,产生具有压缩元素数量的矢量。压缩的内容元信息对多个用户的每一个产生,并且产生的压缩内容元信息存储在压缩内容元信息数据库239中。
也就是说,信息分析单元235压缩用户偏爱性信息同时也压缩内容元信息。注意,存储在内容元信息数据库233中的内容元信息配置成与存储在A偏爱性信息数据库234中的用户偏爱性信息A具有相同元素的相同维矢量。另外,存储在压缩内容元信息数据库239中的压缩内容元信息配置成与存储在B偏爱性信息数据库236中的用户偏爱性信息B具有相同元素的相同维矢量。
注意,获取单词或文本的出现概率的方法,例如PLSA(概率潜在语义分析)、LDA(潜在迪克莱特分配)等可以作为使用信息分析单元235的多主题模型的分析方法的实例而给出。
图21是显示内容1-3的内容元信息的实例的图,并且图22是显示通过对图21中的内容元信息使用PLSA执行分析产生的压缩内容元信息的实例的图。这里描述将作为5维矢量的内容元信息转换成作为3维矢量的压缩内容元信息的实例以便简化描述,但是实际上,内容元信息和压缩内容元信息都是高维矢量。
在该情况下,使用信息分析单元235,准备主题数为3且参数预先确定的PLSA概率模型,并且获取内容元信息的元素A1-A5的出现概率。关于第一主题,元素A1和A2的出现概率高,并且关于第二主题,元素A3和A4的出现概率高。也就是说,元素A1和A2是类似的元素,并且元素A3和A4是类似的元素。
在该情况下,第一至第三主题对应于图22中的元素B1-B3,所以对于具有相对大值的元素A2的内容1的压缩内容元信息,以及具有相对大值的元素A1的内容2的压缩内容元信息,其元素B1的值是相对大的值。这是因为元素A1和A2是类似的元素。另外,内容1-3中内容元信息的元素A3和A4的值是“0”,所以对于内容1-3的压缩内容元信息,元素B2的值对于每一个是“0”。这是因为元素A3和A4是类似的元素。此外,对于元素A5的值相对大的内容1和3的压缩内容元信息,元素B3具有相对大的值。
因此,作为高维稀疏矢量的内容元信息可以转换(产生)成作为较低维矢量的压缩内容元信息。因此,通过产生压缩内容元信息,可以更简单和准确的方式比较内容特征。
注意,产生压缩内容元信息,使得每个用户的压缩内容元信息的矢量的元素数量变得相同,而不管内容元信息。
返回到图20,与图1中的介绍用户确定单元37类似,确定处理单元237对于在用户介绍系统200上具有个人主页的多个用户的每一个,基于浏览器231的使用者的用户偏爱性信息A过滤用户偏爱性信息A或用户偏爱性信息B,识别与作为过滤结果而获取的用户偏爱性信息A或用户偏爱性信息B相对应的用户,并且提取识别用户的用户偏爱性信息B。
确定处理单元237计算提取的用户偏爱性信息B的每一个与浏览器231的使用者的用户偏爱性信息B之间的相似性,并且基于其相似性确定应当介绍给浏览器231的使用者的用户。
另外,确定处理单元237识别与经由浏览器231输入的内容ID相对应的压缩内容元信息,并且对于在用户介绍系统200上具有个人主页的多个用户的每一个,提取用户偏爱性信息B。
确定处理单元237计算与输入的内容ID相对应的压缩内容元信息和提取的用户偏爱性信息B的每一个之间的相似性,并且基于其相似性确定应当介绍给浏览器231的使用者的用户。
也就是说,确定处理单元237不仅接收用户偏爱性信息B的输入并且计算与其他用户偏爱性信息B的相似性,而且也可以接收压缩内容元信息的输入并且执行与用户偏爱性信息B的相似性的计算。
相似性计算为例如某个候选用户的用户偏爱性信息B的矢量与压缩内容元信息的矢量之间的欧几里得距离的反符号值。注意,相似性并不局限于基于欧几里得距离的计算,例如可以计算为矢量的内积。
这里已经给出描述,其中计算候选用户的每一个的用户偏爱性信息B与压缩内容元信息之间的相似性,但是可以执行方案,其中例如不仅使用用户偏爱性信息B而且使用用户偏爱性信息A。
呈现处理单元238配置以便显示使用确定处理单元237确定的、显示应当介绍的用户的介绍用户列表,以及介绍原因。呈现处理单元238按照较大相似性的次序排序用户,并且将这个作为介绍用户列表显示在浏览器上。此时,如上所述,呈现处理单元238基于介绍用户的用户偏爱性信息A创建介绍原因,并且与介绍原因一起显示应当介绍的用户。也就是说,配置呈现处理单元238,使得产生并显示例如上面参考图7描述的介绍用户列表。因此,根据本发明,用户也可以基于内容元信息介绍。
使用图20中的用户介绍系统200的用户偏爱性信息A产生处理、参数学习处理、以及用户偏爱性信息B产生处理是与上面分别参考图8-10描述的处理类似的处理,所以将省略其详细描述。
接下来,将参考图23中的流程图描述使用图20中的用户介绍系统200的压缩内容元信息产生处理。
在使用上面参考图9描述的处理学习参数之后,使用这些参数执行该处理。
在步骤S111中,信息分析单元235确定压缩内容元信息的元素数量。元素数量可以是预先确定的值,或者可以例如基于来自系统管理员的命令确定等。
在步骤S112中,信息分析单元235从内容元信息数据库233读入内容元信息。
在步骤S113中,信息分析单元235通过使用例如PLSA(概率潜在语义分析)执行分析,压缩使用步骤S112中的处理读入的内容元信息的元素数量。实际上,元素数量的压缩将通过例如使用PLSA执行分析,对存储在内容元信息数据库233中的内容元信息的每一个而执行。
在步骤S114中,信息分析单元235将使用步骤S113中的处理压缩元素的内容元信息存储在压缩内容元信息数据库239中。由此,产生压缩内容元信息。
注意,可以执行方案,其中可以与上面参考图23描述的处理的执行一起,学习PLSA概率模型的参数。也就是说,可以执行方案,使用上面参考图9描述的处理,图23中的处理不在学习参数之后使用参数来执行,而是可以在执行图23中的处理的同时学习参数。
对于图20中的用户介绍系统200,在基于用户偏爱性信息介绍用户的情况下的介绍列表产生显示处理是与上面参考图11描述的处理类似的处理,所以将省略其详细描述。
对于图20中的用户介绍系统200,在基于预先确定内容的内容元信息介绍用户的情况下的介绍列表产生显示处理变成例如图24中所示的处理。将参考图24中的流程图描述在基于预先确定的内容元信息介绍用户的情况下使用用户介绍系统200的介绍列表产生显示处理的实例。例如当使用用户命令基于内容元信息显示介绍列表时,该处理执行。
在步骤S131中,确定处理单元237通过例如接收内容ID的输入识别预先确定的内容。
在步骤S132中,确定处理单元237基于步骤S131中识别的内容元信息执行用户的过滤。此时,例如,搜索内容元信息中具有较大值的元素,并且仅提取用户偏爱性信息A中这种元素的值等于或大于阈值的用户并变成候选用户。注意,可以执行方案,其中省略步骤S132中的处理。
在步骤S133中,确定处理单元237从B偏爱性信息数据库236中提取使用步骤S132中的过滤而获取的候选用户的用户偏爱性信息B。
在步骤S134中,确定处理单元237计算步骤S131中识别的预先确定内容的压缩内容元信息与每一个候选用户的用户偏爱性信息B之间的相似性。此时,相似性计算为例如压缩内容元信息与用户偏爱性信息B的矢量之间的欧几里得距离的反符号值。
在步骤S135中,确定处理单元237基于通过步骤S134中的处理获取的相似性确定介绍用户。此时,执行确定,使得与相似性等于或高于预先设置阈值的用户偏爱性信息B相对应的候选用户例如变成介绍用户。
在步骤S136中,呈现处理单元238例如基于介绍用户的用户偏爱性信息A创建介绍原因。
在步骤S137中,呈现处理单元238在例如使用用户的浏览器上显示介绍用户列表。此时,例如,如上面参考图7描述的屏幕显示在使用用户的个人计算机等的屏幕上。由此,执行基于内容元信息的用户介绍。
至此,已经描述了基于用户偏爱性信息介绍用户的实例以及基于内容元信息介绍用户的实例,但是无须说,可以使用用户介绍系统200基于用户偏爱性信息介绍内容。
接下来,将参考图25中的流程图描述在基于用户偏爱性信息介绍内容的情况下使用用户介绍系统200的介绍列表产生显示处理的实例。例如当使用用户命令基于用户偏爱性信息显示内容介绍列表时,执行该处理。
在步骤S151中,确定处理单元237读入使用用户的用户偏爱性信息A。
在步骤S152中,确定处理单元237基于步骤S151中读入的使用用户的用户偏爱性信息A执行内容元信息的过滤。此时,例如从使用用户的用户偏爱性信息A中搜索具有较大值的元素,并且仅提取这种元素的内容元信息值等于或高于阈值的内容并变成候选内容。注意,步骤S152中的处理可以省略。
在步骤S153中,确定处理单元237从压缩内容元信息数据库239中提取在步骤S152中的过滤而获取的候选内容的压缩内容元信息。
在步骤S154中,确定处理单元237计算使用用户的用户偏爱性信息B与每一个候选内容的压缩内容元信息之间的相似性。此时,在用户偏爱性信息B和压缩内容元信息作为矢量的情况下,相似性计算为例如欧几里得距离的反符号值。
在步骤S155中,确定处理单元237基于使用步骤S154中的处理获取的相似性确定介绍内容。此时,例如,确定与相似性等于或高于预先设置阈值的压缩内容元信息相对应的候选内容,以便变成介绍内容。
在步骤S156中,呈现处理单元238例如基于介绍内容的内容元信息创建介绍原因。
在步骤S157中,呈现处理单元238例如在使用用户的浏览器上显示介绍内容列表。此时,如图26中所示的屏幕显示在使用用户的个人计算机等的屏幕上。
图26显示介绍内容列表的实例。在该实例中,介绍内容显示为“内容4”、“内容5”、“内容6”等。介绍内容“内容4”的介绍原因是“元素A2”和“元素A5”,介绍内容“内容5”的介绍原因是“元素A1”、“元素A2”和“元素A8”,以及介绍内容“内容6”的介绍原因是“元素A5”、“元素A8”和“元素A3”。如上所述,“元素A1”、“元素A2”等基于各自的内容元信息元素而显示。
另外,图26中所示的星号显示介绍内容是“内容4”、“内容5”、“内容6”等的压缩内容元信息与使用用户的用户偏爱性信息B之间的相似性。在该实例中,“内容4”和“内容5”显示有四个星号,而“内容6”显示有三个星号。因此,我们可以容易地确认与“内容4”和“内容5”的相似性比与“内容6”的相似性高。
注意,为了简化描述,图26中的介绍原因写为“元素A1”、“元素A10”、“元素A2”等,但是实际上,这些是每个元素的名称,并且将显示例如艺术家名和流派的介绍原因。
另外,可以执行方案,其中压缩内容元信息的元素显示为介绍原因。
由此,基于用户偏爱性信息介绍内容。注意,这里给出描述为内容介绍,但是实际上,可以执行方案,其中可以创建要推荐给用户的内容的列表,并且可以显示如图26中所示的介绍内容列表。另外,可以执行方案,其中例如当用户登陆到用户介绍系统200时,自动地执行上面参考图25描述的处理,并且如图26中所示的列表作为推荐给用户的内容的列表而呈现。
至此描述了基于用户偏爱性信息介绍用户的实例,基于内容元信息介绍用户的实例,以及基于用户偏爱性信息介绍(推荐)内容的实例,但是基于内容元信息介绍(推荐)内容也可以使用用户介绍系统200执行。也就是说,根据本发明,在用户输入用户期望观看/收听的内容或用户期望购买的内容的ID的情况下,可以基于内容元信息介绍(推荐)新的内容。
接下来,将参考图27中的流程图描述在基于内容元信息介绍内容的情况下使用用户介绍系统200的介绍列表产生显示处理的实例。当使用用户命令基于内容元信息显示内容介绍列表时,执行该处理。
在步骤S171中,确定处理单元237通过例如接收内容ID的输入来识别预先确定的内容。这里识别的内容将称作“基点(base point)内容”。
在步骤S172中,确定处理单元237基于基点内容的内容元信息执行内容元信息的过滤。此时,例如从基点内容的内容元信息中搜索具有较大值的元素,并且仅提取具有这种元素的内容元信息值等于或高于阈值的内容并变成候选内容。注意,可以省略步骤S172中的处理。
在步骤S173中,确定处理单元237从压缩内容元信息数据库239中提取从步骤S172中的过滤而获取的候选内容的压缩内容元信息。
在步骤S174中,确定处理单元237计算基点内容的压缩内容元信息与每一个候选内容的压缩内容元信息之间的相似性。此时,例如在压缩内容元信息是矢量的情况下,相似性计算为欧几里得距离的反符号值。
在步骤S175中,确定处理单元237基于在步骤S174中的处理获取的相似性确定介绍内容。此时,例如与相似性等于或高于预先设置阈值的压缩内容元信息相对应的候选内容确定为介绍内容。
在步骤S176中,呈现处理单元238例如基于介绍内容的内容元信息创建介绍原因。
在步骤S177中,呈现处理单元238将介绍内容列表显示在例如使用用户的浏览器上。此时,例如,如图26中所示的屏幕显示在使用用户的个人计算机等的屏幕上。
由此,基于基点内容的内容元信息介绍内容。注意,这里给出描述为内容介绍,但是实际上,可以执行方案,其中如图26中所示的介绍内容列表显示为要推荐给用户的内容的列表。另外,可以执行方案,其中例如当用户使用用户介绍系统200输入观看/收听或购买内容的命令时,以这种内容作为基点内容自动地执行上面参考图27描述的处理,并且如图26中所示的列表作为推荐给用户的内容列表而呈现。
注意,对于用户介绍系统200,在基于内容元信息介绍内容的情况下,可以执行方案,其中不配置用户信息处理单元232、A偏爱性信息数据库234、以及B偏爱性信息数据库236。
注意,上述系列的处理可以使用硬件执行,或者可以使用软件执行。在使用软件执行上述系列处理时,构成这种软件的程序从网络或记录介质安装到嵌入专用硬件中的计算机上,或者安装到可以通过安装各种类型的程序执行各种类型的功能、例如图28中所示的通用计算机700上。
在图28中,CPU(中央处理单元)701根据存储在ROM(只读存储器)702中的程序或者从存储单元708加载到RAM(随机存取存储器)703中的程序执行各种类型的处理。CPU 701执行各种类型的程序所必需的数据等也适当地存储在RAM 703中。
CPU 701、ROM 702和RAM 703经由总线704相互连接。该总线704也连接到输入/输出接口705。
输入/输出接口705连接到由键盘、鼠标等构成的输入单元706,由显示器例如CRT(阴极射线管)、LCD(液晶显示器)和扬声器等构成的输出单元707,由硬盘等构成的存储单元708,以及由调制解调器或网络接口卡例如LAN卡构成的通信单元709等。通信单元709经由包括因特网的网络执行通信处理。
输入/输出接口705也适当地连接到驱动器710,可移除介质711例如磁盘、光盘、光磁盘或半导体存储器等适当地安装,并且从中读出的计算机程序适当地安装在存储单元708中。
在使用软件执行上述系列处理的情况下,构成软件的程序从网络例如因特网或者记录介质例如可移除介质711安装。
注意,这里的记录介质不仅包括可移除介质711例如磁盘(包括软盘)、光盘(CD-ROM(致密盘-只读存储器)和DVD(数字通用盘))、磁光盘(包括MD(迷你盘)(注册商标))以及半导体存储器的配置,其中程序与设备主单元分离地记录以将程序分发给用户,而且也包括包含在ROM 702或存储单元708中的硬盘的配置,其中程序以预先内置到设备主单元的状态存储并分发给用户。
注意,对于执行在本说明书中描述的上述系列处理的步骤,无须说,可以时间序列的方式按照描述的次序执行处理,但是处理并不局限于以时间序列的方式执行,并且也包括以并行方式或独立地执行的处理。
本领域技术人员应当理解,各种修改、组合、子组合和更改可以根据设计需求和其他因素而进行,它们均落入附加权利要求或其等价物的范围内。

Claims (19)

1.一种信息处理设备,包括:
用户信息获取装置,配置以获取与用户已经使用的内容的数据相关的信息;
元信息获取装置,配置以获取与所述用户已经使用的内容相对应的内容元信息;
第一矢量产生装置,配置以使用所述获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;
第二矢量产生装置,配置以产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;以及
用户识别装置,配置以识别与多个所述第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
2.根据权利要求1的信息处理设备,其中所述第二矢量产生装置通过使用多主题模型执行关于所述第一用户偏爱性矢量的分析,压缩所述第一用户偏爱性矢量的元素的数量。
3.根据权利要求2的信息处理设备,其中所述第二矢量产生装置
执行PLSA多主题模型的分析;以及
预先读入多个所述第一用户偏爱性矢量并学习所述PLSA的概率模型的参数。
4.根据权利要求1的信息处理设备,其中预先提供的所述预先确定的第二用户偏爱性矢量是请求介绍具有与自己类似偏爱性的用户的使用用户的第二用户偏爱性矢量;以及
其中所述用户识别装置识别与预先存储的第二用户偏爱性矢量中预先确定的一个相对应的用户,作为应当介绍给所述使用用户的介绍用户。
5.根据权利要求4的信息处理设备,其中所述用户识别装置基于所述使用用户的第一用户偏爱性矢量,提取与预先存储的第一用户偏爱性矢量中预先确定的一个相对应的用户,作为候选用户;以及
其中与所述候选用户的第二用户偏爱性矢量中预先确定的一个相对应的用户被识别为应当介绍给所述使用用户的介绍用户。
6.根据权利要求5的信息处理设备,其中基于所述使用用户的所述第二用户偏爱性矢量与每一个所述候选用户的所述第二用户偏爱性矢量之间的欧几里得距离计算所述相似性;以及
其中所述用户识别装置识别与具有预先设置的阈值量或更大的所述相似性的所述第二用户偏爱性矢量相对应的用户作为所述介绍用户。
7.根据权利要求1的信息处理设备,还包括:
介绍用户呈现装置,配置以产生将所述介绍用户的列表呈现给所述使用用户的屏幕数据;
其中,所述介绍用户呈现装置基于所述介绍用户的所述第一用户偏爱性矢量的元素,产生将所述介绍用户介绍给所述使用用户的介绍原因。
8.根据权利要求7的信息处理设备,其中基于以值由大到小的次序,从所述介绍用户的所述第一用户偏爱性矢量的元素中提取的预先确定数量的元素名称而产生所述介绍原因。
9.根据权利要求8的信息处理设备,其中所述介绍用户呈现装置进一步以值由大到小的次序提取所述使用用户的所述第一用户偏爱性矢量的元素中预先确定数量的元素;以及
其中,在提取以便产生所述介绍原因的所述介绍用户的所述第一用户偏爱性矢量元素中的元素的每一个与从所述使用用户的所述第一用户偏爱性矢量中提取的所述元素是相同元素的情况下,基于其中相同元素的名称产生的所述介绍原因以不同于基于其它元素名称产生的所述介绍原因的显示状态而显示。
10.一种信息处理方法,包括步骤:
获取与用户已经使用的内容的数据相关的信息;
获取与所述用户已经使用的内容相对应的内容元信息;
使用所述获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;
产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;以及
识别与多个所述第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
11.一种使得计算机用作信息处理设备的程序,包括:
用户信息获取组件,配置以获取与用户已经使用的内容的数据相关的信息;
元信息获取组件,配置以获取与所述用户已经使用的内容相对应的内容元信息;
第一矢量产生组件,配置以使用所述获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;
第二矢量产生组件,配置以产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;以及
用户识别组件,配置以识别与多个所述第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
12.一种记录介质,其中记录有根据权利要求11的程序。
13.一种信息处理设备,包括:
用户信息获取装置,配置以获取与用户已经使用的内容的数据相关的信息;
元信息获取装置,配置以获取与所述用户已经使用的内容相对应的内容元信息;
第一矢量产生装置,配置以产生与所述获取的内容元信息具有相同元素数量的第一用户偏爱性矢量;
第二矢量产生装置,配置以产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;
第三矢量产生装置,配置以产生压缩的元信息矢量,其中分析所述内容元信息作为矢量并且压缩所述内容元信息矢量的元素的数量;以及
用户识别装置,配置以识别与多个所述第二用户偏爱性矢量中与预先确定的压缩元信息矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
14.根据权利要求13的信息处理设备,还包括:
内容识别装置,配置以识别与多个所述压缩元信息矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的压缩元信息矢量相对应的内容。
15.根据权利要求13的信息处理设备,还包括:
内容识别装置,配置以识别与多个所述压缩元信息矢量中与预先确定的压缩元信息矢量具有高度相似性的压缩元信息矢量相对应的内容。
16.一种信息处理方法,包括步骤:
获取与用户已经使用的内容的数据相关的信息;
获取与所述用户已经使用的内容相对应的内容元信息;
产生与所述获取的内容元信息具有相同元素数量的第一用户偏爱性矢量;
产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;
产生压缩的元信息矢量,其中分析所述内容元信息作为矢量并且压缩所述内容元信息矢量的元素的数量;以及
识别与多个所述第二用户偏爱性矢量中与预先确定的压缩元信息矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
17.一种信息处理设备,包括:
用户信息获取单元,配置以获取与用户已经使用的内容的数据相关的信息;
元信息获取单元,配置以获取与所述用户已经使用的内容相对应的内容元信息;
第一矢量产生单元,配置以使用所述获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;
第二矢量产生单元,配置以产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;以及
用户识别单元,配置以识别与多个所述第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
18.一种使得计算机用作信息处理设备的程序,包括:
用户信息获取单元,配置以获取与用户已经使用的内容的数据相关的信息;
元信息获取单元,配置以获取与所述用户已经使用的内容相对应的内容元信息;
第一矢量产生单元,配置以使用所述获取的内容元信息的每一个作为其元素产生第一用户偏爱性矢量;
第二矢量产生单元,配置以产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;以及
用户识别单元,配置以识别与多个所述第二用户偏爱性矢量中与预先确定的第二用户偏爱性矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
19.一种信息处理设备,包括:
用户信息获取单元,配置以获取与用户已经使用的内容的数据相关的信息;
元信息获取单元,配置以获取与所述用户已经使用的内容相对应的内容元信息;
第一矢量产生单元,配置以产生与所述获取的内容元信息具有相同元素数量的第一用户偏爱性矢量;
第二矢量产生单元,配置以产生第二用户偏爱性矢量,其中分析所述产生的第一用户偏爱性矢量并且压缩所述第一用户偏爱性矢量的元素的数量;
第三矢量产生单元,配置以产生压缩的元信息矢量,其中分析所述内容元信息作为矢量并且压缩所述内容元信息矢量的元素的数量;以及
用户识别单元,配置以识别与多个所述第二用户偏爱性矢量中与预先确定的压缩元信息矢量具有高度相似性的第二用户偏爱性矢量相对应的用户。
CN 200810180789 2007-12-04 2008-12-02 信息处理设备和方法、程序以及记录介质 Pending CN101452478A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007313099 2007-12-04
JP2007313098 2007-12-04
JP2007313098 2007-12-04
JP2008122172 2008-05-08

Publications (1)

Publication Number Publication Date
CN101452478A true CN101452478A (zh) 2009-06-10

Family

ID=40734706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810180789 Pending CN101452478A (zh) 2007-12-04 2008-12-02 信息处理设备和方法、程序以及记录介质

Country Status (2)

Country Link
JP (1) JP4538760B2 (zh)
CN (1) CN101452478A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013044647A1 (zh) * 2011-09-27 2013-04-04 腾讯科技(深圳)有限公司 一种sns网络中推送关联用户的方法及系统
WO2017016063A1 (en) * 2015-07-28 2017-02-02 Huawei Technologies Co., Ltd. Anomaly detection apparatus, method, and computer program using a probabilistic latent semantic analysis

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583725B2 (en) 2010-04-05 2013-11-12 Microsoft Corporation Social context for inter-media objects
JP5280418B2 (ja) * 2010-09-28 2013-09-04 株式会社プロフィールド サーバ装置、端末装置、情報処理方法、プログラム
KR101062927B1 (ko) * 2011-01-04 2011-09-07 (주)올라웍스 적어도 한 명의 사용자의 성향을 고려하여 타사용자 또는 사물을 추천하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JPWO2014027415A1 (ja) * 2012-08-16 2016-07-25 株式会社Jx通信社 情報提供装置、情報提供方法、及びプログラム
JP6079270B2 (ja) * 2013-01-30 2017-02-15 日本電気株式会社 情報提供装置
JP5478767B1 (ja) * 2013-11-05 2014-04-23 株式会社 ディー・エヌ・エー 電子コンテンツを提供するシステム及び方法
JP6125454B2 (ja) * 2014-03-24 2017-05-10 Kddi株式会社 マッチング装置、マッチングシステム及びマッチング方法
JPWO2017094326A1 (ja) 2015-11-30 2018-09-13 ソニー株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4428036B2 (ja) * 2003-12-02 2010-03-10 ソニー株式会社 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法
JP4599141B2 (ja) * 2004-11-19 2010-12-15 ソニー株式会社 情報提供システム,情報提供サーバおよびコンピュータプログラム
JP4378646B2 (ja) * 2005-09-28 2009-12-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP4987341B2 (ja) * 2006-04-10 2012-07-25 株式会社東芝 番組推薦装置及び番組推薦方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013044647A1 (zh) * 2011-09-27 2013-04-04 腾讯科技(深圳)有限公司 一种sns网络中推送关联用户的方法及系统
US9544384B2 (en) 2011-09-27 2017-01-10 Tencent Technology (Shenzhen) Company Limited Method and system for pushing associated users in social networking service network
WO2017016063A1 (en) * 2015-07-28 2017-02-02 Huawei Technologies Co., Ltd. Anomaly detection apparatus, method, and computer program using a probabilistic latent semantic analysis
US10255554B2 (en) 2015-07-28 2019-04-09 Futurewei Technologies, Inc. Anomaly detection apparatus, method, and computer program using a probabilistic latent semantic analysis

Also Published As

Publication number Publication date
JP2009157899A (ja) 2009-07-16
JP4538760B2 (ja) 2010-09-08

Similar Documents

Publication Publication Date Title
CN101452478A (zh) 信息处理设备和方法、程序以及记录介质
EP2068276A1 (en) Information processing device and method, program, and recording medium
CN108021929B (zh) 基于大数据的移动端电商用户画像建立与分析方法及系统
CN110321482B (zh) 一种信息的推荐方法、装置及设备
US8156138B2 (en) System and method for providing targeted content
TWI631474B (zh) Method and device for product identification label and method for product navigation
CN101840410B (zh) 学习装置和方法、信息处理装置和方法以及程序
US9639846B2 (en) System and method for providing targeted content
WO2017096877A1 (zh) 一种推荐方法和装置
CN106294500B (zh) 内容项目的推送方法、装置及系统
WO2015034850A2 (en) Feature selection for recommender systems
JP2013517563A (ja) ユーザ通信の解析システムおよび方法
CN103052953A (zh) 信息处理设备、信息处理方法和程序
Bhattacharjee et al. Identifying the causal relationship between social media content of a Bollywood movie and its box-office success-a text mining approach
CN107577672B (zh) 基于舆情设定剧本的方法和装置
CN111259192A (zh) 音频推荐方法和装置
CN103207917A (zh) 标注多媒体内容的方法、生成推荐内容的方法及系统
CN109923539A (zh) 识别具有特定音频内容的视听媒体项
US20150120634A1 (en) Information processing device, information processing method, and program
CN108765052A (zh) 电商推荐/推送方法及装置、存储介质及计算设备
CN111861550A (zh) 一种基于ott设备的家庭画像构建方法及系统
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN115618024A (zh) 多媒体推荐方法、装置及电子设备
US20130108180A1 (en) Information processing device, information processing method, and program
CN113298145A (zh) 标签填充方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20090610

C20 Patent right or utility model deemed to be abandoned or is abandoned