CN103150317A - 信息处理装置、信息处理方法和程序 - Google Patents

信息处理装置、信息处理方法和程序 Download PDF

Info

Publication number
CN103150317A
CN103150317A CN2012103954741A CN201210395474A CN103150317A CN 103150317 A CN103150317 A CN 103150317A CN 2012103954741 A CN2012103954741 A CN 2012103954741A CN 201210395474 A CN201210395474 A CN 201210395474A CN 103150317 A CN103150317 A CN 103150317A
Authority
CN
China
Prior art keywords
trooping
standard
project
probability
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103954741A
Other languages
English (en)
Inventor
大谷伸弥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103150317A publication Critical patent/CN103150317A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种信息处理装置,包括:群集标准选择单元,其从用于将项目分类到多个群集的群集标准中选择群集标准,所述群集标准包括:第一数目以上的已知类型群集,其中用户已知项目属于群集的概率等于或大于第一阈值,以及第二数目以上的未知类型群集,其中所述概率等于或小于第二阈值,该第二阈值小于所述第一阈值;以及展示控制单元,其基于选择的群集标准控制对群集或项目的展示。

Description

信息处理装置、信息处理方法和程序
技术领域
本发明涉及信息处理装置、信息处理方法及程序,更具体涉及有利地用于展示各个项目的情况的信息处理装置、信息处理方法及程序。
背景技术
在现有技术中,已经提出了一种利用其它用户的了解状态预测了解状态的信息量较小的用户的了解状态(例如,参考日本待审专利申请公开No.9-212492)。
例如,可以考虑在搜索引擎、购物网站、等等中利用这样的方法来估计用户是否知道一个项目、向用户展示未知的项目、以及进行推荐等。
发明内容
然而,由于用户对于未知的项目不熟悉,如果仅仅展示未知的项目,用户难于接受该项目,例如参考与该项目相关的信息或者购买该项目。
期望的是,用户能够容易地接收未知的项目。
根据本发明第一实施例的信息处理装置包括:从用于将项目分类到多个群集中的群集标准中选择一个群集标准的群集标准选择单元,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值。展示控制单元,基于选择的群集标准控制群集或项目的展示。
展示控制单元可以进行控制以从选择的群集标准的群集中展示第一数目的已知类型的群集和第二数目的未知类型的群集。
展示控制单元可以进行控制以与每个群集中包括的项目的至少一部分一起展示第一数目的已知类型的群集和第二数目的未知类型的群集。
展示控制单元可以进行控制以进一步与项目所属的群集一起展示每个项目。
展示控制单元可以进行控制以区分并展示已知类型的群集和未知类型的群集。
群集选择单元可以选择从不同的概率分布生成的其它群集组的概率以及具有更高概率的第一数目的群集组的概率中具有最大可能性的群集标准。
群集标准选择单元可以从群集数目等于第一数目与第二数目的总和的群集标准中选择群集标准。
还可提供群集标准学习单元,学习用于通过群集标准对项目进行分类的模型。
还可以提供群集标准信息收集单元,收集与群集标准相关的信息。
还可以提供项目分类单元,其分类用户已知的项目和用户未知的项目。
还可以提供项目判别器学习单元,进行用于判别项目对于用户是已知还是对用户是未知的项目判别器的学习。
根据本发明第一实施例的信息处理方法包括:使得信息处理装置从用于将项目分类到多个群集的群集标准中选择一个群集标准,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中,用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中,所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值;以及使得所述信息处理装置基于选择的群集标准控制群集或项目的展示。
根据本发明第一实施例的程序使得计算机执行以下步骤:从用于将项目分类到多个群集的群集标准中选择一个群集标准,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中,用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中,所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值;以及基于选择的群集标准控制群集或项目的展示。
根据本发明第二实施例的信息处理装置包括:从用于将项目分类到多个群集中的群集标准中选择一个群集标准的群集标准选择单元,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,所述群集标准是从不同的概率分布生成的其它群集组的概率以及具有最高概率的第一数目的群集组的概率中具有最大可能性的群集标准;以及展示控制单元,基于选择的群集标准控制群集或项目的展示。
根据本发明第一实施例,从用于将项目分类到多个群集的群集标准中选择一个群集标准,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中,用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中,所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值;以及基于选择的群集标准控制群集或项目的展示。
根据本发明第二实施例,从用于将项目分类到多个群集中的群集标准中选择一个群集标准的群集标准选择单元,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,所述群集标准是从不同的概率分布生成的其它群集组的概率以及具有最高概率的第一数目的群集组的概率中具有最大可能性的群集标准;以及展示控制单元,基于选择的群集标准控制群集或项目的展示。
根据本发明第一实施例和第二实施例,用户更容易接受未知项目。
附图说明
图1为示出应用本发明实施例的信息处理系统的实施例的框图;
图2为示出服务器的功能的结构实例的框图;
图3为用于描述项目展示处理的流程图;
图4是示出项目空间的实例的视图;
图5为用于描述项目分类处理的流程图;
图6是用于描述项目分类处理的具体实例的视图;
图7是用于描述项目分类处理的另一具体实例的视图;
图8是用于描述项目分类处理的又一具体实例的视图;
图9为用于描述群集标准构建处理的流程图;
图10为用于描述群集标准构建处理的另一流程图;
图11是把群集标准的选择中使用的概率模型的实例表示为贝叶斯网络的视图;
图12是用于描述群集标准的选择方法的实例的视图;
图13是用于描述群集标准的选择方法的实例的另一视图;
图14是用于描述群集标准的选择方法的另一实例的视图;
图15是用于描述群集标准的选择方法的又一实例的视图;
图16是例示项目展示画面的第一实例的视图;
图17是例示项目展示画面的第二实例的视图;
图18是例示项目展示画面的第三实例的视图;以及
图19为示出计算机的结构实例的框图。
具体实施方式
下面将描述本发明实施例(下文表示为实施例)。本文将以下面的顺序进行描述。
1.实施例
2.修改例
1.实施例
信息处理系统1的配置实例
图1为示出应用本发明实施例的信息处理系统1的实施例的框图。
信息处理系统1包括服务器11和客户端12-1至12-n。服务器11与客户端12-1至12-n经网络13彼此连接。
服务器11经网络13向客户端12-1至12-n提供预定服务,并进行在服务中使用的项目的展示。
这里,服务器11提供的服务不限于具体类型,其实例包括信息搜索服务、购物网站、诸如SNS(社交网络服务)的社区网站等。
另外,服务器11展示的项目也不限于具体类型,其实例包括各种内容和产品(诸如视频、静止图像、书、文档、音轨、电视节目、软件、新闻文章、博客贴文、微薄和信息)、以及社区网站用户、社区等。
客户端12-1至12-n由能够使用服务器11提供的服务的装置构成,诸如为个人计算机、移动信息终端、移动电话、以及音频播放器。另外,用户利用客户端12-1至12-n使用服务器11提供的服务。
下文中,在单独区分客户端12-1至12-n可能不重要的情况中,将客户端12-1至12-n简称为客户端12。
服务器11的结构实例
图2为示出服务器11的功能的结构实例的框图。服务器11包括项目DB(数据库)51、项目判别器学习单元52、项目判别器存储单元53、项目分类单元54、群集标准信息收集单元55、群集标准信息DB(数据库)56、群集标准学习单元57、群集标准DB(数据库)58、群集标准选择单元59、以及展示控制单元60。
与用于服务器11提供的服务中的项目相关的信息在项目DB 51中累积。
项目判别器学习单元52学习项目判别器,该项目判别器用于判别在项目DB 51中寄存的每个项目是对于用户为已知类型的项目(下文称为已知类型项目)还是未知类型的项目(下文称为未知类型项目)。项目判别器学习单元52存储作为项目判别器存储单元53中的学习结果获得的与项目判别器相关的信息。
项目判别器存储单元53中存储与用户的数目相同的数目的对应于每个使用服务器11提供的服务的用户的项目判别器。
项目分类单元54基于从外部输入的各条信息(例如每个用户的项目使用历史等)和存储在项目判别器存储单元53中的项目判别器对于每个用户将寄存在项目DB 51中的项目分类为已知类型项目和未知类型项目。项目分类单元54在项目DB 51中累积分类结果。
群集标准信息收集单元55从连接到网络13的其它服务器(未示出)收集与用于分类项目的群集标准相关的信息(下文称为群集标准信息),并在群集标准信息DB 56中累积该信息。
例如在群集标准信息中包括按照群集标准分类的每个群集的名称等。例如,在项目为书的情况中,在与基于主题的群集标准相关的群集标准信息中包括对包括(日语、数学、科学、社会学科、英语、音乐)的群集名称的集合。
通过群集标准信息收集单元55收集或从外部输入的群集标准信息在群集标准信息DB 56中被累积。另外,输入并在群集标准信息DB56中累积用于学习模型的学习样本,所述模型根据每个群集标准分类项目。
群集标准学习单元57学习用于根据在群集标准信息DB 56中寄存的群集标准分类项目的模型。对于作为群集标准DB 58中的学习结果获得的每个群集标准,群集标准学习单元57累积表示模型的函数、参数等。
群集标准选择单元59从寄存在群集标准DB 58中的群集标准选择在向用户展示寄存在项目DB 51中的项目时用于分类项目的群集标准。群集标准选择单元59将与选择的群集标准相关的信息提供给展示控制单元60。
展示控制单元60基于通过群集标准选择单元59选择的群集标准对寄存在项目DB 51中的项目分类。另外,展示控制单元60生成包括程序、数据等的显示控制数据以显示展示项目的画面(下文称为项目展示画面)。展示控制单元60通过经网络13将生成的显示控制数据传输给客户端12而控制客户端12上的项目展示画面的显示。
项目展示处理
下面,将参考图3的流程图描述通过服务器11进行的项目展示处理。
这里,为了简化下面的描述,重点放在一个用户上,并且将描述对该用户(下文称为目标用户)展示项目的情况。实际中,对于服务器11提供的服务的每个用户进行下面的处理。
另外,下面的图4表示通过寄存在项目DB 51中的项目形成的项目空间。这里,在附图中,由白色圆表示各个项目,并且由项目之间的距离表示各个项目之间的特征量的相似性。
在步骤S1,服务器11执行项目分类处理。
项目分类处理
这里,将参考图5的流程图描述项目分类处理的详细内容。
在步骤S21,项目分类单元54获得已知项目集合。即,项目分类单元54从寄存在项目DB 51中的项目中提取对于目标用户已知的项目。
这里,用于提取对于目标用户已知的项目的方法不限于具体方法,而可以采用任意方法。例如,可基于目标用户过去对项目的浏览历史、使用历史等提取已知项目。可选地,例如,可以对目标用户展示项目列表等以选择已知项目。
项目分类单元54将指示项目对于目标用户为已知(下文称为已知项目)的信息添加到与从项目DB 51提取的项目相关的信息。
图6示出在图4的项目空间进行步骤S21的处理之后的项目空间的状态。
在步骤S22,项目判别器学习单元52进行对用于判别已知类型与未知类型的项目判别器的学习。通过这样的处理,基于例如与已知项目的特征量的相似性生成项目判别器,该项目判别器判别每个项目对于目标用户是已知类型还是未知类型。更具体是,例如,生成这样的项目判别器,该项目判别器将图7中的已知项目周围中由框包围的两个区域(下文称为已知类型区域K1和K2)中的项目指定为已知类型,并将其它指定为未知类型。
这里,项目判别器的学习方法不限于具体方法,而可以采用任意方法。
项目判别器学习单元52使得项目判别器存储单元53存储作为学习结果获得的与项目判别器相关的信息。
在步骤S23,项目分类单元54利用项目判别器对项目分类。具体是,项目分类单元54对于除已知项目以外的全部项目利用项目判别器确定项目是已知类型还是未知类型。
通过这样做,将寄存在项目DB 51中的全部项目分类为已知类型项目和未知类型项目。这里,除了被识别为对于目标用户已知的已知项目之外,已知类型项目还包括具有高概率已知的项目和与已知项目类似的项目。
项目分类单元54将指示项目对于目标用户是已知类型还是未知类型的信息增加到与项目DB 51中的每个项目相关的信息。
通过该处理,例如,如图8所示,已知类型区域K1和已知类型区域K2中的项目被分类为已知类型项目。这里,在附图中,由阴影表示不是已知类型的已知类型项目。
项目分类处理然后结束。
返回到图3,在步骤S2,服务器11执行群集标准构建处理。
群集标准构建处理
这里,将参考图9的流程图描述群集标准构建处理的详细内容。
在步骤S41,服务器11收集群集标准信息。即,服务器11收集与群集标准相关的信息,所述群集标准能够应用于对寄存在项目DB 51中的项目的分类。
这里,群集标准信息的收集方法不限于具体方法,而可以采用任意方法。例如,可将手动创建的群集标准信息输入到群集标准信息DB 56中。
可选地,例如,可以基于项目DB 51中的项目的特征量自动生成群集标准,并且可以对在自动生成的群集标准中的每个群集手动命名并将其输入到群集标准信息DB 56中。
可选地,例如,群集标准信息收集单元55可以经网络13从其它服务器等提供的各种服务(例如购物等)的网站等机械地收集与可应用的群集标准相关的信息。
这里,期望的是,每个群集名称是人们容易理解的名称。另外,期望的是,对相同群集标准中的每个群集提供显示群集之间的关系的名称。
群集标准信息收集单元55在群集标准信息DB 56中累积收集的群集标准信息。
在步骤S42中,服务器11获得用于每个群集标准的学习样本。
例如,服务管理员选择群集标准中的一个,对于该群集标准在群集标准信息DB 56中累积群集标准信息。另外,服务管理员基于选择的群集标准对项目DB 51中寄存的项目的一部分进行分类,并使得指示分类结果的信息成为用于群集标准的学习样本。通过对于每个群集标准进行上述步骤,生成用于每个群集标准的学习样本。
另外,服务管理员将用于每个群集标准的学习样本输入到群集标准信息DB 56中。
在步骤S43中,群集标准学习单元57进行对群集标准的学习。具体是,群集标准学习单元57选择群集标准中的一个,对于该群集标准在群集标准信息DB 56中累积群集标准信息。另外,群集标准学习单元57从群集标准信息DB 56获得群集标准信息和与选择的群集标准相关的学习样本。
另外,群集标准学习单元57基于在选择的群集标准的学习样本中包括的每个项目的特征量进行对用于将项目分类到群集标准的每个群集的模型的学习。
群集标准学习单元57通过对全部群集标准执行上述步骤构建用于每个群集标准的模型。另外,对于群集标准DB 58中的每个群集标准,群集标准学习单元57累积表示模型的函数、参数等。
然后群集标准构建处理结束。
返回到图3,在步骤S3,群集标准选择单元59执行群集标准选择处理。
群集标准选择处理
这里,将参考图10的流程图描述群集标准选择处理的详细内容。
这里,将描述这样的情况,其中将展示给目标用户的已知类型的群集的数目设置为L,并将未知类型的群集的数目设置为M。
另外,图11把在群集标准的选择中使用的计算技术的实例表示为贝叶斯网络。该贝叶斯网络由七个节点形成:用户U、项目B、群集标准Z、项目特征量X、已知或未知R、已知类型或未知类型S、以及群集C。这里,由自每个节点的引线表示的数字或字母表示对应于每个节点的变量的数目。例如,对应于用户U的节点的变量的数目是u,从而表示有u个用户。
通过下面的公式1将概率模型的联合概率表示为数值公式。
P(Z,C,X,B,R,U,S)=P(U)·P(B)·P(Z)·P(R|B,U)·P(X|B)·P(C|X,Z)·P(S|U,R,X)…(1)
在步骤S61,群集标准选择单元59计算每个群集标准的每个群集对于目标用户是已知类型群集的概率。
具体的说,群集标准选择单元59选择群集数目为L+M的群集标准中的一个,并从群集标准DB 58获得与用于选择的群集标准的模型相关的信息。另外,群集标准选择单元59利用用于选择的群集标准的模型进行对项目DB 51中寄存的项目的分类。
另外,群集标准选择单元59计算选择的群集标准的每个群集是已知类型群集的概率(下文称为已知类型群集概率)。利用P(S=k|c,z,u)从图11的概率模型获得已知类型群集概率。这里,k表示项目是已知类型,c表示每个群集,z表示一定群集标准,以及u表示目标用户。即,已知类型群集概率指示属于群集的项目对于目标用户已知的概率,换句话说,在属于群集的项目中的对于目标用户为已知类型的项目的比例。
群集标准选择单元59通过对于群集数目为L+M的全部群集标准进行上述处理而对于每个群集标准的每个群集计算已知类型群集概率。
在步骤S62,群集标准选择单元59基于已知类型群集概率选择类项目的分类中使用的群集标准。具体是,群集标准选择单元59选择群集标准中已经计算了已知类型群集概率的一个群集标准,即,群集数为L+M的群集标准中的一个。另外,群集标准选择单元59将具有选择的群集标准的群集分为具有最高已知类型群集概率的L个群集组(下文称为已知类型群集组)和其它M个群集组(下文称为未知类型群集组)。
例如,考虑这样的情况,其中包括群集C1至C6的群集标准的已知类型群集概率是图12所示的值。这里,图中所示的未知类型群集概率是群集为未知类型群集的概率,并且是从1减去了已知类型群集概率的值。
例如,在其中展示的已知类型群集的数目L=2的情况中,将群集分为由具有两个最高已知类型群集概率的群集C1和C2形成的群集组、以及由其它群集C3到C6形成的群集组。另外,例如,在其中L=3的情况中,将群集分为由具有三个最高已知类型群集概率的群集C1至C3形成的群集组、以及由其它群集C4到C6形成的群集组。
另外,群集标准选择单元59确定零假设(null hypothesis)“从不同的概率分布生成两个群集组(已知类型群集组和未知类型群集组)的已知类型群集概率”的p值。
p值越大,零假设正确的概率越大。即,从不同的概率分布产生的两个群集组的已知类型群集概率的可能性越大。换句话说,属于已知类型群集组的项目与属于未知类型群集组的项目的总群不同的可能性越大。即,属于已知类型群集组的项目的总群是近似由已知类型项目形成的总群、且属于未知类型群集组的项目的总群是近似由未知类型项目形成的总群的可能性越大。
群集标准选择单元59对群集数为L+M的全部群集标准进行所述处理以获得上述零假设的p值。另外,群集标准选择单元59选择具有最大p值的群集标准作为在分类项目中使用的群集标准(下面称为应用的群集标准)。
这里,将参考图13到15描述这样的实例,其中在展示的已知类型的群集的数目L=2的情况中选择应用的群集标准。这里,图13到15示出这样的实例,其中基于三个不同的群集标准分割图8所示的项目空间。
具体是,图13示出其中基于由群集C1a到C6a形成的群集标准分割项目空间的实例。在该实例中,群集C4a包括已知类型区域K1和K2,并且仅在群集C4a中包括已知类型项目。另外,尽管群集C4a包括多个已知类型项目,群集C4a还包括多个未知类型群集。从而,群集C4a和一个其它群集被选择为已知类型群集组,剩余群集被选择为未知类型群集组。
图14示出其中基于由群集C1b到C6b形成的群集标准分割项目空间的实例。在该实例中,群集C1b包括已知类型区域K1,群集C2b包括已知类型区域K2,且在两个群集之间分割已知类型项目。从而,群集C1b和群集C2b被选择为已知类型群集组,群集C3b到C6b被选择为未知类型群集组。这里,尽管群集C1b和群集C2b包括多个已知类型项目,这两个群集也都可以包括多个未知类型项目。
图15示出其中基于由群集C1c到C6c形成的群集标准分割项目空间的实例。在该实例中,已知类型项目被分到群集C1c和群集C2c的两个群集中。从而,群集C1c和群集C2c被选择为已知类型群集组,群集C3c到C6c被选择为未知类型群集组。另外,群集C1c和群集C2c都主要包括已知类型项目,且几乎不包括任何未知类型项目。
在该情况中,在图15的群集标准中,在已知类型群集组中的已知类型项目的概率分布与未知类型群集组中的已知类型项目的概率分布的差别最大,且上述p值最大。从而,选择图15的群集标准。
通过这种方式,在具有最高已知类型群集概率的L个群集中包括更多的已知类型群集,并且使得在L个群集中包括最少未知类型群集的群集标准被选择为应用的群集标准。
另外,群集标准选择单元59将应用的群集标准和指示应用的群集标准的每个群集的已知类型群集概率的信息提供到展示控制单元60。
然后群集标准选择处理结束。
返回图3,在步骤S4,展示控制单元60基于选择的群集标准(即,应用的群集标准)分类并展示项目。具体是,展示控制单元60基于应用的群集标准对寄存在项目DB 51中的项目分类。
另外,展示控制单元60从应用的群集标准的群集中选择具有最高已知类型群集概率的L个群集作为已知类型群集。另外,展示控制单元60选择应用的群集标准的剩余M个群集作为未知类型的群集。
另外,展示控制单元60基于应用的群集标准产生用于显示对项目进行分类和展示的项目展示画面的显示控制数据,并经网络13将显示控制数据传输给目标用户的客户端12。
接收显示控制数据的客户端12基于接收的显示控制数据开始或更新项目展示画面的显示。
图16到图18示出项目展示画面的实例。
图16示出将应用的群集标准的群集显示为列表的项目展示画面的实例。这里,展示的项目为音乐轨,并且示出了这样的实例,其中展示的已知类型的群集的数目L=2,并且展示的未知类型的群集的数目M=4。
在该实例中,在画面幕的预定区域101a到101f中将已知类型的群集和未知类型的群集分别显示为“未知区域”和“熟知区域”。更具体是,电影占用(tie-up)轨、多程序占用轨、商务占用轨、以及午夜动画占用轨对应于未知类型的群集(未知区域),并在区域101a到101d中显示。戏剧占用轨和80年代动画占用轨对应于已知类型的群集(熟知区域),并且在区域101e和101f中显示。另外,对区域101a到101d以及区域101e和101f过行颜色编码,从而可以容易地区分未知类型的群集和已知类型的群集。
另外,对每个区域101a到101f显示展开框102a到102f。另外,在展开框102a到102f中显示群集的名称和群集中包括的音乐轨的多个代表轨的标题。通过这样,用户能够容易地确定每个群集是哪种群集、以及其中包括哪种音乐轨。
另外,通过选择区域101a到101f中的任一个,用户能够例如显示选择的群集中包括的信息或音乐轨列表,或者播放或购买音乐轨。
通过这样,用户能够容易地辨别出存在用户仍不知道的类型的音乐轨。另外,由于与未知类型的群集一起显示基于相同群集标准的已知类型群集,用户能够基于与已知类型群集的关系容易地确定未知类型群集的内容。
从而,用户对未知类型群集消除了疑虑,对接受未知类型群集的心理障碍减小,从而使得未知类型音乐轨更容易被接受。从而,用户获得关于音乐的新的了解,并且更容易拓宽音乐兴趣的范围。
图17示出与每个项目所属的群集一起显示多个项目的项目展示画面的实例。这里,示出这样的实例,其中展示的项目为书,并且展示的已知类型的群集的数目L=2,且展示的未知类型的群集的数目M=2。
在画面的右侧将应用的群集标准的群集1至4显示为列表。另外,显示了每个群集是已知类型群集还是未知类型群集,以及每个群集的群集名称。例如,群集1是已知类型的群集,并且群集名称是“严肃地关注现代社会问题类型”。
另外,对每个群集分别提供不同的标记,从而可以一眼识别群集,并且在每个群集的描述部分的左侧显示这些标记。更具体是,对已知类型群集和未知类型群集提供不同形状的标记。这里,对已知类型群集提供心形标记,并对未知类型群集提供菱形标记。另外,通过颜色和图案区分相同形状的标记。
在画面的左侧显示书的列表。用于选择书以显示为列表的方法不具体限定,例如,将根据预定条件搜索的书和服务器11推荐的书显示为列表。另外,对于每本书显示封面照片、书名、作者、用户评价、评价数等。
另外,在每本书的封面照片的左侧显示代表每本书所属的群集的标记。标记与右侧的群集列表上的标记中的一个匹配。从而,用户能够容易地确定被显示为列表的书中的每本书对于用户是已知类型还是未知类型的书。另外,用户能够容易地确定被显示为列表的书所属的群集。
另外,用户可以例如通过从书列表中选择希望的书而显示更多具体信息或购买选择的书。
通过这样,用户能够容易地辨别存在用户仍不知道的类型的书。另外,通过与图16的项目展示画面的情况相同的原因,用户对未知类型群集消除了疑虑,对接受未知类型群集的心理障碍减小,从而使得未知类型的书容易被接受。从而,用户获得关于书的新的了解,并且更容易拓宽阅读范围。
与图17的实例类似,图18示出与每个项目所属的群集一起显示多个项目的项目展示画面的实例。这里,示出这样的实例,其中展示交流伙伴(即,其它用户)作为诸如SNS(社交网络服务)的交流空间中的项目。另外,示出这样的实例,其中已知类型群集的数目L=2,且未知类型群集的数目M=2。
与图17的项目展示画面的右侧相似,在画面的右侧将应用的群集标准的群集1至4显示为列表。例如,群集1是已知类型的群集,并且群集名称是“一旦开始就不停说话类型”。另外,对每个群集提供与图17的项目展示画面上的标记类似的标记,并且在每个群集的描述部分的左侧显示所述标记。
例如,在画面的左侧的代表交流空间的图像中显示代表可以与其交流的伙伴的用户图像。另外,在每个用户图像上显示代表每个用户所述的群集的标记。标记与右侧的群集列表上的标记中的一个匹配。从而,用户能够容易地确定交流空间中的其它用户是在过去没有互动的类型(未知类型)还是有过互动的类型(已知类型)。另外,用户能够基于其它用户属于的群集容易地确定其它用户的个性。
另外,用户能够在交流空间中选择希望的用户并与其互动。
通过这样,用户能够容易地找到适于其自身的喜好的用户并与其互动。另外,用户能够容易地了解到存在与其仍未进行任何互动的类型的用户。另外,通过与图16的项目展示画面的情况相同的原因,用户对未知类型群集消除了疑虑,对接受未知类型群集的心理障碍减小,从而使得未知类型的用户容易被接受。从而,用户与未知类型的用户互动,并且更容易拓宽互动范围。
如上所述,对每个用户分类已知类型项目和未知类型项目,并基于相同的群集标准清楚地分离已知类型群集和未知类型群集,并通过指定的比例以简单的方式展示。
通过上述方法,用户能够知晓他们自身难于找到的未知区域的存在。另外,如上所述,由于用户更容易接受未知区域,从而可以更容易地扩展用户的知识。
另外,通过从外部收集群集标准信息,可以例如利用超过由服务提供者设想的范围的群集标准分类并展示项目。
2.修改实例
下面将描述本发明实施例的修改实例。
修改实例1:应用的群集标准的选择方法的修改实例
上述选择应用的群集标准的方法是一个实例,可以采用其它方法。
尽管在上文的实例中从具有确切的L+M个群集的群集标准中选择应用的群集标准,然而可以从具有L+M个以上的群集的群集标准中选择应用的群集标准。
在该情况中,例如,可以从应用的群集标准的群集中选择具有最高已知类型群集概率的L个群集作为已知类型群集,可从剩余的群集中选择M个群集作为未知类型群集。此时,例如,可以选择具有最低已知类型群集概率的M个群集作为未知类型群集,或者可以从具有等于或小于预定阈值的已知类型群集概率的群集中随机选择M个群集作为未知类型群集。
另外,例如,可以从各群集标准(下文称为备选群集标准)中选择应用的群集标准:所述各群集标准具有等于或大于预定阈值(例如,0.7(70%))的已知类型群集概率的L个以上群集以及具有等于或小于预定阈值(例如,0.3(30%))的已知类型群集概率的M个以上群集。通过这样,可靠地选择具有高比例的已知类型项目的L个群集和具有高比例的未知类型项目的M个群集。
在该情况中,例如,可以从备选群集标准中选择群集的最高已知类型群集概率为第L高已知类型群集概率的群集标准作为应用的群集标准。可选地,例如,可以从备选群集标准中选择群集的最低已知类型群集概率为第M低已知类型群集概率的群集标准作为应用的群集标准。另外,例如,可以通过同时考虑具有第L高已知类型群集概率的群集和具有第M低已知类型群集概率的群集的已知类型群集概率,从备选群集标准中选择应用的群集标准。
可选地,例如,可以从备选群集标准中随机选择应用的群集标准。
另外,尽管在上文中示出了选择一个应用的群集标准的实例,然而,可以选择多个应用的群集标准,所述多个应用的群集标准被组合以分类项目。
修改实例2:项目的展示方法的修改实例
上述项目展示画面是实例,可以通过其它显示方法展示项目。
另外,可以仅展示应用的群集标准的群集,而不展示项目。例如,在图16的项目展示画面中,可以仅显示群集名称,而不显示每个群集的代表轨。另外,在通过用户选择群集的情况中,可以展示属于选择的群集的项目。
修改实例3:其它修改实例
例如,在图4所示的项目空间中,项目之间的距离(即,项目的特征量的相似性)取决于用户的偏好、特性、值等。从而,通过考虑每个用户的偏好、特性、值等可以对每个用户形成不同的项目空间。
另外,尽管在上文中示出了其中项目分类单元54获得已知项目集合并分类项目的实例,例如,可通过获得未知项目集合或已知和未知项目集合二者而分类项目。
计算机的配置实例
可通过硬件或软件执行上述系列处理。在通过软件执行所述系列处理的情况中,在计算机上安装构成软件的程序。这里,计算机包括建造成专用硬件的计算机、例如能够通过安装各种程序而执行各种功能的通用个人计算机等。
图19为示出利用程序执行上述系列处理的计算机的硬件的配置实例的框图。
在计算机中,CPU(中央处理单元)301、ROM(只读存储器)302以及RAM(随机存取存储器)303通过总线304相互连接。
输入输出接口305还连接到总线304。输入单元306、输出单元307、存储单元308、通信单元309以及驱动器310被连接到输入输出接口305。
输入单元306由键盘、鼠标、麦克风等形成。输出单元307由显示器、扬声器等形成。存储单元308由硬盘、非易失性存储器等形成。通信单元309由网络接口等形成。驱动器310驱动可移动介质311,该可移动介质311为磁盘、光盘、磁光盘、半导体存储器等。
在如上所述配置的计算机中,通过CPU 301经输入输出接口305和总线304装载和执行存储在RAM 303上的存储单元308中的程序而进行上述系列处理。
例如,可以通过在作为封装介质的可移动介质311等上进行记录而提供计算机(CPU 301)执行的程序。另外,可以通过诸如局域网、互联网或数字卫星广播的有线或无线传输介质提供程序。
在计算机中,可以通过将可移动介质311安装到驱动器310上而经输入输出接口305在存储单元308上安装程序。另外,可以通过通信单元309经有线或无线传输介质接收程序,并且所述程序可以被安装在存储单元308上。或者,可以预先将程序安装到ROM 302上或存储单元308上。
这里,计算机执行的程序可以是这样的程序,其中以本发明说明书所述的顺序中的时间序列进行处理,或者可以是这样的程序,其中以希望的定时,诸如当存在调用时,并行进行处理。
另外,在本发明说明书中,系统指多个构成元件(装置、模块(部件)等)的集合,并且全部构成元件处于相同的壳体中并不重要。从而,被装入分离壳体中并通过网络连接的多个装置、与其中在一个壳体中装入多个模块的一个装置都是系统。
另外,本发明实施例不限于上述实施例,在不偏离本发明实施例的主旨的情况下可以进行各种修改。
例如,本发明实施例可以采用云计算配置,其中一个功能被分割,并由多个装置经网络一起处理。
另外,在上述流程图中描述的每个步骤可以通过一个装置执行,也可以被分割而通过多个装置执行。
另外,在一个步骤中包括多个处理的情况中,在该一个步骤中包括的多个处理可通过一个装置执行,也可以被分割而通过多个装置执行。
另外,例如,本发明的实施例可以采用以下配置。
(1)一种信息处理装置,包括:
从用于将项目分类到多个群集中的群集标准中选择一个群集标准的群集标准选择单元,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值;以及
展示控制单元,基于选择的群集标准控制群集或项目的展示。
(2)根据(1)所述的信息处理装置,
其中所述展示控制单元进行控制以从选择的群集标准的群集中展示第一数目的已知类型的群集和第二数目的未知类型的群集。
(3)根据(2)所述的信息处理装置,
其中所述展示控制单元进行控制以与每个群集中包括的项目的至少一部分一起展示第一数目的已知类型的群集和第二数目的未知类型的群集。
(4)根据(2)所述的信息处理装置,
其中所述展示控制单元进行控制以进一步与项目所属的群集一起展示每个项目。
(5)根据(2)至(4)中任一项所述的信息处理设备,
其中所述展示控制单元进行控制以区分并展示已知类型的群集和未知类型的群集。
(6)根据(1)至(5)中任一项所述的信息处理设备,
其中所述群集选择单元选择从不同的概率分布生成的其它群集组的概率以及具有更高概率的第一数目的群集组的概率中具有最大可能性的群集标准。
(7)根据(1)至(6)中任一项所述的信息处理设备,
其中所述群集标准选择单元从群集数目等于第一数目与第二数目的总和的群集标准中选择群集标准。
(8)根据(1)至(7)中任一项所述的信息处理设备,还包括群集标准学习单元,学习用于通过群集标准对项目进行分类的模型。
(9)根据(1)至(8)中任一项所述的信息处理设备,还包括群集标准信息收集单元,收集与群集标准相关的信息。
(10)根据(1)至(9)中任一项所述的信息处理设备,还包括项目分类单元,对用户已知的项目和用户未知的项目进行分类。
(11)根据(10)所述的信息处理装置,还包括:
项目判别器学习单元,进行用于判别项目对于用户是已知还是对用户是未知的项目判别器的学习。
(12)一种信息处理方法,包括使得信息处理装置从用于将项目分类到多个群集的群集标准中选择一个群集标准,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中,用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中,所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,以及
使得所述信息处理装置基于选择的群集标准控制群集或项目的展示。
(13)一种使得计算机执行以下步骤的程序:
从用于将项目分类到多个群集的群集标准中选择一个群集标准,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中,用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中,所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,以及
基于选择的群集标准控制群集或项目的展示。
(14)一种信息处理装置,包括:
从用于将项目分类到多个群集中的群集标准中选择一个群集标准的群集标准选择单元,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,所述群集标准是从不同的概率分布生成的其它群集组的概率以及具有最高概率的第一数目的群集组的概率中具有最大可能性的群集标准;以及
展示控制单元,基于选择的群集标准控制群集或项目的展示。
本公开包含与在于2011年10月26日提交于日本专利局的日本优先权专利申请JP 2011-234553中公开的主题相关的主题,该日本优先权专利申请的全部内容在此引入作为参考。

Claims (14)

1.一种信息处理装置,包括:
从用于将项目分类到多个群集中的群集标准中选择一个群集标准的群集标准选择单元,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值;以及
展示控制单元,基于选择的群集标准控制群集或项目的展示。
2.根据权利要求1所述的信息处理装置,
其中所述展示控制单元进行控制以从选择的群集标准的群集中展示第一数目的已知类型的群集和第二数目的未知类型的群集。
3.根据权利要求2所述的信息处理装置,
其中所述展示控制单元进行控制以与每个群集中包括的项目的至少一部分一起展示第一数目的已知类型的群集和第二数目的未知类型的群集。
4.根据权利要求2所述的信息处理装置,
其中所述展示控制单元进行控制以进一步与项目所属的群集一起展示每个项目。
5.根据权利要求2所述的信息处理装置,
其中所述展示控制单元进行控制以区分并展示已知类型的群集和未知类型的群集。
6.根据权利要求1所述的信息处理装置,
其中所述群集选择单元选择从不同的概率分布生成的其它群集组的概率以及具有更高概率的第一数目的群集组的概率中具有最大可能性的群集标准。
7.根据权利要求1所述的信息处理装置,
其中所述群集标准选择单元从群集数目等于第一数目与第二数目的总和的群集标准中选择群集标准。
8.根据权利要求1所述的信息处理装置,还包括:
群集标准学习单元,学习用于通过群集标准对项目进行分类的模型。
9.根据权利要求1所述的信息处理装置,还包括:
群集标准信息收集单元,收集与群集标准相关的信息。
10.根据权利要求1所述的信息处理装置,还包括:
项目分类单元,对用户已知的项目和用户未知的项目进行分类。
11.根据权利要求10所述的信息处理装置,还包括:
项目判别器学习单元,进行用于判别项目对于用户是已知还是对用户是未知的项目判别器的学习。
12.一种信息处理方法,包括:
使得信息处理装置从用于将项目分类到多个群集的群集标准中选择一个群集标准,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中,用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中,所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,以及
使得所述信息处理装置基于选择的群集标准控制群集或项目的展示。
13.一种使得计算机执行以下步骤的程序:
从用于将项目分类到多个群集的群集标准中选择一个群集标准,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中,用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中,所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,以及
基于选择的群集标准控制群集或项目的展示。
14.一种信息处理装置,包括:
从用于将项目分类到多个群集中的群集标准中选择一个群集标准的群集标准选择单元,所述一个群集标准包括:第一数目以上的已知类型的群集以及第二数目以上的未知类型的群集,在所述已知类型的群集中用户已知项目属于群集的概率等于或大于第一阈值,在所述未知类型的群集中所述概率等于或小于第二阈值,所述第二阈值小于所述第一阈值,所述群集标准是从不同的概率分布生成的其它群集组的概率以及具有最高概率的第一数目的群集组的概率中具有最大可能性的群集标准;以及
展示控制单元,基于选择的群集标准控制群集或项目的展示。
CN2012103954741A 2011-10-26 2012-10-18 信息处理装置、信息处理方法和程序 Pending CN103150317A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-234553 2011-10-26
JP2011234553A JP2013092911A (ja) 2011-10-26 2011-10-26 情報処理装置、情報処理方法、および、プログラム

Publications (1)

Publication Number Publication Date
CN103150317A true CN103150317A (zh) 2013-06-12

Family

ID=48172525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103954741A Pending CN103150317A (zh) 2011-10-26 2012-10-18 信息处理装置、信息处理方法和程序

Country Status (3)

Country Link
US (1) US9020863B2 (zh)
JP (1) JP2013092911A (zh)
CN (1) CN103150317A (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751198B (zh) * 2013-12-27 2018-04-27 华为技术有限公司 图像中的目标物的识别方法及装置
JP6405704B2 (ja) * 2014-05-26 2018-10-17 ソニー株式会社 情報処理装置、情報処理方法、及び、プログラム
CN106934679B (zh) * 2015-12-29 2021-11-30 优信拍(北京)信息科技有限公司 信息匹配方法及装置
JP7322985B2 (ja) * 2020-03-19 2023-08-08 カシオ計算機株式会社 運動支援装置、運動支援方法及びプログラム
JP7354063B2 (ja) * 2020-05-14 2023-10-02 株式会社東芝 分類システム、プログラム及び学習システム
CN113392903A (zh) * 2021-06-15 2021-09-14 上海华兴数字科技有限公司 一种工地区域的识别方法、系统及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1586075A (zh) * 2001-11-13 2005-02-23 皇家飞利浦电子股份有限公司 在项目推荐器中把多个项划分成相似项的组的方法及装置
CN1771498A (zh) * 2003-04-07 2006-05-10 皇家飞利浦电子股份有限公司 将内容项进行分组的方法和设备
CN101178721A (zh) * 2007-10-12 2008-05-14 北京拓尔思信息技术有限公司 一种对论坛中有用帖子信息进行分类并整理的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3580004B2 (ja) 1996-01-31 2004-10-20 富士ゼロックス株式会社 文書処理装置および文書処理方法
US7813835B2 (en) * 2002-03-15 2010-10-12 Sony Corporation Robot behavior control system, behavior control method, and robot device
AU2003302558A1 (en) * 2002-12-02 2004-06-23 Sony Corporation Dialogue control device and method, and robot device
US7426497B2 (en) * 2004-08-31 2008-09-16 Microsoft Corporation Method and apparatus for analysis and decomposition of classifier data anomalies
JP4162015B2 (ja) * 2006-05-18 2008-10-08 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP2009059257A (ja) * 2007-09-03 2009-03-19 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP5531443B2 (ja) * 2009-04-08 2014-06-25 ソニー株式会社 情報処理装置および方法、並びにプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1586075A (zh) * 2001-11-13 2005-02-23 皇家飞利浦电子股份有限公司 在项目推荐器中把多个项划分成相似项的组的方法及装置
CN1771498A (zh) * 2003-04-07 2006-05-10 皇家飞利浦电子股份有限公司 将内容项进行分组的方法和设备
CN101178721A (zh) * 2007-10-12 2008-05-14 北京拓尔思信息技术有限公司 一种对论坛中有用帖子信息进行分类并整理的方法

Also Published As

Publication number Publication date
JP2013092911A (ja) 2013-05-16
US20130108180A1 (en) 2013-05-02
US9020863B2 (en) 2015-04-28

Similar Documents

Publication Publication Date Title
US20230281663A1 (en) System and method of providing a platform for managing data content campaign on social networks
US8577962B2 (en) Server apparatus, client apparatus, content recommendation method, and program
Tinati et al. Identifying communicator roles in twitter
CN103150317A (zh) 信息处理装置、信息处理方法和程序
US9996537B2 (en) Systems and methods for automatic narrative creation
US20130297608A1 (en) Content presentation device, content presentation terminal, content presentation system, content presentation program, and content presentation method
JP2017010517A (ja) 人工知能によるヒューマン・マシン間の知能チャットの方法および装置
CN104469430A (zh) 基于上下文和群组组合的视频推荐方法及系统
CN103198086A (zh) 信息处理设备,信息处理方法和程序
WO2009070841A1 (en) Social multimedia management
CN111861550B (zh) 一种基于ott设备的家庭画像构建方法及系统
CN109871464A (zh) 一种基于ucl语义标引的视频推荐方法与装置
CN104346431B (zh) 信息处理装置、信息处理方法和程序
CN105744370A (zh) 基于群体收视行为的广播电视系统及其个性节目推荐方法
CN103577593A (zh) 一种基于微博热门话题的视频聚合方法及系统
CN114817663A (zh) 一种基于类别感知图神经网络的服务建模与推荐方法
Markou et al. Real-Time Taxi Demand Prediction using data from the web
CN101908057A (zh) 信息处理装置与信息处理方法
CN104657457A (zh) 一种用户评价视频的数据处理方法、视频推荐方法及装置
CN111209470B (zh) 个性化内容推荐方法、装置及存储介质
US9544384B2 (en) Method and system for pushing associated users in social networking service network
Schulz Political communication in long-term perspective
CN106658091B (zh) 一种实现收视信息处理的方法及装置
CN103503469B (zh) 分阶段元素的分类系统
Markou et al. Is travel demand actually deep? An application in event areas using semantic information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130612