CN108780456A

CN108780456A - 信息处理装置、信息处理方法和程序

Info

Publication number: CN108780456A
Application number: CN201780007452.4A
Authority: CN
Inventors: 桐原丽子
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2016-03-29
Filing date: 2017-01-20
Publication date: 2018-11-09
Also published as: WO2017168985A1; US20190035420A1; JP2017182275A

Abstract

[目标]提供一种信息处理装置、一种信息处理方法和一种程序。[解决方案]所述信息处理装置包括：评分单元，其被配置成基于用户针对包括多个内容片段的内容列表中包括的一个内容片段做出的模糊语音评价来执行评分；和内容选择单元，其被配置成基于所述评分的结果从所述内容列表中选择内容片段。

Description

信息处理装置、信息处理方法和程序

技术领域

本公开涉及一种信息处理装置、一种信息处理方法和一种程序。

背景技术

近年来，基于语音识别技术的语音输出被用作从用户到信息处理装置的输入方法之一。例如，专利文献1描述了关于能够基于语音识别技术接收语音输入的信息处理装置的向用户输出反馈信息的技术。反馈信息指示信息处理装置执行的语音识别结果。

另外，还对个性化技术进行了研究。个性化技术针对由多个用户使用的装置、服务等执行更适合于每个用户的处理。例如，存在基于用户执行的操作、选择、观看等的历史来提供更适合于用户的内容的技术。

引用列表

专利文献

专利文献1：JP 2011-209786A

发明内容

技术难题

然而，在上述个性化技术中，在操作、选择、观看等历史较少的情况下，可能变得不可能提供适合于用户的内容。对于用户来说，多次执行操作、选择、观看等的负担很重。

因此，本公开提出了一种新颖和改进的信息处理装置、信息处理方法和程序，其能够减轻用户的负担并提供适合于用户的内容。

问题的解决方案

根据本公开，提出一种信息处理装置，其包括：评分单元，其被配置成基于用户对包括多个内容片段的内容列表中包括的一个内容片段做出的模糊语音评价来执行评分；和内容选择单元，其被配置成基于评分结果从内容列表中选择内容片段。

另外，根据本公开，提供一种信息处理方法，其包括：由处理器基于用户对包括多个内容片段的内容列表中包括的一个内容片段做出的模糊语音评价来执行评分；和基于评分结果从内容列表中选择内容片段。

另外，根据本公开，提供一种使得计算机实现以下的程序：基于用户对包括多个内容片段的内容列表中包括的一个内容片段做出的模糊语音评价来执行评分的功能；和基于评分结果从内容列表中选择内容片段的功能。

本发明的有益效果如下：

如上所述，根据本公开，可以减轻用户的负担并提供适合用户的内容。

请注意，上文说明的效果不一定是限制性的。与上述效果同时，或者取代上述效果，可以实现本说明书描述的任何一个效果，或者可以从本说明书掌握的其它效果。

附图说明

图1是示出根据本公开的一个实施例的信息处理装置的概况的说明图。

图2是示出根据该实施例的信息处理装置1的配置的示例的框图。

图3是示出根据该实施例的信息处理装置1的处理工作流的示例的流程图。

图4是示出根据该实施例的评分单元104执行的评分的处理工作流的示例的流程图。

图5是示出根据该实施例的与用户的对话操作的具体示例的说明图。

图6是示出根据变形例的信息处理装置1的处理工作流的示例的流程图，其中评分单元104对同一个内容片段再次执行评分。

图7是示出根据该变形例的评分处理的工作流的示例的流程图。

图8是示出根据该变形例的与用户的对话操作的具体示例的说明图。

图9是示出根据变形例的信息处理装置1的处理工作流的示例的流程图，其中输出控制单元106提示用户进行语音评价。

图10是示出硬件配置示例的说明图。

具体实施方式

下文中，将参考附图详细说明本公开的优选实施例。请注意，在本说明书及附图中，具有基本上相同的功能和结构的结构性元件用相同的元件符号表示，并且对这些结构性元件不再赘述。

请注意，用以下顺序给出说明。

<<1.概述>>

<<2.配置示例>>

<<3.操作>>

<3-1.处理工作流>

<3-2.具体示例>

<<4.变形例>>

<4-1.第一变形例>

<4-2.第二变形例>

<4-3.第三变形例>

<4-4.第四变形例>

<4-5.第五变形例>

<4-6.第六变形例>

<4-7.第七变形例>

<4-8.第八变形例>

<<5.硬件配置示例>>

<<6.结论>>

<<1.概述>>

已知有针对由多个用户使用的装置、服务等执行更适合每个用户(个性化)的处理的个性化技术。例如，可以基于用户执行的操作、选择、观看等的历史来提供或推荐更适合用户的内容(音乐、视频、信息、应用等)。

然而，在操作、选择、观看等历史较少的情况下，可能变得不可能提供适合于用户的内容。对于用户来说，多次执行操作、选择、观看等的负担很重。

另外，根据用户针对内容执行的动作(例如内容的再现、停止、跳过等)，认为用户是否满意通过个性化技术提供的内容。然而，很难进行高精度的评价。

此外，有时用户的偏好可能会根据用户的内源性/外源性状态、时间的过去等而改变。因此，有可能个性化结果与用户的偏好不匹配，并且用户感觉个性化技术不起作用。

因此，本实施例是鉴于上述情况而开发的。根据本实施例，基于用户对多个内容片段做出的语音评价来执行评分(分数分配)，并且选择一个内容片段。这使得能够减轻用户的负担并提供适合用户的内容片段。接下来，将描述具有这种效果的根据实施例的信息处理装置的概况。

图1是示出根据本公开的一个实施例的信息处理装置的概况的说明图。图1所示的信息处理装置1检测信息处理装置1周围的用户U，并将内容提供给检测到的用户U。信息处理装置1提供给用户的内容没有特别限制。例如，内容可以是音乐，例如图1所示的内容片段C10。

例如，信息处理装置1生成包括与用户U相对应的多个内容片段(适合于用户U的内容片段的候选)的内容列表，并且依次再现包括在内容列表中的内容片段(提供部分内容片段)用于试听。在图1所示的示例中，信息处理装置1再现内容片段C10用于试听，并且用户U说出与针对内容片段C10的评分相关联的语音评价W10。

此外，信息处理装置1基于用户U已经说出并连接到评分的语音评价W10来对内容片段C10进行评分，并且信息处理装置1基于评分的结果(诸如分数)从内容列表中选择内容片段。例如，可以从开头到结尾提供所选内容片段(完全再现)。

例如，这样的配置使得能够基于如图1所示的语音评价W10的模糊的语音评价来选择一段内容。因此，可以减轻用户的负担并提供适合用户的内容片段。

另外，信息处理装置1的外观没有特别限制。例如，如图1所示，信息处理装置1的外观可以是圆柱形，并且信息处理装置1可以放置在房间中的地板或桌子上。另外，信息处理装置1包括由诸如发光二极管(LED)的发光元件构成的带状发光单元18，使得带状发光单元18在水平方向上围绕信息处理装置1的侧面的中心区域。通过点亮发光单元18的一部分或全部，信息处理装置1可以向用户通知信息处理装置1的状态。例如，通过在与用户对话期间在用户方向(即说话者方向)上点亮发光单元18的一部分，信息处理装置1可以像信息处理装置1看着作为对话伙伴的用户U那样操作，如图1所示。另外，通过控制发光单元18，使得在生成响应或搜索数据期间光围绕侧面旋转，信息处理装置1可以通知用户正在进行处理。另外，例如，信息处理装置1具有在墙壁80上投影和显示图像的功能，如图1所示。信息处理装置1除了输出声音之外还可以输出显示。

例如，信息处理装置1输出评分的结果(评分结果)。在图1所示的示例中，信息处理装置1在墙壁80上投影(输出)与内容片段C10相关的评分结果D10。

这样的配置使得用户U理解评分是基于模糊的语音评价来执行的，并且使得用户U感觉个性化技术起作用。此外，由于用户U理解评分是基于模糊的语音评价来执行的，因此鼓励用户U自愿进行语音评价，以改进个性化的性能。

上面已经描述了根据本公开的信息处理装置1的概况。请注意，信息处理装置1的形状不限于图1所示的圆柱形。例如，信息处理装置1的形状可以是立方体、球体、多面体等。接下来，将描述根据本公开的实施例的信息处理装置1的配置示例的细节。

<<2.配置示例>>

图2是示出根据本实施例的信息处理装置1的配置的示例的框图。如图2所示，信息处理装置1包括控制单元10、通信单元11、声音收集单元12、扬声器13、照相机14、测距传感器15、投影仪单元16、存储单元17和发光单元18。

控制单元10控制信息处理装置1的相应结构元件。另外，如图2所示，控制单元10还用作用户识别单元101、内容列表管理单元102、语音识别单元103、评分单元104、内容选择单元105和输出控制单元106。

用户识别单元101检测并识别信息处理装置1周围的用户。例如，用户识别单元101基于由照相机14获取的图像和由测距传感器15获取的距离，通过使用已知的面部检测技术、人物检测技术等来检测用户。另外，用户识别单元101基于照相机14获取的图像，通过使用已知的面部识别技术等来识别用户。

例如，用户识别单元101可以根据存储在存储单元17中的已知用户的识别信息与从图像中检测到的用户提取的信息之间的匹配来识别用户。另外，用户识别单元101可以向内容列表管理单元102提供所识别的用户的识别信息。

内容列表管理单元102管理包括与由用户识别单元101识别的用户相对应的多个内容片段(适合于用户U的一个内容片段的候选)的内容列表。内容列表管理单元102可以基于评分单元104(稍后描述)执行的评分的结果来管理内容列表。根据这种配置，内容列表变为基于用户偏好的内容列表。

例如，内容列表管理单元102基于评分单元104(稍后描述)执行的评分的结果来生成或更新内容列表。内容列表可以被生成为使得内容列表包括过去基于用户做出的语音评价而被分配了高分(已经被评了高分)的内容片段，或者与这些内容片段相似的内容片段。这种配置使得生成的内容列表能够包括更适合每个用户的内容片段。

另外，在评分单元104已经将高于预定阈值的分数分配给特定内容片段的情况下，内容列表管理单元102可以更新内容列表，使得内容列表包括与该特定内容片段相似的内容片段。另外，在评分单元104已经将低于预定阈值的分数分配给特定内容片段的情况下，内容列表管理单元102可以更新内容列表，使得内容列表包括与该特定内容片段相似的内容片段。这种配置使得内容列表能够根据评分单元104执行的评分包括适合于每个用户的内容片段。

语音识别单元103识别由声音收集单元12(将在后面描述)收集的用户的语音(诸如用户针对内容片段做出的语音评价)，将该语音转换成字符串，并获取语音文本。请注意，语音识别单元103还可以基于语音的特征来识别正在说话的人，或者估计语音源(换言之，说话者)的方向。此外，语音识别单元103还可以确定用户是否正在说话(例如，语音评价)。

评分单元104基于由语音识别单元103获取的语音文本、基于由用户对内容片段做出的语音评价来执行对内容片段的评分(分数的分配)。评分单元104可以通过使用各种方法来执行评分。接下来，将描述评分单元104执行的评分的一些示例。

评分单元104可以检测表示由语音识别单元103获取的语音文本中的分数的分数措辞，并且可以基于分数措辞执行评分。下表1是示出基于分数措辞的评分的示例的表。

[表1]

表1：基于分数措辞的评分的示例

语音示例	分数示例
		P1：hachijutten(80分)	80分
P2：hyakuten manten(100分满分)	100分
		P3：gojutten kana(可能50分)	50分

在这种情况下，例如，基于语音评价的语音文本可以是如语音示例P1的表示“80分”的分数的分数措辞本身。另一方面，语音文本可以包括分数措辞之外的词，例如“100分”或“50分”，如语音示例P2或P3。

这种配置能够实现更准确地反映用户意图的评分。

另外，评分单元104可以基于用户针对内容片段做出的模糊语音评价来执行对一个内容片段的评分(分数的分配)。例如，模糊语音评价可以是不直接表示分数的语音(不包括如上所述的分数措辞的语音)。

例如，评分单元104可以在基于用户针对一个内容片段做出的语音评价的由语音识别单元103获取的语音文本中检测与一个分数相关联的预定措辞，并且可以基于预定措辞来执行评分。例如，分数与预定措辞之间的关联可以存储在存储单元17中(稍后描述)。下表2是示出基于分数措辞的评分的示例的表。

[表2]

表2：基于预定措词的评分的示例

语音示例	分数示例
		F1:iine(好)	80分
F2:naisu(不错)	80分
		F3:gureeto(很好)	90分
F4:paafekuto(完美)	100分
		F5:suki(喜欢)	100分
F6:kirai(不喜欢)	0分
		F7:futsuu(一般)	50分

即使在用户不想清楚地表达分数的情况下，这种配置也使得能够通过说出预定的措辞(例如表2所示的语音示例F1至F7)来评分。

此外，评分单元104还可以基于自然语音的语义分析进行语音评价。下表3是示出基于自然语音的语义分析的评分的示例的表。

[表3]

表3：基于自然语音的语义分析的评分的示例

这种配置使得能够通过使用如表3中的语音示例N1至N5之类的比表2中的语音示例F1至F7更不受约束的语音来评分。请注意，表3中的语音示例N5与表2中的语音示例F6相同。评分可以基于在语音示例F6中检测到预定措辞来执行，或者评分可以在将语音示例F6作为自然语音执行语义分析之后执行。

此外，在评分单元104通过自然语音的语义分析来执行评分的情况下，评分单元104可以例如基于用户针对一个内容片段的语音评价来对语音识别单元103获取的语音文本执行形态分析。另外，评分单元104可以基于形态分析的结果来执行评分。下面列出的表4至8是示出在上面列出的表3中示出的相应语音示例N1至N5的形态分析结果的表。

[表4]

表4：语音示例N1的形态分析结果

词	词性
		kore(这个)	名词
wa	助词
		ammari(很)	副词
suki(喜欢)	形容性名词
		ja	助词
nai(不)	形容词
		naa	助词

[表5]

表5：语音示例N2的形态分析结果

词	词性
		kore(这个)	名词
wa	助词
		warito(比较)	副词
suki(喜欢)	形容性名词
		da	助动词
na	助词

[表6]

表6：语音示例N3的形态分析结果

词	词性
		kore(这个)	名词
ga	助词
		ii(很喜欢)	形容词
na	助词

[表7]

表7：语音示例N4的形态分析结果

词	词性
		maa-maa	形容性名词
kana	助词

[表8]

表8：语音示例N5的形态分析结果

请注意，稍后将参考图4描述基于形态分析结果的评分的详细过程。

图2所示的内容选择单元105基于评分单元104执行的评分结果从内容列表中选择内容片段。例如，内容选择单元105可以从内容列表中选择分数高于预定值的内容片段。另外，在经受由评分单元104执行的评分的内容片段的评分高于预定值的情况下，内容选择单元105可以选择该内容片段。此外，内容选择单元105可以从内容列表中选择与分数高于预定值的内容片段相似的内容片段。

请注意，例如，具有诸如流派、创建者等相同信息的内容片段可以被视为相似的内容片段。将该信息与内容片段相关联。此外，例如，具有诸如价格等相似信息的内容片段可以被视为相似内容片段。将该信息与内容片段相关联。请注意，例如，与内容片段相关联的这种信息可以存储在存储单元17中(稍后描述)，或者可以经由通信单元11(稍后描述)从外部获取。

输出控制单元106控制来自扬声器13、投影仪单元16或发光单元18的输出。例如，输出控制单元106可以依次输出包括在由内容列表管理单元102生成的内容列表(诸如用于试听的再现)中的内容片段(诸如音乐)。此外，输出控制单元106可以使内容选择单元105选择的一个内容片段被输出(诸如完全再现)。另外，输出控制单元106可以控制信息处理装置1和用户之间的对话的输出。

另外，输出控制单元106也可以使评分单元104的评分结果被输出。输出控制单元106可以通过使用各种方法输出评分结果。例如，与图1所示的评分结果D10一样，输出控制单元106可以控制投影仪单元16，并使投影仪单元16显示表示作为评分结果的分数的条(分数条)。

这种配置通过显示评分结果使得用户理解他/她自己做出的语音评价与评分相关。因此，用户可以感觉到个性化技术起作用。此外，由于用户理解自己做出的语音评价与评分相关，所以期望用户更主动地说出语音评价。

通信单元11与外部装置交换数据。例如，通信单元11可以经由通信网络(未示出)与预定服务器(未示出)连接，并且可以接收内容和与内容相关(相关联)的信息。

声音收集单元12具有收集外围声音并将收集的声音作为声音信号输出到控制单元10的功能。另外，声音收集单元12例如可以由一个或多个麦克风实施。

扬声器13具有在输出控制单元106的控制下将语音信号转换成语音并输出语音的功能。

照相机14具有通过使用安装在信息处理装置1中的成像透镜来捕获外围图像并将捕获的图像输出到控制单元10的功能。另外，例如，照相机14可以是360度照相机、广角照相机等。

测距传感器15具有测量信息处理装置1、用户和用户周围的人之间的距离的功能。例如，测距传感器15可以由光学传感器(被配置成基于关于发光定时和光接收定时之间的相位差的信息来测量到目标物体的距离的传感器)实施。

投影仪单元16是显示装置的示例，并且具有在墙壁或屏幕上投影和显示(放大的)图像的功能。

存储单元17存储用于使信息处理装置1的相应结构元件起作用的程序和参数。例如，存储单元17可以存储诸如用户的识别信息的与用户相关的信息、内容、与内容相关联的信息、关于过去评分结果的信息等。

发光单元18可以由发光元件(例如LED)实施，并且可以控制发光单元18的发光方式和发光位置，使得所有的灯被打开、一部分灯被打开或者灯闪烁。例如，在控制单元10的控制下，发光单元18在由语音识别单元103识别的讲话者的方向上的一部分被打开。因此，信息处理装置1可以像信息处理装置1看着讲话者的方向那样操作。

上面已经描述了根据实施例的信息处理装置1的配置的细节。注意，图2所示的信息处理装置1的配置是一个更好的示例。本实施例不限于此。例如，信息处理装置1还可以包括红外(IR)照相机、深度照相机、立体照相机、运动检测器等，以获取关于周围环境的信息。另外，信息处理装置1还可以包括触摸屏显示器、物理按钮等作为用户接口。另外，声音收集单元12、扬声器13、照相机14、发光单元18等在信息处理装置1中的安装位置没有特别限制。另外，根据本实施例的控制单元10的功能可以在经由通信单元11连接的另一信息处理装置中。

<<3.操作>>

接下来，参考图3至图5，将描述根据本实施例的信息处理装置1的操作示例。首先，参考图3和图4，将描述根据本实施例的处理工作流。接下来，参考图5，将描述根据本实施例的对话操作的具体示例。

<3-1.处理工作流>

下文中，参考图3，将描述根据本实施例的整体处理工作流。接下来，参考图4，将描述基于评分单元104针对自然语音执行的语义分析的评分的处理工作流程。

图3是示出根据本实施例的信息处理装置1的处理工作流的示例的流程图。首先，如图3所示，用户识别单元101检测信息处理装置1周围的用户，并识别检测到的用户(S104)。接下来，内容列表管理单元102基于与所识别的用户相关的过去评分结果生成包括多个内容片段的内容列表(S108)。

接下来，在输出控制单元106的控制下，再现(部分地输出)包括在内容列表中的内容片段，用于试听(S112)。在语音识别单元103确定用户已经在预定时间段内说出了语音评价的情况下(S116中为“是”)，语音识别单元103基于语音评价执行语音识别，并获取语音文本(S120)。

接下来，评分单元104基于由语音识别单元103获取的语音文本执行评分(S124)。如参考表1至表8所述，评分单元104可以基于指示分数的分数措辞来执行评分，或者可以基于与分数相关联的预定措辞来执行评分。另外，如稍后参考图4所述，评分单元104可以基于语音文本的形态分析来执行评分。

接下来，输出控制单元106控制投影仪单元16，并且例如使投影仪单元16基于评分来显示评分结果(S128)。另外，在步骤S124中通过评分获得的分数(指定的分数)是预定值或更高的情况下(S132中为“是”)，处理前进到步骤S136。在步骤S136中，内容选择单元105选择当前再现用于试听的内容片段，并且在输出控制单元106的控制下从开头重新开始内容片段的再现。

另一方面，在步骤S116中在预定时间段内没有接收到语音评价的情况下(S116中为“否”)，或者在步骤S132中分数小于预定值的情况下(步骤S132中为“否”)，处理前进到步骤S134。在步骤S134中，再现目标转移到下一个内容片段。随后，处理返回到步骤S112，并且再现下一个内容片段用于试听。

请注意，基于通过上述步骤S104至步骤S136获得的评分结果，执行下一内容列表生成处理(S108)(下一内容列表生成处理反映评分结果)。

上面已经描述了根据本实施例的整个处理工作流。接下来，参考图4，将描述在评分单元104基于语音文本的形态分析执行评分的情况下，图3所示的评分处理(S124)的处理工作流。图4是示出由评分单元104执行的评分的处理工作流的示例的流程图。请注意，在下文中，将针对以上列出的表3至8中所示的语音示例来描述特定分数计算示例。

首先，评分单元104对语音识别单元103获取的语音文本执行形态分析(S1241)。接下来，评分单元104基于形态分析的结果确定语音文本中是否包括指示语(S1242)。在包括指示语的情况下(S1242中为“是”)，基于指示语指定并设置作为评分目标的内容片段(S1243)。另一方面，在不包括指示语的情况下(S1242中为“否”)，将当前再现用于试听的内容片段设置为目标(S1244)。

例如，表3至表8所示的语音示例中的语音示例N1至语音示例N3包括指示语“Kore(这个)”。因此，当前为试听而再现的内容片段被设置为目标。另一方面，语音示例N4和N5不包括指示语。因此，当前为试听而再现的内容片段被设置为目标。

接下来，评分单元104确定语音评价是肯定评价还是否定评价。例如，评分单元104可以基于通过语音文本的形态分析指定为形容词或形容性名词的词来确定语音评价是正面评价还是负面评价。请注意，评分单元104可以确定语音评价既不是正面评价也不是负面评价(中性评价)。

例如，语音示例N1包括形容性名词“suki(喜欢)”和形容词“nai(不)”的组合。因此，可以将语音示例N1的语音评价确定为负面评价。此外，语音示例N2包括形容性名词“suki(喜欢)”。因此，可以将语音示例N2的语音评价确定为正面评价。此外，语音示例N3包括形容词“ii(很喜欢)”。因此，可以将语音示例N3的语音评价确定为正面评价。此外，语音示例N4包括形容性名词“maa-maa(一般)”。因此，可以将语音示例N4的语音评价确定为中性评价。此外，语音示例N5包括形容性名词“kirai(不喜欢)”。因此，可以将语音示例N5的语音评价确定为负面评价。

接下来，评分单元104评价通过语音文本的形态分析被指定为副词的词(S1246)。例如，在步骤S1246中，评分单元104可以评价指定为副词的词，并指定在步骤S1247(稍后描述)中的分数计算处理中使用的系数。

例如，语音示例N1包括副词“amari(真)”。因此，可以将与语音示例N1相关的系数指定为0.6。此外，语音示例N2包括副词“warito(比较)”。因此，可以将与语音示例N2相关的系数指定为0.6。此外，语音示例N3至N5不包括副词。因此，与语音示例N3至N5相关的系数可以被确定为1.0。

请注意，步骤S1245和步骤S1246中的上述处理可以基于预登记的词与正/负评价或系数之间的关联，或者基于各种自然语言处理技术来执行。

接下来，评分单元104基于在步骤S1245中做出的确定的结果和在步骤S1246中获得的系数来计算分数(S1247)。例如，评分单元104可以通过使用以下等式(1)来计算分数。

分数＝参考分数+确定分数×系数...(1)

在等式1中，参考分数可以是例如“50分”。此外，确定分数可以是基于例如在步骤S1245中做出的确定的值。如果在步骤S1245中确定评价为正面评价，则确定分数可以是“+50分”；如果评价被确定为负面评价，则确定分数可以是“-50分”；如果评价被确定为中性评价，则确定分数可以是“0分”。

例如，表3至表8中所示的语音示例N1至N5的分数分别通过使用以下等式(2)至(6)来计算。

参考分数(50分)+确定分数(-50分)×系数(0.6)＝20分...(2)

参考分数(50分)+确定分数(50分)×系数(0.6)＝80分...(3)

参考分数(50分)+确定分数(50分)×系数(1.0)＝100分...(4)

参考分数(50分)+确定分数(0分)×系数(1.0)＝50分...(5)

参考分数(50分)+确定分数(-50分)×系数(1.0)＝0分...(6)

<3-2.具体示例>

上面已经描述了根据本实施例的处理工作流。接下来，参考图5，将描述根据本实施例的与用户的对话操作的具体示例。图5是示出根据本实施例的与用户的对话操作的具体示例的说明图。

首先，信息处理装置1输出语音W21，用于通知用户U生成包括针对用户U的内容片段(音乐)的内容列表。接下来，当用户U说出指示用户U想要再现内容列表以进行试听的响应W22时，信息处理装置1再现内容列表中的内容片段C21。当用户U说出内容片段C21的语音评价W23时，信息处理装置1基于语音评价W23显示评分结果D21。请注意，评分结果D21指示内容片段C21的分数为20分。

这里，在图3中的步骤S132中内容片段C21的分数小于预定值。因此，信息处理装置1再现内容列表中的下一个内容片段C22用于试听。当用户U说出内容片段C22的语音评价W24时，信息处理装置1基于语音评价W24显示评分结果D22。请注意，评分结果D22指示内容片段C22的分数为80分。

这里，在图3中的步骤S132中内容片段C22的分数小于预定值。因此，信息处理装置1再现内容列表中的下一个内容片段C23用于试听。当用户U说出内容片段C23的语音评价W25时，信息处理装置1基于语音评价W25显示评分结果D23。请注意，评分结果D23指示内容片段C23的分数为100分。

这里，在图3中的步骤S132中内容片段C23的分数大于或等于预定值。因此，信息处理装置1选择内容片段C23，并输出指示整个内容片段C23将从开头被再现(输出)的语音W26。

上面已经描述了根据本实施例的与用户的对话操作的具体示例。然而，根据本实施例的与用户的对话操作不限于此。不用说，根据用户、内容片段等执行各种类型的对话操作。

<<4.变形例>>

上面已经描述了本公开的实施例。接下来，将描述根据本公开的实施例的一些变形例。请注意，下面将要描述的变形例可以单独应用于根据本公开的实施例，或者可以组合应用于根据本公开的变形例。此外，可以应用变形例来代替根据本公开的实施例中描述的配置，或者可以除了根据本公开的实施例中描述的配置之外还应用变形例。

<4-1.第一变形例>

上面已经描述了在图3中的步骤S132中分数是预定值或更高的情况下选择当前再现用于试听的内容片段的示例。然而，本发明的技术不限于此。

例如，内容选择单元105可以在对包括在内容列表中的所有内容片段执行评分之后选择内容片段。在这种情况下，内容选择单元105可以选择分配了预定值或更高的分数的内容片段，或者可以按照分数的降序选择预定数量的内容片段。

例如，在用户简单地检查多个内容片段之后，这种配置能够实现被分配了高分的内容片段的更精确的检查、内容片段之间的比较等。

<4-2.第二变形例>

另外，上面已经描述了对每个内容片段仅执行一次评分的示例。然而，本发明的技术不限于此。例如，在用户再次对已经经过评分的内容片段说出语音评价的情况下，评分单元104可以再次执行对内容片段的评分。以下，将参考图6至图8，说明评分单元104对同一内容片段再次执行评分的变形例。

图6是示出评分单元104对同一内容片段再次执行评分的情况下的信息处理装置1的处理工作流的示例的流程图。图6所示的步骤S204至S228中的处理与参考图3描述的步骤S104至S128中的处理相似。因此，将省略重复描述。

接下来，在语音识别单元103确定用户已经在预定时间段内说出了语音评价的情况下(S230中为“否”)，处理返回到步骤S224，并且评分单元104基于语音评价再次执行评分。

另一方面，在语音识别单元103没有确定用户已经在预定时间段内说出了语音评价的情况下，处理返回到步骤S232。请注意，步骤S232至S236中的处理与参考图3描述的步骤S132至S136中的处理相似。因此，将省略重复描述。

图7是示出评分单元104对同一内容片段再次执行评分的情况下执行的评分处理工作流的示例的流程图。图7所示的步骤S2241至S2246中的处理与参考图7描述的步骤S1241至S1246中的处理相似。因此，将省略重复描述。

在紧接着步骤S2247之前已经针对在步骤S2243和S2244中设置的目标内容片段进行了语音评价的情况下(S2247中为“是”)，将参考分数设置为通过基于最后语音评价的评分处理获得的分数(S2248)。另一方面，在紧接着步骤S2247之前没有针对在步骤S2243和S2244中设置的目标内容片段进行语音评价的情况下(S2247中为“否”)，将参考分数设置为50分，50分是平均分数。

接下来，评分单元104计算分数(S2250)。例如，评分单元104可以通过使用上述等式(1)和在步骤S2248和S2249中设置的参考分数来计算分数。

下面列出的表9是示出在对同一目标再次执行评分的情况下执行的评分的示例的表。

[表9]

表9：同一目标的评分的示例

此外，下表10是示出表9中的语音示例N6和N7的形态分析结果的表。

[表10]

表10：语音实例N6和N7的形态分析结果

词	词性
		iya(不)	感叹词
warito(比较)	副词
		suki(喜欢)	形容性名词
da	助动词
		yo	助词

表9和表10中的语音示例N6和N7包括形容性名词“suki(喜欢)”。因此，在步骤S2245中，可以将语音示例N6和N7的语音评价确定为正面评价。此外，语音示例N6和N7包括副词“warito(比较)”。因此，在步骤S2246中，可以将与语音示例N6和7相关的系数指定为0.6。

另外，在步骤S2248中，可以将与语音示例N6相关的参考分数设置为50分，这是与最后的语音示例N4相关的分数。另外，在步骤S2248中，可以将与语音示例N7相关的参考分数设置为0分，这是与最后的语音示例N5相关的分数。

因此，在步骤S2250中，通过分别使用以下等式(7)和(8)来计算语音示例N6和N7的分数。

参考分数(50分)+确定分数(+50分)×系数(0.6)＝80分...(7)

参考分数(0分)+确定分数(50分)×系数(0.6)＝30分...(8)

上面已经描述了根据变形例的处理工作流。接下来，参考图8，将描述根据变形例与用户的对话操作的具体示例。图8是示出根据变形例的与用户的对话操作的具体示例的说明图。

首先，信息处理装置1输出语音W31，用于通知用户U生成包括针对用户U的内容片段(音乐)的内容列表。接下来，当用户U说出指示用户U想要再现内容列表以进行试听的响应W32时，信息处理装置1再现内容列表中的内容片段C31以用于试听。当用户U说出内容片段C31的语音评价W33时，信息处理装置1基于语音评价W33显示评分结果D31。请注意，评分结果D31指示内容片段C31的分数为50分。

这里，当已经看到评分结果D31的用户U在图6中的步骤S230中所示的预定时间段内说出另一个语音评价W34时，信息处理装置1再次执行评分，并基于语音评价W34显示评分结果D32。

如上所述，根据本修改，用户可以检查评分结果并校正分数。

请注意，在如上所述说出用于校正分数的语音的情况下，在随后的处理中，可以针对每个用户改变图7中的步骤S2240中指定的系数和步骤S2250中的分数计算方法。例如，对于某个用户做出的语音评价中的“warito(比较)”和另一个用户做出的语音评价中的“warito(比较)”可以指定不同的系数。

<4-3.第三变形例>

另外，上面已经描述了评分单元104通过使用等式(1)计算分数的示例。然而，本发明的技术不限于此。

例如，评分单元104可以基于从内容片段的输出(例如为了试听而再现)到用户做出的语音评价的响应时间来执行评分。例如，评分单元104可以通过将响应时间与预定时间段比较来确定响应时间是长还是短。下表11是示出基于响应时间的评分的示例的表。

[表11]

表11：基于响应时间的评分的示例

例如，评分单元104确定语音评价中是否包括犹豫词，并基于确定的结果执行评分。下面列出的表12是示出基于犹豫词的确定的评分的示例的表。

[表12]

表12：基于犹豫词的评分的示例

<4-4.第四变形例>

另外，上面已经描述了评分单元104基于语音评价执行内容片段的评分的示例。然而，本发明的技术不限于此。

例如，评分单元104可以基于对特定内容片段的语音评价，执行特定内容片段和与该特定内容片段相似的另一内容片段的评分。例如，基于对特定内容片段的语音评价，相同的分数可以被分配给特定内容片段和与特定内容片段相似的另一内容片段。

即使在用户仅进行少量语音评价的情况下，这种配置也能够以更高的精度实现个性化。

<4-5.第五变形例>

另外，上面已经描述了用户自愿进行语音评价的操作示例。然而，本发明的技术不限于此。例如，输出控制单元106可以引起提示用户进行语音评价的信息的输出。

图9是示出在输出控制单元106提示用户进行语音评价的情况下的整体处理工作流的示例的流程图。图9所示的步骤S404至S412中的处理与参考图3描述的步骤S104至S112中的处理相似。因此，将省略重复描述。

在步骤S416中在预定时间段内没有识别出用户做出的语音评价的情况下(S416中为“否”)，输出控制单元106输出提示用户进行语音评价的信息。例如，输出控制单元106可以控制扬声器13并使扬声器13输出提示用户进行语音评价的语音。

步骤S420至S436中的后续处理与参考图3描述的步骤S120至S136中的处理相似。因此，将省略重复描述。

这种配置使得即使在用户未认识到评分是基于语音评价执行的情况下，也能够提示用户进行语音评价。因此，例如可以提供更适合用户的内容片段。

<4-6.第六变形例>

另外，例如，上面已经描述了类似于图1所示的评分结果D10将评分结果显示为分数条的示例。然而，本发明的技术不限于此。输出控制单元106可以通过使用各种方法来引起评分结果的输出。

例如，输出控制单元106可以控制投影仪单元16并使投影仪单元16以文本形式显示分数。此外，输出控制单元106可以控制扬声器13并使扬声器13通过语音输出分数。

另外，输出控制单元106可以输出(例如显示)排名结果(排名顺序)作为评分的结果。排名结果是基于多个内容片段的评分对内容列表中包括的多个内容片段的排名。请注意，在这种情况下，评分单元104可以基于指示内容片段之间的比较或指示其排名的语音评价来执行评分。

<4-7.第七变形例>

另外，上面已经描述了只有一个用户的示例。然而，本发明的技术不限于此。不用说，本技术也可以应用于存在多个用户的情况。

例如，评分单元104可以基于由多个用户做出的语音评价来执行评分，并且输出控制单元106可以输出针对每个用户的评分结果(例如，多个内容片段的排名结果)。这种配置使得用户更容易感觉到个性化根据当前技术起作用。

<4-8.第八变形例>

另外，上面已经描述了内容列表管理单元102基于评分结果管理(生成或更新)内容列表的示例。然而，本发明的技术不限于此。

另外，内容列表管理单元102可以基于用户执行的操作、选择、查看等的历史来进一步管理内容列表。即使在用户过去没有进行语音评价的情况下，这种配置也使得能够生成内容列表。

例如，内容列表管理单元102可以进一步基于用户的内源性状态(诸如身体状况或忙碌程度)或外源性状态(诸如季节、天气或去某个艺术家的音乐会)来管理内容列表。请注意，以类似的方式，评分单元104可以进一步基于关于用户的内源性状态的信息或外部因素执行评分。

这种配置使得不仅能够基于用户做出的语音评价，而且能够基于用户的内源性或外源性状态来提供内容片段。因此，例如，即使在用户的偏好改变的情况下，也可以提供适合于用户的内容片段。

<<5.硬件配置示例>>

上面已经描述了本公开的实施例。上述信息处理，例如用户识别处理、内容列表管理处理、语音识别处理、评分处理、内容选择处理、输出控制处理等，通过协同操作软件和信息处理装置1来实现。接下来，将信息处理装置1000的硬件配置示例描述为作为根据本实施例的信息处理装置的信息处理装置1的硬件配置示例。

图10是示出信息处理装置1000的硬件配置的示例的说明图。如图10所示，信息处理装置1000包括中央处理单元(CPU)1001、只读存储器(ROM)1002、随机存取存储器(RAM)1003、输入装置1004、输出装置1005、存储装置1006、成像装置1007和通信装置1008。

CPU 1001用作算术处理装置和控制装置，以根据各种程序控制信息处理装置1000中的所有操作处理。另外，CPU 1001可以是微处理器。ROM 1002存储由CPU 1001使用的程序、操作参数等。RAM 1003暂时存储在执行CPU 1001时使用的程序、在执行这些程序时适当改变的各种参数等。它们经由包括CPU总线等的主机总线彼此连接。主要地，控制单元10的功能通过协同操作软件、CPU 1001、ROM 1002和RAM 1003来实现。

输入装置1004包括：用户用于输入信息的输入机构，例如鼠标、键盘、触摸屏、按钮、麦克风、开关或控制杆；输入控制电路，其被配置成基于用户输入生成输入信号，并将该信号输出到CPU 1001；等等。通过操作输入装置1004，信息处理装置1000的用户可以将各种数据输入到信息处理装置1000中，并指示信息处理装置100执行处理操作。

输出装置1005包括显示装置，例如诸如液晶显示器(LCD)装置、OLED装置、透视显示器或灯。此外，输出装置1005包括音频输出装置，诸如扬声器或耳机。例如，显示装置显示捕获的图像、生成的图像等。另一方面，音频输出装置将音频数据等转换成音频并输出音频。输出装置1005对应于例如参考图2描述的扬声器13、投影仪单元16和发光单元18。

存储装置1006是用于存储数据的装置。存储装置1006可以包括存储介质、将数据记录在存储介质中的记录装置、从存储介质读取数据的读取器装置、删除记录在存储介质中的数据的删除装置等。存储装置1006存储由CPU 1001执行的程序和各种数据。存储装置1006对应于参考图2描述的存储单元17。

成像装置1007包括成像光学系统，诸如配置成收集光的成像透镜或变焦透镜，以及信号转换元件，诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)。图像光学系统收集从被摄体发射的光，并在信号转换单元上形成被摄体图像，并且信号转换元件将形成的被摄体图像转换成电图像信号。成像装置1007对应于参考图2描述的照相机14。

通信装置1008是包括例如用于连接到通信网络的通信装置等的通信接口。此外，通信装置1008可以包括支持无线局域网(LAN)的通信装置、支持长期演进(LTE)的通信装置、执行有线通信的有线通信装置或支持蓝牙(注册商标)的通信装置。通信装置1008对应于例如参考图2描述的通信单元11。

<<6.结论>>

如上所述，根据本公开的实施例，基于用户针对内容片段做出的语音评价来执行评分，并且选择内容片段。这使得能够减轻用户的负担并提供适合用户的内容片段。另外，基于用户做出的语音评价的评分结果的输出提示用户进行语音评价，并且用户可能感觉到个性化已经被执行。

此外，例如，也可以输出引用过去语音评价内容的语音，比如“你以前说过你喜欢这个，所以我在提供内容时选择了与它相似的艺术家的乐曲”。因此，期望用户满意度有更多的改进。

上文参考附图说明了本公开的优选实施例，而本公开不限于上面的示例。本领域的技术人员在随附权利要求书的范围内可以想到各种更改和变形例，并且应当理解的是，这些更改和变形例当然属于本公开的技术范围。

例如，在上述实施例中，音乐被用作内容的示例。然而，本发明的技术不限于此。例如，内容可以是要提供给用户的各种信息，诸如视频、图像、新闻、电视节目、电影、餐馆、菜单、旅行目的地信息或网页。

此外，可以不必按照流程图中描述的顺序按时间顺序执行根据上述实施例的相应步骤。例如，根据上述实施例的处理中的相应步骤可以用不同于流程图中描述的顺序的顺序处理，并且也可以并行处理。

另外，根据上述实施例，还可以提供用于使诸如CPU 1001、ROM 1002和RAM 1003之类的硬件执行与上述信息处理装置1的结构元件等效的功能的计算机程序。此外，可以提供其中存储有计算机程序的记录介质。

而且，本说明书中说明的效果只是说明性的或者例示性的效果，并且没有限制性。也就是说，除了上述效果之外，或者代替上述效果，根据本公开的技术还可以实现本领域的技术人员通过本说明书的说明所了解的其它效果。

另外，也可以如下配置本技术。

(1)

一种信息处理装置，其包括：

评分单元，其被配置成基于用户针对包括多个内容片段的内容列表中包括的一个内容片段做出的模糊语音评价来执行评分；和

内容选择单元，其被配置成基于所述评分的结果从所述内容列表中选择内容片段。

(2)

根据(1)所述的信息处理装置，其进一步包括：

内容列表管理单元，其被配置成基于由所述评分单元执行的所述评分的所述结果来管理所述内容列表。

(3)

根据(2)所述的信息处理装置，

其中所述内容列表管理单元基于所述评分的所述结果生成所述内容列表。

(4)

根据(2)或(3)所述的信息处理装置，

其中，每次所述评分单元执行所述评分时，所述内容列表管理单元基于所述评分的结果更新所述内容列表。

(5)

根据(1)到(4)中任一项所述的信息处理装置，

其中所述评分单元在基于所述语音评价的语音文本中检测与分数相关联的预定措辞，并基于所述预定措辞执行所述评分。

(6)

根据(1)到(5)中任一项所述的信息处理装置，

其中所述评分单元在基于所述语音评价的语音文本的形态分析的结果的基础上执行评分。

(7)

根据(1)到(6)中任一项所述的信息处理装置，

其中所述评分单元确定所述语音评价是正面评价还是负面评价，并且基于所述确定的结果执行所述评分。

(8)

根据(1)到(7)中任一项所述的信息处理装置，

其中所述评分单元基于从所述内容片段的输出到所述语音评价的响应时间来执行所述评分。

(9)

根据(1)到(8)中任一项所述的信息处理装置，

其中所述评分单元确定所述语音评价中是否包括犹豫词，并基于所述确定的结果执行所述评分。

(10)

根据(1)到(9)中任一项所述的信息处理装置，还包括：

输出控制单元，其被配置成使得输出所述评分的结果。

(11)

根据(10)所述的信息处理装置，

其中所述评分单元基于所述用户针对已经经过所述评分的内容片段做出的所述语音评价再次执行评分。

(12)

根据(10)或(11)所述的信息处理装置，其中

所述评分单元基于由多个用户做出的所述语音评价来执行评分，并且

所述输出控制单元使得针对每个所述用户输出所述评分的结果。

(13)

根据(10)到(12)中任一项所述的信息处理装置，

其中所述输出控制单元使信息被输出，所述信息提示所述用户进行所述语音评价。

(14)

一种信息处理方法，其包括:

由处理器基于用户针对包括多个内容片段的内容列表中包括的一个内容片段做出的模糊语音评价来执行评分；和

基于所述评分的结果从所述内容列表中选择内容片段。

(15)

一种程序，其使计算机实现以下功能：

基于用户针对包括多个内容片段的内容列表中包括的一个内容片段做出的模糊语音评价来执行评分的功能；和

基于所述评分的结果从所述内容列表中选择内容片段的功能。

附图标记列表

1 信息处理装置

10 控制单元

11 通信单元

12 声音收集单元

13 扬声器

14 照相机

15 测距传感器

16 投影仪单元

17 存储单元

18 发光单元

101 用户识别单元

102 内容列表管理单元

103 语音识别单元

104 评分单元

105 内容选择单元

106 输出控制单元。

权利要求书(按照条约第19条的修改)

1.一种信息处理装置，其包括：

内容选择单元，其被配置成基于所述评分的结果从所述内容列表中选择内容片段，

其中所述评分单元基于与所述内容片段相对应的所述语音评价来执行与所述内容片段相似的内容片段的评分。

2.根据权利要求1所述的信息处理装置，其进一步包括：

3.根据权利要求2所述的信息处理装置，

4.根据权利要求2所述的信息处理装置，

5.根据权利要求1所述的信息处理装置，

6.根据权利要求1所述的信息处理装置，

其中所述评分单元在基于所述语音评价的语音文本的形态分析的结果的基础上执行所述评分。

7.根据权利要求1所述的信息处理装置，

8.根据权利要求1所述的信息处理装置，

9.根据权利要求1所述的信息处理装置，

10.根据权利要求1所述的信息处理装置，其进一步包括：

输出控制单元，其被配置成使得输出所述评分的结果。

11.根据权利要求10所述的信息处理装置，

其中所述评分单元基于所述用户针对已经经过所述评分的所述内容片段做出的所述语音评价再次执行评分。

12.根据权利要求10所述的信息处理装置，其中

13.根据权利要求10所述的信息处理装置，

14.一种信息处理方法，其包括：

基于所述评分的结果从所述内容列表中选择内容片段，

其中所述处理单元基于与所述内容片段相对应的所述语音评价来执行与所述内容片段相似的内容片段的评分。

15.一种程序，其使计算机实现以下功能：

基于所述评分的结果从所述内容列表中选择内容片段的功能，

其中所述执行评分的功能基于与所述内容片段相对应的所述语音评价来执行与所述内容片段相似的内容片段的评分。

Claims

1.一种信息处理装置，其包括：

2.根据权利要求1所述的信息处理装置，其进一步包括：

3.根据权利要求2所述的信息处理装置，

4.根据权利要求2所述的信息处理装置，

5.根据权利要求1所述的信息处理装置，

6.根据权利要求1所述的信息处理装置，

7.根据权利要求1所述的信息处理装置，

8.根据权利要求1所述的信息处理装置，

9.根据权利要求1所述的信息处理装置，

10.根据权利要求1所述的信息处理装置，其进一步包括：

输出控制单元，其被配置成使得输出所述评分的结果。

11.根据权利要求10所述的信息处理装置，

12.根据权利要求10所述的信息处理装置，其中

13.根据权利要求10所述的信息处理装置，

14.一种信息处理方法，其包括：

基于所述评分的结果从所述内容列表中选择内容片段。

15.一种程序，其使计算机实现以下功能：