具体实施方式
以下,参照附图来说明本发明的实施方式。
1.第1实施方式
这里,说明涉及本发明的第1实施方式中的信息处理装置10。
1.1结构
信息处理装置10如图1所示,包括内容储存部101、内容群选择部102、数据库103、对象选择部104、内容解析部105、类似对象确定部106、附带数据提取部107、附带数据推定部108、附带数据写入部109及接受部110。
(1)数据库103
数据库103存在于信息处理装置10内,储存内容储存部101管理的数字内容数据及其附带数据、及数字内容中包含的对象的特征量。另外,数据库还仅储存数字内容数据。
图2是表示数据库103的内部结构的一例的图。数据库103如图2所示,在内容存储区域内储存数字内容201、…、202及301、302、…、303。
这里,所谓数字内容只要是以数字形式保存的信息即可。例如,既可以是由数字静态照相机拍摄的静止图像,也可以是由数码摄像机拍摄的动态图像。
数字内容201、…、202按照每个该数字内容,保存内容整体的特征量数据、数字内容中包含的对象的特征量数据及数字内容的附带数据。例如,数字内容201由作为图像数据的数字内容数据A210、内容整体的特征量数据211、由对象A1、A2、…、Aa的特征量数据构成的特征量数据群212、由附带数据A1、A2、…、Ab构成的附带数据群213构成。对象A1、A2、…、Aa分别是从数字内容数据A210内检测到的对象。所谓对象是数字内容上的1张图像中包含的人物或物体、景色及将所述1张图像分割而得到的任意区域等。另外,所谓特征量是数字内容的1张图像内的色相、亮度、轮廓线等图像的构成要素、以及根据所述图像的构成要素计算的各种指标等。
附带数据A1、A2、…、Ab是对数字内容附加的数字内容的属性信息,例如是对由数字静态照相机拍摄的图像附加的Exif数据、或由数字内容投稿站对数字内容附加的如关键字或标签那样的元数据等。另外,附带数据A1、A2、…、Ab还用于识别数字内容。例如,在对各个数字内容附加了表示生成该数字内容的日期时间的附带数据的情况下,将这些附带数据用于识别在指定的日期时间生成的数字内容。
数字内容C301、D302、…、E303是尚未与内容整体的特征量、对象的特征量及附带数据建立对应的内容。
信息处理装置10对于尚未与内容整体的特征量、对象的特征量及附带数据建立对应的内容,使用数字内容201、…、202来确定应建立对应的附带数据。后面,将尚未与内容整体的特征量、对象的特征量及附带数据建立对应的内容称为推定目标内容,将已与内容整体的特征量、对象的特征量及附带数据建立对应的数字内容称为储存内容。
(2)内容储存部101
内容储存部101将信息处理装置10所管理的、与附带数据等建立对应的数字内容(图2中的数字内容201、…、202)、推定目标内容(图2中的数字内容301、302、…、303)储存在数据库103中并管理。
(3)内容群选择部102
内容群选择部102从内容储存部101管理的数字内容中,提取多个推定目标内容,并根据用户操作,将提取出的各个推定目标内容分类为1个以上的输入内容群中的某一个。
这里,所谓输入内容群是指由1个以上的推定目标内容构成的集合。另外,作为分类方法,有通过用户操作根据日期时间、事件、场所等指标将多个推定目标内容进行分组的方法。具体地,按相对于某个日期时间属于从该日期时间起规定期间的内容来分类,或按相对于某个位置属于距该位置规定范围的内容来分类。
(4)对象选择部104
对象选择部104按照所述输入内容群所包含的每个推定目标内容,选择1个以上的对象,作为输入对象。
具体地,若通过用户操作经由接受部110接受包含推定目标内容中存在的对象的区域(例如矩形区域)的指定,则对象选择部104选择指定的区域、对象。下面,将选择到的对象称为输入对象。
(5)内容解析部105
内容解析部105解析由对象选择部104选择的1个以上的输入对象,并按每个输入对象计算特征量。
另外,因为特征量的计算方法是已知的技术,所以这里省略说明。例如,特开2001-84274号公报或特开2005-275847号公报中公开了该技术。
(6)类似对象确定部106
类似对象确定部106使用计算的特征量和与所述多个对象分别建立对应的特征量,从输入内容群以外的数字内容、即多个储存内容中包含的多个对象(下面称为‘储存对象’)中,按照每个输入对象提取1个以上类似的储存对象(下面称为‘类似对象’)。
(7)附带数据提取部107
附带数据提取部107针对按照每个输入对象提取的类似对象,分别提取与包含该类似对象的储存内容建立对应的全部附带数据。
(8)附带数据推定部108
附带数据推定部108根据附带数据提取部107提取出的附带数据,按照每个输入内容群推定最佳的附带数据。
附带数据的推定方法通过推定中利用的类似内容的附带数据的数量、种类、或附带数据为固定型还是非固定型等来推定。这里,所谓固定附带数据是如数字静态照相机的拍摄图像等中使用的Exif数据等那样数据内容确定的附带数据。所谓非固定附带数据是如由数字内容投稿站对动态图像附加的关键字或标签等那样数据内容不确定的附带数据。
具体地,附带数据推定部108在通过用户操作由接受部110接受多个附带数据中的在推定中使用的附带数据的种类时,使用与接受到的种类相应的附带数据,按每个输入内容群,推定应与该输入内容群中包含的全部推定目标内容建立对应的1个以上附带数据。这里,所谓附带数据的种类例如是Exif数据中包含的生成日期时间信息、GPS(GlobalPositioningSystem)信息或识别元数据中包含的关键字或标签的信息。
具体地,附带数据推定部108提取在从输入内容群的各推定目标内容分别选择的全部输入对象中共同的附带数据,并将该提取的附带数据作为应与该各推定目标内容建立对应的附带数据。另外,附带数据推定部108将组合提取到的各附带数据的、即提取到的全部附带数据分别作为应与该各推定目标内容建立对应的附带数据。另外,关于推定对输入内容群的附带数据的方法的具体例,在后面进行叙述。
(9)附带数据写入部109
附带数据写入部109将由附带数据推定部108按每个输入内容群推定的1个以上附带数据与对应的输入内容群中包含的全部推定目标内容建立对应。
(10)接受部110
接受部110例如是用户向信息处理装置10进行输入用的遥控器、鼠标、键盘等。
接受部110通过用户操作,接受各种指示。
例如,接受部110针对提取的多个推定目标内容,分别接受该推定目标内容属于哪个输入内容群的指示。
另外,接受部110接受推定目标内容中包含的对象的指定。
另外,接受部110接受附带数据推定部108中使用的附带数据的种类。
1.2动作
(1)动作概要
这里,用图3所示的流程图来说明推定对输入内容群的附带数据的信息处理装置10的动作概要。
内容群选择部102执行根据用户操作将1个以上推定目标内容分别分类为1个以上输入内容群的分类处理(步骤S5)。
对象选择部104按照输入内容群中包含的每个推定目标内容,选择1个以上的对象(步骤S10)。具体地,对象选择部104当通过用户操作接受包含推定目标内容中存在的对象的区域(例如矩形区域)的指定时,选择指定的区域,作为输入对象。
内容解析部105按照由对象选择部104选择的1个以上的输入对象分别计算特征量(步骤S15)。具体地,内容解析部105按照步骤S10中选择的1个以上输入对象分别解析该输入对象,计算其特征量。
类似对象确定部106针对步骤S10中提取的每个输入对象,从1个以上的储存内容中包含的1个以上储存对象中,提取1个以上的与该输入对象类似的储存对象(类似对象)(步骤S20)。这里,储存对象是否与输入对象类似的判断通过比较步骤S15中提取的该输入对象的特征量与储存内容中包含的储存对象的特征量、并判断两者是否一致或差异是否在允许范围内来进行。在判断为一致或在允许范围内的情况下,判断为两者类似。这里,允许范围既可利用预定的值,也可以由用户设定值。
附带数据提取部107针对步骤S20中提取的1个以上类似对象,分别提取与包含该类似对象的储存内容对应的附带数据(步骤S25)。
附带数据推定部108使用步骤S25中提取的附带数据,按照每个输入内容群,执行推定针对该输入内容群的附带数据的附带数据推定处理(步骤S30)。
附带数据写入部109按照每个输入内容群,对该输入内容群中包含的全部推定目标内容附加步骤S30中推定的附带数据(步骤S35)。
(2)分类处理
这里,用图4所示的流程图来说明图3所示的步骤S5的分类处理的详细动作。
内容群选择部102根据用户的操作,从数据库103存储的数字内容中选择推定目标内容(步骤S100)。
若步骤S100选择推定目标内容,则内容群选择部102将选择的推定目标内容分类为1个以上的输入内容群(步骤S105)。
(3)附带数据推定处理
这里,用图5所示的流程图来说明图3的步骤S30所示的附带数据推定处理的详细动作。该处理按照每个推定目标内容执行。
附带数据推定部108通过用户操作,经由接受部110,接受图3所示的步骤S25中提取的储存内容的附带数据中的、1种用于推定的附带数据种类(步骤S200)。
附带数据推定部108判断接受到的附带数据种类是否是固定型(步骤S205)。具体地,附带数据推定部108针对一储存内容,基于保存有由附带数据种类确定的附带数据的区域,判断附带数据种类是否是固定型。这是因为保存固定附带数据及非固定附带数据的区域不同。
在判断为不是固定附带数据种类、即是非固定附带数据的情况下(步骤S205为‘否’),附带数据推定部108按照每个输入内容群,使用针对该输入内容群提取到的1个以上的储存内容,提取与接受的附带数据种类相符的附带数据或附带数据的一部分(步骤S210)。
在执行步骤S210之后,及判断为接受的附带数据种类是固定型的情况下(步骤S205为‘是’),附带数据推定部108通过取舍选择或组合固定的附带数据、或步骤S210提取的附带数据或其一部分,生成推定为针对输入内容群最佳的概率最高的附带数据(步骤S215)。
1.3具体例
这里,使用具体例来说明对推定目标内容的附带数据的推定。
(1)具体例1
首先,用使用非固定附带数据来推定与场所有关的附带数据时的具体例来说明。
图6是表示所述信息处理装置10开始与场所有关的附带数据的推定动作,执行图3所示的步骤S5至步骤S25的结果而得到的、针对输入内容群提取的储存内容及其非固定附带数据(关键字)的图。
详细叙述得到图6的储存内容的附带数据的经过。在图3所示的步骤S5中,将拍摄‘东京ABC塔’的照片(推定目标内容C100)和拍摄‘东京AA路线’电车的照片(推定目标内容C101)分类为输入内容群。
接着,在步骤S10中,选择各个推定目标内容C100、C101中包含‘东京ABC塔’的区域(下面称为OBJ1)和包含‘东京AA路线’电车的区域(下面称为OBJ2),作为输入对象。
接着,在步骤S15中,计算OBJ1及OBJ2各自的特征量,在步骤S20中,针对计算的各个特征量,各提取3个具有接近该特征量的特征量的类似对象。这里,针对OBJ1提取储存内容1-1、1-2、1-3,针对OBJ2提取储存内容2-1、2-2、2-3。
之后,在步骤S25中,针对包含提取到的类似对象的储存内容1-1至2-3,得到图6所示的附带数据。设从该状态起开始附带数据推定处理(步骤S30)。
附带数据推定部108执行步骤S200。因为这次得到的附带数据是1种(仅关键字),所以将该附带数据原样用于推定中。
接着,附带数据推定部108执行步骤S205。因为得到的附带数据是关键字且是非固定型,所以处理迁移到步骤S210。附带数据推定部108提取与涉及想推定的场所的附带数据相符的附带数据及附带数据的一部分。此时,针对储存内容1-1、1-2及1-3,从‘东京旅行’及‘东京ABC塔’中提取‘东京’,从‘巴黎观光’中提取‘巴黎’,从‘拉斯维加斯观光’中提取‘拉斯维加斯’来作为关键字,针对储存内容2-1、2-2及2-3,从‘关东旅行’中提取‘关东’,从‘东京一周’中提取‘东京’,从‘广岛周游’中提取‘广岛’来作为关键字。
附带数据推定部108执行步骤S215。这里,在关键字的一部分中存在共同部分的情况下,采用该共同部分作为新的附带数据。这里,采用在2个储存内容1-1、2-2中共同的‘东京’作为输入内容群的附带数据。
这里,也可以采用具有包含关系的关键字作为新的附带数据,在本具体例中,因为‘东京’包含在作为上位概念的‘关东’中,所以也可以采用‘东京’或‘关东’或这两者作为输入内容群的附带数据。另外,为了利用这种地理上的包含关系,信息处理装置10内部中需要有辅助与场所有关的知识的词典。例如,考虑在数据库103中保存词典数据、由内容储存部101管理的方法。
另外,在针对输入对象的储存内容中的某一个附带数据中必然包含相同关键字的情况下采用该关键字作为新的附带数据的方法中,采用针对OBJ1的储存内容1-1与针对OBJ2的储存内容2-2的双方中包含的‘东京’作为输入内容群的附带数据。
并且,在单纯采用全部关键字作为附带数据的方法中,采用所述‘东京’、‘巴黎’、‘拉斯维加斯’、‘关东’、‘广岛’全部作为输入内容群的附带数据。
并且,在采用关键字所表示的场所在地理上的距离的阈值以内集中数量最多的关键字作为新的附带数据的方法中,例如,在设阈值为500km以内的情况下,因为‘东京’与‘关东’两种场所在500km以内,其他场所不在500km以内,所以采用‘东京’与‘关东’作为输入内容群的附带数据。另外,在这种情况下,因为‘东京’是‘关东’的下位概念,所以也可以考虑仅采用‘东京’或‘关东’之一作为输入内容群的附带数据。另外,关于阈值,既可以利用预定的值,也可以由用户设定值。
另外,也可以是根据取得的多个关键字取得相同或视为相同的关键字的出现数量,在取得的出现数量为规定值以上的情况下,采用该关键字作为附带数据。这里,所谓视为相同的关键字例如指与一个关键字存在上位或下位概念的关系的关键字。
(2)具体例2
这里,用使用固定附带数据来推定与场所有关的附带数据时的具体例来说明。
图7是表示所述信息处理装置10开始与场所有关的附带数据的推定动作,执行图3所示的步骤S5至步骤S25的结果而得到的、针对输入内容群提取的储存内容及其固定附带数据的图。
另外,步骤S5至步骤S25的动作的经过与具体例1所示的细节一样,所以省略说明。设从该状态起开始附带数据推定处理(步骤S30)。
附带数据推定部108执行步骤S200。因为这次得到的附带数据是1种,所以将该附带数据原样用于推定中。
附带数据推定部108执行步骤S205。因为得到的附带数据是固定型,所以处理迁移到步骤S215。
在步骤S215中,在附带数据推定部108采用单纯采用提取到的全部附带数据作为输入内容群的附带数据的方法的情况下,单纯采用6个GPS信息作为附带数据。或者,在将6个GPS信息捕捉为范围而不是点的方法中,例如采用属于纬度为‘北纬34度23分739秒~北纬48度51分30秒’、经度为‘从西经115度10分20秒经由东经0度至东经139度45分24秒’的范围的GPS信息,作为对输入内容群的附带数据。
并且,在采用附带数据所表示的场所在预定的地理距离的阈值以内集中数量最多的附带数据作为新的附带数据的方法中,例如,在设阈值为500km以内的情况下,采用3种GPS信息‘北纬35度39分31秒、东经139度44分43秒’、‘北纬35度39分20秒、东经139度45分24秒’、‘北纬35度43分48秒、东经139度42分40秒’作为新的附带数据。另外,在将这3个GPS信息捕捉为范围而不是点的方法中,采用纬度为‘北纬35度39分20秒~北纬35度43分48秒’、经度为‘从东经139度42分40秒至东经139度45分24秒’的范围,作为输入内容群的附带数据。
并且,在先将GPS信息变换为都市名称的情况下,也可以通过根据储存内容的非固定附带数据来推定与场所有关的附带数据的情况下说明的方法来推定输入内容群的附带数据。另外,为了利用这种从GPS信息向都市名称的变换,信息处理装置10内部中需要有辅助与场所及GPS信息的关联有关的知识的词典。例如,可以考虑在数据库103中保存词典数据、由内容储存部101管理的方法。
(3)具体例3
这里,用根据固定附带数据来推定与年代有关的附带数据时的具体例来说明。
图8是表示所述信息处理装置10开始与场所有关的附带数据的推定动作,执行图3所示的步骤S5至步骤S25的结果而得到的、针对输入内容群提取的储存内容及其固定附带数据的图。另外,因为步骤S5至步骤S25的经过与具体例1所示的细节一样,所以省略说明。设从该状态起开始附带数据推定处理(步骤S30)。
附带数据推定部108执行步骤S200。因为这次得到的附带数据是1种,所以将该附带数据原样用于推定中。
附带数据推定部108执行步骤S205。因为得到的附带数据是固定型,所以处理迁移到步骤S215。
在步骤S215中,在附带数据推定部108采用单纯采用提取到的全部附带数据作为输入内容群的附带数据的方法中,单纯采用6个日期时间信息作为附带数据。或者,在将6个日期时间信息捕捉为范围而不是点的方法中,采用‘1988/5/313:37~2008/12/2817:57’的范围,作为输入内容群的附带数据。
另外,在采用附带数据所表示的年代在预定的时间范围内最集中的范围作为新的附带数据的方法中,例如,在设阈值为10年以内的情况下,采用4种日期时间信息‘1988/5/313:37’、‘1990/5/514:45’、‘1993/3/2315:07’、‘1998/8/1815:29’作为新的附带数据。另外,在将这4个日期时间信息捕捉为范围而不是点的方法中,采用‘1988/5/313:37~1998/8/1815:29’的范围作为输入内容群的附带数据。
1.4变形例
(1)附带数据的推定变形例
在上述实施方式中,推定中使用的附带数据为1种,但不限于此。也可以使用多种附带数据来推定对输入内容群的附带数据。
下面,用图9所示的流程图来说明使用多种附带数据来推定针对输入内容群的附带数据的处理的动作。
附带数据推定部108确认图3所示的步骤S25中提取到的、包含与输入对象类似的储存对象的储存内容的多个附带数据种类,分类为储存内容的附带数据的取舍选择中使用的附带数据种类、以及最终的输入内容群的附带数据推定中使用的附带数据种类(步骤S300)。具体地,若通过用户操作,经接受部110接受取舍选择中使用的附带数据种类的指定、以及推定中使用的附带数据种类的指定,则附带数据推定部108根据接受的指定内容进行分类。
附带数据推定部108判断步骤S300中提取为储存内容的附带数据取舍选择用的附带数据种类之一的附带数据种类是否是固定型(步骤S305)。
在判断为不是固定型的情况下(步骤S305为‘否’),附带数据推定部108确认该一个附带数据种类的附带数据的事项(日文:内容),并取与取舍选择的基准相符的附带数据或附带数据的一部分(步骤S310)。如上述实施方式所述,因为非固定的附带数据种类的附带数据的记述事项不确定,不一定与附带数据的取舍选择的基准相符,所以必需如步骤S310中执行的那样,确认附带数据的事项,提取与取舍选择的基准相符的附带数据或附带数据的一部分。这里,所谓的取舍选择的基准是用于在后述的步骤S315中选择并留下推定为更适当的储存内容的附带数据的基准。例如,该基准是留下在多个附带数据及附带数据的一部分中存在共同部分的附带数据,或多种附带数据存在包含关系的情况下留下这些附带数据,或根据规定基准从所述附带数据及附带数据的一部分中留下最可靠的附带数据,或将所述附带数据及附带数据的一部分的全部留下等。另外,也可以根据附带数据的事项或推定的附带数据的每个事项而提供不同的基准。
在执行步骤S310之后、以及判断为一个附带数据种类为固定型的情况下(步骤S305为‘是’),附带数据推定部108根据取舍选择的基准,组合步骤S305判断的固定附带数据或步骤S310选择的附带数据,由此取舍选择储存内容的附带数据(步骤S315)。所谓组合方法例如是选择并留下在多个附带数据及附带数据的一部分中存在共同部分的储存内容,或根据规定基准从所述附带数据及附带数据的一部分中选择并留下包含最可靠的附带数据的储存内容,或将包含附带数据及附带数据的一部分的数字内容全部留下等方法。另外,也可以根据附带数据的事项或推定的附带数据的每个事项而提供不同的基准。
附带数据推定部108确认附带数据的取舍选择处理是否已完成(步骤S320)。
在判断为附带数据的取舍选择处理未完成的情况下(步骤S320为‘否’),处理返回到步骤S305,继续进行储存内容的附带数据的取舍选择。
在判断为已完成的情况下(步骤S320为‘是’),附带数据推定部108判断针对输入内容群的附带数据的推定中使用的附带数据种类是否是固定附带数据(步骤S325)。
在判断为不是固定型的情况下(步骤S325为‘否’),附带数据推定部108确认推定中使用的附带数据种类,提取与推定对象的输入内容群的附带数据种类相符的附带数据或附带数据的一部分(步骤S330)。这是因为与上述理由一样,非固定附带数据种类的附带数据的记述事项不确定,不一定与想推定的附带数据种类相符。
附带数据推定部108取舍选择或组合储存内容的固定附带数据种类的附带数据或所述步骤S330提取到的附带数据或附带数据的一部分,由此生成推定为针对输入内容群最佳的概率最高的附带数据(步骤S335)。所谓组合方法例如是提取在多个附带数据及附带数据的一部分中共同的部分并采用为附带数据、或在多种附带数据存在包含关系的情况下将其采用为附带数据、或根据设定的基准从附带数据及附带数据的一部分中选择最可靠的附带数据、或采用全部的所述附带数据及附带数据的一部分作为附带数据等方法。另外,也可以根据推定中利用的储存内容的附带数据的事项或推定的附带数据的每个事项,提供不同的方法。
另外,步骤S320的取舍选择处理完成的基准因取舍选择处理的细节不同而不同。例如,在将1种附带数据种类仅用于1次取舍选择的情况下,只要判断步骤S300中分类为储存内容的附带数据的取舍选择用的附带数据种类中是否存在未用于取舍选择的附带数据种类即可。或者,在使用相同的附带数据种类根据不同的取舍选择基准来执行多次取舍选择处理的情况下(例如使用非固定关键字型附带数据,根据场所和年代不同的基准,执行2次储存内容的取舍选择等),只要判断是否将所述附带数据的取舍选择处理重复了预定次数即可。
(具体例)
用具体例来说明根据储存内容的多种附带数据来推定与年代有关的附带数据的情况。
图10是表示信息处理装置10开始与场所有关的附带数据的推定动作,执行图3所示的步骤S5至步骤S25的结果而得到的针对输入内容群提取的储存内容及与此对应的2种附带数据(日期时间信息和关键字)的图。另外,因为步骤S5至步骤S25的经过与所述具体例1至3所示的细节一样,所以省略说明。设从该状态起开始附带数据推定处理(步骤S30)。
附带数据推定部108通过执行步骤S300,例如将附带数据(关键字)分类为所述储存内容的取舍选择用,将日期时间信息分类为最终的附带数据的推定用。
附带数据推定部108执行步骤S305。此时,因为取舍选择用的关键字的数据是非固定型,所以附带数据推定部108接着执行步骤S310。例如,在以‘场所’为基准执行储存内容的取舍选择的情况下,附带数据推定部108仅选择并留下与场所有关的关键字。具体地,附带数据推定部108选择并留下‘东京’、‘巴黎’、‘拉斯维加斯’、‘东京’、‘京都’、‘广岛’。
附带数据推定部108执行步骤S310。这里,假设在关键字的一部分中存在共同部分的情况下选择并留下包含具有该共同部分的附带数据的储存内容的方法。具体地,附带数据推定部108选择并留下将‘东京’作为关键字的储存内容1-1及储存内容2-1。
附带数据推定部108执行步骤S320。因为分类为取舍选择用的附带数据仅为关键字,所以附带数据推定部108前进到步骤S325。
附带数据推定部108执行步骤S325。因为分类为推定用的附带数据(日期时间信息)为固定型,所以附带数据推定部108跳过步骤S330。
附带数据推定部108执行步骤S335。附带数据推定部108在单纯采用提取的全部附带数据作为输入内容群的附带数据的情况下,采用‘1964/5/313:37’、‘1964/5/514:45’这2种日期时间信息作为输入内容群的附带数据。另外,在使用将这2种日期时间信息捕捉为范围而不是点的方法的情况下,附带数据推定部108采用‘1964/5/313:37~1964/5/514:45’的范围作为输入内容群的附带数据。另外,在采用在预定的时间范围以内、附带数据表示的年代最集中的范围作为新的附带数据的方法中,也采用‘1964/5/313:37~1964/5/514:45’作为输入内容群的附带数据。
在图10所示的例中,例如假设东京ABC塔于1956年完成,则在仅使用附带数据种类1的日期时间信息来进行年代推定的情况下,也有可能采用东京ABC塔未完成的1955/8/1815:29作为附带数据,可知使用多个附带数据种类进行的附带数据的锁定是有效的。
(2)信息处理装置的变形例1
在上述实施方式中,数据库103存在于信息处理装置10内,但不限于此。数据库103有时也存在于信息处理装置10的外部、例如网络上。
图11是表示利用网络上的数据库1203的信息处理装置1000的内部结构的图。另外,对具有与第1实施方式所示的信息处理装置10的构成要素一样功能的构成要素附加相同符号。
信息处理装置1000由内容储存部1101、内容群选择部102、对象选择部104、内容解析部105、类似对象确定部106、附带数据提取部107、附带数据推定部108、附带数据写入部109及接受部110构成。
另外,外部装置1001经网络与信息处理装置1000连接,具有数据库1203。
内容储存部1101经网络将信息处理装置1000管理的全部数字内容及其附带数据、及数字内容中包含的对象的特征量储存在数据库1203中管理。
外部装置1001具有的数据库1203储存内容储存部1101管理的数字内容及其附带数据、及数字内容中包含的对象的特征量。另外,数据库1203存储的内容与第1实施方式所示的数据库103一样,所以这里省略说明。
另外,就信息处理装置1000的针对输入内容群的附带数据的推定动作而言,仅是访问对象不同,动作自身与第1实施方式所示的一样,所以这里省略说明。
(3)信息处理装置的变形例2
在上述实施方式中,数据库103存在于信息处理装置10内,但不限于此。信息处理装置也可以在本装置内及网络上的双方中利用数据库。
图12是表示本变形例中的信息处理装置1000a的内部结构的图。另外,对具有与第1实施方式所示的信息处理装置10的构成要素一样功能的构成要素附加相同符号。
信息处理装置1000a由内容储存部1101a、内容群选择部102、数据库1103a、对象选择部104、内容解析部105、类似对象确定部106、附带数据提取部107、附带数据推定部108、附带数据写入部109及接受部110构成。
另外,外部装置1001a经网络与信息处理装置1000a连接,具有数据库1203a。
内容储存部1101a将信息处理装置1000a管理的全部数字内容及其附带数据、及数字内容中包含的对象的特征量储存在数据库1103a与数据库1203a中管理。
数据库1103a及数据库1203a储存内容储存部1101a管理的数字内容数据及其附带数据、及数字内容中包含的对象的特征量等。例如,基本上使用数据库1103a,将数据库1203a用作数据库1103a的备份。
就信息处理装置1000a的针对输入内容的附带数据的推定动作而言,除使用数据库1103a及数据库1203a来代替数据库103外,与第1实施方式所示的输入内容群的附带数据的推定动作一样,所以这里省略说明。
另外,在上述说明中,将2个数据库中的1个数据库(上述中数据库1203a)用作备份来说明,但不限于此。
例如,也可以基本上使用数据库1203a,将数据库1103a用作数据库1203a的备份。此外,也可以根据数据库1103a和数据库1203a的容量,将信息处理装置1000a管理的全部数字内容分割保存并使用。并且,也可以将数字内容的数据保存在数据库1103a中,仅将数字内容的特征量、附带数据存保存在数据库1203a中使用。也可以相反,将数字内容的数据保存在数据库1203a中,仅将数字内容的特征量、附带数据保存在所述数据库1103a中使用。即,只要是使用数据库1103a和数据库1203a双方来使用数字内容的方法即可。
(4)信息处理装置的变形例3
在上述实施方式中,数据库103存在于信息处理装置10内,但不限于此。信息处理装置除本装置内的数据库外,也可以利用外部的多个数据库。
图13是表示本变形例中的信息处理装置1000b的内部结构的图。另外,对具有与第1实施方式所示的信息处理装置10的构成要素一样功能的构成要素附加相同符号。
信息处理装置1000b由内容储存部1101b、内容群选择部102、数据库1103b、对象选择部104、内容解析部105、类似对象确定部106、附带数据提取部107、附带数据推定部108、附带数据写入部109及接受部110构成。
外部装置1001a经网络与信息处理装置1000a连接,具有数据库1203b。
外部装置1002b经网络与信息处理装置1000a连接,具有n个数据库1~n1303b。
内容储存部1101b将信息处理装置1000b管理的全部数字内容及其附带数据、及数字内容中包含的对象的特征量储存在数据库1103b和数据库1203b中管理。
数据库1103b及数据库1203b储存内容储存部1101b管理的数字内容数据及其附带数据、及数字内容中包含的对象的特征量等。
数据库1~n1303b不在信息处理装置1000b管理之下。这里,所谓外部数据库例如是由数字内容投稿站管理的数据库。
作为数据库1~n1303b的利用方法,例如用于内容储存部1101b在由类似对象确定部106提取类似于输入对象的储存对象时,与数据库1103b或数据库1203b内的数字内容一样,也从数据库1~n1303b管理的数字内容中提取的情况。具体地,在类似对象确定部106检索类似对象的情况下,除数据库1103b及数据库1203b外,关于数据库1~n1303b的数字内容也从内容储存部1101b获得,解析取得的数字内容中包含的对象,导出特征量,与输入对象的特征量比较。
另外,设数据库1103b及数据库1203b以变形例2所示的利用方式使用。
就信息处理装置1000b的针对输入内容群的附带数据的推定动作而言,除使用数据库1103b、数据库1203b及数据库1~n1303b来代替数据库103外,与第1实施方式所示的输入内容群的附带数据的推定动作一样,所以这里省略说明。
另外,数据库1103b、数据库1203b及数据库1~n1303b的利用方法不限于上述情况。
例如,也可以是,信息处理装置1000b事先执行数据库1~n1303b上的数字内容中包含的对象的解析,将其特征量或附带数据保存在数据库1103b或数据库1203b中,由内容储存部1101b管理,在类似对象确定部106检索类似对象时提取所管理的特征量或附带数据。
另外,也可以是,从信息处理装置1000b管理的数据库1103b、数据库1203b及数据库1~n1303b上存在的储存内容中选择一部分储存内容来进行类似对象的检索。例如,在需要进行检索的情况记述在储存内容的附带数据中的情况下,也可以仅对在附带数据中有该记述的储存内容进行特征量的比较。另外,在需要计算量的削减或处理的高速化的情况下,也可以排除未被解析储存内容中包含的储存对象的特征量的储存内容,仅对事先解析了特征量的储存内容进行特征量的比较。
另外,也可以利用储存内容的附带数据的生成方法对类似度判断附加优先级。例如,考虑如下方法:对于在数字静态照相机拍摄时直接附加于数字内容的附带数据或用户自己附加的附带数据,判断为可靠性高,当针对附加有附带数据的储存内容提取类似对象时,增大特征量的差异的允许范围。
并且,也可以利用数据库的种类对类似度判断附加优先级。例如,也可以在从信息处理装置1000b管理的数据库1103b或1203b上提取类似对象时,增大特征量的差异的允许范围,若是外部数据库1~n1303b上的类似对象,则缩小特征量的差异的允许范围。
另外,若外部数据库1~n1303b内存在用户频繁利用的数据库,则也可以在提取该数据库上的类似对象时,增大特征量的差异的允许范围。
另外,上述方法是一例,外部数据库1-n1440上的数字内容数据或附属信息的利用方法不限于上述方法。
另外,数据库1103b与数据库1203b的利用方法不限于变形例2所示的利用方法。例如,也可以是,数据库1103b储存信息处理装置1000b管理的全部内容的数据及特征量或附属信息,数据库1203b储存作为外部数据库1~n1303b上的数字内容的解析结果的特征量或附属信息。或者,也可以是,数据库1203b储存信息处理装置1000b管理的全部内容的数据及特征量或附属信息,数据库1103b储存作为外部数据库1~n1303b上的数字内容的解析结果的特征量或附属信息。
对数据库1103b与数据库1203b所示的上述利用方法是一例,不限于这些利用方法。
(5)信息处理装置的变形例4
在上述实施方式中,设推定目标的内容存在于数据库103内,但不限于此。信息处理装置也可以从外部取入推定目标的内容。
图14是表示本变形例中的信息处理装置1000c的内部结构的图。另外,对具有与第1实施方式所示的信息处理装置10的构成要素一样功能的构成要素附加相同符号。
信息处理装置1000c由内容储存部1101c、输入接受部1111c、数据库1103c、对象选择部104、内容解析部105、类似对象确定部106、附带数据提取部107、附带数据推定部108、附带数据写入部109及接受部110构成。
内容储存部1101c将信息处理装置1000c管理的全部数字内容及其附带数据、及数字内容中包含的对象的特征量储存在数据库1103c中管理。
输入接受部1111c从输入设备1003c接受1个以上推定目标内容的输入。将输入的全部推定目标内容分类为1个以上的输入内容群。另外,因为输入内容群的分类方法的细节与第1实施方式所示的内容群选择部102一样,所以这里省略说明。
数据库1103c储存内容储存部1101c管理的数字内容,尤其是第1实施方式所示的储存内容。
输入设备1003c是用于对信息处理装置1000c输入推定目标内容的设备,例如是作为存储数字内容的设备的数字静态照相机或摄像机、个人计算机(PC)或个人视频记录机(PVR)等。另外,输入设备1003c不限于这些设备,只要是储存数字内容的设备即可。
就信息处理装置1000c的针对输入内容群的附带数据的推定动作而言,仅是推定目标内容的取得路径不同,涉及附带数据推定的动作与第1实施方式所示的动作一样,所以这里省略说明。
1.5其他变形例
本发明除上述实施方式及变形例外,例如考虑以下变形例。
(1)在上述实施方式中,数据库103中保存的储存内容是数字内容数据与内容整体的特征量、内容中包含的对象的特征量及附带数据建立对应的结构,但不限于此。
数据库103也可以是将数字内容数据与其附带数据建立对应来保存、而不保存各种特征量数据的结构。
此时,类似对象确定部106计算储存内容的特征量、及储存内容中包含的对象的特征量。
(2)在上述实施方式中,针对推定目标内容,特征量是建立对应来管理的,但不限于此。
也可以是,将针对推定目标内容的整体的特征量及推定目标内容中包含的对象、即输入对象的特征量事先与推定目标内容建立对应来保存在数据库103中。此时,内容解析部105利用事先建立对应的特征量。
(3)在上述实施方式中,附带数据不是事先被与推定目标内容建立对应的,但不限于此。
也可以将与附带数据建立对应的数字内容作为推定目标内容。此时,推定未被建立对应的附带数据。
例如,信息处理装置10在仅有日期时间信息作为附带数据被建立对应的情况下,推定GPS信息。
(4)在上述实施方式中,作为推定目标内容的选择方法,设从遥控器或鼠标、键盘等接受部110接受该指示,但不限于此。
信息处理装置10在具备触摸面板作为接受部110的情况下,也可以用如触摸笔那样的触针(stylus)、用户的手指来选择推定目标内容。
并且,信息处理装置10也可以设置接受手势或声音的专用接收装置作为接受部110。
另外,作为接受部110,上述的结构是一例,不限于这些结构。
另外,内容群选择部102也可以不根据用户的输入,而通过其他选择基准来选择推定目标内容。这里,所谓其他选择基准是如不附带着附带数据的、或一部分附带数据不足那样的基准。
并且,也可以在数字内容的附带数据中记述确定应选择的数字内容的选择信息。此时,内容群选择部102也可以使用选择信息来选择推定目标内容。
另外,也可以事先将推定目标内容进行分组来保存。此时,内容群选择部102将组处理为1个输入内容群。
另外,内容群选择部102的上述选择方法是一例,不限于这些方法。
(5)针对推定目标内容的向输入内容群的分类方法不限于上述第1实施方式所示的方法。例如,在将附带着附带数据的数字内容作为推定目标的情况下,也可以根据日期时间、事件、场所等指标来对多个推定目标内容进行分组。
(6)设为了通过用户操作来接受推定中使用的附带数据种类,但不限于此。
也可以通过以下方法来选择推定中使用的附带数据种类。
既可以是选择与作为推定目标的输入内容群的附带数据种类相符的附带数据的方法,也可以是选择在附带数据自身中记述有输入内容群中欠缺的附带数据种类、推定中使用的附带数据种类的储存内容的附带数据种类的方法。
另外,如上所述的附带数据种类的选择方法是一例,不限于这些方法。
(7)针对推定目标内容的附带数据的推定方法不限于上述实施方式所示的方法。
例如,也可以提取在多个所述附带数据及附带数据的一部分中共同的部分,采用为附带数据。
或者,在多种附带数据存在包含关系的情况下,也可以将这些采用为附带数据,也可以根据规定基准,从所述附带数据及附带数据的一部分中选择最可靠的附带数据。
或者,也可以将附带数据及附带数据的一部分全部采用为附带数据。
此外,也可以按照推定中利用的储存内容的附带数据的事项或推定的附带数据的每个事项,适用不同的推定方法。
(8)在使用多个附带数据种类的情况下分类为推定用和取舍选择用的方法不限于上述方法。
例如,也可以是,在存在与包含推定目标内容的输入内容群的附带数据种类相符的附带数据种类的情况下,将该附带数据种类分类为推定用、将其余的附带数据种类分类为取舍选择用的方法。
此外,也可以是,按照如在附带数据自身中记述有推定及取舍选择中使用的附带数据种类那样的储存内容的附带数据种类来分类的方法。
另外,上述的附带数据种类的分类方法是一例,不限于这些方法。
(9)在上述实施方式中,对象选择部104通过用户操作接受推定目标内容中包含的对象的指定,但不限于此。
对象选择部104也可以使用一般物体识别技术来识别数字内容内的对象,选择适于附带数据推定的对象。
并且,在输入内容群所包含的数字内容的附带数据中记述有所选择的对象的情况下,对象选择部104也可以将附带数据中记述的对象作为输入对象来选择。
另外,对象的选择方法不限于这些方法。
(10)类似对象确定部106的类似对象的确定不限于如上所述的方法。
例如,也可以是,类似对象确定部106在提取类似于输入对象的类似对象时,未必对数据库103上的全部储存内容中包含的全部储存对象进行与输入对象的特征量的比较。此时,例如在应进行特征量的比较的储存内容的附带数据中记述有该旨意时,仅提取有该记述的储存内容来进行特征量的比较。
另外,在提取类似于输入对象的类似对象时,也可以利用储存内容的附带数据的生成方法,对储存对象和输入对象的特征量比较进行加权。例如,可以认为数字静态照相机拍摄时直接附加于数字内容的附带数据、或用户自己附加的附带数据其附带数据的可靠性较高,所以也可以将判断为被附加了可靠性高的附带数据的储存内容中包含的储存对象是类似对象的特征量差异的允许范围设定得大。或者,也可以仅将被附加了可靠性高的附带数据的储存内容中包含的储存对象作为特征量的比较对象。并且,在需要计算量的削减或处理的高速化的情况下,也可以排除未被解析储存内容中包含的储存对象的特征量的储存内容,仅对已解析特征量的储存内容进行所述比较。
另外,进行特征量比较的储存对象的选择方法不限于这些方法。
(11)在类似对象确定部106在特征量的比较中进行加权的情况下,上述所示的附带数据写入部109也可以追加记述是利用该加权导出的附带数据。
(12)在上述实施方式中,当提取针对输入对象的类似对象时,也可以对提取出的类似对象赋予权重(与输入对象的匹配的适合率,即匹配的可靠性),并根据赋予的权重,推定输入内容群的附带数据。例如,考虑采用所赋予的权重中的最高权重的类似对象的附带数据。
另外,对类似对象的权重不仅是与输入对象的匹配的适合率,也可以是基于推定目标内容中包含的相同对象数量的值。例如,可以考虑相同对象数量在全部对象数量之中存在的比例。
(13)在上述实施方式中,作为输入内容和储存内容而选择的数字内容的种类也可以不同。例如,也可以选择动态图像作为输入内容,选择静止图像作为储存内容。此外,也可以相反,选择静止图像作为输入内容,选择动态图像作为储存内容。
此外,也可以选择多种数字内容作为输入内容或储存内容。例如,也可以选择静止图像和动态图像双方作为输入内容。
1.7总结
由此,本实施方式及各变形例所示的信息处理装置能够根据与包含类似对象的储存内容建立对应的附带数据,来推定对输入内容群中包含的全部推定目标内容的附带数据。
2.第2实施方式
这里,说明涉及本发明的第2实施方式中的信息处理装置的内部结构。
2.1结构
在第1实施方式中,根据与储存内容建立对应的附带数据,推定了推定目标内容的附带数据,但在第2实施方式中,根据事先准备的词典数据,推定推定目标内容的附带数据。
下面说明本实施方式中的信息处理装置2000的结构。对具有与第1实施方式所示的信息处理装置10的构成要素相同的功能的构成要素附加相同符号。
信息处理装置2000如图15所示,由内容储存部2101、内容群选择部102、数据库103、对象选择部104、内容解析部105、词典对象确定部2106、附带数据提取部2107、附带数据推定部2108、附带数据写入部109及接受部110构成。
(1)数据库2103
数据库2103如图16所示,具有内容存储区域2200、一般词典数据存储区域2201、用户词典数据存储区域2202。
在内容存储区域2200中,与第1实施方式一样,保存储存内容及推定目标内容。另外,关于储存内容及推定目标内容,已在第1实施方式中说明,所以这里省略说明。
一般词典数据存储区域2201及用户词典数据存储区域2202是保存词典数据的区域。
这里,所谓词典数据是记述词典对象、该词典对象的特征量、及根据词典对象推定的附带数据的关联的数据。
这里,将词典数据分类为:综合了对象与附带数据的一般的关联的一般词典数据、以及综合了对象与附带数据的依赖于用户的关联的用户词典数据,一般词典数据保存在一般词典数据存储区域2201中,用户词典数据保存在用户词典数据存储区域2202中。
这里,在一般词典数据存储区域2201中,保存与场所或年代等关联的词典数据2210、2211、…,例如,词典数据2210是与场所关联的词典数据,词典数据2211是与年代关联的词典数据。
另外,在用户词典数据存储区域2202中,保存与场所或年代等关联的词典数据2230、2231、…,例如,词典数据2230是与场所关联的词典数据,词典数据2231是与年代关联的词典数据。
另外,词典数据具有多个由词典对象、其特征量、1个以上附带数据构成的组(下面称为‘对象信息’),例如,词典数据2210具有对象信息2220、…、2221,对象信息2220由词典对象(对象A)、其特征量、1个以上的附带数据(这里为附带数据A1、…、Aa)构成。另外,各附带数据用于识别对应的对象。
这里,用具体例来说明词典数据的内容。在由数字静态照相机拍摄的照片中作为对象而包含‘东京ABC塔’的情况下,能够容易地推定与‘东京’或‘ABC街’等场所有关的关键字,作为生成该照片的场所。在这种情况下,设定‘东京ABC塔’作为一般词典数据的词典对象,记述‘东京’或‘ABC街’等作为所述词典对象的附带数据。这样,可将表示所存在的场所被限定的对象的场所的词典数据作为与场所关联的词典数据而包含在词典数据2210中。
另外,在由数字静态照相机拍摄的照片中作为对象而包含有‘汽车’的情况下,作为生成该照片的年代,能够将从‘汽车’的开始销售之年到所述‘汽车’的生产停止并经过10年左右之年的期间作为与年代关联的词典数据的有力候补来列举。这是因为一般,‘汽车’几年进行1次模型改良,所以某型式的‘汽车’的生产、销售时期有限,并且认为‘汽车’的一般寿命为10年左右。但是,因为还考虑将相同的‘汽车’使用10年以上的情况,所以可以考虑将这种与词典对象的年代有关的附带数据和与每个年代的存在概率有关的附带数据一起附加。这样,能够将表示所存在的期间被限定的对象设为用于表示年代的词典数据。
另外,在由数字静态照相机拍摄的照片中作为对象而包含‘用户从1990年到1995年之间拥有的车’的情况下,作为生成该照片的年代,能容易地推定与‘从1990年到1995年’的年代有关的附带数据。在这种情况下,设定‘用户从1990年到1995年之间拥有的车’作为用户词典数据的词典对象,记述‘从1990年到1995年’作为该词典对象的附带数据。这样,能将与用户关联的对象中的、所存在的场所或期间被限定的的对象设为用于表示年代或场所的词典数据。
(2)内容储存部2101
内容储存部2101将储存内容、推定目标内容及词典数据储存在数据库2103中管理。
(3)词典对象确定部2106
词典对象确定部2106从由内容储存部2101管理的词典数据内的对象中,按照每个输入对象提取1个以上的类似的词典数据内的对象(词典对象)。
(4)附带数据提取部2107
附带数据提取部2107针对按照每个输入对象从词典数据中提取到的每个词典对象,提取与该词典对象建立对应的全部附带数据。
(5)附带数据推定部2108
附带数据推定部2108按照每个输入内容群,使用提取的附带数据,推定针对该输入内容群的附带数据。
关于推定方法,在与存在概率有关的附带数据未附加于词典对象的附带数据中的情况下,能够以与第1实施方式所示的方法相同的方法来实现。另一方面,在附加了存在概率的情况下,将附加于各附带数据的存在概率以附带数据单位相加,将存在概率之和最大的附带数据采用为附带数据。
2.2动作
(1)动作概要
这里,用图17所示的流程图来说明信息处理装置2000的动作概要。
内容群选择部102执行根据用户操作、将1个以上推定目标内容分别分类为1个以上输入内容群的分类处理(步骤S400)。
对象选择部104按照输入内容群中包含的每个推定目标内容,选择1个以上的输入对象(步骤S405)。具体地,与第1实施方式一样,对象选择部104当通过用户操作接受包含推定目标内容中存在的对象的区域的指定时,选择指定的区域,作为输入对象。
内容解析部105按照由对象选择部104选择的1个以上的输入对象,分别计算特征量(步骤S410)。
词典对象确定部2106按照在步骤S405中提取到的每个输入对象,将1个以上储存内容分别所包括的1个以上对象中的、类似于该输入对象的词典对象提取一个以上(步骤S415)。这里,对象是否类似于输入对象的判断与第1实施方式一样,所以这里省略说明。
附带数据提取部2107针对在步骤S415中提取的1个以上词典对象,分别提取对该词典对象的附带数据(步骤S420)。
附带数据推定部2108使用步骤S420中提取的附带数据,按照每个输入内容群,执行推定对该输入内容群的附带数据的附带数据推定处理(步骤S425)。
附带数据写入部109按照每个输入内容群,对该输入内容群所包含的全部推定目标内容附加步骤S425中推定的附带数据(步骤S430)。
(2)分类处理
图17的步骤S400所示的分类处理的细节可通过与图4所示的流程图一样的处理动作实现,所以这里省略说明。
(3)附带数据推定处理
这里,用图18所示的流程图来说明图17的步骤S425所示的附带数据推定处理的详细动作。该处理按每个推定目标内容执行。
附带数据推定部2108通过用户操作,经接受部110,接受1种图17所示的步骤S420中提取到的词典对象的附带数据中的、用于推定的附带数据种类(步骤S500)。
附带数据推定部2108判断接受的附带数据种类是否是固定型(步骤S505)。具体地,附带数据推定部108与第1实施方式一样,根据针对一储存内容存储由附带数据种类确定的附带数据的区域,判断附带数据种类是否是固定型。
在判断为不是固定附带数据种类、即非固定附带数据的情况下(步骤S505为‘否’),附带数据推定部2108按照每个输入内容群,使用针对该输入内容群提取到的1个以上词典对象,提取与接受的附带数据种类相符的附带数据或附带数据的一部分(步骤S510)。
在执行步骤S510之后,及判断为接受的附带数据种类是固定型的情况下(步骤S505为‘是’),附带数据推定部2108通过取舍选择或组合固定的附带数据、或步骤S210中提取到的附带数据或其一部分,生成推定为对输入内容群最佳的概率最高的附带数据(步骤S515)。
2.3变形例
本发明除上述实施方式外,例如可以考虑以下变形例。
(1)在上述实施方式中,词典对象确定部2106在提取与输入对象类似的词典对象时,与全部的词典数据中包含的各对象的特征量进行了比较,但不限于此。
也可以未必对全部对象执行与输入对象的特征量的比较。例如,在应执行特征量比较的对象的附带数据中记述有该旨意时,仅提取该对象来进行特征量的比较。
另外,在提取类似于输入对象的词典对象时,也可以根据词典数据的种类,在词典对象与输入对象的特征量的比较中进行加权。例如,在想使用户词典数据优先的情况下,也可以将判断为用户词典数据中包含的对象是与输入对象类似的词典对象的特征量差异的允许范围设定得大。或者,也可以仅将想优先的用户词典数据中包含的对象设为特征量的比较对象。另外,也可以设为与词典的制作源的可靠度相应地在词典对象的类似度判断中进行加权。另外,进行特征量比较的对象的选择方法不限于这些方法。
(2)在上述实施方式中,附带数据推定部2108在附加有存在概率的情况下,将附加于各附带数据的存在概率以附带数据单位相加,将存在概率之和最大的附带数据采用为附带数据,但不限于此。
例如,附带数据推定部2108也可以将存在概率之和比某个阈值高的全部附带数据采用为附带数据。
另外,也可以按照推定中利用的附带数据的事项或推定的附带数据的每个事项,设定不同的条件。
(3)上述第2实施方式所示的信息处理装置也可以执行如图11及图12所示的利用网络上的数据库的附带数据的推定、如图13所示的利用数据库1~n的附带数据的推定、如图14所示的利用输入设备的附带数据的推定。
此时,不同之处仅在于:使用的附带数据是词典对象的附带数据;以及作为附带数据的推定方法而如图19所示的例那样利用存在概率,因为动作的概念本身没有不同之处,所以这里省略说明。
并且,也可以组合第1实施方式利用类似对象的附带数据的推定、和本实施方式的利用词典对象的附带数据的推定。此时,既可以并行执行使用类似对象的附带数据的推定方法及使用词典对象的推定方法,来进行附带数据的取舍选择或推定,也可以通过按顺序执行来进行附带数据的取舍选择或推定。
2.4具体例
这里,用使用词典数据推定与年代有关的附带数据时的具体例来说明。
图19是表示信息处理装置2000开始与年代有关的附带数据的推定动作并执行图17所示的步骤S400至步骤S420的结果得到的词典对象及其固定附带数据(年代+存在概率)的图。
首先,详细叙述得到如图19的词典对象的附带数据的经过。内容群选择部102在步骤S400中,选择拍摄‘用户’的照片(推定目标内容C200)和拍摄‘汽车’的照片(推定目标内容C201)作为输入内容群。
接着,对象选择部104在步骤S405中选择包含推定目标内容C200的‘用户’的区域(输入对象;下面称为OBJ1a)和包含‘汽车’的区域(输入对象;下面称为OBJ2a),作为输入对象。
接着,内容解析部105在步骤S410中,计算2个输入对象(OBJ1a、OBJ2a)各自的特征量。
词典对象确定部2106在步骤S415中,按照2个输入对象各自的每个特征量,提取持有接近该特征量的特征量的词典对象。具体地,针对OBJ1a,利用脸识别功能识别对象是‘用户’,利用用户词典中的脸与年代的对应关系,将脸与‘用户’相似的年代连同概率一起提取。另外,针对OBJ2a,提取2辆类似的‘汽车’,各自的年代连同存在概率一起被提示。从这种状态起开始附带数据推定处理(步骤S425)。
附带数据推定部2108执行步骤S500。此时,因为得到的附带数据是1种,所以将该附带数据原样用于推定中。
接着,附带数据推定部2108执行步骤S505。因为推定中使用的附带数据是固定型,所以附带数据推定部2108执行步骤S515。这里,例如在采用存在概率之和最大的年代作为附带数据的情况下,因为2001年的存在概率之和为55%,为最高,所以采用2001年作为附带数据。
另外,在采用存在概率之和为50%以上的年代作为附带数据的情况下,因为2001年与2009-2010年的存在概率之和为50%以上,所以将这些采用为附带数据。另外,对于阈值(这里为50%),既可以使用预定的值,也可以由用户设定值。
另外,也可以将年代采用为范围。此时,采用2001年~2010年的范围作为附带数据。并且,若考虑词典对象2-1与词典对象2-2是不同的对象、与OBJ20相符的是某一方,则也可以不单纯取3种词典对象的附带数据的存在概率之和,而分别计算词典对象1-1与词典对象2-1的附带数据的存在概率之和、以及词典对象1-1与词典对象2-2的附带数据的存在概率之和,采用存在概率最高的2001年作为附带数据。
另外,还考虑使用多种词典数据来推定附带数据的情况,但除了取舍选择或推定中使用的附带数据是词典对象的附带数据,并且作为推定时的附带数据的组合方法而如图19所示的例那样利用存在概率外,与第1实施方式的图9所示的处理一样,所以这里省略说明。
2.5总结
如上所述,本实施方式的信息处理装置2000可使用词典数据来推定输入内容群的附带数据。
3.第3实施方式
这里,说明涉及本发明的第3实施方式中的信息处理装置的内部结构。
3.1结构
在第1实施方式中根据与储存内容建立对应的附带数据,在第2实施方式中根据词典数据,分别推定推定目标内容的附带数据,但在第3实施方式中,根据年龄推定用数据,来推定推定目标内容的附带数据。
下面说明本实施方式中的信息处理装置3000的结构。对具有与第1实施方式所示的信息处理装置10的构成要素相同的功能的构成要素附加相同符号。
信息处理装置3000由内容储存部3101、内容群选择部102、数据库3103、对象选择部104、内容解析部105、年龄推定对象确定部3106、附带数据提取部3107、附带数据推定部3108、附带数据写入部109及接受部110构成。
(1)数据库3103
数据库3103如图21所示,具有内容存储区域3200、用户数据存储区域3203。
在内容存储区域3200中,与第1实施方式一样,保存有储存内容及推定目标内容。另外,关于储存内容及推定目标内容,已在第1实施方式中说明,所以这里省略说明。
一般词典数据存储区域3201及用户词典数据存储区域3202与第2实施方式一样,保存一般词典数据及用户词典数据。另外,关于一般词典数据及用户词典数据,已在第2实施方式中说明,所以这里省略说明。
用户数据存储区域3203中,如图21所示,保存有出生年月日数据3210及年龄推定用数据3211。
出生年月日数据3210是按多个用户(这里为用户a、用户b、…、用户n)中每个用户,与关于该用户的1个以上特征量及出生年月日建立对应的数据,用于确定内容中包含的被摄体及该被摄体的年龄。
年龄推定用数据3211按照用于对推定目标内容中包含的对象的年龄进行推定的每个对象或事件,与其附带数据(特征量、对应的用户及该用户的推定年龄)建立对应的数据。下面,将用于推定年龄的对象或事件称为年龄推定对象。这里,各附带数据用于识别对应的对象或事件。
这里,作为能推定年龄的对象或事件,例如可以列举‘学生服’、‘吸烟’。这是因为一般用户穿学生服的时期锁定为中学~高中期间,或在日本国内未成年人是不允许吸烟的,所以能推定被建立对应的用户的年龄。另外,还可以考虑基于用户固有的事情的对象或事件。另外,年龄推定对象不限于这些例,只要是能推定用户的年龄的对象或事件即可。
(2)内容储存部3101
内容储存部3101将储存内容、推定目标内容、一般词典数据、用户词典数据、出生年月日及年龄推定用数据储存在数据库3103中管理。
(3)年龄推定对象确定部3106
年龄推定对象确定部3106按照每个输入对象,使用出生年月日数据3210确定类似于该输入对象的用户,并且,从年龄推定用数据3211中包含的年龄推定对象中,提取1个以上类似于该输入对象的年龄推定对象。
具体地,年龄推定对象确定部3106根据由内容解析部105计算的输入对象的特征量、以及出生年月日数据3210中包含的用户各自的1个以上的特征量,确定类似于输入对象的用户。
另外,年龄推定对象确定部3106取得1个以上的与包含确定的用户的附带数据对应、且类似于该输入对象的年龄推定对象。
具体地,年龄推定对象确定部3106首先根据基于内容解析部105的输入对象的特征量、以及年龄推定用数据中包含的特征量,取得1个以上类似于该输入对象的年龄推定对象。年龄推定对象确定部3106从提取到的1个以上年龄推定对象中,取得附带数据中包含被确定为类似于输入对象的用户的全部年龄推定对象。
这里,所谓某个年龄推定对象类似于某个输入对象是指比较输入对象的特征量与年龄推定对象的特征量,两者一致或差异在允许范围内的情况。另外,关于允许范围,既可利用预定的值,也可以由用户设定值。
另外,附带数据中包含被确定的用户这一概念是指附带数据中的有关用户的信息(用户信息)与该确定的用户一致、及该用户信息中包含该确定的用户。
(4)附带数据提取部3107
附带数据提取部3107提取对应于取得的年龄推定对象的推定年龄。
(5)附带数据推定部3108
附带数据推定部3108使用由年龄推定对象确定部3106确定的用户的出生年月日和由附带数据提取部3107提取的年龄推定对象的附带数据,推定输入内容群的年代。
3.2动作
(1)动作概要
这里,用图22所示的流程图来说明信息处理装置3000的动作概要。
内容群选择部102执行根据用户操作、将1个以上推定目标内容分别分类为1个以上输入内容群的分类处理(步骤S600)。
对象选择部104按照输入内容群中包含的每个推定目标内容,选择1个以上的输入对象(步骤S605)。具体地,与第1实施方式一样,对象选择部104当通过用户操作接受包含推定目标内容中存在的对象的区域的指定时,选择指定的区域,作为输入对象。
内容解析部105按照由对象选择部104选择的1个以上的输入对象,分别计算特征量(步骤S610)。
年龄推定对象确定部3106针对在步骤S605中提取到的各个输入对象,执行年龄推定对象取得处理,该年龄推定对象取得处理进行类似于该输入对象的用户的确定、以及1个以上年龄推定对象的取得(步骤S615)。
附带数据提取部3107针对在步骤S615中提取到的1个以上年龄推定对象,分别提取针对该年龄推定对象的推定年龄(步骤S620)。
附带数据推定部2108按照每个输入内容群,执行推定针对该输入内容群的年代的年代推定处理(步骤S625)。
附带数据写入部109按照每个输入内容群,对该输入内容群中包含的全部推定目标内容附加步骤S625中推定的年代,作为附带数据(步骤S630)。
(2)分类处理
图22的步骤S600所示的分类处理的细节能够通过与图4所示的流程图一样的处理动作实现,所以这里省略说明。
(3)年龄推定对象提取处理
这里,用图23所示的流程图来说明图22的步骤S615所示的年龄推定对象提取处理的动作。
年龄推定对象确定部3106从步骤S605中提取到的输入对象中,选择进行年龄推定对象的检索的输入对象(步骤S700)。
年龄推定对象确定部3106根据出生年月日数据中包含的用户a、…、用户n各自的特征量以及输入对象的特征量,判断是否确定了类似于所选择的输入对象的用户(步骤S705)。
在判断为确定了的情况下(步骤S705为‘是’),年龄推定对象确定部3106取得与所确定的用户建立对应的出生年月日(步骤S710)。并且,年龄推定对象确定部3106提取与所选择的输入对象类似的1个以上的年龄推定对象(步骤S715)。
年龄推定对象确定部3106判断是否针对在步骤S605中提取出的全部输入对象完成了年龄推定对象的提取(步骤S720)。
在判断为未完成的情况下(步骤S720为‘否’),处理返回到步骤S700。在判断为完成的情况下(步骤S720为‘是’),处理结束。
另外,在判断为未确定出类似于所选择的输入对象的用户的情况下(步骤S705为‘否’),处理移动到步骤S720。
(4)年代推定处理
这里,用图24所示的流程图来说明图22的步骤S625所示的附带数据推定处理的详细动作。该处理按照每个推定目标内容执行。
附带数据推定部3108针对一个推定目标内容,选择1个进行年龄推定的年龄推定对象(步骤S800)。
附带数据推定部3108根据年龄推定对象的推定年龄,推定推定目标内容年代(S805)。这里,使用具体例来说明。另外,设推定目标内容包含‘穿学生服的用户a’作为输入对象。此时,附带数据推定部3108若在步骤S800选择‘学生服’作为年龄推定对象,则根据作为其推定年龄的12-18岁、以及用户a的出生年月日(例如1976年6月13日),推定‘1988-1994年’作为该输入对象的年代。
附带数据推定部3108判断是否对一个推定目标内容中包含的全部输入对象执行了年代的推定(步骤S810)。
在判断为未执行的情况下(步骤S810为‘否’),处理返回到步骤S800。
在判断为已执行的情况下(步骤S810为‘是’),附带数据推定部3108组合推定的年代后,对输入内容群生成最佳的年代,作为附带数据(步骤S815)。
3.3变形例
本发明除上述实施方式外,例如可以考虑以下变形例。
(1)在上述实施方式中,年龄推定对象确定部3106在提取类似于输入对象的年龄推定对象时,对年龄推定用数据3211中包含的全部年龄推定对象进行了与输入对象的特征量的比较,但不限于此。
例如,年龄推定对象确定部3106也可以仅对附带数据中记载有应进行特征量的比较的年龄推定对象进行比较。
年龄推定对象确定部3106也可以从在附带数据中包含确定的用户的全部年龄推定对象中,取得类似于输入对象的年龄推定对象。
另外,进行所述特征量的比较的年龄推定用对象的选择方法不限于上述方法。
(2)在上述实施方式中,也可以追加使用第2实施方式所示的词典数据的附带数据的推定功能。
并且,也可以组合第1及第2实施方式与本实施方式的推定功能,根据储存内容、词典对象及年龄推定对象来综合地推定最适于输入内容群的附带数据。
(3)在上述实施方式中,信息处理装置3000在图24所示的步骤S805中推定年代,但不限于此。
例如,信息处理装置3000也可以根据出生年月日数据和年龄推定用数据,对用户与年龄推定用对象的组合事先导出年代,对该用户与年龄推定用对象的组合分配所导出的年代,保持在数据库3103中。
另外,如上所述,在事先导出年代的情况下,也可以将对该用户与年龄推定用对象的组合分配所导出的年代的信息作为第2实施方式中说明的用户词典数据,将其保持在数据库3103上,利用年龄推定对象,作为词典对象的一部分。
(4)在上述实施方式中,作为年代的推定方法,使用出生年月日数据3210与年龄推定用数据3211,但不限于此。
例如,也可以按照用户a~用户n,分别将该用户的出生年月日与对该用户的不同年龄的脸的特征量建立对应并保持在数据库3103中。此时,年龄推定对象确定部3106通过比较输入对象的特征量与每个用户的各年龄下的特征量,可取得类似于该输入对象的年龄推定对象(这里为用户的脸)。
另外,针对用户,也可以不保持各年龄的脸的特征量,而例如将10来岁脸的特征量、20来岁脸的特征量等某个期间每个的脸的特征量与出生年月日。
3.4总结
如上所述,本实施方式的信息处理装置3000能推定输入内容群的附带数据(这里为年代)。
4.变形例
以上根据各实施方式进行了说明,但本发明不限于上述各实施方式。例如,考虑以下变形例。
(1)也可以将记述上述实施方式说明的方法的步骤的程序存储在存储器中,由CPU(CentralProcessingUnit)等从存储器中读出程序,执行读出的程序,从而实现上述方法。
另外,也可以将记述该方法的步骤的程序存储在记录媒体中,发布。
(2)涉及上述各实施方式的各结构也可以实现为作为集成电路的LSI(LargeScaleIntegration)。这些结构既可单芯片化,也可以包含部分或全部地单芯片化。这里,表现为LSI,但也可以根据电路集成度的不同,称为IC(IntegratedCircuit)、系统LSI、超级LSI、特级LSI。另外,集成电路化的手法不限于LSI,也可以由专用电路或通用处理器来进行集成电路化。另外,也可以利用在LSI制造后可编程的FPGA(FieldProgrammableGateArray)、或可重构LSI内部的电路单元的连接或设定的可重构处理器(ReConfigruableProcessor)。或者,这些功能块的运算例如也可以使用DSP(DigitalSignalProcessor)或CPU(CentralProcessingUnit)等来运算。并且,这些处理步骤也可以作为程序记录在记录媒体中并执行来处理。
并且,如果因半导体技术的进步或派生的其他技术而出现置换LSI的集成电路的技术,则当然可使用该技术来集成功能模块。有可能是生物技术的应用等。
(3)也可以组合上述实施方式及变形例。
5.补充
(1)作为本发明一实施方式的信息处理装置,其特征在于,具备:第1取得单元,取得多个内容;第2取得单元,按取得的每个内容求出表示该内容的特征的1个以上的特征信息,并且在多个参照数据中进行检索而取得包含所述特征信息的1个以上的参照数据,所述多个参照数据是所述多个内容以外的数据,且已被赋予用于识别该数据的表示该数据的属性的属性信息;确定单元,从对按每个所述内容取得的1个以上的参照数据分别赋予的属性信息所示的属性中,确定所述多个内容的共同的属性,并将所确定的属性作为应该用于所述多个内容的识别的、表示该多个内容各自的属性的属性信息;以及赋予单元,将由所述确定单元确定的属性信息分别赋予给所述多个内容。
根据该结构,信息处理装置使用对参数数据赋予的属性信息,确定应在多个内容识别中共同使用的属性信息,将确定的属性信息分别赋予给多个内容,所以能够对由多个内容构成的内容群赋予共同的属性信息。信息处理装置通过对多个内容中的各个内容赋予共同的属性信息,例如通过将赋予的属性信息用作检索的关键字,能够检索该内容群。
(2)这里,也可以是,所述多个内容是拍摄的图像,包含至少1个以上的对象,所述参照数据包含用被赋予的属性信息识别的对象,所述第2取得单元按照由所述第1取得单元取得的每个内容,取得该内容中包含的至少1个对象,作为所述特征信息,针对所取得的全部对象,分别在所述多个参照数据中进行检索而取得1个以上与该对象相同或类似的对象,所述确定单元对按照通过检索得到的1个以上对象,分别取得对包含该对象的参照数据赋予的属性信息。
根据该结构,信息处理装置通过使用对与作为特征信息取得的对象相同或类似的对象赋予的属性信息,能够容易确定应在多个内容的识别中共同使用的属性信息。
(3)这里,也可以是,所述参照数据是包含用被赋予的属性信息识别的对象的图像。
根据该结构,信息处理装置能够对应赋予属性信息的所述多个内容(图像),利用已被赋予属性信息的图像(参照数据)。另外,通过对所述多个内容赋予关联信息,还能将这些内容利用为参照数据。
(4)这里,也可以是,所述参照数据中包含的对象与涉及对象的识别的可靠性建立对应,所述第2取得单元在针对一个参照数据检测到2个以上的作为取得目标的对象的情况下,取得可靠性最高的1个对象。
根据该结构,信息处理装置取得可靠性最高的对象,所以对所述多个内容赋予的属性信息也是对该多个内容而言可靠性高的属性信息。
(5)这里,也可以是,所述参照数据是拍摄的图像,对所述参照数据赋予的属性信息表示拍摄场所,所述确定单元基于根据参照数据取得的属性信息各自所示的场所,将各属性信息按每个规定范围进行分组,确定所属的属性信息的数量最多的组,并将所确定的组所示的范围作为应该用于所述多个内容的识别的属性信息。
根据该结构,信息处理装置通过使用表示拍摄场所的属性信息,能够对所述多个内容赋予共同的场所作为属性信息。
(6)这里,也可以是,所述参照数据是拍摄的图像,对所述参照数据赋予的关联信息表示拍摄日期时间,所述确定单元基于根据参照数据取得的属性信息各自所示的日期时间,将各属性信息按每个规定期间进行分组,确定所属的属性信息的数量最多的组,将与确定的组相应的期间作为应该用于所述多个内容的识别的属性信息。
根据该结构,信息处理装置通过使用表示拍摄日期时间的属性信息,能够对所述多个内容赋予共同的期间作为属性信息。
(7)这里,也可以是,所述参照数据是拍摄的图像,对所述参照数据赋予的属性信息是表示该参照数据的关键字,所述确定单元基于根据参照数据取得的属性信息各自所示的关键字,确定相同或视为相同的关键字出现的数量,在确定的数量为规定数以上的情况下,将该出现数量为规定数以上的关键字作为应该用于所述多个内容的识别的属性信息。
根据该结构,信息处理装置通过将表示内容的关键字作为属性信息,能够对所述多个内容赋予共同的关键字作为属性信息。
(8)这里,也可以是,由所述多个参照数据构成词典数据,所述第2取得单元针对按照所述第1取得单元所取得的每个内容取得的全部对象,分别在所述词典数据中进行检索而取得所述1个以上对象。
根据该结构,信息处理装置通过使用词典数据,能够容易地取得对象。
(9)这里,也可以是,所述信息处理装置还具备存储涉及用户的用户信息的用户信息存储单元,所述第2取得单元针对按照所述第1取得单元所取得的每个内容取得的全部对象,分别取得与所述用户关联的所述1个以上的对象,针对所取得的1个以上的对象,分别取得对包含该对象的参照数据赋予的关联信息,使用所取得的各属性信息和用户信息,确定所述多个内容分别被拍摄的年代,将所确定的年代作为对所述多个内容各自的属性信息。
根据该结构,信息处理装置根据与用户关联的对象的属性信息和用户信息来确定所述多个内容的年代,所以能取得对该多个内容适当的年代。
(10)这里,也可以是,所述用户信息是所述用户的出生年月日,所述属性信息是表示所述用户的年龄范围的数据,所述参照数据中包含的对象是推定是被赋予的属性信息所示的年龄范围的所述用户的脸,所述确定单元使用所取得的1个以上的属性信息各自所示的年龄范围和用户的出生年月日,确定拍摄所述多个内容各自的年代。
根据该结构,信息处理装置使用用户的出生年月日作为用户信息,所以能够容易确定对所述多个内容的适当年代。
产业上的可利用性
涉及本发明的信息处理装置能够对由多个内容构成的输入内容群推定并赋予最佳的关联信息,并根据赋予的关联信息,实现这些内容的管理和利用,并且,还能够推荐与某个内容关联的内容。
符号说明
10信息处理装置
101内容储存部
102内容群选择部
103数据库
104对象选择部
105内容解析部
106类似对象确定部
107附带数据提取部
108附带数据推定部
109附带数据写入部
110接受部