CN101201846A - 信息处理方法,信息处理设备和程序 - Google Patents

信息处理方法,信息处理设备和程序 Download PDF

Info

Publication number
CN101201846A
CN101201846A CNA2007101997578A CN200710199757A CN101201846A CN 101201846 A CN101201846 A CN 101201846A CN A2007101997578 A CNA2007101997578 A CN A2007101997578A CN 200710199757 A CN200710199757 A CN 200710199757A CN 101201846 A CN101201846 A CN 101201846A
Authority
CN
China
Prior art keywords
information
content information
time point
content
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101997578A
Other languages
English (en)
Inventor
竹原充
佐古曜一郎
河上达
中村隆俊
阿部友一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101201846A publication Critical patent/CN101201846A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种信息处理方法,包括存储步骤、生成步骤、第一判定步骤和关联步骤,在该存储步骤中与内容信息相关联地存储指示内容信息内携带的特定内容的属性的属性信息,在该生成步骤中通过提取通过该存储步骤存储的属性信息的至少一部分生成属性信息集合,在该第一判定步骤中判定存储介质内存储的一组内容信息是否包含构成该属性信息集合的任何属性信息,在该关联步骤中将该组内容信息与构成属性信息集合的属性信息中的被判断为被包含在该组内容信息内的特定属性信息设定为彼此相关联。

Description

信息处理方法,信息处理设备和程序
对相关申请的交叉引用
本发明包含与2006年12月12日在日本专利局提交的日本专利申请JP 2006-334899相关的主题,该专利申请全部内容并入此作为参考文献。
技术领域
本发明涉及信息处理方法,信息处理设备和程序。
背景技术
提供用户请求的内容信息的服务可经由信息服务器广泛得到,该信息服务器内提供携带特定内容例如新闻报道、电影和音乐的内容信息。简要描述各组内容信息的属性信息并且被作为标签附加到信息服务器内存储的内容信息中的属性信息将使得用户可基于该标签有效地搜索并请求他所要的内容信息。为此,需要在信息存储器内存储的内容信息上附加准确的标签。
这种标签可被人工或自动地附加到内容信息中。在人工方法中,观察者观察/收听内容信息,并将被观察者判断为适合于具体内容的标签附加到该内容信息中。尽管人工方法由于在内容信息上附加了准确的标签而是有利的,但是观察/收听所有信息存储器内存储的所有内容信息并总结内容是一项艰巨的工作。
日本专利公开号2003-228569公开了一种用于将元数据自动附加到内容信息中的元数据附加方法。在此元数据附加方法中,从被以文本格式提供的内容信息中提取关键字,比较该关键字与比较标签组,每个该比较标签组被与一组元数据对应地预先设定,并且将基于比较结果被判断为匹配于内容信息的内容的元数据附加到内容信息上。
发明内容
上述相关领域中的元数据附加方法内使用的比较标签组被人工设定,或者通过形态分析内容信息的内容被设定。尽管人工设定比较标签组的过程非常艰巨,但是通过形态分析内容信息的内容设定的比较标签组可能包含不合适的比较标签。
因此,本发明通过解决了上述问题而被完成,并且提供了一种新的和改进的信息处理方法,一种新的和改进的信息设备,以及一种新的和改进的程序,由此可使用包含通过简单过程生成的最优属性信息的属性信息集合使内容信息与属性信息相关联。
根据本发明的一个实施例,提供了一种包含存储步骤、生成步骤、第一判定步骤和关联步骤的信息处理方法,在该存储步骤中与内容信息相关联地存储指示内容信息内携带的特定内容的属性的属性信息,在该生成步骤中通过提取通过该存储步骤存储的属性信息的至少一部分生成属性信息集合,在该第一判定步骤中,判定存储介质内存储的一组内容信息是否包含构成该属性信息集合的任何属性信息,在该关联步骤中,将该组内容信息与构成属性信息集合的属性信息中的被判断为被包含在该组内容信息内的特定属性信息设定为彼此相关联。
通过该生成步骤,可通过与内容信息相对应地提取存储步骤内存储的属性信息自动生成属性信息集合。由于构成此属性信息集合的属性信息是已经被通过例如人工过程添加到内容信息中的属性信息,所以没有正确指示内容信息属性的属性信息不太可能被包含在该属性信息集合内。在该关联步骤中,一组内容信息与构成属性信息集合的属性信息中的被判断为被包含在该组内容信息内的特定属性信息被设定为彼此相关联。因此,可通过采用该信息处理方法通过简单的过程与内容信息相对应地设定属性信息。
内容信息可包含指示特定内容出现的时间点的时间点信息。在此情况下,可使用内容信息内包含的时间点信息执行信息处理。
信息处理方法还可包括第二判定步骤,在该第二判定步骤中,基于该组内容信息中包含的第一时间点信息内指示的时间点与已经人工地使该特定属性信息与其相关联的特定内容信息中包含的第二时间点信息内指示的时间点之间的定时关系,判定是否将该组内容信息指定为将与特定属性信息相关联的关联目标。由于关于一组内容信息是否应该被指定为将与特定属性信息相关联的关联目标的判定是在考虑了第一时间点信息内指示的时间点与第二时间点信息内指示的时间点之间的关系做出的,所以可非常可靠地与内容信息相对应地设定属性信息。
定时关系可以是第一时间点信息内指示的时间点与第二时间点信息内指示的时间点之间的时序关系。例如,只有当第一时间点信息内指示的时间点匹配于或者比第二时间点信息内指示的时间点更新时,该组内容信息才会被指定为将与特定属性信息相关联的关联目标。在此情况下,如果特定内容信息内携带的内容不可能与在该第二时间点信息内指示的时间点之前的时间点出现的内容和在该第二时间点信息内指示的时间点之前的时间点出现的该组内容信息中携带的内容相关,则该组内容信息不会与被设定为特定内容信息相关联的特定属性信息相关联。
定时关系可以是第一时间点信息内指示的时间点和第二时间点信息内指示的时间点之间的时间间隔。例如,只有当第一时间点信息内指示的时间点和第二时间点信息内指示的时间点之间的时间间隔等于或小于预定时间长度时,该组内容信息才会被指定为将与特定属性信息相关联的关联目标。如果在该组内容信息内携带的内容出现的时间点和该特定内容信息内携带的内容出现的时间点之间仅存在小的时间滞后,则可认为该组内容信息内携带的内容与该特定内容信息内携带的内容彼此相关联的可能性高。因此,通过考虑了第一时间点信息内指示的时间点和第二时间点信息内指示的时间点之间的时间间隔,确保非常可靠的特定属性信息可被设定为与该组内容信息相关联。
定时信息可以是该特定属性信息已经被人工地设定为与其相关联的多组内容信息中包含的多组第二时间点信息内指示的时间点的时间点分布与第一时间点信息内指示的时间点之间的关系。例如,如果第一时间点信息内指示的时间点在该组第二时间点信息指示的时间点的时间点分布中处于高频位置,则该组内容信息才会被指定为将被设定为与特定属性信息相关联的关联目标。当第一时间点信息内指示的第一时间点在第二时间点信息内指示的时间点的时间点分布处于高频位置时,则可认为该组内容信息与该特定属性信息相关联的可能性高。因此,通过考虑第二时间点信息内指示的时间点的时间点分布与第一时间点信息内指示的时间点之间的关系,确保非常可靠的特定属性信息可被设定为与该组内容信息相关联。
每组内容信息可与其特定内容的属性相对应地被分类为多个类别中的一种,并且可为被提取的属性信息被设定为与其相关联的每类内容信息生成属性信息集合。如上所述构造的结合内容信息和属性信息集合采用的信息处理方法还可包括选择步骤,在该选择步骤中,选择将被用于第一判定步骤的对应于特定类别的属性信息集合。在此情况下,可使需要在第一判定步骤内被检查以确定它们是否被包含在该组内容信息内的属性信息组的数量最小。另外,通过仔细选择将用于第一判定步骤的属性信息集合的类别,不必要的属性信息被设定为与该组内容信息相关联的可能性最小。
信息处理方法还可包括其中选择特定内容信息类别的步骤。在此情况下,可在第一判定步骤内判定被分组到该被选择的类别内的每组内容信息是否包含构成该属性信息集合的任何属性信息。通过采用这些措施,可确保属性信息不会被疏忽地设定成与将被从图像处理中排除的内容信息相关联。
图像处理方法还包括其中当新的内容信息被添加到存储介质内时更新属性信息集合的步骤。通过该更新步骤,可更新属性信息集合以便反映存储介质内存储的内容信息和属性信息中的变化。
第一判定步骤或关联步骤可以预定的频率执行。通过比较存储介质内存储的内容信息和构成属性信息集合的属性信息执行的第一判定步骤的处理负荷较高。因此,通过调节执行第一判定步骤或关联步骤的频率,可调节参与使用上述方法的图像处理的执行的硬件上的负荷。
图像处理方法还可包括以下步骤,即向已经通过该关联步骤被设定为与该组内容信息相关联的特定属性信息中添加识别信息。可通过参考此识别信息确定被设定为与该组内容信息相关联的属性信息是已经被人工设定,还是被使用上述信息处理方法设定。
不允许被人工地设定为与内容信息相关联的属性信息提取并入属性信息集合内。通过不允许人工设定的属性信息的提取,可防止将包含例如个人内容的属性信息合并到该属性信息集合内。
根据本发明的另一个实施例,提供了一种信息处理设备,该信息处理设备包括相互关联地存储携带特定内容的内容信息和指示该特定内容的属性的属性信息的存储单元,生成包含该存储单元内存储的属性信息的至少一部分的属性信息集合的生成单元,判定一组内容信息是否包含构成该属性信息集合的任何属性信息的第一判定单元,以及将该组内容信息与属性信息集合内的被判断为被包含在该组内容信息内的特定属性信息设定为彼此相关联的处理单元。
根据本发明的另一个实施例,提供了一种使计算机能够用作以下这种信息处理设备的程序,即该信息处理设备包括彼此相关地存储携带特定内容的内容信息和指示该特定内容的属性的属性信息的存储单元,生成包含该存储单元内存储的属性信息的至少一部分的属性信息集合的生成单元,判定一组内容信息是否包含构成该属性信息集合的任何属性信息的判定单元,和设定该组内容信息与被判断为被包含在该组内容信息中的属性信息内的特定属性信息彼此相关联的处理单元。
根据上述本发明的实施例,可在使内容信息和属性信息彼此相关联时使用通过简单过程生成的包含最优属性信息的属性信息集合。
附图说明
图1示出在一实施例中实现的时表管理系统内可采取的配置的示例;
图2是示出在本实施例的时表管理装置内采用的硬件配置的框图;
图3是示出在本实施例的时表管理装置内可采用的结构示例的功能框图;
图4示出在显示存储单元内存储的时表的显示设备上可呈现的显示屏幕的示例;
图5示出标签集合生成单元可生成的标签集合的示例;
图6示出标签集合生成单元执行的标签集合更新处理的流程图;
图7是详细示出加标签单元采用的结构的功能框图;
图8示出时间点信息分布的示例;
图9示出在本实施例的加标签处理单元执行的信息处理的流程图;以及
图10示出可被该时表管理装置通过采用信息处理方法实现的处理结果的示例。
具体实施方式
下文将参照附图详细说明本发明的优选实施例。应注意,在此说明书和附图中,具有基本相同的功能和结构的结构元件被用相同标号表示,并省去了对这些结构元件的重复说明。
在下面的说明中,参照图1简要说明了实施例中实现的时表管理系统1,并然后参照图2到10说明包含根据本发明的信息处理设备的时表管理装置20的结构和操作。
图1示出在本实施例的时表管理系统1内可采用的配置的示例。时表管理系统1包括PC(个人计算机)10,网络12,时表管理装置20和数据提供装置30。通过时表管理系统1,创建时表,将该时表存储在时表管理装置20内,并且然后可更新或利用时表管理装置20内存储的时表。
通过基于特定内容出现的时间点组织携带该特定内容的内容信息编译成的时表被存储在时表管理装置20内。例如,给定一组内容信息可对应于在与该内容出现的日期相对应的时间轴上的位置被存储在时表管理装置20内。另外,该特定内容可例如是音乐、电影、财务报告、时事、体育新闻、娱乐新闻、名人琐事、人物历史、讲演、游戏内容或项。内容信息可以是与特定艺术家的即将发行的专辑有关的信息,与出版物有关的信息、与足球比赛有关的信息,与用户难忘的事件例如高校入学有关的信息,与历史事件有关的信息或者与新电影发行有关的信息。时表可以是具有按时间顺序组织的多组音乐相关内容信息的音乐时表,具有按时间顺序组织的多组电影相关内容信息的电影时表,具有按时间顺序组织的多组财经相关内容信息的财经新闻时表,或者具有按时间组织的多组与特定个人相关的内容信息的个人时表。
存储在此时表管理装置20内的内容信息可经由网络12从外部设备例如PC 10或数据提供装置30提供。PC 10可属于正式用户,并且在这种情况下用户能够经由PC 10将与个人背景或业余爱好有关的内容信息传输给时表管理装置20。拥有数据提供装置30的企业经营者能够经由数据提供装置30将与他具有版权的音乐、电影等有关的内容信息传输给时表管理装置20。
另外,响应于PC 10发出的时表传输请求,时表管理装置20将其中存储的时表传输给PC 10。PC 10的用户能够通过在显示设备上显示从时表管理装置20传输的时表来检查该时表。应注意,PC 10仅是信息处理设备的一个示例,并且根据本发明的信息处理设备可以是多种其他设备包括家用视频图像处理设备(DVD记录机、录像机)、便携式电话、PHS(个人手持电话系统)单元、便携式音乐重放设备、便携式视频图像处理设备、PDA(个人数字助理)单元、家用游戏控制器、便携式游戏机和家庭用具中的任何一种。另外,时表管理装置20和数据提供装置30还可用类似的信息处理设备构成。
用户将能够基于指示内容信息内携带的内容的属性并且被作为标签附加到内容信息中的属性信息在时表内包含的内容信息中容易地搜索出希望的内容信息。可使用以下方法将这种标签附加到内容信息中,即观察者观察/收听给定的一组内容信息,并将被该观察者判断为适合于具体内容信息的内容的标签附加到内容信息中。尽管此方法由于在内容信息中附加了准确的标签而是有利的,但是观察/收听时表管理装置20内存储的所有内容信息并总结内容是一项艰巨的工作。
通过聚焦于上述问题产生了本发明的实施例中的时表管理装置20。在本实施例的时表管理装置20内,可通过简单和容易的过程生成包含最优标签的标签集合,并且可使用该标签集合自动将内容信息和标签设定为彼此相关联。现在将参照图2到10说明此时表管理装置20的结构和操作。
图2是示出本实施例内实现的时表管理装置20的硬件配置的框图。时表管理装置20包括CPU(中央处理器)201、ROM(只读存储器)202、RAM(随机存取存储器)203、主机总线204、桥接器205、外部总线206、接口207、输入设备208、输出设备210、存储设备(HDD)211、驱动器212和通信设备215。
用作算术处理设备和控制设备的CPU 201遵照各种程序控制在时表管理装置20内执行的所有操作。CPU 201可由微处理器构成。CPU 201使用的程序、算术操作参数等存储在ROM 202内。CPU 201在执行特定处理期间使用的程序、在该处理执行等期间改变参数等被临时存储在RAM 203内。这些组件经由例如由CPU总线构成的主机总线204相互连接。
主机总线204经由桥接器205连接到外部总线206例如PCI(外围组件互连/接口)总线。应注意,主机总线204、桥接器205和外部总线206不需要被提供为相互独立的分离单元,并且可在单个总线内实现它们各自的功能。
输入设备208可包括例如用户操作的操作部件例如鼠标、键盘、触摸板、按钮、开关或杠杆、基于用户执行的操作生成输入信号并将生成的输入信号输出给CPU 201的输入控制电路等。时表管理装置20的用户能够通过操作输入设备208向时表管理装置20输入各种数据,并向时表管理装置20发布处理操作指令。
输出设备210包括显示设备例如CRT(阴极射线管)显示设备、液晶显示(LCD)设备或灯,以及音频输出设备例如扬声器或耳机。被重放的内容例如经由输出设备210被输出。更准确地说,在显示设备上以文本格式或作为图像显示各种信息例如被重放的视频图像数据。音频输出设备提供被转换成音频输出的被重放的音频数据等。
存储设备211是构成实施例中的时表管理装置20内的存储单元的示例的数据存储设备。此存储设备211可包括例如存储介质、将数据记录在该存储介质内的记录设备、从该存储介质中读出数据的读取设备,和删除存储介质中记录的数据的删除设备。存储设备211可例如是HDD(硬盘驱动器)。当硬盘被驱动时,将被CPU 201执行的程序以及将被CPU 201使用的各种数据被存储在存储设备211内。另外,稍后将详细说明的包含多组内容信息和标签集合的时表被存储在存储设备211内。
用作存储介质阅读器/写入器的驱动器212被提供作为时表管理装置20的嵌入单元或者在外部安装的单元。驱动器212读出磁盘、光盘、磁光盘或可取出的存储介质24例如其中加载半导体存储器内记录的信息,并将被读出的信息输出给RAM 203。
通信设备215是由例如可连接到网络12的通信设备构成的通信接口。通信设备215可以是无线LAN(局域网)兼容通信设备、无线USB兼容通信设备,或从事有线通信的有线通信设备。通信设备215与PC 10、数据提供装置30等交换各种数据包含时表和内容信息。
由于PC 10和数据提供装置30可采用与已经参照图2说明的本实施例内实现的时表管理装置200的硬件结构基本相同的硬件结构,所以省去重复说明。现在,参照图3说明本实施例内实现的时表管理装置200的功能。
图3是示出在本实施例的时表管理装置20内可采用的结构示例的功能框图。时表管理装置20包括通信单元220、记录/读取单元224、存储单元228、标签集合生成单元232和加标签单元240。
通信单元220是与PC 10和数据提供装置30的接口,并且用作接收单元和传输单元。更准确地说,在通信单元220处接收PC 10传输的内容信息和数据提供装置30传输的内容信息。另外,通信单元220将存储单元228内存储的时表传输给PC 10。应注意,通信单元220可被实现为使图2内的通信设备215能够实现特定功能的软件程序。
用作记录单元和读取单元的记录/读取单元224将内容信息和标签记录在存储单元228内,并且从存储单元228中读出时表和标签集合。记录/读取单元224能够例如将已经经由通信单元220从PC 10或数据提供装置30接收到的内容信息记录在存储单元228内存储的时表上的特定位置处。
通过基于特定内容出现的时间点组织携带该特定内容的内容信息编译成的时表和标签集合生成单元232生成的标签集合存储在存储单元228中。该存储单元228可以是非易失性存储器例如EEPROM(电可擦除可编程只读存储器)、EPROM(可擦除可编程只读存储器),磁盘例如硬盘或盘状磁盘,或由光盘例如CD-R(可记录光盘)/RW(可写)、DVD-R(可记录数字通用盘)/RW/+R/+RW/RAM(随机存取存储器)或BD(蓝光盘)-R/BD-RE构成或由MO(磁光)盘构成的存储介质。
图4示出在显示存储单元228内存储的时表的显示器上可提供的显示屏幕的示例。时表可在例如PC 10的显示设备上的如图4所示的显示屏幕内显示。
图4内的时表显示屏幕包括基本操作区域310,时表选择区域320,时期指示区域330,男孩的漫画时表340,橄榄球时表350和细节显示区域360。
在基本操作区域310内显示出这样的图标、字符串、按钮等,即经由这些图标、字符串、按钮等执行基本操作例如放大或缩小显示屏幕,保存显示屏幕以及更新显示屏幕。例如,用户可用鼠标点击字符串“display”以便在显示器上呈现这样的屏幕,即经由该屏幕可放大或缩小显示屏幕。
在时表选择区域320内显示这样的图标、字符串、按钮等,即经由这些图标、字符串、按钮等显示被选择显示的特定时表。在图4所示的时表选择区域320中,可选择“男孩的动画”时表、“国际联合会”时表或“电影”时表。例如,用户可用鼠标点击“电影”以便在显示器上呈现电影时表。
时期显示区域330用作时表内的时间轴。例如,在对应于“1992”的位置处设定与年份1992有关的内容信息。
男孩的动画时表340是通过按时间顺序组织与年轻男性读者的漫画有关的内容信息编译成的。男孩的动画时表340包含内容信息341到内容信息346等。每组内容信息可包括标题、时间点信息、图标、细节信息、相关信息的URL(统一资源定位器)和提供该内容信息的介质的类型例如静止图像、动态图像或音乐。
更准确地说,内容信息341包含标题““Keiyuh UniversityStory”series start”,和指示“1992”的时间点信息。当用户选择此内容信息341时,可在显示器上呈现作为内容信息的描述的对应于内容信息341的细节信息。另外,对应于“Keiyuh University Story”的属性“青春”和“大学生”作为标签被附加到内容信息341中(标签是括号内的字符串)。这些标签可被人工附加。应注意,为时间点信息内指示的时间点假设的时间单位并不局限于年,相反可假设代、世纪、月、星期、天、小时或分钟作为时间单位。
同样,内容信息342包括标题““O2”series start”和时间点信息“1992”,并且附加有标签“运动”和“棒球”,内容信息343包括标题““From the files of the young Kindaichi”series start”和时间点信息“1992”,并且附加有标签“神秘”和“中学”,内容信息344包括标题““NINNIN”series start”和时间点信息“1993”,并且附加有标签“战争”,内容信息345包括标题““Captain Hane World Youth”seriesstart”和时间点信息“1994”,并且附加有标签“运动”和“橄榄球”,而内容信息346包括标题““Detective Doyle”series start”和时间点信息“1994”,并且附加有标签“神秘”和“年级学校学生”。
橄榄球时表350是通过按时间顺序组织橄榄球相关内容信息编译出的时表。橄榄球时表350包含内容信息351到内容信息354。
更准确地说,内容信息351包括标题“Osamu new generalmanager of Japanese national team”和时间点信息“1992”,并且附加有标签“喜多(Osamu)”和“总经理”,内容信息352包括标题“Heartbreaker in Baghdad”和时间点信息“1993”,并且附加有标签“游戏结果”,而内容信息354包括标题“国际联合会”和时间点信息“1994”,并且附加有标签“国际联合会”和“R联合会”。
尽管内容信息353包括标题“R League inaugurated”和时间点信息“1993”,但是内容信息353中没有附加标签。作为该实施例的特征的时表管理装置20的特征在于可在还没有被加标签的内容信息中附加标签,或者可容易地向内容信息中添加额外的标签。稍后将参照图7到10详细说明此特征。
细节显示区域360内详细说明了内容信息的内容。图4示出对应于内容信息353“R League inaugurated”的细节信息。对应于内容信息353“R League inaugurated”的细节信息包括例如描述“The R Leagueinaugurated on May 15,1993 with great fanfare impacted Japanesesports in a big way since before that there was only baseball andSu mo”和描述“The very first game,which marked the beginning of anew phase in Japanese professional sports,was played by BaruseruKawasaki and Yokohama SV at the International Sports Stadium”。
为了参照图3说明时表管理装置20采用的结构,标签集合生成单元232通过提取附加在构成存储单元228内存储的时表的内容信息中的标签生成标签集合。例如,标签集合生成单元232可基于图4内所示的男孩的漫画时表340和橄榄球时表350生成例如图5内所示的标签集合。
图5示出可通过标签集合生成单元232生成的标签集合的示例。图5内的标签集合均与用作标签提取源的特定时表对应地生成。更准确地说,对应于男孩的动画时表340的标签集合包括在男孩的动画时表340内的内容信息342中附加的标签“运动”和在男孩的动画时表340内的内容信息345中附加的标签“橄榄球”。对应于男孩的动画时表340的标签集合还包括标签“棒球”,“战争”,“年级学校学生”,“中学”,“大学生”,“神秘”,“青春”等。
另外,对应于橄榄球时表350的标签集合包括在橄榄球时表350内的内容信息354上附加的标签“国际联合会”和“R联合会”,图4内未示出的内容信息上附加的标签“国际运动场”。对应于橄榄球时表350的标签集合还包括标签“喜多”,“总经理”,“游戏结果”等。
应注意,尽管图5内的标签集合均与用作标签提取源的特定时表对应地生成,但是一个标签集合并不需要与单个标签提取源即单个时表对应地生成。
另外,标签集合生成单元232能够更新已经生成的标签集合。下面将参照图6说明标签结合生成单元232执行的标签集合更新处理的流程。
图6示出标签集合生成单元232执行的标签集合更新处理的流程图。首先,在存储步骤中,记录/读取单元224将与标签对应的内容信息记录在存储单元228内,并生成时表(S402)。接下来,在生成步骤中,标签集合生成单元232基于已经生成的时表生成标签集合(S404)。然后,当记录/读取单元224向存储单元228内添加新的内容信息或者修改存储单元228内的内容信息时(S408),标签集合生成单元232确定是否已经被添加或修改的内容信息中是否附加有标签(S410)。在确定已经被添加或修改的内容信息中添加有标签时,标签集合生成单元232确定该标签是否存在于该标签集合内(S420)。
如果确定该标签集合内不存在该标签,则标签集合生成单元232执行更新步骤,以经由记录/读取单元224将该标签添加到该标签集合中(S430)。另一方面,如果在步骤S410中确定已经被添加或修改的内容信息中没有附加标签,或者在步骤S420中确定该标签集合内已经包含该标签,则标签集合生成单元232结束操作。
如上所述,当向存储单元228内添加新标签时,标签集合生成单元232将该新标签添加到标签集合中,从而更新该标签集合以便反映存储单元228内存储的内容信息和标签中的变化。
为了重新开始参照图3说明时表管理装置20内采用的结构,加标签单元240能够通过比较具体内容信息与标签集合,在构成存储单元228内存储的时表的每组内容信息中附加标签。下面参照图7到9详细说明加标签单元240的结构和操作。
图7是详细示出加标签单元240的结构的功能框图。加标签单元240包括内容信息判定单元242,时间条件判定单元244和加标签处理单元246。
内容信息判定单元242确定构成存储单元228内存储的时表的各组内容信息中的标签,该标签存储于标签集合内。例如,如果标签内容信息被以文本格式提供,则判定内容信息中的标题、描述或其它内容是否包含与标签匹配或类似的字符串。
更准确地说,如前文所述,图4的内容信息353包括描述“The RLeague inaugurated on May 15,1993 with great fanfare impactedJapanese sports in a big way since before that there was only baseballand Sumo”和描述“The very first game,which marked the beginningof a new phase in Japanese profession al sports,was played byBaruseru Kawasaki and Yokohama SV at the International SportsStadium”。假设图5内所示的标签集合被存储在存储单元228内,则内容信息判定单元242判断内容信息353包含匹配标签“R联合会”,“棒球”,“运动”和“国际运动场”的字符串。
应注意,内容信息判定单元242能够选择对应于特定时表类别的将与内容信息比较的标签集合。更准确地说,关于图4内所示的内容信息353作出判定的内容信息判定单元242能够选择性地仅使用与橄榄球时表相对应的标签集合。在这些情况下,内容信息判定单元242判断内容信息353包含匹配标签“R联合会”和“国际运动场”的字符串。即,内容信息判定单元242能够使“棒球”和“运动”无资格作为标签被附加到内容信息353中,“棒球”与内容信息353的基本内容不匹配,而“运动”不是橄榄球时表内的尤其有效的标识关键字。通过允许内容信息判定单元242如上所述地选择将在对目标内容信息作出判定时被使用的特定标签集合,可使与内容信息具有低等级的相关性的标签被附加到内容信息中的可能性最小。
另外,如果内容信息被以音频格式提供,则内容信息判定单元242判定内容信息内的声音数据是否包含代表标签集合内的标签的特定声音。如果内容信息被以视频图像格式提供,则内容信息判定单元242判定内容信息内的视频图像数据是否包含代表标签集合内的标签的视频图像。同样,如果内容信息被以图像格式提供,则内容信息判定单元242判定内容信息内的图像数据是否包含代表标签集合内的标签的图像。
时间条件判定单元244基于作为内容信息判定单元242的当前判定目标的一组内容信息内包含的时间点信息(下文可被称为第一时间点信息)与特定内容信息内包含的时间点信息(下文可被称为第二时间点信息)之间的时间关系,最初从该特定内容信息中提取被该内容信息判定单元242判断为被包含在该组内容信息内的特定标签,判定该特定标签是否应被指定为将被设定为与该组内容信息相关联的关联目标。应注意,该特定标签可被人工地附加到该特定内容信息中。
例如,只有当第一时间点信息内指示的时间点匹配或者比第二时间点信息内指示的时间点更新时,时间条件判定单元244才会将该组内容信息指定为将与该特定属性信息相关联的关联目标。在此情况下,如果特定内容信息内携带的内容不可能与在第二时间点信息内指示的时间点之前的时间点出现的内容以及在第二时间点信息内指示的时间点之前的时间点出现的该组内容信息内携带的内容有关,则该组内容信息与被设定为与该特定内容信息相关联的特定标签不相关。
例如,如果已经从具有指示年份“1992”的时间点信息的内容信息中提取出标签集合内的标签“喜多(Osamu)”,则标签“喜多”可没有资格作为将被设定为与具有指示1992年之前的时间点的时间点信息的内容信息相关联的关联目标。在1992年之前出现的内容信息内包含的字符串“喜多”涉及不同于“喜多”的个人的可能性很大,喜多在1992年被任命为日本国家队的总经理,并因此通过经由时间点判定单元244对时间条件进行约束,可有效地防止内容信息被不可靠地加标签。
可选择地,只有当第一时间点信息内指示的时间点和第二时间点信息内指示的时间点之间的时间间隔等于或小于预定的时间长度时,时间条件判定单元244才会将该组内容信息指定为将被设定为与特定标签相关联的关联目标。如果在该组内容信息内携带的内容出现的时间点和该特定内容信息内携带的内容出现的时间点之间仅存在小的时间延迟,则可认为该组内容信息内携带的内容和该特定内容信息内携带的内容彼此相关的可能性高。因此,通过考虑第一时间点信息内指示的时间点和第二时间点信息内指示的时间点之间的时间间隔,确保较高的可靠性的特定标签可被设定为与该组内容信息相关联。
例如,如果已经从具有指示年份“1992”的时间点信息的内容信息中提取出标签集合内的标签“喜多”,则标签“喜多”可没有资格作为将被设定为与具有指示相对于1992有5年或更长时间间隔的时间点的时间点信息的内容信息相关联的关联目标。假设喜多在1992年被任命为日本国家队的总经理,则喜多在1997年不再是日本国家队的总经理的可能性较高。因此,具有指示时间点1997或更晚的时间点信息的内容信息内包含的字符串“喜多”很有可能涉及另一个人,并且如上所述通过经由时间点判定单元244对时间条件进行时间约束,可有效地防止比较不可靠的标签。
作为另一个替代,只有当第一时间点信息内指示的时间点在该特定标签已经附加到其中的多组内容信息内包含的多组第二时间点信息中指示的时间点的时间点分布内呈现高频位置时,时间条件判定单元244才会将该组内容信息指定为将被设定为与该特定标签相关联的关联目标。当第一时间点信息内指示的时间点在第二时间点信息中指示的时间点的时间点分布内呈现高频位置时,可认为该组内容信息与该特定标签有关的可能性高。因此,通过考虑第二时间点信息内指示的时间点的分布和第一时间点信息内指示的时间点之间的关系,确保较高可靠性的特定标签可被设定为与该组内容信息相关联。
例如,被加标签“国际联合会”的内容信息内包含的多组时间点信息可如图8所示地分布。图8指示被加标签“国际联合会”的内容信息内的时间点信息主要指示年份1994、1995和1996。因此,时间条件判定单元224可选择其时间点信息指示年份1994、1995或1996的包含字符串“国际联合会”的内容信息作为将被加标签“国际联合会”的内容信息。同时,时间条件判定单元244能够确定其时间点信息指示不同于1994、1995或1996的年份的包含字符串“国际联合会”的内容信息不会被加标签“国际联合会”。
加标签处理单元246然后将与已经被时间条件判定单元244指定的内容信息相关联的特定标签设定(附加)为将被设定为与该特定目标相关联的关联目标。现在,参照附图说明上述加标签单元240的操作。
图9是指本实施例的加标签处理单元246执行的图像处理的流程图。内容信息判定单元242首先在存储单元228存储的时表内的内容信息中附加预处理标记(S504)。然后,内容信息判定单元242判定是否存在被标以该预处理标记的任何一组内容信息(S508)。内容信息判定单元242然后提取已被判断为被标以该预处理标记的一组内容信息(S512)。
接下来,内容信息判定单元242在构成存储单元228内存储的标签集合的标签内附加预处理标记(S516)。然后,内容信息判定单元242判定是否存在被标以该预处理标记的任何标签(S520)。内容信息判定单元242然后提取已被判断为被标以该预处理标记的一个标签(S524)。
随后,内容信息判定单元242执行第一判定步骤,在该第一判定步骤中判定在步骤S512中已提取的内容信息是否包含匹配在步骤S524中已提取的标签的字符串(S528)。如果判定在步骤S512中已提取的内容信息包含匹配在步骤S524中已提取的标签的字符串,则时间条件判定单元244执行第二判定步骤,在该第二判定步骤中判定在步骤S512中已提取的内容信息内的时间点信息中指示的时间点和与在步骤S524内已提取的标签相对应的时间点信息中指示的时间点是否满足预定时间条件(S532)。
然后,如果判定在步骤S512中已提取的内容信息内的时间点信息中指示的时间点和与在步骤S524内已提取的标签相对应的时间点信息中指示的时间点满足预定时间条件,则加标签处理单元246执行关联步骤,在该关联步骤中将在步骤S512中已提取的内容信息内的时间点信息附加到在步骤S524中已提取的标签内(S536)。这里,加标签处理单元246还能够通过采用上述信息处理方法附加指示该标签已经被附加的识别信息。随后,在操作返S520之前,内容信息判定单元242为在S524中提取的标签设定后处理标记(S540)。
另一方面,如果在步骤S528中判定在步骤S512中已提取的内容信息不包含匹配在步骤S524中已提取的标签的字符串,或者在步骤S532中判定在步骤S512中已提取的内容信息内的时间点信息中指示的时间点和与在步骤S524内已提取的标签相对应的时间点信息中指示的时间点不满足特定时间条件,则操作前进到步骤S540。
另外,如果在步骤S520判定不存在被标以该预处理标记的标签,则内容信息判定单元242为在步骤S512中已提取的内容信息设定后处理标记(S544),然后操作返回S508。
图10结合存储单元228内存储的如图4所示的时表示出被时表管理装置20如上所述执行的图像处理的结果的示例。
图10示出可被时表管理装置20通过如上所述执行图像处理实现的处理结构的示例。图4内的未被加标签的内容信息353已经通过本实施例内实现的图像处理方法被自动加标签“R联合会”,“棒球”,“运动”和“国际运动场”。另外,信息“自动加标签”被附加到这些标签中作为指示这些标签已经通过本实施例内实现的信息处理方法被附加的识别信息。应注意,识别信息不需要呈现字符串的格式,并且可被设置成可通过例如颜色或字体区分的信息。
如上所述,本实施例内实现的基于被人工附加在内容信息中的标签自动生成标签集合的时表管理装置20使得可容易地设定内容信息与正确标签相关联,同时使不能正确地指示内容信息的属性或内容的不希望的标签信息被包含在属性信息集合内的可能性最小。
另外,本实施例的包含时间条件判定单元244的时表管理装置20能够以更加可靠的方式在给定一组内容信息中附加标签,该时间条件判定单元244基于该组内容信息中的时间点信息内指示的时间点和用作标签提取源的内容信息中的时间点信息内指示的时间点之间的关系,判定是否设定该组内容信息与特定标签相关联。
本领域的技术人员应理解,在所附权利要求或其等同物的范围内根据设计要求和其它因素可做出各种修改、组合、子组合和改变。
在时表管理装置20内被加标签单元240执行以设定内容信息与特定标签相关联的关联处理可以预定的频率、在特定的周期例如每24个小时或每12个小时上执行,或者可在时表管理装置20内以不规则的时间间隔例如一天两次或一个月三次执行。通过必要地调节频率,可优化时表管理装置20上的负荷。
另外,可与特定时表类型相对应地选择加标签的目标内容信息,时表管理装置20内的内容信息判定单元242对该目标内容信息进行判定。通过采用这些措施,可确保标签不会疏忽地被设定为与应该无资格作为自动加标签目标的内容信息相关联。
不允许将由标签集合生成单元232并入到标签集合中的特定标签的提取。例如,通过不允许提取包含个人内容的标签,防止了将包含个人内容的标签并入标签集合。
尽管上文对其中内容信息被附加标签的示例进行了说明,但是标签还可被附加到包含多组内容信息的时表中。
此外,可提供使时表管理装置20内的硬件单元例如CPU 201、ROM 202和RAM 203能够实现与时表管理装置20的各个功能块等同的功能的计算机程序。另外,本发明提供了这种程序存储在其中的存储介质。
说明书中的在时表管理装置20内执行的处理的各个步骤并不必须按与参照流程图所述的顺序相匹配的时间顺序执行,这些步骤可(例如,通过并行处理或基于对象的处理)被同时或单独地执行。

Claims (21)

1.一种信息处理方法,包括以下步骤:
存储步骤,在该存储步骤中与内容信息相关联地存储指示内容信息内携带的特定内容的属性的属性信息;
生成步骤,在该生成步骤中通过提取通过该存储步骤存储的属性信息的至少一部分生成属性信息集合;
第一判定步骤,在该第一判定步骤中判定存储介质内存储的一组内容信息是否包含构成该属性信息集合的任何属性信息;以及
关联步骤,在该关联步骤中将该组内容信息与构成属性信息集合的属性信息中的被判断为被包含在该组内容信息内的特定属性信息设定为彼此相关联。
2.根据权利要求1的信息处理方法,其中所述内容信息包含指示特定内容出现的时间点的时间点信息。
3.根据权利要求2的信息处理方法,其中还包括以下步骤:
第二判定步骤,其中基于所述一组内容信息中包含的第一时间点信息内指示的时间点与已经人工地关联了所述特定属性信息的特定内容信息中包含的第二时间点信息内指示的时间点之间的定时关系,判定是否将该特定属性信息指定为将与该组内容信息相关联的关联目标。
4.根据权利要求3的信息处理方法,其中所述定时关系是所述第一时间点信息内指示的时间点与所述第二时间点信息内指示的时间点之间的时序关系。
5.根据权利要求3的信息处理方法,其中所述定时关系是所述第一时间点信息内指示的时间点和所述第二时间点信息内指示的时间点之间的时间间隔。
6.根据权利要求3的信息处理方法,其中所述定时关系是已经被人工地关联了所述特定属性信息的多组内容信息中包含的第二时间点信息内指示的时间点分布与所述第一时间点信息内指示的时间点之间的关系。
7.根据权利要求1的信息处理方法,其中:
每组内容信息与其特定内容的属性相对应地被分类为多个类别中的一种;
为被设定为与所述被提取的属性信息相关联的每类内容信息生成所述属性信息集合;并且
所述信息处理方法还包括在所述第一判定步骤中选择使用对应于特定类别的属性信息集合的步骤。
8.根据权利要求7的信息处理方法,还包括:
选择特定内容信息类别的步骤;并且
在所述第一判定步骤内,判定被分组到该被选择的类别内的每组内容信息是否包含构成所述属性信息集合的任何属性信息。
9.根据权利要求1的信息处理方法,该方法还包括:
当新的属性信息被添加到所述存储介质内时更新所述属性信息集合的步骤。
10.根据权利要求1的信息处理方法,其中所述第一判定步骤或关联步骤以预定的频率执行。
11.根据权利要求1的信息处理方法,还包括:
向已经通过所述关联步骤被设定为与所述一组内容信息相关联的特定属性信息中添加识别信息的步骤。
12.根据权利要求1的信息处理方法,其中不允许将已被人工地设定为与所述内容信息相关联的属性信息提取并入到所述属性信息集合内。
13.一种信息处理装置,包括:
存储单元,该存储单元相互关联地存储携带特定内容的内容信息和指示该特定内容的属性的属性信息;
生成单元,该生成单元生成包含该存储单元内存储的属性信息的至少一部分的属性信息集合;
判定单元,该判定单元判定一组内容信息是否包含构成该属性信息集合的任何属性信息;以及
处理单元,该处理单元将该组内容信息与属性信息集合内的被判断为被包含在该组内容信息内的特定属性信息设定为彼此相关联。
14.根据权利要求13的信息处理设备,其中所述内容信息包含指示特定内容出现的时间点的时间点信息;并且
该信息处理设备还包括第二判定单元,该第二判定单元基于所述一组内容信息中包含的第一时间点信息内指示的时间点与已经人工地关联了所述特定属性信息的特定内容信息中包含的第二时间点信息内指示的时间点之间的定时关系,判定是否将该特定属性信息指定为将与该组内容信息相关联的关联目标。
15.根据权利要求14的信息处理设备,其中所述第二判定单元基于所述第一时间点信息内指示的时间点与所述第二时间点信息内指示的时间点之间的时序关系,判定是否将所述特定属性信息指定为将与所述一组内容信息相关联的关联目标。
16.根据权利要求14的信息处理设备,其中所述第二判定单元基于所述第一时间点信息内指示的时间点和所述第二时间点信息内指示的时间点之间的时间间隔,判定是否将所述特定属性信息指定为将与所述一组内容信息相关联的关联目标。
17.根据权利要求14的信息处理设备,其中所述第二判定单元基于已经被人工地设定为关联了所述特定属性信息的多组内容信息中包含的第二时间点信息内指示的时间点分布与所述第一时间点信息内指示的时间点之间的关系,判定是否将所述特定属性信息指定为将与所述一组内容信息相关联的关联目标。
18.根据权利要求13的信息处理设备,其中
所述存储单元内存储的每组内容信息与其特定内容的属性相对应地被分类为多个类别中的一种;
所述生成单元与被设定为与所述被提取的属性信息相关联的每类内容信息相对应地生成所述属性信息集合;并且
所述判定单元选择对应于特定类别的属性信息集合由所述判定单元使用。
19.根据权利要求13的信息处理设备,其中所述判定单元判定被分组到所述被选择的类别内的每组内容信息是否包含构成所述属性信息集合的任何属性信息。
20.根据权利要求13的信息处理设备,其中所述生成单元不允许将已被人工地设定为与所述内容信息相关联的属性信息提取并入到所述属性信息集合内。
21.一种其中记录有使计算机能够执行特定处理的程序的记录介质,其中:
该特定处理包括以下步骤:
存储步骤,在该存储步骤中与内容信息相关联地存储指示内容信息内携带的特定内容的属性的属性信息;
生成步骤,在该生成步骤中通过提取通过该存储步骤存储的属性信息的至少一部分生成属性信息集合;
第一判定步骤,在该第一判定步骤中判定存储介质内存储的一组内容信息是否包含构成该属性信息集合的任何属性信息;以及
关联步骤,在该关联步骤中将该组内容信息与构成属性信息集合的属性信息中的被判断为被包含在该组内容信息内的特定属性信息设定为彼此相关联。
CNA2007101997578A 2006-12-12 2007-12-12 信息处理方法,信息处理设备和程序 Pending CN101201846A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006334899A JP2008146483A (ja) 2006-12-12 2006-12-12 情報処理方法、情報処理装置およびプログラム
JP2006334899 2006-12-12

Publications (1)

Publication Number Publication Date
CN101201846A true CN101201846A (zh) 2008-06-18

Family

ID=38961196

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101997578A Pending CN101201846A (zh) 2006-12-12 2007-12-12 信息处理方法,信息处理设备和程序

Country Status (4)

Country Link
US (1) US20080140611A1 (zh)
EP (1) EP1933241A2 (zh)
JP (1) JP2008146483A (zh)
CN (1) CN101201846A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330091A (zh) * 2017-07-04 2017-11-07 百度在线网络技术(北京)有限公司 信息处理方法和装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8495735B1 (en) * 2008-12-30 2013-07-23 Uab Research Foundation System and method for conducting a non-exact matching analysis on a phishing website
US8468597B1 (en) * 2008-12-30 2013-06-18 Uab Research Foundation System and method for identifying a phishing website

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330091A (zh) * 2017-07-04 2017-11-07 百度在线网络技术(北京)有限公司 信息处理方法和装置
US11244153B2 (en) 2017-07-04 2022-02-08 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for processing information

Also Published As

Publication number Publication date
JP2008146483A (ja) 2008-06-26
US20080140611A1 (en) 2008-06-12
EP1933241A2 (en) 2008-06-18

Similar Documents

Publication Publication Date Title
US10908778B1 (en) Categorized and tagged video annotation
US9431057B2 (en) Media Production application
US8554640B1 (en) Content completion recommendations
US20090177301A1 (en) Scalable system and method for an integrated digital media catalog, management and reproduction system
US20050071736A1 (en) Comprehensive and intuitive media collection and management tool
US20070025701A1 (en) Information-processing apparatus, content reproduction apparatus, information-processing method, event-log creation method and computer programs
US20040059996A1 (en) Exhibition of digital media assets from a digital media asset management system to facilitate creative story generation
US20080313570A1 (en) Method and system for media landmark identification
US20050069225A1 (en) Binding interactive multichannel digital document system and authoring tool
US20080178068A1 (en) Automated creation of media asset illustrations
KR20080035617A (ko) 단일 액션 미디어 재생 리스트 생성
CN103631835A (zh) 兴趣点信息地图呈现系统及其方法
US20140372942A1 (en) Chronology providing method, chonology providing apparatus, and recording medium containing chronology providing program
JP2018517971A (ja) メディアファイルのためのブックマークを管理する技術
CN113395605B (zh) 视频笔记生成方法及装置
WO2014158199A1 (en) Method and system for creating and distributing financial application workflows
CN101201846A (zh) 信息处理方法,信息处理设备和程序
CN103593382A (zh) 信息处理设备、信息处理方法和程序
CN113518187A (zh) 视频编辑方法及设备
JP2005038404A (ja) データマッピング装置、データマッピング方法、およびプログラム
US9575614B1 (en) Integrated content display system and method
US20180081885A1 (en) Handoff support in asynchronous analysis tasks using knowledge transfer graphs
CN106489110B (zh) 用于非分层文件系统的图形化用户界面控制方法
CN101162552A (zh) 语言学习机的学习管理方法
WO2017103996A1 (ja) 生産計画立案装置、及び生産計画立案方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080618