CN101446947A

CN101446947A - 摘要生成装置以及方法

Info

Publication number: CN101446947A
Application number: CNA2008101495148A
Authority: CN
Inventors: 樱田孔司
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2007-11-30
Filing date: 2008-09-10
Publication date: 2009-06-03
Also published as: JP2009135754A

Abstract

本发明提供一种摘要生成装置和方法，能够与节目种类无关地针对内容抽出适当的要点部分。其特征是，检测出关于1个节目的内容数据的节目分类，设定表示与该检测节目分类对应的内容数据的解析项目及其判定条件的分类特性，按照时间系列顺序抽出内容数据中的符合设定分类特性的部分。

Description

摘要生成装置以及方法

技术领域

本发明涉及生成由广播节目等内容的要点部分构成的摘要(概要)的摘要生成装置以及方法。

背景技术

作为以往的摘要生成装置，有利用节目的元数据(Meta Data)，来缩短视听时间的装置，其抽出被输入或检测出的元数据中的适合用户的喜好的内容的片段，把该内容片段解释为要点，并进行再生(参照专利文献1)。通过进行元数据与用户喜好数据的匹配来进行该片段的抽出。根据该方法，只要是属于特定节目种类的内容，便能够根据用户的喜好，抽出适当的场景，进行短时间再生的要点视听。

[专利文献1]日本特开2007-208651号公报

但是，在上述以往的摘要生成装置中，存在着不能对于各种各样的节目种类的内容，视听适当的要点部分的问题。即，一般视听者的喜好针对每个节目种类而不同，因此，由于不能唯一地确定用户喜好数据，所以，在以往的摘要生成装置中，存在着只能对特定种类的内容抽出适当的要点片段的问题。

发明内容

因此，本发明的目的是，提供一种能够与节目种类无关地从内容中抽出适当的要点部分的摘要生成装置以及方法。

本发明的摘要生成装置，其特征在于，是用于生成关于1个节目的内容摘要数据的摘要生成装置，具有：存储单元，其储存关于上述1个节目的内容数据；分类检测单元，其检测出上述内容数据的节目分类；设定单元，其设定分类特性，且该分类特性表示与由上述分类检测单元检测出的节目分类对应的上述内容数据的解析项目及其判定条件；和抽出单元，其按照时间系列顺序抽出上述内容数据中的符合由上述设定单元设定的分类特性的部分，并把其作为上述摘要数据。

本发明的摘要生成方法，其特征在于，是用于生成关于1个节目的内容摘要数据的摘要生成方法，检测出关于上述1个节目的内容数据的节目分类，设定表示与该检测出的节目分类对应的上述内容数据的解析项目及其判定条件的分类特性，按照时间系列顺序抽出上述内容数据中的符合已设定的分类特性的部分，并把其作为上述摘要数据。

根据这样的本发明的摘要生成装置以及方法，由于检测出内容数据的节目分类，设定表示与该节目分类对应的内容数据的解析项目及其判定条件的分类特性，按照时间系列顺序抽出内容数据中的符合分类特性的部分，所以，能够与节目种类无关地针对内容抽出适当的要点部分。

附图说明

图1是表示应用了本发明的摘要生成装置的内容视听装置的方框图。

图2是表示图1的装置中的解析规则判定部和数据解析部的动作的流程图。

图3是表示单词表、每个节目分类的评价值、以及足球的分类特性的图。

图4是表示足球以及棒球的加权值数据表的图。

图5是用于说明解析结果数据、重要度以及摘要数据的图。

图6是表示图1的装置中的内容选择部的动作的流程图。

图中：1-内容输入部；3-解析规则判定部；4-数据解析部；6-内容选择部；7-内容再生部；8-影像音响监视器。

具体实施方式

下面，参照附图，对本发明的实施例进行详细说明。

图1表示应用了本发明的摘要生成装置的内容视听装置的方框结构。该内容视听装置具有内容输入部1、数据分离部2、解析规则判定部3、数据解析部4、内容存储部5、内容选择部6、内容再生部7、和影像音响监视器8。

内容输入部1例如由接收电路构成，其从外部网络输入内容数据，并把该输入内容数据输出到数据分离部2和内容存储部5。

数据分离部2输入由内容输入部1提供来的内容数据，把内容数据中的节目元数据输出到解析规则判定部3，把内容数据中的影像数据、音响数据、以及字幕数据输出到数据解析部4。

解析规则判定部3输入从数据分离部2提供来的节目元数据，把解析规则数据输出到数据解析部4。

数据解析部4从解析规则判定部3输入解析规则数据，从数据分离部2输入影像数据、音响数据、字幕数据，把解析结果数据输出到内容存储部5。

内容存储部5从内容输入部1进行输入内容数据的输入，从数据解析部4输入解析结果数据，把解析结果数据和内容数据输出到内容选择部6。

内容选择部6从内容存储部5输入解析结果数据和内容数据，根据解析结果数据选择性地把内容数据输出到内容再生部7。

内容再生部7再生来自内容选择部6的内容数据，把其作为影像信号和声音信号，输出到影像音响监视器8。影像音响监视器8，在被提供了影像信号和声音信号后，根据影像信号显示再生影像，根据声音信号输出声音。

在本实施例中，内容数据由上述的影像数据、音响数据、字幕数据、以及节目元数据构成。包含在文件等数据单位的内容数据中的影像数据、音响数据、以及字幕数据共同构成1个节目，并相互构成时间同步。节目元数据是，在内容数据中以文本形式表示关于该1个节目的详细信息的信息，其中包括节目种类、标题、演出者、播放时间、节目内容等信息。另外，影像数据、音响数据等数据除了是被数字化的数据以外，也可以是被实施了压缩处理的压缩形式的数据，内容再生部7采用能够对应这些数据形式进行再生的结构。

下面，对具有这样的结构的内容视听装置的动作进行说明。

当内容数据从外部网络被输入到内容输入部1时，该输入内容数据被输出到数据分离部2和内容存储部5。

数据分离部2把输入内容数据分离成4种数据，即，影像数据、音响数据、字幕数据、以及节目元数据，并输出。影像数据、音响数据、以及字幕数据被提供给数据解析部4，节目元数据被提供给解析规则判定部3。

解析规则判定部3，若从数据分离部2提供来节目元数据，则为了生成适合节目的解析结果数据，如图2所示那样，通过进行(1)节目元数据的单词检测；(2)节目分类的解析；(3)解析规则的决定的3阶段的动作，求出解析规则数据，并把其输出到数据解析部4。

下面，结合图3的解析规则判定部3的动作说明图，对上述3个阶段的动作进行说明。

(1)节目元数据的单词检测

解析规则判定部3保持有如在节目元数据中包含的那样的单词列表，检测在所输入的节目元数据中，是否包含有列表的多个单词中的任意的单词(步骤S11)。图3中(a)表示该单词列表的一部分，在图3中(a)的例中，表示从输入节目元数据中检测出“运动”、“足球”、“日本”这样的3个单词。

(2)节目分类的解析

解析规则判定部3具有按照每个节目分类对上述单词表的多个单词分别决定了整数的加权值后的加权值数据表。对于肯定含义的单词分配正的加权值，肯定性越大，值越向正侧变大。另一方面，对于否定含义的单词分配负的加权值，否定性越大，值越向负侧变大。在加权值数据表中，例如，在“足球”和“棒球”的各个情况下，对于单词表的多个单词的各个单词，如图4所示那样设定加权值。解析规则判定部3计算出通过对每个节目分类进行上述(1)的单词检测动作而检测出的单词的加权值的合计值，把其作为评价值(步骤S21)，把该评价值为最大值的分类作为解析结果检测出来(步骤S22)。在图3中(b)的例中，与“运动”、“足球”、“日本”这样的节目元数据中的3个单词对应，在“足球”的节目分类中得到最大评价值。此外，本实施例中所说的“分类”表示比“种类”窄的的分类。

(3)解析规则的决定

解析规则判定部3针对每个节目分类，作为数据保持有解析规则，并且把与通过上述(2)的节目分类解析动作所决定的节目分类对应的解析规则，作为解析规则数据输出(步骤S31)。解析规则数据由解析项目列表、和与各个解析项目对应的分类特性构成。解析项目表示对于从影像数据、音响数据、字幕数据的各个数据中，检测出属于节目分类的内容的要点部分来说有效的解析项目。另外，分类特性表示在该片段中解析项目应该如何存在的判定条件。在图3中(c)的例中，对应“足球”的节目分类，定义“音量”、“球门”、“剪辑长度”、“移动”等解析项目，并且，把音量大、存在球门这样的关键词、剪辑长度短且连续、移动激烈的时间区间设定为足球节目的要点片段，把这些信息决定为解析规则数据。解析规则判定部3的判定结果，即解析规则数据，被提供给数据解析部4。

数据解析部4根据从解析规则判定部3提供来的解析规则数据，分别解析影像数据、音响数据、和字幕数据，输出包含解析规则数据的解析结果数据。解析结果数据是对于解析规则数据中包含的解析项目，显示与分类特性对应的部分的时间系列数据。关于该数据的计测，可运用以往公知的任意的方法。即，对解析规则数据所示的每个解析项目，从影像数据、音响数据、和字幕数据中的至少1种数据中，检测出满足分类特性的判定条件的部分(步骤S41)，并且，通过把满足部分的匹配程度数值化，生成时间系列的解析结果数据(步骤S42)。匹配程度越高，设定越大的值。

例如，如果是图3中(c)的例，则虽然“音量”、“球门”、“剪辑长度”、“移动”这4个解析项目成为对象，但作为一例，可通过解析音响数据来获得“音量”。检测出音响数据中的规定电平以上的大音量部分，并且把该检测出的部分作为匹配程度，分成高中低3个等级。另外，对于“球门”的检测，可使用从字幕数据中检测出“球门”的关键词的方法、从音响数据中检测出“球门”的声音的方法、和从影像数据中检测出“球门”的字符图形的方法中的至少一种方法。“剪辑长度”可通过检测出影像数据在时间上的不连续点(场景切换)，计测相邻的不连续点之间(场景)的长度，来获得。“移动”，可通过计测影像数据的相邻帧之间的移动量来获得，该分类特性是，移动量在规定量以上。

图5中(a)是说明与图3中(c)的例对应的解析结果数据的图。在图5中(a)中，示意地表现“音量”、“球门”、“剪辑长度”、“移动”各自的时间系列解析结果数据。在图5中(a)中，涂黑的部分表示解析项目的计测结果与分类特性的匹配性最高的区间，白的部分表示没有匹配性的区间，网线部分和斜线部分表示其中间的区间。在全部4个解析项目中用黑表示的区间，表示在“音量”、“球门”、“剪辑长度”、“移动”中的任何一个的点中，是特征性的片段(例如，球门场景等)的可能性高的情况。作为数值化的值，例如，涂黑的部分为3、网线部分为2、斜线部分为1、白的部分为0。

在获得了解析结果数据后，把该解析结果数据提供给内容存储部5。在内容存储部5中，把包含解析规则数据的解析结果数据与输入内容数据一同保存(步骤S51)。

在视听被保存在内容存储部5中的内容的要点时，用户例如通过未图示的操作部进行规定的操作。内容选择部6响应该操作，开始进行内容选择动作。在内容选择动作中，如图6所示，首先，内容选择部6从内容存储部5输入包含解析规则数据的解析结果数据(步骤S61)，对解析结果数据所表示的分类特性各自的数值总和按照时间系列顺序进行计算，并把其作为重要度(步骤S62)。而且，抽出重要度在规定值以上的部分的内容数据，把其组合成1个摘要数据(步骤S63)。

下面，结合图5中(b)和(c)，说明与图3中(c)的分类特性的例对应的要点视听的动作。解析项目的解析结果数据与分类特性匹配的区域，例如，在音量大、存在球门的关键词、剪辑长度短且连续，移动剧烈的时间区域中，由于各自的解析项目的解析结果数据与分类特性匹配，所以，重要度表示高的数值。图中，用黑表示的区间和网线区间表示重要度在规定值以上的情况，网线区间所示的区间表示仅次于黑的区间的重要度高的情况。通过抽出重要度在规定值以上的内容数据(影像数据、音响数据、和字幕数据)的部分，可如图5中(c)所示那样获得摘要数据。

内容选择部6在进行重要度为规定值以上的部分的内容数据的抽出时，也可以改变规定值，以使该抽出部分的合计再生时间为规定的时间长度。也可以构成为能够由用户通过进行操作部的操作来指定规定的时间长度。

由内容选择部6生成的摘要数据，即内容数据，被提供给影像音响再生部7，再生来自内容选择部6的内容数据。根据内容数据中的影像数据生成影像信号，另外，根据音响数据生成声音信号，该影像信号和声音信号被输出到影像音响监视器8。

由此，用户能够通过影像音响监视器8进行根据节目分类对输入内容数据优化后的要点部分的视听，并且能够缩短视听时间。

这样，在上述的实施例中，由于使用与内容的节目分类对应的解析规则进行内容的时间系列解析，所以，可以实现对于各种各样的节目种类(分类)的内容数据的适当的要点部分的视听。

在上述的实施例中，对内容选择部6根据解析结果数据再生要点部分的影像的情况进行了说明，但内容选择部6的动作不限于此。例如，作为内容选择部6的其他动作，也可以根据解析结果数据抽出各个要点的片段，以能够进行针对各个片段的前头的跳跃再生的方式，在画面上显示各个片段的前头影像，通过用户的影像选择，再生从该时刻起的影像。由此，用户可缩短视听时间。

在上述的实施例中，说明了数据分离部2从内容数据中抽出节目元数据的情况，但也可以利用其他单元抽出该节目元数据。例如，作为数据分离部2的动作，实施通过网络取得与该内容相关的元数据的动作、用户通过手动操作输入元数据的动作，也可以获得与上述的实施例相同的效果。

在上述的实施例中，说明了内容数据通过网络输入的情况，但内容数据的输入方式不限于网络，可利用电波、存储介质等任意方式。另外，内容数据不限于包含影像数据的情况，即使是只有音响数据的节目，也可以获得与上述实施例相同的效果。

在上述的实施例中，说明了抽出并保存所输入的内容数据的解析结果数据，并且根据该解析结果数据进行输入内容数据的要点部分的视听的情况，但也可以只保存输入内容数据的要点部分，即摘要数据。另外，对于该摘要数据存储，也可以保存在容易携带的可移动硬盘等记录介质中。

另外，在上述的实施例中，虽然是输入并保存1个节目的内容数据，但也可以输入并保存多个节目的各自的内容数据，从该保存的多个节目内容数据中选择任意1个节目的内容数据，生成该选择内容数据的摘要数据。

Claims

1.一种摘要生成装置，其特征在于，用于生成关于1个节目的内容摘要数据，具有：

存储单元，其储存关于上述1个节目的内容数据；

分类检测单元，其检测出上述内容数据的节目分类；

设定单元，其设定分类特性，且该分类特性表示与由上述分类检测单元检测出的节目分类对应的上述内容数据的解析项目及其判定条件；和

抽出单元，其按照时间系列顺序抽出上述内容数据中的符合由上述设定单元设定的分类特性的部分，并把其作为上述摘要数据。

2.根据权利要求1所述的摘要生成装置，其特征在于，

上述内容数据包含用文本表示节目内容的节目元数据，

上述分类检测单元把上述节目元数据所表示的单词与包含预定的多个单词的单词表进行比较，根据其比较结果，检测上述内容数据的节目分类。

3.根据权利要求2所述的摘要生成装置，其特征在于，

上述分离检测单元具有：

单词检测单元，其检测出上述单词表的多个单词中的上述节目元数据所表示的单词；

保持单元，其把在预定的多个节目分类的每个中对上述多个单词的各个单词分配的加权值，作成加权值数据表保持；

计算单元，其使用上述加权值数据表，对上述多个节目分类的每个分类，取得与由上述单词检测单元检测出的单词对应的加权值，并把该加权值的合计值作为评价值计算出来；和

把由上述计算单元对上述多个节目分类的每个分类计算出的评价值中的成为最大值的评价值的节目分类，作为上述内容数据的节目分类的单元。

4.根据权利要求1所述的摘要生成装置，其特征在于，

上述设定单元具有保持分类特性的保持单元，且该分类特性表示关于预定的多个节目分类的每个分类的上述内容数据的每个解析项目的判定条件，

从上述保持单元取得与由上述分类检测单元检测出的节目分类对应的分类特性，并把其提供给上述抽出单元。

5.根据权利要求1或4所述的摘要生成装置，其特征在于，

上述抽出单元以时间系列解析构成上述内容数据的影像数据、音响数据、以及字幕数据中的至少1种以上的数据，并抽出符合由上述设定单元所设定的分类特性的部分。

6.一种摘要生成方法，其特征在于，用于生成关于1个节目的内容摘要数据，

检测出关于上述1个节目的内容数据的节目分类，

设定表示与该检测出的节目分类对应的上述内容数据的解析项目及其判定条件的分类特性，

按照时间系列顺序抽出上述内容数据中的符合已设定的分类特性的部分，并把其作为上述摘要数据。