CN1441930A

CN1441930A - 通过时间分片进行文本的自动化分类的系统和方法

Info

Publication number: CN1441930A
Application number: CN01802885A
Authority: CN
Inventors: T·E·麦吉; N·迪米特罗瓦
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2000-07-26
Filing date: 2001-07-09
Publication date: 2003-09-10
Also published as: JP2004505348A; EP1325431A2; WO2002008933A3; KR20020035153A; US6990496B1; WO2002008933A2

Abstract

公开了一种用于信息处理系统的自动分类文本的系统和方法。该系统包括文本分类器控制器，读取带有一个或多个包含在文本内的一个或多个故事段中的关键词的文本。文本分类器控制器标识每行中的关键词，并响应该标识一行文本中的至少一个关键词，将该行文本分类为该文本内的故事段的一部分。文本分类器控制器还标识文本内特定类别的关键词中的关键词的个数减少到低于阈值的关键词转换点。文本分类器控制器还标识文本内特定类别的关键词中的关键词的个数增加到高于阈值的关键词转换点。文本分类器控制器基于关键词转换点的位置分类故事段。

Description

通过时间分片进行文本的自动化分类的系统和方法

本发明总体涉及文本(text)自动化分类的系统和方法，更具体来说，涉及对在视频、音频和/或文本广播内出现的个别故事片断(storysegment)的文本进行自动化分类的系统和方法。个别故事片断的文本的分类，可以被用来将视频片断分类，以便以后能选择性地检索分类的视频片断。

存在用于标识和记录含有用户需要记录的主题的无线电或电视广播的片断的计算机化个人信息检索系统。所需要的片断一般根据用户输入的关键词来标识。在典型的应用中，计算机系统在后台运行，监视来自诸如因特网的源的信息的内容。内容选择是由用户所提供的关键词引导的。如果在关键词与所监视信息的内容之间发现匹配，就将该信息存储起来，供用户以后回放或观看。尽管下载的信息可能包含向也能被用户下载的音频或视频剪辑(clips)的链接，对要存储的信息的选择主要是根据用户所提供的关键词载广播材料中出现的频率。

允许用户选择和检索部分的无线电或电视节目供以后回放的计算机化个人信息检索系统，一般满足三个主要条件。第一，一般有某种系统和方法用于将输入的视频信号解析(parsing)成视频信号的可视成分、音频成分和文本成分。第二，一般有某种系统和方法用于针对用户输入的标准分析广播信号的音频和/或文本成分的内容并根据内容将各成分划分成片断。第三，一般有某种系统和方法用于整合和存储与用户的要求匹配的节目片断供用户以后回放。

美国专利申请“具有故事分段功能及其运行程序的多媒体计算机系统”描述了一种满足这些条件的系统，该申请的申请号是09/006,657，申请日1998年1月23日，发明人Dimitrova(本发明的共同发明人)。在本专利申请中特此全文引用美国专利申请号09/006,657作为参考。

美国专利申请号09/006,657描述的系统和方法，提供一组用于识别符号序列的模型，一个用于标识所需选择标准的匹配模型，以及一种用于根据选择标准选择和检索一个或多个视频故事片断或序列的方法论。

美国专利申请号09/006,657没有专门涉及当该将广播信息分段成独立的故事的方法主要专注于可视内容而不是以音频和文本分析加强的视频分段时所产生的问题。目前，当视频分段的故事被按照关键词分类时，分析根据的假设是，片断之内德国特定关键词的检测和所需频率，提供一种标志，即可以将整个片断按一个单一关键词集合来分类。实际上，特定关键词的出现频率随广播片断上的时间而变化的概率较高，即使在故事分段的视频标准得到满足时也如此。

因此，视频分段可能产生一个或多个有多个段落(section)内故事、并可按照一个单一关键词集合来分类的片断。被选择用来分类有多个故事的片断的结果关键词可能适合也可能不适合片断内的每个故事。

因此现有技术中需要一种用于标识和分断广播信息的改进的系统和方法。现有技术中特别需要一种用于根据关键词标识和分断广播信息的改进的系统和方法。更具体来说，现有技术中需要一种改进的系统和方法，用于对一段时间内在某广播文本内出现的各个故事片断的文本进行自动分类。

为解决以上讨论的现有技术的缺陷，本发明的一个主要目的是提供一种用于多媒体广播系统的改进的系统和方法，以按照一段时间的音频和/或文本内容自动分类多媒体信息。具体来说，本发明的一个主要目的是提供一种改进的系统和方法，用于分类视频片断，使得以后能有选择地检索这些视频片断。

本发明的系统包含一个文本分类器控制器，文本分类器控制器读取文本，文本有一个或多个关键词，包含在文本内的一个或多个故事片断内。文本分类器控制器标识每行内的关键词，并响应标识某文本行内的至少一个关键词，将该文本行分类为文本内一个故事片断的一部分。

文本分类器控制器标识文本中的关键词转换点，在此所检测到的属于某关键词类别的关键词的出现频率减少到某阀值数以下。文本分类器控制器也标识文本中的关键词转换点，在此所检测到的属于某关键词类别的关键词的出现频率增加到某阀值数以上。文本分类器控制器根据各关键词转换点的位置分类各故事片断。

本发明的一个目的是提供一种改进的系统和方法，用于读取文本的各行，以标识文本的各行内包含的关键词。

本发明的另一个目的是提供一种改进的系统和方法，用于将文本的每行分类为在在该文本行中有最大关键词数的关键词的类别中。

本发明的另一个目的是提供一种改进的系统和方法，用于通过标识和定位文本中的关键词转换点来分类文本中的故事片断。

本发明的另一个目的是提供一种改进的系统和方法，用于通过标识和定位文本中两个相邻的关键词转换点来分类文本中的故事片断。

本发明的另一个目的是提供一种改进的系统和方法，用于标识不到关键词转换点时分类文本中的故事片断。

以上泛泛地概括了本发明的特征和技术优点，以便本技术领域的熟练人员能更好地理解下面对本发明的详细说明。本发明的其它特点和优点将在以下构成本发明的权利要求的主题的部分作说明。本领域的熟练人员应当明白，他们可以随时用所披露的构思和特定实施例作为基础，修改或设计其它的结构来实现本发明的相同目的。本领域的熟练人员也应当认识到，这类等同的构造不偏离本发明的精神和范围。

在进行详细说明之前，最好陈述一下本专利文件自始至终使用的某些词语的定义：术语“包括”和“包含”以及它们的派生词，意思是没有限制的蕴含；术语“或”是蕴含性的，意思是和/或；短语“与…相关联的”和“与其相关联的”以及它们的派生短语，意思可以是包括、被包括在内、与…互连、含有、被包含在…内、与…连接、可与…通信、与…合作、交织、并置、接近于、固定于、具有、具有…的性质，等等。术语“控制器”意思是控制一个操作的任何装置、系统或其局部，这样一个装置可以以硬件、固件或软件、或它们中至少两种的某个组合来实现。应当注意，与任何控制器相关联的功能可以是集中的、分布的，无论是本地的还是远程的。本专利文件自始至终提供了对某些词语的定义，本领域的熟练人员应当明白，即便不在大多数情况下，在许多情况下，这种定义适用于这种定义的词语的现有用法和将来用法。

为了更彻底理解本发明及其优点，现在参看以下结合附图所作的说明。附图中相同的数字代表相同的对象，其中：

图1表示按照本发明的一个实施例的一个示例性多媒体计算机系统的高级框图；

图2表示按照本发明的一个实施例的一个示例性视频分段(segmentation)装置的高级框图；

图3表示按照本发明的一个实施例的一个示例性文本分类器(classifier)的高级框图；

图4表示的流程图表示本发明的一个算法的步骤，该步骤用于扫描文本片断中的每行文本，以计算该行文本内关键词的频率。

以下讨论的图1至图4以及用来说明本专利文件中的本发明的原理的各种实施例只是示例性的，不应解释为是对本发明范围的任何限值。本技术领域的熟练人员将明白，本发明的这些原理可以在任何适当安排的多媒体系统中实现。

图1表示按照本发明的一个实施例的一个示例性多媒体计算机系统105的高级框图100。多媒体计算机系统105包含视频故事分段装置110、存储装置120和显示装置130。按照一个实施例，视频故事分段装置110可以是电视机顶盒，存储装置120可以是盒式录像机(VCR)，显示装置130可以是电视机。

在另一个实施例中，多媒体计算机系统105可以是个有多媒体功能的计算机处理单元(CPU)，配备有电视调谐卡和读写光盘(CD-RW)驱动器。对这个实施例来说，CPU和电视调谐卡合起来构成视频故事分段装置110，CD-RW驱动器构成存储装置120，计算机显示器构成显示装置130。在另一个实施例中，可以用只读光盘(CD-ROM)驱动器、CD-RW驱动器或数字多用盘(DVD)驱动器中的一个，而不是用电视广播或有线系统，来提供多媒体视频输入信号。在另一个实施例中，与CPU相关联的硬驱可以起存储装置120的作用。其它配置也是可能的。例如，一个实施例可以包含一个内置于盒式录像机或CD-RW驱动器内的视频故事分段装置110。

术语“视频”可以与“多媒体”互换。无论哪一种情况下，输入信号都包含有同时的视频镜头(shot)、音频片断和文本片断(例如，闭合字幕文本(closed captioned text)、语音-文本转换、提取的视频文本)组成的一个时间序列。术语“文本”指的是节目材料的录制文本(transcript)。术语“文本”可包括但不限于视频文本的录制文本，音频文本的录制文本、、闭合字幕文本的录制文本以及文本的生成录制文本。

视频输入信号可以包括时间标记(marker)。或者，可以由视频故事分段装置110将时间标记插入视频输入。

术语“多媒体”信号表示一种具有一个视频成分和至少一个其它成分(例如音频成分)的信号。多媒体信号可以包含视频剪辑、视频流、视频位流、视频序列、数字视频信号、模拟视频信号、广播电视信号、以及类似的信号，不论信号是否是压缩的。尽管以下的讨论涉及的多媒体信号是数字信号，本发明并不仅仅限于数字化的视频或多媒体信号。

图2更详细地表示按照本发明的一个实施例的示例性视频分段装置110的高级框图200。视频分段装置110包含视频镜头分析装置210、音频分析装置220、文本分析装置230、时间提取(time extraction)电路260、带有关键词库245的有限自动机(FA-finite automaton)库240、时间模型识别装置250、带有文本分类器275的分类装置270，以及分类存储装置280。

FA库240和分类存储装置280可以在一个单一的存储器装置内。该单一的存储器装置可以是非易失性存储器，诸如硬驱、闪存或可编程只读存储器(PROM)。视频分段装置110中包含的装置可以是用于将通用计算机转换成多媒体计算机系统的软件模块，其中每一个模块驻留在程序存储器(例如存储介质)中，直到被系统中央处理单元(CPU)调用。现在按对应的软件模块给出对视频分段装置110中包含的各种装置的详细描述。

视频镜头分析装置210、音频分析装置220和文本分析装置230各自的作用是将它们的指定视频输入信号部分与信号的其它成分分离，并按需要将这些信号数字化，用于传输到事件模型识别装置250的适当部分。在一个有利的实施例中，视频镜头分析装置210、音频分析装置220和文本分析装置230之一(或它们的组合)可以包含一个为与各个基于视频、音频或文本的信号相关联的信号的频率特别配置的数字过滤器。或者，视频镜头分析装置210、音频分析装置220和文本分析装置230的一个或多个可以包含用于带有提取相关视频输入信号成分的内容的算法的软件。

视频镜头分析装置210检测视频剪辑(cuts)，以产生一序列的关键帧(key frames)和这些关键帧的时间戳，作为输出提供给事件模型识别装置250。类似地，音频分析装置220模拟一个语音识别系统，将所提取的音频信号分离成分立的片断类型，包括声音、音乐、笑声和静默。音频分析装置220分析所提取的声音信号，并根据这个分析检测和识别说话者。音频分析装置220把时间戳插入被提取的和被分类的音频数据。文本分析装置230解码与闭合字幕相关联的文本并与这个文本一起插入时间戳。

时间提取电路260提供一个时钟信号，用作视频故事分段装置110内所有装置的定时源。时间提取电路260提供与分开的可视、音频和文本信息一起插入的时间戳。时间戳被用于识别信号是在同时接收的还是在顺序时点接收的。

有限自动机(FA)库240为代表特定类型的可视、音频或文本模式有限自动机模型提供存储，用于分段和标记的目的。有限自动机(FA)的概念与编译器中所用的类似。FA根据可能的标签序列，用有节点的转换图来构造模型，节点之间有表示允许从一个节点向另一个节点转换的箭头。由沿着箭头从节点到节点穿过转换图的路径，构造出顺序过程的模型。每个路径对应于一系列沿该路径的连续节点的标签。

至于视频信号故事分段，FA的每个节点用一个表征正在被分析的信号的适当特征的符号标签代表一个事件。例如，库240可以存储代表一组关键帧、一组关键词、某时间间隔的音频特征名称、以及类似的视频、音频和文本数据的特征的标签。在选择图的某个路径的选择中，节点之间的每个转换，不仅根据特定标签(符号)的外表，也根据从视频输入信号中提取的代表文本、视频帧和音频片断的一组符号。由于使用FA，沿转换路径上的节点的标签为视频输入信号的各片断提供一个描述性的FA模型。

FA库240可以存储包含表示顺序的可视、音频和文本信号内的信号模式的预定模型的符号、节点和路径信息的FA数据。此外，FA库240可以为新的FA数据提供存储，新FA数据例如可以由事件模型识别装置250根据输入数据的特征而创建。

FA库240内的关键词库245可以为可用作标签并用于标识文本或数字化音频信号内的关键词的关键词提供存储。关键词库245可以提供预定一组关键词(默认关键词)，表示可能出现在被典型用户监视的节目片断的代表性的交叉部分(cross-section)的对话的类型，诸如与新闻节目相关的对话。例如，诸如“谋杀”、“偷窃”、“枪击”、“罪犯”等关键词可以表示有关犯罪的故事。类似地，诸如“参议院”、“众议院”、“华盛顿”、“参议院法案”、“众议院法案”和“立法”等关键词可以表示政治新闻故事。关键词库245也可以存储用户选择的关键词。

事件模型识别装置250按照事件提取电路将来自相应的视频镜头分析装置210、音频分析装置220和文本分析装置230的输入视频、音频和文本数据同步。事件模型识别装置250然后将同步过的输入数据与FA库240中的已知模型作比较。如果事件模型识别装置250不能从FA库240中找到一个与输入信号的有特定时间戳的片断相匹配的事件模型，事件模型识别装置250就创建一个对应于该片断的事件模型，并标记这个模型，然后将这个模型存储在FA库240中供将来使用。

在事件模型识别装置250用一个相关的FA匹配输入信号后，该FA的标签和描述该FA特征的关键词就可以传送到分类装置270用于故事分析。赋予新FA模型的标签可以由用户来指定，或者可以由多媒体计算机系统105用电子编程引导(EPG)信息来生成，或者可以由多媒体计算机系统105用随机标签生成器来生成。

分类装置270在考虑所确定的FA特征的情况下分析视频镜头内的关键帧(没有转换的帧)。利用FA特征和有名的关键帧标识算法，分类装置270将用于分段视频信号的视频镜头序列内的模式标识成一组或多组相关的序列，其中每个相关分组被称作一个故事。分类装置270随后按照与对话、新闻节目、体育、自然镜头相关联的特征模式和类似的模式分类适用的视频镜头。

分类装置270应用循环的过程，将相邻的视频镜头与当前的关键帧比较，以确定类似模式(例如FA)的存在。在这个稍后的处理期间或者在以后某个时间，分类装置270可以检索文本信息(例如闭合字幕)或者为进一步比较以及分段而转换成文本的音频信息。通过循环的比较过程，分类装置270最后组装一序列关键帧，关键帧带有如相关视频片断(例如故事)一样相关联的音频和文本。

在初始分类期间或者在存储之前，分类装置270可以进一步加工特定各类故事的故事分段。按照本发明的一个实施例，分类装置270可以将例如具有新闻分类的故事传送到示例性的文本分类器275作进一步分析。

文本分类器275包含检查故事片断以便按照关键词标识和分类故事片断的各部分的软件。带文本分类器275的视频故事分段装置110包含一个能执行本发明的文本分类器控制器。

文本分类器275检查故事片断，以便按照关键词标识和分类故事片断的各部分。如前文所述，每个从分类装置270接收的故事片断带有一个标志，表明关键词已经被确定，用于提供故事片断内主题类别的分类。文本分类器275接收所标识的关键词并在故事的每行文本中搜索关键词。文本分类器275计算每行文本中每个关键词出现的频率。文本分类器275然后根据所检测的关键词的出现频率分类每行文本。

文本分类器275就故事片断中文本行的数目和位置记录关于关键词的出现频率的统计数据。文本分类器275对所记录的统计数据应用一种搜索算法，以便检测文本中关键词的出现频率显著变化的可能关键词转换点。

例如，文本分类器275确定故事片断中1至6行被分类在犯罪故事类别中。1至6行每行含有至少一个犯罪故事类别中的关键词。文本分类器275也确定确定故事片断中7至15行被分类在体育故事类别中。7至15行每行含有至少一个体育故事类别中的关键词，但不含有犯罪故事类别中的关键词。文本分类器275在第6与第7行之间的“关键词转换点”识别到关键词类别的显著变化。

“关键词转换点”是两个相邻的文本部分之间的这样一个点，在关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率显著减少或减少到某阀值数以下。“关键词转换点”也可以是两个相邻的文本部分之间的这样一个点，在关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率显著增加或增加到某阀值数以下。阀值数可以选择是任何整数，并且可以选择低至整数1。

多数情况中，一个关键词转换点将标志一个故事结束另一个故事开始的边界。就是说，当在关键词转换点之前，在每行文本中检测到的属于第一关键词类别的关键词数减少到第一阀值数以下时，一般来说在每行文本中检测到的属于第二关键词类别的关键词数增加到第二类别的第二阀值数以上。属于第一关键词类别的关键词数的减少代表第一个故事的结束。属于第二关键词类别的关键词数的增加代表第二个故事的开始。

在有些情况中，文本分类器275将寻找这样一个关键词转换点，此点处属于第一关键词类别的关键词数有减少，但是属于任何其它可能的关键词类别的关键词数的没有增加。文本分类器275然后将该关键词转换点标记为第一个故事的结尾。关键词转换点之后的文本被临时地分类为“杂类文本”，直到文本分类器275获得足够的能为该杂类文本确定合适类别的其它信息。

可以用连续行阀值数来使确定关键词转换点的出错可能性最小化。例如，假设文本分类器275找到有被划分为属于体育类别的关键词的连续5行。然后，第6行有一个被划分为属于犯罪类别的关键词。然后，下5行有被划分为属于体育类别的关键词。可能在体育故事中用到了某个犯罪关键词。例如，体育撰稿人可能说过“裁判的决定抢劫了该队的胜利”。犯罪关键词“抢劫”在体育故事中的使用，使得出现该词的行被分类为体育故事。

在这种情况中，将连续行阀值数设置为至少为2，意味着必须至少连续两行中有被划分为属于犯罪类别的关键词，文本分类器275才考虑可能有个关键词转换点，存在于文本的体育故事部分与犯罪故事部分之间。

按照一个实施例，如果与故事分类相关联的关键词的出现频率是稳定的或上升的，文本分类器275将该部分文本分类为是由所检测的关键词适当分类的。

然而，当文本分类器275检测到这样一个关键词转换点，所检测的关键词的数目在此减少到某个阀值数以下，文本分类器275可能将该关键词转换点标识为一个故事的可能结尾和另一个故事的可能开始。文本分类器275然后标识一个以经过原始故事片断的结尾的可能关键词转换点为开始的新故事片断。从该可能关键词转换点到原始故事片断的结尾的故事片断被称作部分故事片断、

文本分类器275按照关键词的出现频率检查部分故事片断。按照一个有益的实施例，如果文本分类器275找到的关键词数不足以满足最低的阀值数，文本分类器275可以确定1)该部分故事片断是来自原始故事的过渡片断，2)根据该部分故事片断之后的数行，可以确定或不确定该部分故事片断依然要是原始故事的一部分。

按照另一个实施例，文本分类器275可以确定部分故事片断也有这样一个关键词转换点，在此检测到的与部分故事片断的当前这部分相关联的关键词的数目减少到某个阀值数以下。文本分类器275于是可以将部分故事片断的当前这部分分类为第二个故事。文本分类器275然后标识从关键词转换点开始至原始故事片断结尾的另一个可能的新故事片断。

按照另一个实施例，文本分类器275可以确定部分故事片断也有这样一个关键词转换点，在此检测到的不与部分故事片断的当前这部分相关联的关键词的数目增加到某个阀值数以上。文本分类器275于是可以将部分故事片断的当前这部分分类为第二个故事。文本分类器275然后标识从关键词转换点开始至原始故事片断结尾的另一个可能的新故事片断。

在文本分类器275完成就一个或多个关键词分类的类别对原始故事片断的检查并且不再发现另外的关键词转换点后，文本分类器275检查关键词分析的结果以及在各关键词分类检查之间过去的时间，以对原始故事片断内的各个故事的数目作出最后的确定。文本分类器275按照关键词分类将新的故事片断分组。文本分类器275然后开始用相同的程序处理下一个接收的故事片断。

在一个有益的实施例中，文本分类器275可以应用一个关键词算法，将一个故事的结束和另一个故事的开始标识为所指定关键词有一次出现的最后一个文本行。在另一个实施例中，文本分类器275可以应用算法来根据特定分类的片断的持续时间进一步分析故事片断。在选择的时间阀值内，文本分类器275然后可以将特定片断分类为是广告、公告、即将到来的新闻的嘲弄者(teaser)、或具有特定时间长度的类似类型的故事。

分类存储装置280存储来自分类装置270的分类的视频片断，用于立即或延迟地传送到存储这种120，并按用户的指定，最终由显示这种130显示。

图3表示按照本发明的一个实施例文本分类器275的操作的流程图300。在视频故事分段装置100的操作期间，文本分类器275从事件模型识别装置250和分类装置270接收一个分类的故事及其相关联的关键词列表(过程步骤305)。文本分类器275然后在故事中每一行文本搜索在关键词列表中包含的关键词。文本分类器275应用(图4中所示的)一个算法，来确定每行文本的关键词的出现频率。这个算法将在下文作更详细的描述。该算法根据在每个文本行中找到的关键词的数量来分类特定故事内的每行文本(过程步骤310)。

文本分类器275然后检查从搜索过程得出的关键词统计数据，以检测故事中的一个或多个关键词转换点。如前文所述，关键词转换点是关键词列表中的关键词的出现频率显著减少或减少到某个阀值数以下时的点(过程步骤315)。

如果在故事中检测到至少一个关键词转换点(过程步骤320)，文本分类器275按照关键词列表的类别，对具有最频繁出现的关键词列表中的关键词的故事片断部分分类，并暂时存储分类额定故事片断(过程步骤330)。

在文本分类器275分类并暂时存储故事的第一部分(过程步骤330)之后，文本分类器275使分类装置270将原始故事的其余部分传送到事件模型识别装置250，用于确定一个表征作为一个故事的其余故事部分的新的关键词列表(过程步骤335)。

文本分类器275监视事件模型识别装置250的状态，直到有关键词列表可用于其余故事部分(过程步骤340)。文本分类器275然后如前所述那样地再次开始下一个分类过程，从事件模型识别装置250和分类装置270接收具有相关的关键词列表的故事部分(过程步骤305)。

所述过程一直继续到文本分类器275在被分类的故事片断内检测不到关键词转换点(文本分类器275已经在此检测到文本的结束)(过程步骤320)。当检测不到关键词转换点时(并且检测到文本的结尾)(过程步骤320)，文本分类器275将正在处理的故事部分及其关键词列表与任何其它故事部分和它们的关键词列表组合起来，生成一个集成的故事和关键词列表。文本分类器275然后将生成的故事部分和关键词列表传送到分类存储装置280(过程步骤325)。视频分段装置110然后继续其正常操作。

图4表示的流程图400表示一个算法的操作，该算法用于如过程步骤310中所示那样搜索每行文本。准备一个大小为N×J的计算机存储位置阵列来接收关于在文本中检测到的关键词的身份(identity)和位置的信息。该N×J阵列的名称为Hit Counter(N，J)(命中计数器(N，J))。字母N表示一行文本的号码，字母J表示关键词列表中某关键词的号码。在算法的开始，Hit Counter(N，J)中每个存储位置被设定为等于零(过程步骤405)。

准备一个大小为N×M的计算机存储位置阵列来接收N行文本，每行文本长度不超过M个字符。N是个顺序地指向文本中每行的整数下标。指向一行文本的变量的名称是Line(N)(行(N))。当N等于1(N＝1)时，line(N)指向文本中的第1行。当N等于2(N＝2)时，line(N)指向文本中的第2行，依此类推。

在文本的每个line(N)中，line(N)中的各个单词(word)被顺序地标识为Word(I)(单词(I))。I是个顺序地指向文本的Line(N)中的每个单词的整数下标。就是说，当I等于1(I＝1)时，Word(I)指向Line(N)中的第1个单词。当I等于2(I＝2)时，Word(I)指向line(N)中的第2个单词，依此类推。

准备一个大小为J×K的计算机存储位置阵列来接收J个关键词，阵列中的每个关键词的长度不超过K个字符。关键词列表驻留在该J×K的计算机存储位置阵列中。J是个顺序地指向关键词列表中每个关键词的整数下标。指向一个关键词的变量的名称是Keyword(J)(关键词(J))。当J等于1(J＝1)时，Keyword(I)指向关键词列表中的第1个关键词，依此类推。

将数N设置为等于一(1)，使Line(N)指向文本的第1行(过程步骤405)。将数I设置为等于一(1)，使Word(I)指向Line(N)中的第1个单词(过程步骤405)。将数J设置为等于一(1)，使Keyword(J)指向关键词列表中的第1个关键词(过程步骤405)。

然后将Line(N)中的文本收取(retrieve)到计算机存储器中(过程步骤410)。然后将line(N)中的第1个单词Word(I)收取到计算机存储器中(过程步骤415)。然后将Keyword(J)收取到计算机存储器中(过程步骤410)。然后对Word(I)是否等于Keyword(J)作出确定(判定步骤425)。

如果Word(I)不等于Keyword(J)，则对Keyword(J)是否是关键词列表中的最后一个关键词作出确定(判定步骤430)。如果Keyword(J)不是关键词列表中的最后一个关键词，则将J的整数值递增1，将Keyword(J)指向关键词列表中下一个关键词(过程步骤435)。将关键词列表中该下一个关键词收取到计算机存储器中(过程步骤420)。控制然后传到判定步骤425作进一步处理。

当判定步骤425发现Word(I)等于Keyword(J)时，则将HitCounter(N，J)中的相应阵列位置递增，以记录Keyword(J)在Line(N)中的一个“命中”(过程步骤440)。控制然后传到判定步骤445，以判定Word(I)是否是Line(N)中的最后一个单词。当判定特定Keyword(J)是关键词列表中的最后一个关键词时，控制也从判定步骤430传到判定步骤445。

如果Word(I)不是Line(N)中的最后一个单词，则将指数值I递增1，使Word(I)指向Line(N)中的下一个单词(过程步骤450)。此外，将J设定为等于1，使Keyword(J)指向关键词列表中的第一个关键词(过程步骤450)。控制然后传到过程步骤415，以取得Line(N)中的下一个Word(I)去作进一步处理。

如果Word(I)是Line(N)中的最后一个单词，则将Line(N)分类在在Hit Counter(N，J)中有最大数量的关键词检测(或命中)的类别中。如果Line(N)是文本中的最后一行，流程图400中所述的算法就结束，程序的控制然后传到过程步骤315。如果Line(N)不是文本中的最后一行，则将指数值N递增1，使Line(N)指向文本的下一行(过程步骤470)。此外，将I设定为等于1，是Word(I)指向Line(N)中的第一个单词(过程步骤465)。控制然后传到过程步骤410，以取得文本的下一个Line(N)去作进一步处理。

尽管所选择的单词经常出现在故事片断的最近的部分，这却不是总是这样。按照在故事片断的后部、中部或其它部分出现的关键词来对原始故事片断分类是可能的。应当明白，文本分类器275包含这样的算法，它们能标识和隔离原始片断内的故事，而不管这些故事在原始片断内的位置。还应当明白，与视频故事分段装置110相联系的文本分类器275能隔离原始片断内的其余故事，而不管出现这些其余故事的时间间隔。

在另一个实施例中，文本分类器275可以与初始视频和音频算法一起使用。在这个实施例中，文本分类器275与分类装置270的其它部分合作，可以按照根据关键词在一段时间或在数行文本内出现的频率来分类故事的关键词算法，随着片断的出现而分类片断。在这个实施例中，文本分类器275也可以重新检查相邻的故事片断，以确定可能存在与当前正在被分类的片断相关联的文本行。

在另一个实施例中，FA库240和事件模型识别装置250可以在视频故事分段装置110内工作，以仅仅根据视频输入信号的音频和视频成分(而不是使用视频输入信号的文本成分)来分离和标识故事片断。音频成分可以被转换成文本，以分离和标识故事片断，但是不用直接来自文本分析装置230(例如闭合字幕文本、语音-文本转换、被提取的视频文本)的文本来分离和标识故事片断。

分类装置270接收每个生成的故事片断及其相关联的文本。相关联的文本可以包括从直接来自文本分析装置230的音频和文本转换的文本。文本分类器275然后进一步根据关键词库245中的关键词来分割故事片断。文本分类器275执行如图4中所示那样的逐行分析。当文本的每行被分类时，文本分类器1275检测关键词转换点，并根据为特定片断生成的关键词列表将故事片断的各部分分类。文本分类器275然后将生成的故事片断及其相关联的关键词列表传送到分类存储装置280。

尽管详细地描述了本发明，本技术领域的熟练人员应当明白，可以作出各种改变、替代和修改，而不偏离本发明的精神和范围。

Claims

1.一种在信息处理系统(105)中使用的用于自动分类文本的装置，包含：

一个文本分类器控制器(110，275)，能够读取文本，文本有至少一个关键词，包含在所述文本内的至少一个故事片断内；并且能标识所述文本的每行内的关键词，并响应标识某文本行内的所述关键词的至少一个，分类所述文本行为所述文本内所述至少一个故事片断的一部分。

2.权利要求1中所述的装置，其中，所述文本分类器控制器(110，275)能够顺序地比较文本的第一和第二行，以比较对文本的每个第一行检测的关键词数与对文本的每个第二行检测的关键词数，并能够标识文本的两个相邻部分之间的关键词转换点，在所述关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率减少到某阀值数以下。

3.权利要求2中所述的装置，其中，当所述文本分类器控制器(110，275)标识到某第一个关键词转换点时，所述文本分类器控制器(110，275)能够将在文本的开始与某第一个关键词转换点之间的文本分类为文本的一个故事片断。

4.权利要求2中所述的装置，其中，当所述文本分类器控制器(110，275)标识到某第一个关键词转换点和某第二个关键词转换点时，所述文本分类器控制器(110，275)能够将在某第一个关键词转换点和某第二个关键词转换点之间的文本分类为文本的一个故事片断。

5.权利要求1中所述的装置，其中，所述文本分类器控制器(110，275)能够顺序地比较文本的第一和第二行，以比较对文本的每个第一行检测的关键词数与对文本的每个第二行检测的关键词数，并能够标识文本的两个相邻部分之间的关键词转换点，在所述关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率增加到某阀值数以上。

6.权利要求1中所述的装置，其中，所述文本分类器控制器(110，275)包含一个算法，用于读取各行文本，以标识所述各行文本内含有的关键词，其中所述算法将每个文本行分类在在所述文本行中有最大关键词数的关键词类别中。

7.一种类型是包含视频故事分段装置(110)、关键词库(245)和分类装置(270)的信息处理系统(105)，其中所述信息处理系统(105)包含：

8.权利要求7中所述的信息处理系统(105)，其中，所述文本分类器控制器(110，275)能够顺序地比较文本的第一和第二行，以比较对文本的每个第一行检测的关键词数与对文本的每个第二行检测的关键词数，并能够标识文本的两个相邻部分之间的关键词转换点，在所述关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率减少到某阀值数以下。

9.权利要求8中所述的信息处理系统(105)，其中，当所述文本分类器控制器(110，275)标识到某第一个关键词转换点时，所述文本分类器控制器(110，275)能够将在文本的开始与某第一个关键词转换点之间的文本分类为文本的一个故事片断。

10.权利要求8中所述的信息处理系统(105)，其中，当所述文本分类器控制器(110，275)标识到某第一个关键词转换点和某第二个关键词转换点时，所述文本分类器控制器(110，275)能够将在某第一个关键词转换点和某第二个关键词转换点之间的文本分类为文本的一个故事片断。

11.权利要求7中所述的信息处理系统(105)，其中，所述文本分类器控制器(110，275)能够顺序地比较文本的第一和第二行，以比较对文本的每个第一行检测的关键词数与对文本的每个第二行检测的关键词数，并能够标识文本的两个相邻部分之间的关键词转换点，在所述关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率增加到某阀值数以上。

12.权利要求7中所述的信息处理系统(105)，其中，所述文本分类器控制器(110，275)包含一个算法，用于读取各行文本，以标识所述各行文本内含有的关键词，其中所述算法将每个文本行分类在在所述文本行中有最大关键词数的关键词类别中。

13.一种在信息处理系统(105)中使用的自动分类文本的方法，包含以下步骤：

读取文本，文本有至少一个关键词，包含在所述文本内的至少一个故事片断内；

标识所述文本的每行内的关键词；和

响应标识某文本行内的所述关键词的至少一个，分类所述文本行为所述文本内所述至少一个故事片断的一部分。

14.权利要求13中所述的方法，进一步包含下述步骤：

顺序地比较文本的第一和第二行，以比较对文本的每个第一行检测的关键词数与对文本的每个第二行检测的关键词数；和

标识文本的两个相邻部分之间的关键词转换点，在所述关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率减少到某阀值数以下。

15.权利要求14中所述的方法，进一步包含下述步骤：

当所述文本分类器控制器(110，275)标识到某第一个关键词转换点时，将在文本的开始与某第一个关键词转换点之间的文本分类为文本的一个故事片断。

16.权利要求14中所述的方法，进一步包含下述步骤：

当所述文本分类器控制器(110，275)标识到某第一个关键词转换点和某第二个关键词转换点时，将在某第一个关键词转换点和某第二个关键词转换点之间的文本分类为文本的一个故事片断。

17.权利要求13中所述的方法，进一步包含下述步骤：

标识文本的两个相邻部分之间的关键词转换点，在所述关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率增加到某阀值数以上。

18.权利要求13中所述的方法，进一步包含下述步骤：

顺序地比较文本的第一和第二行，以比较对文本的每个第一行检测的关键词数与对文本的每个第二行检测的关键词数；

标识文本中在文本的相邻部分之间的多个关键词转换点，在所述关键词转换点之前，在每行文本中检测到的属于某关键词类别的关键词的出现频率减少到某阀值数以下；和

将在所述多个关键词转换点的两个相邻的关键词转换点之间的文本分类为文本的一个故事片断。

19.在计算机化信息处理系统(105)中使用的、存储在计算机可读介质(120)上的用于自动分类文本的计算机可读指令，计算机可读指令包含以下步骤：

标识所述文本的每行内的关键词；和

20.权利要求19中所述的存储在计算机可读介质(120)上的用于自动分类文本的计算机可读指令，计算机可读指令进一步包含以下步骤：

21.权利要求20中所述的存储在计算机可读介质(120)上的用于自动分类文本的计算机可读指令，计算机可读指令进一步包含以下步骤：

22.权利要求20中所述的存储在计算机可读介质(120)上的用于自动分类文本的计算机可读指令，计算机可读指令进一步包含以下步骤：

23.权利要求19中所述的存储在计算机可读介质(120)上的用于自动分类文本的计算机可读指令，计算机可读指令进一步包含以下步骤：

24.权利要求19中所述的存储在计算机可读介质(120)上的用于自动分类文本的计算机可读指令，计算机可读指令进一步包含以下步骤：