CN113807085A - 一种针对新闻场景的标题字幕提取方法 - Google Patents
一种针对新闻场景的标题字幕提取方法 Download PDFInfo
- Publication number
- CN113807085A CN113807085A CN202111372664.7A CN202111372664A CN113807085A CN 113807085 A CN113807085 A CN 113807085A CN 202111372664 A CN202111372664 A CN 202111372664A CN 113807085 A CN113807085 A CN 113807085A
- Authority
- CN
- China
- Prior art keywords
- text
- caption
- texts
- content
- news
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种针对新闻场景的标题字幕提取方法,包括步骤:S1,提取待处理新闻视频中的文本并进行位置编码和内容编码;S2,基于所述位置编码和内容编码对文本进行预处理;S3,构建一致性约束并从预处理后的文本中选出部分文本作为标题字幕的候选文本;S4,对所述标题字幕的候选文本进行视觉特征和语义特征提取并将两者融合,得到文本融合特征;S5,基于所述文本融合特征,使用聚类算法对标题字幕的候选文本进行聚类,从而得到标题字幕集合;S6,对所述标题字幕集合进行后处理;本发明可用于不同的新闻栏目,可有效地提升新闻视频的编辑效率,减少人工成本。
Description
技术领域
本发明涉及电视新闻制作领域,涉及图像处理和分析,更为具体的,涉及一种针对新闻场景的标题字幕提取方法。
背景技术
随着网络技术的发展,数字视频的普及,融媒体的兴起,视频数据的处理和分析技术变得越来越重要。
在新闻视频中,每个新闻事件展开前会有相应的标题字幕的展示,该标题字幕对整个新闻事件进行了概括,通过标题人们可以大致了解事件的内容。同时,标题字幕的内容通常非常生动形象,从而提升观众对新闻事件的兴趣。因此对新闻视频中的标题字幕进行提取,可形成对新闻视频的概括。
在电视新闻制作中,有时希望对一档新闻进行拆条,即从整档新闻视频中将每个独立的新闻事件拆分出来。在这个过程中,标题字幕可以提供很强的先验信息,通过标题字幕进行初步的切分后可显著地减少所需的工作量。
由于电视新闻制作过程中有大量的素材,若通过人工的方式对标题字幕进行提取需要很高的人力成本。因此,提供一种针对电视新闻制作过程中的标题字幕提取方法,可以大大节省人力成本。
发明内容
本发明的目的在于克服现有技术的不足,提供一种针对新闻场景的标题字幕提取方法,可用于不同的新闻栏目,可有效地提升新闻视频的编辑效率,减少人工成本等。
本发明的目的是通过以下方案实现的:
一种针对新闻场景的标题字幕提取方法,包括步骤:
S1,提取待处理新闻视频中的文本并进行位置编码和内容编码;
S2,基于所述位置编码和内容编码对文本进行预处理;
S3,构建一致性约束并从预处理后的文本中选出部分文本作为标题字幕的候选文本;
S4,对所述标题字幕的候选文本进行视觉特征和语义特征提取并将两者融合,得到文本融合特征;
S5,基于所述文本融合特征,使用聚类算法对标题字幕的候选文本进行聚类,从而得到标题字幕集合;
S6,对所述标题字幕集合进行后处理。
进一步地,步骤S1中,所述位置编码包括子步骤:使用文本检测算法对视频进行处理,检测各帧画面中的文本内容的文本位置,检测到的文本位置作为对应画面的文本位置编码:所述内容编码包括子步骤:使用文本识别算法对各帧画面中的文本位置的图像进行识别,识别出的文本内容作为文本内容编码。
进一步地,步骤S2中,所述预处理包括基于位置编码将相邻文本重新合成一条文本;和/或,所述预处理包括设定阈值去掉同帧中字号较标题字幕小的文本。
进一步地,步骤S3中包括子步骤:基于标题字幕出现在视频中时位置固定、内容固定、持续时间较长的特性构建一致性约束,通过构建的一致性约束过滤掉非标题字幕的文本,过滤掉非标题字幕文本后得到剩余的文本作为标题字幕的候选文本。
进一步地,步骤S4中,对所述候选文本进行视觉特征和语义特征提取包括子步骤:基于所述候选文本的位置编码信息,从视频中获取包含该标题字幕的候选文本的图像,使用图像分类模型对文本图像进行视觉特征提取;同时,使用语言模型对所述候选文本的内容进行语义特征提取。
进一步地,步骤S5中,所述聚类包括聚为两类;并在聚为两类后,包括子步骤:分别计算两类的类内距离,取类内距离小的一类作为标题字幕所在类别即得到所述标题字幕集合。
进一步地,步骤S6中,所述后处理包括子步骤:基于标题字幕的先验信息,对所述标题字幕集合进行过滤处理。
进一步地,在识别出文本位置编码和文本内容编码后,包括子步骤:。
进一步地,所述构建一致性约束,通过构建的一致性约束过滤掉非标题字幕的文本包括子步骤:
S31,基于位置编码和内容编码信息,对矩形框左上角相同位置、连续出现的文本进行合并,得到一个包含文起止时间点、位置编码集合、内容编码集合的文本集合;
S32,在步骤S31的基础上,若SS中存在某文本内容,其出现次数与文本总条数m的比例大于设定值k,则视为满足内容一致性。
本发明的有益效果是:
本发明针对新闻视频场景,提供一种通用的新闻视频标题提取的解决方案。通过对新闻视频中标题字幕的通用特征进行分析,构建了一致性约束,该一致性约束适用于不同新闻栏目,保证了本发明的通用性。使用视觉特征和语义特征对标题候选文本进行表征,并进一步地通过无监督的方法提升了对标题字幕提取的准确性。综上,本发明可用于不同的新闻栏目,可有效地提升新闻视频的编辑效率,减少人工成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的整体流程图;
图2为本发明实施例中基于文本的位置和内容编码进行预处理的流程图;
图3为本发明实施例中一致性约束的流程图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
本发明实施例中,包含图1~图3。
实施例1:如图1所示,一种针对新闻场景的标题字幕提取方法,
一种针对新闻场景的标题字幕提取方法,包括步骤:
S1,提取待处理新闻视频中的文本并进行位置编码和内容编码;
S2,基于位置编码和内容编码对文本进行预处理;
S3,构建一致性约束并从预处理后的文本中选出部分文本作为标题字幕的候选文本;
S4,对标题字幕的候选文本进行视觉特征和语义特征提取并将两者融合,得到文本融合特征;
S5,基于文本融合特征,使用聚类算法对标题字幕的候选文本进行聚类,从而得到标题字幕集合;
S6,对标题字幕集合进行后处理。
在实施例1具体应用时,通过对新闻视频中标题字幕的通用特征进行分析,构建了一致性约束,该一致性约束适用于不同新闻栏目,保证了本实施例的通用性。使用视觉特征和语义特征对标题候选文本进行表征,并进一步地通过无监督的方法提升了对标题字幕提取的准确性。综上,本实施例可用于不同的新闻栏目,可有效地提升新闻视频的编辑效率,减少人工成本。
实施例2:在实施例1的基础上,举例说明:步骤S1中,具体包括子步骤:
在本实施例中,可选的,包括子步骤:
实施例3:在实施例1的基础上,举例说明:步骤S2中,如图2所示,具体包括子步骤:
步骤201:由于文本检测模块可能将本该连在一起的文本检测为两条文本,因此需要基于位置编码对横向相邻的文本进行合并。具体的,针对第i帧,基于文本位置编码信息,依次对其中文本矩形框进行同行判断。在两个矩形框同行的条件下,若两矩形框边界相距小于较小矩形框高度一半,则合并两个矩形框。
由于标题字幕为同一帧画面中字号较大的文本,因此去掉文本矩形框高度小于t的文本。
实施例4:在实施例1的基础上,举例说明:步骤S3中,如图3所示,具体包括子步骤:
步骤301:基于标题字幕出现在视频中时位置固定、内容固定、持续时间较长的特性,构建一致性约束。具体的,基于位置编码和内容编码信息,对矩形框左上角相同位置、连续出现的文本进行合并,最终得到一个文本集合的起止时间点、位置编码集合、内容编码集合。具体的,该文本集合可表示为TS:
步骤302:在步骤301的基础上,若文本内容SS中存在某文本内容,其出现次数与文本总条数m的比例大于k,则视为满足内容一致性,具体的,k可以取0.8,可将对应TS记为标题字幕的候选文本集合CT:
实施例5:在实施例4的基础上,举例说明:步骤S4中,包括子步骤:
步骤401:针对步骤302中每个标题字幕的候选文本,基于候选文本的位置编码信息,从视频画面中获取包含候选标题的图像。
步骤402:使用在ImageNet图像分类数据集上训练得到的模型Resnet50对步骤401中的包含候选标题的图像进行视觉特征提取:
步骤403:使用预训练的语言模型Bert对文本内容进行语义特征提取:
步骤404:将视觉特征与语义特征结合,作为该文本的融合特征,具体的可朴素地将视觉特征和语义特征进行拼接:
实施例6:在实施例5的基础上,包括子步骤:
步骤501:基于步骤404中所得的融合特征F,使用层次聚类算法将步骤302所述标题字幕的候选文本集合聚为两类。具体地,由于标题字幕的视觉特征和语义特征都应很相近,因此分别计算两类的类内距离d:
其中N为类中样本个数;F代表融合特征。
步骤502:取类内距离小的一类作为标题字幕所在类别,从而得到该视频中标题字幕的集合。
本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,在一台计算机设备(可以是个人计算机,服务器,或者网络设备等)以及相应的软件中执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、或者光盘等各种可以存储程序代码的介质,进行测试或者实际的数据在程序实现中存在于只读存储器(Random Access Memory,RAM)、随机存取存储器(Random Access Memory,RAM)等。
Claims (9)
1.一种针对新闻场景的标题字幕提取方法,其特征在于,包括步骤:
S1,提取待处理新闻视频中的文本并进行位置编码和内容编码;
S2,基于所述位置编码和内容编码对文本进行预处理;
S3,构建一致性约束并从预处理后的文本中选出部分文本作为标题字幕的候选文本;
S4,对所述标题字幕的候选文本进行视觉特征和语义特征提取并将两者融合,得到文本融合特征;
S5,基于所述文本融合特征,使用聚类算法对标题字幕的候选文本进行聚类,从而得到标题字幕集合;
S6,对所述标题字幕集合进行后处理。
2.根据权利要求1所述的针对新闻场景的标题字幕提取方法,其特征在于,步骤S1中,所述位置编码包括子步骤:使用文本检测算法对视频进行处理,检测各帧画面中的文本内容的文本位置,检测到的文本位置作为对应画面的文本位置编码:所述内容编码包括子步骤:使用文本识别算法对各帧画面中的文本位置的图像进行识别,识别出的文本内容作为文本内容编码。
3.根据权利要求1所述的针对新闻场景的标题字幕提取方法,其特征在于,步骤S2中,所述预处理包括基于位置编码将相邻文本重新合成一条文本;和/或,所述预处理包括设定阈值去掉同帧中字号较标题字幕小的文本。
4.根据权利要求1所述的针对新闻场景的标题字幕提取方法,其特征在于,步骤S3中包括子步骤:基于标题字幕出现在视频中时位置固定、内容固定、持续时间较长的特性构建一致性约束,通过构建的一致性约束过滤掉非标题字幕的文本,过滤掉非标题字幕文本后得到剩余的文本作为标题字幕的候选文本。
5.根据权利要求1所述的针对新闻场景的标题字幕提取方法,其特征在于,步骤S4中,对所述候选文本进行视觉特征和语义特征提取包括子步骤:基于所述候选文本的位置编码信息,从视频中获取包含该标题字幕的候选文本的图像,使用图像分类模型对文本图像进行视觉特征提取;同时,使用语言模型对所述候选文本的内容进行语义特征提取。
6.根据权利要求1所述的针对新闻场景的标题字幕提取方法,其特征在于,步骤S5中,所述聚类包括聚为两类;并在聚为两类后,包括子步骤:分别计算两类的类内距离,取类内距离小的一类作为标题字幕所在类别即得到所述标题字幕集合。
7.根据权利要求1所述的针对新闻场景的标题字幕提取方法,其特征在于,步骤S6中,所述后处理包括子步骤:基于标题字幕的先验信息,对所述标题字幕集合进行过滤处理。
8.根据权利要求2所述的针对新闻场景的标题字幕提取方法,其特征在于,在识别出文本位置编码和文本内容编码后,包括子步骤:将新闻视频中各视频帧的编号及其中包含的文本位置编码和文本内容编码按设定格式存放。
9.根据权利要求4所述的针对新闻场景的标题字幕提取方法,其特征在于,所述构建一致性约束,通过构建的一致性约束过滤掉非标题字幕的文本包括子步骤:
S31,基于位置编码和内容编码信息,对矩形框左上角相同位置、连续出现的文本进行合并,得到一个包含文起止时间点、位置编码集合、内容编码集合的文本集合;
S32,在步骤S31的基础上,若SS中存在某文本内容,其出现次数与文本总条数m的比例大于设定值k,则视为满足内容一致性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111372664.7A CN113807085B (zh) | 2021-11-19 | 2021-11-19 | 一种针对新闻场景的标题字幕提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111372664.7A CN113807085B (zh) | 2021-11-19 | 2021-11-19 | 一种针对新闻场景的标题字幕提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113807085A true CN113807085A (zh) | 2021-12-17 |
CN113807085B CN113807085B (zh) | 2022-03-04 |
Family
ID=78938460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111372664.7A Active CN113807085B (zh) | 2021-11-19 | 2021-11-19 | 一种针对新闻场景的标题字幕提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807085B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102331990A (zh) * | 2010-12-22 | 2012-01-25 | 四川大学 | 一种基于字幕提取的新闻视频检索方法 |
CN102915438A (zh) * | 2012-08-21 | 2013-02-06 | 北京捷成世纪科技股份有限公司 | 一种视频字幕的提取方法及装置 |
WO2015165524A1 (en) * | 2014-04-30 | 2015-11-05 | Longsand Limited | Extracting text from video |
WO2017033083A1 (en) * | 2015-08-24 | 2017-03-02 | Google Inc. | Video recommendation based on video titles |
US20170235820A1 (en) * | 2016-01-29 | 2017-08-17 | Jack G. Conrad | System and engine for seeded clustering of news events |
US20180143980A1 (en) * | 2016-11-22 | 2018-05-24 | Facebook, Inc. | Generating News Headlines on Online Social Networks |
CN108093314A (zh) * | 2017-12-19 | 2018-05-29 | 北京奇艺世纪科技有限公司 | 一种视频新闻拆分方法及装置 |
CN108256508A (zh) * | 2018-02-28 | 2018-07-06 | 北京奇艺世纪科技有限公司 | 一种新闻主副标题检测方法及装置 |
CN108388872A (zh) * | 2018-02-28 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 一种基于字体颜色的新闻标题识别方法及装置 |
CN108446603A (zh) * | 2018-02-28 | 2018-08-24 | 北京奇艺世纪科技有限公司 | 一种新闻标题检测方法及装置 |
CN108734166A (zh) * | 2018-05-23 | 2018-11-02 | 深圳市茁壮网络股份有限公司 | 一种新闻标题检测方法及装置 |
CN111401368A (zh) * | 2020-03-24 | 2020-07-10 | 武汉大学 | 一种基于深度学习的新闻视频标题提取方法 |
CN111581510A (zh) * | 2020-05-07 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 分享内容处理方法、装置、计算机设备和存储介质 |
CN111709324A (zh) * | 2020-05-29 | 2020-09-25 | 中山大学 | 一种基于时空一致性的新闻视频拆条方法 |
CN111931775A (zh) * | 2020-09-28 | 2020-11-13 | 成都索贝数码科技股份有限公司 | 自动获取新闻标题方法、系统、计算机设备及存储介质 |
CN112633241A (zh) * | 2020-12-31 | 2021-04-09 | 中山大学 | 一种基于多特征融合和随机森林模型的新闻故事分割方法 |
CN112818984A (zh) * | 2021-01-27 | 2021-05-18 | 北京奇艺世纪科技有限公司 | 标题生成方法、装置、电子设备和存储介质 |
-
2021
- 2021-11-19 CN CN202111372664.7A patent/CN113807085B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102331990A (zh) * | 2010-12-22 | 2012-01-25 | 四川大学 | 一种基于字幕提取的新闻视频检索方法 |
CN102915438A (zh) * | 2012-08-21 | 2013-02-06 | 北京捷成世纪科技股份有限公司 | 一种视频字幕的提取方法及装置 |
WO2015165524A1 (en) * | 2014-04-30 | 2015-11-05 | Longsand Limited | Extracting text from video |
WO2017033083A1 (en) * | 2015-08-24 | 2017-03-02 | Google Inc. | Video recommendation based on video titles |
US20170235820A1 (en) * | 2016-01-29 | 2017-08-17 | Jack G. Conrad | System and engine for seeded clustering of news events |
US20180143980A1 (en) * | 2016-11-22 | 2018-05-24 | Facebook, Inc. | Generating News Headlines on Online Social Networks |
CN108093314A (zh) * | 2017-12-19 | 2018-05-29 | 北京奇艺世纪科技有限公司 | 一种视频新闻拆分方法及装置 |
CN108256508A (zh) * | 2018-02-28 | 2018-07-06 | 北京奇艺世纪科技有限公司 | 一种新闻主副标题检测方法及装置 |
CN108388872A (zh) * | 2018-02-28 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 一种基于字体颜色的新闻标题识别方法及装置 |
CN108446603A (zh) * | 2018-02-28 | 2018-08-24 | 北京奇艺世纪科技有限公司 | 一种新闻标题检测方法及装置 |
CN108734166A (zh) * | 2018-05-23 | 2018-11-02 | 深圳市茁壮网络股份有限公司 | 一种新闻标题检测方法及装置 |
CN111401368A (zh) * | 2020-03-24 | 2020-07-10 | 武汉大学 | 一种基于深度学习的新闻视频标题提取方法 |
CN111581510A (zh) * | 2020-05-07 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 分享内容处理方法、装置、计算机设备和存储介质 |
CN111709324A (zh) * | 2020-05-29 | 2020-09-25 | 中山大学 | 一种基于时空一致性的新闻视频拆条方法 |
CN111931775A (zh) * | 2020-09-28 | 2020-11-13 | 成都索贝数码科技股份有限公司 | 自动获取新闻标题方法、系统、计算机设备及存储介质 |
CN112633241A (zh) * | 2020-12-31 | 2021-04-09 | 中山大学 | 一种基于多特征融合和随机森林模型的新闻故事分割方法 |
CN112818984A (zh) * | 2021-01-27 | 2021-05-18 | 北京奇艺世纪科技有限公司 | 标题生成方法、装置、电子设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
刘海涛 等: "一种快速新闻视频标题字幕探测与定位方法", 《计算机应用研究》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113807085B (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100828166B1 (ko) | 동영상의 음성 인식과 자막 인식을 통한 메타데이터 추출방법, 메타데이터를 이용한 동영상 탐색 방법 및 이를기록한 기록매체 | |
Lyu et al. | A comprehensive method for multilingual video text detection, localization, and extraction | |
CN111931775B (zh) | 自动获取新闻标题方法、系统、计算机设备及存储介质 | |
EP2034426A1 (en) | Moving image analyzing, method and system | |
Yang et al. | Automatic lecture video indexing using video OCR technology | |
Shivakumara et al. | An efficient edge based technique for text detection in video frames | |
CN113052169A (zh) | 视频字幕识别方法、装置、介质及电子设备 | |
Dumont et al. | Automatic story segmentation for tv news video using multiple modalities | |
Kuwano et al. | Telop-on-demand: Video structuring and retrieval based on text recognition | |
CN111401368B (zh) | 一种基于深度学习的新闻视频标题提取方法 | |
US20150356353A1 (en) | Method for identifying objects in an audiovisual document and corresponding device | |
Wang et al. | Synchronization of lecture videos and electronic slides by video text analysis | |
CN113435438B (zh) | 一种图像和字幕融合的视频报幕板提取及视频切分方法 | |
KR20050087987A (ko) | 앵커 샷 결정방법 및 결정장치. | |
CN113807085B (zh) | 一种针对新闻场景的标题字幕提取方法 | |
CN111709324A (zh) | 一种基于时空一致性的新闻视频拆条方法 | |
Yang et al. | Caption detection and text recognition in news video | |
Zhang et al. | Accurate overlay text extraction for digital video analysis | |
Dimitrova et al. | MPEG-7 Videotext description scheme for superimposed text in images and video | |
KR100404322B1 (ko) | 멀티모달 특징 기반의 뉴스 비디오 요약 방법 | |
Rozsa et al. | TV News Database Indexing System with Video Structure Analysis, Representative Images Extractions and OCR for News Titles | |
Cózar et al. | Detection of logos in low quality videos | |
Al-Asadi et al. | Arabic-text extraction from video images | |
Bertini et al. | Content based annotation and retrieval of news videos | |
Haloi et al. | News video indexing and story unit segmentation using text cue |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |