CN112905843A

CN112905843A - 一种基于视频流的信息处理方法、装置以及存储介质

Info

Publication number: CN112905843A
Application number: CN202110285364.9A
Authority: CN
Inventors: 张轶君; 朱玉荣
Original assignee: Beijing Wenxiang Information Technology Co ltd
Current assignee: Beijing Wenxiang Information Technology Co ltd
Priority date: 2021-03-17
Filing date: 2021-03-17
Publication date: 2021-06-04
Anticipated expiration: 2041-03-17
Also published as: CN112905843B

Abstract

本申请公开了一种基于视频流的信息处理方法、装置以及存储介质，对从视频流中抓取得到的图像帧进行文字检测。在检测到图像帧的预设标注区域内存在文字的情况下，将图像帧标记为备选图像。对获取到的各个备选图像的文字集合进行比对，得到冗余图像，其中，文字集合基于对备选图像进行文字识别得到。删除冗余图像，并依据图像帧被抓取时所对应的时间戳由早到晚的顺序，对剩余的各个备选图像进行排列，得到图文材料。可见，利用本申请所述方法，能够从视频流中有效提取用户所需的图文材料。此外，删除冗余图像，能够提高图文材料的简洁性，剩余的各个备选图像依据时间戳由早到晚的顺序排列，还原视频中图文材料的浏览顺序，从而提高使用体验。

Description

一种基于视频流的信息处理方法、装置以及存储介质

技术领域

本申请涉及数据处理技术领域，尤其涉及一种基于视频流的信息处理方法、装置以及存储介质。

背景技术

随着互联网的快速发展，视频会议、以及视频课程等视频应用越来越流行。随着视频会议、以及视频课程的增多，很多人通过视频学习和传递工作内容。但是视频信息的特点是大容量和冗余，并且必须在显示设备上播放。这使其不如文字和图片资料那样适合人反复学习。因为文字和图片的信息量更大，也方便打印成纸质资料，翻阅资料比播放视频更便捷和低能耗。另外，很多视频学习资料或会议视频并没有匹配的文字内容，因为视频中可能没有使用ppt文档等电子资料，而是采用板书手写的方式展现。其中，教学视频、以及培训视频通常会采用图文材料(例如，ppt文档、word文档、以及手写板书等)，结合讲授者的语音信息进行教学和培训活动。在大多数情况下，用户只能下载视频，但无法获取视频中所使用的图文材料。

目前，还没有看到将视频转化为图文材料的技术。为了提高教学视频的学习效率，现有技术大多是对视频进行精确索引，切片等方式。而精简的视频与图文材料相比，仍然有数据量大，内容冗余度高，需要设备播放等问题，不适合多次、方便的反复浏览。

为此，如何从视频流中提取用户所需的图文材料，成为本领域亟需解决的问题。

发明内容

本申请提供了一种基于视频流的信息处理方法、装置以及存储介质，目的在于提取视频中所使用的图文材料。

为了实现上述目的，本申请提供了以下技术方案：

一种基于视频流的信息处理方法，包括：

对从视频流中抓取得到的图像帧进行文字检测；

在检测到所述图像帧的预设标注区域内存在文字的情况下，将所述图像帧标记为备选图像；

对获取到的各个所述备选图像的文字集合进行比对，得到冗余图像；其中，所述文字集合基于对所述备选图像进行文字识别得到；

删除所述冗余图像；

依据所述图像帧被抓取时所对应的时间戳由早到晚的顺序，对剩余的各个所述备选图像进行排列，得到图文材料。

可选的，所述对从视频流中抓取得到的图像帧进行文字检测，包括：

依据预设间隔时间，从预先加载的视频流中抓取第n图像帧；其中，n为正整数；

对所述第n图像帧进行文字检测，判断所述第n图像帧的预设标注区域内是否存在文字；

在所述第n图像帧的预设标注区域内不存在所述文字的情况下，删除所述第n图像帧。

可选的，所述对获取到的各个所述备选图像的文字集合进行比对，得到冗余图像之前，还包括：

预先将第n次抓取到的图像帧对应的备选图像，标记为第n备选图像；其中，n为正整数；

判断预设的图像队列中是否包含有图像；

在所述图像队列中不包含有所述图像的情况下，将所述第n备选图像插入到所述图像队列中；

在所述图像队列中包含有所述图像的情况下，将位于所述图像队列中第一序位的图像作为目标图像；

判断所述第n备选图像的文字集合是否包含所述目标图像的文字集合；

在所述第n备选图像的文字集合包含所述目标图像的文字集合的情况下，利用所述第n备选图像替代所述目标图像；

所述对获取到的各个所述备选图像的文字集合进行比对，得到冗余图像，包括：

对所述图像队列中所包含的各个图像的文字集合进行比对，得到所述冗余图像。

可选的，还包括：

在所述第n备选图像的文字集合不包含所述目标图像的文字集合的情况下，判断所述目标图像的文字集合是否包含所述第n备选图像的文字集合；

在所述目标图像的文字集合包含所述第n备选图像的文字集合的情况下，删除所述第n备选图像。

可选的，还包括：

在所述目标图像的文字集合不包含所述第n备选图像的文字集合的情况下，将所述第n备选图像插入到所述图像队列中的第一序位，并将所述目标图像在所述图像队列中所处的序位往后推移。

可选的，还包括：

计算所述第n备选图像与所述目标图像的像素差值；

在所述像素差值不大于预设阈值的情况下，删除所述第n备选图像。

可选的，所述对获取到的各个所述备选图像的文字集合进行比对，得到冗余图像，包括：

判断第一图像的文字集合与第二图像的文字集合之间是否存在包含关系；其中，所述第一图像和所述第二图像均为所述备选图像；

在所述第一图像的文字集合与所述第二图像的文字集合之间存在包含关系的情况下，计算所述第一图像和所述第二图像的像素差值；

在所述像素差值不大于预设阈值的情况下，判断所述第一图像的文字集合是否包含所述第二图像的文字集合；

在所述第一图像的文字集合包含所述第二图像的文字集合的情况下，将所述第二图像作为冗余图像；

在所述第一图像的文字集合不包含所述第二图像的文字集合的情况下，判断所述第二图像的文字集合是否包含所述第一图像的文字集合；

在所述第二图像的文字集合包含所述第一图像文字集合的情况下，将所述第一图像作为冗余图像。

一种基于视频流的信息处理装置，包括：

检测单元，用于对从视频流中抓取得到的图像帧进行文字检测；

标记单元，用于在检测到所述图像帧的预设标注区域内存在文字的情况下，将所述图像帧标记为备选图像；

比对单元，用于对获取到的各个所述备选图像的文字集合进行比对，得到冗余图像；其中，所述文字集合基于对所述备选图像进行文字识别得到；

删除单元，用于删除所述冗余图像；

排列单元，用于依据所述图像帧被抓取时所对应的时间戳由早到晚的顺序，对剩余的各个所述备选图像进行排列，得到图文材料。

可选的，所述检测单元具体用于：

依据预设间隔时间，从预先加载的视频流中抓取第n图像帧；其中，n为正整数；对所述第n图像帧进行文字检测，判断所述第n图像帧的预设标注区域内是否存在文字；在所述第n图像帧的预设标注区域内不存在所述文字的情况下，删除所述第n图像帧。

可选的，还包括：

筛选单元，用于预先将第n次抓取到的图像帧对应的备选图像，标记为第n备选图像；其中，n为正整数；判断预设的图像队列中是否包含有图像；在所述图像队列中不包含有所述图像的情况下，将所述第n备选图像插入到所述图像队列中；在所述图像队列中包含有所述图像的情况下，将位于所述图像队列中第一序位的图像作为目标图像；判断所述第n备选图像的文字集合是否包含所述目标图像的文字集合；在所述第n备选图像的文字集合包含所述目标图像的文字集合的情况下，利用所述第n备选图像替代所述目标图像；

所述比对单元，还用于对所述图像队列中所包含的各个图像的文字集合进行比对，得到所述冗余图像。

可选的，所述筛选单元还用于：

在所述第n备选图像的文字集合不包含所述目标图像的文字集合的情况下，判断所述目标图像的文字集合是否包含所述第n备选图像的文字集合；在所述目标图像的文字集合包含所述第n备选图像的文字集合的情况下，删除所述第n备选图像。

可选的，所述筛选单元还用于：

计算所述第n备选图像与所述目标图像的像素差值；在所述像素差值不大于预设阈值的情况下，删除所述第n备选图像。

可选的，所述比对单元具体用于：

判断第一图像的文字集合与第二图像的文字集合之间是否存在包含关系；其中，所述第一图像和所述第二图像均为所述备选图像；在所述第一图像的文字集合与所述第二图像的文字集合之间存在包含关系的情况下，计算所述第一图像和所述第二图像的像素差值；在所述像素差值不大于预设阈值的情况下，判断所述第一图像的文字集合是否包含所述第二图像的文字集合；在所述第一图像的文字集合包含所述第二图像的文字集合的情况下，将所述第二图像作为冗余图像；在所述第一图像的文字集合不包含所述第二图像的文字集合的情况下，判断所述第二图像的文字集合是否包含所述第一图像的文字集合；在所述第二图像的文字集合包含所述第一图像文字集合的情况下，将所述第一图像作为冗余图像。

一种计算机可读存储介质，所述计算机可读存储介质包括存储的程序，其中，所述程序执行所述的基于视频流的信息处理方法。

一种基于视频流的信息处理设备，包括：处理器、存储器和总线；所述处理器与所述存储器通过所述总线连接；

所述存储器用于存储程序，所述处理器用于运行程序，其中，所述程序运行时执行所述的基于视频流的信息处理方法。

本申请提供的技术方案，对从视频流中抓取得到的图像帧进行文字检测；在检测到图像帧的预设标注区域内存在文字的情况下，将图像帧标记为备选图像。对获取到的各个备选图像的文字集合进行比对，得到冗余图像，其中，文字集合基于对备选图像进行文字识别得到。删除冗余图像，并依据图像帧被抓取时所对应的时间戳由早到晚的顺序，对剩余的各个备选图像进行排列，得到图文材料。可见，利用本申请所述方法，能够从视频流中有效提取用户所需的图文材料。此外，删除冗余图像，能够提高图文材料的简洁性，由于剩余的各个备选图像依据时间戳由早到晚的顺序排列，还原了视频中所示图文材料的浏览顺序，从而提高了使用体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于视频流的信息处理方法的示意图；

图2为本申请实施例提供的另一种基于视频流的信息处理方法的示意图；

图3为本申请实施例提供的又一种基于视频流的信息处理方法的示意图；

图4为本申请实施例提供的一种基于视频流的信息处理装置的架构示意图；

图5为本申请实施例提供的一种基于视频流的信息处理设备的架构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

如图1所示，为本申请实施例提供的一种基于视频流的信息处理方法的示意图，包括如下步骤：

S101：依据预设间隔时间，从预先加载的视频流中抓取图像帧，并将第n次抓取的图像帧标识为第n图像帧。

其中，从视频流中抓取图像帧的具体实现方式，为本领域技术人员所熟悉的公知常识，具体的，每间隔3秒，对处于加载状态的视频流进行一次图像帧抓取，得到一个图像帧，按照抓取时间由早到晚的顺序，对抓取到的各个图像帧进行标识，第1次抓取的图像帧标识为第1图像帧，第2次抓取的图像帧标识为第2图像帧，以此类推，将第n次抓取的图像帧标识为第n图像帧，直至视频流加载结束。在本申请实施例中，n为正整数。

S102：对第n图像帧进行文字检测，判断第n图像帧的预设标注区域内是否存在文字。

若第n图像帧的预设标注区域内存在文字，则执行S103，否则执行S104。

其中，文字检测的具体实现方式，为本领域技术人员所熟悉的公知常识，这里不再赘述。

S103：将第n图像帧标记为第n备选图像。

在执行S103之后，继续执行S105。

S104：删除第n图像帧。

其中，若第n图像帧的预设标注区域内不存在文字，则确定第n图像帧不属于图文材料(例如，教学视频中位于画面中间的黑板为预设标注区域，黑板中不存在文字的话，证明当前还没进行图文材料的展示)，属于无效图像，应将无效的图像予以删除，从而避免无效的操作，并确保后续提取的图文材料都是有效的。

S105：判断预设的图像队列中是否包含有图像。

若预设的图像队列中包含有图像，则执行S106，否则执行S107。

S106：将位于图像队列中第一序位的图像作为目标图像。

在执行S106之后，继续执行S108。

S107：将第n备选图像插入到图像队列中，并对第n备选图像进行文字识别，获得第n备选图像的文字集合。

其中，文字识别的具体实现方式，为本领域技术人员所熟悉的公知常识，例如采用公开的OCR文字识别技术。

S108：计算第n备选图像与目标图像的像素差值，并判断像素差值是否大于预设阈值。

若像素差值大于预设阈值，则确定目标图像与第n备选图像不相同，并执行S109。若像素差值不大于预设阈值，则确定目标图像与第n备选图像相同，并执行S110。

其中，计算第n备选图像与目标图像的像素差值的具体实现过程包括：

1、对第n备选图像进行灰度转换，得到第一灰度图，并对目标图像进行灰度转换，得到第二灰度图。

需要说明的是，灰度转换的具体实现方式，为本领域技术人员所熟悉的公知常识，这里不再赘述。

2、对第一灰度图和第二灰度图进行逐点差值，得到差值图。

3、采用阈值法对差值图进行二值化处理，得到二值图像。

需要说明的是，利用阈值法对差值图进行二值化处理的过程，为本领域技术人员所熟悉的公知常识，具体的，遍历差值图中的各个像素点，将灰度值大于预设数值的像素点的取值设为1，将灰度值不大于预设数值的像素点的取值设为0。

4、统计二值图像中取值非零的像素点的个数，得到第n备选图像与目标图像的像素差值。

需要说明的是，二值图像中取值非零的像素点的个数，实质就是第n备选图像与目标图像的像素差值。

S109：判断第n备选图像的文字集合是否包含目标图像的文字集合。

若第n备选图像的文字集合包含所述目标图像的文字集合，则执行S111，否则执行S112。

需要说明的是，目标图像的文字集合基于对目标图像进行文字识别所得到。

S110：删除第n备选图像。

其中，删除第n备选图像，能够预先去除冗余图像，节省计算资源。

S111：利用第n备选图像替代目标图像。

S112：判断目标图像的文字集合是否包含第n备选图像的文字集合。

若目标图像的文字集合包含第n备选图像的文字集合，则执行S113，否则执行S114。

S113：删除第n备选图像。

S114：将第n备选图像插入到图像队列中的第一序位，并将目标图像在图像队列中所处的序位往后推移。

S115：在视频流加载结束的情况下，对图像队列中所包含的各个图像的文字集合进行比对，得到图像队列的冗余图像。

可选的，对图像队列中所包含的各个图像的文字集合进行比对，得到图像队列的冗余图像的具体实现过程，包括：

1、判断第一图像的文字集合与第二图像的文字集合之间是否存在包含关系，其中，第一图像和第二图像均为图像队列中所包含的图像，图像队列中所包含的图像的文字集合，基于对图像进行文字识别所得到。

需要说明的是，所谓的包含关系，是指：第一图像的文字集合包含第二图像的文字集合、或者第二图像的文字集合包含第一图像的文字集合。

2、在第一图像的文字集合与第二图像的文字集合之间存在包含关系的情况下，计算第一图像和第二图像的像素差值。

3、在第一图像的文字集合与第二图像的文字集合之间不存在包含关系的情况下，保留第一图像和第二图像。

4、判断第一图像和第二图像的像素差值是否大于预设阈值。

5、在像素差值大于预设阈值的情况下，保留第一图像和第二图像。

6、在像素差值不大于预设阈值的情况下，判断第一图像的文字集合是否包含第二图像的文字集合。

7、在第一图像的文字集合包含第二图像的文字集合的情况下，将第二图像作为图像队列的冗余图像。

8、在第一图像的文字集合不包含第二图像的文字集合的情况下，判断第二图像的文字集合是否包含第一图像的文字集合。

9、在第二图像的文字集合包含第一图像文字集合的情况下，将第一图像作为图像队列的冗余图像。

10、在第二图像的文字集合不包含第一图像文字集合的情况下，保留第一图像和第二图像。

可选的，还可以按照序位由后到前的顺序，依次从图像队列中选取图像作为第一图像，图像队列中除第一图像之外的各个图像轮流作为第二图像，进行比对，直至完成图像队列中所有图像的文字集合的比对。

S116：删除图像队列中的冗余图像，得到新的图像队列。

其中，删除冗余图像，能够进一步丰富图文材料的用户体验，使得图文材料所包含的内容都是有价值的。

S117：按照序位从后到前的顺序，对新的图像队列中所包含的各个图像进行排列，得到图文材料。

综上所述，利用本实施例所述方法，能够从视频流中有效提取用户所需的图文材料。此外，删除冗余图像，能够提高图文材料的简洁性，由于剩余的各个备选图像依据时间戳由早到晚的顺序排列，还原了视频中所示图文材料的浏览顺序，从而提高使用体验。

需要说明的是，上述实施例提及的S101，为本申请所述基于视频流的信息处理方法的一种可选的实现方式。此外，上述实施例提及的S117，也为本申请所述基于视频流的信息处理方法的一种可选的实现方式。为此，上述实施例提及的流程，可以概括为图2所示的方法。

如图2所示，为本申请实施例提供的另一种基于视频流的信息处理方法的示意图，包括如下步骤：

S201：对从视频流中抓取得到的图像帧进行文字检测。

S202：在检测到图像帧的预设标注区域内存在文字的情况下，将图像帧标记为备选图像。

S203：对获取到的各个备选图像的文字集合进行比对，得到冗余图像。

其中，文字集合基于对备选图像进行文字识别得到。

S204：删除冗余图像。

S205：依据图像帧被抓取时所对应的时间戳由早到晚的顺序，对剩余的各个备选图像进行排列，得到图文材料。

需要说明的是，剩余的各个备选图像也可以按照其它顺序进行排列，本申请不做限定。

综上所述，利用本实施例所述方法，能够从视频流中有效提取用户所需的图文材料。

为了方便理解上述实施例示出的基于视频流的信息处理方法，以图3所示的流程为例，进行进一步的应用说明。

如图3所示，为本申请实施例提供的又一种基于视频流的信息处理方法的示意图，包括如下步骤：

1、初始化备选画面队列，记为L。队列的单位将包含备选画面和备选画面中文字内容。

需要说明的是，备选画面队列为上述实施例提及的图像队列的一种具体表达形式，备选画面为上述实施例提及的备选图像的一种具体表达形式，文字内容为上述实施例提及的文字集合的一种具体表达形式。

2、每隔若干秒，从视频中抓取视频帧，抓取的视频画面输入到下面步骤。

需要说明的是，若干秒为上述实施例提及的预设时间间隔的一种具体表达形式，视频帧为上述实施例提及的图像帧的一种具体表达形式。

3、在上一步骤中画面的感兴趣区域(感兴趣区域可以通过用户进行设置，主要是为了排除环境中的干扰文字内容。例如教室中的标语，通常处在画面的边缘)位置，进行文字检测。文字检测只是找到文字，并没有进行复杂更高的文字识别OCR。确定感兴趣区域是否存在文字。如果不存在文字，则舍弃该画面，准备检测下一张。如果存在文字则进行下面步骤，并记该画面为B。

需要说明的是，感兴趣区域为上实施例提及的预设标注区域的一种具体表达形式。

4、检查L，是否为空。如果为空，则对B进行OCR识别，并将文字结果和画面B作为一个单位，插入L。如果不为空，则取出L中的队首单元，记为画面A及其文字结果。

需要说明的是，画面A和画面B均为备选图像的一种具体表达方式。

5、对画面A和画面B，进行图像像素比对。比对方法采用如下方法：对A，B进行灰度转换；对灰度图逐点差值，将大于阈值T(本例中采用20)的点记为1，否则记为0，得到差值图D；最终计算D的非零点个数大于阈值TC(本例中采用30)，则认为画面B与画面A不同，进行下一步判断。否则认为画面B与画面A重复，舍弃B，返回步骤2进行下一帧检测。

6、对画面B进行OCR检测，得到画面B的文字内容。

7、比对画面A的文字内容和画面B的文字内容。如果A的文字内容和B的文字内容不存在完全包含关系，即A中有B没有的文字，B中也有A没有的文字，则将B画面和文字插入到L队首。否则，A与B的文字内容存在完全包含关系，如果A包含B则舍弃画面B；如果B包含A则舍弃画面A，将B插入到L队首。

经过以上步骤，我们将从视频中获得备选画面队列L。为了进一步去重，我们再对L进行去重操作。由于新的画面从L队首插入，所以L队尾的内容是在视频中最开始的内容，被后面内容包含的可能性更大。所以我们从队尾开始进行去重操作，步骤如下：

1、从队尾开始取出一个单元的画面和文字内容；

2、从第1步取出的单元开始逐一取出画面和文字，进行文字和画面的比对。比对方法如下：首先比对文字包含关系，如果不存在包含关系，则比对结束，2个单元都保留；如果存在包含关系，则进一步比对画面，如果画面存在大面积的差异，则2个单元都保留；如果画面差异很小则将被包含的单元内容从L中删除。

需要说明的是，单元为上述实施例提及的备选图像的一种具体表达形式。

本步骤中，之所以采用文字和图片同时比对，满足差异就保留的方式，是考虑到某些ppt课件中文字相同，但是图片不同的情况，通常不同的图片展示了不同的案例，也应保留。

3、重复步骤1和2将L中重复内容删除，最得到的序列L。

需要说明的书，重复内容为上述实施例提及的冗余图像的一种具体表达形式。

4、将序列L中保存的画面，按照从队尾到队首的顺序排列，组成该段视频的摘要资料。

需要说明的是，摘要资料为上述实施例提及的图文材料的一种具体表达形式。

与上述本申请实施例提供的基于视频流的信息处理方法相对应，本申请实施例还提供了一种基于视频流的信息处理装置。

如图4所示，为本申请实施例提供的一种基于视频流的信息处理装置的架构示意图，包括：

检测单元100，用于对从视频流中抓取得到的图像帧进行文字检测。

其中，检测单元100具体用于：依据预设间隔时间，从预先加载的视频流中抓取第n图像帧，其中，n为正整数；对第n图像帧进行文字检测，判断第n图像帧的预设标注区域内是否存在文字；在第n图像帧的预设标注区域内不存在文字的情况下，删除第n图像帧。

标记单元200，用于在检测到图像帧的预设标注区域内存在文字的情况下，将图像帧标记为备选图像。

筛选单元300，用于：预先将第n次抓取到的图像帧对应的备选图像，标记为第n备选图像,其中，n为正整数；判断预设的图像队列中是否包含有图像；在图像队列中不包含有图像的情况下，将第n备选图像插入到图像队列中；在图像队列中包含有图像的情况下，将位于图像队列中第一序位的图像作为目标图像；判断第n备选图像的文字集合是否包含目标图像的文字集合；在第n备选图像的文字集合包含目标图像的文字集合的情况下，利用第n备选图像替代所述目标图像。

筛选单元300还用于：在第n备选图像的文字集合不包含目标图像的文字集合的情况下，判断目标图像的文字集合是否包含第n备选图像的文字集合；在目标图像的文字集合包含第n备选图像的文字集合的情况下，删除第n备选图像。

筛选单元300还用于：在目标图像的文字集合不包含第n备选图像的文字集合的情况下，将第n备选图像插入到图像队列中的第一序位，并将目标图像在图像队列中所处的序位往后推移。

筛选单元300还用于：计算第n备选图像与目标图像的像素差值；在像素差值不大于预设阈值的情况下，删除第n备选图像。

比对单元400，用于对获取到的各个备选图像的文字集合进行比对，得到冗余图像，其中，文字集合基于对备选图像进行文字识别得到。

其中，比对单元400还用于对图像队列中所包含的各个图像的文字集合进行比对，得到冗余图像。

其中，比对单元400具体用于：判断第一图像的文字集合与第二图像的文字集合之间是否存在包含关系；其中，第一图像和第二图像均为备选图像；在第一图像的文字集合与第二图像的文字集合之间存在包含关系的情况下，计算第一图像和第二图像的像素差值；在像素差值不大于预设阈值的情况下，判断第一图像的文字集合是否包含第二图像的文字集合；在第一图像的文字集合包含第二图像的文字集合的情况下，将第二图像作为图像队列的冗余图像；在第一图像的文字集合不包含第二图像的文字集合的情况下，判断第二图像的文字集合是否包含第一图像的文字集合；在第二图像的文字集合包含第一图像文字集合的情况下，将第一图像作为图像队列的冗余图像。

删除单元600，用于删除冗余图像。

排列单元700，用于依据图像帧被抓取时所对应的时间戳由早到晚的顺序，对剩余的各个备选图像进行排列，得到图文材料。

本申请还提供了一种计算机可读存储介质，计算机可读存储介质包括存储的程序，其中，程序执行上述本申请提供的基于视频流的信息处理方法。

本申请还提供了一种基于视频流的信息处理设备，如图5所示，包括：处理器501、存储器502和总线503。处理器501与存储器502通过总线503连接，存储器502用于存储程序，处理器501用于运行程序，其中，程序运行时执行上述本申请提供的基于视频流的信息处理方法，包括如下步骤：

对从视频流中抓取得到的图像帧进行文字检测；

删除所述冗余图像；

判断预设的图像队列中是否包含有图像；

可选的，还包括：

计算所述第n备选图像与所述目标图像的像素差值；

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算设备可读取存储介质中。基于这样的理解，本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算设备(可以是个人计算机，服务器，移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于视频流的信息处理方法，其特征在于，包括：

对从视频流中抓取得到的图像帧进行文字检测；

删除所述冗余图像；

2.根据权利要求1所述的方法，其特征在于，所述对从视频流中抓取得到的图像帧进行文字检测，包括：

3.根据权利要求1所述的方法，其特征在于，所述对获取到的各个所述备选图像的文字集合进行比对，得到冗余图像之前，还包括：

判断预设的图像队列中是否包含有图像；

4.根据权利要求3所述的方法，其特征在于，还包括：

5.根据权利要求4所述的方法，其特征在于，还包括：

6.根据权利要求3所述的方法，其特征在于，还包括：

计算所述第n备选图像与所述目标图像的像素差值；

7.根据权利要求1所述的方法，其特征在于，所述对获取到的各个所述备选图像的文字集合进行比对，得到冗余图像，包括：

8.一种基于视频流的信息处理装置，其特征在于，包括：

删除单元，用于删除所述冗余图像；

9.根据权利要求8所述的装置，其特征在于，所述检测单元具体用于：

10.根据权利要求8所述的装置，其特征在于，还包括：

11.根据权利要求10所述的装置，其特征在于，所述筛选单元还用于：

12.根据权利要求11所述的装置，其特征在于，所述筛选单元还用于：

13.根据权利要求10所述的装置，其特征在于，所述筛选单元还用于：

14.根据权利要求8所述的装置，其特征在于，所述比对单元具体用于：

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，所述程序执行权利要求1-7任一所述的基于视频流的信息处理方法。

16.一种基于视频流的信息处理设备，其特征在于，包括：处理器、存储器和总线；所述处理器与所述存储器通过所述总线连接；

所述存储器用于存储程序，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1-7任一所述的基于视频流的信息处理方法。