CN106295628A

CN106295628A - 一种使视频中出现的文字易于交互的方法

Info

Publication number: CN106295628A
Application number: CN201510256214.XA
Authority: CN
Inventors: 徐珺炜
Original assignee: Austria Holding (west Ham) Network Agricultural Co Ltd
Current assignee: Austria Holding (west Ham) Network Agricultural Co Ltd
Priority date: 2015-05-20
Filing date: 2015-05-20
Publication date: 2017-01-04

Abstract

本发明公开了一种使视频中出现的文字易于交互的方法，方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层；所述叠加层由控制器生成；控制器使用OCR技术，实时解析视频显示屏所播放的视频目前是否存在文字；如果存在文字则在叠加层上，与视频文字位置相同的位置上；添加可交互的与视频上文字相同的透明的文字，以使用户可以方便的复制文字，或者点击链接。本发明设计合理，通过OCR解析后直接将可以交互的透明的文字叠加在视频上，直接复制或者对以文字形式出现链接进行点击操作，并且实现检查图像，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字，使用户可以方便的与之交互。

Description

一种使视频中出现的文字易于交互的方法

技术领域

本发明涉及视频显示技术领域，具体地说，涉及一种使视频中出现的文字易于交互的方法。

背景技术

随着科技进步，人们已经逐渐开始习惯在互联网上进行学习和生活。近年来网络带宽飞速提高。通过视频来分享生活的点滴，已经是继文字分享和图片分享之后新的分享方式。也有很多人以在互联网上观看其他人录制的教学视频作为重要的知识获取方式。通过视频分享，可以让朋友更直观的了解自己想要表达的内容；通过视频来进行教学可以大大降低成本，想对于书本，也更见贴近于实践。

但是视频有一个弊端，人们无法与视频中的文字进行交互。如通过视频向朋友分享一段名言，这句名言至多只能以字幕的形式出现在视频中，朋友无法复制，只能重新输入，才能获取文本；通过视频向学员教授一段程序，学员不能直接复制这段程序的代码，只能通过照着视频重新输入，才能获取；一段广告，在字幕中出现购买的网页链接，观众不能直接点击这个网页链接就跳转到购物页面。

发明内容

为了克服现有技术的不足，本发明提供了一种使视频中出现的文字易于交互的方法，能够实现直接复制或者对以文字形式出现链接进行点击操作，并且实现检查图像，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字，最终实现与视频中的文字进行交互。

为解决上述问题，本发明所采用的技术方案是：

一种使视频中出现的文字易于交互的方法，其特征在于：方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层；所述叠加层由控制器生成；控制器使用OCR技术，实时解析视频显示屏所播放的视频目前是否存在文字；如果存在文字则在叠加层上，与视频文字位置相同的位置上；添加可交互的与视频上文字相同的透明的文字，以使用户可以方便的复制文字，或者点击链接。

作为一种优化的技术方案，所述控制器内包含3个模块：视频预读模块、OCR图像解析模块、叠加层管理模块；其中叠加层管理模块包含三个子模块：叠加层添加模块、叠加层内容生成模块、叠加层内容更新模块；

视频预读模块：用于读取视频正在播放的内容的下一帧；工作时首先判断当前播放的位置，接着取当前位置的下一帧图像，并将图像和图像出现的时间发送给OCR图像解析模块处理；

OCR图像解析模块：用于获取到视频预读模块发送过来的图像后，利用OCR解析技术对图像进行解析，判断图像中是否有文字，如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块；

叠加层添加模块：用于在视频准备开始播放的时候，获取视频的高度和宽度，接着创建一层透明的大小与视频相同的叠加层，并覆盖在视频上；

叠加层内容生成模块：用于在获取到了OCR图像解析模块传来的文字位置和文字内容后，判断文字是否为网页链接；如果为网页链接，则将文字处理为透明的超链接，以使用户可以点击；如果不为网页链接，则将文字处理为透明的可以复制的文字，并将生成的内容，文字的位置和出现的时间发送给叠加层内容更新模块；

叠加层内容更新模块：用于根据叠加层内容生成模块传送过来的内容，文字的位置和出现的时间；在内容应该出现的时，首先清空叠加层，接着在文字的位置上放置生成的内容。

作为一种优化的技术方案，步骤如下：

1)、首先利用叠加层添加模块在视频准备开始播放的时候，获取视频的高度和宽度，接着创建一层透明的大小与视频相同的叠加层，并覆盖在视频上；

2)、当视频开始播放后，利用视频预读模块用于读取视频正在播放的内容的下一帧，判断当前播放的位置，接着取当前位置的下一帧图像，并将图像和图像出现的时间发送给OCR图像解析模块处理；

3)、由OCR图像解析模块获取到视频预读模块发送过来的图像后，利用OCR解析技术对图像进行解析，判断图像中是否有文字，如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块；

4)、叠加层内容生成模块在获取到了OCR图像解析模块传来的文字位置和文字内容后，判断文字是否为网页链接；如果为网页链接，则将文字处理为透明的超链接，以使用户可以点击；如果不为网页链接，则将文字处理为透明的可以复制的文字，并将生成的内容，文字的位置和出现的时间发送给叠加层内容更新模块；

5)、叠加层内容更新模块根据叠加层内容生成模块传送过来的内容，文字的位置和出现的时间；在内容应该出现的时间首先清空叠加层，接着在文字的位置上放置生成的内容；

6)、以此循环，使整个播放过程一旦出现文字，则叠加层相应位置会出现透明的可交互的文字，以达到使视频的用户直接与视频中的文字交互的目的。

由于采用了上述技术方案，与现有技术相比，本发明设计合理，通过OCR解析后直接将可以交互的透明的文字叠加在视频上，直接复制或者对以文字形式出现链接进行点击操作，并且实现检查图像，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字，使用户可以方便的与之交互。

同时下面结合附图和具体实施方式对本发明作进一步说明。

附图说明

图1为本发明一种实施例的系统模块框图；

图2为本发明一种实施例中的系统总体核心流程图；

图3为本发明一种实施例中的添加叠加层流程图；

图4为本发明一种实施例中的视频预读流程图；

图5为本发明一种实施例中的OCR图像解析流程图；

图6为本发明一种实施例中的叠加层内容生成流程图；

图7为本发明一种实施例中的叠加层内容更新流程图。

具体实施方式

实施例：

一种使视频中出现的文字易于交互的方法，方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层；所述叠加层由控制器生成；控制器使用OCR技术，实时解析视频显示屏所播放的视频目前是否存在文字；如果存在文字则在叠加层上，与视频文字位置相同的位置上；添加可交互的与视频上文字相同的透明的文字，以使用户可以方便的复制文字，或者点击链接。

如图1所示，所述控制器内包含3个模块：视频预读模块、OCR图像解析模块、叠加层管理模块；其中叠加层管理模块包含三个子模块：叠加层添加模块、叠加层内容生成模块、叠加层内容更新模块。

视频预读模块：用于读取视频正在播放的内容的下一帧；工作时首先判断当前播放的位置，接着取当前位置的下一帧图像，并将图像和图像出现的时间发送给OCR图像解析模块处理。

OCR图像解析模块：用于获取到视频预读模块发送过来的图像后，利用OCR解析技术对图像进行解析，判断图像中是否有文字，如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块。

叠加层添加模块：用于在视频准备开始播放的时候，获取视频的高度和宽度，接着创建一层透明的大小与视频相同的叠加层，并覆盖在视频上。

叠加层内容生成模块：用于在获取到了OCR图像解析模块传来的文字位置和文字内容后，判断文字是否为网页链接；如果为网页链接，则将文字处理为透明的超链接，以使用户可以点击；如果不为网页链接，则将文字处理为透明的可以复制的文字，并将生成的内容，文字的位置和出现的时间发送给叠加层内容更新模块。

如图2所示，一种使视频中出现的文字易于交互的方法，步骤如下：

1)、如图3所示，首先利用叠加层添加模块在视频准备开始播放的时候，获取视频的高度和宽度，接着创建一层透明的大小与视频相同的叠加层，并覆盖在视频上。

2)、当视频开始播放后，如图4所示，利用视频预读模块用于读取视频正在播放的内容的下一帧，判断当前播放的位置，接着取当前位置的下一帧图像，并将图像和图像出现的时间发送给OCR图像解析模块处理。

3)、如图5所示，由OCR图像解析模块获取到视频预读模块发送过来的图像后，利用OCR解析技术对图像进行解析，判断图像中是否有文字，如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块。

4)、如图6所示，叠加层内容生成模块在获取到了OCR图像解析模块传来的文字位置和文字内容后，判断文字是否为网页链接；如果为网页链接，则将文字处理为透明的超链接，以使用户可以点击；如果不为网页链接，则将文字处理为透明的可以复制的文字，并将生成的内容，文字的位置和出现的时间发送给叠加层内容更新模块。

5)、如图7所示，叠加层内容更新模块根据叠加层内容生成模块传送过来的内容，文字的位置和出现的时间；在内容应该出现的时间首先清空叠加层，接着在文字的位置上放置生成的内容。

本发明设计合理，通过OCR解析后直接将可以交互的透明的文字叠加在视频上，直接复制或者对以文字形式出现链接进行点击操作，并且实现检查图像，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字，使用户可以方便的与之交互。

本发明不局限于上述最佳实施方式，任何人应该得知在本发明的启示下做出的结构变化，凡是与本发明具有相同或者相近似的技术方案，均属于本发明的保护范围。

Claims

1.一种使视频中出现的文字易于交互的方法，其特征在于：方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层；

所述叠加层由控制器生成；

控制器使用OCR技术，实时解析视频显示屏所播放的视频目前是否存在文字；如果存在文字则在叠加层上，与视频文字位置相同的位置上；添加可交互的与视频上文字相同的透明的文字，以使用户可以方便的复制文字，或者点击链接。

2.根据权利要求1所述的一种使视频中出现的文字易于交互的方法，其特征在于：

控制器内包含3个模块：视频预读模块、OCR图像解析模块、叠加层管理模块；其中叠加层管理模块包含三个子模块：叠加层添加模块、叠加层内容生成模块、叠加层内容更新模块；

3.根据权利要求2所述的一种使视频中出现的文字易于交互的方法，其特征在于：

步骤如下：