CN106295628A - 一种使视频中出现的文字易于交互的方法 - Google Patents

一种使视频中出现的文字易于交互的方法 Download PDF

Info

Publication number
CN106295628A
CN106295628A CN201510256214.XA CN201510256214A CN106295628A CN 106295628 A CN106295628 A CN 106295628A CN 201510256214 A CN201510256214 A CN 201510256214A CN 106295628 A CN106295628 A CN 106295628A
Authority
CN
China
Prior art keywords
word
video
superimposed layer
content
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510256214.XA
Other languages
English (en)
Inventor
徐珺炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Austria Holding (west Ham) Network Agricultural Co Ltd
Original Assignee
Austria Holding (west Ham) Network Agricultural Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Austria Holding (west Ham) Network Agricultural Co Ltd filed Critical Austria Holding (west Ham) Network Agricultural Co Ltd
Priority to CN201510256214.XA priority Critical patent/CN106295628A/zh
Publication of CN106295628A publication Critical patent/CN106295628A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/23Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on positionally close patterns or neighbourhood relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种使视频中出现的文字易于交互的方法,方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层;所述叠加层由控制器生成;控制器使用OCR技术,实时解析视频显示屏所播放的视频目前是否存在文字;如果存在文字则在叠加层上,与视频文字位置相同的位置上;添加可交互的与视频上文字相同的透明的文字,以使用户可以方便的复制文字,或者点击链接。本发明设计合理,通过OCR解析后直接将可以交互的透明的文字叠加在视频上,直接复制或者对以文字形式出现链接进行点击操作,并且实现检查图像,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字,使用户可以方便的与之交互。

Description

一种使视频中出现的文字易于交互的方法
技术领域
本发明涉及视频显示技术领域,具体地说,涉及一种使视频中出现的文字易于交互的方法。
背景技术
随着科技进步,人们已经逐渐开始习惯在互联网上进行学习和生活。近年来网络带宽飞速提高。通过视频来分享生活的点滴,已经是继文字分享和图片分享之后新的分享方式。也有很多人以在互联网上观看其他人录制的教学视频作为重要的知识获取方式。通过视频分享,可以让朋友更直观的了解自己想要表达的内容;通过视频来进行教学可以大大降低成本,想对于书本,也更见贴近于实践。
但是视频有一个弊端,人们无法与视频中的文字进行交互。如通过视频向朋友分享一段名言,这句名言至多只能以字幕的形式出现在视频中,朋友无法复制,只能重新输入,才能获取文本;通过视频向学员教授一段程序,学员不能直接复制这段程序的代码,只能通过照着视频重新输入,才能获取;一段广告,在字幕中出现购买的网页链接,观众不能直接点击这个网页链接就跳转到购物页面。
发明内容
为了克服现有技术的不足,本发明提供了一种使视频中出现的文字易于交互的方法,能够实现直接复制或者对以文字形式出现链接进行点击操作,并且实现检查图像,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字,最终实现与视频中的文字进行交互。
为解决上述问题,本发明所采用的技术方案是:
一种使视频中出现的文字易于交互的方法,其特征在于:方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层;所述叠加层由控制器生成;控制器使用OCR技术,实时解析视频显示屏所播放的视频目前是否存在文字;如果存在文字则在叠加层上,与视频文字位置相同的位置上;添加可交互的与视频上文字相同的透明的文字,以使用户可以方便的复制文字,或者点击链接。
作为一种优化的技术方案,所述控制器内包含3个模块:视频预读模块、OCR图像解析模块、叠加层管理模块;其中叠加层管理模块包含三个子模块:叠加层添加模块、叠加层内容生成模块、叠加层内容更新模块;
视频预读模块:用于读取视频正在播放的内容的下一帧;工作时首先判断当前播放的位置,接着取当前位置的下一帧图像,并将图像和图像出现的时间发送给OCR图像解析模块处理;
OCR图像解析模块:用于获取到视频预读模块发送过来的图像后,利用OCR解析技术对图像进行解析,判断图像中是否有文字,如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块;
叠加层添加模块:用于在视频准备开始播放的时候,获取视频的高度和宽度,接着创建一层透明的大小与视频相同的叠加层,并覆盖在视频上;
叠加层内容生成模块:用于在获取到了OCR图像解析模块传来的文字位置和文字内容后,判断文字是否为网页链接;如果为网页链接,则将文字处理为透明的超链接,以使用户可以点击;如果不为网页链接,则将文字处理为透明的可以复制的文字,并将生成的内容,文字的位置和出现的时间发送给叠加层内容更新模块;
叠加层内容更新模块:用于根据叠加层内容生成模块传送过来的内容,文字的位置和出现的时间;在内容应该出现的时,首先清空叠加层,接着在文字的位置上放置生成的内容。
作为一种优化的技术方案,步骤如下:
1)、首先利用叠加层添加模块在视频准备开始播放的时候,获取视频的高度和宽度,接着创建一层透明的大小与视频相同的叠加层,并覆盖在视频上;
2)、当视频开始播放后,利用视频预读模块用于读取视频正在播放的内容的下一帧,判断当前播放的位置,接着取当前位置的下一帧图像,并将图像和图像出现的时间发送给OCR图像解析模块处理;
3)、由OCR图像解析模块获取到视频预读模块发送过来的图像后,利用OCR解析技术对图像进行解析,判断图像中是否有文字,如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块;
4)、叠加层内容生成模块在获取到了OCR图像解析模块传来的文字位置和文字内容后,判断文字是否为网页链接;如果为网页链接,则将文字处理为透明的超链接,以使用户可以点击;如果不为网页链接,则将文字处理为透明的可以复制的文字,并将生成的内容,文字的位置和出现的时间发送给叠加层内容更新模块;
5)、叠加层内容更新模块根据叠加层内容生成模块传送过来的内容,文字的位置和出现的时间;在内容应该出现的时间首先清空叠加层,接着在文字的位置上放置生成的内容;
6)、以此循环,使整个播放过程一旦出现文字,则叠加层相应位置会出现透明的可交互的文字,以达到使视频的用户直接与视频中的文字交互的目的。
由于采用了上述技术方案,与现有技术相比,本发明设计合理,通过OCR解析后直接将可以交互的透明的文字叠加在视频上,直接复制或者对以文字形式出现链接进行点击操作,并且实现检查图像,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字,使用户可以方便的与之交互。
同时下面结合附图和具体实施方式对本发明作进一步说明。
附图说明
图1为本发明一种实施例的系统模块框图;
图2为本发明一种实施例中的系统总体核心流程图;
图3为本发明一种实施例中的添加叠加层流程图;
图4为本发明一种实施例中的视频预读流程图;
图5为本发明一种实施例中的OCR图像解析流程图;
图6为本发明一种实施例中的叠加层内容生成流程图;
图7为本发明一种实施例中的叠加层内容更新流程图。
具体实施方式
实施例:
一种使视频中出现的文字易于交互的方法,方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层;所述叠加层由控制器生成;控制器使用OCR技术,实时解析视频显示屏所播放的视频目前是否存在文字;如果存在文字则在叠加层上,与视频文字位置相同的位置上;添加可交互的与视频上文字相同的透明的文字,以使用户可以方便的复制文字,或者点击链接。
如图1所示,所述控制器内包含3个模块:视频预读模块、OCR图像解析模块、叠加层管理模块;其中叠加层管理模块包含三个子模块:叠加层添加模块、叠加层内容生成模块、叠加层内容更新模块。
视频预读模块:用于读取视频正在播放的内容的下一帧;工作时首先判断当前播放的位置,接着取当前位置的下一帧图像,并将图像和图像出现的时间发送给OCR图像解析模块处理。
OCR图像解析模块:用于获取到视频预读模块发送过来的图像后,利用OCR解析技术对图像进行解析,判断图像中是否有文字,如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块。
叠加层添加模块:用于在视频准备开始播放的时候,获取视频的高度和宽度,接着创建一层透明的大小与视频相同的叠加层,并覆盖在视频上。
叠加层内容生成模块:用于在获取到了OCR图像解析模块传来的文字位置和文字内容后,判断文字是否为网页链接;如果为网页链接,则将文字处理为透明的超链接,以使用户可以点击;如果不为网页链接,则将文字处理为透明的可以复制的文字,并将生成的内容,文字的位置和出现的时间发送给叠加层内容更新模块。
叠加层内容更新模块:用于根据叠加层内容生成模块传送过来的内容,文字的位置和出现的时间;在内容应该出现的时,首先清空叠加层,接着在文字的位置上放置生成的内容。
如图2所示,一种使视频中出现的文字易于交互的方法,步骤如下:
1)、如图3所示,首先利用叠加层添加模块在视频准备开始播放的时候,获取视频的高度和宽度,接着创建一层透明的大小与视频相同的叠加层,并覆盖在视频上。
2)、当视频开始播放后,如图4所示,利用视频预读模块用于读取视频正在播放的内容的下一帧,判断当前播放的位置,接着取当前位置的下一帧图像,并将图像和图像出现的时间发送给OCR图像解析模块处理。
3)、如图5所示,由OCR图像解析模块获取到视频预读模块发送过来的图像后,利用OCR解析技术对图像进行解析,判断图像中是否有文字,如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块。
4)、如图6所示,叠加层内容生成模块在获取到了OCR图像解析模块传来的文字位置和文字内容后,判断文字是否为网页链接;如果为网页链接,则将文字处理为透明的超链接,以使用户可以点击;如果不为网页链接,则将文字处理为透明的可以复制的文字,并将生成的内容,文字的位置和出现的时间发送给叠加层内容更新模块。
5)、如图7所示,叠加层内容更新模块根据叠加层内容生成模块传送过来的内容,文字的位置和出现的时间;在内容应该出现的时间首先清空叠加层,接着在文字的位置上放置生成的内容。
6)、以此循环,使整个播放过程一旦出现文字,则叠加层相应位置会出现透明的可交互的文字,以达到使视频的用户直接与视频中的文字交互的目的。
本发明设计合理,通过OCR解析后直接将可以交互的透明的文字叠加在视频上,直接复制或者对以文字形式出现链接进行点击操作,并且实现检查图像,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字,使用户可以方便的与之交互。
本发明不局限于上述最佳实施方式,任何人应该得知在本发明的启示下做出的结构变化,凡是与本发明具有相同或者相近似的技术方案,均属于本发明的保护范围。

Claims (3)

1.一种使视频中出现的文字易于交互的方法,其特征在于:方法是在用户的视频显示屏之上叠加一层与视频显示屏大小一致的叠加层;
所述叠加层由控制器生成;
控制器使用OCR技术,实时解析视频显示屏所播放的视频目前是否存在文字;如果存在文字则在叠加层上,与视频文字位置相同的位置上;添加可交互的与视频上文字相同的透明的文字,以使用户可以方便的复制文字,或者点击链接。
2.根据权利要求1所述的一种使视频中出现的文字易于交互的方法,其特征在于:
控制器内包含3个模块:视频预读模块、OCR图像解析模块、叠加层管理模块;其中叠加层管理模块包含三个子模块:叠加层添加模块、叠加层内容生成模块、叠加层内容更新模块;
视频预读模块:用于读取视频正在播放的内容的下一帧;工作时首先判断当前播放的位置,接着取当前位置的下一帧图像,并将图像和图像出现的时间发送给OCR图像解析模块处理;
OCR图像解析模块:用于获取到视频预读模块发送过来的图像后,利用OCR解析技术对图像进行解析,判断图像中是否有文字,如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块;
叠加层添加模块:用于在视频准备开始播放的时候,获取视频的高度和宽度,接着创建一层透明的大小与视频相同的叠加层,并覆盖在视频上;
叠加层内容生成模块:用于在获取到了OCR图像解析模块传来的文字位置和文字内容后,判断文字是否为网页链接;如果为网页链接,则将文字处理为透明的超链接,以使用户可以点击;如果不为网页链接,则将文字处理为透明的可以复制的文字,并将生成的内容,文字的位置和出现的时间发送给叠加层内容更新模块;
叠加层内容更新模块:用于根据叠加层内容生成模块传送过来的内容,文字的位置和出现的时间;在内容应该出现的时,首先清空叠加层,接着在文字的位置上放置生成的内容。
3.根据权利要求2所述的一种使视频中出现的文字易于交互的方法,其特征在于:
步骤如下:
1)、首先利用叠加层添加模块在视频准备开始播放的时候,获取视频的高度和宽度,接着创建一层透明的大小与视频相同的叠加层,并覆盖在视频上;
2)、当视频开始播放后,利用视频预读模块用于读取视频正在播放的内容的下一帧,判断当前播放的位置,接着取当前位置的下一帧图像,并将图像和图像出现的时间发送给OCR图像解析模块处理;
3)、由OCR图像解析模块获取到视频预读模块发送过来的图像后,利用OCR解析技术对图像进行解析,判断图像中是否有文字,如有文字则将文字内容和文字位置以及出现的时间发送给叠加层内容生成模块;
4)、叠加层内容生成模块在获取到了OCR图像解析模块传来的文字位置和文字内容后,判断文字是否为网页链接;如果为网页链接,则将文字处理为透明的超链接,以使用户可以点击;如果不为网页链接,则将文字处理为透明的可以复制的文字,并将生成的内容,文字的位置和出现的时间发送给叠加层内容更新模块;
5)、叠加层内容更新模块根据叠加层内容生成模块传送过来的内容,文字的位置和出现的时间;在内容应该出现的时间首先清空叠加层,接着在文字的位置上放置生成的内容;
6)、以此循环,使整个播放过程一旦出现文字,则叠加层相应位置会出现透明的可交互的文字,以达到使视频的用户直接与视频中的文字交互的目的。
CN201510256214.XA 2015-05-20 2015-05-20 一种使视频中出现的文字易于交互的方法 Pending CN106295628A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510256214.XA CN106295628A (zh) 2015-05-20 2015-05-20 一种使视频中出现的文字易于交互的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510256214.XA CN106295628A (zh) 2015-05-20 2015-05-20 一种使视频中出现的文字易于交互的方法

Publications (1)

Publication Number Publication Date
CN106295628A true CN106295628A (zh) 2017-01-04

Family

ID=57633255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510256214.XA Pending CN106295628A (zh) 2015-05-20 2015-05-20 一种使视频中出现的文字易于交互的方法

Country Status (1)

Country Link
CN (1) CN106295628A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277602A (zh) * 2017-07-26 2017-10-20 联想(北京)有限公司 信息获取方法及电子设备
CN109309844A (zh) * 2017-07-26 2019-02-05 腾讯科技(深圳)有限公司 视频台词处理方法、视频客户端及服务器
CN109714632A (zh) * 2018-12-11 2019-05-03 泰康保险集团股份有限公司 技术分享方法、装置、设备及存储介质
CN109819340A (zh) * 2019-02-19 2019-05-28 上海七牛信息技术有限公司 视频播放过程中的网址解析方法、装置及可读存储介质
WO2019105467A1 (zh) * 2017-11-30 2019-06-06 腾讯科技(深圳)有限公司 信息的分享方法和装置、存储介质、电子装置
CN112231498A (zh) * 2020-09-29 2021-01-15 北京字跳网络技术有限公司 互动信息处理方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070047922A1 (en) * 2005-08-29 2007-03-01 Eklund Don Discontinuous timeline in disc authoring
CN101021903A (zh) * 2006-10-10 2007-08-22 鲍东山 视频字幕内容分析系统
CN101076089A (zh) * 2006-06-23 2007-11-21 腾讯科技(深圳)有限公司 一种显示字幕的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070047922A1 (en) * 2005-08-29 2007-03-01 Eklund Don Discontinuous timeline in disc authoring
CN101076089A (zh) * 2006-06-23 2007-11-21 腾讯科技(深圳)有限公司 一种显示字幕的方法
CN101021903A (zh) * 2006-10-10 2007-08-22 鲍东山 视频字幕内容分析系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277602A (zh) * 2017-07-26 2017-10-20 联想(北京)有限公司 信息获取方法及电子设备
CN109309844A (zh) * 2017-07-26 2019-02-05 腾讯科技(深圳)有限公司 视频台词处理方法、视频客户端及服务器
CN111901659A (zh) * 2017-07-26 2020-11-06 联想(北京)有限公司 信息获取方法及电子设备
CN111901659B (zh) * 2017-07-26 2022-01-14 联想(北京)有限公司 信息获取方法及电子设备
WO2019105467A1 (zh) * 2017-11-30 2019-06-06 腾讯科技(深圳)有限公司 信息的分享方法和装置、存储介质、电子装置
US11265614B2 (en) 2017-11-30 2022-03-01 Tencent Technology (Shenzhen) Company Limited Information sharing method and device, storage medium and electronic device
CN109714632A (zh) * 2018-12-11 2019-05-03 泰康保险集团股份有限公司 技术分享方法、装置、设备及存储介质
CN109819340A (zh) * 2019-02-19 2019-05-28 上海七牛信息技术有限公司 视频播放过程中的网址解析方法、装置及可读存储介质
CN112231498A (zh) * 2020-09-29 2021-01-15 北京字跳网络技术有限公司 互动信息处理方法、装置、设备及介质
WO2022068533A1 (zh) * 2020-09-29 2022-04-07 北京字跳网络技术有限公司 互动信息处理方法、装置、设备及介质
US11917344B2 (en) 2020-09-29 2024-02-27 Beijing Zitiao Network Technology Co., Ltd. Interactive information processing method, device and medium

Similar Documents

Publication Publication Date Title
CN106295628A (zh) 一种使视频中出现的文字易于交互的方法
Earley-Spadoni Spatial history, deep mapping and digital storytelling: archaeology's future imagined through an engagement with the digital humanities
Wang et al. Application of VR technology in civil engineering education
CN103679204A (zh) 基于智能移动设备平台的图像识别与创作应用系统及方法
CN104461318A (zh) 基于增强现实技术的点读方法及系统
CN109817031B (zh) 一种基于vr技术的肢体运动教学方法
CN102982194A (zh) 一种3d产品在线体验系统
CN101048210A (zh) 面向对象混合现实和视频游戏创作工具系统和方法发明背景
CN109696961A (zh) 基于vr技术的文物虚拟拆装导赏实现系统及方法、介质
Xie Intangible Cultural Heritage High‐Definition Digital Mobile Display Technology Based on VR Virtual Visualization
CN105243485A (zh) 基于bim网络技术的建筑工程管理系统平台
Yang et al. A Human‐Computer Interaction System for Agricultural Tools Museum Based on Virtual Reality Technology
CN105430473A (zh) 显示支持者头像的方法和装置
Michon et al. It’s hard to be down when you’re up: interpreting cultural heritage through alternative media
Li Research on application of virtual reality technology in information retrieval
Wang et al. Research on Immersive Experience of Rural Tourism Marketing in the Internet Era
Meng et al. The development of a panorama manifestation virtual reality system for navigation and a usability comparison with a desktop system
CN106034254A (zh) 一种实现与视频中文字进行交互操作的方法及系统
De Paolis et al. Augmented Reality, Virtual Reality, and Computer Graphics: 6th International Conference, AVR 2019, Santa Maria al Bagno, Italy, June 24–27, 2019, Proceedings, Part II
Han et al. [Retracted] The Teaching Method of Basketball Training Based on Intelligent Network Multimedia Technology
CN104104889B (zh) 多屏运动与内容协同变化的新媒体广告实现系统及方法
Xu Immersive display design based on deep learning intelligent VR technology
Yang et al. Enhancing the Sustainability of Intangible Cultural Heritage Projects: Obtaining Efficient Digital Skills Preservation through Binocular Half Panoramic VR Maps
CN112825215A (zh) 基于虚拟现实技术的核电厂防人因培训系统及方法
Mor et al. Augmented reality for virtual renovation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170104

WD01 Invention patent application deemed withdrawn after publication