CN101286274A - 一种供盲人使用的数字视频的自动讲解系统 - Google Patents

一种供盲人使用的数字视频的自动讲解系统 Download PDF

Info

Publication number
CN101286274A
CN101286274A CNA2008100994242A CN200810099424A CN101286274A CN 101286274 A CN101286274 A CN 101286274A CN A2008100994242 A CNA2008100994242 A CN A2008100994242A CN 200810099424 A CN200810099424 A CN 200810099424A CN 101286274 A CN101286274 A CN 101286274A
Authority
CN
China
Prior art keywords
video
frame
digital video
audiovisual
position data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008100994242A
Other languages
English (en)
Inventor
李卫红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA2008100994242A priority Critical patent/CN101286274A/zh
Publication of CN101286274A publication Critical patent/CN101286274A/zh
Pending legal-status Critical Current

Links

Images

Abstract

一种供盲人使用的数字视频的自动讲解系统。包括视听转换信息数据库和播放控制单元两部分,视听转换信息数据库中储存着整部数字视频中的每一视频帧片段的起始视频帧位置数据、结束视频帧位置数据、相应的文字描述的文本内容等视听转换信息。播放控制单元利用TTS语音合成技术,在相应帧位置处转换、播放相应的“文本信息”的语音,完成数字视频节目的“视听转化”,从而实现数字视频的自动讲解,便于盲人欣赏数字视频节目。

Description

一种供盲人使用的数字视频的自动讲解系统
技术领域
本发明涉及一种供盲人使用的数字视频的自动讲解系统,具体是一种利用TTS语音合成技术来实现数字视频的视听转换的自动讲解系统。播放控制单元利用TTS语音合成技术,在相应帧位置处转换、播放相应的“文本信息”的语音,完成数字视频节目的“视听转化”,从而来实现数字视频的自动讲解,便于盲人欣赏数字视频节目。本发明用于信息处理技术领域。
背景技术
盲人因特殊的视觉障碍,无法欣赏影视等视频节目。此前,当一个盲人去电影院看电影时,必须得有一个人陪同,随着剧情的发展来讲述故事情节。这样就出现了一个问题:这位陪同人员也是头一回看这部电影,所以在给盲人讲述这部电影的情节的速度总是比电影的速度慢一些,而且陪同人员也看不好这场电影,并且盲人在这个时候也无法兼顾电影中的对话与陪同人的描述,他们的窃窃私语也影响其他观众观看电影。电视节目也是这样。
对于电影、电视等视频节目,过去主要以胶片拷贝、录像带等为存储介质,通过放映机、放像机等以模拟信号的方式进行传播,而现在主要以VCD、DVD等光存储介质,通过影碟机、计算机、宽带网络等以数字视频即数字信号的方式进行传播。
在以胶片拷贝、录像带等为存储介质进行视频传播的时代,虽然美国、法国、丹麦等也发明了一些电影的听视系统,但该听视系统需要相关的片源及电影播放设备等硬件的支持,成本较高,不便推广,实际上也确实很少能够得到实施。
而目前,VCD、DVD、互联网宽带已进入千家万户,大街小巷网吧遍布,宽带影视等数字视频节目触手可及。而TTS(Text-to-Speech,语音合成又称为文语转换,是指计算机可以自动把输入的文本信息转换成语音的技术)语音合成技术又相当成熟,我们完全可以借助TTS语音技术来实现数字视频的计算机自动讲解,为盲人随时随地提供数字视频节目。
发明内容
为解决数字视频的视听转换的自动讲解,本发明提供了一种利用TTS语音合成技术来实现数字视频的视听转换的自动讲解系统,便于盲人欣赏影视艺术。
本发明解决其技术问题所采用的技术方案是:
基于本发明的盲人数字视频的视听转换系统包括视听转换信息数据库和播放控制单元两部分。
视听转换信息数据库是将整部数字视频逐帧按情节划分为一个个视频帧片段,并对这些视频帧片段进行文字描述,进而建立起包含该部视频的每一个视频帧片段的文字描述的视听转换信息数据库。每一视频帧片段的起始视频帧位置数据、结束视频帧位置数据、相应的文字描述的文本内容等视听转换信息全部都储存在视听转换信息数据库中。
该视听转换信息数据库的数据库结构中包含视频帧片段的起始视频帧位置、结束视频帧位置、相应的文字描述的文本内容等字段。
盲人可根据各自的需要,随时随地选择播放经过视听转换信息处理的数字视频节目。播放开始时,播放控制单元首先读取当前视频帧的位置数据。根据当前视频帧的位置数据,播放控制单元在视听转换信息数据库中搜索、查找、过滤,看当前视频帧片段是否符合条件,是否需要进行TTS语音合成,转换、播放相应的视频帧片段的文字描述的文本内容。如果当前视频帧片段需要进行TTS语音合成,则播放控制单元自动进行TTS语音合成,转换、播放相应的视频帧片段的文字描述的文本内容。否则,播放控制单元继续读入下一视频帧的位置数据。如此反复循环,直至最后一个视频帧,播放结束。
本发明的有益效果是,盲人可以根据自己的需要,随时随地通过VCD、DVD、计算机、互联网等途径“观看”自己喜欢的数字视频节目。影视公司可以在不改变现有任何拍摄、编辑、制作等硬件设备的情况下,制作出既满足普通观众,又满足盲人需要的数字影视节目。
附图说明
下面结合附图和实施例对本发明进一步说明。
附图是本发明的播放控制单元的流程图。
具体实施方式
对任一数字视频,制作完成后,将整部视频逐帧按情节划分为一个个视频帧片段,并对这些视频帧片段进行文字描述,进而建立起包含该部视频的每一个视频帧片段的文字描述的视听转换信息数据库。每一视频帧片段的起始视频帧位置数据、结束视频帧位置数据、相应的文字描述的文本内容等视听转换信息全部都储存在视听转换信息数据库中。在附图中,播放开始时,播放控制单元首先读取当前视频帧的位置数据。根据当前视频帧的位置数据,播放控制单元在视听转换信息数据库中搜索、查找、过滤,看当前视频帧片段是否符合条件,是否需要进行TTS语音合成,转换、播放相应的视频帧片段的文字描述的文本内容。如果当前视频帧片段需要进行TTS语音合成,则播放控制单元自动进行TTS语音合成,转换、播放相应的视频帧片段的文字描述的文本内容。否则,播放控制单元继续读入下一视频帧的位置数据。如此反复循环,直至最后一个视频帧,播放结束。
本发明既可以各种编程语言、开发工具开发出独立运行的,存储在磁盘、光盘等存储介质上的完整版本的软件产品,又可以插件、补丁的形式存在,存储在磁盘、光盘等存储介质上,作用于现有的各种专业、非专业的商用机、家用机上运行的各种流行、非流行、专业、非专业、商用、非商用的视频媒体播放器上,也可以固化在电子、存储芯片中,应用在VCD、DVD、数字电视、手机等各类视频媒体播放机中,更可以广播信号的形式,在电视、数字电视等视频媒体接受装置中。

Claims (4)

1、一种供盲人使用的数字视频的自动讲解系统,其特征在于:它主要由视听转换信息数据库和播放控制单元两部分组成。
2、根据权利要求1所述的供盲人使用的数字视频的自动讲解系统,其特征在于:视听转换信息数据库的数据库结构中包含视频帧片段的起始视频帧位置、结束视频帧位置、相应的文字描述的文本内容等字段。
3、根据权利要求1所述的供盲人使用的数字视频的自动讲解系统,其特征在于:每一视频帧片段的起始视频帧位置数据、结束视频帧位置数据、相应的文字描述的文本内容等视听转换信息全部都储存在视听转换信息数据库中。
4、根据权利要求1所述的供盲人使用的数字视频的自动讲解系统,其特征在于:播放控制单元以视听转换信息数据库中储存的每一视频帧片段的起始视频帧位置数据、结束视频帧位置数据为过滤条件对整部视频进行动态过滤,利用TTS语音合成技术,在相应视频帧位置处自动转换、播放相应的“文本信息”的语音。
CNA2008100994242A 2008-05-08 2008-05-08 一种供盲人使用的数字视频的自动讲解系统 Pending CN101286274A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008100994242A CN101286274A (zh) 2008-05-08 2008-05-08 一种供盲人使用的数字视频的自动讲解系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008100994242A CN101286274A (zh) 2008-05-08 2008-05-08 一种供盲人使用的数字视频的自动讲解系统

Publications (1)

Publication Number Publication Date
CN101286274A true CN101286274A (zh) 2008-10-15

Family

ID=40058459

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008100994242A Pending CN101286274A (zh) 2008-05-08 2008-05-08 一种供盲人使用的数字视频的自动讲解系统

Country Status (1)

Country Link
CN (1) CN101286274A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469485A (zh) * 2014-12-10 2015-03-25 四川长虹电器股份有限公司 一种针对视力障碍者的播放方法
CN104980790A (zh) * 2015-06-30 2015-10-14 北京奇艺世纪科技有限公司 语音字幕的生成和装置、播放方法和装置
CN106604056A (zh) * 2016-11-30 2017-04-26 腾讯科技(深圳)有限公司 视频播放方法和装置
CN109672932A (zh) * 2018-12-29 2019-04-23 深圳Tcl新技术有限公司 辅助视力障碍者观看视频的方法、系统、设备及存储介质
CN113225615A (zh) * 2021-04-20 2021-08-06 深圳市九洲电器有限公司 电视节目播放方法、终端设备、服务器以及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469485A (zh) * 2014-12-10 2015-03-25 四川长虹电器股份有限公司 一种针对视力障碍者的播放方法
CN104980790A (zh) * 2015-06-30 2015-10-14 北京奇艺世纪科技有限公司 语音字幕的生成和装置、播放方法和装置
CN106604056A (zh) * 2016-11-30 2017-04-26 腾讯科技(深圳)有限公司 视频播放方法和装置
CN106604056B (zh) * 2016-11-30 2019-05-24 腾讯科技(深圳)有限公司 视频播放方法和装置
CN109672932A (zh) * 2018-12-29 2019-04-23 深圳Tcl新技术有限公司 辅助视力障碍者观看视频的方法、系统、设备及存储介质
CN109672932B (zh) * 2018-12-29 2021-09-28 深圳Tcl新技术有限公司 辅助视力障碍者观看视频的方法、系统、设备及存储介质
CN113225615A (zh) * 2021-04-20 2021-08-06 深圳市九洲电器有限公司 电视节目播放方法、终端设备、服务器以及存储介质
CN113225615B (zh) * 2021-04-20 2023-08-08 深圳市九洲电器有限公司 电视节目播放方法、终端设备、服务器以及存储介质

Similar Documents

Publication Publication Date Title
US20170229151A1 (en) Resuming A Playing Of A Video Responsive To A Beginning Of A Segment.
US9380282B2 (en) Providing item information during video playing
US8494346B2 (en) Identifying a performer during a playing of a video
US9124950B2 (en) Providing item information notification during video playing
RU2330335C2 (ru) Система воспроизведения информации, использующая информационный запоминающий носитель
CN100488242C (zh) 根据字幕反复播放视频部分的方法和装置
KR101246976B1 (ko) 미디어 콘텐츠 렌더링의 특징
Díaz-Cintas The technology turn in subtitling
US20050180462A1 (en) Apparatus and method for reproducing ancillary data in synchronization with an audio signal
US8327009B2 (en) Method and system for providing real-time streaming media content
CN103313113A (zh) 一种视频的播放方法及机顶盒
US9058845B2 (en) Synchronizing a map to multiple video formats
CN104065979A (zh) 一种动态显示和视频内容相关联信息方法及系统
US20080159724A1 (en) Method and system for inputting and displaying commentary information with content
CN101286274A (zh) 一种供盲人使用的数字视频的自动讲解系统
US9058846B2 (en) Video map synchronizing diagnostic information
CN105744291B (zh) 视频数据处理方法及系统、视频播放设备和云端服务器
CN102522096A (zh) 多路音视频同步回放系统及其方法
US6243085B1 (en) Perspective switching in audiovisual works
CN103200450A (zh) 跨平台的多媒体互动系统及其互动方法
CN106792105A (zh) 光盘镜像iso音视频文件的播放处理方法、装置及电视
US11785300B2 (en) HDMI customized ad insertion
CN101877234B (zh) 一种对dvd光盘进行备份的方法和装置
CN105187969A (zh) 一种用于同声翻译的耳机
Franceschi et al. Italianizing Italy: Dubbing Woody Allen’s' To Rome with Love'

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081015