CN101262611B - 一种流媒体播放器 - Google Patents
一种流媒体播放器 Download PDFInfo
- Publication number
- CN101262611B CN101262611B CN 200810088098 CN200810088098A CN101262611B CN 101262611 B CN101262611 B CN 101262611B CN 200810088098 CN200810088098 CN 200810088098 CN 200810088098 A CN200810088098 A CN 200810088098A CN 101262611 B CN101262611 B CN 101262611B
- Authority
- CN
- China
- Prior art keywords
- stream
- caption
- timestamp
- media
- video flowing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明公开了一种流媒体播放器,以解决现有技术在同时提供流媒体和字幕服务时存在灵活性和动态可控性差的问题;该流媒体播放器,包括将流媒体分离并解码出音频流和视频流的媒体流处理单元,用于播放音频流和视频流的播放单元;所述播放器还包括合成单元,该合成单元用于接收和解码字幕流,并以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,则将解码后的字幕流转换为新的视频流或者将解码后的字幕流与所述媒体流处理单元输出的视频流合成新的视频流后输出到所述播放单元。
Description
本申请是申请日为2005年5月1日、申请号为200510034548.9,发明名称为“播放流媒体字幕的方法及其流媒体播放器”的申请的分案申请。
技术领域
本发明涉及流媒体技术,尤其涉及一种流媒体播放器。
背景技术
流媒体(Streaming Media)技术是一种新兴的网络传输技术,用于在互联网上实时顺序地传输和播放视/音频等多媒体内容的连续时基数据流,流媒体技术包括流媒体数据采集、视/音频编解码、存储、传输、播放等领域。在网络上传播多媒体信息主要有两种方式:下载和流式传输。下载方式是传统的传输方式,指在播放之前由用户下载多媒体文件至本地。流式传输则把多媒体信息通过服务器向用户实时地提供,采用这种方式时,用户不必等到整个文件全部下载完毕,而只需经过几秒或几十秒的启动时延即可播放,之后,客户端边接收数据边播放。
目前,流媒体技术广泛应用在多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、视频点播、远程教育、实时视频会议和即时通讯等互联网的信息服务上。为了向用户提供更丰富的流媒体服务,一般在向用户提供流媒体服务的同时还提供字幕服务,现有技术提供字幕服务有以下两种方案:
1、流媒体服务器端解决方案,该方案在制作媒体流的时候同时制作好字幕流,再存储为媒体流和字幕流按时间顺序交错的媒体流文件;播放时,由客户端播放器直接解码媒体流和字幕流。
这种方案的缺点是字幕流和媒体流交错存储在文件里,对所有的用户都是提供相同的字幕流,不能针对不同的用户发送不同的字幕流,其灵活性较差,而且修改字幕流也不方便。
2、流媒体播放器客户端解决方案,该方案预先制作和对应媒体流匹配的字幕流文件,将该文件保存在客户端本地,客户端播放媒体流文件的同时显示相应字幕。
这种方案的缺点是字幕流内容不受服务器端控制,而且字幕流也不受流媒体供应商控制,对于一些现场直播类媒体流的字幕服务不能及时更新,因此,其灵活性和动态可控性差。
发明内容
本发明提供一种流媒体播放器,以解决现有技术在同时提供流媒体和字幕服务时存在灵活性和动态可控性差的问题。
一种流媒体播放器,包括将流媒体分离并解码出音频流和视频流的媒体流处理单元,用于播放音频流和视频流的播放单元;其中,所述播放器还包括合成单元,该合成单元用于接收和解码字幕流,并以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,则将解码后的字幕流转换为新的视频流或者将解码后的字幕流与所述媒体流处理单元输出的视频流合成新的视频流后输出到所述播放单元。
一种流媒体字幕合成装置,包括:
字幕接收/缓冲组件,用于接收并缓存字幕流;
字幕解码组件,用于解码缓存的字幕流;
视频/字幕合成组件,用于以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,则将字幕解码组件输出的字幕流和接收到的视频流合成新的视频流。
本发明在播放媒体流的过程中,将媒体流中的视频流与字幕流动态的合成新的视频流播放,因而在对IM用户提供流媒体服务的时候,可以灵活的提供对应的字幕服务,这种字幕可以是对应的视频对白、音频字幕、广告字幕、消息字幕等;在本发明中字幕服务由服务器端提供,其动态可控性好,能够根据需要及时更新。采用本发明不仅能够满足不同的业务需求,而且也可作为一种增值服务为流媒体服务商增加收入来源、为用户提供更丰富的流媒体服务。
附图说明
图1为实现本发明网络系统结构示意图;
图2为媒体流和字幕流服务的流程示意图;
图3A为媒体流的存储格式示意图;
图3B为字幕流存储格式示意图;
图4为流媒体播放器结构示意图;
图5为字幕组件处理字幕流的流程图。
具体实施方式
为了满足多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、视频点播、远程教育、实时视频会议和即时通讯等信息服务对流媒体字幕技术的不同需求,提高其灵活性,本发明由字幕服务器控制字幕流,在流媒体播放器请求流媒体服务器提供流媒体服务时,向字幕服务器请求该流媒体对应的字幕服务;流媒体播放器接收到流媒体服务器和字幕服务器发送来的媒体流和字幕流后匹配时间戳,在字幕流时间戳与媒体流时间戳匹配时,将该字幕流转换为视频流与所述媒体流同步播放。
以下主要以即时通讯服务为例,结合附图对实现本发明进行详细说明:
如图1所示,实现本发明的即时网络系统包括即时通讯用户客户端(IMClient)400(用户客户端为多个)、即时通讯服务器(IM Server)100、流媒体服务器200和字幕服务器300。其中:即时通讯服务器200负责管理用户和对即时通讯用户(IM User)登录进行认证,并对用户发放签名。流媒体服务器200向用户提供流媒体服务,并对访问流媒体服务器的用户进行认证。字幕服务器300向用户提供字幕服务,并对访问字幕服务器的用户进行认证。
参阅图2所示,在即时通讯客户端具有流媒体播放器500,该流媒体播放器500包括媒体流处理单元510、合成单元520和播放单元530。媒体流处理单元510接收和解码流媒体服务器通过网络传送来的媒体流,合成单元520将媒体流处理单元510输出的媒体流和字幕服务器300通过网络传送来的字幕流合成新的媒体流,播放单元530播放合成单元520输出的媒体流。
流媒体播放器500中,除合成单元520外,媒体流处理单元510和播放单元530可以是Windows操作系统上安装的Windows Media Player中的单元。
参阅图3A所示,媒体流在流媒体服务器200上的存储格式和普通的流媒体服务器媒体流储存格式一致。
参阅图3B所示,在字幕服务器300上,期望和媒体流里某时间点同时出现的字幕则打上和该媒体流里相同的时间戳,以保证流媒体播放和字幕流同步显示。字幕服务器300上的字幕流采用无损压缩编码算法进行编码,如LZ77算法。
参阅图4所示,媒体流处理单元510包括:接收/缓冲组件511、音/视频媒体流分离组件512、音频解码组件513和视频解码组件514。接收/缓冲组件511接收并缓存从流媒体服务器200传送来的流媒体;音/视频媒体流分离组件512将接收/缓冲组件511输出的媒体流分离为音频流和视频流,并分别输出到音频解码组件513和视频解码组件514;音频解码组件513对音频流进行解码,视频解码组件514对视频流进行解码。
合成单元520包括:字幕接收/缓冲组件521、字幕解码组件522和视频/字幕合成组件523。字幕接收/缓冲组件521接收由字幕服务器300发送来的字幕流,并把接收到字幕流按字幕流时间样本先后顺序保存在本地的一个缓冲队列里;字幕解码组件522对字幕接收/缓冲组件521输出的已编码字幕流数据,采用相应的解码算法进行解码,并将解码后的数据流写入字幕缓冲文件,如,字幕服务器300上的字幕流采用LZ77算法编码,字幕解码组件522则采用LZ77解码算法进行解码。既使用和字幕流编码对应的解码算法解码。视频/字幕合成组件523将视频解码组件514输出的视频流和字幕解码组件522输出的字幕流合成新的视频流并输出。
播放单元530包括音频播放组件531和视频播放组件532,音频播放组件531用于播放音频解码组件513输出的音频流,视频播放组件532用于播放视频/字幕合成组件523输出的视频流。
为了使字幕流和对应的媒体流同步播放,字幕流的时间戳必须与对应的媒体流的时间戳匹配(或者说明媒体流和字幕流的时间戳必须一致)。流媒体播放器500在确定字幕流和媒体流的时间戳是否匹配时,以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配。如:阈值设定为2,媒体流的第一个媒体样本的时间戳是10,字幕流第一个样本的时间戳是110,则参考值为110-10=100。若经过5秒以后,当前媒体流的时间戳为10+5=15,此时收到的字幕流样本的时间戳为116,则当前字幕流样本的时间戳与当前媒体流样本时间戳的差值101(116-15=101)与参考值100的差为1,此时该差值1小于阈值2,流媒体播放器500则确定字幕流时间戳与流媒体时间戳匹配。
参阅图5所示,播放流媒体字幕的过程如下:
步骤10:即时通讯用户A首先向流媒体服务器200申请流媒体服务(标识该流媒体为C),在收到流媒体服务器200的应答后,通讯用户A再向字幕服务器300申请媒体流C对应的字幕服务。流媒体服务器对即时通讯用户A的应答中包括了是否需要认证、是否提供字幕流服务等信息。
步骤20:流媒体服务器200和字幕服务器300分别检查后确认可为该新用户提供流媒体服务和字幕服务,并要求用户A提供签名。
步骤30:用户A向即时通讯服务器100获取用于访问流媒体服务器200和字幕服务器300的签名,即时通讯服务器100返回一个可访问流媒体服务器的签名S1和一个可访问字幕服务器的签名S2,由用户发送签名给流媒体服务器200和字幕服务器300。
步骤40:流媒体服务器200和字幕服务器300分别认证签名S1和签名S2,若两个签名均通过认证,则流媒体服务器200和字幕服务器300分别向用户A发送媒体流C和对应的字幕流。若签名未通过认证,则服务器不会向用户A提供服务。
步骤50:即时通讯用户A客户端(IM Client)上启动的流媒体播放器500接收媒体流C和对应的字幕流,由媒体流处理单元510解码媒体流C并分离出音频流和视频流,合成单元520接收到视频流和解码后的字幕服务流后,判断视频流的时间戳与字幕流的时间戳是否匹配,如果匹配,则将该视频流和字幕流合成新的视频流,播放单元530播放媒体流处理单元510输出的音频流和合成单元520输出的视频流,从而达到媒体流和对应的字幕流同频播放。若不匹配,则缓存该字幕流,如果该字幕流时间戳的绝对差值和当前媒体流时间戳的绝对差值大于限定值,则认为该字幕样本已经无效,丢弃该样本。
在媒体流处理单元510中,视频解码组件514将媒体流中的视频流解码后,以位图(Bitmap)的格式传输给合成单元520中的视频/字幕合成组件523,视频/字幕合成组件523合成新的视频帧时将要显示字幕点阵在位图上对应的位置的位图点阵替换成字幕颜色,处理完当前帧要显示的所有字符的点阵即完成一帧的字幕、视频合成。
若上述的媒体流中不包含视频流即仅有音频流,视频/字幕合成组件523将字幕流单独转化成视频流的格式发送给视频显示组件532进行显示。
当然,流媒体服务器200和字幕服务器300也可能不需要用户提供签名而直接提供服务,即在上述步骤20、步骤30和步骤40中没有要求签名、获取签名和签名认证过程。
本发明在多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、视频点播、远程教育和实时视频会议服务上的实现与上述即时通讯服务上的实现同理,在此不再赘述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (3)
1.一种流媒体播放器,包括将流媒体分离并解码出音频流和视频流的媒体流处理单元,用于播放音频流和视频流的播放单元;其特征在于,所述播放器还包括合成单元,该合成单元用于接收和解码字幕流,并以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,则将解码后的字幕流转换为新的视频流或者将解码后的字幕流与所述媒体流处理单元输出的视频流合成新的视频流后输出到所述播放单元。
2.如权利要求1所述的流媒体播放器,其特征在于,所述合成单元包括:
字幕接收/缓冲组件,用于接收并缓存字幕流;
字幕解码组件,用于解码缓存的字幕流;
视频/字幕合成组件,用于以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,则将解码后的字幕流转换为新的视频流,或者将解码后的字幕流与所述视频流合成新的视频流。
3.一种流媒体字幕合成装置,其特征在于该流媒体字幕合成装置包括:
字幕接收/缓冲组件,用于接收并缓存字幕流;
字幕解码组件,用于解码缓存的字幕流;
视频/字幕合成组件,用于以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,则将字幕解码组件输出的字幕流和接收到的视频流合成新的视频流。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810088098 CN101262611B (zh) | 2005-05-01 | 2005-05-01 | 一种流媒体播放器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810088098 CN101262611B (zh) | 2005-05-01 | 2005-05-01 | 一种流媒体播放器 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100345489A Division CN100452874C (zh) | 2005-05-01 | 2005-05-01 | 播放流媒体字幕的方法及其流媒体播放器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101262611A CN101262611A (zh) | 2008-09-10 |
CN101262611B true CN101262611B (zh) | 2010-10-13 |
Family
ID=39962770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810088098 Active CN101262611B (zh) | 2005-05-01 | 2005-05-01 | 一种流媒体播放器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101262611B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010142081A1 (zh) * | 2009-06-12 | 2010-12-16 | 华为技术有限公司 | 一种传送视频报文的方法、路由器设备及系统 |
CN102055941A (zh) * | 2009-11-03 | 2011-05-11 | 腾讯科技(深圳)有限公司 | 视频播放器及视频播放方法 |
CN104378331B (zh) | 2013-08-14 | 2019-11-29 | 腾讯科技(北京)有限公司 | 网络媒介信息的播放及响应处理方法、装置和系统 |
CN104410894B (zh) * | 2014-11-19 | 2018-05-01 | 大唐移动通信设备有限公司 | 一种无线环境影音同步的方法和装置 |
CN104853257A (zh) * | 2015-04-30 | 2015-08-19 | 北京奇艺世纪科技有限公司 | 字幕显示方法和装置 |
CN105843393A (zh) * | 2016-03-30 | 2016-08-10 | 苏州合欣美电子科技有限公司 | 一种自适应字幕调整的影音播放器 |
CN106231363A (zh) * | 2016-08-08 | 2016-12-14 | 上海幻电信息科技有限公司 | 一种弹幕视频流传输方法及其设备 |
CN109756744B (zh) * | 2017-11-02 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 数据处理方法、电子设备及计算机存储介质 |
CN110460889A (zh) * | 2019-09-16 | 2019-11-15 | 深圳市迅雷网络技术有限公司 | 一种视频投屏方法、装置、系统及存储介质 |
CN112584078B (zh) * | 2019-09-27 | 2022-03-18 | 深圳市万普拉斯科技有限公司 | 视频通话方法、装置、计算机设备和存储介质 |
CN112055245B (zh) * | 2020-09-11 | 2023-03-24 | 海信视像科技股份有限公司 | 一种彩色字幕实现方法及显示设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1505032A (zh) * | 2002-12-04 | 2004-06-16 | 上海乐金广电电子有限公司 | 利用国际互联网的光盘播放方法 |
CN1558664A (zh) * | 2004-01-17 | 2004-12-29 | 上海交通大学 | 一种高清晰数字电视节目字幕与背景图像的合成方法 |
-
2005
- 2005-05-01 CN CN 200810088098 patent/CN101262611B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1505032A (zh) * | 2002-12-04 | 2004-06-16 | 上海乐金广电电子有限公司 | 利用国际互联网的光盘播放方法 |
CN1558664A (zh) * | 2004-01-17 | 2004-12-29 | 上海交通大学 | 一种高清晰数字电视节目字幕与背景图像的合成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101262611A (zh) | 2008-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100452874C (zh) | 播放流媒体字幕的方法及其流媒体播放器 | |
CN101262611B (zh) | 一种流媒体播放器 | |
US11785289B2 (en) | Receiving device, transmitting device, and data processing method | |
US8045054B2 (en) | Closed captioning language translation | |
KR101874142B1 (ko) | 방송 시스템에서의 애플리케이션 서비스 장치 및 방법 | |
CN103096128B (zh) | 一种实现视频互动的方法、服务器、终端及系统 | |
DK2180652T3 (en) | Method and system for transmitting media information | |
CN1988665A (zh) | 一种dvb实时广告播放方法和播放系统 | |
CN103024454B (zh) | 在广播电视节目中向受众传送互动入口信息的方法及其系统 | |
EP1487212A1 (en) | Video information delivery apparatus and reception apparatus | |
US20070038781A1 (en) | Apparatus and method for converting contents | |
CN113301359A (zh) | 音视频处理方法、装置及电子设备 | |
KR101371064B1 (ko) | 방송 신호 전송 방법 | |
CN101631166A (zh) | 一种彩信播放系统及彩信播放方法 | |
CN101605243B (zh) | 节目提供的方法、媒体设备和用户侧设备 | |
WO2013166785A1 (zh) | 媒体业务提供方法和装置、媒体业务显示方法和装置 | |
CN109413476A (zh) | 一种音视频与钢琴动作同步直播方法及系统 | |
KR102533674B1 (ko) | 수신 장치, 송신 장치 및 데이터 처리 방법 | |
CN1231063C (zh) | 用于对数字广播音频内容确定目标的系统和方法 | |
KR100825755B1 (ko) | Mpeg-4 bifs 기반의 데이터 서비스와 미들웨어기반의 데이터 서비스 연동을 위한 디지털 멀티미디어 방송송수신 방법 및 그 장치 | |
KR100883366B1 (ko) | 디지털멀티미디어 방송에서 통합 데이터서비스를 제공하기 위한 dmb 수신 시스템 및 그 방법 | |
JP2003052030A (ja) | 番組情報変換方法及び送信サーバ装置及び送信サーバプログラムを記録した記録媒体 | |
JP5010102B2 (ja) | 放送受信方式 | |
JP2014060625A (ja) | 映像信号送信方法、映像信号受信装置及び映像信号受信方法 | |
Theme | Deliverable title: Technical Plan of Mature Pilot Services |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |