CN101179347B - 一种提供文本文件信息的方法、系统及服务端 - Google Patents

一种提供文本文件信息的方法、系统及服务端 Download PDF

Info

Publication number
CN101179347B
CN101179347B CN2007101606080A CN200710160608A CN101179347B CN 101179347 B CN101179347 B CN 101179347B CN 2007101606080 A CN2007101606080 A CN 2007101606080A CN 200710160608 A CN200710160608 A CN 200710160608A CN 101179347 B CN101179347 B CN 101179347B
Authority
CN
China
Prior art keywords
file
text
files
stream media
relevant information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101606080A
Other languages
English (en)
Other versions
CN101179347A (zh
Inventor
李彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xunlei Network Technology Co Ltd
Original Assignee
Shenzhen Xunlei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xunlei Network Technology Co Ltd filed Critical Shenzhen Xunlei Network Technology Co Ltd
Priority to CN2007101606080A priority Critical patent/CN101179347B/zh
Publication of CN101179347A publication Critical patent/CN101179347A/zh
Application granted granted Critical
Publication of CN101179347B publication Critical patent/CN101179347B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种提供文本文件信息的方法、系统及服务端,属于互联网领域,以实现准确提供与流媒体文件对应的文本文件信息。方法包括:确定终端当前新建任务所指向的流媒体文件;获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识;根据获得的文本文件的文件标识向终端提供文本文件信息。因此应用本发明能够实现准确提供与流媒体文件对应的文本文件信息。

Description

一种提供文本文件信息的方法、系统及服务端
技术领域
本发明涉及互联网领域,特别是涉及一种提供文本文件的方法、系统及服务端信息。
背景技术
随着互联网技术的不断发展,互联网上的流媒体资源(音频及视频)的数量不断增长。目前互联网上聚合大量的流媒体资源,但是较多的流媒体文件(例如AVI格式的电影文件等)中无字幕(文本文件),或者原有字幕中所用的语言与用户期望看到的字幕语言不同,因此用户需要手动查找并下载其期望的字幕文件,字幕文件(文本文件)中记录了台词及每句台词显示的时间,可通过特定的插件将字幕(文本文件)嵌入流媒体文件中。
为了实现字幕与流媒体播放同步,符合用户的感官体验,要求字幕的出现与流媒体文件的播放一致。但是互联网上流媒体资源的数量较大,同一个流媒体文件可能存在多个不同的版本,其播放时长也可能不同,而且一个流媒体文件还可能被分割为多个片段,因此同一个流媒体文件可能存在多个版本的字幕文件(文本文件)。
现有的字幕(文本文件)下载,需要用户手动搜索和选择,以下载与流媒体文件对应的字幕文件。目前用户搜索一个流媒体文件对应的字幕文件时,流媒体文件与字幕文件的对应仅限于通过关键字(例如文件名称)和文件分段信息(例如一个流媒体文件被分为3个片段),用户需要从多个搜索结果中选择对应的字幕文件,只能将每个字幕文件嵌入流媒体文件中,并通过实际体验来判断该字幕文件是否与该流媒体文件对应,而且找到对应的字幕文件后,用户需要手动下载并将字幕文件(文本文件)与流媒体文件进行关联,操作繁琐。
发明人在发明过程中发现,现有技术不能实现准确提供与流媒体文件对应的字幕文件(文本文件)信息。
发明内容
本发明实施例提供一种提供文本文件的方法、系统及服务端,以实现准确提供与流媒体文件对应的文本文件信息。
本发明实施例的方法包括:服务端获取流媒体文件和文本文件的相关信息;并分别获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识,其中若流媒体文件和文本文件的相关信息中包含的文件名称和播放时长均相同,则判定流媒体文件的相关信息与文本文件的相关信息相互匹配;以及建立流媒体文件的文件标识和文本文件的文件标识之间的对应关系;确定终端当前新建任务所指向的流媒体文件;获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识;根据获得的文本文件的文件标识向终端提供文本文件信息。
本发明实施例的系统包括:终端,用于新建任务;服务端,用于获取流媒体文件和文本文件的相关信息,并分别获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识,其中若流媒体文件和文本文件的相关信息中包含的文件名称和播放时长均相同,则判定流媒体文件的相关信息与文本文件的相关信息相互匹配,以及建立流媒体文件的文件标识和文本文件的文件标识之间的对应关系,确定终端当前新建任务所指向的流媒体文件,获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识,以及根据获得的文本文件的文件标识向终端提供文本文件信息。
本发明实施例的服务端包括:获取匹配单元,用于获取流媒体文件和文本文件的相关信息,并匹配所述相关信息,所述获取匹配单元获取的流媒体文件和文本文件的相关信息中包含的文件名称和播放时长均相同,则判定流媒体文件的相关信息与文本文件的相关信息相互匹配;文件标识获取单元,用于获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识;对应关系建立单元,用于建立所述相关信息相互匹配的流媒体文件和文本文件的文件标识的对应关系;确定单元,用于确定终端当前新建任务所指向的流媒体文件;第一获取单元,用于获取该流媒体文件的文件标识;第二获取单元,用于根据对应关系获取与该流媒体文件对应的文本文件的文件标识;提供单元,用于根据文本文件的文件标识向终端提供文本文件信息。
本发明实施例中,服务端获取流媒体文件和文本文件的相关信息,并分别计算所述相关信息相互匹配的流媒体文件和文本文件的文件标识,以及建立对应关系。预先建立对应关系后,服务端确定终端当前新建任务所指向的流媒体文件,获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识,以及根据获得的文本文件的文件标识向终端提供文本文件信息。因此本发明实施例能够实现准确提供与流媒体文件对应的文本文件信息。
附图说明
图1为本发明实施例中的方法步骤流程图;
图2为本发明实施例中的系统结构示意图;
图3为本发明实施例中的服务端结构示意图之一;
图4为本发明实施例中的服务端结构示意图之二;
图5为本发明实施例中的服务端结构示意图之三;
图6为本发明方法实施例1的步骤流程图;
图7为本发明方法实施例2的步骤流程图;
图8为本发明方法实施例3的步骤流程图。
具体实施方式
为了实现准确提供与流媒体文件对应的文本文件信息,本发明实施例提供一种提供文本文件信息的方法、系统及服务端,以下分别简要概述。
本发明实施例提供一种提供文本文件信息的方法,在预先建立一些对应关系(可将其保存在数据库中)后,参见图1所示,执行下列主要步骤:
S1、确定终端当前新建任务所指向的流媒体文件;
S2、获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识;
S3、根据获得的文本文件的文件标识向终端提供文本文件信息。
所述文件标识可为文件名或内容签名(Content Identity,CID)等。其中,内容签名CID是根据预设的算法对二进制文件的内容数据进行计算后获得的。预设的算法可以是对不同的二进制文件的内容数据进行处理得到不同的处理结果的任一算法,其处理结果(即内容签名)可唯一标识二进制文件,或者,也可以是处理结果重复率极低,在可接受范围内的算法。
所述预先建立对应关系的步骤包括:服务端获取流媒体文件和文本文件的相关信息,分别获取相关信息相互匹配的流媒体文件和文本文件的文件标识,并建立其对应关系。
以下依次描述获取并匹配相关信息、获取文件标识、建立对应关系的具体步骤。
获取并匹配相关信息的步骤:流媒体文件和文本文件的相关信息均至少包括:文件名称和播放时长,还可以包括文件类型等。服务端获取文件的相关信息时,可直接获取文件名称,可通过下述方式获取播放时长:根据流媒体文件的文件头的内容获取流媒体文件的播放时长,根据文本文件的内容获取文本文件的播放时长。
当流媒体文件和文本文件的相关信息同时满足以下两个条件时,可判定流媒体文件和文本文件的相关信息相互匹配。
条件一、流媒体文件的相关信息中的文件名称和文本文件的相关信息中的文件名称相同;
条件二、流媒体文件的相关信息中的播放时长和文本文件的相关信息中的播放时长相同,或误差在一预定范围内(因有时最后一段字幕的出现时间不一定是视频播放的最后时刻)。
获取文件标识的步骤:
当文件标识为文件名时,直接从文件获取文件名;
当文件标识为内容签名CID时,获取文件标识包括以下因素(之后不再赘述):
因素一、采用能算出文件内容的唯一标识的算法来计算内容签名,或者,也可以是采用处理结果重复率极低,在可接受范围内的算法来计算,例如,对每个二进制文件的内容数据进行哈希运算,得到文件内容的哈希值,该文件内容的哈希值可以唯一代表该二进制文件内容信息。哈希算法可以采用信息-摘要算法MD(Message-Digest Algorithm)5、MD4等,安全散列算法SHA(SecureHash Algorithm)、SHS(Secure Hash Standard,)等。
因素二、选择计算的对象。例如,可以对文件的所有二进制数据内容进行计算;也可以任意选取文件中至少两段二进制数据内容进行计算,而且选取的每段二进制数据内容的长度任意,例如可以对文件起始20K字节信息、中间20K字节信息进行计算,也可以对文件起始10K字节信息、中间10K字节信息以及结尾10K字节信息进行计算。
因素三、对计算后的结果进行合成的方式。当任意选取文件中至少两段二进制数据内容进行计算时,对计算后得出的结果可以采用但不限于以下方式进行合成:例如采用MD5算法计算,可以将计算后得出的各MD5值首尾相连合成该文件的内容签名作为文件标识;也可以再以MD5算法对前述计算后得出的结果再进行计算,得出内容签名,作为该文件的文件标识。
建立对应关系的步骤:建立相关信息相互匹配的流媒体文件和文本文件的文件标识的对应关系,例如,可建立相关信息相互匹配的流媒体文件的内容签名和文本文件的文件名的对应关系,或建立相互匹配的流媒体文件和文本文件的内容签名的对应关系。进一步,该对应关系中还可以关联保存文本文件的URL(统一资源定位符)地址。
显然,当文件标识为内容签名CID时,所述步骤S2中,服务端获取该流媒体文件的文件标识所采用的算法,应当与建立所述对应关系时所采用的算法相同。
进一步,当对应关系中还关联保存文本文件的URL地址时,服务端向终端提供文本文件信息时的具体步骤包括:服务端根据获得的文本文件的文件标识得到关联的文本文件的URL地址,并向终端提供该URL地址,终端从该URL地址下载文本文件。
本发明实施例还提供一种提供文本文件信息的系统,参见图2所示,包括终端和服务端,其中,终端,用于新建任务;服务端,用于确定终端当前新建任务所指向的流媒体文件,获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识,以及根据获得的文本文件的文件标识向终端提供文本文件信息。
进一步,该系统中的服务端还用于获取流媒体文件和文本文件的相关信息,分别获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识,并建立其对应关系。
本发明实施例还提供一种提供文本文件信息的服务端,参见图3所示,包括:确定单元、第一获取单元、第二获取单元和提供单元。其中,确定单元,用于确定终端当前新建任务所指向的流媒体文件;第一获取单元,用于获取该流媒体文件的文件标识;第二获取单元,用于根据对应关系获取与该流媒体文件对应的文本文件的文件标识;提供单元,用于根据文本文件的文件标识向终端提供文本文件信息。
进一步,参见图4所示,该服务端还可以包括:获取匹配单元、文件标识获取单元、对应关系建立单元。其中,获取匹配单元,用于获取流媒体文件和文本文件的相关信息,并匹配所述相关信息;文件标识获取单元,用于获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识;对应关系建立单元,用于建立所述相关信息相互匹配的流媒体文件和文本文件的文件标识的对应关系。
再进一步,对应关系建立单元还在所述对应关系中关联保存文本文件的URL地址。参见图5所示,服务端还可包括第三获取单元,用于从对应关系中获取流媒体文件对应的文本文件的URL地址,并发送到所述提供单元。提供单元向终端提供文本文件的URL地址,供终端下载文本文件。
下面以3个实施例来详细描述本发明实施例的方法。
方法实施例1、提供视频文件对应的字幕文件信息。
本实施例中的流媒体文件为视频文件,文本文件为字幕文件,当前新建任务为播放视频文件。参见图6所示,本实施例的步骤流程如下:
步骤101、服务端确定用户当前播放的视频文件,例如用户通过视频播放程序(如Real player)播放电影或者在线播放电影(或MTV),服务端确定该电影(或MTV)的名称、文件类型等。
步骤102、服务端获取该视频文件的文件标识,并根据对应关系获得与该视频文件对应的字幕文件的文件标识。
服务端可以通过但不限于信息-摘要算法MD5(Message-Digest Algorithm5),分别对该视频文件(电影或MTV)起始的32k字节信息、中间的32k字节信息以及结尾的32k字节信息进行计算,得出对应的MD5值,然后将得出的各MD5值首尾相连合成该视频文件的内容签名作为文件标识,以该文件标识唯一确定该视频文件(电影或MTV)。
服务端获取该视频文件(电影或MTV)的文件标识后,根据预先建立的对应关系,获得与该视频文件(电影或MTV)对应的字幕文件的文件标识。
步骤103、服务端根据获得的字幕文件的文件标识向用户提供字幕文件信息。
用户通过视频播放程序(如Real player)播放电影或者在线播放的电影无字幕时,服务端根据获得的该电影对应的字幕文件的文件标识,向用户提供该电影对应的字幕文件信息。
本实施例在预先建立一些对应关系后,服务端确定用户当前播放的视频文件,获取该视频文件的文件标识,并根据对应关系获得与该视频文件对应的字幕文件的文件标识,然后服务端根据获得的字幕文件的文件标识向用户提供字幕文件信息。因此本实施例能够实现准确提供与视频文件对应的字幕文件信息。
方法实施例2、提供视频文件对应的字幕文件的URL地址,供用户下载视频文件对应的字幕文件。参见图7所示,本实施例的步骤流程如下:
本实施例中的流媒体文件为视频文件,文本文件为字幕文件,当前新建任务为下载视频文件。
步骤201、服务端确定用户当前下载的视频文件,例如服务端确定用户当前要下载的电影或MTV的名称、文件类型等。
步骤202、服务端获取该视频文件的文件标识,并根据对应关系获得与该视频文件对应的字幕文件的文件标识,并根据获得的文本文件的文件标识得到关联的URL地址。
服务端可以通过但不限于MD5算法,分别对该视频文件(电影或MTV)起始的32k字节信息和中间的32k字节信息进行计算,得出对应的MD5值,然后再次用MD5算法对得出的两个MD5值进行计算,得到内容签名,作为该视频文件的文件标识,以该文件标识唯一确定该视频文件(电影或MTV)。
服务端获取该视频文件(电影或MTV)的文件标识后,根据预先建立的对应关系,获得与该视频文件对应的字幕文件的文件标识。
本实施例的对应关系中还关联保存字幕文件的URL地址,服务端还可根据获得的字幕文件的文件标识,从对应关系中获得该字幕文件的URL地址。
步骤203、服务端向用户提供字幕文件的URL地址,用户从该URL地址下载字幕文件。
用户下载视频文件时,服务端还向用户提供该视频文件对应的字幕文件的URL地址,提示用户从该URL地址下载当前视频文件对应的字幕文件。
或者,用户已经下载过视频文件,但没有下载该视频文件对应的字幕文件,用户想要单独下载该视频文件对应的字幕文件时,服务端向用户提供该视频文件对应的字幕文件的URL地址,供用户下载该视频文件对应的字幕文件。
本实施例在预先建立一些对应关系后,服务端确定用户当前下载的视频文件,获取该视频文件的文件标识,并根据对应关系获得与该视频文件对应的字幕文件的文件标识,由于对应关系中还关联保存字幕文件的URL地址,服务端还可根据获得的字幕文件的文件标识,从对应关系中获得与该字幕文件的URL地址,然后向用户提供该URL地址,供用户下载字幕文件。因此本实施例能够实现准确提供与视频文件对应的字幕文件信息。
方法实施例3、提供音频文件对应的字幕文件的URL地址,供用户下载音频文件对应的字幕文件。参见图8所示,本实施例的步骤流程如下:
本实施例中的流媒体文件为音频文件,文本文件为字幕文件,当前新建任务为下载或播放音频文件。
步骤301、服务端确定用户当前下载或播放的音频文件,例如用户下载mp3或wav等格式的歌曲等,服务端确定当前要下载的歌曲的名称、文件类型等。
步骤302、服务端获取该音频文件的文件标识,并根据对应关系获得与该音频文件对应的字幕文件的文件标识,并根据获得的字幕文件的文件标识得到关联的URL地址。
服务端可以通过但不限于MD5算法,对该音频文件(歌曲)的所有二进制数据内容进行计算,得出对应的MD5值,即内容签名,作为该音频文件的文件标识,以该文件标识唯一确定该音频文件(歌曲)。
服务端获取该音频文件(歌曲)的文件标识后,根据预先建立的对应关系,获得与该音频文件(歌曲)对应的字幕文件(歌词)的文件标识。由于对应关系中还关联字幕文件的URL地址,服务端还可从对应关系中获得与该音频文件对应的字幕文件(歌词)的URL地址。
步骤303、服务端向用户提供该字幕文件的URL地址,供用户下载字幕文件。
用户下载歌曲时,服务端向用户提供歌曲对应的歌词的URL地址,提示用户从该URL地址下载歌词。
或者,用户已经下载一首歌曲,没有下载该歌曲对应的歌词,但用户希望播放该歌曲时同步看到对应的歌词,此时就需要下载该歌曲对应的歌词。当用户播放该歌曲或欲下载该歌曲对应的歌词时,服务端向用户提供该歌曲对应的歌词的URL地址,供用户下载该歌曲对应的歌词。
本实施例在预先建立一些对应关系后,服务端确定用户当前下载或播放的音频文件,获取该音频文件的文件标识,并根据对应关系获得与该音频文件对应的字幕文件的文件标识,由于对应关系中还关联保存字幕文件的URL地址,服务端还可从对应关系中获得与该字幕文件的URL地址,然后向用户提供该字幕文件的URL地址,供用户下载字幕文件。因此本实施例能够实现准确提供与音频文件对应的字幕文件信息。
下面以2个实施例来详细描述本发明实施例的系统。
系统实施例1、提供视频文件对应的字幕文件的URL地址,用户从该URL地址下载字幕文件。
系统中的服务端,预先建立一些对应关系,将其保存在数据库中。
服务端获取视频文件的相关信息,可直接获取文件名称和文件类型,并根据文件头的内容获取视频文件的播放时长;服务端获取字幕文件的相关信息,可直接获取文件名称和文件类型,并根据字幕文件的内容,获取字幕文件的播放时长。
当视频文件和字幕文件的相关信息同时满足以下两个条件时,服务端可判定视频文件和字幕文件的相关信息相互匹配:视频文件的相关信息中的文件名称和字幕文件的相关信息中的文件名称相同;视频文件的相关信息中的播放时长和字幕文件的相关信息中的播放时长相同。
服务端获取相关信息互相匹配的视频文件和字幕文件的文件标识,该文件标识可为文件名或内容签名等。
当文件标识为内容签名时,服务端获取文件标识包括以下因素(之后不再赘述):
因素一、服务端采用能算出文件内容的唯一标识的算法来计算内容签名,例如,对每个二进制文件的内容数据进行哈希运算,得到文件内容的哈希值,该文件内容的哈希值可以唯一代表该二进制文件内容信息。哈希算法可以采用信息-摘要算法,安全散列算法,安全散列算法等算法作为公式。
因素二、服务端选择计算的对象。例如,服务端可以对文件的所有二进制数据内容进行计算;也可以任意选取文件中至少两段二进制数据内容进行计算,而且选取的每段二进制数据内容的长度任意,例如服务端可以对文件起始20K字节信息、中间20K字节信息进行计算,也可以对文件起始20K字节信息、中间20K字节信息以及结尾20K字节信息进行计算。
因素三、服务端对计算后的结果进行合成的方式。当服务端任意选取文件中至少两段二进制数据内容进行计算时,对计算后得出的结果可以采用但不限于以下方式进行合成:例如服务端采用MD5算法计算,可以将计算后得出的各MD5值首尾相连合成该文件的内容签名作为文件标识;也可以再以MD5算法对前述计算后得出的结果再进行计算,得出内容签名,作为该文件的文件标识。
服务端建立相关信息相互匹配的视频文件和字幕文件的文件标识的对应关系,并关联保存字幕文件的URL地址。
系统中的终端,用于新建任务,例如用户新建下载视频文件的任务,也可以新建播放视频文件的任务。
系统中的服务端确定用户当前下载或播放的视频文件,获取该视频文件的文件标识,根据该视频文件的文件标识,从对应关系中获得该视频文件对应的字幕文件的文件标识,再根据该字幕文件的文件标识获得字幕文件的URL地址,并向用户提供该URL地址,用户从该URL地址下载当前视频文件对应的字幕文件。
本实施例在预先建立一些对应关系后,服务端确定用户当前下载或播放的视频文件,获取该视频文件的文件标识,并根据对应关系获得与该视频文件对应的字幕文件的文件标识,由于对应关系中还关联保存字幕文件的URL地址,服务端还可根据字幕文件的文件标识,从对应关系中获得该字幕文件的URL地址,然后向用户提供该URL地址,用户从该URL地址下载视频文件对应的字幕文件。因此本实施例能够实现准确提供与视频文件对应的字幕文件信息。
系统实施例2、提供音频文件对应的字幕文件的URL地址,用户从该URL地址下载字幕文件。
系统中的服务端,预先建立一些对应关系,将其保存在数据库中。
服务端获取音频文件的相关信息,可直接获取文件名称和文件类型,并根据文件头的内容获取音频文件的播放时长;服务端获取字幕文件的相关信息,可直接获取文件名称和文件类型,并根据字幕文件的内容,获取字幕文件的播放时长。
当音频文件和字幕文件的相关信息同时满足以下两个条件时,服务端可判定音频文件和字幕文件的相关信息相互匹配:音频文件的相关信息中的文件名称和字幕文件的相关信息中的文件名称相同;音频文件的相关信息中的播放时长和字幕文件的相关信息中的播放时长相同。
当文件标识为内容签名时,服务端按照上述计算相关信息互相匹配的视频文件和字幕文件的内容签名的方法,对相关信息互相匹配的音频文件和字幕文件进行计算,得出其内容签名作为文件标识,并关联保存相关信息相互匹配的音频文件和字幕文件的文件标识的对应关系,并关联保存字幕文件的URL地址。
系统中的终端,用于新建任务,例如新建下载音频文件的任务,也可以新建播放音频文件的任务。
系统中的服务端确定终端当前下载或播放的音频文件,获取该音频文件的文件标识,根据当前音频文件的文件标识,从对应关系中获得该音频文件对应的字幕文件的文件标识,再根据获得的字幕文件的文件标识,从对应关系中获得字幕文件的URL地址,并向终端提供该URL地址,终端从该URL地址下载当前音频文件对应的字幕文件。
本实施例在预先建立一些对应关系后,服务端确定终端当前下载或播放的音频文件,获取该音频文件的文件标识,并根据对应关系获得与该音频文件对应的字幕文件的文件标识,由于对应关系中还关联保存字幕文件的URL地址,服务端还可根据获得的字幕文件的文件标识,从对应关系中获得该字幕文件的URL地址,然后服务端向终端提供该URL地址,终端从该URL地址下载音频文件对应的字幕文件。因此本实施例能够实现准确提供与音频文件对应的字幕文件信息。
下面以2个实施例来详细描述本发明实施例的服务端。
服务端实施例1、提供视频文件对应的字幕文件,不包括第三获取单元。
本实施例提供的服务端,参见图4所示,包括:获取匹配单元、文件标识获取单元、对应关系建立单元、确定单元、第一获取单元、第二获取单元和提供单元。
获取匹配单元获取视频文件和字幕文件的相关信息,并匹配获取的相关信息。获取视频文件的相关信息时,可直接获取文件名称和文件类型,并根据视频文件文件头的内容获取视频文件的播放时长;获取字幕文件的相关信息时,可直接获取文件名称和文件类型,并根据字幕文件的内容,获取字幕文件的播放时长。
当视频文件和字幕文件的相关信息同时满足以下两个条件时,获取匹配单元可判定视频文件和字幕文件的相关信息相互匹配:视频文件的相关信息中的文件名称和字幕文件的相关信息中的文件名称相同;视频文件的相关信息中的播放时长和字幕文件的相关信息中的播放时长相同。
文件标识获取单元获取相关信息互相匹配的视频文件和字幕文件的文件标识,该文件标识可为文件名或内容签名等。
当文件标识为内容签名时,文件标识获取单元计算文件标识包括以下因素(之后不再赘述):
因素一、文件标识获取单元采用能算出文件内容的唯一标识的算法来计算内容签名,或者,也可以是采用处理结果重复率极低,在可接受范围内的算法来计算,例如,对每个二进制文件的内容数据进行哈希运算,得到文件内容的哈希值,该文件内容的哈希值可以唯一代表该二进制文件内容信息。哈希算法可以采用信息-摘要算法,安全散列算法,安全散列算法等算法作为公式。
因素二、文件标识获取单元选择计算的对象。例如,文件标识获取单元可以对文件的所有二进制数据内容进行计算;也可以任意选取文件中至少两段二进制数据内容进行计算,而且选取的每段二进制数据内容的长度任意,例如文件标识获取单元可以对文件起始20K字节信息、中间20K字节信息进行计算,也可以对文件起始20K字节信息、中间20K字节信息以及结尾20K字节信息进行计算。
因素三、文件标识获取单元对计算后的结果进行合成的方式。当文件标识获取单元任意选取文件中至少两段二进制数据内容进行计算时,对计算后得出的结果可以采用但不限于以下方式进行合成:例如文件标识获取单元采用MD5算法计算,可以将计算后得出的各MD5值首尾相连合成该文件的内容签名作为文件标识;也可以再以MD5算法对前述计算后得出的结果再进行计算,得出内容签名,作为该文件的文件标识。
对应关系建立单元建立相关信息相互匹配的视频文件和字幕文件的文件标识的对应关系。
确定单元确定终端当前新建任务所指向的视频文件。
第一获取单元获取该视频文件的文件标识。
第二获取单元根据对应关系建立单元预先建立的对应关系,获取与与该视频文件对应的字幕文件的文件标识。
提供单元根据字幕文件的文件标识向终端提供该字幕文件信息。
本实施例的服务端中,获取匹配单元获取视频文件和字幕文件的相关信息,并匹配相关信息;文件标识获取单元获取相关信息相互匹配的视频文件和字幕文件的文件标识;对应关系建立单元建立相关信息相互匹配的视频文件和字幕文件的文件标识的对应关系;确定单元确定用户当前新建任务所指向的视频文件;第一获取单元获取该视频文件的文件标识;第二获取单元根据对应关系建立单元预先建立的对应关系,获取与与该视频文件对应的字幕文件的文件标识;提供单元向用户提供该字幕文件的文件标识对应的字幕文件信息。因此本实施例能够实现准确提供与视频文件对应的字幕文件信息。
服务端实施例2、包括第三获取单元,提供音频文件对应的字幕文件的URL地址,供用户下载字幕文件。
本实施例提供的服务端,参见图5所示,包括:获取匹配单元、文件标识获取单元、对应关系建立单元、确定单元、第一获取单元、第二获取单元、第三获取单元和提供单元。
获取匹配单元获取音频文件和字幕文件的相关信息,并匹配获取的相关信息。获取音频文件的相关信息时,可直接获取文件名称和文件类型,并根据音频文件文件头的内容获取音频文件的播放时长;获取字幕文件的相关信息时,可直接获取文件名称和文件类型,并根据字幕文件的内容,获取字幕文件的播放时长。
当音频文件和字幕文件的相关信息同时满足以下两个条件时,获取匹配单元可判定音频文件和字幕文件的相关信息相互匹配:音频文件的相关信息中的文件名称和字幕文件的相关信息中的文件名称相同;音频文件的相关信息中的播放时长和字幕文件的相关信息中的播放时长相同。
当文件标识为内容签名时,文件标识获取单元按照上述计算相关信息互相匹配的视频文件和字幕文件的文件标识的方法,对相关信息互相匹配的音频文件和字幕文件进行计算,得出其文件标识。
对应关系建立单元建立相关信息相互匹配的视频文件和字幕文件的文件标识的对应关系,还在对应关系中关联保存字幕文件的URL地址。
确定单元确定终端当前新建任务所指向的音频文件。
第一获取单元获取该视频文件的文件标识。
第二获取单元根据对应关系建立单元预先建立的对应关系,获取与与该视频文件对应的字幕文件的文件标识。
第三获取单元根据第二获取单元获取的字幕文件的文件标识,从对应关系建立单元预先建立的对应关系中获取该字幕文件的URL地址,并发送到提供单元。
提供单元向用户提供该字幕文件的URL地址,供用户下载音频文件对应的字幕文件信息。
本实施例的服务端中,获取匹配单元获取音频文件和字幕文件的相关信息,并匹配相关信息;文件标识获取单元计算相关信息相互匹配的音频文件和字幕文件的文件标识;对应关系建立单元建立相关信息相互匹配的音频文件和字幕文件的文件标识的对应关系;确定单元确定用户当前新建任务所指向的音频文件;第一获取单元获取该音频文件的文件标识;第二获取单元根据对应关系建立单元预先建立的对应关系,获取与与该音频文件对应的字幕文件的文件标识;第三获取单元根据第二获取单元获取的字幕文件的文件标识,从对应关系中获取该字幕文件的URL地址,并发送到提供单元;提供单元向用户提供该字幕文件的URL地址,供用户下载音频文件对应的字幕文件。因此本实施例能够实现准确提供与音频文件对应的字幕文件信息。
综上所述,本发明实施例在预先建立一些对应关系后,服务端确定用户当前新建任务所指向的视频文件或音频文件,获取该文件的文件标识,并根据对应关系获得与该文件对应的字幕文件的文件标识,然后服务端根据获得的字幕文件的文件标识向用户提供字幕文件信息。进一步,对应关系中还可以关联保存字幕文件的URL地址,服务端还可根据获取的字幕文件的文件标识,从对应关系中获得该字幕文件的URL地址,然后向用户提供该字幕文件的URL地址,供用户下载视频文件对应的字幕文件。因此本发明实施例能够实现准确提供与视频文件或音频文件对应的字幕文件信息。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种提供文本文件信息的方法,其特征在于,包括下列步骤:
服务端获取流媒体文件和文本文件的相关信息;并
分别获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识,其中若流媒体文件和文本文件的相关信息中包含的文件名称和播放时长均相同,则判定流媒体文件的相关信息与文本文件的相关信息相互匹配;以及
建立流媒体文件的文件标识和文本文件的文件标识之间的对应关系;
确定终端当前新建任务所指向的流媒体文件;
获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识;
根据获得的文本文件的文件标识向终端提供文本文件信息。
2.如权利要求1所述的方法,其特征在于,所述对应关系中还关联保存文本文件的统一资源定位符URL地址,以及
服务端向终端提供文本文件信息时具体包括:根据获得的文本文件的文件标识得到关联的URL地址,并向终端提供该URL地址,终端从该URL地址下载文本文件。
3.如权利要求1所述的方法,其特征在于,服务端从流媒体文件文件头的内容中获取流媒体文件的播放时长,从文本文件的内容中获取文本文件的播放时长。
4.如权利要求1所述的方法,其特征在于,所述文件标识为通过预定算法对二进制文件的内容数据进行计算后获得的文件内容签名,该预定算法为对不同的二进制文件的内容数据进行处理得到不同的处理结果的算法。
5.一种提供文本文件信息的系统,其特征在于,包括:
终端,用于新建任务;
服务端,用于获取流媒体文件和文本文件的相关信息,并分别获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识,其中若流媒体文件和文本文件的相关信息中包含的文件名称和播放时长均相同,则判定流媒体文件的相关信息与文本文件的相关信息相互匹配,以及建立流媒体文件的文件标识和文本文件的文件标识之间的对应关系,确定终端当前新建任务所指向的流媒体文件,获取该流媒体文件的文件标识,并根据对应关系获得与该流媒体文件对应的文本文件的文件标识,以及根据获得的文本文件的文件标识向终端提供文本文件信息。
6.如权利要求5所述的系统,其特征在于,服务端还在建立的对应关系中关联保存文本文件的统一资源定位符URL地址,以及
根据获得的文本文件的文件标识得到关联的URL地址,并向终端提供该URL地址,终端从该URL地址下载文本文件。
7.如权利要求5所述的系统,其特征在于,服务端从流媒体文件文件头的内容中获取流媒体文件的播放时长,从文本文件的内容中获取文本文件的播放时长。
8.如权利要求5所述的系统,其特征在于,服务端通过预定算法对二进制文件的内容数据进行计算后获得文件的内容签名作为所述文件标识,该预定算法为对不同的二进制文件的内容数据进行处理得到不同的处理结果的算法。
9.一种提供文本文件信息的服务端,其特征在于,包括:
获取匹配单元,用于获取流媒体文件和文本文件的相关信息,并匹配所述相关信息,所述获取匹配单元获取的流媒体文件和文本文件的相关信息中包含的文件名称和播放时长均相同,则判定流媒体文件的相关信息与文本文件的相关信息相互匹配;
文件标识获取单元,用于获取所述相关信息相互匹配的流媒体文件和文本文件的文件标识;
对应关系建立单元,用于建立所述相关信息相互匹配的流媒体文件和文本文件的文件标识的对应关系;
确定单元,用于确定终端当前新建任务所指向的流媒体文件;
第一获取单元,用于获取该流媒体文件的文件标识;
第二获取单元,用于根据对应关系获取与该流媒体文件对应的文本文件的文件标识;
提供单元,用于根据文本文件的文件标识向终端提供文本文件信息。
10.如权利要求9所述的服务端,其特征在于,还包括第三获取单元;
所述对应关系建立单元还在所述对应关系中关联保存文本文件的URL地址,第三获取单元用于从所述对应关系中获取流媒体文件对应的文本文件的URL地址,并发送到所述提供单元,所述提供单元向终端提供文本文件的URL地址,供终端下载文本文件。
11.如权利要求9所述的服务端,其特征在于,所述获取匹配单元从流媒体文件文件头的内容中获取流媒体文件的播放时长,从文本文件的内容中获取文本文件的播放时长。
12.如权利要求9所述的服务端,其特征在于,所述文件标识获取单元通过预定算法对二进制文件的内容数据进行计算后获得文件的内容签名作为所述文件标识,该预定算法为对不同的二进制文件的内容数据进行处理得到不同的处理结果的算法。
CN2007101606080A 2007-12-21 2007-12-21 一种提供文本文件信息的方法、系统及服务端 Expired - Fee Related CN101179347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101606080A CN101179347B (zh) 2007-12-21 2007-12-21 一种提供文本文件信息的方法、系统及服务端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101606080A CN101179347B (zh) 2007-12-21 2007-12-21 一种提供文本文件信息的方法、系统及服务端

Publications (2)

Publication Number Publication Date
CN101179347A CN101179347A (zh) 2008-05-14
CN101179347B true CN101179347B (zh) 2010-11-24

Family

ID=39405451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101606080A Expired - Fee Related CN101179347B (zh) 2007-12-21 2007-12-21 一种提供文本文件信息的方法、系统及服务端

Country Status (1)

Country Link
CN (1) CN101179347B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101616181B (zh) 2009-07-27 2013-06-05 腾讯科技(深圳)有限公司 一种上传和下载字幕文件的方法、系统和设备
CN102193943B (zh) * 2010-03-12 2013-10-30 腾讯科技(深圳)有限公司 向用户提供媒体数据的方法和装置
CN101937695B (zh) * 2010-08-30 2012-08-29 中国电信股份有限公司 富媒体业务场景播放方法及文件播放器
CN103870577A (zh) * 2014-03-20 2014-06-18 梁鸿才 执法记录仪重要媒体文件自动识别判断方法及装置
CN103986940A (zh) * 2014-06-03 2014-08-13 王军明 一种视频字幕的流化方法
CN110177150A (zh) * 2019-06-06 2019-08-27 北京金山安全软件有限公司 一种数据获取方法、装置、电子设备及可读存储介质
CN113835649B (zh) * 2020-06-08 2024-09-10 花瓣云科技有限公司 一种投屏方法和终端
CN114785773A (zh) * 2022-04-27 2022-07-22 广州宸祺出行科技有限公司 一种将文件数据消息化的文件传输方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505032A (zh) * 2002-12-04 2004-06-16 上海乐金广电电子有限公司 利用国际互联网的光盘播放方法
CN1543212A (zh) * 2003-04-28 2004-11-03 株式会社东芝 再现装置
CN1890662A (zh) * 2003-09-29 2007-01-03 千兆科技(深圳)有限公司 内容定向的索引和搜索方法与系统
CN1980302A (zh) * 2005-12-09 2007-06-13 中兴通讯股份有限公司 在移动通讯终端上实现文字与音频或视频同步显示的方法
CN101030873A (zh) * 2007-02-15 2007-09-05 深圳市迅雷网络技术有限公司 一种下载数据的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505032A (zh) * 2002-12-04 2004-06-16 上海乐金广电电子有限公司 利用国际互联网的光盘播放方法
CN1543212A (zh) * 2003-04-28 2004-11-03 株式会社东芝 再现装置
CN1890662A (zh) * 2003-09-29 2007-01-03 千兆科技(深圳)有限公司 内容定向的索引和搜索方法与系统
CN1980302A (zh) * 2005-12-09 2007-06-13 中兴通讯股份有限公司 在移动通讯终端上实现文字与音频或视频同步显示的方法
CN101030873A (zh) * 2007-02-15 2007-09-05 深圳市迅雷网络技术有限公司 一种下载数据的方法及系统

Also Published As

Publication number Publication date
CN101179347A (zh) 2008-05-14

Similar Documents

Publication Publication Date Title
CN101179347B (zh) 一种提供文本文件信息的方法、系统及服务端
CN100498259C (zh) 使附加数据和基本数据同步的装置和方法
CN105025319B (zh) 一种视频推送方法和装置
US8090606B2 (en) Embedded media recommendations
US8200602B2 (en) System and method for creating thematic listening experiences in a networked peer media recommendation environment
US20120296908A1 (en) Appapatus and method for generating a collection profile and for communicating based on the collection profile
US8595330B2 (en) Method, system and apparatus for uploading and downloading a caption file
US20140139555A1 (en) Method of adding expression to text messages
CN104980773B (zh) 一种流媒体处理方法、装置、终端及服务器
TWI474200B (zh) Scene clip playback system, method and recording medium thereof
CN105376612A (zh) 一种视频播放方法、媒体设备、播放设备以及多媒体系统
US20070219937A1 (en) Automated visualization for enhanced music playback
US20090100093A1 (en) Apparatus, system, method and computer program product for previewing media files
CN102970281B (zh) 一种处理多媒体播放记录的方法、用户终端和服务器
CN110636345B (zh) 一种同一身份账号下的多媒体信息共享方法和系统
KR20110075259A (ko) 사용자 선호와 평가를 반영한 음악 재생 목록을 생성하는 온라인 음악 서비스 장치 및 방법
WO2012037671A1 (en) Systems and methods for client-side media chunking
JP2009266083A (ja) 試聴用コンテンツ配信システムおよび端末装置
CN110035296B (zh) 直播间歌曲信息的显示方法、设备及可读存储介质
WO2007000706A2 (en) Block signature based data transfer
EP2426941A1 (en) Content replay system, control device and replay device
CN105141572A (zh) 播放方法与应用其的发送装置、播放装置与通信系统
KR101554662B1 (ko) 디지털 오디오 데이터에 대한 코드 제공 방법 및 이에 의한 사용자 단말
KR100462826B1 (ko) 독립된 둘 이상의 멀티미디어 데이터의 동기화 재생을 위한 휴대용 멀티미디어 데이터 재생 장치 및 그 재생 제어 방법과, 멀티미디어 데이터를 제공하는 시스템
JP2011146879A (ja) コンテンツ再生装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101124

Termination date: 20111221