CN104244081B

CN104244081B - 视频的提供方法及装置

Info

Publication number: CN104244081B
Application number: CN201410505739.8A
Authority: CN
Inventors: 向林林; 马健
Original assignee: Conew Network Technology Beijing Co Ltd
Current assignee: Conew Network Technology Beijing Co Ltd
Priority date: 2014-09-26
Filing date: 2014-09-26
Publication date: 2018-10-16
Anticipated expiration: 2034-09-26
Also published as: CN104244081A

Abstract

本发明公开了一种视频的提供方法，包括：接收待提供视频的视频数据和与视频数据相关的多种语言的语音文件和字幕文件；接收输入的语音字幕选择指令；根据语音字幕选择指令从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件；以及将选择的语音文件和字幕文件加载至待提供视频，并将加载过语音文件和字幕文件的待提供视频提供至用户。本发明实施例的方法实现了用户可以根据需要来定制自己的播放语音的语言类型和播放字幕类型的设置功能，扩展了视频客户端或视频播放器的使用功能，对于用户而言，提升了用户体验。本发明还公开了一种视频的提供装置。

Description

视频的提供方法及装置

技术领域

本发明涉及互联网技术领域，尤其涉及一种视频的提供方法及装置。

背景技术

随着互联网的发展，越来越多的国际化信息开始进入普通大众的生活中。例如，目前大量的国外视频被引入国内，一般视频提供商会提供与这些国外视频对应的国内语言的字幕和/或语音，以便本国用户通过视频客户端软件或视频网站进行观看。

但是存在的问题是，不管是PC(Personal Computer，个人计算机)机还是移动终端，在视频进行播放时，大部分都没有可以让用户自己根据需要来定制的播放语音的语言类型和播放字幕类型的设置功能，导致用户体验差。

发明内容

本发明的目的旨在至少在一定程度上解决上述的技术问题之一。

为此，本发明的第一个目的在于提出一种视频的提供方法。该方法使得在用户播放视频时即可根据自己的需要来设置语音的语言类型和字幕类型，扩展了视频客户端或视频播放器的使用功能，对于用户而言，提升了用户体验。

本发明的第二个目的在于提出一种视频的提供装置。

为了实现上述目的，本发明第一方面实施例的视频的提供方法，包括：接收待提供视频的视频数据和与所述视频数据相关的多种语言的语音文件和字幕文件；接收输入的语音字幕选择指令；根据所述语音字幕选择指令从所述多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件；以及将选择的所述语音文件和字幕文件加载至所述待提供视频，并将加载过所述语音文件和字幕文件的待提供视频提供至用户。

本发明实施例的视频的提供方法，可接收待提供视频的视频数据和与视频数据相关的多种语言的语音文件和字幕文件，之后可接收输入的语音字幕选择指令，并根据该指令从中选择一个语音文件和字幕文件，以及将选择的语音文件和字幕文件加载至待提供视频，并将加载过语音文件和字幕文件的待提供视频提供至用户，实现了用户可以根据需要来定制自己的播放语音的语言类型和播放字幕类型的设置功能，扩展了视频客户端或视频播放器的使用功能，对于用户而言，提升了用户体验。

为了实现上述目的，本发明第二方面实施例的视频的提供装置，包括：第一接收模块，用于接收待提供视频的视频数据和与所述视频数据相关的多种语言的语音文件和字幕文件；第二接收模块，用于接收输入的语音字幕选择指令；选择模块，用于根据所述语音字幕选择指令从所述多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件；加载模块，用于将选择的所述语音文件和字幕文件加载至所述待提供视频；以及提供模块，用于将加载过所述语音文件和字幕文件的待提供视频提供至用户。

本发明实施例的视频的提供装置，可通过第一接收模块接收待提供视频的视频数据和与视频数据相关的多种语言的语音文件和字幕文件，第二接收模块接收输入的语音字幕选择指令，选择模块根据语音字幕选择指令从中选择一个语音文件和字幕文件，生成模块根据选择的语音文件和字幕文件生成目标语音文件和目标字幕文件，加载模块将选择的语音文件和字幕文件加载至待提供视频，提供模块将加载过语音文件和字幕文件的待提供视频提供至用户，实现了用户可以根据需要来定制自己的播放语音的语言类型和播放字幕类型的设置功能，扩展了视频客户端或视频播放器的使用功能，对于用户而言，提升了用户体验。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中，

图1是根据本发明一个实施例的视频的提供方法的流程图；

图2是根据本发明另一个实施例的视频的提供方法的流程图；

图3是根据本发明一个实施例的视频的提供装置的结构示意图；

图4是根据本发明另一个实施例的视频的提供装置的结构示意图；

图5是根据本发明一个实施例的视频的提供装置中生成模块的结构示意图；

图6是根据本发明又一个实施例的视频的提供装置的结构示意图；

图7是根据本发明又另一个实施例的视频的提供装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

目前，在播放视频的时候，某些视频客户端软件可以对部分视频进行国语和视频原有拍摄的语言切换，但是，视频字幕不可以切换且也不可以多种语言的字幕同时出现；还有很多电影或电视剧第一次可以在互联网上看到时都只有对应拍剧本时的语言，比如美剧或韩剧，对于一个可能不懂英语或韩语又想马上看剧的用户而言，不能实时翻译而去直接看画面是非常痛苦地；如果想要看到一些其他语言版本，则需手动去切换视频源，非常不方便。随着互联网的发展，观众遍布在全球的每个角落，语言千差万别，而现有的语言和字幕类型切换，远远不能满足观众的需要，也不能消除人们之间的语言障碍。

为此，本发明提出了一种视频的提供方法及装置，可以实现用户根据个人需要，通过手动设置播放语言和字幕，娱乐的同时还可学习其他语言。具体地，下面参考附图描述根据本发明实施例的视频的提供方法及装置。

图1是根据本发明一个实施例的视频的提供方法的流程图，该实施例可从视频客户端或视频播放器侧进行描述，其中，视频客户端可理解为被应用于移动终端上，视频播放器可理解为被应用于终端(如PC机)上。如图1所示，该视频的提供方法可以包括：

S101，接收待提供视频的视频数据和与视频数据相关的多种语言的语音文件和字幕文件。

例如，当用户通过视频客户端或视频播放器播放某个视频时，视频客户端或视频播放器会先接收服务器下发的该视频的视频数据，和与该视频数据相关的一些常用多种语言的语音文件和字幕文件。

S102，接收输入的语音字幕选择指令。

例如，以视频客户端或视频播放器为用户提供可以设置播放语音的语言类型和播放字幕类型为例，用户可通过视频客户端或视频播放器提供的设置功能对播放语言和播放字幕类型进行选择。

S103，根据语音字幕选择指令从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。

其中，在本发明的实施例中，用户选择的目标语音和目标字幕可理解为用户希望视频使用用户选择的语音和字幕进行播放。

具体地，当视频客户端或视频播放器接收到用户输入的语音字幕选择指令之后，可根据该指令从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。例如，当用户想观看某个视频时，用户通过在设置页面中选择了目标语音和目标字幕，这时，视频客户端或视频播放器可根据用户的选择从待提供视频中的多种语言的语音文件和字幕文件中选择出用户期待选择的语音文件和字幕文件。

S104，将选择的语音文件和字幕文件加载至待提供视频，并将加载过语音文件和字幕文件的待提供视频提供至用户。

进一步的，为了提升用户体验，可不通过用户手动选择目标语音和目标字幕，只需根据视频客户端或视频播放器自身默认的语音类型，从视频的语音文件和字幕文件中找出与视频客户端或视频播放器自身默认的语音类型对应的语音文件和字幕文件进行加载来播放该视频。具体地，在本发明的一个实施例中，在接收输入的语音字幕选择指令(即上述S102)之前，该视频的提供方法还可包括：先获取加载视频数据的客户端的默认语音。之后，根据默认语言从多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载。

进一步的，为了提升用户体验，可不通过用户手动选择目标语音和目标字幕，只需获取用户输入的搜索信息(如某个视频的搜索词)，并对该搜索信息进行语言类型分析以获取对应的语言，之后从视频的语音文件和字幕文件中找出与该语言对应的语音文件和字幕文件进行加载来播放该视频。具体地，在本发明的一个实施例中，在接收输入的语音字幕选择指令(即上述S102)之前，该视频的提供方法还可包括：先接收输入的搜索信息，并获取搜索信息对应的语言。之后，根据搜索信息对应的语言从多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载。

需要说明的是，在本发明的一个实施例中，还可接收输入的目标语音和多个目标字幕选择指令，之后可加载目标语音文件与多个目标字幕文件进行视频播放。也就是说，当用户播放某个视频时，可选择需要播放的语言和多个语言版本的字幕，这样可避免用户手动去搜索不同语言对应的视频源，实现了一个视频页面中支持多种语言版本的字幕，对于用户来说，娱乐的同时还可学习其他语言。

本发明实施例的视频的提供方法，可接收视频数据和与视频数据相关的多种语言的语音文件和字幕文件，之后可接收输入的语音字幕选择指令，并根据该指令从中选择一个语音文件和字幕文件，以及将选择的语音文件和字幕文件加载至待提供视频，并将加载过语音文件和字幕文件的待提供视频提供至用户，实现了用户可以根据需要来定制自己的播放语音的语言类型和播放字幕类型的设置功能，实现了用户可以根据需要来定制自己的播放语音的语言类型和播放字幕类型的设置功能，扩展了视频客户端或视频播放器的使用功能，对于用户而言，提升了用户体验。

需要说明的是，在本发明的一个实施例中，当未接受到输入的语音字幕选择指令，即用户未进行语音和字幕的设置时，可加载该视频本身默认给定的语音文件和对应的字幕文件。

还需要说明的是，在本发明的一个实施例中，用户还可通过语音来输入用户的语音字幕选择指令，即可通过语音来对视频进行语言和字幕类型的设置。例如，用户对着客户端所在设备的麦克风进行语音：语音-中文，字幕-中文，之后，可根据该语音指令进行语言和字幕类型的设置。

图2是根据本发明另一个实施例的视频的提供方法的流程图。

需要说明的是，用户选择的目标语音和目标字幕可能不属于多种语言的语音文件和字幕文件中，因此需对用户选择的目标语音和目标字幕进行判断以确定其是否属于多种语言的语音文件和字幕文件。具体地，如图2所示，该视频的提供方法可以包括：

S201，接收待提供视频的视频数据和与视频数据相关的多种语言的语音文件和字幕文件。

S202，接收输入的语音字幕选择指令。

S203，根据语音字幕选择指令判断选择的目标语音和目标字幕是否属于多种语言的语音文件和字幕文件。

具体地，当视频客户端或视频播放器接收到输入的语音字幕选择指令之后，判断用户选择的目标语音和目标字幕是否属于上述多种语言的语音文件和字幕文件。例如，当用户想观看某个视频时，用户通过在设置页面中选择了目标语音和目标字幕，这时，视频客户端或视频播放器需判断用户选择的目标语音和目标字幕是否属于该视频的多种语言中的语音文件和字幕文件。

S204，如果目标语音和目标字幕不属于多种语言的语音文件和字幕文件，则从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。

也就是说，当多种语言的语音文件和字幕文件中没有用户需要的目标语音和目标字幕时，视频客户端或视频播放器可从该多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。

S205，根据选择的语音文件和字幕文件生成目标语音文件和目标字幕文件并加载，并将加载过生成的目标语音文件和目标字幕文件的待提供视频提供至用户。

例如，可根据选择的语音文件和字幕文件通过语音合成技术或实时语音翻译以生成目标语音文件和目标字幕文件，并加载该生成后的目标语音文件和目标字幕文件以为用户播放对应的视频。具体而言，在本发明的实施例中，首先，根据选择的字幕文件进行翻译以生成目标字幕文件。之后，获取选择的语音文件中的背景音，并将字幕文件按照目标语音文件对应的语言播放以生成配音。然后，将背景音和配音进行合成以生成目标语音文件。最后，加载目标语音文件和目标字幕文件。其中，在本发明的实施例中，可对生成后的目标字幕文件和生成后的目标语音文件进行保存，以方便用户下次观看，避免了翻译和合成的重复操作。

举例而言，以用户观看韩国正在直播的某个综艺视频节目为例，假设用户想用汉语语音类型和汉语字幕类型对该视频进行播放，由于直播视频当前不能提供较多的语音文件和字幕文件以供用户选择，所以，可先对的韩语字幕文件进行翻译以生成用户需要的目标字幕文件，即汉语字幕文件。之后，可从该视频的的韩语语音文件中获取出背景音，并通过实时语音翻译技术将的韩语字幕文件按照汉语语言进行播放，以生成对应的汉语配音。然后，通过语音合成技术将上述背景音和配音进行合成来生成用户需要的汉语语音文件。最后，加载汉语语音文件和汉语字幕文件。由此，通过实时在线翻译和语音合成技术使得用户可以及时地观看视频，不必烦恼可能看不懂等问题。

S206，如果目标语音和目标字幕属于多种语言的语音文件和字幕文件，则选择目标语音和目标字幕对应的语音文件和字幕文件进行加载，并将加载过与目标语音和目标字幕对应的语音文件和字幕文件的待提供视频提供至用户。

本发明实施例的视频的提供方法，在接收到输入的语音字幕选择指令之后，可根据语音字幕选择指令判断选择的目标语音和目标字幕是否属于多种语言的语音文件和字幕文件，若否，则可从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件，并根据选择的语音文件和字幕文件生成目标语音文件和目标字幕文件并加载，以及将加载过生成的目标语音文件和目标字幕文件的待提供视频提供至用户，通过对用户选择的目标语音和目标字幕进行判断以确定其是否属于多种语言的语音文件和字幕文件，完善了视频客户端或视频播放器的设置功能。

为了实现上述实施例，本发明还提出了一种视频的提供装置。

图3是根据本发明一个实施例的视频的提供装置的结构示意图。如图3所示，该视频的提供装置可以包括：第一接收模块10、第二接收模块20、选择模块30、加载模块40和提供模块50。

具体地，第一接收模块10可用于接收待提供视频的视频数据和与视频数据相关的多种语言的语音文件和字幕文件。例如，当用户通过视频客户端或视频播放器播放某个视频时，第一接收模块10可先接收服务器下发的该视频的视频数据，和与该视频数据相关的一些常用多种语言的语音文件和字幕文件。

第二接收模块20可用于接收输入的语音字幕选择指令。例如，以视频客户端或视频播放器为用户提供可以设置播放语音的语言类型和播放字幕类型为例，用户可通过视频客户端或视频播放器提供的设置功能对播放语言和播放字幕类型进行选择，第二接收模块20可接收用户对应的选择指令。

选择模块30可用于根据语音字幕选择指令从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。其中，在本发明的实施例中，用户选择的目标语音和目标字幕可理解为用户希望视频使用用户选择的语音和字幕进行播放。

更具体地，当第二接收模块20接收到用户输入的语音字幕选择指令之后，选择模块30可根据该指令从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。例如，当用户想观看某个视频时，用户通过在设置页面中选择了目标语音和目标字幕，这时，选择模块30可根据用户的选择从待提供视频中的多种语言的语音文件和字幕文件中选择出用户期待选择的语音文件和字幕文件。

加载模块40可用于将选择的语音文件和字幕文件加载至待提供视频。提供模块50可用于将加载过语音文件和字幕文件的待提供视频提供至用户。

进一步的，在本发明的一个实施例中，如图4所示，该视频的提供装置还可包括：判断模块60和生成模块70。具体地，判断模块60可用于在第二接收模块20接收到输入的语音字幕选择指令之后，根据语音字幕选择指令判断用户选择的目标语音和目标字幕是否属于多种语言的默认语音文件和默认字幕文件。其中，在本发明的实施例中，用户选择的目标语音和目标字幕可理解为用户希望视频使用用户选择的语音和字幕进行播放。

更具体地，在第二接收模块20接收到输入的语音字幕选择指令之后，判断模块60判断用户选择的目标语音和目标字幕是否属于上述多种语言的默认语音文件和默认字幕文件。例如，当用户想观看某个视频时，用户通过在设置页面中选择了目标语音和目标字幕，这时，判断模块60需判断用户选择的目标语音和目标字幕是否属于该视频的多种语言中的默认语音文件和默认字幕文件。

在本发明的实施例中，选择模块30可具体用于：在判断模块60判断目标语音和目标字幕不属于多种语言的语音文件和字幕文件时，从多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。也就是说，当多种语言的语音文件和字幕文件中没有用户需要的目标语音和目标字幕时，选择模块30可从该多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件。

生成模块70可用于根据选择模块选择的语音文件和字幕文件生成目标语音文件和目标字幕文件。在本发明的实施例中，加载模块40可具体用于：将生成模块70生成的目标语音文件和目标字幕文件加载至待提供视频。

例如，生成模块70可根据选择的默认语音文件和默认字幕文件通过语音合成技术或实时语音翻译以生成目标语音文件和目标字幕文件，并加载该生成后的目标语音文件和目标字幕文件以为用户播放对应的视频。

具体而言，在本发明的一个实施例中，如图5所示，该生成模块70可包括翻译单元71、获取单元72、播放单元73、合成单元74和加载单元75。

具体地，翻译单元71可用于根据选择的字幕文件进行翻译以生成目标字幕文件。获取单元72可用于获取选择的语音文件中的背景音。播放单元73可用于将字幕文件按照目标语音文件对应的语言播放以生成配音。合成单元74可用于将背景音和配音进行合成以生成目标语音文件。加载单元75可用于加载目标语音文件和目标字幕文件。其中，在本发明的实施例中，可对生成后的目标字幕文件和生成后的目标语音文件进行保存，以方便用户下次观看，避免了翻译和合成的重复操作。

举例而言，以用户观看韩国正在直播的某个综艺视频节目为例，假设用户想用汉语语音类型和汉语字幕类型对该视频进行播放，由于直播视频当前不能提供较多的语音文件和字幕文件以供用户选择，所以，翻译单元71可先对默认的韩语字幕文件进行翻译以生成用户需要的目标字幕文件，即汉语字幕文件。获取单元72可从该视频的默认的韩语语音文件中获取出背景音，播放单元73通过实时语音翻译技术将默认的韩语字幕文件按照汉语语言进行播放，以生成对应的汉语配音。合成单元74通过语音合成技术将上述背景音和配音进行合成来生成用户需要的汉语语音文件。加载单元75加载汉语语音文件和汉语字幕文件。由此，通过实时在线翻译和语音合成技术使得用户可以及时地观看视频，不必烦恼可能看不懂等问题。

在本发明的实施例中，选择模块30还可用于在判断模块60判断目标语音和目标字幕属于多种语言的语音文件和字幕文件时，选择目标语音和目标字幕对应的语音文件和字幕文件进行加载。

由此，通过对用户选择的目标语音和目标字幕进行判断以确定其是否属于多种语言的语音文件和字幕文件，完善了视频客户端或视频播放器的设置功能。

进一步的，为了提升用户体验，可不通过用户手动选择目标语音和目标字幕，只需根据视频客户端或视频播放器自身默认的语音类型，从视频的语音文件和字幕文件中找出与视频客户端或视频播放器自身默认的语音类型对应的语音文件和字幕文件进行加载来播放该视频。具体地，在本发明的一个实施例中，如图6所示，该视频的提供装置还可包括第一获取模块80。第一获取模块80可用于在接收输入的语音字幕选择指令之前，获取加载视频数据的客户端的默认语言。在本发明的实施例中，加载模块40还可用于根据默认语言从多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载。

进一步的，为了提升用户体验，可不通过用户手动选择目标语音和目标字幕，只需获取用户输入的搜索信息(如某个视频的搜索词)，并对该搜索信息进行语言类型分析以获取对应的语言，之后从视频的语音文件和字幕文件中找出与该语言对应的语音文件和字幕文件进行加载来播放该视频。具体地，在本发明的一个实施例中，如图7所示，该视频的提供装置还可包括第二获取模块90。第二获取模块90可用于在接收输入的语音字幕选择指令之前，接收输入的搜索信息，并获取搜索信息对应的语言。在本发明的实施例中，加载模块40还可用于根据搜索信息对应的语言从多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载。

还需要说明的是，在本发明的一个实施例中，当未接受到用户输入的语音字幕选择指令，即用户未进行语音和字幕的设置时，可加载该视频本身默认给定的语音文件和对应的字幕文件。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种视频的提供方法，其特征在于，包括以下步骤：

接收待提供视频的视频数据和与所述视频数据相关的多种语言的语音文件和字幕文件；

接收输入的语音字幕选择指令，其中，为用户提供设置所述待提供视频的播放语音的语言类型和播放字幕类型的功能，以使所述用户通过提供的设置功能对所述播放语音的语言类型和播放字幕类型进行选择，其中，在所述接收输入的语音字幕选择指令之前，还包括：获取加载所述视频数据的客户端的默认语言；以及根据所述默认语言从所述多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载；

根据所述语音字幕选择指令从所述多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件；以及

将选择的所述语音文件和字幕文件加载至所述待提供视频，并将加载过所述语音文件和字幕文件的待提供视频提供至用户，其中，根据所述语音字幕选择指令判断选择的目标语音和目标字幕是否属于所述多种语言的语音文件和字幕文件；如果所述目标语音和目标字幕不属于所述多种语言的语音文件和字幕文件，则从所述多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件，根据选择的所述语音文件和字幕文件生成目标语音文件和目标字幕文件并加载，其中，根据选择的所述字幕文件进行翻译以生成目标字幕文件；获取所述选择的语音文件中的背景音，并将所述字幕文件按照所述目标语音文件对应的语言播放以生成配音；将所述背景音和所述配音进行合成以生成所述目标语音文件；以及加载所述目标语音文件和所述目标字幕文件。

2.如权利要求1所述的视频的提供方法，其特征在于，还包括：

如果所述目标语音和目标字幕属于所述多种语言的语音文件和字幕文件，则选择所述目标语音和目标字幕对应的语音文件和字幕文件进行加载。

3.如权利要求1所述的视频的提供方法，其特征在于，在所述接收输入的语音字幕选择指令之前，还包括：

接收输入的搜索信息，并获取所述搜索信息对应的语言；

根据所述搜索信息对应的语言从所述多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载。

4.一种视频的提供装置，其特征在于，包括：

第一接收模块，用于接收待提供视频的视频数据和与所述视频数据相关的多种语言的语音文件和字幕文件；

第二接收模块，用于接收输入的语音字幕选择指令，其中，为用户提供设置所述待提供视频的播放语音的语言类型和播放字幕类型的功能，以使所述用户通过提供的设置功能对所述播放语音的语言类型和播放字幕类型进行选择；选择模块，用于根据所述语音字幕选择指令从所述多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件；

加载模块，用于将选择的所述语音文件和字幕文件加载至所述待提供视频；以及

提供模块，用于将加载过所述语音文件和字幕文件的待提供视频提供至用户；

判断模块，用于在所述第二接收模块接收到输入的语音字幕选择指令之后，根据所述语音字幕选择指令判断选择的目标语音和目标字幕是否属于所述多种语言的语音文件和字幕文件；

第一获取模块，用于在所述接收输入的语音字幕选择指令之前，获取加载所述视频数据的客户端的默认语言；

所述加载模块还用于根据所述默认语言从所述多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载；

所述选择模块具体用于：

在所述目标语音和目标字幕不属于所述多种语言的语音文件和字幕文件时，从所述多种语言的语音文件和字幕文件中选择一个语音文件和字幕文件；

生成模块，用于根据所述选择模块选择的所述语音文件和字幕文件生成目标语音文件和目标字幕文件；所述生成模块包括：翻译单元，用于根据选择的所述字幕文件进行翻译以生成目标字幕文件；获取单元，用于获取所述选择的语音文件中的背景音；播放单元，用于将所述字幕文件按照所述目标语音文件对应的语言播放以生成配音；合成单元，用于将所述背景音和所述配音进行合成以生成所述目标语音文件；以及加载单元，用于加载所述目标语音文件和所述目标字幕文件；

所述加载模块具体用于：

将所述生成模块生成的所述目标语音文件和目标字幕文件加载至所述待提供视频。

5.如权利要求4所述的视频的提供装置，其特征在于，所述选择模块还用于在所述目标语音和目标字幕属于所述多种语言的语音文件和字幕文件时，选择所述目标语音和目标字幕对应的语音文件和字幕文件进行加载。

6.如权利要求4所述的视频的提供装置，其特征在于，还包括：

第二获取模块，用于在所述接收输入的语音字幕选择指令之前，接收输入的搜索信息，并获取所述搜索信息对应的语言；

所述加载模块还用于根据所述搜索信息对应的语言从所述多种语言的语音文件和字幕文件中选择对应的语音文件和字幕文件进行加载。