CN113630630B

CN113630630B - 一种视频解说配音信息的处理方法、装置及设备

Info

Publication number: CN113630630B
Application number: CN202110910573.8A
Authority: CN
Inventors: 刘养亭; 佘志强
Original assignee: China Mobile Communications Group Co Ltd; MIGU Digital Media Co Ltd; MIGU Culture Technology Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; MIGU Digital Media Co Ltd; MIGU Culture Technology Co Ltd
Priority date: 2021-08-09
Filing date: 2021-08-09
Publication date: 2023-08-15
Anticipated expiration: 2041-08-09
Also published as: CN113630630A

Abstract

本发明公开了一种视频解说配音信息的处理方法、装置及设备，该方法包括：获取视频数据和第一目标观众的用户信息；对所述视频数据进行分段，得到视频段；从所述视频段中，确定与所述用户信息匹配的第一目标视频段；将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。通过上述方式，本发明实现了用户个性化的需求，极大的提高了用户的参与感。

Description

一种视频解说配音信息的处理方法、装置及设备

技术领域

本发明涉及移动终端技术领域，具体涉及一种视频解说配音信息的处理方法、装置及设备。

背景技术

现有的体育赛事解说，一般只安排一个固定的解说员，很多解说员都是按部就班的讲解，没有太多激情，用户只能被动的接收一个解说员解说的信息，无法做其他选择，这满足不了用户个性化的需求，也无法满足用户个性化的选择，且用户参与感低。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频解说配音信息的处理方法、装置及设备。

根据本发明实施例的一个方面，提供了一种视频解说配音信息的处理方法，包括：

获取视频数据和第一目标观众的用户信息；

对所述视频数据进行分段，得到视频段；

从所述视频段中，确定与所述用户信息匹配的第一目标视频段；

将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。

根据本发明实施例的另一方面，提供了一种视频解说配音信息的处理装置，包括：

获取模块，用于获取视频数据和第一目标观众的用户信息；

第一处理模块，用于对所述视频数据进行分段，得到视频段；

确定模块，用于从所述视频段中，确定与所述用户信息匹配的第一目标视频段；

第二处理模块，用于将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。

根据本发明实施例的又一方面，提供了一种计算设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行上述视频解说配音信息的处理方法对应的操作。

根据本发明实施例的再一方面，提供了一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如上述视频解说配音信息的处理方法对应的操作。

根据本发明上述实施例提供的方案，通过获取视频数据和第一目标观众的用户信息；对所述视频数据进行分段，得到视频段；从所述视频段中，确定与所述用户信息匹配的第一目标视频段；将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。可以使观众能够获得与其信息匹配的视频段，并可以为该视频段进行解说配音，取得了可以满足用户个性化的需求，提高了用户参与感的有益效果。

上述说明仅是本发明实施例技术方案的概述，为了能够更清楚了解本发明实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明实施例的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明实施例的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的视频解说配音信息的处理方法流程图；

图2示出了本发明另一实施例提供的视频解说配音信息的处理方法的流程图；

图3示出了本发明实施例提供的视频解说配音信息的处理装置在终端设备上进入赛事视频界面图；

图4示出了本发明实施例提供的视频解说配音信息的处理装置在终端设备上加入解说界面图；

图5示出了本发明实施例提供的视频解说配音信息的处理装置在终端设备上开始解说界面图；

图6示出了本发明实施例提供的视频解说配音信息的处理装置在终端设备上试听其他人解说界面图；

图7示出了本发明实施例提供的视频解说配音信息的处理装置在终端设备上查看其他解说成员信息界面图；

图8示出了本发明实施例提供的视频解说配音信息的处理装置在终端设备上展示每个视频段有多少人讲解界面图；

图9示出了本发明实施例提供的视频解说配音信息的处理装置在终端设备上选择不同解说员并对其点赞界面图；

图10示出了本发明实施例提供的视频解说配音信息的处理装置的结构示意图；

图11示出了本发明实施例提供的计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

图1示出了本发明实施例提供的视频解说配音信息的处理方法的流程图。如图1所示，该方法包括以下步骤：

步骤11，获取视频数据和第一目标观众的用户信息；

具体的，首先收集基础数据，包括观众的行为数据、内容偏好数据和交易数据，如浏览量、访问时长、偏好设置、回头率等等，但不限于如上所述。

其次，对收集的基础数据进行分析和加工，提炼关键要素，构建可视化模型。对收集到的数据进行行为建模，抽象出用户的标签。所述用户的标签在各个领域代表的信息可能不相同，如电商领域把用户的基本属性、行为特征、兴趣爱好、心理特征、社交网络标签化，而金融风控领域把用户的基本信息、风险信息、财务信息标签化。

然后，利用Hive、HBase等大数据的整体架构对标签化的过程进行开发实现，对基础数据进行加工，将标签管理化。同时为了提高数据的实时性，还要用到Flink、Kafka等实时计算技术将标签计算的结果进行实时计算。

最后，根据计算结果得到第一目标观众的用户信息，这里的用户信息如可以是用户画像。

步骤12，对所述视频数据进行分段，得到视频段；

步骤13，从所述视频段中，确定与所述用户信息匹配的第一目标视频段；

步骤14，将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。

该实施例所述的视频解说配音信息的处理方法，通过获取视频数据和第一目标观众的用户信息；对所述视频数据进行分段，得到视频段；从所述视频段中，确定与所述用户信息匹配的第一目标视频段；将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。可以使观众能够获得与用户信息匹配的视频段，并可以为该视频段进行解说配音，满足用户个性化的需求，提高用户参与感。

在本发明的又一可选的实施例中，步骤12可以包括：

步骤121，按照至少一预设时间间隔，对所述视频数据进行分段，得到视频段；

具体的，预设时间间隔的大小可以根据实际情况进行设置，例如，60分钟的视频数据，可以按照至少一个预设时间间隔进行分段，从视频数据的起始时间开始，间隔第一预设时间间隔(例如10分钟)对视频数据进行分段，得到第一视频段；再继续以第二预设时间间隔(例如20分钟)对视频数据进行分段，得到第二视频段等。

或者，

步骤122，根据所述视频数据的关键图像信息和/或关键音频信息，对所述视频数据进行自动分段，得到视频段，所述视频数据包括多个关键图像信息和/或关键音频信息。

具体的，根据视频数据的视频轨道或者音频轨道，提取视频数据的关键图像信息和/或关键音频信息；例如，获得视频数据的关键图像信息是观众喜欢的运动员的图像，则将该运动员的该段视频作为一个视频段；再例如，获得视频数据中关键音频信息“接下来将要出场的运动员是XXX”，将运动员XXX的该段视频作为一个视频段。

在本发明的又一可选的实施例中，步骤13可以包括：

步骤131，获得所述视频段的每一个视频段的关键图像信息和/或关键音频信息；

步骤132，将所述关键图像信息与所述用户信息中的目标图像信息进行匹配和/或将所述关键音频信息与所述用户信息中的目标音频信息进行匹配，将匹配成功的视频段确定为与所述用户信息匹配的第一目标视频段。

该实施例中，根据所述关键图像信息和/或关键音频信息，与用户信息中的相关信息进行匹配，将匹配成功的视频段确定为与所述用户信息匹配的第一目标视频段，实现了为用户推荐最优视频段的目的。若没有用户信息的情况下，用户可以自主选择需要解说的视频段。

在本发明的又一可选的实施例中，步骤14可以包括：

步骤141，接收所述第一目标观众输入的对所述第一目标视频段的解说配音信息；

具体的，接收所述第一目标观众通过所述视频数据的播放界面的解说输入模块输入的对所述第一目标视频段的解说配音信息，这里解说输入模块可以是播放界面的解说按钮。

步骤142，将所述解说配音信息与所述第一目标视频段的图像帧进行合成处理，得到第二目标视频段。

该实施例中，可以通过收音设备接收第一目标观众输入的解说配音信息，通过音频信息与视频段的合成处理，得到第二目标视频段。

在本发明的又一可选的实施例中，步骤14之后还可以包括：

步骤15，获取对所述第二目标视频段的评价信息；

步骤16，根据所述评价信息，生成最优解说员列表，并输出至播放所述视频数据的播放设备。

具体的，用户在观看第二目标视频段时，可对第二目标视频段的解说员的解说效果给出评价，当观众切换解说员时，可对解说员进行点赞，评分时，播放器将此信息反馈至服务器端，服务器记录此用户的行为。系统可通过每个解说员的评价信息，包括被选中次数、点赞、送礼物、关注、喜欢、收藏但不限于如上所述，获取每位解说员的好评度。新的观众获取赛事信息时，服务器端会综合之前的所有用户反馈信息，生成新的最优解说员列表，下发至播放器端。

该实施例中，观看用户在观看非第二目标视频段时，服务端会根据当前的解说员的综合评分，选择每一个片段的最优解说员作为默认的解说员。然后形成整个视频的最优解说员列表，下发至播放器端。

图2示出了本发明另一个实施例提供的视频解说配音信息的处理方法的流程图。如图2所示，该方法包括上述步骤11至14的基础上，还可以包括以下步骤：

步骤21，获取所述第一目标观众的社交关系列表，所述社交关系列表包括至少一个第二目标观众，所述第二目标观众与所述第一目标观众为好友关系；

具体的，获取所述第一目标观众的社交关系列表，打造和维护所述第一目标观众的好友圈。所述好友圈中至少包含一个第二目标观众于所述第一目标观众为好友关系。所述好友圈包括自建的好友圈、微信好友圈、QQ好友圈但不限于上说所说好友圈。

步骤22，将所述社交关系列表中的第二目标观众已经完成解说配音的第三目标视频段推送给所述第一目标观众；

具体的，第二目标观众完成配音后，可以将自己解说的第三目标视频进行保存、下载，以便于后续分享。第三目标视频合成后，会根据第二目标观众的好友圈，自动推送给所述第一目标观众。

步骤23，将所述第三目标视频段与所述第二目标视频段进行合成处理，得到播放视频流，进一步地，可以将播放视频流输出至播放所述视频数据的播放设备。

具体的，首先，第二目标观众完成配音后，会根据第二目标观众的社交关系好友圈，优先选择第二目标观众好友圈好友的解说片段进行合成。其次，根据第二目标观众的好友圈，优先选择第二目标观众好友的解说音频轨道与视频轨道实时合成播放视频流，通过流媒体协议下发到观众的播放器中。最后，当用户切换解说员时，播放器与服务器交互，服务器端切换解说员的音频轨道，合成新的视频流，下发到观众的播放器中，实现解说员的切换。

在本发明的再一可选实施例中，步骤14之后还可以包括：

步骤17，获取所述第一目标观众的社交关系列表；

步骤18，如果所述社交关系列表为空或者没有所述社交关系列表中的第二目标观众完成的解说配音的第三目标视频段，将预设解说员片段解说配音的第四目标视频段推送给所述第一目标观众，并将所述第四目标视频段与所述第二目标视频段进行合成处理，得到播放视频流。

具体的，所述预设解说员片段解说配音包括系统评分最高的解说员片段但不限于如上所述。

该实施例中，首先获取所述第一目标观众的社交关系列表，如果好友圈中没有可以使用的解说片段，则使用预设解说员片段进行填充。(例如，赛事a分为：a、b、c三段，小王解说了其中的b段，当小王下载自己解说的该赛事a时，首先可以判断a段以及c段对应的解说中是否有小王的好友，如果有的话，则优先选择小王好友的解说段落进行合成。如果没有的话，则使用系统评分最高的解说员片段填充b、c段。)其次，根据预设解说员，优先选择预设解说员的解说音频轨道与视频轨道实时合成播放视频流，通过流媒体协议下发到观众的播放器中。最后，当用户切换解说员时，播放器与服务器交互，服务器端切换解说员的音频轨道，合成新的视频流，下发到观众的播放器中，实现解说员的切换。

该实施例中，音频信息的合成是将所述第二目标视频段和第三目标视频中包含的所有解说员音频一次性合成到视频文件中，然后下发解说员音频轨道序号的映射关系到播放器。播放器通过此映射关系，进行音频轨道的选择和播放。当用户切换解说员时，只需要切换对应的音频轨道即可。图像信息的合成是通过服务器端下发实时合成的流媒体文件。服务器端选择视频轨道和最佳的解说员对应的音频轨道，实时合成播放视频流，通过流媒体协议下发到观众的播放器中。当用户切换解说员时，播放器与服务器交互，服务器端切换解说员的音频轨道，合成新的视频流，下发到观众的播放器中。

本发明的上述实施例提供的视频解说配音信息的处理方法，可应用于配备有触控面板的终端设备中，为了便于描述，在以下步骤的执行主体为终端设备进行举例说明，但对此不构成限定。

如图3所示，首先，用户进入赛事视频界面，用户点击“加入解说”的按钮，服务器可以根据解说员的用户信息和标签，自动匹配最优的解说片段。

如图4所示，其次，用户进入需解说的视频界面，顶部左侧展示当前要参与讲解的用户信息、右侧展示当前片段所有的解说员、底部展示当前片段进度条以及“开始”按钮。

如图5所示，再次，当用户点击“开始”按钮后，按钮文案变为“完成”，用户可根据视频内容开始解说，解说好后点击完成即可结束。若是录播场景，用户可拖动底部的进度条重新解说，支持多遍录制，对于直播场景，用户只能根据实时进度进行解说。

如图6和图7所示，同时，如果用户想借鉴其他人的解说，需要用户进入解说片段，点击“共50人参与解说”即可查看全部解说成员信息(有好友关系的解说员优先展示)，然后点击某个用户头像，当前视频即可播放此用户对视频的解说，在试听其他人的解说的时候，可对其解说内容点“赞”。再次点击本人头像，回到自己开始自己的解说，录制场景用户可回到任意位置，直播场景会实时获取当前进度，服务器能够实时获取用户解说的音频信息，并对敏感信息进行过滤。

最后，用户完成配音后，可以将自己解说的比赛视频进行保存、下载，以便于后续分享。完整视频的合成会根据该用户的好友圈，优先选择该用户好友圈好友的解说片段进行合成。如果好友圈中没有可以使用的解说片段，则使用系统评分最高的解说员片段进行填充。

如图8和图9所示，除此之外，观看赛事的用户进入赛事视频界面时，会展示每个视频段有多少人讲解，默认给用户推荐好评度最高的讲解员。观看用户可针对每个视频段选择不同的解说员，并可对解说员点“赞”，提升解说员的好评度。在用户看完整个赛事后即形成自己独一无二的解说视频。每位用户对当前解说员的选择，将传给后台服务器，下个用户再次进入当前赛事，服务器会根据大数据重新计算每个片段智能推荐的解说员。

在本发明的上述实施例，通过获取视频数据和观看所述视频数据的第一目标观众的用户信息；对所述视频数据进行分段，得到视频段；从所述视频段中，确定与所述用户信息匹配的第一目标视频段；将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。可以使用户有了选择解说员的条件，由此解决了用户只能被动的接收一个解说员解说的信息，无法做其他选择的问题，取得了可以通过用户个性化的需求，提高用户参与感的有益效果。同时当有用户进入非常火爆的视频时，服务器会根据大数据重新计算每个片段智能推荐的解说员，从而达到最优的推荐及解说效果，形成千人千面的赛事解说内容，满足用户个性化的解说需求，引发观众兴趣及参与感，激发全民热情与斗志。

图10示出了本发明实施例提供的视频解说配音信息的处理装置100的结构示意图。如图10所示，该装置包括：

获取模块101，用于获取视频数据和第一目标观众的用户信息；

第一处理模块102，用于对所述视频数据进行分段，得到视频段；

确定模块103，用于从所述视频段中，确定与所述用户信息匹配的第一目标视频段；

第二处理模块104，用于将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段。

可选的，所述第一处理模块102用于按照至少一预设时间间隔，对所述视频数据进行分段，得到视频段；或者

根据所述视频数据的关键图像信息和/或关键音频信息，对所述视频数据进行自动分段，得到视频段。

可选的，所述确定模块103用于获得所述视频段的每一个视频段的关键图像信息和/或关键音频信息；将所述关键图像信息与所述用户信息中的目标图像信息进行匹配和/或将所述关键音频信息与所述用户信息中的目标音频信息进行匹配，将匹配成功的视频段确定为与所述用户信息匹配的第一目标视频段。

可选的，所述第二处理模块104还用于接收所述第一目标观众输入的对所述第一目标视频段的解说配音信息；

将所述解说配音信息与所述第一目标视频段的图像帧进行合成处理，得到第二目标视频段。

可选的，所述第二处理模块104还用于获取所述第一目标观众的社交关系列表，所述社交关系列表包括至少一个第二目标观众，所述第二目标观众与所述第一目标观众为好友关系；

将所述社交关系列表中的第二目标观众已经完成解说配音的第三目标视频段推送给所述第一目标观众；并将所述第三目标视频段与所述第二目标视频段进行合成处理，得到播放视频流。

可选的，所述第二处理模块104还用于获取所述第一目标观众的社交关系列表；

如果所述社交关系列表为空或者没有所述社交关系列表中的第二目标观众完成的解说配音的第三目标视频段，将预设解说员片段解说配音的第四目标视频段推送给所述第一目标观众，并将所述第四目标视频段与所述第二目标视频段进行合成处理，得到播放视频流。

可选的，所述第二处理模块104还用于获取对所述第二目标视频段的评价信息；根据所述评价信息，生成最优解说员列表，并输出至播放所述视频数据的播放设备。

需要说明的是，该实施例是与上述方法实施例对应的装置实施例，上述方法实施例中的所有实现方式均适用于该装置的实施例中，也能达到相同的技术效果。

本发明实施例提供了一种非易失性计算机存储介质，所述计算机存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的视频解说配音信息的处理方法。

图11示出了本发明实施例提供的计算设备的结构示意图，本发明具体实施例并不对计算设备的具体实现做限定。

如图11所示，该计算设备可以包括：处理器(processor)、通信接口(Communications Interface)、存储器(memory)、以及通信总线。

其中：处理器、通信接口、以及存储器通过通信总线完成相互间的通信。通信接口，用于与其它设备比如客户端或其它服务器等的网元通信。处理器，用于执行程序，具体可以执行上述用于计算设备的视频解说配音信息的处理方法实施例中的相关步骤。

具体地，程序可以包括程序代码，该程序代码包括计算机操作指令。

处理器可能是中央处理器CPU，或者是特定集成电路ASIC(Application SpecificIntegrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器，用于存放程序。存储器可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序具体可以用于使得处理器执行上述任意方法实施例中的视频解说配音信息的处理方法。程序中各步骤的具体实现可以参见上述视频解说配音信息的处理方法实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明实施例的内容，并且上面对特定语言所做的描述是为了披露本发明实施例的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明实施例并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明实施例进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤，除有特殊说明外，不应理解为对执行顺序的限定。

Claims

1.一种视频解说配音信息的处理方法，其特征在于，所述方法包括：

获取视频数据和第一目标观众的用户信息；

对所述视频数据进行分段，得到视频段；

获得所述视频段中的每一个视频段的关键图像信息和/或关键音频信息；

将所述关键图像信息与所述用户信息中的目标图像信息进行匹配和/或将所述关键音频信息与所述用户信息中的目标音频信息进行匹配，将匹配成功的视频段确定为与所述用户信息匹配的第一目标视频段；

2.根据权利要求1所述的视频解说配音信息的处理方法，其特征在于，对所述视频数据进行分段，得到视频段，包括：

按照至少一预设时间间隔，对所述视频数据进行分段，得到视频段；或者

3.根据权利要求1所述的视频解说配音信息的处理方法，其特征在于，将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理，得到第二目标视频段，包括：

接收所述第一目标观众输入的对所述第一目标视频段的解说配音信息；

4.根据权利要求1所述的视频解说配音信息的处理方法，其特征在于，得到第二目标视频段后，还包括：

获取所述第一目标观众的社交关系列表，所述社交关系列表包括至少一个第二目标观众，所述第二目标观众与所述第一目标观众为好友关系；

5.根据权利要求1所述的视频解说配音信息的处理方法，其特征在于，得到第二目标视频后，还包括：

获取所述第一目标观众的社交关系列表；

6.根据权利要求1所述的视频解说配音信息的处理方法，其特征在于，得到第二目标视频段后，还包括：

获取对所述第二目标视频段的评价信息；

根据所述评价信息，生成最优解说员列表，并输出至播放所述视频数据的播放设备。

7.一种视频解说配音信息的处理装置，其特征在于，所述装置包括：

获取模块，用于获取视频数据和第一目标观众的用户信息；

确定模块，用于获得所述视频段中的每一个视频段的关键图像信息和/或关键音频信息；将所述关键图像信息与所述用户信息中的目标图像信息进行匹配和/或将所述关键音频信息与所述用户信息中的目标音频信息进行匹配，将匹配成功的视频段确定为与所述用户信息匹配的第一目标视频段；

8.一种计算设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-6中任一项所述的视频解说配音信息的处理方法对应的操作。

9.一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-6中任一项所述的视频解说配音信息的处理方法对应的操作。