CN109376145A

CN109376145A - 影视对白数据库的建立方法、建立装置及存储介质

Info

Publication number: CN109376145A
Application number: CN201811390321.1A
Authority: CN
Inventors: 赖长明; 徐永泽
Original assignee: Shenzhen TCL New Technology Co Ltd
Current assignee: Shenzhen TCL New Technology Co Ltd
Priority date: 2018-11-19
Filing date: 2018-11-19
Publication date: 2019-02-22
Anticipated expiration: 2038-11-19
Also published as: CN109376145B

Abstract

本发明公开了一种影视对白数据库的建立方法，包括：解析获取的影视资源，得到视频对象和音频对象；识别并获取所述音频对象中的人声片段；将所述人声片段中的每句对白标记预设标签；根据标记有所述预设标签的所述对白获取第一对白文本；将所述人声片段和对应的所述视频对象压缩成影视片段，并与所述第一对白文本关联存储以形成影视对白数据库。同时本发明还公开了一种影视对白数据库的建立装置及计算机存储介质，实现根据影视片中的经典对白建立数据库，重新整理影视片资源，达到影视资源的二次利用的目的。

Description

影视对白数据库的建立方法、建立装置及存储介质

技术领域

本发明涉及影视技术领域，尤其涉及影视对白数据库的建立方法、影视对白数据库的建立装置及计算机存储介质。

背景技术

目前市面上拥有数以万计的影视片资源,这些影视片资源通常包括一些当下热门的影视片和许多以往的经典电影，而在这些影视的对白里，都会有一些让人印象深刻的经典桥段或是经典对白，这些对白的内容非常精彩丰富, 有些对白很生活化，却又深藏智慧，有一些经典的对白，已经成为大家的口头禅。这些对白各有不同的表达方式，再配上各大明星或者演员不同的面部表情和肢体动作，塑造出一个又一个经典场景。

然而这些影视片除了用作观赏以外，没有其他用途，这样导致大量的影视资源浪费，特别是那些因为不再热门而受冷落的经典影视片，渐渐淡出人们的视野，失去了其应有的价值。

发明内容

本发明的主要目的在于提供一种影视对白数据库的建立方法、影视对白数据库的建立装置及计算机存储介质，旨在解决目前大量影视片用途单一，资源浪费的问题。

为实现上述目的，本发明提供一种影视对白数据库的建立方法，所述影视对白数据库的建立方法的步骤包括：

解析获取的影视资源，得到视频对象和音频对象；

识别并获取所述音频对象中的人声片段；

将所述人声片段中的每句对白标记预设标签；

根据标记有所述预设标签的所述对白获取第一对白文本；

将所述人声片段和对应的所述视频对象压缩成影视片段，并与所述第一对白文本关联存储以形成影视对白数据库。

优选地，所述识别并获取所述音频对象中的人声片段的步骤包括：

通过语音活动检测方法对所述音频对象进行人声识别，识别出所述音频对象中的人声片段；

从所述音频对象中切分出所述人声片段。

优选地，所述将所述人声片段中的每句对白标记预设标签的步骤包括：

对所述对白标记电影年代标签；

对所述对白进行声纹识别，并标记演员姓名标签和演员性别标签。

优选地，所述将所述人声片段中的每句对白标记预设标签的步骤还包括：

对所述对白进行情感识别，并标记情感标签。

优选地，所述根据标记有所述预设标签的所述对白获取第一对白文本的步骤包括：

对所述对白进行语音识别，得到第一字幕；

识别所述对白对应的所述视频对象中的自带字幕，得到第二字幕；

根据所述第二字幕对所述第一字幕进行修正，得到第一对白文本。

优选地，其特征在于，所述影视对白数据库的建立方法的步骤还包括：

在接收到用户输入的搜索指令时，获取所述搜索指令的类型；

在所述搜索指令为文本指令时，从所述第一对白文本中获取与所述文本指令内容相似度最高的第二对白文本；

从所述影视对白数据库中搜索出与所述第二对白文本关联的影视片段。

优选地，所述获取所述搜索指令的类型的步骤之后还包括：

在所述搜索指令为语音指令时，对所述语音指令进行语音识别，得到文本指令，从所述第一对白文本中获取与所述文本指令内容相似度最高的第二对白文本；

优选地，所述获取所述搜索指令的类型的步骤之后还包括：

在所述搜索指令为语音指令时，对所述语音指令进行语音识别和情感识别，得到对应情感标签的文本指令，从所述第一对白文本中获取标记有所述情感标签且与所述文本指令内容相似度最高的第二对白文本；

此外，为实现上述目的，本发明还提供一种影视对白数据库的建立装置，其特征在于，所述影视对白数据库的建立装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的影视对白数据库的建立程序，所述影视对白数据库的建立程序被所述处理器执行时实现如上所述中任一项所述的影视对白数据库的建立方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机存储介质，所述计算机存储介质上存储有影视对白数据库的建立程序，所述影视对白数据库的建立程序被所述处理器执行时实现如上所述中任一项所述的影视对白数据库的建立方法的步骤。

本发明提出的影视对白数据库的建立方法、影视对白数据库的建立装置及计算机存储介质，通过解析获取的影视资源，得到视频对象和音频对象，再识别并获取所述音频对象中的人声片段，再将所述人声片段中的每句对白标记预设标签，再根据标记有所述预设标签的所述对白获取第一对白文本，再将所述人声片段和对应的所述视频对象压缩成影视片段，并与所述第一对白文本关联存储以形成影视对白数据库，实现根据影视片中的经典对白建立数据库，重新整理影视片资源，达到影视资源的二次利用的目的。进一步地，本发明提出的技术方案可用于影视对白的搜索，实现根据输入文本或语音指令在所述影视对白数据库中搜索相应的影视片段。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图；

图2为本发明影视对白数据库的建立方法第一实施例的流程示意图；

图3为本发明影视对白数据库的建立方法第二实施例的流程示意图；

图4为本发明影视对白数据库的建立方法第三实施例的流程示意图；

图5为本发明影视对白数据库的建立方法第四实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例的主要解决方案是：

解析获取的影视资源，得到视频对象和音频对象；

识别并获取所述音频对象中的人声片段；

将所述人声片段中的每句对白标记预设标签；

根据标记有所述预设标签的所述对白获取第一对白文本；

由于现有技术中，这些影视片除了用作观赏以外，没有其他用途，这样导致大量的影视资源浪费，特别是那些因为不再热门而受冷落的经典影视片，渐渐淡出人们的视野，失去了其应有的价值。同时这些影视片资源巨大，种类繁多，用户在搜索时难以查找出包含特定经典对白的影片资源。

本发明提供一种解决方案，通过解析获取的影视资源，得到视频对象和音频对象，再识别并获取所述音频对象中的人声片段，再将所述人声片段中的每句对白标记预设标签，再根据标记有所述预设标签的所述对白获取第一对白文本，再将所述人声片段和对应的所述视频对象压缩成影视片段，并与所述第一对白文本关联存储以形成影视对白数据库，实现根据影视片中的经典对白建立数据库，重新整理影视片资源，达到影视资源的二次利用的目的。进一步地，本发明提出的技术方案可用于影视对白的搜索，实现根据输入文本或语音指令在所述影视对白数据库中搜索相应的影视片段。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端为智能电视。如图1所示，该终端可以包括：处理器 1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线 1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003 可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口 1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM 存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及影视对白数据库的建立程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的影视对白数据库的建立程序，并执行以下操作：

解析获取的影视资源，得到视频对象和音频对象；

识别并获取所述音频对象中的人声片段；

将所述人声片段中的每句对白标记预设标签；

根据标记有所述预设标签的所述对白获取第一对白文本；

进一步地，处理器1001可以调用存储器1005中存储的影视对白数据库的建立程序，还执行以下操作：

从所述音频对象中切分出所述人声片段。

对所述对白标记电影年代标签；

对所述对白进行情感识别，并标记情感标签。

对所述对白进行语音识别，得到第一字幕；

此外，处理器1001可以用于调用存储器1005中存储的搜索程序，并执行以下操作：

进一步地，处理器1001可以调用存储器1005中存储的搜索程序程序，还执行以下操作：

参照图2，图2为本发明影视对白数据库的建立方法第一实施例的流程示意图；

本实施例提出影视对白数据库的建立方法，该影视对白数据库的建立方法包括步骤：

步骤S10，解析获取的影视资源，得到视频对象和音频对象；

在本实施例中，所述影视资源可从网络平台或获取其他渠道获取，一般为MP4(Moving Picture Experts Group 4)或TS(Transport Stream)的格式。通过一些专业视频编辑软件，如狸窝转换器等，将所述影视资源解析为音频对象和视频对象。通过解析，所述音频对象的格式一般为WAV(一种音乐格式)，以保证音频对象的质量够好，并且所述音频对象有时间戳可用于与所述视频对象匹配。得到的视频对象的格式通常是H.264(一种数字视频编解码标准)，以保证所述视频对象可逐帧进行播放，并且所述视频对象同样有时间戳与音频对象对应。

步骤S20，识别并获取所述音频对象中的人声片段；

在本实施例中，音频一般分为人声、非人声和静音等类别。可以通过人声识别技术识别出所述音频对象中的人声片段，人声识别技术可以有多种识别方法，如VAD(语音活动检测方法)，识别出所述音频对象中的人声、非人声和静音。然后通过专业工具从所述音频对象中获取其中的人声片段。所述人声片段的前端和后端一般为静音，中部为语义相对完整的对白。

步骤S30，将所述人声片段中的每句对白标记预设标签；

在本实施例中，由于人声片段都是由一段语音组成，即多句对白。按照人的说话习惯，人每说一句话都会有一次短暂的停顿进行换气，因此每句对白之间会存在停顿，我们可以通过此停顿将人声片段分割成一句句的对白。然后再通过声纹识别技术识别出演员姓名和性别，通过电影简介识别电影年代，通过情感识别技术识别出对白中人物的感情状态。然后通过识别出的上述特征为每句对白标记相应标签，如男演员、1995年和高兴等预设标签。

步骤S40，根据标记有所述预设标签的所述对白获取第一对白文本；

在本实施例中，通过语音识别技术识别出人生片段中的每句对白，并转化为文字内容，但是由于目前的语音识别技术准确率不高，所以还需通过视频字幕识别技术识别出在视频对象中与所述对白对应的字幕，转化成文字内容。将两种文字内容进行修正比对，形成准确率很高第一对白文本。

步骤S50，将所述人声片段和对应的所述视频对象压缩成影视片段，并与所述第一对白文本关联存储以形成影视对白数据库。

在本实施例中，由于所述人声片段和所述视频对象都有时间戳，因此可以根据所述人声片段的时间戳获取相同时间戳的视频对象，并剪切出来。将所述人声片段和对应的所述视频对象通过专业视频编辑工具封装成一个完整的影视片段，与相应的第一对白文本相关联并存储，形成所述影视对白数据库。由于有时间戳的存在，因此不会产生影音不同步的问题。

本实施例公开的技术方案中，通过解析所述影视资源，获取视频对象和音频对象再识别并获取所述音频对象中的人声片段，在将所述人声片段中的每句对白标记预设标签，再根据所述对白获取第一对白文本，并存储在所述影视对白数据库中，然后将所述人声片段和对应的所述视频对象压缩成影视片段，并存储在所述影视对白数据库中，实现根据影视片中的经典对白建立数据库，重新整理影视片资源，达到影视资源的二次利用的目的。

如图3所示，图3为本发明影视对白数据库的建立方法第二实施例的流程示意图。本实施例以图2所示第一实施例为基础，步骤S30具体包括：

步骤S31，对所述对白标记电影年代标签；

步骤S32，对所述对白进行声纹识别，并标记演员姓名标签和演员性别标签；

在本实施例中，根据每部电影的简介得到所述对白对应的电影年代标签。通过声纹识别技术对每句对白进行识别，声纹识别的原理是人讲话使用的发声器官，如舌、牙齿、喉头、肺、鼻腔等，在尺寸和形态方面个体差异很大，所以任何两个人的声纹图谱都有差异，因此每一个声音都具有独特的特征，通过该特征能将不同演员的声音进行有效的区分。通过预先存储各大演员的声纹图谱，通过声纹识别技术将每句对白的声纹图谱与预先存储的声纹图谱进行对比，从而发现所述对白是哪位演员发出的，再将所述对白标记相应的演员姓名标签和性别标签。

步骤S33，对所述对白进行情感识别，并标记情感标签。

在本实施例中，情感识别技术是通过识别所述对白是否有一些表达情感的词汇，如痛苦、幸福、孤独等，分析出该对白的角色所处的感情状态，再标记标签，如温柔，愤怒，恐惧和悲伤等。当然也可通过该对白的语气，如音调高低和音量大小，分析出该对白的角色所处的感情状态，如当音调较高或音量较大时，则该对白的角色的情感状态可以是愤怒。

本实施例公开的技术方案中，通过影片介绍、声纹识别和情感识别等所述对白标记相应的标签，以便于后续搜索影视片段时可以更方便的找到最合适的影视片段。

如图4所示，图4为本发明影视对白数据库的建立方法第三实施例的流程示意图。本实施例以图2所示第一实施例为基础，步骤S40具体包括：

步骤S41，对所述对白进行语音识别，得到第一字幕；

步骤S42，识别所述对白对应的所述视频对象中的自带字幕，得到第二字幕；

在本实施例中，通过视频字幕识别技术获取视频对象中的字幕，并生成文字内容。视频字幕识别技术的原理是字幕定位和文本识别。字幕定位，即找出字幕在视频中所处的位置，通常字幕呈水平或竖直排列。文本识别，即通过提取字幕区域的图像特征，识别其中的文字，最终输出文本内容。

步骤S43，根据所述第二字幕对所述第一字幕进行修正，得到第一对白文本。

在本实施例中，由于目前的语音识别技术准确率不高，且所述对白中一般有许多杂音或电影配乐会干扰语音识别，所以语音识别出的文本会有不少误差。因此可以根据视频字幕识别技术识别出的文本对语音识别出的文本进行修正比对，形成准确率很高第一对白文本。

参照图5，图5为本发明搜索方法第一实施例的流程示意图，该搜索方法包括步骤：

步骤S60，在接收到用户输入的搜索指令时，获取所述搜索指令的类型；

步骤S70，在所述搜索指令为语音指令时，对所述语音指令进行语音识别，得到文本指令，并执行搜索指令为文本指令时的步骤；

在本实施例中，用户在进行搜索时可对搜索方式进行选择，即文本指令搜索和语音指令搜索。当用户进行语音指令搜索时，对用户输入的语音进行语音识别，转化成文字文本，再进行文本指令搜索过程。

步骤S80，在所述搜索指令为文本指令时，从所述第一对白文本中获取与所述文本指令内容相似度最高的第二对白文本；

在本实施例中，将文本指令作为影视对白数据库的搜索句子，在所述第一对白文本中寻找与所述文本指令相似度最高的第二对白文本。相似度的比较一般采用DSSM深度学习技术实现，DSSM深度学习技术广泛应用于信息检索、网络搜索排名和广告相关性等方面。同时用户也可输入标签指令对所述第二对白文本进行筛选，筛选出标记有该标签指令的对白，该标签指令也可为演员姓名标签、演员性别标签、电影年代标签和情感标签等。同时，用户在输入语音指令时也可附带一定的语气，以便于对用户输入的语音指令进行情感识别，得到一个用户情感标签，情感标签可以为“中性”、“温柔”、“愤怒”、“搞笑”、“恐惧”和“悲伤”等。通过该用户情感标签对所述第二对白文本进行筛选，得到标记有该用户情感标签且与所述文本指令相似度最高的第三对白文本，并从所述影视对白数据库中搜索出与所述第三对白文本关联的影视片段。

步骤S90，从所述影视对白数据库中搜索出与所述第二对白文本关联的影视片段。

在本实施例中，由于每个第一对白文本与所述影视片段关联存储，且所述第二对白文本在第一对白文本中，因此很容易就可找出所述第二对白文本对应的所述影视片段。

本实施例公开的技术方案中，通过输入文字或语音，得到文本指令，然后在所述第一对白文本中获取与所述文本指令相似度最高的第二对白文本，也可通过标签筛选指令对进行所述第二对白文本筛选，再获取所述第二对白文本对应的所述影视片段，实现根据输入文本在所述影视对白数据库中搜索相应的影视片段。

此外，为实现上述目的，本发明实施例还提供一种影视对白数据库的建立装置，其特征在于，所述影视对白数据库的建立装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的影视对白数据库的建立程序，所述影视对白数据库的建立程序被所述处理器执行时实现如上实施例所述的影视对白数据库的建立方法的步骤。

此外，本发明实施例还提出一种计算机存储介质，所述计算机存储介质上存储有影视对白数据库的建立程序，所述影视对白数据库的建立程序被所述处理器执行时实现如上实施例所述的影视对白数据库的建立方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种影视对白数据库的建立方法，其特征在于，所述影视对白数据库的建立方法的步骤包括：

解析获取的影视资源，得到视频对象和音频对象；

识别并获取所述音频对象中的人声片段；

将所述人声片段中的每句对白标记预设标签；

根据标记有所述预设标签的所述对白获取第一对白文本；

2.如权利要求1所述的影视对白数据库的建立方法，其特征在于，所述识别并获取所述音频对象中的人声片段的步骤包括：

从所述音频对象中切分出所述人声片段。

3.如权利要求1所述的影视对白数据库的建立方法，其特征在于，所述将所述人声片段中的每句对白标记预设标签的步骤包括：

对所述对白标记电影年代标签；

4.如权利要求3所述的影视对白数据库的建立方法，其特征在于，所述将所述人声片段中的每句对白标记预设标签的步骤还包括：

对所述对白进行情感识别，并标记情感标签。

5.如权利要求1所述的影视对白数据库的建立方法，其特征在于，所述根据标记有所述预设标签的所述对白获取第一对白文本的步骤包括：

对所述对白进行语音识别，得到第一字幕；

6.如权利要求1至5中任一项所述的影视对白数据库的建立方法，其特征在于，所述影视对白数据库的建立方法的步骤还包括：

7.如权利要求6所述的影视对白数据库的建立方法，其特征在于，所述获取所述搜索指令的类型的步骤之后还包括：

8.如权利要求6所述的影视对白数据库的建立方法，其特征在于，所述获取所述搜索指令的类型的步骤之后还包括：

9.一种影视对白数据库的建立装置，其特征在于，所述影视对白数据库的建立装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的影视对白数据库的建立程序，所述影视对白数据库的建立程序被所述处理器执行时实现如权利要求1至8中任一项所述的影视对白数据库的建立方法的步骤。

10.一种计算机存储介质，其特征在于，所述计算机存储介质上存储有影视对白数据库的建立程序，所述影视对白数据库的建立程序被所述处理器执行时实现如权利要求1至8中任一项所述的影视对白数据库的建立方法的步骤。