CN110072140A

CN110072140A - 一种视频信息提示方法、装置、设备及存储介质

Info

Publication number: CN110072140A
Application number: CN201910222036.7A
Authority: CN
Inventors: 郑峰
Original assignee: Xiamen University of Technology
Current assignee: Xiamen University of Technology
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2019-07-30
Anticipated expiration: 2039-03-22
Also published as: CN110072140B

Abstract

本发明实施例提供一种视频信息提示方法、装置、设备及存储介质，涉及信息技术领域，包括：获取目标视频的标题信息并筛选出至少一个关键词；基于关键词，提取目标视频的关键帧并计算关键帧出现的第一频率系数；基于关键词，识别目标视频语音的音频特征并计算音频特征出现的第二频率系数；根据第一频率系数和第二频率系数预设的权重值，生成目标视频与标题信息的匹配分数并对用户进行提示。本发明通过从视频图像内容与视频的音频内容判断视频内容与视频标题是否匹配，得出匹配分数后给用户相关的提示信息，减少观看用户错点视频的概率，提高用户体验感。

Description

一种视频信息提示方法、装置、设备及存储介质

技术领域

本发明涉及信息技术领域，具体而言，涉及一种视频信息提示方法、装置、设备及存储介质。

背景技术

自媒体是新媒体的一种表现形式，越来越多自媒体从业者通过在网上发布视频资源来实现传播。在观看视频的时候，用户经常是通过视频标题选择感兴趣的视频进行观看。但是很多自媒体从业者为了吸引用户的注意，视频通过设置引人注意的标题来吸引观看用户，但这些视频标题与视频内容不相符合，导致用户体验不佳。

发明内容

有鉴于此，本方案提供了一种视频信息提示方法、装置、设备及存储介质，能够根据提取视频内容相关信息并判断其与视频标题是否匹配，而后得出相关的提示信息，减少观看用户错点视频的概率，提高用户体验感。

本发明较佳实施例提供了一种视频信息提示方法，包括:

获取目标视频的标题信息并筛选出至少一个关键词；

基于所述关键词，提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数；

基于所述关键词，识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数；

根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

优选地，从获取目标视频的标题信息并筛选出至少一个关键词之后，还包括：

基于所述关键词和预设词库进行词义扩展，生成与所述关键词相关联的一组关键词组。

优选地，基于所述关键词，提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数的步骤包括：

根据所述关键词组，生成所述关键词组的样本图像；

基于所述样本图像和图像分析技术，提取所述目标视频的关键帧；

计算所述关键帧出现的所述第一频率系数。

优选地，基于所述关键词，识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数的步骤包括：

基于语音识别技术，生成所述目标视频的语音文档；

匹配所述关键词组和所述语音文档，获得所述目标视频的音频特征；

计算所述音频特征在所述语音文档中出现的所述第二频率系数。

优选地，根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示之前，还包括：

预设频率系数阈值；

判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值；

若是，基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数，生成所述目标视频与标题信息的匹配分数并对用户进行提示；

若否，根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

本发明还提供一种视频信息提示装置，包括：

获取单元，用于获取目标视频的标题信息并筛选出至少一个关键词；

提取单元，用于基于所述关键词，提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数；

识别单元，用于基于所述关键词，识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数；

匹配单元，用于根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

优选地，还包括：

词义扩展单元，用于基于所述关键词和预设词库进行词义扩展，生成与所述关键词相关联的一组关键词组。

优选地，还包括：

阈值预设单元，预设频率系数阈值；

判断单元，判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值；其中，当所述第一频率系数和/或所述第二频率系数其中一个超过所述频率系数阈值时，所述匹配单元基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数，生成所述目标视频与标题信息的匹配分数并对用户进行提示；当所述第一频率系数和所述第二频率系数均不超过所述频率系数阈值时，所述匹配单元根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的视频信息提示方法。

本发明还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现上述的视频信息提示方法。

本发明提供的一种视频信息提示方法、装置、设备及存储介质，通过从视频图像内容与视频的音频内容判断视频内容与视频标题是否匹配，得出匹配分数后给用户相关的提示信息，减少观看用户错点视频的概率，提高用户体验感。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明提供的视频信息提示方法的第一实施例的流程示意图；

图2是图1的S10步骤之后包括的一个实施例的流程示意图；

图3是图2的S40步骤之前包括的一个实施例的流程示意图；

图4是本发明提供的视频信息提示装置的第二实施例的结构示意图；

图标：10-获取单元；20-提取单元；30-识别单元；40-匹配单元。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参考图1～图3，本发明的第一实施例提供了一种视频信息提示方法，可由视频信息提示设备来执行，并至少包括如下步骤：

S10，获取目标视频的标题信息并筛选出至少一个关键词。

其中，在本实施例中，所述视频信息提示设备例如可为一个服务器或者具有数据处理和收发能力的终端，其安装有相应的计算机程序(例如一个中间件)，并通过执行所述计算机程序来实现本实施例的视频信息提示方法。

所述目标视频为服务器从网络中拉取的视频，或者由终端上传的视频，本申请的实施例并不对目标视频的来源进行限定。在一个示意性的应用场景下，视频信息提示设备为视频网站的后台服务器，该目标视频为用户使用该视频网站可观看的视频，例如在哔哩哔哩视频网站上可观看的一个名为《最有挑战性的忍笑大挑战》的视频就可当做目标视频。其中，该视频的标题就是本实施例所描述的标题信息，而所述视频信息提示设备可利用算法获取所述标题信息并筛选出关于所述标题信息的至少一个关键词，上述目标视频的例子从其标题信息提取的关键词就可为“挑战”、“笑”等。

具体的，在本实施例中，可先对目标视频的标题信息进行提取至少一个关键词时，所述视频信息提示设备可以利用TextRank算法，提取目标视频的标题信息当中的关键词。而TextRank算法为关键词提取的常用技术，为现有技术，这里就不再赘述。所述视频信息提示设备还可以利用LDA算法、TPR算法进行目标视频的标题信息关键词提取，但不限于此。

S20，基于所述关键词，提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数。

具体地，在本实施例中，所述关键帧指角色或者物体运动或变化中的执行所述关键词动作所处的那一帧。其中，视频信息提示设备可对目标视频进行帧分析并进行总帧数统计，而后分别判断出每帧数据是否具有匹配所述关键词的特征信息；如果有，则该帧数记为关键帧并进行关键帧次数统计，最后通过关键帧出现的次数与目标视频的总帧数进行比较，计算获得所述关键帧出现的第一频率系数。其中，提取关键词所对应的关键帧的具体实现方式可以采用现有技术，在此不做赘述。

S30，基于所述关键词，识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数。

具体地，在本实施例中，所述音频特征指目标视频的音频数据当中的出现所述关键词所在的音频片段。其中，视频信息提示设备当中包括语音识别程序，通过该语音识别程序对目标视频音频数据进行语音识别并进行时间长度信息统计，而后判断目标视频的音频数据当中是否具有关键词的音频片段；如果有，则将该音频片段记为音频特征并进行音频特征次数及时间长度信息统计，最后通过将所有音频特征的总时间长度信息与目标视频音频数据的时间长度信息进行比较，计算获得所述音频特征出现的第二频率系数。其中，语音识别程序的具体实现方式可以采用现有技术，在此不做赘述。

S40，根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

具体地，在本实施例中，可根据目标视频的类型预设所述第一频率系数和所述第二频率系数的权重值，例如，第一频率系数的权重值可设置为70％，第二频率系数的权重值的可设置为30％，而后通过百分数制或十分制的计算方法，生成所述目标视频与标题信息的匹配分数，并将该匹配分数显示在目标视频标题之前或之后对用户进行提示。其中，所述目标视频的类型包括：美食类、音乐类、搞笑类、时尚类、影视类等，不同类别的目标视频预设的权重值不一致。

本发明的第一实施例过从视频图像内容与视频的音频内容判断视频内容与视频标题是否匹配，得出匹配分数后给用户相关的提示信息，减少观看用户错点视频的概率，提高用户体验感。而且，为了提高视频内容与视频标题的匹配准确性，本实施例从图像维度和音频维度，对目标视频进行多维度分析，然后根据不同维度下目标视频的匹配结果，综合确定出目标视频与标题的匹配分数并对用户进行提示，提高了匹配的准确度。

请参考图2，在第一实施例的基础上，在一个优选实施例中，从获取目标视频的标题信息并筛选出至少一个关键词之后，还包括：

S101，基于所述关键词和预设词库进行词义扩展，生成与所述关键词相关联的一组关键词组。

具体的，在本实施例中，对所述关键词进行词义分析，根据预先设置的词库，获取关键词对应的同义词组或者与关键词词义相适配的拟声词组，该同义词组和拟声词组整合即形成与所述关键词相关联的一组关键词组。例如，对于关键词“笑”来而言，其同义词组为“笑脸、笑貌、笑容、笑颜”，其拟声词组为“哈哈、呵呵、嘿嘿”，因此构成关键词“笑”的相关联的一组关键词组为“笑脸、笑貌、笑容、笑颜、哈哈、呵呵、嘿嘿”。本实施例通过对关键词的词义进行扩展，得到范围更大的关键词组，进一步扩大了视频内容与标题信息的关联性，提高了视频内容与标题信息匹配的准确度。

在上述实施例的基础上，在另一个优选实施例中，基于所述关键词，提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数的步骤包括：

根据所述关键词组，生成所述关键词组的样本图像；

计算所述关键帧出现的所述第一频率系数。

具体的，在本实施例中，可根据预设的图像库，依据关键词组的信息生成所述关键词组的样本图像，生成的样本图像包括文字样本图像和事物样本图片，文字样本图像为纯文字图片，事物样本图片为以关键词为特征的人物部分特征图片或风景图片。例如，对于关键词“笑”来说，其文字文字样本图像为以“笑”字形成的图片，其事物样本图片可为以笑脸形成的图片，这二者整合就可形成所述关键词的样本图像。而后视频信息提示设备可对目标视频进行帧分析并进行总帧数统计，并将样本图像作为提取关键帧的特征信息，利用图像分析技术判断目标视频的每帧数据是否具有该特征信息；如果有，则将该帧数记为关键帧并进行关键帧次数统计，最后通过关键帧出现的次数与目标视频的总帧数进行比较，获得所述关键帧出现的第一频率系数。其中，所述图像分析技术为图像识别技术，该技术可以采用现有技术，在此不做赘述。因为视频当中经常出现纯文字片段，通过生成文字样本图像作为关键帧的特征信息，对于只有文字的视频类型而言，进一步提高了视频内容与标题信息匹配的准确性。

在上述实施例的基础上，在另一个优选实施例中，基于所述关键词，识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数的步骤包括：

基于语音识别技术，生成所述目标视频的语音文档；

具体地，在本实施例中，视频信息提示设备当中包括语语音识别技术的程序，通过该语音识别技术将目标视频音频数据转换成语音文档，利用语音文档与关键词组进行匹配；如果匹配，提取关键词组出现的音频片段作为音频特征并进行音频特征次数及时间长度信息统计，最后通过将所有音频特征的总时间长度信息与目标视频音频时间长度信息进行比较，获得所述音频特征出现的第二频率系数。本实施例先将目标视频的音频转换成文档，与关键词进行匹配而后再进行音频特征提取，加快了音频与关键词的匹配的速度，也提高了匹配的准确性。

请参考图3，在上述实施例的基础上，在另一个优选实施例中，根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示之前，还包括：

S31，预设频率系数阈值；

S32，判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值；

S33，若是，基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数，生成所述目标视频与标题信息的匹配分数并对用户进行提示；

S34，若否，根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

具体地，目前视频当中包括视频画面孔白的语音视频，也包括音频为纯音乐的视频。因而，在实施例中，先判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值，若其中一个超过预设频率系数阈值，就可表示这个目标视频内容与标题信息是匹配的，就可生成所述目标视频与标题信息的匹配分数并对用户进行提示。其中，可选择超出预设频率系数阈值的频率系数作为基准，生成所述目标视频与标题信息的匹配分数并对用户进行提示，并可根据选择计算基于超出预设频率系数阈值的大小来定义匹配分数。确保在上述两种视频情况下匹配分数的准确性，而且对于不在这两种范围的视频来说，只要超过该预设频率系数阈值就可输出匹配分数，减少了程序计算过程，减小视频信息提示设备的负担。

本发明第二实施例:

请参考图4，本发明的第二实施例提供一种视频信息提示装置，包括：

获取单元10，用于获取目标视频的标题信息并筛选出至少一个关键词；

提取单元20，用于基于所述关键词，提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数；

识别单元30，用于基于所述关键词，识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数；

匹配单元40，用于根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

优选地，还包括：

优选地，所述提取单元20具体包括：

图像生产模块，用于根据所述关键词组，生成所述关键词组的样本图像；

关键帧提取模块，用于基于所述样本图像和图像分析技术，提取所述目标视频的关键帧；

第一计算模块，用于计算所述关键帧出现的所述第一频率系数。

优选地，所述识别单元30具体包括：

语音文档生成模块，基于语音识别技术，生成所述目标视频的语音文档；

音频特征获取模块，匹配所述关键词组和所述语音文档，获得所述目标视频的音频特征；

第二计算模块，计算所述音频特征在所述语音文档中出现的所述第二频率系数。

优选地，还包括：

阈值预设单元，预设频率系数阈值；

判断单元，判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值；其中，当所述第一频率系数和/或所述第二频率系数其中一个超过所述频率系数阈值时，所述匹配单元40基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数，生成所述目标视频与标题信息的匹配分数并对用户进行提示；当所述第一频率系数和所述第二频率系数均不超过所述频率系数阈值时，所述匹配单元40根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示。

本发明第三实施例:

本发明第三实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述实施例的视频信息提示方法。

本发明第四实施例:

本发明第四实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述实施例的视频信息提示方法。

示例性地，本发明实施例所述的计算机程序可以被分割成一个或多个模块，所述一个或者多个模块被存储在所述存储器中，并由所述处理器执行，以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述实现服务器设备中的执行过程。例如，本发明第二实施例中所述的装置。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(APPlication Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述页面元素显示方法的控制中心，利用各种接口和线路连接整个所述实现视频信息提示方法的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现页面元素显示方法的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其中，所述实现服务设备的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一个计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种视频信息提示方法，其特征在于，包括:

获取目标视频的标题信息并筛选出至少一个关键词；

2.根据权利要求1所述的视频信息提示方法，其特征在于，从获取目标视频的标题信息并筛选出至少一个关键词之后，还包括：

3.根据权利要求2所述的视频信息提示方法，其特征在于，基于所述关键词，提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数的步骤包括：

根据所述关键词组，生成所述关键词组的样本图像；

计算所述关键帧出现的所述第一频率系数。

4.根据权利要求2所述的视频信息提示方法，其特征在于，基于所述关键词，识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数的步骤包括：

基于语音识别技术，生成所述目标视频的语音文档；

5.根据权利要求1所述的视频信息提示方法，其特征在于，根据所述第一频率系数和所述第二频率系数预设的权重值，生成所述目标视频与标题信息的匹配分数并对用户进行提示之前，还包括：

预设频率系数阈值；

6.一种视频信息提示装置，其特征在于，包括：

7.根据权利要求6所述的视频信息提示装置，其特征在于，还包括：

8.根据权利要求6所述的视频信息提示装置，其特征在于，还包括：

阈值预设单元，预设频率系数阈值；

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-5任意一项所述的视频信息提示方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1～5任一项所述的视频信息提示方法。