CN110072140A - 一种视频信息提示方法、装置、设备及存储介质 - Google Patents

一种视频信息提示方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110072140A
CN110072140A CN201910222036.7A CN201910222036A CN110072140A CN 110072140 A CN110072140 A CN 110072140A CN 201910222036 A CN201910222036 A CN 201910222036A CN 110072140 A CN110072140 A CN 110072140A
Authority
CN
China
Prior art keywords
frequency
frequency coefficient
coefficient
target video
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910222036.7A
Other languages
English (en)
Other versions
CN110072140B (zh
Inventor
郑峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University of Technology
Original Assignee
Xiamen University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University of Technology filed Critical Xiamen University of Technology
Priority to CN201910222036.7A priority Critical patent/CN110072140B/zh
Publication of CN110072140A publication Critical patent/CN110072140A/zh
Application granted granted Critical
Publication of CN110072140B publication Critical patent/CN110072140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4882Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种视频信息提示方法、装置、设备及存储介质,涉及信息技术领域,包括:获取目标视频的标题信息并筛选出至少一个关键词;基于关键词,提取目标视频的关键帧并计算关键帧出现的第一频率系数;基于关键词,识别目标视频语音的音频特征并计算音频特征出现的第二频率系数;根据第一频率系数和第二频率系数预设的权重值,生成目标视频与标题信息的匹配分数并对用户进行提示。本发明通过从视频图像内容与视频的音频内容判断视频内容与视频标题是否匹配,得出匹配分数后给用户相关的提示信息,减少观看用户错点视频的概率,提高用户体验感。

Description

一种视频信息提示方法、装置、设备及存储介质
技术领域
本发明涉及信息技术领域,具体而言,涉及一种视频信息提示方法、装置、设备及存储介质。
背景技术
自媒体是新媒体的一种表现形式,越来越多自媒体从业者通过在网上发布视频资源来实现传播。在观看视频的时候,用户经常是通过视频标题选择感兴趣的视频进行观看。但是很多自媒体从业者为了吸引用户的注意,视频通过设置引人注意的标题来吸引观看用户,但这些视频标题与视频内容不相符合,导致用户体验不佳。
发明内容
有鉴于此,本方案提供了一种视频信息提示方法、装置、设备及存储介质,能够根据提取视频内容相关信息并判断其与视频标题是否匹配,而后得出相关的提示信息,减少观看用户错点视频的概率,提高用户体验感。
本发明较佳实施例提供了一种视频信息提示方法,包括:
获取目标视频的标题信息并筛选出至少一个关键词;
基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数;
基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数;
根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
优选地,从获取目标视频的标题信息并筛选出至少一个关键词之后,还包括:
基于所述关键词和预设词库进行词义扩展,生成与所述关键词相关联的一组关键词组。
优选地,基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数的步骤包括:
根据所述关键词组,生成所述关键词组的样本图像;
基于所述样本图像和图像分析技术,提取所述目标视频的关键帧;
计算所述关键帧出现的所述第一频率系数。
优选地,基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数的步骤包括:
基于语音识别技术,生成所述目标视频的语音文档;
匹配所述关键词组和所述语音文档,获得所述目标视频的音频特征;
计算所述音频特征在所述语音文档中出现的所述第二频率系数。
优选地,根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示之前,还包括:
预设频率系数阈值;
判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值;
若是,基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数,生成所述目标视频与标题信息的匹配分数并对用户进行提示;
若否,根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
本发明还提供一种视频信息提示装置,包括:
获取单元,用于获取目标视频的标题信息并筛选出至少一个关键词;
提取单元,用于基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数;
识别单元,用于基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数;
匹配单元,用于根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
优选地,还包括:
词义扩展单元,用于基于所述关键词和预设词库进行词义扩展,生成与所述关键词相关联的一组关键词组。
优选地,还包括:
阈值预设单元,预设频率系数阈值;
判断单元,判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值;其中,当所述第一频率系数和/或所述第二频率系数其中一个超过所述频率系数阈值时,所述匹配单元基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数,生成所述目标视频与标题信息的匹配分数并对用户进行提示;当所述第一频率系数和所述第二频率系数均不超过所述频率系数阈值时,所述匹配单元根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的视频信息提示方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的视频信息提示方法。
本发明提供的一种视频信息提示方法、装置、设备及存储介质,通过从视频图像内容与视频的音频内容判断视频内容与视频标题是否匹配,得出匹配分数后给用户相关的提示信息,减少观看用户错点视频的概率,提高用户体验感。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明提供的视频信息提示方法的第一实施例的流程示意图;
图2是图1的S10步骤之后包括的一个实施例的流程示意图;
图3是图2的S40步骤之前包括的一个实施例的流程示意图;
图4是本发明提供的视频信息提示装置的第二实施例的结构示意图;
图标:10-获取单元;20-提取单元;30-识别单元;40-匹配单元。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参考图1~图3,本发明的第一实施例提供了一种视频信息提示方法,可由视频信息提示设备来执行,并至少包括如下步骤:
S10,获取目标视频的标题信息并筛选出至少一个关键词。
其中,在本实施例中,所述视频信息提示设备例如可为一个服务器或者具有数据处理和收发能力的终端,其安装有相应的计算机程序(例如一个中间件),并通过执行所述计算机程序来实现本实施例的视频信息提示方法。
所述目标视频为服务器从网络中拉取的视频,或者由终端上传的视频,本申请的实施例并不对目标视频的来源进行限定。在一个示意性的应用场景下,视频信息提示设备为视频网站的后台服务器,该目标视频为用户使用该视频网站可观看的视频,例如在哔哩哔哩视频网站上可观看的一个名为《最有挑战性的忍笑大挑战》的视频就可当做目标视频。其中,该视频的标题就是本实施例所描述的标题信息,而所述视频信息提示设备可利用算法获取所述标题信息并筛选出关于所述标题信息的至少一个关键词,上述目标视频的例子从其标题信息提取的关键词就可为“挑战”、“笑”等。
具体的,在本实施例中,可先对目标视频的标题信息进行提取至少一个关键词时,所述视频信息提示设备可以利用TextRank算法,提取目标视频的标题信息当中的关键词。而TextRank算法为关键词提取的常用技术,为现有技术,这里就不再赘述。所述视频信息提示设备还可以利用LDA算法、TPR算法进行目标视频的标题信息关键词提取,但不限于此。
S20,基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数。
具体地,在本实施例中,所述关键帧指角色或者物体运动或变化中的执行所述关键词动作所处的那一帧。其中,视频信息提示设备可对目标视频进行帧分析并进行总帧数统计,而后分别判断出每帧数据是否具有匹配所述关键词的特征信息;如果有,则该帧数记为关键帧并进行关键帧次数统计,最后通过关键帧出现的次数与目标视频的总帧数进行比较,计算获得所述关键帧出现的第一频率系数。其中,提取关键词所对应的关键帧的具体实现方式可以采用现有技术,在此不做赘述。
S30,基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数。
具体地,在本实施例中,所述音频特征指目标视频的音频数据当中的出现所述关键词所在的音频片段。其中,视频信息提示设备当中包括语音识别程序,通过该语音识别程序对目标视频音频数据进行语音识别并进行时间长度信息统计,而后判断目标视频的音频数据当中是否具有关键词的音频片段;如果有,则将该音频片段记为音频特征并进行音频特征次数及时间长度信息统计,最后通过将所有音频特征的总时间长度信息与目标视频音频数据的时间长度信息进行比较,计算获得所述音频特征出现的第二频率系数。其中,语音识别程序的具体实现方式可以采用现有技术,在此不做赘述。
S40,根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
具体地,在本实施例中,可根据目标视频的类型预设所述第一频率系数和所述第二频率系数的权重值,例如,第一频率系数的权重值可设置为70%,第二频率系数的权重值的可设置为30%,而后通过百分数制或十分制的计算方法,生成所述目标视频与标题信息的匹配分数,并将该匹配分数显示在目标视频标题之前或之后对用户进行提示。其中,所述目标视频的类型包括:美食类、音乐类、搞笑类、时尚类、影视类等,不同类别的目标视频预设的权重值不一致。
本发明的第一实施例过从视频图像内容与视频的音频内容判断视频内容与视频标题是否匹配,得出匹配分数后给用户相关的提示信息,减少观看用户错点视频的概率,提高用户体验感。而且,为了提高视频内容与视频标题的匹配准确性,本实施例从图像维度和音频维度,对目标视频进行多维度分析,然后根据不同维度下目标视频的匹配结果,综合确定出目标视频与标题的匹配分数并对用户进行提示,提高了匹配的准确度。
请参考图2,在第一实施例的基础上,在一个优选实施例中,从获取目标视频的标题信息并筛选出至少一个关键词之后,还包括:
S101,基于所述关键词和预设词库进行词义扩展,生成与所述关键词相关联的一组关键词组。
具体的,在本实施例中,对所述关键词进行词义分析,根据预先设置的词库,获取关键词对应的同义词组或者与关键词词义相适配的拟声词组,该同义词组和拟声词组整合即形成与所述关键词相关联的一组关键词组。例如,对于关键词“笑”来而言,其同义词组为“笑脸、笑貌、笑容、笑颜”,其拟声词组为“哈哈、呵呵、嘿嘿”,因此构成关键词“笑”的相关联的一组关键词组为“笑脸、笑貌、笑容、笑颜、哈哈、呵呵、嘿嘿”。本实施例通过对关键词的词义进行扩展,得到范围更大的关键词组,进一步扩大了视频内容与标题信息的关联性,提高了视频内容与标题信息匹配的准确度。
在上述实施例的基础上,在另一个优选实施例中,基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数的步骤包括:
根据所述关键词组,生成所述关键词组的样本图像;
基于所述样本图像和图像分析技术,提取所述目标视频的关键帧;
计算所述关键帧出现的所述第一频率系数。
具体的,在本实施例中,可根据预设的图像库,依据关键词组的信息生成所述关键词组的样本图像,生成的样本图像包括文字样本图像和事物样本图片,文字样本图像为纯文字图片,事物样本图片为以关键词为特征的人物部分特征图片或风景图片。例如,对于关键词“笑”来说,其文字文字样本图像为以“笑”字形成的图片,其事物样本图片可为以笑脸形成的图片,这二者整合就可形成所述关键词的样本图像。而后视频信息提示设备可对目标视频进行帧分析并进行总帧数统计,并将样本图像作为提取关键帧的特征信息,利用图像分析技术判断目标视频的每帧数据是否具有该特征信息;如果有,则将该帧数记为关键帧并进行关键帧次数统计,最后通过关键帧出现的次数与目标视频的总帧数进行比较,获得所述关键帧出现的第一频率系数。其中,所述图像分析技术为图像识别技术,该技术可以采用现有技术,在此不做赘述。因为视频当中经常出现纯文字片段,通过生成文字样本图像作为关键帧的特征信息,对于只有文字的视频类型而言,进一步提高了视频内容与标题信息匹配的准确性。
在上述实施例的基础上,在另一个优选实施例中,基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数的步骤包括:
基于语音识别技术,生成所述目标视频的语音文档;
匹配所述关键词组和所述语音文档,获得所述目标视频的音频特征;
计算所述音频特征在所述语音文档中出现的所述第二频率系数。
具体地,在本实施例中,视频信息提示设备当中包括语语音识别技术的程序,通过该语音识别技术将目标视频音频数据转换成语音文档,利用语音文档与关键词组进行匹配;如果匹配,提取关键词组出现的音频片段作为音频特征并进行音频特征次数及时间长度信息统计,最后通过将所有音频特征的总时间长度信息与目标视频音频时间长度信息进行比较,获得所述音频特征出现的第二频率系数。本实施例先将目标视频的音频转换成文档,与关键词进行匹配而后再进行音频特征提取,加快了音频与关键词的匹配的速度,也提高了匹配的准确性。
请参考图3,在上述实施例的基础上,在另一个优选实施例中,根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示之前,还包括:
S31,预设频率系数阈值;
S32,判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值;
S33,若是,基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数,生成所述目标视频与标题信息的匹配分数并对用户进行提示;
S34,若否,根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
具体地,目前视频当中包括视频画面孔白的语音视频,也包括音频为纯音乐的视频。因而,在实施例中,先判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值,若其中一个超过预设频率系数阈值,就可表示这个目标视频内容与标题信息是匹配的,就可生成所述目标视频与标题信息的匹配分数并对用户进行提示。其中,可选择超出预设频率系数阈值的频率系数作为基准,生成所述目标视频与标题信息的匹配分数并对用户进行提示,并可根据选择计算基于超出预设频率系数阈值的大小来定义匹配分数。确保在上述两种视频情况下匹配分数的准确性,而且对于不在这两种范围的视频来说,只要超过该预设频率系数阈值就可输出匹配分数,减少了程序计算过程,减小视频信息提示设备的负担。
本发明第二实施例:
请参考图4,本发明的第二实施例提供一种视频信息提示装置,包括:
获取单元10,用于获取目标视频的标题信息并筛选出至少一个关键词;
提取单元20,用于基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数;
识别单元30,用于基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数;
匹配单元40,用于根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
优选地,还包括:
词义扩展单元,用于基于所述关键词和预设词库进行词义扩展,生成与所述关键词相关联的一组关键词组。
优选地,所述提取单元20具体包括:
图像生产模块,用于根据所述关键词组,生成所述关键词组的样本图像;
关键帧提取模块,用于基于所述样本图像和图像分析技术,提取所述目标视频的关键帧;
第一计算模块,用于计算所述关键帧出现的所述第一频率系数。
优选地,所述识别单元30具体包括:
语音文档生成模块,基于语音识别技术,生成所述目标视频的语音文档;
音频特征获取模块,匹配所述关键词组和所述语音文档,获得所述目标视频的音频特征;
第二计算模块,计算所述音频特征在所述语音文档中出现的所述第二频率系数。
优选地,还包括:
阈值预设单元,预设频率系数阈值;
判断单元,判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值;其中,当所述第一频率系数和/或所述第二频率系数其中一个超过所述频率系数阈值时,所述匹配单元40基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数,生成所述目标视频与标题信息的匹配分数并对用户进行提示;当所述第一频率系数和所述第二频率系数均不超过所述频率系数阈值时,所述匹配单元40根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
本发明第三实施例:
本发明第三实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例的视频信息提示方法。
本发明第四实施例:
本发明第四实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例的视频信息提示方法。
示例性地,本发明实施例所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述实现服务器设备中的执行过程。例如,本发明第二实施例中所述的装置。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(APPlication Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述页面元素显示方法的控制中心,利用各种接口和线路连接整个所述实现视频信息提示方法的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现页面元素显示方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述实现服务设备的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种视频信息提示方法,其特征在于,包括:
获取目标视频的标题信息并筛选出至少一个关键词;
基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数;
基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数;
根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
2.根据权利要求1所述的视频信息提示方法,其特征在于,从获取目标视频的标题信息并筛选出至少一个关键词之后,还包括:
基于所述关键词和预设词库进行词义扩展,生成与所述关键词相关联的一组关键词组。
3.根据权利要求2所述的视频信息提示方法,其特征在于,基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数的步骤包括:
根据所述关键词组,生成所述关键词组的样本图像;
基于所述样本图像和图像分析技术,提取所述目标视频的关键帧;
计算所述关键帧出现的所述第一频率系数。
4.根据权利要求2所述的视频信息提示方法,其特征在于,基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数的步骤包括:
基于语音识别技术,生成所述目标视频的语音文档;
匹配所述关键词组和所述语音文档,获得所述目标视频的音频特征;
计算所述音频特征在所述语音文档中出现的所述第二频率系数。
5.根据权利要求1所述的视频信息提示方法,其特征在于,根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示之前,还包括:
预设频率系数阈值;
判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值;
若是,基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数,生成所述目标视频与标题信息的匹配分数并对用户进行提示;
若否,根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
6.一种视频信息提示装置,其特征在于,包括:
获取单元,用于获取目标视频的标题信息并筛选出至少一个关键词;
提取单元,用于基于所述关键词,提取所述目标视频的关键帧并计算所述关键帧出现的第一频率系数;
识别单元,用于基于所述关键词,识别所述目标视频语音的音频特征并计算所述音频特征出现的第二频率系数;
匹配单元,用于根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
7.根据权利要求6所述的视频信息提示装置,其特征在于,还包括:
词义扩展单元,用于基于所述关键词和预设词库进行词义扩展,生成与所述关键词相关联的一组关键词组。
8.根据权利要求6所述的视频信息提示装置,其特征在于,还包括:
阈值预设单元,预设频率系数阈值;
判断单元,判断所述第一频率系数和/或所述第二频率系数其中一个是否超过所述频率系数阈值;其中,当所述第一频率系数和/或所述第二频率系数其中一个超过所述频率系数阈值时,所述匹配单元基于超过所述频率系数阈值的所述第一频率系数或所述第二频率系数,生成所述目标视频与标题信息的匹配分数并对用户进行提示;当所述第一频率系数和所述第二频率系数均不超过所述频率系数阈值时,所述匹配单元根据所述第一频率系数和所述第二频率系数预设的权重值,生成所述目标视频与标题信息的匹配分数并对用户进行提示。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5任意一项所述的视频信息提示方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~5任一项所述的视频信息提示方法。
CN201910222036.7A 2019-03-22 2019-03-22 一种视频信息提示方法、装置、设备及存储介质 Active CN110072140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910222036.7A CN110072140B (zh) 2019-03-22 2019-03-22 一种视频信息提示方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910222036.7A CN110072140B (zh) 2019-03-22 2019-03-22 一种视频信息提示方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110072140A true CN110072140A (zh) 2019-07-30
CN110072140B CN110072140B (zh) 2021-05-28

Family

ID=67366497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910222036.7A Active CN110072140B (zh) 2019-03-22 2019-03-22 一种视频信息提示方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110072140B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111277892A (zh) * 2020-01-20 2020-06-12 北京百度网讯科技有限公司 用于选取视频片段的方法、装置、服务器和介质
CN111339359A (zh) * 2020-02-18 2020-06-26 中山大学 一种基于九宫格的视频缩略图自动生成方法
CN111753126A (zh) * 2020-06-24 2020-10-09 北京字节跳动网络技术有限公司 用于视频配乐的方法和装置
CN113704553A (zh) * 2020-05-22 2021-11-26 上海哔哩哔哩科技有限公司 视频取景地推送方法及系统
CN114764363A (zh) * 2020-12-31 2022-07-19 上海擎感智能科技有限公司 提示方法、装置及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005115014A2 (en) * 2004-05-14 2005-12-01 Pixel Instruments, Corp. Method, system, and program product for measuring audio video synchronization
CN101447185A (zh) * 2008-12-08 2009-06-03 深圳市北科瑞声科技有限公司 一种基于内容的音频快速分类方法
CN106227793A (zh) * 2016-07-20 2016-12-14 合网络技术(北京)有限公司 一种视频与视频关键词相关度的确定方法及装置
CN108241729A (zh) * 2017-09-28 2018-07-03 新华智云科技有限公司 筛选视频的方法及设备
CN108429920A (zh) * 2018-02-06 2018-08-21 北京奇虎科技有限公司 一种处理标题党视频的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005115014A2 (en) * 2004-05-14 2005-12-01 Pixel Instruments, Corp. Method, system, and program product for measuring audio video synchronization
CN101447185A (zh) * 2008-12-08 2009-06-03 深圳市北科瑞声科技有限公司 一种基于内容的音频快速分类方法
CN106227793A (zh) * 2016-07-20 2016-12-14 合网络技术(北京)有限公司 一种视频与视频关键词相关度的确定方法及装置
CN108241729A (zh) * 2017-09-28 2018-07-03 新华智云科技有限公司 筛选视频的方法及设备
CN108429920A (zh) * 2018-02-06 2018-08-21 北京奇虎科技有限公司 一种处理标题党视频的方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111277892A (zh) * 2020-01-20 2020-06-12 北京百度网讯科技有限公司 用于选取视频片段的方法、装置、服务器和介质
US11490168B2 (en) 2020-01-20 2022-11-01 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for selecting video clip, server and medium
CN111339359A (zh) * 2020-02-18 2020-06-26 中山大学 一种基于九宫格的视频缩略图自动生成方法
CN113704553A (zh) * 2020-05-22 2021-11-26 上海哔哩哔哩科技有限公司 视频取景地推送方法及系统
CN113704553B (zh) * 2020-05-22 2024-04-16 上海哔哩哔哩科技有限公司 视频取景地推送方法及系统
CN111753126A (zh) * 2020-06-24 2020-10-09 北京字节跳动网络技术有限公司 用于视频配乐的方法和装置
CN114764363A (zh) * 2020-12-31 2022-07-19 上海擎感智能科技有限公司 提示方法、装置及计算机存储介质
CN114764363B (zh) * 2020-12-31 2023-11-24 上海擎感智能科技有限公司 提示方法、装置及计算机存储介质

Also Published As

Publication number Publication date
CN110072140B (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN110072140A (zh) 一种视频信息提示方法、装置、设备及存储介质
US10824874B2 (en) Method and apparatus for processing video
CN111694984B (zh) 视频搜索方法、装置、电子设备及可读存储介质
CN110246512A (zh) 声音分离方法、装置及计算机可读存储介质
CN113542801B (zh) 主播标识的生成方法、装置、设备、存储介质及程序产品
CN107566906B (zh) 一种视频评论处理方法及装置
US20230027412A1 (en) Method and apparatus for recognizing subtitle region, device, and storage medium
CN111488813B (zh) 视频的情感标注方法、装置、电子设备及存储介质
CN111372116A (zh) 视频播放提示信息处理方法、装置、电子设备及存储介质
CN114095749A (zh) 推荐及直播界面展示方法、计算机存储介质、程序产品
CN116738250A (zh) 提示文本扩展方法、装置、电子设备和存储介质
CN113301382B (zh) 视频处理方法、设备、介质及程序产品
CN116524906A (zh) 用于语音识别的训练数据生成方法、系统和电子设备
CN116881412A (zh) 汉字多维信息匹配训练方法、装置、电子设备和存储介质
CN113365138B (zh) 内容展示方法、装置、电子设备、存储介质
CN112333554B (zh) 多媒体数据的处理方法、装置、电子设备以及存储介质
CN115098729A (zh) 视频处理方法、样本生成方法、模型训练方法及装置
CN112989115B (zh) 待推荐视频的筛选控制方法及装置
CN114422824A (zh) 数据处理方法、视频处理方法、显示方法及设备
CN113923477A (zh) 视频处理方法、装置、电子设备以及存储介质
CN107679083A (zh) 一种智能信息推送的方法及装置
CN114390306A (zh) 一种直播互动摘要生成方法和装置
CN112165626A (zh) 图像处理方法、资源获取方法、相关设备及介质
CN114697762B (zh) 一种处理方法、装置、终端设备及介质
CN112243156B (zh) 弹幕显示方法和装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant