CN115209218A - 一种视频信息处理方法、电子设备及存储介质 - Google Patents

一种视频信息处理方法、电子设备及存储介质 Download PDF

Info

Publication number
CN115209218A
CN115209218A CN202210744761.2A CN202210744761A CN115209218A CN 115209218 A CN115209218 A CN 115209218A CN 202210744761 A CN202210744761 A CN 202210744761A CN 115209218 A CN115209218 A CN 115209218A
Authority
CN
China
Prior art keywords
video
target
reference analysis
image
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210744761.2A
Other languages
English (en)
Inventor
张涤非
康伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202210744761.2A priority Critical patent/CN115209218A/zh
Publication of CN115209218A publication Critical patent/CN115209218A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种视频信息处理方法,该方法包括:获取待分析视频;其中,所述待分析视频中包括目标对象;根据所述目标对象的第一声音特征参数,从所述待分析视频中提取至少一个第一参考分析视频;根据每一所述第一参考分析视频中所述目标对象的目标特征参数,对对应的所述第一参考分析视频进行分段处理,得到至少一个第二参考分析视频;根据至少一个所述第二参考分析视频,得到目标分析视频。本申请实施例还提供了一种电子设备和存储介质。

Description

一种视频信息处理方法、电子设备及存储介质
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频信息处理方法、电子设备及存储介质。
背景技术
随着视频技术的迅速发展,对视频信息的应用也越来越广。例如直接对采集到的视频信息进行视频内容分析,例如,对采集到的视频信息中的人的情绪分析进行分析。目前,常用的方法为对视频进行压缩处理后,对视频中的人脸图像进行图像分析,以确定得到用户的情绪。
但是,在针对视频内容较大时,采用目前常用的视频压缩处理方法进行处理后,得到的视频内容依然较大,导致对压缩处理后的视频内容进行分析时,花费的时长依然较长,导致视频分析效率较低。
发明内容
为解决上述技术问题,本申请实施例期望提供一种视频信息处理方法、电子设备及存储介质,解决了目前视频分析过程花费时间较长的问题,有效减小了确定分析视频的长度,进而缩短了视频分析过程,提高了视频分析效率。
本申请的技术方案是这样实现的:
第一方面,一种视频信息处理方法,所述方法包括:
获取待分析视频;其中,所述待分析视频中包括目标对象;
根据所述目标对象的第一声音特征参数,从所述待分析视频中提取至少一个第一参考分析视频;
根据每一所述第一参考分析视频中所述目标对象的目标特征参数,对对应的所述第一参考分析视频进行分段处理,得到至少一个第二参考分析视频;
根据至少一个所述第二参考分析视频,得到目标分析视频。
可选的,所述方法还包括:
确定每一所述第一参考分析视频中每一帧图像对应的所述目标对象的p个第二声音特征参数;其中,p为大于或等于1的整数;
根据每一所述第一参考分析视频中每一第一图像的每一所述第二声音特征参数和对应的第二图像的所述第二声音特征参数,确定所述目标特征参数;其中,所述第一图像为每一所述第一参考分析视频中与所述第二图像相邻的两帧图像,且所述第一图像为所述第二图像前一帧图像。
可选的,所述根据每一所述第一参考分析视频中每一第一图像的每一所述第二声音特征参数和对应的第二图像的每一所述第二声音特征参数,确定所述目标特征参数,包括:
确定每一所述第一图像的每一所述第二声音特征参数与对应的所述第二图像的所述第二声音特征参数的差值的绝对值;
确定每一所述绝对值与对应的所述第一图像的所述第二声音特征参数的比值,得到所述目标特征参数;其中,所述目标特征参数包括每一所述第一参考分析视频包括的全部视频帧数减1组p个所述比值。
可选的,所述根据每一所述第一参考分析视频中所述目标对象的目标特征参数,对对应的所述第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,包括:
从所述目标特征参数中,确定q组p个目标比值;
若q大于或等于1,确定所述q组p个目标比值对应的所述第一图像;
根据所述q组p个目标比值对应的所述第一图像对对应的所述第一参考分析视频进行分段处理,得到对应的所述第二参考分析视频;
若q等于0,确定对应的所述第一参考分析视频为所述第二参考分析视频,如此,得到至少一个所述第二参考分析视频。
可选的,所述从所述目标特征参数中,确定q组p个目标比值,包括:
基于所述目标特征参数中,确定每一组p个所述比值与对应的预设阈值的目标关系;
从所述目标特征参数中,确定所述目标关系为至少一个所述比值大于对应的预设阈值的目标组,得到所述q组p个目标比值。
可选的,所述根据至少一个所述第二参考分析视频,得到目标分析视频,包括:
根据每一段所述第二参考分析视频,确定预设时长;
从每一段所述第二参考分析视频中,获取目标位置处所述预设时长范围内的第三参考分析视频,得到所述目标分析视频。
可选的,所述根据每一段所述第二参考分析视频,确定预设时长,包括:
确定每一段所述第二参考分析视频的目标时长;
确定预设时长阈值;
确定每一所述目标时长与所述预设时长阈值的乘积,得到所述预设时长。
可选的,所述第一声音特征参数至少包括:所述目标对象的声纹特征参数。
第二方面,一种电子设备,该设备至少包括:存储器、处理器和通信总线;其中:
所述存储器,用于存储可执行指令;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的视频信息处理程序,实现如上述任一项所述的视频信息处理方法的步骤。
第三方面,一种存储介质,所述存储介质上存储有视频信息处理程序,所述视频信息处理程序被处理器执行时实现如上述任一项所述的视频信息处理方法的步骤。
本申请实施例提供了一种视频信息处理方法、电子设备及存储介质,获取待分析视频后,根据目标对象的第一声音特征参数,从待分析视频中提取至少一个第一参考分析视频,然后根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,最后根据指示一个第二参考分析视频,得到目标分析视频。这样,先根据目标对象的第一声音特征参数对待分析视频进行处理,得到至少一个第一参考分析视频,再根据目标对象的目标特征参数对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,从而根据指示一个第二参考分析视频得到目标分析视频,解决了目前视频分析过程花费时间较长的问题,有效减小了确定分析视频的长度,进而缩短了视频分析过程,提高了视频分析效率。
附图说明
图1为本申请实施例提供的一种视频信息处理方法的流程示意图;
图2为本申请实施例提供的另一种视频信息处理方法的流程示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本申请的实施例提供一种视频信息处理方法,参照图1所示,方法应用于电子设备,该方法包括以下步骤:
步骤101、获取待分析视频。
其中,待分析视频中包括目标对象。
在本申请实施例中,待分析视频可以是具有目标对象的音频信息的视频内容。例如可以是访谈内容,也可以是一般的视频内容。待分析视频可以是刚采集到的一段完整视频,也可以是电子设备本地存储的或从其他设备处获取得到的一段视频。
步骤102、根据目标对象的第一声音特征参数,从待分析视频中提取至少一个第一参考分析视频。
在本申请实施例中,目标对象的第一声音特征参数是能够唯一识别目标对象的声音的特征参数。对待分析视频中的音频信息进行分析,从待分析视频中截取目标对象的第一声音特征参数对应的分析视频,得到至少一个第一参考分析视频。也就是说每一第一参考分析视频中包括目标对象的第一声音特征参数对应的视频内容。
步骤103、根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频。
在本申请实施例中,确定每一第一参考分析视频中目标对象的目标特征参数,根据每一第一参考分析视频中目标对象的目标特征参数,对每一第一参考分析视频进行分析,再次对每一第一参考分析视频进行分段处理,得到至少一个第二参考分析视频。
步骤104、根据至少一个第二参考分析视频,得到目标分析视频。
在本申请实施例中,对至少一个第二参考分析视频继续进行视频提取处理,并将提取到的视频内容确定为目标分析视频。
本申请实施例提供的视频信息处理方法,获取待分析视频后,根据目标对象的第一声音特征参数,从待分析视频中提取至少一个第一参考分析视频,然后根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,最后根据指示一个第二参考分析视频,得到目标分析视频。这样,先根据目标对象的第一声音特征参数对待分析视频进行处理,得到至少一个第一参考分析视频,再根据目标对象的目标特征参数对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,从而根据指示一个第二参考分析视频得到目标分析视频,解决了目前视频分析过程花费时间较长的问题,有效减小了确定分析视频的长度,进而缩短了视频分析过程,提高了视频分析效率。
基于前述实施例,本申请的实施例提供一种视频信息处理方法,方法应用于电子设备,参照图2所示,该方法包括以下步骤:
步骤201、获取待分析视频。
其中,待分析视频中包括目标对象。
在本申请实施例中,以待分析视频为访谈视频为例进行说明,电子设备获取对访谈内容进行视频录制得到的视频内容,得到待分析视频。
示例性的,假设待分析视频中包括主持人和一个被访问对象,需对被访问对象进行后续分析时,可以确定目标对象为该被访问对象。
步骤202、根据目标对象的第一声音特征参数,从待分析视频中提取至少一个第一参考分析视频。
其中,第一声音特征参数至少包括:目标对象的声纹特征参数。
在本申请实施例中,目标对象的声纹特征参数例如可以是目标对象的声音的音高、音强、音长、音色等特征信息。示例性的,对待分析视频进行视频剪辑,提取只包括被访问对象的第一声音特征参数即声音对应的视频信息,得到至少一个第一参考分析视频。
步骤203、确定每一第一参考分析视频中每一帧图像对应的目标对象的p个第二声音特征参数。
其中,p为大于或等于1的整数。
在本申请实施例中,p的数量可以根据实际情况进行设定,其数量越大,分析的准确度越高。对每一第一参考分析视频中的每一帧图像进行分析,确定每一帧图像对应的目标对象的p个第二声音特征参数。第二声音特征参数例如可以是声音频率、音调、音量等声音特征参数。示例性的,假设p的取值为3,则对应的需要确定每一第一参考分析视频中每一帧图像对应的目标对象的3个第二声音特征参数,3个第二声音特征参数分别记为S1、S2和S3。
步骤204、根据每一第一参考分析视频中每一第一图像的每一第二声音特征参数和对应的第二图像的第二声音特征参数,确定目标特征参数。
其中,第一图像为每一第一参考分析视频中与第二图像相邻的两帧图像,且第一图像为第二图像前一帧图像。
在本申请实施例中,对每一第一参考分析视频中的每一前一帧图像的第二声音特征参数和对应的后一帧的第二声音特征参数进行分析,确定得到每一第一参考分析视频的目标特征参数。
步骤205、根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频。
在本申请实施例中,对每一第一参考分析视频中目标对象的目标特征参数进行比较分析,来对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,其中,至少一个第二参考分析视频包括对至少一个第一参考分析视频进行分段处理后的全部分段视频。
步骤206、根据至少一个第二参考分析视频,得到目标分析视频。
在本申请实施例中,对至少一个第二参考分析视频中的每一第二参考分析视频按要求再次进行视频内容提取,得到目标分析视频。在本申请实施例中,得到目标分析视频后,可以对目标分析视频应用于各个分析应用场景,例如可以采用情绪分析方法对目标分析视频中的目标对象进行情绪分析。
基于前述实施例,在本申请其他实施例中,步骤204可以由步骤204a~204b来实现:
步骤204a、确定每一第一图像的每一第二声音特征参数与对应的第二图像的第二声音特征参数的差值的绝对值。
在本申请实施例中,假设每一第一参考分析视频中包括m帧视频图像,对应的每一第一图像对应的每一第二声音特征参数可以表示为Sij,对应的第二图像的第二声音特征参数可以表示为Si(j+1),其中,i用于表示目标对象的第i个第二声音特征参数,i=1,2,……,p,j用于表示每一第一参考分析视频中的第j帧视频图像,j=1,2,……,m-1。这样,针对可以采用公式Cij=|Sij-Si(j+1)|表示每一第一图像的每一第二声音特征参数与对应的第二图像的第二声音特征参数的差值的绝对值。
步骤204b、确定每一绝对值与对应的第一图像的第二声音特征参数的比值,得到目标特征参数。
其中,目标特征参数包括每一第一参考分析视频包括的全部视频帧数减1组p个比值。
在本申请实施例中,每一第一参考分析视频中,每一绝对值与对应的第一图像的第二声音特征参数的比值Bij=Cij/Sij=|Sij-Si(j+1)|/Sij,对应的,目标特征参数为至少一个第一参考分析视频对应的Bij,其中,i的取值为从1至p,j的取值为从1至m-1。
基于前述实施例,在本申请其他实施例中,步骤205可以由步骤205a~205c或步骤205a和步骤205d来实现:
步骤205a、从目标特征参数中,确定q组p个目标比值。
在本申请实施例中,从目标特征参数中,对每一第一参考分析视频中第j帧图像对应的p个第二声音特征参数对应的比值进行分析,若每一第一参考分析视频中第j帧图像对应的p个第二声音特征参数对应的比值均满足一定要求,确定该第j帧图像对应的p个第二声音特征参数对应的比值为一组p个目标比值,如此,从目标特征参数中,可以确定得到q组p个目标比值。
步骤205b、若q大于或等于1,确定q组p个目标比值对应的第一图像。
在本申请实施例中,在q大于或等于1时,表明至少一个第一参考分析视频中有q处,目标对象的声音信息发生了明显的变化。示例性的,假设q=5,表明至少一个第一参考分析视频中总共有5次目标对象的说话语气发生明显变化,因此,可以确定这5处对应的第一图像来作为对对应的第一参考分析视频进行分段处理的分段节点。
步骤205c、根据q组p个目标比值对应的第一图像对对应的第一参考分析视频进行分段处理,得到对应的第二参考分析视频。
在本申请实施例中,采用确定得到的q帧第一图像来对对应的第一参考分析视频进行分段处理,得到对应的第二参考分析视频。示例性的,在第一参考分析视频总共有4个,分别为第一视频、第二视频、第三视频和第四视频,q的取值为5时,确定得到的对应的第一图像分别为第一视频中的第4帧图像和第20帧图像,第二视频中的第30帧图像,第三视频中的第10帧图像和第50帧图像;针对第一视频,采用第4帧图像和第20帧图像,将第一视频分割为3个第二参考分析视频,针对第二视频,采用第30帧图像,将第二视频分割为2个第二参考分析视频,针对第三视频,采用第10帧图像和第50帧图像,将第三视频分割为两个第二参考分析视频,针对第四视频,由于未确定得到第一图像,则直接将第四视频确定为第二参考分析视频。
步骤205d、若q等于0,确定对应的第一参考分析视频为第二参考分析视频,如此,得到至少一个第二参考分析视频。
在本申请实施例中,在q等于0时,表明至少一个第一参考分析视频无需进行分段处理,可直接确定至少一个第二参考分析视频就是至少一个第一参考分析视频。
基于前述实施例,在本申请其他实施例中,步骤205a可以由步骤a11~a12来实现:
步骤a11、基于目标特征参数中,确定每一组p个比值与对应的预设阈值的目标关系。
在本申请实施例中,预设阈值是根据大量实验得到的,针对不同第二声音特征参数确定的,用于表示用户声音语气发生明显变化的经验值。示例性的,以对某一第一参考分析视频中第j组B1j、B2j、……和Bpj为例进行说明,将第j组B1j、B2j、……和Bpj分别与对应的预设阈值进行比较分析,得到第j组中B1j、B2j、……和Bpj与对应的预设阈值之间的大小关系,即得到第j组比值与对应的预设阈值之间的目标关系,如此,可以得到目标特征参数中所有组对应的目标关系。
步骤a12、从目标特征参数中,确定目标关系为至少一个比值大于对应的预设阈值的目标组,得到q组p个目标比值。
在本申请实施例中,对目标特征参数包括的所有组对应的目标关系进行分析,确定目标关系为至少一个比值大于对应的预设阈值的目标组,并统计数量共存在q组,如此,可以得到q组p个目标比值。
基于前述实施例,在本申请其他实施例中,步骤206可以由步骤206a~206b来实现:
步骤206a、根据每一段第二参考分析视频,确定预设时长。
在本申请实施例中,每一段第二参考分析视频的预设时长与每一第二参考分析视频的总时长有关。
步骤206b、从每一段第二参考分析视频中,获取目标位置处预设时长范围内的第三参考分析视频,得到目标分析视频。
在本申请实施例中,目标位置可以是预先设定的视频中的任意位置,例如可以是视频起始位置、视频中间位置、或者视频终点位置等。示例性的,以目标位置为视频起始位置为例进行说明,获取每一段第二参考分析视频中视频起始位置开始预设时长范围内的第三参考分析视频,这样,将至少一个第二参考分析视频对应的第三参考分析视频进行组合,得到目标分析视频。
基于前述实施例,在本申请其他实施例中,步骤206a可以由步骤b11~b13来实现:
步骤b11、确定每一段第二参考分析视频的目标时长。
在本申请实施例中,目标时长为每一第二参考分析视频的总时长。
步骤b12、确定预设时长阈值。
在本申请实施例中,预设时长阈值可以是根据大量实验得到的经验值,例如可以是5%,10%等。在一些应用场景下,还可以根据实际情况进行设定。
步骤b13、确定每一目标时长与预设时长阈值的乘积,得到预设时长。
在本申请实施例中,将每一第二参考分析视频的目标时长与预设阈值进行乘积计算,即可得到每一第二参考分析视频的预设时长。
基于前述实施例,本申请实施例提供一种视频信息处理方法,该方法应用于对访谈内容中的被访问对象进行分析的场景为例进行说明,该方法包括以下步骤:
步骤c11、对访谈过程进行视频录制,得到访谈视频。
步骤c12、首先对访谈视频进行自动化分析,通过声纹识别,定位识别出被访问对象说话的时间段,并采用视频剪辑方法剪辑出被访问对象说话时对应的视频内容,得到至少一个第一参考分析视频。
步骤c13、确定每一第一参考分析视频每一相邻两帧图像之间对应的被访问对象的语音频率波动、音调波动和音量波动进行计算分析,得到分析结果。
其中,每一第一参考分析视频每一相邻两帧图像之间对应的被访问对象的语音频率波动为后一帧视频图像对应的语音频率与前一帧视频图像对应的语音频率差的百分比;音调波动为后一帧视频图像对应的音调与前一帧视频图像对应的音调差的百分比;音量波动为后一帧视频图像的音量与前一帧视频图像对应的音量差的百分比。将每一相邻两帧图像之间的语音频率波动与预设阈值α、音调波动与预设阈值β、音量波动与预设阈值θ分别进行比较,在语音频率波动、音调波动和音量波动中至少一个波动大于对应的预设阈值时,确定对每一第一参考分析帧的分段节点为该相邻两帧视频图像中的前一帧视频图像,如此,继续对后续相邻两帧图像进行分析,直至每一第一参考分析帧的最后一帧图像,得到每一第一参考分析帧中的全部分段节点为分析结果。需说明的是,在一段时间内每一相邻两帧图像之间的语音频率波动、音调波动和音量波动均小于或等于各自对应的预设阈值,可以确定被访问对象没有太大的情绪波动。
步骤c14、根据分析结果,对每一第一参考分析视频进行再次分段剪辑,得到至少一个第二参考分析视频。
步骤c15、从每一第二参考分析视频中提取预设时长的第三参考分析视频,并将全部第三参考分析视频按照时间顺序进行拼接,得到目标分析视频。
步骤c16、采用预设的情绪分析方法对目标分析视频进行情绪分析处理,得到备访问对象的情绪分析结果。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本申请实施例提供的视频信息处理方法,获取待分析视频后,根据目标对象的第一声音特征参数,从待分析视频中提取至少一个第一参考分析视频,然后根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,最后根据指示一个第二参考分析视频,得到目标分析视频。这样,先根据目标对象的第一声音特征参数对待分析视频进行处理,得到至少一个第一参考分析视频,再根据目标对象的目标特征参数对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,从而根据指示一个第二参考分析视频得到目标分析视频,解决了目前视频分析过程花费时间较长的问题,有效减小了确定分析视频的长度,进而缩短了视频分析过程,提高了视频分析效率。
基于前述实施例,本申请的实施例提供一种电子设备,该电子设备可以应用于图1~2对应的实施例提供的视频信息处理方法中,参照图3所示,该电子设备3可以包括:存储器31、处理器32和通信总线33;其中:
存储器31,用于存储可执行指令;
通信总线33,用于实现处理器32和存储器31之间的通信连接;
处理器32,用于执行存储器中存储的视频信息处理程序,实现以下步骤:
获取待分析视频;其中,待分析视频中包括目标对象;
根据目标对象的第一声音特征参数,从待分析视频中提取至少一个第一参考分析视频;
根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频;
根据至少一个第二参考分析视频,得到目标分析视频。
在本申请其他实施例中,处理器还用于执行以下步骤:
确定每一第一参考分析视频中每一帧图像对应的目标对象的p个第二声音特征参数;其中,p为大于或等于1的整数;
根据每一第一参考分析视频中每一第一图像的每一第二声音特征参数和对应的第二图像的第二声音特征参数,确定目标特征参数;其中,第一图像为每一第一参考分析视频中与第二图像相邻的两帧图像,且第一图像为第二图像前一帧图像。
在本申请其他实施例中,处理器执行步骤根据每一第一参考分析视频中每一第一图像的每一第二声音特征参数和对应的第二图像的每一第二声音特征参数,确定目标特征参数时,可以通过以下步骤来实现:
确定每一第一图像的每一第二声音特征参数与对应的第二图像的第二声音特征参数的差值的绝对值;
确定每一绝对值与对应的第一图像的第二声音特征参数的比值,得到目标特征参数;其中,目标特征参数包括每一第一参考分析视频包括的全部视频帧数减1组p个比值。
在本申请其他实施例中,处理器执行步骤根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频时,可以通过以下步骤来实现:
从目标特征参数中,确定q组p个目标比值;
若q大于或等于1,确定q组p个目标比值对应的第一图像;
根据q组p个目标比值对应的第一图像对对应的第一参考分析视频进行分段处理,得到对应的第二参考分析视频;
若q等于0,确定对应的第一参考分析视频为第二参考分析视频,如此,得到至少一个第二参考分析视频。
在本申请其他实施例中,处理器执行步骤从目标特征参数中,确定q组p个目标比值时,可以通过以下步骤来实现:
基于目标特征参数中,确定每一组p个比值与对应的预设阈值的目标关系;
从目标特征参数中,确定目标关系为至少一个比值大于对应的预设阈值的目标组,得到q组p个目标比值。
在本申请其他实施例中,处理器执行步骤根据至少一个第二参考分析视频,得到目标分析视频时,可以通过以下步骤来实现:
根据每一段第二参考分析视频,确定预设时长;
从每一段第二参考分析视频中,获取目标位置处预设时长范围内的第三参考分析视频,得到目标分析视频。
在本申请其他实施例中,处理器执行步骤根据每一段第二参考分析视频,确定预设时长时,可以通过以下步骤来实现:
确定每一段第二参考分析视频的目标时长;
确定预设时长阈值;
确定每一目标时长与预设时长阈值的乘积,得到预设时长。
在本申请其他实施例中,第一声音特征参数至少包括:目标对象的声纹特征参数。
需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~2对应的实施例提供的视频信息处理方法中的实现过程,此处不再赘述。
本申请实施例提供的电子设备,获取待分析视频后,根据目标对象的第一声音特征参数,从待分析视频中提取至少一个第一参考分析视频,然后根据每一第一参考分析视频中目标对象的目标特征参数,对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,最后根据指示一个第二参考分析视频,得到目标分析视频。这样,先根据目标对象的第一声音特征参数对待分析视频进行处理,得到至少一个第一参考分析视频,再根据目标对象的目标特征参数对对应的第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,从而根据指示一个第二参考分析视频得到目标分析视频,解决了目前视频分析过程花费时间较长的问题,有效减小了确定分析视频的长度,进而缩短了视频分析过程,提高了视频分析效率。
基于前述实施例,本申请的实施例提供一种计算机可读存储介质,可简称为存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现参照图1~2对应的实施例提供的方法实现过程,此处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

Claims (10)

1.一种视频信息处理方法,所述方法包括:
获取待分析视频;其中,所述待分析视频中包括目标对象;
根据所述目标对象的第一声音特征参数,从所述待分析视频中提取至少一个第一参考分析视频;
根据每一所述第一参考分析视频中所述目标对象的目标特征参数,对对应的所述第一参考分析视频进行分段处理,得到至少一个第二参考分析视频;
根据至少一个所述第二参考分析视频,得到目标分析视频。
2.根据权利要求1所述的方法,所述方法还包括:
确定每一所述第一参考分析视频中每一帧图像对应的所述目标对象的p个第二声音特征参数;其中,p为大于或等于1的整数;
根据每一所述第一参考分析视频中每一第一图像的每一所述第二声音特征参数和对应的第二图像的所述第二声音特征参数,确定所述目标特征参数;其中,所述第一图像为每一所述第一参考分析视频中与所述第二图像相邻的两帧图像,且所述第一图像为所述第二图像前一帧图像。
3.根据权利要求2所述的方法,所述根据每一所述第一参考分析视频中每一第一图像的每一所述第二声音特征参数和对应的第二图像的每一所述第二声音特征参数,确定所述目标特征参数,包括:
确定每一所述第一图像的每一所述第二声音特征参数与对应的所述第二图像的所述第二声音特征参数的差值的绝对值;
确定每一所述绝对值与对应的所述第一图像的所述第二声音特征参数的比值,得到所述目标特征参数;其中,所述目标特征参数包括每一所述第一参考分析视频包括的全部视频帧数减1组p个所述比值。
4.根据权利要求3所述的方法,所述根据每一所述第一参考分析视频中所述目标对象的目标特征参数,对对应的所述第一参考分析视频进行分段处理,得到至少一个第二参考分析视频,包括:
从所述目标特征参数中,确定q组p个目标比值;
若q大于或等于1,确定所述q组p个目标比值对应的所述第一图像;
根据所述q组p个目标比值对应的所述第一图像对对应的所述第一参考分析视频进行分段处理,得到对应的所述第二参考分析视频;
若q等于0,确定对应的所述第一参考分析视频为所述第二参考分析视频,如此,得到至少一个所述第二参考分析视频。
5.根据权利要求4所述的方法,所述从所述目标特征参数中,确定q组p个目标比值,包括:
基于所述目标特征参数中,确定每一组p个所述比值与对应的预设阈值的目标关系;
从所述目标特征参数中,确定所述目标关系为至少一个所述比值大于对应的预设阈值的目标组,得到所述q组p个目标比值。
6.根据权利要求1所述的方法,所述根据至少一个所述第二参考分析视频,得到目标分析视频,包括:
根据每一段所述第二参考分析视频,确定预设时长;
从每一段所述第二参考分析视频中,获取目标位置处所述预设时长范围内的第三参考分析视频,得到所述目标分析视频。
7.根据权利要求6所述的方法,所述根据每一段所述第二参考分析视频,确定预设时长,包括:
确定每一段所述第二参考分析视频的目标时长;
确定预设时长阈值;
确定每一所述目标时长与所述预设时长阈值的乘积,得到所述预设时长。
8.根据权利要求1所述的方法,所述第一声音特征参数至少包括:所述目标对象的声纹特征参数。
9.一种电子设备,该设备至少包括:存储器、处理器和通信总线;其中:
所述存储器,用于存储可执行指令;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的视频信息处理程序,实现如权利要求1至8中任一项所述的视频信息处理方法的步骤。
10.一种存储介质,所述存储介质上存储有视频信息处理程序,所述视频信息处理程序被处理器执行时实现如权利要求1至8中任一项所述的视频信息处理方法的步骤。
CN202210744761.2A 2022-06-27 2022-06-27 一种视频信息处理方法、电子设备及存储介质 Pending CN115209218A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210744761.2A CN115209218A (zh) 2022-06-27 2022-06-27 一种视频信息处理方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210744761.2A CN115209218A (zh) 2022-06-27 2022-06-27 一种视频信息处理方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115209218A true CN115209218A (zh) 2022-10-18

Family

ID=83578703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210744761.2A Pending CN115209218A (zh) 2022-06-27 2022-06-27 一种视频信息处理方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115209218A (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104394422A (zh) * 2014-11-12 2015-03-04 华为软件技术有限公司 一种视频分割点获取方法及装置
CN105224925A (zh) * 2015-09-30 2016-01-06 努比亚技术有限公司 视频处理装置、方法及移动终端
CN108764010A (zh) * 2018-03-23 2018-11-06 姜涵予 情绪状态确定方法及装置
CN108848419A (zh) * 2018-06-07 2018-11-20 康佳集团股份有限公司 基于生物特征识别的电视互动方法、智能电视及存储介质
CN110378228A (zh) * 2019-06-17 2019-10-25 深圳壹账通智能科技有限公司 面审视频数据处理方法、装置、计算机设备和存储介质
CN110691258A (zh) * 2019-10-30 2020-01-14 中央电视台 一种节目素材制作方法、装置及计算机存储介质、电子设备
CN111263234A (zh) * 2020-01-19 2020-06-09 腾讯科技(深圳)有限公司 一种视频剪辑的方法、相关装置、设备以及存储介质
CN111800673A (zh) * 2020-07-31 2020-10-20 聚好看科技股份有限公司 视频播放方法、显示设备及服务器
CN113259761A (zh) * 2020-02-13 2021-08-13 华为技术有限公司 视频处理方法和视频处理的设备、存储介质
CN113347491A (zh) * 2021-05-24 2021-09-03 北京格灵深瞳信息技术股份有限公司 一种视频剪辑方法、装置、电子设备和计算机存储介质
CN113468983A (zh) * 2021-06-15 2021-10-01 杭州海康威视系统技术有限公司 一种情绪分析方法、装置、设备及存储介质
CN113992970A (zh) * 2020-07-27 2022-01-28 阿里巴巴集团控股有限公司 视频数据处理方法、装置、电子设备及计算机存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104394422A (zh) * 2014-11-12 2015-03-04 华为软件技术有限公司 一种视频分割点获取方法及装置
CN105224925A (zh) * 2015-09-30 2016-01-06 努比亚技术有限公司 视频处理装置、方法及移动终端
CN108764010A (zh) * 2018-03-23 2018-11-06 姜涵予 情绪状态确定方法及装置
CN108848419A (zh) * 2018-06-07 2018-11-20 康佳集团股份有限公司 基于生物特征识别的电视互动方法、智能电视及存储介质
CN110378228A (zh) * 2019-06-17 2019-10-25 深圳壹账通智能科技有限公司 面审视频数据处理方法、装置、计算机设备和存储介质
CN110691258A (zh) * 2019-10-30 2020-01-14 中央电视台 一种节目素材制作方法、装置及计算机存储介质、电子设备
CN111263234A (zh) * 2020-01-19 2020-06-09 腾讯科技(深圳)有限公司 一种视频剪辑的方法、相关装置、设备以及存储介质
CN113259761A (zh) * 2020-02-13 2021-08-13 华为技术有限公司 视频处理方法和视频处理的设备、存储介质
CN113992970A (zh) * 2020-07-27 2022-01-28 阿里巴巴集团控股有限公司 视频数据处理方法、装置、电子设备及计算机存储介质
CN111800673A (zh) * 2020-07-31 2020-10-20 聚好看科技股份有限公司 视频播放方法、显示设备及服务器
CN113347491A (zh) * 2021-05-24 2021-09-03 北京格灵深瞳信息技术股份有限公司 一种视频剪辑方法、装置、电子设备和计算机存储介质
CN113468983A (zh) * 2021-06-15 2021-10-01 杭州海康威视系统技术有限公司 一种情绪分析方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108766418B (zh) 语音端点识别方法、装置及设备
CN112906483B (zh) 一种目标重识别方法、装置及计算机可读存储介质
WO2021164466A1 (zh) 用户信息分析方法及系统
CN108682436B (zh) 语音对齐方法及装置
CN111382647B (zh) 一种图片处理方法、装置、设备及存储介质
US20210319230A1 (en) Keyframe Extractor
CN110570348A (zh) 一种脸部图像替换方法及设备
CN114449313B (zh) 视频的音画面播放速率调整方法及装置
CN113992970A (zh) 视频数据处理方法、装置、电子设备及计算机存储介质
CN114339451A (zh) 视频剪辑方法、装置、计算设备及存储介质
CN115209218A (zh) 一种视频信息处理方法、电子设备及存储介质
CN113408332A (zh) 视频分镜方法、装置、设备及计算机可读存储介质
CN114819110B (zh) 一种实时识别视频中说话人的方法及装置
CN115333879B (zh) 一种远程会议方法及系统
CN114125365A (zh) 视频会议方法、装置及可读存储介质
CN114020962A (zh) 视频系统管理方法、电子设备和计算机可读存储介质
CN114187556A (zh) 一种基于画面特征的高清视频智能分割方法
CN113409822A (zh) 对象状态的确定方法、装置、存储介质及电子装置
KR20180065438A (ko) 실시간 디지털 후반 처리 방법
CN113949942A (zh) 视频摘要生成方法、装置、终端设备及存储介质
CN111461901A (zh) 车辆保险理赔信息的输出方法和装置
CN113936698B (zh) 音频数据的处理方法、装置以及电子设备
CN115050085B (zh) 基于图谱的模拟机管理系统对象识别方法、系统及设备
CN114363720B (zh) 一种基于计算机视觉的视频切片方法、系统、设备及介质
CN114387589A (zh) 语音监督数据获取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination