CN103530652A - 一种基于人脸聚类的视频编目方法、检索方法及其系统 - Google Patents
一种基于人脸聚类的视频编目方法、检索方法及其系统 Download PDFInfo
- Publication number
- CN103530652A CN103530652A CN201310504743.8A CN201310504743A CN103530652A CN 103530652 A CN103530652 A CN 103530652A CN 201310504743 A CN201310504743 A CN 201310504743A CN 103530652 A CN103530652 A CN 103530652A
- Authority
- CN
- China
- Prior art keywords
- face
- people
- video
- picture
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明提供一种基于人脸聚类的视频编目方法、检索方法及其系统,方法包括以下步骤:对视频文件进行镜头切分;对视频镜头进行人脸检测,得到人脸图片及相关信息;对检测出的人脸图片进行去重;对去重后的人脸图片进行人脸特征提取,将提取到的人脸特征存入人脸特征库;根据人脸特征,对人脸图片进行特征聚类;对人脸类别库中存储的各个人脸类别进行人工标注;根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。具有以下优点:对视频文件进行自动编目,准确高效,大大节省人力;不需要预制人脸样本库;提供基于人名和图片的视频检索功能,具有检索方便、高效的优点。
Description
技术领域
本发明属于视频编目技术领域,具体涉及一种基于人脸聚类的视频编目方法、检索方法及其系统。
背景技术
视频编目是指对视频文件进行整理和提炼的过程,将其中有价值的画面和资料整理成为独立的文件,便于检索和再利用。
现有的视频编目方法主要为基于人脸识别的视频编目方法,例如,申请号为201110453762.3的专利申请公开了一种基于人脸识别技术的自动编目方法,具体包括:接收人脸素材库;接收多媒体文件;根据所述视频文件获取关键帧记录及与之对应的关键帧数据画面;根据所述关键帧数据画面获取关键帧人脸画面;根据所述关键帧人脸画面查询所述人脸素材库人脸画面信息,获取匹配人脸素材文本信息;根据所述关键帧记录对所述音频文件进行语言识别获取关键帧编目文本;根据所述关键帧记录在所述关键帧编目文本中合并所述人脸素材文本信息,获取编目文件。该专利申请解决了无法通过视频文件进行编目文件生成及编辑的问题,提高了编目文件生成及处理的精度与灵活性,节约了系统成本,减少了错误率,并且具有更广泛的实用性。
但是,在实现本发明的过程中,发明人发现,上述专利申请至少具有以下不足:
(1)需要提前建立人脸样本库:该方法需要提前建立并维护一个关键人物样本库,在人物样本库中预制感兴趣人物的人脸样本,利用该人脸样本库对视频进行编目;(2)只支持利用关键人物进行编目:该方法只能识别样本库中的关键人物,导致其他大部分人物信息丢失,编目信息缺乏完整性;(3)可能存在滞后性:如果调整人脸样本库,那么已存在的编目信息不会自动更新,会出现滞后性。
发明内容
针对现有技术存在的缺陷,本发明提供一种基于人脸聚类的视频编目方法、检索方法及其系统,解决了无法通过视频文件自动生成完整的人脸元数据和无法利用人物姓名或者图片自动检索视频的问题。
本发明采用的技术方案如下:
本发明提供一种基于人脸聚类的视频编目方法,包括以下步骤:
S1,接收待编目的视频文件,对所述视频文件进行镜头切分,得到视频镜头序列;
S2,对视频镜头序列中的每个视频镜头进行人脸检测,获得每个镜头中出现的各个人物的人脸图片及其相关信息;
S3,对检测出的人脸图片进行去重,去除同一个镜头中同一个人重复的人脸图片;
S4,对去重后的人脸图片进行人脸特征提取,将提取到的人脸特征存入人脸特征库;
S5,根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类,将同一个人不同镜头或视频片段中得到的人脸图片聚合在同一个人脸类别中,不同人的人脸图片被分配到不同的人脸类别中,将各个人物的人脸类别存储到人脸类别库中;
S6,对人脸类别库中存储的各个人脸类别进行人工标注;
S7,根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。
优选的,S1中,所述镜头切分包括针对镜头突变的镜头切分、针对镜头渐变的镜头切分。
优选的,S2中,所述对视频镜头序列中的每个视频镜头进行人脸检测包括以下步骤:
以Td为时间间隔从每个视频镜头抽取若干个视频关键帧;
对每个视频关键帧进行人脸检测,检测得到所述视频关键帧中包含的所有人脸图像,每一个人脸图像均生成一张人脸图片;另外,还生成检测得到的人脸图像的相关信息,所述相关信息包括对应的镜头编号、人物在视频中出现的时间、人脸在视频画面中的位置、人脸图像的大小。
优选的,S3中,所述对检测出的人脸图片进行去重包括执行以下步骤:
S3.1,建立临时存储空间,即人脸堆栈;对于一个视频镜头,初始化人脸堆栈的人脸数Nface为0,初始化视频关键帧的帧序号n为1;
S3.2,读取视频关键帧V(n),判断Nface是否等于0,如果等于,则从视频关键帧V(n)中提取所有人脸图片、以及各张人脸图片在视频关键帧V(n)中的位置坐标,设提取到m个人脸图片;然后将所有人脸图片和位置坐标存储到人脸堆栈中,并更新Nface为m;其中,m≥1;
如果Nface大于0,设Nface=w,则在视频关键帧V(n)中对人脸堆栈中的w个人脸进行跟踪,即:对于人脸堆栈中的人脸F(k),k∈{1,2,...,w},读取其位置坐标,如果在V(n)的相应位置处检测出了人脸F*,则认为该人脸F(k)在V(n)中持续存在,用人脸F*替换堆栈中的人脸F(k),删除V(n)中的人脸F*;反之,如果对于堆栈中的人脸F(k),在V(n)的相应位置处没有检测出人脸,则认为该人脸F(k)在V(n)中已消失,则认为人脸F(k)为视频关键帧V(n)中所提取到的人脸图片,输出人脸F(k),将人脸F(k)从堆栈中删除,并将Nface减1;
S3.3,视频关键帧V(n)中未在人脸堆栈中出现的人脸为新出现的人脸,将新出现的人脸及位置坐标添加到人脸堆栈中,并相应增加Nface值;
S3.4,检查是否到达视频镜头的最后1个视频关键帧,如果是最后1个视频关键帧,则输出人脸堆栈中存储的人脸图片,结束操作步骤;反之,则令n增加1,转到S3.2。
优选的,S4中,所述对去重后的人脸图片进行人脸特征提取,将提取到的人脸特征存入人脸特征库包括以下步骤:
对人脸图片进行旋转和缩放,生成固定尺寸的规范化图片;
对规范化人脸图片进行人脸特征提取;
将提取到的人脸特征存入人脸特征库。
优选的,S5中,所述根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类包括以下步骤:
S5.1,建立人脸类别库,初始化人脸类别数Nclass为0,人脸类别库为空;
S5.2,读取一个新的人脸图片的人脸特征T(n),如果人脸类别数Nclass大于0,设人脸类别数Nclass值为b,查询全部的人脸类别Class(k),k∈{1,2,...,b},计算T(n)与Class(k)之间的相似度S(n,k);选择与T(n)相似度最大的人脸类别Class(k0),对应的相似度记为S(n,k0);
S5.3,如果S(n,k0)大于或等于阈值Th,则认为人脸特征T(n)属于人脸类别Class(k0),将T(n)及对应的人脸图片和相关信息添加到Class(k0)中,转到S5.4;
反之,如果S(n,k0)小于阈值Th,则认为人脸特征T(n)不属于已有的人脸类别,创建一个新的类别Class(Nclass+1),将T(n)及对应的人脸图片和相关信息添加到Class(Nclass+1)中,最后将该类别加入人脸类别库,并将Nclass增加1;
S5.4,判断是否还有未处理的人脸图片,如果有,则转到S5.2,否则结束操作步骤。
优选的,S5.2中,所述计算人脸特征T(n)与人脸类别Class(k)之间的相似度具体包括以下步骤:
遍历Class(k)中的N(k)个人脸特征TC(k,m),m∈{1,2,...,N(k)},分别计算人脸特征T(n)与人脸特征TC(k,m)之间的相似度ST(k,m);
选择使得ST(k,m)达到最大的人脸特征TC(k,m0),将对应的相似度ST(k,m0)作为T(n)与Class(k)之间的相似度。
优选的,S6中,所述对人脸类别库中存储的各个人脸类别进行人工标注包括以下步骤:
通过人工识别该人脸类别中的人脸所对应的人物,并标注其姓名;
检查该人脸类别中的人脸图片,如果发现有错误识别的人脸图片,则将其从该人脸类别中删除;
检查是否有同一个人的人脸图像被误拆分成多个人脸类别,如果有误拆分,则将误拆分的人脸类别合并成一个完整的人脸类别。
优选的,S7具体包括以下步骤:
利用标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,所述人脸元数据包括人物姓名、对应的镜头编号、人物在视频中出现的起止时间、人脸在视频画面中的位置、人脸图像的大小;
将该人脸元数据作为镜头层编目的扩展元数据,增加到原始编目文件中,得到最终的视频编目文件。
本发明还提供一种视频检索的方法,包括以下步骤:
接收待检索人物的姓名信息或者人脸图片;
如果接收到的为姓名信息,则遍历所有视频编目文件,通过查询编目文件中镜头层的扩展元数据,得到包含该人物的视频信息和人物出现的精确时间;
如果接收到的为人脸图片,则:首先对输入的人脸图片进行人脸检测,进而进行人脸规范化,得到标准人脸图片;然后提取该标准人脸图片的人脸特征F;遍历所有人脸类别,分别计算人脸特征F与人脸类别Class(k),k∈{1,2,...,Nclass}中代表特征TK(k)的相似度ST(k),选择使得ST(k)达到最大的人脸类别Class(k1);记ST(k)取得的最大值为Smax;如果Smax大于等于检索阈值Ts,则获取该类别中所有人脸信息;最后输出对应的视频信息和人物出现的精确时间;如果Smax小于检索阈值Ts,则输出为空。
本发明还提供一种基于人脸聚类的视频编目系统,包括以下模块:
人脸采集模块,用于从输入的视频文件中提取出有效的人脸图片,参与后续模块的分析和处理;其中,所述人脸采集模块包括:
镜头切分子模块,用于接收待编目的视频文件,对视频文件进行镜头切分,得到视频镜头序列;
人脸检测子模块,用于对视频镜头序列中的每个视频镜头进行人脸检测,获得每个镜头中出现的各个人物的人脸图片及其相关信息;
人脸去重子模块,用于对检测出的人脸图片进行去重,去除同一个镜头中同一个人重复的人脸图片;
特征提取模块,用于对采集到的人脸图片进行人脸特征的提取,并将提取到的人脸特征存入人脸特征库;
特征聚类模块,用于根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类,将同一个人不同镜头或视频片段中得到的人脸图片聚合在同一个人脸类别中,不同人的人脸图片被分配到不同的人脸类别中,将各个人物的人脸类别存储到人脸类别库中;
类别标注模块,用于对人脸类别库中存储的各个人脸类别进行人工标注;
自动编目模块,用于根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。
本发明还提供一种视频检索的系统,包括:上述的基于人脸聚类的视频编目系统、姓名检索模块和人脸图片检索模块;
其中,所述姓名检索模块用于:接收待检索人物的姓名信息;遍历所有视频编目文件,通过查询编目文件中镜头层的扩展元数据,得到包含该人物的视频信息和人物出现的精确时间;
所述人脸图片检索模块用于:首先对输入的人脸图片进行人脸检测,进而进行人脸规范化,得到标准人脸图片;然后提取该标准人脸图片的人脸特征F;遍历所有人脸类别,分别计算人脸特征F与人脸类别Class(k),k∈{1,2,...,Nclass}中代表特征TK(k)的相似度ST(k),选择使得ST(k)达到最大的人脸类别Class(k1);记ST(k)取得的最大值为Smax;如果Smax大于等于检索阈值Ts,则获取该类别中所有人脸信息;最后输出对应的视频信息和人物出现的精确时间;如果Smax小于检索阈值Ts,则输出为空。
本发明的有益效果如下:
(1)对视频文件进行自动编目,准确高效,大大节省人力;
(2)不需要预制人脸样本库,可将视频中出现的所有人物参与编目而非仅限于人脸样本库中的人物;
(3)提供基于人名和图片的视频检索功能,输入一个人的姓名或者照片,即可快速检索出包含该人的所有视频,并精确定位其出现的时间点;具有检索方便、高效的优点。
附图说明
图1为本发明提供的基于人脸聚类的视频编目方法和检索方法的示意图;
图2为本发明提供的基于人脸聚类的视频编目方法的流程示意图。
具体实施方式
以下结合附图对本发明进行详细说明:
(一)视频编目方法
如图1-2所示,本发明提供一种基于人脸聚类的视频编目方法,包括以下步骤:
S1,接收待编目的视频文件,对所述视频文件进行镜头切分,得到视频镜头序列;
本步骤中,镜头切分包括针对镜头突变的镜头切分、针对镜头渐变的镜头切分。
S2,对视频镜头序列中的每个视频镜头进行人脸检测,获得每个镜头中出现的各个人物的人脸图片及其相关信息;
此步骤具体包括:
以Td为时间间隔从每个视频镜头抽取若干个视频关键帧;其中,视频关键帧提取原则为:既能反映视频内容,又保证数量上尽量精简。
对每个视频关键帧进行人脸检测,人脸检测是指:在视频关键帧中检测人脸图像,得到人脸图像所在的矩形区域,并标注人脸图像矩形区域的位置坐标,所述位置坐标包括矩形区域的左上角坐标和右下角坐标;另外还生成检测得到的人脸图像的相关信息,所述相关信息包括对应的镜头编号、人物在视频中出现的时间、人脸在视频画面中的位置、人脸图像的大小。本实例中,人脸检测采用Haar特征加Adaboost分类器的方法。
例如:对于一个视频关键帧,一共涉及到3个人物,则本步骤中需要生成3张人脸图片。
S3,对检测出的人脸图片进行去重,去除同一个镜头中同一个人重复的人脸图片,确保同一个镜头中每人仅有一幅人脸图片;
此步骤具体包括:
S3.1,建立临时存储空间,即人脸堆栈;对于一个视频镜头,初始化人脸堆栈的人脸数Nface为0,初始化视频关键帧的帧序号n为1;
S3.2,读取视频关键帧V(n),判断Nface是否等于0,如果等于,则从视频关键帧V(n)中提取所有人脸图片、以及各张人脸图片在视频关键帧V(n)中的位置坐标,设提取到m个人脸图片;然后将所有人脸图片和位置坐标存储到人脸堆栈中,并更新Nface为m;其中,m≥1;
如果Nface大于0,设Nface=w,则在视频关键帧V(n)中对人脸堆栈中的w个人脸进行跟踪,即:对于人脸堆栈中的人脸F(k),k∈{1,2,...,w},读取其位置坐标,如果在V(n)的相应位置处检测出了人脸F*,则认为该人脸F(k)在V(n)中持续存在,用人脸F*替换堆栈中的人脸F(k),删除V(n)中的人脸F*;反之,如果对于堆栈中的人脸F(k),在V(n)的相应位置处没有检测出人脸,则认为该人脸F(k)在V(n)中已消失,则认为人脸F(k)为视频关键帧V(n)中所提取到的人脸图片,输出人脸F(k),将人脸F(k)从堆栈中删除,并将Nface减1;
例如:对于一个视频镜头,假设共提取三个视频关键帧,分别为V(1)、V(2)、和V(3);初始化后,人脸堆栈中人脸数Nface=0;
首先读取V(1),由于此时Nface=0,所以,从V(1)中设共提取3张人脸图片,然后将这3张人脸图片及对应的坐置坐标存储到堆栈中,并更新Nface=3;其中,将3张人脸图片分别记为F(1)、F(2)和F(3);将3张人脸图片在V(1)中的坐置坐标分别记为位置坐标a、位置坐标c和位置坐标c;
然后继续读取V(2),由于此时Nface不等于0,因此,从堆栈中首先读取F(1)以及位置坐标a,在V(2)的位置坐标a附近检测是否存在人脸F*,如果存在,则认为同一人脸在V(1)和V(2)中持续存在,但是,由于同一人脸在V(2)中的位置有可能与其在V(1)中的位置稍有变化,为减少人物检测误差,此时,重新获取同一人脸在V(2)中的位置坐标,记为位置坐标a’,则用V(2)中检测到的人脸F*替换堆栈中的人脸F(1),同时,用位置坐标a’替换位置坐标a;
反之,如果在V(2)的位置坐标a附近没有检测到人脸,则认为人脸F(1)在V(2)中已消失,则认为F(1)即为该视频镜头所提取到的同一人的最终一张人脸图片,则输出F(1),并将F(1)从堆栈中删除,并将Nface减1。重复上述过程,依次再从堆栈中读取F(2)以及位置坐标b,F(3)以及位置坐标c,其处理方法与F(1)相同,在此不再赘述。
通过上述方法,可以保证同一镜头中同一个人只存储一张人脸图片。
S3.3,视频关键帧V(n)中未在人脸堆栈中出现的人脸为新出现的人脸,将新出现的人脸及位置坐标添加到人脸堆栈中,并相应增加Nface值;
S3.4,检查是否到达视频镜头的最后1个视频关键帧,如果是最后1个视频关键帧,则输出人脸堆栈中存储的人脸图片,结束操作步骤;反之,则令n增加1,转到S3.2。
S4,对去重后的人脸图片进行人脸特征提取,将提取到的人脸特征存入人脸特征库;
此步骤具体包括:
对人脸图片进行旋转和缩放,生成固定尺寸的规范化图片;
对规范化人脸图片进行人脸特征提取,,所述人脸特征提取是从规范化后的人脸图片中提取人脸特征,人脸特征有多种,包括局部二值模式(LBP)、Gabor小波特征和局部Gabor特征等,本实例使用基于局部Gabor变换直方图序列特征(HSLGBP);
将提取到的人脸特征存入人脸特征库。
S5,根据人脸特征对人脸图像进行聚类;
此步骤具体包括:根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类,将同一个人不同镜头或视频片段中得到的人脸图片聚合在同一个人脸类别中,不同人的人脸图片被分配到不同的人脸类别中,将各个人物的人脸类别存储到人脸类别库中;
S5.1,建立人脸类别库,初始化人脸类别数Nclass为0,人脸类别库为空;
S5.2,读取一个新的人脸图片的人脸特征T(n),如果人脸类别数Nclass大于0,设人脸类别数Nclass值为b,查询全部的人脸类别Class(k),k∈{1,2,...,b},计算T(n)与Class(k)之间的相似度S(n,k);选择与T(n)相似度最大的人脸类别Class(k0),对应的相似度记为S(n,k0);
本步骤中,计算人脸特征T(n)与人脸类别Class(k)之间的相似度具体包括以下步骤:
遍历Class(k)中的N(k)个人脸特征TC(k,m),m∈{1,2,...,N(k)},分别计算人脸特征T(n)与人脸特征TC(k,m)之间的相似度ST(k,m);
选择使得ST(k,m)达到最大的人脸特征TC(k,m0),将对应的相似度ST(k,m0)作为T(n)与Class(k)之间的相似度。
S5.3,如果S(n,k0)大于或等于阈值Th,则认为人脸特征T(n)属于人脸类别Class(k0),将T(n)及对应的人脸图片和相关信息添加到Class(k0)中,转到S5.4;
反之,如果S(n,k0)小于阈值Th,则认为人脸特征T(n)不属于已有的人脸类别,创建一个新的类别Class(Nclass+1),将T(n)及对应的人脸图片和相关信息添加到Class(Nclass+1)中,最后将该类别加入人脸类别库,并将Nclass增加1;
S5.4,判断是否还有未处理的人脸图片,如果有,则转到S5.2,否则结束操作步骤。
S6,对人脸类别库中存储的各个人脸类别进行人工标注;
此步骤具体包括:为每个人脸类别标注上人物姓名并检查聚类结果;
通过人工识别该人脸类别中的人脸所对应的人物,并标注其姓名;
检查该人脸类别中的人脸图片,如果发现有错误识别的人脸图片,则将其从该人脸类别中删除;
检查是否有同一个人的人脸图像被误拆分成多个人脸类别,如果有误拆分,则将误拆分的人脸类别合并成一个完整的人脸类别。
S7,根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。此步骤具体包括:利用标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,所述人脸元数据包括人物姓名、对应的镜头编号、人物在视频中出现的起止时间、人脸在视频画面中的位置、人脸图像的大小;将该人脸元数据作为镜头层编目的扩展元数据,增加到原始编目文件中,得到最终的视频编目文件。
(二)视频检索方法
通过上述基于人脸聚类的视频编目方法,得到视频编目文件,本发明还提供一种对得到的视频编目文件进行视频检索的方法,包括以下步骤:
接收待检索人物的姓名信息或者人脸图片;
如果接收到的为姓名信息,则遍历所有视频编目文件,通过查询编目文件中镜头层的扩展元数据,得到包含该人物的视频信息和人物出现的精确时间;
如果接收到的为人脸图片,则:首先对输入的人脸图片进行人脸检测,进而进行人脸规范化,得到标准人脸图片;然后提取该标准人脸图片的人脸特征F;遍历所有人脸类别,分别计算人脸特征F与人脸类别Class(k),k∈{1,2,...,Nclass}中代表特征TK(k)的相似度ST(k),选择使得ST(k)达到最大的人脸类别Class(k1);记ST(k)取得的最大值为Smax;如果Smax大于等于检索阈值Ts,则获取该类别中所有人脸信息;最后输出对应的视频信息和人物出现的精确时间;如果Smax小于检索阈值Ts,则输出为空。
(三)视频编目系统
本发明还提供一种基于人脸聚类的视频编目系统,包括以下模块:
人脸采集模块,用于从输入的视频文件中提取出有效的人脸图片,参与后续模块的分析和处理;其中,所述人脸采集模块包括:
镜头切分子模块,用于接收待编目的视频文件,对视频文件进行镜头切分,得到视频镜头序列;
人脸检测子模块,用于对视频镜头序列中的每个视频镜头进行人脸检测,获得每个镜头中出现的各个人物的人脸图片及其相关信息;
人脸去重子模块,用于对检测出的人脸图片进行去重,去除同一个镜头中同一个人重复的人脸图片;
特征提取模块,用于对采集到的人脸图片进行人脸特征的提取,并将提取到的人脸特征存入人脸特征库;
特征聚类模块,用于根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类,将同一个人不同镜头或视频片段中得到的人脸图片聚合在同一个人脸类别中,不同人的人脸图片被分配到不同的人脸类别中,将各个人物的人脸类别存储到人脸类别库中;
类别标注模块,用于对人脸类别库中存储的各个人脸类别进行人工标注;
自动编目模块,用于根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。
(四)视频检索系统
本发明还提供一种视频检索的系统,包括:上述的基于人脸聚类的视频编目系统、姓名检索模块和人脸图片检索模块;
其中,所述姓名检索模块用于:接收待检索人物的姓名信息;遍历所有视频编目文件,通过查询编目文件中镜头层的扩展元数据,得到包含该人物的视频信息和人物出现的精确时间;
所述人脸图片检索模块用于:首先对输入的人脸图片进行人脸检测,进而进行人脸规范化,得到标准人脸图片;然后提取该标准人脸图片的人脸特征F;遍历所有人脸类别,分别计算人脸特征F与人脸类别Class(k),k∈{1,2,...,Nclass}中代表特征TK(k)的相似度ST(k),选择使得ST(k)达到最大的人脸类别Class(k1);记ST(k)取得的最大值为Smax;如果Smax大于等于检索阈值Ts,则获取该类别中所有人脸信息;最后输出对应的视频信息和人物出现的精确时间;如果Smax小于检索阈值Ts,则输出为空。
综上所述,本发明所公开的基于人脸聚类的视频编目方法、检索方法及其系统,可以用于对视频进行自动编目并在大量视频中检索感兴趣的视频,具有以下优点:
(1)对视频文件进行自动编目,准确高效,大大节省人力;
(2)不需要预制人脸样本库,可将视频中出现的所有人物参与编目而非仅限于人脸样本库中的人物;
(3)提供基于人名和图片的视频检索功能,输入一个人的姓名或者照片,即可快速检索出包含该人的所有视频,并精确定位其出现的时间点;具有检索方便、高效的优点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
Claims (12)
1.一种基于人脸聚类的视频编目方法,其特征在于,包括以下步骤:
S1,接收待编目的视频文件,对所述视频文件进行镜头切分,得到视频镜头序列;
S2,对视频镜头序列中的每个视频镜头进行人脸检测,获得每个镜头中出现的各个人物的人脸图片及其相关信息;
S3,对检测出的人脸图片进行去重,去除同一个镜头中同一个人重复的人脸图片;
S4,对去重后的人脸图片进行人脸特征提取,将提取到的人脸特征存入人脸特征库;
S5,根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类,将同一个人不同镜头或视频片段中得到的人脸图片聚合在同一个人脸类别中,不同人的人脸图片被分配到不同的人脸类别中,将各个人物的人脸类别存储到人脸类别库中;
S6,对人脸类别库中存储的各个人脸类别进行人工标注;
S7,根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。
2.根据权利要求1所述的基于人脸聚类的视频编目方法,其特征在于,S1中,所述镜头切分包括针对镜头突变的镜头切分、针对镜头渐变的镜头切分。
3.根据权利要求1所述的基于人脸聚类的视频编目方法,其特征在于,S2中,所述对视频镜头序列中的每个视频镜头进行人脸检测包括以下步骤:
以Td为时间间隔从每个视频镜头抽取若干个视频关键帧;
对每个视频关键帧进行人脸检测,检测得到所述视频关键帧中包含的所有人脸图像,每一个人脸图像均生成一张人脸图片;另外,还生成检测得到的人脸图像的相关信息,所述相关信息包括对应的镜头编号、人物在视频中出现的时间、人脸在视频画面中的位置、人脸图像的大小。
4.根据权利要求3所述的基于人脸聚类的视频编目方法,其特征在于,S3中,所述对检测出的人脸图片进行去重包括执行以下步骤:
S3.1,建立临时存储空间,即人脸堆栈;对于一个视频镜头,初始化人脸堆栈的人脸数Nface为0,初始化视频关键帧的帧序号n为1;
S3.2,读取视频关键帧V(n),判断Nface是否等于0,如果等于,则从视频关键帧V(n)中提取所有人脸图片、以及各张人脸图片在视频关键帧V(n)中的位置坐标,设提取到m个人脸图片;然后将所有人脸图片和位置坐标存储到人脸堆栈中,并更新Nface为m;其中,m≥1;
如果Nface大于0,设Nface=w,则在视频关键帧V(n)中对人脸堆栈中的w个人脸进行跟踪,即:对于人脸堆栈中的人脸F(k),k∈{1,2,...,w},读取其位置坐标,如果在V(n)的相应位置处检测出了人脸F*,则认为该人脸F(k)在V(n)中持续存在,用人脸F*替换堆栈中的人脸F(k),删除V(n)中的人脸F*;反之,如果对于堆栈中的人脸F(k),在V(n)的相应位置处没有检测出人脸,则认为该人脸F(k)在V(n)中已消失,则认为人脸F(k)为视频关键帧V(n)中所提取到的人脸图片,输出人脸F(k),将人脸F(k)从堆栈中删除,并将Nface减1;
S3.3,视频关键帧V(n)中未在人脸堆栈中出现的人脸为新出现的人脸,将新出现的人脸及位置坐标添加到人脸堆栈中,并相应增加Nface值;
S3.4,检查是否到达视频镜头的最后1个视频关键帧,如果是最后1个视频关键帧,则输出人脸堆栈中存储的人脸图片,结束操作步骤;反之,则令n增加1,转到S3.2。
5.根据权利要求1所述的基于人脸聚类的视频编目方法,其特征在于,S4中,所述对去重后的人脸图片进行人脸特征提取,将提取到的人脸特征存入人脸特征库包括以下步骤:
对人脸图片进行旋转和缩放,生成固定尺寸的规范化图片;
对规范化人脸图片进行人脸特征提取;
将提取到的人脸特征存入人脸特征库。
6.根据权利要求1所述的基于人脸聚类的视频编目方法,其特征在于,S5中,所述根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类包括以下步骤:
S5.1,建立人脸类别库,初始化人脸类别数Nclass为0,人脸类别库为空;
S5.2,读取一个新的人脸图片的人脸特征T(n),如果人脸类别数Nclass大于0,设人脸类别数Nclass值为b,查询全部的人脸类别Class(k),k∈{1,2,...,b},计算T(n)与Class(k)之间的相似度S(n,k);选择与T(n)相似度最大的人脸类别Class(k0),对应的相似度记为S(n,k0);
S5.3,如果S(n,k0)大于或等于阈值Th,则认为人脸特征T(n)属于人脸类别Class(k0),将T(n)及对应的人脸图片和相关信息添加到Class(k0)中,转到S5.4;
反之,如果S(n,k0)小于阈值Th,则认为人脸特征T(n)不属于已有的人脸类别,创建一个新的类别Class(Nclass+1),将T(n)及对应的人脸图片和相关信息添加到Class(Nclass+1)中,最后将该类别加入人脸类别库,并将Nclass增加1;
S5.4,判断是否还有未处理的人脸图片,如果有,则转到S5.2,否则结束操作步骤。
7.根据权利要求6所述的基于人脸聚类的视频编目方法,其特征在于,S5.2中,所述计算人脸特征T(n)与人脸类别Class(k)之间的相似度具体包括以下步骤:
遍历Class(k)中的N(k)个人脸特征TC(k,m),m∈{1,2,...,N(k)},分别计算人脸特征T(n)与人脸特征TC(k,m)之间的相似度ST(k,m);
选择使得ST(k,m)达到最大的人脸特征TC(k,m0),将对应的相似度ST(k,m0)作为T(n)与Class(k)之间的相似度。
8.根据权利要求1所述的基于人脸聚类的视频编目方法,其特征在于,S6中,所述对人脸类别库中存储的各个人脸类别进行人工标注包括以下步骤:
通过人工识别该人脸类别中的人脸所对应的人物,并标注其姓名;
检查该人脸类别中的人脸图片,如果发现有错误识别的人脸图片,则将其从该人脸类别中删除;
检查是否有同一个人的人脸图像被误拆分成多个人脸类别,如果有误拆分,则将误拆分的人脸类别合并成一个完整的人脸类别。
9.根据权利要求1所述的基于人脸聚类的视频编目方法,其特征在于,S7具体包括以下步骤:
利用标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,所述人脸元数据包括人物姓名、对应的镜头编号、人物在视频中出现的起止时间、人脸在视频画面中的位置、人脸图像的大小;
将该人脸元数据作为镜头层编目的扩展元数据,增加到原始编目文件中,得到最终的视频编目文件。
10.一种对权利要求1得到的视频编目文件进行视频检索的方法,其特征在于,包括以下步骤:
接收待检索人物的姓名信息或者人脸图片;
如果接收到的为姓名信息,则遍历所有视频编目文件,通过查询编目文件中镜头层的扩展元数据,得到包含该人物的视频信息和人物出现的精确时间;
如果接收到的为人脸图片,则:首先对输入的人脸图片进行人脸检测,进而进行人脸规范化,得到标准人脸图片;然后提取该标准人脸图片的人脸特征F;遍历所有人脸类别,分别计算人脸特征F与人脸类别Class(k),k∈{1,2,...,Nclass}中代表特征TK(k)的相似度ST(k),选择使得ST(k)达到最大的人脸类别Class(k1);记ST(k)取得的最大值为Smax;如果Smax大于等于检索阈值Ts,则获取该类别中所有人脸信息;最后输出对应的视频信息和人物出现的精确时间;如果Smax小于检索阈值Ts,则输出为空。
11.一种基于人脸聚类的视频编目系统,其特征在于,包括以下模块:
人脸采集模块,用于从输入的视频文件中提取出有效的人脸图片,参与后续模块的分析和处理;其中,所述人脸采集模块包括:
镜头切分子模块,用于接收待编目的视频文件,对视频文件进行镜头切分,得到视频镜头序列;
人脸检测子模块,用于对视频镜头序列中的每个视频镜头进行人脸检测,获得每个镜头中出现的各个人物的人脸图片及其相关信息;
人脸去重子模块,用于对检测出的人脸图片进行去重,去除同一个镜头中同一个人重复的人脸图片;
特征提取模块,用于对采集到的人脸图片进行人脸特征的提取,并将提取到的人脸特征存入人脸特征库;
特征聚类模块,用于根据人脸特征库中存储的人脸特征,对通过S3得到的各张人脸图片进行特征聚类,将同一个人不同镜头或视频片段中得到的人脸图片聚合在同一个人脸类别中,不同人的人脸图片被分配到不同的人脸类别中,将各个人物的人脸类别存储到人脸类别库中;
类别标注模块,用于对人脸类别库中存储的各个人脸类别进行人工标注;
自动编目模块,用于根据人工标注后的人脸类别和类别中人脸的相关信息,自动生成人脸元数据,将所述人脸元数据增加到原始编目文件中,得到最终的视频编目文件。
12.一种视频检索的系统,其特征在于,包括:权利要求11所述的基于人脸聚类的视频编目系统、姓名检索模块和人脸图片检索模块;
其中,所述姓名检索模块用于:接收待检索人物的姓名信息;遍历所有视频编目文件,通过查询编目文件中镜头层的扩展元数据,得到包含该人物的视频信息和人物出现的精确时间;
所述人脸图片检索模块用于:首先对输入的人脸图片进行人脸检测,进而进行人脸规范化,得到标准人脸图片;然后提取该标准人脸图片的人脸特征F;遍历所有人脸类别,分别计算人脸特征F与人脸类别Class(k),k∈{1,2,...,Nclass}中代表特征TK(k)的相似度ST(k),选择使得ST(k)达到最大的人脸类别Class(k1);记ST(k)取得的最大值为Smax;如果Smax大于等于检索阈值Ts,则获取该类别中所有人脸信息;最后输出对应的视频信息和人物出现的精确时间;如果Smax小于检索阈值Ts,则输出为空。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310504743.8A CN103530652B (zh) | 2013-10-23 | 2013-10-23 | 一种基于人脸聚类的视频编目方法、检索方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310504743.8A CN103530652B (zh) | 2013-10-23 | 2013-10-23 | 一种基于人脸聚类的视频编目方法、检索方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103530652A true CN103530652A (zh) | 2014-01-22 |
CN103530652B CN103530652B (zh) | 2016-09-14 |
Family
ID=49932648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310504743.8A Active CN103530652B (zh) | 2013-10-23 | 2013-10-23 | 一种基于人脸聚类的视频编目方法、检索方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103530652B (zh) |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133875A (zh) * | 2014-07-24 | 2014-11-05 | 北京中视广信科技有限公司 | 一种基于人脸的视频标注方法和视频检索方法 |
CN105426515A (zh) * | 2015-12-01 | 2016-03-23 | 小米科技有限责任公司 | 视频归类方法及装置 |
CN105760472A (zh) * | 2016-02-06 | 2016-07-13 | 中国农业大学 | 视频检索方法及系统 |
CN105830068A (zh) * | 2016-01-30 | 2016-08-03 | 深圳市博信诺达经贸咨询有限公司 | 基于大数据的实时数据关联方法及系统 |
CN106162222A (zh) * | 2015-04-22 | 2016-11-23 | 无锡天脉聚源传媒科技有限公司 | 一种视频镜头切分的方法及装置 |
CN106339654A (zh) * | 2015-07-06 | 2017-01-18 | 无锡天脉聚源传媒科技有限公司 | 一种半自动识别人物的方法及装置 |
CN106341699A (zh) * | 2015-07-14 | 2017-01-18 | 无锡天脉聚源传媒科技有限公司 | 一种镜头切分方法和装置 |
CN106446051A (zh) * | 2016-08-31 | 2017-02-22 | 北京新奥特云视科技有限公司 | Eagle媒资深度搜索方法 |
CN106709424A (zh) * | 2016-11-19 | 2017-05-24 | 北京中科天云科技有限公司 | 一种优化的监控视频存储系统及设备 |
CN107153817A (zh) * | 2017-04-29 | 2017-09-12 | 深圳市深网视界科技有限公司 | 行人重识别数据标注方法和装置 |
CN107644213A (zh) * | 2017-09-26 | 2018-01-30 | 司马大大(北京)智能系统有限公司 | 视频人物提取方法及装置 |
CN107729928A (zh) * | 2017-09-30 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 信息获取方法和装置 |
CN107911748A (zh) * | 2017-11-24 | 2018-04-13 | 南京融升教育科技有限公司 | 一种基于人脸识别的视频裁剪方法 |
CN108470195A (zh) * | 2018-05-11 | 2018-08-31 | 东方网力科技股份有限公司 | 视频身份管理方法及装置 |
CN108563651A (zh) * | 2017-12-19 | 2018-09-21 | 深圳云天励飞技术有限公司 | 一种多视频的目标搜索方法、装置及设备 |
CN109063611A (zh) * | 2018-07-19 | 2018-12-21 | 北京影谱科技股份有限公司 | 一种基于视频语义的人脸识别结果处理方法和装置 |
CN109241299A (zh) * | 2018-09-25 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 多媒体资源搜索方法、装置、存储介质及设备 |
CN109446356A (zh) * | 2018-09-21 | 2019-03-08 | 深圳市九洲电器有限公司 | 一种多媒体文件检索方法及装置 |
CN109658572A (zh) * | 2018-12-21 | 2019-04-19 | 上海商汤智能科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN109684913A (zh) * | 2018-11-09 | 2019-04-26 | 长沙小钴科技有限公司 | 一种基于社区发现聚类的视频人脸标注方法和系统 |
WO2019105337A1 (zh) * | 2017-11-30 | 2019-06-06 | 北京市商汤科技开发有限公司 | 基于视频的人脸识别方法、装置、设备、介质及程序 |
CN109969891A (zh) * | 2019-03-25 | 2019-07-05 | 浙江新再灵科技股份有限公司 | 一种基于深度学习的电梯乘客重识别分析系统 |
CN110309691A (zh) * | 2018-03-27 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 一种人脸识别方法、装置、服务器及存储介质 |
CN110348529A (zh) * | 2019-07-16 | 2019-10-18 | 韶关市启之信息技术有限公司 | 一种智能的衣服流行风格预测方法与系统 |
CN110502953A (zh) * | 2018-05-16 | 2019-11-26 | 杭州海康威视数字技术股份有限公司 | 一种图像模型比对方法和装置 |
CN110543584A (zh) * | 2018-05-29 | 2019-12-06 | 腾讯科技(深圳)有限公司 | 一种建立人脸索引的方法、装置、处理服务器及存储介质 |
CN110555345A (zh) * | 2018-06-01 | 2019-12-10 | 北京深鉴智能科技有限公司 | 智能图像分析系统和方法 |
CN110826390A (zh) * | 2019-09-09 | 2020-02-21 | 博云视觉(北京)科技有限公司 | 一种基于人脸矢量特征的视频数据处理方法 |
CN111046235A (zh) * | 2019-11-28 | 2020-04-21 | 福建亿榕信息技术有限公司 | 基于人脸识别的声像档案搜索方法、系统、设备及介质 |
CN111553191A (zh) * | 2020-03-30 | 2020-08-18 | 深圳壹账通智能科技有限公司 | 基于人脸识别的视频分类方法、装置及存储介质 |
CN111597936A (zh) * | 2020-05-06 | 2020-08-28 | 深圳市英威诺科技有限公司 | 基于深度学习的人脸数据集标注方法、系统、终端及介质 |
CN112084812A (zh) * | 2019-06-12 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN112291574A (zh) * | 2020-09-17 | 2021-01-29 | 上海东方传媒技术有限公司 | 一种基于人工智能技术的大型体育赛事内容管理系统 |
CN112364688A (zh) * | 2020-09-30 | 2021-02-12 | 北京奇信智联科技有限公司 | 人脸聚类方法、装置、计算机设备和可读存储介质 |
CN112875077A (zh) * | 2021-01-12 | 2021-06-01 | 安徽世绿环保科技有限公司 | 一种大型垃圾站用垃圾分类方法和分类系统 |
CN113283480A (zh) * | 2021-05-13 | 2021-08-20 | 北京奇艺世纪科技有限公司 | 一种对象识别方法、装置、电子设备及存储介质 |
CN113536032A (zh) * | 2020-04-10 | 2021-10-22 | 天津职业技术师范大学(中国职业培训指导教师进修中心) | 一种视频序列信息挖掘系统、方法及其应用 |
CN113923521A (zh) * | 2021-12-14 | 2022-01-11 | 深圳市大头兄弟科技有限公司 | 一种视频的脚本化方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021857A (zh) * | 2006-10-20 | 2007-08-22 | 鲍东山 | 基于内容分析的视频搜索系统 |
US20080080743A1 (en) * | 2006-09-29 | 2008-04-03 | Pittsburgh Pattern Recognition, Inc. | Video retrieval system for human face content |
CN101754056A (zh) * | 2008-12-17 | 2010-06-23 | 中国科学院自动化研究所 | 支持海量数据自动处理的数字内容编目管理系统及方法 |
CN102165464A (zh) * | 2008-07-14 | 2011-08-24 | 谷歌公司 | 用于对视频内容中的人进行自动注释的方法和系统 |
CN102752540A (zh) * | 2011-12-30 | 2012-10-24 | 新奥特(北京)视频技术有限公司 | 一种基于人脸识别技术的自动编目方法 |
-
2013
- 2013-10-23 CN CN201310504743.8A patent/CN103530652B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080080743A1 (en) * | 2006-09-29 | 2008-04-03 | Pittsburgh Pattern Recognition, Inc. | Video retrieval system for human face content |
US20110170749A1 (en) * | 2006-09-29 | 2011-07-14 | Pittsburgh Pattern Recognition, Inc. | Video retrieval system for human face content |
CN101021857A (zh) * | 2006-10-20 | 2007-08-22 | 鲍东山 | 基于内容分析的视频搜索系统 |
CN102165464A (zh) * | 2008-07-14 | 2011-08-24 | 谷歌公司 | 用于对视频内容中的人进行自动注释的方法和系统 |
CN101754056A (zh) * | 2008-12-17 | 2010-06-23 | 中国科学院自动化研究所 | 支持海量数据自动处理的数字内容编目管理系统及方法 |
CN102752540A (zh) * | 2011-12-30 | 2012-10-24 | 新奥特(北京)视频技术有限公司 | 一种基于人脸识别技术的自动编目方法 |
Non-Patent Citations (1)
Title |
---|
江艳霞: "视频人脸跟踪识别算法研究", 《中国博士学位论文全文数据库 信息科技辑》, no. 06, 15 June 2008 (2008-06-15), pages 138 - 26 * |
Cited By (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133875B (zh) * | 2014-07-24 | 2017-03-22 | 北京中视广信科技有限公司 | 一种基于人脸的视频标注方法和视频检索方法 |
CN104133875A (zh) * | 2014-07-24 | 2014-11-05 | 北京中视广信科技有限公司 | 一种基于人脸的视频标注方法和视频检索方法 |
CN106162222A (zh) * | 2015-04-22 | 2016-11-23 | 无锡天脉聚源传媒科技有限公司 | 一种视频镜头切分的方法及装置 |
CN106162222B (zh) * | 2015-04-22 | 2019-05-24 | 无锡天脉聚源传媒科技有限公司 | 一种视频镜头切分的方法及装置 |
CN106339654A (zh) * | 2015-07-06 | 2017-01-18 | 无锡天脉聚源传媒科技有限公司 | 一种半自动识别人物的方法及装置 |
CN106341699A (zh) * | 2015-07-14 | 2017-01-18 | 无锡天脉聚源传媒科技有限公司 | 一种镜头切分方法和装置 |
CN106341699B (zh) * | 2015-07-14 | 2019-07-02 | 无锡天脉聚源传媒科技有限公司 | 一种镜头切分方法和装置 |
WO2017092127A1 (zh) * | 2015-12-01 | 2017-06-08 | 小米科技有限责任公司 | 视频归类方法及装置 |
RU2667027C2 (ru) * | 2015-12-01 | 2018-09-13 | Сяоми Инк. | Способ и устройство категоризации видео |
CN105426515A (zh) * | 2015-12-01 | 2016-03-23 | 小米科技有限责任公司 | 视频归类方法及装置 |
CN105426515B (zh) * | 2015-12-01 | 2018-12-18 | 小米科技有限责任公司 | 视频归类方法及装置 |
US10115019B2 (en) | 2015-12-01 | 2018-10-30 | Xiaomi Inc. | Video categorization method and apparatus, and storage medium |
CN105830068A (zh) * | 2016-01-30 | 2016-08-03 | 深圳市博信诺达经贸咨询有限公司 | 基于大数据的实时数据关联方法及系统 |
WO2017128363A1 (zh) * | 2016-01-30 | 2017-08-03 | 深圳市博信诺达经贸咨询有限公司 | 基于大数据的实时数据关联方法及系统 |
CN105760472A (zh) * | 2016-02-06 | 2016-07-13 | 中国农业大学 | 视频检索方法及系统 |
CN106446051A (zh) * | 2016-08-31 | 2017-02-22 | 北京新奥特云视科技有限公司 | Eagle媒资深度搜索方法 |
CN106709424A (zh) * | 2016-11-19 | 2017-05-24 | 北京中科天云科技有限公司 | 一种优化的监控视频存储系统及设备 |
CN107153817A (zh) * | 2017-04-29 | 2017-09-12 | 深圳市深网视界科技有限公司 | 行人重识别数据标注方法和装置 |
CN107153817B (zh) * | 2017-04-29 | 2021-04-27 | 深圳市深网视界科技有限公司 | 行人重识别数据标注方法和装置 |
CN107644213A (zh) * | 2017-09-26 | 2018-01-30 | 司马大大(北京)智能系统有限公司 | 视频人物提取方法及装置 |
CN107729928B (zh) * | 2017-09-30 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 信息获取方法和装置 |
CN107729928A (zh) * | 2017-09-30 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 信息获取方法和装置 |
CN107911748A (zh) * | 2017-11-24 | 2018-04-13 | 南京融升教育科技有限公司 | 一种基于人脸识别的视频裁剪方法 |
US11068697B2 (en) | 2017-11-30 | 2021-07-20 | Beijing Sensetime Technology Development Co., Ltd | Methods and apparatus for video-based facial recognition, electronic devices, and storage media |
WO2019105337A1 (zh) * | 2017-11-30 | 2019-06-06 | 北京市商汤科技开发有限公司 | 基于视频的人脸识别方法、装置、设备、介质及程序 |
CN108563651B (zh) * | 2017-12-19 | 2021-05-11 | 深圳云天励飞技术有限公司 | 一种多视频的目标搜索方法、装置及设备 |
CN108563651A (zh) * | 2017-12-19 | 2018-09-21 | 深圳云天励飞技术有限公司 | 一种多视频的目标搜索方法、装置及设备 |
CN110309691A (zh) * | 2018-03-27 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 一种人脸识别方法、装置、服务器及存储介质 |
CN110309691B (zh) * | 2018-03-27 | 2022-12-27 | 腾讯科技(深圳)有限公司 | 一种人脸识别方法、装置、服务器及存储介质 |
CN108470195B (zh) * | 2018-05-11 | 2021-01-26 | 东方网力科技股份有限公司 | 视频身份管理方法及装置 |
CN108470195A (zh) * | 2018-05-11 | 2018-08-31 | 东方网力科技股份有限公司 | 视频身份管理方法及装置 |
CN110502953A (zh) * | 2018-05-16 | 2019-11-26 | 杭州海康威视数字技术股份有限公司 | 一种图像模型比对方法和装置 |
CN110543584A (zh) * | 2018-05-29 | 2019-12-06 | 腾讯科技(深圳)有限公司 | 一种建立人脸索引的方法、装置、处理服务器及存储介质 |
CN110555345B (zh) * | 2018-06-01 | 2022-06-28 | 赛灵思电子科技(北京)有限公司 | 智能图像分析系统和方法 |
CN110555345A (zh) * | 2018-06-01 | 2019-12-10 | 北京深鉴智能科技有限公司 | 智能图像分析系统和方法 |
CN109063611A (zh) * | 2018-07-19 | 2018-12-21 | 北京影谱科技股份有限公司 | 一种基于视频语义的人脸识别结果处理方法和装置 |
CN109063611B (zh) * | 2018-07-19 | 2021-01-05 | 北京影谱科技股份有限公司 | 一种基于视频语义的人脸识别结果处理方法和装置 |
CN109446356A (zh) * | 2018-09-21 | 2019-03-08 | 深圳市九洲电器有限公司 | 一种多媒体文件检索方法及装置 |
WO2020057347A1 (zh) * | 2018-09-21 | 2020-03-26 | 深圳市九洲电器有限公司 | 一种多媒体文件检索方法及装置 |
CN109241299A (zh) * | 2018-09-25 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 多媒体资源搜索方法、装置、存储介质及设备 |
CN109684913A (zh) * | 2018-11-09 | 2019-04-26 | 长沙小钴科技有限公司 | 一种基于社区发现聚类的视频人脸标注方法和系统 |
US11410001B2 (en) | 2018-12-21 | 2022-08-09 | Shanghai Sensetime Intelligent Technology Co., Ltd | Method and apparatus for object authentication using images, electronic device, and storage medium |
CN109658572B (zh) * | 2018-12-21 | 2020-09-15 | 上海商汤智能科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN109658572A (zh) * | 2018-12-21 | 2019-04-19 | 上海商汤智能科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN109969891A (zh) * | 2019-03-25 | 2019-07-05 | 浙江新再灵科技股份有限公司 | 一种基于深度学习的电梯乘客重识别分析系统 |
CN112084812A (zh) * | 2019-06-12 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN112084812B (zh) * | 2019-06-12 | 2023-08-01 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN110348529A (zh) * | 2019-07-16 | 2019-10-18 | 韶关市启之信息技术有限公司 | 一种智能的衣服流行风格预测方法与系统 |
CN110348529B (zh) * | 2019-07-16 | 2021-10-22 | 上海惟也新文化科技有限公司 | 一种智能的衣服流行风格预测方法与系统 |
CN110826390A (zh) * | 2019-09-09 | 2020-02-21 | 博云视觉(北京)科技有限公司 | 一种基于人脸矢量特征的视频数据处理方法 |
CN110826390B (zh) * | 2019-09-09 | 2023-09-08 | 博云视觉(北京)科技有限公司 | 一种基于人脸矢量特征的视频数据处理方法 |
CN111046235B (zh) * | 2019-11-28 | 2022-06-14 | 福建亿榕信息技术有限公司 | 基于人脸识别的声像档案搜索方法、系统、设备及介质 |
CN111046235A (zh) * | 2019-11-28 | 2020-04-21 | 福建亿榕信息技术有限公司 | 基于人脸识别的声像档案搜索方法、系统、设备及介质 |
CN111553191A (zh) * | 2020-03-30 | 2020-08-18 | 深圳壹账通智能科技有限公司 | 基于人脸识别的视频分类方法、装置及存储介质 |
CN113536032A (zh) * | 2020-04-10 | 2021-10-22 | 天津职业技术师范大学(中国职业培训指导教师进修中心) | 一种视频序列信息挖掘系统、方法及其应用 |
CN111597936A (zh) * | 2020-05-06 | 2020-08-28 | 深圳市英威诺科技有限公司 | 基于深度学习的人脸数据集标注方法、系统、终端及介质 |
CN112291574A (zh) * | 2020-09-17 | 2021-01-29 | 上海东方传媒技术有限公司 | 一种基于人工智能技术的大型体育赛事内容管理系统 |
CN112364688B (zh) * | 2020-09-30 | 2022-04-08 | 北京奇信智联科技有限公司 | 人脸聚类方法、装置、计算机设备和可读存储介质 |
CN112364688A (zh) * | 2020-09-30 | 2021-02-12 | 北京奇信智联科技有限公司 | 人脸聚类方法、装置、计算机设备和可读存储介质 |
CN112875077A (zh) * | 2021-01-12 | 2021-06-01 | 安徽世绿环保科技有限公司 | 一种大型垃圾站用垃圾分类方法和分类系统 |
CN113283480A (zh) * | 2021-05-13 | 2021-08-20 | 北京奇艺世纪科技有限公司 | 一种对象识别方法、装置、电子设备及存储介质 |
CN113283480B (zh) * | 2021-05-13 | 2023-09-05 | 北京奇艺世纪科技有限公司 | 一种对象识别方法、装置、电子设备及存储介质 |
CN113923521B (zh) * | 2021-12-14 | 2022-03-08 | 深圳市大头兄弟科技有限公司 | 一种视频的脚本化方法 |
CN113923521A (zh) * | 2021-12-14 | 2022-01-11 | 深圳市大头兄弟科技有限公司 | 一种视频的脚本化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103530652B (zh) | 2016-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103530652A (zh) | 一种基于人脸聚类的视频编目方法、检索方法及其系统 | |
Chou et al. | Pattern-based near-duplicate video retrieval and localization on web-scale videos | |
Papadopoulos et al. | Cluster-based landmark and event detection for tagged photo collections | |
Wang et al. | Event driven web video summarization by tag localization and key-shot identification | |
CN104133875B (zh) | 一种基于人脸的视频标注方法和视频检索方法 | |
JP2012509522A (ja) | 事象毎に意味論的に分類する方法 | |
US20080002864A1 (en) | Using background for searching image collections | |
CN111860523B (zh) | 一种声像档案的智能著录系统与方法 | |
CN104376108A (zh) | 一种基于6w语义标识的非结构化自然语言信息抽取方法 | |
Liu et al. | Event analysis in social multimedia: a survey | |
CN113254634A (zh) | 一种基于相空间的档案分类方法及系统 | |
Trad et al. | Large scale visual-based event matching | |
WO2012174971A1 (zh) | 信息摘录方法及基于云计算的摘录信息网络存储管理系统 | |
CN115238081A (zh) | 一种文物智能识别方法、系统及可读存储介质 | |
Ma et al. | Lecture video segmentation and indexing | |
CN115203474A (zh) | 一种数据库自动分类提取技术 | |
Nagaraja et al. | Content based video retrieval using support vector machine classification | |
Ahmad et al. | Event recognition in personal photo collections: An active learning approach | |
JP4755122B2 (ja) | 画像辞書生成方法及び装置及びプログラム | |
Jadhav et al. | Unstructured big data information extraction techniques survey: Privacy preservation perspective | |
Abdelhalim et al. | Intelligent organization of multiuser photo galleries using sub-event detection | |
Van Gool et al. | Mining from large image sets | |
Sahay et al. | Visually classified & tagged video repository | |
Aggarwal et al. | Event summarization in videos | |
CN109992568B (zh) | 一种信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |