CN113191411B - 一种基于照片组的电子声像类文件管理方法 - Google Patents

一种基于照片组的电子声像类文件管理方法 Download PDF

Info

Publication number
CN113191411B
CN113191411B CN202110433019.5A CN202110433019A CN113191411B CN 113191411 B CN113191411 B CN 113191411B CN 202110433019 A CN202110433019 A CN 202110433019A CN 113191411 B CN113191411 B CN 113191411B
Authority
CN
China
Prior art keywords
image
encoder
clustering
cluster
archive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110433019.5A
Other languages
English (en)
Other versions
CN113191411A (zh
Inventor
余运坤
罗文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Zhuo Zhichuang Information Technology Co ltd
Original Assignee
Hangzhou Zhuo Zhichuang Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Zhuo Zhichuang Information Technology Co ltd filed Critical Hangzhou Zhuo Zhichuang Information Technology Co ltd
Priority to CN202110433019.5A priority Critical patent/CN113191411B/zh
Publication of CN113191411A publication Critical patent/CN113191411A/zh
Application granted granted Critical
Publication of CN113191411B publication Critical patent/CN113191411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及电子档案库架构技术领域,具体是一种基于照片组的电子声像类文件管理方法,为了解决传统声像档案分类归档时无法自动生成类标的问题,具体包括四大步骤。本发明可以自动提取图像特征进行聚类分析,然后逆向搜索与聚类结果强相关的图片像素,提取出声像档案中的共性图像作为该类的类标,能够对档案进行快速有效的归档分类,从而实现更加方便快捷的声像档案管理。

Description

一种基于照片组的电子声像类文件管理方法
技术领域
本发明涉及电子档案库架构技术领域,具体是一种基于照片组的电子声像类文件管理方法。
背景技术
声像档案是指各单位在科研、生产、基本建设、党务、行政、经营、外事等各项活动中产生的、具有保存价值并经过整理归档的录音带、录像带、传统胶片照片、幻灯片、缩微胶片以及数码照片、数字音频、数字视频文件等,并提供附属文字材料。
由于数据来源多样,且需要定义统一的规范和标准,使得难以对档案进行有效的归档分类,也加大了后续对声像档案管理的难度。因此,本领域技术人员提供了一种基于照片组的电子声像类文件管理方法,以解决上述背景技术中提出的问题。
发明内容
本发明的目的在于提供一种基于照片组的电子声像类文件管理方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于照片组的电子声像类文件管理方法,包括如下步骤:
步骤1:提取图片样本中最能代表图像间差异的像素进行编码作为图片特征;
步骤2:使用编码向量进行聚类分析,根据聚类结果重新迭代训练自编码器,直至到达聚类指标;
步骤3:取出训练后自编码器第一层的权重矩阵W和偏置矩阵B,找出relu(wx+b)>0的激活神经元及输入样本图片的对应像素;
步骤4:将步骤3中提取出的像素重新组合出共性图像作为声像档案的类标。
作为本发明更进一步的方案:步骤1中差异性指标使用图片编码向量的与原始图像集的相关性R(S,E)来衡量,公式:
Figure BSA0000240083630000021
作为本发明更进一步的方案:其中S表示原始图像的集合,s表示图像集中的某张图像,E表示编码向量的集合,e为某个编码向量,p(e|s)为编码向量的高斯分布,
Figure BSA0000240083630000022
为原始数据的分布,p(s)这是在指定p(e|s)后整个编码向量集合E的分布:
Figure BSA0000240083630000023
因此只需要最大化图片的相关性评价,即可训练出一个自编码器使得对于每个样本s,都能使得该样本的编码向量z保留原始数据尽可能多的重要信息。
作为本发明更进一步的方案:步骤2的具体方法是将得到图片的编码向量后采用聚类算法对图片进行聚类,使用纯度purity来衡量聚类结果;具体公式如下:
Figure BSA0000240083630000024
作为本发明更进一步的方案:其中pij指聚类i中成员属于类j的概率,mi是在聚类i中所有成员的个数,m是整个聚类划分类型所涉及到的成员个数,K是聚类簇的数量。然后根据聚类结果重新迭代训练自编码器,反向调整自编码器的神经元激活状态直至到达聚类指标,因此自编码器的损失函数为:
Figure BSA0000240083630000025
与现有技术相比,本发明的有益效果是:本发明可以自动提取图像特征进行聚类分析,然后逆向搜索与聚类结果强相关的图片像素,提取出声像档案中的共性图像作为该类的类标,能够对档案进行快速有效的归档分类,从而实现更加方便快捷的声像档案管理。
附图说明
图1为一种基于照片组的电子声像类文件管理方法的步骤示意图。
具体实施方式
请参阅图1,本发明实施例中,一种基于照片组的电子声像类文件管理方法,包括如下步骤:
步骤1:提取图片样本中最能代表图像间差异的像素进行编码作为图片特征;
步骤2:使用编码向量进行聚类分析,根据聚类结果重新迭代训练自编码器,直至到达聚类指标;
步骤3:取出训练后自编码器第一层的权重矩阵W和偏置矩阵B,找出relu(wx+b)>0的激活神经元及输入样本图片的对应像素;
步骤4:将步骤3中提取出的像素重新组合出共性图像作为声像档案的类标。
进一步的,步骤1中差异性指标使用图片编码向量的与原始图像集的相关性R(S,E)来衡量,公式:
Figure BSA0000240083630000031
进一步的,其中S表示原始图像的集合,s表示图像集中的某张图像,E表示编码向量的集合,e为某个编码向量,p(e|s)为编码向量的高斯分布,
Figure BSA0000240083630000032
为原始数据的分布,p(s)这是在指定p(e|s)后整个编码向量集合E的分布:
Figure BSA0000240083630000033
因此只需要最大化图片的相关性评价,即可训练出一个自编码器使得对于每个样本s,都能使得该样本的编码向量z保留原始数据尽可能多的重要信息。
进一步的,步骤2的具体方法是将得到图片的编码向量后采用聚类算法对图片进行聚类,使用纯度purity来衡量聚类结果;具体公式如下:
Figure BSA0000240083630000034
进一步的,其中pij指聚类i中成员属于类j的概率,mi是在聚类i中所有成员的个数,m是整个聚类划分类型所涉及到的成员个数,K是聚类簇的数量。然后根据聚类结果重新迭代训练自编码器,反向调整自编码器的神经元激活状态直至到达聚类指标,因此自编码器的损失函数为:
Figure BSA0000240083630000035
综上所述:本发明可以自动提取图像特征进行聚类分析,然后逆向搜索与聚类结果强相关的图片像素,提取出声像档案中的共性图像作为该类的类标,能够对档案进行快速有效的归档分类,从而实现更加方便快捷的声像档案管理。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (3)

1.一种基于照片组的电子声像类文件管理方法,其特征在于,包括如下步骤:
步骤1:提取图片样本中最能代表图像间差异的像素进行编码作为图片特征;
步骤2:使用编码向量进行聚类分析,根据聚类结果重新迭代训练自编码器,直至到达聚类指标;
步骤3:取出训练后自编码器第一层的权重矩阵W和偏置矩阵B,找出relu(Wx +B )>0的激活神经元及输入样本图片的对应像素;
步骤4:将步骤3中提取出的像素重新组合出共性图像作为声像档案的类标;
步骤1中差异性指标使用图片编码向量的与原始图像集的相关性R(S,E)来衡量,公式:
Figure FSB0000200287360000011
其中S表示原始图像的集合,s表示图像集中的某张图像,E表示编码向量的集合,e为某个编码向量,p(e|s)为编码向量的高斯分布,
Figure FSB0000200287360000012
为原始数据的分布,p(s)这是在指定p(e|s)后整个编码向量集合E的分布:
Figure FSB0000200287360000013
2.根据权利要求1所述的一种基于照片组的电子声像类文件管理方法,其特征在于,步骤2的具体方法是将得到图片的编码向量后采用聚类算法对图片进行聚类,使用纯度purity来衡量聚类结果;具体公式如下:
Figure FSB0000200287360000021
其中pij指聚类i中成员属于类j的概率,mi是在聚类i中所有成员的个数,m是整个聚类划分类型所涉及到的成员个数,K是聚类簇的数量。
3.根据权利要求2所述的一种基于照片组的电子声像类文件管理方法,其特征在于,所述根据聚类结果重新迭代训练自编码器,直至到达聚类指标,具体为,根据聚类结果重新迭代训练自编码器,反向调整自编码器的神经元激活状态直至到达聚类指标,所述自编码器的损失函数为:
Figure FSB0000200287360000022
CN202110433019.5A 2021-04-22 2021-04-22 一种基于照片组的电子声像类文件管理方法 Active CN113191411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110433019.5A CN113191411B (zh) 2021-04-22 2021-04-22 一种基于照片组的电子声像类文件管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110433019.5A CN113191411B (zh) 2021-04-22 2021-04-22 一种基于照片组的电子声像类文件管理方法

Publications (2)

Publication Number Publication Date
CN113191411A CN113191411A (zh) 2021-07-30
CN113191411B true CN113191411B (zh) 2023-02-07

Family

ID=76978577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110433019.5A Active CN113191411B (zh) 2021-04-22 2021-04-22 一种基于照片组的电子声像类文件管理方法

Country Status (1)

Country Link
CN (1) CN113191411B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710780A (zh) * 2018-12-28 2019-05-03 上海依图网络科技有限公司 一种归档方法及装置
CN110555841A (zh) * 2019-09-10 2019-12-10 西安电子科技大学 基于自注意图像融合和dec的sar图像变化检测方法
CN111831820A (zh) * 2020-03-11 2020-10-27 昆明理工大学 基于案件要素指导及深度聚类的新闻与案件相关性分析方法
AU2020103887A4 (en) * 2020-12-04 2021-02-11 kale, Karbhari Vishwanath DR A method for automated endmember identification, selection and extraction from hyperspectral imagery

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751439A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 基于层次聚类的图像检索方法
CN111488907B (zh) * 2020-03-05 2023-07-14 浙江工业大学 一种基于稠密PCANet的鲁棒图像识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710780A (zh) * 2018-12-28 2019-05-03 上海依图网络科技有限公司 一种归档方法及装置
CN110555841A (zh) * 2019-09-10 2019-12-10 西安电子科技大学 基于自注意图像融合和dec的sar图像变化检测方法
CN111831820A (zh) * 2020-03-11 2020-10-27 昆明理工大学 基于案件要素指导及深度聚类的新闻与案件相关性分析方法
AU2020103887A4 (en) * 2020-12-04 2021-02-11 kale, Karbhari Vishwanath DR A method for automated endmember identification, selection and extraction from hyperspectral imagery

Also Published As

Publication number Publication date
CN113191411A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN109359592B (zh) 视频帧的处理方法、装置、电子设备及存储介质
WO2020119350A1 (zh) 视频分类方法、装置、计算机设备和存储介质
CN109543714B (zh) 数据特征的获取方法、装置、电子设备及存储介质
CN103038765B (zh) 用于适配情境模型的方法和装置
CN110728294A (zh) 一种基于迁移学习的跨领域图像分类模型构建方法和装置
WO2021031645A1 (zh) 图像处理方法及装置、电子设备和存储介质
CN113395578B (zh) 一种提取视频主题文本的方法、装置、设备及存储介质
CN114067385B (zh) 基于度量学习的跨模态人脸检索哈希方法
CN111489401B (zh) 一种图像颜色恒常性处理方法、系统、设备和存储介质
CN114298170A (zh) 一种多模态会议数据结构化方法、装置及计算机设备
TWI785267B (zh) 影像處理方法、電子設備和儲存介質
CN112861976B (zh) 一种基于孪生图卷积哈希网络的敏感图像识别方法
WO2020092276A1 (en) Video recognition using multiple modalities
WO2021175040A1 (zh) 视频处理方法及相关装置
CN111723239A (zh) 一种基于多模态的视频标注方法
Li et al. Data-driven affective filtering for images and videos
Zhang et al. Learning contextually fused audio-visual representations for audio-visual speech recognition
CN113191411B (zh) 一种基于照片组的电子声像类文件管理方法
CN116935292A (zh) 一种基于自注意力模型的短视频场景分类方法及系统
CN110991219B (zh) 一种基于双路3d卷积网络的行为识别方法
CN114155388B (zh) 一种图像识别方法、装置、计算机设备和存储介质
CN117688390A (zh) 内容匹配方法、装置、计算机设备、存储介质和程序产品
Chung et al. Filter pruning by image channel reduction in pre-trained convolutional neural networks
CN107798687B (zh) 一种基于稀疏时变图的幻灯片切换检测方法
CN111898658A (zh) 图像分类方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant