CN113191411B - 一种基于照片组的电子声像类文件管理方法 - Google Patents
一种基于照片组的电子声像类文件管理方法 Download PDFInfo
- Publication number
- CN113191411B CN113191411B CN202110433019.5A CN202110433019A CN113191411B CN 113191411 B CN113191411 B CN 113191411B CN 202110433019 A CN202110433019 A CN 202110433019A CN 113191411 B CN113191411 B CN 113191411B
- Authority
- CN
- China
- Prior art keywords
- image
- encoder
- clustering
- cluster
- archive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及电子档案库架构技术领域,具体是一种基于照片组的电子声像类文件管理方法,为了解决传统声像档案分类归档时无法自动生成类标的问题,具体包括四大步骤。本发明可以自动提取图像特征进行聚类分析,然后逆向搜索与聚类结果强相关的图片像素,提取出声像档案中的共性图像作为该类的类标,能够对档案进行快速有效的归档分类,从而实现更加方便快捷的声像档案管理。
Description
技术领域
本发明涉及电子档案库架构技术领域,具体是一种基于照片组的电子声像类文件管理方法。
背景技术
声像档案是指各单位在科研、生产、基本建设、党务、行政、经营、外事等各项活动中产生的、具有保存价值并经过整理归档的录音带、录像带、传统胶片照片、幻灯片、缩微胶片以及数码照片、数字音频、数字视频文件等,并提供附属文字材料。
由于数据来源多样,且需要定义统一的规范和标准,使得难以对档案进行有效的归档分类,也加大了后续对声像档案管理的难度。因此,本领域技术人员提供了一种基于照片组的电子声像类文件管理方法,以解决上述背景技术中提出的问题。
发明内容
本发明的目的在于提供一种基于照片组的电子声像类文件管理方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于照片组的电子声像类文件管理方法,包括如下步骤:
步骤1:提取图片样本中最能代表图像间差异的像素进行编码作为图片特征;
步骤2:使用编码向量进行聚类分析,根据聚类结果重新迭代训练自编码器,直至到达聚类指标;
步骤3:取出训练后自编码器第一层的权重矩阵W和偏置矩阵B,找出relu(wx+b)>0的激活神经元及输入样本图片的对应像素;
步骤4:将步骤3中提取出的像素重新组合出共性图像作为声像档案的类标。
作为本发明更进一步的方案:步骤1中差异性指标使用图片编码向量的与原始图像集的相关性R(S,E)来衡量,公式:
作为本发明更进一步的方案:其中S表示原始图像的集合,s表示图像集中的某张图像,E表示编码向量的集合,e为某个编码向量,p(e|s)为编码向量的高斯分布,为原始数据的分布,p(s)这是在指定p(e|s)后整个编码向量集合E的分布:
因此只需要最大化图片的相关性评价,即可训练出一个自编码器使得对于每个样本s,都能使得该样本的编码向量z保留原始数据尽可能多的重要信息。
作为本发明更进一步的方案:步骤2的具体方法是将得到图片的编码向量后采用聚类算法对图片进行聚类,使用纯度purity来衡量聚类结果;具体公式如下:
作为本发明更进一步的方案:其中pij指聚类i中成员属于类j的概率,mi是在聚类i中所有成员的个数,m是整个聚类划分类型所涉及到的成员个数,K是聚类簇的数量。然后根据聚类结果重新迭代训练自编码器,反向调整自编码器的神经元激活状态直至到达聚类指标,因此自编码器的损失函数为:
与现有技术相比,本发明的有益效果是:本发明可以自动提取图像特征进行聚类分析,然后逆向搜索与聚类结果强相关的图片像素,提取出声像档案中的共性图像作为该类的类标,能够对档案进行快速有效的归档分类,从而实现更加方便快捷的声像档案管理。
附图说明
图1为一种基于照片组的电子声像类文件管理方法的步骤示意图。
具体实施方式
请参阅图1,本发明实施例中,一种基于照片组的电子声像类文件管理方法,包括如下步骤:
步骤1:提取图片样本中最能代表图像间差异的像素进行编码作为图片特征;
步骤2:使用编码向量进行聚类分析,根据聚类结果重新迭代训练自编码器,直至到达聚类指标;
步骤3:取出训练后自编码器第一层的权重矩阵W和偏置矩阵B,找出relu(wx+b)>0的激活神经元及输入样本图片的对应像素;
步骤4:将步骤3中提取出的像素重新组合出共性图像作为声像档案的类标。
进一步的,步骤1中差异性指标使用图片编码向量的与原始图像集的相关性R(S,E)来衡量,公式:
进一步的,其中S表示原始图像的集合,s表示图像集中的某张图像,E表示编码向量的集合,e为某个编码向量,p(e|s)为编码向量的高斯分布,为原始数据的分布,p(s)这是在指定p(e|s)后整个编码向量集合E的分布:
因此只需要最大化图片的相关性评价,即可训练出一个自编码器使得对于每个样本s,都能使得该样本的编码向量z保留原始数据尽可能多的重要信息。
进一步的,步骤2的具体方法是将得到图片的编码向量后采用聚类算法对图片进行聚类,使用纯度purity来衡量聚类结果;具体公式如下:
进一步的,其中pij指聚类i中成员属于类j的概率,mi是在聚类i中所有成员的个数,m是整个聚类划分类型所涉及到的成员个数,K是聚类簇的数量。然后根据聚类结果重新迭代训练自编码器,反向调整自编码器的神经元激活状态直至到达聚类指标,因此自编码器的损失函数为:
综上所述:本发明可以自动提取图像特征进行聚类分析,然后逆向搜索与聚类结果强相关的图片像素,提取出声像档案中的共性图像作为该类的类标,能够对档案进行快速有效的归档分类,从而实现更加方便快捷的声像档案管理。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (3)
1.一种基于照片组的电子声像类文件管理方法,其特征在于,包括如下步骤:
步骤1:提取图片样本中最能代表图像间差异的像素进行编码作为图片特征;
步骤2:使用编码向量进行聚类分析,根据聚类结果重新迭代训练自编码器,直至到达聚类指标;
步骤3:取出训练后自编码器第一层的权重矩阵W和偏置矩阵B,找出relu(Wx +B )>0的激活神经元及输入样本图片的对应像素;
步骤4:将步骤3中提取出的像素重新组合出共性图像作为声像档案的类标;
步骤1中差异性指标使用图片编码向量的与原始图像集的相关性R(S,E)来衡量,公式:
其中S表示原始图像的集合,s表示图像集中的某张图像,E表示编码向量的集合,e为某个编码向量,p(e|s)为编码向量的高斯分布,为原始数据的分布,p(s)这是在指定p(e|s)后整个编码向量集合E的分布:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110433019.5A CN113191411B (zh) | 2021-04-22 | 2021-04-22 | 一种基于照片组的电子声像类文件管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110433019.5A CN113191411B (zh) | 2021-04-22 | 2021-04-22 | 一种基于照片组的电子声像类文件管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113191411A CN113191411A (zh) | 2021-07-30 |
CN113191411B true CN113191411B (zh) | 2023-02-07 |
Family
ID=76978577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110433019.5A Active CN113191411B (zh) | 2021-04-22 | 2021-04-22 | 一种基于照片组的电子声像类文件管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113191411B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109710780A (zh) * | 2018-12-28 | 2019-05-03 | 上海依图网络科技有限公司 | 一种归档方法及装置 |
CN110555841A (zh) * | 2019-09-10 | 2019-12-10 | 西安电子科技大学 | 基于自注意图像融合和dec的sar图像变化检测方法 |
CN111831820A (zh) * | 2020-03-11 | 2020-10-27 | 昆明理工大学 | 基于案件要素指导及深度聚类的新闻与案件相关性分析方法 |
AU2020103887A4 (en) * | 2020-12-04 | 2021-02-11 | kale, Karbhari Vishwanath DR | A method for automated endmember identification, selection and extraction from hyperspectral imagery |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751439A (zh) * | 2008-12-17 | 2010-06-23 | 中国科学院自动化研究所 | 基于层次聚类的图像检索方法 |
CN111488907B (zh) * | 2020-03-05 | 2023-07-14 | 浙江工业大学 | 一种基于稠密PCANet的鲁棒图像识别方法 |
-
2021
- 2021-04-22 CN CN202110433019.5A patent/CN113191411B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109710780A (zh) * | 2018-12-28 | 2019-05-03 | 上海依图网络科技有限公司 | 一种归档方法及装置 |
CN110555841A (zh) * | 2019-09-10 | 2019-12-10 | 西安电子科技大学 | 基于自注意图像融合和dec的sar图像变化检测方法 |
CN111831820A (zh) * | 2020-03-11 | 2020-10-27 | 昆明理工大学 | 基于案件要素指导及深度聚类的新闻与案件相关性分析方法 |
AU2020103887A4 (en) * | 2020-12-04 | 2021-02-11 | kale, Karbhari Vishwanath DR | A method for automated endmember identification, selection and extraction from hyperspectral imagery |
Also Published As
Publication number | Publication date |
---|---|
CN113191411A (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359592B (zh) | 视频帧的处理方法、装置、电子设备及存储介质 | |
WO2020119350A1 (zh) | 视频分类方法、装置、计算机设备和存储介质 | |
CN109543714B (zh) | 数据特征的获取方法、装置、电子设备及存储介质 | |
CN103038765B (zh) | 用于适配情境模型的方法和装置 | |
CN110728294A (zh) | 一种基于迁移学习的跨领域图像分类模型构建方法和装置 | |
WO2021031645A1 (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113395578B (zh) | 一种提取视频主题文本的方法、装置、设备及存储介质 | |
CN114067385B (zh) | 基于度量学习的跨模态人脸检索哈希方法 | |
CN111489401B (zh) | 一种图像颜色恒常性处理方法、系统、设备和存储介质 | |
CN114298170A (zh) | 一种多模态会议数据结构化方法、装置及计算机设备 | |
TWI785267B (zh) | 影像處理方法、電子設備和儲存介質 | |
CN112861976B (zh) | 一种基于孪生图卷积哈希网络的敏感图像识别方法 | |
WO2020092276A1 (en) | Video recognition using multiple modalities | |
WO2021175040A1 (zh) | 视频处理方法及相关装置 | |
CN111723239A (zh) | 一种基于多模态的视频标注方法 | |
Li et al. | Data-driven affective filtering for images and videos | |
Zhang et al. | Learning contextually fused audio-visual representations for audio-visual speech recognition | |
CN113191411B (zh) | 一种基于照片组的电子声像类文件管理方法 | |
CN116935292A (zh) | 一种基于自注意力模型的短视频场景分类方法及系统 | |
CN110991219B (zh) | 一种基于双路3d卷积网络的行为识别方法 | |
CN114155388B (zh) | 一种图像识别方法、装置、计算机设备和存储介质 | |
CN117688390A (zh) | 内容匹配方法、装置、计算机设备、存储介质和程序产品 | |
Chung et al. | Filter pruning by image channel reduction in pre-trained convolutional neural networks | |
CN107798687B (zh) | 一种基于稀疏时变图的幻灯片切换检测方法 | |
CN111898658A (zh) | 图像分类方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |