CN115457640A

CN115457640A - 一种档案合并方法、装置及介质

Info

Publication number: CN115457640A
Application number: CN202211261538.9A
Authority: CN
Inventors: 江艺榕; 齐战胜; 梁煜麓; 赖光冰; 施翔飞; 阮志忠
Original assignee: Xiamen Meiya Pico Information Co Ltd
Current assignee: Xiamen Meiya Pico Information Co Ltd
Priority date: 2022-10-14
Filing date: 2022-10-14
Publication date: 2022-12-09

Abstract

本申请提出了一种档案合并方法，包括：获取待合并档案，每个所述待合并档案包括一张封面图像和多张人脸图像；根据所述待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将所述待合并档案和所述预合并档案构建成候选档案对；获取所述待合并档案和所述预合并档案的多维度特征信息以及所述候选档案对的交互特征信息；将所述多维度特征信息和所述交互特征信息输入到训练好的机器学习模型中，所述机器学习模型输出所述候选档案对中的两个档案属于同一目标的置信度；根据所述置信度判断所述候选档案对是否合并成合并档案。本申请的档案合并方法融合了更多维度的特征信息，档案合并的准确性和合并率更高，同时实现了不同合并档案间的去重。

Description

一种档案合并方法、装置及介质

技术领域

本申请涉及图像处理的技术领域，具体涉及一种档案合并方法、装置及介质。

背景技术

随着人工智能的发展和摄像头的普及，人脸识别技术越来越成熟，公共安全领域高清视频监控覆盖面越来越广，使得人脸图片聚类归档成为可能。但是由于不同时间点存在着多种不同的外在因素，使得同一目标的人脸图片结构化信息在特征相似度上较低，难以表现为同一目标，从而导致人脸档案库里存在着一人多档的现象，使得归档效果变差，也影响了后续基于人脸聚档的技战法的效果。因此，需要对人脸档案库进行合并去重。

现有的技术方案，普遍是基于特征相似度的方案，通过计算两个档案间的人脸特征相似度，将达到预设的阈值以上的档案进行合并。现有技术对档案间的人脸特征相似度计算，一般有两种，一种是两个档案各自用一张代表性图片(也叫封面图片)来代表档案，通过计算代表性图片间的相似度来表示档案间的相似度；另一种是两个档案用类中心特征来代表档案，通过计算类中心特征的相似度来表示档案间的平均相似度。此外，还有一些技术方案是将两种方法结合在一起使用。但这些方案，都只是利用了档案图片特征相似度这一维度的信息，未充分考虑其他影响因素，在档案合并效果上存在着较低的合并率。

发明内容

为了解决现有技术的档案合并率较低技术问题，本申请提出了一种档案合并方法、装置及介质。

根据本申请的第一方面，提出了一种档案合并方法，包括：

获取待合并档案，每个所述待合并档案包括一张封面图像和多张人脸图像；

根据所述待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将所述待合并档案和所述预合并档案构建成候选档案对；

获取所述待合并档案和所述预合并档案的多维度特征信息以及所述候选档案对的交互特征信息；

将所述多维度特征信息和所述交互特征信息输入到训练好的机器学习模型中，所述机器学习模型输出所述候选档案对中的两个档案属于同一目标的置信度；

根据所述置信度判断所述候选档案对是否合并成合并档案。

优选的，所述根据所述待合并档案检索档案库，包括：

根据所述待合并档案的档案特征检索档案库，所述待合并档案的档案特征为封面图像特性或类中心特征，其中所述类中心特征用于表征所述待合并档案中多张人脸图像特征向量的平均向量。

优选的，所述根据所述待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将所述待合并档案和所述预合并档案构建成候选档案对，包括：

根据所述待合并档案检索档案库，得到对应一个或多个不同相似度的所述预合并档案；

将检索结果中相似度达到第一预设阈值的所述预合并档案分别与所述待合并档案构建成所述候选档案对。

优选的，所述根据所述待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将所述待合并档案和所述预合并档案构建成候选档案对，还包括：

分析所述检索结果；

判断相似度达到第二预设阈值的所述预合并档案的数量是否大于第三预设阈值，若是，则只选取相似度达到第二预设阈值的所述预合并档案分别与所述待合并档案构建成所述候选档案对；若否，则只选取所述检索结果中相似度最大的所述预合并档案与所述待合并档案构建成所述候选档案对。

优选的，所述待合并档案和所述预合并档案的多维度特征信息，包括：

所述待识别档案中的人脸图像的年龄、性别、是否佩戴口罩、平均质量分、内聚性、图像数量，其中所述内聚性用于表征档案中任意两张人脸图像特征向量相似度的平均值；以及

检索到的所述预合并档案的数量、相似度大于第四预设阈值的所述预合并档案的数量。

优选的，所述候选档案对的交互特征信息，包括：

所述候选档案对中两个档案之间的特征相似度以及两个档案融合后的内聚性、内聚性的减少量、人脸图像平均质量分。

优选的，所述候选档案对中两个档案融合后的内聚性的表达式具体为：

其中，

x＝(x₁,x₂,…,x_n)为档案中的人脸图像特征向量，s_a和s_b分别为两个档案的内聚性，n_a和n_b分别为两个档案中的人脸图像的数量，sim为两个档案的特征相似度；

所述候选档案对中两个档案融合后内聚性的减少量的表达式具体为：

s_ab-0.5×(s_a+s_b)。

优选的，所述根据所述置信度判断所述候选档案对是否合并成合并档案，包括：

筛选出所述置信度达到第五预设阈值的所有所述候选档案对，将该所有候选档案对中的所述待合并档案和所述预合并档案构成图网络；

将所述图网络中的所有所述待合并档案按照人脸图像的数量从大到小排序构建剪枝序列；

根据所述剪枝序列依次将所述待合并档案及其关联的所有所述预合并档案合并成所述合并档案，并在每次合并后从所述图网络中移除。

根据本申请的第二方面，提出了一种档案合并装置，包括：

获取模块，配置用于获取待合并档案，每个所述待合并档案包括一张封面图像和多张人脸图像；

检索模块，配置用于根据所述待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将所述待合并档案和所述预合并档案构建成候选档案对；

特征提取模块，配置用于获取所述待合并档案和所述预合并档案的多维度特征信息以及所述候选档案对的交互特征信息；

预测模块，配置用于将所述多维度特征信息和所述交互特征信息输入到训练好的机器学习模型中，所述机器学习模型输出所述候选档案对中的两个档案属于同一目标的置信度；

策略模块，配置用于根据所述置信度判断所述候选档案对是否合并成合并档案。

根据本申请的第三方面，提出了一种计算机可读储存介质，其储存有计算机程序，所述计算机程序在被处理器执行时实施如本申请第一方面所述的档案合并方法。

本申请提出了一种档案合并方法、装置及介质，通过获取待合并档案预合并档案的多维度特征信息以及候选档案对的交互特征信息，然后采用机器学习模型来给出两个档案属于同一个目标的置信度，档案合并的准确性更高，合并率也更高，能更有效地缓解档案库中同一目标多个档案的现象。并且通过机器学习模型筛选出置信度满足预设阈值的候选档案对后，将该所有候选档案对构成图网络，利用剪枝策略进行剪枝操作，从而在档案合并的同时实现去重，有着更高的合并率。

附图说明

包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本申请的原理。将容易认识到其它实施例和实施例的很多预期优点，因为通过引用以下详细描述，它们变得被更好地理解。附图的元件不一定是相互按照比例的。同样的附图标记指代对应的类似部件。

图1是根据本申请实施例的档案合并方法流程图；

图2是根据本申请一个具体实施例的剪枝策略示意图；

图3是根据本申请实施例的档案合并装置的结构框图。

具体实施方式

下面将详细描述本申请的各个方面的特征和示例性实施例，为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细描述。应理解，此处所描述的具体实施例仅被配置为解释本申请，并不被配置为限定本申请。对于本领域技术人员来说，本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括......”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

根据本申请的第一方面，提出了一种档案合并方法。图1示出了根据本申请实施例的档案合并方法流程图，如图1所示，该方法包括以下步骤：

S101：获取待合并档案，每个待合并档案包括一张封面图像和多张人脸图像。

在具体的实施例中，封面图像是每个待合并档案中最具代表性(比如图像质量分最高)的图像。获取待合并档案的准则具体如下：1、优先选取新生成的档案；2、优先选取人脸图像数量较多的档案；3、优先选取距离上次被选取时间最长的档案。

S102：根据待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将待合并档案和预合并档案构建成候选档案对。

在具体的实施例中，根据待合并档案的档案特征检索档案库，待合并档案的档案特征为封面图像特性或类中心特征，其中类中心特征用于表征待合并档案中多张人脸图像特征向量的平均向量。若待合并档案采用了封面图像特征来表示档案特征，则用封面图像特征检索档案库；若待合并档案采用了类中心特征来表示档案特征，则用类中心特征检索档案库。

在具体的实施例中，待合并档案检索对象库，可以采用主流的向量检索，包括但不限于向量引擎搜索(milvus)、相似向量检索(faiss)等

在具体的实施例中，根据待合并档案检索档案库，得到对应一个或多个不同相似度的预合并档案；将检索结果中相似度达到第一预设阈值的预合并档案分别与所述并档案构建成候选档案对。这里的第一预设阈值是个较低的阈值，目的只是为了过滤相似度特别低的档案，这些档案往往不会与待合并档案属于同一目标，继续往下走，只会徒增无效的计算量。

在具体的实施例中，可以对检索档案库的检索结果进行分析，判断相似度达到第二预设阈值的预合并档案的数量是否大于第三预设阈值，若是，则只选取相似度达到第二预设阈值的预合并档案分别与待合并档案构建成候选档案对；若否，则只选取检索结果中相似度最大的预合并档案与待合并档案构建成候选档案对。这里的第二预设阈值是一个比较高的阈值，目的是为了判断高相似度的结果是否足够多，若是，则只考虑与高相似度检索结果的预合并档案构成档案对；否则，只考虑与相似度最大的预合并档案构成档案对。这种可选策略，是一种平衡策略，有助于后续减少错误合并。

S103：获取待合并档案和预合并档案的多维度特征信息以及候选档案对的交互特征信息。

在具体的实施例中，待合并档案的多维度特征信息包括但不限于：人脸图像的年龄、性别、是否佩戴口罩、平均质量分、内聚性、图像数量，其中内聚性用于表征档案中任意两张人脸图像特征向量相似度的平均值。

在具体的实施例中，预合并档案的多维度特征信息包括但不限于：检索到的预合并档案的数量、相似度大于第四预设阈值的预合并档案的数量。这里的第四阈值高于第一阈值，该特征用来表征高相似度的检索结果。

在具体的实施例中，候选档案对的交互特征信息包括但不限于：候选档案对中两个档案之间的特征相似度以及两个档案融合后的内聚性、内聚性的减少量、人脸图像平均质量分。

其中：

内聚性计算：假设待识别档案中的人脸图像特征向量为x＝(x₁,x₂,…,x_n)，则内聚性可转化为x和x的内积，即

候选档案对中两个档案融合后的内聚性的计算：

其中，

s_a和s_b分别为两个档案的内聚性，n_a和n_b分别为两个档案中的人脸图像的数量，sim为两个档案的特征相似度。

候选档案对中两个档案融合后内聚性的减少量计算：

s_ab-0.5×(s_a+s_b)。

候选档案对中两个档案融合后人脸图像平均质量分计算：假设待合并档案的人脸图像平均质量分为f_a，人脸图像数量为n_a，预合并档案的人脸图像平均质量分为f_b，人脸图像数量为n_b，则合并后的人脸图像平均质量分为

S104：将多维度特征信息和交互特征信息输入到训练好的机器学习模型中，机器学习模型输出候选档案对中的两个档案属于同一目标的置信度。

在具体的实施例中，在具体的实施例中，采用事先训练好的机器学习模型，输入以上待合并档案和预合并档案的多维度特征信息以及候选档案对的交互特征信息，机器学习模型输出候选档案对中的两个档案属于同一目标的置信度，若置信度达到第五预设阈值，则可进行下一步的档案合并操作。其中，机器学习模型，可以采用集成学习模型，如随机森林、xgboost、lightgbm等建立分类模型。

S105：根据置信度判断候选档案对是否合并成合并档案。

在具体的实施例中，由于不同的候选档案对中，可能存在相同的预合并档案，即不同的待合并档案对应同一个预合并档案。因此还需要通过剪枝策略实现去重，剪枝策略具体如下：

筛选出置信度达到第五预设阈值的所有候选档案对，将该所有候选档案对中的待合并档案和预合并档案构成图网络；将图网络中的所有待合并档案按照人脸图像的数量从大到小排序构建剪枝序列；根据该剪枝序列依次将待合并档案及其关联的所有预合并档案合并成合并档案，并在每次合并后从图网络中移除。

图2示出了根据本申请一个具体实施例的剪枝策略示意图，如图2所示，假设有3个待合并档案对A、B、C，待合并档案A分别与预合并档案A1、A2、A3构成候选档案对，待合并档案B分别与预合并档案A3、B1、B2、B3构成候选档案对，待合并档案C分别与预合并档案B3、C1、C2、C3构成候选档案对，如图左所示。那么，就可以构成如图右中的一个图网络结构。假设待合并档案对A、B、C中的人脸图像数量的关系为：A＞B＞C，那么，构建剪枝序列ABC，根据剪枝序列首先将待合并档案对A与预合并档案A1、A2、A3合并成合并档案1，同时将待合并档案对A、预合并档案A1、A2、A3从图网络中移除。以此类推，直至对3个待合并档案对A、B、C完成合并档案并去重，得到合并档案1、合并档案2和合并档案3。

根据上述的剪枝策略，可以看出，与待合并档案对B关联的预合并档案A3被剪掉，与待合并档案对C关联的预合并档案B3被剪掉。此策略是为了防止档案误合并导致不断往外延拓形成大错误，是一种保守策略。

需要说明的是，在本实施例中，当存在有一个待合并档案，其关联的预合并档案在先前已经全部被剪掉时，即当待合并档案没有预合并档案可以进行合并，那么该待合并档案不作处理，直接作废处理。

需要说明的是，本实施例中的第一预设阈值、第二预设阈值、第三预设阈值、第四预设阈值和第五预设阈值并不作具体的限定，其可以根据实际的档案合并情况进行设定。

综上，本申请的档案合并方法通过获取待合并档案预合并档案的多维度特征信息以及候选档案对的交互特征信息，然后采用机器学习模型来给出两个档案属于同一个目标的置信度，档案合并的准确性更高，合并率也更高，能更有效地缓解档案库中同一目标多个档案的现象。并且通过机器学习模型筛选出置信度满足预设阈值的候选档案对后，将该所有候选档案对构成图网络，利用剪枝策略进行剪枝操作，从而在档案合并的同时实现去重，有着更高的合并率。

根据本申请的第二方面，基于同样的构思，还提出了一种档案合并装置。图3示出了根据本申请实施例的档案合并装置的结构框图，如图3所示，该装置包括：

获取模块201，配置用于获取待合并档案，每个待合并档案包括一张封面图像和多张人脸图像；

检索模块202，配置用于根据待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将待合并档案和所述预合并档案构建成候选档案对；

特征提取模块203，配置用于获取待合并档案和预合并档案的多维度特征信息以及候选档案对的交互特征信息；

预测模块204，配置用于将多维度特征信息和交互特征信息输入到训练好的机器学习模型中，机器学习模型输出所述候选档案对中的两个档案属于同一目标的置信度；

策略模块205，配置用于根据置信度判断候选档案对是否合并成合并档案。

根据本申请的第三方面，基于同样的构思，进一步提出了一种计算机可读储存介质，其储存有计算机程序，该计算机程序在被处理器执行时实施如本申请第一方面的档案合并方法。

在本申请实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置/系统/方法实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

显然，本领域技术人员在不偏离本申请的精神和范围的情况下可以作出对本申请的实施例的各种修改和改变。以该方式，如果这些修改和改变处于本申请的权利要求及其等同形式的范围内，则本申请还旨在涵盖这些修改和改变。词语“包括”不排除未在权利要求中列出的其它元件或步骤的存在。某些措施记载在相互不同的从属权利要求中的简单事实不表明这些措施的组合不能被用于获利。权利要求中的任何附图标记不应当被认为限制范围。

Claims

1.一种档案合并方法，其特征在于，包括：

根据所述置信度判断所述候选档案对是否合并成合并档案。

2.根据权利要求1所述的方法，其特征在于，所述根据所述待合并档案检索档案库，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将所述待合并档案和所述预合并档案构建成候选档案对，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述待合并档案检索档案库，得到包含多张人脸图像的预合并档案，并将所述待合并档案和所述预合并档案构建成候选档案对，还包括：

分析所述检索结果；

5.根据权利要求3所述的方法，其特征在于，所述待合并档案和所述预合并档案的多维度特征信息，包括：

6.根据权利要求5所述的方法，其特征在于，所述候选档案对的交互特征信息，包括：

7.根据权利要求6所述的方法，其特征在于，所述候选档案对中两个档案融合后的内聚性的表达式具体为：

其中，

s_ab-0.5×(s_a+s_b)。

8.根据权利要求3所述的方法，其特征在于，所述根据所述置信度判断所述候选档案对是否合并成合并档案，包括：

9.一种档案合并装置，其特征在于，包括：

10.一种计算机可读储存介质，其储存有计算机程序，所述计算机程序在被处理器执行时实施如权利要求1-8中任一项所述的方法。