CN115564712B

CN115564712B - 基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法

Info

Publication number: CN115564712B
Application number: CN202211091243.1A
Authority: CN
Inventors: 涂继辉; 刘琛; 邱威; 王云龙; 江堃; 张庆; 郑欢
Original assignee: Yangtze University
Current assignee: Yangtze University
Priority date: 2022-09-07
Filing date: 2022-09-07
Publication date: 2023-07-18
Anticipated expiration: 2042-09-07
Also published as: CN115564712A

Abstract

本发明提供一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，包括以下步骤：S1、选取连续的三帧图像，利用孪生网络模型获取每帧图像的特征图；S2、计算各个特征图之间的欧式距离；S3、利用逻辑回归模型根据欧式距离判断图像之间的相似性，从相似的图像中仅保留一张，或者保留不相似的图像；S4、从去除冗余后的图像中选择帧数在后的图像和新的连续帧图像，执行步骤S1~S3；通过以上步骤实现将胶囊内窥镜视频图像冗余帧删除。与现有技术相比，能够可靠的去除胶囊内窥镜视频图像冗余帧，而且能够避免丢失用于给医师辅助诊断的关键的图像信息。经测算，本发明中，每张图片的处理速度为0.017秒，能够满足实时处理的需求。

Description

基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法

技术领域

本发明涉及医疗图像处理领域，特别是一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法。

背景技术

消化道疾病，如溃疡、出血和肿瘤等极大地危害着人们的健康。造成消化系统癌症多发的最主要原因仍然是早期诊断率低，传统检测手段是依靠机械推入式的内窥镜很难到达胃肠道的理想位置，诊断过程中因其舒适性差会对患者身体造成伤害和痛苦，使得患者产生畏惧心理，从而放弃检查，错失了最佳治疗时机。无线胶囊内窥镜(Wireless CapsuleEndoscopy,WCE)技术具有无痛、无创、无不适、无需麻醉等优点，同时还能深入到传统推入式内窥镜难以到达的小肠部分区域进行检查，为消化道疾病提供了一种新的检测手段。随着第一粒胶囊问世以来，胶囊内窥镜在临床应用得到了快速的增长。人的消化道较长，胶囊内窥镜在体内工作时间长达8小时左右，在此期间，胶囊内窥镜会产生每秒12-24帧的视频，即每位患者会有5-6万张24位的海量彩色图像，但病变图像所占比例不到整个图像的1％，为了减少漏诊和误诊，医生往往要重复检查，工作量极大，识别效率极低。此外，这些图像里还包含20％无效干扰内容，例如气泡、食物残渣和胆汁等，审阅这些图片会浪费医生大量的时间。由于人工判读效率低下，会直接影响到胶囊内窥镜大规模的使用，不利于胶囊内窥镜的推广与长期发展。因此需要迫切寻找一种低误检、低漏检、高效率且顾及到对海量的内窥镜图像冗余帧去除的方法。中国专利文献CN101584571A记载了一种胶囊内镜辅助读片方法，其中记载了训练一个病灶部位分类器，为识别病灶部位做准备，并记载了应用模式识别技术，删除内镜图片序列中相似度较高的冗余帧。即其采用了先识别病灶再去除冗余帧的方案，但是其并未记载具体的方案，因此并不足以进行实施。

发明内容

本发明所要解决的技术问题是提供一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，能够有效的去除胶囊内窥镜视频图像冗余帧，避免丢失用于辅助医师诊断病情的关键数据，且去除冗余帧的速度较快，效率较高。

为解决上述技术问题，本发明所采用的技术方案是：一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，包括以下步骤：

S1、选取连续的三帧图像，利用孪生网络模型获取每帧图像的特征图；

S2、计算各个特征图之间的欧式距离；

S3、利用逻辑回归模型根据欧式距离判断图像之间的相似性，从相似的图像中仅保留一张，或者保留不相似的图像；

S4、从去除冗余后的图像中选择帧数在后的图像和新的连续帧图像，执行步骤S1～S3；

通过以上步骤实现将胶囊内窥镜视频图像冗余帧删除。

优选的方案中，还包括孪生网络模型的训练步骤：

S01、在孪生网络模型的训练数据集中，选择一张胶囊内窥镜图片作为锚样本，再选择一张与锚样本相似的图片作为正样本和一张与锚样本不相似的图片作为负样本；

S02、使用ResNet-50模型提取步骤S01中选择的三张胶囊内窥镜图像特征；

S03，计算锚样本与正样本之间的欧式距离和锚样本与负样本之间的欧式距离；

S04，利用逻辑回归算法判定锚样本与正样本和锚样本与负样本之间的相似性；

通过以上步骤得到孪生网络模型。

优选的方案中，步骤S01中，将锚样本、正样本和负样本三张图片组成一个三元组(I_a，I_p，I_n)，并进行归一化处理。

优选的方案中，步骤S02中，将步骤S01中归一化处理后的三元组(I_a，I_p，I_n)，采用孪生网络模型进行特征提取得到3个特征图(F_A，F_P，F_N)；

其中，F_A∈R^C×H×W，F_A∈R^C×H×W，F_A∈R^C×H×W，C代表通道数，H代表特征图的高，W代表特征图的宽。

优选的方案中，步骤S03中，提取图像特征欧式距离的步骤为：

设锚样本I_a与正样本I_p的欧式距离为D(A，P)，锚样本I_a与负样本I_n的欧式距离为D(A，N)，采用以下公式计算：

其中，F_A(k，i，j)、F_N(k，i，j)和F_P(k，i，j)分别表示锚样本、负样本和正样本的特征图在第k个通道，行为i，列为j处的像素值。

优选的方案中，设三元损失函数(Tripletloss)为L_Tri(F_A，F_P，F_N)，损失函数的表达式为：

L_Tri(F_A，F_P，F_N)＝max(D(A，P)-D(A，N)+margin，0)；

其中，参数margin表示D(A，P)和D(A，N)之间间隔的程度；margin越大，就越容易区分D(A，P)和D(A，N)。

优选的方案中，取margin＝0.5。

优选的方案中，利用逻辑回归算法判定图像之间的相似性，具体流程如下：

设2m张序列图像相似性的标签为Y，1表示相似，0表示不相似，即Y∈{0，1}，两张图像之间的相似度为D＝{d₀，d₁，d₂，...，d_m-1}，对应的标签为Y＝{y₀，y₁，y₂，...，y_m-1}，逻辑回归模型的公式为：

Y＝g(D)；

其中，g为逻辑回归sigmoid函数，sigmoid函数的计算公式为：

逻辑回归算法使用交叉熵(Cross Entropy)作为损失函数，设为L_CE(g(d_i)，y_i)，如以下公式：

其中，lg表示以10为底的对数。

优选的方案如步骤S3中：设w张胶囊内窥镜视频图像序列为V：{V₀，V₁，V₂，...，V_w-1}，去冗余帧后的胶囊内窥镜视频图像序列为V′：{V′₀，V′₁，V′₂，...}，具体流程如下：

S11、选取连续的三帧胶囊内窥镜图像{V_i，V_i+1，V_i+2}，得到每帧胶囊内窥镜的特征图F′：{F′_i，F′_i+1，F′_i+2}，初始i＝0；

S12、计算F′_i与F′_i+1的欧式距离和F′_i+1与F′_i+2的欧式距离D′：{D′(F′_i，F′_i+1)，D′(F′_i+1，F′_i+2)}；

S13、将D′：{D′(F′_i，F′_i+1)，D′(F′_i+1，F′i₊₂)}输入训练好的逻辑回归模型中判定图片的相似性Y′：{g(D′(F′_i，F′_i+1))，_g(D′(F′_i+1，F′i₊₂))}，得到3种相似性的情况Y′∈{Y′₀，Y′₁，Y′₂}；

其中，Y′₀＝{1，1}表示选取的3张内窥镜图像中V_i与V_i+1相似、V_i+1与V_i+2相似，Y′₁＝{0，1}表示选取的3张内窥镜图像中V_i与V_i+1不相似、V_i+1与V_i+2相似，Y′₂＝{1，0}表示选取的3张内窥镜图像中V_i与V_i+1相似、V_i+1与V_i+2不相似；

根据Y′的3种情况(Y′₀，Y′₁，Y′₂)，得到以下3种的去冗余帧的方法：

其中，B0＝{V_i}表示选取的3张内窥镜图像中当V_i与V_i+1相似、V_i+1与V_i+2相似时，去除V_i+1与V_i+2，保留V_i；B₁＝{V_i，V_i+1}表示选取的3张内窥镜图像中当V_i与V_i+1不相似，V_i+1与V_i+2相似时，去除V_i+2，保留V_i与V_i+1；B₂＝{V_i，V_i+2}表示选取的3张内窥镜图像中当V_i与V_i+1相似、V_i+1与V_i+2不相似时，去除V_i+1，保留V_i与V_i+2。

优选的方案如步骤S4中还包括以下步骤：

S21、判断此时是否处理结束，即i+2是小于w-1还是等于w-1；若(i+2)<(w-1)，则表示未处理结束，跳转至步骤S21；

若(i+2)＝(w-1)，则表示处理结束，跳转至S33。

S22、根据步骤S13中的3种的去冗余帧的方法，来选取新一轮的三张内窥镜图像；

选取规则为：若去冗余输出为B0＝{V_i}，则将图像V_i放入去冗余帧后的胶囊内窥镜视频图像序列V′中，并选取图像V_i、图像V_i+3和图像V_i+4作为新一轮的三张内窥镜图像；若去冗余输出为B₁＝{V_i，V_i+1}，将图像V_i和V_i+1放入去冗余帧的胶囊内窥镜视频图像序列V′中，并选取图像Vi₊₁、图像V_i+3和图像V_i+4作为新一轮的三张内窥镜图像；若去冗余输出为B₂＝{V_i，V_i+2}，则将图像V_i和V_i+2放入去冗余帧的胶囊内窥镜视频图像序列V′中，并选取图像V_i+2、图像V_i+3和图像V_i+4作为新一轮的三张内窥镜图像；

将选取的新一轮三张内窥镜图像重复步骤s21～s22；

S23、处理结束，生成去冗余帧后的胶囊内窥镜视频图像序列V′：{V′₀，V′₁，V′₂，...}。

本发明提供了一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，与现有技术相比，能够可靠的去除胶囊内窥镜视频图像冗余帧，而且能够避免丢失用于给医师辅助诊断的关键的图像信息。经测算，本发明中，每张图片的处理速度为0.017秒，能够满足实时处理的需求，测试服务器采用的GPU为英伟达2080ti芯片。

附图说明

下面结合附图和实施例对本发明作进一步说明：

图1为本发明的图像特征提取流程图。

图2为本发明的总体流程图。

图3为胶囊内窥镜视频图像连续帧的图像。

图4为本发明去除冗余帧后的图片。

具体实施方式

一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，包括以下步骤：

如图1中所示，S1、选取连续的三帧图像，利用孪生网络模型获取每帧图像的特征图；

S2、计算各个特征图之间的欧式距离；

S4、从去除冗余后的图像中选择帧数在后的图像和新的连续帧图像，执行步骤S1～S3，直至完成对全部胶囊内窥镜视频图像的比较；

通过以上步骤实现将胶囊内窥镜视频图像冗余帧删除。

优选的方案如图2中，还包括孪生网络模型的训练步骤：

S02、如图1中所示，优选使用ResNet-50网络模型提取步骤S01中选择的三张胶囊内窥镜图像特征；另可选的方案中，也可以采用VGG16、InceptionV3、Xception网络模型，但是经过比较，本项目中ResNet-50网络模型具有更高准确率，对最终的结果的准确率贡献较高。

通过以上步骤得到孪生网络模型。

优选的方案中，步骤S01中，将锚样本、正样本和负样本三张图片组成一个三元组(I_a，I_p，I_n)，优选的，将选择的锚样本、正样本和负样本比例缩放为224×224并转化为张量形式，并进行归一化处理。

其中，I_A表示锚样本处理后的数据，I_a表示锚样本的张量形式，I_amin表示锚样本像素点的最小值，I_amax表示锚样本像素点的最大值；I_P表示正样本处理后的数据，I_p表示正样本的张量形式，I_pmin表示正样本像素点的最小值，I_pmax表示正样本像素点的最大值；I_N表示负样本处理后的数据，I_n表示负样本的张量形式，I_nmin表示负样本像素点的最小值，I_nmax表示负样本像素点的最大值。

其中，F_A∈R^C×H×W，F_A∈R^C×H×W，F_A∈R^C×H×W，C代表通道数，优选的本例取值为2048，H代表特征图的高，本例中取值7，W代表特征图的宽，本例中取值7。

L_Tri(F_A，F_P，F_N)＝max(D(A，P)-D(A，N)+margin，0) (6)；

优选的方案中，本例取margin＝0.5。

y＝g(D) (7)；

其中，g为逻辑回归sigmoid函数，sigmoid函数的计算公式为：

其中，lg表示以10为底的对数。

优选的方案如步骤S1～S3中：设w张胶囊内窥镜视频图像序列为V：{V₀，V₁，V₂，...，V_w-1}，去冗余帧后的胶囊内窥镜视频图像序列为V′：{V′₀，V′₁，V′₂，...}，具体流程如下：

S13、将D′：{D′(F′_i，F′_i+1)，D′(F′_i+1，F′_i+2)}输入训练好的逻辑回归模型中判定图片的相似性Y′：{g(D′(F′_i，F′_i+1))，g(D′(F′_i+1，F′_i+2))}，得到3种相似性的情况Y′∈{Y′₀，Y′₁，Y′₂}；

其中，Y′₀＝{1，1}表示选取的3张内窥镜图像中V_i与V_i+1相似、V_i+1与V_i+2相似，Y′₁＝{0，1}表示选取的3张胶囊内窥镜图像中V_i与V_i+1不相似、V_i+1与V_i+2相似，Y′₂＝{1，0}表示选取的3张内窥镜图像中V_i与V_i+1相似、V_i+1与V_i+2不相似；

其中，B0＝{V_i}表示选取的3张胶囊内窥镜图像中当V_i与V_i+1相似、V_i+1与V_i+2相似时，去除V_i+1与V_i+2，保留V_i；B₁＝{V_i，V_i+1}表示选取的3张胶囊内窥镜图像中当V_i与V_i+1不相似，V_i+1与V_i+2相似时，去除V_i+2，保留V_i与V_i+1；B₂＝{V_i，V_i+2}表示选取的3张内窥镜图像中当V_i与V_i+1相似、V_i+1与V_i+2不相似时，去除V_i+1，保留V_i与V_i+2。

优选的方案如步骤S4中还包括以下步骤：

若(i+2)＝(w-1)，则表示处理结束，跳转至S23。

S22、根据步骤S13中的3种的去冗余帧的方法，来选取新一轮的三张胶囊内窥镜图像；

选取规则为：若去冗余输出为B0＝{V_i}，则将图像V_i放入去冗余帧后的胶囊内窥镜视频图像序列V′中，并选取图像V_i、图像V_i+3和图像V_i+4作为新一轮的三张胶囊内窥镜图像；若去冗余输出为B₁＝{V_i，V_i+1}，将图像V_i和V_i+1放入去冗余帧的胶囊内窥镜视频图像序列V′中，并选取图像V_i+1、图像V_i+3和图像V_i+4作为新一轮的三张内窥镜图像；若去冗余输出为B₂＝{V_i，V_i+2}，则将图像V_i和V_i+2放入去冗余帧的胶囊内窥镜视频图像序列V′中，并选取图像V_i+2、图像V_i+3和图像V_i+4作为新一轮的三张胶囊内窥镜图像；

将选取的新一轮三张内窥镜图像重复步骤s21～s22；

S23、处理结束，生成去冗余帧后的胶囊内窥镜视频图像序列V′：{V′₀，V′₁，V′₂，...}。如图4中所示。

上述的实施例仅为本发明的优选技术方案，而不应视为对于本发明的限制，本申请中的实施例及实施例中的特征在不冲突的情况下，可以相互任意组合。本发明的保护范围应以权利要求记载的技术方案，包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围。即在此范围内的等同替换改进，也在本发明的保护范围之内。

Claims

1.一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，其特征是包括以下步骤：

还包括孪生网络模型的训练步骤：

通过以上步骤得到孪生网络模型；

S2、计算各个特征图之间的欧式距离；

设w张胶囊内窥镜视频图像序列为V：{V₀，V₁，V₂，...，V_w-1}，去冗余帧后的胶囊内窥镜视频图像序列为V′：{V′₀，V′₁，V′₂，...}，具体流程如下：

S13、将D′：{D′(F′_i，F′_i+1)，D′(F′_i+1，F′_i+2)}输入训练好的逻辑回归模型中判定图片的相似性Y，：{g(D′(F′_i，F′_i+1))，g(D′(F′_i+1，F′_i+2))}，得到3种相似性的情况Y′∈{Y′₀，Y′₁，Y′₂}；

其中，B₀＝{V_i}表示选取的3张内窥镜图像中当V_i与V_i+1相似、V_i+1与V_i+2相似时，去除V_i+1与V_i+2，保留V_i；B₁＝{V_i，V_i+1}表示选取的3张内窥镜图像中当V_i与V_i+1不相似，V_i+1与V_i+2相似时，去除V_i+2，保留V_i与V_i+1；B₂＝{V_i，V_i+2}表示选取的3张内窥镜图像中当V_i与V_i+1相似、V_i+1与V_i+2不相似时，去除V_i+1，保留V_i与V_i+2；

还包括以下步骤：

S21、判断此时是否处理结束，即i+2是小于w-1还是等于w-1；若(i+2)＜(w-1)，则表示未处理结束，跳转至步骤S22；

若(i+2)＝(w-1)，则表示处理结束，跳转至S23；

选取规则为：若去冗余输出为B₀＝{V_i}，则将图像V_i放入去冗余帧后的胶囊内窥镜视频图像序列V′中，并选取图像V_i、图像V_i+3和图像V_i+4作为新一轮的三张内窥镜图像；若去冗余输出为B₁＝{V_i，V_i+1}，将图像V_i和V_i+1放入去冗余帧的胶囊内窥镜视频图像序列V′中，并选取图像V_i+1、图像V_i+3和图像V_i+4作为新一轮的三张内窥镜图像；若去冗余输出为B₂＝{V_i，V_i+2}，则将图像V_i和V_i+2放入去冗余帧的胶囊内窥镜视频图像序列V′中，并选取图像V_i+2、图像V_i+3和图像V_i+4作为新一轮的三张内窥镜图像；

将选取的新一轮三张内窥镜图像重复步骤s21～s22；

S23、处理结束，生成去冗余帧后的胶囊内窥镜视频图像序列V′：{V′₀，V′₁，V′₂，...}；

通过以上步骤实现将胶囊内窥镜视频图像冗余帧删除。

2.根据权利要求1所述的一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，其特征是：步骤S01中，将锚样本、正样本和负样本三张图片组成一个三元组(I_a，I_p，I_n)，并进行归一化处理。

3.根据权利要求2所述的一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，其特征是：步骤S02中，将步骤S01中归一化处理后的三元组(I_a，I_p，I_n)，采用孪生网络模型进行特征提取得到3个特征图(F_A，F_P，F_N)；

4.根据权利要求2所述的一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，其特征是：步骤S03中，提取图像特征欧式距离的步骤为：

5.根据权利要求4所述的一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，其特征是：设三元损失函数为L_Tri(F_A，F_P，F_N)，损失函数的表达式为：

L_Tri(F_A，F_P，F_N)＝max(D(A，P)-D(A，N)+margin，0)；

6.根据权利要求5所述的一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，其特征是：取margin＝0.5。

7.根据权利要求5或6所述的一种基于孪生网络的胶囊内窥镜视频图像冗余帧去除的方法，其特征是：利用逻辑回归算法判定图像之间的相似性，具体流程如下：

Y＝g(D)；

其中，g为逻辑回归sigmoid函数，sigmoid函数的计算公式为：

逻辑回归算法使用交叉熵作为损失函数，设为L_CE(g(d_i)，y_i)，以下公式：

其中，lg表示以10为底的对数。