WO2021217854A1

WO2021217854A1 - 假阳性过滤方法、装置、设备及存储介质

Info

Publication number: WO2021217854A1
Application number: PCT/CN2020/098974
Authority: WO
Inventors: 陈凯星; 周鑫; 吕传峰
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-04-30
Filing date: 2020-06-29
Publication date: 2021-11-04
Also published as: CN111652277A

Abstract

涉及人工智能技术领域，揭露了一种假阳性过滤方法，该方法包括：通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域（S400）；从模型输出的所述正常区域中采用预设规则确定出初始正常区域（S402）；采用相似度测度算法分别计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距（S404）；根据所述类内距和类间距计算所述被怀疑区域为正常区域的概率（S406）；根据所计算出的概率和选定的阈值过滤出假阳性区域（S408）。还提供一种装置、设备及存储介质。能够利用数据本身的类内和类间差异，通过对比同一待检测图像中正常区域与被怀疑区域间的相似性来区分真假阳性区域，从而对网络学习方式进行补充和优化。

Description

假阳性过滤方法、装置、设备及存储介质

本申请要求于2020年4月30日提交中国专利局、申请号为CN202010369986.5，发明名称为“假阳性过滤方法、电子装置及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种假阳性过滤方法、装置、设备及计算机可读存储介质。

背景技术

随着高性能计算的产生和信息计算的飞速发展，人工智能技术的研究与应用已成为当前学术界和工业界的一个热点，并已成功应用于医疗健康等领域。在医疗健康领域，由于超过90％的医疗数据是来自于医学影像，因此，基于人工智能技术在医学影像领域的应用就具有很多种可能，例如图像分析与病变检查、疾病防治、智能治疗规划与预测等。当然，技术的发展难免会遇到一些痛点问题，而假阳性则是人工智能病灶检测技术的一个普遍痛点。

现有的压制假阳性的方法主要分两类：基于规则的方法或基于网络学习的方法。这两类方法互有优劣：基于规则的方法需要人为归纳有效规则，针对性和可解释性强，但无法根据数据的变化自动归纳。而基于网络学习的方法可以根据数据自我归纳，在训练数据完备的情况下，是简单有效的解决方案。发明人发现在病灶检测的应用中，真阳性(病灶)形态、灰度、纹理千变万化，假阳性则根据网络输入结果不断变化。因此，真假阳性都无法获得完备的训练集。特别是在训练样本和测试样本图像性质不同的情况下，区分真假阳性会出现偏差。

在现实医生阅片过程中，即使图像特性有变化，医生依然能迅速分辨假阳性。究其原因，医生是以同一个序列(case)或单张(slice)图像的被怀疑区域与正常区域的相似性，来判断被怀疑区域是否是真阳性。例如，一个被怀疑区域如果与正常的脑实质十分相似的话，那么这个区域大概率为假阳性。在此基础上，通过模拟医生的上述对比阅片的思路，可以提出一种有效的区分真假阳性的技术。

发明内容

本申请提供一种假阳性过滤方法、装置、设备及存储介质，以解决至少一个上述技术问题。

首先，为实现上述目的，本申请提出一种假阳性过滤方法，该方法包括步骤：

通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域；

从模型输出的所述正常区域中采用预设规则确定出初始正常区域；

采用相似度测度算法分别计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距；

根据所述类内距和类间距计算所述被怀疑区域为正常区域的概率；及

根据所计算出的概率和选定的阈值过滤出假阳性区域。

为了解决上述问题，本申请还提供一种假阳性过滤装置，所述装置包括：

定位模块：用于通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域；

确定模块：用于从模型输出的所述正常区域中采用预设规则确定出初始正常区域；

测度模块：用于采用相似度测度算法分别计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距；

计算模块：用于根据所述类内距和类间距计算所述被怀疑区域为正常区域的概率；及

过滤模块：用于根据所计算出的概率和选定的阈值过滤出假阳性区域。

为了解决上述问题，本申请还提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

根据所计算出的概率和选定的阈值过滤出假阳性区域。

为了解决上述问题，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

根据所计算出的概率和选定的阈值过滤出假阳性区域。

相较于现有技术，本申请所提出的假阳性过滤方法、装置、设备及计算机可读存储介质，可以通过模拟医生对比阅片的思路，利用数据本身的类内和类间差异，通过对比同一待检测图像中正常区域与被怀疑区域间的相似性来区分真假阳性区域，从而对网络学习方式进行补充和优化，有效提高真假阳性分类的成功率和泛化性。

附图说明

图1是本申请计算机设备一可选的硬件架构的示意图；

图2是本申请假阳性过滤装置第一实施例的模块示意图；

图3是本申请假阳性过滤装置第二实施例的模块示意图；

图4是本申请假阳性过滤方法第一实施例的流程示意图；

图5是图4中步骤S402的细化流程示意图；

图6是本申请假阳性过滤方法第二实施例的流程示意图；

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本申请中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

参阅图1所示，是本申请计算机设备2一可选的硬件架构的示意图。

本实施例中，所述计算机设备2可包括，但不仅限于，可通过系统总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是，图1仅示出了具有组件11-13的计算机设备2，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，所述计算机设备2可以是服务器，也可以是进行病灶检测的终端设备等。所述服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备，并且可以是独立的服务器，也可以是多个服务器所组成的服务器集群。

所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器11可以是所述计算机设备2的内部存储单元，例如该计算机设备2的硬盘或内存。在另一些实施例中，所述存储器11也可以是所述计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器11还可以既包括所述计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，所述存储器11通常用于存储安装于所述计算机设备2的操作系统和各类应用软件，例如假阳性过滤程序100的程序代码等。此外，所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述计算机设备2的总体操作。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行所述的假阳性过滤程序100等。

所述网络接口13可包括无线网络接口或有线网络接口，该网络接口13通常用于在所述计算机设备2与其他电子设备之间建立通信连接。

至此，己经详细介绍了本申请相关设备的硬件结构和功能。下面，将基于上述介绍提出本申请的各个实施例。

首先，本申请提出一种假阳性过滤装置200。

参阅图2所示，是本申请假阳性过滤装置200第一实施例的模块图。

本实施例中，所述假阳性过滤装置200包括一系列的存储于存储器11上的计算机程序指令，当该计算机程序指令被处理器12执行时，可以实现本申请各实施例的假阳性过滤操作。在一些实施例中，基于该计算机程序指令各部分所实现的特定的操作，假阳性过滤装置200可以被划分为一个或多个模块。例如，在图2中，所述假阳性过滤装置200可以被分割成定位模块201、确定模块202、测度模块203、计算模块204、过滤模块205。其中：

所述定位模块201，用于通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域。

具体地，对于CT(Computed Tomography，电子计算机断层扫描)、MRI(Magnetic Resonance Imaging，磁共振成像)、PET(Positron Emission Computed Tomography，正电子发射型计算机断层显像)等3D图像模态，每次检查能产生一个序列的图像。所述待检测图像可以是待进行假阳性过滤(区分真假阳性)的case或slice图像。其中，case可理解为序列的意思，一次检查得到的一序列图像就是一个case图像；slice图像可理解为单张图像，一个case图像由多个slice图像组成。

在本实施例中，可以选择任意一个或多个常用的深度神经网络框架进行正常区域或被怀疑区域的学习训练，使训练出的模型能根据输入的数据输出正常区域和被怀疑区域信息。然后利用训练好的深度神经网络模型(病灶检测网络模型)处理case或slice图像，从模型输出中即可定位出正常区域和被怀疑区域。针对每一个case或slice图像，可以定位出一个或多个正常区域以及一个或多个被怀疑区域。

所述确定模块202，用于从模型输出的所述正常区域中采用预设规则确定出初始正常区域。

具体地，由于深度神经网络的学习过程是一个定向认知的过程，它所学到信息仅仅局限在给予它学习的样本，而无法像人一样可通过对比分析当前样本被怀疑区域与正常区域共同特性来排除由噪声或者图像特性的差异带来的干扰。因此，本实施例需要从模型输出结果中进一步确定初始正常区域。

所述初始正常区域可通过以下方式进行确定(即所述预设规则为)：

(1)分别计算模型输出的各个所述正常区域的灰度值；

(2)计算所有所述正常区域的灰度均值；

(3)比较各个所述正常区域的灰度值和所述灰度均值，从中选取灰度值与所述灰度均值差异较小的若干个区域作为所述初始正常区域。

也就是说，分别计算各个所述正常区域的灰度值和所述灰度均值之间的差异值，然后按差异值大小通过升序排序，并按需选择前M个(M为正整数，例如3个)差异值对应的所述正常区域作为初始正常区域。或者，还可以在计算出差异值后，选择差异值小于预设阈值的所述正常区域作为初始正常区域。

所述测度模块203，用于采用相似度测度算法分别计算初始正常区域间的类内距和被怀疑区域与初始正常区域间的类间距。

具体地，所述相似性测度就是比较两个事物的相似性，一般通过计算事物特征之间的距离来衡量。其中，事物的特征可分为低维特征和高维特征，常用的低维特征包括颜色(灰度)、纹理、大小、形状等，常用的相似度测度算法包括欧式距离、曼哈顿距离、余弦相似度等；而高维特征一般通过卷积获得，常用的相似度测度算法包括结构相似性、块匹配等。如果距离小则相似度大，反之，距离大则相似度小。

所述类内距是指分别计算每两个初始正常区域之间的距离。所述类间距是指分别计算每个被怀疑区域与每个初始正常区域之间的距离。

在本实施例中，利用预先设置的或用户选择的某一种相似度测度算法，计算同一case或slice图像中每两个所述初始正常区域之间的距离，这些距离(类内距)的集合用符号P表示；计算同一case或slice图像中每个所述初始正常区域与每个被怀疑区域之间的距离，这些距离(类间距)的集合用符号Q表示。

所述计算模块204，用于根据所计算出的类内距和类间距计算所述被怀疑区域为正常区域的概率。

具体地，计算上述集合P中距离(类内距)的均值μ和标准差σ。然后，以μ和σ作为以下高斯函数的均值和标准差，以集合Q中距离(类间距)作为x代入以下高斯函数公式求取被怀疑区域为正常区域的概率p(x)，概率p(x)越小则表明所述被怀疑区域属于正常区域的可能性越小。

所述过滤模块205，用于根据所计算出的概率和选定的阈值过滤出假阳性区域。

具体地，在计算出所述被怀疑区域为正常区域的概率后，选取阈值进行假阳性区域的过滤，以此达到抑制假阳性的效果。所述假阳性区域即最后被判断为正常区域的所述被怀疑区域，也就是说该区域为正常区域的概率超过(大于或等于)所述阈值。在本实施例中，可根据高斯函数中的3σ原则或者通过在大量样本测试来选取合适的阈值筛选假阳性区域。

所述3σ原则为，先假设一组检测数据只含有随机误差，对其进行计算处理得到标准偏差，按一定概率确定一个区间，认为凡超过这个区间的误差，就不属于随机误差而是粗大误差，含有该粗大误差的数据应予以剔除。3σ原则是最常用也是最简单的粗大误差判别准则，它一般应用于测量次数充分多(n≥30)做判别时的情况。在本实施例中就是测试充分多的case或者slice图像，然后取一个合适的区间，将误差在这个区间外的作为假阳性。所述通过在大量样本测试来选取合适的阈值就是通过测试足够多的数据，然后分析结果，选择一个压制假阳性效果好的阈值。

由于医学影像有多种成像方式，且成像的设备、设备厂商及环境的不同都造成图像特性存在差异，数据收集时往往无法涵盖所有数据特性，因此训练的网络容易在遇到不同特性的图像时出现检测错误。本实施例是模拟医生的阅片思路，从case或slice层面去比对被怀疑区域与正常区域间的相似性来筛选目标，该处理过程更具合理性和科学依据，可以有效提高真假阳性样本分类的成功率和泛化性，从而更好地压制假阳性。

本实施例提供的假阳性过滤装置，可以利用数据本身的类内和类间差异，通过对比同一case或slice图像中正常区域与被怀疑区域间的相似性来压制假阳性，不仅避免了数据差异造成的性能的不稳定，而且还利用了正常区域信息，可以对网络学习方式进行补充和优化。另外，相比通过搜集样本进行深度学习的压制假阳性策略，本实施例可以泛化于不同特性的图像上，从而降低了数据搜集的难度。并且，本实施例可以接在任意病灶检测网络模型后，作为对网络模型输出结果的简单补充，因此具有普适性和即插即用的优点。

参阅图3所示，是本申请假阳性过滤装置200第二实施例的模块图。本实施例中，所述的假阳性过滤装置200除了包括第一实施例中的所述定位模块201、确定模块202、测度模块203、计算模块204、过滤模块205之外，还包括对比模块206。

所述对比模块206，用于通过对比多种备选的相似度测度算法来选定最佳的相似度测度算法。

在本实施例中，最佳的相似性测度方法的确定是通过对比各种相似性测度方法在所述初始正常区域结构上的表现，选取能够使得所述初始正常区域结构在低维或高维特征层面类内距最小的相似性测度方法作为后续区分真假阳性的计算方法。在前期可以采用所有常用特征去计算距离，判断哪些特征对于区分真假阳性是有效的，后期就选择使用这些有效的特征。

例如，选择四个低维特征(颜色、纹理、大小、形状)作为判断依据，备选的相似度测度算法包括欧式距离、曼哈顿距离、余弦相似度三种。根据所选择的特征，分别采用这三种备选的相似度测度算法计算所述初始正常区域的类内距，然后从中选出类内距最小的一种相似度测度算法，作为所述最佳的相似度测度算法。后续则采用所述最佳的相似度测度算法分别计算所述初始正常区域间的类内距以及被怀疑区域与所述初始正常区域间的类间距。其中：

(1)欧式距离计算公式：

其中k表示特征的维度，xi、yi分别表示两个特征向量中对应的元素。

(2)曼哈顿距离计算公式：

D＝|x _i-y _i|,i∈k

(3)余弦相似度测度算法采用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小，计算公式为：

其中A、B代表特征向量。

值得注意的是，当所述深度神经网络模型不变时，通过所述对比模块206选定最佳的相似度测度算法后，后续均可采用该最佳的相似度测度算法来进行计算；若所述深度神经网络模型发生改变，则需要再次重新选定最佳的相似度测度算法。

在本实施例中，所述测度模块203利用所述对比模块206选定的所述最佳的相似度测度算法分别计算初始正常区域间的类内距和被怀疑区域与初始正常区域间的类间距。

本实施例提供的假阳性过滤装置，可以通过对比多种备选的相似度测度算法在所述初始正常区域结构上的表现，选取能够使得所述初始正常区域结构在低维或高维特征层面类内距最小的相似性测度方法作为后续区分真假阳性的计算方法，使得针对同一case或slice图像中正常区域与被怀疑区域间的相似性测度更加有效，从而提升后续对于假阳性区域的判断结果的准确性，优化过滤效果。

此外，本申请还提出一种假阳性过滤方法。

参阅图4所示，是本申请假阳性过滤方法第一实施例的流程示意图。在本实施例中，根据不同的需求，图4所示的流程图中的步骤的执行顺序可以改变，某些步骤可以省略。该方法包括：

步骤S400，通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域。

具体地，对于CT、MRI、PET等3D图像模态，每次检查能产生一个序列的图像。所述待检测图像可以是待进行假阳性过滤(区分真假阳性)的case或slice图像。其中，case可理解为序列的意思，一次检查得到的一序列图像就是一个case图像；slice图像可理解为单张图像，一个case图像由多个slice图像组成。

步骤S402，从模型输出的所述正常区域中采用预设规则确定出初始正常区域。

在本实施例中，所述预设规则可以是根据各个所述正常区域的灰度值与其均值之间的差异，选取差异较小的若干个所述正常区域作为所述初始正常区域。

进一步参阅图5所示，所述步骤S402具体包括：

步骤S4020，分别计算模型输出的各个所述正常区域的灰度值。

步骤S4022，计算所有所述正常区域的灰度均值。

也就是说，将上一步计算得到的各个所述正常区域的灰度值求平均值。

步骤S4024，分别计算各个所述正常区域的灰度值和所述灰度均值之间的差异值。

步骤S4026，选取差异值较小的若干个所述正常区域作为所述初始正常区域。

其中，可以按差异值大小将所述正常区域通过升序排序，并按需选择前M个(M为正整数，例如3个)差异值对应的所述正常区域作为初始正常区域。或者，还可以在计算出差异值后，选择差异值小于预设阈值的所述正常区域作为初始正常区域。

回到图4，步骤S404，采用相似度测度算法分别计算初始正常区域间的类内距和被怀疑区域与初始正常区域间的类间距。

步骤S406，根据所计算出的类内距和类间距计算所述被怀疑区域为正常区域的概率。

步骤S408，根据所计算出的概率和选定的阈值过滤出假阳性区域。

本实施例提供的假阳性过滤方法，可以利用数据本身的类内和类间差异，通过对比同一case或slice图像中正常区域与被怀疑区域间的相似性来压制假阳性，不仅避免了数据差异造成的性能的不稳定，而且还利用了正常区域信息，可以对网络学习方式进行补充和优化。另外，相比通过搜集样本进行深度学习的压制假阳性策略，本实施例可以泛化于不同特性的图像上，从而降低了数据搜集的难度。并且，本实施例可以接在任意病灶检测网络模型后，作为对网络模型输出结果的简单补充，因此具有普适性和即插即用的优点。

如图6所示，是本申请假阳性过滤方法的第二实施例的流程示意图。本实施例中，所述假阳性过滤方法在第一实施例的基础上，还包括步骤S504。

该方法包括以下步骤：

步骤S500，通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域。

步骤S502，从模型输出的所述正常区域中采用预设规则确定出初始正常区域。

在本实施例中，所述预设规则可以是根据各个所述正常区域的灰度值与其均值之间的差异，选取差异较小的若干个所述正常区域作为所述初始正常区域。该步骤的具体过程参见图5及相关说明，在此不再赘述。

步骤S504，通过对比多种备选的相似度测度算法来选定最佳的相似度测度算法。

例如，选择四个低维特征(颜色、纹理、大小、形状)作为判断依据，备选的相似度测度算法包括欧式距离、曼哈顿距离、余弦相似度三种。根据所选择的特征，分别采用这三种备选的相似度测度算法计算所述初始正常区域的类内距，然后从中选出类内距最小的一种相似度测度算法，作为所述最佳的相似度测度算法。后续则采用所述最佳的相似度测度算法分别计算所述初始正常区域间的类内距以及被怀疑区域与所述初始正常区域间的类间距。

其中：

(1)欧式距离计算公式：

(2)曼哈顿距离计算公式：

D＝|x _i-y _i|,i∈k

其中A、B代表特征向量。

值得注意的是，当所述深度神经网络模型不变时，通过该步骤选定最佳的相似度测度算法后，后续均可采用该最佳的相似度测度算法来进行计算；若所述深度神经网络模型发生改变，则需要再次重新选定最佳的相似度测度算法。

在本实施例中，后续利用该步骤选定的所述最佳的相似度测度算法进行类内距和类间距的计算。

步骤S506，采用所述最佳的相似度测度算法分别计算初始正常区域间的类内距和被怀疑区域与初始正常区域间的类间距。

在本实施例中，利用所选定的所述最佳的相似度测度算法，计算同一case或slice图像中每两个所述初始正常区域之间的距离，这些距离(类内距)的集合用符号P表示；计算同一case或slice图像中每个所述初始正常区域与每个被怀疑区域之间的距离，这些距离(类间距)的集合用符号Q表示。

步骤S508，根据所计算出的类内距和类间距计算所述被怀疑区域为正常区域的概率。

步骤S510，根据所计算出的概率和选定的阈值过滤出假阳性区域。

本实施例提供的假阳性过滤方法，可以通过模拟医生对比阅片的思路，提出一种通过使用同一个case或slice图像中的正常区域结构为背景来区分真假阳性的技术，有效提高真假阳性分类的成功率和泛化性。并且，还可以通过对比多种备选的相似度测度算法在所述初始正常区域结构上的表现，选取能够使得所述初始正常区域结构在低维或高维特征层面类内距最小的相似性测度方法作为后续区分真假阳性的计算方法，使得针对同一case或slice图像中正常区域与被怀疑区域间的相似性测度更加有效，从而提升后续对于假阳性区域的判断结果的准确性，优化过滤效果。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性，所述计算机可读存储介质存储有假阳性过滤程序，所述假阳性过滤程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述的假阳性过滤方法的步骤。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种假阳性过滤方法，其中，所述方法包括步骤：

通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域；

从模型输出的所述正常区域中采用预设规则确定出初始正常区域；

采用相似度测度算法分别计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距；

根据所述类内距和类间距计算所述被怀疑区域为正常区域的概率；及

根据所计算出的概率和选定的阈值过滤出假阳性区域。
如权利要求1所述的假阳性过滤方法，其中，该方法在计算所述类内距和类间距之前还包括步骤：

通过对比多种备选的相似度测度算法，选取使所述初始正常区域类内距最小的相似性测度方法作为最佳的相似度测度算法，并在所述计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距的步骤中采用所述最佳的相似度测度算法。
如权利要求1或2所述的假阳性过滤方法，其中，所述待检测图像为待进行假阳性过滤的序列图像或单张图像。
如权利要求3所述的假阳性过滤方法，其中，所述类内距为同一序列图像或单张图像中每两个所述初始正常区域之间的距离；所述类间距为同一序列图像或单张图像中每个所述被怀疑区域与每个所述初始正常区域间之间的距离。
如权利要求1或2所述的假阳性过滤方法，其中，所述从模型输出的所述正常区域中采用预设规则确定出初始正常区域的步骤包括：

分别计算模型输出的各个所述正常区域的灰度值；

计算所有所述正常区域的灰度均值；

分别计算各个所述正常区域的灰度值和所述灰度均值之间的差异值；

选取差异值较小的若干个所述正常区域作为所述初始正常区域。
如权利要求5所述的假阳性过滤方法，其中，所述选取差异值较小的若干个所述正常区域作为所述初始正常区域的步骤包括：

按差异值大小将所述正常区域通过升序排序，并按需选择前M个差异值对应的所述正常区域作为所述初始正常区域，其中M为正整数；或者

选择差异值小于预设阈值的所述正常区域作为所述初始正常区域。
如权利要求1或2所述的假阳性过滤方法，其中，所述根据所计算出的概率和选定的阈值过滤出假阳性区域的步骤包括：

根据高斯函数中的3σ原则选取所述阈值，将所述概率大于或等于所述阈值的所述被怀疑区域确定为假阳性区域。
一种假阳性过滤装置，其中，所述装置包括：

定位模块：用于通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域；

确定模块：用于从模型输出的所述正常区域中采用预设规则确定出初始正常区域；

测度模块：用于采用相似度测度算法分别计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距；

计算模块：用于根据所述类内距和类间距计算所述被怀疑区域为正常区域的概率；及过滤模块：用于根据所计算出的概率和选定的阈值过滤出假阳性区域。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如下步骤：

通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域；

从模型输出的所述正常区域中采用预设规则确定出初始正常区域；

采用相似度测度算法分别计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距；

根据所述类内距和类间距计算所述被怀疑区域为正常区域的概率；及

根据所计算出的概率和选定的阈值过滤出假阳性区域。
如权利要求9所述的计算机设备，其中，在计算所述类内距和类间距之前所述处理器执行所述计算机程序时还实现如下步骤：

通过对比多种备选的相似度测度算法，选取使所述初始正常区域类内距最小的相似性测度方法作为最佳的相似度测度算法，并在所述计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距的步骤中采用所述最佳的相似度测度算法。
如权利要求9或10所述的计算机设备，其中，所述待检测图像为待进行假阳性过滤的序列图像或单张图像。
如权利要求11所述的计算机设备，其中，所述类内距为同一序列图像或单张图像中每两个所述初始正常区域之间的距离；所述类间距为同一序列图像或单张图像中每个所述被怀疑区域与每个所述初始正常区域间之间的距离。
如权利要求9或10所述的计算机设备，其中，所述从模型输出的所述正常区域中采用预设规则确定出初始正常区域的步骤包括：

分别计算模型输出的各个所述正常区域的灰度值；

计算所有所述正常区域的灰度均值；

分别计算各个所述正常区域的灰度值和所述灰度均值之间的差异值；

选取差异值较小的若干个所述正常区域作为所述初始正常区域。
如权利要求13所述的计算机设备，其中，所述选取差异值较小的若干个所述正常区域作为所述初始正常区域的步骤包括：

按差异值大小将所述正常区域通过升序排序，并按需选择前M个差异值对应的所述正常区域作为所述初始正常区域，其中M为正整数；或者

选择差异值小于预设阈值的所述正常区域作为所述初始正常区域。
如权利要求9所述的计算机设备，其中，所述根据所计算出的概率和选定的阈值过滤出假阳性区域的步骤包括：

根据高斯函数中的3σ原则选取所述阈值，将所述概率大于或等于所述阈值的所述被怀疑区域确定为假阳性区域。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

通过深度神经网络模型处理待检测图像，定位出正常区域和被怀疑区域；

从模型输出的所述正常区域中采用预设规则确定出初始正常区域；

采用相似度测度算法分别计算所述初始正常区域间的类内距和所述被怀疑区域与所述初始正常区域间的类间距；

根据所述类内距和类间距计算所述被怀疑区域为正常区域的概率；及

根据所计算出的概率和选定的阈值过滤出假阳性区域。
如权利要求16所述的计算机可读存储介质，其中，所述待检测图像为待进行假阳性过滤的序列图像或单张图像。
如权利要求17所述的计算机可读存储介质，其中，所述类内距为同一序列图像或单张图像中每两个所述初始正常区域之间的距离；所述类间距为同一序列图像或单张图像中每个所述被怀疑区域与每个所述初始正常区域间之间的距离。
如权利要求16所述的计算机可读存储介质，其中，所述从模型输出的所述正常区域中采用预设规则确定出初始正常区域的步骤包括：

分别计算模型输出的各个所述正常区域的灰度值；

计算所有所述正常区域的灰度均值；

分别计算各个所述正常区域的灰度值和所述灰度均值之间的差异值；

选取差异值较小的若干个所述正常区域作为所述初始正常区域。
如权利要求16所述的计算机可读存储介质，其中，所述根据所计算出的概率和选定的阈值过滤出假阳性区域的步骤包括：

根据高斯函数中的3σ原则选取所述阈值，将所述概率大于或等于所述阈值的所述被怀疑区域确定为假阳性区域。