WO2024055805A1

WO2024055805A1 - 数据检索方法、影像数据检索方法及装置

Info

Publication number: WO2024055805A1
Application number: PCT/CN2023/113590
Authority: WO
Inventors: 李超; 付奎; 安山; 王虎
Original assignee: 北京京东拓先科技有限公司
Priority date: 2022-09-15
Filing date: 2023-08-17
Publication date: 2024-03-21
Also published as: CN115410717B; CN115410717A

Abstract

提供了一种数据检索方法、影像数据检索方法及上述方法的装置、存储介质、计算机程序产品和计算机程序。该数据检索方法包括获取所述目标部位的待检索数据，其中所述待检索数据的模态为影像模态或者文本模态；将所述待检索数据输入到哈希码提取模型，以得到所述待检索数据对应的目标哈希码；和从不同于所述待检索数据的模态的数据库中，获取与所述目标哈希码匹配的检索结果。

Description

数据检索方法、影像数据检索方法及装置

相关申请的交叉引用

本申请要求在2022年09月15日在中国提交的中国专利申请号2022111229324的优先权，其全部内容通过引用并入本文。

技术领域

本公开涉及人工智能和医疗健康技术领域，具体涉及一种数据检索方法、影像数据检索方法及上述方法的装置、存储介质、计算机程序产品和计算机程序。

背景技术

哈希码在多模态检索应用中有非常有效，例如，在医学领域中，可通过文本信息在数据库中查找符合文字描述的医学影像数据，或者，可通过医学影像数据在数据库中查询对应的疾病诊断文本等。

在对多模态检索应用中，通常采用预先训练好的哈希码提取模型对待检索数据(例如图片或者文本)进行处理，以得到待检索数据对应的哈希码。如何使得哈希码提取模型可以准确确定出待检索数据对应的哈希码对于多模态检索是十分重要的。相关技术中，通常采用样本数据对哈希码提取模型进行训练，例如，在医学领域中，可通过专业医师对影像数据以及对应的疾病诊断文本进行精细标注，并基于标注后的样本数据对哈希码提取模型进行训练。然而，采用人工的方式对样本数据进行标记，导致哈希码提取模型的训练成本较高，进而造成检索数据的过程繁琐复杂，成本过高。

发明内容

本公开提出一种数据检索方法、影像数据检索方法及上述方法的装置、存储介质、计算机程序产品和计算机程序。

本公开一方面实施例提出一种基于哈希码提取模型的哈希检索方法，所述方法包括：获取所述目标部位的待检索数据，其中，所述待检索数据的模态为影像模态或者文本模态；将所述待检索数据输入到哈希码提取模型，以得到所述待检索数据对应的目标哈希码；从不同于所述待检索数据的模态的数据库中，获取与所述目标哈希码匹配的检索结果，其中所述哈希码提取模型是通过以下步骤得到的：获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。

本公开另一方面实施例提出一种影像检索方法，包括：获取目标部位的疾病影像数据；将所述疾病影像数据输入到哈希码提取模型，以得到所述疾病影像数据对应的目标哈希码；从所述目标部位对应的疾病诊断文本库中获取与所述目标哈希码对应的目标诊断文本，其中所述哈希码提取模型是通过以下步骤得到的：获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。

本公开另一方面实施例提出一种基于哈希码提取模型的哈希检索装置，所述装置包括：第一获取模块，用于获取所述目标部位的待检索数据，其中，所述待检索数据的模态为影像模态或者文本模态；哈希码确定模块，用于将所述待检索数据输入到哈希码提取模型，以得到所述待检索数据对应的目标哈希码；第二获取模块，用于从不同于所述待检索数据的模态的数据库中，获取与所述目标哈希码匹配的检索结果，其中，所述哈希码提取模型是通过哈希码提取模型的训练装置得到的，所述训练装置包括：第一获取模块，用于获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；第一确定模块，用于通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；第二确定模块，用于根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；第三确定模块，用于根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和训练模块，用于根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。

本公开另一方面实施例提出了一种影像检索装置，包括：第一获取模块，用于获取目标部位的疾病影像数据；哈希码确定模块，用于将所述疾病影像数据输入到哈希码提取模型，以得到所述疾病影像数据对应的目标哈希码；第二获取模块，用于从所述目标部位对应的疾病诊断文本库中获取与所述目标哈希码对应的目标诊断文本。本公开实施例的影像检索装置，在获取目标部位的疾病影像数据，通过预先训练的哈希码提取模型即可确定出疾病影像数据所对应的目标哈希码，并从目标部位对应的疾病诊断文本库中获取与所述目标哈希码对应的目标诊断文本，其中，所述哈希码提取模型是通过哈希码提取模型的训练装置得到的，所述训练装置包括：第一获取模块，用于获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；第一确定模块，用于通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；第二确定模块，用于根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；第三确定模块，用于根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和训练模块，用于根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。

本公开另一方面实施例提出了一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现本公开实施例的基于哈希码提取模型的哈希检索方法，或者，影像检索方法。

本公开另一方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开实施例的基于哈希码提取模型的哈希检索方法，或者，影像检索方法。

本公开另一方面实施例提出了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现本公开实施例的基于哈希码提取模型的哈希检索方法，或者，影像检索方法。

本公开另一方面实施例提出了一种计算机程序，包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以使得计算机执行本公开实施例的基于哈希码提取模型的哈希检索方法，或者，影像检索方法。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开一个实施例的哈希码提取模型的训练方法的流程示意图；

图2是根据本公开另一个实施例的哈希码提取模型的训练方法的流程示意图；

图3是本公开一个实施例的哈希码提取模型的网络结构的示例图；

图4是根据本公开另一个实施例的哈希码提取模型的训练方法的流程示意图；

图5是根据本公开一个实施例的基于哈希码提取模型的哈希检索方法的流程示意图；

图6是根据本公开另一个实施例的基于哈希码提取模型的哈希检索方法的流程示意图；

图7是根据本公开一个实施例的影像检索方法的流程示意图；

图8是根据本公开一个实施例的哈希码提取模型的训练装置的结构示意图；

图9是根据本公开一个实施例的基于哈希码提取模型的哈希检索装置的结构示意图；

图10是根据本公开另一个实施例的影像检索装置的结构示意图；

图11是根据本公开一个实施例的电子设备的框图。

具体实施方式

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本公开实施例的哈希码提取模型的训练方法、基于哈希码提取模型的哈希检索方法、影像数据检索方法及上述方法的装置、电子设备、存储介质、计算机程序产品和计算机程序。

图1是根据本公开一个实施例的哈希码提取模型的训练方法的流程示意图。其中，需要说明的是，本实施例提供的哈希码提取模型的训练方法由哈希码提取模型的训练装置执行，本实施例中的哈希码提取模型的训练装置可以由软件和/或者硬件的方式实现，该哈希码提取模型的训练装置可以为电子设备，或者可以配置在电子设备中。

其中，本示例实施例中的电子设备可以包括终端设备、服务器等，其中，终端设备可以为PC(Personal Computer，个人计算机)、移动设备、平板电脑等，该实施例对此不做具体限定。

如图1所示，该哈希码提取模型的训练方法可以包括：步骤101至步骤105。

步骤101，获取目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与第一疾病影像样本对应的疾病诊断文本，其中，第一疾病影像样本、第二疾病影像样本和疾病诊断文本所对应的疾病名称是相同的。

其中，本实施例中的目标部位可以为人体或者动物中的任意一个部位。其中，本示例实施例中以目标部位为人体中的一个部位为例进行描述，例如，目标部位可以为人体的胸部。

其中，本示例中的疾病名称可以任意一种疾病所对应的名称。例如，疾病名称可以为肺炎。

其中，需要说明的是，第一疾病影像样本和第二疾病影像样本可以是同一种疾病名称所对应的两个不同的疾病影像样本，例如，第一疾病影像样本和第二疾病影像样本可以为患肺炎的两个病例各自对应的胸部影像。

其中，需要说明的是，本示例实施例对各种数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。

步骤102，通过哈希码提取模型分别确定正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本各自的哈希码。

在一些示例中，可分别将正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本输入到哈希码提取模型中，以通过哈希码提取模型来对分别正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本进行处理，以得到正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本各自对应的哈希码。

其中，需要说明的是，此时的哈希码提取模型是指还未经过训练的初始的哈希码提取模型。

步骤103，根据正常影像样本的哈希码和疾病诊断文本的哈希码之间的距离以及第一疾病影像样本的哈希码和疾病诊断文本的哈希码之间的距离，确定哈希码提取模型的跨模态对比损失值。

在一些示例中，在确定出正常影像样本的哈希码和疾病诊断文本的哈希码之间的距离以及第一疾病影像样本的哈希码和疾病诊断文本的哈希码之间的距离，可将所确定出的两个距离输入至哈希码提取模型的跨模态对比损失函数中，以通过跨模态对比损损失函数，确定哈希码提取模型的跨模态对比损失值。

在另一些示例中，在确定出正常影像样本的哈希码和疾病诊断文本的哈希码之间的距离以及第一疾病影像样本的哈希码和疾病诊断文本的哈希码之间的距离，可对确定出的两个距离通过加权求和的方式，以得到哈希码提取模型的跨模态对比损失值。

其中，需要说明的是，本示例中的距离可以为汉明距离，汉明距离越小表示两者之间的哈希码越接近，反之则表示两者之间的哈希码差异越大。

步骤104，根据正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及第一疾病影像样本的哈希码和第二疾病影像样本的哈希码之间的距离，确定哈希码提取模型的同模态对比损失值。

在一些示例中，在确定出正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及第一疾病影像样本的哈希码和第二疾病影像样本的哈希码之间的距离后，可将所确定出的两个距离输入到哈希码提取模型的同模态对比损失函数中，以通过同模态对比损失函数确定出哈希码提取模型的同模态对比损失值。

在另一些示例中，在确定出正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及第一疾病影像样本的哈希码和第二疾病影像样本的哈希码之间的距离后，可将所确定出的两个距离，可对确定出的两个距离进行加权求和，以得到哈希码提取模型的同模态对比损失值。

步骤105，根据跨模态对比损失值和同模态对比损失值，对哈希码提取模型进行训练。

在一些示例性的实施方式中，可根据跨模态对比损失值和同模态对比损失值，确定出哈希码提取模型的总损失值，并根据总损失值对哈希码提取模型的模型参数进行调整，并对调整后的哈希码提取模型继续训练，直至总损失值满足预设条件。

在一些示例性的实施方式中，可对跨模态对比损失值和同模态对比损失值进行加权求和，以得到哈希码提取模型的总损失值。

其中，预设条件即为模型训练结束的条件。预设条件可以根据实际需求进行相应的配置。例如，总损失值满足预设条件可以是总损失值小于预设值，也可以是总损失值的变化趋近于平稳，即相邻两次或多次训练对应的总损失值的差值小于设定值，也就是总损失值基本不再变化。

本公开实施例的哈希码提取模型的训练方法，在获取目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与第一疾病影像样本对应的疾病诊断文本后，通过哈希码提取模型分别确定正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本各自的哈希码；根据正常影像样本的哈希码和疾病诊断文本的哈希码之间的距离以及第一疾病影像样本的哈希码和疾病诊断文本的哈希码之间的距离，确定哈希码提取模型的跨模态对比损失值；根据正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及第一疾病影像样本的哈希码和第二疾病影像样本的哈希码之间的距离，确定哈希码提取模型的同模态对比损失值；根据跨模态对比损失值和同模态对比损失值，对哈希码提取模型进行训练。由此，无需对样本数据进行人工标注，通过对正常影像样本、疾病影像样本以及疾病诊断文本进行对比学习，即可实现对哈希码提取模型的训练，降低了哈希码提取模型的训练成本。

基于上述实施例的基础上，在本示例中的哈希码提取模型包括影像深度网络、文本深度网络、与影像深度网络连接的第一哈希层和与文本深度网络连接的第二哈希层的情况下，为了可以清楚理解通过哈希码提取模型如何分别正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本各自的哈希码，本实施例还提出了一种哈希码提取模型的训练方法，下面结合图2对该过程进行示例性描述。

图2是根据本公开另一个实施例的哈希码提取模型的训练方法的流程示意图。

如图2所示，该哈希码提取模型的训练方法，可以包括：步骤201至步骤206。

步骤201，获取目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与第一疾病影像样本对应的疾病诊断文本，其中，第一疾病影像样本、第二疾病影像样本和疾病诊断文本所对应的疾病名称是相同的。

其中，需要说明的是，关于步骤201的具体实现方式，可参见上述实施例的相关描述，此处不再赘述。

步骤202，通过影像深度网络确定第一疾病影像样本的第二图像特征，并通过文本深度网络确定疾病诊断文本的文本特征。

其中，本示例实施例中的影像深度网络可以为残差网络深度网络，例如，影像深度网络可以为残差网络Resnet50。可以理解的是，在实际应用中，本实施例中的影像深度网络还可以其他能够对影像数据进行特征提取的其他类型的深度网络，该实施例对此不作具体限定。

在一些示例性的实施方式中，为了准确确定出疾病诊断文本的文本特征，本示例中的文本深度网络可以为预先训练好的语言表示模型，例如，语言表示模型可以为双向变换器的编码器(Bidirectional Encoder Representations from Transformers)BERT模型。又例如，语言表示模型可以为知识增强的语义表示模型(Enhanced Representation through Knowledge Integration，ERNIE)。可以理解的是，在实际应用中，本实施例中的文本深度网络还可以其他能够对疾病诊断文本进行特征提取的其他类型的深度网络，该实施例对此不作具体限定。

在本公开的一个实施例中，为了使得影像深度网络可以专注于第一疾病影像样本的病灶区域的特征提取，本示例实施例中的哈希码提取模型还可以包括自注意力层，自注意力层设置在影像深度网络和文本深度网络之间，通过影像深度网络确定第一疾病影像样本的第二图像特征，并通过文本深度网络确定疾病诊断文本的文本特征的一种可能实现方式为：通过文本深度网络确定疾病诊断文本的文本特征；将文本特征输入到自注意力层中，以得到疾病诊断文本的注意力特征；将注意力特征输入到影像深度网络中，以使得影像深度网络基于注意力特征对第一疾病影像样本进行病灶特征提取，得到第一疾病影像样本的第二图像特征。

例如，哈希码提取模型的网络结构的示例图，如图3所示，目标部位为人体的胸部，疾病名称为肺炎，第一疾病影像样本为肺炎胸部影像样本，疾病诊断文本为肺炎诊断描述文本。对应地，可将肺炎胸部影像样本输入到图3中的影像深度网络，并将肺炎诊断描述文本图3中的BERT网络中，以得到肺炎诊断描述文本的语义表示向量，并将语义表示向量输入到自注意力层，并将自注意力层输出的注意力特征输入到影像深度网络中前几个卷积层中(其中，需要说明的是，图3中未示意出影像深度网络中的多个卷积层)(例如影像深度网络中可以包括依次连接的五个卷积层，可将注意特征输入到影像深度网络中的前三个卷积层中)，并最后一个卷积层输出的图像特征输入到第一哈希层中，以通过第一哈希层得到肺炎胸部影像样本的哈希码。对应地，语义表示向量还被输入到第二哈希层中，以通过第二哈希层得到肺炎诊断描述文本的哈希码。其中，图3中用第一哈希码表示肺炎胸部影像样本的哈希码，用第二哈希码表示肺炎诊断描述文本的哈希码。

步骤203，将第二图像特征输入到第一哈希层中以得到第一疾病影像样本的哈希码，并将文本特征输入到第二哈希层中以得到疾病诊断文本的哈希码。

在一些示例中，在将第二图像特征输入到第一哈希层中，对应地，第一哈希层基于第一图像特征进行哈希计算，以得到第一疾病影像样本的哈希码。

在一些示例中，将文本特征输入到第二哈希层中，对应地，第二哈希层基于文本特征进行哈希计算，以得到疾病诊断文本的哈希码。

其中，需要说明的是，为了方便后续可实现两种模态的数据之间可通过哈希码进行相互检索，提高检索效率，本示例实施例中的第一哈希层和第二哈希层进行哈希计算时所使用的哈希码编码空间可以是相同的。也就是说，本实施例中的第一哈希层和第二哈希层可以将影像和文本影像到同一个哈希码编码空间中。

步骤204，根据正常影像样本的哈希码和疾病诊断文本的哈希码之间的距离以及第一疾病影像样本的哈希码和疾病诊断文本的哈希码之间的距离，确定哈希码提取模型的跨模态对比损失值。

步骤205，根据正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及第一疾病影像样本的哈希码和第二疾病影像样本的哈希码之间的距离，确定哈希码提取模型的同模态对比损失值。

步骤206，根据跨模态对比损失值和同模态对比损失值，对哈希码提取模型进行训练。

其中，需要说明的是，关于步骤204至步骤206的具体实现方式，可参见上述实施例中的相关描述，此处不再赘述。

在本示例实施例中，通过哈希码提取模型中的影像深度网络对正常影像样本以及对应的第二疾病影像样本进行处理，并通过与影像深度网络连接的第一哈希层基于影像深度网络的输出准确确定出了正常影像样本以及第二疾病影像样本各自对应的哈希码，并通过哈希码提取模型中的影像深度网络和文本深度网络对第一疾病影像样本和疾病诊断文本分别进行特征提取，并通过第一哈希层对图像特征进行哈希计算，并通过第二哈希层对文本特征进行哈希计算准确确定出了第一疾病影像样本和疾病诊断文本各自对应的哈希码，由此，方便后续可基于所确定出的哈希码，准确确定出哈希码提取模型的模态对比损失值和同模态对比损失值，继而可对哈希码提取模型进行准确训练，有利于哈希码提取模型的训练。

为了可以清楚理解本公开，下面结合图4对该实施例的哈希码提取模型的训练方法进行示例性描述，其中，需说明的是，本示例中以目标部位为人体的胸部，疾病名称为肺炎为例进行描述。

如图4所示，可以包括：步骤401至步骤405。

步骤401，获取胸部的正常影像样本、第一肺炎影像样本A、第二肺炎影像样本B以及与第一肺炎影像样本A对应的肺炎诊断文本A。

步骤402，通过哈希码提取模型分别确定出正常影像样本、第一肺炎影像样本A、第二肺炎影像样本B以及与第一肺炎影像样本A对应的肺炎诊断文本A各自对应的哈希码。

其中，需要说明的是，关于通过哈希码提取模型分别确定出正常影像样本、第一肺炎影像样本A、第二肺炎影像样本B以及与第一肺炎影像样本A对应的肺炎诊断文本A各自对应的哈希码的具体实现方式，可参见本公开实施例中的相关描述，此处不再赘述。

步骤403，根据正常影像样本的哈希码nV和疾病诊断文本A的哈希码FAT之间的距离以及第一疾病影像样本A的哈希码FAV和疾病诊断文本A的哈希码FAT之间的距离，确定哈希码提取模型的跨模态对比损失值。

步骤404，根据正常影像样本的哈希码nV和第一疾病影像样本的哈希码FAV之间的距离以及第一疾病影像样本的哈希码FAV和第二疾病影像样本的哈希码FBV之间的距离，确定哈希码提取模型的同模态对比损失值。

步骤405，根据跨模态对比损失值和同模态对比损失值，对哈希码提取模型进行训练。

也就是说，本示例中基于双阶段对比学习方式对哈希码提取模型进行训练，其中，双阶段学习对比方式主要是包括由影像数据之间的对比学习和跨影像-诊断文本之间的对比学习方法。通过设计双层次的对比学习损失进行训练，包括：同模态对比损失值和跨模态对比损失值。对于同模态的影像数据：设计模态内对比损失，拉近相同病灶特征之间的距离，相反拉远正常影像与肺炎影像之间的距离。由此，使网络学习提取肺炎病灶相关特征和病灶无关特征。对于跨影像和诊断文档数据：设计模态间的对比学习损失，拉近病灶诊断文档与病灶影像数据特征之间的距离，从而促进病灶表征提取能力。

在本公开的一个实施例中，为了解决符号函数sign导致深度网络梯度无法反传进行优化的问题，在对哈希提取模型进行训练的过程中，可将第一哈希层以及第二哈希层的输出通过tanh激活函数以得到对应文本样本或者影像样本的最终的哈希码，并基于最终的哈希码来确定哈希码提取模型的同模态对比损失值和跨模态对比损失值，并基于同模态对比损失值和跨模态对比损失值，对哈希码提取模型的模型参数进行调整，以实现对哈希码提取模型的训练。

在本示例中，在对哈希码提取模型进行训练的过程中，采用胸部的正常影像样本、第一肺炎影像样本A、第二肺炎影像样本B以及与第一肺炎影像样本A对应的肺炎诊断文本A进行对比学习的方式对哈希码提取模型进行训练，从而降低模型训练过程中人工标注样本数据的成本，降低了模型的训练成本。

图5是根据本公开一个实施例的基于哈希码提取模型的哈希检索方法的流程示意图。其中，需要说明的是，本实施例提供的基于哈希码提取模型的哈希检索方法由基于哈希码提取模型的哈希检索装置执行，本实施例中的基于哈希码提取模型的哈希检索装置可以由软件和/或者硬件的方式实现，该基于哈希码提取模型的哈希检索装置可以为电子设备，或者可以配置在电子设备中。

如图5所示，该基于哈希码提取模型的哈希检索方法可以包括：步骤501至步骤503。

步骤501，获取目标部位的待检索数据，其中，待检索数据的模态为影像模态或者文本模态。

其中，可以理解的是，在待检索数据的模态为影像模态的情况下，说明待检索数据为待检索影像数据。对应地，在待检索数据的模态为文本模态的情况下，说明待检索数据为待检索文本数据。

步骤502，将待检索数据输入到哈希码提取模型，以得到待检索数据对应的目标哈希码。

其中，需要说明的是，本示例实施例中所使用的哈希码提取模型是通本公开所公开的训练方法训练得到的。

其中，需要说明的是，关于训练哈希码提取模型的过程，可参见本公开所公开的相关描述，此处不再赘述。

步骤503，从不同于待检索数据的模态的数据库中，获取与目标哈希码匹配的检索结果。

作为一种示例，在待检索数据的模态为影像模态的情况下，不同于待检索数据的模态的数据库为文本模态所对应的数据库，其中，该数据库中所保存的数据为目标部位的已有疾病诊断文本的哈希码。对应地，可从该数据库中获取与目标哈希码匹配的检索结果。

作为另一种示例，在待检索数据的模态为文本模态的情况下，不同于待检索数据的模态的数据库为影像模态所对应的数据库，其中，该数据库中所保存的数据为目标部位的已有疾病影像的哈希码。对应地，可从该数据库中获取与目标哈希码匹配的检索结果。

例如，在目标部位为胸部，在待检索数据的模态为影像模态，即，待检索数据为待检索肺炎影像，对应的，可通过预先训练好的哈希码提取模型来确定出待检索肺炎影像的目标哈希码，然后，从用于保存文本模态的数据库中，基于目标哈希码进行检索，以得到与目标哈希码匹配的目标肺炎诊断文本。

又例如，在目标部位为胸部，在待检索数据的模态为文本模态，即，待检索数据为待检索肺炎诊断文本，对应的，可通过预先训练好的哈希码提取模型来确定出待检索肺炎诊断文本的目标哈希码，然后，从用于保存影像模态的数据库中，基于目标哈希码进行检索，以得到与目标哈希码匹配的目标肺炎影像数据。由此，实现了诊断文本与影像数据之间可通过哈希码进行相互检索，提高检索效率。

本公开实施例提供的基于哈希码提取模型的哈希检索方法，通过预先训练好的哈希码提取模型来确定目标部位的待检索数据的目标哈希码，并从不同于待检索数据的模态的数据库中，获取与目标哈希码匹配的检索结果。由此，实现了不同模态数据之间可进行相互检索的同时，有效提高检索效率。

图6是根据本公开另一个实施例的基于哈希码提取模型的哈希检索方法的流程示意图。其中，需要说明的是，本实施例提供的基于哈希码提取模型的哈希检索方法是对前述实施例的进一步细化。

如图6所示，该基于哈希码提取模型的哈希检索方法可以包括：步骤601至步骤604。

步骤601，获取目标部位的待检索数据，其中，待检索数据的模态为影像模态或者文本模态。

步骤602，将待检索数据输入到哈希码提取模型，以得到待检索数据对应的目标哈希码。

步骤603，确定目标哈希码与数据库中各个数据的哈希码之间的距离。

在一些示例中，可计算目标哈希码与数据库中各个数据的哈希码之间的汉明距离。

步骤604，根据距离，从各个数据中获取与目标哈希码匹配的检索结果。

在本公开的一个实施例中，在不同应用场景中，根据距离，从各个数据中获取与目标哈希码匹配的检索结果的实现方式不同，示例性方式如下：

作为一种示例，根据距离，从各个数据中选择出距离最短的目标数据作为检索结果。

作为另一种示例，根据距离，从各个数据中选择出距离小于预设距离阈值的目标数据作为检索结果。

作为一种示例，按照距离从低到高的顺序对各个数据进行排序，并从排序结果中选择出排序在前N位的数据作为检索结果，其中，N为大于或者等于1的整数。

其中，本示例实施例中的距离可以为汉明距离。

在本公开的一个实施例中，为了可以准确确定出各个数据的哈希码，本示例中的数据库中各个数据的哈希码可以通过下述方式得到：针对各个数据，将数据输入到哈希码提取模型中，以通过哈希码提取模型得到数据的哈希码。

图7是根据本公开一个实施例的影像检索方法的流程示意图。其中，需要说明的是，本实施例提供的影像检索方法由影像检索装置执行，本实施例中的影像检索装置可以由软件和/或者硬件的方式实现，该影像检索装置可以为电子设备，或者可以配置在电子设备中。

如图7所示，该影像检索方法可以包括：步骤701至步骤703。

步骤701，获取目标部位的疾病影像数据。

步骤702，将疾病影像数据输入到哈希码提取模型，以得到疾病影像数据对应的目标哈希码。

步骤703，从目标部位对应的疾病诊断文本库中获取与目标哈希码对应的目标诊断文本。

其中，本示例中的疾病诊断文本库中保存已有疾病诊断文本与其对应的哈希码。

作为一种示例性的实施方式中，本示例中疾病诊断文本库中各个已有疾病诊断文本所对应的哈希码的示例性获取方式可以为：针对各个已有疾病诊断文本，可将该已有疾病诊断文本输入到哈希码提取模型，以通过哈希码提取模型确定出该已有疾病诊断文本所对应的哈希码。

在本公开的一个实施例中，从目标部位对应的疾病诊断文本库中获取与目标哈希码对应的目标诊断文本的一种可能实现方式为：确定出目标哈希码与疾病诊断文本库中各个已有疾病诊断文本的哈希码之间的距离；根据距离，从各个已有疾病诊断文本中获取与目标哈希码匹配的疾病诊断文本。

在本公开的一个实施例中，在不同应用场景中，根据距离，从各个已有疾病诊断文本中获取与目标哈希码匹配的疾病诊断文本的实现方式不同，示例性方式如下：

作为一种示例，根据距离，从各个已有疾病诊断文本中选择出距离最短的目标已有疾病诊断文本作为与目标哈希码匹配的疾病诊断文本。

作为另一种示例，根据距离，从各个已有疾病诊断文本中选择出距离小于预设距离阈值的目标已有疾病诊断文本作为与目标哈希码匹配的疾病诊断文本。

作为一种示例，按照距离从低到高的顺序对各个已有疾病诊断文本进行排序，并从排序结果中选择出排序在前N位的已有疾病诊断文本作为与目标哈希码匹配的疾病诊断文本，其中，N为大于或者等于1的整数。

其中，本示例实施例中的距离可以为汉明距离。

本公开实施例的影像检索方法，在获取目标部位的疾病影像数据，通过预先训练的哈希码提取模型即可确定出疾病影像数据所对应的目标哈希码，并从目标部位对应的疾病诊断文本库中获取与所述目标哈希码对应的目标诊断文本。由此，基于疾病影像数据的哈希码，即可快速检索出与该哈希码匹配的疾病诊断文本，提高了获取疾病诊断文本的效率。

与上述几种实施例提供的哈希码提取模型的训练方法相对应，本公开的一种实施例还提供一种哈希码提取模型的训练装置，由于本公开实施例提供的哈希码提取模型的训练装置与上述几种实施例提供的哈希码提取模型的训练方法相对应，因此在哈希码提取模型的训练方法的实施方式也适用于本实施例的哈希码提取模型的训练装置，在本实施例中不再详细描述。

图8是根据本公开一个实施例的哈希码提取模型的训练装置的结构示意图。

如图8所示，该哈希码提取模型的训练装置800包括：第一获取模块801、第一确定模块802、第二确定模块803、第三确定模块804和训练模块805。

第一获取模块801，用于获取目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与第一疾病影像样本对应的疾病诊断文本，其中，第一疾病影像样本、第二疾病影像样本和疾病诊断文本所对应的疾病名称是相同的。

第一确定模块802，用于通过哈希码提取模型分别确定正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本各自的哈希码。

第二确定模块803，用于根据正常影像样本的哈希码和疾病诊断文本的哈希码之间的距离以及第一疾病影像样本的哈希码和疾病诊断文本的哈希码之间的距离，确定哈希码提取模型的跨模态对比损失值。

第三确定模块804，用于根据正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及第一疾病影像样本的哈希码和第二疾病影像样本的哈希码之间的距离，确定哈希码提取模型的同模态对比损失值。

训练模块805，用于根据跨模态对比损失值和同模态对比损失值，对哈希码提取模型进行训练。

在本公开的一个实施例中，哈希码提取模型包括影像深度网络、文本深度网络、与影像深度网络连接的第一哈希层和与文本深度网络连接的第二哈希层，第一确定模块802，包括：

第一确定单元，用于通过影像深度网络分别确定正常影像样本和第二疾病影像样本各自对应的第一图像特征，并将第一图像特征输入到第一哈希层中，以得到正常影像样本和第二疾病影像样本各自对应的哈希码；

第二确定单元，用于通过影像深度网络确定第一疾病影像样本的第二图像特征，并通过文本深度网络确定疾病诊断文本的文本特征；

第三确定单元，用于将第二图像特征输入到第一哈希层中以得到第一疾病影像样本的哈希码，并将文本特征输入到第二哈希层中以得到疾病诊断文本的哈希码。

在本公开的一个实施例中，哈希码提取模型还包括自注意力层，自注意力层设置在影像深度网络和文本深度网络之间，第二确定单元，具体用于：通过文本深度网络确定疾病诊断文本的文本特征；将文本特征输入到自注意力层中，以得到疾病诊断文本的注意力特征；将注意力特征输入到影像深度网络中，以使得影像深度网络基于注意力特征对第一疾病影像样本进行病灶特征提取，得到第一疾病影像样本的第二图像特征。

本公开实施例的哈希码提取模型的训练装置，在获取目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与第一疾病影像样本对应的疾病诊断文本后，通过哈希码提取模型分别确定正常影像样本、第一疾病影像样本、第二疾病影像样本和疾病诊断文本各自的哈希码；根据正常影像样本的哈希码和疾病诊断文本的哈希码之间的距离以及第一疾病影像样本的哈希码和疾病诊断文本的哈希码之间的距离，确定哈希码提取模型的跨模态对比损失值；根据正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及第一疾病影像样本的哈希码和第二疾病影像样本的哈希码之间的距离，确定哈希码提取模型的同模态对比损失值；根据跨模态对比损失值和同模态对比损失值，对哈希码提取模型进行训练。由此，无需对样本数据进行人工标注，通过对正常影像样本、疾病影像样本以及疾病诊断文本进行对比学习，即可实现对哈希码提取模型的训练，降低了哈希码提取模型的训练成本。

与上述几种实施例提供的哈希码提取模型的哈希码检索方法相对应，本公开的一种实施例还提供一种哈希码提取模型的哈希码检索装置，由于本公开实施例提供的哈希码提取模型的哈希码检索装置与上述几种实施例提供的哈希码提取模型的哈希码检索方法相对应，因此在哈希码提取模型的哈希码检索方法的实施方式也适用于本实施例的哈希码提取模型的哈希码检索装置，在本实施例中不再详细描述。

图9是根据本公开一个实施例的基于哈希码提取模型的哈希检索装置的结构示意图。

如图9所示，该基于哈希码提取模型的哈希检索装置900包括：第一获取模块901、哈希码确定模块902和第二获取模块903。

第一获取模块901，用于获取目标部位的待检索数据，其中，待检索数据的模态为影像模态或者文本模态。

哈希码确定模块902，用于将待检索数据输入到哈希码提取模型，以得到待检索数据对应的目标哈希码。

其中，本实施例中的哈希码提取模型是通过本公开实施例所提出的哈希码提取模型的训练方法训练得到的。

第二获取模块903，用于从不同于待检索数据的模态的数据库中，获取与目标哈希码匹配的检索结果。

在本公开的一个实施例中，第二获取模块903，包括：确定单元和获取单元。

确定单元，用于确定目标哈希码与数据库中各个数据的哈希码之间的距离。

获取单元，用于根据距离，从各个数据中获取与目标哈希码匹配的检索结果。

在本公开的一个实施例中获取单元，具体用于：

根据距离，从各个数据中选择出距离最短的目标数据作为检索结果；或者，

按照距离从低到高的顺序对各个数据进行排序，并从排序结果中选择出排序在前N位的数据作为检索结果，其中，N为大于或者等于1的整数。

在本公开的一个实施例中数据库中各个数据的哈希码是通过下述方式得到的：针对各个数据，将数据输入到哈希码提取模型中，以通过哈希码提取模型得到数据的哈希码。

本公开实施例的基于哈希码提取模型的哈希检索装置，通过预先训练好的哈希码提取模型来确定目标部位的待检索数据的目标哈希码，并从不同于待检索数据的模态的数据库中，获取与目标哈希码匹配的检索结果。由此，实现了不同模态数据之间可进行相互检索的同时，有效提高检索效率。

图10是根据本公开一个实施例的影像检索装置的结构示意图。

如图10所示，该影像检索装置1000包括：第一获取模块1001、哈希码确定模块1002和第二获取模块1003。

第一获取模块1001，用于获取目标部位的疾病影像数据。

哈希码确定模块1002，用于将疾病影像数据输入到哈希码提取模型，以得到疾病影像数据对应的目标哈希码。

其中，哈希码提取模型是本公开实施例所提供的哈希码提取模型的训练方法训练得到的。

其中，需要说明的是，关于哈希码提取模型的训练方法的具体描述，可参见本公开实施例的相关描述，此处不再赘述。

第二获取模块1003，用于从目标部位对应的疾病诊断文本库中获取与目标哈希码对应的目标诊断文本。

其中，需要说明的是，前述对影像检索方法实施例的解释说明也适用于该影像检索装置，此处不再赘述。

本公开实施例的影像检索装置，在获取目标部位的疾病影像数据，通过预先训练的哈希码提取模型即可确定出疾病影像数据所对应的目标哈希码，并从目标部位对应的疾病诊断文本库中获取与目标哈希码对应的目标诊断文本。由此，基于疾病影像数据的哈希码，即可快速检索出与该哈希码匹配的疾病诊断文本，提高了获取疾病诊断文本的效率。

根据本公开的实施例，本公开还提供了一种电子设备和一种可读存储介质。

图11是根据本公开一个实施例的电子设备的结构框图。

如图11所示，该电子设备1100包括：存储器1110、处理器1120及存储在存储器1110上并可在处理器1120上运行的计算机指令。所述电子设备用于哈希检索或影像检索。

处理器1120执行指令时实现上述实施例中提供的基于哈希码提取模型的哈希检索方法，或者哈希码提取模型的训练方法，或者，影像检索方法。

在一些实施例中，电子设备1100还包括：

通信接口1130，用于存储器1110和处理器1120之间的通信。

存储器1110，用于存放可在处理器1120上运行的计算机指令。在一些实施例中，处理器可以为中央处理器(Central Processing Unit，CPU)、特定应用集成电路(application-specific integrated circuit，ASIC)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。

存储器1110可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。在一些实施例中，存储器可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、以及至少一个功能(比如影像采集和处理功能等)所需的应用程序等；存储数据区可存储根据计算机的使用过程中所创建的数据，比如，影像或文本数据等。

在一些实施例中，所述电子设备还包括影像采集器。所述影像采集器可以为摄像机、X光成像类、计算机断层扫描(CT)、磁共振成像(MRI)和核医学类、超声设备和内镜设备等。

处理器1120，用于执行程序时实现上述实施例的基于哈希码提取模型的哈希检索方法，或者哈希码提取模型的训练方法，或者，影像检索方法。

如果存储器1110、处理器1120和通信接口1130独立实现，则通信接口1130、存储器1110和处理器1120可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture，简称为ISA)总线、外部设备互连(Peripheral Component，简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在一些实施例中，在具体实现上，如果存储器1110、处理器1120及通信接口1130，集成在一块芯片上实现，则存储器1110、处理器1120及通信接口1130可以通过内部接口完成相互间的通信。

处理器1120可能是一个中央处理器(Central Processing Unit，简称为CPU)，或者是特定集成电路(Application Specific Integrated Circuit，简称为ASIC)，或者是被配置成实施本公开实施例的一个或多个集成电路。

本公开另一方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开实施例任一的基于哈希码提取模型的哈希检索方法，或者哈希码提取模型的训练方法，或者，影像检索方法。

根据本公开的实施例，本公开还提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如本公开任一实施例的哈希码提取模型的训练方法、或者，基于哈希码提取模型的哈希检索方法，或者，影像检索方法。

根据本公开的实施例，本公开还提供了一种计算机程序，该计算机程序包括计算机程序代码，当该计算机程序代码在计算机上运行时，使得计算机执行本公开任一实施例的哈希码提取模型的训练方法、或者，基于哈希码提取模型的哈希检索方法，或者，影像检索方法。

需要说明的是，前述对方法、装置实施例的解释说明也适用于上述实施例的电子设备、计算机可读存储介质、计算机程序产品和计算机程序，此处不再赘述。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

本公开所有实施例均可以单独被执行，也可以与其他实施例相结合被执行，均视为本公开要求的保护范围。

Claims

一种基于哈希码提取模型的哈希检索方法，包括：

获取目标部位的待检索数据，其中，所述待检索数据的模态为影像模态或者文本模态；

将所述待检索数据输入到哈希码提取模型，以得到所述待检索数据对应的目标哈希码；和

从不同于所述待检索数据的模态的数据库中，获取与所述目标哈希码匹配的检索结果，

其中所述哈希码提取模型是通过以下步骤得到的：

获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；

通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；

根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；

根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和

根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。
如权利要求1所述的方法，其中所述从不同于所述待检索数据的模态的数据库中，获取与所述目标哈希码匹配的检索结果，包括：

确定所述目标哈希码与所述数据库中各个数据的哈希码之间的距离；

根据所述距离，从各个所述数据中获取与所述目标哈希码匹配的检索结果。
如权利要求2所述的方法，其中所述根据所述距离，从各个所述数据中获取与所述目标哈希码匹配的检索结果，包括：

根据所述距离，从各个所述数据中选择出距离最短的目标数据作为所述检索结果；或者，

按照距离从低到高的顺序对各个所述数据进行排序，并从排序结果中选择出排序在前N位的数据作为所述检索结果，其中，N为大于或者等于1的整数。
如权利要求1至3中任一项所述的方法，其中所述哈希码提取模型包括影像深度网络、文本深度网络、与所述影像深度网络连接的第一哈希层和与所述文本深度网络连接的第二哈希层，所述通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码，包括：

通过所述影像深度网络分别确定所述正常影像样本和所述第二疾病影像样本各自对应的第一图像特征，并将所述第一图像特征输入到所述第一哈希层中，以得到所述正常影像样本和所述第二疾病影像样本各自对应的哈希码；

通过所述影像深度网络确定所述第一疾病影像样本的第二图像特征，并通过所述文本深度网络确定所述疾病诊断文本的文本特征；

将所述第二图像特征输入到所述第一哈希层中以得到第一疾病影像样本的哈希码，并将所述文本特征输入到所述第二哈希层中以得到所述疾病诊断文本的哈希码。
如权利要求4所述的方法，其中所述哈希码提取模型还包括自注意力层，所述自注意力层设置在所述影像深度网络和所述文本深度网络之间，所述通过所述影像深度网络确定所述第一疾病影像样本的第二图像特征，并通过所述文本深度网络确定所述疾病诊断文本的文本特征，包括：

通过所述文本深度网络确定所述疾病诊断文本的文本特征；

将所述文本特征输入到所述自注意力层中，以得到所述疾病诊断文本的注意力特征；

将所述注意力特征输入到所述影像深度网络中，以使得所述影像深度网络基于所述注意力特征对所述第一疾病影像样本进行病灶特征提取，得到所述第一疾病影像样本的第二图像特征。
如权利要求1至5中任一项所述的方法，其中所述数据库中各个数据的哈希码是通过下述方式得到的：

针对各个数据，将所述数据输入到所述哈希码提取模型中，以通过所述哈希码提取模型得到所述数据的哈希码。
一种影像检索方法，包括：

获取目标部位的疾病影像数据；

将所述疾病影像数据输入到哈希码提取模型，以得到所述疾病影像数据对应的目标哈希码；和

从所述目标部位对应的疾病诊断文本库中获取与所述目标哈希码对应的目标诊断文本，

其中所述哈希码提取模型是通过以下步骤得到的：

获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；

通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；

根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；

根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和

根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。
如权利要求7所述的方法，其中所述哈希码提取模型包括影像深度网络、文本深度网络、与所述影像深度网络连接的第一哈希层和与所述文本深度网络连接的第二哈希层，所述通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码，包括：

通过所述影像深度网络分别确定所述正常影像样本和所述第二疾病影像样本各自对应的第一图像特征，并将所述第一图像特征输入到所述第一哈希层中，以得到所述正常影像样本和所述第二疾病影像样本各自对应的哈希码；

通过所述影像深度网络确定所述第一疾病影像样本的第二图像特征，并通过所述文本深度网络确定所述疾病诊断文本的文本特征；

将所述第二图像特征输入到所述第一哈希层中以得到第一疾病影像样本的哈希码，并将所述文本特征输入到所述第二哈希层中以得到所述疾病诊断文本的哈希码。
如权利要求8所述的方法，其中所述哈希码提取模型还包括自注意力层，所述自注意力层设置在所述影像深度网络和所述文本深度网络之间，所述通过所述影像深度网络确定所述第一疾病影像样本的第二图像特征，并通过所述文本深度网络确定所述疾病诊断文本的文本特征，包括：

通过所述文本深度网络确定所述疾病诊断文本的文本特征；

将所述文本特征输入到所述自注意力层中，以得到所述疾病诊断文本的注意力特征；

将所述注意力特征输入到所述影像深度网络中，以使得所述影像深度网络基于所述注意力特征对所述第一疾病影像样本进行病灶特征提取，得到所述第一疾病影像样本的第二图像特征。
一种基于哈希码提取模型的哈希检索装置，包括：

第一获取模块，用于获取所述目标部位的待检索数据，其中，所述待检索数据的模态为影像模态或者文本模态；

哈希码确定模块，用于将所述待检索数据输入到哈希码提取模型，以得到所述待检索数据对应的目标哈希码；

第二获取模块，用于从不同于所述待检索数据的模态的数据库中，获取与所述目标哈希码匹配的检索结果，

其中，所述哈希码提取模型是通过哈希码提取模型的训练装置得到的，所述训练装置包括：

第一获取模块，用于获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；

第一确定模块，用于通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；

第二确定模块，用于根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；

第三确定模块，用于根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和

训练模块，用于根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。
如权利要求10所述的装置，其中所述第二获取模块包括：

确定单元，用于确定所述目标哈希码与所述数据库中各个数据的哈希码之间的距离；

获取单元，用于根据所述距离，从各个所述数据中获取与所述目标哈希码匹配的检索结果。
如权利要求11所述的装置，其中所述获取单元具体用于：

根据所述距离，从各个所述数据中选择出距离最短的目标数据作为所述检索结果；或者，

按照距离从低到高的顺序对各个所述数据进行排序，并从排序结果中选择出排序在前N位的数据作为所述检索结果，其中，N为大于或者等于1的整数。
如权利要求10至12中任一项所述的装置，其中所述哈希码提取模型包括影像深度网络、文本深度网络、与所述影像深度网络连接的第一哈希层和与所述文本深度网络连接的第二哈希层，所述第一确定模块，包括：

第一确定单元，用于通过所述影像深度网络分别确定所述正常影像样本和所述第二疾病影像样本各自对应的第一图像特征，并将所述第一图像特征输入到所述第一哈希层中，以得到所述正常影像样本和所述第二疾病影像样本各自对应的哈希码；

第二确定单元，用于通过所述影像深度网络确定所述第一疾病影像样本的第二图像特征，并通过所述文本深度网络确定所述疾病诊断文本的文本特征；

第三确定单元，用于将所述第二图像特征输入到所述第一哈希层中以得到第一疾病影像样本的哈希码，并将所述文本特征输入到所述第二哈希层中以得到所述疾病诊断文本的哈希码。
如权利要求13所述的装置，其中所述哈希码提取模型还包括自注意力层，所述自注意力层设置在所述影像深度网络和所述文本深度网络之间，所述第二确定单元，具体用于：

通过所述文本深度网络确定所述疾病诊断文本的文本特征；

将所述文本特征输入到所述自注意力层中，以得到所述疾病诊断文本的注意力特征；

将所述注意力特征输入到所述影像深度网络中，以使得所述影像深度网络基于所述注意力特征对所述第一疾病影像样本进行病灶特征提取，得到所述第一疾病影像样本的第二图像特征。
如权利要求10至14中任一项所述的装置，其中所述数据库中各个数据的哈希码是通过下述方式得到的：

针对各个数据，将所述数据输入到所述哈希码提取模型中，以通过所述哈希码提取模型得到所述数据的哈希码。
一种影像检索装置，包括：

第一获取模块，用于获取目标部位的疾病影像数据；

哈希码确定模块，用于将所述疾病影像数据输入到哈希码提取模型，以得到所述疾病影像数据对应的目标哈希码；

第二获取模块，用于从所述目标部位对应的疾病诊断文本库中获取与所述目标哈希码对应的目标诊断文本，

其中，所述哈希码提取模型是通过哈希码提取模型的训练装置得到的，所述训练装置包括：

第一获取模块，用于获取所述目标部位的正常影像样本、第一疾病影像样本、第二疾病影像样本以及与所述第一疾病影像样本对应的疾病诊断文本，其中，所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本所对应的疾病名称是相同的；

第一确定模块，用于通过所述哈希码提取模型分别确定所述正常影像样本、所述第一疾病影像样本、所述第二疾病影像样本和所述疾病诊断文本各自的哈希码；

第二确定模块，用于根据所述正常影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述疾病诊断文本的哈希码之间的距离，确定所述哈希码提取模型的跨模态对比损失值；

第三确定模块，用于根据所述正常影像样本的哈希码和第一疾病影像样本的哈希码之间的距离以及所述第一疾病影像样本的哈希码和所述第二疾病影像样本的哈希码之间的距离，确定所述哈希码提取模型的同模态对比损失值；和

训练模块，用于根据所述跨模态对比损失值和所述同模态对比损失值，对所述哈希码提取模型进行训练。
一种电子设备，包括：

存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1至6中任一所述的方法，或者，如权利要求7至9中任一所述的方法。
一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如权利要求1至6中任一所述的方法，或者，如权利要求7至9中任一所述的方法。
一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如权利要求1至6中任一所述的方法，或者，如权利要求7至9中任一所述的方法。
一种计算机程序，所述计算机程序包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以使得计算机执行如权利要求1至6中任一所述的方法，或者，如权利要求7至9中任一所述的方法。