WO2023116231A1 - 图像分类方法、装置、计算机设备及存储介质 - Google Patents

图像分类方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2023116231A1
WO2023116231A1 PCT/CN2022/129702 CN2022129702W WO2023116231A1 WO 2023116231 A1 WO2023116231 A1 WO 2023116231A1 CN 2022129702 W CN2022129702 W CN 2022129702W WO 2023116231 A1 WO2023116231 A1 WO 2023116231A1
Authority
WO
WIPO (PCT)
Prior art keywords
features
feature
sub
image
pathological
Prior art date
Application number
PCT/CN2022/129702
Other languages
English (en)
French (fr)
Inventor
赵宇
林震宇
姚建华
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Priority to US18/198,165 priority Critical patent/US20230290120A1/en
Publication of WO2023116231A1 publication Critical patent/WO2023116231A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种图像分类方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取待分类的病理图像的图像特征;对于多个尺度中的每个尺度,从图像特征中提取尺度对应的局部特征;根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;对拼接图像特征进行分类,得到病理图像所属的类别。本申请实施例提供的方法,不同尺度对应的局部特征所包含的信息不同,使得最终得到的拼接图像特征包含不同尺度对应的特征信息,丰富了拼接图像特征的特征信息,基于该拼接图像特征来确定病理图像所属的类别,以保证该类别的准确性。

Description

图像分类方法、装置、计算机设备及存储介质
本申请要求于2021年12月22日提交中国专利局、申请号202111583275.9、申请名称为“图像分类方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种图像分类方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展,图像分类技术应用越来越广泛,可以应用于多种场景下,如在人脸识别场景或医学图像分类场景等。相关技术中,对待分类的图像进行特征提取,得到图像的图像特征,直接对该图像的图像特征进行分类,得到该图像所属的类别。由于上述方法中直接以提取到的图像特征进行分类,图像特征中的信息量少,导致分类准确性差。
发明内容
本申请实施例提供了一种图像分类方法、装置、计算机设备及存储介质,能够提升分类准确性。所述技术方案如下:
一方面,提供了一种图像分类方法,所述方法由计算机设备执行,所述方法包括:
获取待分类的病理图像的图像特征;
对于多个尺度中的每个尺度,从所述图像特征中提取所述尺度对应的局部特征;
根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;
对所述拼接图像特征进行分类,得到所述病理图像所属的类别。
另一方面,提供了一种图像分类装置,所述装置包括:
获取模块,用于获取待分类的病理图像的图像特征;
聚合模块,用于对于多个尺度中的每个尺度,从所述图像特征中提取所述尺度对应的局部特征;
拼接模块,用于根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;
分类模块,用于对所述拼接图像特征进行分类,得到所述病理图像所属的类别。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的图像分类方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的图像分类方法所执行的操作。
再一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述方面所述的图像分类方法所执行的操作。
本申请实施例提供的方法、装置、计算机设备及存储介质,在获取到病理图像的图像特征后,按照多个尺度,分别对病理图像的图像特征进行处理,得到多个尺度分别对应的 局部特征,再根据多个尺度分别对应的局部特征进行拼接处理得到拼接图像特征,对该拼接图像特征进行分类,得到病理图像的类别。由于不同尺度对应的局部特征所包含的信息不同,使得最终得到的拼接图像特征包含不同尺度对应的特征信息,丰富了拼接图像特征的特征信息,基于该拼接图像特征来确定病理图像所属的类别,以保证该类别的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的结构示意图;
图2是本申请实施例提供的一种图像分类方法的流程图;
图3是本申请实施例提供的另一种图像分类方法的流程图;
图4是本申请实施例提供的一种提取局部特征的示意图;
图5是本申请实施例提供的一种基于获取任一聚合特征的流程图;
图6是本申请实施例提供的一种获取待处理子特征对应的第一更新特征的流程图;
图7是本申请实施例提供的一种基于分类模型进行图像分类的流程图;
图8是本申请实施例提供的一种图像分类装置的结构示意图;
图9是本申请实施例提供的一种图像分类装置的结构示意图;
图10是本申请实施例提供的一种终端的结构示意图;
图11是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,能够将第一特征向量称为第二特征向量,且类似地,可将第二特征向量称为第一特征向量。
本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个尺度包括3个尺度,而每个是指这3个尺度中的每一个尺度,任一是指这3个尺度中的任意一个,能够是第一个,或者,是第二个,或者,是第三个。
本申请实施例提供的方案,可以基于人工智能的机器学习技术,训练分类模型,利用训练后的分类模型,实现对病理图像的分类。
本申请实施例提供的图像分类方法,由计算机设备执行。在一种可能的实现方式中,该计算机设备为终端或服务器。在一种可能的实现方式中,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式系统,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、 CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。在一种可能的实现方式中,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电及车载终端等,但并不局限于此。
在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备能够组成区块链系统。
图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
终端101用于获取病理图像,向服务器102发送该病理图像。服务器102用于对终端101发送的病理图像进行分类,得到该病理图像所属的类别。
在一些实施例中,终端101上安装由服务器102提供服务的目标应用,终端101能够通过该目标应用实现例如数据传输、消息交互等功能。在一种可能的实现方式中,目标应用为终端101操作系统中的目标应用,或者为第三方提供的目标应用。例如,目标应用为图像分类应用,该图像分类应用具有图像分类的功能,当然,该图像分类应用还能够具有其他功能,例如,点评功能、导航功能等。
终端101用于获取病理图像,基于用户标识登录目标应用,通过目标应用向服务器102发送该病理图像,服务器102用于接收终端101发送的病理图像,对该终端101发送该病理图像进行分类,得到该病理图像所属的类别。在一种可能的实现方式中,服务器102向终端101发送分类结果,该分类结果指示该病理图像所属的类别,终端101接收服务器102发送的分类结果并显示。
图2是本申请实施例提供的一种图像分类方法的流程图,由计算机设备执行,如图2所示,该方法包括:
201、计算机设备获取待分类的病理图像的图像特征。
其中,病理图像用于呈现机体器官、组织或细胞的病理形态的图像,例如,该病理图像为WSI(Whole Slide Image,数字化病理图像)。病理图像的图像特征用于表征该病理图像,该病理图像的图像特征为二维特征或三维特征,该图像特征能够以任意的形式表示。例如,该图像特征以特征矩阵的形式表示或者以特征向量的形式表示。再例如,该图像特征以三维特征矩阵或二维特征矩阵的形式表示。
202、计算机设备对于多个尺度中的每个尺度,从该图像特征中提取该尺度对应的局部特征。
其中,该尺度用于从该图像特征中提取的局部特征的特征尺寸大小,多个尺度的大小不同,例如,多个尺度均为二维尺度,如该多个尺度分别为3×3,或者为5×5,或者为7×7。每个局部特征为图像特征中的部分特征,任一尺度对应的任一局部特征表示该局部特 征的特征尺寸与该尺度相匹配,即该局部特征是基于该尺度从图像特征中提取的。对于多个尺度中的任一尺度,从该图像特征中提取该尺度对应的至少一个局部特征。
203、计算机设备根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征。
由于不同尺度对应的局部特征所包含的信息不同,根据不同尺度的局部特征进行拼接处理,即可保证该拼接图像特征包含多个尺度对应的特征信息。
在一种可能的实现方式中,若一个尺度对应的局部特征包括多个,则根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征的方式可以是针对每个尺度对应的多个局部特征,将尺度对应的多个局部特征进行聚合,得到聚合特征,再将多个聚合特征进行拼接处理,得到拼接图像特征。
204、计算机设备对该拼接图像特征进行分类,得到该病理图像所属的类别。
本申请实施例提供的方法、装置、计算机设备及存储介质,在获取到病理图像的图像特征后,按照多个尺度,分别对病理图像的图像特征进行处理,得到多个尺度分别对应的局部特征,再根据多个尺度分别对应的局部特征进行拼接处理得到拼接图像特征,对该拼接图像特征进行分类,得到病理图像的类别。由于不同尺度对应的局部特征所包含的信息不同,使得最终得到的拼接图像特征包含不同尺度对应的特征信息,丰富了拼接图像特征的特征信息,基于该拼接图像特征来确定病理图像所属的类别,以保证该类别的准确性。
在图2所示实施例的基础上,还能够采取先分割再拼接的方式来获取病理图像的图像特征;采取自注意力机制,获取多个聚合特征,并对获取到的拼接图像特征进行更新,之后基于更新后的拼接图像特征来获取病理图像所属的类别,具体过程详见下述实施例。
图3是本申请实施例提供的另一种图像分类方法的流程图,由计算机设备执行,如图3所示,该方法包括:
301、计算机设备对待分类的病理图像进行分割,得到多个子图像。
其中,每个子图像为该病理图像中的部分图像,多个子图像能够组成该病理图像。在一种可能的实现方式中,该多个子图像的图像尺寸相同。例如,病理图像的图像尺寸为40000×40000,每个子图像的尺寸为4000×4000,在对该病理图像进行分割后,得到100个子图像。
在一种可能实现方式中,该步骤301包括:基于预设尺寸,对该病理图像进行分割,得到多个子图像。其中,每个子图像的尺寸与该预设尺寸相同。例如,该预设尺寸为1120×1120,则分割到的每个子图像的尺寸大小均为1120×1120。
在一种可能的实现方式中,对病理图像进行分割的过程,包括:基于第一移动步长,将第一滑动窗口在该病理图像上移动,将每次移动后的第一滑动窗口内的部分病理图像确定为一个子图像。
其中,第一滑动窗口的尺寸与该预设尺寸相同,第一移动步长表示每次移动第一滑动窗口的移动距离,例如,第一移动步长表示移动第一滑动窗口时每次移动的像素点数目。在一种可能的实现方式中,该预设尺寸包括第一尺寸和第二尺寸,第一尺寸和第二尺寸分别表示第一滑动窗口的长和宽,第一移动步长与第一尺寸和第二尺寸相同。例如,预设尺 寸为1120×1120,第一移动步长为1120,按照此第一移动步长和预设尺寸得到该病理图像中的多个子图像,每个子图像的尺寸为1120×1120。
在一种可能的实现方式中,病理图像以三维特征矩阵的形式表示,分割得到的每个子图像也以三维特征矩阵的形式表示,该多个子图像能够拼接成该病理图像,则该病理图像及该多个子图像,满足以下关系:
B={p 0,0,p r,c,…,p H′,W′}
B∈R H×W×3
Figure PCTCN2022129702-appb-000001
Figure PCTCN2022129702-appb-000002
其中,B表示病理图像,B∈R H×W×3指示该病理图像的图像尺寸为H×W×3,H、W表示病理图像的长度和宽度,H、W为任意的正整数;p 0,0、p r,c、p H′,W′均表示多个子图像中的一个子图像,p 0,0、p r,c
Figure PCTCN2022129702-appb-000003
指示每个子图像的图像尺寸为τ h×τ w×3,τ h、τ w表示每个子图像的长度和宽度,τ h、τ w均为任意的正整数,且τ h小于H,τ w小于W;r,c表示多个子图像的序号,r为大于0不大H′的整数,c为大于0不大于W′的正整数;H′为按照子图像的图像尺寸τ h在病理图像的图像尺寸H上分割出的数量,W′为按照子图像的图像尺寸τ w在病理图像的图像尺寸W上分割出的数量,H′×W′即表示从病理图像中分割出的子图像的总数目。
302、计算机设备分别对每个子图像进行特征提取,得到每个子图像的图像特征。
其中,每个子图像的图像特征用于表征对应的子图像,该子图像的图像特征为二维特征或三维特征,该图像特征能够以任意的形式表示。例如,子图像的图像特征以特征向量的形式表示,或者,以特征矩阵的形式表示。再例如,该子图像的图像特征以二维特征矩阵的形式表示,或者,以三维特征矩阵的形式表示。
在一种可能实现方式中,每个子图像及对应的图像特征,满足以下关系:
e r,c=f E(p r,c)∈R D
其中,e r,c表示多个子图像中的任一子图像,r,c表示多个子图像的序号,p r,c表示多个子图像中第r,c个子图像;f E(·)表示特征提取函数,基于该特征提取函数f E(·),能够分别对每个子图像进行特征提取,得到每个子图像的图像特征;e r,c∈R D表示图像特征e r,c为D维的特征向量。
303、计算机设备基于该多个子图像在该病理图像中的位置,将该多个子图像的图像特征进行拼接,得到该病理图像的图像特征。
其中,病理图像的图像特征用于表征该病理图像,该病理图像的图像特征能够以任意的形式表示。例如,多个子图像的图像特征均为二维特征矩阵,则该病理图像的图像特征 也为二维特征矩阵;多个子图像的图像特征均为三维特征矩阵,则该病理图像的图像特征也为三维特征矩阵。
由于不同的子图像在该病理图像中的位置不同,基于每个子图像在病理图像中的位置,将多个子图像的图像特征进行拼接,得到该病理图像的图像特征,使得病理图像的图像特征与该病理图像相对应,该病理图像的图像特征中保留了各个子图像的位置信息,从而保证该图像特征的准确性。并且,通过先将病理图像分割成多个小尺寸的子图像,在获取到每个子图像的图像特征后,再采取拼接的方式,将多个子图像的图像特征拼接成病理图像的图像特征,无需直接对大尺寸的病理图像进行特征提取,从而降低了对设备性能的需要,降低了对用于图像分类的设备的要求,以保证此种特征提取方式的通用性。
在一种可能的实现方式中,在多个子图像的图像特征均为二维特征矩阵的情况下,该病理图像的图像特征的特征尺寸为该多个子图像的图像特征的特征尺寸之和。例如,病理图像包括4个子图像,每个子图像的图像特征的特征尺寸为2×2,则该病理图像的图像特征的特征尺寸为8×8。
在一种可能的实现方式中,在多个子图像的图像特征均为三维特征矩阵的情况下,子图像的图像特征的特征尺寸包括第一尺寸、第二尺寸及第三尺寸,该病理图像的图像特征的特征尺寸包括第四尺寸、第五尺寸及第六尺寸,该第四尺寸为多个子图像对应的第一尺寸之和,该第五尺寸为多个子图像对应的第二尺寸之和,该第六尺寸与该第三尺寸相同。例如,病理图像包括4个子图像,每个子图像的图像特征的特征尺寸为2×2×10,则该病理图像的图像特征的特征尺寸为8×8×10。
在一种可能的实现方式中,多个子图像的图像特征与病理图像的图像特征,满足以下关系:
E=(e 0,0,e r,c,…,e H′,W′)∈R W′×H′×D
其中,E表示病理图像的图像特征,e 0,0、e r,c、e H′,W′均表示多个子图像中的一个子图像的图像特征;r,c表示多个子图像的序号,r为大于0不大于H′的整数,c为大于0不大于W′的正整数;H′为按照子图像的特征尺寸τ h在病理图像的H维度上分割出的数量,W′为按照子图像的特征尺寸τ w在病理图像的W维度上分割出的数量,H′×W′即表示从病理图像中分割出的子图像的总数目;D表示在每个子图像的图像特征为向量的情况下,每个子图像的图像特征的向量维度。
需要说明的是,本申请实施例是以先分割再拼接的方式,将病理图像分割成多个子图像,基于多个子图像来获取病理图像的图像特征的,而在另一实施例中,无需执行步骤301-303,能够采取其他方式,获取待分类的病理图像的图像特征。
304、计算机设备对于多个尺度中的每个尺度,从该病理图像的图像特征中提取该尺度对应的多个局部特征,分别将提取到的每个局部特征中的第二子特征进行拼接,得到每个局部特征对应的第一特征向量。
在本申请实施例中,病理图像的图像特征包括位于多个位置上的第二子特征,该第二子特征为一维特征或二维特征,例如,第二子特征包括一个特征值,或者,该第二子特征是由多个特征值构成的特征向量。在该病理图像的图像特征为二维特征的情况下,该第二 子特征包括一个特征值;在该病理图像的图像特征为三维特征的情况下,该第二子特征包括多个特征值,即该第二子特征是由多个特征值构成的特征向量。例如,该病理图像的图像特征的特征尺寸为3×3×10,该图像特征包括9个位置上的第二子特征,每个第二子特征是由10个特征值构成的特征向量。
对于多个尺度中的任一尺度,基于该尺度从该病理图像的图像特征中提取到至少一个局部特征,每个局部特征包括位于至少一个位置上的第二子特征。在一种可能的实现方式中,任一尺度对应有多个局部特征,每个局部特征包括位于多个位置上的第二子特征,不同的局部特征可能包括相同的第二子特征。病理图像的图像特征包括位于3×3个位置上的第二子特征,如图4所示,每个方框相当于一个位置;尺度为2×2,基于该尺度从该病理图像的图像特征401中提取到4个局部特征402,每个局部特征402包括位于4个位置上的第二子特征,即病理图像的图像特征中,左上角4个位置上的第二子特征构成一个局部特征402,右上角四个位置上的第二子特征构成一个局部特征402,左下角四个位置上的第二子特征构成一个局部特征402,右下角四个位置上的第二子特征构成一个局部特征402,左上角的局部特征402与右上角的局部特征402包括两个相同的第二子特征。
对于任一局部特征,将该局部特征中的第二子特征拼接成一个第一特征向量,该第一特征向量的特征尺寸为局部特征中至少一个第二子特征的特征尺寸之和。例如,任一局部特征包括4个第二子特征,每个第二子特征的特征尺寸为为1×3,将4个第二子特征拼接成一个第一特征向量,该局部特征对应的第一特征向量的尺寸为1×12。
在一种可能实现方式中,对于任一尺度,提取该尺度对应的局部特征的过程,包括:基于第二移动步长,将该尺度对应的第二滑动窗口在该病理图像的图像特征上移动,将每次移动后的第二滑动窗口内的至少一个位置上的第二子特征构成一个局部特征。
其中,该尺度对应的第二滑动窗口的尺寸与该尺度相同。在一种可能的实现方式中,该尺度为第二滑动窗口的边长。例如,该尺度为一维尺度,则该第二滑动窗口的长度和宽度均与该尺度相同;如该尺度为3,该第二滑动窗口的尺寸为3×3。再例如,该尺度为二维尺度,该二维尺度包括长度和宽度,该尺度对应的第二滑动窗口的长度和宽度,分别与二维尺度包括的长度和宽度相等。第二移动步长表示每次移动第二滑动窗口的距离,例如,第二移动步长表示移动第二滑动窗口时每次移动的位置数,如该第二移动步长为1,即每次移动第二滑动窗口时,移动一个位置即可。如图4所示,第二滑动窗口的尺寸为2×2,第二移动步长为1,提取到的每个局部特征402包括位于4个位置上的第二子特征。
在一种可能的实现方式中,提取任一尺度对应的局部特征的过程包括:确定该尺度对应的扩充参数,基于该扩充参数对该病理图像的图像特征进行扩充,得到扩充后的图像特征,基于第二移动步长,将尺度对应的第二滑动窗口在该病理图像的图像特征上移动,将每次移动后的第二滑动窗口内的至少一个位置上的第二子特征构成一个局部特征。
其中,扩充参数指示扩充病理图像的图像特征中的位置数目,例如,扩充参数为Padding。对于任一尺度对应的扩充参数,将病理图像的图像特征周围扩充出该扩充参数指示的位置数目,以使扩充后的图像特征的特征尺寸变大。例如,在病理图像的图像特征进行扩充后,扩充后的图像特征的特征尺寸中的长度和宽度均增大2倍的扩充参数指示的位置数目。例 如,病理图像的图像特征为3×3的特征矩阵,任一尺度对应的扩充参数为1,则扩充后的图像特征为5×5的特征矩阵;任一尺度对应的扩充参数为2,则扩充后的图像特征为7×7的特征矩阵。
在一种可能的实现方式中,任一尺度为一维尺度,确定该尺度对应的扩充参数的过程包括:确定该尺度与第一数值的差值,将该差值与第二数值的比值确定为该尺度对应的扩充参数。
其中,第一数值和第二数值均为任意的数值,例如,第一数值为1,第二数值为2。
在一种可能的实现方式中,任一尺度及该尺度对应的扩充参数,满足以下关系:
Figure PCTCN2022129702-appb-000004
其中,κ表示尺度,β表示尺度κ对应的扩充参数,在本申请实施例中,第一数值为1,第二数值为2。
例如,病理图像的图像特征的特征尺寸为4×4,第一尺度为3,即第一尺度对应的第二滑动窗口的尺寸为3×3,第一尺度对应的第一扩充参数为1,即基于第一扩充参数扩充后的图像特征的特征尺寸为6×6,基于第一尺度对应的第二滑动窗口,能够从中提取到16个特征尺寸为3×3的局部特征;第二尺度为5,即第二尺度对应的第二滑动窗口的尺寸为5×5,第二尺度对应的第二扩充参数为2,即基于第二扩充参数扩充后的图像特征的特征尺寸为8×8,基于第二尺度对应的第二滑动窗口,能够从中提取到16个特征尺寸为5×5的局部特征,即基于第一尺度和第二尺度提取到的局部特征均为16个。
在基于每个尺度从病理图像的图像特征中提取局部特征时,先基于每个尺度对应的扩充参数对病理图像的图像特征进行扩充,以保证基于每个尺度提取到的局部特征的数目相同,以便后续基于多个尺度获取到的特征融合。
在一种可能实现方式中,对于多个尺度中的任一尺度,在得到该尺度对应的每个局部特征所对应的第一特征向量的情况下,将该多个第一特征向量构成该尺度对应的第一特征矩阵。
在一种可能的实现方式中,对于多个尺度中的任一尺度,该尺度对应的第一特征矩阵及该病理图像的图像特征,满足以下关系:
T=SoftSplit(E)=Concat(Unfold(E))
Figure PCTCN2022129702-appb-000005
Figure PCTCN2022129702-appb-000006
其中,T表示该尺度对应的第一特征矩阵;E表示病理图像的图像特征,SoftSplit(·)表示特征重构函数,用于将病理图像的图像特征E构成该第一特征矩阵;Concat(·)表示拼接函数,用于将多个第一特征向量构成该尺度对应的第一特征矩阵;unfold(·)表示展开函数,用于将该尺度对应的局部特征中的第二子特征进行拼接成一个第一特征向量;
Figure PCTCN2022129702-appb-000007
表示该尺度对应的第一特征矩阵的尺寸为H″W″×κ 2D,κ表示该尺度,κ为正整数;该尺度κ对应的每个局部特征的特征尺寸为κ×κ;病理图像的图像特征的特征尺寸为W′×H′×D,W′、H′表示病理图像的图像特征的长度和宽度,D表示病理图像的图像特征中每个第二子特征的维度,W′、H′、D均为任意的正整数;H″表示按照尺度κ从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的H′维度分成的数量;W″表示按照尺度κ从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的W′维度分成的数量;D表示每个第二子特征的向量维度;κ 2D表示每个第一特征向量的向量维度;H″W″表示尺度κ对应的多个局部特征的数目,也表示尺度κ对应的多个第一特征向量的数目;β表示尺度κ对应的扩充参数;α表示第二移动步长。
305、计算机设备基于多个局部特征对应的第一特征向量,分别对每个第一特征向量进行更新,得到每个第一特征向量对应的第二特征向量。
在本申请实施例中,对于多个尺度中的任一尺度,该尺度对应有多个局部特征,考虑到不同的局部特征之间具有关联性,在获取到多个局部特征对应的第一特征向量后,通过多个局部特征对应的第一特征向量,对每个第一特征向量进行更新,使得更新得到的第二特征向量中融入了其他局部特征对应的第一特征向量,从而保证第二特征向量的准确性。
在一种可能实现方式中,该步骤305包括:对于多个第一特征向量的待处理特征向量,获取每个第一特征向量与该待处理特征向量之间的相似度,基于每个第一特征向量对应的相似度,对该多个第一特征向量进行加权融合,得到该待处理特征向量对应的第二特征向量。
其中,待处理特征向量为多个第一特征向量中的任一第一特征向量。任一第一特征向量与该待处理特征向量之间的相似度,表示该第一特征向量与该待处理特征向量之间的相似程度,该相似度能够采用余弦相似度或者其他相似度的获取方式来获取。由于每个第一特征向量对应的相似度能够表示该第一特征向量与该待处理特征向量之间的相似程度,采取自注意力机制,基于多个第一特征向量与待处理特征向量之间的相似度,对该第一特征向量进行加权融合,得到待处理特征向量对应的第二特征向量,使得第二特征向量中按照各个第一特征向量对应的相似度融入了多个第一特征向量,以保证得到的第二特征向量的准确性。按照上述获取待处理特征向量对应的第二特征向量的方式,即可获取到每个第一特征向量对应的第二特征向量。
在一种可能的实现方式中,获取待处理特征向量对应的第二特征向量的过程包括:对于多个第一特征向量的待处理特征向量,获取每个第一特征向量与该待处理特征向量之间的相似度,基于每个第一特征向量对应的相似度,对该多个第一特征向量进行加权融合,得到第三特征向量,对该第三特征向量进行特征变换,得到该待处理特征向量对应的第二特征向量。
在本申请实施例中,每个第一特征向量与对应的第二特征向量的特征维度不同。对于多个尺度中的每个尺度,不同尺度对应的第二特征向量的特征维度相同。在对每个尺度对应的多个第一特征向量进行更新的过程中,将特征向量转换为相同特征维度的特征向量,以保证后续基于每个尺度得到的聚合特征的特征尺寸相同。
在一种可能的实现方式中,对第三特征向量进行特征变换的过程包括:将第三特征向量与特征变换矩阵的乘积,确定为该目标特征向量对应的第二特征向量。
其中,特征变换矩阵用于对第三特征向量进行转换,该特征变换矩阵为任意的常数矩阵。
在一种可能实现方式中,对于多个尺度中的任一尺度,该尺度对应的每个局部特征所对应的第一特征向量构成了该尺度对应的第一特征矩阵,则该步骤305包括:基于该第一特征矩阵中的多个第一特征向量,分别对该第一特征矩阵中每个第一特征向量进行更新,得到每个第一特征向量对应的第二特征向量,将多个第二特征向量构成第二特征矩阵。
在一种可能的实现方式中,对于多个尺度中的任一尺度,该尺度对应的第一特征矩阵及第二特征矩阵,满足以下关系:
Figure PCTCN2022129702-appb-000008
MSA(T)=Concat(H 1,…,H w,…,H Ω)W O
Figure PCTCN2022129702-appb-000009
Figure PCTCN2022129702-appb-000010
其中,T′表示该尺度对应的第二特征矩阵;MLP(·)表示多层感知函数,用于对特征进行全连接变换;MSA(·)表示多头自注意力函数;T表示该尺度对应的第一特征矩阵;病理图像的图像特征的特征尺寸为W′×H′×D,W′、H′表示病理图像的图像特征的长度和宽度,D表示病理图像的图像特征中每个第二子特征的维度,W′、H′、D均为任意的正整数;H″表示按照该尺度从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的H′维度分成的数量;W″表示按照该尺度从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的W′维度分成的数量;H″W″表示尺度κ对应的多个局部特征的数目,也即是多个第二特征向量的数目;d z表示每个第二特征向量的向量维度;Concat(·)表示连接函数;Ω表示多头自注意力函数中的头数,Ω为大于1的正整数;H w表示多头自注意力函数中任一头输出的特征,w表示多头自注意力函数中的每个头自注意力的序号,w为大于0且不大于Ω的正整数;W O表示映射矩阵,也是常数矩阵;
Figure PCTCN2022129702-appb-000011
均为第w个头自注意力函数中的常数矩阵;A(·)表示多头自注意力函数中第w个头自注意力函数;κ 2D表示该尺度对应的第一特征矩阵中每个第一特征向量的向量维度。
306、计算机设备基于该多个局部特征在该病理图像的图像特征中的位置,将多个第二特征向量构成三维特征矩阵,将该三维特征矩阵确定为聚合特征。
其中,不同的局部特征在病理图像的图像特征中的位置不同。任一局部特征对应的第二特征向量为该局部特征在病理图像中对应的位置的像素点的特征,在一种可能的实现方式中,任一局部特征对应的第二特征向量是该局部特征在病理图像中对应的一个或多个像素点的特征。例如,该病理图像中的图像特征用于表征该病理图像,该病理图像中的任一局部特征是该病理图像中的部分区域中的像素点的特征,该病理图像中的部分区域中的像素点包括一个或多个,则该局部特征对应的第二特征向量是该病理图像中的部分区域中的一个或多个像素点的特征。
按照多个局部特征在病理图像的图像特征中的位置,将多个局部特征对应的第二特征向量构成一个三维特征矩阵,该三维特征矩阵即为一个聚合特征。例如,任一尺度对应的多个局部特征的个数为4,每个局部特征对应的第二特征向量的维度为10,基于该多个局部特征对应的第二特征向量构成的聚合特征的特征尺寸为2×2×10。按照上述步骤304-306的方式,基于多个尺度分别对病理图像的图像特征进行处理,得到多个聚合特征。
在基于每个尺度对病理图像的图像特征进行处理的过程中,将每个局部特征中的第二子特征拼接成一个特征向量,考虑到不同的局部特征之间具有关联性,通过多个局部特征对应的第一特征向量,对每个第一特征向量进行更新,使得更新得到的第二特征向量中融入了其他局部特征对应的第一特征向量,从而保证第二特征向量的准确性,并按照多个局部特征在病理图像的图像特征中的位置,将多个局部特征对应的特征向量构成的三维特征矩阵确定为聚合特征,使得聚合特征中保留个原来的病理图像的图像特征中的位置信息,以保证聚合特征的准确性。
在一种可能实现方式中,不同尺度对应的多个局部特征的数目相同,不同尺度对应的第二特征向量的特征维度相同,则基于不同尺度获取到的聚合特征的特征尺寸相同。
在一种可能实现方式中,对于多个尺度中的任一尺度,该尺度对应的多个第二特征向量构成第二特征矩阵,则步骤306包括:基于该多个局部特征在该病理图像的图像特征中的位置,将第二特征矩阵中多个第二特征向量构成三维特征矩阵,将该三维特征矩阵确定为聚合特征。
在一种可能的实现方式中,该第二特征矩阵与该聚合特征,满足以下关系:
Figure PCTCN2022129702-appb-000012
其中,E′表示基于该尺度得到的聚合特征;Reshape(·)表示重塑函数,用于对第二特征矩阵进行重塑,恢复空间位置信息,得到新的特征图;
Figure PCTCN2022129702-appb-000013
表示聚合特征E′的特征尺寸;病理图像的图像特征的特征尺寸为W′×H′×D,W′、H′表示病理图像的图像特征的长度和宽度,D表示病理图像的图像特征中每个第二子特征的维度,W′、H′、D均为任意的正整数;H″表示按照该尺度从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的H′维度分成的数量;W″表示按照该尺度从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的W′维度分成的数量;d z表示每个第二特征向量的向量维度。
在基于任一尺度获取聚合特征的过程,如图5所示,以病理图像的图像特征为4×4的矩阵为例,任一尺度为3,从病理图像的图像特征中提取4个局部特征501,将每个局部特征501融合成一个第一特征向量502,采取多头注意力机制及多层感知器,按照上述步骤305-306,对每个第一特征向量进行更新,将将多个第二特征向量构成聚合特征503。
需要说明的是,本申请实施例是每个尺度对应有多个局部特征为例进行说明的,而在另一实施例中,任一尺度对应有一个局部特征,则将该尺度对应的局部特征中的子特征进行拼接,得到该局部特征对应的第一特征向量,将该第一特征向量确定为聚合特征。
需要说明的是,本申请实施例是以局部特征包括多个位置上的第二子特征为例,基于多个尺度中的每个尺度及病理图像的图像特征,获取多个聚合特征的,而在另一实施例中, 无需执行上述步骤304-306,能够采取其他方式,对于多个尺度中的每个尺度,从该图像特征中提取该尺度对应的多个局部特征,将该尺度对应的多个局部特征进行聚合,得到聚合特征。
307、计算机设备将得到的多个聚合特征进行拼接,得到拼接图像特征。
在本申请实施例中,基于多个尺度对病理图像的图像特征进行处理,得到多个聚合特征,不同的聚合特征包含了不同尺度对应的特征信息,将该多个聚合特征进行拼接,使得该拼接图像特征包含多个尺度对应的特征信息。
在一种可能实现方式中,该步骤307包括:将该多个聚合特征中处于相同位置的特征进行拼接,得到多个位置对应的特征向量;将该多个位置对应的特征向量构成的三维特征矩阵,确定为该拼接图像特征。
在本申请实施例中,该多个聚合特征的特征尺寸相同,每个聚合特征包括位于多个位置上的特征,每个位置上的特征为一个第二特征向量。对于不同的聚合特征,相同位置上的特征是病理图像中相同位置上的像素点的特征,因此,将多个聚合特征中处于相同位置的特征进行拼接,得到多个位置对应的特征向量。基于多个位置,将多个位置对应的特征向量构成一个三维特征矩阵,将该三维特征矩阵确定为拼接图像特征。
例如,多个尺度包括3个,每个聚合特征的特征尺寸为4×4×10,3个聚合特征拼接得到的拼接图像特征的特征尺寸为4×4×30。
在一种可能的实现方式中,基于多个聚合特征得到的拼接图像特征满足以下关系:
E″=Concat(E′ 1、E′ 2、E′ γ)
E″∈R H″×W″×C
C=γd z
其中,E″表示拼接图像特征;Concat(·)表示拼接函数;E′ 1、E′ 2、E′ γ表示基于不同尺度得到的聚合特征,γ表示多个尺度的数目;E″∈R H″×W″×C表示拼接图像特征的特征尺寸为H″×W″×C;病理图像的图像特征的特征尺寸为W′×H′×D,W′、H′表示病理图像的图像特征的长度和宽度,D表示病理图像的图像特征中每个第二子特征的维度,W′、H′、D均为任意的正整数;H″表示按照每个尺度从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的H′维度分成的数量;W″表示按照每个尺度从病理图像的图像特征中提取局部特征时,将病理图像的图像特征的W′维度分成的数量;C表示拼接图像特征中每个第一子特征的特征尺寸;d z表示每个第二特征向量的向量维度。
308、计算机设备基于拼接图像特征中的多个第一子特征,分别对每个第一子特征进行更新,得到每个第一子特征对应的第一更新特征。
其中,拼接图像特征包括位于多个位置上的第一子特征,即该拼接图像特征包括多个第一子特征,每个第一子特征包含了不同尺度对应的特征信息。在本申请实施例中,不同位置上的第一子特征之间具有关联性,采取自注意力机制,通过多个第一子特征,对每个 第一子特征进行更新,使得更新得到的第一更新特征中融入了其他第一子特征,从而保证第一更新特征的准确性。
在一种可能实现方式中,该步骤308:对于该多个第一子特征中的待处理子特征,获取该多个第一子特征的权重;基于该多个第一子特征的权重,对该多个第一子特征进行加权融合,得该待处理子特征对应的第一更新特征。
其中,任一第一子特征的权重指示该第一子特征与待处理子特征之间的关联程度,权重越大,表示该第一子特征与该待处理子特征越相关;该权重越小,表示该第一子特征与该待处理子特征越不相关。由于每个第一子特征的权重表示该第一子特征与待处理子特征之间的关联程度,即按照多个第一子特征与该待处理子特征之间的关联程度,将多个第一子特征加权融合为第一更新特征,以保证得到的第一更新特征的准确性。按照上述获取待处理子特征对应的第一更新特征的方式,能够获取到每个第一子特征对应的第一更新特征。
在一种可能的实现方式中,获取每个第一子特征的权重的过程,包括:对于该多个第一子特征中的待处理子特征,获取每个第一子特征与该待处理子特征之间的距离特征;基于每个第一子特征与该待处理子特征之间的相似度及距离特征,获取每个第一子特征的权重。
其中,任一第一子特征与该待处理子特征之间的距离特征,指示在拼接图像特征中该第一子特征与该待处理子特征所处的位置之间的距离;任一第一子特征与该待处理子特征之间的相似度表示该第一子特征与该待处理子特征之间的相似程度。
在本申请实施例中,病理图像中不同位置的特征之间可能存在关联。对于任一第一子特征,由于该第一子特征与待处理子特征之间的相似度,能够表示该第一子特征与待处理子特征之间的相似程度;而该第一子特征与待处理子特征之间的距离特征,能够指示该第一子特征与该待处理子特征在拼接图像特征中的分布情况,基于该第一子特征与待处理子特征之间的相似度及距离特征,获取该第一子特征的权重,不仅考虑到第一子特征与目标在特征之间的相似程度,也考虑到了第一子特征与目标在特征之间的相对位置关系,即充分考虑到了第一子特征与目标在特征之间的关联性,以保证获取到的权重的准确性。
在一种可能的实现方式中,获取距离特征的过程包括:基于每个第一子特征及待处理子特征在该拼接图像特征中的位置,确定每个第一子特征对应的距离;分别对每个第一子特征对应的距离进行映射处理,得到每个第一子特征与待处理子特征之间的距离特征。
其中,任一第一子特征对应的距离表示该第一子特征与待处理子特征所处的位置之间的距离。每个第一子特征在拼接图像特征中的位置能够以任意的形式表示,例如,每个第一子特征在拼接图像特征中的位置以二维坐标的形式表示。对于任一第一子特征,基于该第一子特征对应的位置及该待处理子特征对应的位置,即可确定出两个位置之间的距离,即为该第一子特征对应的目标距离。将该第一子特征对应的距离映射为距离特征,以便后续能够基于该距离特征来获取该第一子特征的权重。
在一种可能的实现方式中,基于每个第一子特征与该待处理子特征之间的相似度及距离特征,获取每个第一子特征的权重的过程,包括:对于多个第一子特征中的每个第一子特征,将该第一子特征与该待处理子特征之间的相似度及距离特征进行融合,得到该第一 子特征对应的第一匹配度;确定多个第一子特征对应的第一匹配度的和值;将每个第一子特征对应的第一匹配度与该和值的比值,分别确定为每个第一子特征的权重。
其中,任一第一子特征对应的第一匹配度指示该第一子特征与待处理子特征之间的匹配程度。在获取任一子特征的权重时,先获取每个第一子特征与该待处理子特征之间的第一匹配度,并考虑到多个第一子特征与该待处理子特征之间的匹配程度,将每个第一子特征对应的第一匹配度与该和值的比值,分别确定为每个第一子特征的权重,以保证与待处理子特征越匹配的第一子特征的权重越大,从而保证权重的准确性。
在一种可能的实现方式中,获取任一第一子特征与该待处理子特征之间的第一匹配度的过程包括:将该第一子特征与该待处理子特征之间的相似度与距离特征进行融合,得到第二匹配度;对该第二匹配度进行特征变换,得到该第一子特征对应的第一匹配度。
通过先获取第二匹配度,再对第二匹配度进行特征变换,以保证每个第一子特征对应的第一匹配度属于相同的区间内,以便后续对多个第一子特征对应的第一匹配度进行对比。
在一种可能的实现方式中,对于该多个第一子特征中的待处理子特征,任一第一子特征的权重,满足以下关系:
Figure PCTCN2022129702-appb-000014
Figure PCTCN2022129702-appb-000015
Figure PCTCN2022129702-appb-000016
ρ i=(r″ i,c″ i);ρ j=(r″ j,c″ j)
Figure PCTCN2022129702-appb-000017
其中,在多个第一子特征中,待处理子特征e″ i为多个第一子特征中的第i个第一子特征;任一第一子特征为多个第一子特征中的第j个第一子特征e″ j;a ij(X,W Q,W K)表示第一子特征e″ j的权重;X表示多个第一子特征构成的特征矩阵,W Q、W K为常数矩阵;exp(η″ ij)表示第一子特征e″ j对应的第一匹配度;exp(·)表示自然常数e为底的指数函数;η″ ij表示第一子特征e″ j与待处理子特征e″ i之间的第二匹配度;
Figure PCTCN2022129702-appb-000018
表示多个第一子特征对应的第一匹配度的和值;N表示多个第一子特征的总数目;η″ ik表示多个第一子特征中第k个第一子特征与待处理子特征e″ i之间的第二匹配度;
Figure PCTCN2022129702-appb-000019
表示第一子特征e″ j与待 处理子特征e″ i之间的相似度;d″ z为任意的常数;T表示对矩阵的转置;
Figure PCTCN2022129702-appb-000020
表示第一子特征e″ j与待处理子特征e″ i之间的距离特征;θ(·)表示映射函数,用于将距离映射为距离特征;μ(ρ i,ρ j)表示第一子特征e″ j对应的距离;ρ i表示待处理子特征e″ i在拼接图像特征中的位置,(r″ i,c″ i)表示待处理子特征e″ i在拼接图像特征中的位置的二维坐标;ρ j表示第一子特征e″ j在拼接图像特征中的位置;(r″ j,c″ j)表示第一子特征e″ j在拼接图像特征中的位置的二维坐标。
在一种可能的实现方式中,待处理子特征对应的第一更新特征,满足以下关系:
Figure PCTCN2022129702-appb-000021
Figure PCTCN2022129702-appb-000022
其中,z i表示待处理子特征对应的第一更新特征;E″表示拼接图像特征;W Q,W K,W V均为常数矩阵;N表示多个第一子特征的总数目;e″ j表示多个第一子特征中的第j个第一子特征;a ij(X,W Q,W K)表示第一子特征e″ j的权重;
Figure PCTCN2022129702-appb-000023
表示基于该多个第一子特征的权重,对该多个第一子特征进行加权融合;
Figure PCTCN2022129702-appb-000024
表示待处理子特征对应的第一更新特征z i为d z维度的特征向量,d z为任意的正整数;
Figure PCTCN2022129702-appb-000025
表示常数矩阵W Q,W K,W V的尺寸为C×d z,C、d z均为任意的正整数。基于拼接图像特征中的多个第一子特征,获取待处理子特征对应的第一更新特征的过程,如图6所示。
309、计算机设备基于该多个第一子特征在该拼接图像特征中所处的位置,将该多个第一子特征对应的第一更新特征构成三维特征矩阵,将该三维特征矩阵确定为更新后的拼接图像特征。
其中,第一更新特征为向量,即每个第一子特征对应的第一更新特征为一个向量。通过按照多个第一子特征在拼接图像特征中的位置,将多个第一更新特征构成一个三维特征矩阵,该三维特征矩阵即为更新后的拼接图像特征,使得该更新后的拼接图像特征中保留了不同特征之间的位置信息,以保证更新后的拼接图像特征的准确性。
例如,更新前的拼接图像特征的特征尺寸为3×3×10,每个第一子特征是一个维度为10的特征向量,即更新前的拼接图像特征包括9个位置;每个第一子特征对应的第一更新 特征是一个维度为8的特征向量,即多个第一更新特征构成的更新后的拼接图像特征的特征尺寸为3×3×8。
在一种可能实现方式中,更新后的拼接图像特征满足以下关系:
Z=(z 1,z 2,…,z N)
其中,Z表示更新后的拼接图像特征,z 1、z 2、z N分别表示更新后的拼接图像特征中的第一个第一更新特征、第二个第一更新特征及第N个第一更新特征,N表示多个第一更新特征的总数目,N为大于1的正整数。
在一种可能实现方式中,按照上述步骤308-309,基于该拼接图像特征,获取更新后的拼接图像特征的过程,满足以下关系:
SETL(E″)=MLP(MSA SET(LN(E″)))
E″=(e″ 1,e″ 2,…,e″ H″W″)
其中,SETL(E″)表示更新后的拼接图像特征;E″表示拼接图像特征;LN(·)表示线性变换函数;MSA SET(·)表示多头自注意力函数,用于按照上述步骤308获取每个第一子特征对应的第一更新特征;MLP(·)表示多层感知函数,用于对特征进行全连接变换;e″ 1、e″ 2、e″ H″W″表示拼接图像特征中的第一子特征;H″W″表示拼接图像特征中多个第一子特征的总数目。
需要说明的是,本申请实施例是以第一更新特征为向量为例来说明的,而在另一实施例中,第一更新特征不是向量,则无需执行步骤309,能够采取其他方式,基于该多个第一子特征在拼接图像特征中所处的位置,将该多个第一子特征对应的第一更新特征构成更新后的拼接图像特征。例如,第一更新特征包括一个特征元素,则基于该多个第一子特征在拼接图像特征中所处的位置,将该多个第一子特征对应的第一更新特征构成一个二维特征矩阵,将该二维特征矩阵确定为更新后的拼接图像特征。
310、计算机设备对该更新后的拼接图像特征进行分类,得到该病理图像所属的类别。
由于该更新的拼接图像特征中的每个第一更新特征,不仅融入了不同尺度的局部特征中的特征,还按照整个拼接图像特征中各个位置上的第一子特征之间的关联程度,融合了整个拼接图像特征中各个位置上的第一子特征,丰富了更新后的拼接图像特征,从而保证了更新后的拼接图像特征的准确性,通过对该更新后的拼接特征进行分类,保证了确定的类别的准确性。
在一种可能实现方式中,该病理图像所属的类别指示病理图像中的特定区域所处的状态。
在一种可能实现方式中,该步骤310包括:对该更新后的拼接图像特征进行分类,得到分类特征向量,将分类特征向量中最大概率对应的类别,确定为该病理图像所属的类别。
在本申请实施例中,分类特征向量包括多个维度的概率,每个维度的概率指示该病理图像属于该维度对应的类别的可能性。通过对更新后的拼接图像特征进行分类,得到分类 特征向量,以指示该病理图像属于多种类别的可能性,将分类特征向量中最大概率对应的类别,确定为病理图像所属的类别,以保证确定的类别的准确性。
在一种可能实现方式中,该更新后的拼接图像特征及该病理图像所属的类别,满足以下关系:
Y=Φ(SETL(E″))
其中,Y表示该病理图像所属的类别;SETL(E″)表示更新后的拼接图像特征;E″表示拼接图像特征;Φ(·)表示分类函数。
需要说明的是,本申请实施例在获取到拼接图像特征后,按照上述步骤308-309对拼接图像特征进行更新,直接对更新后的图像特征进行分类,得到病理图像所属的类别的,而在另一实施例中,在步骤309之后,还能够按照上述步骤308-309对更新后的拼接图像再次进行更新,能够重复执行多次,在最后一次得到更新后的拼接图像特征后,对最后一次得到的更新后的拼接图像特征进行分类,得到该病理图像所属的类别。在得到拼接图像特征后,考虑到不同位置上的特征之间的关联性,通过对拼接图像特征进行多次更新,以使拼接图像特征中不同位置上的特征能够得到充分融合,使得最终得到的更新后的拼接图像特征不同特征之间的位置信息,以保证更新后的拼接图像特征的准确性。
在一种可能实现方式中,在得到拼接图像特征后,对拼接图像特征进行多次更新,对最后一次得到的更新后的拼接图像特征进行分类,得到该病理图像所属的类别的过程,满足以下关系:
Figure PCTCN2022129702-appb-000026
其中,Y表示该病理图像所属的类别;SETL(E″)表示对拼接后的图像特征进行一次更新后,得到的更新后的拼接图像特征;E″表示拼接图像特征;M表示对拼接图像特征进行更新的次数,M为任意的正整数,例如,M为6;Φ(·)表示分类函数。
需要说明的是,本申请实施例提供的方法,能够适用于多种类型的病理图像的分类任务,如癌症分类,淋巴结转移和基因突变预测等。如对于任一种癌症类型对应的病理图像,基于本申请实施例提供的方法,能够确定病理图像对应的癌变区域对应的状态。
本申请实施例提供的方法,在获取到病理图像的图像特征后,按照多个尺度,分别对病理图像的图像特征进行处理,得到多个尺度对应的聚合特征,再将多个尺度对应的聚合特征拼接成一个拼接图像特征,对该拼接图像特征进行分类,得到病理图像的类别。由于不同尺度对应的聚合特征是通过不同尺度的局部特征聚合得到的,不同尺度对应的局部特征所包含的信息不同,使得多个聚合特征包含不同尺度对应的特征信息,将多个聚合特征拼接成拼接图像特征后,使得拼接图像特征包含了不同尺度对应的特征信息,丰富了拼接图像特征的特征信息,基于该拼接图像特征来确定病理图像所属的类别,以保证该类别的准确性。
需要说明的是,上述图3所示的实施例是在得到拼接图像特征后,先基于拼接图像特征中位于多个位置上的第一子特征对每个第一子特征进行更新,得到更新后的拼接图像特征,再对更新后的拼接图像特征进行分类的,而在另一实施例中,无需执行步骤308-310,在得到拼接图像特征后,能够采取其他方式,对该拼接图像特征进行分类,得到该病理图像所属的类别。
在一种可能实现方式中,在获取到拼接图像特征之后,基于该拼接图像特征获取病理图像所属的类别的过程,包括以下步骤1-步骤3:
步骤1、计算机设备将该拼接图像特征中每个第一子特征与对应的位置特征进行融合,得到每个第一子特征对应的第二更新特征。
在本申请实施例中,拼接图像特征包括位于多个位置上的第一子特征;任一第一子特征对应的位置特征指示该第一子特征在拼接图像特征中所处的位置,该位置特征能够以任意的形式表示,例如,该位置特征以向量的形式表示,或者,该位置特征以坐标的形式表示。
每个第二更新特征是由对应的第一子特征与对应的位置特征融合得到的,以增强拼接图像特征中各个第一子特征之间得空间信息,增强不同的第一子特征之间的区别,以提升得到的第二更新特征的准确性。
步骤2、计算机设备基于多个第一子特征在该拼接图像特征中所处的位置,将该多个第一子特征对应的第二更新特征构成更新后的拼接图像特征。
在对每个第一子特征进行更新后,每个第二更新特征中融入了对应的第一子特征的位置特征,以增强不同的第一子特征之间的区别,按照多个第一子特征在拼接图像特征中所处的位置,将多个第二更新特征按照多个第一子特征之间的位置排布,构成更新后的拼接图像特征,更新后的拼接图像特征包括位于多个位置上的第二更新特征。由于更新后的拼接图像特征中各个第二更新特征中融入了各自的位置特征,增强不同的第一子特征之间的区别,从而提升更新后的拼接图像特征的准确性。
在一种可能实现方式中,第二更新特征为向量;该步骤2包括:基于多个第一子特征在拼接图像特征中所处的位置,将该多个第一子特征对应的第二更新特征构成三维特征矩阵,将该三维特征矩阵确定为更新后的拼接图像特征。
在本申请实施例中,第一子特征为向量,将每个第一子特征与对应的位置特征融合后,得到的第二更新特征也为向量。其中,任一第一子特征与对应的第二更新特征的维度可能相同,也可能不同。例如,拼接图像特征的特征尺寸为3×3×10,即该拼接图像特征包括9个第一子特征,每个第一子特征是一个10维的特征向量;在每个第一子特征与对应的第二更新特征的维度相同的情况下,将9个第二更新特征拼接得到的更新后的拼接图像特征的特征尺寸为3×3×10;在每个第一子特征与对应的第二更新特征的维度不同的情况下,每个第二更新特征的维度为20,将9个第二更新特征拼接得到的更新后的拼接图像特征的特征尺寸为3×3×20。
步骤3、计算机设备对该更新后的拼接图像特征进行分类,得到该病理图像所属的类别。
其中,该步骤3与上述步骤310同理,在此不再赘述。
本申请实施例提供的方法,在得到拼接图像特征后,通过将拼接图像特征中每个第一子特征与对应的位置特征进行融合,得到每个第一子特征对应的第二更新特征,以增强不同的第一子特征之间的区别,使得到的更新后的拼接图像特征中各个第二更新特征中融入了各自的位置特征,增强不同的第一子特征之间的区别,从而提升更新后的拼接图像特征的准确性,基于该更新后的拼接图像特征进行分类,以保证确定的类别的准确性。
需要说明的是,上述对拼接图像特征进行更新,获取更新后的拼接图像特征的多种方式能够任意结合,在一种可能实现方式中,在获取到拼接图像特征之后,基于拼接图像特征,获取病理图像所属的类别的过程,包括以下步骤4-步骤8:
步骤4、计算机设备将拼接图像特征中每个第一子特征与对应的位置特征进行融合,得到每个第一子特征对应的第二更新特征。
该步骤4与上述步骤1同理,在此不再赘述。
步骤5、计算机设备基于多个第一子特征在拼接图像特征中所处的位置,将多个第一子特征对应的第二更新特征构成第一拼接图像特征。
其中,第一拼接图像特征相当于上述步骤2中得到的更新后的拼接图像特征,该步骤5与上述步骤2同理,在此不再赘述。
步骤6、计算机设备基于多个第二更新特征,分别对每个第二更新特征进行更新,得到所述每个第二更新特征对应的第三更新特征。
其中,该步骤6与上述步骤308同理,在此不再赘述。
步骤7、计算机设备基于多个第二更新特征在第一拼接图像特征中所处的位置,将多个第三更新特征构成第二拼接图像特征。
在本申请实施例中,每个第三更新特征可能包括一个特征元素,也可能是向量。在每个第三更新特征包括一个特征元素的情况下,多个第二更新特征在第一拼接图像特征中所处的位置,将多个第三更新特征构成一个二维特征矩阵,将该二维特征矩阵确定为第二拼接图像特征;在每个第三更新特征为向量的情况下,该步骤7与上述步骤309同理,在此不再赘述。
步骤8、计算机设备对第二拼接图像特征进行分类,得到病理图像所属的类别。
其中,该步骤与上述步骤310同理,在此不再赘述。
本申请实施例提供的方法,在对拼接图像特征进行更新的过程中,对于拼接图像特征中每个位置上的特征,不仅融入了对应的位置信息,还融入了各个位置上的第一子特征之间的关联程度,在每个位置上的特征中融入了各个位置上的特征,即不仅考虑到拼接图像特征中各个位置上的特征的绝对位置信息,还考虑到了不同位置之间的相对位置关系,能够兼顾病理图像中的局部信息和全局信息捕捉的从而提升了第二拼接图像特征的准确性,通过对该更新后的拼接特征进行分类,保证了确定的类别的准确性。
需要说明的是,在上述图2和图3所示的实施例的基础上,还能够基于分类模型对病理图像进行分类,得到该病理图像所属的类别。
在一种可能实现方式中,分类模型包括特征提取子模型及分类子模型,该分类子模型包括绝对位置编码层、至少一个空间编码器及线性层。基于分类模型对病理图像进行分类的流程如图7所示,基于特征提取子模型,按照上述步骤301-303,将待分类的病理图像分割成多个子图像,之后分别提取每个子图像的图像特征,在将多个子图像的图像特征拼接成病理图像的图像特征。
基于分类子模型,按照上述步骤304-306,利用多个尺度,获取多个聚合特征;之后,按照上述步骤307,将多个聚合特征进行拼接,得到拼接图像特征。
基于该绝对位置编码层将拼接图像特征中每个第一子特征与对应的位置特征进行融合,得到每个第一子特征对应的第二更新特征,基于多个第一子特征在拼接图像特征中所处的位置,将拼接图像特征中多个第一子特征对应的第二更新特征构成第一拼接图像特征。
基于第一个空间编码器,按照上述步骤308-309,基于第一拼接图像特征中的多个第二更新特征,分别对每个第二更新特征进行更新,得到每个第二更新特征对应的第三更新特征;基于多个第二更新特征在第一拼接图像特征中所处的位置,将多个第三更新特征构成第二拼接图像特征。
基于第q个空间编码器,按照上述步骤308-309,对第q-1个空间编码器输出的拼接图像特征再次进行更新,直至最后一个空间编码器输出更新后的拼接图像特征,其中,q为大于1的整数。
基于分类子模型中的线性层,对最后一个空间编码器输出的更新后的拼接图像特征进行分类,得到该病理图像所属的类别。
在一种可能的实现方式中,每个空间编码器包括规范化层、多头注意力层、融合层及多层感知器。
以第一个空间编码器为例,基于规范化层,对第一拼接图像特征进行特征变换,得到变换后的第一拼接图像特征;基于多头自注意力层,按照上述步骤308-309,变换后的第一拼接图像特征进行处理,得到更新后的第一拼接图像特征;基于第一个融合层,将第一拼接图像特征与更新后的第一拼接图像特征进行融合,得到融合图像特征,以增强融合图像特征的准确性,基于第二个规范化层,对融合图像特征进行特征变换,得到变换后的融合图像特征;基于多层感知器,对变换后的融合图像特征进行映射,得到映射特征,将映射特征与变换后的融合图像特征进行融合,得到第二拼接图像特征。
需要说明的是,在上述基于分类模型对病理图像进行分类之前,还需要对分类模型进行训练,以分类模型包括特征提取子模型及分类子模型为例,训练分类模型的过程,包括以下步骤1-4:
步骤1、获取样本病理图像及样本标签,该样本标签指示样本病理图像所属的类别。
其中,该样本病理图像用于呈现机体器官、组织或细胞的病理形态的病理图像,该样本标签指示的类别即为该样本病理图像所属的类别。
步骤2、基于特征提取子模型,获取该样本病理图像的样本图像特征。
其中,该步骤2与上述步骤301-303同理,在此不再赘述。
步骤3、基于该分类子模型,对于多个尺度中的每个尺度,从该样本图像特征中提取该尺度对应的样本局部特征;根据每个尺度分别对应的样本局部特征进行拼接处理,得到样本拼接图像特征;对该样本拼接图像特征进行分类,得到该样本病理图像所属的预测标签,该预测标签指示预测到该样本病理图像所属的类别。
其中,该步骤3与上述步骤304-310同理,在此不再赘述。
步骤4、基于该预测标签及该样本标签,对该分类模型进行训练。
由于该预测标签指示基于分类模型预测到的该样本病理图像所属的类别,该样本标签指示该样本病理图像所属的类别,该预测标签与该样本标签进行对比,能够反映出分类模型的准确率,基于该预测标签及该样本标签,对该分类模型进行训练,以提升分类模型的准确性。
在一种可能实现方式中,该步骤4包括:基于该预测标签及该样本标签确定损失值,基于该损失值对该分类模型进行训练。
其中,该损失值表示该预测标签与该样本标签之间的差异程度。基于该损失值对该分类模型进行训练,以提升分类模型的准确性。
在一种可能实现方式中,基于多个样本病理图像及对应的样本标签,按照上述步骤1-4,对分类模型进行多轮迭代训练,在当前迭代中得到的损失值小于损失值阈值的情况下,停止训练分类模型;或者,在迭代次数达到目标次数的情况下,停止训练分类模型。
通过设置训练分类模型的损失值阈值或目标次数,以使训练的分类模型尽可能准确,保证了训练得到的分类模型的准确性。
需要说明的是,在上述对分类模型训练的过程中,该特征提取子模型能够是已经预训练的任意的图像特征提取模型,例如,该特征提取子模型为ResNet(Residual Neural Network,残差神经网络)、DenseNet(Densely Connected Convolutional Networks,密接卷积网络)或Inception Networks(初始网络)等。在该特征提取子模型的基础上,将该特征提取子模型及分类子模型构成分类模型,按照上述步骤1-4对分类模型进行训练,以节省训练所需时长,也能保证分类模型的准确性。
基于本申请实施例提供的分类模型,与相关技术中多种分类模型进行对比。相关技术中的分类模型包括RNN-MIL(Recurrent Neural Network-Multiple Instance Learning,循环神经网络-多示例学习)、CNN-MIL(Convolution Neural Network-Multiple Instance Learning,卷积神经网络-多示例学习)ViT-MIL(Vision Transformer-Multiple Instance Learning,视觉转换器-多示例学习)。如表1所示,在多种不同的数据集中,基于多种不同的分类任务,将本申请实施例提供的分类模型,与相关技术中多种分类模型进行对比。本申请实施例提供的分类模型,在前两种数据集上能够达到90%以上的AUC(Area Under Curve,特征曲线下与坐标轴围成的面积),在肺腺癌-基因突变数据集上,能够达到90%以上的AUC。基于表1能够获知,本申请提供的分类模型比相关技术中的分类模型性能更好。
表1
Figure PCTCN2022129702-appb-000027
Figure PCTCN2022129702-appb-000028
本申请实施例提供的分类模型包括位置编码层、基于编码器的金字塔多尺度融合和空间编码器。例如,基于编码器的金字塔多尺度融合为TPMF(Transformer-based Pyramid Multi-Scale Fusion);空间编码器为SET(Spatial Encoding Transformer)为了基于本申请提供的分类模型来进行图像分类时,分类模型中各个部分的重要程度,在4种不同的数据集上对分类模型进行测试,如表2所示,基于表2中的数据可知,本申请提供的分类模型中各个部分均重要,基于各个部分组成的分类模型具有更高的分类性能。
表2
Figure PCTCN2022129702-appb-000029
Figure PCTCN2022129702-appb-000030
Figure PCTCN2022129702-appb-000031
在本申请实施例提供的方法中,通过多种不同的位置编码策略,对分类模型的性能进行评估。在4种不同的数据集上对分类模型进行测试时,设置了两种位置编码策略配置:一种是绝对位置编码,另一种是相对位置编码。基于表3可知,同时使用绝对位置编码和相对位置编码机制能够提升图像分类的准确性。
表3
Figure PCTCN2022129702-appb-000032
图8是本申请实施例提供的一种图像分类装置的结构示意图,如图8所示,该装置包括:
获取模块801,用于获取待分类的病理图像的图像特征;
聚合模块802,用于对于多个尺度中的每个尺度,从图像特征中提取尺度对应的局部特征;
拼接模块803,用于根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;
分类模块804,用于对拼接图像特征进行分类,得到病理图像所属的类别。
在一种可能实现方式中,所述聚合模块802,还用于针对每个尺度对应的多个局部特征,将尺度对应的多个局部特征进行聚合,得到聚合特征;
所述拼接模块803,具体用于将多个聚合特征进行拼接处理,得到拼接图像特征。
在一种可能实现方式中,拼接图像特征包括位于多个位置上的第一子特征;如图9所示,分类模块804,包括:
更新单元8041,用于基于多个第一子特征,分别对每个第一子特征进行更新,得到每个第一子特征对应的第一更新特征;
构成单元8042,用于基于多个第一子特征在拼接图像特征中所处的位置,将多个第一子特征对应的第一更新特征构成更新后的拼接图像特征;
分类单元8043,用于对更新后的拼接图像特征进行分类,得到病理图像所属的类别。
在另一种可能实现方式中,更新单元8041,用于对于多个第一子特征中的待处理子特征,获取多个第一子特征的权重,权重指示对应的第一子特征与待处理子特征之间的关联程度;基于多个第一子特征的权重,对多个第一子特征进行加权融合,得到待处理子特征对应的第一更新特征。
在另一种可能实现方式中,更新单元8041,用于对于多个第一子特征中的待处理子特征,获取每个第一子特征与待处理子特征之间的距离特征,距离特征指示在拼接图像特征中第一子特征与待处理子特征所处的位置之间的距离;基于每个第一子特征与待处理子特征之间的相似度及距离特征,获取每个第一子特征的权重。
在另一种可能实现方式中,更新单元8041,用于基于每个第一子特征及待处理子特征在拼接图像特征中的位置,确定每个第一子特征对应的距离,第一子特征对应的距离表示第一子特征与待处理子特征所处的位置之间的距离;分别对每个第一子特征对应的距离进行映射处理,得到每个第一子特征与待处理子特征之间的距离特征。
在另一种可能实现方式中,第一更新特征为向量;构成单元8042,用于基于多个第一子特征在拼接图像特征中所处的位置,将多个第一子特征对应的第一更新特征构成三维特征矩阵,将三维特征矩阵确定为更新后的拼接图像特征。
在另一种可能实现方式中,拼接图像特征包括位于多个位置上的第一子特征;如图9所示,装置还包括:
融合模块805,用于将每个第一子特征与对应的位置特征进行融合,得到每个第一子特征对应的第二更新特征,位置特征指示对应的第一子特征在拼接图像特征中所处的位置;
构成模块806,用于基于多个第一子特征在拼接图像特征中所处的位置,将多个第一子特征对应的第二更新特征构成更新后的拼接图像特征。
在另一种可能实现方式中,第二更新特征为向量;构成模块806,用于基于多个第一子特征在拼接图像特征中所处的位置,将多个第一子特征对应的第二更新特征构成三维特征矩阵,将三维特征矩阵确定为更新后的拼接图像特征。
在另一种可能实现方式中,局部特征包括位于多个位置上的第二子特征;聚合模块802,用于分别将提取到的每个局部特征中的第二子特征进行拼接,得到每个局部特征对应的第一特征向量;基于多个局部特征对应的第一特征向量,分别对每个第一特征向量进行更新,得到每个第一特征向量对应的第二特征向量;基于多个局部特征在图像特征中的位置,将多个第二特征向量构成三维特征矩阵,将三维特征矩阵确定为聚合特征。
在另一种可能实现方式中,获取模块801,用于对病理图像进行分割,得到多个子图像;分别对每个子图像进行特征提取,得到每个子图像的图像特征;基于多个子图像在病理图像中的位置,将多个子图像的图像特征进行拼接,得到病理图像的图像特征。
在另一种可能实现方式中,多个聚合特征的特征尺寸相同;拼接模块803,用于将多个聚合特征中处于相同位置的特征进行拼接,得到多个位置对应的特征向量;将多个位置对应的特征向量构成的三维特征矩阵,确定为拼接图像特征。
在另一种可能实现方式中,获取待分类的病理图像的图像特征;对于多个尺度中的每个尺度,从图像特征中提取尺度对应的局部特征;根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;对拼接图像特征进行分类,得到病理图像所属的类别的步骤是基于分类模型实现的。
在另一种可能实现方式中,分类模型包括特征提取子模型及分类子模型;如图9所示,装置还包括:
获取模块801,还用于获取样本病理图像及样本标签,样本标签指示样本病理图像所属的类别;
获取模块801,还用于基于特征提取子模型,获取样本病理图像的样本图像特征;
预测模块807,用于基于分类子模型,对于多个尺度中的每个尺度,从样本图像特征中提取尺度对应的样本局部特征;根据每个尺度分别对应的样本局部特征进行拼接处理,得到样本拼接图像特征;对样本拼接图像特征进行分类,得到样本病理图像所属的预测标签,预测标签指示预测到样本病理图像所属的类别;
训练模块808,用于基于预测标签及样本标签,对分类模型进行训练。
需要说明的是:上述实施例提供的图像分类装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像分类装置与图像分类方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的图像分类方法所执行的操作。
在一种可能的实现方式中,计算机设备提供为终端。图10示出了本申请一个示例性实施例提供的终端1000的结构框图。该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电及车载终端等。
终端1000包括有:处理器1001和存储器1002。
处理器1001可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central  Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1001可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1002可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1002中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器1001所执行以实现本申请中方法实施例提供的图像分类方法。
在一些实施例中,终端1000还可选包括有:外围设备接口1003和至少一个外围设备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地,外围设备包括:射频电路1004、显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。
在一些实施例中,终端1000还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于:加速度传感器1011、陀螺仪传感器1012、压力传感器1010、光学传感器1014以及接近传感器1015。
本领域技术人员可以理解,图10中示出的结构并不构成对终端1000的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在一种可能的实现方式中,计算机设备提供为服务器。图11是本申请实施例提供的一种服务器的结构示意图,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)1101和一个或一个以上的存储器1102,其中,存储器1102中存储有至少一条计算机程序,至少一条计算机程序由处理器1101加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的图像分类方法所执行的操作。
本申请实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述方面所述的图像分类方法所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (18)

  1. 一种图像分类方法,所述方法由计算机设备执行,所述方法包括:
    获取待分类的病理图像的图像特征;
    对于多个尺度中的每个尺度,从所述图像特征中提取所述尺度对应的局部特征;
    根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;
    对所述拼接图像特征进行分类,得到所述病理图像所属的类别。
  2. 根据权利要求1所述的方法,若一个尺度对应的局部特征包括多个,所述根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征,包括:
    针对每个尺度对应的多个局部特征,将所述尺度对应的多个局部特征进行聚合,得到聚合特征;
    将多个聚合特征进行拼接处理,得到所述拼接图像特征。
  3. 根据权利要求1所述的方法,所述拼接图像特征包括位于多个位置上的第一子特征;所述对所述拼接图像特征进行分类,得到所述病理图像所属的类别,包括:
    基于多个第一子特征,分别对每个第一子特征进行更新,得到所述每个第一子特征对应的第一更新特征;
    基于所述多个第一子特征在所述拼接图像特征中所处的位置,将所述多个第一子特征对应的第一更新特征构成更新后的拼接图像特征;
    对所述更新后的拼接图像特征进行分类,得到所述病理图像所属的类别。
  4. 根据权利要求3所述的方法,所述基于多个第一子特征,分别对每个第一子特征进行更新,得到所述每个第一子特征对应的第一更新特征,包括:
    对于所述多个第一子特征中的待处理子特征,获取所述多个第一子特征的权重,所述权重指示对应的第一子特征与所述待处理子特征之间的关联程度;
    基于所述多个第一子特征的权重,对所述多个第一子特征进行加权融合,得到所述待处理子特征对应的第一更新特征。
  5. 根据权利要求4所述的方法,所述对于所述多个第一子特征中的待处理子特征,获取所述多个第一子特征的权重,包括:
    对于所述多个第一子特征中的待处理子特征,获取所述每个第一子特征与所述待处理子特征之间的距离特征,所述距离特征指示在所述拼接图像特征中所述第一子特征与所述待处理子特征所处的位置之间的距离;
    基于所述每个第一子特征与所述待处理子特征之间的相似度及所述距离特征,获取所述每个第一子特征的权重。
  6. 根据权利要求5所述的方法,所述对于所述多个第一子特征中的待处理子特征,获取所述每个第一子特征与所述待处理子特征之间的距离特征,包括:
    基于所述每个第一子特征及所述待处理子特征在所述拼接图像特征中的位置,确定所述每个第一子特征对应的距离,第一子特征对应的距离表示第一子特征与所述待处理子特征所处的位置之间的距离;
    分别对所述每个第一子特征对应的距离进行映射处理,得到所述每个第一子特征与所述待处理子特征之间的距离特征。
  7. 根据权利要求3所述的方法,所述第一更新特征为向量;所述基于所述多个第一子特征在所述拼接图像特征中所处的位置,将所述多个第一子特征对应的第一更新特征构成更新后的拼接图像特征,包括:
    基于所述多个第一子特征在所述拼接图像特征中所处的位置,将所述多个第一子特征对应的第一更新特征构成三维特征矩阵,将所述三维特征矩阵确定为所述更新后的拼接图像特征。
  8. 根据权利要求1所述的方法,所述拼接图像特征包括位于多个位置上的第一子特征;所述对所述拼接图像特征进行分类,得到所述病理图像所属的类别之前,所述方法还包括:
    将每个第一子特征与对应的位置特征进行融合,得到所述每个第一子特征对应的第二更新特征,所述位置特征指示对应的第一子特征在所述拼接图像特征中所处的位置;
    基于多个第一子特征在所述拼接图像特征中所处的位置,将所述多个第一子特征对应的第二更新特征构成更新后的拼接图像特征。
  9. 根据权利要求8所述的方法,所述第二更新特征为向量;所述基于多个第一子特征在所述拼接图像特征中所处的位置,将所述多个第一子特征对应的第二更新特征构成更新后的拼接图像特征,包括:
    基于所述多个第一子特征在所述拼接图像特征中所处的位置,将所述多个第一子特征对应的第二更新特征构成三维特征矩阵,将所述三维特征矩阵确定为所述更新后的拼接图像特征。
  10. 根据权利要求2所述的方法,所述局部特征包括位于多个位置上的第二子特征;所述将所述尺度对应的多个局部特征进行聚合,得到聚合特征,包括:
    分别将提取到的每个局部特征中的第二子特征进行拼接,得到所述每个局部特征对应的第一特征向量;
    基于多个局部特征对应的第一特征向量,分别对每个第一特征向量进行更新,得到所述每个第一特征向量对应的第二特征向量;
    基于所述多个局部特征在所述图像特征中的位置,将多个第二特征向量构成三维特征矩阵,将所述三维特征矩阵确定为所述聚合特征。
  11. 根据权利要求2所述的方法,所述多个聚合特征的特征尺寸相同;所述将多个聚合特征进行拼接处理,得到所述拼接图像特征,包括:
    将多个聚合特征中处于相同位置的特征进行拼接,得到多个位置对应的特征向量;
    将所述多个位置对应的特征向量构成的三维特征矩阵,确定为所述拼接图像特征。
  12. 根据权利要求1-11任一所述的方法,所述获取待分类的病理图像的图像特征;对于多个尺度中的每个尺度,从所述图像特征中提取所述尺度对应的局部特征;根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;对所述拼接图像特征进行分类,得到所述病理图像所属的类别的步骤是基于分类模型实现的。
  13. 根据权利要求12所述的方法,所述分类模型包括特征提取子模型及分类子模型;所述方法还包括:
    获取样本病理图像及样本标签,所述样本标签指示所述样本病理图像所属的类别;
    基于所述特征提取子模型,获取所述样本病理图像的样本图像特征;
    基于所述分类子模型,对于所述多个尺度中的每个尺度,从所述样本图像特征中提取所述尺度对应的样本局部特征;根据每个尺度分别对应的样本局部特征进行拼接处理,得到样本拼接图像特征;对所述样本拼接图像特征进行分类,得到所述样本病理图像所属的预测标签,所述预测标签指示预测到所述样本病理图像所属的类别;
    基于所述预测标签及所述样本标签,对所述分类模型进行训练。
  14. 根据权利要求1-11任一所述的方法,所述获取待分类的病理图像的图像特征,包括:
    对所述病理图像进行分割,得到多个子图像;
    分别对每个子图像进行特征提取,得到所述每个子图像的图像特征;
    基于所述多个子图像在所述病理图像中的位置,将所述多个子图像的图像特征进行拼接,得到所述病理图像的图像特征。
  15. 一种图像分类装置,所述装置包括:
    获取模块,用于获取待分类的病理图像的图像特征;
    聚合模块,用于对于多个尺度中的每个尺度,从所述图像特征中提取所述尺度对应的局部特征;
    拼接模块,用于根据每个尺度分别对应的局部特征进行拼接处理,得到拼接图像特征;
    分类模块,用于对所述拼接图像特征进行分类,得到所述病理图像所属的类别。
  16. 一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至14任一权利要求所述的图像分类方法所执行的操作。
  17. 一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至14任一权利要求所述的图像分类方法所执行的操作。
  18. 一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至14任一权利要求所述的图像分类方法所执行的操作。
PCT/CN2022/129702 2021-12-22 2022-11-04 图像分类方法、装置、计算机设备及存储介质 WO2023116231A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/198,165 US20230290120A1 (en) 2021-12-22 2023-05-16 Image classification method and apparatus, computer device, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111583275.9A CN114332530A (zh) 2021-12-22 2021-12-22 图像分类方法、装置、计算机设备及存储介质
CN202111583275.9 2021-12-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/198,165 Continuation US20230290120A1 (en) 2021-12-22 2023-05-16 Image classification method and apparatus, computer device, and storage medium

Publications (1)

Publication Number Publication Date
WO2023116231A1 true WO2023116231A1 (zh) 2023-06-29

Family

ID=81053739

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/129702 WO2023116231A1 (zh) 2021-12-22 2022-11-04 图像分类方法、装置、计算机设备及存储介质

Country Status (3)

Country Link
US (1) US20230290120A1 (zh)
CN (1) CN114332530A (zh)
WO (1) WO2023116231A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114332530A (zh) * 2021-12-22 2022-04-12 腾讯科技(深圳)有限公司 图像分类方法、装置、计算机设备及存储介质
CN115496976B (zh) * 2022-08-29 2023-08-11 锋睿领创(珠海)科技有限公司 多源异构数据融合的视觉处理方法、装置、设备及介质
CN115619634B (zh) * 2022-09-06 2023-06-20 广州医科大学附属第一医院(广州呼吸中心) 基于病理切片关联的病理图像拼接方法及装置
CN115761383B (zh) * 2023-01-06 2023-04-18 北京匠数科技有限公司 一种图像分类方法、装置、电子设备及介质
CN116682096B (zh) * 2023-08-03 2024-02-27 腾讯科技(深圳)有限公司 信息添加方法、装置、计算机设备及存储介质
CN117351485B (zh) * 2023-12-04 2024-03-08 深圳赛陆医疗科技有限公司 基因测序训练数据集的增强方法及装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444365A (zh) * 2020-03-27 2020-07-24 Oppo广东移动通信有限公司 图像分类方法、装置、电子设备及存储介质
CN112257728A (zh) * 2020-11-12 2021-01-22 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备以及存储介质
CN113506310A (zh) * 2021-07-16 2021-10-15 首都医科大学附属北京天坛医院 医学图像的处理方法、装置、电子设备和存储介质
WO2021218469A1 (zh) * 2020-04-30 2021-11-04 腾讯科技(深圳)有限公司 影像数据检测方法、装置、计算机设备和存储介质
CN113743186A (zh) * 2021-06-15 2021-12-03 腾讯医疗健康(深圳)有限公司 医学图像的处理方法、装置、设备及存储介质
CN114332530A (zh) * 2021-12-22 2022-04-12 腾讯科技(深圳)有限公司 图像分类方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444365A (zh) * 2020-03-27 2020-07-24 Oppo广东移动通信有限公司 图像分类方法、装置、电子设备及存储介质
WO2021218469A1 (zh) * 2020-04-30 2021-11-04 腾讯科技(深圳)有限公司 影像数据检测方法、装置、计算机设备和存储介质
CN112257728A (zh) * 2020-11-12 2021-01-22 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备以及存储介质
CN113743186A (zh) * 2021-06-15 2021-12-03 腾讯医疗健康(深圳)有限公司 医学图像的处理方法、装置、设备及存储介质
CN113506310A (zh) * 2021-07-16 2021-10-15 首都医科大学附属北京天坛医院 医学图像的处理方法、装置、电子设备和存储介质
CN114332530A (zh) * 2021-12-22 2022-04-12 腾讯科技(深圳)有限公司 图像分类方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
US20230290120A1 (en) 2023-09-14
CN114332530A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
WO2023116231A1 (zh) 图像分类方法、装置、计算机设备及存储介质
US10984286B2 (en) Domain stylization using a neural network model
US10424072B2 (en) Leveraging multi cues for fine-grained object classification
US20200111203A1 (en) Method and apparatus for generating vehicle damage information
US20170124711A1 (en) Universal correspondence network
WO2020248841A1 (zh) 图像的au检测方法、装置、电子设备及存储介质
JP7425147B2 (ja) 画像処理方法、テキスト認識方法及び装置
WO2020087564A1 (zh) 三维物体重建方法、计算机设备及存储介质
CN112308866B (zh) 图像处理方法、装置、电子设备及存储介质
WO2023138188A1 (zh) 特征融合模型训练及样本检索方法、装置和计算机设备
WO2022134464A1 (zh) 目标检测定位置信度确定方法、装置、电子设备及存储介质
WO2014162690A1 (ja) 情報処理装置、及び、画像処理方法
CN108898181A (zh) 一种图像分类模型的处理方法、装置及存储介质
CN117078790B (zh) 图像生成方法、装置、计算机设备和存储介质
CN112464798A (zh) 文本识别方法及装置、电子设备、存储介质
CN110163095B (zh) 回环检测方法、回环检测装置及终端设备
JP2024508867A (ja) 画像クラスタリング方法、装置、コンピュータ機器及びコンピュータプログラム
CN114612612A (zh) 人体姿态估计方法及装置、计算机可读介质、电子设备
CN113111885B (zh) 一种动态分辨率实例分割方法及计算机可读存储介质
CN111507259B (zh) 脸部特征提取方法、装置、电子设备
CN112069412B (zh) 信息推荐方法、装置、计算机设备及存储介质
CN116030466B (zh) 图像文本信息识别与处理方法、装置及计算机设备
US20230252692A1 (en) Learning dense correspondences for images
WO2022236802A1 (zh) 一种物体模型的重建方法、装置、终端设备和存储介质
CN114677350A (zh) 连接点提取方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22909548

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2022909548

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2022909548

Country of ref document: EP

Effective date: 20240327