CN113934880A - 数据处理方法和系统 - Google Patents

数据处理方法和系统 Download PDF

Info

Publication number
CN113934880A
CN113934880A CN202010676933.8A CN202010676933A CN113934880A CN 113934880 A CN113934880 A CN 113934880A CN 202010676933 A CN202010676933 A CN 202010676933A CN 113934880 A CN113934880 A CN 113934880A
Authority
CN
China
Prior art keywords
training
target
images
frame
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010676933.8A
Other languages
English (en)
Inventor
刘伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010676933.8A priority Critical patent/CN113934880A/zh
Publication of CN113934880A publication Critical patent/CN113934880A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种数据处理方法和系统。其中,该方法包括:接收模型训练请求;获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型;输出定位模型。本申请解决了相关技术中的数据处理方法无法实现海量医学影像快速检索的技术问题。

Description

数据处理方法和系统
技术领域
本申请涉及医学影像处理领域,具体而言,涉及一种数据处理方法和系统。
背景技术
在医学领域中,需要从海量的医学影像数据库中查找到感兴趣的部位或病灶的影像,对于CT(Computed Tomography,计算机断层成像)影像而言,可以使用DICOM(DigitalImaging and Communications in Medicine,医疗数位影像传输协定)的“BodyPartExamined”字段筛选出对应部位的影像序列,然后再逐一浏览每个序列,从中找到感兴趣的片段,整个过程费时费力。另外,影像数据库存储的影像数据来源于不同厂家的医疗设备,不同病灶通常采用不同的拍片方式,导致CT影像序列中单个横截面影像的“SliceLocation”字段无法统一,上述方法不适用于检索这种来源复杂的大规模影像数据集。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种数据处理方法和系统,以至少解决相关技术中的数据处理方法无法实现海量医学影像快速检索的技术问题。
根据本申请实施例的一个方面,提供了一种数据处理方法,包括:接收模型训练请求;获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型;输出定位模型。
根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型。
根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:接收待处理影像序列;利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的;输出多帧待处理影像的定位结果。
根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取待处理影像序列;利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的。
根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述的数据处理方法。
根据本申请实施例的另一方面,还提供了一种计算机终端,包括:存储器和处理器,处理器用于运行存储器中存储的程序,其中,程序运行时执行上述的数据处理方法。
根据本申请实施例的另一方面,还提供了一种数据处理系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:接收模型训练请求;获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型;输出定位模型。
在本申请实施例中,使用训练好的定位模型可以得到每帧影像的定位结果,根据定位结果可以实现海量医学影像快速检索的目的,而且,模型训练中使用的至少一组训练样本包含有多帧训练影像的参考坐标,而且参考坐标是基于目标对象的分段特征确定的,使得定位模型独立于设备和成像方式,而且训练过程中参考了分段特征,实现了定位模型的有监督训练,使得每次训练完模型对相同的输入序列能够得到的一致预测结果,达到了提高定位模型处理结果的稳定性的技术效果,进而解决了相关技术中的数据处理方法无法实现海量医学影像快速检索的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据现有技术的一种人体Z方向定位的示意图;
图2是根据本申请实施例的一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图;
图3是根据本申请实施例的一种计算机终端(或移动设备)作为服务器的示意图;
图4是根据本申请实施例的第一种数据处理方法的流程图;
图5是根据本申请实施例的一种可选的人体部位定位模型的示意图;
图6是根据本申请实施例的一种可选的矢位面脊柱各个分段中心点标注的示意图;
图7是根据本申请实施例的一种可选的数据处理方法的流程图;
图8是根据本申请实施例的一种可选的CT影像序列回归坐标可视化结果的示意图;
图9是根据本申请实施例的第二种数据处理方法的流程图;
图10是根据本申请实施例的第三种数据处理方法的流程图;
图11是根据本申请实施例的第四种数据处理方法的流程图;
图12是根据本申请实施例的第一种数据处理装置的示意图;
图13是根据本申请实施例的第二种数据处理装置的示意图;
图14是根据本申请实施例的第三种数据处理装置的示意图;
图15是根据本申请实施例的第四种数据处理装置的示意图;以及
图16是根据本申请实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
CT影像:利用精确准直的X线束、γ射线、超声波等,与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描,每个断面图像作为一帧影像,从而可以得到一个完整的CT影像序列。
批规范化:Batch Normalization,简称为BN,可以在模型每次随机梯度下降训练时,通过minni-batch来对相应的网络响应做规范化操作,使得结果(输出信号各个维度)的均值为0,方差为1。
S函数(sigmoid):该函数的曲线图形近似于字母S,常用的S函数包括:逻辑函数、双曲正弦函数、反正切函数、古德曼函数、误差函数等,本申请对此不作具体限定。
距离回归损失函数:可以分为L1损失函数(最小绝对值误差)、L2损失函数(最小平方误差)、smooth L1损失函数,其中,smooth L1损失函数将L1损失函数和L2损失函数进行融合,是一个分段函数,小于1时为L2损失函数,大于1时为L1损失函数。
Adam(Adaptive Moment Estimation适应性矩估计):可以利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。
为了满足海量医学影像快速检索的目的,相关技术中提供了如下的技术方案:利用影像序列训练一个人体部位定位模型,建立一个独立于设备和拍照方式、统一的Z方向(即Inferior-Superior方向)的坐标轴,如图1所示,将序列的每一帧都对应到坐标轴上的一个坐标。
在此基础上,具体可以采用如下两类方案实现,第一种方案使用孪生网络对序列之间的关系进行分类,同时输入两帧影像(间隔任意),模型自动判断两者在坐标上的大小,输出大和小两个类别。第二种方案使用自监督的方法,连续输入多帧影像(间隔相同),模型自动回归得到每帧影像的坐标,并且回归的坐标满足在空间上的分布和大小关系。
虽然使用孪生网络的方法操作简单,但由于每次只是比较了两帧影像之间的关系,建模能力不强,为了确保模型能够学习整个序列之间的关系,需要采用较好的采样方法作为支持。使用自监督的方法,每次输入多帧影像,只要采样时多帧影像之间有重叠,就可以递推坐标关系到整个序列,因此建模能力更强;但为了学习多帧影像之间的空间关系,需要寻找更有效的损失函数进行回归结果的评价。另外,上述两种方法是完全无监督的,在回归的坐标结果中没有添加任何约束,会导致每次训练完模型后,输入相同的序列得到的预测结果之间存在较大的差异。
为了解决上述问题,本申请提供了一种参考脊柱分段的CT影像人体部位定位方法,不仅可以无监督地利用序列之间的空间关系,还可以参考人体脊柱的分段特征,有监督地对回归的坐标进行修正,使得每次训练完模型对相同的输入序列能够得到的一致预测结果,提高了回归结果的稳定性。
实施例1
根据本申请实施例,还提供了一种数据处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图2示出了一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图。如图2所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图2所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备10)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的数据处理方法的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备10)的用户界面进行交互。
图2示出的硬件结构框图,不仅可以作为上述计算机终端10(或移动设备10)的示例性框图,还可以作为上述服务器的示例性框图,一种可选实施例中,图3以框图示出了使用上述图2所示的计算机终端10(或移动设备10)作为服务器的一种实施例。如图3所示,计算机终端10(或移动设备10)可以经由数据网络连接或电子连接到一个或多个客户端20。数据网络连接可以是局域网连接、广域网连接、因特网连接,或其他类型的数据网络连接。计算机终端10(或移动设备)可以为客户端提供基于网络的用户服务,诸如社交网络、云资源、电子邮件、在线支付或其他在线应用。
在上述运行环境下,本申请提供了如图4所示的数据处理方法。图4是根据本申请实施例的第一种数据处理方法的流程图。如图4所示,该方法可以包括如下步骤:
步骤S402,接收模型训练请求。
为了能够训练得到一个处理精度较高的模型,往往需要采用大量训练样本进行多次训练,整个训练过程的数据量和运算量较大。为了减少用户设备(例如智能手机、平板电脑、笔记本电脑、掌上电脑、个人计算机等)的资源消耗,可以由服务器进行模型训练,用户设备中仅部署训练好的模型,以方便用户使用。进一步地,为了大幅度减少用户设备的运算负担,可以直接将训练好的模型部署在服务器中,用户设备通过特定接口连接服务器,将待处理数据发送给服务器,服务器利用部署好的模型对待处理数据进行处理,并将处理结果反馈给用户设备。
上述步骤中的模型训练请求可以根据用户的模型使用需求生成,该请求中可以携带需要处理的数据类型,以及预期达到的处理结果等,例如,在医学领域中,需要处理的数据类型可以是CT影像,预期达到的处理结果可以是人体部位定位。
由于服务器可以为不同的用户提供模型训练服务,模型使用需求不同,模型的具体结构以及训练样本均不同,在一种可选的实施例中,可以在用户设备上提供一个交互界面,用户在输入区域内输入模型训练请求,从而用户设备可以通过网络将模型训练请求发送给服务器。为了更加有针对性,服务器可以针对用户的类型,给用户提供不同的模型训练方案,由用户在输入区域内进行选择,从而用户设备可以根据用户的选择结果生成模型训练请求,并通过网络发送给服务器。
步骤S404,获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的。
上述步骤中的训练样本可以是用于对初始模型进行训练的大量的医学影像,例如,可以是CT影像,但不仅限于此。同一个患者的多帧医学影像可以作为一组训练样本。目标对象可以是指人体脊柱,脊柱由多个分段构成,而且,脊柱分段不会因为设备和成像的方式不同而发生变化,因此,在本申请实施例中,可以基于人体脊柱的分段特征构建一个独立于设备和拍照方式、统一的坐标轴,并将每帧CT影像映射到该坐标轴中,从而得到上述的参考坐标。
为了提高定位模型的准确度,可以利用大量不同患者的CT影像序列构建训练样本。不同患者的CT影像序列中包含的人体部位不同,对于包含有脊柱的CT影像序列,可以预先对其进行标注,确定CT影像序列中每帧CT影像的参考坐标,此时,可以得到包含多帧CT影像以及多帧CT影像的参考坐标的训练样本;对于未包含有脊柱的CT影像序列,可以预先对其进行标注,设定CT影像序列中每帧CT影像的定位结果标签,此时,可以得到包含多帧CT影像,但不包含参考坐标的训练样本。
需要说明的是,训练影像的帧数越多,建模能力越强,但是运算量和数据量越大,为了在提高建模能力的同时,降低训练的运算量和数据量,可以预先通过实验确定一个训练影像的固定帧数,例如,可以是5帧。为了更加具备针对性,可以根据用户需要的模型处理精度确定训练影像的帧数,也即,该帧数可以根据模型训练请求动态更新,不再是固定值。
上述步骤中的初始模型可以是使用深度卷积神经网络搭建的模型,模型的具体结构可以采用现有结构,本申请对此不作具体限定。例如,如图5所示,该初始模型可以是包括卷积层、批规范化层、激活层、全局平均池化层和全连接层的深度卷积神经网络,其中,将多帧训练影像输入至深度卷积神经网络中,提取每帧训练影像的特征,然后通过一个卷积层将特征层数固定为m(即上述的训练影像的帧数),后接BN批规范化层和ReLU激活层,再经过全局平均池化层和全连接层输出m个预测坐标,分别对应每帧训练影像。
步骤S406,利用多组训练样本对初始模型进行训练,得到定位模型。
可选的,可以利用适应性矩估计算法,基于训练样本对初始模型进行训练,得到定位模型,训练过程中的初始学习率和迭代次数可以根据实际训练需求进行动态调整,也可以通过实验设置为一个固定值,例如,初始模型的初始学习率为0.001,初始模型的迭代次数为100,但不仅限于此。
在一种可选的实施例中,在初始模型的训练过程中,可以使用Adam算法进行迭代优化,初始学习率为0.001,一共迭代100次。在每个迭代过程中,可以将训练样本输入至初始模型中,得到每帧训练影像的预测坐标,并结合每帧训练影像的参考坐标进行模型参数更新,直至迭代次数到达100次。
步骤S408,输出定位模型。
在一种可选的实施例中,如果定位模型需要部署在用户设备中,则服务器可以通过网络将定位模型传输至用户设备;如果定位模型需要部署在服务器中,则可以直接将定位模型进行上线,从而用户可以使用上线后的定位模型进行人体部位定位,实现海量医学影像的快速检索的目的。
通过本申请上述实施例提供的技术方案,在接收到模型训练请求之后,可以获取与该模型训练请求相对应的多组训练样本和初始模型,进一步利用多组训练样本对初始模型进行训练,实现定位模型训练的目的。容易注意到的是,使用训练好的定位模型可以得到每帧影像的定位结果,根据定位结果可以实现海量医学影像快速检索的目的,而且,模型训练中使用的至少一组训练样本包含有多帧训练影像的参考坐标,而且参考坐标是基于目标对象的分段特征确定的,使得定位模型独立于设备和成像方式,而且训练过程中参考了分段特征,实现了定位模型的有监督训练,使得每次训练完模型对相同的输入序列能够得到的一致预测结果,达到了提高定位模型处理结果的稳定性的技术效果,进而解决了相关技术中的数据处理方法无法实现海量医学影像快速检索的技术问题。
在本申请上述实施例中,在获取模型训练请求的多组训练样本之前,该方法还包括:获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;随机抽取目标影像序列中预设帧数的目标影像;基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
上述步骤中的影像数据库可以是海量医学影像数据库,该数据库中存储有大量的影像序列,不同影像序列的设备和拍照方式可以相同,也可以不同。
为了提高定位模型的处理准确度,训练样本需要能够覆盖人体的不同部位,因此,在本申请实施例中,可以预先设定一个筛选训练数据集的预设条件,通过该预设条件可以从海量医学影像数据库中筛选出符合训练要求的数据集。例如,预设条件可以是序列长度大于10帧,且序列包含完整的人体脊柱,但不仅限于此。
上述步骤中的预设帧数可以是固定帧数,例如,可以是5帧;也可以是根据用户需要的模型处理精度确定的帧数,此时,预设帧数是一个动态变化的值。
对于病灶不同的患者,其拍摄的影像序列中包含的人体部位不同,因此,海量医学影像数据库中包含完整人体脊柱的影像序列数量有限,为了扩充训练样本的数据量,不直接将筛选出的影像序列作为训练样本,而是通过随机抽取的方式,抽取影像序列中的部分影像作为训练影像。
例如,以CT影像为例,可以从影像数据库中筛选出序列长度大于10帧的所有CT影像序列,作为实验数据集,进一步筛选出包含完整人体脊柱的CT影像序列作为标注集,首先基于人体脊柱建立坐标系,并基于每帧CT影像与脊柱各个分段的对应关系,将每帧CT影像映射到该坐标系中,确定每帧CT影像的参考坐标。进一步通过随机抽取的方式,从每个CT影像序列中随机多帧CT影像作为训练样本,并且该训练样本中还包含有CT影像的参考坐标。
在本申请上述实施例中,基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标包括:对目标对象的多个分段进行标注;确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;基于多个分段的标注结果,确定多个分段对应的参考坐标;基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
对于一个目标影像序列,可以在矢位面上标注脊柱各个分段,由于脊柱各个分段存在一定的长度,在本申请实施例中,可以针对各个分段的中心点进行标注,具体可以采用现有脊柱分段方法进行标注,如图6所示,可以将各个分段的中心点标注为从S1到C7。其中,C表示颈段cervical,T表示胸段thoracic,L表示腰段lumbar,S表示骶段sacral,数字越小,表明该分段距离头部越近。
在一种可选的实施例中,在获取到目标影像序列之后,可以在矢位面上标注脊柱各个分段的中心点,得到各个分段的标注结果,并将中心点所在影像的帧序号作为分段对应的帧序号。预先针对人体脊柱建立坐标系,每个分段的中心点对应于坐标系中的一个坐标,从而可以将每个分段对应的帧序号映射为相应的参考坐标,对于相邻两个分段之间的目标影像,可以结合目标影像的帧序号与相邻两个分段对应的帧序号,基于等比例关系确定目标影像的参考坐标。
例如,仍以CT影像为例,在获取到CT影像序列之后,可以在矢位面上将各个分段的中心点标注为S1到C7,中心点所在CT影像的帧序号为:Z=(zS1,zL5,...,zT1,zC7),进一步结合每帧CT影像的帧序号,可以确定每帧CT影像的参考坐标。
在本申请上述实施例中,基于多个分段的标注结果,确定多个分段对应的参考坐标包括:基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请实施例中,为了方便计算,可以选取位于脊柱中间的分段L1作为原点建立坐标系,此时,该分段L1对应的帧序号与参考坐标0相对应。预设坐标间隔可以是相邻两个分段的坐标之间的变化量,例如,可以是2,也即,从目标分段开始向头部的各个分段对应的坐标依次递增2,从该分段开始向脚部的各个分段对应的坐标依次递减2,但不仅限于此,可以根据实际需要进行设定。
例如,仍以CT影像为例,CT影像序列的标注结果如图6所示,以分段L1为原点建立坐标系,则分段L1的中心点所在的CT影像的参考坐标为0,在此基础上可以得到:分段L2的中心点所在的CT影像的参考坐标为-2,分段L3的中心点所在的CT影像的参考坐标为-4,分段L4的中心点所在的CT影像的参考坐标为-6,分段L5的中心点所在的CT影像的参考坐标为-8,分段S1的中心点所在的CT影像的参考坐标为-10,分段T12的中心点所在的CT影像的参考坐标为2,分段T11的中心点所在的CT影像的参考坐标为4,分段T10的中心点所在的CT影像的参考坐标为6,分段T9的中心点所在的CT影像的参考坐标为8,分段T8的中心点所在的CT影像的参考坐标为10,其他分段依次类推,在此不做赘述。
在本申请上述实施例中,基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标包括:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
上述步骤中的第一目标影像可以是位于相邻两个分段之间的目标影像,第一分段可以是相邻两个分段中帧序号较小的分段,第二分段可以是相邻两个分段中帧序号较大的分段。
在一种可选的实施例中,对于相邻两个分段的中心点所在目标影像之间的其他目标影像,可以采用如下公式计算参考坐标s(i):
Figure BDA0002584385130000111
其中,zs是第一分段对应的帧序号,ze是第二分段对应的帧序号,s(zs)是第一分段对应的参考坐标。
在本申请上述实施例中,随机抽取目标影像序列中预设帧数的目标影像包括:获取抽取初始帧序号和抽取间隔;基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
上述步骤中的抽取初始帧序号可以是开始抽取影像的帧序号,用j标识。抽取间隔可以是相邻两帧目标影像的帧序号间隔,用k表示。对于不同的随机样本,可以设置不同的j和k,从而可以获取到大量的训练样本,而且训练样本之间存在重叠。
在一种可选的实施例中,如图5所示,可以首先从目标影像序列中随机选取抽取初始帧序号j,并按一定间隔k,随机抽取预设帧数m的目标影像,则抽取出的目标影像的帧序号分别为:j,j+k,j+2k,……,j+(m-1)k。
在本申请上述实施例中,基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本包括:对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在一种可选的实施例中,为了进一步扩展训练样本,扩大定位模型的适用范围,避免模型过拟合,可以对目标影像采取数据增广操作,例如,随机上下翻转、随机缩放和随机旋转等,其中,翻转的概率为0.5,缩放的尺寸为0.5-1.5倍,旋转的角度为-90°-90°。
需要说明的是,上述操作需要同时对随机抽取出的所有目标影像进行处理,而不是对抽取出的部分目标影像进行处理。
在本申请上述实施例中,在获取影像数据库中满足预设条件的目标影像序列之后,该方法还包括:调整多帧目标影像的窗宽和窗位;通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;调整多帧目标影像的尺寸为目标尺寸。
上述步骤中的目标分辨率可以根据实际训练需要进行设定,例如,可以是0.1mm/像素,但不仅限于此。目标尺寸也可以根据实际训练需要进行设定,例如,可以是224*224,但不仅限于此。
在一种可选的实施例中,在筛选出目标影像序列之后,可以对不同部分的CT影像序列,调整到对应的窗宽和窗位;通过双线性插值的方式统一所有目标影像的分辨率;对插值后的目标影像进行尺寸缩放,从而得到模型训练所需要的图像数据。
在本申请上述实施例中,利用训练样本对初始模型进行训练,得到定位模型包括:将训练样本输入至初始模型,得到多帧训练影像的预测坐标;获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;基于损失值对初始模型进行参数更新,得到定位模型。
在一种可选的实施例中,为了提高定位模型处理结果的稳定性,可以在初始模型的训练过程中引入有监督的损失函数,从而通过无监督的损失函数和有监督的损失函数相结合的方式,完成模型训练过程。
坐标差值可以通过如下公式得到:Δi,j+1=si,j+1-si,j,其中,si,j+1和si,j为相邻两帧目标影像的预测坐标。
在本申请上述实施例中,基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值包括:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
在一种可选的实施例中,可以通过如下公式计算常量误差Lossconst、排序误差Lossorder、间隔误差Lossdist和回归误差Lossannot,其中,常量误差要求Δi,j+1>b,排序误差要求预测坐标满足s1<s2<s3<...<sm,间隔误差要求预测坐标满足s2-s1=s3-s2=sm-sm-1
Figure BDA0002584385130000131
Figure BDA0002584385130000132
Figure BDA0002584385130000133
Figure BDA0002584385130000134
其中,N表示每次迭代的训练样本的数据批量大小,例如,可以是常数8,但不仅限于此;b表示第二预设值,例如,b可以是常数0.1,k可以是常数2,但不仅限于此;A表示该训练过程中标注集的数据规模,ai,j表示参考坐标。
最终的损失值可以是上述各个误差的总和:
Loss=Lossconst+Lossorder+Lossdist+Lossannot
下面结合图7和图8以CT影像为例对本申请一种可选的实施例进行详细说明。如图7所示,该方法可以包括如下步骤:
步骤S71,影像收集;
可选的,从医学影像数据库中筛选符合要求的CT影像序列作为数据集。
步骤S72,标注脊柱分段中心点;
可选的,从数据集中筛选包含完整人体脊柱的CT影像序列作为标注集,在矢位面上标注脊柱各个分段的中心点,并得到每个分段的中心点所在的帧序号。
步骤S73,数据预处理;
可选的,分别调整CT影像序列的窗宽窗位、统一所有CT影像的分辨率、统一尺寸缩放,得到用于训练的目标影像。然后对标注集进行解析,生成各帧目标影像的参考坐标。
步骤S74,建立模型;
可选的,使用深度卷积神经网络搭建人体部位定位模型,并从CT影像序列中随机选取m帧影像,然后将m帧影像输入到深度卷积神经网络进行特征提取,并进一步得到m个预测坐标。
步骤S75,模型训练。
可选的,在训练过程中使用无监督损失函数和有监督损失函数,并使用Adam算法进行迭代优化。此次训练完成之后,判断模型是否收敛,如果未收敛,则继续进行模型训练,如果收敛,在结束训练过程,得到训练好的定位模型。在一个完整的CT影像序列上回归得到的坐标可视化结果如图8所示。
通过上述步骤提供的方案,提供了一种参考脊柱分段的CT影像人体部位定位方法,除了无监督地利用序列之间的空间关系,还参考了人体脊柱的分段特征,有监督地对回归的坐标进行修正,使得每次训练完模型对相同的输入序列能够得到的一致预测结果,提高了回归结果的稳定性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
根据本申请实施例,还提供了一种数据处理方法。
图9是根据本申请实施例的第二种数据处理方法的流程图。如图9所示,该方法可以包括如下步骤:
步骤S902,获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的。
上述步骤中的训练样本可以是用于对初始模型进行训练的大量的医学影像,例如,可以是CT影像,但不仅限于此。同一个患者的多帧医学影像可以作为一组训练样本。目标对象可以是指人体脊柱,脊柱由多个分段构成,而且,脊柱分段不会因为设备和成像的方式不同而发生变化。
为了提高定位模型的准确度,可以利用大量不同患者的CT影像序列构建训练样本。不同患者的CT影像序列中包含的人体部位不同,对于包含有脊柱的CT影像序列,可以预先对其进行标注,确定CT影像序列中每帧CT影像的参考坐标,此时,可以得到包含多帧CT影像以及多帧CT影像的参考坐标的训练样本;对于未包含有脊柱的CT影像序列,可以预先对其进行标注,设定CT影像序列中每帧CT影像的定位结果标签,此时,可以得到包含多帧CT影像,但不包含参考坐标的训练样本。
需要说明的是,训练影像的帧数越多,建模能力越强,但是运算量和数据量越大,为了在提高建模能力的同时,降低训练的运算量和数据量,可以预先通过实验确定一个训练影像的固定帧数,例如,可以是5帧。为了更加具备针对性,可以根据用户需要的模型处理精度确定训练影像的帧数,也即,该帧数可以根据模型训练请求动态更新,不再是固定值。
上述步骤中的初始模型可以是使用深度卷积神经网络搭建的模型,模型的具体结构可以采用现有结构,本申请对此不作具体限定。
步骤S904,利用多组训练样本对初始模型进行训练,得到定位模型。
可选的,可以利用适应性矩估计算法,基于训练样本对初始模型进行训练,得到定位模型,训练过程中的初始学习率和迭代次数可以根据实际训练需求进行动态调整,也可以通过实验设置为一个固定值,例如,初始模型的初始学习率为0.001,初始模型的迭代次数为100,但不仅限于此。
在本申请上述实施例中,在获取多组训练样本之前,该方法还包括:获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;随机抽取目标影像序列中预设帧数的目标影像;基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标包括:对目标对象的多个分段进行标注;确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;基于多个分段的标注结果,确定多个分段对应的参考坐标;基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
在本申请上述实施例中,基于多个分段的标注结果,确定多个分段对应的参考坐标包括:基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请上述实施例中,基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标包括:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
在本申请上述实施例中,随机抽取目标影像序列中预设帧数的目标影像包括:获取抽取初始帧序号和抽取间隔;基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
在本申请上述实施例中,基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本包括:对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,在获取影像数据库中满足预设条件的目标影像序列之后,该方法还包括:调整多帧目标影像的窗宽和窗位;通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;调整多帧目标影像的尺寸为目标尺寸。
在本申请上述实施例中,利用训练样本对初始模型进行训练,得到定位模型包括:将训练样本输入至初始模型,得到多帧训练影像的预测坐标;获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;基于损失值对初始模型进行参数更新,得到定位模型。
在本申请上述实施例中,基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值包括:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例3
根据本申请实施例,还提供了一种数据处理方法。
图10是根据本申请实施例的第三种数据处理方法的流程图。如图10所示,该方法可以包括如下步骤:
步骤S1002,接收待处理影像序列。
上述步骤中的待处理影像序列可以是医学影像序列,例如,可以是CT影像序列,但不仅限于此。
在一种可选的实施例中,可以在用户设备上提供一个交互界面,用户在输入区域内上传待处理影像序列,用户可以通过直接将待处理影像序列拖至该区域,或者通过点击“上传影像序列”按钮的方式,完成待处理影像序列的上传过程。如果定位模型需要部署在用户设备中,则用户设备可以直接对待处理影像序列进行处理;如果定位模型需要部署在服务器中,则用户设备可以通过网络将待处理影像序列发送给服务器,由服务器进行处理。
步骤S1004,利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的。
上述步骤中的目标对象可以是指人体脊柱,脊柱由多个分段构成,而且,脊柱分段不会因为设备和成像的方式不同而发生变化。定位模型可以是使用深度卷积神经网络搭建的模型,模型的具体结构可以采用现有结构,本申请对此不作具体限定。
步骤S1006,输出多帧待处理影像的定位结果。
在一种可选的实施例中,如果定位模型需要部署在用户设备中,则用户设备可以直接将定位结果显示在交互界面的显示区域中;如果定位模型需要部署在服务器中,则服务器可以将定位结果通过网络返回给用户设备,由用户设备,显示在交互界面的显示区域中,进一步地,用户可以基于定位结果从海量医学影像数据库中检索出感兴趣的影像,实现海量医学影像的快速检索的目的。
在本申请上述实施例中,该方法还包括:获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型。
在本申请上述实施例中,在获取多组训练样本之前,该方法还包括:获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;随机抽取目标影像序列中预设帧数的目标影像;基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标包括:对目标对象的多个分段进行标注;确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;基于多个分段的标注结果,确定多个分段对应的参考坐标;基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
在本申请上述实施例中,基于多个分段的标注结果,确定多个分段对应的参考坐标包括:基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请上述实施例中,基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标包括:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
在本申请上述实施例中,随机抽取目标影像序列中预设帧数的目标影像包括:获取抽取初始帧序号和抽取间隔;基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
在本申请上述实施例中,基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本包括:对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,在获取影像数据库中满足预设条件的目标影像序列之后,该方法还包括:调整多帧目标影像的窗宽和窗位;通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;调整多帧目标影像的尺寸为目标尺寸。
在本申请上述实施例中,利用训练样本对初始模型进行训练,得到定位模型包括:将训练样本输入至初始模型,得到多帧训练影像的预测坐标;获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;基于损失值对初始模型进行参数更新,得到定位模型。
在本申请上述实施例中,基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值包括:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例4
根据本申请实施例,还提供了一种数据处理方法。
图11是根据本申请实施例的第四种数据处理方法的流程图。如图11所示,该方法可以包括如下步骤:
步骤S1102,获取待处理影像序列。
上述步骤中的待处理影像序列可以是医学影像序列,例如,可以是CT影像序列,但不仅限于此。
步骤S1104,利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的。
上述步骤中的目标对象可以是指人体脊柱,脊柱由多个分段构成,而且,脊柱分段不会因为设备和成像的方式不同而发生变化。定位模型可以是使用深度卷积神经网络搭建的模型,模型的具体结构可以采用现有结构,本申请对此不作具体限定。
在本申请上述实施例中,该方法还包括:获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型。
在本申请上述实施例中,在获取多组训练样本之前,该方法还包括:获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;随机抽取目标影像序列中预设帧数的目标影像;基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标包括:对目标对象的多个分段进行标注;确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;基于多个分段的标注结果,确定多个分段对应的参考坐标;基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
在本申请上述实施例中,基于多个分段的标注结果,确定多个分段对应的参考坐标包括:基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请上述实施例中,基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标包括:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
在本申请上述实施例中,随机抽取目标影像序列中预设帧数的目标影像包括:获取抽取初始帧序号和抽取间隔;基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
在本申请上述实施例中,基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本包括:对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,在获取影像数据库中满足预设条件的目标影像序列之后,该方法还包括:调整多帧目标影像的窗宽和窗位;通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;调整多帧目标影像的尺寸为目标尺寸。
在本申请上述实施例中,利用训练样本对初始模型进行训练,得到定位模型包括:将训练样本输入至初始模型,得到多帧训练影像的预测坐标;获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;基于损失值对初始模型进行参数更新,得到定位模型。
在本申请上述实施例中,基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值包括:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例5
根据本申请实施例,还提供了一种用于实施上述数据处理方法的数据处理装置,如图12所示,该装置1200包括:接收模块1202、获取模块1204、训练模块1206和输出模块1208。
其中,接收模块1202用于接收模型训练请求;获取模块1204用于获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;训练模块1206用于利用多组训练样本对初始模型进行训练,得到定位模型;输出模块1208用于输出定位模型。
此处需要说明的是,上述接收模块1202、获取模块1204、训练模块1206和输出模块1208对应于实施例1中的步骤S402至步骤S408,四个模块与的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请上述实施例中,该装置还包括:确定模块、抽取模块和生成模块。
其中,获取模块还用于获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;确定模块用于基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;抽取模块用于随机抽取目标影像序列中预设帧数的目标影像;生成模块用于基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,确定模块包括:标注单元、第一确定单元、第二确定单元和第三确定单元。
其中,标注单元用于对目标对象的多个分段进行标注;第一确定单元用于确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;第二确定单元用于基于多个分段的标注结果,确定多个分段对应的参考坐标;第三确定单元用于基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
在本申请上述实施例中,第二确定单元还用于基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请上述实施例中,第三确定单元还用于执行如下步骤:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
在本申请上述实施例中,抽取模块包括:第一获取单元和抽取单元。
其中,第一获取单元用于获取抽取初始帧序号和抽取间隔;抽取单元用于基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
在本申请上述实施例中,生成模块包括:操作单元和生成单元。
其中,操作单元用于对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;生成单元用于基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,该装置还包括:调整模块、插值模块和缩放模块。
其中,调整模块用于调整多帧目标影像的窗宽和窗位;插值模块用于通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;缩放模块用于调整多帧目标影像的尺寸为目标尺寸。
在本申请上述实施例中,训练模块包括:输入单元、第二获取单元、第四确定单元和更新单元。
其中,输入单元用于将训练样本输入至初始模型,得到多帧训练影像的预测坐标;第二获取单元用于获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;第四确定单元用于基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;更新单元用于基于损失值对初始模型进行参数更新,得到定位模型。
在本申请上述实施例中,第四确定单元还用于执行如下步骤:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例6
根据本申请实施例,还提供了一种用于实施上述数据处理方法的数据处理装置,如图13所示,该装置1300包括:获取模块1302和训练模块1304。
其中,获取模块1302用于获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;训练模块1304用于利用多组训练样本对初始模型进行训练,得到定位模型。
此处需要说明的是,上述获取模块1302和训练模块1304对应于实施例2中的步骤S902至步骤S904,两个模块与的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请上述实施例中,该装置还包括:确定模块、抽取模块和生成模块。
其中,获取模块还用于获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;确定模块用于基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;抽取模块用于随机抽取目标影像序列中预设帧数的目标影像;生成模块用于基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,确定模块包括:标注单元、第一确定单元、第二确定单元和第三确定单元。
其中,标注单元用于对目标对象的每个分段进行标注;第一确定单元用于确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;第二确定单元用于基于多个分段的标注结果,确定多个分段对应的参考坐标;第三确定单元用于基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
在本申请上述实施例中,第二确定单元还用于基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请上述实施例中,第三确定单元还用于执行如下步骤:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
在本申请上述实施例中,抽取模块包括:第一获取单元和抽取单元。
其中,第一获取单元用于获取抽取初始帧序号和抽取间隔;抽取单元用于基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
在本申请上述实施例中,生成模块包括:操作单元和生成单元。
其中,操作单元用于对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;生成单元用于基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,该装置还包括:调整模块、插值模块和缩放模块。
其中,调整模块用于调整多帧目标影像的窗宽和窗位;插值模块用于通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;缩放模块用于调整多帧目标影像的尺寸为目标尺寸。
在本申请上述实施例中,训练模块包括:输入单元、第二获取单元、第四确定单元和更新单元。
其中,输入单元用于将训练样本输入至初始模型,得到多帧训练影像的预测坐标;第二获取单元用于获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;第四确定单元用于基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;更新单元用于基于损失值对初始模型进行参数更新,得到定位模型。
在本申请上述实施例中,第四确定单元还用于执行如下步骤:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例7
根据本申请实施例,还提供了一种用于实施上述数据处理方法的数据处理装置,如图14所示,该装置1400包括:接收模块1402、处理模块1404和输出模块1406。
其中,接收模块1402用于接收待处理影像序列;处理模块1404用于利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的;输出模块1406用于输出多帧待处理影像的定位结果。
此处需要说明的是,上述接收模块1402、处理模块1404和输出模块1406对应于实施例3中的步骤S1002至步骤S1006,三个模块与的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请上述实施例中,该装置还包括:获取模块和训练模块。
其中,获取模块用于获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;训练模块用于利用多组训练样本对初始模型进行训练,得到定位模型。
在本申请上述实施例中,该装置还包括:确定模块、抽取模块和生成模块。
其中,获取模块还用于获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;确定模块用于基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;抽取模块用于随机抽取目标影像序列中预设帧数的目标影像;生成模块用于基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,确定模块包括:标注单元、第一确定单元、第二确定单元和第三确定单元。
其中,标注单元用于对目标对象的多个分段进行标注;第一确定单元用于确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;第二确定单元用于基于多个分段的标注结果,确定多个分段对应的参考坐标;第三确定单元用于基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
在本申请上述实施例中,第二确定单元还用于基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请上述实施例中,第三确定单元还用于执行如下步骤:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
在本申请上述实施例中,抽取模块包括:第一获取单元和抽取单元。
其中,第一获取单元用于获取抽取初始帧序号和抽取间隔;抽取单元用于基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
在本申请上述实施例中,生成模块包括:操作单元和生成单元。
其中,操作单元用于对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;生成单元用于基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,该装置还包括:调整模块、插值模块和缩放模块。
其中,调整模块用于调整多帧目标影像的窗宽和窗位;插值模块用于通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;缩放模块用于调整多帧目标影像的尺寸为目标尺寸。
在本申请上述实施例中,训练模块包括:输入单元、第二获取单元、第四确定单元和更新单元。
其中,输入单元用于将训练样本输入至初始模型,得到多帧训练影像的预测坐标;第二获取单元用于获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;第四确定单元用于基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;更新单元用于基于损失值对初始模型进行参数更新,得到定位模型。
在本申请上述实施例中,第四确定单元还用于执行如下步骤:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例8
根据本申请实施例,还提供了一种用于实施上述数据处理方法的数据处理装置,如图15所示,该装置1500包括:获取模块1502和处理模块1504。
其中,获取模块1502用于获取待处理影像序列;处理模块1504用于利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的。
此处需要说明的是,上述获取模块1502和处理模块1504对应于实施例4中的步骤S1102至步骤S1104,两个模块与的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
在本申请上述实施例中,该装置还包括:训练模块。
其中,获取模块还用于获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;训练模块用于利用多组训练样本对初始模型进行训练,得到定位模型。
在本申请上述实施例中,该装置还包括:确定模块、抽取模块和生成模块。
其中,获取模块还用于获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;确定模块用于基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;抽取模块用于随机抽取目标影像序列中预设帧数的目标影像;生成模块用于基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,确定模块包括:标注单元、第一确定单元、第二确定单元和第三确定单元。
其中,标注单元用于对目标对象的多个分段进行标注;第一确定单元用于确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;第二确定单元用于基于多个分段的标注结果,确定多个分段对应的参考坐标;第三确定单元用于基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
在本申请上述实施例中,第一确定单元还用于基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
在本申请上述实施例中,第三确定单元还用于执行如下步骤:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
在本申请上述实施例中,抽取模块包括:第一获取单元和抽取单元。
其中,第一获取单元用于获取抽取初始帧序号和抽取间隔;抽取单元用于基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
在本申请上述实施例中,生成模块包括:操作单元和生成单元。
其中,操作单元用于对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;生成单元用于基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
在本申请上述实施例中,该装置还包括:调整模块、插值模块和缩放模块。
其中,调整模块用于调整多帧目标影像的窗宽和窗位;插值模块用于通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;缩放模块用于调整多帧目标影像的尺寸为目标尺寸。
在本申请上述实施例中,训练模块包括:输入单元、第二获取单元、第四确定单元和更新单元。
其中,输入单元用于将训练样本输入至初始模型,得到多帧训练影像的预测坐标;第二获取单元用于获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;第四确定单元用于基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;更新单元用于基于损失值对初始模型进行参数更新,得到定位模型。
在本申请上述实施例中,第四确定单元还用于执行如下步骤:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例9
根据本申请实施例,还提供了一种数据处理系统,包括:
处理器。以及
存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:接收模型训练请求;获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型;输出定位模型。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例10
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行数据处理方法中以下步骤的程序代码:接收模型训练请求;获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型;输出定位模型。
可选地,图16是根据本申请实施例的一种计算机终端的结构框图。如图16所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器1602、以及存储器1604。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的数据处理方法和装置的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收模型训练请求;获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型;输出定位模型。
可选的,上述处理器还可以执行如下步骤的程序代码:获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;随机抽取目标影像序列中预设帧数的目标影像;基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
可选的,上述处理器还可以执行如下步骤的程序代码:对目标对象的多个分段进行标注;确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;基于多个分段的标注结果,确定多个分段对应的参考坐标;基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
可选的,上述处理器还可以执行如下步骤的程序代码:基于多个分段对应的标注结果与和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
可选的,上述处理器还可以执行如下步骤的程序代码:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
可选的,上述处理器还可以执行如下步骤的程序代码:获取抽取初始帧序号和抽取间隔;基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
可选的,上述处理器还可以执行如下步骤的程序代码:对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
可选的,上述处理器还可以执行如下步骤的程序代码:调整多帧目标影像的窗宽和窗位;通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;调整多帧目标影像的尺寸为目标尺寸。
可选的,上述处理器还可以执行如下步骤的程序代码:将训练样本输入至初始模型,得到多帧训练影像的预测坐标;获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;基于损失值对初始模型进行参数更新,得到定位模型。
可选的,上述处理器还可以执行如下步骤的程序代码:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收待处理影像序列;利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的;输出多帧待处理影像的定位结果。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取待处理影像序列;利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的。
采用本申请实施例,提供了一种人体部位定位的方案。使用训练好的定位模型可以得到每帧影像的定位结果,根据定位结果可以实现海量医学影像快速检索的目的,而且,模型训练中使用的至少一组训练样本包含有多帧训练影像的参考坐标,而且参考坐标是基于目标对象的分段特征确定的,使得定位模型独立于设备和成像方式,而且训练过程中参考了分段特征,实现了定位模型的有监督训练,使得每次训练完模型对相同的输入序列能够得到的一致预测结果,达到了提高定位模型处理结果的稳定性的技术效果,进而解决了相关技术中的数据处理方法无法实现海量医学影像快速检索的技术问题。
本领域普通技术人员可以理解,图16所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobi leInternet Devices,MID)、PAD等终端设备。图16其并不对上述电子装置的结构造成限定。例如,计算机终端A还可包括比图16中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图16所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例11
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例所提供的数据处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:接收模型训练请求;获取模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型;输出定位模型。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:获取影像数据库中满足预设条件的目标影像序列,其中,目标影像序列中包含有目标对象;基于目标对象的分段特征,确定目标影像序列中多帧目标影像的参考坐标;随机抽取目标影像序列中预设帧数的目标影像;基于预设帧数的目标影像,以及预设帧数的目标影像的参考坐标,生成至少一组训练样本。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:对目标对象的多个分段进行标注;确定多个分段的中心点所在目标影像的帧序号,得到多个分段对应的帧序号;基于多个分段的标注结果,确定多个分段对应的参考坐标;基于多帧目标影像的帧序号,多个分段对应的帧序号,以及多个分段对应的参考坐标,确定多帧目标影像的参考坐标。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:基于多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到多个分段对应的参考坐标。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,第一目标影像是目标影像序列中的任意一帧目标影像,第一目标影像的帧序号大于第一分段对应的帧序号,且小于第二分段对应的帧序号,第一分段与第二分段相邻;获取第二分段对应的帧序号与第一分段对应的帧序号的差值,得到第二差值;获取第一差值与第二差值的比值;获取比值与第一预设值的乘积;获取乘积与第一分段对应的参考坐标的和值,得到第一目标影像的参考坐标。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:获取抽取初始帧序号和抽取间隔;基于抽取初始帧序号和抽取间隔对目标影像序列进行影像抽取,得到预设帧数的目标影像。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:对预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;基于操作后的目标影像,以及操作后的目标影像的参考坐标,生成至少一组训练样本。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:调整多帧目标影像的窗宽和窗位;通过双线性插值方法调整多帧目标影像的分辨率为目标分辨率;调整多帧目标影像的尺寸为目标尺寸。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:将训练样本输入至初始模型,得到多帧训练影像的预测坐标;获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;基于坐标差值、多帧训练影像的参考坐标和预测坐标,确定初始模型的损失值;基于损失值对初始模型进行参数更新,得到定位模型。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:基于坐标差值与第二预设值的差值,确定常量误差;将坐标差值输入至S函数,确定排序误差;将坐标差值输入至距离回归损失函数,确定间隔误差;将多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;获取常量误差、排序误差、间隔误差和回归误差的总和,得到损失值。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,参考坐标是基于多帧训练影像中包含的目标对象的分段特征确定的;利用多组训练样本对初始模型进行训练,得到定位模型。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:接收待处理影像序列;利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的;输出多帧待处理影像的定位结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取待处理影像序列;利用定位模型对待处理影像序列进行处理,得到待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于至少一帧待处理影像包含的目标对象的分段特征确定的。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (24)

1.一种数据处理方法,包括:
接收模型训练请求;
获取所述模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及所述多帧训练影像的参考坐标,所述参考坐标是基于所述多帧训练影像中包含的目标对象的分段特征确定的;
利用所述多组训练样本对所述初始模型进行训练,得到定位模型;
输出所述定位模型。
2.根据权利要求1所述的方法,其中,在获取所述模型训练请求的多组训练样本之前,所述方法还包括:
获取影像数据库中满足预设条件的目标影像序列,其中,所述目标影像序列中包含有所述目标对象;
基于所述目标对象的分段特征,确定所述目标影像序列中多帧目标影像的参考坐标;
随机抽取所述目标影像序列中预设帧数的目标影像;
基于所述预设帧数的目标影像,以及所述预设帧数的目标影像的参考坐标,生成所述至少一组训练样本。
3.根据权利要求2所述的方法,其中,基于所述目标对象的分段特征,确定所述目标影像序列中多帧目标影像的参考坐标包括:
对所述目标对象的多个分段进行标注;
确定所述多个分段的中心点所在目标影像的帧序号,得到所述多个分段对应的帧序号;
基于所述多个分段的标注结果,确定所述多个分段对应的参考坐标;
基于所述多帧目标影像的帧序号,所述多个分段对应的帧序号,以及所述多个分段对应的参考坐标,确定所述多帧目标影像的参考坐标。
4.根据权利要求3所述的方法,其中,基于所述多个分段的标注结果,确定所述多个分段对应的参考坐标包括:
基于所述多个分段对应的标注结果和相邻两个分段对应的预设坐标间隔,得到所述多个分段对应的参考坐标。
5.根据权利要求3所述的方法,其中,基于所述多帧目标影像的帧序号,所述多个分段对应的帧序号,以及所述多个分段对应的参考坐标,确定所述多帧目标影像的参考坐标包括:
获取第一目标影像的帧序号与第一分段对应的帧序号的差值,得到第一差值,其中,所述第一目标影像是所述目标影像序列中的任意一帧目标影像,所述第一目标影像的帧序号大于所述第一分段对应的帧序号,且小于第二分段对应的帧序号,所述第一分段与所述第二分段相邻;
获取所述第二分段对应的帧序号与所述第一分段对应的帧序号的差值,得到第二差值;
获取所述第一差值与所述第二差值的比值;
获取所述比值与第一预设值的乘积;
获取所述乘积与所述第一分段对应的参考坐标的和值,得到所述第一目标影像的参考坐标。
6.根据权利要求2所述的方法,其中,随机抽取所述目标影像序列中预设帧数的目标影像包括:
获取抽取初始帧序号和抽取间隔;
基于所述抽取初始帧序号和所述抽取间隔对所述目标影像序列进行影像抽取,得到所述预设帧数的目标影像。
7.根据权利要求2所述的方法,其中,基于所述预设帧数的目标影像,以及所述预设帧数的目标影像的参考坐标,生成所述至少一组训练样本包括:
对所述预设帧数的目标影像进行翻转、缩放或旋转操作,得到操作后的目标影像;
基于所述操作后的目标影像,以及所述操作后的目标影像的参考坐标,生成所述至少一组训练样本。
8.根据权利要求2所述的方法,其中,在获取影像数据库中满足预设条件的目标影像序列之后,所述方法还包括:
调整所述多帧目标影像的窗宽和窗位;
通过双线性插值方法调整所述多帧目标影像的分辨率为目标分辨率;
调整所述多帧目标影像的尺寸为目标尺寸。
9.根据权利要求1所述的方法,其中,利用所述至少一组训练样本对所述初始模型进行训练,得到定位模型包括:
将所述训练样本输入至所述初始模型,得到所述多帧训练影像的预测坐标;
获取相邻两帧训练影像的预测坐标的差值,得到坐标差值;
基于所述坐标差值、所述多帧训练影像的参考坐标和预测坐标,确定所述初始模型的损失值;
基于所述损失值对所述初始模型进行参数更新,得到所述定位模型。
10.根据权利要求9所述的方法,其中,基于所述坐标差值、所述多帧训练影像的参考坐标和预测坐标,确定所述初始模型的损失值包括:
基于所述坐标差值与第二预设值的差值,确定常量误差;
将所述坐标差值输入至S函数,确定排序误差;
将所述坐标差值输入至距离回归损失函数,确定间隔误差;
将所述多帧训练影像的参考坐标和预测坐标输入至距离回归损失函数,确定回归误差;
获取所述常量误差、所述排序误差、所述间隔误差和所述回归误差的总和,得到所述损失值。
11.根据权利要求1所述的方法,其中,利用适应性矩估计算法,基于所述训练样本对所述初始模型进行训练,得到所述定位模型,其中,所述初始模型的初始学习率为0.001,所述初始模型的迭代次数为100。
12.一种数据处理方法,包括:
获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及所述多帧训练影像的参考坐标,所述参考坐标是基于所述多帧训练影像中包含的目标对象的分段特征确定的;
利用所述多组训练样本对初始模型进行训练,得到定位模型。
13.根据权利要求12所述的方法,其中,在获取多组训练样本之前,所述方法还包括:
获取影像数据库中满足预设条件的目标影像序列,其中,所述目标影像序列中包含有所述目标对象;
基于所述目标对象的分段特征,确定所述目标影像序列中多帧目标影像的参考坐标;
随机抽取所述目标影像序列中预设帧数的目标影像;
基于所述预设帧数的目标影像,以及所述预设帧数的目标影像的参考坐标,生成所述至少一组训练样本。
14.根据权利要求13所述的方法,其中,基于所述目标对象的分段特征,确定所述目标影像序列中多帧目标影像的参考坐标包括:
对所述目标对象的多个分段进行标注;
确定所述多个分段的中心点所在目标影像的帧序号,得到所述多个分段对应的帧序号;
基于所述多个分段对应的标注结果,确定所述多个分段对应的参考坐标;
基于所述多帧目标影像的帧序号,所述多个分段对应的帧序号,以及所述多个分段对应的参考坐标,确定所述多帧目标影像的参考坐标。
15.根据权利要求12所述的方法,其中,在利用所述多组训练样本对初始模型进行训练,得到定位模型之后,所述方法还包括:
获取待处理影像序列,其中,所述待处理影像序列中包含有所述目标对象;
利用所述定位模型对所述待处理影像序列进行处理,得到所述待处理影像序列中多帧待处理影像的定位结果。
16.一种数据处理方法,包括:
接收待处理影像序列;
利用定位模型对所述待处理影像序列进行处理,得到所述待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于所述至少一帧待处理影像包含的目标对象的分段特征确定的;
输出所述多帧待处理影像的定位结果。
17.根据权利要求16所述的方法,其中,所述方法还包括:
获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,所述参考坐标是基于所述多帧训练影像中包含的目标对象的分段特征确定的;
利用所述多组训练样本对初始模型进行训练,得到所述定位模型。
18.根据权利要求17所述的方法,其中,在获取多组训练样本之前,所述方法还包括:
获取影像数据库中满足预设条件的目标影像序列,其中,所述目标影像序列中包含有所述目标对象;
基于所述目标对象的分段特征,确定所述目标影像序列中多帧目标影像的参考坐标;
随机抽取所述目标影像序列中预设帧数的目标影像;
基于所述预设帧数的目标影像,以及所述预设帧数的目标影像的参考坐标,生成所述至少一组训练样本。
19.一种数据处理方法,包括:
获取待处理影像序列;
利用定位模型对所述待处理影像序列进行处理,得到所述待处理影像序列中多帧待处理影像的定位结果,其中,至少一帧待处理影像的定位结果是基于所述至少一帧待处理影像包含的目标对象的分段特征确定的。
20.根据权利要求19所述的方法,其中,所述方法还包括:
获取多组训练样本,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,所述参考坐标是基于所述多帧训练影像中包含的目标对象的分段特征确定的;
利用所述多组训练样本对初始模型进行训练,得到所述定位模型。
21.根据权利要求20所述的方法,其中,在获取多组训练样本之前,所述方法还包括:
获取影像数据库中满足预设条件的目标影像序列,其中,所述目标影像序列中包含有所述目标对象;
基于所述目标对象的分段特征,确定所述目标影像序列中多帧目标影像的参考坐标;
随机抽取所述目标影像序列中预设帧数的目标影像;
基于所述预设帧数的目标影像,以及所述预设帧数的目标影像的参考坐标,生成所述至少一组训练样本。
22.一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至21中任意一项所述的数据处理方法。
23.一种计算机终端,包括:存储器和处理器,所述处理器用于运行所述存储器中存储的程序,其中,所述程序运行时执行权利要求1至21中任意一项所述的数据处理方法。
24.一种数据处理系统,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:接收模型训练请求;获取所述模型训练请求的多组训练样本和初始模型,其中,至少一组训练样本包括:多帧训练影像,以及多帧训练影像的参考坐标,所述参考坐标是基于所述多帧训练影像中包含的目标对象的分段特征确定的;利用所述训练样本对所述初始模型进行训练,得到定位模型;输出所述定位模型。
CN202010676933.8A 2020-07-14 2020-07-14 数据处理方法和系统 Pending CN113934880A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010676933.8A CN113934880A (zh) 2020-07-14 2020-07-14 数据处理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010676933.8A CN113934880A (zh) 2020-07-14 2020-07-14 数据处理方法和系统

Publications (1)

Publication Number Publication Date
CN113934880A true CN113934880A (zh) 2022-01-14

Family

ID=79273835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010676933.8A Pending CN113934880A (zh) 2020-07-14 2020-07-14 数据处理方法和系统

Country Status (1)

Country Link
CN (1) CN113934880A (zh)

Similar Documents

Publication Publication Date Title
US10470510B1 (en) Systems and methods for full body measurements extraction using multiple deep learning networks for body feature measurements
US10489683B1 (en) Methods and systems for automatic generation of massive training data sets from 3D models for training deep learning networks
US9471748B2 (en) Method for sharing medical image data based on cloud platform, cloud platform and system
CN110321920A (zh) 图像分类方法、装置、计算机可读存储介质和计算机设备
JP2022517925A (ja) 画像処理方法および装置、電子機器、記憶媒体およびコンピュータプログラム
CN111445440B (zh) 一种医学图像分析方法、设备和存储介质
CN110752028A (zh) 一种图像处理方法、装置、设备以及存储介质
WO2013040693A1 (en) Computer system and method for atlas-based consensual and consistent contouring of medical images
CN113469180A (zh) 医学图像的处理方法和系统、数据处理方法
CN113256529B (zh) 图像处理方法、装置、计算机设备及存储介质
CN111488872B (zh) 图像检测方法、装置、计算机设备和存储介质
CN113763533A (zh) 对象的模型处理方法、存储介质和处理器
CN111862124A (zh) 图像处理方法、装置、设备及计算机可读存储介质
CN115131289A (zh) 图像处理模型的训练方法
CN110648762A (zh) 病灶区识别模型生成方法、装置及病灶区识别方法、装置
CN112132232A (zh) 医学图像的分类标注方法和系统、服务器
CN111402278A (zh) 分割模型训练方法、图像标注方法及相关装置
CN110415341B (zh) 一种三维人脸模型的生成方法、装置、电子设备及介质
CN113780519A (zh) 生成对抗网络训练方法、装置、计算机设备和存储介质
CN113934880A (zh) 数据处理方法和系统
Aydin et al. A hybrid image processing system for X-ray images of an external fixator
CN112037886B (zh) 放疗计划制定装置、方法及存储介质
CN114723723A (zh) 医学影像处理方法、计算机设备和存储介质
CN113012207A (zh) 一种图像配准方法和装置
CN117237394B (zh) 基于多注意力的轻量级分割图像的方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination