CN117651969A - 已学习模型生成方法和已学习模型生成系统 - Google Patents

已学习模型生成方法和已学习模型生成系统 Download PDF

Info

Publication number
CN117651969A
CN117651969A CN202280049043.1A CN202280049043A CN117651969A CN 117651969 A CN117651969 A CN 117651969A CN 202280049043 A CN202280049043 A CN 202280049043A CN 117651969 A CN117651969 A CN 117651969A
Authority
CN
China
Prior art keywords
image data
region
learned model
data
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280049043.1A
Other languages
English (en)
Inventor
山本周平
泽田隆二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of CN117651969A publication Critical patent/CN117651969A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本已学习模型生成方法包括以下步骤:基于包括第一训练图像数据(86b)的学习数据(86)来生成已学习模型(50);判定推断结果数据(84)中的估计区域是否为误估计;决定包含于第一训练图像数据(86b)中的噪声区域(60);更新第一训练图像数据(86b);以及重新生成已学习模型(55)。

Description

已学习模型生成方法和已学习模型生成系统
技术领域
本发明涉及一种已学习模型生成方法和已学习模型生成系统。
背景技术
以往已知一种用于进行细胞图像的分割处理的基于机器学习的已学习模型的生成方法。这样的已学习模型的生成方法例如在再公表专利WO2019/171453号中公开。
在上述再公表专利WO2019/171453号中公开了以下内容:为了在iPS细胞、ES细胞等多能性干细胞的观察图像内识别未分化细胞、从未分化状态逸脱的未分化逸脱细胞等的区域,而对观察图像进行分割。观察图像的分割是通过利用机器学习生成的已学习模型来实施的。通过对作为处理对象的输入图像(观察图像)进行分割,来输出对未分化细胞区域(正常细胞区域)、未分化逸脱细胞区域(异常细胞区域)、不存在细胞的背景区域等分别进行了标记的标签图像。在上述再公表专利WO2019/171453号中还公开了用于生成在进行观察图像的分割时使用的学习模型的学习模型生成方法。
现有技术文献
专利文献
专利文献1:再公表专利WO2019/171453号
发明内容
发明要解决的问题
然而,作为对输入图像进行分割的结果,在标签图像中,有时对应该被赋予为“背景”区域的标签的部分错误地赋予了“异常细胞”区域的标签。另一方面,有时由于在机器学习中将如上述那样有可能被错误地赋予“异常细胞”区域的标签的部分学习为“背景”区域,使得在标签图像中未对应该被赋予为“异常细胞”区域的标签的区域正确地赋予“异常细胞”区域的标签。也就是说,存在无法正确地检测到检测对象的问题。尤其在“异常细胞”的出现频率比“正常细胞”的出现频率低的情况下,“异常细胞”的检测精度的下降在实用上会成为很大的问题。
本发明是为了解决上述这样的问题而完成的,本发明的目的之一在于提供一种能够抑制检测对象的检测精度的下降的已学习模型生成方法和已学习模型生成系统。
用于解决问题的方案
本发明的第一方面的已学习模型生成方法是基于机器学习的已学习模型的生成方法,所述已学习模型用于进行细胞图像的分割处理,所述已学习模型生成方法包括以下步骤:基于包括第一输入图像数据以及与第一输入图像数据对应的第一训练图像数据的学习数据,来生成已学习模型,所述第一训练图像数据至少被标记了表示检测对象的第一标签和表示背景的第二标签;通过所生成的已学习模型,使用包括第二输入图像数据的推断处理用数据来执行推断处理;判定在通过推断处理输出的推断结果数据中被估计为是检测对象或背景的区域是否为误估计;在被判定为所估计的区域是误估计的区域中,确定不适用于第一标签和第二标签的噪声区域;决定包含于第一训练图像数据中的噪声区域;还对在第一训练图像数据中被决定为噪声区域的区域标记表示噪声区域的第三标签,并且更新第一训练图像数据;以及基于包括第一输入图像数据和更新后的第一训练图像数据的更新后的学习数据,来重新生成已学习模型。
本发明的第二方面的已学习模型生成系统是基于机器学习的已学习模型的生成系统,所述已学习模型用于进行细胞图像的分割处理,所述已学习模型生成系统具备:存储部,其存储包括第一输入图像数据和与第一输入图像数据对应的第一训练图像数据的学习数据、以及至少包括第二输入图像数据的推断处理用数据,所述第一训练图像数据至少被标记了表示检测对象的第一标签和表示背景的第二标签;已学习模型生成部,其基于存储部存储的学习数据来生成已学习模型;以及推断处理执行部,其通过所生成的已学习模型,使用存储部存储的推断处理用数据来执行推断处理,其中,存储部构成为:还存储包括第一输入图像数据和更新后的第一训练图像数据的更新后的学习数据,所述更新后的第一训练图像数据是通过还对包含于第一训练图像数据中的噪声区域标记表示噪声区域的第三标签所得到的,噪声区域与在由推断处理执行部输出的结果数据中被误估计为是检测对象的区域中的、不适用于第一标签和第二标签的噪声区域相当,已学习模型生成部构成为:基于存储部存储的更新后的学习数据,来重新生成已学习模型。
发明的效果
本发明的第一方面的已学习模型生成方法如上所述那样包括以下步骤:判定在推断结果数据中被估计为是检测对象或背景的区域是否为误估计;在被判定为所估计的区域是误估计的区域中确定噪声区域;决定包含于第一训练图像数据中的噪声区域;还对在第一训练图像数据中被决定为噪声区域的区域标记表示噪声区域的第三标签,并且更新第一训练图像数据;以及基于更新后的学习数据来重新生成已学习模型。在此,考虑预先掌握在输入图像中可能被错误地赋予为检测对象的标签的背景区域,并且预先将分割时的标签的种类设为检测对象区域、背景区域以及噪声区域这三种。然而,大多是通过确认由利用机器学习生成的已学习模型实施的输入图像的分割的结果中的标签图像才能够识别哪个区域是噪声区域。即,难以事先识别哪个区域有可能成为噪声区域。因此,存在以下问题:难以预先基于包括被单纯地标记了检测对象区域、背景区域以及噪声区域这三种的训练图像数据的学习数据来生成已学习模型。因此,通过构成为在被判定为在推断结果数据中是误估计的区域中确定噪声区域,能够确定包含于第一训练图像数据中的噪声区域,因此能够再学习为与被赋予了其它标签的区域相区别地检测噪声区域。因此,能够基于更新后的学习数据来重新生成已学习模型,其结果是,能够抑制检测对象的检测精度的下降。
本发明的第二方面的已学习模型生成系统如上所述那样构成为还存储包括更新后的第一训练图像数据的更新后的学习数据,所述更新后的第一训练图像数据是通过还对包含于第一训练图像数据中的噪声区域标记表示噪声区域的第三标签所得到的,噪声区域与在由推断处理执行部输出的推断结果数据中被误估计为是检测对象的区域中的噪声区域相当,并且构成为基于更新后的学习数据来重新生成已学习模型。通过像这样构成,与上述第一方面同样,能够再学习为与被赋予了其它标签的区域相区别地检测包含于第一训练图像数据中的噪声区域。因此,能够基于更新后的学习数据重新生成已学习模型,其结果是,能够抑制检测对象的检测精度的下降。
附图说明
图1是用于说明第一实施方式的图像分析系统的概要的框图。
图2是用于说明服务器的结构的框图。
图3是示出机器学习、推断处理、机器学习(再学习)以及分割处理的概要的图。
图4是用于说明差分图像数据的示意图。
图5是对使用重新生成前的已学习模型所输出的处理图像的一例以及使用重新生成的已学习模型所输出的处理图像的一例进行比较的示意图。
图6是用于说明第一实施方式的机器学习、推断处理以及机器学习(再学习)的流程图。
图7是用于说明第二实施方式的机器学习、推断处理以及机器学习(再学习)的流程图。
图8是示出变形例中的使用重新生成的已学习模型所输出的处理图像的一例的示意图。
具体实施方式
下面,基于附图来说明将本发明具体化的实施方式。
[第一实施方式]
参照图1~图6来说明包括第一实施方式的已学习模型生成系统100的图像分析系统200的结构和已学习模型生成方法。
(图像分析系统)
图1所示的图像分析系统200包括用于通过机器学习来生成已学习模型55的已学习模型生成系统100,所述已学习模型55用于进行细胞图像81的分割处理。已学习模型生成系统100包括被包含于服务器10的控制部11和存储部12。
图像分析系统200包括服务器10、计算机20以及摄像装置30。在图1中示出了通过客户服务器模型构建出的图像分析系统200的例子。服务器10、计算机20以及摄像装置30经由网络40以彼此能够通信的方式连接。
计算机20是用户操作的客户终端,对服务器10发送各种处理的请求。计算机20包括显示部21。计算机20能够从摄像装置30获取通过摄像装置30拍摄到的细胞图像81,并将获取到的细胞图像81显示于显示部21。显示部21例如是液晶显示装置。
服务器10根据来自计算机20的请求(处理请求)来进行各种信息处理。服务器10包括控制部11和存储部12。
服务器10(控制部11)生成已学习模型50。另外,服务器10(控制部11)执行推断处理。推断处理是使用通过机器学习生成的已学习模型50来输出基于输入的推断结果的处理。另外,服务器10(控制部11)利用已学习模型50对细胞图像81进行图像处理。作为图像处理的结果,服务器10(控制部11)生成细胞图像81的处理图像82。服务器10(控制部11)将生成的处理图像82发送到计算机20。接收到信息的计算机20使显示部21显示处理图像82。
控制部11构成为基于学习数据86(参照图2)来生成已学习模型50。另外,控制部11构成为通过所生成的已学习模型50使用推断处理用数据87(参照图2)来执行推断处理。另外,在本实施方式中,基于针对推断处理用数据87(参照图2)的推断处理的结果来对学习数据86进行修正,并更新为学习数据88。另外,控制部11构成为基于更新后的学习数据88(参照图2)来重新生成已学习模型55(参照图3)。所重新生成的已学习模型55(参照图3)用于进行细胞图像81的分割处理。
另外,控制部11构成为生成示出推断处理用数据87(参照图2)和推断结果数据84(参照图2)的差分的差分图像数据83(参照图2)。控制部11包括CPU(Central ProcessingUnit:中央处理单元)、FPGA(Field-Programmable Gate Array:现场可编程门阵列)、ASIC(Application Specific Integrated Circuit:专用集成电路)等处理器。通过处理器执行规定的程序来进行作为控制部11的运算处理。
存储部12是存储信息的装置。存储部12存储已学习模型50、重新生成的已学习模型55(参照图2)、以及各种图像数据80。存储部12包括非易失性存储装置。非易失性存储装置例如为硬盘驱动器、固态硬盘等。
摄像装置30生成拍摄细胞所得到的细胞图像81。摄像装置30能够经由网络40将所生成的细胞图像81发送到计算机20和/或服务器10。细胞图像81例如是使用细胞培养器具培养出的培养细胞的图像。拍摄到的细胞图像81是显微镜图像。摄像装置进行基于明视野观察法、暗视野观察法、相位差观察法、微分干涉观察法等摄影方法的图像化。
网络40将服务器10、计算机20以及摄像装置30以彼此能够通信的方式连接。例如,网络40能够是构建于设施内的LAN(Local Area Network:局域网)。例如,网络40能够是因特网。在网络为因特网的情况下,图像分析系统200能够是以云计算的方式构建的系统。
(图像分析系统的具体的装置结构)
接着,对图像分析系统200的具体的装置结构的一例进行说明。
摄像装置30是在线型全息显微镜。摄像装置30具备图像传感器32和包括激光二极管等的光源部31。在进行摄像时,在光源部31与图像传感器32之间配置包括细胞菌落(或细胞单体)的培养板33。摄像装置30生成作为细胞图像81的IHM(In-line HolographicMicroscopy:在线全息显微镜)相位像。
计算机20具备处理器22、存储部23、显示部21以及作为用户接口的输入部24。输入部24包括鼠标、键盘等输入装置。
处理器22构成为:通过执行存储部23中存储的程序,来控制摄像装置30的动作,并且对通过摄像装置30获取到的数据进行处理。处理器22以功能块的方式包括摄像控制部22a和细胞图像生成部22b。
当由用户将包括细胞菌落的培养板33放置于摄像装置30的规定位置、并经由输入部24受理规定的操作时,处理器22通过摄像控制部22a控制摄像装置30来获取全息数据。
摄像装置30基于摄像控制部22a的控制使光源部31照射相干光。摄像装置30通过图像传感器32获取基于透过了培养板33及细胞菌落34的光与在培养板33上透过了细胞菌落34的附近区域的光的干涉条纹的像。图像传感器32获取全息数据(形成于检测面上的全息的二维光强度分布数据)。
细胞图像生成部22b通过对由摄像装置30获取到的全息数据执行用于相位恢复的运算处理来计算相位信息。而且,细胞图像生成部22b基于计算出的相位信息来生成IHM相位像(细胞图像81)。相位信息的计算、IHM相位像的生成方法能够利用公知的技术,因此省略详细的说明。
生成的细胞图像81被存储于存储部23。另外,生成的细胞图像81被处理器22发送到服务器10。
(服务器)
如图2所示,服务器10的控制部11以功能块的方式包括已学习模型生成部11a、推断处理执行部12b以及图像处理部11c。
存储部12存储有所生成的已学习模型50。存储部12存储有重新生成的已学习模型55。存储部12存储有通过摄像装置30拍摄到的多个细胞图像81。例如,通过摄像装置30拍摄到的全部的细胞图像81被自动地发送到服务器10,并被存储于存储部12。另外,存储部12存储将第一输入图像数据86a以及与第一输入图像数据86a对应的第一训练图像数据86b建立关联所得到的学习数据86。学习数据86用于生成已学习模型50。第一训练图像数据86b是作为针对第一输入图像数据86a进行的分割处理的结果而应该输出的正解图像。另外,存储部12存储将第二输入图像数据87a以及与第二输入图像数据87a对应的第二训练图像数据87b建立关联所得到的推断处理用数据87。推断处理用数据87用于推断处理。第二训练图像数据87b是作为针对第二输入图像数据87a进行的推断处理的结果而应该输出的正解图像。另外,存储部12存储包括第一输入图像数据86a和更新后的第一训练图像数据88b的更新后的学习数据88。另外,存储部12存储示出推断处理用数据87的第二训练图像数据87b与同第二训练图像数据87b对应的推断结果数据84的差分的差分图像数据83。
〈已学习模型生成部〉
已学习模型生成部11a构成为:通过使用存储部12中存储的学习数据86进行机器学习,来生成已学习模型50。已学习模型生成部11a基于包括第一输入图像数据86a和第一训练图像数据86b的学习数据86来生成已学习模型50。另外,已学习模型生成部11a基于包括第一输入图像数据86a和更新后的第一训练图像数据88b的更新后的学习数据88,来重新生成已学习模型55。
〈推断处理执行部〉
推断处理执行部11b构成为使用存储部12中存储的推断处理用数据87来进行推断处理。推断处理执行部11b通过已学习模型50,使用推断处理用数据87中包括的第二输入图像数据87a来执行分割的推断处理,并输出推断结果数据84。
〈图像处理部〉
图像处理部11c构成为使用存储部12中存储的重新生成的已学习模型55来进行针对细胞图像81的图像处理。图像处理部11c将被选择为处理对象的细胞图像81设为输入图像并将其输入到重新生成的已学习模型55,由此进行针对输入图像的分割处理。作为分割处理的结果,图像处理部11c输出被输入到再学习所得到的已学习模型55的细胞图像81被分割为多个标签区域所得到的标签图像作为处理图像82。图像处理部11c将处理图像82发送到计算机20,并且使存储部12存储该处理图像82。
在本说明书中,“分割处理”是将输入图像分割为多个区域的处理,并且是通过对拍到检测对象的区域赋予表示该检测对象的标签来将输入图像划分为多个标签区域的处理。标签是表示出图像部分所示的含义的信息。标签区域是由在图像中被赋予了共同的标签的像素群构成的区域(图像的一部分)。
如图3所示,重新生成的已学习模型55对所输入的细胞图像81进行分割处理,并输出分割成多个标签区域的处理图像82。通过对图像中的每一个像素赋予(标记)标签来进行分割。可以是以多个像素的集合(像素群)为单位来赋予标签。将标签的种类称作类。
图2所示的图像处理部11c构成为:基于用户针对计算机20的输入部24(参照图1)进行的操作,对在第一训练图像数据86b中被决定为噪声区域60(参照图4)的区域标记表示噪声区域60(参照图4)的第三标签63(参照图5),并设为更新后的第一训练图像数据88b。在后文叙述噪声区域60(参照图4)。
另外,图像处理部11c构成为:在标记表示噪声区域60(参照图4)的第三标签(参照图5)而更新后的第一训练图像数据88b的数量少于规定数量的情况下,基于用户针对计算机20的输入部24(参照图1)进行的操作,进一步生成被标记了第三标签63(参照图5)的第一训练图像数据88b。具体地说,基于用户针对计算机20的输入部24(参照图1)进行的操作,从第一训练图像数据86b剪切出在第一训练图像数据86b中被决定为噪声区域60(参照图4)的区域的一部分或全部,并将剪切出的噪声区域60嵌入存储部12所存储的细胞图像81的背景,由此追加被标记了第三标签63的第一训练图像数据88b。上述规定数量是用户预先设定的认为在统计学上足够的更新后的第一训练图像数据88b的数量。或者,图像处理部11c基于用户针对计算机20的输入部24(参照图1)进行的操作,延用存储部12中存储的、在其它学习数据中标记了第三标签63所得到的第一训练图像数据88b,并追加被标记了第三标签63所得到的第一训练图像数据88b。
另外,图像处理部11c构成为生成示出推断处理用数据87的第二训练图像数据87b与同第二训练图像数据87b对应的推断结果数据84的差分的差分图像数据83。
(差分图像数据)
如图4所示,差分图像数据83是用于提取推断结果数据84中的误估计的区域的图像数据。差分图像数据83是示出推断处理用数据87(参照图2)中包括的第二训练图像数据87b与同第二训练图像数据87b对应的推断结果数据84之间的一致点以及差异点的图像数据。在第二训练图像数据87b中标记了表示检测对象的第一标签61和表示背景的第二标签62。另外,在推断结果数据84中也标记了基于推断的表示检测对象的第一标签61和表示背景的第二标签62。
在图4中示出在第二训练图像数据87b和推断结果数据84中将iPS细胞、ES细胞等多能性干细胞的图像(细胞图像)按以下三个类进行区域分割的例子:作为检测对象的“正常细胞”区域(维持了多能性的细胞即未分化细胞区域);作为检测对象的“异常细胞”区域(从未分化状态逸脱的细胞即未分化逸脱细胞区域);以及它们以外的“背景”区域。此外,在分割处理中,根据生成的已学习模型的利用用途的不同,类数量、检测的标签内容可能不同。因此,在本发明中,关于类数量、检测的标签内容没有特别限定。
在差分图像数据83中以能够识别的方式显示出在第二训练图像数据87b与推断结果数据84的对应的区域中均被标记了第一标签61的第一区域66。另外,以能够识别的方式显示出在第二训练图像数据87b中被标记了第二标签62而在推断结果数据84中被标记了第一标签61的第二区域67。另外,以能够识别的方式显示出在第二训练图像数据87b中被标记了第一标签61而在推断结果数据84中被标记了第二标签62的第三区域68。另外,以能够识别的方式显示出在第二训练图像数据87b与推断结果数据84的对应的区域中均被标记了第二标签62的第四区域69。
(噪声区域)
例如,输入图像数据中拍到的培养面的缺陷等并不是检测对象。因此,在训练图像数据中,培养面的缺陷等的区域的标签被赋予为背景区域。也就是说,在训练图像数据中未表示出培养面的缺陷等的区域。然而,在使用这样的输入图像数据和训练图像数据进行了机器学习的情况下,学习模型学习为背景是非均匀的。在通过生成的已学习模型进行了分割处理的情况下,细胞图像中拍到的细胞中的形状与缺陷很相似的细胞的标签有可能被赋予为背景区域。另外,在使用没有培养面的缺陷等的输入图像数据和训练图像数据进行了机器学习的情况下,学习模型学习为背景是均匀的。在通过生成的已学习模型进行了分割处理的情况下,细胞图像中拍到的细胞中的形状与培养面的缺陷很相似的细胞的标签有可能被赋予为检测对象区域。关于这样的在处理图像中可能被错误地赋予为检测对象的标签的背景的区域,在大多情况下通过确认分割的结果中的标签图像才能够识别出,难以预先识别。另外,关于在处理图像中可能被错误地赋予为背景区域的标签的检测对象的区域,也同样难以预先识别。在本实施方式中,将这样的在处理图像中可能被错误地赋予为检测对象的标签的背景的区域、以及在处理图像中可能被错误地赋予为背景区域的标签的检测对象的区域称作噪声区域60。图4所示的噪声区域60是在处理图像中可能被错误地赋予为检测对象的标签的背景的区域,是异物。
另外,噪声区域60是在通过推断处理输出的推断结果数据84中被估计为是检测对象的区域被图像处理部11c(参照图2)判定为是误估计、且该被判定为误估计的区域不适用于第一标签61和第二标签62的区域。在本实施方式中,噪声区域60是在推断结果数据84中“正常细胞”区域或“异常细胞”区域被判定为是误估计、且该被判定为误估计的区域不适用于第一标签61和第二标签62的区域。另外,噪声区域60是被用户确定为对检测对象的检测精度产生的影响较大(无法忽略)的区域。例如是如“背景”区域中包含的不符合“正常细胞”和“异常细胞”的物体被错误地估计为“异常细胞”的区域那样被确定为对检测对象的检测精度产生的影响较大的区域。
(第一输入图像数据的更新)
因此,在本实施方式中,通过使用包括第一输入图像数据86a和第一训练图像数据86b的学习数据86进行机器学习,来生成已学习模型50。第一输入图像数据86a可能包含噪声区域60。接着,通过生成的已学习模型50,使用推断处理用数据87中包括的第二输入图像数据87a执行推断处理,并输出推断结果数据84。第二输入图像数据87a也可能包含噪声区域60。生成示出推断结果数据84与推断处理用数据87中包括的第二训练图像数据87b的差分的差分图像数据83。用户如图4所示的那样对差分图像数据83与推断结果数据84进行对比。此时,如果在第二输入图像数据87a中包含有噪声区域60,则在差分图像数据中出现第二区域67。因此,用户能够确定包含于推断结果数据84中的噪声区域60。用户决定可能包含于第一输入图像数据86a中的噪声区域60。用户能够在第一输入图像数据86a中将例如形状等与在推断结果数据84中确定出的噪声区域60类似的区域决定为噪声区域60。用户能够通过输入部24对在第一输入图像数据86a中决定出的噪声区域60赋予第三标签63。计算机20或图像处理部11c将被赋予了第三标签63的第一输入图像数据86a进行更新,并作为更新后的第一输入图像数据88a存储于存储部12。
(机器学习、推断处理、机器学习(再学习)以及分割处理的概要)
参照图3来说明基于本实施方式的机器学习、推断处理、机器学习(再学习)以及分割处理的概要。
〈机器学习〉
已学习模型生成部11a(参照图2)构成为使用存储部12中存储的学习数据86来进行机器学习。已学习模型生成部11a从存储部12获取学习数据86。学习数据86构成为包括足够数量的数据。各个学习数据86包括作为处理对象的第一输入图像数据86a以及第一训练图像数据86b。已学习模型生成部11a使学习模型51以第一输入图像数据86a作为输入,并以第一训练图像数据86b作为输出,来学习从第一输入图像数据86a向第一训练图像数据86b的转换处理(分割处理)。通过进行机器学习来生成已学习模型50。
在本实施方式中,第一训练图像数据86b的类由作为检测对象的“正常细胞”区域(例如,iPS细胞、ES细胞等多能性干细胞中的未分化细胞区域)、作为检测对象的“异常细胞”区域(例如,iPS细胞、ES细胞中的从未分化状态逸脱的未分化逸脱细胞区域)、以及“背景”区域这三个类构成。
作为已学习模型50的机器学习法,能够使用全卷积神经网络(FullyConvolutional Networks;FCN)、神经网络、支持向量机(SVM)、提升方法(Boosting)等任意方法。作为一例,已学习模型50使用在语义分割中经常使用的卷积神经网络。这样的已学习模型50构成为包括被输入图像的输入层、卷积层、输出层。
〈推断处理〉
推断处理执行部11b(参照图2)构成为:通过生成的已学习模型50,使用存储部12中存储的推断处理用数据87中包括的第二输入图像数据87a进行推断处理。推断处理执行部11b从存储部12获取推断处理用数据87中包括的第二输入图像数据87a。推断处理用数据87构成为包括足够数量的数据。在进行推断处理时,通过将用于推断处理的第二输入图像数据87a输入到已学习模型50,能够进行第二输入图像数据87a的分割处理,并输出被分割为多个标签区域的推断结果数据84。
用于推断处理的推断处理用数据87是与用于机器学习的学习数据86不同的数据。第二训练图像数据87b的类及推断结果数据84的类与第一训练图像数据86b的类同样地由作为检测对象的“正常细胞”区域、作为检测对象的“异常细胞”区域、以及“背景”区域这三个类构成。
〈机器学习(再学习)〉
已学习模型生成部11a构成为使用存储部12中存储的更新后的学习数据88使已学习模型50再学习。已学习模型生成部11a从存储部12获取更新后的学习数据88。更新后的学习数据88包括作为处理对象的第一输入图像数据86a和更新后的第一训练图像数据88b。已学习模型生成部11a使已学习模型50以第一输入图像数据86a作为输入,并以更新后的第一训练图像数据88b作为输出,来学习从第一输入图像数据86a向更新后的第一训练图像数据88b的转换处理(分割处理)。通过进行机器学习(再学习)来生成重新生成的已学习模型55。
在本实施方式中,更新后的第一训练图像数据88b的类由作为检测对象的“正常细胞”区域、作为检测对象的“异常细胞”区域、“背景”区域、以及“噪声”区域这四个类构成。
〈分割处理〉
重新生成的已学习模型55对被输入的细胞图像81进行分割处理,来输出分割为多个标签区域的处理图像82。
在图5所示的、使用重新生成前的已学习模型50所输出的处理图像82的一例中,区域64a是“背景”的一部分区域,区域64b是作为检测对象的“异常细胞”区域。另外,在使用重新生成的已学习模型55所输出的处理图像82的一例中也是,区域64a是“背景”的一部分区域,区域64b是作为检测对象的“异常细胞”区域。在使用更新前的已学习模型50所输出的处理图像82中,区域64a被错误地检测为“异常细胞”区域,区域64b被错误地检测为“背景”区域。与此相对地,在使用更新后的已学习模型55所输出的处理图像82中,区域64a被正确地检测为噪声区域60,区域64b被正确地检测为“异常细胞”区域。
(机器学习、推断处理以及机器学习(再学习)的处理)
参照图6来说明基于本实施方式的机器学习、推断处理以及机器学习(再学习)的处理。
在步骤S1中,已学习模型生成部11a从存储部12获取包括第一输入图像数据86a和第一训练图像数据86b的学习数据86。之后,处理进入步骤S2。
在步骤S2中,已学习模型生成部11a使已学习模型50以第一输入图像数据86a作为输入,并以第一训练图像数据86b作为输出,来学习从第一输入图像数据86a向第一训练图像数据86b的转换处理(分割处理),来生成已学习模型50。之后,处理进入步骤S3。
在步骤S3中,推断处理执行部11b通过将存储部12中存储的第二输入图像数据87a输入到所生成的已学习模型50,来执行推断处理,并输出推断结果数据84。之后,处理进入步骤S4。
在步骤S4中,图像处理部11c生成示出存储部12中存储的第二训练图像数据87b与推断结果数据84的差分的差分图像数据83。另外,服务器10(控制部11)将生成的差分图像数据83和推断结果数据84的数据发送到计算机20,计算机20使显示部21显示差分图像数据83和推断结果数据84。之后,处理进入步骤S5。
在步骤S5中,基于用户对输入部24进行的操作,控制部11获取基于显示部21所显示的差分图像数据83和推断结果数据84的、关于在通过推断处理输出的推断结果数据84中被估计为是检测对象的区域是否为误估计的判定结果。之后,处理进入步骤S6。
在步骤S6中,基于用户对输入部24进行的操作,控制部11获取在被判定为在推断结果数据84中被估计为是检测对象的区域是误估计的区域中确定出不适用于第一标签61和第二标签62的噪声区域60的确定结果。之后,处理进入步骤S7。
在步骤S7中,基于用户对输入部24进行的操作,获取关于噪声区域60对检测对象的检测精度产生的影响是否大的判定结果。在为噪声区域60对检测对象的检测精度产生的影响大这一判定结果的情况下(在步骤S7中为“是”),处理进入步骤S8,在为噪声区域60对检测对象的检测精度产生的影响不大这一判定结果的情况下(在步骤S7中为“否”),处理结束。
在步骤S8中,基于用户对输入部24进行的操作,获取基于在推断结果数据84中确定出的噪声区域60的、决定出包含于第一训练图像数据86b中的噪声区域60的决定结果。之后,处理进入步骤S9。
在步骤S9中,用户确认差分图像数据83或者确认包括第一训练图像数据86b的学习数据86,对在第一训练图像数据86b中被决定为噪声区域60的区域标记表示噪声区域60的第三标签63。例如,第三标签63的标记能够经由计算机的输入部24来进行。此外,关于第三标签63的标记方法没有特别限定。标记第三标签63,并且更新第一训练图像数据86b。之后,处理进入步骤S10。
在步骤10中,基于用户对输入部24进行的操作,获取更新后的第一训练图像数据88b的数量是否为用户预先设定的更新后的第一训练图像数据88b的数量以上的判定结果。在是为用户预先设定的更新后的第一训练图像数据88b的数量以上这一判定结果的情况下(在步骤S10中为“是”),处理进入步骤S11,在是少于用户预先设定的更新后的第一训练图像数据88b的数量这一判定结果的情况下(在步骤S10中为“否”),处理进入步骤S12。
在步骤S11中,已学习模型生成部11a基于包括第一输入图像数据86a和更新后的第一训练图像数据88b的更新后的学习数据88,进行已学习模型55的重新生成(再学习)。通过进行机器学习(再学习),生成更新后的已学习模型55。之后,处理结束。
在步骤S12中,用户还生成(追加)标记了第三标签63的第一训练图像数据88b。之后,处理进入步骤S11。
(第一实施方式的效果)
在第一实施方式中,能够得到如以下那样的效果。
在第一实施方式中,如上所述,已学习模型生成方法包括以下步骤:判定在推断结果数据84中被估计为是检测对象的区域是否为误估计;在被判定为所估计的区域是误估计的区域中,确定噪声区域60,并决定包含于第一训练图像数据86b中的噪声区域60;还对在第一训练图像数据86b中被决定为噪声区域60的区域标记表示噪声区域60的第三标签63,来更新第一训练图像数据86b;以及基于更新后的学习数据88来重新生成已学习模型55。在此,考虑预先掌握在输入图像中有可能被错误地赋予为检测对象的标签的背景的区域,并预先将分割时的标签的种类设为检测对象区域、背景区域以及噪声区域这三种。然而,在大多情况下通过确认由通过机器学习生成的已学习模型实施的输入图像的分割的结果中的标签图像才能够识别哪个区域是噪声区域60。即,难以事先识别哪个区域有可能成为噪声区域60。因此,存在以下问题:难以预先基于包括被单纯地标记了检测对象区域、背景区域以及噪声区域这三种的训练图像数据的学习数据来生成已学习模型。因此,通过在被判定为在推断结果数据84中是误估计的区域中确定噪声区域,能够决定出包含于第一训练图像数据86b中的噪声区域60,因此能够再学习为与被赋予了其它标签的区域相区别地检测噪声区域60。因此,能够基于更新后的学习数据88来重新生成已学习模型55,其结果是,能够抑制检测对象的检测精度的下降。
另外,在第一实施方式中,如上所述,还包括以下步骤:生成示出第二训练图像数据87b与同第二训练图像数据87b对应的推断结果数据84的差分的差分图像数据83,来作为用于提取推断结果数据84中的误估计的区域的图像数据。由此,能够容易地识别差分图像数据83中所示的、被赋予了正确的标签的第二训练图像数据87b与推断结果数据84的差分。因此,能够基于差分图像数据83来容易地识别推断结果数据84中的误估计的区域。其结果是,能够容易地确定噪声区域60。
另外,在第一实施方式中,如上所述,生成将被标记了第一标签61的第一区域66、在第二训练图像数据87b中被标记了第二标签62而在推断结果数据84中被标记了第一标签61的第二区域67、以及在第二训练图像数据87b中被标记了第一标签61而在推断结果数据84中被标记了第二标签62的第三区域68以能够识别的方式显示的差分图像数据。由此,在差分图像数据83中将被正确地估计为检测对象区域的第一区域66、背景区域被错误地估计为检测对象区域的第二区域67、以及检测对象区域被错误地估计为背景区域的第三区域68以能够识别的方式显示。因此,能够更容易地确定噪声区域60。
另外,在第一实施方式中,如上所述,噪声区域60是误估计的区域的一部分。由此,能够将在背景区域被错误地估计为检测对象区域的区域中的、对检测对象的检测精度产生的影响大的区域确定为噪声区域60。因此,可以不将背景区域被错误地估计为检测对象区域的区域整体确定为噪声区域60,因此能够高效地确定噪声区域60。
另外,在第一实施方式中,如上所述,在重新生成已学习模型55的步骤中,基于除了更新后的学习数据88以外还被追加了包括第一输入图像数据86a和被标记了第三标签63后的第一训练图像数据88b的学习数据88的、更新后的学习数据88,来重新生成已学习模型55。由此,即使在更新后的学习数据88中的被标记了第三标签63的第一训练图像数据86b的数量少的情况下,也能够确保被标记了第三标签63的第一训练图像数据88b的数量。
另外,在第一实施方式中,如上所述,已学习模型的生成系统构成为:还获取更新后的学习数据88,并且基于更新后的学习数据88来重新生成已学习模型55,所述更新后的学习数据88包括还对包含于第一训练图像数据86b中的噪声区域60标记表示噪声区域60的第三标签63所得到的更新后的第一训练图像数据88b,噪声区域60与在由推断处理执行部11b输出的推断结果数据84中被误估计为是检测对象的区域中的噪声区域60相当。由此,能够再学习为与被赋予了其它标签的区域相区别地检测包含于第一训练图像数据88b中的噪声区域60。因此,能够基于更新后的学习数据88来重新生成已学习模型55,其结果是,能够抑制检测对象的检测精度的下降。
[第二实施方式]
接着,说明基于本发明的第二实施方式的已学习模型生成系统和已学习模型生成方法。与构成为判定在通过推断处理输出的推断结果数据84中被估计为是检测对象的区域是否为误估计的第一实施方式不同,在第二实施方式中构成为:判定在推断结果数据84中被估计为是包含于检测对象中的出现频率为规定的阈值以下的低出现检测对象的区域是否为误估计。
由于噪声区域60引起的对检测对象的检测精度的影响在检测对象的出现频率低的情况下(为低出现检测对象的情况下)变得显著。例如,设为用于进行分割处理的细胞图像81为1000张,在1000张之中拍到低出现检测对象的细胞图像只有5张。在该情况下,在噪声区域60被错误地检测为“低出现检测对象”区域的处理图像82存在5张的情况下,区域检测的正确率下降到50%。与此相对地,如果能够将噪声区域60被错误地检测为“低出现检测对象”区域的处理图像从5张减少到1张,则区域检测的正确率能够设为83.3%。
在本实施方式中,低出现检测对象是“异常细胞”。另外,在本实施方式中,噪声区域60是被判定为推断结果数据84中的“异常细胞”区域是误估计、且该被判定为误估计的区域不适用于第一标签61及第二标签62的区域。
图2所示的已学习模型生成部11a构成为获取从存储部12获取到的包括第一输入图像数据86a和第一训练图像数据86b的学习数据86中包含的检测对象的出现频率。另外,已学习模型生成部11a构成为判定所获取到的检测对象的出现频率是否为预先设定的阈值以下。为预先设定的阈值以下的情况例如是每10张第一输入图像数据有3张以下的数量的拍到检测对象的第一输入图像数据86a的情况、检测对象区域的面积占全部的第一输入图像数据86a的总面积的比例为10%以下的情况。此外,预先设定的阈值并不限定于这些,能够适当地设定。
另外,已学习模型生成部11a构成为:在检测对象的出现频率为预先设定的阈值以下的情况下,判定为存在低出现检测对象,并将存在低出现检测对象的情况存储于存储部12。另外,服务器10(控制部11)构成为:将学习数据86中包括低出现检测对象这一信息发送到计算机20,接收到信息的计算机20经由显示部21对用户通知包括低出现检测对象这一情况。
图像处理部11c判定在存储部12中存储的其它学习数据86中是否存在包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据。在存在包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据的情况下,图像处理部11c将这些数据追加于学习数据86。在不存在包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据的情况、或者即使追加了包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据也达不到预先设定的张数的情况下,图像处理部11c构成为生成包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据。具体地说,基于用户对计算机20的输入部24(参照图1)进行的操作,从包括低出现检测对象的第一输入图像数据86a或第一训练图像数据86b中剪切出低出现检测对象,并将剪切出的低出现检测对象嵌入存储部12中存储的学习数据86的背景,由此追加包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据。此外,对于包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据的生成方法没有特别限定,能够使用公知的数据扩展方法。
(机器学习、推断处理以及机器学习(再学习)的处理)
参照图7来说明基于本实施方式的机器学习、推断处理以及机器学习(再学习)的处理。此外,对与第一实施方式不同的处理进行说明,对于与第一实施方式相同的处理省略说明。
在步骤S21中,已学习模型生成部11a获取从存储部12获取到的包括第一输入图像数据86a和第一训练图像数据86b的学习数据86中包含的检测对象的出现频率,并判定是否存在低出现检测对象。在不存在低出现检测对象的情况下(在步骤S21中为“是”),处理进入步骤S2,在存在低出现检测对象的情况下(在步骤S21中为“否”),处理进入步骤S22。
在步骤S22中,已学习模型生成部11a将存在低出现检测对象的情况存储于存储部12,并且服务器10(控制部11)经由计算机20对用户通知包括低出现检测对象这一情况。之后,处理进入步骤S23。
在步骤S23中,图像处理部11c判定在存储部12中存储的其它学习数据86中是否存在包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据。在存在包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据的情况下(在步骤S23中为“是”),处理进入步骤S24,在不存在包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据的情况、或者即使追加了学习数据86也达不到预先设定的张数的情况下(在步骤S23中为“否”),处理进入步骤S24。
在步骤S24中,图像处理部11c将包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据追加到学习数据86中。之后,处理进入步骤S2。
在步骤S25中,基于用户对输入部24进行的操作,生成(追加)包括低出现检测对象的第一输入图像数据86a和第一训练图像数据86b的数据。之后,处理进入步骤S2。
在步骤S26中,基于用户对输入部24进行的操作,在显示部21获取基于差分图像数据83和推断结果数据84的、在通过推断处理输出的推断结果数据84中被估计为是低出现检测对象即“异常细胞”区域的区域是否为误估计的判定结果。之后,处理进入步骤S6。
第二实施方式的其它结构与上述第一实施方式相同。
(第二实施方式的效果)
在第二实施方式中,能够得到如以下那样的效果。
在第二实施方式中,在已学习模型生成方法中,如上所述,在判定是否为误估计的步骤中,判定在推断结果数据84中被估计为是包含于检测对象中的出现频率在规定的阈值以下的低出现检测对象的区域是否为误估计。由此,能够将被判定为被估计为是低出现检测对象的区域是误估计的区域确定为噪声区域60。由于噪声区域60引起的对检测对象的检测精度的影响在检测对象的出现频率低的情况下变得显著,因此能够进一步抑制检测对象的检测精度的下降。
另外,在第二实施方式中,如上所述,低出现检测对象是异常细胞。由此,能够基于被误估计为是异常细胞区域的区域确定噪声区域60,因此能够进一步抑制低出现检测对象即异常细胞的检测精度的下降。
另外,在第二实施方式中,如上所述,还包括以下步骤:获取包含于学习数据86中的检测对象的出现频率;以及在基于获取到的包含于学习数据86中的检测对象的出现频率而在检测对象中包括低出现检测对象的情况下,对用户通知包括低出现检测对象这一情况。由此,能够促使用户追加被标记了表示低出现检测对象的第一标签61的第一训练图像数据86b。因此,能够进一步抑制在检测对象的出现频率低的情况下变得显著的由于噪声区域引起的检测对象的检测精度的下降。
另外,在第二实施方式中,如上所述,在生成已学习模型的步骤中,基于被追加了包括低出现检测对象的学习数据86的学习数据86来生成已学习模型50。由此,能够进一步抑制在检测对象的出现频率低的情况下变得显著的由于噪声区域60引起的检测对象的检测精度的下降。
另外,第二实施方式的其它效果与第一实施方式相同。
[变形例]
此外,应当认为本次公开的实施方式在所有方面均是例示,而非限制性的。本发明的范围不由上述的实施方式的说明表示而由权利要求书表示,还包括与权利要求书等同的含义和范围内的所有变更(变形例)。
例如,在上述第一实施方式中示出了推断处理执行部11b构成为执行推断处理(步骤S3)、并且判定在推断结果数据84中被估计为是检测对象的区域是否为误估计(步骤S5)的例子,但本发明并不限于此。例如,可以构成为在执行推断处理之后且判定是否为误估计之前,使计算机20的显示部21显示推断结果数据84中的误估计的区域。图像处理部11c例如可以在推断结果数据84中提取被误估计为是检测对象区域且被背景区域包围的区域,并将其作为噪声区域60的具体例而显示于计算机20的显示部21。由此,用户能够目视确认噪声区域60的具体例,因此能够更高效地确定噪声区域60。
另外,在使计算机20的显示部21显示上述的推断结果数据84中的误估计的区域的情况下,图像处理部11c可以构成为使计算机20的显示部21显示满足预先设定的与深宽比、专有面积及形状的复杂度中的至少任一方有关的条件的误估计的区域。由此,用户能够目视确认容易识别为噪声区域60的具体例,因此能够更高效地确定噪声区域60。此外,与深宽比、专有面积及形状的复杂度有关的条件能够根据检测对象适当地设定,没有特别限定。另外,形状的复杂度可以基于噪声区域60的周长和专有面积来设定,也可以根据其它条件设定。
另外,在使计算机20的显示部21显示上述的推断结果数据中的误估计的区域的情况下,图像处理部11c可以对第二训练图像数据87b的、与推断结果数据84中的提取出的噪声区域60对应的区域标记第三标签63。由此,用户能够目视确认噪声区域60的第三标签63的具体例。
另外,在上述第一实施方式中,示出了在使用重新生成的已学习模型55所输出的处理图像82(参照图5)中区域64a被正确地显示为噪声区域60的例子,但本发明不限于此。图8所示的使用重新生成的已学习模型55所输出的处理图像82除了未进行表示噪声区域60的显示以外,其余与图5所示的使用更新后的已学习模型50所输出的处理图像82对应。作为对噪声区域60再学习的结果,能够抑制由于噪声区域60引起的检测对象的检测精度的下降,但根据图像分析对象的不同,在处理图像82中不显示噪声区域60的话有可能成为对于用户有用且不使识别性下降的分析图像。因此,如图8所示,处理图像82可以不进行表示噪声区域60的显示。
另外,在上述第一实施方式中,示出了构成为判定在通过推断处理输出的推断结果数据84中被估计为是检测对象的区域是否为误估计的例子,但本发明并不限于此。例如,可以构成为判定在通过推断处理输出的推断结果数据84中被估计为是背景的区域是否为误估计。
另外,在上述第二实施方式中示出了低出现检测对象是“异常细胞”的例子,但本发明并不限于此。例如,低出现检测对象可以是“正常细胞”。
另外,在第一实施方式中,示出了构成为图像处理部11c生成差分图像数据83、并且服务器10(控制部11)将生成的差分图像数据83和推断结果数据84的数据发送到计算机20的例子,但本发明并不限于此。例如,可以构成为:图像处理部11c还基于生成的差分图像数据83,生成对推断结果数据84覆盖正确的区域标签所得到的覆盖图像数据(未图示),服务器10(控制部11)将生成的差分图像数据83和覆盖图像数据的数据发送到计算机20。
另外,在第一实施方式中,机器学习、推断处理以及机器学习(再学习)的处理中的步骤S5~步骤S10以及步骤S12的处理由用户实施,但本发明并不限于此。可以是步骤S5~步骤S10以及步骤S12的处理中的全部处理由服务器10(控制部11)执行,也可以是,步骤S5~步骤S10以及步骤S12的处理中的任一处理由用户实施,其余由服务器10(控制部11)执行。
[方式]
本领域技术人员应该理解的是,上述的例示性的实施方式是以下方式的具体例。
(项目1)
一种已学习模型生成方法,是基于机器学习的已学习模型的生成方法,所述已学习模型用于进行细胞图像的分割处理,所述已学习模型生成方法包括以下步骤:
基于包括第一输入图像数据以及与第一输入图像数据对应的第一训练图像数据的学习数据,来生成已学习模型,所述第一训练图像数据至少被标记了表示检测对象的第一标签和表示背景的第二标签;
通过所生成的已学习模型,使用包括第二输入图像数据的推断处理用数据来执行推断处理;
判定在通过推断处理输出的推断结果数据中被估计为是检测对象或背景的区域是否为误估计;
在被判定为所估计的区域是误估计的区域中,确定不适用于第一标签和第二标签的噪声区域;
决定包含于第一训练图像数据中的噪声区域;
还对在第一训练图像数据中被决定为噪声区域的区域标记表示噪声区域的第三标签,并且更新第一训练图像数据;以及
基于包括第一输入图像数据和更新后的第一训练图像数据的更新后的学习数据,来重新生成已学习模型。
(项目2)
在项目1所记载的已学习模型生成方法中,在执行推断处理的步骤之后且判定是否为误估计的步骤之前,还包括以下步骤:生成示出第二训练图像数据与同第二训练图像数据对应的推断结果数据的差分的差分图像数据,来作为用于提取推断结果数据中的误估计的区域的图像数据,所述第二训练图像数据是包含于推断处理用数据中的、至少被标记了第一标签和第二标签的图像数据。
(项目3)
在项目2所记载的已学习模型生成方法中,
在生成差分图像数据的步骤中,生成以能够识别第一区域、第二区域以及第三区域的方式显示第一区域、第二区域以及第三区域的差分图像数据,第一区域是在第二训练图像数据与推断结果数据的对应的区域中均被标记了第一标签的区域,第二区域是在第二训练图像数据中被标记了第二标签且在推断结果数据中被标记了第一标签的区域,第三区域是在第二训练图像数据中被标记了第一标签且在推断结果数据中被标记了第二标签的区域。
(项目4)
在项目1~3中的任一项所记载的已学习模型生成方法中,噪声区域是误估计的区域的一部分。
(项目5)
在项目1~4中的任一项所记载的已学习模型生成方法中,在重新生成已学习模型的步骤中,基于除了更新后的学习数据以外还被追加了包括第一输入图像数据和被标记了第三标签的第一训练图像数据的学习数据的、更新后的学习数据,来重新生成已学习模型。
(项目6)
在项目1~5中的任一项所记载的已学习模型生成方法中,在执行推断处理的步骤之后且判定是否为误估计的步骤之前,还包括以下步骤:在显示部显示推断结果数据中的误估计的区域。
(项目7)
在项目6所记载的已学习模型生成方法中,在显示部显示误估计的区域的步骤中,在显示部显示满足预先设定的与深宽比、专有面积及形状的复杂度中的至少任一方有关的条件的误估计的区域。
(项目8)
在项目1~7中的任一项所记载的已学习模型生成方法中,在判定是否为误估计的步骤中,判定在推断结果数据中被估计为是检测对象中包括的出现频率为规定的阈值以下的低出现检测对象的区域是否为误估计。
(项目9)
在项目8所记载的已学习模型生成方法中,低出现检测对象是异常细胞。
(项目10)
在项目9所记载的已学习模型生成方法中,还包括以下步骤:
在生成已学习模型之前,获取学习数据中包括的检测对象的出现频率;以及
在基于获取到的检测对象的出现频率而在检测对象中包括低出现检测对象的情况下,对用户通知包括低出现检测对象这一情况。
(项目11)
在项目10所记载的已学习模型生成方法中,在生成已学习模型的步骤中,基于被追加了包括低出现检测对象的学习数据的学习数据,来生成已学习模型。
(项目12)
一种已学习模型生成系统,是基于机器学习的已学习模型的生成系统,所述已学习模型用于进行细胞图像的分割处理,所述已学习模型生成系统具备:
存储部,其存储包括第一输入图像数据和与第一输入图像数据对应的第一训练图像数据的学习数据、以及至少包括第二输入图像数据的推断处理用数据,所述第一训练图像数据至少被标记了表示检测对象的第一标签和表示背景的第二标签;
已学习模型生成部,其基于存储部获取到的学习数据来生成已学习模型;以及
推断处理执行部,其通过所生成的已学习模型,使用存储部存储的推断处理用数据来执行推断处理,
其中,存储部构成为:还存储包括第一输入图像数据和更新后的第一训练图像数据的更新后的学习数据,所述更新后的第一训练图像数据是通过还对包含于第一训练图像数据中的噪声区域标记表示噪声区域的第三标签所得到的,噪声区域与在由推断处理执行部输出的推断结果数据中被误估计为是检测对象的区域中的、不适用于第一标签和第二标签的噪声区域相当,已学习模型生成部构成为:基于存储部存储的更新后的学习数据,来重新生成已学习模型。
附图标记说明
111a:已学习模型生成部;11b:推断处理执行部;12:存储部;50:已学习模型;55:重新生成已学习模型;60:噪声区域;61:第一标签;62:第二标签;63:第三标签;66:第一区域;67:第二区域;68:第三区域;83:差分图像数据;84:推断结果数据;86:学习数据;86a:第一输入图像数据;86b:第一训练图像数据;87:推断处理用数据;87a:第二输入图像数据;87b:第二训练图像数据;88:更新学习数据;88a:更新第一训练图像数据;100:已学习模型生成系统。

Claims (12)

1.一种已学习模型生成方法,是基于机器学习的已学习模型的生成方法,所述已学习模型用于进行细胞图像的分割处理,所述已学习模型生成方法包括以下步骤:
基于包括第一输入图像数据以及与所述第一输入图像数据对应的第一训练图像数据的学习数据,来生成已学习模型,所述第一训练图像数据至少被标记了表示检测对象的第一标签和表示背景的第二标签;
通过所生成的所述已学习模型,使用包括第二输入图像数据的推断处理用数据来执行推断处理;
判定在通过所述推断处理输出的推断结果数据中被估计为是所述检测对象或所述背景的区域是否为误估计;
在被判定为所估计出的所述区域是误估计的区域中,确定不适用于所述第一标签和所述第二标签的噪声区域;
决定包含于所述第一训练图像数据中的所述噪声区域;
还对在所述第一训练图像数据中被决定为所述噪声区域的区域标记表示所述噪声区域的第三标签,并且更新所述第一训练图像数据;以及
基于包括所述第一输入图像数据和更新后的所述第一训练图像数据的更新后的所述学习数据,来重新生成所述已学习模型。
2.根据权利要求1所述的已学习模型生成方法,其中,
在执行所述推断处理的步骤之后且判定是否为所述误估计的步骤之前,还包括以下步骤:生成示出第二训练图像数据与同所述第二训练图像数据对应的所述推断结果数据的差分的差分图像数据,来作为用于提取所述推断结果数据中的所述误估计的区域的图像数据,所述第二训练图像数据是包含于所述推断处理用数据中的、至少被标记了所述第一标签和所述第二标签的图像数据。
3.根据权利要求2所述的已学习模型生成方法,其中,
在生成所述差分图像数据的步骤中,生成以能够识别第一区域、第二区域以及第三区域的方式显示所述第一区域、所述第二区域以及所述第三区域的所述差分图像数据,所述第一区域是在所述第二训练图像数据与所述推断结果数据的对应的区域中均被标记了所述第一标签的区域,所述第二区域是在所述第二训练图像数据中被标记了所述第二标签且在所述推断结果数据中被标记了所述第一标签的区域,所述第三区域是在所述第二训练图像数据中被标记了所述第一标签且在所述推断结果数据中被标记了所述第二标签的区域。
4.根据权利要求1所述的已学习模型生成方法,其中,
所述噪声区域是所述误估计的区域的一部分。
5.根据权利要求1所述的已学习模型生成方法,其中,
在重新生成所述已学习模型的步骤中,基于除了更新后的所述学习数据以外还被追加了包括所述第一输入图像数据和被标记了所述第三标签的所述第一训练图像数据的学习数据的、更新后的所述学习数据,来重新生成所述已学习模型。
6.根据权利要求1所述的已学习模型生成方法,其中,
在执行所述推断处理的步骤之后且判定是否为所述误估计的步骤之前,还包括以下步骤:在显示部显示所述推断结果数据中的所述误估计的区域。
7.根据权利要求6所述的已学习模型生成方法,其中,
在所述显示部显示所述误估计的区域的步骤中,在所述显示部显示满足预先设定的与深宽比、专有面积及形状的复杂度中的至少任一方有关的条件的所述误估计的区域。
8.根据权利要求1所述的已学习模型生成方法,其中,
在判定是否为所述误估计的步骤中,判定在所述推断结果数据中被估计为是所述检测对象中包括的出现频率为规定的阈值以下的低出现检测对象的区域是否为误估计。
9.根据权利要求8所述的已学习模型生成方法,其中,
所述低出现检测对象是异常细胞。
10.根据权利要求9所述的已学习模型生成方法,还包括以下步骤:
在生成所述已学习模型的步骤之前,获取所述学习数据中包括的所述检测对象的出现频率;以及
在基于获取到的所述检测对象的出现频率而在所述检测对象中包括所述低出现检测对象的情况下,对用户通知包括所述低出现检测对象这一情况。
11.根据权利要求10所述的已学习模型生成方法,其中,
在生成所述已学习模型的步骤中,基于被追加了包括所述低出现检测对象的所述学习数据的所述学习数据,来生成已学习模型。
12.一种已学习模型生成系统,是基于机器学习的已学习模型的生成系统,所述已学习模型用于进行细胞图像的分割处理,所述已学习模型生成系统具备:
存储部,其存储包括第一输入图像数据和与所述第一输入图像数据对应的第一训练图像数据的学习数据、以及至少包括第二输入图像数据的推断处理用数据,所述第一训练图像数据至少被标记了表示检测对象的第一标签和表示背景的第二标签;
已学习模型生成部,其基于所述存储部获取到的所述学习数据来生成已学习模型;以及
推断处理执行部,其通过所生成的所述已学习模型,使用所述存储部存储的所述推断处理用数据来执行推断处理,
其中,所述存储部构成为:还存储包括所述第一输入图像数据和更新后的所述第一训练图像数据的更新后的所述学习数据,所述更新后的所述第一训练图像数据是通过还对包含于所述第一训练图像数据中的噪声区域标记表示所述噪声区域的第三标签所得到的,所述噪声区域与在由所述推断处理执行部输出的推断结果数据中被误估计为是检测对象的区域中的、不适用于所述第一标签和所述第二标签的噪声区域相当,
所述已学习模型生成部构成为:基于所述存储部存储的更新后的所述学习数据,来重新生成所述已学习模型。
CN202280049043.1A 2021-05-11 2022-01-31 已学习模型生成方法和已学习模型生成系统 Pending CN117651969A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021080479 2021-05-11
JP2021-080479 2021-05-11
PCT/JP2022/003699 WO2022239316A1 (ja) 2021-05-11 2022-01-31 学習済みモデル作成方法および学習済みモデル作成システム

Publications (1)

Publication Number Publication Date
CN117651969A true CN117651969A (zh) 2024-03-05

Family

ID=84029019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280049043.1A Pending CN117651969A (zh) 2021-05-11 2022-01-31 已学习模型生成方法和已学习模型生成系统

Country Status (3)

Country Link
JP (1) JPWO2022239316A1 (zh)
CN (1) CN117651969A (zh)
WO (1) WO2022239316A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7299002B2 (ja) * 2018-08-23 2023-06-27 ファナック株式会社 判別装置及び機械学習方法
WO2021059572A1 (ja) * 2019-09-27 2021-04-01 富士フイルム株式会社 情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム

Also Published As

Publication number Publication date
WO2022239316A1 (ja) 2022-11-17
JPWO2022239316A1 (zh) 2022-11-17

Similar Documents

Publication Publication Date Title
US10997711B2 (en) Appearance inspection device
CN110852983B (zh) 用于检测半导体装置中的缺陷的方法
KR102073873B1 (ko) 시맨틱 세그먼테이션 방법 및 그 장치
CN110264444B (zh) 基于弱分割的损伤检测方法及装置
JP6985856B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
WO2019087803A1 (ja) 画像処理装置、画像処理方法及び記録媒体
CN110969200B (zh) 基于一致性负样本的图像目标检测模型训练方法及装置
JP7106391B2 (ja) 画像判定方法、画像判定装置および画像判定プログラム
WO2020039882A1 (ja) 判別装置及び機械学習方法
KR102297232B1 (ko) 형태학적 영상처리를 활용한 이상 탐지 방법
KR102204956B1 (ko) 시맨틱 세그먼테이션 방법 및 그 장치
US11386538B2 (en) Image processing apparatus, image processing method, and storage medium
WO2021095509A1 (ja) 推定システム、推定装置および推定方法
US20210056675A1 (en) Image generation device, image generation method, and image generation program
CN117651969A (zh) 已学习模型生成方法和已学习模型生成系统
CN113537407B (zh) 基于机器学习的图像数据评价处理方法及装置
JP2022088341A (ja) 機器学習装置及び方法
CN113673589A (zh) 基于边框距离度量的标签选择自适应增量检测方法及系统
JP2018018197A (ja) ソースコード評価プログラム
EP4383209A1 (en) Image processing apparatus, learning method of feature extractor, updating method of identifier, and image processing method
CN112686277A (zh) 模型训练的方法和装置
JP2019021037A (ja) ソースコード評価装置、ソースコード評価方法及びソースコード評価プログラム
US20240221370A1 (en) Computer-implemented method and system for ascertaining a misclassification value during the classification of images into at least one image category by a classification algorithm
US20240144661A1 (en) Support device and method
US20240185064A1 (en) Learning apparatus, method, non-transitory computer readable medium and inference apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination