CN112771510A - 信息处理设备、信息处理方法和程序 - Google Patents
信息处理设备、信息处理方法和程序 Download PDFInfo
- Publication number
- CN112771510A CN112771510A CN201980063820.6A CN201980063820A CN112771510A CN 112771510 A CN112771510 A CN 112771510A CN 201980063820 A CN201980063820 A CN 201980063820A CN 112771510 A CN112771510 A CN 112771510A
- Authority
- CN
- China
- Prior art keywords
- cluster
- information processing
- processing apparatus
- clustering
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 141
- 238000003672 processing method Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000011156 evaluation Methods 0.000 claims description 117
- 238000005259 measurement Methods 0.000 claims description 53
- 238000000926 separation method Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 8
- 230000005284 excitation Effects 0.000 claims description 4
- 210000004027 cell Anatomy 0.000 description 50
- 239000000126 substance Substances 0.000 description 25
- 238000010586 diagram Methods 0.000 description 17
- 238000009826 distribution Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 230000010354 integration Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 8
- 238000002189 fluorescence spectrum Methods 0.000 description 7
- 238000010835 comparative analysis Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000001575 pathological effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 210000003855 cell nucleus Anatomy 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001151 other effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100367084 Caenorhabditis elegans such-1 gene Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1429—Signal processing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1456—Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
- G01N15/1459—Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals the analysis being performed on a sample stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N2015/1006—Investigating individual particles for cytology
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N2015/1477—Multiparameters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Chemical & Material Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Dispersion Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供一种信息处理设备、至少一种非瞬时性计算机可读存储介质以及一种方法,其在考虑待聚类的多维数据的特征的情况下评估聚类结果的适当性。一种信息处理设备,包括:至少一个硬件处理器;以及至少一个存储处理器可执行指令的非瞬时性计算机可读存储介质,当所述指令由所述至少一个硬件处理器执行时,使得所述至少一个硬件处理器执行:接收从多个细胞获得的多维数据;对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及输出表示聚类结果的可靠性的信息,其中该信息指示所述第一聚类和所述二聚类之间的关系。
Description
相关申请的交叉引用
本申请要求2018年11月16日提交的日本优先权专利申请JP2018-215289的权益,其全部内容通过引用结合于此。
技术领域
本公开涉及信息处理设备、信息处理方法和程序。
背景技术
在医学、生物化学等领域,通常使用流式细胞仪来快速分析大量细胞的特征。流式细胞仪是一种通过用光束照射流经流通池的细胞并检测从细胞发出的荧光、散射光等来光学分析细胞特性的装置。
这里,由流式细胞仪测量的数据是包括多种颜色的荧光强度信息的多维数据。从多个角度评估这种多维数据很重要,但是随着维度数量的增加,很难人工分析数据。
因此,已经考虑了通过聚类技术对流式细胞仪测量的多维数据进行分析。聚类技术是一种利用机器学习将目标集合划分为子集合的技术,在子集合内实现内部连接和外部分离。通过使用聚类技术,可以将由流式细胞仪分析的大量细胞分成多个细胞组。
例如,下面的PTL 1公开了用于对由流式细胞仪测量的数据进行聚类的聚类技术的示例。
引用列表
专利文献
PTL 1:美国专利申请公开No.2013/0060775
发明内容
技术问题
在通过聚类技术分析使用流式细胞仪的测量结果的情况下,重要的是考虑由流式细胞仪测量的多维数据的特征。另一方面,由于聚类技术是无监督学习方法,因此难以评估所获得的聚类结果的适当性等。因此,难以评估所获得的聚类结果是否适合由流式细胞仪测量的多维数据的特征。
因此,需要一种能够考虑待聚类的多维数据的特征来评估聚类结果的适当性的技术。
问题的解决方案
根据本公开,提供了一种信息处理设备,包括:至少一个硬件处理器;以及至少一个存储处理器可执行指令的非瞬时性计算机可读存储介质,当所述指令由所述至少一个硬件处理器执行时,使得所述至少一个硬件处理器执行:接收从多个细胞获得的多维数据;对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
此外,根据本公开,提供了至少一种存储处理器可执行指令的非易失性计算机可读存储介质,当所述指令由至少一个硬件处理器执行时,使得所述至少一个硬件处理器执行:接收从多个细胞获得的多维数据;对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
此外,根据本公开,提供了一种方法,包括:接收从多个细胞获得的多维数据;对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
根据本公开,通过将多级聚类中的各个聚类的评估值彼此进行比较,可以在聚类适当性低的情况下确定前元聚类和后元聚类之间是否存在关系。
本发明的有益效果
如上所述,根据本公开,可以在考虑到待聚类的多维数据的特征的情况下,评估聚类结果的适当性。
请注意,上述效果不一定受到限制,并且,与上述效果一起或代替上述效果,可以发挥本说明书中示出的任何效果,或者可以从本说明书中解读的其他效果。
附图说明
图1是示意性示出包括根据本公开实施例的信息处理设备的系统的配置示例的示意图。
图2是图示根据实施例的信息处理设备的配置示例的框图。
图3A是示出表示信息处理设备的聚类结果的图像显示的示例的说明图。
图3B是示出表示信息处理设备的聚类结果的图像显示的示例的说明图。
图3C是示出表示信息处理设备的聚类结果的图像显示的示例的说明图。
图4是曲线图,其中针对每个后元聚类绘制了前元聚类和后元聚类的评估值。
图5是示出一种模式的说明图,在该模式中,从其中针对每个后元聚类绘制前元聚类和后元聚类的评估值的图表中额外显示所选聚类的每个维度的测量数据。
图6A是示出图像显示的示例的说明图,其中指定被确定为具有预定关系的第一聚类和第二聚类的指示叠加在图3A所示的图像显示上。
图6B是示出图像显示的示例的说明图,其中指定被确定为具有预定关系的第一聚类和第二聚类的指示叠加在图3B所示的图像显示上。
图6C是示出图像显示的示例的说明图,其中指定被确定为具有预定关系的第一聚类和第二聚类的指示叠加在图3C所示的图像显示上。
图7是示出根据实施例的信息处理设备的操作示例的流程图。
图8是示意性示出根据实施例的变型例的信息处理设备的配置示例的框图。
图9是示出根据实施例的变型例的信息处理设备的操作示例的流程图。
图10是将根据实施例的信息处理设备应用于病理图像分析的情况下的流程图。
图11是示出应用根据实施例的信息处理设备的分析流程的流程图。
图12是将根据实施例的信息处理设备应用于多个样本之间的比较分析的情况下的流程图。
图13是图示根据实施例的信息处理设备的硬件配置示例的框图。
具体实施方式
在下文中,将参照附图详细描述本公开的优选实施例。请注意,在本说明书和附图中,具有基本相同功能配置的组件将指定相同的附图标记,并且将省略多余的描述。
请注意,将按以下顺序进行描述。
1.整个系统的配置示例
2.信息处理设备的配置示例
3.信息处理设备的操作示例
4.变型例
5.应用示例
6.硬件配置示例
<1.整个系统的配置示例>
首先,参照图1,将描述包括根据本公开实施例的信息处理设备的系统100的配置。图1是示意性示出包括根据本实施例的信息处理设备的系统100的配置示例的示意图。
如图1所示,根据本实施例的系统100包括测量设备10、信息处理设备20以及终端装置30和40。测量设备10、信息处理设备20以及终端装置30和40经由网络N连接,以便能够彼此通信。网络N可以是例如移动通信网络或信息通信网络,例如互联网或局域网,或者可以是多种这些网络的组合。
测量设备10是能够检测来自待测量的细胞等的每种颜色的荧光的测量设备。测量设备10可以是例如流式细胞仪,其允许荧光染色的细胞高速流过流通池流通池,并用光照射流通池以检测来自细胞的每种颜色光的荧光。可选地,测量设备可以是荧光显微镜、共聚焦激光显微镜等,其观察染色细胞的荧光以检测来自细胞的每种颜色光的荧光。
信息处理设备20基于与由测量设备10测量的细胞的荧光有关的信息来对每个待测量的细胞进行聚类。由此,信息处理设备20可以将由测量设备10测量的每个细胞分成多个组(即,聚类)。此外,信息处理设备20可以评估对每个细胞进行聚类的结果的适当性。由此,信息处理设备20可以向终端装置30和40中的每一个发送信息,该信息指定其聚类结果被确定为不适当的聚类。信息处理设备20例如可以是能够高速处理大量数据的服务器等。
终端装置30和40中的每一个例如是显示设备等,将信息处理设备20的聚类结果输出到该显示设备等。例如,每个终端装置30和40可以是配备有显示单元的计算机、膝上型电脑、智能手机、平板终端等,该显示单元将从信息处理设备20接收的分析结果显示为图像、字符等。
在包括根据本实施例的信息处理设备20的系统100中,首先,信息处理设备20经由网络N获取由在医院、诊所或研究机构中的每一个中设置的测量设备10测量的测量数据。此后,信息处理设备20对获取的测量数据进行聚类,并将聚类结果输出到每个终端装置30和40。此外,在聚类结果中存在确定为适当性低的聚类的情况下,信息处理设备20可以向每个终端装置30和40输出指定该聚类的信息。在具有高信息处理负载的聚类的情况下,通过由专用服务器等配置的信息处理设备20集中执行聚类,可以提高整个系统100的效率。
下面将详细描述由信息处理设备20进行聚类的具体方法和用于从聚类结果中指定被确定为适当性低的聚类的方法。
请注意,尽管在上述中测量设备10、信息处理设备20以及终端装置30和40经由网络N相互连接,但是根据本公开的技术不限于这样的示例。例如,测量设备10、信息处理设备20以及终端装置30和40可以直接连接。
<2.信息处理设备的配置示例>
接下来,将参考图2描述根据本实施例的信息处理设备20的配置示例。图2是图示根据本实施例的信息处理设备20的配置示例的框图。
如图2所示,信息处理设备20包括输入单元201、荧光分离单元203、第一聚类单元205、第二聚类单元207、评估值计算器209、确定单元211和输出单元213。请注意,信息处理设备20的一些功能(例如,稍后描述的荧光分离单元203的功能)可以包括在测量设备10中。
输入单元201从测量设备10获取诸如细胞的样本的测量结果。具体地,输入单元201从测量设备10获取关于从诸如细胞的样本测量的荧光光谱或每个波段的荧光强度的信息。输入单元201可以由例如外部输入接口来配置,该外部接口为用于经由网络N从测量设备10获取信息的连接端口或者包括通信设备等。
荧光分离单元203从测量设备10获取的关于荧光光谱或每个波段的荧光强度的信息中分离每种荧光,以导出对应于每种荧光的荧光物质、生物分子等的表达水平。用多种荧光物质标记待测细胞等,并且从每种荧光物质发射的荧光的波长分布彼此重叠。因此,荧光分离单元203可以通过校正从每种荧光物质等发射的荧光的相互泄漏来导出每种荧光物质的表达水平和用每种荧光物质标记的生物分子等的表达水平。
因此,荧光分离单元203可以校正每种荧光的相互泄漏,并导出荧光物质的净表达水平,从而使得后一阶段的第一聚类单元205能够以高精度执行聚类。这里,以高精度进行聚类是为了能够将标记有每种荧光物质的大量样本分成多个最佳样本组。此外,荧光分离单元203从关于每个波段的荧光光谱或荧光强度的信息中导出发射每种荧光的荧光物质的表达水平,因此可以减少在后一阶段的第一聚类单元205中聚类时要使用的数据的维数。
具体地,在测量结果是针对每个特定波段通过划分而检测到的荧光强度的情况下,荧光分离单元203首先计算每个波段之间的荧光泄漏量。接下来,荧光分离单元203从每个波段的荧光强度中减去计算出的荧光泄漏量,从而可以导出发出荧光的荧光物质的表达水平。因此,荧光分离单元203使得后一阶段的第一聚类单元205能够以高精度执行聚类。
此外,在测量结果是通过检测器阵列检测经过棱镜光谱分离的荧光获得的荧光光谱的情况下,荧光分离单元203首先获取每个待检测荧光物质的荧光的参考光谱。接下来,荧光分离单元203根据检测到的荧光光谱来估计每种荧光物质的荧光参考光谱的叠加,从而可以导出每种荧光物质的表达水平。因此,由于荧光分离单元203可以从由光谱表示的测量结果中导出每种荧光物质的表达水平,从而减少测量数据的维数。
第一聚类单元205基于测量数据对待测量的细胞进行聚类。具体地,第一聚类单元205基于由荧光分离单元203导出的细胞的每种荧光物质的表达水平来对待测量的细胞进行聚类。由此,第一聚类单元205将待测的一组细胞分成每个第一聚类。
将待测细胞用多种荧光物质标记,并且多种荧光物质的表达水平(即,用荧光物质标记的生物分子的表达水平)因细胞而异。因此,在划分待测细胞的情况下,使用多种荧光物质的表达水平的多维数据。通过使用基于机器学习的聚类技术,使用多维数据的这种划分可以比手动划分执行得更快。
第一聚类单元205中使用的聚类方法没有特别限制,但是可以是已知的聚类方法。例如,第一聚类单元205可以使用通用聚类方法,例如沃德方法、组平均方法、单链接方法或k-均值方法,或者可以使用自组织映射方法。
第二聚类单元207进一步对第一聚类单元205的聚类结果进行聚类。具体地,第二聚类单元207对作为第一聚类单元205的聚类结果而生成的第一聚类进行整合或划分,以生成第二聚类。
例如,第二聚类单元207可以通过使用上述已知的聚类方法来整合第一聚类,以生成第二聚类。可选地,第二聚类单元207可以通过使用上述已知的聚类方法来划分第一聚类,以生成第二聚类。
这里,通过整合多个聚类而生成的上部聚类(upper cluster)被称为后元聚类(post-meta cluster)(也称为元聚类),并且包括在上部聚类中的多个下部聚类被称为前元聚类(pre-meta cluster)(也称为som聚类)。换言之,在第二聚类单元207整合第一聚类以生成第二聚类的情况下,第一聚类变成前元聚类,第二聚类变成后元聚类。此外,在第二聚类单元207划分第一聚类以生成第二聚类的情况下,第一聚类变成后元聚类,第二聚类变成前元聚类。
第一聚类单元205和第二聚类单元207的聚类结果可以从输出单元213输出到每个终端装置30、40等。例如,输出到每个终端装置30、40等的聚类结果可以显示为每个终端装置30、40等上的图像显示。
具体地,第一聚类单元205和第二聚类单元207的聚类结果可以显示在图3A到图3C中的每一个所示的图像显示中。图3A至3C是示出表示信息处理设备20的聚类结果的图像显示的示例的说明图。
例如,如图3A所示,第一聚类单元205和第二聚类单元207的聚类结果可以在树状显示中表示。
在图3A所示的显示中,样本“Data1”被聚类成“meta1”到“meta3”的后元聚类和“Som1”到“Som6”的前元聚类。此外,图3A清楚地示出了一种结构,其中“meta1”到“meta3”的后元聚类包括“Som1”到“Som6”的前元聚类。具体而言,“meta1”的后元聚类包括“Som2”和“Som5”的前元聚类,“meta2”的后元聚类包括“Som1”、“Som3”和“Som6”的前元聚类,“meta1”的后元聚类包括“Som4”的前元聚类。这样的树状显示可以清楚地说明前元聚类和后元聚类之间的层次关系。
例如,如图3B所示,第一聚类单元205和第二聚类单元207的聚类结果可以在网格显示中表示。
在图3B所示的显示中,用多种颜色绘制的雷达图排列成一个网格。这里,每个雷达图代表每个前元聚类,用每个颜色着色的区域代表每个后元聚类。此外,每个雷达图的分布表示对应于前元聚类中每种荧光物质的表达水平的代表性向量,并且每个雷达图的大小表示前元聚类的组的大小。例如,涂有相同颜色的雷达图(即前元聚类)(图3B中的相同阴影)包括在相同的后元聚类中。这种网格显示可以同时说明前元聚类和后元聚类之间的包含关系以及前元聚类的信息,例如代表性向量。
例如,如图3C所示,第一聚类单元205和第二聚类单元207的聚类结果可以在最小生成树状显示中表示。
在图3C所示的显示器中,用多种颜色绘制的雷达图排列成相互连接的树形。这里,每个雷达图代表每个前元聚类,用每个颜色着色的区域代表每个后元聚类。此外,每个雷达图的分布表示对应于前元聚类中每种荧光物质的表达水平的代表性向量,并且每个雷达图的大小表示前元聚类的组的大小。例如,涂有相同颜色的雷达图(即前元聚类)(图3C中的相同阴影)包括在相同的后元聚类中。
此外,在图3C所示的显示中,该显示上雷达图之间的距离对应于由雷达图表示的前元聚类之间的相似性。换言之,示出了彼此接近的雷达图的前元聚类彼此相似,并且彼此分离的雷达图的前元聚类彼此不相似。除了前元聚类和后元聚类之间的包含关系之外,这种最小生成树状显示可以同时说明前元聚类和后元聚类之间的相似关系。
评估值计算器209计算第一聚类和第二聚类中的每一个的评估值。聚类的评估值表示聚类的分离程度,并且是根据聚类数据的分布计算的值。具体而言,可以基于属于该聚类的元素(例如,检测事件)的离散度以及该聚类与另一个聚类之间的距离来计算聚类的评估值。更具体地,聚类的评估值可以基于属于聚类的元素与聚类中心之间的距离以及聚类中心与另一个聚类中心之间的距离来计算。例如,每个聚类的评估值可以是每个聚类的轮廓系数、DBindex、COP系数等。
请注意,上述距离表示每个元素的相似性。例如,可以基于每个元素的属性差异来设置距离,以便满足距离的公理。具体地,该距离可以是基于其属性表示每个元素的特征量向量之间的欧几里德距离、曼哈顿距离、闵可夫斯基距离、马哈拉诺比斯距离或余弦距离。
确定单元211确定第一聚类的评估值和第二聚类的评估值是否具有预定关系。具体地,确定单元211确定第一聚类的评估值和通过整合或划分第一聚类获得的第二聚类的评估值是否具有预定关系。预定关系是在第一聚类或第二聚类的聚类有效性低的情况下,在第一聚类和第二聚类的评估值之间出现的关系。通过确定这种预定关系的存在与否,确定单元211可以识别(specify)具有低聚类适当性的第一聚类或第二聚类。
这里,将参照图4描述上述预定关系的示例。图4是针对每个后元聚类绘制了前元聚类和后元聚类的评估值的图。请注意,在图4的纵轴上示出的评估值是例如上述的DBindex,表示数值越接近0,聚类的分离度越高,聚类的适当性越高。
如图4所示,确定单元211在后元聚类和包括在后元聚类中的前元聚类之间比较第一聚类和第二聚类的评估值。此时,如在后元聚类No.4中,在后元聚类的评估值小于(优于)至少一个或多个前元聚类的评估值的情况下,确定单元211可以确定前元聚类和后元聚类具有预定关系。在整合使得后元聚类的评估值优于前元聚类的评估值的情况下,确定单元211可以确定在整合之前或之后已经执行了不适当的聚类。
可选地,在后元聚类中包括的前元聚类的评估值的接近度(closesness)或离散度等于或高于阈值的情况下,确定单元211可以确定前元聚类和后元聚类具有预定关系。此外,基于前元聚类的评估值和后元聚类的评估值之间的差值的大小,确定单元211可以确定前元聚类和后元聚类是否具有预定关系。
请注意,预定关系可以是除上述关系之外的另一种关系。预定关系可以是在第一聚类和第二聚类中的聚类适当性低的情况下预先登记的关系。
此外,基于来自用户的输入,确定单元211可以确定第一聚类的评估值和第二聚类的评估值是否具有预定关系。具体地说,如图5所示,确定单元211可以向用户指示一个图,在该图中,为每个后元聚类绘制了前元聚类和后元聚类的评估值,以及聚类的每个维度的测量数据,使得用户可以选择具有预定关系的第一聚类和第二聚类。图5是示出另外显示从图中选择的聚类的每个维度的测量数据的方面的说明视图,在该图中为每个后元聚类绘制了前元聚类和后元聚类的评估值。
如图5所示,确定单元211可以向用户呈现一个图形,其中经由输出单元213为每个后元聚类绘制前元聚类和后元聚类的评估值。通过研究所呈现的图形,用户可以指定具有前元聚类的评估值和后元聚类的评估值之间的预定关系的聚类。
此外,在绘制了前元聚类和后元聚类的评估值的图中,可以针对所选聚类的每个维度另外显示测量数据。另外显示的测量数据例如可以是指示相对于每个维度的整个测量目标的分布的聚类的测量目标的分布的数据。因此,用户可以参考另外显示的测量数据,并确定前元聚类的测量目标的分布和后元聚类的测量目标的分布之间的相似性,从而确定前元聚类的聚类和后元聚类的聚类是否合适。
例如,在图5所示的情况下,在左下角图形中测量目标的分布在前元聚类和后元聚类之间有显著变化。在如上所述的情况下,其中测量对象在至少一个或多个维度上的分布在整合前后显著变化,前元聚类或后元聚类的聚类适当性可能较低。因此,通过调查聚类的每个维度的测量数据,用户可以确认聚类适当性低的聚类,其中第一聚类的评估值和第二聚类的评估值具有预定关系。
此外,确定单元211可以突出显示其中测量目标的分布在前元聚类和后元聚类之间已经显著改变的图,以便帮助用户识别具有低聚类适当性的聚类。具体地,确定单元211可以改变显示其中测量目标的分布在前元聚类和后元聚类之间已经显著改变的图形的区域的颜色,可以用框线包围该区域,或者可以添加示出警报的显示。请注意,其中测量目标的分布在前元聚类和后元聚类之间已经显著改变的图可以通过例如确定测量目标的分布中的每个峰宽、峰高或峰位置在整合前后是否已变化了阈值或更大来识别。
输出单元213向每个终端装置30、40等输出信息,该信息指定由确定单元211确定为具有预定关系的第一聚类和第二聚类。具体地,输出单元213可以向终端装置30和40中的每一个输出用于在指示第一聚类单元205和第二聚类单元207的聚类结果的图像显示上叠加指定由确定单元211确定的第一聚类和第二聚类的图像显示的信息。
更具体地,为了指定由确定单元211确定为具有预定关系的第一聚类和第二聚类,输出单元213可以将关于图6A至图6C中的每一个所示的图像显示的信息输出至每个终端装置30和40。通过显示图6A至图6C中的每一个所示的图像显示,终端装置30和40可以向用户清楚地指示被确定为具有预定关系的第一聚类和第二聚类。6A至6C是各自示出图像显示的示例的说明图,其中指定被确定为具有预定关系的第一聚类和第二聚类的显示叠加在图3A至3C所示的图像显示上。
例如,如图6A所示,在树状显示中显示聚类结果的情况下,输出单元213可以改变确定为具有预定关系的第一聚类和第二聚类中的每一个的显示颜色或显示字符。可选地,输出单元213可以在确定为具有预定关系的第一聚类和第二聚类的每一个上显示特定标记,例如感叹号。具体地,在“meta2”的后元聚类和“meta6”的前元聚类确定为具有预定关系的情况下,“meta2”的后元聚类用感叹号显示,并且突出显示“meta2”和“meta6”。因此,输出单元213可以通过向用户清楚地指示聚类适当性低并且具有预定关系的第一聚类和第二聚类来引起用户的请注意。
例如,如图6B所示,在聚类结果显示在网格显示中的情况下,输出单元213可以用框线包围对应于确定为具有预定关系的第一聚类和第二聚类的雷达图。具体地,在包括四个前元聚类的后元聚类和包括在后元聚类中的前元聚类确定为具有预定关系的情况下,将用表示后元聚类的颜色着色的区域用框线包围,并且将对应于前元聚类的雷达图突出显示。因此,输出单元213可以通过向用户清楚地指示聚类适当性低并且具有预定关系的第一聚类和第二聚类来引起用户的请注意。
例如,如图6C所示,在聚类结果显示在最小生成树状显示中的情况下,输出单元213可以用框线包围对应于确定为具有预定关系的第一聚类和第二聚类的雷达图。具体地,在包括四个前元聚类的后元聚类和包括在后元聚类中的前元聚类确定为具有预定关系的情况下,将用表示后元聚类的颜色着色的区域用框线包围,并且将对应于前元聚类的雷达图突出显示。因此,输出单元213可以通过向用户清楚地指示聚类适当性低并且具有预定关系的第一聚类和第二聚类来引起用户的注意。
根据上述配置,信息处理设备20可以通过第一聚类单元205和第二聚类单元207评估聚类的适当性,并且向用户呈现确定为适当性低的第一聚类和第二聚类。因此,用户可以确定用于聚类的待检查的聚类或者具有高聚类精度的聚类。因此,信息处理设备20可以提高分析测量目标的效率。
请注意,可以基于来自用户的输入,通过第二聚类单元207对第一聚类的划分或整合来执行第二聚类的生成。换言之,在信息处理设备20中,可以通过用户编辑由第一聚类单元205的聚类生成的第一聚类来生成第二聚类。此时,信息处理设备20可以通过与上述配置类似的配置来评估用户聚类的适当性。
<3.信息处理设备的操作示例>
接下来,参考图7,将描述根据本实施例的信息处理设备20的操作示例。图7是示出根据本实施例的信息处理设备20的操作示例的流程图。
如图7所示,首先,输入单元201从测量设备10获取测量数据(S101)。测量数据例如可以是关于由流式细胞仪测量的细胞荧光光谱或每个波段的荧光强度的信息。接下来,荧光分离单元203通过荧光分离测量数据,以得出发射每种荧光的荧光物质的表达水平(S103)。
随后,第一聚类单元205基于由荧光分离单元203通过荧光分离的每种荧光物质的表达水平对每个测量的细胞进行聚类,以生成第一聚类(S105)。接下来,第二聚类单元207通过聚类进一步整合或划分由第一聚类单元生成的第一聚类,以生成第二聚类(S107)。此后,评估值计算器209计算第一聚类和第二聚类的评估值(S109)。例如,评估值计算器209可以计算第一聚类和第二聚类中的每一个的轮廓系数、DBindex或COP系数。
接下来,确定单元211确定第一聚类的评估值和第二聚类的评估值是否具有预定关系(S111)。具体地,通过确定第一聚类的评估值和第二聚类的评估值是否具有预定关系,确定单元211指定聚类适当性低的第一聚类和第二聚类。在具有预定关系的第一聚类和第二聚类不存在的情况下(S111/否),输出单元213将第一聚类单元205和第二聚类单元207的聚类结果输出到每个终端装置30和40。由此,将聚类结果呈现给用户。输出单元213可以向用户呈现聚类结果。
另一方面,在存在具有预定关系的第一聚类和第二聚类的情况下(S111/是),输出单元213将第一聚类单元205和第二聚类单元207的聚类结果以及指定具有预定关系的第一聚类和第二聚类的信息(S113)输出到每个终端装置30和40。由此,输出单元213可以向用户呈现确定为聚类适当性低的第一聚类和第二聚类。
根据上述操作,根据本实施例的信息处理设备20可以向用户呈现聚类结果和关于聚类结果的可靠性的信息。具体地,信息处理设备20可以指定被确定为聚类适当性低的聚类,并将指定的聚类呈现给用户。
<4.变型例>
随后,将参考图8和图9描述根据本实施例的信息处理设备21的变型例。图8是示意性地示出根据本修改的信息处理设备21的配置示例的框图。图9是示出根据本变型例的信息处理设备21的操作示例的流程图。
如图8所示,根据本变型例的信息处理设备21与图2所示的信息处理设备20的不同之处在于,还包括聚类重新配置单元215。在下文中,将描述作为本变型例的特征的聚类重新配置单元215,并且省略与图2所示的信息处理设备20的配置基本相似的其他配置的说明。
聚类重新配置单元215基于聚类的评估值来重新配置包括前元聚类的后元聚类。具体地,聚类重新配置单元215参考聚类的评估值来重新考虑包括所指示的前元聚类的后元聚类。
例如,参考聚类结果并确定相对于后元聚类包含一些前元聚类不合适的用户指示聚类重新配置单元215重新配置包括前元聚类的后元聚类。此时,聚类重新配置单元215使得确定单元211在将用户指示的前元聚类整合到每个后元聚类的情况下,综合计算所有聚类的评估值。随后,聚类重新配置单元215指定由于所指示的前元聚类的整合而聚类的评估值为最佳的后元聚类。聚类重新配置单元215然后将所指示的前元聚类整合到后元聚类中。请注意,聚类的评估值最佳意味着,例如,在DBindex中,后元聚类的所有评估值之和最小。
因此,信息处理设备21可以支持用户编辑前元聚类和后元聚类的聚类,并且可以呈现更合适的聚类结果。请注意,用户对前元聚类的选择可以根据表示聚类结果和适当性的确定结果的图像显示来执行,如图3A到3C或图6A所示。用户对前元聚类的选择可以根据表示图的图像显示来执行,在该图中,绘制了前元聚类和后元聚类的评估值,如图4或图5所示。
接下来,参考图9,将描述根据本变型例的信息处理设备21的操作示例。图9是示出根据本变型例的信息处理设备21的操作示例的流程图。
如图9所示,首先,输入单元201从测量设备10获取测量数据(S101)。测量数据例如可以是关于由流式细胞仪测量的细胞荧光光谱或每个波段的荧光强度的信息。接下来,荧光分离单元203通过荧光分离测量数据,以得出发射每种荧光的荧光物质的表达水平(S103)。
随后,第一聚类单元205基于由荧光分离单元203通过荧光分离的每种荧光物质的表达水平对每个测量的细胞进行聚类,以生成第一聚类(S105)。接下来,第二聚类单元207通过聚类进一步整合由第一聚类单元205生成的第一聚类,以生成第二聚类(S121)。
此后,用户等选择用于重新配置第二聚类(包含)的第一聚类(S123)。随后,确定单元211在将所选择的第一聚类整合到每个第二聚类的情况下计算每个聚类的评估值(S125)。接下来,聚类重新配置单元215比较每个第二聚类的各个聚类的计算出的评估值的总和,并将选择的第一聚类整合到评估值的总和为最佳的第二聚类中(S127)。
根据上述操作,根据本变型例的信息处理设备21可以支持将用户选择的第一聚类整合成到更合适的第二聚类中。
<5.应用示例>
随后,将参考图10到12描述根据本实施例的信息处理设备20的应用示例。
首先,参考图10,将描述将根据本实施例的信息处理设备20应用于病理图像的分析的示例。图10是将根据本实施例的信息处理设备20应用于病理图像分析的情况下的流程图。
如图10所示,首先,信息处理设备20从显微镜、内窥镜等获取包括细胞的病理图像(S11)。接下来,信息处理设备20从病理图像中指定包括细胞的图像区域,并切出图像区域(S13)。具体地,如果病理图像是用细胞核染色的细胞的图像,则信息处理设备20可以通过执行边缘提取来识别染色的细胞核,并将识别的细胞核的周围像素视为细胞。可选地,信息处理设备20可以通过使用深度学习等从病理图像中识别细胞。
此后,信息处理设备20获取切出的图像区域的像素值作为指示细胞的特征量的多维数据(S15)。具体地,像素值可以是每个像素的RGB(红、绿和蓝)值的中值、平均值或模式值(mode value),或者可以是通过从每个像素的RGB值转换颜色空间的坐标而导出的HSV(色调、饱和度和色度)值。此外,作为细胞的特征量,信息处理设备20可以获取形态特征,例如面积、圆度、宽度、长度、宽度/长度比、轴向或径向的对称性或紧密度。此外,作为细胞的特征量,信息处理设备20可以获取诸如点、孔、边缘、峰、谷、脊、亮点或暗点的结构特征,或者可以获取所谓的哈利克特征或加博尔特征等。
由此,信息处理设备20可以获取由上述输入单元201获取的测量数据。后续操作示例如上所述,因此省略其描述。
接下来,将参考图11和12描述根据本实施例的信息处理设备20用于分析的示例。图11是示出应用根据本实施例的信息处理设备20的分析流程的流程图。图12是将根据本实施例的信息处理设备20应用于多个样本之间的比较分析的情况下的流程图。
如图11所示,在将根据本实施例的信息处理设备20应用于样本的分析流程的情况下,首先确认相对于测量样本,整个系统的可靠性没有问题(S201)。可以基于由评估值计算器209计算的评估值来评估可靠性。接下来,确认每个聚类的可靠性足够高(S203)。这里,在每个已经被聚类的聚类的可靠性不够高的情况下(S203/否),再次执行聚类的划分、整合或删除(S205),此后,确认每个聚类的可靠性足够高(S207)。具体地,可以基于后元聚类和前元聚类是否具有预定关系来评估聚类的划分、整合或删除的适当性。重复聚类的划分、整合或删除,直到每个聚类的可靠性变得足够高,此后,为其可靠性变得足够高的聚类设置界标节点(S209)。
界标节点例如是在诸如支架图的可视化方法中作为可视化起点的聚类,或者是在比较多个样本的情况下作为参考点的聚类。作为界标节点的聚类需要具有高可靠性。
在设置用作界标节点的聚类之后,使用支架图等来执行每个聚类的可视化确认(S211)。在不可能在可视化确认中获得期望结果的情况下,再次执行聚类的划分、整合或删除(S213)以及每个聚类的可靠性确认(S215),并且重新配置用作界标节点的聚类,以便能够获得期望结果。
在图11所示的分析流程中,根据本实施例的信息处理设备20可以应用于S203、S207、S209和S215的任何处理,用于确认每个聚类的可靠性。
此外,如图12所示,在将根据本实施例的信息处理设备20应用于多个样本之间的比较分析的情况下,首先,执行第一样本的聚类(S251)。接下来,评估在第一样本中聚类的每个聚类的可靠性(S253)。可以基于由评估值计算器209计算的评估值来评估可靠性。随后,确定每个聚类的可靠性是否等于或高于阈值(S255)。在每个聚类的可靠性低于阈值的情况下(S255/否),再次执行第一样本的聚类和每个聚类的可靠性评估。另一方面,在每个聚类的可靠性程度等于或高于阈值的情况下(S255/是),将可靠性等于或高于阈值的聚类设置为界标节点(S257)。
接下来,将第二样本单独聚类(S259)。这里,相对于在第一样本中设置的界标节点,使用机械模型映射在第二样本中聚类的每个聚类(S261)。由此,用户可以感知第一样本和第二样本的每个聚类的对应关系,并执行第一样本和第二样本之间的比较分析。
请注意,作为机械模型,例如,可以使用力导向图、KamadaKawai算法、Fruchterman-Reingold算法等。此外,作为动态模型的目标数据,可以使用每个界标节点的中值、平均值和模式值中的任何一个。
在如图12所示的多个样品之间的比较分析中,根据本实施例的信息处理设备20可以应用于评估每个聚类的可靠性的S253或S257的处理。
<6.硬件配置示例>
随后,将参考图13描述根据本实施例的信息处理设备20的硬件配置。图13是示出根据本实施例的信息处理设备20的硬件配置的示例的框图。
如图13所示,信息处理设备20包括中央处理单元(CPU)901、只读存储器(ROM)902、随机存取存储器(RAM)903、桥接器907、内部总线905、906、接口908、输入设备911、输出设备912、存储设备913、驱动器914、连接端口915和通信设备916。
CPU901用作算术处理单元和控制设备,并且根据存储在ROM902等中的各种程序控制信息处理设备20的整体操作。ROM902存储由CPU901使用的程序和计算参数,RAM903临时存储在CPU901的执行中使用的程序、在执行中适当改变的参数等。例如,CPU901可以执行荧光分离单元203、第一聚类单元205、第二聚类单元207、评估值计算器209和确定单元211的功能。
CPU901、ROM902和RAM903通过桥接器907、内部总线905、906等相互连接。此外,CPU901、ROM902和RAM903也通过接口908连接到输入设备911、输出设备912、存储设备913、驱动器914、连接端口915和通信设备916。
输入设备911包括输入信息的输入设备,例如触摸板、键盘、鼠标、按钮、麦克风、开关和控制杆。此外,输入设备911进一步包括输入控制电路等,用于基于输入信息生成输入信号并将该信号输出到CPU901。例如,输入设备911可以执行输入单元201的功能。
输出设备912包括例如显示设备,例如阴极射线管(CRT)显示设备、液晶显示设备和有机电致发光(EL)显示设备。此外,输出设备912可以包括音频输出设备,例如扬声器和耳机。例如,输出设备912可以执行输出单元213的功能。
存储设备913是用于存储信息处理设备20的数据的存储设备。存储设备913可以包括存储介质、将数据存储到存储介质中的存储设备、从存储介质读取数据的读取设备以及删除存储的数据的删除设备。
驱动器914是用于存储介质的读/写器,并且内置或外部附接到信息处理设备20。例如,驱动器914读取存储在安装在其中的可移动存储介质中的信息,例如磁盘、光盘、磁光盘或半导体存储器,并将读取的信息输出到随机存取存储器903。驱动器914还可以将信息写入可移动存储介质。
连接端口915例如是由连接端口配置的连接接口,用于连接外部连接的设备,例如通用串行总线(USB)端口、以太网(注册商标)端口、IEEE802.11标准端口和光学音频终端。
通信设备916例如是由通信设备等配置的用于连接到网络N的通信接口。此外,通信设备916可以是有线或无线LAN兼容的通信设备或者执行有线电缆通信的电缆通信设备。例如,通信设备916和连接端口915可以执行输入单元201和输出单元213的功能。
请注意,此外,可以创建计算机程序,用于使内置在信息处理设备20中的硬件,例如CPU、ROM和RAM,表现出与根据上述本实施例的信息处理设备的每个配置的功能等同的功能。此外,可以提供存储计算机程序的存储介质。
上述实施例可以使用硬件、软件或其组合来实现。当以软件实现时,软件代码可以在任何合适的处理器(例如,微处理器)或处理器集合上执行,无论是设置在单个计算设备中还是分布在多个计算设备中。应当理解,可以一般地被认为执行上述功能的任何组件或组件的集合是控制上述功能的一个或多个控制器。一个或多个控制器可以以多种方式实现,例如用专用硬件,或者用通用硬件(例如,一个或多个处理器),其使用微码或软件编程以执行上述功能。
在这方面,应当理解,这里描述的实施例的一个实现包括至少一个由计算机程序(例如,多个可执行指令)编码的计算机可读存储介质(例如,RAM、ROM、EEPROM、闪存或其他存储技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储器、盒式磁带、磁带、磁盘存储器或其他磁存储设备、或其他有形的、非易失性的计算机可读存储介质),当在一个或多个处理器上执行该程序时,执行一个或多个实施例的上述功能。计算机可读介质可以是便携式的,使得存储在其上的程序可以加载到任何计算设备上,以实现这里讨论的技术的各方面。此外,应当理解,对当被执行时执行任何上述功能的计算机程序的引用不限于在主机上运行的应用程序。相反,术语“计算机程序”和“软件”在此以一般意义使用,指任何类型的计算机代码(例如,应用软件、固件、微码或任何其他形式的计算机指令),其可用于对一个或多个处理器进行编程,以实现这里讨论的技术的各方面。
已经参照附图详细描述了本公开的优选实施例,但是本公开的技术范围不限于这些示例。显然,本领域技术人员可以在权利要求中描述的技术思想的范围内设想各种变型例或变更。应当理解,这些也自然落入本公开的技术范围内。
此外,本说明书中描述的效果仅仅是说明性的或示例性的,而不是限制性的。也就是说,除了上述效果之外或代替上述效果,根据本公开的技术可以表现出根据本说明书的描述对本领域技术人员而言显而易见的其他效果。
请注意,以下配置也在本公开的技术范围内。
(1)一种信息处理设备,包括:评估值计算器,其被配置为计算作为通过聚类多维数据获得的聚类结果的每个第一聚类的评估值,以及作为通过进一步聚类所述第一聚类获得的聚类结果的每个第二聚类的评估值;确定单元,其被配置为确定所述第一聚类的评估值和通过聚类所述第一聚类获得的所述第二聚类的评估值是否具有预定关系;以及输出单元,其被配置为输出指定被确定为具有所述预定关系的所述第一聚类和所述第二聚类的信息。
(2)根据上述(1)的信息处理设备,其中所述评估值是关于每个聚类的分离度的指标。
(3)根据上述(2)的信息处理设备,其中所述评估值计算器基于聚类之间的距离以及聚类中的每个事件和聚类中心之间的距离来计算所述评估值。
(4)根据上述(3)的信息处理设备,其中基于所述多维数据的每个元素的属性差来设置所述距离。
(5)根据上述(1)至(4)中任一项所述的信息处理设备,其中,所述第二聚类是通过整合所述第一聚类而获得的聚类。
(6)根据上述(5)的信息处理设备,其中,所述确定单元确定所述第一聚类的评估值和通过对所述第一聚类进行整合而获得的所述第二聚类的评估值是否具有所述预定关系。
(7)根据上述(6)所述的信息处理设备,其中,在整合后的所述第二聚类的评估值优于整合前的所述第一聚类中的至少一个或多个的评估值的情况下,所述确定单元确定所述第一聚类和所述第二聚类具有所述预定关系。
(8)根据上述(5)至(7)中任一项所述的信息处理设备,进一步包括聚类重新配置单元,其被配置为重新配置所选择的所述第一聚类被整合到其中的所述第二聚类,其中在所选择的所述第一聚类被整合到多个第二聚类的每一个的情况下,所述评估值计算器计算所述第二聚类的评估值,并且所述聚类重新配置单元基于所计算的评估值来重新配置所选择的所述第一聚类被整合到其中的所述第二聚类。
(9)根据上述(1)至(4)中任一项所述的信息处理设备,其中,所述第二聚类是通过划分所述第一聚类获得的聚类。
(10)根据上述(9)的信息处理设备,其中,在划分之前的所述第一聚类的评估值优于划分之后的所述第二聚类中的至少一个或多个的评估值的情况下,所述确定单元确定所述第一聚类和所述第二聚类具有所述预定关系。
(11)根据上述(1)至(10)中任一项所述的信息处理设备,进一步包括:第一聚类单元,其被配置为通过对所述多维数据进行聚类来得出所述第一聚类;以及第二聚类单元,其被配置为通过对所述第一聚类进行聚类来得出所述第二聚类。
(12)根据上述(11)的信息处理设备,其中所述第二聚类单元基于来自用户的输入对所述第一聚类进行聚类。
(13)根据上述(1)至(12)中任一项所述的信息处理设备,其中所述多维数据是通过将从细胞感测的光分离成多个荧光而获得的数据。
(14)一种信息处理方法,包括:通过计算器计算作为通过聚类多维数据获得的聚类结果的每个第一聚类的评估值,以及作为通过进一步聚类所述第一聚类获得的聚类结果的每个第二聚类的评估值;确定所述第一聚类的评估值和通过聚类所述第一聚类获得的所述第二聚类的评估值是否具有预定关系;以及输出指定被确定为具有所述预定关系的所述第一聚类和所述第二聚类的信息。
(15)一种程序,其使得计算机用作评估值计算器,所述评估值计算器被配置为计算作为通过对多维数据进行聚类而获得的聚类结果的每个第一聚类的评估值,以及作为通过进一步对所述第一聚类进行聚类而获得的聚类结果的每个第二聚类的评估值;确定单元,所述确定单元被配置为确定所述第一聚类的评估值和通过聚类所述第一聚类获得的所述第二聚类的评估值是否具有预定关系;以及输出单元,所述输出单元被配置为输出指定被确定为具有所述预定关系的所述第一聚类和所述第二聚类的信息。
(16)一种信息处理设备,包括:至少一个硬件处理器;以及至少一个存储处理器可执行指令的非瞬时性计算机可读存储介质,当所述指令由所述至少一个硬件处理器执行时,使得所述至少一个硬件处理器执行:接收从多个细胞获得的多维数据;对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
(17)根据上述(16)所述的信息处理设备,其中,表示所述聚类结果的可靠性的信息是通过确定所述第一聚类的第一评估值和所述第二聚类的第二评估值而获得的,并且所述信息指示所述第一评估值和所述第二评估值之间的关系。
(18)根据上述(17)所述的信息处理设备,其中,所述第一评估值是与所述第一聚类与所述多个聚类中的至少一些聚类的分离度相关联的指标。
(19)根据上述(17)或(18)所述的信息处理设备,其中所述第一聚类对应于所述多维数据中的一组检测事件,并且确定所述第一评估值进一步包括确定所述一组检测事件中的各个检测事件与所述第一聚类的中心之间的距离。
(20)根据上述(16)至(19)中任一项所述的信息处理设备,其中,通过将所述第一聚类与所述多个聚类中的另一聚类整合来获得所述第二聚类。
(21)根据上述(20)的信息处理设备,其中所述第一评估值和所述第二评估值之间的关系是所述第一评估值大于所述第二评估值。
(22)根据上述(16)至(19)中任一项所述的信息处理设备,其中,通过将第一聚类分成多个聚类来获得第二聚类。
(23)根据上述(22)的信息处理设备,其中,所述第一评估值和所述第二评估值之间的关系是所述第二评估值大于所述第一评估值。
(24)根据上述(16)至(19)中任一项所述的信息处理设备,其中对所述多维数据进行聚类进一步包括:对所述多维数据进行聚类以生成第一组聚类,所述第一组聚类包括对应于所述多维数据中的一组检测事件的所述第一聚类;以及聚类所述一组组检测事件以生成包括所述第二聚类的第二组聚类。
(25)根据上述(19)或(24)所述的信息处理设备,其中,所述一组检测事件中的每一个对应于从所述多个细胞中的一个细胞中获得的测量数据。
(26)根据上述(16)至(25)中任一项所述的信息处理设备,其中,输出所述信息进一步包括显示示出了所述第一聚类和所述第二聚类之间的关系的图形。
(27)根据上述(16)至(26)中任一项所述的信息处理设备,其中输出所述信息进一步包括显示对应于聚类的雷达图和包围对应于表示所述第一聚类的一组聚类的雷达图的线,其中所述一组聚类包括所述第二聚类。
(28)根据上述(27)所述的信息处理设备,其中输出所述信息进一步包括显示一图形,在该图形中,雷达图通过线连接,并且其中对应于所述一组聚类的所述雷达图通过至少一些线彼此连接。
(29)根据上述(16)至(28)中任一项所述的信息处理设备,其中所述多维数据指示使用多个激发波长获得的荧光强度光谱。
(30)根据上述(29)所述的信息处理设备,其中所述多维数据包括针对所述多个激发波长中的每一个的荧光强度光谱。
(31)根据上述(16)至(28)中任一项所述的信息处理设备,其中所述多维数据是通过使用流式细胞仪来执行所述多个细胞的光学测量而获得的。
(32)至少一个存储处理器可执行指令的非瞬时性计算机可读存储介质,当所述指令由至少一个硬件处理器执行时,使得所述至少一个硬件处理器执行:接收从多个细胞获得的多维数据;对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
(33)根据上述(32)所述的至少一种非瞬时性计算机可读存储介质,其中,输出所述信息进一步包括显示示出了所述第一聚类和所述第二聚类之间的关系的图形。
(34)根据上述(32)或(33)所述的至少一种非瞬时性计算机可读存储介质,其中输出所述信息进一步包括显示对应于聚类的雷达图和包围对应于代表所述第一聚类的一组聚类的雷达图的线,其中所述一组聚类包括所述第二聚类。
(35)根据上述(32)至(34)中任一项所述的至少一种非瞬时性计算机可读存储介质,其中,通过确定所述第一聚类的第一评估值和所述第二聚类的第二评估值来获得表示所述聚类结果的可靠性的信息,并且所述信息指示所述第一评估值和所述第二评估值之间的关系。
(36)一种方法,包括:接收从多个细胞获得的多维数据;对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及输出表示所述聚类结果的可靠性的信息,其中所述信息指示第一聚类和第二聚类之间的关系。
(37)根据上述(36)的方法,其中输出所述信息进一步包括显示示出了所述第一聚类和所述第二聚类之间的关系的图形。
(38)根据上述(36)或(37)的方法,其中输出所述信息进一步包括显示对应于聚类的雷达图和包围对应于代表所述第一聚类的一组聚类的雷达图的线,其中所述一组聚类包括所述第二聚类。
本领域技术人员应该理解,根据设计要求和其它因素,可以进行各种修改、组合、子组合和变更,只要其在所附权利要求或其等同物的范围内。
参考符号列表
10测量设备
20、21信息处理设备
30、40终端装置
100系统
201输入单元
203荧光分离单元
205第一聚类单元
207第二聚类单元
209评估值计算器
211确定单元
213输出单元
215聚类重新配置单元
Claims (20)
1.一种信息处理设备,包括:
至少一个硬件处理器;以及
至少一个非瞬时性计算机可读存储介质,其上存储有处理器可执行指令,当所述指令由所述至少一个硬件处理器执行时,使得所述至少一个硬件处理器执行:
接收从多个细胞获得的多维数据;
对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及
输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
2.根据权利要求1所述的信息处理设备,其中,表示所述聚类结果的可靠性的信息是通过确定所述第一聚类的第一评估值和所述第二聚类的第二评估值而获得的,并且所述信息指示所述第一评估值和所述第二评估值之间的关系。
3.根据权利要求2所述的信息处理设备,其中,所述第一评估值是和所述第一聚类与所述多个聚类中的至少一些聚类的分离度相关联的指标。
4.根据权利要求2所述的信息处理设备,其中,所述第一聚类对应于所述多维数据中的一组检测事件,并且确定所述第一评估值还包括确定所述组中的各个检测事件与所述第一聚类的中心之间的距离。
5.根据权利要求1所述的信息处理设备,其中,所述第二聚类是通过将所述第一聚类与所述多个聚类中的另一聚类整合而获得的。
6.根据权利要求5所述的信息处理设备,其中,第一评估值和第二评估值之间的所述关系是:所述第一评估值大于所述第二评估值。
7.根据权利要求1所述的信息处理设备,其中,所述第二聚类是通过将所述第一聚类分成多个聚类而获得的。
8.根据权利要求7所述的信息处理设备,其中,第一评估值和第二评估值之间的所述关系是:所述第二评估值大于所述第一评估值。
9.根据权利要求1所述的信息处理设备,其中,对所述多维数据进行聚类还包括:
对所述多维数据进行聚类以生成第一组聚类,所述第一组聚类包括对应于所述多维数据中的一组检测事件的所述第一聚类;以及
对所述一组检测事件进行聚类以生成包括所述第二聚类的第二组聚类。
10.根据权利要求9所述的信息处理设备,其中,所述一组检测事件中的每一个检测事件对应于从所述多个细胞中的一个细胞中获得的测量数据。
11.根据权利要求1所述的信息处理设备,其中,输出所述信息还包括显示一图形,所述图形示出了所述第一聚类和所述第二聚类之间的关系。
12.根据权利要求1所述的信息处理设备,其中,输出所述信息还包括显示对应于聚类的多个雷达图和包围对应于表示所述第一聚类的一组聚类的多个雷达图的线,其中所述一组聚类包括所述第二聚类。
13.根据权利要求12所述的信息处理设备,其中,输出所述信息还包括显示一图形,在该图形中,多个所述雷达图由线连接,并且其中对应于所述一组聚类的多个所述雷达图由所述线中的至少一些线彼此连接。
14.根据权利要求1所述的信息处理设备,其中,所述多维数据指示使用多个激发波长获得的荧光强度光谱。
15.根据权利要求14所述的信息处理设备,其中,所述多维数据包括针对所述多个激发波长中的每一个激发波长的荧光强度光谱。
16.根据权利要求1所述的信息处理设备,其中,所述多维数据是通过使用流式细胞仪对所述多个细胞进行光学测量而获得的。
17.至少一个非瞬时性计算机可读存储介质,其上存储有处理器可执行指令,当所述指令由至少一个硬件处理器执行时,使得所述至少一个硬件处理器执行:
接收从多个细胞获得的多维数据;
对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及
输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
18.根据权利要求17所述的至少一个非瞬时性计算机可读存储介质,其中输出所述信息还包括显示示出了所述第一聚类和所述第二聚类之间关系的图形。
19.一种方法,包括:
接收从多个细胞获得的多维数据;
对所述多维数据进行聚类以生成聚类结果,所述聚类结果指示包括共享所述多维数据的至少一部分的第一聚类和第二聚类的多个聚类;以及
输出表示所述聚类结果的可靠性的信息,其中所述信息指示所述第一聚类和所述第二聚类之间的关系。
20.根据权利要求19所述的方法,其中,输出所述信息还包括显示示出了所述第一聚类和所述第二聚类之间关系的图形。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018215289 | 2018-11-16 | ||
JP2018-215289 | 2018-11-16 | ||
PCT/JP2019/044923 WO2020101023A1 (en) | 2018-11-16 | 2019-11-15 | Information processing apparatus, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112771510A true CN112771510A (zh) | 2021-05-07 |
Family
ID=68766805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980063820.6A Pending CN112771510A (zh) | 2018-11-16 | 2019-11-15 | 信息处理设备、信息处理方法和程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220003656A1 (zh) |
EP (1) | EP3867768A1 (zh) |
JP (2) | JP7392411B2 (zh) |
CN (1) | CN112771510A (zh) |
WO (1) | WO2020101023A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115579065A (zh) * | 2022-12-09 | 2023-01-06 | 百图生科(苏州)智能科技有限公司 | 数据的聚类处理方法、装置、电子设备和存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021081342A (ja) * | 2019-11-20 | 2021-05-27 | ソニーグループ株式会社 | 情報処理システムおよび情報処理装置 |
WO2022107077A1 (en) | 2020-11-19 | 2022-05-27 | Sony Group Corporation | Classification workflow for flexible image based particle sorting |
CN117215589A (zh) * | 2023-09-12 | 2023-12-12 | 北京优特捷信息技术有限公司 | 一种云原生状态评估方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080172185A1 (en) * | 2007-01-17 | 2008-07-17 | Shenzhen Mindray Bio-Medical Electronics Co., Ltd. | Automatic classifying method, device and system for flow cytometry |
US20130060775A1 (en) * | 2010-12-27 | 2013-03-07 | The Board Of Trustees Of The Leland Stanford Junior University | Spanning-tree progression analysis of density-normalized events (spade) |
WO2015004843A1 (ja) * | 2013-07-11 | 2015-01-15 | パナソニックIpマネジメント株式会社 | 画像計測装置及び画像計測方法 |
US20150032759A1 (en) * | 2012-04-06 | 2015-01-29 | Sk Planet Co., Ltd. | System and method for analyzing result of clustering massive data |
CN107358268A (zh) * | 2017-07-20 | 2017-11-17 | 北京京东尚科信息技术有限公司 | 用于数据聚类分组的方法、装置、电子设备及可读介质 |
CN108376982A (zh) * | 2017-11-24 | 2018-08-07 | 上海泰豪迈能能源科技有限公司 | 负载相序的识别方法及装置 |
CN108681973A (zh) * | 2018-05-14 | 2018-10-19 | 广州供电局有限公司 | 电力用户的分类方法、装置、计算机设备和存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4194697B2 (ja) * | 1998-10-22 | 2008-12-10 | 株式会社野村総合研究所 | 分類ルール探求式クラスター分析装置 |
JP2006271385A (ja) * | 2001-03-14 | 2006-10-12 | Dna Chip Research Inc | 大腸癌の予測方法 |
JP4041081B2 (ja) * | 2004-03-23 | 2008-01-30 | 東芝ソリューション株式会社 | 分割クラスタリング装置及び分割データ数決定方法 |
JP4509860B2 (ja) * | 2005-05-25 | 2010-07-21 | 株式会社東芝 | データ分割装置、データ分割方法およびプログラム |
JP2006350730A (ja) * | 2005-06-16 | 2006-12-28 | Toshiba Corp | クラスタリング装置、クラスタリング方法およびプログラム |
US8549002B2 (en) * | 2008-05-15 | 2013-10-01 | Oracle International Corporation | Cluster health indicator with dynamic load correlation |
JP6092206B2 (ja) * | 2011-07-19 | 2017-03-08 | オヴィジオ イメージング システムズ エン.ヴェー. | 細胞試料内のがん性細胞を検出し、及び/又は分類する方法及びシステム |
US20130207980A1 (en) * | 2012-02-13 | 2013-08-15 | Anil Babu Ankisettipalli | Visualization of data clusters |
JP5712396B2 (ja) * | 2012-03-30 | 2015-05-07 | 公益財団法人神奈川科学技術アカデミー | イメージングセルソーター |
JP6710512B2 (ja) * | 2015-09-14 | 2020-06-17 | シスメックス株式会社 | 血液分析装置、血液分析方法及びコンピュータプログラム |
-
2019
- 2019-11-15 JP JP2019207396A patent/JP7392411B2/ja active Active
- 2019-11-15 US US17/292,998 patent/US20220003656A1/en active Pending
- 2019-11-15 CN CN201980063820.6A patent/CN112771510A/zh active Pending
- 2019-11-15 EP EP19813664.0A patent/EP3867768A1/en active Pending
- 2019-11-15 WO PCT/JP2019/044923 patent/WO2020101023A1/en active Application Filing
-
2023
- 2023-11-21 JP JP2023197269A patent/JP2024009155A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080172185A1 (en) * | 2007-01-17 | 2008-07-17 | Shenzhen Mindray Bio-Medical Electronics Co., Ltd. | Automatic classifying method, device and system for flow cytometry |
US20130060775A1 (en) * | 2010-12-27 | 2013-03-07 | The Board Of Trustees Of The Leland Stanford Junior University | Spanning-tree progression analysis of density-normalized events (spade) |
US20150032759A1 (en) * | 2012-04-06 | 2015-01-29 | Sk Planet Co., Ltd. | System and method for analyzing result of clustering massive data |
WO2015004843A1 (ja) * | 2013-07-11 | 2015-01-15 | パナソニックIpマネジメント株式会社 | 画像計測装置及び画像計測方法 |
CN107358268A (zh) * | 2017-07-20 | 2017-11-17 | 北京京东尚科信息技术有限公司 | 用于数据聚类分组的方法、装置、电子设备及可读介质 |
CN108376982A (zh) * | 2017-11-24 | 2018-08-07 | 上海泰豪迈能能源科技有限公司 | 负载相序的识别方法及装置 |
CN108681973A (zh) * | 2018-05-14 | 2018-10-19 | 广州供电局有限公司 | 电力用户的分类方法、装置、计算机设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115579065A (zh) * | 2022-12-09 | 2023-01-06 | 百图生科(苏州)智能科技有限公司 | 数据的聚类处理方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20220003656A1 (en) | 2022-01-06 |
JP7392411B2 (ja) | 2023-12-06 |
EP3867768A1 (en) | 2021-08-25 |
WO2020101023A1 (en) | 2020-05-22 |
JP2020087465A (ja) | 2020-06-04 |
JP2024009155A (ja) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112771510A (zh) | 信息处理设备、信息处理方法和程序 | |
US20200279125A1 (en) | Systems and methods for finding regions of interest in hematoxylin and eosin (h&e) stained tissue images and quantifying intratumor cellular spatial heterogeneity in multiplexed/hyperplexed fluorescence tissue images | |
US10127433B2 (en) | Systems and methods for generating fields of view | |
Hartig | Basic image analysis and manipulation in ImageJ | |
JP2019533805A (ja) | 視覚化されたスライド全域画像分析を提供するためのデジタル病理学システムおよび関連するワークフロー | |
EP2377073B1 (en) | Multi-nucleated cell classification and micronuclei scoring | |
JP6715451B2 (ja) | マススペクトル解析システム,方法およびプログラム | |
JP6480918B2 (ja) | フローサイトメトリにおける効率的なコンター及びゲーティング | |
US20110204259A1 (en) | Method and system for detecting fluorochromes in a flow cytometer | |
JP2018512072A (ja) | 自動化スライド全域解析の品質管理 | |
TWI630581B (zh) | 細胞學影像處理裝置及細胞學影像特徵量化方法 | |
CN112750162A (zh) | 一种目标识别定位方法和装置 | |
US20240054639A1 (en) | Quantification of conditions on biomedical images across staining modalities using a multi-task deep learning framework | |
CN112703531A (zh) | 生成组织图像的注释数据 | |
Stossi et al. | Basic image analysis and manipulation in ImageJ/Fiji | |
US20100112627A1 (en) | System and Method for Displaying Three-Dimensional Object Scattergrams | |
WO2021188477A1 (en) | Scalable and high precision context-guided segmentation of histological structures including ducts/glands and lumen, cluster of ducts/glands, and individual nuclei in whole slide images of tissue samples from spatial multi-parameter cellular and sub-cellular imaging platforms | |
CN113168529B (zh) | 信息处理设备、信息处理方法和程序 | |
CA3231502A1 (en) | Systems and methods for multi-tree deconstruction and processing of point clouds | |
EP3611654A1 (en) | System and method for analysis of microscopic image data and for generating an annotated data set for classifier training | |
US20140372450A1 (en) | Methods of viewing and analyzing high content biological data | |
EP4276846A1 (en) | Enhanced digital pathology platform | |
US20230085927A1 (en) | Visualization system and method for interpretation and diagnosis of deep neural networks | |
Kriston-Vizi et al. | Gebiss: an ImageJ plugin for the specification of ground truth and the performance evaluation of 3D segmentation algorithms | |
JP2024084811A (ja) | 情報処理方法、情報処理装置及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |