CN111316095B - 波形分析装置 - Google Patents

波形分析装置 Download PDF

Info

Publication number
CN111316095B
CN111316095B CN201780096535.5A CN201780096535A CN111316095B CN 111316095 B CN111316095 B CN 111316095B CN 201780096535 A CN201780096535 A CN 201780096535A CN 111316095 B CN111316095 B CN 111316095B
Authority
CN
China
Prior art keywords
peak
information
accuracy
waveform
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780096535.5A
Other languages
English (en)
Other versions
CN111316095A (zh
Inventor
小副川健
樋田祐辅
金泽裕治
金泽慎司
山田洋平
安田弘之
国泽研大
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of CN111316095A publication Critical patent/CN111316095A/zh
Application granted granted Critical
Publication of CN111316095B publication Critical patent/CN111316095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • G01N30/8634Peak quality criteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86

Landscapes

  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Quality & Reliability (AREA)
  • Engineering & Computer Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

峰位置估计部(113)当得到关于目标试样的色谱数据时,使用已学习模型存储部(114)中保存的已学习模型求出峰的起点/终点的位置的估计结果和表示该估计的可靠性的准确度。通常,针对一个峰求出多个峰起点/终点的估计结果。峰信息修正处理部(115)将准确度最高的设为最有力候选,将包括该最有力候选的多个候选与准确度一同以重叠于色谱的方式显示于显示部(13)。操作者根据准确度选择需要详细的确认、修正的峰,关于选择出的峰,例如对除最有力候选之外的其它候选等进行选择指示,由此修正起点/终点。由此,能够根据色谱波形对自动检测出的峰的起点/终点高效地进行确认、修正的作业。

Description

波形分析装置
技术领域
本发明涉及一种对通过分析装置得到的信号的波形进行分析的波形分析装置。本发明例如适用于通过气相色谱(GC)装置、液相色谱(LC)装置等获取的色谱波形、通过质量分析装置获取的质谱波形、通过分光光度计等获取的吸光光谱波形、通过X射线分析装置获取的X射线光谱波形等通过各种分析装置得到的信号的波形的分析中。
背景技术
在气相色谱装置、液相色谱装置中,将包含各种成分的试样导入管柱中,在该试样通过管柱的过程中将各种成分在时间上分离,利用设置于管柱的出口的检测器进行检测。在基于由检测器得到的检测信号制作的色谱中出现与试样中的成分对应的峰。由于观测到该峰的时间(保持时间)与成分的种类对应,因此能够根据该峰的保持时间来确定成分,也就是能够进行定性分析。另外,由于峰的高度、面积与该成分的浓度或含量对应,因此能够根据峰的高度值、面积值求出该成分的浓度、含量,也就是能够进行定量分析。
进行定性分析、定量分析需要在色谱波形上准确地检测峰,确定峰的起点、终点的位置(时间)。在实际的色谱波形中,会重叠有各种噪声、或基线发生了变动、或源自多种成分的峰重叠。因此,根据色谱波形准确地检测峰并不容易,以往,作为基于色谱波形的峰检测法,提出了各种算法以供实际使用(参照专利文献1、2等)。
在以往的通常的峰检测算法中,针对实际测量的色谱波形,通过平滑处理等噪声去除、峰位置的检测、基线估计、峰起点和终点的检测、重叠的峰的分离等波形处理来计算峰的高度值、面积值。根据算法,有时在进行峰位置的检测之前执行基线估计、峰起点和终点的检测,但无论在以往的哪种通常的峰检测算法中,均需要操作者进行很多作业,如由操作者(分析担当者)预先设定各种参数、或由操作者在显示画面上观察色谱波形来指定峰的起点/终点、或由操作者判断哪个基线是恰当的并选择该基线用以将重叠的峰分离等。另外,难以对基线、峰的形状各种各样的色谱波形应用一个固定的峰检测算法,因此还需要操作者从预先准备的多个峰检测算法之中选择要使用的算法的作业。
这样的操作对于操作者而言是很大的负担并且非常有碍于分析作业的效率改善。另外,分析作业需要一定程度的熟练、经验,因此能够担当的人有限。并且,无法避免根据操作者存在的判断的偏差,还具有操作者随意进行操作的可能性。因此,也存在难以确保分析结果的精度、再现性或可靠性的问题。
为了减轻操作者的作业负担,还开发了自动地检测峰的起点/终点的算法(参照非专利文献1等)。然而,在这样的算法中也是,依赖于操作者的操作的要素多,期望进一步减轻负担。
另外,即使通过这样的算法自动地进行峰检测,也存在该检测结果并不适当的情况。因此,操作者在显示画面上确认了自动检测出的峰的起点/终点后根据需要进行修正的作业实际上不可或缺。在多成分同时分析中,有时色谱波形中包括超过数万的峰,在这样的情况下,若一边关于全部的峰分别目视确认起点和终点一边通过手动作业进行修正则会需要非常多的时间。据此,即使在进行峰的自动检测的情况下也是,使确认并修正该检测结果的作业简化来减轻作业负担是很重要的。
现有技术文献
专利文献
专利文献1:日本特开2009-8582号公报
专利文献2:国际公开第2017/094170号小册子
非专利文献
非专利文献1:“通过智能的波形处理算法使分析业务效率化”、“online”、“平成29年10月23日检索”、株式会社岛津制作所、网络<URL:http://www.an.shimadzu.co.jp/hplc/support/faq/faq8/i-peakfinder_introduction.ht m>
非专利文献2:“通过利用深度学习技术的小型启动服务来辅助预测分析导入”、Wave 2017.5vol.21、“online”、“平成29年10月23日检索”、东芝信息系统株式会社、网络<URL:https://www.tjsys.co.jp/wave/files/Wave-21_06.pdf>
非专利文献3:Wei Liu及其他六人、“SSD:单发多盒探测器(SSD:Single ShotMultibox Detector)”、“online”、“平成29年10月23日检索”、arXiv.org、网络<URL:https://arxiv.org/pdf/1512.02325.pdf>
非专利文献4:绪方贵纪、“SSD:Single Shot MultiBox Detector(ECCV2016)”、“online”、“平成29年10月24日检索”、slideshare、网络<URL:https://www.slideshare.net/takanoriogata1121/ssd-single-shot-multibox-detector-eccv2016>
发明内容
发明要解决的问题
本发明是为了解决上述课题而完成的,其目的在于提供一种操作者能够简便且高效地确认通过峰检测处理检测出的峰的起点、终点等峰信息并且能够根据需要进行修正来输出精度高的峰检测结果的波形分析装置。
用于解决问题的方案
为了解决上述课题而完成的本发明是一种波形分析装置,对基于通过对试样进行规定的分析而得到的信号列的信号波形进行分析来求出与该信号波形上的峰有关的信息,所述波形分析装置的特征在于,具备:
a)峰检测部,其使用已学习模型来估计包括关于在目标试样的信号波形中出现的一个或多个峰的起点的位置和终点的位置中的至少一方的峰信息,并且求出作为表示该估计的可靠度的指标值的准确度信息,所述已学习模型是通过使用峰的起点和终点已知的多个信号波形进行的机器学习预先构建出的;
b)显示处理部,其将所述峰检测部针对一个峰得到的一个或多个峰信息与各个准确度信息建立对应后与关于所述目标试样的信号波形一同显示于显示部的画面上;以及
c)峰信息修正部,其修正通过所述显示处理部显示于所述显示部的画面上的峰信息。
在本发明中,规定的分析例如为液相色谱、气相色谱等的色谱分析、质量分析、离子迁移率分析、吸光光谱分析和荧光光谱分析等光谱分析、X射线分析等。另外,基于通过进行这样的分析而得到的信号列的信号波形为表示将时间、质荷比、离子迁移率、波长、能量等设为变量的信号强度的变化的色谱波形、光谱波形等。
在本发明所涉及的波形分析装置中,峰检测部具备已学习模型,该学习模型是通过使用峰的准确的起点和终点已知的多个(通常为相当大量的)信号波形进行的机器学习预先构建出的。当被提供通过分析目标试样而得到的信号列时,峰检测部使用已学习模型,基于该信号列或根据信号列求出的信号波形来估计信号波形中出现的一个或多个峰的起点/终点的位置,并且计算测量该估计的可靠度的准确度信息。此外,在此使用的机器学习的方法还包括广义的机器学习中包括的深度学习,不特别进行限定。
接着,显示处理部将估计出的峰信息作为正确的候选与准确度信息建立对应并与关于目标试样的信号波形一同显示于显示部的画面上。操作者(用户)在显示画面上对信号波形和峰信息的候选以及准确度信息进行目视确认,仅在需要的情况下通过峰信息修正部来修正峰信息。例如,操作者关于发现了准确度信息非常高的值即峰信息的候选的峰省略确认作业,仅针对只有准确度信息的值相对低的峰信息候选的峰在信号波形上确认峰波形,并且在需要时能够进行省去手动地指定峰起点/终点之类的工序的作业。
在本发明中,由上述显示处理部进行的显示以及由峰信息修正部进行的修正的指示、与该指示相应的修正动作能够采取各种方式。
具体地说,作为本发明的一个方式,所述显示处理部将关于信号波形上的一个峰得到的多个峰信息中的一个峰信息设为最有力候选,并且以相对于该一个峰信息以外的峰信息即候选能够被识别的方式进行显示,
所述峰信息修正部设为如下的结构即可:包括供用户对除所述最有力候选之外的其它候选进行选择指示的指示部,将由该指示部选择指示出的候选变更为最有力候选。作为上述指示部,例如使用用于对画面上所显示的文字、符号等点击操作的指示设备即可。
在该方式中,所述显示处理部设为如下的结构即可:将关于一个峰得到的多个峰信息中的准确度信息的值最大的峰信息设为最有力候选,并且至少与准确度信息的值第二大的峰信息即候选一同进行显示。
根据该方式,在想要修正作为最有力候选的峰信息的情况下,操作者仅进行选择指示其它候选的操作即可,因此修正的操作简单,并且能够高效地修正峰信息。
另外,在上述方式中,所述显示处理部将与关于一个峰得到的多个峰信息对应的准确度信息视作准确率,求出表示针对该多个峰信息中包括的峰的起点以及/或者终点的位置的准确率的分布的准确度分布,基于该准确度分布来决定所述最有力候选。
另外,在该情况下,在上述准确度分布中,不限于在多个峰信息中的准确度信息的值最大的峰信息中包括的峰的起点/终点的位置出现极大点,具有在稍微偏离该峰的起点/终点的位置的位置出现准确度分布的极大点的可能性。推测出现该极大点的位置作为峰的起点/终点更合理。
因此,在上述结构中,求出包括如下的峰起点以及/或者终点的峰信息,并将其设为最有力候选,所述峰起点以及/或者终点位于在所述准确度分布中准确度信息的值最大的峰信息中包括的峰起点以及/或者终点的位置的附近且与该准确度信息的值为极大点的位置对应。
根据这样的结构,相比于在多个峰信息之中仅将准确度信息的值最大的峰信息设为最有力候选的情况,能够随机地向操作者呈现包括更可靠的峰起点/终点的峰信息来作为最有力候选。
另外,在上述结构中,当在所述准确度分布中存在多个凸部的情况下,可以将分别包括与该凸部各自的极大点中的规定个数的最大的极大点对应的峰的起点以及/或者终点的峰信息设为候选。
另外,作为本发明的其它方式,所述显示处理部设为如下的结构即可:从关于一个峰得到的多个峰信息之中选择如下的峰信息并进行显示,所述峰信息是同该峰信息对应的准确度信息的值与同基于通过关于相同的目标试样进行的分析得到的信号列或信号波形求出的关于相同的峰的峰信息对应的准确度信息的值之间的差异为规定以内的峰信息。
另外,作为本发明的另一其它实施方式,所述显示处理部设为如下的结构即可:同时显示通过对相同的目标试样进行多次分析得到的多个信号列或信号波形求出的关于相同的峰的多个峰信息和准确度信息。
如这些结构那样,在关于相同的试样执行了多次分析的情况下,将基于通过该多个分析得到的信号列或信号波形分别估计出的峰信息和准确度信息进行比较或者获取其差异,由此能够导出可靠性更高的结果。
另外,作为本发明的另一其它方式,所述显示处理部可以设为如下的结构:显示位于针对一个峰的多个峰信息的候选中的指标值最大的候选、或最有力候选的峰的起点以及/或者终点的附近且信号强度最低的位置来作为峰的起点以及/或者终点的最有力候选。
根据该结构,不将由峰检测部估计出的峰的起点/终点的位置本身设为最有力候选,能够将在该位置的附近且表示合理性更高的位置的峰信息列举为最有力候选。
发明的效果
根据本发明所涉及的波形分析装置,用户能够高效地确认自动地检测出的峰的起点、终点等峰信息并根据需要进行修正。特别地,通过以能够简单地识别可靠的峰信息和可靠性比其低的峰信息的方式进行显示,能够使用户通过目视进行的确认、修正的指示更简单,能够减轻这样的作业带给用户的负担。另外,能够使波形分析的处理能力提高。并且,例如在对观测到大量的峰的信号波形进行分析时,用户应确认的峰的数量减少,由此也能够有效防止确认作业的错误、疏忽等。
附图说明
图1是使用本发明所涉及的波形分析装置的一个实施例的液相色谱系统和制作该系统中使用的已学习模型的系统的概要结构图。
图2是表示制作本实施例的波形分析装置中使用的已学习模型时的处理的流程的流程图。
图3是表示本实施例的波形分析装置中的峰检测处理的流程的流程图。
图4是表示本实施例的波形分析装置中的色谱波形的图像化的一例的图。
图5是表示本实施例的波形分析装置中使用的、基于神经网络的已学习模型的示意图。
图6是用于说明制作在本实施例的波形分析装置中使用的已学习模型时的处理的示意图。
图7是用于说明在本实施例的波形分析装置中使用已学习模型进行的峰检测处理的示意图。
图8是表示通过本实施例的波形分析装置中的峰自动检测处理求出的峰的起点/终点的候选的显示的一例的图。
图9是表示通过本实施例的波形分析装置中的峰自动检测处理求出的峰的起点/终点的候选的显示的一例的图。
图10是表示在本实施例的波形分析装置中修正自动地检测出的峰的终点时的作业例的图。
具体实施方式
下面,详细地说明本发明所涉及的波形分析装置的一个实施例。
图1是利用本发明所涉及的波形分析装置的一个实施例的液相色谱(LC)系统和制作该系统中使用的已学习模型的系统的概要结构图。
该LC系统1具备LC测定部10、数据分析部11、操作部12以及显示部13。虽然没有图示,但LC测定部10包括送液泵、喷射器、管柱、管柱加热部、检测器等,关于所提供的试样执行LC分析来获取表示由检测器得到的信号强度的随时间的变化的色谱数据。
数据分析部11包括数据收集部110、峰检测处理部111、定性/定量分析部117等功能块,并且,峰检测处理部111包括图像生成部112、峰位置估计部113、已学习模型存储部114、峰信息修正处理部115、峰决定部116等功能块。
在数据分析部11中,数据收集部110收集并存储通过LC测定部10得到的色谱数据。相当于本发明所涉及的波形分析装置的峰检测处理部111在基于收集到的色谱数据的色谱波形中自动地检测峰,输出包括检测出的峰的起点和终点的位置(保持时间)的峰信息。定性/定量分析部117基于从峰检测处理部111提供的峰信息来鉴定与各峰对应的成分,或计算峰高度值、峰面积值并根据其值来计算各成分的浓度或含量。
在图1中,与LC系统1相分别地设置的模型制作部2包括学习数据输入部20、图像生成部21、学习执行部22以及模型构建部23来作为功能块。由该模型制作部2制作出的已学习模型被保存于LC系统1的数据分析部11中的存储部,作为已学习模型存储部114发挥功能。
此外,通常,数据分析部11的实体为安装有规定的软件的个人计算机、性能更高的工作站、或者包括经由通信线路而与这样的计算机连接的高性能的计算机的计算机系统。即,关于数据分析部11中包括的各块的功能,能够通过执行计算机单体或包括多个计算机的计算机系统上搭载的软件来实施,通过利用该计算机或计算机系统中存储的各种数据进行的处理来具体化。
接着,详细地说明由峰检测处理部111实施的峰检测处理。
极度概括地说,在该峰检测处理部111中,通过使用在将色谱波形(色谱曲线)转换为二维图像后对存在于该图像上的物体的分类和位置进行检测的作为机器学习的一个方法的深度学习(Deep Learning)的方法,来检测峰的起点和终点的位置。
[已学习模型的制作]
如众所周知的那样,在机器学习法中,需要使用大量的学习数据来预先构建已学习模型。如上述的那样,该已学习模型的构建作业并不在作为LC系统1的一部分的数据分析部11中进行,而是通过由其它计算机系统构成的模型制作部2来实施,并且将实施的结果保存在已学习模型存储部114中。这是因为,一般来说,在已学习模型的构建作业中要处理大量的数据,因此计算量非常大,需要性能相当高且与图像处理对应的计算机。图2是表示在模型制作部2中进行的已学习模型制作时的处理的流程的流程图。
在制作已学习模型时,准备大量且多样的色谱波形数据,并且事先准确地求出该各色谱波形中出现的一个或多个峰的起点和终点的保持时间。此处所说的多样的色谱波形数据为包括可能出现在实际实施峰检测时的色谱波形中的以下要素的色谱波形,所述要素为各种噪声的混入、基线的变动(抖动)、多个峰的重叠或者峰形状的变形。学习数据输入部20将该大量的色谱波形数据与包括峰起点/终点的准确的峰信息的组合作为学习数据来读入(步骤S1)。
图像生成部21基于作为时间系列信号的色谱波形数据来制作色谱,将表示信号强度的随时间经过的变化的色谱波形(色谱曲线)转换为规定的像素数的二维图像(步骤S2)。在此,作为一例,设为像素数为512×512。在进行该图像转换时,以色谱波形上的峰之中的信号强度最大的峰的峰顶与矩形状的图像的上边一致的方式将该波形的y方向上的尺寸进行标准化。另外,以色谱波形的整个测定时间范围或一部分的测定时间范围(例如由用户指示的测定时间范围)与矩形状的图像的x方向(横向)上的长度一致的方式将该波形的x方向上的尺寸进行标准化(步骤S3)。
当如上述那样将色谱波形进行标准化时,以与该波形对应的线为边界将矩形状的图像分割为两个区域。因此,将通过该图像分割而形成的两个区域中的一个区域用不同于另一个区域的颜色的规定的颜色进行填充(步骤S4)。此时,使颜色的浓度分为多级,在与波形对应的线也就是两个区域的边界线的附近,根据边界线与像素的位置关系来决定各像素的颜色的浓度为宜。具体地说,例如当用0~255的256级的灰阶对一个区域进行填充时,一个区域中的远离边界线的部分为黑色,另一个区域中的远离边界线的部分为白色,但边界线附近的像素为它们的中间色。
在图4中表示色谱波形的一例(a)以及基于步骤S2~S4对其实施图像化所得到的二维图像(b)。在图4的(b)的下方示意性地表示两个区域的边界线附近的像素的颜色。此外,在此,将两个区域中的一个区域的整体进行填充。由此,在将各区域中的微小区域(一个像素或多个像素的集合)之间进行比较时,能够识别为是不同的区域。这有利于在后述的机器学习的算法中提高图像识别的精度。但是,根据所使用的机器学习的算法,不一定对两个区域中的一个区域的整体进行填充,例如也可以使用沿该边界线整体仅填充距该边界线规定长度的范围内的图像。另外,理所当然的是,可以不用灰阶进行填充,用黑色以外的另一种颜色、或按照色阶的多个颜色进行填充。即,以能够在隔着边界线位于边界线的两侧的区域中的微小区域之间进行识别的方式进行填充即可。
将通过步骤S1读入的全部的色谱波形数据同样地转换为图像。通过伴随色谱波形的标准化进行的图像化的处理,生成表示原始的色谱波形的强度信息、时间信息丢失的波形形状的图像。此外,当然,也可以不在通过步骤S1读入全部的数据后执行步骤S2~S4的处理,一边进行步骤S1中的数据的读入一边基于步骤S2~S4将已读入的数据进行图像化。
另外,图像生成部21根据进行上述的图像化时的x方向、y方向上的标准化、也就是色谱波形的伸缩,来将与色谱波形数据相组合的峰信息转换为图像上的位置信息,也就是x方向和y方向上的像素位置的信息(步骤S5)。
接着,学习执行部22利用通过上述那样根据作为学习数据的色谱波形生成的大量的图像来实施机器学习,模型构建部23基于其学习结果来构建用于估计色谱波形上的峰的起点和终点的学习模型。如公知的那样,机器学习具有各种算法,在此使用作为图像识别中的一般物体探测算法之一的深度学习,其中还使用在图像识别方面尤为优异的SSD法(步骤S6)。
SSD法为使用深度学习之中最为广泛利用的卷积神经网络(CNN)的方法之一,是目前速度最快且能够实现高的识别精度的算法。SSD法是Liu Wei等人在非专利文献3中提出的,在非专利文献3、4等中详细地说明了该算法的详情,因此在此仅叙述本实施例中的特征点。
在通常的SSD法中,使用通过CNN提取出的图像特征图(feature map)来在二维的图像内估计存在物体的部分,但通过对该图像特征图逐步进行卷积来利用各种尺寸(像素数)的图像特征图。由此,能够检测各种大小的物体区域候选。与此相对地,在本实施例中想要检测的是峰的起点和终点的在x方向上的位置。因此,变更算法以检测x方向上的各种大小的区间内存在的峰的起点和终点。
图5是表示在本实施例中使用的基于神经网络得到的已学习模型的示意图。另外,图6是用于说明制作已学习模型时的处理的示意图。如图6所示,在此,设定具有宽度为通过上述步骤S2~S4的处理生成的图像的x方向上的整个长度的窗口的线段Sg1,接着,设定将线段Sg1的窗口分割为一半得到的窗口宽度为1/2的线段Sg2、Sg3。同样地,设定分别将线段Sg2、Sg3的窗口分割为一半得到的窗口宽度为原来的1/4的四个线段Sg4、Sg5、Sg6、Sg7,通过重复进行这样的操作来总共设定120个线段Sg1~Sg120。该各线段为通过CNN来提取图像特征图的单位,基于作为学习数据的图像按该单位来学习由峰的起点和终点决定的峰范围。
如图5所示,在该学习模型中的神经网络中,向设置于输入层的262144个节点的各节点输入512×512像素的图像中的各像素的像素值(在此为灰阶的0~255的范围)。在图5中,pxn表示一张图像中的第n个像素。此外,在图像为彩色或多种颜色的情况下,针对每个像素例如输入三原色的各颜色的像素值,因此输入层的节点数例如变为3倍。
在学习执行部22中,针对基于大量的图像的如上述那样的输入,通过深度学习来学习包括大量的中间层的层构造的网络,从设置于最终输出层的600个节点分别输出数值信息。从该600个节点输出的信息为关于120个线段Sg1~Sg120的各线段计算出的峰检测的准确度(confidence)confn、从该线段的窗口的左端至峰起点的在x方向上的偏移量xsn、从输入图像的下端至峰起点的在y方向上的偏移量ysn、从该线段的窗口的右端至峰终点的在x方向上的偏移量xen、从输入图像的下端至峰终点的在y方向上的偏移量yen这五维的信息。在图6中,将针对第一个线段Sg1的上述五维的信息表示为{conf1,xs1,ys1,xe1,ye1}。在此,用峰范围与窗口的重叠长度来定义峰检测的准确度,其值的范围为0~1。
在图6的例子中,色谱波形中存在两个峰。前面的峰的起点的像素位置为(xs_a,ys_a),终点的像素位置为(xe_a,ye_a),该峰范围为A。另一方面,后面的峰的起点的像素位置为(xs_b,ys_b),终点的像素位置为(xe_b,ye_b),峰范围为B。在该情况下,线段Sg1中的xs1、ys1、xe1以及ye1如图6中所示。另外,conf为同Sg1的窗口宽度与峰范围A的重叠相应的计算值。如上述的那样,学习数据中的峰的起点/终点的像素位置、峰范围是已知的,因此关于大量的学习数据以尽可能与正确答案一致的方式进行学习来计算各中间层中的网络权重并且构建模型。
模型构建部23暂时保存通过这样使用大量的学习数据进行深度学习所求出的学习模型(步骤S7)。在LC系统1中,例如经由通信线路将由模型制作部2如上述那样制作出的学习模型进行传输并且保存在数据分析部11的已学习模型存储部114中。
[针对目标试样的峰检测处理]
接着,对通过LC系统1的数据分析部11执行的、在针对目标试样得到的色谱波形上进行的峰的检测处理进行说明。图3是表示由峰检测处理部111进行的峰检测处理的流程的流程图。
首先,图像生成部112从数据收集部110读入作为处理对象的色谱波形数据(步骤S11)。然后,对读入的数据执行与通过由模型制作部2的图像生成部21执行的步骤S2~S4进行的色谱波形数据的图像化同样的、步骤S12~S14的处理,由此生成包括色谱曲线的512×512像素的图像。
峰位置估计部113对生成的图像的各像素的像素值应用已学习模型存储部114中保存的已学习模型,来获取120个线段的每个线段的上述五维的信息。即,将在图像内被估计为峰的起点和终点的像素位置的信息与峰检测准确度一同获取(步骤S15)。
图7是表示峰检测结果的一例的图。在此,针对每个线段求出{confn,xsn,ysn,xen,yen}(其中n为1~120),因此,在大多数情况下,对一个峰通过多个线段得到峰检测的准确度不为0的{confn,xsn,ysn,xen,yen}。此外,一般来说,峰检测的准确度confn低的峰信息缺乏可靠性。因此,当在该例中计算出的confn为规定值(在此为0.5)以下的情况下,可以视作该五维的峰信息无用,设为{0,0,0,0,0},但不基于这样的准确度进行取舍选择,利用全部的结果。
[峰的起点/终点的修正作业]
如上述的那样,一般来说,针对一个峰得到多个起点/终点的位置和峰检测准确度。因而,可以将该多个峰起点/终点之中的峰检测准确度最高的峰起点/终点的位置估计为正确的起点/终点的位置,并且输出该峰的起点/终点的信息来作为峰检测结果。然而,根据情况,有时表示最大的峰检测准确度的峰起点/终点的位置不一定是正确的。另外,还有时关于一个峰得到的多个峰起点/终点之中没有正确的峰起点/终点。因此,在本实施例的装置中,峰信息修正处理部115如以下那样辅助由操作者进行的确认和修正作业。
峰信息修正处理部115首先将针对一个峰得到的多个峰起点/终点分别设为候选,从该多个候选之中去除峰检测准确度为规定的阈值(例如0.2)以下的候选,之后按照峰检测准确度从高到低的顺序选择规定数量(例如三个)的最大的候选。然后,将该规定数量的候选所表示的峰的起点/终点的在图像上的位置信息转换为时间信息,之后与该峰前后的规定的时间范围的色谱波形一同作为峰自动检测结果显示于显示部13的画面上(步骤S16)。
上述显示的方式能够设为各种方式中的任一个。
由于操作者从多个候选之中选择一个候选的标准是峰检测准确度,因此优选将峰检测准确度最大的候选设为最有力候选并且以容易相对于其它候选在视觉上被识别的方式进行显示。因此,设为在色谱波形上用规定颜色的圆标记等记号来表示基于各候选的峰的起点/终点,表示最有力候选的记号表示为深颜色,表示其它候选的记号表示为浅颜色为宜。另外,可以按照峰检测准确度从高到低的顺序使记号的颜色的深浅具有变化。另外,为了容易区别峰的起点和终点,例如将起点和终点设为不同的颜色进行显示,或者使用不同的标记进行显示,如使用圆标记表示起点、使用三角标记表示终点等。
图8是用圆标记表示关于各峰估计出的峰的起点的位置、用三角标记表示终点的位置并且用黑色的填充表示最有力候选、用白底表示其以外的候选的例子。通过这样的显示,能够一目了然地判别最有力候选和其以外的候选。
操作者在显示部13的画面上通过目视确认色谱波形和成为候选的峰的起点/终点的位置。而且,如果判断为作为最有力候选的起点/终点的位置不合理而作为其以外的候选的起点/终点更为合理,则例如通过利用指示设备进行的点击操作在合理的起点/终点的记号之上或其附近进行选择指示。峰信息修正处理部115接受该指示后将所指示的起点/终点的位置变更为最有力候选。通过这样,操作者能够通过自己的判断和操作来修正峰的自动检测结果(步骤S17)。
通过如上述那样将与峰检测准确度相应的颜色等信息赋予表示峰起点/终点的记号,来获知该准确度的大小关系,但使操作者还能够确认峰检测准确度的数值本身则能够进行更恰当的判断。因此,可以在画面上的色谱波形的附近通过对话框等将多个候选的峰检测准确度以数值的形式表示。图9为这样的显示的一例。在该例中,括弧()内的开头的数值为峰检测准确度(0~1的范围),其后续的数值为峰起点的时间和强度的信息。在此,在进行比较时用粗字表示最重要的峰检测准确度的数值,以使该数值比其它数值明显。由此,操作者能够一目了然地确认峰检测准确度的数值,选择合理性更高的候选。
此外,可以始终显示图9所示的对话框,但例如也可以仅在使图像上的光标靠近色谱波形或表示峰起点/终点的标记时出现对话框显示。另外,可以不将峰检测准确度的数值设为粗字,通过改变其字体的颜色、尺寸、斜体字的倾斜角等,来使其容易看到。另外,在该情况下,也可以是,通过对显示的峰检测准确度的数值、对话框内的任意的部位进行点击操作能够进行候选的选择指示。
另外,也可以是,峰信息修正处理部115实施如下那样的处理,以取代基于峰检测准确度的大小来选择最终的结果或者决定最有力候选。
现在,在针对一个峰存在多个(实际上某种程度的大量的)峰起点/终点的候选情况下,针对每个起点、终点,捕捉时间轴上的峰检测准确度的变化来作为准确度分布并进行图表化。该图表可以为曲线图,也可以为热图等。例如当针对多个点进行适当的拟合来求出准确度分布曲线时,在该点中,准确度分布曲线不一定在峰检测准确度最大的点处取得极大值,准确度分布曲线有时在该峰检测准确度最大的点的附近取得极大值。在该情况下,认为将取得该极大值的位置(时间)作为峰起点或终点是合理的。因此,将准确度分布曲线取得极大值的位置设为峰起点或终点的最有力候选即可。另外,将此时的极大值设为与该最有力候选对应的峰检测准确度即可。
另外,在准确度分布曲线中出现多个凸部的情况下,从该多个凸部中按照极大值从大到小的顺序选择规定数量的凸部,将与该多个凹部对应的位置设为峰的起点/终点的候选即可。
无论如何,在操作者根据需要关于峰的自动检测结果进行了适当的修正之后进行确定峰检测结果的指示时,峰決定部116接受该指示后将该时间点成为最有力候选的峰起点和终点确定为最终的峰检测结果并且输出(步骤S18)。
在数据分析部11中,定性/定量分析部117接受峰检测结果,例如针对每个峰计算峰面积值或高度值,参照预先获取该值而得到的标准曲线来计算目标成分的浓度、含量。或者,在成分未知的情况下,针对每个峰,基于该保持时间来鉴定成分。
在本实施例中,上述的峰的起点/终点的确认和修正作业还能够如以下那样进行变形。
在上述说明中,利用学习模型从通过对一个目标试样进行分析而得到的色谱波形中检测峰,但当重复分析相同的试样时关于该试样得到多个色谱波形,因此可以将针对该多个色谱波形分别得到的峰自动检测结果进行组合。
具体地说,可以将关于源自相同的试样中的相同的成分的峰的相同的起点/终点位置得到的多个峰检测准确度一同显示。由此,操作者能够将多个峰检测准确度均高的起点/终点位置判断为可靠性高的起点/终点位置并且进行候选的选择。另外,也可以关于相同的峰的相同的起点/终点位置计算多个峰检测准确度的差异,将该差异为规定阈值以上的起点/终点位置视作可靠度低并且从候选中排除。像这样,利用通过针对相同的试样进行多次分析而求出的信息,由此能够使峰的检测精度进一步提高,从而能够实现高的定量性。
另外,也可以不根据操作者的操作来修正峰的起点/终点的位置,自动地进行修正。具体地说,将起点、终点的位置自动地修正为以候选所表示的峰起点、终点为中心的固定的时间范围内的信号强度最小的点为宜。图10是自动地将终点变更为相对于作为候选的峰的终点Pe的规定的时间宽度W的范围内的强度最小的点Pe’的例子。
在此,时间宽度W可以设为预先决定的固定的时间范围,也可以设为通过峰宽度的函数(例如峰宽度的1/10=±1/20的范围)决定的值。另外,也可以设为时间宽度W内的色谱波形的平均值、或者设为根据时间宽度W内的最大值和最小值求出的中间值等,以取代选择时间宽度W内的信号强度最小的点。另外,也可以是,使用基于时间宽度W内的色谱数据通过与本算法不同的适当的方法计算出的基线值等。
在上述实施例中,使用深度学习中的SSD法来制作学习模型,但能够利用于本发明中的算法并不限于此。另外,不限于深度学习,也可以利用其以外的机器学习的方法。
另外,上述实施例为将本发明所涉及的波形分析装置应用于通过作为LC、GC的色谱装置得到的色谱波形来进行峰检测的例子,但本发明能够利用于通过色谱装置以外的各种分析装置得到的信号波形的处理。例如,明确可知的是,也能够将本发明应用于通过质量分析装置得到的质谱、通过吸光分光光度计、荧光分光光度计等各种光谱分析装置得到的光学光谱、通过离子迁移率分析装置得到的离子迁移率光谱、通过X射线分析装置得到的X射线光谱等中出现的峰的检测。
另外,明确可知的是,对上述记载以外的点在本发明的主旨的范围中适当进行变形、修正、追加也包括在本申请专利权利要求书中。
附图标记说明
1:液相色谱(LC)系统;10:LC测定部;11:数据分析部;110:数据收集部;111:峰检测处理部;112:图像生成部;113:峰位置估计部;114:模型存储部;115:峰信息修正处理部;116:峰決定部;117:定性/定量分析部;12:操作部;13:显示部;2:模型制作部;20:学习数据输入部;21:图像生成部;22:学习执行部;23:模型构建部。

Claims (10)

1.一种波形分析装置,对基于通过对试样进行规定的分析而得到的信号列的信号波形进行分析来求出与该信号波形上的峰相关联的信息,所述波形分析装置的特征在于,具备:
a)峰检测部,其使用已学习模型来估计包括在关于目标试样的信号波形中出现的一个或多个峰的起点的位置和终点的位置中的至少一方的峰信息,并且求出作为表示该估计的可靠度的指标值的准确度信息,所述已学习模型是通过使用峰的起点和终点已知的多个信号波形进行的机器学习预先构建出的;以及
b)显示处理部,其将所述峰检测部针对一个峰得到的一个或多个峰信息与各个准确度信息建立对应并与关于所述目标试样的信号波形一同显示于显示部的画面上。
2.根据权利要求1所述的波形分析装置,其特征在于,
还具备峰信息修正部,该峰信息修正部修正通过所述显示处理部显示于所述显示部的画面上的峰信息。
3.根据权利要求2所述的波形分析装置,其特征在于,
所述显示处理部将关于信号波形上的一个峰得到的多个峰信息中的一个峰信息设为最有力候选,并且以相对于该一个峰信息以外的峰信息即候选能够被识别的方式进行显示,
所述峰信息修正部包括供用户对除所述最有力候选之外的其它候选进行选择指示的指示部,并且所述峰信息修正部将由该指示部选择指示出的候选变更为最有力候选。
4.根据权利要求3所述的波形分析装置,其特征在于,
所述显示处理部将关于一个峰得到的多个峰信息中的准确度信息的值最大的峰信息设为最有力候选,并且至少与准确度信息的值第二大的峰信息即候选一同进行显示。
5.根据权利要求3所述的波形分析装置,其特征在于,
所述显示处理部将与关于一个峰得到的多个峰信息对应的准确度信息视作准确率,求出表示针对该多个峰信息中包括的峰的起点以及/或者终点的位置的准确率的分布的准确度分布,基于该准确度分布来决定所述最有力候选。
6.根据权利要求5所述的波形分析装置,其特征在于,
所述显示处理部求出包括如下的峰起点以及/或者终点的峰信息,并将其设为最有力候选,所述峰起点以及/或者终点位于在所述准确度分布中准确度信息的值最大的峰信息中包括的峰起点以及/或者终点的位置的附近且与该准确度信息的值为极大点的位置对应。
7.根据权利要求5所述的波形分析装置,其特征在于,
在所述准确度分布中存在多个凸部的情况下,所述显示处理部将分别包括与所述凸部各自的极大点中的规定个数的最大的极大点对应的峰的起点以及/或者终点的峰信息设为候选。
8.根据权利要求1所述的波形分析装置,其特征在于,
所述显示处理部从关于一个峰得到的多个峰信息之中选择如下的峰信息并进行显示,所述峰信息是同该峰信息对应的准确度信息的值与同基于通过关于相同的目标试样进行的分析得到的信号列或信号波形求出的关于相同的峰的峰信息对应的准确度信息的值之间的差异为规定以内的峰信息。
9.根据权利要求1所述的波形分析装置,其特征在于,
所述显示处理部同时显示基于通过对相同的目标试样进行多次分析得到的多个信号列或信号波形求出的关于相同的峰的多个峰信息和准确度信息。
10.根据权利要求1所述的波形分析装置,其特征在于,
所述显示处理部显示位于针对一个峰的多个峰信息的候选中的指标值最大的候选、或最有力候选的峰的起点以及/或者终点的附近且信号强度最低的位置来作为峰的起点以及/或者终点的最有力候选。
CN201780096535.5A 2017-11-09 2017-11-09 波形分析装置 Active CN111316095B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/040487 WO2019092837A1 (ja) 2017-11-09 2017-11-09 波形解析装置

Publications (2)

Publication Number Publication Date
CN111316095A CN111316095A (zh) 2020-06-19
CN111316095B true CN111316095B (zh) 2022-06-17

Family

ID=66438315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780096535.5A Active CN111316095B (zh) 2017-11-09 2017-11-09 波形分析装置

Country Status (4)

Country Link
US (1) US11486866B2 (zh)
JP (1) JP6872034B2 (zh)
CN (1) CN111316095B (zh)
WO (1) WO2019092837A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7001157B2 (ja) * 2018-05-30 2022-01-19 株式会社島津製作所 イメージング質量分析データ処理装置
WO2020129895A1 (ja) 2018-12-20 2020-06-25 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、及びプログラム
CN113711031B (zh) * 2019-05-08 2024-01-23 株式会社岛津制作所 分析装置
US11841373B2 (en) * 2019-06-28 2023-12-12 Canon Kabushiki Kaisha Information processing apparatus, method for controlling information processing apparatus, and program
WO2021064924A1 (ja) * 2019-10-02 2021-04-08 株式会社島津製作所 波形解析方法及び波形解析装置
JP7408136B2 (ja) * 2019-12-17 2024-01-05 東海電子株式会社 ガス分析システムおよびプログラム
JP7332045B2 (ja) * 2020-05-29 2023-08-23 株式会社島津製作所 データ処理装置、データ処理方法、データ処理プログラムおよび分析装置
CN111595992A (zh) * 2020-06-30 2020-08-28 浙江三青环保科技有限公司 一种在线气相色谱峰的快速寻峰方法
JP7463944B2 (ja) 2020-11-09 2024-04-09 株式会社島津製作所 波形処理支援装置および波形処理支援方法
US20230003699A1 (en) * 2021-06-30 2023-01-05 Fei Company Automated peak and baseline generation for chromatogram data

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06201673A (ja) * 1992-12-30 1994-07-22 Shimadzu Corp クロマトグラムのピーク検出方法
JP2008002895A (ja) * 2006-06-21 2008-01-10 Shimadzu Corp クロマトグラフ質量分析用データ処理装置
WO2008149436A1 (ja) * 2007-06-06 2008-12-11 Shimadzu Corporation 信号波形データ処理装置及び信号波形データのピーク検出結果補正方法
JP2009008582A (ja) 2007-06-29 2009-01-15 Shimadzu Corp クロマトグラムデータ処理装置
WO2016166861A1 (ja) * 2015-04-16 2016-10-20 株式会社島津製作所 クロマトグラムデータ処理装置及びプログラム
CN107615059B (zh) * 2015-05-19 2020-08-14 株式会社岛津制作所 色谱数据处理装置以及程序
WO2017046988A1 (en) * 2015-09-18 2017-03-23 Sony Corporation Information processing apparatus, information processing method, and information processing system
JP6790490B2 (ja) * 2015-09-18 2020-11-25 ソニー株式会社 情報処理装置、情報処理方法及び情報処理システム
CN108603867B (zh) * 2015-12-03 2020-11-06 株式会社岛津制作所 峰检测方法以及数据处理装置
US20190113487A1 (en) * 2016-04-13 2019-04-18 Shimadzu Corporation Data processing device and data processing method
WO2018207524A1 (ja) * 2017-05-07 2018-11-15 国立大学法人大阪大学 識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体

Also Published As

Publication number Publication date
CN111316095A (zh) 2020-06-19
WO2019092837A1 (ja) 2019-05-16
US20200292509A1 (en) 2020-09-17
US11486866B2 (en) 2022-11-01
JPWO2019092837A1 (ja) 2020-11-12
JP6872034B2 (ja) 2021-05-19

Similar Documents

Publication Publication Date Title
CN111316095B (zh) 波形分析装置
JP6992817B2 (ja) 波形解析装置
JP4951752B2 (ja) 易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造
JP6245387B2 (ja) 3次元スペクトルデータ処理装置及び処理方法
JP5211753B2 (ja) クロマトグラフ用データ処理装置
US20220128532A1 (en) Method for creating discriminator
CN113711031B (zh) 分析装置
JP5962845B2 (ja) クロマトグラムデータ処理装置及び処理方法
JP6060793B2 (ja) ピーク検出装置
JP6765877B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP7334788B2 (ja) 波形解析方法及び波形解析装置
JP2021117152A (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP6610782B2 (ja) ピーク検出方法及びデータ処理装置
CN109073613A (zh) 峰检测方法以及数据处理装置
JP2020153864A (ja) クロマトグラフのデータ処理装置、データ処理方法、およびクロマトグラフ
JP2023110159A (ja) 解析装置および解析方法
US20230280316A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
CN113640445B (zh) 基于图像处理的特征峰识别方法及计算设备、存储介质
US11946916B2 (en) Waveform processing assistance device and waveform processing assistance method
WO2022230162A1 (ja) 分析装置及び分析装置用波形処理プログラム
CN116805299A (zh) 电泳分析数据处理装置和非暂时性记录介质
JPH07151743A (ja) データ処理装置
JP2001021536A (ja) 電気泳動データ解析方法、電気泳動データ解析装置および電気泳動データ解析を実行するためのプログラムを記録した記録媒体
JP2012099046A (ja) 検査支援方法及び装置、並びに検査支援プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant