JP2020020785A - 分光モデルのクロスバリデーションベース較正 - Google Patents

分光モデルのクロスバリデーションベース較正 Download PDF

Info

Publication number
JP2020020785A
JP2020020785A JP2019120431A JP2019120431A JP2020020785A JP 2020020785 A JP2020020785 A JP 2020020785A JP 2019120431 A JP2019120431 A JP 2019120431A JP 2019120431 A JP2019120431 A JP 2019120431A JP 2020020785 A JP2020020785 A JP 2020020785A
Authority
JP
Japan
Prior art keywords
data set
model
spectral model
target
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019120431A
Other languages
English (en)
Other versions
JP7123866B2 (ja
JP2020020785A5 (ja
Inventor
ション チャンメン
Chang-Meng Hsiung
ション チャンメン
スン ラン
Lan Sun
スン ラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viavi Solutions Inc
Original Assignee
Viavi Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Viavi Solutions Inc filed Critical Viavi Solutions Inc
Publication of JP2020020785A publication Critical patent/JP2020020785A/ja
Publication of JP2020020785A5 publication Critical patent/JP2020020785A5/ja
Priority to JP2022128108A priority Critical patent/JP7387832B2/ja
Application granted granted Critical
Publication of JP7123866B2 publication Critical patent/JP7123866B2/ja
Priority to JP2023194386A priority patent/JP2024035237A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/27Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
    • G01N21/274Calibration, base line adjustment, drift correction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/02Details
    • G01J3/0275Details making use of sensor-related data, e.g. for identification of sensor parts or optical elements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • G01N2021/0106General arrangement of respective parts
    • G01N2021/0118Apparatus with remote processing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

【課題】医薬品の医療材料の含有成分(component ingredients)がその医療材料に関連する包装ラベルに対応するか否かを判定することができる医薬品の分光法を用いた品質管理方法を提供する。【解決手段】装置は、第1分光モデルのマスターデータセット160を受信し、第1分光モデルに関連するターゲット母集団164のターゲットデータセットを受信して第1分光モデルを更新し、マスターデータセットとターゲットデータセットからの第1データとを含むトレーニングデータセットを生成し、ターゲットデータセットからの第2データを含みマスターデータセットを含まないバリデーションデータセットを生成し、クロスバリデーションを用いると共にトレーニングデータセット及びバリデーションデータセットを用いて、第1分光モデルの更新である第2分光モデルを生成し、且つ第2分光モデルを提供することができる。【選択図】図1B

Description

[関連出願]
本願は、米国特許法第119条の下で、2018年6月29日に出願された「近赤外(NIR)スペクトルに基づく較正モデルの更新(UPDATING CALIBRATION MODELS BASED ON NEAR-INFRARED (NIR) SPECTRA)」と題する米国仮特許出願第62/692,248号の優先権を主張し、その内容の全体を参照により本明細書に援用する。
原料識別は、医薬品の品質管理に利用することができる。例えば、原料識別を医療材料で実行して、その医療材料の含有成分(component ingredients)がその医療材料に関連する包装ラベルに対応するか否かを判定することができる。同様に、原料定量化を実行して、特定の試料中の特定の化学物質の濃度を判定することができる。分光法は、他のケモメトリックス手法に比べて少ない準備及び短いデータ収集時間で非破壊的な原料識別及び/又は定量化を容易にすることができる。
いくつかの実施形態によれば、装置は、1つ又は複数のメモリと、1つ又は複数のメモリに通信可能に結合された1つ又は複数のプロセッサであり、第1分光モデルのマスターデータセットを受信し、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して第1分光モデルを更新し、マスターデータセットとターゲットデータセットからの第1データとを含むトレーニングデータセットを生成し、ターゲットデータセットからの第2データを含みマスターデータセットを含まないバリデーションデータセットを生成し、クロスバリデーションを用いると共にトレーニングデータセット及びバリデーションデータセットを用いて、第1分光モデルの更新である第2分光モデルを生成し、且つ第2分光モデルを提供するよう構成された、プロセッサとを含み得る。
いくつかの実施形態によれば、方法は、装置により第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信するステップと、装置によりターゲットデータセットの受信に基づき第1分光モデルのマスターデータセットを取得するステップと、装置によりクロスバリデーションを用いて最適部分最小二乗(PLS)因子を求めるステップであり、最適PLS因子は、それぞれがターゲットデータセットの各部分及びマスターデータセットの全部を含む複数のトレーニングデータセットと、それぞれがターゲットデータセットの各部分を含みマスターデータセットのデータを含まない複数のバリデーションデータセットとに基づき求められるステップと、装置によりターゲットデータセット及びマスターデータセットをマージしてマージ済みデータセットを生成するステップと、装置により、マージ済みデータセット及び最適PLS因子を用いて第2分光モデルを生成するステップであり、第2分光モデルは、第1分光モデルの更新であるステップと、装置により第2分光モデルを提供して第1分光モデルと置き換えるステップとを含み得る。
いくつかの実施形態によれば、非一時的なコンピュータ可読媒体が、1つ又は複数の命令を記憶し得る。1つ又は複数の命令は、装置の1つ又は複数のプロセッサにより実行されると、1つ又は複数のプロセッサに、第1分光モデルのマスターデータセットを受信させ、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信させて第1分光モデルを更新させ、マスターデータセット及びターゲットデータセットに基づき複数のトレーニングデータセットを生成させ、ターゲットデータセットに基づきマスターデータセットのデータを含まない複数のバリデーションデータセットを生成させ、複数のトレーニングデータセット及び複数のバリデーションデータセットに基づき且つクロスバリデーションを用いてモデル設定を求めさせ、モデル設定、ターゲットデータセット、及びマスターデータセットに基づき第2分光モデルを生成させ、且つ第2分光モデルを提供させることができる。
本明細書に記載の例示的な実施形態の概略図である。 本明細書に記載の例示的な実施形態の概略図である。 本明細書に記載の例示的な実施形態の概略図である。 本明細書に記載の例示的な実施形態の概略図である。 本明細書に記載の例示的な実施形態の概略図である。 本明細書に記載のシステム及び/又は方法が実施され得る例示的な環境の図である。 図2の1つ又は複数の装置の例示的なコンポーネントの図である。 分光モデルのクロスバリデーションベース較正の例示的なプロセスのフローチャートである。 分光モデルのクロスバリデーションベース較正の例示的なプロセスのフローチャートである。 分光モデルのクロスバリデーションベース較正の例示的なプロセスのフローチャートである。
以下の実施例の詳細な説明では、添付図面を参照する。異なる図において同一の参照符号は、同一又は同様の要素を示し得る。以下の説明では、分光計を例として用いるが、本明細書に記載の較正原理、手順、及び方法は、限定はされないが他の光センサ及び分光センサを含む、任意のセンサと共に用いることができる。
原料識別(RMID)は、識別、検証等のために特定の試料の成分(例えば、含有成分)を識別するために利用される手法である。例えば、RMIDを利用して、医薬品材料の含有成分がラベルで確認される一組の含有成分に対応することを検証することができる。同様に、原材料定量化は、特定の試料中の特定の材料の濃度の判定等、特定の試料で定量分析を実行するために利用される手法である。分光計を利用して試料(例えば、医薬品材料)で分光法を実行し、試料の成分、試料の成分の濃度等を判定することができる。分光計は、試料の測定値セットを求めることができ、その測定値セットを分光判定(spectroscopic determination)のために提供することができる。分光分類手法(例えば、クラシファイア)は、試料の測定値セットに基づく試料の成分の判定を容易にすることができる。
分光分類又は定量化を実行するために、分光モデルを用いて未知試料の1つ又は複数の測定値を評価することができる。例えば、制御装置が、未知試料の1つ又は複数の測定値を分光モデルの特定のクラス、分光モデルに関連する特定のレベル及び/又は量等に対応するものとして分類することを試みることができる。しかしながら、原材料が経時変化し得る結果として、分光モデルが不正確になり得る。例えば、農産物に適用される分光分類に関しては、収穫年及びそれに関連する収穫量が異なればスペクトルも異なり得る。結果として、マスターデータセット(例えば、初期時点の初期母集団の初期分光測定セット)でトレーニングした分光モデルは、ターゲットデータセット(例えば、後続時点の後続母集団の後続分光測定セット)に適用した場合に不正確であり得る。
別の場合では、分光計毎のマスターデータセットを用いて分光計毎の分光モデルをトレーニングするのは非現実的であり得る。結果として、制御装置は、マスターデータセットで単一の分光モデルをトレーニングし、多くの異なる分光計で用いるためにその単一の分光モデルを展開し得る。しかしながら、分光計が異なれば、関連する較正及び/又は動作の環境条件が異なり得る。結果として、第1分光計により実行された分光測定のマスターデータセットを用いてトレーニングされた分光モデルは、第2分光計により実行された分光測定のターゲットデータセットに適用された場合に不正確であり得る。
本明細書に記載のいくつかの実施形態は、クロスバリデーション手法を用いた分光モデルの較正更新及び較正移行を可能にする。例えば、ターゲットデータセットからのデータをマスターデータセットからのデータとマージして、新たな分光モデルの生成を可能にすることができる。この場合、マスターデータセットからのデータは、分光モデルのトレーニング用のトレーニングセットに用いられ、ターゲットデータセットからのデータは、トレーニングセット及び分光モデルのバリデーション用のバリデーションセットの両方に用いられる。このように、モデル生成及び/又はモデル更新のための他の手法に比べて、分光モデルの精度が改善される。さらに、移行された分光モデルの精度の改善に基づき、分光計毎にマスターデータセットを取得する必要が減ることにより、分光計の展開に関連する費用が減る。
図1A〜図1Eは、本明細書に記載の例示的な実施形態100の図である。図1Aに示すように、例示的な実施形態100は、第1分光計102及び第1制御装置104を含む。
図1Aに参照符号150でさらに示すように、第1制御装置104は、第1分光計120に命令を送信して第1分光計120にマスター母集団152で分光測定セットを実行させることができる。例えば、第1制御装置104は、分類モデルを用いて分類すべき各クラス、定量化モデルを用いて定量化すべき各量等について、第1分光計120に試料の測定を実行させることができる。分類モデルのクラスは、(薬学関連で)ラクトース物質、フルクトース物質、アセトアミノフェン物質、イブプロフェン物質、アスピリン物質等、1つ又は複数の特徴を共有する類似材料のグループ化を指し得る。分類モデルのトレーニングに用いられる材料であって、分類モデルを用いて原料識別を実行すべき材料は、関心材料(materials of interest)と称され得る。
図1Aに参照符号154及び156でさらに示すように、第1分光計102は、分光測定セットを実行することができると共に、処理のために分光測定値セットを第1制御装置104に提供することができる。例えば、第1分光計102は、マスター母集団152の各試料のスペクトルを求め、第1制御装置104が未知試料を定量化モデル用の関心材料の1つとして又は定量化モデルに関して特定の量を有するものとして分類するためのクラスのセットを生成することを可能にし得る。
図1Aに参照符号158でさらに示すように、第1制御装置104は、マスターデータセットに基づき第1分光モデルを生成することができる。例えば、第1制御装置104は、特定の判定手法を用いて、分光測定値セットに基づき、第1分光モデルを生成することができる。いくつかの実施形態では、第1制御装置104は、サポートベクターマシン(SVM)手法(例えば、情報判定に関する機械学習手法)を用いて定量化モデルを生成することができる。追加として又は代替として、第1制御装置104は、別のタイプの定量化手法を用いて定量化モデルを生成することができる。
定量化モデルは、特定のスペクトルを関心材料の特定の量クラスに割り当てることに関連する情報を含み得る。いくつかの実施形態では、定量化モデルは、特定の量クラスに関連する関心材料のタイプの識別に関連する情報を含み得る。このように、第1制御装置104は、未知試料のスペクトルを定量化モデルの特定の量クラスに割り当てることに基づき、分光法の出力として未知試料の材料の量を識別する情報を提供することができる。
図1Bに参照符号160で示すように、第2制御装置104が、第1分光モデルに関連する情報を受信することができる。例えば、第2制御装置104は、第1分光モデル、マスターデータセット等を受信することができる。いくつかの実施形態では、第2制御装置104は、第1制御装置104とは異なる分光計に関連し得る。例えば、較正移行の場合、第2制御装置104は、第2分光計102(例えば、ターゲット分光計)に関連して用いることができると共に、第1分光モデルに関連する情報を受信して第1分光計102(例えば、マスター分光計)から第2分光計102への較正移行を可能にすることができる。この場合、本明細書でより詳細に説明するように、第2制御装置104及び第2分光計102は、ターゲット母集団の測定を実行して第2分光モデルを生成することができる。代替的に、較正更新の場合、本明細書でより詳細に説明するように、第1分光モデルを第2制御装置104に移行させるのではなく、第1制御装置104及び第1分光計102がターゲット母集団の測定を実行して第2分光モデルを生成し得る。
図1Bに参照符号162でさらに示すように、第2制御装置104は、第2分光計102に命令を送信して第2分光計120にターゲット母集団164の分光測定セットを実行させることができる。例えば、第2制御装置104は、第1分光モデルの受信に基づき第2分光計102にターゲット母集団164の分光測定を実行させることができる。いくつかの実施形態では、第2制御装置104は、第1分光モデルの更新又は較正を決定することができると共に、分光測定セットを実行するよう第2分光計102をトリガすることができる。この場合、第2制御装置104は、第2分光モデルの生成を可能にするために第1制御装置104と通信してマスターデータセットを識別する情報を取得することができる。
いくつかの実施形態では、ターゲット母集団164は、マスター母集団152に対応し得る。例えば、ターゲット母集団164は、マスター母集団152に含まれるのと同じクラスの追加試料であり得る。この場合、ターゲット母集団164は、試料を収集又は測定した時間、場所、環境条件等に関してマスター母集団152とは異なり得る。追加として又は代替として、ターゲット母集団164は、異なる分光計を用いて測定されること(例えば、マスター母集団152のように第1分光計102ではなく第2分光計102により測定されること)に基づき、マスター母集団152とは異なり得る。
図1Bに参照符号166及び168でさらに示すように、第2分光計102は、分光測定セットを実行することができると共に、分光測定セットを識別する情報を第2制御装置104に提供することができる。例えば、第2分光計102は、ターゲット母集団164の分光測定を実行することができると共に、(例えば、ターゲットデータセットとして)分光測定を識別する情報を処理のために第2制御装置104に提供することができる。
図1Cに参照符号170で示すように、第2制御装置104は、総合性能メトリック(total performance metric)を求めることができる。例えば、第2制御装置104は、データを複数フォールドに分割し、その複数フォールドに関する複数の性能メトリックを求め、その複数の性能メトリックを集約して二乗平均誤差(RMSE)値を求め、且つRMSE値を最小化するよう部分最小二乗(PLS)因子を最適化(最適PLS因子と称され得る)ことに基づき、総合性能メトリックを求めることができる。フォールドは、候補モデルを生成するためのトレーニングセットと予測データにおける候補モデルの精度を評価するためのバリデーションセットとを含むクロスバリデーション用のデータのサブグループを指し得る。別の例では、第2制御装置104は、主成分回帰(PCR)因子、サポートベクター回帰(SVR)因子等に関するモデル設定等の別のタイプの最適化されたモデル設定を求めることができる。いくつかの実施形態では、第2制御装置104は、前処理最適化を実行することができる。例えば、第2制御装置104は、モデル設定の一部として最適化された前処理パラメータを求めることができる。
いくつかの実施形態では、第2制御装置104は、フォールド毎にデータをトレーニングセット又はバリデーションセットに割り当てることができる。例えば、第2制御装置104は、N個のフォールドについて複数のトレーニングセット1〜Nと、N個のフォールドについて複数の対応するバリデーションセット1〜Nとを求めることができる。いくつかの実施形態では、トレーニングセットは、マスターデータセット及びターゲットデータセットをマージすることにより生成されるマージ済みデータを含み得る。例えば、トレーニングセット(例えば、トレーニングセット1)が、マスターデータセットからの全データ(例えば、MDS)とターゲットデータセットからのデータの一部(例えば、TDS1,TS)とを含み得る。この場合、対応するバリデーションセットは、ターゲットデータセットからのデータの対応部分(例えば、TDS1,TS)を含み、マスターデータセットからのデータを含まない。対応するバリデーションセットは、トレーニングセットに含まれるのと同じ物理的試料の反復走査から得られたデータを省くことができる。
データを複数のフォールドに割り当てることに基づき、第2制御装置104は、フォールド毎の性能メトリックを求めることができる。例えば、第2制御装置104は、フォールド毎の性能メトリックを集約して総合性能メトリックを求めることができる。例えば、第2制御装置104は、フォールド毎にPLS因子を求めることができると共に、フォールド毎のPLS因子毎にRMSEを求めることができる。フォールド毎のPLS因子毎にRMSE値を求めることに基づき、第2制御装置104は、総RMSE値を求めることができる。例えば、第2制御装置104は、全部のフォールドの全部のPLS因子の関数としてRMSE値を求めることができる。この場合、総RMSE値を求めることに基づき、第2制御装置104は、最低RMSE値を有するPLS因子であり得る最適PLS因子を求めることができる。
この場合、クロスバリデーション中のNフォールドトレーニングセットにマスターデータセット及びターゲットデータセットを含むが対応するバリデーションセットにはターゲットデータセットしか含まないことに基づき、他の手法に比べて第2分光モデルの精度が高まる。例えば、このような手法では、更新なしで第1分光モデルを用いること、ターゲットデータセットのみを用いてPLS性能メトリックを求めること、ターゲットデータセットの全データ及びマスターデータセットの全データをマージしてマージ済みデータセットを生成し、トレーニングセット及びバリデーションセットの両方でマージ済みデータセットの分割を用いること等に比べて、精度の向上を得ることができる。
図1Dに参照符号172で示すように、第2制御装置104は、第2分光モデルを生成することができる。例えば、第2制御装置104は、マスターデータセット(MDS)、ターゲットデータセット(TDS)、及び最適PLS因子を用いて第2分光モデルを生成することができる。このように、第2制御装置104は、較正分光モデル、更新分光モデル、移行分光モデル等の生成を可能にし得る。
いくつかの実施形態では、第2制御装置104は、マスターデータセット及びターゲットデータセットをマージしてマージ済みデータセット(例えば、第2分光モデルのトレーニング用の最終トレーニングセット)を生成することができる。例えば、第2制御装置104は、マスターデータセット及びターゲットデータセットを集約してマージ済みデータセットを生成することができる。マージ済みデータセットの生成に基づき、第2制御装置104は、マージ済みデータセット及び最適PLS因子(例えば、最低RMSE値を有する)を用いて第2分光モデルを生成することができる。例えば、第2制御装置104は、定量化モデル生成手法を用いて、マージ済みデータセット(例えば、第2分光モデルのトレーニングセットであり得る)及び最適PLS因子に関連して第2分光モデルを生成することができる。このように、マージ済みデータセットを用いずに最適PLS因子を求めてから最適PLS因子をマージ済みデータセットと結合することにより、制御装置104は、他の手法よりも正確な分光モデルを得る。
いくつかの実施形態では、第2制御装置104は、第2分光モデルの生成に基づき第2分光モデルを提供することができる。例えば、第2制御装置104は、データ構造を介した記憶、1つ又は複数の他の分光計での展開等のために第2分光モデルを提供することができる。追加として又は代替として、第2制御装置104は、第2分光モデルの生成に基づき第2分光モデルに関する出力を提供することができる。例えば、本明細書でより詳細に説明するように、第2制御装置104は、未知試料を分析するために第2分光モデルの使用に基づき未知試料を定量する情報を提供することができる。
図1Eに参照符号174で示すように、第2制御装置104は、第2分光計102に命令を送信して第2分光計102に未知試料176で分光測定セットを実行させることができる。例えば、第2制御装置104は、第2分光モデルの生成後に、第2分光計104に未知試料176で分光測定を実行させることができる。
図1Eに参照符号178及び180でさらに示すように、第2分光計102は、分光測定セットを実行することができると共に、分光測定セットを識別する情報を第2制御装置104に提供することができる。例えば、第2分光計102は、未知試料176のスペクトルを求めることができると共に、分類及び/又は定量化のためにスペクトルを識別する情報を第2制御装置104に提供することができる。
図1Eに参照符号182でさらに示すように、第2制御装置104は、第2分光モデルを用いて分光測定セットの分光分析を実行することができる。例えば、第2制御装置104は、第2分光モデルを用いて未知試料176の分類及び/又は未知試料176の定量化を判定することができる。この場合、第2制御装置104は、分類及び/又は定量化を識別する出力を提供することができる。このように、第2制御装置104は、第2分光モデルの生成に基づき第2分光モデルを用いる。
上記のように、図1A〜図1Eは、1つ又は複数の例として提供されているにすぎない。他の例は、図1A〜図1Eに関して説明したものとは異なり得る。
図2は、本明細書に記載のシステム及び/又は方法を実施し得る例示的環境200の図である。図2に示すように、環境200は、制御装置210、分光計220、ネットワーク230等を含み得る。環境200の装置は、有線接続、無線接続、又は有線及び無線接続の組み合わせを介して相互接続し得る。
制御装置210は、分光分類に関連する情報の記憶、処理、及び/又はルーティングが可能な1つ又は複数の装置を含む。例えば、制御装置210は、トレーニングセットの測定セットに基づき分光モデル(例えば、分類モデル又は定量化モデル)を生成し、バリデーションセットの測定セットに基づき分光モデルを検証し、且つ/又は分光モデルを利用して未知試料の測定セットに基づき分光分析を実行する、サーバ、コンピュータ、ウェアラブルデバイス、クラウドコンピューティングデバイス等を含み得る。いくつかの実施形態では、制御装置210は、特定の分光計220と関連し得る。いくつかの実施形態では、制御装置210は、複数の分光計220と関連し得る。いくつかの実施形態では、制御装置210は、分光計220等の環境200内の別の装置から情報を受信し且つ/又はこれに情報を送信し得る。
分光計220は、試料で分光測定を実行することが可能な1つ又は複数の装置を含む。例えば、分光計220は、分光法(例えば、近赤外(NIR)分光法、中赤外分光(mid−IR)、ラマン分光法等の振動分光法)を実行する分光装置を含み得る。いくつかの実施形態では、分光計220は、ウェアラブル分光計等のウェアラブルデバイスに組み込むことができる。いくつかの実施形態では、分光計220は、制御装置210等の環境200内の別の装置から情報を受信し且つ/又はこれに情報を送信することができる。
ネットワーク230は、1つ又は複数の有線及び/又は無線ネットワークを含む。例えば、ネットワーク230は、セルラーネットワーク(例えば、ロングタームエボリューション(LTE)ネットワーク、3Gネットワーク、符号分割多重アクセス(CDMA)ネットワーク等)、公衆陸上移動体ネットワーク(PLMN)、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、電話網(例えば、公衆交換電話網(PSTN))、プライベートネットワーク、アドホックネットワーク、イントラネット、インターネット、光ファイバネットワーク(fiber optic-based network)、クラウドコンピューティングネットワーク等、及び/又はこれら若しくは他のタイプのネットワークの組み合わせを含み得る。
図2に示す装置及びネットワークの数及び配置は、1つ又は複数の例として挙げたものである。実際には、図2に示すものに比べて追加の装置及び/又はネットワーク、より少ない装置及び/又はネットワーク、異なる装置及び/又はネットワーク、又は異なる配置の装置及び/又はネットワークがあってもよい。さらに、図2に示す2つ以上の装置を単一の装置内で実施してもよく、又は図2に示す単一の装置を複数の分散した装置として実施してもよい。追加として又は代替として、環境200の装置セット(例えば、1つ又は複数の装置)が、環境200の別の装置セットにより実行されると記載されている1つ又は複数の機能を実行してもよい。
図3は、装置300の例示的なコンポーネントの図である。装置300は、制御装置210及び/又は分光計220に対応し得る。いくつかの実施形態では、制御装置210及び/又は分光計220が、1つ又は複数の装置300及び/又は装置300の1つ又は複数のコンポーネントを含み得る。図3に示すように、装置300は、バス310、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、及び通信インタフェース370を含み得る。
バス310は、装置300の複数のコンポーネント間の通信を可能にするコンポーネントを含む。プロセッサ320は、ハードウェア、ファームウェア、及び/又はハードウェア及びソフトウェアの組み合わせで実装される。プロセッサ320は、セントラルプロセッシングユニット(CPU)、グラフィックスプロセッシングユニット(GPU)、アクセラレーテッドプロセッシングユニット(APU)、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、又は別のタイプの処理コンポーネントである。いくつかの実施形態では、プロセッサ320は、機能を実行するようプログラム可能な1つ又は複数のプロセッサを含む。メモリ330は、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、及び/又はプロセッサ320が使用するための情報及び/又は命令を記憶する別のタイプのダイナミック又はスタティックストレージデバイス(例えば、フラッシュメモリ、磁気メモリ、及び/又は光メモリ)を含む。
ストレージコンポーネント340は、装置300の動作及び使用に関する情報及び/又はソフトウェアを記憶する。例えば、ストレージコンポーネント340は、ハードディスク(例えば、磁気ディスク、光ディスク、及び/又は光磁気ディスク)、ソリッドステートドライブ(SSD)、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)、フロッピーディスク、カートリッジ、磁気テープ、及び/又は別のタイプの非一時的なコンピュータ可読媒体を、対応するドライブと共に含み得る。
入力コンポーネント350は、装置300がユーザ入力(例えば、タッチスクリーンディスプレイ、キーボード、キーパッド、マウス、ボタン、スイッチ、及び/又はマイクロフォン)等を介して情報を受信することを可能にするコンポーネントを含む。追加として又は代替として、入力コンポーネント350は、場所を判定するコンポーネント(例えば、全地球測位システム(GPS)コンポーネント)及び/又はセンサ(例えば、加速度計、ジャイロスコープ、アクチュエータ、別のタイプの位置又は環境センサ等)を含み得る。出力コンポーネント360は、装置300からの出力情報を(例えば、ディスプレイ、スピーカ、触覚フィードバックコンポーネント、聴覚又は視覚インジケータ等を介して)提供するコンポーネントを含む。
通信インタフェース370は、装置300が有線接続、無線接続、又は有線及び無線接続の組み合わせ等を介して他の装置と通信することを可能にする送受信機のようなコンポーネント(例えば、送受信機、別個の受信器、別個の送信器等)を含む。通信インタフェース370は、装置300が別の装置から情報を受信し且つ/又は別の装置に情報を提供することを可能にし得る。例えば、通信インタフェース370は、イーサネットインタフェース、光インタフェース、同軸インタフェース、赤外線インタフェース、無線周波数(RF)インタフェース、ユニバーサルシリアルバス(USB)インタフェース、Wi−Fiインタフェース、セルラーネットワークインタフェース等を含み得る。
装置300は、本明細書に記載の1つ又は複数のプロセスを実行し得る。装置300は、プロセッサ320がメモリ330及び/又はストレージコンポーネント340等の非一時的なコンピュータ可読媒体により記憶されたソフトウェア命令を実行することに基づき、これらのプロセスを実行し得る。本明細書において、「コンピュータ可読媒体」という用語は、非一時的なメモリデバイスを指す。メモリデバイスは、単一の物理ストレージデバイス内のメモリ空間又は複数の物理ストレージデバイスに広がるメモリ空間を含む。
ソフトウェア命令は、別のコンピュータ可読媒体又は別の装置から通信インタフェース370を介して入力メモリ330及び/又はストレージコンポーネント340に読み込むことができる。実行されると、メモリ330及び/又はストレージコンポーネント340に記憶されたソフトウェア命令は、プロセッサ320に本明細書に記載の1つ又は複数のプロセスを実行させることができる。追加として又は代替として、ハードウェア回路をソフトウェア命令の代わりに又はソフトウェア命令と組み合わせて用いて、本明細書に記載の1つ又は複数のプロセスを実行してもよい。したがって、本明細書に記載の実施形態は、ハードウェア回路及びソフトウェアのいかなる特定の組み合わせにも限定されない。
図3に示すコンポーネントの数及び配置は、一例として挙げたものである。実際には、装置300は、図3に示すものに比べて追加のコンポーネント、より少ないコンポーネント、異なるコンポーネント、又は異なる配置のコンポーネントを含んでいてもよい。追加として又は代替として、装置300のコンポーネントのセット(例えば、1つ又は複数のコンポーネント)が、装置300の別のコンポーネントのセットにより実行されると記載されている1つ又は複数の機能を実行してもよい。
図4は、分光モデルのクロスバリデーションベース較正の例示的なプロセス400のフローチャートである。いくつかの実施形態では、図4の1つ又は複数のブロックが制御装置(例えば、制御装置210)により実行され得る。いくつかの実施形態では、図4の1つ又は複数のブロックが、制御装置とは別個の又は制御装置を含む、分光計(例えば、分光計220)等の別の装置又は装置群により実行され得る。
図4に示すように、プロセス400は、第1分光モデルのマスターデータセットを受信するステップを含み得る(ブロック410)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第1分光モデルのマスターデータセットを受信し得る。
図4にさらに示すように、プロセス400は、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して第1分光モデルを更新するステップを含み得る(ブロック420)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して第1分光モデルを更新し得る。
図4にさらに示すように、プロセス400は、マスターデータセットとターゲットデータセットからの第1データとを含むトレーニングデータセットを生成するステップを含み得る(ブロック430)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、マスターデータセットとターゲットデータセットからの第1データとを含むトレーニングデータセットを生成し得る。
図4にさらに示すように、プロセス400は、ターゲットデータセットからの第2データを含みマスターデータセットを含まないバリデーションデータセットを生成するステップを含み得る(ブロック440)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、ターゲットデータセットからの第2データを含みマスターデータセットを含まないバリデーションデータセットを生成し得る。
図4にさらに示すように、プロセス400は、クロスバリデーションを用いると共にトレーニングデータセット及びバリデーションデータセットを用いて、第1分光モデルの更新である第2分光モデルを生成するステップを含み得る(ブロック450)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、クロスバリデーションを用いると共にトレーニングデータセット及びバリデーションデータセットを用いて、第1分光モデルの更新である第2分光モデルを生成し得る。
図4にさらに示すように、プロセス400は、第2分光モデルを提供するステップを含み得る(ブロック460)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第2分光モデルを提供し得る。
プロセス400は、以下に記載され且つ/又は本明細書の他の箇所に記載の1つ又は複数の他のプロセスに関連して記載された任意の単一の実施形態又は実施形態の任意の組み合わせ等の、さらなる実施形態を含み得る。
第1実施形態では、プロセス400は、分光測定値を受信するステップと、第2分光モデルを用いて分光判定を実行するステップと、分光判定を識別する出力を提供するステップとを含む。
単独の又は第1実施形態と組み合わせた第2実施形態では、トレーニングデータセットは複数のトレーニングデータセットであり、バリデーションデータセットは複数のバリデーションデータセットであり、プロセス400は、複数のトレーニングデータセット及び複数のバリデーションデータセットに基づき複数の性能メトリックを生成するステップと、複数の性能メトリックに基づき総合性能メトリックを求めるステップと、総合性能メトリックに基づき最適部分最小二乗(PLS)因子を求めるステップと、最適PLS因子及びマージ済みデータセットに基づき第2分光モデルを求めるステップとを含み、マージ済みデータセットは、マスターデータセット及びターゲットデータセットを含む。
単独の又は第1及び第2実施形態の一方又は両方と組み合わせた第3実施形態では、第1分光モデル及び第2分光モデルは定量化モデルである。
単独の又は第1〜第3実施形態の1つ又は複数と組み合わせた第4実施形態では、マスターデータセットは、マスター分光計により実行された第1分光測定セットに基づき、ターゲットデータセットは、マスター分光計とは異なるターゲット分光計により実行された第2分光測定セットに基づく。
単独の又は第1〜第4実施形態の1つ又は複数と組み合わせた第5実施形態では、マスターデータセットは、特定の分光計により実行された第1分光測定セットに基づき、ターゲットデータセットは、特定の分光計により実行された第2分光測定セットに基づく。
図4は、プロセス400の例示的なブロックを示しているが、いくつかの実施形態では、プロセス400は、図4に示すものに比べて追加のブロック、より少ないブロック、異なるブロック、又は異なる配置のブロックを含んでいてもよい。追加として又は代替として、プロセス400のブロックのうち2つ以上を並行して実行してもよい。
図5は、分光モデルのクロスバリデーションベース較正の例示的なプロセス500のフローチャートである。いくつかの実施形態では、図5の1つ又は複数のプロセスブロックが制御装置(例えば、制御装置210)により実行され得る。いくつかの実施形態では、図5の1つ又は複数のブロックプロセスが、制御装置とは別個の又は制御装置を含む、分光計(例えば、分光計220)等の別の装置又は装置群により実行され得る。
図5に示すように、プロセス500は、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信するステップを含み得る(ブロック510)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信し得る。
図5にさらに示すように、プロセス500は、ターゲットデータセットの受信に基づき第1分光モデルのマスターデータセットを取得するステップを含み得る(ブロック520)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、ターゲットデータセットの受信に基づき第1分光モデルのマスターデータセットを取得し得る。
図5にさらに示すように、プロセス500は、クロスバリデーションを用いて最適部分最小二乗(PLS)因子を求めるステップであり、最適PLS因子は、それぞれがターゲットデータセットの各部分及びマスターデータセットの全部を含む複数のトレーニングデータセットと、それぞれがターゲットデータセットの各部分を含みマスターデータセットのデータを含まない複数のバリデーションデータセットとに基づき求められるステップを含み得る(ブロック530)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、クロスバリデーションを用いて最適部分最小二乗(PLS)因子を求め得る。いくつかの態様では、最適PLS因子は、それぞれがターゲットデータセットの各部分及びマスターデータセットの全部を含む複数のトレーニングデータセットと、それぞれがターゲットデータセットの各部分を含みマスターデータセットのデータを含まない複数のバリデーションデータセットとに基づき求められる。
図5にさらに示すように、プロセス500は、ターゲットデータセット及びマスターデータセットをマージしてマージ済みデータセットを生成するステップを含み得る(ブロック540)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、ターゲットデータセット及びマスターデータセットをマージしてマージ済みデータセットを生成し得る。
図5にさらに示すように、プロセス500は、マージ済みデータセット及び最適PLS因子を用いて、第1分光モデルの更新である第2分光モデルを生成するステップを含み得る(ブロック550)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、マージ済みデータセット及び最適PLS因子を用いて第2分光モデルを生成し得る。いくつかの態様では、第2分光モデルは第1分光モデルの更新である。
図5にさらに示すように、プロセス500は、第2分光モデルを提供して第1分光モデルと置き換えるステップを含み得る(ブロック560)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第2分光モデルを提供して第1分光と置き換え得る。
プロセス500は、以下に記載され且つ/又は本明細書の他の箇所に記載の1つ又は複数の他のプロセスに関連して記載された任意の単一の実施形態又は実施形態の任意の組み合わせ等の、さらなる実施形態を含み得る。
第1実施形態では、最適化PLS因子を求めるステップは、複数のトレーニングデータセットのそれぞれ及び複数のバリデーションデータセットのそれぞれについて部分最小二乗(PLS)性能メトリックを求めるステップと、PLS性能メトリックに基づき総合PLS性能メトリックを求めるステップと、総合PLS性能メトリックに基づき第2分光モデルのPLS因子を最適化するステップとを含む。
単独の又は第1実施形態と組み合わせた第2実施形態では、総合PLS性能メトリックは、二乗平均誤差(RMSE)値に関連し、PLS因子を最適化するステップは、RMSE値を最小化するようPLS因子を最適化するステップを含む。
単独の又は第1及び第2実施形態の一方又は両方と組み合わせた第3実施形態では、複数のバリデーションデータセットは、複数のトレーニングデータセットとは異なるターゲットデータセットのデータを含む。
単独の又は第1〜第3実施形態の1つ又は複数と組み合わせた第4実施形態では、総合PLS性能メトリックを求めるステップは、PLS性能メトリックを集約するステップを含む。
単独の又は第1〜第4実施形態の1つ又は複数と組み合わせた第5実施形態では、ターゲットデータセットは、マスターデータセットに関連する測定後に実行されたターゲット母集団の測定セットに関連する。
単独の又は第1〜第5実施形態の1つ又は複数と組み合わせた第6実施形態では、第2分光モデルは、第1分光モデルの較正更新モデルである。
単独の又は第1〜第6実施形態の1つ又は複数と組み合わせた第7実施形態では、ターゲットデータセットは、マスターデータセットに関連する測定を実行した1つ又は複数の分光計とは異なる特定の分光計により実行された測定セットに関連する。
単独の又は第1〜第7実施形態の1つ又は複数と組み合わせた第8実施形態では、第2分光モデルは、第1分光モデルの較正移行モデルである。
単独の又は第1〜第8実施形態の1つ又は複数と組み合わせた第9実施形態では、第2分光モデルを提供するステップは、特定の分光計による後続の測定に関連して用いるための第2分光モデルを提供するステップを含む。
図5は、プロセス500の例示的なブロックを示しているが、いくつかの実施形態では、プロセス500は、図5に示すものに比べて追加のブロック、より少ないブロック、異なるブロック、又は異なる配置のブロックを含んでいてもよい。追加として又は代替として、プロセス500のブロックのうち2つ以上を並行して実行してもよい。
図6は、分光モデルのクロスバリデーションベース較正の例示的なプロセス600のフローチャートである。いくつかの実施形態では、図6の1つ又は複数プロセスブロックが制御装置(例えば、制御装置210)により実行され得る。いくつかの実施形態では、図6の1つ又は複数のプロセスブロックが、制御装置とは別個の又は制御装置を含む、分光計(例えば、分光計220)等の別の装置又は装置群により実行され得る。
図6に示すように、プロセス600は、第1分光モデルのマスターデータセットを受信するステップと、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して第1分光モデルを更新するステップと、マスターデータセット及びターゲットデータセットに基づき複数のトレーニングデータセットを生成するステップと、ターゲットデータセットに基づきマスターデータセットのデータを含まない複数のバリデーションデータセットを生成するステップとを含み得る(ブロック610)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第1分光モデルのマスターデータセットを受信し、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して第1分光モデルを更新し、マスターデータセット及びターゲットデータセットに基づき複数のトレーニングデータセットを生成し、ターゲットデータセットに基づきマスターデータセットのデータを含まない複数のバリデーションデータセットを生成し得る。いくつかの態様では、複数のバリデーションデータセットはマスターデータセットのデータを含まない。
図6に示すように、プロセス600は、第1分光モデルのマスターデータセットを受信するステップを含み得る(ブロック610)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第1分光モデルのマスターデータセットを受信し得る。
図6に示すように、プロセス600は、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して第1分光モデルを更新するステップを含み得る(ブロック620)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して第1分光モデルを更新し得る。
図6に示すように、プロセス600は、マスターデータセット及びターゲットデータセットに基づき複数のトレーニングデータセットを生成するステップを含み得る(ブロック630)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、マスターデータセット及びターゲットデータセットに基づき複数のトレーニングデータセットを生成し得る。
図6に示すように、プロセス600は、ターゲットデータセットに基づきマスターデータセットのデータを含まない複数のバリデーションデータセットを生成するステップを含み得る(ブロック640)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、ターゲットデータセットに基づき複数のバリデーションデータセットを生成し得る。いくつかの態様では、複数のバリデーションデータセットはマスターデータセットのデータを含まない。
図6にさらに示すように、プロセス600は、複数のトレーニングデータセット及び複数のバリデーションデータセットに基づき且つクロスバリデーションを用いてモデル設定を求めるステップを含み得る(ブロック650)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、複数のトレーニングデータセット及び複数のバリデーションデータセットに基づきモデル設定を求め得る。
図6にさらに示すように、プロセスは、モデル設定、ターゲットデータセット、及びマスターデータセットに基づき第2分光モデルを生成するステップを含み得る(ブロック660)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、モデル設定、ターゲットデータセット、及びマスターデータセットに基づき第2分光モデルを生成し得る。
図6にさらに示すように、プロセス600は、第2分光モデルを提供するステップを含み得る(ブロック670)。例えば、上述のように、制御装置は(例えば、プロセッサ320、メモリ330、ストレージコンポーネント340、入力コンポーネント350、出力コンポーネント360、通信インタフェース370等を用いて)、第2分光モデルを提供し得る。
プロセス600は、以下に記載され且つ/又は本明細書の他の箇所に記載の1つ又は複数の他のプロセスに関連して記載された任意の単一の実施形態又は実施形態の任意の組み合わせ等の、さらなる実施形態を含み得る。
第1実施形態では、モデル設定は、PLSモデルの部分最小二乗(PLS)因子、主成分回帰(PCR)モデルの成分の量、サポートベクター回帰(SVR)モデルのSVRパラメータ、又は前処理設定の少なくとも1つである。
単独の又は第1実施形態と組み合わせた第2実施形態では、プロセス600は、複数のトレーニングデータセットのそれぞれ及び複数のバリデーションデータセットの対応するバリデーションデータセットについて複数の部分性能メトリックを生成するステップと、複数の部分性能メトリックを集約して総合性能メトリックを生成するステップと、総合性能メトリックの誤差値を最小化するモデル設定を求めるステップとを含む。
単独の又は第1実施形態及び第2実施形態の一方又は両方と組み合わせた第3実施形態では、プロセス600は、測定に基づき且つ第2分光モデルを用いて分光判定を実行するステップと、分光判定を識別する出力を提供するステップとを含む。
図6は、プロセス600の例示的なブロックを示しているが、いくつかの実施形態では、プロセス600は、図6に示すものに比べて追加のブロック、より少ないブロック、異なるブロック、又は異なる配置のブロックを含んでいてもよい。追加として又は代替として、プロセス600のブロックのうち2つ以上を並行して実行してもよい。
上記開示により図解及び説明を行ったが、これは、網羅的であることも実施形態を開示された形態そのものに限定することも意図されない。変更及び変形は、上記開示に照らして可能であるか、又は実施形態の実施から得ることができる。
本明細書において、「コンポーネント」という用語は、ハードウェア、ファームウェア、又はハードウェア及びソフトウェアの組み合わせと広義に解釈されることを意図したものである。
本明細書において、閾値を満たすことは、文脈に応じて、値が閾値を超えること、閾値より大きいこと、閾値より高いこと、閾値以上であること、閾値未満であること、閾値より少ないこと、閾値より低いこと、閾値以下であること、閾値と等しいこと等を指し得る。
本明細書に記載のシステム及び/又は方法が、異なる形態のハードウェア、ファームウェア、及び/又はハードウェア及びソフトウェアの組み合わせで実施され得ることが明らかであろう。これらのシステム及び/又は方法の実施に用いられる実際の特殊制御ハードウェア又はソフトウェアコードは、実施形態を制限するものではない。したがって、システム及び/又は方法の動作及び挙動は、本明細書の記載では特定のソフトウェアコードに関係なく、ソフトウェアハードウェアが本明細書の記載に基づくシステム及び/又は方法を実施するよう設計され得ることが理解される。
特定の特徴の組み合わせが特許請求の範囲に記載され且つ/又は本明細書に開示されているが、これらの組み合わせが可能な実施形態の開示を限定することは意図されない。実際には、これらの特徴の多くを、具体的に特許請求の範囲に記載且つ/又は本明細書に開示されていない方法で組み合わせることができる。添付の各従属請求項は、1つの請求項のみに直接従属している場合があるが、種々の実施形態の開示には、各従属請求項をその請求項セットの他の全ての請求項と組み合わせたものが含まれる。
本明細書で使用される要素、行為、又は指示はいずれも、そのように明記されない限りは重要であるとも必須であるとも解釈されないものとする。また、本明細書において、不定冠詞「a」及び「an」は1つ又は複数の事項を含むことが意図され、「1つ又は複数の」と交換可能に用いることができる。さらに、本明細書において、「セット」という用語は、1つ又は複数の事項(例えば、関連事項、非関連事項、関連事項及び非関連事項の組み合わせ等)を含むことが意図され、「1つ又は複数の」と交換可能に用いることができる。1つの事項のみを意図する場合、「1つのみ」という語句又は同様の文言が用いられる。また、本明細書において、「有する」("has," "have," "having")という用語又はそれに類する用語はオープンエンドな用語であることが意図される。さらに、「基づく」という語句は、別段に明記されない限り「少なくとも一部基づく」を意味することが意図される。また、本明細書において、「又は」という用語は、羅列において用いられる場合は包括的であることが意図され、別段に明記されない限り(例えば、「いずれか」又は「のうちの1つのみ」と組み合わせて用いられる場合)「及び/又は」と交換可能に用いることができる。

Claims (20)

  1. 1つ又は複数のメモリと、
    前記1つ又は複数のメモリに通信可能に結合された1つ又は複数のプロセッサであり、
    第1分光モデルのマスターデータセットを受信し、
    前記第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信して前記第1分光モデルを更新し、
    前記マスターデータセットと前記ターゲットデータセットからの第1データとを含むトレーニングデータセットを生成し、
    前記ターゲットデータセットからの第2データを含み前記マスターデータセットを含まないバリデーションデータセットを生成し、
    クロスバリデーションを用いると共に前記トレーニングデータセット及び前記バリデーションデータセットを用いて、前記第1分光モデルの更新である第2分光モデルを生成し、且つ
    前記第2分光モデルを提供する
    よう構成されたプロセッサと
    を備えた装置。
  2. 請求項1に記載の装置において、前記1つ又は複数のプロセッサは、
    分光測定値を受信し、
    前記第2分光モデルを用いて分光判定を実行し、且つ
    前記分光判定を識別する出力を提供する
    よう構成される装置。
  3. 請求項1に記載の装置において、前記トレーニングデータセットは複数のトレーニングデータセットであり、前記バリデーションデータセットは複数のバリデーションデータセットであり、
    前記1つ又は複数のプロセッサは、前記第2分光モデルの生成時に、
    前記複数のトレーニングデータセット及び前記複数のバリデーションデータセットに基づき複数の性能メトリックを生成し、
    前記複数の性能メトリックに基づき総合性能メトリックを求め、
    前記総合性能メトリックに基づき最適部分最小二乗(PLS)因子を求め、且つ
    前記最適PLS因子及びマージ済みデータセットに基づき前記第2分光モデルを求める
    よう構成され、前記マージ済みデータセットは前記マスターデータセット及び前記ターゲットデータセットを含む装置。
  4. 請求項1に記載の装置において、前記第1分光モデル及び前記第2分光モデルは定量化モデルである装置。
  5. 請求項1に記載の装置において、前記マスターデータセットは、マスター分光計により実行された第1分光測定セットに基づき、前記ターゲットデータセットは、前記マスター分光計とは異なるターゲット分光計により実行された第2分光測定セットに基づく装置。
  6. 請求項1に記載の装置において、前記マスターデータセットは、特定の分光計により実行された第1分光測定セットに基づき、前記ターゲットデータセットは、前記特定の分光計により実行された第2分光測定セットに基づく装置。
  7. 装置により第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信するステップと、
    前記装置により前記ターゲットデータセットの受信に基づき前記第1分光モデルのマスターデータセットを取得するステップと、
    前記装置によりクロスバリデーションを用いて最適部分最小二乗(PLS)因子を求めるステップであり、
    前記最適PLS因子は、それぞれが前記ターゲットデータセットの各部分及び前記マスターデータセットの全部を含む複数のトレーニングデータセットと、それぞれが前記ターゲットデータセットの各部分を含み前記マスターデータセットのデータを含まない複数のバリデーションデータセットとに基づき求められるステップと、
    前記装置により前記ターゲットデータセット及び前記マスターデータセットをマージしてマージ済みデータセットを生成するステップと、
    前記装置により前記マージ済みデータセット及び前記最適PLS因子を用いて第2分光モデルを生成するステップであり、
    前記第2分光モデルは、前記第1分光モデルの更新であるステップと、
    前記装置により前記第2分光モデルを提供して前記第1分光モデルと置き換えるステップと
    を含む方法。
  8. 請求項7に記載の方法において、前記最適PLS因子を求めるステップは、
    前記複数のトレーニングデータセットのそれぞれ及び前記複数のバリデーションデータセットのそれぞれについて部分最小二乗(PLS)性能メトリックを求めるステップと、
    前記PLS性能メトリックに基づき総合PLS性能メトリックを求めるステップと、
    前記総合PLS性能メトリックに基づき前記第2分光モデルの前記最適PLS因子を求めるようPLS因子を最適化するステップと
    を含む方法。
  9. 請求項8に記載の方法において、前記総合PLS性能メトリックは、二乗平均誤差(RMSE)値に関連し、
    前記PLS因子を最適化するステップは、
    前記RMSE値を最小化するよう前記PLS因子を最適化するステップ
    を含む方法。
  10. 請求項8に記載の方法において、前記複数のバリデーションデータセットは、前記複数のトレーニングデータセットとは異なる前記ターゲットデータセットのデータを含む方法。
  11. 請求項8に記載の方法において、前記総合PLS性能メトリックを求めるステップは、
    前記PLS性能メトリックを集約するステップ
    を含む方法。
  12. 請求項7に記載の方法において、前記ターゲットデータセットは、前記マスターデータセットに関連する測定後に実行された前記ターゲット母集団の測定セットに関連する方法。
  13. 請求項12に記載の方法において、前記第2分光モデルは前記第1分光モデルの較正更新モデルである方法。
  14. 請求項7に記載の方法において、前記ターゲットデータセットは、前記マスターデータセットに関連する測定を実行した1つ又は複数の分光計とは異なる特定の分光計により実行された測定セットに関連する方法。
  15. 請求項14に記載の方法において、前記第2分光モデルは前記第1分光モデルの較正移行モデルである方法。
  16. 請求項14に記載の方法において、前記第2分光モデルを提供するステップは、
    前記特定の分光計による後続の測定に関連して用いるための前記第2分光モデルを提供するステップ
    を含む方法。
  17. 命令を記憶する非一時的なコンピュータ可読媒体であって、前記命令は、
    1つ又は複数のプロセッサにより実行されると、該1つ又は複数のプロセッサに
    第1分光モデルのマスターデータセットを受信させ、
    前記第1分光モデルに関連するターゲット母集団のターゲットデータセットを受信させて前記第1分光モデルを更新させ、
    前記マスターデータセット及び前記ターゲットデータセットに基づき複数のトレーニングデータセットを生成させ、
    前記ターゲットデータセットに基づき前記マスターデータセットのデータを含まない複数のバリデーションデータセットを生成させ、
    前記複数のトレーニングデータセット及び複数のバリデーションデータセットに基づき且つクロスバリデーションを用いてモデル設定を求めさせ、
    前記モデル設定、前記ターゲットデータセット、及び前記マスターデータセットに基づき第2分光モデルを生成させ、且つ
    前記第2分光モデルを提供させる
    1つ又は複数の命令を含む非一時的なコンピュータ可読媒体。
  18. 請求項17に記載の非一時的なコンピュータ可読媒体において、前記モデル設定は、
    PLSモデルの部分最小二乗(PLS)因子、
    主成分回帰(PCR)モデルの成分の量、
    サポートベクター回帰(SVR)モデルのSVRパラメータ、又は
    前処理設定
    の少なくとも1つである非一時的なコンピュータ可読媒体。
  19. 請求項17に記載の非一時的なコンピュータ可読媒体において、前記1つ又は複数のプロセッサに前記モデル設定を求めさせる前記1つ又は複数の命令は、前記1つ又は複数のプロセッサに
    前記複数のトレーニングデータセットのそれぞれ及び前記複数のバリデーションデータセットの対応するバリデーションデータセットについて複数の部分性能メトリックを生成させ、
    前記複数の部分性能メトリックを集約して総合性能メトリックを生成させ、且つ
    前記総合性能メトリックの誤差値を最小化する前記モデル設定を求めさせる
    非一時的なコンピュータ可読媒体。
  20. 請求項17に記載の非一時的なコンピュータ可読媒体において、前記1つ又は複数の命令は、前記1つ又は複数のプロセッサにより実行されると、該1つ又は複数のプロセッサに
    測定値を受信させ、
    前記測定値に基づき且つ前記第2分光モデルを用いて分光判定を実行させ、且つ
    前記分光判定を識別する出力を提供させる
    非一時的なコンピュータ可読媒体。
JP2019120431A 2018-06-29 2019-06-27 分光モデルのクロスバリデーションベース較正 Active JP7123866B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022128108A JP7387832B2 (ja) 2018-06-29 2022-08-10 分光モデルのクロスバリデーションベース較正
JP2023194386A JP2024035237A (ja) 2018-06-29 2023-11-15 分光モデルのクロスバリデーションベース較正

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862692248P 2018-06-29 2018-06-29
US62/692,248 2018-06-29
US16/448,914 US10928309B2 (en) 2018-06-29 2019-06-21 Cross-validation based calibration of a spectroscopic model
US16/448,914 2019-06-21

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022128108A Division JP7387832B2 (ja) 2018-06-29 2022-08-10 分光モデルのクロスバリデーションベース較正

Publications (3)

Publication Number Publication Date
JP2020020785A true JP2020020785A (ja) 2020-02-06
JP2020020785A5 JP2020020785A5 (ja) 2022-02-21
JP7123866B2 JP7123866B2 (ja) 2022-08-23

Family

ID=67137548

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019120431A Active JP7123866B2 (ja) 2018-06-29 2019-06-27 分光モデルのクロスバリデーションベース較正
JP2022128108A Active JP7387832B2 (ja) 2018-06-29 2022-08-10 分光モデルのクロスバリデーションベース較正
JP2023194386A Pending JP2024035237A (ja) 2018-06-29 2023-11-15 分光モデルのクロスバリデーションベース較正

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2022128108A Active JP7387832B2 (ja) 2018-06-29 2022-08-10 分光モデルのクロスバリデーションベース較正
JP2023194386A Pending JP2024035237A (ja) 2018-06-29 2023-11-15 分光モデルのクロスバリデーションベース較正

Country Status (6)

Country Link
US (3) US10928309B2 (ja)
EP (2) EP3588060B1 (ja)
JP (3) JP7123866B2 (ja)
KR (2) KR102494073B1 (ja)
CN (2) CN115266604A (ja)
TW (2) TW202305327A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024002023A (ja) * 2022-06-23 2024-01-11 横河電機株式会社 検量装置、検量方法および検量プログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10928309B2 (en) 2018-06-29 2021-02-23 Viavi Solutions Inc. Cross-validation based calibration of a spectroscopic model
US10969331B2 (en) * 2018-07-11 2021-04-06 Viavi Solutions Inc. Focusing linear model correction and linear model correction for multivariate calibration model maintenance
CN112629659A (zh) * 2019-10-08 2021-04-09 中强光电股份有限公司 用于训练用于不同的光谱仪的管线的自动化模型训练装置和自动化模型训练方法
CN115280334A (zh) * 2020-03-31 2022-11-01 株式会社日立高新技术 错误原因的推定装置以及推定方法
CN112161965B (zh) * 2020-09-22 2022-08-05 复旦大学附属妇产科医院 检测中药药性的方法、装置、计算机设备和存储介质
WO2023183499A1 (en) * 2022-03-23 2023-09-28 Si-Ware Systems Generalized artificial intelligence modeler for ultra-wide-scale deployment of spectral devices

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6230077B1 (en) * 1998-12-30 2001-05-08 Hyundai Motor Company Car glass mounting system
US6341257B1 (en) * 1999-03-04 2002-01-22 Sandia Corporation Hybrid least squares multivariate spectral analysis methods
US20140012504A1 (en) * 2012-06-14 2014-01-09 Ramot At Tel-Aviv University Ltd. Quantitative assessment of soil contaminants, particularly hydrocarbons, using reflectance spectroscopy
JP2015526135A (ja) * 2012-07-02 2015-09-10 ナショナル ユニヴァーシティー オブ シンガポール 光ファイバーラマン分光法を利用する内視鏡検査でのリアルタイム癌診断に関連する方法
US20160141193A1 (en) * 2014-11-19 2016-05-19 Kla-Tencor Corporation System, method and computer program product for combining raw data from multiple metrology tools
JP2017004509A (ja) * 2015-06-04 2017-01-05 ザ・ボーイング・カンパニーThe Boeing Company 機械学習のための高度解析インフラストラクチャ
JP2018059900A (ja) * 2016-07-29 2018-04-12 ビアビ・ソリューションズ・インコーポレイテッドViavi Solutions Inc. スパース転送セットを使用する較正モデルの転送

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100545730B1 (ko) * 2004-02-03 2006-01-24 재단법인서울대학교산학협력재단 라만 분광법을 이용한 소변 성분 분석 시스템 및 그 방법
US7277810B2 (en) * 2005-07-05 2007-10-02 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for automating calibration of test instruments
WO2009051784A1 (en) * 2007-10-17 2009-04-23 Baylor University Methods for determining enantiomeric purity with improved chiral selectors
WO2011035391A1 (en) * 2009-09-24 2011-03-31 Commonwealth Scientific And Industrial Research Organisation Method of contaminant prediction
CN103528990B (zh) * 2013-10-31 2017-07-28 天津工业大学 一种近红外光谱的多模型建模方法
GB201405223D0 (en) * 2014-03-24 2014-05-07 Inst Of Food Res Spectroscopy method and system
CN105117734B (zh) * 2015-07-28 2018-04-13 江南大学 基于模型在线更新的玉米种子高光谱图像分类识别方法
CN105203498A (zh) * 2015-09-11 2015-12-30 天津工业大学 一种基于lasso的近红外光谱变量选择方法
US10928309B2 (en) 2018-06-29 2021-02-23 Viavi Solutions Inc. Cross-validation based calibration of a spectroscopic model

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6230077B1 (en) * 1998-12-30 2001-05-08 Hyundai Motor Company Car glass mounting system
US6341257B1 (en) * 1999-03-04 2002-01-22 Sandia Corporation Hybrid least squares multivariate spectral analysis methods
US20140012504A1 (en) * 2012-06-14 2014-01-09 Ramot At Tel-Aviv University Ltd. Quantitative assessment of soil contaminants, particularly hydrocarbons, using reflectance spectroscopy
JP2015526135A (ja) * 2012-07-02 2015-09-10 ナショナル ユニヴァーシティー オブ シンガポール 光ファイバーラマン分光法を利用する内視鏡検査でのリアルタイム癌診断に関連する方法
US20160141193A1 (en) * 2014-11-19 2016-05-19 Kla-Tencor Corporation System, method and computer program product for combining raw data from multiple metrology tools
JP2017004509A (ja) * 2015-06-04 2017-01-05 ザ・ボーイング・カンパニーThe Boeing Company 機械学習のための高度解析インフラストラクチャ
JP2018059900A (ja) * 2016-07-29 2018-04-12 ビアビ・ソリューションズ・インコーポレイテッドViavi Solutions Inc. スパース転送セットを使用する較正モデルの転送

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024002023A (ja) * 2022-06-23 2024-01-11 横河電機株式会社 検量装置、検量方法および検量プログラム

Also Published As

Publication number Publication date
JP7387832B2 (ja) 2023-11-28
KR20230022897A (ko) 2023-02-16
JP2024035237A (ja) 2024-03-13
JP7123866B2 (ja) 2022-08-23
US20210164891A1 (en) 2021-06-03
US10928309B2 (en) 2021-02-23
TWI783159B (zh) 2022-11-11
EP3588060A1 (en) 2020-01-01
CN110657890A (zh) 2020-01-07
US20200003679A1 (en) 2020-01-02
US11719628B2 (en) 2023-08-08
KR20200002694A (ko) 2020-01-08
TW202305327A (zh) 2023-02-01
EP4063831A1 (en) 2022-09-28
JP2022172139A (ja) 2022-11-15
CN110657890B (zh) 2022-07-05
CN115266604A (zh) 2022-11-01
KR102494073B1 (ko) 2023-01-31
TW202018260A (zh) 2020-05-16
US20230349818A1 (en) 2023-11-02
EP3588060B1 (en) 2022-05-11

Similar Documents

Publication Publication Date Title
JP7387832B2 (ja) 分光モデルのクロスバリデーションベース較正
TWI810013B (zh) 用於減少光譜分類的誤報識別之設備和方法以及相關的非暫時性電腦可讀取媒體
US11775616B2 (en) Reduced false positive identification for spectroscopic quantification

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220210

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220810

R150 Certificate of patent or registration of utility model

Ref document number: 7123866

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150