JPH10512667A - Nonlinear multivariate infrared analysis method - Google Patents

Nonlinear multivariate infrared analysis method

Info

Publication number
JPH10512667A
JPH10512667A JP8519224A JP51922496A JPH10512667A JP H10512667 A JPH10512667 A JP H10512667A JP 8519224 A JP8519224 A JP 8519224A JP 51922496 A JP51922496 A JP 51922496A JP H10512667 A JPH10512667 A JP H10512667A
Authority
JP
Japan
Prior art keywords
linear
property
estimate
test sample
ron
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8519224A
Other languages
Japanese (ja)
Other versions
JP3671241B2 (en
Inventor
ペリー・ブルース・エヌ
ブラウン・ジェイムズ・エム
Original Assignee
エクソン リサーチ アンド エンジニアリング カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/567,613 external-priority patent/US5641962A/en
Application filed by エクソン リサーチ アンド エンジニアリング カンパニー filed Critical エクソン リサーチ アンド エンジニアリング カンパニー
Publication of JPH10512667A publication Critical patent/JPH10512667A/en
Application granted granted Critical
Publication of JP3671241B2 publication Critical patent/JP3671241B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biochemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Photometry And Measurement Of Optical Pulse Characteristics (AREA)
  • Investigating Or Analyzing Materials Using Thermal Means (AREA)

Abstract

(57)【要約】 テストサンプルのスペクトル、線形予測モデル、および線形予測値に対する非線形補正を使用して、検定サンプル集合と性質または組成データとの相関から、テストサンプルの該当性質または組成データを求める方法。 (57) [Summary] Using the spectrum of the test sample, the linear prediction model, and the nonlinear correction to the linear prediction value, determine the relevant property or composition data of the test sample from the correlation between the test sample set and the property or composition data. Method.

Description

【発明の詳細な説明】 非線形多変量赤外解析法 発明の背景 本発明は一般的には赤外解析を利用して材料の物理的または化学的性質を決定 する方法に関し、より詳細には、材料のサンプルの注目の性質を、そのサンプル の赤外スペクトルとの非線形相関に基づいて推定する改良された方法に関する。 この方法の具体定な用途としては、赤外解析によるガソリンのオクタン価推定 の改良がある。 適切なサンプル集合に対しては、オクタン価、セタン価、芳香族化合物含量な どの物理的または化学的性質を、赤外スペクトルと効果的に相関づけることがで きる。PLS、PCRなどの線形手法やCPSA(Constrained Principal Spec tra Anallysis:条件付き主スペクトル解析、J.M.Brown、米国特許第5,121,33 7号)などの拡張手法、ならびにDiForggioの方法(米国特許第5,397,899号)を 用いると、多くの場合で有効な相関が得られる。こうした相関を求める目的は赤 外アナライザーを検定し、その赤外アナライザーを利用して、その後の未知のサ ンプルの物理的または化学的性質を、それらサンプルの赤外スペクトルに基づい て推定できるようにすることである。こうしたアナライザーを活用する際に考慮 すべき重要な点は、異常値を有するサンプル、すなわち、解析結果が推定モデル の外挿部分に相当するようなサンプルを統計的に検出するアナライザーの能力で ある。 用途によっては、PLS、PCR、CPSAなどの線形相関手法による検定に よって、十分な正確さで物理的または化学的性質を予測することができない。検 定が不正確であるということは、推定される性質がサンプルの組成に対して非線 形の関係を有することを示唆することがある。こうした問題に対処するために、 局所線形回帰、MARS、ニューラルネットなど種々の手法が提案されてきたが 、こうした手法では一般的に多数の係数が必要となり、通常、線形手法から得ら れる統計的指標を提供するものではない。 性質または組成データをスペクトルデータと相関づけるのに現在利用されてい る検定方法は、ほとんど例外なく線形方法である。こうした方法では、性質/成 分濃度がスペクトルシグナルと線形関係にあると仮定している。これらの線形方 法は、性質が化学成分と非線形関係にある場合、または成分間の相互作用が非線 形のスペクトルレスポンスを生じさせる場合には、不適切なものとなる。いくつ かの非線形モデル化方法が文献中で検討されてきたが、これらの方法は一般的に 、スペクトルデータと性質/成分濃度との非線形関係を規定する試みである。こ うした非線形方法では、通常、多数の係数を決定しなければならない。多数の係 数を使用するには、検定の際に、非常に大きなサンプル集合を使用する必要が生 じ、データを拡大当てはめする傾向がある。また、ほとんどの非線形方法は、解 析される新しいサンプルが検定の範囲外にあることを求める、すなわち異常値検 出のための統計的手段を含まない。拡大あてはめにそれほど影響されず、しかも 異常値検出機能を有する簡単な非線形方法が必要であった。 性質および成分濃度の推定には様々な線形検定が利用されている。例えば、Hi eftje、Honigs、およびHirschfeld(米国特許第4,800,279号)は、炭化水素の物 理的性質の線形評価法を記述している。LambertおよびMartens(欧州特許第0 28 5 251号)は、オクタン価の線形推定方法を記載している。Maggardは、オクタン 価の線形推定方法(米国特許第4,963,745号)および炭化水素中の芳香族化合物 の線形推定方法(米国特許第5,145,785号)を記述している。Brown(米国特許第 5,121,337号)は、条件付き主スペクトル解析(CPSA)に基づく線形手法を 記述し、種々の実施例を示している。 Espinosaら(欧州特許第0 305 090 B1号および同第0 304 232 A2号)は、炭化 水素の物理的性質を直接決定する方法を記載している。Espinosaらは、線形項( 選択された周波数における吸収)、二次項(異なる周波数における吸収の積)、 および相同項(異なる周波数における吸収の商)を式に加えている。実施例に示 された式には、わずかな非線形項が含まれているにすぎず、これらの二次項およ び相同項を、多数の可能性のある非線形項の中から任意にまたは統計的に選んだ 。例えば、欧州特許第0 305 090 B1号中の16個の推奨周波数に対しては、利用可 能な項として182(324)個の二次項、その他に18×17(306)個の相同項がある。16 個の周波数に対しては、646個の係数を決定またはゼロに設定して相関式を誘導 する必要がある。わずか6個の周波数を対象としたより単純な実施例においてす ら、線形項、二次項、および相同項として216個が利用可能であり、216個の係数 を決定またはゼロに設定して相関式を誘導する必要がある。 Crawfordら(Process Control and Quality,4(1992)13-20)は、ニュール ネットワークを利用して、近赤外吸収データからリサーチオクタン価を予測した 。231個の波長における吸光度を、一つの隠れた層に24個のノードを有するニュ ーラルネットワークへのインプットとして使用した。ノードバイアスを含めて、 合計で24*231+24(5568)個の係数(ウェートおよびバイアス)を、ネットワーク のトレーニングで決定した。 非線形多変量検定法に関する概説がSekulicらによって報告された(Analytica l Chemistry,65(1993)835A-845A)。局所荷重回帰(LWR)、射影追跡回帰( PPR)、交代条件予測(ACE)、多変量適応スプライン(MARS)、ニュ ーラルネットワーク、非線形主成分回帰(NLPCR)、および非線形部分最小 自乗(NLPLS)が記述されている。これらの手法はすべて、本発明の非線形 後処理法よりもかなり計算が困難である。 発明の要旨 本発明は、分光計に基づくアナライザーの性能を顕著に改良する方法であり、 このアナライザーを使用してテストサンプルを測定し、サンプルの性質または組 成データを処理や解析用途に提供する。本発明の方法は、テストサンプルのスペ クトルとテスルサンプルの性質または組成データの値との非線形相関からテスト サンプルの該当性質または組成データを決定する。アナライザーの検定において 、本発明の方法には、次の工程が含まれる。 (1)検定サンプル集合のスペクトルを測定する工程。 (2)該検定サンプル集合の性質または組成データを測定する工程。 (3)工程(1)で得られたスペクトルと工程(2)で得られた性質または組成データ との線形相関を求める工程。 (4)工程(3)の線形相関を工程(1)で収集した検定集合のスペクトルに適用する ことによって、検定サンプル性質または組成データの線形推定値を求める工程。 (5)工程(2)から得られた性質もしくは組成データ、または工程(2)から得られ た性質もしくは組成データと工程(4)で得られた線形推定値との差を工程(4)から 得られた線形推定値の非線形関数として当てはめることによって、線形推定値に 対する非線形補正を求める工程。 解析の際は、この非線形検定を使用して、次の工程によりテストサンプルの性質 または組成データを求める。 (6)テストサンプルのスペクトルを測定する工程。 (7)工程(3)で求めた線形相関を該スペクトルに適用して、その性質または組成 データの線形推定値を得る工程。 (8)工程(5)で求めた非線形補正を工程(7)の線形推定値に適用して、テストサ ンプルの性質または組成データを推定する工程。 (9)工程(8)で求めたテストサンプルの性質または組成データの推定値を出力す る工程。 工程(2)から得られる性質または組成データを工程(4)から得られる線形推定値 の非線形関数として直接当てはめを行うことによって工程(5)の非線形補正を計 算する場合は、工程(8)におけるテストサンプルの性質または組成データの推定 では、工程(7)から得られる線形推定値を工 程(5)から得られる非線形補正式へ代入する。 工程(2)から得られる性質または組成データと工程(4)から得られる性質または 組成データの線形推定値との差を工程(4)から得られる線形推定値の非線形関数 として当てはめることによって工程(5)の非線形補正を計算する場合は、工程(8) におけるテストサンプルの性質または組成データの推定では、工程(7)から得ら れる線形推定値を工程(5)から得られる非線形補正式へ代入し、得られた非線形 補正を工程(7)から得られる線形推定値に加えて最終推定値を得る。 工程(3)の線形補正は、スペクトルデータに由来する変数に対して参照性質デ ータを回帰処理することによって得られる線形多変量検定からなるものである。 スペクトル変数として、特定の波長における吸光度を、回帰方法として、多重線 形回帰(MLR)を利用することができる。別の方法として、主成分回帰(PC R)、部分最小自乗(PLS)、または条件付き主スペクトル解析(CPSA) を利用して、スペクトルデータから変数(スコア)を抽出し、これらの変数を性 質データに対して回帰処理することもできる。残差、すなわち実際の参照性質値 と線形モデルによる予測値との差を、検定集合中の各サンプル毎に求める。次に 、この性質値の残差を、線形予測値の非線形関数(例えば、二次または三次の関 数)として当てはめを行う。別の方法として、実際の参照値を、線形予測値の非 線形関数として直接当てはめを行うこともできる。 本発明の方法によれば、検定精度および分光計に基づくアナラスザーの性能が 顕著に改良され、しかも線形方法の異常値検出能力が維持される。 図面の簡単な説明 図1は、エンジンのリサーチオクタン価(RON)の実測値を、実施例1の線形C PSA検定から得られたRONの推定値に対してプロットしたものである。丸印は 、検定データ集合に属する365個のPowerformateサンプルのデータを表している 。実線は、エンジンRON測定値に対するASTM95%再現性限界を、RONの線形推定値 に対して計算したものである。 図2は、実施例1のデータ集合に対する残差(線形CPSA検定から得られたRO N推定値 − エンジン試験から得られたRON実測値)を、線形CPSA検定から得 られたRON推定値に対してプロットしたものである。丸印は、検定データ集合に 属する365個のPowerformateサンプルに対する残差の値を表している。実線は、 残差の最良当てはめを行ったRONの線形推定値の三次多項式関数である。 図3は、エンジンのリサーチオクタン価(RON)の実測値を、実施例1の線形C PSA検定の非線形後処理から得られたRONの推定値に対してプロットしたもの である。丸印は、検定データ集合に属する365個のPowerformateサンプルのデー タを表している。実線は、エンジンRON測定値に対するASTM95%再現性限界を、RO Nの非線形推定値に対して計算したものである。 図4は、エンジンのリサーチオクタン価(RON)の実測値を、実施例2の線形C PSA検定から得られたRONの推定値に対してプロットしたものである。丸印は 、検定データ集合に属する385個のブレンドガソリンサンプルのデータを表して いる。実線は、エンジンRON値の最良当てはめを行ったRONの線形推定値の三次多 項式関数である。 図5は、実施例2のテストデータ集合に対する、エンジンのリサーチオクタン価 (RON)の実測値を、線形CPSA検定から得られたRONの推定値に対してプロッ トしたものである。菱形印は、テストデータ集合に属する238個のブレンドガソ リンサンプルのデータを表している。実線は、エンジンRON測定値に対するASTM9 5%再現性限界を、RONの線形推定値に対して計算したものである。 図6は、実施例2のデータ集合に対する、残差(線形CPSA検定から得られた RON推定値 − エンジン試験から得られたRON実測値)を、線形CPSA検定から 得られたRON推定値に対してプロットしたものである。丸印は、検定データ集合 に属する385個のブレンドガソリンサンプルの残差の値を表している。実線は、 残差の最良当てはめを行ったRONの線形推定値の三次多項式関数である。 図7は、実施例2のテストデータ集合に対する、残差(線形CPSA検定から得 られたRON推定値 − エンジン試験から得られたRON実測値)を、線形CPSA検 定から得られたRONの推定値に対してプロットしたものである。丸印は、テスト データ集合に属する238個のブレンドガソリンサンプルの残差の値を表している 。実線は、RONの線形推定値の三次多項式関数を表しており、検定データ集合か ら得られたものである。 図8は、実施例2のテストデータ集合に対する、エンジンのリサーチオクタン価 (RON)の実測値を、線形CPSA検定の非線形後処理から得られたRONの推定値 に対してプロットしたものである。菱形印は、テストデータ集合に属する238個 のブレンドガソリンサンプルのデータを表 している。実線は、エンジンRON測定値に対するASTM95%再現性限界を、RONの非 線形推定値に対して計算したものである。 図9は、実施例3のテストデータ集合に対する、エンジンのリサーチオクタン価 (RON)の実測値を、線形MLR検定から得られたRONの推定値に対してプロット したものである。丸印は、テストデータ集合に属する238個のブレンドガソリン サンプルのデータを表している。実線は、エンジンRON測定値に対するASTM95%再 現性限界を、RONの線形推定値に対して計算したものである。 図10は、エンジンのリサーチオクタン価(RON)の実測値を、実施例3の線形M LR検定から得られたRONの推定値に対してプロットしたものである。四角印は 、検定データ集合に属する385個のブレンドガソリンサンプルのデータを表して いる。実線は、エンジンRON値の最良当てはめを行ったRONの線形推定値の三次多 項式関数である。 図11は、エンジンのリサーチオクタン価(RON)の実測値を、実施例3のテスト データ集合に対する線形MLR検定の非線形後処理から得られたRONの推定値に 対してプロットしたものである。丸印は、テストデータ集合に属する238個のブ レンドガソリンサンプルのデータを表している。実線は、エンジンRON測定値に 対するASTM95%再現性限界を、RONの非線形推定値に対して計算したものである。 好ましい態様の説明 線形検定法を用いて、スペクトル測定値と、化学組成、物理的性質、および性 能特性との関連づけが行われてきた。線形手法では、組成また は性質が既知のサンプル、すなわち、組成または性質が参照技術により既に測定 されているサンプルの集合を使用して検定またはトレーニングが行われる。次に 、その検定を別のテスト集合の解析に適用し、その予測結果を参照法で得られた 結果と比較することによって検定の妥当性を保証することが好ましい。最後に、 検定済みのアナライザーを使用して、未知物質を解析し組成または性質データを 予測する。 線形検定においては、検定サンプルのスペクトルは、f×n次元の行列Xの列を 形成する。ただし、fは、一つのスペクトルに含まれる個々のデータ点(周波数 または波長)の数であり、nは、検定サンプルの数である。ベクトルyがn個の検 定サンプルに対する組成/性質データを含むとすると、線形モデルは次式をpに 関して解くことにより構築される。 y=Xtp [1] ただし、pは回帰係数を含むベクトルである。一般的にはf>>nであるので、式 [1]を直接解くことはできない。一般的には、三つのアプローチが利用される。 MLRの場合、k<nの条件下でXの中からk個の行の場合(個々の周波数あるい は波長)を選び、Xをk個の行だけを含むより小さい行列Xkに置き換える。次に 、行列Xkの擬逆行列を計算することによってpを求める。PCRの場合、行列 Xを三つの行列の積、すなわち、U(f×k次元のローディング行列)、Σ(k×k 次元の特異値行列)、およびV(n×k次元のスコア行列)の積に分解する。 X=UΣVt [2] 次に、性質ベクトルyに対してスコアを回帰処理して、モデルを構築する。PL Sでは、Xに類似の分解を施して直交行列とし、スコア行列に 対してyの回帰処理を行う。 線形モデルにおける性質または成分濃度の推定値であり、次式で与えられる。 この線形モデルにおける残差r1は次式で与えられる。 線形モデルによって適切に性質yを推定できる場合には、残差r1は正規分布す ると予想される。モデル化の対象となる性質とサンプルの化学成分との間に非線 形性従属関係があるために線形モデルが不適切な場合には、一般に残差の中に構 造が観測される。この場合は、推定値を後処理することによって、より正確なモ デルを得ることができる。 後処理として、二つの形式のうちの一つが利用できる。残差r1また して回帰処理する。 または ただし、f(y1)は、性質/成分の線形推定値の非線形関数を表す。非線形関 数は、性質/成分の線形推定値の累乗で表される多項式であることが好ましい。 または mが2の場合には後処理が二次となり、mが3の場合には後処理が三次となる。mは 、残差中に存在する構造に対する後処理関数の当てはめ能力に基づいて選ばれる 。 [5]または[7]を使用して、性質の線形推定値の線形関数として残差の当てはめ を行う場合は、線形推定値および非線形推定残差を合計することによって成分/ 性質の非線形推定値が得られる。 得られる残差の非線形推定値である。[6]または[8]を使用する場合は、成分/性 質の非線形推定値が直接に得られる。 スペクトル行列Xは、前処理してからモデル化処理にかけることができる。前 処理としては、例えば、平均センタリング、ベースライン補正、数値導関数、ま たはベースラインおよび補正スペクトルに対する直交化(例えば、CPSAアル ゴリズムを使用する)が挙げられる。 単一の検定スペクトル集合を用いて、複数の性質のモデルを開発することがで き、それをそれぞれ別々に後処理することができる。 予測対象となる成分としては、個々の化学種(例えば、ベンゼンなど)、一塊 りの化学種(例えば、オレフィン類、芳香族化合物類など)、物理的性質(例え ば、屈折率、比重など)、化学的性質(例えば、安定性など)、または性能性質 (例えば、オクタン価、セタン価など)が挙げられる。 実施例を三つ提示する。 実施例1 365個のPOWERFORMATEサンプル(改質炉生成物サンプル)のデータ集合に対し て、線形回帰法である条件付き主スペクトル解析(CPSA)を使用してリサー チオクタン価(RON)の回帰処理を行った。FT-IRスペクトルは、フッ化カルシウ ム窓を有する公称経路長0.5mmのセルにサンプルを入れて、7000〜400cm-1範囲に わたり解像度2cm-1で測定した。CPSA検定では、5300.392〜3150.151cm-1、2 599.573〜2445.296cm-1、2274.627〜1649.804cm-1の周波数範囲にある吸光度を 使用した。7000〜5300.392cm-1の範囲の吸光度は弱すぎるために有意な相関をと ることはできない。3150.151〜2599.573cm-1および1649.804〜400cm-1の周波数 範囲は、FT-IR装置の動的応答範囲を超える吸光度を含むために除外する。 2445.296〜2274.627cm-1の周波数範囲は、大気中の二酸化酸素の干渉を防ぐため に除外する。CPSA検定に二組の多項式補正を利用して、ベースライン変動を 補償する。第一の組で5300.392〜3150.151cm-1の範囲を補償し、第二の組で2599 .573〜1649.804cm-1の範囲を補償する。CPSA検定ではまた、水蒸気補正を行 って、装置のパージの変動が推定値に及ぼす影響を最小限に抑える。五つの条件 付き主成分を使用して、RON検定を実施した。この五つの条件付き主成分の係数 を、段階式回帰に基づくPRESSを用いて決定した。参照(エンジン)値に対 するRONの線形予測値のプロットを図1に示す。図1のデータの推定値の標準誤差 は、0.54 RON値である。 RONの線形予測値の二次関数に対して、RON残差(FT-IRからのRONの線形予測値 −エンジンRON)を回帰処理した。RONの線形予測値に対するRON残差のプロット を、残差に対する二次当てはめと共に図2に示す。 図3は、図2の二次補正を図1のデータに適用することによって得られたモデル の結果を示している。これは、RONの線形予測値の二次関数として参照(エンジ ン)RON値の当てはめを行ったものと同一である。図2における推定値の標準誤差 は、0.41 RON値である。 本明細書中に記載した非線形後処理法を適用すると、前に使用した線形手法よ りRON推定が24%改良されるが、最初の線形相関の五つの係数の他にわずか三つの 係数を追加決定するだけでよい。 実施例2 385個のブレンドガソリンサンプルのスペクトルの検定データ集合に対して、 線形回帰法である条件付き主スペクトル解析(CPSA)を使用してリサーチオ クタン価(RON)の回帰処理を行った。FT-IRスペクトルは、フッ化カルシウム窓 を有する公称経路長0.5mmのセルにサンプルを入れて、7000〜400cm-1範囲にわた り解像度2cm-1で測定した。CPSA検定では、4850.094〜3324.677cm-1および2 200.381〜1634.376cm-1の周波数範囲にある吸光度を使用した。7000〜4850.094c m-1の範囲の吸光度は弱すぎるために有意な相関をとることはできない。3150.15 1〜2400cm-1および1634.376〜400cm-1の周波数範囲は、FT-IR装置の動的応答範 囲を超える吸光度を含むために除外する。2400〜2200.381cm-1の周波数範囲は、 大気中の二酸化酸素の干渉を防ぐために除外する。CPSA検定に二組の多項式 補正を利用して、ベースライン変動を補償する。第一 の組(三次の多項式)で5300.392〜3150.151cm-1の範囲を補償し、第二の組(二 次の多項式)で2599.573〜1649.804cm-1の範囲を補償する。CPSA検定ではま た、水蒸気補正を行って、装置のパージの変動が推定値に及ぼす影響を最小限に 抑える。14個の条件付き主成分を使用して、RON検定を実施した。この14個の条 件付き主成分の係数を、段階式回帰に基づくPRESSを用いて決定した。参照 (エンジン)値に対するRONの線形予測値のプロットを図4に示す。線形CPSA モデルにおける検定の標準誤差は、0.411である。 図4に示された線形モデルを、モデルの構築に使用した集合には含まれない238 個のブレンドガソリンサンプル(314個の別々のエンジン測定値)の分析に適用 した。これらのテストサンプルに対する線形モデルから得られた予測値を図5に 示す。この線形モデルに関しては、テストサンプルに対する有効性の標準誤差は 0.569であり、ASTMエンジン再現限界の範囲内で参照エンジン値と一致する予測 値を有するサンプルは、全体の84%にすぎない。 RONの線形予測値の三次関数に対して、検定集合に含まれる385個のサンプルの RON残差(FT-IRからのRONの線形予測値−エンジンRON)を回帰処理した。RONの 線形予測値に対するRON残差のプロットを、残差に対する三次当てはめと共に図6 に示す。RONの線形推定値の三次後処理を行うと、検定の標準誤差が0.327まで減 少する。 図7は、テスト集合に含まれる238個のサンプルのRON残差(FT-IRからのRONの 線形予測値−エンジンRON)を、検定サンプルの当てはめから得られた係数を使 用して生成させた三次曲線に対してプロットしたもので ある。図8は、テスト集合のエンジンRONを、RONの線形推定値の三次後処理によ って推定されたRON値に対してプロットしたものを示す。三次後処理を行うと、 有効性の標準誤差は0.397まで低下し、RON推定値の95%が、RONエンジンのASTM再 現性の範囲内で、参照エンジン値と一致する。 非線形後処理法を適用すると、テスト集合のRON推定値が30%改良されるが、最 初の線形検定で使用された係数の他にわずか四つの係数を追加して決定する必要 があるだけである。D2699 RON試験などのASTM試験においては、二つの異なる実 験室で二人の異なるオペレータが測定した値は、その時点での見積もり再現性95 %の範囲内にあることが期待される。非線形後処理を行うと、IR RON推定値が、 その時点での再現性95%の範囲内でD2699 RONの試験データと一致することから、 IR推定値がエンジン測定値と等価であると言える。 実施例3 実施例2に記載した385個のブレンドガソリンサンプルのスペクトルと同一の集 合を使用し、LambertおよびMartens(欧州特許第0 285 251 B1号、1991年8月28 日)が提示した方法に従って多重線形回帰(MLR)モデルを構築した。Lamber tおよびMartensにが記載した15個の周波数に最も近い周波数(表1)における吸 光度を、ベースラインポイントにおける吸光度を差し引くことにより補正し、次 に、これをエンジンRON値に対して回帰処理することによって表2の係数を得た。 この線形MLRモデルにおける推定の標準誤差は、0.459であった。 MLRモデルを使用して、238個のブレンドガソリンのテストサンプルのスペク トルから成る同一の集合を解析した。MLR推定値をテスト集合の314のエンジ ン測定値と比較した。この線形MLRモデルから得られた予測値を図9に示す。 この線形MLRモデルにおいては、テストサンプルの有効性の標準誤差は0.457 であり、ASTMエンジン再現限界範囲内で予測されるサンプルは、全体のわずか81 %にすぎない。 385個のブレンドガソリンサンプル検定集合の場合、線形MLR推定値の三次 関数としてエンジンRON値の当てはめを行った。この当てはめを、図10にグラフ で示す。 238個のブレンドガソリンのテスト集合の線形MLR推定値に三次後処理を適 用した。非線形後処理MLR推定値と314個の別々のエンジン測定値との比較を 図11に示す。テスト集合の有効性の標準誤差は0.406であり、ASTM RON試験の再 現限界範囲内で推定されるサンプルは全体の91%である。三次非線形後処理法を 適用すると、線形MLR検定よりも11%改良されるが、線形MLR検定で使用さ れた係数の他にわずか四つの係数を追加して決定する必要があるだけである。Description: BACKGROUND OF THE INVENTION The present invention relates generally to a method for determining the physical or chemical properties of a material using infrared analysis, and more particularly, to a method for determining the physical or chemical properties of a material. An improved method for estimating the properties of interest of a sample of a material based on a non-linear correlation with the infrared spectrum of the sample. A specific application of this method is to improve the estimation of gasoline octane number by infrared analysis. For an appropriate sample set, physical or chemical properties such as octane number, cetane number, aromatics content, etc. can be effectively correlated with the infrared spectrum. Linear methods such as PLS and PCR, extended methods such as CPSA (Constrained Principal Spectra Analysis), JM Brown, US Pat. No. 5,121,337, and DiForggio's method (US Pat. 5,397,899), an effective correlation can be obtained in many cases. The purpose of these correlations is to test an infrared analyzer, which can then be used to estimate the physical or chemical properties of an unknown sample based on its infrared spectrum. That is. An important consideration when utilizing such an analyzer is the ability of the analyzer to statistically detect samples with outliers, ie, samples whose analysis results correspond to the extrapolated portion of the estimated model. For some applications, tests by linear correlation techniques such as PLS, PCR, CPSA, etc., cannot predict physical or chemical properties with sufficient accuracy. An inaccurate test may indicate that the property being estimated has a non-linear relationship to the composition of the sample. Various methods such as local linear regression, MARS, and neural networks have been proposed to address these problems. However, such methods generally require a large number of coefficients, and are usually statistical indices obtained from the linear method. Does not provide. The test methods currently used to correlate property or composition data with spectral data are almost exclusively linear methods. These methods assume that the property / component concentration is linearly related to the spectral signal. These linear methods are inadequate if the properties are non-linear with the chemical components, or if the interaction between the components produces a non-linear spectral response. Several non-linear modeling methods have been discussed in the literature, but these are generally attempts to define a non-linear relationship between spectral data and properties / component concentrations. In such non-linear methods, typically a large number of coefficients must be determined. The use of a large number of coefficients requires the use of a very large sample set during the test, which tends to stretch the data. Also, most non-linear methods require that the new sample to be analyzed is outside the range of the test, ie, do not include statistical means for outlier detection. There was a need for a simple non-linear method that was not significantly affected by the expansion fit and that had an outlier detection function. Various linear tests are used to estimate properties and component concentrations. For example, Hi eftje, Honigs, and Hirschfeld (U.S. Pat. No. 4,800,279) describe a linear method for evaluating the physical properties of hydrocarbons. Lambert and Martens (EP 0 285 251) describe a method for linear estimation of the octane number. Maggard describes a method for linear estimation of octane number (US Pat. No. 4,963,745) and a method for linear estimation of aromatics in hydrocarbons (US Pat. No. 5,145,785). Brown (US Pat. No. 5,121,337) describes a linear approach based on conditional principal spectral analysis (CPSA) and gives various examples. Espinosa et al. (EP 0 305 090 B1 and EP 0 304 232 A2) describe a method for directly determining the physical properties of hydrocarbons. Espinosa et al. Add a linear term (absorption at selected frequencies), a quadratic term (product of absorption at different frequencies), and a homologous term (quotient of absorption at different frequencies) to the equation. The equations shown in the examples include only a few non-linear terms, and these quadratic and homologous terms can be arbitrarily or statistically selected from a number of possible non-linear terms. It is. For example, for the 16 recommended frequencies in EP 0 305 090 B1, there are 18 2 (324) quadratic terms available and 18 × 17 (306) homologous terms as available terms. is there. For 16 frequencies, 646 coefficients need to be determined or set to zero to derive the correlation equation. Even in the simpler example for only six frequencies, 216 linear, quadratic, and homologous terms are available, and the 216 coefficients are determined or set to zero to reduce the correlation equation. Need to guide. Crawford et al. (Process Control and Quality, 4 (1992) 13-20) used a neural network to predict research octane numbers from near-infrared absorption data. Absorbance at 231 wavelengths was used as input to a neural network with 24 nodes in one hidden layer. A total of 24 * 231 + 24 (5568) coefficients (weight and bias), including node bias, were determined during network training. A review on non-linear multivariate tests was reported by Sekulic et al. (Analytical Chemistry, 65 (1993) 835A-845A). Describes Local Weighted Regression (LWR), Projection Tracking Regression (PPR), Alternating Condition Prediction (ACE), Multivariate Adaptive Spline (MARS), Neural Network, Nonlinear Principal Component Regression (NLPCR), and Nonlinear Partial Least Squares (NLPLS) Have been. All of these approaches are significantly more difficult to compute than the non-linear post-processing method of the present invention. SUMMARY OF THE INVENTION The present invention is a method of significantly improving the performance of an analyzer based on a spectrometer, using this analyzer to measure a test sample and providing sample property or composition data for processing and analysis applications. The method of the present invention determines the relevant property or composition data of the test sample from the non-linear correlation between the spectrum of the test sample and the value of the property or composition data of the test sample. In the assay of the analyzer, the method of the present invention includes the following steps. (1) The step of measuring the spectrum of the test sample set. (2) measuring the property or composition data of the test sample set; (3) A step of obtaining a linear correlation between the spectrum obtained in the step (1) and the property or composition data obtained in the step (2). (4) A step of obtaining a linear estimate of test sample property or composition data by applying the linear correlation of step (3) to the spectrum of the test set collected in step (1). (5) The property or composition data obtained from step (2) or the difference between the property or composition data obtained from step (2) and the linear estimated value obtained in step (4) is calculated from step (4). Determining a non-linear correction to the linear estimate by applying the obtained linear estimate as a non-linear function. In the analysis, the non-linear test is used to determine the property or composition data of the test sample in the following steps. (6) The step of measuring the spectrum of the test sample. (7) a step of applying the linear correlation determined in step (3) to the spectrum to obtain a linear estimate of the property or composition data. (8) A step of applying the nonlinear correction obtained in the step (5) to the linear estimation value in the step (7) to estimate properties or composition data of the test sample. (9) A step of outputting an estimated value of the property or composition data of the test sample obtained in the step (8). If the non-linear correction of step (5) is calculated by directly fitting the property or composition data obtained from step (2) as a non-linear function of the linear estimate obtained from step (4), In estimating the property or composition data of the test sample, the linear estimate obtained from step (7) is substituted into the nonlinear correction equation obtained from step (5). By applying the difference between the property or composition data obtained from step (2) and the linear estimate of the property or composition data obtained from step (4) as a nonlinear function of the linear estimate obtained from step (4), When calculating the nonlinear correction in 5), in estimating the properties or composition data of the test sample in step (8), substitute the linear estimate obtained from step (7) into the nonlinear correction equation obtained from step (5). Then, the obtained nonlinear correction is added to the linear estimated value obtained from the step (7) to obtain a final estimated value. The linear correction in step (3) consists of a linear multivariate test obtained by regressing reference property data on variables derived from spectral data. Absorbance at a specific wavelength can be used as a spectral variable, and multiple linear regression (MLR) can be used as a regression method. Alternatively, variables (scores) are extracted from the spectral data using principal component regression (PCR), partial least squares (PLS), or conditional principal spectrum analysis (CPSA), and these variables are characterized Regression processing can be performed on the data. The residual, that is, the difference between the actual reference property value and the predicted value by the linear model, is determined for each sample in the test set. Next, the residual of the property value is applied as a nonlinear function (for example, a quadratic or cubic function) of the linear prediction value. Alternatively, the actual reference value can be directly fitted as a non-linear function of the linear predicted value. According to the method of the present invention, the accuracy of the assay and the performance of the spectrometer-based analyzer are significantly improved, while maintaining the outlier detection capability of the linear method. BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a plot of the measured engine octane number (RON) of the engine against the estimated RON obtained from the linear CPSA test of Example 1. Circles represent data of 365 Powerformate samples belonging to the test data set. The solid line is the ASTM 95% reproducibility limit for the measured engine RON calculated for a linear estimate of RON. FIG. 2 shows the residual (RON estimated value obtained from the linear CPSA test—actual RON value obtained from the engine test) for the data set of Example 1 compared to the RON estimated value obtained from the linear CPSA test. Is plotted. Circles represent residual values for 365 Powerformate samples belonging to the test data set. The solid line is the cubic polynomial function of the linear estimate of RON with the best fit of the residuals. FIG. 3 is a plot of the measured engine octane number (RON) of the engine against the estimated RON obtained from the non-linear post-processing of the linear CPSA test of Example 1. Circles represent data of 365 Powerformate samples belonging to the test data set. The solid line is the ASTM 95% reproducibility limit for the engine RON measurement calculated for a non-linear estimate of RON. FIG. 4 is a plot of the measured value of the engine research octane number (RON) against the estimated value of RON obtained from the linear CPSA test of Example 2. The circles represent data of 385 blended gasoline samples belonging to the test data set. The solid line is the cubic polynomial function of the linear estimate of RON with the best fit of the engine RON value. FIG. 5 is a plot of the measured engine research octane number (RON) of the test data set of Example 2 against the estimated value of RON obtained from the linear CPSA test. Diamonds represent data of 238 blended gasoline samples belonging to the test data set. The solid line is the ASTM 9 5% reproducibility limit for engine RON measurements calculated against a linear estimate of RON. FIG. 6 shows the residual (RON estimated value obtained from the linear CPSA test−the measured RON value obtained from the engine test) for the data set of Example 2 with respect to the RON estimated value obtained from the linear CPSA test. Is plotted. The circles represent the residual values of the 385 blended gasoline samples belonging to the test data set. The solid line is the cubic polynomial function of the linear estimate of RON with the best fit of the residuals. FIG. 7 shows the residuals (the estimated RON value obtained from the linear CPSA test−the measured RON value obtained from the engine test) for the test data set of Example 2, and the estimated RON value obtained from the linear CPSA test. Is plotted against. Circles represent residual values of 238 blended gasoline samples belonging to the test data set. The solid line represents the cubic polynomial function of the linear estimate of RON, obtained from the test data set. FIG. 8 is a plot of the measured engine research octane number (RON) for the test data set of Example 2 against the estimated RON obtained from the non-linear post-processing of the linear CPSA test. Diamonds represent data of 238 blended gasoline samples belonging to the test data set. The solid line is the ASTM 95% reproducibility limit for the measured engine RON, calculated for a non-linear estimate of RON. FIG. 9 is a plot of the measured engine research octane number (RON) for the test data set of Example 3 against the estimated RON value obtained from the linear MLR test. The circles represent data of 238 blended gasoline samples belonging to the test data set. The solid line is the ASTM 95% reproducibility limit for the measured engine RON calculated for a linear estimate of RON. FIG. 10 is a plot of the measured value of the engine research octane number (RON) against the estimated value of RON obtained from the linear MLR test of Example 3. The squares represent data of 385 blended gasoline samples belonging to the test data set. The solid line is the cubic polynomial function of the linear estimate of RON with the best fit of the engine RON value. FIG. 11 is a plot of the measured engine octane number (RON) of the engine against the estimated value of RON obtained from the non-linear post-processing of the linear MLR test on the test data set of Example 3. The circles represent data of 238 blended gasoline samples belonging to the test data set. The solid line is the ASTM 95% reproducibility limit for the measured engine RON, calculated for a non-linear estimate of RON. Description of Preferred Embodiments Linear measurements have been used to correlate spectral measurements with chemical composition, physical properties, and performance characteristics. In the linear approach, testing or training is performed using a set of samples of known composition or properties, ie, samples whose composition or properties have already been measured by reference techniques. The test is then preferably applied to the analysis of another set of tests, and the validity of the test is guaranteed by comparing the predicted results with the results obtained by the reference method. Finally, use a calibrated analyzer to analyze unknowns and predict composition or property data. In a linear test, the spectrum of the test sample forms the columns of an f × n-dimensional matrix X. Here, f is the number of individual data points (frequency or wavelength) included in one spectrum, and n is the number of test samples. Assuming that vector y contains composition / property data for n test samples, a linear model is constructed by solving the following equation for p: y = X tp [1] where p is a vector including a regression coefficient. Since f >> n in general, equation [1] cannot be solved directly. In general, three approaches are used. In the case of MLR, k rows (individual frequencies or wavelengths) are selected from X under the condition of k <n, and X is replaced with a smaller matrix X k containing only k rows. Next, p is obtained by calculating a pseudo-inverse of the matrix X k . In the case of PCR, matrix X is the product of three matrices, ie, U (f × k-dimensional loading matrix), Σ (k × k-dimensional singular value matrix), and V (n × k-dimensional score matrix). Decompose into products. X = UΣV t [2] Next, a score is regressed on the property vector y to construct a model. In PLS, decomposition similar to X is performed to obtain an orthogonal matrix, and regression processing of y is performed on the score matrix. This is an estimated value of the property or component concentration in the linear model, and is given by The residual r 1 in this linear model is given by the following equation. If the property y can be appropriately estimated by the linear model, the residual r 1 is expected to be normally distributed. If the linear model is inappropriate due to the nonlinear dependence between the property being modeled and the chemical composition of the sample, a structure is generally observed in the residual. In this case, a more accurate model can be obtained by post-processing the estimated value. For post-processing, one of two forms is available. Residual r 1 And regression processing. Or Here, f (y 1 ) represents a nonlinear function of a linear estimation value of the property / component. The non-linear function is preferably a polynomial expressed as a power of a linear estimate of the property / component. Or When m is 2, the post-processing is secondary, and when m is 3, the post-processing is tertiary. m is chosen based on the ability of the post-processing function to fit the structures present in the residual. When using [5] or [7] to fit the residual as a linear function of the linear estimate of the property, the nonlinear estimate of the component / property is obtained by summing the linear estimate and the nonlinear estimate residual Is obtained. This is a non-linear estimate of the residual obtained. When using [6] or [8], a non-linear estimate of the component / property is obtained directly. The spectral matrix X can be pre-processed and then subjected to a modeling process. Preprocessing includes, for example, mean centering, baseline correction, numerical derivatives, or orthogonalization to the baseline and corrected spectrum (eg, using the CPSA algorithm). A single set of test spectra can be used to develop models of multiple properties, each of which can be separately post-processed. Components to be predicted include individual chemical species (eg, benzene, etc.), a mass of chemical species (eg, olefins, aromatic compounds, etc.), physical properties (eg, refractive index, specific gravity, etc.), Chemical properties (eg, stability, etc.) or performance properties (eg, octane number, cetane number, etc.). Three examples are presented. Example 1 A regression process of a research octane number (RON) was performed on a data set of 365 POWERFORMATE samples (reformer product samples) by using conditional main spectrum analysis (CPSA), which is a linear regression method. Was. FT-IR spectrum, taking samples to the cells of the nominal path length 0.5mm with calcium fluoride windows was measured at a resolution 2 cm -1 over 7000~400Cm -1 range. The CPSA assay, 5300.392~3150.151cm -1, 2 599.573~2445.296cm -1, using the absorbance in the frequency range of 2274.627~1649.804cm -1. The absorbance in the range 7000-5300.392 cm -1 is too weak to correlate significantly. The frequency ranges 3150.151-2599.573 cm- 1 and 1649.804-400 cm- 1 are excluded because they contain absorbances that exceed the dynamic response range of the FT-IR instrument. The frequency range from 2445.296 to 2274.627 cm -1 is excluded to prevent interference with atmospheric oxygen dioxide. The CPSA test utilizes two sets of polynomial corrections to compensate for baseline variation. The first set compensates for the range 5300.392 to 3150.151 cm -1 and the second set compensates for the range of 29599.573 to 1649.804 cm -1 . The CPSA assay also performs a water vapor correction to minimize the effect of equipment purge variations on the estimate. An RON test was performed using five conditional principal components. The coefficients of the five conditional principal components were determined using PRESS based on stepwise regression. A plot of the RON linear prediction against the reference (engine) value is shown in FIG. The standard error of the estimate for the data in FIG. 1 is a 0.54 RON value. For the quadratic function of the linear prediction of RON, the RON residual (linear prediction of RON from FT-IR-engine RON) was regressed. A plot of the RON residual against the linear prediction of RON is shown in FIG. 2 with a quadratic fit to the residual. FIG. 3 shows the results of the model obtained by applying the quadratic correction of FIG. 2 to the data of FIG. This is the same as applying the reference (engine) RON value as a quadratic function of the RON linear prediction. The standard error of the estimated value in FIG. 2 is a 0.41 RON value. Applying the nonlinear post-processing method described herein improves the RON estimation by 24% over the linear method used previously, but adds only three coefficients in addition to the five coefficients of the first linear correlation. Just do it. Example 2 A test data set of spectra of 385 blended gasoline samples was subjected to a research octane number (RON) regression process using conditional main spectrum analysis (CPSA) which is a linear regression method. FT-IR spectrum, taking samples to the cells of the nominal path length 0.5mm with calcium fluoride windows was measured at a resolution 2 cm -1 over 7000~400Cm -1 range. For the CPSA assay, absorbances in the frequency range of 4850.094-3324.677 cm -1 and 2 200.381-1633.476 cm -1 were used. Absorbances in the range 7000-4850.094 cm- 1 are too weak to correlate significantly. The frequency ranges of 3150.15 1-2400 cm- 1 and 1634.376-400 cm- 1 are excluded because they contain absorbances that exceed the dynamic response range of the FT-IR instrument. The frequency range between 2400 and 2200.381 cm -1 is excluded to prevent interference with atmospheric oxygen dioxide. The CPSA test utilizes two sets of polynomial corrections to compensate for baseline variation. The first set (third-order polynomial) compensates for the range 5300.392-3150.151 cm -1 and the second set (second-order polynomial) compensates for the range 2599.573-1649.804 cm -1 . The CPSA assay also performs a water vapor correction to minimize the effect of equipment purge variations on the estimate. The RON test was performed using 14 conditional principal components. The coefficients of the 14 conditional principal components were determined using PRESS based on stepwise regression. A plot of the RON linear prediction against the reference (engine) value is shown in FIG. The standard error of the test in the linear CPSA model is 0.411. The linear model shown in FIG. 4 was applied to the analysis of 238 blended gasoline samples (314 separate engine measurements) that were not included in the set used to build the model. The predicted values obtained from the linear model for these test samples are shown in FIG. For this linear model, the standard error of validity for the test sample is 0.569, and only 84% of the samples have predicted values that match the reference engine values within the ASTM engine reproduction limits. For the cubic function of the linear prediction value of RON, the RON residual of 385 samples included in the test set (linear prediction value of RON from FT-IR−engine RON) was regressed. A plot of the RON residual against the linear prediction of RON is shown in FIG. 6, along with a cubic fit to the residual. A third-order post-processing of the linear estimate of RON reduces the standard error of the test to 0.327. Figure 7 shows that the RON residuals (linear prediction of RON from FT-IR-engine RON) of the 238 samples included in the test set were generated using the coefficients obtained from the test sample fitting. It is plotted against a cubic curve. FIG. 8 shows a plot of the engine RON of the test set against the RON value estimated by cubic post-processing of the linear estimate of RON. With tertiary post-processing, the standard error of effectiveness drops to 0.397, and 95% of the estimated RON values are consistent with the reference engine values within the ASTM reproducibility of the RON engine. Applying nonlinear post-processing improves the RON estimate of the test set by 30%, but requires only four additional coefficients in addition to those used in the first linear test . In ASTM tests such as the D2699 RON test, values measured by two different operators in two different laboratories are expected to be within 95% of the estimated reproducibility at that time. With nonlinear post-processing, the IR RON estimate is consistent with the D2699 RON test data within 95% reproducibility at that point, indicating that the IR estimate is equivalent to the engine measurement. Example 3 Using the same set of spectra from the 385 blended gasoline samples described in Example 2, according to the method presented by Lambert and Martens (European Patent No. 0 285 251 B1, August 28, 1991). A multiple linear regression (MLR) model was constructed. The absorbance at the frequency closest to the 15 described by Lambert and Martens (Table 1) is corrected by subtracting the absorbance at the baseline point, which is then regressed against engine RON values. Thus, the coefficients in Table 2 were obtained. The standard error of the estimation in this linear MLR model was 0.459. Using the MLR model, the same set of spectra of test samples of 238 blended gasolines was analyzed. The MLR estimates were compared to 314 engine measurements in the test set. The predicted values obtained from this linear MLR model are shown in FIG. In this linear MLR model, the standard error of test sample validity is 0.457, and only 81% of the samples are predicted within the ASTM engine reproduction limit. For the 385 blended gasoline sample test set, the engine RON value was fitted as a cubic function of the linear MLR estimate. This fit is shown graphically in FIG. Third order post-processing was applied to the linear MLR estimates of the test set of 238 blended gasolines. A comparison of the non-linear post-processing MLR estimate with 314 separate engine measurements is shown in FIG. The standard error of the validity of the test set is 0.406, and the estimated sample within the reproducible range of the ASTM RON test is 91% of the whole. Applying a third-order nonlinear post-processing method improves the linear MLR test by 11%, but requires only four additional coefficients besides those used in the linear MLR test.

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),AU,CA,JP,SG (72)発明者 ブラウン・ジェイムズ・エム アメリカ合衆国、ニュージャージー州 08822、フレミントン、レーン ドライブ 31────────────────────────────────────────────────── ─── Continuation of front page    (81) Designated countries EP (AT, BE, CH, DE, DK, ES, FR, GB, GR, IE, IT, LU, M C, NL, PT, SE), AU, CA, JP, SG (72) Inventor Brown James M             New Jersey, United States             08822, Flemington, Lane Drive               31

Claims (1)

【特許請求の範囲】 1.テストサンプルのスペクトルとテストサンプルの性質または組成データの値 との非線形相関から、テストサンプルの該当性質または組成データを求める方法 であって、 1.テストサンプルのスペクトルを測定する工程と、 2.線形相関を該スペクトルに適用して、性質または組成データの線形推定 値を得る工程と、 3.非線形補正を工程(2)の線形推定値に適用して、テストサンプルの性質ま たは組成データを推定する工程と、 4.工程(3)で求めたテストサンプルの性質または組成データの推定値を出力 する工程と、 によってテストサンプルを解析すること包含し、該線形相関および非線 形補正は、 a)検定サンプル集合のスペクトルを測定する工程と、 b)参照方法を使用して該検定サンプル集合の性質または組成データを測定す る工程と、 c)工程(a)で得られたスペクトルと工程(b)で得られた性質または組成データ との線形相関を求める工程と、 d)工程(c)の線形相関を工程(b)で収集したスペクトルに適用することによっ て、前記検定サンプルの性質または組成データの線形推定値を求める工程と、 e)工程(b)から得られた性質もしくは組成データ、または工程(b)から得られ た性質もしくは組成データと工程(d)で得られた線形推定 値との差を工程(d)から得られた線形推定値の非線形関数として当てはめること によって、工程(d)から得られた線形推定値に対する非線形補正を求める工程と 、 から求められるものである前記方法。 2.工程(3)及び(e)における非線形補正は、工程(3)におけるテストサンプル の性質または組成データの推定が工程(2)から得られる線形推定値を工程(e)か らの線形推定値の非線形補正式に代入することを含むように、工程(b)から得ら れた性質もしくは組成データを直接工程(d)からの線形推定値の非線形関数とし て当てはめることによって計算される請求の範囲1項記載の方法。 3.工程(3)及び(e)における非線形相関は、工程(3)におけるテストサンプル の性質または組成データの推定が工程(2)から得られる線形推定値を工程(e)か らの非線形補正式に代入し、得られる非線形補正値を工程(2)から得られる線形 推定値に加えて最終推定値を得るするように、工程(b)から得られた性質もしく は組成データと工程(4)から得られる性質または組成データの線形推定値との差 を工程(d)から得られる線形推定値の非線形関数として工程(d)からの線形推定 値の非線形関数として当てはめることによって計算される請求の範囲1項記載の 方法。 4.非線形補正の形態は多項式である請求の範囲1項記載の方法。 5.非線形補正の形態は多項式である請求の範囲2項記載の方法。 6.非線形補正の形態は多項式である請求の範囲3項記載の方法。 7.前記性質はリサーチ法オクタン価である請求の範囲1項記載の方法。 8.前記性質はリサーチ法オクタン価である請求の範囲2項記載の方法。 9.前記性質はリサーチ法オクタン価である請求の範囲3項記載の方法。[Claims] 1. Test sample spectra and test sample property or composition data values To determine the relevant property or composition data of the test sample from the nonlinear correlation with And     1. Measuring the spectrum of the test sample;     2. Apply linear correlation to the spectrum to obtain a linear estimate of property or composition data Obtaining a value;     3. Apply nonlinear correction to the linear estimate in step (2) to reduce the properties of the test sample. Or estimating composition data;     Four. Outputs estimated values of test sample properties or composition data obtained in step (3) The process of        Analyzing the test sample by the linear correlation and nonlinear Shape correction is   a) measuring the spectrum of the test sample set;   b) determine the property or composition data of the test sample set using a reference method; Process,   c) spectrum obtained in step (a) and property or composition data obtained in step (b) Determining a linear correlation with   d) By applying the linear correlation of step (c) to the spectrum collected in step (b) Determining a linear estimate of the property or composition data of the test sample;   e) Property or composition data obtained from step (b) or obtained from step (b). Properties or composition data and the linear estimate obtained in step (d) Fitting the difference from the value as a nonlinear function of the linear estimate obtained from step (d) Determining a non-linear correction to the linear estimate obtained from step (d) ,      The method as described above. 2. The non-linear corrections in steps (3) and (e) are based on the test sample in step (3). Estimation of the property or compositional data of step (e) is based on the linear estimate obtained from step (2). Resulting from step (b) to include substituting these linear estimates into the nonlinear correction equation. Property or composition data as a non-linear function of the linear estimate from step (d) 2. The method of claim 1, wherein said method is calculated by fitting. 3. The non-linear correlations in steps (3) and (e) are based on the test sample in step (3). Estimation of the property or compositional data of step (e) is based on the linear estimate obtained from step (2). Substituting into these nonlinear correction formulas, the obtained nonlinear correction value is obtained from the linear The properties obtained from step (b) or the properties obtained from step (b) so as to obtain a final estimate in addition to the estimate Is the difference between the composition data and the linear estimate of the property or composition data obtained from step (4). As the non-linear function of the linear estimate obtained from step (d) 2. The method according to claim 1, wherein the value is calculated by applying the value as a nonlinear function. Method. 4. The method of claim 1, wherein the form of the non-linear correction is a polynomial. 5. 3. The method according to claim 2, wherein the form of the nonlinear correction is a polynomial. 6. 4. The method according to claim 3, wherein the form of the nonlinear correction is a polynomial. 7. The method of claim 1 wherein said property is a research octane number. 8. 3. The method of claim 2 wherein said property is a research octane number. 9. 4. The method of claim 3 wherein said property is a research octane number.
JP51922496A 1994-12-13 1995-12-13 Nonlinear multivariate infrared analysis Expired - Fee Related JP3671241B2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US35497694A 1994-12-13 1994-12-13
US08/354,976 1994-12-13
US08/567,613 US5641962A (en) 1995-12-05 1995-12-05 Non linear multivariate infrared analysis method (LAW362)
US08/567,613 1995-12-05
PCT/US1995/016129 WO1996018881A1 (en) 1994-12-13 1995-12-13 Non linear multivariate infrared analysis method

Publications (2)

Publication Number Publication Date
JPH10512667A true JPH10512667A (en) 1998-12-02
JP3671241B2 JP3671241B2 (en) 2005-07-13

Family

ID=26998647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51922496A Expired - Fee Related JP3671241B2 (en) 1994-12-13 1995-12-13 Nonlinear multivariate infrared analysis

Country Status (5)

Country Link
EP (1) EP0801737A4 (en)
JP (1) JP3671241B2 (en)
AU (1) AU689016B2 (en)
CA (1) CA2208216C (en)
WO (1) WO1996018881A1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1030982A (en) * 1996-07-13 1998-02-03 Horiba Ltd Method for analysing multicomponent aqueous solution
JP2004132921A (en) * 2002-10-15 2004-04-30 Yukihiro Toyoda Method of predicting property
WO2005111583A1 (en) * 2004-05-17 2005-11-24 The New Industry Research Organization Method for nondestructively examining component of vegetable or the like by near-infrared spectroscopy and its device
JP2012506532A (en) * 2008-10-20 2012-03-15 ナルコ カンパニー A method for predicting hydrocarbon process stream stability using near-infrared spectra
JP6725928B1 (en) * 2020-02-13 2020-07-22 東洋インキScホールディングス株式会社 Regression model creation method, regression model creation device, and regression model creation program

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100425975C (en) * 2004-07-29 2008-10-15 中国石油化工股份有限公司 Method for measuring character data of gasoline from near infrared light spectrum
CN103134767B (en) * 2013-01-30 2015-04-01 华中科技大学 Method for liquor quality identification through infrared spectrum revision
CN112683816B (en) * 2020-12-25 2021-08-06 中船重工安谱(湖北)仪器有限公司 Spectrum identification method for spectrum model transmission

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4800279A (en) * 1985-09-13 1989-01-24 Indiana University Foundation Methods and devices for near-infrared evaluation of physical properties of samples
ES2041801T3 (en) * 1987-08-18 1993-12-01 Bp Oil International Limited METHOD FOR THE DIRECT DETERMINATION OF PHYSICAL PROPERTIES OF HYDROCARBON PRODUCTS.
US5349188A (en) * 1990-04-09 1994-09-20 Ashland Oil, Inc. Near infrared analysis of piano constituents and octane number of hydrocarbons
JP3027241B2 (en) * 1991-07-30 2000-03-27 株式会社堀場製作所 Foreign matter inspection device
US5223714A (en) * 1991-11-26 1993-06-29 Ashland Oil, Inc. Process for predicting properties of multi-component fluid blends

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1030982A (en) * 1996-07-13 1998-02-03 Horiba Ltd Method for analysing multicomponent aqueous solution
JP2004132921A (en) * 2002-10-15 2004-04-30 Yukihiro Toyoda Method of predicting property
WO2005111583A1 (en) * 2004-05-17 2005-11-24 The New Industry Research Organization Method for nondestructively examining component of vegetable or the like by near-infrared spectroscopy and its device
JPWO2005111583A1 (en) * 2004-05-17 2008-03-27 財団法人新産業創造研究機構 Non-destructive inspection method for components such as vegetables by near infrared spectroscopy and the same device
JP2012506532A (en) * 2008-10-20 2012-03-15 ナルコ カンパニー A method for predicting hydrocarbon process stream stability using near-infrared spectra
JP6725928B1 (en) * 2020-02-13 2020-07-22 東洋インキScホールディングス株式会社 Regression model creation method, regression model creation device, and regression model creation program
WO2021162033A1 (en) * 2020-02-13 2021-08-19 東洋インキScホールディングス株式会社 Regression model creation method, regression model creation device, and regression model creation program
JP2021128042A (en) * 2020-02-13 2021-09-02 東洋インキScホールディングス株式会社 Regression model creation method, regression model creation device, and regression model creation program

Also Published As

Publication number Publication date
JP3671241B2 (en) 2005-07-13
EP0801737A4 (en) 1999-03-31
CA2208216A1 (en) 1996-06-20
CA2208216C (en) 2007-03-13
WO1996018881A1 (en) 1996-06-20
EP0801737A1 (en) 1997-10-22
AU689016B2 (en) 1998-03-19
AU4468596A (en) 1996-07-03

Similar Documents

Publication Publication Date Title
US5641962A (en) Non linear multivariate infrared analysis method (LAW362)
US6223133B1 (en) Method for optimizing multivariate calibrations
CA2092713C (en) Spectral data measurement and correction
EP0552291B1 (en) Method of estimating property and/or composition data of a test sample
McGlone et al. Comparing density and NIR methods for measurement of kiwifruit dry matter and soluble solids content
US5459677A (en) Calibration transfer for analytical instruments
US5121337A (en) Method for correcting spectral data for data due to the spectral measurement process itself and estimating unknown property and/or composition data of a sample using such method
US5360972A (en) Method for improving chemometric estimations of properties of materials
CN105319198B (en) Benzene content in gasoline Forecasting Methodology based on Raman spectrum analytic technique
CN108287141A (en) A kind of multicomponent gas concentration analysis method based on spectroscopic methodology
Westerhaus et al. Quantitative analysis
CN107966499B (en) Method for predicting crude oil carbon number distribution by near infrared spectrum
JP3671241B2 (en) Nonlinear multivariate infrared analysis
Lorber et al. Local centering in multivariate calibration
EP3861320B1 (en) Systems and methods for implicit chemical resolution of vacuum gas oils and fit quality determination
US11754539B2 (en) System and computer-implemented method for extrapolating calibration spectra
JPH02290537A (en) Method for estimating eating taste value by near infrared ray
CN110646373A (en) Method for measuring sugar content of tobacco flavor and fragrance
JP2000074828A (en) Analytical method for physical property value of hydrocarbon by near-infrared spectrum method
Pavoni et al. FT‐IR Spectroscopy and Chemometrics as a Useful Approach for Determining Chemical‐Physical Properties of Gasoline, by Minimizing Analytical Times and Sample Handling
Mirghani et al. Multivariate calibration of Fourier transform infrared spectra for determining thiobarbituric acid-reactive substance content in palm oil
Puchwein et al. Use of indirect multivariate calibration for quality control of agricultural products by near infrared spectroscopy
CN114910440A (en) Method for rapidly analyzing quality stability of feed liquid preparation
TH2201003268A (en) Method for analyzing moisture content Total amount of curcumin (Curcumin) and curcumin (Curcuminoids) in turmeric powder by infrared spectroscopy technique.
CN110646403A (en) Method for measuring total volatile component amount of tobacco essence and flavor

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050330

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050330

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050330

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080428

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees