SE516343C2 - Metod och anordning för kalibrering av indata - Google Patents

Metod och anordning för kalibrering av indata

Info

Publication number
SE516343C2
SE516343C2 SE0000563A SE0000563A SE516343C2 SE 516343 C2 SE516343 C2 SE 516343C2 SE 0000563 A SE0000563 A SE 0000563A SE 0000563 A SE0000563 A SE 0000563A SE 516343 C2 SE516343 C2 SE 516343C2
Authority
SE
Sweden
Prior art keywords
descriptor
orthogonal
property
new
charge
Prior art date
Application number
SE0000563A
Other languages
English (en)
Other versions
SE0000563D0 (sv
SE0000563L (sv
Inventor
Johan Trygg
Svante Wold
Original Assignee
Johan Trygg
Svante Wold
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Johan Trygg, Svante Wold filed Critical Johan Trygg
Priority to SE0000563A priority Critical patent/SE516343C2/sv
Publication of SE0000563D0 publication Critical patent/SE0000563D0/sv
Priority to US10/204,646 priority patent/US6853923B2/en
Priority to EP01910276A priority patent/EP1269341A1/en
Priority to PCT/SE2001/000399 priority patent/WO2001063441A1/en
Priority to AU2001237850A priority patent/AU2001237850A1/en
Publication of SE0000563L publication Critical patent/SE0000563L/sv
Publication of SE516343C2 publication Critical patent/SE516343C2/sv

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/10Composition for standardization, calibration, simulation, stabilization, preparation or preservation; processes of use in preparation for chemical testing

Description

20 25 30 516 343 2 . u | a Q » | n | . - ..
Geladi, D MacDougall och H Martens, Linearization and Scatter-Correction for Near-Infrared Reflectance Spectra of Meat, (Linearisering och spridningskorrigering för reflektansspektra hos kött inom det nära infraröda området), Applied Spectroscopy 3 (1985), 491-50, Fourier transformation (F ourier-omvandling) av P C Williams och K Norris, Near-Infrared Technology in Agricultural and Food Industries (N ärainfrarödteknolo gi inom Jordbruks- och Livsmedelsindustriema), American Cereal Association, St Paul, MN (1987), Principal Component Analysis (Huvudkomponentanalys) (PCA) av J Sun, Statistical Analysis of NIR data : Data pretreatment, J Chemom, 11 (1997) 525-532, Variable Selection av H Martens och T Naes, Multivariate Calibration, Wiley, New York, 1989 och M Baroni, S Clementi, G Cruciani, G Constantino och D Riganelli, Predictive ability of regression models, del 2 : Selection of the best predictive PLS model, J Chemom, 6 (1992) 347-56 och Base line correction av H Martens och T Naes, Multivariate Calibration, Wiley, New York, 1989 och R J Bames, M S Dhanoa och S J Lister, Standard Nonnal Variate Transformation och De- trending of Near-Infrared Diffuse Reflectance Spectra, Appl. Spectrosc. 43 (1989) 772-777.
Dessa signalkorrigeringar utgöra olika fall av filtrering där en signal (t ex ett NIR- spektrum) fås att uppvisa "bättre egenskaper" genom att låt den gå genom ett filter. Syflena med filtrering är ofta relativt vaga; det är inte alltid lätt att specificera vad som menas med "bättre egenskaper". T o m i fallet med kalibrering där det är möjligt att specificera detta syfie i termer av mindre förutsägelsefel eller enklare kalibreringsmodeller är det svårt att konstruera allmänna filter som verkligen förbättrar dessa egenskaper hos data.
Proj ektioner mot latenta strukturer med hjälp av partiella minstakvadrater (PLS) är ett av de viktigaste allmänt tillämpade regressionsförfarandena för analys av flervariabeldata där ett kvantitativt förhållande mellan en deskriptormatris X och en kvalitetsmatris Y önskas.
Flervariabelkalibrering, klassificering, diskriminantanalys och mönsteridentifiering är några få av de områden som kan nämnas där PLS har visat sig vara ett värdefullt verktyg. De viktigaste orsakema till dess framgång beror på att PLS kan klara av kolinearitet bland variabler, brus hos både X och Y, moderata mängder saknade data både hos X och Y, och PLS kan även samtidigt hantera multipla Y. Dessa typer av komplicerade data är nu vanliga beroende på tillkomsten av analysinstrument såsom HPLC, LC-UV, LC-MS och spektroskopiinstrument.
Förbättrade och modifierade PLS-förfaranden där det s k NIPALS-törfarandet används av H Wold, Nonlinear estimation by iterative least Squares procedures hos F David (förläggare), Research Papers in Statistics, Wiley, New York, 1966 sidoma 411-444, har föreslagits sedan uppkomsten av PLS år 1977. En modifiering av PLS-förfarandet presenteras 10 15 20 25 30 516 343 3 a u u u ao här. Den syftar till att förbättra tolkningen av PLS-modellema, minska modellkomplexiteten och förbättra förutsägelserna och stabiliteten.
Spektroskopfórfarandena utgör ett relativt billigt, snabbt och enkelt sätt för att ta rätt på data om prover. Vid karakteriseringen av organiska substanser såsom trä, pappersmassa, farmaceptiska tabletter, etanolinnehåll etc har nära infraröda instrument (NIR), NMR- instrument och andra instrument visat sig vara användbara.
Sammanfattning av den beskrivna uppfinningen Föreliggande uppfinning avser ett allmänt förbehandlingsförfarande som kallas ortogonala partiella minstakvadrater (OPLS) för användning inom flervariabeldataanalys (MVA). Konceptet avser att eliminera sådana variationer från X (diskriptorvariabler) som är irrelevanta för Y (kvalitetsvariabler, t ex utbyte, kostnad eller toxicitet). Med matematiska termer är detta likvärdigt med att eliminera den variation hos X som är ortogonal mot Y. S Wold, H Antti, F Lindgren, J Öhman har tidigare i Orthogonal signal correction of near- infrared spectra, Chemometrics and Intelligent Laboratory Systems, 44 (1998) 175-185, beskrivit den ortogonala si gnalkonigeringstekniken (OSC), vilken har visat sig vara framgångsrik när det gäller att eliminera information hos X som är irrelevant för Y. I föreliggande beskrivning indikeras ett förfarande baserat på samma kriterier, men med armorlunda medel.
I enlighet med föreliggande uppfinning förbättrar OPLS-förfarandet kvalitén hos en resulterande kalibreringsmodell med avseende på förutsägelsefönnåga, modellsparsamhet och tolkning.
För att lösa dessa problem och för att uppnå dessa ändamål anges genom föreliggande uppfinning ett förfarande för koncentrations- eller egenskapskalibrering av indata från prover av substanser eller ämnen, varvid nämnda kalibrering är bestämmande för en flltermodell för ytterligare prover av samma substans eller ämne, innefattande att indata valfritt omvandlas, centreras och skalas för att åstadkomma en deskriptoruppsättning och en koncentrations- eller egenskapsuppsättning. Genom förfarandet avlägsnas information eller systematisk variation hos indata som inte är korrelerad mot koncentrations- eller egenskapsuppsättningen, genom att följande steg anordnas : framställning av en deskriptorviktuppsättning, vilken är normaliserad, genom projicering av deskriptoruppsättningen på koncentrations- eller egenskapsuppsättningen, projicering av deskriptoruppsättningen på deskriptorviktuppsättningen, framställning av en deskriptortaluppsättning, projicering av deskriptoruppsättningen på 10 15 20 25 30 516 343 4 o ~ o I » no deskriptortaluppsättningen, framställning av en deskriptorladdningsuppsättning, proj icering av egenskapsuppsättningen på deskriptortaluppsättningen, framställning av en egenskapsviktuppsättning, projicering av egenskapsuppsättningen på egenskapsviktuppsättningen, framställning av en egenskapstaluppsättning; jämförelse mellan deskriptorladdningsuppsättningen och deskriptorviktuppsättningen, och deras skillnad, för att på så sätt erhålla den del av deskriptorladdningsuppsättningen som inte står i samband med egenskapsuppsättningen; användning av nämnda skillnadsviktuppsättning, vilken är normaliserad, som en startuppsättning för analys av partiella minstakvadrater; beräkning av motsvarande ortogonala deskriptortaluppsättning som proj ektion mellan deskriptoruppsättningen och nämnda nonnaliserade ortogonala skillnadsviktuppsättning (wortho), och beräkning av en motsvarande ortogonal deskriptorladdningsuppsättning som projektion av deskriptoruppsättningen på den ortogonala deskriptortaluppsättningen; eliminering av den yttre produkten av den ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen från deskriptoruppsättningen, för att på så sätt framställa restdata som används som deskriptoruppsättning i en följande komponent; upprepning av ovan nämnda steg för varje ortogonal komponent; varvid restdata nu filtreras från stark systematisk variation vilken kan moduleras bilinjärt som den yttre produkten av den ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen, vilket på så sätt ger en ortogonal deskriptoruppsättning som är ortogonal mot egenskapsuppsättningen; valfritt utförande av en huvudkomponentanalys (PCA) av den ortogonala deskriptoruppsättningen, vilket ger upphov till en bilinjär uppdelning av den ortogonala deskriptoruppsättningen som den yttre produkten av taluppsättningen vid huvudkomponentanalysen och laddningsuppsättningen vid huvudkomponentanalysen och resterna vid huvudkomponentanalysen, tillägg av restdata från huvudkomponentanalysen tillbaka till filtrerade restdata.
För filtrering av nya data utförs enligt förfarandet följ ande steg : proj icering av en ny deskriptoruppsättning på den norrnaliserade ortogonala skillnadsviktuppsättningen, vilket på så sätt ger upphov till en ny ortogonal deskriptortaluppsättning ; avlägsnande av produkten mellan den nya ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen från den nya deskriptoruppsättningen, vilket 10 15 20 25 30 516 343 5 n ø n o n a o o c en på så sätt ger nya rester, vilka används som en ny deskriptoruppsättning i nästa ortogonala komponent; upprepning av nämnda filtrersteg för nya data för alla uppskattade ortogonala komponenter; datorberäkning av en ny ortogonal deskriptoruppsättning som den yttre produkten av den nya ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen, datorberäkning av en ny ortogonal huvudkomponenttaluppsättning från projiceringen av den nya ortogonala deskriptoruppsättningen på laddningsuppsättningen från huvudkomponentanalysen, varvid de nybildade restema från huvudkomponentanalysen läggs till tillbaka i de nya restema om huvudkomponentanalysen har använts på den ortogonala deskriptoruppsättningen, och endast den yttre produkten av taluppsättningarna från huvudkomponentanalysen och huvudkomponentladdningsuppsättningen har avlägsnats från den ursprungliga deskriptoruppsättningen.
För multipla koncentrations- eller egenskapsuppsättningar beräknas en huvudkomponentanalysmodell av nämnda egenskapsuppsättningar och ovan nämnda steg upprepas för varje separat taluppsättning från huvudkomponentanalysen och med användning av den ortogonala deskriptom som inmatningsdeskriptoruppsättning tör varje efterföljande taluppsättning från huvudkomponentanalysen, för att på så sätt åstadkomma nämnda filtreringsmodell för filtrering av ytterligare prover av sarnma typ.
Vidare genom utförande av en vanlig PLS-analys utförs med filtrerade restdata och koncentrations- eller egenskapsuppsättningen, och en vanlig PLS-analys med nämnda filtrerade nya restuppsättningar som förutsägelseuppsättning.
Vid en utföringsforrn av föreliggande uppfinningen kan, genom att hitta nämnda ortogonala komponenter för varje komponent separat, en mängd störande variation i varje partiell minstakvadratkomponent analyseras.
Vid en annan utföringsform utnyttjas korsvalidering och/eller egenvärdeskriteria för att minska överanpassning.
Ytterligare en annan utföringsforrn innefattar att i nämnda huvudanalys (PCA) väljs komponenterna i enlighet med en korsvalidering eller egenvärdeskriteria.
Ytterligare en annan uttöringsforrn innefattar att det är utformat för att avlägsna specifika typer av variationer hos deskriptoruppsättningen när en oönskad eller icke relevant koncentrations- eller egenskapsuppsättning eller föreligger, genom användning av den ortogonala deskriptom som datauppsättning av intresse, eftersom den inte innehåller någon 10 15 20 25 30 516 343 6 variation som är korrelerad mot koncentrations- eller egenskapsuppsättningen.
Föreliggande uppfinning avser även en anordning för koncentrations- eller egenskapskalibrering av indata från prover av substanser eller ämnen, varvid nämnda kalibrering är bestämmande för en filtennodell för ytterligare prover av samma substans eller ämne, innefattande att valfritt omvandla, centrera och skala indata för att erhålla en deskriptoruppsättning (X) och en koncentrations- eller egenskapsuppsättning.
Filterrnodellen avlägsnar information eller systematisk variation hos indata som inte är korrelerad mot koncentrations- eller egenskapsuppsättningen, genom att den innefattar : projiceringsorgan för att åstadkomma en deskriptorviktuppsättning, vilken normaliseras, genom projicering av deskriptoruppsättningen på koncentrations- eller egenskapsuppsättningen ; projiceringsorgan för projicering av deskriptoruppsättningen på deskriptorviktuppsättningen för framställning av en deskriptortaluppsättning; proj icering för deskriptoruppsättningen på deskriptortaluppsättningen för att åstadkomma en deskriptorladdningsuppsättning ; proj iceringsorgan för projicering av egenskapsuppsättningen på deskriptortaluppsättningen för att åstadkomma en egenskapsviktuppsättning ; projiceringsorgan för projicering av egenskapsuppsättningen på egenskapsviktuppsättningen för att åstadkomma en egenskapstaluppsättning ; jämförelseorgan för jämförelse av deskriptorladdningsuppsättningen och deskriptorviktuppsättningen, och deras skillnad, för att på så sätt erhålla den del av deskriptorladdningsuppsättningen som inte står i samband med egenskapsuppsättningen ; användning av nämnda skillnadsviktuppsättning, vilken är normaliserad, som en startuppsättning för partiell minstakvadratanalys; beräkningsorgan för motsvarande ortogonala deskriptortaluppsättning som proj ektion mellan deskriptoruppsättningen och nämnda norrnaliserade ortogonala skillnadsviktuppsättning, och för beräkning av en motsvarande ortogonal deskriptorladdningsuppsättning som proj ektion av deskriptoruppsättningen på den ortogonala deskriptortaluppsättningen ; beräkningsorgan för avlägsnande av den yttre produkten av den ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen från deskriptoruppsättningen, vilket på så sätt ger restdata som används som deskriptoruppsättning i nästa komponent.
Upprepad användning av ovanstående organ och steg för varje varvid den dessutom 10 15 20 25 30 516 343 7 u n « . n .n innefattar ; filtreringsorgan för restdata från en stark systematisk variation som kan modelleras bilinjärt som den yttre produkten av den ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen, vilket på så sätt ger en ortogonal deskriptoruppsättning som är ortogonal mot egenskapsuppsättningen ; valfri framställning av analysorgan för en huvudkomponentanalys (PCA) på den ortogonala deskriptoruppsättningen, vilket ger en bilinjär uppdelning av den ortogonala deskriptoruppsättningen som den yttre produkten av taluppsättningen från huvudkomponentanalysen och laddningsuppsättningen från huvudkomponentanalysen och restema från huvudkomponentanalysen, med tillägg av restdata från huvudkomponentanalysen tillbaka till de filtrerade restdata ; Varvid den innefattar filtreringsorgan för nya data, och utförande med följande organ: organ för proj icering av en ny deskriptoruppsättning på den norrnaliserade ortogonala skillnadsviktuppsättningen, vilket på så sätt ger en ny ortogonal deskriptortaluppsättning ; beräkningsorgan för avlägsnande av produkten mellan den nya ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen från den nya deskriptoruppsättningen, vilket på så sätt ger nya rester vilka används som en ny deskriptoruppsättning i en följande ortogonal komponent.
Upprepad användning av nämnda filtrering av nya data för alla uppskattade ortogonala komponenter, innefattande : beräkningsorgan för beräkning av en ny ortogonal deskriptor som den yttre produkten av den nya ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen, datorberäkning av en ny ortogonal huvudkomponenttaluppsättning från proj iceringen av den nya ortogonala deskriptoruppsättningen på laddningsuppsättningen från huvudkomponentanalysen, varvid de nybildade restema från huvudkomponentanalysen läggs tillbaka i de nya restema om en huvudkomponentanalys har använts på den ortogonala deskriptoruppsättningen, och enbart avlägsnande av den yttre produkten av taluppsättningama från huvudkomponentanalysen och huvudkomponentsladdningsuppsättningen från den ursprungliga deskriptoruppsättningen.
För multipla koncentrations- eller egenskapsuppsättningar: beräkning av en huvudkomponentanalysmodell på nämnda egenskapsuppsättningar och upprepad användning av de ovan nämnda organen för varje separat taluppsättning från huvudkomponentanalysen 10 15 20 25 30 516 343 8 och användning av den ortogonala deskriptom som inmatningsdeskriptoruppsättning för varje efterföljande taluppsättning vid huvudkomponentanalysen, för att på så sätt åstadkomma nämnda filtreringsmodell för filtrering av ytterligare prover av samma typ.
Anordningen innefattar dessutom organ för partiell minstakvadratanalys för filtrerade restdata och koncentrations- eller egenskapsuppsättningen, och för nämnda filtrerade nya restuppsättningar som förutsägelseuppsättning.
Anordningen är vidare i stånd att erbjuda andra utföringsformer av förfarandet i överensstämmelse med de bifogade underkraven.
Kortfattad beskrivning av ritningarna För en mer fullständig förståelse av föreliggande uppfinning och för vidare ändamål och fördelar med densamma hänvisas nu till nedanstående beskrivning som betraktas -i samband med bilagda figurer, där : Fig. 1 illustrerar en översikt för ortogonala partiella minstakvadrater (OPLS) i överensstämmelse med föreliggande uppfinning; Fig. Za och 2b illustrerar ett figurexempel på effekten av OPLS, varvid fig. 2a illustrerar spaltcentrerade obehandlade NIR-spektra och fig. 2b visar OPLS-behandlade NIR- spektrai överensstämmelse med föreliggande uppfinning; Fig. 3 illustrerar normen för en ortogonal vektor; Fig. 4 illustrerar en förklarad variation för ortogonala OPLS-komponenter; Fig. 5 illustrerar en första huvudsakli g ortogonal laddning av en störvariation hos X; Fig. 6 illustrerar en andra huvudsaklig ortogonal laddning av en fördelningsvariation hos X; Fig. 7 illustrerar ett talprickdiagram tl-t2 för ortogonala huvudkomponenter; Fig. 8 illustrerar en första laddning wl från en ursprunglig PLS-modell; Fig. 9 illustrerar en andra laddning w2 från en ursprunglig PLS-modell; Fig. 10 illustrerar ett talprickdiagrarn tl-ul för en ursprunglig PLS-modell; Fig. 11 illustrerar ett talprickdiagram tl-ul för en OPLS-förbehandlad PLS-modell enligt föreliggande uppfinning; Fig. 12 illustrerar en första laddning wl från en ursprunglig PLS-modell; Fig. 13 illustrerar en första laddning wl från en OPLS-förbehandlad PLS-modell enligt föreliggande uppfinning; Fig. 14 illustrerar PLS-regressionskoefficienter; och Fig. 15 illustrerar OPLS-förbehandlade PLS- regressionskoefficienter i enlighet med 10 15 20 25 30 516 343 9 o o ~ . . | n ; ø .- föreliggande uppfinning.
Tabeller Tabell l och 2 till vilka hänvisas i beskrivningen utgör en del av denna.
Detaljerad beskrivning av föredragna utfóringsformer Föreliggande uppfinning möjliggör avlägsnande av systematisk information från en indatauppsättning X som är irrelevant för koncentrationen eller egenskapsuppsättningen y eller Y. Med andra ord, för att eliminera den variabilitet hos X som är ortogonal mot Y beskrivs genom föreliggande uppfinning ett förbehandlingsförfarande med en liknande utfonnning som ortogonal korrigering OSC, vilket förfarande kallas förfarande med ortogonala partiella minstakvadrater (OPLS).
Definitioner En vektor, matris och liknande definieras som uppsättningar och t ex en uppsättning kan vara en vektor, en matris eller liknande.
Preparerade vektorer eller matriser är matematiskt transponerade.
En komponent i PCA eller PLS representerar en ny latent variabel som erhållits genom summering av tidigare variabler genom projektion.
En laddningsuppsättning beskriver inriktningen hos en erhållen komponent i förhållande till ursprungliga variabler i en datamatris X.
Tecknet y definierar en spaltvektor och Y föreställer en matris, dvs flera spaltvektorer.
Det föreslagna OPLS-förfarandet enligt föreliggande uppfinning analyserar störande variation i varje PLS-komponent. Den störande variationen hos X avskiljs från relevant variation, vilket gör att tolkningen och analysen av filtrerade X-indata förbättras och med ytterligare bonus kan själva den irrelevanta variationen studeras och analyseras.
I ett exempel på användning av reflektansspektra inom det nära infraröda området (NlR) på träspån, med tillämpning av OPLS som ett förbehandlingsförfarande, erhölls som resultat en minskad komplexitet hos PLS-modellen med bibehållen förutsägelseförinåga, effektiv eliminering av störvariationer hos data, och inte minst en förbättrad tolkningsfönnåga med avseende på både önskade och oönskade variationer hos data.
Att eliminera irrelevanta variationer hos data innan datarnodellering är fördelaktigt inte bara från förutsägelsesynpunkt, utan dessutom förbättras tolkningsförmågan med 10 15 20 25 30 516 343 10 avseende på de resulterande modellema.
Tolkningen av alla uppställda modeller är mycket viktig. Genom tolkning kan mer information och kunskap om ett system samlas in och analyseras och utvecklas ytterligare.
Den multiplikativa spridningskorrigeringen (MSC) är ett förfarande som utvecklats av Geladi m fl. F örfarandet utvecklades för att bidra till att lösa problem som påträffats i ett spektrum från närainfraröd reflektansspektroskopi vid flervariabelkalibrering. Additiva och multiplikativa spridningseffekter ger upphov till variationer i ett NIR-spektrum som det är svårt att klara av i kalibreringsmodellerna. Genom MSC-förfarandet beräknas parametrama a och b genom regression av vart och ett av spektra till ett målspektrum, vanligtvis medelspektret, xiii ' Xi = ai - xiiibi. Parametrama a, b används vidare för att uppdatera NIR- spektret med hjälp av följande formel : MSC-korrigeringsfilter Xi kni, = (Xi - ai =)/ bi.
Ett större problem med MSC är att parametrama a, b fastställs oberoende av Y. Vid flervariabelkalibrering betyder detta att MSC i sj älva verket kan eliminera en variation hos X som är relevant för modelleringen av y eller Y och därigenom åstadkomma sämre kalibreringsmodeller och öka förutsägelserestema. Den normala standardvariabeltransfonnen (SNV) som utvecklats av Barnes liknar MSC. Här beräknas uppdateringspararnetrarria a och b utgående från varje separat spektrum, varvid ai representerar medelvärdet för spektret Xi och bi är standardavvikelsen hos raden Xi. SNV motsvarar enhetsvariansskalning (UV) och centrering av varje rad. 26% _ ai)2 d.f.
SNV : Xi = (Xi - ai)/ bi. ai = medelvärde för rad i, bi = i rad i.
SNV-parametrama fastställs likaledes oberoende av Y, vilket kan leda till sämre kalibreringsmodeller och högre törutsägelserester.
Andersson har nyligen rapporterat om ett annat förbehandlingsförfarande som kallas direkt ortogonalisering (DO), C A Andersson, "Direct orthogonalization, Chemometrics and Intelligent laboratory systems", 47 (1999) 51-63. Detta förfarande strävar likaledes efter att eliminera den variation hos X som är ortogonal mot Y. Detta förfarande är olyckligtvis misslyckat eftersom det inte - tvärtom mot vad narrmet antyder - garanterar att ortogonal information elimineras. Därför kan DO inte klassificeras som ett ortogonalt filtreringsförfarande.
Stegen i det direkta ortogonaliseringstörfarandet visas här nedan : 1) X och Y centreras. 2) w=X'y(y'y)'1, projicera X mot Y 10 15 20 25 30 516 3 43 šïï* - f: - . u nnnn u 11 3) X_ortho = X-Yw', ortogonalisera X mot Y 4) X_ortho = T_orthoP'_ortho + E, dela upp X_ortho i huvudkomponenter, behåll Iaddningarna P 5) T = XP_ortho, beräkna nya tal T från ursprungliga X och ortogonala laddningar P 6) Xdo = X - TP'_ortho 7) Beräkna kalibreringsmodellen med användning av Xdo och Y 8) För nya spaltcentrerade prover, Tpm, = TpmdP_ortho 9) XdLpmd = XW, - TpmdPLortho Vissa större problem sammanhänger med den föreslagna metoden. Det avgörande problemet finns i steg 5. I stället för att använda de ortogonala talen T_ortho från steg 4, beräknar Andersson en ny uppsättning tal T med laddningama P_ortho från den ursprungliga X-matrisen. Dessa nya T tal är inte ortogonala mot Y, vilket betyder att variationen hos data som är relevant fór modelleringen av Y kan avlägsnas vid steg 6, vilket leder till sämre kalibreringsmodeller och högre förutsägelsefel. Samma situation uppstår för nya okända prov som skall förutsägas under steg 8. Om förfarandet hade använt sig av de ortogonala tal som beräknats under steg 4 hade variationen som eliminerats från X varit ortogonal. Problemet skulle då emellertid vara uppdateringen av nya prov p g a att inget Y föreligger för dessa.
Detta problem har tidigare omnämnts av Wold.
Det av Wold m fl införda ortogonala signalkorrigeringsförfarandet (OSC) utgjorde ett nytt spännande koncept för analys och modellering av flervariabeldata. Idén bakom detta går ut på att avlägsna information i X som är irrelevant för modelleringen av Y. Detta sker genom borttagning av information eller variabilitet hos X som inte är korrelerad eller ortogonal i förhållande till Y.
Tre kriterier gäller för OSC-lösningen : 0 Bör involvera en stor systematisk varians hos X 0 Måste vara förutsägbar genom X (för att tillämpas på framtida data) 0 Inforrnation som avlägsnas från X måste vara ortogonal mot Y.
De första två kriteriema kan enkelt uppfyllas. Genom en regelbunden PCA-lösning åstadkoms detta. Det tredje och viktigaste kriteriet uppfylls emellertid inte så lätt. Det krävs en tidskrävande upprepning för att finna en OSC-lösning som uppfyller alla tre kriteriema samtidigt.
En lösning konverterar ofta snabbt, men den kräver fortfarande 10-20 upprepningar.
OSC-lösningen är inte unik utan beror på en startvektor t. Därför är huvudkomponentanalysen (PCA) ett gott val för att åstadkomma startvektom eftersom den ger den längsta vektom t som 10 15 20 25 30 o . . . , , | | . ø nu 516 343 12 kan lörutsägas genom X. Då uppfylls automatiskt två av de ovanstående kriterierna. Genom en OSC-upprepning kommer längden hos vektom t att minska något för att konvergera OSC- lösningen.
Sammanfattning av den ortogonala si gnalkorri geringen ( OSC) (1) Omvandla, centrera och skala optimalt data för erhållande av de "råa" matrisema X och Y. (2) Börja med att beräkna den första huvudkomponenten för X, med talvektom t. tny= (I-Y(Y'Y)'*Y')t (4) Beräkna en normaliserad viktvektor, W, vilken ger Xw= tny. Detta sker genom en w= Xtuy t=Xw (3) Ortogonalisera t mot Y.
PLS-uppskattning som ger en generaliserad invers = X' (5) Beräkna en talvektor från X och W (6) Kontrollera konvergensen genom att testa om t har stabiliserats. Konvergens föreligger om (t-tny)/norrn(t) < 106, om ingen konvergens föreligger: återgå till steg 3 och fortsätt annars till steg 7. (7) Beräkna en laddningsvektor p (behövs för ortogonalitet mellan komponenter) p'= t'X/(t't) (8) Subtrahera "korrigeringen" från X för att erhålla rester E. (9) Fortsätt med nästa "komponent" genom att använda E som X och därefter ett annat etc, ända till dess att ett tillfredsställande resultat erhållits. (10) Nya prover (lörutsägelsuppsättningen) korrigeras med användning av W och P hos kalibreringsmodellen. För varje ny observationsvektor, xny : tl= xnyw, e1= xny - t,p,, t2= elwz, e2= el-tzpz' osv.
Det största problemet med OSC sammanhänger med överanpassningen av de ortogonala komponentema. Någon korsvalidering eller något annat valideringsförfarande används inte vid OSC och den tilläggstid som behövs för detta har varit ett av hindren. Det korrekta antalet "intema PLS-komponenter" för att uppskatta de ortogonala komponenterna har därför varit svårt att uppskatta, vilket leder till överanpassning och ibland försämring av de resulterande kalibreringsmodellerna. OSC-förfarandet kräver relativt stora datorinsatser för större datauppsättningar (K>2000), beroende på upprepningen för att uppskatta de ortogonala komponentema. 10 15 20 25 30 516 343 .... _. 1 3 Förfarandet med ortogonala partiella minstakvadrater (OPLS) i enlighet med föreliggande uppfinning har ett liknande kriterium som OSC, nämligen att avlägsna variation hos X som är irrelevant gentemot y eller Y.
Sammanfattning av OLPS-fórfarandet 0 Omvandla, centrera och skala optimalt data för att erhålla de "råa" matrisema X och y 1. W' = y'/X/y'y Projicera X mot y 2. w = w/ Normalisera w 3. t = Xw/(w'w) Proj icera X mot W 4. c' = t'y/(t't) Projicera y mot t 5. u = yc/(c'c) Projicera y mot c 6. p' =t'/X(t't) Projicera X mot t 7. wenho = p -w'p/(w'w)w Sök ortogonal laddning i p womm Norrnalisera den ortogonala laddningen wonho 8' Wonho = Wortho/ 9' tortho = X Wortho/(Worthowvonho) ponho' = tonho' X/(tonhm tortho) 1 Eopls : X' tortho ponho' Tortho = [Tortho torthoïl! Portho = [Portho ponhoL Wortho = [Wonho Worthok Lagra de funna parametrarna. Återgå till steg 1 och ställ in X = E Projicera X mot wonho Projicera X mot tmho Avlägsna ortogonal variation från X upp för ytterligare ortogonala komponenter, fortsätt annars till steg 13. ß. X..... = T....*P.....' komponentvis eller kör PCA på Xmho (steg 14) l4. Xonho = T *Ppca_on,,o' Epcunh., Huvudkomponentanalys (PCA) på Xom för att pca_ortho Ortogonal variation hos X. Analysera variationen summera latent ortogonal variation. Borttagning av all uppskattad ortogonal variation från X är en valmöjlighet. En annan valmöjlíghet innebär att endast de latenta ortogonala komponenter som uppskattats från PCA avlägsnas under steg l4. Detta motsvarar att åter Eputonho i Eopß. Läggs till. 15. Nya eller framtida prover (förutsägelseuppsättningen) korrigeras med användning av Wonho och Pom hos kalibreringsmodellen. För varje ny observationsvektor xny': upprepa stegen 16-18 för varje ortogonal komponent som uppskattats i kalibreringsmodellen. 16. tnyßnho = xny' wonho/ (wonhcjwonho) Beräkna det ortogonala talet hos xny' 17. tnmnho = [tnunho tnkonho] Lagra ortogonala tal för törutsägelseuppsättning 10 15 20 25 30 516 343 14 o n u» oc. l8.e ' “Upls = xuy' - tnkonho ponho' Den ortogonala komponenten hos xny' avlägsnas. Ställ in xny' = enyjplsfl Fortsätt till steg 19 när alla ortogonala komponenter har uppskattats. 19. xnkom = tnkwflm* Ponho' Ortogonal variation hos xny' 20. t P Beräkna nya tal från PCA under steg 14 21. xwmho = tnyjctonhü Ppc,_°nh0'+ enyfltonha Om endast de ortogonala latenta X ny _pca_ortho z ny_onho pca_ortho = komponenterna från PCA hos Xmho har avlägsnats skall enuctonho läggas tillbaka i enupls.
För multipel Y kör huvudkomponentanalysen (PCA) på Y och upprepa ovan angivna förfarande för varje separat Y-tal. Använd Xom som X-inmatningsmatris eñer den första omgången. Då garanteras ortogonaliteten för alla Y-variablema.
På området för halvempirisk modellering är de uppbara fördelarna med OLPS en mer sparsam PLS-modell (färre komponenter) och en förbättrad tolkning eftersom den störande variationen och den relevanta variationen har separerats. OPLS bör ge en förbättrad detekteringsgräns för moderata utliggare i talen eftersom relevanta variationer hos X skulle kunna innebära statistiska fördelningar som är olika den relevanta variationen, vilket medför en störning i beräkningen av t ex Hotelling's TZ-statistik.
En annan fördel med OPLS jämfört med det tidigare föreslagna OSC-förfarandet är att inte någon tidskrävande intern upprepning föreligger, vilket gör att det går mycket fort att beräkna. Även risken för en överanpassning minskas i hög grad med OPLS eftersom korsvalidering och/eller något egenvärdeskriterium används, vilket resulterar i att systematiska och relevanta komponenter beräknas och utvinns. OPLS är en modifiering av det ursprungliga PLS NIPALS-förfarandet för att effektivt separera relevant och irrelevant variation för att förbättra tolkningen av data. Antalet ortogonala komponenter bör väljas allt efter ett signifikanskriterium. Här används en kombination som innebär att det kontrolleras hur mycket ortogonal variation som har avlägsnats för varje komponent och den norrnaliserade skillnaden mellan p och wonho. En regelmässi g korsvalidering med Y är inte möjlig eftersom viktparametem c alltid är noll för alla ortogonala komponenter.
Fig. 1 visar en översikt av OPLS-förfarandet enligt föreliggande uppfinning. Översikten kommenteras i textblocken i ñg. 1 där fördelarna och nackdelama med OPLS- förbehandlade PLS-modeller jämfört med PLS-modeller utan förbehandling anges. En regelmässig PLS-modell är sålunda svårare att tolka, fler komponenter krävs och X innehåller irrelevant information. Den OPLS-förbehandlade PLS-modellen uppvisar således de fördelama att den är lättare att tolka, att den resulterande PLS-modellen är mer sparsam, att parameterpunkter såsom tal och laddningar är mer relevanta och att förutsägelserna kan förbättras. 10 15 20 25 30 516 343 šïï= - f' : 15 Huvudkomponentanalysen (PCA) kan användas för att dela upp den redan ortogonala matrisen X_ortho i ortogonala huvudkomponenter. Antalet PCA-komponenter kan välj as allt efter vissa signifikanskriterier, dvs korsvalidering eller egenvärde. En analys av den irrelevanta variationen är ytterst värdefull, källan till störande variation kan eventuellt identifieras och elimineras, eller kan åtminstone förstås varifrån den kommer.
Det är viktigt att inse att all variation i talen och laddningspunktema är stömingar och kan tolkas utan beaktande av inflytandet på Y. Informationen från en sådan analys är mycket viktig, inte minst för industriella processdata som kan innehålla ett stort antal variationer beroende på fluktuerande processmiljöer som svårligen kan elimineras, men medvetenheten om dessa kan vara ytterst viktig för vidare processförbättringar. Likaledes, i stället för att eliminera de ortogonala PLS-komponentema från de ursprungliga data innebär en annan föreslagen metod som fungerar väl att köra huvudkomponentanalysen (PCA) på den ortogonal datamatrisen och endast eliminera huvudkomponentema från den ortogonala datamatrisen. Den rest som finns kvar matas in i den OPLS-behandlade X-matrisen. Detta har visat sig förbättra förutsägelsema och drastiskt minska det totala antalet komponenter.
Resultaten av en sådan analys visas i den bifogade tabell 1.
I enlighet med föreliggande uppfinning finns även ett annat användbart förfarande för att uppskatta och eliminera irrelevant variation från X med avseende på en given Y och detta förfarande konvergerar med OPLS-lösningen om PCA används på den ortogonala datamatrisen Xmho enligt vad som föreslagits vid OPLS-förfarandet. Detta förfarande kallas här proj icerad ortogonal signalkorrigering, POSC. Det kräver att en initialt helt uppskattad PLS-modell beräknas och det kan inte utvinna en ortogonal PLS-komponent för varje PLS- komponent på det sätt som OPLS-förfarandet är i stånd att göra.
Förfarandet enligt föreliggande uppfinning kan således sammanfattas som ett förfarande för koncentrations- eller egenskapskalibrering av indata från prover av substanser eller ämnen, varvid nämnda kalibrering bestämmer en filtrerrnodell för ytterligare prover av samma substans eller ämne och innefattar att valfritt omvandla, centrera och skala indata för att åstadkomma en deskriptoruppsättning X och en koncentrations- eller egenskapsuppsättning y, Y. Det avlägsnar information eller systematiskt variation hos indata som inte har korrelerats mot koncentrationen eller egenskapsuppsättningen genom att anordna följande steg : Förfarandet enligt föreliggande uppfinning kan sammanfattas som ett förfarande för koncentrations- eller egenskapskalibrering av indata från prover av substanser eller ämnen, varvid nämnda kalibrering är bestämmande för en filterrnodell för ytterligare prover av 10 15 20 25 30 516 m 16 samma substans eller ämne, innefattande att indata valfritt omvandlas, centreras och skalas för att åstadkomma en deskriptoruppsättning X och en koncentrations- eller egenskapsuppsättning y, Y. Genom förfarandet avlägsnas information eller systematisk variation hos indata som inte är korrelerad mot koncentrations- eller egenskapsuppsättningen, genom att följande steg anordnas : framställning av en deskriptorviktuppsättning W, vilken är norrnaliserad, genom projicering av deskriptoruppsättningen X på koncentrations- eller egenskapsuppsättningen y, Y, projicering av deskriptoruppsättningen X på deskriptorviktuppsättningen W, framställning av en deskriptortaluppsättning t, projicering av deskriptoruppsättningen X på deskriptortaluppsättningen t, framställning av en deskriptorladdningsuppsättning p, projicering av egenskapsuppsättningen y på deskriptortaluppsättningen t, framställning av en egenskapsviktuppsättning c, projicering av egenskapsuppsättningen y på egenskapsviktuppsättningen c, framställning av en egenskapstaluppsättning u; jämförelse mellan deskriptorladdningsuppsättningen p och deskriptorviktuppsättningen w, och deras skillnad p-w, for att på så sätt erhålla den del av deskriptorladdningsuppsättningen p som inte står i samband med egenskapsuppsättningen y användning av nämnda skillnadsviktuppsättning wortho, vilken är normaliserad, som en startuppsättning for analys av partiella minstakvadrater; beräkning av motsvarande ortogonala deskriptortaluppsättning tortho som proj ektion mellan deskriptoruppsättningen X och nämnda normaliserade ortogonala skillnadsviktuppsättning wortho, och beräkning av en motsvarande ortogonal deskriptorladdningsuppsättning portho som proj ektion av deskriptoruppsättningen X på den ortogonala deskriptortaluppsättningen tortho; eliminering av den yttre produkten av den ortogonala deskriptortaluppsättningen tortho och den ortogonala deskriptorladdningsuppsättningen portho' från deskriptoruppsättningen X, för att på så sätt framställa restdata E som används som deskriptoruppsättning X i en följ ande komponent; upprepning av ovan nämnda steg för varje ortogonal komponent; varvid restdata E nu filtreras från stark systematisk variation vilken kan moduleras bilinjärt som den yttre produkten av den ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen Tortho*Portho', vilket på så sätt ger en ortogonal deskriptoruppsättning Xortho som är ortogonal mot egenskapsuppsättningen y, Y.
Valfritt kan en huvudkomponentanalys (PCA) av den ortogonala deskriptoruppsättningen Xortho utföras, vilket ger upphov till en bilinjär uppdelning av den 10 15 20 25 30 516 343 .:"ssïï.."I':": n n c n | a a | | ø nu 17 ortogonala deskriptoruppsättningen Xortho som den yttre produkten av taluppsättningen vid huvudkomponentanalysen och laddningsuppsättningen vid huvudkomponentanalysen och resterna vid huvudkomponentanalysen Tpcaortho*Ppcaortho' + Epcaortho. Härvidlag kan restdata Epcaortho från huvudkomponentanalysen läggas tillbaka till filtrerade restdata E.
För filtrering av nya data utförs följande steg : projicering av en ny deskriptoruppsättning xnew' på den normaliserade ortogonala skillnadsviktuppsättningen woitho, vilket på så sätt ger upphov till en ny ortogonal deskriptortaluppsättning tnewwortho; avlägsnande av produkten mellan den nya ortogonala deskriptortaluppsättningen tnewortho och den ortogonala deskriptorladdningsuppsättningen portho' från den nya deskriptoruppsättningen xnew', vilket på så sätt ger nya rester enew', vilka används som en ny deskriptoruppsättning xnew' i nästa ortogonala komponent.
Filtrerstegen upprepas för nya data för alla uppskattade ortogonala komponenter; datorberäkning av en ny ortogonal deskriptoruppsättning xnewortho'=tnewortho'Portho' som den yttre produkten av den nya ortogonala deskriptoitaluppsättningen tnewortho och den ortogonala deskriptorladdningsuppsättningen portho', datorberäkning av en ny ortogonal huvudkomponenttaluppsättning tnewpcaortho från projiceringen av den nya ortogonala deskriptoruppsättningen på laddningsuppsättningen xnewortho'=Ppcaortho' från huvudkomponentanalysen. Härvidlag läggs de nybildade resterna från huvudkomponentanalysen enewpcaortho'=xnewortho'- tnewpcaortho*Ppcaortho' tillbaka i de nya resterna enew' om huvudkomponentanalysen har använts på den ortogonala deskriptoruppsättningen Xortho, och endast den yttre produkten av taluppsättningarna från huvudkomponentanalysen och huvudkomponentladdningsuppsättningen Tpcaortho*Ppcaortho' har avlägsnats från den ursprungliga deskriptoruppsättningen X.
För multipla koncentrations- eller egenskapsuppsättningar Y : beräkning av en huvudkomponentanalysmodell av nämnda egenskapsuppsättningar Y=TP'+E och upprepning av ovan nämnda steg för varje separat taluppsättning t från huvudkomponentanalysen och användning av den ortogonala deskriptom Xom som inmatningsdeskriptoruppsättning X för varje efterföljande taluppsättning t från huvudkomponentanalysen, för att på så sätt åstadkomma nämnda filtreringsmodell för filtrering av ytterligare prover av samma typ.
Utförande av en vanlig PLS-analys utförs med filtrerade restdata E och koncentrations- eller egenskapsuppsättningen y, Y, och med en vanlig PLS-analys utförs med nämnda ñltrerade nya restuppsättningar enew' som förutsägelseuppsättning.
Föreliggande uppfinning avser även en anordning för koncentration eller 10 15 20 25 30 516 343 18 on sno-vu - w n n , r o v o o nu egenskapskalibrering av indata från prover av substanser eller ämnen.
En filterrnodell som ingår i anordningen avlägsnar infonnation eller systematisk variation hos indata som inte är korrelerad mot koncentrations- eller egenskapsuppsättningen, genom att den innefattar : projiceringsorgan för att åstadkomma en deskriptorviktuppsättning W, vilken normaliseras, genom projicering av deskriptoruppsättningen X på koncentrations- eller egenskapsuppsättningen y, Y; proj iceringsorgan för projicering av deskriptoruppsättningen X på deskriptorviktuppsättningen W för framställning av en deskriptortaluppsättning t; projicering för deskriptoruppsättningen X på deskriptortaluppsättningen t för att åstadkomma en deskriptorladdningsuppsättning p; proj iceringsorgan för projicering av egenskapsuppsättningen y på deskriptortaluppsättningen t för att åstadkomma en egenskapsviktuppsättning c; projiceringsorgan för proj icering av egenskapsuppsättningen y på egenskapsviktuppsättningen c för att åstadkomma en egenskapstaluppsättning u; jämförelseorgan för jämförelse av deskriptorladdningsuppsättningen p och deskriptorviktuppsättningen w, och deras skillnad p-w, för att på så sätt erhålla den del av deskriptorladdningsuppsättningen p som inte står i samband med egenskapsuppsättningen y, Y; användning av nämnda skillnadsviktuppsättning wortho, vilken är norrnaliserad, som en startuppsättning för partiell minstakvadratanalys; beräkningsorgan för motsvarande ortogonala deskriptortaluppsättning tortho som proj ektion mellan deskriptoruppsättningen X och nämnda normaliserade ortogonala skillnadsviktuppsättning wortho, och för beräkning av en motsvarande ortogonal deskriptorladdningsuppsättning portho som proj ektion av deskriptoruppsättningen X på den ortogonala deskriptortaluppsättningen tortho; beräkningsorgan för avlägsnande av den yttre produkten av den ortogonala deskriptortaluppsättningen tortho och den ortogonala deskriptorladdningsuppsättningen portho' från deskriptoruppsättningen X, vilket på så sätt ger restdata E som används som deskriptoruppsättning X i nästa komponent.
Upprepad användning av ovanstående organ och steg för varje ortogonal latent variabel komponent ; filtreringsorgan för restdata E från en stark systematisk variation som kan modelleras bilinjärt som den yttre produkten av den ortogonala deskriptortaluppsättningen och den 10 15 20 25 30 516 343 19 ortogonala deskriptorladdningsuppsättningen Tortho*Portho', vilket på så sätt ger en ortogonal deskriptoruppsättning Xortho som är ortogonal mot egenskapsuppsättningen y, Y; Anordningen innehåller valfritt analysorgan för en huvudkomponentanalys PCA på den ortogonala deskriptoruppsättningen Xortho, vilket ger en bilinj är uppdelning av den ortogonala deskriptoruppsättningen Xortho som den yttre produkten av taluppsättningen från huvudkomponentanalysen och laddningsuppsättningen från huvudkomponentanalysen och resterna från huvudkomponentanalysen Tpcaortho*Ppcaortho' + Epcaortho, med tillägg av restdata Epcaortho från huvudkomponentanalysen tillbaka till de filtrerade restdata E.
Filtreringsorgan för nya data, utförande med följande organ : organ för projicering av en ny deskriptoruppsättning xnew' på den norrnaliserade ortogonala skillnadsviktuppsättningen wortho, vilket på så sätt ger en ny ortogonal deskriptortaluppsättning tnewortho; beräkningsorgan för avlägsnande av produkten mellan den nya ortogonala deskriptortaluppsättningen tnewortho och den ortogonala deskriptorladdningsuppsättningen portho' från den nya deskriptoruppsättningen xnew', vilket på så sätt ger nya rester enew' vilka används som en ny deskriptoruppsättning xnew' i en följande ortogonal komponent; Upprepad användning av nämnda filtrering av nya data för alla uppskattade ortogonala komponenter; beräkningsorgan för beräkning av en ny ortogonal deskriptoruppsättning xnewortho'=tnewortho*Portho' som den yttre produkten av den nya ortogonala deskriptortaluppsättningen tnewortho och den ortogonala deskriptorladdningsuppsättningen portho', datorberäkning av en ny ortogonal huvudkomponenttaluppsättning tnewpcaortho från proj iceringen av den nya ortogonala deskriptoruppsättningen på laddningsuppsättningen från huvudkomponentanalysen xnewortho'* Ppcaortho'. Härvidlag läggs de nybildade resterna från huvudkomponentanalysen enewpcaortho=xnewortho'-tnewpcaortho* Ppcaortho' tillbaka i de nya restema enew' om en huvudkomponentanalys har använts på den ortogonala deskriptoruppsättningen Xortho, och enbart den yttre produkten av taluppsättningarna från huvudkomponentanalysen och huvudkomponentsladdningsuppsättningen Tpcaortho*Ppcaortho' från den ursprungliga deskriptoruppsättningen X.
För multipla koncentrations- eller egenskapsuppsättningar Y : beräkning av en huvudkomponentanalysmodell på nämnda egenskapsuppsättningar Y=TP'+E och upprepad användning av de ovan nämnda organen och stegen för varje separat taluppsättning t från huvudkomponentanalysen och användning av den ortogonala deskriptorn Xonho som inmatningsdeskriptoruppsättning X för varje efterföljande taluppsättning t vid 10 15 20 25 30 516 343 20 buvudkomponentanalysen, för att på så sätt åstadkomma nämnda filtreringsmodell för filtrering av ytterligare prover av samma typ.
Tillämpning av organ för partiell minstakvadratanalys för filtrerade restdata E och koncentrations- eller egenskapsuppsättningen y, Y, och för nämnda filtrerade nya restuppsättningar enew' som förutsägelseuppsättning.
Här bör inses att de medel som anordningen utgörs av kan vara rena programvarumedel, hårdvarumedel som är kända inom tekniken, eller kombinationer av dessa.
Sammanfattning av POSC-förfarandet (1) Omvandla, centrera och skala valfritt data för erhållande av de "råa" matriserna X och y (2) t = X*w Beräkna den norrnaliserade laddningen W från något regressionsförfarande för att uppskatta t som representerar den bästa systematiska korrelationen till Y. (3) p' =t'X /(t't) (4) X_ortho =X-tp' (5) X_ortho = T_ortho_Portho' + E_ortho Beräkna en regelmässig PCA-modell med Proj icera X på t för att erhålla laddningen p. xx antal valda komponenter. (6) Xposc = X-T_orthoP_ortho' (7) Nya eller framtida data (förutsägelseuppsättningen) korrigeras med användning F iltrerade data Xposc av W, p och P_ortho från kalibreringsmodellen. För varje ny observationsvektor x_test' upprepar stegen 11-14 för varje ortogonal komponent som uppskattats i kalibreringsmodellen. (8) t_test = x_test'W Beräkna talet hos x_test' (9) t_test_ortho'= x_test' - t_test p' Ortogonal variation hos nya data. (10) Upprepa stegen ll och 14 för varje ortogonal komponent som avlägsnas under steg 5 (11) t_test_ortho'= x_test_ortho'p_ortho (12) t_test_ortho = [t_test_ortho t_test_ortho] Spara ortogonala tal för förutsägelseuppsättningen. (13) e_test_ortho' = x_test_ortho' - t_test_ortho P_ortho' (14) För varje återstående ortogonal komponent, ställ in x_test_ortho' = e_test_ortho' och återgå till steg 11, fortsätt annars till steg 15. (15) xposc_test' = x_test' - t_test_orthoP_ortho' Filtrerade nya data xposc_test'. 10 15 20 25 30 516 343 21 Alla proj ektionsförfaranden som arbetar enligt metodologin med minstakvadrater är känsliga för onormala dataförekomster. PLS och PCA är inte annorlunda. Det är viktigt att inse att detektering och undersökning av onormala data eller utliggare representerar en stor del vid flervariabeldataanalys och halvempirisk modellering. Vid PLS och PCA kan de onormala datasamplen detekteras och analyseras genom att tal och rester betraktas.
Detektering av utliggare vid OPLS-förfarandet ger inte upphov till ytterligare något problem eftersom samma principer gäller.
De första stegen vid OPLS-förfarandet går ut på att uppskatta laddningama w och p.
Genom OPLS-förfarandet beräknas w och p allmänna regressionsmetodproj ektioner på partiella minstakvadrater (PLS) i latenta strukturer. Antalet ortogonala och icke ortogonala komponenter som används bör väljas enligt vissa si gnifikanskriteria. Den väl kända korsvalideringstekniken kan användas. Det är viktigt att använda vissa signiñkanskriteria för bestämningen av antalet PLS-komponenter. Underanpassning och överanpassning av data är allvarligt för varjehanda empirisk modellering och följaktligen även för OPLS.
OLPS-modellen och den ursprungliga PLS-modellen kommer att ge liknande resultat med avseende på den förklarade variansen hos Y om inte den OPLS-behandlade X-matrisen har skalats innan PLS-modellering. Förbättringar i förutsägelsen i den resulterande OPLS- modellen jämfört med den ursprungliga PLS-modellen kan erhållas om den OPLS- behandlade datamatrisen X skalas innan PLS-modelleringen. Här rekommenderas skalningsförfaranden såsom en enhetsvariansskalning (UV) där varje spalt delas med standardavvikelsen för denna spalt, eller paritetsskalning där viktfaktom är kvadiaten av standardavvikelsen för den spalten. Det är viktigt att inse att den ortogonala variationen hos X som avlägsnas från kalibreringsprovema antas föreligga även hos de framtida provema. Detta antagande kommer från det faktum att uppdateringsparametrarna W*_ortho och P_ortho uppskattas enbart utgående från kalibreiingsdata. Ingen variation som endast föreligger i framtida prover eller endast i kalibreringsprover bör avlägsnas och detta understryker vikten av att endast avlägsna systematiskt relevanta ortogonala komponenter från data.
F örutsägelserna kan förbättras genom att systematiska irrelevanta variationer avlägsnas och genom att skalning därefter tillämpas på de OPLS-behandlade data.
Det föreslagna OPLS-förfarandet är verkligen mångsidigt och om det används på lämpligt sätt kommer OPLS att förbättra datamodelleringen och tolkningen oavsett de flesta typer av dataegenskaper. Om det antas att en datauppsättning innehåller endast relevant variation så kommer följaktligen OPLS-förfarandet inte att finna några ortogonala komponenter och den resulterande PLS -modellen konvergerar mot en regelmässig 10 15 20 25 30 516 343 22 u - . - o I' .- -eø enkomponents-PLS-lösning. Detta är fallet med data från utformade experiment där spalter är ortogonala i förhållande till varandra och inga ortogonala latenta variabler föreligger. Det är även möjligt att betrakta det motsatta fallet där data enbart består av icke relevant information och här finner OPLS-förfarandet enbart ortogonal irrelevant variation och ingen PLS- komponent och därför konvergerar det mot en PCA-lösning.
OPLS-kan vara utformat för att avlägsna specifik information. I stället för att avlägsna all systematisk icke relevant variation hos X kan OPLS vara utformat för att avlägsna specifika variationstyper hos X-data. Detta sker genom att ställa in den oönskade egenskapen på y eller Y. Ett exempel är det vanliga problemet med temperaturskillnader hos prover inom NIR-spektret som ger upphov till en oönskad variation hos spektret. Detta ger möjlighet att analysera den specifika systematiska variationen X som uppstår p g a temperaturskillnaderna och även att vidare analysera OPLS-behandlade data Xortho med mindre inflytande från den störande variation som på ett säkert sätt har eliminerats.
Vid OPLS-förfarandet används de erhållna X-data och y-data eller Y-data för att filtrera och eliminera variationen hos X som inte är relevant gentemot Y. Om det givna Y- datat innefattar en stor del brus har det befarats att OPLS-förfarandet inte presterar så bra som det borde, även om den från X avlägsnade informationen i själva verket alltid är ortogonal mot Y. Resultat från inledande studier visar inte på någon försämring av resultaten järnfört med icke behandlade data. Användningen av korsvalidering och/eller egenvärdeslcriteria leder OPLS-förfarandet till att uppvisa goda resultat med avseende på de mest olika datatyper.
Den kanske största fördelen med OPLS-förfarandet är den förbättrade tolkningen av data. Det är även möjligt att tänka sig en PLS-modell med tolv komponenter som ger upphov till frågoma : vilka är de intressanta variablema för förutsägelse av svarsvariabeln Y ? Vilka prickdiagram och parametrar är intressanta ? Vissa skulle analysera regrcssionskoefficientvektom eftersom den används för att förutsäga Y utgående från X. Andra skulle anföra en kombination av alla laddningar, tal, och koefficientvektom tillsammans med en granskning av restema. Detta låter relativt besvärligt, men tillsammans med tidigare kunskap om data fimgerar detta i allmänhet. OPLS-förfarandet skulle göra tolkningen lättare. Först och främst avskiljs genom detta förfarande den relevanta informationen från den icke relevanta ortogonala informationen. För det andra ger det en möjlighet till analys av den icke relevanta informationen i data och att förstå vilka källor som behövs för detta. För det tredje blir antalet PLS-komponenter mycket mindre, vanligtvis en eller två komponenter. Det blir påtagligt lättare att tolka och analysera OPLS-modellen och det är ett intressant faktum att den första w-laddningen enligt OPLS motsvarar den första W- 10 15 20 25 30 516 m. 23 laddningen enligt PLS hos den ursprungliga PLS-modellen. Detta inses lätt, mendet går att ställa sig vissa frågor när det gäller kvalitén vid tolkningen av PLS-modellema.
Huvudkomponentanalysen (PCA) är den viktigaste delen av flervariabeldataanalysen. Här kommer endast en kort beskrivning att ges och ytterligare information kan återfinnas hos H Martens, T Naes, Multivariate Calibration, Wiley, New York, 1989. Varje X-datamatris med storleken N*K, där N anger antalet objekt (rader) och K anger antalet variabler (spalter), kan delas upp i ett antal huvudkomponenter med hjälp av PCA-förfarandet.
X = TP'+E Genom PGA-förfarandet utvärderas den underliggande dimensionen (latenta variabler) hos data och det ger en översikt över dominerande mönster och viktigare tendenser hos data.
Partiella minstakvadrater (PLS) är ett proj iceringsförfarande som modellerar förhållandet mellan svaret Y och prediktorema X, se H Martens m fl. Blocken delas upp enligt följ ande X = TP' + E Y = UC' + F Här är T och U talmatriser och P och C är laddningsmatriser för X respektive Y, och Y och F är restmatriser. x-talen t, är linjära kombinationer av X-restema och X själv där w är viktvektorn. f. = (X-T,.1*P.-1) *W.
Detta sker på ett sådant sätt att kovariansen mellan T och U maximeras. W* är viktema som kombinerar de ursprungliga X-variablema (inte deras rester som med w) för att bilda talen t.
W* = Wftas-*Wyl U sammanhänger med T genom det inre sambandet U = T+H H = restmatris F örutsägelseforrnuleringen för Y är enligt följande Y = TC'+F* Följ ande statistiker för regressionsmodellema har beräknats.
F* är restmatrisen Förklarad varians hos X, hos träningsuppsättningen.
R2(X)=1- fik-X) /ZXZ Förklarad varians hos y, hos träningsuppsättningen. 10 15 20 25 516 343 24 ~ . . a n ,. .no Rane-Xßflfl/XW Den fdrutsagda korsvaliderade variansen hos Y, hos träningsuppsättningen. 2 Q2(y) =1 ~ Eli/md - y] /Z yz Genomsnittligt kvadratrotsfel hos fórutsägelsen, hos testuppsättningen zßyf N RMSEP = Distansen till modellen inom X-rummet, DmodX. Den nonnaliserade reststandardavvikelsen inom X-rummet. 2021)” (K - A) S0 Szf Zífll ° (NAaJwßM K = antalet X-variabler, A = antalet PLS-komponenter, A.,=l for spaltcentrerade Dmødxfi) = data. E är restmatrisen. N=antal objekt hos X.
NIR-VIS-spektra samlades in från våglängdsområdet 400-2500 nm. En NIR- spektrometer av system 6500 installerades på toppen av ett transportband och 151 korgar fyllda med olika träspånsammansättningar uppmättes intill transportbandet vid pappersfabriken hos ASSI Domän i Piteå, Sverige. Torvsubstanshalten uppmättes med hjälp av ett referensfórfarande. Träspånomas torrsubstanshalt varierade från 39-5 8%. Från datauppsättningen N*K, där N=151 prover, och K=1050 digitaliserade våglängder, avlägsnades slumpmässigt 51 spektra som en testuppsättning, vilket lämnade kvar 101 spektra som användes som en träningsuppsättning för kalibrering. Antalet PLS-komponenter beräknades enligt korsvalidering.
Fig. 2a illustrerar spaltcentrerade obehandlade NIR-spektra och fig. 2b OPLS- behandlade NIR-spektra enligt föreliggande uppfinning.
I fig. 2a och 2b ges en jämförelse av NIR-spektra före och efter OPLS-behandling.
Det obehandlade NIR-spektret uppvisar en klar baslinj evariation med liten relevans för fukthalten Y, vilket visas i det övre högra hömet av fig. 2a. Irrelevant variation, baslinje- och 10 15 20 25 30 . ~ . u c II .n .en 516 343 25 lutningsproblem har minskats enligt vad som visas i fig. 2b. En skillnad i fukthalt hos provema ger upphov till den mesta variationen och baslinje- och lutningsproblem som tidigare angivits har minskats i hög grad.
Resultatet i tabell l visar på en klar minskning av antalet PLS-komponenter som behövs när OPLS-förfarandet användes. CSC-förfarandet kunde endast användas för att utvinna en komponent som i viss mån var överanpassad. Användningen av en andra OSC- komponent resulterade i en mer allvarlig överanpassning hos PLS-modellen. Här bör noteras att SNV-, DO- och MSC-förfarandena inte gav goda resultat. De gav i själva verket upphov till en ökning av förutsägelsefelet och försämrade resultaten jämfört med den ursprungliga PLS-modellen. Inget av dessa förfaranden garanterar ortogonalitet med avseende på vad som avlägsnats från X och därför går ibland relevant information förlorad. Här bör påpekas att DO-förfarandet eliminerade inte någon variation som är ortogonal mot Y och gav därför även upphov till större förutsägelsefel än den ursprungliga PLS-modellen. Att lägga märke till, är att om PCA används på Xonho för att finna de latenta ortogonala komponentema och i stället dessa avlägsnas från X och inte hela Xonho-matrisen och skalning tillämpas, resulterar detta i en klar minskning av det totala antalet komponenter. Detta visar att skalning efter OPLS kunde förbättra modelleringen.
Fastställande av ett korrekt antal OPLS-komponenter bör ske i enlighet med ett signifikanskriterium. Den regelmässiga korsvalideringsproceduren kan inte användas eftersom Y-viktvektom c blir noll för alla OPLS-komponenter. Här föreslås att antalet ortogonala variationer som avlägsnas för varje komponent beaktas och även normen för den w_ortho-vektor som återfinns i steg 8 vid OPLS-förfarandet. Om denna norm är liten jämfört med laddningsnorrnen p återfanns få ortogonala variationer hos X i denna komponent och antalet ortogonala PLS-komponenter har återfunnits. Ett tillvägagångssätt kan gå ut på att inte stoppa utan i stället utvinna sådana komponenter som regelmässiga PLS-komponenter och fortsätta förfarandet ända till dess att all varians hos X har beaktats. Detta gör det möjligt att med OPLS-förfarandet fortsätta sökandet efter ortogonala komponenter som är gömda under de första. I fig. 3 visas den norrnaliserade norrnen för wonho-vektom. En klar tendens syns tydligt och fyra ortogonala komponenter avlägsnades. Det är svårt att säga om den fjärde ortogonala komponenten är relevant eller ej, vilket även var fallet med den ursprungliga PLS- modellen där den femte PLS-komponenten var nära att betrakta som irrelevant. I fig. 4 har den förklarade variationen för varje ortogonal PLS-komponent angetts och här finns en klar likhet med ñg. 3. Som en tumregel gäller att det totala antalet komponenter för OPLS aldrig skall överstiga antalet PLS-komponenter för den ursprungliga PLS-modellen. 10 15 20 25 30 516 343 26 . . ø « - » - n .. n.
I fig. 3 illustreras normen för en ortogonal vektor wonho och fi g. 4 en förklarad variation för varje ortogonal PLS-komponent.
En stor fördel med OPLS-förfarandet är att det möjliggör analys av den icke relevanta informationen hos X som ortogonala huvudkomponenter. Här bör observeras att all infonnationi dessa prickdiagram, tal och laddningar är systematiskt icke relevanta, ortogonala, i förhållande till den önskade kvalitetsvariabeln Y.
De två första ortogonala laddningama har dragits upp i fig. 5 och 6. Fig. 5 illustrerar en första huvudsaklig ortogonal laddningsstörvariation hos X och fig. 6 är en andra huvudsaklig ortogonal laddning av störvariationen hos X.
Här framgår klart att de ortogonala komponentema är i själva verket huvudsakligen förskjutning eller en lutningsskillnad. Dessa irrelevanta variationer hade detekterats och avlägsnats genom OPLS-förfarandet. Hur kan det komma sig att det multiplikativa spridningskorrigeringsförfarandet (MSC), vilket utfonnats för att avlägsna dessa typer av störningar från NIR-spektrat, inte har klarat av att åstadkomma bättre resultat ? En enkel orsak skulle kunna vara att MSC-målvektom (vanligtvis spaltmedelvektom) som användes för att korrigera alla övri ga spektra inte var något gott val. Genom OPLS-förfarandet återfinns dessa korrigeringsvektorer från data och garanterar även att den eliminerade informationen inte är relevant för modelleringen av Y. I fig. 7 visas motsvarande talprickdiagram för de ortogonala latenta komponentema. F i g. 7 visar ett talprickdiagram t1-t2 för de ortogonala huvudkomponentema.
OPLS-förfarandet ger möjlighet till analys av den irrelevanta variationen i data hos de ortogonala komponentema (tal och laddningar). All variation hos talprickdiagrammen är relevanta för Y och därför kan källan till oönskad variation kanske påträffas och elimineras eller minskas. Inom industriella processer är det inte alltid möjligt att avlägsna oönskad variation, men OPLS-förfarandet erbjuder den fördelen att det vet åtminstone vilken typ av störande variation som förekommer och finner eventuellt ut förfaranden för att minska denna. Är det möjligt att veta i förväg där tillämpningen av OPLS-förfarandet kommer att hjälpa ? I princip borde alla PLS-modeller med mer än en PLS-komponent dra fördel av användningen av OPLS. Ifrågavarande data kan beaktas med ortogonala variabler. Endast en PLS- komponent behövs eftersom inte någon latent ortogonal variation föreligger. I fig. 8 och 9 visas ett gott exempel på när OPLS skall användas och detta fenomen uppstår ofta för NIR- spektra. De första två w-laddningama från den ursprungliga PLS-modellen har dragits upp.
Fig. 8 visar en första laddning wl från en ursprunglig PLS-modell och Fig. 9 en andra laddning w2 från en ursprunglig PLS-modell. 10 15 20 25 30 516 343 27 Anledningen till att de båda första laddningarna liknar varandra är att X-datamatrisen innehåller stora baslinjevariationer (icke relevanta) som är ortogonala mot Y. Detta förorsakar problem för PLS-förfarandet. PLS-förfarandet måste innefatta en viss X-Y-kovarians i varje PLS-komponent även om en stor del av X-variationen är ortogonal mot Y. PLS-förfarandet löser detta genom avskalning av infonnation från X-matrisen i ett komponentpar, vilket leder till en mer komplex PLS-modell som är svårare att tolka.
I tabell 2 visas PLS-modellparametrama för den ursprungliga PLS-modellen, och även den OPLS-behandlade PLS-modellen. Ett klart tecken på när OPLS- förbehandlingsförfarandet skall användas ges i tabell 2. Mängden av varianser R2Ycum (eller korsvaliderad Q2cum) är relativt liten i den första komponenten. Mängden förklarad variation hos X, R2Xcum är relativt stor. Detta är en klar indikation på att stora ortogonala variationer med avseende på Y föreligger i X och där skulle OPLS kunna förbättra modellering och tolkning. I detta fall har de ortogonala komponenterna påvisat att baslinjevariationema var orsaken till den stora oönskade variationen hos X. För andra typer av data skulle de ortogonala komponenterna kunna uppträda senare i PLS-komponentema, men här har baslinj eproblemen infört en sådan stor variation hos data och det uppträdde i den första komponenten. OPLS-modellen krävde enbart en PLS-komponent eftersom all relevant ortogonal latent variation redan hade eliminerats. Än en gång bör utformade experiment betraktas där data uppvisar ortogonala variabler. Dessa modeller kräver endast en PLS- komponent och skälet till detta är enkelt att förstå. De utformade data innefattar inte någon ortogonal latent variation och därför behöver PLS-modellen endast en komponent.
Antalet PLS-komponenter för den OPLS-förbehandlade PLS-modellen har minskats i hög grad, vilket gör tolkningen enklare jämfört med den ursprungliga PLS-modellen. Talen är inte längre maskerade med irrelevant variation som i hög grad har undertryckts genom OPLS-förfarandet, Fig. 10 illustrerar ett talprickdiagram tl-ul hos en ursprunglig PLS-modell och Fig. ll ett talprickdiagram tl-ul hos en OPLS-förbehandlad PLS-modell enligt föreliggande uppfinning.
Korrelationen t-u i den OPLS-behandlade PLS-modellen är mycket mer distinkt och klar. Den ursprungliga PLS-modellen i ñg. 10 uppvisar inte mycket korrelation i den första PLS-komponenten och anledningen till detta är huvudsakligen den störande baslinj evariationen. l fig. ll har baslinjevariationerna och lutningsskillnadema eliminerats och PLS-modellen behöver bara en komponent för att modellera X-Y-sambandet.
I fig. 12 och 13 har den första laddningsvektom wl dragits upp för den ursprungliga 10 15 20 25 30 516 343 28 PLS-modellen och den OPLS-förbehandlade PLS-modellen. Det är att lägga märke till att den första laddningen wl i den ursprungliga PLS-modellen är identiskt lika med den första laddningen w i den OPLS-förbehandlade PLS-modellen. Detta förstås enkelt när det inses att w är proj ektionen av matrisen X på vektom u, y om det bara finns en spalt i Y, med användning av NIPALS-förfarandet. Elimineringen av ortogonala komponenter från X stör inte korrelationen mellan X och Y eftersom ortogonala spalter i X har ingen inverkan på proj ektionen w=u'X/(u'u).
Fig. 12 illustrerar en första laddning wl från en ursprunglig PLS-modell och fig. 13 en första laddning Wl från en OPLS-förbehandlad PLS-modell.
Detta leder fram till det intressanta ämne som tolkningen utgör. Både den ursprungliga PLS-modellen och den OPLS-förbehandlade PLS-modellen har samma första laddningsviktvektor w, men olika tal produceras. Detta betyder att PLS-viktvektom w inte är särskilt nyttig när den ortogonala variationen föreligger. Laddningsvektom p är mer relevant att analysera med avseende på talen. Laddningama påverkas emellertid både av den relevanta och irrelevanta variationen hos X-värden som blandats. Detta gör tolkningen av PLS- modellen svår. Den fysisk-kemiska tolkningen av talen med avseende på vilka variabler är viktig för förutsägelsen och vilka variabler som åstadkommer en störande variation hos X.
OPLS-förfarandet delar upp de båda separata variationema hos data i två olika datamatriser som analyseras individuellt och oberoende av varandra.
Det är klart att regressionskoefficientema hos den ursprungliga PLS-modellen och den OPLS-förbehandlade PLS-modellen måste vara mycket olika. Se fig. 14 och 15.
Fig. 14 illustrerar PLS-regressionskoefficienter och fig. 15 illustrerar OPLS- förbehandlade PLS-regressionskoefficienter enligt föreliggande uppfinning.
Skillnaden härrör från mängden av ortogonal information hos X som föreligger i den ursprungliga PLS-modellen. Regressionskoefficienterna visar variablerna med hjälp av aktuella data som är viktiga för modelleringen av Y. Att eliminera så mycket av den irrelevanta variationen hos X är viktigt för att erhålla relevant och maximal kunskap om systemet som undersöks och för att modellkomplexiteten skall hållas vid ett minimum.
Dessutom kan analysen av den ortogonala variationen i termer av ortogonala huvudkomponenter (tal och laddning) för att finna ut och minska den irrelevanta variationen av data ibland vara avgörande. Det föreslagna OPLS-förfarandet är ett bra förfarande att använda för detta ändamål.
Föreliggande uppfinning avseende OPLS-förfarandet har visat sig vara allmän och mångsidig. Den kan göras till en ingående del i den regelmässiga PLS-modelleringen, för 10 15 20 516 343 29 förbättring av tolkning och modellförutsägelser, eller den kan användas som en förbehandlingsmetod för att eliminera störande variationer från data. I det givna exemplet avlägsnades den störande variationen på ett effektivt sätt och analyserades med hjälp av en huvudkomponentanalys (PCA) och den resulterande PLS-modellen med en enda komponent var enklare att tolka. OPLS-förfarandet kan betraktas som ett filtrerförfarande där variation som är irrelevant för ifrågavarande problem effektivt elimineras. Detta kan tillämpas inte bara för kalibreringsändamål, utan även för alla typer av filtrering där irrelevant variation hos X- data skall minskas eller elimineras. Industriella processignaler uppvisar t ex driftvariationer och andra störande variationer. Tillämpning av OPLS-förfarandet med tid såsom Y skulle avslöja variationer hos X som är relaterade till tidsdrifi. Ett annat exempel är modellering med kvantitativa strukturaktivitetssamband (QSAR). Tolkningen av deras modeller är högst väsentlig och OPLS-förfarandet ger möjlighet till att separera den relevanta variationen hos data från den icke relevanta variationen. Intema valideringsförfaranden såsom korsvalidering och egenvärdeskriteria garanterar att OPLS-förfarandet kommer att fungera för de flesta typer av data. Jämfört med det tidigare föreslagna CSC-förfarandet föreligger inte någon tidskrävande upprepning vid förfarandet. Eftersom OPLS-förfarandet är baserat på PLS- NIPALS-förfarandet arbetar det med moderata mängder saknad data. Den mest tydliga fördelen med användning av OPLS-förfarandet är förbättringen vid tolkningen av PLS- modellema och deras parametrar tal, laddningar och rester.
Här antas att funktionssättet och uppbyggnaden av föreliggande uppfinning kommer att framgå av den föregående beskrivningen. Även om det förfarande och den anordning som visats eller beskrivits är att föredra är det självklart att ändringar och modifieringar kan göras hos dessa utan att avvika från uppfinningens anda och omfäng enligt vad som definíeras i bilagda krav. 516 343 30 Tabeller lêïzill Datauppsättning : ASSI NIR (Antal komponenter enligt korsvalidering) F örfarande # Ortogonal # PLS- R2Y Q2Y RMSEP komponent komponent PLS - 5 0,80 0,73 2,95 MSC+PLS - 2 0,80 0,81 3,13 SNV+PLS - 3 0,81 0,81 3,09 DO+PLS 3 (ej ortogonal) 2 0,72 0,68 3,06 OSC+PLS 1 1 0,81 0,80 3,01 OPLS 4 1 0,80 0,78 2,95 OPLS (PCA) 1 1 0,80 0,78 2,94 hlzvlll Ursprunglig PLS-modell OPLS-fórbehandlad PLS-modell PLS-komp. R2Xcum R2Ycum Q2cum PLS komp. R2Xcum R2Ycum Q2cum 1 0,948 0,107 0,093 1 0,976 0,796 0,782 2 0,987 0,499 0,478 3 0,995 0,629 0,587 4 0,996 0,757 0,695 5 0,997 0,796 0,731

Claims (12)

10 15 20 25 30 516 343 31 - ° J.. .. an .ns Patentkrav
1. l. Förfarande för koncentrations- eller egenskapskalibrering av indata från prover av substanser eller ämnen, varvid nämnda kalibrering är bestämmande för en filterrnodell för ytterligare prover av samma substans eller ämne, innefattande att indata valfritt omvandlas, centreras och skalas för att åstadkomma en deskriptoruppsättning (X) och en koncentrations- eller egenskapsuppsättning (y, Y), k ä n n e t e c k n at a v att genom förfarandet avlägsnas information eller systematisk variation hos indata som inte är korrelerad mot koncentrations- eller egenskapsuppsättningen, genom att följ ande steg anordnas : framställning av en deskriptorviktuppsättning (W), vilken är normaliserad, genom projicering av deskriptoruppsättningen (X) på koncentrations- eller egenskapsuppsättningen (y, Y), projicering av deskriptoruppsättningen (X) på deskriptorviktuppsättningen (W), framställning av en deskriptortaluppsättning (t), projicering av deskriptoruppsättningen (X) på deskriptortaluppsättningen (t), framställning av en deskriptorladdningsuppsättning (p), proj icering av egenskapsuppsättningen (y) på deskriptortaluppsättningen (t), framställning av en egenskapsviktuppsättning (c), projicering av egenskapsuppsättningen (y) på egenskapsviktuppsättningen (c), framställning av en egenskapstaluppsättning (u); jämförelse mellan deskriptorladdningsuppsättningen (p) och deskriptorviktuppsättningen (W), och deras skillnad (p-w), för att på så sätt erhålla den del av deskriptorladdningsuppsättningen (p) som inte står i samband med egenskapsuppsättningen (y) ; användning av nämnda skillnadsviktuppsättning (wortho), vilken är normaliserad, som en startuppsättning fór analys av partiella minstakvadrater; beräkning av motsvarande ortogonala deskriptortaluppsättning (tortho) som proj ektion mellan deskriptoruppsättningen (X) och nämnda normaliserade ortogonala skillnadsviktuppsättning (wortho), och beräkning av en motsvarande ortogonal deskriptorladdningsuppsättning (portho) som projektion av deskriptoruppsättningen (X) på den ortogonala deskriptortaluppsättningen (tortho); eliminering av den yttre produkten av den ortogonala deskriptortaluppsättningen (tortho) och den ortogonala deskriptorladdningsuppsättningen (porthd) från deskriptoruppsättningen (X), för att på så sätt framställa restdata (E) som används som deskriptoruppsättnin g (X) i en följande latent variabel komponent; upprepning av ovan nämnda steg för varje ortogonal latent variabel komponent; varvid restdata (E) nu filtreras från stark systematisk variation vilken kan moduleras bilinjärt som den yttre produkten av den ortogonala deskriptortaluppsättningen och den 10 15 20 25 30 51 e 343 " n . . . « o ' ' '° 32 ortogonala deskriptorladdningsuppsättningen (Tortho*Portho'), vilket på så sätt ger en ortogonal deskriptoruppsättning (Xortho) som är ortogonal mot egenskapsuppsättningen (y, Y); valfritt utförande av en huvudkomponentanalys (PCA) av den ortogonala deskriptoruppsättningen (Xortho), vilket ger upphov till en bilinjär uppdelning av den ortogonala deskriptoruppsättningen (Xortho) som den yttre produkten av taluppsättningen vid huvudkomponentanalysen och laddningsuppsättningen vid huvudkomponentanalysen och resterna vid huvudkomponentanalysen (Tpcaortho*Ppcaortho' + Epcaortho), tillägg av restdata (Epcaortho) fi'ån huvudkomponentanalysen tillbaka till filtrerade restdata (E); för ñltrering av nya data utförs följ ande steg : projicering av en ny deskriptoruppsättning (xnew') på den normaliserade ortogonala skillnadsviktuppsättningen (wortho), vilket på så sätt ger upphov till en ny ortogonal deskriptortaluppsättning (tnewwortho); avlägsnande av produkten mellan den nya ortogonala deskriptortaluppsättningen (tnewortho) och den ortogonala deskriptorladdningsuppsättningen (portho') från den nya deskriptoruppsättningen (xnew'), vilket på så sätt ger nya rester (enew'), vilka används som en ny deskriptoruppsättning (xnew') i nästa ortogonala komponent; upprepning av nämnda filtrersteg för nya data för alla uppskattade ortogonala komponenter; datorberäkning av en ny ortogonal deskriptoruppsättning (xnewortho'=tnewortho'Portho') som den yttre produkten av den nya ortogonala deskriptortaluppsättningen (tnewortho) och den ortogonala deskriptorladdningsuppsättningen (portho'), datorberäkning av en ny ortogonal huvudkomponenttaluppsättning (tnewpcaortho) från projiceringen av den nya ortogonala deskriptoruppsättningen på laddningsuppsättningen (xnewortho'=Ppcaortho') från huvudkomponentanalysen, varvid de nybildade restema från huvudkomponentanalysen (enewpcaortho'=xnewortho'- tnewpcaortho*Ppcaortho') läggs till tillbaka i de nya restema (enew') om huvudkomponentanalysen har använts på den ortogonala deskriptoruppsättningen (Xortho), och endast den yttre produkten av taluppsättningarna från huvudkomponentanalysen och huvudkomponentladdningsuppsättningen (Tpcaortho*Ppcaortho') har avlägsnats från den ursprungliga deskriptoruppsättningen (X); for multipla koncentrations- eller egenskaps uppsättningar (Y) : beräkning av en huvudkomponentanalysmodell av nämnda egenskapsuppsättningar (Y=TP'+E) och upprepning av ovan nämnda steg För varje separat taluppsättning (t) från huvudkomponentanalysen och användning av den ortogonala deskriptom (Xmho) som 10 15 20 25 30 , u Q p n n »- s 1 e 34 s ä? ~ 33 inmatningsdeskriptoruppsättning (X) för vaij e efterföljande taluppsättning (t) från huvudkomponentanalysen, for att på så sätt åstadkomma nämnda filtreringsmodell för filtrering av ytterligare prover av samma typ.
2. Förfarande enligt patentkrav 1, k ä n n e t e c k n at a v att : en vanlig PLS-analys utförs med filtrerade restdata (E) och koncentrations- eller egenskapsuppsättningen (y, Y); en vanlig PLS-analys utförs med nämnda filtrerade nya restuppsättningar (enew') som förutsägelseuppsättning.
3. Förfarande enligt patentkrav 1 eller 2, k ä n n e t e c k n at a v att genom att hitta nämnda ortogonala komponenter för varje komponent separat kan en mängd störande variation i varje partiell minstakvadratkomponent analyseras.
4. Förfarande enligt något av patentkraven 1 - 3, k ä n n et e c k n at a v att förfarandet utnyttjar korsvalidering och/eller egenvärdeskriteria för att minska överanpassning.
5. Förfarande enligt något av patentkraven 1 - 4, k ä n n e t e c k n at a v att i nämnda huvudanalys (PCA) väljs komponentema i enlighet med en korsvalidering eller egenvärdeskriteria.
6. Förfarande enligt något av patentkraven 1 - 5, k ä n n e t e c k n at a v att det är utformat för att avlägsna specifika typer av variationer hos deskriptoruppsättningen (X) när en oönskad eller icke relevant koncentrations- eller egenskapsuppsättning (y) eller (Y) föreligger, genom användning av den ortogonala deskriptom (Xonho) som datauppsättning av intresse, efiersom den inte innehåller någon variation som är korrelerad mot koncentrations- eller egenskapsuppsättningen (y, Y).
7. Anordning för koncentrations- eller egenskapskalibrering av indata från prover av substanser eller ämnen, varvid nämnda kalibrering är bestämmande för en filtermodell för ytterligare prover av samma substans eller ämne, innefattande att valfritt omvandla, centrera och skala indata för att erhålla en deskriptoruppsättning (X) och en koncentrations- eller egenskapsuppsättning (y, Y), k ä n n e t e c k n a d a v att nämnda filtermodell avlägsnar information eller systematisk variation hos indata som inte är korrelerad mot koncentrations- eller egenskapsuppsättningen, genom att den innefattar : proj iceringsorgan för att åstadkomma en deskriptorviktuppsättning (W), vilken normaliseras, genom proj icering av deskriptoruppsättningen (X) på koncentrations- eller egenskapsuppsättningen (y, Y); projiceringsorgan för projicering av deskriptoruppsättningen (X) på 10 15 20 25 30 516 343 34 o ø . Q n n» deskriptorviktuppsättningen (W) för framställning av en deskriptortaluppsättning (t); projicering för deskriptoruppsättningen (X) på deskriptortaluppsättningen (t) för att åstadkomma en deskriptorladdningsuppsättning (p); projiceringsorgan för projicering av egenskapsuppsättningen (y) på deskriptortaluppsättningen (t) för att åstadkomma en egenskapsviktuppsättning (c); projiceringsorgan för projicering av egenskapsuppsättningen (y) på egenskapsviktuppsättningen (c) för att åstadkomma en egenskapstaluppsättning (u); jämförelseorgan för jämförelse av deskriptorladdningsuppsättningen (p) och deskriptorviktuppsättningen (w), och deras skillnad (p-w), för att på så sätt erhålla den del av deskriptorladdningsuppsättningen (p) som inte står i samband med egenskapsuppsättningen (y, Yl; användning av nämnda skillnadsviktuppsättning (wortho), vilken är nonnaliserad, som en startuppsättning för partiell minstakvadratanalys; beräkningsorgan för motsvarande ortogonala deskriptortaluppsättning (tortho) som proj ektion mellan deskriptoruppsättningen (X) och nämnda normaliserade ortogonala skillnadsviktuppsättning (wortho), och för beräkning av en motsvarande ortogonal deskriptorladdningsuppsättning (portho) som proj ektion av deskriptoruppsättningen (X) på den ortogonala deskriptortaluppsättningen (tortho); beräkningsorgan för avlägsnande av den yttre produkten av den ortogonala deskriptortaluppsättningen (tortho) och den ortogonala deskriptorladdningsuppsättningen (portho') från deskriptoruppsättningen (X), vilket på så sätt ger restdata (E) som används som deskriptoruppsättning (X) i nästa komponent; upprepad användning av ovanstående organ för varje ortogonal latent variabel komponent; filtreringsorgan för restdata (E) från en stark systematisk variation som kan modelleras bilinj ärt som den yttre produkten av den ortogonala deskriptortaluppsättningen och den ortogonala deskriptorladdningsuppsättningen (Tortho*Portho'), vilket på så sätt ger en ortogonal deskriptoruppsättning (Xortho) som är ortogonal mot egenskapsuppsättningen (y, Y); valfri framställning av analysorgan för en huvudkomponentanalys (PCA) på den ortogonala deskriptoruppsättningen (Xortho), vilket ger en bilinj är uppdelning av den ortogonala deskriptoruppsättningen (Xortho) som den yttre produkten av taluppsättningen från huvudkomponentanalysen och laddningsuppsättningen från huvudkomponentanalysen och restema från huvudkomponentanalysen (Tpcaortho*Ppcaortho' + Epcaortho), med tillägg 10 15 20 25 30 . . . > e» 516 343 35 av restdata (Epcaortho) från huvudkomponentanalysen tillbaka till de filtrerade restdata (E); filtreringsorgan för nya data, utförande med följande organ : organ för proj icering av en ny deskriptoruppsättning (xnew') på den normaliserade ortogonala skillnadsviktuppsättningen (wortho), vilket på så sätt ger en ny ortogonal deskriptortaluppsättning (tnewortho); beräkningsorgan för avlägsnande av produkten mellan den nya ortogonala deskriptortaluppsättningen (tnewortho) och den ortogonala deskriptorladdningsuppsättningen (portho') från den nya deskriptoruppsättningen (xnew'), vilket på så sätt ger nya rester (enew') vilka används som en ny deskriptoruppsättning (xnew') i en följ ande ortogonal komponent; upprepad användning av nämnda filtrering av nya data för alla uppskattade ortogonala komponenter; beräkningsorgan för beräkning av en ny ortogonal deskriptoruppsättning (xnewortho'=tnewortho*Portho') som den yttre produkten av den nya ortogonala deskriptortaluppsättningen (tnewortho) och den ortogonala deskriptorladdningsuppsättningen (portho'), beräkning av en ny ortogonal huvudkomponenttaluppsättning (tnewpcaortho) från proj iceringen av den nya ortogonala deskriptoruppsättningen på laddningsuppsättningen från huvudkomponentanalysen (xnewortho'* Ppcaorthd), varvid de nybildade resterna från huvudkomponentanalysen (enewpcaortho=xnewortho'-tnewpcaortho* Ppcaortho') läggs tillbaka i de nya resterna (enew') om en huvudkomponentanalys har använts på den ortogonala deskriptoruppsättningen (Xortho), och enbart den yttre produkten av taluppsättningama från huvudkomponentanalysen och huyudkomponentsladdningsuppsättningen (Tpcaortho*Ppcaortho') har avlägsnats från den ursprungliga deskriptoruppsättningen (X); och för multipla koncentrations- eller egenskapsuppsättningar (Y) : beräkning av en huvudkomponentanalysmodell på nämnda egenskapsuppsättningar (Y=TP'+E) och upprepad användning av de ovan nämnda organen för varje separat taluppsättning (t) från huvudkomponentanalysen och användning av den ortogonala deskriptorn (Xonho) som inmatningsdeskriptoruppsättning (X) för varje efterföljande taluppsättning (t) vid huvudkomponentanalysen, för att på så sätt åstadkomma nämnda ñltreringsmodell för filtrering av ytterligare prover av samma typ.
8. Förfarande enligt patentkrav 7, k ä n n e t e c k n at a v : organ för partiell minstakvadratanalys för filtrerade restdata (E) och koncentrations- eller egenskapsuppsättningen (y, Y), och för nämnda filtrerade nya restuppsättningar (enew') som förutsägelseuppsättning. 10 15 516 343 36 q . . Q - n - . . a s
9. Anordning enligt patentkrav 7 - 8, k ä n n e t e c k n a d a v att genom att återfinna nämnda ortogonala komponenter för varje komponent separat kan en mängd störande variation i varje partiell minstakvadratkomponent analyseras av nämnda analysorgan.
10. Anordning enligt patentkrav 7 - 9, k ä n n e t e c k n a a v att den utnyttjar korsvalidering och/eller egenvärdeskriteria för att minska överanpassning.
11. Anordning enligt patentkrav 7 - 10, k ä n n e t e c k n a d a v att nämnda komponenter från huvudkomponentanalysen (PCA) väljs av nämnda analysorgan i enlighet med en korsvalidering eller egenvärdeskriteria.
12. Anordning enligt patentkrav 7 -11, k ä n n e t e c k n a d a v att den är utformad för att eliminera specifika typer av variationer hos deskriptoruppsättningen (X), när en oönskad eller icke relevant koncentrationsuppsättning eller egenskapsuppsättning (y) föreligger, genom användning av den ortogonala deskriptom (Xom) som en datauppsättning av intresse, eftersom den inte innehåller någon variation som är korrelerad mot koncentrations- eller egenskapsuppsättningen (y, Y).
SE0000563A 2000-02-22 2000-02-22 Metod och anordning för kalibrering av indata SE516343C2 (sv)

Priority Applications (5)

Application Number Priority Date Filing Date Title
SE0000563A SE516343C2 (sv) 2000-02-22 2000-02-22 Metod och anordning för kalibrering av indata
US10/204,646 US6853923B2 (en) 2000-02-22 2001-02-22 Orthogonal signal projection
EP01910276A EP1269341A1 (en) 2000-02-22 2001-02-22 Orthogonal signal projection
PCT/SE2001/000399 WO2001063441A1 (en) 2000-02-22 2001-02-22 Orthogonal signal projection
AU2001237850A AU2001237850A1 (en) 2000-02-22 2001-02-22 Orthogonal signal projection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0000563A SE516343C2 (sv) 2000-02-22 2000-02-22 Metod och anordning för kalibrering av indata

Publications (3)

Publication Number Publication Date
SE0000563D0 SE0000563D0 (sv) 2000-02-22
SE0000563L SE0000563L (sv) 2001-08-23
SE516343C2 true SE516343C2 (sv) 2001-12-17

Family

ID=20278532

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0000563A SE516343C2 (sv) 2000-02-22 2000-02-22 Metod och anordning för kalibrering av indata

Country Status (5)

Country Link
US (1) US6853923B2 (sv)
EP (1) EP1269341A1 (sv)
AU (1) AU2001237850A1 (sv)
SE (1) SE516343C2 (sv)
WO (1) WO2001063441A1 (sv)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002092305A (ja) * 2000-09-13 2002-03-29 Hitachi Ltd スコア算出方法及びスコア提供方法
US9135402B2 (en) 2007-12-17 2015-09-15 Dexcom, Inc. Systems and methods for processing sensor data
US7494465B2 (en) 2004-07-13 2009-02-24 Dexcom, Inc. Transcutaneous analyte sensor
US7920906B2 (en) 2005-03-10 2011-04-05 Dexcom, Inc. System and methods for processing analyte sensor data for sensor calibration
US9247900B2 (en) 2004-07-13 2016-02-02 Dexcom, Inc. Analyte sensor
EP1766345A2 (en) 2004-06-28 2007-03-28 Aspectrics, Inc. Encoder spectrograph for analyzing radiation using spatial modulation of radiation dispersed by wavelength
US8565848B2 (en) 2004-07-13 2013-10-22 Dexcom, Inc. Transcutaneous analyte sensor
US7310544B2 (en) 2004-07-13 2007-12-18 Dexcom, Inc. Methods and systems for inserting a transcutaneous analyte sensor
US9471978B2 (en) * 2004-10-04 2016-10-18 Banner Health Methodologies linking patterns from multi-modality datasets
US7248370B2 (en) * 2005-03-07 2007-07-24 Caleb Brett Usa, Inc. Method to reduce background noise in a spectrum
US7251037B2 (en) 2005-03-07 2007-07-31 Caleb Brett Usa, Inc. Method to reduce background noise in a spectrum
US8744546B2 (en) 2005-05-05 2014-06-03 Dexcom, Inc. Cellulosic-based resistance domain for an analyte sensor
US8943163B2 (en) * 2005-05-02 2015-01-27 S-Matrix System for automating scientific and engineering experimentation
US7613574B2 (en) * 2005-10-28 2009-11-03 S-Matrix System and method for automating scientific and engineering experimentation for deriving surrogate response data
US8209149B2 (en) 2005-10-28 2012-06-26 S-Matrix System and method for automatically creating data sets for complex data via a response data handler
US7606685B2 (en) * 2006-05-15 2009-10-20 S-Matrix Method and system that optimizes mean process performance and process robustness
GB0606776D0 (en) * 2006-04-03 2006-05-10 Novartis Pharma Ag Predictive biomarkers for chronic allograft nephropathy
US7494893B1 (en) 2007-01-17 2009-02-24 Pdf Solutions, Inc. Identifying yield-relevant process parameters in integrated circuit device fabrication processes
US8219328B2 (en) 2007-05-18 2012-07-10 S-Matrix System and method for automating scientific and engineering experimentation for deriving surrogate response data
US20080294361A1 (en) * 2007-05-24 2008-11-27 Popp Shane M Intelligent execution system for the monitoring and execution of vaccine manufacturing
US20080312875A1 (en) * 2007-06-12 2008-12-18 Yu Guanyuan M Monitoring and control of integrated circuit device fabrication processes
US8417312B2 (en) 2007-10-25 2013-04-09 Dexcom, Inc. Systems and methods for processing sensor data
US8290559B2 (en) 2007-12-17 2012-10-16 Dexcom, Inc. Systems and methods for processing sensor data
TW200943092A (en) * 2007-12-21 2009-10-16 Mks Instr Inc Hierarchically organizing data using a partial least squares analysis (PLS-trees)
DE102009026893A1 (de) * 2009-06-10 2010-12-16 Endress + Hauser Flowtec Ag Verfahren und Messsystem zur Bestimmung von Zustandsgrößen eines Messmediums
NZ599772A (en) * 2009-11-02 2015-10-30 Uni Fur Bodenkultur Wien Method for determining polycyclic aromatic hydrocarbon contaminant concentration
US8359164B2 (en) * 2010-03-02 2013-01-22 Weiyong Li Supervised principal component analysis
US9792823B2 (en) * 2014-09-15 2017-10-17 Raytheon Bbn Technologies Corp. Multi-view learning in detection of psychological states
GB2533589A (en) * 2014-12-22 2016-06-29 Ndc Infrared Eng Ltd Measurement of porous film
CN111220566A (zh) * 2020-01-16 2020-06-02 东北大学秦皇岛分校 基于opls和pds的红外光谱测量仪器标定迁移方法
ES2932150A1 (es) * 2021-06-29 2023-01-13 Luque Ripoll Luis De Procedimiento de determinación del origen geográfico y/o la especie botánica en muestras de madera

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69027233T2 (de) * 1989-03-03 1996-10-10 Edward W Stark Verfahren und Vorrichtung zur Signalbehandlung
DE4224621C2 (de) 1992-07-25 1994-05-05 Boehringer Mannheim Gmbh Verfahren zur Analyse eines Bestandteils einer medizinischen Probe mittels eines automatischen Analysegerätes
CA2285058C (en) * 1997-03-24 2004-06-01 Evan W. Steeg Coincidence detection method, products and apparatus
DE19810917A1 (de) * 1998-03-13 1999-09-16 Buehler Ag Automatisches Kalibrationsverfahren
SE512540C2 (sv) 1998-06-22 2000-04-03 Umetri Ab Metod och anordning för kalibrering av indata
US6593572B2 (en) * 2000-12-13 2003-07-15 Midwest Research Institute Method of predicting mechanical properties of decayed wood

Also Published As

Publication number Publication date
AU2001237850A1 (en) 2001-09-03
US6853923B2 (en) 2005-02-08
SE0000563D0 (sv) 2000-02-22
EP1269341A1 (en) 2003-01-02
WO2001063441A1 (en) 2001-08-30
US20030200040A1 (en) 2003-10-23
SE0000563L (sv) 2001-08-23

Similar Documents

Publication Publication Date Title
SE516343C2 (sv) Metod och anordning för kalibrering av indata
Brereton et al. Chemometrics in analytical chemistry—part I: history, experimental design and data analysis tools
Roger et al. EPO–PLS external parameter orthogonalisation of PLS application to temperature-independent measurement of sugar content of intact fruits
Kowalski et al. Recent developments in multivariate calibration
Brereton Applied chemometrics for scientists
Langsrud 50–50 multivariate analysis of variance for collinear responses
Ferré et al. Net analyte signal calculation for multivariate calibration
Daszykowski et al. TOMCAT: A MATLAB toolbox for multivariate calibration techniques
US5592402A (en) Method for interpreting complex data and detecting abnormal instrumentor process behavior
Vigni et al. Exploratory data analysis
Shao et al. A new regression method based on independent component analysis
Kriesten et al. Identification of unknown pure component spectra by indirect hard modeling
Gerretzen et al. Boosting model performance and interpretation by entangling preprocessing selection and variable selection
Cécillon et al. Spectral fingerprinting of soil organic matter composition
Tauler Application of non-linear optimization methods to the estimation of multivariate curve resolution solutions and of their feasible band boundaries in the investigation of two chemical and environmental simulated data sets
SE512540C2 (sv) Metod och anordning för kalibrering av indata
Brereton Tutorial review. Deconvolution of mixtures by factor analysis
Mishra et al. FRUITNIR-GUI: A graphical user interface for correcting external influences in multi-batch near infrared experiments related to fruit quality prediction
Goodacre et al. Fourier transform infrared spectroscopy and chemometrics as a tool for the rapid detection of other vegetable fats mixed in cocoa butter
Reis et al. Multiscale statistical process control with multiresolution data
Mou et al. Robust calibration model transfer
Metz et al. RoBoost-PLS2-R: an extension of RoBoost-PLSR method for multi-response
Coen et al. Optimizing the tuning parameters of least squares support vector machines regression for NIR spectra
Luo et al. Quality prediction based on HOPLS-CP for batch processes
Booksh et al. Calibration method choice by comparison of model basis functions to the theoretical instrumental response function

Legal Events

Date Code Title Description
NUG Patent has lapsed