SE512540C2 - Metod och anordning för kalibrering av indata - Google Patents

Metod och anordning för kalibrering av indata

Info

Publication number
SE512540C2
SE512540C2 SE9802229A SE9802229A SE512540C2 SE 512540 C2 SE512540 C2 SE 512540C2 SE 9802229 A SE9802229 A SE 9802229A SE 9802229 A SE9802229 A SE 9802229A SE 512540 C2 SE512540 C2 SE 512540C2
Authority
SE
Sweden
Prior art keywords
model
concentration
calibration
input data
filtration
Prior art date
Application number
SE9802229A
Other languages
English (en)
Other versions
SE9802229L (sv
SE9802229D0 (sv
Inventor
Svante Wold
Original Assignee
Umetri Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Umetri Ab filed Critical Umetri Ab
Priority to SE9802229A priority Critical patent/SE512540C2/sv
Publication of SE9802229D0 publication Critical patent/SE9802229D0/sv
Priority to AU48122/99A priority patent/AU4812299A/en
Priority to EP99931685A priority patent/EP1090358A1/en
Priority to JP2000556315A priority patent/JP2002519763A/ja
Priority to PCT/SE1999/001035 priority patent/WO1999067722A1/en
Priority to US09/720,425 priority patent/US6754543B1/en
Publication of SE9802229L publication Critical patent/SE9802229L/sv
Publication of SE512540C2 publication Critical patent/SE512540C2/sv

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light

Description

iii iiwnii-I m »i Wat. i iifilšäili; å :n zizvr 10 15 20 25 30 35 w 512 540 * 2 T Naes, Multivariate Calibration, Wiley, New York, 1989 och R J Bames, M S Dhanoa och S J Lister, Standard Normal Variate Transformation and De-trending of Near-Infrared Diffuse Reflectance Spectra. Appl. Spetrosc. 43 (1989) 772-777.
Dessa signalkorrigeringar utgör olika fall av filtrering där en signal (t ex ett NIR- spektrum) fås att uppvisa “bättre egenskaper" genom att passera genom ett filter. Syftena med filtrering är ofta relativt vaga; det är inte alltid lätt att specificera vad som menas med "bättre egenskaper". T o m i fallet med kalibrering där det är möjligt att specificera detta syfte i termer av minskade förutsägelsefel eller enklare kalibreringsmodeller, är det svårt att konstruera allmänna filter som verkligen förbättrar dessa egenskaper hos data.
Sammanfattning av den beskrivna uppfinningen Föreliggande uppfinning avser och en anordning som eliminerar ovidkommande delar hos en uppsättning X-indata från prover av substanser eller ämnen såsom spektroskopiska indata från det infraröda eller när-infraröda området, andra spektroskopiska indata, indata för förutsägelser och allmänt för indata som kan delas in i kategorier av uppsättningar eller matriser i enlighet med föreliggande uppfinning. Detta uppnås genom att tillse att den eliminerade delen är ortogonal mot Y, eller så nära ortogonal som möjligt.
Metoden enligt föreliggande uppfinning har kallats OSC (Orthogonal Signal Correction = Ortogonal signalkorrigering).
Sålunda föreslås genom föreliggande uppfinning ett förfarande för förbehandling (ñltrering) av indata från prover av substanser eller ämnen vilka tagits för koncentrations- eller egenskapskalibrering. En kalibrering är bestämmande för en filtermodell för efterkommande prover av samma typ och innefattar följande steg : valfri omvandling, centrering och skalning av indata för att åstadkomma två startuppsättningar ; ordnande av nämnda indata i en inmatningsuppsättning ; bestämning av en koncentrations- eller egenskapsuppsättning ; bestämning av en träff-uppsättning och en last-uppsättning och av deras produkt, varvid nämnda produkt efterliknar inmatningsuppsättningen så mycket som möjligt med den restriktionen att träff-uppsättningen är ortogonal mot koncentrations- eller egenskapsuppsättningen; filtrering av nämnda indata genom subtraktion av nämnda produkt från inmatningsuppsättningen för att eliminera variationer som sammanhänger med andra egenskaper än föreliggande kalibreringsegenskaper; varvid nämnda modell är bestämmande för filtreringen och således åstadkommer att efterföljande prover av samma typ kan filtreras med filtermodellen.
Vid en utföringsform år uppsättningar anordnade i två matriser eller en matris och en koncentrations- eller egenskapsvektor.
Vid en annan utföringsform kombineras den bilinjära filtreringen med ett annat 10 15 20 25 30 35 -i 512 540 " 3 linjärt filtrerförfarande. Det andra filtrerförfarandet vid utföringsformen är en glättningsfiltrering eller en Fourier-filtrering vid en föredragen utföringsform.
Vid ytterligare en annan utföringsforrn förbättras modellen genom tillämpning av multipla uppsättningar av indata som övningsuppsättningar och genom upprepning av nämnda steg med en bättre koncentration eller egenskap, och således genom avstämning av filtrermodellen.
Genom uppfinningen föreslås dessutom en anordning för koncentrations- eller egenskapskalibrering av prover från spektroskopiska indata. Koncentrations- eller egenskapskalibreringen är bestämmande för ett filterorgan för efterföljande spektra av prover av samma typ, innefattande : omvandlingsorgan, centreringsorgan, och skalorgan för att valfritt påverka indata för att åstadkomma två startuppsättningar; sorteringsorgan för att ordna nämnda indata i en inmatningsuppsättning; bestämningsorgan för bestämning av en träff-uppsättning och en last-uppsättning utgående från en inmatningsuppsättning och en koncentrations- eller egenskapskalibreringsuppsättning,; beräkningsorgan för fastställande av produkten av träff-uppsättningen och last- uppsättningen, varvid nämnda produkt efterliknar inmatningsuppsättningen så mycket som möjligt med den restriktionen att träff-uppsättningen är ortogonal mot koncentrations- eller egenskapskalibreringen; filtrerorgan för filtrering av nämnda spektroskopiska indata genom subtraktion av nämnda produkt från inmatningsuppsättningen för att eliminera variationer som sammanhänger med andra egenskaper än föreliggande kvalitetsegenskaper; varvid nämnda modell är bestämmande för filtreringen och gör således att efterföljande prover av samma typ kan filtreras med filtrermodellen.
Vid en utföringsforrn av nämnda anordning är uppsättningama anordnade som två matriser eller en matris och en koncentrations- eller egenskapsvektor.
Vid en annan utföringsforrn kombineras nämnda bilinjära filtrering med ett annat linjärt filtrerrnedel. Nämnda andra filtrerorgan är ett organ som utför t ex glättningsfiltrering eller Fourier-filtrerin g.
Vid ytterligare en annan utföringsform förbättras nämnda filterrnodell genom tillämpning av multipla uppsättningar av indata som övningsuppsättningar för nämnda organ, vilket således ger bättre fastställda egenskaper genom avstämning av filtrermodellen.
Kortfattad beskrivning av ritningarna För en mer fullständig förståelse av föreliggande uppfinning och av ytterligare uppfinningsföremål och fördelar med uppfinningen hänvisas nu till nedanstående beskrivning som ges i samband med de bifogade figurerna där : Figur 1 illustrerar ett obearbetat reflexionsspektrum inom det när-infraröda området l ' “l lill' lllllilllll lllll " 10 15 20 25 30 35 -' 512 540 ~* 4 (NIR); Figur 2 illustrerar ett korrigerar (OSC) reflexionsspektrum i det när-infraröda området (NIR) i enlighet med föreliggande uppfinning; Figurerna 3a, 3b och 3c illustrerar observerade kontra förutsagda viskositetsvärden for PLS-modeller fastställda utgående från en uppsättning data från mald cellulosa, i Figur 3A visas resultaten från en modell som baserats på illustrerade obearbetade data, i Figur 3b visas resultaten från en modell som baseras på MSC-filtrerade data och i Figur 3c visas resultaten från en modell baserad på CSC-filtrerade data.
Figur 4 åstadkommer en schematisk beskrivning av förfarandet enligt föreliggande uppfinning; Figur 5 återger ett exempel på en multipel övningsuppsättningsprocess som ingår i förfarandet i enlighet med Figur 4; och Figur 6 återger schematiskt en anordning for koncentrations- eller egenskapskalibrering av prover.
Förteckning över befogade tabeller Tabell 1 : Qz-värden enligt korsvis bekräftelse för varje fastställd modell enligt föreliggande uppfinning; Tabell 2 : RMSEP-värden för testuppsättningen för var och en av de fastställda modellerna; och Tabell 3 : antal PLS-komponenter for var och en av de fastställda modellerna.
Föredragna utfóringsformer av uppfinningen Föreliggande uppfinning beskrivs här nedan, varvid den använder indata från spektroskopi inom det infraröda eller när-infraröda området, men här bör noteras att det är möjligt att mata in indata från nästan vilket tekniskt område som helst så länge som de syften som framhävs genom uppfinningen uppnås. Sålunda är förfarandet enligt föreliggande uppfinning inte begränsat till spektroskopiska indata. Andra möjliga tekniska områden som uppvisar indata härför sig t ex till förutsägelser, prognoser etc. Även termen egenskap som används i föreliggande uppfinning måste ges en bred tolkning innefattande sådana egenskaper hos fasta, halvfasta, fluida prover och ångprover etc såsom koncentration, densitet, elasticitet, viskositet, styrka, tjocklek, klasstillhörighet (t ex oktantal för bränsleklassificering) etc och förutsägelser från sannolikhetsinmatningar (t ex börsinformationer) eller andra inmatningssiffror för förutsägelse på vilket tekniskt område som helst etc.
Som en illustration visas i föreliggande beskrivning en modellering av viskositeten hos tre uppsättningar av cellulosaprover som modifierats med avseende på deras NIR- reflexionsspektra och ett liknande exempel där NIR-spektra används för att modellera och förutsäga l7 uppmätta egenskaper hos prover av pappersmassa. 10 15 20 25 30 35 -i 512 540 * 5 I föreliggande beskrivning av en föredragen utföringsforin används halvfeta versaler för matriser, t ex X och Y, små halvfeta bokstäver för kolumnvektorer, t ex v, ej feta bokstäver för vektor- och matriselement, t ex xik, och vi, och för index, t ex i, j, k och 1, samt icke feta versaler för indexgränser, t ex K och N, och A. Radvektorer visas som transponerade vektorer, t ex v', och således indikeras en transponering med ett primtecken ': Index i används som provindex (rader i X och Y; i = 1, ..., N) och index k som index för X- variabler (k = 1, 2, ..., K).
Tidigare, innan användningen av flervariabel kalibrering, var det tveklöst så att det ideala spektret liknande ett väl upplöst NMR-spektrum (Nuclear Magnetic Resonance = nukleär magnetisk resonans) eller IR-spektrum, dvs huvudsakligen en rak baslinje plus några smala och symmetriska toppar som utan tvetydighet sträcker sig ovanför denna baslinje.
Enligt vad som illustreras i Figur l har reflexionsspektret inom det när-infraröda området (NIR) inte detta utseende. Tvärtom finns baslinjevariationer och andra variationer som är variationer eller mätfel som uppstår i mätinstrument och variationer beroende på en ändring av komponenter som provvariationer bidrar med men som inte hänför sig till intressanta variabler (irrelevant information).
I Figur 1 innefattar den horisontala skalan spektroskopiska variabla tal från 1 till 1201 (inklusive 0) vilka härrör från 1201 digitaliserade värden. Den vertikala skalan avbildar den spektrala amplituden i godtyckliga enheter.
Brus tillför "krumbukter" men kan avlägsnas genom en lämplig "filtrering" av spektret. De flesta syftena med filtrering uttrycks fortfarande samstämmigt som ett sätt göra signaler och spektra "glättade" och behagliga för ögat och således enkla att tolka.
Vid en flervariabelanalys utvärderas emellertid ett spektrum av datororgan. Det finns inte som mycket som talar för att "glättade" och för ögat behagliga signaler innehåller mer information för datoriserade filtrerade metoder än obearbetade ofiltrerade spektra som illustreras av reflexionsspektret som återges i Figur 2. Spektret i Figur 2 är ett korrigerat (OSC) reflexionsspektrum i det när-infraröda området (NIR) i enlighet med föreliggande uppfinning. Skaloma i Figur 2 överensstämmer med skaloma i Figur 1.
För att bygga upp en effektiv filtrerinetod finns i grund och botten ett behov att kvantitativt formulera kriteria för vad filtreringen antas leda till. Vid flervariabel kalibrering specificeras kvantitativt minst ett filtrermål, nämligen att filtreringen inte får ta bort information om Y från spektret X. Här är Y det som det kalibreras mot, dvs analytkoncentrationer eller andra "egenskaper" hos prover. Detta "icke borttagande" kan formuleras stringent, dvs att informationen i Y inte skall vara relaterad, ortogonal, till vad som avlägsnas från X genom ñltreringen.
För att uppnå en sådan ortogonalitet är det emellertid nödvändigt att filtren uttrycks på ett sådant sätt att deras ortogonalitet mot en vektor eller matris, Y, kan kvantifieras. Detta verkar vara lättast att utföra genom att uttrycka filtreringen som borttagande av en bilinjär struktur från X, dvs en produkt av en "score"-matris eller träff-matris, T, och en last-matris, w-li ii 'lrllll m' I ni. i i “lll 10 15 20 25 30 35 _- 512 540 f- 6 Pl. Ortogonalt mot Y betyder då att både T'Y och Y'T är matriser med enbart element uppskattade till noll.
Enligt den diskussion som förs av Sun i J Sun, Statistical Analysis of NIR-data : Data pretreatment. J Chemom ll (1997) 525-532, är det möjligt att formulera en klass av filter såsom PCA-liknande flervariabelprojektioner. Här menas med PCA (eng. Principal Components Analysis) analys av huvudkomponenter enligt vad som vidare beskrivs i J F Jacksons verk A User's guide to principal components. Wiley, New York, 1991. Att basera ett filter på ej modifierad PCA har den fördelen att en persondatonnodell skulle beskriva så många som möjligt av X och skulle således uppfånga den mest systematiska variationen av X. Nackdelen är emellertid att denna systematiska variation innehåller både den som är linjärt orelaterad till Y och den som innehåller linjär information om Y.
PCA-liknande (analys av huvudkomponenter) filter kan beskrivas som : X = TP' + E Här betecknar X matris nr (N x K) av ofiltrerade, okorrigerade uppsättningar av digitaliserade spektra och E är matris nr (N x K) av "filtrerade" spektra. Träff-matris nr (N x A) anges med T och P' är matris nr (K x A) av "filter", laster. Antalet prover och variabler i "övningsuppsättningen" (kalibreringsuppsättningen) är N och K, och A är antalet komponenter. Sun har funnit att A = l eller 2 är optimalt i de fall han har rapporterat om i J Sun, Statistical Analysis of NIR-data : Data pretreatment J Chemom ll (1997) 525-532.
Om sålunda T kan göras ortogonal mot Y tas ingen information bort från X som förhåller sig linjärt till Y. Med denna insikt är det möjligt att utveckla filter, baslinjekorrigeringar etc med ortogonal restriktion.
Här hänvisas till den ofta använda Additive and Multiplicative Signal Correction (MSC) av P Geladi, D MacDougall, och H Martens, Linearization and Scatter-Correction for Near-Infrared Reflectance Spectra of Meat, Applied Spectroscopy, 3 (1985), 491-50, se även likaledes H Martens och T Naes, Multivariate Calibration (Flervariabelkalibrering). Wiley, New York, 1989. Här "normaliseras" varje digitaliserat spektrum, radvektom x,', genom en regression av denna mot genomsnittsspektret i övningsuppsättningen, m : Xik = aa "i" bamk + ett Det genomsnittliga spektret hos övningsuppsättningen inbegriper elementen : mk = E x", / N Därefter subtraheras från varje rad, xf, interceptet (a,) och delas med den multiplikativa konstanten (b,) : Xi, korr' = (Xi, ' al) / b» 10 15 20 25 30 35 -' 512 540 * 7 Här bör noteras att denna korrigering (filter) inte kan uttryckas som en bilinjär, PCA-liknande expansion. Sålunda kan MSC inte på ett enkelt sätt göras ortogonal mot Y. Här inses även att det finns en väsentlig risk att vektorema a och b är korrelerade mot Y och att MSC således kan avlägsna Y-relaterad information från X.
Samma argument gäller Barnes' m fl standardiserade normalvariabelkorrigering (SNV), se R J Barnes, M S Dhanoa, och S J Lister. Standard Normal Variate Transformation and De-trending of Near-Infrared Diffuse Reflectance Spectra. Appl. Spectrosc. 43 (1989) 772-777. Detta filter har exakt samma matematiska form som en av MSC-korrigeringama, men parametrama a, och b, fastställs som den genomsnittliga avvikelsen respektive standardavvikelsen hos rad nr i hos X.
Om emellertid provspektra befinner sig relativt nära sitt genomsnitt och om "sluttningama" b, inte befinner sig alltför långt från 1,0 eller annars är relativt konstanta kan en tvåkomponents bilinjär expansion fortfarande relativt väl approximera ovan nämnda korrigeringar. Då skulle OSC som beskrivs här nedan utföra en filtrering liknande MSC och SNV, men utan att avlägsna relevant information från X i enlighet med föreliggande uppfinning.
I enlighet med föreliggande uppfinning är det nu möjligt att avlägsna bilinjära komponenter från X vilka är ortogonala mot Y, dvs att utföra en signalkorrigering som inte tar bort någon information från X. Detta sker genom att sätta upp en PCA/PLS-relaterad lösning vilken från X tar bort bara det som är orelaterat (ortogonalt) till Y. Denna metod baserar sig på det faktum att så länge som steg i NIPALS iterativa algoritm i den klassiska tvåblocks-PLS-regressionen bibehålls kan viktvektorn w ändras för att innefatta restriktioner, glättning eller som här målet att t = Xw skall vara ortogonal mot Y. Detta faktum påvisades av A Höskuldsson, PLSs regression methods, J Chemometrics 2 (1988) 211-228. Här kommer OSC-algoritmen att vara identiskt lika med den vanliga PLS-algoritmen förutom det avgörande steget med bestämning av vikterna, W. Normalt fastställs dessa så att kovariansen maximeras mellan X och Y men här fastställs de så att denna kovarians minimeras, dvs så att de kommer så nära ett ortogonalt förhållande mellan t och Y som möjligt.
OSC-förfarandet innehåller följande kännetecken : (a) att signalkorrigeringen (filtrering) uttrycks som subtraktionen av ett bilinjärt, PLS-liknande, uttryck T P'; och (b) att "OSC-träff-en", ta, kan fastställas från nya provspektra såsom tm, ,= x ,W ny a När antalet X-variabler, K, är större än N (antalet övningsprov) är det alltid möjligt "il ri'i -ii i *vi ii ll l llfl' lll" i'| i *ii 'l|ll' l lill' I lll" llll l 'll |'|ll l ll 10 15 20 25 30 35 512 540 r 8 att finna en exakt ortogonal OSC-lösning, men om K < N är detta inte alltid möjligt. Detta betyder även att för K > N finns det oändligt många OSC-lösningar där en modell enligt föreliggande uppfinning sätts upp för att finna ut vilken som modellerar så mycket av X som möjligt vid varje komponent, dvs varje produkt av träff-vektom ta och last-vektom pa. Denna lösning är emellertid inte alltid den "bästa" och ytterligare restriktioner med avseende på W- vektorerna kan vara berättigade vid OSC.
Här nedan ges en förklaring till föreliggande version av OSC-förfarandet. l.
Valfritt omvandla, centrera och skala data för att erhålla en "obehandlad" X- och Y-matris.
Börja med att fastställa den första huvudkomponenten hos X , med träff- vektom t.
Ställ in t ortogonalt mot Y. fn,= <1 - (Yo/'Yt " w Fastställ en viktvektor W, som gör att Xw = tny. Detta sker genom en PLS- uppskattning som ger en generaliserad invertering = X' w = X' tm.
Fastställ en ny träff-vektor utgående från X och W t = X W Beräkna en uppdaterad last-vektor p' = t'X / t't Kontrollera konvergensen genom att testa om t har stabiliserats konvergens om Ht - t / < 106 gammal om ingen konvergens föreligger : återgå till steg 3 och fortsätt annars med steg 8.
Subtrahera "korrigeringen" från X för att erhålla rester, E E = X - t p' Fortsätt med nästa "komponent" genom att använda E som X och därefter 10 15 20 25 30 35 f 512 540 r 9 ytterligare en etc ända till dess att resultatet är tillfredsställande.
En viktig anmärkning är att om alltför många OSC-komponenter subtraheras från den ursprungliga X-matrisen så leder detta till en MLR- lösning (Multiple Linear Regression - Multipel linjär regression) eftersom all information som inte står i förhållande till Y då måste avlägsnas. Om endast två eller tre komponenter for filtreringen används kommer detta emellertid inte att leda till problem av detta slag. 10. Nya prover (törutsägelseuppsättningen) korrigeras under användning av W och P från kalibreringsmodellen. För varje ny vektorobservation, Xny' : I, = Xny' W, el' = Xny' _ t] pl' t, = e,' W, 92' = el' ' tz P2' och så vidare l Efter A komponenter är de slutgiltiga resterna de korrigerade x-data, vilka då ger de törutsagda värdena för yny' (törutsagda svarsvärden för det nya provet).
Innan bestämningarna kan X och Y omvandlas, centreras och skalas enligt vad som omnämns här nedan.
Enligt en utforingsform av OSC enligt föreliggande uppfinning fastställs och avlägsnas från X en komponent i taget enligt standardmetoden NIPALS (Non Linear Iterative Partial Least Square = Icke linjär iterativ partiell minsta kvadrat). Detta har den fördelen att metoden kan fungera även om data saknas på samma sätt som vanlig PLS och PCA.
PLS, som betyder iterativ partiell minsta kvadratprojektion mot latenta strukturer, är ett särskilt förfarande för flervariabel kalibrering där en modell utvecklas för relationen mellan en matris av indata, X, och en vektor eller matris av koncentrations- eller egenskapsdata, Y, som beskrivs hos S Wold, A Ruhe, H Wold och W J Dunn IIII, The Collinearity Problem in Linear Regression. The Partial Least Squares Approach to Generalized Inverses, SIAM J. Sci. Stat. Comput. 5 (1984) 735 - 743, och hos S Wold, H Martens och H Wold. The multivariate calibration method in chemistry solved by the PLS methods. In Proc. Conf. Matrix Pencils (A Ruhe och B Kågström, ed. s). Lecture notes in mathematics. Springer Verlag, Heidelberg, 1983, sidoma 286 - 293 och H Martens och T Naes, Multivariate Calibration. Wiley, New York, 1989.
Första steget vid bestämning av varje komponent är att fastställa den forsta 10 15 20 25 30 35 -v 512- 540 r 10 huvudkomponenten hos det aktuella X. Detta garanterar att start-träff (t) är en optimal linjär summa av X. Denna träff-vektor görs sedan ortogonal mot Y för erhållande av tny. Detta sker som tny - Y (Y. Yyl t Här inses att tny är ortogonal mot Y eftersom : Y' tny=Y' (1 -Y(Y'Y)" (Y')t=(Y'-Y'Y(Y' Y)" Y')t=0 Därefter fastställs PLS-viktema (W) (genom inbäddad PLS-regression) för att göra så att t = Xw ligger så nära tn, som möjligt. Denna slutgiltiga uppskattning av "den ortogonala träff-vektorn", t, gör då en "NIPALS-runda" genom X för erhållande av en uppdaterad träff-vektor, t, vilken därefter åter ställs in ortogonalt mot Y, osv ända fram till konvergens. På så sätt bringas t att konvergera mot den längsta vektom som är ortogonal mot Y och som fortfarande ger en god sammanfattning av X.
Efter konvergensen fastställs en last-vektor, p, och därefter fastställs restmatrisen E, genom att från X avlägsna de ortogonalt inställda träffama gånger de slutgiltiga lastema.
Restmatrisen används därefter som X vid bestämningen av nästa "OSC-komponent". Den slutgiltiga restmatrísen, E A, efter den sista OSC-komponenten (nr A), utgör den filtrerade X- matrisen. Denna filtrerade X används därefter tillsammans med Y, t ex i en vanlig PLS- (eller kalibreringsmodellen. regression huvudkomponentregression om så föredras) för att utveckla fastställs den norrnala modellvariansen för X (Rf), träff-diagram för t' från olika komponenter etc. Det senare borde Efter varje komponent "projektionsdiagnosen", dvs som vanligt kontrolleras med avseende på utliggare eftersom förvrängda provspektra kan allvarligt påverka OSC-"modellen". "OSC-lastema" kan ge intressanta antydningar om orsakema till den oönskade variationen.
De resulterande OSC-komponentema (a = 1, 2, ..., A) kan nu betraktas som en del av kalibreringsmodellen PLS. För en ny observation (digitaliserat spektrum av ett ny prov) med den obehandlade datavektorn XW obehandhd' (en radvektor), krävs förutsagda värden för yny' (radvektor för svaren). Det åstadkommes på följande sätt, precis som för en vanlig PLS- modell, men det bör observeras att bidraget till y", från OSC-komponentema är noll. Först omvandlas och skalas den nya x-vektorn på samma sätt som övningsuppsättningen, vilket ger xnyï Därefter fastställs det första träff-värdet (tny, 1) såsom I ,_, | ny,l _ Xny Wl Restvektorn erhålls därefter som : 10 l5 20 25 30 35 f 512 540 r ll eny, 1 = xnyl _ tny, lpl' Denna restvektor används som x-vektorn i den andra komponenten etc, ända till dess att den korrigerade xny har erhållits som restvektor efter AOSC-komponenter. Den korrigerade x-vektom används därefter i kalibreringsmodellen i enlighet med uppfinningen för att ge de förutsagda värdena ymfi. i Efter presentation i staden Lahtis, Finland, har många specialister på kemometri föreslagit att det enklaste sättet att fastställa en optimal OSC skulle vara att använda en PCA av matrisen Z, där Z är X-matrisen som gjorts ortogonal mot Y. Sålunda motsvarar varje kolumn av Z : li=(1-Y(Y'Y)"(Y')Xk Denna bestämning kan fungera väl för en övningsuppsättning, men eftersom inga y- värden är tillgängliga för nya prov kan x-vektorer av dessa nya prov inte göras ortogonala på samma sätt som övningsuppsättningen.
Två OSC-komponenter berättigas på typiskt sätt med NIR-reflektansspektra, där den forsta komponenten ofta efterliknar en "baslinjekorrigering" och den andra ofta i viss utsträckning korrigerar multiplikativa effekter. Antalet OSC-komponenter som krävs vid en given tillämpning kan härledas från antalet X som förklaras i varje OSC-komponent. När detta antal ligger under ett värde motsvarande ett egenvärde på 2,0, dvs att den modellerade Rxz av komponenten är mindre än 2/min (N, K), indikerar detta att flera komponenter inte är berättigade, motsvarande ett "egenvärdekriterium" > 1 " som vanligtvis används vid PCA och faktoranalys, men som gjorts något säkrare genom användning av 2,0 i stället för 1,0.
Ortogonalitetsrestriktionen tillför ytterligare stringens till detta kriterium. Mera stringenta tester med avseende pâ när en OSC-expansion skall avslutas kan naturligtvis baseras på en korsvis bekräftelse.
Eftersom OSC för varje komponent avlägsnar en struktur från X som inte är relaterad till Y kommer kvarstoden E att bättre modellera Y och bättre även i det fall då X verkligen inte alls innehåller någon signifikant information om Y. Sålunda konvergerar OSC med den efterföljande PLS-analysen (eller PCR-analysen) mot en lösning med multipel linjär regression (MLR). MLR är känd för att uppvisa en farlig överbelastning av kolinjära flervariabeldata, vilket visar att även OSC-PLS är riskabel om alltför många OSC komponenter tillåts.
Sålunda får antalet OSC komponenter inte överstiga en liten del av min (N, K), för att på så sätt göra risken liten för falska förhållanden mellan det korrigerade X och Y. I föreliggande exempel har denna andel legat mycket under 1/10, vilket verkar tryggt så länge som observationema är relativt oberoende, dvs inte grupperade. Här rekommenderas att ll I i ri ii ililiiliil ii' i ii ii i' lll 10 15 20 25 30 35 f 512 540 r 12 OSC-resultaten bekräftas med nya förutsägelseprover på samma sätt som skett i föreliggande exempel.
Ett målrotationsförfarande som presenterats av O M Kvalheim och T V Karstang, Interpretatíon of latent-Variable regression models, Chemometrics and Intelligent Laboratory System, 7 (1989) 39-51 och som senare reviderats av Christie i O H J Christie, Data Laundering by Target Rotation in Chemistry-based oil exploration, J Chemometrics 10 (1996) 453 - 461, är ett filtrerförfarande som hänför sig till PCA och således även till OSC. Vid detta mâlrotationsförfarande används en specifik mål-träff-vektor för att filtrera X-matrisen. Idén bakom målrotationen är att avlägsna "känd" information från X som uttrycks genom målvektom, vilken maskerar den värdefulla informationen. Men eftersom ingen ortogonalisering mot Y sker ñnns en risk för att information försvinner som hänför sig till Y.
Detta problem kan lösas genom att det innan målrotationen utförs en ortogonalisering av mål- träff-vektorn gentemot Y. Detta ger ett ortogonal målrotationsförfarande som kan ge t o m bättre modeller än det ursprungliga målrotationsförfarandet.
Sun har nyligen publicerat en skrift där PCA används för signalkorrigering, J Sun, Statistical Anlysis of NIR data : Data pretreatment, J Chemom. ll (1997) 525 - 532. Han fann att detta förfarande var användbart för att avlägsna en bred baslinjevariation liksom även ett varierande backgrundspektrum.
CSC-förfarandet enligt föreliggande uppfinning kan betraktas som en ortogonaliserad och vidare ändrad PCA, vilket sålunda skulle uppvisa bättre egenskaper än Suns metod.
En direkt PLS-metod har undersökts på basis av signalmatrisen X och en "kontrastsvarsmatris" Z = 1 - Y Y', där Y först har normaliserats till enhetsvariansen. Detta gav relativt goda resultat, men denna metod är mindre rigorös än OSC-förfarandet enligt föreliggande uppfinning. i Resultaten av vilken projektion som helst, inkl OSC, påverkas av skalningen av de ursprungliga data i X. Vid NIR-tillämpningar används normalt antingen oskalade data, data som skalats efter enhetsvariansen (självskalning), eller någonting mellan dessa, t ex den s k Pareto-skalningen, se S Wold PLS for multivariate linear modelling. I QSAR : Chemometric Methods in Molecular Design (Ed. H van de Waterbeemd), Methods and principles in Medicinal, S Wold är upphovsmannen till föreliggande uppfinning.
Ett problem med skalning av ursprungliga data uppträder när en stor del av variationen hos X-data beror på ljusspridning och andra fenomen som elimineras genom OSC-filtrering. Då kommer självskalningen eller Pareto-skalningen att baseras på större variationer hos X som är irrelevant för föreliggande kalibreringsmodell.
Sålunda verkar användningen av oskalade X-data lämpligare för OSC-filtrering. För att kringgå denna svårighet är det möjligt att tillämpa CSC-förfarandet på ursprungliga (skalade eller oskalade) data och därefter använda sig av den filtrerade X-matrisen för att fastställa en ny skalning av ursprungliga data, och åter tillämpa OSC-förfarandet på de 10 15 20 25 30 35 f 512 540 * 13 omskalade X-data.
Vid denna studie användes fyra olika datauppsättningar för jämförelse av filtreringsförfarandena (signalkorrigering). Tre av dessa datauppsättningar var NIR-data vilka samlats in från cullulosaderivat för att förutsäga den uppmätta viskositeten. Den fjärde datauppsättningen är NIR-data för prover av pappersmassa från pappersmassa- och pappersindustrin på vilka 17 fysiska egenskaper hade uppmätts.
Varje datauppsättning delas upp på en kalibreringsuppsättning och en extern testuppsättning som används för bekräftelse av modellens förutsägelseförrnåga.
En datauppsättning för inmatning vid förfarandet enligt föreliggande uppfinning samlades in vid Akzo Nobel, i staden Ömsköldsvik, Sverige. Råmaterialet för deras cellulosaderiveringsförfarande levereras till fabriken i form av cellulosaskikt. Innan de tas in i processen genomgår cellulosaskíkten en kontroll genom viskositetsmätning, vilket fungerar som en styrparameter för just detta parti.
NIR-spektra för 181 cellulosaskikt samlades in efter det att skikten hade genomgått en malningsprocess. Sålunda mättes NIR-spektra på det pulverformiga cellulosaråmaterialet.
För bestämning av en kalibreringsmodell användes 161 provspektra. De återstående 20 provspektra användes för modellbekräftelse.
X : 1201 våglängder inom VIS-NIR-området Y : Viskositet N : (Kalibreringsuppsättning) = 161 N : (Testuppsättning) = 20 innehöll NIR-spektra från cellulosaprover. XFM-cellulosan är ett råmaterial i cellulosaderiveringsprocessen vid Akzo Nobel, Örnsköldsvik.
För var och en av de 106 cellulosaprovema mättes viskositeten. N=86 provspektra En annan datauppsättning 106 pulverfonniga användes för kalibreringen, medan de återstående 20 användes för modellbekräftelse i överensstämmelse med modellen enligt föreliggande uppfinning.
X 3 1201 våglängder inom VIS-NIR-området Y : Viskositet N : (Kalibreringsuppsättníng) = 86 N : (Testuppsättning) = 20 Ytterligare datauppsättning från cellulosaskikt samlades in vid Akzo Nobel, Örnsköldsvik. I denna datauppsättning utfördes NIR-mätningama på föreliggande cellulosaskikt. Den för varje skikt uppmäta viskositeten användes som en svarsvariabel Y vid modellbestämningama. l ll ll lll 10 15 20 25 30 35 -i 512 540 r 14 NIR-spektra för 65 cellulosaskikt samlades in. N=45 provspektra användes för kalibreringen och de återstående 20 användes för modellbekräftelse.
X : 1201 våglängder inom VIS-NIR-området Y : Viskositet N : (Kalibreringsuppsättning) = 45 N : (Testuppsättning) = 20 Ytterligare en datauppsättning samlades in vid Assi-Domän Corporate Research i staden Piteå, Sverige. Här samlades NIR-spektra för 39 laboratoriekokade pappersmassor in.
För varje pappersmassa uppmättes 17 fysiska egenskaper. De motsvarar produktkvalitetsparametrar som vanligen tillämpas inom pappersmasse- och pappersindustrin. De 17 fysiska egenskaperna användes som svarsvariabler vid modellbestämningama. N=28 prover användes för kalibreringen och Nbemñ = ll prover användes för den extema bekräftelsen av modellen. : 233 våglängder inom VIS-NIR-området : 17 fysiska egenskaper : (Kalibreringsuppsättning) = 28 ZZ~<1>< : (Testuppsättning) = ll För alla ovanstående datauppsättningar användes två OSC-komponenter för filtreringen.
För cellulosadatauppsättningama är det klart att CSC-förfarandet ger bättre kalibreringsmodeller, dvs högre Qi i enlighet med den korsvisa bekräftelsen (se tabell 1). Här definieras Qz-värdena som Q: = l - PRESS/SSY där PRESS är den förutsägbara summan av kvadratema på koncentrationen eller egenskapsmatrisen Y enligt den korsvisa bekräftelsen, och SSY är summan av kvadratema på koncentrationen eller egenskapsmatrisen Y kring dess genomsnittsvektor för egenskaperna.
Uppskattningen av förutsägelsefelen med avseende på de externa testuppsättningama ger vid handen att de OSC-behandlade data ger väsentligt lägre RMSEP-värden än obearbetade data och MSC-data (se tabell 2). Här betyder RMSEP det genomsnittliga kvadratrotfelet vid fórutsägelsen, vilket definieras som kvadratroten av summan av kvadratema på forutsägelsefelen delat med antalet element i denna summa, dvs variansen hos förutsägelserestema enligt vad som vidare beskrivs i referensema här nedan avseende tabell 3. 10 15 20 25 30 35 -v 512 540 r 15 OSC-filtrerade data ger även mycket enklare kalibreringsmodeller med färre komponenter än modeller som är baserade på obehandlade data (se tabell 3).
Nu med hänvisning till Figurema 3a-c, vilka illustrerar observerade kontra förutsagda viskositetsvärden för PLS-modeller som fastställs utgående från en uppsättning data från mald cellulosa, återger Figur 3a resultaten från en modell som är baserad på obearbetade data, Figur 3b illustrerar resultaten från en modell baserad på MSC-filtrerade data och Figur 3c illustrerar resultaten från en modell baserad på OSC-filtrerade data.
De observerade, öppna cirklama, kontra förutsagda, ifyllda cirklama utgör ett diagram i Figurerna 3a-c för Y = viskositet och visar hur hoppassningen och förutsägelserna utvecklas från obehandlade data i Figur 3a via MSC i Figur 3b till OSC i Figur 3c, vilket exemplifieras genom data för malda prover.
För den pappersmassedatauppsättning där Y-matrisen består av sjutton uppmätta egenskaper är Qz-värdena i enlighet med den korsvisa bekräftelsen ungefär desamma som för de tre kalibreringsmodellerna motsvarande ofiltrerade, MSC-filtrerade och OSC-filtrerade data. RMSEP-värdet för den externa testuppsättningen är emellertid lägst för den modell som fastställs med OSC-behandlade data.
Resultaten antyder att OSC-förfarandet eliminerar i själva verket information från NIR-data som inte är nödvändig för anpassning av Y-variablema. Eftersom förfarandet ger bättre förutsägelser av testuppsättningsobjekten tar förbehandlingen bort störande brus från NIR-data. Resultatet visar även att OSC-förfarandet fungerar för modeller som utnyttjar både singel- och multi-Y-svar.
Ovanstående data visar att för att erhålla goda kalibreringsmodeller med låga förutsägelsefel behövs någon form av spridningskorrígering. MSC verkar fungera i många fall men förbättrar i själva verket inte modellerna på signifikant sätt. OSC å andra sidan ger för dessa datauppsättningar kalibreringsmodeller med väsentligen bättre anpassning och förutsägelseförrnåga.
I vissa fall eliminerar OSC-förfarandet även icke linjära förhållanden mellan X och Y. Detta kan t ex ses i de observerade kontra förutsagda prickarna för datauppsättningen "mald cellulosa" (figurema 3a - 3c). Det framgår tydligt att prickarna avseende obehandlade data och MSC-modellen är icke linjära medan i diagrammet för OSC-behandlade data denna bristande linearitet har försvunnit.
I enlighet med de resultat som visas genom föreliggande uppfinning är den ortogonala signalkorrigeringen (OSC) av NIR-spektra en god metod för att förbättra modeller för multivariabel kalibrering.
Eftersom projektionsförfaranden såsom PLS ' tydligen påverkas av en stark systematisk variation hos förutsägelsematrisen X vilken inte är relaterad till svarsmatrisen, Y, finns ett behov att eliminera en sådan variation från X- innan fortsatt modellering. Genom föreliggande uppfinning förutses ett förfarande där signalkorrigering (filtrering) sker på så sätt att de eliminerade delama är linjärt orelaterade (ortogonala) i förhållande till 10 15 20 25 30 35 512 540 4 16 -v svarsmatrisen Y. OSC har ytterligare fördelar förutom den förbättrade förutsägbarheten hos PLS-modellema, som t ex väsentligt enklare (färre komponenter) kalibreringsmodeller, vilket underlättar tolkningen av modellerna.
Datorrnässigt är vid föreliggande uppfinning OSC baserad på PLS och NIPALS- förfarandet som fastställer en OSC-komponent i taget. Detta val gjordes eftersom det är lämpligt att därmed realisera ortogonalitetsrestriktionen och även göra förfarandet tillämpbart på ofullständiga datamatriser.
För att tillämpa OSC på filtreringen av en signalmatris krävs naturligtvis även en Y-matris. flervariabelkalibreríng, men vid andra filtreringsfall kan det hända att den inte är tillgänglig. svarsvektor eller Den är alltid närvarande vid tillämpningar med Vid t ex signalanalys är det ofta önskvärt att filtrera tidsserier från oönskat brus. Samtidigt kan spektra som används för karakterisering av material eller produkter som t ex farrnacevtiska tabletter (piller) framstå som bemängda med brus och en filtrering skulle vara berättigad. Om syftet med karakteríseringen granskas är det emellertid ofta möjligt att konstruera en "suddig" eller "mjuk" svarsmatris Y. Vid t ex tidsserieanalys är det möjligt att använda signalerna för att leta efter trender - linjära eller kvadratiska eller eventuellt exponentiella - och då är det möjligt att konstruera en Y-matris på motsvarande sätt med kolumner som varierar linjärt, kvadratiskt och exponentiellt med tiden.
På motsvarande sätt om spektralmatrisen från en materialkarakterisering används för klassificering - t ex dåliga material kontra acceptabla material - går det att konstruera en Y- matris motsvarande denna klassificering.
Andra tillämpningsområden där OSC kan befinnas vara användbar inbegriper 3D- QSAR (Three-Dimensional Quantitative Structure - Activity Relationship = Tredimensionella kvantitativa struktur-aktivitetsförhållanden), där strukturer av en uppsättning av molekyler omvandlas till en uppsättning av strukturbeskrivande vektorer med hjälp av t ex CoMFA hos R D Cramer III, D E Patterson, and J D Bruce. Comparative molecular field analysis (CoMFA). Effect of shape on binding of steroids to carrier proteins J Amer Chem. Soc. 110 (1988) 5959-5967 eller GRID i P J Goodford, A computational procedure for determining energically favourable binding sites on biologically important macromolecules. J Med.
Chem. 28 (1985) 849-57. Den resulterande X-matrisen som ofta har tusentals kolumner men bara några få rader, t ex 15 till 50, relateras därefter av PLS till en Y-matris med uppmätta biologiska aktivitetsvärden. Eftersom det ofta finns stora delar av X som inte är relaterade till Y kan OSC hjälpa till att rensa data innan analysen och på så sätt förbättra förutsägbarheten och tolkningen vid denna lösning.
När antalet X-variabler, K, är större än N (antalet övningsprover) är det alltid möjligt att finna en exakt ortogonal OSC-lösning, medan om K < N är detta inte alltid möjligt. Detta betyder även att för K > N finns ett oändligt antal OSC-lösningar där förfarandet enligt föreliggande uppfinning används for att finna den lösning som modulerar så många X som möjligt i varje komponent. Denna lösning är emellertid kanske inte allt den bästa och 10 15 20 25 30 35 'i 512 540 'Å 17 ytterligare restriktioner med avseende på W-vektorema vid OSC kan vara befogade.
Nu ges med hänvisning till Figur 4 en schematisk beskrivning av förfarandet enligt föreliggande uppfinning.
Prover 400 tas från en substans eller ett ämne och underställs vid 410 en flervaríabel datakälla, t ex en spektrometer, en kromatograf eller ett elektrokemiskt instrument, dvs ett instrument som ger multipla dimensionsdata, vektorer som resultat. Indata ordnas t ex i en X- matris 420 med N x K element. Koncentrations- eller egenskapsmatrisen eller -vektom Y 430 med storleken N x M fastställs genom koncentrations- eller egenskapsmätningar 440 på provsubstansen eller -ämnet. På så sätt framställs i enlighet med ovanstående beskrivning en OSC modell 450 genom utnyttjande av X- och Y-matrisema, vilken finavstäms med hjälp av multipla indataprov 400. Som ett resultat av detta skapas en filtrerad X*-matris 460 och Y- matrisen 430 förblir oförändrad. Slutligen härleds modellen 470 efter det att en övningsuppsättning av prover har finavstämt den filtrerade matrisen 460 till en flervariabel kalibrering av matrisema X* och Y.
Ett exempel på den multipla övningsuppsättningsprocessen som ingår i förfarandet i enlighet med Figur 4 och det ovan beskrivna förfarandet återges i Figur 5. Nya prover 400 tas och karakteriseras av datakällan 410, vilket ger nya indata som ordnas i en matris Z 500.
I enlighet med OSC-modellen 450 i Figur 4 används modellen 450 för att filtrera Z 510 vilket ger en filtrerad Z* 520 vilken används för att fastställa egenskaper hos substanser och ämnen.
Föreliggande uppfinning avser även, vilket schematiskt återges i Figur 6, en anordning för koncentrations- eller egenskapskalibrering av prover 600 av en substans eller ett ämne från indata 610, 620 som hänför sig till spektroskopiska data.
En föredragen utföringsform av anordningen innebär att koncentrations- eller egenskapskalibreringen är bestämmande för ett filterrnodellorgan 630 för efterföljande prover av samma substans eller ämne, varvid nedan nämnda organ ingår i modellen 630 som schematiskt återges i Figur 6, och innefattar dessutom följande organ : omvandlingsorgan, centreringsorgan, och skalorgan för att valfritt påverka indata för att åstadkomma två startuppsättningar; sorteringsorgan för att ordna nämnda indata i en inmatningsuppsättning; bestämningsorgan för att bestämma en uppsättning för koncentrations- eller egenskapskalibrering, en träff-uppsättning och en last-uppsättning; multipliceringsorgan för att fastställa produkten av träff-uppsättningen och last- uppsättningen, varvid denna produkt efterliknar spektraluppsättningen så mycket som möjligt med den restriktionen att träff-uppsättningen är ortogonal mot koncentrations- eller egenskapskalibreringen; filtrerorgan för filtrering av nämnda indata genom subtraktion av nämnda produkt från inmatningsuppsättningen för att eliminera variationer som hänför sig till andra egenskaper eller kvalitetsegenskaper; varvid 10 15 20 w 512 540 e 18 nämnda modell är bestämmande fór filtrerrnodellen 630, vilket gör att efterföljande prover från samma substans eller ämne kan filtreras med filtrermodell 630.
Kända organ fór utförande av de ovan nämnda funktionema är t ex spektrometrar, kromatografer, filter, drivelement (fór skalning), multiplikatorer, adderare, omvandlare, datorer, mjukvara, mjukhårdvara etc, Anordningen kan således användas fór att ordna uppsättningarna som två matriser eller en matris och en koncentratíons- eller egenskapsvektor, där deluppsättningen är en kolumn av träff-matrisen.
Ett filter i enlighet med föreliggande uppfinning är bilinjärt, men kan kombineras med ett annat linjär filtrermedel som t ex kryssningsfiltrering eller Fourier-filtrering.
Filtermodellen förbättras företrädesvis genom tillämpning av multipla uppsättningar av indata i övningsuppsättningar till nämnda organ, vilket på så sätt ger egenskaper som fastställs på bättre sätt genom avstämning av filtrerrnodellen.
Resultaten från filtreringen med den härledda modellen 630 visas på visualiseringsorgan 640.
Funktionssättet och uppbyggnaden av föreliggande uppfinning antas framgå av föreliggande beskrivning. Även om det förfarande och den anordning som visats eller beskrivits har föredragits är det självklart att olika ändringar och modifieringar kan ske i dessa utan att avvika från uppfinningens anda och omfattning som definieras i de bifogade kraven. *v 512 540 19 Tabeller Tabell 1: Qz-vården enligt korsvis bekräftelse for var och en av de fastställda modellema Obehandlad MSC OSC Mald 0,72 0,623 0,94 XFM 0,614 0,618 0,83 9 Skikt 0,536 0,604 0,86 3 Pappersmassa 0,54 0,54 0,57 Tabell 2: RMSEP-värden for testuppsättningen for var och en av de fastställda modellerna Obehandlad MSC OSC Mald 199,76 195,13 183,16 XFM 616, 56 478,99 428,48 Sldkt 138,55 130,54 78,43 Pappersmassa 85,51 96,48 78,74 Tabell 3 : Antal PLS-komponenter för var och en av de fastställda modellerna Obehandlad MSC OSC Mald 5 3 3 XFM 3 6 2 Skikt 4 6 1 Pappersmassa 4 4 2

Claims (10)

.m-'i um H :m i 10 15 20 25 30 35 512 540 'f 20 Patentkrav
1. Förfarande för koncentrations- eller egenskapskalibrering av indata från prover (400) av substanser eller ämnen, k ä n n e t e c k n at a v att en filterrnodell (470) fastställs genom nämnda kalibrering för efterföljande prover av samma substans eller ämne, innefattande följande steg : valfri omvandling, centrering och skalning av indata (410, 440) för att åstadkomma tvâ startuppsättningar (420, 430); ordnande av nämnda indata i en inmatningsuppsättning (420); bestämning av en koncentrations- eller egenskapsuppsättning (430); bestämning av en träff-uppsättning och en last-uppsättning och av deras produkt, varvid nämnda produkt efterliknar inmatningsuppsättningen så mycket som möjligt med den restriktionen att träff-uppsättningen är ortogonal mot koncentrations- eller egenskapsuppsättningen; filtrering av nämnda indata (410) genom subtraktion av nämnda produkt från inmatningsuppsättningen för att eliminera variationer som sammanhänger med andra egenskaper än föreliggande kalibreringsegenskaper; varvid nämnda modell (470) är bestämmande för filtreringen och således gör att efterföljande prover av samma typ kan filtreras med ñltermodellen (470).
2. Förfarande enligt patentkrav 1, k ä n n e t e c k n at a v att nämnda uppsättningar är anordnade i två matriser (420, 430) eller en matris och en koncentrations- eller egenskapsvektor.
3. Förfarande enligt patentkrav 1 eller 2, k ä n n ete c kn at av att nämnda filtrering är bilinjär och kombinerad med ett annat linjärt filtrerförfarande.
4. Förfarande enligt patentkrav 3, k ä n n e t e c k n at a v att nämnda andra ñltrerförfarande är en glättningsfiltrering eller en Fourier-filtrering.
5. Förfarande enligt något av patentkraven 1 - 4, k ä n n e t e c k n at av att nämnda modell (470) förbättras genom tillämpning av multipla uppsättningar av indata (410) som övningsuppsättningar och genom upprepning av nämnda steg med en bättre koncentration eller egenskap, och således genom avstämning (510) av filtrermodellen (470).
6. Anordning för koncentrations- eller egenskapskalibrering av spektroskopiska indata (610) från prover av en substans eller ett ämne, kännetecknad av att koncentrations- eller egenskapskalibreringen är bestämmande för ett filterorgan (450) för efterföljande spektra av prover (600) av samma typ, innefattande : omvandlingsorgan, centreringsorgan, och skalorgan för att valfritt påverka indata för att åstadkomma två startuppsättningar; sorteringsorgan för att ordna nämnda indata i en inmatningsuppsättning; bestämningsorgan för bestämning av en träff-uppsättning och en last-uppsättning koncentrations- eller utgående från en inmatningsuppsättning och en egenskapskalibreringsuppsättning,; 10 15 20 w 512 540 r 21 beräkningsorgan för fastställande av produkten av träff-uppsättningen och last- uppsättningen, varvid nämnda produkt efterliknar inmatningsuppsättningen så mycket som möjligt med den restriktionen att träff-uppsättningen är ortogonal mot koncentrations- eller egenskapskalibreringen; filtrerorgan för filtrering av nämnda spektroskopíska indata genom subtraktion av nämnda produkt från inmatningsuppsättningen för att eliminera variationer som sammanhänger med andra egenskaper än föreliggande kvalitetsegenskaper; varvid nämnda modell (630) är bestämmande för filtreringen och gör således att efterföljande prover (600) av samma typ kan filtreras med filtrermodellen (630).
7. Anordning enligt patentkrav 6, k ä n n e te c k n a d a v att nämnda uppsättningar är anordnade som två matriser (420, 430) eller en matris och en koncentrations- eller egenskapsvektor.
8. Anordning enligt patentkrav 6 eller 7, k ä n n e t e c k n a d a v att nämnda filtrering är bilinjär eller kombinerad med ett annat linjärt filtrermedel.
9. Anordning enligt patentkrav 8, k ä n n e t e c k n a d a v att nämnda andra filtrerorgan är ett organ som utför glättningsfiltrering eller Fourier-filtrering.
10. Anordning enligt något av patentkraven 6 - 9, kän n e t ec kn ad a v att nämnda ñlterrnodell förbättras genom tillämpning av multipla uppsättningar av indata (410) som övningsuppsättningar för nämnda organ, vilket således ger bättre fastställda egenskaper genom avstämning (510) av filtrermodellen.
SE9802229A 1998-06-22 1998-06-22 Metod och anordning för kalibrering av indata SE512540C2 (sv)

Priority Applications (6)

Application Number Priority Date Filing Date Title
SE9802229A SE512540C2 (sv) 1998-06-22 1998-06-22 Metod och anordning för kalibrering av indata
AU48122/99A AU4812299A (en) 1998-06-22 1999-06-11 Method and arrangement for calibration of input data
EP99931685A EP1090358A1 (en) 1998-06-22 1999-06-11 Method and arrangement for calibration of input data
JP2000556315A JP2002519763A (ja) 1998-06-22 1999-06-11 入力データの校正の方法と装置
PCT/SE1999/001035 WO1999067722A1 (en) 1998-06-22 1999-06-11 Method and arrangement for calibration of input data
US09/720,425 US6754543B1 (en) 1998-06-22 1999-07-11 Method and arrangement for calibration of input data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE9802229A SE512540C2 (sv) 1998-06-22 1998-06-22 Metod och anordning för kalibrering av indata

Publications (3)

Publication Number Publication Date
SE9802229D0 SE9802229D0 (sv) 1998-06-22
SE9802229L SE9802229L (sv) 1999-12-23
SE512540C2 true SE512540C2 (sv) 2000-04-03

Family

ID=20411807

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9802229A SE512540C2 (sv) 1998-06-22 1998-06-22 Metod och anordning för kalibrering av indata

Country Status (6)

Country Link
US (1) US6754543B1 (sv)
EP (1) EP1090358A1 (sv)
JP (1) JP2002519763A (sv)
AU (1) AU4812299A (sv)
SE (1) SE512540C2 (sv)
WO (1) WO1999067722A1 (sv)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE516343C2 (sv) 2000-02-22 2001-12-17 Johan Trygg Metod och anordning för kalibrering av indata
US7302349B2 (en) 2002-08-16 2007-11-27 Lattec I/S System and a method for observing and predicting a physiological state of an animal
US7444197B2 (en) 2004-05-06 2008-10-28 Smp Logic Systems Llc Methods, systems, and software program for validation and monitoring of pharmaceutical manufacturing processes
US7799273B2 (en) 2004-05-06 2010-09-21 Smp Logic Systems Llc Manufacturing execution system for validation, quality and risk assessment and monitoring of pharmaceutical manufacturing processes
US8943163B2 (en) * 2005-05-02 2015-01-27 S-Matrix System for automating scientific and engineering experimentation
US8209149B2 (en) * 2005-10-28 2012-06-26 S-Matrix System and method for automatically creating data sets for complex data via a response data handler
US7606685B2 (en) * 2006-05-15 2009-10-20 S-Matrix Method and system that optimizes mean process performance and process robustness
US7613574B2 (en) * 2005-10-28 2009-11-03 S-Matrix System and method for automating scientific and engineering experimentation for deriving surrogate response data
US8219328B2 (en) 2007-05-18 2012-07-10 S-Matrix System and method for automating scientific and engineering experimentation for deriving surrogate response data
US20080294361A1 (en) * 2007-05-24 2008-11-27 Popp Shane M Intelligent execution system for the monitoring and execution of vaccine manufacturing
DE102007044606B4 (de) 2007-09-19 2010-05-12 Pal Preservation Academy Gmbh Leipzig Bestimmung des Zustandes von Zellstoff und Papier
US8387256B2 (en) * 2009-08-13 2013-03-05 Emd Millipore Corporation Method for improved scaling of filters
CN102243170A (zh) * 2010-05-12 2011-11-16 天津天士力现代中药资源有限公司 用近红外光谱技术鉴别麦冬药材产地的方法
US20140081889A1 (en) * 2012-09-14 2014-03-20 Axioma, Inc. Purifying Portfolios Using Orthogonal Non-Target Factor Constraints
US9678002B2 (en) * 2014-10-29 2017-06-13 Chevron U.S.A. Inc. Method and system for NIR spectroscopy of mixtures to evaluate composition of components of the mixtures
CN113030010A (zh) * 2021-03-11 2021-06-25 贵州省生物技术研究所(贵州省生物技术重点实验室、贵州省马铃薯研究所、贵州省食品加工研究所) 一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法
IT202100011123A1 (it) * 2021-04-30 2022-10-30 Analytical Solutions S R L Sistema e metodo per identificare e quantificare singoli componenti in un campione oggetto di analisi.
FI20225430A1 (sv) * 2022-05-16 2023-11-17 Teknologian Tutkimuskeskus Vtt Oy Uppskattning av viskositeten hos textilmaterial

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69027233T2 (de) * 1989-03-03 1996-10-10 Edward W Stark Verfahren und Vorrichtung zur Signalbehandlung
US5568400A (en) * 1989-09-01 1996-10-22 Stark; Edward W. Multiplicative signal correction method and apparatus
US5459677A (en) * 1990-10-09 1995-10-17 Board Of Regents Of The University Of Washington Calibration transfer for analytical instruments
MY107458A (en) * 1990-10-12 1995-12-30 Exxon Res & Engineering Company Special data measurement and correction
US5243546A (en) * 1991-01-10 1993-09-07 Ashland Oil, Inc. Spectroscopic instrument calibration
CA2133412A1 (en) * 1992-04-16 1993-10-28 Kenneth R. Beebe Improved method for interpreting complex data and detecting abnormal instrument or process behavior
DE4224621C2 (de) * 1992-07-25 1994-05-05 Boehringer Mannheim Gmbh Verfahren zur Analyse eines Bestandteils einer medizinischen Probe mittels eines automatischen Analysegerätes
US5442562A (en) * 1993-12-10 1995-08-15 Eastman Kodak Company Method of controlling a manufacturing process using multivariate analysis
SE9304246L (sv) * 1993-12-22 1995-06-23 Asea Brown Boveri Förfarande vid övervakning av multivariata processer
US5498875A (en) * 1994-08-17 1996-03-12 Beckman Instruments, Inc. Signal processing for chemical analysis of samples
US5991653A (en) * 1995-03-14 1999-11-23 Board Of Regents, The University Of Texas System Near-infrared raman spectroscopy for in vitro and in vivo detection of cervical precancers
SG38866A1 (en) * 1995-07-31 1997-04-17 Instrumentation Metrics Inc Liquid correlation spectrometry
US5606164A (en) * 1996-01-16 1997-02-25 Boehringer Mannheim Corporation Method and apparatus for biological fluid analyte concentration measurement using generalized distance outlier detection
CA2228844C (en) * 1995-08-07 2006-03-14 Boehringer Mannheim Corporation Biological fluid analysis using distance outlier detection
US6122628A (en) * 1997-10-31 2000-09-19 International Business Machines Corporation Multidimensional data clustering and dimension reduction for indexing and searching

Also Published As

Publication number Publication date
SE9802229L (sv) 1999-12-23
JP2002519763A (ja) 2002-07-02
EP1090358A1 (en) 2001-04-11
WO1999067722A1 (en) 1999-12-29
AU4812299A (en) 2000-01-10
US6754543B1 (en) 2004-06-22
SE9802229D0 (sv) 1998-06-22

Similar Documents

Publication Publication Date Title
Workman A review of calibration transfer practices and instrument differences in spectroscopy
Wold et al. Orthogonal signal correction of near-infrared spectra
SE512540C2 (sv) Metod och anordning för kalibrering av indata
CA2092713C (en) Spectral data measurement and correction
Wang et al. Calibration transfer and measurement stability of near-infrared spectrometers
Bouveresse et al. Standardization of near-infrared spectrometric instruments
Kowalski et al. Recent developments in multivariate calibration
EP0552291B1 (en) Method of estimating property and/or composition data of a test sample
Xiaobo et al. Variables selection methods in near-infrared spectroscopy
US5121337A (en) Method for correcting spectral data for data due to the spectral measurement process itself and estimating unknown property and/or composition data of a sample using such method
Swierenga et al. Comparison of two different approaches toward model transferability in NIR spectroscopy
Cécillon et al. Spectral fingerprinting of soil organic matter composition
Li et al. The cost‐effectiveness of reflectance spectroscopy for estimating soil organic carbon
JP2000504822A (ja) 多変量信号レスポンスを試料分析に用いる方法
Felício et al. Comparison of PLS algorithms in gasoline and gas oil parameter monitoring with MIR and NIR
Chen et al. Recursive wavelength-selection strategy to update near-infrared spectroscopy model with an industrial application
Panchuk et al. Calibration transfer between different analytical methods
Cooper et al. Calibration transfer of near‐IR partial least squares property models of fuels using virtual standards
CN107966499B (zh) 一种由近红外光谱预测原油碳数分布的方法
Boysworth et al. Aspects of multivariate calibration applied to near-infrared spectroscopy
Bjørsvik et al. Data analysis: calibration of NIR instruments by PLS regression
Lemos et al. Identifying chemical, physical, and instrumental matrix matched samples by leveraging spectral model regression vectors
Boysworth et al. Aspects of multivariate calibration applied to near-infrared spectroscopy
Vandeginste Chemometrics—General introduction and historical development
Westad A retrospective look at cross model validation and its applicability in vibrational spectroscopy

Legal Events

Date Code Title Description
NUG Patent has lapsed