SE520474C2 - Sätt och anordning för identifiering av objekt i digitala bilder - Google Patents

Sätt och anordning för identifiering av objekt i digitala bilder

Info

Publication number
SE520474C2
SE520474C2 SE0103845A SE0103845A SE520474C2 SE 520474 C2 SE520474 C2 SE 520474C2 SE 0103845 A SE0103845 A SE 0103845A SE 0103845 A SE0103845 A SE 0103845A SE 520474 C2 SE520474 C2 SE 520474C2
Authority
SE
Sweden
Prior art keywords
image
quality measure
basis
threshold
current
Prior art date
Application number
SE0103845A
Other languages
English (en)
Other versions
SE0103845D0 (sv
SE0103845L (sv
Inventor
Andreas Olsson
Original Assignee
Anoto Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anoto Ab filed Critical Anoto Ab
Priority to SE0103845A priority Critical patent/SE520474C2/sv
Publication of SE0103845D0 publication Critical patent/SE0103845D0/sv
Priority to AU2002349854A priority patent/AU2002349854A1/en
Priority to US10/300,029 priority patent/US7283676B2/en
Priority to EP02786335A priority patent/EP1449171A1/en
Priority to PCT/SE2002/002104 priority patent/WO2003044740A1/en
Publication of SE0103845L publication Critical patent/SE0103845L/sv
Publication of SE520474C2 publication Critical patent/SE520474C2/sv

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Description

lO 15 20 25 30 35 520 474 2 relevanta strukturer, dels till att reducera mängden data som behandlas i efterföljande steg. Självfallet är det eftersträvansvärt att binäriseringen sker med hög nog- grannhet, eftersom fel annars tillåts fortplanta sig i efterföljande behandlingssteg. I det flesta fall kan hög noggrannhet tyvärr endast uppnås till priset av förhåll- andevis tids- och minneskrävande beräkningar.
Ovanstående överväganden mäste exempelvis göras vid beräkning av en position utgående frän bilder av ett mönster pä ett underlag. Mönstret innehåller härvid inbördes ätskilda symboler vars form och/eller inbördes placering kodar nämnda position. Bilderna kan exempelvis registreras optiskt av en sensor i en handhållen apparat, t ex med formen av en penna. En dylik apparat för posi- tionsbestämning beskrivs exempelvis i US-A-5 051 736, US-A-5 477 012, WO OO/73983 och US~Bl-6 208 771. De beräknade positionerna återspeglar apparatens rörelse- mönster över underlaget och kan därför användas för att skapa en elektronisk version av handskriven information.
Ovannämnda bilder kan behandlas i en databehand- lingsenhet, säsom en lämpligt programmerad mikroproces- sor, en ASIC, en FPGA etc, vilken mottager en följd av digitala gråskalebilder, binäriserar dessa för identifie- ring av ovannämnda symboler, samt beräknar en position pä basis av varje binäriserad bild. Under binäriseringen används en tröskelmatris som innehåller ett tröskelvärde för varje bildelement i gräskalebilden. Varje bild inne- häller typiskt som minst ca 100 x 100 bildelement och har typiskt 8-bitars upplösning i luminans. Registrering av handskriven information bör ske med hög tidsupplösning, typiskt ca 50-100 bilder per sekund, varför det är svårt att förena kraven på hög noggrannhet vid binäriseringen med kraven pä snabb behandling och litet minnesbehov, även i en specialanpassad databehandlingsenhet.
I de flesta fall innehåller bilderna dessutom stör- ningar, t ex i form av brus, oskärpa, ojämn belysning och .«.... lO 15 20 25 30 35 5 2 0 4 7 4 §:ï¿ 3 geometrisk distorsion, vilket ytterligare försvårar iden- tifieringen av symboler eller objekt.
Sammanfattning av uppfinningen Föreliggande uppfinning har som ändamål att åtmin- stone delvis övervinna ovan relaterade problem med känd teknik.
Närmare bestämt syftar uppfinningen till att anvisa en förbättrad bildbehandlingsteknik för identifiering av objekt i en digital bild ingående i en följd av bilder.
Det är vidare önskvärt att anvisa en bildbehand- lingsteknik som är noggrann men som likväl kan realiseras på ett tids- och minneseffektivt vis.
Det är också ett ändamål att anvisa en bildbehand- lingsteknik som är tolerant för störningar, såsom varia- tioner i skärpa, variationer i bakgrundsluminans, varia- tioner i signal-brus-förhållande och perspektiveffekter, både inom respektive bild och mellan olika bilder.
Dessa och andra ändamål, som kommer att framgå av följande beskrivning, uppnås helt eller delvis genom ett sätt enligt patentkrav l, ett datorprogram enligt patent- krav 19, en datorprogramprodukt enligt krav 20, en hand- hàllen apparat enligt krav 21, och en anordning enligt krav 22. Föredragna utföringsformer definieras i de underordnade patentkraven.
Uppfinningen utgår från insikten att den eftersökta bildbehandlingstekniken kan åstadkommas genom en kombina- tion av en trösklingsalgoritm och återkopplad reglering.
Närmare bestämt verkställs en återkopplad reglering av minst en vid trösklingen använd trösklingsparameter för uppnàende av ett börvärde i form av ett kvalitetsmått hos bilderna efter trösklingen. Förekomsten av en återkopplad reglering gör det möjligt att uppnå en önskad tålighet mot ovannämnda störningar. Vidare kan en tillräcklig nog- grannhet uppnås även med användning av en förhållandevis enkel trösklingsalgoritm, vilken i sig kan realiseras på ett tids- och minneseffektivt vis. .-... 10 15 20 25 30 35 520 474 4 Enligt en första aspekt av uppfinningen avser denna således ett sätt att identifiera objekt i en digital bild ingående i en följd av bilder. Sättet omfattar steget att jämföra luminansvärden hos en aktuell digital bild med minst ett tröskelvärde för att på basis av jämförelsen skapa en aktuell binäriserad bild. Sättet omfattar dess- utom stegen att beräkna ett kvalitetsmått för den aktu- ella binäriserade bilden, och att på basis av kvalitets- måttet uppdatera nämnda minst ett tröskelvärde för an- vändning vid binärisering av en följande bild.
Nämnda minst ett tröskelvärde uppdateras lämpligen på basis av differensen mellan kvalitetsmåttet, som bil- dar ett ärvärde, och ett kvalitetsbörvärde.
Kvalitetsmåttet reflekterar någon önskad egenskap hos de binäriserade bilderna, såsom en viss storlek eller form hos objekten. Enligt ett utförande, som bl a kan vara ändamålsenligt vid ovannämnda positionsbestämning, representerar kvalitetsmåttet arean av objekten i den aktuella binàriserade bilden. Ett sådant kvalitetsmått kan exempelvis utgöras av den totala objektarean, ett objektareamedelvärde, en objektareafördelning, ett för- hållande mellan objektarea och bakgrundsarea i den bi- näriserade bilden etc. Ett sådant kvalitetsmàtt, i form av ett aggregerat värde för ett flertal objekt i den binäriserade bilden, är förhållandevis okänsligt för perspektivrelaterade bildförvrängningar. Exempelvis med- för ett perspektiv att objektens area ökar i en del av bilden och minskar i en annan; i medeltal är dock objekt- arean väsentligen densamma, oberoende av perspektiv.
Ovannämnda tàlighet mot störningar möjliggörs genom användning av en tröskelmatris innehållande tröskelvärden som är designerade för olika delområden av den aktuella bilden, där varje delområde omfattar ett flertal bild- element. En sådan tröskelmatris kan beräknas på ett snabbt och minneseffektivt vis genom att ett bakgrunds- luminansvärde och ett objektluminansvärde skattas för varje delområde hos den aktuella bilden, och genom att 10 l5 20 25 30 35 520 474 ïßïff 5 tröskelmatrisens tröskelvärden uppdateras på basis av nämnda bakgrundsluminansvärde och nämnda objektluminans- värde. Denna tröskelmatris är således beräknad på basis av bildstatistikdata för delområdena i den aktuella bild- en och innehåller därigenom tröskelvärden som är relate- rade till den övergripande luminansfördelningen i denna bild, både med avseende på bakgrunden och på objekten.
I ett sådant utförande kan tröskelmatrisens trös- kelvärden uppdateras på basis av minst en kontrastdjup- faktor, som anger tröskelvärdets relativa läge mellan bakgrundsluminansvärdet och objektluminansvärdet. Binäri- seringen regleras lämpligen via denna kontrastdjupfaktor.
I detta fall används således kvalitetsmåttet på den aktu- ella binäriserade bilden för att fastställa kontrastdjup- faktorn inför nästföljande binärisering.
Enligt ett utförande används en och samma kontrast- djupfaktor för beräkning av hela tröskelmatrisen.
Enligt ett alternativt utförande fastställs en kontrastdjupfaktor för vart och ett av ett antal styr- delområden i den aktuella binäriserade bilden, varpå den resulterande uppsättningen kontrastdjupfaktorer används för beräkning av tröskelmatrisen.
Ett föredraget utförande inbegriper en reglerloop, vid vilken varje iteration omfattar stegen att läsa in en aktuell bild; att skatta den aktuella bildens kontrast- fördelning; att beräkna tröskelmatrisens tröskelvärden, utgående från nämnda kontrastfördelning och en under den föregående iterationen beräknad kontrastdjupfaktor; att skapa en aktuell binäriserad bild på basis av tröskel- matrisen; att beräkna ett kvalitetsmått på den aktuella binäriserade bilden; att beräkna ett fel mellan ett bör- värde och kvalitetsmåttet; och att beräkna en ny kont- rastdjupfaktor utgående från den föregående kontrastdjup- faktorn och nämnda fel. Den aktuella bildens kontrastför- delning kan exempelvis skattas utgående från ovannämnda bakgrunds- och objektluminansvärden för olika delområden. ...». lO 15 20 25 30 35 520 474 6 Reglerloopen är lämpligen utformad att arbeta med väsentligen konstanta poler. En sådan reglerloop kan vara baserad på en modellfunktion som relaterar kvalitets- måttet till den föregående kontrastdjupfaktorn och som omfattar minst en modellarbetspunkt som är väsentligen gemensam för alla digitala bilder i följden av bilder, dvs för alla driftsbetingelser. Därmed kan en ny kont- rastdjupfaktor beräknas genom parametrisering av modell- funktionen på basis av den föregående kontrastdjupfaktorn och nämnda modellarbetspunkt. Modellfunktionens paramet- rar kan således beräknas för varje iteration, varpå reg- lerloopens reglerparametrar kan anpassas adaptivt för uppnående av väsentligen konstanta poler. Dessa poler kan vara valda för uppnående av önskad stabilitet och/eller svarstid hos reglerloopen.
Det bör kanske påpekas att den gemensamma modell- arbetspunkten inte behöver utgöra en faktisk driftspunkt för den arbetande reglerloopen. Modellarbetspunkten kan således ligga utanför reglerloopens styrområde och endast användas som ett bivillkor för beräkning av reglerpara- metrarna.
Modellfunktionen är lämpligen definierad åtminstone kring börvärdet. Av reglertekniska skäl är det vidare föredraget, men ej nödvändigt, att modellfunktionen är en linjär funktion.
Enligt ett utförande sätts kvalitetsmåttet lika med börvärdet vid parametriseringen av modellfunktionen. Ett sådant utförande är att föredra med avseende på regler- loopens stabilitet.
Enligt ett alternativt utförande parametriseras modellfunktionen med användning av det kvalitetsmått som beräknats för den aktuella binäriserade bilden. Ett så- dant utförande är att föredra med avseende på regler- loopens svarstid.
Enligt ett ytterligare föredraget utförande verk- ställs även en intermittent uppdatering av börvärdet på basis av kvalitetsmåttet, företrädesvis på basis av den .1-.... lO l5 20 25 30 35 520 474 7 nya kontrastdjupfaktor som beräknas utgående från kvali- tetsmåttet. En sådan uppdatering kan ske baserat på ett uppmätt samband mellan ett optimalt börvärde för olika driftsbetingelser och tillhörande kontrastdjupfaktor. Den nya kontrastdjupfaktor som avges av reglerloopen under varje iteration kan således även användas för att via detta uppmätta samband beräkna ett uppdaterat börvärde.
För att àterknyta till den inledningsvis diskuterade positionsbestämningen så kan reglerloopen vara utformad för uppnående av en given area på objekten i var och en av de binäriserade bilderna. Ett sådant börvärde är givetvis satt med kunskap om såväl det avbildande system- et som objektens originalstorlek på det underlag som av- bildas. I praktiken är det emellertid svårt att översätta objektens originalstorlek till en optimal objektstorlek i bilderna. Exempelvis påverkas avbildningen av underlag- ets kvalitet, t ex med avseende pà objektens absorbans/ reflektans. Vidare kan objekten på underlaget avvika från sin tilltänkta originalstorlek p g a felaktigheter i trycknings- eller utskriftsprocessen. Alternativt saknas någon entydig originalstorlek, exempelvis om underlaget medvetet har försetts med positionskodande objekt av olika storlek, t ex för att bädda in positionskodnings- mönstret i grafisk information, såsom beskrivs i sökan- dens internationella patentansökan PCT/SEOl/71644, vilken införlivas häri genom denna hänvisning.
I samtliga dessa fall är det en stor fördel att verkställa ovannämnda intermittenta uppdatering av bör- värdet, i det att reglerloopen kan bringas att automa- tiskt anpassa sig till underlaget.
Ytterligare aspekter av uppfinningen avser ett datorprogram, en datorprogramprodukt, en handhållen apparat för positionsbestämning, samt en anordning för identifiering av objekt i en digital bild.
Fördelarna med datorprogrammet, datorprogramprodukt- en, den handhållna apparaten och anordningen framgår av ovanstående redogörelse. Sàrdragen som beskrivs i samband 10 l5 20 25 30 35 520 474 8 med sättet att identifiera objekt i en digital bild är självfallet tillämpbara även vid dessa ytterligare aspekter.
Kortfattad beskrivning av ritningarna Uppfinningen beskrivs nedan i exemplifierande syfte med hänvisning till bifogade ritningar, vilka äskädliggör för närvarande föredragen utföringsformer.
Fig 1 är en schematisk vy av en uppsättning om 4 X 4 objekt i ett positionskodningsmönster.
Fig 2 är en schematisk vy av en handhållen sensor- anordning som kan användas för att detektera positions- kodningsmönstret i fig 1.
Fig 3 är ett blockschema som visar delar av en upp- finningsenlig anordning, samt informationsutbytet mellan dessa delar.
Fig 4 är ett flödesschema som visar de övergripande stegen vid ett uppfinningsenligt sätt att identifiera objekt i digitala bilder.
Fig 5 är en vy som schematiskt illustrerar indel- ningen av en gràskalebild i delområden för beräkning av en tröskelmatris.
Fig 6 är ett blockschema för äskädliggörande av en reglerloop enligt en första utföringsform av det upp- finningsenliga sättet.
Fig 7 är ett flödesschema som i större detalj äskäd- liggör den första utföringsformen av det uppfinnings- enliga sättet.
Fig 8 är ett diagram över uppmätt förhållande mel- lan medelobjektarea Q och kontrastdjupfaktor k för olika underlag, samt en modellfunktion som approximerar för- hällandet kring ett börvärde w.
Fig 9 är ett blockschema för äskädliggörande av en reglerloop enligt en andra utföringsform av det uppfin- ningsenliga sättet.
Fig 10 är ett diagram över uppmätt förhållande mellan optimalt börvärde w@x och tillhörande kontrast- djupfaktor k för olika driftsbetingelser. lO 15 20 25 30 35 520 474 9 Fig 11 är ett flödesschema som i detalj åskådliggör en implementation av den andra utföringsformen.
Beskrivning av föredragna utföringsformer Nedanstående beskrivning år inriktad på positions- bestämning utifrån gråskalebilder av ett positionskod- ningsmönster. Positionskodningsmönstret kan vara av god- tyckligt slag, exempelvis något av de inledningsvis ut- pekade mönstren. I det följande exemplifieras dock upp- finningen i anslutning till det mönster som beskrivs i sökandens patentpublikationer WO 01/16691, WO 01/26032 och WO 01/26033. med hänvisning till fig 1.
Detta mönster beskrivs nedan i korthet Positionskodningsmönstret innefattar ett virtuellt raster 10, som alltså varken syns för det mänskliga ögat eller kan detekteras direkt av en anordning som skall bestämma positioner på ytan, och ett flertal markeringar 11, som var och en, beroende på sin placering, till ”4”. represen- terar ett av fyra värden ”1” Markeringens 11 värde beror på var den är placerad i förhållande till sin nominella position 12. Den nominella positionen 12, som också kan betecknas som en rasterpunkt, representeras av skärningspunkten mellan rasterlinjerna.
I en utföringsform är avståndet mellan rasterlinjer- na 300 pm och vinkeln mellan rasterlinjerna 90 grader.
Andra rasteravstånd år möjliga, t ex 254 pm för att passa till printrar och scanners, som ofta har en upplösning som är en multipel av 100 dpi, vilket motsvarar ett av- stånd mellan punkter på 25,4 mm/100, dvs 254 pm.
I exemplet i fig 1 finns fyra möjliga placeringar, en på var och en av rasterlinjerna som utgår från den nominella positionen 12. Förskjutningen från den nomi- nella positionen 12 år lika stor för alla värden. Varje markering 11 är med sin tyngdpunkt förskjuten i förhåll- ande till sin nominella position 12, dvs ingen markering år belägen i den nominella positionen. Det finns vidare en enda markering 11 per nominell position 12. -q-n. l0 15 20 25 30 35 520 474 10 I en utföringsform är markeringarna 11 förskjutna 50 pm utmed rasterlinjerna i förhållande till de nomi- nella positionerna 12. Förskjutningen är företrädesvis 1/6 av rasteravståndet, eftersom det då blir relativt enkelt att avgöra vilken nominell position som en viss markering tillhör. Förskjutningen bör vara minst omkring 1/8 av rasteravstàndet, eftersom det annars kan bli det svårt att bestämma en förskjutning, dvs kraven på upplös- ning blir stora. Å andra sidan bör förskjutningen vara mindre än omkring 1/4 av rasteravståndet för att till- hörighet till nominell position skall kunna bestämmas.
Varje markering ll utgöres av en mer eller mindre cirkulär prick med en radie som är omkring lika stor som förskjutningen eller något mindre. Radien kan vara mellan 25% till 120% av förskjutningen. Om radien blir mycket större än förskjutningen kan det bli svårt att bestämma rasterlinjerna. Om radien blir för liten behövs större upplösning för att registrera markeringarna. Markering- arna behöver dock inte vara cirkulära eller runda, utan kan ha vilken som helst lämplig form, såsom kvadratisk, triangulär, elliptisk, fylld, ofylld etc.
Ovan beskrivna mönster kan utformas att koda ett mycket stort antal absoluta positioner. Exempelvis kan mönstret vara sådant att 6x6 angränsande markeringar tillsammans kodar en position, i form av en x-koordinat och en y-koordinat. Om en delmängd av mönstret är appli- cerad på en produkt kan man åstadkomma en elektronisk representation av det som skrivs eller ritas pà produkten med en penna genom att man löpande bestämmer pennans position på produkten genom avläsning av den lokala kom- binationen av markeringar. Denna avläsning kan ske genom optisk detektion.
I fig 2 visas en handhållen apparat 20, nedan kallad penna, som används för optisk detektion av positionskod- ningsmönstret i fig 1. I det följande beskrivs kort pennans huvudkomponenter. För en mer fullständig beskriv- lO l5 20 25 30 35 520 474 ;;g;f ll ning hänvisas till ovannämnda WO 01/16691, WO 01/26032 och WO Ol/26033.
Pennan 20 uppvisar ett pennformigt hölje 21 som i sin ena kortände avgränsar en öppning 22. Kortänden är avsedd att ligga an mot eller hållas på litet avstånd från den yta på vilken positionsbestämningen skall ske.
En eller flera infraröda lysdioder 23 är inrättade vid öppningen 22 för belysning av det ytområde som skall avbildas, och en IR-känslig areasensor 24, exempelvis en CCD- eller CMOS-sensor, är inrättad att registrera en tvådimensionell bild av ytområdet.
Areasensorn 24 är kopplad till en databehandlare 25 som är anordnad att bestämma en position på basis av den av sensorn 14 registrerade bilden. Databehandlaren 25 kan innehålla ett processororgan 25a som är programmerat att bearbeta bilder från sensorn 24, eller från ett sensorn 24 tillordnat minnesorgan 25b, för positionsbestämning på basis av dessa bilder.
Processororganet 25a kan omfatta en mikroprocessor, såsom en CPU ("Central Processing Unit"), en DSP ("Digi- tal Signal Processor") eller någon annan programmerbar logisk anordning, såsom en FPGA. Processororganet 25a kan alternativt, eller dessutom, omfatta en hårdvarukrets, såsom en ASIC ("Application-Specific Integrated Circuit") och/eller diskreta analoga och digitala komponenter.
Minnesorganet 25b omfattar företrädesvis olika typer av minne, såsom arbetsminne (RAM), läsminne (ROM/FLASH) och skrivminne (FLASH). På känt vis kan arbetsminnet lagra data under det att denna bearbetas medelst proces- sororganet 25a, kan läsminnet lagra den programkod som exekveras av processororganet 25a i arbetsminnet, och kan skrivminnet lagra resultatet av bearbetningen, såsom positionskoordinater.
Pennan 20 har också en pennspets 26 som avsätter markeringsvätska på underlaget. Därmed kan användaren skriva fysiskt på underlaget samtidigt som det skrivna registreras digitalt via optisk detektion av positions- ...m ...n-_ 10 15 20 25 30 35 520 474 12 kodningsmönstret. Markeringsvätskan är lämpligen trans- parent för infrarött ljus, medan positionskodningsmönst- rets markeringar 11 (fig 1) är absorberande för infrarött ljus. Därmed undviks att markeringsvätskan stör detek- tionen av mönstret.
När pennan 20 förs över positionskodningsmönstret registrerar sàledes areasensorn 24 en följd av digitala gràskalebilder som överförs till databehandlaren 25 för positionsbestämning. I ett utförande innehåller gràskale- bilderna 96 x 96 bildelement vars luminansvärden ges med 8 bitars upplösning. För uppnàende av adekvat tidsupplös- ning på den digitalt registrerade informationen utläses bilder frän areasensorn 24 med en frekvens av ca 100 Hz.
I bilderna framträder markeringarna 11 (fig 1) som mörka prickar mot en ljus bakgrund. Vanligen täcker varje markering eller objekt flera bildelement. Skärpan kan variera inom bilden som resultat av att pennan 20, och därmed areasensorn 24, vinklas mot underlaget vid ned- tecknandet av information. Kontrasten kan även variera inom bilden som resultat av ojämna spridningsegenskaper hos underlaget. Dessutom kan belysningen av underlaget vara ojämn. Sammantaget leder detta till variationer i skärpa, kontrast, signal-brus-förhållande och belysning inom varje bild. Dessutom uppkommer motsvarande varia- tioner mellan olika bilder, eftersom pennans snedställ- ningsvinkel varierar över tiden, och mellan olika använ- dare och underlag, under nedtecknande av information.
I fig 3 visas ett blockschema över relevanta delar av databehandlaren enligt fig 2. En gräskalebild I re- gistreras medelst sensorn 30 (motsvarande areasensorn 24 i fig 2) och överförs för lagring till en minnesmodul 31, exempelvis ovannämnda arbetsminne eller skrivminne. Vid behov kan ett flertal bilder buffras i minnesmodulen 31 i väntan pà avkodning. En segmenteringsmodul 32 läser in en gräskalebild I fràn minnesmodulen 31 och trösklar sedan denna med användning av en tröskelmatris T som erhålls fràn en tröskelberäkningsmodul 33. Segmenteringsmodulen 10 15 20 25 30 35 520 474 l3 32 jämför härvid luminansvärdet hos varje bildelement i den aktuella bilden I med ett tillhörande tröskelvärde i tröskelmatrisen T. Om luminansvärdet är större än tröskelvärdet sätts motsvarande luminansvärde hos den binära bilden till ett (1), annars till noll (O). Den resulterande binära bilden B innehåller således mörka objekt (värde O), som idealt utgör markeringarna, mot en ljus bakgrund (värde 1). Den binära bilden B sparas sedan i minnesmodulen 31.
Den binära bilden B läses sedan in av en analysmodul 34, vilken beräknar ett kvalitetsmått Q på bilden B, så- som kommer att beskrivas mer i detalj nedan. Slutligen behandlas den binära bilden B i en avkodningsmodul 35, vilken bearbetar informationen i bilden B för avkodning av positionskoordinater x,y pà basis av objektens lägen i förhållande till det virtuella rastret. Avkodningsmodulen 35 kommer inte att beskrivas i detalj häri, eftersom föreliggande uppfinning är inriktad på förbehandlings- steget, närmare bestämt binäriseringen av gràskalebild- erna I.
Den inkommande gråskalebilden I behandlas även av en statistikmodul 36, vilken genererar bildstatistikdata S för givna delområden eller underregioner i den aktuella gräskalebilden I. Denna bildstatistikdata S läggs i lämp- ligen i minnesmodulen 31, från vilken tröskelberäknings- modulen 33 kan hämta aktuell bildstatistikdata S när den skall påbörja beräkningen av en ny tröskelmatris T.
Databehandlaren omfattar vidare en reglermodul 37, vilken läser in ett börvärde w, reglerparametrar ll, 12 samt det av analysmodulen 34 beräknade kvalitetsmåttet Q och beräknar en kontrastdjupfaktor k som i sin tur an- vänds av tröskelberäkningsmodulen 33 för beräkning av tröskelmatrisen T.
Det bör inses att var och en av ovanstående moduler 32-37 kan realiseras i databehandlaren 25, i form av en mjukvarustyrd processor, en specialanpassad hårdvaru- lO l5 20 25 30 35 520 474 14 krets, diskreta analoga/digitala komponenter, eller någon kombination därav.
I den för närvarande föredragna utföringsformen år tröskelberäknings-, analys-, avkodnings- och reglermodul- erna 33-35, 37 realiserade som en mjukvarustyrd mikropro- cessor, medan segmenterings- och statistikmodulerna 32, 36 är realiserade som en ASIC som opererar på stora data- mängder utan att belasta mikroprocessorn. För att ytter- ligare avlasta mikroprocessorn sker inläsningen av grå- skalebilder från sensorn 30 till minnesmodulen 31 via DMA (”Direct Memory Access”).
I fig 4 visas övergripande processteg som utförs i systemet enligt fig 3. I systemet hämtas först en aktuell gråskalebild #n, steg 41. I steg 42 verkställs inläsning av kvalitetsmåttet Q(n-1) för en föregående binär bild och beräkning av en aktuell tröskelmatris T(n) på basis av detta kvalitetsmått. I steg 43 läser sedan segmente- ringsmodulen 32 in den aktuella tröskelmatrisen T(n), jämför denna med den aktuella gråskalebilden och skapar en aktuell binär bild. I steg 44 beräknar analysmodulen 34 ett kvalitetsmått Q(n) på den aktuella binära bilden.
Efter steg 44 àtervänder exekveringen till steg 41.
I det följande kommer tröskelberäkningsmodulen 33, analysmodulen 36 och reglermodulen 37 att beskrivas var för sig i större detalj.
Tröskelberåkningsmodulen Tröskelberåkningsmodulen 33 (fig 1) är utformad att skatta kontrasten i ett antal delområden av den aktuella gråskalebilden I och att utifrån kontrasten beräkna ett tröskelvärde per delomràde. En utförlig beskrivning av tröskelberäkningsmodulen återfinns i sökandens svenska patentansökan SE 0102254-0, vilken införlivas häri genom denna hänvisning. Nedan följer en sammanfattning av de principer som ligger till grund för tröskelberäknings- modulen, följt av ett utföringsexempel.
Kontrasten inom respektive delområde skattas som differensen mellan ett bakgrundsluminansvàrde och ett 10 15 20 25 30 35 520 474 15 objektluminansvärde, vilka i sin tur skattas för respek- tive delomràde. Lämpligen skattas bakgrundsluminansvärdet och objektluminansvärdet på basis av första ordningens statistik av luminansvärdena hos de bildelement som ingår i respektive delomràde. Första ordningens statistik, exempelvis innefattande det minsta värdet, det största värdet, medianvärdet, medelvärdet och summan av bildele- mentens luminansvärden inom ett delområde, kan extraheras pà beräkningseffektivt vis från gråskalebilden I via statistikmodulen 36.
I fallet med gråskalebilder med mörka objekt mot en ljus bakgrund kan bakgrundsluminansvärdet skattas på basis av det största luminansvärdet hos bildelementen inom respektive delomràde. Alternativt kan bakgrundslumi- nansvärdet skattas på basis av medelvärdet av luminans- värdena hos bildelementen inom respektive delomràde.
Enligt ett annat alternativ skattas bakgrundsluminans- värdet på basis av ett percentilvärde, t ex i intervallet 80-95, för luminansvärdena inom respektive delomràde.
På motsvarande vis kan objektluminansvärdet skattas på basis av det minsta luminansvärdet hos bildelementen inom respektive delomràde.
Ovanstående princip kan förfinas genom att bak- grundsluminansvärdena och objektluminansvärdena skattas för bakgrundsdelomràden respektive objektdelomràden vars storlekar är anpassade för optimal skattning av respek- tive värde, såsom kommer att framgå av nedanstående exempel.
I fig 5 exemplifieras beräkningar av en tröskelmat- ris enligt ovannämnda principer, utgående från gråskale- bilder om 96 x 96 bildelement. Varje gràskalebild är indelad i 64 (8 x 8) objektdelomràden Islo, som vart och ett innehåller 12 x 12 bildelement, respektive 256 (16 x 16) bakgrundsdelomràden Islb, som vart och ett innehåller 6 x 6 bildelement. Delomràdena Islo, Islb är avgränsade med tunna linjer i fig 5. Denna indelning används dels av statistikmodulen 36 för generering av 10 15 20 25 30 35 520 474 16 bildstatistikdata S, dels av tröskelberäkningsmodulen 33 för beräkning av tröskelmatrisen T. Indelningen är an- passad till kodningsmönstret i fig l.
I detta exempel beräknas sàledes tröskelmatrisen utgående fràn bildstatistikdata för två olika uppsätt- ningar delomràden, dels objektdelomràden, dels bakgrunds- delomràden. Objektdelomrádena och bakgrundsdelomràdena överlappar varandra och täcker var för sig hela den del av bilden som skall binäriseras. Objektdelomràdena är så stora att de med säkerhet innehàller åtminstone en del av en markering. Den övre gränsen för objektdelomràdenas storlek ges av den minsta acceptabla upplösningen på tröskelmatrisen, vilken bl a beror av luminansvariation- ernas spatiala storlek i bilderna. Bakgrundsdelomràdena kan däremot göras mindre, eftersom de endast behöver vara sà stora att de med säkerhet innehåller bildelement som är representativa för bildens lokala bakgrundsluminans, dvs de bör vara större än varje markering i bilden. Här- vid bör hänsyn tas till eventuell förstoring som resultat av perspektiveffekter.
Det bör också noteras att objektdelomrädena Islo i detta exempel är dimensionerade att omfatta ett helt antal (i detta fall fyra) bakgrundsdelomràden Islb, vilket underlättar beräkningen av tröskelmatrisen T. (fig l) beräkna ett tröskelvärde för varje bakgrundsdelomràde, Tröskelberäkningsmodulen 33 är utformad att enligt: Ti = bi - k * (bi - oi), varvid bi är skattningen av bakgrundsluminansen inom bakgrundsdelomràdet Islb, och oi är skattningen av objektluminansen inom det större objektdelomràde IS,O som överlappar det aktuella bakgrundsdelomràdet Islb. I detta exempel skattas bakgrundsluminansen som det största lumi- nansvärdet inom bakgrundsdelomràdet och objektluminansen som det minsta luminansvärdet inom objektdelomràdet. I lO l5 20 25 30 35 520 474 17 detta utföringsexempel extraherar således statistikmodu- len 36 (fig 3) bildstatistikdata S i form av det största luminansvärdet (max) och det minsta luminansvärdet (min) inom delområdena Islb respektive ISIO.
Kontrastdjupfaktorn k (OS k S 1) styr pà vilket kontrastdjup som tröskelvärdet skall sättas. För k = O sätts tröskelvärdet i nivå med bakgrundsluminansvärdet, och för k = l sätts tröskelvärdet i nivå med objektlumi- nansvärdet. Tröskelberäkningsmodulen 33 erhåller ett aktuellt värde pä faktorn k från reglermodulen 37. I det beskrivna utföringsexemplet àsätts denna faktor samma värde för alla delområden.
Efter ovanstående beräkning innehåller tröskel- matrisen T ett tröskelvärde Ti per bakgrundsdelområde Islb (fig 5).
Analysmodulen Analysmodulen 34 (fig 3) är utformad att beräkna kvalitetsmåttet Q på den aktuella binära bilden. Valet av kvalitetsmàtt är givetvis beroende på vilken typ av objekt som skall identifieras i gråskalebilderna.
Vid identifiering av markeringarna i positionskod- ningsmönstret enligt fig 1 har det visat sig lämpligt att basera kvalitetsmåttet på objektens storlek i den binära bilden. Kvalitetsmàttet beräknas lämpligen för hela bild~ en, eller åtminstone för ett bildomràde som med säkerhet innehåller flera objekt. Därmed minimeras inverkan på kvalitetsmàttet från den geometriska distorsion som upp- kommer när pennan, och därmed areasensorn, snedställs relativt det positionskodade underlaget.
Analysmodulen 34 kan således vara utformad att sum- mera antalet objektpixlar (värde O) i den binära bilden, för beräkning av den totala objektstorleken.
Analysmodulen 34 kan alternativt vara utformad att beräkna en genomsnittlig objektstorlek i bilden genom att summera antalet objektpixlar, identifiera antalet grupper av sammanhängande objektpixlar som kan förmodas bilda objekt, samt bilda kvoten av dessa antalsvärden. ..... 10 15 20 25 30 35 520 474 fffçff 18 Enligt ett ytterligare alternativ kan analysmodulen 34 vara utformad att identifiera alla grupper av samman- hängande objektpixlar som kan förmodas bilda objekt, be- räkna storleken pà varje grupp, samt bilda ett histogram över gruppernas storleksfördelning eller extrahera något mått därpå.
Reglermodulen Reglermodulen kan åskådliggöras som en del av ett reglersystem enligt fig 6. Reglermodulen 60 (motsvarande reglermodulen 37 i fig 3) opererar på en process 61, vil- ken verkställs i tröskelberäkningsmodulen 33, segmente- ringsmodulen 32 och analysmodulen 34 i fig 3. Regler- modulen 37 är utformad att på basis av differensen e mellan börvärdet w och ett ärvärde, i form av kvalitets- måttet Q på en föregående binär bild, beräkna kontrast- djupfaktorn k. Denna kontrastdjupfaktor k används sedan av processen 61 för att beräkna en aktuell tröskelmatris och med denna skapa en aktuell binär bild från en aktuell gråskalebild.
I fig 7 återges mer i detalj de processteg som ut- förs i systemet enligt fig 3 och 6. I ett första steg 71 inläses bildstatistik S(n) för den aktuella gråskalebild- en. I steg 72, som utförs i tröskelberäkningsmodulen 33 enligt ovanstående beskrivning, beräknas en aktuell tröskelmatris T(n) baserat på en föregående kontrastdjup- faktor k(n-1) och bildstatistiken S(n}. Därefter, i steg 73, binäriseras den aktuella gråskalebilden med tröskel- matrisen T(n). I efterföljande steg 74 beräknas den genomsnittliga objektstorleken i den aktuella binära bilden och används som kvalitetsmättet Q(n). I steg 75, som kommer att diskuteras mer i detalj nedan, beräknas sedan en ny kontrastdjupfaktor k(n). Därefter återgår exekveringen till steg 71.
Ovanstående reglersystem omfattar en reglerloop av första ordningen, i det att den nya tröskelmatrisen beräknas innan nästa gråskalebild binäriseras. va... lO 15 20 25 30 35 520 474 §:;;; 19 I fig 8 visas överföringsfunktionen för processen 61 i fig 6. Närmare bestämt visas ett uppmätt förhållande mellan medelobjektstorleken Q och kontrastdjupfaktorn k för sex olika underlag med positionskodningsmönster enligt fig 1. Såväl papperskvalitet som objektstorlek varierar mellan de olika underlagen. I fig 8 indikerar de heldragna kurvorna mätpunkterna för respektive underlag, och de streckade linjerna indikerar linjära approxima- tioner till mätpunkterna. Det framgår att överförings- funktionen kan approximeras med en linjär modellfunktion kring ett börvärde w: Q(n) = a - k(n-1) + C, där a och C är konstanter, och n är tidssteget.
Härvid kan reglerloopen uttryckas som en gängse PI-loop: km) = al - (w(n) ~ om) + az - 2 (wrm) - omm), m=0 där w(n) är den önskade medelobjektstorleken, och al, as är reglerparametrar.
Genom att definiera Ak(n) = k(n) - k(n-1) kan man eliminera summeringen genom omskrivning av reglerloopen SOTH man) = al - (Awzn) - Adm) + az - (w(n) - Qfm).
Detta resulterar i AQm)=a-A1<(n-1)=a-al-(Aw(n-1)-AQ(n-1))+ +a-a2-(w(n-1)-Q(n-1)) i vilket kan skrivas om och transformeras till en överföringsfunktion för ett àterkopplat system: l0 15 20 25 30 (a-al+a-a2)-z'l-a-al-z"2 Gc(z) = l+(a-al+a-a2-1)-z'l-a-al-z"2' Överföringsfunktionens poler blir: Z=1-a-al-a-a2iJfi-a-al-a-azf +a-a1 2 4 Placeringen av polerna påverkar reglersystemets stabilitet och svarstid. Exempelvis är det ett kriterium för stabilitet att alla poler ligger inom enhetscirkeln.
Det är således möjligt att undersöka polerna med avse- ende på reglerparametrarna al, az, för ett givet värde på konstanten a, och utifrån detta välja värden på regler- parametrarna som ger önskad prestanda hos reglersystemet.
Generellt sett bör reglersystemet vara så snabbt som möj- ligt, dock inte till priset av alltför mycket oscilla- tioner.
Ett samband för reglerloopen kommer nu att fast- ställas. Om man inför e(n) = w(n) - Q(n) erhålls Ak(n) = k(n) - k(n - l) = al -Ae(n) + az -e(n) <ï> km) = km - 1) + a, - (em) - em - 1)) + az - em) Integrationen ingår implicit i ovanstående samband.
Därmed undviks problem med integrationsuppvridning. Om utsignalen blir mättad vid tidpunkten n kan med andra ord det mättade värdet användas, och vid tidpunkten n+l kan ovanstående samband åter användas utan hänsyn till före- gående händelser.
För att återvända till placeringen av polerna, så är denna enligt ovanstående beroende av värdet på a, vilket i sin tur kan variera kraftigt beroende på sensoranord- ningens driftsbetingelser, exempelvis som resultat av förändringar i egenskaper hos underlaget, såsom objektens storlek, formkvalitet eller absorbans. Om al och az sätts -.-.. 10 15 20 25 30 520 474 2l till konstanta värden måste dessa väljas i enlighet med det högsta tänkbara värdet pà |a| för att säkerställa att oscillationer ej uppstår under nägra förhållanden. En sä- dan reglerloop skulle kunna vara användbar i vissa fall, när man kan tolerera ett förhållandevis långsamt svar pä snabba förändringar i sensoranordningens omgivning.
I ett alternativt utförande utformas reglerloopen att arbeta med väsentligen konstanta poler, oberoende av driftsbetingelse. Detta utförande drar nytta av det fak- tum att modellfunktionen Q(n) = a -k(n-l) + C, för alla relevanta driftsförhàllanden, uppvisar en väsentligen oberoende driftspunkt. Av fig 8 framgår att alla modell- funktionskurvor väsentligen konvergerar mot en drifts- punkt (Pd: Qd, kd), i detta exempel med en medelobjekt- storlek kring -l för en kontrastfaktor kring 1,05. Efter- som Q(n) = w = konstant i “steady state" kan värdet på a beräknas i stället för sättas till en konstant: _ W_Qd I ljuset av ovanstående kan reglersystemet, genom denna beräkning av a, modifieras att uppvisa väsentligen konstanta poler: a'a1=ß1<:>a1(n):ß1' a och a az = ßz ca azüfl = ßè. kÛï;hñ:¶'kd. d Detta ger den slutliga versionen av reglerloopen för binäriseringen: lO 15 20 25 30 520 474 22 km) = km - 1) + alm) - (an) - em - 1)) + azm) - em) e(n) = w - Q(n) afln) = ßi ' k(n _ l) _ kd w - Qd azfil) = ßz ' k(n _ 1)* kd w - Qd där ßl och ßz väljs i enlighet med ovanstående dis- kussioner kring stabilitet och svarstid, w är den önskade medelobjektstorleken efter binärisering, och Q(n) är medelobjektstorleken efter binärisering av den aktuella bilden. och börvärdet w kan fastställas genom testning, De optimala värdena på reglerparametrarna Bl, ßz såsom inses av fackmannen pà området. Exempelvis har framgångs- rika tester utförts med ßl = O, dvs användning av en helt integrerande reglerlOOp, ßz = ~l, och w = 4, dvs en medelobjektarea om 4 pixlar.
Som ett alternativ till att sätta medelobjektstor- leken Q(n) lika med börvärdet w vid parametriseringen av modellfunktionen, för ästadkommande av väsentligen konstanta poler oberoende av driftsbetingelse, kan man använda den faktiska medelobjektstorleken efter binärise- Detta angreppssätt kan potentiellt ge ett ännu snabbare regler- ring av den aktuella bilden, dvs ärvärdet Q(n). system, dock till priset av en ökad risk för instabilite- ter i reglersystemet. I det exempel som ges ovan och som åskådliggörs i fig 8 försämras emellertid inte systemets stabilitet i nämnvärd omfattning eftersom modellfunktion- en även på avstånd från börvärdet w väl återspeglar det verkliga beroendet mellan medelobjektstorleken Q och kontrastdjupfaktorn k.
I utförandet enligt fig 3-8 sätts ett börvärde som förutsätts vara adekvat för alla driftsbetingelser. Det kan emellertid vara svårt att fastställa ett sådant uni- versellt börvärde. I ovanstående exempel används objekt- storleken i de binära bilderna som kvalitetsmàtt. Den optimala objektstorleken, dvs börvärdet, sätts härvid med .-»»-. 10 15 20 25 30 35 520 474 23 kännedom om den nominella storleken på markeringarna i kodningsmönstret (jfr fig l) och ev förstoring i avbild- ningen från underlaget till areasensorn. Det har dock visat sig att den optimala objektstorleken även är bero- ende av driftsbetingelserna, framförallt egenskaper hos underlaget, såsom underlagets reflektans av IR-ljus, underlagets ytjämnhet, trycksvärtans absorbans av IR- ljus, markeringarnas svärtningsgrad, etc. Vidare kan mar- keringarnas faktiska storlek avvika från sitt nominella värde, exempelvis p g a störningar vid anbringandet av markeringarna.
I fig 9 visas ett alternativt utförande som möter ovanstående behov. Reglersystemet enligt fig 9 innehåller en reglermodul 90, som motsvarar reglermodulen 60 i fig 6 och som opererar på en process 91, vilken motsvarar pro- cessen 61 i fig 6. Reglersystemet innehåller vidare en beräkningsmodul 92 för börvärde, vilken intermittent upp- daterar börvärdet w utgående från den aktuella kontrast- djupfaktor k som utmatas av reglermodulen 90.
Det har nämligen överraskande visat sig att det föreligger ett samband mellan den optimala objektarean i binära bilder för en given driftsbetingelse (med givna egenskaper hos underlaget) och motsvarande kontrastdjup- faktor som beräknas av reglermodulen enligt föregående beskrivning. Med optimal objektarea kan avses det bör- värde som för en underlagstyp ger bäst identifiering av objekten, sett över alla tillåtna snedställningar av pennan relativt underlaget. Det finns olika tänkbara kri- terier på den optimala objektarean, såsom minst antal felaktigt identifierade objekt, störst säkerhet vid be- räkning av positioner, etc.
Fig 10 visar en del av fig 8 i närmare detalj. För varje kurva (heldragna linjer), dvs varje underlag, indi- keras vidare den optimala arbetspunkten (ofylld cirkel), dvs den arbetspunkt som ger en optimal objektarea för respektive underlag. I fig 10 visas även en rät linje som har anpassats till de optimala arbetspunkterna via ..~.-. 10 15 20 25 30 35 520 474 24 regressionsanalys och som ges av funktionssambandet wqx = 5- k + y, där y = 1,4 och 6 = 4,8.
Beräkningsmodulen 92 utgår således från detta funk- tionssamband för att fastställa ett optimalt börvärde.
I vissa fall kan det av reglertekniska skäl vara lämpligt att inte uppdatera börvärdet under varje itera- tion av reglerloopen. Således kan kontrastdjupfaktorn k från reglermodulen 90 medelvärdesbildas under ett antal iterationer innan ett uppdaterat börvärde w beräknas och utmatas till reglermodulen 90. Det kan vidare vara lämp- ligt att endast tillåta uppdatering av börvärdet inom ett börvärdesintervall.
Det må också påpekas att stabilitetskriterierna för reglersystemet som helhet kan ändras i förhållande till reglersystemet i fig 6, varför värdena på reglerparamet- rarna ah cb sannolikt är annorlunda. I fallet med ett reglersystem med konstanta poler har ßl = O och ßz = -0,2 befunnits ge tillfredsställande resultat.
I det följande beskrivs med hänvisning till fig 11 en implementation av det alternativa utförandet enligt ovan.
Först verkställs en initiering 110 av reglermodul- en. I steg 111, läser reglermodulen in startvärden, dvs aktuell kontrastdjupfaktor k(O), aktuellt fel e(0) och aktuellt börvärde w(O). Typiska värden är k(O) = 0,6; e(0) = O; w(O) = 4,28. Startvärdena k(O) och w(O) kan vara konstanta standardvärden, eller uppdateras varje gång pennan stängs av, exempelvis med det senaste beräk- nade värdet på kontrastdjupfaktorn respektive börvärdet.
I steg 112 läser reglermodulen in reglerparametrarna ßh ßz- En överordnad räknare n àterställs till 1 i steg 113, varpå en huvudreglerloop startas i steg 114.
I samband därmed, i steg 115, läser tröskelberäk- ningsmodulen in bildstatistik S(n), vilken tidigare har beräknats av statistikmodulen för en aktuell gråskalebild I(n). Utifrån bildstatistiken S(n) skattar tröskelberäk- -.«... 10 l5 20 25 30 35 520 474 25 ningsmodulen en bakgrundsmatris BG(n) och en objektmatris O(n) innehållande bakgrundsluminansvärden respektive ob- jektluminansvärden för givna delområden i gràskalebilden I(n). I steg 116 beräknar så tröskelberäkningsmodulen tröskelmatrisen T(n) baserat pà bakgrundmatrisen BG(n), objektmatrisen O(n) och kontrastdjupfaktorn k(n-1).
I steg 117 läser segmenteringsmodulen in gràskale- bilden I(n), om sä inte redan har skett tidigare, och tröskelmatrisen T(n), varpà gräskalebilden I(n) binäri- seras med användning av tröskelmatrisen T(n). Resultatet är en aktuell binär bild B(n).
Därefter, i steg 118, behandlar analysmodulen den binära bilden B(n) och beräknar medelobjektstorleken Q(n) inom denna.
Reglermodulen läser i steg 119 in den beräknade medelobjektstorleken Q(n) och beräknar differensen, eller felet, e(n) mellan det aktuella börvärdet w(n-1) och medelobjektstorleken Q(n). I steg 120 beräknar regler- modulen alfin) och 0@(n) utgäende fràn k(n-l), Q(n) och reglerparametrarna ßl respektive ßz. I detta exempel an- vänds således Q(n) för att parametrisera modellfunktion- en. Avslutningsvis, i steg 121, beräknar reglermodulen k(n) pà basis av k(n-1), a1(n), a2(n), e(n) och e(n-1).
Beräkningsmodulen för börvärde (hänvisningsbeteck- ning 92 i fig 9) läser därefter, i steg 122, in den upp- daterade kontrastdjupfaktorn k(n) och beräknar ett nytt börvärde w(n), vilket därefter läses in av reglermodulen.
Här är kan beräkningsmodulen vara utformad att beräkna det nya börvärdet som funktion av ett medelvärde av ett antal föregående kontrastdjupfaktorer.
Slutligen inkrementeras räknaren n i steg 123, var- på exekveringen återvänder till steg 115 för en ny itera- tion.
Alternativa utföringsformer Ovanstående beskrivning är endast avsedd att ge ett exempel pä hur uppfinningen kan realiseras inom ramen för 10 15 20 25 30 35 520 474 26 det skyddsomfång som definieras av efterföljande patent- krav.
Exempelvis kan reglerloopen implementeras som en PID-regulator, dvs en regulator som vid sidan av propor- tionell (P) and integrerande (I) reglering även verk- ställer deriverande (D) reglering. Vidare är det tänkbart att använda linjära reglersystem av högre ordning än l, liksom olika typer av icke-linjära reglersystem, för regleringen av binäriseringsprocessen.
Vidare bör understrykas att ovannämnda delområden kan ha godtycklig form, såsom kvadratisk, rektangulär, triangulär, rombisk, hexagonal etc.
I ovanstående exempel beräknas en kontrastdjupfaktor på basis av hela den binära bilden. Det är dock tänkbart att istället fastställa en kontrastdjupfaktor för vart och ett av ett antal styrdelområden i den binära bilden, på basis av ett beräknat kvalitetsmått för respektive styrdelomràde. Den resulterande uppsättningen kontrast- djupfaktorer kan sedan användas för beräkning av tröskel- matrisen.
Med avseende på det exemplifierande positionskod- ningsmönstret må påpekas att rastret kan ha andra former än ortogonalt, såsom ett rombiskt rutnät, t ex med 60 graders vinkel, ett triangulärt eller hexagonalt rutnät, etc. Vidare kan markeringarna vara förskjutna i andra riktningar än längs rasterlinjerna.
Uppfinningen är dock inte på något vis bunden till det beskrivna positionskodningsmönstret, utan är tillämp- lig även vid identifiering och avkodning av andra kod- ningsmönster.
I utföringsexemplet ovan är mönstret optiskt avläs- bart och sensorn således optisk. Det inses dock att de bilder som behandlas enligt uppfinningen kan vara genere- rade på annan väg, t ex genom detektion av kemiska, akus- tiska, elektromagnetiska, kapacitiva eller induktiva parametrar. Likaså inses att uppfinningen kan användas »..-. 520 474 :riff 27 även för identifiering av ljusa markeringar mot en mörk bakgrund.
Slutligen bör noteras att uppfinningen är generellt användbar för uppnàende av noggrann, snabb och minnes- effektiv identifiering av objekt i en digital bild ingà- ende i en följd av bilder.

Claims (22)

10 15 20 25 30 35 520 474 28 PATENTKRAV
1. Sätt att identifiera objekt i en digital bild ingående i en följd av bilder, omfattande steget att jäm- föra luminansvärden hos en aktuell digital bild med minst ett tröskelvärde för att pä basis av jämförelsen skapa en aktuell binäriserad bild, k äI1r1e t e c] att beräkna ett kvalitetsmàtt för den aktuella binärise- rade bilden, och att pà basis av nämnda kvalitetsmätt uppdatera nämnda minst ett tröskelvärde för användning vid binärisering av en följande bild.
2. Sätt enligt krav 1, varvid nämnda minst ett tröskelvärde uppdateras pä basis av differensen mellan nämnda kvalitetsmàtt och ett kvalitetsbörvärde.
3. Sätt enligt krav 1 eller 2, varvid nämnda jäm- förelse verkställs pà basis av en tröskelmatris inne- hållande tröskelvärden som är designerade för olika del- områden av den aktuella bilden.
4. Sätt enligt krav 3, omfattande stegen att för varje delomràde hos den aktuella bilden skatta ett bak- grundsluminansvärde och ett objektluminansvärde, varvid uppdateringen av tröskelmatrisens tröskelvärden sker pä basis av nämnda bakgrundsluminansvärde och nämnda objekt- luminansvärde.
5. Sätt enligt krav 4, varvid tröskelmatrisens tröskelvärden uppdateras pä basis av minst en kontrast- djupfaktor, som anger tröskelvärdets relativa läge mellan objektluminansvärdet och bakgrundluminansvärdet.
6. Sätt enligt krav 5, varvid kontrastdjupfaktorn fastställs pà basis av nämnda kvalitetsmàtt.
7. Sätt enligt krav 5 eller 6, varvid kvalitetsmàtt- et beräknas för styrdelomràden av den aktuella binärise- rade bilden, och varvid kontrastdjupfaktorn fastställs för vart och ett av styrdelomràdena.
8. Sätt enligt något av föregående krav, varvid kvalitetsmättet representerar arean av objekten i den aktuella binäriserade bilden. ...n- 10 l5 20 25 30 35 520 474 29
9. Sätt enligt något av kraven 3-8, omfattande steg- et att bilda en reglerloop, varvid varje iteration (n) av reglerloopen omfattar: att läsa in en aktuell bild (I), att skatta den aktuella bildens (I) kontrastfördel- ning, att beräkna tröskelmatrisens (T) tröskelvärden, utgående frän nämnda kontrastfördelning och en under den föregående iterationen beräknad kontrastdjupfaktor (k(n-l)), att skapa en aktuell binäriserad bild (B) på basis av tröskelmatrisen (T), att beräkna ett kvalitetsmått (Q) på den aktuella binäriserade bilden (B), att beräkna ett fel (e(n)) mellan ett börvärde (w) och kvalitetsmàttet (Q), och att beräkna en ny kontrastdjupfaktor (k(n)) ut- gående från den föregående kontrastdjupfaktorn (k(n-1)) och nämnda fel (e(n)).
10. lO. Sätt enligt krav 9, varvid reglerloopen arbetar med väsentligen konstanta poler.
11. ll. Sätt enligt krav 10, varvid reglerloopen är ba- serad på en modellfunktion som relaterar kvalitetsmàttet (Q) till den föregående kontrastdjupfaktorn (k(n-1)), vilken modellfunktion omfattar minst en väsentligen gemensam modellarbetspunkt (Pd) för alla digitala bilder i följden av bilder, varvid steget att beräkna en ny kontrastdjupfaktor (k(n)) omfattar steget att paramet- risera modellfunktionen på basis av den föregående kont- rastdjupfaktorn (k(n-1)) och nämnda modellarbetspunkt (Pa)-
12. l2. Sätt enligt krav ll, varvid modellfunktionen åtminstone är definierad kring nämnda börvärde (w).
13. Sätt enligt krav 12, varvid parametriseringen av modellfunktionen omfattar att sätta kvalitetsmàttet (Q) lika med börvärdet (w). ..... 5 10 15 20 25 30 520 474 30
14. Sätt enligt krav 12, varvid det kvalitetsmàtt (Q) som beräknats för den aktuella binäriserade bilden (B) används vid parametriseringen av modellfunktionen.
15. Sätt enligt något av kraven 11-14, varvid modellfunktionen är en linjär funktion.
16. Sätt enligt något av kraven 11-15, varvid reglerloopen ges av: km)=km-1)+a,(n)-(e(n)-e(n-1))+a2(n)em) e(n)=w-Q(n) kfn-u-kd w= -----_ aln 'ßl Qnv-Qd k(n-l)-l m= --_- azn ß? own-od där ßfi, ßß är konstanter, och k¿, Qd är värdena pà kontrastdjupfaktorn respektive kvalitetsmàttet i nämnda modellarbetspunkt (Pd).
17. Sätt enligt något av kraven 9-16, omfattande steget att intermittent uppdatera börvärdet pà basis av nämnda kvalitetsmàtt.
18. Sätt enligt nàgot av kraven 9-17, omfattande steget att intermittent uppdatera börvärdet (w) pä basis av kontrastdjupfaktorn (k(n)).
19. Datorprogram med programkod som vid exekvering i en processorförsedd enhet bringar denna att verkställa binärisering av digitala bilder, k ärirxe t e clcria d av att nämnda programkod vid exekveringen verkställer en äterkopplad reglering av minst en vid binäriseringen an- vänd trösklingsparameter för uppnàende av ett börvärde i form av ett kvalitetsmàtt hos bilderna efter binärise- ringen.
20. Datorprogramprodukt som är avläsbar för en pro- cessorförsedd enhet och innefattar ett datorprogram med instruktioner för att bringa enheten att genomföra ett sätt enligt något av kraven 1-18.
21. Handhällen apparat för positionsbestämning, innefattande en sensor (24) för àstadkommande av en följd av bilder av en yta med ett positionskodningsmönster, och 10 15 520 474 31 en processorförsedd behandlingsenhet (25) som är anordnad att utifràn positionskodningsmönstret i bilden beräkna en position, varvid behandlingsenheten omfattar ett dator- program enligt krav 19.
22. Anordning för identifiering av objekt i en di- gital bild ingående i en följd av bilder, omfattande ett segmenteringsorgan (32) som är utformat att läsa in minst ett tröskelvärde och jämföra luminansvärden hos en aktu- ell digital bild med nämnda minst ett tröskelvärde för att pà basis av jämförelsen skapa en aktuell binäriserad bild, k ärin et:e cl 37) som är utformat att beräkna ett kvalitetsmàtt för den aktuella binäriserade bilden och att uppdatera nämnda minst ett tröskelvärde, varvid segmenteringsorganet (32) är anordnat att läsa in det uppdaterade tröskelvärdet för användning vid binärisering av en följande bild.
SE0103845A 2001-11-20 2001-11-20 Sätt och anordning för identifiering av objekt i digitala bilder SE520474C2 (sv)

Priority Applications (5)

Application Number Priority Date Filing Date Title
SE0103845A SE520474C2 (sv) 2001-11-20 2001-11-20 Sätt och anordning för identifiering av objekt i digitala bilder
AU2002349854A AU2002349854A1 (en) 2001-11-20 2002-11-20 Method and a hand-held device for identifying objects in a sequence of digital images by creating binarized images based on a adaptive threshold value
US10/300,029 US7283676B2 (en) 2001-11-20 2002-11-20 Method and device for identifying objects in digital images
EP02786335A EP1449171A1 (en) 2001-11-20 2002-11-20 Method and a hand-held device for identifying objects in a sequence of digital images by creating binarized images based on a adaptive threshold value
PCT/SE2002/002104 WO2003044740A1 (en) 2001-11-20 2002-11-20 Method and a hand-held device for identifying objects in a sequence of digital images by creating binarized images based on a adaptive threshold value

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0103845A SE520474C2 (sv) 2001-11-20 2001-11-20 Sätt och anordning för identifiering av objekt i digitala bilder

Publications (3)

Publication Number Publication Date
SE0103845D0 SE0103845D0 (sv) 2001-11-20
SE0103845L SE0103845L (sv) 2003-05-21
SE520474C2 true SE520474C2 (sv) 2003-07-15

Family

ID=20286029

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0103845A SE520474C2 (sv) 2001-11-20 2001-11-20 Sätt och anordning för identifiering av objekt i digitala bilder

Country Status (4)

Country Link
EP (1) EP1449171A1 (sv)
AU (1) AU2002349854A1 (sv)
SE (1) SE520474C2 (sv)
WO (1) WO2003044740A1 (sv)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543181A (ja) 2006-06-28 2009-12-03 アノト アクティエボラーク 電子ペンにおける動作制御およびデータ処理

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852434A (en) 1992-04-03 1998-12-22 Sekendur; Oral F. Absolute optical position determination
US5661506A (en) 1994-11-10 1997-08-26 Sia Technology Corporation Pen and paper information recording system using an imaging pen
US5923776A (en) * 1996-05-23 1999-07-13 The United States Of America As Represented By The Secretary Of The Navy Object extraction in images
US5949905A (en) 1996-10-23 1999-09-07 Nichani; Sanjay Model-based adaptive segmentation
US5960111A (en) * 1997-02-10 1999-09-28 At&T Corp Method and apparatus for segmenting images prior to coding
US6195458B1 (en) * 1997-07-29 2001-02-27 Eastman Kodak Company Method for content-based temporal segmentation of video
GB2372661B (en) * 1999-12-10 2004-04-21 British Telecomm Image processing
US6678416B1 (en) * 2000-02-08 2004-01-13 University Of Washington Detecting and segmenting local deformation in a tracked video object

Also Published As

Publication number Publication date
SE0103845D0 (sv) 2001-11-20
EP1449171A1 (en) 2004-08-25
AU2002349854A1 (en) 2003-06-10
SE0103845L (sv) 2003-05-21
WO2003044740A1 (en) 2003-05-30

Similar Documents

Publication Publication Date Title
US7283676B2 (en) Method and device for identifying objects in digital images
US7110604B2 (en) Processing of digital images
JP5378500B2 (ja) 動的特徴検出の方法およびシステム
US20110019243A1 (en) Stereoscopic form reader
US5872863A (en) Component detection method
JP2012002761A (ja) 位置姿勢計測装置、その処理方法及びプログラム
CN108573471B (zh) 图像处理装置、图像处理方法以及记录介质
JP2012510235A (ja) 曲線修正のためのイメージ処理
Han et al. Research and implementation of an improved canny edge detection algorithm
CN111652205B (zh) 基于深度学习的文本矫正方法、装置、设备和介质
CN109190452A (zh) 作物行识别方法及装置
US12079978B2 (en) System and method for determining 3D surface features and irregularities on an object
CN113902652B (zh) 散斑图像校正方法、深度计算方法、装置、介质及设备
CN114383510B (zh) 光学感测系统以及光学导航系统
CN112184723B (zh) 图像处理方法及装置、电子设备、存储介质
JP2022009474A (ja) ビジョンシステムでラインを検出するためのシステム及び方法
SE520474C2 (sv) Sätt och anordning för identifiering av objekt i digitala bilder
WO2023082417A1 (zh) 抓取点信息获取方法、装置、电子设备和存储介质
JP2637591B2 (ja) 位置認識装置及びその方法
CN109218707B (zh) 口扫系统及口扫方法
CN111815705B (zh) 激光跟踪仪滤光保护镜片污染识别方法、装置及电子设备
CN114022342A (zh) 抓取点信息获取方法、装置、电子设备和存储介质
Kang et al. Automatic circle pattern extraction and camera calibration using fast adaptive binarization and plane homography
Ristić et al. Performance measure as feedback variable in image processing
CN115319761B (zh) 高精度机械手抓取的控制方法、控制系统及机器人

Legal Events

Date Code Title Description
NUG Patent has lapsed