SE535888C2 - Förfarande för att identifiera en karaktäristisk del i en bild - Google Patents

Förfarande för att identifiera en karaktäristisk del i en bild Download PDF

Info

Publication number
SE535888C2
SE535888C2 SE1150522A SE1150522A SE535888C2 SE 535888 C2 SE535888 C2 SE 535888C2 SE 1150522 A SE1150522 A SE 1150522A SE 1150522 A SE1150522 A SE 1150522A SE 535888 C2 SE535888 C2 SE 535888C2
Authority
SE
Sweden
Prior art keywords
pixel
image
pixels
edge area
local
Prior art date
Application number
SE1150522A
Other languages
English (en)
Other versions
SE1150522A1 (sv
Inventor
Ingvar Lindgren
Mikael Loewgren
Original Assignee
Imtt Svenska Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Imtt Svenska Ab filed Critical Imtt Svenska Ab
Priority to SE1150522A priority Critical patent/SE535888C2/sv
Priority to PCT/SE2012/050620 priority patent/WO2012169964A1/en
Publication of SE1150522A1 publication Critical patent/SE1150522A1/sv
Publication of SE535888C2 publication Critical patent/SE535888C2/sv

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Abstract

Förfarande för att identifiera en karaktäristisk del av en digitalt lagrad bild. Uppfinningen utmärks av stegen: a) identifiera ett kantområde (10) i bilden; b) identifiera en första riktning (Al) i bil-den för kantområdet (l0); c) identifiera ett lokalt samman-hängande kantområde (ll) vars bredd har ett enda globalt maximum; d) identifiera en andra riktning (A2) för det lokala(11): G)kring det lokala kantomràdet kantområdet identifiera ett (11): f) tilläggsomràde (12)identifiera den karak-täristiska delen av bilden sà att den innefattar det lokala(ll) (12). kantområdet och tilläggsomràdet

Description

30 535 888 flera karaktäristiska delar av en viss bild identifieras. En sådan karaktäristisk del kan identifieras på olika sätt, men med det gemensamma syftet att vara informationsbärande i den meningen att delen kan användas för att till exempel identi- fiera eller jämföra en bild istället för att hela bilden används. Om den karaktäristiska delen innehåller information som är representativ eller beskrivande för bilden som helhet, är det effektivare att i olika bildanalyser ta hänsyn endast till den karaktäristiska delen snarare än till hela bilden.
Ett problenl är att automatiskt kunna identifiera relevanta karaktäristiska delar i bilder pà ett konsistent och repeter- bart sätt.
WO200608586l beskriver ett förfarande för att identifiera eller indexera en digitalt lagrad bild, i vilket karaktäris- tiska delar identifieras i egenskap av kantområden, definie- rade som uppsättningar par av pixlar med hög ljuskontrast.
När man utför en analys baserad pà en karaktäristisk bilddel, till exempel genom att jämföra den med en motsvarande karak- täristisk bilddel i en annan bild, uppstår ofta problem när den bild i vilken den ena karaktäristiska delen ingår föränd- ras, till exempel genom perspektivförskjutning, vinkelföränd- ring, vridning, upplösningsförändring, beskärning, färgför- ändringar och så vidare. Exempel innefattar jämförelse mellan två bilder med hjälp av respektive karaktäristiska delar där den ena bilden är en variant av den andra bilden som besku- rits eller roterats; identifieringen av avvikande bilder i ett bildmaterial med hjälp av respektive karaktäristiska delar där vissa bilder har avvikande upplösning men där själ- va upplösningen inte är den egenskap vars avvikande är det som åsyftas med identifieringen; och gruppering av ett stort 10 15 20 25 30 535 888 antal bilder efter motiv utifrån respektive karaktäristiska delar, där vissa bilder innefattar samma motiv* men visade från något olika vinklar eller med delvis olika bakgrund.
Det gemensamma problemet är i dessa fall att åstadkomma ett förfarande för att på ett konsistent och repeterbart sätt identifiera en karaktäristisk bilddel, för de syften som beskrivits ovan, och som är så opàverkad som möjligt av bild- förändringar av de typer som anges ovan.
Föreliggande uppfinning löser de ovan beskrivna problemen.
Således hänför sig uppfinningen till ett förfarande för att identifiera en karaktäristisk del av en bild, där bilden bringas att lagras i digitalt format i form av en matris uppbyggd av pixlar, och utmärks av följande steg : a) identi- fiera ett kantomràde i bilden bestående av en sammanhängande mängd kantpixlar bilden; b) som tillsammans bildar ett kantomràde i identifiera en första riktning i bilden för kant- området; c) identifiera ett lokalt kantomràde bestående av en sammanhängande mängd pixlar, för vilket lokalt kantomràde bredden i en första breddriktning längs med den första rikt- ningen saknar lokala maximum förutom ett enda globalt maxi- mum; d) identifiera en andra riktning för det lokala kantom- rådet; e) identifiera ett tilläggsområde kring det lokala kantområdet som innefattar pixlar som är belägna i omedelbar anslutning till en periferiskt belägen gränspixel hos det lokala kantområdet och vidare bort från gränspixeln fram till ett avstånd i den andra riktningen från gränspixeln som är proportionellt mot det lokala kantområdets bredd i den andra riktningen vid gränspixeln: f) identifiera den karaktäristis- ka delen av bilden så att den innefattar det lokala kantområ- 20 25 535 888 det och tilläggsområdet, och lagra den karaktäristiska delen i digital form pá ett lagringsmedium.
Uppfinningen kommer nu att beskrivas i detalj, med hänvisning till exemplifierande utföringsformer av uppfinningen och de bifogade ritningarna, där: Figur l är en förstorad detalj i en digitalt lagrad bild på vilket ett förfarande enligt föreliggande uppfinning tilläm- pas; Figur 2 är en graf som illustrerar ett tröskelvärde för en jämförelseparameter enligt föreliggande uppfinning; Figur 3 är ett flödesschema som illustrerar identifieringen av ett kantområde i enlighet med föreliggande uppfinning; Figur 4 är en översiktlig illustration av en identifiering av ett karaktäristiskt område enligt föreliggande uppfinning; och Figur 5 är ett flödesschema som illustrerar identifieringen av en karaktäristisk del i enlighet med föreliggande uppfin- ning.
Figur 1 visar ett kraftigt uppförstorat utsnitt 1 av en bild.
I enlighet med uppfinningen är bilden lagrad i digitalt for- mat pà ett digitalt lagringsmedium i form av en matris upp- byggd av pixlar. Detta innebär att bilden kan vara en bild vars förlaga är en analogt lagrad bild, exempelvis lagrad på en fotografisk film. I detta fall utförs en konventionell digitalisering av bilden innan den används i ett förfarande enligt föreliggande uppfinning. Lagringsmediet kan vara vil- ket konventionellt digitalt lagringsmedium som helst, såsom en hårddisk, ett interminne i en eller flera datorer eller en CD-skiva. 20 25 30 535 BBB I figur l är utsnittet så förstorat att de enskilda pixlarna framträder tydligt. Ett rutnät är tillagt, enbart i syfte att ytterligare öka tydligheten i figuren.
Figur 3 illustrerar översiktligt de olika stegen som utförs vid en identifiering av ett kantområde i enlighet med en föredragen utföringsform av föreliggande uppfinning.
I ett första steg 101 sveper man över hela bilden, pixel för pixel, och beräknar för varje par pixlar i bilden, där den ena pixeln befinner sig i. en förutbestämd lokal omgivning till den andra pixeln, en jämförelseparameter som utgör skillnaden mellan de två pixlarna beträffande en intensitets- egenskap över en eller flera kanaler.
Det är föredraget att intensitetsegenskapsskillnaden definie- ras som den absoluta skillnaden i värdet för intensitetsegen- skapen. Exempelvis kan skillnaden utgöras av den absoluta skillnaden i luminans hos två pixlar.
Det är även föredraget att en intensitetsskillnad mellan pixeln ifråga och var och en av de pixlar som ingår i en fördefinierad lokal omgivning till pixeln jämförs. Omgivning- en är företrädesvis symmetrisk kring pixeln ifråga, och kan, beroende på bland annat prestandakrav, 4, 8, exempelvis utgöras av 12, 20, 24 eller fler närliggande pixlar.
I figur 1 illustreras en pixel 4 för vilken intensitetsskill- naden i jämförelse med var och en av pixlarna 3a-3h i en 8 pixlars 3x3 omgivning 3 (mittpixeln 4 är jämförelsepixeln och tillhör inte omgivningen 3) àskàdliggörs. 10 15 20 25 30 535 BBB För varje pixel 4 i bilden jämförs således en intensitete- skillnad mellan pixeln 4 och var och en av pixlarna 3a-3h i en omgivning 3 till pixeln 4. Enligt en föredragen utförings- form definierar varje omgivningspixel 3a-3h en riktning i bilden i förhållande till pixeln 4. Tabell l visar de olika riktningar, uttryckta som vinklar i i förhållande relation till bildens geometri, till pixeln 4 som de olika omgiv- ningspixlarna 3a~3h definierar i figur 1. Det är naturligtvis möjligt att använda färre eller fler riktningar, men det är föredraget att riktningarna är jämnt fördelade mellan 0 och 360°.
Tabell 1 Omgivningspixel Riktning 3a 270° 3b 3l5° 3c 0° 3d 45° 3e 225° 3f l80° 3g l35° 3h 90° Enligt föreliggande föredragna utföringsform beräknas för varje pixel 4 och för varje använd riktning en jämförelsepa- rameter, beträffande en intensitetsegenskap över en eller flera kanaler, som utgör skillnaden mellan pixeln 4 och den omgivningspixel som definierar riktningen ifråga. En ”kanal” i detta sammanhang är en numerisk uppgift om en viss typ av intensitet, såsom luminans, reflektans eller motsvarande.
Exempel innefattar en RGB-kodad bild, där ljusintensitet i det röda, gröna respektive blåa färgbandet anges numeriskt av 10 20 25 M7 535 BBB varsin respektive av tre kanaler, och en gråskalebild, där gråskala anges numeriskt i en enda kanal.
Enligt en föredragen utföringsform är intensitetsegenskapen för en viss pixel den totala luminansen hos pixeln ifråga över hela det synliga färgspektrumet. I det fall ursprungs- bilden innehåller färginformation är det föredraget att bil- den i ett inledande steg, till exempel i samband med den ovan beskrivna eventuella digitaliseringen, konverteras till en gråskalebild, i vilken den totala luminansen för en viss pixel utgörs av värdet på dess gràton. Genom att på detta sätt bortse från färginformation i bilden kan en karaktäris- tisk del av bilden identifieras på ett sätt som är repeter- bart även i. många fall då ursprungsbildens färginformation manipulerats.
För alla pixlar i bilden lagras det beräknade jämförelsevär- det för var och en av omgivningspixlarna i omgivningen till varje respektive pixel. Den sålunda erhållna mängden jämfö- relsevärden kan för var och en av de använda riktningarna i bilden àskådliggöras i en graf av den typ som illustreras i figur 2, som längs med en axel d visar skillnad i intensi- tetsegenskap och längs med en annan axel n visar antalet pixlar i bilden som uppvisar denna intensitetsegenskapsskill- nad för den aktuella riktningen. Med andra ord kan åtta såda- na grafer upprättas för det svep som illustreras i figur l som använder sig av en 3x3 pixelomgivning.
För varje graf identifieras därefter, i ett steg 102, ett som utgörs av det första lokala minimumet hos den funktion n(d) som för en viss riktning illustreras i tröskelvärde dl, figur 2. Vid beräkning av värdet dl är det föredraget att först utföra en filtrering av funktionen f(n) så att den blir 15 20 25 30 535 B88 jämnare och/eller införa en viss toleransparameter som igno- rerar mindre fluktuationer i funktionens värde. Detta säker- ställer att det är det första mer markant framträdande mini- mumet som väljs ut som tröskelvärdet dl.
I ett steg 103 identifieras därefter ett kantomràde i bilden som ett sammanhängande område kantpixlar. Uttrycket ”kantpix- el” i detta sammanhang skall tolkas som de pixlar för vilka jämförelseparametern vid jämförelse med en annan pixel i steget 101 befanns vara större än tröskelvärdet dl. Med andra ord kan kantpixlar sägas vara de pixlar i bilden som uppvisar högst kontrast i jämförelse med sina respektive lokala omgiv- ningar. Samma bild kan innefatta vilket antal sådana samman- hängande områden som helst, men det är föredraget att varje sammanhängande och isolerat område definieras som ett enskilt kantomràde, möjligen med användning av vissa tröskelvärden i form av exempelvis minsta tillåtna storlek för ett kantomràde eller minsta tillåtna storlek för förbindelser mellan kantom- råden. Även om det är föredraget att utföra jämförelserna och be- stämningarna av tröskelvärden enligt det ovan beskrivna i var och en av vissa förutbestämda riktningar i bilden är det även möjligt att utföra intensitetsegenskapsjämförelsen mellan pixeln 4 och omgivningspixlarna 3a-3h utan att ta hänsyn till riktningar, vilket i det fall som illustreras i figur l skul- le resultera i 8 olika jämförelsevärden för varje pixel i bilden, och där samtliga dessa jämförelsevärden analyseras i en och samma funktion f(n), varför endast ett tröskelvärde dl kommer att fastställas.
I det fall riktningar används, kommer med andra ord en viss pixel 4 att anses vara en kantpixel ifall intensitetsskillna- 10 15 20 25 30 535 888 den mellan pixeln 4 och någon av dess omgivningspixlar 3a-3h är större än tröskelvärdet för den riktning som definieras av omgivningspixeln ifråga. I det fall riktningar inte används kommer å ifall andra sidan pixeln 4 att anses vara en kantpixel intensitetsegenskapsskillnaden och mellan pixeln 4 någon av omgivningspixlarna 3a-3h är större än det för samt- liga riktningar gemensamma tröskelvärdet.
Enligt en föredragen utföringsform associeras varje sålunda identifierad kantpixel med ett binärt tal, i vilket varje bit motsvarar en viss riktning, och där den respektive bitens värde (0 eller 1) hänför sig till huruvida jämförelseparame- tern för kantpixeln ifråga i den riktning som motsvaras av biten befanns vara större än tröskelvärdet för åtminstone en av de förutbestämda riktningarna. Om exempelvis pixeln 4 i figur 1 befanns vara en kantpixel eftersom dess intensitets- skillnad i jämförelse med omgivningspixlarna 3d, 3e och 3g var större än de för dessa tre riktningars respektive beräk- nade tröskelvärden, kan det binära talet beräknas enligt Tabell 2: Tabell 2 Omgivningspixel Riktning Bitvärde 3a 270° 0 3b 3l5° O 3c 0° 0 3d 45° l 3e 225° 1 3f l80° 0 3g l35° 1 3h 90° O 10 20 25 30 535 BBB 10 Alltså blir det binära talet 00011010, vilket motsvarar det decimala talet 26. En sådan representation, där ett unikt binärt tal identifierar de riktningar längs med vilka kant- pixeln 4 ifråga uppfyller kriteriet för att anses vara en kantpixel, medger effektiv sökning bland identifierade kant- pixlar eftersom varje kantpixel är associerad med information som anger i. vilka riktningar angränsande pixlar åtminstone sannolikt också är kantpixlar.
Enligt uppfinningen används ett identifierat kantområde, bestående av en sammanhängande mängd kantpixlar som tillsam- mans bildar ett kantområde i bilden, fält, exempelvis mellan två angränsande för att identifiera ett karaktäristiskt område. Det är föredraget men inte nödvändigt att använda ett förfarande i enlighet med det som beskrivits ovan för att identifiera kantområdet. Genom att som kantpixlar identifiera sådana pixlar som har en stor intensitetsegenskapsskillnad i jämförelse med andra pixlar i en lokal omgivning, åstadkoms ett kantområde som dels effektivt fångar upp relevanta delar av bilden, dels på många sätt är oberoende av de typer av förändringar av originalbilden som beskrivits ovan. Genom att därutöver även utföra analysen i ett antal förutbestämda riktningar förbättras precisionen.
Flödesschemat i figur 5 illustrerar ett förfarande enligt föreliggande uppfinning, där identifieringen av kantområdet utgör ett första steg 201.
Figur 4 visar i en matris ett visst kantomràde 10 som identi- fierats i steget 201 för en viss bild. Själva bildinformatio- nen visas inte, av tydlighetsskäl, utan endast kantområdets 10 utbredning i bildens pixelmatris. De pixlar som tillhör 10 15 20 25 30 535 BBB ll det identifierade kantområdet 10 är markerade med grå bak- grund.
I enlighet med uppfinningen identifieras i ett steg 202 en första riktning A1 i hdlden. Den första riktningen Al kan vara vilken riktning som helst, och kan speciellt vara en riktning i. förhållande till bildens axelriktningar eller i förhållande till en viss geometrisk egenskap hos det identi- fierade kantområdet, såsom dess längsta diameter. Den rikt- ning Al som illustreras i figur 4 utgörs av en av bildens axelriktningar.
I ett steg 203 genomlöps därefter hela det identifierade kantområdet 10 längs med den första riktningen Al, i det i figur 4 illustrerade exemplifierande utföringsexemplet ned- ifrån och uppåt i figuren. För varje pixel längs med den första riktningen Al undersöks bredden i en första breddrikt- ning för kantområdet 10 vid läget för pixeln Med ”bredden i en första breddriktning” menas i detta ifråga. uttrycket sammanhang bredden i en ytterligare riktning som inte är parallell med den första riktningen Al. Denna breddriktning är företrädesvis vinkelrät mot den första riktningen Al, men kan även utgöras exempelvis av en med Al icke parallell axel- riktning i bilden.
Genom sådana successiva undersökningar av bredden i den för- sta breddriktningen längs med den första riktningen Al iden- tífieras i ett steg 203 ett lokalt kantområde ll. För varje undersökt bredd i den första breddriktningen läggs till det lokala kantområdet ll de pixlar som är belägna längs med bredden i den första breddriktningen ifråga. 15 20 ü 30 535 888 12 Enligt uppfinningen identifieras det lokala kantomràdet ll så att bredden i den första breddriktningen i det lokala kantom- rådet ll längs med den första riktningen Al saknar lokala maximum förutom ett enda globalt maximum. Detta kan praktiskt utföras genom att genomlöpningen fortsätter till nästa bredd i den första breddriktningen längs med den första riktningen Al så länge som bredden i den första breddriktningen inte åter börjar öka efter att först ha minskat. Med andra ord avbryts identifieringen av det lokala kantomràdet ll när det första lokala minimumet hos bredden i den första breddrikt- ningen har nåtts längs med den första riktningen Al, alterna- tivt när den sista bredden i den första breddriktningen i kantomràdet 10 har nåtts.
Enligt en föredragen utföringsform används de tidigare lagra- de binära talen för varje respektive kantpixel för att utföra genomlöpningen av kantområdet 10. Detta utförs så att kantom- ràdet 10 genomlöps pixel för pixel, där den bit i det binära talet som motsvarar en viss riktning avgör huruvida genomlöp- ningen skall fortsätta i denna riktning eller inte på så sätt att bitvärdet ”O” innebär att genomlöpning inte skall fort- sätta i den riktningen. Ett sådant förfarande medför snabb genomlöpning av samtliga pixlar i ett kantomràde 10.
Det på detta sätt identifierade lokala kantområdet 11 är i figur 4 illustrerat med hjälp av streckade linjer.
Därefter kan ytterligare lokala kantområden identifieras utifrån de eventuella delar av ett identifierat kantomràde 10 som inte redan utgör en del av ett identifierat lokalt kant- område ll. Förfarandet kan även fortsätta för alla identifie- rade kantområden i bilden, så att slutligen samtliga identi- 10 15 20 25 30 535 888 13 fierade kantområden har delats in i ett antal lokala kantom- råden.
I ett steg 204 identifieras därefter en andra riktning A2 för det lokala kantområdet ll. Denna andra riktning A2 kan, på ett sätt som liknar det för den första riktningen A1, vara antingen relaterad till geometrin för bilden eller det lokala kantområdet ll, exempelvis till en längsta diameter hos det lokala kantområdet ll eller till en axelriktning hos bilden.
Speciellt kan den andra riktningen A2 väljas att vara bredden i den första breddriktningen som diskuterats ovan eller samma riktning som den första riktningen Al. I den exemplifierande utföringsform som illustreras i figur 4 väljs den andra rikt- ningen A2 till bredden i den första breddriktningen som dis- kuterats ovan.
Efter detta identifieras, i ett steg 205, 12 kring det lokala kantområdet ll. ett tilläggsomràde Tilläggsområdet 12 illu- streras i figur 4 med streckad bakgrund. Enligt uppfinningen väljs vid identifieringen av tilläggsområdet 12 pixlar l4a, l4b som är belägna i omedelbar anslutning till en periferiskt belägen gränspixel 13 hos det lokala kantområdet ll och vida- re bort från gränspixeln 13, längs med den andra riktningen A2, fram till ett visst avstånd i den andra riktningen A2 från gränspixeln 13.
Uttrycket ”gränspixel” betyder häri en sådan pixel som i den andra riktningen A2 angränsar till en pixel l4b som inte ingår i det lokala kantområdet 11. För en viss sådan kantpix- el 13 läggs alltså den angränsande pixeln l4b som inte ingår i det lokala kantområdet ll till tilläggsområdet 12. Dessutom läggs till tilläggsomràdet 12 nästa pixel l4a i den andra riktningen A2, och så vidare, fram till det nämnda avståndet 15 20 25 30 535 BBB 14 från gränspixeln 13. Enligt uppfinningen är avståndet propor- tionellt mot det lokala kantområdets ll bredd. i den andra vid riktningen A2 mellan gränspixeln 13. Proportionen tilläggsområdets 12 avstånd och det lokala kantområdets 11 bredd i den andra riktningen A2 kan vara vilken lämplig kon- stant som helst, och 5, enligt en föredragen utföringsform mellan 1 hellre mellan 1 och 3, helst l. I föreliggande exemp- lifierande utföringsform används konstanten 1, vilket alltså betyder att avståndet väljs till samma som bredden i den andra riktningen A2.
För den illustrerade gränspixeln 13 är bredden vid gränspix- eln 13 i den andra riktningen A2 två pixlar, 14b, varför två yt- terligare pixlar l4a, området 11, som inte ingår i det lokala kant- väljs att ingå i tilläggsomràdet 12 i den andra riktningen A2. Men avståndets storlek är alltså variabelt över olika gränspixlar. Såsom tydligt framgår av figur 4 varierar avståndet mellan l och 5 pixlar for olika gränspix- lar.
Enligt en föredragen utföringsform identifieras tilläggsomrà- den på detta sätt för alla gränspixlar i det lokala kantområ- det ll, och alla således identifierade tilläggsområden bildar tillsammans tilläggsområdet för det lokala kantomràdet 11.
Detta medför hög repeterbarhet vid identifieringen av en karaktäristisk del.
Enligt uppfinningen identifieras därefter den karaktäristiska delen av bilden så att den innefattar det lokala kantområdet och tilläggsområdet. Med andra ord kommer den karaktäristiska delen att utgöra ett sammanhängande område av bilden, inne- fattande dels kantpixlar, dels tilläggspixlar. Den karaktä- ristiska delen lagras därefter i digital form på ett lag- 20 25 30 535 B88 15 ringsmedium, som kan vara vilket konventionellt lagringsmedi- um som helst såsom beskrivits ovan.
Således utgår föreliggande uppfinnings förfarande från ett kantområde i en bild.
Sådana kantomràden kan i allmänhet identifieras automatiskt för olika bilder på ett i hög grad repeterbart sätt. Eftersom den intressanta informationen i fotografiska bilder i många fall tenderar att vara associerad med partier med relativt hög kontrast och/eller som utgör gränser mellan i bilden förekommande fält exempelvis mellan för- och bakgrund i bilden, kommer de kantomràden som identi- fieras av en automatisk algoritm i allmänhet att vara belägna i partier av bilden som är intressanta ur till exempel en jämförelsesynpunkt. Speciellt god repeterbarhet har av före- liggande uppfinnare uppnåtts med hjälp av det ovan beskrivna förfarandet för att identifiera ett kantområde. Genom att välja ett lokalt kantområde med endast ett lokalt maximum kan rumsligt begränsade, distinkta kantomràden av lagom storlek erhållas snabbt och på ett repeterbart sätt.
Genom att identifiera en karaktäristisk del som unionen av ett kantomràde och ett tilläggsomràde på det ovan angivna sättet, kommer den karaktäristiska delen även att innefatta partier i bilden som omger ett kantområde. Det har överras- kande visat sig att sådana kringpartier ofta innehåller hög- relevant bildinformation. Genom att välja tilläggsomràde vars dimensioner är proportionella mot kantområdets dimensioner erhålls en karaktäristisk del vars utsträckning i en bild blir repeterbar i hög utsträckning. Med andra ord kommer ungefärligen samma parti av bilden med avseende pá själva bildinformationen att identifieras även ifall bilden har modifierats med avseende på upplösning, vinkelförändringar, fokusering, rotation, färginställningar, etc. Eftersom kant- 15 20 25 30 535 B88 16 området är identifierat enbart på basis av själva bildinne- hållet, och eftersom tilläggsomràdet är identifierat på basis av kantområdet, finns inga beroenden till exempelvis bildma- trisens yttre geometri.
Detta medför slutligen att karaktäristiska delar som identi- fierats genom ett förfarande enligt föreliggande uppfinning med stor sannolikhet ger repeterbara resultat när de används för ett brett spektrum av olika syften, såsom automatiska jämförelser mellan bilder.
Det är föredraget att den digitalt lagrade karaktäristiska delen bringas att innefatta information beträffande vilka pixlar som utgör kantpixlar, och även den ursprungliga pixe- linformationen från bilden. Lagringen av en karaktäristisk del på detta sätt gör att delen på ett enkelt sätt kan använ- das i analyser som även tar hänsyn till vilka pixlar som utgör kantpixlar. Detta kan i. många tillämpningar vara en intressant parameter vid exempelvis jämförelser mellan bil- der, eftersom dessa pixlar till exempel kan markera gränser mellan fält i bilden.
Enligt en föredragen utföringsform väljs inte endast en för- sta riktning, utan två första riktningar. Dessa riktningar kan, på samma sätt som beskrivs ovan för den första riktning- en, vara vilka riktningar som helst som är relaterade till bildens dimensioner eller till det identifierade kantomrádets dimensioner, så länge som de två första riktningarna inte är parallella. Sedan utförs identifieringen av det lokala kant- området på motsvarande sätt såsom beskrivs ovan, men med användning av båda de första riktninqarna var för sig. Alltså väljs det lokala kantomrádet som en del av det identifierade kantområdet som enbart har ett lokalt maximum längs med båda 10 15 20 25 30 535 888 17 de respektive första riktningarna. Detta medför högre repe- terbarhet vid identifiering av karaktäristiska delar även i det fall bilden roteras och även i fallet långsträckta kant- områden. Det är föredraget att de båda första riktningarna är vinkelräta. Exempel innefattar riktningen längs med kantområ- dets längsta diameter respektive dennas normalriktning, samt två vinkelräta axeldimensioner hos bilden. Speciellt det senare möjliggör snabba beräkningar i ett automatiserat för- farande i kombination med hög konsistens och repeterbarhet.
Pâ ett liknande sätt väljs, enligt en föredragen utförings- form, inte endast en andra riktning utan två andra riktning- ar. Dessa båda andra riktningar kan också, såsonx beskrivs ovan för den andra riktningen, vara vilka riktningar som helst som är relaterade till bildens dimensioner eller till det identifierade kantområdets dimensioner. De får dock inte vara parallella. Därefter utförs identifieringen av tilläggs- omràdet på motsvarande sätt såsom beskrivs ovan för den andra riktningen, men med användning av båda de andra riktningarna.
Alltså identifieras först ett tilläggsomràde med hjälp av en av de andra riktningarna. Därefter identifieras, på motsva- rande sätt, ett ytterligare tilläggsomràde med hjälp av den andra av de båda andra riktningarna. Slutligen väljs tilläggsomràdet för den karaktäristiska delen som unionen av dessa identifierade tilläggsomràden. Ett sådant förfarande ger ytterligare förbättrad konsistens och repeterbarhet, eftersom tilläggsomràdet inte kommer att förändra sin form nämnvärt även i. det fall bilden exempelvis har roterats i förhållande till sitt ursprungliga utseende.
Ifall ytterligare förbättrad repeterbarhet önskas är det vidare möjligt att använda ytterligare första respektive andra riktningar. 10 15 535 888 18 Enligt en föredragen utföringsforn1 är bildens en fristående fotografisk bild eller en fotografisk bild som ingår i en filmsekvens. Enligt en annan föredragen utföringsform är bilden en mikroskopisk bild eller en bild som utgör resulta- tet av en mätning av ett objekts såsom en inre struktur, röntgenbild av en patient eller en artikel som skall avsynas för nmterialdefekter, alternativt ett tvärsnitt av ett ob- jekts tredimensionella struktur, såsom en NMR-avbildning av vävnad i en patient.
Ovan har föredragna utföringsformer beskrivits. Emellertid är det uppenbart för fackmannen att många förändringar kan göras av de beskrivna utföringsformerna utan att fràngà uppfinning- ens tanke. Sålunda skall uppfinningen inte vara begränsad till de beskrivna utföringsformerna, utan kan varieras inom ramen för de bifogade kraven.

Claims (12)

15 20 25 30 535 BBB 19 P A. T E N T K R .A. V
1. Förfarande för att identifiera en karaktäristisk del av en bild format i form av en matris uppbyggd av pixlar, t e c k n a t 8) b) C) (1), där bilden (1) bringas att lagras i digitalt k ä n n e - a v följande steg: identifiera ett kantomráde (10) i bilden (1) beståen- de av en sammanhängande mängd kantpixlar som tillsam- (l0) i bilden; identifiera en första riktning (Al) i bilden (1) kantområdet (10): mans bildar ett kantområde för identifiera ett lokalt kantområde (ll) bestående av en sammanhängande mängd pixlar, för vilket lokalt (ll) längs med den första riktningen kantområde bredden i en första breddriktning (Al) maximum förutom ett enda globalt maximum; (A2) saknar lokala identifiera en andra riktning för det lokala kantområdet (l1); identifiera ett tilläggsområde (ll) (l2) kring det lokala (l4a,l4b) är belägna i omedelbar anslutning till en periferiskt (13) och vidare bort från gränspixeln kantområdet som innefattar pixlar som belägen gränspixel (11) hos det lokala kantområdet (13) (A2) som är proportionellt mot det lokala (ll) vid gränspixeln (13): fram till ett avstånd i den andra riktningen (13) kantomràdets från gräns- pixeln bredd i den andra riktningen (A2) identifiera den karaktäristiska delen av bilden (1) så att den innefattar det lokala kantområdet (ll) och (12), delen i digital form på ett lagringsmedium. tilläggsomràdet och lagra den karaktäristiska 10 20 25 30 535 BBB 20
2. Förfarande enligt krav 1, k ä n n e t e c k n a t a v att i steg f), den digitala lagringen av den karaktäristiska delen bringas att innefatta den ursprungliga pixelinformatio- nen från bilden samt information beträffande vilka pixlar i den karaktäristiska delen som utgör kantpixlar.
3. Förfarande enligt krav 1 eller 2, (10) genom ett förfarande som innefattar stegen att: k ä n n e t e c k n a t a-V att i steg a) kantområdet bringas att identifieras i. för alla par pixlar i bilden där den ena pixeln (3a- 3h) befinner sig i. en förutbestämd lokal omgivning (3) till den andra pixeln (4), bestämma värdet hos en jämförelseparameter som utgör skillnaden mellan de två pixlarna beträffande en intensitetsegenskap över en eller flera kanaler; ii. bestämma ett tröskelvärde (dl) (dl) nimumet med avseende på jämförelseparametern som fö- för jämförelseparame- tern, där tröskelvärdet är det första lokala mi- rekommer i en funktion (f) som för varje förekommande värde hos jämförelseparametern anger antalet jämförde pixelpar i bilden som i steg i) uppvisade detta värde för jämförelseparametern, eventu- där funktionen (f) ellt först filtreras för att minska inverkan av brus vid bestämningen av det första lokala minimumet (d1); (10) område kantpixlar i vilket samtliga kantpixlar utgörs iii. identifiera kantområdet son) ett sammanhängande av pixlar för vilka jämförelseparametern vid jämfö- relse med en annan pixel i steg i) befanns vara stör- re än tröskelvärdet (dl).
4. Förfarande enligt krav 3, k ä n n e t e c k n a t a v att stegen i) och ii) bringas att utföras för var och en av en uppsättning vinkelmässigt jämnt fördelade, förutbestämda 10 15 20 25 30 535 BBB 21 riktningar i bilden, så att för varje sådan förutbestämd riktning först i steg i) varje pixel i bilden jämförs med en angränsande pixel längs med riktningen, och sedan i steg ii) ett tröskelvärde bestäms för de i steg i) jämförda pixelpa- ren, och så att ett respektive tröskelvärde erhàlls för varje förutbestämd riktning, och av att kantomràdet (10) i bringas att identifieras som ett sammanhängande område Steg iii) kantpixlar där samtliga kantpixlar utgörs av pixlar för vilka jämförelseparametern vid jämförelse med en annan pixel i steg i) befanns vara större än tröskelvärdet för den andra pixelns riktning för åtminstone en av de förutbestämda riktningarna.
5. Förfarande enligt krav 4, k ä n n e t e c k n a t a v att varje kantpixel bringas att associeras med ett binärt representerat tal, i vilket varje bit motsvarar en viss rikt- (O eller 1) sig till huruvida jämförelseparametern för kantpixeln ifråga ning, och där den respektive bitens värde hänför i den riktning som motsvaras av biten befanns vara större än tröskelvärdet för denna riktning, så att ett binärt tal för alla kantpixlar på detta sätt bringas att lagra information beträffande längs med vilka riktningar kantpixeln ifråga uppfyller kriteriet för att vara en kantpixel.
6. Förfarande enligt något av kraven 3-5, k ä n n e t e c k - n a t a v att intensitetsegenskapen för en pixel är den totala luminansen hos pixeln ifråga.
7. Förfarande enligt krav 6, att bilden (1) k ä n n e t e c k n a t a v i ett första steg som föregår steget a) bring- as att konverteras till en gråskalebild, i vilken den totala luminansen för en pixel utgörs av värdet på pixelns ifråga gràton. 10 15 20 25 30 535 888 22
8. Förfarande enligt något av föregående krav, k ä n n e - t e c k n a t a v att steget e) bringas att utföras för alla (ll) gränsar mot en pixel i bilden (1) (10), delen av bilden (1) bringas att innefatta samtliga identifie- gränspixlar i det lokala kantområdet (A2) sonx i den andra riktningen S0m inte innefattas i kantområdet och av att den karaktäristiska rade tilläggsområden till det lokala kantområdet (ll).
9. Förfarande enligt något av föregående krav, k äran e - t e c k n a t a v att i steget b) två olika första riktning- ar bringas att väljas, och av att i steget c) det lokala kantområdet (ll) bringas att väljas så att det saknar lokala maxima förutom ett respektive globalt maximum i båda de för- sta riktningarna var för sig.
10. Förfarande enligt krav 9, k ä n n e t e c k n a t a v att de två första riktningarna bringas att utgöras av 'två inbördes vinkelräta koordinataxlar i bildmatrisen.
11. ll. Förfarande enligt. något av föregående krav, k ä n n e - t e c k n a t a v att i steget d) två olika andra riktningar bringas att väljas, (12) och av att i steget e) tilläggsområdet bringas att identifieras innefattande pixlar som längs med varje respektive andra riktning är belägna i omedelbar anslutning till en gränspixel hos det lokala kantområdet (11) och vidare bort från gränspixeln fram till ett avstånd i den respektive andra riktningen från gränspixeln som är propor- tionellt mot det lokala kantområdets (ll) bredd i den respek- tive andra riktningen vid gränspixeln.
12. Förfarande enligt krav ll, k ä n n e t e c k n a t a v att de två andra riktningarna bringas att utgöras av två vinkelräta koordinataxlar i bildmatrisen.
SE1150522A 2011-06-08 2011-06-08 Förfarande för att identifiera en karaktäristisk del i en bild SE535888C2 (sv)

Priority Applications (2)

Application Number Priority Date Filing Date Title
SE1150522A SE535888C2 (sv) 2011-06-08 2011-06-08 Förfarande för att identifiera en karaktäristisk del i en bild
PCT/SE2012/050620 WO2012169964A1 (en) 2011-06-08 2012-06-08 Method for identifying a characteristic part of an image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE1150522A SE535888C2 (sv) 2011-06-08 2011-06-08 Förfarande för att identifiera en karaktäristisk del i en bild

Publications (2)

Publication Number Publication Date
SE1150522A1 SE1150522A1 (sv) 2012-12-09
SE535888C2 true SE535888C2 (sv) 2013-02-05

Family

ID=47296294

Family Applications (1)

Application Number Title Priority Date Filing Date
SE1150522A SE535888C2 (sv) 2011-06-08 2011-06-08 Förfarande för att identifiera en karaktäristisk del i en bild

Country Status (2)

Country Link
SE (1) SE535888C2 (sv)
WO (1) WO2012169964A1 (sv)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240228B (zh) * 2013-06-24 2017-10-24 阿里巴巴集团控股有限公司 一种应用于网站的特定图片的检测方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6639593B1 (en) * 1998-07-31 2003-10-28 Adobe Systems, Incorporated Converting bitmap objects to polygons
US7333648B2 (en) * 1999-11-19 2008-02-19 General Electric Company Feature quantification from multidimensional image data
JP2007140684A (ja) * 2005-11-15 2007-06-07 Toshiba Corp 画像処理装置、方法、プログラム
JP4966077B2 (ja) * 2007-04-12 2012-07-04 キヤノン株式会社 画像処理装置及びその制御方法
EP2216749B1 (en) * 2007-12-03 2017-11-08 National University Corporation Hokkaido University Image classification device and image classification program
JP5376906B2 (ja) * 2008-11-11 2013-12-25 パナソニック株式会社 特徴量抽出装置、物体識別装置及び特徴量抽出方法

Also Published As

Publication number Publication date
SE1150522A1 (sv) 2012-12-09
WO2012169964A1 (en) 2012-12-13

Similar Documents

Publication Publication Date Title
Gong et al. Interactive shadow removal and ground truth for variable scene categories
JP4727703B2 (ja) マシンビジョンシステムの作動方法及び境界位置決めシステム
Pape et al. Utilizing machine learning approaches to improve the prediction of leaf counts and individual leaf segmentation of rosette plant images
JP5432714B2 (ja) 構図解析方法、構図解析機能を備えた画像装置、構図解析プログラム及びコンピュータ読み取り可能な記録媒体
CN113077467A (zh) 一种目标物体的边缘缺陷检测方法及装置、存储介质
US8121415B2 (en) Combining feature boundaries
US9177222B2 (en) Edge measurement video tool and interface including automatic parameter set alternatives
CN107945221B (zh) 一种基于rgb-d图像的三维场景特征表达与高精度匹配方法
JP2006053919A (ja) 画像データ分離システム及びその方法
CN109035170B (zh) 基于单网格图分段映射的自适应广角图像校正方法及装置
WO2016062259A1 (zh) 基于透明度的抠图方法和装置
JP2013077296A (ja) 画像処理装置、画像処理方法およびプログラム
CN111833371B (zh) 一种基于pq-mean稀疏测度的图像边缘检测方法
JP6499647B2 (ja) キーポイント識別
CN116523898A (zh) 一种基于三维点云的烟草表型性状提取方法
CN112819842B (zh) 适用于工件质检的工件轮廓曲线拟合方法、装置及介质
SE535888C2 (sv) Förfarande för att identifiera en karaktäristisk del i en bild
WO2013032441A1 (en) Inserting an object into an image
CN113096090B (zh) 带倒角的端面间隙视觉测量方法、装置、设备及存储介质
JP7003291B2 (ja) 補正方法および像データを補正するための装置
SE1150523A2 (sv)
US11776127B2 (en) Computer-implemented method for segmenting measurement data from a measurement of an object
JP4986934B2 (ja) 図形領域抽出装置、図形領域抽出方法、プログラム、及び記録媒体
US20220405936A1 (en) Computer-implemented method for segmenting measurement data from a measurement of an object
SE1050937A1 (sv) Förfarande för att automatiskt klassificera en två-eller högredimensionell bild