NO316198B1 - Fremgangsmåte for segmentering og gjenkjenning av et dokument, s¶rlig en teknisk tegning - Google Patents
Fremgangsmåte for segmentering og gjenkjenning av et dokument, s¶rlig en teknisk tegning Download PDFInfo
- Publication number
- NO316198B1 NO316198B1 NO19996462A NO996462A NO316198B1 NO 316198 B1 NO316198 B1 NO 316198B1 NO 19996462 A NO19996462 A NO 19996462A NO 996462 A NO996462 A NO 996462A NO 316198 B1 NO316198 B1 NO 316198B1
- Authority
- NO
- Norway
- Prior art keywords
- image
- skeleton
- bipoints
- bipoint
- morphological
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 78
- 230000000877 morphologic effect Effects 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 46
- 238000004422 calculation algorithm Methods 0.000 claims description 44
- 238000003909 pattern recognition Methods 0.000 claims description 17
- 238000011282 treatment Methods 0.000 claims description 17
- 230000011218 segmentation Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 12
- 238000002156 mixing Methods 0.000 claims description 11
- 238000012567 pattern recognition method Methods 0.000 claims description 11
- 230000036961 partial effect Effects 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 235000012730 carminic acid Nutrition 0.000 claims description 7
- 239000004106 carminic acid Substances 0.000 claims description 7
- 229940080423 cochineal Drugs 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000003628 erosive effect Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 241000243142 Porifera Species 0.000 claims description 2
- 230000006872 improvement Effects 0.000 claims description 2
- 235000012461 sponges Nutrition 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 claims 2
- 238000009826 distribution Methods 0.000 description 6
- 238000007792 addition Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
- Processing Or Creating Images (AREA)
Description
Oppfinnelsen som beskrives angår en fremgangsmåte for å behandle informasjon inneholdt i et bilde og en fremgangsmåte for mønstergjenkjenning Den finner anvendelse i den digitale behandlingen av et bilde, spesielt i feltet for gjenkjenning av dokumenter, f eks tekniske dokumenter
Gjenkjennelsen av dokumenter og gjenvinning av data på papirdokumenter er for tiden av stor viktighet Det er derfor nødvendig å utvikle strategier for den elektroniske administrasjon av dokumentasjon med sikte på å gjenvinne informasjonen som finnes på disse, muligens inkludert tilegnelsen av dokumenter som eksisterer på et papirmedium eller lignende (traser, mikrofiche, etc )
For tiden er det kjent et antall teknikker for å konvertere tegninger, spesielt tekniske tegninger, som gjør det mulig å forsyne bedrifters dokumentdatabaser Hvor mengden av dokumentasjon som skal konverteres er høy, og ved bruk av manuell teknikk, blir arbeidsmengden uoverkommelig Det dreier seg da om et tilfelle av å oppfange tekstlig og grafisk informasjon fra dokumentet ved bruk av digitalisering I tillegg er kvaliteten på data som genereres slik ikke garantert En slik konvertering krever også ofte underleverandører og reiser problemet med konfidensialitet for dataene i en konkurransesammenheng
Verktøy for den automatiske eller halvautomatiske konvertering av tekniske tegninger er også kjent Disse verktøy, og de tilhørende teknikker, har en parametensering som er vanskelig, kompleks og svært følsom for variasjoner i dokumentrepresentasjonsreglene Dersom parasittiske signaler er tilstede i dokumentet, mister disse verktøyene progressivt sin effektivitet og krever øket manuell bearbeiding
Til slutt er det kjent teknikker for digital behandling av bilder kodet ved hjelp av en bit og av monokromdokumenter Selv om disse teknikkene tillater en viss "rensing" av dokumentet, gjør de det ikke mulig å skille ut den nyttige informasjonen fra støyen når sistnevnte er overveiende Dette er fordi et teknisk dokument ofte er resultat av en overlagnng av et essensielt dokument og tilføyelser som kun indikerer et gitt tema
Videre krever ofte tradisjonelle verktøy for mønstergjenkjenning, spesielt for lange elementer, introduksjon av data av en operatør, f eks de som angår segmenter og deres lengde Disse verktøy er derfor ikke automatiserte, og i tillegg vil denne utvelgelsen for hånd ikke gjøre rede for de primitive (eng pnmitives) som benyttes
I tillegg har disse tradisjonelle mønstergjenkjennelsesverktøy et komplekst menneske/maskin -grensesnitt som krever en opplæring av operatøren som ikke står i forhold til hans jobb Dersom han f eks er en spesialist på dokumentasjon av elektrisitetsdistnbusjon, må han opparbeide seg kompetanser på feltet bildebehandling
Til slutt krever disse verktøy en vesentlig mengde manuelle korreksjoner etter mønstergjenkjenning
Med hensyn til disse teknikker er formålet for oppfinnelsen en fremgangsmåte for å behandle et bilde eller informasjon inneholdt i et bilde, inkludert
- en første behandling for å definere et område av bildet som er av interesse, - utførelsen av en adaptiv terskling (eng thresholding) av dette området av interesse for å oppnå et terskelbilde av dette området av interesse, referert til som et første terskelbilde, - segmentering av terskelbildet for å oppnå et første sett av morfologiske lag av terskelbildet
Formålet med oppfinnelsen er nærmere definert i det vedlagte kravsettet, hvor fremgangsmåten for å benytte bilde eller informasjonsinnhold i et bilde er beskrevet i det selvstendige krav 1, med tilhørende underkrav Likeledes er anordningen for å behandle informasjon inneholdt i et bilde beskrevet i det selvstendige krav 12 med tilhørende underkrav
Morfologiske lag betyr et sett av fasonger som har lignende geometriske karakteristikker (f eks størrelse, overflater, indre eller ytre avgrensninger, forhold mellom lengde og bredde, etc ) Denne lignende karakter kan defineres f eks i tilfellet av en overflate, som en tetthet av piksler pr overflateelement Utførelse av en første behandling for å definere et område av interesse i bildet og deretter utførelse av tersklingen, forbedrer dette andre trinn på en opplagt måte Den første behandlingen kan utføres i seg selv ved terskling (eller multiterskhng), f eks ved å anvende OTSU eller KITTLER-ILLINGWORTH algoritmen En mønstergjenkjenningsbehandlmg kan så anvendes ved hvert av de morfologiske lagene av det første settet av morfologiske lag Det er således mulig å velge, for hvert lag, den mest egnede gjenkjenningsbehandhng
Før utførelse av en mønstergjenkjenningsbehandlmg, tillater fremgangsmåten ifølge oppfinnelsen en første analyse og en utskillelse av de morfologiske lagene fra begynnelsen, på det opprinnelige bildet (som vanligvis vil være et "raster' bilde, dvs et bilde oppnådd ved hjelp av en skannmg av et virkelig bilde) Således har man etter behov, den fordel å ha en utskillelse av de morfologiske lag fra de aller første behandlingstnnn
På grunn av en moroflogisk klassifikasjon av objektet, som tillater en høy grad av egnethet for algoritmer knyttet til fasongene som skal gjenkjennes, garanterer denne fremgangsmåten automatisering av behandlingene assosiert med redusert parameterisenng Resultatet av disse behandlingene er et svært strukturert vektonelt dokument hvis naturlige topologi respekteres
Videre kan en slik fremgangsmåte tilpasses uten modifikasjon av parametensenngen til variasjonene i representasjon av tematikkene eller morfologiske lag Oppfinnelsen gjør det mulig å identifisere disse forskjellige lag å atskille dem, og å beholde kun de lag som er nyttige for
mønstergjenkjenningsbehandlingen
Til slutt er oppfinnelsen vel tilpasset til gjenkjennelsen av nettverkstegninger
(f eks telekommunikasjonsnett, eller vann, gass eller elektrisitetsdistnbusjonsnett), selv om de inneholder bakgrunnskart
Den første behandlingen kan følges av et trinn for å forbedre området av interesse i bildet, f eks ved utvidelse eller erosjon, for å forbedre pikselpopulasjonsutvalget Denne første behandlingen (spatial mask) så vel som videre det første trinn for klassifikasjon i forskjellige morfologiske lag av bildet, gjør det mulig å separere den "nyttige" informasjonen i et dokument fra informasjonen som anses å være kun indikerende
Det er mulig, etter segmentering av terskelbildet, å utføre et trinn av terskling av delene av terskelbildet som svarer til ett av de morfologiske lag, idet bildet som oppnås refereres til som det andre terskelbildet
Informasjonen bestående av gråtonenivåene for terskelbildet, men begrenset av eller til ett av de morfologiske lagene som derfor så selv benyttes som en maske på terskelbildet, gjentas derfor Denne informasjonen unngår så selv en terskling som deretter gjør det mulig å forbedre segmenteringen, idet sistnevnte i sin tur gjør det mulig å oppnå et andre sett av morfologiske lag
En mønstergjenkjenningsbehandlmg kan deretter utføres på hvert av lagene av det andre settet av morfologiske lag
Oppfinnelsen angår også en anordning for implementering av en bildebehandhngsfremgangsmåte som beskrevet over
Oppfinnelsen angår således en anordning for behandling av informasjonen inneholdt i et bilde omfattende
- midler for å utføre en første behandling som gjør det mulig å definere et område av interesse i bildet, - midler for å utføre en adaptiv terskling av nevnte område av interesse, og for å oppnå et terskelbilde, - midler for å segmentere terskelbildet for å oppnå et første sett av morfologiske lag i terskelbildet
1 tillegg kan det skaffes tilveie midler for å utføre en
mønstergjenkjenningsbehandhng på hvert av de morfologiske lagene i det første settet av morfologiske lag
Denne anordningen kan også ha midler for å utføre, etter segmentering av terskelbildet, et trinn for å terskelbehandle delene av terskelbildet som svarer til ett av de morfologiske lag, idet bildet som oppnås refereres til som det andre terskelbildet
Et annet formål for oppfinnelsen er en fremgangsmåte for gjenkjenning av fasonger i et bilde inkludert
- en skjelettering av bildet for å etablere et skjelett av elementene i bildet,
- en polygonahsering som benytter pikslene i skjelettet av bildet for å generere segmenter eller bipunkter, - en strukturering av bipunktene for å samle sammen de som hører til samme fasong i bildet
Bildet som mønstergjenkjenningsmetoden benyttes på, kan være fra ett av settene av morfologiske lag definert over
Skjelettermgen av bildet kan omfatte
en søking etter graden av mnvendighet (eng interiority) av hver piksel,
- en søking etter pikslene med høyest grad av mnvendighet Polygonaliseringstnnnet kan etterfølges av en behandling for å bestemme fasongene som skal gjenkjennes på nivået for multiple punkter Denne behandlingen kan omfatte bruken av første og andre skjelettsponngsalgontmer - den første algoritmen resulterer i en linjesponng som favoriserer bifurkasjon til venstre i tilfellet av en multippel node, slik at det genereres en første skjelettsporing, - den andre algoritmen resulterer i en linjesponng som favoriserer en bifurkasjon til høyre i tilfellet av multippel node, slik at det genereres en andre skjelettsporing
Et trinn for å blande dataene som resulterer av anvendelsen av de to skjelettsponngsalgontmene kan også anvendes for å eliminere den redundante informasjonen som inneholdes i de to skjelettsponngene Denne blandingen av data kan inkludere f eks bestemmelsen av segmentene, eller bipunktene, av en av skjelettsporingene som er inkludert, delvis eller fullstendig, i den andre Strukturen til bipunktene kan inkludere følgende trinn
a) etablering av en enkelt liste av bipunkter ordnet etter økende lengde,
b) valg av den største av bipunktene i denne listen,
c) søking etter delvis inkludering med de andre bipunktene,
d) testing ved polygonahsering når et delvis inkludert bipunkt finnes i det
foregående trinn,
e) dersom resultatet av trinn d) er positivt, sletting av bipunktene og erstatting av de blandede bipunktene, og retur til c), f) fortsette trinn c) dersom resultatet av d) inkluderer mer enn to punkter, g) dersom trinn d) ikke gir flere bipunkter, lagring av siste bipunkt fra trinn d), sletting av dette bipunkt fra listen av bipunkter opprettet i a), og retur til a)
Ifølge en annen utførelse inkluderer mønstergjenkjenningsmetoden ifølge
oppfinnelsen også et trinn for å samle de tilstøtende bipunktene i samme segment, idet samlingen utføres ved søking, trinn for trinn, fysisk kontinuitet, i den umiddelbare nærhet av hvert punkt av et bipunkt som skal utstrekkes ved kontinuitet
Der bildet som mønstergjenkjenningsmetoden anvendes på, representerer tekniske premisser eller kamre plassert ved enden av seksjoner eller buer kan mønstergjenkjenningsmetoden også inkludere et trinn for å søke tillukkinger i bildet, et trinn for å filtrere tillukkingene og et trinn for å søke antallet av ender av seksjoner plassert i nærheten hvor et kammer ble detektert
Til slutt er det et ytterligere formål for oppfinnelsen å skaffe tilveie en anordning for å implementere en fremgangsmåte for mønstergjenkjenning ifølge oppfinnelsen slik den er beskrevet over
En slik anordning har
- midler for å utføre en skjelettering av bildet for å etablere et skjelett av bildet, - midler for å utføre en polygonahsering ved bruk av pikslene til skjelettet av bildet, - midler for strukturering av bipunktene og innsamling av de som hører til samme fasong i bildet Anordningen kan også ha midler for utføring av første og andre skjelettsporingsalgontmer - første algoritme utfører en linjesponng som favoriserer bifurkasjon til venstre i tilfellet av multiple noder og danner en første skjelettsporing, - andre algoritme som utfører en linjesponng som favoriserer en bifurkasjon til høyre i tilfellet av en multippel node slik at det genereres en andre skjelettsporing Midlene for utføring av første og andre skjelettsporingsalgontmer kan også gjøre det mulig å blande dataene som resulterer fra utførelsen av de to skjelettsporingsalgontmene for å eliminere redundant informasjon inneholdt i de to skjelettsporingene Denne anordningen kan også ha midler for å samle sammen de tilstøtende bipunktene i ett og samme segment I alle tilfelle vil oppfinnelsens karakteristikker og fordeler fremstå klarere i lys av følgende beskrivelse Denne beskrivelsen relaterer seg til utførelseseksemplene gitt som forklaring og ikke-begrensende, med henvisning til de vedlagte tegninger, hvor Fig IA og IB viser skjematisk trinnene for en fremgangsmåte ifølge oppfinnelsen
Fig 2 er et eksempel på et dokument som skal gjenkjennes
Fig 3 er et histogram for dokumentet i fig 2
Fig 4 viser det bildet som oppnås etter maskering av dokumentet
Fig 5 er et histogram av bildet vist i fig 4
Fig 6 viser bildet som oppnås etter adaptiv terskling av bildet vist i fig 4
Fig 7A-7C viser tre morfologiske lag oppnådd ved segmentering av bildet vist i fig 6
Fig 8 viser en anordning for implementering av foreliggende oppfinnelse
Fig 9 er et eksempel på et resultat av polygonahsering
Fig 10A og 10B er eksempler på et resultat av en skjelettspormgsalgoritme, henholdsvis trigonometrisk og anti-tngonometrisk
Fig 11 illustrerer prinsippet med inklusjon
Fig 12 viser mulige konfigurasjoner mellom bipunkter
Fig 13 viser en nettverksopptegning etter endelig blanding av bipunktene
Fig 14 viser en opptegning som oppnås ved strukturering av bipunktene
Fig 15 er et eksempel på kamre på en skannet original tegning
Fig 16 viser et eksempel på tillukking
Fig IA og IB viser trinn av en fremgangsmåte som kan implementeres i overensstemmelse med oppfinnelsen
Først av alt skannes (eller samples, trinn 1-2) et teknisk dokument 2 (fig IA),
f eks i et 8-bit format, og ved høy oppløsning, f eks høyere enn 400 dpi Dette trinnet leverer således et kildebilde 4
Med dette kildebildet vil det utføres en første behandling 1 -4 for å definere et område av bildet som er av interesse Dette første trinn (også vist til som et globalt tilnærmingstnnn) kan implementeres f eks ved terskling, hvor terskelnivået eller nivåene som anvendes bestemmes av en tersklingsalgontme fra histogrammet over gråtonemvåene i kildebildet Denne terskhngen gjør det mulig å definere forskjellige klasser (minst to) av gråtonenivåer i histogrammet over bildet F eks korresponderer minst en av disse klassene med bakgrunnen av bildet og beholdes ikke modusen for bakgrunnen reduseres derfor til 0 i kildebildet Fra denne operasjonen kan det derfor utledes en maske 6 som gjør det mulig å definere et område av interesse i bildet
Det maskerte bildet 8 oppnås ved å anvende (1-6) masken på kildebildet 4 Dette maskerte bildet inneholder derfor ikke lenger mer enn elementene av dokumentet som velges som signifikante
En lokal behandling (lokal approksimasjon) av bildet utføres deretter det maskerte bildet vil gjennomgå en adaptiv terskling (trinn 1-8) ved bruk av en tersklingsalgontme Et såkalt "terskelbehandlet" bilde 10 oppnås på denne måten Terskhngsoperasjonen som utføres på det maskerte bildet er mye mer effektiv eller mye mer presis enn den som ville ha vært utført direkte på kildebildet 4 Spesielt er det mulig å oppnå, ved hjelp av denne metoden, den differensiering av enkelte detaljer i bildet som ville ha blitt blandet sammen dersom terskling hadde blitt utført direkte på kildebildet
En operasjon for å trekke ut mengdene av beslektede piksler utføres så (fig IB, trinn 1-10) På denne måten produseres bilder 12 hvor hvert bilde representerer lignende mengder eller fasonger av piksler
Disse fasongene vil så sorteres (trinn 1-12) etter morfologiske kriterier Operasjonen bestående av "merking" av fasongene og klassifisering av dem i overensstemmelse med morfologiske kriterier refereres til som en segmenteringsoperasjon På denne måten oppnås en definisjon av fysiske "lag" 14-1, 14-2, 14-3, Sortering av fasongene ifølge deres morfologi heretter gjør det mulig å utsette dem for spesialiserte gjenkjenningsalgoritmer, tilpasset til hver av fasongene
Hver av de forskjellige fysiske lagene som defineres slik, kan i sm tur vurderes som en maske for kildebildet 4 Å bruke disse maskene på kildebildet gjør det mulig å oppnå små bilder 16-1, 16-2, 16-3, til formatet av kildebildet (her 8 bits) Hvert fysiske lag gjør det derfor mulig å finne informasjonen som korresponderer til det når det gjelder gråtonenivå, i kildebildet Hvert av bildene 16-1, 16-2 16-3, kan i sin tur utsettes for behandling ved terskling for å forbedre segmenteringen av bildet Så snart de nye tersklene har blitt bestemt for ett av bildene 16-i, kan en ny syklus påbegynnes med dette bildet 16-1 dette bildet kan resegmenteres av størrelsen til de nært beslektede maskene Det er således mulig å separere fasongene (eller tegnene) som på den tekniske tegningen 2 ikke var forbundet eller var separate, men som så ut til å være forbundet i kildebildet 4
Fig 2 er et karakteristisk eksempel på typen dokument som skal gjenkjennes Elementene som skal trekkes ut har blitt markert, de som utleder ruten av et telefonnett Slik er det funnet tegn 20, nettverksseksjoner 22, kamre 24 (kabelkamre), en bygmngsterminal 26, konsentrasjonspunktene (CP) 28 (bokser som setter en bruker i stand til å forbindes med et nettverk) eller hjørner av plottinger 27 En undersøkelse av gråtonenivåene i dette bildet viser en sterk bakgrunnsstøy på grunn av kvaliteten til mediet og den høye grad av forbundethet for elementene som skal trekkes ut med bakgrunnen til den kartografiske tegningen Beskrivelsen av histogrammet av dette bildet, vist i fig 3, viser disse karakteristikker
Dette histogrammet inkluderer essensielt tre områder
- en første region 30 (eller "high mode"), som kun inneholder bakgrunnen av bildet,
en sentral region 32 som i hovedsak inneholder matrikkelinformasjon,
- en tredje region 34 (eller "low mode"), som i hovedsak inneholder informasjonen knyttet til telefonnettet
I en første approksimasjon av bildet, referert til som den globale approksimasjon, bestemmes det interessante området som omfatter nettet For dette formål utføres en adaptiv flerterskling, dette er et tilfelle av flertersklmg i tre klasser, basert på OTSU-algoritmen De vertikale aksene indikerer terskelverdiene Sj, S2 beregnet ved algoritmen fra histogrammet
En farge kan tildeles pikslene for hver av de tre klassene og den romlige distribusjonen av disse klassene (fig 4) kan bestemmes
Det vil legges merke til at nettverket passer fullstendig innenfor den klassen som er avbildet i grått i bildet Imidlertid forblir støyen svært høy og det er ikke mulig å presentere denne klassen direkte til et gjenkjenningssystem På den annen side svarer denne klassen til den rommelige utstrekning av det opprinnelige bildet som inneholder nettverket
Ved hjelp av den globale approksimasjonen av bildet har et område av interesse svarende til den rommelige utstrekning i hvilken nettverket passer fullstendig, derfor blitt isolert Dette området er resultatet av en flerterskling basert på å søke de karakteristiske moduser av histogrammet Med utgangspunkt i det prinsipp at nettverket er inkludert i denne klassen, produseres en maskering av det opprinnelige bildet for å eliminere pikslene i bakgrunnen Det er ved å velge klassene at den romlige masken velges
Bildet som oppnås er en "divisjon" av bildet i gråtonenivåer og hvis histogram er gitt i fig 5 Atskillelsen av de forskjellige moduser forbedres vesentlig der, fordi eksklusjonen av populasjonen av bakgrunnspiksler i bildet Fra nå av benytter behandlingskjeden ikke lenger mer enn de signifikante elementene i dokumentet Flere terskhngsalgontmer har blitt benyttet (OTSU, KITTLER-ILLINGWORTH og en spektral klassifisering, ISODATA, beskrevet i programvaren IMAGINE fra ERDAS) Resultatene som oppnås har vist at returen til kildebildet for å bruke bare en signifikant populasjon av piksler, klart optimaliserer funksjonen ngen av de forskjellige tersklinger
1 tillegg er det i utførelsen av masken, mulig å benytte en konvensjonell matematisk morfologioperatorer som er lettere å produsere (ekspansjon eller erosjon av bildet), for å forbedre populasjonsseleksjonen
Til slutt har det blitt konstruert et område av interesse hvor en segmentering av fasongene i bildet (fig 6) kan utføres
Det kan ses i denne figuren at hoveddelen av informasjonen i den kartografiske bakgrunnen har blitt eliminert, dette er tilfellet spesielt med skravenngen av bygninger som er sterkt forstyrrende elementer i vektorisenng Denne informasjonen er ikke nødvendigvis tatt siden den utskilles ved valget av klasse i det terskelbehandlede bildet
Dette terskelbehandlede bildet vil deretter segmenteres
Segmentenngsoperasjonen består av å merke de fasongene som er tilstede og å klassifisere dem elter morfologiske kriterier Hver av de merkede fasongene utgjør en beslektet mengde av piksler I vår prototype består denne segmenteringen av å bestemme tre klasser av fasonger
- tre store lineære elementer som i hovedsak inneholder lederne (hovedkabelseksjoner i nettverket) og kabelkamrene (fig 7A), - fasonger som svarer til terminalutstyr i nettverket (CP, hvis symbologi her er representert av triangler eller rektangler) og til tegnene (fig 7B), - fasonger hvis morfologi ikke faller innenfor noen av de ovennevnte kritener(fig 7C)
Disse tre lagene utgjør en fysisk modell av dokumentet Sortering av fasongene ifølge deres morfologi vil gjøre det mulig å utsette dem for spesialiserte gjenkjenningsalgoritmer tilpasset hver av fasongene
Hvert lag inneholder flertallet av elementer som skal gjenkjennes Heretter vil oppmerksomhet rettes, gjennom gjenkjenningen av fasonger (se under), mot studien av lag, spesielt de som inneholder seksjoner av hovedkabler (fig 7A)
De tre lagene kan anses å være et sett av masker på objekter av samme klasse Det er derfor mulig å bruke disse masker for å finne informasjonen i form av gråtonenivåer angående en enkelt klasse Gråtonenivåbildet generert fra forskjellige masker kan således terskelbehandles på nytt for å forbedre segmenteringen av bildet Dette er fordi ved å redusere antallet av typer informasjon i bildet vil bestemmelsen av automatiske terskler bli mer passende
Så snart de nye terskler har blitt bestemt begynner en ny syklus med dette nye bildet Dette nye bildet resegmenteres av størrelsen av de nært beslektede masser Resultatene er fullstendig tilfredsstillende Flertallet av sammenkoblede tegn har blitt koblet fra hverandre De eneste som fortsatt er forbundet er også forbundet med det originale bildet De kan derfor ikke segmenteres ved dette nivået av behandling Til slutt presenteres hvert av lagene som slik oppnås, til mønstergjenkjennmgsprosessen ved å tillate bruken av algoritmer som er best egnet til den fysiske tematikken som er foreslått
Tersklingsalgontmene som benyttes kan f eks implementere OTSU-metoden eller den for KITTLER-ILLINGWORTH
OTSU-metoden ("A threshold selection method from grey level histograms", IEEE Trans Syst Man Cyber, 1, s 62-66, 1979) assimilerer problemet å bestemme en passende terskel T for binærisenngen av bildet, til problemet å bedre klassifisere pikslene i to subgrupper Cit og C2r
En av disse klassene inneholder alltid bakgrunnen og de andre objektene i bildet Histogrammet av bildet for et gråtonenivå t, gjør det mulig å beregne de statistiske data sett tidligere a pi ion sannsynlighet for å tilhøre gjennomsnittelig gråtonenivå og varians for hver klasse C| og C2 OTSU utledet fra dette følgende ligninger
- gjennomsnittelig gråtonenivå for hele bildet
- varians for hele bildet
med
or2w(t)= 2wJ(t).o- 2j {tj referert til som intra-klasse varians,
3 = 1.2
»2B(t)= T>j(t}.(9]( t)-o )2 r
_i 2 referert tu som inter-klasse varians
OTSU introduserer følgende disknminenngsknterium, avhengig av t, som vil måtte maksimeres
Dette forholdet representerer hvor passende valget av terskel t for binærisering av bilder er Dette er fordi uansett hva den totale variansen av bildet er, resulterer en optimal terskel 1 en maksimal verdi for variansen mellom klassen som korresponderer med bakgrunnen og det som korresponderer til objektene a<2>B(t)
Derfor, dersom t er optimal, og o variansen til hele bildet, ikke er avhengig av t, når r|(t) sitt maksimum Evalueringen av r|(t) krever forhåndsberegning av cr<2>B(t) og av c^T Istedenfor å bruke r|(t) for å søke etter den optimale terskelen, er det mulig å bruke det faktum at a<2>T=a<2>w(t)+a<2>B(t) er en konstant for enhver t
Imidlertid for T, optimal terskel, er det en maksimum a<2>B(t), dvs en minimum o<2>w(t)
Som et resultat av dette innebærer klassifikasjon ifølge denne første fremgangsmåten til å finne den grensen som på den ene side maksimerer inter-klasse variansen for å atskille klassene og på den annen side minimalisere intra-klassevariansen for å gruppere sammen gråtonenivåene i hver klasse rundt sin middelverdi
I metoden til KITTLER og ILLINGWORTH (Kittler et al, "Minimum error thresholding", Pattern Recognition, 25(9), s 963-973, 1992) er den opprinnelige hypotese at populasjonene Cj og C2 assosiert med bakgrunnene og objekt følger gaussiske distribusjoner
La T være den gaussiske modellendnngsterskel gitt a priori, og la h(g) være histogrammet av bildet, det er da mulig å definere parametrene for hver populasjon Ci(i=l,2)
La h(g/i,T) være den tilnærmede lov for h(g), betinget av populasjonen 1 og terskelen T For et gråtonenivå g 1 [0, L], er den betingede sannsynlighet definert for g erstattet 1 bildet av en korrekt verdi etter binænsering når T er valgt ved noterer
Imidlertid, ifølge hypotesen
Ved å kombinere (4) og (5) utledes Det eneste problem er med den ikke-konstante delen gitt av£•' (g, T) er en indikator for den korrekte klassifikasjonen av g Jo mindre den er,, jo bedre vil T være for klassifikasjonen av denne pikselen For å evaluere tersklingskvahteten oppnådd for en gitt verdi av T, definerer KITTLER & ILLINGWORTH følgende kriterium
Den optimale terskel T<*> for binærisering av bildet vil bh gitt av J(T<*>)=minTJ(T)
Man oppnår også
Ved å starte fra (9) og ta hensyn til (1), (2) og (5), når man frem til følgende formulering av KITTLER & ILLINGWORTH kriteriene
For å bestemme den optimale terskelen er det tilstrekkelig å finne T slik at T(T) er minimal Disse metodene kan utvides til multiterskling Dette er av interesse i spesielle tilfeller, spesielt i det beskrevet over Dette er fordi histogrammene gitt som et eksempel har to modi, og en bred udefinert region mellom de to Det later derfor til å være legitimt å ønske å søke tre klasser, det vil si en for hver modus og en siste for den udefinerte regionen, hvorfra behovet for å finne to terskler kommer Dette er en parameter valgt a priori Å velge mer enn to terskler kan også være fordelaktig i enkelte tilfeller I metoden beskrevet over skannes først et teknisk dokument ved hjelp av et egnet apparat av skannertype På denne måten får man originale bilder som kan lagres i form av digitale bilder Bildebehandlingsmetoden ifølge oppfinnelsen kan implementeres ved hjelp av en Unix eller Windows arbeidsstasjon Denne stasjonen kan arbeide uavhengig av skanneren hvis bilder ble lagret tidligere Databehandhngsprogrammet ifølge oppfinnelsen kan lagres på magnetbånd eller på en eller flere disketter Programmene er utviklet under Unix i ANSI-kompatibelt C språk og kan overføres til forskjellige UNIX/Motif arbeidsstasjoner eller en mikrodatamaskin av PC-type under Windows NT4 Arbeidsstasjonen kan også omfatte en fremvisningsenhet Datamaskinsystemet som benyttes har en beregningsenhet med en mikroprosessor og alle de elektroniske komponentene som er nødvendig for å behandle bildet Fig 8 er en forenklet representasjon, i form av et blokkdiagram, av en av komponentene til den datamaskinen som benyttes En mikroprosessor 39 er forbundet, via en buss 40, til RAM minner 41 for lagring av data og programinstruksjoner, og el ROM minne 42 for lagring av instruksjonene i det produserte behandlingsprogrammet En datamaskin som har disse elementene kan også ha andre perifere elementer slik som skanneren eller fremvisningsenheten nevnt over, eller en mus, modem, etc Data angående bilder som skal behandles eller angående programmer som skal anvendes kan overføres til RAM minnet 41 fra et lager eller minnemedium slik som disk, CD ROM, magnetooptiske disker, harddisker etc Et tastatur 38 gjør det mulig å skrive inn instruksjoner til apparatet I generelle termer har et apparat eller en enhet ifølge oppfinnelsen for behandling av informasjon inneholdt i et bilde - lagringsmidler for lagring av instruksjoner for behandling av informasjonen som inneholdes i bildet,
- en prosessor forbundet med lagringsmidlene som utfører instruksjonene
<*> første behandling for å definere et område av interesse i bildet,
<*> utføre en adaptiv terskling av området av interesse for å oppnå et terskelbehandlet bilde av dette området av interesse, referert til som første terskelbehandlet bilde <*> segmentering av det terskelbehandlede bilde for å oppnå et første sett av morfologiske lag i det terskelbehandlede bildet
Andre instruksjoner kan være knyttet til andre trinn eller andre utførelsei av fremgangsmåten ifølge oppfinnelsen som beskrevet over
Enheten eller systemet beskrevet over benytter et program for en datamaskin, lagret på et medium som kan leses av en datamaskin og omfattende instruksjonene som setter en datamaskin i stand til å implementere fremgangsmåten for å behandle informasjon inneholdt i et bilde ifølge oppfinnelsen, dvs
- utføre en første behandling for å definere et område av interesse i bildet,
- utføre en adaptiv terskling av dette området av interesse for å finne et terskelbehandlet bilde av dette området av interesse, referert til som første terskelbehandlet bilde, - segmentering av det terskelbehandlede bildet for å oppnå et første sett av morfologiske lag av det terskelbehandlede bildet
Det kan også finnes andre instruksjoner som svarer til forskjellige utførelser eller spesielle trinn i informasjonsbehandhngsmetoden som beskrevet over Fremgangsmåten ifølge oppfinnelsen kan også implementeres ifølge en "komponentversjon" eller "hard versjon"
Skeletteringsmetoden (vektorisenngsalgoritmer) supplementerer arbeidet til B Taconet (TAC90) beskrevet i "Two skeletonisation algonthms", Transactions of the RAE Colloquium, Le Havrem BIGRE 68, s 68-76. 1990 En av fordelene med denne algoritmen er dens relative ufølsomhet for støy I tillegg er denne algoritmen effektiv når det gjelder behandlingstiden Merkingen av elementene som en funksjon av deres grad av mnvendighet i linjen er også en ikke uvesentlig fordel hvis nytteverdi vil beskrives litt senere Dette er fordi skjelettet denne metoden resulterer i faktisk er et standardisert bilde hvis piksler er merket ifølge deres grad av mnvendighet i fasongen Målingen av tykkelsen av linjene er således direkte tilgjengelig ved hjelp av denne merkingen
Denne algoritmen inkluderer et trinn for å søke etter graden av mnvendighet for hvert piksel, og derettei trinn for å søke etter pikslene med høyest grad av mnvendighet
1 Søking etter graden av mnvendighet for hver piksel
Det første trinnet består i å merke pikslene ifølge deres grad av mnvendighet i fasongen Det brytes ned de to suksessive passeringer over bildet Hver passering svarer til anvendelsen av en L-formet maske som gjør det mulig å merke pikslene ifølge deres grad av mnvendighet Den første L-formede masken anvendes på bildet ved å passere over det fra topp til bunn Hvert piksel P av objektet merkes ifølge følgende maske (første maske for konstruksjonen av bildet av gradene av mnvendighet)
P merkes så ifølge sine omgivelser i overensstemmelse med følgende regel P0=lavest (Pl+1, P2+1, P3+1, P4+1) Den andre skanmngen utføres fra bunnen til toppen av bildet Masken som anvendes er som følger (annen maske for konstruksjonen av bildet av gradene av mnvendighet) P meikes så i henhold til sine omgivelser i overensstemmelse med følgende regel Pi=lavest(P5+l, P6+1, P7+1, P8+1) Graden av mnvendighet som antas for hver piksel P er den største verdien av Po og P, (høyest (Po, Pi)) Piksler med den høyeste grad av mnvendighet svarer til punktene på skjelettet Skjelettet oppnås ved å søke etter alle disse punktene med maksimum merking 2 Dannelse av kjernebilde søking etter pikslene med høyest grad av mnvendighet Dette andre trinnet består i å trekke ut de signifikante punktene av skjelettet, konstruere et "kjerne" bilde fra bildet av gradene av mnvendighet Kjernebildet er faktisk et bilde hvor tykkelsen av linjene er maksimalt lik to Det beregnes ved bruk av tolv 3x3 masker De tolv maskene oppnås ved å rotere de tre maskene illustrert over rundt den sentrale piksel merket P (P=nåværende punkt, C=konturpunkt, X=punkt i bakgrunnen eller indre masse) For hver iterasjon er de behandlede pikslene de hvis grad av mnvendighet er hk graden av den nåværende iterasjonen såvel som de med lavere grad som ble beholdt ved de tidligere trinn Forbedringen av kjernebildet i overensstemmelse med de omgivende forhold uttrykket ved de 16 maskene som oppnås ved å rotere de andre maskene (under) gjør det til slutt mulig å oppnå skjelettet
Siden prosessen å skjelettifisere ikke gir mulighet for noen strukturering av informasjonen gjennomføres så en overvåkning av skjelettet som vil gjøre det mulig å utføre denne struktureringen
Fremgangsmåten for fasonggjenkjenmng ifølge oppfinnelsen vil forklares ved anvendelse på lineære objekter (et nettverk og dets forskjellige seksjoner) Den kan implementeres på andre typer objekter
Fra skjelettet som er funnet over, gjør en skjelettsporing det mulig å konstruere en graf som svarer til de lineære objektene som er behandlet Gjenkjenningen av nettverket resulterer fra denne rekonstruksjonen Ved slutten av denne behandlingen struktureres informasjonen i form av en graf som forbinder alle nodene av bildet
For å gjennomføre rekonstruksjonen av nettverket er det tjenelig et polygonalisenngsverktøy et slikt verktøy gjør det mulig å generere segmenter fra punkter Et eksempel på et slikt verktøy er beskrevet i doktorgradavhandl ingen fra universitetet i Rouen (1994) av J M Ogier med tittelen "Contribution to the automatic analysis of cartographic documents interpretation of cadastral data"
Det er også tilgjengelig lister av punkter med forskjellige strukturer Dette er fordi dersom det er et flertall punkter på skjelettet, kan det være forskjellige muligheter for å gjennomføre behandlingen På denne måten dannes to lister av sponngsresultater, og dataene blandes for å oppnå en sporing av den linjen som best oppfyller topologien til fasongen som skal rekonstrueres Det er også tilgjengelig informasjon angående tykkelsen til de originale linjene det er faktisk et tilfelle at informasjonen (graden av mnvendighet) som resulterer fra algoritmen beskrevet over
Til slutt er bildet som har blitt bearbeidet, dvs her det morfologiske lag det gjelder (resultatet av segmentenngsoperasjonen) og det originale bildet Det morfologiske laget det gjelder vil i hovedsak være det som svarer til elementene eller objektene, her lineære
I tillegg, når det angår applikasjonen eller fagområdet det gjelder (gjenkjenning av en telekommunikasjons-nettegning, eller av et vann- eller gassdistribusjonsnett, eller av et elektrisk distribusjonsnett), er det regler gitt av industrien selv Spesielt forbinder telekommunikasjonskablene, eller seksjonene, kabelkamre, vannrør forbinder vanndistnbusjonspunkter, elektriske linjer forbinder forgreningsbokser, etc Generelt forbinder nettverkets buer nodene i dette nettverket Ved nodene i nettverket kan det være "kamre"
Innen telekommunikasjonsfeltet sier modellen til France Telecom nettverket at en arteneseksjon er avgrenset av to, og bare to, infrastrukturnoder En infrastrukturnode kan være et kammer, en enkelt node eller en støtte ved en fasade 1 tillegg kan et ubegrenset antall arteneseksjoner starte fra en infrastrukturnode I mer generelle termer gir reglene for organisering av dataene innen ett tema, av en hvilken som helst art, informasjon som er nyttig for gjenkjenningen av et dokument Denne modelleringen er knyttet til den industri som førte til produksjon av dette dokumentet Det er derfor mulig å definere, i en gjenkjenningskjede, "industnonenterte moduler" som er vel avgrensede for å gjøre det mulig, basert på antagelsen om en gjenbruk av metoden, å modifisere kun deler av systemet og å bevare dets generiske deler
Rekonstruksjonen av nettverket gjør det mulig å produsere linjer, eller buer, fra skjelettet (alle pikslene i skjelettet) Produksjon av disse linjene eller buene, er et resultat av anvendelse av industrireglene og dataene for skjelettet Rekonstruksjonen av objekter benytter forskjellige informasjonsprimitive, f eks
- modellen av dataene, som inneholder informasjon knyttet til fagområdet,
- segmenteringsprimitivene (bipunktene) som utgjør basiselementene for objektene som skal finnes, - informasjon som utledes fra objekter gjenkjent i andre morfologiske lag
("kabelkamre' i tilfellet av telekommunikasjon)
Polygonahsering gjør det mulig å produsere buer (faktisk bipunkter, eller segmenter)
Et polygonahsert forløp svarende til det eksempel som allerede er gitt over (i tilknytning til fig 2-7) er gitt i fig 9 Alle artikulasjonspunktene (eller reversenngspunktene), såvel som start- og endepunktene for segmentene, er representert ved punkter
I denne figuren kan det ses blant segmentene, de som svarer til elementer av nettverket 50, 52 og de som svarer til kantene til plottingene 54, 56, 58
En stor del av elementene til nettverket består av lange lineære objekter Plottkantene som står igjen har imidlertid ikke insignifikante lengder
Disse lineære elementene utgjør en første primitiv som det er mulig å stole på for å produsere en skisse av nettverket bestående av store segmenter, og i hvilken det eneste som gjenstår vil være å identifisere de manglende elementene Slike manglende elementer er f eks merket i fig 9 ved henvisningstallene 60, 62
En andre primitiv er basert på tykkelsen til linjene Den utgjør en primitiv som grovt skiller mellom nettverket og plottingskantene
For dette formål er det definert en terskel En terskel på gjennomsnittet av graden av mnvendighet i bildet later ikke til å gi noe generisk resultat Ved dette stadium forblir dens definisjon manuell
Ved flertallet av punkter i skjelettet kan det være forskjellige muligheter for å gjennomføre denne behandlingen Slik produseres det to lister av sponngsresultater, og dataene blandes for å oppnå en linjesponng som best oppfyller topologien til fasongen som skal rekonstrueres
For rekonstruksjonen benyttes derfor to skjelettsporingsalgontmer, hvor hver av dem genererer en liste av objekter
Den første (eller respektive den andre) algoritmen utfører en linjesponng, som favoriserer, dersom det er noen tvil, en bifurkasjon til venstre (eller respektive til høyre) i tilfellet av en multippel node
For å plukke opp eksemplet fra fig 9 resulterer anvendelsen av disse to algoritmene i den trigonometriske og den anti-trigonometnske sporingen vist i fig 10A og 10B
Det er derfor dannet to lister av segmenter som strukturerer informasjonen slik at nettverket representeres i disse på en relativt kontinuerlig måte For å utnytte disse to listene maksimalt, og for å finne hele kontinuiteten for en seksjon mellom to nodei, blandes dataene, som avslører de lange rette objekter, siden de hver vil være representert av to relativt fjerntliggende punkter
Det er også mulig å velge disse data, dvs bipunktene, for å segmentere informasjonen som er tilstede i de to listene
1 tillegg, dersom en utvelgelse gjøres på de lange objektene, er det større sjanse for å beholde kun nettverkselementer av "seksjonstype", og ekskludere deler av plottekantene og nesten alle vimpler Dette er fordi terskelen benyttet for å utføre polygonalisenngen er tykkelsen til den originale linjen Således har plottekantene, som er tynnere linjer, større sjanser for å bh delt opp av polygonalisenngen Ikke desto mindre blir også elementene som utgjør kamrene også ekskludert ved denne utvelgelsen
Terskelen fra hvilken det er mulig å bruke betegnelsen "langt objekt" er ikke presist bestemt Det er mulig å benytte en terskel på omtrent 120 piksler, som svarer til en lengde på papirtegmngen på omtrent 0,6 mm (oppløsning på 400 dpi) Behandlingene er lite følsomme for svingningene av denne terskelen, og derfor synes en manuell bestemmelse egnet På de få testene som er utført har denne terskelen alltid virket egnet uten å ha måttet modifiseres
Blandingen av data gjør det mulig å eliminere redundansen som eksisterer i hver liste utgitt fra de to forskjellige sporingene samtidig som den gjør det mulig å komplettere informasjonen om de lange objektene i én liste i forhold til den andre Ved slutten av denne behandlingen vil det gjenstå ikke mer enn én liste redusert til den maksimale utstrekning, noe som reetablerer hoveddelen av seksjonen av nettverket
Et problem som reises av denne blandingen er at segmentene som utgår fra polygonalisenngen ikke overlapper fullstendig Dette problemet skyldes det faktum at startnoden og sluttnoden er forskjellige for de to sporingene Derfor vil ikke de nøyaktig samme veiene oppnås etter polygonahsering De er ikke desto mindre svært nær hverandre siden de begge hører til det morfologiske lag av seksjonene av nettverket
Det forsøkes derfor å sortere og forbinde sammen disse to segmentene for å oppnå en beskrivelse av alle seksjonene av nettverket som er så fullstendig som mulig Sorteringen består i å eliminere, fra én liste, bipunktene som er inkludert i den andre
For dette formål defineres et inklusjonskriterium som gjør det mulig å bestemme om et bipunkt er nært et annet
For å definere inklusjonen utføres to trinn Det første trinn (fig 11) består av avgrensningen av en region innenfor hvilken et kildebipunkt 70 er plassert En region 72 som er rektangelet som omslutter bipunktet avgrenses så, dette kan forstørres i høyde og bredde, f eks med to ganger graden av mnvendighet for segmentet fra hvilket det kommer Således søkes etter bipunkter 74, 76 som ville bh inkludert i denne regionen Dette er det første inklusjonskriteriet Det andre inklusjonskriteriet består i å måle, for hvert tidligere valgte bipunkt 74, avstanden d som eksisterer med den rette linje dannet av kildebipunktet 70 Distansen som beregnes er den for den ortogonale projeksjonen av et punkt på en rett linje for de to punktene som utgjør hvert bipunkt Dersom denne distansen er mindre enn en terskel for de to punktene til et bipunkt, anses det så at det er total inklusjon Terskelen er f eks hk graden av mnvendighet som gjør det mulig å oppnå svært gode resultater
Det defineres også en delvis inklusjon, som består i å detektere et enkelt punkt av et bipunkt inkludert i et kildebipunkt
De ovennevnte behandlingene vil ikke utføres ved lesing på bildet, men direkte fra informasjonen som kommer fra listene
Fra elementene som er definert på denne måten, elimineres den redundante informasjonen For dette formål velges en kildeliste tilfeldig og med denne kan inklusjonskriteriet, definert over, evalueres mot den andre listen Ethvert bipunkt inkludert fullstendig i et kildebipunkt kan elimineres
Etter denne behandlingen reverseres rollene til disse to listene og prosessen startes fra begynnelsen
Alt som gjenstår deretter er delvis inklusjon mellom bipunktene i de to listene De delvis inkluderte bipunktene kan altså blandes
Det er forskjellige typer av mulige konfigurasjoner, to hovedtilfeller 80, 82 er avbildet i fig 12 Henvisningstall 80 indikerer et tilfelle av ikke-kohneære bipunkter og henvisningstall 82 et tilfelle av kohneære bipunkter Ifølge denne figuren er det fordelaktig å blande to kohneære bipunkter til et enkelt bipunkt Dette er fordi de to bipunktene da uttrykker samme seksjonsdel Denne delvise redundansen kan derfor elimineres Imidlertid blandes ikke to lkke-kohneære segmenter
En av vanskelighetene ligger i å bestemme kolmeanteten Dette er fordi det er mulig å finne to segmenter svært nær hverandre, og nesten kohneære, uten at de faktisk er det
Denne vanskeligheten overvinnes ved bruken av polygonahseringsalgoritme slik som den allerede implementert tidligere Dette er fordi dersom koordiantene for de to bipunktene som skal blandes kjøres gjennom polygonahseringsfunksjonen, med graden av mnvendighet som en maksimal feil, vil resultatet bli et enkelt bipunkt dersom de to startbipunktene faktisk er kohneære og kommer fra samme seksjon For å utføre den siste blandeoperasjonen arbeides det ikke lenger på to distinkte lister, men snarere på en enkelt liste som inneholder de to tidligere listene Dette gjør det mulig å optimalisere valget av bipunkter Dette er fordi arbeid på to lister svarer til å søke kontinuiteten til et bipunkt til en liste i den andre listen, som ikke nødvendigvis er den mest veloverveide løsningen
Således er det, ved å følge et bipunkt, mulig å finne to andre bipunktkandidater (én for hver liste) Det beste valget anses å være det lengste bipunktet Det er derfor tilstrekkelig å lage bare en liste og å ordne den etter økende lengde På denne måten vil rekkefølgen av testing av bipunktene etablere den ønskede prioritet Derfor plasseres alle bipunktene i ett enkelt segment (kildeliste), og deretter klassifiseres de etter økende lengde
Et første bipunkt (det største) velges og delvis inklusjon med de andre bipunktene søkes etter Når et bipunkt delvis inkludert i det største bipunktet finnes, testes de to bipunktene ved polygonahsering
Denne fasen benytter kunnskapen om rekkefølgen punktene følger etter hverandre for å utgjøre et enkelt bipunkt Dette er fordi polygonaliseringsalgontmen benytter kunnskapen om de to endepunktene til settet av bipunkter som skal behandles Det søkes derfor å kjenne posisjonen til de forskjellige punktene med hensyn til hverandre • dersom resultatet av denne behandlingen er et bipunkt, har de to bipunktene blitt korrekt blandet I lys av dette slettes de to bipunktene i kildelisten Et nytt delvis inklusjonssøk initieres så fra det nye bipunktet dannet på denne måten, og syklusen starter på nytt, • dersom resultatet av polygonalisenngen inkluderer mer enn to punkter, er samhørigheten mellom de to bipunktene ikke i konformitet Det delvis inklusjonssøket fortsetter så
Når delvis inklusjonssøket ikke lenger gir nye bipunkter, plasseres bipunktet som resulterer av denne behandlingen i en resultatliste (lagring i minnet) Dersom ingen modifikasjon er blitt gjort med dette bipunktet i løpet av behandlingen, slettes det fia kildelisten
Det største av bipunktene som gjenstår i kildelisten brukes deretter for å starte behandlingen fra begynnelsen
Deretter gjenstår i resultatsegmentet, bare de bipunktene som utgjør skissen av det behandlede nettverket Et eksempel på et resultat fra listen av figurer 10A og 10B, er gitt i fig 13 Diskontinuiteter gjenstår fortsatt i nettverket I tillegg har kamrene åpenbart forsvunnet
Det etterfølgende trinn er struktureringen av bipunktene For dette formål organiseres bipunktene slik at de som følger etter hverandre i samme segment grupperes sammen Alle segmentene som utgjøres på denne måten vil plasseres i en liste av segmenter
Formålet med denne struktureringen er å samle sammen, i samme segment, de sammenhengende bipunktene som hører til de samme seksjonene Denne organiseringen vil muliggjøre analysen av de manglende delene I tillegg er denne struktureringen nær den som er nødvendig ved utgangen av disse behandlingene Dette er fordi en seksjon er en separat enhet Hver seksjon må derfor fortrinnsvis gjenkjennes individuelt, derfor denne struktureringen For å utføre denne grupperingen er det mulig å fortsette med nærhetsanalyse
Således søkes det etter fysisk kontinuitet i svært tett nærhet til hvert punkt som utgjør bipunktet som skal utvides Dette søket utføres trinn for trinn til en mulig rekke ikke lenger finnes Alle bipunktene detektert på denne måten lagres i samme segment Rekkefølgen bipunktene er lagret i gjør det mulig å bevare den logiske sammenheng av punkter fra en ende av seksjonen til den andre, hvor endene er de viktigste punktene å lokalisere
Regruppenngsbehandlinger utføres også direkte fra listen uten å returnere til bildet Disse behandlingene benytter deteksjonen av inklusjon som allerede beskrevet Når et punkt er detektert vurderes selvfølgelig bipunktet fra hvilket det kommer i sin helhet Den relative posisjonen til dette bipunktet er kjent med hensyn på kildebipunktet
Dette tillates av en klassifikasjon av hvert punkt som utgjør bipunktene Således har det første elementet i et bipunkt alltid en mindre X-akse enn sin etterfølger Dersom den er hk utføres klassifikasjonen på Y-aksen av punktene under vurdering Dette gjør det mulig å kjenne til den relative posisjonen av de fire punktene som behandles Inklinasjonen til hvert bipunkt (økende eller avtagende) tas også hensyn til Inklusjonsfunksjonen sender så tilbake en indikator som spesifiserer rekkefølgen i hvilket punktene må lagres
Lagnngsrekkefølgen kan forstyrres av nærvær av en bifurkasjon Således er det ikke lenger en, men to bipunkter eller flere som kan detekteres nært et punkt Det eksisterer deretter ikke lenger en mulig rekkefølge med den strukturering som er benyttet En strukturering med form av et tre løser dette problemet I fig 14 avgrenses bipunktene som er gruppert sammen innenfor et segment av kryss Resultatene er tilfredsstillende
Bipunktene som oppnås etter dette trinnet kommer fra flere behandlinger skelettenngen og deretter skjelettsponngen, polygonalisenngen, blanding og noen ganger også polygonahsering nok en gang Selv om parametnseringen av prosessen bevarer gyldigheten av resultatene, kan verifisering være nyttig Denne verifiseringen er basert på en retur til det morfologiske laget av seksjonene Ligningene for de rette linjene som passerer gjennom hvert bipunkt beregnes Deretter kjøres laget eller det opprinnelige bildet gjennom ved hjelp av disse ligningene, idet hver merking (graden av mnvendighet) av hvert punkt plassert mellom de to endene av et bipunkt noteres Dette gjør det mulig å etablere en merkingsprosentverdi for veien, og derfor å verifisere prosentandelen av bipunkter som hører til laget
Følgelig verifiseres det hvorvidt hvert av punktene mellom to ender av et bipunkt av en ikke-null grad av mnvendighet i det opprinnelige bildet og derfor hører til en fasong i bildet eller til et moroflogisk lag
Denne behandlingen gjennomføres som en indikasjon, men kunne gjøre det mulig å stille spørsmål ved bipunktet for en mulig resentrenng på laget Det er vanskelig å trekke konklusjoner om forskjellen mellom 90 % gyldighet og 100 % gyldighet Siden kvaliteten på laget ikke er perfekt, finnes derfor ofte punkter på en seksjon som ikke har noen merking En utvidelse av dette laget løser dette problemet Ikke desto mindre kan en gyldighet på mindre enn 80 % se tivilsom ut
De verdiene som er funnet hittil er svært ofte opp mot 100 % og i ethvert tilfelle større enn 90 %
Prinsippet for plassering av kamrene må fortsatt forklares Startpunket er prinsippet at det er unødvendig å søke å reetablere kamrene med informasjonen som kommer fra vektoriseringen Dette er fordi skelettenngen og behandlingene som går forut foi denne, har gjort denne informasjonen ganske inkonsistent med den opprinnelige representasjonen Representasjonen på de opprinnelige tegningene er også noen ganger forvrengt Således er et kammer normalt representert av et rektangel Den lille størrelse av disse elementer på en tegning lager til å være grunnen til at disse ofte eggformede representasjoner slik det kan ses i fig 15, hvor et kammer er angitt med henvisningstall 90
En første plassering av kamrene utføres ved å søke tillukking på det morfologiske laget av seksjonene Denne operasjonen utføres ved å detektere nært beslektede masser For hver tillukking leveres koordinatene Ul det omsluttende rektangel og den nedre perimeter Fasongen 16 representerer forskjellige typer tillukkinger noen (92) representerer et kammer og andre (94, 96, 98, 100) gjør ikke det For å utføre en første filtrering på tillukkingene ble det bestemt to pnmitiver av samme type som de som gjorde det muhg å separere tegningene i overensstemmelse med tre lag De er basert på den indre perimeter av tillukkingene Det har således blitt mulig å bestemme, på tegningssampler, en minimumsperimeter på 30 piksler og en maksimum perimeter på 150 piksler for en oppløsning på 400 dpi Skalering av disse parametrene kan utføres ved hjelp av en enkel proporsjonalitetsregel
Denne første filtreringen er ikke tilstrekkelig for å velge kun de tillukkingene som utgår fra et kammer En tredje primitiv benyttes derfor for å validere hypotesen for et kammer Denne tredje primitive basert på antallet segmentender som er posisjonert i nærheten av der kammeret ble detektert Således er et kammer, i det store flertall av tilfeller, forbundet med minst to seksjoner Segmentendene (og derfor seksjonene) søkes etter, f eks i et kvadrat hvis senter er senteret for den detekterte tillukkingen, og med en side lik f eks 30 piksler Denne terskelen kommer fra eksperimenteringen Den fungerer korrekt med de tegningene som er tilgjengelige En altfor stor terskel kan føre til falsk deteksjon En altfor liten terskel kan føre til ikke-deteksjon Skalering av denne terskelen gjøres ved proporsjonalitet ifølge skalaen for tegningen som skal behandles Validering av de ovenfor nevnte tre pnmitiver gir opphav til validering av deteksjonen av kammeret
Kammeret representeres så ved en standardisert kvadrat med en 10 piksel side Ikke desto mindre vil de originale koordinatene til kammeret lagres i en vektor som inneholder koordinatene til det øvre venstre punkt av rektangelet som omgir tillukkingen, og vil ha lengden og høyden til dette rektangelet Denne tilnærmingen gjør det mulig for kamrene å posisjoneres og gjenkjennes nøyaktig Mønstergjenkjenningsmetoden eller algoritmen som er beskrevet kan benyttes ved hjelp av en enhet som allerede beskrevet over i tilknytning til fig 8
Programinstruksjonene som svarer til mønstergjenkjenningsmetoden beskrevet over kan lagres istedenfor, eller i tillegg til instruksjonene for
informasjonsbehandlingsmetoden inneholdt i et bilde beskrevet ved begynnelsen av denne beskrivelsen
En enhet for implementering av mønstergjenkjenningsmetoden ifølge oppfinnelsen har derfor
- lagringsmidler for lagring av bildeinformasjon,
- en prosessor koblet til lagringsmidlene som utfører instruksjonene skjelettenng av bildet for å etablere et skjelett av bildet,
polygonahsering ved bruk av pikslene i skjelettet av bildet for å generere bipunktsegmenter,
<*> strukturering av bipunktene for å samle sammen de som hører til samme fasong av bildet
Andre instruksjoner kan utføres av prosessoren, og som svarer til spesielle utførelser av mønstergjenkjenningsmetoden ifølge oppfinnelsen som beskrevet over
En enhet eller et system ifølge oppfinnelsen benytter et program for en datamaskin lagret på et lagringsmedium som kan leses av en datamaskin og som inneholder instruksjoner som gjør datamaskinen i stand til å utføre mønstergjenkjenningsmetoden ifølge oppfinnelsen, og spesielt de tre trinnene som nettopp er angitt over Det kan også inneholde andre instruksjoner for å utføre andre trinn av mønstergjenkjenningsmetoden som beskrevet i foreliggende søknad
Claims (45)
1 Fremgangsmåte for å behandle informasjon inneholdt i et bilde (4), karakterisert ved- en første behandling (1-4), for å definere et område av interesse i bildet (8), - utføring av en adaptiv terskling (1-8) av dette området av interesse for å oppnå et terskelbehandlet bilde (10) av dette området av interesse, referert til som det første terskelbehandlede bilde, - segmentering (1-12) av det terskelbehandlede bildet for å oppnå et første sett av morfologiske lag (14-1, 14-2, 14-3, ) av det terskelbehandlede bildet
2 Fremgangsmåte ifølge krav 1, karakterisert ved at en mønstergjenkjennin<g>sbehandlmg også utføres på hvert av de moroflogiske lagene av det første sett av morfologiske lag
3 Fremgangsmåte ifølge krav 1 eller 2, karakterisert ved at den første behandlingen (1-4) som gjør det mulig å definere et område av interesse i bildet, utføres ved terskling eller multiterskhng
4 Fremgangsmåte ifølge krav 1, karakterisert ved at trinnene for terskling eller multiterskhng benytter OTSU eller KITTLER-ILLINGWORTH algoritmen
5 Fremgangsmåte ifølge et av kravene 1-4, karakterisert ved at den første behandlingen etterfølges av et trinn for å forbedre området av interesse i bildet
6 Fremgangsmåte ifølge krav 5, karakterisert ved at forbedringstnnnet utføres ved utvidelse eller erosjon av det område av interesse som er definert i bildet
7 Fremgangsmåte ifølge et av kravene 1-6, karakterisert ved at den omfatter, etter segmentering av det terskelbehandlede bildet utførelse av et trinn for å terskelbehandle de delene av det terskelbehandlede bildet som svarer til ett av de morfologiske lagene, idet bildet som oppnås refereres til som det andre terskelbehandlede bildet (16-1, 16-2, 16-3, )
8 Fremgangsmåte ifølge krav 7, karakterisert ved at det andre terskelbehandlede bildet segmenteres for å oppnå et andre sett av morfologiske lag
9 Fremgangsmåte ifølge krav 8, karakterisert ved at en mønstergjenkjenningsbehandlmg utføres på hvert av lagene av det andre settet av morfologiske lag
10 Fremgangsmåte ifølge et av kravene 1-9, karakterisert ved at hvert morfologiske lag forbinder nært beslektede masser av piksler i bildet
11 Fremgangsmåte ifølge et av kravene 1-10, karakterisert ved at bildet er en teknisk tegning
12 Anordning for behandling av informasjon som inneholdes i et bilde, karakterisert ved at det omfatter - første midler for å utføre en første behandling (1-4), for å definere et område av interesse i bildet, - andre midler for å utføre en adaptiv terskling (1-8) av nevnte område av interesse, og for å oppnå et terskelbehandlet bilde (10), - tredje midler (1-12) for å segmentere det terskelbehandlede bildet for å oppnå et første sett av morfologiske lag (14-1, 14-2, 14-3, ) av det terskelbehandlede bildet
13 Anordning ifølge krav 12, karakterisert ved at det også har midler for å utføre en mønstergjenkjenningsbehandlmg på hvert av de morfologiske lag av det første settet av morfologiske lag
14 Anordning ifølge krav 12 eller 13, karakterisert ved at de første midler er behandlingsmidler for terskling eller multiterskhng
15 Anordning ifølge krav 14, karakterisert ved at de første midler benytter OTSU eller KITTLER-ILLINGWORTH algoritmen
16 Anordning ifølge et av kravene 12-15, karakterisert ved at den også har midler for å forbedre området av interesse av bildet
17 Anordning ifølge krav 16, karakterisert ved midlene for å forbedre området av interesse benytter matematiske morfologioperatorer
18 Anordning ifølge et av kravene 12-17, karakterisert ved at den også har midler for å utføre, etter segmentering av det terskelbehandlede bildet, et trinn for terskling av delene av det terskelbehandlede bildet som svarer til et av de morfologiske lag, idet bildet som oppnås refereres til som det andre terskelbehandlede bildet (16-1, 16-2, 16-3, )
19 Anordning ifølge krav 18, karakterisert ved at den også har midler for å utføre en segmentering av det andre terskelbehandlede bildet for å oppnå et andre sett av morfologiske lag
20 Anordning ifølge krav 19, karakterisert ved at den også har midler for å utføre en mønstergjenkjenningsbehandlmg av lagene av det andre settet av morfologiske lag
21 Fremgangsmåte ifølge et av kravene 2 eller 9, karakterisert ved at mønstergjenkjenningsbehandlingen som utføres inkluderer - en skjelettering av hvert morfologiske lag for å etablere et skjelett av elementer i dette laget, - en polygonahsering som benytter pikslene i skjelettet av dette laget for å generere segmenter eller bipunkter, - en strukturering av bipunktene for å samle sammen de som hører til en og samme fasong av det morfologiske lag
22 Fremgangsmåte ifølge krav 21, karakterisert ved at skjelettenngen omfatter - en søking etter graden av mnvendighet for hvert piksel, - en søking etter pikslene med høyest grad av mnvendighet
23 Fremgangsmåte ifølge et av kravene 21 eller 22, karakterisert ved at polygonalisenngen etterfølges av en behandling for å bestemme fasongene som skal gjenkjennes ved nivået til de multiple punktene
24 Fremgangsmåte ifølge krav 23, karakterisert ved at behandlingen for å bestemme fasongene som skal gjenkjennes ved nivået for de multiple punktene inkluderer bruken av første og andre skjelettsporingsalgontmer - den første algoritmen utfører en linjesponng som favoriserer en bifurkasjon til venstre i tilfellet av en multippel node slik at det genereres en første skjelettsporing, - den andre algoritmen utfører en linjesponng som favoriserer en bifurkasjon til høyre i tilfellet av en multippel node, slik at det genereres en andre skjelettsporing
25 Fremgangsmåte ifølge krav 24, karakterisert ved at den også inkluderer et trinn for å blande data som resulterer fra anvendelsen av to skjelettsporingsalgontmer for å eliminere den redundante informasjonen som inneholdes i de to skjelettsporingene
26 Fremgangsmåte ifølge krav 25, karakterisert ved at blandingen av data inkluderer bestemmelsen at segmentene eller bipunktene, av en av skjelettsponngene som er inkludert delvis eller fullstendig, i den andre
27 Fremgangsmåte ifølge krav 26, karakterisert ved at den totale (eller delvise) inklusjon av et bipunkt, referert til som bipunktet som skal testes, i et bipunkt, referert til som kildebipunktet, bestemmes som en funksjon av følgende kriterier - nærværet av bipunktet som skal testes (74, 76), eller av en av dets ender, i et forhåndsbestemt område (72) rundt kildebipunktet (70), - en distanse mellom bipunktet som skal testes (74, 76) og kildebipunktet (70) mindre enn en gitt terskel
28 Fremgangsmåte ifølge krav 27, karakterisert ved at terskelen er Uk graden av mnvendighet for kildebipunktet
29 Fremgangsmåte ifølge et av kravene 26-28, karakterisert ved at den også omfatter et trinn for å eliminere bipunktene i en av skjelettsporingene som er fullstendig inkludert i den andre og vice versa
30 Fremgangsmåte ifølge et av kravene 26-29, karakterisert ved at den også omfatter et trinn for å blande bipunktene (80, 82) for hvert av de to listene som er delvis inkludert i den andre listen
31 Fremgangsmåte ifølge krav 30, karakterisert ved at den inkluderer blandingen av de kohneære bipunktene (82) til et enkelt bipunkt
32 Fremgangsmåte ifølge krav 31, karakterisert ved at kohneanteten for de to bipunktene bestemmes ved å anvende en polygonaliseringsalgontme på disse to bipunktene, idet graden av mnvendighet for ett av de to bipunktene regnes som feilmargin
33 Fremgangsmåte ifølge et av kravene 26-32, karakterisert ved at den også omfatter a) etableringen av en enkelt liste av bipunkter ordnet etter økende lengde, b) valget av det største av bipunktene i denne siste listen, c) søking etter delvis inklusjon i de andre bipunktene, d) når et delvis inkludert bipunkt finnes i det foregående trinnet, testing av de to bipunktene ved polygonahsering, e) dersom resultatet av trinn d) er positivt, slettingen av bipunktene, erstatning ved et blandet bipunkt, og retur til c), f) fortsettelsen av trinn c), dersom resultatet i d) har flere enn to punkter, g) dersom trinn d) gir ingen nye bipunkter, lagringen av det siste bipunktet avgitt fra trinn d), slettingen av dette bipunktet fra listen av bipunkter etablert ved a) og retur til a)
34 Fremgangsmåte ifølge et av kravene 21-33,, karakterisert ved at det også inkluderer et trinn for å samle sammen de sammenhengende bipunktene i ett og samme segment
35 Fremgangsmåte ifølge krav 34, karakterisert ved at sammensamhngen av de sammenhengende bipunktene utføres ved å søke, trinn for trinn, etter fysisk kontinuitet i det svært nære området rundt hvert punkt av et bipunkt som skal utvides ved sammenheng
36 Fremgangsmåte ifølge et av kravene 34 eller 35, karakterisert ved sammensamhngen av de sammenhengende bipunktene i samme segment ved bruk av en inklusjonsalgoritme
37 Fremgangsmåte ifølge et av kravene 34-36, karakterisert ved at bipunktene struktureres i form av trær ved bifurkasjonspunktene
38 Fremgangsmåte ifølge krav 22, karakterisert ved at den også omfatter et verifiseringstrinn som består av å verifisere hvorvidt hvert punkt i bipunktet er inneholdt i ett av elementene i laget
39 Fremgangsmåte ifølge et av kravene 21-37, karakterisert ved at laget som utsettes for mønstergjenkjenningsmetoden har kamre plassert ved endene av seksjonene, idet denne metoden også inkluderer et trinn for å søke tillukkinger (92, 94, 96, 98, 100) i laget, et trinn for å filtrere tillukkingen, og et trinn for å søke antallet av seksjonsender plassert i området hvor et kammer (90) ble detektert
40 Fremgangsmåte ifølge krav 39, karakterisert ved at det søkes etter tillukkingene ved deteksjon av nært beslektede masser
41 Fremgangsmåte ifølge et av kravene 39 eller 40, karakterisert ved at filtreringen utføres som en funksjon av den indre perimeter av hver tillukking
42 Anordning ifølge krav 13 eller 20, karakterisert ved at midlene for å anvende en mønstergjenkjenningsmetode eller behandling inkluderer - første midler for å utføre en skjelettering av hvert morfologiske lag for å etablere et skjelett for dette laget, - andre midler for å utføre en polygonahsering fra pikslene i skjelettet i dette laget, - tredje midler for å strukturere bipunktene og å samle sammen de som hører til en og samme fasong i dette laget
43 Anordning ifølge krav 42, karakterisert ved at den har midler for å gjennomføre første og andre skjelettsporingsalgontmer - den første algoritmen utfører en linjesponng som favoriserer en bifurkasjon til venstre i tilfellet av en multippel node, slik at det genereres en første skjelettsporing, - den andre algoritmen utfører en linjesponng som favoriserer en bifurkasjon til høyre i tilfellet av multippel node, slik at det genereres en andre skjelettsporing
44 Anordning ifølge krav 43, karakterisert ved at midlene for å utføre første og andre skjelettsporingsalgontmer også gjør det muhg å blande data som resulterer fra utførelsen av de to skjelettsponngsalgontmene for å eliminere den redundante informasjonen inneholdt i de to skjelettsporingene
45 Anordning ifølge et av kravene 42 eller 43, karakterisert ved at det har midler for å samle sammen de sammenhengende bipunktene i ett og samme segment
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9805825A FR2778476B1 (fr) | 1998-05-07 | 1998-05-07 | Procede de segmentation et de reconnaissance d'un document, notamment d'un plan technique |
PCT/FR1999/001076 WO1999057677A1 (fr) | 1998-05-07 | 1999-05-06 | Procede de segmentation et de reconnaissance d'un document, notamment d'un plan technique |
Publications (3)
Publication Number | Publication Date |
---|---|
NO996462D0 NO996462D0 (no) | 1999-12-23 |
NO996462L NO996462L (no) | 2000-03-07 |
NO316198B1 true NO316198B1 (no) | 2003-12-22 |
Family
ID=9526151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO19996462A NO316198B1 (no) | 1998-05-07 | 1999-12-23 | Fremgangsmåte for segmentering og gjenkjenning av et dokument, s¶rlig en teknisk tegning |
Country Status (8)
Country | Link |
---|---|
US (1) | US6901168B1 (no) |
EP (1) | EP0993650B1 (no) |
JP (1) | JP4521485B2 (no) |
CA (1) | CA2296000C (no) |
DE (1) | DE69904903T2 (no) |
FR (1) | FR2778476B1 (no) |
NO (1) | NO316198B1 (no) |
WO (1) | WO1999057677A1 (no) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10154875B4 (de) * | 2001-11-08 | 2007-06-21 | Siemens Corp. Research, Inc. | Verfahren zur Identifizierung grafischer Objekte in großen technischen Zeichnungen |
ITVA20020060A1 (it) * | 2002-11-22 | 2004-05-23 | St Microelectronics Srl | Metodo di analisi di immagini rilevate da un micro-array |
US9547799B2 (en) * | 2008-07-17 | 2017-01-17 | Sharp Laboratories Of America, Inc. | Methods and systems for content-boundary detection |
US8873864B2 (en) * | 2009-12-16 | 2014-10-28 | Sharp Laboratories Of America, Inc. | Methods and systems for automatic content-boundary detection |
US10096110B2 (en) | 2014-08-22 | 2018-10-09 | University Of South Florida | System and method for automated stereology of cancer |
EP4064217A1 (en) | 2021-03-27 | 2022-09-28 | Tata Consultancy Services Limited | Extracting region of interest from scanned images and determining an associated image type thereof |
CN117173455B (zh) * | 2023-08-11 | 2024-02-13 | 兰州交通大学 | 一种基于骨架线的地图建筑物形状分类方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5274714A (en) * | 1990-06-04 | 1993-12-28 | Neuristics, Inc. | Method and apparatus for determining and organizing feature vectors for neural network recognition |
US5142589A (en) * | 1990-12-21 | 1992-08-25 | Environmental Research Institute Of Michigan | Method for repairing images for optical character recognition performing different repair operations based on measured image characteristics |
CA2078423C (en) * | 1991-11-19 | 1997-01-14 | Per-Kristian Halvorsen | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information |
-
1998
- 1998-05-07 FR FR9805825A patent/FR2778476B1/fr not_active Expired - Fee Related
-
1999
- 1999-05-06 EP EP99917002A patent/EP0993650B1/fr not_active Expired - Lifetime
- 1999-05-06 US US09/462,259 patent/US6901168B1/en not_active Expired - Fee Related
- 1999-05-06 CA CA002296000A patent/CA2296000C/fr not_active Expired - Fee Related
- 1999-05-06 WO PCT/FR1999/001076 patent/WO1999057677A1/fr active IP Right Grant
- 1999-05-06 DE DE69904903T patent/DE69904903T2/de not_active Expired - Lifetime
- 1999-05-06 JP JP55501799A patent/JP4521485B2/ja not_active Expired - Fee Related
- 1999-12-23 NO NO19996462A patent/NO316198B1/no unknown
Also Published As
Publication number | Publication date |
---|---|
EP0993650A1 (fr) | 2000-04-19 |
NO996462D0 (no) | 1999-12-23 |
FR2778476A1 (fr) | 1999-11-12 |
WO1999057677A1 (fr) | 1999-11-11 |
JP4521485B2 (ja) | 2010-08-11 |
DE69904903D1 (de) | 2003-02-20 |
JP2002509632A (ja) | 2002-03-26 |
CA2296000A1 (fr) | 1999-11-11 |
DE69904903T2 (de) | 2003-11-06 |
US6901168B1 (en) | 2005-05-31 |
CA2296000C (fr) | 2007-04-24 |
EP0993650B1 (fr) | 2003-01-15 |
FR2778476B1 (fr) | 2000-06-16 |
NO996462L (no) | 2000-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105180890B (zh) | 融合激光点云和数字影像的岩体结构面产状测量方法 | |
CN111626146B (zh) | 一种基于模板匹配的合并单元格表格分割识别方法 | |
Wenyin et al. | From raster to vectors: extracting visual information from line drawings | |
US7660441B2 (en) | System and method for fusing geospatial data | |
CN103295199B (zh) | 古壁画的裂缝智能修复辅助系统 | |
Brown et al. | Handprinted symbol recognition system | |
JP2005523530A (ja) | 取り込み画像データから文字列を識別して抜出するシステムおよび方法 | |
CN109522646B (zh) | 岩体交叉裂隙图像自动分离及其矢量化表达方法 | |
US20090169113A1 (en) | Automatic and Semi-Automatic Detection of Planar Shapes from 2D Images | |
Oka et al. | Vectorization of contour lines from scanned topographic maps | |
NO316198B1 (no) | Fremgangsmåte for segmentering og gjenkjenning av et dokument, s¶rlig en teknisk tegning | |
US20020006224A1 (en) | Computer automated process for vectorization of raster images | |
Karathanassi et al. | A thinning-based method for recognizing and extracting peri-urban road networks from SPOT panchromatic images | |
CN114549511A (zh) | 基于图像的植物根系表型分析方法、系统及装置 | |
JP3679680B2 (ja) | 細胞系譜抽出方法 | |
Li | Intelligent restoration of ancient murals based on discrete differential algorithm | |
Yamamoto et al. | Symbol recognition and surface reconstruction from topographic map by parallel method | |
JP2004094427A (ja) | 帳票画像処理装置及び該装置を実現するためのプログラム | |
CN114998096B (zh) | 一种路面图像中裂缝比例检测方法及系统 | |
CN116343070B (zh) | 一种航测影像地物要素的智能解译方法 | |
Qu et al. | Eliminating lining seams in tunnel concrete crack images via line Segments’ translation and expansion | |
Peled et al. | Toward automatic updating of the Israeli National GIS-Phase II | |
Cao et al. | A fast thinning algorithm of square hmong character handwriting using template matching mechanism | |
Ito et al. | Interactive region segmentation for manga | |
Gold | A topological approach to processing scanned urban maps |