FI96646C

FI96646C - Kuvien prosessointilaite

Info

Publication number: FI96646C
Application number: FI883431A
Authority: FI
Inventors: Anthony Richard Leaning
Original assignee: British Telecomm
Priority date: 1986-11-20
Filing date: 1988-07-20
Publication date: 1996-07-25
Also published as: IN170294B; IE65473B1; DK389588A; NO174986B; CA1292320C; DE3751684D1; HK110897A; CN1015951B; ES2081799T3; GB8627787D0; NO883209D0; AU8234287A; NO883209L; DK389588D0; EP0272794B1; EP0272794A1; IN173777B; AU607450B2; PT86190A; DE3751684T2

Description

96646

Kuvien prosessointilaite - Bildprocessanordning

Esillä olevan keksinnön kohteena on kuvien prosessointi ja erityisesti, mutta ei yksinomaan tällaisen prosessoinnin soveltaminen videosignaalien koodaukseen.

Eräänä esimerkkinä voidaan mainita videokooderit, joissa käytetään ruutujen välistä ehdollista täydennyskoodausta liikkuvien kuvien siirtämiseksi. Tällöin otetaan kuvaelementtiarvojen ja ennustettujen arvojen {eli edellisestä ruudusta saadut arvot) välinen ero. Erot viedään kynnyspiiriin, joka tuottaa kullekin eroarvolle merkin "1” tai "0" osoittamaan onko kynnysarvo ylitetty vai ei, jolloin muodostuu "liikematriisi". Vai ne elemettiarvot (tai mikäli se on edullista elementtierot), joissa on "1" liikematriisin vastaavassa elementissä, koodataan siirrettäviksi.

Vastaanottajassa vastaanotettuja tietoja käytetään saattamaan ajan tasalle paikalliseen ruutuvarastoon varastoitu kuva. Jotta vastaanotin kykenee dekoodaamaan oikealla tavalla vastaanotetut tiedot, lähetyksen pitää liittää mukaan sivutietoja, jotka osoittavat sen, mitä kertoimet on lähetetty. Liikematriisin kaikkien bittien lähettäminen muodostaa huomattavan kuormituk- .. sen ja tästä syystä on ehdotettu sitä, että kuva jaettaisiin • · 8x8 lohkoon ja kukin 8x8 liikematriisi "vektorikvantisoi-taisiin" vertaamalla sitä lähimpään kuvaan esimerkiksi 32 kuvan sarjasta, jolloin tämä voidaan identifioida vastaanottimelle käyttämällä vain viittä lähetettyä bittiä. Tähän mennessä tämä vertailu on suoritettu käyttämällä kuvien korrelointimene-telmää; tämä on laskennallisesti ylimitoitettua ja jopa suuri-nopeuksisella prosessoinnilla on 32 kuvaa maksimimäärä, joka normaalisti voidaan käsitellä reaaliajassa.

2 96646

Tekniikkaa voidaan myös soveltaa niin kutsuttuihin hybridi-videokoodereihin, joissa käytetään muuntokoodauksen ja ruutujen välisen ehdollisen täydennyskoodauksen yhdistelmää. Muuntokoo-dauksessa käytetään kaksiulotteista muunnosta, kuten Hadamard-tai erillistä cosiinimuunnosta (DCT) kuvaelementtien (esim.

8x8) lohkoihin vastaavan muuntokertoimien matriisin muodostamiseksi (koko ruudun muuntaminen kerrallaan on liian hidasta reaaliaikaprosessoinnin kannalta). Tällöin liikematriisi perustuu nykyisen ruudun matriisin ja edeltävän ruudun matriisin kertoimien välisiin eroihin.

Tämän menettelytavan eräässä muunnosmuodossa ruutujen välisten erojen ottaminen voi edeltää transformaatiota eikä tapahtua sen jälkeen.

Keksinnön eräänä tarkoituksena on saada aikaan menetelmä kaksiulotteista kuvaa edustavan arvosarjan luokittelemiseksi, jolloin muodostetaan näiden arvojen painotettu summa, moduli x, jossa x on pienempi kokonaisluku kuin 2P, jolloin p on sarjassa olevien arvojen lukumäärä ja jolloin tätä summaa käytetään pääsyosoitteena muistiin, jossa on x paikkaa ja jokainen niistä sisältää luokan tunnistussanan.

Periaatteessa kyseiset arvot voivat olla kuvan kuhunkin eleli menttiin liittyvä arvo, mutta summausta voidaan yksinkertaistaa ja painotuskertoimien ja modulin derivointia helpottaa muodostamalla ensin sarja arvoja, joista kukin edustaa tiettyä määrää elementtejä. Keksinnön edullisessa suoritusmuodossa siis derivoidaan sarja arvoja identifioimalla kutakin kuvan elementtien useaa ryhmää varten se näistä ennalta määrätyistä ryhmistä, joista kuhunkin liittyy koodi, jota tämä ryhmä lähimmin muistuttaa ennalta määrätyn kriteerin mukaisesti, jolloin tällä tavoin identifioidut ryhmiin liittyvät koodit muodostavat arvosarjan.

3 96646

Ryhmät voivat olla suorakulmaisen kuvamatriisin rivejä (tai sarakkeita), vaikka muutkin valinnat ovat mahdollisia.

Keksinnön erästä suoritusmuotoa selvitetään seuraavaksi esimerkin muodossa viittaamalla oheisiin piirustuksiin, joissa: kuvio 1 on lohkokaavio laitteesta liikematriisien vektori-kvantisoimiseksi; kuvio 2 esittää sarjaa standardiviivavektoreita; kuvio 3 esittää sarjaa standardikuvia; kuvio 4 on kaavio, joka esittää käsitettä kuva-alueiden kartoittamiseksi; kuviot 5 ja 6 ovat kulkukaavioita kertoimen ja modulin deri-voimiseksi; ja kuvio 7 on kaavio, joka esittää liikevektorin muodostumista.

Kuvattavia järjestelmiä käytetään videokooderissa, joka johdannossa esitetyllä tavalla muodostaa kutakin useata 8x8 osa-lohkoa kohti 8x8 liikematriisin, jonka kukin elementti on ;· yksittäinen bitti osoittaen sen onko vastaava kuvaelementti (tai muunnoskerroin) olennaisesti muuttunut ruutujen välillä.

Yllä esitetty ongelma liittyy mahdollisten 2*>4 kuvien siirtoon pienempään määrään (32) luokkia. Teoriassa tämä voidaan suorittaa käyttämällä etsintätaulukkoa, jossa on 2^4 paikkaa ja jokainen niistä sisältää 5 bittisen luvun osoittaen sen mihin luokkaan kuva kuuluu, mutta luonnollisesti tämän kokoinen taulukko on epäkäytännöllinen. Vieläpä vaikka matriisi esiproses-soidaan vektorikvantisoimalla matriisin rivit esittäen kukin * \ 4 96646 8 bitin viiva 5 bitillä, taulukon koko on silti 240. Esitetyssä menetelmässä käytetään moduli x summausfunktiota 2*>4 (2^0) kuvien kartoittamiseksi pienemmäksi määräksi x luokkia. Summaus-funktion ja moduli x:n kertoimien arvot pitää luonnollisesti valita siten, että ne sopivat haluttuun kuvasarjaan jäljempänä selvitetyllä tavalla. Vaikka poikkeuksellisissa tapauksissa tietyssä kuvasarjassa voitaisiin saattaa x yhtä suureksi kuin luokkien määrä, näin ei yleensä ole asianlaita, vaan käytännössä on havaittu, että x voidaan tehdä riittävän pienempi siten, että etsintätaulukkoon voidaan konstruoida x paikkaa, joista kukin sisältää 5 bitin luvun, joka identifioi yhden 32 luokasta.

Kuviossa 1 on esitetty videokooderin osan muodostava järjestely, joka identifioi sen mitä 32 standardikuvasta 8x8x1 bitin tuloliikematriisi lähemmin muistuttaa. Tällöin oletetaan muodostuvan liikematriisi, jossa on 1 bitti b(i,j) per elementti ja tämä tallennetaan 64 bitin puskurimuistiin 1. 6 bitin osoitelaskin 2 ajoitetaan muodostamaan osoitteet 0-63, jotka siirretään muistin 1 osoitesisääntuloihin. Muistin 1 tieto-tulostus b(i,j) ja sarakeosoitteet j siirretään rivikvantisoi-jaan 3, joka muodostaa 5 bitin rivivektorikoodin q(i). Rivi-osoitteet i siirretään vain luettavan kerroinmuistin 4 osoitesisääntuloihin, jossa muistissa on 8 paikkaa ja niistä jokainen .. sisältää 8 bitin· kertoimen c(i). Rivivektorikoodit q(i) ja « · muistin 4 tietotulostukset syötetään kertojaan 5, joka muodostaa tulon. Tulot siirretään akkumulaattoriin, johon kuuluu moduli x yhteenlaskun 6 ja 16 bitin salpa 7, jonka tulostus syötetään takaisin yhteenlaskimen yhteen sisääntuloon. Moduli ei luonnollisestikaan saa olla suurempi kuin 2^-6.

Akkumulaattorin tulostus muodostaa osoitesyötön hakutaulukkoon, jonka muodostaa lisälukumuisti 8, jossa on 216 = 64K paikkaa (joista vain x käytetään)? kukin sisältää 5 bitin sanan, joka « 5 96646 identifioi yhden 32 kuvaluokasta, joihin sisääntuloliikemat-riisit on tarkoitus siirtää.

Muistin 7 tietotulostus 8 tarjoaa siis 5 bitin sanan, joka on valittu taulukosta moduli x summan arvon mukaisesti.

Tarkasteltaessa prosessia yksityiskohtaisemmin voidaan todeta, että tulokuva muodostuu 8x8 matriisista B, jonka kukin elementti b(ij) on yksittäinen bitti, joka osoittaa arvioi-daanko kuvan vastaavan kuvaelementin (pixel) liikkuvan ("1") vai ei ("0"). Tämä on tärkeä tekijä etsittäessä vastaavuus-kriteeriä, koska on edullista esittää kuvaelementti liikkuvana silloin kun se ei liiku sen sijaan, että esitettäisiin liikkuva kuvaelementti paikallaan olevana.

Rivikvantisoijassa 3, 8x8x1 matriisin tietosisältö "rivi-kvantisoidaan" siten, että 8x1 bittien kutakin vaakariviä verrataan lähimpään vektoriin 8x1 perusvektorien muodostamasta sarjasta. Kuviossa 2 on esitetty 6 perusvektoria. Voidaan todeta, että periaatteessa ei ole välttämätöntä tässä prosessissa käytettävien 8 bitin ryhmien derivoiminen sisääntulo-matriisin riveistä; muutkin valinnat ovat mahdollisia. Kutakin perusvektoria edustaa koodi V0...V5. Nämä voisivat periaatteessa olla kokonaislukuja 0-6; muiden valintojen on kuiten- \\ kin todettu antavan parempia tuloksia. Erityisesti laajalla välillä toisistaan olevat luvut, pääasiallisesti jaottomat luvut välillä 0 - 255 on todettu edullisiksi - esim. 141, 95, 111, 173, 237, 29, 192, 224 tai 149, 97, 113, 173, 239, 29, 137, 43.

Sarja pitää valita käsin, mutta mahdollisten ehdokassarjojen vertailut voidaan suorittaa käyttämällä kuhunkin jäljempänä kuvattua kerroineterointialgoritmia (käytetään samoja haja-lukuja kussakin tapauksessa). Nopeimman convergenssin antama sarja on ilmeisestikin paras.

• · 6 96646

Vertailuprosessi vaatii sen, että tuloriviä, jolla on jossakin asennossa "1" ei pidä verrata perusvektoriin, jolla tässä asennossa on "0". Esimerkiksi kuviossa 2 esitettyä esimerkki-tuloriviä El ei voi verrata V4?ään (näennäisesti lähin), koska asemassa 7 on "1"; sitä pitää verrata VQ:aan.

Tällöin siis edetään identifioimalla se perusvektori (vektorit), joilla on arvo "1" kaikissa niissä asemissa, joissa sisääntulorivillä on arvo "1". Mikäli näitä on enemmän kuin 1, valitaan niistä se, joka on lähin siinä mielessä, että sillä on pienin määrä bittejä, jotka eroavat tulorivin vastaavista biteistä.

8x8 tulomatriisi on nyt muutettu vektoriksi [q(i)l, jossa on 8 elementtiä.

Tämä vektori kvantisoidaan nyt edelleen kertojalla 5 ja akku-mulaattorilla 6, 7 kerroinmuistin 4 avulla muodostamalla sen elementtien painotettu summa h, moduli x, jolloin: i = 7^ h = / ^ q(i).c(i) i = 0 MODx • · « · (tästä määritelmästä käytetään seuraavassa selityksessä nimitystä summausfunktio).

Scalaarisummaksi (alueella 0 - x) siten muutettua tulomatriisia käytetään sitten muistin 8 hakutaulukon käsittelemiseksi, josta voidaan lukea koodisanat, jotka osoittavat sen standardikuvan, jota käytetään. Kuviossa 3 on esitetty 14 esimerkkiä standardi-kuvista sekä vastaavat koodit ZQ...Z13.

:l Itt-tM» l ! ie : 96646 7

On selvää, että ilman moduli x rajoitusta akkumulaattorin muodostama painotettu summa edustaa mahdollisten kuvien kartoitusta - joista kuvista joitakin on esitetty kuviossa 4 poikkiviivoina A - E ajatellulla kuva-alueella P, jolloin kartoitus tapahtuu "summa-alueeksi S, jonka koko riippuu kertoimien c(j) ja rivivektorikoodien vq...V5 arvoista. Mikäli kertoimet ovat numerollisesti kaukana toisistaan, kaikki kuvat tulevat kartoitetuiksi eri asemiin alueella S. Mikäli tämä ehto ei toteudu, jotkin kuvat näkyvät samana kuvana S-alueella (kts. kuva C, E).

Tämä on luonnollisesti toivottavaa vain silloin kun nämä kaksi kuvaa kuuluvat samaan luokkaan.

Moduli x akkumulaation käyttö pienenpää alueen S kokoa taittamalla se takaisin itsensä päälle yhden tai useamman kerran.

Kuviossa 4 on esitetty yksi taitto, jossa kuva B liittyy nyt C:hen ja E:hen alueella H.

Kertoimet ja moduli pitää valita siten, että saavutetaan hyväksyttävän alhainen modulin arvo varmistaen samalla se, että mikäli mahdollista vain samaan luokkaan kuuluvat kuvat kartoitetaan samoihion H:n arvoihin (vaikkakin käytännössä voidaan jäljempänä selvitetyllä tavalla sietää joitakin virheitä).

Hakijan tiedossa ei ole mitään teoreettisia todisteita siitä, että tämä voidaan aikaansaada eikä tunneta myöskään mitään teoreettista menetelmää c(i):n ja x:n arvojen derivoimiseksi.

Kokeet ovat kuitenkin osoittaneet, että tyydyttäviä tuloksia voidaan saavuttaa käyttämällä iteratiivista menettelytapaa näiden arvojen saamiseksi.

Seuraavaksi kuvataan menetelmä sopivien arvojen aikaansaamiseksi kertoimille c(i) ja modulille x. Iteratiivista menetelmää käytetään kertoimien c(i) saamiseksi ja tämä vaatii iteroitujen kertoiminen toistuvaa testiä soveltamalla summausfunktiota (ilman modulirajoitusta) kuvioiden testi järjestykseen.

• · 8 96646

Selvästikään ei ole käytännöllistä testata kaikkia 2^4 mahdollisia 8x8 kuvia tai edes 24^ kuvia, jotka ovat mahdollisia ilmaistuina rivikvantisoituina vektoreina. Tästä syystä testi on rajoitettu itse standardikuviin ja kuvien lisäluokka on määritelty standardikuvien variantteina. Varianttikuva on määritelty standardikuvana (perusvektorimuodosta) yhden tai useamman osavektorin ollessa korvattu vaihtoehtoisella vektorilla. Kullakin perusvektorilla on ainoastaan tietty mahdolli-suusalue substituution suorittamiseksi, nimittäin vain ne vektorit, joilla on arvot "1" vain niissä asemissa, joissa alkuperäisellä vektorilla on myös arvo "1". Kuviossa 2 on lueteltu kuhunkin perusvektoriin liittyvät varianttivektorit. Varianttikuvioiden sarjaan kuuluu kaikki tällaisten substituutioiden mahdolliset yhdistelmät. Tämä varianttien määrittely antaa varianttikuvan ja peruskuvan välisen samanlaisuus-kriteerin; eli kun kuvakoodaus suoritetaan pitäisi variantti-kuvan tuottaa sama koodinumero kuin sen standardikuvan, jonka variantti se on.

Kerroinsarjän C = [c(i)l testi suoritetaan siirtämällä summaus-standardi- ja varianttikuviin arvojen saamiseksi summalle h' (yläpilkku tarkoittaa sitä, että summa ei ole modulisumma).

Loppuun suoritettuna tämä prosessi muodostaa sarjan arvoja h', jotka ovat alueella qminiT c(i) - qmax £c(i), jossa ·; imin Öa ^max °vat q:n (tai v:n) pienimmät ja suurimmat arvot.

Kutakin uutta muodostettua h' verrataan kuitenkin vasten h':n aikaisempia arvoja. h':n jonkun aikaisemman arvon uudelleen-esiintyminen on hyväksyttävissä mikäli tämän arvon aiheuttavat kuvat kuuluvat samaan standardikuva/varianttikuvaryhmään (eli niillä on sama koodiluku). Muussa tapauksessa tämä tarkoittaa erillisten kuvien kartoitusta h':n samaan arvoon ja sitä kutsutaan nimityksellä "törmäys". Testissä esiintyvien törmäysten lukumäärä otetaan testattavan kerroinsarjän c hyvyystestin (C) mitaksi.

m 9 96646

Iterointiprosessi on esitetty kuvion 5 kulkukaaviossa.

Cn = tcn,0 ···· cn,7l on kerroinsarjän n:n iterointi.

RND(r, s) osoittaa sattumanvaraisen luvun muodostumista alueella r - s. Prosessi etenee seuraavasti.

Lähtöarvio Cg tehdään (1). Tämä voi olla täysin sattumanvarainen tai operaattori voi lyhentää prosessia suorrittamalla inspiroidun arvauksen sopivasta lähtöpisteestä. Sen jälkeen tämä testataan (2) ja iterointi ja ajoitinlaskimet käynnistetään (3, 4). Cn:n uusi arvo derivoidaan (5) Cn_i:stä valitsemalla sattumanvaraisesti yksi (cn,R) kertoimista ja suorittamalla siihen sattumanvarainen muutos P. Ensimmäisessä iteroinnissa käytetään suurta muutosta (esim. kerroinarvojen ollessa alueella 0 - 255 muutos on alueella 8 - 255) kun taas myöhemmissä käytetään vain pientä muutosta (esim. alueella 1-7). Tämä voidaan tehdä moduli 256 lisäyksellä kertoimien pitämiseksi alueella.

Nyt testataan uusi kerroinsarja (6)? mikäli törmäystä ei tapahdu (7), prosessi on täydellinen. Muussa tapauksessa ajoi-tinlaskin etenee (8) ja testin tulosta Gn verrataan (9) aikaisemman testin tulokseen Gn_i· Mikäli parannus on saavutettu, siirretään kierroslaskin eteenpäin (10) ja kierros toistetaan kunnes saadaan sellainen kerroinsarja, josta ei seurauksena . ole törmäystä. Tätä vaatimusta voidaan kuitenkin lievittää joko siitä syystä, että se on saavuttamattomissa tai iterointiajän lyhentämiseksi, jolloin iterointi lopetetaan kun törmäysten lukumäärä testissä on pienempi kuin tietty suhde, esim. 5 tai 10 % testattujen kuvien lukumäärästä. Vaihtoehtoisesti iterointien määrää voidaan rajoittaa. Silloin kuin törmäyksiä sallitaan tällä tavoin on välttämätöntä päättää se mikä tai kumpi kahdesta (tai useammasta) luokasta pitää ottaa edustamaan sitä h':n arvoa, joka kartoitetaan tiettyyn h':n arvoon.

Tuloksena olevien luokitusvirheiden lukumäärän minimoimiseksi 10 96646 valitaan yleensä se luokka, joka suurimmalla todennäköisyydellä esiintyy tyypillisessä kuvassa.

Mikäli jossain vaiheessa ei saavuteta parannusta, viimeisiin kerroinsarja yläpään siitä syystä, että se ei edistä kierros-laskinta ja vasta tämän jälkeen yritetään uutta muutosta (11). Mikäli kymmenen epäonnistunutta yritystä on tehty tietyn kerroinsarjän parantamiseksi, tämä tarkoittaa sitä, että prosessi etenee väärään suuntaan ja kierroslaskin käännetään takaisin (12) siten, että sekä viimeisin ja sitä edeltävät sarjat tulevat hylätyiksi. Luonnollisesti (13, 14) tämä rajoitus ei koske ensimmäistä iterointia (tai sitä seuraavia vai- i heitä, joissa prosessi palautuu takaisin arvoon Gq).

Iteroinnin päättäminen muodostaa sarjan kertoimia Cn, jotka eivät muodosta törmäystä (tai muodostavat rajoitetun määrän törmäyksiä) testissä silloin kun modulirajoitusta ei käytetä summauksessa. Sarja arvoja h'j (j = 0 ... T-l, jossa T on testattujen kuvien lukumäärä), jotka on saatu käyttämällä kyseistä kerroinsarjaa, oletetaan (6a) tallennetuiksi muistiin ja nyt ne prosessoidaan moduli x:n löytämiseksi. Tämä aikaansaadaan muuttamalla h':n sarja x:n peräkkäisiksi arvoiksi alkaen Mistä, jossa M on standardikuvin lukumäärä.

Pienin x:n arvo, joka ei aiheuta törmäystä (kuten yllä on määritelty) - tai aiheuttaa rajoitetun määrän törmäyksiä -on vaadittu tulos. Tämä prosessi on esitetty kuvion 6 kulku-kaaviossa. Ulkopiiri A tutkii x:n kunkin arvon vuorollaan ja päättyy löytäessään arvon, joka ei aiheuta törmäystä. Keski-piiri B laskee sen hetkiselle modulille x h^rn kunkin peräkkäisen arvon kun taas sisäpiiri C tarkistaa h^in vertaamalla sitä h;n kaikkiin aikaisempiin arvoihin törmäyksen aiheuttamassa x:n arvossa.

Ί ' - i l il l i t a» . . | 11 96646

Voidaan todeta, että kaikkia mahdollisia syöttökuvia ei ole testattu kertoimien ja modulin derivoinnissa. Tarkoituksena on, että standardikuvat ja niiden variantit tulisi olla valittuina siten, että ne kattavat kiinnostavimmat kuvat. Tässä esimerkissä tarkoituksena on, että sellaiset kuvat, joiden paikoista yli puolet sisältävät arvon "l" ovat sellaisia, että niitä edustaa standardi "kaikki 1" kuva (Z13). Nämä ja muut testaamattomat kuvat voivat käytössä aiheuttaa virheellisiä tuloksia ja tästä syystä menetelmään kuuluu lisävaihe, jossa tulos tarkistetaan. Saatua koodia vastaavaa standardikuvaa verrataan sisäänsyöttökuvaan. Mikäli jälkimmäinen sisältää arvon "1" jossakin paikassa, jossa edellinen ei sitä sisällä, tarkistus , osoittaa virhettä ja saatu koodi korvataan Z^ista. Toiminta on esitetty kaaviomaisesti kuviossa 1 testiyksiköliä 9 ja kääntökytkimellä 10. Tämä prosessi kompensoi myös ne virheet, joita aiheuttaa yllämaintitu vaihtoehtoinen lievitetty törmäys-kriteeri.

Keksinnön eräs toinen sovellutus on liikevektorien muodostaminen. Tässä verrataan aikaisemman kuvaruudun lohkoa nykyisen ruudun siirrettyihin lohkoihin (tai päinvastoin), jotta saadaan selville se lohkoasema nykyisessä ruudussa, jota aikaisempi lohko lähimmin vastaa ja saadaan muodostetuksi liikevektori, joka edustaa liikkeen suuruutta ja suuntaa. Tätä tekniikkaa käytetään mm. ruutujen välissä koodausjärjestelmissä, joissa liikevektori voidaan siirtää vastaanottimeen ja käyttää sitä edellisen ruudun tehon parantamiseksi ennusteeksi sen sijaan, että käytettäisiin aikaisempaa ruutua siirtämällä kuvan sopivia osia toisiinsa nähden.

. Kuten aikaisemminkin, korrelointimenetelmät ovat hitaita.

Käyttämällä liikevektoreita tällä tavoin ei siirrettyjen ja siirtämättömien lohkojen välisen vertailun tarvitse olla aivan täsmällinen kunhan vain tulos antaa paremman ennusteen kuin aikaisempi modifioimaton ruutu.

12 966 46

Seuraavaksi kuvattavia liikevektorin muodostustuloksia voidaan käyttää välittömästi tai ne voivat muodostaa ensimmäisen arvion tavanomaisten liikevektorimuodostusmenetelmien "etsintäalueen" rajoittamiseksi.

Oletetaan, että kuvan kaikille lohkoille on annettu koodiluvut yllä kuvatulla tavalla (perustuen elementtiarvoihin eikä muutoskertoimiin). Tällöin edetään siten, että ensiksi paikallistetaan yksi tai useampia lohkoja, joilla on "täysin liikkuva" koodi Z12 - eli identifioidaan kuvan ne alueet, joilla tapahtuu olennainen liikemäärä.

Kutakin tällaista lohkoa varten suoritetaan vertailu tämän lohkoaseman koodien välillä nykyisissä ja edellisissä ruuduissa, jossa saadaan selville se liikesuunta, jota tämä edustaa (kuten jäljempänä kuvataan yksityiskohtaisemmin). Kahdeksan ympäröivää lohkoa tutkitaan samalla tavoin ja mikäli vastaavuus löydetään (esim. mikäli yli puolet dedusoiduista suunnista on sama), silloin tämä suunta otetaan vaadituksi arvioksi.

Vertailuprosessi on kuvattu kuviossa 7. Mikäli aikaisempien ja nykyisten ruutujen koodit ovat Ζχχ ja Zg vastaten kuviossa 7(a) esitettyjä standardikuvia, tällöin liikesuunnan oletetaan olevan nuolen osoittama. Kuvioissa 7(b) ja (c) on esitetty lisäesimerkkejä. Liikevektoriparametreilla varustettu haku-taulukko voidaan ottaa mukaan siten, että se vastaa kutakin koodiparia.

Luonnollisesti jos kahden lohkon vertailu osoittaa, että ne ·. kokonaisuudessaan liikkuvat, tällöin ei saada mitään tietoja ja päätös tehdään tätä lohkoa ympäröivien lohkojen vertailujen perusteella tai - silloin kun vierekkäiset lohkot ovat myös täysin liikkeessä molemmissa ruuduissa - vertaillaan tällaisten lohkojen ryhmää ympäröiviä lohkoja.

il : M » III H IM ; i .

Claims

1. Kuvankäsittelylaite kaksiulotteista kuvaa edustavista signaaleista derivoidun arvosarjan luokittelemiseksi stan- 5 dardimallien sarjan suhteen, johon laitteeseen kuuluu sum-mauselimet näiden arvojen painotetun summan, moduli x:n muodostamiseksi, jossa x on pienempi kokonaisluku kuin 2p, muttei pienempi kuin standardimallien lukumäärä, jolloin p on sarjassa olevien arvojen lukumäärä; ja muisti, jonka x 10 paikkaa kukin sisältää luokan identifiointisanan, joka edustaa yhtä standardimallien sarjasta, jolloin muistin osoitesyötöt on liitetty siten, että ne vastaanottavat sammutuselinten tulostuksen, t u n e t t u siitä, että x:n ja painotetun summan muodostamiseen käytettyjen painotusker-15 toimien arvot on valittu siten, että mallit, jotka ovat standardimallin kanssa samanlaisia, syötettyinä summaus-elimiin pyrkivät sellaisen ulostulon muodostamiseen, joka osoittaa samaa paikkaa, tai paikkoja joilla on sama identi-fiointisana. 20

1 3 96646

2. Patenttivaatimuksen 1 mukainen laite, tunnettu siitä, että siihen kuuluu elimet kuvan vastaavia elementtejä edustavien tietojen vastaanottamiseksi ja identifioimaan kustakin kuvan elementtien useista ryhmistä se näiden ennal- 25 ta määriteltyjen ryhmien sarjasta, jonka sarjan kuhunkin ·: jäseneen liittyy koodi, jota tämä ryhmä kaikkein lähimmin muistuttaa ennalta määrätyn kriteerin mukaisesti, jolloin nämä identifioituihin ryhmiin liittyvät koodit muodostavat mainitun arvosarjan. 30

3. Patenttivaatimuksen 1 tai 2 mukainen laite, t u n - ·· n e t t u siitä, että painotettu summa on muodostettu seuraavan kaavan summausfunktiolla: TC N-l 35 —j h = / q(i).c(i) i = 0 MODx 96646 1 4 jossa q (i) tarkoittaa mainittuja arvoja, N on sarjassa olevien arvojen lukumäärä ja c(i) tarkoittaa painotuskertoi-mia, jotka on derivoitu iteratiivisella prosessilla, jossa kerroin arvoihin on tehty sattumanvarainen muutos, ja että 5 kaavalla: N-l h' = 2_, q(i).c(i) i = 0 10 määritelty modifioitu summausfunktio on sovitettu sarjaan testikuvia, jolloin sattumanvarainen muutos säilytetään iteroinnin jatkamiseksi vain silloin kun muutos on aiheuttanut parannuksen esiintyvien törmäysten lukumäärässä, jolloin törmäys on määritelty h':n identtisten arvojen muodostumise-15 na kahden kuvan kohdalla, jotka ennaltamäärätyn luokituskri-teerin mukaisesti eivät kuulu samaan luokkaan, ja prosessi toistetaan.

4. Patenttivaatimuksen 3 mukainen laite, tunnettu 20 siitä, että moduli x on derivoitu etsimällä se pienin kokonaisluku, jolla iteroinnnilla löydetyn kerroinsarjän saatujen h' arvojen modulireduktio ei aiheuta törmäystä tai aiheuttaa vähemmän kun ennalta määrätyn määrän törmäyksiä.

5. Jonkin edellä olevan patenttivaatimuksen mukainen laite, '.· tunnettu siitä, että siihen kuuluu lisäksi testieli- met kaksiulotteisen kuvan vertaamiseksi standardikuvaan, joka vastaa muistin tulostuksessa saatua luokan identifioin- tisanaa, ja jolloin tilalle sijoitetaan vaihtoehtoinen 30 luokan identifiointisana siinä tapauksessa, että kuva ei kuulu ennalta määrätyn luokituskriteerin mukaisesti samaan !! luokkaan kuin kyseinen standardisana. *

6. Videokoodauslaite, johon kuuluu ruutujen väliset koo-35 dauselimet ja elimet liikematriisin muodostamiseksi, joka matriisi osoittaa kuvan ne elementit, jotka ovat olennaisesti muuttuneet ruutujen välillä, tunnettu siitä, että < · IH.i 14It M4JK . . . 1 5 96646 siihen kuuluu jonkun edellä olevan patenttivaatimuksen mukainen laite näiden matriisien luokittelemiseksi ja elimet niiden siirtämiseksi vastaanottimeen kutakin kuvaa varten, jolloin kuvan vastaava luokan identifiointisana ja tietoja 5 koskevat elementit on valittu tämän luokan identifiointisa-naan liittyvän standardikuvan mukaisesti.

7. Patenttivaatimuksen 6 mukainen videokoodauslaite, tunnettu siitä, että siihen kuuluu elimet liikevektorin 10 muodostamiseksi liikkuvan kuva-alueen suhteen vertaamalla vastaavien alueiden luokan identifiointisanoja kahdessa peräkkäisessä ruudussa.

8. Patenttivaatimuksen 7 mukainen videokoodauslaite, t u n -15 n e t t u siitä, että vertailu suoritetaan käyttämällä kahta luokan identifiointisanaa, jolloin päästään käsiksi hakutaulukkoon, johon on tallennettu liikevektorit, jotka vastaavat vastaavia luokan identifiointisanayhdistelmiä. 16 96646