FI96646C - Kuvien prosessointilaite - Google Patents

Kuvien prosessointilaite Download PDF

Info

Publication number
FI96646C
FI96646C FI883431A FI883431A FI96646C FI 96646 C FI96646 C FI 96646C FI 883431 A FI883431 A FI 883431A FI 883431 A FI883431 A FI 883431A FI 96646 C FI96646 C FI 96646C
Authority
FI
Finland
Prior art keywords
values
image
standard
series
identification word
Prior art date
Application number
FI883431A
Other languages
English (en)
Swedish (sv)
Other versions
FI883431L (fi
FI96646B (fi
FI883431A0 (fi
Inventor
Anthony Richard Leaning
Original Assignee
British Telecomm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecomm filed Critical British Telecomm
Publication of FI883431L publication Critical patent/FI883431L/fi
Publication of FI883431A0 publication Critical patent/FI883431A0/fi
Application granted granted Critical
Publication of FI96646B publication Critical patent/FI96646B/fi
Publication of FI96646C publication Critical patent/FI96646C/fi

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Error Detection And Correction (AREA)
  • Image Processing (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Image Analysis (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Exposure Of Semiconductors, Excluding Electron Or Ion Beam Exposure (AREA)
  • Polarising Elements (AREA)
  • Mechanical Treatment Of Semiconductor (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Photoreceptors In Electrophotography (AREA)
  • Dc Digital Transmission (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)
  • Details Of Television Scanning (AREA)
  • Picture Signal Circuits (AREA)
  • Power Steering Mechanism (AREA)

Description

96646
Kuvien prosessointilaite - Bildprocessanordning
Esillä olevan keksinnön kohteena on kuvien prosessointi ja erityisesti, mutta ei yksinomaan tällaisen prosessoinnin soveltaminen videosignaalien koodaukseen.
Eräänä esimerkkinä voidaan mainita videokooderit, joissa käytetään ruutujen välistä ehdollista täydennyskoodausta liikkuvien kuvien siirtämiseksi. Tällöin otetaan kuvaelementtiarvojen ja ennustettujen arvojen {eli edellisestä ruudusta saadut arvot) välinen ero. Erot viedään kynnyspiiriin, joka tuottaa kullekin eroarvolle merkin "1” tai "0" osoittamaan onko kynnysarvo ylitetty vai ei, jolloin muodostuu "liikematriisi". Vai ne elemettiarvot (tai mikäli se on edullista elementtierot), joissa on "1" liikematriisin vastaavassa elementissä, koodataan siirrettäviksi.
Vastaanottajassa vastaanotettuja tietoja käytetään saattamaan ajan tasalle paikalliseen ruutuvarastoon varastoitu kuva. Jotta vastaanotin kykenee dekoodaamaan oikealla tavalla vastaanotetut tiedot, lähetyksen pitää liittää mukaan sivutietoja, jotka osoittavat sen, mitä kertoimet on lähetetty. Liikematriisin kaikkien bittien lähettäminen muodostaa huomattavan kuormituk- .. sen ja tästä syystä on ehdotettu sitä, että kuva jaettaisiin • · 8x8 lohkoon ja kukin 8x8 liikematriisi "vektorikvantisoi-taisiin" vertaamalla sitä lähimpään kuvaan esimerkiksi 32 kuvan sarjasta, jolloin tämä voidaan identifioida vastaanottimelle käyttämällä vain viittä lähetettyä bittiä. Tähän mennessä tämä vertailu on suoritettu käyttämällä kuvien korrelointimene-telmää; tämä on laskennallisesti ylimitoitettua ja jopa suuri-nopeuksisella prosessoinnilla on 32 kuvaa maksimimäärä, joka normaalisti voidaan käsitellä reaaliajassa.
2 96646
Tekniikkaa voidaan myös soveltaa niin kutsuttuihin hybridi-videokoodereihin, joissa käytetään muuntokoodauksen ja ruutujen välisen ehdollisen täydennyskoodauksen yhdistelmää. Muuntokoo-dauksessa käytetään kaksiulotteista muunnosta, kuten Hadamard-tai erillistä cosiinimuunnosta (DCT) kuvaelementtien (esim.
8x8) lohkoihin vastaavan muuntokertoimien matriisin muodostamiseksi (koko ruudun muuntaminen kerrallaan on liian hidasta reaaliaikaprosessoinnin kannalta). Tällöin liikematriisi perustuu nykyisen ruudun matriisin ja edeltävän ruudun matriisin kertoimien välisiin eroihin.
Tämän menettelytavan eräässä muunnosmuodossa ruutujen välisten erojen ottaminen voi edeltää transformaatiota eikä tapahtua sen jälkeen.
Keksinnön eräänä tarkoituksena on saada aikaan menetelmä kaksiulotteista kuvaa edustavan arvosarjan luokittelemiseksi, jolloin muodostetaan näiden arvojen painotettu summa, moduli x, jossa x on pienempi kokonaisluku kuin 2P, jolloin p on sarjassa olevien arvojen lukumäärä ja jolloin tätä summaa käytetään pääsyosoitteena muistiin, jossa on x paikkaa ja jokainen niistä sisältää luokan tunnistussanan.
Periaatteessa kyseiset arvot voivat olla kuvan kuhunkin eleli menttiin liittyvä arvo, mutta summausta voidaan yksinkertaistaa ja painotuskertoimien ja modulin derivointia helpottaa muodostamalla ensin sarja arvoja, joista kukin edustaa tiettyä määrää elementtejä. Keksinnön edullisessa suoritusmuodossa siis derivoidaan sarja arvoja identifioimalla kutakin kuvan elementtien useaa ryhmää varten se näistä ennalta määrätyistä ryhmistä, joista kuhunkin liittyy koodi, jota tämä ryhmä lähimmin muistuttaa ennalta määrätyn kriteerin mukaisesti, jolloin tällä tavoin identifioidut ryhmiin liittyvät koodit muodostavat arvosarjan.
3 96646
Ryhmät voivat olla suorakulmaisen kuvamatriisin rivejä (tai sarakkeita), vaikka muutkin valinnat ovat mahdollisia.
Keksinnön erästä suoritusmuotoa selvitetään seuraavaksi esimerkin muodossa viittaamalla oheisiin piirustuksiin, joissa: kuvio 1 on lohkokaavio laitteesta liikematriisien vektori-kvantisoimiseksi; kuvio 2 esittää sarjaa standardiviivavektoreita; kuvio 3 esittää sarjaa standardikuvia; kuvio 4 on kaavio, joka esittää käsitettä kuva-alueiden kartoittamiseksi; kuviot 5 ja 6 ovat kulkukaavioita kertoimen ja modulin deri-voimiseksi; ja kuvio 7 on kaavio, joka esittää liikevektorin muodostumista.
Kuvattavia järjestelmiä käytetään videokooderissa, joka johdannossa esitetyllä tavalla muodostaa kutakin useata 8x8 osa-lohkoa kohti 8x8 liikematriisin, jonka kukin elementti on ;· yksittäinen bitti osoittaen sen onko vastaava kuvaelementti (tai muunnoskerroin) olennaisesti muuttunut ruutujen välillä.
Yllä esitetty ongelma liittyy mahdollisten 2*>4 kuvien siirtoon pienempään määrään (32) luokkia. Teoriassa tämä voidaan suorittaa käyttämällä etsintätaulukkoa, jossa on 2^4 paikkaa ja jokainen niistä sisältää 5 bittisen luvun osoittaen sen mihin luokkaan kuva kuuluu, mutta luonnollisesti tämän kokoinen taulukko on epäkäytännöllinen. Vieläpä vaikka matriisi esiproses-soidaan vektorikvantisoimalla matriisin rivit esittäen kukin * \ 4 96646 8 bitin viiva 5 bitillä, taulukon koko on silti 240. Esitetyssä menetelmässä käytetään moduli x summausfunktiota 2*>4 (2^0) kuvien kartoittamiseksi pienemmäksi määräksi x luokkia. Summaus-funktion ja moduli x:n kertoimien arvot pitää luonnollisesti valita siten, että ne sopivat haluttuun kuvasarjaan jäljempänä selvitetyllä tavalla. Vaikka poikkeuksellisissa tapauksissa tietyssä kuvasarjassa voitaisiin saattaa x yhtä suureksi kuin luokkien määrä, näin ei yleensä ole asianlaita, vaan käytännössä on havaittu, että x voidaan tehdä riittävän pienempi siten, että etsintätaulukkoon voidaan konstruoida x paikkaa, joista kukin sisältää 5 bitin luvun, joka identifioi yhden 32 luokasta.
Kuviossa 1 on esitetty videokooderin osan muodostava järjestely, joka identifioi sen mitä 32 standardikuvasta 8x8x1 bitin tuloliikematriisi lähemmin muistuttaa. Tällöin oletetaan muodostuvan liikematriisi, jossa on 1 bitti b(i,j) per elementti ja tämä tallennetaan 64 bitin puskurimuistiin 1. 6 bitin osoitelaskin 2 ajoitetaan muodostamaan osoitteet 0-63, jotka siirretään muistin 1 osoitesisääntuloihin. Muistin 1 tieto-tulostus b(i,j) ja sarakeosoitteet j siirretään rivikvantisoi-jaan 3, joka muodostaa 5 bitin rivivektorikoodin q(i). Rivi-osoitteet i siirretään vain luettavan kerroinmuistin 4 osoitesisääntuloihin, jossa muistissa on 8 paikkaa ja niistä jokainen .. sisältää 8 bitin· kertoimen c(i). Rivivektorikoodit q(i) ja « · muistin 4 tietotulostukset syötetään kertojaan 5, joka muodostaa tulon. Tulot siirretään akkumulaattoriin, johon kuuluu moduli x yhteenlaskun 6 ja 16 bitin salpa 7, jonka tulostus syötetään takaisin yhteenlaskimen yhteen sisääntuloon. Moduli ei luonnollisestikaan saa olla suurempi kuin 2^-6.
Akkumulaattorin tulostus muodostaa osoitesyötön hakutaulukkoon, jonka muodostaa lisälukumuisti 8, jossa on 216 = 64K paikkaa (joista vain x käytetään)? kukin sisältää 5 bitin sanan, joka « 5 96646 identifioi yhden 32 kuvaluokasta, joihin sisääntuloliikemat-riisit on tarkoitus siirtää.
Muistin 7 tietotulostus 8 tarjoaa siis 5 bitin sanan, joka on valittu taulukosta moduli x summan arvon mukaisesti.
Tarkasteltaessa prosessia yksityiskohtaisemmin voidaan todeta, että tulokuva muodostuu 8x8 matriisista B, jonka kukin elementti b(ij) on yksittäinen bitti, joka osoittaa arvioi-daanko kuvan vastaavan kuvaelementin (pixel) liikkuvan ("1") vai ei ("0"). Tämä on tärkeä tekijä etsittäessä vastaavuus-kriteeriä, koska on edullista esittää kuvaelementti liikkuvana silloin kun se ei liiku sen sijaan, että esitettäisiin liikkuva kuvaelementti paikallaan olevana.
Rivikvantisoijassa 3, 8x8x1 matriisin tietosisältö "rivi-kvantisoidaan" siten, että 8x1 bittien kutakin vaakariviä verrataan lähimpään vektoriin 8x1 perusvektorien muodostamasta sarjasta. Kuviossa 2 on esitetty 6 perusvektoria. Voidaan todeta, että periaatteessa ei ole välttämätöntä tässä prosessissa käytettävien 8 bitin ryhmien derivoiminen sisääntulo-matriisin riveistä; muutkin valinnat ovat mahdollisia. Kutakin perusvektoria edustaa koodi V0...V5. Nämä voisivat periaatteessa olla kokonaislukuja 0-6; muiden valintojen on kuiten- \\ kin todettu antavan parempia tuloksia. Erityisesti laajalla välillä toisistaan olevat luvut, pääasiallisesti jaottomat luvut välillä 0 - 255 on todettu edullisiksi - esim. 141, 95, 111, 173, 237, 29, 192, 224 tai 149, 97, 113, 173, 239, 29, 137, 43.
Sarja pitää valita käsin, mutta mahdollisten ehdokassarjojen vertailut voidaan suorittaa käyttämällä kuhunkin jäljempänä kuvattua kerroineterointialgoritmia (käytetään samoja haja-lukuja kussakin tapauksessa). Nopeimman convergenssin antama sarja on ilmeisestikin paras.
• · 6 96646
Vertailuprosessi vaatii sen, että tuloriviä, jolla on jossakin asennossa "1" ei pidä verrata perusvektoriin, jolla tässä asennossa on "0". Esimerkiksi kuviossa 2 esitettyä esimerkki-tuloriviä El ei voi verrata V4?ään (näennäisesti lähin), koska asemassa 7 on "1"; sitä pitää verrata VQ:aan.
Tällöin siis edetään identifioimalla se perusvektori (vektorit), joilla on arvo "1" kaikissa niissä asemissa, joissa sisääntulorivillä on arvo "1". Mikäli näitä on enemmän kuin 1, valitaan niistä se, joka on lähin siinä mielessä, että sillä on pienin määrä bittejä, jotka eroavat tulorivin vastaavista biteistä.
8x8 tulomatriisi on nyt muutettu vektoriksi [q(i)l, jossa on 8 elementtiä.
Tämä vektori kvantisoidaan nyt edelleen kertojalla 5 ja akku-mulaattorilla 6, 7 kerroinmuistin 4 avulla muodostamalla sen elementtien painotettu summa h, moduli x, jolloin: i = 7^ h = / ^ q(i).c(i) i = 0 MODx • · « · (tästä määritelmästä käytetään seuraavassa selityksessä nimitystä summausfunktio).
Scalaarisummaksi (alueella 0 - x) siten muutettua tulomatriisia käytetään sitten muistin 8 hakutaulukon käsittelemiseksi, josta voidaan lukea koodisanat, jotka osoittavat sen standardikuvan, jota käytetään. Kuviossa 3 on esitetty 14 esimerkkiä standardi-kuvista sekä vastaavat koodit ZQ...Z13.
:l Itt-tM» l ! ie : 96646 7
On selvää, että ilman moduli x rajoitusta akkumulaattorin muodostama painotettu summa edustaa mahdollisten kuvien kartoitusta - joista kuvista joitakin on esitetty kuviossa 4 poikkiviivoina A - E ajatellulla kuva-alueella P, jolloin kartoitus tapahtuu "summa-alueeksi S, jonka koko riippuu kertoimien c(j) ja rivivektorikoodien vq...V5 arvoista. Mikäli kertoimet ovat numerollisesti kaukana toisistaan, kaikki kuvat tulevat kartoitetuiksi eri asemiin alueella S. Mikäli tämä ehto ei toteudu, jotkin kuvat näkyvät samana kuvana S-alueella (kts. kuva C, E).
Tämä on luonnollisesti toivottavaa vain silloin kun nämä kaksi kuvaa kuuluvat samaan luokkaan.
Moduli x akkumulaation käyttö pienenpää alueen S kokoa taittamalla se takaisin itsensä päälle yhden tai useamman kerran.
Kuviossa 4 on esitetty yksi taitto, jossa kuva B liittyy nyt C:hen ja E:hen alueella H.
Kertoimet ja moduli pitää valita siten, että saavutetaan hyväksyttävän alhainen modulin arvo varmistaen samalla se, että mikäli mahdollista vain samaan luokkaan kuuluvat kuvat kartoitetaan samoihion H:n arvoihin (vaikkakin käytännössä voidaan jäljempänä selvitetyllä tavalla sietää joitakin virheitä).
Hakijan tiedossa ei ole mitään teoreettisia todisteita siitä, että tämä voidaan aikaansaada eikä tunneta myöskään mitään teoreettista menetelmää c(i):n ja x:n arvojen derivoimiseksi.
Kokeet ovat kuitenkin osoittaneet, että tyydyttäviä tuloksia voidaan saavuttaa käyttämällä iteratiivista menettelytapaa näiden arvojen saamiseksi.
Seuraavaksi kuvataan menetelmä sopivien arvojen aikaansaamiseksi kertoimille c(i) ja modulille x. Iteratiivista menetelmää käytetään kertoimien c(i) saamiseksi ja tämä vaatii iteroitujen kertoiminen toistuvaa testiä soveltamalla summausfunktiota (ilman modulirajoitusta) kuvioiden testi järjestykseen.
• · 8 96646
Selvästikään ei ole käytännöllistä testata kaikkia 2^4 mahdollisia 8x8 kuvia tai edes 24^ kuvia, jotka ovat mahdollisia ilmaistuina rivikvantisoituina vektoreina. Tästä syystä testi on rajoitettu itse standardikuviin ja kuvien lisäluokka on määritelty standardikuvien variantteina. Varianttikuva on määritelty standardikuvana (perusvektorimuodosta) yhden tai useamman osavektorin ollessa korvattu vaihtoehtoisella vektorilla. Kullakin perusvektorilla on ainoastaan tietty mahdolli-suusalue substituution suorittamiseksi, nimittäin vain ne vektorit, joilla on arvot "1" vain niissä asemissa, joissa alkuperäisellä vektorilla on myös arvo "1". Kuviossa 2 on lueteltu kuhunkin perusvektoriin liittyvät varianttivektorit. Varianttikuvioiden sarjaan kuuluu kaikki tällaisten substituutioiden mahdolliset yhdistelmät. Tämä varianttien määrittely antaa varianttikuvan ja peruskuvan välisen samanlaisuus-kriteerin; eli kun kuvakoodaus suoritetaan pitäisi variantti-kuvan tuottaa sama koodinumero kuin sen standardikuvan, jonka variantti se on.
Kerroinsarjän C = [c(i)l testi suoritetaan siirtämällä summaus-standardi- ja varianttikuviin arvojen saamiseksi summalle h' (yläpilkku tarkoittaa sitä, että summa ei ole modulisumma).
Loppuun suoritettuna tämä prosessi muodostaa sarjan arvoja h', jotka ovat alueella qminiT c(i) - qmax £c(i), jossa ·; imin Öa ^max °vat q:n (tai v:n) pienimmät ja suurimmat arvot.
Kutakin uutta muodostettua h' verrataan kuitenkin vasten h':n aikaisempia arvoja. h':n jonkun aikaisemman arvon uudelleen-esiintyminen on hyväksyttävissä mikäli tämän arvon aiheuttavat kuvat kuuluvat samaan standardikuva/varianttikuvaryhmään (eli niillä on sama koodiluku). Muussa tapauksessa tämä tarkoittaa erillisten kuvien kartoitusta h':n samaan arvoon ja sitä kutsutaan nimityksellä "törmäys". Testissä esiintyvien törmäysten lukumäärä otetaan testattavan kerroinsarjän c hyvyystestin (C) mitaksi.
m 9 96646
Iterointiprosessi on esitetty kuvion 5 kulkukaaviossa.
Cn = tcn,0 ···· cn,7l on kerroinsarjän n:n iterointi.
RND(r, s) osoittaa sattumanvaraisen luvun muodostumista alueella r - s. Prosessi etenee seuraavasti.
Lähtöarvio Cg tehdään (1). Tämä voi olla täysin sattumanvarainen tai operaattori voi lyhentää prosessia suorrittamalla inspiroidun arvauksen sopivasta lähtöpisteestä. Sen jälkeen tämä testataan (2) ja iterointi ja ajoitinlaskimet käynnistetään (3, 4). Cn:n uusi arvo derivoidaan (5) Cn_i:stä valitsemalla sattumanvaraisesti yksi (cn,R) kertoimista ja suorittamalla siihen sattumanvarainen muutos P. Ensimmäisessä iteroinnissa käytetään suurta muutosta (esim. kerroinarvojen ollessa alueella 0 - 255 muutos on alueella 8 - 255) kun taas myöhemmissä käytetään vain pientä muutosta (esim. alueella 1-7). Tämä voidaan tehdä moduli 256 lisäyksellä kertoimien pitämiseksi alueella.
Nyt testataan uusi kerroinsarja (6)? mikäli törmäystä ei tapahdu (7), prosessi on täydellinen. Muussa tapauksessa ajoi-tinlaskin etenee (8) ja testin tulosta Gn verrataan (9) aikaisemman testin tulokseen Gn_i· Mikäli parannus on saavutettu, siirretään kierroslaskin eteenpäin (10) ja kierros toistetaan kunnes saadaan sellainen kerroinsarja, josta ei seurauksena . ole törmäystä. Tätä vaatimusta voidaan kuitenkin lievittää joko siitä syystä, että se on saavuttamattomissa tai iterointiajän lyhentämiseksi, jolloin iterointi lopetetaan kun törmäysten lukumäärä testissä on pienempi kuin tietty suhde, esim. 5 tai 10 % testattujen kuvien lukumäärästä. Vaihtoehtoisesti iterointien määrää voidaan rajoittaa. Silloin kuin törmäyksiä sallitaan tällä tavoin on välttämätöntä päättää se mikä tai kumpi kahdesta (tai useammasta) luokasta pitää ottaa edustamaan sitä h':n arvoa, joka kartoitetaan tiettyyn h':n arvoon.
Tuloksena olevien luokitusvirheiden lukumäärän minimoimiseksi 10 96646 valitaan yleensä se luokka, joka suurimmalla todennäköisyydellä esiintyy tyypillisessä kuvassa.
Mikäli jossain vaiheessa ei saavuteta parannusta, viimeisiin kerroinsarja yläpään siitä syystä, että se ei edistä kierros-laskinta ja vasta tämän jälkeen yritetään uutta muutosta (11). Mikäli kymmenen epäonnistunutta yritystä on tehty tietyn kerroinsarjän parantamiseksi, tämä tarkoittaa sitä, että prosessi etenee väärään suuntaan ja kierroslaskin käännetään takaisin (12) siten, että sekä viimeisin ja sitä edeltävät sarjat tulevat hylätyiksi. Luonnollisesti (13, 14) tämä rajoitus ei koske ensimmäistä iterointia (tai sitä seuraavia vai- i heitä, joissa prosessi palautuu takaisin arvoon Gq).
Iteroinnin päättäminen muodostaa sarjan kertoimia Cn, jotka eivät muodosta törmäystä (tai muodostavat rajoitetun määrän törmäyksiä) testissä silloin kun modulirajoitusta ei käytetä summauksessa. Sarja arvoja h'j (j = 0 ... T-l, jossa T on testattujen kuvien lukumäärä), jotka on saatu käyttämällä kyseistä kerroinsarjaa, oletetaan (6a) tallennetuiksi muistiin ja nyt ne prosessoidaan moduli x:n löytämiseksi. Tämä aikaansaadaan muuttamalla h':n sarja x:n peräkkäisiksi arvoiksi alkaen Mistä, jossa M on standardikuvin lukumäärä.
Pienin x:n arvo, joka ei aiheuta törmäystä (kuten yllä on määritelty) - tai aiheuttaa rajoitetun määrän törmäyksiä -on vaadittu tulos. Tämä prosessi on esitetty kuvion 6 kulku-kaaviossa. Ulkopiiri A tutkii x:n kunkin arvon vuorollaan ja päättyy löytäessään arvon, joka ei aiheuta törmäystä. Keski-piiri B laskee sen hetkiselle modulille x h^rn kunkin peräkkäisen arvon kun taas sisäpiiri C tarkistaa h^in vertaamalla sitä h;n kaikkiin aikaisempiin arvoihin törmäyksen aiheuttamassa x:n arvossa.
Ί ' - i l il l i t a» . . | 11 96646
Voidaan todeta, että kaikkia mahdollisia syöttökuvia ei ole testattu kertoimien ja modulin derivoinnissa. Tarkoituksena on, että standardikuvat ja niiden variantit tulisi olla valittuina siten, että ne kattavat kiinnostavimmat kuvat. Tässä esimerkissä tarkoituksena on, että sellaiset kuvat, joiden paikoista yli puolet sisältävät arvon "l" ovat sellaisia, että niitä edustaa standardi "kaikki 1" kuva (Z13). Nämä ja muut testaamattomat kuvat voivat käytössä aiheuttaa virheellisiä tuloksia ja tästä syystä menetelmään kuuluu lisävaihe, jossa tulos tarkistetaan. Saatua koodia vastaavaa standardikuvaa verrataan sisäänsyöttökuvaan. Mikäli jälkimmäinen sisältää arvon "1" jossakin paikassa, jossa edellinen ei sitä sisällä, tarkistus , osoittaa virhettä ja saatu koodi korvataan Z^ista. Toiminta on esitetty kaaviomaisesti kuviossa 1 testiyksiköliä 9 ja kääntökytkimellä 10. Tämä prosessi kompensoi myös ne virheet, joita aiheuttaa yllämaintitu vaihtoehtoinen lievitetty törmäys-kriteeri.
Keksinnön eräs toinen sovellutus on liikevektorien muodostaminen. Tässä verrataan aikaisemman kuvaruudun lohkoa nykyisen ruudun siirrettyihin lohkoihin (tai päinvastoin), jotta saadaan selville se lohkoasema nykyisessä ruudussa, jota aikaisempi lohko lähimmin vastaa ja saadaan muodostetuksi liikevektori, joka edustaa liikkeen suuruutta ja suuntaa. Tätä tekniikkaa käytetään mm. ruutujen välissä koodausjärjestelmissä, joissa liikevektori voidaan siirtää vastaanottimeen ja käyttää sitä edellisen ruudun tehon parantamiseksi ennusteeksi sen sijaan, että käytettäisiin aikaisempaa ruutua siirtämällä kuvan sopivia osia toisiinsa nähden.
. Kuten aikaisemminkin, korrelointimenetelmät ovat hitaita.
Käyttämällä liikevektoreita tällä tavoin ei siirrettyjen ja siirtämättömien lohkojen välisen vertailun tarvitse olla aivan täsmällinen kunhan vain tulos antaa paremman ennusteen kuin aikaisempi modifioimaton ruutu.
12 966 46
Seuraavaksi kuvattavia liikevektorin muodostustuloksia voidaan käyttää välittömästi tai ne voivat muodostaa ensimmäisen arvion tavanomaisten liikevektorimuodostusmenetelmien "etsintäalueen" rajoittamiseksi.
Oletetaan, että kuvan kaikille lohkoille on annettu koodiluvut yllä kuvatulla tavalla (perustuen elementtiarvoihin eikä muutoskertoimiin). Tällöin edetään siten, että ensiksi paikallistetaan yksi tai useampia lohkoja, joilla on "täysin liikkuva" koodi Z12 - eli identifioidaan kuvan ne alueet, joilla tapahtuu olennainen liikemäärä.
Kutakin tällaista lohkoa varten suoritetaan vertailu tämän lohkoaseman koodien välillä nykyisissä ja edellisissä ruuduissa, jossa saadaan selville se liikesuunta, jota tämä edustaa (kuten jäljempänä kuvataan yksityiskohtaisemmin). Kahdeksan ympäröivää lohkoa tutkitaan samalla tavoin ja mikäli vastaavuus löydetään (esim. mikäli yli puolet dedusoiduista suunnista on sama), silloin tämä suunta otetaan vaadituksi arvioksi.
Vertailuprosessi on kuvattu kuviossa 7. Mikäli aikaisempien ja nykyisten ruutujen koodit ovat Ζχχ ja Zg vastaten kuviossa 7(a) esitettyjä standardikuvia, tällöin liikesuunnan oletetaan olevan nuolen osoittama. Kuvioissa 7(b) ja (c) on esitetty lisäesimerkkejä. Liikevektoriparametreilla varustettu haku-taulukko voidaan ottaa mukaan siten, että se vastaa kutakin koodiparia.
Luonnollisesti jos kahden lohkon vertailu osoittaa, että ne ·. kokonaisuudessaan liikkuvat, tällöin ei saada mitään tietoja ja päätös tehdään tätä lohkoa ympäröivien lohkojen vertailujen perusteella tai - silloin kun vierekkäiset lohkot ovat myös täysin liikkeessä molemmissa ruuduissa - vertaillaan tällaisten lohkojen ryhmää ympäröiviä lohkoja.
il : M » III H IM ; i .

Claims (8)

1. Kuvankäsittelylaite kaksiulotteista kuvaa edustavista signaaleista derivoidun arvosarjan luokittelemiseksi stan- 5 dardimallien sarjan suhteen, johon laitteeseen kuuluu sum-mauselimet näiden arvojen painotetun summan, moduli x:n muodostamiseksi, jossa x on pienempi kokonaisluku kuin 2p, muttei pienempi kuin standardimallien lukumäärä, jolloin p on sarjassa olevien arvojen lukumäärä; ja muisti, jonka x 10 paikkaa kukin sisältää luokan identifiointisanan, joka edustaa yhtä standardimallien sarjasta, jolloin muistin osoitesyötöt on liitetty siten, että ne vastaanottavat sammutuselinten tulostuksen, t u n e t t u siitä, että x:n ja painotetun summan muodostamiseen käytettyjen painotusker-15 toimien arvot on valittu siten, että mallit, jotka ovat standardimallin kanssa samanlaisia, syötettyinä summaus-elimiin pyrkivät sellaisen ulostulon muodostamiseen, joka osoittaa samaa paikkaa, tai paikkoja joilla on sama identi-fiointisana. 20
1 3 96646
2. Patenttivaatimuksen 1 mukainen laite, tunnettu siitä, että siihen kuuluu elimet kuvan vastaavia elementtejä edustavien tietojen vastaanottamiseksi ja identifioimaan kustakin kuvan elementtien useista ryhmistä se näiden ennal- 25 ta määriteltyjen ryhmien sarjasta, jonka sarjan kuhunkin ·: jäseneen liittyy koodi, jota tämä ryhmä kaikkein lähimmin muistuttaa ennalta määrätyn kriteerin mukaisesti, jolloin nämä identifioituihin ryhmiin liittyvät koodit muodostavat mainitun arvosarjan. 30
3. Patenttivaatimuksen 1 tai 2 mukainen laite, t u n - ·· n e t t u siitä, että painotettu summa on muodostettu seuraavan kaavan summausfunktiolla: TC N-l 35 —j h = / q(i).c(i) i = 0 MODx 96646 1 4 jossa q (i) tarkoittaa mainittuja arvoja, N on sarjassa olevien arvojen lukumäärä ja c(i) tarkoittaa painotuskertoi-mia, jotka on derivoitu iteratiivisella prosessilla, jossa kerroin arvoihin on tehty sattumanvarainen muutos, ja että 5 kaavalla: N-l h' = 2_, q(i).c(i) i = 0 10 määritelty modifioitu summausfunktio on sovitettu sarjaan testikuvia, jolloin sattumanvarainen muutos säilytetään iteroinnin jatkamiseksi vain silloin kun muutos on aiheuttanut parannuksen esiintyvien törmäysten lukumäärässä, jolloin törmäys on määritelty h':n identtisten arvojen muodostumise-15 na kahden kuvan kohdalla, jotka ennaltamäärätyn luokituskri-teerin mukaisesti eivät kuulu samaan luokkaan, ja prosessi toistetaan.
4. Patenttivaatimuksen 3 mukainen laite, tunnettu 20 siitä, että moduli x on derivoitu etsimällä se pienin kokonaisluku, jolla iteroinnnilla löydetyn kerroinsarjän saatujen h' arvojen modulireduktio ei aiheuta törmäystä tai aiheuttaa vähemmän kun ennalta määrätyn määrän törmäyksiä.
5. Jonkin edellä olevan patenttivaatimuksen mukainen laite, '.· tunnettu siitä, että siihen kuuluu lisäksi testieli- met kaksiulotteisen kuvan vertaamiseksi standardikuvaan, joka vastaa muistin tulostuksessa saatua luokan identifioin- tisanaa, ja jolloin tilalle sijoitetaan vaihtoehtoinen 30 luokan identifiointisana siinä tapauksessa, että kuva ei kuulu ennalta määrätyn luokituskriteerin mukaisesti samaan !! luokkaan kuin kyseinen standardisana. *
6. Videokoodauslaite, johon kuuluu ruutujen väliset koo-35 dauselimet ja elimet liikematriisin muodostamiseksi, joka matriisi osoittaa kuvan ne elementit, jotka ovat olennaisesti muuttuneet ruutujen välillä, tunnettu siitä, että < · IH.i 14It M4JK . . . 1 5 96646 siihen kuuluu jonkun edellä olevan patenttivaatimuksen mukainen laite näiden matriisien luokittelemiseksi ja elimet niiden siirtämiseksi vastaanottimeen kutakin kuvaa varten, jolloin kuvan vastaava luokan identifiointisana ja tietoja 5 koskevat elementit on valittu tämän luokan identifiointisa-naan liittyvän standardikuvan mukaisesti.
7. Patenttivaatimuksen 6 mukainen videokoodauslaite, tunnettu siitä, että siihen kuuluu elimet liikevektorin 10 muodostamiseksi liikkuvan kuva-alueen suhteen vertaamalla vastaavien alueiden luokan identifiointisanoja kahdessa peräkkäisessä ruudussa.
8. Patenttivaatimuksen 7 mukainen videokoodauslaite, t u n -15 n e t t u siitä, että vertailu suoritetaan käyttämällä kahta luokan identifiointisanaa, jolloin päästään käsiksi hakutaulukkoon, johon on tallennettu liikevektorit, jotka vastaavat vastaavia luokan identifiointisanayhdistelmiä. 16 96646
FI883431A 1986-11-20 1988-07-20 Kuvien prosessointilaite FI96646C (fi)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB868627787A GB8627787D0 (en) 1986-11-20 1986-11-20 Pattern processing
GB8627787 1986-11-20
GB8700816 1987-11-17
PCT/GB1987/000816 WO1988004084A1 (en) 1986-11-20 1987-11-17 Pattern processing

Publications (4)

Publication Number Publication Date
FI883431L FI883431L (fi) 1988-07-20
FI883431A0 FI883431A0 (fi) 1988-07-20
FI96646B FI96646B (fi) 1996-04-15
FI96646C true FI96646C (fi) 1996-07-25

Family

ID=10607665

Family Applications (1)

Application Number Title Priority Date Filing Date
FI883431A FI96646C (fi) 1986-11-20 1988-07-20 Kuvien prosessointilaite

Country Status (20)

Country Link
US (1) US4930013A (fi)
EP (1) EP0272794B1 (fi)
JP (1) JP2674770B2 (fi)
KR (1) KR950001947B1 (fi)
CN (1) CN1015951B (fi)
AT (1) ATE133508T1 (fi)
AU (1) AU607450B2 (fi)
CA (1) CA1292320C (fi)
DE (1) DE3751684T2 (fi)
DK (1) DK171882B1 (fi)
ES (1) ES2081799T3 (fi)
FI (1) FI96646C (fi)
GB (1) GB8627787D0 (fi)
HK (1) HK110897A (fi)
IE (2) IE65473B1 (fi)
IN (4) IN170294B (fi)
NO (1) NO174986C (fi)
NZ (1) NZ222623A (fi)
PT (1) PT86190B (fi)
WO (1) WO1988004084A1 (fi)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5083206A (en) * 1990-03-19 1992-01-21 At&T Bell Laboratories High definition television arrangement including noise immunity means
JPH03272290A (ja) * 1990-03-20 1991-12-03 Victor Co Of Japan Ltd 画像フィルタ処理装置
US6005627A (en) * 1991-05-31 1999-12-21 Kabushiki Kaisha Toshiba Video coding apparatus
US5325126A (en) * 1992-04-01 1994-06-28 Intel Corporation Method and apparatus for real time compression and decompression of a digital motion video signal
US5337085A (en) * 1992-04-10 1994-08-09 Comsat Corporation Coding technique for high definition television signals
DE4314483A1 (de) * 1993-05-03 1994-11-10 Philips Patentverwaltung Überwachungssystem
US5909460A (en) * 1995-12-07 1999-06-01 Ericsson, Inc. Efficient apparatus for simultaneous modulation and digital beamforming for an antenna array
US6614845B1 (en) * 1996-12-24 2003-09-02 Verizon Laboratories Inc. Method and apparatus for differential macroblock coding for intra-frame data in video conferencing systems
FR2770726A1 (fr) * 1997-11-03 1999-04-30 Telediffusion Fse Procede de transmission d'images video numerisees
JP4636786B2 (ja) * 2003-08-28 2011-02-23 カシオ計算機株式会社 撮影画像投影装置、撮影画像投影装置の画像処理方法及びプログラム
CN1319373C (zh) * 2003-09-19 2007-05-30 四川长虹电器股份有限公司 一种信号模式识别的方法及adc参数的设置方法
US7965773B1 (en) * 2005-06-30 2011-06-21 Advanced Micro Devices, Inc. Macroblock cache
US10402436B2 (en) 2016-05-12 2019-09-03 Pixel Forensics, Inc. Automated video categorization, value determination and promotion/demotion via multi-attribute feature computation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2423817A1 (de) * 1973-07-16 1975-02-06 Ibm Verfahren und schaltungsanordnungen zur codierung zweidimensionaler bildinformationen
JPS5952768B2 (ja) * 1976-09-14 1984-12-21 三菱電機株式会社 色彩図形の特徴抽出方式
JPS5929020B2 (ja) * 1977-06-08 1984-07-17 松下電器産業株式会社 2次元ブロック符号化方法
JPS55105475A (en) * 1979-02-06 1980-08-13 Nippon Telegr & Teleph Corp <Ntt> Color picture coding process system
CA1212452A (en) * 1982-06-11 1986-10-07 Tokumichi Murakami Vector quantizer
EP0192929A1 (de) * 1985-02-07 1986-09-03 Siemens Aktiengesellschaft Anordnung zum selbsttätigen Ermitteln von Reaktionen in Abhängigkeit von Situationen
US4779131A (en) * 1985-07-26 1988-10-18 Sony Corporation Apparatus for detecting television image movement

Also Published As

Publication number Publication date
IN170294B (fi) 1992-03-07
IE65473B1 (en) 1995-11-01
DK389588A (da) 1988-07-12
NO174986B (no) 1994-05-02
CA1292320C (en) 1991-11-19
DE3751684D1 (de) 1996-03-07
HK110897A (en) 1997-08-29
CN1015951B (zh) 1992-03-18
ES2081799T3 (es) 1996-03-16
GB8627787D0 (en) 1986-12-17
NO883209D0 (no) 1988-07-19
AU8234287A (en) 1988-06-16
NO883209L (no) 1988-09-19
DK389588D0 (da) 1988-07-12
EP0272794B1 (en) 1996-01-24
EP0272794A1 (en) 1988-06-29
IN173777B (fi) 1994-07-09
AU607450B2 (en) 1991-03-07
PT86190A (pt) 1988-12-15
DE3751684T2 (de) 1996-05-30
IE873240L (en) 1988-05-20
JP2674770B2 (ja) 1997-11-12
FI883431L (fi) 1988-07-20
FI96646B (fi) 1996-04-15
KR890700250A (ko) 1989-03-10
ATE133508T1 (de) 1996-02-15
IN173776B (fi) 1994-07-09
CN87101244A (zh) 1988-07-20
US4930013A (en) 1990-05-29
WO1988004084A1 (en) 1988-06-02
JPH01502143A (ja) 1989-07-27
DK171882B1 (da) 1997-07-28
NO174986C (no) 1994-08-10
FI883431A0 (fi) 1988-07-20
NZ222623A (en) 1990-08-28
PT86190B (pt) 1993-12-31
IN173778B (fi) 1994-07-09
KR950001947B1 (ko) 1995-03-07

Similar Documents

Publication Publication Date Title
FI96646B (fi) Kuvien prosessointilaite
US6292114B1 (en) Efficient memory mapping of a huffman coded list suitable for bit-serial decoding
US6157745A (en) Method and system for coding and decoding a sequence of segmented images
EP1523196A2 (en) Encoding system of motion image containing arbitrary object
US4910608A (en) Imagery data compression mechanism employing adaptive vector quantizer
JPH05300382A (ja) ビットプレーン符号化方法及び装置
US4870695A (en) Compression and de-compression of column-interlaced, row-interlaced graylevel digital images
KR20030096443A (ko) 부호화 방법 및 장치와 복호화 방법 및 장치
GB2333412A (en) A context based coding/decoding method and apparatus
US6121905A (en) Method and apparatus for decoding JPEG symbols
US6594310B1 (en) Partition coding method and device
EP0283798A2 (en) Compression and decompression of column-interlaced, row-interlaced graylevel digital images
KR100689642B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법
JPH0918350A (ja) 符号化復号化装置及び符号化復号化方法
JPH0936749A (ja) 符号化復号化装置およびこれに用いられる符号化方法
JP3272214B2 (ja) 格子量子化器および入力ベクトルを格子量子化するための方法
RU2316908C2 (ru) Способ совместного использования векторного квантования и фрактального кодирования изображений
KR20260027263A (ko) 이미지 시퀀스를 인코딩 및 디코딩하기 위한 방법 및 장치
KR0169666B1 (ko) 피티에스 벡터양자화 부호기의 왜곡치 계산장치
JPH10150664A (ja) 映像信号符号化装置および復号化装置
Liu Ordered Kohonen vector quantization for very low rate interframe video coding
Lee Design and implementation of robust signal processors with applications to video coding

Legal Events

Date Code Title Description
BB Publication of examined application
MM Patent lapsed
MM Patent lapsed

Owner name: BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY