FI96646C - Kuvien prosessointilaite - Google Patents
Kuvien prosessointilaite Download PDFInfo
- Publication number
- FI96646C FI96646C FI883431A FI883431A FI96646C FI 96646 C FI96646 C FI 96646C FI 883431 A FI883431 A FI 883431A FI 883431 A FI883431 A FI 883431A FI 96646 C FI96646 C FI 96646C
- Authority
- FI
- Finland
- Prior art keywords
- values
- image
- standard
- series
- identification word
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Error Detection And Correction (AREA)
- Image Processing (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
- Image Analysis (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Exposure Of Semiconductors, Excluding Electron Or Ion Beam Exposure (AREA)
- Polarising Elements (AREA)
- Mechanical Treatment Of Semiconductor (AREA)
- Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Photoreceptors In Electrophotography (AREA)
- Dc Digital Transmission (AREA)
- Radar Systems Or Details Thereof (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
- Details Of Television Scanning (AREA)
- Picture Signal Circuits (AREA)
- Power Steering Mechanism (AREA)
Description
96646
Kuvien prosessointilaite - Bildprocessanordning
Esillä olevan keksinnön kohteena on kuvien prosessointi ja erityisesti, mutta ei yksinomaan tällaisen prosessoinnin soveltaminen videosignaalien koodaukseen.
Eräänä esimerkkinä voidaan mainita videokooderit, joissa käytetään ruutujen välistä ehdollista täydennyskoodausta liikkuvien kuvien siirtämiseksi. Tällöin otetaan kuvaelementtiarvojen ja ennustettujen arvojen {eli edellisestä ruudusta saadut arvot) välinen ero. Erot viedään kynnyspiiriin, joka tuottaa kullekin eroarvolle merkin "1” tai "0" osoittamaan onko kynnysarvo ylitetty vai ei, jolloin muodostuu "liikematriisi". Vai ne elemettiarvot (tai mikäli se on edullista elementtierot), joissa on "1" liikematriisin vastaavassa elementissä, koodataan siirrettäviksi.
Vastaanottajassa vastaanotettuja tietoja käytetään saattamaan ajan tasalle paikalliseen ruutuvarastoon varastoitu kuva. Jotta vastaanotin kykenee dekoodaamaan oikealla tavalla vastaanotetut tiedot, lähetyksen pitää liittää mukaan sivutietoja, jotka osoittavat sen, mitä kertoimet on lähetetty. Liikematriisin kaikkien bittien lähettäminen muodostaa huomattavan kuormituk- .. sen ja tästä syystä on ehdotettu sitä, että kuva jaettaisiin • · 8x8 lohkoon ja kukin 8x8 liikematriisi "vektorikvantisoi-taisiin" vertaamalla sitä lähimpään kuvaan esimerkiksi 32 kuvan sarjasta, jolloin tämä voidaan identifioida vastaanottimelle käyttämällä vain viittä lähetettyä bittiä. Tähän mennessä tämä vertailu on suoritettu käyttämällä kuvien korrelointimene-telmää; tämä on laskennallisesti ylimitoitettua ja jopa suuri-nopeuksisella prosessoinnilla on 32 kuvaa maksimimäärä, joka normaalisti voidaan käsitellä reaaliajassa.
2 96646
Tekniikkaa voidaan myös soveltaa niin kutsuttuihin hybridi-videokoodereihin, joissa käytetään muuntokoodauksen ja ruutujen välisen ehdollisen täydennyskoodauksen yhdistelmää. Muuntokoo-dauksessa käytetään kaksiulotteista muunnosta, kuten Hadamard-tai erillistä cosiinimuunnosta (DCT) kuvaelementtien (esim.
8x8) lohkoihin vastaavan muuntokertoimien matriisin muodostamiseksi (koko ruudun muuntaminen kerrallaan on liian hidasta reaaliaikaprosessoinnin kannalta). Tällöin liikematriisi perustuu nykyisen ruudun matriisin ja edeltävän ruudun matriisin kertoimien välisiin eroihin.
Tämän menettelytavan eräässä muunnosmuodossa ruutujen välisten erojen ottaminen voi edeltää transformaatiota eikä tapahtua sen jälkeen.
Keksinnön eräänä tarkoituksena on saada aikaan menetelmä kaksiulotteista kuvaa edustavan arvosarjan luokittelemiseksi, jolloin muodostetaan näiden arvojen painotettu summa, moduli x, jossa x on pienempi kokonaisluku kuin 2P, jolloin p on sarjassa olevien arvojen lukumäärä ja jolloin tätä summaa käytetään pääsyosoitteena muistiin, jossa on x paikkaa ja jokainen niistä sisältää luokan tunnistussanan.
Periaatteessa kyseiset arvot voivat olla kuvan kuhunkin eleli menttiin liittyvä arvo, mutta summausta voidaan yksinkertaistaa ja painotuskertoimien ja modulin derivointia helpottaa muodostamalla ensin sarja arvoja, joista kukin edustaa tiettyä määrää elementtejä. Keksinnön edullisessa suoritusmuodossa siis derivoidaan sarja arvoja identifioimalla kutakin kuvan elementtien useaa ryhmää varten se näistä ennalta määrätyistä ryhmistä, joista kuhunkin liittyy koodi, jota tämä ryhmä lähimmin muistuttaa ennalta määrätyn kriteerin mukaisesti, jolloin tällä tavoin identifioidut ryhmiin liittyvät koodit muodostavat arvosarjan.
3 96646
Ryhmät voivat olla suorakulmaisen kuvamatriisin rivejä (tai sarakkeita), vaikka muutkin valinnat ovat mahdollisia.
Keksinnön erästä suoritusmuotoa selvitetään seuraavaksi esimerkin muodossa viittaamalla oheisiin piirustuksiin, joissa: kuvio 1 on lohkokaavio laitteesta liikematriisien vektori-kvantisoimiseksi; kuvio 2 esittää sarjaa standardiviivavektoreita; kuvio 3 esittää sarjaa standardikuvia; kuvio 4 on kaavio, joka esittää käsitettä kuva-alueiden kartoittamiseksi; kuviot 5 ja 6 ovat kulkukaavioita kertoimen ja modulin deri-voimiseksi; ja kuvio 7 on kaavio, joka esittää liikevektorin muodostumista.
Kuvattavia järjestelmiä käytetään videokooderissa, joka johdannossa esitetyllä tavalla muodostaa kutakin useata 8x8 osa-lohkoa kohti 8x8 liikematriisin, jonka kukin elementti on ;· yksittäinen bitti osoittaen sen onko vastaava kuvaelementti (tai muunnoskerroin) olennaisesti muuttunut ruutujen välillä.
Yllä esitetty ongelma liittyy mahdollisten 2*>4 kuvien siirtoon pienempään määrään (32) luokkia. Teoriassa tämä voidaan suorittaa käyttämällä etsintätaulukkoa, jossa on 2^4 paikkaa ja jokainen niistä sisältää 5 bittisen luvun osoittaen sen mihin luokkaan kuva kuuluu, mutta luonnollisesti tämän kokoinen taulukko on epäkäytännöllinen. Vieläpä vaikka matriisi esiproses-soidaan vektorikvantisoimalla matriisin rivit esittäen kukin * \ 4 96646 8 bitin viiva 5 bitillä, taulukon koko on silti 240. Esitetyssä menetelmässä käytetään moduli x summausfunktiota 2*>4 (2^0) kuvien kartoittamiseksi pienemmäksi määräksi x luokkia. Summaus-funktion ja moduli x:n kertoimien arvot pitää luonnollisesti valita siten, että ne sopivat haluttuun kuvasarjaan jäljempänä selvitetyllä tavalla. Vaikka poikkeuksellisissa tapauksissa tietyssä kuvasarjassa voitaisiin saattaa x yhtä suureksi kuin luokkien määrä, näin ei yleensä ole asianlaita, vaan käytännössä on havaittu, että x voidaan tehdä riittävän pienempi siten, että etsintätaulukkoon voidaan konstruoida x paikkaa, joista kukin sisältää 5 bitin luvun, joka identifioi yhden 32 luokasta.
Kuviossa 1 on esitetty videokooderin osan muodostava järjestely, joka identifioi sen mitä 32 standardikuvasta 8x8x1 bitin tuloliikematriisi lähemmin muistuttaa. Tällöin oletetaan muodostuvan liikematriisi, jossa on 1 bitti b(i,j) per elementti ja tämä tallennetaan 64 bitin puskurimuistiin 1. 6 bitin osoitelaskin 2 ajoitetaan muodostamaan osoitteet 0-63, jotka siirretään muistin 1 osoitesisääntuloihin. Muistin 1 tieto-tulostus b(i,j) ja sarakeosoitteet j siirretään rivikvantisoi-jaan 3, joka muodostaa 5 bitin rivivektorikoodin q(i). Rivi-osoitteet i siirretään vain luettavan kerroinmuistin 4 osoitesisääntuloihin, jossa muistissa on 8 paikkaa ja niistä jokainen .. sisältää 8 bitin· kertoimen c(i). Rivivektorikoodit q(i) ja « · muistin 4 tietotulostukset syötetään kertojaan 5, joka muodostaa tulon. Tulot siirretään akkumulaattoriin, johon kuuluu moduli x yhteenlaskun 6 ja 16 bitin salpa 7, jonka tulostus syötetään takaisin yhteenlaskimen yhteen sisääntuloon. Moduli ei luonnollisestikaan saa olla suurempi kuin 2^-6.
Akkumulaattorin tulostus muodostaa osoitesyötön hakutaulukkoon, jonka muodostaa lisälukumuisti 8, jossa on 216 = 64K paikkaa (joista vain x käytetään)? kukin sisältää 5 bitin sanan, joka « 5 96646 identifioi yhden 32 kuvaluokasta, joihin sisääntuloliikemat-riisit on tarkoitus siirtää.
Muistin 7 tietotulostus 8 tarjoaa siis 5 bitin sanan, joka on valittu taulukosta moduli x summan arvon mukaisesti.
Tarkasteltaessa prosessia yksityiskohtaisemmin voidaan todeta, että tulokuva muodostuu 8x8 matriisista B, jonka kukin elementti b(ij) on yksittäinen bitti, joka osoittaa arvioi-daanko kuvan vastaavan kuvaelementin (pixel) liikkuvan ("1") vai ei ("0"). Tämä on tärkeä tekijä etsittäessä vastaavuus-kriteeriä, koska on edullista esittää kuvaelementti liikkuvana silloin kun se ei liiku sen sijaan, että esitettäisiin liikkuva kuvaelementti paikallaan olevana.
Rivikvantisoijassa 3, 8x8x1 matriisin tietosisältö "rivi-kvantisoidaan" siten, että 8x1 bittien kutakin vaakariviä verrataan lähimpään vektoriin 8x1 perusvektorien muodostamasta sarjasta. Kuviossa 2 on esitetty 6 perusvektoria. Voidaan todeta, että periaatteessa ei ole välttämätöntä tässä prosessissa käytettävien 8 bitin ryhmien derivoiminen sisääntulo-matriisin riveistä; muutkin valinnat ovat mahdollisia. Kutakin perusvektoria edustaa koodi V0...V5. Nämä voisivat periaatteessa olla kokonaislukuja 0-6; muiden valintojen on kuiten- \\ kin todettu antavan parempia tuloksia. Erityisesti laajalla välillä toisistaan olevat luvut, pääasiallisesti jaottomat luvut välillä 0 - 255 on todettu edullisiksi - esim. 141, 95, 111, 173, 237, 29, 192, 224 tai 149, 97, 113, 173, 239, 29, 137, 43.
Sarja pitää valita käsin, mutta mahdollisten ehdokassarjojen vertailut voidaan suorittaa käyttämällä kuhunkin jäljempänä kuvattua kerroineterointialgoritmia (käytetään samoja haja-lukuja kussakin tapauksessa). Nopeimman convergenssin antama sarja on ilmeisestikin paras.
• · 6 96646
Vertailuprosessi vaatii sen, että tuloriviä, jolla on jossakin asennossa "1" ei pidä verrata perusvektoriin, jolla tässä asennossa on "0". Esimerkiksi kuviossa 2 esitettyä esimerkki-tuloriviä El ei voi verrata V4?ään (näennäisesti lähin), koska asemassa 7 on "1"; sitä pitää verrata VQ:aan.
Tällöin siis edetään identifioimalla se perusvektori (vektorit), joilla on arvo "1" kaikissa niissä asemissa, joissa sisääntulorivillä on arvo "1". Mikäli näitä on enemmän kuin 1, valitaan niistä se, joka on lähin siinä mielessä, että sillä on pienin määrä bittejä, jotka eroavat tulorivin vastaavista biteistä.
8x8 tulomatriisi on nyt muutettu vektoriksi [q(i)l, jossa on 8 elementtiä.
Tämä vektori kvantisoidaan nyt edelleen kertojalla 5 ja akku-mulaattorilla 6, 7 kerroinmuistin 4 avulla muodostamalla sen elementtien painotettu summa h, moduli x, jolloin: i = 7^ h = / ^ q(i).c(i) i = 0 MODx • · « · (tästä määritelmästä käytetään seuraavassa selityksessä nimitystä summausfunktio).
Scalaarisummaksi (alueella 0 - x) siten muutettua tulomatriisia käytetään sitten muistin 8 hakutaulukon käsittelemiseksi, josta voidaan lukea koodisanat, jotka osoittavat sen standardikuvan, jota käytetään. Kuviossa 3 on esitetty 14 esimerkkiä standardi-kuvista sekä vastaavat koodit ZQ...Z13.
:l Itt-tM» l ! ie : 96646 7
On selvää, että ilman moduli x rajoitusta akkumulaattorin muodostama painotettu summa edustaa mahdollisten kuvien kartoitusta - joista kuvista joitakin on esitetty kuviossa 4 poikkiviivoina A - E ajatellulla kuva-alueella P, jolloin kartoitus tapahtuu "summa-alueeksi S, jonka koko riippuu kertoimien c(j) ja rivivektorikoodien vq...V5 arvoista. Mikäli kertoimet ovat numerollisesti kaukana toisistaan, kaikki kuvat tulevat kartoitetuiksi eri asemiin alueella S. Mikäli tämä ehto ei toteudu, jotkin kuvat näkyvät samana kuvana S-alueella (kts. kuva C, E).
Tämä on luonnollisesti toivottavaa vain silloin kun nämä kaksi kuvaa kuuluvat samaan luokkaan.
Moduli x akkumulaation käyttö pienenpää alueen S kokoa taittamalla se takaisin itsensä päälle yhden tai useamman kerran.
Kuviossa 4 on esitetty yksi taitto, jossa kuva B liittyy nyt C:hen ja E:hen alueella H.
Kertoimet ja moduli pitää valita siten, että saavutetaan hyväksyttävän alhainen modulin arvo varmistaen samalla se, että mikäli mahdollista vain samaan luokkaan kuuluvat kuvat kartoitetaan samoihion H:n arvoihin (vaikkakin käytännössä voidaan jäljempänä selvitetyllä tavalla sietää joitakin virheitä).
Hakijan tiedossa ei ole mitään teoreettisia todisteita siitä, että tämä voidaan aikaansaada eikä tunneta myöskään mitään teoreettista menetelmää c(i):n ja x:n arvojen derivoimiseksi.
Kokeet ovat kuitenkin osoittaneet, että tyydyttäviä tuloksia voidaan saavuttaa käyttämällä iteratiivista menettelytapaa näiden arvojen saamiseksi.
Seuraavaksi kuvataan menetelmä sopivien arvojen aikaansaamiseksi kertoimille c(i) ja modulille x. Iteratiivista menetelmää käytetään kertoimien c(i) saamiseksi ja tämä vaatii iteroitujen kertoiminen toistuvaa testiä soveltamalla summausfunktiota (ilman modulirajoitusta) kuvioiden testi järjestykseen.
• · 8 96646
Selvästikään ei ole käytännöllistä testata kaikkia 2^4 mahdollisia 8x8 kuvia tai edes 24^ kuvia, jotka ovat mahdollisia ilmaistuina rivikvantisoituina vektoreina. Tästä syystä testi on rajoitettu itse standardikuviin ja kuvien lisäluokka on määritelty standardikuvien variantteina. Varianttikuva on määritelty standardikuvana (perusvektorimuodosta) yhden tai useamman osavektorin ollessa korvattu vaihtoehtoisella vektorilla. Kullakin perusvektorilla on ainoastaan tietty mahdolli-suusalue substituution suorittamiseksi, nimittäin vain ne vektorit, joilla on arvot "1" vain niissä asemissa, joissa alkuperäisellä vektorilla on myös arvo "1". Kuviossa 2 on lueteltu kuhunkin perusvektoriin liittyvät varianttivektorit. Varianttikuvioiden sarjaan kuuluu kaikki tällaisten substituutioiden mahdolliset yhdistelmät. Tämä varianttien määrittely antaa varianttikuvan ja peruskuvan välisen samanlaisuus-kriteerin; eli kun kuvakoodaus suoritetaan pitäisi variantti-kuvan tuottaa sama koodinumero kuin sen standardikuvan, jonka variantti se on.
Kerroinsarjän C = [c(i)l testi suoritetaan siirtämällä summaus-standardi- ja varianttikuviin arvojen saamiseksi summalle h' (yläpilkku tarkoittaa sitä, että summa ei ole modulisumma).
Loppuun suoritettuna tämä prosessi muodostaa sarjan arvoja h', jotka ovat alueella qminiT c(i) - qmax £c(i), jossa ·; imin Öa ^max °vat q:n (tai v:n) pienimmät ja suurimmat arvot.
Kutakin uutta muodostettua h' verrataan kuitenkin vasten h':n aikaisempia arvoja. h':n jonkun aikaisemman arvon uudelleen-esiintyminen on hyväksyttävissä mikäli tämän arvon aiheuttavat kuvat kuuluvat samaan standardikuva/varianttikuvaryhmään (eli niillä on sama koodiluku). Muussa tapauksessa tämä tarkoittaa erillisten kuvien kartoitusta h':n samaan arvoon ja sitä kutsutaan nimityksellä "törmäys". Testissä esiintyvien törmäysten lukumäärä otetaan testattavan kerroinsarjän c hyvyystestin (C) mitaksi.
m 9 96646
Iterointiprosessi on esitetty kuvion 5 kulkukaaviossa.
Cn = tcn,0 ···· cn,7l on kerroinsarjän n:n iterointi.
RND(r, s) osoittaa sattumanvaraisen luvun muodostumista alueella r - s. Prosessi etenee seuraavasti.
Lähtöarvio Cg tehdään (1). Tämä voi olla täysin sattumanvarainen tai operaattori voi lyhentää prosessia suorrittamalla inspiroidun arvauksen sopivasta lähtöpisteestä. Sen jälkeen tämä testataan (2) ja iterointi ja ajoitinlaskimet käynnistetään (3, 4). Cn:n uusi arvo derivoidaan (5) Cn_i:stä valitsemalla sattumanvaraisesti yksi (cn,R) kertoimista ja suorittamalla siihen sattumanvarainen muutos P. Ensimmäisessä iteroinnissa käytetään suurta muutosta (esim. kerroinarvojen ollessa alueella 0 - 255 muutos on alueella 8 - 255) kun taas myöhemmissä käytetään vain pientä muutosta (esim. alueella 1-7). Tämä voidaan tehdä moduli 256 lisäyksellä kertoimien pitämiseksi alueella.
Nyt testataan uusi kerroinsarja (6)? mikäli törmäystä ei tapahdu (7), prosessi on täydellinen. Muussa tapauksessa ajoi-tinlaskin etenee (8) ja testin tulosta Gn verrataan (9) aikaisemman testin tulokseen Gn_i· Mikäli parannus on saavutettu, siirretään kierroslaskin eteenpäin (10) ja kierros toistetaan kunnes saadaan sellainen kerroinsarja, josta ei seurauksena . ole törmäystä. Tätä vaatimusta voidaan kuitenkin lievittää joko siitä syystä, että se on saavuttamattomissa tai iterointiajän lyhentämiseksi, jolloin iterointi lopetetaan kun törmäysten lukumäärä testissä on pienempi kuin tietty suhde, esim. 5 tai 10 % testattujen kuvien lukumäärästä. Vaihtoehtoisesti iterointien määrää voidaan rajoittaa. Silloin kuin törmäyksiä sallitaan tällä tavoin on välttämätöntä päättää se mikä tai kumpi kahdesta (tai useammasta) luokasta pitää ottaa edustamaan sitä h':n arvoa, joka kartoitetaan tiettyyn h':n arvoon.
Tuloksena olevien luokitusvirheiden lukumäärän minimoimiseksi 10 96646 valitaan yleensä se luokka, joka suurimmalla todennäköisyydellä esiintyy tyypillisessä kuvassa.
Mikäli jossain vaiheessa ei saavuteta parannusta, viimeisiin kerroinsarja yläpään siitä syystä, että se ei edistä kierros-laskinta ja vasta tämän jälkeen yritetään uutta muutosta (11). Mikäli kymmenen epäonnistunutta yritystä on tehty tietyn kerroinsarjän parantamiseksi, tämä tarkoittaa sitä, että prosessi etenee väärään suuntaan ja kierroslaskin käännetään takaisin (12) siten, että sekä viimeisin ja sitä edeltävät sarjat tulevat hylätyiksi. Luonnollisesti (13, 14) tämä rajoitus ei koske ensimmäistä iterointia (tai sitä seuraavia vai- i heitä, joissa prosessi palautuu takaisin arvoon Gq).
Iteroinnin päättäminen muodostaa sarjan kertoimia Cn, jotka eivät muodosta törmäystä (tai muodostavat rajoitetun määrän törmäyksiä) testissä silloin kun modulirajoitusta ei käytetä summauksessa. Sarja arvoja h'j (j = 0 ... T-l, jossa T on testattujen kuvien lukumäärä), jotka on saatu käyttämällä kyseistä kerroinsarjaa, oletetaan (6a) tallennetuiksi muistiin ja nyt ne prosessoidaan moduli x:n löytämiseksi. Tämä aikaansaadaan muuttamalla h':n sarja x:n peräkkäisiksi arvoiksi alkaen Mistä, jossa M on standardikuvin lukumäärä.
Pienin x:n arvo, joka ei aiheuta törmäystä (kuten yllä on määritelty) - tai aiheuttaa rajoitetun määrän törmäyksiä -on vaadittu tulos. Tämä prosessi on esitetty kuvion 6 kulku-kaaviossa. Ulkopiiri A tutkii x:n kunkin arvon vuorollaan ja päättyy löytäessään arvon, joka ei aiheuta törmäystä. Keski-piiri B laskee sen hetkiselle modulille x h^rn kunkin peräkkäisen arvon kun taas sisäpiiri C tarkistaa h^in vertaamalla sitä h;n kaikkiin aikaisempiin arvoihin törmäyksen aiheuttamassa x:n arvossa.
Ί ' - i l il l i t a» . . | 11 96646
Voidaan todeta, että kaikkia mahdollisia syöttökuvia ei ole testattu kertoimien ja modulin derivoinnissa. Tarkoituksena on, että standardikuvat ja niiden variantit tulisi olla valittuina siten, että ne kattavat kiinnostavimmat kuvat. Tässä esimerkissä tarkoituksena on, että sellaiset kuvat, joiden paikoista yli puolet sisältävät arvon "l" ovat sellaisia, että niitä edustaa standardi "kaikki 1" kuva (Z13). Nämä ja muut testaamattomat kuvat voivat käytössä aiheuttaa virheellisiä tuloksia ja tästä syystä menetelmään kuuluu lisävaihe, jossa tulos tarkistetaan. Saatua koodia vastaavaa standardikuvaa verrataan sisäänsyöttökuvaan. Mikäli jälkimmäinen sisältää arvon "1" jossakin paikassa, jossa edellinen ei sitä sisällä, tarkistus , osoittaa virhettä ja saatu koodi korvataan Z^ista. Toiminta on esitetty kaaviomaisesti kuviossa 1 testiyksiköliä 9 ja kääntökytkimellä 10. Tämä prosessi kompensoi myös ne virheet, joita aiheuttaa yllämaintitu vaihtoehtoinen lievitetty törmäys-kriteeri.
Keksinnön eräs toinen sovellutus on liikevektorien muodostaminen. Tässä verrataan aikaisemman kuvaruudun lohkoa nykyisen ruudun siirrettyihin lohkoihin (tai päinvastoin), jotta saadaan selville se lohkoasema nykyisessä ruudussa, jota aikaisempi lohko lähimmin vastaa ja saadaan muodostetuksi liikevektori, joka edustaa liikkeen suuruutta ja suuntaa. Tätä tekniikkaa käytetään mm. ruutujen välissä koodausjärjestelmissä, joissa liikevektori voidaan siirtää vastaanottimeen ja käyttää sitä edellisen ruudun tehon parantamiseksi ennusteeksi sen sijaan, että käytettäisiin aikaisempaa ruutua siirtämällä kuvan sopivia osia toisiinsa nähden.
. Kuten aikaisemminkin, korrelointimenetelmät ovat hitaita.
Käyttämällä liikevektoreita tällä tavoin ei siirrettyjen ja siirtämättömien lohkojen välisen vertailun tarvitse olla aivan täsmällinen kunhan vain tulos antaa paremman ennusteen kuin aikaisempi modifioimaton ruutu.
12 966 46
Seuraavaksi kuvattavia liikevektorin muodostustuloksia voidaan käyttää välittömästi tai ne voivat muodostaa ensimmäisen arvion tavanomaisten liikevektorimuodostusmenetelmien "etsintäalueen" rajoittamiseksi.
Oletetaan, että kuvan kaikille lohkoille on annettu koodiluvut yllä kuvatulla tavalla (perustuen elementtiarvoihin eikä muutoskertoimiin). Tällöin edetään siten, että ensiksi paikallistetaan yksi tai useampia lohkoja, joilla on "täysin liikkuva" koodi Z12 - eli identifioidaan kuvan ne alueet, joilla tapahtuu olennainen liikemäärä.
Kutakin tällaista lohkoa varten suoritetaan vertailu tämän lohkoaseman koodien välillä nykyisissä ja edellisissä ruuduissa, jossa saadaan selville se liikesuunta, jota tämä edustaa (kuten jäljempänä kuvataan yksityiskohtaisemmin). Kahdeksan ympäröivää lohkoa tutkitaan samalla tavoin ja mikäli vastaavuus löydetään (esim. mikäli yli puolet dedusoiduista suunnista on sama), silloin tämä suunta otetaan vaadituksi arvioksi.
Vertailuprosessi on kuvattu kuviossa 7. Mikäli aikaisempien ja nykyisten ruutujen koodit ovat Ζχχ ja Zg vastaten kuviossa 7(a) esitettyjä standardikuvia, tällöin liikesuunnan oletetaan olevan nuolen osoittama. Kuvioissa 7(b) ja (c) on esitetty lisäesimerkkejä. Liikevektoriparametreilla varustettu haku-taulukko voidaan ottaa mukaan siten, että se vastaa kutakin koodiparia.
Luonnollisesti jos kahden lohkon vertailu osoittaa, että ne ·. kokonaisuudessaan liikkuvat, tällöin ei saada mitään tietoja ja päätös tehdään tätä lohkoa ympäröivien lohkojen vertailujen perusteella tai - silloin kun vierekkäiset lohkot ovat myös täysin liikkeessä molemmissa ruuduissa - vertaillaan tällaisten lohkojen ryhmää ympäröiviä lohkoja.
il : M » III H IM ; i .
Claims (8)
1. Kuvankäsittelylaite kaksiulotteista kuvaa edustavista signaaleista derivoidun arvosarjan luokittelemiseksi stan- 5 dardimallien sarjan suhteen, johon laitteeseen kuuluu sum-mauselimet näiden arvojen painotetun summan, moduli x:n muodostamiseksi, jossa x on pienempi kokonaisluku kuin 2p, muttei pienempi kuin standardimallien lukumäärä, jolloin p on sarjassa olevien arvojen lukumäärä; ja muisti, jonka x 10 paikkaa kukin sisältää luokan identifiointisanan, joka edustaa yhtä standardimallien sarjasta, jolloin muistin osoitesyötöt on liitetty siten, että ne vastaanottavat sammutuselinten tulostuksen, t u n e t t u siitä, että x:n ja painotetun summan muodostamiseen käytettyjen painotusker-15 toimien arvot on valittu siten, että mallit, jotka ovat standardimallin kanssa samanlaisia, syötettyinä summaus-elimiin pyrkivät sellaisen ulostulon muodostamiseen, joka osoittaa samaa paikkaa, tai paikkoja joilla on sama identi-fiointisana. 20
1 3 96646
2. Patenttivaatimuksen 1 mukainen laite, tunnettu siitä, että siihen kuuluu elimet kuvan vastaavia elementtejä edustavien tietojen vastaanottamiseksi ja identifioimaan kustakin kuvan elementtien useista ryhmistä se näiden ennal- 25 ta määriteltyjen ryhmien sarjasta, jonka sarjan kuhunkin ·: jäseneen liittyy koodi, jota tämä ryhmä kaikkein lähimmin muistuttaa ennalta määrätyn kriteerin mukaisesti, jolloin nämä identifioituihin ryhmiin liittyvät koodit muodostavat mainitun arvosarjan. 30
3. Patenttivaatimuksen 1 tai 2 mukainen laite, t u n - ·· n e t t u siitä, että painotettu summa on muodostettu seuraavan kaavan summausfunktiolla: TC N-l 35 —j h = / q(i).c(i) i = 0 MODx 96646 1 4 jossa q (i) tarkoittaa mainittuja arvoja, N on sarjassa olevien arvojen lukumäärä ja c(i) tarkoittaa painotuskertoi-mia, jotka on derivoitu iteratiivisella prosessilla, jossa kerroin arvoihin on tehty sattumanvarainen muutos, ja että 5 kaavalla: N-l h' = 2_, q(i).c(i) i = 0 10 määritelty modifioitu summausfunktio on sovitettu sarjaan testikuvia, jolloin sattumanvarainen muutos säilytetään iteroinnin jatkamiseksi vain silloin kun muutos on aiheuttanut parannuksen esiintyvien törmäysten lukumäärässä, jolloin törmäys on määritelty h':n identtisten arvojen muodostumise-15 na kahden kuvan kohdalla, jotka ennaltamäärätyn luokituskri-teerin mukaisesti eivät kuulu samaan luokkaan, ja prosessi toistetaan.
4. Patenttivaatimuksen 3 mukainen laite, tunnettu 20 siitä, että moduli x on derivoitu etsimällä se pienin kokonaisluku, jolla iteroinnnilla löydetyn kerroinsarjän saatujen h' arvojen modulireduktio ei aiheuta törmäystä tai aiheuttaa vähemmän kun ennalta määrätyn määrän törmäyksiä.
5. Jonkin edellä olevan patenttivaatimuksen mukainen laite, '.· tunnettu siitä, että siihen kuuluu lisäksi testieli- met kaksiulotteisen kuvan vertaamiseksi standardikuvaan, joka vastaa muistin tulostuksessa saatua luokan identifioin- tisanaa, ja jolloin tilalle sijoitetaan vaihtoehtoinen 30 luokan identifiointisana siinä tapauksessa, että kuva ei kuulu ennalta määrätyn luokituskriteerin mukaisesti samaan !! luokkaan kuin kyseinen standardisana. *
6. Videokoodauslaite, johon kuuluu ruutujen väliset koo-35 dauselimet ja elimet liikematriisin muodostamiseksi, joka matriisi osoittaa kuvan ne elementit, jotka ovat olennaisesti muuttuneet ruutujen välillä, tunnettu siitä, että < · IH.i 14It M4JK . . . 1 5 96646 siihen kuuluu jonkun edellä olevan patenttivaatimuksen mukainen laite näiden matriisien luokittelemiseksi ja elimet niiden siirtämiseksi vastaanottimeen kutakin kuvaa varten, jolloin kuvan vastaava luokan identifiointisana ja tietoja 5 koskevat elementit on valittu tämän luokan identifiointisa-naan liittyvän standardikuvan mukaisesti.
7. Patenttivaatimuksen 6 mukainen videokoodauslaite, tunnettu siitä, että siihen kuuluu elimet liikevektorin 10 muodostamiseksi liikkuvan kuva-alueen suhteen vertaamalla vastaavien alueiden luokan identifiointisanoja kahdessa peräkkäisessä ruudussa.
8. Patenttivaatimuksen 7 mukainen videokoodauslaite, t u n -15 n e t t u siitä, että vertailu suoritetaan käyttämällä kahta luokan identifiointisanaa, jolloin päästään käsiksi hakutaulukkoon, johon on tallennettu liikevektorit, jotka vastaavat vastaavia luokan identifiointisanayhdistelmiä. 16 96646
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB868627787A GB8627787D0 (en) | 1986-11-20 | 1986-11-20 | Pattern processing |
| GB8627787 | 1986-11-20 | ||
| GB8700816 | 1987-11-17 | ||
| PCT/GB1987/000816 WO1988004084A1 (en) | 1986-11-20 | 1987-11-17 | Pattern processing |
Publications (4)
| Publication Number | Publication Date |
|---|---|
| FI883431L FI883431L (fi) | 1988-07-20 |
| FI883431A0 FI883431A0 (fi) | 1988-07-20 |
| FI96646B FI96646B (fi) | 1996-04-15 |
| FI96646C true FI96646C (fi) | 1996-07-25 |
Family
ID=10607665
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FI883431A FI96646C (fi) | 1986-11-20 | 1988-07-20 | Kuvien prosessointilaite |
Country Status (20)
| Country | Link |
|---|---|
| US (1) | US4930013A (fi) |
| EP (1) | EP0272794B1 (fi) |
| JP (1) | JP2674770B2 (fi) |
| KR (1) | KR950001947B1 (fi) |
| CN (1) | CN1015951B (fi) |
| AT (1) | ATE133508T1 (fi) |
| AU (1) | AU607450B2 (fi) |
| CA (1) | CA1292320C (fi) |
| DE (1) | DE3751684T2 (fi) |
| DK (1) | DK171882B1 (fi) |
| ES (1) | ES2081799T3 (fi) |
| FI (1) | FI96646C (fi) |
| GB (1) | GB8627787D0 (fi) |
| HK (1) | HK110897A (fi) |
| IE (2) | IE65473B1 (fi) |
| IN (4) | IN170294B (fi) |
| NO (1) | NO174986C (fi) |
| NZ (1) | NZ222623A (fi) |
| PT (1) | PT86190B (fi) |
| WO (1) | WO1988004084A1 (fi) |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5083206A (en) * | 1990-03-19 | 1992-01-21 | At&T Bell Laboratories | High definition television arrangement including noise immunity means |
| JPH03272290A (ja) * | 1990-03-20 | 1991-12-03 | Victor Co Of Japan Ltd | 画像フィルタ処理装置 |
| US6005627A (en) * | 1991-05-31 | 1999-12-21 | Kabushiki Kaisha Toshiba | Video coding apparatus |
| US5325126A (en) * | 1992-04-01 | 1994-06-28 | Intel Corporation | Method and apparatus for real time compression and decompression of a digital motion video signal |
| US5337085A (en) * | 1992-04-10 | 1994-08-09 | Comsat Corporation | Coding technique for high definition television signals |
| DE4314483A1 (de) * | 1993-05-03 | 1994-11-10 | Philips Patentverwaltung | Überwachungssystem |
| US5909460A (en) * | 1995-12-07 | 1999-06-01 | Ericsson, Inc. | Efficient apparatus for simultaneous modulation and digital beamforming for an antenna array |
| US6614845B1 (en) * | 1996-12-24 | 2003-09-02 | Verizon Laboratories Inc. | Method and apparatus for differential macroblock coding for intra-frame data in video conferencing systems |
| FR2770726A1 (fr) * | 1997-11-03 | 1999-04-30 | Telediffusion Fse | Procede de transmission d'images video numerisees |
| JP4636786B2 (ja) * | 2003-08-28 | 2011-02-23 | カシオ計算機株式会社 | 撮影画像投影装置、撮影画像投影装置の画像処理方法及びプログラム |
| CN1319373C (zh) * | 2003-09-19 | 2007-05-30 | 四川长虹电器股份有限公司 | 一种信号模式识别的方法及adc参数的设置方法 |
| US7965773B1 (en) * | 2005-06-30 | 2011-06-21 | Advanced Micro Devices, Inc. | Macroblock cache |
| US10402436B2 (en) | 2016-05-12 | 2019-09-03 | Pixel Forensics, Inc. | Automated video categorization, value determination and promotion/demotion via multi-attribute feature computation |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2423817A1 (de) * | 1973-07-16 | 1975-02-06 | Ibm | Verfahren und schaltungsanordnungen zur codierung zweidimensionaler bildinformationen |
| JPS5952768B2 (ja) * | 1976-09-14 | 1984-12-21 | 三菱電機株式会社 | 色彩図形の特徴抽出方式 |
| JPS5929020B2 (ja) * | 1977-06-08 | 1984-07-17 | 松下電器産業株式会社 | 2次元ブロック符号化方法 |
| JPS55105475A (en) * | 1979-02-06 | 1980-08-13 | Nippon Telegr & Teleph Corp <Ntt> | Color picture coding process system |
| CA1212452A (en) * | 1982-06-11 | 1986-10-07 | Tokumichi Murakami | Vector quantizer |
| EP0192929A1 (de) * | 1985-02-07 | 1986-09-03 | Siemens Aktiengesellschaft | Anordnung zum selbsttätigen Ermitteln von Reaktionen in Abhängigkeit von Situationen |
| US4779131A (en) * | 1985-07-26 | 1988-10-18 | Sony Corporation | Apparatus for detecting television image movement |
-
1986
- 1986-11-20 GB GB868627787A patent/GB8627787D0/en active Pending
-
1987
- 1987-11-17 WO PCT/GB1987/000816 patent/WO1988004084A1/en not_active Ceased
- 1987-11-17 ES ES87310139T patent/ES2081799T3/es not_active Expired - Lifetime
- 1987-11-17 US US07/221,790 patent/US4930013A/en not_active Expired - Lifetime
- 1987-11-17 DE DE3751684T patent/DE3751684T2/de not_active Expired - Lifetime
- 1987-11-17 KR KR1019880700873A patent/KR950001947B1/ko not_active Expired - Fee Related
- 1987-11-17 IN IN827/MAS/87A patent/IN170294B/en unknown
- 1987-11-17 AT AT87310139T patent/ATE133508T1/de not_active IP Right Cessation
- 1987-11-17 EP EP87310139A patent/EP0272794B1/en not_active Expired - Lifetime
- 1987-11-17 AU AU82342/87A patent/AU607450B2/en not_active Ceased
- 1987-11-17 JP JP62506817A patent/JP2674770B2/ja not_active Expired - Lifetime
- 1987-11-19 CA CA000552281A patent/CA1292320C/en not_active Expired - Lifetime
- 1987-11-20 PT PT86190A patent/PT86190B/pt not_active IP Right Cessation
- 1987-11-20 IE IE314087A patent/IE65473B1/en not_active IP Right Cessation
- 1987-11-20 IE IE873140A patent/IE873240L/xx unknown
- 1987-11-20 CN CN87101244A patent/CN1015951B/zh not_active Expired
- 1987-11-20 NZ NZ222623A patent/NZ222623A/xx unknown
-
1988
- 1988-07-12 DK DK389588A patent/DK171882B1/da active
- 1988-07-19 NO NO883209A patent/NO174986C/no unknown
- 1988-07-20 FI FI883431A patent/FI96646C/fi not_active IP Right Cessation
-
1991
- 1991-05-27 IN IN402MA1991 patent/IN173778B/en unknown
- 1991-05-27 IN IN400MA1991 patent/IN173776B/en unknown
- 1991-05-27 IN IN401MA1991 patent/IN173777B/en unknown
-
1997
- 1997-06-29 HK HK110897A patent/HK110897A/en not_active IP Right Cessation
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| FI96646B (fi) | Kuvien prosessointilaite | |
| US6292114B1 (en) | Efficient memory mapping of a huffman coded list suitable for bit-serial decoding | |
| US6157745A (en) | Method and system for coding and decoding a sequence of segmented images | |
| EP1523196A2 (en) | Encoding system of motion image containing arbitrary object | |
| US4910608A (en) | Imagery data compression mechanism employing adaptive vector quantizer | |
| JPH05300382A (ja) | ビットプレーン符号化方法及び装置 | |
| US4870695A (en) | Compression and de-compression of column-interlaced, row-interlaced graylevel digital images | |
| KR20030096443A (ko) | 부호화 방법 및 장치와 복호화 방법 및 장치 | |
| GB2333412A (en) | A context based coding/decoding method and apparatus | |
| US6121905A (en) | Method and apparatus for decoding JPEG symbols | |
| US6594310B1 (en) | Partition coding method and device | |
| EP0283798A2 (en) | Compression and decompression of column-interlaced, row-interlaced graylevel digital images | |
| KR100689642B1 (ko) | 부호화 장치 및 방법, 복호 장치 및 방법 | |
| JPH0918350A (ja) | 符号化復号化装置及び符号化復号化方法 | |
| JPH0936749A (ja) | 符号化復号化装置およびこれに用いられる符号化方法 | |
| JP3272214B2 (ja) | 格子量子化器および入力ベクトルを格子量子化するための方法 | |
| RU2316908C2 (ru) | Способ совместного использования векторного квантования и фрактального кодирования изображений | |
| KR20260027263A (ko) | 이미지 시퀀스를 인코딩 및 디코딩하기 위한 방법 및 장치 | |
| KR0169666B1 (ko) | 피티에스 벡터양자화 부호기의 왜곡치 계산장치 | |
| JPH10150664A (ja) | 映像信号符号化装置および復号化装置 | |
| Liu | Ordered Kohonen vector quantization for very low rate interframe video coding | |
| Lee | Design and implementation of robust signal processors with applications to video coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| BB | Publication of examined application | ||
| MM | Patent lapsed | ||
| MM | Patent lapsed |
Owner name: BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY |