PT86190B - Aparelho para classificar valores de um padrao bidireccional e aparelho de codificacao de sinais video que utiliza o mesmo - Google Patents

Aparelho para classificar valores de um padrao bidireccional e aparelho de codificacao de sinais video que utiliza o mesmo Download PDF

Info

Publication number
PT86190B
PT86190B PT86190A PT8619087A PT86190B PT 86190 B PT86190 B PT 86190B PT 86190 A PT86190 A PT 86190A PT 8619087 A PT8619087 A PT 8619087A PT 86190 B PT86190 B PT 86190B
Authority
PT
Portugal
Prior art keywords
values
pattern
class identification
image
coefficients
Prior art date
Application number
PT86190A
Other languages
English (en)
Other versions
PT86190A (pt
Inventor
Anthony Richard Leaning
Original Assignee
British Telecomm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecomm filed Critical British Telecomm
Publication of PT86190A publication Critical patent/PT86190A/pt
Publication of PT86190B publication Critical patent/PT86190B/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Error Detection And Correction (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Exposure Of Semiconductors, Excluding Electron Or Ion Beam Exposure (AREA)
  • Polarising Elements (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Mechanical Treatment Of Semiconductor (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Photoreceptors In Electrophotography (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Dc Digital Transmission (AREA)
  • Details Of Television Scanning (AREA)
  • Picture Signal Circuits (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Power Steering Mechanism (AREA)

Description

Memória descritiva referente à patente da invenção de BRITISH TELECOMMUNICATIONS public limited cotnpany, britânica, industrial e comercial, com. sede em 81 Newgate Street, London ECLA 7AJ, Inglaterra, (inventor: Anthony Richard Leaning, residente na Inglaterra), para APARELHO PARA CLASSIFICAR VALORES DE UM PADRÃO BIDIRECCIO.NAL E APARELHO DE CODIFICAÇÃO DE SINAIS VIDEO QUE UTILIZA'O MESMO
Memória descritiva
A presente invenção refere-se ao processamento de padrões e diz respeito em particular, embora não exclusivamento, à aplicação de tal processamento à codificação de sinais video.
Um exemplo é em codificadores de video que utilizam a codificação por reenchimento condicional entre. Imagens para a transmissão de imagens móveis. Faz-se a diferença entre valores dos elementos de imagem e valores preditos (isto é, provenientes da imagem anterior).
As diferenças são aplicadas a um circuito de limiar que, para cada valor da diferença produz um 1 ou um O indican do se excedeu ou não um valor de limiar, formando assim uma matriz de movimentos. Apenas os valores de elementos (ou, se se preferir, diferenças de elementos) que tenham um 1 no elemento correspondente da matriz de movimentos são codi1
ficados para a transmissão.
No receptor, a informação recebida é usada para actualiza r uma imagem armazenada num armazém de imagem local. A fim de o receptor poder descodificar corectamente a informação, tem de ser incluída informação secundária, que indique quais os coeficientes que foram emitidos, na transmissão. A emissão de todos os bits da matriz de movimentos representa um dispêndio substancial, tendo por isso sido proposto dividir a imagem em 8 x 8 blocos e quantificar vectorialmente cada uma das 8 x8 matrizes de movimentos ajustando-a ao mais próximo de um conjunto de (por exemplo) 32 padrões que podem ser identificadas para o receptor usando apenas cinco bits transmitidos. Até agora esse ajustamento ou aplicação tem si do obtido utilizando um processo de correlação com os padrõe s isso, do ponto de vista da computação, é extravagante e, mes mo com processamento de alta velocidade, 32 padrões é o máxi mo possível normalmente praticável em tempo real.
A técnica é também aplicavél aos chamados codificadores de video híbridos nos quais se utiliza uma combinação de codificar por transformação e a codificação de reenchimento condicional inter-imagens. A codificação por transformação envolve a aplicação de uma transformação bidimensional tal como a transformação de Hadamard ou transformação discreta de coseno (DCT) a (por exemplo 8x8) blocos de elementos de imagem para produzir coeficientes da matriz de transformação correspondentes (transformação de uma imagem completa imediatamente é demaseado lento para o processamento em tempo real). Aqui, a matriz de movimentos é baseada nas diferenças entre os coeficientes da matriz da imagem corrente e os da imagem anterior.
Numa variante deste processo, a realização das diferenças entre os coeficientes pode preceder a transformação em vez de se lhe seguir .
De acordo com unu aspecto da presente invenção proporciona -se um processo para a classificação de um conjunto de valores representando um padrão bidlmencional que compreende a formação de uma soma ponderada desses valores, módulo x, onde f
('
x é um número inteiro menor que 2^ , sendo p o número de valores no conjunto, e utilizando a soma como endereço para aceder a uma memória com x posição, cada uma delas contendo uma palavra de identificação de classes..
Em princípio, os valores referidos podem ser o valor asso ciado com cada elemento de padrão, mas a soma pode ser simplificada e a sua derivação dos coeficientes de ponderação e do módulo , facilitada formando primeiramente um conjunto de valores, cada um dos quais representa um certo número de elementos. Assim, uma forma preferida de realização da prese nte invenção inclui a derivação do conjunto de valores por i identificação, para cada um de uma multitude de grupos de elementos do padrão, aquele de um conjunto de tafs grupos pré-determinados, cada um dos quais tem um código com ele associado, a que esse grupo se assemelha mais de acordo com um critério pré-determinado, formando os códigos associados com os grupos assim identificados o conjunto de valores.
Os grupos podem ser as linhas (ou as colunas) de uma matriz rectangular do padrão, embora sejam possíveis outras so luções.
Vai agora descrever-se uma forma de realização da presente invenção a título de exemplo, com referência aos desenhos anexos, cujas figuras representam:
A fig. 1, um esquema de blocos de um aparelho para a quan tificação vectorial de matrizes de movimentos;
A fig. 2, um conjunto de vectores linhas padrões;
A fig. 3, um conjunto de padrões nçrmalizados;
A fig. 4, um diagrama que ilustra o conceito da topologia dos domínios do padrão;
As fig. 5 e 6, fluxogramas para a derivação dos coeficien tes e módulos; e
A fig. 7, um diagrama que ilustra a geração do vector dos movimentos.
Os dispositivos a descrever são utilizados num codificado de video que se supõe formar, como se descreveu na introdu ção, para cada um de de um certo número de blocos de 8 x 8 pixel (elementos de imagem) uma matriz dos movimentos de 8 x elementos, cada um de cujos elementos é um único bit que indica se o elemento de imagem (ou coeficiente de transformação) correspondente mudou substâncialmente entre imagens.
problema atras discutida· é um problema de dividir 264 padrões possíveis num número menor (32) de classes.
Em teoria isso poderia conseguir-se utilizando uma tabela de consulta com 2° posições, cada uma delas contendo um número de cinco bits que indicasse a que classe pertencia o pa drão', mas evidentemente que uma tabela de tal dimensão é impraticável. Mesmo que a matriz fosse processada previamente por quantificação vectorial das linhas da matriz, representa ndo cada linha de 8 bits, a dimensão da tabela seria ainda 40 assim de 2 .0 processo proposto utiliza uma função de soma módulo x para elaborar o mapa dos 2 (2^°) padrões num menor número x de classes. Os valores dos coeficientes da função soma e o módulo x têm evidentemente de ser escolhidos para se adaptar ao conjunto de padrões desejado, como adiante será descrito. Embora em casos exceptionais um conjunto particular de padrões deva permitir que x seja igual ao número de classes, em geral não é esse o caso, mas na prática verifica-se que pode fazer-se x suficientemente pequeno para permitir uma tabela de consulta com x posição contendo cada uma delas um número de cinco bits que identifique uma das 32 classes.
A fig. 1 representa um dispositivo, que faz parte de um codificador de video que serve para identificar qual aquele de dois padrões normalizados se assemelha mais a uma matriz de movimentos de 8x8x1 bits de entrada. Admite-se que a matriz de movimentos com um bit por elemento b (i,j) foi gerada e está armazenada numa memória tampão de 64 bits (1).
Um contador de endereços de 6 bits (2) é comandado por im pulsos de relógio para gerar endereços de O a 63, que são aplicados a entradas de endereços da memória (1). A saida de dados b (i,j) da memória (1) e os endereços de colunas (j) são aplicados a um quantificador de linhas (3), que produz um código de vectores linhas de cinco bits q )i). Os endereços de linhas (i) são aplicados a entradas de endereços de
de uma memória fixa de coeficientes (4), com 8 posições, con tendo cada uma um coeficiente de 8 bits c (i). Os códigos dos vectores linhas q(i) e as sãidas de dados da memória (4) são fornecidos multiplicador (5) que forma o produto. Os pro dutos são aplicados ao acumulador que compreende um adiciona dor módulo x (6) e um retentor de 16 bits (7), cuja saida é reenviada para tràs para uma entrada do adicionador.
á evidente que’o módulo não pode exceder 2^^.
A saida do acumulador forma a entrada de endereço para uma tabela de consulta constituida por uma outra memória fixa (8) com 2X = 64K posições (das quais apenas x são usadas) cada uma delas contém uma palavra de cinco bits que identifi ca uma de 32 classes de padrões às quais se devem atribuir as matrizes de movimentos de entrada. A saida de dados (8) da memória (7) oferece assim a palavra de cinco bits peleccionada provenientemente da tabela, de acordo com o valor da soma módulo x.
Considerando o processo com mais pormenor, admitiu-se que o padrão de entrada é constituido por uma matriz B de 8 x 8 elementos, cada elemento b (i,j) da qual é um único bit que indica se um elemento de imagem (pixel) correspondente de uma imagem foi considerado movente (?1“) ou não (0).
Este é um factor significativo na procura do critério de semelhança, visto que é preferível representar um pixel como movente quando ele o não for que representar um pixel movente como fixo.
No quantificador de linhas (3), o conteúdo de informação da matriz 8 x 8 x 1 é quantificado por linhas, no sentido de que cada linha horizontal de 8 x 1 bits é ajustado à mais próxima de um conjunto de vectores bases 8x1. São conside rados seis vectores base, como se representa na fig. 2.
Notar que não é em princípio necessário que os grupos de bits sujeitos a este processo sejam derivados de linhas da matriz de entrada; são possíveis outras selecções.
Cada vector de base é representado por um código (Vn,,,v ) Estes códigos poderiam em principio ser os números inteiros de O a 6; porém foram encontradas outras escolhas para
produzir melhores resultados. Sm particular, verificou-se se.? preferivel escolher números muito afastados, principalmente números primos, na gama de 0 a 255, por exemplo 141 , 95 , 111 , 173 , 237 , 29 , 192 , 224 , ou 149 , 97 , 113 , 173 , 239 , 29 , 137 , 43.
conjunto tem de ser escolhido manualmente, mas a comparação de conjuntos candidatos possíveis pode ser feita por aplicação do algoritmo de iteração de coeficientes descrito adiante a cada um deles (usando os masmos números aleatórios em cada caso). Admite-se que o conjunto melhor é o que dá uma convergência mais rápida.
processo de adaptação exige que uma linha de entrada com l em qualquer posição não seja adaptada a um vector de base com um O nessa posição. Por exemplo, a linha de entra da (El) representada na fig. 2 não pode adaptar-se a (V4) (ostensivamente a mais próxima) devido ao 1 na posição (7); ela tem de adaptar-se a (V ).
o
Assim procede-se por identificação do ou dos vectores de com um 1 em todas as posições em que a linha de entrada tem um 1. Se houver mais de uma, a mais próxima destas, em termos de ter o menor número de bits que diferem dos bits correspondentes na linha de entrada, é a escolhida.
A matriz de entrada 8x8 está agora convertida num vector q(i) com 8 elementos.
Este vector é agora de novo quantificado pelo multiplicador (5) e o acumulador (6,7), com o auxílio da memória de coeficientes (4), formando uma soma ponderada (h) dos seus elementos, módulo x, nomeadamente:
i-7 v
h - Z_—i q (i) . c (i) iz0
MOD x (esta definição é referida na descrição seguinte como função somatório).
Tendo a matriz de entrada sido assim convertida numa so ma escalar (de ordem O a x), ela é então usada para acesso à tabela de consulta da memória (8), a partir da qual podem ler-se palavras que indicam o padrão normalizado que deve ser usado.
Na fig. 3 estão representados catorze exemplos de padrões normalizados, juntamente com os respectivos códigos, (z .(z 13
Compreender-se-á que a soma ponderada que seria produzida acumulador sem a restricção módulo x representa uma topologia dos padrões possíveis - alguns dos quais estão representados na fig. 4, como cruzes (A) a (E), no interior de um domínio de padrões ideal (P) num domínio soma (S) cuja dimensão dependerá dos valores dos coeficientes c(j) e dos códigos de vectores linha (V ),... (Vc). Se os coeficientes o □ estiverem numericamente muito afastados, então todos os padrões será localizados na topologia em posições diferentes dentro do domínio (S). Se esta condição não for satifeita, então alguns padrões aparecerão como o mesmo padrão no domínio (S) (ver os padrões (C;E) ). Isto é desejável apenas se os dois padrões pertencerem à mesma classe, evidentemente.
uso da acumulação módulo x reduz a dimensão do domínio (s) dobrando-o sobre si próprio uma ou mais vezes. Uma dobra simples está representada, para ilustração, na fig. 4 na qual o padrão (B) agora coincide com (C) e (E) no domínio (H) .
Os coeficientes e o módulo têm que ser escolhidos de modo a encontrar-se um valor do módulo aceitavelmente baixo enquanto que se assegura que, se possível, apenas os padrões pertencentes à mesma classe são localizados na topologia para os mesmos valores de H (embora na prática sejam tolerados alguns erros, como adiante se discute). O inventor não tem conhecimento de qualquer demostração teórica de que isso pode ser conseguido nem de qualquer processo teórico para a determinação dos valores de c(i) e de x. No entanto, a experiência mostrou que podem obeter-se resultados satisfatórios usando um procedimento iterativo para obter esses valores.
Um processo para obter valores apropriados para os coefl=
cientes c(i) e do módulo x vai agora ser descrito. Utiliza-se um processo iterativo para a obtenção dos coeficientes c(i) e isso requer um ensaio períodico dos coeficientes iterados por aplicação da somatória (sem restriçãp de módulo) a uma sequência de ensaios de padrões.
Com toda a evidência não é prático ensaiar todos os 2° padrões 8x8, nem mesmo os 2^ padrões possíveis quando expressos em vectores quantificados. Por conseguinte, o ensaio limita-se aos próprios padrões normalizados e a uma claí se de padrões definidos como variantes dos padrões normalizados. Um padrão variante é definido como sendo um padrão normalizado (na forma de vector base) sendo um vector ou mais constituintes substituídos por um vector alternativo.
Cada vector base tem apenas uma certa gama de possibilidades de substituição, nomeadamente aqueles vectores que tên. 1 apenas em posições onde o vector original tem também um 1. Λ fig. 2 apresenta uma listagem dos vectores variantes associados com cada vector base. O conjunto de padrões variantes inclui todas as combinações possíveis de tais substituições. Esta definição de variantes representa um critério de similaridade entre um padrão variante e um padrão base,
isto é, quando se realiza a codificação de uma imagem um padrão variante deve produzir o mesmo número de código que o padrão normalizado de que ele é variante.
Um ensaio de um conjunto de coeficientes C- é realizado por aplicação do somatório aos padrões normalizados e aos padrões variantes para obter valores da soma h' (indicando a plica que a soma não é uma soma módulo).
Se se completar, este processo produzirá um conjunto de valores h' situado no intervalo q . J^.e (i) a q X^c (i) onde m li m 3.3^
ÇL·,-!,-. ® Q™ os valores minimo e máximo de q (ou v) . mln max
Porém, cada novo valor h’ gerado é verificado com valores anteriores de h'. A recorrência de um valor anterior de h1 é aceitável se os padrões que dão origem a esse valor forem do mesmo grupo de padrões normalizados padrões variantes (isto é, se eles tiverem o mesmo número de código).
Caso contrário isso implica uma localização topologica de
padrões distintos para o mesmo valor de h' e denomina-se uma colisão, sendo o número de colisões que se verificam no ensaio tomado como uma medida da bondade TEST (C) do conjunto de coeficientes C que está ensaiado.
O processo de iteração está ilustrado no fluxograma da fig. 5.
Cn * £cn Q... cn é a enésima iteração do conjunto de coeficientes, RND (r,s) indica a geração de um número aleatório no intervalo r a t. O processo prosegue da seguinte maneira.
Faz-se uma estimativa inicial Cq(1). Esta estimativa pode ser completamente aleatória, ou então o processo será abreviado se o operador fizer uma conjectura inspirada de um pon to de partida apropriado.
Esta estimativa é então ensaiada (2) e são inicializados contadores de iteração e de temporização (3,4). Um novo valor C é derivado (5) de C , escolhendo ao acaso um (c n n-1 n, R dos coeficientes efectuando uma variação aleatória P no mesmo. A primeira iteração utiliza uma variação grande (digamos para coeficientes no intervalo de O a 255, da ordem de 8 a
255), enquanto que as últimas utilizam apenas uma pequena variação (por exemplo no intervalo de 1 a 7). Isso pode ser feito por uma adição módulo 256,para manter os coeficientes nesses intervalos.
Ensaia-se agora o novo conjunto de coeficientes (6); se não se vereficar qualquer colisão (7), o processo está completo. Caso contrário, faz-se avançar o contador de temporização (8) e o resultado Gn do ensaio é comparado (9) com G -1 do ensaio anterior. Se se melhorou, avança-se o contador de ciclos (10) e repete-se o ciclo até que se obtenha um con junto de coeficientes de que não resulte uma colisão.
Este requisito pode no entanto ser tornado menos rígido, ou porque é inatingível ou para reduzir o tempo das iterações e terminar-se a iteração quando o número de colisões num ensaio for menor que uma proporção dada, por exemplo 5% ou 10% do número de padrões ensaiados. Em alternativa, o número de iterações pode ser limitado.
Quando se permitem colisões, deste modo, é necessário decidir qual das duas (ou mais) classes que fazem coincidir te pologicamente com o valor particular de h' esse valor de. h' deve ser tomada para a representação.
Para minimizar o número de erros de classificação que da: resultam usualmente escolher-se-á a classe que tem a maior probabilidade de ocorrência numa imagem típica.
Se em qualquer altura não se obtém uma melhoria, deita-se fora o último conjunto de coeficientes, por eliminação da incrementação do contador de ciclos antes de expermentar uma outra variação (11). Quando se tiverem feito dez tentativas infrutíferas para melhorar um coeficiente particular isso quer dizer que o processo está a avançar no sentido errado e decrementa-se o contador de ciclos (12), de modo que são deitados fora quer o último quer o penúltimo ciclos,
Ê claro (13,14) que está restrição não se aplica à priiteração (ou a outros casos ulteriores quando o processo re gride para G ).
A terminação da iteração proporciona um conjunto de coeficientes Cn que não dão qualquer colisão (ou dão um número limitado de colisões) no ensaio, quando não se aplica a res trição do módulo ao somatório.
O conjunto de valores h'j (j^; O ... T-l ), onde T é o nú mero de padrões ensaiados obtido utilizando esse conjunto de coeficientes é considerado (6a) ter sido armazenado e os seus valores são agora processados para obter o módulo x.
Isso consegue-se convertendo o conjunto de h' para sucessivos valores de x a começar em M, sendo Μ o número de padrões normalizados.
menor valor de x que não dá origem a uma colisão (como atrás de define) - ou a um número limitado de colisões - é o resultado pretendido. Este processo está ilustrado no flu xograma da fig. 6. O anel exteriore (A) examina cada valor de x por sua vez e termina quando encontrar um valor que não dá origem a uma colisão. O anel médio (B) calcuiia , para o módulo x corrente, cada valor sucessivo de h·^ enquanto que o anel interior (C) verifica h. em face de todos os valores anteriores de h e esse valor de x relativamente a uma colisão.
Observar-se-á que nem todos os padrões de entrada possíveis foram ensaiados na determinação dos coeficientes e do módulo. Pretende-se que os padrões normalizados e os seus variantes devem ter sido escolhidos por forma a cobrir os padrões com maior interesse.
Neste exemplo, os padrões em que mais de metade das suas posições contêm um 1 devem ser representados por um padrão normalizado de tudo uns (Z^^)· Estes e outros padrões não ensaiados podem, em operação, dar origem a resultados espúrios e portanto o processo inclui a face adicional de verificar o resultado. O padrão normalizado correspondente ao código obtido é comparado.com o padrão de entrada.
Se este contiver um 1 em qualquer posição em que o primeiro não tem, a verificação é negativa e Z^ é substituido para o código obtido. A operação está indicada esquemáticamente pela unidade de ensaio (9) e pelo comutador (10).
Este processo também compensará os erros provocados pelo critério alternativo de menor exigência quanto à ausência de colisão atrás referido.
Uma outra aplicação da presente invenção é na geração de vectores de movimento. Isso implica a comparação de um bloco de um fotograma da imagem anterior com blocos deslocados do fotograma corrente (ou viceversa) para averiguar a posição do bloco dentro do fotograma corrente a que o bloco anterior melhor corresponde e forma um vector de movimento que representa a grandeza e a direcção do movimento.
Uma utilização desta técnica é em sistemas de codificação inter-imagens onde o vector de movimento pode ser transmiti do para o receptor e utilizado para melhorar a eficiência da imagem anterior como preditor em vez de usar a imagem anterior com partes apropriadas da imagem deslocadas.
Como anteriormente, os métodos de correlação são lentos.
O uso de vectores de movimento deste modo não requer que a adaptação entre os blocos deslocado e não deslocado seja exacta, desde que o resultado seja uma predição melhor que a imagem anterior não modificada.
Os resultados da geração dos vectores de movimento que vão agora descrever-se podem ser usados directamente ou po-Λ dem constituir uma primeira estimativa para limitar a área de busca dos processos de geração dos vectores de movimento convencional.
Parte-se de hipótese de que a todos os blocos da imagem foram atribuidos números de código como na maneira atrás descrita (com base em valores de elementos em vez de coeficientes de transformação). Procede-se localizando primeiramente um ou mais blocos que têm o código de tudo movimento - isto é, identificam-se as áreas da imagem onde está a verificar-se uma quantidade de movimento.
Para cada bloco desses, faz-se uma comparação entre os códigos dessa posição do bloco nas imagens anteriores e cor rente para avaliar o sentido do movimento que isso represe]} ta (como se descreverá com mais pormenor mais adiante).
Examinam-se de maneira análoga os oito blocos circundantese se se obtiver consistência (por exemplo se mais de metade dos sentidos determinados forem iguais) então toma-se í i esse sentido como a estimativa desejada.
O processo de comparação está ilustrado na fig. 7. Se os códigos para as imagens anterior e corrente forem ΖΊ_ e Z,, representado os padrões normalizados ilustrados na fig. 7(a; então o sentido do movimento é considerado ser o indicado pela seta. As fig. 7(b) e 7(c) ilustram outros exemplos.
Deve proporcionar-se uma tabela de consulta com os parâmetros do movimento correspondentes a cada par de códigos.
É evidente que se uma comparação de dois blocos mostrar que eles estão totalmente em movimento, então não se obtém qualquer informação e a decisão é tomada na base das comparações dos blocos circundantes desse blico ou- quando os blo cos adjacentes estiverem também totalmente em movimento em ambas as imagens- um bloco envolvente de um grupo de tais blocos.

Claims (1)

  1. REIVINDICAÇÕES
    - 1δ -
    Aparelho para classificar um conjunto de valores que representam um padrão bidimensional, caracterizado por compreender meios de adição para a formação de uma soma ponderada módulo x daqueles valores, onde x é um número inteiro menor que , sendo p o número de valoI res no conjunto, e uma memória de x posições contendo cada uma delas uma palavra de identificação de classe que representa um de um conjunto de padrões, sendo as entradas de endereço da memória ligadas para receber a saída dos meios de adição,
    Aparelho de acordo com a reivindicação 1, caracterizado por incluir meios para receber dados que representam elementos respectivos do padrão e que identifição, para cada um de um certo número de grupos de elementos do padrão, o grupo de um conjunto de tais grupos pré-definidos, cada um dos quais tem um código com ele associado, a que esse grupo mais se assemelha de acordo com um critério pré-determinado, formando os códigos associados com os grupos assim identificados o conjunto de valores.
    -32 Aparelho de acordo com as reivin dicações 1 ou 2, caracterizado por a soma ponderada ser formada por uma função somatório da forma
    N-l 1-0 MODx onde q(i) são os referidos valores, N é o número de valores no conjunto e c(i) são coeficientes de ponderação que foram derivados por um processo iterativo no qual se efectua uma alteração aleatória dos valores dos coeficientes, e por se aplicar uma função somatório definida por:
    N-l h' = Σ i=o a uma série de padrões de ensaio, sendo a alteração aleatória retida para uma iteração ulterior apenas se a alteração tiver dado como resultado uma melhoria no número de colisões que ocorrem, sendo uma colisão definida como sendo a geração de valores idênticos de h' relativamente a dois padrões que, de acordo com um critério de classificação pré-determinado, não pertencem à mesma classe, repetindo-se o processo,
    - 4â -
    Aparelho de acordo com a reivindicação 3, caracterizado por o módulo x ter sido determinado procurando o menor número inteiro para o qual a redução do módulo dos valores h' obtidos para o conjunto de coeficientes obtidos pelos resultados das iterações dá como resultado a inextência de colisões ou um número de colisões inferior a um número pré-determinado.
    r V.
    (
    Aparelho de acordo com qualquer das reivindicações anteriores, caracterizado ainda por incluir meios de ensaio para comparar o padrão bidimensional com o padrão normalizado correspondente à palavra de identificação de classe obtida na saída da memória e por substituir por uma outra palavra de identificação de classe no caso em que o padrão não pertença, de acordo com o critério de classificação pré-determinado, à mesma classe que o padrão normalizado .
    - 6§ Aparelho codificador de sinais video com meios de codificação inter-imagens e meios para gerar uma matriz de movimentos indicando os elementos deium padrão de imagem que mudaram substancialmente entre imagens, caracterizado por incluir um aparelho de acordo com as reivindicações anteriores para classificar tais matrizes e meios para transmitir para um receptor, por cada padrão de imagem, a palavra de identificação de classe correspondente e informação referente ao padrão de imagem seleccionado de acordo com o padrão normalizado associado com a palavra de identificação de classe.
    - Aparelho de codificação de sinai 3 video de acordo com a reivindicação 6, caracterizado por incluir meios para gerar um vector de movimento relativamente a uma área móvel da imagem por comparação das palavras de identificação de classe em duas imagens sucessivas.
    8Aparelho de codificação de sinais video de acordo com a reivindicação 7, caracterizado por a comparação ser efectuada mediante à uiilização das duas palavras de identificação de classe para aceder a uma tabela de consulta na^ual estão armazenados vectores.de movimento correspondentes às combinações respeètivas das palavras de Identificação de classe.
    O' requerente declara que o primei ro pedido desta patente foi apresentado no Reino Unido em 20 de Novembro de 1986, sob o n®. 8627787
PT86190A 1986-11-20 1987-11-20 Aparelho para classificar valores de um padrao bidireccional e aparelho de codificacao de sinais video que utiliza o mesmo PT86190B (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB868627787A GB8627787D0 (en) 1986-11-20 1986-11-20 Pattern processing

Publications (2)

Publication Number Publication Date
PT86190A PT86190A (pt) 1988-12-15
PT86190B true PT86190B (pt) 1993-12-31

Family

ID=10607665

Family Applications (1)

Application Number Title Priority Date Filing Date
PT86190A PT86190B (pt) 1986-11-20 1987-11-20 Aparelho para classificar valores de um padrao bidireccional e aparelho de codificacao de sinais video que utiliza o mesmo

Country Status (20)

Country Link
US (1) US4930013A (pt)
EP (1) EP0272794B1 (pt)
JP (1) JP2674770B2 (pt)
KR (1) KR950001947B1 (pt)
CN (1) CN1015951B (pt)
AT (1) ATE133508T1 (pt)
AU (1) AU607450B2 (pt)
CA (1) CA1292320C (pt)
DE (1) DE3751684T2 (pt)
DK (1) DK171882B1 (pt)
ES (1) ES2081799T3 (pt)
FI (1) FI96646C (pt)
GB (1) GB8627787D0 (pt)
HK (1) HK110897A (pt)
IE (2) IE65473B1 (pt)
IN (4) IN170294B (pt)
NO (1) NO174986C (pt)
NZ (1) NZ222623A (pt)
PT (1) PT86190B (pt)
WO (1) WO1988004084A1 (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5083206A (en) * 1990-03-19 1992-01-21 At&T Bell Laboratories High definition television arrangement including noise immunity means
JPH03272290A (ja) * 1990-03-20 1991-12-03 Victor Co Of Japan Ltd 画像フィルタ処理装置
US6005627A (en) * 1991-05-31 1999-12-21 Kabushiki Kaisha Toshiba Video coding apparatus
US5325126A (en) * 1992-04-01 1994-06-28 Intel Corporation Method and apparatus for real time compression and decompression of a digital motion video signal
US5337085A (en) * 1992-04-10 1994-08-09 Comsat Corporation Coding technique for high definition television signals
DE4314483A1 (de) * 1993-05-03 1994-11-10 Philips Patentverwaltung Überwachungssystem
US5909460A (en) * 1995-12-07 1999-06-01 Ericsson, Inc. Efficient apparatus for simultaneous modulation and digital beamforming for an antenna array
US6614845B1 (en) * 1996-12-24 2003-09-02 Verizon Laboratories Inc. Method and apparatus for differential macroblock coding for intra-frame data in video conferencing systems
FR2770726A1 (fr) * 1997-11-03 1999-04-30 Telediffusion Fse Procede de transmission d'images video numerisees
JP4636786B2 (ja) 2003-08-28 2011-02-23 カシオ計算機株式会社 撮影画像投影装置、撮影画像投影装置の画像処理方法及びプログラム
CN1319373C (zh) * 2003-09-19 2007-05-30 四川长虹电器股份有限公司 一种信号模式识别的方法及adc参数的设置方法
US7965773B1 (en) * 2005-06-30 2011-06-21 Advanced Micro Devices, Inc. Macroblock cache
US10402436B2 (en) 2016-05-12 2019-09-03 Pixel Forensics, Inc. Automated video categorization, value determination and promotion/demotion via multi-attribute feature computation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2423817A1 (de) * 1973-07-16 1975-02-06 Ibm Verfahren und schaltungsanordnungen zur codierung zweidimensionaler bildinformationen
JPS5952768B2 (ja) * 1976-09-14 1984-12-21 三菱電機株式会社 色彩図形の特徴抽出方式
JPS5929020B2 (ja) * 1977-06-08 1984-07-17 松下電器産業株式会社 2次元ブロック符号化方法
JPS55105475A (en) * 1979-02-06 1980-08-13 Nippon Telegr & Teleph Corp <Ntt> Color picture coding process system
CA1212452A (en) * 1982-06-11 1986-10-07 Tokumichi Murakami Vector quantizer
EP0192929A1 (de) * 1985-02-07 1986-09-03 Siemens Aktiengesellschaft Anordnung zum selbsttätigen Ermitteln von Reaktionen in Abhängigkeit von Situationen
US4779131A (en) * 1985-07-26 1988-10-18 Sony Corporation Apparatus for detecting television image movement

Also Published As

Publication number Publication date
IN173778B (pt) 1994-07-09
IE873240L (en) 1988-05-20
DE3751684T2 (de) 1996-05-30
FI883431A (fi) 1988-07-20
ES2081799T3 (es) 1996-03-16
FI883431A0 (fi) 1988-07-20
IN173776B (pt) 1994-07-09
WO1988004084A1 (en) 1988-06-02
JP2674770B2 (ja) 1997-11-12
US4930013A (en) 1990-05-29
JPH01502143A (ja) 1989-07-27
EP0272794A1 (en) 1988-06-29
CN1015951B (zh) 1992-03-18
ATE133508T1 (de) 1996-02-15
AU607450B2 (en) 1991-03-07
DK389588A (da) 1988-07-12
DK389588D0 (da) 1988-07-12
IE65473B1 (en) 1995-11-01
NO883209L (no) 1988-09-19
EP0272794B1 (en) 1996-01-24
NO883209D0 (no) 1988-07-19
GB8627787D0 (en) 1986-12-17
CA1292320C (en) 1991-11-19
DE3751684D1 (de) 1996-03-07
DK171882B1 (da) 1997-07-28
IN173777B (pt) 1994-07-09
NO174986C (no) 1994-08-10
FI96646B (fi) 1996-04-15
PT86190A (pt) 1988-12-15
NO174986B (no) 1994-05-02
AU8234287A (en) 1988-06-16
NZ222623A (en) 1990-08-28
HK110897A (en) 1997-08-29
IN170294B (pt) 1992-03-07
CN87101244A (zh) 1988-07-20
FI96646C (fi) 1996-07-25
KR890700250A (ko) 1989-03-10
KR950001947B1 (ko) 1995-03-07

Similar Documents

Publication Publication Date Title
PT86190B (pt) Aparelho para classificar valores de um padrao bidireccional e aparelho de codificacao de sinais video que utiliza o mesmo
Jain Image data compression: A review
US5732157A (en) Image processing apparatus and method using lossless encoding of a difference between image blocks
US6292114B1 (en) Efficient memory mapping of a huffman coded list suitable for bit-serial decoding
EP1523196A2 (en) Encoding system of motion image containing arbitrary object
JP3764505B2 (ja) 階層的動き推定を採用した動きベクトル決定方法
JPH01157686A (ja) 空間充填カーブに基づくビデオスクランブル装置及び方法
US5216750A (en) Computation system and method using hamming distance
US5933105A (en) Context-based arithmetic encoding/decoding method and apparatus
Li et al. State of the art and prospects of structured sensing matrices in compressed sensing
CA2100064C (en) Image undithering apparatus and method
Kim et al. Inverse halftoning using binary permutation filters
Yeo et al. Robust distributed multiview video compression for wireless camera networks
Memon et al. Lossless compression of RGB color images
US6539366B1 (en) Codec with genetic adaptation
WO2020156670A1 (en) Encoder- and decoder-side device for machine learining based signal coding
JP2001231017A (ja) 電子透かしを用いた絶対画質評価方法、そのための符号化方法、および符号化装置
WO1997012330A1 (en) Method and apparatus for information processing using cellular automata transform
KR100613106B1 (ko) 나무구조벡터양자화(tsvq)에 기반하는 부호화를 위한 인덱스할당방법
Panigrahy et al. VLSI design of fast fractal image encoder
Nasrabadi et al. Hierarchical block truncation coding of digital HDTV images
CN115604473B (zh) 用于代码化视频数据块的方法和装置
Farrelle et al. Quad-tree based two source image coding
JPH11298894A (ja) 2値形状信号符号化装置
HAMZAOUI FRACTAL IMAGE COMPRESSION WITH FAST LOCAL SEARCH RAOUF HAMZAOUI* AND DIETMAR SAUPE

Legal Events

Date Code Title Description
FG3A Patent granted, date of granting

Effective date: 19930621

MM3A Annulment or lapse

Free format text: LAPSE DUE TO NON-PAYMENT OF FEES

Effective date: 19981231