PT90390B - Processo e dispositivo para comprimir e descomprimir dados video de cor digitais, codificados estatisticamente - Google Patents
Processo e dispositivo para comprimir e descomprimir dados video de cor digitais, codificados estatisticamente Download PDFInfo
- Publication number
- PT90390B PT90390B PT90390A PT9039089A PT90390B PT 90390 B PT90390 B PT 90390B PT 90390 A PT90390 A PT 90390A PT 9039089 A PT9039089 A PT 9039089A PT 90390 B PT90390 B PT 90390B
- Authority
- PT
- Portugal
- Prior art keywords
- color
- digital
- digital word
- combinations
- path length
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/005—Statistical coding, e.g. Huffman, run length coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Color Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
presente invento relaciona-se em geral com processamento de sinal de informação, e em particular com o campo de processamento de sinais de informação sequenciais em tempo, tais como sinais video, com a finalidade de reduzir a quantidade de informação a ser transferida de um local de codificação para um local de descodificação. Um uso particular do invento é na comunicação de dados video de cor em linhas telefónicas.
Arte anterior:
A codificação de sinais de televisão digital necessita normalmente de uma velocidade de transmissão de aproximadamente 200 Mbits/seg. Desenvolvimentos recentes nos dispositivos de cp.difiliação tem permitido que a velocidade de transmissão seja cortada para menos de 2 Mbits/s. Dispositivos de codifi. cação usando a análise orientada de bloco de quadros de imagem video e processamento por um coeficiente híbrido convencional de transformação de co-seno discreto (DGT) permite a transformação em velocidades de entre 64 Kbits e 384 Kbits.
Uma outra técnica na redução do tempo de transmissão que não diminui a resolução de uma imagem transmitida é codificada em comprimento de percurso. Na codificação de comprimento de percurso as linhas de exploração de um quadro de imagem são codificadas como um valor do conteúdo em cor de uma série de pixels e tendo o comprimento da sequência de pixels aquele valor ou gama de valores. Os valores podem ter uma medida da amplitude de um sinal video, ou outras propriedades de tais si nais video, tais como luminância ou crominência. Um exemplo de um dispositivo o qual utiliza codificação de comprimento de percurso da amplitude dos sinais video é a patente dos Estados Unidos número 3609244 (Mounts). Naquele dispositivo, uma me69 143
SDK/DTV/33657/O2O
-3mória de quadro também determina diferenças quadro a quadro de modo que as diferenças de um quadro para o seguinte sâo pa ra serem transmitidas. As técnicas de codificação adaptativa aplicadas a esse processamento DCT tem permitido a transmissão a velocidades tão baixas como um a dois bits por pixel como é descrito em Adaptive Coding of Monochrome and Color Images IEEE Transactions on Communications Vol. COM-25 n2 11, de 19 de Novembro de 1977. Contudo, a informação transmitida a velocidades de dados tão baixas afecta seriamente a capacidade para reconstruir um número suficiente de quadros por segundo de modo que uma imagem em tempo real seja aceitável para um espectador. Existem linhas telefónicas de alta capacidade as quais transportarão transmissões a uma velocidade até 1,544 Hbits/s, mas tais linhas são extremanente caras para uma velocidade de uso exclusivo e são ainda bastante caras para uma velocidade de uso programada. Existem linhas telefónicas de mais baixa capacidade as quais permitem a transmissão em relações até 56 Kbits/s e 64 Kbits/s. Existem comercialmente, dispositivdh videodigitais e de codificação relativamente caros os quais transmitirão um sinal video a 56.000 bits por segundo, de modo que é necessário utilizar uma combinação de um aparelho desta natureza com uma linha telefónica de alta capacidade de 1,544 Hbits/s para permitir uma velocidade de enquadramento muito mais rápida do que cerca de um quadro por segundo. 0 limite de velocidade de transmissão corrente de linhas telefónicas normais aproxima-se dos 18.000 bits por segundo, assim a transmissão da sequenciação em tempo real das imagens video em linhas telefónicas normais foi vista na arte anterior como não praticável.
Foram usados vários esquemas para reduzir a quantidade de redundância de informação a ser transmitida num sinal video di gital. Uma técnica é utilizar uma câmara de exploração lenta; e outra técnica é transmitir todas as linhas de exploração de ordem n para cada quadro. Outra técnica implica o envio apenas das partes de um quadro de imagem que foram determinadas
143
SDH/hTW/33657/020
....
-4como sendo importantes ou mudadas de alguma maneira significativa, pela divisão do quadro de imagem num número de segmentos ou blocos os quais são tipicamente grupos de pixels 3x3 ou 4x4, e analisando o conteúdo dos blocos. Estas técnicas tendem tam bém para reduzir a resolução da imagem video.
Outra técnica na redução do tempo de transmissão o qual não diminui a resolução de uma imagem transmitida ê a codificação de comprimento de percurso. Na codificação de comprimen to de percurso, as linhas de exploração de um quadro de imagem são codificadas como um valor do conteúdo em cor de uma série de pixels e o comprimento da sequência de pixels que têm tal valor ou gama de valores. Os valores podem ter uma medida da amplitude de um sinal video, ou outras propriedades de tais sinais video, tais como luminância ou crominência. Um exemplo de um dispositivo que utiliza codificação de comprimento de percurso de amplitude de sinais video é a patente dos Estados Unidos n2 3609244 (Mounts). Naquele dispositivo, uma memória de quadrQ^também determina diferenças quadro a quadro, de modo a que apenas aquelas diferenças de um quadro para o seguinte são para ser transmitidos. Outro exemplo de um processo para transmitir sinais video como valores de comprimento de percur so comprimido os quais também utilizam codificação estatística de valores frequentes para reduzir o número de bits necessários para representar dados é a patente dos Estados Unidos n2 4420771 (Pirsch).
Idealmente, a compressão de informação video de cor para permitir a sequência em tempo real de quadros de imagem a uma velocidade até 15 quadros por segundo, e em relações de bits tão baixas como 11.500 bits por segundo seria desejável, para permitir a comunicação de dados video de cor em linhas telefónicas normais. Também seria desejável ter um dispositivo de compressão de dados video capaz de conseguir velocidades equivalentes de transmissão de dados como dispositivos usando linhas telefónicas de mais alta qualidade com equipamento mais
143
SDM/DTW/33657/O2O
-5eficiente e mais barato do que o normalmente existente.
Sumário do invento presente invento proporciona um processo e dispositivo para comprimir dados video de cor digital num dispositivo de comunicação video, para transmitir um grande número de quadros de imagem video de sinais video de cor digitalizados na forma de comprimentos de tercurso e três componentes de cor digital. Até um número predeterminado das combinações mais visualmente significativas dos componentes de cor, pelo menos, numa porção do quadro de imagem, são determinadas, e os componentes de cor digital na imagem são codificados numa tabela de consulta de códigos de cor comprimidos digitalmente os quais são também co dificados junto com os comprimentos de percurso associados.
presente invento proporciona também um processo e dispo sitivo para descomprimir dados video de cor num dispositivo de comunicação video o qual utiliza um grande número de sinais di gitalizadU^^epresentando comprimentos de percurso de pixel e códigos de componentes de cor comprimidos digitalmente, e uma tabela de consulta dos códigos de componentes de cor comprimidos digitalmente para três componentes de cor digital correspondentes. Os códigos de cor comprimidos digitalmente são des. codificados de acordo com a tabela de consulta para formar uma tabela dos três componentes de cor digital para cada um dos com primentos de percurso, e os comprimentos de percurso e os componentes de cor correspondentes são armazenados numa série numa memória tampão para representarem comprimentos de percurso e dados componentes de cor para as linhas de exploração num quadro de imagem video. Uma vez que estes dados são descodificados desta maneira, os dados podem ser mais descomprimidos para representarem pixels individuais na imagem.
Resumindo e em termos gerais, o processo de comprimir dados video de cor digital utiliza um sinal video de cor digitalizado tendo três componentes de cor digital e um componente
143
SDM/DTW/33657/020
-6de comprimento de percurso, com o comprimento de percurso a ser de um primeiro tamanho de palavra digital, e sendo os três com ponentes de cor digital de segundo, terceiro e quarto tamanhos de palavra digital, respectivamente. Os passos do processo compreendem a determinação de um histograma até um número prede terminado das combinações mais visualmente significativas dos componentes de cor em pelo menos uma porção do quadro de imagem a codificação de todos os componentes de cor digital no quadro de imagem para uma tabela de consulta como códigos de cor comprimidos das combinações de cor mais significativas visualmente de um quinto tamanho de palavra digital o qual é menor do que a soma dos segundo, terceiro e quarto tamanhos de palavra digital; e codificação de um grande número de códigos de compri mento de percurso e de cor comprimida digitalmente e representando, pelo menos, uma porção de quadro de imagem. 0 processo para descomprimir estes dados video de cor digital comprimida, compreende geralmente a descodificação dos códigos de componen te de çor__cqmprimidos digitalmente de acordo com a tabela de consulta para formar uma tabela dos três componentes de cor di. gital correspondendo a cada comprimento de percurso; e armazenagem de pelo menos uma porção do comprimento de percurso e dos componentes cor correspondente numa série em meios tampão de memória de comprimento de percurso e dados de componente de cor representando as linhas de exploração no quadro de imagem video
O dispositivo para comprimir dados video de cor digital é para usar num dispositivo de comunicação video para transmitir um grande número de quadros de imagem video, utilizando um sinal video de cor digitalizada tendo três componentes de cor di. gital e uma porção de comprimento de percurso, com a porção de comprimento de percurso a ser de um primeiro tamanho de palavra digital, e os três componentes de cor digital a serem de um segundo, terceiro e quarto tamanhos de palavra digital, respectivamente. 0 dispositivo de compressão de dados compreende em resumo e em geral meios para determinar em um histograma de até um número predeterminado das combinações mais significativas
143
SDK/DTW/33657/020
-7visualmente dos componentes de cor, pelo menos, numa porção do quadro de imagem. Também incluídos no dispositivo de compressão de dados estão meios para codificar em todos os componentes de cor digital no quadro de imagem para uma tabela de consulta de códigos de cor comprimidos digitalmente das combinações de cor mais significativas visualmente de um quinto tamanho de pa lavra digital o qual é mais pequeno que a soma dos segundos, terceiro e quarto tamanhos de palavra digital; e meios para co. dificar em um grande número de códigos de comprimentos de percurso e de cor comprimida digitalmente associada os quais repre sentam, pelo menos, uma porção do quadro de imagem. 0 dispositivo do invento para descomprimir estes dados video de cor digital comprimidos, em resumo e em geral, compreende meios para descodificar os códigos componentes de cor comprimida digitalmente, de acordo com a tabela de consulta dos três componentes de cor digital, para cada comprimento de percurso, tendo os di tos três códigos componentes de cor descodificados terceiro quarto e quinto tamanhos de palavra digital, respectivamente; e meios para armazenarem, pelo menos, uma porção dos componentes de comprimento de percurso e de cor correspondentes numa série num tampão de memória de comprimento de percurso e de da dos componentes de cor para representar o grande número de linhas de exploração no quadro de imagem video.
Numa realização preferida, comprimentos de percurso adjacentes em cada linha de exploração para as quais os comprimentos de percurso adjacentes têm componentes de cor associados, os quais variam menos do que uma quantidade predeterminada, são encadeados com um sexto tamanho de palavra digital o qual pode ser maior do que o primeiro tamanho de palavra digital dos comprimentos de percurso. Uma ou ambas a porção de comprimento de percurso e a porção de código de componente de cor comprimida das combinações de códigos de cor comprimida e de comprimento de percurso são, de preferência, codificados estatisticamente pela determinação da frequência de ocorrência de valores de uma ou ambas as porções. É proporcionado um grande
143
SDLí/DTW/33657/020
SS
-8núnero de tabelas de códigos diferentes. A mais frequente ocor rência de valores numa porção é codificada estatisticamente numa primeira tabela de código por uma palavra de tamanho digital de um hit. As três ocorrências mais frequentes seguintes são seleccionadas e codificadas numa segunda tabela de código por uma palavra de tamanho digital de dois hits, e todos os outros valores são codificados do mesmo modo em pelo menos uma tabela de código adicional por um tamanho de palavra digital maior do que dois hits. É também feito o fornecimento de codificação opcional de diferenças linha-a-linha, diferenças quadro-a-quadro, e determinação e codificação do movimento de margens distintivas de sequências de combinações de comprimento de percurso e de códigos de cor comprimidos quadro-a-quadro.
Outros aspectos e vantagens do invento tomar-se-ão eviden tes a partir da descrição detalhada seguinte e dos desenhos anexos que representam, através de um exemplo, as características do invento.
---- DESCRIÇÃO RESUMIDA DOS DESENHOS
A figura 1 é um diagrama esquemático de um dispositivo e processo para comprimir dados video de cor num dispositivo de comunicação video;
A figura 2 é um gráfico de luminância através de uma linha de exploração numa imagem video;
A figura 3 mostra uma representação das características do comprimento de percurso numa linha de exploração video;
A figura 4 mostra uma representação das transições do com primento de percurso em pontos de decisão de inclinados de uma linha de exploração video;
A figura 5 mostra uma representação da linha de exploração video reconstruída para o visor;
A figura 6 mostra uma representação de como os dados de comprimento de percurso são convertidos para visionar dados com transições entre percursos;
143
SDK/DTYí/33657/020
-9A figura 7 é um diagrama esquemático de um processo e dis positivo para descomprimir dados video de cor num dispositivo de comunicação video;
A figura 8 mostra o dispositivo e processo para comprimir dados video de cor num dispositivo de comunicação video incluindo um subdispositivo processador adicional;
A figura 9 é um diagrama esquemático mais detalhado de uma secção de controlo 1/0 combinada, secção de processador, e dispositivo de construção de entrada e dispositivo de reconstrução ;
A figura 10 é um diagrama de fluxo representando a compressão de tamanhos de palavra digital de comprimento de percurso e de componentes de cor;
A figura 11 é uma carta de fluxo representando o processamento de sinal adicional de dados video de cor;
A figura 12 mostra o dispositivo e processo para descomprimir 'os'~dados video de cor num dispositivo de comunicação vi deo incluindo um subdispositivo processador adicional;
A figura 13 é um diagrama de fluxo da descodificação do processamento de compressão de dados adicional da figura 11;
A figura 14 é um diagrama de fluxo representando a descom pressão das palavras digitais processadas de componentes de comprimento de percurso e de cor da fig 10; e
A figura 15 é uma representação de um cubo de cor tri-di mensional.
DESCRIÇÃO DETALHADA DO INVENTO
Como é mostrado nos desenhos com a finalidade de representação, o invento é realizado por um processo e dispositivo para comprimir dados video de cor digital, num dispositivo de comunicação video, para transmitir um grande número de quadros de imagem video. Cada quadro de imagem compreende um grande número de linhas de exploração compostas por um grande número
143
SDM/DTW/33657/020
-10de pixels, e o sinal video de cor digitalizada que é usado tem três componentes de cor digital e uma porção de comprimento de percurso, sendo a porção de comprimento de percurso de um primeiro tamanho de palavra digital, e sendo os três componentes de cor digital de segundo, terceiro e quarto tamanhos de palavra digital, respectivamente. E criado um histograma de até um número predeterminado de combinações mais significativas vi sualmente dos componentes de cor, pelo menos, numa porção do quadro de imagem. Todos os componentes de cor digital no quadro de imagem são codificados para uma tabela de consulta de códigos de cor comprimida digitalmente de um quinto tamanho de palavra digital mais pequeno que a soma dos segundo, terceiro e quarto tamanhos de palavra digital; e o grande número de com primentos de percurso são codificados em combinação com os códigos de cor comprimidos digitalmente. A representação da cor com tal número limitado de códigos, permite uma redução significante no tamanho de bit necessário para representar os dados de cor; e o juso de comprimentos de percurso permite uma redução mais significativa na quantidade de dados nacessária para representar pixels numa imagem.
invento é também realizado por um processo e dispositivo para descomprimir estes dados video de cor comprimidos. Os códigos de cor comprimidos digitalmente são descodificados de acordo com a tabela de consulta para formar uma tabela dos três componentes de cor digital para cada dos comprimentos de percur so, e os comprimentos de percurso e componentes de cor correspondentes são armazenados numa série numa memória tampão para representar comprimento de percurso e dados componentes de cor para as linhas de exploração num quadro de imagem video.
De acordo com o presente invento, é proporcionado um processo de comprimir dados video de cor digital num dispositivo de comunicação video para transmitir um grande número de quadros de imagem video, compreendendo cada quadro de imagem um grande número de linhas de exploração compostas de um grande número de pixels, utilizando um sinal video de cor digitaliza69 143
SDK/DTW/33657/020
-lida tendo três componentes de cor digital, incluindo o dito dis positivo de comunicação video meios para determinarem una função de luminância para cada pixel; meios para determinarem qual dos ditos pixels em cada linha de exploração representa pontos de decisão baseados na dita função de luminância; e meios para codificarem, pelo menos, uma porção do dito grande número de pixels em cada linha de exploração como um grande número de com binações de comprimentos de percurso e os ditos três componentes de cor digital, sendo o dito comprimento de percurso de um primeiro tamanho de palavra digital e os ditos três componentes de cor digital de segundo, terceiro e quarto tamanhos de palavra digital, respectivamente; compreendendo o dito processo os passos de: determinação até um número predeterminado das combi nações que ocorrem visualmente significativas dos ditos componentes de cor, pelo menos, numa porção do dito quadro de imagem; codificação de todos os ditos componentes de cor digital no dito quadro de imagem para uma tabela de consulta em meios de memória de códigos de cor comprimidos digitalmente das ditas combinações de cor visualmente mais significativas de um quinto tamanho de palavra digital mais pequeno do que a soma dos ditos segundo, terceiro e quarto tamanhos de palavra digital; e codificação de um grande número de comprimentos de percurso e dos ditos códigos de cor comprimidos digitalmente representando pe lo menos uma porção do dito quadro de imagem nos ditos meios de memória.
presente invento também proporciona do mesmo modo um dis positivo para comprimir dados video de cor digital num dispositivo de comunicação video para transmitir um grande número de quadros de imagem video, compreendendo cada quadro de imagem um grande número de linhas de exploração compostas por um gran de número de pixels, utilizando um sinal video de cor digitali zado tendo três componentes de cor digital, incluindo o dito dispositivo de comunicação video meios para determinar em uma função de luminância para cada pixel, meios para determinar qual dos ditos pixels em cada linha de exploração representa
143
SDM/DTW/33657/O2O
-12pontos de decisão baseados na dita função de luminância, e meios para codificarem, pelo menos uma porção do dito grande número de pixels em cada linha de exploração com o grande número de combinações de comprimentos de percurso e os ditos três componentes de cor digital, sendo os ditos comprimentos de percurso de um primeiro tamanho de palavra digital, e os ditos três componentes de cor digital de segundo, terceiro e quarto tamanhos de palavra digital, respectivamente, compreendendo o dito dispositivo de compressão de dados video de cor digital: meios para determinarem atê um número predeterminado das combinações visualmente mais significativas dos ditos componentes de cor em pelo menos uma porção do dito quadro de imagem; meios para codificarem todos os ditos componentes de cor digital no dito quadro de imagem para uma tabela de consulta em meios de memória de códigos de cor comprimidos digitalmente das ditas combinações de cor significativas visualmente que ocorrem frequentemente de um quinto tamanho de palavra digital mais peque no do que a soma dos ditos segundo, terceiro e quarto tamanhos de palavra digital; e meios para codificar um grande número de comprimentos de percurso e os ditos códigos de cor comprimidos digitalmente representando pelo menos uma porção do dito quadro de imagem nos ditos meios de memória.
invento proporciona mais um processo para descomprimir dados video de cor digital num dispositivo de comunicação video utilizando um grande número de sinais digitalizados representando combinações de um grande número de comprimentos de percurso de um primeiro tamanho de palavra digital e códigos de componente de cor comprimidos digitalmente de, pelo menos, uma porção de um grande número de linhas de exploração de um quadro de imagem video, e uma tabela de consulta dos ditos có digos componentes de cor comprimidos digitalmente para três componentes de cor digital correspondentes aos segundo, tercei ro e quarto tamanhos de palavra digital, respectivamente, compreendendo o dito processo os passos de descodificar os ditos códigos componentes de cor comprimidos digitalmente de acordo
143
SDM/DTW/33657/020
-13com a dita tabela de consulta para formar uma tabela nuns meios de memória dos ditos três componentes de cor digital para cada dito comprimento de percurso; e armazenar, pelo menos, uma porção do dito comprimento de percurso e os ditos componentes de cor correspondentes numa série em meios de memória tampão de dados de comprimento de percurso e de componente de cor representando o dito grande número de linhas de exploração no dito quadro de imagem video.
invento proporciona adicionalmente um dispositivo para descomprimir dados video de cor digital num dispositivo de comunicação video utilizando um grande número de sinais digitalizados representando combinações de um grande número de códigos comprimentos de percurso e de componentes de cor comprimidos digitalmente para, pelo menos, uma porção de um grande número de linhas de exploração de um quadro de imagem video, e uma tabela de consulta para os ditos códigos componentes de cor comprimidos digitalmente, sendo os ditos comprimentos de perçprsc .,cLe--um primeiro tamanho de palavra digital, e sendo os ditos códigos componentes de cor comprimidos de segundo, terceiro e quarto tamanhos de palavra digital, respectivamente, compreendendo meios para descodificar os ditos códigos componentes de cor comprimidos digitalmente de acordo com a dita tabela de consulta para formar uma tabela nuns meios de memória dos ditos três componentes de cor digital para cada dito comprimento de percurso; e meios para armazenarem, pelo menos, uma porção do dito comprimento de percurso e os ditos componen tes de cor correspondentes numa rede numa memória tampão de da dos de comprimento de percurso e de componente de cor represen tando o dito grande número de linhas de exploração no dito qua dro de imagem video.
Como é representado nos desenhos, numa implementação preferida do invento, o dispositivo de comunicação video é capaz de produzir uma imagem video de cor usando uma câmara video RGB (vermelho, verde e azul), gerando um sinal RGB analógico nos normais 60 campos por segundo, com cada campo representan69 143
SDK/DTW/33657/020 <7
-14do metade da imagem num modo entrelaçado. 0 sinal para os qua dros de imagem video gerado pela câmara 10 é recebido por um conversor analógico/digital 12, o qual converte os componentes analógicos vermelho, verde e azul (RGB) em componentes RGB digitais, os quais são cada um digitalizados como palavras digitais de seis bits, formando grupos de bits para os componentes RGB para cada pixel da imagem video de cor de dezoito bits.
tipo de dispositivo usado para gerar a imagem video de cor de fonte não é crucial para o invento, como uma câmara gerando um sinal composto de transmissão a cor da televisão americana (NTSC) padrão o qual é convertido numa saída digital RGB, seria também adequado como seria uma câmara usando uma ve locidade de campo diferente da velocidade de 6o/seg de uma câmara NTSC. A saída da câmara também não precisa de ser estritamente RGB, visto que outros três grupos componentes de cor podem ser usados para criar e transmitir imagens video de cor. Por exemplo, os três sinais componentes de cor digital podem ser.xfianq^-uuagenta e amarelo; tonalidade, saturação e intensi dade; ou mesmo duas cores distintas e um terceiro parâmetro baseado no sinal video completo, tal como tonalidade, saturação ou intensidade de um sinal video analógico original, de mo do a que existiria alguma ponderação automática da informação de cor gerada pela câmara.
Também não é essencial que os tres componentes de cor se jam representados pelo mesmo número de bits, visto que é sabi do na indústria da televisão que certas gamas de cores não são facilmente perceptíveis pelo olho humano. Tal ponderação de informação podia envolver uma redução no número de bits usados para o componente vermelho num esquema RGB, por exemplo, permitindo assim a transmissão de mais gradações de outra informação de cor que é de facto perceptível.
Adicionalmente, a fonte das imagens video de cor a serem comprimidas podem ser meios de armazenagem, tal como um disco video, um meio de armazenagem de arquivo de computador, uma fi
145
SDM/DTW/55657/020
-15ta video, ou parecidos a partir dos quais a informação video de cor pode ser processada para introdução num dispositivo de compressão de dados video de cor do invento.
sinal RGB digitalizado é recebido pela porção do instrumento de transição 14 do dispositivo de captura de imagem 16, o qual inclui de preferencia meios de circuito integrado e meios de memória associada. A primeira maior parte do dispositivo de captura de imagem é o dispositivo de transição o qual inclui circuitos electrónicos para determinarem uma função de luminância baseada nos trés sinais video de componente de cor para cada elemento de imagem, ou pixel, de cada linha de exploração na sequência de imagens video geradas pelo painel frontal analógico do dispositivo. No modo preferido, o conversor de luminância 18 soma os bits de cada um dos tres componentes de cor digital para cada pixel nas linhas de exploração do quadro de imagem video para conseguir um valor de luminância (ou intensidade) e realiza mais processamento dos dadpjs obtidos. No dispositivo do presente invento cada linha de exploração contém, de preferencia, 480 pixels, os quais con dizem com a resolução da câmara, e os quais proporcionam uma melhor resolução do que a tipicamente obtida na arte anterior, na qual geralmente apenas são utilizados 256 pixels por linha de exploração. A luminância dos três componentes de cor pode ser ponderada para dar um maior significado a uma cor ou a duas cores para proporcionar a função de luminância, e pode também ser baseada em parte numa fonte original de sinal video analógico. Contudo, a função de luminância é de preferencia baseada em parte pelo menos na soma dos tres componentes de cor digital. A função de luminância derivada da soma dos tres compo nentes de cor de seis bits tem por isso um tamanho de palavra digital de oito bits. Esta função de luminância para cada pixel é utilizada no dispositivo de captura de entrada para avaliar um ou mais parâmetros de decisão baseados na função de lu minância para determinação dos pixels que funcionam como pontos de decisão nos quais, um ou mais parâmetros de decisão, são en69 143
SDM/DTW/33657/020
-16contrados para variar a partir de um conjunto pré-armazenado de valores de limiar.
A função de luminância é um excelente indicador de mudanças de cor na imagem, ou movimentos de objectos na imagem.
No dispositivo de captura de imagem o um ou mais parâmetros de decisão baseados na função de luminância podem também ser usados como a base para determinar as diferenças de linha a linha, e de sequências distintivas de pixels, as quais definem margens de objectos, as quais podem ser determinadas para ser movidas de quadro para quadro. Geralmente, a luminância, ou outra com binação de componentes de cor a qual compreende a função de lu minância, sofre significantes mudanças onde há mudanças nas ca racterísticas da imagem.
A câmara também introduz anomalias ou artifícios na imagem video devido a ruído na resolução de amostragem de cor a qual idealmente deveria ser eliminada para reduzir a quantidade de dados a serem transmitidos desde que eles não contribuam com nadatbénéfTcõ para a imagem. Quando a imagem é visionada com
O um novo campo todos os 60 de um segundo, o efeito de tais ano malias é integrado fora pelo olho humano. As áreas tendo uma aparência suave e pequeno detalhe actual sob observação próxima parecem mover-se lentamente. Esta aparência é também conhecida como oefeito de mosquito. Quando a imagem é parada de modo a que apenas um campo, ou quadro de imagem, esteja a ser examinado, a imagem torna uma aparência granulada, com malhas. 0 impacto do ruído nos dados de luminância é na forma de pequenas variações na luminância calculada. Quando a imagem é digitalizada, o processo de digitalização também conver te todos estes artifícios a representações digitais, mesmo que eles não representem de facto detalhes de imagem. 0 processamento de luminância no instrumento de captura de imagem funcio. na para eliminar tais detalhes sem significado.
Um processo preferido, de eliminar os detalhes não essenciais provocados pelo ruído nos dados de luminância, é determinar os pontos de mudânça baseados, pelo menos, em parte na
143
SDK/DTW/33657/O2O ,7'
-17função de luminância para pixels nas linhas de exploração por comparação de diferenças em um ou mais parâmetros de decisão com os correspondentes limiares adaptativos. Os parâmetros de decisão tem, de preferencia, compreendidas as diferenças da função de luminância entre pixels, determinadas entre pixels imediatos (Diff-1) numa linha de exploração, n mais um n mais dois, ou mesmo a uma maior distância, onde n representa a posição numa linha de exploração do pixel a ser examinado para mudanças em luminância; entre primeiras diferenças adjacentes (Liff-2) e um parâmetro cumulativo (Cum-Diff) o qual é uma so. ma das funções de diferença individuais Diff-1 e Diff-2. Cada parâmetro de decisão tem o seu próprio limiar adaptativo correspondente, tendo um valor de defeito o qual é sujeito a modificação pelo dispositivo em resposta aos ajustamentos do operador ou processador.
limiar adaptativo tem de preferencia um valor de defeito o qual pode ser ajustado pelo dispositivo de captura de entractó · que—rerage ás selecções do operador para resolução. A s£ lecção dos parâmetros de limiar para determinar os pontos de decisão de caracteristica ou de transição é bastante subjectiva. A selecção dos parâmetros determina o número de pontos de dados necessários para definir a imagem e também determina a qualidade perceptual total da imagem.
Tipicamente para a determinação do comprimento de percurso característico, são usados dois limiares. Um é a mudança cumulativa em mudança desde o último ponto de decisão, Cumdiff. 0 Cumdiff disparará um ponto de decisão se for maior que 6 e o número de pixels desde o último ponto de decisão for maior que
5. Outro parâmetro de decisão é a soma de dois valores de diferença adjacentes Diff2 (isto é o mesmo que a diferença entre valores de luminância que estão afastadas dois pixels). Se o valor Diff2 é calculado para ser maior do que, tipicamente, 32, o lógico significará que a linha está a entrar numa margem, o que identifica um ponto de decisão, e ficará na caracteristica de margem até que o valor Diff2 caia abaixo de 20. Quando se
143
SDM/DTW/33657/020
/Λ
-18sai do modo de margem, a cor do pixel seguinte é levada para trás para o pixel onde a determinação do início de margem foi feito. Também, se a Diff 2 muda de sinal, ele significa um no vo ponto de decisão. Mudando os valores para os limiares cum diff afecta grandemente a qualidade e complexidade de dados da imagem.
Na determinação de inclinação dos pontos de decisão, (vér tices), são usadas tres condições gerais. É determinada uma inclinação inicial no ponto de decisão e todas as medidas são baseadas naquela inclinação. A inclinação inicial, INITS, é determinada pelo cálculo da função seguinte chamada NDIFF2:
NDIFF2 = (luminância(i+2) - luminância^ )/2
INITS é o valor de NDIFF2 imediatamente após o ponto de decisão 0 cumdiff no caso de inclinação é definido do seguinte modo:
— CUMDIFF^ ) = CUMDIFF + NDIFF2^^
Se o valor absoluto do CUMDIFF é tipicamente maior que 20 e o número de pixels no comprimento de percurso é tipicamente maior que 10, então será disparado um ponto de decisão. Do mesmo modo, se o valor absoluto de NDIFF2 é menor ou igual a tipicamente 4 e o comprimento de percurso é tipicamente maior que 5, será disparado um ponto de decisão, a menos que o último ponto de decisão seja também disparado da mesma maneira.
terceiro parâmetro de decisão é também baseado no NDIFF2:
TRIGVAL^) = NDIFFZ^^ - INITS limiar para o TRIGVA1 ê usualmente ajustado na gama de 4 a 10 e disparará um ponto de decisão em qualquer altura que o valor absoluto alcance ou exceda o valor ajustado e o comprimento de percurso é, pelo menos, 2 pixels. Rodem ser usadas outras técnicas mas estas parecem dar imagens de boa qua69 143
SDM/DTW/33657/O2O
-19lidade com um número aceitável de pontos de dados.
Uma representação gráfica de um traçado típico de luminân cia através de uma linha de uma imagem video é mostrada na figura 2. A função de luminância dos pixels intersectados pela linha de exploração 36 é graficamente representada pela linha
38. Como é mostrado na figura 3, um gráfico dos pontos de decisão haseado na comparação de um dos parâmetros de decisão com o correspondente limiar de diferença adaptativa numa técni ca de codificação de característica, resulta na linha escalonada 40, uma sequência de linhas direitas horizontais através de um modelo de luminância. Cada linha horizontal representa um comprimento separado de uma cor específica.
Uma segunda abordagem que pode ser usada para eliminar os detalhes não essenciais, é uma técnica de codificação de transição ou de inclinação que é ilustrada na figura 4. Nesta técnica é determinada a relação de mudança das diferenças no parâmetro de decisão entre pixels, e as velocidades de mudança destas diferenças são comparadas com uma diferença adaptativa prearmazenada de limite de velocidade de mudança para determi nar pontos de decisão ou pontos de vértice. Estes pontos de mudança ou pontos de decisão são indicados como X's na linha
39. Eles indicam a localização do vértice seguinte. 0 comprimento de percurso é definido como a distância pixel entre pontos de decisão, para ambas as técnicas de codificação de ca racterística e codificação de inclinação. De acordo com a técnica de codificação de transição ou inclinação, os dados de luminância resultam numa linha 42 representando uma série de pontos de vértice ou de decisão de inclinação, a qual pode ser usada para controlar os segmentos de cor entre pontos de decisão. Um dispositivo de configuração pode produzir uma transição suave de valores de cor para o comprimento de percurso entre pontos de decisão quando a informação codificada é para ser recuperada. Nesta técnica, para cada linha de exploração é transmitida uma cor inicial, seguida por tantas sequências de
143
SDM/DTW/33657/O2O
-20valores de comprimento de percurso e cor quanto as necessárias para representarem o conteúdo do quadro de imagem. Noutra implementação a informação é visionada como uma série de inclina ções. Para os dados codificados de comprimento de percurso são inseridas inclinações de cor artificial na linha de visor como mostrado na figura 5. Neste caso as inclinações são geradas como uma função do deslocamento de luminância entre per cursos e o comprimento dos percursos unidos como mostrado na figura 6.
No dispositivo de captura de imagem da figura 1, o detector de ponto de decisão 26 para determinar pontos de decisão pode alternativamente ser capaz de utilizar um destes processos para fixar os pontos de decisão na cor dos pixels na imagem, atendendo a que cada processo tem as suas respectivas van tagens e desvantagens. A técnica de codificação de caracterís tica é tipicamente mais adequada para imagens com uma complex_i dade de objectos com linhas ou margens distintivas. Por outro ladçu,-.a bâcnica de codificação de inclinação é mais adequada para codificar transições graduais em sombreamento ou mudanças de cor gradual, mas pode necessitar codificação adicional para representar imagens complexas com imagens tendo muitas margens e linhas. Na implementação preferida da técnica de codificação de inclinação, será comparada uma sequencia de limiares com os parâmetros de decisão, e o parâmetro cumulativo (Cum-diff) e um limiar cumulativo adaptativo também será utilizado para determinar pontos de decisão, para ter em conta os atrasos, comprimentos de percurso graduais de luminância os quais ainda resultariam numa mudança de luminância acumulada a qual é sufi cientemente significante para merecer a identificação de um pon to de decisão.
Os tres códigos componentes de cor são também operados no processador de comprimento de percurso 28 para deixar cair os dois bits menos significantes dos valores de seis bits para os componentes de cor, reduzindo cada um dos componentes de cor
145 ./ ___
SDK/DTW/55657/020 jF
-21no modo preferido para palavras digitais de quatro bits. Alternativamente, numa realização preferida, o dispositivo de transição pode também conter uma representação predeterminada de projecção de cor de tres cores componentes, com um código de n bits correspondente a uma combinação de cor particular. Aqui, as cores da imagem combinam tão próximo quanto possível com as cores na projecção de cor. Como outra alternativa, os códigos de cor podiam também ser rodeados. Estes componentes de cor digital reduzidos ou truncados são então codificados com os comprimentos de percurso entre pontos de decisão no pro. cessador 28 de comprimento de percurso. Embora o tamanho de bit preferido para os componentes de cor reduzidos seja quatro bits, como é o tamanho de palavra digital de entrada para os componentes de cor de um painel frontal analógico, pode ser de diferentes tamanhos para variar o conteúdo informático, os com ponentes de cor digital reduzidos podem também ser de tamanhos diferentes. Uma combinação particular de tamanhos de palavra digital .çara componentes de cor pode incluir um tamanho reduzido para o componente vermelho, devido ao reconhecimento na indústria da reduzida perceptibilidade deste componente.
As técnicas de codificação de caracteristica e inclinação permitem que um número variável de bits seja usado para representar um quadro de imagem inicial, e então mudar nos quadros de imagem subsquentes, de modo a codificar o número mínimo de bits para cada quadro de imagem. Isto é significantemente uma melhoria na arte anterior a qual tipicamente analisa um grupo de pixels de três por três ou quatro por quatro para comprimir a informação em tal grupo, o qual sempre resulta no mesmo número de bits a serem utilizados para representar o conteúdo in formático na imagem, mesmo que haja ou não mudanças fora do segmento.
A segunda maior porção do dispositivo de captura de imagem é a memória intermédia de captura (CBM) 29, a qual recebe os comprimentos de percurso codificados e os componentes de cor re.
143
SDK/DTW/33657/020
-22duzidos representando algumas 200 linhas de dados do quadro de imagem. Alternativamente, se a velocidade de dados necessária se tornar muito alta para enviar imagens a uma velocidade dese; jada, menor número de linhas de exploração podem ser armazenadas, tais como 150 ou 100 linhas. A informação de componente de comprimento de percurso e cor na memória intermédia de captura é então transmitida para o processador de dados video 30, o qual liga o comprimento de percurso e os dados de cor na memória tampão de captura por um controlo de ligação 35, e funcio. na como uma interface para transformar e transmitir a informação video num formato adequado para transmissão pelo modem 32, ligado ao telefone 34, e o qual pode incluir meios para compri mir mais os dados video, em 33. Os dados video podem também ser comparados com um quadro de imagem anterior armazenado numa memória de imagem antiga 31.
E possível num processador de simplificação 33 de um processador de dados video 30 para analisar mais a diferença entre valoyes· de—cor de pixels depois de os códigos de cor terem sido truncados para fornecer os códigos de componentes de cor re duzidos, e para encandear comprimentos de percurso de tais códigos de componentes de cor reduzidos, os quais variam menos do que um dado valor de limiar, ou para encandear mais comprimentos de percurso dos códigos de cor reduzidos baseados na va riaçâo de um ou mais dos parâmetros de decisão em relação a um limiar correspondente. Como o código de comprimento de percur so está tipicamente a um máximo de quatro bits para ser compatível com as combinações de código de comprimento de percurso e cor de 16 bits, com canais de computador de 16 bits numa implementação de corrente, encandeamento de uma sequencia de pixels para cada comprimento de percurso seria esperado para per mitir a codificação de até dezasseis pixels por comprimento de percurso. Contudo, na implementação corrente são usados os va lores 0 a 15 para representar comprimentos de percurso de 2 até 17 pixels, visto que os comprimentos de percurso de 0 e 1 não são significativos. Alternativamente, também podem ser
143
SDW/DTW/33657/020
-23inicialmente determinados maiores comprimentos de percurso, bem como podem ser compatíveis com bus de computador com capacidades diferentes, para permitir comprimentos de percurso maiores do que 4 bits e combinações de comprimento de percurso e código de cor maiores que 16 bits.
Como mencionado anteríormente, é esperado que os limites de compressão necessários para a suavizaçâo adequada da informação numa sequênciaçSo em tempo real de imagens video em telecomunicações, seria cerca de 15 quadros por segundo para trans missão em linhas telefónicas normais. Seria possível usar um modern a 1200 hps (bits por segundo), mas isto iria considerável mente diminuir a velocidade do número de quadros por segundo possível no dispositivo de comunicação. Idealmente, ó disposi tivo é configurado para modo semi-duplex e para um modo de con figuração duplex total seria de esperar a necessidade de duas linhas telefónicas. Idealmente o modern que é para ser usado é um que utilizaria a maior largura de banda possível e pode ser um mi>dem-.<i&nvencional de 2400 bps ou 9600 bps ou modems especiais fornecendo maiores velocidades de bits podem ser usados.
Com referencia à figura 7, na realização preferida, um telefone 43 recebe um sinal transmitido a partir de um modern transmissor em linhas telefónicas normais e o modern receptor 44 converte estes sinais num formato digitalizado electronicamente para ser receptível pelo processador de dados video 46. 0 processador de dados video adapta então os sinais digitalizados os quais representam informação de comprimento de percurso e de cor codificados para um formato o qual é aceitável para recepção pelo dispositivo de configuração 62. 0 dispositivo de configuração do dispositivo de reconstrução 48 converte os dados de comprimento de percurso para a forma de inclinação e apresenta-a pixel a pixel para o conversor digital/analógico para usar pelo monitor. Altemativamente, a interface processador de video podia ser adaptado para receber os dados video de cor comprimida de um dispositivo computador 66 recuperando
143
SDM/DTW/33657/020
’.-Χ'
-24a informação de meios magnéticos, tais como discos rígidos ou discos flexíveis de alta capacidade, ou de um toca discos video para visionamento de muito maiores séries de comprimentos de quadros de imagem video, numa forma como a de para um filme vi deo. 0 processador de dados video inclui, de preferência, mei os de microprocessador e meios de memória associados (não mostrados) programados para executar várias funções. Uma função preferida é reconstruir uma representação de dados de quadro de imagem total em termos de códigos de comprimento de percur so e cor de uma memória de imagem antiga 52 dos últimos dados de quadro de imagem, e uma rede dos códigos de comprimentos de percurso e cor os quais mudaram desde o último quadro de imagem. Esta função de reconstrução de diferença 45 prepara os dados de quadro de imagem para a reconstrução de comprimento de percurso em 50 e a reconstrução de código de cor 56, utili zando sinais de controlo embebidos nos dados de comprimento de percurso e cor.
.^..ComQ—as- informações de comprimento de percurso e cor são recebidos pelo processador de dados video 46 do dispositivo de reconstrução 48, os sinais digitalizados são tipicamente de um tamanho de palavra digital de dezasseis bits. 0 número pode variar, dependendo do tipo de codificação estatística usado. Alternativamente pode ser usado um código de cor (o qual pode ter em comprimento 4 a 8 bits) para seleccionar cores específi cas de uma projecção ou paleta de modo a que menos bits precisam de ser enviados. Gomo comprimidos e codificados a partir de um dispositivo de construção de entrada como descrito anteriormente, o tamanho de palavra digital da porção de comprimen to de percurso efectivamente processada seria tipicamente de quatro bits, e o tamanho de palavra digital da porção de código de cor seria de doze bits. Como mencionado anteriormente, o rateamento preferido dos tamanhos de bits dos três códigos de componentes de cor é tal que cada componente de código de cor digital tem um tamanho de palavra digital de quatro bits. Contudo, apenas pequenas porções da imagem a qual têm efecti69 143
SDM/DTW/33657/020
-25vamente mudado podem ser efectivamente codificadas, com dados de controlo apropriados, para saltarem comprimentos de percur so que podem não ter mudado sendo embebidos na informação trans mitida. A reconstrução de comprimento de percurso ou função descodificadora 50 do processador de dados video funciona para separar a porção de comprimento de percurso de um sinal digita lizado, e a função de reconstrução de código de cor 56 do processador de dados video, para descodificar os códigos de cor, pode separar os componentes de cor digital dos sinais digitalizados de entrada. Contudo, o processamento de sinal avança do e compressão dos dados pode também envolver o encandeamento de comprimentos de percurso com um tamanho de palavra digital de oito ou nove bits, de modo que a função descodificadora de comprimento de percurso operaria então também para separar o tamanho de palavra digital de oito ou nove bits em porções de palavra digital de quatro bits. No caso de os códigos de com primento de percurso estarem encandeados com um tamanho de pa lavra.digital de oito ou nove bits, a porção de código de cor teria também de ser sujeita a técnicas de compressão de dados avançados para reduzir os três códigos de cor digital cada com quatro bits a uma porção de código de cor combinada tendo um tamanho de palavra digital de oito bits. A função de reconstrução de cor 56 operaria então também para converter os cód_i gos de cor digital de oito bits a três códigos de cor digital do tamanho de palavra digital de quatro bits.
A partir do instrumento de reconstrução, descodificador de comprimento de percurso e secções de códigos de cor a infor mação de código de comprimento de percurso e cor é transferida de um processador de dados de video através dos circuitos 54 electrónicos de controlo de ligação e temporização no dispositivo de configuração 62 para uma memória intermédia de visor do dispositivo de configuração 57 a qual idealmente compreende tampões de memória duplos, e técnicas de programação que utili za 2 unidades de fita magnética para ficheiros múltiplos de bo bina e comutando automaticamente entre as suas unidades até o
143
SDK/DTW/33657/O2O
-26ficheiro estar completo, ping-pong A 58 e ping-pong B60.
controlo de ligação e de temporização 54, sob a direcção do processador de video, envia a informação de comprimento de per curso e de cor reconstruídas para armazenagem numa das porções de memória intermédia ping-pong até que a informação para um quadro de imagem individual esteja completa; aquela imagem é então visionada enquanto a informação de imagem sequencial se guinte recebida pelo dispositivo é enviada e armazenada de uma maneira semelhante na segunda porção na memória intermédia de visor. Cada grupo de pixels da memória intermédia de visor ne cessita de ter uma capacidade suficiente para evitar sobrecarga da memória pela informação de código de comprimento de percurso e cor e achou-se que uma memória de ligação casual com uma capacidade de palavras digitais 32K 16 bits é adequada para a reconstrução de imagem.
dispositivo de desenho 62 inclui um gerador de pixels 61 para converter os códigos de comprimento de percurso e cor armazenado®--nas memórias ping-pong individuais em pontos in dividuais para visionar no monitor 64. 0 controlo de ligação e temporização 54 do dispositivo de configuração é responsável por todas as temporizações de visor e controlo para o gerador de pixels. 0 dispositivo de configuração gera um estrobo de escrita para escrever os percursos de informação de cor para as séries de pontos a serem convertidas de digital a analógico para visionar.
Na realização preferida para a geração de pixels de dados característicos de comprimento de percurso codificados, cada final de um comprimento de percurso de uma combinação de cor particular é essencialmente derivada para fornecer uma transi ção de cor suave de um comprimento de percurso para outro. A linha video reconstruída suavemente resultante 41 é descrita na figura 6. Quando um comprimento de percurso é curto, é nor malmente uma indicação que 0 nível de cor está a mudar rapidamente. Se o comprimento de percurso é grande, normalmente in69 143
SDM/DTW/33657/020
-27dica que o nível de cor está a mudar devagar. Quando a mudança na função de luminância, dada por um dos parânetros de deci são, é grande, ela normalmente indica una alta probabilidade de uma margem na imagem, visto que se a mudança é pequena, é provável uma indicação de um efeito de sombreamento. Baseado no comprimento de percurso e um ou mais parâ metros de decisão, o gerador de pixels determina onde devem ser colocados os pontos de decisão intermédios, e interpola as transições de cor suave para cada um dos componentes de cor RGB a partir de ura ponto de decisão intermédio para o seguinte. Os fins de cada linha de exploração transitam do mesmo modo quando contactam outra cor, de modo a que o princípio e o fim de uma linha de exploração possam ter um único ponto de decisão intermédio adjacente ao fim, para definir uma transição relativamente aguda de uma margem da imagem para a cor adjacente. A interpolação é de preferencia realizada linearmente, mas pode também ser moldada a superfícies curvas descritas mais fielmente. Se a imagem, éco.dif içada em inclinação, os pixels geram uma transi ção suave de um apex para o seguinte sem injectar um ponto de decisão intermédio.
gerador de pixels do dispositivo de configuração inclui todas as secções funcionais necessárias para implementar a interpolação de cor entre pares de pontos designados pelos comprimentos de percurso, e converte, de preferencia, os componen tes de cor de quatro bits para palavras digitais de seis ou oi to bits, para precisão de seis ou oito bits, em tres canais se parados, com um por cada dos componentes RGB. 0 aumento do ta manho de bits permite ao gerador de pixels gerar gradações mais suaves das transições de cor entre pixels de cores diferentes. Por exemplo, embora tamanhos de palavra digital de quatro bits permitam até 4 096 combinações de cor de componentes vermelho, verde e azul, apenas até 16 gradações de qualquer um dos compo. nentes de cor seria possível. Aumentando o tamanho de bit até 6 permite até 64 gradações de qualquer componente individual, e até 262 144 combinações totais. Um tamanho de palavra digi69 143
SDM/LTW/33657/020
-28tal de oito bits permite ainda uma maior gama de gradações para um componente individual. Contudo, como discutido previamente, os tamanhos de palavra digital completa para os componentes de cor não precisam de ser iguais, e podem ser de facto arranjados de modo a permitir uma gama mais larga de cores para um ou dois dos componentes de cor, à custa de um dos componentes de cor o qual apenas necessitaria de um tamanho de pala vra digital mais pequeno para acomodar a sua perceptibilidade. 0 gerador de pixels, por conseguinte, gera dinamicamente uma representação digital completa dos pixels de um quadro de imagem para ser visionada numa base pixel a pixel, e esta informação é transmitida em três canais RGB do gerador de pixel para o conversor digital/analógico 63 o qual converte o sinal vi deo para a forma analógica para visionamento no monitor 64.
Referindo as figuras 1 - 9 os elementos na posição de referência com os números 110 a 134 correspondem a elementos na posição de referência com os números 10 a 34. A figura 8 mostra:outra-2?e-alização com o dispositivo de captura de imagem 116 a ter um processador video 130 funcionando para simplificar mais e comprimir dados do dispositivo de transição 114.
A saída da memória intermédia de captura 129 é recebida pelo subdispositivo processador 130 que tem entrada e saída (i/O) e controlo padrão 166. A entrada/saída (l/θ) padrão 166 podia tipicamente incluir um teclado, um controlo de ^iskette (disco), um relógio de data-hora, e uma saída monitor e controlo. A saída do subdispositivo processador é tipicamente ligada a um modem 132, o qual está ligado a um telefone 134 para transmissão da informação comprimida em linhas telefóni cas normais. Pode ser usado mais de um modem para proporcio nar relações de visor de imagem mais rápidas ou imagens de cor de mais alta qualidade.
Com referência à figura 9, o subdispositivo processador de dados video 168, o qual realiza as funções de compressão e descompressão do processador video 130 e do processador video 146, a ser mais explicado daqui para a frente, é mais preferi69 143
SDK/DTV/33657/020
-29velmente adaptado para ser ligado a ambos os dispositivos de captura de imagem (I.C.E.) e dispositivo de reconstrução (R.C.E.) para usar na compressão e descompressão de dados de cor video num dispositivo de comunicação de duas vias. Contudo, onde o subdispositivo processador está a ser usado para comprimir a informação video de cor, seria aparente que o dispositivo de reconstrução não necessitasse de ser ligado ao mesmo subdispositivo processador com está ligado ao dispositivo de construção de entrada. Se um dispositivo de comunica ção video é configurado de modo a que os circuitos electrónicos do dispositivo de captura de imagem sejam parte de uma câ mara, e os circuitos electrónicos do dispositivo de reconstru ção sejam parte de um monitor de visor, seriam utilizados geralmente subdispositivos processadores diferentes 130 e 146 pelo dispositivo de captura de imagem e pelo dispositivo de reconstrução.
Como é representado na figura 9 o subdispositivo processador · de-«-dedos video repartido recebe entradas a partir do se parador 170 de memória de captura repartido para receber entrada do dispositivo de captura de imagem, e de preferencia também envia saídas para o separador 172 de memória de visor repartido o qual contém a secção 154, 158 e 160 do dispositivo de configuração, para saída para o dispositivo de reconstrução Cada um destes tampões de memória necessita de suficiente capa cidade para evitar o transbordar da informação codificada, e foi achado na prática que um espaço de memória de 52K por 16 bits é adequado para estas finalidades. 0 tampão de memória 170 é também de preferencia repartido para entrada e saída en tre o dispositivo de captura de imagem e o processador de dados video; e o tampão de memória 172 com a sua secção de memó ria de técnica de programação que utiliza 2 unidades de fita magnética para ficheiros múltiplos de bobina e comutando automaticamente entre as duas unidades, até todo o ficheiro estar processado (ping-pong) dupla é semelhantemente, repartida para entrada e saída entre o dispositivo de reconstrução e o proces
145
SDK/DTW/55657/020
-50sador de dados video. 0 subdispositivo processador inclui dois microprocessadores, os quais são de preferência Motorola 68020 processadores de 52 bits, o processador nA 174 e o processador B 176. Como o processador realiza tipicamente muitas das fun. ções de processamento do subdispositivo processador, ele é provido com uma memória de dados privada A 178 de 512K bites.
processador ”B” é provido com menor quantidade de memória na memória B” 180 de 256K bites. Também provido, entre o proce_s sador A e o processador B para comunicação entre os proces sadores, é um acesso duplo de memória de leitura e escrita 182 de 16K bites. Os acessos duplos de memória aleatória 184 e 186 de 52K bites são também providos como tampões entre os processadores A e B” e a secção processadora entrada/saída (i/O) 166.
microprocessador C 188 para a secção de controlo 1/0 166 é de preferência um Intel 80 286 tendo DRAM refrescado e um acesso de memória directo 190 para controlo de disquete e um SRAM lAB-de 512K bites. Os acessos de entrada/saída 194 são designados geralmente para o l/θ padrão, o qual pode incluir um excitador de disco, teclado, um monitor e semelhante.
Com referência às figuras 8, 10 e 11 a operação do dispositivo de captura de imagem e o subdispositivo processador 150 tendo funções de simplificação e compressão serão descritos.
Os comprimentos de percurso 200 de uma sequência de pixels nu ma linha de exploração tendo valores de cor semelhantes são determinados como palavras digitais de nove bits as quais são divididas no dispositivo de captura de imagem como palavras 201 digitais de quatro bits. Os componentes de cor RGB 202 a, b,c como utilizados para determinar as funções de luminância na secção 118 são palavras digitais de seis bits usadas para determinar pontos de decisão para comprimentos de percurso no ponto de decisão lógico 126. Estas cores são truncadas pela remoção dos dois menos significativos bits de cada palavra de seis bits nos circuitos electrónicos 120 de truncamento de có
143
SDM/DTW/33657/O2O
-31digo de cor para formar palavras digitais de quatro bits 204a, b,c. 0 codificador de comprimento de percurso 128 projecta uma série de combinações 205 de comprimento de percurso e código de cor RGB para a memória tampão de captura 129, em preparação para mais processamento do subdispositivo processador 130. Na realização preferida deste invento, um projecto de de feito de cor predeterminado 214, na secção de código de cor 120 consistindo numa tabela de consulta de combinações únicas dos três componentes de cor tais como valores RGB e códigos de oito bits correspondentes, projectos 256 das combinações de cor mais visualmente significativa fora de um possível 4 096, obtidas a partir dos três códigos de quatro bits truncados RGB. 0 projecto de cor é alterável de preferência pelo subdispositivo pro. cessador de dados video.
As 256 combinações de código de cor a serem incluídas no projecto de cor são determinadas na seguinte base. Dado que cada componente de cor RGB é representado como um código de quatrobi-írsp é possível uma gama de 16 gradações de cada componente de cor. Contudo, na prática as cores nos extremos de cada gama de gradações raramente aparece em imagens capturadas por uma câmara video. Inspecções estatísticas de uma larga va riedade de cenas capturadas por câmaras video revela uma distribuição comum de cores. Para ilustrar a distribuição, uma carta bidimensional de uma gama de 0 a 16 de verde descendente ao longo de um eixo vertical, com uma gama de 0 a 16 de azul para a direita através de um eixo horizontal desenvolve um modelo oval no meio, ao longo de um eixo de 0,0 a 15,15. Juntan do uma terceira dimensão de vermelho desenvolve uma distribuição com a forma de salsicha das combinações de cor visualmente mais significativas a partir de uma larga variedade de cenas e imagens possíveis. Uma combinação seleccionada a partir duma extremidade desta distribuição em forma de salsicha foi achada para ser virtualmente indistinguível de uma combinação de cor numa extremidade próxima do bloco de cor tridimensional, e den tro da distribuição em forma de salsicha, as combinações de cor
143
SDM/DTW/33657/O2O
-32próximas umas das outras são também virtualmente indistinguíveis. Por selecção cuidadosa de 256 combinações de cor repre sentativas de blocos dentro desta distribuição em forma de sal sicha, pode assim ser construído um projecto de cor das combinações de cor visualmente mais significativas semelhantemente para ser encontrado. Na prática foi achado que uma razão RGB de 4:3:2 produz cores nas gamas de tom de pele, e esta informação pode ser usada para compensar a distribuição da razão de cor, com o factor primário a ser a aparência subjectiva.
processo de projecção de cor faz uso da observação que muitas cores que ocorrem na natureza não são muito puras.
A fig. 15 mostra um cubo de cor com sem cor, preto no canto esquerdo mais baixo frontal, e branco o qual é o máximo vermelho, verde e azul no canto traseiro direito mais alto. 0 azul aumenta a partir do preto em direcção ao canto traseiro esquerdo mais baixo e o vermelho é representado por um número de planos representando níveis constantes de vermelho. 0 ver melho'·-aumenta na direcção do cimo do cubo. Assim todas as pos síveis cores podem ser representadas no cubo para uma precisão a qual é dependente do número de bits distribuídos a cada componente de cor. Qualquer cor específica pode ser representada pelas coordenadas de qualquer ponto dentro do cubo.
Todas as cores reais parecem estar juntas pesadamente ao longo de uma forma de salsicha a qual vai desde o canto preto num arco para cima para o canto branco. Visto que as cores es tão concentradas com cores não naturais acontecendo nos cantos de puro vermelho, verde, azul, magenta, ciano ou amarelo, é possível reduzir o número de códigos de cor dos 4 096 pré-repre sentados possíveis de 4 bits cada vermelho, verde e azul. Os ovais representados por 260, identificam as áreas as quais devem ser reproduzidas com alguma precisão porque as cores reais concentram-se aqui.
Λ
E realmente apenas necessário ter tons de carne, sendo fi eis à reprodução com as cores desligadas ligeiramente noutras
143
SDM/DTV/33657/O2O
-33áreas sendo bastante aceitáveis visto que as pessoas no final receptor não sabem exactamente quais as cores que são apresen tadas no final transmissor do dispositivo embora um processo de correcção possa ser aplicado se é importante. A aproximação para gerar a projecção de cor foi para definir gradações finas na cor nos tons de carne com mais gradações grossas quan to mais a cor capturada está fora da salsicha” central. A pro jecção foi empiricamente derivado a partir do exame das distribuições de cor num grande número de imagens e ajuste dos parâmetros de projecção para obter resultados aceitáveis. 0 processo de correcção consiste na análise das cores efectivas as quais acontecem em cada das áreas de projecção e correcção do segmento de projecção de modo que represente mais fielraente as cores detectadas naquela cena. 0 processo é bastante subjecti vo mas parece funcionar bem.
No subdispositivo processador, é processado estatisticamente um histograma dos códigos 212 de cor RGB para todas as combinaçõee-de comprimento de percurso para actualizar a projecção de cor 214 para ser usado como uma tabela de consulta. Mesmo com os códigos de cor de quatro bits para cada um dos componentes RGB, até 4 096 combinações de cor diferentes seriam teoricamente conseguidas. Na prática, foi achado que um grupo de 256 combinações de cor, cuidadosamente seleccionadas, é bajs tante adequado para servir como cores de vértice para o dispositivo de configuração para construir a imagem com até 262 144 cores com reconstrução de cor de seis bits para cada um dos três componentes de cor. Altemativamente mais gradações são possíveis pela reconstrução de cada um dos três componentes de cor como códigos de oito bits. Por conseguinte, pode ser usado o histograma de 256 das mais frequentes combinações de cor RGB para modificar as cores codificadas como uma série de palavras digitais de oito bits na tabela de consulta de código de cor ou projecção de cor 214. Visto que cada combinação de cor na projecção de cor representa um bloco de gama de cores, o histograma de frequência de cor pode ser usado para substi69 143
SDM/DTW/33657/O2O
-34tuir uma combinação de cor que ocorre frequentemente dentro do seu bloco de cor como uma combinação de cor representativa, pa ra uma reprodução de cor mais fiel. Como estas cores represen tativas estão dentro do bloco de cores para aquelas cores, as cores substitutas são determinadas pelo dispositivo são visual mente significativas, e não são meramente seleccionadas na fre quencia de aparição na imagem.
A necessidade da informação de cor RGB de 12 bits para re presentar o máximo de 4 096 cores é assim reduzida a uma tabela de 265 palavras digitais de 8 bits para representar as 256 cores mais significantes visualmente. As cores que ocorrem menos frequentemente as quais podem estar acima do limite das 256 cores podem também ser forçadas a confinarem-se com a mes ma coloração que a combinação de código de cor mais próxima na projecção de cor, sem perda significativa da justeza das cores no quadro de imagem a ser transmitido. Uma vez os códigos de cor na forma de palavras digitais de oito bits 206 as qyai-s·,podem ser combinadas com a porção de comprimento de percurso de quatro bits 200, o código de comprimento de percurso de quatro bits, o qual representa de facto um comprimen to de percurso de 2 a 17 pixels na implementação preferida na codificação de comprimentos de percurso, pode ser estatistica mente processado para fornecer uma palavra digital de comprimento variável 208 para ser junto na eventual combinação de có digo de cor e comprimento de percurso 210. Os códigos de comprimento de percurso podem variar de um bit, para os comprimen tos mais frequentes, até 8 ou 10 para comprimentos ocorrendo raramente. Assim, o comprimento de percurso pode representar de 2 a 257 pixels, o que seria teoricamente adequado para representar uma linha de exploração completa de 512 pixels em duas combinações código de cor comprimento de percurso. Assim os comprimentos de percurso de quatro bits são encandeados onde possível em 216 finalmente antes da codificação das combina çães código de cor e comprimento de percurso em 218. De modo a adaptar a codificação dos componentes de cor RGB de oito bits
143
SDM/DTW/33657/020
-35às combinações de comprimento de percurso, é também necessário construir e codificar a tabela de consulta de código de cor 214 como uma tabela de 256 códigos de cor de quatro bits individuais para um dos componentes RGB, os quais seriam transmitidos com as combinações de comprimento de percurso código de cor pa ra habilitar um receptor ou tradutor, da informação de imagem, a descodificar a informação de cor comprimida.
Pode ocorrer processamento e compressão mais avançados, das combinações de código de cor comprimento de percurso, na secção de processamento avançado 220. Semelhante à diferencia ção pixel a pixel e comparação para determinação de pontos de decisão no dispositivo de construção de entrada, podem ser com paradas linhas de exploração adjacentes para formular uma tabe la de linhas de exploração as quais não diferem da linha de ex ploração anterior na direcção de exploração, de modo a que as linhas ou porções de linhas possam ser meramente duplicadas. Assim isto permitiria mais compressão das combinações 210 de códi-gò· 'de’~coT e comprimento de percurso como uma tabela de diferenças 222. Outra técnica chamada processamento de subquadro pode ser usada para reduzir a quantidade de dados que devem ser enviados para actualizar uma nova imagem na secção receptora de um dispositivo. Esta técnica de processamento de subquadro amostra todas as linhas de ordem e continua o processamento apenas com as linhas para qualquer imagem. Segmentos distintivos, das combinações de comprimento de percurso aparecem pa ra formar uma margem, podem ser detectados num detector de mar gem 224 para controlar o afastamento de tais segmentos de quadro a quadro por análise de movimento 226, a qual podia de pre ferência seguir o movimento de tais segmentos de linhas de exploração em grupos de segmentos de linhas de exploração de acor do com qualquer deslocamento horizontal, redução, aumento ou afastamento vertical de tais segmentos, ou virtualmente qualquer combinação de tais movimentos. Um maior nível de compres são envolve a diferenciação quadro-a-quadro por comparação da informação de combinação de códigos de cor e comprimento de
143
SDM/DTW/33657/020
-36percurso a partir do último quadro de imagem com o quadro de imagem corrente, e codificação de um código de pulo para iden tificar aquelas porções que não mudaram, de modo a que apenas as combinações de código de cor e comprimento de percurso as quais mudaram são codificadas em 228.
Finalmente o subdispositivo processador também codifica de preferencia as combinações de código de cor e comprimento de percurso para serem transmitidas a partir de um subdispositivo processador pela determinação de um histograma da ocor rência de combinações de código de cor e comprimento de percurso. A forma preferida de codificação estatística neste estádio é semelhante à codificação Huffman, e envolve a atribuição da combinação, que ocorre mais frequentemente, a uma tabela de palavras digitais de um bit, em 230. Esta tabela é para ser utilizada no final receptor do dispositivo pela refe rencia a um ou outro dos estados de bit da palavra digital de um bit para preencher nesta combinação de comprimento de percurso- - que—ocorre mais frequentemente numa tabela de código de cor comprimento de percurso correspondente. Por exemplo, se a tabela indica um binário, a tabela de recepção será preenchida com a combinação de código de cor comprimento de percur so, e seria por outro lado deixada com uma marca zero indican do que o ponto na tabela era para ser preenchido mais tarde.
As três combinações que ocorrem mais são então representadas como uma palavra digital de comprimento dois bits, com um dos estados de bit binários indicando que o local na tabela de re cepção era para ser preenchido mais tarde, e as três seguintes combinações que ocorrem mais frequentemente são preenchidas nos seus respectivos locais na tabela de recepção correspondente.
Uma tabela de palavra digital de três bits pode então ser cons truida de uma maneira similar para designar os sete valores se guintes que ocorrem mais frequentemente, com um dos estados de bits binários representando valores a serem preenchidos mais tarde, etc, com um tamanho de palavra digital final de oito bits usado para representar as combinações de código de cor restan/7 .-Λ
145
SDK/DTW/55657/O2O
-57tes. Este processo pode ser aplicado a outros agrupamentos que não as sequências de agrupamentos de 1, 2, 5, n bits des critas acima. Mais preferível, esta codificação estatística da informação de código de cor comprimento de percurso compri mida, é realizada para pelo menos os códigos de cor, individu almente, com as porções de comprimento de percurso sendo então codificadas e recebidas como uma tabela separada de palavras digitais de oito bits, mas é também possível codificar estatística e separadamente as porções de comprimento de percurso de oito bits numa maneira similar e transmitir uma tabela codificada estatisticamente separada para os componentes de comprimento de percurso das combinações comprimento de per curso e código de cor. Outra aproximação da codificação esta tística similar pode também ser apropriada como uma alternativa.
Referindo a fig. 12, na qual os elementos 145 a 166 são essencialmente idênticos aos previamente descritos os quais possuem crs-viúmeros de referência 45 a 66, no modo preferido do invento, o telefone 145 recebe os sinais digitalizados audio de um modem transmissor em linhas telefónicas normais, os quais são por outro lado recebidos por um modem receptor 144, e o processador de dados video 146, o qual prepara o sinal vídeo d.igitalizado na forma e formato adoptado para ser receptível pelo dispositivo de configuração 162. 0 processador de dados video 146 é ligado á secção de entrada/saída e controlo 166.
A arquitectura do subdispositivo processador é geralmente como foi descrito e ilustrado pela fig. 9. 0 sinal digitalizado re presentando combinações de um grande número de comprimentos de percurso de um primeiro tamanho de palavra digital e código componente de cor comprimido digitalmente de, pelo menos, uma porção de um grande número de linhas de exploração de um quadro de imagem video, e uma tabela de consulta dos códigos com ponentes de cor comprimida digitalmente, são sujeitos à desco, dificação dos códigos componentes de cor de acordo com a tabe la de consulta para formar uma tabela dos três componentes de
143
SDH/DTW/33657/O2O
-38cor digital na memória do processador de reconstrução de cor em 156, e o comprimento de percurso e os componentes de cor são enviados para a memória intermédia de visor 157, a qual inclui o espaço de memória duplo 172, o acesso temporizado e controlo 154 e os dois tampões ping-pong 158 e 160.
Como com o sinal processado pelo dispositivo de reconstrução discutido em referência à fig. 7, o descodificador de comprimento de percurso 150 recebe a informação de comprimento de percurso descomprimida, e a informação de componente de cor, para descodificação da informação de comprimento de percurso, é reconstruída em 156. As informações de cor e de com primento são comparadas com a imagem anterior 152 para projec ção em 150 e 156 para a memória intermédia de visor 157 a qual compreende a memória ping-pong A” 158 e a memória ping-pong ”B 160. 0 gerador de pixels 161 é subordinado pela memória tampão de visor 157 das memórias ping-pong, alternadamente, para reconstruir as linhas de exploração da imagem transmitida pixel »«-jjixel, a qual é então convertida da forma digital à forma analógica no conversor digital/analógico 163, para ser visionada no monitor 164.
Com referência à fig. 13 e 14, na realização preferida do subdispositivo processador 146 do invento, antes da reconstrução da diferença em 145 que ocorre no processador de dados video, a codificação estatística é descodificada em 232 e possivelmente também em 234 pela formação de uma tabela na memória do subdispositivo processador dos códigos de comprimento de per curso e cor associada, para ser preenchido em 156 de acordo com a tabela de consulta, como explicado anteriormente. Nas operações de reconstrução de diferença avançadas 145, as tabelas de difernças quadro a quadro e diferenças linha a linha são descodificadas em 234 para descodificar as diferenças de quadro a quadro em 236 ou mudanças de linha a linha em 238, em referência à memória de imagem antiga 152. Também na operação de reconstrução de diferença as tabelas representando as mar69 143
SDM/DTW/33657/020
-39gens e movimento são descodificadas em 240 e 242, com a infor mação de imagem entre as margens a serem construídas por inter polação. A divisão em 246 de comprimentos de percurso do tama nho de palavra digital encadeado para comprimentos de percurso de um tamanho de palavra digital de quatro bits acontece na operação de reconstrução de comprimento de percurso 150. A de£ codificação dos códigos de cor comprimidos na operação de reconstrução de cor 156, de acordo com a tabela de consulta, acon tece em 248, permitindo que os códigos componentes de cor de quatro bits, seis bits ou oito bits sejam atribuídos aos comprimentos de percurso, para armazenagem em 250 na memória tampão de visor 157.
Assim referindo a fig. 14, na descodificação estatística do sinal digitalizado totalmente comprimido, as tabelas recons truidas são de comprimento de percurso de tamanho de palavra digital de quatro bits 256, e o código de cor comprimida RGB 254 de tamanho de palavra digital de oito bits. 0 descodificador-de •eemprimento de percurso e cor trata a porção de comprimento de percurso separadamente para proporcionar as porções 256 de comprimento de percurso de tamanho de palavra digital de quatro bits; e os códigos de cor comprimida RGB de tamanho de palavra digital de oito bits são descodificados para propor cionar os componentes RGB de tamanho de palavra digital de qua tro bits individuais 256 a, 256 b e 256 c. 0 comprimento de percurso de quatro bits e os códigos de cor RGB digital de qua tro bits são projectados na memória tampão, para processamento pelo dispositivo de reconstrução, e transmissão para o gerador de pixels, onde os componentes de cor digital de quatro bits são expressos como uma interpolação de componentes RGB digitais de seis bits 258 a, 258 b e 258 c, para pixels individuais entre pontos de começo e paragem representando o comprimento de percurso.
Embora o invento tenha sido descrito no contexto de um dispositivo de conferência de telefone video, o invento pode
143
SDM/DTW/33657/O2O
-40ser também adaptado para usar em descomprimir dados video de cor de meios magnéticos, tais como discos rigidos ou discos flexíveis magnéticos de alta capacidade de três polegadas e meia os quais podem ser usados no armazenamento e comunicação de tais dados através de dispositivos de computador, ou de discos video para toca discos video os quais podiam transmi tir a informação na forma de um filme video.
Na descrição precedente, foi demonstrado que o processo e dispositivo do invento permite a compressão e recuperação de dados video de cor através do truncamento de informação me nos significante dos códigos componentes de cor, e a codifica ção estatística das combinações de código de cor mais signifi cantes visualmente. O invento também permite a compressão e recuperação de dados video de cor após mais processamentos dos dados video de cor através de mais compressão dos dados por codificação de comprimentos de percurso encadeados, diferenças linha a linha, movimentos de segmentos de quadros de imagem e porç-ões <da-quadros de imagem os quais mudaram para reduzir a quantidade de informação a ser codificada para a quantidade mínima. 0 invento proporciona mais a codificação adicional e descodificação de dados de acordo com uma forma de codificação estatística, a qual permite uma maior redução na quantidade de informação a qual deve ser transmitida pelo dispositivo.
Claims (17)
- is. - Processo para comprimir dados video de cor digitais num dispositivo de comunicação video para transmitir uma plura lidade de quadros de imagem video, com cada quadro de imagem incluindo uma pluralidade de linhas de exploração compostas de uma pluralidade de pixels, utilizando um sinal video de cor di gitalizado, tendo três componentes de cor digitais, incluindo o dito dispositivo meios para determinarem uma função de luminância para cada pixel, meios para determinarem quais dos ditos pixels, em cada linha de exploração, representam pontos de decisão baseados na dita função de luminância, e meios para codi ficarem, pelo menos, uma porção da dita pluralidade de pixels em cada linha de exploração como uma pluralidade de combinações de comprimentos de percurso e os ditos três componentes de cor digitais, sendo o dito comprimento de percurso de um primeiro tamanho de palavra digital, e sendo os ditos três componentes de cor, digitais de segundo, terceiro e quarto tamanhos de palavra digital, respectivamente, caracterizado por compreender os passos de:a) codificar todos os ditos componentes de cor digital no dito quadro de imagem de acordo com uma tabela de consulta em meios de memória dos códigos de cor comprimidos digitalmen te das combinações de cor mais visualmente significantes, de um quinto tamanho de palavra digital mais pequeno do que a so ma dos ditos segundo, terceiro e quarto tamanhos de palavra digital; eb) codificar uma pluralidade de comprimentos de percurso e representando os ditos códigos de cor comprimidos digitalmen te, pelo menos, uma porção do dito quadro de imagem nos ditos meios de memória.
- 2ã. - Processo de acordo com a reivindicação 1, caracterizado por incluir adicionalmente o passo de modificar a dita tabela de consulta pela determinação até um predeterminado número das combinações mais significantes visualmente dos ditos69 143SDK/DTW/33657/O2O-42componentes de cor em, pelo menos, uma porção do dito quadro de imagem, e substituindo, pelo menos, uma das ditas combina ções mais significantes visualmente de componentes de cor pa ra, pelo menos, uma combinação de cor correspondente na dita tabela de consulta.
- 3â. - Processo de acordo com a reivindicação 1, caracterizado por incluir adicionalmente o passo de encadear comprimentos de percurso adjacentes em cada linha de exploração para a qual os ditos comprimentos de percurso adjacentes têm componentes de cor associados, os quais variam menos do que um predeterminado limiar de diferença de cor para um sexto ta manho de palavra digital o qual é maior do que o dito primeiro tamanho de palavra digital.
- 4- . - Processo de acordo com a reivindicação 1, caracterizado por incluir adicionalmente o passo de codificar estatisticamente nos ditos meios de memória, pelo menos, uma da dita porção de comprimento de percurso e da dita porção de com ponéhte áe cor da dita combinação de comprimento de percurso e de componentes de cor pela determinação da frequência de ocorrência dos valores da dita, pelo menos, uma porção, fornecendo uma pluralidade de tabelas de código diferentes, seleccionando a ocorrência mais frequente, representando a dita ocorrência mais frequente numa primeira tabela de códigos por uma palavra digital de tamanho de um bit, seleccionando as três ocorrências mais frequentes seguintes na dita, pelo menos, uma porção, representando as ditas três ocorrências mais frequentes seguintes numa segunda tabela de códigos por uma palavra digital de tamanho de dois bits, e representando todos os outros valores na dita, pelo menos, uma porção em, pelo menos, uma tabela de códigos adicional por um tamanho de palavra digital maior que dois bits.
- 5- . - Processo de acordo com a reivindicação 1, caracterizado por incluir adicionalmente o passo de determinar as mar gens distintivas de uma sequência de combinações de comprimento69 143SDH/DTW/33657/020-43de percurso e códigos de cor comprimidos em, pelo menos, uma linha de exploração para cada quadro de imagem, e codificar uma tabela de mudanças em, pelo menos, uma das ditas sequências entre as ditas margens distintivas como uma tabela nos ditos meios de memória, representando um movimento da dita se. quência de um quadro para um outro quadro sequencialmente.
- 6s. - Dispositivo para comprimir dados video de cor digi tais num dispositivo de comunicação video para transmitir uma pluralidade de quadros de imagem video, compreendendo cada quadro de imagem uma pluralidade de linhas de exploração compostas por uma pluralidade de pixels, utilizando um sinal video de cor digitalizado, tendo três componentes de cor digitais, incluindo o dito dispositivo de comunicação video meios para determinarem uma função de luminância para cada pixel, meios para determinarem qual dos ditos pixels em cada linha de exploração representa os pontos de decisão baseados na dita função de luminância, e meios para codificarem, pelo menos, uma-porç-ãe-d-a dita pluralidade de pixels em cada linha de exploração como uma pluralidade de combinações de comprimentos de percurso e os ditos três componentes de cor digitais, em meios de memória, sendo o dito comprimento de percurso de um primeiro tamanho de palavra digital, e sendo os ditos três com ponentes de cor digitais de segundo, terceiro e quarto tamanhos de palavra digital, respectivamente, sendo o dito dispositivo para comprimir dados video de cor digitais, caracterizado por compreender:a) meios para codificarem todos os ditos componentes no dito quadro de imagem de acordo com uma tabela de consulta em meios de memória de códigos de cor comprimidos digitalmente das combinações de cor mais significantes visualmente de um quinto tamanho de palavra digital mais pequeno do que a soma dos ditos segundo, terceiro e quarto tamanhos de palavra digital; eb) meios para codificarem uma pluralidade de comprimen tos de percurso e ditos códigos de cor comprimidos digital69 143SDM/DTW/33657/O2O-44mente representando, pelo menos, uma porção do dito quadro de imagem nos ditos meios de memória.
- 7§. - Dispositivo de acordo com a reivindicação 6, caracterizado por incluir adicionalmente meios para modificarem a dita tabela de consulta pela determinação de um número predeterminado das combinações mais significantes visualmente dos ditos componentes de cor em,pelo menos, uma porção do dito qua dro de imagem; e substituir, pelo menos, uma das ditas combina ções determinadas mais significantes visualmente de componentes de cor para, pelo menos, uma combinação de cor correspondente na dita tabela de consulta.
- 8ã. - Dispositivo de acordo com a reivindicação 6, caracterizado por incluir adicionalmente meios para encadearem comprimentos de percurso adjacentes em cada linha de exploração para as quais os ditos comprimentos de percurso adjacentes têm componentes de .cor associados os quais variam menos do que um limiar predeterminado de diferença de cor para um sexto tamanho paiavra digital o qual é maior do que o dito primeiro tamanho de palavra digital.
- 9â. - Dispositivo de acordo com a reivindicação 6, caracterizado por incluir adicionalmente meios para codificarem estatisticamente, nos ditos meios de memória, pelo menos, uma da dita porção de comprimento de percurso e dita porção de componente de cor da dita combinação de comprimento de percurso e componentes de cor para determinação da frequência de ocorrência de valores da dita, pelo menos, uma porção, proporcionando uma pluralidade de diferentes tabelas de códigos, seleccionando a ocorrência mais frequente, representando a dita ocorrência mais frequente numa primeira tabela de códigos por uma palavra digital do tamanho de um bit, seleccionando as três ocor rências mais frequentes seguintes na dita, pelo menos uma, por ção, representando as ditas três ocorrências mais frequentes seguintes numa segunda tabela de códigos por uma palavra digital do tamanho de dois bits, e representando todos os outros69 143SDM/DTW/33657/020X-45valores na dita, pelo menos, uma porção em, pelo menos, uma tabela de códigos adicional por um tamanho de palavra digital maior do que dois bits.
- 10^. - Dispositivo de acordo com a reivindicação 6, caracterizado por incluir adicionalmente meios para determinarem margens distintivas de uma sequência de combinações de comprimento de percurso e de códigos de cor comprimidos em, pelo menos, uma linha de exploração para cada quadro de imagem, e codificarem uma tabela nos ditos meios de memória das mudanças em, pelo menos, uma das ditas sequências entre as ditas margens distintivas como uma tabela nos ditos meios de memória, representando um movimento da dita sequência de um quadro para um outro quadro sequencialmente.
- 11^. - Processo para descomprimir dados video de cor digitais num dispositivo de comunicação video, utilizando uma pluralidade de sinais digitalizados representando combinações de uma pluralidade de comprimentos de percurso de um primeiro tamanho de palavra digital e códigos de componente de cor com primidos digitalmente de um segundo tamanho de palavra digital para, pelo menos, uma porção de uma pluralidade de linhas de exploração de um quadro de imagem video, e uma tabela de consulta dos ditos códigos de componentes de cor comprimidos digitalmente para três componentes de cor digital correspondentes, sendo o dito processo caracterizado por compreender os passos de:a) descodificar os ditos códigos de componentes de cor comprimidos digitalmente de acordo com uma tabela de consulta para formar uma tabela em meios de memória dos ditos três com ponentes de cor digital para cada dito comprimento de percurso, tendo os ditos três componentes de cor descodificados terceiro, quarto e quinto tamanhos de palavra digital, respectivamente; eb) armazenar, pelo menos, uma porção do dito comprimento de percurso e o dito componente de cor correspondente numa série em meios de memória tampão de comprimento de percurso e da69 143SDM/DTW/33657/020-46dos de componente de cor representando a dita pluralidade de linhas de exploração no dito quadro de imagem video.
- 12ã. - Processo de acordo com a reivindicação 11, caracterizado por incluir adicionalmente o passo de dividir as ditas combinações de comprimento de percurso e de componente de cor numa pluralidade de combinações de comprimentos de percur so não encadeados e de componentes de cor digitais tendo uma porção de comprimento de percurso de um sexto tamanho de pala vra digital, e tendo para cada combinação de comprimento de percurso e de componente de cor um valor de comprimento de per curso maior do que o dito sexto tamanho de palavra digital.
- 13â. - Processo de acordo com a reivindicação 11, caracterizado por a dita pluralidade de sinais digitalizados repre sentando combinações de uma pluralidade de comprimentos de percurso e códigos de componentes de cor comprimidos serem estatisticamente codificados com referência a uma pluralidade de tabelas de códigos diferentes de acordo com a frequência de ocorfêhcfã^abs ditos valores de componente de cor, incluindo adicionalmente os passos de descodificar as ditas combinações de comprimento de percurso e de códigos de componente de cor, codificadas estatisticamente por projecção da ocorrência mais frequente dos ditos valores na dita série de acordo com uma tabela de palavras digitais de tamanho de um bit; projectar as três ocorrências mais frequentes seguintes dos ditos valo res de acordo com uma tabela de códigos incluindo um tamanho de palavra digital de dois bits para cada valor na dita série; e projectar todos os outros valores na dita série de cordo com uma tabela de valores tendo um tamanho de palavra digital maior do que dois bits.
- 14-. - Processo de acordo com a reivindicação 11, caracterizado por margens distintivas de um segmento de imagem representado por combinações de comprimento de percurso e códigos de cor comprimidos em, pelo menos, uma linha de exploração serem codificadas numa tabela para cada quadro de imagem repre69 143SDM/DTW/33657/O2O-47sentando mudanças nas ditas sequências como movimento do dito segmento de imagem de um quadro para um outro quadro sequenci. almente, e incluindo adicionalmente a armazenagem das ditas mudanças no dito segmento de imagem de combinações de comprimento de percurso e códigos de cor comprimidos na dita série.
- 15â. - Dispositivo para descomprimir dados video de cor digitais num dispositivo de comunicação video, utilizando uma pluralidade de sinais digitalizados representando combinações de uma pluralidade de comprimentos de percurso e códigos de componente de cor comprimidos digitalmente para, pelo menos, uma porção de uma pluralidade de linhas de exploração de um quadro de imagem video, e uma tabela de consulta para os ditos códigos de componentes de cor comprimidos digitalmente, sendo o dito comprimento de percurso de um primeiro tamanho de palavra digital e sendo os ditos códigos de componentes de cor comprimidos, de um segundo tamanho de palavra digital, res pectivamente, caracterizado por compreender:,<-a) -.-meios para descodificarem os ditos códigos de componente de cor comprimidos digitalmente de acordo com a dita ta bela de consulta para formarem uma tabela em meios de memória dos ditos três componentes de cor digitais para cada dito com primento de percurso, tendo os ditos três componentes de cor descodificados terceiro, quarto e quinto tamanhos de palavra digital, respectivamente; eb) meios para armazenarem, pelo menos, uma porção do di to comprimento de percurso e ditos componentes de cor correspondentes numa série numa memória tampão dos dados de comprimento de percurso e de componentes de cor, representando a di ta pluralidade de linhas de exploração no dito quadro de imagem video.
- 162. - Dispositivo de acordo com a reivindicação 15, carecterizado por incluir adicionalmente meios para dividirem as ditas combinações de comprimentos de percurso e de componentes de cor numa pluralidade de combinações de comprimentos69 143SDM/DTW/33657/020-48de percurso não encadeados e de componentes de cor digitais, tendo uma porção de comprimento de percurso de um sexto tamanho de palavra .digital, tendo para cada combinação de com primento de percurso e de componente de cor um valor de com primento de percurso maior do que o dito sexto tamanho de pa lavra digital.
- 17â. - Dispositivo de acordo com a reivindicação 15, ca racterizado por a dita pluralidade de sinais digitais representando combinações de uma pluralidade de comprimentos de percurso e de códigos de componentes de cor comprimidos ser estatisticamente codificada com referência a uma pluralidade de tabelas de códigos diferentes de acordo com a frequência da ocorrência dos ditos valores de componente de cor, incluin do adicionalmente meios para descodificarem as ditas combinações de comprimento de percurso e de código de componente de cor, codificadas estatisticamente pela projecção da ocorrência mais frequente dos ditos valores na dita série de acordo com:-uma tabela de palavras digitais de tamanho de um bit; pro jectar as três ocorrências mais frequentes seguintes dos ditos valores de acordo com uma tabela de códigos, incluindo um tamanho de palavra digital de dois bits para cada valor na di ta série; e projectar todos os outros valores na dita série de acordo com uma tabela de valores tendo um tamanho de palavra digital maior do que dois bits.183, - Dispositivo de acordo com a reivindicação 15, caracterizado por as margens distintivas de um segmento de imagem representado por combinações de comprimento de percurso e códigos de cor comprimidos em, pelo menos, uma linha de expio ração serem codificadas numa tabela para cada quadro de imagem, representando mudanças nas ditas combinações como movimento do dito segmento de imagem de um quadro para um outro quadro sequencialmente, incluindo adicionalmente meios para armazenarem as ditas mudanças no dito segmento de imagem de combinações de comprimento de percurso e códigos de cor com69 143
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US18605088A | 1988-04-27 | 1988-04-27 | |
US07/186,637 US4914508A (en) | 1988-04-27 | 1988-04-27 | Method and system for compressing and statistically encoding color video data |
Publications (2)
Publication Number | Publication Date |
---|---|
PT90390A PT90390A (pt) | 1989-11-10 |
PT90390B true PT90390B (pt) | 1994-05-31 |
Family
ID=26881728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PT90390A PT90390B (pt) | 1988-04-27 | 1989-04-27 | Processo e dispositivo para comprimir e descomprimir dados video de cor digitais, codificados estatisticamente |
Country Status (3)
Country | Link |
---|---|
CA (1) | CA1322240C (pt) |
IL (1) | IL90025A0 (pt) |
PT (1) | PT90390B (pt) |
-
1989
- 1989-03-23 CA CA000594758A patent/CA1322240C/en not_active Expired - Fee Related
- 1989-04-19 IL IL90025A patent/IL90025A0/xx unknown
- 1989-04-27 PT PT90390A patent/PT90390B/pt not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CA1322240C (en) | 1993-09-14 |
PT90390A (pt) | 1989-11-10 |
IL90025A0 (en) | 1989-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4914508A (en) | Method and system for compressing and statistically encoding color video data | |
US4847677A (en) | Video telecommunication system and method for compressing and decompressing digital color video data | |
US4857993A (en) | Method and system for decompressing digital color video statistically encoded data | |
US4816901A (en) | Method and system for compressing color video data | |
US8416847B2 (en) | Separate plane compression using plurality of compression methods including ZLN and ZLD methods | |
US6181822B1 (en) | Data compression apparatus and method | |
US8170095B2 (en) | Faster image processing | |
US4857991A (en) | Method and system for decompressing color video feature encoded data | |
US4843466A (en) | Method and system for decompressing color video slope encoded data | |
AU616006B2 (en) | Method and system for compressing and decompressing digital color video statistically encoded data | |
US4849807A (en) | Method and system for compressing color video feature encoded data | |
KR950009460B1 (ko) | 부호화된 칼라 비데오 데이타를 감압하는 방법 및 시스템 | |
US5995671A (en) | Efficient representation of texture for gray scale alpha maps | |
PT90390B (pt) | Processo e dispositivo para comprimir e descomprimir dados video de cor digitais, codificados estatisticamente | |
PT90388B (pt) | Processo e dispositivo para comprimir dados video de cor codificados | |
KR20010023177A (ko) | 통계화된 톤의 컬러 큐브를 사용한 개인용 컴퓨터에서의비디오 프로세싱 방법 | |
JPS60236583A (ja) | 画像デ−タ処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG3A | Patent granted, date of granting |
Effective date: 19931109 |
|
MM3A | Annulment or lapse |
Free format text: LAPSE DUE TO NON-PAYMENT OF FEES Effective date: 19950531 |