BR0106160B1 - Método para gerar estatísticas de fundo para um documento escaneado - Google Patents

Método para gerar estatísticas de fundo para um documento escaneado Download PDF

Info

Publication number
BR0106160B1
BR0106160B1 BRPI0106160-7A BR0106160A BR0106160B1 BR 0106160 B1 BR0106160 B1 BR 0106160B1 BR 0106160 A BR0106160 A BR 0106160A BR 0106160 B1 BR0106160 B1 BR 0106160B1
Authority
BR
Brazil
Prior art keywords
background
peak
subregion
statistic
full
Prior art date
Application number
BRPI0106160-7A
Other languages
English (en)
Other versions
BR0106160A (pt
Inventor
Ramesh Nagarajan
Xing Li
Francis K Tse
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of BR0106160A publication Critical patent/BR0106160A/pt
Publication of BR0106160B1 publication Critical patent/BR0106160B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • H04N1/4072Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original
    • H04N1/4074Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original using histograms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Input (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

[001] Os processos convencionais de detecção automática de fundo ou segundo plano ("background") coletam informações de inten- sidade para criar um histograma da imagem escaneada. O processo em seguida identifica um pico de fundo a partir do histograma, estima uma curva que inclui o pico e calcula a média e o desvio padrão. O desvio padrão é em seguida usado para determinar o fator de ganho para o documento. O fator de ganho é usado para compensar o nível cinza de fundo da imagem do documento escaneado. Desta maneira, o histograma de nível cinza proporciona uma medida de fácil leitura do contraste de imagem a partir do qual um valor de fundo pode ser fa- cilmente gerado. Entretanto, cumpre notar que o valor de fundo é tão preciso quanto o histograma do qual o gerado. Conseqüentemente, ao gerar um histograma para determinar o nível de fundo de uma imagem escaneada, deve-se estar seguro de amostrar apenas os pixels prove- nientes de dentro da área de documento. [002] Nos sistemas convencionais, a detecção de fundo é execu- tada por amostragem de valores de pixel dentro de uma sub-região do documento (tipicamente o bordo anterior, ou de avanço) ou através de todo o documento (página). Estas abordagens tipicamente dependem de uma medição predefinida do tamanho e forma da imagem escane- ada, o que pode deixar de refletir o tamanho e forma reais do docu- mento escaneado. Conseqüentemente, embora estas abordagens produzam resultados razoáveis quando a medição predefinida reflete com precisão o tamanho e forma do documento escaneado, as abor- dagens podem falhar na medição precisa do fundo se o documento escaneado não for do mesmo tamanho que a medição predefinida ou se o documento escaneado estiver colocado de tal maneira que a me- dição predefinida inclua áreas de fundo que não são aquelas do do- cumento (por exemplo, tampa de mesa de prensa). [003] Por exemplo, considere-se o escaneamento de um docu- mento a partir de uma mesa de prensa com uma tampa de mesa de prensa branca ou cinza claro. Quando o documento a ser escaneado é menor que a medição predefinida, o histograma gerado conteria valo- res de nível cinza que correspondem à tampa branca de mesa de prensa, além dos valores de nível cinza do documento. Se uma quan- tidade suficiente da tampa de mesa de prensa for incluída no histo- grama, o valor de fundo detectado seria incorreto. Portanto, é vantajo- so utilizar um processo de detecção de fundo que possa diferenciar informação de nível cinza obtida de áreas que não são do documento da informação de nível cinza correspondente ao plano de fundo de do- cumento. Ao utilizar um tal processo, o valor de fundo refletirá o valor do documento e não o nível cinza de áreas que não são do documento e, conseqüentemente, a cópia que sai do dispositivo de impressão não realizará uma perda de qualidade de imagem. [004] De acordo com um aspecto da presente invenção, é apre- sentado um método para gerar estatísticas de fundo para um docu- mento escaneado. O método inclui as etapas de (a) determinar uma estatística de fundo de página inteira a partir de pixels selecionados dentro de uma área de documento; (b) determinar uma estatística de fundo de sub-região a partir de pixels selecionados dentro de uma sub- região da área de documento; (c) determinar se a estatística de fundo de sub-região corresponde a dados de imagem provenientes da área que não é do documento; (d) determinar se a estatística de fundo de página inteira está corrompida; e (e) gerar uma estatística de fundo de página inteira validada se a estatística de fundo de página inteira esti- ver corrompida. [005] De acordo com um outro aspecto da presente invenção, é apresentado um método para gerar estatísticas de fundo que distingue entre informação de nível cinza proveniente de área do documento ou de fora do documento. O método inclui gerar uma estatística de fundo de página inteira a partir de pixels de dentro de uma área de documen- to; gerar uma estatística de fundo de primeira sub-região a partir de pixels de dentro de uma primeira sub-região da área de documento; gerar uma estatística de fundo de segunda sub-região a partir de pi- xels de dentro de uma segunda sub-região da área de documento; de- terminar se a estatística de fundo de primeira sub-região corresponde a dados de nível cinza a partir de uma área fora do documento; reali- zar uma primeira determinação se a estatística de fundo de página in- teira estiver corrompida e, neste caso, gerar uma estatística de fundo de página inteira validada; determinar se a estatística de fundo de se- gunda sub-região corresponde a dados de nível cinza a partir de uma área fora do documento; e realizar uma segunda determinação se a estatística de fundo de página inteira está corrompida e, neste caso, gerar uma estatística de fundo de página inteira validada. [006] A fig. 1 ilustra a orientação de uma área de documento es- caneada e sub-regiões dentro da área de documento usada na discus- são da presente invenção; [007] A fig. 2 é um fluxograma que mostra um processo para de- terminar se a informação de nível cinza proveniente de áreas fora do documento está incluída na determinação de um valor de fundo de do- cumento de acordo com os conceitos da presente invenção; [008] A fig. 3 ilustra um processo para gerar estatísticas de fundo de página inteira de acordo com os conceitos da presente invenção; [009] A fig. 4 ilustra um processo para gerar estatísticas de fundo para uma sub-região de uma área de documento de acordo com os conceitos da presente invenção; [0010] A fig. 5 ilustra um processo para gerar estatísticas de fundo de página inteira validadas de acordo com os conceitos da presente invenção; e [0011] A fig. 6 ilustra um processo que utiliza informações coleta- das a partir de duas sub-regiões na determinação se a informação de nível cinza obtida de áreas fora do documento está incluída na deter- minação de fundo de acordo com os conceitos da presente invenção. [0012] Na descrição que se segue, são utilizados os termos dire- ção de escaneamento rápido e direção de escaneamento lento. A di- reção de escaneamento rápido se refere ao escaneamento de pixels ao longo de uma linha de escaneamento ou rastreio. Esta é também comumente referida como o escaneamento eletrônico em que o esca- neamento é o resultado da coleta de dados de imagem a partir de um arranjo de sensores fotoelétricos. A direção de escaneamento lento, por outro lado, refere-se à direção do movimento relativo entre o do- cumento e o sistema de escaneamento. Trata-se do movimento mecâ- nico que faz com que o sistema de escaneamento gere linhas de es- caneamento de dados de imagem. [0013] As abordagens convencionais de detecção de fundo podem falhar na medição precisa do fundo se o documento que está sendo escaneado não refletir com precisão o tamanho e/ou posição do do- cumento médio ou esperado. Para resolver este problema, a presente invenção propõe uma abordagem para distinguir informação de nível cinza obtida de áreas que não são do documento de informação de nível cinza correspondente ao fundo de documento. A abordagem da presente invenção coleta informação de histograma para área predefi- nida que define o tamanho e forma de um documento de página inteira padrão (por exemplo, 8,5 x 11, A4, etc), assim como uma ou mais sub- regiões dentro da área predefinida, tal como os bordos, onde a mesa de prensa pode ser detectada se a área predefinida não representar precisamente o documento escaneado. Após toda a página ter sido escaneada, a abordagem analisa os histogramas para as sub-regiões a fim de determinar se o valor de pico do histograma está contido no valor de nível cinza da tampa de mesa de prensa. Se for este o caso, a abordagem então compara o valor de pico do histograma de página inteira para determinar se está dentro de uma faixa limite do valor de pico de qualquer uma das sub-regiões. Se o pico de página inteira está contido em uma faixa limite de qualquer um dos picos de sub-região, a abordagem procura além do primeiro valor de pico da área de página inteira para encontrar um outro pico. [0014] Com referência agora à figura 1, nela aparece um diagrama que ilustra a orientação de um documento escaneado e sub-regiões dentro do documento escaneado usado na discussão da presente in- venção. Na fig. 1, a área 10 representa a área predefinida que define o tamanho, forma e orientação de um documento de página inteira pa- drão a partir do qual serão coletados dados de histograma durante o escaneamento de um documento introduzido. Ao escanear de uma mesa de prensa, o documento introduzido é usualmente colocado no canto esquerdo de topo (canto de registro) da mesa de prensa. Com esta orientação, se o documento introduzido for menor que o docu- mento de página inteira padrão (área 10), a tampa de mesa de prensa ficará exposta no bordo inferior quando o documento introduzido for menor que a área predefinida na direção de escaneamento rápido 20, ou no bordo direito, quando o documento introduzido for menor que a área predefinida na direção de escaneamento lento 22. Assim, para distinguir informação de nível cinza correspondente à tampa de mesa de prensa de informação proveniente de áreas de documento, a abor- dagem coleta informação de histograma a partir de uma sub-região, janela de amostra 12, próxima do bordo direito, e de uma sub-região, janela de amostra 14, próxima do bordo inferior, além da área de pági- na inteira 10. Além disso, conforme será explicado em detalhes abai- xo, para auxiliar a detecção de um segundo pico de fundo, a aborda- gem coleta informação de histograma a partir de uma sub-região, jane- la de amostra 16, no centro de documento. [0015] Cumpre notar que as janelas de amostra 12, 14, e 16 são mostradas para fins de ilustração, e não estão limitadas às regiões mostradas na fig. 1. Ou seja, qualquer um ou mais dentre o tamanho, forma e orientação das janelas de amostra pode ser modificado para uma dada aplicação. Por exemplo, a janela de amostra de bordo direi- to 12 pode se estender para baixo próximo da janela de amostra de bordo inferior 14. Além disso, a janela de amostra 12 e a janela de amostra 14 não precisam ser mutuamente exclusivas (ou seja, as duas regiões podem se sobrepor). Outrossim, vale apreciar que as janelas de amostra 12 e 14 podem ser combinadas em uma - e consideradas como uma - única janela de amostra. [0016] Pode-se perceber que embora a presente invenção seja discutida em relação a uma mesa de prensa na qual o canto superior do lado esquerdo define o canto de registro, a invenção pode se adap- tar facilmente para escanear com outras posições de registro. [0017] Com referência agora à figura 2, nela aparece um fluxo- grama que ilustra as etapas em uma realização de um processo de escaneamento de acordo com a presente invenção. A etapa 100 de- termina as estatísticas de fundo de página inteira, tais como o valor de pico de histograma, desvio padrão, fator de ganho para o documento, nível cinza de fundo, etc, usando os dados de imagem escaneada pa- ra a área predefinida 10 correspondente a um documento introduzido de página inteira. [0018] A etapa 110 determina estatísticas de fundo usando dados de imagem de uma sub-região de área de documento 10, tal como a janela de amostra 12 ou 14, na qual a tampa de mesa de prensa ou outro meio que não seja documento seria detectado se o documento introduzido não fosse equivalente à área de documento predefinida 10.
Para propósitos de ilustração, o processo será descrito como operan- do sobre pixele dentro de janela de amostragem 12. Ou seja, a etapa 110 gera estatísticas de fundo, tais como o valor de pico de histogra- ma, desvio padrão, fator de ganho para o documento, nível cinza de fundo, etc, usando os dados de imagem de vídeo correspondentes à janela de amostra 12. [0019] A etapa 120 determina se a tampa de mesa de prensa é detectada nas estatísticas geradas para a janela de amostra 12. Espe- cificamente, a etapa 120 compara as estatísticas de fundo geradas para a janela 12 com as estatísticas para a tampa de mesa de prensa.
Se as estatísticas provenientes da janela 12 não forem comparáveis com as estatísticas de tampa de mesa de prensa, o processo estabe- lece que a tampa de mesa de prensa não é detectada na janela 12, e continua com a etapa 130, na qual as estatísticas de página inteira co- letadas na etapa 100 são usadas para processamento adicional de detecção de fundo. Se as estatísticas de fundo para a janela de amos- tra 12 forem comparáveis com aquelas da tampa de mesa de prensa, a etapa 120 determina que a tampa de mesa de prensa é detectada na janela 12, e continua com a etapa 140. [0020] Na etapa 140, as estatísticas de página inteira provenientes da etapa 100 são comparadas com uma estatística correspondente para a tampa de mesa de prensa a fim de determinar se as estatísticas de página inteira foram corrompidas por dados de imagem correspon- dentes à tampa de mesa de prensa ou a outra área que não seja de documento. Se a estatística de página inteira está dentro de uma faixa limite da estatística de tampa de mesa de prensa, o processo decide que as estatísticas de página inteira estão corrompidas e continua o processamento com a etapa 150, em caso contrário o processo decide que as estatísticas de página inteira são válidas, e continua com a e- tapa 130. Na etapa 150, o processo analisa as estatísticas de página inteira para gerar estatísticas de página inteira validadas. [0021] A fig. 3 mostra em maiores detalhes o processo que gera estatísticas de fundo de página inteira a partir dos dados de imagem escaneados, executado na etapa 100 da fig. 2. Neste processo, a eta- pa 101 é estabelecida para gerar um histograma a partir de valores de imagem provenientes de dentro da área escaneada 10. Mais especifi- camente, a etapa 101 identifica a área escaneada 10 a partir da qual os dados de histograma serão coletados. A etapa 101 identifica ainda o subconjunto de pixels dentro da área a ser amostrada se nem todos os pixels dentro da área forem usados na geração do histograma. Na etapa 103, os dados de histograma são coletados a partir de pixels selecionados dentro dos dados de imagem escaneados a partir da á- rea de documento 10. A etapa 105 determina o pico de fundo de pági- na inteira Pfe o desvio padrão Sf a partir dos dados de histograma co- letados na etapa 103. A etapa 107 pode ser incluída para gerar esta- tísticas adicionais, tais como o fator de ganho a partir do pico Pf e o desvio padrão Sf Conforme aqui empregado, um pico Pf ou valor de pico Pf identifica o valor de compartimento (valor de nível cinza) do compartimento de histograma que contém o pico. [0022] Em uma revisão resumida, uma abordagem convencional para determinar o valor de fundo de um documento compila um histo- grama dos valores de intensidade de imagem a partir de pixels sele- cionados de dentro da área de documento. Uma vez obtidos os dados de histograma, o pico de fundo e o limite branco são determinados. O valor de pico de fundo é o nível cinza com o maior número de pixels que possui uma intensidade relacionada ao valor de fundo (branco) da imagem que está sendo escaneada. [0023] Uma vez compilados os dados de histograma, os valores de compartimento, cada valor de compartimento é associado a um va- lor de nível cinza específico (os valores de compartimento variam de 0 a 225 para um sistema de oito bits), são lidos a partir dos comparti- mentos de alta intensidade (branco) até os compartimentos de baixa intensidade (preto). O número de pixels de cada compartimento (a fre- qüência) é comparado com um máximo armazenado em operação pa- ra encontrar o primeiro pico. Além disso, para impedir uma identifica- ção errada de um pico secundário como sendo fundo, a freqüência do compartimento de nível cinza e/ou nível cinza do pico pode ser compa- rada com um limite. Ademais, uma vez encontrado um pico no histo- grama, a busca dos dados de histograma pode continuar para procurar um pico maior adjacente. Se for encontrado um pico maior sem a pre- sença de um vale, o pico maior é designado como o pico de fundo. [0024] Uma vez identificado o pico de fundo, é determinado o des- vio padrão a partir do ponto médio ou de pico na distribuição de histo- grama. Segundo um método, a forma aproximada do histograma é es- timada pela definição de uma curva através de pelo menos três pon- tos, inclusive o valor de freqüência no compartimento com a maior fre- qüência de ocorrência e os valores de freqüência nos compartimentos de cada lado do compartimento que possui a maior freqüência de o- corrência. O desvio padrão da curva de distribuição do histograma po- de então ser determinado de uma maneira conhecida. Alternativamen- te, em vez de encaixar três ou mais pontos amostrados na curva e a- proximar o resultado de uma distribuição normal, uma média pondera- da dos pontos amostrados pode ser usada para determinar a média.
De posse da média calculada, e supondo uma distribuição normal, o desvio padrão pode ser obtido de uma maneira convencional. [0025] Alternativamente, como uma distribuição de histograma tí- pica se assemelha muito a uma distribuição Gaussiana normal, a de- terminação do valor de pico de quarto (1/4) representa uma estimativa razoável dos dois pontos sigma a partir da média (pico) no histograma.
Em outras palavras, o nível cinza que possui uma freqüência menor ou igual a % da freqüência de pico representa um ponto que está afasta- do de 2 desvios padrão a partir do ponto médio ou de pico na distribui- ção de histograma. Alternativamente, se o local de freqüência de pico de quarto (1/4) não puder ser determinado, o valor de nível cinza que possui uma freqüência de pico igual a 5/8 da freqüência de pico do pi- co de fundo pode ser usado para identificar um nível cinza que está afastado de um desvio padrão a partir do ponto médio ou de pico do histograma. [0026] Como os dados de histograma podem ser barulhentos, o nivelamento dos dados pode ser vantajoso. Uma abordagem para ni- velar o histograma adiciona as freqüências em N compartimentos ad- jacentes, divide a soma por N e coloca o resultado em um novo com- partimento. Desta maneira, com N = 4, um histograma com 256 com- partimentos é comprimido em um histograma de 64 compartimentos.
Finalmente, uma vez obtido o desvio padrão, este é usado para de- terminar o fator de ganho a partir do qual o nível cinza de fundo é de- terminado. [0027] A fig. 4 mostra em maiores detalhes o processo de gerar estatísticas de fundo para uma sub-região a partir dos dados de ima- gem escaneados executado na etapa 110 da fig. 2. Neste processo, a etapa 111 é estabelecida para gerar um histograma a partir de valores de imagem provenientes de pelo menos uma sub-região (por exemplo, a janela de amostra 12 ou 14) dentro da área de documento 10. Mais especificamente, a etapa 111 pode identificar a janela de amostra a ser amostrada conforme definida por um número de linhas de escane- amento a serem amostradas, um número de linhas de escaneamento anteriores a serem saltadas em uma direção de escaneamento lento antes da amostragem, um número de pixels anteriores para saltar em uma direção de escaneamento rápido antes da amostragem começar, e um número de pixels dentro de uma linha de escaneamento a ser amostrada. Além disso, se o número de pixels na janela de amostra for maior que a capacidade de um buffer de histograma, a etapa 111 iden- tifica pixels selecionados e cria janelas de subamostra dentro da janela de amostra a ser processada na etapa 113. [0028] Na etapa 113, são coletados dados de histograma a partir de pixels dentro dos dados de imagem escaneados a partir da janela de amostra identificada. A etapa 115 determina o pico de histograma de janela de amostra Ps e o desvio padrão Ss a partir dos dados de histograma coletados na etapa 113. A etapa 117 pode ser incluída pa- ra gerar outras estatísticas de fundo, tais como o fator de ganho e o nível cinza de fundo baseado em Ps e Ss. [0029] A figura 5 é um fluxograma que ilustra, em maiores deta- lhes, a geração de estatísticas de fundo de página inteira validadas executadas na etapa 150 da fig. 2. Neste processo, a etapa 151 de- termina novas estatísticas de fundo de página inteira (por exemplo, o pico P’f) a partir dos dados de histograma de página inteira coletados na etapa 100 verificando além do primeiro pico de página. Ou seja, a etapa 151 identifica o pico P>de uma maneira semelhante àquela des- crita acima, porém começa olhando com um compartimento que pos- sui um valor de nível cinza que está associado a uma intensidade me- nor (mais preta) do que o pico P’f. Uma vez identificado um novo pico de página P’f, a etapa 151 pode identificar o desvio padrão e gerar quaisquer estatísticas de fundo adicionais que possam ser necessá- rias. [0030] Na etapa 153, as novas estatísticas de fundo de página in- teira (por exemplo, o pico P» são comparadas com um ou mais limites para determinar se as novas estatísticas são válidas. Em particular, os limites são escolhidos para assegurar que o novo pico de fundo P’f es- teja mais provavelmente associado ao fundo de documento do que à tampa de mesa de prensa ou à imagem de documento. Se uma nova estatística de fundo estiver dentro do(s) limite(s), as novas estatísticas são consideradas estatísticas válidas, e o processo continua com a etapa 155, onde as novas estatísticas de fundo (por exemplo, o pico P’f) são usadas para processamento adicional de detecção de fundo.
Alternativamente, se, na etapa 153, for verificado que uma nova esta- tística de fundo está fora da faixa limite, o processo estabelece que não foram geradas novas estatísticas válidas, e continua com a etapa 157. Na etapa 157, o processo volta para as estatísticas de página in- teira coletadas na etapa 100 como as estatísticas validadas usadas para processamento adicional de detecção de fundo. [0031] Em uma realização preferida, os limites usados na etapa 153 se baseiam em estatísticas de fundo geradas dos dados de histo- grama de página inteira, assim como dos dados de histograma coleta- dos de uma ou mais sub-regiões, inclusive a janela de amostra 16.
Nesta realização, a etapa 110 precisaria gerar uma estatística de fun- do para duas sub-regiões (por exemplo, a janela de amostra 16, assim como a janela de amostra 12 ou 14). [0032] Mais particularmente, com a realização acima, a etapa 110 seria modificada para identificar uma primeira janela de amostra (por exemplo, a janela 12) para uma sub-região da área de documento, e uma segunda janela de amostra (por exemplo, a janela 16) para uma segunda sub-região. A primeira e segunda janelas de amostra podem ser definidas, cada uma, por um número de linhas de escaneamento a serem amostradas, um número de pixels anteriores para saltar em uma direção de escaneamento rápido antes da amostragem começar, e um número de pixels dentro de uma linha de escaneamento a ser amostrada. Além disso, a etapa modificada 110 geraria um primeiro histograma a partir de pixels dentro da primeira janela de amostra, e um segundo histograma a partir de pixels dentro da segunda janela de amostra. [0033] A seguir é apresentado um exemplo detalhado do processo para identificar o valor de fundo de uma imagem escaneada que sepa- ra níveis cinza de áreas que não são do documento daquelas do do- cumento de acordo com uma realização da presente invenção mostra- da nas figuras 2 - 5. As estatísticas de fundo usadas na discussão des- te exemplo detalhado são o histograma de valores de intensidade de pixel, o pico de fundo determinado a partir do histograma e o desvio padrão do valor de pico. [0034] Neste exemplo, os dados de histograma são coletados a partir de pixels selecionados dentro da área de documento 10, dentro de uma sub-região próxima do bordo direito (janela de amostra 12) e dentro de uma sub-região no centro do documento (janela de amostra 16), e um histograma dos valores de imagem é gerado para cada uma das três regiões. Uma vez compilados os histogramas, o processo en- tão determina o valor de pico de fundo e o desvio padrão para cada histograma. Ou seja, a etapa 100 determina o valor de pico de fundo de página inteira Pfe o desvio padrão Sf a partir do histograma compi- lado a partir da área de documento 10, enquanto o valor de pico de fundo de bordo direito Pre o desvio padrão Sr a partir do histograma compilado a partir da janela 12, e o valor de pico de fundo central Pc e o desvio padrão Sc a partir do histograma compilado a partir da janela 16 são gerados na etapa 110. [0035] Uma vez determinados os valores de pico, a etapa 120 de- termina se a tampa de mesa de prensa é detectada no histograma de bordo direito compilado para a janela de amostra 12. Ou seja, a etapa 120 determina se as estatísticas de fundo geradas para a janela 12 correspondem aos dados de imagem de uma área que não é do do- cumento, tal como a tampa de mesa de prensa. Vantajosamente, esta determinação é realizada verificando se o histograma de bordo direito corresponde a um histograma para a tampa de mesa de prensa. Es- pecificamente, o valor de pico de bordo direito Pr é comparado com uma faixa definida pelos valores de nível cinza mais alto e mais baixo para a tampa de mesa de prensa, e o desvio padrão Sr é comparado com o desvio padrão máximo para o nível cinza médio da tampa de mesa de prensa. Matematicamente, estas comparações são dadas por: PC|0W< Pr ^ PChigh (1) Sr < Max_Std_Dev (2) [0036] em que PC|0W é o valor de nível cinza mais baixo para a tampa de mesa de prensa, PChigh é o valor de nível cinza mais alto pa- ra a tampa de mesa de prensa, e Max_Std_Dev é o desvio padrão máximo para o nível cinza médio da tampa de mesa de prensa. Os valores para PC|0W, PChigh e Max_Std_Dev podem ser determinados por técnicas de calibragem. Em um sistema com uma tampa de mesa de prensa branca, encontrou-se o valor de 210 para o PC|0W; o valor de 230 para o PChigh; e o valor de 2,5 para o Max_Std_Dev. [0037] Se qualquer uma das condições indicadas pelas equações (1) e (2) não for satisfeita, o processo determina que uma tampa de mesa de prensa não é detectada no histograma de bordo direito. Ou seja, como o pico de bordo direito Pr não está dentro da faixa de valo- res de nível cinza para a tampa de mesa de prensa e/ou o desvio pa- drão Sr é maior que o que se poderia esperar se o pico fosse devido à tampa de mesa de prensa, o processo estabelece que a tampa de me- sa de prensa não foi detectada dentro da janela 12. Conforme discuti- do acima, se a tampa não é detectada na janela, o processo continua com a determinação do ganho global para a imagem escaneada usan- do o pico de página inteira Pf (etapa 130). No entanto, se ambas as condições indicadas pelas equações (1) e (2) forem satisfeitas (ou se- ja, o pico de bordo direito Pr está dentro da faixa de valores de nível cinza para a tampa de mesa de prensa, e o desvio padrão Sr é seme- lhante ao da tampa de mesa de prensa), o processo decide que a tampa de mesa de prensa foi vista na janela 12. [0038] Conforme discutido acima, quando a tampa de mesa de prensa é detectada dentro de uma sub-região, o processo determina se o valor de pico de página inteira pode ter sido corrompido pela tam- pa de mesa de prensa. Para realizar isto, o processo vantajosamente compara o valor de pico de fundo de página Pf com o pico de bordo direito. Especificamente, o processo determina se o valor de pico de página inteira incide no pico de fundo identificado a partir do histogra- ma compilado da janela 12. Esta comparação pode ser expressa por: (Pr- M Sr) < Pf < (Pr + M Sr) (3) [0039] em que M é uma constante maior que 0 e, de preferência, 2. [0040] Ou seja, se o pico de página inteira Pf incide dentro de dois sigmas do pico de bordo direito, o processo decide que o histograma de página inteira pode ter sido corrompido pela tampa de mesa de prensa e, em conseqüência, o pico de página inteira Pf pode ter sido calculado erroneamente. Por outro lado, se o pico de página inteira Pf não está dentro de dois sigmas do pico de bordo direito, o processo considera que o histograma de página inteira e o pico de página inteira Pf não foram afetados pela tampa de mesa de prensa, e usa o histo- grama de página inteira e o pico Pf para determinar o ganho global (e- tapa 130). [0041] Se o processo decide que as estatísticas de página inteira podem ser corrompidas pela tampa de mesa de prensa, o histograma de página inteira é analisado para gerar um pico de fundo de página inteira validado. Conforme descrito acima, a geração de um pico de fundo de página inteira validado começa com a identificação do novo pico de página inteira P’f a partir dos dados de histograma de página inteira coletados na etapa 100 olhando além do primeiro pico de pági- na. Ou seja, o novo pico P’f compreende um pico a partir de um valor de compartimento (valor de nível cinza) com intensidade menor (mais preta) do que a do pico Pf. [0042] Uma vez identificado um novo pico de página inteira P’f, o novo pico é comparado com limites baseados em estatísticas de fundo geradas dos dados de histograma coletados da janela de amostra 16 para determinar se P’f é válido. Vantajosamente, para ser válido, o no- vo pico P’fé pelo menos dois sigmas menor que o pico de bordo direito Pre possui uma freqüência mínima baseada naquela do pico Pf. Além disso, para garantir que o novo pico seja um pico de fundo, o novo pi- co P’f deve ser maior que o menor pico de fundo que poderia ser obti- do para o documento escaneado conforme determinado a partir do centro (janela 16) do documento. Ou seja, a validade do novo pico P’f vantajosamente é determinada usando as seguintes condições: P’f< (Pr- M Sr) (4) (Pc-MS)c<P’f (5) P’f(count) > N Pf(count) (6) [0043] em que Pf(count) é a freqüência do compartimento de pico (o número de pixels no compartimento de pico); P’f(count) é a freqüên- cia do novo compartimento de pico; M é uma constante maior que 0 e, de preferência, 2; e N é uma constante entre 0 e 1. [0044] Se todas as condições dadas pelas equações (4), (5) e (6) forem satisfeitas, o processo estabelece que um novo pico de fundo válido foi identificado. Ou seja, o novo pico de fundo P’f é considerado um pico válido, e o processo continua com o novo pico de fundo P’f como o pico validado usado para processamento adicional de detec- ção de fundo, tal como o cálculo do ganho global para o documento escaneado. Por outro lado, se uma ou mais das condições dadas pe- las equações (4), (5) e (6) não forem satisfeitas, o processo estabelece que um pico válido não pode ser identificado, (ou seja, o novo pico P’f não é válido), e volta para o pico de página inteira Pf previamente cole- tado na etapa 100 como o pico validado usado para o cálculo do ga- nho global. [0045] Com referência agora à figura 6, nela aparece um fluxo- grama que ilustra um processo que utiliza informações coletadas de duas sub-regiões para determinar se as informações de nível cinza obtidas a partir de uma área que não é do documento foram incluídas na determinação do fundo. O processo ilustrado na fig. 6 começa na etapa 200 com a coleta de dados de histograma e a compilação de um histograma a partir de uma pluralidade de regiões que incluem a área de documento 10, a janela 12, a janela 14 e a janela 16. Uma vez compilados os histogramas, o processo em seguida determina o valor de pico de fundo e o desvio padrão para cada histograma na etapa 210. Ou seja, a etapa 210 determina o valor de pico de fundo de pági- na inteira Pfe o desvio padrão Sf a partir do histograma compilado a partir da área de documento 10, o valor de pico de fundo de bordo di- reito Pre o desvio padrão Sr a partir do histograma compilado da jane- la 12, o valor de pico de bordo inferior Pbe o desvio padrão Sb a partir do histograma compilado da janela 14, e o valor de pico de fundo cen- tral Pc e o desvio padrão Sc a partir do histograma compilado a partir da janela 16. [0046] Na etapa 220, o processo determina se a tampa de mesa de prensa é detectada no histograma de bordo direito compilado para a janela de amostra 12. Ou seja, a etapa 120 determina se as estatís- ticas de fundo geradas para a janela 12 correspondem aos dados de imagem de uma área que não é do documento, tal como a tampa de mesa de prensa. Vantajosamente, esta determinação é realizada veri- ficando se o histograma de bordo direito corresponde a um histograma para a tampa de mesa de prensa. Esta determinação pode ser efetua- da da mesma maneira que foi discutida acima usando as relações da- das nas equações (1) e (2). Conforme discutido acima, se qualquer uma das condições estabelecidas pelas equações (1) e (2) não for sa- tisfeita, o processo determina que a tampa de mesa de prensa não é detectada no histograma de bordo direito. Se a tampa não for detecta- da na janela 42, o processo determina se a tampa de mesa é detecta- da no histigrama de bordo inferior na etapa 250, discutido em detalhes abaixo. Entretanto, se ambas as condições dadas pelas equações (1) e (2) forem satisfeitas, o processo estabelece que a tampa de mesa de prensa foi vista na janela 12, e continua com a etapa 230, na qual é efetuada uma determinação se o valor de pico de página inteira pode ter sido corrompido pela tampa de mesa de prensa. [0047] A determinação se o valor de pico de página inteira pode ter sido corrompido é realizada da mesma maneira que foi discutida anteriormente acima usando a relação dada na equação (3). Especifi- camente, o processo compara o valor de pico de fundo de página intei- ra Pf com o pico de bordo direito para determinar se o pico de página inteira Pf incide dentro de dois sigmas (2Sr) do pico de bordo direito Pr.
Em caso contrário, o histograma de página inteira e o pico de página inteira Pf são considerados não afetados pela tampa de mesa de pren- sa, e o processo usa o histograma de página inteira e o pico Pf para determinar o ganho global (etapa 260). [0048] Alternativamente, se o pico de página inteira incide dentro de dois sigmas do pico de bordo direito, o histograma de página inteira e o pico de página inteira Pf podem ter sido corrompidos por dados de imagem provenientes de áreas que não são do documento, tais como a tampa de mesa de prensa. Neste caso, o processo gera, na etapa 240, um pico de página inteira validado. A etapa 240 opera da mesma manei- ra que a etapa 150 descrita acima. Ou seja, um novo pico de página in- teira P’f é identificado a partir dos dados de histograma de página inteira coletados na etapa 200 olhando além do primeiro pico de página. A se- guir, a validade do novo pico de página inteira P’fé determinada de acor- do com as condições dadas nas equações (4), (5) e (6). [0049] Se todas as condições dadas pelas equações (4), (5) e (6) forem satisfeitas, o novo pico de fundo P’f é considerado um pico vali- dado, e o processo continua com a geração de estatísticas de fundo, tais como o cálculo do ganho global usando o novo pico de fundo P’f na etapa 290. Por outro lado, se uma ou mais das condições dadas pelas equações (4), (5) e (6) não forem satisfeitas, o processo estabe- lece que o novo pico P’f não é válido e volta para o histograma de pá- gina inteira e pico Pf gerado nas etapas 200 e 210 como o pico valida- do usado para o cálculo do ganho global na etapa 290. [0050] A etapa 250 determina se a tampa de mesa de prensa é de- tectada no histograma de bordo inferior compilado para a janela 14. Van- tajosamente, esta determinação é realizada verificando se o histograma de bordo inferior corresponde a um histograma para a tampa de mesa de prensa. Esta determinação pode ser efetuada da mesma maneira que foi usada para detectar a tampa de mesa de prensa no histograma de bordo direito. Especificamente, o valor de nível cinza de pico de bordo inferior Pb é comparado com a faixa definida pelos valores maior e menor de ní- vel cinza esperados para a tampa de mesa de prensa, e o desvio padrão Sb do pico de fundo inferior é comparado com o desvio padrão máximo para o nível cinza médio da tampa de mesa de prensa. Ou seja, a etapa 250 determina se as seguintes condições são satisfeitas: PClow < Pb < PChigh (7) Sb < Max_Std_Dev (8) [0051] Se ambas as condições dadas pelas equações (7) e (8) fo- rem satisfeitas (ou seja, o pico de bordo inferior Pb está na faixa de va- lores de nível cinza para a tampa de mesa de prensa, e o desvio pa- drão Sb é semelhante ao da tampa de mesa de prensa), o processo considera que a tampa de mesa de prensa foi vista na janela 14 e con- tinua com a etapa 270. Por outro lado, se uma das condições dadas pelas equações (7) e (8) não for satisfeita, a tampa de mesa de prensa não foi vista na janela 14 e o processo continua com a etapa 260. A eta- pa 260 gera estatísticas de fundo, tais como o ganho global, usando o histograma de página inteira e o pico Pf gerado nas etapas 200 e 210. [0052] A etapa 270 determina se o valor de pico de página inteira pode ter sido corrompido. Esta determinação é efetuada de uma ma- neira semelhante à da etapa 230. Entretanto, em vez de comparar o pico de página inteira com o pico de bordo direito, a etapa 270 deter- mina se o pico de página inteira Pf incide dentro de dois sigmas (2Sb) do pico de bordo direito Pb. Ou seja, a etapa 270 determina se a se- guinte condição é satisfeita: (Pb-MSb)<Pf<(Pb+MSb) (9) [0053] em que M é uma constante maior que 0 e, de preferência, 2. [0054] Em caso contrário, o histograma de página inteira e o pico de página inteira Pf são considerados não afetados pela tampa de me- sa de prensa, e o processo usa o histograma de página inteira e o pico Pf para determinar o ganho global (etapa 260). Se a condição da e- quação (9) não for atendida, o histograma de página inteira e o pico de página inteira Pf podem ter sido corrompidos por dados de imagem provenientes da tampa de mesa de prensa. Neste caso, o processo gera um pico de página inteira validado na etapa 280. [0055] A etapa 280 opera de uma maneira semelhante à da etapa 240. Ou seja, um novo pico de página inteira P’f é identificado a partir dos dados de histograma de página inteira coletados na etapa 200 o- Ihando além do primeiro pico de página. A seguir, a validade do novo pico de página inteira P’fé determinada de acordo com as condições: P’f< (Pb~ MS*,) (10) (Pc-MSb)<P’f (11) P’f(count) > N Pf(count) (12) [0056] em que M é uma constante maior que 0 e, de preferência, 2, e N é uma constante entre 0 e 1 e, de preferência, entre 0,15 e 0,35. [0057] Se todas as condições dadas pelas equações (10), (11) e (12) forem satisfeitas, o novo pico de fundo P’fé considerado um pico validado, e o processo continua com a geração de estatísticas de fun- do, tais como o cálculo do ganho global usando o novo pico de fundo P’f na etapa 290. Por outro lado, se uma ou mais das condições dadas pelas equações (10), (11) e (12) não forem satisfeitas, o processo considera que não foi identificado um pico válido, e volta para o histo- grama de página inteira e pico Pf gerado nas etapas 200 e 210 como o pico validado usado para o cálculo do ganho global na etapa 290. [0058] Em resumo, a presente invenção apresenta um processo para determinar o valor de fundo de uma imagem escaneada que dis- crimina as documento introduzido de nível cinza obtidas de áreas que não são do documento a partir de informações de nível cinza corres- pondentes ao fundo do documento. O processo coleta informações de histograma para área predefinida que define o tamanho e forma de um documento de página inteira padrão, assim como uma ou mais sub- regiões dentro da área predefinida onde podem ser coletados dados de nível cinza provenientes de áreas que não são do documento se a área predefinida não representa precisamente a imagem escaneada. O processo analisa os histogramas para as sub-regiões para determi- nar se o valor de pico do histograma está contido no valor de nível cin- za da tampa de mesa de prensa. Se for este o caso, a abordagem comparar o valor de pico da área de página inteira para determinar se está na faixa limite do valor de pico de qualquer sub-região. Se o pico de página inteira está na faixa limite, a abordagem olha além do pri- meiro valor de pico da área de página inteira para determinar se um segundo pico de fundo válido pode ser encontrado.

Claims (19)

1. Método para gerar estatísticas de fundo para um docu- mento escaneado compreendendo as etapas de: (a) determinar (100) uma estatística de fundo de página inteira a partir de pixels selecionados dentro de uma área do documento; (b) determinar (110) uma estatística de fundo de sub- região a partir de pixels selecionados dentro de uma sub-região da área do documento; caracterizado pelo fato de que ainda compreende as eta- pas de: (c) determinar (120) se a estatística de fundo de sub- região corresponde a dados de imagem provenientes de uma área que não é do documento; (d) determinar (140) se a estatística de fundo de página inteira está corrompida; e (e) gerar (150) uma estatística de fundo de página inteira validada se a estatística de fundo de página inteira es- tiver corrompida.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda a etapa de (f) gerar uma estatísti- ca de fundo para um documento escaneado usando uma dentre a es- tatística de fundo de página inteira e a estatística de fundo de página inteira validada.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a estatística de fundo de sub-região compreende um histograma de sub-região, e que a etapa (c) verifica se o histograma de sub-região corresponde a um histograma para a tampa de mesa de prensa.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a estatística de fundo de sub-região compreende um pico de fundo de sub-região Ps, e em que a etapa (c) compreende as sub-etapas: (c1) comparar o pico de sub-região Ps com uma faixa de valores de nível cinza para a área que não é do docu- mento; e (c2) estabelecer que a estatística de fundo de sub-região corresponde a dados de imagem provenientes de uma área que não é do documento quando o pico de sub- região Ps está dentro da faixa de valores de nível cinza para a área que não é do documento.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que a etapa (c) compreende ainda: (c3) comparar um desvio padrão Ss de um pico de fundo de sub-região com um desvio padrão para um pico de fundo para a área que não é do documento; e em que a sub-etapa (c2) estabelece que a estatística de fundo de sub-região corresponde a dados de imagem provenientes de uma área que não é do documento quando tanto o pico de sub-região Ps está na faixa de valores de nível cinza para a área que não é do documento como o desvio padrão Ss é menor que o desvio padrão pa- ra um pico de fundo para a área que não é do documento.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa (d) compreende comparar a estatística de fundo de página inteira com a estatística de fundo de sub-região.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a estatística de fundo de página inteira compreende um pico de página inteira Pf e a estatística de fundo de sub-região compreende um pico de sub-região Ps, e em que a comparação da etapa (d) é dada por (Ps - M Ss) < Pf< (Ps + M Ss), em que Ss é o des- vio padrão do pico de sub-região Ps e M é uma constante maior que 0.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa (e) compreende as sub-etapas: (e1) determinar (151) uma segunda estatística de fundo de página inteira a partir de pixels dentro da área do do- cumento; (e2) determinar (153) se a segunda estatística de fundo de página inteira é válida; e (e3) usar (155) a segunda estatística de fundo de página inteira como a estatística de fundo de página inteira validada quando a segunda estatística de fundo de página inteira é válida.
9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que compreende ainda a sub-etapa (e4) de usar (157) a estatística de fundo de página inteira como a estatística de fundo de página inteira validada quando a segunda estatística de fundo de pá- gina inteira não é válida.
10. Método, de acordo com a reivindicação 8, caracteriza- do pelo fato de que a etapa (e2) compreende comparar a segunda estatística de fundo de página inteira com pelo menos um dentre uma faixa de contagem de picos, um valor de pico mínimo e um valor de pico máximo.
11. Método, de acordo com a reivindicação 10, caracteri- zado pelo fato de que a faixa de contagem de picos é baseada na contagem de picos para a estatística de fundo de página inteira.
12. Método, de acordo com a reivindicação 10, caracteri- zado pelo fato de que o valor de pico mínimo é baseado em uma es- tatística de fundo para uma sub-região próxima ao centro da área do documento.
13. Método, de acordo com a reivindicação 10, caracteri- zado pelo fato de que o valor de pico máximo é baseado na estatísti- ca de fundo de sub-região.
14. Método, de acordo com a reivindicação 8, caracteriza- do pelo fato de que a sub-etapa (e2) compreende determinar se pelo menos um dentre P>< (Ps- M Ss), (Pc- M Sc) < P’fe P’f(COunt) >N Pf(count) é satisfeito, onde Pf é um pico de fundo para a área do documento, P’f é um segundo pico de fundo para a área do documento, Ps é um pico de fundo para a sub-região, Pc é um pico de fundo para uma segunda sub-região da área do documento, Sséo desvio padrão do pico de fundo para a sub-região, Sc é o desvio padrão do pico de fundo para a segunda sub-região, Pf(COunt) é o número de pixels do pico de fundo pa- ra a área do documento, P’f(COunt) é o número de pixels do segundo pico de fundo para a área do documento, M é uma constante maior que ze- ro e N é uma constante entre 0 e 1.
15. Método, para gerar estatísticas de fundo para um do- cumento escaneado compreendendo as etapas de: (a) gerar uma estatística de fundo de página inteira a par- tir de pixels selecionados de dentro de uma área do documento; (b) gerar uma estatística de fundo de primeira sub-região a partir de dados de imagem provenientes de uma primeira sub-região da área do documento; caracterizado pelo fato de que ainda compreende as eta- pas de: (c) gerar uma estatística de fundo de segunda sub-região a partir de dados de imagem provenientes de uma se- gunda sub-região da área do documento; (d) determinar se a estatística de fundo de primeira sub- região corresponde a dados de imagem provenientes de uma área que não é do documento, (e) se a estatística de fundo de primeira sub-região cor- responde a dados de imagem provenientes de uma área que não é do documento, realizar uma determi- nação se a estatística de fundo de página inteira está corrompida com base na estatística de fundo de pri- meira sub-região e, se for este o caso, gerar uma esta- tística de fundo de página inteira validada; (f) determinar se a estatística de fundo de segunda sub- região corresponde a dados de imagem provenientes de uma área que não é do documento; e (g) se a estatística de fundo de segunda sub-região cor- responde a dados de imagem provenientes de uma área que não é do documento, realizar uma determi- nação se a estatística de fundo de página inteira está corrompida com base na estatística de fundo de se- gunda sub-região e, se for este o caso, gerar uma es- tatística de fundo de página inteira validada.
16. Método, de acordo com a reivindicação 15, caracteri- zado pelo fato de que a primeira sub-região compreende uma janela próxima a uma margem inferior da área do documento e a segunda sub-região compreende uma janela próxima à margem direita da área do documento.
17. Método, de acordo com a reivindicação 15, caracteri- zado pelo fato de que a estatística de fundo de primeira sub-região compreende um pico de fundo Ps1 e em que etapa (d) compreende as sub-etapas: (d1) comparar o pico de sub-região Ps1 com uma faixa de valores de nível cinza para a área que não é do docu- mento; e (d2) estabelecer que a estatística de fundo de sub-região corresponde a dados de imagem provenientes de uma área que não é do documento quando o pico de sub- região Ps1 está na faixa de valores de nível cinza para a área que não é do documento.
18. Método, de acordo com a reivindicação 15, caracteri- zado pelo fato de que a etapa (e) compreende as sub-etapas: (e1) determinar se a estatística de fundo de página inteira está dentro de uma faixa em torno da estatística de fundo de primeira sub-região; e, se for este o caso, (e2) gerar uma segunda estatística de fundo de página in- teira a partir de pixels selecionados dentro da área do documento; (e3) determinar se a segunda estatística de fundo de pági- na inteira é válida; e (e4) usar a segunda estatística de fundo de página inteira como a estatística de fundo de página inteira validada quando a segunda estatística de fundo de página intei- ra é válida.
19. Método, de acordo com a reivindicação 18, caracteri- zado pelo fato de que a etapa (e2) compreende comparar a segunda estatística de fundo de página inteira com pelo menos um dentre uma faixa de contagem de picos, um valor de pico mínimo e um valor de pico máximo.
BRPI0106160-7A 2000-12-18 2001-12-18 Método para gerar estatísticas de fundo para um documento escaneado BR0106160B1 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/739,405 US6674899B2 (en) 2000-12-18 2000-12-18 Automatic background detection of scanned documents

Publications (2)

Publication Number Publication Date
BR0106160A BR0106160A (pt) 2002-08-13
BR0106160B1 true BR0106160B1 (pt) 2014-09-02

Family

ID=24972140

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0106160-7A BR0106160B1 (pt) 2000-12-18 2001-12-18 Método para gerar estatísticas de fundo para um documento escaneado

Country Status (7)

Country Link
US (1) US6674899B2 (pt)
EP (1) EP1215884B1 (pt)
JP (1) JP4416365B2 (pt)
BR (1) BR0106160B1 (pt)
CA (1) CA2365001C (pt)
DE (1) DE60141739D1 (pt)
MX (1) MXPA01013064A (pt)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4085580B2 (ja) * 2001-02-20 2008-05-14 富士ゼロックス株式会社 画像処理装置
US7116826B2 (en) * 2001-06-15 2006-10-03 Canon Kabushiki Kaisha Embedding with error-correction encoding
US7058222B2 (en) * 2001-12-20 2006-06-06 Xerox Corporation Automatic background detection of scanned documents
US20030128873A1 (en) * 2002-01-07 2003-07-10 Barry Bronson Imaging system and method for generating a digital image file
JP4046016B2 (ja) * 2003-06-04 2008-02-13 セイコーエプソン株式会社 画像データ処理装置及び画像データの処理方法
US6965746B2 (en) * 2003-06-17 2005-11-15 Xerox Corporation Hybrid electrophotographic development with toner induction charged via AC induced conductivity
KR100750112B1 (ko) * 2003-11-03 2007-08-21 삼성전자주식회사 입체물 스캔 장치 및 방법
US7421143B2 (en) * 2004-06-01 2008-09-02 Xerox Corporation Systems and methods for optimal dynamic range adjustment of scanned images
US20050265600A1 (en) * 2004-06-01 2005-12-01 Xerox Corporation Systems and methods for adjusting pixel classification using background detection
US20060039627A1 (en) * 2004-08-21 2006-02-23 Xerox Corporation Real-time processing of grayscale image data
US7515772B2 (en) * 2004-08-21 2009-04-07 Xerox Corp Document registration and skew detection system
US20060098243A1 (en) * 2004-11-08 2006-05-11 Lexmark International, Inc. Determining a gray background value and/or skew of a scanned document
US20060165292A1 (en) * 2005-01-26 2006-07-27 Xerox Corporation. Noise resistant edge detection
US20060268365A1 (en) * 2005-05-27 2006-11-30 Lexmark International, Inc. Imaging apparatus configured for scanning a document
US7388690B2 (en) * 2005-05-27 2008-06-17 Khageshwar Thakur Method for calibrating an imaging apparatus configured for scanning a document
US7551334B2 (en) * 2005-07-20 2009-06-23 Xerox Corporation Background suppression method and apparatus
US7555172B2 (en) * 2005-10-31 2009-06-30 Xerox Corporation Dynamic range detection and adjustment
US7668394B2 (en) * 2005-12-21 2010-02-23 Lexmark International, Inc. Background intensity correction of a scan of a document
US7701618B2 (en) * 2006-06-14 2010-04-20 Kabushiki Kaisha Toshiba Automatic image enhancement using computed predictors
US8134762B2 (en) * 2007-01-29 2012-03-13 Sharp Laboratories Of America, Inc. Methods and systems for characterizing regions of substantially-uniform color in a digital image
US7873232B2 (en) * 2007-07-31 2011-01-18 Xerox Corporation Method and system for image background suppression using neutral adjustment of color channels
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
US7843616B2 (en) * 2008-03-27 2010-11-30 Xerox Corporation Background suppression in a multi-function color scanning system
US8111918B2 (en) * 2008-10-20 2012-02-07 Xerox Corporation Segmentation for three-layer mixed raster content images
US8180153B2 (en) * 2008-12-05 2012-05-15 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a black text layer
US8285035B2 (en) * 2008-12-05 2012-10-09 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a text layer and processing thereof
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
JP5701182B2 (ja) 2011-08-18 2015-04-15 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
JP5701181B2 (ja) * 2011-08-18 2015-04-15 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
US9426329B2 (en) * 2014-07-10 2016-08-23 Csr Imaging Us, Lp Image processing system of background removal and white/black point compensation
JP6326316B2 (ja) * 2014-07-25 2018-05-16 シャープ株式会社 画像処理装置、撮影装置、プログラム、記録媒体
US9710911B2 (en) * 2015-11-30 2017-07-18 Raytheon Company System and method for generating a background reference image from a series of images to facilitate moving object identification
JP2020065193A (ja) * 2018-10-18 2020-04-23 シャープ株式会社 画像形成装置、画像処理方法及び画像処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5086485A (en) 1990-10-19 1992-02-04 Xerox Corporation Method and apparatus for dynamically setting a background level
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
US5488491A (en) * 1993-07-06 1996-01-30 Eastman Kodak Company Image processing apparatus and method for eliminating background density in a designated image area
JP3532014B2 (ja) * 1995-11-30 2004-05-31 松下電器産業株式会社 しきい値算出方法
US5751848A (en) 1996-11-21 1998-05-12 Xerox Corporation System and method for generating and utilizing histogram data from a scanned image
US5848183A (en) 1996-11-21 1998-12-08 Xerox Corporation System and method for generating and utilizing histogram data from a scanned image
US5881166A (en) 1996-11-21 1999-03-09 Xerox Corporation Method and system for generating a histogram of a scanned image
US5835628A (en) 1996-11-21 1998-11-10 Xerox Corporation Method and system for generating histograms from a scanned image
US6198845B1 (en) * 1997-07-01 2001-03-06 Xerox Corporation Method for determining document background for adjusting the dynamic range of an image of the document

Also Published As

Publication number Publication date
JP4416365B2 (ja) 2010-02-17
EP1215884B1 (en) 2010-04-07
EP1215884A2 (en) 2002-06-19
CA2365001C (en) 2005-01-25
EP1215884A3 (en) 2004-07-21
MXPA01013064A (es) 2004-05-21
BR0106160A (pt) 2002-08-13
US6674899B2 (en) 2004-01-06
JP2002208007A (ja) 2002-07-26
US20020076102A1 (en) 2002-06-20
CA2365001A1 (en) 2002-06-18
DE60141739D1 (de) 2010-05-20

Similar Documents

Publication Publication Date Title
BR0106160B1 (pt) Método para gerar estatísticas de fundo para um documento escaneado
US7058222B2 (en) Automatic background detection of scanned documents
EP0780791B1 (en) Automatic tone scale adjustment using image activity measures
US6990233B2 (en) Apparatus and method for extracting object based on feature matching between segmented regions in images
US9619897B2 (en) Correction of blotches in component images
US8059892B1 (en) Image enhancement method and apparatus
US8457403B2 (en) Method of detecting and correcting digital images of books in the book spine area
US7634151B2 (en) Imaging systems, articles of manufacture, and imaging methods
EP0778543A2 (en) A gradient based method for providing values for unknown pixels in a digital image
US6801670B2 (en) Image reading apparatus and shading correction data acquiring method
EP0624848A2 (en) A technique for the detection and removal of local defects in digital continuous-tone images
CN101326549B (zh) 检测数字图像中的条纹的方法
US7454078B2 (en) Method and apparatus for flicker removal from an image sequence
EP1345175B1 (en) Method and apparatus for tracking moving objects in pictures
US20060210164A1 (en) Image processing device
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
WO2002047553A1 (fr) Procede servant a detecter les limites de la cage thoracique dans une image numerique
Kundu et al. Cobb angle measurement of scoliosis with reduced variability
JP4437772B2 (ja) 画像処理システム、画像処理方法、プログラムおよびその記録媒体
CN116542934B (zh) 薄膜电容工艺检测方法及电子设备
CN113128435B (zh) 图像中手部区域分割方法、装置、介质及计算机设备
JPH0727711A (ja) 画像におけるマーク部の欠陥検出方法
KR100353842B1 (ko) 쿼시 3차 마르코프 랜덤 필드를 이용한 영역분할 영상후처리 방법
KR910015946A (ko) 디지탈 데이타 처리방법
Vishwanath et al. 2-Row Indian LP character segmentation hybrid algorithm with adaptive noise filter

Legal Events

Date Code Title Description
B06A Notification to applicant to reply to the report for non-patentability or inadequacy of the application [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 02/09/2014, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 14A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2342 DE 24-11-2015 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.