BRPI0108856B1 - Método e aparelho para binarizaçao de imagem - Google Patents

Método e aparelho para binarizaçao de imagem Download PDF

Info

Publication number
BRPI0108856B1
BRPI0108856B1 BRPI0108856-4A BRPI0108856A BRPI0108856B1 BR PI0108856 B1 BRPI0108856 B1 BR PI0108856B1 BR PI0108856 A BRPI0108856 A BR PI0108856A BR PI0108856 B1 BRPI0108856 B1 BR PI0108856B1
Authority
BR
Brazil
Prior art keywords
image
pixels
gray level
limits
values
Prior art date
Application number
BRPI0108856-4A
Other languages
English (en)
Inventor
Zlotnick Aviad
Original Assignee
International Business Machines Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corporation filed Critical International Business Machines Corporation
Publication of BRPI0108856B1 publication Critical patent/BRPI0108856B1/pt
Publication of BRPI0108856B8 publication Critical patent/BRPI0108856B8/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Image Input (AREA)
  • Optical Fibers, Optical Fiber Cores, And Optical Fiber Bundles (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

"método aperfeiçoado para binarização de imagens". descreve-se um método para binarizar uma imagem de entrada de nível cinza (20), que inclui uma pluralidade de pixels que têm valores de nível cinza respectivos. um limite inferior e um limite inferior são determinados. um primeiro valor binário é designado para os pixels na imagem de nível cinza, que têm valores de nível cinza acima do limite superior, e um segundo valor binário é designado para os pixels na imagem de nível cinza, que têm valores de nível cinza abaixo do limite inferior. os pixels em um grupo intermediário, que têm valores de nível cinza entre os limites inferiores e superiores, são processados de modo a determinar designações ótimas dos pixels no grupo intermediário para o primeiro e segundo valores binários.

Description

(54) Título: MÉTODO E APARELHO PARA BINARIZAÇAO DE IMAGEM (51) Int.CI.: G06K 9/36 (30) Prioridade Unionista: 02/03/2000 US 09/519,446 (73) Titular(es): INTERNATIONAL BUSINESS MACHINES CORPORATION (72) Inventor(es): AVIAD ZLOTNICK “MÉTODO E APARELHO PARA BINARIZAÇÃO DE IMAGEM”.
CAMPO TÉCNICO DA INVENÇÃO
A presente invenção refere-se genericamente a métodos e aparelho para processar imagens, e especificamente, métodos para binarização de imagens de nível de cinza.
ANTECEDENTES DA INVENÇÃO
Os métodos para binarização de imagens são bem conhecidos nessas técnicas. Dito genericamente, esses métodos pegam uma imagem de nível de cinza, na qual cada pixel tem um valor de nível de cinza em multibits, e convertem-na em uma imagem binária, na qual cada pixel tem um valor binário, seja preto (primeiro plano) ou branco (segundo plano). A binarização é usada particularmente para simplificar imagens de documentos, a fim de processar e armazenar informações que estão impressas ou escritas sobre o documento.
O método de binarização mais rápido e mais simples é simplesmente fixar um limite e determinar que todos pixels que têm um valor de nível de cinza acima do limite são brancos, enquanto que aqueles abaixo do limite são pretos. Este método, entretanto, resulta frequentemente em perda ou confusão das informações contidas na imagem de nível de cinza. Estas informações são incorporadas principalmente nas bordas que aparecem na imagem, e dependem não tanto do brilho absoluto dos pixels quanto do seu brilho relativo em relação aos seus vizinhos. Assim sendo, dependendo da escolha do limite, uma borda expressiva na imagem de nível de cinza desaparecerá na imagem binária se os pixels sobre ambos os lados da borda são binarizados até o mesmo valor. Por outro lado, objetos na imagem binária com aparência de bordas podem ocorrer em uma área de transição contínua na imagem de nível de cinza, quando os pixels com valores muito similares de nível de cinza caem sobre lados opostos do limite escolhido.
Estes problemas estão exemplificados pelas tabelas que seguem. A tabela I representa os valores dos pixels em uma imagem 5 x 5, onde os valores mais altos representam pixels mais brilhantes:
Petição 870170055363, de 02/08/2017, pág. 9/12
TABELA I
Cinza Col 1 Col 2 Col 3 Col 4 Col 5
Fileira 1 10 10 10 11 11
Fileira 2 10 11 12 13 14
Fileira 3 16 17 18 19 20
Fileira 4 14 16 14 16 18
Fileira 5 16 14 16 14 90
Se esta imagem for binarizada usando um limite de 85, o resultado será como indicado na Tabela II:
TABELA II
Limite=85 Col 1 Col 2 Col 3 Col 4 Col 5
Fileira 1 0 0 0 0 0
Fileira 2 0 0 0 0 0
Fileira 3 0 0 0 0 0
Fileira 4 0 0 0 0 0
Fileira 5 0 0 0 0 1
Os grandes intervalos que circundam o pixel no canto inferior direito estão representados na imagem binarizada, mas todos os outros intervalos são perdidos. (O termo intervalo é usado, no contexto do presente pedido de patente e nas reivindicações, para denotar a diferença absoluta no nível cinza entre um par de pixels vizinhos).
Por outro lado, se o limite é estabelecido em 15, a imagem binária resultante será como indicada na Tabela III:
TABELA III
Limite=85 Col 1 Col 2 Col 3 Col 4 Col 5
Fileira 1 0 0 0 0 0
Fileira 2 0 0 0 0 0
Fileira 3 1 1 1 1 1
Fileira 4 0 1 0 1 1
Fileira 5 1 0 1 0 1
O intervalo de tamanho 6 entre as fileiras 2 e 3, que provavelmente corresponde a uma borda real na imagem, está representado na ima-
Figure BRPI0108856B1_D0001
Figure BRPI0108856B1_D0002
:
gem binária. Os intervalos grandes no canto inferior direito, entretanto, são perdidos. Ao mesmo tempo, os intervalos pequenos (de tamanho 2) entre as fileiras 4 e 5, que poderíam ser devido a interferência, estão representados na imagem binária. Assim sendo, bordas significativas na imagem de nível
-5 cinza são perdidas, enquanto que intervalos insignificantes são tolerados, gerando objetos.
Devido às razões exemplificadas por essas tabelas, os algoritmos práticos de binarização permitem que o limite da binarização varie. Estes algoritmos genericamente fazem suposições sobre o conteúdo da ima10 gem, para determinar o melhor limite a usar por toda a imagem ou em áreas específicas da imagem. As suposições podem relacionar-se aos tamanhos de objetos na imagem, propriedades dos histograma, níveis de interferência ou outras propriedades da imagem. Devido ao fato de que elas são dependentes dessas suposições, os algoritmos da binarização tendem a funcionar bem no tipo específico de imagens ou objetos para os quais eles foram desenhados, mas falham em outros. Por exemplo, um algoritmo de binarização orientado para textos pode funcionar bem em uma imagem de documento que contém texto sobre um fundo simples, mas pode falhar quando o fundo é texturizado. Além disso, as imagens de documentos contêm freqüente20 mente características salientes que não um texto simples, tais como símbolos, linhas e quadros, que são importantes preservar na imagem binária e são perdidos quando a binarização orientada para textos é usada.
A ternarização de imagens foi sugerida como um método para processar imagens de nível cinza, embora não no contexto da reprodução de imagens de documentos. Tipicamente, uma faixa de valores de pixels cinza é definida na intermediária entre os valores baixos da faixa do preto e os valores baixos da faixa do branco. A imagem ternária resultante demonstrou ser útil em inúmeras aplicações de reconhecimento de imagens e correlação de imagens.
Por exemplo, a patente n° US 5.067.162, cuja descrição é aqui incorporada como referência, descreve um método e um aparelho para verificar a identidade, usando correlação de imagens, baseado tipicamente em análise de impressões digitais. Para eliminar a incerteza e variabilidade das determinações das bordas na imagem de impressões digitais, uma técnica ternarização é usada para dividir todos os pixels em um entre três níveis:
preto, cinza ou branco. Um histograma de valores do cinza da imagem em
-5 escala cinza é determinado, valores limiares de preto-cinza e cinza-branco são estabelecidos de acordo com distribuições igualitárias de terços. Todos pixels que têm valores de cinza mais escuros do que o valor limite de pretocinza são convertidos em pixels de preto; todos os outros pixels são ignorados em cálculos subseqüentes de correlação. Assim sendo, os pixels de preto e de branco representam regiões de cristas e vales de alta confiança da imagem da impressão digital, enquanto que os pixels do cinza representam as regiões de transição entre as cristas e vales.
Como outro exemplo, a patente nQ US 5.715.325, cuja descrição é aqui incorporada como referência, descreve um aparelho e métodos para detectar uma face em uma imagem de vídeo. As imagens de face são processadas para eliminar detalhes precisos e proporcionar um contraste carregado, resultando em uma imagem que é quase binarizada (tendo blocos escuros e blocos claros), mais ainda contém alguns blocos que não podem ser claramente classificados. Para promover simplicidade no processamento, a imagem é tratada como uma imagem ternária, onde regiões escuras são identificadas com sinal do número um negativo (-1's), regiões claras são identificadas com número um positivo (1's), e regiões indefinidas são identificadas com zeros (0‘s). A imagem ternária é então comparada com diferentes modelos de faces, para encontrar um parelho ótimo.
SUMÁRIO DA INVENÇÃO
É um objeto da presente invenção fornecer métodos e um aparelho aperfeiçoados para processamento de imagens, e partieularmente, para processar imagens de documentos.
É um outro objeto de alguns aspectos da presente invenção for30 necer métodos aperfeiçoados para binarização de imagens.
É ainda outro objeto de alguns aspectos da presente invenção fornecer um método para ternarização de uma imagem.
Figure BRPI0108856B1_D0003
Em modalidades preferidas da presente invenção, uma imagem de entrada em nível cinza é ternarizada, genericamente como uma etapa preparatória na geração de uma imagem de saída binária. A imagem de entrada é primeiro analisada, para caracterizar as variações entre os valores '5 de nível cinza dos pixels na imagem, tais como os intervalos entre os valores de pixels vizinhos. Baseado nestas variações, limites superiores e inferiores de binarização são determinados, de tal modo que os pixels que têm valores de nível cinza acima do limite superior sejam classificados como branco, e aqueles abaixo do limite inferior sejam classificados como preto. Os pixels que têm valores de nível cinza entre os limites inferior e superior, aqui doravante referidos como pixels intermediários ou cinza, são então processados, de preferência, de modo a determinar uma classificação ótima desses pixels como brancos ou pretos.
De preferência, os limites superiores e inferiores da binarização são escolhidos de uma maneira desenhada para aumentar o número de bordas significativas na imagem de entrada, que são preservadas na imagem binária de saída, e ao mesmo tempo diminuindo o número de bordas com objetos que ocorrem. Gerando a imagem binária desta maneira, conduz-se as características salientes da imagem de saída claramente, sem depender substancialmente do tipo de conteúdo da imagem. Uma faixa de diferentes valores limiares são avaliados contra as variações de nível cinza entre os pixels, de modo a escolher limites ótimos superiores e inferiores. De preferência, a avaliação baseia-se em uma análise estatística dos intervalos do nível de cinza entre os pixels. Alternativamente ou adicionalmente, outras análises estatísticas e chaves de instruções, tais como as bordas reais encontradas por algoritmos de detecção de bordas, podem ser usadas para escolher os limites.
Em algumas modalidades preferidas da presente invenção, os pixels intermediários são classificados baseado na sua relação com outros pixels vizinhos. De preferência, os pixels que são significativamente mais brilhantes do que a média dos seus vizinhos são classificados como brancos, enquanto que aqueles significativamente mais escuros do que a média
Figure BRPI0108856B1_D0004
são classificados como pretos. Esta classificação não precisa depender dos limites superiores e inferiores escolhidos. Os pixels que não diferem significativamente da média dos seus vizinhos são tipicamente classificados, usando um limite, tal como uma média dos limites superiores e inferiores.
'5 Alternativamente, outros métodos podem ser aplicados para classificar ou processar de outra forma os pixels intermediários. Em uma modalidade preferida, um algoritmo de binarização orientado para textos é aplicado para a imagem de nível cinza, e os pixels intermediários são classificados usando os resultados deste algoritmo. Em outra modalidade preferi10 da, os valores do nível cinza dos pixels intermediários são armazenados junto com os valores binários dos outros pixels. Armazenar a imagem desta maneira requer muito menos memória do que a imagem de nível cinza completa, mas quase todas as informações significativas na imagem são preservadas para uso quando a imagem é rechamada para processamento ou vi15 sualização posterior por um operador humano.
Fornece-se, portanto, de acordo com uma modalidade preferida da presente invenção, um método para binarização de imagens, que inclui:
receber uma imagem de entrada de nível cinza que inclui uma pluralidade de pixels que têm valores de nível cinza respectivos;
determinar um limite inferior e um limite superior, que é maior do que o limite inferior, por uma diferença selecionada;
designar um primeiro valor binário aos pixels na imagem de nível cinza, tendo valores de nível cinza acima do limite superior, e um segundo valor binário aos pixels na imagem de nível cinza, tendo valores de nível cin25 za abaixo do limite inferior; e processar os pixels em um grupo intermediário que têm valores de nível cinza entre os limites inferiores e superiores, de modo a determinar as designações ótimas dos pixels no grupo intermediário para o primeiro e segundo valores binários.
De preferência, a determinação dos limites inferiores e superiores inclui analisar variações entre os valores do nível de cinza dos pixels na imagem de entrada e determinar os limites responsivos às variações anali-
Figure BRPI0108856B1_D0005
sadas. Mais preferivelmente, a análise das variações entre os valores do nível de cinza inclui encontrar bordas na imagem de entrada, e determinar os limites inclui selecionar os limites de modo a preservar as bordas em uma imagem de saída composta dos valores binários designados.
'5 Adicionalmente ou alternativamente, analisar as variações entre as imagens de nível cinza inclui encontrar inten/alos entre os níveis de cinza de pixels vizinhos, e determinar os limites inclui selecionar os limites de modo a preservar os intervalos que são significativos em detrimento dos intervalos que não são significativos em uma imagem de saída composta dos valores binários designados. De preferência, selecionar os limites inclui definir os intervalos que são significativos como aqueles cuja magnitude absoluta é maior do que a diferença selecionada entre os limites superiores e inferiores. Mais preferivelmente, selecionar os limites inclui selecionar os limites superiores e inferiores de modo a maximizar uma pontuação de mérito computada para múltiplos pares diferentes de limites superiores e inferiores, onde a pontuação correlaciona-se positivamente com o número de intervalos significativos preservados na imagem de saída pelo número de limites selecionados, e correlaciona-se negativamente com o número de intervalos que não são significativos, que são preservados, e o número de intervalos signi20 ficativos que não são preservados na imagem de saída pelos limites selecionados.
De preferência, determinar os limites inclui selecionar os limites de modo a preservar as informações sobre as bordas em uma imagem de saída composta dos valores binários designados. Mais preferivelmente, se25 lecionar os limites inclui escolher os limites substancialmente sem dependência do tipo de característica da imagem à qual as informações pertencem. Adicionalmente ou alternativamente, selecionar os limites inclui encontrar um valor médio ótimo dos limites superiores e inferiores e encontrar um valor ótimo da diferença selecionada entre os limites.
Ainda preferivelmente, processar os pixels no grupo intermediário inclui analisar as variações entre os valores do nível cinza dos pixels na imagem de entrada e determinar as designações dos pixels para o primeiro e segundo valores binários responsivos às variações analisadas. Mais preferivelmente, determinar as designações responsivas às variações analisadas inclui encontrar uma diferença significativa entre o valor de nível cinza de um dos pixels e os valores de nível cinza de outros pixels em sua vizinhança, e '5 designar o pixel para o primeiro ou segundo valor binário responsivo à diferença.
Em uma modalidade preferida, processar os pixels no grupo intermediário inclui aplicar um método de binarização otimizado para texto, a fim de determinar as designações ótimas dos pixels no grupo intermediário.
De preferência, o método inclui emitir uma imagem binária composta dos valores binários designados dos pixels.
Fornece-se também, de acordo com uma modalidade preferida da presente invenção, um método para processar uma imagem de entrada de nível cinza, que inclui uma pluralidade de pixels que têm valores de nível cinza respectivos, sendo que o método inclui:
analisar variações entre os valores de nível cinza dos pixels na imagem de entrada;
em resposta às variações analisadas, determinar um limite inferior e um limite superior, que é maior do que o limite inferior por um tamanho de intervalo selecionado;
designar um primeiro valor binário para os pixels na imagem de nível cinza que têm valores de nível cinza acima do limite superior e um segundo valor binário para os pixels na imagem de nível cinza que têm valores de nível cinza abaixo do limite inferior; e gerar uma imagem de saída ternária na qual os pixels aos quais foram designados o primeiro e o segundo valores binários são representados por seus respectivos valores binários, e os pixels em um grupo intermediário, que têm valores de nível cinza entre os limites inferiores e superiores, são representados por seus respectivos valores de nível cinza.
Em uma modalidade preferida, gerar a imagem de saída ternária inclui exibir a imagem de saída. Em outra modalidade preferida, gerar a imagem de saída ternária inclui armazenar a imagem de saída em uma memó-
Figure BRPI0108856B1_D0006
ria.
Fornece-se adicionalmente, de acordo com uma modalidade preferida da presente invenção, um aparelho para binarização de imagens, incluindo um processador de imagens, que é acoplado para receber uma J5 imagem de entrada de nível cinza que inclui uma pluralidade de pixels que têm valores de nível cinza respectivos, e que é adaptado para determinar um limite inferior e um limite superior, que é maior do que o limite inferior por uma diferença selecionada, a fim de designar um primeiro valor binário para os pixels na imagem de nível cinza que têm valores de nível cinza acima do limite superior, e um segundo valor binário para os pixels na imagem de nível cinza que têm valores de nível cinza abaixo do limite inferior, e para processar os pixels em um grupo intermediário que têm valores de nível cinza entre os limites inferiores e superiores, de modo a determinar designações ótimas dos pixels no grupo intermediário para o primeiro e segundo valores binários.
Fornece-se ainda, de acordo com uma modalidade preferida da presente invenção, um aparelho para processar uma imagem de entrada de nível cinza, que inclui uma pluralidade de pixels que têm valores de nível cinza respectivos, sendo que o aparelho inclui um processador de imagens que é adaptado para analisar variações entre os valores de nível cinza dos pixels na imagem de entrada e, em resposta às variações analisadas, determinar um limite inferior e um limite superior, que é maior do que o limite inferior, por um tamanho de intervalo selecionado, e para designar um primeiro valor binário para os pixels na imagem de nível cinza que têm valores de nível cinza acima do limite superior, e um segundo valor binário para os pixels na imagem de nível cinza que têm valores de nível cinza abaixo do valor inferior, e assim sendo, gerar uma imagem de saída ternária na qual os pixels aos quais são designados o primeiro e segundo valores binários são representados por seus respectivos valores binários, e os pixels em um gru30 po intermediário, que têm valores de nível cinza entre os limites inferiores e superiores, são representados por seus respectivos valores de nível cinza.
Em uma modalidade preferida, o aparelho inclui um painel de • · ·· exibição que é acoplado ao processador, de modo a receber e exibir a imagem de saída ternária. Em outra modalidade preferida, o aparelho inclui uma memória de armazenamento que é acoplada ao processador, de modo a receber e armazenar a imagem de saída ternária.
'5 Fornece-se ainda, de acordo com uma modalidade preferida da presente invenção, um produto de software de computador para processar uma imagem de entrada, incluindo um meio legível por computador, tendo instruções do programa armazenadas dentro dele, instruções estas que, quando lidas por um computador, fazem com que o computador receba uma imagem de entrada de nível cinza, incluindo uma pluralidade de pixels que têm valores de nível cinza respectivos, para determinar um limite inferior e um limite superior, que é maior do que o limite inferior por uma diferença selecionada, a fim de designar um primeiro valor binário para os pixels na imagem de nível cinza, que têm valores de nível cinza acima do limite supe15 rior, e um segundo valor binário para os pixels na imagem de nível cinza, que têm valores de nível cinza abaixo do limite inferior, e para processar os pixeis em um grupo intermediário, que têm valores de nível cinza entre os limites inferiores e superiores, de modo a determinar designações ótimas dos pixels no grupo intermediário para o primeiro e segundo valores binários.
Fornece-se ainda, de acordo com uma modalidade preferida da presente invenção, um produto de software de computador para processar uma imagem de entrada de nível cinza, que inclui uma pluralidade de pixels que têm valores de nível cinza respectivos, sendo que o produto inclui um meio legível por computador que tem instruções do programa armazenadas dentro dele, instruções estas que, quando lidas por um computador, fazem com que o computador analise variações entre os valores de nível cinza dos pixels na imagem de entrada e, responsivo às variações analisadas, determinar um limite inferior e um limite superior, que é maior do que o limite inferior por um tamanho de intervalo selecionado, a fim de designar um primeiro valor binário para os pixels na imagem de nível cinza, que têm valores de nível cinza acima do limite superior, e um segundo valor binário para os pixels na imagem de nível cinza, que têm valores de nível cinza abaixo do ní·· vel inferior, e para gerar uma imagem de saída ternária na qual os pixels aos quais são designados o primeiro e segundo valores binários, são representados por seus valores binários respectivos, e os pixels em um grupo intermediário, que têm valores de nível cinza entre os limites inferiores e superio'5 res, são representados por seus respectivos valores de nível cinza.
A presente invenção será mais inteiramente compreendida a partir da descrição detalhada das suas modalidades preferidas, que se segue, tomada em conjunto com os desenhos, nos quais:
BREVE DESCRIÇÃO DOS DESENHOS
A Figura 1 é uma reprodução esquemática de uma imagem de nível cinza captada por um scanner, como é do conhecimento nessas técnicas;
As Figuras 2 e 3 são reproduções esquemáticas de imagens binárias geradas pelo processamento da imagem de nível cinza da Figura 1, usando métodos conhecidos de binarização;
A Figura 4 é uma ilustração pictórica esquemática do aparelho processador de imagens de acordo com uma modalidade preferida da presente invenção;
A Figura 5 é um fluxograma que ilustra esquematícamente um método para binarização de imagens, de acordo com uma modalidade preferida da presente invenção;
A Figura 6 é um fluxograma que ilustra esquematícamente detalhes do método da Figura 5, de acordo com uma modalidade preferida da presente invenção; e
A Figura 7 é uma reprodução esquemática de uma imagem binária gerada pelo processamento da imagem de nível cinza da Figura 1, usando o métodos das Figuras 5 e 6.
DESCRIÇÃO DETALHADA DE MODALIDADES PREFERIDAS
As Figuras 1 a 3 são reproduções esquemáticas de imagens do cheque 20, apresentadas com a intenção de comparar diferentes métodos de binarização de imagens. A Figura 1 é uma imagem de nível cinza do cheque conforme ela é captada por um scanner de documentos. O cheque inclui caracteres impressos 22 sobre um fundo texturizado 24, junto com outras características, como as linhas 26 e um logotipo 28. Esse cheque poderia ser submetido a um contribuinte junto com seus formulários de devolução de imposto. Todos os formulários são escaneados, e suas imagens são arma'5 zenadas pelas autoridades tributárias para referência posterior. As imagens são tipicamente binarizadas antes do armazenamento, para reduzir o volume dos dados armazenados. É genericamente importante que as linhas, logotipo e outros detalhes identificadores sejam preservados na imagem, de tal modo que o cheque (ou outro documento) possa ser identificado claramente quando ele é rechamado a partir do armazenamento.
A Figura 2 mostra uma imagem 30 do cheque após a binarização, usando um algoritmo que funciona genericamente bem em imagens de documentos. O algoritmo é desenhado para documentos que têm um fundo simples e falha no fundo texturizado do cheque.
A Figura 3 ilustra uma imagem 35 do cheque após a binarização, usando um algoritmo que é especificamente sintonizado para texto. O algoritmo está descrito no pedido de patente n° US 09/310.287, que está cedido para a cessionária do presente pedido de patente, e cuja descrição é aqui incorporada como referência. Neste caso, os caracteres são nítidos, mas partes das linhas 26 e o logotipo 28 são perdidos. As dificuldades ilustradas pelas Figuras 2 e 3 são superadas por modalidades preferidas da presente invenção.
Faz-se agora referência à Figura 4, que é uma representação pictórica esquemática do aparelho processador de imagens 40, de acordo com uma modalidade preferida da presente invenção. O aparelho compreende um scanner 42, ou qualquer outro tipo apropriado de dispositivo de captação de imagens conhecido nessas técnicas, que recebe e escaneia um documento, como um cheque 20 (Figura 1). O scanner capta uma imagem de nível cinza do documento e conduz os dados correspondentes da ima30 gem para um processador de imagens 44, compreendendo tipicamente um computador apropriado de propósito genérico. Altemativamente, a imagem é alimentada no processador a partir de outra fonte. O processador 44 proces• c·· • · ·· sa a imagem de nível cinza, para gerar uma imagem ternária do documento, e depois processa adicionalmente a imagem ternária, para gerar uma imagem binária, usando os métodos aqui abaixo descritos. A imagem ternária ou binária é tipicamente exibida em um monitor 46 e/ou armazenada em '5 uma memória de massa 48 para rechamada posterior. As imagens podem ser também impressas ou transmitidas por uma rede, bem como ser submetidas a processamento adicional, usando, por exemplo, métodos de reconhecimento de caracteres ópticos (OCR) conhecidos nessas técnicas.
As funções de processamento de imagens do processador 44 são, de preferência, realizadas usando um software que roda no processador, que implementa uma modalidade da presente invenção, como aqui descrito detalhadamente abaixo. O software pode ser fornecido em meios tangíveis, tais como disquetes ou CD-ROM, e carregado no processador. Alternativamente, o software pode ser baixado para o processador por intermédio de uma conexão de rede ou outra ligação eletrônica. Ainda mais alternativamente, o processador 44 pode compreender elementos cabeados dedicados ou um processador digital de sinais para conduzir algumas ou todas as etapas do processamento de imagens.
A Figura 5 é um fluxograma que ilustra esquematicamente um método para binarizar imagens de nível cinza, de acordo com uma modalidade preferida da presente invenção. Uma imagem de nível cinza, como a imagem da Figura 1, é alimentada no processador 44 em uma etapa de entrada de imagens 50. Os valores de nível cinza dos pixels, e particularmente os intervalos entre os valores de pixels vizinhos, são analisados, em uma etapa de otimização 52, para encontrar um valor limiar mediano ótimo T e um valor de diferença D. T e D definem um valor limiar superior, dado por T + D/2, e um valor limiar inferior, dado por T - D/2. Em uma etapa de ternarização 54, todos os pixels na imagem de entrada são classificados em três grupos: aqueles que têm valores de nível cinza abaixo do limite inferior são marcados como preto (ou primeiro plano - tipicamente binário 1); aqueles acima do limite superior são marcados como branco (ou segundo plano ou fundo - binário 0); e aqueles intermediários entre os limites superiores e infe14 riores são marcados como cinza. O resultado é uma imagem ternária, que pode ser exibida no monitor 46 ou armazenada na memória 48.
Na etapa 52, os valores de T e D são escolhidos de modo a aumentar o número de bordas significativas na imagem de entrada, que são '5 preservados na imagem binária de saída, e ao mesmo tempo diminuindo o número de bordas de objetos que ocorrem. Para este propósito, define-se um intervalo significativo entre dois pixels vizinhos como um intervalo cujo >
tamanho absoluto é maior do que D. Diz-se que um intervalo está representado em uma imagem binária de saída l(T), gerada usando T como o limite de binarização, se os pixels em cada um dos dois lados do intervalo têm valores binários diferentes em l(T). Em outras palavras, o intervalo está representado se um dos pixels na imagem de saída tem um valor de nível cinza maior do que T, e o outro é menor do que T. Os valores ótimos de T e D são então, de preferência, encontrados maximizando uma função de méw 15 rito de T e D, que é escolhida para atender aos seguintes critérios:
1. Correlacionar-se positivamente com o número de intervalos significativos na imagem de entrada, que estão representados em l(T);
2. Correlacionar-se negativamente com o número de intervalos insignificantes na imagem de entrada, que estão representados em l(T); e
3. Correlacionar-se negativamente com o número de intervalos significativos na imagem de entrada, que não estão representados em l(T).
Para calcular essa função de mérito, toma-se N(T,D) como uma contagem ponderada de intervalos insignificantes na imagem de entrada, que estão representados em l(T). De preferência, a ponderação é tal que, quanto menor o intervalo que está representado em l(T), maior é seu peso. Em outras palavras, cada intervalo contado em N(T,D) tem um pixel com um valor de nível cinza maior do que T, sendo que a diferença absoluta entre valores de nível cinza não é mais do que D. Tome-se MAX como denotando o valor mais alto de nível cinza na imagem, de tal modo que N(T,MAX) seja a contagem ponderada de todos os intervalos representados em l(T). Tomese G(D) como uma contagem ponderada do número de intervalos significativos na imagem, isto é, intervalos que têm uma diferença absoluta maior do
Figure BRPI0108856B1_D0007
Figure BRPI0108856B1_D0008
cXY que D entre os valores de nível cinza do pixel. As seguintes mensurações são então definidas:
1. bom(T,D) = N(T,MAX) - N(T,D), a contagem ponderada de intervalos significativos representados em l(T);
'5 2. objetos(T,D) = N(T,D), intervalos insignificantes representados em l(T);
3. perdido(T,D) = G(D) - bom(T,D), intervalos significativos que foram perdidos em l(T).
Estas mensurações correspondem aos três critérios listados acima. A pontuação do mérito de qualquer par (T,D) é então dada por:
Pontuação(T,D) = bom(T,D) - objetos(T.D) - perdidos(T.D)
O par (T,D) que dá a pontuação mais alta é escolhido para uso na etapa 54.
Esta pontuação de mérito e o método para escolher T e D estão descritos acima a título exemplificativo, e outras pontuações e métodos podem ser também usados para otimizar T e D. Por exemplo, os pesos designados para os intervalos podem ser variados. Além disso, embora os intervalos sejam aqui definidos como referindo-se a pixels vizinhos, os pixels não precisam ser vizinhos imediatos, mas podem, ao invés disso, estar um pouco distantes entre si. Além disso, pode não ser necessário avaliar todos os intervalos na imagem, mas ao invés disso podem ser retiradas amostras representativas. Além disso, como o propósito de avaliar os intervalos é primordialmente escolher valores de T e D que preservarão bordas verdadeiras na imagem binária, pode-se usar um operador de bordas, como uma trans25 formada de Sobel, para identificar bordas na imagem de escala cinza. T e D podem ser então otimizados por todos os intervalos entre pixels que correspondem a essas bordas. Outras chaves de informações na imagem de escala cinza, como perfis de intensidade com formato em V (bordas de cobertura - comumente encontradas em linhas finas e características de tex30 tos), podem ser similarmente usadas para este propósito. Outros métodos para escolher os valores limiares superiores e inferiores devem ficar evidentes para os versados nessas técnicas, e são considerados como estando dentro do âmbito da presente invenção.
Retornando agora à Figura 5, em uma etapa de processamento de pixels cinza 56, os pixels intermediários são processados separadamente, e de preferência e recebem valores binários. Um método preferido para '5 binarização dos pixels intermediários está aqui descrito abaixo, fazendo referência à Figura 6. Em uma modalidade alternativa, um algoritmo de binarização orientado para textos, como aquele usado para gerar a imagem 35 na Figura 3, é aplicado à imagem de entrada de nível cinza. Os pixels intermediários (cinza) da etapa 54, e opcionalmente os pixels brancos também, re10 cebem então os valores binários gerados pelo algoritmo de binarização orientado para textos. Outros métodos para processar os pixels intermediários devem ficar evidentes para os versados nessas técnicas e são considerados como estando dentro do âmbito da presente invenção. Alternativamente, os pixels intermediários não são binarizados, e seus valores de nível cinza são armazenados e exibidos junto com os valores binários dos outros pixels.
Uma vez binarizados todos os pixels, a imagem binária é emitida para exibição, armazenamento ou processamento adicional, na etapa de saída 58. Opcionalmente, a imagem ternária é emitida também.
A Figura 6 é um fluxograma que ilustra esquematicamente de20 talhes da etapa 56 de processamento de pixels cinza, de acordo com uma modalidade preferida da presente invenção. A essência do método da Figura 6 é que os pixels que ressaltam como sendo significativamente mais brilhantes ou mais escuros do que seus vizinhos são marcados respectivamente como brancos ou pretos. Assim sendo, para cada um dos pixels in25 termediários, uma média local dos valores de nível cinza dos pixels na sua vizinhança é determinada, em uma etapa de tirar médias 60. Em uma etapa de pixels pretos 62, os pixels cujos valores de nível cinza são menores do que a média local em uma diferença maior do que D são designados como sendo preto binário. Os pixels cujos valores de nível cinza são maiores do que a média local em mais do que D são designados como sendo branco binário, em uma etapa de pixels brancos 64. Alternativamente, outro valor apropriado da diferença pode ser usado no lugar de D nas etapas 62 e 64.
· ·
Λ3 ·· ·· » · · · ·· ··
Ainda alternativamente, ou adicionalmente, outras medições e operadores, tais como operadores de bordas, podem ser usados para encontrar os pixels que ressaltam entre os pixels intermediários.
Os pixels remanescentes, que não foram classificados na etapa ‘5 62 ou 64, são processados em uma etapa de estabelecimento de limites 66.
De preferência, esses pixels são simplesmente binarizados ao redor do limite T, de tal modo que os pixels com valores de níveis de cinza maiores do que T recebam uma designação de branco binário, e os outros pixels, preto binário. Alternativamente, outro método de estabelecimento de limites pode ser usado.
A Figura 7 é uma representação esquemática de uma imagem binária 70 do cheque 20, gerada usando o método das Figuras 5 e 6, de acordo com uma modalidade preferida da presente invenção. Embora os caracteres 22 não sejam tão nítidos como na Figura 3, as linhas 26 e o logotipo 28 estão precisamente reproduzidos.
Embora modalidades preferidas estejam aqui descritas acima, com relação à reprodução de imagens, deve-se entender que os princípios da presente invenção podem ser usados símilarmente em outras aplicações de processamento de imagens. Por exemplo, os métodos aqui descritos podem ser adaptados para detectar bordas com uma dada intensidade relati20 vamente uniforme em uma imagem, e para distinguir entre as bordas na imagem quais realmente representam características salientes e aquelas que surgem devido a objetos, ou são insignificantes de outra maneira. Os métodos da presente invenção podem ser aplicados também, mutatis mutandi, a imagens em cores e para imagens de objetos tridimensionais.
Deve-se avaliar então que as modalidades preferidas descritas acima são citadas a título exemplificativo, e que a presente invenção não está limitada ao que foi aqui acima particularmente ilustrado e descrito. Ao invés disso, o âmbito da presente invenção inclui combinações e também subcombinações das várias características aqui acima descritas, bem como suas variações e modificações que poderiam ocorrer aos versados nessas técnicas, após a leitura da descrição precedente, e que não estão descritas nas técnicas anteriores.
1/2

Claims (7)

  1. REIVINDICAÇÕES
    1. Método para binarização de imagem, compreendendo:
    receber (50) uma imagem de entrada em nível cinza, que compreende uma pluralidade de pixels que tem respectivos valores de níveis de cinza;
    determinar (52) um limite inferior e um limite superior, que é maior do que o limite inferior por uma diferença selecionada;
    designar (54) um primeiro valor binário para os pixels na imagem de nível de cinza que tem valores de nível cinza acima do limite superior, e um segundo valor binário para os pixels na imagem de nível cinza que tem valores abaixo do limite inferior; e processar os pixels em um grupo intermediário que tem valores de nível cinza entre os limites superior e inferior, de modo a determinar designações dos pixels no grupo intermediário aos primeiro e segundo valores binários, a determinação dos limites superior e inferior compreende analisar as variações entre os valores de nível de cinza dos pixels na imagem de entrada e determinar os limites em resposta às variações analisadas;
    em que a análise das variações entre as imagens de nível de cinza compreende encontrar lacunas entre os níveis de cinza de pixels vizinhos, e em que a determinação de limites compreende selecionar os limites de modo a preservar as lacunas que são significantes em preferência para as lacunas que não são significantes em uma imagem de saída deita dos valores binários designados;
    caracterizado pelo fato de que:
    em que selecionar os limites compreende definir as lacunas que são significativas para aquelas cuja magnitude absoluta é maior do que a diferença selecionada entre os limites superior e inferior; e em que selecionar os limites compreende selecionar os limites superior e inferior de modo a maximizar uma pontuação de mérito computada para múltiplos pares diferentes de limites superior e inferior, em que a pontuação correlaciona-se positivamente com o número de lacunas significativas preservadas na imagem de saída pelos limites selecionados, e correlaciona
    Petição 870170055363, de 02/08/2017, pág. 10/12
  2. 2/2 negativamente com o o número de lacunas que não são significativas que são preservadas e o número de lacunas significativas que não são preservadas na imagem de saída pelos limites selecionados.
    2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que selecionar os limites compreende escolher os limites substancialmente sem dependência do tipo de característica de imagem ao qual a informação pertence.
  3. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que selecionar os limites compreende encontrar um valor médio ótimo dos limites superior e inferior e encontrar um valor ótimo da diferença selecionada entre os limites.
  4. 4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que a etapa de determinar as designações em resposta às variações analisadas compreende encontrar uma diferença significativa entre o valor de nível cinza de um dos pixels e os valores de nível cinza de outro pixels em sua proximidade, e designar o pixel ao primeiro ou segundo valor binário em resposta a diferença.
  5. 5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que gerar a imagem de saída compreende exibir a imagem de saída.
  6. 6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que gerar a imagem de saída compreende armazenar a imagem de saída em uma memória.
  7. 7. Aparelho para binarização de imagem caracterizado pelo fato de que compreende um processador de imagem que está acoplado para realizar as etapas do método definido em qualquer uma das reivindicações 1 a 6.
    Petição 870170055363, de 02/08/2017, pág. 11/12 ··· ··
    1/7
    CM
    1.¾ ir.
    et !s!
    ω *c
    O
    Iil
    2/7
    CVI
    CM
BRPI0108856A 2000-03-02 2001-02-21 método e aparelho para binarizaçao de imagem BRPI0108856B8 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/519,446 US6351566B1 (en) 2000-03-02 2000-03-02 Method for image binarization
US09/519,446 2000-03-02
PCT/IL2001/000163 WO2001065465A2 (en) 2000-03-02 2001-02-21 Improved method for image binarization

Publications (2)

Publication Number Publication Date
BRPI0108856B1 true BRPI0108856B1 (pt) 2018-02-27
BRPI0108856B8 BRPI0108856B8 (pt) 2018-08-14

Family

ID=24068340

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0108856A BRPI0108856B8 (pt) 2000-03-02 2001-02-21 método e aparelho para binarizaçao de imagem
BR0108856-4A BR0108856A (pt) 2000-03-02 2001-02-21 Método aperfeiçoado para binarizaçao de imagens

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR0108856-4A BR0108856A (pt) 2000-03-02 2001-02-21 Método aperfeiçoado para binarizaçao de imagens

Country Status (11)

Country Link
US (1) US6351566B1 (pt)
EP (1) EP1269394B1 (pt)
JP (1) JP3953817B2 (pt)
AT (1) ATE383625T1 (pt)
AU (1) AU2001235931A1 (pt)
BR (2) BRPI0108856B8 (pt)
CA (1) CA2397805C (pt)
DE (1) DE60132315T2 (pt)
IL (2) IL151545A0 (pt)
MX (1) MXPA02008296A (pt)
WO (1) WO2001065465A2 (pt)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738496B1 (en) * 1999-11-01 2004-05-18 Lockheed Martin Corporation Real time binarization of gray images
US6587585B1 (en) * 2000-05-23 2003-07-01 Ncr Corporation Method of parameterizing a threshold curve for a binarization program and an apparatus therefor
US7417771B2 (en) * 2001-06-26 2008-08-26 Sharp Laboratories Of America, Inc. Error diffusion halftoning system
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US7136515B2 (en) * 2001-09-13 2006-11-14 Intel Corporation Method and apparatus for providing a binary fingerprint image
JP4003428B2 (ja) * 2001-10-10 2007-11-07 セイコーエプソン株式会社 小切手等処理装置及び小切手等処理方法
KR100484141B1 (ko) * 2002-06-05 2005-04-18 삼성전자주식회사 영상 이진화 장치 및 방법
KR100532275B1 (ko) * 2002-12-11 2005-11-29 삼성전자주식회사 이미지 압축방법
US7295347B2 (en) * 2003-12-19 2007-11-13 Xerox Corporation Image processing method for generating multi-level data
US7315398B2 (en) * 2003-12-19 2008-01-01 Xerox Corporation Multi-level error diffusion with color image data
JP2006309650A (ja) * 2005-05-02 2006-11-09 Calsonic Kansei Corp ナンバー認識装置及方法
US7724955B2 (en) * 2005-05-31 2010-05-25 Xerox Corporation Apparatus and method for auto windowing using multiple white thresholds
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
US20080005684A1 (en) * 2006-06-29 2008-01-03 Xerox Corporation Graphical user interface, system and method for independent control of different image types
US20080101703A1 (en) * 2006-10-30 2008-05-01 Lockheed Martin Corporation Systems and methods for recognizing shapes in an image
US8351720B2 (en) * 2008-04-24 2013-01-08 Hewlett-Packard Development Company, L.P. Method and system providing edge enhanced image binarization
US8117134B2 (en) * 2008-10-16 2012-02-14 Xerox Corporation Neutral pixel correction for proper marked color printing
CN101727582B (zh) * 2008-10-22 2014-02-19 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
TWI463415B (zh) * 2009-03-06 2014-12-01 Omnivision Tech Inc 以物件為基礎之光學字元辨識之預處理演算法
US8406554B1 (en) * 2009-12-02 2013-03-26 Jadavpur University Image binarization based on grey membership parameters of pixels
KR100977558B1 (ko) * 2009-12-22 2010-08-23 전자부품연구원 적외선 스크린 방식의 공간 터치 장치
JP5725276B2 (ja) * 2010-08-03 2015-05-27 富士ゼロックス株式会社 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム
US8594446B2 (en) 2012-01-12 2013-11-26 Eastman Kodak Company Method for enhancing a digitized document
US8937749B2 (en) 2012-03-09 2015-01-20 Xerox Corporation Integrated color detection and color pixel counting for billing
JP5870826B2 (ja) * 2012-04-11 2016-03-01 コニカミノルタ株式会社 画像処理装置、画像処理方法、およびコンピュータプログラム
CN104346599B (zh) * 2013-07-23 2019-09-17 深圳市腾讯计算机系统有限公司 一种色彩边缘的检测方法及图像处理设备
KR102208893B1 (ko) 2013-12-30 2021-01-28 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 채널 맵 관리 방법
US9552528B1 (en) * 2014-03-03 2017-01-24 Accusoft Corporation Method and apparatus for image binarization
US10127672B2 (en) * 2015-10-12 2018-11-13 International Business Machines Corporation Separation of foreground and background in medical images
US10416681B2 (en) * 2017-07-12 2019-09-17 Mitsubishi Electric Research Laboratories, Inc. Barcode: global binary patterns for fast visual inference
US10878596B2 (en) 2018-11-29 2020-12-29 International Business Machines Corporation Object oriented image normalization

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4520505A (en) * 1981-12-23 1985-05-28 Mitsubishi Denki Kabushiki Kaisha Character reading device
US5067162A (en) 1986-06-30 1991-11-19 Identix Incorporated Method and apparatus for verifying identity using image correlation
US4832447A (en) 1987-12-04 1989-05-23 Board Of Trustees Operating Michigan State University Joint transform image correlation using a nonlinear spatial light modulator at the fourier plane
IL91220A (en) 1989-08-04 1995-03-30 Ibm Israel Compression of information
JPH07104921B2 (ja) * 1989-11-17 1995-11-13 松下電器産業株式会社 画像閾値決定方法
US5191525A (en) 1990-01-16 1993-03-02 Digital Image Systems, Corporation System and method for extraction of data from documents for subsequent processing
EP0679313A1 (en) 1993-11-16 1995-11-02 International Business Machines Corporation Method and apparatus for alignment of images for template elimination
US5715325A (en) 1995-08-30 1998-02-03 Siemens Corporate Research, Inc. Apparatus and method for detecting a face in a video image

Also Published As

Publication number Publication date
JP3953817B2 (ja) 2007-08-08
MXPA02008296A (es) 2002-12-09
ATE383625T1 (de) 2008-01-15
IL151545A0 (en) 2003-04-10
BRPI0108856B8 (pt) 2018-08-14
EP1269394A2 (en) 2003-01-02
EP1269394A4 (en) 2006-11-22
WO2001065465A3 (en) 2002-01-17
DE60132315D1 (de) 2008-02-21
JP2003525560A (ja) 2003-08-26
IL151545A (en) 2007-12-03
CA2397805A1 (en) 2001-09-07
EP1269394B1 (en) 2008-01-09
CA2397805C (en) 2007-05-01
BR0108856A (pt) 2005-01-11
US6351566B1 (en) 2002-02-26
DE60132315T2 (de) 2009-01-02
AU2001235931A1 (en) 2001-09-12
WO2001065465A2 (en) 2001-09-07

Similar Documents

Publication Publication Date Title
BRPI0108856B1 (pt) Método e aparelho para binarizaçao de imagem
Sanin et al. Shadow detection: A survey and comparative evaluation of recent methods
US9189842B2 (en) Paper identifying method and related device
CN108805116B (zh) 图像文本检测方法及其系统
CA2789813A1 (en) Document page segmentation in optical character recognition
CN107093172A (zh) 文字检测方法及系统
US9633284B2 (en) Image processing apparatus and image processing method of identifying object in image
CN109738450B (zh) 笔记本键盘的检测方法和装置
CN108830857B (zh) 一种自适应的汉字碑帖图像二值化分割方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
JP2014131278A (ja) 印刷された文書の認証方法
Trongtirakul et al. Single backlit image enhancement
CN108961209B (zh) 行人图像质量评价方法、电子设备及计算机可读介质
CN112101386A (zh) 文本检测方法、装置、计算机设备和存储介质
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
CN111553431A (zh) 图片清晰度检测方法、装置、计算机设备及存储介质
CN110188693B (zh) 改进的复杂环境车辆特征提取和停车判别方法
Lokhande et al. A survey on document image binarization techniques
JPS61141087A (ja) 画像処理方法及び装置
Hadiprakoso Face anti-spoofing method with blinking eye and hsv texture analysis
JP3906221B2 (ja) 画像処理方法及び画像処理装置
Dutta et al. Segmentation of meaningful text-regions from camera captured document images
JPH11283036A (ja) 対象物検出装置及び対象物検出方法
Soontornwutikul et al. Optical music recognition on Windows Phone 7
Nassu et al. Text line detection in document images: Towards a support system for the blind