PT604687E

PT604687E - Metodo para derivar caracteristicas de caracteres num sistema de reconhecimento de caracteres

Info

Publication number: PT604687E
Application number: PT92204106T
Authority: PT
Inventors: Robert Wilcke
Original assignee: Koninkl Kpn Nv
Priority date: 1992-12-30
Filing date: 1992-12-30
Publication date: 2000-09-29
Also published as: DK0604687T3; ES2146205T3; JPH076209A; DE69230940D1; ATE191980T1; EP0604687A1; EP0604687B1; DE69230940T2; GR3033926T3; US6240209B1

Description

íok 6<Κ

Vjiii Iiri^* - 1 -

DESCRIÇÃO "MÉTODO PARA DERIVAR CARACTERÍSTICAS DE CARACTERES NUM SISTEMA DE RECONHECIMENTO DE CARACTERES” A. Antecedentes do Invento 1. Campo de Aplicação do Invento O campo de aplicação do invento é o do reconhecimento de formas. O invento diz respeito a lim sistema próprio para reconhecer caracteres, tais como dígitos e letras, tanto na forma de escrita manual como na forma impressa, e mais particularmente a um método próprio para derivar características de um carácter destinado a ser reconhecido num sistema de reconhecimento de caracteres desse tipo. 2. Técnica Anterior

Os sistemas de reconhecimento de caracteres, tais como os que aqui foram indicados anteriormente, compreendem normalmente um determinado número de etapas de processamento que irão ser descritas em seguida com referência a um diagrama de blocos representado na Fig. 1. As referidas etapas de processamento são as seguintes: (1) exploração óptica de um carácter inscrito na superfície de um suporte; essa exploração, por exemplo com uma câmara vídeo, dá origem a uma forma bidimensional de elementos de imagem (pixels), por exemplo 64 x 64 pixels, aos quais é atribuído um valor de cinzento codificado em 5 bits; (2) quantificação binária da forma de pixels, através de um processo que consiste em submeter os valores de cinzento de todos os pixels a uma operação limiar, indo o resultado, que pode ser visto como uma forma a preto/branco ou como uma forma de "zeros" e "uns", ser armazenado numa memória; (3) derivação, a partir da referida forma de pixels quantificada, de uma descrição de imagem do carácter destinado a ser reconhecido; (4) derivação, a partir da descrição de imagem, de um conjunto de características de caracteres do carácter destinado a ser reconhecido; (5) verificação do conjunto de características de caracteres encontrado em comparação com os resultados obtidos previamente com a ajuda de processos de aprendizagem em caracteres conhecidos; e (6) decisão, com base na verificação, de qual é o carácter conhecido sob cuja forma é reconhecido o carácter destinado a ser reconhecido.

Por exemplo, através da referência [1] (cf. no capítulo C.) é conhecida uma técnica de reconhecimento deste tipo. Nessa técnica, a forma de pixels quantificada é utilizada para derivar uma descrição do contorno. Ao mesmo tempo que vai sendo seguido o contorno de uma forma digitalizada de uma característica destinada a ser reconhecida, vão sendo escolhidas as coordenadas de certos pontos. Os pontos que são escolhidos são aqueles em que o produto interno do vector de ponto correspondente a cada ponto e de um vector direccional num certo número de direcções previamente definidas apresenta o valor mais elevado. Um ponto escolhido é caracterizado por ser um "ponto extremo" se a diferença entre o referido produto interno nesse ponto e o produto interno no ponto escolhido seguinte ultrapassar um valor limite previamente estabelecido. Os referidos pontos extremos definem uma aproximação poligonal -3- do contorno da forma. O referido polígono apresenta uma forma de estruturas convexas e côncavas. A referida forma é utilizada para comparação com formas semelhantes, que são características de caracteres conhecidos e que se acham guardadas num "dicionário" previamente compilado. O carácter destinado a ser reconhecido é lido como sendo o carácter conhecido cujas formas mostram a melhor correspondência.

Uma limitação das características de formas derivadas na referida técnica de reconhecimento conhecida é a que consiste no facto destas se basearem numa descrição estrutural das formas destinadas a ser reconhecidas. No entanto, isso só produz resultados de reconhecimento aceitáveis se as formas destinadas a ser reconhecidas tiverem uma estrutura distinta. Isto quer dizer que a referida técnica conhecida só pode ser sensivelmente aplicada no reconhecimento de caracteres provenientes de uma escrita manual distinta ou de uma escrita impressa. Outra limitação é a que consiste no facto da variabilidade do número de características nas quais se baseia o reconhecimento, isto é, o número de estruturas convexas e côncavas presentes na forma. Isto faz com que seja difícil a aplicação de decisores no reconhecimento, decisores esses que trabalham com um número fixo de características, tais como, por exemplo, os que fazem uso de redes neurais de "alimentação antecipada" (feed-forward). A referência [2] divulga outro sistema de reconhecimento de caracteres do tipo anteriormente referido. A técnica de reconhecimento, na qual esse sistema se baseia, deriva características de caracteres a partir de um certo número de vistas designadas por vistas de uma imagem, tanto da imagem completa como de partes desta, de uma forma de pixels quantificados de forma binária de um carácter destinado a ser reconhecido. Neste método, designado por método de vistas, para cada uma das vistas, tomadas por cima, por baixo e de lado, e para cada uma das imagens completas ou cada uma das imagens parciais, -4- é derivado um certo número de diferentes características da forma de pixels. Para essas características, tais como saltos bruscos, declives, pontos terminais e ilhas, são determinados valores de características para formas específicas encontradas nas vistas. Durante a realização da fase de verificação, os valores de características encontrados são ponderados utilizando factores de ponderação ajustáveis para cada classe de caracteres destinados a ser reconhecidos. Os referidos factores de ponderação foram previamente obtidos a partir de um processo de aprendizagem sobre caracteres conhecidos. Os valores de características ponderados são utilizados para determinar uma pontuação para cada classe. O carácter destinado a ser reconhecido é reconhecido como sendo o carácter que pertence à classe para a qual foi determinada a mais elevada pontuação.

Esta técnica conhecida, que utiliza o método de vistas para a derivação de características de caracteres, foi desenvolvido em primeiro lugar para o reconhecimento de dígitos. Descobriu-se que as características de caracteres que eram derivadas através deste processo eram de natureza muito geral para poderem ser usadas no reconhecimento de letras. Além disso, devido ao grande número de características em relação às quais o carácter destinado a ser reconhecido precisa de ser verificado, o método próprio para derivar as características é bastante complexo. Além disso, devido ao tipo das características, que de facto são características estruturais, um reconhecimento baseado nessas características é muito sensível a soluções de continuidade numa forma de imagem de um carácter destinado a ser reconhecido, e por conseguinte este método de reconhecimento é inadequado, por exemplo, para escrita matricial, tal como, em particular, cartas impressas em impressoras matriciais ou de agulhas.

No processamento digital de imagens também é conhecido o -5- processo que consiste em fazer uso de funções da distância. Os métodos baseados nesse processo são por vezes designados por "transformada da distância" ou por "mapeamento da distância". Por exemplo, na referência [3] é divulgado um método conhecido deste tipo, de "mapeamento da distância". Esse método implica que a cada pixel, que pode fazer parte de um subconjunto de pixels, seja atribuída, no objecto (ou no fundo) da imagem binária original, a distância mais curta ao pixel mais próximo no fundo (ou no objecto). Portanto, em correspondência com cada ponto existe uma etiqueta de distância. O resto do processamento é então realizado com base nesta descrição de dois componentes, indo nesse processamento ser, entre outras coisas, realizado o rastreio das estruturas de esqueleto do carácter destinado a ser reconhecido. Uma etiqueta de distância deste tipo é em si própria inadequada para servir como característica de carácter com o propósito de, em particular, efectuar o reconhecimento de caracteres escritos à mão. B. Sumário do Invento O objectivo do invento consiste em proporcionar um método próprio para derivar características de caracteres num sistema de reconhecimento de caracteres, e um sistema de reconhecimento de caracteres no qual é aplicado esse método, método e sistema esses que não apresentam os inconvenientes e as limitações anteriormente referidas. De acordo com o invento, um método para derivar características de caracteres num sistema de reconhecimento de caracteres, tais como letras e dígitos, que compreende, para cada ponto de uma pluralidade de pontos num plano de imagem de pontos de imagem incluindo uma forma de um carácter destinado a ser reconhecido, uma etapa de derivação de dados de características indicativos da distância a um ponto de fronteira mais próximo da forma, e que é conhecido através da referência [3], é, para esse efeito, caracterizado de acordo com a reivindicação 1. Uma ideia subjacente neste -6- contexto é a de que geralmente para esse ponto de referência Rj, um ponto de fronteira mais próximo corresponde a um ponto único da descrição de imagem do carácter destinado a ser reconhecido, incluindo a sua vizinhança. Então, tomando em consideração a vizinhança desse ponto único corresponde a um ponto de referência Rj, será possível escolher, além dos dados de distância (D (Rj)), ainda uma ou mais características suplementares que podem caracterizar o perfil da descrição de imagem do carácter na vizinhança desse ponto de referência. Descobriu-se que uma característica muito forte para este efeito é a característica que proporciona uma estimativa da direcção (H (Rj)), que, se a descrição de imagem do carácter contiver uma descrição do contorno, tem um contorno num único ponto de contorno correspondente ao ponto de referência Rj. De facto, num modo de realização preferido, o método de acordo com o invento é caracterizado de acordo com a reivindicação 2.

Comparado com o método de vistas anteriormente descrito, o método de acordo com o invento baseia o reconhecimento num determinado número de características que foram obtidas, por assim dizer, a partir de vistas locais da forma de um carácter, tal como este é visto a partir de cada um dos pontos de referência. A referência [5] divulga um método próprio para derivar características com o objectivo de reconhecimento de níveis de cinzento da imagem, em que as características são determinadas nas chamadas células de características cujas localizações próprias para efeitos de combinação são descritas por meio de coordenadas polares em relação a uma origem, designada por célula de referência. As características derivadas são muito mais complicadas do que as características derivadas através do método do presente invento.

De acordo com o invento, um sistema de reconhecimento de -7- caracteres de um tipo tal como o indicado na parte pré-caracterizante da reivindicação 7 e que é conhecido através da referência [1] ou [2], é, para este efeito, caracterizado de acordo com a reivindicação 7. C. Referências [1] Documento da patente US No. 4.566.124, intitulada "Pattem Reading System" [2] Documento da patente US No. 3.999.161, intitulada "Method and Device for the Recognition of Characters, Preferably of Figures"; [3] P.-E. Danielsson, "Euclidean Distance Mapping, Computer Graphics and Image Process", 14,227-248 (1980); [4] R. P. Lippmann, "An Introduction to Computing with Neural Nets", IEEE ASSP Magazine, Abril 1987, págs. 4-22; [5] M. Sano, et al., "Gray-level Image Recognition Based on Multiple Cell-features", Systems and Computers in Japan, 22 (1991) No. 5, New York, págs. 81-93. D. Breve Descrição dos Desenhos O invento irá ser explicado de uma maneira mais pormenorizada por meio de uma descrição de um modo de realização ilustrativo, com referência aos desenhos anexos, nos quais: a Fig. 1 é um diagrama de blocos de etapas de processamento de um sistema de reconhecimento de caracteres; -8- a Fig. 2 representa uma imagem de pixels pretos/brancos de um carácter destinado a ser reconhecido que apresenta um contorno interior e um contorno exterior; a Fig. 3 ilustra um processo de rastreio de um contorno, mostrando a Fig. 3a a situação para um único pixel preto, e mostrando a Fig. 3b a situação depois de ter sido encontrado um k-ésimo ponto do contorno; a Fig. 4 representa o perfil do contorno após filtragem dos contornos da imagem de pixels de acordo com a Fig. 2; a Fig. 5 mostra, nas subsecções das Figs. 5a, 5b e 5c, três diferentes situações da posição de um ponto de referência com respeito a uma corda do contorno; a Fig. 6 mostra uma vista global, sob a forma de um diagrama de blocos, do processador e dos meios de memória próprios para o objectivo específico de realização das etapas de processamento (3) e (4) de acordo com o invento que se acham representadas na Fig. 1; e a Fig. 7 mostra um diagrama de um decisor próprio para a realização das etapas de processamento (5) e (6) de acordo com a Fig. 1, quando aplicado em combinação com o método de acordo com o invento. E. Descrição de um Modo de Realização Ilustrativo O invento diz respeito a um método próprio para derivar características de caracteres destinado a ser utilizado num sistema de reconhecimento de caracteres, tais como letras e dígitos impressos ou escritos à mão. Começando a partir da descrição de um carácter destinado a ser reconhecido, o processo de reconhecimento prossegue com base num determinado número de características, derivadas no interior de pontos de fronteira adequadamente determinados, do carácter descrito. Por conseguinte, o invento diz respeito, em primeiro lugar, à etapa de processamento (4) no sistema de reconhecimento de caracteres descrito com referência à Fig. 1. O invento pode ser aplicado tanto à descrição dos pixels como à descrição do contorno de um carácter destinado a ser reconhecido. Isto diz respeito à etapa de processamento (3). Uma vez que é preferida a abordagem através do contorno, este processo será descrito a seguir de uma maneira pormenorizada, ao passo que a abordagem através dos pixels será aqui apenas sugerida. As etapas de processamento (1) e (2) são realizadas de acordo com técnicas conhecidas através de meios de registo que são conhecidos per se e que por esse motivo não serão aqui descritos de forma mais pormenorizada. Na descrição que irá ser feita a seguir de um modo de realização ilustrativo parte-se do princípio de que essas etapas já foram realizadas e que uma forma de pixels pretos/brancos de um carácter destinado a ser reconhecido foi armazenada numa memória de imagens bidimensionais à qual se pode ter acesso para outras operações. Essa forma de pixels pretos/brancos num plano de imagem compreendendo L x M pixels tem uma descrição elementar, designada por descrição de pixels, por meio de uma função B (i, j) de valores de pixels para cada pixel (i, j) no plano de imagem, em que i = 1, ..., L, e j = 1, ..., M, sendo essa função definida por B (i, j) = 1 para cada pixel preto (i, j) e por B (i, j) = 0 para cada pixel branco (i, j) no plano de imagem.

Também se parte do princípio de que, se o carácter destinado a ser reconhecido faz parte de uma série de caracteres registados simultaneamente, na referida série já foi realizada uma operação de segmentação, de acordo com técnicas conhecidas per se* a fim de separar os caracteres e fazer com que estes se tomem adequados para tratamento separado. As etapas de processamento (5) e -10- (6) também são realizadas através de técnicas conhecidas. No entanto, uma vez que os meios de verificação e de decisão necessários para esse efeito devem ter sido previamente informados, de maneira a que certos caracteres possam ser reconhecidos com base nas características de caracteres derivadas de acordo com o método de acordo com o invento, esses meios deverão ser resumidamente explicados de uma maneira mais pormenorizada a seguir a uma descrição completa do método.

No âmbito do processamento de imagens e do reconhecimento de formas, é conhecida a chamada transformada da distância. Esta transformada atribui da seguinte maneira um número D (P) a cada ponto P num plano de imagem de uma forma a preto-e-branco de pontos de imagem: se o ponto P se encontrar situado numa zona branca do plano de imagem, então D (P) é igual à distância ao ponto de imagem preto mais próximo; e se o ponto P se encontrar situado numa zona preta que, por exemplo, representa um dígito ou uma letra, então D (P) é igual à distância ao ponto de imagem branco mais próximo, dotado de um sinal negativo. A transformada da distância é muitas vezes utilizada nos chamados algoritmos de esqueleto próprios para o rastreio de estruturas de esqueleto, sendo então o reconhecimento de caracteres realizado com base nas estruturas de esqueleto encontradas. Um sinal de imagem assim transformado também é por vezes utilizado directamente na realização do processo de reconhecimento. Nesse caso, como característica de carácter é utilizada uma etiqueta de distância. Se no processo for incluído um número limitado de pontos de imagem, por exemplo para aumentar a rapidez da operação aritmética, a etiqueta de distância é insuficiente para descrever um carácter destinado a ser reconhecido. A fim de se -11 - conseguir obter um aceitável grau de probabilidade de reconhecimento, na transformada deve ser incluído um número muito elevado de pontos de imagem, senão mesmo todos os pontos de imagem. Apesar disso, em particular, o reconhecimento de escrita manual é insuficiente. No entanto, o objectivo do invento consiste na obtenção de um grau de probabilidade de reconhecimento consideravelmente mais elevado através de um processo que consiste em atribuir uma ou mais características de caracteres adicionais a cada etiqueta de distância obtida com base numa transformada da distância num número limitado N de pontos Ri, que foram previamente escolhidos de uma maneira adequada (em que i = 1,..., N), e que são designados por pontos de referência, no plano de imagem.

Isto é baseado na ideia de que, se a um tal ponto de referência Rj for atribuída uma etiqueta de distância D (Rj), de uma maneira geral haverá apenas um único ponto de fronteira Pj de um carácter destinado a ser reconhecido que irá corresponder a esse ponto, incluindo a sua vizinhança. Os pontos de fronteira devem ser entendidos como os pontos de imagem que tanto têm pontos de imagem brancos como pontos de imagem pretos na sua vizinhança directa. No caso da descrição de um contorno, um ponto de fronteira é um ponto situado no contorno, um ponto do contorno. A menos que se diga alguma coisa em contrário, daqui em diante, deverá ter-se em conta a descrição de um contorno e os pontos do contorno. Depois, tendo em consideração a vizinhança de um único ponto de fronteira Pi deste tipo e correspondente a um ponto de referência Rj, será possível atribuir à etiqueta de distância D (Rj) uma ou mais características adicionais que, vistas a partir desse ponto de referência Rj, descrevem o perfil do segmento de contorno C (Ri) mais próximo. Descobriu-se que uma característica muito forte é a que proporciona uma estimativa da direcção (H (Rj)) do contorno no ponto Pj do contorno. Outras características suplementares a serem designadas são também aquelas que proporcionam uma estimativa da segunda e da terceira derivadas do contorno no ponto Pj do contorno. No entanto, as referidas características suplementares não proporcionam uma grande contribuição adicional para aumentar o grau de probabilidade de reconhecimento de um carácter. Descobriu-se que todas estas descrições, com base nas referidas características adicionais, dos referidos segmentos de contorno C (Rj) mais próximos para todos os N pontos de referência Rj permitiam obter um reconhecimento muito eficaz se N tivesse um valor suficientemente grande. São de preferência utilizados entre 70 e 120 pontos de referência para cada carácter, podendo esses pontos ser distribuídos de uma maneira regular ou de uma maneira aleatória sobre o plano de imagem.

Num exemplo que será apresentado a seguir, o método próprio para determinar as características D (R,) e H (Rj) para um ponto de referência (Rj) no plano de imagem de uma forma destinada a ser reconhecida irá ser explicado de uma maneira mais pormenorizada.

Para esse efeito, a Fig. 2 mostra uma forma a preto/branco de um carácter separado num rectângulo de 12 por 16 campos, correspondendo cada campo a um pixel. Por motivos de clareza, o número de pixels neste exemplo foi mantido com um valor baixo. Cada campo é identificável exclusivamente por meio do seu centro de coordenadas (i, j), em que i = 1, ..., 12 e j = 1, ...,16. Os campos pretos estão hachurados. Cada campo é preto ou branco. Portanto o campo (2, 3) é branco e o campo (4, 3) é preto. Se um campo (i, j) for preto tem um valor de pixel B (i, j) = 1; e se for branco tem um valor de pixel B (i, j) = 0. Quando um campo preto se liga a um campo branco, as linhas de fronteira são traçadas em negrito. A referida descrição bidimensional é então convertida, por meio de um processo que é designado por rastreio de contornos, numa descrição unidimensional do contorno da forma do carácter destinado a ser reconhecido. O referido rastreio de contornos vai passar sucessivamente por todos os 12 x 16 campos da imagem de pixels ao mesmo tempo que procura pontos de contorno. -13-

Cada vez que é encontrado um ponto de partida, é gerado um contorno. Neste processo, a cada um dos contornos é atribuído um número, e a sua posição relativa é estabelecida pedindo-se à memória a informação sobre se um ponto de partida encontrado se acha ou não situado no interior de um contorno previamente determinado. O processo de rastreio de um contorno irá a seguir ser explicado de uma maneira mais pormenorizada com referência à Fig. 3 com secções 3a e 3b. Neste processo, cada pixel é encarado como sendo um pequeno quadrado preto ou branco de dimensões finitas. Os vértices desse quadrado são designados por pontos de cruzamento da retícula. Na Fig. 3a encontra-se representado um único pixel preto cujo centro tem as coordenadas (i, j) e que é representado sob a forma de um pequeno quadrado hachurado, com pontos de cruzamento da retícula numerados de 1 a 4 inclusive. Um pixel preto separado já possui por si próprio um contorno bem definido que é formado pelos segmentos periféricos de 1 a 2, de 2 a 3, etc., traçados em negrito, que delimitam a zona preta no sentido do movimento dos ponteiros do relógio (de acordo com o sentido da seta). As coordenadas x, y dos referidos quatro pontos 1 a 4 inclusive de cruzamento da retícula do contorno são escolhidos da seguinte maneira: (x (1); y (1)) = (i - 0,5; j + 0,5) (x (2); y (2)) = (i + 0,5; j + 0,5) (x (3); y (3)) = (i + 0,5; j - 0,5) (x (4); y (4)) = (i - 0,5; j - 0,5)

Na Fig. 3b encontra-se representada a situação em que, quando se efectua o rastreio de um contorno C depois do (k-2)-ésimo e do (k-l)-ésimo pontos de cruzamento da retícula do contorno, quando se provém de uma direcção de chegada v, foi encontrado um ponto (x (k); y (k)) de cruzamento da retícula como sendo o k-ésimo ponto do contorno. A direcção de chegada v = (vx, vy) tem quatro valores possíveis que podem ser expressos do seguinte modo: (1, 0), (-1, 0), (0, 1) e (0, -1). No exemplo traçado o valor é (1, 0). Para a esquerda e para a direita da continuação da direcção de chegada v, para além do k-ésimo ponto do contorno, encontram-se representados dois pixels L e R sob a forma de linhas a tracejado. Há três direcções segundo as quais é possível encontrar o (k+l)-ésimo ponto do contorno seguinte, representadas na figura como as direcções v1} v2 e v3. A direcção segundo a qual é encontrado o ponto do contorno seguinte depende do valor de pixel B de cada um dos pixels L e R. As coordenadas do centro dos pixels L e R, dada a direcção de chegada (vx, vy) e as coordenadas dos k-ésimos pontos de cruzamento da retícula do contorno, são: iL = x (k) + (vx - vy)/2 e jL = y (k) + (vx + vy)/2 iR = x (k) + (vx + vy)/2 e jR = y (k) + (vx - vy)/2 O (k+l)-ésimo ponto de cruzamento da retícula do contorno e a direcção de chegada que lhe está associada são determinados por meio de um algoritmo de rastreio do contorno, que pode ter o seguinte aspecto: se B (iL, jL) = 1 então início vx:= - vy; vy := vx fim de outro modo se B (iR, jR) = 1 então início vx:= vy; vy := - vx fim: x (k + 1) := x (k) + vx; y (k + 1) := y (k) + vy; k := k + 1; continua para o ponto seguinte;

Para se encontrar os contornos de uma imagem de pixels tal como a que se acha representada na Fig. 2, o plano de imagem é explorado da esquerda r para a direita e de cima para baixo. E encontrado uma primeiro ponto de partida para um contorno se durante essa exploração for encontrado o primeiro pixel preto, fl pixel (6, 14) no caso do presente exemplo. Nesse caso, os primeiros dois pontos de contorno escolhidos são os que correspondem aos pontos 1 e 2 de cruzamento da retícula do contorno representados na Fig. 3a, com v = (1, 0) como direcção de chegada no segundo ponto de cruzamento da retícula do contorno. Então é dado início ao algoritmo de rastreio do contorno até ser feito um retomo ao primeiro ponto de cruzamento da retícula do contorno. Para cada novo início do algoritmo de rastreio do contorno, um número de contorno CN é aumentado uma unidade. Durante cada execução do algoritmo de rastreio do contorno, os pixels que pertencem ao mesmo contorno são marcados com o mesmo número de contorno CN. Essa marcação é memorizada numa segunda memória de imagens separada. Antes de se dar início à exploração do plano de imagem, todos os pixels armazenados na segunda memória de imagens têm a mesma marcação inicial, zero por exemplo. Depois de um contorno ter sido completado, a imagem de pixels é novamente explorada para se procurar um ponto de partida para um contorno seguinte. O ponto de partida seguinte é encontrado se, durante a nova exploração for encontrado um pixel preto que ainda não tenha sido marcado, ou se um pixel branco não marcado for encontrado no interior de um contorno previamente encontrado. Nesse caso, o algoritmo de rastreio é novamente executado. Durante a execução todos os pontos de cruzamento da retícula do contorno encontrados são registados, na mesma ordem em que foram encontrados, num quadro de contorno, incluindo uma associada avaliação do contorno. A referida avaliação compreende, para cada contorno, o número CN do contorno, indicadores nrept e nrlpt para o primeiro e para o último ponto de cruzamento da retícula do contorno em questão, respectivamente, e um código cdoc que indica o número do contorno imediatamente vizinho. Neste contexto, a periferia da totalidade da imagem de pixels é considerada como um contorno virtual tendo o número 0. A imagem de pixels da Fig. 2 tem um primeiro contorno Cl, cujos pontos de cruzamento da retícula do contorno são sucessivamente numerados 1, 2, 3, ..., 61 e 62. Esta imagem tem um segundo contorno C2, cujos pontos de cruzamento da retícula do contorno são sucessivamente numerados 63, 2, 3, 77 e 78, e que se acha inteiramente situada no interior do primeiro contorno Cl. O quadro de contorno que lhe está associado encontra-se representado no Quadro 1 com subsecções la e lb, encontrando-se a avaliação do contorno incorporada na subsecção la, e indo o Quadro lb formar a lista de pontos de cruzamento da retícula do contorno. A título de exemplo, suponha-se um conjunto RP de pontos de referência RP (m, n), compreendendo um determinado número de centros de pixels: RP - {RP (m, n) = (4m-2, 5n-2) | m, n = 1, 2, 3}

Na Fig. 2 foi traçado um dos referidos pontos de referência, o ponto RP (3, 2). Se a partir desse ponto for investigada a forma local do segmento de contorno mais próximo, neste caso do contorno Cl, serão obtidas características de uma forma bastante angulosa e tortuosa. Por conseguinte, antes de se dar início à derivação de características propriamente dita, a descrição do contorno obtida através do anteriormente referido algoritmo de rastreio é em primeiro lugar tratada por aquilo que pode ser designado por um processo de filtragem do contorno, que produz um contorno com um perfil mais suave. Novamente a título de exemplo, isso é realizado por um simples filtro linear que, correndo ao longo do contorno, determina sempre uma média ponderada dos correspondentes pontos de cruzamento da retícula do contorno. Neste processo, a etapa de filtragem é sempre levada a cabo com uma decalagem correspondente ao espaçamento de uma malha da retícula. O resultado dessa filtragem é uma nova e igualmente longa lista de pontos do contorno que normalmente já não são pontos de cruzamento da retícula e que formam os vértices de um polígono com um perfil suave. Se o comprimento desse filtro linear for escolhido de modo a ser igual a -17- quatro unidades da malha da retícula, cada uma das etapas de filtragem irá abarcar sempre cinco pontos sucessivos de cruzamento da retícula do contorno presentes no quadro do contorno. Irá então ser compilado um novo quadro do contorno atribuindo os seguintes novos valores às coordenadas de cada um dos k-ésimos pontos de cruzamento da retícula do contorno do agora antigo quadro do contorno: X (k) = x (k-2)/8 + x (k-l)/4 + x (k)/4 + x (k+l)/4 + x (k+2)/8 Y (k) = y (k-2)/8 + y (k-l)/4 + y (k)/4 + y (k+l)/4 + y (k+2)/8

Quando aplicado à forma de imagem representada na Fig. 2 com o quadro do contorno de acordo com o Quadro lb, isto produz um novo perfil do contorno que se acha ilustrado na Fig. 4, e cujo quadro do contorno que lhe está associado se encontra representado no Quadro 2 com a lista de novas coordenadas dos pontos do contorno. Neste caso a avaliação do contorno manteve-se inalterada. O que acontece é que a descrição do contorno é mais adequada para a derivação das características locais D e H do contorno para cada um dos pontos de referência do conjunto RP. Neste processo, cada contorno é encarado como sendo composto por cordas. Uma corda, com o número k, é o segmento de ligação em linha recta entre dois sucessivos pontos do contorno numerados por k-1 e por k, incluindo o ponto do contorno k como o ponto terminal, e excluindo o ponto do contorno k-1 como o ponto de partida. A lista de pontos do contorno no quadro do contorno irá desse modo tomar-se numa lista de pontos terminais de sucessivas cordas que constituem os contornos especificados na avaliação do contorno. Então, para cada um dos pontos de referência provenientes do conjunto RP, irá ser determinado qual das cordas de todos os contornos presentes no quadro do contorno é aquela em relação à qual o ponto de referência Dmín (RQ) se encontra situado à distância mais curta, assim como o -18-

valor da referida distância mais curta. Isto consegue-se fazer através de um processo que consiste em correr sucessivamente através da lista de pontos terminais das cordas. Em função da posição de um ponto de referência RQ com respeito a uma corda k, podem surgir três situações diferentes. Essas situações encontram-se esquematicamente representadas na Fig. 5 com subsecções 5a, 5b e 5c. Na situação de acordo com a Fig. 5a, o ponto mais próximo é de facto o ponto de partida da corda k. Por conseguinte, a distância mínima Dmín (RQ) encontrada até agora já foi determinada no caso de corda antecedente. Nas situações de acordo com a Fig. 5b e 5c, respectivamente, um ponto P da corda k e o ponto terminal da corda k são os pontos mais próximos que se encontram a uma distância d do ponto de referência RQ. Em ambos os casos é realizado um teste para descobrir se a distância d é ou não menor do que a distância mínima Dmín (RQ) previamente registada até agora. Em caso afirmativo, a distância d encontrada é registada como sendo o novo valor de Dmín (RQ), juntamente com o número de corda que lhe está associado. São utilizadas as seguintes fórmulas para se calcular a distância, na situação de acordo com a Fig. 5b: d2 = (ax * cy - ay * cx)2/(cx2 + cy2) e na situação de acordo com a Fig. 5c d2 = ax2 + ay2 em que: ax = x(RQ) - X(k) e ay = y (RQ) - Y(k) cx = X (k) - X (k-1) e cy = Y (k) - Y (k-1) - 19- *) ·

Com efeito, em primeiro lugar é determinado o d mínimo, e só se este for encontrado é que a sua raiz é calculada. Ao mesmo tempo o processo verifica se o ponto de referência RQ em questão se encontra situado para a esquerda ou para a direita do contorno de que a corda com a distância mínima Dmín (RQ) faz parte. Isso é feito através de um processo que consiste em determinar o produto interno (ax * cy - ay * cx) do vector (cy, cx) perpendicular à corda, que agora é interpretado como sendo um vector (cy, cx), sendo o vector (ax, ay) definido pelo ponto terminal da corda e pelo ponto de referência RQ. O ponto de referência RQ está localizado para a direita do contorno se o valor do produto interno for positivo, e para a esquerda do contorno se o valor do produto interno for negativo. Uma vez que um contorno é sempre escolhido no sentido do movimento dos ponteiros do relógio em tomo de preto, é fácil saber se o ponto de referência RQ em questão se encontra situado numa zona "preta" ou numa zona "branca" da forma de imagem filtrada.

As características desejadas no ponto de referência RQ são agora determinadas do seguinte modo: (i) D (RQ) = Dmín (RQ) se RQ se encontrar numa zona "branca"; D (RQ) = - Dmín (RQ) se RQ se encontrar numa zona "preta"; (n) H (RQ) = direcção da corda mais próxima encontrada, que é calculada como sendo a direcção do vector [X (k) - X (k-1), Y (k) - Y (k-1)] na situação de acordo com a Fig. 5b; H (RQ) = direcção do vector perpendicular à linha de ligação entre o -20- ponto terminal da corda mais próxima e o ponto de referência RQ, que é calculada como sendo a direcção do vector ± [Y (k) - Y (RQ), - X (k) + X (RQ)] na situação de acordo com a Fig. 5c, sendo o sinal mais/menos aplicado conforme o ponto de referência RQ se encontre situado em "preto" ou "branco", respectivamente. A característica de direcção é de preferência expressa sob a forma de um ângulo e pode ser calculada, por exemplo, por meio de uma função cos'1, sen'1 ou tg'1.

Quando aplicado à descrição do contorno filtrado tal como o que se acha representado na Fig. 4, descobriu-se que, para um ponto de referência RP (3, 2), a corda com o número 14 era a que se encontrava à distância mais curta. Uma vez que o ponto de referência se acha localizado em "branco", a distância mínima deve ser considerada como sendo positiva, e que a característica de direcção H (RP (3, 2)) = direcção do vector [X (14) - X (13), Y (14) - Y (13)].

Conforme já aqui foi anteriormente referido, o método de acordo com o invento pode ser realizado não apenas com uma descrição do contorno de uma forma de imagem. Uma descrição feita à base de pixels, a descrição de pixels B (i, j), é de forma semelhante directamente adequada para se determinar as características D (RQ) e H (RQ). Além disso, no caso desta descrição, é também possível fazer uso de um dos muitos algoritmos conhecidos para se determinar a transformada da distância. Neste caso, se como pontos de referência também forem escolhidos centros de pixels, pode proceder-se da seguinte maneira: se um ponto de referência RQ se encontrar localizado em "branco", os pixels situados na vizinhança do ponto de referência RQ são explorados segundo círculos cada vez maiores até que seja encontrado o pixel "preto" Z mais -21 - próximo. Então as características são escolhidas da seguinte forma: D (RQ) = «i (Z) - i (RQ))2 + 0 (z) - j (RQ))2}1'2 e H (RQ) = direcção do vector [- j (Z) + j (RQ), i (Z) - j (RQ)]

Se RQ se encontrar situado numa zona "preta", o pixel "branco" W mais próximo é, evidentemente, procurado, e então às características aplicam-se as expressões análogas. A anteriormente referida escolha para a característica direccional H (RQ) é muito simples, mas bastante pouco precisa. Podem ser obtidos aperfeiçoamentos através da inclusão de pontos situados na vizinhança de Z ou de W, cujo valor de pixels se acha correlacionado com Z ou W.

As características obtidas de acordo com a maneira aqui anteriormente descrita, com base numa descrição dos pixels ou numa descrição do contorno de um carácter destinado a ser reconhecido, formam os elementos de um vector, o vector de características V = {vn} com n = 1, ..., 2N, sendo a série de coeficientes do vector escolhida como {vn} = {D (RO, H (RO, D (Ra), H (Ra),..., D (Rn), H (Rn)}.

Na Fig. 6 encontra-se representado, sob a forma de um diagrama de blocos, uma vista global dos meios de processamento PM e dos meios de memória MM, que são específicos para a realização das etapas (3) e (4) da Fig. 1 de acordo com o anteriormente descrito método de derivação das características dos caracteres. Abaixo de uma linha a tracejado encontram-se representados os meios de memória, indicados por Ml, M2, M3 e M4, e acima da referida linha a -22- tracejado encontram-se representados os meios de processamento PM próprios para a realização de três processos indicados por CD, CF e FD. A relação é conforme se indica a seguir. O processo CD descreve o contorno de um carácter. Este processo realiza o algoritmo de rastreio do contorno na forma de imagem do carácter que, depois das etapas de processamento (1) e (2) da Fig. 1, se acha disponível numa primeira memória Ml, a memória de imagens; e coloca numa segunda memória M2 a descrição do contorno obtida. Então o processo CF realiza o processo de filtragem do contorno na descrição do contorno colocada na segunda memória M2, e coloca numa terceira memória M3 a descrição filtrada do contorno assim obtida. Numa quarta memória M4 encontra-se armazenada uma lista com dados das coordenadas dos pontos de referência R, do conjunto RP. O processo FD, a partir da lista armazenada na quarta memória M4, realiza a derivação de caraçterísticas para todos os pontos de referência na descrição filtrada do contorno presente na terceira memória, e faz sair o vector de características V assim encontrado. O vector de características V é subsequentemente apresentado a uns meios combinados de verificação e decisão, designados por decisor 100, um diagrama do qual se encontra representado na Fig. 7, que é próprio para a realização das etapas (5) e (6) de processamento representadas na Fig. 1. O decisor 100 compreende um verificador de características 101 e um selector de máximos 102. No caso do presente exemplo, o número de entradas In do verificador de características é igual ao número de coeficientes do vector de características V, por conseguinte, 2N, a fim de receber todos os coeficientes v„, os valores das características derivadas; e o número de saídas um do verificador de características é igual ao número total M de caracteres destinados a ser reconhecidos. O referido número M é, por exemplo, 34 se o conjunto de caracteres destinados a ser reconhecidos for formado pelos dígitos 0, 1, ..., 9 e pelas letras maiúsculas A, B, ..., Z. Para cada vector de características V que se -23- apresenta na entrada do verificador de características 101, este último determina um vector de pontuação S = {sm |m= 1,M}, indo cada um dos seus coeficientes sm exprimir a medida de acordo com a qual o vector de características V apresentado se ajusta ao m-ésimo carácter do conjunto de caracteres destinados a ser reconhecidos. Os coeficientes do vector de pontuação S são apresentados, por intermédio das saídas um, ao selector de máximos 102. O referido selector de máximos 102 determina qual é o maior dos coeficientes sm e, de acordo com o carácter proveniente do conjunto de caracteres destinados a ser reconhecidos, faz sair na sua saída 103 um sinal CH que corresponde ao maior coeficiente que foi determinado. O verificador de características é de preferência uma rede neural múlti-camadas, por exemplo composta por três camadas de perceptrões, conforme divulgado, por exemplo, na referência [4]. No entanto, na Fig. 7, o verificador de características 101 foi representado simplesmente apenas sob a forma de uma rede neural de uma só camada tendo um número M de perceptrões. No verificador de características 101 deve-se distinguir três etapas, designadamente: uma etapa de distribuição, indicada pela letra T; uma etapa de ponderação, indicada pela letra W; e uma etapa de soma, indicada pela letra Σ.

Os valores de características apresentados ao verificador de características 101 juntamente com o vector de características V são, conforme são derivados, valores contínuos. Na etapa de distribuição T cada um dos valores vn apresentados é, por assim dizer, distribuído por umas unidades de distribuição t„(n= 1, ..., 2N) através de um processo que consiste em apresentar o mesmo valor de um modo múltiplo, designadamente segundo M direcções, isto é, num número de direcções igual ao número de perceptrões. Durante a etapa de ponderação W, cada um dos valores de características vn orientado segundo cada -24- direcção m é ponderado por meio de um factor de ponderação Wnm a partir de um conjunto de factores de ponderação (Wnm). De facto, este conjunto de factores de ponderação forma um conjunto dimensional, a matriz de factores de ponderação, em que η = 1, ..., 2N é o número de um valor de características v„ apresentado, e m = 1,..., 2M é o número de um carácter destinado a ser reconhecido no conjunto de caracteres destinados a ser reconhecidos. Com a ajuda dos factores de ponderação na etapa de soma Σ irá então ser determinada por cada um de um número M de somadores am uma pontuação que forma o anteriormente referido coeficiente sm do vector de pontuação S. Para cada somador am essa pontuação é:

Sm = f (Σ Wnm * Vn) em que a soma é realizada sobre todos os η = 1,..., 2N e f representa uma função não linear, como por exemplo um sigmóide. Isto encontra-se indicado na Fig. 7 por meio de setas que partem de cada uma das unidades de distribuição t„ e se dirigem para cada um dos somadores am. Cada uma das setas encontra-se dotada do factor de ponderação que lhe está associado e que é retirado da matriz de factores de ponderação.

Os coeficientes sm do vector de pontuação S são apresentados ao selector de máximos 102. A matriz de factores de ponderação (Wnm) encontra-se localizada numa memória acessível ao decisor. Os coeficientes desta matriz foram previamente determinados de acordo com um algoritmo de treino que é conhecido pela designação de "algoritmo contendo contrapropagação" (ver, por exemplo, a referência [4], particularmente a Caixa 6.). Nesse caso, as características de caracteres foram apresentadas ao decisor de caracteres conhecidos a partir de um conjunto de treino de caracteres conhecidos, que foram derivados com a ajuda do novo método aqui anteriormente descrito. -25-

Quando aplicado a um grande conjunto de testes de material de experiência (aproximadamente 200.000) de dígitos escritos à mão e facilmente separáveis, constata-se que um sistema de reconhecimento de caracteres que tenha trabalhado com o novo método próprio para derivar as características de caracteres "distância" e "direcção" é capaz de reconhecer de uma maneira satisfatória 99,3% dos caracteres apresentados. Se apenas for utilizada a característica de caracteres "distância", constata-se que o rendimento máximo é de 98,6%.

Quadro la CN nrept nrlpt cdoc 1 1 62 0 2 63 78 1 -26-

Quadro lb k X y 1 5,5 14,5 2 6,5 14,5 3 7,5 14,5 4 8,5 14,5 5 8,5 13,5 6 9,5 13,5 7 9,5 12,5 60 3,5 13,5 61 4,5 13,5 62 5,5 13,5 63 6,5 13,5 64 6,5 12,5 65 5,5 12,5 76 8,5 12,5 77 7,5 12,5 78 7,5 13,5 -27- Quadro 2 k X Y 1 5,875 14,125 2 6,625 14,375 3 7,375 14,375 4 8,125 14,125 5 8,750 13,75 6 9,125 13,125 7 9,5 12,5 60 3,875 13,125 61 4,5 13,5 62 5,125 13,875 63 6,75 13,0 64 6,125 12,875 65 5,5 12,5 76 8,125 12,125 77 7,75 12,75 78 7,25 13,0

Lisboa, 5 de Julho de 2000

JORGE CRUZ Agente Oficial da Propriedade Industriai RUA VICTOR CORDON, 14 1200 LISBOA

Claims

REIVINDICAÇÕES 1. Método para derivar características de caracteres num sistema de reconhecimento de caracteres, tais como letras e dígitos, compreendendo, para cada ponto de uma pluralidade de pontos num plano de imagem de pontos de imagem incluindo uma forma de um carácter destinado a ser reconhecido, uma etapa de derivação de dados de características indicativos da distância a um ponto de fronteira mais próximo da forma, em que a pluralidade de pontos inclui um conjunto (R= (Rj/i-1, ..., N}) de pontos previamente escolhidos (Ri), designados por pontos de referência, e em que o método inclui, para cada ponto de referência, uma outra etapa de derivação de outros dados de características (H (RO) indicativos da direcção da fronteira no seu correspondente ponto de fronteira mais próximo.
2. Método de acordo com a reivindicação 1, caracterizado por os pontos de fronteira serem pontos de contorno num contorno filtrado (Cb C2), sendo o contorno filtrado obtido por meio de etapas de rastreio e filtragem do contorno que precedem a referida primeira etapa de derivação.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado por compreender uma etapa de determinação de um vector de características (V = {vn}/n= 1, ..., 2N) a partir dos referidos dados de características e dos referidos outros dados de características, incluindo o vector de características os dados de distância (D (RO) e os dados direccionais (H (RO) para cada ponto de referência (RO como coeficientes vectoriais.
4. Método de acordo com a reivindicação 1, 2 ou 3, caracterizado por o número de pontos de referência ser superior a 70 e inferior a 120. -2-
5. Método de acordo com qualquer uma das reivindicações l a 4, caracterizado por o conjunto de pontos de referência incluir pontos distribuídos de uma maneira aleatória no plano da imagem.
6. Método de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por o conjunto de pontos de referência incluir pontos distribuídos de uma maneira regular no plano da imagem.
7. Sistema de reconhecimento de caracteres próprio para reconhecer caracteres tais como letras e dígitos, compreendendo o referido sistema: uns meios próprios para registar uma forma de imagem de um carácter destinado a ser reconhecido que se acha inscrito na superfície de um suporte, uns meios de derivação de características próprios para derivar dados de características a partir de um determinado número de características de caracteres do carácter destinado a ser reconhecido a partir da referida forma de imagem registada, uns meios de verificação (101) próprios para verificar os dados de características derivados em comparação com os resultados obtidos previamente num conjunto de caracteres conhecidos, e para fazer sair os resultados das verificações, e uns meios de decisão (102) próprios para decidir, com base nos resultados das verificações, qual é o carácter conhecido sob cuja forma é reconhecido o carácter destinado a ser reconhecido, em que os meios de derivação de características (FD) incluem uns meios de derivação próprios para derivar, para cada ponto de um conjunto de pontos -3- previamente escolhidos, designados por pontos de referência, num plano da imagem da referida forma de imagem registada, dados de características indicativos da distância a um mais próximo ponto de fronteira da forma, e dados de características indicativos da direcção da fronteira no seu correspondente ponto de fronteira mais próximo.
8. Sistema de reconhecimento de caracteres, de acordo com a reivindicação 7, caracterizado por compreender ainda uns meios de rastreio de contornos (CD, CF) próprio para localizar um contorno do carácter destinado a ser reconhecido e para determinar uma descrição de contorno do contorno encontrado, sendo os meios de derivação concebidos para determinar, para cada ponto de referência (RQ), a distância (D (RQ) = d) a um segmento de contorno (k) mais próximo e a direcção (H (RQ), pelo menos sob a forma de uma aproximação, do segmento de contorno mais próximo. Lisboa, 5 de Julho de 2000

Agente Oficial da Propriedade Industrial RUA VICTOR CORDON, 14 1200 USBOA