ITRM930179A1

ITRM930179A1 - Apparecchio e procedimento per il riconoscimento di caratteri manoscritti.

Info

Publication number: ITRM930179A1
Application number: IT000179A
Authority: IT
Inventors: Girolamo Gallo; Cristina Lattaro; Flavio Lucentini; Giuseppe Savarese; Michael C Smayling
Original assignee: Texas Instruments Italia Spa
Priority date: 1993-03-22
Filing date: 1993-03-22
Publication date: 1994-09-22
Also published as: DE69425009T2; KR100308856B1; IT1265673B1; EP0617381A2; JPH06325212A; EP0617381B1; KR940022338A; ITRM930179A0; TW321747B; US5757962A; EP0617381A3; DE69425009D1

Description

DESCRIZIONE

a corredo di una domanda di Brevetto d'Invenzione, avente per titolo:

"Apparecchio e procedimento per il riconoscimento di caratteri manoscritti"

La presente invenzione si riferisce ad un procedimento e ad uncapparecchio per il riconoscimento di caratteri, in particolare per il riconosci mento di lettere, numeri ed altri simboli, quali i caratteri giapponesi, i simboli musicali, i disegni semplici e simili.

Negli schemi di ingresso senza tastiera per sistemi calcolatori, per esempio, le istruzioni o i dati possono essere inseriti dall'operatore del sistema per mezzo di uno stilo simile a penna su uno schermo di ingresso/uscita. Un esempio di un tale schermo ? un monitor sensibile al tocco. Le istruzioni o i dati di ingresso possono essere delle scritte a mano, dei numeri oppure una qualsiasi altra forma di caratteri manoscritti. In questi tipi di sistemi, ? essenziale che il calcolatore "comprenda" l?ingresso che gli ? stato dato dall'operatore e conosca e legga i caratteri di ingresso.

Vi sono numerosi sistemi noti capaci di riconoscere e leggere i caratteri di ingresso. Uno ditali sisterni ? descritto n brevetto statunitense US 4.972.496. Questo brevetto descrive un sistema che comprende uno schermo di ingresso trasparente che genera informazioni posizionali corrispondenti alle posizioni nelle quali uno stilo entra in con-, tatto con lo schermo {vale a dire le informazioni posizionali del carattere) e visualizza anche all'o peratore l'ingresso che ? stato inserito. Il sistema inoltre comprende un calcolatore il quale ? programmato in modo da compilare le informazioni posizionali in "segmenti" o "Strokes" prodotti dallo sti lo. I segmenti vengono analizzati per identificare il punto di partenza di ciascun segmento, il punto di estremit? di ciascun segmento, la pendenza del segmento, il centroide del segmento, la velocit? di variazione della pendenza e, nel caso in cui il carattere comprenda pi? di un segmento, se esso ? il primo, il secondo, ecc.. Una volta che il segmento sia stato analizzato, si accede ad una base di dati personalizzata la quale ? univoca per un operatore specifico, allo scopo di identificare il carattere che pi? strettamente corrisponde al carattere che viene analizzato.

Questo sistema ? relativamente complesso dal implementare per l'impiego di un hardware dedicato alla analisi dei segmenti, a causa della dettagliata analisi dei segmenti che deve essere eseguita. In aggiunta, esso si basa su una base personalizzata di dati per ciascun operatore. Ci? pu? significare che una grande quantit? di memoria viene sprecata se un dato sistema viene utilizzato da molti operatori. Se non viene impostata alcuna base personali zata di dati, il grado di riconoscimento del sistema pu? discendere fino ad un livello inaccettabile. Poich? questo sistema si basa sull'analisi dei segmen ti, ? importante che tutti gli operatori scrivano i caratteri in una predeterminata maniera convenziona le. Il riconoscimento viene gravemente inibito qualu do l'operatore adotta uno stile di scrittura in cui i segmenti sono diversi dal modo convenzionale predeterminato. Anche se i caratteri in stile libero possono avere un aspetto molto simile a quello dei caratteri convenzionali, il riconoscimento pu? non essere accurato poich? l'analisi dei segmenti indica un carattere diverso da quello che ? stato scrit to

Uno scopo della presente invenzione consiste nel fornire un sistema per il riconoscimento di caratteri il quale superi almeno alcuni degli inconvenienti dei sistemi noti.

Un altro scopo della presente in venzione consiste nel fornire un semplice sistema per i l ricono -scimento di caratteri il quale presenti un perfezionato indice di riconoscimento anche quando non viene utilizzata alcuna base personalizzata di dati.

In conformit? con un aspetto della presente invenzione, viene fornito un procedimento per il riconoscimento di un carattere scritto a mano comprendente le operazioni di inserire il carattere con lo impiego di mezzi di inserimento dei caratteri; digitalizzare il carattere; memorizzare il carattere digitalizzato; estrarre le caratteristiche topologiche e le caratteristiche vettoriali di detto carattere; confrontare le caratteristiche topologiche e vettoriali del carattere con una serie di caratteri stiche topologiche e di caratteristiche vettorialidi riferimento memorizzate nella memoria del calcolatore, ciascuna delle serie corrispondendo ad un carattere specifico; ed eseguire un procedimento lo gico per determinare quale di dette serie di caratteristiche di riferimento pi? strettamente corrisponde alle caratteristiche topologiche e vettoriali del carattere digitalizzato, identificando cosi il carattere manoscritto.

Questo sistema presenta i vantaggi che non vi ? alcuna necessit? di analisi dei segmenti dei caratteri che comporti perdita di tempo e complicazioni di esecuzione e che la base dei dati permette r? il riconoscimento di fino 98% di tutti i caratteri inseriti da un operatore.

Verr? ora fatto riferimento, a titolo di esempio, ai disegni allegati, in cui:

la figura 1 rappresenta uno schema a blocchi di un sistema di riconoscimento di caratteri in conformit? con un aspetto della presente invenzione;

la figura 2 rappresenta uno schema di un esempio di una memoria di programma visualizzato sullo schermo del sistema;

la figura 3 rappresenta un diagramma che mostra alcuni esempi di caratteri con difetti di vincolamento dei quadri;

la figura 4 rappresenta uno schema di un for mato STK del carattere A;

la figura 5 rappresenta un diagramma di un formato della configurazione del carattere A;

la figura 6 rappresenta un diagramma che mostra una serie di caratteristiche topologiche usate per identificare un qualsiasi carattere; e

le figure 7 e 8 rappresentano diagrammi per mostrare come venga riconosciuto il carattere Con riferimento alla figura 1, un sistema per il riconoscimento di caratteri ? rappresentato nel suo assieme con il numero di riferimento 10. Il sistema comprende un microcalcolatore 12 avente unmonitor 14. Il calcolatore viene collegato ad uno chermo sensibile al tocco, per esempio un digitalizzatore grafico LCD 16. E' possibile sostituire il monitor con un monitor sensibile al tocco ed el minare lo schermo separato sensibile al tocco. Un stilo 18 simile a penna pu? essere usato sullo scher mo sensibile al tocco per la introduzione delle istruzioni, dei dati o simili nel calcolatore. Un operatore pu? scrivere i comandi direttamente sullo schermo. Per un riconoscimento pi? accurato dei comandi, i caratteri dovrebbero preferibilmente esse re inseriti in un quadro rappresentato genericamente con 20. Il men? dello schermo sensibile al tocco impiegato dall'operatore per l'inserrimento delle inforrmazioni ? rappresentato nella figura 2. Le opzioni prrincipali disponibili sono rappresentate nei blocchi 22 e possono essere attivate toccando con lo stilo il riquadro appropriato 24a-24f.

Il quadro o frame 20 ? rappresentato in mag giore dettaglio nella figura 3.Esso comprende un quadro di sommit? 26, un quadro intermedio 28 ed un quadro di fondo 30. Ciascun carattere dovrebbe essere inserito in una colonna 32 La posizione del carattere viene usata per agevolare il riconoscimento di tale carattere. Per esempio le lettere in forma to minuscolo "corte", per esempio a, c, e, m, n, o, r, s, u, v, w, x e z dovrebbero essere inserite nel quadro intermedio e dovrebbero preferibilmente avere una dimensione tale da non estendersi negli altri quadri. Le lettere in formato minuscolo pi? alte, per esempio b, d, f, h, i, k, l e t dovrebbero avere una dimensione verticale maggiore delle lette re in formato minuscolo pi? piccole e dovrebbero es sere inserite nel quadro di sommit? e nel quadro intermedio. Le lettere in formato minuscolo con una "coda" , per esempio g, j, p, q e y dovrebbero prefe ribilmente essere inserite in modo tale che le code si estendano nel quadro inferiore. Le lettere in formato maiuscolo ed i numeri dovrebbero generalmente essere inseriti nei quadri di sommit? e di centro di una qualsiasi data colonna 32. Altri caratteri, per esempio la punteggiatura, dovrebbero essere inseriti nella loro posizione normale relativamente ai caratteri alfanumerici. Il riconoscimento della punteggiatura non ? discusso in questo documento ma ? oggetto di altra copendente domanda di brevetto.

Aderendo ai vincoli di quadro o di frame precedentemente illustrati si permette al sistema diriconoscere la differenza per esempio fra "c" e "C". E' possibile all' operatore di regolare la dimensione dei quadri oppure di utilizzare il quadro standard. In aggiunta, per diversi alfabeti, per esempio i caratteri giapponesi che comprendono simboli della stessa forma ma dimensioni diverse, i vincoli di quadro non sono necessari e l'operatore pu? inse rire i caratteri in un riquadro senza alcun vincolo di quadro. Lo stesso vale se il sistema viene usato per simboli geometrici o per il riconoscimento dei disegni. Il pieno dettaglio del modo in cui i vincoli di quadro agevolino il riconoscimento verr? descritto nel seguito pi? dettagliatamente.

Una volta che i dati manoscritti siano stati inseriti sul digitalizzatore grafico LCD 16, l'u scita del digitalizzatore viene scaricata nel calco latore in quello che ? denominato un file dei forma ti dei segmenti (STK file). In un tale formato, il carattere ? descritto da una sequenza di segmenti, ciascuno dei quali ? costituito da una serie di coor dinate fra una condizione di penna in basso ed una condizione di penna in alto . La figura 4 rappresenba una conversione del formato ASCII del contenuto di un file di segmenti in forma binaria per la lettera A. L'uscita dal digitalizzatore viene quindi "Pre- elaborata " prima di implemenatre il riconoscimento di caratteri. Questa elaborazione preliminare comprende la demoltiplicazione di grandezza dei caratteri, la centratura, la filtrazione del rumore digitale e l'inserimento delle informazioni digitali in una matrice di pixel di una data grandezza, per esempio una matrice 16 x 16.

Dopo la elaborazione preliminare , il carattere subisce un procedimento di riconoscimento il quale comprende tre operazioni fondamentali:

- estrazione delle caratteristiche topologiche del carattere di ingresso manoscritto,

- determinazione del codice vettoriale del carattere, e - riconoscimento mediante confronto "fuzzy" con una serie di caratteri di riferimento immagazzi nati nella memoria.

Il riconoscimento della scrittura manuale viene eseguito su ciascun singolo carattere una volta che esso sia stato scritto. Ci? permette una totale libert? nella scrittura dei caratteri in conformit? con lo stile ll'operatore, vale a dire che non ? necessario inserire il carattere come una particolare sequenza di segmenti. Ci? pu? consentire delle variazioni nella direzione di movimento della penna e di effettuare delle correzioni dopo che i caratteri siano stati originariamente scritti. Il riconoscimento ? basato principalmente sulle cara -teristiche ottiche del simbol per risolvere le ambiguit? dovete all'effetto ottico del carattere, per, esempio fra "S" e "5", viene determinato un codice, vettoriale per ciascun carattere. Come precedentemente stabilito, il riconoscimento delle lettere in formato maiuscolo ed in formato minuscolo con la stessa forma (per esempio "c" e "C") viene migliore, to per il fatto che l'operatore scrive in quadri o campi.

Questo particolare sisterna viene ottimizzato per i caratteri come anche per tutti gli altri segni usualmente incontrati in una classica tastiera di calcolatore. Tuttavia il sistema ? stato ottimizzato per tutti gli alfabeti, per i caratteri giapponesi, per i simboli geometrici e per i disegni semplici. In aggiunta, il principio ? valido per tutti gli altri alfabeti. Il sistema pu? essere usa to nel modo dipendente dalla persona che scrive, in cui esso presenta un miglior indice di riconoscimen-Tuttavia, un ottimo riconoscimento ? possibile quando esso viene usato come un sistema indipenden -te dalla persona che scrive, vale a dire senza l'addestramento del sistema. L'operatore pu? inserire la sua pr?pria serie di caratteri di riferimento at -traverso un modo di inserimento dei caratteri "user friendly". Una volta adeguatamente addestrato, il sistema pu? accettare un qualsiasi stile di scrittura manuale, per esempio, un operatore pu? addestrare il sistema al riconoscimento di una molteplicit? di stili dei caratteri per una data lettera dell'alfabeto oppure il suo speciale modo di scrivere un dato carattere. Alternativamente, il sistema pu? es sere usato in un "modo non addestrato" con una serie convenzionale di caratteri.

La elaborazione preliminare inizialmente converte il formato STK precedentemente descritto in un formato di configurazione (PTN) di una matrice 16 x 16 normalizzata. Questo formato PTN ? rappresentato nella figura 5. La parte restante della elaborazione preliminare del carattere viene eseguita nel modo seguente.

La interpolazione del punto/il livellamento si verificano quando il digitalizzatore converte i punti con velocit? costante la distanza fra due punti consecutivi essendo proporzionale alla velocit? della penna Se la velocit? di scrittura ? bassa, alcuni punti possono,essere molto vicini agli altri, comportando un rumore di digitalizzazione. Alternativamente, se la velocit? di scrittura ? relativamente rapida, i punti possono essere ben distanziati uno dall'altro, lasciando delle lacune nel segmento. Per superare questo inconveniente, viene usata una routine di interpolazione/livellamento per l'ag giunta dei punti interpolati, ogni volta che i punti sono troppo distanziati e per rimuovere i punti che siano troppo strettamente ravvicinati.

I confini dei caratteri vengono valutati ed i punti vengono scalati per adattarsi in una matrice 16 x 16 normalizzata. Le componenti X e Y vengono scalate con diversi fattori di scalatura per riem pire completamente la matrice. Se il rapporto dimensione X/dimensione Y oppure dimensione Y/dimensione X ? superiore ad un dato valore di soglia (tipicamente 4), viene scalata soltanto la componente pi? grande (X oppure Y) del carattere. Ci? serve per evitare una inappropriata espansione dei caratteri "sottili", per esempio "I" oppure La mappatura dei caratteri coinvolge il numero dei punti appartenenti a ciascuno dei 16 x 16 pixel che vengono contat e quindi viene calcolato il loro valore medio. Un valore di soglia (circa 1/8 del valore medio) viene usato per stabilire se un ato-pixel della matrice deve essere nero {1) oppure bianco (0). Se i numero dei punti in un dato pixel ? superiore al valore di soglia il bit corrispondente viene impostato a 1 altrimenti esso viene impostato a 0 Ulteriori dati vengono aggiunti alla matrice dei caratteri per specificare l'elemeo to identificatore del carattere (disponibile soltanto se il carattere ? un membro della serie di riferimento), questi dati includono il numero dei segmenti del carattere e la posizione nel quadro o frame. Questa informazione verr? usata durante il processo di riconoscimento, come verr? descritto nel seguito. La posizione di quadro viene codificata assegnando un punteggio a ciascuno dei tre quadri di scrittura: il punteggio 1 per il quadro di sommit? 26, il punteggio 2 per quello centjrale 28 ed il punteggio 4 per quello di fondo 30. Per esempio, il ca rattere "g" viene normalmente scritto nel quadro centrale e nel quadro inferiore, perci? il suo nume ro di quadro sar? 2+4=6. I numeri di quadro vengono valutati controllando la posizione del carattere sul campo di scrittura. Allo scopo di non prender in considerazione i piccoli errori di inquadratura da parte dell'operatore, l'area attiva del campo di sommit? e del campo di fondo in effetti ? leggermente pi? piccola di quella indicata dalle linee del quadro. Ci? significa che il confine effettivo frail quadro centrale ed il quadro superiore ? leggermente pi? alto di quello rappresentato ed il confine fra il quadro centrale ed il quadro inferiore ? leggermente pi? basso di quello rappresentato. L'ammontare di questi scorrimenti pu? essere regolato, da parte dell'operatore.

Il risultato della fase di elaborazione preliminare dei caratteri ? una matrice 16 x 16 nel formato della configurazione, ciascun elemento della matrice essendo un pixel dell'immagine del carattere. I valori ammessi per il dato elemento sono 0 (pixel bianco) e 1 (pixel nero), come rappresentato nella figura 5. Alla sommit? della matrice vi ? una linea di dati di intestazione che contengono le seguenti informazioni:

a) identificatore del carattere (disponibile soltanto se il carattere ? un membro della serie di riferimento);

b) numero dei segmenti; e

c) posizionamento nel quadro.

La riga dei dati di intestazione pu? anche contenere codici vettoriali dei caratteri.

La prima operazione del procedimento di ri-, conoscimento consiste nell'estrarre dalla matrice o riginaria 16 x 16 e dal formato di carattere STK in codice o descrizione topologica e dinamica {vettoriale) del carattere. Il riconoscimento viene quindi eseguito confrontando il codice del carattere di ingresso con i codici dei caratteri di riferimento raccolti dall'operatore durante la fase di apprendi mento oppure dalla serie normalizzata contenuta nella memoria. Il codice contiene fondamentalmente tre tipi di informazione:

i) codice di estrazione delle caratteristiche;

ii) codice di intersezione; e iii) posizione nel quadro, numero dei segmenti ed elemento identificatore del carattere (questo ultimo essendo soltanto disponibile se il carattere ? un membro della serie di riferimento); e iv) codice vettoriale del carattere. La estrazione delle caratteristiche ? l'operazione chiave dell'algoritmo di riconoscimento. Esso esegue una fedele descrizione della topologia del carattere per rendere il riconoscimento molto accurato. Questa operazione viene eseguita impiegando una "serie di caratteristiche topologiche". Essa consiste delle 99 matrici 16 x16 riportate nella figura 6 che rappresentano strutture geometriche elementari. Queste matrici sono state ottenute attraverso un complesso lavoro di ottimizzazione effettuato impiegando parecchie serie di caratteri da molte persone diverse.

Il procedimento di estrazione delle caratteristiche fondamentalmente consiste nel sovrapporre ilcarattere alla i-sima matrice di caratteristiche (i=1,...99) e quindi contando il numero dei pixel neri che essi presentano in comune. Questa operazione pu? essere facilmente implementata per mezzo di una funzione AND eseguita su base di bit. Il risultato del conteggio X viene quindi confrontato con tre valori di soglia T1, T2, T3:

se X<= T1, la risposta fi della i-sima caratteristica viene impostata a 0,

se TI < X < = T2, la risposta fi della i-si ma caratteristica viene impostata a 1,

se T2 < X < = T3, la risposta fi della i-simacaratteristica viene impostata a 2,

se X > = T3, la risposta fi della i-sima ca ratteristica viene impostata a 3.

Questo procedimento, ? rappresentato nella figura 7. pertanto il risultato dell'operazione descritta ? una disposizione ordinata di 99 valori in teri denominati codice di estrazione delle caratteristiche, il quale rappresenta la risposta della serie di caratteristiche al carattere dato. I valori T1 T2 T3 vengono scelti da simulazioni del sistema e sono tipicamente impostati, in modo da essere T1=2, T2=3, T3=6.

Il codice di intersezione contiene ulteriori informazioni sulla topologia del carattere. Esso consiste di 32 valori interi Ni(i=1.32), ciascuno di essi essendo il numero delle intersezioni del carattere con le 16 righe orizzontali e con le 16 righe verticali della matrice. Un esempio di questa operazione ? rappresentato nella figura 8.

Il successivo campo del codice del carattere contiene la posizione di quadro, il numero dei segmenti del carattere e, se il carattere ? un membro delle serie di apprendimento, il suo elemento di identificazione, fornito dall'operatore.

L'ultimo campo ? costituito dall'informazione di codice vettoriale del carattere. Tale informa zione comprende i seguenti parametri vettoriali: i) -Nd, in cui Nd+1 rappresenta il numero dei punti nel formato del carattere STK;

ii) DIN, un gruppo ordinato di Nd valori di 4 bit che descrivono la posizione di ciascun punto nel formato di carattere STK rispetto a quello pre -cedente;

ii i) APPX, che rappresenta un gruppo ordinato di Nd valori di 3 bit che descrivono la posizione della coordinata X di ciascun punto del formato di carattere STK rispetto alla coordinata X del primo, di quello centrale e dell'ultimo punto del for -mato di carattere STK;

iv) APPY, che rappresenta un gruppo ordinato di Nd valori di 3 bit che descrivono la posizione della coordinata Y di ciascun punto del formato di carattere STK rispetto alla coordinata Y del pri mo, di quello centrale e dell'ultimo punto del formato di carattere STK; e

v) REL, che ? un gruppo ordinato di 12 valo ri di 2 bit che rappresentano la posizione relativa dei punti di estremit? (massimo e minimo) del carat tere.

Il parametro DIN che descrive la posizione di ciascun punto nel formato STK rispetto a quello precedente ? determinato nella maniera seguente.

Si supponga che (X1, Y1) siano le coordinate di un dato punto nel formato STK e che (X2, Y2} siano le coordinate di quello successivo e cos? via. Le coordinate pen-up e pen-down nella sequenza dei punti STK vengono tralasciate, per cui seguente procedimento pu? assere applicato anche se i due punti appartengono a segmenti divers. La posizione relativa dei due punti ? rappresentata impiegando il seguente schema di flusso:

_

. .

_

Il numero dei valori DIN per ciascun carat tere ? Nd (numero di punti-1). Quindi, i valori DIN sono compresi fra 1 e 10, un valore di 4 bit ? necessario per rappresentare ciascuno di essi.

Per esempio, se un carattere ? costituito dai seguenti 5 punti:

_

I parametri APPX e APPY rappresentano la po sizione di ciascun punto nel formato di carattere STK rispetto al primo, a quello centrale ed all'ultimo punto. Come precedentemente indicato, le coordinate pen-up e pen-down non vengono prese in consi derazione. Supponendo:

(X,Y) sono le coordinate del punto corrente; (??,??) sono le coordinate del primo punto; (Xc,Yc) sono le coordinate del punto centrale ; e

(?n,?n) sono le coordinate dell'ultimo punto,

allora i valori di APPX e APPY sono ottenuticome segue:

- -

mentre :

Il numero dei valori APPX e APPY per ciascun carattere ? Nd, come per i parametri DIN. Poich? i possibili valori sono compresi fra 1 e 8 ed un valore di 3 bit ? necessario per memorizzare il codice APPX/APPY, si richiedono 2*3*Nd bit. Per esempio il codice APP per il carattere dell'esempio prece-

in cui:

I parametri REL che rappresentano la posizione relativa dei punti di estremit? dei caratteri sono valutati nella maniera seguente.

Si supponga che :

Xmax sia il valore massimo della coordinata X nel formato di carattere STK;

Ymax sia il valore massimo della coordinata Y nel formato di carattere STK;

Xmin sia il valore minimo della coordinata X nel formato di carattere STK; e

Ymin sia il valore minimo della coordinata Y nel formato di carattere STK; e

Y(Xmax) sia la coordinata y del punto a cui appartiene Xmax;

X{Ymax) sia la coordinata x del punto a cui appartiene Ymax;

Y(Xmin) sia la coordinata y del punto a cui appartiene Xmin; e

X(Ymin) sia la coordinata x del punto a cui appartiene Ymin.

I 4 punti di estremit? vengono considerati in ordine di tempo secondo il quale essi sono stati scritti dall'utente ed i valori delle loro coordinate vengono confrontati. Il risultato del confronto viene impostato a "+" se la differenza ? positiva e viene impostato a "- " se la differenza ? negativa essendo impostato a "= " se la differenza ? 0.

er esempio, se si prende in considerazione il precedente esempio, si ottiene:

Xmax=4 Ymax=8 Xmin=3 Ymin=6

e la sequenza ordinata nel tempo ?:

Confrontando il primo punto con il secondo, si ottiene: ==

Confrontando il primo punto con i terzo , si ottiene: =-Confrontando il primo punto con il quarto, si ottiene: --Confrontando il secondo punto con terzo, si ottiene: =-Confrontando i l secondo punto con il quarto , si ottiene:

Confrontando il terzo punto con il quarto, si ottiene:

Pertanto, il codice REL associato al particolare carattere, ?:

Poich? ciascun simbolo nel codice REL pu? assumere tre valori diversi, si richiedono 4 bit per memorizzare ciascuno di essi. Perci?, il codice REL per ciascun carattere richiede 2*12=24 bit.

I codici DIN, APPX/APPY e REL, come anche i valori Nd vengono sommati al codice di carattere geometrico (o topologico) precedentemente descritto, pertanto, il codice di carattere aggiornato contiene la seguente informazione:

1. Codice di estrazione delle caratteristiche.

2. Codice di intersezione.

3. Posizione di quadro, numero di segmento e identificatore di carattere (quest'ultimo essendo disponibile soltanto se il carattere ? un membro di una serie di riferimento).

4. Numero Nd.

5. Codice DIN.

6. Codice APPX/APPY.

7. Codice REL.

Pertanto, dopo il processo di codificazione, un dato carattere ? rappresentato da un gruppo ord? nato di numeri interi 99 dalla estrazione delle ca ratteristich e dalle intersezioni, 1 per il nume ro di segmenti per la posizione di quadro; 1 per Nd; Nd per DIN; 2Nd per APPX/APPY e 12 per REL.

Il riconoscimento viene effettuato confrontando valore per valore il codice del carattere di ingresso incognito con i caratteri codificati nclu si nella serie di riferimento che presenta lo stesso numero di quadro. I caratteri con numeri di quadro diversi da quello del carattere di ingresso vengono esclusi durante il confronto. Ci? presenta due importanti vantaggi. In primo luogo, consente il riconoscimento dei caratteri aventi la stessa forma e diversa grandezza. In secondo luogo, il processo di riconoscimento ? relativamente pi? rapido poich? im plica un minor numero di confronti. Come risultato, il punteggio Sj ? fornito da:

e viene assegnato al confronto fra il carattere di ingresso incognito ed il j-simo carattere nella base di dati dei caratteri nella equazione. Nella equazione, Wo rappresenta un fattore di ponderazione che descrive l'importanza relativa dell'informazione ottica e vettoriale; Soj ? il cos? detto punteggio ottico o topografico e Sdj ? il cos? detto puntegg io dinamico.

Il punteggio "ottico " Soj assegnato agli j simi confronti (J=1. Ncar)? dato da:

in cui

S numero del segmenti del carattere di ingresso,

Stj = numero dei segmenti dei j-simo carattere di riferimento,

fi = risposta della i-sima caratteristica al carattere di ingresso,

fij = risposta della i-sima caratteristica al j-simo carattere di riferimento,

Ni = numero delle intersezioni della i-sima riga con il carattere di ingresso,

Nij = numero delle intersezioni della i-sima linea o riga con il j-simo carattere di riferimento,

SW = peso del segmento,

IW = peso della intersezione.

Questo punteggio viene valutato per ciascuno dei Ncar caratteri di riferimento.

Sdj , il termine dinamico del punteggio del carattere pu? essere espresso come la somma di tre diversi termini:

_

in cui: AJ rappresenta il punteggio APP/DIN;

Rj rappresenta punteggio REL; e

Wp e Wr sono i fattori di ponderazione. i risultati delle simulazioni dimostrano che i valori migliori per i fattori di ponderazione Wr e Wp sono 8 e 4, rispettivamente.

Il punteggio Aj viene valutato mediante un confronto dei codici DIN e APPX/APPY. Si supponga che DIN, APPX, APPY e Nd si riferiscano ai caratteri di ingresso e DINj, APPXj, APPYj e Ndj si rifer? scano al j-simo carattere nella serie di riferimento.

Gli elementi DIN, APPX, APPY sono costituiti da Nd elementi, DINj, APPXj, APPYj e Ndj contengono Ndj elementi. Poich?, in generale, Nd/Ndj e vi ? una elevata variabilit? nella scrittura manuale, non ? sufficiente confrontare i valori di DIN e di APPX/APPY cos? come sono, per? si richiedono dei confronti multipli, ciascuno dei quali deve essere ese guito dopo lo scorrimento dei due gruppi ordinati uno rispetto all'altro. I risultati delle simulazioni dimostrano che il miglior indice di riconoscimen to ? ottenuto considerando 7 diversi scorrimenti relativi. per esempio se:

I 7 scorrimenti da prendere in considerazione sono;

Per ciascuno dei 7 casi menzionati, il confronto viene eseguito nel modo seguente. APPX[i], vale a dire l'i-simo elemento del gruppo ordinato APPX viene confrontato con APPXj[i] e APPY[i] viene confrontato con AAPYj[i]. Il confronto non viene eseguito se uno qualsiasi di questi elementi non ? disponibile. Quindi, possono verificarsi 3 diversi casi:

_ In questo caso, il risultato del confronto Cijk (k=l,...7) ? fornito dall'elemento collocato nella posizione (DIN[i], DINj[i]) della matrice:

In questo caso, il risultato del confronto Cijk ? fornito dall'elemento collocato nella posizione (DIN[i], DINj[i]) della matrice:

-

Il ri sultato de l confronto ? Cijk=0. Il risultato complessivo dei confronti relat i vi ad una data posizione di scorrimento ? Cjk=SUM Cijk. in cui la somma deve essere effettuata su tutti i valori di i per cui APPX(i) e APPXj(i) sono si multaneamente definiti.

Infine, il punteggio APP/DIN ? fornito da:

Per valutare il punteggio Rj , il codice REL del carattere di ingresso ed il codice RELj del jsimo carattere nella serie di riferimento vengono confrontati valore per valore . Si supponga che RELi e RELj i ( i = 1 , .. . 12 ) rappresentino il valore di ordine i di REL ed il codice RELj, il punteggio di Rj ? fornito da:

_

in cui:

-_

_

Una volta che. siano stati valutati,

essi possono essere inseriti per calcolare Sdj.

Quindi , il punteggio complessivo Sj assegna -to al confronto con il j-simo carattere nella base , di dati di riferimento viene valutato per ciascuno dei Ncar caratteri di riferimento. L'elemento identificatore del carattere di riferimento con il minimo punteggio viene assegnato al simbolo di ingresso incognito.

Il ruolo giocato dai fattori di ponderazione dinamici Wo, Wr, Wp e dal peso del segmento SW ? molto importante. Infatti, quanto maggiore ? Wo, tan to pi? importante ? il peso dell'informazione ottica nel procedimento di riconoscimento. Gli elementi Wr e Wp descrivono l'importanza relativa delle diverse componenti del punteggio dinamico Sdj. Un altro parametro importante ? il peso di segmento SW: quanto pi? grande ? il suo valore, tanto maggiore ? l'influenza del numero dei segmenti. Pertanto, in dipendenza dalla applicazione, ? possibile ponderare l'importanza relativa della parte ottica e della parte dinamica dell'algoritmo mediante una rifin?tu ra dei fattori Wo, Wr. Wp e SW. Per esempio, se lo algoritmo di riconoscimento viene usato per il rico noscimento dei caratteri giapponesi, che vengono generalmente scritti con la stessa sequenza dei segmeri ti, il contributo dinamico diventa molto importante ed il parametro Wo dovrebbe essere inferiore a quel lo usato per i caratteri romani. Analogamente, SW, Wr e Wp dovrebbero essere maggiori. Per alcune applicazioni, questi fattori di ponderazione possono essere rifiniti dall'utente o operatore. I risultati delle simulazioni dimostrano che i valori migli? ri per i fattori di ponderazione sono Wo=24, Wr=8, Wp=4, SW=15 per i caratteri romani e Wo=20, Wr=8, Wp=4, SW=50 per i caratteri giapponesi.

Il processo di apprendimento che pu? essere usato per educare il calcolatore sugli stili di scrit tura manuale dell'operatore viene spiegato nel seguito in maggiore dettaglio. Se l'operatore non desidera educare il sistema, egli pu? basarsi sul riconoscimento che,viene effettuato in virt? di una serie di riferimento parmanentemente memorizzat nel sistema oppure di quella di un altro operatore.

Il procedimento di apprendimento consiste nel raccogliere un conveniente numero di esempi per ciascun simbolo che l'operatore desidera che venga riconosciuto. Questi simboli formeranno la serie di riferimento durante ?l processo di diconoscimento. Sono disponibili due diver i modi di apprendimento (o di addestramento). Il primo ? noto come modo di apprendimento incorporato. In questo modo, il programma richiede all'operatore di scrivere esempi dei simboli riportati in un file di comandi. Questo file contiene una lista completa dei simboli che debbono essere riconosciuti con i corrispondenti vincp li di quadro. La lista dei simboli ed i vincoli di quadro possono essere modificati dall'operatore, in dipendenza dai simboli che l'operatore desidera che vengano riconosciuti e dal relativo stile di scrittura manuale. Una molteplicit? di valori dei vincoli di quadro sono permessi per ciascun simbolo. Al lo scopo di evitare l'inserimento di cattivi caratteri nella serie di apprendimento, il programma scar ter? i caratteri aventi posizioni di quadro diverse da quelle stabilite nel file.

Il secondo modo ? il modo di apprendimento interatt ivo. L'operatore scrive i simboli nell'ordine che desidera. Quindi viene effettuato il riconoscimento. Ogni volta che il riconoscimento non riesce, i simboli non riconosciuti vengono automaticamente inseriti nella serie di apprendimento (o di riferimento) . Inoltre, i caratteri con posizioni di quadro non ammissibile verranno scartati.

Dopo avere eseguito il modo di apprendimento incorporato, la capacit? di riconoscimento pu? essere ulteriormente migliorata mediante l'aggiunta alla serie di apprendimento di altri caratteri attraverso il modo di apprendimento interattivo.

Questo progetto di HPCR (riconoscimento di caratteri scritti a mano) ? suscettibile di essere implementato su hardware. Per facilitare il trasferimento su silicio, quando necessario, il numero dei pixel neri ? stato scelto costante e uguale a 16. Tuttavia, questa ? semplicemente una scelta preferita e non deve essere considerata come una limitazio ne .

Il trasferimento del sistema sopra descritto sul silicio fornirebbe diversi vantaggi, tra i quali vi sono quelli pi? interessanti che seguono:

un incremento della velocit?, che significherebbe che l hardware dedicato potrebbe sfruttare una architettura parallela messiva per svolgere le numerose operazioni di confronto necessarie per i plementare sia la estrazione delle caratteristiche sia la memoria associativa in un tempo molto pi? breve; e

il consumo di energia sarebbe ridotto al minimo e l'hardware dedicato potrebbe essere attivato soltanto quando deve essere eseguito il riconoscimento. La memoria di Database potrebbe essere integrata sul chip. In questo modo si risparmierebbe la energia necessaria per pilotare i bus esterni.

Chip dedicati possono essere impiegati in prodotti di basso costo destinati ai consumatori dove allo stato della tecnica non sono disponibili dei Microchip potenti.

Si deve menzionare che il sistema si presta benissimo alla implementazione su silicio. Infatti, le operazioni che debbono essere effettuate, anche se numerose, sono molto semplici in se stesse (fondamentalmente AND e EXNOR). La architettura massivamente parallela necessaria per la elevata velocit? potrebbe essere costruita intorno a nuclei di memoria DRAM (usati per la memorizzazione di database caratteristira) in maniera relativamente semplice, grazie alla struttura interna delle stesse, memorie DRAM.

Si dovrebbe notare che, sebbene sistema sia stato descritto con riferimento a caratteri for manti parte di un alfabeto o dell'altro, si pu? anceh determinare il riconoscimento di altri simboli Per esempio, i simboli geometrici semplici possono essere identificati mediante confronto dei loro codici con quelli di simboli geometrici di riferimento. Alcuni esempi di tali simboli comprendono i sim boli dei dispositivi a semiconduttore (vale a dire i resistori, i condensatori, i transistori, i diodi, ecc.), i simboli musicali (le note, le note alte, le note basse e simili), i disegni semplici (per esempio gatti, cani, sole, luna e molti molti di pi?). Non vi ? alcun limite all'ambito di questo sisterna una volat che, per un dato simbolo, sia stato generato un codice di riferimento.

Claims

RIVENDICAZIONI 1. Procedimento per il riconoscimento di un carattere scritto a mano comprendente le seguenti operazioni. inserire il carattere con l'impiego di mezzi di inserimento dei caratteri; digitalizzare il carattere; memorizzare il carattere digitalizzato; estrarre le caratteristiche topologiche e le caratteristiche vettoriali di detto carattere; confrontare le caratteristiche topologiche e vettoriali del carattere con una serie di caratteristiche topologiche e vettoriali di riferimento me morizzate in una memoria, ciascuna delle serie corrispondendo ad un carattere specifico; e eseguire un procedimento logico per determinare quale di dette serie di caratteristiche di riferimento corrisponde pi? strettamente alle caratte ristiche topologiche e vettoriali del carattere digitalizzato, identificando cosi il carattere scritto a mano.
2. Procedimento secondo la rivendicazione 1, in cui la estrazione delle caratteristiche topologi che e vettoriali consiste nel ponderare le caratteristiche della topologia e del vettore pi? di una volta in una predeterminata maniera in dipendenza dalla natura del carattere.
3. Procedimento secondo la rivendicazione 1 o la rivendicazione 2, in cui la estrazione delle caratteristiche vettoriali consiste nell'estrarre le caratteristiche del carattere nella forma di uno o pi? codici vettoriali, ciascun codice vettoriale essendo indicativo di una delle caratteristiche vet toriali del carattere.
4. Procedimento secondo una qualsiasi precedente rivendicazione, in cui la digitalizzazione del carattere consiste nel costruire una matrice di uni e di zeri ed un gruppo ordinato di punti che sono rappresentativi del carattere.
5. Procedimento secondo la rivendicazione 4, in cui la estrazione del codice vettoriale consiste nell'estrarre un codice indicativo del numero dei punti di detto carattere.
6. Procedimento secondo la rivendicazione 4 o la rivendicazione 5, in cui la estrazione del codice vettoriale consiste ulteriormente nell'estrarre un codice che descrive la posizione di ciascun punto del gruppo ordinato relativamente al punto pre cedente.
7. Procedimento secondo una qualsiasi delle rivendicazioni da 4 a 6, in cui la estrazione del codice vettoriale consiste ulteriormente nell'estrarre un codice che descrive una coordinata X per ciascun punto rispetto ad una o pi? predeterminate coordinate X del carattere.
8. Procedimento secondo una qualsias? delle rivendicazioni da 4 a 7, in cui la estrazione del codice vettoriale consiste ulteriormente nell'estrar re un codice che descrive una coordinata Y per ciascun punto rispetto ad una o pi? predeterminate coordinate Y del carattere.
9. Procedimento secondo una qualsiasi delle rivendicazioni da 4 a 8, in cui la estrazione del codice vettoriale consiste ulteriormente nell'estrarre un codice che rappresenta la posizione relativa dei punti di estremit? del carattere.
10. Procedimento secondo una qualsiasi precedente rivendicazione, in cui la esecuzione del pr? cedimento logico consiste nel valutare un punteggio Sj per ciascuno dei caratteri di riferimento (Ncar) e nell'identificare il carattere di riferimento con il punteggio pi? basso Sj come il carattere che ? stato inserito come carattere manoscritto, in cui Sj ? fornito da:

in cui; rappresenta il fattore di ponderazione; Soj rappresenta il punteggio topologico; e Sdj rappresenta un punteggio vettoriale.
11. Procedimento secondo la M rivendicazione 9, in cui la valutazione di detto punteggio Sj consiste nel valutare il punteggio Soj che ? fornito da:

in cui: S = numero di segmenti del carattere di ingresso, Stj = numero di segmenti del j-simo carattere di riferimento, fi = risposta della i-sima caratteristica al carattere di ingresso, fij = risposta della i-sima caratteristica al j-simo carattere di riferimento, Ni = numero delle intersezioni della i-sima riga con il carattere di ingresso, Nij = numero delle intersezioni della i-sima riga con il j-simo carattere di riferimento, SW = peso del segmento, IW = peso della intersezione.
12. Procedimento secondo la rivendicazione 9 o la rivendicazione 10, in cui la valutazione di detto punteggio consiste nel valutare punteggio Sdj che ? fornito da:

in cui: Aj rappresenta il punteggio APP/DIN; Rj rappresenta il punteggio REL; Wp e Wr sono i fattojr? di ponderazione, Nd rappresenta il (numero dei punti del carattere-1) del carattere di ingresso; e Ndj rappresenta il (numero dei punti del ca rattere-1) del j-simo carattere di riferimento.
13. Apparecchio per il riconoscimento di un carattere scritto a mano comprendente: mezzi di inserimento dei caratteri per inse rire e ricevere i caratteri; mezzi di digitalizzazione per digitalizzare i caratteri; mezzi di memorizzazione per memorizzare i caratteri digitalizzati; mezzi di estrazione delle caratteristiche topografiche per estrarre le caratteristiche topolo giche e le caratteristiche vettoriali rappresentati ve del carattere; mezzi per confrontare le caratteristiche to pologiche e vettoriali del carattere con una serie di caratteristiche topologiche e vettoriali di rife rimento, ciascuna delle quali corrisponde ad un caratt re specifico; e mezzi logici per identificare quale di dette serie di caratteristiche di riferimento corrispon de pi? strettamente alle caratteristiche topologiche e vettoriali del carattere digitalizzato, identificando cosi il carattere scritto a mano.
14. Apparecchio secondo la rivendicazione 13, ulteriormente comprendente mezzi di ponderazione associati ai mezzi di estrazione delle caratteri stiche capaci di fornire un diverso fattore di ponderazione a ciascuan di dette caratteristiche topologiche e vettoriali in una maniera predeterminata che dipende dalla natura del carattere.
15. Apparecchio secondo la rivendicazione 14, in cui il fattore di ponderazione delle caratte ristiche vettoriali ? pi? elevato del fattore di pon derazione delle caratteristiche topologiche per i caratteri giapponesi.
16. Apparecchio secondo la rivendicazione 14, in cui il fattore di ponderazione delle caratte ristiche vettoriali ? inferiore al fattore di ponde razione delle caratteristiche topologiche per i caratteri romani.
17. Apparecchio secondo una qualsiasi delle rivendicazioni da 13 a 16, in cui i mezzi di estrazione delle caratteristiche comprendono mezzi generratori di codice per generare una pluralit? di codi ci indicativi delle caratteristiche vettoriali e to pologiche.
18. Apparecchio secondo una qualsiasi delle rivendicazioni da 13 a 17, in cui i mezzi di confronto confrontano i codici della serie di riferimento ed il codice del carattere di ingresso.
19. Apparecchio secondo una qualsiasi delle rivendicazioni da 13 a 18, in cui i mezzi logici va lutano un punteggio Sj per ciascun carattere di riferimento (Nd) ed identificano il carattere di riferimento con il punteggio pi? basso, come quello corrispondente ai caratteri manoscritti, in cui Sj ? fornito da;

?nc ui: Wo ? un fattore di ponderazione, Soj ? un punteggio topologico; e Sdj ? un punteggio vettoriale.
20 Apparecchio secondo la rivendicazione 19, in cui Soj ? fornito da:

in cui: S_= numero dei segmenti del carattere di ingresso, Stj = numero dei segmenti del j-simo carattere di riferimento, fi = risposta della i-sima caratteristica al carattere di ingresso, fij = risposta della i-sima caratteristica al j-simo carattere di riferimento, Ni = numero delle intersezioni della i-sima riga con il carattere di ingresso, Nij = numero delle intersezioni della i-sima riga con il j-simo carattere di riferimento, SW = peso del segmento, IW = peso della interseizone.
21. Apparecchio secondo la rivendicazione 19 o la rivendicazione 20, in cui Sdj ? fornito da:

in cui: Aj rappresenta il punteggio APP/DIN; Rj rappresenta il punteggio REL; Wp e Wr sono i fattori di ponderazione; Nd ? il (numero dei punti del carattere-1) del carattere di ingresso; e Ndj ? il (numero dei punti del carattere-1) del j-simo carattere di riferimento.
22. Apparecchio secondo una qualsiasi delle rivendicazioni da 13 a 21 in cui, una interfaccia viene fornita fra l'apparecchio ed un calcolatore, in modo tale che l'interfaccia lasci passare il carattere identificato verso li calcolatore, per formare cosi parte delle istruzioni per il calcolatore.
23. Prodotto basato su calcolatore comprendente un apparecchio secondo una qualsiasi delle vendicazioni da 13 a 21 ed una interfaccia fra l'apparecchio ed il calcolatore per far passare l'istru zione al calcolatore dall'apparecchio.