ITRM940338A1 - Procedimento ed apparecchio per il riconoscimento dei caratteri - Google Patents

Procedimento ed apparecchio per il riconoscimento dei caratteri Download PDF

Info

Publication number
ITRM940338A1
ITRM940338A1 IT000338A ITRM940338A ITRM940338A1 IT RM940338 A1 ITRM940338 A1 IT RM940338A1 IT 000338 A IT000338 A IT 000338A IT RM940338 A ITRM940338 A IT RM940338A IT RM940338 A1 ITRM940338 A1 IT RM940338A1
Authority
IT
Italy
Prior art keywords
character
weighting factor
micro
code
characters
Prior art date
Application number
IT000338A
Other languages
English (en)
Inventor
Girolamo Gallo
Cristina Lattaro
Giuseppe Savarese
Original Assignee
Texas Instruments Italia Spa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Italia Spa filed Critical Texas Instruments Italia Spa
Priority to ITRM940338A priority Critical patent/IT1272259B/it
Publication of ITRM940338A0 publication Critical patent/ITRM940338A0/it
Priority to DE69526285T priority patent/DE69526285T2/de
Priority to EP95303614A priority patent/EP0689153B1/en
Priority to JP7132296A priority patent/JPH08161429A/ja
Priority to US08/454,450 priority patent/US5673337A/en
Publication of ITRM940338A1 publication Critical patent/ITRM940338A1/it
Application granted granted Critical
Publication of IT1272259B publication Critical patent/IT1272259B/it

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

DESCRIZIONE
a corredo di una domanda di Brevetto d'invenzione, avente per titolo:
"Procedimento ed apparecchio per il riconoscimento dei caratteri".
La presente invenzione si riferisce ad un prò cedimento e ad un apparecchio per il riconoscimento di caratteri, in particolare il riconoscimento di lettere, numeri ed altri simboli, per esempio i caratteri giapponesi, i simboli musicali, i disegni semplici e simili.
Negli schemi di ingresso senza tastiera per sistemi calcolatori, per esempio, le istruzioni oppure i dati possono essere introdotti in ingresso dall'utente del sistema per mezzo di uno stilo simile ad una penna su uno schermo di ingresso/uscita. Un e sempio di un tale schermo è il monitor sensibile al contatto. Le istruzioni o i dati di ingresso possono essere delle istruzioni manuali, numeri oppure una qualsiasi altra forma di carattere manoscritto. In questi tipi di sistemi, è essenziale che il calcolatore "comprenda" l'ingresso che gli è stato fornito dall'utente e riconosca e legga i caratteri di ingresso.
Vi sono numerosi sistemi noti capaci di riconoscere e leggere caratteri di ingresso. Un tale sistema è descritto nel brevetto statunitense 4.972.496. Tale brevetto descrive un sistema che comprende uno
schermo di ingresso trasparente il quale genera delle informazioni di posizione corrispondenti alle posizioni nelle quali uno stilo tocca lo schermo (vale
a dire l'informazione di posizione del carattere) e
visualizza anche all'utente l'ingresso che è stato
fornito. Il sistema inoltre comprende un calcolatore
il quale è'programmato in modo da compilare l'informazione di posizione in "segmenti" prodotti dallo
stilo. I segmenti vengono analizzati per identificare il punto di partenza di ciascun segmento, il termine di ciascun segmento, la pendenza del segmento,
il centroide del segmento, la velocità di variazione
della pendenza e, nel caso in cui un carattere comprenda più di un segmento, se si tratti del primo,
del secondo, etc. Una volta che il segmento sia stato analizzato singolarmente, una base di dati personalizzata che è univocamente associata ad un utente
specifico, viene risuperata per identificare il carattere che più strettamente corrisponde al carattere che viene analizzato.
94830118.9 (TI-17878). In quest'ultimo caso, è stato descritto un sistema che analizza le caratteristiche topologiche e vettoriali di ciascun carattere manoscritto. Queste caratteristiche vengono quindi confrontate con una serie di caratteristiche topologiche e vettoriali di riferimento per identificare il carattere.
Tuttavia, anche con questo sistema, qualche volta è difficile identificare la differenza fra le lettere in formato maiuscolo e le lettere in formato minuscolo, per esempio "C" e "c“. In qualche misura, questo problema potrebbe essere risolto richiedendo all'utente di inserire le lettere in una cornice in una certa maniera.
Per esempio, nel brevetto TI-17878, il riquadro di ingresso comprende tre cornici. Le lette re corte in formato minuscolo, per esempio a,c,e,m, n,o,r,s,u,v,w,x e z debbono essere inserite nella cornice intermedia, mentre le lettere più alte in formato minuscolo, come b,d,f,h,i,k,1 e t, come anche le lettere in formato maiuscolo ed i numeri debbono essere inseriti nelle cornici superiore ed intermedia.
Questa soluzione ha avuto successo soltanto se l'utente inseriva il carattere correttamente. Se l'utente non inseriva il carattere nella maniera richiesta, il sistema potrebbe commettere errori di r_i_ conoscimento dei segnali di ingresso applicati dallo utente.
Uno scopo della presente invenzione consiste nel superare almeno alcuni dei problemi della tecnica anteriore.
In conformità con un aspetto della presente Invenzione, viene fornito un procedimento per riconc) scere un carattere manoscritto, comprendente le operazioni di introdurre il carattere utilizzando mezzi di introduzione dei caratteri; digitalizzare il carattere; memorizzare il carattere digitalizzato; estrarre le caratteristiche topologiche e le caratteristiche vettoriali di detto carattere; estrarre le microcaratteristiche del carattere; determinare le dimensioni del carattere; confrontare le caratteristiche topologiche e vettoriali del carattere con una serie di caratteristiche di riferimento equivale^ ti ad esso e memorizzate in una memoria, ciascuna delle serie corrispondendo ad un carattere specifico; ed eseguire un procedimento logico per determinare quale della serie di caratteristiche di riferimento più strettamente corrisponde alle caratteristiche to pologiche, alle caratteristiche vettoriali, alle microcaratteristiche ed alle dimensioni del carattere digitalizzato, riconoscendo cosi il carattere manoscritto.
Il riconoscimento dei caratteri viene migliorato utilizzando il procedimento ed è più facile da effettuare da parte dell'utente. In aggiunta, viene notevolmente evitata la confusione fra le lettere in formato maiuscolo e le lettere in formato minuscolo aventi la stessa forma.
Viene ora fatto riferimento, a titolo di esem pio, ai disegni allegati, in cui:
la Figura 1 rappresenta uno schema a blocchi di un sistema per il riconoscimento di caratteri in conformità con un aspetto della presente invenzione;
la Figura 2 rappresenta un diagramma di un esempio di una memoria di programma visualizzato sullo schermo del sistema;
la Figura 3 rappresenta un diagramma che mostra alcuni esempi di caratteri con difetti di vinco lamento delle cornici;
la Figura 4 rappresenta un diagramma del formato dei segmenti del carattere A;
la Figura 6 rappresenta un diagramma che mostra una serie di caratteristiche topologiche utilizzate per identificare un qualsiasi carattere; e le Figure 7 e 8 rappresentano diagrammi che mostrano il modo in cui il carattere viene riconosciuto.
Con riferimento alla Figura 1, un sistema per il riconoscimento di caratteri è rappresentato nel suo assieme con il numero di riferimento 10. Il sistema comprende un microcalcolatore 12 avente un monitor 14. Il calcolatore viene collegato ad uno schermo sensibile al contatto, per esempio un digita lizzatore grafico 16 a LCD. E1 possibile sostituire il monitor con un altro monitor sensibile al contatto ed è possibile fare a meno del separato schermo sensibile al contatto. Uno stilo 18 simile ad una penna può essere usato sullo schermo sensibile al contatto per inserire in ingresso le istruzioni, i dati oppure simili, nel calcolatore. Un utente può scrivere i comandi direttamente sullo schermo. Per un riconoscimento della massima accuratezza dei comandi, i caratteri dovrebbero preferibilmente essere introdotti in una cornice rappresentata genericamente con il numero di riferimento 20. Il menu sullo schermo sensibile al contatto utilizzato dall'utente per l'inserimento delle informazioni è rappresentato nella Figura 2. Le opzioni principali disponibili so no rappresentate nei blocchi 22 e possono essere attivate toccando con lo stilo il riquadro appropriato 24a-24f.
Il riquadro di.ingresso dei caratteri è rappresentato in maggiore dettaglio nella Figura 3. Esso è diviso in due cornici (cornice di sommità 26 e cornice di fondo 30) per mezzo di una linea di scri_t tura 28. Ciascun carattere dovrebbe in linea ideale essere inserito in una colonna 32. La posizione del carattere viene usata per agevolare il riconoscimento di tale carattere. Le lettere in formato minuscolo con una "coda", per esempio g.j.p.q e y dovrebbero preferitilmente essere inserite in modo tale che la porzione di coda si estenda nella cornice di fondo. Tutte le altre lettere in formato minuscolo ed in mormato maiuscolo, come anche i numeri, dovrebbero generalmente essere i nserite nel la cornice di som mità di una qualsiasi data colonna 32. Altri caratte ri, per esempio la punteggiatura, dovrebbero essere inseriti nelle loro posizioni normali relativamente ai caratteri alfanumerici.
. L'adesione ai vincoli di posizione precedente mente illustrati consente al sistema di riconoscere la differenza, per esempio, fra "q " e "9".
La presente versione del sistema supera le l_i_ nutazioni della tecnica precedente e nella pratica i seguenti caratteri possono essere inseriti in una po sizione qualsiasi nella cornice di sommità 26: a,b, c,d,e,f,n,m ,i,k,1,m,n,o,r,s,t,u,v,w e z. Il riconoscimento delle lettere in formato maiuscolo ed in formato minuscolo con la stessa forma (per esempio c e C) è perfezionato dalla particolare routine di alimentazione in retroazione, come verrà descritto in seguito in maggiore dettaglio.
E' possibile che l'operatore imposti la posizione della linea di scrittura oppure utilizzi il suo valore difettoso. Per quegli alfabeti come i caratteri giapponesi che non presentano simboli della stessa forma ma diversa posizione, i vincoli di posizione non sono necessari e l'utente può inserire i caratteri nel riquadro di ingresso senza alcun vincolo di cornice. Lo stesso vale se il sistema viene usato per simboli geometrici oppure per il riconoscimento del disegno. Il pieno dettaglio del modo in cui il vincolo di posizione agevoli il riconoscimento verrà descritto nel seguito con maggiori particolari.
La posizione di scrittura viene codificata assegnando un punteggio a ciascuna di due cornici di scrittura: 2 per la cornice di sommità 26 e 4 per quella di fondo 30. Per esempio, il carattere "g" viene normalmente scritto nelle cornici di sommità e di fondo, per cui il suo numero di posizione sarà 2+4=6. I numeri di posizione vengono valutati attraverso una verifica della posizione del carattere sul campo di scrittura. Alio scopo di trascurare i picco li errori di incorniciamento da parte dell'utente, l'area attiva al disotto della linea di scrittura è in pratica leggermente più piccola di quella indicata. Ciò significa che il confine effettivo fra le parti di riquadro di sommità e di fondo di ingresso è leggermente più basso di quello rappresentato. La entità di questo scorrimento può essere regolata dall'utente.
Una volta che i dati manoscritti siano stati inseriti sul digitalizzatore grafico 16 a LCD, la uscita del digitalizzatore viene scaricata nel calco latore in quello che è denominato un archivio dei formati dei segmenti (archivio o file di STK). In un tale formato, il carattere è descritto da una sequenza di segmenti, ciascuno dei quali è costituito da una serie di coordinate fra una condizione corrispondente ad uno stato di penna-in-basso ed una condizio ne di penna-in-alto. La Figura 4 rappresenta una con versione del formato ASCII del contenuto di un archi vio di segmenti in forma binaria della lettera A. La uscita dal digitalizzatore viene quindi "pre-elabora ta" prima che venga implementato il riconoscimento dei caratteri. Questa pre-elaborazione comprende la scalatura del carattere, il centraggio, la filtrazio ne digitale del rumore e la introduzione dell'informazione digitale in una matrice di pixel di una data grandezza, per esempio una matrice 16x16.
Dopo la pre-elaborazione, il carattere subisce un procedimento di riconoscimento che comprende le seguenti operazioni fondamentali:
la estrazione degli elementi caratterizzanti (caratteristiche) topologici del carattere manoscrit to di ingresso;
la estrazione delle microcaratteristiche del carattere;
la determinazione dei codici dei vettori del carattere;
la determinazione della grandezza del caratte re; e
il riconoscimento mediante confronto "sfumato" (fuzzy) con una serie di caratteri di riferimento me morizzati in una memoria ed occasionalmente riconoscimento per retroazione.
Il riconoscimento della scrittura manuale viene eseguito su ciascun carattere singolo una voita che esso sia stato scritto. Ciò consente totale libertà di scrittura dei caratteri in conformità con 10 stile dell'utente, vale a dire che non è necessario inserire il carattere come una particolare sequenza di segmenti. Ciò può consentire delle variazioni nella direzione di movimento della penna e correzioni possono essere effettuate dopo che i carette ri sono stati originariamente scritti. Il riconoscimento è basato principalmente sulle caratteristiche ottiche dei simboli. Per risolvere le ambiguità dovute all'aspetto ottico dei caratteri, per esempio tra "S“ e "5", viene determinato un codice vettoriale per ciascun carattere. Questa determinazione del codice vettoriale verrà descritta nel seguito in maggiore dettaglio. Come precedentemente stabilita, il riconoscimento delle lettere in formato maiuscolo e delle lettere in formato minuscolo con la stessa for ma (per esempio "c" e "C") viene perfezionato dal fatto che l'utente scrive in campi o cornici e mediante il riconoscimento in retroazione.
Questo particolare sistema viene ottimizzato per i caratteri come anche per tutti gli altri simbo li che usualmente si trovano in una classica tastiera di calcolatore. Tuttavia, il sistema è stato otti mizzato per tutti gli alfabeti, i caratteri giappone si, i simboli geometrici ed i disegni semplici. In aggiunta, il principio è valido per tutti gli altri alfabeti. II sistema può essere usato in un modo che dipende dalla persona che scrive, in cui esso presen ta il miglior indice di riconoscimento. Tuttavia, un ottimo riconoscimento è possibile quando usato come un sistema indipendente dallo scrivente, vale a dire senza l'addestramento del sistema. L'utente può inse rire il suo proprio gruppo di caratteri di riferimen to attraverso un modo di inserimento dei caratteri direttamente accessibile all'utente. Una volta che sia stato adeguatamente addestrato, il sistema può accettare un qualsiasi stile di scrittura manuale. Per esempio, un utente può addestrare il sistema al riconoscimento di una molteplicità di stili di carat teri per una data lettera dell'alfabeto oppure il suo modo speciale di scrivere un dato carattere. Alternativamente, il sistema può essere usato in un "modo senza addestramento" con una normale serie di caratteri.
La pre-elaborazione inizialmente converte il formato STK precedentemente descritto in un formato basato sulle configurazioni (PTN) di una matrice 16x 16 normalizzata. Questo formato PTN è rappresentato nella Figura 5.
La pre-elaborazione dei caratteri è stata ottimizzata in termini di velocità e di memoria necessaria. L'impiego di una nuova routine di assottigli_a mento e di interpolazione rende più rapido e più efficiente il procedimento di estrazione delle caratte ristiche. Questa soluzione ha consentito una riduzio ne del numero delle matrice delle caratteristiche da 99 a 79, come si vede nella Figura 6.
La conversione dal formato a segmenti al formato a configurazioni si verifica nella maniera seguente. Tutte le coordinate dei punti nel formato STK vengono moltiplicate per 16. Le nuove coordinate (t_x,t_y) del punto originario (x,y) sono date da:
mentre la larghezza x_fact del riquadro dei caratteri e la sua altezza y_fact sono:
t.max.x, t.min.x, t.max.y e t.min.y essendo i bordi del riquadro dei caratteri.
Se il rapporto x-fact/y-fact oppure il rapporto y-fact/x-fact è maggiore di un dato valore di soglia (tipicamente 4) viene scalato soltanto il componente maggiore del carattere. Ciò serve per evi tare una inappropriata espansione dei caratteri "sottili", come il carattere "I" oppure Questa verifica viene eseguita attraverso le seguenti operazioni:
in cui offs.x e offs.y sono le coordinate dell'origine del riquadro del carattere scalato. Una procedura analoga viene applicata se x_fact > =y_fact.
La posizione di un dato punto (t_x,t_y) nella matrice di caratteri 16*16 può essere determinata dalla formula:
R e C rappresentando la riga e la colonna a cui appartiene il punto.
Nella matrice di caratteri 16*16, due punti consecutivi possono appartenere a pixel non adiacenti. Ciò comporterebbe un "buco" nel segmento del carattere. Per superare questo inconveniente, viene eseguita una routine di interpolazione per riempire i pixel vuoti.
Per ciascuna coppia di pixel consecutivi (R,C) e (R1,C1), il parametro NUM, vale a dire la massima differenza fra le loro coordinate, è calcolato nel modo seguente:
Se NUM è superiore a 1, allora i punti di NUM vengono inseriti tra i due pixel mediante interpolazione lineare. Allora, tutti i pixel della matrice che contengono almeno un punto vengono impostati sul valore 1 (nero) e quelli che non contengono alcun punto vengono impostati sul valore 0 (bianco). Una volta completata la interpolazione, si applica una routine di assottigliamento del carattere in modo da rendere i segmenti del carattere i più sottili poss_i_ bile. Ciò viene effettuato considerando tre pixel consecutivi della matrice 16*16 (Pi=(Ri,Ci), Pi+1=
e sviluppando:
Se MAXDIFF=1, i due punti Pi e Pi+2 sono consecutivi, pertanto Pi+1 viene impostato al valore 0. D'altra parte, se MAXDIFF >1, allora Pi e Pi+2 non sono consecutivi e Pi+1 viene lasciato nero. Quindi la routine viene ripetuta considerando la successiva terna di punti, se MAXDIFF=1, ciò porterà al risulta to di Pi+2,Pi+3 e Pi+4. Alternativamente, se MAXDIFF >1, allora Pi+l,Pi+2 e Pi+3 saranno presi in considerazione. Una volta che la descrita procedura di a_s sottig1lamento sia stata completata, il formato del carattere PTN è disponibile. Questo formato per la lettera A è rappresentato nella Figura 5.
Alla sommità della matrice vi è una linea di testa dei dati che contiene la seguente informazione a) identificatore del carattere (disponibile soltanto se il carattere è un membro della serie di riferimento);
b) numero dei segmenti; e
c) posizionamento delle cornici.
La linea dei dati di testa può anche contenere i codici vettoriali dei caratteri e l'informazione dimensionale per il riconoscimento in retroazione La prima operazione del procedimento di riconoscimento consiste nell'estrarre dalla matrice originaria 16x16 e dal formato STK del carattere un codice del carattere. Il riconoscimento viene quindi eseguito confrontando un codice di carattere di ingresso con i codici dei caratteri di riferimento raccolti dall'utente durante la fase di apprendimento oppure dalla serie classica contenuta nella memoria.
Il codice di carattere fondamentalmente contiene cinque tipi di informazioni:
i) codice di estrazione delle caratteristiche; ii) codice di rivelazione delle microcaratteristiche;
iii) posizione della cornice, numero dei segmenti, identificatore dei caratteri (quest'ultimo essendo disponibile soltanto se il carattere è un membro della serie di riferimento);
iv) codice vettoriale dei caratteri;
v) grandezza del carattere (sua larghezza X e sua altezza Y).
La estrazione delle caratteristiche rappresen ta l'operazione chiave dell'algoritmo di riconoscimento. Esso esegue una descrizione fedele della topo logia del carattere in modo da rendere il riconoscimento molto accurato. Questa operazione viene esegui ta impiegando una "serie di caratteristiche topologiche". Essa consiste di settantanove matrici 16x16 rappresentate nella Figura 6 in rappresentazione delle strutture geometriche elementari. Queste matrici sono state ottenute attraverso un complesso lavoro di ottimizzazione eseguito applicando diverse serie di caratteri da molte persone diverse.
Il procedimento di estrazione delle caratteri stiche fondamentalmente consiste nel sovrapporre il carattere alla i-sima (i=1. 79) matrice di caratteristiche e quindi contando il numero dei pixel neri che essi hanno in comune. Questa operazione può essere facilmente implementata per mezzo di una funzione AND eseguita su base di bit. Il risultato di conteggio X viene quindi confrontato con tre valori di soglia T1,TZ,T3:
se X <=T1, la risposta fi della i-sima caratteristica viene messa uguale a 0
se T1<X <=T2, la risposta fi della i-sima caratteristica viene messa uguale a 1 se T2-<X<=T3, la risposta fi della i-sima caratteristica viene messa uguale a 2 se X > =T3, la risposta fi della i-sima caratteristica viene messa uguale a 3.
Questo procedimento è rappresentato nella Figura 7. Pertanto, il risultato dell'operazione descritta è costituito da un gruppo ordinato di settantanove valori interi denominati codice di estrazione delle caratteristiche che rappresentano la risposta della serie di caratteristiche al carattere dato. T1,T2,T3 vengono scelti da simulazioni del sistema e sono tipicamente regolati in modo da essere T1=2,T2=3,T3=6.
Grazie alla nuova routine di pre-elaborazione, il numero delle matrici delle caratteristiche è stato ridotto da novantanove a settantanove, senza influenzare la accuratezza del riconoscimento.
Il codice di rivelazione delle microcaratteristiche contiene informazioni ottiche che si riferisco no ad alcune particolari configurazioni di pixel che possono verificarsi nella matrice di caratteri 16x16. Essi vengono rivelati mediante esplorazione delle 15 righe superiori della matrice dei caratteri colonna per colonna dalla sinistra verso destra. Cigni volta che viene trovato un pixel nero, la configurazione dei pixel adiacenti appartenenti alla riga inferiore viene memorizzata, mentre non viene esegui ta alcuna azione quando viene incontrato un pixel bianco. Per essere specifici, se le coordinate di un pixel nero nella i-sima riga della matrice sono P=(i,j), Talgoritmo esegue una verifica della presenza di pixel neri nelle seguenti posizioni:
Ciascuna configurazione è codificata assegnando un punteggio a ciascuna delle tre posizioni, 1 per A, 2 per B e 4 per C. Per esempio, se il pixel P è nero e vi sono pixel ne ri in A ed in C ed un pixel bianco in B, il codice delle microcaratteristiche sarà 1+4=5. La Figura 8 rappresenta tutte le possibili configurazioni ed i relativi valori del codice.
Questa operazione viene eseguita considerando soltanto i primi cinque pixel neri di ciascuna riga. Se una riga contiene più di cinque pixel neri, essi non vengono presi in considerazione, mentre, se vi sono meno di cinque pixel neri, i restanti campi dei codici delle caratteristiche sono impostati a 0. Pe_r tanto, il codice di rivelazione delle microcaratteM stiche consiste di 15 (righe) *5 (pixel neri) valori di 3 bit (29 byte). Il codice delle microcaratteristiche è indicato da Ri(k)(i=1,...,15;k=l,...5) in relazione al k-simo pixel nero della i-sima riga de_l_ la matrice, una ulteriore informazione che è richiesta è il numero P dei valori di Ri(k) diversi da zero. Perciò, la memorizzazione dei codici dei caratte ri delle microcaratteristiche richiede 30 byte.
Il campo successivo del codice di carattere contiene la posizione sulla cornice o sottoquadro, il numero dei segmenti o tratti del carattere e, se il carattere è un membro delle serie di apprendimento, il suo identificatore, fornito dall'utente.
Il codice vettoriale dei caratteri è stato normalizzato allo scopo di ottimizzare la quantità di memoria richiesta per memorizzare le informazioni dinamiche e per eliminare la necessità di far scorre re i codici vettoriali dei simboli che debbono essere confrontati durante il procedimento di riconoscimento. Questa soluzione fornisce nello stesso tempo: un notevolissimo miglioramento nella velocità di riconoscimento (3 volte più rapida in confronto con la versione precedente), una riduzione della memoria necessarla per memorizzare il codice DIN/APP dei carat teri (27 byte/carattere) ed una considerevole riduzione della grandezza del programma. Poiché la nuova versione del codice DIN fornisce una descrizione più fedele della dinamica della scrittura, certi codici, per esempio il codice REL, non sono più necessari e sono stati eliminati. Il codice vettoriale del carattere ottimizzato comprende la seguente informazione vettoriale:
i) DIN, un gruppo ordinato o mosaico di 27 valori di 3 bit che descrivono, in un formato normalizzato, le posizioni relative dei punti nel formato dei caratti STK.
ii) APPX, che è un gruppo ordinato di 27 vaio ri di 2 bit che descrivono, in un formato normalizzato, la posizione della coordinata X dei punti del formato STK dei caratteri rispetto alla coordinata X del primo e dell'ultimo punto del formato dei caratteri STK.
iii) APPY, che è un gruppo ordinato di 27 valori di 2 bit che descrivono la posizione della coordinata Y dei punti del formato STK dei caratteri rispetto alla coordinata Y del primo e dell'ultimo punto del formato dei caratteri STK.
I parametri DIN sono valutati nella maniera seguente. .
Le coordinate di un dato punto Pi nel formato STK sono date da (Xi.Yi) e le coordinate di quello successivo Pi+1 sono date da (X(i+1),Y(i+1)). Le caratteristiche dei precedenti sistemi per la determinazione delle condizioni penna-in-alto e penna-inbasso nella sequenza dei punti STK non vengono prese in considerazione, pertanto il seguente procedimento può essere applicato anche se i due punti appartengo no a diversi segmenti o tratti. Si supponga che DXi (DYi) sia la differenza fra le coordinate x(y) dei punti Pi e Pi+1. La lunghezza L del poligono che coj_ lega i punti Nstk viene valutata attraverso la formu la:
Poiché il numero dei parametri Din che debbono essere presi in considerazione è stato fissato (mediante vaste simulazioni) a 27, il peso dei punti Pi e Pi+1 è fornito da:
in cui Ni rappresenta la parte intera di Ni e R(i-l) rappresenta il resto della precedente iterazione. Se Ni=0, nessuna informazione relativa alla coppia di punti i,i+l viene inserita nel codice DIN. Al contrario, se NiT≤0, il codice DIN viene valutato attraverso il seguente flusso:
1 parametri DIN della coppia Pi,Pi+l vengono inseriti Ni volte nel codice DIN del carattere. Poiché i valori DIN sono compresi fra 0 e 7, un valore di 3 bit è necessario per rappresentare ciascuno di essi. Per esempio, se un carattere è costituito dai seguenti 5 punti:
si ottiene: e
Si noti che Pertanto, il codi ce DIN del carattere è dato da:
I parametri APPX e APPY rappresentano le pos_i_ zioni dei punti del formato dei caratteri STK rispet to al primo ed all'ultimo punto. Come precedentemente indicato, le coordinate di penna-in-alto e pennain-basso non vengono prese in considerazione.
si suppone che:
(Χi,Υi) siano le coordinate del punto corrente nel formato del caratterse STK,
(Χο,Υο) siano le coordinate del primo punto, (Χn,Υn) siano le coordinate dell'ultimo punto. Come per i parametri DIN, i valori di APPX e APPY relativi al punto Pi vengono valutati soltanto se N(i-1)≡0 e vengono ripetuti Ni volte. Essi sono ottenuti nel modo seguente:
mentre
Il numero dei valori di APPX e di APPY per ciascun carattere è 27, come per i parametri DIN. Poiché i possibili valori sono compresi fra 0 e 3 ed un valore 'di 2 bit è necessario per rappresentare ciascuno di essi, si richiedono 2*2*27=108 bit. Per esempio, il codice APP per il carattere nell'esempio precedente è:
in cu i ( Xo , Yo) = ( 3 , 6 ) e (Xn , Yn ) =(3 ,8 ) .
L'ultimo campo del codice di carattere conti£ ne l'informazione di grandezza del carattere divisa per la sua larghezza X{1 byte) e per la sua altezza Y(1 byte).
Pertanto, dopo il procedimento di codificazio ne, un dato carattere è rappresentato da un mosaico di 83 byte: 20 dalla estrazione delle caratteristiche, 30 dalla rivelazione delle microcaratteristiche, 1 per il numero dei trattini o segmenti, 1 per la po sizione del sottoquadro o cornice, 1 per l'identificatore dei caratteri (se disponibile), 27 per i par£ metri DIN, APPX e APPY, 2 per larghezza ed altezza. Un ulteriore byte è richiesto per tenere traccia del numero degli errori di riconoscimento dovuti ad un dato carattere di riferimento, come verrà spiegato nel seguito.
Il riconoscimento viene eseguito confrontando il codice del carattere di ingresso sconociuto con i caratteri codificati nel gruppo di riferimento avente lo stesso numero di posizione. I caratteri con nu meri di posizione diversi da quello del carattere di ingresso non vengono presi in considerazione durante il confronto. Ciò presenta due importanti vantaggi. In primo luogo, consente il riconoscimento dei carat teri con la stessa forma e con diversa posizione (per esempio "q" e "9"). In secondo luogo, il procedimento di riconoscimento è relativamente più rapido poiché implica un minor numero di confronti. Come M sultato, il punteggio Sj è dato da:
e viene assegnato al confronto fra il carattere di ingresso incognito e l'i-simo carattere nella base dati dei caratteri. Nell'equazione Sfj.Smj e Sdj sono rispettivamente: il punteggio di estrazione delle caratteristiche, il punteggio della rivelazione delle microcaratteristiche ed il punteggio dinamico, mentre Wf,Wm e Wd rappresentano i fattori di pondera zione che descrivono la loro importanza relativa.
In aggiunta, nell'equazione:
St = numero dei tratti del carattere di ingresso, Stj = numero dei tratti dell'j-simo carattere di r iferimento,
Ws .= peso del segmento,
X = larghezza del carattere di ingresso,
Xj = larghezza dell'j-simo carattere di riferimento ,
Wx = peso della larghezza,
Y = altezza del carattere di ingresso,
Yj = altezza dell'j-simo carattere di riferimento, Wy = peso dell'altezza.
Questo punteggio viene valutato per ciascuno dei Ncar caratteri di riferimento.
Il punteggio delle caratteristiche Sfj assegnato all'j-simo confronto (j=1 Ncar) è dato da:
in cui:
fi = risposta della i-sima caratteristica al carattere di ingresso,
fij = risposta della i-sima caratteristica a_l, l'j-simo carattere di riferimento.
La valutazione del codice delle microcaratteristiche Smj è data dalla formula:
in cui:
Rik (k=1,...5, i=1...15) rappresenta il codice delle microcaratteristiche del carattere di ingresso,
Rjik (k=1,...5, i=1...15) rappresenta il cod_i_ ce delle microcaratteristiche dell'j-simo carattere di riferimento,
P rappresenta il numero degli elementi Rik d_i_ versi da zero,
Pj rappresenta il numero degli elementi Rjik diversi da zero,
e M rappresenta la seguente matrice:
Il punteggio dei caratteri dinamici Sdj viene valutato mediante un confronto dei codici DIN e APPX/ APPY. Si supponga che i parametri DIN, PPX, PPY si r_i_ feriscano al carattere di ingresso ed i parametri DINj, APPXj, APPYj si riferiscano all'j-simo carattere del gruppo di riferimento. Il confronto viene eseguito nella maniera seguente. APPX[i], vale a dire l'i-simo elemento del gruppo APPX, viene confrontato con APPXj[i] e APPY[i] viene confrontato con APPXjCi] (i=1,...,27). Quindi, possono verificarsi quattro CJÌ si diversi:
a)
In questo caso, il risultato del confronto Cij è fornito dall'elemento collocato nella posizione (DIN[i],DINj[i]) della matrice:
b) APPX[i]MPPXj[i] APPY[i ]=APPYj[i]
In questo caso, il risultato del confronto Cij è fornito dall'elemento collocato nella posizione (DIN[i],DINj[i]) della matrice:
c ) APPX[ i ] =APPX j [ i ] APPY[ i ]≡ APPYj [ i ]
In questo caso, il risultato del confronto Cij è fornito dall'elemento collocato nella posizione (DIN[i],DINj[i]) della matrice:
d )
Il risultato del confronto è Cij=0.
Il risultato complessivo dei confronti è:
Una volta che Sfj, Smj e Sdj siano stati valutati, essi possono essere inseriti per calcolare Sj. Quindi, il punteggio complessivo Sj assegnato al coin fronto con l'j-simo carattere nella base di dati di riferimento viene valutato per ciascuno dei Ncar caratteri di riferimento. L'identificatore del carat tere di riferimento con il minimo punteggio viene a_s segnato al simbolo di ingresso incognito.
Il ruolo giocato dai parametri dimensionali X e Y è importante per il riconoscimento dei caratteri aventi la stessa forma e diversa grandezza. Per esem pio, vengono prese in considerazione le seguenti coppie di caratteri ambigui:
Se il carattere di ingresso incognito viene assegnato dal dispositivo di riconoscimento ad una delle coppie di cui sopra, viene eseguito un procedi mento di retroazione allo scopo di identificare accu ratamente il carattere ambiguo. Il peso dei fattori Wx e Wy viene aumentato, il riconoscimento viene rieseguito limitando il gruppo dei caratteri di riferimento ai simboli che appartengono alla coppia considerata. Ciò rende possibile distinguere i caratteri ambigui uno dall'altro, senza assegnare un peso trop po grande ai termini di grandezza nel flusso di rico noscimento principale.
Il ruolo giocato dai fattori di ponderazione Wf,Wm e Wd, come anche dai pesi dei segmenti o tratti e delle grandezze Ws,Wx e Wy è molto importante. Infatti, quanto più grandi sono i valori di Wf e Wm, tanto più importante è il peso dell'informazione ottica nel processo di riconoscimento. Un altro pararne tro importante è il peso dei segmenti o tratti Sw: quanto maggiore esso è, tanto più grande è l'influeri za del numero dei segmenti. Pertanto, in dipendenza dalla applicazione, è possibile ponderare l'importan za relativa della parte ottica e della parte dinamica dell'algoritmo mediante una regolazione di precisione di questi fattori. Per esempio, se l'algoritmo di riconoscimento viene usato per il riconoscimento dei caratteri giapponesi, che sono generalmente scritti con la stessa sequenza di tratti, il contributo dinamico diventa molto importante ed i pararnetri Wf e Wm dovrebbero essere inferiori a quelli usa ti per i caratteri romani. Similmente, Ws e Wd dovrebbero essere maggiori ed i pesi di grandezza Wx e Wy non dovrebbero essere usati, per certe applicazioni, questi fattori di ponderazione possono essere regolati dall'utente. 1 risultati delle simulazioni dimostrano che, per i caratteri romani, i valori migliori per i fattori di ponderazione sono Wf=4, Wm=1, Wd=5, Ws=72, Wx=3 e Wy=10. Quando la routine di retroazione viene applicata allo scopo di riconoscere caratteri ambigui, Wx viene posto a 10 e Wy viene po sto a 50. Per i caratteri giapponesi, i valori migliori sono Wf=4, Wm=1, Wd=8, Ws=100, mentre Wx=Wy=0. Per il riconoscimento dei disegni e dei simboli geometrici, l'algoritmo di riconoscimento deve essere puramente ottico. Ciò significa che Wd,Ws,Wy e Wx dovrebbero essere posti uguali a zero.
Se un simbolo scritto male viene inintenzionalmente inserito nella base dei dati, esso può degradare le conoscenze del sistema ed influenzare negativamente il comportamento del sistema in fase di riconoscimento. Per superare questo problema, ogni volta che un dato carattere nella base dei dati provoca un errore di riconoscimento ed un nuovo esempio viene introdotto nella serie di riferimento, il "sim bolo cattivo" viene marcato. Dopo un dato numero di marcature NM (tipicamente 3), il carattere viene classificato come un carattere fuorviante e viene automaticamente cancellato dalla base dei dati. Il valore NM viene memorizzato nell'84-simo byte dei co dice dei caratteri.

Claims (1)

  1. RIVENDICAZIONI I. Procedimento per riconoscere un carattere scritto a mano comprendente le operazioni di: inserire il carattere utilizzando mezzi di in serimento del carattere; digitalizzare il carattere; memorizzare il carattere digitalizzato; estrarre caratteristiche topologiche e caratteristiche vettoriali di detto carattere; estrarre le microcaratteristiche del carattere; determinare le dimensioni del carattere; confrontare le caratteristiche topologiche e vettoriali, le microcaratteristiche e le dimensioni del carattere con una serie di caratteristiche di riferimento equivalenti ad esso e memorizzate in una memoria, ciascuna delle serie corrispondendo ad un carattere specifico; e eseguire un procedimento logico per determina re quale delle serie di caratteristiche di riferirnen to più strettamente corrisponde alle caratteristiche topologiche, alle caratteristiche vettoriali, alle microcaratteristiche ed alle dimensioni del carattere digitalizzato, riconoscendo così il carattere scritto a mano 2. Procedimento seconda la rivendicazione 1, in cui la estrazione delle caratteristiche consiste nel11attribuire alle caratteristiche di topologia, vettoriali, microcaratteristiche e dimensioni un peso superiore alle altre in maniera predeterminata, in dipendenza dalla natura del carattere. 3. Procedimento secondo la rivendicazione 1 o la rivendicazione 2, in cui la estrazione delle mj_ crocaratteristiche del carattere consiste nell'ottenere informazioni ottiche relative alla natura del carattere in modo da produrre un codice rappresentativo delle microcaratteristiche. 4. Procedimento secondo una qualsiasi precedente rivendicazione, in cui la digitalizzazione del carattere consiste nel costruire una matrice di uni e di zeri ed una disposizione ordinata o mosaico di punti che sono rappresentativi del carattere. 5. Procedimento secondo la rivendicazione 4, ulteriormente consistente nell'esplorare la matrice rappresentativa del carattere per determinare un codice delle microcaratteristiche quando un pixel nero viene trovato in una riga della matrice che memorizza i pixel adiacenti nella riga sottostante e nello assegnare un codice indicativo dei pixel adiacenti. 6. Procedimento secondo la rivendicazione 3 ed una qualsiasi delle rivendicazioni 4 o 5 quando considerate dipendenti dalla rivendicazione 3, in cui il codice delle microcaratteristiche è dato da: in cui: Rik (k=1,...5} i=1...15) rappresenta il codice delle microcaratteristiche del carattere di ingresso, Rjik (k=1,...5, i=1...15) rappresenta il codice delle microcaratteristiche dell'j-simo carattere di riferimento, P rappresenta il numero degli elementi Rik diversi da zero, Pj rappresenta il numero degli elementi Rjik diversi da zero, e M rappresenta la seguente matrice: 7. Procedimento secondo la rivendicazione 5 o 6, in cui l'estrazione del codice vettoriale consiste nell'estrarre un codice indicativo del numero dei punti di detto carattere. 8. Procedimento secondo una qualsiasi delle rivendicazioni da 4 a 7, in cui l'estrazione del codice vettoriale consiste ulteriormente nell'estrarre un codice che descrive la posizione di ciascun punto del mosaico relativamente al punto precedente. 9. Procedimento secondo una qualsiasi precedente rivendicazione, in cui l'operazione di determi nazione delle dimensioni del carattere consiste nel determinare le dimensioni X e Y del carattere e nel determinare un punteggio dinamico e nell'eseguire una operazione di ponderazione su ciascuna delle dimensioni X e Y per permettere la differenziazione dei caratteri che presentano forme simili, ma diverse dimensioni. 10. Procedimento secondo una qualsiasi precedente rivendicazione, in cui l'operazione di inserimento consiste nell'appiicare il carattere in ingre_s so in una cornice o sottoquadro di un riquadro e nelrassegnare al carattere codici che dipendono dalla sua posizione in tale cornice. 11. Procedimento secondo una qualsiasi precedente rivendicazione, in cui la esecuzione del proce dimento logico consiste nel valutare un punteggio Sj per ciascuno dei caratteri di riferimento (Ncar) e nelI'identificare il carattere di riferimento con il minimo punteggio Sj come il carattere che è stato in serito in qualità di carattere manoscritto, in cui Sj è dato da: in cui: Sfj rappresenta il punteggio relativo alla estrazione'ideile caratteristiche, Smj rappresenta il punteggio relativo alla rivelazione delle microcaratteristiche, Sdj rappresenta il punteggio dinamico, Wf rappresenta il fattore di ponderazione per Sfj, Wm rappresenta il fattore di ponderazione per Smj, Wd rappresenta il fattore di ponderazione per Sdj, St rappresenta il numero dei segmenti o tratti del carattere di ingresso, Stj rappresenta il numero dei tratti dell'j-simo carattere di riferimento, Ws rappresenta il fattore di ponderazione dei segmenti, X rappresenta la larghezza del carattere di ingresso, Xj rappresenta la larghezza dell'j-simo carat tere di riferimento, Wx rappresenta il fattore di ponderazione della larghezza, Y rappresenta l'altezza del carattere di ingresso, Yj rappresenta l'altezza dell’j-simo carattere di riferimento, Wy rappresenta il fattore di ponderazione del l'altezza. 12. Apparecchio per riconoscere un carattere scritto a mano comprendente: mezzi di inserimento del carattere per inseri re e ricevere il carattere; mezzi di digitalizzazione per digitalizzare il carattere; mezzi di memorizzazione per memorizzare il ca_ rattere digitalizzato; mezzi di estrazione delle caratteristiche per estrarre le caratteristiche topologiche, le caratteristiche vettoriali, le microcaratteristiche e le caratteristiche dimensionali rappresentative di detto carattere; mezzi di confronto per confrontare le caratte ristiche estratte del carattere con una serie di ca ratteristiche di riferimento memorizzate in una memoria, ciascuna della serie corrispondendo ad un carat tere specifico; e mezzi logici per identificare quale delle serie di caratteristiche di riferimento più strettameli te corrisponde alle caratteristiche del carattere di gitalizzato, riconoscendo così il carattere scritto a mano. 13. Apparecchia secondo la rivendicazione 12, ulteriormente comprendente mezzi di ponderazione associati ai'mezzi di estrazione delle caratteristiche, capaci di impartire un diverso fattore di ponderazio ne a ciascuna di dette caratteristiche in maniera predeterminata che dipende dalla natura del carattere. 14. Apparecchio secondo la rivendicazione 13, in cui il fattore di ponderazione delle caratteristiche vettoriali è superiore al fattore di ponderazione delle caratteristiche topologiche per i caratteri giapponesi. 15. Apparecchio secondo la rivendicazione 13, in cui il fattore di ponderazione delle caratterista che vettoriali è inferiore al fattore di ponderazione delle caratteristiche topologiche per i caratteri romani. 16. Apparecchio secondo la rivendicazione 13, in cui le microcaratteristiche e le caratteristiche dimensionali sono usate per risolvere la identità dei caratteri che presentano caratteristiche simili. 17. Apparecchio secondo una qualsiasi delle rivendicazioni da 12 a 16, in cui i mezzi di estrazione delle caratteristiche comprendono mezzi genera tori di codice per generare una pluralità di codici indicativi delle caratteristiche. 18. Apparecchio secondo una qualsiasi delle rivendicazioni da 12 a 17, in cui i mezzi di confronto comparano i codici della serie di riferimento ed il codice del carattere di ingresso. 19. Apparecchio secondo una qualsiasi delle rivendicazioni da 12 a 18, in cui i mezzi logici valutano un punteggio Sj per ciascun carattere di riferimento (Nd) ed identificano il carattere di riferimento con il punteggio minimo come quello corrispondente al carattere manoscritto, in cui Sj è dato da: in cui: Sfj rappresenta il punteggio relativo alla estrazione delle caratteristiche, Smj rappresenta il punteggio relativo alla ri velazione delle microcaratteristiche, Sdj rappresenta il punteggio dinamico, Wf rappresenta il fattore di ponderazione per Sfj, Wm rappresenta il fattore di ponderazione per Smj, Wd rappresenta il fattore di ponderazione per Sdj, St rappresenta il numero dei segmenti o tratti del carattere di ingresso, Stj rappresenta il numero dei tratti dell'j-si_ mo carattere di riferimento, Ws rappresenta il fattore di ponderazione dei segmenti, X rappresenta la larghezza del carattere di ingresso, Xj rappresenta la larghezza dell'j-simo carattere di riferimento, Wx rappresenta il fattore di ponderazione della larghezza, Y rappresenta l'altezza die carattere di ingresso, Yj rappresenta l'altezza dell'j-simo carattere di riferimento, Wy rappresenta il fattore di ponderazione del l'altezza. 20. Apparecchio secondo una qualsiasi delle rivendicazioni da 12 a 19, in cui una interfaccia è fornita fra l'apparecchio ed un calcolatore, in modo tale che l'interfaccia lasci passare ilcarattere identificato verso il calcolatore, formando così parte delle istruzioni del calcolatore. 21. Prodotto a base di un calcolatore comprerà dente un apparecchio secondo una qualsiasi delle rivendicazioni da 12 a 20 ed una interfaccia fra l'apparecchio ed il calcolatore per far passare al calco latore le istruzioni provenienti dall'apparecchio.
ITRM940338A 1994-05-30 1994-05-30 Procedimento ed apparecchio per il riconoscimento dei caratteri IT1272259B (it)

Priority Applications (5)

Application Number Priority Date Filing Date Title
ITRM940338A IT1272259B (it) 1994-05-30 1994-05-30 Procedimento ed apparecchio per il riconoscimento dei caratteri
DE69526285T DE69526285T2 (de) 1994-05-30 1995-05-26 Zeichenerkennung
EP95303614A EP0689153B1 (en) 1994-05-30 1995-05-26 Character recognition
JP7132296A JPH08161429A (ja) 1994-05-30 1995-05-30 文字を認識するための方法および装置
US08/454,450 US5673337A (en) 1994-05-30 1995-05-30 Character recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ITRM940338A IT1272259B (it) 1994-05-30 1994-05-30 Procedimento ed apparecchio per il riconoscimento dei caratteri

Publications (3)

Publication Number Publication Date
ITRM940338A0 ITRM940338A0 (it) 1994-05-30
ITRM940338A1 true ITRM940338A1 (it) 1995-11-30
IT1272259B IT1272259B (it) 1997-06-16

Family

ID=11402566

Family Applications (1)

Application Number Title Priority Date Filing Date
ITRM940338A IT1272259B (it) 1994-05-30 1994-05-30 Procedimento ed apparecchio per il riconoscimento dei caratteri

Country Status (5)

Country Link
US (1) US5673337A (it)
EP (1) EP0689153B1 (it)
JP (1) JPH08161429A (it)
DE (1) DE69526285T2 (it)
IT (1) IT1272259B (it)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3792755B2 (ja) * 1995-08-29 2006-07-05 キヤノン株式会社 文字認識方法及び装置
US5909509A (en) * 1996-05-08 1999-06-01 Industrial Technology Research Inst. Statistical-based recognition of similar characters
GB9701793D0 (en) * 1997-01-29 1997-03-19 Gay Geoffrey N W Means for inputting characters or commands into a computer
JP3525997B2 (ja) * 1997-12-01 2004-05-10 富士通株式会社 文字認識方法
CN1343337B (zh) 1999-03-05 2013-03-20 佳能株式会社 用于产生包括音素数据和解码的字的注释数据的方法和设备
US6882970B1 (en) 1999-10-28 2005-04-19 Canon Kabushiki Kaisha Language recognition using sequence frequency
GB9925562D0 (en) * 1999-10-28 1999-12-29 Canon Kk Pattern matching method and apparatus
US7310600B1 (en) 1999-10-28 2007-12-18 Canon Kabushiki Kaisha Language recognition using a similarity measure
WO2001031627A2 (en) 1999-10-28 2001-05-03 Canon Kabushiki Kaisha Pattern matching method and apparatus
US6640337B1 (en) 1999-11-01 2003-10-28 Koninklijke Philips Electronics N.V. Digital television (DTV) including a smart electronic program guide (EPG) and operating methods therefor
US7295193B2 (en) * 1999-12-23 2007-11-13 Anoto Ab Written command
GB0011798D0 (en) 2000-05-16 2000-07-05 Canon Kk Database annotation and retrieval
GB0015233D0 (en) 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
GB0023930D0 (en) 2000-09-29 2000-11-15 Canon Kk Database annotation and retrieval
GB0027178D0 (en) 2000-11-07 2000-12-27 Canon Kk Speech processing system
GB0028277D0 (en) 2000-11-20 2001-01-03 Canon Kk Speech processing system
US6721452B2 (en) 2001-09-12 2004-04-13 Auburn University System and method of handwritten character recognition
CN1987963A (zh) * 2005-12-21 2007-06-27 群康科技(深圳)有限公司 平面显示器及其屏幕显示控制方法
US7945119B2 (en) * 2007-06-26 2011-05-17 Microsoft Corporation Optimizing character rendering
KR101214772B1 (ko) * 2010-02-26 2012-12-21 삼성전자주식회사 문자의 방향성을 기반으로 한 문자 인식 장치 및 방법
GB2531551A (en) * 2014-10-21 2016-04-27 Ibm Generating a computer executable chart visualization by annotating a static image of said visualization

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4972496A (en) 1986-07-25 1990-11-20 Grid Systems Corporation Handwritten keyboardless entry computer system
US4850026A (en) * 1987-10-13 1989-07-18 Telecommunications Laboratories Dir. Gen'l Of Telecom. Ministry Of Communications Chinese multifont recognition system based on accumulable stroke features
EP0548030B1 (en) * 1991-12-19 1998-09-30 Texas Instruments Incorporated Character recognition
US5515455A (en) * 1992-09-02 1996-05-07 The Research Foundation Of State University Of New York At Buffalo System for recognizing handwritten words of cursive script
US5454046A (en) * 1993-09-17 1995-09-26 Penkey Corporation Universal symbolic handwriting recognition system

Also Published As

Publication number Publication date
ITRM940338A0 (it) 1994-05-30
EP0689153B1 (en) 2002-04-10
JPH08161429A (ja) 1996-06-21
DE69526285T2 (de) 2002-10-31
US5673337A (en) 1997-09-30
DE69526285D1 (de) 2002-05-16
EP0689153A2 (en) 1995-12-27
IT1272259B (it) 1997-06-16
EP0689153A3 (en) 1997-05-02

Similar Documents

Publication Publication Date Title
ITRM940338A1 (it) Procedimento ed apparecchio per il riconoscimento dei caratteri
JP4787275B2 (ja) セグメント化ベースの認識
JP2669575B2 (ja) データ入力方法及び装置
KR100297482B1 (ko) 수기입력의문자인식방법및장치
CN110178139B (zh) 使用具有注意力机制的全卷积神经网络的字符识别的系统和方法
JP2008532176A (ja) 認識グラフ
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
JP4936513B2 (ja) 画像処理装置、画像処理方法、サイン登録プログラム及び記憶媒体
JP3480404B2 (ja) 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
SE519014C2 (sv) Metod och anordning för igenkänning av ett handskrivet mönster
KR20000057730A (ko) 문자 분할 사용자 인터페이스를 갖춘 수기 정보 처리 시스템
EP0546343A2 (en) Diagram recognizing system
CN112784531B (zh) 一种基于深度学习和部件拼接的中文字形及字库生成方法
CN114730241B (zh) 触摸式用户界面输入中的手势笔画识别
ITRM930179A1 (it) Apparecchio e procedimento per il riconoscimento di caratteri manoscritti.
KR20100010396A (ko) 터치스크린상의 문자입력장치 및 필기인식시스템
JP2014092817A (ja) 文字認識装置及びプログラム
JPH0557598B2 (it)
JP3128357B2 (ja) 文字認識処理装置
JPS60217483A (ja) 文字認識装置
JP4442136B2 (ja) 文字認識方法および装置
JPH10208023A (ja) 手話認識装置
Kherallah et al. Toward an On-Line Handwriting Recognition System Based on Visual Coding and Genetic Algorithm
CN116945762A (zh) 丝网印刷的智能化调控方法及其系统
KR101276281B1 (ko) 터치스크린을 가진 전자기기의 한글 인식 장치 및 한글 인식 방법

Legal Events

Date Code Title Description
0001 Granted