SE521911C2 - Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken - Google Patents

Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken

Info

Publication number
SE521911C2
SE521911C2 SE0100114A SE0100114A SE521911C2 SE 521911 C2 SE521911 C2 SE 521911C2 SE 0100114 A SE0100114 A SE 0100114A SE 0100114 A SE0100114 A SE 0100114A SE 521911 C2 SE521911 C2 SE 521911C2
Authority
SE
Sweden
Prior art keywords
handwritten character
character
reference characters
determining
handwritten
Prior art date
Application number
SE0100114A
Other languages
English (en)
Other versions
SE0100114D0 (sv
SE0100114L (sv
Inventor
Anders Holtsberg
Original Assignee
Decuma Ab Ideon Res Park
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Decuma Ab Ideon Res Park filed Critical Decuma Ab Ideon Res Park
Priority to SE0100114A priority Critical patent/SE521911C2/sv
Publication of SE0100114D0 publication Critical patent/SE0100114D0/sv
Priority to TW090102405A priority patent/TW573280B/zh
Priority to JP2002556828A priority patent/JP2004518198A/ja
Priority to US10/466,087 priority patent/US7349576B2/en
Priority to PCT/SE2002/000037 priority patent/WO2002056242A1/en
Priority to CN028036778A priority patent/CN1488120B/zh
Publication of SE0100114L publication Critical patent/SE0100114L/sv
Publication of SE521911C2 publication Critical patent/SE521911C2/sv

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

15 20 25 30 35 521 911 2 handskrivna tecknet måste jämföras med ett mycket stort antal referenstecken när igenkänning av ett kinesiskt tecken utförs, blir igenkänningen långsam.
Enligt US 4 284 975 beräknas skillnader i koordina- ter mellan punkter på det handskrivna tecknet och punkter på referenstecknet. Dessa skillnader används för beräk- ning av ett avständsmàtt mellan punkterna.
Idag beräknas skillnaderna i åtminstone två steg.
Två egenskaper som definierar en punkt kan vara lagrade i olika områden för enkel åtkomst till värdet för en egen- skap genom hänvisning till det register där det är lagrat. En beräkning av en skillnad mellan två punkter utförs då i två subtraktioner för att jämföra de två egenskaperna hos punkterna. I dessa subtraktioner kan hänvisning göras direkt till de register som håller värdena för egenskaperna. Detta innebär emellertid att mycket minne behövs eftersom de två egenskaperna lagras separat. En annan metod är att komprimera värdena för de två egenskaperna för lagring av varje punkt separat.
Detta innebär att mindre minne krävs men egenskaperna hos punkten måste dekomprimeras innan beräkning av skillnaderna i egenskaper utförs. Detta ger en långsammare metod.
Sammanfattning av uppfinningen Det är ett ändamål med uppfinningen att tillhanda- hålla en snabbare metod för igenkänning av handskrivna tecken. Ändamålet med uppfinningen uppnås genom en metod för igenkänning av ett handskrivet tecken. Metoden innefattar stegen att bestämma ett flertal positionssärdrag som definierar det handskrivna tecknet och jämföra det hand- skrivna tecknet med referenstecken, som är lagrade i en databas, hittas. Steget att jämföra innefattar stegen att beräkna så att det bäst överensstämmande referenstecknet en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett 10 15 20 25 30 35 521 911 3 av referenstecknen och bestämma, genom uppslagning i en fördefinierad tabell, ett avstàndsmätt som är baserat pä den beräknade skillnaden. Steget att jämföra innefattar vidare stegen att upprepa stegen att beräkna en skillnad och bestämma ett avständsmàtt för vart och ett av fler- talet av positionssärdrag hos det handskrivna tecknet och beräkna en kostnadsfunktion, som är baserad på de bestäm- da avstàndsmàtten.
Den uppfinningsenliga metoden är baserad på insikten att en snabb metod för igenkänning av ett handskrivet tecken kräver att jämförelsen som skall utföras mellan det handskrivna tecknet och ett stort antal referens- tecken är snabb. Om steget att jämföra således snabbas upp kommer hela igenkänningsmetoden att bli mycket snabbare. Steget att jämföra tecken innefattar steget att jämföra flera positionssärdrag hos tecknen. Enligt upp- finningen utförs jämförelsen av positionssärdrag mycket snabbt. Steget att jämföra ett positionssärdrag hos det handskrivna tecknet med ett positionssärdrag hos ett referenstecken innefattar en tabelluppslagning för bes- tämning av ett avstàndsmàtt mellan positionssärdragen.
Denna tabelluppslagning är snabbare än en faktiskt beräk- ning av ett avstàndsmàtt. Varje jämförelse av det hand- skrivna tecknet med ett referenstecken blir således mycket snabbare och en liten ökning i hastigheten för jämförelse av positionssärdrag resulterar i en betydligt snabbare metod för igenkänning av ett handskrivet tecken.
Positionssärdragen definierar det handskrivna tecknet. Positionssärdragen är företrädesvis punkter och/eller vektorer i det handskrivna tecknet. Vektorerna kan exempelvis beskriva en rät linje mellan tvà punkter på tecknet eller en derivata i en punkt hos tecknet. Det handskrivna tecknet kan naturligtvis också definieras av någon kombination av punkter och vektorer.
Avståndsmàttet är en funktion av skillnaden mellan ett positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos referenstecknet. Denna funktion 10 15 20 25 30 35 521 '911 4 måste inte vara särskilt komplex. Avståndsmåttet bestäms ändå snabbare genom en tabelluppslagning än genom en faktisk beräkning. I denna uppfinnings sammanhang defi- nieras ordet ”tecken” som vilken symbol som helst som kan skrivas. I vissa fall kan ett tecken vara en del av en sådan symbol eller en kombinerad struktur av sådana symboler.
Varje positionssärdrag definieras företrädesvis av åtminstone två egenskaper. Steget att beräkna en skillnad mellan ett positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos referenstecknet innefattar beräkningen av en skillnad mellan varje egenskap hos det handskrivna tecknets positionssärdrag och motsvarande egenskap hos referenstecknets positionssärdrag. Två egen- skaper behövs normalt för att definiera ett positions- särdrag, såsom en X- och en y-koordinat för en punkt eller en x- och en y-riktning för en vektor. Vid bestäm- ning av ett avståndsmått behövs skillnaderna för båda egenskaperna för de jämförda positionssärdragen så att båda egenskaperna bidrar till avståndsmåttet.
Enligt en föredragen utföringsform av uppfinningen utförs steget att beräkna en skillnad för varje egenskap i en enda operation. Metoden enligt uppfinningen beräknar skillnaderna för egenskaperna genom lagring av egenskap- erna för varje positionssärdrag i en enda datapost och använder kännedom om vilka bitar i dataposten som repre- senterar varje egenskap för beräkning av skillnaderna.
Positionssärdragen kan således vara lagrade i ett litet minnesutrymme och förutom det snabba steget att bestämma ett avståndsmått är steget att beräkna skillnaderna mycket snabbt, eftersom endast en maskinkodsoperation behövs för beräkningen av skillnaden i positionssärdrag.
Steget att bestämma positionssärdrag innefattar företrädesvis ett steg att bestämma ett läge för posi- tionssärdraget i ett rutnät. Det handskrivna tecknets positionssärdrag kan därigenom enkelt jämföras med mot- svarade positionssärdrag hos referenstecknen. 10 15 20 25 30 35 521 911 5 I en föredragen utföringsform innefattar positions- särdragen hos det handskrivna tecknet och referenstecknen koordinater för jämförelsepunkter. Specifika jämförelse- punkter hos det handskrivna tecknet kan således jämföras med fördefinierade jämförelsepunkter hos referenstecknen sä att ett överensstämmande referenstecken skall hittas.
Steget att bestämma positionssärdrag innefattar företrädesvis steget att bestämma en x-koordinat och en y-koordinat för jämförelsepunkten i ett rutnät. Därigenom beskrivs positionen för en jämförelsepunkt enkelt med tvä egenskaper.
I en föredragen utföringsform är rutnätet av en storlek pà 16 x 16 positioner och koordinaterna för en jämförelsepunkt representeras av en databyte. Denna rut- nätstorlek är optimal för otvetydig representation av kinesiska tecken och för lagring av en position för en jämförelsepunkt i ett litet minnesutrymme.
Avstàndsmáttet som erhålls från tabelluppslagningen i den fördefinierade tabellen är företrädesvis en funk- tion av det euklidiska avståndet mellan jämförelsepunkten hos det handskrivna tecknet och en jämförelsepunkt hos referenstecknet. Det euklidiska avståndet ger ett jämnt v-riktat mätt för skillnaden i X- och y-riktningarna.
Funktionen skulle kunna vara det kvadrerade euklidiska avståndet, vilket ger ett heltalsresultat om de inmatade skillnaderna är heltal.
I en annan utföringsform innefattar positionssär- dragen hos det handskrivna tecknet och referenstecknen positioner och riktningar för jämförelsevektorer. Jäm- förelsevektorerna kan också vara kombinerade med jäm- förelsepunkter för definiering av tecknen. När positions- särdragen innefattar jämförelsevektorer jämförs riktning- arna hos bägar i det handskrivna tecknet med motsvarande jämförelsevektorer hos referenstecknen, vilka jämförelse- vektorer definierar riktningen för bågar i referens- tecknen. 10 15 20 25 30 35 521911 6 I denna utföringsform är avstàndsmättet som erhålls från tabelluppslagningen i den fördefinierade tabellen en funktion av en skillnad mellan krökningar för det hand- skrivna tecknet och referenstecknen. Detta innebär att derivatorna för bàgarna jämförs.
Företrädesvis innefattar metoden vidare steget att centrera det handskrivna tecknet i rutnätet innan steget att bestämma positionssärdragen hos det handskrivna tecknet utförs. Som ett resultat tas hänsyn till en för- skjutning av det handskrivna tecknets position och posi- tionen anpassas till positioneringen för referenstecknen.
Därigenom kan det handskrivna tecknet skrivas pä vilken plats som helst där dektering av skriften är aktiv.
Med fördel innefattar metoden vidare steget att skala det handskrivna tecknet till en normaliserad stor- lek i enlighet med storleken för referenstecknen innan steget att bestämma det handskrivna tecknets positions- särdrag utförs. Således är inte det handskrivna tecknets storlek avgörande för igenkänning.
I en föredragen utföringsform innefattar metoden vidare steget att bestämma antalet bågar som bildar det handskrivna tecknet. Detta är ett sätt att klassificera tecknet sà att jämförelse av det handskrivna tecknet med varenda referenstecken undviks.
Steget att jämföra det handskrivna tecknet med refe- renstecken innefattar företrädesvis steget att inled- ningsvis jämföra det handskrivna tecknet med referens- tecken som är bildade av samma antal bägar. Som ett resultat jämförs det handskrivna tecknet inledningsvis med referenstecken som har störst sannolikhet att vara det bäst överensstämmande referenstecknet.
Dessutom innefattar företrädesvis steget att jämföra vidare steget att jämföra det handskrivna tecknet med referenstecken som är bildade av nägra fä bågar färre än den handskrivna tecknet, sä att felaktig ihopslagning av bàgarna tilläts. Det är inte ovanligt att tvà bàgar slàs ihop pà grund av att skrivaren inte lyfter pennan när han 10 15 20 25 30 35 521 911 7 borde. Detta arrangemang innebär att det korrekta bäst överensstämmande referenstecknet skall hittas även om skrivaren felaktigt slår ihop två bågar.
Därutöver innefattar företrädesvis steget att jäm- föra vidare steget att jämföra det handskrivna tecknet med referenstecken som är bildade av några fä bågar fler än det handskrivna tecknet, så att felaktigt lyftande av en penna tilläts. Detta arrangemang innebär att referens- tecknet skall hittas även om skrivaren felaktigt lyfter pennan i en båge.
I en annan föredragen utföringsform jämförs en båge hos det handskrivna tecknet med en motsvarande båge hos referenstecknet, varvid de motsvarande bàgarna bestäms genom den ordning i vilken bàgarna hos det handskrivna tecknet dragits. Referenstecknens motsvarande positions- särdrag relateras således enkelt till de positionssärdrag hos de handskrivna tecknet som de svarar mot. Detta är speciellt användbart för kinesiska tecken, eftersom dessa har ett speciellt schema för den ordning i vilken bågar skall dras. Det innebär att en skicklig skrivare av kine- siska tecken sällan drar bàgar hos ett tecken i fel ordning.
Metoden innefattar företrädesvis vidare steget att omorganisera ordningen för bàgarna i det handskrivna tecknet, så att dragning av bàgarna i felaktig ordning tillåts. Detta arrangemang gör det möjligt att hitta ett korrekt, bäst överensstämmande referenstecken även om skrivaren drar bàgarna i tecknet i felaktig ordning.
I en föredragen utföringsform innefattar metoden vidare steget att beräkna en affin transformation av det handskrivna tecknet för kompensering för möjlig lutning av det handskrivna tecknet och därefter jämföra det transformerade tecknet med databasens referenstecken.
Detta arrangemang resulterar i att det korrekta, bäst överensstämmande referenstecknet kan hittas även om skrivaren drar ett lutande tecken. lO 15 20 25 30 35 Ändamålet med uppfinningen uppnås också genom en anordning för igenkänning av ett handskrivet tecken och för omvandling av detta till ett digitalt format. Anord- ningen innefattar organ för bestämmande av ett flertal positionssärdrag, som definierar det handskrivna tecknet, en databas, som innefattar referenstecken, och organ för jämförelse av det handskrivna tecknet med referenstecken hos databasen så att det bäst överensstämmande referens- tecknet hittas. Organet för jämförelse innefattar organ för beräkning av en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av referenstecknen och en för- definierad tabell, vilken definierar ett avståndsmått som är baserat på skillnaderna i positionssärdrag. Organet för jämförelse innefattar vidare organ för bestämning av ett avståndsmått genom uppslagning i den fördefinierade tabellen och organ för beräkning av en kostnadsfunktion, som är baserad pà de bestämda avstàndsmåtten.
En sådan anordning skulle kunna användas för inmat- ning av text till en datahanteringsanordning och således ersätta eller komplettera tangentborden. Tabelluppslag- ning enligt uppfinningen gör igenkänningen av handskrivna tecken mycket snabb. Således kan irriterande väntetider elimineras. Ändamålet med uppfinningen uppnås också av ett datorprogram enligt krav 22.
Kort beskrivning av ritningarna Föreliggande uppfinning kommer nu i exemplifierande syftet att beskrivas mer i detalj under hänvisning till bifogade ritningar.
Fig l visar ett handskrivet tecken och ett överens- stämmande referenstecken.
Fig 2 är ett flödesschema över en användares inter- aktion med en anordning som realiserar metoden enligt uppfinningen. lO 15 20 25 30 35 521 911 . . . , ,, 9 Fig 3 är ett flödesschema över förbehandlingen av ett handskrivet tecken innan den faktiska igenkänningen utförs.
Fig 4 är ett flödesschema över processen att jämföra ett handskrivet tecken med ett referenstecken.
Fig 5 är ett flödesschema som beskriver den ordning i vilken det handskrivna tecknet jämförs med referens- tecknen.
Fig 6 är ett flödesschema över processen att jämföra en affin transformation av det handskrivna tecknet med referenstecknen.
Pig 7 visar en anordning som realiserar metoden enligt uppfinningen.
Detaljerad beskrivning av en föredragen utföringsform av uppfinningen I fig 1 visas ett handskrivet tecken 1 (tjocka, gråa linjer) och ett referenstecken 2 (tunna, svarta linjer), vilka är placerade i ett rutnät 3. Det handskrivna tecknet 1 består av flera bågar 4. Placeringen i rutnätet 3 för start- 5 och ändpunkter 6 för varje båge 4 är markerade. Bàgarnas 4 start- 5 och ändpunkter 6 används företrädesvis som positionssärdrag hos det handskrivna tecknet 1. Deras x- och y-koordinater i rutnätet 3 definierar positionssärdragen. Ett annat koordinatsystem skulle naturligtvis kunna användas, såsom ett polärt koordinatsystem. Ytterligare positionssärdrag hos det handskrivna tecknet 1 skulle kunna vara en vektor från startpunkten 5 till ändpunkten 6 hos varje båge 4 eller ytterligare punkter pà bàgarna 4 mellan start- 5 och ändpunkterna 6. Det handskrivna tecknet 1 jämförs med referenstecknet 2 genom jämförelse av positionssärdragen hos det handskrivna tecknet 1 med positionssärdragen hos referenstecknet 2, såsom kommer att beskrivas mer i detalj nedan.
Med hänvisning till fig 2-6 kommer nu en föredragen metod för igenkänning av ett handskrivet tecken att lO 15 20 25 30 35 521 911 lO beskrivas. Följande beskrivning kommer att göras med hänvisning till ett skrivet tecken pä ett tryckkänsligt område, varpå omedelbar teckenigenkänning utförs. Såsom kommer att framhållas senare skulle metoden emellertid också kunna tillämpas på ett handskrivet tecken pà en bit papper, vilket tecken senare läses in till ett digitalt format.
Hänvisning görs till fig 2, i vilken en användares agerande för inmatning av tecken för hand beskrivs. Ett tecken skrivs manuellt, steg 10, pà ett tryckkänsligt område för igenkänning och omvandling till ett digitalt format. Det tryckkänsliga området är en inmatningsenhet, som är kopplad till en datahanteringsanordning, såsom en dator, en PDA eller en mobiltelefon. Användaren skriver på det tryckkänsliga området genom att använda ett spet- sigt objekt, härefter kallat en penna, för anbringande av tryck i området. Ett tecken består av åtminstone en bàge, d v s en linje som dragits utan att lyfta pennan. Använ- daren drar bågarna som bildar tecknet. När ett helt tecken har inmatats indikerar användaren detta, steg 12, till datahanteringsanordningen, som sedan kommer att jämföra det handskrivna tecknet med referenstecken sä att det bäst överensstämmande tecknet hittas. Det finns andra sätt för datahanteringsanordningen att få reda pà att ett helt tecken har inmatats, t ex skulle en tidsutlösning av ingen aktion från användaren kunna indikera detta. De bäst överensstämmande tecknen kommer sedan att presen- teras för användaren, som kommer att svara på om det Användaren kan det korrekta tecknet presenteras, steg 14. acceptera, steg 16, eller kassera, steg 18, föreslagna tecknet.
Med hänvisning till fig 3 kommer nu databehandlingen av det handskrivna tecknet att beskrivas mer i detalj.
När ett handskrivet tecken inmatas, steg 20, samplas för defi- niering av det handskrivna tecknet. Dessa punkter bestäms punkter pà det handskrivna tecknet, steg 22, företrädesvis av deras x- och y-koordinater i ett rutnät. 10 15 20 25 30 35 521 911 ---- ~ ll Punkterna används senare för jämförelse av det hand- skrivna tecknet med referenstecken. Efter steget att sampla, steg 22, förbehandlas det inmatade handskrivna tecknet för korrigering av felaktigt läge eller storlek hos det handskrivna tecknet.
Förbehandlingen innefattar steget att centrera, steg 24, det handskrivna tecknet i rutnätet och steget att skala, steg 26, det handskrivna tecknet till en normali- serad storlek. Dessa steg 24-26 utförs enligt följande.
Först bestäms medelvärdena för x- och y-koordinaterna för alla samplade punkter. Sedan subtraheras X- och y-medel- värdena från koordinaterna för de samplade punkterna, varvid masscentrum för det handskrivna tecknet placeras i origo. Därefter normaliseras standardavvikelsen för avståndet från de samplade punkterna till masscentret.
Denna storlek motsvarar storleken för referenstecknen.
Slutligen flyttas det handskrivna tecknet till rutnätets centrum. De samplade punkterna bestäms företrädesvis med högre upplösning än den upplösning som används under processen att jämföra det handskrivna tecknet med refe- renstecknen. Skalningen av tecknet skulle då kunna inne- fatta ändring av upplösningen, vilket innebär att värdena för x- och y-koordinaterna delas med förhållandet mellan upplösningarna.
Det handskrivna tecknet är bildat av bågar, d v s linjer som dragits utan att lyfta pennan. Varje båge samplas och positionssärdrag bestäms. Samplingen skulle kunna detektera ett positionssärdrag vid specifika inter- vall varvid läget för pennan vid denna tidpunkt bestämmer positionssärdraget. Alternativt bestäms start- och änd- positionerna för bågen. En ytterligare position bestäms genom beräkning av vilken punkt på bàgen som avviker mest från en rät linje mellan start- och ändpositionen. Ytter- ligare flera positioner skulle kunna bestämmas på samma sätt. Ett positionssärdrag hos det handskrivna tecknet kan vara koordinater för en samplad punkt. Det skulle alternativt kunna vara en riktningsvektor mellan två 10 15 20 25 30 521 911 :f-f:-¿~ l2 intilliggande, samplade punkter eller en krökningsvektor, vilken definierar skillnaden i riktning mellan två intil- liggande riktningsvektorer.
Bågarna listas i enlighet med den ordning i vilken de dras. Det handskrivna tecknets första båge jämförs sedan med den första bågen i referenstecknet och så vidare. Detta är speciellt användbart för kinesiska tecken, eftersom bàgordningen är entydig. Om bågarna dras i fel ordning skulle detta emellertid kunna tas hänsyn till genom omblandning av bågarnas ordning. Omblandningen skulle kunna utföras genom jämförelse av varje båge hos det handskrivna tecknet med varje båge hos referensteck- net och bestämning av vilken båge som bäst överensstämmer med varje båge hos det handskrivna tecknet.
Det handskrivna tecknet representeras av ett flertal positionssärdrag. Dessa positionssärdrag skulle kunna innefatta koordinater för samplade punkter, riktnings- vektorer, krökningsvektorer eller någon kombination av dessa. Det handskrivna tecknets positionssärdrag jämförs med positionssärdrag hos referenstecknen så att det bäst överensstämmande referenstecknet hittas. Referenstecknens positionssärdrag är fördefinierade och representerar samma egenskaper som de positionssärdrag som extraheras från det handskrivna tecknet. Det är emellertid inte nödvändigt att det finns ett motsvarande positionssärdrag för varje positionssärdrag hos det handskrivna tecknet.
Ett positionssärdrag hos referenstecknet skulle kunna användas för jämförelse med två eller flera positions- särdrag hos det handskrivna tecknet eller vice versa.
Bågarna behöver varierande antal positionssärdrag för att vara väldefinierade. Således skulle tre positionssärdrag hos det handskrivna tecknet kunna jämföras med fyra posi- I detta fall är det nödvändigt att bestämma vilka positionssärdrag hos refe- tionssärdrag hos ett referenstecken. renstecknet som motsvarar positionssärdrag hos det hand- skrivna tecknet. Detta innebär att de tre positions- särdrag hos referenstecknet som skiljer sig minst från lO 15 20 25 30 35 521 911 13 det handskrivna tecknets positionssärdrag skulle kunna väljas som motsvarande positionssärdrag för referens- tecknet. Alternativt skulle ett positionssärdrag hos det handskrivna tecknet kunna tilldelas två motsvarande posi- tionssärdrag och tvà avständsmàtt skulle kunna beräknas för detta positionssärdrag.
I en föredragen utföringsform innefattar positions- särdrag jämförelsepunkter för tecknen. Positionerna för jämförelsepunkterna i rutnätet bestäms av deras x- och y- koordinater. Rutnätet innefattar företrädesvis 16 x 16 kvadrater och således kan en jämförelsepunkt represen- teras av en byte data eftersom 4 bitar behövs för x- respektive y-koordinaterna.
Med hänvisning till fig 4 kommer nu jämförelsen av det handskrivna tecknet med referenstecken att beskrivas mer i detalj. Referenstecknen lagras som information om deras motsvarande positionssärdrag i en databas i data- hanteringsanordningen. Varje jämförelsepunkt hos det handskrivna tecknet jämförs med en motsvarande jämförel- sepunkt hos referenstecknet. Detta àstadkommes genom mellan jämförelsepunkt- beräkning av skillnaden, steg 30, erna, d v s subtraktion av värdet för X- och y-koordinat- erna för den motsvarande jämförelsepunkten hos referens- tecknet fràn värdet för x- och y-koordinaterna för jäm- förelsepunkten hos det handskrivna tecknet. Skillnaderna används sedan som indata för uppslagning av ett avstånds- mätt, som helst med formen steg 32, i en fördefinierad tabell. Vilken funktion f(Xa-Xb)+(Ya-Yb) där f och är jämförelsepunkten hos det skulle kunna användas som avstàndsmàttet, g är funktioner och (xa,yg handskrivna tecknet och (xb,y¿ förelsepunkten hos referenstecknet. är den motsvarande jäm- (Xæya) och skulle naturligtvis i stället kunna representera Särdragen (Xwyb) en riktningsvektor eller en krökningsvektor. lO 15 20 25 30 35 521 911 14 I den föredragna utföringsformen definierar tabellen avstàndsmàttet som det kvadrerade euklidiska avståndet mellan punkterna, d v s tabellen ger resultatet av (Xa"Xb) 2+ (Ya'Yb) 2 - Detta ger ett positivt värde för alla avstånd och ger vidare ett heltalsresultat om de två skillnaderna är heltal.
Koordinaterna för en jämförelsepunkt lagras i (Xfnya) en byte data. X-koordinaten lagras i databytens första nybble, lagras i följande nybble. d v s de första fyra bitarna, och y-koordinaten (Ya'Yb) efter- (xa-xb) och skulle då kunna beräknas simultant i en operation, Skillnaderna som lagringspositionerna för x- och y-värdena är kända. (ya-yb) och används som indata för den fördefinierade tabellen.
Skillnaderna (xíøg) och representeras i nio bitar Nämnda första nybble, d v s de första fyra bitarna, rep- resenterar skillnaden (xa-xb) och nämnda följande nybble (ya'yb) - indikatorbit som indikerar om skillnaden i y-koordinater- representerar skillnaden Den nionde biten är en na är negativ. För X-koordinaterna antas det att en skillnad på mer än àtta X-steg aldrig inträffar. Därför tolkas nämnda första nybble som en representation av intervallet [-7,81. Subtraktionen utförs genom att helt från enkelt subtrahera de åtta bitarna (xb,yb) (xa,ya). Om skillnaden i de fyra minst signifikanta bitarna, d v s bg-xb), är negativ kommer detta att påverka skillnaden (yá-yb). Resultatet i de fyra följande bitarna kommer då att bli (ya-yb)-l, och detta tas hänsyn till i den för- definierade tabellen. En tom bit skulle naturligtvis kunna placeras mellan x- och y-koordinaterna, vilken då skulle vara en indikatorbit för negativa värden för Enligt den föredragna utföringsformen antas (ya-yb) betydelse, när en skillnad av mer än 8 X-steg inträffar.
(Xa"Xb) - emellertid att felet som uppstår i inte har någon Om denna skillnad av fler än 8 X-steg skulle inträffa är 10 15 20 25 30 35 521 91 1 š.f-'jffiff'=,___f" ¿"_;-I'_';_¿"¿Iï::_ ïfij 15 tecknen som jämförs så olika att referenstecknet inte kommer att tolkas som det bäst överensstämmande tecknet.
Den fördefinierade tabellen består av 16 X 32 = 512 element. Alternativt skulle indikatorbiten för y-koordi- I sådant fall skulle tabellen bestå av endast 256 element. naterna också kunna ignoreras.
Om ett 16 X 16 rutnät används är det inte säkert att alla punkter är som mest 8 X-steg ifrån varandra. Bågar hos kinesiska tecken dras emellertid i huvudsak från vänster till höger eller nedåt, varför risken för förväx- ling är liten. Alternativt skulle ett 8 X 8 rutnät kunna användas, vilket innebär att endast 3 bitar skulle behöva användas för representation av varje koordinat. Detta skulle emellertid ge en upplösning som är för grov för kinesiska tecken, men skulle kunna användas för andra tillämpningar.
Uppslagningen i tabellen returnerar ett resultat för ett avstàndsmàtt. Denna bestämning av ett avstàndsmàtt, steg 30 och 32, drag hos det handskrivna tecknet. upprepas, steg 34, för alla positionssär- Sedan beräknas en kost- för definiering av likheten mellan nadsfunktion, steg 36, referenstecknet och det handskrivna tecknet. Denna kost- nadsfunktion skulle kunna vara en summa av alla de bes- tämda måtten. Resultatet för kostnadsfunktionen för refe- renstecknet kontrolleras, steg 38, för att ta reda på om det är det lägsta resultatet hittills för de jämförda referenstecknen. Om resultatet är det lägsta hittills, lagras detta och referenstecknet definieras, steg 40, som det hittills bäst överensstämmande referenstecknet.
Om summan för de bestämda avståndsmàtten hos ett referenstecken överstiger summan för det hittills bäst överensstämmande referenstecknet innan alla avstàndsmàtt har bestämts för referenstecknet skulle jämförelsen kunna avbrytas. I detta fall kasseras referenstecknet innan alla avstàndsmàtt har bestämts, eftersom summan av av- ståndsmàtten redan är för hög. 10 15 20 25 30 35 . ~ . . . . 521 91 1 ífï: fiiiëjíi a f* 16 Jämförelsen i stegen 30-38 upprepas för alla refe- renstecknen. Det referenstecken som är lagrat som det hittills bäst överensstämmande referenstecknet, när det handskrivna tecknet har jämförts med alla referenstecken, anses vara det bäst överensstämmande referenstecknet. Det bäst överensstämmande referenstecknet kan sedan presen- teras och användaren kan således kontrollera om det hand- skrivna tecknet har blivit korrekt igenkänt, såsom besk- rivs ovan i fig 2.
Med hänvisning till fig 5 beskrivs ett sätt att intelligent välja de referenstecken som har störst sanno- likhet att vara det korrekta tecknet. Referenstecknen i databasen delas upp i grupper baserat på det antal bågar som de består av. Det handskrivna tecknet jämförs sedan med de referenstecken som består av samma antal bågar, steg 50, vilket inledningsvis definierar en liten del av referenstecknen som de som har störst sannolikhet att vara det bäst överensstämmande tecknet.
När en användare drar ett handskrivet tecken skulle emellertid två bågar felaktigt kunna slås ihop eller en enda båge delas upp i två om användaren lyfter pennan mitt i bågen. Detta innebär att det handskrivna tecknet bör jämföras med referenstecken med ett nàgot skiljande' antal bågar. Positioneringen av bågarna i det handskrivna tecknet undersöks. Par av bågar, där den ena bàgen har sin ände nära början för den andra bàgen, slås ihop, steg 52, innan det handskrivna tecknet jämförs, steg 54, med referenstecken med ett antal bågar som motsvarar det nya antalet bågar i det handskrivna tecknet. Kombinationen av olika ihopslagna bågar jämförs med referenstecken med motsvarande antal bågar.
Vidare skulle en båge kunna delas upp, steg 56, genom att en brytpunkt sätts och att de två delarna av bågen på var sida om brytpunkten definieras som två en- skilda bågar. med referenstecken med ett antal bågar som mot- Sedan kan det handskrivna tecknet jämföras, steg 58, svarar det nya antalet bågar i det handskrivna tecknet. 10 15 20 25 30 35 6521911 17 Ihopslagningen och uppdelningen av bågar kan upprepas flera gånger och med olika kombinationer för att hitta ett på rätt sätt draget tecken.
Således jämförs aldrig en stor del av referensteck- nen med det handskrivna tecknet, eftersom dessa referens- tecken har ett antal bågar som skiljer sig för mycket från antalet bågar hos det handskrivna tecknet.
Hänvisning görs nu till fig 6, av vilken framgår att det handskrivna tecknet också skulle kunna ha en felaktig lutning. Det korrekt överensstämmande referenstecknet skulle då kunna hittas genom att en affin transformation görs, steg 60, av det handskrivna tecknet. En invariant av den affina transformationen skulle kunna beräknas, steg 62, för det handskrivna tecknet. Denna invariant används för jämförelse av det handskrivna tecknet med referenstecknen. Vektorprodukten beräknas, steg 64, mellan invarianten och referenstecknet. Om tecknen är identiska spänner de upp samma rum och därför kommer den inbördes vektorprodukten att vara noll. Vektorprodukten mellan invariaten och referenstecknet bestäms genom tabelluppslagning.
Som framgår av ovanstående måste ett stort antal jämförelser göras. Det handskrivna tecknet bör jämföras med många olika referenstecken. Vidare kan det handskriv- na tecknet ha dragits på ett något felaktigt sätt. I syfte att kompensera för detta behöver några transforma- tioner (ihopslagning av bägar, uppdelning av bågar, affina transformationer) göras för det handskrivna tecknet och de nya tecknen som erhålls från dessa trans- formationer måste jämföras med referenstecknen. Det är därför en stor fördel om jämförelsen mellan tecken är snabb. Detta åstadkommes genom tabelluppslagningen för bestämning av avståndsmått enligt uppfinningen.
Ovan har beskrivningen gjorts väsentligen pà basen att tecknen skrivs pà en skärm och detekteras samtidigt som de skrivs. Ett alternativ är att tecknen detekteras, exempelvis inläses, efter att de har skrivits på en bit 10 15 20 25 30 35 521 911 18 Detta rör handskrivna tecken, såväl som maskin- papper. skrivna. Detekteringen innefattar således, istället för åtgärden att igenkänna skärmskriften, åtgärden att läsa (skanna) Positionssärdrag för tecknen från pappersbiten. de lästa tecknen detekteras således och igenkänning kan utföras såsom beskrivs ovan.
Med hänvisning till fig 7 kommer en anordning enligt uppfinningen att beskrivas. En datahanteringsanordning 100, en PDA, eller liknande, såsom en dator, en mobiltelefon, en skanner innefattar en textinmatningsenhet 102 för inmatning av text genom manuell skrift. Datahanterings- anordningen 100 innefattar ett organ för detektering 104 av den inmatade texten. Organet för detektering 104 bestämmer positionssärdrag hos ett handskrivet tecken.
Datahanteringsanordningen 100 innefattar en databas 106 eller åtminstone åtkomst till en. Databasen inne- fattar referenstecken och representationer av deras ut- seende. Datahanteringsanordningen 100 innefattar vidare organ för jämförelse 108 av det detekterade, handskrivna tecknet med referenstecken i databasen enligt metoden som beskrivs ovan.
Organet för jämförelse 108 skulle kunna starta jäm- förelsen av det handskrivna tecknet samtidigt som inmat- ningen/skrivningen av tecknet pågår. Alternativt skulle jämförelsen kunna inledas genom en indikation från använ- daren att hela tecknet har inmatats.
Organet för jämförelse 108 returnerar ett referens- tecken som är det bäst överensstämmande med det hand- skrivna tecknet. Datahanteringsanordningen 100 presen- terar det bäst överensstämmande tecknet på en skärm 110 och är nu beredd att igenkänna ett nytt tecken.
När det bäst överensstämmande tecknet presenteras skulle användaren kunna bes kontrollera om det hand- skrivna tecknet har blivit korrekt igenkänt. Om använ- daren kasserar det bäst överensstämmande tecknet skulle datahanteringsanordningen 100 kunna presentera det näst 10 15 20 521 911 '''' " 19 bäst överensstämmande tecknet. Alternativt skulle använ- daren kunna bes inmata tecknet pä nytt.
Datahanteringsanordningen 100 skulle som ett annat alternativ kunna känna igen tecknen utan att användaren bes om ett godkännande/en kassering. En inmatad text skulle sedan kunna kontrolleras för korrekt stavning och grammatik och fel skulle kunna presenteras för användar- en. Användaren skulle sedan kunna korrekturläsa texten och korrigera de feltolkade tecknen.
Det skall betonas att den föredragna utföringsformen som beskrivs häri inte pà något sätt är begränsande och att mànga alternativa utföringsformer är möjliga inom ramen för det skydd som definieras av bifogade krav.
Exempelvis skulle rutnätet kunna vara av andra storlekar, t ex 8 x 8 eller 32 x 32, eller t o m av asymmetrisk storlek, sàsom 16 x 8. Det är emellertid lämpligt att rutnätet är en potens av tvâ, eftersom x- och y-koordi- naterna representeras med binära tal. Följaktligen skulle exempelvis 3 eller 5 bitar kunna användas för represen- tation av en koordinat.

Claims (22)

10 15 20 25 30 35 521 911 20 PATENTKRAV
1. l. Metod för igenkänning av ett handskrivet tecken, vilken metod innefattar stegen att: bestämma ett flertal positionssärdrag, som defi- nierar det handskrivna tecknet, och jämföra det handskrivna tecknet med referenstecken, som är lagrade i en databas, sä att det bäst överens- stämmande referenstecknet hittas, varvid steget att jäm- föra innefattar stegen att: beräkna en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av referenstecknen, bestämma, tabell, beräknade skillnaden, genom uppslagning i en fördefinierad ett avstàndsmàtt, som är baserat pà den upprepa stegen att beräkna en skillnad och bestämma ett avstàndsmàtt för vart och ett av fler- talet positionssärdrag hos det handskrivna tecknet och beräkna en kostnadsfunktion, som är baserad på de bestämda avstàndsmàtten.
2. Metod enligt krav 1, vid vilken varje positions- särdrag är definierat av åtminstone tvà egenskaper och vid vilken steget att beräkna en skillnad mellan ett positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos referenstecknet innefattar beräk- nandet av en skillnad mellan varje egenskap hos posi- tionssärdraget hos det handskrivna tecknet och den mot- svarande egenskapen hos positionssärdraget hos referens- tecknet.
3. Metod enligt krav 2, vid vilken steget att beräk- na en skillnad för varje egenskap utförs i en enda opera- tion. /3 A- 10 15 20 25 30 35 521 911 21
4. Metod enligt något av föregående krav, vid vilken steget att bestämma positionssärdrag innefattar steget att bestämma ett läge för positionssärdrag i ett rutnät.
5. Metod enligt något av föregående krav, vid vilken positionssärdragen hos det handskrivna tecknet och refe- renstecknen innefattar koordinater för jämförelsepunkter.
6. Metod enligt krav 5, vid vilken steget att bes- tämma positionssärdrag innefattar steget att bestämma en x-koordinat och en y-koordinat för jämförelsepunkten i ett rutnät.
7. Metod enligt krav 6, vid vilken rutnätet är av en storlek på 16 X 16 positioner och koordinaterna för en jämförelsepunkt representeras av en databyte.
8. Metod enligt något av krav 5-7, vid vilken avs- tåndsmåttet som erhålls från tabelluppslagningen i den fördefinierade tabellen är en funktion av det euklidiska avståndet mellan jämförelsepunkten hos det handskrivna tecknet och en jämförelsepunkt hos referenstecknet.
9. Metod enligt något av föregående krav, vid vilken positionssärdragen hos det handskrivna tecknet och refe- renstecknen innefattar positioner och riktningar för jäm- förelsevektorer.
10. Metod enligt krav 9, vid vilken avståndsmàttet som erhålls från tabelluppslagningen i den fördefinierade tabellen är en funktion av en skillnad mellan krökningar- na för det handskrivna tecknet och referenstecknen.
11. ll. Metod enligt något av krav 4-10, vilken vidare innefattar steget att centrera det handskrivna tecknet i rutnätet innan steget att bestämma positionssärdragen hos det handskrivna tecknet utförs. 10 15 20 25 30 35 521911 22
12. Metod enligt något av föregående krav, vilken vidare innefattar steget att skala det handskrivna teck- net till en normaliserad storlek i enlighet med storleken för referenstecknen innan steget att bestämma positions- särdragen för det handskrivna tecknet utförs.
13. Metod enligt något av föregående krav, vilken vidare innefattar steget att bestämma antalet bågar som bildar det handskrivna tecknet.
14. Metod enligt krav 13, vid vilken steget att jäm- föra det handskrivna tecknet med referenstecken inne- fattar steget att inledningsvis jämföra det handskrivna tecknet med referenstecken som är bildade av samma antal bågar.
15. Metod enligt krav 13 eller 14, vid vilken steget att jämföra vidare innefattar steget att jämföra det handskrivna tecknet med referenstecken som är bildade av några få bågar färre än det handskrivna tecknet.
16. Metod enligt något av krav 13-15, vid vilken steget att jämföra vidare innefattar steget att jämföra det handskrivna tecknet med referenstecken som är bildade av några få bågar fler än det handskrivna tecknet.
17. Metod enligt något av krav 13-16, vid vilken en båge hos det handskrivna tecknet jämförs med en mot- svarande båge hos referenstecknet, varvid de motsvarande bågarna bestäms av den ordning i vilken bågarna hos det handskrivna tecknet dragits.
18. Metod enligt krav 17, vilken vidare innefattar steget att omorganisera ordningen för bågarna hos det handskrivna tecknet. 10 15 20 25 30 35 2521911 23
19. Anordning för igenkänning av ett handskrivet tecken och för omvandling av detta till ett digitalt format, vilken anordning innefattar: organ för bestämning av ett flertal positions- särdrag, som definierar de handskrivna tecknet, en databas vilken innefattar referenstecken, organ för jämförelse av det handskrivna tecknet med referenstecken i databasen så att det bäst överensstäm- mande referenstecknet hittas, vilket organ för jämförelse innefattar: organ för beräkning av en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av referenstecknen, en fördefinierad tabell, som definierar ett avstàndsmàtt, som är baserat pà skillnaderna i positionssärdrag, organ för bestämning av ett avstàndsmátt genom uppslagning i den fördefinierade tabellen och organ för beräkning av en kostnadsfunktion, som är baserad pà de bestämda avstàndsmåtten.
20. Anordning enligt krav 19, vid vilken ett posi- tionssärdrag innefattar två egenskaper, vilka definierar detta och vilka är lagrade i en datapost i databasen.
21. En bärbar anordning för datahantering, vilken innefattar ett tryckkänsligt område, som är anordnat för manuell skrift av ett tecken och en anordning enligt krav 19 för igenkänning av ett tecken som skrivits i det tryckkänsliga omràdet för omvandling av detta till ett digitalt format.
22. Ett datorprogram för igenkänning av ett hand~ skrivet tecken, vilket datorprogram innefattar: kod för bestämning av ett flertal positionssärdrag som definierar det handskrivna tecknet och 521 911 24 kod för jämförelse av det handskrivna tecknet med referenstecken, som är lagrade i en databas, sä att det bäst överensstämmande referenstecknet hittas, vilken kod för jämförelse innefattar: 5 kod för beräkning av en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av refe- renstecknen, kod för bestämning, genom uppslagning i en 10 fördefinierad tabell, av ett avstàndsmätt, som är baserat pà den beräknade skillnaden, kod för upprepning av stegen att beräkna en skillnad och bestämma ett avständsmätt för vart och ett av flertalet positionssärdrag hos det handskriv- l5 na tecknet och kod för beräkning av en kostnadsfunktion, som är baserad på de bestämda avständsmàtten.
SE0100114A 2001-01-15 2001-01-15 Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken SE521911C2 (sv)

Priority Applications (6)

Application Number Priority Date Filing Date Title
SE0100114A SE521911C2 (sv) 2001-01-15 2001-01-15 Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken
TW090102405A TW573280B (en) 2001-01-15 2001-02-05 Method, device and computer program for recognition of a handwritten character
JP2002556828A JP2004518198A (ja) 2001-01-15 2002-01-11 手書文字を認識するための方法、デバイス及びコンピュータプログラム
US10/466,087 US7349576B2 (en) 2001-01-15 2002-01-11 Method, device and computer program for recognition of a handwritten character
PCT/SE2002/000037 WO2002056242A1 (en) 2001-01-15 2002-01-11 Method, device and computer program for recognition of a handwritten character
CN028036778A CN1488120B (zh) 2001-01-15 2002-01-11 用于识别手写字符的方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0100114A SE521911C2 (sv) 2001-01-15 2001-01-15 Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken

Publications (3)

Publication Number Publication Date
SE0100114D0 SE0100114D0 (sv) 2001-01-15
SE0100114L SE0100114L (sv) 2002-07-16
SE521911C2 true SE521911C2 (sv) 2003-12-16

Family

ID=20282632

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0100114A SE521911C2 (sv) 2001-01-15 2001-01-15 Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken

Country Status (6)

Country Link
US (1) US7349576B2 (sv)
JP (1) JP2004518198A (sv)
CN (1) CN1488120B (sv)
SE (1) SE521911C2 (sv)
TW (1) TW573280B (sv)
WO (1) WO2002056242A1 (sv)

Families Citing this family (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7712053B2 (en) * 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US8938688B2 (en) * 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
AU5299700A (en) * 1999-05-27 2000-12-18 America Online, Inc. Keyboard system with automatic correction
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7750891B2 (en) * 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system
US7821503B2 (en) * 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
US7286115B2 (en) * 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8583440B2 (en) * 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
US7634729B2 (en) * 2002-11-10 2009-12-15 Microsoft Corporation Handwritten file names
US7284200B2 (en) * 2002-11-10 2007-10-16 Microsoft Corporation Organization of handwritten notes using handwritten titles
US7580551B1 (en) * 2003-06-30 2009-08-25 The Research Foundation Of State University Of Ny Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
US8095364B2 (en) * 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
US7587378B2 (en) * 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
US7580925B2 (en) * 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
US8913833B2 (en) * 2006-05-08 2014-12-16 Fuji Xerox Co., Ltd. Image processing apparatus, image enlarging apparatus, image coding apparatus, image decoding apparatus, image processing system and medium storing program
US7565624B2 (en) 2006-06-30 2009-07-21 Research In Motion Limited Method of learning character segments during text input, and associated handheld electronic device
US8395586B2 (en) 2006-06-30 2013-03-12 Research In Motion Limited Method of learning a context of a segment of text, and associated handheld electronic device
KR100801224B1 (ko) * 2006-08-16 2008-02-05 장경호 사용자 필적 구현 시스템 및 방법
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20080154576A1 (en) * 2006-12-21 2008-06-26 Jianchao Wu Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities
US8225203B2 (en) * 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8201087B2 (en) * 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8299943B2 (en) * 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
CN100533478C (zh) * 2007-07-09 2009-08-26 华南理工大学 基于最优全局仿射变换的汉字合成实现方法
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8416264B2 (en) 2008-11-03 2013-04-09 Sony Mobile Communications Ab Method and device for optimizing an image displayed on a screen
TWI385584B (zh) * 2008-11-05 2013-02-11 Avermedia Information Inc 自動排列手寫字串之裝置及方法
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8363947B2 (en) 2010-07-31 2013-01-29 International Business Machines Corporation Handwritten character recognition based on frequency variations in characters
CN103140862B (zh) * 2010-09-30 2016-11-02 法国电信公司 用户界面系统及其操作方法
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8989492B2 (en) * 2011-06-03 2015-03-24 Apple Inc. Multi-resolution spatial feature extraction for automatic handwriting recognition
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
TWI447619B (zh) * 2011-12-15 2014-08-01 Inventec Corp 提供引導軌跡以輔助手勢輸入之系統及其方法
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
CN103313212A (zh) * 2012-03-16 2013-09-18 腾讯科技(深圳)有限公司 一种信息发送、接收的方法、发送终端及接收终端
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR101392295B1 (ko) 2012-12-17 2014-05-12 한승희 한글 필적의 음절단위 분석 장치 및 방법
JP6125333B2 (ja) * 2013-05-31 2017-05-10 株式会社東芝 検索装置、方法及びプログラム
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10489051B2 (en) * 2014-11-28 2019-11-26 Samsung Electronics Co., Ltd. Handwriting input apparatus and control method thereof
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN111222590B (zh) * 2019-12-31 2024-04-12 咪咕文化科技有限公司 形近字确定方法、电子设备和计算机可读存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5580183A (en) * 1978-12-12 1980-06-17 Nippon Telegr & Teleph Corp <Ntt> On-line recognition processing system of hand-written character
JPS60136892A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd オンライン手書き図形認識装置
JPS60237580A (ja) 1984-05-11 1985-11-26 Hitachi Ltd オンライン手書文字認識方式
JPS61182185A (ja) 1985-02-06 1986-08-14 Nippon Tsushin Kensetsu Kk 手書き文字認識装置
JPH03282896A (ja) 1990-03-30 1991-12-13 Toshiba Corp パターン認識装置
IL100198A (en) 1991-11-29 1999-10-28 Art Advanced Recognition Tech Character recognition method
US5901255A (en) * 1992-02-07 1999-05-04 Canon Kabushiki Kaisha Pattern recognition method and apparatus capable of selecting another one of plural pattern recognition modes in response to a number of rejects of recognition-processed pattern segments
US5774586A (en) * 1994-05-04 1998-06-30 Ncr Corporation Method and apparatus for standardization of inputs to word recognition systems
US6052481A (en) 1994-09-02 2000-04-18 Apple Computers, Inc. Automatic method for scoring and clustering prototypes of handwritten stroke-based data
JP3444561B2 (ja) 1994-11-01 2003-09-08 株式会社東芝 文字認識方法及び文字認識装置
DE19511470C1 (de) * 1995-03-29 1996-10-24 Siemens Ag Verfahren zur Ermittlung eines Referenzschriftzuges anhand einer Menge von schreiberidentischen Musterschriftzügen
DE19511472C1 (de) * 1995-03-29 1996-10-17 Siemens Ag Verfahren zur dynamischen Verifikation eines Schriftzuges anhand eines Referenzschriftzuges

Also Published As

Publication number Publication date
CN1488120A (zh) 2004-04-07
US7349576B2 (en) 2008-03-25
SE0100114D0 (sv) 2001-01-15
JP2004518198A (ja) 2004-06-17
TW573280B (en) 2004-01-21
US20040096105A1 (en) 2004-05-20
SE0100114L (sv) 2002-07-16
WO2002056242A1 (en) 2002-07-18
CN1488120B (zh) 2010-09-29

Similar Documents

Publication Publication Date Title
SE521911C2 (sv) Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken
SE514377C2 (sv) Teckenigenkänning
CN110866495A (zh) 票据图像识别方法及装置和设备、训练方法和存储介质
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
SE519014C2 (sv) Metod och anordning för igenkänning av ett handskrivet mönster
US7369702B2 (en) Template-based cursive handwriting recognition
EP1703444A2 (en) Detecting an orientation of characters in a document image
CN111723807A (zh) 使用端到端深度学习识别机打字符和手写字符
CN109685870B (zh) 信息标注方法及装置、标注设备及存储介质
KR19990036622A (ko) 비트맵 이미지의 처리 방법 및 처리 장치, 비트맵 이미지의처리를 행하는 이미지 처리 프로그램을 저장한 기억 매체
JPH03161891A (ja) 表形式文書読取装置
JP4594952B2 (ja) 文字認識装置及び文字認識方法
CN114299529A (zh) 基于医疗化验单图片的识别方法、存储介质及终端
Wendling et al. A new way to detect arrows in line drawings
JP3192468B2 (ja) オンライン手書き文字認識装置及び認識方法
JP2009223612A (ja) 画像認識装置及びプログラム
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2001005804A (ja) 文字認識装置を利用したデータベース登録方法
Kar et al. Line reconstruction and segmentation of words and characters using measures of central tendency and measures of dispersion
JPH11265422A (ja) マーク認識方法及び装置並びに記録媒体
JP5291034B2 (ja) 楕円印検出及び楕円印自動正立処理装置
CN113778281B (zh) 辅助信息生成方法、装置及电子设备和存储介质
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
JPH10198766A (ja) 文字認識装置及びその方法並びに記憶媒体
JP3128357B2 (ja) 文字認識処理装置

Legal Events

Date Code Title Description
NUG Patent has lapsed