SE521911C2 - Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken - Google Patents
Metod, anordning och datorprogram för igenkänning av ett handskrivet teckenInfo
- Publication number
- SE521911C2 SE521911C2 SE0100114A SE0100114A SE521911C2 SE 521911 C2 SE521911 C2 SE 521911C2 SE 0100114 A SE0100114 A SE 0100114A SE 0100114 A SE0100114 A SE 0100114A SE 521911 C2 SE521911 C2 SE 521911C2
- Authority
- SE
- Sweden
- Prior art keywords
- handwritten character
- character
- reference characters
- determining
- handwritten
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
15 20 25 30 35 521 911 2 handskrivna tecknet måste jämföras med ett mycket stort antal referenstecken när igenkänning av ett kinesiskt tecken utförs, blir igenkänningen långsam.
Enligt US 4 284 975 beräknas skillnader i koordina- ter mellan punkter på det handskrivna tecknet och punkter på referenstecknet. Dessa skillnader används för beräk- ning av ett avständsmàtt mellan punkterna.
Idag beräknas skillnaderna i åtminstone två steg.
Två egenskaper som definierar en punkt kan vara lagrade i olika områden för enkel åtkomst till värdet för en egen- skap genom hänvisning till det register där det är lagrat. En beräkning av en skillnad mellan två punkter utförs då i två subtraktioner för att jämföra de två egenskaperna hos punkterna. I dessa subtraktioner kan hänvisning göras direkt till de register som håller värdena för egenskaperna. Detta innebär emellertid att mycket minne behövs eftersom de två egenskaperna lagras separat. En annan metod är att komprimera värdena för de två egenskaperna för lagring av varje punkt separat.
Detta innebär att mindre minne krävs men egenskaperna hos punkten måste dekomprimeras innan beräkning av skillnaderna i egenskaper utförs. Detta ger en långsammare metod.
Sammanfattning av uppfinningen Det är ett ändamål med uppfinningen att tillhanda- hålla en snabbare metod för igenkänning av handskrivna tecken. Ändamålet med uppfinningen uppnås genom en metod för igenkänning av ett handskrivet tecken. Metoden innefattar stegen att bestämma ett flertal positionssärdrag som definierar det handskrivna tecknet och jämföra det hand- skrivna tecknet med referenstecken, som är lagrade i en databas, hittas. Steget att jämföra innefattar stegen att beräkna så att det bäst överensstämmande referenstecknet en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett 10 15 20 25 30 35 521 911 3 av referenstecknen och bestämma, genom uppslagning i en fördefinierad tabell, ett avstàndsmätt som är baserat pä den beräknade skillnaden. Steget att jämföra innefattar vidare stegen att upprepa stegen att beräkna en skillnad och bestämma ett avständsmàtt för vart och ett av fler- talet av positionssärdrag hos det handskrivna tecknet och beräkna en kostnadsfunktion, som är baserad på de bestäm- da avstàndsmàtten.
Den uppfinningsenliga metoden är baserad på insikten att en snabb metod för igenkänning av ett handskrivet tecken kräver att jämförelsen som skall utföras mellan det handskrivna tecknet och ett stort antal referens- tecken är snabb. Om steget att jämföra således snabbas upp kommer hela igenkänningsmetoden att bli mycket snabbare. Steget att jämföra tecken innefattar steget att jämföra flera positionssärdrag hos tecknen. Enligt upp- finningen utförs jämförelsen av positionssärdrag mycket snabbt. Steget att jämföra ett positionssärdrag hos det handskrivna tecknet med ett positionssärdrag hos ett referenstecken innefattar en tabelluppslagning för bes- tämning av ett avstàndsmàtt mellan positionssärdragen.
Denna tabelluppslagning är snabbare än en faktiskt beräk- ning av ett avstàndsmàtt. Varje jämförelse av det hand- skrivna tecknet med ett referenstecken blir således mycket snabbare och en liten ökning i hastigheten för jämförelse av positionssärdrag resulterar i en betydligt snabbare metod för igenkänning av ett handskrivet tecken.
Positionssärdragen definierar det handskrivna tecknet. Positionssärdragen är företrädesvis punkter och/eller vektorer i det handskrivna tecknet. Vektorerna kan exempelvis beskriva en rät linje mellan tvà punkter på tecknet eller en derivata i en punkt hos tecknet. Det handskrivna tecknet kan naturligtvis också definieras av någon kombination av punkter och vektorer.
Avståndsmàttet är en funktion av skillnaden mellan ett positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos referenstecknet. Denna funktion 10 15 20 25 30 35 521 '911 4 måste inte vara särskilt komplex. Avståndsmåttet bestäms ändå snabbare genom en tabelluppslagning än genom en faktisk beräkning. I denna uppfinnings sammanhang defi- nieras ordet ”tecken” som vilken symbol som helst som kan skrivas. I vissa fall kan ett tecken vara en del av en sådan symbol eller en kombinerad struktur av sådana symboler.
Varje positionssärdrag definieras företrädesvis av åtminstone två egenskaper. Steget att beräkna en skillnad mellan ett positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos referenstecknet innefattar beräkningen av en skillnad mellan varje egenskap hos det handskrivna tecknets positionssärdrag och motsvarande egenskap hos referenstecknets positionssärdrag. Två egen- skaper behövs normalt för att definiera ett positions- särdrag, såsom en X- och en y-koordinat för en punkt eller en x- och en y-riktning för en vektor. Vid bestäm- ning av ett avståndsmått behövs skillnaderna för båda egenskaperna för de jämförda positionssärdragen så att båda egenskaperna bidrar till avståndsmåttet.
Enligt en föredragen utföringsform av uppfinningen utförs steget att beräkna en skillnad för varje egenskap i en enda operation. Metoden enligt uppfinningen beräknar skillnaderna för egenskaperna genom lagring av egenskap- erna för varje positionssärdrag i en enda datapost och använder kännedom om vilka bitar i dataposten som repre- senterar varje egenskap för beräkning av skillnaderna.
Positionssärdragen kan således vara lagrade i ett litet minnesutrymme och förutom det snabba steget att bestämma ett avståndsmått är steget att beräkna skillnaderna mycket snabbt, eftersom endast en maskinkodsoperation behövs för beräkningen av skillnaden i positionssärdrag.
Steget att bestämma positionssärdrag innefattar företrädesvis ett steg att bestämma ett läge för posi- tionssärdraget i ett rutnät. Det handskrivna tecknets positionssärdrag kan därigenom enkelt jämföras med mot- svarade positionssärdrag hos referenstecknen. 10 15 20 25 30 35 521 911 5 I en föredragen utföringsform innefattar positions- särdragen hos det handskrivna tecknet och referenstecknen koordinater för jämförelsepunkter. Specifika jämförelse- punkter hos det handskrivna tecknet kan således jämföras med fördefinierade jämförelsepunkter hos referenstecknen sä att ett överensstämmande referenstecken skall hittas.
Steget att bestämma positionssärdrag innefattar företrädesvis steget att bestämma en x-koordinat och en y-koordinat för jämförelsepunkten i ett rutnät. Därigenom beskrivs positionen för en jämförelsepunkt enkelt med tvä egenskaper.
I en föredragen utföringsform är rutnätet av en storlek pà 16 x 16 positioner och koordinaterna för en jämförelsepunkt representeras av en databyte. Denna rut- nätstorlek är optimal för otvetydig representation av kinesiska tecken och för lagring av en position för en jämförelsepunkt i ett litet minnesutrymme.
Avstàndsmáttet som erhålls från tabelluppslagningen i den fördefinierade tabellen är företrädesvis en funk- tion av det euklidiska avståndet mellan jämförelsepunkten hos det handskrivna tecknet och en jämförelsepunkt hos referenstecknet. Det euklidiska avståndet ger ett jämnt v-riktat mätt för skillnaden i X- och y-riktningarna.
Funktionen skulle kunna vara det kvadrerade euklidiska avståndet, vilket ger ett heltalsresultat om de inmatade skillnaderna är heltal.
I en annan utföringsform innefattar positionssär- dragen hos det handskrivna tecknet och referenstecknen positioner och riktningar för jämförelsevektorer. Jäm- förelsevektorerna kan också vara kombinerade med jäm- förelsepunkter för definiering av tecknen. När positions- särdragen innefattar jämförelsevektorer jämförs riktning- arna hos bägar i det handskrivna tecknet med motsvarande jämförelsevektorer hos referenstecknen, vilka jämförelse- vektorer definierar riktningen för bågar i referens- tecknen. 10 15 20 25 30 35 521911 6 I denna utföringsform är avstàndsmättet som erhålls från tabelluppslagningen i den fördefinierade tabellen en funktion av en skillnad mellan krökningar för det hand- skrivna tecknet och referenstecknen. Detta innebär att derivatorna för bàgarna jämförs.
Företrädesvis innefattar metoden vidare steget att centrera det handskrivna tecknet i rutnätet innan steget att bestämma positionssärdragen hos det handskrivna tecknet utförs. Som ett resultat tas hänsyn till en för- skjutning av det handskrivna tecknets position och posi- tionen anpassas till positioneringen för referenstecknen.
Därigenom kan det handskrivna tecknet skrivas pä vilken plats som helst där dektering av skriften är aktiv.
Med fördel innefattar metoden vidare steget att skala det handskrivna tecknet till en normaliserad stor- lek i enlighet med storleken för referenstecknen innan steget att bestämma det handskrivna tecknets positions- särdrag utförs. Således är inte det handskrivna tecknets storlek avgörande för igenkänning.
I en föredragen utföringsform innefattar metoden vidare steget att bestämma antalet bågar som bildar det handskrivna tecknet. Detta är ett sätt att klassificera tecknet sà att jämförelse av det handskrivna tecknet med varenda referenstecken undviks.
Steget att jämföra det handskrivna tecknet med refe- renstecken innefattar företrädesvis steget att inled- ningsvis jämföra det handskrivna tecknet med referens- tecken som är bildade av samma antal bägar. Som ett resultat jämförs det handskrivna tecknet inledningsvis med referenstecken som har störst sannolikhet att vara det bäst överensstämmande referenstecknet.
Dessutom innefattar företrädesvis steget att jämföra vidare steget att jämföra det handskrivna tecknet med referenstecken som är bildade av nägra fä bågar färre än den handskrivna tecknet, sä att felaktig ihopslagning av bàgarna tilläts. Det är inte ovanligt att tvà bàgar slàs ihop pà grund av att skrivaren inte lyfter pennan när han 10 15 20 25 30 35 521 911 7 borde. Detta arrangemang innebär att det korrekta bäst överensstämmande referenstecknet skall hittas även om skrivaren felaktigt slår ihop två bågar.
Därutöver innefattar företrädesvis steget att jäm- föra vidare steget att jämföra det handskrivna tecknet med referenstecken som är bildade av några fä bågar fler än det handskrivna tecknet, så att felaktigt lyftande av en penna tilläts. Detta arrangemang innebär att referens- tecknet skall hittas även om skrivaren felaktigt lyfter pennan i en båge.
I en annan föredragen utföringsform jämförs en båge hos det handskrivna tecknet med en motsvarande båge hos referenstecknet, varvid de motsvarande bàgarna bestäms genom den ordning i vilken bàgarna hos det handskrivna tecknet dragits. Referenstecknens motsvarande positions- särdrag relateras således enkelt till de positionssärdrag hos de handskrivna tecknet som de svarar mot. Detta är speciellt användbart för kinesiska tecken, eftersom dessa har ett speciellt schema för den ordning i vilken bågar skall dras. Det innebär att en skicklig skrivare av kine- siska tecken sällan drar bàgar hos ett tecken i fel ordning.
Metoden innefattar företrädesvis vidare steget att omorganisera ordningen för bàgarna i det handskrivna tecknet, så att dragning av bàgarna i felaktig ordning tillåts. Detta arrangemang gör det möjligt att hitta ett korrekt, bäst överensstämmande referenstecken även om skrivaren drar bàgarna i tecknet i felaktig ordning.
I en föredragen utföringsform innefattar metoden vidare steget att beräkna en affin transformation av det handskrivna tecknet för kompensering för möjlig lutning av det handskrivna tecknet och därefter jämföra det transformerade tecknet med databasens referenstecken.
Detta arrangemang resulterar i att det korrekta, bäst överensstämmande referenstecknet kan hittas även om skrivaren drar ett lutande tecken. lO 15 20 25 30 35 Ändamålet med uppfinningen uppnås också genom en anordning för igenkänning av ett handskrivet tecken och för omvandling av detta till ett digitalt format. Anord- ningen innefattar organ för bestämmande av ett flertal positionssärdrag, som definierar det handskrivna tecknet, en databas, som innefattar referenstecken, och organ för jämförelse av det handskrivna tecknet med referenstecken hos databasen så att det bäst överensstämmande referens- tecknet hittas. Organet för jämförelse innefattar organ för beräkning av en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av referenstecknen och en för- definierad tabell, vilken definierar ett avståndsmått som är baserat på skillnaderna i positionssärdrag. Organet för jämförelse innefattar vidare organ för bestämning av ett avståndsmått genom uppslagning i den fördefinierade tabellen och organ för beräkning av en kostnadsfunktion, som är baserad pà de bestämda avstàndsmåtten.
En sådan anordning skulle kunna användas för inmat- ning av text till en datahanteringsanordning och således ersätta eller komplettera tangentborden. Tabelluppslag- ning enligt uppfinningen gör igenkänningen av handskrivna tecken mycket snabb. Således kan irriterande väntetider elimineras. Ändamålet med uppfinningen uppnås också av ett datorprogram enligt krav 22.
Kort beskrivning av ritningarna Föreliggande uppfinning kommer nu i exemplifierande syftet att beskrivas mer i detalj under hänvisning till bifogade ritningar.
Fig l visar ett handskrivet tecken och ett överens- stämmande referenstecken.
Fig 2 är ett flödesschema över en användares inter- aktion med en anordning som realiserar metoden enligt uppfinningen. lO 15 20 25 30 35 521 911 . . . , ,, 9 Fig 3 är ett flödesschema över förbehandlingen av ett handskrivet tecken innan den faktiska igenkänningen utförs.
Fig 4 är ett flödesschema över processen att jämföra ett handskrivet tecken med ett referenstecken.
Fig 5 är ett flödesschema som beskriver den ordning i vilken det handskrivna tecknet jämförs med referens- tecknen.
Fig 6 är ett flödesschema över processen att jämföra en affin transformation av det handskrivna tecknet med referenstecknen.
Pig 7 visar en anordning som realiserar metoden enligt uppfinningen.
Detaljerad beskrivning av en föredragen utföringsform av uppfinningen I fig 1 visas ett handskrivet tecken 1 (tjocka, gråa linjer) och ett referenstecken 2 (tunna, svarta linjer), vilka är placerade i ett rutnät 3. Det handskrivna tecknet 1 består av flera bågar 4. Placeringen i rutnätet 3 för start- 5 och ändpunkter 6 för varje båge 4 är markerade. Bàgarnas 4 start- 5 och ändpunkter 6 används företrädesvis som positionssärdrag hos det handskrivna tecknet 1. Deras x- och y-koordinater i rutnätet 3 definierar positionssärdragen. Ett annat koordinatsystem skulle naturligtvis kunna användas, såsom ett polärt koordinatsystem. Ytterligare positionssärdrag hos det handskrivna tecknet 1 skulle kunna vara en vektor från startpunkten 5 till ändpunkten 6 hos varje båge 4 eller ytterligare punkter pà bàgarna 4 mellan start- 5 och ändpunkterna 6. Det handskrivna tecknet 1 jämförs med referenstecknet 2 genom jämförelse av positionssärdragen hos det handskrivna tecknet 1 med positionssärdragen hos referenstecknet 2, såsom kommer att beskrivas mer i detalj nedan.
Med hänvisning till fig 2-6 kommer nu en föredragen metod för igenkänning av ett handskrivet tecken att lO 15 20 25 30 35 521 911 lO beskrivas. Följande beskrivning kommer att göras med hänvisning till ett skrivet tecken pä ett tryckkänsligt område, varpå omedelbar teckenigenkänning utförs. Såsom kommer att framhållas senare skulle metoden emellertid också kunna tillämpas på ett handskrivet tecken pà en bit papper, vilket tecken senare läses in till ett digitalt format.
Hänvisning görs till fig 2, i vilken en användares agerande för inmatning av tecken för hand beskrivs. Ett tecken skrivs manuellt, steg 10, pà ett tryckkänsligt område för igenkänning och omvandling till ett digitalt format. Det tryckkänsliga området är en inmatningsenhet, som är kopplad till en datahanteringsanordning, såsom en dator, en PDA eller en mobiltelefon. Användaren skriver på det tryckkänsliga området genom att använda ett spet- sigt objekt, härefter kallat en penna, för anbringande av tryck i området. Ett tecken består av åtminstone en bàge, d v s en linje som dragits utan att lyfta pennan. Använ- daren drar bågarna som bildar tecknet. När ett helt tecken har inmatats indikerar användaren detta, steg 12, till datahanteringsanordningen, som sedan kommer att jämföra det handskrivna tecknet med referenstecken sä att det bäst överensstämmande tecknet hittas. Det finns andra sätt för datahanteringsanordningen att få reda pà att ett helt tecken har inmatats, t ex skulle en tidsutlösning av ingen aktion från användaren kunna indikera detta. De bäst överensstämmande tecknen kommer sedan att presen- teras för användaren, som kommer att svara på om det Användaren kan det korrekta tecknet presenteras, steg 14. acceptera, steg 16, eller kassera, steg 18, föreslagna tecknet.
Med hänvisning till fig 3 kommer nu databehandlingen av det handskrivna tecknet att beskrivas mer i detalj.
När ett handskrivet tecken inmatas, steg 20, samplas för defi- niering av det handskrivna tecknet. Dessa punkter bestäms punkter pà det handskrivna tecknet, steg 22, företrädesvis av deras x- och y-koordinater i ett rutnät. 10 15 20 25 30 35 521 911 ---- ~ ll Punkterna används senare för jämförelse av det hand- skrivna tecknet med referenstecken. Efter steget att sampla, steg 22, förbehandlas det inmatade handskrivna tecknet för korrigering av felaktigt läge eller storlek hos det handskrivna tecknet.
Förbehandlingen innefattar steget att centrera, steg 24, det handskrivna tecknet i rutnätet och steget att skala, steg 26, det handskrivna tecknet till en normali- serad storlek. Dessa steg 24-26 utförs enligt följande.
Först bestäms medelvärdena för x- och y-koordinaterna för alla samplade punkter. Sedan subtraheras X- och y-medel- värdena från koordinaterna för de samplade punkterna, varvid masscentrum för det handskrivna tecknet placeras i origo. Därefter normaliseras standardavvikelsen för avståndet från de samplade punkterna till masscentret.
Denna storlek motsvarar storleken för referenstecknen.
Slutligen flyttas det handskrivna tecknet till rutnätets centrum. De samplade punkterna bestäms företrädesvis med högre upplösning än den upplösning som används under processen att jämföra det handskrivna tecknet med refe- renstecknen. Skalningen av tecknet skulle då kunna inne- fatta ändring av upplösningen, vilket innebär att värdena för x- och y-koordinaterna delas med förhållandet mellan upplösningarna.
Det handskrivna tecknet är bildat av bågar, d v s linjer som dragits utan att lyfta pennan. Varje båge samplas och positionssärdrag bestäms. Samplingen skulle kunna detektera ett positionssärdrag vid specifika inter- vall varvid läget för pennan vid denna tidpunkt bestämmer positionssärdraget. Alternativt bestäms start- och änd- positionerna för bågen. En ytterligare position bestäms genom beräkning av vilken punkt på bàgen som avviker mest från en rät linje mellan start- och ändpositionen. Ytter- ligare flera positioner skulle kunna bestämmas på samma sätt. Ett positionssärdrag hos det handskrivna tecknet kan vara koordinater för en samplad punkt. Det skulle alternativt kunna vara en riktningsvektor mellan två 10 15 20 25 30 521 911 :f-f:-¿~ l2 intilliggande, samplade punkter eller en krökningsvektor, vilken definierar skillnaden i riktning mellan två intil- liggande riktningsvektorer.
Bågarna listas i enlighet med den ordning i vilken de dras. Det handskrivna tecknets första båge jämförs sedan med den första bågen i referenstecknet och så vidare. Detta är speciellt användbart för kinesiska tecken, eftersom bàgordningen är entydig. Om bågarna dras i fel ordning skulle detta emellertid kunna tas hänsyn till genom omblandning av bågarnas ordning. Omblandningen skulle kunna utföras genom jämförelse av varje båge hos det handskrivna tecknet med varje båge hos referensteck- net och bestämning av vilken båge som bäst överensstämmer med varje båge hos det handskrivna tecknet.
Det handskrivna tecknet representeras av ett flertal positionssärdrag. Dessa positionssärdrag skulle kunna innefatta koordinater för samplade punkter, riktnings- vektorer, krökningsvektorer eller någon kombination av dessa. Det handskrivna tecknets positionssärdrag jämförs med positionssärdrag hos referenstecknen så att det bäst överensstämmande referenstecknet hittas. Referenstecknens positionssärdrag är fördefinierade och representerar samma egenskaper som de positionssärdrag som extraheras från det handskrivna tecknet. Det är emellertid inte nödvändigt att det finns ett motsvarande positionssärdrag för varje positionssärdrag hos det handskrivna tecknet.
Ett positionssärdrag hos referenstecknet skulle kunna användas för jämförelse med två eller flera positions- särdrag hos det handskrivna tecknet eller vice versa.
Bågarna behöver varierande antal positionssärdrag för att vara väldefinierade. Således skulle tre positionssärdrag hos det handskrivna tecknet kunna jämföras med fyra posi- I detta fall är det nödvändigt att bestämma vilka positionssärdrag hos refe- tionssärdrag hos ett referenstecken. renstecknet som motsvarar positionssärdrag hos det hand- skrivna tecknet. Detta innebär att de tre positions- särdrag hos referenstecknet som skiljer sig minst från lO 15 20 25 30 35 521 911 13 det handskrivna tecknets positionssärdrag skulle kunna väljas som motsvarande positionssärdrag för referens- tecknet. Alternativt skulle ett positionssärdrag hos det handskrivna tecknet kunna tilldelas två motsvarande posi- tionssärdrag och tvà avständsmàtt skulle kunna beräknas för detta positionssärdrag.
I en föredragen utföringsform innefattar positions- särdrag jämförelsepunkter för tecknen. Positionerna för jämförelsepunkterna i rutnätet bestäms av deras x- och y- koordinater. Rutnätet innefattar företrädesvis 16 x 16 kvadrater och således kan en jämförelsepunkt represen- teras av en byte data eftersom 4 bitar behövs för x- respektive y-koordinaterna.
Med hänvisning till fig 4 kommer nu jämförelsen av det handskrivna tecknet med referenstecken att beskrivas mer i detalj. Referenstecknen lagras som information om deras motsvarande positionssärdrag i en databas i data- hanteringsanordningen. Varje jämförelsepunkt hos det handskrivna tecknet jämförs med en motsvarande jämförel- sepunkt hos referenstecknet. Detta àstadkommes genom mellan jämförelsepunkt- beräkning av skillnaden, steg 30, erna, d v s subtraktion av värdet för X- och y-koordinat- erna för den motsvarande jämförelsepunkten hos referens- tecknet fràn värdet för x- och y-koordinaterna för jäm- förelsepunkten hos det handskrivna tecknet. Skillnaderna används sedan som indata för uppslagning av ett avstånds- mätt, som helst med formen steg 32, i en fördefinierad tabell. Vilken funktion f(Xa-Xb)+(Ya-Yb) där f och är jämförelsepunkten hos det skulle kunna användas som avstàndsmàttet, g är funktioner och (xa,yg handskrivna tecknet och (xb,y¿ förelsepunkten hos referenstecknet. är den motsvarande jäm- (Xæya) och skulle naturligtvis i stället kunna representera Särdragen (Xwyb) en riktningsvektor eller en krökningsvektor. lO 15 20 25 30 35 521 911 14 I den föredragna utföringsformen definierar tabellen avstàndsmàttet som det kvadrerade euklidiska avståndet mellan punkterna, d v s tabellen ger resultatet av (Xa"Xb) 2+ (Ya'Yb) 2 - Detta ger ett positivt värde för alla avstånd och ger vidare ett heltalsresultat om de två skillnaderna är heltal.
Koordinaterna för en jämförelsepunkt lagras i (Xfnya) en byte data. X-koordinaten lagras i databytens första nybble, lagras i följande nybble. d v s de första fyra bitarna, och y-koordinaten (Ya'Yb) efter- (xa-xb) och skulle då kunna beräknas simultant i en operation, Skillnaderna som lagringspositionerna för x- och y-värdena är kända. (ya-yb) och används som indata för den fördefinierade tabellen.
Skillnaderna (xíøg) och representeras i nio bitar Nämnda första nybble, d v s de första fyra bitarna, rep- resenterar skillnaden (xa-xb) och nämnda följande nybble (ya'yb) - indikatorbit som indikerar om skillnaden i y-koordinater- representerar skillnaden Den nionde biten är en na är negativ. För X-koordinaterna antas det att en skillnad på mer än àtta X-steg aldrig inträffar. Därför tolkas nämnda första nybble som en representation av intervallet [-7,81. Subtraktionen utförs genom att helt från enkelt subtrahera de åtta bitarna (xb,yb) (xa,ya). Om skillnaden i de fyra minst signifikanta bitarna, d v s bg-xb), är negativ kommer detta att påverka skillnaden (yá-yb). Resultatet i de fyra följande bitarna kommer då att bli (ya-yb)-l, och detta tas hänsyn till i den för- definierade tabellen. En tom bit skulle naturligtvis kunna placeras mellan x- och y-koordinaterna, vilken då skulle vara en indikatorbit för negativa värden för Enligt den föredragna utföringsformen antas (ya-yb) betydelse, när en skillnad av mer än 8 X-steg inträffar.
(Xa"Xb) - emellertid att felet som uppstår i inte har någon Om denna skillnad av fler än 8 X-steg skulle inträffa är 10 15 20 25 30 35 521 91 1 š.f-'jffiff'=,___f" ¿"_;-I'_';_¿"¿Iï::_ ïfij 15 tecknen som jämförs så olika att referenstecknet inte kommer att tolkas som det bäst överensstämmande tecknet.
Den fördefinierade tabellen består av 16 X 32 = 512 element. Alternativt skulle indikatorbiten för y-koordi- I sådant fall skulle tabellen bestå av endast 256 element. naterna också kunna ignoreras.
Om ett 16 X 16 rutnät används är det inte säkert att alla punkter är som mest 8 X-steg ifrån varandra. Bågar hos kinesiska tecken dras emellertid i huvudsak från vänster till höger eller nedåt, varför risken för förväx- ling är liten. Alternativt skulle ett 8 X 8 rutnät kunna användas, vilket innebär att endast 3 bitar skulle behöva användas för representation av varje koordinat. Detta skulle emellertid ge en upplösning som är för grov för kinesiska tecken, men skulle kunna användas för andra tillämpningar.
Uppslagningen i tabellen returnerar ett resultat för ett avstàndsmàtt. Denna bestämning av ett avstàndsmàtt, steg 30 och 32, drag hos det handskrivna tecknet. upprepas, steg 34, för alla positionssär- Sedan beräknas en kost- för definiering av likheten mellan nadsfunktion, steg 36, referenstecknet och det handskrivna tecknet. Denna kost- nadsfunktion skulle kunna vara en summa av alla de bes- tämda måtten. Resultatet för kostnadsfunktionen för refe- renstecknet kontrolleras, steg 38, för att ta reda på om det är det lägsta resultatet hittills för de jämförda referenstecknen. Om resultatet är det lägsta hittills, lagras detta och referenstecknet definieras, steg 40, som det hittills bäst överensstämmande referenstecknet.
Om summan för de bestämda avståndsmàtten hos ett referenstecken överstiger summan för det hittills bäst överensstämmande referenstecknet innan alla avstàndsmàtt har bestämts för referenstecknet skulle jämförelsen kunna avbrytas. I detta fall kasseras referenstecknet innan alla avstàndsmàtt har bestämts, eftersom summan av av- ståndsmàtten redan är för hög. 10 15 20 25 30 35 . ~ . . . . 521 91 1 ífï: fiiiëjíi a f* 16 Jämförelsen i stegen 30-38 upprepas för alla refe- renstecknen. Det referenstecken som är lagrat som det hittills bäst överensstämmande referenstecknet, när det handskrivna tecknet har jämförts med alla referenstecken, anses vara det bäst överensstämmande referenstecknet. Det bäst överensstämmande referenstecknet kan sedan presen- teras och användaren kan således kontrollera om det hand- skrivna tecknet har blivit korrekt igenkänt, såsom besk- rivs ovan i fig 2.
Med hänvisning till fig 5 beskrivs ett sätt att intelligent välja de referenstecken som har störst sanno- likhet att vara det korrekta tecknet. Referenstecknen i databasen delas upp i grupper baserat på det antal bågar som de består av. Det handskrivna tecknet jämförs sedan med de referenstecken som består av samma antal bågar, steg 50, vilket inledningsvis definierar en liten del av referenstecknen som de som har störst sannolikhet att vara det bäst överensstämmande tecknet.
När en användare drar ett handskrivet tecken skulle emellertid två bågar felaktigt kunna slås ihop eller en enda båge delas upp i två om användaren lyfter pennan mitt i bågen. Detta innebär att det handskrivna tecknet bör jämföras med referenstecken med ett nàgot skiljande' antal bågar. Positioneringen av bågarna i det handskrivna tecknet undersöks. Par av bågar, där den ena bàgen har sin ände nära början för den andra bàgen, slås ihop, steg 52, innan det handskrivna tecknet jämförs, steg 54, med referenstecken med ett antal bågar som motsvarar det nya antalet bågar i det handskrivna tecknet. Kombinationen av olika ihopslagna bågar jämförs med referenstecken med motsvarande antal bågar.
Vidare skulle en båge kunna delas upp, steg 56, genom att en brytpunkt sätts och att de två delarna av bågen på var sida om brytpunkten definieras som två en- skilda bågar. med referenstecken med ett antal bågar som mot- Sedan kan det handskrivna tecknet jämföras, steg 58, svarar det nya antalet bågar i det handskrivna tecknet. 10 15 20 25 30 35 6521911 17 Ihopslagningen och uppdelningen av bågar kan upprepas flera gånger och med olika kombinationer för att hitta ett på rätt sätt draget tecken.
Således jämförs aldrig en stor del av referensteck- nen med det handskrivna tecknet, eftersom dessa referens- tecken har ett antal bågar som skiljer sig för mycket från antalet bågar hos det handskrivna tecknet.
Hänvisning görs nu till fig 6, av vilken framgår att det handskrivna tecknet också skulle kunna ha en felaktig lutning. Det korrekt överensstämmande referenstecknet skulle då kunna hittas genom att en affin transformation görs, steg 60, av det handskrivna tecknet. En invariant av den affina transformationen skulle kunna beräknas, steg 62, för det handskrivna tecknet. Denna invariant används för jämförelse av det handskrivna tecknet med referenstecknen. Vektorprodukten beräknas, steg 64, mellan invarianten och referenstecknet. Om tecknen är identiska spänner de upp samma rum och därför kommer den inbördes vektorprodukten att vara noll. Vektorprodukten mellan invariaten och referenstecknet bestäms genom tabelluppslagning.
Som framgår av ovanstående måste ett stort antal jämförelser göras. Det handskrivna tecknet bör jämföras med många olika referenstecken. Vidare kan det handskriv- na tecknet ha dragits på ett något felaktigt sätt. I syfte att kompensera för detta behöver några transforma- tioner (ihopslagning av bägar, uppdelning av bågar, affina transformationer) göras för det handskrivna tecknet och de nya tecknen som erhålls från dessa trans- formationer måste jämföras med referenstecknen. Det är därför en stor fördel om jämförelsen mellan tecken är snabb. Detta åstadkommes genom tabelluppslagningen för bestämning av avståndsmått enligt uppfinningen.
Ovan har beskrivningen gjorts väsentligen pà basen att tecknen skrivs pà en skärm och detekteras samtidigt som de skrivs. Ett alternativ är att tecknen detekteras, exempelvis inläses, efter att de har skrivits på en bit 10 15 20 25 30 35 521 911 18 Detta rör handskrivna tecken, såväl som maskin- papper. skrivna. Detekteringen innefattar således, istället för åtgärden att igenkänna skärmskriften, åtgärden att läsa (skanna) Positionssärdrag för tecknen från pappersbiten. de lästa tecknen detekteras således och igenkänning kan utföras såsom beskrivs ovan.
Med hänvisning till fig 7 kommer en anordning enligt uppfinningen att beskrivas. En datahanteringsanordning 100, en PDA, eller liknande, såsom en dator, en mobiltelefon, en skanner innefattar en textinmatningsenhet 102 för inmatning av text genom manuell skrift. Datahanterings- anordningen 100 innefattar ett organ för detektering 104 av den inmatade texten. Organet för detektering 104 bestämmer positionssärdrag hos ett handskrivet tecken.
Datahanteringsanordningen 100 innefattar en databas 106 eller åtminstone åtkomst till en. Databasen inne- fattar referenstecken och representationer av deras ut- seende. Datahanteringsanordningen 100 innefattar vidare organ för jämförelse 108 av det detekterade, handskrivna tecknet med referenstecken i databasen enligt metoden som beskrivs ovan.
Organet för jämförelse 108 skulle kunna starta jäm- förelsen av det handskrivna tecknet samtidigt som inmat- ningen/skrivningen av tecknet pågår. Alternativt skulle jämförelsen kunna inledas genom en indikation från använ- daren att hela tecknet har inmatats.
Organet för jämförelse 108 returnerar ett referens- tecken som är det bäst överensstämmande med det hand- skrivna tecknet. Datahanteringsanordningen 100 presen- terar det bäst överensstämmande tecknet på en skärm 110 och är nu beredd att igenkänna ett nytt tecken.
När det bäst överensstämmande tecknet presenteras skulle användaren kunna bes kontrollera om det hand- skrivna tecknet har blivit korrekt igenkänt. Om använ- daren kasserar det bäst överensstämmande tecknet skulle datahanteringsanordningen 100 kunna presentera det näst 10 15 20 521 911 '''' " 19 bäst överensstämmande tecknet. Alternativt skulle använ- daren kunna bes inmata tecknet pä nytt.
Datahanteringsanordningen 100 skulle som ett annat alternativ kunna känna igen tecknen utan att användaren bes om ett godkännande/en kassering. En inmatad text skulle sedan kunna kontrolleras för korrekt stavning och grammatik och fel skulle kunna presenteras för användar- en. Användaren skulle sedan kunna korrekturläsa texten och korrigera de feltolkade tecknen.
Det skall betonas att den föredragna utföringsformen som beskrivs häri inte pà något sätt är begränsande och att mànga alternativa utföringsformer är möjliga inom ramen för det skydd som definieras av bifogade krav.
Exempelvis skulle rutnätet kunna vara av andra storlekar, t ex 8 x 8 eller 32 x 32, eller t o m av asymmetrisk storlek, sàsom 16 x 8. Det är emellertid lämpligt att rutnätet är en potens av tvâ, eftersom x- och y-koordi- naterna representeras med binära tal. Följaktligen skulle exempelvis 3 eller 5 bitar kunna användas för represen- tation av en koordinat.
Claims (22)
1. l. Metod för igenkänning av ett handskrivet tecken, vilken metod innefattar stegen att: bestämma ett flertal positionssärdrag, som defi- nierar det handskrivna tecknet, och jämföra det handskrivna tecknet med referenstecken, som är lagrade i en databas, sä att det bäst överens- stämmande referenstecknet hittas, varvid steget att jäm- föra innefattar stegen att: beräkna en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av referenstecknen, bestämma, tabell, beräknade skillnaden, genom uppslagning i en fördefinierad ett avstàndsmàtt, som är baserat pà den upprepa stegen att beräkna en skillnad och bestämma ett avstàndsmàtt för vart och ett av fler- talet positionssärdrag hos det handskrivna tecknet och beräkna en kostnadsfunktion, som är baserad på de bestämda avstàndsmàtten.
2. Metod enligt krav 1, vid vilken varje positions- särdrag är definierat av åtminstone tvà egenskaper och vid vilken steget att beräkna en skillnad mellan ett positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos referenstecknet innefattar beräk- nandet av en skillnad mellan varje egenskap hos posi- tionssärdraget hos det handskrivna tecknet och den mot- svarande egenskapen hos positionssärdraget hos referens- tecknet.
3. Metod enligt krav 2, vid vilken steget att beräk- na en skillnad för varje egenskap utförs i en enda opera- tion. /3 A- 10 15 20 25 30 35 521 911 21
4. Metod enligt något av föregående krav, vid vilken steget att bestämma positionssärdrag innefattar steget att bestämma ett läge för positionssärdrag i ett rutnät.
5. Metod enligt något av föregående krav, vid vilken positionssärdragen hos det handskrivna tecknet och refe- renstecknen innefattar koordinater för jämförelsepunkter.
6. Metod enligt krav 5, vid vilken steget att bes- tämma positionssärdrag innefattar steget att bestämma en x-koordinat och en y-koordinat för jämförelsepunkten i ett rutnät.
7. Metod enligt krav 6, vid vilken rutnätet är av en storlek på 16 X 16 positioner och koordinaterna för en jämförelsepunkt representeras av en databyte.
8. Metod enligt något av krav 5-7, vid vilken avs- tåndsmåttet som erhålls från tabelluppslagningen i den fördefinierade tabellen är en funktion av det euklidiska avståndet mellan jämförelsepunkten hos det handskrivna tecknet och en jämförelsepunkt hos referenstecknet.
9. Metod enligt något av föregående krav, vid vilken positionssärdragen hos det handskrivna tecknet och refe- renstecknen innefattar positioner och riktningar för jäm- förelsevektorer.
10. Metod enligt krav 9, vid vilken avståndsmàttet som erhålls från tabelluppslagningen i den fördefinierade tabellen är en funktion av en skillnad mellan krökningar- na för det handskrivna tecknet och referenstecknen.
11. ll. Metod enligt något av krav 4-10, vilken vidare innefattar steget att centrera det handskrivna tecknet i rutnätet innan steget att bestämma positionssärdragen hos det handskrivna tecknet utförs. 10 15 20 25 30 35 521911 22
12. Metod enligt något av föregående krav, vilken vidare innefattar steget att skala det handskrivna teck- net till en normaliserad storlek i enlighet med storleken för referenstecknen innan steget att bestämma positions- särdragen för det handskrivna tecknet utförs.
13. Metod enligt något av föregående krav, vilken vidare innefattar steget att bestämma antalet bågar som bildar det handskrivna tecknet.
14. Metod enligt krav 13, vid vilken steget att jäm- föra det handskrivna tecknet med referenstecken inne- fattar steget att inledningsvis jämföra det handskrivna tecknet med referenstecken som är bildade av samma antal bågar.
15. Metod enligt krav 13 eller 14, vid vilken steget att jämföra vidare innefattar steget att jämföra det handskrivna tecknet med referenstecken som är bildade av några få bågar färre än det handskrivna tecknet.
16. Metod enligt något av krav 13-15, vid vilken steget att jämföra vidare innefattar steget att jämföra det handskrivna tecknet med referenstecken som är bildade av några få bågar fler än det handskrivna tecknet.
17. Metod enligt något av krav 13-16, vid vilken en båge hos det handskrivna tecknet jämförs med en mot- svarande båge hos referenstecknet, varvid de motsvarande bågarna bestäms av den ordning i vilken bågarna hos det handskrivna tecknet dragits.
18. Metod enligt krav 17, vilken vidare innefattar steget att omorganisera ordningen för bågarna hos det handskrivna tecknet. 10 15 20 25 30 35 2521911 23
19. Anordning för igenkänning av ett handskrivet tecken och för omvandling av detta till ett digitalt format, vilken anordning innefattar: organ för bestämning av ett flertal positions- särdrag, som definierar de handskrivna tecknet, en databas vilken innefattar referenstecken, organ för jämförelse av det handskrivna tecknet med referenstecken i databasen så att det bäst överensstäm- mande referenstecknet hittas, vilket organ för jämförelse innefattar: organ för beräkning av en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av referenstecknen, en fördefinierad tabell, som definierar ett avstàndsmàtt, som är baserat pà skillnaderna i positionssärdrag, organ för bestämning av ett avstàndsmátt genom uppslagning i den fördefinierade tabellen och organ för beräkning av en kostnadsfunktion, som är baserad pà de bestämda avstàndsmåtten.
20. Anordning enligt krav 19, vid vilken ett posi- tionssärdrag innefattar två egenskaper, vilka definierar detta och vilka är lagrade i en datapost i databasen.
21. En bärbar anordning för datahantering, vilken innefattar ett tryckkänsligt område, som är anordnat för manuell skrift av ett tecken och en anordning enligt krav 19 för igenkänning av ett tecken som skrivits i det tryckkänsliga omràdet för omvandling av detta till ett digitalt format.
22. Ett datorprogram för igenkänning av ett hand~ skrivet tecken, vilket datorprogram innefattar: kod för bestämning av ett flertal positionssärdrag som definierar det handskrivna tecknet och 521 911 24 kod för jämförelse av det handskrivna tecknet med referenstecken, som är lagrade i en databas, sä att det bäst överensstämmande referenstecknet hittas, vilken kod för jämförelse innefattar: 5 kod för beräkning av en skillnad mellan ett av flertalet positionssärdrag hos det handskrivna tecknet och ett positionssärdrag hos ett av refe- renstecknen, kod för bestämning, genom uppslagning i en 10 fördefinierad tabell, av ett avstàndsmätt, som är baserat pà den beräknade skillnaden, kod för upprepning av stegen att beräkna en skillnad och bestämma ett avständsmätt för vart och ett av flertalet positionssärdrag hos det handskriv- l5 na tecknet och kod för beräkning av en kostnadsfunktion, som är baserad på de bestämda avständsmàtten.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0100114A SE521911C2 (sv) | 2001-01-15 | 2001-01-15 | Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken |
TW090102405A TW573280B (en) | 2001-01-15 | 2001-02-05 | Method, device and computer program for recognition of a handwritten character |
JP2002556828A JP2004518198A (ja) | 2001-01-15 | 2002-01-11 | 手書文字を認識するための方法、デバイス及びコンピュータプログラム |
US10/466,087 US7349576B2 (en) | 2001-01-15 | 2002-01-11 | Method, device and computer program for recognition of a handwritten character |
PCT/SE2002/000037 WO2002056242A1 (en) | 2001-01-15 | 2002-01-11 | Method, device and computer program for recognition of a handwritten character |
CN028036778A CN1488120B (zh) | 2001-01-15 | 2002-01-11 | 用于识别手写字符的方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0100114A SE521911C2 (sv) | 2001-01-15 | 2001-01-15 | Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken |
Publications (3)
Publication Number | Publication Date |
---|---|
SE0100114D0 SE0100114D0 (sv) | 2001-01-15 |
SE0100114L SE0100114L (sv) | 2002-07-16 |
SE521911C2 true SE521911C2 (sv) | 2003-12-16 |
Family
ID=20282632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SE0100114A SE521911C2 (sv) | 2001-01-15 | 2001-01-15 | Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken |
Country Status (6)
Country | Link |
---|---|
US (1) | US7349576B2 (sv) |
JP (1) | JP2004518198A (sv) |
CN (1) | CN1488120B (sv) |
SE (1) | SE521911C2 (sv) |
TW (1) | TW573280B (sv) |
WO (1) | WO2002056242A1 (sv) |
Families Citing this family (138)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7712053B2 (en) * | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
US8938688B2 (en) * | 1998-12-04 | 2015-01-20 | Nuance Communications, Inc. | Contextual prediction of user words and user actions |
US7720682B2 (en) | 1998-12-04 | 2010-05-18 | Tegic Communications, Inc. | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input |
US7881936B2 (en) * | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US7679534B2 (en) * | 1998-12-04 | 2010-03-16 | Tegic Communications, Inc. | Contextual prediction of user words and user actions |
AU5299700A (en) * | 1999-05-27 | 2000-12-18 | America Online, Inc. | Keyboard system with automatic correction |
US7030863B2 (en) * | 2000-05-26 | 2006-04-18 | America Online, Incorporated | Virtual keyboard system with automatic correction |
US7750891B2 (en) * | 2003-04-09 | 2010-07-06 | Tegic Communications, Inc. | Selective input system based on tracking of motion parameters of an input device |
US7610194B2 (en) * | 2002-07-18 | 2009-10-27 | Tegic Communications, Inc. | Dynamic database reordering system |
US7821503B2 (en) * | 2003-04-09 | 2010-10-26 | Tegic Communications, Inc. | Touch screen and graphical user interface |
US7286115B2 (en) * | 2000-05-26 | 2007-10-23 | Tegic Communications, Inc. | Directional input system with automatic correction |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8583440B2 (en) * | 2002-06-20 | 2013-11-12 | Tegic Communications, Inc. | Apparatus and method for providing visual indication of character ambiguity during text entry |
US7634729B2 (en) * | 2002-11-10 | 2009-12-15 | Microsoft Corporation | Handwritten file names |
US7284200B2 (en) * | 2002-11-10 | 2007-10-16 | Microsoft Corporation | Organization of handwritten notes using handwritten titles |
US7580551B1 (en) * | 2003-06-30 | 2009-08-25 | The Research Foundation Of State University Of Ny | Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples |
US7636083B2 (en) * | 2004-02-20 | 2009-12-22 | Tegic Communications, Inc. | Method and apparatus for text input in various languages |
US8095364B2 (en) * | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US8504606B2 (en) * | 2005-11-09 | 2013-08-06 | Tegic Communications | Learner for resource constrained devices |
US7587378B2 (en) * | 2005-12-09 | 2009-09-08 | Tegic Communications, Inc. | Embedded rule engine for rendering text and other applications |
US7580925B2 (en) * | 2006-04-19 | 2009-08-25 | Tegic Communications, Inc. | Efficient storage and search of word lists and other text |
US8913833B2 (en) * | 2006-05-08 | 2014-12-16 | Fuji Xerox Co., Ltd. | Image processing apparatus, image enlarging apparatus, image coding apparatus, image decoding apparatus, image processing system and medium storing program |
US7565624B2 (en) | 2006-06-30 | 2009-07-21 | Research In Motion Limited | Method of learning character segments during text input, and associated handheld electronic device |
US8395586B2 (en) | 2006-06-30 | 2013-03-12 | Research In Motion Limited | Method of learning a context of a segment of text, and associated handheld electronic device |
KR100801224B1 (ko) * | 2006-08-16 | 2008-02-05 | 장경호 | 사용자 필적 구현 시스템 및 방법 |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080154576A1 (en) * | 2006-12-21 | 2008-06-26 | Jianchao Wu | Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities |
US8225203B2 (en) * | 2007-02-01 | 2012-07-17 | Nuance Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8201087B2 (en) * | 2007-02-01 | 2012-06-12 | Tegic Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8103499B2 (en) * | 2007-03-22 | 2012-01-24 | Tegic Communications, Inc. | Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8299943B2 (en) * | 2007-05-22 | 2012-10-30 | Tegic Communications, Inc. | Multiple predictions in a reduced keyboard disambiguating system |
CN100533478C (zh) * | 2007-07-09 | 2009-08-26 | 华南理工大学 | 基于最优全局仿射变换的汉字合成实现方法 |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8416264B2 (en) | 2008-11-03 | 2013-04-09 | Sony Mobile Communications Ab | Method and device for optimizing an image displayed on a screen |
TWI385584B (zh) * | 2008-11-05 | 2013-02-11 | Avermedia Information Inc | 自動排列手寫字串之裝置及方法 |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8363947B2 (en) | 2010-07-31 | 2013-01-29 | International Business Machines Corporation | Handwritten character recognition based on frequency variations in characters |
CN103140862B (zh) * | 2010-09-30 | 2016-11-02 | 法国电信公司 | 用户界面系统及其操作方法 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8989492B2 (en) * | 2011-06-03 | 2015-03-24 | Apple Inc. | Multi-resolution spatial feature extraction for automatic handwriting recognition |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
TWI447619B (zh) * | 2011-12-15 | 2014-08-01 | Inventec Corp | 提供引導軌跡以輔助手勢輸入之系統及其方法 |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
CN103313212A (zh) * | 2012-03-16 | 2013-09-18 | 腾讯科技(深圳)有限公司 | 一种信息发送、接收的方法、发送终端及接收终端 |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR101392295B1 (ko) | 2012-12-17 | 2014-05-12 | 한승희 | 한글 필적의 음절단위 분석 장치 및 방법 |
JP6125333B2 (ja) * | 2013-05-31 | 2017-05-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10489051B2 (en) * | 2014-11-28 | 2019-11-26 | Samsung Electronics Co., Ltd. | Handwriting input apparatus and control method thereof |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN111222590B (zh) * | 2019-12-31 | 2024-04-12 | 咪咕文化科技有限公司 | 形近字确定方法、电子设备和计算机可读存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5580183A (en) * | 1978-12-12 | 1980-06-17 | Nippon Telegr & Teleph Corp <Ntt> | On-line recognition processing system of hand-written character |
JPS60136892A (ja) * | 1983-12-26 | 1985-07-20 | Hitachi Ltd | オンライン手書き図形認識装置 |
JPS60237580A (ja) | 1984-05-11 | 1985-11-26 | Hitachi Ltd | オンライン手書文字認識方式 |
JPS61182185A (ja) | 1985-02-06 | 1986-08-14 | Nippon Tsushin Kensetsu Kk | 手書き文字認識装置 |
JPH03282896A (ja) | 1990-03-30 | 1991-12-13 | Toshiba Corp | パターン認識装置 |
IL100198A (en) | 1991-11-29 | 1999-10-28 | Art Advanced Recognition Tech | Character recognition method |
US5901255A (en) * | 1992-02-07 | 1999-05-04 | Canon Kabushiki Kaisha | Pattern recognition method and apparatus capable of selecting another one of plural pattern recognition modes in response to a number of rejects of recognition-processed pattern segments |
US5774586A (en) * | 1994-05-04 | 1998-06-30 | Ncr Corporation | Method and apparatus for standardization of inputs to word recognition systems |
US6052481A (en) | 1994-09-02 | 2000-04-18 | Apple Computers, Inc. | Automatic method for scoring and clustering prototypes of handwritten stroke-based data |
JP3444561B2 (ja) | 1994-11-01 | 2003-09-08 | 株式会社東芝 | 文字認識方法及び文字認識装置 |
DE19511470C1 (de) * | 1995-03-29 | 1996-10-24 | Siemens Ag | Verfahren zur Ermittlung eines Referenzschriftzuges anhand einer Menge von schreiberidentischen Musterschriftzügen |
DE19511472C1 (de) * | 1995-03-29 | 1996-10-17 | Siemens Ag | Verfahren zur dynamischen Verifikation eines Schriftzuges anhand eines Referenzschriftzuges |
-
2001
- 2001-01-15 SE SE0100114A patent/SE521911C2/sv not_active IP Right Cessation
- 2001-02-05 TW TW090102405A patent/TW573280B/zh not_active IP Right Cessation
-
2002
- 2002-01-11 WO PCT/SE2002/000037 patent/WO2002056242A1/en active Application Filing
- 2002-01-11 US US10/466,087 patent/US7349576B2/en not_active Expired - Fee Related
- 2002-01-11 CN CN028036778A patent/CN1488120B/zh not_active Expired - Lifetime
- 2002-01-11 JP JP2002556828A patent/JP2004518198A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN1488120A (zh) | 2004-04-07 |
US7349576B2 (en) | 2008-03-25 |
SE0100114D0 (sv) | 2001-01-15 |
JP2004518198A (ja) | 2004-06-17 |
TW573280B (en) | 2004-01-21 |
US20040096105A1 (en) | 2004-05-20 |
SE0100114L (sv) | 2002-07-16 |
WO2002056242A1 (en) | 2002-07-18 |
CN1488120B (zh) | 2010-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
SE521911C2 (sv) | Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken | |
SE514377C2 (sv) | Teckenigenkänning | |
CN110866495A (zh) | 票据图像识别方法及装置和设备、训练方法和存储介质 | |
US8270721B2 (en) | Method and system for acquiring data from machine-readable documents | |
SE519014C2 (sv) | Metod och anordning för igenkänning av ett handskrivet mönster | |
US7369702B2 (en) | Template-based cursive handwriting recognition | |
EP1703444A2 (en) | Detecting an orientation of characters in a document image | |
CN111723807A (zh) | 使用端到端深度学习识别机打字符和手写字符 | |
CN109685870B (zh) | 信息标注方法及装置、标注设备及存储介质 | |
KR19990036622A (ko) | 비트맵 이미지의 처리 방법 및 처리 장치, 비트맵 이미지의처리를 행하는 이미지 처리 프로그램을 저장한 기억 매체 | |
JPH03161891A (ja) | 表形式文書読取装置 | |
JP4594952B2 (ja) | 文字認識装置及び文字認識方法 | |
CN114299529A (zh) | 基于医疗化验单图片的识别方法、存储介质及终端 | |
Wendling et al. | A new way to detect arrows in line drawings | |
JP3192468B2 (ja) | オンライン手書き文字認識装置及び認識方法 | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2001005804A (ja) | 文字認識装置を利用したデータベース登録方法 | |
Kar et al. | Line reconstruction and segmentation of words and characters using measures of central tendency and measures of dispersion | |
JPH11265422A (ja) | マーク認識方法及び装置並びに記録媒体 | |
JP5291034B2 (ja) | 楕円印検出及び楕円印自動正立処理装置 | |
CN113778281B (zh) | 辅助信息生成方法、装置及电子设备和存储介质 | |
JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
JPH10198766A (ja) | 文字認識装置及びその方法並びに記憶媒体 | |
JP3128357B2 (ja) | 文字認識処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
NUG | Patent has lapsed |