FI112403B - Menetelmä käsinkirjoitetun syötteen tunnistamiseksi - Google Patents

Menetelmä käsinkirjoitetun syötteen tunnistamiseksi Download PDF

Info

Publication number
FI112403B
FI112403B FI955609A FI955609A FI112403B FI 112403 B FI112403 B FI 112403B FI 955609 A FI955609 A FI 955609A FI 955609 A FI955609 A FI 955609A FI 112403 B FI112403 B FI 112403B
Authority
FI
Finland
Prior art keywords
substantially parallel
separation distance
distance
discrete
value
Prior art date
Application number
FI955609A
Other languages
English (en)
Swedish (sv)
Other versions
FI955609A0 (fi
FI955609A (fi
Inventor
John L C Seybold
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of FI955609A0 publication Critical patent/FI955609A0/fi
Publication of FI955609A publication Critical patent/FI955609A/fi
Application granted granted Critical
Publication of FI112403B publication Critical patent/FI112403B/fi

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Electrotherapy Devices (AREA)
  • Character Input (AREA)

Description

112403
Menetelmä käsinkirjoitetun syötteen tunnistamiseksi Tämä keksintö liittyy yleisesti käsialan tunnistamiseen ja erityisesti yksittäisten sanojen tunnistamiseen.
5
Ihmisen käsialan koneellinen tunnistus on hyvin vaikea ongelma, ja kynään perustuvien laskentalaitteiden räjähdysmäisesti lisääntyessä se on tullut tärkeäksi ratkaistavaksi ongelmaksi. Ihmisen käsialan koneellisella tunnis-10 tamisella on nykyisin monenlaisia sovelluksia.
Eräs esimerkki ihmisen käsialan koneellisen tunnistamisen nykyisestä sovelluksesta esiintyy "henkilökohtaisiksi digitaalisiksi avustajiksi" (personal digital assistant) 15 kutsutuissa tuotteissa, kuten EO- ja Newton-tuotteissa. Tämäntyyppisissä tuotteissa on tyypillisesti kosketusherkkä ruutu, johon käyttäjä voi käsin syöttää kirjoitusta. Näiden laitteiden tarkoituksena on digitoida käsinkirjoitettu syöte, kuten alfanumeerinen syöte, ja sen jälkeen käsitellä 20 syöte ja yrittää tunnistaa käsialan informaatiosisältö.
* Erään ennestään tunnetun käsialan tunnistustekniikan mukaan < # · ;,,.J tehdään paras määritys siitä, mikä kunkin jonossa oleva : alfanumeerinen merkki on, saadun merkkijonon muodostaessa * * * 25 tunnistustoiminnan tuloksen. Tällä ratkaisulla on joukko varjopuolia. Sen hankaluutena on esitettyjen syötteiden * · · ·;·. (tässä tapauksessa alfanumeeristen merkkien) välisten rajo- • · jen tunnistamisen vaikeus. Jos näitä rajoja ei ole pai- , . kallistettu oikein, niin on mahdotonta tunnistaa merkkiä • » 30 tarkasti, koska siitä joko puuttuu osia tai se käsittää ! ;*’ asiaankuulumatonta aineistoa viereisistä merkeistä.
: Eräs merkittävä ongelma ihmisen käsialan koneellisessa tunnistamisessa on kyky tunnistaa tietyn syötteen loppu ja 35 seuraavan syötteen alku. Merkittävä ongelma on esimerkiksi • tietyn käsinkirjoitetun syötesegmentin, sanan tai alfanu meerisen syötteen, lopun paikan erottaminen seuraavan 2 112403 käsinkirjoitetun syötesegmentin, sanan tai alfanumeerisen merkin alusta. Tällaisten käsinkirjoitetussa syötteessä I olevien katkosten huono tunnistus johtaa käsinkirjoitetun syötteen informaatiosisällön huonoon, epätarkkaan tunnistuk-5 seen.
On siis olemassa sellaisen käsialan tunnistustekniikan tarve, joka pystyy erottamaan ensimmäisen käsinkirjoitetun syötesegmentin lopun toisen käsinkirjoitetun syötesegmentin 10 alusta käsinkirjoitetussa syötteessä ja suorittamaan siten käsinkirjoitetun syötteen informaatiosisällön tarkemman tulkinnan.
US-patentti 5033097 kuvaa merkkientunnistusmenetelmän, joka 15 käyttää "pystyprojektiota" segmentoinnin aikaansaamiseksi.
Ensimmäisessä vaiheessa segmenttisijainti valitaan alustavasti. Tämän valinnan ehtoon liittyy pystysuuntaisen projektion merkkiviivakuvassa näkyvien valkeiden ja mustien alueiden leveyksiin perustuva arviointi. Toisessa vaiheessa 20 merkkiviivakuva jaetaan kuvaosiin segmenttiasennossa kuvaosien erottamiseksi.
US-patentti 5033097 luettelee useita ehtoja sen .J : määrittämiseksi käsitelläänkö segmenttejä yhdessä vaiko : 25 erikseen. Nämä ehdot vaativat kirjoitusta sisältävien ja ei- • kirjoitusta sisältävien merkkivirran osien pituuden mittausta. Ehdot sisältävät kynnyksiä, joita mitatut pituudet joko ylittävät tai eivät ylitä.
* 1 · 3 0 IBM Journal of Research and Development, voi. 27 no. 4, ';· Heinäkuu 1983, Armonk, NY, sivut 386-99, sisältää R.G.
W1 Caseyn artikkelin "A processor based OCR system". Tämä järjestelmä kuvaa erityisen menetelmän segmentointia varten, jossa kahdella merkillä ei ole eroa kirjoituksen suunnassa, » » 1 ! 35 toisin sanoen ne ovat päällekkäin. Tämä voi tapahtua kun ‘ merkki roikkuu tekstissä toisen päällä.
i j i 112403 3
Caseyn artikkeli selittää menetelmän päällekkäisen alueen jakamiseksi ruudukoksi, jossa on useita vaakasuuntaisia vyöhykkeitä. Sitten menetelmä yrittää määritellä joukon vierekkäisiä pystysuuntaisia tyhjiä osuuksia. Vasemman ja 5 oikeimmanpuoleiset joukot näistä tyhjistä osuuksista käsitellään segmentointipisteinä päällekkäisille merkeille.
Kuvio 1 esittää esillä olevan keksinnön parhaana pidetyn suoritusmuodon toimintavuokaaviota.
10
Kuvio 2 esittää esillä olevan keksinnön parhaana pidetyn suoritusmuodon mukaisen kuvaavan näytön graafista kuvaa.
Kuvio 3 esittää esillä olevan keksinnön parhaana pidetyn 15 suoritusmuodon mukaisen kuvaavan näytön graafista kuvaa.
Kuvio 4 esittää esillä olevan keksinnön vaihtoehtoisen parhaana pidetyn suoritusmuodon mukaisen kuvaavan näytön graafista kuvaa.
20
Kuvio 5 esittää esillä olevan keksinnön parhaana pidetyn V suoritusmuodon mukaisen kuvaavan näytön graafista kuvaa.
• I * · 1 2 .'j: Käsinkirjoitettu merkkisyöte vastaanotetaan käyttäjältä • 25 tyypillisesti erillisten yhtäjaksoisten segmenttien muodos- • 1 1 1 sa. Erillinen yhtäjaksoinen segmentti käsittää yhden tai «M · useampia kynän piirtoja, missä kynän piirto on kynän jättämä jälki sen ollessa kosketuksessa syöttölaitteen kuten digi-, toivan koordinaatinlukijän tai paperin kanssa. Piirto 1 · 30 esitetään pistesekvenssinä, jossa olevat pisteet syöttölaite on näytteittänyt likimäärin säännöllisin välein. Kukin piste kuvataan ainakin X- ja Y-koodinaatilla. Piirrot voidaan kaapata elektronisesti digitoivaa koordinaatinlukijaa käyttäen tai vaihtoehtoisessa suoritusmuodossa ne voidaan t 1 · I 35 johtaa kuvanlukijalla luetusta tai telekopioidusta kuvasta 2 kuvassa olevien viivojen ilmaisumenetelmällä; tällaiset menetelmät kaappauksen suorittamiseksi elektronisesti ovat 112403 i 4 i | alalla ymmärrettyjä.
Esillä oleva selitettävä keksintö yleisesti ottaen ratkaisee, muodostavatko käsinkirjoitetun syötteen kaksi erillistä 5 yhtäjaksoista segmenttiä saman käsinkirjoitetun syötteen osan vai ovatko ne useamman kuin yhden erillisen käsinkirjoitetun syötteen osia. Esillä olevassa keksinnössä yksi tai useampi erillinen yhtäjaksoinen segmentti ovat tunnistettavan käsinkirjoitetun syötteen yksiköitä. Käsin-10 kirjoitettu syöte on sellainen elektronisesti kaapattu syöte, joka sisältää seuraavia mutta ei niihin rajoittuen: käsinkirjoitettu syöte, elektroninen syöte, paineen avulla kaapattu syöte kuten leimattu syöte, elektronisesti, kuten telekopiona, hakulaitteelta tai muulta laitteelta, vas-15 taanotettu syöte. Esillä oleva keksintö ratkaisee esimerkiksi, muodostavatko kaksi erillistä yhtäjaksoista segmenttiä osan samasta sanasta vai muodostavatko ne osan erillisistä sanoista. Parhaana pidetyssä menetelmässä esillä oleva keksintö laskee yhden tai useamman olennaisesti 20 samansuuntaisen etäisyyden, jotka on asetettu samansuuntaisiksi kirjoitusakseliin nähden, ja vertaa näitä V · etäisyyksiä yhteen tai useampaan ennalta määrättyyn kyn- nykseen. Nämä ennalta määrätyt kynnykset määrittelevät ne : : : etäisyyksien vähimmäismitat, jotka mainittujen olennaisesti • 1 » 25 samansuuntaisten etäisyyksien täytyy ylittää, jotta mainitut I t t · : erilliset yhtäjaksoiset segmentit arvosteltaisiin kuuluviksi »t » · toisistaan erottuviin käsinkirjoitettuihin syötteisiin, • · » • «Il esimerkiksi toisistaan erottuviin käsinkirjoitettuihin . sanoihin. Kirjoitusakseli on viiva, jonka suunnassa mai- 30 nittua käsinkirjoitettua syötettä lisätään. Kirjoitussuunta i 1 ·;1’ on se suunta, jossa kukin peräkkäinen käsinkirjoitettu syöte : ; '. lisätään. Englanninkielessä käsinkirjoitettu syöte lisätään tyypillisesti vaakasuuntaisen kirjoitusakselin suunnassa kunkin peräkkäisen alfanumeerisen syötteen seuratessa # » · ; 1, 35 vaakasuunnassa edellistä syötettä kirjoitussuunnassa, joka ’· 1 on vasemmalta oikealle. Esillä olevan keksinnön oppeja toteutettaessa erilaiset muut kirjoitusakseli- ja kir- 5 112403 joitussuuntavaihtoehdot ovat mahdollisia.
Parhaana pidetyssä suoritusmuodossa käsinkirjoitusakseli on vaakasuuntainen, ja käsinkirjoitettu syöte muodostaa 5 sanajonon. Tässä parhaana pidetyssä suoritusmuodossa mainitut olennaisesti samansuuntaiset etäisyydet lasketaan vaakasuuntaisesti, ja saatu tulos kertoo, kuuluvatko erilliset yhtäjaksoiset segmentit eri sanoihin. Vaihtoehtoisessa parhaana pidetyssä suoritusmuodossa käsinkirjoitusakseli on 10 vaakasuuntainen, ja käsinkirjoitettu syöte muodostaa erillisten merkkien jonon, jotka merkit voivat olla alfanumeerisia merkkejä, ideografisia merkkejä, jollaisia esiintyy sellaisissa kielissä kuin kiina, tai muita kirjoitetun viestinnän merkki- tai symbolimuotoja. Tässä 15 vaihtoehtoisessa suoritusmuodossa saatu tulos kertoo, kuuluvatko mainitut erilliset yhtäjaksoiset segmentit eri merkkeihin. Eräässä toisessa parhaana pidetyssä suoritusmuodossa käsinkirjoitusakseli on pystysuuntainen, ja käsinkirjoitettu syöte muodostaa erillisten merkkien jonon, 20 jotka merkit voivat olla alfanumeerisia merkkejä, ideografisia merkkejä tai muuta käsinkirjoitettuja tekstejä. Tässä V ·" parhaana pidetyssä suoritusmuodossa kirjoitusakseli on • * '1 • ifi! pystysuuntainen, ja mainitut olennaisesti samansuuntaiset : : etäisyydet on suunnattu pystysuuntaan; saatu tulos kertoo, i * » • 25 kuuluvatko mainitut erilliset yhtäjaksoiset segmentit eri > 4 · * ; merkkeihin. Lisäksi vielä eräässä toisessa parhaana •; ·, pidetyssä suoritusmuodossa käsinkirjoitusakseli on > $ i pystysuuntainen, ja käsinkirjoitettu teksti muodostaa , . erillisten sanojen jonon, alfanumeerisen syötteen tai muun 30 käsinkirjoitetun syötteen, kuten pystysuuntaisen sanojen tai » lukujen luettelon. Tässä parhaana pidetyssä suoritusmuodossa ^ ί kir joitusakseli on pystysuuntainen, ja mainitut olennaisesti samansuuntaiset etäisyydet on suunnattu pystysuuntaan; saatu tulos kertoo, kuuluvatko mainitut erilliset yhtäjaksoiset ; 35 segmentit erillisiin käsinkirjoitettuihin syötteisiin, kuten '· eri sanoihin. Kuten edellä on esitetty ja kuten jäljempänä on lähemmin esitetty, esillä oleva keksintö osoittaa useiden 6 112403 parhaana pidettyjen suoritusmuotojen selityksen avulla, että kirjoitusakseli voi olla missä tahansa kulmassa ja että käsinkirjoitetun syötteen voidaan tulkita yleisemmin vastaavan erillisiä elementtejä (merkit ja sanat 5 mukaanluettuna mutta ei rajoittavassa mielessä), jotka sisältävät yhden tai useamman erillisen yhtäjaksoisen segmentin. Tässä selitettyjen menetelmien soveltaminen mihin tahansa erilaisista parhaana pidetyistä suoritusmuodoista vaatii ainoastaan käytettävän koordinaattijärjestelmän 10 vaihtamisen, ja tällaiset muunnokset voidaan tehdä esitettyjen oppien mukaan.
Kuviossa 1 on esitetty esillä olevan keksinnön parhaana pidetty menetelmä. Esillä oleva keksintö on sovellettavissa 15 yhteen tai useampaan erillisten yhtäjaksoisten segmenttien muodostamaan käsinkirjoitettuun syötteeseen. Vain kahden erillisen yhtäjaksoisen segmentin Si ja S2 käyttö on esitetty vain kuvaustarkoituksissa. Kuviossa 1 esitetyssä parhaana pidetyssä suoritusmuodossa kahden erillisen 20 yhtäjaksoisen segmentin Si ja S2 muodostama käsinkirjoitettu syöte vastaanotetaan (110) laitteella, kuten PDA:11a tai muulla laitteella. Muihin laitteisiin, joiden tarkoituksena on käsinkirjoitetun syötteen vastaanottaminen, kuuluvat seu-raavat mutta ei niihin rajoittuen: tietokoneet, modeemit, : : 25 hakulaitteet, puhelimet, digitaaliset televisiot, vuoro- • · 1 vaikutteiset televisiot, laitteet joissa on digitoiva • · · :'j*; koordinaatinlukija, telekopiointilaitteet, kuvanlukulaitteet ja muut laitteet, jotka pystyvät kaappaamaan käsin- ·,·. kirjoitetun syötteen. Parhaana pidetään, että käsinkirjoi- 30 tettua syötettä vastaanotettaessa määritetään (120) mai- ;* nittujen erillisten yhtäjaksoisten segmenttien Si ja S2 väliset olennaiset kohtisuorat rajat bi ja b2. Rajat bi ja b2, jotka ovat olennaisesti kohtisuorassa kirjoitusakselia vastaan, määritetään etsimällä se piste piirtojen jonossa ‘ 35 Si, jolla on suurin siirtymä kirjoitussuunnassa, sekä se * · piste piirtojen jonossa S2, jolla on pienin siirtymä kir joitussuunnassa (12 0) . Olennaisesti kohtisuora raja bi on 7 112403 i ! sen piirtojen jonossa Si olevan pisteen siirtymäarvo, jolla on suurin siirtymä kirjoitussuunnassa. Olennaisesti kohtisuora raja b2 on sen piirtojen jonossa S2 olevan pisteen siirtymäarvo, jolla on pienin siirtymä kirjoitus-5 suunnassa. Laskemalla kunkin Si:ssä olevan pisteen siirtymä kirjoitussuunnassa vuoron perään ja vertaamalla tätä arvoa tallennettuun arvoon, joka on aluksi hyvin suuri negatiivinen luku, voidaan määrittää se olennaisesti kohtisuora raja bi, jolla on suurin siirtymä kirjoitussuun-10 nassa. Jos laskettu siirtymäarvo on suurempi kuin tallennettu arvo, niin tallennettu arvo korvataan lasketulla siirtymäarvolla. Sen jälkeen kun kaikki pisteet on tutkittu, tallennettu arvo sisältää suurimman piirtojen jonosta löydetyn siirtymäarvon. Samanlaista menettelyä alkaen suu-15 rella positiivisella alkuarvolla voidaan käyttää sen pisteen löytämiseksi S2:sta, jolla on pienin siirtymä kirjoitussuunnassa, laskemalla kunkin S2:ssä olevan pisteen siirtymä kirjoitussuunnassa vuoron perään ja vertaamalla tätä arvoa tallennettuun arvoon, joka on aluksi hyvin suuri 20 positiivinen luku. Jos laskettu siirtymäarvo on pienempi kuin tallennettu arvo, niin tallennettu arvo korvataan lasketulla siirtymäarvolla. Parhaana pidetty menetelmä laskee sen jälkeen ensimmäisen olennaisesti samansuuntaisen etäisyyden d', jossa d' = b2 - bi (130) .
25 t » ,·. Kuvion 1 mukaan ensimmäistä olennaisesti samansuuntaista V * · ·;·. etäisyyttä d1 verrataan ensimmäiseen ennalta määrättyyn » · kynnykseen t'. Jos d' on suurempi tai yhtäsuuri kuin (>=) , , t', niin parhaana pidetty menetelmä päättelee, että ensim- • 1 30 mäinen yhtäjaksoinen erillinen segmentti Si ja toinen yhtä- ···* jaksoinen erillinen segmentti S2 kuuluvat käsinkirjoitetun V: syötteen eri segmentteihin (145) . Esimerkiksi jos d' on suurempi kuin (>) t', niin parhaana pidetty menetelmä päättelee, että Si ja S2 ovat käsinkirjoitetun syötteen eri * » 35 sanoja, merkkejä tai muita elementtejä. Ennalta määrätyn •kynnyksen t' valinta tehdään kunkin erityisen suoritusmuodon mukaan. Kynnyksen t' valintaa on tarkasteltu 8 112403 yksityiskohtaisemmin toisaalla.
Jos d':n arvon on pienempi kuin kynnysarvo t', niin tapahtuu jatkokäsittely. Sen ratkaisemiseksi, muodostavatko erilliset 5 yhtäjaksoiset segmentit Si ja S2 käsinkirjoitetun syötteen toisistaan erottuvat erilliset yhtäjaksoiset segmentit, kuten eri sanat, merkit tai muut elementit, lasketaan toinen olennaisesti samansuuntainen etäisyys d" . Tämä toinen olennaisesti samansuuntainen etäisyys d" määritetään 10 laskemalla useita olennaisesti samansuuntaisia etäisyyksiä ja valitsemalla lyhin näistä etäisyyksistä. Parhaana pidetyssä suoritusmuodossa tämä tehdään laskemalla ensin Si:n ja S2:n yhteinen ääripisteiden välinen kirjoitusakselia vastaan kohtisuora kokonaisulottuvuus (150). Tämä ulottuvuus 15 jaetaan sen jälkeen useisiin yhtä korkeisiin kaistoihin, jotka ovat olennaisesti samansuuntaiset kirjoitusakseliin nähden (160). Sen jälkeen määritetään mainittu olennaisesti samansuuntainen etäisyys SI:n ja S2:n välillä kullakin kaistalla (17 0) . Pienin eli lyhin olennaisesti samansuuntainen 20 etäisyys Si:n ja S2:n välillä mainittujen useiden kaistojen , . joukossa valitaan d":ksi (180) . Kuviossa 1 esitetyssä ^ * parhaana pidetyssä menetelmässä mainitun olennaisesti vaa- ’···* kasuuntaisen etäisyyden d" määrittämisen jälkeen etäisyys d" ja ensimmäinen olennaisesti vaakasuuntainen etäisyys d’ yh-·,: - 25 distetään auttamaan lopullista ratkaisua sen suhteen, ovatko j : .* Si ja S2 saman käsikirjoitetun syötteen osia vai ovatko ne käsinkirjoitetun syötteen toisistaan erottuvien erillisten jatkuvien segmenttien osia. Lasketaan d' :n ja d":n painotettu keskiarvo. Parhaana pidetty yhtälö painotetun ,···, 30 keskiarvon laskemiseksi on q'd' + q"d"/(q' + q") .
'·’ Empiirisillä testeillä todellisella käsinkirjoitetulla ta» datalla on havaittu, että d' :n ja d" :n painotettu keskiarvo * · · on tarkempi kuin jompikumpi näistä yksinään. Eräässä parhaana pidetyssä suoritusmuodossa q' =q", mutta saattaa .·. : 35 olla mahdollista vielä optimoida tätä valitsemalla q' ja q" • * t • » | järkevällä tavalla erisuuriksi. Lisäksi q' ja q" voivat kumpikin olla nollan suuruiset, mutta eivät samanaikaisesti.
9 112403
Painotettua keskiarvoa verrataan toiseen kynnykseen t". Jos painotettu keskiarvo on pienempi kuin t", niin parhaana pidetty menetelmä päättelee, että Si ja S2 ovat käsinkir-5 joitetun syötteen saman segmentin osia (197). Jos painotettu keskiarvo on suurempi tai yhtäsuuri kuin t", niin parhaana pidetty menetelmä päättelee, että Si ja S2 ovat käsinkirjoitetun syötteen toisistaan erottuvat yhtäjaksoiset erilliset segmentit, ja parhaana pidetty menetelmä lopettaa 10 tähän tulokseen (199).
Parhaana pidetty menetelmä t':n ja t":n valitsemiseksi on erityisen suoritusmuodon yksityiskohta. Eräässä suoritusmuodossa t’ voidaan asettaa mittaamalla d' :n arvo suuresta 15 datajoukosta ja valitsemalla se arvo, joka parhaiten erottaa todelliset jakopisteet virheellisistä vaihtoehdoista. Eräässä toisessa parhaana pidetyssä suoritusmuodossa t' voidaan asettaa vakioarvoksi, joka vastaa syöttölaitteen syöttöohjäimien välisen etäisyyden jotakin murto-osaa. 20 Eräässä toisessa parhaana pidetyssä suoritusmuodossa t' voi vaihdella dynaamisesti Si:n ja S2:n kohtisuoraan kir- • · · ’·’ ’ joitusakselia vastaan mitatun ulottuvuuden murto-osana.
* « * *··· Eräässä toisessa suoritusmuodossa käyttäjä voi asettaa t’:n eksplisiittisesti ennen menetelmän herättämistä. Kuvatussa • » ·.· * 25 parhaana pidetyssä suoritusmuodossa t' asetetaan l/3:ksi : : : Sj:n ja S2:n kohtisuoraan kirjoitusakselia vastaan mitatusta ulottuvuudesta, mikä antaa hyvän tuloksen englanninkielisellä alfanumeerisella tekstillä. Monet muut tavat t':n asettamiseksi ovat harkittavissa ja voivat olla • #
• I
,···, 30 optimaalisia eri ratkaisuissa. Eri tavat t" :n määrittämi- seksi eri suoritusmuodoissa ovat samalaisia kuin kuvatut ,V tavat t':n määrittämiseksi.
Kuviossa 2 on annettu graafinen esitys erään parhaana pi- 1 » » .·, : 35 detyn suoritusmuodon osalta. Tässä suoritusmuodossa eril liset yhtäjaksoiset segmentit Si (210) ja S2 (220) vastaavat englanninkielen sanoja, kirjoitusakseli (230) on vaa- 10 112403 kasuuntainen ja kirjoitussuunta (270) on vasemmalta oikealle. Tässä parhaana pidetyssä suoritusmuodossa minkä tahansa pisteen siirtymä kirjoitussuunnassa on yksinkertaisesti tämän pisteen X-koordinaatin arvo, joten olennaisesti 5 samansuuntainen raja bi (240) on Si:n (210) oikeanpuoleisimman pisteen X-koordinaatin arvo ja olennaisesti samansuuntainen raja b2 (250) on S2--n (220) vasemmanpuo- leisimman pisteen X-koordinaatin arvo. Olennaisesti samansuuntainen etäisyys d' (260) on bi:n ja b2:n välinen etäi-10 syys.
Vaihtoehtoisesti kuten kuviossa 3 on esitetty, erilliset yhtäjaksoiset segmentit Si (310) ja S2 (320) vastaavat kiinalaisia merkkejä, kirjoitusakseli (330) on pystysuun-15 täinen ja kirjoitussuunta (370) on ylhäältä alas. Tässä suoritusmuodossa siirtymä kirjoitussuunnassa (370) millä tahansa pisteellä on yksinkertaisesti tämän pisteen Y-koordinaatin arvo kerrottuna -l:llä (oletuksena normaali koordinaattijärjestelmä, jossa Y-suurenee alhaalta ylöspäin 20 siirryttäessä), joten olennaisesti kohtisuora raja bl (340) on Si:n (310) alimman pisteen Y-koordinaatin arvo kertaa -1 ja olennaisesti kohtisuora raja b2 (350) on S2:n (320) ylimmän pisteen Y-koordinaatin arvo kertaa -1.
25 Toisissa suoritusmuodoissa bi:n ja b2:n arvot voidaan laskea jj soveltamalla käsinkirjoitetun syötteen yksinkertaista :: : geometrista kiertoa kirjoitusakselin suuntaamiseksi koordinaattijärjestelmän jommankumman pääakselin suuntai- |\\ seksi ja soveltamalla sitten edellä kuvattua menettelyä.
.···, 3 0 Tämä on suoraviivainen vaihe, joka on ymmärrettävissä tässä • » ·* esitettyjen oppien yhteydessä. Vaihtoehtoisesti toiset
* I
V.' suoritusmuodot voivat laskea pisteiden siirtymät ·...· kirjoitussuunnassa, jos kirjoitussuunta ei yhdy koordinaat- .V. tiakselin jompaankumpaan pääakseliin, erillisten yhtäjak- .·, ; 35 soisten segmenttien yksinkertaisella geometrisella pro- » * » jisioimisella kirjoitusakselille ja käyttämällä sen jälkeen trigonometriaa projisioitujen pisteiden siirtymän 11 112403 koordinaattijärjestelmän origosta laskemiseksi. Tämä on hyvin ymmärrettävä matemaattinen menettely, jota voidaan soveltaa tässä esitettyihin oppeihin.
5 Kuten edellä on esitetty, jos d' on pienempi kuin t', niin käsittely jatkuu. Monissa tapauksissa segmentit, jotka todellisuudessa kuuluvat eri sanoihin tai merkkeihin, on sijoitettu sillä tavoin, että d' on pienempi tai jopa negatiivinen, mutta on silti mahdollista ratkaista, että Si 10 ja S2 kuuluvat eri sanoihin tai merkkeihin. Kuvio 4 esittää esimerkkiä tästä tilanteesta eräällä suoritusmuodolla, missä Si (410) ja S2 (420) ovat englanninkielen sanoja. Tässä esimerkissä d' (460) on todellisuudessa negatiivinen, ja bi (440) on suurempi kuin b2 (450) . Tässä esimerkissä 15 kirjoitusakseli (430) on vaakasuuntainen ja kirjoitussuunta (470) on vasemmalta oikealle.
Eräässä suoritusmuodossa, jossa kirjoitusakseli on vaakasuuntainen, Si:n ja S2:n suurin ääripisteiden välinen kir-20 joitusakselia vastaan kohtisuora ulottuvuus lasketaan määrittämällä Si:ssä ja S2:ssa esiintyvät suurin ja pienin Y- * * koordinaattiarvo. Pienimmän Y-koordinaattiarvon määrittä- * i * miseksi tallennetulle arvolle asetetaan aluksi hyvin suuri • t * positiivinen arvo ja sen jälkeen Si:n ja S2-'n jokainen piste i.j j 25 tutkitaan vuoron perään, ja jos sen Y-koordinaattiarvo on • * jj j pienempi kuin tallennettu arvo, niin tallennetuksi arvoksi sijoitetaan tämä Y-koordinaattiarvo. Samanlaista menetelmää käytetään suurimman Y-koordinaattiarvon määrittämiseksi. Vähentämällä suurin ja pienin Y-koordinaattiarvo toisistaan * · ,···, 30 voidaan laskea kir joitusakselia vastaan kohtisuora ·' ulottuvuus. Kaikki Sun ja S2:n pisteet ovat tämän v.· ulottuvuuden rajoissa.
Parhaana pidetyssä suoritusmuodossa tämä menettely voidaan » , . ; 35 tehdä tehokkaammaksi tarkastelemalla vain Si*.ssä ja S2:ssa olevien pisteiden osajoukkoa siten, että tarkastellaan vain kiinteätä määrää pisteitä kyseessä olevan rajan lähellä.
12 112403 j koska nämä ovat sellaisia, jotka todennäköisimmin vaikuttavat johdettavaan mittausarvoon.
Eräässä vaihtoehtoisessa suoritusmuodossa, jossa kirjoi-5 tusakseli on pystysuuntainen, Si:n ja S2:n suurin ääripis-teiden välinen kirjoitusakselia vastaan kohtisuora ulottuvuus lasketaan määrittämällä pienin ja suurin Si:ssä ja S2:ssa esiintyvä X-koordinaattiarvo. Pienimmän X-koordi-naattiarvon määrittämiseksi tallennetulle arvolle asetetaan 10 aluksi hyvin suuri positiivinen arvo ja sen jälkeen Si:n ja S2--n jokainen piste tutkitaan vuoron perään, ja jos sen X-koordinaattiarvo on pienempi kuin tallennettu arvo, niin tallennetuksi arvoksi sijoitetaan tämä X-koordinaattiarvo. Samanlaista menetelmää käytetään suurimman X- 15 koordinaattiarvon määrittämiseksi. Vähentämällä suurin ja pienin X-koordinaattiarvo toisistaan voidaan laskea kirjoitusakselia vastaan kohtisuora ulottuvuus.
Eräässä vaihtoehtoisessa suoritusmuodossa, jossa kirjoi-20 tusakseli ei ole vaakasuuntainen eikä pystysuuntainen, kuvatasoa voidaan kiertää kirjoitusakselin suuntaamiseksi koordinaatti järjestelmän X- tai Y-akselin suuntaiseksi, kuten edellä on kuvattu, laskettaessa mainittu olennaisesti samansuuntainen etäisyys d' , jos kirjoitusakseli ei olisi : 25 vaakasuuntainen eikä pystysuuntainen.
• · · • · » • i t · : : : Kirjoitusakselia vastaan kohtisuoran ulottuvuuden määrittä misen jälkeen parhaana pidetty suoritusmuoto jakaa tämän ulottuvuuden olennaisesti kir joitusakselin kanssa saman-.*··, 30 suuntaisiin kaistoihin siten, että kukin kaista kuvaa ka- i · peata Si:n ja S2:n poikki kulkevaa viipaletta. Kullakin ‘f kaistalla määritetään suurimman siirtymän kirjoitussuunnassa i « t omaava piste Si:ssä sekä määritetään pienimmän siirtymän kirjoitussuunnassa omaava piste S2:ssä. Mitä Si-.een tulee, I » . \ : 35 tämä voidaan tehdä tehokkaasti asettamalla tallennetulle arvolle kullakin kaistalla hyvin suuri negatiivinen alkuarvo. Kukin piste SI:ssä tutkitaan vuoron perään. Ensin 13 112403 tarkistetaan sen siirtymä kohtisuorassa kirjoitusakselia vastaan sen toteamiseksi, millä kaistalla se sijaitsee. Koska kaistat kattavat Si:n ja S2:n koko ulottuvuuden kirjoitusakselia vastaan kohtisuorassa suunnassa, niin on 5 taattu, että mille tahansa Si:ssä ja S2:ssa olevalle pisteelle on määritettävissä kaista. Edellä kuvatussa suoritusmuodossa, jossa kohtisuora ulottuvuus lasketaan tarkastelemalla vain Si:ssä ja S2:ssa olevien pisteiden osajoukkoa, mainittu kohtisuora ulottuvuus ei ehkä sisällä kaikkia 10 Si.-ssä ja S2:ssa olevia pisteitä, ja siten jokainen piste täytyy tarkistaa, jotta taattaisiin että se on jollakin kaistalla. Ellei se ole, sitä ei tarkastella enempää. Sen jälkeen kun kaista on määritetty, pisteen siirtymää kirjoitussuunnassa verrataan tätä kaistaa vastaavaan 15 tallennettuun arvoon, ja jos siirtymä on suurempi, niin se sijoitetaan tallennetuksi arvoksi. Sen jälkeen kun kaikki SI:ssä olevat pisteet on tällä tavoin tarkistettu, tallennettu arvo kullakin kaistalla sisältää pisteen suurimman siirtymän yhdessä suurimman tavatun siirtymän kanssa 20 tällä kaistalla Sirssä. Jos Si:ssä ei olisi yhtään tietyllä kaistalla sijaitsevaa pistettä, niin tallennettu arvo pysyy • > · ’ mainittuna hyvin suurena negatiivisena alkuarvona.
* · *·..* Samanlaista menettelyä käyttäen kullakin kaistalla toista ·..·.· tallennettua arvoa, jonka alkuarvo on asetettu hyvin ·/’ · 25 suureksi positiiviseksi luvuksi, käytetään S2:n suhteen : : : sellaisen pisteen minimi siirtymän määrittämiseksi, jolla on :’:’j pienin siirtymä kirjoitussuunnassa kullakin kaistalla S2:ssa. Jos S2.-ssa ei tietyllä kaistalla ole yhtään pistettä, niin tämän kaistan toinen tallennettu arvo pysyy • ' t I | 3 0 suuressa alkuarvossaan.
Tämän suoritusvaiheen lopussa kutakin kaistaa kohti on kaksi • » * tallennettua arvoa, jotka vastaavat Si:n suurinta siirtymää kirjoitussuunnassa ja S2:n pienintä siirtymää > t · ,·, ; 35 kirjoitussuunnassa asianomaisella kaistalla. Jos kumpikaan tallennettu arvo ei ole muuttunut hyvin suuresta negatiivisesta tai positiivisesta alkuarvostaan, niin asianomaista 14 1 12403 kaistaa koskevaa informaatiota ei käytetä seuraavissa laskutoimituksissa. Muussa tapauksessa kutakin kaistaa kohti lasketaan etäisyys vähentämällä Si: ssä olevan pisteen tallennettu siirtymäarvo S2:ssä olevan pisteen tallennetusta 5 siirtymäarvosta. Pienin näistä etäisyyksistä etsitään tutkimalla etäisyyttä kullakin kaistalla vuoron perään ja tallentamalla pienin löydetty etäisyys. Tämä pienin etäisyys on mainittu olennaisesti vaakasuuntainen etäisyys d". Jos d" on pienempi kuin 0, kuten voi tapahtua, jos Si ja S2 10 koskettavat toisiaan tai ovat limittäin, sille sijoitetaan arvo 0.
Kuviossa 5 on esitetty eräs suoritusmuoto, jossa kirjoi-tusakseli on vaakasuora ja kirjoitussuunta on vasemmalta 15 oikealle. Tässä suoritusmuodossa kaistojen (510) lukumäärä on 10. Sun oikeanpuoleisin piste (520) kullakin kaistalla määritetään ja S2:n vasemmanpuoleisin piste (530) tällä kaistalla määritetään myös. Tämä tehdään Si:n osalta asettamalla tallennettu alkuarvo kullakin kaistalla hyvin suu-20 reksi negatiiviseksi luvuksi. Kukin Si:n piste tarkistetaan vuoron perään. Ensin tarkistetaan sen Y-koordinaatti ja todetaan, millä kaistalla se sijaitsee. Koska kaistat I * '·;* kattavat koko korkeuden, Si:n ja S2:n ulottuvuuden (540), * * » '···' niin on taattu, että kaista voidaan määrittää jokaiselle
• I
• * ♦ f « : 25 Si:n 3a S2:n pisteelle. Kaistan määrittämisen jälkeen pis- > · ·,; · teen X-koordinaattia verrataan tämän kaistan tallennettuun ·“,·* ' arvoon, ja jos X-koordinaatti on suurempi, niin se sijoi tetaan tallennetuksi arvoksi. Sen jälkeen kun kaikki Si:n pisteet on tällä tavoin tarkistettu, tallennettu arvo i , 30 kullakin kaistalla sisältää Si:ssä tällä kaistalla tavatun oikeanpuoleisimman pisteen X-koordinaatin. Jos Si:ssä ei olisi yhtään pistettä tietyllä kaistalla, niin tallennettu arvo pysyisi mainittuna hyvin suurena negatiivisena alku-arvona. Samanlaista menettelyä S2'.n suhteen käyttäen kul- : 35 lakin kaistalla toista tallennettua arvoa, jolle on annettu > » alkuarvoksi suuri positiivinen luku, käytetään Si:ssä kullakin kaistalla olevan vasemmanpuoleisimman pisteen X- ί is 112403 koordinaatin määrittämiseksi.
Kuten edellä on selitetty arvo d" lasketaan tallennetuista pisteistä kullakin kaistalla. Pienin, eli lyhin, olennai-5 sesti samansuuntainen etäisyys Si:n ja S2:n välillä mainittujen useiden kaistojen joukossa, valitaan d":ksi. Sen jälkeen etäisyys d" yhdistetään d' :n kanssa määrittämällä niiden painotettu keskiarvo ja sitä verrataan t":hen. Verrattaessa t’’:hen esillä olevan keksinnön menetelmä päätte-10 lee, kuuluvatko erilliset yhtäjaksoiset segmentit Si ja S2 samaan käsinkirjoitettuun syötteeseen vai eri syötteisiin.
Alan asiantuntijoille on selvää, että selitettyä keksintöä voidaan muuntaa monin tavoin ja että se voi saada monia suo-15 ritusmuotoja, jotka ovat toisia kuin edellä erityisesti esitetyt ja selitetyt suoritusmuodot. Näin ollen tarkoituksena on, että oheiset patenttivaatimukset kattavat kaikki tämän keksinnön muunnokset ja muutokset, jotka ovat tämän keksinnön ja sen ekvivalenttisten suoritusmuotojen hengen 20 mukaisia ja kuuluvat keksinnön suojapiiriin.
Ml ‘ t · I · » * * » * I · * * · * I It· • · · • » · ·
• I
• · ·
• » I
It· I I I t • t »
t I I
• I ·
• ♦ I
'.· I

Claims (6)

16 1 12403
1. Menetelmä sen ratkaisemiseksi, kuuluvatko käsinkirjoitetun syötteen kaksi erillistä yhtäjaksoista segmenttiä toisistaan erottuviin käsinkirjoitettuihin 5 syötteisiin (210, 220; 410, 420), tunnettu siitä, että menetelmä käsittää seuraavat vaiheet: vastaanotetaan käsinkirjoitettu syöte (110), joka käsittää ainakin ensimmäisen ja toisen erillisen yhtäjaksoisen segmentin (Si ja S2); 10 määritetään (120) sekä ensimmäisellä että toisella erillisellä yhtäjaksoisella segmentillä raja (240, 250; 440, 450), joka on olennaisesti kirjoitusakselia (270; 370; 470) vastaan kohtisuora, jotka määritetyt olennaisesti kohtisuorat rajat ovat ne rajat, jotka ovat lähimpänä 15 toisiaan; lasketaan (130) ensimmäisen ja toisen erillisen yhtä-jaksoisen segmentin olennaisesti kohtisuorien rajojen välinen ensimmäinen erottava etäisyys (d'), * * * • · · * * · · ; jos erottava etäisyys ylittää ensimmäisen ennalta määrätyn * » * · :T: 20 kynnyksen (t'), niin päätellään, että ensimmäinen ja toinen erillinen yhtäjaksoinen segmentti (Si and S2) kuuluvat toi- < * i • sistaan erottuviin käsinkirjoitettuihin syötteisiin, i * · I · » · I I I t , jos erottava etäisyys ei ylitä ensimmäistä ennalta * · · .···. määrättyä kynnystä, lasketaan (150, 160, 170) useita * · * 25 olennaisesti samansuuntaisia erottavia etäisyyksiä, jotka * » olennaisesti samansuuntaiset erottavat etäisyydet ovat ensimmäisen ja toisen erillisen yhtäjaksoisen segmentin i7 112403 osien välillä yhdessä useista kaistoista, jotka on sijoitettu olennasesti samansuuntaisiksi kirjoitusakseliin nähden; käytetään (180, 190, 195, 197, 199) ensimmäistä erottavaa 5 etäisyyttä (d') ja pienintä (d") olennaisesti samansuuntaisista erottavista etäisyyksistä sen ratkaisemiseksi, kuuluvatko ensimmäinen ja toinen erillinen yhtäjaksoinen segmentti (Si ja S2) toisistaan erottuviin käsin kirjoitettuihin syötteisiin.
2. Patenttivaatimuksen 1 mukainen menetelmä, tun nettu siitä, että käsinkirjoitettu syöte käsittää merkkejä, ja kirjoitusakseli on joko olennaisesti vertikaalinen (370) tai olennaisesti horisontaalinen (270; 470) .
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tun nettu siitä, että vaihe, jossa ensimmäistä erottavaa etäisyyttä (d') ja pienintä olennaisesti samansuuntaista erottavaa etäisyyttä (d") käytetään sen ratkaisemiseksi, • * * : kuuluvatko ensimmäinen ja toinen erillinen yhtäjaksoinen ; 20 segmentti (Si and S2) toisistaan erottuviin käsin- I kirjoitettuihin syötteisiin, käsittää vaiheen, jossa painotettu ensimmäinen erottava etäisyys (q'd' ) ja painotettu pienin olennaisesti samansuuntainen erottava etäisyys > · » • (q"d") lasketaan yhteen tuloksen saamiseksi ja jossa tulos ,,,·’ 25 jaetaan kahdella lopputuloksen saamiseksi ja jossa lopputu- losta verrataan toiseen ennalta määrättyyn kynnykseen (t") .
4. Patenttivaatimuksen 3 mukainen menetelmä, t u n -n e t t u ainakin yhdestä seuraavassa luetelluista: » ie 112403 ensimmäinen (t'} ja toinen (t") ennalta määrätty kynnys ovat keskenään samansuuruiset, ensimmäinen (t') ja toinen (t") ennalta määrätty kynnys ovat keskenään erisuuret, 5 painotuskerroin, jota sovelletaan sekä ensimmäiseen erottavaan etäisyyteen että olennaisesti samansuuntaiseen erottavaan etäisyyteen painotetun ensimmäisen erottavan etäisyyden ja painotetun pienimmän olennaisesti samansuuntaisen erottavan etäisyyden saamiseksi, on vastaavasti 10 yksi siten, että ensimmäinen erottava etäisyys (d') on yhtäsuuri kuin painotettu ensimmäinen erottava etäisyys (q'd') ja pienin olennaisesti samansuuntainen erottava etäisyys (d") on yhtäsuuri kuin painotettu pienin olennaisesti samansuuntainen erottava etäisyys (q"d").
5. Patenttivaatimuksen 3 mukainen menetelmä, tun nettu siitä, että vaihe, jossa lasketaan ensimmäisen ja toisen erillisen yhtäjaksoisen segmentin (Si ja S2) .·’ olennaisesti kohtisuorien rajojen välinen ensimmäinen ;,· erottava etäisyys (d'), käsittää seuraavat vaiheet: * · 1 * * : j 20 jos pienin olennaisesti samansuuntainen etäisyys (d") on V : arvoltaan positiivinen, niin pienintä olennaisesti saman suuntaista etäisyyttä käytetään pienimpänä olennaisesti • · * .* *,* samansuuntaisena etäisyytenä, » · < • » * : jos pienin olennaisesti samansuuntainen etäisyys (d") on » i » 25 arvoltaan negatiivinen, niin ennalta määrättyä arvoa • * » ·*·, käytetään pienimpänä olennaisesti samansuuntaisena etäisyytenä, ja i is 112403 mikäli on valittu, ennalta määrätty arvo on nolla.
6. Patenttivaatimuksen 3 mukainen menetelmä, tunnettu siitä, että lasketaan lopputulos kaavan: q' d' + q"d"/(q' + q") mukaisesti, jossa d' on ensimmäinen 5 erottava etäisyys, d" on pienin olennaisesti samansuuntainen erottava etäisyys, sekä q' ja q" ovat painotus-arvot. 10 • · · • · • · · • · · 20 112 4 0 3
FI955609A 1994-05-10 1995-11-22 Menetelmä käsinkirjoitetun syötteen tunnistamiseksi FI112403B (fi)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US08/240,405 US5600735A (en) 1994-05-10 1994-05-10 Method of recognizing handwritten input
US24040594 1994-05-10
US9505640 1995-05-08
PCT/US1995/005640 WO1995030965A1 (en) 1994-05-10 1995-05-08 Method for recognizing handwritten input

Publications (3)

Publication Number Publication Date
FI955609A0 FI955609A0 (fi) 1995-11-22
FI955609A FI955609A (fi) 1995-11-22
FI112403B true FI112403B (fi) 2003-11-28

Family

ID=22906381

Family Applications (1)

Application Number Title Priority Date Filing Date
FI955609A FI112403B (fi) 1994-05-10 1995-11-22 Menetelmä käsinkirjoitetun syötteen tunnistamiseksi

Country Status (18)

Country Link
US (1) US5600735A (fi)
EP (1) EP0708944B1 (fi)
JP (1) JPH09500473A (fi)
CN (1) CN1128073A (fi)
AT (1) ATE221225T1 (fi)
AU (1) AU672558B2 (fi)
BR (1) BR9506217A (fi)
CA (1) CA2162609C (fi)
CZ (1) CZ285285B6 (fi)
DE (1) DE69527487T2 (fi)
ES (1) ES2181776T3 (fi)
FI (1) FI112403B (fi)
HU (1) HU219991B (fi)
IL (1) IL113658A (fi)
NO (1) NO309247B1 (fi)
PL (1) PL312986A1 (fi)
SK (1) SK3196A3 (fi)
WO (1) WO1995030965A1 (fi)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1102275C (zh) * 1994-11-14 2003-02-26 摩托罗拉公司 分解手写体输入的装置和方法
US5801941A (en) * 1996-08-12 1998-09-01 International Business Machines Corporation Mobile client computer programmed to establish soft keyboard targeting sensitivity
US6108444A (en) * 1997-09-29 2000-08-22 Xerox Corporation Method of grouping handwritten word segments in handwritten document images
KR100595925B1 (ko) 1998-01-26 2006-07-05 웨인 웨스터만 수동 입력 통합 방법 및 장치
US7091959B1 (en) * 1999-03-31 2006-08-15 Advanced Digital Systems, Inc. System, computer program product, computing device, and associated methods for form identification and information manipulation
US6826551B1 (en) * 2000-05-10 2004-11-30 Advanced Digital Systems, Inc. System, computer software program product, and method for producing a contextual electronic message from an input to a pen-enabled computing system
US6798907B1 (en) * 2001-01-24 2004-09-28 Advanced Digital Systems, Inc. System, computer software product and method for transmitting and processing handwritten data
US20020107885A1 (en) * 2001-02-01 2002-08-08 Advanced Digital Systems, Inc. System, computer program product, and method for capturing and processing form data
US7639876B2 (en) * 2005-01-14 2009-12-29 Advanced Digital Systems, Inc. System and method for associating handwritten information with one or more objects
US7697001B2 (en) * 2005-01-31 2010-04-13 Microsoft Corporation Personalized ink font
US7295206B2 (en) * 2005-01-31 2007-11-13 Microsoft Corporation Ink input region adjustments
US7613341B1 (en) * 2005-04-19 2009-11-03 Adobe Systems Incorporated Gap detection in a drawing
US7720286B2 (en) * 2005-05-25 2010-05-18 Advanced Digital Systems, Inc. System and method for associating handwritten information with one or more objects via discontinuous regions of a printed pattern
CN100430958C (zh) * 2005-08-18 2008-11-05 富士通株式会社 调整候选字符的初始识别距离的方法和装置
CN101192124B (zh) * 2006-11-17 2010-04-21 中兴通讯股份有限公司 对触摸屏输入信息进行自动区分处理的系统及方法
US8269727B2 (en) 2007-01-03 2012-09-18 Apple Inc. Irregular input identification
US7855718B2 (en) * 2007-01-03 2010-12-21 Apple Inc. Multi-touch input discrimination
US8130203B2 (en) 2007-01-03 2012-03-06 Apple Inc. Multi-touch input discrimination
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
CN102663388B (zh) * 2012-03-27 2014-01-08 复旦大学 从背景图片中对手写体字符进行分割的方法
CN104346631A (zh) * 2013-07-30 2015-02-11 夏普株式会社 图像判别方法、图像处理装置以及图像输出装置
JP6492894B2 (ja) 2015-04-01 2019-04-03 富士通株式会社 認識プログラム、認識方法及び認識装置
US11762989B2 (en) 2015-06-05 2023-09-19 Bottomline Technologies Inc. Securing electronic data by automatically destroying misdirected transmissions
US20170163664A1 (en) 2015-12-04 2017-06-08 Bottomline Technologies (De) Inc. Method to secure protected content on a mobile device
US10235356B2 (en) 2016-06-03 2019-03-19 Bottomline Technologies (De), Inc. Dual authentication method for identifying non-exactly matching text
US11163955B2 (en) 2016-06-03 2021-11-02 Bottomline Technologies, Inc. Identifying non-exactly matching text
US11416713B1 (en) 2019-03-18 2022-08-16 Bottomline Technologies, Inc. Distributed predictive analytics data set
US11042555B1 (en) 2019-06-28 2021-06-22 Bottomline Technologies, Inc. Two step algorithm for non-exact matching of large datasets
US11269841B1 (en) 2019-10-17 2022-03-08 Bottomline Technologies, Inc. Method and apparatus for non-exact matching of addresses
US11763278B2 (en) 2020-03-13 2023-09-19 Bottomline Technologies, Inc. Deposit token service system, apparatus and method
US11449870B2 (en) 2020-08-05 2022-09-20 Bottomline Technologies Ltd. Fraud detection rule optimization
US11694276B1 (en) 2021-08-27 2023-07-04 Bottomline Technologies, Inc. Process for automatically matching datasets
US11544798B1 (en) 2021-08-27 2023-01-03 Bottomline Technologies, Inc. Interactive animated user interface of a step-wise visual path of circles across a line for invoice management

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
US4379282A (en) * 1979-06-01 1983-04-05 Dest Corporation Apparatus and method for separation of optical character recognition data
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition

Also Published As

Publication number Publication date
HU9503881D0 (en) 1996-02-28
WO1995030965A1 (en) 1995-11-16
CZ6096A3 (en) 1996-07-17
CA2162609C (en) 1999-12-14
NO309247B1 (no) 2001-01-02
FI955609A0 (fi) 1995-11-22
AU672558B2 (en) 1996-10-03
JPH09500473A (ja) 1997-01-14
DE69527487D1 (de) 2002-08-29
AU2472495A (en) 1995-11-29
ES2181776T3 (es) 2003-03-01
EP0708944A1 (en) 1996-05-01
CN1128073A (zh) 1996-07-31
SK3196A3 (en) 1997-02-05
MX9600190A (es) 1998-11-30
NO955088D0 (no) 1995-12-15
EP0708944B1 (en) 2002-07-24
BR9506217A (pt) 1997-09-30
NO955088L (no) 1995-12-15
DE69527487T2 (de) 2002-12-19
IL113658A0 (en) 1995-08-31
CZ285285B6 (cs) 1999-06-16
CA2162609A1 (en) 1995-11-16
FI955609A (fi) 1995-11-22
ATE221225T1 (de) 2002-08-15
HUT73908A (en) 1996-10-28
US5600735A (en) 1997-02-04
EP0708944A4 (en) 1996-09-18
PL312986A1 (en) 1996-05-27
IL113658A (en) 1998-10-30
HU219991B (hu) 2001-10-28

Similar Documents

Publication Publication Date Title
FI112403B (fi) Menetelmä käsinkirjoitetun syötteen tunnistamiseksi
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
US5390259A (en) Methods and apparatus for selecting semantically significant images in a document image without decoding image content
EP1969489B1 (en) Table detection in ink notes
KR101114135B1 (ko) 카메라 입력된 문서들을 위한 저해상 ocr
Chaudhuri et al. Skew angle detection of digitized Indian script documents
US7664325B2 (en) Framework for detecting a structured handwritten object
Aradhye A generic method for determining up/down orientation of text in roman and non-roman scripts
US20120324341A1 (en) Detection and extraction of elements constituting images in unstructured document files
CA3027038A1 (en) Document field detection and parsing
US20120128249A1 (en) Script-agnostic text reflow for document images
Van Beusekom et al. Combined orientation and skew detection using geometric text-line modeling
Hesham et al. Arabic document layout analysis
KR102572180B1 (ko) 텍스트 분류
Suleyman et al. An adaptive threshold algorithm for offline Uyghur handwritten text line segmentation
CN100456317C (zh) 行方向判定方法以及装置
CN111783781B (zh) 基于产品协议字符识别的恶意条款识别方法、装置、设备
CN110399877B (zh) 连接字符的光学字符识别
Mukherjee et al. An unsupervised and robust line and word segmentation method for handwritten and degraded printed document
Parodi et al. Efficient and flexible text extraction from document pages
Ghanmi et al. Separator and content based approach for table extraction in handwritten chemistry documents
Seni et al. Segmenting handwritten text lines into words using distance algorithms
JPH10507014A (ja) 2進イメージにおけるランドスケープ・スキャンの自動決定
Pal et al. Recognition of Indian multi-oriented and curved text
Lu et al. Identification of scripts and orientations of degraded document images