NO309247B1 - Framgangsmåte for gjenkjennelse av håndskrevne data - Google Patents

Framgangsmåte for gjenkjennelse av håndskrevne data Download PDF

Info

Publication number
NO309247B1
NO309247B1 NO955088A NO955088A NO309247B1 NO 309247 B1 NO309247 B1 NO 309247B1 NO 955088 A NO955088 A NO 955088A NO 955088 A NO955088 A NO 955088A NO 309247 B1 NO309247 B1 NO 309247B1
Authority
NO
Norway
Prior art keywords
distance
substantially parallel
discrete continuous
continuous segments
discrete
Prior art date
Application number
NO955088A
Other languages
English (en)
Other versions
NO955088D0 (no
NO955088L (no
Inventor
John L C Seybold
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of NO955088D0 publication Critical patent/NO955088D0/no
Publication of NO955088L publication Critical patent/NO955088L/no
Publication of NO309247B1 publication Critical patent/NO309247B1/no

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Electrotherapy Devices (AREA)
  • Character Input (AREA)

Description

Framgangsmåte for gjenkjenning av håndskrift, som angitt i innledningen til patentkrav 1, hhv. framgangsmåte for å avgjøre om to diskrete kontinuerlige segmenter tilhører separate, håndskrevne inndata.
Bakgrunn
Maskingjenkjennelse av menneskelig håndskrift er et vanskelig problem, og med den nylige eksplosjon av pennbasert datautstyr, er det blitt ei viktig oppgave å løse.
Maskingjenkjennelse av menneskelig håndskrift har forskjellige anvendelser. Et eksempel på en eksisterende anvendelse for maskingjenkjennelse av menneskelig håndskrift finnes i personlige digitale "assistenter", så som produktene EO og Newton. Typisk har disse produktene en berøringsfølsom skjerm som en bruker kan påføre håndskrift. Disse anordningene vil så virke til å digitalisere de håndskrevne data, så som alfanumeriske data, og deretter prosessere dataene i et forsøk på å gjenkjenne informasjonsinnholdet i håndskriften.
Ved kjente teknikker for gjenkjennelse av håndskrift gjøres først en bestemmelse for å identifisere hver alfanumeriske karakter i sekvens, med den resulterende streng av karakterer omfatter resultatet ved gjenkjennelsesaktiviteten. Det er forskjellige ulemper ved denne fremgangsmåten. Den hindres ved vanskeligheten med å identifisere romlige avgrensninger av inndataene (i dette tilfellet alfanumeriske karakterer) som skal gjenkjennes. Når disse grensene ikke lokaliseres korrekt vil det være umulig å gjenkjenne karakteren nøyaktig, da den enten vil mangle deler eller vil inkorporere overflødig materiale fra nærliggende karakterer.
Et betydelig problem med maskingjenkjennelse av menneskelig håndskrift er evnen til å gjenkjenne enden av et inndata og begynnelsen av neste inndata. F.eks. eksisterer et betydelig problem ved å lokalisere enden av et håndskrevet inndatasegment, ord eller alfanumerisk inndata, fra starten av etterfølgende håndskrevet inndatasegment, ord eller alfanumerisk inndata. Dårlig gjenkjennelse av et slikt brudd i de håndskrevne inndata resulterer i dårlig og unøyaktig tolkning av informasjonsinnholdet ved de håndskrevne inndata.
Formål
Det er derfor et formål med foreliggende oppfinnelse å framskaffe en teknikk for gjenkjennelse av håndskrift som kan detektere enden av første håndskrevne inndatasegment fra starten av andre håndskrevne inndatasegment i de håndskrevne inndata og dermed gi en mer nøyaktig tolkning av . informasjonsinnholdet ved de håndskrevne inndata.
Oppfinnelsen
Oppfinnelsens formål oppnås ved en framgangsmåte med trekk som angitt i den karakteriserende delen av de selvstendige krav. Ytterligere trekk framgår av de tilhørende uselvstendige krav.
Eksempel
Oppfinnelsen skal nå beskrives med referanse til eksempel på utførelse og med henvisning til vedlagte tegninger, der
fig. 1 viser et flytskjema av driften i samsvar med en foretrukket utførelse av foreliggende oppfinnelse,
fig. 2 viser en grafisk framstilling av et illustrativt bilde i samsvar med en foretrukket utførelse av foreliggende oppfinnelse,
fig. 3 viser en grafisk framstilling av et illustrativt bilde i samsvar med en foretrukket utførelse av foreliggende oppfinnelse,
fig. 4 viser en grafisk framstilling av et illustrativt bilde i samsvar med en alternativ foretrukket utførelse av foreliggende oppfinnelse, og
fig. 5 viser en grafisk framstilling av et illustrativt bilde i samsvar med en foretrukket utførelse av foreliggende oppfinnelse.
Typisk blir håndskrevne bokstavdata innsamlet fra brukeren i form av diskrete sammenhengende segmenter. Et diskret sammenhengende segment omfatter en eller flere pennestrøk, der et pennestrøk er et merke satt med en penn under dens kontakt med et "innmatingorgan", så som et digitaliseringsbord eller papir. Et strøk representeres som en sekvens av punkter der prøver tas ved omtrentlig regulære intervaller ved innmatingorganet. Hvert punkt beskrives minimun ved en X-koordinat og en Y-koordinat. Strøk kan innfanges elektronisk ved bruk av et digitaliseringsbord, eller i en alternativ utførelse kan avledes fra scannet eller faxet bilde gjennom en prosess med linjedetektering i bildet, slike framgangsmåter for å innfange inndata elektronisk er kjent i teknikken.
Generelt avgjør foreliggende oppfinnelse som den er beskrevet, om to diskrete kontinuerlige segmenter danner deler av samme håndskrevne bokstavinndata eller deler av mer enn en håndskrevet bokstavinndata. I foreliggende oppfinnelse er en eller flere diskrete kontinuerlige segmenter enheter av håndskrevne inndata som blir gjenkjent. Håndskrevne inndata er inndata som innfanges elektronisk og som omfatter, men ikke er begrenset til følgende: håndskrevne inndata, elektroniske inndata, inndata innfanget gjennom trykk, så som stemplet inndata, inndata som mottas elektronisk, så som via fax, personsøker eller annet organ. F.eks. avgjør foreliggende oppfinnelse om to diskrete kontinuerlige segmenter danner deler av samme ord eller om de danner deler av separate ord. I en foretrukket framgangsmåte kalkulerer foreliggende oppfinnelse en eller flere vesentlig parallelle avstander anordnet vesentlig parallelt til skriveaksen, og sammenlikner disse avstandene med en eller flere på forhånd definerte terskler. De forhåndsdefinerte tersklene spesifiserer minimumsavstandsmålinger som må overskrides ved vesentlig parallelle avstander for at de diskrete kontinuerlige segmentene bedømmes som å tilhøre separate håndskrevne inndata, f.eks. separate håndskrevne ord. Skriveaksen er linjen som de håndskrevne inndata tilføres langs. Skriveretningen er retningen som hver etterfølgende håndskrevet inndata tilføres. I engelsk blir håndskrevne inndata typisk lagt til langs en horisontal skriveakse ved hver etterfølgende alfanumerisk inndata følger horisontalt etter foregående inndata i en skriveretning som er fra venstre mot høyre. Forskjellige andre skriveakser eller skriveretninger er skriveretningsalternativer er mulig ved implementeringen av foreliggende oppfinnelse.
I en foretrukket utførelse er den håndskrevne aksen horisontal og de håndskrevne inndata danner en serie av ord. I denne foretrukne utførelsen er vesentlig parallelle avstander kalkulert horisontalt og utdata forteller om diskrete kontinuerlige segmenter hører til separate ord. I en alternativ utførelse er den håndskrevne aksen horisontal og de håndskrevne inndata danner en serie av separate bokstaver, som kan være alfanumeriske bokstaver, ideografiske bokstaver som finnes i språk som kinesisk, eller andre form for bokstaver eller symboler med skreven kommunikasjon. I denne alternative utførelsen forteller utdata om diskrete kontinuerlige segmenter tilhører separate bokstaver. I en annen foretrukket utførelse er håndskriftaksen vertikal og de håndskrevne inndata danner en serie av separate bokstaver, som kan være alfanumeriske bokstaver, ideografiske bokstaver eller annen håndskreven tekst. I denne foretrukne utførelsen er skriveaksen vertikal og vesentlig parallelle avstander tilpasses vertikalt, utdata forteller om de diskrete kontinuerlige segmentene tilhører separate bokstaver. I en ytterligere foretrukket utførelse er håndskriftaksen vertikal og de håndskrevne inndata danner serie av separate ord, alfanumerisk inndata, eller annen håndskreven inndata, så som en vertikal liste av ord eller tall. I denne foretrukne utførelsen er skriveaksen vertikal og de vesentlig parallelle avstandene tilpasses vertikalt, utdata forteller om de diskrete kontinuerlige segmentene tilhører separate håndskrevne inndata, så som separate ord. Som beskrevet ovenfor og som vil bli diskutert videre, demonstrerer foreliggende oppfinnelse gjennom framvisningen av flere foretrukne utførelser at skriveaksen kan eksistere i enhver vinkel og at de håndskrevne inndata kan tolkes mer generelt som tilhørende til diskrete elementer (inkludert bokstaver og ord, men ikke begrenset til disse) som inneholder en eller flere diskrete sammenhengende segmenter. Anvendelsen av framgangsmåtene som her er beskrevet på enhver av forskjellige foretrukne utførelser krever bare en endring i koordinatsystemet som brukes og slike modifikasjoner kan gjøres i samsvar med den teknikk som presenteres. Med nå å referere til fig. 1, er vist en foretrukket framgangsmåte i samsvar med foreliggende oppfinnelse. Foreliggende oppfinnelse kan anvendes på en eller flere håndskrevne inndata eller diskrete sammenhengende segmenter. De foretrukne utførelser ved foreliggende oppfinnelse kan anvendes til to eller flere håndskrevne inndata av diskrete kontinuerlige segmenter. Bruken av bare to diskrete kontinuerlige segmenter S, og S2 er for illustrasjon. I den foretrukne framgangsmåten vist i fig. 1 omfatter håndskrevne inndata at to diskrete kontinuerlige segmenter S, og S2 som blir akseptert 110 ved et organ, så som en PDA eller annet organ. Andre organ som virker for å motta håndskrevne inndata inkluderer, men er ikke begrenset til følgende: datamaskiner, modem, personsøkere, telefoner, digitale eller interaktive eller andre fjernsynsapparater, organer som har et digitaliseringsbord, faxorganer, scannere og ethvert organ som er istand til å innfange håndskrevne inndata. Fortrinnsvis, ved aksept av håndskrevne inndata blir etterfølgende vinkelrette grenser b, og b2 mellom de diskrete kontinuerlige segmentene S, og S2 identifisert 120. Grensene b, og b2 som er vesentlig vinkelrett til skriveaksen blir bestemt ved å finne 120 det punktet i strøksekvensen S, som har største avstand langs skriveretningen og punktet i strøksekvensen S2 som har minste avstand langs skriveretningen. Den vesentlige vinkelrette grensen b, er forskyvningsverdien av punktet i strøksekvensen S, som har største avstand langs skriveretningen. Den vesentlige vinkelrette grensen b, er forskyvningsverdien av punktet etter strøksekvensen S2 som har minste forskyvning langs skriveretningen. Ved å kalkulere forskyvningen i skriveretningen for hvert punkt i S, etter tur og sammenlikne verdien med en lagret verdi som først er et meget stort negativt tall, kan den vesentlige vinkelrette grensen b, som er største avstand langs skriveretningen bestemmes. Dersom den kalkulerte avstandsverdien er større enn den lagrede verdien blir den lagrede verdien erstattet med den kalkulerte avstandsverdien. Når alle punkt har blitt undersøkt vil den lagrede verdien inneholde verdien for største avstandsverdi funnet i strøksekvensen. En liknende prosedyre som starter med et stort positivt initialiseringsverdi kan brukes for å oppdage punktet i S, som har minste avstand langs skriveretningen ved å kalkulere avstanden i skriveretningen for hvert punkt i S, etter tur og sammenlikne verdien med en lagret verdi som initielt er et meget stort positivt tall. Dersom den kalkulerte avstandsverdien er mindre enn lagret verdi vil lagret verdi erstattes med kalkulert avstandsverdi. Den foretruken framgangsmåten vil så kalkulere 130 et første vesentlig parallell avstand d', der d' = b, - b,.
Ved nå å referere til fig. 1, blir den første vesentlig parallelle avstanden d' sammenliknet med første gitte terskel f. Dersom d' er større enn eller lik (>=) t', vil den foretrukne framgangsmåten konkludere 145 med at første kontinuerlige diskrete segment S, og andre kontinuerlige diskrete segment S2 tilhører forskjellige segment av håndskrevet data. Som et eksempel, dersom b, er større enn (>) f så vil foretrukket framgangsmåte konkludere med at S, og S2 er forskjellige ord, bokstaver eller andre elementer av håndskrevne inndata. Valget av gitt terskel t' er en verdi som gjøres i samsvar med den spesifikke utførelsen. Valget av en terskel f vil diskuteres videre i detalj nedenfor.
Dersom verdien av d' er mindre enn terskelverdien t' vil videre behandling skje. For å avgjøre om de diskrete kontinuerlige segmentene S{ og S2 danner separate diskrete kontinuerlige segmenter av håndskrevet inndata, så som separate ord, bokstaver eller andre elementer blir en andre, vesentlig parallell avstand d" kalkulert. Den andre, vesentlige parallelle avstanden d" finnes ved å kalkulere flere vesentlige parallelle avstander og velge den korteste av disse avstandene. I en foretrukket utførelse blir dette gjort ved først å kalkulere 150 maksimal utstrekning vinkelrett til skriveaksen som er motstående av S, og S2 sammen. Størrelsen blir så dividert 160 i et antall bånd av lik høyde vesentlig parallell med skriveaksen. Den vesentlige parallelle avstanden mellom S, og S, for hvert bånd blir så funnet 170. Den minste eller korteste vesentlige parallelle avstanden mellom S, og S2 blant flertallet av bånd velges 180 som d". Ved den foretrukne framgangsmåten representert i fig. 1, blir, når den vesentlige horisontale avstanden d" er funnet, avstanden d" og første vesentlige horisontale avstand d' kombinert for hjelp i å lage en endelig avgjørelse om at S, og S, er deler av samme håndskrevne inndata eller deler av separate diskrete kontinuerlige segmenter av håndskrevne inndata. Et veid gjennomsnitt av d' og d" blir kalkulert. En foretrukket likning for veid gjennomsnitt er q'd' + q"d"/(q' + q"). Det har blitt funnet ved empiriske tester på virkelige håndskrevne data at et veid gjennomsnitt av d' og d" er mer nøyaktig enn en av dem alene. I en foretrukket utførelse, q' = q", men det kan være mulig å optimalisere dette videre ved et skjønsomt valg av q' og q" som ikke er identisk. Videre kan q' og q" hver settes til 0, men ikke begge samtidig.
Det veide gjennomsnitt sammenliknes med en andre terskel t". Dersom det veide gjennomsnitt er mindre enn t" vil den foretrukne framgangsmåten konkludere 197 at S, og S2 er deler av samme segment av håndskrevet inndata. Dersom det veide gjennomsnittet er større enn eller lik t" vil den foretrukne framgangsmåten konkludere med at S, og S2 er forskjellige kontinuerlige diskrete segmenter av håndskrevet inndata og den foretrukne framgangsmåten konkluderer 199 med det resultatet.
Den foretrukne framgangsmåten for å velge f og t" er en detalj ved den spesifikke utførelsen. I en utførelse kan f settes ved å måle verdien av d' over et stort sett av data og velge verdien som best skiller virkelige delingspunkt fra falske valg. I en annen foretrukket utførelse kan f settes til en konstant verdi som tilsvarer en del av avstanden mellom inndataføringen på inndataorganet. I en annen foretrukket utførelse kan t' varieres dynamisk som en del av målt utstrekning av S, og S2 vinkelrett til skriveaksen. I en annen utførelse kan t' settes eksplisitt av brukeren før framgangsmåten anvendes. I den foretrukne utførelsen som er illustrert blir f satt til 1/3 av målt utstrekning av S, og S2 vinkelrett til skriveaksen, som gir et godt resultat for engelsk, alfanumerisk tekst. Mange andre måter for å sette f kan vurderes og kan være optimal for forskjellige valg. De forskjellige måter for å bestemme t" i forskjellig utførelse er lik de som er beskrevet for å bestemme f.
I fig. 2 er gitt en grafisk representasjon ved en foretrukket utførelse. I denne utførelsen vil diskrete kontinuerlige segmenter S, 210 og S, 220 tilsvare engelske ord, en skriveakse 230 er horisontal og en skriveretning 270 er fra venstre til høyre. I denne foretrukne utførelsen blir avstanden langs skriveretningen for ethvert punkt rett og slett verdien av X-koordinaten for det punktet, slik at vesentlig vinkelrett grense b, 240 er verdien for X- koordinatoren ved det punktet som er lengst til høyre i S, 210 og den vesentlig vinkelrette grensen b, 250 er verdien av X-koordinatoren av det punktet som er lengst til venstre S2 220. Den vesentlige parallelle avstanden d' 260 er avstanden som strekker seg mellom b, og b2.
Alternativt, som illustrert i fig. 3 vil de diskrete kontinuerlige segmentene S, 310 og S2 320 tilsvare kinesiske bokstaver, skriveaksen 330 er vertikal og skriveretningen 330 er fra topp til bunn. I denne utførelsen er avstanden langs skriveretningen 370 for et hvert punkt ganske enkelt verdien av Y-koordinaten ved punktet multiplisert ved -1 (antatt et standard koordinatsystem der Y øker med en bevegelse fra bunn til topp), slik at den vesentlige vinkelrette grensen b, 340 er verdien av Y-koordinaten ganger -1 av det nederste punktet i S, 310 og den vesentlige vinkelrette grensen b, 350 er verdien av Y-koordinaten ganger -1 av det øverste punktet i S2 320.
I andre utførelser kan verdiene for b, og b2 kalkuleres ved å tilføre en enkel diametrisk rotasjon av de håndskrevne inndata for å linjere opp skriveaksen med en av hovedaksene ved koordinatsystemet, og så utføre prosedyren som akkurat er beskrevet. Dette er en enkel operasjon som vil forstås i samband med det som her er presentert. Alternativt kan andre utførelser kalkulere avstanden av punkter langs skriveretningen, når skriveretningen ikke er på linje med en av hovedaksene av koordinatsystemet, ved en enkel geometrisk projeksjon av de diskrete kontinuerlige segmentene på skriveaksen og så anvende trigonometri for å kalkulere avstanden av de projiserte punktene fra nullpunktet av koordinatsystemet. Dette er en godt kjent matematisk prosedyre som kan anvendes på det som her er presentert.
Som beskrevet tidligere, dersom d' er mindre enn f vil behandlingen fortsette. I mange tilfeller vil segmentet som faktisk tilhører separate ord eller bokstaver bli posisjonert på en slik måte at d' er mindre eller også negativ, men det er fortsatt mulig å avgjøre at S, og S2 tilhører forskjellige ord eller bokstaver. Fig. 4 viser et eksempel på denne situasjonen for en utførelse der S, 410 og S2 420 er engelske ord. I dette eksemplet er d' 460 i virkeligheten negativ, og b' 440 er større enn b2 450. I dette eksemplet er skriveaksen 430 horisontal og skriveretningen 470 er fra venstre til høyre.
I en utførelse der skriveaksen er horisontal vil maksimal utstrekning vinkelrett til skriveaksen motstående til S, og S2 bli kalkulert ved å finne minimum og maksimum Y-koordinatverdier som er tilstede i S, og S2. For å finne minimum Y-koordinatverdi, blir en lagret verdi initialisert med en svært stor positiv verdi, og deretter vil hvert punkt i S, og S2 undersøkes etter tur, og dersom dens Y-koordinatverdi er mindre enn den lagrede verdien blir den lagrede verdien tillagt den Y-koordinatverdien. En liknende framgangsmåte er brukt for å finne maksimum Y-koordinatverdi. Ved å trekke fra maksimum og minimum Y-koordinatverdier vil utstrekningen vinkelrett til skriveaksen kunne kalkuleres. Alle punkter i S, og S2 ligger innenfor denne utstrekningen.
I en foretrukket utførelse kan denne prosessen gjøres mer effektiv ved å betrakte bare et undersett av punktene i S, og S2 slik at bare et fast antall punkter i nærheten av de aktuelle grensene betraktes, da disse er de som det er størst sjanse at påvirker målingen som utføres.
I en alternativ utførelse, der skriveaksen er vertikal vil maksimum utstrekning vinkelrett til skriveaksen motstående til S, og S2 bli kalkulert ved å finne minimum og maksimum X-koordinatverdi som er tilstede i S, og S2. For å finne mimimum X-koordinatverdi blir en lagret verdi initialisert med et meget stort positiv verdi, og deretter blir hvert punkt i S, og S2 undersøkt etter tur, og dersom dens X-koordinatverdi er mindre enn lagret verdi, blir lagret verdi tillagt den X-koordinatverdien. En liknende framgangsmåte er brukt for å finne maksimum X-koordinatverdi. Ved å trekke fram maksimum og minimum X-koordinatverdier, vil utstrekningen vinkelrett til skriveaksen kunne kalkuleres.
I en alternativ utførelse der skriveaksen er verken horisontal eller vertikal, kan billedplanet roteres for å tilpasse skriveaksen med X- eller Y-aksen av koordinatsystemet, som beskrevet ovenfor ved kalkulering av vesentlige parallelle avstand d' når skriveaksen verken var horisontal eller vertikal.
Med en gang utstrekningen vinkelrett til skriveaksen har blitt funnet, vil en foretrukket utførelse dele denne utstrekningen i bånd som er vesentlig parallelle med skriveaksen, slik at hvert bånd beskriver en smal spalte gjennom S, og S2. Innenfor hvert bånd vil punktet i S, med største forskyvning i skriveretningen bli funnet, og punktet i S2 med minste forskyvning i skriveretningen blir funnet. Dette kan gjøres effektivt med hensyn til S, ved å initialisere en lagret verdi for hvert bånd til et meget stort negativt tall. Hvert punkt i S, blir så kontrollert etter tur. Først blir forskyvningen vinkelrett til skriveaksen kontrollert for å se hvilket bånd den ligger i. Etter som båndet strekker seg ut hele utstrekningen av S, og S2 vinkelrett til skriveaksen, er det garantert at et bånd kan finnes for et hvert punkt i S, og S2. Ved den foretrukne utførelsen beskrevet ovenfor for kalkulering av vinkelrett utstrekning ved betraktning av bare et undersett av punkter i S, og S2, kan det tenkes at den vinkelrette utstrekningen ikke inneholder alle punkter i S, og S2, og slik at hvert punkt må kontrolleres for å sikre at det ligger innenfor et bånd. Dersom det ikke gjør det, blir det ikke betraktet videre. Når båndet er identifisert vil forskyvningen av punktet i skriveretningen bli sammenliknet med lagret verdi for båndet, og dersom forskyvningen er større, blir det tillagt den lagrede verdien. Når alle punktene i S, har blitt kontrollert på denne måten, vil lagret verdi i hvert bånd inneholde største forskyvning av punktet med største forskyvning påstøtt i det båndet i S,. Dersom det ikke var noen punkt i S, som ligger innenfor et gitt bånd, vil lagret verdi fortsatt være den meget store negative initialiseringsverdien. En liknende prosedyre, som bruker en andre lagret verdi i hvert bånd initialisert til et stort positivt tall, er brukt med hensyn til S2 for å finne minimum forskyvning av punktet med minimum forskyvning i skriveretningen innenfor hvert bånd i S2. Dersom det er ingen punkter for et gitt bånd i S,, vil andre lagret verdi fordelt på båndet holdes ved dets store initialiseringsverdi.
Ved avslutningen av denne operasjonen, er det for hvert bånd lagret verdier som tilsvarer største forskyvning i skriveretningen av S, i båndet og minste forskyvning i skriveretningen av S2 i båndet. Dersom ingen av de lagrede verdiene har blitt endret fra den meget store negative eller positive initialiseringsverdi, så vil informasjonen for det båndet ikke anvendes i videre kalkulasjoner. Ellers blir en avstand kalkulert for hvert bånd ved å trekke fra lagret verdi for forskyvningen av punktet i S, fra lagret verdi for forskyvningen av punktet i S2. Den minste av disse avstandene blir funnet ved å undersøke avstanden for hvert bånd etter tur og lagre den minste som er funnet. Denne minste avstanden er vesentlig horisontal avstand d". Dersom d" er mindre enn 0, som kan skje dersom S, og S2 berører eller overlapper, tillegges den verdien 0.
En utførelse der skriveaksen er horisontal og skriveretningen er fra venstre til høyre, er vist i fig. 5. I denne utførelsen er antall bånd 510 lik 10. Det punktet lengst til høyre av S, som ligger innenfor hvert bånd finnes 520 og det punktet lengst til venstre av S2 som ligger innenfor båndet blir også funnet 530. Dette gjøres med hensyn til S, ved å initialisere lagret verdi for hvert bånd til et meget stort negativt tall. Hvert punkt i S, kontrolleres etter tur. Først blir dets Y-koordinat kontrollert for å se hvilket bånd den ligger i. Da båndene strekker seg hele høyden, eller utstrekning 540 av S, og S2, er det garantert at et bånd kan finnes for et hvert punkt i S, og S2. Når båndet er identifisert vil X-koordinaten for punktet bli sammenliknet med lagret verdi for det båndet, og dersom X-koordinaten er større, vil den tillegges den lagrede verdien. Når alle punktene i S, har blitt kontrollert på denne måten vil lagret verdi i hvert bånd innehold X-koordinaten for det punktet som er påstøtt lengst til høyre i båndet i S,. Dersom det ikke var noen punkt i S, som lå innenfor et gitt bånd, vil lagret verdi holdes som en meget stor negativ initialiseringsverdi. En liknende prosedyre med hensyn til S2, ved bruk av et andre lagret tall i hvert bånd som initialiseres til et stort positivt tall, bli brukt for å finne X-koordinaten av det punktet lengst til venstre i hvert bånd i S2.
Som beskrevet tidligere blir verdien av d" beregnet ut fra lagret lokasjon for hvert bånd. Den minste, eller korteste, vesentlige parallelle avstand mellom S, og S2 fra mengden av flertall av bånd, velges som d". Avstanden d" blir så kombinert med d' via et veid gjennomsnitt og sammenliknet med t". Ved sammenlikning med t" vil framgangsmåten i samsvar med foreliggende oppfinnelse konkludere om diskrete kontinuerlige segmenter S, og S2 tilhører samme håndskrevne inndata eller separate håndskrevne inndata.
Det vil forstås av fagfolk på området at den viste oppfinnelsen kan modifiseres på forskjellige måter og kan anta mange utførelser, andre enn de foretrukne former som er beskrevet ovenfor. I samsvar med dette er det ment at de etterfølgende krav skal dekke alle modifikasjoner av oppfinnelsen som faller innenfor oppfinnelsens rekkevidde.

Claims (10)

1. Framgangsmåte for gjenkjennelse av håndskrift, med tilførsel av inndata i form av håndskrevne bokstaver, som omfatter minst et første og et andre diskret kontinuerlig segment, karakterisert ved å omfatte følgende trinn: - beregning av minst vesentlig parallelle avstander mellom første og andre diskrete kontinuerlige segmenter, - bruk av den vesentlig parallelle avstanden for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne bokstav-inndata, idet en - identifisering av en vesentlig vinkelrett grense for hver av første og andre diskrete kontinuerlige segmenter, - beregning av en avstand mellom de vesentlige vinkelrette grensene for første og andre diskrete kontinuerlige segmenter, og - at en videre ved bruk av parallell avstand for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata, bruker avstanden mellom vesentlig vinkelrett grense for første og andre diskrete kontinuerlige segmenter for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata.
2. Framgangsmåte i samsvar med krav 1, karakterisert ved at trinnet med beregning av minst en vesentlig parallell avstand inkluderer et trinn med kalkulering av et flertall av vesentlig parallelle avstander mellom første og andre diskrete kontinuerlige segmenter, der ved valg av trinnet for beregning av et flertall av vesentlig parallelle avstander, videre inkluderer et trinn med å identifisere de vesentlige parallelle avstandene som har minste verdi, og der en videre ved valg av trinnet for bruk av parallell avstand, for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata, inkluderer et trinn med å bruke vesentlig parallelle avstander som har minste verdi for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata.
3. Framgangsmåte for gjenkjennelse av håndskrift, hvor en tilfører håndskrevne inndata, som omfatter minst et første og et andre diskret kontinuerlig segment, karakterisert ved å omfatte følgende trinn: - identifisering av en vesentlig vinkelrett grense for hver av første og andre diskrete kontinuerlige segmenter, - beregning av en første avstand mellom de vesentlig vinkelrette grensene for første og andre diskrete kontinuerlig segmenter, - når første avstand ikke minst overskrider første gitte terskel, kalkulering av minst en vesentlig parallell avstand mellom første og andre diskrete kontinuerlige segmenter, og - bruke av første avstand og den vesentlig parallelle avstanden for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata.
4. Framgangsmåte i samsvar med krav 3, karakterisert ved at trinnet med å bruke første avstand og den vesentlig parallelle avstanden for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata, inkluderer et trinn med å tillegge en veid første avstand og en veid vesentlig parallell avstand sammen, for å oppnå et resultat og dividere resultatet på to for å oppnå et sluttresultat, og sammenlikne sluttresultatet med en andre gitt terskel.
5. Framgangsmåte i samsvar med krav 4, karakterisert ved minst et av følgende forhold iakttas: a) at første og andre gitte terskel er identisk med hverandre, b) at første og andre gitte terskel er forskjellig fra hverandre, c) at en vektfaktor, som tilføres til både første avstand og vesentlig den parallelle avstanden for å oppnå at hhv. veid første avstand og veid vesentlig parallell avstand, er én, slik at første avstand er lik den veide første avstanden og den vesenlig parallelle avstanden er lik den veide vesentlig parallelle avstanden.
6. Framgangsmåte i samsvar med krav 3, karakterisert ved at trinnet med å kalkulere en første avstand mellom den vesentlig vinkelrette grensen for første og andre diskrete kontinuerlige segmenter inkluderer følgende trinn: - når den vesentlig parallelle avstanden er positiv i verdi, brukes den vesentlig parallelle avstanden som vesentlig parallell avstand, - når den vesentlig parallelle avstanden er negativ verdi, brukes den gitte verdien som den vesentlig parallelle avstanden, og - der ved ytterligere valg den gitte verdien er null.
7. Framgangsmåte i samsvar med krav 3, karakterisert ved at trinnet med kalkulering av i det minste en vesentlig parallell avstand inkluderer et trinn med beregning av et flertall av vesentlig parallelle avstander mellom første og andre diskrete kontinuerlige segmenter.
8. Framgangsmåte i samsvar med krav 7, karakterisert ved at trinnet med kalkulering av et flertall av vesentlig parallelle avstander videre inkluderer et trinn med å identifisere den vesentlig parallelle avstanden som har minste verdi, og der videre valget av trinnet for bruk av første avstand av den vesentlig parallelle avstanden for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata, inkluderer det trinn å anvende den vesentlige parallelle avstanden som har minste verdi og den første avstanden, for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata.
9. Framgangsmåte for gjenkjennelse av håndskrift, med tilførsel av inndata, som omfatter i det minste første og andre kontinuerlige segment som er anordnet vesentlig parallelt til en skriveakse, karakterisert ved å omfatte: - å identifisere en grense som er vinkelrett til skriveaksen for hver av de første og andre diskrete kontinuerlige segmenter, - å kalkulere en første avstand mellom grensen for første og andre diskrete kontinuerlige segmenter, og - når første avstand i det minste overskrider en første gitt terskel, konkludere at første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata, - når første avstand ikke minst overskrider første gitt terskel, beregne minst en vesentlig vinkelrett avstand mellom første og andre diskrete kontinuerlige segmenter, som vesentlig vinkelrett avstand er vesentlig vinkelrett til skriveaksen, samt å anvende den første avstand og den vesentlige parallelle avstanden, for å avgjøre om det første og andre diskrete kontinuerlige segmentet tilhører separate håndskrevne inndata.
10. Framgangsmåte for å avgjøre om to diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata, hvor det tilføres håndskrevne inndata, som omfatter minst en første og en andre diskret kontinuerlig segment, karakterisert ved å omfatte følgende trinn: - identifisere en vesentlig vinkelrett grense for hver av første og andre diskrete kontinuerlige segmenter, som hvilke vesentlige vinkelrette grenser er de grensene som er mest i nærheten av hverandre, - beregne en separasjonsavstand mellom de vesentlige vinkelrette grensene for første og andre diskrete kontinuerlige segmenter, - når separasjonsavstanden i det minste overskrider en første gitte terskel, konkludere at første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata, - når separasjonsavstanden ikke minst overskrider den første gitte terskel, kalkulere et flertall av vesentlig parallelle separasjonsavstander mellom deler av første og andre diskrete kontinuerlige segmenter, og - bruke separasjonsdistansen og en minste av de vesentlige parallelle separasjonsavstandene for å avgjøre om første og andre diskrete kontinuerlige segmenter tilhører separate håndskrevne inndata.
NO955088A 1994-05-10 1995-12-15 Framgangsmåte for gjenkjennelse av håndskrevne data NO309247B1 (no)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/240,405 US5600735A (en) 1994-05-10 1994-05-10 Method of recognizing handwritten input
PCT/US1995/005640 WO1995030965A1 (en) 1994-05-10 1995-05-08 Method for recognizing handwritten input

Publications (3)

Publication Number Publication Date
NO955088D0 NO955088D0 (no) 1995-12-15
NO955088L NO955088L (no) 1995-12-15
NO309247B1 true NO309247B1 (no) 2001-01-02

Family

ID=22906381

Family Applications (1)

Application Number Title Priority Date Filing Date
NO955088A NO309247B1 (no) 1994-05-10 1995-12-15 Framgangsmåte for gjenkjennelse av håndskrevne data

Country Status (18)

Country Link
US (1) US5600735A (no)
EP (1) EP0708944B1 (no)
JP (1) JPH09500473A (no)
CN (1) CN1128073A (no)
AT (1) ATE221225T1 (no)
AU (1) AU672558B2 (no)
BR (1) BR9506217A (no)
CA (1) CA2162609C (no)
CZ (1) CZ285285B6 (no)
DE (1) DE69527487T2 (no)
ES (1) ES2181776T3 (no)
FI (1) FI112403B (no)
HU (1) HU219991B (no)
IL (1) IL113658A (no)
NO (1) NO309247B1 (no)
PL (1) PL312986A1 (no)
SK (1) SK3196A3 (no)
WO (1) WO1995030965A1 (no)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1102275C (zh) * 1994-11-14 2003-02-26 摩托罗拉公司 分解手写体输入的装置和方法
US5801941A (en) * 1996-08-12 1998-09-01 International Business Machines Corporation Mobile client computer programmed to establish soft keyboard targeting sensitivity
US6108444A (en) * 1997-09-29 2000-08-22 Xerox Corporation Method of grouping handwritten word segments in handwritten document images
KR100595925B1 (ko) 1998-01-26 2006-07-05 웨인 웨스터만 수동 입력 통합 방법 및 장치
US7091959B1 (en) * 1999-03-31 2006-08-15 Advanced Digital Systems, Inc. System, computer program product, computing device, and associated methods for form identification and information manipulation
US6826551B1 (en) * 2000-05-10 2004-11-30 Advanced Digital Systems, Inc. System, computer software program product, and method for producing a contextual electronic message from an input to a pen-enabled computing system
US6798907B1 (en) * 2001-01-24 2004-09-28 Advanced Digital Systems, Inc. System, computer software product and method for transmitting and processing handwritten data
US20020107885A1 (en) * 2001-02-01 2002-08-08 Advanced Digital Systems, Inc. System, computer program product, and method for capturing and processing form data
US7639876B2 (en) * 2005-01-14 2009-12-29 Advanced Digital Systems, Inc. System and method for associating handwritten information with one or more objects
US7697001B2 (en) * 2005-01-31 2010-04-13 Microsoft Corporation Personalized ink font
US7295206B2 (en) * 2005-01-31 2007-11-13 Microsoft Corporation Ink input region adjustments
US7613341B1 (en) * 2005-04-19 2009-11-03 Adobe Systems Incorporated Gap detection in a drawing
US7720286B2 (en) * 2005-05-25 2010-05-18 Advanced Digital Systems, Inc. System and method for associating handwritten information with one or more objects via discontinuous regions of a printed pattern
CN100430958C (zh) * 2005-08-18 2008-11-05 富士通株式会社 调整候选字符的初始识别距离的方法和装置
CN101192124B (zh) * 2006-11-17 2010-04-21 中兴通讯股份有限公司 对触摸屏输入信息进行自动区分处理的系统及方法
US8269727B2 (en) 2007-01-03 2012-09-18 Apple Inc. Irregular input identification
US7855718B2 (en) * 2007-01-03 2010-12-21 Apple Inc. Multi-touch input discrimination
US8130203B2 (en) 2007-01-03 2012-03-06 Apple Inc. Multi-touch input discrimination
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
CN102663388B (zh) * 2012-03-27 2014-01-08 复旦大学 从背景图片中对手写体字符进行分割的方法
CN104346631A (zh) * 2013-07-30 2015-02-11 夏普株式会社 图像判别方法、图像处理装置以及图像输出装置
JP6492894B2 (ja) 2015-04-01 2019-04-03 富士通株式会社 認識プログラム、認識方法及び認識装置
US11762989B2 (en) 2015-06-05 2023-09-19 Bottomline Technologies Inc. Securing electronic data by automatically destroying misdirected transmissions
US20170163664A1 (en) 2015-12-04 2017-06-08 Bottomline Technologies (De) Inc. Method to secure protected content on a mobile device
US10235356B2 (en) 2016-06-03 2019-03-19 Bottomline Technologies (De), Inc. Dual authentication method for identifying non-exactly matching text
US11163955B2 (en) 2016-06-03 2021-11-02 Bottomline Technologies, Inc. Identifying non-exactly matching text
US11416713B1 (en) 2019-03-18 2022-08-16 Bottomline Technologies, Inc. Distributed predictive analytics data set
US11042555B1 (en) 2019-06-28 2021-06-22 Bottomline Technologies, Inc. Two step algorithm for non-exact matching of large datasets
US11269841B1 (en) 2019-10-17 2022-03-08 Bottomline Technologies, Inc. Method and apparatus for non-exact matching of addresses
US11763278B2 (en) 2020-03-13 2023-09-19 Bottomline Technologies, Inc. Deposit token service system, apparatus and method
US11449870B2 (en) 2020-08-05 2022-09-20 Bottomline Technologies Ltd. Fraud detection rule optimization
US11694276B1 (en) 2021-08-27 2023-07-04 Bottomline Technologies, Inc. Process for automatically matching datasets
US11544798B1 (en) 2021-08-27 2023-01-03 Bottomline Technologies, Inc. Interactive animated user interface of a step-wise visual path of circles across a line for invoice management

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
US4379282A (en) * 1979-06-01 1983-04-05 Dest Corporation Apparatus and method for separation of optical character recognition data
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition

Also Published As

Publication number Publication date
HU9503881D0 (en) 1996-02-28
WO1995030965A1 (en) 1995-11-16
CZ6096A3 (en) 1996-07-17
CA2162609C (en) 1999-12-14
FI112403B (fi) 2003-11-28
FI955609A0 (fi) 1995-11-22
AU672558B2 (en) 1996-10-03
JPH09500473A (ja) 1997-01-14
DE69527487D1 (de) 2002-08-29
AU2472495A (en) 1995-11-29
ES2181776T3 (es) 2003-03-01
EP0708944A1 (en) 1996-05-01
CN1128073A (zh) 1996-07-31
SK3196A3 (en) 1997-02-05
MX9600190A (es) 1998-11-30
NO955088D0 (no) 1995-12-15
EP0708944B1 (en) 2002-07-24
BR9506217A (pt) 1997-09-30
NO955088L (no) 1995-12-15
DE69527487T2 (de) 2002-12-19
IL113658A0 (en) 1995-08-31
CZ285285B6 (cs) 1999-06-16
CA2162609A1 (en) 1995-11-16
FI955609A (fi) 1995-11-22
ATE221225T1 (de) 2002-08-15
HUT73908A (en) 1996-10-28
US5600735A (en) 1997-02-04
EP0708944A4 (en) 1996-09-18
PL312986A1 (en) 1996-05-27
IL113658A (en) 1998-10-30
HU219991B (hu) 2001-10-28

Similar Documents

Publication Publication Date Title
NO309247B1 (no) Framgangsmåte for gjenkjennelse av håndskrevne data
CN111723807B (zh) 使用端到端深度学习识别机打字符和手写字符
CN100576233C (zh) 检测文档图像中的字符的方向
RU2613734C1 (ru) Захват видео в сценарии ввода данных
US9024882B2 (en) Data input system and method for a touch sensor input
US10083163B2 (en) Completing fields in electronic documents by automatically assigning drawing input
US20200372248A1 (en) Certificate recognition method and apparatus, electronic device, and computer-readable storage medium
CN111507330B (zh) 习题识别方法、装置、电子设备及存储介质
US20230101426A1 (en) Method and apparatus for recognizing text, storage medium, and electronic device
JP7135473B2 (ja) 医用画像処理装置、医用画像処理方法、プログラム及び医用画像処理システム
JP2019204417A (ja) 帳票認識システム
US10503993B2 (en) Image processing apparatus
RU2605078C2 (ru) Сегментация изображения для верификации данных
CN109697414A (zh) 一种文本定位方法及装置
US20220301329A1 (en) Image processing system and an image processing method
JP2008234291A (ja) 文字認識装置及び文字認識方法
US9418281B2 (en) Segmentation of overwritten online handwriting input
CN114297720A (zh) 一种图像脱敏方法、装置、电子设备及存储介质
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
MXPA96000190A (es) Metodo para el reconocimiento de ingreso de escritura manual
US11722615B2 (en) Image processing including adjusting image orientation
JP5669044B2 (ja) 文書検定システム及び文書検定方法
CN114677768A (zh) 一种电子签字的核对方法、装置、电子设备及存储介质
CN116012848A (zh) 基于方向校正的文字识别方法、装置、介质、设备及产品
CN112101292A (zh) 一种勾选项识别方法、装置和设备