NL8004426A - Inrichting voor het herkennen van tekens. - Google Patents

Inrichting voor het herkennen van tekens. Download PDF

Info

Publication number
NL8004426A
NL8004426A NL8004426A NL8004426A NL8004426A NL 8004426 A NL8004426 A NL 8004426A NL 8004426 A NL8004426 A NL 8004426A NL 8004426 A NL8004426 A NL 8004426A NL 8004426 A NL8004426 A NL 8004426A
Authority
NL
Netherlands
Prior art keywords
code
layer structure
layer
branches
codes
Prior art date
Application number
NL8004426A
Other languages
English (en)
Original Assignee
Nederlanden Staat
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nederlanden Staat filed Critical Nederlanden Staat
Priority to NL8004426A priority Critical patent/NL8004426A/nl
Priority to EP81200847A priority patent/EP0045549A1/en
Priority to JP56119379A priority patent/JPS5833781A/ja
Publication of NL8004426A publication Critical patent/NL8004426A/nl

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

. ' —^ ...........................'.......
j 3 VO 0853 * - i -
Inrichting voor het herkennen van tekens.
Dë uitvinding heeft betrekking op een inrichting voor het herkennen van tekens, bij voorkeur van handgeschreven cijfers op ·--- --- -documenten, omvattende een opneemcamera, een drempelschakeling*.
een schakeling voor het discretiseren van het signaal van de 5 drempelschakeling, een binair geheugen, een geheugen voor informatie verkregen uit een leerset en een processor voor het besturen van de inrichting.
Een dergelijke inrichting is bekend, bijvoorbeeld uit het Duitse. octrooischrift 2432129. Bij de bekende inrichting wordt een groot 10 aantal kenmerken uit de data van de te herkennen tekens afgeleid, waardoor de benodigde apparatuur zeer omvangrijk is.
Het verder uitbreiden van het aantal kenmerken is zeer wel mogelijk, maar het herkenningsresultaat is er nauwelijks nog mee te verbeteren. Dit komt doordat de struktuurkenmerken die bij de 15 bekende techniek worden gebruikt, de eigenschap hebben, dat zij elk slechts een onderdeel der struktuur beschrijven.
Het is niet eenvoudig en in veel gevallen ondoenlijk een eventueel gestyleerd tekenbeeld "terug te tekenen" aan de hand van de kenmerkeninformatie. Een nadeel van de bekende techniek is verder, 20 dat bepaalde aspecten van de struktuur door de verschillende kenmerken meerdere malen opgespoord worden.
8004426 - 2 - ΐ* * .Enerzijds heeft men dus te maken met een tekort aan informatie, waardoor er een grens is aan de herkenbaarheid, anderzijds met een teveel aan informatie, hetgeen kostbare apparatuur tot gevolg heeft.
5 De uitvinding beoogt een inrichting waarbij van een geheel ander principe wordt uitgegaan, zodanig dat het herkenningsresultaat niet onderdoet voor dat van de bekende techniek of zelfs beter is, terwijl met relatief weinig apparatuur kan worden volstaan.
Aan de inrichting volgens de uitvinding ligt de gedachte ten * IQ grondslag slechts een type kenmerk, dat in vier aanzichtrich-tingen wordt afgeleid, te gebruiken. Dit kenmerk beschrijft de gehele basisstructuur die in die aanzichtrichting gezien wordt, welke basisstructuur opgebouwd gedacht wordt uit een samenstel van lagen die achtereenvolgens gevonden worden.
15 Het bovenstaande kan worden gerealiseerd door de inrichting te kenmerken door een schakeling voor het aftasten en geometrisch scheiden van een deel van het binaire geheugen waarin zich de informatie van één teken bevindt, een schakeling voor het samenstellen van quasi-topólogische codetabellen in vier aanzicht- ZQ richtingen, een schakeling voor het transformeren van deze codetabellen naar vier lagenstruktuurcodes en een schakeling waarin gebruik wordt gemaakt van waarschijnlijkheidstabellen ter bepaling door middel van een schakeling van de meest waarschijnlijke klasse van het te herkennen teken.
25 De inrichting wordt toegelicht aan de hand van de tekening. Hierin wordt voorgesteld door
Fig. 1 een voorbeeld van de eerste cyclus in een lagenstruktuur;
Fig. 2 idem van de tweede cyclus; 3G Fig. 3 idem van de derde cyclus;
Fig. 4 het samendrukken van een tekenbeeld;
Fig. 5 twee gelijksoortige tekens met verschillende ligging van de eindpunten; 8004426 Ρ ψ -.-3-
Fig. 6 codering van een lagenstruktuur;
Fig. 7 codering volgens Nadler;
Fig. 8 codering volgens de uitvinding|
Fig. 9 idem; 5 Fig. 10 omzetting van een codetabel in een gerangschikte tabel, geschikt voor bepaling van de lagenstruk-tuurcode en
Fig. 11 een blokschema.
De basisstruktuur van een tekenbeeld, die in een bepaalde aanzicht-10 richting-, in het volgende van links naar rechts gezien wordt, wordt opgebouwd gedacht uit een samenstel van lagen.
Bij het vormen van iedere nieuwe laag worden slechts die doorlopende "takken" in de laag opgenomen die in de gegeven aanzichtrichting volledig zichtbaar zijn, dat wil zeggen, niet geheel of ten dele 15 verborgen zijn achter andere takken.
In de eerste cyclus volgens het voorbeeld van Fig. 1 zijn slechts twee volledige takken van het tekenbeeld zichtbaar. De pijl geeft . . de aanzichtrichting aan.
In de tweede cyclus wordt als het ware over de eerste laag'heen 20 naar het tekenbeeld gekeken en worden weer nieuwe takken gevonden die volledig zichtbaar zijn. Op deze wijze wordt de tweede laag . gevormd die bovendien op een speciale wijze vastzit aan de eerste laag (Fig. 2).
In de derde cyclus tenslotte wordt de voor dit voorbeeld laatste . 25r laag gevonden die weer op een speciale wijze vastzit aan de reeds gevórmde lagen (Fig. 3).
Volgens bovenstaand proces wordt de basisstruktuur die, gegeven een bepaalde aanzichtrichting, in een tekenbeeld opgesloten is op een speciale manier vastgelegd in de lagenstruktuur, die een gestyleerd 30 beeld vormt van het tekenbeeld.
Dit gestyleerde beeld lijkt als het ware ontstaan door het tekenbeeld tegen een vertikale muur die zich links van het tekenbeeld bevindt te drukken, waarbij als eis gesteld wordt dat geen takken in elkaar gedrukt mogen worden (Fig. 4).
8004426 ) - 4 -
Door nu bovenstaande lagenstruktuur ook laagsgewijs te coderen ontstaat een struktuur die invariant is voor niet-essentiele variatie in de ligging van begin- en eindpunten der takken.
Dit is een groot voordeel ten opzichte van bekende quasi - topo-5 logische codes die onder andere door M. Nadler in "Sequentially -local picture operators", 2nd Int. Joint Conf. on Pattern Recognition 1974, Copenhagen, p. 131-135 en in "Structural codes for omnifont and handwritten characters", 3rd Int. Joint Conf. on Pattern Recognition 1976, California p. 135-139 zijn beschreven 10 voor een herkenningssysteem. In het genoemde tweede artikel wordt het variant zijn voor de ligging van begin- en eindpunten van quasi-topologische codes een nadeel genoemd. Zo is de hierboven genoemde techniek met een quasi-topologische code gevoelig voor de verandering die in Fig. 5 in beeld is gebracht.
15 De lagenstruktuur plus de bijbehorende struktuurcode volgens de uitvinding is daarentegen invariant voor bovenstaande verandering.
Bij de laagsgewijze codering wordt een laag zodanig gecodeerd, dat aan de code te zien is waaruit de laag is opgebouwd, zodat achteraf de lagenstruktuur eenduidig is terug te tekenen. Bijv. voor de reeds 20 eerder beschreven "negen" (Fig. 6): B = een gewoon begin van een tak; . A = een begin van een zich afsplitsende tak, die dus aan de bovenkant vastzit aan een vorige laag; E = een gewoon einde van een tak; 25 S = een einde van een samenvloeiende tak, die dus aan de onderkant vastzit aan een vorige laag; V = een vertakkingspunt, dus een verbinding naar een volgende laag en 0 = een opvulpunt, dat optreedt bij verbindingen over een afstand van meer dan êên laag.
30 Een laagsgewijze codering is dan bijv. de volgende code, die gegenereerd wordt door de laag van boven naar beneden te doorlopen: 8004426 - 5 -
laag I: BVVÉBVE
laag 2: A V S O
laag 3: AS
Met behulp van een scheidingsteken, bijv. i is dan de gehele laag-5 struktuur als volgt te coderen: 1 agens truk tuur linkeraanzicht »BVVEB7E^AVSOjiAS.
Door nu bovenstaande tekens te coderen bijv. in 3 bits, ontstaan codewoorden die de gehele lagenstruktuur vastleggen. Het blijkt dat 72 bits ruim voldoende zijn om alle voorkomende handgeschreven cij-10 fers te coderen.
- - Dat de code een zeer sterke datareduktie oplevert is ook gebleken door in een set van 40.000 handgeschreven cijfers afkomstig van het giroproces te tellen hoeveel verschillende lagenstruktuurcodes voorkomen in een viertal aanzichtriehtingen. Het blijkt dan dat per aan-15 ~ zichtrichting slechts 200 codes nodig zijn om ruim 99% der cijfers ; in te kunnen delen.
De lagenstructuurcode kan nog worden aangevuld met een tabel waarin alle taklengtes· van-het,gestyleerde .tekenbeeld zijn vermeld. Deze taklengtes maken de beschrijving van de 1agenstructuur nog krachti-20 Ser, daar het gestyleerde tekenbeeld dan als het ware in z’n juiste verhoudingen bekend is. In de herkenningsmethode die hier beschreven zal worden is geen gebruik gemaakt van bovengenoemde taklengtes. Afhankelijk van de wijze waarop het zwart-wit tekenbeeld is vastgelegd, kan de lagenstruktuurcode voor een bepaalde aanzichtrich-25 ting op diverse manieren worden gegenereerd. Wanneer bijv. de con-tourfuncties vastgelegd zijn met behulp van een "flying spot" scanner (zie J.R. Tlllmann "Pattern Recognition Techniques London Butterworths p. 45) dan is daaruit de lagenstruktuurcode te destilleren. Wanneer een contour wordt afgetast, dan ontstaat, gegeven 30 een bepaald coSrdinatorstelsel, de parametervoorstelling x (t), y (t). Wanneer de y-as vertikaal gekozen is, dan is de lagenstructuurcode behorende bij bijv. het linkeraanzicht te genereren door onder andere te kijken naar de -maxima en minima in de functie y (t).
8004426
• - V
- 6 -
Aan Fig. 3 is dat goed te zien. In het onderhavige geval echter werd gebruik gemaakt van een zwart-wit tekenbeeld vastgelegd volgens de in de inleiding genoemde techniek, gevolgd door een schakeling voor het geometrisch scheiden (Nederlands octrooi 160408), waarbij 5 de informatie waarvan is uitgegaan, is vastgelegd in een binair geheugen van 1024 geheugenplaatsen, behorende bij een zwart-wit tekenbeeld van 32 x 32 beeldelementen die of zwart of wit zijn.
Een dergelijke discrete opslag van de informatie leent zich er goed voor om de lagenstruktuurcode te bepalen in vier richtingen (horizon-10 taal, vertikaal, onder 45° en onder 135°).
Het nog te beschrijven herkenningssysteem is dan ook gebaseerd op deze vier lagenstruktuurcodes. De lagenstruktuurcode zou in dit geval rechtstreeks uit het binaire geheugen kunnen worden bepaald door dat geheugen in vier aanzichten te analyseren op de wijze zoals beschreven 15 bij de Fig. 1-3 , dus door laagsgewijs de aanzichten op te bouwen en tenslotte het samenstel der verkregen volledige takken op de beschreven wijze te coderen. Volgens de uitvinding is echter uitgegaan van de reeds genoemde quasi—topologische codes. Deze hebben onder andere het voordeel dat zij tegelijkertijd in vier richtingen zijn af te 20 leiden door middel van een scan over het binaire beeld, zoals beschreven is door Nadler in het tweede hierboven genoemde artikel. De quasi-topologische codes moesten worden aangepast c.q. verbeterd en hebben een wat andere interpretatie gekregen ten behoeve van de daarop volgende bepaling der lagenstruktuurcode. Zo werd de code 0 25 (van ''opening”) (Fig. 7) vervangen 'door V Δ, dat wil zeggen vertakking naar een afsplitsing (Fig. 8).
Het effect is gelijk, namelijk 1 tak erin en 2 takken eruit.
De code V A is echter georiënteerd naar het linkeraanzicht en is, in tegenstelling tot de code 0, ook geschikt om meervoudige afsplit-30' singen te beschrijven (Fig. 9).
Tenslotte is de code G (van "close”) vervangen door V S (vertakking naar een samenvloeiing), en heet de startcode: B, de stopcode: E en het eenvoudige doorgeven van een tak; D.
8004426 ν ψρ τ* ✓
. I
- 7 -
Aan de hand van Fig. 10 zal nu worden beschreven hoe de quasi-topologische codetabel (a) is te transformeren in de lagenstruk-tuurcode (b).
' Door nu de quasi-topologische codetabel (a.) van boven naar bene-5 den en van links naar rechts te doorlopen kunnen telkens volledige takken naar links als het ware uit de tabel getrokken worden, waardoor de gerangschikte tabel ontstaat die behoort bij de gezochte 1agenstruktuur. De 1agenstruktuurcode _b voor het linkeraanzicht luidt nu voor het voorbeeld van Fig. 10 s B V V E φ A E 0 φ B S.
10 Tengevolge van bovenstaand rangschikproces ontstaan soms zogenaamde opvulpunten zoals in het voorbeeld van Fig. 10 getoond is.
In de gerangschikte tabel ontstaan dan extra codes aangegeven door een 0.
Bij het van boven naar beneden en van links naar rechts doorlopen -15 van de quasi-topologische codetabel éi is direkt de lagenstruktuur-cöde te genereren zonder dat eerst de gerangschikte tabel gevormd behoeft te worden. Het behulp van een aantal tellers moet dan bijgehouden worden hoeveel codes op iedere regel reeds uit de tabel getrokken zijn. Een afsplitsing (A) of een samenvloeiing (S) die in een 20 cyclus niet uit de tabel getrokken kan worden, genereert een op-vulpunt (Zie "S" in Fig. 10). De hier beschreven transformatie is in het onderhavige geval gerealiseerd met behulp van een speciaal geprogrammeerde microprocessor, die dit werk doet in ongeveer 200 us.
Speciaal gebouwde hardware schakelingen met tellers, schuifregisters 25 en dergelijke kunnen dit werk nauwelijks sneller omdat ook in dat geval min of meer sequentieel gewerkt moet worden.
Een microprocesssor is voor dit doel dan ook een bijzonder geschikt apparaat.
Een compleet herkenningssysteem gebaseerd op de lagenstruktuurcodes 30 behorende bij vier aanzichtrichtingen is eenvoudig van opzet.
Fig, 11 geeft hiervan een blokschema. Een inrichting voor het opnemen van de informatie van een document d,, bijv. een opneemcamera 1, geeft via een drempelschakeling 2 de tekenbeeldinformatie door aan een schakeling 3 Voor het discretiseren, welke schakeling 8004426 - 8 -
Cf •t' ft
If op zijn beurt de informatie doorschuift naar een binair geheugen 4.
De tot dusver genoemde techniek wijkt niet af van die bijv. volgens het in de inleiding genoemde Duitse octrooischrift 2432129.
Een gecombineerde schakeling 5, 6 dient voor het selecteren van een 5 enkel vak en het geometrisch scheiden van de tekenbeelden, welke techniek beschreven is bijv. in het Nederlandse octrooischrift 160408.
Een schakeling 7 genereert in ëên scan over het geheugen van de schakeling 5, 6, tegelijk voor vier aanzichtrichtingen de quasi-10 topologische code.
Een schakeling 8 voorzien van een speciaal geprogrammeerde microprocessor transformeert de vier quasi-topologische codetabellen naar vier lagenstructuurcodes en signaleert bovendien wanneer het werk gereed is, zodat een centrale processor 12 dit kan registreren 1.5 en nieuwe taken kan uitdelen.
In een geheugen 9 is opgeslagen welke lagenstruktuurcodes in een leer-set voorkomen, en hoe vaak. Door gebruik te maken van tabellen waarin is vermeld hoe vaak voor elke klasse de lagenstruktuurcodes voor de vier aanzichtrichtingen en combinaties daarvan in de leerset ZO voorkomen, wordt met behulp van een vergelijker 10 bepaald welke klasse de meest waarschijnlijke is.
Voor het bepalen van de klasse kunnen hardware schakelingen volgens het meermalen genoemde Duitse octrooischrift 2432129 worden toegepast. Ook kan de centrale processor 12 voor dit doel zijn ingericht.
25 Wanneer de kansen afgelezen of berekend zijn, volgt tenslotte de statistische klassificatie in een schakeling II. Deze schakeling kiest de klasse met de hoogste kans van voorkomen.
800 4 4 26

Claims (2)

  1. 2. Inrichting volgens conclusie 1, met het kenmerk, dat bij de over- gang van de quasi-topologische codetabellen naar. de lagenstruktuurcodes slechts bij een afsplitsing of een samenvloeiing van takken een overgang naar een andere kolom wordt gecodeerd terwijl delen van eenzelfde volledige tak in verschillende kolommen naar eenzelfde kolom 20 worden verschoven.
  2. 3. Inrichting volgens conclusie 2, met het kenmerk dat in de lagenstruktuurcodes slechts begin, eind, eventueel voorkomende afsplitsingen en samenvloeiingen van de takken en opvulpunten in de aansluitingen van de takken zijn gecodeerd. 800 44 26
NL8004426A 1980-08-01 1980-08-01 Inrichting voor het herkennen van tekens. NL8004426A (nl)

Priority Applications (3)

Application Number Priority Date Filing Date Title
NL8004426A NL8004426A (nl) 1980-08-01 1980-08-01 Inrichting voor het herkennen van tekens.
EP81200847A EP0045549A1 (en) 1980-08-01 1981-07-24 Apparatus for the recognition of characters
JP56119379A JPS5833781A (ja) 1980-08-01 1981-07-31 文字認識装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL8004426A NL8004426A (nl) 1980-08-01 1980-08-01 Inrichting voor het herkennen van tekens.
NL8004426 1980-08-01

Publications (1)

Publication Number Publication Date
NL8004426A true NL8004426A (nl) 1982-03-01

Family

ID=19835697

Family Applications (1)

Application Number Title Priority Date Filing Date
NL8004426A NL8004426A (nl) 1980-08-01 1980-08-01 Inrichting voor het herkennen van tekens.

Country Status (3)

Country Link
EP (1) EP0045549A1 (nl)
JP (1) JPS5833781A (nl)
NL (1) NL8004426A (nl)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09259219A (ja) * 1996-03-26 1997-10-03 Sharp Corp 文字認識方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL160408C (nl) * 1973-02-21 1979-10-15 Nederlanden Staat Inrichting voor het lezen van tekens, bij voorkeur van cijfers.
CH591726A5 (nl) * 1973-07-30 1977-09-30 Nederlanden Staat

Also Published As

Publication number Publication date
JPS5833781A (ja) 1983-02-28
EP0045549A1 (en) 1982-02-10

Similar Documents

Publication Publication Date Title
US4513442A (en) Method for locating and circumscribing text areas on a master which may contain text, graphics and/or image areas
US3541511A (en) Apparatus for recognising a pattern
US9014479B2 (en) Method and system for text-image orientation
US4468808A (en) Feature extraction system for digitized character information
JPS63261486A (ja) 書体識別装置
IE832262L (en) Image processors
Sunny et al. Image based automatic traffic surveillance system through number-plate identification and accident detection
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
US4783835A (en) Method of character recognition
NL8004426A (nl) Inrichting voor het herkennen van tekens.
KR100243350B1 (ko) 뉴스 비디오 자막 추출 및 인식 방법
CN112926568B (zh) 联锁表蓝图识别方法、装置、电子设备及存储介质
JPS6141029B2 (nl)
JPH09134404A (ja) 棒グラフ認識装置
Balasubramanian et al. Information extraction from tabular drawings
JP3220226B2 (ja) 文字列方向判別方法
CN114173190A (zh) 视频数据检测方法、装置、电子设备和存储介质
JP2509992B2 (ja) 分離文字の統合方式
Kazymyr et al. Recognition of license plates symbols of different formats
JPH04260980A (ja) 図形認識装置
JPS5811663B2 (ja) 文字図形認識方式
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
CN113936224A (zh) 一种检测方法、装置、计算机设备和存储介质
JPS60258688A (ja) パタ−ン認識方法及びこれを用いた装置
JPH07220028A (ja) 文字認識装置

Legal Events

Date Code Title Description
A1B A search report has been drawn up
A85 Still pending on 85-01-01
BV The patent application has lapsed