DK173066B1 - Apparat til behandling af dokumenter - Google Patents

Apparat til behandling af dokumenter Download PDF

Info

Publication number
DK173066B1
DK173066B1 DK198906450A DK645089A DK173066B1 DK 173066 B1 DK173066 B1 DK 173066B1 DK 198906450 A DK198906450 A DK 198906450A DK 645089 A DK645089 A DK 645089A DK 173066 B1 DK173066 B1 DK 173066B1
Authority
DK
Denmark
Prior art keywords
color
document
markings
printed
image
Prior art date
Application number
DK198906450A
Other languages
English (en)
Other versions
DK645089D0 (da
DK645089A (da
Inventor
Kenneth Terrell Lovelady
Medford Duane Sanner
Original Assignee
Banctec Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Banctec Inc filed Critical Banctec Inc
Publication of DK645089D0 publication Critical patent/DK645089D0/da
Publication of DK645089A publication Critical patent/DK645089A/da
Application granted granted Critical
Publication of DK173066B1 publication Critical patent/DK173066B1/da

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/143Sensing or illuminating at different wavelengths
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/62Retouching, i.e. modification of isolated colours only or in isolated picture areas only

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Document Processing Apparatus (AREA)

Description

DK 173066 Bl i
Opfindelsen angår et dokumentbehandlingssystem til signalbehandling af dokumenter af den art, der har påtrykte data inklusive fortrykte markeringer, der er synlige for øjet, men som ikke skal genkendes af systemet, og maskinlæsbare karakterer som skal genkendes af systemet, omfattende organer til skandering af et dokument for opfangning af 5 et farvebillede af dokumentet, der signalbehandles, samt organer forbundet til skanderingsorganerne til reduktion af kontrasten mellem de fortrykte markeringer og de baggrunde, der omgiver en maskinlæsbar karakter på basis af de fortrykte markeringers farve, og til at frembringe et filtreret billede af dokumentet, og til at afgive farven af markeringerne til organet til at reducere kontrasten.
10 Adskillige dokumenter bærer informationsmarkeringer og fortrykte karakterpositionsmarkeringer, der er synlige for øjet, og som gør det lettere at indføre den ønskede information for dokumentet. Mange fortrykte formularer anvender disse fortrykte karakterpositionsmarkeringer for anbringelse af karaktererne i særlige positioner og med de rigtige størrelser for 15 at gøre det lettere for en karakter læser at identificere karaktererne på dokumentet.
Forskellige kommercielt tilgængelige optiske karaktergenken-delsesanordninger kan identificere karakterer, der er klart adskilt fra uvedkommende linier, prikker, trykmateriale og 20 andet synligt materiale, der kan være fortrykt pA dokumentet og som ikke skal kunne aflæses af den optiske karaktergenkendelsesanordning. S&danne OCR-anordn i nger har ikke vanskeligt ved at identificere en enkelt karakter eller linie af karakterer på en eller klar flade. Tilsvarende er det ikke særligt 2^ vanskeligt for optiske karaktergenkendelsesanordninger at identificere alle karaktererne pA en hel side, når blot der ikke er uvedkommende markeringer på siden, og karaktererne er korrekt registreret. På visse dokumenter er det imidlertid essentielt, at karakterer trykkes på formularer, der er fortrykt på en sådan måde, at påskrivningsområder er adskilt ved hjælp af synlige linier eller andre markeringer. Sådanne linier er nødvendige til adskillelse af data på en passende måde. Mange officielle formularer, såsoæ indkomstskat formularer folketællingsformularer, socialhjælpsformularer m.v. har kasser, i 2 DK 173066 B1 hvilke der skal trykkes information. Det har vist sig, at en maskinidentifi kat ion af håndtrykte karakterer lettes, hvis synlige afgrænsningsmarker på dokumentet er fortrykt således, at det bliver lettere at udfylde dokumentet. Ønskværdigheden 5 af de fortrykte karakterpos itionsmarkeri nger afvejes over for problemerne med at få de optiske karaktergenkendelsesanordninger til at genkende karakterer på dokumenter indeholdende sådanne markeringer. OCR-anordningerne må være baseret på 1ys-reflektionen fra karakterbaggrunden og absorption fra selve jq karaktererne for derigennem at kunne skelne mellem sande karakterer, der skal identificeres af OCR-anordni ngen, og andre synlige markeringer i nærheden af karakterer, og som berører eller passerer karaktererne eller omgiver karaktererne.
Der er foreslået dokumentbehand1 ingssysterner, der tillader at ^ OCR-anordninger skelner mel lem fortrykte karakterpositionsmarkeringer og de aktuelle karakterer, der skal aflæses. Et sådant system er beskrevet i US-patentskrift nr. 3.444.517 i navnet J. Rabinow og som har titlen "Optical Reading Machine and Specially Prepared Document Therefor". Denne optiske læsemaskine anvender fortrykte dokumenter, i hvilke karakterposi-20 tionsmarkeri ngerne er trykt i fluorescerende materiale. Dokumentet underkastes en eksiterende bestråling under aflæsningscyklen således, at de sande karakterer reflekterer meget lidt af bestrålingen, medens afmærkningerne energi forsynes på en sådan måde, at de emitterer energi, der kan påvirke en skan-2^ derende fotocelle. Selv om disse markeringer under almindeligt lys synes at være synlige ved tilførsel af energi i samarbejde med deres strålingskilde, emitterer disse mærker energi på en sådan måde, at den skanderende fotocelle tilvejebringer udgangssignaler som om mærkerne ikke eksisterer eller mærkerne er lysere end baggrunden eller de karakterer, der skal aflæ-^ ses. Hele sort-t i 1-hvid-området for anordningen, der undersøger karaktererne, er derfor upåvirket.
Mange dokumenter er fortrykte i flere forskellige farver, idet baggrunden såvel som karakterpositionsmarkeringerne kan være trykt med blæk af forskellige farver. For at eliminere de for- 3 DK 173066 B1 trykte farvepositionsmarkeri nger, der trykkes med farvet blak, er der blevet gjort brug af forskellige optiske filtre og linser for at forhindre, at denne information opfanges fra det dokument, der tilføres til den optiske karaktergenkendelsesanordning således, at karaktergenkendelsesanordningen "afbiendes” over for disse farveblek. Farvefølsomme fotoceller anvendes i karaktergenkendelsesanordningen til at frafiltrere den fortrykte karakterpositions-biliedelement informat ion og kun tilføre sand karakterbilledelanentinfonrøtion til den optiske ka- ^ raktergenkendelsesanordning. Sådanne systemer kraver multiple optiske filtre, der må udskiftes afhangigt af farverne af det blak, der anvendes på den fortrykte formular.
Et andet system til at forhindre vekselvirkning af fortrykte 10 karakterpost ionsmarkeringer med aktuelle karakterer, der skal afleses på et dokument, er beskrevet i US-patentskrift nr.
RE.29.104 i navnet David H. Shepard, og som har titlen "Method of Scanning Documents to Read Characters Thereon without Interference From Visible Harks on the Document Wich Are Not To Be ^ Read By the Scanner". Dette system anvender en 1aserscanneren-hed, der er indrettet til at skandere et dokument. Farven af markeringerne på dokumentet, der ikke skal leses, er relateret til 1 aserbølgelengden således, at lyset reflekteret fra markeringerne har den samme intensitet som lyset reflekteret fra dokumentets baggrund, og tilstedevarelsen af disse fortrykte karakterpositionsmarkeringer vekselvirker ikke med aflmsningen af karaktererne. Laserbølgelsngden er derfor låst til farven af de fortrykte karakterpositionsmarkeringer, og et sådant system vil ikke let kunne tilpasses til forskellige farvede fortrykte markeringer på forskellige dokumenter såvel som til forskelligt farvede fortrykte karakterpositionsmarkeringer på det samme dokument, der skal signalbehandles og afleses ved hjalp af en optisk karaktergenkendelsesanordning.
4 DK 173066 B1
For mange anvendelser ska! dokumentbehandlingssystemer også kunne vise et billede af det dokument, der behandles af systemet. Billedet kan anvendes af en operatør til at verificere eller korrigere data afl*st ved hjalp af den optiske tegngenkendelses-5 del af dokumentbehandlingssystemet. Det er ønskværdigt, at det viste billede nøjagtigt afspejler det aktuelle billede af dokumentet for operatøren af dokumentbehandlingssystemet. Det viste billede skal derfor indeholde de fortrykte karakterposi- ti onsmarker i nger, der som tidligere nævnt, forstyrrer 1Q genkendelsesprocessen af optiske karaktergenkendelsesanordninger i dokumentbehandlingssystemet. Hvis dataene tilført til den optiske karaktergenkendelsesenhed også vises for operatøren mangler meget af det aktuelle informationsindhold af dokumentet, og brugeren af systemet kan ikke se et sandt billede af det dokument, der behandles. Der er foreslået systemer til uafhængig opfangning af billedet af et dokument og for opfang-ning af data for tilførsel til en optisk karaktergenkendelsesanordning. Et sådant dobbelt opfangningssystem er beskrevet i US-patentskrift nr. 4.205.780 i navnet Emmett Burns et al. og som har titlen "Document Processing System and Method". Dette 20 system kræver ligesom andre systemer, der anvender optiske karaktergenkendelsesanordninger, separate dataopfangningsanord-ninger, der er separat optimeret for billed- og dataaftast-n i ngsfunkti oner.
Der eksisterer således et behov for et dokumentbehandl ingssy-25 stem til signalbehandling af dokumenter med fortrykte karakte rpos itionsmarkeri nger, der er synlige for øjet, men som er "afblændet” over for en optisk karaktergenkendelsesanordning, og som desuden viser et nøjagtigt billede af dokumentet. Et sådant dokumentbehandlingssystem må være i stand til at be- DK 173066 B1 s handle dokumenter med flere forskellige farver uden en mekanisk udskiftning af optiske filtre, og det skal kunne eliminere "blindblæk" af forskellige farver på samme dokument. Et sådant dokumentbehandlingssystem skal desuden kunne operere med spe-5 cielt forberedte formularer, dokumenter eller andre flader, hvorpå karakterer skal afimses ved hjalp af en karaktergenkendelsesanordning, er formet på en sådan måde, at andre afmark-n i nger end de sande karakterer ikke vil kunne skelnes af . den optiske karaktergenkendelsesanordning fra baggrundsreflektionen af over fladen.
10
Der er desuden opstået et behov for et dokumentbehandl i nssystem ned et enkelt dataløft for opfangning af både et billede af et dokument og karakterer, der skal tilføres til en optisk karaktergenkendelsesanordning. Et sådant system skal også kunne programmeres for genkendelse af forskellige typer af op-15 tiske karakterer, være elektronisk udskiftelig for visning af forskellige typer af dokumentbi lieder og have en lille reaktionstid med hensyn til farveændringer.
JP 55-146571, i navnet Hitachi Ltd., omtaler et dokumentbehandlingssystem svarende til krav l's indledning. Dette system arbejder ved at sammenligne et reflekteret billede af en 20 udfaldsfarve og et hvidområde af en formular med et lagret billede af formularen, og herfra uddrage et billede af de karakterer, der skal genkendes.
Et system, der arbejder på denne måde, rummer imidlertid mulighed for fejl, da det reflekterede billede af formularen kan indeholde detaljer eller trykfejl i forhold til det lagrede eksemplar, hvilke fejl i givet fald vil indgå som forstyrrende elementer i karaktergenkendel-25 sesprocessen. Desuden er dette system ikke særlig fleksibelt, da der i princippet skal lagres et eksemplar af alle de typer formularer, systemet skal kunne behandle.
JP 59-158481, i navnet NEC Corp., angår et system til at genkende karakterer på et dokument med karakterer i en farve og fortrykte markeringer i en anden farve ved at skelne mellem karakterernes farve og en udfaldsfarve, de fortrykte markeringer er trykt med.
30 Ifølge dette skrift omfatter karaktergenkendelsessystemet en scanner med tre primære 6 DK 173066 B1 farvefiltre, rød, grøn og blå. Et lysstyrkebehandlende kredsløb afgiver et signal svarende til summen af disse tre primære farver for hvert enkelt punkt i billedet af det dokument, der skal signalbehandles, og et chromaticitetskredsløb afgiver to chromaticitetssignaler ved henholdsvis at danne forholdet mellem den røde farve og summen af de tre farver, og 5 forholdet mellem den grønne farve og summen af de tre farver. Et diskriminatorkredsløb skelner dernæst mellem en anden farve og en udfaldsfarve og afgiver et signal for de punkter, der er beskrevet med en anden farve end udfaldsfarven.
Arbejdsgangen i dette dokumentbehandlingssystem er imidlertid ret indviklet og finder hovedsaglig sted i faste, elektroniske kredsløb, der ikke på nogen enkel måde lader sig 10 ændre med hensyn til følsomheden for de tre primære farver.
Formålet med opfindelsen er derfor at anvise et system, der er i stand til at afhjælpe nogle af de ulemper, der kendetegner de eksisterende systemer og samtidig at forenkle arbejdsgangen i forhold til de eksisterende systemer.
Et system af den indledningsvis nævnte art er ifølge opfindelsen ejendommeligt ved, at det 15 indeholder optiske karaktergenkendelsesorganer til udelukkende at modtage information til at identificere de karakterer, som forekommer på dokumentet, og organer til at subtrahere komplementærfarven af de fortrykte markeringer fra baggrundsfarven således, at kontrasten mellem baggrunden, der omgiver en maskinlæsbar karakter og de fortrykte markeringer reduceres, så intensiteten af de fortrykte markeringer er den samme som intensiteten af den 20 baggrund, der omgiver en maskinlæsbar karakter.
Derved opnås et system, der er forholdsvis enkelt opbygget, da det anvender en matematisk algoritme på det afiæste billede af dokumentet til at reducere kontrasten mellem de fortrykte markeringer, og derfor ikke har behov for særlige elektroniske kredsløb for at foretage denne kontrastreduktion. Algoritmen kan relativt let ændres ved at ændre i det tilhørende 25 programmel, hvis særlige forhold, som f. eks. en anden ønsket baggrundsfarve, nødvendiggør det. Systemet ifølge opfindelsen er også mere sikkert og fleksibelt at anvende til optisk karaktergenkendelse end eksisterende systemer, da det ikke er nødvendigt at have adgang til en lagret udgave af den fortrykte formular, der skal behandles af systemet.
Dokumentbehandlingssystemet ifølge opfindelsen behøver blot at kende til komplementær-30 farven af de anvendte fortrykte markeringer for at kunne foretage en hurtig og sikker genkendelse af karakterer med en anden farve end markeringer.
7 DK 173066 B1
Der er således opnået et apparat til optisk karaktergenkendelse af dokumenter med fortrykte markeringer, der ikke skal indgå i den endelige karaktergenkendelse, som er sikrere, enklere og mere effektivt end hidtil kendt.
Opfindelsen nærmere skal forklares i det følgende under henvisning til tegningen, hvor 5 fig. 1 viser et blokdiagram af dokumentsystemet ifølge opfindelsen, fig. 2 en illustration af et dokument s igna1behand1 et ved hjælp af dokumentbehandlingssystemet, og fig. 3 er en illustration af dataene fra dokvmentet vist i fig. 2 tilført til den optiske tegngenkendelsesenhed i dokumentbehand-1 i ngssystemet.
10
Det i fig. 1 viste dokumentbehandl ingssystem har henvisningstallet 10. Dokumentbehandlingssystemet 10 anvendes til signalbehandling af dokumenter af flere forskellige typer, i hvilke fortrykt information og markeringer for position af karakterer er synlige for øjet. Disse markeringer gør det lettere for den, der skal udfylde dokumentet, at identificere information og position af data og anbringe og forme karakterer, der skal påføres dokumentet. De fortrykte markeringer kan indeholde linier, kasser, prikker og andre styreelementer, som ikke skal aflcses af den optiske karaktergenkendelsesanordning under signalbehandling af dokumentet. Disse markeringer er typisk 20 påtrykt i "blind" blak, reflekterende blak eller udfaldsfarver, og selv om de er synlige for øjet, skal de vare usynlige for karaktergenkendelsesanordningen. Disse fortrykte markeringer kan trykkes i enhver farve blak og det foreliggende system 10 kan anvendes i forbindelse med dokumenter, der har forskellige 25 farver blæk på samme dokument.
Der kraves for det meste optiske tegngenkendelsesanordninger til at identificere karakterer trykt på en optisk konstraste-rende flade. De sædvanlige krav er, at karaktererne skal vare mørke, medens baggrunden er lys således, at sort-ti 1-hvidforholdet er så stort som muligt. Under almindelig belysning er karaktererne så lysabsorberende som muligt, medens bag- 8 DK 173066 B1 grundsarearealet er så lysreflekterende som muligt. Oårlig eller forringet OCR-trykning kan have trykkekontrastforhold, der er så lave, som det blinde blæk eller reflektioner, der er lige så høje som reflektionen af det blinde blæk, og OCR-tryk-5 ningen kan derfor ikke tærskel værd ibehand1 es uden forstyrrelser, hvis det blinde blæk ikke elimineres. Man har også konstateret vanskeligheder i forbindelse med disse optiske karaktergenkendelsesanordninger, eftersom der kræves uvedkommende påtrykt materiale på samme flade som karaktererne, der skal identificeres. Disse fortrykte markeringer, der i det følgende omtales som markeringer, er synlige for øjet og kan antage form af linier, kasser, der omgiver en karakter, skrevne instruktioner på dokumentet og andre markeringer, der påvirker funktionen af den optiske karaktergenkendelsesånordning skadeligt* Disse markeringer vil blive diskuteret i forbindelse med fig.
2. Ifølge opfindelsen reduceres kontrasten mellem markeringerne og baggrunden, der omgiver en karakter, der skal aflæses, ved at subtrahere en procentdel af den komplementære farve af markeringerne fra den farvekanal, der bedst svarer til farven af markeringerne. Det resulterende udgangssignal 20 har det samme intensitetsniveau for markeringerne som karakterens baggrunds i ntens itet. Baggrundsintensiteten "ses" derfor son den samme intensitet som markeringerne således, at markeringen bliver blind for den optiske karaktergenkendelses-anordn i ng.
Det foreliggende dokumentbehandlingssystem 10 udnytter en 25 farvescanner/et farvekamera 12 til i farve at opfange billedet af det dokument, der skal signalbehandles. Farvescanneren/ka-meraet 12 anvender en trefarvet billedføler, der skanderer dokumentet på punkt-1i 1-punkt-bas is og frembringer videosignaler, der tilføres til en s igna1 konditi oner ing 14. Farve-30 scanneren/kameraet 12 kan f.eks. omfatte et model TCD 116 farvesæt, fremstillet og solgt af Toshiba Corporation USA, som frembringer 400 farvepunkter pr. tomme med røde, grønne, blå (RGB) udgangskanaler.
Udgangssignalet af farvescanneren/kameraet 12 forstærkes og DC-retableres, og de multiple udgangssignaler af farvescanneren 9 DK 173066 B1 12 balanceres for at forhindre fuger mellem segmenter, der anvender en signalkonditionering 14. En forst»rkm* ngskorrek-, tion tilføres hvert enkelt billedelement ved hjalp af signalkon- i it i o neringen 14 for at normalisere hver celle til den samme 5 fo somhed således, at R, G, B-f arvekanalerne alle er normaliseret til "1" ved betragtning af en kalibreret hvid flade, hvorved virkningen af en hvid belysningsanordning med "samme energi" opretholdes.
R-, G-, B-udgangen af s igna1konditi oner ingsenheden 14 tilfores samtidigt til tre signalbehandlingskanaler af dokumentbehandlingssystemet 10. De tre kanaler indeholder en farvebil-ledkanal 16, en monochrom billedkanal 18 og en optisk karaktergenkendelseskanal 20 (OCR). Hver kanal 16, 18 og 20 fungerer uafhmngigt af de andre og hver af eller begge kanalerne 16 og 18 kan anvendes med dokumentbehandlingssystemet 10.
15
Udgangen af signalkonditioneringen 14 tilføres til farvelagerenheden 30 i kanal 16 af dokumentbehandlingssystemet 10. Udgangen af farvelagerenheden 30 tilføres til en farvebi1 ledvisning 32, der f.eks. kan tilvejebringe et 1024 X 1024 billed-elementbi1 lede ved 24 bit pr. billedelement. Det billede, der 2q vises på farvebi1ledvisningen 22, representerer farvebilledet af dokumentet opfanget ved hjelp af farvescanneren/kameraet 12 og kan anvendes til at hjelpe en operatør af dokumentbehandlingssystemet 10 med at identificere karakterer, der ikke skal genkendes af den optiske karaktergenkendelsesenhed ifølge op- f i nde1 sen.
25
Udgangssignalet af signalkonditioneringskredsløbet 14 er også tilført til en farvesignalbehandl ings-bi1 ledenhed 36 i kanal 18 af dokumentbehandlingssystemet 10. Farvesignalbehandlingsbi 1 1 edenheden signalbehandler signalerne fra farvescanneren/ kameraet 12 til et monochromt signal, der representerer billedet af dokumentet opfanget ved hjelp af farvescanneren/kameraet 12 i overensstemmelse med dettes lysstyrke. Andelen af hver af farvesignalerne fra farvescanneren/kameraet 12, der anvendes til dannelse af luminanssignalet, er følgende: 59* af det grønne signal, 30* af det røde signal og 11* af det blå 10 DK 173066 B1 signal. Et system til dannelse af 1uminanssignalet er beskrevet i en publikation med titlen "color TV Training Manual” publiceret af Howard W. Sams and Co., Inc., the Bobbs-Merr i 11 Co., Inc., Indianapolis, Indiana/4. udgave 1973, side 34-37, 5 hvilken beskrivelse indgår som reference. Udgangssignalet af farvesignalbehandlings-bi1 ledenheden 36 tilføres til mono-chrom-bi1 led lagerenheden 38, hvilket udgangssignal tilføres til en monochrom bi 1 ledvisning 40. Visningen 40 viser for operatøren af dokumentbehandlingssystemet 10 billedet af dokumentet opfanget ved hj*lp af farvescanneren/kameraet 12 i et 10 sort/hvidt eller monochromt billede. Det monochrome billede af dokumentet, vist ved hjælp af monochrombi11 edvisni ngen 40, kan anvendes på en måde svarende til visningen tilvejebragt ved hjalp af farvebi 1 ledvisningen 32 af operatøren af dokumentbehandlingssystemet 10.
15
Udgangssignalet af signalkonditioner ingskredsløbet 14 er også tilført til kanal 20 af det foreliggende dokumentbehandlingssystem 10 og ispr til en farvebehandl ingsenhed 44. Farvebe-handlingsenheden 44 modtager også et indgangssignal tilvejebragt ved hjalp af systemets Programmel eller ved hjalp af en operatør, der indikerer karakteristikkerne af det blinde (usynlige) blak og isar farven af det blinde blak. Farvesignal behand 1 i ngsenheden 44 foretager en elektronisk filtrering af de fortrykte markeringer fra dataene opfanget ved hjælp af farvescanneren/ kameraet 12 for tilførsel til OCR-enheden 48 for karaktergenkendelse. Udgangssignalet af farves ignalbehand- ^ lingsenheden 44 kan tilføres direkte til OCR-enheden 48 eller lagres i en lagerenhed 46 for efterfølgende tilførsel til OCR-enheden 48.
Farvesignalbehandlingsenheden 44 omfatter f.eks. det tredimen-tionale farvedetektions- og modifikationssystem, der er beskrevet i US-patentskrift nr. 4.488.245, i navnet G. B. Oalke et al., og som har titlen "Method and Means for Color Detection and Modification". Beskrivelsen og tegningerne til dette patent indgår som reference.
I en alternativ udformning af dokumentbehandlingssystemet 10 virker farvesigna1behand1 ingsenheden 44 som et elektronisk n DK 173066 Bl filter, der subtraherer en procentdel af komplementærfarven af de fortrykte markeringer fra farvekanalen (RGB), der bedst matcher ti! farven af de fortrykte markeringer- Resultatet er, at baggrundsintensiteten n$es" med samme intensitet som de 5 fortrykte markeringer således, at markeringerne bliver blinde for den optiske karaktergenkendelsesenhed 48. I denne udførelsesform kan farvesignalbehandlingsenheden 44 f.eks. indeholde en opslagstabel for generering af komplementærfarven på basis af et indgangssignal af blindfarvekarakteristikkerne. Farven 10 af den blinde blæk kan forudindstilles ved drift af systemets programmel afhængigt af den særlige formular eller det dokument, der signalbehandles, en operatørindgangsomskifter eller operatørmenuvalget eller som beskrevet i 245-patentet.
15 Farvesignalbehandlingsenheden 44 subtraherer en procentdel af komplementærfarven fra bl indblækkanalen eller -planet. Den værdi, der skal subtraheres, er differencen mellem .· 1) blind-blækværdien i b 1 indblækkanalen omfattende billedet af de fortrykte markeringer og: 2) den hvide farve eller baggrundsfar-20 ven i blindblækkanalen repræsenterende det areal, der omgiver en karakter, der skal genkendes. Eftersom der ikke er nogen blindblækenergi i komplementærfarven, er der ikke subtraheret noget fra blindblækkanalen under signa lbehandling af blind-blækbilledelementerne. Når reflektansen er fra baggrunden om-25 kring en karakter, antager et komplementært udgangssignal sin maksimale værdi, og subtraktionen reducerer værdien af de hvide baggrundsbilledelementer til værdien af reflektionen eller energien af det blinde blæk, hvorved værdien af den hvide baggrund bliver lig med værdien af den blinde blæk, 30 hvilket resulterer i en kontrast på 0. Når et billedelement er sort eller antager en ikke-blind blækfarve repræsenterende en karakter, der skal genkendes, er kontrasten øget en smule afhængigt af intensiteten og farven. Farvesignalbehandlingsenheden 44 foretager følgende aritmetiske operationer for røde, 35 blå og grønne blinde blæktyper, der anvendes til trykning af positionsmarkeringer for den fortrykte karakter: 12 DK 173066 B1 R = —1 (BIH - %CH) (1) 1 % hvor.· R er det afblændede resultat; 5 (udgangssignalet af farvesignalbehandlingsenheden 44) BIH er blindblækfarven; CH er komplementet af bl indblækfarven; 10 % er 1 - reflektionen af det blinde blæk i farvekana-len, og i er den reskalerende faktor.
15
Den resulterende bi 11ede1ementampli tude eller lysstyrke er p4 ny skaleret tilbage til 100* under anvendelse af faktoren 20 rH ·
Komplementet af bl indblækfarverne for grøn er magenta, som er rød plus blå divideret med 2; for rød er det cyan, som er blå plus grøn divideret med 2; og for blå er det gult, som er rød plus grøn divideret med 2. De fortrykte markeringer kan være 2 5 magenta, cyan og gul, i hvilket tilfælde komplementerne er rød, blå og grøn. I almindelighed er den bedste komplementære farve kanalen eller den kombination af kanaler, der har den mindste mængde blindblækenergi .
30
Udgangssignalet af farves igna1behand1 ingsenheden 44 tilføres til en optisk karaktergenkendelsesenhed 48. Dette udgangssignal repræsenterer kun billedelementer repræsenterende dataindholdet af karakterer, der skal genkendes, og baggrunden, der omgiver sådanne karakterer med fortrykte markeringer, der er blevet elimineret ved drift af farves ignalbehand1 ingsenhe-den 44. OCR-enheden 48 kan f.eks. omfatte et system, der er be- 13 DK 173066 B1 skrevet i US-patentskrift nr. 3.761.87$ i navnet L. Flaherty, et al. 09 ned titlen "Recognition Unit for Optical Character Reading Systen", hvilket skrift indgår son reference.
5 I fig. 1 og 2 er der vist et dokument 52 (fig. 2), der er representativt for dokumenter signalbehandlet ved hjælp af dokumentbehandlingssystemet 10. Dokumentet 52 indeholder fortrykte karakterpositionsmarkeringer tillige med skrevne instruktioner, der vekselvirker med driften af OCR-enheden 48 under ka-10 raktergenkendelse. Dokumentet 52 indeholder fortrykte karakterpositionsmarkeringer 1 form af kasser 54, der anvendes af det individuelle kompletterende dokument 52 til at lokalisere og danne karaktererne omfattende navnet "SMITH MARY". På dokumentet 52 er der desuden indikeret et område for adressen af 15 det individuelle kompletterende dokument 52 indeholdende et felt 56 for gadenavn, et felt 58 for by og et felt 60 for staten. De fortrykte markeringer indeholder ordene "gadenavn", "by" og "stat" ud over de stiplede linier, der adskiller felterne 56, 58 og 60. På dokumentet 52 er der desuden et om-20 råde for komplettering af dataene og som indeholder felterne 62, 64 og 66 representerende dag, måned og år. Instruktionsinformation er trykt i hver felt repræsenterende "dag", "måned" og "år". Endelig kræver en del af dokumentet 52 den individuelle zip-kode og kasser 68 til lokalisering af cifrene af 25 zip-koden.
Fig. 3 illustrerer dataene af dokumentet 52 efter at dokumentet 52 er blevet signalbehandlet af farvesignalbehandlingsenheden 44. De fortrykte markeringer er blevet "elimineret" og 30 er ikke tilført til OCR-enheden 48. Alle linier og kasser, der omgiver karakterer og skrevne instruktioner på dokumentet 52, der skadeligt påvirker driften af OCR-enheden 48, er blevet elektronisk frafiltreret og er ikke tilført til OCR-enheden 48. Visninger 32 og 40 af dokumentbehandl ingsenheden 10 vil 35 for operatøren af systemet 10 vise billedet af dokumentet 52 i farve eller 1 monochrom som vist i fig. 2.
14 DK 173066 B1
Det foreliggende dokumentbehand 1 ingssystem 10 opererer derfor på alle de farver af blæk, der anvendes til fortrykning på dokumentet. Farvescanneren/kameraet 12 tjener til at opfange indholdet af brugertilført karakterinformation, såvel som 5 fortrykte markeringer i et enkelt dataløft. Oisse opfangne data tilføres til bi 1 ledvisni nger 32 og/eller 40 for visning af et billede af dokumentet såvel som den del af de opfangne data, der repræsenterer karakterinformationen til OCR-enheden 48 for karaktergenkendelsesformål. De fortrykte markeringer 10 "afblændes" fra OCR-enheden 48 ved en automatisk reduktion af kontrasten af det blinde blæk uden anvendelse af mekaniske filtre, fluorescerende blæktyper eller bølgelængdeafhængige la-serscannere.
15 Selv om opfindelsen er blevet beskrevet i forbindelse med specielle udførelsesformer, er det underforstået, at der vil kunne foretages ændringer og modifikti oner, uden at der derved afviges fra opfindelsens idé.

Claims (1)

  1. DK 173066 Bl \ 15 Dokumentbehandlingssystem (10) til signalbehandling af dokumenter (52) med påtrykte data inklusive fortrykte markeringer (54), der er synlige for øjet, men som ikke skal 5 genkendes af systemet, og maskinlæsbare karakterer (56, 58, 60), som skal genkendes af systemet, omfattende: organer (12) til skandering af et dokument for opfangning af et farvebillede af dokumentet, der signalbehandles, organer (44) forbundet til skanderingsorganerne til reduktion af kontrasten mellem de 10 fortrykte markeringer og baggrunden, der omgiver en maskinlæsbar karakter, på basis af de fortrykte markeringers farve, og til at frembringe et filtreret billede af dokumentet og til at afgive farven af markeringerne til organet (44) til at reducere kontrasten, kendetegnet ved, at det indeholder: optiske karaktergenkendelsesorganer (48) til udelukkende at modtage information til at 15 identificere de karakterer, som forekommer på dokumentet, og organer (44) til at subtrahere komplementærfarven af de fortrykte markeringer fra baggrundsfarven således, at kontrasten mellem baggrunden, der omgiver en maskinlæsbar karakter og de fortrykte markeringer, reduceres således, at intensiteten af de fortrykte markeringer er den samme som intensiteten af den baggrund, der omgiver en maskin-20 læsbar karakter.
DK198906450A 1988-12-21 1989-12-19 Apparat til behandling af dokumenter DK173066B1 (da)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US28959688 1988-12-21
US07/289,596 US5003613A (en) 1988-12-21 1988-12-21 Document processing system and method

Publications (3)

Publication Number Publication Date
DK645089D0 DK645089D0 (da) 1989-12-19
DK645089A DK645089A (da) 1990-06-22
DK173066B1 true DK173066B1 (da) 1999-12-13

Family

ID=23112228

Family Applications (1)

Application Number Title Priority Date Filing Date
DK198906450A DK173066B1 (da) 1988-12-21 1989-12-19 Apparat til behandling af dokumenter

Country Status (6)

Country Link
US (1) US5003613A (da)
EP (1) EP0375090B1 (da)
JP (1) JP2864137B2 (da)
DE (1) DE68925682T2 (da)
DK (1) DK173066B1 (da)
NO (1) NO177119C (da)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5335292A (en) * 1988-12-21 1994-08-02 Recognition International Inc. Document processing system and method
EP0407935B1 (en) * 1989-07-10 1999-10-06 Hitachi, Ltd. Document data processing apparatus using image data
JP2746692B2 (ja) * 1989-10-09 1998-05-06 富士通株式会社 色画像データ処理装置
US5134669A (en) * 1990-06-13 1992-07-28 National Computer Systems Image processing system for documentary data
US5103490A (en) * 1990-06-13 1992-04-07 National Computer Systems, Inc. Method and apparatus for storing and merging multiple optically scanned images
US5014329A (en) * 1990-07-24 1991-05-07 Eastman Kodak Company Automatic detection and selection of a drop-out color using zone calibration in conjunction with optical character recognition of preprinted forms
JPH05501778A (ja) * 1990-07-24 1993-04-02 イーストマン・コダック・カンパニー 事前印刷書式の光学式文字認識のために多数ドロップアウトカラーの自動的な電子的フィルタリングを用いた自動的本文分離のための方法及び装置
US5014328A (en) * 1990-07-24 1991-05-07 Eastman Kodak Company Automatic detection and selection of a drop-out color used in conjunction with optical character recognition of preprinted forms
JP3001065B2 (ja) * 1991-03-19 2000-01-17 テイ・エイ・エス通商株式会社 プログラムの作成方法
US5459797A (en) * 1991-03-30 1995-10-17 Kabushiki Kaisha Toshiba Character reading system
US5987149A (en) 1992-07-08 1999-11-16 Uniscore Incorporated Method for scoring and control of scoring open-ended assessments using scorers in diverse locations
US5672060A (en) * 1992-07-08 1997-09-30 Meadowbrook Industries, Ltd. Apparatus and method for scoring nonobjective assessment materials through the application and use of captured images
JPH06131495A (ja) * 1992-10-15 1994-05-13 Fujitsu Ltd 画像情報抽出方式
US5437554A (en) 1993-02-05 1995-08-01 National Computer Systems, Inc. System for providing performance feedback to test resolvers
JP3258122B2 (ja) * 1993-03-31 2002-02-18 株式会社東芝 画像処理装置
US5748780A (en) * 1994-04-07 1998-05-05 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression
US5642442A (en) * 1995-04-10 1997-06-24 United Parcel Services Of America, Inc. Method for locating the position and orientation of a fiduciary mark
WO1996032692A1 (en) * 1995-04-10 1996-10-17 United Parcel Service Of America, Inc. Two-camera system for locating and storing indicia on conveyed items
DE19515981B4 (de) * 1995-05-05 2005-11-17 Oventrop, Josta Verfahren zum Erfassen manuell beschriebener Belege
US5754743A (en) * 1996-04-10 1998-05-19 Snap-On Technologies, Inc. Apparatus and method for printing color screen displays on a monochrome printer
FR2756952B1 (fr) * 1996-12-06 1999-06-25 Itesoft Systeme de reconnaissance de caracteres manuscrits
US6021220A (en) * 1997-02-11 2000-02-01 Silicon Biology, Inc. System and method for pattern recognition
US6961482B2 (en) * 2001-03-05 2005-11-01 Ncs Pearson, Inc. System for archiving electronic images of test question responses
US6810232B2 (en) 2001-03-05 2004-10-26 Ncs Pearson, Inc. Test processing workflow tracking system
US6751351B2 (en) 2001-03-05 2004-06-15 Nsc Pearson, Inc. Test question response verification system
US6675133B2 (en) 2001-03-05 2004-01-06 Ncs Pearsons, Inc. Pre-data-collection applications test processing system
GB2381687B (en) * 2001-10-31 2005-08-24 Hewlett Packard Co Assisted reading method and apparatus
US7164500B2 (en) * 2002-01-29 2007-01-16 Hewlett-Packard Development Company, L.P. Method and apparatus for the automatic generation of image capture device control marks
US20040064472A1 (en) * 2002-09-27 2004-04-01 Oetringer Eugen H. Method and system for information management
US6993818B2 (en) * 2003-03-17 2006-02-07 Memx, Inc. Multi-fixture assembly of cutting tools
US20050067482A1 (en) * 2003-09-26 2005-03-31 Wu Daniel Huong-Yu System and method for data capture and management
EP1914978A3 (en) * 2006-10-19 2009-08-19 Murata Machinery Ltd. Image processing apparatus and image processing method
JP4470958B2 (ja) * 2007-05-01 2010-06-02 村田機械株式会社 画像処理装置
US8244037B2 (en) * 2007-11-15 2012-08-14 Master Wave International Company Ltd Image-based data management method and system
US8804201B1 (en) 2012-04-04 2014-08-12 Banctec, Inc. System and method for characterizing a scanned image artifact and modifying a scanned image based thereon

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3444517A (en) * 1965-03-09 1969-05-13 Control Data Corp Optical reading machine and specially prepared documents therefor
US3761876A (en) * 1971-07-28 1973-09-25 Recognition Equipment Inc Recognition unit for optical character reading system
USRE29104E (en) * 1971-08-18 1977-01-04 Cognitronics Corporation Method of scanning documents to read characters thereon without interference from visible marks on the document which are not to be read by the scanner
US3893166A (en) * 1972-01-05 1975-07-01 Crosfield Electronics Ltd Colour correcting image reproducing methods and apparatus
US3903517A (en) * 1974-02-26 1975-09-02 Cummins Allison Corp Dual density display
US4021777A (en) * 1975-03-06 1977-05-03 Cognitronics Corporation Character reading techniques
DE2544703C3 (de) * 1975-10-07 1978-04-06 Dr.-Ing. Rudolf Hell Gmbh, 2300 Kiel Verfahren und Schaltungsanordnung zum Erkennen von Farben einer farbigen Fläche
US4205780A (en) * 1977-03-21 1980-06-03 Teknekron, Inc. Document processing system and method
CH646788A5 (de) * 1978-11-28 1984-12-14 Hell Rudolf Dr Ing Gmbh Verfahren und schaltungsanordnung zum erkennen von farben.
JPS55146571A (en) * 1979-05-04 1980-11-14 Hitachi Ltd Optical character reader
US4323919A (en) * 1979-08-09 1982-04-06 Canon Kabushiki Kaisha Optical scanner for reading data recorded in plural colors
US4488245A (en) * 1982-04-06 1984-12-11 Loge/Interpretation Systems Inc. Method and means for color detection and modification
US4547897A (en) * 1983-02-01 1985-10-15 Honeywell Inc. Image processing for part inspection
JPS59158481A (ja) * 1983-03-01 1984-09-07 Nec Corp 光学式図面読取り方法および装置
JPS60151789A (ja) * 1984-01-19 1985-08-09 Hitachi Ltd 多機能画像処理プロセツサ
JPS60230693A (ja) * 1984-04-27 1985-11-16 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション カラ−画像表示システム
GB2160065B (en) * 1984-06-09 1988-11-09 Fuji Photo Film Co Ltd Method of processing an image signal
US4628534A (en) * 1984-07-06 1986-12-09 Honeywell Information Systems Inc. Method for changing the resolution of compressed image data
US4769718A (en) * 1986-01-07 1988-09-06 Ushio Denki Kabushiki Kaisha Image processing apparatus
US4760607A (en) * 1986-07-31 1988-07-26 Machine Vision International Corporation Apparatus and method for implementing transformations in grayscale image processing

Also Published As

Publication number Publication date
EP0375090A3 (en) 1992-08-26
EP0375090A2 (en) 1990-06-27
DE68925682D1 (de) 1996-03-28
DK645089D0 (da) 1989-12-19
US5003613A (en) 1991-03-26
NO895105L (no) 1990-06-22
NO177119C (no) 1995-07-19
JP2864137B2 (ja) 1999-03-03
NO895105D0 (no) 1989-12-19
JPH02264384A (ja) 1990-10-29
EP0375090B1 (en) 1996-02-14
NO177119B (no) 1995-04-10
DE68925682T2 (de) 1996-06-27
DK645089A (da) 1990-06-22

Similar Documents

Publication Publication Date Title
DK173066B1 (da) Apparat til behandling af dokumenter
US5335292A (en) Document processing system and method
US3444517A (en) Optical reading machine and specially prepared documents therefor
US7417774B2 (en) Method and apparatus for selective processing of captured images
US5719948A (en) Apparatus and methods for fluorescent imaging and optical character reading
US8610966B2 (en) System for template based extracting information from an identity card
US4634148A (en) Negotiable instrument
US6373965B1 (en) Apparatus and methods for authentication using partially fluorescent graphic images and OCR characters
US20060072822A1 (en) System for extracting information from an identity card
KR20080095743A (ko) 화상 처리 프로그램 및 화상 처리 장치
US6795209B1 (en) Method and apparatus for modifying a hard copy image digitally in accordance with instructions provided by consumer
US20060215232A1 (en) Method and apparatus for processing selected images on image reproduction machines
CN111327783B (zh) 具有图像处理功能的事务机
US20230118236A1 (en) Collation device and non-transitory computer readable medium storing program
JPH08161423A (ja) 照明装置および文字読取装置
JP3812858B2 (ja) 紙葉類真偽識別装置
US10452901B2 (en) Image processing device, image processing method, and program
JPS62276554A (ja) 色分解の印刷方法
USH524H (en) Image processing system for converting monochrome bank check images to multicolor bank check images
JPH06215206A (ja) マークシート
JP7337572B2 (ja) 記番号読取装置、紙葉類処理装置、及び記番号読取方法
JP4193306B2 (ja) 光学式マーク読取装置
JPH10329459A (ja) 用紙判定方法および用紙判定装置
JP2004005070A (ja) 文字認識システム、及び文字認識プログラム
JPS6017005Y2 (ja) パタ−ン判定装置

Legal Events

Date Code Title Description
B1 Patent granted (law 1993)
PBP Patent lapsed

Country of ref document: DK