NL2003382C2 - METHOD AND DEVICE FOR FILLING A DATABASE. - Google Patents
METHOD AND DEVICE FOR FILLING A DATABASE. Download PDFInfo
- Publication number
- NL2003382C2 NL2003382C2 NL2003382A NL2003382A NL2003382C2 NL 2003382 C2 NL2003382 C2 NL 2003382C2 NL 2003382 A NL2003382 A NL 2003382A NL 2003382 A NL2003382 A NL 2003382A NL 2003382 C2 NL2003382 C2 NL 2003382C2
- Authority
- NL
- Netherlands
- Prior art keywords
- text
- data
- template
- database
- reading
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Document Processing Apparatus (AREA)
Description
Werkwijze en inrichting voor het vullen van een databankMethod and device for filling a database
De onderhavige uitvinding heeft betrekking op een werkwijze en inrichting voor het vullen van een databank. Het vullen van databanken is op zich bekend, en kan op vele 5 wijzen geschieden. De onderhavige uitvinding heeft in het bijzonder betrekking op het in een databank opnemen van gegevens die in een niet-direct voor opname in een databank geschikt formaat worden aangeleverd, en het vervolgens beschikbaar stellen van deze gegevens.The present invention relates to a method and device for filling a database. The filling of databases is known per se, and can be done in many ways. The present invention relates in particular to the recording in a database of data which is supplied in a format that is not immediately suitable for inclusion in a database, and the subsequent provision of this data.
10 De uitvinding verschaft daartoe een werkwijze voor het vullen van een databank met records, omvattende het inlezen van ten minste een sjabloon met een opmaak die gelijk is aan de opmaak van documenten met gegevens voor de records, het vaststellen waar zich tekst bevindt in het sjabloon en het zo nodig herkennen van deze tekst, het bepalen van de locaties van relevante waarden in de herkende tekst, het inlezen van ten minste 15 één document dat is opgemaakt volgens het sjabloon, het herkennen van de tekst op de op basis van het sjabloon bepaalde locaties, en het als een record in de databank opnemen van de waarden uit de herkende tekst van het document.To this end, the invention provides a method for filling a database with records, comprising reading in at least one template with a layout that is similar to the layout of documents with data for the records, determining where there is text in the template and recognizing this text if necessary, determining the locations of relevant values in the recognized text, reading in at least one document formatted according to the template, recognizing the text on the determined on the basis of the template locations, and recording the values from the recognized text of the document as a record in the database.
Het in te lezen sjabloon kan een hardcopy of een digitaal bestand, bijvoorbeeld een 20 salarisstrook van een werknemer, omvatten, waarbij een eerste van een reeks documenten waarvan de gegevens ingelezen dienen te worden in de databank als het sjabloon kan dienen. In het geval van een hardcopy kan het document worden gescand teneinde ingelezen te kunnen worden. Een reeds digitaal beschikbaar document kan daarbij desgewenst worden geconverteerd naar een voor het inlezen geschikter formaat.The template to be read in may comprise a hardcopy or a digital file, for example a salary slip of an employee, wherein a template of a series of documents whose data is to be read into the database can serve as the template. In the case of a hard copy, the document can be scanned in order to be read. A document that is already digitally available can be converted to a more suitable format for reading in, if desired.
25 Door te bepalen waar de tekst zich bevindt op het document, behoeft bij het verwerken van de in te lezen documenten slechts het gedeelte van de documenten waarvan op basis van het ingelezen sjabloon bekend is dat zich daar de gegevens bevinden verwerkt te worden, hetgeen een reductie in verwerkingstijd en datahoeveelheid als voordeel heeft.By determining where the text is located on the document, when processing the documents to be read in, only the part of the documents for which it is known on the basis of the read-in template that the data is there needs to be processed, which is a reduction in processing time and data amount has the advantage.
30 In een uitvoeringsvorm van de onderhavige uitvinding omvat de werkwijze het inlezen van het ten minste éne sjabloon in pdf formaat. Dit formaat heeft als voordeel dat omdat de gegevens waarvoor de werkwijze bijzonder geschikt is, zoals salarisgegevens of persoonsgegevens die van loonstroken worden ingelezen, veelal beschikbaar zijn in pdf formaat, er vooraf geen conversie vereist is. Daarnaast is pdf een formaat waarin 2 nagenoeg ieder bronsysteem voor de in te lezen gegevens zonder separate exportmodules kan exporteren, door middel van een printopdracht naar een pdf-printer. Dit maakt de noodzaak van dure IT investeringen overbodig, en reduceert bovendien de kans op fouten die ontstaat bij iedere conversieslag. Het is daarbij efficiënt wanneer bij 5 de conversie of afdruk naar pdf formaat de aanwezige tekst als bewerkbare tekst wordt opgenomen.In an embodiment of the present invention, the method comprises reading in the at least one template in pdf format. This format has the advantage that because the data for which the method is particularly suitable, such as salary data or personal data read from pay slips, are often available in pdf format, no conversion is required in advance. In addition, PDF is a format in which 2 can export almost any source system for the data to be read in without separate export modules, by means of a print order to a PDF printer. This makes the need for expensive IT investments superfluous, and furthermore reduces the chance of errors occurring with every conversion stroke. It is thereby efficient if the present text is included as editable text in the conversion or print to pdf format.
Bij voorkeur vindt het vaststellen waar zich tekst bevindt in het ten minste éne sjabloon en/of het herkennen van de tekst plaats door automatische tekstherkenning. Daardoor 10 kan het verwerken van de documenten met een nog grotere snelheid plaatsvinden en wordt het benodigde aantal manuren verder gereduceerd.Preferably, determining where text is located in the at least one template and / or recognizing the text takes place by automatic text recognition. As a result, the processing of the documents can take place at an even greater speed and the required number of man-hours is further reduced.
Het bepalen van de locaties van relevante velden in de herkende tekst kan snel en eenvoudig geschieden door middel van het aanbrengen van een selectie op een grafische 15 weergave van het ingelezen ten minste éne sjabloon. Daartoe kan het ingelezen sjabloon bijvoorbeeld op een beeldscherm worden weergegeven, waarna een gebruiker door middel van een selectiemiddel, zoals een aanwijzer, een muis, of een daartoe ingericht touch-screen aangeeft waar het veld met in de databank op te nemen informatie zich bevindt. Deze locatie wordt samen met verdere gegevens van het sjabloon opgeslagen in 20 de centrale databank en gebruikt om de gegevens van de documenten die volgens het sjabloon zijn opgemaakt snel te kunnen uitlezen.Determining the locations of relevant fields in the recognized text can be done quickly and easily by making a selection on a graphical representation of the read in at least one template. To that end, the read-in template can for instance be displayed on a screen, whereafter a user indicates by means of a selection means, such as a pointer, a mouse, or a touch screen arranged for this purpose, where the field with information to be included in the database is located. This location, together with further data from the template, is stored in the central database and used to be able to quickly read out the data from the documents prepared according to the template.
In een alternatieve uitvoeringsvorm geschiedt het bepalen van de locaties door een aanduiding in te voeren waardoor een in een record op te nemen gegeven vooraf gaat, 25 zoals een lettercode of een woord. Zo kan het zijn dat het Burger Service Nummer (BSN) van een werknemer telkens vooraf wordt gegaan door de letters “BSN:”. Een dergelijk herkenningsteken kan worden gebruikt om telkens bij het inlezen van een document de waarde die volgt op “BSN:” op te nemen in een record in de databank.In an alternative embodiment, the location is determined by entering an indication that precedes a data to be recorded in a record, such as a letter code or a word. For example, it may be that the Citizen Service Number (BSN) of an employee is always preceded by the letters “BSN:”. Such a identifier can be used each time when reading a document to include the value that follows “BSN:” in a record in the database.
30 Bij voorkeur worden ook de documenten waarvan de gegevens als records in de databank opgeslagen moeten worden in pdf formaat ingelezen. In het bijzonder wanneer er gebruik gemaakt wordt van pdf-bestanden met bewerkbare tekst wordt door deze werkwijze ook de kans op fouten gereduceerd. In elk geval wordt hiermee een relatief hoge verwerkingssnelheid bereikt, terwijl de grootte van de bestanden die ingelezen 3 moeten worden relatief beperkt blijft. Voorts is het mogelijk dat er gebruik gemaakt wordt van ten minste één pdf bestand dat meerdere documenten omvat die alle volgens hetzelfde sjabloon, of volgens verschillende sjablonen zijn opgemaakt.Preferably also the documents whose data are to be stored as records in the database are imported in pdf format. In particular when PDF files with editable text are used, this method also reduces the chance of errors. In any case, a relatively high processing speed is achieved with this, while the size of the files to be read in remains relatively limited. Furthermore, it is possible that use is made of at least one pdf file which comprises several documents, all of which are drawn up according to the same template or according to different templates.
5 Indien er gebruik gemaakt wordt van meerdere sjablonen volgens welke documenten opgemaakt kunnen zijn, omvat de werkwijze volgens de uitvinding het bepalen volgens welk sjabloon een document is opgemaakt. Dit kan handmatig gebeuren, waarbij een gebruiker alvorens de documenten in te lezen aangeeft van welk sjabloon uit een keur aan beschikbare sjablonen er gebruik gemaakt kan worden, of het kan geautomatiseerd 10 gebeuren, waarbij een systeem voor het uitvoeren van de werkwijze volgens de onderhavige uitvinding is ingericht om een ingelezen document te vergelijken met de beschikbare sjablonen, en op basis daarvan het meest overeenkomstige sjabloon te selecteren. Desgewenst kan het door het systeem meest waarschijnlijk geachte sjabloon aan een gebruiker ter goedkeuring worden voorgelegd, of kan er een keuzemogelijkheid 15 voor sj ablonen worden weergegeven.If multiple templates are used according to which documents can be made up, the method according to the invention comprises determining according to which template a document is made up. This can be done manually, wherein a user indicates beforehand the documents which template from a variety of available templates can be used, or it can be done automatically, wherein a system for performing the method according to the present invention is arranged to compare a read-in document with the available templates, and to select the most corresponding template on the basis thereof. If desired, the template most likely to be considered by the system can be submitted to a user for approval, or a selection option for stencils can be displayed.
Wanneer er documenten zijn ingelezen en records in de databank zijn aangemaakt, kan er toegang tot een specifiek deel of het geheel van de gegevens van de databank aan gebruikers worden verschaft. Dergelijke toegang is bij voorkeur afhankelijk van aan de 20 gebruikers toegekende functies. In het geval dat de documenten salarisstroken omvatten kunnen werknemers, werkgevers en bijvoorbeeld de accountants als gebruikers van het systeem worden toegelaten. De databank wordt door middel van de salarisstroken gevuld met gegevens van de werknemer, zoals naam- en adresgegevens, salarisgegevens, pensioengegevens etc. De werknemer kan deze gegevens raadplegen 25 en bijvoorbeeld gebruiken om zijn jaarlijkse belastingaangifte mee te doen. De werkgever kan de gegevens van al zijn werknemers gebruiken om bijvoorbeeld jaaroverzichten te maken, en de accountant kan het systeem raadplegen om bijvoorbeeld deze jaarcijfers te controleren.When documents have been read in and records have been created in the database, users can be provided with access to a specific part or all of the data from the database. Such access is preferably dependent on functions assigned to the users. In the event that the documents include payslips, employees, employers and, for example, accountants may be admitted as users of the system. The database is filled with data from the employee by means of the salary slips, such as name and address data, salary data, pension data etc. The employee can consult this data and use it for example to participate in his annual tax return. The employer can use the data of all his employees to make annual statements, for example, and the accountant can consult the system to, for example, check these annual figures.
30 Een gebruiker kan - in afhankelijkheid van zijn rechten - toestemming verschaffen voor het ter beschikking stellen van gegevens aan ten minste een derde. Zulks kan voordelig zijn wanneer een werknemer van baan verandert, en zowel de werkgever vanwaar hij vertrekt als de werkgever waar hij heengaat gebruikmaken van een systeem voor het uitvoeren van de werkwijze volgens de onderhavige uitvinding. In dat geval kunnen 4 bijvoorbeeld de adres- en pensioengegevens van de werknemer eenvoudig van de oude naar de nieuwe werkgever worden doorgestuurd. Naast persoonsgegevens zoals adresgegevens en financiële gegevens zoals salarisgegevens kunnen overeenkomstgegevens zoals arbeidsovereenkomsten in de databank worden 5 opgenomen. Bij voorkeur omvat een systeem voor het uitvoeren van de werkwijze volgens de onderhavige uitvinding ten minste een web-interface voor het invoeren danwel raadplegen van de gegevens in de databank.30 A user can - depending on his rights - provide permission to make data available to at least a third party. This can be advantageous when an employee changes jobs, and both the employer from which he departs and the employer from whom he goes use a system for carrying out the method according to the present invention. In that case, for example, the address and pension details of the employee can easily be forwarded from the old to the new employer. In addition to personal data such as address data and financial data such as salary data, contract data such as employment contracts can be included in the database. A system for performing the method according to the present invention preferably comprises at least one web interface for entering or consulting the data in the database.
De uitvinding zal nu worden toegelicht aan de hand van de volgende figuren, waarin: 10 - Figuur 1 een stroomschema toont van een werkwijze volgens de onderhavige uitvinding;The invention will now be explained with reference to the following figures, in which: - Figure 1 shows a flow chart of a method according to the present invention;
Figuren 2a-2b invoerschermen tonen voor het inlezen van documenten;Figures 2a-2b show input screens for reading documents;
Figuur 3 een bevestigingsscherm toont voor de invoer van documenten;Figure 3 shows a confirmation screen for entering documents;
Figuur 4 een tabel weergeeft met rechten die verschillende gebruikers hebben 15 binnen een systeem voor het uitvoeren van de werkwijze volgens de onderhavige uitvinding.Figure 4 represents a table with rights that different users have within a system for performing the method according to the present invention.
Figuur 1 toont een stroomschema 1 van een werkwijze volgens de onderhavige uitvinding. Het schema toont het inlezen oftewel uploaden van documenten. Het schema 20 begint met het kiezen van een documentsoort. Daarbij wordt aan een gebruiker, bijvoorbeeld via de grafische userinterface volgens figuur 2, gevraagd een documentsoort te kiezen 2. Bij het kiezen van een documentsoort krijgt de gebruiker de optie om te kiezen tussen documentsoorten die overeenstemmen met de tot dantoe ingelezen sjablonen. Afhankelijk van de in het systeem aangemaakte gebruikers of 25 gebruikertypen kan aangegeven worden wie de ontvangers zijn van het document. Deze betreffende ontvangers kunnen vervolgens via een persoonlijke pagina met behulp waarvan zij op het systeem kunnen inloggen bekijken welke documenten zij hebben ontvangen. Het systeem kan zodanig zijn ingesteld dat het een gebruiker meldt 9 indien hij een document 3 heeft ontvangen. De gebruiker kan de gegevens die tijdens het 30 verwerken 4 in de records van de databank worden opgeslagen indien er een document ontvangen is combineren, en bijvoorbeeld gegevens uit een salarisstrook of een jaaropgave opnemen in een belastingaangifte. Het systeem kan zijn ingericht om gecomprimeerde bestanden zoals zip-bestanden 6 of pdf-bestanden 7 met meerdere 5 documenten op te nemen, en zijn ingericht om de uitgelezen waarden te valideren, bijvoorbeeld aan de hand van bekende redundancy-codes of checksum codes.Figure 1 shows a flow chart 1 of a method according to the present invention. The diagram shows the reading in or uploading of documents. The scheme 20 starts with choosing a document type. A user is then asked, for example via the graphical user interface according to Figure 2, to select a document type 2. When choosing a document type, the user is given the option to choose between document types that correspond to the templates read up to that point. Depending on the users or user types created in the system, it can be indicated who are the recipients of the document. These relevant recipients can then view which documents they have received via a personal page with the aid of which they can log into the system. The system can be set such that it notifies a user 9 if he has received a document 3. The user can combine the data stored in the records of the database during processing 4 if a document has been received, and, for example, include data from a salary slip or an annual statement in a tax return. The system can be arranged to record compressed files such as zip files 6 or pdf files 7 with several documents, and can be adapted to validate the read values, for example on the basis of known redundancy codes or checksum codes.
Figuur 2a toont een invoerscherm 10 waarin een gebruiker kan aangeven 11 wat voor 5 type document hij wil invoeren. Daarbij kan de gebruiker kiezen uit diverse op ingelezen sjablonen gebaseerde voorbeelddocumenten 12, ingedeeld in categorieën 13. Na het maken van de keus komt de gebruiker in het scherm zoals afgebeeld in figuur 2b.Figure 2a shows an input screen 10 in which a user can indicate 11 what type of document he wants to input. In addition, the user can choose from various sample documents 12 based on read-in templates, divided into categories 13. After making the choice, the user enters the screen as shown in Figure 2b.
Figuur 2b toont een invoerscherm 20 waarmee documenten kunnen worden ingevoerd. 10 Het invoerscherm biedt een gebruiker de mogelijkheid om te kiezen 21 voor wie het in te voeren document bedoeld is, en wat voor type document het betreft 22. Nadat de gebruiker deze selecties 21, 22 heeft gemaakt kan hij aangeven waar het document met de gegevens zich bevindt 23. Na het inlezen van de documenten wordt het resultaatscherm uit figuur 3 getoond.Figure 2b shows an input screen 20 with which documents can be entered. 10 The input screen offers a user the option of choosing 21 for whom the document to be entered is intended, and what type of document it concerns. 22. After the user has made these selections 21, 22, he can indicate where the document containing the data 23. After reading in the documents, the result screen from figure 3 is shown.
1515
Figuur 3 toont een resultaatscherm 30 dat weergeeft welke records 31 er zijn aangemaakt na het inlezen van de documenten 32. Door middel van het overzicht kan worden nagegaan of de gegevens op correcte wijze zijn ingelezen. Wie er vervolgens gebruik van mag en kan maken hangt af van de verstrekte rechten, die zijn weergegeven 20 in de tabel in figuur 4.Figure 3 shows a result screen 30 which shows which records 31 have been created after reading in the documents 32. By means of the overview it can be checked whether the data has been read in correctly. Who can and can subsequently use it depends on the rights granted, which are shown in the table in Figure 4.
Figuur 4 toont een tabel 40 met een voorbeeld van mogelijke documenten doe kunnen worden ingelezen, in de documenten aanwezige gegevens of groepen van gegevens 41, en rechten die gebruikers 42 hebben om de gegevens uit de records in de databank te 25 gebruiken.Figure 4 shows a table 40 with an example of possible documents that can be read, data present in the documents or groups of data 41, and rights that users 42 have to use the data from the records in the database.
Naast de getoonde voorbeelden en uitvoeringsvormen zijn er vele variaties mogelijk, die alle onder de beschermingsomvang van de navolgende conclusies worden geacht te vallen.In addition to the examples and embodiments shown, many variations are possible, all of which are understood to fall within the scope of protection of the following claims.
Claims (14)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL2003382A NL2003382C2 (en) | 2009-08-24 | 2009-08-24 | METHOD AND DEVICE FOR FILLING A DATABASE. |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL2003382 | 2009-08-24 | ||
NL2003382A NL2003382C2 (en) | 2009-08-24 | 2009-08-24 | METHOD AND DEVICE FOR FILLING A DATABASE. |
Publications (1)
Publication Number | Publication Date |
---|---|
NL2003382C2 true NL2003382C2 (en) | 2011-02-28 |
Family
ID=41693221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NL2003382A NL2003382C2 (en) | 2009-08-24 | 2009-08-24 | METHOD AND DEVICE FOR FILLING A DATABASE. |
Country Status (1)
Country | Link |
---|---|
NL (1) | NL2003382C2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6816630B1 (en) * | 2000-05-22 | 2004-11-09 | Electro-Sensors, Inc. | System and method for creating and processing data forms |
GB2415519A (en) * | 2004-06-24 | 2005-12-28 | Canon Europa Nv | A scanning and indexing device |
-
2009
- 2009-08-24 NL NL2003382A patent/NL2003382C2/en not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6816630B1 (en) * | 2000-05-22 | 2004-11-09 | Electro-Sensors, Inc. | System and method for creating and processing data forms |
GB2415519A (en) * | 2004-06-24 | 2005-12-28 | Canon Europa Nv | A scanning and indexing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8233751B2 (en) | Method and system for simplified recordkeeping including transcription and voting based verification | |
US10114821B2 (en) | Method and system to access to electronic business documents | |
CN1811771B (en) | Adaptive document management system using a physical representation of a document | |
US9002838B2 (en) | Distributed capture system for use with a legacy enterprise content management system | |
CN101673256B (en) | Method and system for automatically extracting article metadata information based on word flow | |
US9390089B2 (en) | Distributed capture system for use with a legacy enterprise content management system | |
US20070245227A1 (en) | Business Transaction Documentation System and Method | |
US20180131834A1 (en) | Image filing method | |
CN110688349A (en) | Document sorting method, device, terminal and computer readable storage medium | |
NL2003382C2 (en) | METHOD AND DEVICE FOR FILLING A DATABASE. | |
CN112445911A (en) | Workflow assistance apparatus, system, method, and storage medium | |
JP4002762B2 (en) | Electronic form processing apparatus, computer program therefor, and electronic form creation program | |
US8838543B2 (en) | Archiving system that facilitates systematic cataloguing of archived documents for searching and management | |
JP6187633B2 (en) | Generating mobile documents from a print workflow | |
CN107644009B (en) | Transmission method and transmission system of book checking information | |
US11620432B2 (en) | System and method for aggregating legal orders | |
JP2019101802A (en) | Data display device, data display method, and data display program | |
Mangindaan et al. | The Impact of COVID-19 Pandemic on Stock Prices: An Empirical Study of State-Owned Enterprises in Indonesia Stock Exchange | |
JPH11219394A (en) | Automatic various financial chart input device | |
JP2017151627A (en) | Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device | |
JP2007280413A (en) | Automatic input device of financial statement | |
JP2003296441A5 (en) | ||
US11838474B2 (en) | Information processing apparatus, control method of information processing apparatus, and storage medium | |
CN108416895A (en) | A kind of enterprise's invoice input system and method based on image recognition technology | |
US20040153345A1 (en) | System and method for processing records associated with a healthcare encounter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM | Lapsed because of non-payment of the annual fee |
Effective date: 20190901 |