JP2020107330A - Ledger registration device and ledger registration program - Google Patents

Ledger registration device and ledger registration program Download PDF

Info

Publication number
JP2020107330A
JP2020107330A JP2019221938A JP2019221938A JP2020107330A JP 2020107330 A JP2020107330 A JP 2020107330A JP 2019221938 A JP2019221938 A JP 2019221938A JP 2019221938 A JP2019221938 A JP 2019221938A JP 2020107330 A JP2020107330 A JP 2020107330A
Authority
JP
Japan
Prior art keywords
image data
unit
divided
data
divided image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019221938A
Other languages
Japanese (ja)
Inventor
竹内 有一
Yuichi Takeuchi
有一 竹内
周 村山
Shu Murayama
周 村山
壮秀 徳田
Akihide Tokuda
壮秀 徳田
照範 岡本
Terunori Okamoto
照範 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto Information Proc Service Co Ltd
Kyoto Information Processing Service Co Ltd
Original Assignee
Kyoto Information Proc Service Co Ltd
Kyoto Information Processing Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto Information Proc Service Co Ltd, Kyoto Information Processing Service Co Ltd filed Critical Kyoto Information Proc Service Co Ltd
Publication of JP2020107330A publication Critical patent/JP2020107330A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Multimedia (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

To enhance security at the time of electronizing and registering information recorded in a ledger.SOLUTION: A ledger registration device is adapted to include: a ledger image acquisition unit for acquiring ledger image data by imaging each of a plurality of sheets of a ledger; an image division unit for dividing each of the ledger image data for each preset entry area of a ledger and creating a plurality of divided image data; a divided image shuffling unit for shuffling a plurality of divided image data of different entry areas so that the entry areas become irregular; a divided image transmission unit for transmitting the plurality of the shuffled divided image data to character recognition means; a divided text receiving unit for receiving divided text data that are results of character recognition of each of the divided image data; and a text integrating unit for integrating a plurality of the divided text data based on common ledger image data.SELECTED DRAWING: Figure 8

Description

本発明は、帳票に記入された情報をテキスト化して登録するために用いられる帳票登録装置及びこの装置に用いられるプログラムに関するものである。 The present invention relates to a form registration device used for converting information entered in a form into text and registering the program, and a program used for this device.

例えば、転居届けや受診票などの帳票に記入された情報を電子化して登録しておくシステムとしては、特許文献1に示すように、記入済みの帳票をイメージ化して、そのイメージデータを文字認識手段により文字認識させ、これにより得られたテキストデータを登録するように構成されたものがある。 For example, as a system for digitizing and registering information entered in forms such as moving notices and consultation forms, as shown in Patent Document 1, the completed form is imaged and the image data is recognized by characters. There is a configuration in which a character is recognized by a means and the text data obtained by this is registered.

かかるシステムにおいて、テキストデータを登録する側が、文字認識を外部に委託する場合、その外部に帳票のイメージデータをそのまま送れば個人情報の漏洩に繋がる。 In such a system, when the side that registers the text data outsources the character recognition to the outside, if the image data of the form is sent to the outside as it is, personal information will be leaked.

そこで、特許文献1に示すシステムでは、複数の帳票のイメージデータそれぞれを名前や電話番号などの項目毎に分割し、それらの分割イメージデータのうち項目が共通するものを順不同にシャッフルしてから、文字認識手段に送信することで個人情報の保護を図っている。 Therefore, in the system shown in Patent Document 1, the image data of a plurality of forms is divided into items such as names and telephone numbers, and among the divided image data items having common items are shuffled in random order, The personal information is protected by transmitting it to the character recognition means.

しかしながら、このように項目が共通する分割イメージデータをシャッフルしたとしても、送られてきた分割イメージデータがどの項目のものであるかは比較的容易に推測されてしまうため、個人情報に対するセキュリティは決して高いとはいえない。 However, even if the divided image data having common items is shuffled in this way, it is relatively easy to guess which item the transmitted divided image data belongs to. Not expensive.

特開2006−244315号公報JP, 2006-244315, A

そこで、本発明は、上述した問題を解決するべくなされたものであり、帳票に記入された情報を電子化して登録するにあたり、そのセキュリティの強化を図ることをその主たる課題とするものである。 Therefore, the present invention has been made to solve the above-mentioned problems, and its main problem is to strengthen the security of the information entered in the form in an electronic form and registered.

すなわち、本発明に係る帳票登録装置は、複数枚の記入済み帳票をイメージ化した複数の帳票イメージデータを格納する帳票イメージ格納部と、前記帳票イメージデータそれぞれを帳票の予め設定された記入領域ごとに分割して複数の分割イメージデータを作成するイメージ分割部と、異なる記入領域の分割イメージデータを含む複数の分割イメージデータを、少なくとも記入領域が順不同となるようにシャッフルする分割イメージシャッフル部と、シャッフルされた複数の前記分割イメージデータを文字認識手段に送信する分割イメージ送信部と、前記分割イメージデータそれぞれを文字認識した結果である分割テキストデータを受け付ける分割テキスト受付部と、共通の帳票イメージデータを元にする複数の前記分割テキストデータを統合してテキスト統合データを作成するテキスト統合部とを備えることを特徴とするものである。 That is, the form registration apparatus according to the present invention includes a form image storage unit for storing a plurality of form image data in which a plurality of completed forms are imaged, and each of the form image data for each preset entry region of the form. An image division unit that divides the image data into a plurality of divided image data, and a divided image shuffle unit that shuffles a plurality of divided image data including divided image data in different writing areas so that at least the writing areas are out of order. Common form image data, a divided image transmission unit that transmits a plurality of shuffled divided image data to a character recognition unit, a divided text reception unit that receives divided text data that is a result of character recognition of each of the divided image data. And a text integration unit that creates a text integrated data by integrating a plurality of the divided text data based on the above.

このように構成された帳票登録装置によれば、例えば「姓」と「名」を異なる記入領域として設定すれば、複数人の氏名を姓と名とに分割した分割イメージデータがシャッフルされるので、それらの分割イメージデータから例えば特定の人物の氏名を推測することはほぼ不可能である。
また、例えば電話番号や郵便番号を実際の桁数よりも少ない文字に区切り、それらを異なる記入領域に設定すれば、それらの分割イメージデータは、もはや単なる数字を表すに過ぎず、どの項目の数字であったかすら推測することが出来なくなる。
このように、本発明に係る帳票登録装置によれば、異なる記入領域の分割イメージデータを含む複数の分割イメージデータを少なくとも記入領域が順不同となるようにシャッフルして文字認識手段に送信するので、セキュリティを従来よりも遥かに強化することができる。
According to the form registration apparatus configured in this way, for example, if "surname" and "first name" are set as different entry areas, the divided image data obtained by dividing the names of a plurality of persons into their surnames and given names is shuffled. It is almost impossible to guess the name of a specific person from the divided image data.
Also, for example, if you divide a telephone number or postal code into less than the actual number of digits and set them in different entry areas, those divided image data will no longer represent simple numbers, but the number of any item. I can't even guess.
As described above, according to the form registration device of the present invention, a plurality of divided image data including divided image data of different entry areas are shuffled so that at least the entry areas are out of order, and are transmitted to the character recognition means. Security can be strengthened far more than before.

前記イメージ分割部が、前記分割イメージデータのファイル名を、前記記入領域それぞれに対して生成されたユニークキーを少なくとも含む文字列とし、前記分割イメージシャッフル部が、前記分割イメージ送信部による前記分割イメージデータの送信順を、前記ファイル名に関して予め定めた規則に従って決定することが好ましい。
このような構成であれば、分割イメージデータのファイル名に固有のユニークキーが含まれているので、例えばファイル名のアルファベット順や数字順に分割イメージデータを送信するように決定すれば、複数の分割イメージデータを簡単にシャッフルすることができる。
The image division unit sets the file name of the divided image data to a character string including at least a unique key generated for each of the writing areas, and the divided image shuffle unit sets the divided images by the divided image transmission unit. It is preferable that the transmission order of data is determined according to a predetermined rule regarding the file name.
With such a configuration, since the unique key unique to the file name of the divided image data is included, if it is decided to transmit the divided image data in alphabetical order or numerical order of the file name, for example, a plurality of divided images can be obtained. Image data can be shuffled easily.

セキュリティの強化とデータの処理時間とはトレードオフの関係にあり、例えばシャッフルする分割イメージデータが多い程、セキュリティは強化されるが、その一方で、データ処理に要する時間は長くなる。
そこで、前記分割イメージシャッフル部によりシャッフルされる複数の分割イメージデータの元となる帳票の枚数が、予め設定されており、その設定枚数が変更可能であることが好ましい。
このような構成であれば、ユーザは、所望するセキュリティや所望するデータ処理時間とに鑑みて、設定枚数を変更することができ、ユーザにとってより使い勝手の良いものとなる。
There is a trade-off relationship between the security enhancement and the data processing time. For example, the more shredded divided image data is, the stronger the security is. On the other hand, the time required for the data processing becomes longer.
Therefore, it is preferable that the number of forms as a source of the plurality of divided image data shuffled by the divided image shuffle unit is preset and the set number can be changed.
With such a configuration, the user can change the set number in consideration of the desired security and the desired data processing time, which is more convenient for the user.

ユーザによっては、帳票に記入された項目のうち、一部の項目が外部に送信してはいけないものとして取り決められている場合がある。
こうした場合にも本装置を利用可能なものとするためには、帳票に設定された記入領域のうち、前記分割イメージ送信部の送信対象から除く記入領域を受け付けて、その記入領域を非送信領域として設定する非送信領域設定部をさらに備えることが好ましい。
このような構成であれば、外部に送信できない項目を非送信領域として設定することで、残りの送信可能な項目に対して本発明に係る装置を利用することができる。
Depending on the user, some of the items entered in the form may be arranged as not to be transmitted to the outside.
In order to make this device usable even in such a case, of the writing areas set in the form, the writing areas excluded from the transmission target of the divided image transmitting unit are accepted and the writing area is set as the non-transmission area. It is preferable to further include a non-transmission area setting unit configured as.
With such a configuration, by setting an item that cannot be transmitted to the outside as a non-transmission area, the device according to the present invention can be used for the remaining items that can be transmitted.

前記テキスト統合部により作成された複数のテキスト統合データを出力するデータ出力部と、前記データ出力部の出力対象から除くテキスト統合データを受け付けて、そのテキスト統合データを非出力データとして設定するデータ抜き取り部とをさらに備えることが好ましい。
このような構成であれば、テキスト統合データのうち、例えば記入内容を再確認する必要があるようなものを、そのまま出力されてしまわないように抜き取っておくことができ、後から再確認等することができる。
A data output section for outputting a plurality of text integrated data created by the text integrating section, and text extracting data for receiving the text integrated data excluded from the output target of the data output section and setting the text integrated data as non-output data It is preferable to further include a part.
With such a configuration, it is possible to extract the text integrated data that needs to be reconfirmed, for example, so that it will not be output as it is, and reconfirm it later. be able to.

また、本発明に係る帳票登録用プログラムは、複数枚の記入済み帳票をイメージ化した複数の帳票イメージデータを格納する帳票イメージ格納部と、前記帳票イメージデータそれぞれを帳票の予め設定された記入領域ごとに分割して複数の分割イメージデータを作成するイメージ分割部と、異なる記入領域の分割イメージデータを含む複数の分割イメージデータを、少なくとも記入領域が順不同となるようにシャッフルする分割イメージシャッフル部と、シャッフルされた複数の前記分割イメージデータを文字認識手段に送信する分割イメージ送信部と、前記分割イメージデータそれぞれを文字認識した結果である分割テキストデータを受け付ける分割テキスト受付部と、共通の帳票イメージデータを元にする複数の前記分割テキストデータを統合してテキスト統合データを作成するテキスト統合部としての機能をコンピュータに発揮させることを特徴とするものである。
このように構成された帳票登録用プログラムによっても、上述した帳票登録装置と同様の作用効果を奏し得る。
Further, the form registration program according to the present invention includes a form image storage unit for storing a plurality of form image data in which a plurality of completed forms are imaged, and each of the form image data sets a preset entry area for the form. An image dividing unit that divides each image to create multiple divided image data, and a divided image shuffle unit that shuffles multiple divided image data containing divided image data in different writing areas so that at least the writing areas are in random order. A common form image; a divided image transmission unit that transmits the shuffled plurality of divided image data to a character recognition unit; a divided text reception unit that receives the divided text data that is the result of character recognition of each of the divided image data; It is characterized in that the computer is caused to exert a function as a text integration unit that creates a text integrated data by integrating a plurality of the divided text data based on the data.
The form registration program thus configured can also achieve the same effects as the form registration device described above.

このように構成した本発明によれば、帳票に記入された情報を電子化して登録する際のセキュリティを従来に比べて遥かに強化することができる。 According to the present invention configured as described above, the security at the time of digitizing and registering the information entered in the form can be greatly strengthened as compared with the related art.

本実施形態に係る帳票登録装置の使用例を示す模式図。The schematic diagram which shows the usage example of the form registration apparatus which concerns on this embodiment. 同実施形態における帳票の模式図。The schematic diagram of the form in the same embodiment. 同実施形態における帳票登録装置の機能を示す機能ブロック図。The functional block diagram which shows the function of the form registration apparatus in the embodiment. 同実施形態における帳票登録装置の動作を説明するためのフローチャート図。The flowchart figure for demonstrating operation|movement of the form registration apparatus in the same embodiment. 同実施形態におけるテンプレートファイルを説明する図。The figure explaining the template file in the embodiment. 同実施形態における参照テーブルを説明する図。The figure explaining the reference table in the same embodiment. 同実施形態におけるイメージ分割部の機能を説明する図。The figure explaining the function of the image division part in the embodiment. 同実施形態における分割イメージシャッフル部の機能を説明する図。The figure explaining the function of the division image shuffle part in the same embodiment. その他の実施形態における帳票登録装置の機能を示す機能ブロック図。The functional block diagram which shows the function of the form registration apparatus in other embodiment.

本発明の一実施形態に係る帳票登録装置について図面を参照しながら説明する。 A form registration device according to an embodiment of the present invention will be described with reference to the drawings.

本実施形態の帳票登録装置1は、帳票Pに記入された情報を電子化して登録するために用いられるものであり、図1に示すように、スキャナ等の撮像手段2やOCR等の文字認識手段3とともに帳票登録システムXを構築するものである。 The form registration device 1 of the present embodiment is used to digitize and register the information entered in the form P, and as shown in FIG. 1, image recognition means 2 such as a scanner or character recognition such as OCR. The form registration system X is constructed together with the means 3.

まず、帳票Pについて、図2を参照しながら簡単に説明する。
帳票Pは、複数の記入項目それぞれに対する記入欄P1が設けられた記入用紙である。記入項目は、「氏名」、「生年月日」、「住所」、「電話番号」、「性別」などである。記入欄P1は、ここでは枠線で囲われており、例えば「性別」という記入項目に対する記入欄P1のように、1つの記入領域P2が設けられているものもあれば、例えば「氏名」という記入項目に対する「姓」の記入領域P2、及び、「名」の記入領域P2のように、複数の記入領域P2に細分化されているものもある。つまり、記入欄P1には、予め1又は複数の記入領域P2が設定されている。
First, the form P will be briefly described with reference to FIG.
The form P is an entry sheet provided with entry fields P1 for each of a plurality of entry items. The entry items are “name”, “date of birth”, “address”, “telephone number”, “sex” and the like. The entry field P1 is surrounded by a frame line here. For example, like the entry field P1 for the entry item "sex", one entry area P2 is provided, or the entry field P1 is called "name". Some of them are subdivided into a plurality of entry areas P2, such as a "surname" entry area P2 and a "first name" entry area P2 for entry items. That is, in the entry field P1, one or a plurality of entry areas P2 are set in advance.

次に、帳票登録装置1について説明する。
この帳票登録装置1は、CPU、メモリ、入出力インターフェース等を備えた専用乃至汎用のコンピュータであり、前記メモリに格納されている帳票登録用プログラムに従って、CPUやその他の周辺機器を協働させることにより、図3に示すように、テンプレート格納部11、帳票イメージ格納部12、ファイル名変更部13、参照テーブル作成部15、イメージ分割部16、分割イメージシャッフル部18、分割イメージ送信部20、分割テキスト受付部21、及びテキスト統合部23などとしての機能を発揮するように構成されたものである。
Next, the form registration device 1 will be described.
The form registration device 1 is a dedicated or general-purpose computer including a CPU, a memory, an input/output interface, etc., and causes a CPU and other peripheral devices to cooperate in accordance with a form registration program stored in the memory. Thus, as shown in FIG. 3, the template storage unit 11, the form image storage unit 12, the file name changing unit 13, the reference table creating unit 15, the image dividing unit 16, the divided image shuffle unit 18, the divided image transmitting unit 20, and the dividing unit. The text reception unit 21 and the text integration unit 23 are configured to perform their functions.

以下、各部に説明を兼ねて、図3の機能ブロック図、及び、図4のフローチャートを参照しながら、帳票登録装置1を用いた本帳票登録システムXによる情報の登録までの動作について説明する。なお、以下に述べる種々のイメージデータは、画像データであっても良いし、画像データを文字列に変換したデータであっても良い。 Hereinafter, the operations up to the registration of information by the form registration system X using the form registration apparatus 1 will be described with reference to the functional block diagram of FIG. 3 and the flowchart of FIG. The various image data described below may be image data or data obtained by converting the image data into a character string.

まず、ユーザは、図5に示すように、帳票Pに設けられている記入領域P2の位置、及び、その記入領域P2に対する項目名を少なくとも結び付けた複数のテンプレート情報からなるテンプレートファイルを作成する(S1)。 First, as shown in FIG. 5, the user creates a template file including a position of the entry area P2 provided in the form P and a plurality of template information in which at least item names for the entry area P2 are linked ( S1).

具体的には、マウスやキーボードやタッチパネルなどの入力手段を用いて、帳票Pに設定されている記入領域P2を選択し、その記入領域P2に対する項目名を入力する。これにより、その記入領域P2の位置を示す座標及び項目名がテンプレート情報として結び付き、そのテンプレート情報が本装置1のハードディスクの所定領域に設定されたテンプレート格納部11に格納される。なお、テンプレート情報としては、記入領域P2の座標や項目名に加えて、例えば記入領域P2に記入される文字種(例えば数字、アルファベット等)や、記入領域P2の行数など、記入領域P2に関する付加情報を結び付けても良い。なお、テンプレート格納部11は、SSD等の補助記憶装置に設定されていても良い。 Specifically, the entry area P2 set in the form P is selected using an input means such as a mouse, a keyboard, or a touch panel, and the item name for the entry area P2 is entered. As a result, the coordinates indicating the position of the entry area P2 and the item name are linked as template information, and the template information is stored in the template storage unit 11 set in a predetermined area of the hard disk of the apparatus 1. As the template information, in addition to the coordinates and item names of the writing area P2, for example, the type of characters (for example, numbers, alphabets, etc.) written in the writing area P2, the number of lines in the writing area P2, and the like regarding the writing area P2 are added. You may combine information. The template storage unit 11 may be set in an auxiliary storage device such as SSD.

一方、複数枚の記入済み帳票Pは、スキャナ等の撮像手段2を用いてイメージ化する(S2)。そして、イメージ化した帳票イメージデータを本装置1に入力し、複数枚分の帳票イメージデータが本装置1のハードディスクの所定領域に設定された帳票イメージ格納部12に格納される。なお、帳票イメージ格納部12は、SSD等の補助記憶装置に設定されていても良い。 On the other hand, the plurality of completed forms P are imaged by using the image pickup means 2 such as a scanner (S2). Then, the image data of the form is input to the apparatus 1, and the form image data for a plurality of sheets is stored in the form image storage unit 12 set in a predetermined area of the hard disk of the apparatus 1. The form image storage unit 12 may be set in an auxiliary storage device such as SSD.

次に、ファイル名変更部13が、帳票イメージ格納部12に格納されている帳票イメージデータそれぞれのファイル名を、互いに異なる固有のファイル名にユニーク化する(S3)。 Next, the file name changing unit 13 makes the file names of the form image data stored in the form image storage unit 12 unique to different unique file names (S3).

具体的にファイル名変更部13は、帳票イメージ格納部12から帳票イメージデータを順次取得し、それぞれの帳票イメージデータに対して、複数の文字列からなり、互いい異なる第1のユニークキーを生成する。そして、帳票イメージデータを取得した際のファイル名の手前に、生成した第1のユニークキーを付加したものを、ユニーク化後のファイル名とする。例えば、取得した帳票イメージデータのファイル名がabcであり、この帳票イメージデータに対して生成した第1のユニークキーが3f2504E0であれば、ユニーク化後のファイル名は、3f2504E0.abcとなる。そして、このようにファイル名がユニーク化された帳票イメージデータは、本装置1のハードディスクの所定領域に設定されたユニークファイル格納部14に保存される。なお、ユニークファイル格納部14は、SSD等の補助記憶装置に設定されていても良い。
なお、ファイル名のユニーク化方法は上述したものに限らず、例えば帳票イメージデータを取得した際のファイル名を、生成した第1のユニークキーに置き換えたものをユニーク化後のファイル名とするなど、適宜変更して構わない。
Specifically, the file name changing unit 13 sequentially acquires the form image data from the form image storage unit 12 and generates a first unique key composed of a plurality of character strings and different for each form image data. To do. The file name after uniqueness is obtained by adding the generated first unique key to the front of the file name when the form image data is acquired. For example, if the file name of the acquired form image data is abc and the first unique key generated for this form image data is 3f2504E0, the file name after uniqueization will be 3f2504E0.abc. The form image data having the unique file name is stored in the unique file storage unit 14 set in a predetermined area of the hard disk of the apparatus 1. The unique file storage unit 14 may be set in an auxiliary storage device such as SSD.
Note that the method of making the file name unique is not limited to the one described above, and for example, the file name obtained when the form image data is acquired is replaced with the generated first unique key, and the file name after making unique is used. , May be changed as appropriate.

続いて、参照テーブル作成部15が、図6に示すように、ユニーク化後のファイル名、テンプレート情報に含まれる項目名、及び各項目名に対して生成された第2のユニークキーを結び付けた参照テーブルを作成する(S4)。なお、参照テーブル作成部15は、オンメモリにより発揮される機能である。ただし、参照テーブル作成部15としての機能を、オンメモリデータベースや仮想ドライブなどの技術により発揮させても良い。 Subsequently, the reference table creation unit 15 associates the file name after uniqueization, the item name included in the template information, and the second unique key generated for each item name, as shown in FIG. A reference table is created (S4). The reference table creation unit 15 is a function exerted by the on-memory. However, the function as the reference table creation unit 15 may be exhibited by a technique such as an on-memory database or a virtual drive.

具体的に参照テーブル作成部15は、テンプレート格納部11にテンプレート情報として格納されている複数の項目名を参照し、それらの項目名それぞれに対して、複数の文字列からなり、互いに異なる第2のユニークキーを生成する。 Specifically, the reference table creation unit 15 refers to a plurality of item names stored in the template storage unit 11 as template information, and includes a plurality of character strings for each of the item names, which are different from each other. Generate a unique key for.

そして、1つの帳票イメージデータのユニーク化後のファイル名、すなわち第1のユニークキーを含むファイル名に対して、複数の項目名と、各項目名に対して生成された第2のユニークキーとを結び付ける。なお、参照テーブルとしては、テンプレート情報に含まれる付加情報がさらに結び付けられていても良い。 A file name after one form image data is made unique, that is, a file name including the first unique key, a plurality of item names, and a second unique key generated for each item name. Tie together. The reference table may be further linked with the additional information included in the template information.

参照テーブル作成部15は、上述した動作を予め設定された設定枚数分の帳票イメージデータに対して順次行う。これにより、参照テーブル作成部15は、単一の参照テーブルの作成において、上述した設定枚数に、テンプレート格納部11に格納されている項目名の数(項目数)を掛け合わせた数だけ、第2のユニークキーを生成することになる。
なお、設定枚数は変更可能であり、具体的にはユーザがキーボード等の入力手段を用いて設定枚数を入力すると、その入力値を設定枚数変更部(不図示)が受け付けて設定枚数が変更される。
The reference table creating unit 15 sequentially performs the above-described operation on the form image data for a preset number of sheets. As a result, the reference table creation unit 15 creates the first reference table by the number of item names stored in the template storage unit 11 (the number of items) when creating a single reference table. Will generate 2 unique keys.
The set number can be changed. Specifically, when the user inputs the set number using an input means such as a keyboard, the set number changing unit (not shown) accepts the input value and the set number is changed. It

その後、イメージ分割部16が、ユニークファイル格納部14から帳票イメージデータを取得し、図7に示すように、その帳票イメージデータを記入領域P2ごとに分割して分割イメージデータを作成する(S5)。なお、イメージ分割部16は、オンメモリにより発揮させる機能である。ただし、イメージ分割部16としての機能を、オンメモリデータベースや仮想ドライブなどの技術により発揮させても良い。 After that, the image dividing unit 16 acquires the form image data from the unique file storage unit 14, and divides the form image data into the entry areas P2 to create divided image data as shown in FIG. 7 (S5). .. The image division unit 16 has a function to be exerted by an on-memory. However, the function as the image dividing unit 16 may be exhibited by a technique such as an on-memory database or a virtual drive.

具体的にイメージ分割部16は、テンプレート格納部11を参照して、項目名それぞれに対応する記入領域P2の座標を取得し、それらの座標で表される記入領域P2毎に帳票イメージデータを分割する。 Specifically, the image division unit 16 refers to the template storage unit 11, acquires the coordinates of the writing area P2 corresponding to each item name, and divides the form image data for each writing area P2 represented by those coordinates. To do.

そして、イメージ分割部16は、参照テーブルを参照して、図7に示すように、各項目名それぞれに結び付けられている第2のユニークキーを、各分割イメージデータのファイル名とする。なお、分割データのファイル名は、必ずしも第2のユニークキーのみからなる必要はなく、例えば、少なくとも第2のユニークキーを含むものであれば、その第2のユニークキーの後ろに別の文字列が付加されていても良い。 Then, the image dividing unit 16 refers to the reference table and, as shown in FIG. 7, sets the second unique key associated with each item name as the file name of each divided image data. It should be noted that the file name of the divided data does not necessarily have to include only the second unique key. For example, if the file name includes at least the second unique key, another character string is added after the second unique key. May be added.

イメージ分割部16は、かかる帳票イメージデータの分割を設定枚数分の帳票イメージデータに対して行う。これにより、分割イメージデータは、上述した設定枚数に、テンプレート格納部11に格納されている項目名の数(項目数)を掛け合わせた数だけ生成されることになる。そして、これらのファイル名には、互いに異なる第2のユニークキーが含まれており、全て異なる固有のファイル名となる。 The image dividing unit 16 divides the form image data into the set number of form image data. As a result, the number of pieces of divided image data is generated by multiplying the above-mentioned set number by the number of item names (the number of items) stored in the template storage unit 11. Then, these file names include the second unique keys different from each other, and all have different unique file names.

そして、これらの分割イメージデータの中には、互いに異なる記入領域P2の分割イメージデータが複数含まれることになる。
より詳細に説明すると、例えば上述したテンプレートファイルの作成時において、帳票Pの「姓」及び「名」を互いに異なる記入領域P2として設定すれば、イメージ分割部16により作成された複数の分割イメージデータの中には、設定枚数分の帳票Pに記入された「姓」の分割イメージデータと、設定枚数分の帳票Pに記入された「名」の分割イメージデータとが混在する。
また、図7とは別の態様ではあるが、例えば郵便番号の各桁や電話番号の各桁を互いに異なる記入領域P2として設定すれば、イメージ分割部16により作成された複数の分割イメージデータの中には、設定枚数分の帳票Pに記入された郵便番号の各桁及び電話番号の各桁それぞれの分割イメージデータが混在することになる。
ただし、記入領域P2の設定方法は、上述した態様に限らず、ユーザが適宜変更して構わない。
Then, these divided image data include a plurality of divided image data of the writing areas P2 different from each other.
More specifically, for example, when the template file described above is created, if the “surname” and “first name” of the form P are set as different entry areas P2, a plurality of divided image data created by the image dividing unit 16 will be described. In this case, the divided image data of the "surname" written in the set number of forms P and the divided image data of the "first name" written in the set number of forms P are mixed.
Although different from FIG. 7, if each digit of the postal code or each digit of the telephone number is set as a different writing area P2, for example, a plurality of divided image data created by the image dividing unit 16 will be displayed. The divided image data of each digit of the postal code and each digit of the telephone number written in the set number of sheets P are mixed in the inside.
However, the setting method of the entry area P2 is not limited to the above-described mode, and the user may change it appropriately.

そして、これらの分割イメージデータは、本装置1のハードディスクの所定領域に設定された分割イメージ格納部17に保存される。なお、分割イメージ格納部17は、SSD等の補助記憶装置に設定されていても良い。 Then, these divided image data are stored in the divided image storage unit 17 set in a predetermined area of the hard disk of the apparatus 1. The divided image storage unit 17 may be set in an auxiliary storage device such as SSD.

次に、分割イメージシャッフル部18が、図8に示すように、分割イメージ格納部17に格納されている複数の分割イメージデータを、少なくとも記入領域P2が順不同となるようにシャッフルする(S6)。 Next, as shown in FIG. 8, the divided image shuffle unit 18 shuffles the plurality of divided image data stored in the divided image storage unit 17 so that at least the writing area P2 is out of order (S6).

具体的に分割イメージシャッフル部18は、後述する分割イメージ送信部20による分割イメージデータの送信順を、分割イメージデータのファイル名に関して予め定めた規則に従って決定することで、送信される分割イメージデータの記入領域P2を不規則にする。 Specifically, the divided image shuffle unit 18 determines the transmission order of the divided image data by the divided image transmission unit 20 described later according to a predetermined rule regarding the file name of the divided image data, so that the divided image data to be transmitted is The writing area P2 is irregular.

予め定めた規則とは、例えばアルファベット順、数字順、或いはこれらを組み合わせた順序などを挙げることができ、分割イメージシャッフル部18は、この予め定められた順序で、分割イメージデータを分割イメージ格納部17から順次取得して並べる。 The predetermined rule may be, for example, an alphabetical order, a numerical order, or an order in which these are combined. The divided image shuffle unit 18 stores the divided image data in the divided image storage unit in this predetermined order. It acquires sequentially from 17 and arranges.

なお、ここでの分割イメージシャッフル部18は、上述した参照テーブルを参照して、分割イメージ格納部17から取得した分割イメージデータのファイル名に用いられている第2のユニークキーに結び付いた付加情報を、その分割イメージデータに附帯させる。これにより、後述する文字認識手段3は、この付加情報を用いて文字認識を行うことができる。 It should be noted that the divided image shuffle unit 18 here refers to the above-mentioned reference table and the additional information associated with the second unique key used in the file name of the divided image data acquired from the divided image storage unit 17. Is attached to the divided image data. As a result, the character recognition unit 3 described later can perform character recognition using this additional information.

そして、この実施形態では、後述の分割イメージ送信部20により1度に送信されるデータ量を抑えるべく、分割イメージシャッフル部18は、分割イメージ格納部17から連続して取得した所定数の分割イメージデータを1つの送信用データ群としてまとめる。 Then, in this embodiment, in order to suppress the amount of data transmitted at one time by the divided image transmission unit 20 described later, the divided image shuffle unit 18 has a predetermined number of divided images continuously acquired from the divided image storage unit 17. The data is collected as one transmission data group.

その後、分割イメージ格納部17に格納された全ての分割イメージデータ、すなわち上述した設定枚数に項目数を掛け合わせた数の分割イメージデータの全てが、分割イメージシャッフル部18により取得されてシャッフルされたかが判断される(S7)。 After that, it is determined whether all the divided image data stored in the divided image storage unit 17, that is, all the divided image data of the number obtained by multiplying the set number of sheets by the number of items are acquired and shuffled by the divided image shuffle unit 18. It is determined (S7).

分割イメージ格納部17に格納された全ての分割イメージデータがシャッフルされていなければ、分割イメージシャッフル部18による動作が繰り返される。
一方、分割イメージ格納部17に格納された分割イメージデータの全てがシャッフルされると、上述した参照テーブル作成部15により作成された参照テーブルが、オンメモリから削除され、本装置1のハードディスクの所定領域に設定された参照テーブル蓄積部19に蓄積される(S8)。なお、参照テーブル蓄積部9は、SSD等の補助記憶装置に設定されていても良い。
If all the divided image data stored in the divided image storage unit 17 have not been shuffled, the operation by the divided image shuffle unit 18 is repeated.
On the other hand, when all of the divided image data stored in the divided image storage unit 17 is shuffled, the reference table created by the reference table creation unit 15 described above is deleted from the on-memory, and the hard disk of the device 1 is predetermined. The data is stored in the reference table storage unit 19 set in the area (S8). The reference table storage unit 9 may be set in an auxiliary storage device such as SSD.

参照テーブルがオンメモリから削除されると、次に、帳票イメージ格納部12に格納された帳票イメージデータが残っているかが判断される(S9)。 When the reference table is deleted from the on-memory, it is next determined whether the form image data stored in the form image storage unit 12 remains (S9).

帳票イメージ格納部12に帳票イメージデータが残っている場合は、S3〜S9までの動作を繰り返す。
一方、帳票イメージ格納部12に格納された帳票イメージデータが存在しなくなると、分割イメージ送信部20が、シャッフルされた分割イメージデータを、ここでは送信用データ群ごとに文字認識手段3に送信する(S10)。なお、文字認識手段3は、本装置1の外部にあり、本装置1のユーザとは別の者によって操作されるので、分割イメージ送信部20は、分割イメージデータを本装置1の外部に出力することになる。
When the form image data remains in the form image storage unit 12, the operations from S3 to S9 are repeated.
On the other hand, when the form image data stored in the form image storage unit 12 no longer exists, the divided image transmission unit 20 transmits the shuffled divided image data to the character recognition unit 3 here for each transmission data group. (S10). Since the character recognition means 3 is outside the device 1 and is operated by a person other than the user of the device 1, the divided image transmission unit 20 outputs the divided image data to the outside of the device 1. Will be done.

文字認識手段3は、分割イメージ送信部20により送信された分割イメージデータそれぞれを文字認識し、これにより得られた結果である分割テキストデータを作成する(S11)。ここで、文字認識手段3は、分割イメージデータのファイル名、すなわち第2のユニークキーを、分割テキストデータのファイル名として引き継ぐように構成されており、このように作成された分割テキストデータは、文字認識手段3から本装置1に入力される。 The character recognition unit 3 character-recognizes each of the divided image data transmitted by the divided image transmitting unit 20, and creates the divided text data which is the result obtained by this (S11). Here, the character recognition means 3 is configured to inherit the file name of the divided image data, that is, the second unique key as the file name of the divided text data, and the divided text data created in this way is It is input to the device 1 from the character recognition means 3.

入力された分割テキストデータは、本装置1の分割テキスト受付部21により受け付けられ、本装置1のハードディスクの所定領域に設定された分割テキスト格納部22に格納される(S12)。なお、分割テキスト格納部22は、SSD等の補助記憶装置に設定されていても良い。 The input fragment text data is accepted by the fragment text accepting unit 21 of the device 1 and stored in the fragment text storage unit 22 set in a predetermined area of the hard disk of the device 1 (S12). The divided text storage unit 22 may be set in an auxiliary storage device such as SSD.

その後、テキスト統合部23が、複数の分割テキストデータのうち、共通の帳票イメージデータを元にする複数の分割テキストデータを統合してテキスト統合データを作成する(S13)。 After that, the text integration unit 23 integrates a plurality of pieces of divided text data based on common form image data among the plurality of pieces of divided text data to create text integrated data (S13).

具体的にテキスト統合部23は、上述した参照テーブル蓄積部19に蓄積された参照テーブルを参照して、分割テキストデータのファイル名に用いられている第2のユニークキーに結び付いた帳票イメージデータのファイル名(第1のユニークキー)を特定し、このファイル名(第1のユニークキー)が共通している分割テキストデータを、共通の帳票イメージデータを元にするものとして特定する。 Specifically, the text integration unit 23 refers to the reference table stored in the reference table storage unit 19 described above, and stores the form image data linked to the second unique key used in the file name of the divided text data. The file name (first unique key) is specified, and the divided text data having the common file name (first unique key) is specified as the one based on the common form image data.

そして、共通の帳票イメージデータを元にする分割テキストデータを全て特定した後、再び参照テーブルを参照して、各分割テキストデータのファイル名に用いられている第2のユニークキーに結び付いた項目名を特定し、各分割テキストデータの示す文字列を、その特定した項目名として記入された文字列として認定する。 Then, after all the divided text data based on the common form image data is specified, the reference table is referred to again, and the item name linked to the second unique key used for the file name of each divided text data. Is specified, and the character string indicated by each piece of divided text data is recognized as the character string entered as the specified item name.

ここで、テキスト統合部23は、テキスト統合データを作成した後、そのテキスト統合データを構成する各分割テキストデータの示す文字列をディスプレイに表示する。 Here, the text integration unit 23 creates the text integration data, and then displays the character string indicated by each piece of the divided text data forming the text integration data on the display.

具体的にテキスト統合部23は、分割テキストデータの元となる帳票イメージデータをユニークファイル格納部14から取得して、その元となる帳票の画像と分割テキストデータの示す文字列とを比較可能に表示する。
なお、帳票イメージデータをユニークファイル格納部14から取得する代わりに、或いは、帳票イメージデータの取得に加えて、分割イメージ格納部17から分割テキストデータに対応する分割イメージデータを取得し、その文字列及び分割画像を比較可能に表示しても良い。
Specifically, the text integration unit 23 acquires the form image data that is the source of the divided text data from the unique file storage unit 14, and can compare the image of the source form and the character string indicated by the divided text data. indicate.
Instead of obtaining the form image data from the unique file storage unit 14, or in addition to obtaining the form image data, the divided image data corresponding to the divided text data is obtained from the divided image storage unit 17, and the character string thereof is acquired. Alternatively, the divided images may be displayed in a comparable manner.

ここで、本装置1は、分割テキストデータが示す文字列を修正可能に構成されている。
例えばテキスト統合部23によりディスプレイ表示された文字列の中に、文字認識手段3の誤認識により作成された文字列が含まれている場合、例えばマウスやキーボードやタッチパネル等の入力手段を用いてその文字列を修正することができ、その修正後の文字列が分割テキストデータの示す文字列として更新される。
Here, the device 1 is configured to be able to modify the character string indicated by the fragment text data.
For example, when the character string displayed by the text integration unit 23 includes a character string created by the erroneous recognition of the character recognition unit 3, the character string is displayed by using an input unit such as a mouse, a keyboard, or a touch panel. The character string can be modified, and the modified character string is updated as the character string indicated by the fragment text data.

上述したようにテキスト統合部23により作成されたテキスト統合データは、データ出力部24によって出力可能である。 The text integrated data created by the text integrating unit 23 as described above can be output by the data output unit 24.

データ出力部24は、テキスト統合データを所定の出力形式で出力するものであり、ここでは帳票複数枚分のテキスト統合データを一括して、例えば分割テキストデータが示す文字列と、その分割テキストデータに対応する項目名とを識別可能に例えば表形式等で出力する(S14)。 The data output unit 24 outputs the text integrated data in a predetermined output format. Here, for example, the text integrated data for a plurality of forms are collectively processed, for example, a character string indicated by the divided text data and the divided text data. The item name corresponding to is output in a table format or the like so as to be distinguishable (S14).

本装置1は、テキスト統合部23により作成された複数のテキスト統合データのうち、データ出力部24の出力対象から除くテキスト統合データを受け付けて、そのテキスト統合データを非出力データとして設定するデータ抜き取り部25としての機能をさらに備えている。 The device 1 receives the text integrated data excluded from the output target of the data output unit 24 among the plurality of text integrated data created by the text integrating unit 23, and sets the text integrated data as non-output data. The function as the unit 25 is further provided.

より具体的に説明すると、例えばテキスト統合部23によりディスプレイ表示されているテキスト統合データのうち、例えば記入された手書き文字そのものが読めなかったり、性別が男女ともに選択されている場合など、再確認が必要なテキスト統合データに対して、そのテキスト統合データを例えばマウスやタッチパネル等により選択できるようにしてある。 More specifically, for example, in the text integrated data displayed on the display by the text integration unit 23, reconfirmation is required when, for example, the written handwritten character itself cannot be read or gender is selected for both genders. With respect to the required text integrated data, the text integrated data can be selected by, for example, a mouse or a touch panel.

これにより、選択されたテキスト統合データがデータ抜き取り部25により受け付けられて、非出力データとして設定され、データ出力部24による一括出力の対象から外される。なお、設定された非出力データに対して、例えば再確認の理由など種々のコメントを記入できるようにしても良い。 As a result, the selected text integrated data is accepted by the data extracting unit 25, set as non-output data, and excluded from the batch output target of the data output unit 24. Note that various comments such as the reason for reconfirmation may be entered on the set non-output data.

このように構成された帳票登録装置1によれば、例えば複数人の氏名を姓と名とに分割した分割イメージデータがシャッフルされるので、それらの分割イメージデータから例えば特定の人物の氏名を推測することはほぼ不可能である。
また、例えば電話番号や郵便番号を実際の桁数よりも少ない桁数に分割した分割イメージデータをシャッフルすれば、それらの分割イメージデータは、もはや単なる数字を表すに過ぎず、どの項目の数字であったかすら推測することが難しい。
このように、本発明に係る帳票登録装置1によれば、異なる記入領域P2の分割イメージデータの複数を、記入領域P2が順不同となるようにシャッフルして文字認識手段3に送信するので、セキュリティを従来よりも遥かに強化することができる。
According to the form registration apparatus 1 configured as described above, for example, the divided image data obtained by dividing the names of a plurality of people into the surname and the given name is shuffled. Therefore, for example, the name of a specific person is inferred from the divided image data. It is almost impossible to do.
Also, for example, if you shuffle the divided image data obtained by dividing the telephone number or zip code into a smaller number of digits than the actual number of digits, those divided image data will no longer represent mere numbers, and the number of any item It's difficult to guess if there was any.
As described above, according to the form registration device 1 of the present invention, a plurality of pieces of divided image data in different entry areas P2 are shuffled so that the entry areas P2 are out of order, and are transmitted to the character recognition means 3. Can be strengthened much more than before.

さらに、分割イメージデータのファイル名に第2のユニークキーが用いられるので、複数の分割イメージデータを例えばファイル名がアルファベット順や数字順となるように並べることで、複数の分割イメージデータを簡単にシャッフルすることができる。 Furthermore, since the second unique key is used for the file name of the divided image data, the divided image data can be easily arranged by arranging the divided image data so that the file names are in alphabetical order or numerical order. You can shuffle.

加えて、シャッフルされる複数の分割イメージデータの元となる帳票Pの設定枚数が変更可能であるので、ユーザは、所望するセキュリティの高さとデータ処理時間とに鑑みて、設定枚数を変更することができ、ユーザにとってより使い勝手の良いものとなる。 In addition, since the set number of sheets of the form P that is the source of the plurality of shuffled divided image data can be changed, the user can change the set number of sheets in consideration of the desired high security and the data processing time. This makes it easier for users to use.

そのうえ、テキストデータ抜き取り部25が、データ出力部24の出力対象から除くテキスト統合データ非出力データとして設定するので、テキスト統合データのうち、例えば記入内容を再確認する必要があるようなものを、そのまま出力されてしまわないように抜き取っておくことができ、後から再確認することができる。 In addition, since the text data extracting unit 25 sets as the text integrated data non-output data to be excluded from the output target of the data output unit 24, the text integrated data that needs to be reconfirmed, You can remove it so that it is not output as it is, and you can check it again later.

なお、本発明は前記実施形態に限られるものではない。 The present invention is not limited to the above embodiment.

例えば、ユーザによっては、帳票Pに記入された項目のうち、一部の項目を外部に送信してはいけないものとして取り決められている場合がある。 For example, some users may have agreed that some of the items written on the form P should not be transmitted to the outside.

そこで、帳票登録装置1としては、図9に示すように、帳票Pに設定された記入領域P2のうち、分割イメージ送信部20の送信対象から除く記入領域P2を受け付けて、その記入領域P2を非送信領域として設定する非送信領域設定部26をさらに備えていても良い。 Therefore, as shown in FIG. 9, the form registration apparatus 1 accepts an entry region P2, which is excluded from the transmission target of the divided image transmission unit 20, among the entry regions P2 set in the form P, and sets the entry region P2 as the entry region P2. A non-transmission area setting unit 26 that is set as a non-transmission area may be further provided.

具体的には、例えばテンプレートファイルの作成時において、項目名を所定の態様で入力すると、非送信領域設定部26が、その態様で入力された項目名に結び付けられた記入領域P2を非送信領域として設定する。なお、所定の態様とは、例えば項目名の前、後、又は前後に所定文字を付加して入力する方法などが挙げられる。
また、非送信領域の設定の仕方としては、テンプレートファイルに含まれる種々の記入領域P2の中から所望の領域を例えばチェックボックス等により選択可能にしておき、ユーザが選択した記入領域P2が非送信領域として設定されるようにしても良い。
Specifically, for example, when an item name is input in a predetermined mode when creating a template file, the non-transmission area setting unit 26 sets the entry area P2 linked to the item name input in that mode in the non-transmission area. Set as. The predetermined mode may be, for example, a method of inputting a predetermined character before, after, or before and after the item name, and the like.
Further, as a method of setting the non-transmission area, a desired area can be selected from, for example, a check box or the like among various entry areas P2 included in the template file, and the entry area P2 selected by the user is not transmitted. It may be set as an area.

そして、1又は複数の記入領域P2が非送信領域として設定されたテンプレートファイルは、テンプレート格納部11からテキスト統合部23に出力されても良い。
このような構成であれば、テキスト統合部23により作成されたテキスト統合データに対して、非送信領域の文字列をオペレータが入力して追加することができる。
これにより、非送信領域以外に記入された文字列は、自動的にテキスト統合データに含まれ、非送信領域に記入された文字列は、外部に出力されることなく、マニュアルでテキスト統合データに含ませることができる。
Then, the template file in which one or more entry areas P2 are set as non-transmission areas may be output from the template storage unit 11 to the text integration unit 23.
With such a configuration, the operator can input and add the character string of the non-transmission area to the text integrated data created by the text integrating unit 23.
As a result, the character strings entered in areas other than the non-send area are automatically included in the text integrated data, and the character strings entered in the non-send area are manually output to the text integrated data without being output to the outside. Can be included.

このような構成であれば、外部に送信できない項目を非送信領域として設定することで、取り決めに従いながら、残りの送信可能な項目に対して本発明に係る帳票登録装置1を利用することができる。 With such a configuration, by setting an item that cannot be transmitted to the outside as a non-transmission area, it is possible to use the form registration device 1 according to the present invention for the remaining items that can be transmitted while following the agreement. ..

なお、上述した構成において、イメージ分割部16としては、非送信領域設定部26により設定された非送信領域の分割イメージデータを作成しても良いし、作成しなくても良い。非送信領域の分割イメージデータを作成する場合は、分割データシャッフル部が、非送信領域の分割イメージデータを分割イメージ格納部17から取得しないように構成されていれば良い。 In the above-described configuration, the image dividing unit 16 may or may not create the divided image data of the non-transmission area set by the non-transmission area setting unit 26. When the divided image data of the non-transmission area is created, the divided data shuffle unit may be configured not to acquire the divided image data of the non-transmission area from the divided image storage unit 17.

また、上述したように非送信領域を設定した場合、テキスト統合部23が作成して表示するテキスト統合データには、非送信領域に設定された記入領域P2のみならず、非送信領域には設定されてはいないものの未記入な記入領域P2も空白な状態となる。
そこで、テキスト統合部23は、非送信領域として設定された記入領域P2を、その他の記入領域P2と識別可能に表示することが好ましく、具体的には記入領域P2の色を変えたり、記入領域P2の内部又は外部近傍に識別文字を付す等の表示態様を挙げることができる。
When the non-transmission area is set as described above, the text integration data created and displayed by the text integration unit 23 is set not only in the entry area P2 set in the non-transmission area but also in the non-transmission area. An unfilled entry area P2, which has not been entered, is also in a blank state.
Therefore, it is preferable that the text integration unit 23 displays the entry area P2 set as the non-transmission area so as to be distinguishable from the other entry areas P2. Specifically, the color of the entry area P2 is changed or the entry area P2 is changed. A display mode such as attaching an identification character to the inside or outside of P2 may be mentioned.

さらに、テキスト統合部23は、非送信領域として設定された記入領域P2をフィルタリングして表示出力するように構成されていても良い。
これならば、ユーザは、フィルタリングして表示された非送信領域に、次々と文字列を入力することができるので、非送信領域を設定する構成においても、作業の高効率化を図れる。
Further, the text integration unit 23 may be configured to filter the entry area P2 set as the non-transmission area and display and output it.
In this case, the user can input character strings one after another in the non-transmission area that is displayed after filtering, so that the work efficiency can be improved even in the configuration in which the non-transmission area is set.

また、前記実施形態の分割イメージ送信部20は、分割イメージシャッフル部18により生成された送信用データ群単位で分割イメージデータを文字認識手段3に送信していたが、分割イメージデータを1つずつ送信しても良いし、全てを一括して送信しても良い。 In addition, the divided image transmission unit 20 of the above-described embodiment transmits the divided image data to the character recognition unit 3 in units of the transmission data group generated by the divided image shuffle unit 18, but the divided image data is sent one by one. It may be transmitted, or may be transmitted all at once.

その他、本発明の趣旨に反しない限りにおいて様々な実施形態の変形や組み合わせを行っても構わない。 In addition, various modifications and combinations of the embodiments may be made without departing from the spirit of the present invention.

X ・・・帳票登録システム
2 ・・・撮像手段
3 ・・・文字認識手段
1 ・・・帳票登録装置
P ・・・帳票
P1 ・・・記入欄
P2 ・・・記入領域
11 ・・・テンプレート格納部
12 ・・・帳票イメージ格納部
13 ・・・ファイル名変更部
14 ・・・ユニークファイル格納部
15 ・・・参照テーブル作成部
16 ・・・イメージ分割部
17 ・・・分割イメージ格納部
18 ・・・分割イメージシャッフル部
19 ・・・参照テーブル蓄積部
20 ・・・分割イメージ送信部
21 ・・・分割テキスト受付部
22 ・・・分割テキスト格納部
23 ・・・テキスト統合部
24 ・・・データ出力部
25 ・・・データ抜き取り部
26 ・・・非送信領域設定部
X ... form registration system 2 ... imaging means 3 ... character recognition means 1 ... form registration device P ... form P1 ... entry field P2 ... entry area 11 ... template storage Part 12... form image storage part 13... file name changing part 14... unique file storage part 15... reference table creating part 16... image dividing part 17... divided image storing part 18 .. Split image shuffle unit 19... Reference table storage unit 20... Split image transmission unit 21... Split text reception unit 22... Split text storage unit 23... Text integration unit 24... Data Output unit 25 ・・・Data extraction unit 26 ・・・Non-transmission area setting unit

Claims (6)

複数枚の記入済み帳票をイメージ化した複数の帳票イメージデータを格納する帳票イメージ格納部と、
前記帳票イメージデータそれぞれを帳票の予め設定された記入領域ごとに分割して複数の分割イメージデータを作成するイメージ分割部と、
異なる記入領域の分割イメージデータを含む複数の分割イメージデータを、少なくとも記入領域が順不同となるようにシャッフルする分割イメージシャッフル部と、
シャッフルされた複数の前記分割イメージデータを文字認識手段に送信する分割イメージ送信部と、
前記分割イメージデータそれぞれを文字認識した結果である分割テキストデータを受け付ける分割テキスト受付部と、
共通の帳票イメージデータを元にする複数の前記分割テキストデータを統合してテキスト統合データを作成するテキスト統合部とを備えることを特徴とする帳票登録装置。
A form image storage unit for storing a plurality of form image data in which a plurality of completed forms are imaged,
An image dividing unit that divides each of the form image data for each preset entry area of the form to create a plurality of divided image data,
A divided image shuffle section that shuffles a plurality of divided image data including divided image data of different entry areas so that at least the entry areas are in no particular order,
A divided image transmitting unit for transmitting the shuffled plurality of divided image data to the character recognition means,
A divided text receiving unit that receives the divided text data that is the result of character recognition of each of the divided image data,
A form registration device comprising: a text integration unit that creates a text integrated data by integrating a plurality of the divided text data based on common form image data.
前記イメージ分割部が、前記分割イメージデータのファイル名を、前記記入領域それぞれに対して生成されたユニークキーを少なくとも含む文字列とし、
前記分割イメージシャッフル部が、前記分割イメージ送信部による前記分割イメージデータの送信順を、前記ファイル名に関して予め定めた規則に従って決定することを特徴とする請求項1記載の帳票登録装置。
The image dividing unit sets the file name of the divided image data to a character string including at least a unique key generated for each of the writing areas,
The form registration apparatus according to claim 1, wherein the divided image shuffle unit determines the transmission order of the divided image data by the divided image transmission unit according to a predetermined rule regarding the file name.
前記分割イメージシャッフル部によりシャッフルされる複数の分割イメージデータの元となる帳票の枚数が、予め設定されており、その設定枚数が変更可能であることを特徴とする請求項1又は2記載の帳票登録装置。 3. The form according to claim 1 or 2, wherein the number of forms as a source of a plurality of divided image data shuffled by the divided image shuffle unit is set in advance, and the set number can be changed. Registration device. 帳票に設定された記入領域のうち、前記分割イメージ送信部の送信対象から除く記入領域を受け付けて、その記入領域を非送信領域として設定する非送信領域設定部をさらに備えることを特徴とする請求項1乃至3のうち何れか一項に記載の帳票登録装置。 It further comprises a non-transmission area setting unit that accepts, from among the input areas set in the form, the input areas excluded from the transmission target of the divided image transmission unit and sets the input area as a non-transmission area. The form registration device according to any one of items 1 to 3. 前記テキスト統合部により作成された複数のテキスト統合データを所定の出力形式で出力するデータ出力部と、
前記データ出力部の出力対象から除くテキスト統合データを受け付けて、そのテキスト統合データを非出力データとして設定するデータ抜き取り部とをさらに備えることを特徴とする請求項1乃至4のうち何れか一項に記載の帳票登録装置。
A data output unit for outputting a plurality of text integrated data created by the text integrating unit in a predetermined output format,
5. The data extracting unit that receives text integrated data to be excluded from the output target of the data output unit, and sets the text integrated data as non-output data. Form registration device described in.
複数枚の記入済み帳票をイメージ化した複数の帳票イメージデータを格納する帳票イメージ格納部と、
前記帳票イメージデータそれぞれを帳票の予め設定された記入領域ごとに分割して複数の分割イメージデータを作成するイメージ分割部と、
異なる記入領域の分割イメージデータを含む複数の分割イメージデータを、少なくとも記入領域が順不同となるようにシャッフルする分割イメージシャッフル部と、
シャッフルされた複数の前記分割イメージデータを文字認識手段に送信する分割イメージ送信部と、
前記分割イメージデータそれぞれを文字認識した結果である分割テキストデータを受け付ける分割テキスト受付部と、
共通の帳票イメージデータを元にする複数の前記分割テキストデータを統合してテキスト統合データを作成するテキスト統合部としての機能をコンピュータに発揮させることを特徴とする帳票登録用プログラム。
A form image storage unit for storing a plurality of form image data in which a plurality of completed forms are imaged,
An image dividing unit that divides each of the form image data for each preset entry area of the form to create a plurality of divided image data,
A divided image shuffle section that shuffles a plurality of divided image data including divided image data of different entry areas so that at least the entry areas are in no particular order,
A divided image transmitting unit for transmitting the shuffled plurality of divided image data to the character recognition means,
A divided text receiving unit that receives the divided text data that is the result of character recognition of each of the divided image data,
A program for registering a form, which causes a computer to exert a function as a text integration unit that creates a text integrated data by integrating a plurality of the divided text data based on common form image data.
JP2019221938A 2018-12-26 2019-12-09 Ledger registration device and ledger registration program Pending JP2020107330A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018242512 2018-12-26
JP2018242512 2018-12-26

Publications (1)

Publication Number Publication Date
JP2020107330A true JP2020107330A (en) 2020-07-09

Family

ID=71450871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019221938A Pending JP2020107330A (en) 2018-12-26 2019-12-09 Ledger registration device and ledger registration program

Country Status (2)

Country Link
JP (1) JP2020107330A (en)
KR (1) KR20200080120A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022059674A1 (en) * 2020-09-18 2022-03-24 株式会社 東芝 Information processing device, information processing method, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4274375B2 (en) 2005-03-04 2009-06-03 株式会社アイデック Data entry system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022059674A1 (en) * 2020-09-18 2022-03-24 株式会社 東芝 Information processing device, information processing method, and program
JP7413220B2 (en) 2020-09-18 2024-01-15 株式会社東芝 Information processing device, information processing method and program

Also Published As

Publication number Publication date
KR20200080120A (en) 2020-07-06

Similar Documents

Publication Publication Date Title
US11032437B2 (en) Method to create a secure distributed data validation system using a distributed storage system and artificial intelligence
JP5098056B2 (en) Medical management apparatus, medical management method, and medical management program
US10290365B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP2007018087A (en) Code generating device and method using biological information
CN112001159A (en) Document generation method and device, electronic equipment and storage medium
JP6529254B2 (en) INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, PROGRAM, AND STORAGE MEDIUM
JP6694587B2 (en) Image reading device and program
JP2020107330A (en) Ledger registration device and ledger registration program
ES2734058T3 (en) A method and system to provide a document extract
CN112149402B (en) Document matching method, device, electronic equipment and computer readable storage medium
JP6600830B2 (en) Personal number collection system and personal number collection sheet
JP6426572B2 (en) Image processing apparatus, image processing system, image processing method and image processing program
JP6707112B2 (en) User information input support system
CN112583603A (en) Visual signature method and device, electronic equipment and computer readable storage medium
JP2008152357A (en) Text recognition system, text recognition method and text recognition program
JP6397084B2 (en) User information input support system
JP2007280413A (en) Automatic input device of financial statement
JP6190549B1 (en) Document processing system
JP4278524B2 (en) Image processing apparatus, method and program, and image processing system
JP2004005386A (en) Information inputting method and system
JP2003029910A (en) Secret information input method, device and program
KR101377554B1 (en) System and method for making and managing electronic medical record using user terminal capable of electronic notes
JP2003317075A (en) Processor and method for masking electronized document
JP2004005387A (en) Document for information inputting system
JP2008102858A (en) Information processor and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191219

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240528