JP6109688B2 - Form reader and program - Google Patents

Form reader and program Download PDF

Info

Publication number
JP6109688B2
JP6109688B2 JP2013184623A JP2013184623A JP6109688B2 JP 6109688 B2 JP6109688 B2 JP 6109688B2 JP 2013184623 A JP2013184623 A JP 2013184623A JP 2013184623 A JP2013184623 A JP 2013184623A JP 6109688 B2 JP6109688 B2 JP 6109688B2
Authority
JP
Japan
Prior art keywords
item name
character recognition
result
information
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013184623A
Other languages
Japanese (ja)
Other versions
JP2015052864A (en
Inventor
キョウ 丁
キョウ 丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2013184623A priority Critical patent/JP6109688B2/en
Publication of JP2015052864A publication Critical patent/JP2015052864A/en
Application granted granted Critical
Publication of JP6109688B2 publication Critical patent/JP6109688B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の実施形態は、帳票読取装置およびプログラムに関する。   Embodiments described herein relate generally to a form reading apparatus and a program.

健康診断結果を通知する帳票、例えば健康診断結果通知書には、赤血球数、コレステロール、血糖などといった検査項目毎に各々の検査結果である数値(項目値)が記載(印字)される欄が設けられている。このような帳票の処理にはスキャナを用いて帳票の画像を読み取り、文字認識する帳票読取装置が利用される。   Forms for notifying health check results, for example, health check result notifications, have a column where the numerical values (item values) for each test item such as red blood cell count, cholesterol, blood sugar, etc. are written (printed). It has been. For the processing of such a form, a form reading apparatus that reads a form image using a scanner and recognizes characters is used.

ところで、健康診断結果通知書は、検査機関毎に独自の項目の配置が採用されており、同じ項目を用いているといえども配置が異なるため、帳票読取装置には事前に個々の帳票を読み取る(文字認識する)ための読取情報の定義を検査機関毎(帳票毎)に行っておく必要がある。読取情報とは、例えば、文字認識する認識対象文字が記録されている帳票上の位置情報、認識対象文字の種類(漢字、仮名,カタカナ、数字)や文字数などである。   By the way, the health check result notification form employs a unique arrangement of items for each inspection institution, and even if the same items are used, the arrangement is different, so the form reading device reads each form in advance. It is necessary to define the reading information for (character recognition) for each inspection organization (for each form). The read information includes, for example, position information on a form in which recognition target characters for character recognition are recorded, types of recognition target characters (kanji, kana, katakana, numbers), and the number of characters.

帳票読取装置に新たな帳票の読み取りをさせる場合には、文字認識のための読取情報の定義をすべての文字認識対象の項目について入力設定する必要がある。このため、帳票読取のための初期設定として読取情報の定義に多大な時間と労力が必要であった。   When the form reading apparatus is to read a new form, it is necessary to input and set the definition of the read information for character recognition for all items to be recognized. For this reason, much time and labor are required for defining the read information as an initial setting for reading the form.

特開平9−305715号公報Japanese Patent Laid-Open No. 9-305715

このように従来の帳票読取装置の場合、読取情報の定義として、読取情報の入力設定をすべての文字認識対象の項目数分行う必要がある。   As described above, in the case of the conventional form reading apparatus, it is necessary to perform the input setting of the reading information for the number of items for all the character recognition objects as the definition of the reading information.

本発明が解決しようとする課題は、帳票の読取情報の定義を容易に行うことができる帳票読取装置およびプログラムを提供することにある。   The problem to be solved by the present invention is to provide a form reading apparatus and program capable of easily defining the form reading information.

実施形態の帳票読取装置は、帳票に記録された文字を認識する帳票読取装置であり、画像記憶部、項目名記憶部、第1定義部、第2定義部を備える。画像記憶部には項目名とこの項目名に対応する文字認識領域との対が複数設けられた帳票の画像情報が記憶される。項目名記憶部には項目名とこの項目名に対応する文字認識領域を文字認識するための読取情報とを対応付けて記憶される。第1定義部は指定された第1の項目名の位置とこの第1の項目名に対応付けられている第1の文字認識領域の位置とに基づいて第1の項目名を文字認識し、この文字認識結果に基づいて項目名記憶部を参照して文字認識した項目名に対応付けられた読取情報を用いて第1の文字認識領域に対して読取情報を定義する。第2定義部は指定された第2の項目名に対応付けられている第2の文字認識領域の位置と第1の項目名の位置と第1の項目名に対応付けられている第1の文字認識領域の位置とに基づいて第2の項目名を文字認識し、この文字認識結果に基づいて項目名記憶部を参照して文字認識した項目名に対応付けられた読取情報を用いて第2の文字認識領域に対して読取情報を定義する。   The form reading apparatus according to the embodiment is a form reading apparatus that recognizes characters recorded in a form, and includes an image storage unit, an item name storage unit, a first definition unit, and a second definition unit. The image storage unit stores image information of a form in which a plurality of pairs of item names and character recognition areas corresponding to the item names are provided. The item name storage unit stores the item name and the reading information for recognizing the character recognition area corresponding to the item name in association with each other. The first definition unit character recognizes the first item name based on the position of the designated first item name and the position of the first character recognition area associated with the first item name, Based on the character recognition result, reading information associated with the item name recognized by referring to the item name storage unit is defined for the first character recognition area. The second definition unit includes a first character name associated with the position of the second character recognition area associated with the designated second item name, the position of the first item name, and the first item name. The second item name is character-recognized based on the position of the character recognition area, and the reading information associated with the item name recognized character by referring to the item name storage unit based on the character recognition result is used. Read information is defined for the second character recognition area.

第1実施形態の帳票読取システムの構成を示す図である。It is a figure which shows the structure of the form reading system of 1st Embodiment. 第1実施形態における定義対象の帳票の一例を示す図である。It is a figure which shows an example of the form of the definition object in 1st Embodiment. 帳票読取システムの動作を示すフローチャートである。It is a flowchart which shows operation | movement of a form reading system. 第1実施形態における定義対象の帳票の他の例を示す図である。It is a figure which shows the other example of the form of the definition object in 1st Embodiment. 第2実施形態の帳票読取システムの構成を示す図である。It is a figure which shows the structure of the form reading system of 2nd Embodiment. 第2実施形態における定義対象の帳票の一例を示す図である。It is a figure which shows an example of the form of the definition object in 2nd Embodiment.

以下、図面を参照して実施形態を詳細に説明する。実施形態では、複数の検査機関が作成した、検査項目の名称が記載されている項目名欄と検査項目の結果である項目値が記載(印字)される結果欄との配置がそれぞれ異なる複数の健康診断結果通知書を文字認識する場合を例示として説明する。つまり、これら複数の健康診断結果通知書ではすべての検査項目は共通するが、項目欄と結果欄の配置がそれぞれ異なっている。図1は第1実施形態の帳票読取システムの構成を示すブロック図である。   Hereinafter, embodiments will be described in detail with reference to the drawings. In the embodiment, a plurality of inspection fields created by a plurality of inspection organizations, each having a plurality of different arrangements of an item name field in which the name of the inspection item is described and a result field in which an item value as a result of the inspection item is described (printed) A case will be described as an example in which a health check result notification letter is recognized. In other words, all the examination items are common in the plurality of health check result notifications, but the arrangement of the item column and the result column is different. FIG. 1 is a block diagram showing a configuration of a form reading system according to the first embodiment.

(第1実施形態)
図1に示すように、この第1実施形態の帳票読取システムは、入力機器1、スキャナ2、コンピュータ3(以下「PC3」と称す)および表示装置としてのモニタ4を備える。
(First embodiment)
As shown in FIG. 1, the form reading system according to the first embodiment includes an input device 1, a scanner 2, a computer 3 (hereinafter referred to as “PC3”), and a monitor 4 as a display device.

PC3は例えばCPU、メモリ、ハードディスク装置、CD−ROM、DVD−ROMなどの記録媒体を再生する再生装置としてのディスク再生装置などを有する。PC3ではディスク再生装置にセットされた記録媒体からハードディスク装置にインストールされた制御ソフトウェアをCPUがメモリ上に読み出し、そのソフトウェアの処理を実行することで、PC3が、帳票を読み取る帳票読取装置として機能する。   The PC 3 includes, for example, a disk reproduction device as a reproduction device for reproducing a recording medium such as a CPU, a memory, a hard disk device, a CD-ROM, and a DVD-ROM. In the PC 3, the CPU reads out control software installed in the hard disk device from a recording medium set in the disk reproducing device onto the memory, and executes processing of the software, whereby the PC 3 functions as a form reading device that reads the form. .

帳票読取装置として機能するPC3は、帳票画像記憶部31、入出力インターフェース32(以下「入出力I/F32」と称す)、項目名リスト記憶部33、定義情報記憶部34、第1定義部35、第2定義部36を備える。   The PC 3 functioning as a form reading device includes a form image storage unit 31, an input / output interface 32 (hereinafter referred to as “input / output I / F 32”), an item name list storage unit 33, a definition information storage unit 34, and a first definition unit 35. The second definition unit 36 is provided.

スキャナ2は、読取対象の帳票、例えば帳票20(図2参照)の帳票イメージ(帳票画像)を光学的に読み取り、読み取った帳票画像をPC3の帳票画像記憶部31に記憶する。   The scanner 2 optically reads a form to be read, for example, a form image (form image) of the form 20 (see FIG. 2), and stores the read form image in the form image storage unit 31 of the PC 3.

図2に示す帳票20は、健康診断結果通知書である。帳票20には、最上部に帳票名(健康診断結果通知書)が印字され、その下に項目名が印字された項目名欄と、各項目名に対応した検査結果である項目値が印字される結果欄とが設けられている。これらの欄は罫線で区切られている。この帳票20は、検査項目の結果が印字されていない未使用の帳票である。   The form 20 shown in FIG. 2 is a health check result notification. The form 20 is printed with a form name (health check result notification) at the top, an item name column in which item names are printed, and item values that are inspection results corresponding to the respective item names. And a result column. These fields are separated by ruled lines. This form 20 is an unused form on which the result of the inspection item is not printed.

帳票20には表題「項目」が印刷されている表題欄21が設けられている。表題欄21の下には複数の項目名欄が設けられている。各項目名欄には検査項目の項目名(赤血球、白血球、血色素、血小板など)が印刷されている。帳票20には表題「結果」が印刷されている表題欄22が表題欄21の右側に対応付けて設けられている。表題欄22の下には複数の結果欄が設けられている。各結果欄には左隣の項目名欄に印刷された検査項目に対応する検査結果である数値が印字される。帳票画像記憶部31には、スキャナ2により光学的に読み取られた帳票の帳票画像が記憶される。   The form 20 is provided with a title column 21 on which a title “item” is printed. A plurality of item name fields are provided below the title field 21. In each item name column, the item names (red blood cells, white blood cells, hemoglobin, platelets, etc.) of the inspection items are printed. In the form 20, a title column 22 on which the title “result” is printed is provided in association with the right side of the title column 21. A plurality of result columns are provided below the title column 22. In each result column, a numerical value that is an inspection result corresponding to the inspection item printed in the item name column adjacent to the left is printed. The form image storage unit 31 stores a form image of a form optically read by the scanner 2.

入出力I/F32は帳票定義設定用の画面をモニタ4に表示し、定義対象の帳票画像を帳票画像記憶部31から読み出しその画面に表示する。入出力I/F32は、画面に表示された帳票画像に対して、入力機器1の操作により項目名欄と結果欄の位置情報を指定可能とする。   The input / output I / F 32 displays a screen for form definition setting on the monitor 4, reads out the form image to be defined from the form image storage unit 31, and displays it on the screen. The input / output I / F 32 can specify the position information of the item name column and the result column for the form image displayed on the screen by operating the input device 1.

項目名リスト記憶部33には、複数の検査機関が作成した複数の健康診断結果通知書において共通する検査項目の項目名称と、検査項目に対応付けられた結果欄に記載(印字)される項目値に関する読取情報とが、対応付けて記憶されている。   In the item name list storage unit 33, the item names of the inspection items common to the plurality of health check result notifications created by the plurality of inspection organizations and the items described (printed) in the result column associated with the inspection items The reading information related to the value is stored in association with each other.

項目名称は、赤血球、白血球、血色素、血小板などいった名称(テキストデータ)である。読取情報は、認識対象文字の種類(漢字、仮名,カタカナ、数字)や文字数などである。この読取情報に結果欄の位置情報は含まれていない。   The item name is a name (text data) such as red blood cell, white blood cell, hemoglobin, and platelet. The read information includes the type of characters to be recognized (kanji, kana, katakana, numbers) and the number of characters. This read information does not include the position information of the result column.

これは、上記複数の健康診断結果通知書において、検査項目に対応付けられた結果欄の位置が同一ではなく異なるからである。換言すれば、位置情報を除く認識対象文字の種類や文字数などの読取情報は、上記複数の健康診断結果通知書において共通であることが前提となっている。   This is because the positions of the result columns associated with the examination items are not the same but different in the plurality of health check result notifications. In other words, it is assumed that the read information such as the type and number of characters to be recognized excluding position information is common in the plurality of health check result notifications.

定義情報記憶部34には、上記複数の帳票毎に定義された位置情報を含む読取情報が記憶される。第1定義部35は帳票画像記憶部31から読み出した帳票画像における項目名欄23と結果欄24の位置情報(座標値)が入力機器1から入力され指定された場合、この位置が指定された項目名欄23に対応する帳票画像の領域から切り出した画像に基づいて項目名欄23に印字された項目名を文字認識する。   The definition information storage unit 34 stores read information including position information defined for each of the plurality of forms. When the position information (coordinate values) of the item name column 23 and the result column 24 in the form image read from the form image storage unit 31 is input from the input device 1 and specified, the first definition unit 35 specifies this position. Based on the image cut out from the form image area corresponding to the item name column 23, the item name printed in the item name column 23 is recognized.

第1定義部35は文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄24に対する読取情報として定義する。第1定義部35は項目名欄23と結果欄24の位置情報に基づいて、両者の相対的な位置関係の情報を一時的に保存する。相対的な位置関係の情報とは、例えば、項目名欄23と結果欄24の位置情報の位置誤差(距離)である。   The first definition unit 35 refers to the item name list information storage unit 33 using the item name recognized as a character as a key, acquires read information associated with the item name, and reads this read information into the result column 24. Define as information. Based on the position information in the item name field 23 and the result field 24, the first definition unit 35 temporarily stores information on the relative positional relationship between them. The information on the relative positional relationship is, for example, the positional error (distance) between the positional information in the item name column 23 and the result column 24.

第2定義部36は、次に読取情報を定義すべき結果欄26の位置情報が入力機器1から入力され指定された場合、結果欄26の位置情報と第1定義部35から提供される項目名欄23と結果欄24との相対的な位置関係の情報とに基づいて項目名欄25の領域の位置を特定し、この位置が特定された帳票画像の領域から切り出した画像に基づいて項目名欄25に印字された項目名を文字認識する。   When the position information of the result column 26 in which the reading information is to be defined next is input from the input device 1 and specified, the second definition unit 36 and the item provided from the first definition unit 35 Based on the information on the relative positional relationship between the name field 23 and the result field 24, the position of the area of the item name field 25 is specified, and the item is based on the image cut out from the area of the form image in which the position is specified. The item name printed in the name column 25 is recognized.

第2定義部36は、文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄25対する読取情報として定義する。   The second definition unit 36 refers to the item name list information storage unit 33 using the item name that has been character-recognized as a key, acquires the read information associated with the item name, and assigns the read information to the result column 25. Define as read information.

続いて、図2,図3を参照してこの第1実施形態の帳票読取システムの動作を説明する。
この帳票読取システムの場合、入出力I/F32は、モニタ4に帳票定義用の画面を表示し、画面において処理対象の帳票の画像を取り込む操作を行うことで、スキャナ2にセットされた処理対象の帳票、例えば図2に示した帳票20が光学的に読み取られ、読み取られた帳票20の帳票画像がPC3の帳票画像記憶部31に記憶される。
Next, the operation of the form reading system according to the first embodiment will be described with reference to FIGS.
In the case of this form reading system, the input / output I / F 32 displays a form definition screen on the monitor 4, and performs an operation of capturing an image of the form to be processed on the screen, whereby the processing target set in the scanner 2 is displayed. 2, for example, the form 20 shown in FIG. 2 is optically read, and the form image of the read form 20 is stored in the form image storage unit 31 of the PC 3.

続いて、上記画面において、定義対象の帳票画像の読み出し操作を行うことで、帳票画像記憶部31に記憶された帳票画像が読み出されて画面に表示される(図3のステップS101)。   Subsequently, the form image stored in the form image storage unit 31 is read out and displayed on the screen by performing an operation for reading out the form image to be defined on the screen (step S101 in FIG. 3).

画面に表示された帳票画像に対して、まず初めにユーザがマウスなどの入力機器1の操作により結果欄24の位置情報を指定する(ステップS102のYes)。この位置情報の指定は、結果欄24の対角線上に位置する2点(左上の角と右下の角の組み合わせ、又は右上の角と左下の角の組み合わせ)を指定する方法や、結果欄24の領域全体の範囲を指定する方法で行う。   For the form image displayed on the screen, first, the user specifies the position information in the result column 24 by operating the input device 1 such as a mouse (Yes in step S102). The position information is specified by a method of specifying two points (a combination of the upper left corner and the lower right corner, or a combination of the upper right corner and the lower left corner) located on the diagonal line of the result column 24, or the result column 24. This is done by specifying the range of the entire area.

続いて、項目名欄23の位置情報が指定されと(ステップS103のYes)、第1定義部35は項目名欄23に印字された項目名を文字認識する。   Subsequently, when the position information in the item name column 23 is designated (Yes in step S103), the first definition unit 35 recognizes the item name printed in the item name column 23 as characters.

そして、第1定義部35は文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄24に対する読取情報として定義する。   Then, the first definition unit 35 refers to the item name list information storage unit 33 using the item name recognized as a character as a key, acquires read information associated with the item name, and stores the read information in the result column 24. Is defined as read information for.

この結果、項目名「赤血球」の検査結果が印字される結果欄24の領域を文字認識するための読取情報が定義されたことになる。第1定義部35は項目名欄23と結果欄24の位置情報に基づいて、両者の相対的な位置関係の情報を一時的に保存する(ステップS104)。   As a result, the read information for recognizing characters in the area of the result column 24 in which the test result of the item name “red blood cell” is printed is defined. Based on the position information in the item name column 23 and the result column 24, the first definition unit 35 temporarily stores information on the relative positional relationship between the two (step S104).

次に、ユーザがマウスの操作により次に読取情報を定義すべき結果欄26の位置情報を指定すると(ステップS105のYes)、第2定義部36は、結果欄26の位置情報と第1定義部35から提供される項目名欄23と結果欄24との相対的な位置関係の情報とに基づいて結果欄26に対応する項目名欄25の領域の位置を特定し、この位置が特定された帳票画像の領域から切り出した画像に基づいて項目名欄25に印字された項目名を文字認識する(ステップS106)。   Next, when the user designates the position information of the result column 26 where the reading information is to be defined next by the operation of the mouse (Yes in step S105), the second definition unit 36 determines the position information and the first definition of the result column 26. The position of the area of the item name column 25 corresponding to the result column 26 is specified based on the information on the relative positional relationship between the item name column 23 and the result column 24 provided from the unit 35, and this position is specified. The item name printed in the item name column 25 is recognized based on the image cut out from the form image area (step S106).

第2定義部36は、文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄25対する読取情報として定義する(ステップS107)。この結果、項目名「白血球」の検査結果が印字される結果欄26の領域を文字認識するための読取情報が定義されたことになる。   The second definition unit 36 refers to the item name list information storage unit 33 using the item name that has been character-recognized as a key, acquires the read information associated with the item name, and assigns the read information to the result column 25. It is defined as read information (step S107). As a result, the read information for recognizing the area of the result column 26 where the test result of the item name “white blood cell” is printed is defined.

以下、同様に読取情報を定義すべき結果欄の位置情報を指定すると、その結果欄の領域を文字認識するための読取情報が定義される。そして、定義終了操作が行われると(ステップS108のYes)、第2定義部36は、帳票名や帳票IDなどと共に帳票20の定義情報を定義情報記憶部34に記憶する(ステップS109)。   Similarly, when the position information of the result column in which the read information is to be defined is designated, the read information for recognizing the character of the region of the result column is defined. When the definition ending operation is performed (Yes in step S108), the second definition unit 36 stores the definition information of the form 20 together with the form name, form ID, and the like in the definition information storage unit 34 (step S109).

このように第1実施形態によれば、帳票20の読取情報を定義すべき結果欄24と結果欄24に対応付けられている項目名欄23の位置情報を指定すると、項目名欄23に印字されている項目名を文字認識し、この項目名に対応付けられている読取情報を結果欄24に対する読取情報として定義する。次に読取情報を定義すべき結果欄26の位置情報を指定すると、結果欄26の位置情報と項目名欄23と結果欄24との相対的な位置関係の情報とに基づいて項目名欄25の領域の位置を特定し、この位置が特定された項目名欄25に印字された項目名の文字認識、及び結果欄26に対する読取情報の定義が行われる。以降、ユーザは結果欄の位置情報を指定するだけで、その結果欄に対する読取情報が定義できる。   As described above, according to the first embodiment, when the position information of the item name field 23 associated with the result field 24 and the result field 24 in which the reading information of the form 20 is to be defined is specified, the information is printed in the item name field 23. The character of the item name is recognized, and the reading information associated with the item name is defined as the reading information for the result column 24. Next, when the position information of the result column 26 in which the read information is to be defined is specified, the item name column 25 is based on the position information of the result column 26 and the information on the relative positional relationship between the item name column 23 and the result column 24. , The character recognition of the item name printed in the item name column 25 in which the position is specified, and the definition of the read information for the result column 26 are performed. Thereafter, the user can define the reading information for the result column only by specifying the position information of the result column.

この結果、項目名が共通し項目名に対応付けられている文字認識すべき欄の配置が異なる複数の帳票に対して、読取情報の定義を容易に行うことができる。   As a result, it is possible to easily define the read information for a plurality of forms having the same item name and different arrangements of the columns to be recognized that are associated with the item name.

以上の実施形態では、項目名欄と結果欄が左右に直接隣接し罫線で区切られ、項目名欄と結果欄の対が縦方向に複数配置された帳票20を対象とする読取情報の定義について説明した。しかし、帳票はこのような帳票20に限定されない。   In the above embodiment, the definition of read information for a form 20 in which an item name field and a result field are directly adjacent to each other on the left and right and separated by a ruled line, and a plurality of pairs of item name fields and result fields are arranged in the vertical direction. explained. However, the form is not limited to such a form 20.

すなわち、項目名欄と結果欄が上下に直接隣接し罫線で区切られ、項目名欄と結果欄の対が横方向に複数配置された帳票でも本発明は適用できる。更に、項目名欄と結果欄が罫線で区切られるが、直接隣接せずに離間して項目名欄と結果欄が対応して配置されている帳票でも本発明は適用できる。この場合、項目名欄と結果欄の対が横方向に複数配置された帳票、項目名欄と結果欄の対が縦方向に複数配置された帳票のいずれの場合でもよい。   That is, the present invention can also be applied to a form in which the item name column and the result column are directly adjacent to each other in the vertical direction and separated by a ruled line, and a plurality of pairs of the item name column and the result column are arranged in the horizontal direction. Furthermore, although the item name field and the result field are separated by a ruled line, the present invention can also be applied to a form in which the item name field and the result field are arranged correspondingly without being directly adjacent to each other. In this case, any of a form in which a plurality of pairs of item name fields and result fields are arranged in the horizontal direction and a form in which a plurality of pairs of item name fields and result fields are arranged in the vertical direction may be used.

更に、項目名欄と結果欄が罫線で区切られていない帳票でも本発明は適用できる。図4に項目名欄と結果欄が罫線で区切られていない帳票27を示す。この帳票27に対して読取情報の定義をする場合には、図4に示すように使用済みの帳票を使用する。   Furthermore, the present invention can be applied to a form in which the item name column and the result column are not separated by ruled lines. FIG. 4 shows a form 27 in which the item name field and the result field are not separated by ruled lines. When reading information is defined for this form 27, a used form is used as shown in FIG.

帳票27には罫線がないため項目名欄と結果欄は存在しないが、印字結果に基づいて項目名欄と結果欄に相当する領域の位置情報を指定することになる。この場合の位置情報の指定は、各欄に相当する領域の位置をマウスなどで図4に点線で示したように範囲指定することで行う。なお、この範囲指定は罫線が存在しないため、正確な範囲の位置指定はできないが、認識すべき文字が存在する大まかな範囲が指定できれば十分である。   Since the form 27 has no ruled line, the item name field and the result field do not exist, but the position information of the area corresponding to the item name field and the result field is designated based on the print result. The designation of position information in this case is performed by designating the position of the area corresponding to each column with a mouse or the like as indicated by the dotted line in FIG. In addition, since there is no ruled line in this range specification, it is impossible to specify the position of the accurate range, but it is sufficient if a rough range in which characters to be recognized exist can be specified.

(第2実施形態)
続いて、図5、図6を参照して第2実施形態を説明する。なおこの第2実施形態において第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
図5に示すように、この第2実施形態の帳票読取システムは、第3定義部37を備える。第3定義部37は前列の定義情報を用いて次の列をまとめて一括定義する。
(Second Embodiment)
Next, the second embodiment will be described with reference to FIGS. In the second embodiment, the same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof is omitted.
As shown in FIG. 5, the form reading system according to the second embodiment includes a third definition unit 37. The third definition unit 37 collectively defines the next column using the definition information of the previous column.

図6に示すように、各項目名欄に対応する結果欄が、2012年の結果と2013年の結果というように、それぞれ独立した列で設けられている健康診断結果通知書60の場合、上記第1実施形態では、2列の結果欄についてそれぞれ読取情報の定義作業を繰り返す必要がある。   As shown in FIG. 6, in the case where the result column corresponding to each item name column is a health check result notification 60 provided in independent columns, such as a 2012 result and a 2013 result, In the first embodiment, it is necessary to repeat the definition work of the read information for each of the two columns of result columns.

そこで、この第2実施形態では、第1定義部35が1列目の最後の結果欄28の読取情報の定義を終了した後、ユーザが2列目の初めの結果欄29の位置情報と項目名欄23の位置情報と指定することで、第3定義部37が結果欄29の位置情報、項目名欄23の位置情報、及び1列目のすべての結果欄の位置情報とに基づいて、2列目のすべての結果欄に対する読取情報の定義を一括して定義する。   Therefore, in the second embodiment, after the first definition unit 35 finishes defining the read information in the last result column 28 in the first column, the user can use the position information and items in the first result column 29 in the second column. By specifying the position information in the name field 23, the third definition unit 37 based on the position information in the result field 29, the position information in the item name field 23, and the position information in all the result fields in the first column, Definitions of reading information for all the result columns in the second column are collectively defined.

このように第2実施形態によれば、第3定義部37は2列目のすべての結果欄に対する読取情報の定義を一括してすることができる。   Thus, according to the second embodiment, the third definition unit 37 can collectively define the read information for all the result columns in the second column.

本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上記新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although the embodiment of the present invention has been described, the above embodiment is presented as an example, and is not intended to limit the scope of the invention. The novel embodiment can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. The above-described embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and equivalents thereof.

さらに上記実施形態では、各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM,DVD−ROMなどの記録媒体やフラッシュメモリ、リムーバブルメディア:Removable mediaなどが含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。   Furthermore, in the above embodiment, each component is realized by a program installed in a storage such as a hard disk device of a computer. However, the above program is stored in a computer-readable electronic medium: electronic media, and the program is stored in the electronic medium. The computer may realize the functions of the present invention by causing the computer to read the information. Examples of the electronic medium include recording media such as CD-ROM and DVD-ROM, flash memory, removable media, and the like. Further, the configuration may be realized by distributing and storing components in different computers connected via a network, and communicating between computers in which the components are functioning.

1…入力機器、2…スキャナ、3…コンピュータ(PC)、4…モニタ、20…帳票、24,26,28…結果欄、23,25…項目名欄、31…帳票画像記憶部、32…入出力インターフェース(入出力I/F)、33…項目名リスト記憶部、34…定義情報記憶部、35…第1定義部、36…第2定義部、37…第3定義部。   DESCRIPTION OF SYMBOLS 1 ... Input device, 2 ... Scanner, 3 ... Computer (PC), 4 ... Monitor, 20 ... Form, 24, 26, 28 ... Result column, 23, 25 ... Item name column, 31 ... Form image storage part, 32 ... Input / output interface (input / output I / F), 33 ... item name list storage section, 34 ... definition information storage section, 35 ... first definition section, 36 ... second definition section, 37 ... third definition section.

Claims (2)

帳票に記録された文字を認識する帳票読取装置において、
項目名とこの項目名に対応する文字認識領域との対が複数設けられた帳票の画像情報を記憶する画像記憶部と、
前記項目名とこの項目名に対応する前記文字認識領域を文字認識するための読取情報とを対応付けて記憶する項目名記憶部と、
指定された第1の項目名の位置とこの第1の項目名に対応付けられている第1の文字認識領域の位置とに基づいて前記第1の項目名を文字認識し、この文字認識結果に基づいて前記項目名記憶部を参照して前記文字認識した項目名に対応付けられた読取情報を用いて前記第1の文字認識領域に対して読取情報を定義する第1定義部と、
指定された第2の項目名に対応付けられている第2の文字認識領域の位置と前記第1の項目名の位置と前記第1の項目名に対応付けられている第1の文字認識領域の位置とに基づいて前記第2の項目名を文字認識し、この文字認識結果に基づいて前記項目名記憶部を参照して前記文字認識した項目名に対応付けられた読取情報を用いて前記第2の文字認識領域に対して読取情報を定義する第2定義部と、
を具備する帳票読取装置。
In the form reading device that recognizes the characters recorded in the form,
An image storage unit for storing image information of a form in which a plurality of pairs of item names and character recognition areas corresponding to the item names are provided;
An item name storage unit for storing the item name and reading information for character recognition of the character recognition area corresponding to the item name;
Character recognition is performed on the first item name based on the position of the designated first item name and the position of the first character recognition area associated with the first item name. A first definition unit that defines read information for the first character recognition area using read information associated with the item name recognized by referring to the item name storage unit based on
The position of the second character recognition area associated with the designated second item name, the position of the first item name, and the first character recognition area associated with the first item name Character recognition of the second item name based on the position of the character, and using the reading information associated with the item name recognized character by referring to the item name storage unit based on the character recognition result A second definition unit that defines read information for the second character recognition area;
A form reading apparatus comprising:
帳票に記録された文字を認識するコンピュータにおいて、
前記コンピュータを、
項目名とこの項目名に対応する文字認識領域との対が複数設けられた帳票の画像情報を記憶する画像記憶部と、
前記項目名とこの項目名に対応する前記文字認識領域を文字認識するための読取情報とを対応付けて記憶する項目名記憶部と、
指定された第1の項目名の位置とこの第1の項目名に対応付けられている第1の文字認識領域の位置とに基づいて前記第1の項目名を文字認識し、この文字認識結果に基づいて前記項目名記憶部を参照して前記文字認識した項目名に対応付けられた読取情報を用いて前記第1の文字認識領域に対して読取情報を定義する第1定義部と、
指定された第2の項目名に対応付けられている第2の文字認識領域の位置と前記第1の項目名の位置と前記第1の項目名に対応付けられている第1の文字認識領域の位置とに基づいて前記第2の項目名を文字認識し、この文字認識結果に基づいて前記項目名記憶部を参照して前記文字認識した項目名に対応付けられた読取情報を用いて前記第2の文字認識領域に対して読取情報を定義する第2定義部
として機能させるプログラム。
In a computer that recognizes characters recorded in a form,
The computer,
An image storage unit for storing image information of a form in which a plurality of pairs of item names and character recognition areas corresponding to the item names are provided;
An item name storage unit for storing the item name and reading information for character recognition of the character recognition area corresponding to the item name;
Character recognition is performed on the first item name based on the position of the designated first item name and the position of the first character recognition area associated with the first item name. A first definition unit that defines read information for the first character recognition area using read information associated with the item name recognized by referring to the item name storage unit based on
The position of the second character recognition area associated with the designated second item name, the position of the first item name, and the first character recognition area associated with the first item name Character recognition of the second item name based on the position of the character, and using the reading information associated with the item name recognized character by referring to the item name storage unit based on the character recognition result A program that functions as a second definition unit that defines read information for the second character recognition area.
JP2013184623A 2013-09-06 2013-09-06 Form reader and program Active JP6109688B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013184623A JP6109688B2 (en) 2013-09-06 2013-09-06 Form reader and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013184623A JP6109688B2 (en) 2013-09-06 2013-09-06 Form reader and program

Publications (2)

Publication Number Publication Date
JP2015052864A JP2015052864A (en) 2015-03-19
JP6109688B2 true JP6109688B2 (en) 2017-04-05

Family

ID=52701863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013184623A Active JP6109688B2 (en) 2013-09-06 2013-09-06 Form reader and program

Country Status (1)

Country Link
JP (1) JP6109688B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11699296B2 (en) 2020-12-09 2023-07-11 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
US11756321B2 (en) 2020-12-16 2023-09-12 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6917688B2 (en) * 2016-09-02 2021-08-11 株式会社東芝 Form reader, form reading method, program, and form reading system
JP7211157B2 (en) * 2019-02-27 2023-01-24 日本電信電話株式会社 Information processing device, association method and association program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003223610A (en) * 2002-01-28 2003-08-08 Toshiba Corp Character recognizing device and character recognizing method
JP4183527B2 (en) * 2003-02-24 2008-11-19 日立オムロンターミナルソリューションズ株式会社 Form definition data creation method and form processing apparatus
JP2005044256A (en) * 2003-07-25 2005-02-17 Casio Comput Co Ltd Slip field attribute preparation system, method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11699296B2 (en) 2020-12-09 2023-07-11 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
US11756321B2 (en) 2020-12-16 2023-09-12 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
JP2015052864A (en) 2015-03-19

Similar Documents

Publication Publication Date Title
US8295590B2 (en) Method and system for creating a form template for a form
JP6109688B2 (en) Form reader and program
JP2007279828A (en) Business form processor, business form format preparation device, business form, program for processing business form and program for preparing business form format
US10417792B2 (en) Information processing apparatus to display an individual input region for individual findings and a group input region for group findings
JP6759951B2 (en) Learning support program, learning support device, learning tool generation notebook and learning tool generation method
JP4591229B2 (en) Image processing apparatus, image processing method, and computer program
JP6237135B2 (en) Information processing apparatus and information processing program
JP5491774B2 (en) Data entry system and data entry method
JP6199641B2 (en) Form reader and program
JP6525523B2 (en) INFORMATION PROCESSING APPARATUS, CONTROL METHOD, AND PROGRAM
JPWO2017134800A1 (en) Tabular data analysis method, tabular data analysis program, and information processing apparatus
JP6336252B2 (en) Report creation support apparatus, control method thereof, and program
JP2018055256A (en) Information processing apparatus, information processing method, and program
KR20190133268A (en) Information display device, program and information display method
JP5528410B2 (en) Viewer device, server device, display control method, electronic comic editing method and program
JP2010102734A (en) Image processor and program
JP6789776B2 (en) Information processing equipment, information processing methods and programs
JP6682827B2 (en) Information processing apparatus and information processing program
US20210287003A1 (en) Information processing apparatus and non-transitory computer readable medium
US10965902B2 (en) Information processing apparatus and control method therefor
JP6107490B2 (en) Information processing apparatus and information processing program
JP2017228092A (en) Examination business support device and examination business support method
JP6497012B2 (en) Information processing apparatus and information processing program
JP5924035B2 (en) Information processing apparatus and information processing program
JP2018142108A (en) Image reading apparatus, image reading method, and image forming apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160325

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170308

R150 Certificate of patent or registration of utility model

Ref document number: 6109688

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150