JP2015090623A - Document reading device, program and document reading system - Google Patents

Document reading device, program and document reading system Download PDF

Info

Publication number
JP2015090623A
JP2015090623A JP2013230736A JP2013230736A JP2015090623A JP 2015090623 A JP2015090623 A JP 2015090623A JP 2013230736 A JP2013230736 A JP 2013230736A JP 2013230736 A JP2013230736 A JP 2013230736A JP 2015090623 A JP2015090623 A JP 2015090623A
Authority
JP
Japan
Prior art keywords
image
character
unit
recognition
item name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013230736A
Other languages
Japanese (ja)
Other versions
JP6230878B2 (en
Inventor
義正 岩田
Yoshimasa Iwata
義正 岩田
明弘 宇田
Akihiro Uda
明弘 宇田
康裕 中島
Yasuhiro Nakajima
康裕 中島
石川 幸弘
Yukihiro Ishikawa
幸弘 石川
信輔 櫻木
Shinsuke Sakuragi
信輔 櫻木
麻衣 北村
Mai Kitamura
麻衣 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2013230736A priority Critical patent/JP6230878B2/en
Publication of JP2015090623A publication Critical patent/JP2015090623A/en
Application granted granted Critical
Publication of JP6230878B2 publication Critical patent/JP6230878B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To easily perform definition of reading information of a document.SOLUTION: A document reading device reads characters from an image of a document obtained by optically reading the document. The document reading device comprises a screen control section and a character recognition section. The screen control section outputs a screen having the image of the document and display columns displaying item names of character data to be read from the image of the document and recognition result character data corresponding to the item names. In the case where a desired item name and an area of a reading object corresponding to the desired item name are specified by input operation to the screen, the character recognition section performs character recognition of an image portion of the specified area and displays the recognition result character data in the display column of the recognition result character data while storing the recognition result character data obtained associated with the item name.

Description

本発明の実施形態は、帳票の画像から文字を読み取る帳票読取装置、プログラムおよび帳票読取システムに関する。   Embodiments described herein relate generally to a form reading apparatus, a program, and a form reading system that read characters from a form image.

例えばコンピュータなどの帳票読取装置では、デジタルカメラなどの光学式の読取装置で取得した帳票の画像(デジタル写真など)を、文字認識アプリケーションソフトウェア(以下「OCRソフト」と称す)を利用して文字認識する技術が知られている。   For example, in a form reading device such as a computer, a form image (digital photograph, etc.) obtained by an optical reading device such as a digital camera is used for character recognition using character recognition application software (hereinafter referred to as “OCR software”). The technology to do is known.

読取り対象の帳票が例えば複数枚からなる契約書類などの場合、各ページ毎に独自の項目の配置が採用されており、同じ項目名を用いているといえども配置が異なるため、帳票読取装置には事前に各ページを読み取る(文字認識する)ための帳票の定義情報(読取情報の定義)をページ毎に定義しておく必要がある。帳票の定義情報とは、例えば認識項目名、その項目名に対応する読取り位置の座標(x座標,y座標)、サイズ、文字種、文字数などである。   For example, if the form to be read is a contract document consisting of a plurality of sheets, each page uses a unique item arrangement, and even if the same item name is used, the arrangement is different. In advance, it is necessary to define form definition information (reading information definition) for reading each page (character recognition) for each page. The form definition information includes, for example, a recognized item name, reading position coordinates (x coordinate, y coordinate) corresponding to the item name, size, character type, number of characters, and the like.

また帳票読取装置に新たな帳票を読み取らせる場合には、上記読取情報の定義をすべての文字認識対象の項目名について手入力および設定する必要がある。このため、帳票読み取りのための事前準備に多大な時間と労力が必要であった。   Further, when the form reading apparatus is to read a new form, it is necessary to manually input and set the definition of the read information for all item names to be recognized. For this reason, a great deal of time and effort is required for the advance preparation for reading the form.

特開2005−216102号公報JP-A-2005-216102

このように従来の帳票読取装置の場合、読取り対象の帳票1ページ毎に、認識項目名に対応する座標、サイズ、文字種、文字数などを一々手入力し帳票を読み取るための読取情報を事前に設定しておく必要がある。また複数枚綴りの帳票の場合、同じ項目名を読み取ることも多く、一度読み取った情報を再度読み取るのは効率的ではない。   As described above, in the case of the conventional form reading device, the reading information for reading the form is set in advance by manually inputting the coordinates, size, character type, number of characters, etc. corresponding to the recognition item name for each page of the form to be read. It is necessary to keep it. In the case of a multi-sheet form, the same item name is often read, and it is not efficient to read once read information.

本発明が解決しようとする課題は、帳票を読み取るための事前の準備が容易で、かつ帳票の情報のうち所望の箇所を読み取ることができる帳票読取装置、プログラムおよび帳票読取システムを提供することにある。   The problem to be solved by the present invention is to provide a form reading device, a program, and a form reading system that are easy to prepare in advance for reading a form and that can read a desired portion of the form information. is there.

実施形態の帳票読取装置は、帳票を光学的に読み取って得られた帳票の画像から文字を読み取る帳票読取装置であり、画面制御部、文字認識部を備える。画面制御部は帳票の画像とこの帳票の画像から読み取るべき文字データの項目名とこの項目名に対応する認識結果文字データとを表示する表示欄を有する画面を出力する。文字認識部は画面への入力操作により、所望の項目名とこの項目名に対応する読取対象のエリアが指定された場合、指定されたエリアの画像部分を文字認識し、得られた認識結果文字データを項目名と対応づけて記憶すると共に、認識結果文字データを認識結果文字データの表示欄に表示する。   The form reading apparatus according to the embodiment is a form reading apparatus that reads characters from a form image obtained by optically reading a form, and includes a screen control unit and a character recognition unit. The screen control unit outputs a screen having a display field for displaying a form image, an item name of character data to be read from the form image, and recognition result character data corresponding to the item name. When the desired item name and the area to be read corresponding to this item name are specified by the input operation on the screen, the character recognition unit recognizes the image portion of the specified area as a character, and the obtained recognition result character The data is stored in association with the item name, and the recognition result character data is displayed in the recognition result character data display field.

第1実施形態の帳票読取システムの構成を示す図である。It is a figure which shows the structure of the form reading system of 1st Embodiment. 帳票読取システムのタブレットの構成を示す図である。It is a figure which shows the structure of the tablet of a form reading system. 帳票画像DBの内容を示す図である。It is a figure which shows the content of form image DB. エントリ項目定義体DBの内容を示す図である。It is a figure which shows the content of entry item definition body DB. 文字種辞書DBの内容を示す図である。It is a figure which shows the content of character type dictionary DB. エントリ情報DBの内容を示す図である。It is a figure which shows the content of entry information DB. 帳票画像を表示したエントリ画面の一例を示す図である。It is a figure which shows an example of the entry screen which displayed the form image. 第1実施形態の帳票読取システム全体の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the whole form reading system of 1st Embodiment. 画像取得部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of an image acquisition part. 画面制御部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a screen control part. 読取エリアの指定方法の一例を示す図である。It is a figure which shows an example of the designation | designated method of a reading area. 文字認識部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a character recognition part. エントリ情報更新部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of an entry information update part. 第2実施形態の帳票読取システムの構成を示す図である。It is a figure which shows the structure of the form reading system of 2nd Embodiment. 第2実施形態の帳票読取システムの動作を示す図である。It is a figure which shows operation | movement of the form reading system of 2nd Embodiment. 画像取得部の他の構成例を示す図である。It is a figure which shows the other structural example of an image acquisition part. 第4実施形態の帳票読取システムの構成を示す図である。It is a figure which shows the structure of the form reading system of 4th Embodiment. 第4実施形態のタブレットの構成を示す図である。It is a figure which shows the structure of the tablet of 4th Embodiment. 第4実施形態の文字認識依頼部、文字認識確定部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the character recognition request part of 4th Embodiment, and a character recognition confirmation part. 読取エリアの指定方法の他の例を示す図である。It is a figure which shows the other example of the designation | designated method of a reading area.

以下、図面を参照して実施形態を詳細に説明する。図1は第1実施形態の帳票読取システムの構成を示すブロック図である。   Hereinafter, embodiments will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a form reading system according to the first embodiment.

(第1実施形態)
図1に示すように、この第1実施形態の帳票読取システムは、電子機器または携帯端末としてのタブレット端末1とこのタブレット端末1とネットワーク7を介して接続された外部システム8とを備える。外部システム8は例えばサーバコンピュータなどである。
(First embodiment)
As shown in FIG. 1, the form reading system of the first embodiment includes a tablet terminal 1 as an electronic device or a mobile terminal, and an external system 8 connected to the tablet terminal 1 via a network 7. The external system 8 is, for example, a server computer.

タブレット端末1は画像取得部としてのカメラ部2、タッチパネル3、CPU4、メモリ5、通信インターフェース6(以下「通信I/F6」と称す)などを備える。   The tablet terminal 1 includes a camera unit 2 as an image acquisition unit, a touch panel 3, a CPU 4, a memory 5, a communication interface 6 (hereinafter referred to as “communication I / F 6”), and the like.

このタブレット端末1ではメモリ5に記憶されているソフトウェアをCPU4が読み出し、そのソフトウェアの処理を実行することで、タブレット端末1が、帳票を読み取る帳票読取装置として機能する。   In the tablet terminal 1, the CPU 4 reads out the software stored in the memory 5 and executes processing of the software, whereby the tablet terminal 1 functions as a form reading device that reads the form.

カメラ部2は例えばCCDカメラなどであり、読取り対象の帳票、例えば帳票Aの帳票イメージ(帳票画像)を撮像、つまり光学的に読み取り、読み取った帳票画像をメモリ5に記憶する。撮像部としては、この端末1に内蔵されたカメラ部2の他、例えば外部接続したCCDセンサなどを備えたデジタルカメラなどであってもよい。   The camera unit 2 is, for example, a CCD camera or the like, and captures, that is, optically reads a form image (form image) of a form to be read, for example, form A, and stores the read form image in the memory 5. As the imaging unit, in addition to the camera unit 2 built in the terminal 1, for example, a digital camera including an externally connected CCD sensor or the like may be used.

タッチパネル3は情報の表示機能と入力機能の2つの機能を備えており、カメラ部2で撮像した帳票画像を液晶画面に表示すると共に、操作者が液晶画面に表示された画像(絵や写真など)の点または領域に手で触れて操作(タッチ操作)することにより、触れられた画面位置の情報を感知して操作情報(信号)として出力する。すなわちタッチパネル3はカメラ部2により撮像された帳票画像71(図3,図7参照)を表示することが可能であり、タッチ操作が可能なものである。   The touch panel 3 has two functions, an information display function and an input function. The touch panel 3 displays a form image captured by the camera unit 2 on the liquid crystal screen and an image (picture, photograph, etc.) displayed on the liquid crystal screen by the operator. ) By touching a point or region with a hand (touch operation), the information on the touched screen position is sensed and output as operation information (signal). That is, the touch panel 3 can display a form image 71 (see FIGS. 3 and 7) captured by the camera unit 2 and can be touched.

メモリ5には、帳票画像データベース12(以下「帳票画像DB12」と称す)、エントリ項目定義体データベース(エントリ項目定義体DB41(図4参照)、文字種辞書データベース(文字種辞書DB42(図5参照))などの記憶領域が設定されている。   The memory 5 includes a form image database 12 (hereinafter referred to as “form image DB 12”), an entry item definition body database (entry item definition body DB 41 (see FIG. 4), a character type dictionary database (a character type dictionary DB 42 (see FIG. 5)). A storage area such as is set.

帳票画像DB12には、カメラ部2により取得された帳票画像71が記憶される(詳細は後述する)。またメモリ5にはエントリ項目定義体DB41および文字種辞書DB42が記憶されている。エントリ項目定義体DB41は文字認識用の定義情報である。文字種辞書DB42は帳票ID毎またはエントリ項目毎に設定されている文字種の辞書である。メモリ5は各部により帳票画像の処理が行われる際の作業領域として機能する。通信I/F6はネットワーク7を通じて外部システム8と通信する。   The form image DB 12 stores a form image 71 acquired by the camera unit 2 (details will be described later). The memory 5 stores an entry item definition DB 41 and a character type dictionary DB 42. The entry item definition DB 41 is definition information for character recognition. The character type dictionary DB 42 is a character type dictionary set for each form ID or each entry item. The memory 5 functions as a work area when a form image is processed by each unit. The communication I / F 6 communicates with the external system 8 through the network 7.

CPU4は帳票画像71とこの帳票画像71から読み取るべき文字の項目名72と各項目名に対応する認識結果の表示欄73とを有するエントリ画面70(図7参照)をタッチパネル3に表示する画面制御部として機能する。   The CPU 4 controls the screen to display on the touch panel 3 an entry screen 70 (see FIG. 7) having a form image 71, an item name 72 of characters to be read from the form image 71, and a recognition result display column 73 corresponding to each item name. It functions as a part.

またCPU4はエントリ画面70に対するタッチ操作により、オペレータにより所望の項目名を指定するタップ操作とこの項目名に対応する読取り対象のエリアが指定された場合、指定されたエリアを文字認識し、得られた文字データと項目名の情報とエリアの位置情報とを対応付けてメモリ5に記憶すると共に、文字データを認識結果の表示欄73に表示する文字認識部として機能する。   When the operator designates a tap operation for designating a desired item name and an area to be read corresponding to the item name by a touch operation on the entry screen 70, the CPU 4 recognizes the designated area and obtains the character. The character data, item name information, and area position information are stored in the memory 5 in association with each other, and function as a character recognition unit that displays the character data in the recognition result display field 73.

この帳票読取システムの機能としては、図2に示すように、画像取得部10、画面制御部20、文字認識部40、エントリ情報更新部50などを有する。   As shown in FIG. 2, the function of the form reading system includes an image acquisition unit 10, a screen control unit 20, a character recognition unit 40, an entry information update unit 50, and the like.

画像取得部10はカメラ部2、帳票画像書込部11、帳票画像記憶部としての帳票画像データベース12(以下「帳票画像DB12」と称す)を有する。カメラ部2は帳票Aを光学的に読み取って帳票の画像を取得する。帳票画像書込部11はカメラ部2により取得された帳票画像71を取得し帳票画像DB12に記憶する(書き込む)。各DBはメモリ5の記憶領域に構築される。すなわち画像取得部10はカメラ部2により取得された帳票画像71をメモリ5に記憶する。   The image acquisition unit 10 includes a camera unit 2, a form image writing unit 11, and a form image database 12 (hereinafter referred to as “form image DB 12”) as a form image storage unit. The camera unit 2 optically reads the form A and acquires an image of the form. The form image writing unit 11 acquires the form image 71 acquired by the camera unit 2 and stores (writes) it in the form image DB 12. Each DB is constructed in the storage area of the memory 5. That is, the image acquisition unit 10 stores the form image 71 acquired by the camera unit 2 in the memory 5.

図3に示すように、帳票画像DB12には、帳票画像71毎のIDと各IDに対応したバイナリデータ(画像データまたはイメージデータなどともいう)とが記憶される。   As shown in FIG. 3, the form image DB 12 stores an ID for each form image 71 and binary data (also referred to as image data or image data) corresponding to each ID.

画面制御部20は帳票画像読出部21、画面生成部22、OCR対象帳票受付部23、OCR対象エントリ項目受付部24、OCR対象エントリ項目エリア受付部25を有する。
OCRとはオプチカル・キャラクタ・レコグニション(光学文字認識)またはオプチカル・キャラクタ・リーダ(光学式文字読取装置)の略称であり、ここでは前者を指す。
The screen control unit 20 includes a form image reading unit 21, a screen generation unit 22, an OCR target form receiving unit 23, an OCR target entry item receiving unit 24, and an OCR target entry item area receiving unit 25.
OCR is an abbreviation for optical character recognition (optical character recognition) or optical character reader (optical character reader), and here refers to the former.

画面制御部20は帳票画像71の表示欄と帳票画像71から読み取るべき文字のエントリ項目の項目名72の表示欄とこの項目名に対応する認識結果の表示欄73とを有するエントリ画面70(図7参照)をタッチパネル3に表示(出力)する。   The screen control unit 20 includes an entry screen 70 having a display field for a form image 71, a display field for an item name 72 of an entry item of characters to be read from the form image 71, and a display field 73 for a recognition result corresponding to the item name (FIG. 7) is displayed (output) on the touch panel 3.

画面制御部20は帳票画像71の所望の位置がタップ操作により指定されることで、その指定位置に存在する読取対象の文字画像を囲む枠線80(図11参照)を表示し、枠線80内を認識対象のエリアとして特定する。この他、帳票画像71の所望のエリアがスライド操作により始点と終点が指定されることで、読取対象の文字画像を囲む枠線80を表示し、枠線80内を認識対象のエリアとしてもよい。   When the desired position of the form image 71 is designated by a tap operation, the screen control unit 20 displays a frame line 80 (see FIG. 11) surrounding the character image to be read existing at the designated position. The inside is identified as the recognition target area. In addition to this, a desired area of the form image 71 may be designated by a slide operation so that a frame 80 surrounding the character image to be read is displayed, and the area within the frame 80 may be set as a recognition target area. .

帳票画像読出部21は帳票画像DB12に記憶されている帳票画像71を読み出し画面生成部22へ渡し、エントリ画面70に帳票画像71を表示させる。   The form image reading unit 21 reads out the form image 71 stored in the form image DB 12 and passes it to the screen generation unit 22 to display the form image 71 on the entry screen 70.

画面生成部22はエントリ画面70を生成および表示し、帳票画像読出部21から渡された帳票画像71のサムネイル一覧と、サムネイル一覧の中から指定されたサムネイルの帳票画像71をエントリ画面70に表示する。   The screen generation unit 22 generates and displays an entry screen 70, and displays on the entry screen 70 a thumbnail list of the form image 71 passed from the form image reading unit 21 and a form image 71 of a thumbnail specified from the thumbnail list. To do.

また画面生成部22は入力された帳票IDをキーワードにしてエントリ項目定義体DB41を参照して処理対象の帳票Aのエントリ項目を抽出しエントリ画面70内の左端にエントリ項目一覧を縦に表示する。   The screen generation unit 22 extracts the entry items of the processing target form A by referring to the entry item definition DB 41 using the input form ID as a keyword, and vertically displays the entry item list on the left end of the entry screen 70. .

なおこの例では、帳票Aに紐付けたエントリ項目を抽出したが、エントリ項目をバッチ単位で抽出してもよく、本実施形態はエントリ項目を抽出の仕方に限定されるものではない。   In this example, the entry item linked to the form A is extracted. However, the entry item may be extracted in batch units, and the present embodiment is not limited to the method of extracting the entry item.

OCR対象帳票受付部23はエントリ画面70に表示された帳票画像71のサムネイルのうち、タップ(選択または指定)されたサムネイルの帳票画像71を読取処理対象の画像としてエントリ画面70全体に表示する。   The OCR target form receiving unit 23 displays the tapped (selected or designated) form image 71 of the thumbnails of the form image 71 displayed on the entry screen 70 on the entire entry screen 70 as an image to be read.

OCR対象エントリ項目受付部24はエントリ画面70に表示されたエントリ項目一覧のうち例えばチェックボックスのような選択できる方法で(以下、「チェックボックス」と称する)項目名72をタップ(選択または指定)されたエントリ項目をアクティブにする。   The OCR target entry item receiving unit 24 taps (selects or designates) an item name 72 by a method that allows selection, for example, a check box (hereinafter referred to as “check box”), from the list of entry items displayed on the entry screen 70. Activate the entry entry

OCR対象エントリ項目エリア受付部25はエントリ項目をタップした後に帳票画像71に対して行われたタップ操作を検出し、そのタップ位置から文字認識対象エリアを特定する。文字認識対象エリアを特定には、いくつかの方法があるが、一例として、タップされた1点から横方向に一定の範囲(矩形の範囲)にある画像を文字認識対象とする。   The OCR target entry item area receiving unit 25 detects a tap operation performed on the form image 71 after tapping the entry item, and specifies a character recognition target area from the tap position. There are several methods for specifying the character recognition target area. As an example, an image in a certain range (rectangular range) in the horizontal direction from one tapped point is set as a character recognition target.

文字認識部40は文字認識部としてのOCRエンジン44、認識結果記憶部43、ベリファイ部45、エントリ項目定義体DB41、文字種辞書DB42を有する。   The character recognition unit 40 includes an OCR engine 44 as a character recognition unit, a recognition result storage unit 43, a verification unit 45, an entry item definition DB 41, and a character type dictionary DB 42.

OCRエンジン44はエントリ画面70に対するタッチ操作により、所望のエントリ項目の項目名とこの項目名に対応する読取り対象のエリアが指定された場合、指定されたエリアの画像部分を文字認識し、得られた文字データと項目名の情報とエリアの位置情報とを対応付けてメモリ5(認識結果記憶部43)に記憶すると共に、認識結果の文字データを表示欄73に表示する。   When the item name of a desired entry item and an area to be read corresponding to the item name are designated by a touch operation on the entry screen 70, the OCR engine 44 recognizes the image portion of the designated area by character recognition. The character data, item name information, and area position information are associated with each other and stored in the memory 5 (recognition result storage unit 43), and the recognition result character data is displayed in the display column 73.

認識結果記憶部43には認識結果の文字データと読み取りの際に帳票画像から切り出した文字画像と読取り範囲の位置情報とが対応して認識結果として記憶される。   The recognition result storage unit 43 stores the character data of the recognition result, the character image cut out from the form image at the time of reading, and the position information of the reading range as the recognition result.

ベリファイ部45は認識結果記憶部43に記憶された認識結果の文字データに対するベリファイ処理を行う。具体的には、ベリファイ部45は読み取り対象エリアに印字されているべき文字数(予め設定されている文字数)と実際に認識された認識結果の文字数とを比較し一致するか否かをチェックする。文字数の他、文字種に対しても行う。文字種のベリファイ処理だけを行ってもよい。   The verify unit 45 performs a verify process on the character data of the recognition result stored in the recognition result storage unit 43. Specifically, the verify unit 45 compares the number of characters that should be printed in the reading target area (the number of characters set in advance) with the number of characters of the recognition result that is actually recognized, and checks whether they match. In addition to the number of characters, this is also done for character types. Only character type verification processing may be performed.

すなわちベリファイ部45は文字認識した結果として得られた文字データの文字種および/または文字数を、予め設定された項目毎の文字種および/または文字数と比較し、不一致の場合、アラートを出力する。
図4に示すように、エントリ項目定義体DB41には、項目名、定義情報(文字種)、定義情報(文字数)などが対応付けて記憶されている。項目名は、例えば「氏名」、「住所」、「電話番号」…など、定義情報(文字種)は、例えば「かな」、「漢字」など、定義情報(文字数)は「20」、「50」、「10」などの数値が設定されている。この他、定義情報としては文字のサイズなども設定されている。
That is, the verify unit 45 compares the character type and / or number of characters of character data obtained as a result of character recognition with a preset character type and / or number of characters for each item, and outputs an alert if they do not match.
As shown in FIG. 4, the entry item definition DB 41 stores item names, definition information (character types), definition information (number of characters) and the like in association with each other. The item name is, for example, “name”, “address”, “phone number”, etc. The definition information (character type) is, for example, “kana”, “kanji”, and the definition information (number of characters) is “20”, “50”. , “10” and the like are set. In addition, character size and the like are set as definition information.

つまりエントリ項目定義体DB41には、各エントリ項目に対応する定義情報が記憶されている。定義情報は例えば認識対象の項目名、その項目名に対応する読取エリア(読取位置)に記載されているべき文字のサイズ、文字種、文字数などである。   That is, the entry item definition DB 41 stores definition information corresponding to each entry item. The definition information includes, for example, an item name to be recognized, a character size, a character type, and the number of characters that should be described in a reading area (reading position) corresponding to the item name.

図5に示すように、文字種辞書DB42には、複数の文字種の異なる辞書を識別するためのID、タイプ、ルールが対応付けて記憶されている。IDとしては、例えば「1」,「2」などの数値、タイプとしては「かな」、「英語」など、ルールとしては、「かな」であれば「あいうえお…」、「英語」であれば「abcdef…」などが設定されている。   As shown in FIG. 5, the character type dictionary DB 42 stores IDs, types, and rules for identifying different dictionaries of a plurality of character types in association with each other. The ID is a numerical value such as “1” or “2”, the type is “Kana”, “English”, or the like. The rule is “Kana”, “Aiueo ...”, “English”, “ abcdef ... "and the like are set.

すなわち文字種辞書DB42には、項目毎に記載されているべき文字の文字種の辞書が記憶されており、文字認識の際にOCRエンジン44により使用される。OCRエンジン44はエントリ項目定義体DB41から得た文字種に紐付く辞書を文字種辞書DB42から読み出す。   That is, the character type dictionary DB 42 stores a character type dictionary of characters to be described for each item, and is used by the OCR engine 44 in character recognition. The OCR engine 44 reads a dictionary associated with the character type obtained from the entry item definition DB 41 from the character type dictionary DB 42.

エントリ情報更新部50はエントリ情報DB51、エントリ情報書込部52、エントリ情報送信部53を有する。   The entry information update unit 50 includes an entry information DB 51, an entry information writing unit 52, and an entry information transmission unit 53.

図6に示すように、エントリ情報DB51には、項目名、認識結果、帳票ID、座標などが対応付けて記憶されている。項目名は、例えば「氏名」、「住所」、「電話番号」…など、認識結果は、「氏名」であれば「○×太郎」、「住所」であれば「東京都XX市XX町1−1−1」、「電話番号」であれば「0123456789」などである。
座標は、読取対象のエリアを2次元的に示す矩形の頂点の4つのポイントのx座標,y座標が一対で記憶されている。
As shown in FIG. 6, the entry information DB 51 stores item names, recognition results, form IDs, coordinates, and the like in association with each other. The item name is, for example, “name”, “address”, “telephone number”, etc. The recognition result is “○ Taro” if it is “name”, “XX town 1 in XX city XX city” if it is “address” -1-1 "and" phone number "are" 01234456789 ".
As the coordinates, a pair of x and y coordinates of four points of a rectangular vertex that two-dimensionally indicates an area to be read is stored.

すなわちエントリ情報DB51には、項目名と、認識結果記憶部43の認識結果と、OCR対象帳票受付部23によって受け付けられた帳票に紐付く帳票IDと、OCR対象エントリ項目エリア受付部25によって受け付けられたエリア情報(x座標,y座標)が記憶される。   That is, in the entry information DB 51, the item name, the recognition result of the recognition result storage unit 43, the form ID associated with the form received by the OCR target form receiving unit 23, and the OCR target entry item area receiving unit 25 are received. Area information (x coordinate, y coordinate) is stored.

エントリ情報書込部52は認識結果記憶部43より認識結果を読み出してエントリ情報DB51に書き込む。エントリ情報送信部53はエントリ情報DB51に記憶されている情報を、ネットワーク7を通じて外部システム8へ送信する。   The entry information writing unit 52 reads the recognition result from the recognition result storage unit 43 and writes it in the entry information DB 51. The entry information transmission unit 53 transmits information stored in the entry information DB 51 to the external system 8 through the network 7.

図7に示すように、エントリ画面70には、文字読取対象の帳票画像71が画面全体に表示される他、この帳票画像71から読み取るべき文字の項目名72と各項目名72のチェックボックスと各項目名72に対応する認識結果の表示欄73とが画面左側に表示される。この例では、読み取るべき文字の項目名72として、例えばID、氏名、住所、電話番号、生年月日などを例示している。   As shown in FIG. 7, on the entry screen 70, a form image 71 to be read is displayed on the entire screen, and an item name 72 of characters to be read from the form image 71 and a check box for each item name 72 are displayed. A recognition result display field 73 corresponding to each item name 72 is displayed on the left side of the screen. In this example, as the item name 72 of the character to be read, for example, ID, name, address, telephone number, date of birth, etc. are illustrated.

続いて、図8乃至図14を参照してこの第1実施形態の帳票読取システムの動作を説明する。まず、図8のフローチャートを参照してこの帳票読取システムの全体的な動作(概要動作)を説明する。   Next, the operation of the form reading system according to the first embodiment will be described with reference to FIGS. First, the overall operation (outline operation) of the form reading system will be described with reference to the flowchart of FIG.

この帳票読取システムの場合、オペレータがタブレット端末1の電源を入れて文字読取用のプログラムである文字認識アプリケーションソフトウェアを起動すると、タッチパネル3にエントリ画面70が表示される。   In the case of this form reading system, when an operator turns on the tablet terminal 1 and activates character recognition application software which is a character reading program, an entry screen 70 is displayed on the touch panel 3.

続いて、オペレータは、紙の帳票Aを電子データ化するために、エントリ画面70の帳票取り込み釦(図示せず)を操作すると、画像取得部10は、カメラ部2を起動し、エントリ画面70をカメラ撮像用のモニタ画面にする。   Subsequently, when the operator operates a form capture button (not shown) on the entry screen 70 in order to convert the paper form A into electronic data, the image acquisition unit 10 activates the camera unit 2 and activates the entry screen 70. To the monitor screen for camera imaging.

オペレータがモニタ画面をみながら、モニタ画面内に処理対象の帳票Aを入れて撮影すると(図8のステップS101)、カメラ部2は撮像した帳票画像71を帳票画像書込部11に出力する。帳票画像書込部11は撮影された帳票画像71を帳票画像DB12に書き込む。帳票画像71は撮影された枚数分、つまり1枚以上取り込まれる。帳票Aの撮影を終了した後、モニタ画面を閉じると、エントリ画面70になる。   When the operator looks at the monitor screen and puts the form A to be processed in the monitor screen and shoots (step S101 in FIG. 8), the camera unit 2 outputs the captured form image 71 to the form image writing unit 11. The form image writing unit 11 writes the photographed form image 71 in the form image DB 12. The form image 71 is captured as many as the number of shots, that is, one or more sheets. After the photographing of the form A is completed, the entry screen 70 is displayed when the monitor screen is closed.

ここで、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、画面制御部20は、帳票画像DB12に蓄積されている一つ以上の帳票画像71を読み込み、エントリ画面70に帳票画像71のサムネイルを表示し、メッセージなどを表示して選択を促す。   Here, when the operator taps a form image reading button (not shown) on the entry screen 70, the screen control unit 20 reads one or more form images 71 stored in the form image DB 12, and enters the entry screen 70. A thumbnail of the form image 71 is displayed, and a message is displayed to prompt selection.

ここで、オペレータがエントリ画面70のサムネイルの中から所望のサムネイルを選択すると(ステップS102)、指定されたサムネイルに対応する文字認識対象の帳票画像71がエントリ画面70全体に操作用として表示される(図7参照)。   When the operator selects a desired thumbnail from the thumbnails on the entry screen 70 (step S102), a character recognition target form image 71 corresponding to the designated thumbnail is displayed on the entire entry screen 70 for operation. (See FIG. 7).

ここで、オペレータがエントリ画面70の項目名のチェックボックス72を指で選択し、続いて帳票画像71のOCR箇所を指定すると、画面制御部20は、その指定されたOCR箇所を受け付け(ステップS103)、そのOCR箇所にある文字画像を読取対象として特定する。   Here, when the operator selects the check box 72 of the item name on the entry screen 70 with a finger and subsequently designates the OCR location of the form image 71, the screen control unit 20 accepts the designated OCR location (step S103). ), The character image at the OCR location is specified as a reading target.

OCRエンジン44は、特定された文字画像を切り出し、エントリ項目定義体DB41からエントリ項目定義体と、文字種辞書DB42から文字種の辞書を読み出して、これらを参照して文字認識し(ステップS104)、認識結果の文字データを認識結果記憶部43に記憶するとともに表示欄73に表示する。   The OCR engine 44 cuts out the identified character image, reads out the entry item definition body from the entry item definition body DB 41 and the character type dictionary from the character type dictionary DB 42, and recognizes the characters by referring to these (step S104). The resulting character data is stored in the recognition result storage unit 43 and displayed in the display field 73.

エントリ画面70の表示欄73に表示された文字データをオペレータが確認し、誤読していれば、表示欄73の文字データを修正し、修正不要であれば、次の項目名のチェックボックス72をタップする。   The operator confirms the character data displayed in the display field 73 of the entry screen 70 and corrects the character data in the display field 73 if it is misread. If the correction is not necessary, the check box 72 for the next item name is displayed. Tap.

この操作(動作)を繰り返して、オペレータとして所望の項目の文字データが得られた後、オペレータがエントリ画面70のエントリ釦(図示せず)をタップすると、エントリ情報更新部50が認識結果を認識結果記憶部43から取り込んで一定のエントリ形式の情報に変換してエントリ情報DB51の内容を更新した後(ステップS105)、外部システム8へ送信する。この外部システム8では、例えば複数のタブレット端末1から送信されてきたエントリ情報を収集し、顧客情報管理システム等に取り込むなどの処理を行う。   When the operator taps an entry button (not shown) on the entry screen 70 after character data of a desired item is obtained as an operator by repeating this operation (operation), the entry information update unit 50 recognizes the recognition result. After fetching from the result storage unit 43 and converting it into information of a certain entry format and updating the contents of the entry information DB 51 (step S105), the information is transmitted to the external system 8. In the external system 8, for example, entry information transmitted from a plurality of tablet terminals 1 is collected and processed into a customer information management system or the like.

次に各部の詳細な動作を説明する。まず図9を参照して画像取得部10の動作を説明する。この場合、帳票Aをカメラ部2が撮影し(ステップS201)、撮影された帳票画像71が帳票画像書込部11により帳票画像DB12へ書き込まれる(ステップS202)。   Next, the detailed operation of each part will be described. First, the operation of the image acquisition unit 10 will be described with reference to FIG. In this case, the camera unit 2 captures the form A (step S201), and the captured form image 71 is written into the form image DB 12 by the form image writing unit 11 (step S202).

対象となる全ての帳票、例えば帳票A以外に帳票B、帳票Cなどを撮影し終えると(ステップS203のYes)、処理を終了し、対象となる全ての帳票を撮影し終えていなければ(ステップS203のNo)、ステップS201に戻り、処理を繰り返す。   When all of the target forms, for example, form B and form C other than form A have been photographed (Yes in step S203), the process is terminated, and if all of the target forms have not been photographed (step (No in S203), the process returns to step S201 to repeat the process.

続いて、図10を参照して画面制御部20の動作を説明する。この場合、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、帳票画像読出部21は、帳票画像DB12に蓄積されている一つ以上の帳票画像71を読み出し(ステップS301)、タッチパネル3のエントリ画面70に帳票画像71のサムネイル一覧を表示する(ステップS302)。   Next, the operation of the screen control unit 20 will be described with reference to FIG. In this case, when the operator taps a form image reading button (not shown) on the entry screen 70, the form image reading unit 21 reads one or more form images 71 stored in the form image DB 12 (step S301). The thumbnail list of the form image 71 is displayed on the entry screen 70 of the touch panel 3 (step S302).

ここで、オペレータがエントリ画面70のサムネイル一覧の中から所望のサムネイルを選んで、タッチパネル3をタップ操作(サムネイルを指定)すると、OCR対象帳票受付部23はサムネイルの指定を受け付け(ステップS303)、指定されたサムネイルに対応する帳票画像71をOCR対象として確定し(ステップS304)、エントリ画面70ほぼ全体に操作用として表示する(図7参照)。   Here, when the operator selects a desired thumbnail from the thumbnail list on the entry screen 70 and taps the touch panel 3 (designates a thumbnail), the OCR target form accepting unit 23 accepts the designation of the thumbnail (step S303), The form image 71 corresponding to the designated thumbnail is determined as an OCR target (step S304), and displayed for operation on almost the entire entry screen 70 (see FIG. 7).

続いて、オペレータがエントリ画面70の項目名のチェックボックス72を選び、指でタップしてエントリ項目の項目名を指定すると、OCR対象エントリ項目受付部24はOCR対象のエントリ項目の項目名指定を受け付け(ステップS305)、OCRエンジン44をアクティブにして、OCR箇所(読取エリア)が指定されるのを待機する。   Subsequently, when the operator selects the item name check box 72 on the entry screen 70 and taps it with his / her finger to specify the item name of the entry item, the OCR target entry item receiving unit 24 specifies the item name of the OCR target entry item. Acceptance (step S305), activates the OCR engine 44, and waits for an OCR location (reading area) to be designated.

ここで、オペレータが、図11に示すように、指でタッチパネル3(エントリ画面70)の帳票画像71のOCR箇所をタップして読取エリア(の開始点)をポイントで指定すると、OCR対象エントリ項目エリア受付部25は、そのポイントされた位置を受け付け、その位置から一定の方向(水平方向)にある文字画像を囲む枠線80を表示する(ステップS306)。   Here, as shown in FIG. 11, when the operator taps the OCR portion of the form image 71 on the touch panel 3 (entry screen 70) with a finger and designates the reading area (starting point) with a point, the entry item for OCR The area receiving unit 25 receives the pointed position, and displays a frame line 80 surrounding the character image in a certain direction (horizontal direction) from the position (step S306).

続いて、図12を参照して文字認識部40の動作を説明する。この場合、OCRエンジン44は、エントリ項目の項目名と枠線80で特定された読取エリアの座標に基づいて帳票画像71から文字画像を切り出し、エントリ項目定義体DB41からエントリ項目定義体と、文字種辞書DB42から文字種の辞書を読み出して、これらの情報を参照して文字認識し(ステップS501)、得られた認識結果を認識結果記憶部43に記憶すると共に、認識結果の文字データをエントリ項目の項目名に対応する表示欄73に表示する(ステップS502)。   Next, the operation of the character recognition unit 40 will be described with reference to FIG. In this case, the OCR engine 44 cuts out a character image from the form image 71 based on the item name of the entry item and the coordinates of the reading area specified by the frame 80, and enters the entry item definition body and the character type from the entry item definition body DB41. A dictionary of character types is read from the dictionary DB 42, character recognition is performed with reference to these pieces of information (step S501), the obtained recognition result is stored in the recognition result storage unit 43, and the character data of the recognition result is stored in the entry item. The information is displayed in the display field 73 corresponding to the item name (step S502).

これと同時に、ベリファイ部45が、認識結果記憶部43に記憶された認識結果の文字データに対して文字種および文字数のベリファイ処理を行う(ステップS502)。   At the same time, the verify unit 45 performs a character type and character number verify process on the character data of the recognition result stored in the recognition result storage unit 43 (step S502).

ベリファイ処理の結果、ベリファイ処理が不成功に終わった場合、つまり予め設定されている辞書の文字種およびエントリ項目定義体の文字数と、認識結果の文字データの文字種および文字数が不一致の場合(ステップS503のNo)、ベリファイ部45はアラートを出力し(ステップS504)、エントリ画面70上に警告メッセージを表示する。   As a result of the verify process, when the verify process is unsuccessful, that is, when the character type of the dictionary and the number of characters of the entry item definition set in advance do not match the character type and the number of characters of the character data of the recognition result (in step S503) No), the verify unit 45 outputs an alert (step S504), and displays a warning message on the entry screen 70.

なお認識結果を認識結果記憶部43に記憶する前にベリファイ処理を行ってもよい。また文字の文字種および文字数のベリファイ処理を別々に分けて行ってもよい。さらにベリファイ処理が不成功に終わった場合に警告メッセージの表示だけでなく警告音を発報してもよい。また警告音のみを発報してもよい。   A verification process may be performed before the recognition result is stored in the recognition result storage unit 43. In addition, the character type and the number of characters may be separately verified. Further, when the verification process is unsuccessful, not only a warning message but also a warning sound may be issued. Only a warning sound may be issued.

続いて、図13を参照してエントリ情報更新部50の動作を説明する。認識結果の文字データがエントリ画面70の表示欄73に表示された後、その文字データをオペレータが確認し、誤読していれば、表示欄73の文字データをキー入力などで手修正し、修正不要であれば、次の項目名をタップする。   Next, the operation of the entry information update unit 50 will be described with reference to FIG. After the character data of the recognition result is displayed in the display field 73 of the entry screen 70, the operator confirms the character data, and if it is misread, the character data in the display field 73 is manually corrected by key input or the like. If unnecessary, tap the next item name.

この操作(動作)を繰り返して、オペレータとして所望の項目の文字データが得られた後、オペレータがエントリ画面70のエントリ釦(図示せず)をタップすると、エントリ情報書込部52が認識結果を認識結果記憶部43から取り込んで(ステップS601)、一定のエントリ形式の情報に変換してエントリ情報DB51に書き込み(ステップS602)、エントリ情報DB51の内容を更新する。   After this operation (operation) is repeated and character data of a desired item is obtained as an operator, when the operator taps an entry button (not shown) on the entry screen 70, the entry information writing unit 52 displays the recognition result. The data is taken from the recognition result storage unit 43 (step S601), converted into information of a certain entry format, written in the entry information DB 51 (step S602), and the contents of the entry information DB 51 are updated.

その後、一定時間が経過または一定量のデータがエントリ情報DB51に蓄積されると、エントリ情報送信部53がエントリ情報DB51の情報を外部システム8へ送信する(ステップS603)。なお時間の経過またはデータの量によらず、エントリ情報DB51の情報が更新された段階でエントリ情報DB51の情報を外部システム8へ順次送信してもよい。   Thereafter, when a certain time elapses or a certain amount of data is accumulated in the entry information DB 51, the entry information transmission unit 53 transmits the information in the entry information DB 51 to the external system 8 (step S603). Note that the information in the entry information DB 51 may be sequentially transmitted to the external system 8 when the information in the entry information DB 51 is updated regardless of the passage of time or the amount of data.

このように第1実施形態によれば、文字認識を行う帳票の読取情報(帳票定義)として、従来は認識対象の項目名とこの項目内容として入る文字データの属性情報と項目名に対応する読取対象のエリアの位置情報(座標)とを一々対応付けて手作業で定義する必要があったが、本実施形態では、項目名とこの項目内容として入る文字データの属性情報だけを事前に設定しておき、作業に時間を要する読取対象の文字のエリアの位置情報については帳票Aを実際に読み取る際にオペレータによるタップ操作またはスライド操作で指定するようにしたので、帳票Aを読み取るための事前の準備が容易になり、かつ帳票Aの情報のうち所望の箇所を選んで読み取ることができるようになる。また項目名と読取結果とで管理することで、一度読み取った項目については読み取らず、項目を重複することなく効率よく読み取ることができる。   As described above, according to the first embodiment, as the reading information (form definition) of a form for character recognition, conventionally, the item name to be recognized, the character data attribute information entered as the item content, and the reading corresponding to the item name are used. Although it was necessary to manually define the position information (coordinates) of the target area in association with each other, in this embodiment, only the item name and the attribute information of the character data to be entered as the item content are set in advance. In addition, since the position information of the area of the character to be read that requires work is specified by the tap operation or the slide operation by the operator when the form A is actually read, the advance information for reading the form A Preparation is facilitated, and a desired portion of the information on the form A can be selected and read. Further, by managing the item name and the reading result, it is possible to efficiently read without duplicating the item without reading the item once read.

(第2実施形態)
続いて、図14を参照して第2実施形態を説明する。なおこの第2実施形態において第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
図14に示すように、この第2実施形態の帳票読取システムは、訂正部46と訂正履歴DB47を備える。
(Second Embodiment)
Next, the second embodiment will be described with reference to FIG. In the second embodiment, the same components as those in the first embodiment are denoted by the same reference numerals and description thereof is omitted.
As shown in FIG. 14, the form reading system according to the second embodiment includes a correction unit 46 and a correction history DB 47.

訂正部46は以前と同じ読取エリアが指定された場合に訂正履歴DB47に保管されている訂正後の認識結果を読み出して、今回の認識結果として表示欄73に表示すると共に、認識結果記憶部43に記憶する。訂正履歴DB47には訂正部46により文字認識後に手入力などで訂正した認識結果、つまり訂正後の認識結果が記憶(保管)される。   When the same reading area as before is specified, the correction unit 46 reads the corrected recognition result stored in the correction history DB 47 and displays it in the display column 73 as the current recognition result, and the recognition result storage unit 43. To remember. The correction history DB 47 stores (stores) a recognition result corrected by manual input after character recognition by the correction unit 46, that is, a corrected recognition result.

訂正部46は表示欄73に表示された文字データが訂正された場合に、訂正された認識結果を訂正履歴DB47(メモリ5)に記憶する。訂正部46は文字認識の際に、以前と同じエリアが指定された場合、訂正履歴DB47(メモリ5)に記憶した認識結果の訂正履歴を参照して、訂正履歴から読み出した認識結果を文字認識部40の認識結果として表示欄73に表示させる。   When the character data displayed in the display column 73 is corrected, the correction unit 46 stores the corrected recognition result in the correction history DB 47 (memory 5). When the same area as before is designated at the time of character recognition, the correction unit 46 refers to the correction history of the recognition result stored in the correction history DB 47 (memory 5) and recognizes the recognition result read from the correction history. The recognition result of the unit 40 is displayed in the display field 73.

続いて、図15を参照してこの第2実施形態の動作を説明する。
この第2実施形態の場合、文字認識部40において、例えば「氏名」などのエントリ項目を選び、この項目に対応する読取エリアを指定し文字を認識し(図15のステップS701)、文字認識した結果の文字データとして例えば「○×大郎」が表示欄73に表示されたものとする。
Next, the operation of the second embodiment will be described with reference to FIG.
In the case of the second embodiment, the character recognition unit 40 selects an entry item such as “name”, designates a reading area corresponding to this item, recognizes the character (step S701 in FIG. 15), and recognizes the character. For example, it is assumed that “◯ × Daro” is displayed in the display field 73 as the character data of the result.

ここで、認識結果に誤読があった場合、手入力で「○×太郎」と訂正を行うと、訂正部46はエントリ項目の項目名「氏名」の認識結果(文字、文字種、座標など)を訂正後の「○×太郎」と対応付けて訂正履歴として訂正履歴DB47に保管する。   Here, if there is a misreading in the recognition result, and manually correct “○ × Taro”, the correction unit 46 displays the recognition result (character, character type, coordinates, etc.) of the item name “name” of the entry item. The correction history is stored in the correction history DB 47 as a correction history in association with the corrected “○ × Taro”.

これ以降、例えば申込人氏名などのエントリ項目の項目名が選ばれて、訂正を行ったのと同じ読取エリア(OCR認識対象エリア)が指定された場合(ステップS704)、訂正部46は訂正履歴DB47に保管されている訂正後の認識結果を読み出して、今回の認識結果として表示欄73に表示すると共に(ステップS705)、認識結果記憶部43に記憶する。   Thereafter, when the item name of the entry item such as the name of the applicant is selected and the same reading area (OCR recognition target area) as the one that has been corrected is designated (step S704), the correction unit 46 corrects the correction history. The corrected recognition result stored in the DB 47 is read out, displayed as the current recognition result in the display field 73 (step S705), and stored in the recognition result storage unit 43.

このようにこの第2実施形態によれば、文字認識した認識結果に誤読があった場合に認識結果を訂正部46にて訂正し認識結果の訂正履歴として訂正履歴DB47に保管しておき、前と同じ項目で新たな読取エリアが指定されたときに訂正履歴DB47に保管されている訂正後の認識結果「○×太郎」を読み出して今回の「申込人氏名」のエントリ項目の項目名に対する認識結果として表示欄73に「○×太郎」を表示することで、以前の訂正履歴が生かされ、手操作による訂正回数を削減することができ、オペレータへの作業負担の軽減と作業効率を向上することができる。   As described above, according to the second embodiment, when there is an error in the recognition result of character recognition, the recognition result is corrected by the correction unit 46 and stored in the correction history DB 47 as the correction history of the recognition result. When a new reading area is designated with the same item as the above, the corrected recognition result “○ × Taro” stored in the correction history DB 47 is read, and the item name of the entry item of the present “applicant name” is recognized. As a result, by displaying “○ × Taro” in the display field 73, the previous correction history can be utilized, the number of corrections by manual operation can be reduced, the work burden on the operator is reduced, and the work efficiency is improved. be able to.

(第3実施形態)
続いて、図16を参照して第3実施形態を説明する。なおこの第3実施形態において第1および第2実施形態と同じ構成には同一の符号を付しその説明は省略する。
図16に示すように、この第3実施形態は、タブレット端末1の画像取得部10の構成要素としてカメラ部2を持たない例である。
(Third embodiment)
Next, a third embodiment will be described with reference to FIG. In the third embodiment, the same components as those in the first and second embodiments are denoted by the same reference numerals, and the description thereof is omitted.
As shown in FIG. 16, the third embodiment is an example in which the camera unit 2 is not provided as a component of the image acquisition unit 10 of the tablet terminal 1.

この場合、タブレット端末1の外部にストレージ13を設けておき、帳票Aをデジタルカメラ2aやスキャナ9などの画像取得手段で事前に撮影して、得られた帳票画像71をストレージ13に保存しておく。ストレージ13としては、例えばハードディスク装置やフラッシュメモリなどの他、クラウドサービスなどのネットワークストレージを利用するものとする。   In this case, the storage 13 is provided outside the tablet terminal 1, the form A is captured in advance by image acquisition means such as the digital camera 2 a and the scanner 9, and the obtained form image 71 is stored in the storage 13. deep. As the storage 13, for example, a network storage such as a cloud service in addition to a hard disk device or a flash memory is used.

タブレット端末1を利用した文字読取操作を行うときに、タブレット端末1における画像取得の際に、帳票画像書込部11がネットワーク7または通信ケーブルなどを通じて外部のストレージ13にアクセスして処理対象の帳票画像71を取得し、帳票画像DB12に書き込む。以下の動作は第1および第2実施形態と同様である。   When performing a character reading operation using the tablet terminal 1, the form image writing unit 11 accesses the external storage 13 via the network 7 or a communication cable when acquiring an image in the tablet terminal 1, and forms a processing target. An image 71 is acquired and written in the form image DB 12. The following operations are the same as those in the first and second embodiments.

このようにこの第3実施形態によれば、カメラ機能のないタブレット端末1などでも、別の場所において帳票Aから得た帳票画像を用いて文字の読み取りを行うことができ、複数の人で作業を分担して行うことができる。   As described above, according to the third embodiment, a tablet terminal 1 or the like without a camera function can read characters using a form image obtained from the form A in another place, and can be operated by a plurality of people. Can be shared.

(第4実施形態)
続いて、図17、図18を参照して第4実施形態を説明する。なお、この第4実施形態において第1乃至第3実施形態と同じ構成には同一の符号を付しその説明は省略する。
(Fourth embodiment)
Subsequently, the fourth embodiment will be described with reference to FIGS. 17 and 18. In the fourth embodiment, the same components as those in the first to third embodiments are denoted by the same reference numerals, and the description thereof is omitted.

図17に示すように、この第4実施形態の帳票読取システムは、電子機器または携帯端末としてのタブレット端末1とこのタブレット端末1とネットワーク7を介して接続された外部システム8と、同じくネットワーク7を介して接続された外部文字認識システム82(例えばクラウドサービスとして存在するシステム)とを備える。   As shown in FIG. 17, the form reading system of the fourth embodiment includes a tablet terminal 1 as an electronic device or a portable terminal, an external system 8 connected to the tablet terminal 1 via a network 7, and a network 7 And an external character recognition system 82 (for example, a system that exists as a cloud service) connected via the Internet.

図18に示すように、タブレット端末1には、画像取得部10、画面制御部20、文字認識依頼部401、文字認識確定部402、エントリ情報更新部50を備え、タブレット端末1とネットワーク7を介して接続された外部文字認識システム82には、文字認識部811、エントリ項目定義体DB8141、文字種辞書DB8142、ベリファイ部8145を備えている。   As shown in FIG. 18, the tablet terminal 1 includes an image acquisition unit 10, a screen control unit 20, a character recognition request unit 401, a character recognition confirmation unit 402, and an entry information update unit 50. The tablet terminal 1 and the network 7 are connected to each other. The external character recognition system 82 connected via the interface includes a character recognition unit 811, an entry item definition DB 8141, a character type dictionary DB 8142, and a verify unit 8145.

文字認識依頼部401は、OCR対象帳票受付部23で指定された帳票画像と、OCR対象エントリ項目エリア受付部25で指定されたエントリ項目座標に基づき、帳票画像のうちの一部の画像を切り出す画像切出部4011と、この画像切出部4011により切り出された、切り出し画像データのファイル(以下「切り出し画像ファイル」と称す)と、OCR対象エントリ項目受付部24で指定されたエントリ項目の項目名とを、ネットワークなどに接続された外部文字認識システム81に文字認識を依頼する文字認識依頼送受信部4012とを有する。   The character recognition requesting unit 401 cuts out a part of the form image based on the form image specified by the OCR target form receiving unit 23 and the entry item coordinates specified by the OCR target entry item area receiving unit 25. Image cutout unit 4011, a cutout image data file cut out by the image cutout unit 4011 (hereinafter referred to as “cutout image file”), and entry item items designated by the OCR target entry item receiving unit 24 And a character recognition request transmission / reception unit 4012 that requests the external character recognition system 81 connected to a network or the like to perform character recognition.

続いて、図9乃至13、図19を参照してこの第4実施形態の帳票読取システムの動作を説明する。
まず図9を参照して画像取得部10の動作を説明する。この場合、帳票Aをカメラ部2が撮影し(ステップS201)、撮影された帳票画像71が帳票画像書込部11により帳票画像DB12へ書き込まれる(ステップS202)。
Next, the operation of the form reading system according to the fourth embodiment will be described with reference to FIGS. 9 to 13 and FIG.
First, the operation of the image acquisition unit 10 will be described with reference to FIG. In this case, the camera unit 2 captures the form A (step S201), and the captured form image 71 is written into the form image DB 12 by the form image writing unit 11 (step S202).

対象となる全ての帳票を撮影し終えると(ステップS203のYes)、処理を終了し、対象となる全ての帳票を撮影し終えていなければ(ステップS203のNo)、ステップS201に戻り、処理を繰り返す。   When all of the target forms have been photographed (Yes in step S203), the process ends. If all of the target forms have not been photographed (No in step S203), the process returns to step S201 to perform the process. repeat.

続いて、図10を参照して画面制御部20の動作を説明する。この場合、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、帳票画像読出部21は、帳票画像DB12に蓄積されている一つ以上の帳票画像71を読み出し(ステップS301)、タッチパネル3のエントリ画面70に帳票画像71のサムネイル一覧を表示する(ステップS302)。   Next, the operation of the screen control unit 20 will be described with reference to FIG. In this case, when the operator taps a form image reading button (not shown) on the entry screen 70, the form image reading unit 21 reads one or more form images 71 stored in the form image DB 12 (step S301). The thumbnail list of the form image 71 is displayed on the entry screen 70 of the touch panel 3 (step S302).

ここで、オペレータがエントリ画面70のサムネイル一覧の中から所望のサムネイルを選んで、タッチパネル3をタップ操作(サムネイルを指定)すると、OCR対象帳票受付部23はサムネイルの指定を受け付け(ステップS303)、指定されたサムネイルに対応する帳票画像71をOCR対象として確定し(ステップS304)、エントリ画面70ほぼ全体に操作用として表示する(図7参照)。   Here, when the operator selects a desired thumbnail from the thumbnail list on the entry screen 70 and taps the touch panel 3 (designates a thumbnail), the OCR target form accepting unit 23 accepts the designation of the thumbnail (step S303), The form image 71 corresponding to the designated thumbnail is determined as an OCR target (step S304), and displayed for operation on almost the entire entry screen 70 (see FIG. 7).

続いて、オペレータがエントリ画面70の項目名のチェックボックス72を選び、指でタップしてエントリ項目の項目名を指定すると、OCR対象エントリ項目受付部24はOCR対象のエントリ項目の項目名の指定を受け付ける(ステップS305)。   Subsequently, when the operator selects the item name check box 72 on the entry screen 70 and taps it with his / her finger to specify the item name of the entry item, the OCR target entry item receiving unit 24 specifies the item name of the OCR target entry item. Is accepted (step S305).

ここで、オペレータが、図11に示すように、指でタッチパネル3(エントリ画面70)の帳票画像71のOCR箇所をタップして読取エリア(の開始点)をポイントで指定すると、OCR対象エントリ項目エリア受付部25は、そのポイントされた位置を受け付け、その位置から一定の方向(水平方向)にある文字画像を囲む枠線80を表示する(ステップS306)。   Here, as shown in FIG. 11, when the operator taps the OCR portion of the form image 71 on the touch panel 3 (entry screen 70) with a finger and designates the reading area (starting point) with a point, the entry item for OCR The area receiving unit 25 receives the pointed position, and displays a frame line 80 surrounding the character image in a certain direction (horizontal direction) from the position (step S306).

続いて、図19を参照して文字認識依頼部401、文字認識確定部402の動作を説明する。   Next, operations of the character recognition request unit 401 and the character recognition confirmation unit 402 will be described with reference to FIG.

文字認識依頼部401の画像切出部4011は、枠線80で特定された読取エリアの座標に基づいて帳票画像71から文字画像を切り出して、切り出し画像ファイルとする(ステップS5001)。文字認識依頼送受信部4012は、この切り出し画像ファイルとOCR対象エントリ項目受付部24で受け付けたエントリ項目の項目名とを、外部文字認識システム81にネットワークを介して送信し、文字認識を依頼する(ステップS5002)。   The image cutout unit 4011 of the character recognition requesting unit 401 cuts out a character image from the form image 71 based on the coordinates of the reading area specified by the frame line 80 and creates a cutout image file (step S5001). The character recognition request transmitting / receiving unit 4012 transmits the cut image file and the item name of the entry item received by the OCR target entry item receiving unit 24 to the external character recognition system 81 via the network, and requests character recognition ( Step S5002).

外部文字認識システム81は、タブレット端末1から受信した切り出し画像ファイルを、文字認識部811にて文字認識し、認識結果文字データを対象のエントリ項目の項目名と対応させ、エントリ項目定義体DB8141からエントリ項目定義体の対応する項目名(例えば氏名)の定義情報1(文字種、例えば漢字)、定義情報2(文字数、例えば20)と、文字種辞書DB8142から文字種の辞書を読み出して、これらの情報を参照して文字認識結果を確定し(ステップS5004)、確定した認識結果をベリファイ処理する(ステップS5005)。ベリファイ処理後にネットワークを介して、エントリ項目名と文字データをタブレット端末1の文字認識依頼送受信部4012に送信する(ステップS5006)。   The external character recognition system 81 recognizes the cut-out image file received from the tablet terminal 1 with the character recognition unit 811, associates the recognition result character data with the item name of the target entry item, and enters the entry item definition body DB 8141. Read the dictionary of the character type from the definition information 1 (character type, for example, kanji), definition information 2 (number of characters, for example, 20) of the corresponding item name (for example, name) of the entry item definition body, and the character type dictionary DB 8142, The character recognition result is confirmed with reference (step S5004), and the confirmed recognition result is verified (step S5005). After the verify process, the entry item name and the character data are transmitted to the character recognition request transmission / reception unit 4012 of the tablet terminal 1 via the network (step S5006).

文字認識確定部402のエントリ項目内容生成部4021は、受信した認識結果文字データとエントリ項目の項目名とを、対応させて生成し確定するとともに(ステップS5007)、認識結果の文字データをエントリ項目に対応する表示欄73に表示する。   The entry item content generation unit 4021 of the character recognition determination unit 402 generates and determines the received recognition result character data and the item name of the entry item in association with each other (step S5007), and the character data of the recognition result as the entry item. Is displayed in the display field 73 corresponding to

なお、エントリ情報更新部の処理以降については、第1実施形態で説明したとおりであり、その説明は省略する。   Note that the processing after the entry information update unit is as described in the first embodiment, and a description thereof will be omitted.

このように第4実施形態によれば、文字認識をタブレット端末1外であって、例えばクラウドサービス上に存在する文字認識システムで構成することにより、負荷がかかる文字認識処理は外部の文字認識システムにて行い、タブレット端末1内の処理をより軽く実現することができる。   As described above, according to the fourth embodiment, character recognition is performed by an external character recognition system by configuring character recognition outside the tablet terminal 1, for example, with a character recognition system existing on the cloud service. The processing in the tablet terminal 1 can be realized more lightly.

本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上記新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although the embodiment of the present invention has been described, the above embodiment is presented as an example, and is not intended to limit the scope of the invention. The novel embodiment can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. The above-described embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and equivalents thereof.

上記実施形態では、読取エリアの指定を1カ所ポイントすることで実現したが、この他、例えば図20に示すように、タブレット端末1のタッチ操作機能の一つであるスライド操作の機能を利用して、読取エリアの始点と終点を連続した指の移動で指定することで始点と終点で挟まれた範囲の文字画像を囲む枠線80を表示して読取エリアを指定してもよい。   In the above embodiment, the reading area is specified by pointing at one point. However, as shown in FIG. 20, for example, a slide operation function which is one of touch operation functions of the tablet terminal 1 is used. Then, by designating the start point and end point of the reading area by successive finger movements, the reading area may be specified by displaying a frame line 80 surrounding the character image in the range between the start point and the end point.

この場合、読取エリアが規定のサイズを超えるような場合に第1実施形態(図11)のような自動エリア指定に比べてエリアの指定の間違いが少なくなるという利点がある。   In this case, when the reading area exceeds a prescribed size, there is an advantage that the area designation error is reduced compared to the automatic area designation as in the first embodiment (FIG. 11).

この他、例えば文字画像の周囲をなぞるように指をスライド操作して範囲を指定してもよい。   In addition, for example, the range may be specified by sliding the finger so as to trace the periphery of the character image.

この他、上記実施形態では、オペレータがエントリ画面70で、エントリ項目の項目名を指定した後に、文字認識対象エリアを特定するという順番で説明したが、文字認識対象エリアを特定してから、エントリ項目の項目名を指定するという順番で構成してもよい。   In addition, in the above-described embodiment, the description has been given in the order of specifying the character recognition target area after the operator specifies the item name of the entry item on the entry screen 70. You may comprise in the order of specifying the item name of an item.

また上記実施形態では、表示機能と入力機能を一体化したタッチパネル3を有するタブレット端末1を例にして説明したが、この他、例えば表示機能と入力機能を別個に備えたノート形コンピュータや、LCDパネルなどの表示装置とキーボードなどの入力装置とを別個に用意し外部接続したコンピュータや、キーボード、マウス、ポインティングデバイスなどの入力装置を備え、表示装置のみを外部接続した構成のコンピュータまたは表示装置を備え入力装置のみを外部接続した構成のコンピュータであってもよい。   In the above embodiment, the tablet terminal 1 having the touch panel 3 in which the display function and the input function are integrated has been described as an example. However, in addition to this, for example, a notebook computer having a separate display function and an input function, an LCD A computer or display device having a configuration in which a display device such as a panel and an input device such as a keyboard are separately prepared and connected externally, or an input device such as a keyboard, mouse, and pointing device is provided and only the display device is externally connected It may be a computer having a configuration in which only the input device is externally connected.

さらに上記実施形態では、各構成要素を、タブレット(コンピュータ)のメモリなどにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM,DVD−ROMなどの記録媒体やフラッシュメモリ、リムーバブルメディア:Removable mediaなどが含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。   Further, in the above embodiment, each component is realized by a program installed in a memory of a tablet (computer). However, the above program is stored in a computer-readable electronic medium: electronic media, and the program is stored in the electronic medium. The computer may realize the functions of the present invention by causing the computer to read the information. Examples of the electronic medium include recording media such as CD-ROM and DVD-ROM, flash memory, removable media, and the like. Further, the configuration may be realized by distributing and storing components in different computers connected via a network, and communicating between computers in which the components are functioning.

上記実施形態では、帳票画像の取得機能から文字認識および訂正機能、外部システム8へのエントリ機能などをタブレット端末1に収容した例と、文字認識機能を外部文字認識システム81で実現する例を説明したが、タブレット端末1は、帳票画像の取得機能を収容し、その他の機能(画像処理、画像切り出し、文字認識)を外部文字認識システム81で実現してもよい。また、一部の機能、例えば訂正機能などを外部システム(クラウドサービスなど)で実現してもよい。   In the above embodiment, an example in which the form image acquisition function to the character recognition and correction function, the entry function to the external system 8 and the like are accommodated in the tablet terminal 1 and the example in which the character recognition function is realized by the external character recognition system 81 will be described. However, the tablet terminal 1 may accommodate a form image acquisition function and realize other functions (image processing, image segmentation, character recognition) with the external character recognition system 81. Also, some functions, such as a correction function, may be realized by an external system (such as a cloud service).

さらにタブレット端末1にカメラ部2とタッチパネル3とWebブラウザ(通信インターフェース)の機能だけを搭載し、他の機能を外部システム8(クラウドサービスなど)で実現してもよい。   Further, only the functions of the camera unit 2, the touch panel 3, and the web browser (communication interface) may be mounted on the tablet terminal 1, and other functions may be realized by the external system 8 (cloud service or the like).

A…帳票、1…タブレット端末、2…カメラ部、3…タッチパネル、5…メモリ、6…通信インターフェース(通信I/F)、7…ネットワーク、8…外部システム、9…スキャナ、10…画像取得部、11…帳票画像書込部、12…帳票画像データベース(帳票画像DB)、13…ストレージ、20…画面制御部、21…帳票画像読出部、22…画面生成部、23…OCR対象帳票受付部、24…OCR対象エントリ項目受付部、25…OCR対象エントリ項目エリア受付部、40…文字認識部、43…認識結果記憶部、44…OCRエンジン、45…ベリファイ部、46…訂正部、50…エントリ情報更新部、52…エントリ情報書込部、53…エントリ情報送信部、41…エントリ項目定義体データベース(エントリ項目定義体DB)、42…文字種辞書データベース(文字種辞書DB)、47…訂正履歴データベース(訂正履歴DB)、51…エントリ情報データベース(エントリ情報DB)、81…外部文字認識システム、401…文字認識依頼部、402…文字認識確定部、811…文字認識部、8141…エントリ項目定義体データベース(エントリ項目定義体DB)、8142…文字種辞書データベース(文字種辞書DB)、8145…ベリファイ部、4011…画像切出部、4012…文字認識依頼送受信部、4021…エントリ項目内容生成部、4022…エントリ項目データベース(エントリ項目DB)。   A ... Form, 1 ... Tablet terminal, 2 ... Camera unit, 3 ... Touch panel, 5 ... Memory, 6 ... Communication interface (communication I / F), 7 ... Network, 8 ... External system, 9 ... Scanner, 10 ... Image acquisition , 11 ... Form image writing part, 12 ... Form image database (form image DB), 13 ... Storage, 20 ... Screen control part, 21 ... Form image reading part, 22 ... Screen generation part, 23 ... OCR target form reception , 24... OCR target entry item receiving unit, 25... OCR target entry item area receiving unit, 40... Character recognition unit, 43... Recognition result storage unit, 44. Entry information update unit 52 Entry information writing unit 53 Entry information transmission unit 41 Entry item definition database (entry item definition DB) 42 ... Character type dictionary database (character type dictionary DB), 47 ... Correction history database (correction history DB), 51 ... Entry information database (entry information DB), 81 ... External character recognition system, 401 ... Character recognition request unit, 402 ... Character Recognition confirmation unit, 811 ... Character recognition unit, 8141 ... Entry item definition database (entry item definition database), 8142 ... Character type dictionary database (character type dictionary DB), 8145 ... Verification unit, 4011 ... Image cropping unit, 4012 ... Character recognition request transmission / reception unit, 4021 ... entry item content generation unit, 4022 ... entry item database (entry item DB).

Claims (13)

帳票を光学的に読み取って得られた帳票の画像から文字を読み取る帳票読取装置において、
前記帳票の画像とこの帳票の画像から読み取るべき文字データの項目名とこの項目名に対応する認識結果文字データとを表示する表示欄を有する画面を出力する画面制御部と、
前記画面への入力操作により、所望の項目名とこの項目名に対応する読取対象のエリアが指定された場合、指定された前記エリアの画像部分を文字認識し、得られた認識結果文字データを前記項目名と対応づけて記憶すると共に、前記認識結果文字データを前記認識結果文字データの表示欄に表示する文字認識部と
を備える文字読取装置。
In the form reading device that reads characters from the form image obtained by optically reading the form,
A screen control unit for outputting a screen having a display field for displaying the image of the form, the item name of the character data to be read from the image of the form, and the recognition result character data corresponding to the item name;
When a desired item name and an area to be read corresponding to the item name are designated by the input operation on the screen, the image portion of the designated area is recognized as characters, and the obtained recognition result character data is obtained. A character reading apparatus comprising: a character recognition unit that stores the item name in association with the item name and displays the recognition result character data in a display column of the recognition result character data.
前記画面を表示すると共に、前記画面へ触れて入力操作が可能なタッチパネルを備える請求項1記載の帳票読取装置。   The form reading apparatus according to claim 1, further comprising a touch panel that displays the screen and enables an input operation by touching the screen. 前記文字認識部は、
文字認識した結果として得られた文字データと項目名の情報とエリアの位置情報とを対応付けて記憶する請求項1記載の帳票読取装置。
The character recognition unit
The form reading apparatus according to claim 1, wherein character data obtained as a result of character recognition, item name information, and area position information are stored in association with each other.
前記表示欄に表示された文字データが訂正された場合に、訂正された認識結果文字データを記憶する訂正部を備える請求項1記載の帳票読取装置。   The form reading apparatus according to claim 1, further comprising: a correction unit that stores the corrected recognition result character data when the character data displayed in the display field is corrected. 前記訂正部は、
文字認識の際に、以前と同じエリアが指定された場合、前記記憶した認識結果の履歴を参照して、前記履歴から読み出した認識結果文字データを前記表示欄に表示させる請求項1記載の帳票読取装置。
The correction unit is
2. The form according to claim 1, wherein, when the same area as before is designated during character recognition, the stored recognition result history is referred to and the recognition result character data read from the history is displayed in the display field. Reader.
前記文字認識部は、
文字認識した結果として得られた文字データの文字種および/または文字数を、予め設定された項目名毎の文字種および/または文字数と比較し、不一致の場合、アラートを出力するベリファイ部を備える請求項1記載の帳票読取装置。
The character recognition unit
2. A verify unit that compares the character type and / or number of characters of character data obtained as a result of character recognition with a character type and / or number of characters for each item name set in advance, and outputs an alert if they do not match. The form reading device described.
前記画面制御部は、
前記帳票の画像の所望の位置が入力操作により指定されることで、前記位置に存在する文字画像を囲む領域画像を認識対象のエリアとする請求項1記載の帳票読取装置。
The screen control unit
The form reading apparatus according to claim 1, wherein a region image surrounding a character image existing at the position is set as a recognition target area by designating a desired position of the image of the form by an input operation.
前記画面制御部は、
前記帳票の画像の指定された始点と終点に基づき認識対象のエリアを特定する請求項1記載の帳票読取装置。
The screen control unit
The form reading device according to claim 1, wherein an area to be recognized is specified based on a designated start point and end point of the form image.
前記帳票を光学的に読み取って帳票の画像を得るカメラ部と、
前記カメラ部により得られた帳票の画像を記憶する帳票画像記憶部と、
前記帳票画像記憶部に記憶されている帳票の画像を読み出して前記画面に出力する帳票画像読出部と
を備える請求項1記載の帳票読取装置。
A camera unit for optically reading the form to obtain an image of the form;
A form image storage unit for storing an image of the form obtained by the camera unit;
The form reading apparatus according to claim 1, further comprising: a form image reading unit that reads out an image of the form stored in the form image storage unit and outputs the image to the screen.
帳票を光学的に読み取って得られた帳票の画像から文字データを読み取る帳票読取装置において、
前記帳票の画像と前記帳票の画像から読み取るべき文字の項目名とこの項目名に対応する認識結果文字データとを表示する表示欄とを有する画面を出力する画面制御部と、
前記画面への入力操作により、所望の項目名とこの項目名に対応する読取対象のエリアが指定された場合、指定された前記エリアの画像情報を外部文字認識システムに送信し文字認識を依頼して前記外部システムから得られた認識結果文字データを前記認識結果文字データの表示欄に表示する文字認識依頼部と
を備える文字読取装置。
In a form reading device that reads character data from a form image obtained by optically reading a form,
A screen control unit for outputting a screen having a display field for displaying an image of the form, an item name of characters to be read from the image of the form, and recognition result character data corresponding to the item name;
When a desired item name and an area to be read corresponding to the item name are designated by an input operation on the screen, image information of the designated area is transmitted to an external character recognition system to request character recognition. And a character recognition requesting unit for displaying the recognition result character data obtained from the external system in a display column for the recognition result character data.
帳票を光学的に読み取って得られた前記帳票の画像から文字を読み取るコンピュータにおいて、
前記コンピュータを、
前記帳票の画像と前記帳票の画像から読み取るべき文字の項目名とこの項目名に対応する認識結果文字データとを表示する表示欄を有する画面を出力する画面制御部と、
前記入力部による前記画面への入力操作により、所望の項目名とこの項目名に対応する読取対象のエリアが指定された場合、指定された前記エリアの画像部分を文字認識し、得られた認識結果文字データを前記項目名と対応づけて記憶すると共に、前記認識結果文字データを前記認識結果文字データの表示欄に表示する文字認識部
として機能させるプログラム。
In a computer that reads characters from the image of the form obtained by optically reading the form,
The computer,
A screen controller for outputting a screen having a display field for displaying the image of the form, the item name of the character to be read from the image of the form, and the recognition result character data corresponding to the item name;
When a desired item name and an area to be read corresponding to the item name are designated by an input operation on the screen by the input unit, the image portion of the designated area is character-recognized and obtained recognition A program that stores result character data in association with the item name and that functions as a character recognition unit that displays the recognition result character data in a display field of the recognition result character data.
端末装置と、文字認識装置とをネットワークで接続した帳票読取システムであって、
前記端末装置は、
帳票画像を取得する画像取得部と、
この画像取得部にて取得した帳票画像に対し文字認識対象となる項目名を特定する文字認識対象項目受付部と、
この特定された項目名に対応する前記帳票画像の文字認識エリアを特定する対象項目エリア情報受付部と、
対象となる項目名情報を特定する対象エントリ項目受付部と、
前記対象項目エリア情報受付部にて特定された文字認識エリアの画像を切り出す画像切り出し部と、
この画像切り出し部にて切り出された画像ファイルと、前記対象エントリ項目受付部にて特定された項目名とを前記文字認識装置に送信し、文字認識依頼する文字認識依頼送受信部と、
前記文字認識装置から受信した認識結果文字データを前記項目内容文字データとして確定する文字認識確定部とを有し、
前記文字認識装置は、
前記端末装置から送信された画像ファイルを文字認識して認識結果文字データとして前記項目名とともに前記端末装置に送信する文字認識部と
を備える帳票読取システム。
A form reading system in which a terminal device and a character recognition device are connected via a network,
The terminal device
An image acquisition unit for acquiring a form image;
A character recognition target item receiving unit for specifying an item name to be a character recognition target for the form image acquired by the image acquisition unit;
A target item area information receiving unit for specifying a character recognition area of the form image corresponding to the specified item name;
A target entry item receiving unit for specifying target item name information;
An image cutout unit that cuts out an image of the character recognition area specified by the target item area information reception unit;
A character recognition request transmission / reception unit that transmits the image file cut out by the image cutout unit and the item name specified by the target entry item reception unit to the character recognition device, and requests character recognition;
A character recognition confirmation unit for confirming the recognition result character data received from the character recognition device as the item content character data;
The character recognition device includes:
A form reading system comprising: a character recognition unit that character-recognizes an image file transmitted from the terminal device and transmits the recognition result character data to the terminal device together with the item name.
前記端末装置と、前記文字認識装置と、さらに外部システムとをネットワークで接続し、
前記端末装置は、
前記特定された項目名と、前記文字認識確定部で確定した前記項目名に対応する項目内容文字データとを対応付けて保存するエントリ情報データベースと、
このエントリ情報データベースの情報を前記外部システムに送信するエントリ情報送信部と
を備える請求項12記載の帳票読取システム。
Connecting the terminal device, the character recognition device, and an external system via a network;
The terminal device
An entry information database for storing the identified item name and the item content character data corresponding to the item name determined by the character recognition determination unit in association with each other;
The form reading system according to claim 12, further comprising an entry information transmitting unit that transmits information in the entry information database to the external system.
JP2013230736A 2013-11-06 2013-11-06 Form reading device, program, and form reading system Active JP6230878B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013230736A JP6230878B2 (en) 2013-11-06 2013-11-06 Form reading device, program, and form reading system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013230736A JP6230878B2 (en) 2013-11-06 2013-11-06 Form reading device, program, and form reading system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017181269A Division JP2017220266A (en) 2017-09-21 2017-09-21 Document reading device, program and document reading method

Publications (2)

Publication Number Publication Date
JP2015090623A true JP2015090623A (en) 2015-05-11
JP6230878B2 JP6230878B2 (en) 2017-11-15

Family

ID=53194106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013230736A Active JP6230878B2 (en) 2013-11-06 2013-11-06 Form reading device, program, and form reading system

Country Status (1)

Country Link
JP (1) JP6230878B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018037036A (en) * 2016-09-02 2018-03-08 株式会社東芝 Ledger sheet reader, ledger sheet reading method, program and ledger sheet reading system
JP2018124705A (en) * 2017-01-31 2018-08-09 日本Ics株式会社 Voucher management program
CN110390323A (en) * 2018-04-18 2019-10-29 富士施乐株式会社 Information processing unit and computer-readable medium
JP2021002287A (en) * 2019-06-24 2021-01-07 富士ゼロックス株式会社 Information processor and information processing program
JP2022013441A (en) * 2020-07-03 2022-01-18 株式会社リゾーム Notification method and notification system for specific numerical values from shops

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01270184A (en) * 1988-04-21 1989-10-27 Toshiba Corp Character reader for document
JPH03214281A (en) * 1990-01-19 1991-09-19 Sony Corp Character recognizing device
JPH07334624A (en) * 1994-06-07 1995-12-22 Matsushita Electric Ind Co Ltd Character recognizing device
JPH08221558A (en) * 1995-02-17 1996-08-30 Mitsubishi Electric Corp Method and device for filing document
JPH09114921A (en) * 1995-10-18 1997-05-02 Sharp Corp Character recognizing device
JP2003303316A (en) * 2002-04-10 2003-10-24 Ricoh Co Ltd Apparatus, dictionary and program for recognizing character
JP2013196479A (en) * 2012-03-21 2013-09-30 Toshiba Corp Information processing system, information processing program, and information processing method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01270184A (en) * 1988-04-21 1989-10-27 Toshiba Corp Character reader for document
JPH03214281A (en) * 1990-01-19 1991-09-19 Sony Corp Character recognizing device
JPH07334624A (en) * 1994-06-07 1995-12-22 Matsushita Electric Ind Co Ltd Character recognizing device
JPH08221558A (en) * 1995-02-17 1996-08-30 Mitsubishi Electric Corp Method and device for filing document
JPH09114921A (en) * 1995-10-18 1997-05-02 Sharp Corp Character recognizing device
JP2003303316A (en) * 2002-04-10 2003-10-24 Ricoh Co Ltd Apparatus, dictionary and program for recognizing character
JP2013196479A (en) * 2012-03-21 2013-09-30 Toshiba Corp Information processing system, information processing program, and information processing method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018037036A (en) * 2016-09-02 2018-03-08 株式会社東芝 Ledger sheet reader, ledger sheet reading method, program and ledger sheet reading system
JP2018124705A (en) * 2017-01-31 2018-08-09 日本Ics株式会社 Voucher management program
CN110390323A (en) * 2018-04-18 2019-10-29 富士施乐株式会社 Information processing unit and computer-readable medium
CN110390323B (en) * 2018-04-18 2023-09-05 富士胶片商业创新有限公司 Information processing apparatus and computer readable medium
JP2021002287A (en) * 2019-06-24 2021-01-07 富士ゼロックス株式会社 Information processor and information processing program
JP7298330B2 (en) 2019-06-24 2023-06-27 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program
JP2022013441A (en) * 2020-07-03 2022-01-18 株式会社リゾーム Notification method and notification system for specific numerical values from shops

Also Published As

Publication number Publication date
JP6230878B2 (en) 2017-11-15

Similar Documents

Publication Publication Date Title
US9785627B2 (en) Automated form fill-in via form retrieval
KR101955732B1 (en) Associating captured image data with a spreadsheet
JP6230878B2 (en) Form reading device, program, and form reading system
WO2013004036A1 (en) Business card recognition method combining character recognition and image matching
JP2016143165A (en) Information processing apparatus, method, and program
US10423825B2 (en) Retrieval device, retrieval method, and computer-readable storage medium for computer program
US10084936B2 (en) Display system including an image forming apparatus and a display apparatus
US9767388B2 (en) Method and system for verification by reading
US9681016B2 (en) Methods and systems for capturing, sharing, and printing annotations
US9934212B2 (en) Methods and systems for capturing, sharing, and printing annotations
JP6253354B2 (en) Form reading device, program, and form reading system
JP2017151913A (en) Pdf file management system, pdf file management server, pdf file data acquiring server, pdf file management method, pdf file data acquiring method, pdf file management program, and pdf file data acquiring program
JP2017220266A (en) Document reading device, program and document reading method
US20150039643A1 (en) System for storing and searching image files, and cloud server
JP6917688B2 (en) Form reader, form reading method, program, and form reading system
KR20100124952A (en) Ar contents providing system and method providing a portable terminal real-time by using letter recognition
US10165149B2 (en) Methods and systems for automatically generating a name for an electronic document
CN106919546A (en) A kind of document auxiliary establishing method and system
JP6397084B2 (en) User information input support system
JP2017228081A (en) User information input assistance system
KR101659886B1 (en) business card ordering system and method
JP2018206423A (en) User information input assistance system
US20130254354A1 (en) Electronic information terminal and electronic information system
JP2020170273A (en) Character recognition system, character recognition server program and character recognition client program
JP5804430B2 (en) Book information processing apparatus, book information processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170921

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171018

R150 Certificate of patent or registration of utility model

Ref document number: 6230878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150