JP2015090625A - Document reading device, program and document reading system - Google Patents

Document reading device, program and document reading system Download PDF

Info

Publication number
JP2015090625A
JP2015090625A JP2013230738A JP2013230738A JP2015090625A JP 2015090625 A JP2015090625 A JP 2015090625A JP 2013230738 A JP2013230738 A JP 2013230738A JP 2013230738 A JP2013230738 A JP 2013230738A JP 2015090625 A JP2015090625 A JP 2015090625A
Authority
JP
Japan
Prior art keywords
recognition
character
character data
result
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013230738A
Other languages
Japanese (ja)
Other versions
JP6253354B2 (en
Inventor
麻衣 北村
Mai Kitamura
麻衣 北村
信輔 櫻木
Shinsuke Sakuragi
信輔 櫻木
石川 幸弘
Yukihiro Ishikawa
幸弘 石川
義正 岩田
Yoshimasa Iwata
義正 岩田
明弘 宇田
Akihiro Uda
明弘 宇田
康裕 中島
Yasuhiro Nakajima
康裕 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2013230738A priority Critical patent/JP6253354B2/en
Publication of JP2015090625A publication Critical patent/JP2015090625A/en
Application granted granted Critical
Publication of JP6253354B2 publication Critical patent/JP6253354B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a document reading device which can contribute to improving character recognition accuracy while reducing a work load on an operator by decreasing a ratio of erroneous reading and un-reading to all reading regardless of a state of a document image, and further to provide a program.SOLUTION: A document reading device reads characters from an image of a document obtained by optically reading the document. The document reading device comprises a screen control section, a character recognition section, a recognition history storage section and a recognition control section. The screen control section displays a screen having display columns where the image of the document and the characters obtained as a result of character recognition. The character recognition section performs character recognition of a specified area of the image of the document. A character recognition result is stored as a recognition history in the recognition history storage section. The recognition control section searches for characters corresponding to the characters recognized in terms of characters by the character recognition section and character data candidates of recognition results having degrees of similarity equal to a predetermined value or more from the recognition history storage section and displays them in the display columns and in the vicinity thereof.

Description

本発明の実施形態は、帳票の画像から文字を読み取る帳票読取装置、プログラムおよび帳票読取システムに関する。   Embodiments described herein relate generally to a form reading apparatus, a program, and a form reading system that read characters from a form image.

例えばコンピュータなどの帳票読取装置では、デジタルカメラなどの光学式の読取装置で取得した帳票の画像(デジタル写真など)を、文字認識アプリケーションソフトウェア(以下「OCRソフト」と称す)を利用して文字認識する技術が知られている。   For example, in a form reading device such as a computer, a form image (digital photograph, etc.) obtained by an optical reading device such as a digital camera is used for character recognition using character recognition application software (hereinafter referred to as “OCR software”). The technology to do is known.

文字認識には誤読や未読(読み取り不可能)などの事象が生じる可能性があることから、帳票読取装置のグラフィック・ユーザ・インターフェース画面(以下「GUI画面」と称す)には文字認識の結果の文字データをオペレータがチェックおよび修正するための表示欄が設けられており、オペレータが文字認識の結果の正否をチェックするようにしている。   Since character recognition may cause misreading and unread (unreadable) events, the graphic user interface screen (hereinafter referred to as “GUI screen”) of the form reading device shows the result of character recognition. A display field for the operator to check and correct the character data is provided so that the operator can check the correctness of the result of character recognition.

そして、文字認識の結果の文字が正しくない場合、つまり文字の誤読や未読が生じていた場合、表示欄に表示されている文字データをキー入力で直接修正した後、確定操作を行うことで初めて文字認識の結果がエントリ情報として保存される。   And, if the character as a result of character recognition is not correct, that is, if the character is misread or unread, the character data displayed in the display field is directly corrected by key input, and the confirmation operation is performed for the first time. The result of character recognition is stored as entry information.

特開2005−216102号公報JP-A-2005-216102

ところで、光学的に読み取った帳票の画像は常に良い状態であるとは限らず、不鮮明の状態のときもある。このような場合、文字認識の結果が誤読や未読となる割合が多く、帳票の読取項目数が多いほど、誤読や未読を訂正するオペレータへの作業負担が大きくなる。   By the way, the image of the optically read form is not always in a good state and sometimes in a blurred state. In such a case, the rate at which the result of character recognition is misread or unread increases, and the greater the number of read items in the form, the greater the work load on the operator who corrects misread or unread.

本発明が解決しようとする課題は、帳票画像の状態によらず誤読や未読となる割合を少なくしてオペレータへの作業負担を軽減すると共に、文字認識精度の向上に寄与できる帳票読取装置、プログラムおよび帳票読取システムを提供することにある。   The problem to be solved by the present invention is to reduce the rate of misread or unread regardless of the state of the form image, thereby reducing the work burden on the operator and contributing to improving the character recognition accuracy. And providing a form reading system.

実施形態の帳票読取装置は、帳票を光学的に読み取って得られた帳票の画像から文字を読み取る帳票読取装置であって、画面制御部、認識履歴記憶部、認識制御部を備える。画面制御部は帳票の画像と画像から文字認識した結果の文字データとが表示される表示欄を有する画面を表示する。文字認識部は帳票の画像の指定されたエリアの画像部分を文字認識する。認識履歴記憶部には文字認識の結果が認識履歴として記憶されている。認識制御部は文字認識部により文字認識された文字データと一致する文字および類似度が一定値以上の認識結果の文字データ候補を認識履歴記憶部より検索し、表示欄および表示欄近傍に表示する。   The form reading apparatus according to the embodiment is a form reading apparatus that reads characters from a form image obtained by optically reading a form, and includes a screen control unit, a recognition history storage unit, and a recognition control unit. The screen control unit displays a screen having a display field for displaying a form image and character data obtained as a result of character recognition from the image. The character recognition unit recognizes the image portion of the designated area of the form image. The recognition history storage unit stores character recognition results as a recognition history. The recognition control unit searches the recognition history storage unit for characters that match the character data recognized by the character recognition unit and the recognition result character data candidates whose similarity is equal to or greater than a certain value, and displays them in the display field and the vicinity of the display field. .

第1実施形態の帳票読取システムの構成を示す図である。It is a figure which shows the structure of the form reading system of 1st Embodiment. 帳票読取システムのタブレットの構成を示す図である。It is a figure which shows the structure of the tablet of a form reading system. 帳票画像DBの内容を示す図である。It is a figure which shows the content of form image DB. 認識履歴DBの内容を示す図である。It is a figure which shows the content of recognition log | history DB. 帳票定義体DBの内容を示す図である。It is a figure which shows the content of the form definition body DB. 文字種辞書DBの内容を示す図である。It is a figure which shows the content of character type dictionary DB. エントリ情報DBの内容を示す図である。It is a figure which shows the content of entry information DB. 帳票画像を表示したエントリ画面の一例を示す図である。It is a figure which shows an example of the entry screen which displayed the form image. 第1実施形態の帳票読取システムの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the form reading system of 1st Embodiment. 帳票画像を正常に文字認識した結果の表示例を示す図である。It is a figure which shows the example of a display of the result of having normally recognized the form image. 以前の認識結果(履歴情報)が認識履歴DBに含まれる場合の表示例を示す図である。It is a figure which shows the example of a display when a previous recognition result (history information) is contained in recognition history DB. エントリ画面に対してオペレータが操作する様子を示す図である。It is a figure which shows a mode that an operator operates with respect to an entry screen. 認識履歴DBの内容を示す図である。It is a figure which shows the content of recognition log | history DB. 第3実施形態の動作を示す図である。It is a figure which shows operation | movement of 3rd Embodiment. 第5実施形態における認識履歴DBの内容を示す図である。It is a figure which shows the content of recognition log | history DB in 5th Embodiment. 第6実施形態における認識履歴DBの内容を示す図である。It is a figure which shows the content of recognition log | history DB in 6th Embodiment. 第7実施形態の帳票読取システムの構成を示す図である。It is a figure which shows the structure of the form reading system of 7th Embodiment. 第7実施形態の帳票読取システムのタブレットの構成を示す図である。It is a figure which shows the structure of the tablet of the form reading system of 7th Embodiment. 第7実施形態の帳票読取システムの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the form reading system of 7th Embodiment.

以下、図面を参照して実施形態を詳細に説明する。図1は第1実施形態の帳票読取システムの構成を示すブロック図である。   Hereinafter, embodiments will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a form reading system according to the first embodiment.

(第1実施形態)
図1に示すように、この第1実施形態の帳票読取システムは、電子機器、携帯端末または端末装置としてのタブレット端末1とこのタブレット端末1とネットワーク7を介して接続された外部システム8とを備える。外部システム8は例えばサーバコンピュータなどである。
(First embodiment)
As shown in FIG. 1, the form reading system according to the first embodiment includes a tablet terminal 1 as an electronic device, a portable terminal or a terminal device, and an external system 8 connected to the tablet terminal 1 via a network 7. Prepare. The external system 8 is, for example, a server computer.

タブレット端末1は画像取得部としてのカメラ部2、タッチパネル3、CPU4、メモリ5、通信インターフェース6(以下「通信I/F6」と称す)などを備える。   The tablet terminal 1 includes a camera unit 2 as an image acquisition unit, a touch panel 3, a CPU 4, a memory 5, a communication interface 6 (hereinafter referred to as “communication I / F 6”), and the like.

このタブレット端末1ではメモリ5に記憶されているソフトウェアをCPU4が読み出し、そのソフトウェアの処理を実行することで、タブレット端末1が、帳票を読み取る帳票読取装置として機能する。   In the tablet terminal 1, the CPU 4 reads out the software stored in the memory 5 and executes processing of the software, whereby the tablet terminal 1 functions as a form reading device that reads the form.

カメラ部2は例えばCCDカメラなどであり、読取り対象の帳票、例えば帳票Aの帳票イメージ(帳票画像)を撮像、つまり光学的に読み取り、読み取った帳票画像をメモリ5に記憶する。撮像部としては、この端末1に内蔵されたカメラ部2の他、例えば外部接続したCCDセンサなどを備えたデジタルカメラなどであってもよい。   The camera unit 2 is, for example, a CCD camera or the like, and captures, that is, optically reads a form image (form image) of a form to be read, for example, form A, and stores the read form image in the memory 5. As the imaging unit, in addition to the camera unit 2 built in the terminal 1, for example, a digital camera including an externally connected CCD sensor or the like may be used.

タッチパネル3は情報の表示と入力の2つの機能を備えており、カメラ部2で撮像した帳票画像を液晶画面に表示すると共に、操作者が液晶画面に表示された画像(絵や写真など)の点または領域に手で触れることにより、触れられた画面位置の情報を感知して操作情報(信号)として出力する。すなわちタッチパネル3はカメラ部2により撮像された帳票画像71(図3,図8参照)を表示することが可能であり、タッチ操作が可能なものである。   The touch panel 3 has two functions of information display and input, and displays a form image captured by the camera unit 2 on the liquid crystal screen and also displays an image (a picture or a photograph) displayed on the liquid crystal screen by the operator. By touching a point or region with a hand, information on the touched screen position is sensed and output as operation information (signal). That is, the touch panel 3 can display a form image 71 (see FIGS. 3 and 8) captured by the camera unit 2 and can be touched.

メモリ5には、帳票画像データベース12(以下「帳票画像DB12」と称す)(図3参照)、認識履歴データベース(認識履歴DB43)(図4参照)、帳票定義体データベース(帳票定義体DB41)(図5参照)、文字種辞書データベース(文字種辞書DB42)(図6参照)などの記憶領域が設定されている。   The memory 5 includes a form image database 12 (hereinafter referred to as “form image DB 12”) (see FIG. 3), a recognition history database (recognition history DB 43) (see FIG. 4), a form definition database (form definition DB 41) ( A storage area such as a character type dictionary database (character type dictionary DB 42) (see FIG. 6) is set.

帳票画像DB12には、カメラ部2により取得された帳票画像71(図8参照)が記憶される(詳細は後述する)。またメモリ5には、帳票定義体DB41および文字種辞書DB42が記憶されている。帳票定義体DB41には帳票ID毎の文字認識用の定義情報が記憶されている。文字種辞書DB42は帳票ID毎またはエントリ項目毎に設定された文字種の辞書である。メモリ5は各部により帳票画像の処理が行われる際の作業領域として機能する。通信I/F6はネットワーク7を通じて外部システム8と通信する。   A form image 71 (see FIG. 8) acquired by the camera unit 2 is stored in the form image DB 12 (details will be described later). The memory 5 stores a form definition DB 41 and a character type dictionary DB 42. The form definition DB 41 stores definition information for character recognition for each form ID. The character type dictionary DB 42 is a character type dictionary set for each form ID or each entry item. The memory 5 functions as a work area when a form image is processed by each unit. The communication I / F 6 communicates with the external system 8 through the network 7.

CPU4は帳票画像71とこの帳票画像71から読み取るべき文字の項目名の例えばチェックボックスのような選択できる方法で(以下、「チェックボックス」と称する)72と各項目名に対応する認識結果の表示欄73とを有するエントリ画面70(図7参照)をタッチパネル3に表示する画面制御部として機能する。   The CPU 4 can select the form image 71 and the item name of the character to be read from the form image 71 by a method such as a check box (hereinafter referred to as “check box”) 72 and display of the recognition result corresponding to each item name. It functions as a screen control unit that displays an entry screen 70 (see FIG. 7) having a column 73 on the touch panel 3.

またCPU4はエントリ画面70の項目名のチェックボックス72に対するタッチ操作により、オペレータにより所望の項目名とこの項目名に対応する読取り対象のエリアが指定された場合、指定されたエリアの画像部分を文字認識し、得られた文字データと項目名の情報とエリアの位置情報とを対応付けてメモリ5に記憶すると共に、文字データを認識結果の表示欄73に表示する文字認識部として機能する。   When the operator designates a desired item name and an area to be read corresponding to the item name by a touch operation on the item name check box 72 on the entry screen 70, the CPU 4 displays the image portion of the designated area as a character. It recognizes and stores the obtained character data, item name information and area position information in association with each other in the memory 5 and functions as a character recognition unit for displaying the character data in the recognition result display column 73.

この帳票読取システムの機能としては、図2に示すように、画像取得部10、画面制御部20、文字認識部40、エントリ情報更新部50などを有する。   As shown in FIG. 2, the function of the form reading system includes an image acquisition unit 10, a screen control unit 20, a character recognition unit 40, an entry information update unit 50, and the like.

画像取得部10はカメラ部2、帳票画像書込部11、帳票画像記憶部としての帳票画像データベース12(以下「帳票画像DB12」と称す)を有する。カメラ部2は帳票Aを光学的に読み取って帳票の画像を取得する。帳票画像書込部11はカメラ部2により取得された帳票画像71を取得し帳票画像DB12に記憶する(書き込む)。各DBはメモリ5の記憶領域に構築される。すなわち画像取得部10はカメラ部2により取得された帳票画像71をメモリ5に記憶する。   The image acquisition unit 10 includes a camera unit 2, a form image writing unit 11, and a form image database 12 (hereinafter referred to as “form image DB 12”) as a form image storage unit. The camera unit 2 optically reads the form A and acquires an image of the form. The form image writing unit 11 acquires the form image 71 acquired by the camera unit 2 and stores (writes) it in the form image DB 12. Each DB is constructed in the storage area of the memory 5. That is, the image acquisition unit 10 stores the form image 71 acquired by the camera unit 2 in the memory 5.

図3に示すように、帳票画像DB12には、帳票画像71毎の帳票IDと各帳票IDに対応したバイナリデータ(画像データまたはイメージデータなどともいう)とが記憶される。   As shown in FIG. 3, the form image DB 12 stores a form ID for each form image 71 and binary data (also referred to as image data or image data) corresponding to each form ID.

画面制御部20は帳票画像読出部21、画面生成部22、OCR対象帳票受付部23、OCR対象エントリ項目受付部24、OCR対象エントリ項目エリア受付部25を有する。
OCRとはオプチカル・キャラクタ・レコグニション(光学文字認識)またはオプチカル・キャラクタ・リーダ(光学式文字読取装置)の略称であり、ここでは前者を指す。
The screen control unit 20 includes a form image reading unit 21, a screen generation unit 22, an OCR target form receiving unit 23, an OCR target entry item receiving unit 24, and an OCR target entry item area receiving unit 25.
OCR is an abbreviation for optical character recognition (optical character recognition) or optical character reader (optical character reader), and here refers to the former.

画面制御部20は帳票画像71の表示欄と帳票画像71から読み取るべき文字のエントリ項目の項目名の表示欄とそのチェックボックス72とエントリ項目名に対応する認識結果の表示欄73とを有するエントリ画面70(図8参照)をタッチパネル3に表示(出力)する。つまり画面制御部20は帳票画像71と帳票画像71から文字認識した結果の文字データとが表示される表示欄を有するエントリ画面70を表示する。   The screen control unit 20 includes a display field for the form image 71, an item name display field for the entry item of characters to be read from the form image 71, a check box 72, and a recognition result display field 73 corresponding to the entry item name. A screen 70 (see FIG. 8) is displayed (output) on the touch panel 3. That is, the screen control unit 20 displays the entry screen 70 having a display field for displaying the form image 71 and character data obtained as a result of character recognition from the form image 71.

画面制御部20は帳票画像71の所望の位置がタップ操作により指定されることで、その指定位置に存在する読取対象の文字画像の領域を特定し、その領域を認識対象のエリアとする。この他、帳票画像71の所望のエリアがスライド操作により始点と終点が指定されることで、読取対象の文字画像の領域を特定し、その領域を認識対象のエリアとしてもよい。   When the desired position of the form image 71 is designated by the tap operation, the screen control unit 20 specifies the area of the character image to be read existing at the designated position, and sets the area as the area to be recognized. In addition, a desired area of the form image 71 may be specified by specifying the start point and the end point by a slide operation, and the area of the character image to be read may be specified as the area to be recognized.

帳票画像読出部21は帳票画像DB12に記憶されている帳票画像71を読み出し画面生成部22へ渡し、エントリ画面70に帳票画像71を表示させる。   The form image reading unit 21 reads out the form image 71 stored in the form image DB 12 and passes it to the screen generation unit 22 to display the form image 71 on the entry screen 70.

画面生成部22はエントリ画面70を生成および表示し、帳票画像読出部21から渡された帳票画像71のサムネイル一覧と、サムネイル一覧の中から指定されたサムネイルの帳票画像71をエントリ画面70に表示する。   The screen generation unit 22 generates and displays an entry screen 70, and displays on the entry screen 70 a thumbnail list of the form image 71 passed from the form image reading unit 21 and a form image 71 of a thumbnail specified from the thumbnail list. To do.

また画面生成部22は入力された帳票IDをキーワードにして帳票定義体DB41を参照して処理対象の帳票Aのエントリ項目の項目名を抽出しエントリ画面70内の左端にエントリ項目一覧を縦に表示する。   The screen generation unit 22 extracts the item name of the entry item of the processing target form A by referring to the form definition DB 41 using the input form ID as a keyword, and vertically displays the entry item list at the left end of the entry screen 70. indicate.

なおこの例では、帳票Aに紐付けたエントリ項目を抽出したが、エントリ項目をバッチ単位で抽出してもよく、本実施形態はエントリ項目の抽出の仕方に限定されるものではない。また、エントリ項目一覧を縦に表示したが、表示の仕方は縦に限定しなくてもよい。   In this example, the entry item associated with the form A is extracted. However, the entry item may be extracted in batch units, and the present embodiment is not limited to the method of extracting the entry item. Further, although the entry item list is displayed vertically, the display method may not be limited to the vertical.

OCR対象帳票受付部23はエントリ画面70に表示された帳票画像71のサムネイルのうち、タップ(選択または指定)されたサムネイルの帳票画像71を読取処理対象の画像としてエントリ画面70全体に表示する。   The OCR target form receiving unit 23 displays the tapped (selected or designated) form image 71 of the thumbnails of the form image 71 displayed on the entry screen 70 on the entire entry screen 70 as an image to be read.

OCR対象エントリ項目受付部24はエントリ画面70に表示されたエントリ項目一覧のうち例えばチェックボックス72をタップ(選択または指定)されたエントリ項目をアクティブにする。   The OCR target entry item receiving unit 24 activates, for example, the entry item tapped (selected or designated) in the check box 72 in the entry item list displayed on the entry screen 70.

OCR対象エントリ項目エリア受付部25はエントリ項目のチェックボックス72をタップした後に帳票画像71に対して行われたタップ操作を検出し、そのタップ位置から文字認識対象エリアを特定する。文字認識対象エリアを特定には、いくつかの方法があるが、一例として、タップされた1点から横方向に一定の範囲(矩形の範囲)にある画像を文字認識対象とする。   The OCR target entry item area receiving unit 25 detects a tap operation performed on the form image 71 after tapping the check box 72 of the entry item, and specifies a character recognition target area from the tap position. There are several methods for specifying the character recognition target area. As an example, an image in a certain range (rectangular range) in the horizontal direction from one tapped point is set as a character recognition target.

文字認識部40は文字認識部としてのOCRエンジン44、認識履歴DB43、認識結果制御部45、帳票定義体DB41、文字種辞書DB42を有する。   The character recognition unit 40 includes an OCR engine 44 as a character recognition unit, a recognition history DB 43, a recognition result control unit 45, a form definition DB 41, and a character type dictionary DB 42.

OCRエンジン44はエントリ画面70に対するタッチ操作により、所望のエントリ項目とこのエントリ項目に対応する読取り対象のエリアが指定された場合、指定されたエリアを文字認識する。文字認識には予め設定された文字認識用の辞書を用いる。   When a desired entry item and an area to be read corresponding to the entry item are designated by a touch operation on the entry screen 70, the OCR engine 44 recognizes the designated area as characters. A character recognition dictionary set in advance is used for character recognition.

OCRエンジン44は認識結果の文字に対するベリファイ処理を行う。具体的には、OCRエンジン44は読み取り対象エリアに印字されているべき文字数(予め設定されている文字数)と実際に認識された認識結果の文字数とを比較し一致するか否かをチェックする。文字数の他、文字種に対しても行う。文字種のベリファイ処理だけを行ってもよい。   The OCR engine 44 performs a verification process on the recognition result character. Specifically, the OCR engine 44 compares the number of characters to be printed in the reading target area (the number of characters set in advance) with the number of characters of the recognition result actually recognized, and checks whether or not they match. In addition to the number of characters, this is also done for character types. Only character type verification processing may be performed.

OCRエンジン44は文字認識した結果として得られた文字の文字種および/または文字数を、予め設定された項目毎の文字種および/または文字数と比較し、不一致の場合、アラートを出力する。   The OCR engine 44 compares the character type and / or number of characters obtained as a result of character recognition with a preset character type and / or number of characters for each item, and outputs an alert if they do not match.

認識結果制御部45はOCRエンジン44による文字認識の結果の文字データをキーワードとして認識履歴DB43を検索し、認識履歴DB43に存在しない場合、OCRエンジン44から得られた文字認識の結果の文字データと項目名の情報とエリアの位置情報とを対応付けてメモリ5(認識履歴DB43)に記憶する。   The recognition result control unit 45 searches the recognition history DB 43 using the character data obtained as a result of character recognition by the OCR engine 44 as a keyword, and if the character data does not exist in the recognition history DB 43, character recognition result character data obtained from the OCR engine 44 and The item name information and the area position information are associated with each other and stored in the memory 5 (recognition history DB 43).

また認識履歴DB43を検索した結果、OCRエンジン44により文字認識された文字データと一致する文字および類似度が一定値以上の認識結果の文字データ候補が検索された場合、認識結果制御部45はその文字データ候補を表示欄73および表示欄73の近傍に表示する。   Further, as a result of searching the recognition history DB 43, when a character that matches the character data recognized by the OCR engine 44 and a character data candidate of a recognition result having a similarity greater than or equal to a certain value are searched, the recognition result control unit 45 Character data candidates are displayed in the vicinity of the display field 73 and the display field 73.

認識制御部45は表示欄73または表示欄73近傍に表示した文字データまたは文字データ候補のうちオペレータによりタップ操作(選択)された文字データ、文字データ候補または表示欄73にキー入力された文字データを文字認識の結果として確定し認識履歴DB43に記憶する。   The recognition control unit 45 is character data that is tapped (selected) by the operator among character data or character data candidates displayed in the display field 73 or in the vicinity of the display field 73, character data candidates, or character data that is key-input to the display field 73. Is confirmed as a result of character recognition and stored in the recognition history DB 43.

図4に示すように、認識履歴DB43には、帳票画像71の識別子であるIDまたはエントリ項目のIDと各IDに対応した認識結果の文字データとが少なくとも記憶される。   As shown in FIG. 4, the recognition history DB 43 stores at least an ID that is an identifier of the form image 71 or an ID of an entry item and character data of a recognition result corresponding to each ID.

より具体的には、認識履歴DB43には認識結果の文字データと読み取りの際に帳票画像71から切り出した文字画像と読取り範囲の位置情報とが対応した認識結果が認識履歴として記憶される。   More specifically, the recognition history DB 43 stores a recognition result in which the recognition result character data corresponds to the character image cut out from the form image 71 at the time of reading and the position information of the reading range.

図5に示すように、帳票定義体DB41には、項目IDに項目名、定義情報(文字種)、定義情報(文字数)などが対応付けて記憶されている。IDは項目を識別するための識別子(識別情報)である。項目名は、例えば「氏名」、「住所」、「電話番号」…など、定義情報(文字種)は、例えば「かな」、「漢字」など、定義情報(文字数)は「20」、「50」、「10」などの数値が設定されている。この他、定義情報としては文字のサイズなども設定されている。   As shown in FIG. 5, in the form definition DB 41, item names, definition information (character types), definition information (number of characters), and the like are stored in association with item IDs. ID is an identifier (identification information) for identifying an item. The item name is, for example, “name”, “address”, “phone number”, etc. The definition information (character type) is, for example, “kana”, “kanji”, and the definition information (number of characters) is “20”, “50”. , “10” and the like are set. In addition, character size and the like are set as definition information.

つまり帳票定義体DB41には、エントリ項目に対応する定義情報(帳票画像から文字を読み取るための帳票書式と項目名と項目に対応する読取対象の文字の属性情報と)が記憶されている。定義情報は例えば認識対象の項目の名称(項目名)、その項目に対応する読取エリア(読取位置)に記載されているべき文字のサイズ、文字種、文字数などである。   In other words, the form definition DB 41 stores definition information corresponding to entry items (form format for reading characters from form images, item names, and attribute information of characters to be read corresponding to items). The definition information includes, for example, the name of the item to be recognized (item name), the size of characters to be written in the reading area (reading position) corresponding to the item, the character type, the number of characters, and the like.

図6に示すように、文字種辞書DB42には、複数の文字種の異なる辞書を識別するためのID、タイプ、ルールが対応付けて記憶されている。IDとしては、例えば「1」,「2」などの数値、タイプとしては「かな」、「英語」など、ルールとしては、「かな」であれば「あいうえお…」、「英語」であれば「abcdef…」などが設定されている。   As shown in FIG. 6, the character type dictionary DB 42 stores IDs, types, and rules for identifying different dictionaries of a plurality of character types in association with each other. The ID is a numerical value such as “1” or “2”, the type is “Kana”, “English”, or the like. The rule is “Kana”, “Aiueo ...”, “English”, “ abcdef ... "and the like are set.

すなわち文字種辞書DB42には、項目毎に記載されているべき文字の文字種の辞書が記憶されており、文字認識の際にOCRエンジン44により使用される。OCRエンジン44は帳票定義体DB41から得た文字種に紐付く辞書を文字種辞書DB42から読み出す。   That is, the character type dictionary DB 42 stores a character type dictionary of characters to be described for each item, and is used by the OCR engine 44 in character recognition. The OCR engine 44 reads a dictionary associated with the character type obtained from the form definition DB 41 from the character type dictionary DB 42.

エントリ情報更新部50はエントリ情報DB51、エントリ情報書込部52、エントリ情報送信部53を有する。   The entry information update unit 50 includes an entry information DB 51, an entry information writing unit 52, and an entry information transmission unit 53.

図7に示すように、エントリ情報DB51には、項目名、認識結果、帳票ID、座標などが対応付けて記憶されている。項目名は、例えば「氏名」、「住所」、「電話番号」…などである。認識結果は項目名が「氏名」であれば「○×太郎」、項目名が「住所」であれば「東京都XX市X町1−11」、項目名が「電話番号」であれば「0123456789」などである。座標は読取対象のエリアを2次元的に示す矩形の頂点の4つのポイントのx座標,y座標が一対で記憶されている。   As shown in FIG. 7, the entry information DB 51 stores item names, recognition results, form IDs, coordinates, and the like in association with each other. The item name is, for example, “name”, “address”, “telephone number”, etc. The recognition result is “○ × Taro” if the item name is “name”, “1-11 X town X-11, Tokyo XX” if the item name is “address”, and “ 0123456789 ”or the like. The coordinates are stored as a pair of x and y coordinates of four points of a rectangular vertex that two-dimensionally shows the area to be read.

すなわちエントリ情報DB51には、項目名と、認識履歴DB43の認識履歴と、OCR対象帳票受付部23によって受け付けられた帳票に紐付く帳票IDと、OCR対象エントリ項目エリア受付部25によって受け付けられたエリア情報(x座標,y座標)などが記憶される。   That is, in the entry information DB 51, the item name, the recognition history of the recognition history DB 43, the form ID associated with the form received by the OCR target form receiving unit 23, and the area received by the OCR target entry item area receiving unit 25. Information (x coordinate, y coordinate) and the like are stored.

エントリ情報書込部52は認識履歴DB43より認識履歴を読み出してエントリ情報DB51に書き込む。エントリ情報送信部53はエントリ情報DB51に記憶されている情報を、ネットワーク7を通じて外部システム8へ送信する。   The entry information writing unit 52 reads the recognition history from the recognition history DB 43 and writes it in the entry information DB 51. The entry information transmission unit 53 transmits information stored in the entry information DB 51 to the external system 8 through the network 7.

図8に示すように、エントリ画面70には、文字読取対象の帳票画像71が画面全体に表示される他、この帳票画像71から読み取るべき文字の項目名とその項目名の読み取りを指示するためのチェックボックス72と各項目に対応する認識結果の表示欄73とが画面左側に表示される。この例では、読み取るべき文字の項目名として、例えばID、氏名、住所、電話番号、生年月日などを例示している。   As shown in FIG. 8, in the entry screen 70, a form image 71 to be read is displayed on the entire screen, and an item name of a character to be read from the form image 71 and an instruction to read the item name are given. Check box 72 and a recognition result display field 73 corresponding to each item are displayed on the left side of the screen. In this example, ID, name, address, telephone number, date of birth, etc. are illustrated as item names of characters to be read.

続いて、図9を参照してこの第1実施形態の帳票読取システムの動作を説明する。まず、図9のフローチャートを参照してこの帳票読取システムの動作を説明する。   Next, the operation of the form reading system according to the first embodiment will be described with reference to FIG. First, the operation of this form reading system will be described with reference to the flowchart of FIG.

この帳票読取システムの場合、オペレータがタブレット端末1の電源を入れて文字読取用のプログラムである文字認識アプリケーションソフトウェアを起動すると、タッチパネル3にエントリ画面70が表示される。   In the case of this form reading system, when an operator turns on the tablet terminal 1 and activates character recognition application software which is a character reading program, an entry screen 70 is displayed on the touch panel 3.

続いて、オペレータは、紙の帳票Aを電子データ化するために、エントリ画面70の帳票取り込み釦(図示せず)を操作すると、画像取得部10は、カメラ部2を起動し、エントリ画面70をカメラ撮像用のモニタ画面にする。   Subsequently, when the operator operates a form capture button (not shown) on the entry screen 70 in order to convert the paper form A into electronic data, the image acquisition unit 10 activates the camera unit 2 and activates the entry screen 70. To the monitor screen for camera imaging.

オペレータがモニタ画面をみながら、モニタ画面内に処理対象の帳票Aを入れて撮影すると、カメラ部2は撮像した帳票画像71を帳票画像書込部11に出力する。帳票画像書込部11は撮影された帳票画像71を帳票画像DB12に書き込む。帳票画像71は撮像された帳票Aの枚数分、つまり1枚以上取り込まれる。帳票Aの撮影を終了した後、モニタ画面を閉じると、エントリ画面70になる。   When the operator looks at the monitor screen and puts the form A to be processed in the monitor screen and shoots, the camera unit 2 outputs the captured form image 71 to the form image writing unit 11. The form image writing unit 11 writes the photographed form image 71 in the form image DB 12. The form image 71 is taken in as many as the number of forms A taken, that is, one or more sheets. After the photographing of the form A is completed, the entry screen 70 is displayed when the monitor screen is closed.

ここで、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、画面制御部20は、帳票画像DB12に蓄積されている一つ以上の帳票画像71のサムネイルを読み込み、エントリ画面70に帳票画像71のサムネイル一覧と、このサムネイル一覧の中から所望のサムネイルの選択を促すメッセージを表示する。   Here, when the operator taps a form image read button (not shown) on the entry screen 70, the screen control unit 20 reads one or more thumbnails of the form image 71 stored in the form image DB 12, and enters the entry. A thumbnail list of the form image 71 and a message prompting the user to select a desired thumbnail from the thumbnail list are displayed on the screen 70.

ここで、オペレータがサムネイル一覧の中から所望のサムネイルを選択すると、指定されたサムネイルに対応する文字認識対象の帳票画像71が帳票画像DB12から読み出されて、エントリ画面70全体に操作用として表示される(図9のステップS101)。   Here, when the operator selects a desired thumbnail from the thumbnail list, a form recognition target form image 71 corresponding to the designated thumbnail is read from the form image DB 12 and displayed on the entire entry screen 70 for operation. (Step S101 in FIG. 9).

ここで、オペレータがエントリ画面70の項目名のチェックボックス72を指で選択し、続いて帳票画像71のOCRエリアを指定すると(ステップS102のYes)、画面制御部20は、その指定されたOCRエリアを受け付け、そのOCRエリアにある文字画像を読取対象として特定する。   Here, when the operator selects the check box 72 of the item name on the entry screen 70 with a finger and then specifies the OCR area of the form image 71 (Yes in step S102), the screen control unit 20 displays the specified OCR. The area is received, and the character image in the OCR area is specified as a reading target.

OCRエンジン44は、特定された文字画像を切り出し、読み込んだ帳票画像71のIDに該当する帳票定義体を帳票定義体DB41から読み出し、同IDに該当する文字種の辞書を文字種辞書DB42から読み出して、これらを参照してOCRエリアから切り出した文字画像に対して文字認識し(ステップS103)、文字認識した結果((項目名と文字と文字画像)以下「認識結果」と称す)を認識制御部45に渡す。   The OCR engine 44 cuts out the identified character image, reads out the form definition corresponding to the ID of the read form image 71 from the form definition DB 41, reads out the dictionary of the character type corresponding to the ID from the character type dictionary DB 42, Character recognition is performed on the character image cut out from the OCR area with reference to these (step S103), and the result of character recognition ((item name, character and character image) is hereinafter referred to as “recognition result”) is the recognition control unit 45. To pass.

認識制御部45は、認識結果の文字データをキーワードにして認識履歴DB43の認識履歴の中にキーワードと一致または一定の割合以上類似する認識結果(以下現在の認識結果を区別するために「履歴情報」と称す)が存在するか否かを検索する(ステップS104)。   The recognition control unit 45 uses the recognition result character data as a keyword, and recognizes a recognition result in the recognition history DB 43 that matches the keyword or is similar to a certain percentage (hereinafter referred to as “history information to distinguish the current recognition result”. Is searched (step S104).

この検索の結果、キーワードと完全に一致する履歴情報が認識履歴の中に存在した場合(ステップS105のYes)、認識制御部45はその履歴情報を認識履歴DB43から読み出して画面生成部22へ送り、履歴情報に含まれる文字データを表示欄73に表示する(ステップS106)。   As a result of this search, if history information that completely matches the keyword exists in the recognition history (Yes in step S105), the recognition control unit 45 reads the history information from the recognition history DB 43 and sends it to the screen generation unit 22. The character data included in the history information is displayed in the display field 73 (step S106).

一方、キーワードと完全に一致する履歴情報が存在しない場合(ステップS105のNo)、認識制御部45はOCRエンジン44から送られてきた認識結果を認識履歴DB43に登録する(ステップS107)。   On the other hand, when there is no history information that completely matches the keyword (No in step S105), the recognition control unit 45 registers the recognition result sent from the OCR engine 44 in the recognition history DB 43 (step S107).

また上記検索の結果、認識履歴DB43の認識履歴の中にキーワードと一定の割合以上と一致する履歴情報が存在した場合(ステップS108のYes)、認識制御部45はその履歴情報(以前の認識結果)を認識履歴DB43から読み出して画面生成部22へ送る。   As a result of the search, if there is history information in the recognition history in the recognition history DB 43 that matches a certain ratio or more with the keyword (Yes in step S108), the recognition control unit 45 sets the history information (previous recognition result). ) Is read from the recognition history DB 43 and sent to the screen generation unit 22.

この場合、画面生成部22は、認識制御部45から送られてきた履歴情報に含まれる文字データ候補と、OCRエンジン44により文字認識された認識結果の文字データとの双方を、あたかも変換予測したように表示欄73および表示欄73の近傍(下段)に並べて表示する(ステップS109)。   In this case, the screen generation unit 22 performs conversion prediction as if both the character data candidate included in the history information sent from the recognition control unit 45 and the character data of the recognition result recognized by the OCR engine 44 are used. In this manner, the display field 73 and the vicinity (lower part) of the display field 73 are displayed side by side (step S109).

履歴情報の中から一定割合以上キーワードと一致する履歴情報が存在しない場合(ステップS108のNo)、認識制御部45は通常通りOCRエンジン44から送られてきた認識結果に含まれる文字データを表示欄73に表示する(ステップS106)。   If there is no history information that matches the keyword in a certain proportion or more from the history information (No in step S108), the recognition control unit 45 displays the character data included in the recognition result sent from the OCR engine 44 as usual. 73 (step S106).

ここで、図10乃至図12を参照して初めの帳票画像71aから文字データを正常に認識した場合の認識結果の例とその後異なる帳票画像71bから文字データを認識した際に誤読やリジェクト(未読)が発生した場合の例を説明する。   Here, referring to FIG. 10 to FIG. 12, an example of the recognition result when the character data is normally recognized from the first form image 71a and the character data from the different form image 71b after that are misread or rejected (unread) ) Will be described.

図10に示すように、初めの帳票画像71aの例えば「氏名」、「住所」、「電話番号」の項目に対応するエリアの画像を文字認識した場合、認識制御部45が認識履歴DB43を検索した結果、認識履歴DB43に以前のデータが存在しないため、認識履歴DB43はOCRエンジン44による通常の認識結果を認識履歴DB43に記憶するため、認識履歴DB43には「氏名」の項目に「○×太郎」、「住所」の項目に「東京都XX市X町1-11」、「電話番号」の項目に「012−345−6789」が記憶(新規登録)され、それぞれの表示欄73に表示される。   As shown in FIG. 10, when the image of the area corresponding to, for example, the “name”, “address”, and “phone number” items of the first form image 71a is recognized, the recognition control unit 45 searches the recognition history DB 43. As a result, since there is no previous data in the recognition history DB 43, the recognition history DB 43 stores the normal recognition result by the OCR engine 44 in the recognition history DB 43. “Taro” and “Address” are stored (new registration) “012-345-6789” and “012-345-6789” are stored in the “Telephone Number” item, and are displayed in the respective display fields 73. Is done.

その後、初めの帳票画像71aと異なる帳票画像、例えば図11に示すように、帳票画像71bをエントリ画面70に表示して「氏名」、「本籍」、「電話番号」の項目に対応するエリアの画像を文字認識したものとする。   Thereafter, a form image different from the first form image 71a, for example, a form image 71b is displayed on the entry screen 70 as shown in FIG. 11, and the areas corresponding to the items of “name”, “registration”, and “phone number” are displayed. Assume that the image has been recognized.

この際、「本籍」の項目に対応するエリアを読み取ったときに、リジェクト(未読:全てまたは一部の文字が文字として認識できず「?」を代入した事象「東京都XX市?町1-11」)が発生したものとする。   At this time, when reading the area corresponding to the item “Personal registry”, rejected (unread: all or some of the characters could not be recognized as characters and “?” Was assigned to the event “Tokyo XX City? 11 ") occurs.

この場合、認識制御部45が認識履歴DBを検索すると、リジェクトした文字「東京都XX市?町1-11」と類似する以前の認識結果「東京都XX市X町1-11」が履歴情報として蓄積されているので、認識制御部45は「本籍」の項目に対応する表示欄73にリジェクトした文字「東京都XX市?町1-11」を表示すると共に、これと類似する認識履歴DBの履歴情報「東京都XX市X町1-11」を読み出して表示欄73の下段に両方の文字「東京都XX市?町1-11」、「東京都XX市X町1-11」を選択対象の文字データ候補として表示する。   In this case, when the recognition control unit 45 searches the recognition history DB, the previous recognition result “Tokyo city XX city X town 1-11” similar to the rejected character “Tokyo city XX city? Therefore, the recognition control unit 45 displays the rejected character “Tokyo Metropolitan XX City? Machi 1-11” in the display field 73 corresponding to the item “Personal Register” and a similar recognition history DB. History information “Tokyo city XX city X town 1-11” is read out, and both characters “Tokyo city XX city? Town 1-11” and “Tokyo city XX city X town 1-11” are displayed at the bottom of the display column 73. It is displayed as a character data candidate to be selected.

エントリ画面70の表示欄73に表示された文字データ候補をオペレータが確認し、図12に示すように、正しい方の文字データ候補を選択しタップすることで、タップされた文字が認識履歴DBの認識履歴(履歴情報)に反映、つまり認識履歴DBが更新される。   The operator confirms the character data candidates displayed in the display field 73 of the entry screen 70, and selects and taps the correct character data candidate as shown in FIG. 12, so that the tapped character is stored in the recognition history DB. Reflected in the recognition history (history information), that is, the recognition history DB is updated.

この操作(動作)を繰り返して、オペレータとして所望の項目の文字データが得られた後、オペレータがエントリ画面70のエントリ完了釦(図示せず)をタップすると、エントリ情報更新部50が認識履歴DB43から認識履歴を取り込んで一定のエントリ形式の情報に変換してエントリ情報DB51の内容を更新した後、外部システム8へ送信する。   After this operation (operation) is repeated and character data of a desired item is obtained as an operator, when the operator taps an entry completion button (not shown) on the entry screen 70, the entry information update unit 50 recognizes the recognition history DB 43. Then, the recognition history is taken in, converted into information of a certain entry format, the contents of the entry information DB 51 are updated, and then transmitted to the external system 8.

このように第1実施形態によれば、OCRエンジン44により文字認識された文字データと一致する文字データおよび類似度が一定値以上の認識結果の文字データをエントリする文字データ候補として認識履歴DB43より検索し、表示欄73および表示欄73の下段(表示欄近傍)に表示し、エントリ画面70に表示された文字データ候補のうち選択された文字データ候補を文字認識の結果として確定し認識履歴DB43に記憶するので、帳票画像71の状態によらずリジェクトとなる割合を少なくしてオペレータへの作業負担を軽減すると共に、文字認識精度の向上に寄与することができる。   As described above, according to the first embodiment, from the recognition history DB 43 as character data candidates for entering character data that matches the character data recognized by the OCR engine 44 and character data having a recognition result with a similarity greater than or equal to a certain value. The search is performed and displayed in the display column 73 and the lower part of the display column 73 (near the display column), and the selected character data candidate among the character data candidates displayed on the entry screen 70 is determined as a result of character recognition, and the recognition history DB 43 Therefore, the ratio of rejection is reduced regardless of the state of the form image 71, thereby reducing the work load on the operator and contributing to the improvement of character recognition accuracy.

(第2実施形態)
続いて、図13、図14を参照して第2実施形態を説明する。なおこの第2実施形態は第1実施形態とほぼ同じ構成であり、認識履歴DB43の内容と認識制御部45の検索機能が異なるため、この点について説明する。
(Second Embodiment)
Subsequently, the second embodiment will be described with reference to FIGS. 13 and 14. The second embodiment has almost the same configuration as the first embodiment, and the contents of the recognition history DB 43 and the search function of the recognition control unit 45 are different. This point will be described.

この第2実施形態は、図13に示すように、項目のIDに対応して認識結果と確定フラグが対応して記憶される認識履歴DB43を備える。認識結果の文字データにオペレータが確認したことを示す識別子である。確定フラグ「1」は認識結果の文字データが確定済で登録されたことを示す。確定フラグ「0」は認識結果の文字データが未確定のまま登録されたことを示す。   As shown in FIG. 13, the second embodiment includes a recognition history DB 43 in which a recognition result and a confirmation flag are stored corresponding to an item ID. This is an identifier indicating that the operator has confirmed the character data of the recognition result. The confirmation flag “1” indicates that the character data of the recognition result has been confirmed and registered. The confirmation flag “0” indicates that the character data of the recognition result is registered without being confirmed.

認識制御部45は認識結果の文字データに確定フラグ「1」または「0」を付与(付加)して認識履歴DB43に記憶し、OCRエンジン44から得られた認識結果から認識履歴DB43を検索する際には、確定フラグ「1」が付与された文字データの中から文字データ候補を検索する。   The recognition control unit 45 assigns (adds) a confirmation flag “1” or “0” to the character data of the recognition result, stores it in the recognition history DB 43, and searches the recognition history DB 43 from the recognition result obtained from the OCR engine 44. In this case, the character data candidates are searched from the character data to which the confirmation flag “1” is assigned.

第1実施形態では、エントリ画面70に表示された選択候補の文字データをオペレータがタップすることで、タップされた選択候補の文字データを認識履歴DBの認識履歴(履歴情報)に反映したが、この第2実施形態では、選択候補の文字の中から所望の文字がタップされたときに、認識制御部45はタップ操作を「確定」操作と判定して認識履歴DBの認識結果の文字に確定フラグ「1」を付与(設定)する。   In the first embodiment, the operator taps the selection candidate character data displayed on the entry screen 70 to reflect the tapped selection candidate character data in the recognition history (history information) of the recognition history DB. In the second embodiment, when a desired character is tapped from among the selection candidate characters, the recognition control unit 45 determines that the tap operation is a “confirm” operation and confirms it as a recognition result character in the recognition history DB. A flag “1” is assigned (set).

また新たな文字データを登録する際には、OCRエンジン44からの初めての文字データを自動的に登録するときに認識制御部45は確定フラグ「0」を、認識履歴DB43の該当IDのレコードに設定する。   When registering new character data, the recognition control unit 45 sets the confirmation flag “0” in the record of the corresponding ID in the recognition history DB 43 when automatically registering the first character data from the OCR engine 44. Set.

そして、認識制御部45が次に文字認識された認識結果の文字データをキーワードにして認識履歴DB43を検索する際に、確定フラグが「1」と設定されている文字データだけを検索対象とし、キーワードと一致する文字または一定割合以上類似する文字を認識履歴DB43から抽出する。   Then, when the recognition control unit 45 searches the recognition history DB 43 using the character data of the recognition result recognized next as a keyword as a keyword, only character data for which the confirmation flag is set to “1” is set as a search target. Characters that match the keywords or characters that are more than a certain percentage are extracted from the recognition history DB 43.

ここで、この第2実施形態の動作を説明する。
この第2実施形態では、認識制御部45は認識結果の文字データがタップ操作されたことでその文字データが認識結果として確定したものと判定し、確定した認識結果を認識履歴DB43に登録してそのレコードに確定フラグ「1」を設定する。
Here, the operation of the second embodiment will be described.
In this second embodiment, the recognition control unit 45 determines that the character data of the recognition result has been confirmed as a recognition result by tapping, and registers the confirmed recognition result in the recognition history DB 43. A confirmation flag “1” is set in the record.

次に、新たな認識結果が得られた際には、認識制御部45は認識履歴DB43の確定フラグ「1」の立っている文字データの中からキーワードと一致または一定割合以上類似する文字データを検索するので、認識履歴DB43からの検索結果で、以前にリジェクトした結果が選択対象の文字データ候補としてエントリ画面70に表示されることがなくなる。   Next, when a new recognition result is obtained, the recognition control unit 45 selects character data that matches the keyword or is similar to a certain percentage or more from the character data in which the confirmation flag “1” is set in the recognition history DB 43. Since the search is performed, the previously rejected result of the search result from the recognition history DB 43 is not displayed on the entry screen 70 as the character data candidate to be selected.

このように第2実施形態によれば、認識履歴DB43に確定フラグを追加し、確定フラグ「1」が立っている文字データの中から文字データを検索するようにしたので、以前に誤読やリジェクトした結果が選択対象の文字データ候補としてエントリ画面70に表示されることがなくなり、オペレータは認識結果としてより確かな文字を選択しエントリできるようになる。   As described above, according to the second embodiment, the confirmation flag is added to the recognition history DB 43, and the character data is searched from the character data in which the confirmation flag “1” is set. The result is not displayed on the entry screen 70 as a character data candidate to be selected, and the operator can select and enter a more reliable character as a recognition result.

(第3実施形態)
続いて、図14を参照して第3実施形態を説明する。なおこの第3実施形態は第2実施形態とほぼ同じ構成であり、認識制御部45の動作が異なるため、この点について説明する。
(Third embodiment)
Next, a third embodiment will be described with reference to FIG. The third embodiment has substantially the same configuration as the second embodiment, and the operation of the recognition control unit 45 is different, so this point will be described.

上記第2実施形態では、選択対象の文字データ候補として表示欄の下段に表示したが、この第3実施形態は、認識制御部45はリジェクトされた認識結果に対して、認識履歴DB43から検索した履歴情報(文字データ)をエントリ画面70の表示欄73に直接訂正入力(自動修正)する。   In the second embodiment, the character data candidates to be selected are displayed in the lower part of the display column. However, in the third embodiment, the recognition control unit 45 searches the recognition history DB 43 for the recognized recognition result. The history information (character data) is directly corrected (automatically corrected) in the display field 73 of the entry screen 70.

すなわちこの場合の認識制御部45はOCRエンジン44による文字認識が不可能な文字が含まれていた場合、同じエリアから認識された他の文字データを用いて認識履歴DB43より検索された類似度の高い文字データ候補を認識結果の文字データとして表示欄73に表示する。   That is, in this case, when the character that cannot be recognized by the OCR engine 44 is included, the recognition control unit 45 uses the similarity data retrieved from the recognition history DB 43 using other character data recognized from the same area. High character data candidates are displayed in the display column 73 as character data of recognition results.

この第3実施形態では、図14に示すように、OCRエンジン44がリジェクトした場合(ステップS81)、認識制御部45はOCRエンジン44による認識結果の文字データをキーワードにして認識履歴DB43を検索し、確定フラグ「1」が付与されている文字の中で一致または一定割合以上類似する文字データが存在すると、その文字データを認識履歴DB43から読み出して(ステップS82)、エントリ画面70の表示欄73に直接訂正入力する(ステップS83)。なお図14は認識履歴DB43の内容を分かり易く示したものである。   In the third embodiment, as shown in FIG. 14, when the OCR engine 44 is rejected (step S81), the recognition control unit 45 searches the recognition history DB 43 using the character data of the recognition result by the OCR engine 44 as a keyword. If there is character data that matches or is more than a certain percentage among characters to which the confirmation flag “1” is assigned, the character data is read from the recognition history DB 43 (step S82), and the display field 73 of the entry screen 70 is displayed. The correction is directly input to (step S83). FIG. 14 shows the contents of the recognition history DB 43 in an easily understandable manner.

したがって、オペレータはエントリ画面70の表示欄73に表示された文字データを確認するだけで、次の項目の作業に移ることができる。   Therefore, the operator can move to the next item only by confirming the character data displayed in the display field 73 of the entry screen 70.

このようにこの第3実施形態によれば、OCRエンジン44がリジェクトした認識結果に対して認識制御部45が認識履歴DB43から検索した結果を使用して自動的に訂正を行うので、オペレータは訂正内容を確認するだけでよく、作業効率を向上することができる。   As described above, according to the third embodiment, the recognition control unit 45 automatically corrects the recognition result rejected by the OCR engine 44 using the result retrieved from the recognition history DB 43. It is only necessary to confirm the contents, and work efficiency can be improved.

(第4実施形態)
続いて第4実施形態を説明する。なおこの第4実施形態は第3実施形態とほぼ同じ構成であり、認識制御部45の機能が異なるため、この点について説明する。
(Fourth embodiment)
Next, a fourth embodiment will be described. The fourth embodiment has almost the same configuration as the third embodiment, and the function of the recognition control unit 45 is different, so this point will be described.

上記第3実施形態では、認識制御部45が検索した結果の文字データをエントリ画面70の表示欄73に直接入力したが、この第4実施形態は、その表示欄73に入力された文字が正しいものではなかった場合の手入力による文字の訂正を許容するものである。   In the third embodiment, the character data obtained as a result of the search by the recognition control unit 45 is directly input to the display field 73 of the entry screen 70. However, in the fourth embodiment, the character input to the display field 73 is correct. If it is not, the correction of characters by manual input is allowed.

この場合、OCRエンジン44がリジェクトした認識結果に対して認識制御部45が認識履歴DB43から読み出した文字をエントリ画面70の表示欄73に表示する。   In this case, the character read from the recognition history DB 43 by the recognition control unit 45 for the recognition result rejected by the OCR engine 44 is displayed in the display field 73 of the entry screen 70.

ここで、オペレータが確認した結果、表示欄73に表示された文字データが帳票画像71の読取り対象のエリアの文字と違っていた場合、オペレータが表示欄73に表示された文字を直接キー入力で訂正し、エントリ画面70の図示しない確定ボタンをタップ操作することで、認識制御部45はキー入力で訂正された表示欄73の文字データを認識履歴DB43の認識履歴に反映する。なおOCRエンジン44により認識された認識結果を表示欄73に表示し、それをキー入力で訂正されたものを認識履歴DB43の認識履歴に反映してもよい。   Here, as a result of confirmation by the operator, if the character data displayed in the display column 73 is different from the characters in the area to be read of the form image 71, the operator can directly input the characters displayed in the display column 73. By making a correction and tapping a confirmation button (not shown) on the entry screen 70, the recognition control unit 45 reflects the character data in the display field 73 corrected by key input in the recognition history of the recognition history DB 43. The recognition result recognized by the OCR engine 44 may be displayed in the display field 73, and the result corrected by key input may be reflected in the recognition history of the recognition history DB 43.

このようにこの第4実施形態によれば、表示欄73に表示された認識結果の文字データに対する訂正機能を備えたことで、認識履歴DB43の認識履歴により確かなデータが蓄積されるようになり、文字認識精度を向上することができる。なおリジェクトが生じた場合に検索処理を実行せずに表示欄73を空欄とし、オペレータに全ての文字データをキー入力させるようにしてもよい。   As described above, according to the fourth embodiment, since the correction function for the character data of the recognition result displayed in the display field 73 is provided, reliable data can be accumulated based on the recognition history of the recognition history DB 43. The character recognition accuracy can be improved. If a rejection occurs, the display field 73 may be left blank without executing the search process, and the operator may be allowed to key in all character data.

(第5実施形態)
続いて図15を参照して第5実施形態を説明する。なおこの第5実施形態は第2実施形態とほぼ同じ構成であり、認識履歴DB43の内容と認識制御部45の検索機能が異なるため、この点について説明する。
(Fifth embodiment)
Next, a fifth embodiment will be described with reference to FIG. The fifth embodiment has almost the same configuration as the second embodiment, and the contents of the recognition history DB 43 and the search function of the recognition control unit 45 are different. This will be described.

上記第2実施形態では、認識制御部45は確定フラグが付与されている文字を検索対象としたが、この第5実施形態では、履歴情報に項目名を紐付けるように、図15に示すように、認識履歴DB43には、項目IDに対応付けて認識結果の文字の他に項目名が記憶される。すなわち認識制御部45は、認識結果の文字データとこの文字データが属する項目名とを対応付けて認識履歴DB43に記憶し、認識履歴DB43を検索する際に項目名の中から文字データを検索する。   In the second embodiment, the recognition control unit 45 searches for a character to which a confirmation flag is assigned, but in the fifth embodiment, as shown in FIG. In addition, in the recognition history DB 43, item names are stored in association with the item IDs in addition to the characters of the recognition result. That is, the recognition control unit 45 stores the character data of the recognition result in association with the item name to which the character data belongs in the recognition history DB 43, and searches the character data from the item name when searching the recognition history DB 43. .

この第5実施形態では、以前と同じ項目の文字がOCRエンジン44の認識結果として得られた場合、認識制御部45は同一項目の中から認識履歴DB43を検索することで、検索対象を同じ項目に絞り込んで検索する。   In the fifth embodiment, when the characters of the same item as before are obtained as the recognition result of the OCR engine 44, the recognition control unit 45 searches the recognition history DB 43 from the same items, thereby setting the search target to the same item. Search by narrowing down to.

このようにこの第5実施形態によれば、同一項目に複数の認識結果の文字データを紐付けて認識履歴DB43に登録しておくことで、同じ項目の文字データを認識した場合、同一項目の中から文字データを検索することで、検索対象を絞り込むことができ、文字認識の開始から検索結果の表示までの時間を短縮することができる。   As described above, according to the fifth embodiment, when character data of the same item is recognized by associating a plurality of recognition result character data with the same item and registering them in the recognition history DB 43, By searching for character data from the inside, the search target can be narrowed down, and the time from the start of character recognition to the display of the search result can be shortened.

(第6実施形態)
続いて、図16を参照して第6実施形態を説明する。なおこの第6実施形態は第5実施形態とほぼ同じ構成であり、認識履歴DB43の内容と認識制御部45の検索機能が異なるため、この点について説明する。
(Sixth embodiment)
Next, a sixth embodiment will be described with reference to FIG. The sixth embodiment has substantially the same configuration as the fifth embodiment, and the contents of the recognition history DB 43 and the search function of the recognition control unit 45 are different. This point will be described.

上記第5実施形態では、認識履歴DB43の項目IDに項目名を対応付けたが、この第6実施形態では、履歴情報にさらに項目グループを紐付けるように、図16に示すように、認識履歴DB43には、項目IDに対応付けて認識結果の文字データ、項目名の他に項目グループが記憶される。すなわち認識制御部45は認識結果の文字データとこの文字データが属する項目グループとを対応付けて認識履歴DB43に記憶し、認識履歴DB43を検索する際に、項目グループの中から文字データを検索する。   In the fifth embodiment, the item name is associated with the item ID of the recognition history DB 43. However, in the sixth embodiment, as shown in FIG. The DB 43 stores item groups in addition to character data and item names as recognition results in association with item IDs. That is, the recognition control unit 45 stores the character data of the recognition result in association with the item group to which the character data belongs in the recognition history DB 43, and searches the character data from the item group when searching the recognition history DB 43. .

この第6実施形態では、以前と同じ項目グループに属する文字データがOCRエンジン44の認識結果として得られた場合、認識制御部45は同一項目グループの中から認識履歴DB43を検索することで、検索対象を項目グループに絞り込んで検索する。   In the sixth embodiment, when character data belonging to the same item group as before is obtained as a recognition result of the OCR engine 44, the recognition control unit 45 searches the recognition history DB 43 from the same item group, thereby performing a search. Search by narrowing the target to the item group.

このようにこの第6実施形態によれば、項目グループと項目名を認識結果の文字データと紐付けて認識履歴DB43に登録しておくことで、同じ項目グループの文字データを認識した場合、同一項目グループの中から文字データを検索することで、検索対象を同じ項目グループに絞り込むことができ、文字認識にかかる時間を短縮することができる。   As described above, according to the sixth embodiment, the item group and the item name are associated with the character data of the recognition result and registered in the recognition history DB 43. By searching for character data from the item group, the search target can be narrowed down to the same item group, and the time required for character recognition can be shortened.

(第7実施形態)
続いて、図17乃至図19を参照して第7実施形態を説明する。なお、この第7実施形態において第1乃至第6実施形態と同じ構成には同一の符号を付しその説明は省略する。
(Seventh embodiment)
Subsequently, the seventh embodiment will be described with reference to FIGS. 17 to 19. Note that the same reference numerals in the seventh embodiment denote the same parts as in the first to sixth embodiments, and a description thereof will be omitted.

図17に示すように、この第7実施形態の帳票読取システムは、電子機器または携帯端末としてのタブレット端末1とこのタブレット端末1とネットワーク7を介して接続された外部システム8と、同じくネットワーク7を介して接続された外部文字認識システム82(例えばクラウドサービスとして存在するシステム)とを備える。   As shown in FIG. 17, the form reading system of the seventh embodiment includes a tablet terminal 1 as an electronic device or a portable terminal, an external system 8 connected to the tablet terminal 1 via a network 7, and a network 7 And an external character recognition system 82 (for example, a system that exists as a cloud service) connected via the Internet.

図18に示すように、タブレット端末1は、画像取得部10、画面制御部20、文字認識依頼部401、文字認識確定部402、エントリ情報更新部50を備える。ネットワーク7には外部文字認識システム82が接続されている。外部文字認識システム82はタブレット端末1とネットワーク7を介して接続されている。外部文字認識システム82は文字認識部811、帳票定義体DB8141および文字種辞書DB8142を備える。   As illustrated in FIG. 18, the tablet terminal 1 includes an image acquisition unit 10, a screen control unit 20, a character recognition request unit 401, a character recognition confirmation unit 402, and an entry information update unit 50. An external character recognition system 82 is connected to the network 7. The external character recognition system 82 is connected to the tablet terminal 1 via the network 7. The external character recognition system 82 includes a character recognition unit 811, a form definition DB 8141, and a character type dictionary DB 8142.

文字認識依頼部401は、OCR対象帳票受付部23で指定された帳票画像と、OCR対象エントリ項目エリア受付部25で指定されたエントリ項目座標に基づき、帳票画像のうちの一部の画像を切り出す画像切出部4011と、この画像切出部4011により切り出された、切り出し画像データのファイル(以下「切り出し画像ファイル」と称す)と、OCR対象エントリ項目受付部24で指定されたエントリ項目の項目名とを、ネットワークなどに接続された外部文字認識システム81に文字認識を依頼する文字認識依頼送受信部4012とを有する。   The character recognition requesting unit 401 cuts out a part of the form image based on the form image specified by the OCR target form receiving unit 23 and the entry item coordinates specified by the OCR target entry item area receiving unit 25. Image cutout unit 4011, a cutout image data file cut out by the image cutout unit 4011 (hereinafter referred to as “cutout image file”), and entry item items designated by the OCR target entry item receiving unit 24 And a character recognition request transmission / reception unit 4012 that requests the external character recognition system 81 connected to a network or the like to perform character recognition.

文字認識依頼送受信部4012は切り出し画像ファイルと、OCR対象エントリ項目受付部24で指定されたエントリ項目の項目名と、を外部文字認識システム81に送信して文字認識を依頼しこの依頼に対して外部文字認識システム81から受信された文字認識結果の文字データを受信する。   The character recognition request transmission / reception unit 4012 sends the cut-out image file and the item name of the entry item specified by the OCR target entry item reception unit 24 to the external character recognition system 81 to request character recognition. The character data of the character recognition result received from the external character recognition system 81 is received.

文字認識確定部402は、エントリ項目名とこの項目内容として入る文字認識した結果の文字データにより、エントリ項目内容を生成するエントリ項目内容生成部4021と、認識結果記憶部43とを有する。   The character recognition confirmation unit 402 includes an entry item content generation unit 4021 that generates entry item content based on the entry item name and character data obtained as a result of character recognition entered as the item content, and a recognition result storage unit 43.

エントリ項目内容生成部4021は受け取った認識結果の文字データ(以下「認識結果文字データ」と称す)と一致または類似度が一定値以上の認識結果文字データ候補を認識履歴DB43より検索し、エントリ画面70の該当する表示欄73および表示欄73近傍に表示する認識制御部として機能する。   The entry item content generation unit 4021 searches the recognition history DB 43 for a recognition result character data candidate that matches or is similar to the received recognition result character data (hereinafter referred to as “recognition result character data”) or a similarity value, and displays the entry screen. It functions as a recognition control unit for displaying in the corresponding display field 73 and the vicinity of the display field 73.

すなわちこの第7実施形態のタブレット端末1は、帳票画像71とこの帳票画像71から文字認識した結果の文字データとが表示される表示欄を有するエントリ画面70を出力する画面制御部20と、帳票画像71の指定されたエリアの画像部分を画像ファイルにして外部文字認識システム81に送信し文字認識を依頼する文字認識依頼部401と、文字認識の結果が認識履歴として記憶された認識履歴DB43と、文字認識の依頼に対して外部文字認識システム81から受信した認識結果文字データと一致または類似度が一定値以上の認識結果文字データ候補を認識履歴DB43より検索し、エントリ画面70の該当する表示欄73および表示欄73近傍に表示するエントリ項目内容生成部4021とを備える。   That is, the tablet terminal 1 according to the seventh embodiment includes a screen control unit 20 that outputs an entry screen 70 having a display field in which a form image 71 and character data obtained as a result of character recognition from the form image 71 are displayed, and a form. A character recognition request unit 401 that transmits an image portion of the designated area of the image 71 as an image file to the external character recognition system 81 to request character recognition; a recognition history DB 43 in which character recognition results are stored as a recognition history; In response to the character recognition request, a recognition result character data candidate that matches or is similar to the recognition result character data received from the external character recognition system 81 is searched from the recognition history DB 43, and the corresponding entry screen 70 is displayed. A column 73 and an entry item content generation unit 4021 to be displayed in the vicinity of the display column 73.

続いて、図19を参照してこの第7実施形態の帳票読取システムの動作を説明する。
この第7実施形態の場合、帳票Aをカメラ部2が撮影し、撮影された帳票画像71が帳票画像書込部11により帳票画像DB12へ書き込まれる。
Next, the operation of the form reading system according to the seventh embodiment will be described with reference to FIG.
In the case of the seventh embodiment, the camera unit 2 captures the form A, and the captured form image 71 is written into the form image DB 12 by the form image writing unit 11.

対象となる全ての帳票を撮影し終えると、処理を終了し、対象となる全ての帳票を撮影し終えていなければ、上記撮影処理を繰り返す。   When all of the target forms have been photographed, the process ends. When all of the target forms have not been photographed, the above photographing process is repeated.

続いて、オペレータが、エントリ画面70の帳票画像読み込み釦(図示せず)をタップすると、画面制御部20の帳票画像読出部21は、帳票画像DB12に蓄積されている一つ以上の帳票画像71を読み出し、タッチパネル3のエントリ画面70に帳票画像71のサムネイル一覧を表示する。   Subsequently, when the operator taps a form image reading button (not shown) on the entry screen 70, the form image reading unit 21 of the screen control unit 20 has one or more form images 71 stored in the form image DB 12. And a thumbnail list of the form image 71 is displayed on the entry screen 70 of the touch panel 3.

ここで、オペレータがエントリ画面70のサムネイル一覧の中から所望のサムネイルを選んで、タッチパネル3をタップ操作(サムネイルを指定)すると、OCR対象帳票受付部23はサムネイルの指定を受け付け、指定されたサムネイルに対応する帳票画像71をOCR対象として確定し、エントリ画面70ほぼ全体に操作用として表示する(図8参照)(図19のステップS501)。   Here, when the operator selects a desired thumbnail from the thumbnail list on the entry screen 70 and taps the touch panel 3 (designates a thumbnail), the OCR target form accepting unit 23 accepts the designation of the thumbnail, and the designated thumbnail. The form image 71 corresponding to is determined as an OCR object, and is displayed for operation on almost the entire entry screen 70 (see FIG. 8) (step S501 in FIG. 19).

続いて、オペレータがエントリ画面70の項目名のチェックボックス72を選び、指でタップしてエントリ項目の項目名を指定すると、OCR対象エントリ項目受付部24はOCR対象のエントリ項目の項目名の指定を受け付ける。   Subsequently, when the operator selects the item name check box 72 on the entry screen 70 and taps it with his / her finger to specify the item name of the entry item, the OCR target entry item receiving unit 24 specifies the item name of the OCR target entry item. Accept.

ここで、オペレータが、指でタッチパネル3(エントリ画面70)の帳票画像71のOCR箇所をタップして読取エリア(の開始点)をポイントで指定すると(ステップS502のYes)、OCR対象エントリ項目エリア受付部25は、そのポイントされた位置を受け付け、その位置から一定の方向(水平方向)にある文字画像を囲む枠線80を表示する。   Here, when the operator taps the OCR portion of the form image 71 of the touch panel 3 (entry screen 70) with a finger and designates the reading area (starting point) with a point (Yes in step S502), the OCR target entry item area The receiving unit 25 receives the pointed position and displays a frame line 80 that surrounds the character image in a certain direction (horizontal direction) from the position.

そして、文字認識依頼部401の画像切出部4011は、枠線80で特定されたエントリ項目の項目名と読取エリアの座標に基づいて帳票画像71から文字画像を切り出して画像ファイル(以下、「切り出し画像ファイル」という)とし、この切り出し画像ファイルを、文字認識依頼送受信部4012が、エントリ項目の項目名とともに外部文字認識システム81にネットワークなどを介して送信し、文字認識を依頼する(ステップS503)。   Then, the image cutout unit 4011 of the character recognition requesting unit 401 cuts out a character image from the form image 71 based on the item name of the entry item specified by the frame line 80 and the coordinates of the reading area, and an image file (hereinafter, “ The character recognition request transmission / reception unit 4012 transmits the cut image file together with the item name of the entry item to the external character recognition system 81 via a network or the like to request character recognition (step S503). ).

外部文字認識システム81は、タブレット端末1から受信した切り出し画像ファイルを、文字認識部811にて文字認識し、認識結果文字データを対象のエントリ項目の項目名と対応させ、帳票定義体DB8141からエントリ項目定義体の対応する項目名(例えば氏名)の定義情報1(文字種、例えば漢字)、定義情報2(文字数、例えば20)と、文字種辞書DB8142から文字種の辞書を読み出して、これらの情報を参照して文字認識結果を確定し、確定した認識結果をベリファイ処理する。ベリファイ処理後にネットワークを介して、エントリ項目の項目名と文字データをタブレット端末1の文字認識依頼送受信部4012に送信する(ステップS504)。   The external character recognition system 81 recognizes characters in the clipped image file received from the tablet terminal 1 by the character recognition unit 811, associates the recognition result character data with the item name of the target entry item, and enters the entry from the form definition DB 8141. Read the definition information 1 (character type, for example, kanji) and the definition information 2 (number of characters, for example, 20) of the corresponding item name (for example, name) of the item definition body and the character type dictionary from the character type dictionary DB 8142 and refer to these information Then, the character recognition result is confirmed, and the confirmed recognition result is verified. After the verification process, the item name and character data of the entry item are transmitted to the character recognition request transmission / reception unit 4012 of the tablet terminal 1 via the network (step S504).

タブレット端末1では、外部文字認識システム81から送られてきた認識結果の文字データが文字認識依頼送受信部4012により受信されると、文字認識依頼送受信部4012は受信した認識結果文字データを文字認識確定部402に渡す。   In the tablet terminal 1, when the character recognition request transmission / reception unit 4012 receives the recognition result character data sent from the external character recognition system 81, the character recognition request transmission / reception unit 4012 determines the received recognition result character data as character recognition. To the unit 402.

文字認識確定部402のエントリ項目内容生成部4021は、受信した認識結果文字データとエントリ項目の項目名とを、対応させて生成し確定するとともに、認識結果の文字データをエントリ項目に対応する表示欄73に表示する。   The entry item content generation unit 4021 of the character recognition confirmation unit 402 generates and confirms the received recognition result character data and the item name of the entry item in association with each other, and displays the character data of the recognition result corresponding to the entry item. It is displayed in the column 73.

なお、ステップS504以降処理(S104〜S109)については、第1実施形態でしたとおりであり、その説明は省略する。   Note that the processing subsequent to step S504 (S104 to S109) is the same as in the first embodiment, and a description thereof will be omitted.

このように第7実施形態によれば、文字認識をタブレット端末1外であって、例えばクラウドサービス上に存在する文字認識システムで構成することにより、負荷がかかる文字認識処理は外部の文字認識システムにて行い、タブレット端末1内の処理をより軽く実現することができる。   As described above, according to the seventh embodiment, character recognition is performed by an external character recognition system by configuring character recognition outside the tablet terminal 1, for example, with a character recognition system existing on the cloud service. The processing in the tablet terminal 1 can be realized more lightly.

本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上記新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although the embodiment of the present invention has been described, the above embodiment is presented as an example, and is not intended to limit the scope of the invention. The novel embodiment can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. The above-described embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and equivalents thereof.

上記実施形態では、表示機能と入力機能を一体化したタッチパネル3を有するタブレット端末1を例にして説明したが、この他、例えば表示機能と入力機能を別個に備えたノート形コンピュータや、LCDパネルなどの表示装置とキーボードなどの入力装置とを別個に用意し外部接続したコンピュータや、キーボード、マウス、ポインティングデバイスなどの入力装置を備え、表示装置のみを外部接続した構成のコンピュータまたは表示装置を備え入力装置のみを外部接続した構成のコンピュータであってもよい。   In the above embodiment, the tablet terminal 1 having the touch panel 3 in which the display function and the input function are integrated has been described as an example. However, in addition to this, for example, a notebook computer having a separate display function and input function, or an LCD panel A computer with a configuration in which a display device such as a keyboard and an input device such as a keyboard are prepared separately and connected externally, or an input device such as a keyboard, mouse, pointing device, etc., and only the display device is connected externally A computer having a configuration in which only the input device is externally connected may be used.

また上記実施形態では、各構成要素を、タブレット(コンピュータ)のメモリなどにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM,DVD−ROMなどの記録媒体やフラッシュメモリ、リムーバブルメディア:Removable mediaなどが含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。   In the above-described embodiment, each component is realized by a program installed in a memory of a tablet (computer). However, the program is stored in a computer-readable electronic medium: electronic media, and the program is stored in the electronic medium. The computer may realize the functions of the present invention by causing the computer to read the information. Examples of the electronic medium include recording media such as CD-ROM and DVD-ROM, flash memory, removable media, and the like. Further, the configuration may be realized by distributing and storing components in different computers connected via a network, and communicating between computers in which the components are functioning.

上記実施形態では、帳票画像の取得機能から文字認識および訂正機能、外部システム8へのエントリ機能などをタブレット端末1に収容した例と、文字認識機能を外部文字認識システム81で実現する例を説明したが、タブレット端末1は、帳票画像の取得機能を収容し、その他の機能(画像処理、画像切り出し、文字認識)を外部文字認識システム81で実現してもよい。また、一部の機能、例えば訂正機能などを外部システム(クラウドサービスなど)で実現してもよい。   In the above embodiment, an example in which the form image acquisition function to the character recognition and correction function, the entry function to the external system 8 and the like are accommodated in the tablet terminal 1 and the example in which the character recognition function is realized by the external character recognition system 81 will be described. However, the tablet terminal 1 may accommodate a form image acquisition function and realize other functions (image processing, image segmentation, character recognition) with the external character recognition system 81. Also, some functions, such as a correction function, may be realized by an external system (such as a cloud service).

さらにタブレット端末1にカメラ部2とタッチパネル3とWebブラウザ(通信インターフェース)の機能だけを搭載し、他の機能を外部システム8(クラウドサービスなど)で実現してもよい。   Further, only the functions of the camera unit 2, the touch panel 3, and the web browser (communication interface) may be mounted on the tablet terminal 1, and other functions may be realized by the external system 8 (cloud service or the like).

A…帳票、1…タブレット端末、2…カメラ部、3…タッチパネル、5…メモリ、6…通信インターフェース(通信I/F)、7…ネットワーク、8…外部システム、9…スキャナ、10…画像取得部、11…帳票画像書込部、12…帳票画像データベース(帳票画像DB)、13…ストレージ、20…画面制御部、21…帳票画像読出部、22…画面生成部、23…OCR対象帳票受付部、24…OCR対象エントリ項目受付部、25…OCR対象エントリ項目エリア受付部、40…文字認識部、41…帳票定義体データベース(帳票定義体DB)、42…文字種辞書データベース(文字種辞書DB)、47…認識履歴データベース(認識履歴DB)、43…認識履歴DB、44…OCRエンジン、45…認識制御部、46…訂正部、50…エントリ情報更新部、52…エントリ情報書込部、53…エントリ情報送信部、51…エントリ情報データベース(エントリ情報DB)、81…外部文字認識システム、401…文字認識依頼部、402…文字認識確定部、811…文字認識部、4011…画像切出部、4012…文字認識依頼送受信部、4021…エントリ項目内容生成部。   A ... Form, 1 ... Tablet terminal, 2 ... Camera unit, 3 ... Touch panel, 5 ... Memory, 6 ... Communication interface (communication I / F), 7 ... Network, 8 ... External system, 9 ... Scanner, 10 ... Image acquisition , 11 ... Form image writing part, 12 ... Form image database (form image DB), 13 ... Storage, 20 ... Screen control part, 21 ... Form image reading part, 22 ... Screen generation part, 23 ... OCR target form reception , 24... OCR target entry item reception unit, 25... OCR target entry item area reception unit, 40... Character recognition unit, 41... Form definition database (form definition DB), 42. , 47 ... Recognition history database (recognition history DB), 43 ... Recognition history DB, 44 ... OCR engine, 45 ... Recognition control unit, 46 ... Correction unit, 50 Entry information update unit, 52 ... Entry information writing unit, 53 ... Entry information transmission unit, 51 ... Entry information database (entry information DB), 81 ... External character recognition system, 401 ... Character recognition request unit, 402 ... Character recognition confirmation , 811 ... Character recognition unit, 4011 ... Image cutout unit, 4012 ... Character recognition request transmission / reception unit, 4021 ... Entry item content generation unit.

Claims (11)

帳票を光学的に読み取って得られた帳票の画像から文字を読み取る帳票読取装置において、
前記帳票の画像と前記画像から文字認識した結果の文字データとが表示される表示欄を有する画面を出力する画面制御部と、
前記帳票の画像の指定されたエリアの画像部分を文字認識する文字認識部と、
文字認識の結果が認識履歴として記憶された認識履歴記憶部と、
前記文字認識部により文字認識された文字データと一致する文字データおよび類似度が一定値以上の認識結果の文字データ候補を前記認識履歴記憶部より検索し、前記表示欄および前記表示欄近傍に表示する認識制御部と
を具備する文字読取装置。
In the form reading device that reads characters from the form image obtained by optically reading the form,
A screen control unit for outputting a screen having a display field in which the image of the form and character data obtained as a result of character recognition from the image are displayed;
A character recognizing unit for recognizing the image portion of the designated area of the image of the form;
A recognition history storage unit in which the result of character recognition is stored as a recognition history;
Character data that matches the character data recognized by the character recognition unit and character data candidates with a recognition result having a similarity equal to or greater than a certain value are searched from the recognition history storage unit and displayed near the display field and the display field. A character reading device.
前記認識制御部は、
前記表示欄または前記表示欄近傍に表示された前記文字データまたは文字データ候補のうち選択された文データ字、文字データ候補または前記文字データをキー入力により訂正した文字データを文字認識の結果として確定し前記認識履歴記憶部に記憶する請求項1記載の文字読取装置。
The recognition control unit
Character data obtained by correcting the selected text data character, character data candidate, or character data by key input from the character data or character data candidates displayed in the display field or in the vicinity of the display field is determined as a result of character recognition. The character reading device according to claim 1, wherein the character reading device is stored in the recognition history storage unit.
前記認識制御部は、
前記文字認識部により文字認識された文字データを前記表示欄に表示し、類似度の高い認識結果の文字データ候補を前記表示欄近傍に表示する請求項1記載の帳票読取装置。
The recognition control unit
The form reading apparatus according to claim 1, wherein the character data recognized by the character recognition unit is displayed in the display field, and character data candidates of a recognition result having a high similarity are displayed in the vicinity of the display field.
前記認識制御部は、
前記認識履歴記憶部から読み出した文字データを文字認識の結果として前記表示欄に表示する請求項1記載の帳票読取装置。
The recognition control unit
The form reading apparatus according to claim 1, wherein the character data read from the recognition history storage unit is displayed in the display field as a result of character recognition.
前記認識制御部は、
認識結果の文字データとオペレータが確認したことを示す識別子とを対応付けて前記認識履歴記憶部に記憶し、
前記認識履歴記憶部を検索する際に、前記識別子が付与された文字データの中から検索する請求項1記載の帳票読取装置。
The recognition control unit
Storing the recognition result character data and the identifier indicating that the operator has confirmed in the recognition history storage unit in association with each other;
The form reading apparatus according to claim 1, wherein when searching the recognition history storage unit, the form data is searched from character data to which the identifier is assigned.
前記認識制御部は、
認識結果の文字データとこの文字データが属する項目名とを対応付けて前記認識履歴記憶部に記憶し、
前記認識履歴記憶部を検索する際に、前記項目名の中から文字データを検索する請求項1記載の帳票読取装置。
The recognition control unit
The recognition result character data and the item name to which the character data belongs are associated with each other and stored in the recognition history storage unit,
The form reading device according to claim 1, wherein character data is searched from the item names when searching the recognition history storage unit.
前記認識制御部は、
認識結果の文字データとこの文字データが属する項目グループとを対応付けて前記認識履歴記憶部に記憶し、
前記認識履歴記憶部を検索する際に、前記項目グループの中から文字データを検索する請求項1記載の帳票読取装置。
The recognition control unit
Storing the recognition result character data and the item group to which the character data belongs in the recognition history storage unit in association with each other;
The form reading apparatus according to claim 1, wherein character data is searched from the item group when searching the recognition history storage unit.
前記認識制御部は、
前記文字認識部による文字認識が不可能な文字が含まれていた場合、同じエリアから認識された他の文字データを用いて前記認識履歴記憶部より検索された類似度の高い文字データ候補を認識結果の文字データとして前記表示欄に表示する請求項1記載の帳票読取装置。
The recognition control unit
When a character that cannot be recognized by the character recognition unit is included, a character data candidate with a high similarity retrieved from the recognition history storage unit is recognized using other character data recognized from the same area. The form reading apparatus according to claim 1, wherein the form reading data is displayed in the display field as result character data.
帳票を光学的に読み取って得られた前記帳票の画像から文字を読み取るコンピュータにおいて、
前記コンピュータを、
前記帳票の画像と前記画像から文字認識した結果の文字データとが表示される表示欄を有する画面を出力する画面制御部と、
前記帳票の画像の指定されたエリアの画像部分を文字認識する文字認識部と、
文字認識の結果が認識履歴として記憶された認識履歴記憶部と、
前記文字認識部により文字データ認識された文字データと一致する文字データおよび類似度が一定値以上の認識結果の文字データ候補を前記認識履歴記憶部より検索し、前記表示欄および前記表示欄近傍に表示する認識制御部
として機能させるプログラム。
In a computer that reads characters from the image of the form obtained by optically reading the form,
The computer,
A screen control unit for outputting a screen having a display field in which the image of the form and character data obtained as a result of character recognition from the image are displayed;
A character recognizing unit for recognizing the image portion of the designated area of the image of the form;
A recognition history storage unit in which the result of character recognition is stored as a recognition history;
Character data that matches the character data recognized by the character recognition unit and character data candidates whose recognition result is a certain value or more are searched from the recognition history storage unit, and are displayed in the display field and the vicinity of the display field. A program that functions as a recognition control unit for display.
帳票を光学的に読み取って得られた前記帳票の画像から文字を読み取る端末装置と、文字認識装置とをネットワークで接続した帳票読取システムであって、
前記端末装置は、
前記帳票の画像と前記画像から文字認識した結果の文字データとが表示される表示欄を有する画面を出力する画面制御部と、
前記帳票の画像の指定されたエリアの画像部分を画像ファイルにして前記文字認識装置に送信し文字認識を依頼する文字認識依頼部と、
文字認識の結果が認識履歴として記憶された認識履歴記憶部と、
文字認識の依頼に対して前記文字認識装置から受信した認識結果文字データと一致または類似度が一定値以上の認識結果文字データ候補を前記認識履歴記憶部より検索し、前記表示欄および前記表示欄近傍に表示する認識制御部とを備え、
を備え、
前記文字認識装置は、
前記端末装置から送信された画像ファイルを文字認識して認識結果文字データとして前記端末装置に送信する文字認識部を備える帳票読取システム。
A form reading system in which a terminal device for reading characters from an image of the form obtained by optically reading a form and a character recognition device are connected via a network,
The terminal device
A screen control unit for outputting a screen having a display field in which the image of the form and character data obtained as a result of character recognition from the image are displayed;
A character recognition requesting unit for requesting character recognition by transmitting an image portion of a designated area of the image of the form as an image file to the character recognition device;
A recognition history storage unit in which the result of character recognition is stored as a recognition history;
In response to a character recognition request, a recognition result character data candidate that matches or is similar to the recognition result character data received from the character recognition device is searched from the recognition history storage unit, and the display field and the display field A recognition control unit for displaying in the vicinity,
With
The character recognition device includes:
A form reading system including a character recognition unit that recognizes characters of an image file transmitted from the terminal device and transmits the recognition result character data to the terminal device.
前記端末装置と、前記文字認識装置と、さらに外部システムとをネットワークで接続し、
前記端末装置は、
前記表示欄および前記表示欄近傍に表示された中から選択された認識結果文字データまたは認識結果文字データ候補を文字認識の結果として確定し前記認識履歴記憶部に記憶する文字認識確定部と、
前記認識履歴記憶部に記憶された認識履歴のうち確定した文字認識の結果を保存するエントリ情報データベースと、
このエントリ情報データベースの文字認識の結果を前記外部システムに送信するエントリ情報送信部と
を備える請求項10記載の帳票読取システム。
Connecting the terminal device, the character recognition device, and an external system via a network;
The terminal device
A character recognition confirmation unit that confirms the recognition result character data or recognition result character data candidates selected from among the display column and the display column displayed in the vicinity of the display column, and stores the recognition result character data candidate in the recognition history storage unit;
An entry information database for storing a result of character recognition confirmed among the recognition histories stored in the recognition history storage unit;
The form reading system according to claim 10, further comprising an entry information transmitting unit that transmits a result of character recognition in the entry information database to the external system.
JP2013230738A 2013-11-06 2013-11-06 Form reading device, program, and form reading system Active JP6253354B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013230738A JP6253354B2 (en) 2013-11-06 2013-11-06 Form reading device, program, and form reading system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013230738A JP6253354B2 (en) 2013-11-06 2013-11-06 Form reading device, program, and form reading system

Publications (2)

Publication Number Publication Date
JP2015090625A true JP2015090625A (en) 2015-05-11
JP6253354B2 JP6253354B2 (en) 2017-12-27

Family

ID=53194108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013230738A Active JP6253354B2 (en) 2013-11-06 2013-11-06 Form reading device, program, and form reading system

Country Status (1)

Country Link
JP (1) JP6253354B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018085093A (en) * 2016-11-17 2018-05-31 キヤノンマーケティングジャパン株式会社 Information processing apparatus, control method, and program
JP2018151925A (en) * 2017-03-14 2018-09-27 日本電気株式会社 Terminal, character recognition system, control method of terminal and program
JPWO2020218471A1 (en) * 2019-04-24 2020-10-29
JP2021149531A (en) * 2020-03-19 2021-09-27 株式会社Pfu Information processor, correction candidate display method, and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10434704B2 (en) 2017-08-18 2019-10-08 Ppg Industries Ohio, Inc. Additive manufacturing using polyurea materials

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108867A (en) * 1991-10-15 1993-04-30 Nippon Telegr & Teleph Corp <Ntt> Pattern recognizing device
JP2002207960A (en) * 2001-01-12 2002-07-26 Nippon Digital Kenkyusho:Kk Method and program for recognized character correction
JP2013196479A (en) * 2012-03-21 2013-09-30 Toshiba Corp Information processing system, information processing program, and information processing method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108867A (en) * 1991-10-15 1993-04-30 Nippon Telegr & Teleph Corp <Ntt> Pattern recognizing device
JP2002207960A (en) * 2001-01-12 2002-07-26 Nippon Digital Kenkyusho:Kk Method and program for recognized character correction
JP2013196479A (en) * 2012-03-21 2013-09-30 Toshiba Corp Information processing system, information processing program, and information processing method

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018085093A (en) * 2016-11-17 2018-05-31 キヤノンマーケティングジャパン株式会社 Information processing apparatus, control method, and program
JP2018151925A (en) * 2017-03-14 2018-09-27 日本電気株式会社 Terminal, character recognition system, control method of terminal and program
JP7091606B2 (en) 2017-03-14 2022-06-28 日本電気株式会社 Terminals, character recognition systems, terminal control methods and programs
JPWO2020218471A1 (en) * 2019-04-24 2020-10-29
WO2020218471A1 (en) * 2019-04-24 2020-10-29 日本電気株式会社 Processing device, processing method, and program
JP7319011B2 (en) 2019-04-24 2023-08-01 株式会社しんきん情報サービス Processing device, processing method and program
JP2021149531A (en) * 2020-03-19 2021-09-27 株式会社Pfu Information processor, correction candidate display method, and program
JP7421384B2 (en) 2020-03-19 2024-01-24 株式会社Pfu Information processing device, correction candidate display method, and program

Also Published As

Publication number Publication date
JP6253354B2 (en) 2017-12-27

Similar Documents

Publication Publication Date Title
US9785627B2 (en) Automated form fill-in via form retrieval
US10120537B2 (en) Page-independent multi-field validation in document capture
US8244037B2 (en) Image-based data management method and system
JP6253354B2 (en) Form reading device, program, and form reading system
WO2013004036A1 (en) Business card recognition method combining character recognition and image matching
CN110999264B (en) System and method for integrating message content into a target data processing device
US9934212B2 (en) Methods and systems for capturing, sharing, and printing annotations
JP4867941B2 (en) Form processing method, form processing program, form processing apparatus, and form processing system
JP6230878B2 (en) Form reading device, program, and form reading system
JP2014229091A (en) Program for character input
US20170132462A1 (en) Document checking support apparatus, document checking support system, and non-transitory computer readable medium
JP2018097580A (en) Information processing device and program
US20190258656A1 (en) Apparatus, method, and computer-readable medium for recognition of a digital document
TWI688868B (en) System, non-transitory computer readable medium and method for extracting information and retrieving contact information using the same
JP6325604B2 (en) Personal information registration and management system
JP2017220266A (en) Document reading device, program and document reading method
JP2022075467A (en) Data processing device, data processing method, and program
US10165149B2 (en) Methods and systems for automatically generating a name for an electronic document
JP6165595B2 (en) Form identification system
JP2008176625A (en) Device and method for managing character recognition result, and computer program
JP5913774B2 (en) Web site sharing method, electronic device, and computer program
JP2018206423A (en) User information input assistance system
KR101659886B1 (en) business card ordering system and method
US20240040232A1 (en) Information processing apparatus, method thereof, and program thereof, and information processing system
JPH1063813A (en) Method for managing image document and device therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171128

R150 Certificate of patent or registration of utility model

Ref document number: 6253354

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150