JP2021005173A - Ocr recognition result confirmation support program, ocr recognition result confirmation support method, and ocr recognition result confirmation support system - Google Patents
Ocr recognition result confirmation support program, ocr recognition result confirmation support method, and ocr recognition result confirmation support system Download PDFInfo
- Publication number
- JP2021005173A JP2021005173A JP2019117796A JP2019117796A JP2021005173A JP 2021005173 A JP2021005173 A JP 2021005173A JP 2019117796 A JP2019117796 A JP 2019117796A JP 2019117796 A JP2019117796 A JP 2019117796A JP 2021005173 A JP2021005173 A JP 2021005173A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- character
- recognition result
- confirmation
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012790 confirmation Methods 0.000 title claims abstract description 225
- 238000000034 method Methods 0.000 title claims description 55
- 238000012545 processing Methods 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 description 18
- 239000010931 gold Substances 0.000 description 15
- 229910052737 gold Inorganic materials 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000001174 ascending effect Effects 0.000 description 8
- 238000007493 shaping process Methods 0.000 description 8
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013498 data listing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Abstract
Description
本発明は、文字認識(OCR:Optical Character Recognition)結果の確認を支援するOCR認識結果確認支援プログラム、OCR認識結果確認支援方法およびOCR認識結果確認支援システムに関する。 The present invention relates to an OCR recognition result confirmation support program that supports confirmation of character recognition (OCR: Optical Character Recognition) results, an OCR recognition result confirmation support method, and an OCR recognition result confirmation support system.
OCRを用いることで手書き文字をデータ化することができる。例えば、帳票に記入された手書き文字を文字認識することで、帳票の記入内容をテキストデータ等にデータ化し、帳票データのデータベースを構築できる。 Handwritten characters can be converted into data by using OCR. For example, by recognizing the handwritten characters entered in the form, the contents of the form can be converted into text data or the like, and a database of form data can be constructed.
OCRによる文字認識では、手書きされた文字の形状や大きさ等が一様ではないため、文字認識に誤りが生じることがある。このため、手書きされた文字のイメージデータ(例えば画像データ)と、OCR結果のデータ(例えばテキストデータ)とを見比べて、文字認識結果の正誤をユーザが確認する作業を行う。 In character recognition by OCR, since the shape and size of handwritten characters are not uniform, character recognition may be erroneous. Therefore, the user confirms the correctness of the character recognition result by comparing the handwritten character image data (for example, image data) with the OCR result data (for example, text data).
文字認識結果の確認に関連する技術として、OCRの認識結果を色や品詞等のパターン毎にクラスタリングし、同じ文字パターンとして文字認識された複数の画像パターンの認識結果を並べて表示し、確認させるオペレータを選択する技術が開示されている。また、同じ認識結果となった文字イメージから類似するもの同士をクラスタリングして同じクラスタと判定された文字イメージ同士を並べて表示する技術が開示されている。また、認識元の文字列のイメージを1文字毎に分解し、指定された認識結果1文字分の前後の文字のイメージを連結してソートしたものを一覧表示する技術が開示されている。また、文書画像内の図、罫線、画像、表等の領域認識結果と、領域内の文字認識結果を併せて表示する技術が開示されている。 As a technology related to confirmation of character recognition results, an operator that clusters OCR recognition results for each pattern such as color and part of speech, and displays and confirms the recognition results of multiple image patterns that have been recognized as the same character pattern side by side. The technology for selecting is disclosed. Further, there is disclosed a technique of clustering similar character images from character images having the same recognition result and displaying the character images determined to be the same cluster side by side. Further, a technique is disclosed in which an image of a character string of a recognition source is decomposed for each character, and images of characters before and after the specified recognition result of one character are concatenated and sorted to be displayed in a list. Further, a technique for displaying the area recognition result of a figure, a ruled line, an image, a table, etc. in a document image and the character recognition result in the area are disclosed.
従来技術では、OCRにより得られた文字認識結果の確認作業を効率化できなかった。例えば、確認リスト上に確認対象として並べる手書き文字が複数の文字の文字列からなり各文字のサイズが違う場合、単に同じ文字列のイメージを並べただけでは、比較すべき各文字同士の位置が異なり、容易に確認することができない。 In the prior art, the confirmation work of the character recognition result obtained by OCR could not be made efficient. For example, if the handwritten characters to be confirmed on the confirmation list consist of multiple character strings and the size of each character is different, simply arranging the images of the same character string will determine the position of each character to be compared. Unlike, it cannot be easily confirmed.
また、ユーザの癖により手書き文字の大きさが文字毎に異なる場合、同じ文字のイメージ(字形)が同じ位置に並んだとしでも、文字サイズが違うため、異なった字形に見誤る場合がある。このように、手書き文字が複数の文字から構成される文字列の場合、従来技術では、ユーザによる確認作業の際、文字認識結果の正誤を一目で容易に確認することができなかった。 Further, when the size of handwritten characters differs for each character due to the user's habit, even if the images (character shapes) of the same characters are lined up at the same position, the character sizes are different, so that the characters may be mistaken for different character shapes. As described above, in the case where the handwritten character is a character string composed of a plurality of characters, in the prior art, it has not been possible to easily confirm the correctness of the character recognition result at a glance during the confirmation work by the user.
一つの側面では、本発明は、手書き文字のイメージデータと文字認識結果とを比較する作業を容易に行えるリストを出力できることを目的とする。 In one aspect, it is an object of the present invention to be able to output a list that facilitates the task of comparing image data of handwritten characters with character recognition results.
本発明の一側面によれば、イメージデータを取得し、前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、処理を行うことを要件とする。 According to one aspect of the present invention, image data is acquired, and the size of each character is enlarged or reduced so that the size of each character in the character string included in the image data is substantially equal, and the size of each character is enlarged or reduced. The character recognition result obtained as a result of character recognition of the image data or the confirmation image data by concatenating the characters to generate confirmation image data of the character string can be compared with the confirmation image data. It is a requirement to output a list in display format and perform processing.
本発明の一態様によれば、手書き文字のイメージデータと文字認識結果とを比較する作業を容易に行えるリストを出力できるという効果を奏する。 According to one aspect of the present invention, it is possible to output a list that facilitates the work of comparing the image data of handwritten characters with the character recognition result.
(実施の形態)
以下に図面を参照して、開示のOCR認識結果確認支援プログラム、OCR認識結果確認支援方法およびOCR認識結果確認支援システムの実施の形態を詳細に説明する。
(Embodiment)
Hereinafter, embodiments of the disclosed OCR recognition result confirmation support program, OCR recognition result confirmation support method, and OCR recognition result confirmation support system will be described in detail with reference to the drawings.
図1は、実施の形態にかかるOCR認識結果確認支援の一実施例を示す説明図である。OCR認識結果確認支援装置100は、帳票等に手書きされた文字を文字認識し、ユーザが行う文字認識結果の確認作業を支援する。OCRでは、手書き文字の文字認識結果に誤りが生じることがあり、実施の形態のOCR認識結果確認支援装置100は、OCR認識結果を確認するユーザに対して、文字認識状態の正誤を容易に確認可能な表示形式で提示する。
FIG. 1 is an explanatory diagram showing an embodiment of OCR recognition result confirmation support according to the embodiment. The OCR recognition result
OCR認識結果確認支援装置100は、例えば、手書き文字で記入された多数の帳票の内容を集約して電子化(電子データ化)する業務に適用できる。OCR認識結果確認支援装置100は、CPUや記憶部101等を有するPC、サーバ等のコンピュータ装置を用いて構成でき、OCR認識結果確認支援プログラムは、記憶部101等に格納されている。CPUが記憶部101等の記憶部に格納されているOCR認識結果確認支援プログラムをプログラム実行することで、所定のOCR認識処理を実行する。
The OCR recognition result
OCR認識結果確認支援システムは、上記のOCR認識結果確認支援装置100と、このOCR認識結果確認支援装置100に接続される出力部103と、操作部104と、データベース(DB)105と、スキャナ110と、を含む。出力部103は、例えば、図1に記載したディスプレイや、プリンタ等である。操作部104は、例えば、図1に記載したキーボードである。DB105は、OCR認識結果確認支援装置100から独立して配置した構成としてもよいし、OCR認識結果確認支援装置100の記憶部101の一部の記憶領域を用いる構成としてもよい。
The OCR recognition result confirmation support system includes the above-mentioned OCR recognition result
図1を用いて、帳票に対するOCR認識結果確認支援に関する全体の処理の流れを説明する。はじめに、市町村の役場等の職員(ユーザ)Uが利用者宅Hを訪問して所定の帳票Tを利用者に渡し、利用者に対し帳票Tの各記入欄への記入を依頼する。利用者は筆記具を用いて帳票Tの記入欄に文字を手書きして記入する。職員Uは、手書き文字が記入された帳票Tを回収し、役場に持ち帰る(ステップS1)。 With reference to FIG. 1, the flow of the entire process relating to the OCR recognition result confirmation support for the form will be described. First, a staff member (user) U of a municipal office or the like visits a user's house H, hands a predetermined form T to the user, and requests the user to fill in each entry field of the form T. The user writes by handwriting in the entry field of the form T using a writing instrument. Employee U collects the form T on which the handwritten characters are written and takes it back to the government office (step S1).
職員Uは、複数の利用者宅Hの訪問により、複数の帳票Tを収集する。なお、図1に記載した各工程別の複数の職員Uは、同一の職員であってもよいし、異なる職員であってもよく、同一の職員Uが複数の構成の作業を実施してもよい。 Employee U collects a plurality of forms T by visiting a plurality of user's homes H. The plurality of staff U for each process shown in FIG. 1 may be the same staff, different staff, or the same staff U may carry out work having a plurality of configurations. Good.
この後、職員Uは、OCR認識結果確認支援装置100を用いて収集した複数の帳票Tの記入内容の電子化を行うため、スキャナ110を用いて複数の帳票Tをそれぞれ読み取る(ステップS2)。スキャナ110で読み取った帳票Tのイメージデータ(画像データ)IMGは、OCR認識結果確認支援装置100に入力される(ステップS3)。 After that, the staff U reads each of the plurality of forms T using the scanner 110 in order to digitize the entry contents of the plurality of forms T collected by using the OCR recognition result confirmation support device 100 (step S2). The image data (image data) IMG of the form T read by the scanner 110 is input to the OCR recognition result confirmation support device 100 (step S3).
OCR認識結果確認支援装置100は、例えば、読み取った帳票T毎にイメージデータIMGに対するOCR認識(文字認識)、および文字認識結果を確認するための表示にかかる処理を行う(ステップS4)。OCR認識結果確認支援装置100の記憶部101には、これら文字認識および文字認識結果の表示制御にかかる処理プログラムが格納されており、CPU等のプロセッサが処理プログラムを実行する。
The OCR recognition result
文字認識および文字認識結果の表示制御にかかる処理(ステップS4)は、帳票Tのデータの分解処理(ステップS101)、属性別変換結果データのリスト化処理(ステップS102)、帳票Tのデータの統合処理(ステップS103)を含む。 The processing related to character recognition and display control of the character recognition result (step S4) includes decomposition processing of form T data (step S101), attribute-based conversion result data listing process (step S102), and integration of form T data. The process (step S103) is included.
帳票Tのデータの分解処理(ステップS101)では、OCR認識結果確認支援装置100は、一つの帳票T毎の文字認識処理を行う。この文字認識処理時に、OCR認識結果確認支援装置100は、帳票TのイメージデータIMGと、このイメージデータを文字認識処理した文字認識結果(テキストデータ)OCRを関連付けて保持する。
In the data decomposition process of the form T (step S101), the OCR recognition result
ここで、OCR認識結果確認支援装置100は、文字認識の処理の実行前に、イメージデータの文字列を文字単位に分解する分解処理と、文字列の各文字のイメージデータの大きさを揃える整形処理と、を行う。これら処理の詳細は後述する。
Here, the OCR recognition result
この後、OCR認識結果確認支援装置100は、文字認識処理を行い、文字認識後のイメージデータを属性別に分解する。例えば、帳票Tには、複数の記入欄を有し、一つの記入欄が氏名、他の記入欄が住所、さらに他の記入欄としてアンケート回答等、を有する。例えば、これら異なる項目の記入欄の氏名、住所等が属性(属性項目)に相当する。そして、OCR認識結果確認支援装置100は、属性別のイメージデータを属性別変換結果データ102として記憶部101に保持する。
After that, the OCR recognition result
リスト化処理(ステップS102)では、OCR認識結果確認支援装置100は、氏名や住所等の属性別の属性別変換結果データ102のうち、同じ属性のイメージデータと文字認識結果(テキストデータ)を複数の帳票Tから集約する。そして、OCR認識結果確認支援装置100は、文字列データでソートしたリストを作成し、イメージデータと文字認識結果とを比較可能な形式で出力する(ステップS5)。例えば、リストを図1に示す出力部としてのディスプレイ103に表示出力、あるいはプリンタに印字出力する。
In the listing process (step S102), the OCR recognition result
例えば、図1に示すリストL1は、属性として氏名を昇順にソートした表示状態を示す。OCR認識結果確認支援装置100は、氏名のリストL1として、帳票Tに記入された氏名の確認用イメージデータIMG(L11)と、文字認識結果OCR(テキストデータ)L12とを横に並べて配置する。縦方向には、異なる複数の帳票Tに記入された氏名の確認用イメージデータL11と、文字認識結果(テキストデータ)L12を配置する。
For example, the list L1 shown in FIG. 1 shows a display state in which names are sorted in ascending order as attributes. The OCR recognition result
また、図1に示すリストL2は、属性として住所を昇順にソートした表示状態を示す。OCR認識結果確認支援装置100は、住所のリストL2として、帳票Tに記入された住所の確認用イメージデータL21と、文字認識結果(テキストデータ)L22とを横に並べて配置する。縦方向には、異なる複数の帳票Tに記入された住所の確認用イメージデータL21と、文字認識結果(テキストデータ)L22を配置する。
Further, the list L2 shown in FIG. 1 shows a display state in which addresses are sorted in ascending order as attributes. The OCR recognition result
なお、図1に示した確認用イメージデータL11,L21および後述するイメージデータは、実際には手書き文字であるが、便宜上、所定のフォントで記載してある。 The confirmation image data L11 and L21 shown in FIG. 1 and the image data described later are actually handwritten characters, but are described in a predetermined font for convenience.
役場の職員Uは、例えば、属性別に文字認識結果の確認を異なる職員が担当してもよい。図1の例では、属性が氏名に関する文字認識結果の確認を職員U1が行い、属性が住所に関する文字認識結果の確認を職員U2が行う。 For example, the staff U of the government office may be in charge of confirming the character recognition result for each attribute by a different staff. In the example of FIG. 1, the staff U1 confirms the character recognition result regarding the attribute of the name, and the staff U2 confirms the character recognition result regarding the attribute of the address.
そして、職員U1は、ディスプレイ103等に表示されている氏名のリストL1を参照し、氏名に関する文字認識結果の確認を行う。この際、職員U1は、氏名のリストL1に表示されている確認用イメージデータL11と文字認識結果(テキストデータ)L12とを見比べることにより、確認用イメージデータL11に対する文字認識結果(テキストデータ)L12の確認作業を行う。
Then, the staff U1 refers to the list L1 of the names displayed on the
例えば、職員U1は、氏名のリストL1上で、互いに横に並べられた確認用イメージデータL11と、文字認識結果(テキストデータ)L12とを比較する。そして文字認識結果(テキストデータ)L12が正しく文字認識されたものであるか正誤を確認する。図1の例では、氏名のリストL1の文字認識結果は正常である例を示している。ここで、例えば、氏名リストL1の最上段のイメージデータ「川口 明子」に対し、文字認識結果(テキストデータ)L12が「川口 朗子」の場合、職員U1は、文字認識結果(テキストデータ)L12に誤りがあることを確認できる。 For example, the staff member U1 compares the confirmation image data L11 arranged side by side with each other on the name list L1 and the character recognition result (text data) L12. Then, it is confirmed whether the character recognition result (text data) L12 is correctly recognized as a character. In the example of FIG. 1, the character recognition result of the name list L1 is normal. Here, for example, when the character recognition result (text data) L12 is "Ryoko Kawaguchi" with respect to the image data "Akiko Kawaguchi" at the top of the name list L1, the staff U1 is assigned to the character recognition result (text data) L12. You can confirm that there is an error.
ここで、氏名のリストL1の確認用イメージデータL11は、帳票T上で実際には手書きされ、文字毎の大きさ等が異なるものであったが、上記の分解処理(ステップS101)で行ったイメージデータの整形処理により、各文字の大きさが揃えられている。これにより、職員U1は、氏名のリストL1に表示されている確認用イメージデータL11の各文字を見落とすことなく確認できる。この際、職員U1は、文字の大きさが揃えられた確認用イメージデータL11と、文字認識結果(テキストデータ)L12とを容易に見比べることができる。このように、OCR認識結果確認支援装置100は、職員U1が行う確認作業を正確かつ効率的に遂行できるように支援する。
Here, the confirmation image data L11 of the name list L1 was actually handwritten on the form T, and the size and the like of each character were different, but the above decomposition process (step S101) was performed. The size of each character is made uniform by the image data shaping process. As a result, the staff member U1 can confirm each character of the confirmation image data L11 displayed in the name list L1 without overlooking. At this time, the staff U1 can easily compare the confirmation image data L11 having the same character size and the character recognition result (text data) L12. In this way, the OCR recognition result
ここで、氏名のリストL1の確認用イメージデータL11、および文字認識結果(テキストデータ)L12について、異なる複数の帳票Tを縦方向に昇順にソートして配列している。これにより、同じ文字列が縦方向に連続して配置されているため、確認用イメージデータL11を縦方向に目で追って確認した際に異なる文字の混入があれば容易に確認(発見)できるようになる。同様に、文字認識結果(テキストデータ)L12を縦方向に目で追って確認した際に異なる文字の混入(文字の誤認識に相当)を容易に発見できるようになる。 Here, with respect to the confirmation image data L11 of the name list L1 and the character recognition result (text data) L12, a plurality of different forms T are sorted and arranged in ascending order in the vertical direction. As a result, since the same character strings are continuously arranged in the vertical direction, it is possible to easily confirm (discover) if different characters are mixed when the confirmation image data L11 is visually confirmed in the vertical direction. become. Similarly, when the character recognition result (text data) L12 is visually checked in the vertical direction, it becomes possible to easily find a mixture of different characters (corresponding to erroneous recognition of characters).
詳細は後述するが、異なる複数の帳票Tを文字認識結果で縦方向に昇順にソートした場合、確認用イメージデータL11は縦方向で同じ文字列が続いて配置される。このため、同じ文字列が連続している間は、文字認識結果(テキストデータ)L12だけを縦方向に確認していけばよいため、確認作業をさらに効率化できる。 Although the details will be described later, when a plurality of different forms T are sorted in ascending order in the vertical direction based on the character recognition result, the same character string is continuously arranged in the confirmation image data L11 in the vertical direction. Therefore, while the same character string is continuous, only the character recognition result (text data) L12 needs to be confirmed in the vertical direction, so that the confirmation work can be further made more efficient.
また、職員U2についても、住所のリストL2を参照し、住所に関する文字認識結果の確認を容易に行う支援を行う。この際、職員U2は、住所のリストL2に表示されている確認用イメージデータL21と文字認識結果(テキストデータ)L22とを見比べる。そして、確認用イメージデータL21に対する文字認識結果(テキストデータ)L22が正しく文字認識されているかの正誤の確認作業を行う。職員U2についても、OCR認識結果確認支援装置100は、住所に関する文字認識結果の確認作業を正確かつ効率的に遂行できるよう支援する。
In addition, the staff U2 also refers to the address list L2 and provides support for easily confirming the character recognition result regarding the address. At this time, the staff member U2 compares the confirmation image data L21 displayed in the address list L2 with the character recognition result (text data) L22. Then, the correctness confirmation work is performed to confirm whether the character recognition result (text data) L22 for the confirmation image data L21 is correctly recognized as a character. For the staff U2, the OCR recognition result
そして、職員U1,U2は、文字認識結果で文字認識に誤りがあれば、例えば、操作部としてのキーボード104等を操作することで、誤った文字認識結果(テキストデータ)L12,L22を正しい文字認識結果に修正することができる。この際、OCR認識結果確認支援装置100は、属性別変換結果データ102の対応する文字認識結果のデータ(テキストデータ)をキーボード104から入力された文字(文字列)に変更し、記憶部101に格納する。
Then, if there is an error in character recognition in the character recognition result, the staff U1 and U2 can correct the wrong character recognition results (text data) L12 and L22 by operating the
図1に示す例では、属性が氏名と住所の例で職員U1,U2が文字認識の確認作業を行う例を示したが、さらに他の属性について他の職員Uが文字認識の確認作業を行ってもよい。 In the example shown in FIG. 1, the example in which the attributes are the name and the address and the staff U1 and U2 perform the character recognition confirmation work is shown, but the other staff U performs the character recognition confirmation work for other attributes. You may.
そして、帳票Tについて、全ての属性別の文字認識の確認作業が終了すると、OCR認識結果確認支援装置100は、属性別変換結果データ102を用いて帳票Tのデータの統合作業を行い(ステップS103)、DB105に格納する。
Then, when the confirmation work of character recognition for each attribute of the form T is completed, the OCR recognition result
属性別変換結果データ102には、氏名、住所等の属性別に分解されたデータであるが、この統合作業では、帳票T毎に氏名や住所等の各属性を統合し、元の各帳票Tが有する全項目を文字認識結果OCR(テキストデータ)としてDB105に格納する。イメージデータIMGは、文字認識結果の確認用に用いるため、DB105に格納する必要はなく、文字認識の確認作業が終了した時点で削除する。これに限らず、DB105に、文字認識結果OCR(テキストデータ)と、この文字認識結果OCR(テキストデータ)に対応するイメージデータIMGを関連付けて格納してもよい。
The
これにより、DB105には、帳票Tに手書きで記入された文字をテキストデータに変換した電子化データが格納される。このDB105に格納された電子化データに対し、外部端末がアクセスすることで、外部端末では、帳票T毎の情報を容易に取得できるようになる。外部端末は、上記ディスプレイ103、キーボード104を備えた端末装置であってもよい。
As a result, the
図2は、実施の形態にかかるOCR認識結果確認支援装置のハードウェア構成例を示す図である。OCR認識結果確認支援装置100は、例えば、図2に示すハードウェアからなる汎用のPCやサーバで構成することができる。
FIG. 2 is a diagram showing a hardware configuration example of the OCR recognition result confirmation support device according to the embodiment. The OCR recognition result
OCR認識結果確認支援装置100は、CPU(Central Processing Unit)201、メモリ202、ネットワークインタフェース(IF)203、記録媒体IF204、記録媒体205、入出力IF206、を含む。200は各部を接続するバスである。
The OCR recognition result
CPU201は、OCR認識結果確認支援装置100の全体の制御を司る制御部として機能する演算処理装置である。メモリ202は、不揮発性メモリおよび揮発性メモリを含む。不揮発性メモリは、例えば、CPU201のプログラムを格納するROM(Read Only Memory)である。揮発性メモリは、例えば、CPU201のワークエリアとして使用されるDRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)等である。
The
ネットワークIF203は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワークNWに対する通信インタフェースである。OCR認識結果確認支援装置100は、ネットワークIF203を介してネットワークNWに通信接続する。例えば、OCR認識結果確認支援装置100は、ネットワークNWを介して、外部端末と通信可能である。
The network IF203 is a communication interface for a network NW such as LAN (Local Area Network), WAN (Wide Area Network), and the Internet. The OCR recognition result
記録媒体IF204は、CPU201が処理した情報を記録媒体205との間で読み書きするためのインタフェースである。記録媒体205は、メモリ202を補助する記録装置であり、HDD(Hard Disk Drive)や、SSD(Solid State Drive)、USB(Universal Serial Bus)フラッシュドライブ等を用いることができる。
The recording medium IF204 is an interface for reading and writing the information processed by the
メモリ202または記録媒体205に記録されたプログラムをCPU201が実行することにより、OCR認識結果確認支援の処理機能を実現する。また、メモリ202や記録媒体205は、OCR認識結果確認支援装置100が扱う情報を記録保持する。また、記録媒体205は、図1に示した記憶部101に相当し、属性別変換結果データ102を記憶保持する。
The
入出力IF206は、CPU201に対する情報入出力用のインタフェースであり、入出力IF206を介して外部装置としてのスキャナ110、ディスプレイ103、キーボード104等(図1参照)、が接続される。
The input / output IF206 is an interface for inputting / outputting information to the
また、図1に記載のデータベース105は、図2に記載の記録媒体205を用いて構成できる。またデータベース105は、図2に記載の他の各構成(CPU201〜記録媒体205)を含む構成としてもよい。
Further, the
図3は、実施の形態にかかるOCR認識用のイメージデータの変換処理を説明する図である。図3(a)は、上述した帳票TのOCR認識元となった手書き文字のイメージデータIMG(1)の例を示す。この手書き文字のイメージデータIMG(1)の文字列は「金沢市増泉1丁目」であり、文字301「金」、文字302「沢」、…、文字30n「目」の複数(n個)の文字からなる。そして、各文字301〜30nは、便宜上、各文字の大きさが異なり不揃いの状態を示している。
FIG. 3 is a diagram illustrating a conversion process of image data for OCR recognition according to the embodiment. FIG. 3A shows an example of the image data IMG (1) of the handwritten character that is the OCR recognition source of the above-mentioned form T. The character string of the image data IMG (1) of this handwritten character is "1-chome, Masuizumi, Kanazawa-shi", and there are a plurality of (n)
OCR認識結果確認支援装置100は、このように各文字の大きさが異なり不揃いの状態のイメージデータIMG(1)について、文字として認識できる単位(文字単位)で1文字ずつイメージデータを分割する分割処理を行う。この後、各文字のサイズが略均等なサイズになるように、各文字を拡大または縮小する整形処理等、の複数の変換処理を行い、確認用イメージデータIMG(n)を生成する。確認用イメージデータIMG(n)は、文字列の各文字301,302,…30nのサイズが所定サイズで揃えた状態に整形される。なお、整形処理は、各文字のサイズを所定(基準)サイズと略均等になるように、各文字を拡大または縮小してもよい。なお、略均等とは、各文字の高さの差が所定の範囲内、各文字の横幅の差が所定の範囲内、および/又は、各文字を囲む矩形の面積の差が所定の範囲内等の状態である。
The OCR recognition result
そして、OCR認識結果確認支援装置100は、生成した確認用イメージデータIMG(n)を文字認識確認用のリストL1,L2(図1参照)の確認用イメージデータL11,L21として出力する。なお、括弧(1)、(n)は、当初のイメージデータIMG(1)に対して所定の変換処理を行った毎に増加する回数を示し、最終的にn回目の変換処理で確認用イメージデータ(n)を生成している。
Then, the OCR recognition result
(イメージデータの変換処理例)
図4は、実施の形態にかかるOCR認識用のイメージデータの変換処理例を示す図である。図4の(a)〜(d)に示すように、OCR認識結果確認支援装置100の制御部(CPU201)は、手書き文字のイメージデータIMGに対して複数(n)回の変換処理を行う。
(Example of image data conversion process)
FIG. 4 is a diagram showing an example of conversion processing of image data for OCR recognition according to the embodiment. As shown in FIGS. 4A to 4D, the control unit (CPU201) of the OCR recognition result
図4(a)に示すように、はじめに制御部は、スキャナ110が読み取った帳票T上の手書き文字の領域を切り取ったイメージデータIMG(1)を生成する。この例では、帳票Tの属性「住所」の所定の枠E(図示の例では1行)内の複数の文字301〜308からなる文字列を切り取る。
As shown in FIG. 4A, first, the control unit generates image data IMG (1) obtained by cutting out an area of handwritten characters on the form T read by the scanner 110. In this example, a character string consisting of a plurality of
図4(a)に示す例では、手書き文字で生じる特徴を強調するため、便宜上、1行の文字列の各文字の大きさ、筆記状態(図示の例は手書きの各文字を異なるフォントで表現)、1行内での各文字の高さ位置、が異なっている状態を示した。 In the example shown in FIG. 4A, in order to emphasize the characteristics generated by the handwritten characters, for convenience, the size and writing state of each character in the character string of one line (the illustrated example expresses each handwritten character in a different font). ), The height position of each character in one line is different.
次に、図4(b)に示すように、制御部は、枠E内の文字列を1文字単位で複数に分割する分割処理を行ったイメージデータIMG(2)を生成する。この際、制御部は、文字301「金」、文字302「沢」、…文字308「目」のそれぞれの文字の大きさに対応し、各文字単位の分割枠E1〜E8を設定する。
Next, as shown in FIG. 4B, the control unit generates the image data IMG (2) which has been subjected to the division process of dividing the character string in the frame E into a plurality of characters in units of one character. At this time, the control unit sets the division frames E1 to E8 for each character corresponding to the size of each character of the
例えば、制御部は、文字301「金」は、この「金」の文字全体(例えば文字の外縁)に適合した四角(□)状の分割枠E1を設定する。ここで、文字301「金」と比較して文字302「沢」のように小さい文字については、制御部は、文字「沢」の大きさに対応して分割枠E2も分割枠E1に比べて小さく設定する。
For example, the control unit sets a square (□) -shaped division frame E1 in which the
この後、図4(c)に示すように、制御部は、分割処理後のイメージデータIMG(2)の各文字301「金」、文字302「沢」、…文字308「目」のそれぞれの文字の大きさを拡大または縮小して一様に揃える整形処理を行ったイメージデータIMG(3)を生成する。
After that, as shown in FIG. 4C, the control unit receives each of the
例えば、制御部は、最も大きい文字301「金」を基準として、他の文字302「沢」〜文字308「目」を文字301「金」と同じ大きさにする。この場合、制御部は、基準の文字301「金」の分割枠E1の大きさ(縦横)と同じ大きさとなるように、他の文字302「沢」の分割枠E2〜文字308「目」の分割枠E8をそれぞれ拡大または縮小して基準となる同じ大きさに揃える。これにより、文字列の文字301「金」、文字302「沢」、…文字308「目」の大きさが同じになる。
For example, the control unit sets the
この後、図4(d)に示すように、制御部は、文字列の文字301「金」、文字302「沢」、…文字308「目」の各文字を連結したイメージデータIMG(n)を生成する。この場合、イメージデータの変換処理は4回であり、IMG(n)のn=4である。この処理により、1文字単位で分割されたイメージデータIMG(3)は、各文字の大きさが揃えられた状態で分割前の状態のイメージデータIMG(1)に連結される。
After that, as shown in FIG. 4D, the control unit concatenates the characters of the
例えば、制御部は、文字301「金」の分割枠E1、文字302「沢」の分割枠E2、…文字308「目」の分割枠E8を行方向で連結し、一つのイメージデータIMG(n)を生成する。生成したイメージデータIMG(n)は、図3(b)で説明した確認用イメージデータIMGに相当する。また、制御部は、このイメージデータIMG(n)を図1に示した住所のリストL2の確認用イメージデータL21として出力する。
For example, the control unit connects the division frame E1 of the
(OCR認識結果確認支援装置の処理例)
図5は、実施の形態にかかるOCR認識結果確認支援の処理例を示すフローチャートである。制御部(CPU)201が実行し、主に複数の帳票Tに対する文字認識結果の確認支援の処理例を示す。
(Processing example of OCR recognition result confirmation support device)
FIG. 5 is a flowchart showing a processing example of OCR recognition result confirmation support according to the embodiment. An example of processing that is executed by the control unit (CPU) 201 and that mainly supports confirmation of character recognition results for a plurality of forms T is shown.
はじめに、制御部は、複数の帳票Tの中から一つの帳票Tに対しOCR(文字認識)する箇所のイメージデータIMGを切り取る(ステップS501)。この処理は、図4(a)の枠EのイメージデータIMG(1)の切り取りに相当する。 First, the control unit cuts out the image data IMG of the portion to be OCR (character recognition) for one form T from the plurality of forms T (step S501). This process corresponds to cutting out the image data IMG (1) in the frame E of FIG. 4 (a).
次に、制御部は、切り取ったイメージデータを1文字単位のイメージデータに分割する(ステップS502)。この処理により、図4(b)に示した1文字単位の分割枠E1〜E8で分割したイメージデータIMG(2)が生成される。 Next, the control unit divides the cut image data into image data in character units (step S502). By this process, the image data IMG (2) divided by the character-by-character division frames E1 to E8 shown in FIG. 4B is generated.
次に、制御部は、1文字単位に分割したイメージデータの中の文字部分のサイズを整形する(ステップS503)。この処理により、図4(c)に示した各文字の分割枠E1〜E8を拡大または縮小して基準となる同じ大きさにすることで、各文字の大きさを揃えたイメージデータIMG(3)が生成される。 Next, the control unit shapes the size of the character portion in the image data divided into character units (step S503). By this processing, the division frames E1 to E8 of each character shown in FIG. 4C are enlarged or reduced to the same size as the reference, so that the image data IMG (3) having the same size of each character is used. ) Is generated.
次に、制御部は、サイズを整形した1文字単位のイメージデータを分割前の状態に連結する(ステップS504)。この処理により、図4(d)に示した各文字の大きさを揃えた分割枠E1〜E8を連結したイメージデータIMG(4)が生成される。 Next, the control unit concatenates the image data of one character unit whose size has been shaped into the state before the division (step S504). By this process, the image data IMG (4) in which the divided frames E1 to E8 having the same size of each character shown in FIG. 4D are connected is generated.
このイメージデータIMG(4)は、ユーザUが文字認識結果を確認するための確認用イメージデータ(図3(b)参照))に相当する。例えば、制御部は、ユーザUが文字認識結果を確認する際、生成したイメージデータIMG(4)を図1に示した住所のリストL2の確認用イメージデータL21として出力する。 This image data IMG (4) corresponds to confirmation image data (see FIG. 3B) for the user U to confirm the character recognition result. For example, when the user U confirms the character recognition result, the control unit outputs the generated image data IMG (4) as the confirmation image data L21 of the address list L2 shown in FIG.
次に、制御部は、一つの帳票Tの全箇所をOCR(文字認識)したか判断する(ステップS505)。帳票T上には、複数の記入箇所を有しており、これら全ての記入箇所に対する文字認識を行い、上述したイメージデータIMGの生成を行う。複数の記入箇所は、上記説明した氏名や住所などの各属性に相当する。なお、文字認識は、帳票Tを読み取った当初のイメージデータに対しておこなうこともできる。そして、一つの帳票Tの全箇所を文字認識済であれば(ステップS505:Yes)、制御部は、ステップS506の処理に移行する。一方、一つの帳票Tで文字認識が終わっていない箇所があれば(ステップS505:No)、ステップS501の処理に戻って未処理部分に対しステップS501以下の処理を再度実行する。 Next, the control unit determines whether all the parts of one form T have been OCR (character recognition) (step S505). The form T has a plurality of entry points, character recognition is performed for all the entry points, and the above-mentioned image data IMG is generated. The plurality of entry points correspond to each attribute such as the name and address described above. The character recognition can also be performed on the initial image data obtained by reading the form T. Then, if all the parts of one form T have been recognized as characters (step S505: Yes), the control unit shifts to the process of step S506. On the other hand, if there is a part where the character recognition is not completed in one form T (step S505: No), the process returns to the process of step S501 and the process of step S501 or less is executed again for the unprocessed portion.
ステップS506では、制御部は、全ての帳票Tを処理したか判断する(ステップS506)。上記の処理で一つの帳票Tに対する文字認識を行い、イメージデータIMGの生成を行うが、ここでは、対象とする複数の帳票Tに対する文字認識によりイメージデータIMGの生成を行ったかを判断する。全ての帳票Tを処理済であれば(ステップS506:Yes)、制御部は、ステップS507の処理に移行し、未処理の帳票Tがあれば(ステップS506:No)、ステップS501の処理に戻る。 In step S506, the control unit determines whether all the forms T have been processed (step S506). In the above process, character recognition is performed for one form T and image data IMG is generated. Here, it is determined whether the image data IMG is generated by character recognition for a plurality of target forms T. If all the forms T have been processed (step S506: Yes), the control unit proceeds to the process of step S507, and if there is an unprocessed form T (step S506: No), returns to the process of step S501. ..
ステップS507では、制御部は、氏名、住所などの属性単位にリスト化したOCR(文字認識)結果を出力する(ステップS507)。上記の処理により、制御部は、帳票Tに記入された手書き文字は、氏名や住所の属性単位のイメージデータIMGを生成し、生成したイメージデータIMGをディスプレイ103上に表示する。また、プリンタを介して印字出力してもよい。
In step S507, the control unit outputs an OCR (character recognition) result listed in attribute units such as name and address (step S507). By the above processing, the control unit generates an image data IMG for each attribute of the name and address of the handwritten characters entered in the form T, and displays the generated image data IMG on the
このイメージデータIMGは、職員(ユーザ)Uが帳票Tの文字認識結果を確認する際のリスト上の確認用イメージデータとして用いられる。詳細は後述するが、例えば、図1で説明した例の属性「氏名」のリストL1の確認用イメージデータL11としてイメージデータIMGを表示し、その横に文字認識結果(テキストデータ)L12を表示出力する。同様に、属性「住所」のリストL2の確認用イメージデータL21としてイメージデータIMGを表示し、その横に文字認識結果(テキストデータ)L22を表示出力する。 This image data IMG is used as confirmation image data on the list when the staff (user) U confirms the character recognition result of the form T. The details will be described later, but for example, the image data IMG is displayed as the confirmation image data L11 of the list L1 of the attribute “name” of the example described in FIG. To do. Similarly, the image data IMG is displayed as the confirmation image data L21 of the list L2 of the attribute "address", and the character recognition result (text data) L22 is displayed and output next to the image data IMG.
これにより、職員Uが属性別のリストL1、L2に表示されているイメージデータと、文字認識結果(テキストデータ)とを比較することで、文字認識結果の正誤を確認することができる。例えば、職員Uは、文字認識結果で文字認識結果の正誤を、例えば、キーボード104等の操作で制御部に伝える。この際、職員Uは、誤った文字認識結果(テキストデータ)があれば正しい文字を入力操作して文字認識結果を修正する。また、文字認識に誤りがなければ無操作、あるいは正しい文字認識結果の旨を操作入力する。
As a result, the staff U can confirm the correctness of the character recognition result by comparing the image data displayed in the lists L1 and L2 for each attribute with the character recognition result (text data). For example, the staff U conveys the correctness of the character recognition result to the control unit by operating the
そして、制御部は、全ての属性分を確認したか判断する(ステップS508)。職員(ユーザ)Uによる氏名や住所等、帳票Tの全ての属性に対する上記文字認識の確認作業が終了すれば(ステップS508:Yes)、制御部は、ステップS509の処理に移行する。また、文字認識の確認作業で未処理分の属性が残っていれば(ステップS508:No)、ステップS507の処理に戻る。 Then, the control unit determines whether or not all the attributes have been confirmed (step S508). When the confirmation work of the character recognition for all the attributes of the form T such as the name and address by the staff (user) U is completed (step S508: Yes), the control unit shifts to the process of step S509. If the unprocessed attributes remain in the character recognition confirmation work (step S508: No), the process returns to the process of step S507.
ステップS509では、制御部は、一つの帳票T単位にOCR(文字認識)結果を統合し(ステップS509)、以上の一連の処理を終了する。この処理では、一つの帳票Tに含まれる氏名や、住所等の複数の属性のイメージデータIMGをこの一つの帳票T単位のデータのまとまりとして統合した電子データをDB105に格納する。
In step S509, the control unit integrates the OCR (character recognition) result into one form T unit (step S509), and ends the above series of processes. In this process, the
なお、イメージデータIMGは、文字認識結果と比較するために生成したものであり、ステップS508で文字認識結果の正誤を確認した後は、確認済の帳票Tの全てのイメージデータIMGは不要となる。このため、職員Uが文字認識結果の正誤を確認した時点で上記生成したイメージデータIMGを削除してもよい。例えば、制御部は、ステップS509の処理でイメージデータIMGを削除する。この場合、DB105には、帳票Tの文字認識結果のみを格納し、イメージデータIMGは格納しない。
The image data IMG is generated for comparison with the character recognition result, and after confirming the correctness of the character recognition result in step S508, all the image data IMGs of the confirmed form T become unnecessary. .. Therefore, the image data IMG generated above may be deleted when the staff U confirms the correctness of the character recognition result. For example, the control unit deletes the image data IMG in the process of step S509. In this case, only the character recognition result of the form T is stored in the
図6A,図6Bは、実施の形態にかかるOCR認識結果確認支援装置が出力するOCR結果確認リスト例を示す図である。図6Aは、複数の帳票Tを住所の属性でソートしたリストL2の出力例を示す。OCR認識結果確認支援装置100の制御部(CPU201)は、リストL2として、各帳票T別の結果No(601)、文字認識(OCR)結果(住所)L22、確認用イメージデータL21をリスト化する。
6A and 6B are diagrams showing an example of an OCR result confirmation list output by the OCR recognition result confirmation support device according to the embodiment. FIG. 6A shows an output example of a list L2 in which a plurality of forms T are sorted by address attributes. The control unit (CPU201) of the OCR recognition result
各行が一つの帳票Tのデータを示し、例えば、最上部の1行は、ある一つの帳票T(結果No「104」のデータであり、文字認識結果L22として「金沢市増泉1丁目」(テキストデータ)611を表示する。また、確認用イメージデータL21として「金沢市増泉1丁目」の手書き文字のイメージデータ612を表示する。
Each line shows the data of one form T. For example, the top one line is the data of one form T (result No. "104", and the character recognition result L22 is "Masuizumi 1-chome, Kanazawa" (text). Data) 611 is displayed. In addition,
2行目は、他の一つの帳票T(結果No「789」)のデータであり、文字認識(OCR)結果L22として「金沢市増泉1丁目」(テキストデータ)613を表示する。また、確認用イメージデータL21として「金沢市増泉1丁目」の手書き文字のイメージデータ614を表示する。3行目は、さらに他の一つの帳票T(結果No「159」のデータであり、文字認識結果L22として「金沢市増泉1丁目」(テキストデータ)615を表示する。また、確認用イメージデータL21として「金沢市増泉1丁目」の手書き文字のイメージデータ616を表示する。
The second line is the data of another form T (result No. 789), and displays "Kanazawa-shi Masuizumi 1-chome" (text data) 613 as the character recognition (OCR) result L22. Further, as the confirmation image data L21, the
住所の文字認識結果を確認する職員(ユーザ)U2は、住所のリストL2上で、互いに横に並べられた文字認識結果L22と、確認用イメージデータL21と、を比較する。例えば、帳票T単位で1行目では、文字認識結果L22の領域のテキストデータ611と、確認用イメージデータL21の領域のイメージデータ612と、を比較する。これにより、文字認識結果(テキストデータ)L12が正しく文字認識されているか正誤を確認する。
The staff (user) U2 who confirms the character recognition result of the address compares the character recognition result L22 arranged side by side with each other on the address list L2 and the confirmation image data L21. For example, in the first line in the form T unit, the
そして、確認用イメージデータL21は、手書き文字の文字列のイメージデータを文字毎に分解する分解処理、および各文字の大きさを同じにする整形処理を行った後のイメージデータである(上記IMG(4)に相当)。ここで、確認用イメージデータL21は、帳票T上では実際には手書きされ、文字毎の大きさ等が異なるものであったが、上述した分解処理および整形処理により、各文字の大きさが揃えられている。 The confirmation image data L21 is the image data after the decomposition process of decomposing the image data of the character string of the handwritten character for each character and the shaping process of making the size of each character the same (the above IMG). Equivalent to (4)). Here, the confirmation image data L21 was actually handwritten on the form T, and the size of each character was different, but the size of each character was made uniform by the above-mentioned decomposition process and shaping process. Has been done.
これにより、職員U2は、住所のリストL2に表示されている確認用イメージデータL21の各文字を見落とすことなく確認できる。この際、職員U2は、文字の大きさが揃えられた確認用イメージデータL21と、文字認識結果(テキストデータ)L22とを容易に見比べることができる。 As a result, the staff U2 can confirm each character of the confirmation image data L21 displayed in the address list L2 without overlooking. At this time, the staff U2 can easily compare the confirmation image data L21 having the same character size and the character recognition result (text data) L22.
例えば、最上部の1行の帳票T(結果No「104」)の文字認識結果L22のテキストデータ611が「金沢市増泉1丁目」であり、確認用イメージデータL21のイメージデータ612が「金沢市増泉1丁目」である。この場合、職員U2は、文字認識結果L22のテキストデータ611が正しく文字認識されていると判断することができる。
For example, the
また、リストL2は、文字認識結果を住所の昇順にソートしたものであり、OCR認識結果確認支援装置100は、複数の帳票Tの文字認識結果L22の縦方向には、同じ住所を連続して配置する。図示の例では、住所「金沢市増泉1丁目」の複数の帳票Tを表示している。
Further, the list L2 sorts the character recognition results in ascending order of the addresses, and the OCR recognition result
このようにソート表示することで、職員(ユーザ)U2は、同じ文字認識結果「金沢市増泉1丁目」が連続している間は、確認用イメージデータL21だけを上部から順に見ていき、文字が似ていないものの有無を判断するだけでよい。このようにして、複数の帳票Tの文字認識結果の正誤を容易に確認できるようになる。 By sorting and displaying in this way, the staff (user) U2 looks at only the confirmation image data L21 in order from the top while the same character recognition result "Masuizumi 1-chome, Kanazawa" is continuous, and the characters. All you have to do is determine if there are any dissimilar ones. In this way, it becomes possible to easily confirm the correctness of the character recognition results of the plurality of forms T.
この際の職員(ユーザ)U2の視線Pの移動状態を図示した。例えば、文字認識結果L22の領域内で新たな住所の文字認識結果611として「金沢市増泉1丁目」の表示があった場合、以降の視線Pは確認用イメージデータL21の領域を上部から順に移動させればよい。すなわち、イメージデータ612→イメージデータ614→イメージデータ616と縦に移動させるだけでよい。
The moving state of the line of sight P of the staff (user) U2 at this time is illustrated. For example, if "Masuizumi 1-chome, Kanazawa City" is displayed as the
ここで、確認用イメージデータL21に表示されている各帳票Tのイメージデータ612,614,616は、上述したイメージデータの分割処理および整形処理により、文字列の各文字が同じ大きさになるように揃えられている。このため、確認用イメージデータL21の領域内で上下位置で表示されている各帳票Tのイメージデータ612,614,616は、文字列の各文字がほぼ同じ位置に位置している。例えば、イメージデータ612,614,616の住所の先頭文字301「金」は位置p1で上下方向に対しほぼ同じ位置に表示される。同様に、イメージデータ612,614,616の住所の末尾文字308「目」は位置pnで上下方向に対しほぼ同じ位置に表示される。すなわち、文字列の各文字が上下方向で位置ずれなく表示されている。
Here, in the image data 612,614,616 of each form T displayed in the confirmation image data L21, each character of the character string has the same size by the above-mentioned image data division processing and shaping processing. It is arranged in. Therefore, in the
確認用イメージデータL21に表示する各帳票Tのイメージデータ612,614,616はそれぞれ複数の文字からなる文字列である。実施の形態では、文字列の各文字を同じ大きさにすることで文字間隔を均一にし、上下方向で文字の位置ずれを起こすことなく表示している。
The
これにより、上記視線Pの移動時において、職員U2は、確認用イメージデータL21の領域内で上下に連続する文字列全体をイメージ、例えば、図形として捉え、似ていない図形を見つける、という直観的な作業を行うことができる。そして、文字認識結果の正誤の確認作業を効率的に遂行できる。 As a result, when the line of sight P is moved, the staff U2 intuitively captures the entire character string that is continuous up and down in the area of the confirmation image data L21 as an image, for example, a figure, and finds a dissimilar figure. Work can be done. Then, the work of confirming the correctness of the character recognition result can be efficiently performed.
図6Aには、帳票Tの結果No「159」の文字認識結果が誤認識である状態を示している。文字認識結果L22の文字認識結果L22領域内で帳票Tの結果No「159」の文字認識結果615が「金沢市増泉1丁目」であるが、対応する確認用イメージデータL21の領域内のイメージデータ616は「金沢市増泉2丁目」であったとする。この場合、確認用イメージデータL21の領域内で職員U2が上下に連続する文字列全体を見ていく途中で、イメージデータ616の「金沢市増泉2丁目」の文字列のうち6番目の文字X「2」が上下と異なることを容易に見つけ出すことができる。この場合、文字認識結果615は正しくは「金沢市増泉2丁目」であり、帳票Tの結果No「159」の住所の文字認識結果に誤りが生じている、との確認作業を行う。
FIG. 6A shows a state in which the character recognition result of the result No. “159” of the form T is erroneous recognition. The
住所のリストL2は、文字認識結果で昇順にソートしたものであるため、職員U2は、確認用イメージデータL21の領域内で視線Pを上下に移動させてイメージ(図形相当)での相似状態を確認するだけで、文字認識結果の誤りを容易に見つけ出すことができる。 Since the address list L2 is sorted in ascending order based on the character recognition result, the staff U2 moves the line of sight P up and down within the area of the confirmation image data L21 to display the similarity state in the image (corresponding to the figure). You can easily find an error in the character recognition result just by checking it.
また、図6Bは、複数の帳票Tを氏名の属性でソートしたリストL1の出力例を示す。OCR認識結果確認支援装置100の制御部(CPU201)は、上述した住所の属性のリストL2と同様に、氏名の属性のリストL1についても、各帳票T別の結果No(601)、文字認識(OCR)結果(氏名)L12、確認用イメージデータL11をリスト化する。
Further, FIG. 6B shows an output example of the list L1 in which a plurality of forms T are sorted by the attribute of the name. The control unit (CPU201) of the OCR recognition result
この際、確認用イメージデータL11の領域内の各帳票Tのイメージデータ622,624,626は、文字列の各文字が同じ大きさであり、上下位置で同じ位置に位置している。例えば、イメージデータ622,624,626の氏名の先頭文字301「川」は位置p1で上下方向に対しほぼ同じ位置に表示される。同様に、イメージデータ622,624,626の氏名の2番目の文字302「口」は位置p2で上下方向に対しほぼ同じ位置に表示される。このように、文字列の各文字が上下方向で位置ずれなく表示されている。
At this time, in the image data 622,624,626 of each form T in the area of the confirmation image data L11, each character of the character string has the same size and is located at the same position in the vertical position. For example, the
これにより、職員(ユーザ)U1は、氏名のリストL1に表示されている確認用イメージデータL11の各文字を見落とすことなく確認できる。この際、職員U1は、文字の大きさが揃えられた確認用イメージデータL11と、文字認識結果(テキストデータ)L12とを容易に見比べることができ、文字認識結果の正誤を容易に確認できる。 As a result, the staff (user) U1 can confirm each character of the confirmation image data L11 displayed in the name list L1 without overlooking. At this time, the staff member U1 can easily compare the confirmation image data L11 having the same character size and the character recognition result (text data) L12, and can easily confirm the correctness of the character recognition result.
また、職員(ユーザ)U1は、視線Pの移動状態に示すように、文字認識結果L12の領域内で新たな氏名の文字認識結果621として「金沢市増泉1丁目」の表示があった場合、以降の視線Pは確認用イメージデータL11の領域を上部から順に移動させればよい。すなわち、イメージデータ622→イメージデータ624→イメージデータ626と縦に移動させるだけでよい。これにより、上記視線Pの移動時において、職員U1は、確認用イメージデータL11の領域内で上下に連続する文字列全体をイメージ(図形相当)として捉え、似ていない図形を見つける、という直観的な作業を行うことができる。そして、文字認識結果の正誤の確認作業を効率的に遂行できる。
In addition, when the staff (user) U1 displays "Masuizumi 1-chome, Kanazawa City" as the
(対比参考図)
図7は、従来技術に相当する文字認識結果のリストを示す図である。図7には、実施の形態との対比のために、便宜上、実施の形態(図6A)同様の住所の属性と同じ表示形式とした。すなわち、帳票Tの結果No(701)、文字認識(OCR)結果702、確認用イメージデータ703を有し、文字認識結果702を昇順にソートした住所のリストLを示している。
(Comparison reference diagram)
FIG. 7 is a diagram showing a list of character recognition results corresponding to the prior art. For convenience, FIG. 7 has the same display format as the address attribute similar to that of the embodiment (FIG. 6A) for comparison with the embodiment. That is, a list L of addresses having the result No. (701) of the form T, the character recognition (OCR)
従来、帳票T別に、文字認識結果702と、確認用イメージデータ703とを並べることで1行の帳票T単位で文字認識結果の正誤を確認することができる。しかし、従来技術では、確認用イメージデータ703の領域に表示する各帳票Tのイメージデータ712,714,716は、帳票T上に手書きされた文字をそのままイメージとして表示することになる。
Conventionally, by arranging the
このため、確認用イメージデータ703の領域に表示されるイメージデータ712,714,716は、各帳票T毎に文字301〜30nの大きさが異なり、文字間隔も異なり、文字列全体の大きさ(横幅)も異なる。このため、従来は、文字認識結果の正誤の確認に手間がかかり、正誤判断の誤りも生じた。このように、従来は、文字認識結果702と確認用イメージデータ703とを比較しにくく、確認作業を効率的かつ正確に遂行することができない。
Therefore, in the image data 712,714,716 displayed in the area of the
さらに、確認用イメージデータ703の領域では、異なる帳票Tのイメージデータ712,714,716の文字が上下に位置していない。例えば、1行目(結果No「104」)の帳票Tのイメージデータ712の先頭の文字301「金」の位置を基準として上下位置p1の領域を見るとする。この場合、3行目(結果No「159」)の帳票Tのイメージデータ716では先頭の文字301「金」、および2番目の文字302「沢」の2文字が位置している。
Further, in the area of the
また、3行目(結果No「159」)の帳票Tのイメージデータ716の末尾の文字308「目」の位置の上下位置pnの領域で見た場合、1行目(結果No「104」)の帳票Tのイメージデータ712の4番目の文字304「増」が位置している。ここで、3行目(結果No「159」)の帳票Tのイメージデータ716の末尾の文字308「目」に対し、1行目(結果No「104」)の帳票Tのイメージデータ712の末尾の文字308「目」は、文字列方向(横方向)でずれた位置に位置している。
Further, when viewed in the area of the vertical position pn of the position of the
このように、異なる帳票Tのイメージデータ712,714,716の文字が上下に位置していないため、実施の形態で説明したような確認用イメージデータの領域だけで視線Pを上下方向に移動させて異なるイメージを捉えるという作業は行えない。これにより、各行の文字列内で文字が似ていないものの有無を判断することができず、文字認識結果の正誤の確認作業を効率化できない。
As described above, since the characters of the
従来技術では、仮に図7の表示形式としても、確認用イメージデータ703では、文字列の各文字の大きさが違うことが理由で、同じ文字列画像を並べても、同じ文字が位置ずれを起こして上下には並ばない。比較すべき文字同士(1文字目同士、2文字目同士、…)は、文字列内で位置ずれを起こして上下には並ばない。また、手書き文字では、帳票に記入した人の癖により各文字の大きさがバラバラになるため、仮に、確認用イメージデータ703の同じ文字が同じ上下位置に並んだとしても、異なった字形に見誤ることがある。
In the prior art, even if the display format shown in FIG. 7 is used, in the
このように、従来技術では、手書きの文字列に対する一目での確認作業を実現できない。また、一目確認の本質は、並んだ字形の中から違和感のある「字形」を検出することであり、この本質において文字サイズの不揃いは、確認作業上邪魔な要素となる。例えば、上記の特許文献2の技術では、画像の特徴量を利用しているが、関係のない文字サイズまでクラスタリングの演算要素となってしまい、確認精度が落ちてしまう。
As described above, the conventional technique cannot realize the work of confirming the handwritten character string at a glance. In addition, the essence of glance confirmation is to detect a strange "character shape" from the arranged character shapes, and in this essence, irregular character sizes are an obstacle to the confirmation work. For example, in the technique of
これに対し、実施の形態では、図6A,図6Bを用いて説明したように、異なる帳票Tの確認用イメージデータL11,L21の領域内のイメージデータは、文字列の各文字が上下で同じ位置に位置している。これにより、職員(ユーザ)Uは、確認用イメージデータL11,L21の領域だけで視線Pを上下方向に移動させて異なるイメージを捉えるという作業を行うことができる。そして、各行の文字列内で文字が似ていないものの有無を簡単に判断することができ、文字認識結果の正誤の確認作業を効率化することができる。 On the other hand, in the embodiment, as described with reference to FIGS. 6A and 6B, the image data in the areas of the confirmation image data L11 and L21 of the different forms T have the same upper and lower characters in the character string. It is located in position. As a result, the staff (user) U can perform the work of moving the line of sight P in the vertical direction only in the areas of the confirmation image data L11 and L21 to capture different images. Then, it is possible to easily determine whether or not the characters are not similar in the character string of each line, and it is possible to streamline the work of confirming the correctness of the character recognition result.
以上説明した実施の形態は、ユーザによるOCR認識結果の確認作業を支援するために、イメージデータを取得し、イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小する。そして、拡大又は縮小した文字を連結して前記文字列の確認用イメージデータを生成し、イメージデータ又は確認用イメージデータを文字認識した結果得られる文字認識結果と、確認用イメージデータとを比較可能な表示形式のリストを出力する。これにより、リストに表示される確認用イメージデータの各文字が同じ大きさに揃えられ、ユーザは文字認識結果の確認作業時に、確認用イメージデータと、当該確認用イメージデータの文字認識結果とを容易に比較でき、確認作業を適切に行えるようになる。帳票等に記載された手書き文字は、各種多様であり、大きさや筆跡状態が異なるが、上記のように手書き文字のイメージデータに対する分割および整形を行うことで、文字列の各文字を同じ大きさにでき、ユーザによる確認用イメージデータの視認性を向上でき、文字認識結果との比較も容易かつ正しく文字認識結果の正誤を精度よく判断できるようになる。 In the embodiment described above, in order to support the user in confirming the OCR recognition result, image data is acquired, and each character is substantially equal in size of each character in the character string included in the image data. Enlarge or reduce the size of. Then, the enlarged or reduced characters are concatenated to generate confirmation image data of the character string, and the character recognition result obtained as a result of character recognition of the image data or confirmation image data can be compared with the confirmation image data. Output a list of display formats. As a result, each character of the confirmation image data displayed in the list is aligned to the same size, and when the user confirms the character recognition result, the confirmation image data and the character recognition result of the confirmation image data are displayed. You will be able to easily compare and perform confirmation work appropriately. There are various types of handwritten characters written on forms, etc., and their sizes and handwriting states are different. However, by dividing and shaping the image data of handwritten characters as described above, each character in the character string has the same size. This makes it possible to improve the visibility of the confirmation image data by the user, and it becomes possible to easily and correctly compare the character recognition result with the correctness of the character recognition result.
また、取得したイメージデータを文字毎に分割し、各分割した枠の大きさを基準となる大きさに拡大又は縮小してもよい。この処理はイメージデータに対する汎用の画像処理で容易に行うことができ、視認性を向上させた確認用イメージデータを容易に生成できる。 Further, the acquired image data may be divided for each character, and the size of each divided frame may be enlarged or reduced to a reference size. This processing can be easily performed by general-purpose image processing on the image data, and confirmation image data with improved visibility can be easily generated.
また、帳票は、一般的に複数の属性別の手書き記入欄を有している。このような帳票に対応して、イメージデータの取得では、複数の帳票の属性別のイメージデータを取得する。また、リストの出力では、複数の帳票で共通する所定の属性の確認用イメージデータと、当該確認用イメージデータの文字認識結果と、を比較可能な表示形式でリスト出力する。これにより、複数の帳票に対する属性別の文字認識結果の確認作業を行えるようになる。帳票には、氏名、住所等の複数の属性の記入欄が設けられており、属性別に文字認識結果の確認作業を行うことで、この確認作業を効率的に行えるようになる。 In addition, the form generally has a plurality of handwritten entry fields for each attribute. Corresponding to such a form, in the acquisition of image data, image data for each attribute of a plurality of forms is acquired. Further, in the output of the list, the confirmation image data of a predetermined attribute common to a plurality of forms and the character recognition result of the confirmation image data are output as a list in a comparable display format. As a result, it becomes possible to confirm the character recognition result for each attribute for a plurality of forms. The form is provided with fields for entering multiple attributes such as name and address, and by confirming the character recognition result for each attribute, this confirmation work can be performed efficiently.
さらに、複数の帳票のリストの出力では、複数の帳票で共通する一つの属性の文字列の文字認識結果に含まれる文字列でソートする。そして、ソートした複数の帳票の文字認識結果と、当該文字認識結果に対応する確認用イメージデータと、を比較可能な表示形式でリスト出力してもよい。例えば、氏名や住所等の属性別にソートされたリストを用いることで、文字認識結果および確認用イメージデータが氏名の昇順で表示できる。このため、例えば、複数の帳票にわたる確認用イメージデータの表示領域部分で連続する文字列全体をイメージ、例えば、図形として捉え、似ていない図形を見つける、という直観的な作業を行うことができる。そして、文字認識結果の正誤の確認作業を効率的に行えるようになる。 Further, in the output of the list of a plurality of forms, the character string included in the character recognition result of the character string of one attribute common to the plurality of forms is sorted. Then, the character recognition results of the plurality of sorted forms and the confirmation image data corresponding to the character recognition results may be output as a list in a comparable display format. For example, by using a list sorted by attributes such as name and address, character recognition results and confirmation image data can be displayed in ascending order of names. Therefore, for example, it is possible to perform an intuitive work of capturing the entire continuous character string as an image, for example, a figure in the display area portion of the confirmation image data over a plurality of forms, and finding a figure that is not similar. Then, the work of confirming the correctness of the character recognition result can be efficiently performed.
また、出力されたリストを用いたユーザによる文字認識結果の正誤の確認に基づき、当該確認済の文字認識結果を、帳票の電子データとして記憶する。これにより、手書き文字の帳票を容易に電子化でき、正しく文字認識された電子データとして記憶しておくことができる。 Further, based on the confirmation of the correctness of the character recognition result by the user using the output list, the confirmed character recognition result is stored as electronic data of the form. As a result, the form of handwritten characters can be easily digitized and stored as electronic data with correctly recognized characters.
また、複数の属性別の文字認識結果を帳票単位で統合し、帳票の電子データとして記憶してもよい。これにより、1枚の帳票が有する手書き記入欄を全て含む帳票単位の電子データを得ることができる。また、帳票の記載内容に基づく各種処理を行う外部端末に対し容易に帳票のデータを入出力できるようになる。 Further, the character recognition results for each of a plurality of attributes may be integrated for each form and stored as electronic data of the form. As a result, it is possible to obtain electronic data for each form including all the handwritten entry fields of one form. In addition, form data can be easily input / output to an external terminal that performs various processes based on the contents of the form.
また、OCR認識結果確認支援システムは、以上の各処理を行うOCR認識結果確認支援装置と、帳票に手書きで記載された文字列を読み取りイメージデータを出力するスキャナを含む。また、リストを表示または印刷出力する出力部と、出力されたリストに基づき、文字認識結果の正誤の確認をユーザ操作するための操作部と、を含み構成してもよい。このような汎用の外部装置を接続することで、ユーザによる文字認識結果の確認作業を効率的に行えるようになる。 Further, the OCR recognition result confirmation support system includes an OCR recognition result confirmation support device that performs each of the above processes, and a scanner that reads a character string handwritten on a form and outputs image data. Further, an output unit that displays or prints out the list and an operation unit for user operation to confirm the correctness of the character recognition result based on the output list may be included. By connecting such a general-purpose external device, the user can efficiently confirm the character recognition result.
これらのことから、実施の形態によれば、手書き文字で記載された帳票の文字認識精度を向上して電子化できるようになる。すなわち、帳票の手書き文字の確認用イメージデータと、文字認識した文字認識結果(テキストデータ)とをユーザが比較し、文字認識結果の正誤を確認する確認作業を効率化できる。この際、確認用イメージデータ自体の視認性を向上でき、文字認識結果の正誤をユーザが正しく判断できるため、最終的に帳票全体の文字認識精度を向上した電子データを得ることができるようになる。 From these facts, according to the embodiment, it becomes possible to improve the character recognition accuracy of the form described by the handwritten character and digitize it. That is, the user can compare the image data for confirming the handwritten characters of the form with the character recognition result (text data) for character recognition, and the confirmation work for confirming the correctness of the character recognition result can be made more efficient. At this time, the visibility of the confirmation image data itself can be improved, and the user can correctly judge the correctness of the character recognition result, so that it becomes possible to finally obtain electronic data with improved character recognition accuracy of the entire form. ..
なお、本発明の実施の形態で説明したOCR認識結果確認支援にかかる方法は、あらかじめ用意されたプログラムをサーバ等のプロセッサに実行させることにより実現することができる。本方法は、ハードディスク、フレキシブルディスク、CD−ROM(Compact Disc−Read Only Memory)、DVD(Digital Versatile Disk)、フラッシュメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また本方法は、インターネット等のネットワークを介して配布してもよい。 The method for supporting OCR recognition result confirmation described in the embodiment of the present invention can be realized by causing a processor such as a server to execute a program prepared in advance. This method is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM (Compact Disc-Read Only Memory), a DVD (Digital Versailles Disk), or a flash memory, and is read from the recording medium by the computer. Is executed by. Further, this method may be distributed via a network such as the Internet.
上述した実施の形態に関し、さらに以下の付記を開示する。 The following additional notes are further disclosed with respect to the above-described embodiment.
(付記1)イメージデータを取得し、
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータに実行させることを特徴とするOCR認識結果確認支援プログラム。
(Appendix 1) Obtain image data and
Enlarge or reduce the size of each character so that the size of each character of the character string included in the image data is substantially equal.
Image data for confirmation of the character string is generated by concatenating the enlarged or reduced characters.
Outputs a list of display formats capable of comparing the character recognition result obtained as a result of character recognition of the image data or the confirmation image data with the confirmation image data.
An OCR recognition result confirmation support program characterized by having a computer execute processing.
(付記2)前記イメージデータは、帳票上に複数の属性別の手書き記入欄を有し、
前記イメージデータの取得では、複数の前記帳票の前記属性別のイメージデータを取得し、
前記リストの出力では、複数の前記帳票で共通する所定の前記属性の前記確認用イメージデータと、当該確認用イメージデータの文字認識結果と、を比較可能な表示形式でリスト出力する、
ことを特徴とする付記1に記載のOCR認識結果確認支援プログラム。
(Appendix 2) The image data has a plurality of handwritten entry fields for each attribute on the form.
In the acquisition of the image data, image data for each of the attributes of the plurality of forms is acquired.
In the output of the list, the confirmation image data of the predetermined attribute common to the plurality of forms and the character recognition result of the confirmation image data are output as a list in a comparable display format.
The OCR recognition result confirmation support program described in
(付記3)前記リストの出力では、複数の前記帳票で共通する一つの前記属性の前記文字列の前記文字認識結果に含まれる前記文字列でソートし、
前記ソートした複数の前記帳票の前記文字認識結果と、当該文字認識結果に対応する前記確認用イメージデータと、を比較可能な表示形式でリスト出力する、
ことを特徴とする付記2に記載のOCR認識結果確認支援プログラム。
(Appendix 3) In the output of the list, the character string of the character string of one attribute common to the plurality of forms is sorted by the character string included in the character recognition result.
The character recognition result of the sorted plurality of forms and the confirmation image data corresponding to the character recognition result are output as a list in a comparable display format.
The OCR recognition result confirmation support program described in
(付記4)出力された前記リストを用いたユーザによる前記文字認識結果の正誤の確認に基づき、当該確認済の前記文字認識結果を前記帳票の電子データとして記憶する、
ことを特徴とする付記2または3に記載のOCR認識結果確認支援プログラム。
(Appendix 4) Based on the confirmation of correctness of the character recognition result by the user using the output list, the confirmed character recognition result is stored as electronic data of the form.
The OCR recognition result confirmation support program described in
(付記5)複数の属性別の前記文字認識結果を前記帳票単位で統合し、前記帳票の電子データとして記憶する、
ことを特徴とする付記4に記載のOCR認識結果確認支援プログラム。
(Appendix 5) The character recognition results for each of a plurality of attributes are integrated for each form and stored as electronic data of the form.
The OCR recognition result confirmation support program described in
(付記6)取得した前記イメージデータを複数の前記文字それぞれの外形を含む複数の分割枠に分割し、
分割した前記分割枠の大きさを基準となる大きさに拡大又は縮小する、
ことを特徴とする付記1〜5のいずれか一つに記載のOCR認識結果確認支援プログラム。
(Appendix 6) The acquired image data is divided into a plurality of division frames including the outer shapes of the plurality of characters.
Enlarge or reduce the size of the divided frame to a reference size.
The OCR recognition result confirmation support program according to any one of
(付記7)イメージデータを取得し、
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータが実行することを特徴とするOCR認識結果確認支援方法。
(Appendix 7) Obtain image data and
Enlarge or reduce the size of each character so that the size of each character of the character string included in the image data is substantially equal.
Image data for confirmation of the character string is generated by concatenating the enlarged or reduced characters.
Outputs a list of display formats capable of comparing the character recognition result obtained as a result of character recognition of the image data or the confirmation image data with the confirmation image data.
An OCR recognition result confirmation support method characterized in that a computer executes processing.
(付記8)イメージデータを取得し、前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する制御部、
を備えたことを特徴とするOCR認識結果確認支援システム。
(Appendix 8) Acquire image data, enlarge or reduce the size of each character so that the size of each character in the character string included in the image data is substantially equal, and concatenate the enlarged or reduced characters. Then, the confirmation image data of the character string is generated, and the character recognition result obtained as a result of character recognition of the image data or the confirmation image data is displayed in a display format in which the confirmation image data can be compared. Control unit to output,
OCR recognition result confirmation support system characterized by being equipped with.
(付記9)帳票に手書きで記載された文字列を読み取り、前記イメージデータを出力するスキャナと、
前記リストを表示または印刷出力する出力部と、
出力された前記リストに基づき、前記文字認識結果の正誤の確認をユーザ操作するための操作部と、
を備えたことを特徴とする付記8に記載のOCR認識結果確認支援システム。
(Appendix 9) A scanner that reads a character string handwritten on a form and outputs the image data.
An output unit that displays or prints out the list,
Based on the output list, an operation unit for user operation to confirm the correctness of the character recognition result, and
The OCR recognition result confirmation support system according to Appendix 8, which is characterized by the above.
100 OCR認識結果確認支援装置
101 記憶部
102 属性別変換結果データ
103 ディスプレイ
104 キーボード
105 データベース
110 スキャナ
201 CPU(制御部)
202 メモリ
203 ネットワークインタフェース
205 記録媒体
206 入出力インタフェース
301〜30n 文字
611,613,615,621 文字認識結果(テキストデータ)
612,614,616,622,624,626 イメージデータ
E 枠
E1〜E8 分割枠
H 利用者宅
NW ネットワーク
IMG イメージデータ
L1(L1,L2) リスト
L11,L21 確認用イメージデータ
L12,L22 文字認識結果(テキストデータ)
P 視線(視線の移動状態)
T 帳票
U(U1,U2) 職員(ユーザ)
100 OCR recognition result
202
612,614,616,622,624,626 Image data E frame E1 to E8 Divided frame H User's home NW network IMG image data L1 (L1, L2) List L11, L21 Confirmation image data L12, L22 Character recognition result ( Text data)
P line of sight (moving state of line of sight)
T form U (U1, U2) staff (user)
Claims (8)
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータに実行させることを特徴とするOCR認識結果確認支援プログラム。 Get image data
Enlarge or reduce the size of each character so that the size of each character of the character string included in the image data is substantially equal.
Image data for confirmation of the character string is generated by concatenating the enlarged or reduced characters.
Outputs a list of display formats capable of comparing the character recognition result obtained as a result of character recognition of the image data or the confirmation image data with the confirmation image data.
An OCR recognition result confirmation support program characterized by having a computer execute processing.
前記イメージデータの取得では、複数の前記帳票の前記属性別のイメージデータを取得し、
前記リストの出力では、複数の前記帳票で共通する所定の前記属性の前記確認用イメージデータと、当該確認用イメージデータの文字認識結果と、を比較可能な表示形式でリスト出力する、
ことを特徴とする請求項1に記載のOCR認識結果確認支援プログラム。 The image data has a plurality of handwritten entry fields for each attribute on the form.
In the acquisition of the image data, image data for each of the attributes of the plurality of forms is acquired.
In the output of the list, the confirmation image data of the predetermined attribute common to the plurality of forms and the character recognition result of the confirmation image data are output as a list in a comparable display format.
The OCR recognition result confirmation support program according to claim 1, characterized in that.
前記ソートした複数の前記帳票の前記文字認識結果と、当該文字認識結果に対応する前記確認用イメージデータと、を比較可能な表示形式でリスト出力する、
ことを特徴とする請求項2に記載のOCR認識結果確認支援プログラム。 In the output of the list, the character string of the character string of one attribute common to the plurality of forms is sorted by the character string included in the character recognition result.
The character recognition result of the sorted plurality of forms and the confirmation image data corresponding to the character recognition result are output as a list in a comparable display format.
The OCR recognition result confirmation support program according to claim 2, characterized in that.
ことを特徴とする請求項2または3に記載のOCR認識結果確認支援プログラム。 Based on the confirmation of correctness of the character recognition result by the user using the output list, the confirmed character recognition result is stored as the form electronic data.
The OCR recognition result confirmation support program according to claim 2 or 3, characterized in that.
ことを特徴とする請求項4に記載のOCR認識結果確認支援プログラム。 The character recognition results for each of a plurality of attributes are integrated for each form and stored as electronic data of the form.
The OCR recognition result confirmation support program according to claim 4, characterized in that.
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータが実行することを特徴とするOCR認識結果確認支援方法。 Get image data
Enlarge or reduce the size of each character so that the size of each character of the character string included in the image data is substantially equal.
Image data for confirmation of the character string is generated by concatenating the enlarged or reduced characters.
Outputs a list of display formats capable of comparing the character recognition result obtained as a result of character recognition of the image data or the confirmation image data with the confirmation image data.
An OCR recognition result confirmation support method characterized in that a computer executes processing.
を備えたことを特徴とするOCR認識結果確認支援システム。 The image data is acquired, the size of each character is enlarged or reduced so that the size of each character of the character string included in the image data is substantially equal, and the enlarged or reduced characters are concatenated to form the character. A control unit that generates column confirmation image data and outputs a list of display formats that can compare the character recognition result obtained as a result of character recognition of the image data or the confirmation image data with the confirmation image data. ,
OCR recognition result confirmation support system characterized by being equipped with.
前記リストを表示または印刷出力する出力部と、
出力された前記リストに基づき、前記文字認識結果の正誤の確認をユーザ操作するための操作部と、
を備えたことを特徴とする請求項7に記載のOCR認識結果確認支援システム。 A scanner that reads the character string handwritten on the form and outputs the image data,
An output unit that displays or prints out the list,
Based on the output list, an operation unit for user operation to confirm the correctness of the character recognition result, and
The OCR recognition result confirmation support system according to claim 7, wherein the OCR recognition result confirmation support system is provided.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019117796A JP7283257B2 (en) | 2019-06-25 | 2019-06-25 | OCR recognition result confirmation support program, OCR recognition result confirmation support method, and OCR recognition result confirmation support system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019117796A JP7283257B2 (en) | 2019-06-25 | 2019-06-25 | OCR recognition result confirmation support program, OCR recognition result confirmation support method, and OCR recognition result confirmation support system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005173A true JP2021005173A (en) | 2021-01-14 |
JP7283257B2 JP7283257B2 (en) | 2023-05-30 |
Family
ID=74097721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019117796A Active JP7283257B2 (en) | 2019-06-25 | 2019-06-25 | OCR recognition result confirmation support program, OCR recognition result confirmation support method, and OCR recognition result confirmation support system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7283257B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03122773A (en) * | 1989-10-05 | 1991-05-24 | Ricoh Co Ltd | Image forming device |
JPH0773269A (en) * | 1993-09-02 | 1995-03-17 | Fuji Facom Corp | Collating method for character recognizing results |
JPH09297821A (en) * | 1996-05-08 | 1997-11-18 | Toshiba Corp | Character recognition method |
-
2019
- 2019-06-25 JP JP2019117796A patent/JP7283257B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03122773A (en) * | 1989-10-05 | 1991-05-24 | Ricoh Co Ltd | Image forming device |
JPH0773269A (en) * | 1993-09-02 | 1995-03-17 | Fuji Facom Corp | Collating method for character recognizing results |
JPH09297821A (en) * | 1996-05-08 | 1997-11-18 | Toshiba Corp | Character recognition method |
Also Published As
Publication number | Publication date |
---|---|
JP7283257B2 (en) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3425408B2 (en) | Document reading device | |
US8015203B2 (en) | Document recognizing apparatus and method | |
KR101985612B1 (en) | Method for manufacturing digital articles of paper-articles | |
KR20090079226A (en) | Automated generation of form definitions from hard-copy forms | |
JP2004139484A (en) | Form processing device, program for implementing it, and program for creating form format | |
JP2005173730A (en) | Business form ocr program, method, and device | |
EP3757881A1 (en) | Documentation determination device and documentation determination program | |
US20080131000A1 (en) | Method for generating typographical line | |
JP2022066321A (en) | Information processing device and program | |
CN109726369A (en) | A kind of intelligent template questions record Implementation Technology based on normative document | |
JP2008108114A (en) | Document processor and document processing method | |
CN111860450A (en) | Ticket recognition device and ticket information management system | |
JP7283257B2 (en) | OCR recognition result confirmation support program, OCR recognition result confirmation support method, and OCR recognition result confirmation support system | |
JPWO2014068770A1 (en) | Data extraction method, data extraction device and program thereof | |
JP2008028716A (en) | Image processing method and apparatus | |
JPH08320914A (en) | Table recognition method and device | |
JP6869299B2 (en) | Quadrature table judgment device and control program | |
JP3898645B2 (en) | Form format editing device and form format editing program | |
WO2015141260A1 (en) | Handwritten music notation recognition device and program | |
WO2016170690A1 (en) | Input control program, input control device, input control method, character correction program, character correction device, and character correction method | |
JP2001320571A (en) | System and method for processing handwritten slip data | |
JP2009087378A (en) | Business form processor | |
JP4741363B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP4521377B2 (en) | Form processing apparatus, program for executing the apparatus, and form format creation program | |
JP3128899B2 (en) | Mapping method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7283257 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |