JP7110723B2 - Data conversion device, image processing device and program - Google Patents

Data conversion device, image processing device and program Download PDF

Info

Publication number
JP7110723B2
JP7110723B2 JP2018096815A JP2018096815A JP7110723B2 JP 7110723 B2 JP7110723 B2 JP 7110723B2 JP 2018096815 A JP2018096815 A JP 2018096815A JP 2018096815 A JP2018096815 A JP 2018096815A JP 7110723 B2 JP7110723 B2 JP 7110723B2
Authority
JP
Japan
Prior art keywords
characters
extracted
calculation
calculation formula
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018096815A
Other languages
Japanese (ja)
Other versions
JP2019204146A (en
Inventor
貴久 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018096815A priority Critical patent/JP7110723B2/en
Publication of JP2019204146A publication Critical patent/JP2019204146A/en
Application granted granted Critical
Publication of JP7110723B2 publication Critical patent/JP7110723B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

この発明は、演算対象の複数の文字と、これらの複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データから、前記文字や計算式を抽出可能な、例えば画像処理装置等のデータ変換装置、このデータ変換装置を備えた画像処理装置及びプログラムに関する。 The present invention is capable of extracting characters and calculation formulas from image data including a plurality of characters to be calculated and characters indicating calculation results when these characters are calculated by a predetermined calculation formula. The present invention relates to a data conversion device such as an image processing device, an image processing device having the data conversion device, and a program.

近年、画像データに対して、例えばOCR(光学文字認識:optical character reader)やICR(インテリジェント文字認識:intelligent character recognition)、あるいはこれらとオブジェクト分離技術を組み合わせた画像解析処理を行うことにより、印刷文字のみならず手書き文字についてもテキストデータ等への高精度な変換を行うことが可能となってきた。それに伴い、変換後のデータをより編集しやすい形式にすることで、利便性の向上が図られてきている。 In recent years, by performing image analysis processing on image data, for example, OCR (optical character reader), ICR (intelligent character recognition), or combining these with object separation technology, printed characters In addition, it has become possible to convert handwritten characters into text data or the like with high accuracy. Along with this, convenience has been improved by making converted data into a format that is easier to edit.

このような試みの一つに、印刷あるいは手書きされた表を、表計算形式のデータへと変換することが行われている。 One such attempt is to convert printed or handwritten tables into data in spreadsheet form.

具体例を挙げると、図11に示すように、表の縦方向を列、横方向を行とすると、A列2~5行目の各マス目(セル)に「1Q」「2Q」「3Q」「4Q」の文字列がそれぞれ記載され、A列6行目のセルに「合計」という文字列が記載され、B~D列1行目の各セルに個人の氏名がそれぞれ記載され、E列1行目のセルに「合計」という文字列が記載された表についての画像データがあるものとする。また、B~D列2~5行目の各セルには、個人毎の数値が記載されている。 To give a specific example, as shown in FIG. 11, if the vertical direction of the table is the column and the horizontal direction is the row, the squares (cells) of the 2nd to 5th rows of column A are "1Q", "2Q", and "3Q". ” and “4Q” are written respectively, the character string “total” is written in the cell of column A, row 6, the individual’s name is written in each cell of columns B to D, row 1, and E It is assumed that there is image data for a table in which a character string "total" is written in a cell in the first row of the column. Also, in each cell of the 2nd to 5th rows of columns B to D, a numerical value for each individual is written.

このような画像データを表計算形式のデータに変換する。具体的には、B~D列6行目の各セルに各個人毎の1Q~4Qの合計値が自動計算されて記入されるように計算式を埋め込み、E列2~5行目の各セルに1Q~4Q毎の合計値が自動計算されて記入されるように計算式を埋め込み、E列6行目のセルに全部の合計値が自動計算されて記入されるように計算式を埋め込む。従って、例えば破線枠で示すB列6行目のセルB6のデータとしては、「18」という数字ではなく、埋め込まれる計算式である"=sum(B2:B5)"に変換される必要がある。 Such image data is converted into spreadsheet format data. Specifically, the calculation formula is embedded so that the total value of 1Q to 4Q for each individual is automatically calculated and entered in each cell of columns B to D, row 6, and each of columns E, rows 2 to 5 Embed the calculation formula so that the total value for each 1Q to 4Q is automatically calculated and filled in the cell, and embed the formula so that the total value of all is automatically calculated and filled in the cell of column E, row 6. . Therefore, for example, the data in cell B6, row 6, column B, indicated by the dashed frame, must be converted to the embedded formula "=sum(B2:B5)" instead of the number "18". .

しかしながら現状では、画像解析処理(特にオフライン手書き文字認識処理)の精度はまだまだ不十分であり、以下のような誤変換が発生する場合がある。 However, at present, the accuracy of image analysis processing (especially offline handwritten character recognition processing) is still insufficient, and the following erroneous conversion may occur.

例えば、図4の左側の図に示すような手書きの表を読み取って、同図右側の図に示す表計算形式のデータに変換したときに、オリジナルの手書き表における4Qの数値「8」を「3」と誤変換したとすると、計算式により計算した合計値は13となる。つまり、オリジナルの表では合計値が18であるのに対し、表計算形式のデータに変換したときには、演算対象の数値を誤変換すると計算式による計算結果も誤変換されてしまうことになる。 For example, when reading a handwritten table as shown in the diagram on the left side of FIG. 3”, the total value calculated by the formula is 13. In other words, the total value is 18 in the original table, but when converted to spreadsheet format data, if the numerical values to be calculated are erroneously converted, the calculation result of the formula will also be erroneously converted.

なお、特許文献1には、項目と数値が記述された表データから集計に使用された計算式を導出してその計算式が埋め込まれた表データを出力する表データ変換方法が提案されており、格子状にマス目(セル)が配列された表データの中の項目名として「合計」「平均」等の特定のキーワードが使用されている場合に、そのキーワードが使用されているセル(キーワード該当セル)と同じ“行”(横方向)または“列”(縦方向)に含まれる数値が登録されているセルを、「合計」のキーワードに対応する集計結果が格納されるセル(集計結果格納セル)に特定し、該集計結果格納セルの数値を、他のセルを参照する計算式に置き換える、もしくは、計算式による計算結果と元々そのセルに登録されていた数値が一致しない場合に、ユーザに計算結果が不一致となる旨を通知して警告することが記載されている。 Patent Document 1 proposes a table data conversion method that derives a calculation formula used for aggregation from table data in which items and numerical values are described and outputs table data in which the calculation formula is embedded. , when a specific keyword such as "total" or "average" is used as an item name in table data with cells arranged in a grid, the cell (keyword Cells that contain numerical values in the same "row" (horizontal direction) or "column" (vertical direction) as the corresponding cell) are changed to cells that store the aggregation results corresponding to the "total" keyword (aggregation results storage cell) and replace the value of the aggregate result storage cell with a formula that references other cells, or if the result of the formula does not match the value originally registered in that cell, It is described that the user is warned by notifying that the calculation results are inconsistent.

特開2017-187931号公報JP 2017-187931 A

しかし、特許文献1に記載された方法では、計算式による計算結果と元々そのセルに登録されていた数値が一致しない場合に、ユーザに計算結果が不一致となる旨を通知して警告が行われるものの、誤変換の修正はユーザーの手作業により行われるものであり、誤変換を自動的に修正することはできなかった。 However, in the method described in Patent Document 1, when the calculation result by the calculation formula and the numerical value originally registered in the cell do not match, the user is warned that the calculation result does not match. However, erroneous conversions are corrected manually by users, and erroneous conversions cannot be corrected automatically.

この発明は、このような技術的背景に鑑みてなされたものであって、演算対象の複数の文字と、これらの複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データから、文字や計算式を抽出して表計算形式等のデータに変換する場合に、誤変換を自動的に修正することができるデータ変換装置、画像処理装置及びプログラムを低供することを目的とする。 The present invention has been made in view of such a technical background, and includes a plurality of characters to be operated on, and a character indicating the operation result when the plurality of characters are operated by a predetermined formula. To provide a data conversion device, an image processing device, and a program capable of automatically correcting erroneous conversions when extracting characters and calculation formulas from image data containing data and converting them into data in spreadsheet format, etc. aim.

上記目的は、以下の手段によって達成される。
(1)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、を備え、前記抽出手段による前記文字の抽出は文字認識処理により行われ、前記抽出手段は、文字認識率の最も高い文字を抽出し、前記判定手段により、抽出された演算対象の文字が誤変換されていると判定された場合、前記修正手段は、誤変換されている文字を次に文字認識率の高い文字に修正し、前記判定手段は、前記文字の修正後に前記計算式による再計算を行うことにより、修正された文字について再度誤変換されているか否かを判定することを特徴とするデータ変換装置。
(2)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、を備え、前記抽出手段により抽出された計算式が端数処理を含む場合、前記判定手段は、端数処理が切り捨てか切り上げかを判定し、前記修正手段は、端数処理が切り捨てか切り上げかの判定結果に基づいて前記計算式の端数処理を決定することにより、計算式を修正することを特徴とするデータ変換装置。
(3)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、を備え、演算対象の複数の文字の一部についての前記抽出手段による抽出が不可能な場合、前記修正手段は、前記抽出手段により抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、前記一部の文字を適正な文字に修正することを特徴とするデータ変換装置。
(4)前記入力データは計算式を示す文字列を有する表計算形式の画像データであり、前記抽出手段は、前記入力データにおける前記文字列に基づいて前記計算式を抽出するとともに、前記演算対象の複数の文字と演算結果を示す文字を抽出し、前記変換手段は、抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた表計算型データに変換する前項1~3の何れかに記載のデータ変換装置。
(5)前記入力データは演算記号を有する画像データであり、前記抽出手段は、前記演算記号に基づいて前記計算式を抽出し、演算記号で示される被演算領域及び演算結果領域に基づいて、前記演算対象の複数の文字と演算結果を示す文字を抽出する前項1~3の何れかに記載のデータ変換装置。
(6)再計算の結果は別シートに記録される前項1に記載のデータ変換装置。
(7)修正後の文字を識別できる態様で再計算の結果が別シートに記録される前項6に記載のデータ変換装置。
(8)前項1~7の何れかに記載のデータ変換装置を備えた画像処理装置。
(9)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、をデータ変換装置のコンピュータに実行させ、前記抽出ステップによる前記文字の抽出は文字認識処理により行われ、前記抽出ステップでは、文字認識率の最も高い文字を抽出し、前記判定ステップにより、抽出された演算対象の文字が誤変換されていると判定された場合、前記修正ステップでは、誤変換されている文字を次に文字認識率の高い文字に修正し、前記判定ステップでは、前記文字の修正後に前記計算式による再計算を行うことにより、修正された文字について再度誤変換されているか否かを判定する処理を前記コンピュータに実行させるためのプログラム。
(10)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、をデータ変換装置のコンピュータに実行させ、前記抽出ステップにより抽出された計算式が端数処理を含む場合、前記判定ステップでは、端数処理が切り捨てか切り上げかを判定し、前記修正ステップでは、端数処理が切り捨てか切り上げかの判定結果に基づいて前記計算式の端数処理を決定することにより、計算式を修正する処理を前記コンピュータに実行させるためのプログラム。
(11)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、をデータ変換装置のコンピュータに実行させ、演算対象の複数の文字の一部についての前記抽出ステップによる抽出が不可能な場合、前記修正ステップでは、前記抽出ステップにより抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、前記一部の文字を適正な文字に修正する処理を前記コンピュータに実行させるためのプログラム。
The above object is achieved by the following means.
(1) receiving means for receiving, as input data, image data including a plurality of characters to be operated on and characters indicating a result of calculating the plurality of characters by a predetermined calculation formula; extracting means for extracting the plurality of characters to be operated, the calculation formula, and characters indicating the calculation result from the input data obtained; and extracting the input data from the plurality of characters to be operated and the calculation formula and a conversion means for converting into editable data using characters indicating the calculation result; a calculation result when a plurality of characters to be calculated extracted from the extraction means are calculated by the extracted calculation formula; determining means for determining whether or not at least one of the extracted characters to be operated on, the calculation formula, and the characters indicating the operation result have been erroneously converted by comparing them with the characters indicating the operation result; correction means for correcting the characters or formulas to correct characters or calculation formulas when the determination means determines that at least one of them has been erroneously converted, and the extraction of the characters by the extraction means is performed by character recognition processing. , the extracting means extracts a character with the highest character recognition rate, and if the determining means determines that the extracted character to be operated has been erroneously converted, the correcting means The character is corrected to a character with the next highest character recognition rate, and the determination means recalculates according to the formula after the correction of the character, thereby determining whether or not the corrected character is erroneously converted again. A data conversion device characterized by determining:
(2) receiving means for receiving, as input data, image data including a plurality of characters to be operated on and characters indicating a result of calculating the plurality of characters by a predetermined formula; extracting means for extracting the plurality of characters to be operated, the calculation formula, and characters indicating the calculation result from the input data obtained; and extracting the input data from the plurality of characters to be operated and the calculation formula and a conversion means for converting into editable data using characters indicating the calculation result; a calculation result when a plurality of characters to be calculated extracted from the extraction means are calculated by the extracted calculation formula; determining means for determining whether or not at least one of the extracted characters to be operated on, the calculation formula, and the characters indicating the operation result have been erroneously converted by comparing them with the characters indicating the operation result; correction means for correcting to a proper character or calculation formula when at least one of them is determined to be erroneously converted by the determination means, wherein the calculation formula extracted by the extraction means includes rounding. , the determining means determines whether rounding is to be performed by rounding down or rounding up, and the correcting means determines rounding of the formula based on the determination result as to whether rounding is to be performed by rounding down or rounding up. A data conversion device characterized by correcting.
(3) receiving means for receiving, as input data, image data including a plurality of characters to be computed and characters indicating a computation result when the plurality of characters are computed by a predetermined formula; extracting means for extracting the plurality of characters to be operated, the calculation formula, and characters indicating the calculation result from the input data obtained; and extracting the input data from the plurality of characters to be operated and the calculation formula and a conversion means for converting into editable data using characters indicating the calculation result; a calculation result when a plurality of characters to be calculated extracted from the extraction means are calculated by the extracted calculation formula; determining means for determining whether or not at least one of the extracted characters to be operated on, the calculation formula, and the characters indicating the operation result have been erroneously converted by comparing them with the characters indicating the operation result; correcting means for correcting to a proper character or calculation formula when at least one of the characters is determined to be erroneously converted by the determining means; If the extraction is impossible, the correction means corrects the part of the characters to proper characters by calculating backward from the other characters to be operated, the calculation formula, and the characters indicating the calculation result extracted by the extraction means. A data conversion device characterized by:
(4) The input data is image data in a spreadsheet format having a character string indicating a calculation formula, and the extracting means extracts the calculation formula based on the character string in the input data, and extracts the calculation target and the conversion means converts into spreadsheet data using the extracted plurality of characters to be operated, the calculation formula, and the characters indicating the calculation result. 4. The data conversion device according to any one of 3.
(5) The input data is image data having operation symbols, and the extracting means extracts the calculation formula based on the operation symbols, and based on the area to be operated and the operation result area indicated by the operation symbols, 4. The data conversion device according to any one of the preceding items 1 to 3, which extracts the plurality of characters to be operated and the characters indicating the operation result.
(6) The data conversion device according to the preceding item 1, wherein the result of recalculation is recorded on a separate sheet.
(7) The data conversion device according to the preceding item 6, wherein the result of recalculation is recorded on a separate sheet in a manner in which the characters after correction can be identified.
(8) An image processing apparatus comprising the data conversion apparatus according to any one of items 1 to 7 above.
(9) a receiving step of receiving, as input data, image data including a plurality of characters to be computed and characters representing a computation result when the plurality of characters are computed by a predetermined formula; an extracting step of extracting the plurality of characters to be operated on, the calculation formula, and characters representing the calculation result from the input data obtained from the input data; and a conversion step of converting into editable data using characters indicating the calculation result, a calculation result when the plurality of characters to be calculated extracted from the extraction step are calculated with the extracted calculation formula, and the extraction a determination step of determining whether or not at least one of the extracted characters to be operated on, the calculation formula, and the character indicating the operation result has been erroneously converted by comparing with the character indicating the operation result; a correction step of correcting to a proper character or calculation formula when at least one of them is determined to be erroneously converted by the determination step, and causing the computer of the data conversion device to execute extraction of the character by the extraction step. is performed by character recognition processing, the extracting step extracts a character with the highest character recognition rate, and the determining step determines that the extracted character to be operated has been erroneously converted, the correcting In the step, the erroneously converted character is corrected to a character with the next highest character recognition rate, and in the determination step, after the character is corrected, recalculation is performed according to the calculation formula, thereby making the corrected character erroneous again. A program for causing the computer to execute processing for determining whether or not conversion has been performed.
(10) a receiving step of receiving, as input data, image data including a plurality of characters to be computed and characters indicating a computation result when the plurality of characters are computed by a predetermined formula; an extracting step of extracting the plurality of characters to be operated on, the calculation formula, and characters representing the calculation result from the input data obtained from the input data; and a conversion step of converting into editable data using characters indicating the calculation result, a calculation result when the plurality of characters to be calculated extracted from the extraction step are calculated with the extracted calculation formula, and the extraction a determination step of determining whether or not at least one of the extracted characters to be operated on, the calculation formula, and the character indicating the operation result has been erroneously converted by comparing with the character indicating the operation result; and a correction step of correcting to a proper character or calculation formula if at least one of them is determined to be erroneously converted by the determination step, and causing the computer of the data conversion device to execute the calculation extracted by the extraction step. When the formula includes rounding, the determining step determines whether the rounding is rounding down or rounding up, and the modifying step determines rounding of the formula based on the determination result of rounding down or rounding up. A program for causing the computer to execute a process of correcting the calculation formula by
(11) a receiving step of receiving, as input data, image data including a plurality of characters to be computed and characters indicating a computation result when the plurality of characters are computed by a predetermined formula; an extracting step of extracting the plurality of characters to be operated on, the calculation formula, and characters representing the calculation result from the input data obtained from the input data; and a conversion step of converting into editable data using characters indicating the calculation result, a calculation result when the plurality of characters to be calculated extracted from the extraction step are calculated with the extracted calculation formula, and the extraction a determination step of determining whether or not at least one of the extracted characters to be operated on, the calculation formula, and the character indicating the operation result has been erroneously converted by comparing with the character indicating the operation result; If at least one of the characters is determined to be erroneously converted by the determination step, the computer of the data conversion device is caused to execute a correction step of correcting it to a proper character or a calculation formula, and one of the plurality of characters to be calculated. If the part cannot be extracted by the extracting step, the correcting step back-calculates from other characters of the operation target extracted by the extracting step, the calculation formula, and the character indicating the calculation result to obtain the part A program for causing the computer to execute a process of correcting characters to proper characters.

前項(1)に記載の発明によれば、演算対象の複数の文字と、複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データが、入力データとして受け付けられ、この受け付けた入力データから、演算対象の複数の文字と計算式と演算結果を示す文字が抽出され、編集可能なデータへ変換される。一方、抽出された演算対象の複数の文字を抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とが比較されることにより、それぞれ抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かが判定され、少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正される。 According to the invention described in the preceding item (1), image data including a plurality of characters to be operated and characters indicating the operation result when the plurality of characters are operated by a predetermined formula is accepted as input data. , a plurality of characters to be calculated, a calculation formula, and characters indicating the calculation result are extracted from the received input data and converted into editable data. On the other hand, each of the extracted operation target is compared by comparing the operation result when the extracted operation target characters are operated by the extracted calculation expression and the extracted operation result character. It is determined whether or not at least one of characters, calculation formulas, and characters indicating calculation results has been erroneously converted, and if it is determined that at least one of them has been erroneously converted, it is corrected to a proper character or calculation formula. be.

従って、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに誤変換が発生しても、誤変換された文字や計算式が自動的に修正されるから、ユーザーが誤変換された文字や計算式を手作業で修正する手間を省くことができる。また、文字の抽出は文字認識処理により行われるとともに、文字認識率の最も高い文字が抽出されるが、抽出された演算対象の文字が誤変換されていると判定された場合、誤変換されている文字は次に文字認識率の高い文字に修正される。そして、修正後に計算式による再計算が行われ、修正された文字について再度誤変換されているか否かが判定されるから、誤変換の発生をより確実に解消できる。
前項(2)に記載の発明によれば、計算式が端数処理を含む場合、切り捨てかまたは切り上げかの判定を行った後に端数処理が決定され計算式が修正されるから、適正な端数処理を有する計算式に修正できる。
前項(3)に記載の発明によれば、演算対象の複数の文字の一部について抽出が不可能な場合、抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、抽出不可能な一部の文字が適正な文字に修正されるから、確実に誤変換を防止することができる。
Therefore, even if an erroneous conversion occurs when extracting these characters and calculation formulas from the original image data and converting them into editable data, the erroneously converted characters and calculation formulas is automatically corrected, saving the user the trouble of manually correcting misconverted characters and formulas. Character extraction is performed by character recognition processing, and the character with the highest character recognition rate is extracted. character is corrected to the character with the next highest character recognition rate. Then, after the correction, recalculation is performed using the calculation formula, and it is determined whether or not the corrected character has been erroneously converted again.
According to the invention described in the preceding item (2), when the calculation formula includes rounding, rounding down or rounding up is determined and then the calculation formula is corrected by determining the rounding. It can be modified to have a formula.
According to the invention described in the preceding item (3), when extraction of a part of a plurality of characters to be operated is impossible, backward calculation is performed from other extracted characters to be operated, calculation formulas, and characters indicating operation results. Therefore, since some characters that cannot be extracted are corrected to proper characters, erroneous conversion can be reliably prevented.

前項()に記載の発明によれば、計算式を示す文字列を有する表計算形式の画像データにおける前記文字列に基づいて計算式が抽出されるとともに、演算対象の複数の文字と演算結果を示す文字が抽出され、これらの抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた表計算型データに変換される。
According to the invention described in the preceding item ( 4 ), the calculation formula is extracted based on the character string in the image data in the spreadsheet format having the character string indicating the calculation formula, and the plurality of characters to be calculated and the calculation result are extracted. is extracted, and converted into spreadsheet data using the extracted plurality of characters to be operated, the calculation formula, and the characters indicating the operation result.

前項()に記載の発明によれば、演算記号を有する画像データの演算記号に基づいて計算式が抽出され、演算記号で示される被演算領域及び演算結果領域に基づいて、演算対象の複数の文字と演算結果を示す文字が抽出される。
According to the invention described in the preceding item ( 5 ), the calculation formula is extracted based on the calculation symbol of the image data having the calculation symbol, and based on the calculated area and the calculation result area indicated by the calculation symbol, the plurality of calculation targets and the character indicating the operation result are extracted.

前項()に記載の発明によれば、再計算の結果は別シートに記録されるから、再計算の前後の結果を容易に確認することができる。
According to the invention described in the preceding item ( 6 ), the results of recalculation are recorded on a separate sheet, so the results before and after recalculation can be easily confirmed.

前項()に記載の発明によれば、修正後の文字を識別できる態様で再計算の結果が別シートに記録されるから、修正後の文字を容易に認識することができる。
According to the invention described in the preceding item ( 7 ), the result of recalculation is recorded on a separate sheet in a manner in which the corrected characters can be identified, so the corrected characters can be easily recognized.

前項()に記載の発明によれば、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに誤変換が発生しても、誤変換された文字や計算式を自動的に修正することができる画像処理装置となる。
According to the invention described in the preceding paragraph ( 8 ), erroneous conversion occurs when extracting characters and calculation formulas from the original image data and converting them into editable data. can also be an image processing device capable of automatically correcting erroneously converted characters and calculation formulas.

前項()に記載の発明によれば、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに演算対象の文字に誤変換が発生しても、誤変換された文字を自動的に修正する処理を、データ処理装置のコンピュータに実行させることができる。
According to the invention described in the preceding paragraph ( 9 ), when extracting these characters and calculation formulas from the characters and calculation formulas contained in the original image data and converting them into editable data, there is an error in the characters to be operated. If a conversion occurs, the computer of the data processing apparatus can be caused to automatically correct the erroneously converted characters .

データ処理装置を構成する一例としてのパーソナルコンピュータ等の情報処理装置のブロック図である。1 is a block diagram of an information processing device such as a personal computer as an example of a data processing device; FIG. データ処理装置を構成する他の例としての画像形成装置のブロック図である。FIG. 3 is a block diagram of an image forming apparatus as another example of a data processing apparatus; 情報処理装置のCPU及び画像形成装置のCPUによって実現される、画像データから文字や計算式を抽出して編集可能なデータへ変換する機能の構成を示すブロック図である。2 is a block diagram showing a configuration of a function of extracting characters and calculation formulas from image data and converting them into editable data, realized by a CPU of an information processing apparatus and a CPU of an image forming apparatus; FIG. この発明の一実施形態による誤変換の修正方法を説明するための図である。FIG. 4 is a diagram for explaining a method of correcting erroneous conversion according to one embodiment of the present invention; 上記の修正方法に用いられる各数値の変換精度を示す表である。It is a table|surface which shows the conversion precision of each numerical value used for said correction method. 誤変換修正後の状態を示す図である。FIG. 10 is a diagram showing a state after incorrect conversion correction; この発明の他の実施形態による誤変換の修正方法を説明するための図である。FIG. 5 is a diagram for explaining a method of correcting erroneous conversion according to another embodiment of the present invention; この発明のさらに他の実施形態による誤変換の修正方法を説明するための図である。FIG. 11 is a diagram for explaining a method of correcting erroneous conversion according to still another embodiment of the present invention; この発明のさらに他の実施形態による誤変換の修正方法を説明するための図である。FIG. 11 is a diagram for explaining a method of correcting erroneous conversion according to still another embodiment of the present invention; 第1の実施形態におけるデータ処理装置の誤変換の修正動作を示すフローチャートである。4 is a flow chart showing an erroneous conversion correcting operation of the data processing device in the first embodiment. 従来の課題を説明するための図である。It is a figure for demonstrating the conventional problem.

以下、この発明の実施形態を図面に基づいて説明する。 Embodiments of the present invention will be described below with reference to the drawings.

この発明の一実施形態に係るデータ処理装置は、図1に示すようなパーソナルコンピュータ(PCと記す)等の情報処理装置1によって構成されていても良いし、図2に示すような印刷装置等の画像形成装置2によって構成されていても良い。 A data processing apparatus according to an embodiment of the present invention may be configured by an information processing apparatus 1 such as a personal computer (hereinafter referred to as PC) as shown in FIG. image forming apparatus 2.

図1は、データ処理装置を構成する情報処理装置1のブロック図である。 FIG. 1 is a block diagram of an information processing device 1 constituting a data processing device.

情報処理装置1は、制御部11と、記憶装置12と、入力インターフェース(入力I/F)13と、出力インターフェース(出力I/F)14等を備えている。 The information processing apparatus 1 includes a control unit 11, a storage device 12, an input interface (input I/F) 13, an output interface (output I/F) 14, and the like.

制御部11はCPU111とRAM112を備えている。 The control unit 11 has a CPU 111 and a RAM 112 .

CPU111は、記憶装置12等に格納されている動作プログラムに従って動作することにより、情報処理装置1の全体を統括的に制御するものである。特にこの実施形態では、演算対象の複数の文字と、これらの複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを入力データとして受け付けるとともに、受け付けた入力データを画像解析処理して文字や計算式を抽出することにより、入力データを、抽出された文字や計算式を用いた編集可能なデータへ変換する等の処理を実行するが、詳細な説明は後述する。 The CPU 111 comprehensively controls the entire information processing apparatus 1 by operating according to an operation program stored in the storage device 12 or the like. In particular, in this embodiment, image data including a plurality of characters to be operated on and characters indicating the operation result when these plurality of characters are operated by a predetermined formula is accepted as input data, and the accepted input data By analyzing the image and extracting characters and calculation formulas, the input data is converted into editable data using the extracted characters and calculation formulas, etc. Details will be described later. do.

RAM112は、CPU111が動作プログラムに従って動作する際の作業領域となるメモリである。 The RAM 112 is a memory that serves as a work area when the CPU 111 operates according to the operation program.

記憶装置12は例えばハードディスク装置(HDD)等からなり、CPU111の動作プログラム、各種のアプリケーション、その他のデータを記憶する。 The storage device 12 is, for example, a hard disk device (HDD) or the like, and stores an operating program for the CPU 111, various applications, and other data.

入力インターフェース13は外部装置3から送信される各種のデータを受信する受信手段として機能し、出力インターフェース14はデータ処理装置1から外部装置3へ各種のデータを送信する送信手段として機能する。 The input interface 13 functions as receiving means for receiving various data transmitted from the external device 3 , and the output interface 14 functions as transmitting means for transmitting various data from the data processing device 1 to the external device 3 .

図2は、データ処理装置を構成する画像形成装置2のブロック図である。 FIG. 2 is a block diagram of the image forming apparatus 2 that constitutes the data processing apparatus.

画像形成装置2は、制御部21と、記憶装置22と、操作パネル23と、画像入力部24と、画像印刷部25と、入力インターフェース(入力I/F)26と、出力インターフェース(出力I/F)27等を備えている。 The image forming apparatus 2 includes a control unit 21, a storage device 22, an operation panel 23, an image input unit 24, an image printing unit 25, an input interface (input I/F) 26, and an output interface (output I/F). F) 27 and the like.

制御部21はCPU211とRAM212とROM213を備えている。 The control unit 21 has a CPU 211 , a RAM 212 and a ROM 213 .

CPU211は、ROM213や記憶装置22等に格納されている動作プログラムに従って動作することにより、画像形成装置2の全体を統括的に制御し、印刷機能等を実行させるものである。さらにこの実施形態では、CPU211は、演算対象の複数の文字と、これら複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを入力データとして受け付けるとともに、受け付けた入力データを画像解析して文字や計算式を抽出することにより、入力データを、抽出された文字や計算式を用いた編集可能なデータへ変換する等の処理を実行するが、詳細な説明は後述する。 The CPU 211 comprehensively controls the entire image forming apparatus 2 by operating according to the operation programs stored in the ROM 213, the storage device 22, etc., and executes the printing function and the like. Furthermore, in this embodiment, the CPU 211 accepts as input data image data including a plurality of characters to be operated on and characters indicating the operation result when the plurality of characters are operated by a predetermined formula. By analyzing the image of the input data and extracting characters and calculation formulas, the input data is converted into editable data using the extracted characters and calculation formulas. will be described later.

RAM212は、CPU211が動作プログラムに従って動作する際の作業領域となるメモリであり、ROM213は、CPU211の動作プログラム等を格納するメモリである。 A RAM 212 is a memory that serves as a work area when the CPU 211 operates according to an operation program, and a ROM 213 is a memory that stores an operation program of the CPU 211 and the like.

記憶装置22は例えばハードディスク装置(HDD)等からなり、各種のアプリケーションやその他のデータを記憶する。 The storage device 22 is, for example, a hard disk device (HDD) or the like, and stores various applications and other data.

操作パネル23はユーザーによる画像形成装置2の操作やユーザーへのメッセージの通知等に使用されるものであり、タッチパネルを備えた表示部やスタートキー、ストップキー等を備えている。 The operation panel 23 is used by the user to operate the image forming apparatus 2 and to notify the user of messages, and has a display section with a touch panel, a start key, a stop key, and the like.

画像入力部24はスキャナ装置を備え、原稿の画像を読み取って画像データに変換するものであり、画像印刷部25は、画像入力部24で得られた画像データや、外部装置3から送信されるプリントデータを用紙に印刷するものである。 The image input unit 24 has a scanner device, and reads an image of a document and converts it into image data. It prints print data on paper.

入力インターフェース26は外部装置3から送信されるプリントデータやその他のデータを受信する受信手段として機能し、出力インターフェース27はデータ処理装置1から外部装置3へ各種のデータを送信する送信手段として機能する。 The input interface 26 functions as receiving means for receiving print data and other data transmitted from the external device 3 , and the output interface 27 functions as transmitting means for transmitting various data from the data processing device 1 to the external device 3 . .

なお外部装置3は情報処理装置1や画像形成装置3以外の他の情報処理装置や他の画像形成装置等である。 Note that the external device 3 is an information processing device other than the information processing device 1 and the image forming device 3, another image forming device, or the like.

図3は、情報処理装置1のCPU111及び画像形成装置2のCPU211によって実現される、画像データから文字や計算式を抽出して編集可能なデータへ変換する機能の構成を示すブロック図である。 FIG. 3 is a block diagram showing a configuration of functions implemented by the CPU 111 of the information processing apparatus 1 and the CPU 211 of the image forming apparatus 2 to extract characters and calculation formulas from image data and convert them into editable data.

CPU111及びCPU211は、機能的に、画像処理部41と、項目部/数値部分離部42と、演算候補セル特定部43と、演算対象グループ抽出部44と、変換結果加工部45を備えている。 The CPU 111 and CPU 211 functionally include an image processing unit 41 , an item part/numerical part separation unit 42 , a calculation candidate cell identification unit 43 , a calculation target group extraction unit 44 , and a conversion result processing unit 45 . .

画像処理部41は、入力データとして受け付けた表形式等の画像データD1を画像処理し、罫線、文字等のオブジェクトを分離すると共に、OCR処理等により文字を抽出し、表データD2とする。項目部/数値部分離部42は、抽出された文字等を基に例えば「合計」「平均」「田中」「1Q」「2Q」といった表の項目部分と、「4」「2」といった数値部分を分離する。 The image processing unit 41 performs image processing on image data D1 in tabular format or the like received as input data, separates objects such as ruled lines and characters, and extracts characters by OCR processing or the like to generate tabular data D2. The item part/numerical part separation part 42 separates table item parts such as "total", "average", "Tanaka", "1Q", and "2Q" and numerical parts such as "4" and "2" based on the extracted characters. separate.

なお、入力データとしての画像データは、外部装置3から情報処理装置1や画像形成装置2に入力されても良いし、画像形成装置2の画像入力部24で画像を読み取ることにより取得されても良い。 Image data as input data may be input from the external device 3 to the information processing device 1 or the image forming device 2, or may be acquired by reading an image with the image input unit 24 of the image forming device 2. good.

演算候補セル特定部43は、項目部分に記載された「合計」「平均」等の文字列から、計算式を抽出特定すると共に、文字列が指し示す被演算領域つまり数値が演算されるセル(マス目)と、演算結果領域つまり演算結果が記載されるセルを特定する。演算対象グループ抽出部44は、各行(横方向)及び各列(縦方向)の複数のセルのうち演算対象グループを構成するセルを抽出する。 The calculation candidate cell specifying unit 43 extracts and specifies a calculation formula from character strings such as “total” and “average” written in the item part, and also identifies the area to be operated indicated by the character string, that is, the cell (mass cell) where the numerical value is calculated. ) and the calculation result area, that is, the cell in which the calculation result is written. The calculation target group extracting unit 44 extracts cells constituting a calculation target group from among a plurality of cells in each row (horizontal direction) and each column (vertical direction).

変換結果加工部45は、抽出した項目や数値を各セルに記述し、演算結果を示すセルに抽出した計算式を埋め込んで、編集可能な表計算形式のデータに変換するとともに、演算対象グループのセルに記述した数値を計算式に従って演算する。そして、演算結果と、元の画像データから抽出された演算結果を示す文字(数値)とを比較することで、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定し、少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正して、容易に再編集可能な表データD3とする。以下に具体例を説明する。
[第1の実施形態]
この例では数字の「8」と「3」が誤変換される場合を示す。
The conversion result processing unit 45 writes the extracted items and numerical values in each cell, embeds the extracted calculation formula in the cell indicating the calculation result, converts the data into editable spreadsheet format data, and converts the data into editable spreadsheet format data. Calculates the numerical value written in the cell according to the formula. Then, by comparing the operation result with the character (numerical value) indicating the operation result extracted from the original image data, at least one of the extracted characters to be operated, the calculation formula, and the character indicating the operation result. is erroneously converted, and if it is determined that at least one of them is erroneously converted, it is corrected to an appropriate character or calculation formula, and table data D3 which can be easily re-edited is obtained. Specific examples are described below.
[First Embodiment]
This example shows the case where the numbers "8" and "3" are erroneously converted.

図4左側の図は元の手書きによる表計算形式の画像であり、田中さんについて1Q、2Q、3Q、4Qに対応する各数値が4、2、4、8となっており、4Qの下のセルの文字列が「合計」となっている。従って、被演算領域のセルの各数値を合計した「18」が、演算結果領域のセルに記載されている。 The figure on the left side of FIG. 4 is an image of the original handwritten spreadsheet format, and for Mr. Tanaka, the numerical values corresponding to 1Q, 2Q, 3Q, and 4Q are 4, 2, 4, and 8. The text in the cell is "Total". Therefore, "18", which is the sum of the numerical values of the cells in the operation area, is written in the cell in the operation result area.

図4左側の図に示す画像を画像データとして入力し、文字認識処理を含む画像解析処理により文字、計算式を抽出し、表計算形式のデータに変換した状態を同図の右側の図に示す。A列2~5行の各セルA2~A5に、抽出されたそれぞれ1Q、2Q、3Q、4Qの文字が記載され、A列6行のセルA6に、抽出された「合計」の文字が記載され、B列1行のセルB1に抽出された「田中」の文字が記載され、B列2~5行の各セルB2~B5に、抽出された4、2、4、3の各文字が記載されている。文字列「合計」と各数値等との記載から、被演算領域はB列2~5行のセルB2~B5であり、抽出された計算式が埋め込まれる演算結果を示す領域(演算結果領域)はB列6行のセルB6となる。 The image shown on the left side of FIG. 4 is input as image data, characters and calculation formulas are extracted by image analysis processing including character recognition processing, and the state converted into spreadsheet data is shown on the right side of the same drawing. . The extracted characters 1Q, 2Q, 3Q, and 4Q are described in cells A2 to A5 of columns 2 to 5, respectively, and the extracted characters of "total" are described in cell A6 of column A, row 6. The extracted character "Tanaka" is written in cell B1 of column B, row 1, and the extracted characters 4, 2, 4, and 3 are written in cells B2 to B5 of column B, rows 2 to 5. Have been described. From the description of the character string "total" and each numerical value, etc., the area to be operated is cells B2 to B5 in columns 2 to 5 of B, and an area indicating the operation result in which the extracted formula is embedded (operation result area) becomes cell B6 in column B, row 6.

また、計算式としては、被演算領域であるセルB2~B5の数値を加算する"=sum(B2:B5)"となる。 Also, the calculation formula is "=sum(B2:B5)", which adds the numerical values of cells B2 to B5, which are areas to be operated on.

また、図4の左右の図の比較から理解されるように、元の画像データにおける4Qの数値「8」がセルB5において「3」と誤変換されている。その結果、計算式による合計値は4+2+4+3=13となり、画像解析処理により抽出された元の画像データの合計値18とは相違する。 Further, as can be understood from a comparison of the left and right diagrams in FIG. 4, the numerical value "8" of 4Q in the original image data is erroneously converted to "3" in cell B5. As a result, the total value obtained by the calculation formula is 4+2+4+3=13, which is different from the total value 18 of the original image data extracted by the image analysis processing.

そこで、図3に示した変換結果加工部45は、誤変換があると判定し、文字認識処理を実行するアプリケーションが有する文字認識率である各数値の変換精度を再確認し、次に可能性の高い数値を用いて再計算を行う。 Therefore, the conversion result processing unit 45 shown in FIG. 3 determines that there is an erroneous conversion, reconfirms the conversion accuracy of each numerical value, which is the character recognition rate of the application that executes the character recognition processing, and then determines the possibility. Recalculate using a higher number of

各数値の変換精度の一例を図5の表に示す。同図に示すように、4、2、4、3、18の各数値が第1候補として高い変換精度を示しており、これらの数値がまず抽出されるが、上述したように誤変換がある場合は、第2候補の中から最も可能性の高いもの、換言すれば最も文字認識率の高い数値を選択する。図5の例ではハッチングを付した89%の「8」が該当し、最初に抽出されセルB5に記載された数値「3」を「8」に修正し、演算結果領域のセルB6に埋め込まれた計算式により再計算する。 An example of the conversion accuracy of each numerical value is shown in the table of FIG. As shown in the figure, each numerical value of 4, 2, 4, 3, and 18 indicates high conversion accuracy as the first candidate, and these numerical values are extracted first, but there are conversion errors as described above. If so, the one with the highest possibility, in other words, the numerical value with the highest character recognition rate is selected from the second candidates. In the example of FIG. 5, the hatched 89% "8" corresponds, and the number "3" first extracted and written in cell B5 is corrected to "8" and embedded in cell B6 in the calculation result area. Recalculate using the formula.

再計算の結果、図6に示すように、計算式"=sum(B2:B5)"により数式変換した値は18となり、元の画像の文字列から変換された数値18と一致する。このため、セルB5の数値を修正値「8」に確定する。 As a result of the recalculation, as shown in FIG. 6, the value converted by the formula "=sum(B2:B5)" is 18, which matches the numerical value 18 converted from the character string of the original image. Therefore, the numerical value of cell B5 is determined as the modified value "8".

このように、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに誤変換が発生しても、誤変換された文字や計算式が自動的に修正されるから、ユーザーが誤変換された文字や計算式を手作業で修正する必要はなくなり、修正の手間を省くことができる。
[第2の実施形態]
この実施形態は、計算式が「合計」ではなく「平均」を求める式であるために、除算による端数処理が計算式に含まれる場合を示している。
In this way, even if an erroneous conversion occurs when extracting these characters and calculation formulas from the original image data and converting them into editable data, the erroneously converted characters and calculation formulas Since calculation formulas are automatically corrected, the user does not need to manually correct erroneously converted characters or calculation formulas, saving time and effort.
[Second embodiment]
This embodiment shows a case where the calculation formula includes rounding by division because the calculation formula is a formula for obtaining an "average" rather than a "sum".

図7の左側の図は元の手書きによる表計算形式の画像であり、田中さんについて1Q、2Q、3Q、4Qに対応する数値が4、2、4、8となっており、4Qの下のセルの文字列が「平均」となっている。また、被演算領域のセルの各数値を平均して端数を切り捨てた「4」が、演算結果領域のセルに記載されている。 The figure on the left side of FIG. 7 is an image of the original handwritten spreadsheet format, and the numerical values corresponding to Mr. Tanaka's 1Q, 2Q, 3Q, and 4Q are 4, 2, 4, and 8. The text in the cell is "Average". Also, "4" obtained by averaging the numerical values of the cells in the calculation area and rounding off the fractions is written in the cell in the calculation result area.

図7の左側の図に示す画像を画像データとして入力し、文字認識処理を含む画像解析処理して文字、計算式を抽出し、表計算形式のデータに変換した状態を同図右側の図に示す。A列2~5行の各セルA2~A5に、抽出されたそれぞれ1Q、2Q、3Q、4Qの文字が記載され、A列6行のセルA6に、抽出された「平均」の文字が記載され、B列1行のセルB1に抽出された「田中」の文字が記載され、B列2~5行の各セルB2~B5に、抽出された4、2、4、8の各文字が記載されている。文字列「平均」と各数値等との記載から、被演算領域はB列2~5行のセルB2~B5であり、抽出された計算式が埋め込まれる演算結果領域はB列6行のセルB6となる。 The image shown on the left side of FIG. 7 is input as image data, and the image analysis processing including character recognition processing is performed to extract characters and calculation formulas. show. The extracted characters 1Q, 2Q, 3Q, and 4Q are described in each cell A2 to A5 of columns 2 to 5 of column A, and the extracted characters of "average" are described in cell A6 of column A, row 6. The extracted character "Tanaka" is written in cell B1 of column B, row 1, and the extracted characters 4, 2, 4, and 8 are written in cells B2 to B5 of column B, rows 2 to 5. Have been described. From the description of the character string "average" and each numerical value, etc., the area to be operated is cells B2 to B5 in columns 2 to 5 of B, and the calculation result area in which the extracted formula is embedded is the cell in row 6 of column B. becomes B6.

また、計算式としては、被演算領域であるセルB2~B5の数値の平均値を求める"=AVERAGE(Bsum(B2:B5)"であり、この計算式に従って演算した結果は4.5であるが、切り捨てかまたは切り上げかを確認するために四捨五入すると、図7の右側の図に示すように5となる。 The calculation formula is "=AVERAGE(Bsum(B2:B5)" for obtaining the average value of the numerical values of the cells B2 to B5, which are the areas to be calculated, and the result of calculation according to this formula is 4.5. is rounded to determine whether it is rounding down or rounding up, it becomes 5 as shown in the right-hand diagram of FIG.

一方、画像解析処理により抽出され変換された元の画像データの平均値は4であり、両者が相違する。 On the other hand, the average value of the original image data extracted and converted by the image analysis process is 4, and both are different.

そこで、図3に示した変換結果加工部45は、計算式の端数処理に誤変換があると判定し、計算式における端数処理は四捨五入や切り上げではなく切り捨てと判断し、計算式に反映する。 Therefore, the conversion result processing unit 45 shown in FIG. 3 determines that there is an erroneous conversion in the rounding of the calculation formula, determines that the rounding in the calculation formula is rounding down rather than rounding up or rounding up, and reflects it in the calculation formula.

このように、計算式が端数処理を含む場合、切り捨てかまたは切り上げかの確認を行った後に端数処理が決定され計算式が修正されるから、適正な端数処理を有する計算式に修正できる。
[第3の実施形態]
この実施形態は、変換対象の数値のうち、一部が変換不能な記載状態であっても、他の数値及び表の記載内容から逆算して、変換する場合を示している。
In this way, when the calculation formula includes rounding, rounding down or rounding up is confirmed, and then the calculation formula is corrected by determining the rounding.
[Third Embodiment]
This embodiment shows a case in which even if some of the numeric values to be converted cannot be converted, they are converted by calculating backward from the other numeric values and the content of the table.

図8の左側の図は元の手書きによる表計算形式の画像であり、田中さんについて1Q、3Q、4Qに対応する各数値が4、4、8となっており、4Qの下のセルの文字列が「合計」となっているが、2Qに対応する数値は不明である。 The figure on the left side of FIG. 8 is an image of the original handwritten spreadsheet format, and for Mr. Tanaka, the numerical values corresponding to 1Q, 3Q, and 4Q are 4, 4, and 8, and the characters in the cell below 4Q are Although the column is "Total", the numerical value corresponding to 2Q is unknown.

また、被演算領域のセルの各数値を合計した「18」が、演算結果領域のセルに記載されている。 In addition, "18", which is the sum of the numerical values of the cells in the calculation area, is written in the cell in the calculation result area.

図8の左側の図に示す画像を画像データとして入力し、文字認識処理を含む画像解析処理して文字、計算式を抽出し、表計算形式のデータに変換した状態を同図右側の図に示す。A列2~5行の各セルA2~A5に、抽出されたそれぞれ1Q、2Q、3Q、4Qの文字が記載され、A列6行のセルA6に、抽出された「合計」の文字が記載され、B列1行のセルB1に抽出された「田中」の文字が記載され、B列2、4、5行の各セルB2、B4、B5に、抽出された4、4、8の各文字が記載される。ただし、B列3行のセルB3については、読み取れず変換不能となる。文字列「合計」と各数値等との記載から、被演算領域はセルB2~B5であり、抽出された計算式が埋め込まれる演算結果領域はB列6行のセルB6となる。 The image shown on the left side of FIG. 8 is input as image data, and the image analysis processing including character recognition processing is performed to extract characters and calculation formulas. show. The extracted characters 1Q, 2Q, 3Q, and 4Q are described in cells A2 to A5 of columns 2 to 5, respectively, and the extracted characters of "total" are described in cell A6 of column A, row 6. , and the extracted character "Tanaka" is written in cell B1 of column B, row 1, and the extracted characters 4, 4, and 8 are written in cells B2, B4, and B5 of columns B, 2, 4, and 5, respectively. characters are written. However, cell B3 in column B, row 3 cannot be read and cannot be converted. From the description of the character string "total" and each numerical value, the operation area is cells B2 to B5, and the operation result area in which the extracted formula is embedded is cell B6 in column B, row 6.

また、計算式としては、被演算領域であるセルB2~B5の数値を加算する"=sum(B2:B5)"となるが、B列3行のセルB3の数値が不明であるから計算式による演算を行うことができない。 The formula is "=sum(B2:B5)", which adds the values of cells B2 to B5, which are the areas to be operated on. cannot perform operations with

そこで、図3に示した変換結果加工部45は、誤変換があると判定し、元の画像データから抽出された演算対象の各数値文字4、4、8と演算結果を示す数値18を用いて逆算する。つまり、演算結果を示す数値18から他の数値を減算し(18-4-4-8=2)、数値2を求める。 Therefore, the conversion result processing unit 45 shown in FIG. 3 determines that there is an erroneous conversion, and uses numerical characters 4, 4, and 8 to be calculated extracted from the original image data and a numerical value 18 indicating the calculation result. to calculate backwards. That is, another numerical value is subtracted from the numerical value 18 indicating the calculation result (18-4-4-8=2) to obtain the numerical value 2.

そして、変換結果加工部45はB列3行のセルB3の数値として2を当てはめ、計算式により再計算する。再計算の結果、図8に示すように、計算式"=sum(B2:B5)"により数式変換した値は18となり、元の画像の数値18と一致する。 Then, the conversion result processing unit 45 applies 2 as the numerical value of cell B3 in column B, row 3, and recalculates using the formula. As a result of the recalculation, as shown in FIG. 8, the value converted by the formula "=sum(B2:B5)" is 18, which matches the numerical value 18 of the original image.

このように、演算対象の複数の文字の一部について抽出が不可能な場合、抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、抽出不可能な一部の文字が適正な文字に修正されるから、確実に誤変換を防止することができる。
[第4の実施形態]
この実施形態は、元のデータが表形式ではなく、計算式がそのまま記載されている場合を示すものである。
In this way, when it is impossible to extract some of the multiple characters to be operated on, the non-extractable part is calculated backward from the other characters of the extracted operation target, the calculation formula, and the characters indicating the operation result. is corrected to a proper character, erroneous conversion can be reliably prevented.
[Fourth embodiment]
This embodiment shows the case where the original data is not in tabular form but the calculation formula is written as it is.

図9は元の手書きによる画像であり、「2+4+8=14」が記載されている。この画像を画像データとして入力し、文字認識処理を含む画像解析処理して文字、計算式を抽出する。具体的には、左辺に「+」「=」の演算記号に基づいて、左辺を被演算領域と判定し、右辺を演算結果領域と判定する。そして、「+」の演算記号から左辺の数値を加算する計算式を抽出する。 FIG. 9 is an original handwritten image, in which "2+4+8=14" is written. This image is input as image data, image analysis processing including character recognition processing is performed, and characters and calculation formulas are extracted. Specifically, based on the operation symbols “+” and “=” on the left side, the left side is determined as the region to be operated, and the right side is determined as the operation result region. Then, a calculation formula for adding the numerical value on the left side is extracted from the operation symbol "+".

ここで、左辺の「8」を「3」と誤変換したとすると、抽出した左辺の数値を抽出した計算式により加算すると、合計値は9となり、抽出された演算結果の数値14と相違する。 Here, if "8" on the left side is erroneously converted to "3", when the extracted numerical values on the left side are added by the extracted calculation formula, the total value becomes 9, which is different from the numerical value 14 of the extracted operation result. .

そこで、図3に示した変換結果加工部45は、誤変換があると判定し、第1の実施形態と同様に、文字認識処理を実行するアプリケーションが有する文字認識率である各数値の変換精度(図5参照)を再確認し、次に可能性の高い数値を用いて再計算を行う。 Therefore, the conversion result processing unit 45 shown in FIG. 3 determines that there is an erroneous conversion. (see FIG. 5), and then recalculate using the next most likely value.

具体的には、第2候補の中から最も可能性の高いもの、換言すれば最も文字認識率の高い数値を選択する。図5の例では「8」が該当し、最初に抽出された「3」に対応する数値「3」を「8」に修正し、抽出された計算式により再計算する。 Specifically, the one with the highest possibility, in other words, the numerical value with the highest character recognition rate is selected from the second candidates. In the example of FIG. 5, "8" corresponds, and the numerical value "3" corresponding to the first extracted "3" is corrected to "8" and recalculated by the extracted formula.

再計算の結果、計算式により数式変換した値は14となり、元の画像の文字列から変換された数値14と一致する。このため、修正値「8」を確定する。 As a result of the recalculation, the value converted by the formula becomes 14, which matches the numerical value 14 converted from the character string of the original image. Therefore, the correction value "8" is determined.

このように、この実施形態によれば、画像データの演算記号に基づいて計算式を抽出でき、演算記号で示される被演算領域及び演算結果領域に基づいて、演算対象の複数の文字と演算結果を示す文字を抽出できる。 As described above, according to this embodiment, a calculation formula can be extracted based on the operation symbol of the image data, and a plurality of characters to be operated and the operation result can be extracted based on the operation target area and the operation result area indicated by the operation symbol. You can extract characters that indicate .

図10は、図4~図6で説明した第1の実施形態におけるデータ処理装置1、2の誤変換の修正動作を示すフローチャートである。この動作は、データ処理装置1、2のCPU111、211が記憶装置12、22等に保存された動作プログラムに従って動作することにより実行される。 FIG. 10 is a flow chart showing the operation of correcting erroneous conversion of the data processors 1 and 2 in the first embodiment described with reference to FIGS. This operation is executed by the CPUs 111 and 211 of the data processors 1 and 2 operating according to operation programs stored in the storage devices 12 and 22 or the like.

ステップS01で画像データの入力を受け付けたのち、ステップS02で画像解析処理を実行し、ステップS03で「合計」「平均」「+」「=」等の文字(キーワード)を抽出したかどうかを判断する。抽出しなければ(ステップS03でNO)、変換できないので処理を終了する。抽出した場合(ステップS03でYES)、ステップS04に進む。 After receiving input of image data in step S01, image analysis processing is executed in step S02, and it is determined whether or not characters (keywords) such as "total", "average", "+" and "=" are extracted in step S03. do. If not extracted (NO in step S03), conversion is not possible and the process ends. If extracted (YES in step S03), the process proceeds to step S04.

ステップS04では、キーワードの対象となる被演算領域と演算結果を示す演算結果領域を抽出したのち、ステップS05で、演算結果領域を表計算式に変換する。つまり計算式を抽出し、演算結果領域に埋め込む。 In step S04, after extracting a region to be operated as a target of the keyword and a calculation result region indicating the calculation result, in step S05, the calculation result region is converted into a spreadsheet. That is, the calculation formula is extracted and embedded in the calculation result area.

次いでステップS06で変数nを0にセットし、Tに被演算個数+1をセットする。例えば被演算個数が4個の場合、T=5にセットする。 Next, in step S06, the variable n is set to 0, and T is set to the number of operands+1. For example, if the number of operands is 4, set T=5.

次に、ステップS07で、計算式による演算結果と、元の画像データの演算結果領域に記載されていた文字列の変換結果を比較する。同一であれば(ステップS07で「=」)、全て適正に変換されたので、処理を終了する。同一でなければ(ステップS07で「≠」)、ステップS08でn=Tかどうかを判断する。 Next, in step S07, the calculation result of the calculation formula is compared with the conversion result of the character string described in the calculation result area of the original image data. If they are the same (“=” in step S07), then the process is finished since all the values have been properly converted. If not the same (“≠” in step S07), it is determined whether n=T in step S08.

n=Tでなければ(ステップS08でNO)、ステップS09で、図5に示す変換精度の一覧の中から、第2候補中のn番目に変換精度の高いものを取得して一時差し替えたのち、ステップS10で、差し替えた数値を用いて計算式により再計算を行い、ステップS11に進む。再計算の結果は、ユーザーが容易に確認できるように、変換結果を示すシートとは別のシートに記録されるのが良い。また、修正後の数字を識別できる態様で再計算の結果が記録されるのが望ましい。 If n=T (NO in step S08), in step S09, the second candidate with the n-th highest conversion accuracy is obtained from the list of conversion accuracies shown in FIG. , in step S10, recalculation is performed by the formula using the replaced numerical value, and the process proceeds to step S11. The recalculation results are preferably recorded on a sheet separate from the sheet showing the conversion results so that the user can easily check them. It is also desirable that the results of the recalculation be recorded in a manner that allows identification of the revised figures.

ステップS11ではnをn+1にセットしたのち、ステップS07に戻る。 In step S11, after setting n to n+1, the process returns to step S07.

ステップS07では、再度、計算式による演算結果と文字列の変換結果を比較する。このような処理をステップS08でn=Tと判断されるまで行う。ステップS08でn=Tと判断されると(ステップS08でYES)、適正な変換ができないので、ステップS12で、警告画面を表示することによりユーザーに通知する。 In step S07, the calculation result of the calculation formula and the conversion result of the character string are compared again. Such processing is repeated until it is determined that n=T in step S08. If n=T is determined in step S08 (YES in step S08), proper conversion cannot be performed, so in step S12 the user is notified by displaying a warning screen.

1 情報処理装置(データ処理装置)
2 画像形成装置(データ処理装置)
3 外部装置
11、21 制御部
111、211 CPU
41 画像処理部
42 項目部/数値部分離部
43 演算候補セル特定部
44 演算対象グループ抽出部
45 変換結果加工部
1 Information processing device (data processing device)
2 Image forming device (data processing device)
3 external device 11, 21 control unit 111, 211 CPU
41 image processing unit 42 item part/numerical part separation unit 43 calculation candidate cell identification unit 44 calculation target group extraction unit 45 conversion result processing unit

Claims (11)

演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、
前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、
前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、
前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、
前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、
を備え
前記抽出手段による前記文字の抽出は文字認識処理により行われ、前記抽出手段は、文字認識率の最も高い文字を抽出し、
前記判定手段により、抽出された演算対象の文字が誤変換されていると判定された場合、前記修正手段は、誤変換されている文字を次に文字認識率の高い文字に修正し、
前記判定手段は、前記文字の修正後に前記計算式による再計算を行うことにより、修正された文字について再度誤変換されているか否かを判定することを特徴とするデータ変換装置。
receiving means for receiving, as input data, image data including a plurality of characters to be calculated and characters indicating a calculation result when the plurality of characters are calculated by a predetermined formula;
extracting means for extracting the plurality of characters to be calculated, the calculation formula, and characters indicating the calculation result from the input data received by the receiving means;
conversion means for converting the input data into editable data using characters representing a plurality of characters to be operated, calculation formulas, and calculation results extracted by the extraction means;
A plurality of characters to be operated extracted by the extracting means are compared with the operation result when the extracted calculation formula is operated, and the character indicating the extracted operation result is compared to obtain the extracted operation target. Determination means for determining whether or not at least one of the characters, the calculation formula, and the characters indicating the calculation result has been erroneously converted;
Correction means for correcting to a proper character or calculation formula when the determination means determines that at least one of them has been erroneously converted;
with
The extraction of the characters by the extraction means is performed by character recognition processing, and the extraction means extracts characters with the highest character recognition rate,
When the determination means determines that the extracted character to be operated has been erroneously converted, the correction means corrects the erroneously converted character to a character with the next highest character recognition rate,
The data conversion device , wherein the determination means determines whether or not the corrected character is erroneously converted again by performing recalculation according to the calculation formula after the correction of the character .
演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、receiving means for receiving, as input data, image data including a plurality of characters to be calculated and characters indicating a calculation result when the plurality of characters are calculated by a predetermined formula;
前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、extracting means for extracting the plurality of characters to be calculated, the calculation formula, and characters indicating the calculation result from the input data received by the receiving means;
前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、conversion means for converting the input data into editable data using characters representing a plurality of characters to be operated, calculation formulas, and calculation results extracted by the extraction means;
前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、A plurality of characters to be operated extracted by the extracting means are compared with the operation result when the extracted calculation formula is operated, and the character indicating the extracted operation result is compared to obtain the extracted operation target. Determination means for determining whether or not at least one of the characters, the calculation formula, and the characters indicating the calculation result has been erroneously converted;
前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、Correction means for correcting to a proper character or calculation formula when the determination means determines that at least one of them has been erroneously converted;
を備え、with
前記抽出手段により抽出された計算式が端数処理を含む場合、前記判定手段は、端数処理が切り捨てか切り上げかを判定し、When the calculation formula extracted by the extraction means includes rounding, the determination means determines whether the rounding is rounding down or rounding up,
前記修正手段は、端数処理が切り捨てか切り上げかの判定結果に基づいて前記計算式の端数処理を決定することにより、計算式を修正することを特徴とするデータ変換装置。The data conversion device, wherein the correction means corrects the calculation formula by determining rounding of the calculation formula based on a determination result as to whether the rounding is rounding down or rounding up.
演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、receiving means for receiving, as input data, image data including a plurality of characters to be calculated and characters indicating a calculation result when the plurality of characters are calculated by a predetermined formula;
前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、extracting means for extracting the plurality of characters to be calculated, the calculation formula, and characters indicating the calculation result from the input data received by the receiving means;
前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、conversion means for converting the input data into editable data using characters representing a plurality of characters to be operated, calculation formulas, and calculation results extracted by the extraction means;
前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、A plurality of characters to be operated extracted by the extracting means are compared with the operation result when the extracted calculation formula is operated, and the character indicating the extracted operation result is compared to obtain the extracted operation target. Determination means for determining whether or not at least one of the characters, the calculation formula, and the characters indicating the calculation result has been erroneously converted;
前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、Correction means for correcting to a proper character or calculation formula when the determination means determines that at least one of them has been erroneously converted;
を備え、with
演算対象の複数の文字の一部についての前記抽出手段による抽出が不可能な場合、前記修正手段は、前記抽出手段により抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、前記一部の文字を適正な文字に修正することを特徴とするデータ変換装置。When extraction by the extracting means is impossible for some of the plurality of characters to be operated, the correction means extracts from the other characters to be operated, calculation formulas, and characters indicating the operation result extracted by the extraction means 1. A data conversion device for correcting said part of characters to proper characters by calculating backward.
前記入力データは計算式を示す文字列を有する表計算形式の画像データであり、
前記抽出手段は、前記入力データにおける前記文字列に基づいて前記計算式を抽出するとともに、前記演算対象の複数の文字と演算結果を示す文字を抽出し、
前記変換手段は、抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた表計算型データに変換する請求項1~3の何れかに記載のデータ変換装置。
The input data is image data in a spreadsheet format having a character string indicating a calculation formula,
The extraction means extracts the calculation formula based on the character string in the input data, and extracts the plurality of characters to be operated and characters indicating the operation result,
4. The data conversion device according to any one of claims 1 to 3, wherein said conversion means converts data into spreadsheet data using a plurality of extracted characters to be operated, calculation formulas, and characters indicating calculation results.
前記入力データは演算記号を有する画像データであり、
前記抽出手段は、前記演算記号に基づいて前記計算式を抽出し、演算記号で示される被演算領域及び演算結果領域に基づいて、前記演算対象の複数の文字と演算結果を示す文字を抽出する請求項1~3の何れかに記載のデータ変換装置。
The input data is image data having operation symbols,
The extracting means extracts the calculation formula based on the operation symbol, and extracts the plurality of characters to be operated and characters indicating the operation result based on the operation target area and the operation result area indicated by the operation symbol. The data conversion device according to any one of claims 1 to 3 .
再計算の結果は別シートに記録される請求項に記載のデータ変換装置。 2. The data conversion device according to claim 1 , wherein the recalculation result is recorded on a separate sheet. 修正後の文字を識別できる態様で再計算の結果が別シートに記録される請求項に記載のデータ変換装置。 7. The data conversion apparatus according to claim 6 , wherein the recalculation result is recorded on a separate sheet in a manner that allows identification of the characters after correction. 請求項1~の何れかに記載のデータ変換装置を備えた画像処理装置。 An image processing device comprising the data conversion device according to any one of claims 1 to 7 . 演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、
前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、
前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、
前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、
前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、
をデータ変換装置のコンピュータに実行させ、
前記抽出ステップによる前記文字の抽出は文字認識処理により行われ、前記抽出ステップでは、文字認識率の最も高い文字を抽出し、
前記判定ステップにより、抽出された演算対象の文字が誤変換されていると判定された場合、前記修正ステップでは、誤変換されている文字を次に文字認識率の高い文字に修正し、
前記判定ステップでは、前記文字の修正後に前記計算式による再計算を行うことにより、修正された文字について再度誤変換されているか否かを判定する処理を前記コンピュータに実行させるためのプログラム。
a receiving step of receiving, as input data, image data including a plurality of characters to be calculated and characters indicating a calculation result when the plurality of characters are calculated by a predetermined formula;
an extracting step of extracting the plurality of characters to be calculated, the calculation formula, and characters indicating the calculation result from the input data received by the receiving step;
a conversion step of converting the input data into editable data using a plurality of characters extracted by the extraction step, a calculation formula, and characters indicating a calculation result;
By comparing the operation result when a plurality of characters of the operation object extracted in the extraction step are operated by the extracted calculation formula and the character indicating the extracted operation result, the extracted operation object a determination step of determining whether or not at least one of characters indicating each character, calculation formula, and calculation result has been erroneously converted;
a correction step of correcting to a proper character or calculation formula when it is determined that at least one of them is erroneously converted by the determination step;
is executed by the computer of the data conversion device,
The extraction of the characters by the extraction step is performed by character recognition processing, and in the extraction step, the character with the highest character recognition rate is extracted,
If the determination step determines that the extracted character to be operated on has been erroneously converted, the correction step corrects the erroneously converted character to a character with the next highest character recognition rate,
A program for causing the computer to execute, in the determination step, a process of determining whether or not the corrected character is erroneously converted again by performing recalculation according to the calculation formula after the correction of the character.
演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、a receiving step of receiving, as input data, image data including a plurality of characters to be calculated and characters indicating a calculation result when the plurality of characters are calculated by a predetermined formula;
前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、an extracting step of extracting the plurality of characters to be calculated, the calculation formula, and characters indicating the calculation result from the input data received by the receiving step;
前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、a conversion step of converting the input data into editable data using a plurality of characters extracted by the extraction step, a calculation formula, and characters indicating a calculation result;
前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、By comparing the operation result when a plurality of characters of the operation object extracted in the extraction step are operated by the extracted calculation formula and the character indicating the extracted operation result, the extracted operation object a determination step of determining whether or not at least one of characters indicating each character, calculation formula, and calculation result has been erroneously converted;
前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、a correction step of correcting to a proper character or calculation formula when it is determined that at least one of them is erroneously converted by the determination step;
をデータ変換装置のコンピュータに実行させ、is executed by the computer of the data conversion device,
前記抽出ステップにより抽出された計算式が端数処理を含む場合、前記判定ステップでは、端数処理が切り捨てか切り上げかを判定し、If the calculation formula extracted by the extraction step includes rounding, the determining step determines whether the rounding is rounding down or rounding up,
前記修正ステップでは、端数処理が切り捨てか切り上げかの判定結果に基づいて前記計算式の端数処理を決定することにより、計算式を修正する処理を前記コンピュータに実行させるためのプログラム。A program for causing the computer to execute a process of correcting a calculation formula in the correction step, by determining rounding of the calculation formula based on a determination result as to whether the rounding is rounding down or rounding up.
演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、a receiving step of receiving, as input data, image data including a plurality of characters to be calculated and characters indicating a calculation result when the plurality of characters are calculated by a predetermined formula;
前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、an extracting step of extracting the plurality of characters to be calculated, the calculation formula, and characters indicating the calculation result from the input data received by the receiving step;
前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、a conversion step of converting the input data into editable data using a plurality of characters extracted by the extraction step, a calculation formula, and characters indicating a calculation result;
前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、By comparing the operation result when a plurality of characters of the operation object extracted in the extraction step are operated by the extracted calculation formula and the character indicating the extracted operation result, the extracted operation object a determination step of determining whether or not at least one of characters indicating each character, calculation formula, and calculation result has been erroneously converted;
前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、a correction step of correcting to a proper character or calculation formula when it is determined that at least one of them is erroneously converted by the determination step;
をデータ変換装置のコンピュータに実行させ、is executed by the computer of the data conversion device,
演算対象の複数の文字の一部についての前記抽出ステップによる抽出が不可能な場合、前記修正ステップでは、前記抽出ステップにより抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、前記一部の文字を適正な文字に修正する処理を前記コンピュータに実行させるためのプログラム。When extraction by the extraction step is impossible for some of the plurality of characters to be operated, in the correction step, from the other characters to be operated extracted by the extraction step, the calculation formula, and the characters indicating the operation result A program for causing the computer to execute a process of calculating back and correcting the part of the characters into proper characters.
JP2018096815A 2018-05-21 2018-05-21 Data conversion device, image processing device and program Active JP7110723B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018096815A JP7110723B2 (en) 2018-05-21 2018-05-21 Data conversion device, image processing device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018096815A JP7110723B2 (en) 2018-05-21 2018-05-21 Data conversion device, image processing device and program

Publications (2)

Publication Number Publication Date
JP2019204146A JP2019204146A (en) 2019-11-28
JP7110723B2 true JP7110723B2 (en) 2022-08-02

Family

ID=68726916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018096815A Active JP7110723B2 (en) 2018-05-21 2018-05-21 Data conversion device, image processing device and program

Country Status (1)

Country Link
JP (1) JP7110723B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172784A (en) 1998-12-03 2000-06-23 Ricoh Co Ltd Character recognizing method
JP2001325562A (en) 2000-05-17 2001-11-22 Minolta Co Ltd Image recognizing device, image forming device, image recognizing method, and computer-readable recording medium with image reocgnizing program stored therein
JP2016200900A (en) 2015-04-08 2016-12-01 シャープ株式会社 Image reader, image read method and computer program
JP2017187931A (en) 2016-04-06 2017-10-12 コニカミノルタ株式会社 Table data conversion method, program, and image reading device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177334A (en) * 1996-12-18 1998-06-30 Brother Ind Ltd Calculation learning machine

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172784A (en) 1998-12-03 2000-06-23 Ricoh Co Ltd Character recognizing method
JP2001325562A (en) 2000-05-17 2001-11-22 Minolta Co Ltd Image recognizing device, image forming device, image recognizing method, and computer-readable recording medium with image reocgnizing program stored therein
JP2016200900A (en) 2015-04-08 2016-12-01 シャープ株式会社 Image reader, image read method and computer program
JP2017187931A (en) 2016-04-06 2017-10-12 コニカミノルタ株式会社 Table data conversion method, program, and image reading device

Also Published As

Publication number Publication date
JP2019204146A (en) 2019-11-28

Similar Documents

Publication Publication Date Title
US9042653B2 (en) Associating captured image data with a spreadsheet
US9286526B1 (en) Cohort-based learning from user edits
CN111079412A (en) Text error correction method and device
US10963717B1 (en) Auto-correction of pattern defined strings
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
TWI567569B (en) Natural language processing systems, natural language processing methods, and natural language processing programs
KR20170004983A (en) Line segmentation method
US8208685B2 (en) Word recognition method and word recognition program
JP6680052B2 (en) Table data conversion method, program, image reading device
JP7110723B2 (en) Data conversion device, image processing device and program
US20210019554A1 (en) Information processing device and information processing method
JP2020087112A (en) Document processing apparatus and document processing method
JP7315420B2 (en) How to adapt and modify text
US10970483B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20210303782A1 (en) Information processing apparatus and non-transitory computer readable medium
JP5724286B2 (en) Form creation device, form creation method, program
CN113408536A (en) Bill amount identification method and device, computer equipment and storage medium
JP2022095391A (en) Information processing apparatus and information processing program
JP6682827B2 (en) Information processing apparatus and information processing program
JP7421384B2 (en) Information processing device, correction candidate display method, and program
JP2013105344A (en) Business form processing system and business form processing method
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US20230099764A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP7463675B2 (en) Information processing device and information processing program
JP6973433B2 (en) Forms processing device, form processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220704

R150 Certificate of patent or registration of utility model

Ref document number: 7110723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150