WO2022024262A1 - データ処理装置、データ処理方法及びプログラム - Google Patents

データ処理装置、データ処理方法及びプログラム Download PDF

Info

Publication number
WO2022024262A1
WO2022024262A1 PCT/JP2020/029063 JP2020029063W WO2022024262A1 WO 2022024262 A1 WO2022024262 A1 WO 2022024262A1 JP 2020029063 W JP2020029063 W JP 2020029063W WO 2022024262 A1 WO2022024262 A1 WO 2022024262A1
Authority
WO
WIPO (PCT)
Prior art keywords
character string
candidate
data
character strings
character
Prior art date
Application number
PCT/JP2020/029063
Other languages
English (en)
French (fr)
Inventor
鴻鵬 葛
顕 松田
智 小俣
啓太郎 森
Original Assignee
ファーストアカウンティング株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファーストアカウンティング株式会社 filed Critical ファーストアカウンティング株式会社
Priority to JP2020541623A priority Critical patent/JP6810302B1/ja
Priority to PCT/JP2020/029063 priority patent/WO2022024262A1/ja
Priority to JP2020204810A priority patent/JP2022027399A/ja
Publication of WO2022024262A1 publication Critical patent/WO2022024262A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Definitions

  • the present invention relates to a data processing device, a data processing method and a program for processing voucher data.
  • Patent Document 1 discloses a technique for correcting a misrecognized character string based on a misrecognition pattern such as a difference between an old character and a new character of a Chinese character and a difference in an okurigana of a Chinese character.
  • the present invention has been made in view of these points, and an object thereof is to improve the accuracy of the contents of the voucher data registered in the computer that manages the voucher data.
  • the data processing device of the first aspect of the present invention is specified by the data acquisition unit for acquiring voucher data, the character string specifying unit for specifying a plurality of character strings included in the voucher data, and the character string specifying unit.
  • the data acquisition unit for acquiring voucher data
  • the character string specifying unit for specifying a plurality of character strings included in the voucher data
  • the character string specifying unit When there is a misrecognized character string that is a character string that could not be detected, one or more candidates for the misrecognized character string are based on the contents of one or more recognized character strings other than the misrecognized character string. It has a candidate determination unit for determining a candidate character string and an output unit for outputting one or more candidate character strings.
  • the candidate determination unit may determine the one or more candidate character strings based on the contents of the one or more recognition character strings contained in the same column or the same line as the erroneous recognition character string.
  • the candidate determination unit is the same column as the misrecognition character string when at least one of the one or more recognition character strings contained in the same row or the same column as the misrecognition character string indicates an item name.
  • the one or more candidate character strings indicating the item names corresponding to the contents of the one or more recognition character strings contained in the same line may be determined.
  • the candidate determination unit may determine the one or more candidate character strings based on the number of digits of the one or more recognition character strings contained in the same column or the same line as the erroneous recognition character string.
  • the candidate determination unit may determine one or more candidate character strings based on the position of the misrecognition character string in the voucher data.
  • the candidate determination unit determines that the misrecognized character string is a character string indicating an item based on the position of the misrecognized character string in the voucher data
  • the candidate determination unit selects one or more character strings corresponding to the item names. It may be determined as a candidate character string of.
  • the candidate determination unit determines that the misrecognition character string is a character string indicating an item based on the position of the misrecognition character string in the voucher data, a plurality of candidates each indicating a plurality of item names. You may create a template containing a character string.
  • the candidate determination unit may determine the one or more candidate character strings based on the numerical value indicated by the one or more recognition character strings and the consumption tax rate.
  • the data acquisition unit further has a storage unit that stores a plurality of past voucher data, which are a plurality of the voucher data acquired in the past, and a plurality of character strings included in each of the plurality of past voucher data in association with each other.
  • the candidate determination unit is a position corresponding to the position of the erroneous recognition character string in the voucher data in the similar voucher data similar to the voucher data acquired by the data acquisition unit among the plurality of past voucher data.
  • the one or more candidate character strings may be determined based on the character strings included in.
  • the character string specifying unit learns a combination of voucher data and a plurality of character strings as teacher data, and inputs the voucher data to a machine learning model that outputs the plurality of character strings corresponding to the input voucher data.
  • the plurality of character strings may be specified, and the output unit may output information indicating the reliability corresponding to the probability that the character strings are correctly specified in association with each of the plurality of character strings. good.
  • the candidate determination unit learns a combination of voucher data and a plurality of candidate character strings as teacher data, and associates the voucher data with one character string included in the input voucher data to obtain one or more candidate character strings.
  • the voucher data By inputting the voucher data into the machine learning model to be output, the one or more candidate character strings are determined, and the output unit associates each of the one or more candidate character strings with the correct character.
  • Information indicating the reliability corresponding to the probability of being a column may be output.
  • the data processing method includes a step of acquiring voucher data, a step of specifying a plurality of character strings included in the voucher data, and a character that cannot be specified, which is executed by a computer.
  • a misrecognition character string that is a column
  • one or more candidate character strings that are candidates for the misrecognition character string are determined based on the contents of one or more recognition character strings other than the misrecognition character string. It has a step and a step of outputting the one or more candidate character strings.
  • the program of the third aspect of the present invention is a step of acquiring voucher data to a computer, a step of specifying a plurality of character strings included in the voucher data, and an erroneous character string that cannot be specified.
  • a recognition character string exists, a step of determining one or more candidate character strings that are candidates for the misrecognition character string based on the contents of one or more recognition character strings other than the misrecognition character string, and the above-mentioned Execute a step to output one or more candidate strings.
  • FIG. 1 is a diagram for explaining the configuration of the data processing system S.
  • the data processing system S is a system for processing the voucher data obtained by reading the voucher image.
  • a voucher is a document that describes a transaction or transaction terms, such as a quote, purchase order, or invoice.
  • the voucher data is data including a plurality of text data corresponding to a plurality of character strings included in the voucher.
  • the case where the voucher is an invoice is illustrated, but this embodiment can be applied to a voucher other than the invoice.
  • the data processing system S includes a data processing device 1, an accounting terminal 2, and an employee terminal 3.
  • the data processing device 1, the accounting terminal 2, and the employee terminal 3 transmit and receive data via the network N.
  • the network N includes, for example, the Internet or an intranet.
  • the data processing device 1 is a computer that manages various voucher data.
  • the data processing device 1 may acquire a file containing the image data of the voucher from the accounting terminal 2 or the employee terminal 3 and create voucher data based on the character string specified in the acquired image data.
  • a file containing voucher data may be acquired from the terminal 2 or the employee terminal 3.
  • the data processing device 1 manages invoice data indicating the contents of the invoice received by the billing company.
  • the data processing device 1 stores an invoice database including the contents of invoices received by the invoiced company in the past and a plurality of past invoice data indicating the departments related to each invoice, and the accounting terminal 2
  • the contents of the stored invoice data are provided to the accounting terminal 2 in response to the request from.
  • the data processing device 1 may recognize the character string included in the voucher data and output the data registered in the database of the system for managing the voucher data (for example, the backbone system for accounting).
  • the data processing device 1 recognizes the character string included in the invoice data by using, for example, artificial intelligence, but there is a case that the character string cannot be recognized correctly. If the misrecognized character string is registered in the database, the accounting process will be hindered. Therefore, the data processing device 1 can correct the misrecognized character string before the character string is registered in the database. To. The data processing device 1 may be able to correct the erroneously recognized character string after the character string is registered in the database. In the data processing device 1, the person in charge of confirming the voucher data (accounting person in the present specification) can easily correct the character string to be the same as the character string actually written in the voucher. It is characterized by displaying the candidate of the character string with a relatively high probability described in the voucher.
  • the accounting terminal 2 is a computer used by an employee (for example, an accounting person) who uses the data processing device 1 in the billing company that received the invoice.
  • the accounting terminal 2 transmits and receives various data to and from the data processing device 1 via, for example, an intranet.
  • the accounting terminal 2 transmits, for example, the image data of the invoice read by the accounting person with a scanner to the data processing device 1. Further, the accounting terminal 2 accesses the invoice database stored in the data processing device 1 according to the instruction of the accounting person, and displays the invoice data specified by the accounting person. The accounting terminal 2 displays, for example, a department name or a department-specific allocation rate specified by the data processing device 1. Although FIG. 1 shows one accounting terminal 2, a plurality of accounting terminals 2 may access the data processing device 1.
  • the employee terminal 3 is a computer used by an employee of the billing company that ordered the product or the like from the billing company.
  • the employee terminal 3 transmits the image data of the invoice to the data processing device 1 according to the operation of the employee.
  • FIGS. 2 to 4 are diagrams showing an example of invoice data for explaining the outline of the processing executed by the data processing device 1, for example, image data displayed on the accounting terminal 2.
  • the invoice data shown in FIG. 2 all the character strings described in the invoice data are correctly displayed.
  • the invoice data shown in FIG. 3 shows a state in which the character string indicating the name of each item (delivery date, product name, quantity, amount, tax amount) of the invoice details is not properly recognized, and is shown in the item column. It is displayed as X1, X2, X3, X4, X5.
  • FIG. 4 shows image data in a state where the screen of FIG. 3 is displayed on the accounting terminal 2 and the accounting person using the accounting terminal 2 puts the cursor on the portion of X1.
  • the data processing device 1 displays a character string candidate (hereinafter, referred to as “candidate character string”) described at a position selected by the accounting staff.
  • the data processing device 1 (output unit 134 described later) associates each of a plurality of candidate character strings with each other as displayed by the accounting terminal 2, and determines the probability that the candidate character strings are correctly specified. Information indicating the corresponding reliability is output. The reliability corresponds to the probability that the candidate character string determined by the data processing device 1 is actually the same as the character string described in the invoice.
  • the data processing device 1 determines a candidate character string using, for example, an artificial intelligence engine
  • the data processing device 1 has a probability that the character string output by the artificial intelligence engine is a correct character string, or text data indicating reliability (for example, "high reliability”). , “Medium reliability", “Low reliability”).
  • the data processing device 1 When the data processing device 1 receives an operation of selecting one of the displayed candidate character strings from the accounting staff, the data processing device 1 is a computer that manages the voucher data as the character string described in the position X1 of the invoice data. Register the selected candidate character string in. By operating in this way, the data processing device 1 can improve the accuracy of the contents of the voucher data registered in the computer that manages the voucher data. Further, the data processing device 1 also makes it possible to reduce the work load of the accounting staff who confirms the contents of the billing data.
  • FIGS. 3 and 4 are examples of various modes in which the data processing device 1 outputs a candidate character string, and details of the other examples will be described later.
  • FIG. 5 is a diagram showing the configuration of the data processing device 1.
  • the data processing device 1 has a communication unit 11, a storage unit 12, and a control unit 13.
  • the control unit 13 includes a data acquisition unit 131, a character string specifying unit 132, a candidate determination unit 133, and an output unit 134.
  • the communication unit 11 has a communication controller for transmitting and receiving various data to and from the accounting terminal 2 and the employee terminal 3 via the network N.
  • the communication unit 11 inputs data received from, for example, the accounting terminal 2 to the data acquisition unit 131. Further, the communication unit 11 transmits the data input from the output unit 134 to, for example, the accounting terminal 2.
  • the storage unit 12 has a storage medium such as a ROM (ReadOnlyMemory), a RAM (RandomAccessMemory), and a hard disk.
  • the storage unit 12 stores a program executed by the control unit 13.
  • the storage unit 12 also functions as a work memory for temporarily storing the image data of the invoice received via the communication unit 11.
  • the storage unit 12 may store the invoice data of the past invoice.
  • the control unit 13 has, for example, a CPU (Central Processing Unit).
  • the control unit 13 functions as a data acquisition unit 131, a character string specifying unit 132, a candidate determination unit 133, and an output unit 134 by executing the program stored in the storage unit 12.
  • the data acquisition unit 131 acquires various data via the communication unit 11.
  • the data acquisition unit 131 acquires voucher data transmitted from, for example, the accounting terminal 2 or 3.
  • the data acquisition unit 131 inputs the acquired voucher data to the character string specifying unit 132.
  • the data acquisition unit 131 may store the voucher data in the storage unit 12.
  • the data acquisition unit 131 may acquire data indicating the operation content in the accounting terminal 2.
  • the instruction data is, for example, selection data indicating a candidate character string selected by the accounting staff of the accounting terminal 2 from a plurality of candidate character strings.
  • the data acquisition unit 131 notifies the candidate determination unit 133 of the acquired selection data.
  • the character string specifying unit 132 specifies a plurality of character strings included in the voucher data.
  • the character string specifying unit 132 specifies a plurality of character strings by recognizing characters using, for example, OCR (Optical Character Recognition).
  • OCR Optical Character Recognition
  • the character string identification unit 132 learns a combination of voucher data and a plurality of character strings as teacher data, and outputs a plurality of character strings corresponding to the input voucher data (that is, an artificial intelligence engine). ) To specify multiple character strings by entering voucher data.
  • the character string specifying unit 132 further determines whether or not each of the plurality of character strings included in the voucher data can be correctly specified. For example, when the artificial intelligence engine outputs a result that the character string could not be recognized, or when a plurality of character strings are output, the character string specifying unit 132 determines that the character string could not be specified correctly. do. When the character string cannot be correctly specified, the character string specifying unit 132 notifies the candidate determination unit 133 of the position of the unspecified character string in the voucher data. In the following explanation, a character string that cannot be correctly specified is called a misrecognized character string.
  • the candidate determination unit 133 is based on the content of one or more recognition character strings other than the misrecognition character string when there is a misrecognition character string that is a character string that cannot be specified by the character string identification unit 132. , Determines one or more candidate character strings that are candidates for misrecognized character strings. One or more recognition character strings other than the misrecognition character string are correctly recognized character strings among the character strings included in the voucher data.
  • the candidate determination unit 133 notifies the output unit 134 of one or more determined candidate character strings, and the output unit 134 outputs one or more candidate character strings.
  • the output unit 134 transmits one or more candidate character strings to the accounting terminal 2 via the communication unit 11, displays them on a display connected to the data processing device 1, and a printer connected to the data processing device 1. Output to.
  • the candidate determination unit 133 acquires the selection data indicating the candidate character string selected by the accounting staff via the data acquisition unit 131, the candidate character string indicated by the selection data is converted into a character corresponding to the erroneous recognition character string. Decide on a column.
  • the candidate determination unit 133 may store the determined character string in the storage unit 12 in association with the invoice data including the erroneous recognition character string, and externally stores the determined character string via the output unit 134. It may be output to.
  • the output unit 134 arranges one or more candidate character strings at positions that do not overlap with other character strings contained in the same column or the same line as the misrecognized character string corresponding to one or more candidate character strings.
  • One or more candidate character strings may be output.
  • the misrecognized character string is X1
  • the candidate character string is displayed so as not to overlap with the character string in the same column as X1 and the character string in the same line.
  • the candidate determination unit 133 determines one or more candidate character strings based on the contents of one or more recognition character strings contained in the same column or the same line as the erroneous recognition character string, for example.
  • the candidate determination unit 133 When the misrecognition character string is X1 in the invoice data shown in FIG. 3, the candidate determination unit 133 has the character strings “6/10", “6/10", and “6/20" in the same column as X1. , "6/22" to specify that the date is listed in the column containing X1. Further, the candidate determination unit 133 identifies that X1 is located at the top of the column. In such a case, the candidate determination unit 133 determines that X1 is an item name of a column in which a plurality of dates are described in the invoice data, and has a high probability of being described as the item name "delivery date”. , "Order date” and "Acceptance date” are determined as candidate character strings.
  • the candidate determination unit 133 may determine the candidate character string corresponding to the date of the misrecognition character string based on the dates contained in the same column or the same row. For example, when the character string specified by the character string specifying unit 132 is "6/10", “6/18", “6 / 2X", “6/22", the candidate determination unit 133 has X of 0 or It is determined that it is 1, and "6/20" or "6/21" is determined as a candidate character string.
  • the candidate determination unit 133 may determine one or more candidate character strings based on the position of the misrecognized character string in the voucher data.
  • the candidate determination unit 133 determines that the misrecognized character string is a character string indicating an item based on the position in the voucher data of the misrecognized character string, for example, one or more candidates for the character string corresponding to the item name. Decide on a character string.
  • the candidate determination unit 133 is used.
  • the misrecognized character string is a character string indicating an item name.
  • Similar character strings are, for example, a character string indicating the date and time corresponding to the delivery date in FIG. 3, a character string including any of kanji, katakana, hiragana, and alphabet corresponding to the product name, and a numerical character string corresponding to the quantity.
  • the candidate determination unit 133 determines that the item is a character string indicating an item based on the position in this way, and the item name is erroneously recognized, the item name is set as a candidate character string corresponding to the erroneous recognition character string. The probability that the indicated character string will be selected increases.
  • the candidate determination unit 133 may determine one or more candidate character strings based on the number of digits of one or more recognition character strings contained in the same column or the same line as the erroneous recognition character string. For example, when the number of digits of the recognition character string contained in the same column or the same row is less than the threshold value (for example, 3 digits), the candidate determination unit 133 sets a character string indicating a quantity as one or more candidate character strings. When the number of digits of the recognition character string contained in the same column or the same row is equal to or more than a threshold value (for example, 3 digits), a character string indicating an amount of money is selected as one or more candidate character strings.
  • a threshold value for example, 3 digits
  • the candidate determination unit 133 may determine the threshold value based on the product name. For example, when the product name indicates that the product is often purchased in units of less than 10, the candidate determination unit 133 often purchases in units of 10 or more with a threshold value of 2 digits. When the product name indicates that it is a product, the threshold value is set to 3 digits. Since the candidate determination unit 133 determines the threshold value based on the product name, the accuracy with which the candidate determination unit 133 determines whether or not the item name indicates the quantity is improved.
  • FIG. 6 is a diagram showing invoice data in which the candidate determination unit 133 determines the candidate character string based on the number of digits.
  • the candidate determination unit 133 is the same as the misrecognition character string when at least one of one or more recognition character strings contained in the same row or the same column as the misrecognition character string indicates an item name.
  • the item name is a character contained in the same row or column, such as "delivery date", "product name”, “quantity”, “amount”, and "tax amount” in the case of the invoice data shown in FIG. It is a name that indicates what the column means.
  • the candidate determination unit 133 indicates the item name as the candidate character string of X4. Determine the above candidate character strings. Further, the candidate determination unit 133 determines that X4 is an item name related to the amount of money because the number of digits of the character string in the same column as X4 is 5 digits, and determines that X4 is an item name related to the amount of money, and determines that "amount", "unit price", and “subtotal”. , "Tax amount” and “consumption tax” are determined as candidate character strings.
  • FIG. 7 is a diagram showing invoice data in which the item name of X5 in the invoice data shown in FIG. 6 is specified to be the tax amount.
  • the candidate determination unit 133 since the character string “tax amount” is included in the same column as X4, the candidate determination unit 133 selects “tax amount” and “consumption tax” from the candidate character strings shown in FIG. Excluded from the string. In this way, the candidate determination unit 133 can improve the accuracy of the candidate character string by excluding the character string contained in the other column or the other line from the candidate character string.
  • the candidate determination unit 133 determines that the misrecognized character string is a character string indicating an item based on the position in the voucher data of the misrecognized character string, the candidate determination unit 133 determines a plurality of candidate character strings each indicating a plurality of item names. You may create a template that includes it.
  • FIG. 8 is a diagram showing invoice data in which a template including a candidate character string for an item name is displayed.
  • three templates including a plurality of candidate character strings indicating a plurality of item names are displayed in an area different from the area where the invoice details are displayed.
  • the first template includes "delivery date, product name, quantity, amount of tax", and in the second template, "order date” is described instead of “delivery date” in the first template. It is underlined to show the difference from the first template.
  • the "unit price” is described instead of the "amount” in the first template, and is underlined to indicate the difference from the first template.
  • the candidate determination unit 133 may determine one or more candidate character strings based on the numerical value indicated by one or more recognition character strings and the consumption tax rate.
  • FIG. 9 is a diagram showing invoice data in which a candidate character string indicating an amount based on the consumption tax rate is displayed.
  • the candidate determination unit 133 divides the tax amount of 2,000 yen shown on the same line as the misrecognition character string X6 by the consumption tax rate to obtain a candidate amount. Is calculated. Specifically, the candidate determination unit 133 determines 20,000 yen calculated by dividing 2,000 yen by the consumption tax rate of 10% as the first candidate character string, and 2,000 yen is the consumption tax rate of 8. The 25,000 yen calculated by dividing by% is determined as the second candidate character string. The accuracy of the candidate character string can be improved by the candidate determination unit 133 determining the character string corresponding to the result calculated based on the numerical value indicating the tax amount and the consumption tax rate as the candidate character string.
  • the candidate determination unit 133 estimates the consumption tax rate based on the product type indicated by the character string described in the product name column, and first uses the character string of the amount calculated based on the consumption tax rate corresponding to the product type. It may be a candidate character string of. For example, when the product name is "probe for measuring instrument A", the candidate determination unit 133 estimates that the consumption tax rate is 10%, and as shown in FIG. 9, "20,000 yen" is the first candidate. Decide on a character string.
  • the candidate determination unit 133 is a character included in the position corresponding to the position of the misrecognized character string in the voucher data in the similar voucher data similar to the voucher data acquired by the data acquisition unit 131.
  • One or more candidate strings may be determined based on the column.
  • the storage unit 12 stores a plurality of past voucher data, which is a plurality of voucher data acquired in the past by the data acquisition unit 131, in association with a plurality of character strings included in each of the plurality of past voucher data. is doing.
  • the storage unit 12 may store the position where each character string is described in the voucher data.
  • the similar voucher data is, for example, invoice data in which the name of the company that issued the invoice, the transfer destination account information, and the like match. Since it is highly probable that the same item name is used in the invoice issued by the same company, the candidate determination unit 133 determines the candidate character string based on the past similar voucher data, so that the candidate character string can be selected. The accuracy is improved.
  • FIG. 10 shows the processing flow of the data processing device 1.
  • the flowchart shown in FIG. 10 starts from the time when the accounting person using the accounting terminal 2 performs an operation of transmitting the invoice data to the data processing device 1.
  • the character string specifying unit 132 specifies the character string included in the invoice data (S12).
  • the character string specifying unit 132 determines whether or not there is a character string that may have been erroneously recognized (S13), and if there is no character string that may have been erroneously recognized (NO in S13), the specified character string (S14), and the data processing device 1 ends the process of outputting the candidate character string corresponding to the erroneous recognition character string.
  • the character string specifying unit 132 stores the specified character string in the storage unit 12 or transmits it to the accounting terminal 2 via the communication unit 11.
  • the character string specifying unit 132 notifies the candidate determination unit 133 to that effect.
  • the candidate determination unit 133 determines whether or not a general noun is included in a column or row containing a character string that may be erroneously recognized (S15). When the general noun is included in the same column or row (YES in S15), the candidate determination unit 133 determines the "product name" as the candidate character string (S16). When the same column or row does not contain a general noun (NO in S15), the candidate determination unit 133 determines whether or not the same column or row is composed of numerical values (S17).
  • the candidate determination unit 133 determines that the same column or row is not composed of numerical values (for example, when it is a combination of alphabets and numbers) (NO in S17), the candidate determination unit 133 determines the "product name" as the candidate character string (S16). ).
  • the candidate determination unit 133 executes a process of determining the type of numerical value (S18).
  • the output unit 134 outputs the candidate character string (S19).
  • FIG. 11 is a flowchart of a process in which the candidate determination unit 133 determines the type of a numerical value.
  • a numerical value corresponding to one item name for example, an amount
  • the candidate determination unit 133 determines whether or not the number of digits of the numerical value included in the same column is less than the threshold value (for example, two digits) (S181).
  • the threshold value for example, two digits
  • the candidate determination unit 133 determines the character string indicating the quantity as the candidate character string (S182).
  • the candidate determination unit 133 determines whether or not the column has the largest number of digits among the plurality of columns containing the numerical values (S183). When the candidate determination unit 133 determines that the number of digits is the largest (YES in S183), the candidate determination unit 133 determines the character string indicating the amount of money as the candidate character string (S184).
  • the candidate determination unit 133 determines that the column does not have the largest number of digits (NO in S183), the numerical value of the column including the misrecognized character string corresponds to the consumption tax rate (for example, 10%) of the numerical value of the other column. It is determined whether or not it is a numerical value to be used (S185). When the candidate determination unit 133 determines that the numerical value corresponds to the consumption tax rate of the numerical value in another column (YES in S185), the candidate determination unit 133 determines the character string indicating the tax amount as the candidate character string (S186).
  • the candidate determination unit 133 determines whether or not it is a divisor of the numerical value in the other column (S187).
  • the candidate determination unit 133 determines, for example, whether or not the numerical value in the column corresponding to the misrecognition character string matches the result of subtracting the numerical value in the amount column by the numerical value in the quantity column.
  • the candidate determination unit 133 determines that it is a divisor of the numerical value of another column (YES in S187)
  • the candidate determination unit 133 determines the character string indicating the unit price as the candidate character string.
  • the candidate determination unit 133 outputs a result that the candidate character string cannot be determined and ends the process.
  • the candidate determination unit 133 determines the candidate character string by using the relationship with other character strings, but the method by which the candidate determination unit 133 determines the candidate character string is this. Not exclusively.
  • the candidate determination unit 133 learns a combination of voucher data and a plurality of candidate character strings as teacher data, and outputs one or more candidate character strings in association with one character string included in the input voucher data.
  • One or more candidate strings may be determined by inputting voucher data into the machine learning model.
  • the candidate determination unit 133 may select a candidate character string common to the plurality of candidate character strings determined by the various methods described above and one or more candidate character strings output from the machine learning model. By using the machine learning model in this way, the candidate determination unit 133 can further improve the accuracy of the candidate character string.
  • the output unit 134 may output information indicating the reliability corresponding to the probability that the candidate character string is a correct character string in association with each of one or more candidate character strings.
  • the output unit 134 outputs, for example, the reliability output from the machine learning model in association with the candidate character string.
  • the candidate determination unit 133 uses a character string that cannot be specified by the character string identification unit 132 among the plurality of character strings included in the voucher data.
  • the output unit 134 outputs one or more candidate character strings, and enables the accounting staff to select a candidate character string from one or more candidate character strings.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Character Discrimination (AREA)

Abstract

データ処理装置1は、証憑データを取得するデータ取得部131と、証憑データに含まれる複数の文字列を特定する文字列特定部132と、文字列特定部132が特定することができなかった文字列である誤認識文字列が存在する場合に、誤認識文字列以外の一以上の認識文字列の内容に基づいて、誤認識文字列の候補である一以上の候補文字列を決定する候補決定部133と、一以上の候補文字列を出力する出力部134と、を有する。

Description

データ処理装置、データ処理方法及びプログラム
 本発明は、証憑データを処理するデータ処理装置、データ処理方法及びプログラムに関する。
 従来、文書を文字認識した結果に誤りがある場合に、誤認識された文字列を修正する機能を有する画像処理装置が知られている。特許文献1には、漢字の旧字と新字の違いや漢字の送り仮名の違い等の誤認識パターンに基づいて、誤認識した文字列を修正する技術が開示されている。
特開2019-040467号公報
 近年、請求書又は納品書等の証憑に記載された文字列を認識し、認識した文字列を証憑管理用コンピュータで管理するシステムが使用されている。このような証憑に記載された文字列が正しく認識されないと、証憑管理用コンピュータに適切な内容が登録されないので、経理処理に支障が生じてしまう。従来の技術により、誤認識パターンに当てはまる誤認識であれば、文字列が正しく修正される場合があるが、誤認識パターンに当てはまらない誤認識が生じた場合、文字列が正しく修正されないという問題があった。
 そこで、本発明はこれらの点に鑑みてなされたものであり、証憑データを管理するコンピュータに登録される証憑データの内容の精度を高めることを目的とする。
 本発明の第1の態様のデータ処理装置は、証憑データを取得するデータ取得部と、前記証憑データに含まれる複数の文字列を特定する文字列特定部と、前記文字列特定部が特定することができなかった文字列である誤認識文字列が存在する場合に、前記誤認識文字列以外の一以上の認識文字列の内容に基づいて、前記誤認識文字列の候補である一以上の候補文字列を決定する候補決定部と、前記一以上の候補文字列を出力する出力部と、を有する。
 前記候補決定部は、前記誤認識文字列と同じ列又は同じ行に含まれている前記一以上の認識文字列の内容に基づいて前記一以上の候補文字列を決定してもよい。
 前記候補決定部は、前記誤認識文字列と同じ行又は同じ列に含まれている前記一以上の認識文字列の少なくとも一つが項目名を示している場合に、前記誤認識文字列と同じ列又は同じ行に含まれている前記一以上の認識文字列の内容に対応する項目名を示す前記一以上の候補文字列を決定してもよい。
 前記候補決定部は、前記誤認識文字列と同じ列又は同じ行に含まれている前記一以上の認識文字列の桁数に基づいて前記一以上の候補文字列を決定してもよい。
 前記候補決定部は、前記誤認識文字列の前記証憑データにおける位置に基づいて、前記一以上の候補文字列を決定してもよい。
 前記候補決定部は、前記誤認識文字列の前記証憑データにおける位置に基づいて前記誤認識文字列が項目を示す文字列であると判定した場合に、項目名に対応する文字列を前記一以上の候補文字列に決定してもよい。
 前記候補決定部は、前記誤認識文字列の前記証憑データにおける位置に基づいて前記誤認識文字列が項目を示す文字列であると判定した場合に、それぞれが複数の項目名を示す複数の候補文字列を含むテンプレートを作成してもよい。
 前記候補決定部は、前記一以上の認識文字列が示す数値と消費税率とに基づいて、前記一以上の候補文字列を決定してもよい。
 前記データ取得部が過去に取得した複数の前記証憑データである複数の過去証憑データと、前記複数の過去証憑データそれぞれに含まれている複数の文字列とを関連付けて記憶する記憶部をさらに有し、前記候補決定部は、前記複数の過去証憑データのうち、前記データ取得部が取得した前記証憑データに類似する類似証憑データにおいて、前記証憑データにおける前記誤認識文字列の位置に対応する位置に含まれている文字列に基づいて前記一以上の候補文字列を決定してもよい。
 前記文字列特定部は、証憑データと複数の文字列との組み合わせを教師データとして学習し、入力された前記証憑データに対応する前記複数の文字列を出力する機械学習モデルに前記証憑データを入力することにより、前記複数の文字列を特定し、前記出力部は、前記複数の文字列それぞれに関連付けて、文字列が正しく特定されている確率に対応する信頼度を示す情報を出力してもよい。
 前記候補決定部は、証憑データと複数の候補文字列との組み合わせを教師データとして学習し、入力された前記証憑データに含まれている一つの文字列に関連付けて前記一以上の候補文字列を出力する機械学習モデルに前記証憑データを入力することにより、前記一以上の候補文字列を決定し、前記出力部は、前記一以上の候補文字列それぞれに関連付けて、前記候補文字列が正しい文字列である確率に対応する信頼度を示す情報を出力してもよい。
 本発明の第2の態様のデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、前記証憑データに含まれる複数の文字列を特定するステップと、特定することができなかった文字列である誤認識文字列が存在する場合に、前記誤認識文字列以外の一以上の認識文字列の内容に基づいて、前記誤認識文字列の候補である一以上の候補文字列を決定するステップと、前記一以上の候補文字列を出力するステップと、を有する。
 本発明の第3の態様のプログラムは、コンピュータに、証憑データを取得するステップと、前記証憑データに含まれる複数の文字列を特定するステップと、特定することができなかった文字列である誤認識文字列が存在する場合に、前記誤認識文字列以外の一以上の認識文字列の内容に基づいて、前記誤認識文字列の候補である一以上の候補文字列を決定するステップと、前記一以上の候補文字列を出力するステップと、を実行させる。
 本発明によれば、証憑データを管理するコンピュータに登録される証憑データの内容の精度を高めることができるという効果を奏する。
データ処理システムの構成を説明するための図である。 請求書データの例を示す図である。 請求書データの例を示す図である。 請求書データの例を示す図である。 データ処理装置の構成を示す図である。 候補決定部が桁数に基づいて候補文字列を決定した請求書データを示す図である。 図6に示した請求書データにおけるX5の項目名が税額であることが特定されている請求書データを示す図である。 項目名の候補文字列を含むテンプレートが表示された請求書データを示す図である。 消費税率に基づいて金額を示す候補文字列が表示されている請求書データを示す図である。 データ処理装置の処理の流れを示すフローチャートである。 データ処理装置の処理の流れを示すフローチャートである。
[データ処理システムSの概要]
 図1は、データ処理システムSの構成を説明するための図である。データ処理システムSは、証憑の画像を読み取って得られた証憑データを処理するためのシステムである。証憑は、取引内容又は取引条件が記載された書類であり、例えば見積書、注文書、又は請求書である。証憑データは、証憑に含まれる複数の文字列に対応する複数のテキストデータを含むデータである。以下の説明においては証憑が請求書である場合を例示するが、本実施形態は、請求書以外の証憑にも適用することができる。
 データ処理システムSは、データ処理装置1と、経理端末2と、従業員端末3と、を備える。データ処理装置1、経理端末2及び従業員端末3は、ネットワークNを介してデータを送受信する。ネットワークNは、例えばインターネット又はイントラネットを含む。
 データ処理装置1は、各種の証憑データを管理するコンピュータである。データ処理装置1は、経理端末2又は従業員端末3から証憑の画像データを含むファイルを取得し、取得した画像データにおいて特定された文字列に基づいて、証憑データを作成してもよく、経理端末2又は従業員端末3から証憑データを含むファイルを取得してもよい。
 本実施形態に係るデータ処理装置1は、請求先企業が受け取った請求書の内容を示す請求書データを管理する。データ処理装置1は、過去に請求先企業が受け取った請求書の内容、及びそれぞれの請求書に関連する部門を示す複数の過去請求書データを含む請求書データベースを記憶しており、経理端末2からの要求に応じて、記憶している請求書データの内容を経理端末2に提供する。データ処理装置1は、証憑データに含まれている文字列を認識し、証憑データを管理するシステム(例えば経理用の基幹システム)のデータベースに登録されるデータを出力してもよい。
 データ処理装置1は、例えば人工知能を用いて請求書データに含まれている文字列を認識するが、文字列を正しく認識できないという場合がある。誤認識された文字列がデータベースに登録されてしまうと、経理処理に支障が生じるので、データ処理装置1は、データベースに文字列が登録される前に、誤認識された文字列を修正できるようにする。データ処理装置1は、データベースに文字列が登録された後に、誤認識された文字列を修正できるようにしてもよい。データ処理装置1は、証憑データを確認する担当者(本明細書においては経理担当者)が、実際に証憑に記載されていた文字列と同一の正しい文字列に修正をしやすくするために、証憑に記載されていた蓋然性が比較的高い文字列の候補を表示することを特徴としている。
 経理端末2は、請求書を受領した請求先企業においてデータ処理装置1を利用する従業員(例えば経理担当者)が使用するコンピュータである。経理端末2は、例えばイントラネットを介してデータ処理装置1との間で各種のデータを送受信する。
 経理端末2は、例えば経理担当者がスキャナで読み取った請求書の画像データをデータ処理装置1に送信する。また、経理端末2は、経理担当者の指示に応じてデータ処理装置1が記憶している請求書データベースにアクセスして、経理担当者が指定した請求書データを表示する。経理端末2は、例えば、データ処理装置1が特定した部門名又は部門別配賦率を表示する。図1は1台の経理端末2を示しているが、複数の経理端末2がデータ処理装置1にアクセスしてもよい。
 従業員端末3は、商品等を請求元企業に発注した請求先企業の従業員が使用するコンピュータである。従業員端末3は、従業員が請求書を受け取った場合に、従業員の操作に応じて請求書の画像データをデータ処理装置1に送信する。
 図2から図4は、データ処理装置1が実行する処理の概要を説明するための請求書データの例を示す図であり、例えば経理端末2に表示される画像データである。図2に示す請求書データは、請求書データに記載された全ての文字列が正しく表示されている。図3に示す請求書データは、請求書の明細の各項目(納品日、品名、数量、金額、税額)の名称を示す文字列が適切に認識されなかった状態を示しており、項目欄にX1、X2、X3、X4、X5と表示されている。
 図4は、図3の画面が経理端末2に表示された状態で、経理端末2を使用する経理担当者がX1の部分にカーソルを当てた状態の画像データを示している。データ処理装置1は、図4に示すように、経理担当者により選択された位置に記載されていた文字列の候補(以下、「候補文字列」という)を表示する。
 図4に示す例において、データ処理装置1(後述する出力部134)は、経理端末2が表示するように、複数の候補文字列それぞれに関連付けて、候補文字列が正しく特定されている確率に対応する信頼度を示す情報を出力している。信頼度は、データ処理装置1が決定した候補文字列が実際に請求書に記載された文字列と同一である蓋然性に対応している。データ処理装置1は、例えば人工知能エンジンを用いて候補文字列を決定する場合、人工知能エンジンが出力した文字列が正しい文字列である確率、又は信頼度を示すテキストデータ(例えば「信頼度高」、「信頼度中」、「信頼度低」)を出力する。
 データ処理装置1は、表示された候補文字列のうち1つを選択する操作を経理担当者から受けると、請求書データのX1の位置に記載されていた文字列として、証憑データを管理するコンピュータに選択された候補文字列を登録する。データ処理装置1は、このように動作することで、証憑データを管理するコンピュータに登録される証憑データの内容の精度を高めることができる。また、データ処理装置1は、請求データの内容を確認する経理担当者の業務負荷を減らすことも可能にする。なお、図3及び図4に示した例は、データ処理装置1が候補文字列を出力する各種の態様の一例であり、他の例の詳細については後述する。
[データ処理装置1の構成及び動作]
 図5は、データ処理装置1の構成を示す図である。データ処理装置1は、通信部11と、記憶部12と、制御部13とを有する。制御部13は、データ取得部131と、文字列特定部132と、候補決定部133と、出力部134とを有する。
 通信部11は、ネットワークNを介して経理端末2及び従業員端末3と各種のデータを送受信するための通信コントローラを有する。通信部11は、例えば経理端末2から受信したデータをデータ取得部131に入力する。また、通信部11は、出力部134から入力されたデータを、例えば経理端末2に送信する。
 記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部12は、制御部13が実行するプログラムを記憶している。記憶部12は、通信部11を介して受信した請求書の画像データを一時的に記憶するワークメモリとしても機能する。記憶部12は、過去の請求書の請求書データを記憶してもよい。
 制御部13は、例えばCPU(Central Processing Unit)を有する。制御部13は、記憶部12に記憶されたプログラムを実行することにより、データ取得部131、文字列特定部132、候補決定部133及び出力部134として機能する。
 データ取得部131は、通信部11を介して各種のデータを取得する。データ取得部131は、例えば経理端末2又は3から送信された証憑データを取得する。データ取得部131は、取得した証憑データを文字列特定部132に入力する。データ取得部131は、証憑データを記憶部12に記憶させてもよい。
 また、データ取得部131は、経理端末2における操作内容を示すデータを取得してもよい。指示データは、例えば複数の候補文字列から経理端末2の経理担当者が選択した候補文字列を示す選択データである。データ取得部131は、取得した選択データを候補決定部133に通知する。
 文字列特定部132は、証憑データに含まれる複数の文字列を特定する。文字列特定部132は、例えばOCR(Optical Character Recognition)を用いて文字認識することにより複数の文字列を特定する。一例として、文字列特定部132は、証憑データと複数の文字列との組み合わせを教師データとして学習し、入力された証憑データに対応する複数の文字列を出力する機械学習モデル(すなわち人工知能エンジン)に証憑データを入力することにより、複数の文字列を特定する。
 文字列特定部132は、さらに、証憑データに含まれる複数の文字列のそれぞれを正しく特定できたか否かを判定する。文字列特定部132は、例えば人工知能エンジンが、文字列を認識することができなかったという結果を出力した場合、又は複数の文字列を出力した場合、当該文字列を正しく特定できなかったと判定する。文字列特定部132は、文字列を正しく特定することができなかった場合、特定できなかった文字列の証憑データにおける位置を候補決定部133に通知する。以下の説明において、正しく特定することができなかった文字列を誤認識文字列という。
 候補決定部133は、文字列特定部132が特定することができなかった文字列である誤認識文字列が存在する場合に、誤認識文字列以外の一以上の認識文字列の内容に基づいて、誤認識文字列の候補である一以上の候補文字列を決定する。誤認識文字列以外の一以上の認識文字列は、証憑データに含まれている文字列のうち、正しく認識された文字列である。
 候補決定部133は、決定した一以上の候補文字列を出力部134に通知し、出力部134は、一以上の候補文字列を出力する。出力部134は、通信部11を介して、一以上の候補文字列を経理端末2に送信したり、データ処理装置1に接続されたディスプレイに表示したり、データ処理装置1に接続されたプリンタに出力したりする。
 また、候補決定部133は、データ取得部131を介して、経理担当者が選択した候補文字列を示す選択データを取得すると、選択データが示す候補文字列を、誤認識文字列に対応する文字列に決定する。候補決定部133は、誤認識文字列が含まれていた請求書データに関連付けて、決定した文字列を記憶部12に記憶させてもよく、出力部134を介して、決定した文字列を外部に出力してもよい。
 出力部134は、一以上の候補文字列に対応する誤認識文字列と同じ列又は同じ行に含まれている他の文字列と重ならない位置に一以上の候補文字列が配置されるように一以上の候補文字列を出力してもよい。図2に示す例においては、誤認識文字列がX1である場合に、X1と同じ列の文字列及び同じ行の文字列と重ならないように候補文字列が表示されている。出力部134がこのような態様で候補文字列を出力することにより、経理担当者が、同じ列又は同じ行の他の文字列に基づいて、最適な候補文字列を選択しやすくなる。
[候補文字列の決定方法の詳細]
 以下、候補決定部133が候補文字列を決定するための各種の方法を詳細に説明する。
 候補決定部133は、例えば、誤認識文字列と同じ列又は同じ行に含まれている一以上の認識文字列の内容に基づいて一以上の候補文字列を決定する。
 図3に示した請求書データにおいて誤認識文字列がX1である場合、候補決定部133は、X1と同じ列の文字列である「6/10」、「6/10」、「6/20」、「6/22」に基づいて、X1が含まれている列に日付が記載されているということを特定する。さらに、候補決定部133は、X1が列の最上部に位置していることを特定する。このような場合、候補決定部133は、X1が、請求書データにおいて複数の日付が記載されている列の項目名であると判定し、項目名として記載されている確率が高い「納品日」、「発注日」、「検収日」を候補文字列に決定する。
 候補決定部133は、同じ列又は同じ行に含まれている日付に基づいて、誤認識文字列の日付に対応する候補文字列を決定してもよい。例えば、文字列特定部132が特定した文字列が「6/10」、「6/18」、「6/2X」、「6/22」である場合、候補決定部133は、Xが0又は1であると判定し、「6/20」又は「6/21」を候補文字列に決定する。
 候補決定部133は、誤認識文字列の証憑データにおける位置に基づいて、一以上の候補文字列を決定してもよい。候補決定部133は、例えば、誤認識文字列の証憑データにおける位置に基づいて誤認識文字列が項目を示す文字列であると判定した場合に、項目名に対応する文字列を一以上の候補文字列に決定する。
 一例として、候補決定部133は、誤認識文字列が、類似する文字列が連続している列における最上位の位置、又は類似する文字列が連続している行における左端の位置にある場合に、当該誤認識文字列が項目名を示す文字列であると判定する。類似する文字列とは、例えば図3における納品日に対応する日時を示す文字列、品名に対応する漢字・カタカナ・ひらがな・アルファベットのいずれかを含む文字列、数量に対応する数値の文字列、金額の単位を含む文字列である。候補決定部133が、このように位置に基づいて項目を示す文字列であると判定することにより、項目名が誤認識された場合に、誤認識文字列に対応する候補文字列として項目名を示す文字列が選択される確率が高まる。
 候補決定部133は、誤認識文字列と同じ列又は同じ行に含まれている一以上の認識文字列の桁数に基づいて一以上の候補文字列を決定してもよい。候補決定部133は、例えば同じ列又は同じ行に含まれている認識文字列の桁数が閾値(例えば3桁)未満である場合、一以上の候補文字列として、数量を意味する文字列を選択し、同じ列又は同じ行に含まれている認識文字列の桁数が閾値(例えば3桁)以上である場合、一以上の候補文字列として金額を意味する文字列を選択する。
 候補決定部133は、品名に基づいて閾値を決定してもよい。候補決定部133は、例えば、10個未満の単位で購入されることが多い商品であることを品名が示している場合、閾値を2桁とし、10個以上の単位で購入されることが多い商品であることを品名が示している場合、閾値を3桁とする。候補決定部133が品名に基づいて閾値を決定することで、項目名が数量を示しているか否かを候補決定部133が判定する精度が向上する。
 図6は、候補決定部133が桁数に基づいて候補文字列を決定した請求書データを示す図である。この例において、候補決定部133は、誤認識文字列と同じ行又は同じ列に含まれている一以上の認識文字列の少なくとも一つが項目名を示している場合に、誤認識文字列と同じ列又は同じ行に含まれている一以上の認識文字列の内容に対応する項目名を示す一以上の候補文字列を決定する。項目名は、図2に示した請求書データの場合の「納品日」、「品名」、「数量」、「金額」、「税額」のように、同じ行又は同じ列に含まれている文字列がどのような意味を持つかを示す名称である。
 候補決定部133は、図6に示すX4と同じ列に「納品日」、「品名」、「数量」という項目名が記載されていることから、X4の候補文字列として、項目名を示す一以上の候補文字列を決定する。さらに、候補決定部133は、X4と同じ列の文字列の桁数が5桁であることから、X4が金額関連の項目名であると判定し、「金額」、「単価」、「小計」、「税額」、「消費税」を候補文字列に決定している。
 図7は、図6に示した請求書データにおけるX5の項目名が税額であることが特定されている請求書データを示す図である。図7においては、X4と同じ列に「税額」という文字列が含まれていることから、候補決定部133は、図6に示した候補文字列のうち「税額」、「消費税」を候補文字列から除外している。このように、候補決定部133は、他の列又は他の行に含まれている文字列を候補文字列から除外することにより、候補文字列の精度を向上させることができる。
 候補決定部133は、誤認識文字列の証憑データにおける位置に基づいて誤認識文字列が項目を示す文字列であると判定した場合に、それぞれが複数の項目名を示す複数の候補文字列を含むテンプレートを作成してもよい。
 図8は、項目名の候補文字列を含むテンプレートが表示された請求書データを示す図である。図8においては、請求書の明細が表示されている領域と異なる領域に、複数の項目名を示す複数の候補文字列を含む3つのテンプレートが表示されている。
 第1のテンプレートには、「納品日 品名 数量 金額 税額」が含まれており、第2のテンプレートにおいては、第1のテンプレートにおける「納品日」の代わりに「注文日」が記載されており、第1テンプレートとの違いを示すための下線が引かれている。第3のテンプレートにおいては、第1のテンプレートにおける「金額」の代わりに「単価」が記載されており、第1テンプレートとの違いを示すための下線が引かれている。経理担当者は、表示されている複数のテンプレートから所望のテンプレートを選択することで、文字列が特定されていなかった項目名X1~X5の文字列を一度の操作で決定することができる。
 候補決定部133は、一以上の認識文字列が示す数値と消費税率とに基づいて、一以上の候補文字列を決定してもよい。図9は、消費税率に基づいて金額を示す候補文字列が表示されている請求書データを示す図である。
 消費税率として10%又は8%が想定される場合、候補決定部133は、誤認識文字列X6と同じ行に示されている税額2,000円を消費税率で除算することにより候補となる金額を算出する。具体的には、候補決定部133は、2,000円を消費税率10%で除算することにより算出した20,000円を第1の候補文字列に決定し、2,000円を消費税率8%で除算することにより算出した25,000円を第2の候補文字列に決定する。候補決定部133が、このように税額を示す数値と消費税率に基づいて算出した結果に対応する文字列を候補文字列に決定することで、候補文字列の精度を向上させることができる。
 候補決定部133は、品名の列に記載されている文字列が示す商品の種別に基づいて消費税率を推定し、商品の種別に対応する消費税率に基づいて算出した金額の文字列を第1の候補文字列としてもよい。候補決定部133は、例えば、品名が「測定器A用プローブ」である場合、消費税率が10%であると推定し、図9に示すように、「20,000円」を第1の候補文字列に決定する。
 候補決定部133は、複数の過去証憑データのうち、データ取得部131が取得した証憑データに類似する類似証憑データにおいて、証憑データにおける誤認識文字列の位置に対応する位置に含まれている文字列に基づいて一以上の候補文字列を決定してもよい。この場合、記憶部12は、データ取得部131が過去に取得した複数の証憑データである複数の過去証憑データと、複数の過去証憑データそれぞれに含まれている複数の文字列とを関連付けて記憶している。記憶部12は、証憑データにおいて各文字列が記載されていた位置を記憶していてもよい。類似証憑データは、例えば、請求書を発行した企業の名称、又は振込先口座情報等が一致する請求書データである。同じ企業が発行した請求書においては、同じ項目名が用いられている蓋然性が高いことから、候補決定部133が過去の類似証憑データに基づいて候補文字列を決定することにより、候補文字列の精度が向上する。
[データ処理装置1における処理の流れ]
 図10及び図11は、データ処理装置1の処理の流れを示すフローチャートである。図10に示すフローチャートは、経理端末2を使用する経理担当者が請求書データをデータ処理装置1に送信する操作をした時点から開始している。
 データ取得部131が請求書データを取得すると(S11)、文字列特定部132が請求書データに含まれている文字列を特定する(S12)。文字列特定部132は、誤認識した可能性がある文字列があるか否かを判定し(S13)、誤認識した可能性がある文字列がない場合(S13においてNO)、特定した文字列を出力させて(S14)、データ処理装置1が誤認識文字列に対応する候補文字列を出力する処理を終了する。文字列特定部132は、例えば特定した文字列を記憶部12に記憶させたり、通信部11を介して経理端末2に送信したりする。
 文字列特定部132は、誤認識した可能性がある文字列がある場合(S13においてYES)、その旨を候補決定部133に通知する。候補決定部133は、誤認識した可能性がある文字列が含まれている列又は行に一般名詞が含まれているか否かを判定する(S15)。候補決定部133は、同じ列又は行に一般名詞が含まれている場合(S15においてYES)、「品名」を候補文字列に決定する(S16)。候補決定部133は、同じ列又は行に一般名詞が含まれていない場合(S15においてNO)、同じ列又は行が数値により構成されているか否かを判定する(S17)。候補決定部133は、同じ列又は行が数値により構成されていないと判定した場合(例えばアルファベットと数字の組み合わせである場合)(S17においてNO)、「品名」を候補文字列に決定する(S16)。
 候補決定部133は、同じ列又は行が数値により構成されていると判定した場合(S17においてYES)、数値の種別を判定する処理を実行する(S18)。候補決定部133がS16又はS18により候補文字列を決定すると、出力部134は候補文字列を出力する(S19)。
 図11は、候補決定部133が数値の種別を判定する処理のフローチャートである。図11においては、図2に示した請求書データのように、同じ列に一つの項目名(例えば金額)に対応する数値が記載されている場合を例にして説明する。候補決定部133は、同じ列に含まれている数値の桁数が閾値(例えば2桁)未満であるか否かを判定する(S181)。候補決定部133は、数値の桁数が閾値未満である場合(S181においてYES)、数量を示す文字列を候補文字列に決定する(S182)。
 候補決定部133は、桁数が閾値以上である場合(S181においてNO)、数値が含まれる複数の列のうち、桁数が最も多い列であるか否かを判定する(S183)。候補決定部133は、桁数が最も多い桁数であると判定した場合(S183においてYES)、金額を示す文字列を候補文字列に決定する(S184)。
 候補決定部133は、桁数が最も多い列でないと判定した場合(S183においてNO)、誤認識文字列が含まれる列の数値が、他の列の数値の消費税率(例えば10%)に相当する数値か否かを判定する(S185)。候補決定部133は、他の列の数値の消費税率に相当する数値であると判定した場合(S185においてYES)、税額を示す文字列を候補文字列に決定する(S186)。
 候補決定部133は、他の列の数値の消費税率に相当する数値でないと判定した場合(S185においてNO)、他の列の数値の約数であるか否かを判定する(S187)。候補決定部133は、例えば、誤認識文字列に対応する列の数値が、金額の列の数値を数量の列の数値で減算した結果と一致するか否かを判定する。候補決定部133は、他の列の数値の約数であると判定した場合(S187においてYES)、単価を示す文字列を候補文字列に決定する。候補決定部133は、他の列の数値の約数でないと判定した場合(S187においてNO)、候補文字列を決定できないという結果を出力して処理を終了する。
[変形例]
 以上の説明においては、候補決定部133が、他の文字列との関係を用いることにより候補文字列を決定する場合を例示したが、候補決定部133が候補文字列を決定する方法はこれに限らない。候補決定部133は、証憑データと複数の候補文字列との組み合わせを教師データとして学習し、入力された証憑データに含まれている一つの文字列に関連付けて一以上の候補文字列を出力する機械学習モデルに証憑データを入力することにより、一以上の候補文字列を決定してもよい。候補決定部133は、上述した各種の方法で決定した複数の候補文字列と、機械学習モデルから出力された一以上の候補文字列とで共通する候補文字列を選択してもよい。候補決定部133が、このように機械学習モデルを使用することにより、候補文字列の精度をさらに向上させることができる。
 この場合に、出力部134は、一以上の候補文字列それぞれに関連付けて、候補文字列が正しい文字列である確率に対応する信頼度を示す情報を出力してもよい。出力部134は、例えば機械学習モデルから候補文字列に関連付けて出力される信頼度を出力する。
[データ処理装置1による効果]
 以上説明したように、データ処理装置1においては、候補決定部133が、証憑データに含まれている複数の文字列の中に、文字列特定部132が特定することができなかった文字列である誤認識文字列が存在する場合に、誤認識文字列以外の一以上の認識文字列の内容に基づいて、誤認識文字列の候補である一以上の候補文字列を決定する。そして、出力部134が、一以上の候補文字列を出力し、経理担当者が、一以上の候補文字列から候補文字列を選択できるようにする。データ処理装置1がこのように動作することで、誤認識文字列が証憑データを管理するコンピュータに登録されないので、当該コンピュータに登録される証憑データの内容の精度を高めることができる。
 以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
1 データ処理装置
2 経理端末
3 従業員端末
4 請求元端末
11 通信部
12 記憶部
13 制御部
131 データ取得部
132 文字列特定部
133 候補決定部
134 出力部

Claims (13)

  1.  証憑データを取得するデータ取得部と、
     前記証憑データに含まれる複数の文字列を特定する文字列特定部と、
     前記文字列特定部が特定することができなかった文字列である誤認識文字列が存在する場合に、前記誤認識文字列以外の一以上の認識文字列の内容に基づいて、前記誤認識文字列の候補である一以上の候補文字列を決定する候補決定部と、
     前記一以上の候補文字列を出力する出力部と、
     を有するデータ処理装置。
  2.  前記候補決定部は、前記誤認識文字列と同じ列又は同じ行に含まれている前記一以上の認識文字列の内容に基づいて前記一以上の候補文字列を決定する、
     請求項1に記載のデータ処理装置。
  3.  前記候補決定部は、前記誤認識文字列と同じ行又は同じ列に含まれている前記一以上の認識文字列の少なくとも一つが項目名を示している場合に、前記誤認識文字列と同じ列又は同じ行に含まれている前記一以上の認識文字列の内容に対応する項目名を示す前記一以上の候補文字列を決定する、
     請求項2に記載のデータ処理装置。
  4.  前記候補決定部は、前記誤認識文字列と同じ列又は同じ行に含まれている前記一以上の認識文字列の桁数に基づいて前記一以上の候補文字列を決定する、
     請求項2又は3に記載のデータ処理装置。
  5.  前記候補決定部は、前記誤認識文字列の前記証憑データにおける位置に基づいて、前記一以上の候補文字列を決定する、
     請求項1から4のいずれか一項に記載のデータ処理装置。
  6.  前記候補決定部は、前記誤認識文字列の前記証憑データにおける位置に基づいて前記誤認識文字列が項目を示す文字列であると判定した場合に、項目名に対応する文字列を前記一以上の候補文字列に決定する、
     請求項5に記載のデータ処理装置。
  7.  前記候補決定部は、前記誤認識文字列の前記証憑データにおける位置に基づいて前記誤認識文字列が項目を示す文字列であると判定した場合に、それぞれが複数の項目名を示す複数の候補文字列を含むテンプレートを作成する、
     請求項5又は6に記載のデータ処理装置。
  8.  前記候補決定部は、前記一以上の認識文字列が示す数値と消費税率とに基づいて、前記一以上の候補文字列を決定する、
     請求項1から7のいずれか一項に記載のデータ処理装置。
  9.  前記データ取得部が過去に取得した複数の前記証憑データである複数の過去証憑データと、前記複数の過去証憑データそれぞれに含まれている複数の文字列とを関連付けて記憶する記憶部をさらに有し、
     前記候補決定部は、前記複数の過去証憑データのうち、前記データ取得部が取得した前記証憑データに類似する類似証憑データにおいて、前記証憑データにおける前記誤認識文字列の位置に対応する位置に含まれている文字列に基づいて前記一以上の候補文字列を決定する、
     請求項1から8のいずれか一項に記載のデータ処理装置。
  10.  前記文字列特定部は、証憑データと複数の文字列との組み合わせを教師データとして学習し、入力された前記証憑データに対応する前記複数の文字列を出力する機械学習モデルに前記証憑データを入力することにより、前記複数の文字列を特定し、
     前記出力部は、前記複数の文字列それぞれに関連付けて、文字列が正しく特定されている確率に対応する信頼度を示す情報を出力する、
     請求項1から9のいずれか一項に記載のデータ処理装置。
  11.  前記候補決定部は、証憑データと複数の候補文字列との組み合わせを教師データとして学習し、入力された前記証憑データに含まれている一つの文字列に関連付けて前記一以上の候補文字列を出力する機械学習モデルに前記証憑データを入力することにより、前記一以上の候補文字列を決定し、
     前記出力部は、前記一以上の候補文字列それぞれに関連付けて、前記候補文字列が正しい文字列である確率に対応する信頼度を示す情報を出力する、
     請求項1から9のいずれか一項に記載のデータ処理装置。
  12.  コンピュータが実行する、
     証憑データを取得するステップと、
     前記証憑データに含まれる複数の文字列を特定するステップと、
     特定することができなかった文字列である誤認識文字列が存在する場合に、前記誤認識文字列以外の一以上の認識文字列の内容に基づいて、前記誤認識文字列の候補である一以上の候補文字列を決定するステップと、
     前記一以上の候補文字列を出力するステップと、
     を有するデータ処理方法。
  13.  コンピュータに、
     証憑データを取得するステップと、
     前記証憑データに含まれる複数の文字列を特定するステップと、
     特定することができなかった文字列である誤認識文字列が存在する場合に、前記誤認識文字列以外の一以上の認識文字列の内容に基づいて、前記誤認識文字列の候補である一以上の候補文字列を決定するステップと、
     前記一以上の候補文字列を出力するステップと、
     を実行させるためのプログラム。
     
PCT/JP2020/029063 2020-07-29 2020-07-29 データ処理装置、データ処理方法及びプログラム WO2022024262A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020541623A JP6810302B1 (ja) 2020-07-29 2020-07-29 データ処理装置、データ処理方法及びプログラム
PCT/JP2020/029063 WO2022024262A1 (ja) 2020-07-29 2020-07-29 データ処理装置、データ処理方法及びプログラム
JP2020204810A JP2022027399A (ja) 2020-07-29 2020-12-10 データ処理装置、データ処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/029063 WO2022024262A1 (ja) 2020-07-29 2020-07-29 データ処理装置、データ処理方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2022024262A1 true WO2022024262A1 (ja) 2022-02-03

Family

ID=73992880

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/029063 WO2022024262A1 (ja) 2020-07-29 2020-07-29 データ処理装置、データ処理方法及びプログラム

Country Status (2)

Country Link
JP (2) JP6810302B1 (ja)
WO (1) WO2022024262A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2019045909A (ja) * 2017-08-29 2019-03-22 株式会社マーケットヴィジョン 画像認識システム
JP2020047138A (ja) * 2018-09-21 2020-03-26 キヤノン株式会社 情報処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2019045909A (ja) * 2017-08-29 2019-03-22 株式会社マーケットヴィジョン 画像認識システム
JP2020047138A (ja) * 2018-09-21 2020-03-26 キヤノン株式会社 情報処理装置

Also Published As

Publication number Publication date
JPWO2022024262A1 (ja) 2022-02-03
JP2022027399A (ja) 2022-02-10
JP6810302B1 (ja) 2021-01-06

Similar Documents

Publication Publication Date Title
EP1483729B1 (en) Extracting text written on a check
US20060219773A1 (en) System and method for correcting data in financial documents
JPH06111056A (ja) 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法
CN102591596A (zh) 信息处理装置以及信息处理方法
JP2009520246A (ja) カスタマゼーションによらない書式データ抽出
JP2022125220A (ja) 画像処理装置、画像処理方法、プログラム
JP2003091694A (ja) 摘要を処理する方法
JP6980927B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6506652B2 (ja) 帳票読取装置、帳票読取方法および帳票読取システム
WO2022024262A1 (ja) データ処理装置、データ処理方法及びプログラム
US6108677A (en) Data processing apparatus
WO2022029874A1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
WO2019194052A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JP7021496B2 (ja) 情報処理装置及びプログラム
JP3915443B2 (ja) レセプト処理システム
JP6993032B2 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
WO2022038707A1 (ja) データ処理装置、データ処理方法及びプログラム
JP3766854B2 (ja) データ処理装置
WO2022097189A1 (ja) データ処理装置、データ処理方法及びプログラム
JP7111143B2 (ja) 画像処理装置、画像処理方法およびプログラム
JPH11219394A (ja) 財務諸表自動入力装置
WO2022049689A1 (ja) データ処理装置、データ処理方法及びプログラム
JP6858420B1 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
WO2022102065A1 (ja) データ処理装置、データ処理方法及びプログラム
WO2022054136A1 (ja) データ処理装置、データ処理方法及びプログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2020541623

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20947514

Country of ref document: EP

Kind code of ref document: A1