JP7393960B2 - Information processing device, information processing method, and program - Google Patents
Information processing device, information processing method, and program Download PDFInfo
- Publication number
- JP7393960B2 JP7393960B2 JP2020009944A JP2020009944A JP7393960B2 JP 7393960 B2 JP7393960 B2 JP 7393960B2 JP 2020009944 A JP2020009944 A JP 2020009944A JP 2020009944 A JP2020009944 A JP 2020009944A JP 7393960 B2 JP7393960 B2 JP 7393960B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- ocr
- unit
- paper
- sheets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 63
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000012545 processing Methods 0.000 claims description 186
- 238000000034 method Methods 0.000 claims description 146
- 238000007689 inspection Methods 0.000 claims description 23
- 238000012015 optical character recognition Methods 0.000 description 509
- 238000010586 diagram Methods 0.000 description 34
- 238000012360 testing method Methods 0.000 description 17
- 230000005540 biological transmission Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Description
本発明は、手形等の用紙の画像を読み込み、読み込んだ画像に対してOCRを行い、用紙に記載されている金額等の情報を取得する情報処理装置等に関するものである。 The present invention relates to an information processing apparatus and the like that reads an image of a paper such as a bill, performs OCR on the read image, and obtains information such as the amount written on the paper.
銀行等の金融機関では、例えば、各店において、顧客から受け取った手形や小切手等の用紙の束に関し、用紙の枚数と、各用紙に表記されている金額を合計した合計金額とを記入した帳票が作成され、当該用紙の束が帳票と共に事務センターに持ち込まれる。事務センターにおいては、持ち込まれた用紙の束に関し、用紙の枚数と合計金額とが再計算され、帳票に記入されている枚数および合計金額と照合される。 For example, in a financial institution such as a bank, each store has a form containing the number of sheets and the total amount written on each sheet regarding bundles of paper such as bills and checks received from customers. The bundle of paper is then brought to the office center along with the form. At the office center, the number of sheets and the total amount of the bundle of sheets brought in are recalculated and compared with the number of sheets and the total amount written on the form.
事務センターでは、上記のような事務作業の省力化のために、2以上の各用紙の画像をスキャナ等で読み込み、読み込んだ画像に対してOCRを行い、用紙に表記されている情報を取得する情報処理装置が用いられることがある。 At the administrative center, in order to save labor in the administrative work described above, images of two or more sheets are read in using a scanner, etc., and OCR is performed on the read images to obtain the information written on the sheets. An information processing device may be used.
この種の情報処理装置では、一般に、用紙の画像からOCRにより取得される情報は、OCRの精度の不足のため、当該用紙に表記されている情報と必ずしも一致せず、人によるチェックの手間を要する。 In this type of information processing device, the information obtained from the paper image by OCR generally does not necessarily match the information written on the paper due to the lack of accuracy of OCR, so it does not require the effort of human checking. It takes.
かかる手間を軽減するものとして、従来、一の画像に対して、2種類以上のOCRエンジンでOCR認識を行い、2以上の認識結果を取得し、当該2以上の認識結果の一致・不一致に基づいて、人によるチェックの対象となる用紙を絞り込むOCRシステムが存在した(例えば、特許文献1参照)。 In order to reduce this effort, conventional methods have been used to perform OCR recognition on one image using two or more types of OCR engines, obtain two or more recognition results, and based on the coincidence or mismatch of the two or more recognition results. Therefore, there has been an OCR system that narrows down the sheets to be checked by a person (for example, see Patent Document 1).
ただし、2種類以上のOCRエンジンでOCR認識を行う場合でも、各OCRエンジンでのOCRの精度が不足していれば、認識結果の不一致が多くなり、チェックの手間を効果的に低減することは困難である。このため、上記OCRシステムは、読み込んだ画像を第一のOCRエンジンにおいて補正し、補正後の画像を第一および第二の各OCRエンジンで認識することにより、各OCRエンジンでのOCRの精度を高めるようにしていた。 However, even when performing OCR recognition using two or more types of OCR engines, if the OCR accuracy of each OCR engine is insufficient, there will be many discrepancies in the recognition results, making it impossible to effectively reduce the effort of checking. Have difficulty. For this reason, the above OCR system corrects the read image in the first OCR engine, and recognizes the corrected image in each of the first and second OCR engines, thereby improving the accuracy of OCR in each OCR engine. I was trying to increase it.
しかし、上記のような補正によっても、OCRの精度を高めることには限界がある。 However, even with the above-described correction, there is a limit to increasing the accuracy of OCR.
そこで、OCRの精度の不足を補うことで、用紙に表記されている情報を的確に取得できる情報処理装置が所望される。 Therefore, there is a need for an information processing apparatus that can accurately acquire information written on paper by compensating for the lack of accuracy in OCR.
本第一の発明の情報処理装置は、2以上の各用紙に記載されている情報に対する統計処理結果である統計情報が格納される統計情報格納部と、2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付部と、2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCR部と、2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCR部と、統計情報と2以上の第一OCR情報と2以上の第二OCR情報とを用いて、2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定部と、決定部が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力部とを具備する情報処理装置である。 The information processing device of the first invention includes a statistical information storage unit that stores statistical information that is the result of statistical processing of information written on each of two or more sheets, and an image that is read from each of the two or more sheets. a paper image reception unit that receives a certain paper image; and a first OCR processing unit that performs first OCR processing on each of the two or more paper images and obtains two or more pieces of first OCR information that is information on a predetermined area. an OCR unit, a second OCR unit that performs second OCR processing on each of the two or more paper images and obtains two or more pieces of second OCR information that is information on a predetermined area; Using the above first OCR information and two or more second OCR information, a determining section determines correct OCR information that is OCR information corresponding to two or more sheets, and a determining section determines the correct OCR information, and The information processing apparatus includes an output section that outputs inspection information that is information regarding correct OCR information corresponding to each sheet.
かかる構成により、OCRの精度の不足を補うことで、用紙に表記されている情報を的確に取得できる。 With this configuration, the information written on the paper can be accurately acquired by compensating for the lack of accuracy in OCR.
また、本第二の発明の情報処理装置は、第一の発明に対して、統計情報は、2以上の各用紙に記載されている数値の和である情報処理装置である。 Further, the information processing apparatus of the second invention is different from the first invention to an information processing apparatus in which the statistical information is the sum of numerical values written on two or more sheets.
かかる構成により、OCRの精度の不足を簡単かつ効果的に補うことができる。 With this configuration, the lack of precision in OCR can be easily and effectively compensated for.
また、本第三の発明の情報処理装置は、第一または第二の発明に対して、用紙画像受付部は、2以上の各用紙に対して、2以上の異なる用紙画像を受け付け、第一OCR部は、2以上の各用紙ごとに、2以上の異なる各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得し、第二OCR部は、2以上の各用紙ごとに、2以上の異なる各用紙画像に対して、第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得し、決定部は、統計情報と4以上の第一OCR情報と4以上の第二OCR情報とを用いて、2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する情報処理装置である。 Further, in the information processing device of the third invention, in contrast to the first or second invention, the paper image receiving unit receives two or more different paper images for each of the two or more papers, and The OCR unit performs first OCR processing on two or more different paper images for each of the two or more papers, and obtains two or more pieces of first OCR information that is information on a predetermined area. , the second OCR unit performs second OCR processing on two or more different paper images for each of the two or more papers, and generates two or more second OCR information that is information on a predetermined area. The determination unit determines correct OCR information that is OCR information corresponding to each of the two or more sheets using the statistical information, four or more first OCR information, and four or more second OCR information. It is an information processing device.
かかる構成により、OCRの精度の不足を、より効果的に補うことができる。 With this configuration, the lack of accuracy in OCR can be compensated for more effectively.
また、本第四の発明の情報処理装置は、第一から第三いずれか1つの発明に対して、2以上の各用紙には、識別子が表出しており、第一OCR部または第二OCR部は、2以上の各用紙画像に対するOCR処理により、予め決められた領域から識別子を取得し、予め決められた特別処理を行う識別子である1以上の特別識別子が格納される特別識別子格納部と、第一OCR部または第二OCR部が取得した識別子が特別識別子であるか否かを判断する判断部と、判断部が特別識別子であると判断した識別子が表出した用紙に対して、予め決められた処理であり、決定部が正しいOCR情報を決定する決定処理の精度を高めるための処理である特別処理を行う特別処理部とをさらに具備する情報処理装置である。 Further, in the information processing device of the fourth invention, in contrast to any one of the first to third inventions, an identifier is exposed on each of two or more sheets, and The section includes a special identifier storage section that stores one or more special identifiers that are identifiers that acquire identifiers from predetermined areas through OCR processing on each of the two or more paper images and perform predetermined special processing. , a determination unit that determines whether the identifier acquired by the first OCR unit or the second OCR unit is a special identifier; and a determination unit that determines whether the identifier acquired by the first OCR unit or the second OCR unit is a special identifier; The information processing apparatus further includes a special processing unit that performs special processing that is a predetermined process and is a process for increasing the accuracy of the determination process in which the determination unit determines correct OCR information.
かかる構成により、特別識別子が表出している用紙に対してのみ特別処理を行うことで、処理負荷の増大を抑制しつつ、OCRの精度の不足を補うことができる。 With this configuration, by performing special processing only on sheets on which special identifiers are exposed, it is possible to compensate for the lack of accuracy in OCR while suppressing an increase in processing load.
本発明によれば、OCRの精度の不足を補うことで、に用紙に表記されている情報を的確に取得できる情報処理装置が実現される。 According to the present invention, by compensating for the lack of precision in OCR, an information processing device is realized that can accurately acquire information written on paper.
以下、情報処理装置等を含む情報システムの実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。 Hereinafter, embodiments of an information system including an information processing device and the like will be described with reference to the drawings. Note that in the embodiments, constituent elements with the same reference numerals perform similar operations, and therefore, repeated explanation may be omitted.
図1は、本実施の形態における情報処理システムのブロック図である。この情報処理システムは、情報処理装置1、および1または2以上の端末装置2を備える。情報処理装置1は、例えば、LANやインターネット等のネットワーク、無線または有線の通信回線などを介して、1以上の端末装置2の各々と通信可能に接続される。
FIG. 1 is a block diagram of an information processing system in this embodiment. This information processing system includes an
情報処理装置1は、例えば、銀行等の金融機関のサーバである。サーバは、例えば、金融機関内のサーバであるが、クラウドサーバやASPサーバ等でもよく、その所在やタイプは問わない。端末装置2は、例えば、金融機関内のPCであるが、携帯端末でもよく、その所在やタイプは問わない。携帯端末とは、ユーザによる携帯が可能な端末であり、例えば、タブレット端末、スマートフォン、ノートPC、携帯電話機等であるが、その種類は問わない。
The
ただし、情報処理装置1は、スタンドアロンでもよい。すなわち、本発明の情報処理方法は、例えば、一のPCでも実現可能であり、ハードウェア構成には依存しない。
However, the
なお、本実施の形態の金融機関でも、例えば、各店において、顧客から受け取った手形等の用紙の束に関し、用紙の枚数と、各用紙に表記されている金額を合計した合計金額とを記入した帳票が作成され、当該用紙の束が帳票と共に事務センターに持ち込まれる。事務センターにおいては、持ち込まれた用紙の束に関し、用紙の枚数と合計金額とが再計算され、帳票に記入されている枚数および合計金額と照合される。 In addition, in the financial institution of this embodiment, for example, in each store, regarding a bundle of papers such as bills received from a customer, the number of papers and the total amount written on each paper are written down. A form is created, and the bundle of papers is brought to the office center together with the form. At the office center, the number of sheets and the total amount of the bundle of sheets brought in are recalculated and compared with the number of sheets and the total amount written on the form.
情報システムは、事務センターでの上記のような事務作業の省力化のために用いられる。まず、基本的な動作として、情報処理装置1は、端末装置2を介して、2以上の各用紙の画像を読み込み、読み込んだ画像に対してOCRを行い、用紙に表記されている金額等の情報を含むOCR情報を取得する。
Information systems are used to save labor in the above-mentioned clerical work at administrative centers. First, as a basic operation, the
そして、特徴的な動作として、2以上の各用紙に記載されている情報に対する統計処理結果(例えば、合計金額)が記録媒体に格納されており、情報処理装置1は、2以上の各用紙ごとに、第一のOCR処理による第一OCR情報と、第二のOCR処理による第二OCR情報とを取得して、格納されている統計情報と、当該取得した、2以上の第一OCR情報および2以上の第二OCR情報とを用いて、正しいOCR情報を決定する。これにより、OCRの精度を高めなくても、用紙の記載情報と、用紙画像から取得したOCR情報との、人による照合の手間が、効果的に軽減される。
As a characteristic operation, the statistical processing results (for example, the total amount) for the information written on each of two or more sheets are stored in the recording medium, and the
情報処理装置1は、格納部11、受付部12、処理部13、および出力部14を備える。格納部11は、統計情報格納部111、および特別識別子格納部112を備える。受付部12は、用紙画像受付部121を備える。処理部13は、第一OCR部131、第二OCR部132、決定部133、判断部134、および特別処理部135を備える。
The
端末装置2は、端末格納部21、端末受付部22、端末処理部23、端末送信部24、端末受信部25、および端末出力部26を備える。
The
情報処理装置1を構成する格納部11は、各種の情報を格納し得る。各種の情報とは、例えば、後述する統計情報、後述する特別識別子などである。なお、その他の情報については、適時説明する。
The
統計情報格納部111には、1または2以上の統計情報が格納される。統計情報とは、2以上の各用紙に記載されている情報に対する統計処理結果である。 The statistical information storage unit 111 stores one or more pieces of statistical information. Statistical information is the result of statistical processing of information written on two or more sheets.
用紙とは、例えば、手形、または小切手であるが、その種類は問わない。手形は、例えば、約束手形、または為替手形であるが、その種類は問わない。また、用紙は、例えば、伝票でもよい。伝票は、例えば、入金伝票、出金伝票、払出伝票などであるが、その種類は問わない。 The paper may be, for example, a bill or a check, but its type does not matter. The bill is, for example, a promissory note or a bill of exchange, but the type does not matter. Further, the paper may be, for example, a slip. The slip may be, for example, a deposit slip, a withdrawal slip, a payout slip, etc., but the type thereof does not matter.
用紙に記載されている情報とは、例えば、数値である。数値は、通常、金額である。また、用紙には、通常、数値以外の情報も記載されている。数値以外の情報とは、例えば、振出人名、受取人名、種類情報などである。振出人名とは、手形等の用紙を振り出した振出人の名称である。振出人は、通常、会社であるが、会社の役員等でもよい。受取人名は、手形等の用紙に記載されている金額を受け取る受取人の名称である。受取人もまた、通常、会社であるが、個人でもよい。種類情報とは、用紙の種類を示す情報である。種類情報は、例えば、“約束手形”、“小切手”、“伝票”などであるが、その形式は問わない。 The information written on the paper is, for example, a numerical value. The numerical value is usually a monetary amount. In addition, information other than numerical values is usually written on the paper. Information other than numerical values includes, for example, the name of the sender, the name of the recipient, and type information. The name of the drawer is the name of the drawer who issued the paper such as a bill. The drawer is usually a company, but may also be an officer of the company. The beneficiary name is the name of the beneficiary who receives the amount written on paper such as a bill. The recipient is also typically a company, but may also be an individual. Type information is information indicating the type of paper. The type information includes, for example, "promissory note," "cheque," "slip," etc., but the format does not matter.
統計処理結果とは、統計処理の結果である。統計処理とは、統計に関する処理である。統計処理は、通常、2以上の各用紙に記載されている数値の和を求める処理である。数値の和とは、2以上の数値を合計した合計値である。数値の和は、例えば、2以上の金額を合計した合計金額であるが、金額以外の数値の合計でもよい。 The statistical processing result is the result of statistical processing. Statistical processing is processing related to statistics. Statistical processing is usually a process of calculating the sum of numerical values written on two or more sheets. The sum of numerical values is the sum of two or more numerical values. The sum of numerical values is, for example, the total amount of two or more amounts, but may be the sum of numerical values other than amounts.
ただし、統計処理は、例えば、2以上の各用紙に記載されている数値の代表値を求める処理などでもよく、統計に関する処理であれば、その種類は問わない。代表値とは、2以上の数値を代表する値である。代表値は、例えば、平均値であるが、最大値や中央値などでもよく、その種類は問わない。 However, the statistical processing may be, for example, processing to obtain representative values of numerical values written on each of two or more sheets, and any type of processing may be used as long as it is related to statistics. A representative value is a value that represents a numerical value of 2 or more. The representative value is, for example, an average value, but may also be a maximum value, a median value, etc., and its type does not matter.
統計情報には、通常、店識別子が対応付いている。店識別子とは、店を識別する情報である。店とは、例えば、金融機関の本店または1以上の各支店であるが、その種類は問わない。店識別子は、例えば、店番号、支店名等であるが、店を識別し得る情報であれば何でもよい。また、統計情報には、通常、枚数情報も対応付いている。枚数情報とは、用紙の枚数を示す情報である。なお、店識別子および枚数情報は、通常、統計情報格納部111に格納されているが、その所在は問わない。 Statistical information is usually associated with a store identifier. A store identifier is information that identifies a store. A store is, for example, a head office or one or more branches of a financial institution, but the type thereof does not matter. The store identifier is, for example, a store number, a branch name, etc., but any information that can identify the store may be used. Further, the statistical information is usually associated with sheet count information. The number of sheets information is information indicating the number of sheets of paper. Note that the store identifier and the number of sheets information are normally stored in the statistical information storage section 111, but their location does not matter.
統計情報は、例えば、合計金額等の統計処理結果が記入された帳票から、後述するOCR処理によって自動的に取得された情報であるが、帳票を基にユーザが入力した情報でもよい。 The statistical information is, for example, information automatically acquired by OCR processing, which will be described later, from a form in which statistical processing results such as the total amount are entered, but it may also be information input by the user based on the form.
また、2以上の各用紙の表面には、識別子が表出している。ここでいう識別子とは、後述する特別処理の対象か否かの判断に用いられる情報である。識別子は、通常、振出人を識別する情報である。振出人を識別する情報は、例えば、前述した振出人名である。ただし、振出人を識別する情報は、例えば、口座番号や電話番号等でもよく、振出人を識別し得る情報であれば何でもよい。 Furthermore, an identifier is exposed on the surface of each of the two or more sheets. The identifier here is information used to determine whether or not the object is subject to special processing, which will be described later. The identifier is usually information that identifies the issuer. The information for identifying the issuer is, for example, the issuer's name described above. However, the information for identifying the payer may be, for example, an account number, a telephone number, etc., or any information that can identify the payer.
表出することは、例えば、用紙に対して、識別子が予め印刷されていることでもよいし、識別子がプリンタ等で追記されることでもよいし、識別子が手書きされることでもよい。 For example, the expression may be such that the identifier is printed on the paper in advance, the identifier may be added using a printer, or the identifier may be handwritten.
各用紙からは、OCR処理によって、例えば、振出人名等の識別子も自動的に取得されることは好適である。 It is preferable that an identifier such as the payer's name be automatically acquired from each paper by OCR processing.
特別識別子格納部112には、1または2以上の特別識別子が格納される。特別識別子とは、特別処理を行うことを示す情報である。特別識別子は、通常、振出人名である。特別処理とは、特別識別子が表出している用紙に対してのみ行われる、予め決められた特別な処理である。特別処理は、例えば、決定部133による決定処理の精度を高めるための処理である。なお、特別処理の詳細、および決定処理については後述する。
The special
受付部12は、各種の情報を受け付ける。各種の情報とは、例えば、後述する用紙画像である。また、受付部12は、各種の指示も受け付け得る。なお、各種の指示については、具体例で説明する。
The
受付部12による受け付けは、通常、端末装置2から送信された情報の受信であるが、例えば、キーボードやタッチパネル等の入力デバイスから入力された情報の受け付け、スキャナやカメラ等の光学読取デバイスを介して読み取られた情報の受け付け、ディスクや半導体メモリなどの記録媒体から読み出された情報の受け付けなどでもよい。
The
用紙画像受付部121は、用紙画像を受け付ける。用紙画像受付部121による受け付けは、通常、端末装置2から送信された用紙画像の受信であるが、例えば、光学読取デバイスを介して読み取られた用紙画像の受け付けでもよいし、記録媒体から読み出された用紙画像の受け付けでもよい。
The paper
用紙画像とは、2以上の各用紙を読み込んだ画像である。具体的には、例えば、2以上の各用紙が手形であり、そのうち1枚目(以下、用紙1)に、金額“¥1,000※”および振出人名“BBホールディングス”などの情報が記載され、2枚目の用紙(用紙2)には、金額“¥2,000※”および振出人名“AA株式会社”などの情報が記載されている。この場合、用紙画像受付部121は、まず、用紙1をスキャナ等で読み取った画像(以下、用紙画像1)を受け付け、次に、用紙2を読み取った画像(以下、用紙画像2)を受け付ける。
A paper image is an image obtained by reading two or more sheets. Specifically, for example, two or more sheets are each a bill, and the first sheet (hereinafter referred to as sheet 1) contains information such as the amount "¥1,000*" and the name of the drawer "BB Holdings." On the second sheet (Paper 2), information such as the amount "¥2,000*" and the name of the payer "AA Corporation" are written. In this case, the paper
用紙画像受付部121は、例えば、2以上の各用紙に対して、2以上の異なる用紙画像を受け付けてもよい。
For example, the paper
異なる用紙画像とは、通常、一の用紙を2以上の異なる形式で読み取った画像である。異なる形式とは、例えば、JPEG、TIF、GIF、BMP等の形式であるが、その種類は問わない。 Different paper images are usually images obtained by reading one paper in two or more different formats. The different formats include, for example, JPEG, TIF, GIF, BMP, etc., but the types are not limited.
具体的には、例えば、用紙1に対して、JPEGおよびTIFの2つの形式で読み取りが行われ、用紙画像受付部121は、JPEG形式で読み取った画像(以下、用紙画像1J)と、TIF形式で読み取った画像(以下、用紙画像1T)との、2種類の画像を受け付けてもよい。同様に、用紙2に対して、JPEGおよびTIFの2つの形式で読み取りが行われ、用紙画像受付部121は、JPEG形式で読み取った画像(以下、用紙画像2J)と、TIF形式で読み取った画像(以下、用紙画像2T)との、2種類の画像を受け付けてもよい。
Specifically, for example,
なお、異なる用紙画像は、例えば、一の用紙を二度読みした画像でもよい。二度読みとは、一の用紙を、同じ形式で2回以上、読み取ることである。同じ用紙を同じ形式で読み取っても、各用紙画像から取得される情報は、常に同じとは限らない(例えば、OCRの結果に揺らぎが生じる)からである。 Note that the different paper images may be, for example, images obtained by reading one paper twice. Double reading refers to reading one sheet of paper two or more times in the same format. This is because even if the same paper is read in the same format, the information obtained from each paper image is not always the same (for example, fluctuations occur in the OCR results).
具体的には、例えば、用紙1に対して、同じ形式(例えば、JPEG形式)で2回読み取りが行われ、用紙画像受付部121は、1回目に読み取られた画像(以下、用紙画像11)と、2回目に読み取られた画像(以下、用紙画像12)との、2種類の画像を受け付けてもよい。同様に、用紙2に対して、同じ形式で2回読み取りが行われ、用紙画像受付部121は、1回目に読み取られた画像(以下、用紙画像21)と、2回目に読み取られた画像(以下、用紙画像22)との、2種類の画像を受け付けてもよい。
Specifically, for example,
なお、m枚の各用紙ごとに一の用紙画像を受け付ける場合、後述する一致・不一致の組み合わせは、(2のm乗)通りである。また、m枚の各用紙ごとに、n個の用紙画像を受け付ける場合、一致・不一致の組み合わせは、{(2のm乗)×n}通りとなる。 Note that when one sheet image is received for each of m sheets, there are (2 to the power of m) combinations of matches and mismatches, which will be described later. Further, when n paper images are received for each of m sheets, there are {(2 to the power of m)×n} combinations of matches and mismatches.
処理部13は、各種の処理を行う。各種の処理とは、例えば、第一OCR部131、第二OCR部132、決定部133、判断部134、および特別処理部135などの処理である。また、処理部13は、例えば、フローチャートで説明する各種の判別なども行う。なお、その他の処理については適時説明する。
The
第一OCR部131は、2以上の各用紙画像に対して、第一のOCR処理を行い、2以上の第一OCR情報を取得する。
The
OCR処理とは、用紙画像に対して、予め決められた領域からの画像の切り出し、当該切り出した画像の予め準備されたパターンとの照合などの処理を行うことにより、1または2以上の文字の配列(以下、文字列)を特定し、当該特定した文字列に対応する1または2以上の文字コードの配列(以下、文字コード列)を取得する処理である、といってもよい。 OCR processing involves processing a paper image by cutting out an image from a predetermined area and comparing the cut out image with a pre-prepared pattern. It can be said that this is a process of identifying an array (hereinafter referred to as a character string) and acquiring an array of one or more character codes (hereinafter referred to as a character code string) corresponding to the identified character string.
予め決められた領域は、例えば、数値(例えば、金額)が記載される領域であるが、数値以外の情報(例えば、振出人名)が記載される領域でもよく、その種類は問わない。各種の領域には、通常、項目名が対応付いている。項目名とは、当該領域に記載される情報の種類を示す情報である。項目名は、例えば、“金額”や“振出人”等であるが、項目名が示す情報の種類は問わない。 The predetermined area is, for example, an area where a numerical value (for example, an amount of money) is written, but it may also be an area where information other than numerical values (for example, the payer's name) is written, and the type thereof does not matter. Item names are usually associated with each type of area. The item name is information indicating the type of information written in the area. The item name is, for example, "amount" or "payer", but the type of information indicated by the item name does not matter.
なお、予め決められた領域は、例えば、用紙画像から項目名を検出することによって特定されるが、位置情報によって特定されてもよい。位置情報とは、用紙画像内における領域の位置に関する情報である。位置情報は、例えば、(x1,y1),(x2,y2)といった、始点および終点を示す2つの座標の組であるが、その形式は問わない。 Note that the predetermined area is specified, for example, by detecting the item name from the paper image, but may also be specified using position information. Position information is information regarding the position of an area within a paper image. The position information is, for example, a set of two coordinates indicating a starting point and an ending point, such as (x1, y1) and (x2, y2), but its format does not matter.
第一のOCR処理とは、第一の方式によるOCR処理である。なお、これに対して、後述する第二のOCR処理は、第二の方式によるOCR処理である。方式とは、OCRを実現するプログラムである、といってもよい。従って、第一の方式と第二の方式の違いは、通常、OCRを実現するプログラムの違いである。ただし、第一の方式と第二の方式の違いは、例えば、アルゴリズムの差異でもよい。アルゴリズムの差異とは、例えば、画像切り出しやパターン照合等の処理を実現するアルゴリズムの差異、切り出しの位置の差異、予め準備されたパターンの差異等であるが、その種類は問わない。 The first OCR processing is OCR processing using the first method. In contrast, the second OCR process to be described later is an OCR process based on the second method. The method can be said to be a program that implements OCR. Therefore, the difference between the first method and the second method is usually a difference in the program that implements OCR. However, the difference between the first method and the second method may be, for example, a difference in algorithm. Differences in algorithms include, for example, differences in algorithms for implementing processes such as image cropping and pattern matching, differences in cropping positions, and differences in patterns prepared in advance, but the type does not matter.
第一OCR情報とは、2以上の各用紙画像に対する第一のOCR処理により、当該用紙画像の予め決められた領域から取得される情報である。第一OCR情報は、例えば、用紙の予め決められた領域に記載されている文字列に対応するコード列である。 The first OCR information is information obtained from a predetermined area of the paper image by first OCR processing on each of two or more paper images. The first OCR information is, for example, a code string corresponding to a character string written in a predetermined area of a sheet of paper.
なお、第一OCR部131に関する上記各事項は、OCR処理の方式の違いを除いて、後述する第二OCR部132にも当てはまる。
Note that the above-mentioned matters regarding the
詳しくは、第一OCR部131は、例えば、用紙画像1に対して、第一のOCR処理を行い、金額および振出人名等の情報を含む第一OCR情報“1000円,A株式会社,・・・”を取得する。同様に、第一OCR部131は、用紙画像2に対して、第一のOCR処理を行い、金額および振出人名等の情報を含む第一OCR情報“500円,B株式会社,・・・”を取得する。
Specifically, the
第一OCR部131は、2以上の各用紙ごとに、用紙画像受付部121が受け付けた2以上の異なる各用紙画像に対して、第一のOCR処理を行い、2以上の第一OCR情報を取得してもよい。
The
具体的には、例えば、用紙1について、第一OCR部131は、JPEG形式で読み取られた用紙画像1Jに対し、第一のOCR処理を行い、第一OCR情報“1000円,A株式会社,・・・”を取得すると共に、TIF形式で読み取られた用紙画像1Tに対しても、第一のOCR処理を行い、第一OCR情報“1000円,A株式会社,・・・”を取得する。
Specifically, for example, for
同様に、用紙2について、第一OCR部131は、JPEG形式で読み取られた用紙画像2Jに対して、第一のOCR処理を行い、第一OCR情報“500円,B株式会社,・・・”を取得すると共に、TIF形式で読み取られた用紙画像2Jに対しても、第一のOCR処理を行い、第一OCR情報“500円,B株式会社,・・・”を取得してもよい。
Similarly, regarding the
なお、こうして、一の用紙を2以上の異なる形式で読み取った各用紙画像から取得される2以上の第一OCR情報は、必ずしも一致するとは限らない。例えば、用紙1について、用紙画像1Jから第一OCR情報“1000円”が取得される一方、用紙画像1Tから第一OCR情報“1001円”が取得され、用紙2については、用紙画像2Jから第一OCR情報“500円”が取得され、用紙画像2Tからも第一OCR情報“500円”が取得される場合もあり得る。
Note that the two or more pieces of first OCR information obtained from each paper image obtained by reading one paper in two or more different formats do not necessarily match. For example, for
または、用紙1について、第一OCR部131は、1回目に読み取られた用紙画像11に対し、第一のOCR処理を行い、第一OCR情報“1000円,A株式会社,・・・”を取得すると共に、2回目に読み取られた用紙画像12に対しても、第一のOCR処理を行い、第一OCR情報“1000円,A株式会社,・・・”を取得してもよい。
Alternatively, regarding the
同様に、用紙2について、第一OCR部131は、1回目に読み取られた用紙画像21に対して、第一のOCR処理を行い、第一OCR情報“500円,B株式会社,・・・”を取得すると共に、2回目に読み取られた用紙画像22に対しても、第一のOCR処理を行い、第一OCR情報“500円,B株式会社,・・・”を取得してもよい。
Similarly, regarding the
なお、こうして、一の用紙を2回以上読み取った各用紙画像から取得される2以上の第一OCR情報もまた、必ずしも一致するとは限らない。例えば、用紙1について、用紙画像11から第一OCR情報“1000円”が取得され、用紙画像12からも第一OCR情報“1000円”が取得され、用紙2については、用紙画像21から第一OCR情報“505円”が取得される一方、用紙画像22から第一OCR情報“500円”が取得される場合もあり得る。
Note that the two or more pieces of first OCR information obtained from each paper image obtained by reading one paper twice or more do not necessarily match. For example, for
第二OCR部132は、2以上の各用紙画像に対して第二のOCR処理を行い、2以上の第二OCR情報を取得する。
The
第二のOCR処理とは、第二の方式によるOCR処理である。第二の方式は、通常、第一の方式とは異なる方式である。なお、第一の方式と第二の方式との違いについては、前述したので繰り返さない。 The second OCR processing is OCR processing using the second method. The second method is typically a different method than the first method. Note that the difference between the first method and the second method has been described above, so it will not be repeated.
第二OCR部132による第二のOCR処理の対象は、通常、第一OCR部131による第一のOCR処理の対象と共通である。つまり、用紙画像受付部121が受け付けた2以上の用紙画像の各々に対して、第一OCR部131による第一のOCR処理と、第二OCR部132による第二のOCR処理とが行われる。ただし、受け付けられた2以上の用紙画像の中には、第一のOCR処理または第二のOCR処理のどちらか一方しか行われない用紙画像が含まれていてもよい。
The target of the second OCR process by the
第二OCR情報とは、2以上の各用紙画像に対する第二のOCR処理により、当該用紙画像の予め決められた領域から取得される情報である。 The second OCR information is information obtained from a predetermined area of the paper image by performing second OCR processing on each of two or more paper images.
なお、第二OCR情報に関する予め決められた領域は、通常、第一OCR情報に関する予め決められた領域と同じ領域であり、従って、一の用紙に対する第一および第二の2つのOCR処理によって、基本的には、同じ2つのコード列が取得される。つまり、一の用紙内の同じ領域(例えば、金額等の数値が記載される領域:以下、第一領域)から取得される第一OCR情報と第二OCR情報は、通常、一致する。 Note that the predetermined area regarding the second OCR information is usually the same area as the predetermined area regarding the first OCR information. Basically, the same two code strings are obtained. That is, the first OCR information and the second OCR information obtained from the same area (for example, an area where a numerical value such as an amount of money is written: hereinafter referred to as the first area) within one sheet usually match.
ただし、一の用紙内の第一領域から取得される第一OCR情報と第二OCR情報であっても、OCRの精度によっては、必ずしも一致するとは限らない。例えば、用紙画像1の第一領域から、第一OCR情報“1000円”と第二OCR情報“1000円”が取得され、用紙画像2の第一領域からは、第一OCR情報“500円”と第二OCR情報“501円”が取得される場合もあり得る。
However, even if the first OCR information and the second OCR information obtained from the first area within one sheet of paper do not necessarily match, depending on the accuracy of OCR. For example, from the first area of
第二OCR部132もまた、例えば、2以上の各用紙ごとに、2以上の異なる各用紙画像に対して、第二のOCR処理を行い、2以上の第二OCR情報を取得してもよい。なお、この処理は、第一OCR部131が、2以上の各用紙ごとに、2以上の異なる各用紙画像に対して、第一のOCR処理を行い、2以上の第一OCR情報を取得した処理と同様であり、説明を省略する。
The
決定部133は、決定処理を行う。決定処理とは、統計情報格納部111に格納されている統計情報と、第一OCR部131が取得した2以上の第一OCR情報と、第二OCR部132が取得した2以上の第二OCR情報とを用いて、2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する処理である。
The determining
ここで、2以上の第一OCR情報とは、2以上の各用紙ごとに、用紙画像受付部121が受け付けた2以上の各用紙画像に対して、第一OCR部131が第一のOCR処理を行うことにより取得した情報である。同様に、2以上の第二OCR情報とは、当該2以上の各用紙ごとに、用紙画像受付部121が受け付けた2以上の各用紙画像に対して、第二OCR部132が第二のOCR処理を行うことにより取得した情報である。
Here, two or more first OCR information means that the
正しいOCR情報とは、第一OCR情報または第二OCR情報のうち、用紙に記載されている情報と一致する情報である。正しいOCR情報は、例えば、“第一OCR情報”、“第二OCR情報”、または“第一OCR情報および第二OCR情報”のいずれかであるが、ID等でもよく、その形式は問わない。 Correct OCR information is information that matches the information written on the paper, out of the first OCR information or the second OCR information. The correct OCR information is, for example, "first OCR information", "second OCR information", or "first OCR information and second OCR information", but it may also be an ID, etc., and its format does not matter. .
決定部133は、統計情報と2以上の第一OCR情報と2以上の第二OCR情報とを用いて、2以上の各用紙ごとに、例えば、以下の手順で、正しいOCR情報を決定する。
The determining
すなわち、決定部133は、例えば、M枚(ただし、Mは2以上の整数)の各用紙ごとに、当該用紙を読み取った用紙画像から取得された第一のOCR情報と第二のOCR情報が、一致するか否かを判別する。また、決定部133は、例えば、M枚の用紙のうち、一致しないと判別した用紙の数(以下、不一致用紙数m:mは0以上の整数)も取得して、不一致用紙数mが1以上か否かをさらに判別する。
That is, the determining
そして、不一致用紙数mが1以上であると判別された場合、決定部133は、M枚の各用紙について、正しいOCR情報が、“第一OCR情報”、“第二OCR情報”、または“第一OCR情報および第二OCR情報”のうちどれであるかを、次のように決定する。
Then, if it is determined that the number m of mismatched sheets is 1 or more, the
つまり、第一OCR情報と第二OCR情報とが、(1)一致する用紙については、“第一OCR情報および第二OCR情報”に決定され、(2)一致しないm枚の用紙については、一致・不一致の可能な組み合わせ(すなわち、2のm乗通り)のうち、当該組み合わせを基に取得される統計情報(例えば、合計金額)が、格納されている統計情報(例えば、合計金額)と一致する組み合わせに対応するもの、に決定される。 In other words, the first OCR information and the second OCR information are (1) determined to be "first OCR information and second OCR information" for sheets that match, and (2) for m sheets of paper that do not match, Among the possible combinations of matches and mismatches (i.e., 2 to the m power), the statistical information obtained based on the combination (e.g., total amount) is the same as the stored statistical information (e.g., total amount). The one corresponding to the matching combination is determined.
なお、不一致用紙数mが0であると判別された場合は、M枚のどの用紙についても、“第一OCR情報および第二OCR情報”に決定される。 Note that if it is determined that the number m of mismatched sheets is 0, the "first OCR information and second OCR information" are determined for any of the M sheets.
また、統計情報と2以上の第一OCR情報と2以上の第二OCR情報とを用いた決定処理の詳細は、フローチャートおよび具体例で説明する。 Further, details of the determination process using statistical information, two or more first OCR information, and two or more second OCR information will be explained with a flowchart and a specific example.
または、決定部133は、例えば、統計情報格納部111に格納されている統計情報と、第一OCR部131が取得した4以上の第一OCR情報と、第二OCR部132が取得した4以上の第二OCR情報とを用いて、2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定してもよい。
Alternatively, the determining
ここで、4以上の第一OCR情報とは、2以上の各用紙ごとに、用紙画像受付部121が受け付けた2以上の異なる各用紙画像に対して、第一OCR部131が第一のOCR処理を行うことにより取得した情報である。同様に、4以上の第二OCR情報とは、当該2以上の各用紙ごとに、用紙画像受付部121が受け付けた2以上の異なる各用紙画像に対して、第二OCR部132が第二のOCR処理を行うことにより取得した情報である。
Here, the first OCR information of four or more means that the
なお、統計情報と4以上の第一OCR情報と4以上の第二OCR情報とを用いた決定処理は、統計情報と2以上の第一OCR情報と2以上の第二OCR情報とを用いた決定処理(前述)に対し、上記(1)および(2)が、例えば、下記(1a)および(1b)に変更される点を除いて、基本的に同様である。 Note that the determination process using statistical information, 4 or more first OCR information, and 4 or more second OCR information uses statistical information, 2 or more first OCR information, and 2 or more second OCR information. The process is basically the same as the determination process (described above) except that (1) and (2) above are changed to, for example, (1a) and (1b) below.
つまり、M枚の各用紙に対し、n個(ただし、nは2以上の整数)の異なる用紙画像が受け付けられるとして、第一OCR部131は、当該n個の異なる各用紙画像に対して、第一のOCR処理を行い、n個の第一OCR情報を取得し、当該n個の第一OCR情報を格納部11に蓄積する一方、第二OCR部132は、当該n個の異なる各用紙画像に対して、第二のOCR処理を行い、n個の第二OCR情報を取得し、当該n個の第二OCR情報を上記n個の第一OCR情報に対応付けて格納部11に蓄積する。これにより、格納部11には、M枚の各用紙ごとに、第一OCR情報と第二OCR情報との対(以下、「対情報」と記す場合がある)がn個、格納される。
In other words, assuming that n different paper images (where n is an integer of 2 or more) are accepted for each of M sheets, the
そして、第一OCR部131は、M枚の各用紙ごとに、n個の対情報の中に、第一OCR情報と第二OCR情報とが一致する対情報が、(1a)1つでも存在する用紙については、“第一OCR情報および第二OCR情報”に決定され、(2a)1つも存在しない用紙については、一致・不一致の可能な組み合わせ(すなわち、{(2のm乗)×n}通り)のうち、当該組み合わせを基に取得される統計情報(例えば、合計金額)が、格納されている統計情報(例えば、合計金額)と一致する組み合わせに対応するもの、に決定される。
Then, for each of the M sheets, the
判断部134は、第一OCR部131または第二OCR部132が取得した識別子が特別識別子であるか否かを判断する。判断部134は、取得された識別子が、例えば、特別識別子格納部112に格納されている1以上のいずれかの特別識別子と一致する場合に、特別識別子であると判断する。
The determining
なお、金額等の情報に関する一致は、通常、完全一致であるが、識別子に関する一致は、必ずしも完全一致でなくてもよい。識別子に関する一致は、例えば、識別子を構成する1または2以上の文字のうち、一致する文字の数または割合が、閾値を超える又は閾値以上であることでもよい。 Note that although a match regarding information such as an amount is usually a perfect match, a match regarding an identifier does not necessarily have to be a perfect match. A match regarding an identifier may be, for example, that the number or proportion of matching characters among one or more characters constituting the identifier exceeds a threshold value or is equal to or greater than a threshold value.
特別処理部135は、判断部134が特別識別子であると判断した識別子が表出した1または2以上の各用紙に対して、予め決められた特別処理を行う。特別処理とは、前述したように、特別識別子が表出している用紙に対してのみ行われる特別な処理であり、例えば、決定部133による決定処理の精度を高めるための処理である。
The
特別処理は、具体的には、例えば、前述したような、一の用紙に対して2以上の異なる用紙画像を受け付ける処理であってもよい。異なる用紙画像は、前述したように、例えば、一の用紙を異なる形式で読み取った画像であるが、一の用紙を同じ形式で二度読みした画像でもよい。すなわち、特別処理部135は、判断部134が特別識別子であると判断した識別子が表出した1以上の各用紙に対してのみ、例えば、JPEG形式およびTIF形式等の2以上の異なる用紙画像を受け付ける特別処理を行い、それ以外の用紙に対しては、かかる特別処理を行わず、例えば、JPEG等の一の形式の画像のみを受け付ける通常の受け付け処理を行うことは好適である。
Specifically, the special process may be, for example, a process of accepting two or more different paper images for one paper, as described above. As described above, the different paper images are, for example, images obtained by reading one paper in different formats, but may also be images obtained by reading one paper twice in the same format. That is, the
なお、特別処理は、例えば、受け付けられた一の用紙画像の形式を別の形式に変換すること(例えば、JPEG形式からTIF形式やGIF形式への変換等)により、2以上の異なる用紙画像を取得する処理でもよい。 Note that special processing can be used to convert two or more different paper images by, for example, converting the format of one received paper image into another format (for example, converting from JPEG format to TIF format or GIF format). It may also be a process of acquiring it.
または、特別処理は、例えば、第一または第二の少なくとも一方のOCR処理の精度を高める処理でもよく、結果として、決定部133による決定処理の精度が高まる処理であれば、その種類は問わない。
Alternatively, the special process may be, for example, a process that increases the accuracy of at least one of the first or second OCR process, and any type of special process may be used as long as it increases the accuracy of the determination process by the
なお、OCR処理の精度を高める処理とは、例えば、より高い解像度の用紙画像を受け付ける処理、受け付けた用紙画像を補正する処理などであるが、結果として、OCR処理の精度が高まる処理であれば、その種類は問わない。 Processing that increases the accuracy of OCR processing includes, for example, processing that accepts paper images with higher resolution, processing that corrects accepted paper images, etc., but any processing that increases the accuracy of OCR processing as a result , the type does not matter.
判断部134が特別識別子であると判断した識別子が表出した1または2以上の各用紙に対してのみ、特別処理部135が上記のような特別処理を行うことによって、決定部133による決定処理の精度を、処理負荷の増大を抑制しつつ、高めることができる。
The
具体的には、特別識別子が、例えば、誤認識が生じ易い手形等の用紙を多く振り出す振出人の振出人名(例えば、「AA株式会社」等)である場合、特別識別子である振出人名が表出した用紙に対して特別処理が行われることで、誤認識の発生が抑制される。他方、特別識別子でない振出人名(例えば、「BBホールディングス」等)が表出した用紙に対しては、特別処理が行われることはないので、処理負荷の増大が抑制される。 Specifically, if the special identifier is, for example, the drawer name of a drawer who issues a large number of papers such as bills that are likely to be misrecognized (e.g., "AA Co., Ltd."), the drawer name that is the special identifier is By performing special processing on the exposed paper, the occurrence of erroneous recognition is suppressed. On the other hand, no special processing is performed on sheets with a payer's name that is not a special identifier (for example, "BB Holdings", etc.), so an increase in processing load is suppressed.
出力部14は、各種の情報を出力する。各種の情報とは、例えば、後述する検査情報である。出力部14による出力は、通常、ディスプレイへの表示であるが、例えば、プリンタでのプリントアウト、スピーカーからの音出力、他の処理装置や他のプログラムなどへの処理結果の引渡し、記録媒体への蓄積、外部の装置への送信などでもよく、その態様は問わない。
The
検査情報とは、決定部133が決定した、2以上の各用紙に対応する正しいOCR情報に関する情報である。検査情報は、例えば、用紙識別子と、正しいOCR情報との組(以下、組情報)の集合であってもよい。用紙識別子とは、用紙を識別する情報である。用紙識別子は、例えば、“0001”や“0002”等の番号であるが、“1枚目”や“2枚目”等でもよく、用紙を識別し得る情報であれば何でもよい。
The inspection information is information regarding correct OCR information corresponding to two or more sheets determined by the
なお、組情報は、例えば、正しいOCR情報に対応する情報も有していてもよく、その形式は問わない。対応する情報とは、例えば、正しいOCR情報が“第kOCR情報”(ただし、kは自然数)である場合は、“第kOCR情報”に対応する第kのOCR処理によって取得された、金額等の数値である。正しいOCR情報に対応する情報は、通常、用紙に記載されている情報と一致する。 Note that the set information may also include, for example, information corresponding to correct OCR information, and its format does not matter. For example, when the correct OCR information is "k-th OCR information" (k is a natural number), the corresponding information is the amount of money, etc. obtained by the k-th OCR process corresponding to "k-th OCR information". It is a numerical value. Information corresponding to correct OCR information usually matches the information written on the paper.
また、出力部14は、例えば、前述したm枚の不一致用紙について、正しいOCR情報が得られなかった場合に、当該m枚の不一致用紙の用紙識別子群を出力することは好適である。これによって、ユーザは、出力された用紙識別子群に対応する1以上の各用紙についてのみ、効率よくチェックが行える。
Further, it is preferable that the
端末装置2を構成する端末格納部21は、各種の情報を格納し得る。各種の情報とは、例えば、端末識別子である。端末識別子とは、端末装置2を識別する情報である。端末識別子は、例えば、MACアドレスやIPアドレス等のアドレス、電話番号、IDなどであるが、端末装置2のユーザを識別するユーザ識別子でもよく、端末装置2を識別し得る情報であれば何でもよい。ユーザ識別子は、例えば、メールアドレス、電話番号、住所・氏名、IDなどであるが、端末装置2のユーザを識別し得る情報であれば何でもよい。
The
端末受付部22は、各種の情報を受け付ける。各種の情報とは、例えば、前述した用紙画像である。例えば、スキャナやカメラ等の光学読み込みデバイスを介して、2以上の各用紙の画像が読み込まれ、端末受付部22は、当該読み込まれた2以上の各用紙画像を受け付ける。
The
なお、読み込まれた2以上の各用紙画像は、例えば、端末格納部21に蓄積され、端末受付部22は、端末格納部21に格納されている2以上の用紙画像(以下、用紙画像群)を一括的に受け付けてもよい。
Note that the two or more read paper images are stored in, for example, the
端末処理部23は、各種の処理を行う。各種の処理とは、例えば、フローチャートで説明する各種の判別などである。また、端末処理部23は、例えば、受け付けられた情報の、送信される情報への変換なども行う。
The
端末送信部24は、各種の情報を送信する。各種の情報とは、例えば、用紙画像などである。端末送信部24は、例えば、端末受付部22が受け付けた2以上の各用紙画像を、端末格納部21に格納されている端末識別子と対に、情報処理装置1に送信する。
The
端末受信部25は、各種の情報を受信する。各種の情報とは、例えば、前述した検査結果、前述した用紙識別子群などである。端末受信部25は、例えば、端末送信部24が2以上の用紙画像等を情報処理装置1に送信したことに応じて、情報処理装置1から検査結果または用紙識別子群などを受信する。
The
端末出力部26は、各種の情報を出力する。各種の情報とは、例えば、検査結果、用紙識別子群などである。端末出力部26による出力は、通常、ディスプレイへの表示であるが、例えば、記録媒体への蓄積などでもよく、その態様は問わない。端末出力部26は、例えば、端末受信部25が受信した検査結果または用紙識別子群等の情報を、ディスプレイに表示する。
The
ユーザは、検査結果を基に、2以上の各用紙画像からの情報の取得が的確に行われたことを確認できる。なお、的確に行われたことは、例えば、2以上の全ての用紙について、当該用紙に記載されている金額等の情報と、当該用紙を読み取った用紙画像からOCR処理により取得された金額等の情報とが一致することである。 Based on the inspection results, the user can confirm that information has been accurately acquired from each of the two or more paper images. What has been done accurately is, for example, for all sheets of 2 or more, information such as the amount written on the sheet and the amount etc. obtained by OCR processing from the sheet image read from the sheet. The information must match.
また、用紙識別子群が出力された場合、ユーザは、情報の取得が的確に行われなかった可能性が高い1以上の各用紙のみを、効率よくチェックできる。なお、的確に行われなかったことは、例えば、2枚以上の用紙のうち少なくとも1枚の用紙について、当該用紙に記載されている金額等の情報と、当該用紙を読み取った用紙画像からOCR処理により取得された金額等の情報とが一致しないことである。 Further, when a group of paper identifiers is output, the user can efficiently check only one or more papers for which there is a high possibility that information was not acquired accurately. What was not done accurately is, for example, OCR processing of at least one of two or more sheets of paper from the information such as the amount written on the sheet and the paper image read from the sheet. This is because the information such as the amount obtained by the above information does not match.
格納部11、統計情報格納部111、特別識別子格納部112、および端末格納部21は、例えば、ハードディスクやフラッシュメモリといった不揮発性の記録媒体が好適であるが、RAMなど揮発性の記録媒体でも実現可能である。
The
格納部11等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部11等で記憶されるようになってもよく、ネットワークや通信回線等を介して送信された情報が格納部11等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部11等で記憶されるようになってもよい。入力デバイスは、例えば、キーボード、マウス、タッチパネル、カメラ等、何でもよい。
The process by which information is stored in the
受付部12、用紙画像受付部121、および端末受付部22は、入力デバイスを含むと考えても、含まないと考えてもよい。受付部12等は、入力デバイスのドライバーソフトによって、または入力デバイスとそのドライバーソフトとで実現され得る。
The
処理部13、第一OCR部131、第二OCR部132、決定部133、判断部134、特別処理部135、および端末処理部23は、通常、MPUやメモリ等から実現され得る。処理部13等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。ただし、処理手順は、ハードウェア(専用回路)で実現してもよい。
The
出力部14、および端末出力部26は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えてもよい。出力部14等は、出力デバイスのドライバーソフトによって、または出力デバイスとそのドライバーソフトとで実現され得る。
The
端末送信部24、および出力部14の送信機能は、通常、無線または有線の通信手段(例えば、NIC(Network interface controller)やモデム等の通信モジュール)で実現されるが、放送手段(例えば、放送モジュール)で実現されてもよい。
The transmission functions of the
端末受信部25、および受付部12等の受信機能は、通常、無線または有線の通信手段現されるが、放送を受信する手段(例えば、放送受信モジュール)で実現されてもよい。
The receiving functions of the
次に、情報処理システムの動作について図2~図4のフローチャートを用いて説明する。 Next, the operation of the information processing system will be explained using flowcharts shown in FIGS. 2 to 4.
図2は、情報処理装置1の動作を説明するフローチャートである。なお、このフローチャートにおいて、用紙画像受付部121による受け付けは、通常、端末装置2からの受信であり、出力部14による出力は、通常、端末装置2への送信である。用紙画像受付部121は、端末装置2から、端末識別子と対に用紙画像群を受信するものとする。
FIG. 2 is a flowchart illustrating the operation of the
(ステップS201)処理部13は、用紙画像受付部121が端末装置2から用紙画像群等を受信したか否かを判別する。用紙画像受付部121が端末装置2から用紙画像群等を受信したと判別された場合はステップS202に進み、受信していないと判別された場合はステップS201に戻る。
(Step S201) The
(ステップS202)処理部13は、ステップS201で受信された用紙画像群を構成する用紙画像の数を計数し、計数結果を変数Mにセットする。変数Mとは、読み込まれた用紙の枚数を示す変数である。
(Step S202) The
(ステップS203)処理部13は、変数Mが、統計情報格納部111に格納されている統計情報に対応付いた枚数情報と一致するか否かを判別する。変数Mが枚数情報と一致すると判別された場合はステップS205に進み、一致しないと判別された場合はステップS204に進む。
(Step S203) The
(ステップS204)出力部14は、“枚数不一致”を、ステップS201で用紙画像群と対に受信された端末識別子で識別される端末装置2(以下、単に「端末装置2」と記す場合がある)に送信する。その後、ステップS201に戻る。
(Step S204) The
(ステップS205)第一OCR部131は、ステップS201で受信された用紙画像群に対する第一OCR処理により、M個の第一OCR情報を有する第一OCR情報群を取得し、格納部11に蓄積する。
(Step S205) The
(ステップS206)第二OCR部132は、ステップS201で受信された用紙画像群に対する第二OCR処理により、M個の第二OCR情報を有する第二OCR情報群を取得し、ステップS205で取得された第一OCR情報群に対応付けて格納部11に蓄積する。これにより、格納部11には、第一OCR情報と第二OCR情報との対が、M個、格納される。
(Step S206) The
(ステップS207)処理部13は、変数iに初期値“1”をセットする。変数iとは、格納部11に格納されているM個の対のうち、未選択の対を順番に選択していくための変数である。なお、変数iは、M枚の用紙のうち、未選択の用紙を順番に選択していくための変数である、といってもよい。
(Step S207) The
(ステップS208)処理部13は、i番目の対があるか否かを判別する。i番目の対があると判別された場合はステップS209に進み、i番目の対がないと判別された場合はステップS213に進む。
(Step S208) The
(ステップS209)処理部13は、i番目の対を構成する第一OCR情報と第二OCR情報が一致するか否かを判別する。i番目の対を構成する第一OCR情報と第二OCR情報が一致すると判別された場合はステップS210に進み、一致しないと判別された場合はステップS211に進む。
(Step S209) The
(ステップS210)処理部13は、i番目の判別結果に“一致”をセットし、ステップS212に進む。
(Step S210) The
(ステップS211)処理部13は、i番目の判別結果に“不一致”をセットし、ステップS212に進む。
(Step S211) The
(ステップS212)処理部13は、変数iをインクリメントし、ステップS208に戻る。
(Step S212) The
(ステップS213)決定部133は、統計情報格納部111に格納されている統計情報(例えば、合計金額)と、ステップS205で取得された第一OCR情報群と、ステップS206で取得された第二OCR情報群とを用いて、正しいOCR情報群を決定する決定処理を実行する。なお、決定処理については、図3のフローチャートを用いて説明する。
(Step S213) The determining
(ステップS214)処理部13は、正しいOCR情報群が“Null”であるか否かを判別する。なお、“Null”とは、当該情報の不存在を示すフラグである。正しいOCR情報群が、“Null”であると判別された場合はステップS215に進み、“Null”でないと判別された場合はステップS216に進む。
(Step S214) The
(ステップS215)出力部14は、ステップS209での判別結果が“不一致”である1または2以上の対(以下、対群)に対応する用紙識別子群を端末装置2に送信する。その後。ステップS201に戻る。
(Step S215) The
(ステップS216)出力部14は、正しいOCR情報群に関する検査結果を端末装置2に送信する。その後。ステップS201に戻る。
(Step S216) The
なお、図2のフローチャートにおいて、情報処理装置1の電源オンやプログラムの起動に応じて処理が開始し、電源オフや処理終了の割り込みにより処理は終了する。ただし、処理の開始または終了のトリガは問わない。
Note that in the flowchart of FIG. 2, the process starts when the
図3は、ステップS213の決定処理を説明するフローチャートである。 FIG. 3 is a flowchart illustrating the determination process in step S213.
(ステップS301)決定部133は、ステップS209での判別結果が“不一致”である対を計数し、計数結果を変数mにセットする。変数mとは、M個の対のうち、第一OCR情報と第二OCR情報が不一致である対の個数を示す変数である。なお、変数mは、M枚の用紙のうち、第一OCR情報と第二OCR情報が不一致である用紙の枚数を示す変数である、といってもよい。
(Step S301) The determining
(ステップS302)決定部133は、変数mが1以上であるか否かを判別する。変数mが、1以上であると判別された場合はステップS304に進み、1以上でない(つまり、0である)と判別された場合はステップS303に進む。
(Step S302) The determining
(ステップS303)決定部133は、第一OCR情報群および第二OCR情報群を、正しいOCR情報群に決定する。その後、上位の処理にリターンする。
(Step S303) The determining
(ステップS304)決定部133は、ステップS209での判別結果が“不一致”であるm個の対に関し、2のm乗通りの組み合わせを作成する。
(Step S304) The determining
(ステップS305)決定部133は、変数jに初期値“1”をセットする。変数jとは、ステップS304で作成された「2のm乗通りの組み合わせ」のうち、未選択の組み合わせを順番に選択していくための変数である。
(Step S305) The determining
(ステップS306)決定部133は、j番目の組み合わせがあるか否かを判別する。j番目の組み合わせがあると判別された場合はステップS307に進み、ないと判別された場合はステップS312に進む。
(Step S306) The determining
(ステップS307)決定部133は、j番目の組み合わせに対応する統計情報(例えば、j番目の合計金額)を取得する。
(Step S307) The determining
(ステップS308)決定部133は、ステップS307で取得された統計情報が、統計情報格納部111に格納されている統計情報(例えば、合計金額)と一致するか否かを判定する。取得された統計情報が格納されている統計情報と一致すると判定された場合はステップS309に進み、一致しないと判定された場合はステップS310に進む。
(Step S308) The determining
(ステップS309)決定部133は、j番目の判定結果に“一致”をセットし、ステップS311に進む。
(Step S309) The determining
(ステップS310)決定部133は、j番目の判定結果に“不一致”をセットし、ステップS311に進む。
(Step S310) The determining
(ステップS311)決定部133は、変数jをインクリメントし、ステップS306に戻る。
(Step S311) The determining
(ステップS312)決定部133は、ステップS308での判定結果が“一致”の組み合わせがあるか否かを判別する。ステップS308での判定結果が“一致”の組み合わせが、あると判別された場合はステップS313に進み、ないと判別された場合はステップS315に進む。
(Step S312) The determining
(ステップS313)決定部133は、ステップS308での判定結果が“一致”の組み合わせが、1つだけであるか否かを判別する。ステップS308での判定結果が“一致”の組み合わせが、1つだけであると判別された場合はステップS314に進み、1つだけでない(つまり、2つ以上である)と判別された場合はステップS315に進む。
(Step S313) The determining
(ステップS314)決定部133は、正しいOCR情報群に、ステップS308での判定結果が“一致”である唯一の組み合わせをセットする。その後、上位の処理にリターンする。
(Step S314) The determining
(ステップS315)決定部133は、正しいOCR情報群に“Null”をセットする。その後、上位の処理にリターンする。
(Step S315) The determining
図4は、端末装置2の動作を説明するフローチャートである。なお、このフローチャートにおいて、端末受付部22は、端末格納部21に格納されている用紙画像群を一括的に受け付けるものとする。
FIG. 4 is a flowchart illustrating the operation of the
(ステップS401)端末処理部23は、端末受付部22が用紙画像群を受け付けたか否かを判別する。端末受付部22が用紙画像群を受け付けたと判別された場合はステップS402に進み、受け付けていないと判別された場合はステップS403に進む。
(Step S401) The
(ステップS402)端末送信部24は、ステップS401で受け付けられた用紙画像群を、端末格納部21に格納さている端末識別子と対に、情報処理装置1送信する。その後、ステップS401に戻る。
(Step S402) The
(ステップS403)端末処理部23は、端末受信部25が“枚数不一致”を受信したか否かを判別する。端末受信部25が“枚数不一致”を受信したと判別された場合はステップS404に進み、受信していないと判別された場合はステップS405に進む。
(Step S403) The
(ステップS404)端末出力部26は、ステップS403で受信された“枚数不一致”を、ディスプレイ等の出力デバイスを介して出力する。その後、ステップS401に戻る。
(Step S404) The
(ステップS405)端末処理部23は、端末受信部25が検査結果を受信したか否かを判別する。端末受信部25が検査結果を受信したと判別された場合はステップS406に進み、受信していないと判別された場合はステップS407に進む。
(Step S405) The
(ステップS406)端末出力部26は、ステップS405で受信された検査結果を、ディスプレイ等の出力デバイスを介して出力する。その後、ステップS401に戻る。
(Step S406) The
(ステップS407)端末処理部23は、端末受信部25が用紙識別子群を受信したか否かを判別する。端末受信部25が用紙識別子群を受信したと判別された場合はステップS408に進み、受信していないと判別された場合はステップS401に戻る。
(Step S407) The
(ステップS408)端末出力部26は、ステップS407で受信された用紙識別子群を、ディスプレイ等の出力デバイスを介して出力する。その後、ステップS401に戻る。
(Step S408) The
なお、図4のフローチャートにおいて、端末装置2の電源オンやプログラムの起動に応じて処理が開始し、電源オフや処理終了の割り込みにより処理は終了する。ただし、処理の開始または終了のトリガは問わない。
Note that in the flowchart of FIG. 4, the process starts when the
なお、M枚の各用紙に対し、n個の用紙画像を準備し、当該n個の各用紙画像に対してOCR処理を行う場合、図2のフローチャートにおいて、一部のステップ(S202,S205~S209,S213)が、下記のように変更される。 Note that when n paper images are prepared for each of M sheets and OCR processing is performed on each of the n paper images, some steps (S202, S205 to S205) in the flowchart of FIG. S209, S213) are changed as follows.
用紙画像受付部121は、端末装置2から、端末識別子と対に、用紙画像群と変数nを受信する。変数nは、一の用紙に対して準備される用紙画像の数を示す変数である。
The paper
(ステップS202a)処理部13は、ステップS201で受信された用紙画像群を構成する用紙画像の数を計数し、当該用紙画像数を変数nで除算した結果“用紙画像数/n”を変数Mにセットする。
(Step S202a) The
(ステップS205a)第一OCR部131は、ステップS201で受信された用紙画像群に対する第一OCR処理により、(M×n)個の第一OCR情報を有する第一OCR情報群を取得し、格納部11に蓄積する。
(Step S205a) The
(ステップS206a)第二OCR部132は、ステップS201で受信された用紙画像群に対する第二OCR処理により、(M×n)個の第二OCR情報を有する第二OCR情報群を取得し、ステップS205aで取得された第一OCR情報群に対応付けて格納部11に蓄積する。これにより、格納部11には、M枚の各用紙ごとに、第一OCR情報と第二OCR情報との対(対情報)がn個、格納される。
(Step S206a) The
(ステップS207a)処理部13は、変数iに初期値“1”をセットする。ここでの変数iは、M枚の用紙のうち、未選択の用紙を順番に選択していくための変数である。
(Step S207a) The
(ステップS208a)処理部13は、i番目の用紙があるか否かを判別する。i番目の用紙があると判別された場合はステップS209aに進み、i番目の用紙がないと判別された場合はステップS213aに進む。
(Step S208a) The
(ステップS209a)処理部13は、i番目の用紙に対応するn個の対情報の中に、第一OCR情報と第二OCR情報が一致する対情報が少なくとも1つあるか否かを判別する。i番目の用紙に対応するn個の対情報の中に、第一OCR情報と第二OCR情報が一致する対情報が、少なくとも1つあると判別された場合はステップS210に進み、1つもないと判別された場合はステップS211に進む。
(Step S209a) The
(ステップS213a)決定部133は、統計情報格納部111に格納されている統計情報(例えば、合計金額)と、ステップS205aで取得された第一OCR情報群と、ステップS206aで取得された第二OCR情報群とを用いて、正しいOCR情報群を決定する決定処理を実行する。
(Step S213a) The determining
また、図3のフローチャートでも、一部のステップ(S301,S304)が下記のように変更される。 Also, in the flowchart of FIG. 3, some steps (S301, S304) are changed as follows.
(ステップS301a)決定部133は、ステップS209aでの判別結果が“不一致”である用紙の数を計数し、計数結果を変数mにセットする。ここでの変数mは、M枚の用紙のうち、第一OCR情報と第二OCR情報が不一致である用紙の枚数を示す変数である。
(Step S301a) The determining
(ステップS304a)決定部133は、ステップS209aでの判別結果が“不一致”であるm枚の各用紙に関し、{(2のm乗)×n}通りの組み合わせを作成する。
(Step S304a) The determining
さらに、図4のフローチャートでも、一部のステップ(S401,S402)が下記のように変更される。 Furthermore, in the flowchart of FIG. 4 as well, some steps (S401, S402) are changed as follows.
(ステップS401a)端末処理部23は、端末受付部22が用紙画像群および変数nを受け付けたか否かを判別する。端末受付部22が用紙画像群および変数nを受け付けたと判別された場合はステップS402aに進み、受け付けていないと判別された場合はステップS403に進む。
(Step S401a) The
(ステップS402a)端末送信部24は、ステップS401で受け付けられた用紙画像群および変数nを、端末格納部21に格納さている端末識別子と対に、情報処理装置1送信する。その後、ステップS401aに戻る。
(Step S402a) The
以下、本実施の形態における情報処理システムの具体的な動作例について説明する。なお、以下の説明は、種々の変更が可能であり、本発明の範囲を何ら制限するものではない。 A specific example of the operation of the information processing system in this embodiment will be described below. Note that the following description can be modified in various ways and is not intended to limit the scope of the present invention in any way.
(具体例1)
本例における用紙は、手形である。いま、各店から事務センターへ、例えば、図5に示すような3枚の用紙が、図6に示すような帳票と共に持ち込まれたとする。
(Specific example 1)
The paper in this example is a bill. Suppose now that three sheets of paper as shown in FIG. 5 are brought into the office center from each store along with a form as shown in FIG. 6.
図5は、用紙群の一例を示す図である。用紙群とは、2枚以上の用紙の集合である。この用紙群は、3枚の用紙を有する。そのうち、1枚目の用紙には、金額「¥1,000※」、および振出人「BBホールディングス」などが記載されている。また、2枚目の用紙には、金額「¥2,000※」、および振出人「AA株式会社」などが記載されている。さらに、3枚目の用紙には、金額「¥3,000※」、および振出人「AA株式会社」などが記載されている。 FIG. 5 is a diagram showing an example of a paper group. A sheet group is a collection of two or more sheets. This paper group has three sheets. On the first sheet of paper, the amount "¥1,000*" and the drawer "BB Holdings" are written. Furthermore, on the second sheet of paper, the amount "¥2,000*" and the drawer "AA Co., Ltd." are written. Furthermore, on the third sheet, the amount "¥3,000*" and the drawer "AA Co., Ltd." are written.
図6は、帳票の一例を示す図である。この帳票には、統計情報である合計金額「6000円」、および枚数「3枚」などの情報が記入されている。 FIG. 6 is a diagram showing an example of a form. In this form, statistical information such as the total amount "6,000 yen" and the number of sheets "3" are written.
上記3枚の用紙の画像がスキャナで読み込まれ、また、上記帳票に記入された合計金額“6000円”等の情報がキーボード等の入力デバイスを介して入力されると、端末装置2において、図4のステップS401およびS402の処理が実行される。すなわち、端末受付部22が、読み込まれた3つの用紙画像を有する用紙画像群、および読み込まれたた合計金額“6000円”等の情報を受け付け、端末送信部24は、当該受け付けられた用紙画像群および合計金額等の情報を情報処理装置1に送信する。
When the images of the three sheets mentioned above are read by a scanner, and information such as the total amount "6,000 yen" written on the form is inputted via an input device such as a keyboard, the
情報処理装置1において、用紙画像受付部121が上記用紙画像群および合計金額等の情報を受信し、処理部13等は、当該受信された合計金額等の情報を統計情報格納部111に蓄積すると共に、当該受信された用紙画像群、および統計情報格納部111に格納されている合計金額等の情報を用いて、図3のステップS201~S216の処理を実行する。これによって、例えば、図7に示すような、2以上(本例では、3つ)のOCR関連情報が、格納部11に蓄積される。
In the
図7は、OCR関連情報のデータ構造図である。OCR関連情報とは、用紙画像群に対して行われたOCRの結果に関する情報である。OCR関連情報は、第一OCR情報、第二OCR情報、判別結果、および識別子(本例では、振出人名)などを有する。 FIG. 7 is a data structure diagram of OCR related information. The OCR-related information is information regarding the results of OCR performed on a group of paper images. The OCR-related information includes first OCR information, second OCR information, a determination result, an identifier (in this example, the name of the issuer), and the like.
また、格納部11に格納される2以上のOCR関連情報には、不一致情報が対応付いている。不一致情報とは、第一OCR情報と第二OCR情報が一致しない1または2以上の用紙に関する情報である。不一致情報は、1または2以上の用紙識別子を含む。不一致情報は、具体的には、例えば、“1枚目”や“2枚目,3枚目”等であるが、その形式は問わない。
Further, two or more pieces of OCR related information stored in the
さらに、格納される2以上の各OCR関連情報に、ID(例えば、“1”,“2”等)が対応付いている。なお、以下では、格納される2以上のOCR関連情報を「OCR関連情報群」と記す場合がある。 Further, each of the two or more pieces of OCR related information stored is associated with an ID (for example, "1", "2", etc.). Note that, hereinafter, two or more pieces of OCR-related information stored may be referred to as an "OCR-related information group."
なお、図7は、OCR関連情報群の一例も示している。この例は、判別結果が一致しない用紙が1枚のみの場合である。例えば、ID“1”が対応付いたOCR関連情報(以下、OCR関連情報1)は、第一OCR情報“1000円”、第二OCR情報“1000円”、判別結果“一致”、および識別子“BBホールディングス”などを有する。また、ID“2”が対応付いたOCR関連情報(OCR関連情報2)は、第一OCR情報“2000円”、第二OCR情報“2100円”、判別結果“不一致”、および識別子“AA株式会社”などを有する。同様に、OCR関連情報3は、第一OCR情報“3000円”、第二OCR情報“3000円”、判別結果“一致”、および識別子“AA株式会社”などを有する。そして、OCR関連情報1~3に、不一致情報“2枚目”が対応付いている。
Note that FIG. 7 also shows an example of an OCR-related information group. In this example, there is only one sheet of paper for which the determination results do not match. For example, OCR related information associated with ID "1" (hereinafter referred to as OCR related information 1) includes the first OCR information "1000 yen", the second OCR information "1000 yen", the determination result "match", and the identifier " BB Holdings, etc. In addition, the OCR related information (OCR related information 2) associated with ID "2" includes the first OCR information "2000 yen", the second OCR information "2100 yen", the determination result "mismatch", and the identifier "AA stock". Company” etc. Similarly, the OCR related
情報処理装置1において、決定部133が、図7のOCR関連情報群を用いて、図3のステップS213(詳しくは、図3のステップS301~S315)の決定処理を実行することによって、例えば、図8に示すような、1以上の決定情報が、格納部11に蓄積される。
In the
図8は、判定情報のデータ構造図である。判定情報とは、決定処理の経過および結果に関する情報である。判定情報は、不一致情報、組み合わせ、合計金額 判定結果、および正しいOCR情報群を有する。組み合わせとは、不一致情報が有する1または2以上の各用紙識別子で識別される用紙群に関する、可能な全ての一致・不一致の組み合わせである。組み合わせの数は、前述したように、不一致情報が有する用紙識別子の数m(つまり、図3のフローチャートにおける変数m:以下、単に「m」と記す場合がある)に対して、{2のm乗}通りとなる。判定結果とは、ステップS308の判定の結果である。 FIG. 8 is a data structure diagram of determination information. The determination information is information regarding the progress and results of the determination process. The determination information includes mismatch information, combination, total amount determination result, and correct OCR information group. The combinations are all possible combinations of matches and mismatches regarding the paper group identified by one or more paper identifiers included in the mismatch information. As mentioned above, the number of combinations is {2 m The result is as follows. The determination result is the result of the determination in step S308.
なお、格納される1以上の各判定情報には、ID(例えば、“1”,“2”等)が対応付いている。以下では、格納される1以上の判定情報を「判定情報群」と記し、個々の判定情報を「判定情報1」、「判定情報2」等のように記す場合がある。
Note that each of the one or more pieces of stored determination information is associated with an ID (for example, "1", "2", etc.). Hereinafter, one or more pieces of stored determination information may be referred to as a "determination information group", and individual determination information may be referred to as "
なお、図8は、判定情報群の一例も示している。この例は、{不一致情報=2枚目、m=1}の場合である。判定情報群は、ただ1つの判定情報1を有する。
Note that FIG. 8 also shows an example of the determination information group. This example is a case of {mismatch information=2nd sheet, m=1}. The determination information group has only one
判定情報1は、不一致情報“2枚目”、および2通りの組み合わせを含む。第一の組み合わせは、第一OCR情報が正、かつ第一OCR情報が誤(以下、{○,×}のように記す場合がある)であり、第二の組み合わせは、{×,○}である。
また、判定情報1は、第一の組み合わせ{○,×}に対応する合計金額“6000円”と判定結果“一致”、および第二の組み合わせ{×,○}に対応する合計金額“6100円”と判定結果“不一致”、も含む。さらに、判定情報1は、正しいOCR情報群“2枚目:第一OCR情報”をも含む。
In addition,
なお、第一の組み合わせ{○,×}に対応する合計金額“6000円”は、図7のOCR情報群を用いて、例えば、決定部133によって、次にように取得される。すなわち、決定部133は、OCR情報1が有する第一または第二のOCR情報“1000”円と、OCR情報1が有する第一OCR情報“2000円”と、OCR情報3が有する第一または第二のOCR情報“3000”円とを加算し、加算結果“6000円”を取得する。
Note that the total amount “6,000 yen” corresponding to the first combination {◯, ×} is obtained by, for example, the determining
同様に、第二の組み合わせ{×,○}に対応する合計金額“6100円”は、OCR情報1が有する第一または第二のOCR情報“1000”円と、OCR情報2が有する第一OCR情報“2100円”と、OCR情報3が有する第一または第二のOCR情報“3000”円とを加算することにより取得される。
Similarly, the total amount “6100 yen” corresponding to the second combination {x, ○} is calculated by adding “1000” yen of the first or second OCR information that
また、第一の組み合わせ{○,×}に対応する判定結果“一致”は、第一の組み合わせ{○,×}に対応する合計金額“6000円”と、統計情報格納部111の合計金額“6000円”とが一致するか否かを判別した結果として取得される。同様に、第二の組み合わせ{○,×}に対応する判定結果“一致”は、第二の組み合わせ{×,○}に対応する合計金額“6100円”と、統計情報格納部111の合計金額“6000円”とが一致するか否かを判別した結果として取得される。 Further, the determination result “match” corresponding to the first combination {○, ×} is the total amount “6000 yen” corresponding to the first combination {○, ×} and the total amount “ 6,000 yen” match or not. Similarly, the determination result “match” corresponding to the second combination {○, ×} is the total amount “6100 yen” corresponding to the second combination {×, ×} and the total amount in the statistical information storage unit 111. It is obtained as a result of determining whether or not "6000 yen" matches.
さらに、正しいOCR情報群“2枚目,一致”は、不一致情報“2枚目”と、判定結果が“一致”である第一の組み合わせ{○,×}の“○”に対応する“第一OCR情報”とを用いて取得される。 Furthermore, the correct OCR information group “2nd sheet, match” is the “2nd sheet” of mismatch information and the “2nd sheet” corresponding to “○” of the first combination {○, ×} whose judgment result is “match”. "1 OCR information".
さらに、情報処理装置1において、処理部13および出力部14が、図8の判定結果を用いて、図3のステップS214~S215の処理を実行し、そして、端末装置2において、図4のステップS405~S408の処理が実行されることによって、例えば、図9に示すような、1以上の検査結果が、端末装置2のディスプレイに表示される。
Further, in the
図9は、出力される検査結果の構造図である。検査結果は、3つの項目「不一致」,「第一OCR」,および「第二OCR」を含む。「不一致」は、判定情報が有する不一致情報に対応する項目であり、「第一OCR」および「第二OCR」は、判定情報が有する組み合わせを構成する第一OCR情報および第二OCR情報に対応する項目である。 FIG. 9 is a structural diagram of the test results that are output. The inspection result includes three items: "mismatch", "first OCR", and "second OCR". "Mismatch" is an item corresponding to mismatch information included in the judgment information, and "First OCR" and "Second OCR" correspond to the first OCR information and second OCR information that constitute the combination included in the judgment information. This is an item to do.
「不一致」には、不一致情報(図8等参照)が有する1以上のページ識別子が表記される。「第一OCR」および「第二OCR」には、当該1以上の各ページ識別子に対応付けて、第一および第二の2つのOCR処理による2つの認識結果(例えば、{1000円,1000円}や{2000円,2100円}等)と、当該2つの認識結果に対応する2つの判定結果({○,×}または{×,○}のいずれか)とが表記される。 “Unmatched” indicates one or more page identifiers included in the unmatched information (see FIG. 8, etc.). "First OCR" and "Second OCR" include two recognition results obtained by the first and second OCR processes (for example, {1000 yen, 1000 yen }, {2000 yen, 2100 yen}, etc.), and two determination results (either {◯, x} or {x, ○}) corresponding to the two recognition results are written.
なお、図9は、ディスプレイに表示される検査結果の一例も示している。この検査結果では、「不一致」の項目に「2枚目」が表示され、「第一OCR」および「第二OCR」の項目に、{2000円,2100円}と{○,×}とが表示されている。 Note that FIG. 9 also shows an example of the test results displayed on the display. In this inspection result, "2nd sheet" is displayed in the "mismatch" item, and {2000 yen, 2100 yen} and {○, ×} are displayed in the "1st OCR" and "2nd OCR" items. Displayed.
これによって、ユーザは、3枚の用紙のうち、2枚目の用紙において、第一OCRおよび第二OCRによる2つの認識結果に不一致が生じており、第一OCR、第二OCRによる認識結果は、それぞれ2000円、2100円であり、前者が正しく、後者が誤りと判定されたことが分かる。 As a result, the user notices that there is a discrepancy between the two recognition results obtained by the first OCR and the second OCR on the second sheet of the three sheets, and the recognition results obtained by the first OCR and the second OCR are , 2000 yen and 2100 yen, respectively, and it can be seen that the former was determined to be correct and the latter was determined to be incorrect.
なお、ディスプレイには、OKボタン等も表示されており、上記の判定結果は、OKボタンの押下に応じて確定される。 Note that an OK button and the like are also displayed on the display, and the above determination result is confirmed in response to pressing the OK button.
なお、図8の判定情報において、2つの判定結果がいずれも“不一致である場合は、例えば、図10に示す選択画面が表示されてもよい。図10は、選択画面の一例を示す図である。選択画面とは、判定結果がいずれも“不一致である場合に、第一OCRおよび第二OCRによる2つの認識結果を提示して、ユーザによる選択を受け付けるための画面である。選択画面には、例えば、「どちらが正しいか判定できません。正しい方を選択して下さい。」等の文字列と共に、図9の検査結果において、判定結果{○,×}を、判定不可能を示す情報(例えば、{?,?}等)に変更したものが表示される。ただし、選択画面の構造や表現は問わない。 In addition, in the determination information of FIG. 8, if both of the two determination results are "inconsistent," for example, the selection screen shown in FIG. 10 may be displayed. FIG. 10 is a diagram showing an example of the selection screen. The selection screen is a screen for presenting the two recognition results by the first OCR and the second OCR and accepting a selection by the user when the determination results are "inconsistent". On the selection screen, for example, along with a character string such as "It cannot be determined which is correct. Please select the correct one," the judgment result {○, The changed information (for example, {?, ?}, etc.) is displayed. However, the structure and expression of the selection screen does not matter.
これによって、ユーザは、2枚目の用紙で第一OCRおよび第二OCRによる2つの認識結果に不一致が生じており、正誤の判定ができなかったことが分かる。そこで、ユーザは、2枚目の用紙を確認し、“¥2,000※”が記載されていることから、認識結果“2000円”に対応する第一OCRを選択する。これにより、判定不可能を示す{?,?}等の情報は、ユーザの選択による判定結果{○,×}に置き換えられ、2枚目の用紙の金額は“2000円”に確定される。 This allows the user to understand that there is a discrepancy between the two recognition results obtained by the first OCR and the second OCR for the second sheet of paper, and that it was not possible to determine whether it is correct or incorrect. Therefore, the user checks the second sheet of paper, and since "¥2,000*" is written thereon, the user selects the first OCR corresponding to the recognition result "¥2,000". This indicates that it is impossible to determine {? ,? } is replaced with the determination result {◯, ×} based on the user's selection, and the amount of money for the second sheet is determined to be “2000 yen”.
なお、不一致が生じた用紙の数が2枚(すなわち、m=2)の場合、OCR関連情報群、判定情報群、検査結果、および選択画面は、例えば、図11~図14のようになる。この例では、2枚目および3枚目で不一致が生じている。 Note that when the number of sheets in which mismatches occur is two (that is, m = 2), the OCR-related information group, determination information group, inspection results, and selection screen are as shown in FIGS. 11 to 14, for example. . In this example, there is a mismatch between the second and third images.
図11は、OCR関連情報群の他の一例(m=2の場合)を示す図である。このOCR関連情報群を構成するOCR関連情報1~3のうち、OCR関連情報1,2は、図7の例と同様であるが、OCR関連情報3において、第一OCR情報が“3001円”であり、判定結果は“不一致”となっている。従って、不一致情報は、“2,3枚目”である。
FIG. 11 is a diagram showing another example of the OCR-related information group (in the case of m=2). Of the OCR related
図12は、判定情報群の他の一例(m=2、不一致情報=2,3枚目の場合)を示す図である。この判定情報群は、2枚目・3枚目について可能な4通り(つまり、2の2乗)の組み合わせに関する4つの判定情報1~4を有する。このうち、判定情報2において、合計金額が“6000円”、判定結果が“一致”であることから、正しいOCR情報群は、“2枚目:第一OCR情報”,および“3枚目:第二OCR情報”となっている。
FIG. 12 is a diagram showing another example of the determination information group (m=2, mismatch information=2nd, 3rd sheet). This judgment information group has four pieces of
図13は、検査結果の他の一例(m=2、不一致情報=2,3枚目の場合)を示す図である。この検査結果は、図9の検査結果に対し、3枚目に関する情報を追加したものである。なお、2枚目に関する情報は、図9と同様である。すなわち、図13の検査結果では、「不一致」の項目に「3枚目」が追加され、「第一OCR」および「第二OCR」の項目に、「3枚目」に対応する{3001円,3000円}と{×,○}とが追加されている。 FIG. 13 is a diagram showing another example of the inspection results (m=2, mismatch information=2nd, 3rd sheet). This inspection result is obtained by adding information regarding the third sheet to the inspection result of FIG. 9. Note that the information regarding the second sheet is the same as that in FIG. In other words, in the inspection results of FIG. 13, "3rd sheet" is added to the "mismatch" item, and the "3rd sheet" corresponding to {3001 yen] is added to the "1st OCR" and "2nd OCR" items. , 3,000 yen} and {x, ○} are added.
これによって、ユーザは、3枚目の用紙においても、第一OCRおよび第二OCRによる2つの認識結果に不一致が生じており、3枚目に関しては、第一OCR、第二OCRによる認識結果は、それぞれ3001円、3000円であり、前者が誤りであり、後者が正しいと判定されたことが分かる。なお、3枚目に関する判定結果もまた、OKボタンの押下に応じて、3枚目に関する判定結果と共に確定される。 As a result, the user notices that even for the third sheet, there is a discrepancy between the two recognition results obtained by the first OCR and the second OCR, and for the third sheet, the recognition results obtained by the first OCR and the second OCR are , 3001 yen and 3000 yen, respectively, indicating that the former was determined to be incorrect and the latter was determined to be correct. Note that the determination result regarding the third sheet is also confirmed together with the determination result regarding the third sheet in response to pressing the OK button.
図14は、選択画面の他の一例(m=2、不一致情報=2,3枚目の場合)を示す図である。この選択画面は、図10の選択画面に対し、3枚目に関する情報を追加したものである。なお、2枚目に関する情報は、図10と同様である。すなわち、図14の選択画面では、「不一致」の項目に「3枚目」が追加され、「第一OCR」および「第二OCR」の項目に、「3枚目」に対応する{3001円,300円}と{?,?}とが追加されている。 FIG. 14 is a diagram showing another example of the selection screen (m=2, mismatch information=2nd, 3rd image). This selection screen is obtained by adding information regarding the third sheet to the selection screen of FIG. 10. Note that the information regarding the second sheet is the same as that in FIG. 10. That is, on the selection screen in FIG. 14, "3rd sheet" is added to the "unmatched" item, and the "3rd sheet" corresponding to {3001 yen , 300 yen} and {? ,? } has been added.
これによって、ユーザは、3枚目の用紙でも、第一OCRおよび第二OCRによる2つの認識結果に不一致が生じており、正誤の判定ができなかったことが分かる。そこで、ユーザは、3枚目の用紙を確認し、“¥3,000※”が記載されていることから、認識結果“3000円”に対応する第二OCRを選択する。これにより、3枚目に対応付いた{?,?}等の情報は、ユーザの選択による判定結果{×,○}に置き換えられ、3枚目の用紙の金額は“3000円”に確定される。 This allows the user to understand that even for the third sheet, there is a discrepancy between the two recognition results obtained by the first OCR and the second OCR, and it was not possible to determine whether the sheet is correct or incorrect. Therefore, the user checks the third sheet of paper, and since "¥3,000*" is written thereon, the user selects the second OCR corresponding to the recognition result "¥3,000". As a result, the third image has been added {? ,? } and the like are replaced with the determination result {×, ○} based on the user's selection, and the amount of money for the third sheet is determined to be “3000 yen”.
なお、m=3の場合、OCR関連情報群、および判定情報群は、例えば、図15、および図16のようになる。この例では、1枚目から3枚目の全てで不一致が生じている。なお、検査結果、および選択画面については、図示を省略している。 Note that when m=3, the OCR-related information group and the determination information group are as shown in FIGS. 15 and 16, for example. In this example, mismatches occur in all of the first to third sheets. Note that illustration of the test results and selection screen is omitted.
図15は、OCR関連情報群のその他の一例(m=3の場合)を示す図である。このOCR関連情報群を構成するOCR関連情報1~3のうち、OCR関連情報2,3は、図11の例と同様であるが、OCR関連情報1において、第一OCR情報が“1050円”であり、判定結果は“不一致”となっている。従って、不一致情報は、“1~3枚目”である。
FIG. 15 is a diagram showing another example of the OCR-related information group (in the case where m=3). Of the OCR related
図16は、判定情報群のその他の一例(m=3、不一致情報=1~3枚目の場合)を示す図である。この判定情報群は、1~3枚目について可能な8通り(つまり、2の3乗)の組み合わせに関する8つの判定情報1~8を有する。このうち、判定情報6において、合計金額が“6000円”、判定結果が“一致”であることから、正しいOCR情報群は、“1枚目:第二OCR情報”,2枚目:第一OCR情報”および“3枚目:第二OCR情報”となっている。
FIG. 16 is a diagram showing another example of the determination information group (m=3, mismatch information=first to third sheets). This judgment information group has eight pieces of
従って、この場合の検査結果は、図13の検査結果に対して、さらに、1枚目に関する情報を追加したものとなる。すなわち、この場合の検査結果では、「不一致」の項目に「1枚目」が追加され、「第一OCR」および「第二OCR」の項目に、「1枚目」に対応する{1050円,1000円}と{×,○}とが追加される。なお、この検査結果に対するユーザの指示、および当該指示に応じた処理部13等の処理は、前述と同様である。
Therefore, the inspection result in this case is the one in which information regarding the first sheet is further added to the inspection result in FIG. That is, in the inspection results in this case, "1st sheet" is added to the "mismatch" item, and the "1st sheet" corresponding to "1st sheet" is added to the "1st OCR" and "2nd OCR" items. , 1000 yen} and {x, ○} are added. Note that the user's instructions regarding this test result and the processing performed by the
また、この場合の選択画面は、図14の選択画面に対して、さらに、1枚目に関する情報を追加したものとなる。すなわち、この場合の選択画面では、「不一致」の項目に「1枚目」が追加され、「第一OCR」および「第二OCR」の項目に、「1枚目」に対応する{1050円,1000円}と{?,?}とが追加される。なお、この選択画面に対するユーザの指示、および当該指示に応じた処理部13等の処理は、前述と同様である。
Further, the selection screen in this case is the selection screen shown in FIG. 14 with information regarding the first sheet added. In other words, on the selection screen in this case, "1st sheet" is added to the "unmatched" item, and the "1st sheet" corresponding to "1st sheet" is added to the "1st OCR" and "2nd OCR" items. , 1000 yen} and {? ,? } is added. Note that the user's instructions on this selection screen and the processing performed by the
(具体例2)
なお、上記具体例1において、3枚の各用紙ごとに、2つの画像(例えば、JPEGおよびTIFの2種類の画像)を準備し、計6枚の用紙画像を有する用紙画像群等を用いて、決定処理を行ってもよい。具体例2の詳しい説明は省略する。
(Specific example 2)
In addition, in the above specific example 1, two images (for example, two types of JPEG and TIF images) are prepared for each of the three sheets, and a sheet image group having a total of six sheet images is used. , a determination process may be performed. A detailed explanation of the second specific example will be omitted.
(具体例3)
または、上記具体例1において、特別識別子格納部112に、1以上の特別識別子(例えば、誤認識が生じ易い手形等の用紙を多く振り出す振出人の振出人名)が格納されていてもよい。第一OCR部131または第二OCR部132が、各用紙画像に対するOCR処理により振出人名をも取得し、判断部134は、3枚の各用紙画像から取得された振出人名が、特別識別子格納部112に格納されている振出人名と一致するか否かを判定してもよい。そして、取得された振出人名が、格納されている振出人名と一致すると判定されるほど類似している場合に、認識の精度を高めるための特別処理(例えば、用紙画像に対する補正、一の用紙につき2以上の用紙画像を準備する等)を行ってもよい。
(Specific example 3)
Alternatively, in the first specific example, the special
(具体例4)
上記具体例3において、特別処理は、一の用紙につき2以上の用紙画像を準備する処理であり、特別識別子格納部112には、誤読数が閾値より多いと処理部13によって判別された振出人の識別子が格納されてもよい。誤読数とは、一の振出人名に対応する2以上の用紙に関し、認識結果が誤りであると決定部133によって判定された回数、または割合である。
(Specific example 4)
In the above specific example 3, the special process is a process of preparing two or more paper images for one paper, and the special
割合とは、第一OCR部131または第二OCR部132によって認識された回数に対する、決定部133によって誤りであると判定された回数の割合であり、例えば、0~1の数値、または百分率(%)等で表現されるが、その形式は問わない。
The ratio is the ratio of the number of times that the
特別識別子格納部112には、例えば、図17に示すような、1または2以上の特別識別子関連情報が格納されてもよい。図17は、特別識別子関連情報のデータ構造図である。特別識別子関連情報とは、特別識別子に関連する情報である。特別識別子関連情報は、識別子(本例では、振出人名)、誤読数、および特別識別子フラグを有する。ここでの誤読数は、誤りであると判定された回数である。
The special
特別識別子フラグとは、当該識別子が特別識別子か否かを示す情報である。特別識別子フラグは、例えば、当該識別子が、特別識別子であることを示す“ON”、別識別子でないことを示す“OFF”の間で切り替わる。特別識別子フラグ“ON”が対応付いた識別子は、特別識別子であると見なされ、特別識別子フラグ“OFF”が対応付いた識別子は、特別識別子でないと見なされる。 The special identifier flag is information indicating whether the identifier is a special identifier. The special identifier flag switches between, for example, "ON" indicating that the identifier is a special identifier, and "OFF" indicating that the identifier is not a separate identifier. Identifiers associated with the special identifier flag "ON" are considered to be special identifiers, and identifiers associated with the special identifier flag "OFF" are considered not to be special identifiers.
ID“1”が対応付いた特別識別子関連情報1は、識別子“AA株式会社”、誤読数“3”、および特別識別子フラグ“ON”を有する。同様に、特別識別子関連情報2は、識別子“BBホールディングス”、誤読数“1”、および特別識別子フラグ“OFF”を有する。
The special identifier
詳しくは、特別識別子格納部112に格納されている誤読数と特別識別子フラグの初期値は、それぞれ“0”、“OFF”である。特別識別子格納部112に格納されているいずれかの識別子が表出した用紙画像から、第一OCR部131または第二OCR部132によって金額等の情報が取得され、当該取得された情報について、決定部133が「誤り」と判定する度に、処理部13は、当該識別子に対応する誤読数をインクリメントする。そして、処理部13は、当該インクリメント後の誤読数が閾値(ここでは、“2”)を超えたか否かを判別し、閾値を超えたと判別した場合に、当該識別子に対応する特別識別子フラグを“OFF”から“ON”に切り替える。
Specifically, the initial values of the number of misreads and the special identifier flag stored in the special
いま、特別識別子格納部112に、図17に示す2つの特別識別子関連情報1,2が格納されているとすると、特別識別子フラグが“ON”である“AA株式会社”が表出した用紙群についてのみ、一の用紙につき2つの用紙画像が準備され、特別識別子フラグが“OFF”である“BBホールディングス”が表出した用紙については、一の用紙画像しか準備されない。
Assuming that the special
この場合、前述した図7のOCR情報群が有するOCR関連情報2は、例えば、図18に示すOCR関連情報2のようになる。図18は、OCR関連情報群のさらにその他の一例を示す図である。図18に示すOCR関連情報群が有するOCR関連情報2は、2番目の用紙を基に準備された2つの用紙画像(例えば、1番目がTIF画像、2番目がJPEG画像など)に対応する2つのOCR関連情報を含んでいる。
In this case, the OCR-related
上記2つのOCR関連情報のうち、1番目のOCR関連情報は、第一OCR情報“2000円”,第二OCR情報“2100円”,および判別結果“不一致”を含み、2番目のOCR関連情報は、第一OCR情報“2000円”,第二OCR情報“2000円”,および判別結果“一致”を含む。 Among the above two OCR related information, the first OCR related information includes the first OCR information "2000 yen", the second OCR information "2100 yen", and the determination result "mismatch", and the second OCR related information includes the first OCR information "2000 yen", the second OCR information "2000 yen", and the determination result "match".
従って、OCR関連情報2において、少なくとも1つの判別結果が“一致”となったため、図18のOCR情報群に対応付いた不一致情報は“Null”となる。これにより、処理負荷の増加を抑制しつつ、OCRの精度を高めることができる。
Therefore, in OCR related
なお、不一致情報は“Null”である場合、端末装置2のディスプレイには、例えば、図19に示すような確認画面が表示されてもよい。図19は、確認画面の一例を示す図である。確認画面とは、用紙画像群を構成する全ての用紙画像について、第一および第二の2つのOCR処理による2つの認識結果が一致したことを確認する画面である。確認画面は、「全用紙で2つのOCRが一致しました。・・・」等の文字列と、OKボタンとを有する。OKボタンが押下されると、用紙画像群に対する全ての認識結果が確定される。
Note that if the mismatch information is "Null", a confirmation screen as shown in FIG. 19 may be displayed on the display of the
以上、本実施の形態によれば、統計情報格納部111に、2以上の各用紙に記載されている情報に対する統計処理結果である統計情報が格納され、情報処理装置1は、2以上の各用紙を読み込んだ画像である用紙画像を受け付け、2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得し、2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得し、統計情報と2以上の第一OCR情報と2以上の第二OCR情報とを用いて、2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定し、決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する。
As described above, according to the present embodiment, the statistical information storage unit 111 stores statistical information that is the result of statistical processing on information written on each of two or more sheets, and the
こうして、2以上の各用紙ごとに、第一のOCR処理による第一OCR情報と、第二のOCR処理による第二OCR情報とを取得して、格納されている統計情報と、当該取得した2以上の第一OCR情報および2以上の第二OCR情報とを用いて、正しいOCR情報を決定することで、OCRの精度の不足が補われる結果、情報処理装置1は、用紙に表記されている情報を的確に取得できる。なお、的確に取得できることは、用紙に表記されている情報と一致する情報を、当該用紙の用紙画像からOCRによって取得できることである。
In this way, for each of two or more sheets, the first OCR information by the first OCR process and the second OCR information by the second OCR process are acquired, and the stored statistical information and the acquired two By determining correct OCR information using the above first OCR information and two or more second OCR information, the lack of accuracy of OCR is compensated for, and as a result, the
従って、用紙に記載されている情報と、用紙画像からOCRにより取得された情報との、人によるチェックの手間を効果的に軽減できる。 Therefore, it is possible to effectively reduce the effort required for a person to check the information written on the paper and the information obtained from the paper image by OCR.
また、上記構成において、統計情報は、2以上の各用紙に記載されている数値の和であることにより、情報処理装置1は、OCRの精度不足を簡単かつ効果的に補うことができる。
Furthermore, in the above configuration, since the statistical information is the sum of the numerical values written on two or more sheets, the
また、情報処理装置1は、2以上の各用紙に対して、2以上の異なる用紙画像を受け付け、2以上の各用紙ごとに、2以上の異なる各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得し、2以上の各用紙ごとに、2以上の異なる各用紙画像に対して、第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得し、統計情報と4以上の第一OCR情報と4以上の第二OCR情報とを用いて、2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する。
The
こうして、2以上の各用紙ごとに、2以上の異なる用紙画像を取得し、2以上の各用紙画像ごとに、第一のOCR処理による第一OCR情報と、第二のOCR処理による第二OCR情報とを取得し、格納されている統計情報と、当該取得した4以上の第一OCR情報および4以上の第二OCR情報とを用いて、正しいOCR情報を決定することで、OCRの精度の不足を、より効果的に補うことができる。 In this way, two or more different paper images are acquired for each of the two or more paper images, and for each of the two or more paper images, the first OCR information is obtained by the first OCR processing, and the second OCR information is obtained by the second OCR processing. The accuracy of OCR can be improved by determining the correct OCR information using the stored statistical information and the acquired 4 or more first OCR information and 4 or more second OCR information. Deficiencies can be compensated for more effectively.
また、上記構成において、2以上の各用紙には、識別子が表出しており、情報処理装置1は、2以上の各用紙画像に対するOCR処理により、予め決められた領域から識別子を取得し、特別識別子格納部112には、予め決められた特別処理を行う識別子である1以上の特別識別子が格納されており、第一のOCR処理または第二のOCR処理によって取得した識別子が特別識別子であるか否かを判断し、特別識別子であると判断した識別子が表出した用紙に対して、予め決められた処理であり、第一OCR処理または第二OCR処理の精度を高めるための処理である特別処理を行う。
Further, in the above configuration, an identifier is exposed on each of the two or more sheets of paper, and the
こうして、特別識別子が表出している用紙に対してのみ特別処理を行うことで、情報処理装置1は、処理負荷の増大を抑制しつつ、OCRの精度の不足を補うことができる。
In this way, by performing special processing only on the paper on which the special identifier is exposed, the
また、上記構成において、2以上の各用紙は、手形であることにより、情報処理装置1は、手形に表記されている金額等の情報を的確に取得できる。
Furthermore, in the above configuration, since each of the two or more sheets is a bill, the
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。 Furthermore, the processing in this embodiment may be realized by software. Then, this software may be distributed by software download or the like. Furthermore, this software may be recorded on a recording medium such as a CD-ROM and distributed. Note that this also applies to other embodiments in this specification.
なお、本実施の形態における情報処理装置1を実現するソフトウェアは、例えば、以下のようなプログラムである。つまり、このプログラムは、2以上の各用紙に記載されている情報に対する統計処理結果である統計情報が格納される統計情報格納部111にアクセス可能なコンピュータを、前記2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付部121と、前記2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCR部131と、前記2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCR部132と、前記統計情報と前記2以上の第一OCR情報と前記2以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定部133と、前記決定部133が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力部14として機能させるためのプログラムである。
Note that the software that implements the
なお、本実施の形態における情報処理装置1は、第一および第二の2つのOCR部(131および132)を備えているが、例えば、第三OCR部(図示しない)さらに備えていてもよい。
Note that although the
第三OCR部は、2以上の各用紙画像に対して、第三のOCR処理を行い、予め決められた領域の情報である2以上の第三OCR情報を取得する。決定部133は、統計情報格納部111に格納されている統計情報と、第一OCR部131が取得した2以上の第一OCR情報と、第二OCR部132が取得した2以上の第二OCR情報と、第三OCR部が取得した2以上の第三OCR情報とを用いて、2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する。
The third OCR unit performs third OCR processing on each of the two or more paper images, and obtains two or more pieces of third OCR information that is information on a predetermined area. The determining
これによって、OCRの精度の不足を、より効果的に補うことができ、その結果、各用紙に記載されている情報を読み取る精度が向上する。 This makes it possible to more effectively compensate for the lack of accuracy in OCR, and as a result, the accuracy of reading the information written on each sheet is improved.
また、OCR部の数をさらに増やすことで、読み取り精度の一層の向上が期待できる。 Furthermore, by further increasing the number of OCR units, it is expected that reading accuracy will further improve.
図20は、本実施の形態におけるプログラムを実行して、情報処理装置1等を実現するコンピュータシステム900の外観図である。本実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムによって実現され得る。図20において、コンピュータシステム900は、ディスクドライブ905を含むコンピュータ901と、キーボード902と、マウス903と、ディスプレイ904と、光学読取デバイス917とを備える。なお、キーボード902やマウス903やディスプレイ904や光学読取デバイス917をも含むシステム全体をコンピュータと呼んでもよい。
FIG. 20 is an external view of a
図21は、コンピュータシステム900の内部構成の一例を示す図である。図21において、コンピュータ901は、ディスクドライブ905に加えて、MPU911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM913と、アプリケーションプログラム、システムプログラム、およびデータを記憶するストレージ914と、MPU911、ROM912等を相互に接続するバス915と、外部ネットワークや内部ネットワーク等のネットワークへの接続を提供するネットワークカード916と、光学読取デバイス917と、を備える。ストレージ914は、例えば、ハードディスク、SSD、フラッシュメモリなどである。光学読取デバイス917は、例えば、カメラ、スキャナなどである。
FIG. 21 is a diagram showing an example of the internal configuration of the
コンピュータシステム900に、情報処理装置1等の機能を実行させるプログラムは、例えば、DVD、CD-ROM等のディスク921に記憶されて、ディスクドライブ905に挿入され、ストレージ914に転送されてもよい。これに代えて、そのプログラムは、ネットワークを介してコンピュータ901に送信され、ストレージ914に記憶されてもよい。プログラムは、実行の際にRAM913にロードされる。なお、プログラムは、ディスク921、またはネットワークから直接、ロードされてもよい。また、ディスク921に代えて他の着脱可能な記録媒体(例えば、DVDやメモリカード等)を介して、プログラムがコンピュータシステム900に読み込まれてもよい。
A program that causes the
プログラムは、コンピュータの詳細を示す901に、情報処理装置1等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能やモジュールを呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。
The program does not necessarily include an operating system (OS) that causes the
なお、上述したコンピュータシステム900は、サーバまたは据え置き型のPCであるが、端末装置2は、例えば、タブレット端末やスマートフォンやノートPCといった、携帯端末で実現されてもよい。この場合、例えば、キーボード902およびマウス903はタッチパネルに、ディスクドライブ905はメモリカードスロットに、ディスク921はメモリカードに、それぞれ置き換えられることが望ましい。
Note that although the
ただし、以上は例示であり、情報処理装置1等を実現するコンピュータのハードウェア構成は問わない。
However, the above is just an example, and the hardware configuration of the computer that implements the
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。 Note that in the above program, in the transmission step for transmitting information and the reception step for receiving information, processing is performed by hardware, such as processing performed by the modem or interface card in the transmission step (processing that can only be performed by hardware). Processing that is not carried out) is not included.
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、一のコンピュータが集中処理を行ってもよく、あるいは複数のコンピュータが分散処理を行ってもよい。 Further, the number of computers that execute the above program may be one or more. That is, one computer may perform centralized processing, or multiple computers may perform distributed processing.
また、上記実施の形態において、一の装置に存在する2以上の通信手段(端末送信部24、および端末受信部25など)は、物理的に一の媒体で実現されてもよいことは言うまでもない。
Furthermore, in the embodiment described above, it goes without saying that two or more communication means (
また、上記実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。 Furthermore, in the above embodiments, each process (each function) may be realized by being centrally processed by a single device (system), or by being distributed by a plurality of devices. It's okay.
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。 It goes without saying that the present invention is not limited to the above-described embodiments, and that various modifications can be made, and these are also included within the scope of the present invention.
以上のように、本発明にかかる情報処理装置は、OCRの精度の不足を補うことで、用紙に表記されている情報を的確に取得できるという効果を有し、情報処理装置等として有用である。 As described above, the information processing device according to the present invention has the effect of accurately acquiring information written on paper by compensating for the lack of accuracy in OCR, and is useful as an information processing device, etc. .
1 情報処理装置
2 端末装置
11 格納部
12 受付部
13 処理部
14 出力部
21 端末格納部
22 端末受付部
23 端末処理部
24 端末送信部
25 端末受信部
26 端末出力部
111 統計情報格納部
112 特別識別子格納部
121 用紙画像受付部
131 第一OCR部
132 第二OCR部
133 決定部
134 判断部
135 特別処理部
1
Claims (6)
前記2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付部と、
前記2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCR部と、
前記2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCR部と、
前記統計情報と前記2以上の第一OCR情報と前記2以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定部と、
前記決定部が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力部とを具備し、
前記統計情報は、前記2以上の各用紙に記載されている数値の和である、情報処理装置。 a statistical information storage unit that stores statistical information that is the result of statistical processing of the information written on each of the two or more sheets;
a paper image reception unit that receives a paper image that is an image obtained by reading each of the two or more papers;
a first OCR unit that performs first OCR processing on each of the two or more paper images and obtains two or more pieces of first OCR information that is information on a predetermined area;
a second OCR unit that performs second OCR processing on each of the two or more paper images and obtains two or more pieces of second OCR information that is information on a predetermined area;
a determining unit that determines correct OCR information that is OCR information corresponding to each of the two or more sheets using the statistical information, the two or more first OCR information, and the two or more second OCR information;
an output unit that outputs inspection information that is information regarding correct OCR information corresponding to each of the two or more sheets determined by the determination unit,
The information processing device, wherein the statistical information is a sum of numerical values written on each of the two or more sheets.
前記2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付部と、
前記2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCR部と、
前記2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCR部と、
前記統計情報と前記2以上の第一OCR情報と前記2以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定部と、
前記決定部が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力部とを具備し、
前記用紙画像受付部は、
前記2以上の各用紙に対して、2以上の異なる用紙画像を受け付け、
前記第一OCR部は、
前記2以上の各用紙ごとに、前記2以上の異なる各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得し、
前記第二OCR部は、
前記2以上の各用紙ごとに、前記2以上の異なる各用紙画像に対して、第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得し、
前記決定部は、
前記統計情報と前記4以上の第一OCR情報と前記4以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する、情報処理装置。 a statistical information storage unit that stores statistical information that is the result of statistical processing of the information written on each of the two or more sheets;
a paper image reception unit that receives a paper image that is an image obtained by reading each of the two or more papers;
a first OCR unit that performs first OCR processing on each of the two or more paper images and obtains two or more pieces of first OCR information that is information on a predetermined area;
a second OCR unit that performs second OCR processing on each of the two or more paper images and obtains two or more pieces of second OCR information that is information on a predetermined area;
a determining unit that determines correct OCR information that is OCR information corresponding to each of the two or more sheets using the statistical information, the two or more first OCR information, and the two or more second OCR information;
an output unit that outputs inspection information that is information regarding correct OCR information corresponding to each of the two or more sheets determined by the determination unit,
The paper image reception unit includes:
accepting two or more different paper images for each of the two or more papers;
The first OCR section includes:
Performing a first OCR process on each of the two or more different paper images for each of the two or more sheets to obtain two or more pieces of first OCR information that is information on a predetermined area;
The second OCR unit includes:
performing a second OCR process on each of the two or more different paper images for each of the two or more sheets to obtain two or more second OCR information that is information on a predetermined area;
The determining unit is
An information processing device that uses the statistical information, the four or more first OCR information, and the four or more second OCR information to determine correct OCR information that is OCR information that corresponds to each of the two or more sheets . .
前記2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付部と、
前記2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCR部と、
前記2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCR部と、
前記統計情報と前記2以上の第一OCR情報と前記2以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定部と、
前記決定部が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力部とを具備し、
前記2以上の各用紙には、識別子が表出しており、
前記第一OCR部または前記第二OCR部は、
前記2以上の各用紙画像に対するOCR処理により、予め決められた領域から識別子を取得し、
予め決められた特別処理を行う識別子である1以上の特別識別子が格納される特別識別子格納部と、
前記第一OCR部または前記第二OCR部が取得した識別子が特別識別子であるか否かを判断する判断部と、
前記判断部が特別識別子であると判断した識別子が表出した用紙に対して、予め決められた処理であり、前記決定部が正しいOCR情報を決定する決定処理の精度を高めるための処理である特別処理を行う特別処理部とをさらに具備する情報処理装置。 a statistical information storage unit that stores statistical information that is the result of statistical processing of the information written on each of the two or more sheets;
a paper image reception unit that receives a paper image that is an image obtained by reading each of the two or more papers;
a first OCR unit that performs first OCR processing on each of the two or more paper images and obtains two or more pieces of first OCR information that is information on a predetermined area;
a second OCR unit that performs second OCR processing on each of the two or more paper images and obtains two or more pieces of second OCR information that is information on a predetermined area;
a determining unit that determines correct OCR information that is OCR information corresponding to each of the two or more sheets using the statistical information, the two or more first OCR information, and the two or more second OCR information;
an output unit that outputs inspection information that is information regarding correct OCR information corresponding to each of the two or more sheets determined by the determination unit,
An identifier is exposed on each of the two or more sheets,
The first OCR unit or the second OCR unit,
Obtaining an identifier from a predetermined area by OCR processing on each of the two or more paper images,
a special identifier storage unit storing one or more special identifiers that are identifiers for performing predetermined special processing;
a determining unit that determines whether the identifier acquired by the first OCR unit or the second OCR unit is a special identifier;
This is a predetermined process for a sheet on which an identifier that has been determined by the determining unit to be a special identifier is displayed, and is a process for increasing the accuracy of the determining process in which the determining unit determines correct OCR information. An information processing device further comprising a special processing unit that performs special processing.
前記用紙画像受付部が、前記2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付ステップと、
前記第一OCR部が、前記2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCRステップと、
前記第二OCR部が、前記2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCRステップと、
前記決定部が、前記統計情報と前記2以上の第一OCR情報と前記2以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定ステップと、
前記出力部が、前記決定部が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力ステップとを含み、
前記統計情報は、前記2以上の各用紙に記載されている数値の和である、情報処理方法。 A statistical information storage section in which statistical information that is the result of statistical processing on information written on two or more sheets is stored, a paper image reception section, a first OCR section, a second OCR section, a determination section, and an output section. An information processing method realized,
a paper image receiving step in which the paper image receiving unit receives a paper image that is an image obtained by reading each of the two or more papers;
a first OCR step in which the first OCR unit performs a first OCR process on each of the two or more paper images to obtain two or more pieces of first OCR information that is information on a predetermined area; ,
a second OCR step in which the second OCR unit performs a second OCR process on each of the two or more paper images to obtain two or more pieces of second OCR information that is information on a predetermined area;
The determining unit determines correct OCR information that is OCR information corresponding to each of the two or more sheets using the statistical information, the two or more first OCR information, and the two or more second OCR information. a decision step to
an output step in which the output unit outputs inspection information that is information regarding correct OCR information corresponding to each of the two or more sheets determined by the determination unit,
The information processing method , wherein the statistical information is the sum of numerical values written on each of the two or more sheets .
前記2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付部と、
前記2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCR部と、
前記2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCR部と、
前記統計情報と前記2以上の第一OCR情報と前記2以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定部と、
前記決定部が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力部として機能させるためのプログラムであって、
前記統計情報は、前記2以上の各用紙に記載されている数値の和である、プログラム。 A computer that can access the statistical information storage unit where statistical information that is the result of statistical processing of the information written on each of the two or more sheets is stored,
a paper image reception unit that receives a paper image that is an image obtained by reading each of the two or more papers;
a first OCR unit that performs first OCR processing on each of the two or more paper images and obtains two or more pieces of first OCR information that is information on a predetermined area;
a second OCR unit that performs second OCR processing on each of the two or more paper images and obtains two or more pieces of second OCR information that is information on a predetermined area;
a determining unit that determines correct OCR information that is OCR information corresponding to each of the two or more sheets using the statistical information, the two or more first OCR information, and the two or more second OCR information;
A program for functioning as an output unit that outputs inspection information that is information regarding correct OCR information corresponding to two or more sheets determined by the determination unit,
The program, wherein the statistical information is the sum of numerical values written on each of the two or more sheets .
前記2以上の各用紙を読み込んだ画像である用紙画像を受け付ける用紙画像受付部と、a paper image reception unit that receives a paper image that is an image obtained by reading each of the two or more papers;
前記2以上の各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得する第一OCR部と、a first OCR unit that performs first OCR processing on each of the two or more paper images and obtains two or more pieces of first OCR information that is information on a predetermined area;
前記2以上の各用紙画像に対して第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得する第二OCR部と、a second OCR unit that performs second OCR processing on each of the two or more paper images and obtains two or more pieces of second OCR information that is information on a predetermined area;
前記統計情報と前記2以上の第一OCR情報と前記2以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定する決定部と、a determining unit that determines correct OCR information that is OCR information corresponding to each of the two or more sheets using the statistical information, the two or more first OCR information, and the two or more second OCR information;
前記決定部が決定した2以上の各用紙に対応する正しいOCR情報に関する情報である検査情報を出力する出力部として機能させるためのプログラムであって、A program for functioning as an output unit that outputs inspection information that is information regarding correct OCR information corresponding to two or more sheets determined by the determination unit,
前記用紙画像受付部は、The paper image reception unit includes:
前記2以上の各用紙に対して、2以上の異なる用紙画像を受け付け、accepting two or more different paper images for each of the two or more papers;
前記第一OCR部は、The first OCR section includes:
前記2以上の各用紙ごとに、前記2以上の異なる各用紙画像に対して、第一のOCR処理を行い、予め決められた領域の情報である2以上の第一OCR情報を取得し、Performing a first OCR process on each of the two or more different paper images for each of the two or more sheets to obtain two or more pieces of first OCR information that is information on a predetermined area;
前記第二OCR部は、The second OCR unit includes:
前記2以上の各用紙ごとに、前記2以上の異なる各用紙画像に対して、第二のOCR処理を行い、予め決められた領域の情報である2以上の第二OCR情報を取得し、performing a second OCR process on each of the two or more different paper images for each of the two or more sheets to obtain two or more second OCR information that is information on a predetermined area;
前記決定部は、The determining unit is
前記統計情報と前記4以上の第一OCR情報と前記4以上の第二OCR情報とを用いて、前記2以上の各用紙に対応するOCR情報であり、正しいOCR情報を決定するものとして、前記コンピュータを機能させるためのプログラム。The statistical information, the four or more first OCR information, and the four or more second OCR information are used to determine correct OCR information that corresponds to each of the two or more sheets. A program that allows a computer to function.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020009944A JP7393960B2 (en) | 2020-01-24 | 2020-01-24 | Information processing device, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020009944A JP7393960B2 (en) | 2020-01-24 | 2020-01-24 | Information processing device, information processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021117661A JP2021117661A (en) | 2021-08-10 |
JP7393960B2 true JP7393960B2 (en) | 2023-12-07 |
Family
ID=77174894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020009944A Active JP7393960B2 (en) | 2020-01-24 | 2020-01-24 | Information processing device, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7393960B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092546A (en) | 2000-09-20 | 2002-03-29 | Oki Software Kk | Character recognition method |
JP2010073201A (en) | 2008-08-20 | 2010-04-02 | Hammock:Kk | Ocr system |
JP2019169026A (en) | 2018-03-26 | 2019-10-03 | 株式会社Pfu | Information processing device, character recognition engine optimization method, and program |
JP2019204401A (en) | 2018-05-25 | 2019-11-28 | 富士ゼロックス株式会社 | Information processing apparatus and program |
-
2020
- 2020-01-24 JP JP2020009944A patent/JP7393960B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092546A (en) | 2000-09-20 | 2002-03-29 | Oki Software Kk | Character recognition method |
JP2010073201A (en) | 2008-08-20 | 2010-04-02 | Hammock:Kk | Ocr system |
JP2019169026A (en) | 2018-03-26 | 2019-10-03 | 株式会社Pfu | Information processing device, character recognition engine optimization method, and program |
JP2019204401A (en) | 2018-05-25 | 2019-11-28 | 富士ゼロックス株式会社 | Information processing apparatus and program |
Also Published As
Publication number | Publication date |
---|---|
JP2021117661A (en) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10607073B2 (en) | Systems and methods for classifying payment documents during mobile image processing | |
US8611635B1 (en) | Duplicate check detection | |
EP1917628B1 (en) | Real time image quality analysis and verification | |
US20220027613A1 (en) | Systems and methods for assessing standards for mobile image quality | |
US9311634B1 (en) | Systems and methods for automatic bill pay enrollment | |
US8793191B2 (en) | System and method for duplicate detection | |
US11514548B1 (en) | Machine-learning for enhanced machine reading of non-ideal capture conditions | |
US11694499B2 (en) | Systems and methods for updating an image registry for use in fraud detection related to financial documents | |
CN101641721A (en) | Biometric matching method and apparatus | |
US11669839B2 (en) | System and method for processing a digital transaction | |
CN112417516A (en) | File processing method, device, equipment and medium | |
JP7393960B2 (en) | Information processing device, information processing method, and program | |
US20150178346A1 (en) | Using biometric data to identify data consolidation issues | |
US20210090086A1 (en) | Systems and methods for fraud detection for images of financial documents | |
JP2019219955A (en) | Information processor, program, and management system | |
US20090112756A1 (en) | Method and system for processing negotiable instruments | |
CN113128188A (en) | Bank payroll generation method, device and medium | |
TWM584951U (en) | Insurance financial electronic system | |
US20240155064A1 (en) | Photo-based workflow initiation | |
CN115640952A (en) | Method and system for importing and uploading data | |
US20230367449A1 (en) | Dual-view graphical user interface for coordinating and synchronizing data entry | |
CN116703415A (en) | Inquiry letter information processing method and device | |
CN112581134A (en) | Data verification method, device and system | |
JP2023168490A (en) | Transfer data input support apparatus, transfer data input support method, and program | |
CN114936917A (en) | Bill clearing method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7393960 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |