JP2022014856A - OCR recognition accuracy improvement support system and program - Google Patents

OCR recognition accuracy improvement support system and program Download PDF

Info

Publication number
JP2022014856A
JP2022014856A JP2020206253A JP2020206253A JP2022014856A JP 2022014856 A JP2022014856 A JP 2022014856A JP 2020206253 A JP2020206253 A JP 2020206253A JP 2020206253 A JP2020206253 A JP 2020206253A JP 2022014856 A JP2022014856 A JP 2022014856A
Authority
JP
Japan
Prior art keywords
image data
image
ocr
processing
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020206253A
Other languages
Japanese (ja)
Inventor
明 野口
Akira Noguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Publication of JP2022014856A publication Critical patent/JP2022014856A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

To easily and surely improve character recognition accuracy while executing character recognition processing for the entire paper space for paper media in various types and formats.SOLUTION: Information processing apparatuses 10a, 10b constituting a system 1 for supporting improvement of character recognition accuracy with OCR comprise: an image data generation unit 11 which generates character information expressed in a document as image data by scanning an object document; an image adjustment processing unit 12 which changes a prescribed image processing value for the image data generated by the image data generation unit 11; and an OCR image data generation unit 13 which generates prescribed OCR information by performing character recognition processing for the adjusted image data in which the image processing value is changed by the image adjustment processing unit 12 and outputs the OCR information in association with the image data generated by the image data generation unit 11.SELECTED DRAWING: Figure 1

Description

本発明は、例えば自賠責保険の損害調査関係書類などのように、様々な種類やフォーマットの紙媒体の資料について、OCRの認識精度を向上させるための支援技術に関する。 The present invention relates to an assistive technique for improving the recognition accuracy of OCR for various types and formats of paper-based materials such as documents related to damage investigation of automobile liability insurance.

一般に、紙媒体に表示された文書(文字)を光学的に読み取って画像データを生成し、その画像データに対して文字認識処理を実行して、当該文書に示された文字を電子データ(テキストデータ)に変換するOCR(Optical Character Reader)技術が広く知られている。
この種のOCR技術では、紙媒体をスキャナ等で読み取って生成した画像データに対して文字認識処理を行い、認識された文字のテキスト情報(文字コード)を画像データと関連付けて記憶し、文字列を検索可能な画像データ(例えばPDF:Potable Document Format)として生成・出力できるようになっている。
Generally, a document (character) displayed on a paper medium is optically read to generate image data, character recognition processing is performed on the image data, and the character shown in the document is electronic data (text). OCR (Optical Character Reader) technology for converting data) is widely known.
In this type of OCR technology, image data generated by scanning a paper medium with a scanner or the like is subjected to character recognition processing, and the text information (character code) of the recognized characters is stored in association with the image data and is stored as a character string. Can be generated and output as searchable image data (for example, PDF: Potable Document Form).

このようなOCR技術によれば、紙媒体に表された文字情報を、電子情報(テキストデータ)に変換して検索・編集・加工等が行えるようになることから、例えば役所や企業,公共施設など、紙媒体で作成された文書に基づく申請や申し込み・事務処理などの場面において広く活用されている。
ところで、これまでのOCR処理では、紙媒体が同じ大きさや種類・フォーマットで作成され、そこに表される文字も同じフォントや文字サイズの活字であれば、比較的高精度に文字認識が可能である一方、紙媒体の種類やフォーマットが様々であったり、表示されている文字のフォントやサイズもマチマチであるような場合、OCR処理による文字認識精度が大きく低下してしまうことがあった。
With such OCR technology, textual information displayed on paper media can be converted into electronic information (text data) for search, editing, processing, etc., for example, government offices, companies, and public facilities. It is widely used in applications, applications, and paperwork based on documents created in paper media.
By the way, in the conventional OCR processing, if the paper medium is created with the same size, type and format, and the characters represented there are also printed with the same font and character size, character recognition is possible with relatively high accuracy. On the other hand, when the type and format of the paper medium are various, and the font and size of the displayed characters are also gusseted, the character recognition accuracy by the OCR processing may be significantly deteriorated.

このようなOCR処理における文字認識精度の課題に対応するため、これまで、紙媒体の特定の領域(フィールド)に示された文字のみを読み取り対象とすることで、当該領域に表された文字についての文字認識精度を高めることが行われている。
例えば、特許文献1には、スキャナで読み取られる紙媒体について、特定の照合領域(例えば各用紙の左上)を予め設定し、その照合領域に含まれる文字列のみについてOCR処理を実行することにより、照合領域に含まれる文字の認識精度を高めることができるようにする、という技術が提案されている。
In order to deal with the problem of character recognition accuracy in such OCR processing, until now, by reading only the characters shown in a specific area (field) of the paper medium, the characters displayed in the area are read. The character recognition accuracy of is improved.
For example, in Patent Document 1, a specific collation area (for example, the upper left of each sheet) is set in advance for a paper medium read by a scanner, and OCR processing is executed only for a character string included in the collation area. A technique has been proposed in which the recognition accuracy of characters included in the collation area can be improved.

特開2019-149073号公報Japanese Unexamined Patent Publication No. 2019-149073

しかしながら、特許文献1に開示されている技術では、特定の照合領域に表された文字しか認識処理にかけることができないことから、紙媒体の様々な領域に表される様々な文字について認識処理を行うことができず、実用性や汎用性に乏しいものであった。
一般に、役所や企業などで事務処理の対象となる紙媒体による申請書類などは、大きさもフォーマットも種々異なる様々な申込書や申請書類、各種の添付資料などが含まれ、それらの紙媒体のそれぞれについて、様々な領域に表される様々な文字についての文字認識処理を行うことが要請される。
However, in the technique disclosed in Patent Document 1, since only the characters represented in a specific collation area can be subjected to the recognition process, the recognition process is performed on various characters represented in various areas of the paper medium. It could not be done, and it was not practical or versatile.
In general, application documents in paper media that are subject to paperwork at government offices and companies include various application forms and application documents of various sizes and formats, various attached materials, etc., and each of these paper media Is required to perform character recognition processing for various characters represented in various areas.

例えば、自賠責保険の損害調査の場合には、申請書となる「自賠責保険損害調査関係書類送付書兼保険金支払請求書」と、そこに添付される複数の添付書類、例えば事故証明・医師の診断書・診療報酬明細書・領収書など、様々な種類やフォーマットの紙媒体が50枚前後に亘って作成・提出され、それらの資料を1枚ずつ精査しながら事務処理を行う必要がある。そのような種類もフォーマットも異なる複数の紙媒体を処理する場合、単に「特定の照合領域」のみについて文字認識処理が行えるだけでは、実際の事務処理作業にはほとんど役に立たなかった。 For example, in the case of a liability insurance damage investigation, the application form "Invoice for CALI Damage Investigation Documents and Insurance Claims" and multiple attached documents attached to it, such as accident proof / doctor's About 50 paper media of various types and formats, such as medical statements, medical fee statements, and receipts, are created and submitted, and it is necessary to carry out paperwork while carefully examining these materials one by one. When processing a plurality of paper media of different types and formats, simply performing character recognition processing only on a "specific collation area" was of little use in actual paperwork.

本発明は、以上のような従来の技術が有する課題を解決するために提案されたものであり、種類もフォーマットも様々に異なる紙媒体について、紙面全体についての文字認識処理を実行しつつ、その文字認識精度を簡易かつ確実に向上させることができる、例えば自賠責保険の損害調査関係書類などの事務処理に好適な、OCR認識精度向上支援システム及びプログラムの提供を目的とする。 The present invention has been proposed in order to solve the problems of the above-mentioned conventional techniques, and the present invention is performed on a paper medium having various types and formats while performing character recognition processing on the entire paper surface. The purpose is to provide an OCR recognition accuracy improvement support system and a program that can easily and surely improve the character recognition accuracy, for example, suitable for paperwork such as damage investigation related documents of liability insurance.

上記目的を達成するため、本発明のOCR認識精度向上支援システムは、OCRによる文字認識精度の向上を支援するためのシステムであって、当該システムを構成する情報処理装置が、対象となる文書をスキャンして、当該文書に表された文字情報を画像データとして生成する画像データ生成部と、前記画像データ生成部で生成された画像データについて、所定の画像処理値を変更する画像調整処理部と、前記画像調整処理部で画像処理値を変更された調整後画像データについて文字認識処理を行い、所定のOCR情報を生成するとともに、当該OCR情報を、前記画像データ生成部で生成された画像データと関連付けて出力するOCR画像データ生成部と、を備える構成としてある。 In order to achieve the above object, the OCR recognition accuracy improvement support system of the present invention is a system for supporting the improvement of character recognition accuracy by OCR, and the information processing apparatus constituting the system can display a target document. An image data generation unit that scans and generates character information represented in the document as image data, and an image adjustment processing unit that changes predetermined image processing values for the image data generated by the image data generation unit. , Character recognition processing is performed on the adjusted image data whose image processing value has been changed by the image adjustment processing unit to generate predetermined OCR information, and the OCR information is generated by the image data generation unit. It is configured to include an OCR image data generation unit that outputs in association with the above.

また、本発明は、上記のような本発明に係るOCR認識精度向上支援システムを構成する情報処理装置で実行される、OCR認識精度向上支援プログラムとして構成することができる。
さらに、本発明は、上記のような本発明に係るOCR認識精度向上支援システム及びプログラムによって実施可能な、OCR認識精度向上支援方法として構成することもできる。
Further, the present invention can be configured as an OCR recognition accuracy improvement support program executed by the information processing apparatus constituting the OCR recognition accuracy improvement support system according to the present invention as described above.
Further, the present invention can also be configured as an OCR recognition accuracy improvement support method that can be implemented by the OCR recognition accuracy improvement support system and the program according to the present invention as described above.

本発明によれば、種類もフォーマットも様々に異なる紙媒体について、紙面全体についての文字認識処理を実行しつつ、その文字認識精度を簡易かつ確実に向上させることが可能となる。
これによって、例えば自賠責保険の損害調査関係書類などの事務処理に好適な、利便性や汎用性・拡張性に優れたOCR認識精度向上支援システムを提供することができる。
According to the present invention, it is possible to easily and surely improve the character recognition accuracy of a paper medium having various types and formats while performing character recognition processing on the entire paper surface.
This makes it possible to provide an OCR recognition accuracy improvement support system having excellent convenience, versatility, and expandability, which is suitable for paperwork such as documents related to damage investigation of compulsory automobile liability insurance.

本発明の一実施形態に係るOCR認識精度向上支援システムの全体構成を模式的に示すブロック図である。It is a block diagram which shows typically the whole structure of the OCR recognition accuracy improvement support system which concerns on one Embodiment of this invention. 本発明の一実施形態に係るOCR認識精度向上支援システムにおける画像処理値の調整として、コントラストを変化させた場合の説明図であり、(a)は、「もとの画像」を「コントラスト+80の画像」に変化させた場合、(b)は、更に「コントラスト+110」→「コントラスト+120」→「コントラスト127」と変化させた場合を示している。It is explanatory drawing when the contrast is changed as the adjustment of the image processing value in the OCR recognition accuracy improvement support system which concerns on one Embodiment of this invention, and (a) is the "original image" of "contrast +80". When changed to "image", (b) shows a case where "contrast +110"-> "contrast +120"-> "contrast 127" is further changed. 本発明の一実施形態に係るOCR認識精度向上支援システムにおける画像処理値の調整として、コントラストを変化させた場合の説明図であり、「もとの画像」からコントラストを10ずつ変化させて、「コントラスト+10」~「コントラスト+100」まで変化させた場合を示している。It is explanatory drawing when the contrast is changed as the adjustment of the image processing value in the OCR recognition accuracy improvement support system which concerns on one Embodiment of this invention, and the contrast is changed by 10 from the "original image", and " The case where the contrast is changed from "contrast +10" to "contrast +100" is shown. 本発明の一実施形態に係るOCR認識精度向上支援システムにおける処理動作を示すフローチャートである。It is a flowchart which shows the processing operation in the OCR recognition accuracy improvement support system which concerns on one Embodiment of this invention. 本発明の一実施形態に係るOCR認識精度向上支援システムでの処理対象となる紙媒体をスキャンして得られた画像データの一例であり、(a)は画像調整処理前の元データを、(b)は画像調整処理後のデータを示している。It is an example of the image data obtained by scanning the paper medium to be processed by the OCR recognition accuracy improvement support system according to the embodiment of the present invention, and (a) is the original data before the image adjustment processing (a). b) shows the data after the image adjustment processing. 図5に示す画像データに対してOCR処理の実行結果を示しており、(a)は画像調整処理前の元データについての実行結果、(b)は画像調整処理後のデータについての実行結果である。The execution result of the OCR processing is shown for the image data shown in FIG. 5, (a) is the execution result of the original data before the image adjustment processing, and (b) is the execution result of the data after the image adjustment processing. be. 本発明の一実施形態に係るOCR認識精度向上支援システムでのOCR処理の結果、文字列検索が可能となったPDFデータの一例を示している。An example of PDF data that enables character string search as a result of OCR processing in the OCR recognition accuracy improvement support system according to the embodiment of the present invention is shown. 本発明の一実施形態に係るOCR認識精度向上支援システムでのOCR処理による識字率の結果(定量評価)を示す表である。It is a table which shows the result (quantitative evaluation) of the literacy rate by the OCR processing in the OCR recognition accuracy improvement support system which concerns on one Embodiment of this invention. OCR認識精度向上支援システムにおけるサーバ装置又はユーザ端末のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware composition of the server apparatus or the user terminal in the OCR recognition accuracy improvement support system.

以下、本発明に係るOCR認識精度向上支援システムの実施形態について、図面を参照しつつ説明する。
ここで、以下に示す本発明のOCR認識精度向上支援システムは、プログラム(ソフトウェア)の命令によりコンピュータで実行される処理,手段,機能によって実現される。プログラムは、コンピュータの各構成要素に指令を送り、以下に示す本発明に係る所定の処理や機能等を行わせることができる。
すなわち、本発明における各処理や手段,機能は、プログラムとコンピュータとが協働した具体的手段によって実現される。
Hereinafter, embodiments of the OCR recognition accuracy improvement support system according to the present invention will be described with reference to the drawings.
Here, the OCR recognition accuracy improvement support system of the present invention shown below is realized by processing, means, and functions executed by a computer in response to a program (software) instruction. The program can send a command to each component of the computer to perform predetermined processing, functions, and the like according to the present invention shown below.
That is, each process, means, and function in the present invention is realized by concrete means in which a program and a computer cooperate.

なお、プログラムの全部又は一部は、例えば、磁気ディスク,光ディスク,半導体メモリ,その他任意のコンピュータで読取り可能な記録媒体により提供され、記録媒体から読み出されたプログラムがコンピュータにインストールされて実行される。また、プログラムは、記録媒体を介さず、通信回線を通じて直接にコンピュータにロードし実行することもできる。
また、本発明に係るOCR認識精度向上支援システムを構成するコンピュータは、単一の情報処理装置(例えば1台のパーソナルコンピュータや1台のMFP等)で構成することもでき、複数の情報処理装置(例えば複数台のコンピュータやスキャナ,複写機等)で構成することもできる。
All or part of the program is provided by, for example, a magnetic disk, an optical disk, a semiconductor memory, or any other computer-readable recording medium, and the program read from the recording medium is installed and executed in the computer. To. The program can also be loaded and executed directly on the computer via a communication line without going through a recording medium.
Further, the computer constituting the OCR recognition accuracy improvement support system according to the present invention may be configured by a single information processing device (for example, one personal computer, one MFP, etc.), and a plurality of information processing devices. It can also be configured with (for example, multiple computers, scanners, copiers, etc.).

[システム構成]
図1に、本発明の一実施形態に係るOCR認識精度向上支援システムの全体構成を示す。
同図に示すように、本実施形態に係るOCR認識精度向上支援システム1(以下、単に「本システム1」ともいう)は、OCRによる文字認識精度の向上を支援するためのシステムであって、クライアントPC10aとMFP10bとで構成される情報処理装置(OCR認識精度向上支援装置10)によって実現されるようになっている。
クライアントPC10aは、例えばパーソナルコンピュータ等の情報処理装置であり、MFP(Multi Function Peripheral)10bは、所謂複合機とも呼ばれる画像形成装置である。
[System configuration]
FIG. 1 shows the overall configuration of the OCR recognition accuracy improvement support system according to the embodiment of the present invention.
As shown in the figure, the OCR recognition accuracy improvement support system 1 (hereinafter, also simply referred to as “this system 1”) according to the present embodiment is a system for supporting the improvement of character recognition accuracy by OCR. It is realized by an information processing device (OCR recognition accuracy improvement support device 10) composed of a client PC 10a and an MFP 10b.
The client PC 10a is an information processing device such as a personal computer, and the MFP (Multi Function Peripheral) 10b is an image forming device also called a so-called multifunction device.

これらクライアントPC10a及びMFP10bは、有線・無線のネットワークを介して、互いにデータ通信可能に接続されるようになっている。
クライアントPC10aは、MFP10bで読み取られて生成される紙媒体の画像データを受信すると、当該画像データに対して本発明に係る画像調整処理・OCR処理を実行して、画像データにOCR情報が関連付けられた所定のOCR画像データを生成・出力する。
MFP10bは、本システム1の処理対象となる紙媒体の文書がスキャンにかけられると、その紙媒体の表面を読み取って画像データを生成するとともに、生成された画像データを、ネットワークを介してクライアントPC10aに送信する。
These client PCs 10a and MFP10b are connected to each other so as to be capable of data communication via a wired / wireless network.
When the client PC 10a receives the image data of the paper medium read and generated by the MFP 10b, the client PC 10a executes the image adjustment processing / OCR processing according to the present invention on the image data, and the OCR information is associated with the image data. Generates and outputs predetermined OCR image data.
When a document on a paper medium to be processed by the system 1 is scanned, the MFP10b reads the surface of the paper medium to generate image data, and transfers the generated image data to the client PC 10a via a network. Send.

具体的には、本システム1では、まずMFP10bにおいて、(1)1枚又は複数枚を一単位とした紙媒体(文書)がスキャンされて読み取りが行われ、紙媒体の枚数に応じた複数の画像データを生成される。さらに、それら紙媒体単位(例えば一括事案単位)の一又は複数の画像データに基づいて、単一(1個)のPDF(Portable Document Format)ファイルが生成される。その紙媒体毎のPDFファイルは、ネットワークを介してクライアントPC10aに送信される。
ここで、MFP10bで生成される画像データとしては、例えばJPEG(Joint Photographic Experts Group)ファイルや、TIFF(Tagged Image File Format)ファイル等、既存の画像データ・画像ファイルである。
Specifically, in the present system 1, first, in the MFP 10b, (1) a paper medium (document) having one or more sheets as one unit is scanned and read, and a plurality of sheets according to the number of paper media are scanned. Image data is generated. Further, a single PDF (Portable Document Format) file is generated based on one or a plurality of image data of each paper medium unit (for example, a batch case unit). The PDF file for each paper medium is transmitted to the client PC 10a via the network.
Here, the image data generated by the MFP 10b is an existing image data / image file such as a JPEG (Joint Photographic Experts Group) file or a TIFF (Tagged Image File Form) file.

MFP10bから紙媒体毎のPDFファイルを受信したクライアントPC10aでは、(2)受信されたPDFファイルが、元の紙媒体単位の1枚又は複数枚の画像データに変換され、その後、(3)所定の画像調整処理(コントラスト・明るさの変更)が実行され、(4)画像調整処理が行われた画像データは、紙面全体に相当する領域についてOCR処理にかけられ文字認識が実行され、その後、紙媒体端の単一(1個)のPDFファイルに再度変換され、(5)そのPDFファイルに文字認識されたOCR情報(テキスト情報)が関連付けて記憶され、(6)最終的にOCR情報が付加された、所定の文字列を検索可能なPDFファイルが生成・出力される。 In the client PC 10a that receives the PDF file for each paper medium from the MFP 10b, (2) the received PDF file is converted into one or more image data of the original paper medium unit, and then (3) a predetermined image data. Image adjustment processing (change of contrast / brightness) is executed, and (4) the image data that has undergone image adjustment processing is subjected to OCR processing for the area corresponding to the entire paper surface, character recognition is executed, and then the paper medium. It is converted again into a single (one) PDF file at the end, (5) OCR information (text information) recognized as characters is associated and stored in the PDF file, and (6) OCR information is finally added. In addition, a PDF file that can search for a predetermined character string is generated and output.

このように、本システム1では、概要以下のような処理・ステップが実行される。
(1)紙媒体の読み取りによるPDFファイルの生成。
(2)PDFファイルの画像データへの変換。
(3)画像データに対する画像調整処理の実行。
(4)画像調整処理後の画像データのOCR処理及びPDFファイルへの再変換。
(5)PDFファイルに対するOCR情報の付加。
(6)OCR情報付きPDFファイルの出力。
As described above, in the present system 1, the following processes / steps are executed.
(1) Generation of PDF file by reading paper media.
(2) Conversion of PDF files to image data.
(3) Execution of image adjustment processing for image data.
(4) OCR processing of image data after image adjustment processing and reconversion to PDF file.
(5) Addition of OCR information to the PDF file.
(6) Output of PDF file with OCR information.

なお、本システム1では、上述した(1)~(6)の処理のうち、(1)の紙媒体の読み取り処理をMFP10bで行い、(2)~(6)の画像調整処理・OCR処理をクライアントPC10aで行うようにしているが、これらは一例である。
例えば(2)~(6)の画像調整処理・OCR処理の一部又は全部を、MFP10b側で行うようにすることもできる。
また、(1)の紙媒体の読み取り処理を、スキャナを備えたクライアントPC10a側で行うようにすることもできる。
In this system 1, among the above-mentioned processes (1) to (6), the paper medium reading process (1) is performed by the MFP 10b, and the image adjustment process / OCR process of (2) to (6) is performed. It is done on the client PC 10a, but these are examples.
For example, a part or all of the image adjustment processing / OCR processing of (2) to (6) may be performed on the MFP10b side.
Further, it is also possible to perform the reading process of the paper medium (1) on the client PC 10a provided with the scanner.

すなわち、上記(1)~(6)の処理は、本システム1のいずれかの装置・機能において実行されれば良いものであって、いずれの装置・機能において実行されるかは特に限定されるものではない。
また、MFP10bは、紙媒体の読み取り処理を行うスキャン機能を備える手段であれば、どのような装置・機能であっても良く、例えば、MFP10bに代えて、上述したようなクライアントPC10aに接続されたスキャナやコピー機等であっても良い。
That is, the processes (1) to (6) may be executed in any of the devices / functions of the system 1, and which device / function is executed is particularly limited. It's not a thing.
Further, the MFP 10b may be any device / function as long as it is a means having a scanning function for reading a paper medium. For example, the MFP 10b is connected to the client PC 10a as described above instead of the MFP 10b. It may be a scanner, a copier, or the like.

また、上記(1)~(2)のステップにおいては、(1)PDFファイル→(2)画像データへの変換を行っているが、PDFファイルを介さずに、(1)紙媒体の読み取り→(2)画像データへの変換、という処理を行うことも可能である。
但し、この場合、スキャナ(MFP10b)で紙媒体を読み取ると、紙媒体の枚数と同数の画像ファイル(例えば50個超)ができてしまうため、その後の処理においては、それら複数のファイル1つ1つについてファイル名を指定した処理が必要となり、処理動作が煩雑となる。したがって、PDFファイルを介して、複数の画像ファイルを1個のPDFファイルとして処理することが望ましい。
つまり、複数個の画像ファイルに対して、ファイル名がランダムに付与されることについて、紙媒体に対応した順番(ページ順)を担保しつつシステムで読み取り(画像データ生成)ができれば、PDFファイルを介さない方法でも対応は可能である。
Further, in the steps (1) to (2) above, (1) PDF file → (2) conversion to image data is performed, but (1) reading of the paper medium → without going through the PDF file. (2) It is also possible to perform a process of conversion to image data.
However, in this case, if the paper medium is read by the scanner (MFP10b), the same number of image files (for example, more than 50) as the number of paper media are created. Therefore, in the subsequent processing, each of the plurality of files is one. Processing that specifies the file name is required for each, and the processing operation becomes complicated. Therefore, it is desirable to process a plurality of image files as one PDF file via the PDF file.
In other words, if the system can read (image data generation) while ensuring the order (page order) corresponding to the paper medium, the PDF file will be read as the file name is randomly assigned to multiple image files. It is also possible to respond by a method that does not go through.

なお、上記(4)のステップにおける、画像調整処理後の画像データのOCR処理後のPDFファイルへの再変換は、(5)のステップにより、OCR処理で認識された文字情報をPDFファイルで検索等が行えるように付加するために、画像データのPDFファイル化と、認識された文字のマッピングを同時に行っていることから、必須の処理となる。
すなわち、上記(4)~(5)のステップでは、OCR処理された結果として、文字認識されたテキストファイルとPDFファイルの両方が生成され、PDFファイルにはテキストデータが関連付けられて(被さられて)記憶されるようになっており、これによって、PDFファイル中のどの文字が、文字認識されたいずれの文字であるかが、検索・抽出できるようになっている。換言すれば、上記(5)の「PDFファイルに対するOCR情報の付加」は、より正確には「PDFファイルに対して、OCR処理(文字認識)で認識された文字をマッピングする」ということになる。
In the step (4) above, the reconversion of the image data after the image adjustment process to the PDF file after the OCR process is performed by searching the PDF file for the character information recognized by the OCR process in the step (5). This is an indispensable process because the image data is converted into a PDF file and the recognized characters are mapped at the same time in order to add the image data so that the image data can be added.
That is, in the steps (4) to (5) above, both the character-recognized text file and the PDF file are generated as a result of the OCR processing, and the text data is associated (covered) with the PDF file. It is memorized so that it is possible to search and extract which character in the PDF file is which character is recognized. In other words, the "addition of OCR information to the PDF file" in (5) above is more accurately "mapping the characters recognized by the OCR process (character recognition) to the PDF file". ..

以上のように、本システム1で生成されるファイルとしては、必ずしもPDFファイルのみに限らず、例えばJPEG(Joint Photographic Experts Group)ファイルや、TIFF(Tagged Image Fi le Format)ファイル等であっても運用が可能な場合がある。
但し、システム運用上の効率性や利便性等の観点からは、上述したとおり、PDFファイルに変換・生成して処理を行うことが好ましい。
As described above, the file generated by the system 1 is not necessarily limited to the PDF file, but may be, for example, a JPEG (Joint Photographic Experts Group) file, a TIFF (Tagged Image File Form) file, or the like. May be possible.
However, from the viewpoint of efficiency and convenience in system operation, it is preferable to convert / generate a PDF file and perform processing as described above.

[本システムの機能]
以上のような構成からなる本システム1(クライアントPC10a・MFP10b)は、より具体的には、図1に示すように、画像データ生成部11,画像調整処理部12,OCR画像データ生成部13の各部として機能・動作するようになっている。
[Functions of this system]
More specifically, as shown in FIG. 1, the system 1 (client PC10a / MFP10b) having the above configuration includes an image data generation unit 11, an image adjustment processing unit 12, and an OCR image data generation unit 13. It is designed to function and operate as each part.

[画像データ生成部]
画像データ生成部11は、対象となる文書をスキャンして、当該文書に表された文字情報を画像データとして生成する、上記ステップ(1)を実行する手段である。
具体的には、画像データ生成部11は、MFP10bのスキャン機能により、1枚又は複数枚を一単位とした紙媒体(文書)を読み取り、紙媒体の枚数に応じた複数の画像データを生成する。また、画像データ生成部11は、紙媒体単位の一又は複数の画像データに基づいて、単一(1個)のPDFファイルを生成する。
画像データ生成部11で生成された紙媒体毎のPDFファイルは、MFP10bのデータ送信機能により、ネットワークを介してクライアントPC10aに送信される。
[Image data generator]
The image data generation unit 11 is a means for executing the above step (1) of scanning a target document and generating character information represented in the document as image data.
Specifically, the image data generation unit 11 reads a paper medium (document) having one or more sheets as one unit by the scanning function of the MFP 10b, and generates a plurality of image data according to the number of paper media. .. Further, the image data generation unit 11 generates a single (one) PDF file based on one or a plurality of image data in a paper medium unit.
The PDF file for each paper medium generated by the image data generation unit 11 is transmitted to the client PC 10a via the network by the data transmission function of the MFP 10b.

[画像調整処理部]
画像調整処理部12は、画像データ生成部11で生成された画像データについて、所定の画像処理値を変更する、上記ステップ(2)及び(3)を実行する手段である。
具体的には、画像調整処理部12は、クライアントPC10aのデータ変換機能により、MFP10bから送信されたPDFファイルを、元の紙媒体単位の1枚又は複数枚の画像データに変換するとともに、その画像データに対して、所定の画像処理値(コントラスト・明るさ)を変更・調整する画像調整処理を実行する。
その後、画像調整処理部12で画像調整処理が行われた画像データは、OCR画像データ生成部13に出力され、所定のOCR処理(文字認識処理)が実行される。
[Image adjustment processing unit]
The image adjustment processing unit 12 is a means for executing the above steps (2) and (3) of changing a predetermined image processing value for the image data generated by the image data generation unit 11.
Specifically, the image adjustment processing unit 12 converts the PDF file transmitted from the MFP 10b into one or a plurality of image data of the original paper medium unit by the data conversion function of the client PC 10a, and the image thereof. Performs image adjustment processing for changing / adjusting predetermined image processing values (contrast / brightness) for data.
After that, the image data subjected to the image adjustment processing by the image adjustment processing unit 12 is output to the OCR image data generation unit 13, and a predetermined OCR processing (character recognition processing) is executed.

ここで、画像調整処理部12は、画像データに対して実行する画像調整処理として、
当該画像データに設定されている画像処理値のうち、画像のコントラスト及び明るさの少なくともいずれかを変更・調整する処理を実行する。
紙媒体の紙面全体の領域についてOCR処理をかけて文字認識率を向上させる方法として、本願の発明者は、まず、画像の解像度を上げてみたところ、処理速度が大幅に遅くなるだけで、文字認識率が向上しないことが分かった。具体的には、複数ページのPDFファイルを1ページのJpgファイル、あるいはPngファイルに分解し、dpi300→600→1200と解像度を上げてOCR処理を行ったところ、いずれの解像度でも文字認識率にはほとんど変化が無く、むしろ解像度を上げることでOCR処理速度が遅くなるため、解像度としてはdpi300で十分であることが分かった。
Here, the image adjustment processing unit 12 performs image adjustment processing on the image data as an image adjustment process.
Of the image processing values set in the image data, processing for changing / adjusting at least one of the contrast and brightness of the image is executed.
As a method of applying OCR processing to the entire area of the paper surface of the paper medium to improve the character recognition rate, the inventor of the present application first tried to increase the resolution of the image, but the processing speed was significantly slowed down, and the characters were displayed. It turned out that the recognition rate did not improve. Specifically, when a multi-page PDF file was decomposed into a one-page Jpg file or a Png file, and OCR processing was performed by increasing the resolution from dipi300 → 600 → 1200, the character recognition rate was improved at any resolution. It was found that dpi300 is sufficient as the resolution because there is almost no change and the OCR processing speed becomes slower by increasing the resolution.

また、読み取り対象となる紙媒体に示された文字について、例えば見出し文字のようなフォントサイズの大きな文字であっても、認識できない事象が発生することが分かった。したがって、画像データを拡大して文字サイズを大きくしても文字認識率は向上しないことが分かった。
そして、本願の発明者は、鋭意研究の末に、画像のコントラスト及び明るさを変更したところ、所定の値において文字認識率が飛躍的に向上することを見出した。
そこで、本システム1では、画像調整処理部12により、紙媒体が読み取られて生成された画像データに対して実行する画像調整処理として、当該画像データに設定されている画像処理値のうち、画像のコントラスト及び明るさの少なくともいずれかを変更・調整する処理を実行することとした。
Further, it has been found that an unrecognizable phenomenon occurs in the characters shown on the paper medium to be read even if the characters have a large font size such as headline characters. Therefore, it was found that the character recognition rate does not improve even if the image data is enlarged to increase the character size.
Then, the inventor of the present application has found that, after diligent research, when the contrast and brightness of the image are changed, the character recognition rate is dramatically improved at a predetermined value.
Therefore, in the present system 1, the image among the image processing values set in the image data as the image adjustment processing executed for the image data generated by reading the paper medium by the image adjustment processing unit 12 is an image. It was decided to execute a process of changing / adjusting at least one of the contrast and the brightness of the image.

[画像処理値の設定ロジック]
具体的には、本システム1では、画像調整処理部12により、画像データのコントラスト及び明るさの少なくともいずれかを、所定値ずつ変化させて、所定の設定値に変更・設定するようにしている。
[コントラスト調整]
図2及び図3は、本システム1における画像処理値の調整として、コントラストを変化させた場合の説明図であり、図2(a)は、「もとの画像」を「コントラスト+80の画像」に変化させた場合、図2(b)は、更に「コントラスト+110」→「コントラスト+120」→「コントラスト127」と変化させた場合を示している。
また、図3は、「もとの画像」からコントラストを10ずつ変化させて、「コントラスト+10」~「コントラスト+100」まで変化させた場合を示している。
[Image processing value setting logic]
Specifically, in the present system 1, the image adjustment processing unit 12 changes at least one of the contrast and the brightness of the image data by a predetermined value to change and set it to a predetermined set value. ..
[Contrast adjustment]
2 and 3 are explanatory views when the contrast is changed as the adjustment of the image processing value in the present system 1, and FIG. 2A shows the “original image” as the “image of contrast +80”. FIG. 2B shows a case where the image is further changed from “contrast +110” → “contrast +120” → “contrast 127”.
Further, FIG. 3 shows a case where the contrast is changed by 10 from the “original image” and changed from “contrast +10” to “contrast +100”.

一般に、画像データによって、文字認識率が最も高くなるコントラスト値や明るさ値は異なる。例えば、コントラスト値は最大値(例えば+127)の場合に、また、明るさ値は中間値(例えば-80)の場合に、最も文字認識率が高くなることがある。
そこで、本システム1では、元の画像データのコントラスト値・明るさ値に対して、その最大値・最小値の範囲において所定値ずつ(例えば±10ずつ)変化させることで、文字認識率が最も高くなる値を、その画像の設定値として抽出・決定することができる。
より具体的には、画像調整処理部12では、画像データのコントラストを所定値ずつ変化させて、画像ヒストグラムの最大値及び最小値に最も近いピーク値を持つ値を、設定値とすることができる(図2及び図3参照)。
Generally, the contrast value and the brightness value at which the character recognition rate is the highest differ depending on the image data. For example, when the contrast value is the maximum value (for example, +127) and the brightness value is the median value (for example, -80), the character recognition rate may be the highest.
Therefore, in this system 1, the character recognition rate is the highest by changing the contrast value / brightness value of the original image data by a predetermined value (for example, ± 10) within the range of the maximum value / minimum value. The higher value can be extracted and determined as the setting value of the image.
More specifically, in the image adjustment processing unit 12, the contrast of the image data can be changed by a predetermined value, and a value having a peak value closest to the maximum value and the minimum value of the image histogram can be set as a set value. (See FIGS. 2 and 3).

図2(a)に示すように、画像のコントラスト値は、値が低い場合には画像全体が白っぽいイメージとなり、文字認識率は低いものとなる。
一方、図2(b)に示すように、コントラスト値が高すぎる場合には、灰色部分のノイズが増大してしまい、文字認識率は低下することになる。
このため、コントラストは、黒と白に分かれる最大値の状態で、最適コントラスト値を設定することができる。
As shown in FIG. 2A, when the contrast value of the image is low, the entire image becomes a whitish image and the character recognition rate is low.
On the other hand, as shown in FIG. 2B, when the contrast value is too high, the noise in the gray portion increases and the character recognition rate decreases.
Therefore, the optimum contrast value can be set in the state of the maximum value in which the contrast is divided into black and white.

そこで、本システム1では、画像調整処理部12の画像調整処理として、対象となる画像データのコントラストを変化させることにより、二値化を際立たせるように加工し認識率の高い画像ヒストグラムになるように設定する。
具体的には、図3に示すように、コントラストを10ずつ変化させ、画像ヒストグラムの白(255)及び黒(0)に近い値にピーク値を持つように設定値を割り出す。
同図に示す例では、コントラストは「±127」の範囲で調整するようにしている。
その結果、同図に示す例では、画像ヒストグラムの最大値及び最小値に最も近いピーク値として、「+80」が、両脇にヒストグラムがバランス良く偏った状態となり、当該画像の最適コントラスト値として設定するようにしている。
以上のようにして、各画像データに応じた文字認識率が最大となる最適なコントラスト値を抽出・決定することができるようになる。
Therefore, in the present system 1, as the image adjustment processing of the image adjustment processing unit 12, the contrast of the target image data is changed so that the binarization is emphasized and the image histogram has a high recognition rate. Set to.
Specifically, as shown in FIG. 3, the contrast is changed by 10 and the set value is calculated so that the peak value is close to the values close to white (255) and black (0) in the image histogram.
In the example shown in the figure, the contrast is adjusted in the range of "± 127".
As a result, in the example shown in the figure, "+80" is set as the peak value closest to the maximum and minimum values of the image histogram, and the histograms are biased to both sides in a well-balanced manner and set as the optimum contrast value of the image. I try to do it.
As described above, it becomes possible to extract and determine the optimum contrast value that maximizes the character recognition rate according to each image data.

また、以上のようなコントラストの最適値としては、次のような評価式によっても求めることもできる。
1)二値化傾向の評価値(プラスマイナス20を二値とする)
α=0~20(黒と認識する値)の画素割合
β=235~255(白と認識する値)の画素割合
α/βが「1」に近いことが評価値が大きいものとする。
2)灰色部分(21~234)のノイズについては、標準偏差値sで評価する。
3)総合評価値=p1×α/β+p2×s(p1及びp2は評価値の重み付け変数とする)
以上のようにしても、各画像データに応じた文字認識率が最大となる最適なコントラスト値を算出・決定することができる。
なお、明るさ値についても、上記のコントラスト調整と同様の手法により、調整・設定することができる。
Further, the optimum value of the contrast as described above can also be obtained by the following evaluation formula.
1) Evaluation value of binarization tendency (plus or minus 20 is the binary value)
Pixel ratio of α = 0 to 20 (value recognized as black) Pixel ratio of β = 235 to 255 (value recognized as white) It is assumed that the evaluation value is large when α / β is close to “1”.
2) The noise in the gray part (21 to 234) is evaluated by the standard deviation value s.
3) Comprehensive evaluation value = p1 × α / β + p2 × s (p1 and p2 are weighted variables of the evaluation value)
Even in the above manner, it is possible to calculate and determine the optimum contrast value that maximizes the character recognition rate according to each image data.
The brightness value can also be adjusted and set by the same method as the contrast adjustment described above.

[OCR画像データ生成部]
OCR画像データ生成部13は、画像調整処理部12で画像処理値を変更された調整後画像データについてOCR処理文字認識処理を行い、所定のOCR情報を生成するとともに、OCR処理された画像データをPDFファイルに再変換することで、紙媒体単位の1個のPDFファイルを生成し、そのPDFファイルに、文字認識されたOCR情報(テキスト情報)を関連付けて(被せて)記憶し、最終的にOCR情報が付加されたPDFファイルを生成・出力する、上記ステップ(4)~(6)を実行する手段である。
[OCR image data generator]
The OCR image data generation unit 13 performs OCR processing character recognition processing on the adjusted image data whose image processing value has been changed by the image adjustment processing unit 12, generates predetermined OCR information, and generates OCR-processed image data. By reconverting to a PDF file, one PDF file for each paper medium is generated, and the PDF file is associated (covered) with character-recognized OCR information (text information) and stored, and finally. It is a means for executing the above steps (4) to (6) to generate and output a PDF file to which OCR information is added.

具体的には、OCR画像データ生成部13は、まず、上述したコントラスト・明るさが最適な値に設定された画像データ(画像ファイル)に対して、紙媒体の紙面全体に相当する全領域について、所謂ベタ読みでOCR処理(文字認識処理)を実行する。ここで、OCR画像データ生成部13におけるOCR処理は、既存のOCR技術・AI-OCR技術、例えば公知のOCRソフト(アプリケーション)等を用いて実施することができる。
次いで、OCR画像データ生成部13は、OCR処理が実行された複数の画像データを1個のPDFファイルに変換するとともに、そのPDFファイルに対して、OCR処理によって認識・生成されたOCR情報(文字コード)を付加し、所定の文字列を検索可能なデータ(PDFファイル)として出力する。このOCR画像データ生成部13によるPDF変換処理・OCR情報の関連付け処理も、OCR処理と同様に、既存のOCR技術・AI-OCR技術を用いて実施することができる。
Specifically, the OCR image data generation unit 13 first obtains the entire area corresponding to the entire paper surface of the paper medium with respect to the image data (image file) in which the above-mentioned contrast and brightness are set to the optimum values. , The OCR process (character recognition process) is executed by so-called solid reading. Here, the OCR processing in the OCR image data generation unit 13 can be performed using existing OCR technology / AI-OCR technology, for example, known OCR software (application).
Next, the OCR image data generation unit 13 converts a plurality of image data for which OCR processing has been executed into one PDF file, and OCR information (characters) recognized and generated by the OCR processing for the PDF file. Code) is added, and a predetermined character string is output as searchable data (PDF file). The PDF conversion process and the OCR information association process by the OCR image data generation unit 13 can also be performed by using the existing OCR technique / AI-OCR technique in the same manner as the OCR process.

ここで、PDFファイルに対するOCR情報の関連付け(被せ)処理としては、例えば、画像データから変換されたPDFデータと、OCR処理で認識・生成されたOCR情報(文字コード)が、それぞれレイヤーで構成され、PDFデータのレイヤーにOCR情報のレイヤーが被せて配置(テキストイメージをカバー)されることで、OCR情報付きのPDFファイルを生成することができる。
このとき、文字コード(テキストイメージ)は、透明色で描画処理されることで、PDFファイル上において、非表示、かつ、文字列検索が可能となる。
Here, as the OCR information association (covering) process for the PDF file, for example, the PDF data converted from the image data and the OCR information (character code) recognized and generated by the OCR process are each composed of layers. By arranging the layer of OCR information over the layer of PDF data (covering the text image), a PDF file with OCR information can be generated.
At this time, the character code (text image) is drawn in a transparent color so that it cannot be displayed and the character string can be searched on the PDF file.

[動作]
次に、以上のような構成からなる本システム1の具体的な動作(OCR認識精度向上支援方法)について、図4に示すフローチャートと、図5~図7の画像データの具体例を参照しつつ説明する。
以下では、本システム1での処理対象となる文書として、自賠責保険損害調査関係書類を例にとって説明する。
自賠責保険の損害調査は、申請書となる「自賠責保険損害調査関係書類送付書兼保険金支払請求書」と、複数の添付書類として事故証明・医師の診断書・診療報酬明細書・領収書など、様々な種類やフォーマットの紙媒体が、例えば50枚前後を一単位(一括事案)として事務処理の対象となる。
[motion]
Next, regarding the specific operation (OCR recognition accuracy improvement support method) of the system 1 having the above configuration, referring to the flowchart shown in FIG. 4 and specific examples of the image data of FIGS. 5 to 7. explain.
In the following, as a document to be processed by this system 1, a document related to a liability insurance damage investigation will be described as an example.
For the liability insurance damage investigation, the application form "invoice for liability insurance damage investigation related documents and insurance claim payment" and multiple attached documents such as accident certificate, doctor's diagnosis, medical fee statement, receipt, etc. , Various types and formats of paper media are subject to paperwork, for example, with around 50 sheets as one unit (collective case).

このような自賠責保険損害調査関係書類は、紙媒体の種類やフォーマットなどに関らず、全紙媒体の紙面全体について、所謂ベタ読みで文字認識処理を実行する本システム1の対象として好適となる。
以下、自賠責保険損害調査関係書類の一件書類となる一括事案全50枚を処理する場合について説明する。
また、以下に示す処理動作は、上述した本システム1を構成するクライアントPC10a・MFP10bで実現される、画像データ生成部11,画像調整処理部12,OCR画像データ生成部13の各部により実行・運用される。
Such documents related to the liability insurance damage investigation are suitable as the target of the system 1 that executes character recognition processing by so-called solid reading on the entire paper surface of all paper media regardless of the type and format of the paper medium.
Hereinafter, the case of processing all 50 batch cases, which are one document related to the liability insurance damage investigation, will be described.
Further, the processing operations shown below are executed and operated by each of the image data generation unit 11, the image adjustment processing unit 12, and the OCR image data generation unit 13 realized by the client PCs 10a and MFP10b constituting the system 1 described above. Will be done.

図4に示すように、まず、自賠責保険損害調査関係書類(全50枚)は、一括事案単位でMFP10bにおいてスキャンされて読み取られ、画像データ化・PDFファイル化され、1個のPDFファイルが生成される(ステップ01)。
生成されたPDFファイルは、クライアントPC10aに出力・送信され、クライアントPC10aにおいて、PDFファイルが画像ファイル化される(ステップ02)。したがって、ここでは元の一括事案50枚の1ページずつ、全50個の画像ファイルが変換・生成される(ステップ03)。
As shown in FIG. 4, first, the compulsory automobile liability insurance damage investigation related documents (50 sheets in total) are scanned and read by the MFP 10b in batch case units, converted into image data and PDF files, and one PDF file is generated. Is done (step 01).
The generated PDF file is output and transmitted to the client PC 10a, and the PDF file is converted into an image file in the client PC 10a (step 02). Therefore, here, a total of 50 image files are converted and generated, one page for each of the 50 original batch cases (step 03).

その後、50個の全ての画像ファイルについて、クライアントPC10aにおいて画像調整処理が一括で実行され(ステップ04)、各画像について、コントラストと明るさが調整・変更されて、OCR処理に最適となるコントラスト値・明るさ値が設定された、調整処理後の一括事案の画像ファイルが生成される(ステップ05)。
図5に、画像調整処理前後の画像データを示す。
画像調整処理が行われる前の元データは、図5(a)に示す例では、全体がぼんやりとした画像となっているが、コントラスト・明るさが最適値に調整・変更された画像は、図5(b)に示すように、見た目にもはっきりと画像となっていることが分かる。
After that, the image adjustment processing is collectively executed on the client PC 10a for all 50 image files (step 04), and the contrast and brightness of each image are adjusted / changed to the optimum contrast value for the OCR processing. -An image file of the batch case after the adjustment process in which the brightness value is set is generated (step 05).
FIG. 5 shows image data before and after the image adjustment process.
In the example shown in FIG. 5A, the original data before the image adjustment processing is a vague image as a whole, but the image in which the contrast / brightness is adjusted / changed to the optimum value is As shown in FIG. 5B, it can be seen that the image is clearly visible.

このように画像調整処理が行われた画像データは、クライアントPC10aにおいて、50個全ての画像ファイルについて一括でOCR処理がかけられ、紙面全体に相当する領域について文字認識が実行され(ステップ06)、その後、50個の画像ファイルが1個のPDFファイルに再度変換されるとともに、そのPDFファイルに、文字認識されたOCR情報(テキスト情報)がテキストイメージとして関連付けて記憶される(ステップ06)。 The image data to which the image adjustment processing has been performed in this way is subjected to OCR processing for all 50 image files at once on the client PC 10a, and character recognition is executed for the area corresponding to the entire paper surface (step 06). After that, the 50 image files are converted back into one PDF file, and the character-recognized OCR information (text information) is stored in the PDF file in association with the text image (step 06).

図6に、本システム1におけるOCR処理の実行結果の一例を示す。
図6(a)に示すように、画像調整処理が行われる前の元データ(図5(a)参照)では、申請書で最も大きいフォントサイズで示されている「自賠責保険損害調査関係書類送付書兼保険金支払請求書」のタイトル文字についても、正確な文字認識が行われず、意味不明な文字列が生成・出力されているが、コントラスト・明るさが最適値に調整・変更された画像処理後のデータ(図5(b)参照)では、全ての文字列が正確に正しく文字認識されていることが分かる。
FIG. 6 shows an example of the execution result of the OCR process in the system 1.
As shown in FIG. 6 (a), in the original data (see FIG. 5 (a)) before the image adjustment process is performed, the “documents related to the liability insurance damage investigation” shown in the largest font size in the application form are sent. As for the title character of "Calligraphy and Insurance Claims", accurate character recognition is not performed and a meaningless character string is generated / output, but the contrast / brightness is adjusted / changed to the optimum value. In the processed data (see FIG. 5B), it can be seen that all the character strings are accurately and correctly recognized.

以上のようなOCR処理の結果、最終的にOCR情報が関連付けて記憶・付加された、文字列を検索可能な1個のPDFファイルが、一括事案単位で生成・出力されることになる(ステップ07)。
図7に、本システム1でのOCR処理の結果、文字列検索が可能となったPDFデータの一例を示す。
As a result of the OCR processing as described above, one PDF file in which the character string can be searched is finally generated and output in batch case units, in which the OCR information is associated and stored / added (step). 07).
FIG. 7 shows an example of PDF data that enables character string search as a result of OCR processing in the system 1.

同図に示すように、OCR情報が付加されたPDFファイルは、PDFアプリケーションの検索機能を使って必要な文字列(例えば「自賠責保険」等)を検索すると、自賠責保険損害調査関係書類の一件書類となる一括事案全50枚中で、「自賠責保険」の文字列が含まれる文書を1枚ずつ検出・抽出することができる。
これによって、膨大な紙媒体に基づく事務処理も、適宜必要な文字列を検索することで、必要な書類・資料がどこに存在しているか、必要な情報がどこに記載されているかなどが簡単に分かるようになり、事務処理効率を大幅に改善・向上させることができるようになる。
As shown in the figure, if you search for the required character string (for example, "California liability insurance") using the search function of the PDF application for the PDF file to which OCR information is added, one of the documents related to the liability insurance damage investigation It is possible to detect and extract one document at a time that includes the character string of "California Insurance" from all 50 documents in a single case.
This makes it easy to find out where the necessary documents / materials are located and where the necessary information is written by searching for the necessary character strings as appropriate for paperwork based on a huge amount of paper media. It will be possible to greatly improve and improve the efficiency of paperwork.

[文字認識精度向上の定量評価]
図8に、本システム1でのOCR処理による識字率の結果(定量評価)を示す。
同図に示す例では、上述した自賠責保険損害調査関係書類の一括事案の書面について、読取り対象として、全文の文字(カンマ,句読点,カッコなどを含む)を読取り対象文字として評価した。
そのうち、サンプルとして、3ページ(3枚)分の関連書類について読取りを行い、読み取れた文字と書類に含まれる文字の割合を識字率として、画像調整処理の前と後で比較した。
[Quantitative evaluation of character recognition accuracy improvement]
FIG. 8 shows the result (quantitative evaluation) of the literacy rate by the OCR processing in this system 1.
In the example shown in the figure, the characters in the full text (including commas, punctuation marks, parentheses, etc.) were evaluated as the characters to be read in the document of the above-mentioned collective case of the documents related to the liability insurance damage investigation.
Among them, as a sample, three pages (three sheets) of related documents were read, and the ratio of the read characters and the characters contained in the documents was used as the literacy rate and compared before and after the image adjustment processing.

結果は、同図に示すように、まず、定型書面である「自賠責保険損害調査関係書類送付書兼保険金支払請求書」(図5参照)は、文書に含まれる文字数が「1046」で、OCR処理による読取り文字数(識字率)は、画像処理前が「860(82%)」であるのに対して、画像処理後は「952(91%)」と向上しており、改善割合(倍率)は「1.1」となった。
これに対して、非定型の添付書面である「損害額積算明細書(一括払用)」の場合には、文字数「370」、読取り文字数(識字率)は、画像処理前「108(29%)」、画像処理後「288(78%)」、改善割合(倍率)「2.7」と、文字認識の精度がより大きく向上する結果となった。
As shown in the figure, first of all, the standard document "California Insurance Damage Investigation Document Sending Form and Insurance Claim Payment Claim" (see Fig. 5) contains "1046" characters. The number of characters read by OCR processing (literacy rate) has improved to "952 (91%)" after image processing, while it was "860 (82%)" before image processing, and the improvement rate (magnification). ) Was "1.1".
On the other hand, in the case of the atypical attached document "damage amount totalization statement (for lump sum payment)", the number of characters is "370" and the number of read characters (literacy rate) is "108 (29%)" before image processing. ) ”, After image processing“ 288 (78%) ”, and the improvement rate (magnification)“ 2.7 ”, the result is that the accuracy of character recognition is further improved.

さらに、同様に非定型の添付書面である「事故解決に関する承諾書(免責証書)」の場合には、文字数「995」、読取り文字数(識字率)は、画像処理前「128(13%)」、画像処理後「798(80%)」、改善割合(倍率)「6.2」と、文字認識の精度が更に大幅に向上する結果となった。
このように、本システム1による画像調整処理後は、いずれの文書についても、およそ8割の文字が認識されており、読取り精度が6倍以上も改善しているケースもあることが分かる。
特に、非定型の文書で顕著な改善が見られることが分かった。
Furthermore, in the case of the atypical attached document "Accident Resolution Consent Form (Disclaimer)", the number of characters is "995" and the number of characters read (literacy rate) is "128 (13%)" before image processing. After image processing, the accuracy of character recognition was further improved to "798 (80%)" and the improvement rate (magnification) "6.2".
As described above, after the image adjustment processing by the present system 1, about 80% of the characters are recognized in any of the documents, and it can be seen that the reading accuracy is improved by 6 times or more in some cases.
In particular, we found significant improvements in atypical documents.

[ハードウェア構成]
以上のような本実施形態に係る本システム1を構成するクライアントPC10aやMFP10bで構成されるハードウェア構成の一例を、図9に示す。
同図に示すとおり、本システム1は、CPU101,RAM102,ROM103,HDD104,入力装置105及び表示装置106を含む情報処理装置によって構成される。これらの構成要素はシステムバスで接続され、システムバスを介してデータのやり取りが行われる。
[Hardware configuration]
FIG. 9 shows an example of a hardware configuration composed of client PCs 10a and MFP10b constituting the system 1 according to the present embodiment as described above.
As shown in the figure, the system 1 is composed of an information processing device including a CPU 101, a RAM 102, a ROM 103, an HDD 104, an input device 105, and a display device 106. These components are connected by a system bus, and data is exchanged via the system bus.

CPU(Central Processing Unit)101は、中央処理装置ともいい、コンピュータの中心的な処理を行う部位であり、各装置の制御やデータの計算/加工を行う。
RAM(Random Access Memory)102は、メモリ装置の一種で、データの消去・書き換えが可能なものであ。
ROM(Read Only Memory)103は、半導体などを用いたメモリ装置の一種で、データ書き込みは製造時1回のみで、利用時には記録されたデータの読み出しのみできるものである。
The CPU (Central Processing Unit) 101, also referred to as a central processing unit, is a part that performs central processing of a computer, and controls each device and calculates / processes data.
The RAM (Random Access Memory) 102 is a type of memory device capable of erasing / rewriting data.
The ROM (Read Only Memory) 103 is a kind of memory device using a semiconductor or the like, and data can be written only once at the time of manufacture and can only read the recorded data at the time of use.

HDD(Hard Disk Drive)104は、磁性体の性質を利用し、情報を記録し読み出す補助記憶装置である。
入力装置105は、ユーザがコンピュータに対して操作指示を行うため、あるいは、文字等を入力するために使用され、具体的には、キーボード,マウス等で構成される。
また、上述したMFP10bのように、紙媒体をスキャンして画像データを生成するスキャナ等も入力装置105に該当する。
表示装置106は、例えば液晶ディスプレイ等で構成され、タッチパネル機能を有するものであってもよい。この他、図示しない通信機能も有し、この通信機能により他の端末との通信が可能となる。
The HDD (Hard Disk Drive) 104 is an auxiliary storage device that records and reads out information by utilizing the properties of a magnetic material.
The input device 105 is used for a user to give an operation instruction to a computer or for inputting characters and the like, and specifically, is composed of a keyboard, a mouse, and the like.
Further, a scanner or the like that scans a paper medium to generate image data, such as the above-mentioned MFP 10b, also corresponds to the input device 105.
The display device 106 may be composed of, for example, a liquid crystal display or the like, and may have a touch panel function. In addition, it also has a communication function (not shown), which enables communication with other terminals.

以上説明したように、本実施形態に係る本システム1によれば、スキャンして読み取られた紙媒体の画像データについて、OCR処理を行う前に、画像データの画像処理値(コントラスト・明るさ)について、最適な値に画像調整することにより、OCR処理における文字認識率を飛躍的に向上させることができるようになる。
すなわち、本システム1では、種類もフォーマットも様々に異なる紙媒体について、紙面全体について、所謂ベタ読みで文字認識処理を実行しつつ、その文字認識精度を簡易かつ確実に向上させることが可能となる。
As described above, according to the system 1 according to the present embodiment, the image processing value (contrast / brightness) of the image data of the scanned and read image data of the paper medium before the OCR processing is performed. By adjusting the image to the optimum value, the character recognition rate in the OCR processing can be dramatically improved.
That is, in this system 1, it is possible to easily and surely improve the character recognition accuracy of paper media having various types and formats while executing character recognition processing by so-called solid reading on the entire paper surface. ..

その結果、種類やフォーマットが様々に異なる非定型の紙文書について、どこに存在しているか分からない所定の文字を、確実に抽出・検知できるようになる。
これによって、例えば自賠責保険の損害調査関係書類など、様々なフォーマットの書類・資料が含まれる紙媒体であっても、例えばタイトル名や表題などの主要な文字列を抽出・テキスト化することができ、膨大な紙媒体に基づく煩雑な事務処理等をサポート・効率化することができる、利便性や汎用性・拡張性に優れた支援システムを実現することができるようになる。
As a result, it becomes possible to reliably extract and detect predetermined characters whose existence is unknown for atypical paper documents of various types and formats.
This makes it possible to extract and convert major character strings such as title names and titles into text, even for paper media containing documents and materials in various formats, such as documents related to liability insurance damage investigations. It will be possible to realize a support system with excellent convenience, versatility, and expandability that can support and improve the efficiency of complicated paperwork based on a huge amount of paper media.

以上、本発明について、好ましい実施形態を示して説明したが、本発明は、上述した実施形態に限定されるものではなく、本発明の範囲で種々の変更実施が可能であることは言うまでもない。
例えば、上述した実施形態では、本発明に係るOCR認識精度向上支援システムの処理対象となる紙媒体として、自賠責保険の損害調査関係書類を例にとって説明したが、本発明の対象となる紙媒体は、特に自賠責保険の損害調査関係書類に限定されるものではなく、紙媒体に示された文字情報をOCR処理によって認識し電子データとして事務処理等に利用することのある、あらゆる紙媒体を対象とすることができるものである。
Although the present invention has been described above with reference to preferred embodiments, it is needless to say that the present invention is not limited to the above-described embodiments and various modifications can be made within the scope of the present invention.
For example, in the above-described embodiment, as the paper medium to be processed by the OCR recognition accuracy improvement support system according to the present invention, the damage investigation-related documents of the liability insurance have been described as an example, but the paper medium to be the subject of the present invention is In particular, it is not limited to documents related to damage investigation of liability insurance, but for all paper media that may recognize the text information shown on the paper medium by OCR processing and use it as electronic data for paperwork etc. Is something that can be done.

本発明は、例えば自賠責保険の損害調査関係書類などのように、様々なフォーマットの紙媒体の資料について、OCRの認識精度の向上を支援するためのシステム等に好適に利用可能である。 INDUSTRIAL APPLICABILITY The present invention can be suitably used as a system for supporting improvement of OCR recognition accuracy for materials in various formats such as documents related to damage investigation of automobile liability insurance.

1 OCR認識精度向上支援システム
10 OCR認識精度向上支援装置
10a クライアントPC
10b MFP
11 画像データ生成部
12 画像調整処理部
13 OCR画像データ生成部
1 OCR recognition accuracy improvement support system 10 OCR recognition accuracy improvement support device 10a Client PC
10b MFP
11 Image data generation unit 12 Image adjustment processing unit 13 OCR image data generation unit

Claims (5)

OCRによる文字認識精度の向上を支援するためのシステムであって、
当該システムを構成する情報処理装置が、
対象となる文書をスキャンして、当該文書に表された文字情報を画像データとして生成する画像データ生成部と、
前記画像データ生成部で生成された画像データについて、所定の画像処理値を変更する画像調整処理を実行する画像調整処理部と、
前記画像調整処理部で画像処理値を変更された調整後画像データについて文字認識処理を行い、所定のOCR情報を生成するとともに、当該OCR情報を、前記画像データ生成部で生成された画像データと関連付けて出力するOCR画像データ生成部と、
を備えることを特徴とするOCR認識精度向上支援システム。
It is a system to support the improvement of character recognition accuracy by OCR.
The information processing devices that make up the system
An image data generation unit that scans the target document and generates the character information displayed in the document as image data.
An image adjustment processing unit that executes an image adjustment process for changing a predetermined image processing value for the image data generated by the image data generation unit, and an image adjustment processing unit.
Character recognition processing is performed on the adjusted image data whose image processing value has been changed by the image adjustment processing unit to generate predetermined OCR information, and the OCR information is used with the image data generated by the image data generation unit. The OCR image data generator that is associated and output, and
An OCR recognition accuracy improvement support system characterized by being equipped with.
前記画像調整処理部は、
前記所定の画像処理値として、当該画像データのコントラスト及び明るさの少なくともいずれかを変更する
ことを特徴とする請求項1に記載のOCR認識精度向上支援システム。
The image adjustment processing unit is
The OCR recognition accuracy improvement support system according to claim 1, wherein at least one of the contrast and the brightness of the image data is changed as the predetermined image processing value.
前記画像調整処理部は、
前記画像データのコントラスト及び明るさの少なくともいずれかを、所定値ずつ変化させて、所定の設定値に変更する
ことを特徴とする請求項2に記載のOCR認識精度向上支援システム。
The image adjustment processing unit is
The OCR recognition accuracy improvement support system according to claim 2, wherein at least one of the contrast and the brightness of the image data is changed by a predetermined value to be changed to a predetermined set value.
前記画像調整処理部は、
前記画像データのコントラストを所定値ずつ変化させて、画像ヒストグラムの最大値及び最小値に最も近いピーク値を持つ値を、前記設定値とする
ことを特徴とする請求項3に記載のOCR認識精度向上支援システム。
The image adjustment processing unit is
The OCR recognition accuracy according to claim 3, wherein the contrast of the image data is changed by a predetermined value, and the value having the peak value closest to the maximum value and the minimum value of the image histogram is set as the set value. Improvement support system.
OCRによる文字認識精度の向上を支援するためのシステムを構成する情報処理装置を、
対象となる文書をスキャンして、当該文書に表された文字情報を画像データとして生成する画像データ生成手段、
前記画像データ生成手段で生成された画像データについて、所定の画像処理値を変更する画像調整処理を実行する画像調整処理手段、
前記画像調整処理手段で画像処理値を変更された調整後画像データについて文字認識処理を行い、所定のOCR情報を生成するとともに、当該OCR情報を、前記画像データ生成手段で生成された画像データと関連付けて出力するOCR画像データ生成手段、
として機能させることを特徴とするOCR認識精度向上支援プログラム。
Information processing equipment that constitutes a system to support the improvement of character recognition accuracy by OCR,
An image data generation means that scans the target document and generates the character information represented in the document as image data.
An image adjustment processing means that executes an image adjustment process for changing a predetermined image processing value for the image data generated by the image data generation means.
Character recognition processing is performed on the adjusted image data whose image processing value has been changed by the image adjustment processing means to generate predetermined OCR information, and the OCR information is used with the image data generated by the image data generation means. OCR image data generation means, which is associated and output
OCR recognition accuracy improvement support program characterized by functioning as.
JP2020206253A 2020-07-07 2020-12-11 OCR recognition accuracy improvement support system and program Pending JP2022014856A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020117106 2020-07-07
JP2020117106 2020-07-07

Publications (1)

Publication Number Publication Date
JP2022014856A true JP2022014856A (en) 2022-01-20

Family

ID=80120453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020206253A Pending JP2022014856A (en) 2020-07-07 2020-12-11 OCR recognition accuracy improvement support system and program

Country Status (1)

Country Link
JP (1) JP2022014856A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7428451B1 (en) 2023-09-27 2024-02-06 株式会社ナレッジワーク Information processing system, information processing method and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7428451B1 (en) 2023-09-27 2024-02-06 株式会社ナレッジワーク Information processing system, information processing method and program

Similar Documents

Publication Publication Date Title
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
JP5042562B2 (en) Image processing apparatus, handwritten information recognition method, handwritten information recognition program
US10528679B2 (en) System and method for real time translation
US20060221357A1 (en) Information processing apparatus and method
US20030210428A1 (en) Non-OCR method for capture of computer filled-in forms
US20110085198A1 (en) Image forming apparatus and document management method thereof
EP1672473A2 (en) Stamp sheet
US20080162602A1 (en) Document archiving system
JP2008234658A (en) Course-to-fine navigation through whole paginated documents retrieved by text search engine
US7453594B2 (en) Document filing apparatus for storing information added to a document file
JP2019008697A (en) Electronic document creation apparatus, electronic document creation method, and electronic document creation program
JP2022014856A (en) OCR recognition accuracy improvement support system and program
US20220068276A1 (en) Information processor, print system, and control method
JP5153277B2 (en) Image processing apparatus, image processing method, and image processing program
JP4254775B2 (en) Written image acquisition apparatus, writable information extraction method, and computer program
US10630854B2 (en) Image processing apparatus
US11887391B2 (en) Information processing system, data output system, image processing method, and recording medium
JP2007048061A (en) Character processing device, character processing method, and recording medium
JP2004334340A (en) Image processing method and device
US20230306553A1 (en) Mitigating compression induced loss of information in transmitted images
JP7298178B2 (en) Information processing device and information processing system
US20230077608A1 (en) Information processing apparatus, information processing method, and storage medium
JP2010092141A (en) Image processing system, image reader, image processor, and image processing program
JP2011022896A (en) Document management system
US10264157B2 (en) Image processing apparatus, image processing method and image processing program