JP6702629B2 - Type OCR system - Google Patents

Type OCR system Download PDF

Info

Publication number
JP6702629B2
JP6702629B2 JP2015255533A JP2015255533A JP6702629B2 JP 6702629 B2 JP6702629 B2 JP 6702629B2 JP 2015255533 A JP2015255533 A JP 2015255533A JP 2015255533 A JP2015255533 A JP 2015255533A JP 6702629 B2 JP6702629 B2 JP 6702629B2
Authority
JP
Japan
Prior art keywords
document
function
dictionary
ocr
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015255533A
Other languages
Japanese (ja)
Other versions
JP2016126796A (en
Inventor
正美 若山
正美 若山
夏菜子 佐藤
夏菜子 佐藤
有祐 松尾
有祐 松尾
Original Assignee
株式会社 ハンモック
株式会社 ハンモック
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 ハンモック, 株式会社 ハンモック filed Critical 株式会社 ハンモック
Publication of JP2016126796A publication Critical patent/JP2016126796A/en
Application granted granted Critical
Publication of JP6702629B2 publication Critical patent/JP6702629B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Facsimiles In General (AREA)
  • Storing Facsimile Image Data (AREA)

Description

本願発明は、全体を活字、又は一部に手書き部分がある以外は活字(例えば、日付、数量だけ手書き等)で作成されたFAXの受信書面をOCR処理する活字OCRシステムに関するものである。 The present invention relates to a type OCR system for performing OCR processing on a FAX reception document created in a type or a type (for example, handwriting only the date and quantity) except for a handwritten portion.

これまで、FAXにより受信された注文書や連絡書、その他のFAX文書を、相手先毎に自動仕分けする技術として特許文献1に開示されたものがある。
詳しくは、受信したFAXの相手先を自動認識する相手先認識手段2と、自動認識された相手先の情報と関連付けして受信したFAXのイメージデータを格納するイメージデータベース3と、受信したFAXのイメージデータからOCR機能により読み取られた文字情報を格納する文字情報データベース4と、相手先を指定してイメージデータベース3または文字情報データベース4を検索する検索手段5とで受信FAX管理システムを構成するものである。
Up to now, there is a technique disclosed in Patent Document 1 as a technique for automatically sorting an order form, a contact form, and other FAX documents received by FAX for each destination.
More specifically, the destination recognition unit 2 that automatically recognizes the destination of the received FAX, the image database 3 that stores the image data of the FAX that is received in association with the information of the automatically recognized destination, and the FAX of the received FAX. A reception FAX management system is constituted by a character information database 4 for storing character information read from image data by an OCR function and a search means 5 for searching the image database 3 or the character information database 4 by designating a destination. Is.

特開2002−165076号公報JP, 2002-165076, A

このような受信FAX管理システムは、受信したFAX文書の送信元である相手先毎に専任のオペレーターが存在することを前提とした上で、当該専任のオペレーターに仕分けるために開発されたシステムである。 Such a reception FAX management system is a system developed to sort out a dedicated operator on the assumption that there is a dedicated operator for each destination who is a sender of the received FAX document. .

これに対して、本願出願人は、受信したFAX文書を相手先毎に自動仕分けすることを目的とするものでなく、FAXの受信書面に標準的に適用される「グローバルルール」と特定の受信書面にのみ適用される「ローカルルール」とを用いてシステム自体に学習機能を持たせることを可能とし、OCR処理の精度を高めることのできるこれまでにない新規な活字OCRシステムを提供すべく、本願発明を完成させるに至った。 On the other hand, the applicant of the present application does not aim to automatically sort the received FAX documents for each destination, but the "Global Rule" which is standardly applied to the FAX reception document and the specific reception In order to provide a new type OCR system that has never existed before, which enables the system itself to have a learning function using the "local rule" that is applied only to documents, and which can improve the accuracy of OCR processing, The present invention has been completed.

上記目的を達成するために、本願発明の第1の発明は、全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、発信元からFAXにより受信した発信元属性データ(TSIコード又はFAX番号等)の付随した受信書面をOCR処理し、分類用データベースを用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、目的書面に分類された受信書面をOCR処理し、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとを備えた抽出用データベース及びOCR処理を補完する補完用データベースを用いて、当該受信書面から「項目名」「値」「座標」を抽出する抽出機能と、モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正し、また、抽出機能によるOCR領域を確認し、不適切であれば正しいOCR領域を指定し、指定されたOCR領域で再度OCR処理し、改めて「項目名」に対する「値」を確認する確認・修正機能と、確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、確認・修正機能によって指定されたOCR領域及び修正された値を、抽出用データベース及び補完用データベースに反映させる学習機能と、を備えたことを特徴とする活字OCRシステムである。 In order to achieve the above object, the first invention of the present application is a type OCR system for performing OCR processing on a FAX reception document created in a type or a type other than a handwritten part. , OCR processing is performed on the reception document with the transmission source attribute data (TSI code or FAX number, etc.) received by FAX from the transmission source, and the reception document is classified into a target document and a non-purpose document using the classification database. Extraction with a classification function and OCR processing of received documents classified into target documents, and standard rules applied to global rules and local rules applied only to received documents from sources having specific attribute data Extraction function to extract the "item name", "value" and "coordinates" from the received document, and the image of the received document and the extraction function on the monitor screen using the supplemental database and the complementary database that complements the OCR process. The extraction display of the received document is displayed in parallel, the "value" for the "item name" is confirmed, and if it is inappropriate, the correct "value" is corrected, and the OCR area by the extraction function is confirmed. If it is inappropriate, specify the correct OCR area, perform OCR processing again in the specified OCR area, and confirm/correct function to confirm the “value” for the “item name” again, and the extraction confirmed by the confirmation/correction function. Outputs the result in a specified output format and exports it to the target document database, and reflects the OCR area and the corrected value specified by the confirmation/correction function in the extraction database and the complementary database. It is a type OCR system characterized by having a learning function for making it.

第2の発明は、全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、当該活字OCRシステムは、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとをそれぞれ備えた構造辞書・項目辞書・補完用辞書を有し、構造辞書は、文書の種類、文書のレイアウト情報(ゾーン情報)、項目と値の位置関係と値の数に関する情報を含み、項目辞書は、同義語、値の形式に関する情報を含み、補完用辞書は、項目ごとに、誤認識しやすい文字とその場所の情報を含み、発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、目的書面に分類された受信書面のOCR処理に対して、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面から「項目名」「値」「信頼性」「座標」を抽出する抽出機能と、モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正する確認・修正機能と、確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、確認・修正機能によって修正された値を、構造辞書・項目辞書・補完用辞書に反映させる学習機能と、を備え、目的書面のレイアウトに依存せずにデータ化に必要な項目の値の抽出を可能とすることを特徴とした活字OCRシステムである。
また、第2の発明は、請求項2記載の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウトに依存せずにデータ化に必要な項目の値を抽出するためにひとつの仮想帳票として論理的に定義し、この仮想帳票に基づいて抽出機能と確認・修正機能とデータ出力機能とを一括して設定可能とすることを特徴とした設計機能をを備えてもよい。
A second aspect of the present invention is a type OCR system that performs OCR processing on a received document of a FAX that is created in a type except for the entire type or a handwritten part, and the type OCR system is applied as standard. It has a structure dictionary, an item dictionary, and a complementary dictionary, each of which has a global rule and a local rule which is applied only to a received document from a sender having specific attribute data. It contains document layout information (zone information), information about the positional relationship between items and values, and the number of values, the item dictionary contains information about synonyms and value formats, and the complementary dictionary misrecognizes each item. OCR processing is performed on the receiving document that includes the source attribute data received from the sender by FAX, including the characters that are easy to read and the location information, and uses the structural dictionary, item dictionary, and supplementary dictionary to target the receiving document. For the classification function to classify into the document and the non-purpose document and the OCR processing of the reception document classified into the purpose document, using the structure dictionary/item dictionary/complementary dictionary, the “item name” and “value” from the reception document Display the image of the receiving document and the extracting display of the receiving document extracted by the extracting function side by side on the monitor screen, and display the extraction function to extract the "reliability" and "coordinates", and to display the "value" for the "item name". Confirmation/correction function to confirm the value and correct it to the correct “value”, and the extraction result confirmed by the confirmation/correction function is output in the specified output format, and this is exported to the target document database. It is equipped with a data output function that enables the data to be read, and a learning function that reflects the value corrected by the confirmation/correction function in the structure dictionary, item dictionary, and supplementary dictionary, and is necessary for data conversion without depending on the layout of the target document. It is a type OCR system characterized by enabling extraction of item values.
A second aspect of the present invention is a method for extracting a target document having various layouts by the type OCR system according to claim 2 to extract the values of items necessary for data conversion without depending on the layout of each target document. May be logically defined as a virtual form, and a design function characterized by enabling the extraction function, the confirmation/correction function, and the data output function to be collectively set based on the virtual form.

本願発明の第1の発明によれば、以下のような効果を有する。
(1)多く(例えば、70〜80%)のFAX受信書面は、標準的に適用される「グローバルルール」によってOCR処理できる。
(2)それ以外(例えば、20〜30%)のFAX受信書面は、「グローバルルール」によってOCR処理できないものであるが、特定の受信書面にのみ適用される「ローカルルール」によってOCR処理できる。
(3)従って、結果的に全てのFAX受信書面を効率良く且つ確実にOCR処理できる。
(4)しかも、本願発明は、形式の異なるFAX受信書面ごとにそのフォーマットを登録するものではないので、処理するFAX受信書面が増えてもシステムに負荷がかからず、むしろ、学習機能を備えているので、OCR処理をすればするほどその精度が高くなるという効果を有する。
According to the first aspect of the present invention, the following effects can be obtained.
(1) Many (for example, 70 to 80%) fax reception documents can be OCR processed according to a “global rule” that is applied as a standard.
(2) Other (for example, 20 to 30%) FAX reception documents cannot be OCR processed by the "global rule", but can be OCR processed by the "local rule" applied only to a specific reception document.
(3) Therefore, as a result, all FAX reception documents can be efficiently and reliably OCR processed.
(4) In addition, since the present invention does not register the format for each FAX reception document having a different format, the system is not burdened even if the number of FAX reception documents to be processed increases, and rather the learning function is provided. Therefore, there is an effect that the accuracy increases as the OCR processing is performed.

本願発明の第2の発明によれば、以下のような効果を有する。
(1)FAX受信書面のレイアウトが変わってもその都度設計し直す必要がなく(再設計することなく)、様々なレイアウトのFAX受信書面であっても、データ化に必要な項目の値を確実に取り出す(抽出する)ことができる。
(2)すなわち、従来の帳票OCRでは、次のような場合には、そのままでは目的とする値を抽出できず、設計し直す必要があるが、本願発明では、FAX受信書面のレイアウト座標に依存しないので、データ化に必要な項目の値を確実に取り出せる(抽出できる)。
・異なる取引先で似たレイアウトだが、微妙に配置やフォントが違う。
・登録した通りのレイアウトでFAX受信できない。
・取引先の拠点毎に、微妙に配置・フォント・印刷設定が異なる。
・枠数・枠幅が増減する。
・NO行の中の行が増減する。
・行が増減する。
(3)また、本願発明の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウトに依存せずにデータ化に必要な項目の値を抽出するためにひとつの仮想帳票として論理的に定義することで、抽出機能と確認・修正機能とデータ出力機能とを一括して設定することが可能となる(設計機能)。
(4)すなわち、特別なプログラム知識を持たなくても、この設計機能を使用することで、抽出機能と確認・修正機能とデータ出力機能における設定を簡単に行うことができる。そして、それによって、活字OCRシステムの活用の場が広がる。
The second aspect of the present invention has the following effects.
(1) Even if the layout of the fax reception document changes, there is no need to redesign each time (without redesigning), and even for fax reception documents of various layouts, the values of the items necessary for data conversion can be ensured. Can be taken out (extracted).
(2) That is, in the conventional form OCR, in the following cases, the target value cannot be extracted as it is and it is necessary to redesign. However, in the present invention, it depends on the layout coordinate of the FAX reception document. Since it does not, it is possible to reliably extract (extract) the value of the item required for data conversion.
・Although the layout is similar for different customers, the layout and fonts are slightly different.
・Fax cannot be received with the registered layout.
・The layout, fonts, and print settings are slightly different for each business partner's base.
-The number of frames and the width of the frame increase or decrease.
・Lines in the NO line increase or decrease.
・Lines will increase or decrease.
(3) Further, according to the type OCR system of the present invention, an object document having various layouts is logically treated as one virtual form in order to extract the values of items necessary for data conversion without depending on the layout of each object document. It is possible to collectively set the extraction function, confirmation/correction function, and data output function (design function).
(4) That is, even if the user does not have special program knowledge, by using this design function, it is possible to easily set the extraction function, the confirmation/correction function, and the data output function. As a result, the opportunities for utilizing the print type OCR system will expand.

本願発明の第1の発明に関するシステム概念図。The system conceptual diagram about the 1st invention of the invention in this application. 本願発明の第1の発明に関する「確認・修正画面」"Confirmation/correction screen" relating to the first invention of the present invention 本願発明の第2の発明に関する説明図(1)。Explanatory drawing (1) regarding the 2nd invention of this invention. 本願発明の第2の発明に関する説明図(2)。Explanatory drawing (2) regarding the 2nd invention of this invention. 本願発明の第2の発明に関する説明図(3)。Explanatory drawing (3) regarding the 2nd invention of this invention. 本願発明の第2の発明に関する説明図(4)。Explanatory drawing (4) regarding the 2nd invention of this invention. 本願発明の第2の発明に関する説明図(5)。Explanatory drawing (5) regarding the 2nd invention of this invention. 本願発明の第2の発明に関する説明図(6)。Explanatory drawing (6) regarding the 2nd invention of this invention. 本願発明の第2の発明に関するシステム概念図。The system conceptual diagram regarding the 2nd invention of this invention. 本願発明の第2の発明の「仮想帳票」に関する概念図(1)。The conceptual diagram (1) regarding the "virtual form" of the 2nd invention of this invention. 本願発明の第2の発明の「仮想帳票」に関する概念図(2)。The conceptual diagram (2) regarding the "virtual form" of the 2nd invention of this invention.

まず、本願発明で使用する用語について説明する。
[構造辞書」
構造辞書には、以下のような情報が含まれている。
□文書のレイアウト情報(ゾーン情報)
・座標(左上の座標、幅、高さ)
・含まれる項目の項目ID一覧
□項目と値の位置関係と値の数
・右、下、右下、表示なし
・別カラム/同一カラム/カラムなし
・単一/複数(最大数)
[項目辞書]
項目辞書には、以下のような情報が含まれている。
□項目情報
・項目ID
・項目の属性
・同義語グループID
□値の形式
・文字種指定
・テンプレート
・正規表現
□同義語情報
・同義語グループID
・項目1,項目2,項目3…
例)同義語グループID 氏名
項目1 氏名
項目2 ご氏名
項目3 御氏名
項目4 おなまえ
項目5 お名前
項目6 御名前
項目7 ご芳名
[補完用辞書]
補完用辞書には、以下のような情報が含まれている。
□項目ごとに、誤認識しやすい文字とその場所の情報が保存されている。
・項目名
・文字位置
・御認識文字
例)項目名 日付
文字位置 1
正しい文字 日
御認識文字 口

口付→日付
First, terms used in the present invention will be described.
[Structure dictionary]
The structure dictionary contains the following information.
□ Document layout information (zone information)
・Coordinates (upper left coordinates, width, height)
-List of item IDs of included items □ Positional relationship between items and values and number of values-Right, bottom, bottom right, no display-Different column/same column/no column-Single/multiple (maximum number)
[Item dictionary]
The item dictionary includes the following information.
□ Item information ・Item ID
・Item attribute ・Synonym group ID
□ Value format ・Character type specification ・Template ・Regular expression □Synonym information ・Synonym group ID
・Item 1, Item 2, Item 3...
Example) Synonym group ID Name item 1 Name item 2 Your name item 3 Your name item 4 Name item 5 Name item 6 Your name item 7 Your name [Complementary dictionary]
The supplementary dictionary contains the following information.
□ Characters that are easily misrecognized and information about the location are stored for each item.
・Item name ・Character position ・Recognized character Example: Item name Date character position 1
Correct character date recognition character mouth

Mouth → Date

[分類用データベース]
FAXの受信書面を分類するために使用する情報が含まれているデータベースである。実際には、抽出用データベースと同じに、構造辞書・項目辞書・補完用辞書を使用することになるので、分類用データベースというものが抽出用データベースと別に存在するわけではない。分類機能の具体的な処理を説明する場合において、分類しようする情報を蓄えてある場所という程度の意味である。
[抽出用データベース]
目的書面内にある項目を抽出するために使用する情報が含まれているデータベースである。実際には、分類用データベースと同じに、構造辞書・項目辞書・補完用辞書を使用することになるので、抽出用データベースというものが分類用データベースと別に存在するわけではない。抽出機能の具体的な処理を説明する場合において、抽出しようする項目と値の情報を蓄えてある場所という程度の意味である。
[補完用データベース]
補完用辞書とほぼ同じ意味で使われている。データベースという言葉が器を指すニュアンスが強く、辞書は器の中に入る内容を指すニュアンスが強い。
[Classification database]
It is a database that contains information used to classify FAX received documents. In reality, since the structure dictionary, the item dictionary, and the complementary dictionary are used in the same manner as the extraction database, the classification database does not exist separately from the extraction database. When describing a specific process of the classification function, it means a place where information to be classified is stored.
[Extraction database]
It is a database that contains information used to extract the items in the purpose document. Actually, since the structure dictionary, the item dictionary, and the complementary dictionary are used in the same manner as the classification database, the extraction database does not exist separately from the classification database. When describing a specific process of the extraction function, it means a place where information of items and values to be extracted is stored.
[Complementary database]
It has almost the same meaning as the complementary dictionary. The word “database” has a strong nuance to refer to a vessel, and the dictionary has a strong nuance to refer to the contents contained in a vessel.

[得意先別翻訳マスタ]
得意先の品番と自社の品番が異なるとき、得意先の品番を自社の品番に置き換える必要があり、製品名についても同様である。得意先の品番や商品名と自社の品番や製品名の対応付けを行っているのが得意先翻訳マスタである。
[得意先別いつものマスタ]
得意先が発注時に指定する際に、製品名ではなく得意先で使用されている通称などが使用される場合がある。また、色や形状などの細かい仕様については記述されていない場合もある。その際に過去の購入情報をもとにいつも購入している製品の製品名、品番、枝版、仕様を特定して置き換える必要がある。そのような情報を保持しているのかが得意先別いつものマスタである。
[Customer-specific translation master]
When the product number of the customer and the product number of the company are different, it is necessary to replace the product number of the customer with the product number of the company, and the product name is the same. The customer translation master associates the product number and product name of the customer with the product number and product name of the company.
[Usually master by customer]
When the customer specifies when ordering, the common name used by the customer may be used instead of the product name. In some cases, detailed specifications such as color and shape are not described. At that time, it is necessary to identify and replace the product name, product number, branch edition, and specification of the product that is always purchased based on past purchase information. It is the usual master for each customer whether to hold such information.

[グローバルルール]
構造辞書、項目辞書、補完用辞書の中で、特定の得意先に依存しない情報の属性を「グローバル」としている。このグローバルの属性をもった辞書の内容を総称してグローバルルールと称する。
[ローカルルール]
構造辞書、項目辞書、補完用辞書の中で、特定の得意先のための情報の属性を「ローカル」としている。このローカルの属性をもった辞書の内容を総称しローカルルールと称する。
[Global Rule]
In the structure dictionary, the item dictionary, and the complementary dictionary, the attribute of information that does not depend on a specific customer is "global". The contents of the dictionary having this global attribute are collectively called a global rule.
[Local Rule]
In the structure dictionary, the item dictionary, and the complementary dictionary, the attribute of information for a specific customer is "local". The contents of the dictionary having this local attribute are collectively referred to as a local rule.

次に、本願発明の実施形態を図面に基づいて説明する。
図1は、本願発明の第1の発明に関するシステム概念図を図示したものである。本願発明の活字OCRシステムは、大きく「分類機能」「抽出機能」「確認・修正機能」「データ出力機能」「学習機能」から構成される。以下、各機能ごとに説明する。
Next, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 illustrates a system conceptual diagram relating to a first invention of the present invention. The type OCR system of the present invention is mainly composed of "classification function", "extraction function", "confirmation/correction function", "data output function", and "learning function". Hereinafter, each function will be described.

まず、「分類機能」は、FAXで受信した書面(受信書面)をOCR処理する目的の「書面(目的書面)」か「目的外の書面(非目的書面)」かに分類する機能である。
分類の作業としては、発信元からFAXにより受信した発信元属性データ(TSIコード又はFAX番号等)の付随した受信書面を全体的にOCR処理する。
そして、分類用データベースを用いて、「目的書面」と「非目的書面」に分類する。
ここで、「分類用データベース」は、受信書面を目的書面又は非目的書面に分類できる「用語の定義」や「分類のルール」等を備えたものである。例えば、目的書面が「注文書」の場合に、注文書を定義し、注文書と同義語の書面(「発注書」「依頼書」等)を目的書面として分類できるようにする。
First, the "classification function" is a function of classifying a document received by FAX (received document) into a "document (purpose document)" for the purpose of OCR processing or a "non-purpose document (non-purpose document)".
As the classification work, the reception document accompanied by the sender attribute data (TSI code, FAX number, etc.) received from the sender by FAX is wholly OCR processed.
Then, using the classification database, it is classified into "purpose document" and "non-purpose document".
Here, the “classification database” is provided with “definition of terms”, “classification rules” and the like that can classify received documents into target documents or non-target documents. For example, when the purpose document is a “order form”, the order form is defined so that documents having the same meanings as the order form (“order form”, “request form”, etc.) can be classified as the purpose form.

次に、「抽出機能」は、目的書面から必要な「項目名」「値」「座標」を抽出する機能である。
抽出の作業としては、目的書面をOCR処理する。そして、抽出用データベースおよび補完用データベースを用いて、「項目名」「値」「座標」を抽出する。
ここで、抽出用データベースは、受信書面から「項目名」「値」を抽出できる「同義語辞書」や「項目名と値の配置」「項目別の値パターン」等を備えたものである。すなわち、目的書面から「項目名」を抽出する場合、項目名の表現にバラツキがあるので、「同義語辞書」で吸収して正規化を行う。例えば、「氏名」「なまえ」「名前」「お名前」「ご芳名」といったものを「氏名」という項目で代表する。また、「項目名」に対応した「値(数量・品名)」を抽出する場合、その抽出方法は「項目名」をテキストアンカーという目印として使い、その周辺(上下左右と斜め方向:項目名と値の配置で定義・設定)で「項目名」に対応する「値」のパターン(項目別の値パターン)から検索して抽出する。なお、「項目名」と「値」が同じ矩形領域の箱に含まれている場合にも対応する。
また、この抽出用データベースは、標準的に適用される「グローバルルール」と特定の属性データを有する発信元からの受信書面にのみ適用される「ローカルルール」とに分けられる。グローバルルールは、FAX受信書面の7割〜8割方で適用され得るルールで、このグローバルルールを適用できない残りの2割〜3割のFAX受信書面に適用されるのがローカルルールである。ローカルルールは、FAXを受信する際に画像とともに受信する発信元属性データ(TSIコード又はFAX番号等)ごとに蓄積される。すなわち、同じ発信元からの受信書面であれば、同じフォーマットの書面であり、同じルールが適用できるからである。
Next, the "extraction function" is a function of extracting the necessary "item name", "value", and "coordinates" from the purpose document.
As the work of extraction, the target document is OCR processed. Then, the "item name", "value", and "coordinates" are extracted using the extraction database and the complementary database.
Here, the extraction database is provided with a “synonym dictionary” capable of extracting “item name” and “value” from the received document, “arrangement of item name and value”, “value pattern for each item”, and the like. That is, when the "item name" is extracted from the purpose document, since the expression of the item name varies, it is absorbed by the "synonym dictionary" and normalized. For example, items such as “name”, “name”, “name”, “name”, “good name” are represented by the item “name”. When extracting the "value (quantity/item name)" corresponding to the "item name", the extraction method uses "item name" as a marker for the text anchor, and its surroundings (up, down, left, right and diagonal: item name and Search and extract from the "value" pattern (value pattern for each item) corresponding to the "item name" in (Definition/Setting in Value Arrangement). In addition, it corresponds also when the "item name" and the "value" are included in the box of the same rectangular area.
Further, the extraction database is divided into a "global rule" which is applied as a standard and a "local rule" which is applied only to a receiving document from a sender having specific attribute data. The global rule is a rule that can be applied to 70% to 80% of the FAX reception document, and the local rule is applied to the remaining 20% to 30% of the FAX reception document to which this global rule cannot be applied. The local rule is stored for each source attribute data (TSI code, FAX number, etc.) received together with the image when receiving the FAX. That is, as long as the documents are received from the same sender, the documents have the same format and the same rule can be applied.

次に、補完用データベースを用いた「補完機能」及び「標準化・正規化機能」について説明する。まず「補完機能」はOCR結果が誤って認識した文字を含む場合に、N-gram法などに代表されるような、あいまいな文字列から正しい文字列を見つけ出す手法を使って、あらかじめ正しい文字列が登録された補完用データベースからもっとも近い文字列を取り出して抽出結果の文字列を置き換える機能である。たとえば、アルファベットと数字が混在した製品コードをOCRが認識する場合、大文字のI(アイ)と小文字l(エル)と数字の1(イチ)、大文字のO(オー)と数字の0(ゼロ)、M/m(エム)とN/n(エヌ)、V/v(ブイ)とY/y(ワイ)などを明確に識別することは非常に困難となるが、この「補完機能」によってOCRの認識結果を正しい製品コードに補完できる可能性の大幅な向上を期待できる。 Next, the “complementary function” and “standardization/normalization function” using the complementary database will be described. First, the "complementary function" uses a method of finding a correct character string from an ambiguous character string, such as the N-gram method, when the OCR result includes a character that is erroneously recognized. Is a function that replaces the extracted character string by extracting the closest character string from the registered complementary database. For example, when OCR recognizes a product code with a mixture of alphabets and numbers, uppercase I (eye) and lowercase l (el) and number 1 (ichi), uppercase O (o) and number 0 (zero). , M/m (em) and N/n (en), V/v (buoy) and Y/y (wai) are very difficult to distinguish clearly, but this "complementary function" makes OCR It is expected that the recognition result of can be complemented with the correct product code.

また「標準化・正規化機能」は、送信元ごとに存在する独自に定められたコード体系や慣用的な通称や略称を、受信側で定められた標準化されたコードや正式な名称に変換することを目的とする。変換にあたっては、OCRによる誤った文字の認識を考慮し、「補完機能」と同様なN-gram法などに代表される「あいまい検索」を使って慣用データベースの検索を行い、一致した文字列に対応する標準化されたコードや正式な名称の取得をおこない抽出結果を置き換える機能である。この「標準化・正規化機能」によって、送信元ごとに異なる暗黙のルールを標準的なルールに則したコードや名称に変換することができる。 In addition, the "standardization/normalization function" is to convert an independently defined code system or common name or abbreviation that exists for each sender into a standardized code or formal name specified on the receiving side. With the goal. In conversion, in consideration of erroneous character recognition by OCR, a conventional database is searched using a "fuzzy search" typified by the N-gram method similar to the "completion function" to find a matching character string. It is a function that replaces the extraction result by acquiring the corresponding standardized code and official name. With this "standardization/normalization function", it is possible to convert an implicit rule that differs for each sender into a code or name that conforms to the standard rule.

次に、「確認・修正機能」は、抽出機能で抽出した「値」「OCR領域」を確認・修正する機能である。
その確認・修正機能は、「確認・修正画面」で行われる(図2)。「確認・修正画面」は、目的書面の受信画像と、抽出機能によって当該受信画像から抽出した「項目名」と「値」のデータを表示する抽出表示とを並記したものである。
確認機能は、抽出表示の抽出された「項目名」や「値」の欄を指定すると、これに対応する受信画像の該当部分が識別できるようになり(色枠で表示、背景や文字・数字を別 色で表示など)、確認が極めて容易になる。
修正機能は、抽出した「値」と抽出した「エリア(領域)」で異なる処理を行う。抽出対象の「エリア(領域)」は間違っていないが、そこから抽出された「値」が間違えていた場合(例えば、「3」と読み取るところを「8」と読み取っていた場合)は、正しい「値」を抽出表示に入力し直す(オペレータの手作業)。
一方、抽出対象の「エリア(領域)」を間違えた場合は、正しい「エリア(領域)」を受信画像上で指定(選択)し、その指定領域をOCR処理させて正しい「項目名」又は「値」を抽出し、抽出表示に自動的に入力させるようにする。
Next, the "confirmation/correction function" is a function of confirming/correcting the "value" and "OCR area" extracted by the extraction function.
The confirmation/correction function is performed on the “confirmation/correction screen” (FIG. 2). The “confirmation/correction screen” is a parallel display of the received image of the target document and the extraction display for displaying the “item name” and “value” data extracted from the received image by the extraction function.
The confirmation function can identify the corresponding part of the received image that corresponds to this by specifying the extracted "item name" and "value" fields of the extraction display (displayed with a color frame, background and letters and numbers). Is displayed in a different color, etc.), making it extremely easy to check.
The correction function performs different processing for the extracted “value” and the extracted “area”. The “area” to be extracted is not wrong, but it is correct if the “value” extracted from it is incorrect (for example, when reading “3” reads “8”). Reenter the "value" in the extract display (manual operator work).
On the other hand, if the "area (region)" to be extracted is mistaken, the correct "area (region)" is designated (selected) on the received image, and the designated region is OCR-processed so that the correct "item name" or ""Value" is extracted, and it is automatically input to the extraction display.

また、「データ出力機能」は、データ出力機能は、確認・修正したデータを所定の出力フォーマットの形で出力し、エクスポート(目的書面のデータベースへ保存等)するものである。 Further, the “data output function” is a function for outputting the checked/corrected data in the form of a predetermined output format and exporting (storing in a database of a target document).

最後に、「学習機能」は、前記確認・修正機能において、抽出対象の「エリア(領域)」を間違えた場合は、正しい「エリア(領域)」を受信画像上で指定(選択)するが、このとき、この指定領域の情報は当該目的書面に付与された属性データ(発信元情報)と紐付けされて、「ローカル(個別)ルール」に蓄積される。以後、当該属性データ(発信元情報)を付与された目的書面については、抽出機能において「グローバル(標準)ルール」に優先されてこの「ローカル(個別)ルール」が適用されて処理されることになる。
また、抽出する「値」を間違えた場合は、正しい「値」に修正するが、このとき、この修正された「値」の情報は補完用データベースに蓄積される。以後、抽出機能において、この補完用データベースが用いられて「値」が自動的に補完され抽出される。
Finally, the "learning function" specifies (selects) the correct "area (region)" on the received image when the "area (region)" to be extracted is mistaken in the confirmation/correction function, At this time, the information in the designated area is stored in the "local (individual) rule" in association with the attribute data (source information) attached to the purpose document. After that, for the purpose document to which the attribute data (source information) is added, the “local (individual) rule” is applied and processed in the extraction function with priority over the “global (standard) rule”. Become.
Further, when the “value” to be extracted is mistaken, the correct “value” is corrected. At this time, the corrected “value” information is stored in the complementary database. After that, in the extraction function, the “value” is automatically complemented and extracted by using this complementing database.

図3〜図8は、本願発明の第2の発明に関する説明図である。
本願発明の第2の発明は、全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面(FAX受信書面)を、構造辞書・項目辞書・補完用辞書を用いて分析・抽出する。例えば、図の文書を例に説明すると、図示するようにFAX受信書面を「表題ゾーン」「発注先ゾーン」「発注元ゾーン」「メイン明細ゾーン」「共通ゾーン1」「共通ゾーン2」「共通ゾーン3」「共通ゾーン4」「共通ゾーン5」と分析する。分析の方法としては、「表題ゾーン」を例に挙げると、表題は一般的に書面の上段中央部に配置されて、文書名が記載されることが多い(これらの情報は、構造辞書・項目辞書等に蓄積されている)。図3のFAX受信書面では、書面の上段中央部に「注文書」と記載されていることから、構造辞書及び項目辞書等を用いることで、この「注文書」と記載されている領域が「表題ゾーン」であると分析する。同様に、「発注先ゾーン」〜「共通ゾーン5」について分析する。
3 to 8 are explanatory views regarding the second invention of the present invention.
A second invention of the present invention uses a structure dictionary/item dictionary/complementary dictionary for a FAX reception document (FAX reception document) created in print characters except for the whole characters or a handwritten part in part. Analyze and extract. For example, taking the document in the figure as an example, as shown in the figure, the FAX reception document is "title zone", "ordering zone", "ordering zone", "main specification zone", "common zone 1", "common zone 2", "common". It is analyzed as "zone 3""common zone 4""common zone 5". Taking the "title zone" as an example of the analysis method, the title is generally placed in the upper center of the document, and the document name is often described (these information is the structure dictionary/item). Accumulated in dictionaries etc.). In the FAX reception document of FIG. 3, since the "order form" is described in the upper middle part of the document, the area described as "order form" can be changed by using the structure dictionary and the item dictionary. Title zone". Similarly, the "ordered party zone" to "common zone 5" are analyzed.

(分類機能)
そして、「表題ゾーン」に記載されている表題(値)によって、目的書面と非目的書面に分類する。目的書面を「注文書」とするならば、「表題ゾーン」に「注文書」又は注文書と同義語で記載されているもの(これは項目辞書を用いることで、「発注書」「御注文書」などを同義語と認識できる)を目的書面と判断する。
(Classification function)
Then, according to the title (value) described in the “title zone”, it is classified into a target document and a non-target document. If the purpose document is an “Order Form”, the “Order Form” or a synonym for the order form is written in the “Title Zone” (this is the “Order Form” or “Order Form” by using the item dictionary). It can be recognized as a target document.

(抽出機能)
次に、目的書面から「項目名」「値」「信頼性」「座標」を抽出する。「注文書」であれば、例えば「項目名」は商品番号、「値」は数量となる。商品番号や数量は、メイン明細ゾーンに記載されているので(その情報は構造辞書に蓄積)、メイン明細ゾーンに記載されている記載内容から(「座標」と構造辞書で認識できる)、文字種(商品番号であれば数字や英字による表記、数量であれば数字のみ又は数字と単位による表記)、テンプレート(A会社の商品番号であれば、XXXNNNN−XNなど)、「項目名」と「値」の位置関係(数量は商品番号の右側又は下側:構造辞書に蓄積)などの情報を用いて、抽出される。
なお、数量などは、一般的に(各社共通で)算用数字で表記されるので、標準的に適用されるグローバルルールとして「数量は算用数字で表記されたもの」と構造辞書・項目辞書・補完用辞書に備えることになる。
一方、注文書番号などは、取引各社による共通ルールとして表記が一致することは期待できないが、会社・部署ごとに共通する場合もあるので、特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとして「A会社の注文書番号はANNNN−N」などと構造辞書・項目辞書・補完用辞書に備えることになる。
なお、図8に図示するように、「項目名」の背景に着色や網掛けがされている場合に、一般的なOCR技術であれば、そこから項目名を認識し、値を抽出することは極めて困難であるが、本願発明では補完用辞書やローカルルール等を適用して値の抽出を可能にしている。
また、補完用辞書や得意先別翻訳マスタ・得意先別いつものマスタなどを用いて、OCR認識を自動的に補完・置き換えなどをして、その結果を抽出結果とすることで、OCR認識を支援する。万一、OCRの結果、「信頼性」の低いものがあれば、次の確認・修正機能でそれが分かるように表示する。
(Extraction function)
Next, "item name", "value", "reliability" and "coordinates" are extracted from the purpose document. In the case of “order form”, for example, the “item name” is the product number and the “value” is the quantity. Since the product number and quantity are listed in the main detail zone (the information is stored in the structure dictionary), the character type (which can be recognized as "coordinates" in the structure dictionary) from the description content written in the main detail zone ( If it is a product number, it will be written in numbers or English letters, if it is a quantity, it will be written only in numbers or in numbers and units), template (if it is a product number of Company A, XXXNNNN-XN, etc.), "item name" and "value" Is extracted using information such as the positional relationship (the quantity is on the right side or the lower side of the product number: accumulated in the structure dictionary).
In addition, since the quantity etc. are generally written in arithmetic numbers (common to all companies), the global rule that is applied as standard is "quantity is expressed in arithmetic digits" as a structure dictionary/item dictionary.・Prepare for a supplementary dictionary.
On the other hand, the order number etc. cannot be expected to match as a common rule by each trading company, but since it may be common for each company/department, it can be used only in the receiving document from the sender having specific attribute data. As a local rule to be applied, "Structure dictionary of item A is ANNNN-N" and the like are provided in the structure dictionary, item dictionary, and complementary dictionary.
As shown in FIG. 8, when the background of the “item name” is colored or shaded, if it is a general OCR technique, the item name should be recognized and the value extracted from it. Is extremely difficult, but in the present invention, it is possible to extract a value by applying a complementary dictionary, a local rule, or the like.
OCR recognition is also performed by automatically completing and replacing OCR recognition using a complementary dictionary, a translation master for each customer, and a usual master for each customer, and using the result as an extraction result. Support. If the result of OCR is that the "reliability" is low, it will be displayed so that it can be understood by the next confirmation/correction function.

(確認・修正機能)
確認・修正機能については、モニター画面に受信書面の画像(左)と抽出機能によって抽出された当該受信書面の抽出表示(右)とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正する(図2参照)。
(Confirmation/correction function)
Regarding the confirmation/correction function, the image of the reception document (left) and the extraction display of the reception document extracted by the extraction function (right) are displayed in parallel on the monitor screen, and the "value" for the "item name" is displayed. Check and correct it if it is incorrect (see Figure 2).

図9は、本願発明の第2の発明に関するシステム概念図を図示したものである。
ここでは、目的書面の種類を「注文書」として説明する。なお、「分類機能」については、図1に示す第1の発明と同じであるので、その説明を省略するが、目的書面が「注文書」であるため、注文書、発注書、オーダーフォームとよばれる文書のみを抽出する必要がある。
FIG. 9 is a system conceptual diagram relating to the second invention of the present invention.
Here, the type of purpose document will be described as "order form". The “classification function” is the same as that of the first invention shown in FIG. 1, and therefore its explanation is omitted. However, since the purpose document is “order book”, it is called order book, order book, or order form. Only the documents that are exposed need to be extracted.

次の「抽出機能」では、入力された文書から、抽出用データベース(構造辞書・項目辞書・補完用辞書)を使って、必要な項目の値を取り出す。「注文書」においては、得意先名、注文日時、品番、商品名、単価、数量、合計金額、希望納期などが抽出されるべき項目となる。
抽出機能では、OCR結果を、「項目名、値、信頼性、座標」のセットして取り扱う。例としては、「得意先名、○×商事、85%、(972, 246)-(1331,308)」などである。OCRエンジンによって信頼性の解釈が異なり、画像の解像度によって座標の返す値の範囲が異なることを考慮する必要はあるものの、これらの4つの情報は何らかの方法で取得できるはずのものとして取り扱う。
図示するように、分類機能で行った1回目のOCR処理或いは1回目のOCR処理では不十分であれば2回目のOCR処理に対して、ゾーン情報を基にして、ゾーンと項目との関係から項目と値の関係を抽出する。例えば、ゾーンAは、注文書の中段より上側の右端に配置されており、項目として「会社名」「TEL」「FAX」があるので、これを発注元として抽出し、項目と値の関係を抽出する。また、ゾーンBは、注文書の下半分に位置しており、これを注文数量として抽出する。
In the next "extraction function", the value of the required item is extracted from the input document using the extraction database (structure dictionary/item dictionary/completion dictionary). In the "order form", customer name, order date and time, product number, product name, unit price, quantity, total amount, desired delivery date, etc. are items to be extracted.
The extraction function handles the OCR result by setting "item name, value, reliability, coordinate". An example is “customer name, XX company, 85%, (972, 246)-(1331, 308)”. Although it is necessary to consider that the OCR engine has different interpretations of reliability and the range of values returned by the coordinates differs depending on the resolution of the image, these four pieces of information are treated as being supposed to be obtained by some method.
As shown in the figure, if the first OCR processing performed by the classification function or the first OCR processing is insufficient, the second OCR processing is performed based on the zone information, and the relationship between the zone and the item is determined. Extract the relationship between items and values. For example, zone A is located at the upper right side of the middle part of the order form, and there are "company name", "TEL", and "FAX" as items, so this is extracted as the order source and the relationship between the item and value is extracted. Extract. Zone B is located in the lower half of the order form and is extracted as the order quantity.

なお、この抽出機能については、補完用データベース(補完用辞書)を使用して、OCRで誤認識となった文字を正しい文字に置き換える補完機能を備えても良い。文字を正しい文字に置き換える際に、文字単位ではなく単語ごとに誤認識のパターンを保持して、単語を正しいものに修正するような動作を前提にしている。
例えば、「発 シ 主 日 目 寺」→「発注日時」などである。
また、得意先別翻訳マスタを使用して、得意先の品番や製品名を自社の品番や製品名に置き換える機能(標準化・正規化機能)を備えても良い。
Regarding this extraction function, a complementing function (replacement dictionary) may be used to replace a character erroneously recognized by OCR with a correct character. When replacing a character with a correct character, it is premised on the operation of holding a misrecognition pattern for each word instead of each character and correcting the word to be correct.
For example, “Starting date main temple” → “Order date and time”.
Further, a customer-specific translation master may be used to provide a function (standardization/normalization function) of replacing the customer's product number or product name with the company's product number or product name.

続く「確認・修正機能」は、OCR結果で信頼性が低い文字を人が目で見て確認を行い、正しい文字に修正する機能である。一般的に、画面の片側に認識対象の画像、もう片側に認識結果の文字が表示され、認識結果の文字は修正可能になっている。
また「データ出力機能」は、OCR認識、確認修正作業などを経た後、最終的に出力される形式を指定して、リレーショナルデータベースやCSVファイルなどに出力する。
更に「学習機能」は、確認・修正機能において、修正した内容を補完用データベース(補完用辞書)に蓄積し、以降のOCR認識結果を補完する際に有効活用する。
The subsequent “confirmation/correction function” is a function of allowing a person to visually confirm a character with low reliability in the OCR result and correct it to a correct character. In general, an image to be recognized is displayed on one side of the screen and a character of the recognition result is displayed on the other side of the screen, and the character of the recognition result can be corrected.
In addition, the “data output function” specifies the format to be finally output after the OCR recognition and confirmation/correction work, and outputs the data to a relational database or CSV file.
Further, the "learning function" stores the corrected contents in the complementary database (complementary dictionary) in the confirmation/correction function, and makes effective use when complementing the subsequent OCR recognition result.

また、第2の発明には「仮想帳票」という特徴を有する。
図10及び図11において、「仮想帳票」について説明する。
図10に図示するように、従来は、各文書(同一レイアウトの文書)ごとに設定された処理内容で作業が進められていた。
これに対して、本願発明(第2の発明)は、各文書を論理的に定義された「仮想帳票」に集約することを技術思想としており、この仮想帳票に落とし込むために上記した構造辞書・項目辞書・補完用辞書を或いはグローバルルール・ローカルルールを用いて各文書のレイアウトに依存せずにデータ化に必要な項目の値を抽出している(図11:仮想帳票と各種辞書の連関図)。
従って、従来は、各文書(同一レイアウトの文書)ごとそして各作業(例えば、抽出、確認・修正、出力)ごとに設定が必要であったが、本願発明では、理論的に定義された仮想帳票の定義内容を設定するだけで、各文書(各レイアウト)ごと及び各作業ごとの設定が当然に不要となる。換言すれば、本願発明では、仮想帳票を中心にして仮想帳票を作成するために各作業が進められているので、仮想帳票の定義(設定)が決まれば、その他の設定は基本的にいらないのである。
Further, the second invention has a feature of "virtual form".
The “virtual form” will be described with reference to FIGS. 10 and 11.
As shown in FIG. 10, conventionally, work has been performed with the processing content set for each document (document having the same layout).
On the other hand, the present invention (second invention) has a technical idea of consolidating each document into a logically defined “virtual form”, and the above-mentioned structure dictionary Item dictionary/complementary dictionary or global rule/local rule is used to extract the value of the item required for data conversion without depending on the layout of each document (Fig. 11: Relationship between virtual form and various dictionaries) ).
Therefore, conventionally, setting was required for each document (document having the same layout) and for each work (for example, extraction, confirmation/correction, output), but in the present invention, a theoretically defined virtual form is required. By setting the definition content of, it is naturally unnecessary to set each document (each layout) and each work. In other words, in the present invention, since each work is being carried out to create a virtual form with a focus on the virtual form, once the definition (setting) of the virtual form is decided, other settings are basically unnecessary. is there.

仮想帳票は、特定のレイアウトに依存しない帳票で、「注文書」「見積依頼書」「作業依頼書」など文書の目的ごとに作成される帳票で、以下のような情報を含んでいる。
□文書の種類(注文書、見積依頼書、連絡票など)
・文書種別ID
・文書種別名
・文書種別の説明
□使用する項目の一覧
仮想帳票を定義する場合に中心となるのが項目の情報である。「注文書」であれば、文書名、注文書番号、注文書日付、発注元、発注元電話番号、発注元FAX番号、品番、品名、単価、数量、合計金額、消費税などの項目が必要となり、これらの項目の情報を項目辞書への参照方法(項目ID)として保持する。
□対応する構造辞書
仮想帳票には、書面のレイアウトについての情報や、項目の値の配置に関する情報がない。これらの情報は構造辞書にあるため、対応する構造辞書への参照情報(文書種別IDEA)を保持する。
□確認修正用画面レイアウト
具体的な個々の帳票の項目の物理的な配置に依存しない、一般的な帳票の項目の配置をして、目視で内容をチェックする効率があがるようなレイアウト
□出力フォーマット
具体的な個々の帳票に記載されている項目の形式に依存しない、日付や金額の形式が統一された形でリレーショナルデータベースやCSVファイルに出力される設定
□ロジカルチェック
明細に書かれた金額の合計と合計金額欄に書かれた金額が一致するか、希望納期が注文日時よりも充分な日数分後になっているかなど論理的なチェックロジックの設定
□DBルックアップ
入力する項目がいくつかの選択肢に限られる場合に、選択可能な項目を設定。支払い方法が「現金、クレジットカード、代引、納品後振込み」から選択できるなどの設定
The virtual form is a form that does not depend on a specific layout, and is a form created for each purpose of the document such as “order form”, “quotation request form”, “work request form”, and includes the following information.
□ Document type (order form, request for quotation, contact form, etc.)
-Document type ID
-Document type name-Document type description □ List of items to be used When defining a virtual form, item information is central. If it is an "Order Form", items such as document name, order form number, order form date, order originator, order originator phone number, order originator FAX number, product number, product name, unit price, quantity, total amount, consumption tax, etc. are required. Therefore, the information of these items is held as a reference method (item ID) to the item dictionary.
□ Corresponding structural dictionary The virtual form does not have information about the layout of the document or information about the layout of the item values. Since these pieces of information are in the structure dictionary, reference information (document type IDEA) to the corresponding structure dictionary is held.
□ Confirmation/correction screen layout Layout that improves the efficiency of visually checking the contents by arranging general form items that do not depend on the physical arrangement of specific individual form items □ Output format Settings that are output to a relational database or CSV file in a unified format of date and amount that does not depend on the format of the items described in each individual form □ Logical check Total of the amount written in the statement And the amount written in the total amount column match, whether the desired delivery date is a sufficient number of days after the order date, etc. Logical check logic settings □ DB lookup There are several options to enter. Set the selectable items when limited. Settings such as payment method can be selected from "cash, credit card, cash on delivery, transfer after delivery"

一般的に活字OCRといった場合、カラー画像や高解像度の画像を前提としているため、対象画像が理想的な品質でなければ期待どおりのOCR結果を抽出することはできない。しかしながら、本願発明は、FAXや複写による白黒画像や解像度の低い画像で現実的には画像品質の悪い書面からOCR結果を取り出すことが可能となるため、FAXの注文書や請求書、ドットプリンタによる伝票などからのデータ抽出、原本が添付できない本人確認書(パスポート・運転免許書)の白黒コピー・グレイスケールコピーから必要なデータを抽出することが可能となる。また、設計機能(デザイン機能)を備えているので、ニーズにあわせて設定を行えば、目的のデータを効率よく抽出し活用できる。 Generally, in the case of type OCR, since a color image or a high-resolution image is premised, the expected OCR result cannot be extracted unless the target image has ideal quality. However, according to the present invention, since it is possible to extract an OCR result from a document having a poor image quality in a black-and-white image or a low-resolution image by FAX or copying, a FAX order form, invoice, or dot printer It is possible to extract the data from the slips and the necessary data from the black-and-white copy and gray-scale copy of the identification document (passport/driver's license) that cannot be attached with the original. Also, since it has a design function (design function), if you set it according to your needs, you can efficiently extract and utilize the target data.

Claims (3)

全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、
発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、分類用データベースを用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、
目的書面に分類された受信書面をOCR処理し、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとを備えた抽出用データベース及びOCR処理を補完する補完用データベースを用いて、当該受信書面から「項目名」「値」「座標」を抽出する抽出機能と、
モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であればオペレータによって正しい「値」に修正し、また、抽出機能によるOCR領域を確認し、不適切であればオペレータによって正しい「項目名」又は「値」のOCR領域を指定し、指定されたOCR領域で再度OCR処理し、改めて「項目名」に対する「値」を確認する確認・修正機能と、
確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、
確認・修正機能によって指定されたOCR領域の情報については当該目的書面に付与された属性データと紐付けされて、ローカルルールに蓄積され、修正された値の情報については補完用データベースに蓄積されて、抽出用データベース及び補完用データベースに反映させる学習機能と、
を備えたことを特徴とする活字OCRシステム。
A type OCR system for performing OCR processing on a FAX received document created in type except for the entire type or a handwritten part in a part,
A classification function of performing OCR processing on a reception document accompanied by sender attribute data received by FAX from a transmission source and classifying the reception document into a target document and a non-purpose document by using a classification database.
OCR processing of received documents classified into object documents, and extraction database and OCR having global rules applied as standard and local rules applied only to received documents from sources having specific attribute data An extraction function for extracting the "item name", "value", and "coordinates" from the received document by using a complementary database that complements the processing,
Displays in parallel and extracted display of the received document that has been extracted by the image extraction function of the receiving written on the monitor screen, check the "value" for the "item name", correct by the operator if improper "value ", and confirm the OCR area by the extraction function, and if it is inappropriate, specify the correct OCR area of "item name" or "value" by the operator , and perform OCR processing again in the specified OCR area, Confirmation/correction function to confirm the "value" for the "item name" again,
A data output function that outputs the extraction result confirmed by the confirmation/correction function in a predetermined output format and exports it to the database of the target document,
The information in the OCR area specified by the confirmation/correction function is associated with the attribute data attached to the target document and stored in the local rule, and the information on the corrected value is stored in the supplemental database. , Learning function to reflect in extraction database and complementary database,
A type OCR system characterized by being equipped with.
全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、
当該活字OCRシステムは、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとをそれぞれ備えた構造辞書・項目辞書・補完用辞書を有し、
構造辞書は、文書の種類、文書の領域情報であるゾーン情報、項目と値の位置関係と値の数に関する情報を含み、
項目辞書は、同義語、値の形式に関する情報を含み、
補完用辞書は、項目ごとに、誤認識しやすい文字とその場所の情報を含み、
発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、
目的書面に分類された受信書面のOCR処理に対して、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面からゾーン情報を基にしてゾーンと項目との関係から項目と値の関係を抽出し、「項目名」「値」「信頼性」「座標」を抽出する抽出機能と、
モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であればオペレータによって正しい「値」に修正する確認・修正機能と、
確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、
確認・修正機能によって修正された値を、構造辞書・項目辞書・補完用辞書に反映させる学習機能と、
を備え、目的書面のレイアウト座標のみに依存せずにデータ化に必要な項目の値の抽出を可能とすることを特徴とした活字OCRシステム。
A type OCR system for performing OCR processing on a FAX received document created in type except for the entire type or a handwritten part in a part,
The type OCR system has a structure dictionary, an item dictionary, and a complementary dictionary, each of which has a global rule that is applied as a standard and a local rule that is applied only to a receiving document from a sender having specific attribute data. Then
The structure dictionary includes a document type, zone information that is document area information, information about the positional relationship between items and values, and the number of values,
The item dictionary contains information about synonyms, value formats,
The supplementary dictionary contains, for each item, characters that are easily misrecognized and information about the location,
A classification function that performs OCR processing on a reception document accompanied by sender attribute data received by FAX from a transmission source and classifies the reception document into a target document and a non-target document by using a structure dictionary/item dictionary/complementary dictionary. ,
For the OCR processing of the receiving documents classified into the target documents, using the structure dictionary/item dictionary/complementary dictionary , based on the zone information from the relevant receiving document , the relationship between the zone and the item And the extraction function to extract "item name""value""reliability""coordinates",
Displays in parallel and extracted display of the received document that has been extracted by the image extraction function of the receiving written on the monitor screen, check the "value" for the "item name", correct by the operator if improper "value Confirmation/correction function to correct
A data output function that outputs the extraction result confirmed by the confirmation/correction function in a predetermined output format and exports it to the database of the target document,
A learning function that reflects the value corrected by the confirmation/correction function in the structure dictionary/item dictionary/completion dictionary,
And a type OCR system capable of extracting the values of items required for data conversion without depending only on the layout coordinates of the target document.
請求項2記載の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウト座標のみに依存せずにデータ化に必要な項目の値を抽出するために文書の目的ごとに論理的に定義されたひとつの仮想帳票に集約すべく仮想帳票の定義内容を設定することで抽出機能と確認・修正機能とデータ出力機能とを一括して設定可能とすることを特徴とした設計機能を備えた活字OCRシステム。 The type OCR system according to claim 2 makes it possible to extract a target document having various layouts into logical values for each purpose of a document in order to extract the values of items necessary for data conversion without depending only on the layout coordinates of the individual target documents. The design function is characterized in that the extraction function, the confirmation/correction function, and the data output function can be collectively set by setting the definition contents of the virtual form so that it can be aggregated into one virtual form defined in Type OCR system with.
JP2015255533A 2014-12-27 2015-12-27 Type OCR system Active JP6702629B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014266871 2014-12-27
JP2014266871 2014-12-27

Publications (2)

Publication Number Publication Date
JP2016126796A JP2016126796A (en) 2016-07-11
JP6702629B2 true JP6702629B2 (en) 2020-06-03

Family

ID=56357039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015255533A Active JP6702629B2 (en) 2014-12-27 2015-12-27 Type OCR system

Country Status (1)

Country Link
JP (1) JP6702629B2 (en)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112639818B (en) * 2018-08-27 2024-06-04 京瓷办公信息系统株式会社 OCR system
JP2021043775A (en) 2019-09-12 2021-03-18 富士ゼロックス株式会社 Information processing device and program
JP6856916B1 (en) * 2020-01-08 2021-04-14 ジーニアルテクノロジー,インク. Information processing equipment, information processing methods and information processing programs
JP7420578B2 (en) * 2020-02-06 2024-01-23 株式会社Nttデータ Form sorting system, form sorting method, and program
JP7380319B2 (en) * 2020-02-26 2023-11-15 富士フイルムビジネスイノベーション株式会社 Information processing device and program
JP2021135670A (en) * 2020-02-26 2021-09-13 富士フイルムビジネスイノベーション株式会社 Information processing apparatus and program
JP6818923B1 (en) * 2020-04-02 2021-01-27 株式会社スカイコム Information processing equipment, data linkage system, method and program
CN111507230A (en) * 2020-04-11 2020-08-07 创景未来(北京)科技有限公司 Method and system for identifying and extracting document and table data
WO2021215589A1 (en) * 2020-04-24 2021-10-28 주식회사 애자일소다 Ocr-based document analysis system and method
JP7491107B2 (en) * 2020-07-14 2024-05-28 株式会社リコー Information processing device, information processing method, information processing program, and information processing system
CN113468886B (en) * 2021-07-28 2023-07-21 拉扎斯网络科技(上海)有限公司 Work order processing method and device and computer equipment
US11568276B1 (en) 2021-08-25 2023-01-31 International Business Machines Corporation Adaptive document understanding
JP7486760B1 (en) 2023-08-31 2024-05-20 株式会社日本ブレーン Management device, management system, and management method

Also Published As

Publication number Publication date
JP2016126796A (en) 2016-07-11

Similar Documents

Publication Publication Date Title
JP6702629B2 (en) Type OCR system
US20210073531A1 (en) Multi-page document recognition in document capture
US9613267B2 (en) Method and system of extracting label:value data from a document
AU2006307452B2 (en) Form data extraction without customization
US9317484B1 (en) Page-independent multi-field validation in document capture
JP5774597B2 (en) System and method using dynamic variation network
JP6357621B1 (en) Accounting processing apparatus, accounting processing system, accounting processing method and program
US20150310269A1 (en) System and Method of Using Dynamic Variance Networks
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2013164740A (en) Accounting information reading system, accounting information reading method, and program
CN109726369A (en) A kind of intelligent template questions record Implementation Technology based on normative document
JP2018190064A (en) Accounting processing system
KR102282025B1 (en) Method for automatically sorting documents and extracting characters by using computer
JP2016192223A (en) Accounting information reading system and program
JP6856916B1 (en) Information processing equipment, information processing methods and information processing programs
JP2003242441A (en) Document processing method, apparatus and program
US20230162517A1 (en) Interactive visual representation of semantically related extracted data
JP3766854B2 (en) Data processing device
WO2021140682A1 (en) Information processing device, information processing method, and information processing program
US20230073775A1 (en) Image processing and machine learning-based extraction method
US20230099764A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP7037237B1 (en) Data processing equipment, data processing methods and programs
US20240112483A1 (en) Method and apparatus for form identification and registration
JP7547729B2 (en) Information processing device, information processing system, and program
US20230140357A1 (en) Image processing apparatus, image processing method, and non-transitory storage medium

Legal Events

Date Code Title Description
AA64 Notification of invalidation of claim of internal priority (with term)

Free format text: JAPANESE INTERMEDIATE CODE: A241764

Effective date: 20160129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200503

R150 Certificate of patent or registration of utility model

Ref document number: 6702629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250