JP2018207270A - Non-structured fax document classification system - Google Patents

Non-structured fax document classification system Download PDF

Info

Publication number
JP2018207270A
JP2018207270A JP2017109725A JP2017109725A JP2018207270A JP 2018207270 A JP2018207270 A JP 2018207270A JP 2017109725 A JP2017109725 A JP 2017109725A JP 2017109725 A JP2017109725 A JP 2017109725A JP 2018207270 A JP2018207270 A JP 2018207270A
Authority
JP
Japan
Prior art keywords
document
fax
classification
unstructured
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017109725A
Other languages
Japanese (ja)
Inventor
正美 若山
Masami Wakayama
正美 若山
夏菜子 佐藤
Kanako Sato
夏菜子 佐藤
有祐 松尾
Yusuke Matsuo
有祐 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hammock Corp
Original Assignee
Hammock Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hammock Corp filed Critical Hammock Corp
Priority to JP2017109725A priority Critical patent/JP2018207270A/en
Publication of JP2018207270A publication Critical patent/JP2018207270A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimiles In General (AREA)
  • Storing Facsimile Image Data (AREA)

Abstract

To provide a non-structured FAX document classification system capable of almost certainly performing automatic classification of a non-structured FAX document using an OCR result (including a candidate character and attribute information such as reliability).SOLUTION: A non-structured FAX document classification system comprises: a FAX reception function for receiving a non-structured document that is not a document previously structured for OCR processing, using FAX; a classification rule setting function for setting a classification rule for classifying a received non-structured FAX document in units of a person or in units of an item; an automatic classification function for applying the classification rule set as a method for classification to classify the received non-structured Fax document in units of a person or in units of an item; and a storage and output function for storing or outputting classified unit document group in units of a person or in units of an item.SELECTED DRAWING: Figure 1

Description

本願発明は、FAXされた書面(特にOCR処理するように予め構造化された書面ではない非構造化書面)を自動的に分類する分類システムに関するものである。   The present invention relates to a classification system that automatically classifies a faxed document (particularly an unstructured document that is not a prestructured document for OCR processing).

受信されるFAX文書を正確にかつ効率的に分類することのできるFAX文書分類装置として特許文献1に開示されたものがある。
詳しくは、同装置は、1通信にて受信される1群のFAX文書の各々に、FAX文書の一部として含まれる識別情報に対応するキーワードを対応付けることにより、FAX文書を分類するFAX文書分類装置である。同装置では、1群のFAX文書が1枚ずつ順次表示画面120上のイメージ表示領域121に表示され、表示されるFAX文書の各々に対して、文字入力領域122への表示が伴われつつキーワードの入力が受け付けられ、入力されたキーワードと表示されるFAX文書の各々を特定するイメージファイル名との対応付けが記憶されるものである。
Japanese Patent Application Laid-Open No. H10-228688 discloses a FAX document classification apparatus that can accurately and efficiently classify received FAX documents.
More specifically, the apparatus classifies a FAX document by associating a keyword corresponding to identification information included as a part of the FAX document with each group of FAX documents received in one communication. Device. In this apparatus, a group of FAX documents is displayed one by one in the image display area 121 on the display screen 120, and each displayed FAX document is displayed as a keyword in the character input area 122 while being displayed. Is stored, and the correspondence between the input keyword and the image file name that identifies each FAX document to be displayed is stored.

特開2001−282814号公報JP 2001-282814 A

このようなFAX文書分類装置では、FAX文書を分類する前に、受信したFAX文書1枚ずつにユーザが「キーワード」や「優先順位」を入力する。確かに、このような装置であれば、受信されるFAX文書を正確に分類できるかもしれない。
しかし、ユーザによる「キーワード」や「優先順位」といったデータの入力はどうしても必要であり、人間がFAX文書に関する情報を特定しなければならない。
In such a FAX document classification apparatus, the user inputs “keyword” and “priority” for each received FAX document before classifying the FAX document. Certainly, such a device may be able to accurately classify received fax documents.
However, it is absolutely necessary for the user to input data such as “keyword” and “priority order”, and humans must specify information related to the FAX document.

人間にFAX文書に関する情報を特定させることになると効率性を妨げることになる。これに対して、OCR(光学的文字読取装置)を利用することで文書を読み取り、文書に記載された内容を特定することは可能である。
しかし、FAX文書は画像品質が悪くOCRで正確に読み取ることが難しい。FAX文書であっても、OCR処理するように予め構造化された書面であれば、ある程度OCRで読み取ることは可能であるかもしれないが、そうでない非構造化の書面ではOCRで読み取ったキーワードが完全に正確であるということを証明することは難しい。
If humans are allowed to specify information related to a FAX document, efficiency will be hindered. On the other hand, it is possible to read a document by using an OCR (optical character reader) and specify the contents described in the document.
However, FAX documents have poor image quality and are difficult to read accurately with OCR. Even if it is a FAX document, it may be possible to read it with OCR to some extent if the document is structured in advance so as to perform OCR processing. It is difficult to prove that it is completely accurate.

これに対して、本願発明者は、受信した非構造化FAX書面に対するOCR結果の完全性を期待せずに、仮にOCRで読み取れなかった部分があったとしてもそのまま(特定せずにあいまいなまま)で分類することで、人間による特定を必要としない完全自動化された非構造化FAX書面分類システムを提供すべく、本願発明を完成させるに至った。   On the other hand, the inventor of the present application does not expect the completeness of the OCR result for the received unstructured FAX document, and even if there is a part that could not be read by OCR, it remains as it is (unspecified and remains ambiguous) In order to provide a fully automated unstructured FAX document classification system that does not require human identification, the present invention has been completed.

上記目的を達成するために、第1の発明は、OCR処理するように予め構造化された書面ではない非構造化書面をFAXで受信するFAX受信機能と、受信した非構造化FAX書面を人単位又は案件単位に分類するための分類ルールを設定する分類ルール設定機能と、分類分けのための手法に設定された分類ルールを適用して受信した非構造化FAX書面を人単位又は案件単位に分類する自動分類機能と、分類した人単位又は案件単位ごとの単位書面群を保存又は出力する保存出力機能と、を備えたことを特徴とする非構造化FAX書面分類システムである。ここで、FAX受信機能は、OCR処理用に予め構造化された構造化書面や半構造化された半構造化書面の受信を除くものではない。
第2の発明は、自動分類機能における分類分けのための手法として、分類ルールに従い非構造化FAX書面をOCR処理した認識結果から非構造化FAX書面の各ページ間の類似性を算出し、その類似性から分類分けのアルゴリズムを使用して分類分けするものであることを特徴とする同非構造化FAX書面分類システムである。
第3の発明は、自動分類機能が着信の異なる非構造化FAX書面もその対象にして人単位又は案件単位に分類することを特徴とする同非構造化FAX書面分類システムである。
第4の発明は、必要な非構造化FAX書面が欠落して不備・追加のある単位書面群については、補完リストにリストアップ又は保存出力機能によってフォルダ保存し、自動分類機能を用いて後から着信された非構造化FAX書面をリストアップ又はフォルダ保存された単位書面群に分類する不備・追加書面管理機能を備えたことを特徴とする同非構造化FAX書面分類システムである。
第5の発明は、時間差で着信される非構造化FAX書面のある単位書面群については、待機リストにリストアップ又は保存出力機能によってフォルダ保存し、自動分類機能を用いて後から着信された非構造化FAX書面をリストアップ又はフォルダ保存された単位書面群に分類する待機書面管理機能を備えたことを特徴とする同非構造化FAX書面分類システムである。ここで、時間差で着信される先の非構造化FAX書面の発信元と後の非構造化FAX書面の発信元とは、異なる場合の他に、同一の場合も含む。
In order to achieve the above object, the first invention provides a FAX reception function for receiving an unstructured document that is not a previously structured document for OCR processing by FAX, and the received unstructured FAX document is received by a person. A classification rule setting function that sets a classification rule for classifying into units or cases, and an unstructured FAX document received by applying a classification rule set as a method for classification into people or cases An unstructured FAX document classification system comprising an automatic classification function for classification and a storage output function for storing or outputting a unit document group for each classified person unit or project unit. Here, the FAX reception function does not exclude reception of a structured document pre-structured for OCR processing or a semi-structured semi-structured document.
The second invention calculates the similarity between each page of the unstructured FAX document from the recognition result obtained by performing OCR processing on the unstructured FAX document according to the classification rule as a method for classification in the automatic classification function, This unstructured FAX document classification system is characterized in that classification is performed using a classification algorithm based on similarity.
According to a third aspect of the present invention, there is provided the unstructured FAX document classification system in which an unclassified FAX document having different incoming calls is classified into a person unit or a project unit with the automatic classification function as an object.
According to the fourth aspect of the present invention, a unit document group that is missing or missing due to a lack of a necessary unstructured FAX document is stored in a supplementary list in a folder using a list output or storage output function, and later using an automatic classification function. The unstructured FAX document classification system is provided with an incomplete / additional document management function for classifying incoming unstructured FAX documents into unit document groups that are listed or stored in a folder.
In the fifth aspect of the present invention, a unit document group having an unstructured FAX document received at a time difference is stored in a waiting list by a list or a storage output function, and is stored later by using an automatic classification function. The unstructured FAX document classification system includes a standby document management function for classifying structured FAX documents into unit document groups that are listed or stored in a folder. Here, the sender of the previous unstructured FAX document and the sender of the subsequent unstructured FAX document received at a time difference include the same case as well as different cases.

本願発明によれば、以下のような効果を有する。
(1)非構造化FAX書面であっても、分類分けのための手法に設定された分類ルールを適用することで、人間による特定を必要とせずに人単位又は案件単位に自動的に分類することができる。
(2)すなわち、非構造化FAX書面をOCRで読み取った結果(候補文字や信頼性などの属性情報も含む)に、類似度を距離として計算する手法(レーベンシュタイン距離やハミング距離など)とクラスタリング(分類)の技術(グラフ理論、最近傍探索、ニューラルネットなど)を使用することで、OCR処理した認識結果が不十分なもの(あいまいなもの)であっても、ほぼ確実に自動的に分類できる。
(3)特に、個人単位又は案件単位に分類分けをする場合、「漢字」が重要になってくるが、漢字の場合は完全一致が難しい。そこで、非構造化FAX書面の要素や住所等・契約書Noなどで類似性を確認し、所定のアルゴリズム(クラスタリング)で分類分けをすることで、自動的に分類することが可能になる。
(4)また、本願発明は、1着信にて受信される1群の非構造化FAX書面のみならず、着信(時)の異なる非構造化FAX書面の間でも分類を可能にすることで、活用の範囲が広がる。
(5)その1つに、不備書面の管理がある。不備の書面(欠落した書面)が後からFAXで送信されてきた場合に、その不備書面をすでに分類分けされている単位書面群に仕分けることで、単位書面群が完備できる。
(6)もう1つは、待機書面の管理がある。待機の書面(例えば、納期又は見積に関する書面など時間差で送信される書面)が後からFAXで送信されてきた場合に、その待機書面をすでに分類分けされている単位書面群に仕分けることで、単位書面群が完備できる。
(7)本願発明は、OCR処理した認識結果が不十分なもの(あいまいなもの)であっても、ほぼ確実に自動的に分類できることから、個人情報保護法など情報漏洩に対する懸念から、書面に記載される情報の一部を伏せ字にしているケースであっても、伏せ字を含む非構造化FAX書面について、自動的に分類できる。なお、この場合は伏せ字の無いマスターリストを有しておくことで、OCR処理した認識結果が不十分なもの(あいまいなもの)であっても、より確実に自動的に分類することができる。
The present invention has the following effects.
(1) Even if it is an unstructured FAX document, by applying the classification rules set in the classification method, it is automatically classified into human units or project units without requiring human identification. be able to.
(2) In other words, a method (Levenstein distance, Hamming distance, etc.) and clustering for calculating the similarity as a distance based on the result of reading an unstructured FAX document by OCR (including attribute information such as candidate characters and reliability) By using (classification) techniques (graph theory, nearest neighbor search, neural network, etc.), even if the recognition result of OCR processing is insufficient (fuzzy), it is almost automatically classified it can.
(3) In particular, when classifying into individual units or project units, “kanji” is important, but in the case of kanji, it is difficult to completely match. Therefore, it is possible to automatically classify by confirming the similarity based on the elements of the unstructured FAX document, the address, the contract number, etc., and classifying it with a predetermined algorithm (clustering).
(4) In addition, the present invention enables classification not only between a group of unstructured FAX documents received at one incoming call but also between unstructured FAX documents with different incoming (time), The range of utilization expands.
(5) One of them is management of incomplete documents. When an incomplete document (missed document) is sent later by FAX, the unit document group can be completed by sorting the incomplete document into unit document groups that have already been classified.
(6) The other is management of standby documents. When a waiting document (for example, a document sent with a time difference such as a document relating to a delivery date or an estimate) is sent later by FAX, the standby document is sorted into unit document groups that have already been classified. A complete set of documents.
(7) The invention of the present application can be classified automatically almost certainly even if the recognition result obtained by OCR processing is insufficient (ambiguous). Even in the case where a part of the information to be written is hidden characters, an unstructured FAX document including the hidden characters can be automatically classified. In this case, by having a master list with no hidden characters, even if the recognition result obtained by the OCR process is insufficient (obvious), it can be automatically and reliably classified.

本願発明のシステム概念図(1)。The system conceptual diagram (1) of this invention. 本願発明のシステム概念図(2)。The system conceptual diagram (2) of this invention. 本願発明の使用例(1)Example of use of the present invention (1) 本願発明の使用例(2)Example of use of the present invention (2) 本願発明の使用例(3)Example of use of the present invention (3) 本願発明の使用例(4)Example of use of the present invention (4)

本願発明の実施形態を図面に基づいて説明する。
図1及び図2は、本願発明の非構造化FAX書面分類システムの概念図を図示したものである。
図1では、「自動分類機能」と「分類ルール」を中心に図示している。
まず、「自動分類処理」は、FAX受信機能によって受信された非構造化FAX書面をOCRで読み取った認識結果に基づいて、各ページごとにその類似性を算出しながら、分類手法を用いて人単位又は案件単位で分類分けをする。ここで、類似性の算出にはページ間の類似性を距離として計算を行い定量化するとともに、分類手法として所定のアルゴリズムを使用して分類する。
Embodiments of the present invention will be described with reference to the drawings.
1 and 2 are conceptual diagrams of an unstructured FAX document classification system according to the present invention.
In FIG. 1, “automatic classification function” and “classification rule” are mainly illustrated.
First, “automatic classification processing” is based on the recognition result obtained by reading an unstructured FAX document received by the FAX reception function using OCR, and calculates the similarity for each page, and uses a classification method. Classify by unit or project. Here, the similarity is calculated by quantifying the similarity between pages as a distance, and classification is performed using a predetermined algorithm as a classification method.

次に、「自動分類機能」を作動するために、その前提として、受信した非構造化FAX書面を人単位又は案件単位に分類するための「分類ルール」を設定する(分類ルール設定機能)。
分類ルールとは、例えば、識別情報の定義(分類する書面の目的に応じて、識別情報を定義)などがある。具体的には、項目名であれば、「氏名」「生年月日」「住所」「件名」「契約番号」などの文字列を設定し、これらの文字列の後に続く文字列を値として取得する。また、同義語辞書を備えていて、氏名は(おなまえ、ご芳名、姓名)などの文字列に、住所であれば(おところ、登録住所、お届け先)などの文字列にもマッチさせることができる。
値の形式を指定することができ、生年月日であれば、9999年99月99日、9999/99/99などの値の形式(上記の9の部分は数字を表している)、契約番号であれば、AAA-99999999のような形式(アルファベット3文字にハイフンと数字が8桁が続く)で指定をおこなう。また、値の形式が一致していれば、項目名が省略されていても値を取得することができる。
また、証明書や領収書などの添付書類で、定義した項目名を含まない場合には、直前の項目名を含むページと一体のものとみなし、同じグループに分類してもよい。
さらに、発信元からFAXにより受信した発信元属性データ(TSIコード又はFAX番号等)を分類ルールに組み込んでもよい。
Next, in order to operate the “automatic classification function”, a “classification rule” for classifying the received unstructured FAX document into a person unit or a project unit is set as a premise (classification rule setting function).
The classification rule includes, for example, definition of identification information (identification information is defined according to the purpose of the document to be classified). Specifically, if it is an item name, a character string such as “name”, “date of birth”, “address”, “subject”, and “contract number” is set, and the character string following these character strings is acquired as a value. To do. It also has a synonym dictionary, where the name is matched to a character string such as (name, good name, surname), and if it is an address (such as a registered address, delivery address), etc. Can do.
The value format can be specified, and if it is a date of birth, the value format such as 9999/99/99/9999/99/99 (where 9 is a number), contract number If so, specify it in a format like AAA-99999999 (three letters of the alphabet followed by a hyphen and eight digits). If the value formats match, the value can be acquired even if the item name is omitted.
In addition, when an attached document such as a certificate or a receipt does not include a defined item name, it may be regarded as an integral part of the page including the immediately preceding item name and classified into the same group.
Further, sender attribute data (such as TSI code or FAX number) received by FAX from the sender may be incorporated into the classification rule.

なお、「自動分類機能」を補足するために、「分類修正処理」を備えても良い。「分類修正処理」とは、自動分類機能によって分類分けされた単位書面群の分類分けを修正するものである。図示省略するが、自動分類機能によって「その他」に分類されていた非構造化FAX書面を、この分類修正機能によって単位書面群に分類させる。これによって、分類分けが確実なものとなる。
また、自動的に分類されたFAX書面を、人単位又は案件単位ごとの単位書面群で表示するFAX書面表示機能を備えることで、視覚的に表示し、確認と修正を効率よく実施できるように定められた入力手順に従って処理することで、FAX書面の分類の確実性を確保することができるユーザインタフェースを備えてもよい。
In order to supplement the “automatic classification function”, a “classification correction process” may be provided. The “classification correction process” is to correct the classification of unit document groups classified by the automatic classification function. Although not shown, an unstructured FAX document that has been classified as “others” by the automatic classification function is classified into a unit document group by this classification correction function. This ensures the classification.
In addition, by providing a FAX document display function that displays automatically classified FAX documents in unit document groups for each person or project unit, it is possible to visually display and efficiently perform confirmation and correction. You may provide the user interface which can ensure the reliability of the classification | category of a FAX document by processing according to the defined input procedure.

図2では、時間差分類を可能とする「時間差自動分類機能」を中心に図示している。
申込日に単位書面群Aは必要な書面が全て揃い完備している。一方、単位書面群BではB2の書面が足りない。申込日からN日後にB2の書面を受信した場合、時間差自動分類機能によって、B2を単位書面群Bに分類分けし、単位書面群Bは完備することになる。
FIG. 2 mainly illustrates the “time difference automatic classification function” that enables time difference classification.
On the application date, the unit document group A has all the necessary documents. On the other hand, in the unit document group B, the document of B2 is insufficient. When the document of B2 is received N days after the application date, B2 is classified into unit document group B by the time difference automatic classification function, and unit document group B is completed.

図3〜図6は、本願発明の非構造化FAX書面分類システムの使用例を紹介する。
まず、図3及び図4は、1着信に複数人又は複数案件の非構造化FAX書面が混在している場合の人単位又は案件単位のあいまい分類を例示している。
図3は、介護のサービス提供票の月次処理受付のケースを想定したものである。ケアマネージャーが抱える複数の介護サービス利用者(以下「利用者」)のサービス提供票と別表が対になってFAX送信される。受信したFAX書面の被保険者番号又は被保険者名で利用者単位(人単位)の束にする。なお、近年、個人情報保護の観点から被保険者名・被保険者番号の一部が伏せ字でマスクされるケースが見受けられるが、そのようなケースであっても自動的に分類できる。なお、この場合、伏せ字の無い被保険者マスターリストを有しておくことで、OCR処理した認識結果が不十分なもの(あいまいなもの)であっても、より確実に自動的に分類することができる。
3 to 6 introduce examples of using the unstructured FAX document classification system of the present invention.
First, FIG. 3 and FIG. 4 exemplify ambiguous classification of a person unit or a case unit when a plurality of persons or unstructured FAX documents of a plurality of cases are mixed in one incoming call.
FIG. 3 assumes a case of receiving monthly processing of a care service offer slip. The service provision slips and separate tables of a plurality of care service users (hereinafter referred to as “users”) held by the care manager are paired and transmitted by FAX. It is made a bundle of user units (person unit) by the insured person number or insured person name of the received FAX document. In recent years, there have been cases where part of the insured person name and insured person number is masked with hidden characters from the viewpoint of personal information protection. Even such cases can be automatically classified. In this case, by having an insured master list without obfuscation, even if the recognition result obtained by OCR processing is insufficient (fuzzy), it is more automatically classified. Can do.

図4は、弁護士事務所の過払い案件支払い実績問い合わせの回答受信のケースを想定したものである(送信元:問い合わせ金融機関、受信元:弁護士事務所)。日々発生する過払い請求案件処理のため、各金融機関に支払い実績の問い合わせを行い、返信をもらう。金融機関からは、複数人の実績が1着信で返信されることが多い。個人情報授受の目的から、着信したら、案件数・枚数が正しく到着しているか相互に確認の必要があり、直ぐに仕分け(人単位の授受枚数)の必要がある。   FIG. 4 assumes a case of receiving a response to an overpaid case payment result inquiry of a lawyer office (transmission source: inquiry financial institution, reception source: lawyer office). In order to process daily overpaid claims, we ask each financial institution for payment results and get a reply. In many cases, financial institutions return the results of a plurality of people in one incoming call. For the purpose of sending and receiving personal information, when a call is received, it is necessary to mutually confirm whether the number and number of cases have arrived correctly, and it is necessary to immediately sort (number of pieces transferred per person).

次に、図5及び図6は、着信の異なる非構造化FAX書面を補完リスト又は保存フォルダと照合して仕分けするケースを例示している。
図5(不備・追加書面管理機能)は、生保・損保の事故通報や支払い請求の際の不備書類の同一発信元から追加送信のケースを想定したものである(発信元:保険代理店、受信元:保険会社)。生保・損保で支払い請求をする場合、請求事由を証明するために、各種添付書類を送付する。しかし、証明書類が一時に揃わず不備となり、追加の証明書類の送信を依頼するケースが多い。保険会社には近年、支払い処理を遅滞なく行うよう要求が強く、書類受付の効率化、不備確認のスピード化が必須となっている。そこで、不備待ちフォルダにフォルダ保存された単位書面群(Group01)に追加受信した非構造化FAX書面(文書名:診断書)を分類することで、自動的に単位書面群(Group01)が完備される。
Next, FIGS. 5 and 6 exemplify a case where unstructured FAX documents with different incoming calls are sorted by collating with a complementary list or a storage folder.
Figure 5 (Defective / Additional Document Management Function) assumes the case of additional transmission from the same sender of defective documents at the time of a life insurance / non-life insurance accident notification or payment request (sender: insurance agent, reception) Original: insurance company). When requesting payment with life insurance / non-life insurance, various attached documents will be sent to prove the reason for the claim. However, there are many cases in which certificates are not prepared at a time and are incomplete, and requests for transmission of additional certificates are requested. In recent years, insurance companies have been strongly required to process payments without delay, and it has become essential to improve the efficiency of document reception and speed of confirmation of defects. Therefore, by classifying the unstructured FAX document (document name: medical certificate) additionally received into the unit document group (Group01) stored in the folder waiting for deficiency, the unit document group (Group01) is automatically completed. The

図6(待機書面管理機能)は、メーカーからの納期回答を、エンドユーザからの注文書に紐付ける異なる発信元からの時間差送信のケースを想定したものである(待機書面の発信元:エンドユーザ、回答書面の発信元:メーカー、受信元:卸会社)。当該ケースでは、エンドユーザからの注文書の処理後、メーカーに発注処理をする。メーカーからの納期回答を待って、エンドユーザへの納期回答を行う。そのために、発信(返信)されたメーカーからの納期回答を待機リスト(回答待ちリスト)にリストアップ(待機)中の注文書の該当案件に紐付ける。なお、当該ケースでは受信する非構造化FAX書面の発信元が異なるが、この待機書面管理機能は発信元が同一であるケースでも適用できるものである。   FIG. 6 (standby document management function) assumes a case in which a time difference transmission from a different sender that links a delivery date reply from a manufacturer to an order form from an end user (sender of standby document: end user) Response sender: manufacturer, receiver: wholesale company). In this case, after processing the order form from the end user, the order is processed with the manufacturer. Wait for the delivery date response from the manufacturer, and send the delivery date to the end user. For this purpose, the delivery date reply from the manufacturer that is sent (replyed) is linked to the corresponding item in the order form that is listed (standby) in the waiting list (answer waiting list). In this case, the sender of the received unstructured FAX document is different, but this standby document management function can also be applied to the case where the sender is the same.

本願発明は、FAXを使用した業務に幅広く利用できるものである。
例えば、以下のような用途に利用できる。
(1)介護
・サービス提供表
・サービス提供表(別表)
(2)損害保険(他社からの乗換え)
・自動車保険の申し込み書
・現在加入している保険の保険証券
・車検証
・運転免許証
(3)過払い金請求
・過払い金返還請求書
・取引履歴
(4)会社へのマイナンバー関連書類の提出
・マイナンバー登録申込書(表紙)
・通知カード(マイナンバーが記載)
・運転免許証(本人確認書類)
The present invention can be widely used in business using FAX.
For example, it can be used for the following purposes.
(1) Nursing care-Service provision table-Service provision table (separate table)
(2) Non-life insurance (transfer from other companies)
・ Auto insurance application form ・ Current insurance insurance policy ・ Car verification ・ Driver's license (3) Overpayment claim ・ Overpayment return invoice ・ Transaction history (4) Submission of My Number related documents to the company・ My number registration application (cover)
・ Notification card (My number is listed)
・ Driver's license (identification document)

また、個人情報保護法など情報漏洩に対する懸念から、書面に記載される情報の一部を伏せ字(例えば、■や*)にしているケースも多いが、こうした伏せ字を含む非構造化FAX書面について、本願発明は有効に活用できる。   In addition, due to concerns about information leakage, such as the Personal Information Protection Law, there are many cases where some of the information written in the document is hidden characters (for example, ■ or *), but for unstructured FAX documents that contain such hidden characters, The present invention can be effectively utilized.

Claims (5)

OCR処理するように予め構造化された書面ではない非構造化書面をFAXで受信するFAX受信機能と、
受信した非構造化FAX書面を人単位又は案件単位に分類するための分類ルールを設定する分類ルール設定機能と、
分類分けのための手法に設定された分類ルールを適用して受信した非構造化FAX書面を人単位又は案件単位に分類する自動分類機能と、
分類した人単位又は案件単位ごとの単位書面群を保存又は出力する保存出力機能と、
を備えたことを特徴とする非構造化FAX書面分類システム。
A FAX receiving function for receiving an unstructured document that is not a pre-structured document for OCR processing by FAX;
A classification rule setting function for setting a classification rule for classifying the received unstructured FAX document into a person unit or a project unit;
An automatic classification function that classifies unstructured FAX documents received by applying the classification rules set in the method for classification into human units or project units;
Save output function to save or output the unit document group for each classified person unit or project unit,
An unstructured FAX document classification system characterized by comprising:
自動分類機能における分類分けのための手法として、分類ルールに従い非構造化FAX書面をOCR処理した認識結果から非構造化FAX書面の各ページ間の類似性を算出し、その類似性から分類分けのアルゴリズムを使用して分類分けするものであることを特徴とする請求項1記載の非構造化FAX書面分類システム。   As a method for classification in the automatic classification function, the similarity between each page of the unstructured FAX document is calculated from the recognition result obtained by performing OCR processing on the unstructured FAX document in accordance with the classification rule, and the classification is determined from the similarity. 2. The unstructured FAX document classification system according to claim 1, wherein classification is performed using an algorithm. 自動分類機能が着信の異なる非構造化FAX書面もその対象にして人単位又は案件単位に分類することを特徴とする請求項1又は2記載の非構造化FAX書面分類システム。   3. The unstructured FAX document classification system according to claim 1 or 2, wherein the unclassified FAX document having different incoming calls is classified into a person unit or a project unit by the automatic classification function. 必要な非構造化FAX書面が欠落して不備・追加のある単位書面群については、補完リストにリストアップ又は保存出力機能によってフォルダ保存し、自動分類機能を用いて後から着信された非構造化FAX書面をリストアップ又はフォルダ保存された単位書面群に分類する不備・追加書面管理機能を備えたことを特徴とする請求項3記載の非構造化FAX書面分類システム。   For undocumented unit documents with missing / unstructured FAX documents that are missing, add them to the supplement list, save them in a folder using the list output or save output function, and use the automatic classification function to receive unstructured data later 4. The unstructured FAX document classification system according to claim 3, further comprising an incomplete / additional document management function for classifying FAX documents into unit document groups that are listed or stored in a folder. 時間差で着信される非構造化FAX書面のある単位書面群については、待機リストにリストアップ又は保存出力機能によってフォルダ保存し、自動分類機能を用いて後から着信された非構造化FAX書面をリストアップ又はフォルダ保存された単位書面群に分類する待機書面管理機能を備えたことを特徴とする請求項3記載の非構造化FAX書面分類システム。   For unit document groups with unstructured FAX documents that are received with a time difference, list them in the waiting list using the list or save output function, and list the unstructured FAX documents that are received later using the automatic classification function 4. The unstructured FAX document classification system according to claim 3, further comprising a standby document management function for classifying into unit document groups stored up or in folders.
JP2017109725A 2017-06-02 2017-06-02 Non-structured fax document classification system Pending JP2018207270A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017109725A JP2018207270A (en) 2017-06-02 2017-06-02 Non-structured fax document classification system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017109725A JP2018207270A (en) 2017-06-02 2017-06-02 Non-structured fax document classification system

Publications (1)

Publication Number Publication Date
JP2018207270A true JP2018207270A (en) 2018-12-27

Family

ID=64958338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017109725A Pending JP2018207270A (en) 2017-06-02 2017-06-02 Non-structured fax document classification system

Country Status (1)

Country Link
JP (1) JP2018207270A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399487A (en) * 2019-07-01 2019-11-01 广州多益网络股份有限公司 A kind of file classification method, device, electronic equipment and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399487A (en) * 2019-07-01 2019-11-01 广州多益网络股份有限公司 A kind of file classification method, device, electronic equipment and storage medium
CN110399487B (en) * 2019-07-01 2021-09-28 广州多益网络股份有限公司 Text classification method and device, electronic equipment and storage medium

Similar Documents

Publication Publication Date Title
US11663654B2 (en) System and method for processing transaction records for users
US9639900B2 (en) Systems and methods for tax data capture and use
US11720615B2 (en) Self-executing protocol generation from natural language text
US7369701B2 (en) Automated docketing system
US9311627B1 (en) Mail processing and delivery within a controlled-environment facility
US20090265385A1 (en) Insurance document imaging and processing system
US20090030754A1 (en) Methods, systems and computer software utilizing xbrl to identify, capture, array, manage, transmit and display documents and data in litigation preparation, trial and regulatory filings and regulatory compliance
EA034354B1 (en) System and method for document information authenticity verification
US9742935B1 (en) Mail processing and delivery within a controlled-environment facility
CN110322317B (en) Transaction data processing method and device, electronic equipment and medium
WO2020141890A1 (en) Method and apparatus for document management
US10579653B2 (en) Apparatus, method, and computer-readable medium for recognition of a digital document
JP2018207270A (en) Non-structured fax document classification system
CN113610506B (en) Method, device, equipment and storage medium for managing labor allocation service
Baker et al. Terminology should accurately reflect complexities of sexual orientation and identity
US8234237B2 (en) System and method for automatic return letter generation
CN113779998A (en) Structured processing method, device and equipment of service information and storage medium
US10515341B2 (en) Computer communication network for routing communications based on identified information clusters
US20140115018A1 (en) Document Tracking and Management System and Methods
KR20200142186A (en) System for providing work brokerage service for mandator and trustee
US12026173B1 (en) System and method for extraction management
US20240143642A1 (en) Document Matching Using Machine Learning
US12008138B1 (en) Method for maintaining privacy and security of data
US11710328B2 (en) Systems and methods for identifying a presence of a completed document
US20240185039A1 (en) System and method for machine learning-based identification of a condition defined in a rules-based system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200601