JP2022097034A - Examination support system and examination support method - Google Patents

Examination support system and examination support method Download PDF

Info

Publication number
JP2022097034A
JP2022097034A JP2020210382A JP2020210382A JP2022097034A JP 2022097034 A JP2022097034 A JP 2022097034A JP 2020210382 A JP2020210382 A JP 2020210382A JP 2020210382 A JP2020210382 A JP 2020210382A JP 2022097034 A JP2022097034 A JP 2022097034A
Authority
JP
Japan
Prior art keywords
classification
data
examination
result
verification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020210382A
Other languages
Japanese (ja)
Other versions
JP7442430B2 (en
Inventor
明久 石田
Akihisa Ishida
竜 海老澤
Tatsu Ebisawa
啓 前澤
Kei Maezawa
誠 工藤
Makoto Kudo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020210382A priority Critical patent/JP7442430B2/en
Publication of JP2022097034A publication Critical patent/JP2022097034A/en
Application granted granted Critical
Publication of JP7442430B2 publication Critical patent/JP7442430B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To keep the accuracy of an examination continuously in association with change of rules of the examination.SOLUTION: An examination support system is configured to: examine classification data by selecting a classification model for examining classification data (application data) as an examination target; verify whether the examination is performed properly according to rules for a classification result which is an examination result; estimate a time when the rules are changed on the basis of the classification result in which it is found that the examination is wrong; update division information showing a sampling range (a division space) used when application data used to generate learning data of the classification model on the basis of the estimated time; generate learning data on the basis of application data belonging to the division space; generate a classification model for each cluster obtained by clustering the learning data for each division space; and generate a classification model of the cluster learned by learning data similar to the classification data as the examination target.SELECTED DRAWING: Figure 1

Description

本発明は、審査支援システム、及び審査支援方法に関する。 The present invention relates to an examination support system and an examination support method.

公共分野における年金の受給権判断や障害等級の判断、民間分野におけるローン可否や口座開設等、社会には様々な審査業務が存在する。しかしこうした審査業務は一般に処理件数が膨大で業務担当者に大きな負荷がかかる。そのため、審査業務の省力化や自動化への期待が高まっている。 There are various examinations in society, such as determining the right to receive a pension in the public sector, determining the disability grade, whether or not to allow a loan in the private sector, and opening an account. However, such examination work generally involves a huge number of cases and places a heavy load on the person in charge of the work. Therefore, there are increasing expectations for labor saving and automation of examination work.

審査業務を自動化する方法として、例えば、ルールベースの判別プログラムを構築する方法がある。しかし、規則が明確でない、規則が頻繁に変更される、規則が過度に複雑である等の理由で審査業務を自動化することが困難な場合も多い。そこで、データからルールを学習する手法が提案されている。 As a method of automating the examination work, for example, there is a method of constructing a rule-based discrimination program. However, it is often difficult to automate the examination work because the rules are not clear, the rules are changed frequently, and the rules are overly complicated. Therefore, a method of learning rules from data has been proposed.

例えば、特許文献1には、属人的な属性情報とは性質や観点の異なる学習要素を採用することにより審査業務を適切に支援することを目的として構成された審査支援装置について記載されている。審査支援装置は、申請案件の情報を取得し、取得した申請案件の情報を、申請者の属性情報と審査経緯の情報とを入力とし、要件不備を学習対象とした履歴を少なくとも訓練データとした機械学習の結果である判定基準に適用して要件不備の推定結果を取得し、要件不備の推定結果を申請案件の審査業務に情報提供することにより、属人的な属性情報とは性質や観点の異なる学習要素を採用する。 For example, Patent Document 1 describes an examination support device configured for the purpose of appropriately supporting examination work by adopting learning elements having different properties and viewpoints from personal attribute information. .. The examination support device acquires the information of the application matter, inputs the information of the acquired application matter into the attribute information of the applicant and the information of the examination process, and at least the history of learning the deficiency of requirements is used as training data. By applying the judgment criteria that are the result of machine learning to obtain the estimation result of the requirement deficiency and providing the information of the estimation result of the requirement deficiency to the examination work of the application case, the nature and viewpoint of the personal attribute information Adopt different learning elements.

また、例えば、特許文献2には、分類基準の時間発展を考慮して、ラベルなし学習データを用いて分類精度が維持された分類器を作成する作成装置に関して記載されている。作成装置は、過去の所定の時点までに収集された、ラベルが付与されたデータと、上記所定の時点以降に収集された、ラベルが付与されていないデータとを学習データとして用いて、各時点における分類器の分類基準を学習し、上記分類基準の時系列変化を学習し、学習された上記分類基準と時系列変化とを用いて、未来の時点を含む任意の時点の分類器の分類基準と上記分類基準の信頼性を予測する。 Further, for example, Patent Document 2 describes a creation device for creating a classifier in which classification accuracy is maintained by using unlabeled learning data in consideration of the time evolution of the classification standard. The creation device uses the labeled data collected up to the predetermined time point in the past and the unlabeled data collected after the predetermined time point as training data at each time point. By learning the classification criteria of the classifier in, learning the time series change of the above classification criteria, and using the learned above classification criteria and the time series change, the classification criteria of the classifier at any time point including the future time point. And predict the reliability of the above classification criteria.

特開2020-004161号公報Japanese Unexamined Patent Publication No. 2020-004161 特開2019-200618号公報Japanese Unexamined Patent Publication No. 2019-900186

特許文献1では、過去の審査結果を用いて要件不備の基準を学習し、その結果を基に要件不備の推定を行っている。しかし同文献では、審査の基準や項目がある時点で変更された場合やある時点で新たな基準や項目が加わった場合等、基準や項目の不連続な変化に対して審査の精度を維持する技術については記載されていない。 In Patent Document 1, the criteria for deficiencies in requirements are learned using the results of past examinations, and the deficiencies in requirements are estimated based on the results. However, the document maintains the accuracy of the examination against discontinuous changes in the examination criteria and items, such as when the examination criteria and items are changed at some point or when new criteria and items are added at some point. No technology is mentioned.

特許文献2では、過去の所定の時点までに収集された、ラベルが付与されたデータと、過去の所定の時点以降に収集された、ラベルが付与されていないデータとを学習データとして用いて、各時点における分類器の分類基準を学習し、上記分類基準の時系列変化を学習し、学習された上記分類基準と時系列変化とを用いて、未来の時点を含む任意の時点の分類器の分類基準と上記分類基準の信頼性を予測する。しかし、同文献に記載の技術は、
入力の傾向や規則の変化が時系列的に連続していることを前提として構成されており、法令や組織の内部ルールの変更といった外部要因により、審査における基準や規則が不連続に変化する場合には対応することができない。
In Patent Document 2, labeled data collected up to a predetermined time point in the past and unlabeled data collected after a predetermined time point in the past are used as learning data. Learn the classification criteria of the classifier at each time point, learn the time-series changes in the classification criteria, and use the learned classification criteria and time-series changes to classify the classifier at any time point, including future time points. Predict the reliability of the classification criteria and the above classification criteria. However, the techniques described in this document are:
It is constructed on the premise that changes in input trends and rules are continuous in chronological order, and when external factors such as changes in laws and regulations or internal rules of an organization cause discontinuous changes in standards and rules in examination. Cannot be dealt with.

本発明は、このような課題を解決すべくなされたものであり、審査における規則の変化に追随して審査の精度を継続的に維持することが可能な、審査支援システム、及び審査支援方法を提供することを目的とする。 The present invention has been made to solve such a problem, and provides an examination support system and an examination support method capable of continuously maintaining the accuracy of examination in accordance with changes in rules in examination. The purpose is to provide.

上記目的を達成するための本発明の一つは、申請書の審査を支援する審査支援システムであって、情報処理装置を用いて構成され、申請の各項目及び前記各項目の値と、審査の基準として参照される日時であるタイムスタンプと、を含むデータである申請データを記憶するデータベースから、審査の対象とする前記申請データである分類用データを取得する分類用データ取得部と、前記申請書の審査に適用される規則に従い前記申請データを正しく審査した場合の審査の結果を示すラベルを前記申請書に対応づけて記憶するラベル記憶部と、前記分類用データを審査する機械学習モデルである分類モデルを記憶するモデル記憶部と、前記分類用データの審査に用いる前記分類モデルを前記モデル記憶部から選択し、選択した前記分類モデルを用いて前記分類用データを審査する分類器と、前記審査の結果と前記分類用データとを対応づけた情報である分類結果を記憶する分類結果記憶部と、前記分類結果について、前記分類器による審査が規則に従い正しく行われているか否かの検証の結果を取得する結果検証部と、前記分類モデルの学習に用いる学習データの生成に用いる前記申請データを前記データベースから取得する際のサンプリング範囲を示す分割空間に関する情報である分割情報を記憶する分割情報記憶部と、前記検証により審査が誤っていることが判明した前記分類結果に基づき前記規則が変化した時点を推定し、推定した前記時点に基づき前記分割情報を更新する分割情報更新部と、前記申請データを前記分割空間ごとに前記データベースからサンプリングし、前記分割空間の夫々に属する前記申請データに基づき前記学習データを生成する学習データ生成部と、前記分割空間ごとに前記学習データをクラスタリングして得られるクラスタごとに前記分類モデルを生成する学習器と、を備え、前記分類器は、審査の対象となる前記分類用データに類似する前記学習データにより学習した前記クラスタの前記分類モデルを選択し、選択した前記分類モデルにより前記分類用データの審査を行う。 One of the present inventions for achieving the above object is an examination support system that supports the examination of an application form, which is configured by using an information processing apparatus, and is configured with each item of the application and the value of each item and the examination. The classification data acquisition unit that acquires the classification data that is the application data to be examined from the database that stores the application data that is the data including the time stamp that is the date and time referred to as the reference of the above. A label storage unit that stores a label indicating the result of the examination when the application data is correctly examined according to the rules applied to the examination of the application form in association with the application form, and a machine learning model that examines the classification data. A model storage unit that stores the classification model, and a classifier that selects the classification model to be used for examining the classification data from the model storage unit and examines the classification data using the selected classification model. , Whether or not the classification result storage unit that stores the classification result, which is the information corresponding to the examination result and the classification data, and the classification result are correctly examined by the classifier according to the rules. The result verification unit that acquires the verification result and the division information that is information about the division space indicating the sampling range when the application data used for generating the training data used for learning the classification model is acquired from the database are stored. A divided information storage unit and a divided information updating unit that estimates the time when the rule changes based on the classification result found to be incorrect by the verification and updates the divided information based on the estimated time. , The learning data generation unit that samples the application data from the database for each divided space and generates the training data based on the application data belonging to each of the divided spaces, and clusters the learning data for each divided space. Each cluster is provided with a learning device that generates the classification model, and the classifier uses the classification model of the cluster learned from the training data similar to the classification data to be examined. Select and examine the classification data according to the selected classification model.

その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄、及び図面により明らかにされる。 In addition, the problems disclosed in the present application and the solutions thereof will be clarified by the column of the form for carrying out the invention and the drawings.

本発明によれば、審査における基準や規則が不連続に変化しても、申請内容に対する修正の要否判断の精度を維持できる。 According to the present invention, even if the criteria and rules in the examination change discontinuously, the accuracy of determining the necessity of amendment to the application contents can be maintained.

審査支援システムの概略的な構成を示す図である。It is a figure which shows the schematic structure of the examination support system. 申請書TBLの一例である。This is an example of the application form TBL. 分類状態TBLの一例である。This is an example of the classification state TBL. モデルTBLの一例である。This is an example of model TBL. 分類結果TBLの一例である。This is an example of the classification result TBL. ラベルTBLの一例である。This is an example of the label TBL. 分類情報TBLの一例である。This is an example of classification information TBL. 審査支援システム等を構成する情報処理装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware composition of the information processing apparatus which constitutes the examination support system and the like. 分類処理を説明するフローチャートである。It is a flowchart explaining the classification process. 学習処理を説明するフローチャートである。It is a flowchart explaining a learning process. 検証処理を説明するフローチャートである。It is a flowchart explaining the verification process. 分割情報更新処理を説明するフローチャートである。It is a flowchart explaining the division information update process. 結果検証画面の一例である。This is an example of the result verification screen. 個別結果検証画面の一例である。This is an example of the individual result verification screen. 審査支援システムの構成例である。This is a configuration example of the examination support system.

以下、図面を参照しつつ、本発明の実施形態について説明する。以下の記載及び図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略や簡略化がなされている。本発明は、他の種々の形態でも実施することが可能である。とくに限定しない限り、各構成要素は単数でも複数でも構わない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The following description and drawings are examples for explaining the present invention, and are appropriately omitted or simplified for the sake of clarification of the description. The present invention can also be implemented in various other forms. Unless otherwise specified, each component may be singular or plural.

以下の説明において、同一の又は類似する構成に同一の符号を付して重複した説明を省略することがある。また、以下の説明では、「情報」、「テーブル」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。また、識別情報の表現として、「識別情報」、「識別子」、「名」、「ID」、「番号」等の表現があるが、これらについてはお互いに置換が可能である。また、以下の説明において、「データベース」のことを「DB」と、「テーブル」のことを「TBL」と、夫々表記することがある。 In the following description, the same or similar configurations may be designated by the same reference numerals and duplicated description may be omitted. Further, in the following description, various information may be described by expressions such as "information" and "table", but various information may be expressed by a data structure other than these. Further, as expressions of identification information, there are expressions such as "identification information", "identifier", "name", "ID", and "number", which can be replaced with each other. Further, in the following description, the "database" may be referred to as "DB" and the "table" may be referred to as "TBL".

図1に、一実施形態として説明する情報処理システム(以下、「審査支援システム1」と称する。)の概略的な構成(機能ブロック図)を示している。例えば、公共分野に置ける年金の受給権や障害の等級判断、民間分野に置けるローン可否や口座開設等の審査においては、審査の担当者により、申請者が作成した申請書の内容(例えば、申請者の氏名、住所、性別、年齢、職務、学歴、経歴、過去実績、障害の度合い、借り入れ実績、返済実績等)の内容が所定の規則(審査の基準や規定等)を満たしているか否かの判断が行われる。審査支援システム1は、こうした従来、人手により行われていた業務を支援し、担当者の負荷軽減や運用コストの低減を図る。 FIG. 1 shows a schematic configuration (functional block diagram) of an information processing system (hereinafter, referred to as “examination support system 1”) described as an embodiment. For example, in the examination of pension entitlement and disability grade judgment in the public sector, loan availability in the private sector, account opening, etc., the content of the application form prepared by the applicant by the person in charge of examination (for example, application). Whether or not the contents of the person's name, address, gender, age, job, educational background, career, past record, degree of disability, borrowing record, repayment record, etc. meet the prescribed rules (examination criteria and regulations) Judgment is made. The examination support system 1 supports such work that has been performed manually in the past, and aims to reduce the load on the person in charge and the operation cost.

審査支援システム1は、審査の対象となる申請書の内容を電子化したデータ(以下、「申請データ」と称する。)を管理する機能である申請書管理部200、申請データの内容が所定の規則を満たしているか否かの自動審査(以下、「分類」とも称する。)を行う審査支援装置100、及び審査支援装置100により行われた自動審査の結果を検証する機能である個別結果検証部10、を含む。審査支援装置100は、申請書管理部200及び個別結果検証部10と通信可能に接続している。これらの機能や装置は、いずれも情報処理装置(コンピュータ)を用いて実現される。 The examination support system 1 has an application form management unit 200, which is a function of managing digitized data (hereinafter referred to as "application data") of the contents of the application form to be examined, and the contents of the application data are predetermined. The examination support device 100 that automatically examines whether or not the rules are met (hereinafter, also referred to as "classification"), and the individual result verification unit that is a function to verify the result of the automatic examination performed by the examination support device 100. 10, including. The examination support device 100 is communicably connected to the application form management unit 200 and the individual result verification unit 10. All of these functions and devices are realized by using an information processing device (computer).

審査支援装置100は、上記の自動審査を、自動審査の対象となる申請データの内容(申請書の項目の構成や各項目に設定される値)に応じてクラスタリングされたクラスタごとに生成される機械学習モデル(以下、「分類モデル」と称する。)を用いて行う。また、審査支援装置100は、申請データについて行われた自動審査の結果(以下、「分類結果」と称する。)を検証し、検証の結果(以下、「検証結果」と称する。)を分類モデルの学習に用いる学習データの生成方法に反映することにより自動審査が適切に行われるようにする。より具体的には、審査支援装置100は、規則が変化して検証により自動審査の誤りが検出された場合、規則が変化した時点を推定し、分類モデルの学習に用いる学習データの生成に際して参照する情報(以下、「分割情報」と称する。)を更新する。 The examination support device 100 generates the above-mentioned automatic examination for each cluster clustered according to the contents of the application data (the composition of the items of the application form and the values set for each item) to be the target of the automatic examination. This is done using a machine learning model (hereinafter referred to as "classification model"). Further, the examination support device 100 verifies the result of the automatic examination performed on the application data (hereinafter referred to as "classification result"), and the verification result (hereinafter referred to as "verification result") is a classification model. By reflecting it in the method of generating learning data used for learning, automatic examination will be performed appropriately. More specifically, when the rule changes and an error in the automatic examination is detected by the verification, the examination support device 100 estimates the time when the rule changes and refers to it when generating training data used for learning the classification model. Information to be processed (hereinafter referred to as "divided information") is updated.

図1に示すように、審査支援装置100は、分類用データ取得部101、分類器102、学習データ取得部103、学習器104、結果検証部105、分割情報更新部106、
分類状態記憶部300、モデル記憶部400、分類結果記憶部500、ラベル記憶部600、及び分割情報記憶部700の各機能を備える。
As shown in FIG. 1, the examination support device 100 includes a classification data acquisition unit 101, a classification device 102, a learning data acquisition unit 103, a learning device 104, a result verification unit 105, and a division information update unit 106.
Each function includes a classification state storage unit 300, a model storage unit 400, a classification result storage unit 500, a label storage unit 600, and a division information storage unit 700.

分類用データ取得部101は、申請書管理部200が管理する申請書TBL201から自動審査の対象とする申請データを取得し、取得した申請データ(以下、「分類用データ」と称する。)を分類器102に入力する。分類用データ取得部101は、申請データの取得に際し、分類状態記憶部300が管理する分類状態TBL301を参照して申請書TBL201から分類用データを選択する。 The classification data acquisition unit 101 acquires application data to be subject to automatic examination from the application form TBL201 managed by the application form management unit 200, and classifies the acquired application data (hereinafter referred to as “classification data”). Input to the device 102. When acquiring the application data, the classification data acquisition unit 101 selects the classification data from the application form TBL 201 with reference to the classification state TBL 301 managed by the classification state storage unit 300.

図2に、申請データTBL201の一例を示す。例示する申請データTBL201は、申請書ID2011、タイムスタンプ2012、及び項目群2013の各項目を有する複数のエントリ(レコード)で構成される。申請データTBL201の一つのエントリは一つの申請データ(申請書)に対応する。申請データTBL201に管理される申請データは、手入力、OCR(Optical Character Recognition)による紙媒体からの読み込み、
他の情報処理システムからのデータ転送等により、申請書管理部200に提供される。
FIG. 2 shows an example of application data TBL201. The example application data TBL201 is composed of a plurality of entries (records) having each item of the application form ID 2011, the time stamp 2012, and the item group 2013. One entry of application data TBL201 corresponds to one application data (application form). Application data The application data managed by TBL201 is manually input, read from paper media by OCR (Optical Character Recognition), and
It is provided to the application form management unit 200 by data transfer or the like from another information processing system.

上記項目のうち、申請書ID2011には、申請データの識別子(以下、「申請書ID」と称する。)が設定される。タイムスタンプ2012には、当該申請データの審査に際し基準として参照される日時(当該申請データの申請書が提出された日時や当該申請データを申請者から受信した日時等)が設定される。項目群2013は、審査の対象となる申請書の項目ごとの値(文字列、数値、enum値等)が設定される。項目群2013を構成する項目の種類や数は、申請書の種類や内容等に応じて様々である。上記項目の例をあげると、例えば、申請者の属性(氏名、生年月日、続柄、性別、各種区分等)、申請対象の種類(年金受給申請、障害等級認定の申請等)等である。 Among the above items, the application form ID 2011 is set with an identifier of application data (hereinafter, referred to as "application form ID"). In the time stamp 2012, the date and time referred to as a reference in the examination of the application data (the date and time when the application form of the application data is submitted, the date and time when the application data is received from the applicant, etc.) are set. In the item group 2013, values (character strings, numerical values, enum values, etc.) for each item of the application form to be examined are set. The types and numbers of items constituting the item group 2013 vary depending on the type and contents of the application form. Examples of the above items are, for example, the attributes of the applicant (name, date of birth, relationship, gender, various categories, etc.), the type of application target (application for receiving pension, application for disability grade certification, etc.).

図3に、分類状態TBL301の一例を示す。分類状態TBL301には、各申請データの分類状態(ラベル(後述)が付与されているか否か、分類器102により自動審査(分類)を実施済か否か等)を示す情報が設定される。例示する分類状態TBL301は、申請書ID3011及び分類状態3012の各項目を有する複数のエントリ(レコード)で構成される。分類状態TBL301の一つのエントリは一つの申請データ(申請書)に対応する。申請書ID3011には、申請データを特定する情報である申請書IDが設定される。分類状態3012には、当該申請データの分類状態が設定される。分類状態TBL301に管理される分類状態は、審査支援装置100の機能(分類用データ取得部101、結果検証部105、分類器102等)によって随時更新される。 FIG. 3 shows an example of the classification state TBL301. Information indicating the classification status of each application data (whether or not a label (described later) is attached, whether or not automatic examination (classification) has been performed by the classifier 102, etc.) is set in the classification status TBL301. The exemplified classification state TBL301 is composed of a plurality of entries (records) having each item of the application form ID 3011 and the classification state 3012. One entry in the classification state TBL301 corresponds to one application data (application form). The application form ID 3011 is set with the application form ID, which is information for specifying the application data. The classification state of the application data is set in the classification state 3012. The classification state managed by the classification state TBL301 is updated at any time by the functions of the examination support device 100 (classification data acquisition unit 101, result verification unit 105, classifier 102, etc.).

図1に戻り、分類器102は、分類用データ取得部101から入力される分類用データを自動審査する。分類器102は、モデル記憶部400が管理するモデルTBL401から、自動審査の対象となる分類用データに対応する分類モデルを取得し、取得した分類モデルを用いて分類用データを自動審査し、分類用データにラベルを付与したデータ(以下、「分類結果」と称する。)を生成して分類結果記憶部500に入力する。上記ラベルは、自動審査の結果を示す情報であり、本例では、申請書(分類用データ(申請データ))の修正要否を示す情報である。 Returning to FIG. 1, the classifier 102 automatically examines the classification data input from the classification data acquisition unit 101. The classifier 102 acquires a classification model corresponding to the classification data to be automatically examined from the model TBL401 managed by the model storage unit 400, automatically examines the classification data using the acquired classification model, and classifies the data. Data with a label attached to the data (hereinafter referred to as "classification result") is generated and input to the classification result storage unit 500. The above label is information indicating the result of automatic examination, and in this example, it is information indicating whether or not the application form (classification data (application data)) needs to be modified.

図4に、モデルTBL401の一例を示す。例示するモデルTBL401は、クラスタID4011、代表点4012、距離閾値4013、ラベル4014、及び対象期間4015の各項目を有する一つ以上のエントリ(レコード)で構成される。モデルTBL401の一つのエントリは一つのクラスタに対応する。尚、審査支援システム1の導入時においては、例えば、人間系によりモデルTBL401に初期値が設定される。 FIG. 4 shows an example of the model TBL401. The exemplary model TBL401 comprises one or more entries (records) having each item of cluster ID 4011, representative point 4012, distance threshold 4013, label 4014, and target period 4015. One entry in model TBL401 corresponds to one cluster. At the time of introduction of the examination support system 1, for example, an initial value is set in the model TBL401 by a human system.

上記項目のうち、クラスタID4011には、クラスタの識別子(以下、「クラスタI
D」と称する。)が設定される。代表点4012には、当該クラスタの代表点を示す情報(分類用データがいずれのクラスタに属するかの判定に際し、分類用データの項目群と対照される、クラスタの特徴を表す項目群(以下、「代表点」と称する。)を示す情報)が設定される。距離閾値4013には、分類用データがいずれのクラスタに属するかを判定する際に用いる類似度(距離)の閾値(境界値)が設定される。上記の類似度は、例えば、ユークリッド距離やマハラノビス距離である。本例では、距離閾値4013には、分類用データを構成する項目群と代表点4012との類似度について設定された閾値が設定される。ラベル4014には、自動審査の対象である分類用データが当該クラスタに該当する場合に当該分類用データに付与するラベルが設定される。対象期間4015には、当該クラスタが適用される期間(開始日時と終了日時)が設定される。上記期間は、当該分類用データがいずれのクラスタに属するかを判定する際、分類用データのタイムスタンプ(申請データのタイムスタンプ2012)と対照される。本例では、開始日時や終了日時が定まっていない場合、対象期間4015の該当欄には未定義を意味する値(以下、「null値」と称する。)が設定される。
Among the above items, the cluster ID 4011 is a cluster identifier (hereinafter, "cluster I").
Called "D". ) Is set. The representative point 4012 is an information indicating the representative point of the cluster (a group of items representing the characteristics of the cluster, which is compared with the item group of the classification data when determining which cluster the classification data belongs to (hereinafter,). Information indicating (referred to as "representative point")) is set. In the distance threshold value 4013, a threshold value (boundary value) of the similarity (distance) used when determining which cluster the classification data belongs to is set. The above similarity is, for example, the Euclidean distance or the Mahalanobis distance. In this example, the distance threshold value 4013 is set to a threshold value set for the degree of similarity between the item group constituting the classification data and the representative point 4012. Label 4014 is set with a label to be assigned to the classification data when the classification data to be automatically examined corresponds to the cluster. In the target period 4015, a period (start date and time and end date and time) to which the cluster is applied is set. The above period is compared with the time stamp of the classification data (time stamp 2012 of the application data) when determining which cluster the classification data belongs to. In this example, when the start date and time and the end date and time are not determined, a value meaning undefined (hereinafter referred to as "null value") is set in the corresponding column of the target period 4015.

図1に戻り、分類結果記憶部500は、分類器102から入力される分類結果を分類結果TBL501に管理する。また、分類結果記憶部500は、分類結果TBL501に管理している分類結果を結果検証部105に、その要求に応じて随時入力する。 Returning to FIG. 1, the classification result storage unit 500 manages the classification result input from the classifier 102 in the classification result TBL501. Further, the classification result storage unit 500 inputs the classification result managed by the classification result TBL 501 to the result verification unit 105 at any time according to the request.

図5に、分類結果TBL501の一例を示す。例示する分類結果TBL501は、申請書ID5011、ラベル5012、タイムスタンプ5013、及び項目群5014の各項目を有する一つ以上のエントリ(レコード)で構成される。分類結果TBL501の一つのエントリは一つの分類用データ(申請データ(申請書))に対応する。 FIG. 5 shows an example of the classification result TBL501. The exemplary classification result TBL501 is composed of one or more entries (records) having each item of application ID 5011, label 5012, time stamp 5013, and item group 5014. One entry of the classification result TBL501 corresponds to one classification data (application data (application form)).

上記項目のうち、ラベル5012以外の項目については図2に示した申請データTBL201の対応する名称の項目と同様であるので説明を省略する。ラベル5012には、分類器102によって当該分類用データに付与されたラベルが設定される。本例では、ラベル5012には、当該分類用データ(申請データ)が修正が必要であることを示す「修正必要」、又は当該分類用データ(申請データ)が修正不要であることを示す「修正不要」が設定される。 Of the above items, the items other than the label 5012 are the same as the items having the corresponding names of the application data TBL201 shown in FIG. 2, and thus the description thereof will be omitted. The label 5012 is set with a label assigned to the classification data by the classifier 102. In this example, the label 5012 has "correction required" indicating that the classification data (application data) needs to be corrected, or "correction" indicating that the classification data (application data) does not need to be corrected. "Not required" is set.

図1に戻り、結果検証部105は、分類結果記憶部500から入力される分類結果が規則に従い適切に審査されているか否か(自動審査が規則に従い正しく行われているか否か)を、個別結果検証部10と連携して検証する。結果検証部105は、個別結果検証部10に分類結果を入力し、個別結果検証部10から検証結果を取得する。 Returning to FIG. 1, the result verification unit 105 individually determines whether or not the classification result input from the classification result storage unit 500 is properly examined according to the rules (whether or not the automatic examination is correctly performed according to the rules). Verification is performed in cooperation with the result verification unit 10. The result verification unit 105 inputs the classification result to the individual result verification unit 10 and acquires the verification result from the individual result verification unit 10.

個別結果検証部10は、結果検証部105から入力される分類結果について、人間系が検証を行うためのユーザインタフェースを提供し、ユーザから受け付けた検証結果を結果検証部105に返す。ユーザは、例えば、規則について記載された書類や自身の経験等に基づき分類結果を検証する。尚、本例ではこのように分類結果の検証を人間系が行う構成としているが、検証のための機械学習モデルを利用する等、情報処理装置により分類結果の検証を自動的に行うようにしてもよい。 The individual result verification unit 10 provides a user interface for the human system to verify the classification result input from the result verification unit 105, and returns the verification result received from the user to the result verification unit 105. The user verifies the classification result based on, for example, a document describing the rule or his / her own experience. In this example, the classification result is verified by the human system in this way, but the classification result is automatically verified by the information processing device, such as by using a machine learning model for verification. May be good.

結果検証部105は、個別結果検証部10から返された検証結果が誤りであった場合、分割情報の更新指示を分割情報更新部106に入力する。尚、結果検証部105が、例えば、個別結果検証部10から返された検証結果が誤りとなった数や割合が予め設定された閾値を超えたことを契機として、分割情報の更新指示を分割情報更新部106に入力するようにしてもよい。 When the verification result returned from the individual result verification unit 10 is incorrect, the result verification unit 105 inputs the division information update instruction to the division information update unit 106. The result verification unit 105 divides the division information update instruction when, for example, the number or ratio of the verification results returned from the individual result verification unit 10 exceeds a preset threshold value. It may be input to the information update unit 106.

結果検証部105は、分類結果の分類用データ(申請データ)を規則に従い適切に審査し
た場合に当該分類用データ(申請データ)に付与されるラベルをラベル記憶部600に入力する。ラベル記憶部600は、結果検証部105から入力された各申請データ(申請書)のラベルをラベルTBL601に管理する。
The result verification unit 105 inputs a label attached to the classification data (application data) to the label storage unit 600 when the classification data (application data) of the classification result is appropriately examined according to the rules. The label storage unit 600 manages the label of each application data (application form) input from the result verification unit 105 on the label TBL601.

図6に、ラベルTBL601の一例を示す。同図に示すように、ラベルTBL601は、申請書ID6011及びラベル6012の各項目を有する複数のエントリ(レコード)で構成される。ラベルTBL601の一つのエントリは一つの申請データ(申請書)に対応する。 FIG. 6 shows an example of the label TBL601. As shown in the figure, the label TBL601 is composed of a plurality of entries (records) having each item of the application form ID 6011 and the label 6012. One entry on the label TBL601 corresponds to one application data (application form).

上記項目のうち、申請書ID6011には、申請書IDが設定される。ラベル6012には、図5のラベル5012と同様に、当該申請書(分類用データ(申請データ)に付与されているラベルが設定される。 Among the above items, the application form ID is set in the application form ID 6011. Similar to the label 5012 of FIG. 5, the label 6012 is set with the label attached to the application form (classification data (application data)).

図1に戻り、分割情報更新部106は、結果検証部105から分割情報の更新指示が入力されると、分割情報の更新に関する処理を行い、分割情報記憶部700が分割情報TBL701に管理する分割情報を更新する。尚、分割情報の更新に関する処理の詳細については後述する。 Returning to FIG. 1, when the result verification unit 105 inputs the division information update instruction, the division information update unit 106 performs processing related to updating the division information, and the division information storage unit 700 manages the division information TBL701. Update the information. The details of the process for updating the division information will be described later.

図7に、分割情報TBL701の一例を示す。分割情報は、学習データ取得部103が、学習データの生成元とする申請データを抽出する範囲(以下、「分割空間」と称する。)を示す情報である。分割空間は、時間的な範囲と、空間的な範囲(分類用データ(申請データ)の各項目の特徴(項目の種類や変域))とをパラメータとして定義される。 FIG. 7 shows an example of the division information TBL701. The divided information is information indicating a range (hereinafter, referred to as "divided space") in which the learning data acquisition unit 103 extracts the application data that is the generation source of the learning data. The divided space is defined with a temporal range and a spatial range (characteristics (type of item and domain) of each item of classification data (application data)) as parameters.

例示する分割情報TBL701は、分割空間ID7011及び範囲7012の各項目を有する一つ以上のエントリ(レコード)で構成される。分割情報TBL701の一つのエントリは一つの分割空間に対応する。尚、審査支援システム1の導入時においては、例えば、人間系により分割情報TBL701に初期値が設定される。 The illustrated division information TBL701 is composed of one or more entries (records) having each item of the division space ID 7011 and the range 7012. One entry of the division information TBL701 corresponds to one division space. When the examination support system 1 is introduced, for example, an initial value is set in the division information TBL701 by a human system.

分割空間ID7011には、当該分割空間の識別子(以下、「分割空間ID」と称する。)が設定される。範囲7012には、当該分割空間の範囲を示す情報が設定される。同図に示すように、範囲7012は、日時70121と項目群70122の各項目を有する。このうち日時70121には、当該分割空間の時間的な範囲を示す情報が設定される。尚、本例では、審査支援システム1の導入時において、上記範囲の開始日時として現在日時(導入時の日時)が、また、上記範囲の終了日時としてnull値が、夫々されるものとする。項目群70122には、当該分割空間の空間的な範囲を示す情報が設定される。項目群70122の各項目の意味については、申請データTBL201の項目群2013と同様であるので説明を省略する。 An identifier of the divided space (hereinafter, referred to as "divided space ID") is set in the divided space ID 7011. Information indicating the range of the divided space is set in the range 7012. As shown in the figure, the range 7012 has each item of the date and time 70121 and the item group 70122. Of these, information indicating the temporal range of the divided space is set at the date and time 70121. In this example, at the time of introduction of the examination support system 1, the current date and time (date and time at the time of introduction) is set as the start date and time of the above range, and the null value is set as the end date and time of the above range. Information indicating the spatial range of the divided space is set in the item group 70122. Since the meaning of each item of the item group 70122 is the same as that of the item group 2013 of the application data TBL201, the description thereof will be omitted.

図1に戻り、学習データ取得部103は、分類状態記憶部300の分類状態TBL301に管理されている分類状態、及び分割情報記憶部700の分割情報TBL701に管理されている分割情報を参照しつつ、分類モデルの学習データの生成に用いる申請データを申請書管理部200から取得し、取得した申請データに基づき学習データを生成し、生成した学習データを学習器104に入力する。 Returning to FIG. 1, the learning data acquisition unit 103 refers to the classification state managed by the classification state TBL301 of the classification state storage unit 300 and the division information managed by the division information TBL701 of the division information storage unit 700. , The application data used for generating the learning data of the classification model is acquired from the application form management unit 200, the learning data is generated based on the acquired application data, and the generated learning data is input to the learning device 104.

学習器104は、学習データ取得部103から入力される学習データを、学習データの内容(申請書の項目の構成や各項目に設定される値)に基づきクラスタリングし、クラスタリングにより得られた各クラスタにラベル記憶部600から取得されるラベルを付与することにより分類モデルを生成し、生成した分類モデルをモデル記憶部400に格納する。学習器104は、上記のクラスタリングを、例えば、階層型クラスタリングの手法により行う。尚、クラスタリングの手法は必ずしも限定されない。また、クラスタリングによ
り得られるクラスタの数は、学習データの性質等に応じて適切に(自動審査の精度が向上するように)設定される。
The learning device 104 clusters the learning data input from the learning data acquisition unit 103 based on the content of the learning data (the configuration of the items of the application form and the values set for each item), and each cluster obtained by the clustering. A classification model is generated by assigning a label acquired from the label storage unit 600 to the model, and the generated classification model is stored in the model storage unit 400. The learner 104 performs the above clustering by, for example, a hierarchical clustering method. The clustering method is not always limited. Further, the number of clusters obtained by clustering is appropriately set (so as to improve the accuracy of automatic examination) according to the nature of the training data and the like.

図8は、審査支援システム1、個別結果検証部10、及び申請書管理部200の実現に用いる情報処理装置のハードウェア構成の一例である。同図に示すように、例示する情報処理装置20は、プロセッサ21、主記憶装置22、通信装置23、入力装置24、出力装置25、及び補助記憶装置26を備える。 FIG. 8 is an example of the hardware configuration of the information processing apparatus used to realize the examination support system 1, the individual result verification unit 10, and the application form management unit 200. As shown in the figure, the exemplary information processing device 20 includes a processor 21, a main storage device 22, a communication device 23, an input device 24, an output device 25, and an auxiliary storage device 26.

尚、例示する情報処理装置20は、その全部又は一部が、例えば、クラウドシステムによって提供される仮想サーバのように、仮想化技術やプロセス空間分離技術等を用いて提供される仮想的な情報処理資源を用いて実現されるものであってもよい。また、情報処理装置20によって提供される機能の全部又は一部は、例えば、クラウドシステムがAPI(Application Programming Interface)等を介して提供するサービスによって実現して
もよい。また、情報処理装置20によって提供される機能の全部又は一部は、例えば、SaaS(Software as a Service)、PaaS(Platform as a Service)、IaaS(Infrastructure as a Service)等を利用して実現されるものであってもよい。
It should be noted that the information processing apparatus 20 illustrated is virtual information in which all or part of the information processing apparatus 20 is provided by using virtualization technology, process space separation technology, or the like, for example, like a virtual server provided by a cloud system. It may be realized by using processing resources. Further, all or part of the functions provided by the information processing apparatus 20 may be realized by, for example, a service provided by a cloud system via an API (Application Programming Interface) or the like. Further, all or part of the functions provided by the information processing apparatus 20 are realized by using, for example, SaaS (Software as a Service), PaaS (Platform as a Service), IaaS (Infrastructure as a Service), and the like. It may be one.

プロセッサ21は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、AI(Artificial Intelligence)チップ、FPGA(Field Programmable Gate Array)、SoC(System on Chip)、ASIC(Application Specific Integrated Circuit)等を用いて構成される。 The processor 21 is, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), a GPU (Graphics Processing Unit), an AI (Artificial Intelligence) chip, an FPGA (Field Programmable Gate Array), a SoC (System on Chip), and an ASIC. (Application Specific Integrated Circuit) etc. are used.

主記憶装置22は、プログラムやデータを記憶する装置であり、例えば、ROM(Read
Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。
The main storage device 22 is a device for storing programs and data, and is, for example, a ROM (Read).
Only Memory), RAM (Random Access Memory), non-volatile memory (NVRAM (Non Volatile RAM)) and the like.

通信装置23は、通信ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、専用線、公衆通信網等)を介して、他の情報処理装置
(スマートフォン、タブレット、ノートブック型コンピュータ、各種携帯情報端末等)との間で通信を行う装置であり、無線又は有線の通信モジュール(無線通信モジュール、通信ネットワークアダプタ、USBモジュール等)である。
The communication device 23 is a communication device (smartphone, tablet, notebook computer, etc.) via a communication network (LAN (Local Area Network), WAN (Wide Area Network), the Internet, a dedicated line, a public communication network, etc.). , Various mobile information terminals, etc.), and is a wireless or wired communication module (wireless communication module, communication network adapter, USB module, etc.).

入力装置24は、ユーザからの入力や外部の装置からのデータ入力を受け付けるユーザインタフェースであり、例えば、キーボード、マウス、タッチパネル、カードリーダ、音声入力装置(例えば、マイクロフォン)等である。 The input device 24 is a user interface that receives input from a user or data input from an external device, and is, for example, a keyboard, a mouse, a touch panel, a card reader, a voice input device (for example, a microphone), or the like.

出力装置25は、各種情報を、画像によって出力する表示装置、音声によって出力する音声出力装置、紙媒体に印刷する印刷装置等である。 The output device 25 is a display device that outputs various information as an image, an audio output device that outputs as an audio, a printing apparatus that prints on a paper medium, and the like.

補助記憶装置26は、プログラムやデータを格納する装置であり、例えば、SSD(Solid State Drive)、ハードディスクドライブ、光学式記憶媒体(CD(Compact Disc)
、DVD(Digital Versatile Disc)等)、ICカード、SDカード等である。補助記憶装置26の全部又は一部は、クラウドが提供する仮想的な記憶領域等であってもよい。補助記憶装置26には、審査支援システム1の機能を実現するためのプログラムやデータが格納されている。
The auxiliary storage device 26 is a device for storing programs and data, for example, an SSD (Solid State Drive), a hard disk drive, and an optical storage medium (CD (Compact Disc)).
, DVD (Digital Versatile Disc), etc.), IC card, SD card, etc. All or part of the auxiliary storage device 26 may be a virtual storage area or the like provided by the cloud. The auxiliary storage device 26 stores programs and data for realizing the functions of the examination support system 1.

プログラムやデータは、記録媒体の読取装置や通信装置23を介して補助記憶装置26に読み込むことができる。補助記憶装置26に格納(記憶)されているプログラムやデータは、主記憶装置22に随時読み込まれる。プロセッサ21は、補助記憶装置26に格納されているプログラムを主記憶装置22に読み出して実行することにより各種の機能を実
現する。
The program or data can be read into the auxiliary storage device 26 via the reading device of the recording medium or the communication device 23. Programs and data stored (stored) in the auxiliary storage device 26 are read into the main storage device 22 at any time. The processor 21 realizes various functions by reading the program stored in the auxiliary storage device 26 into the main storage device 22 and executing the program.

情報処理装置20には、例えば、オペレーティングシステム、ファイルシステム、DBMS(DataBase Management System)(リレーショナルデータベース、NoSQL等)、KVS(Key-Value Store)等が導入されていてもよい。分類状態記憶部300、モデル
記憶部400、分類結果記憶部500、ラベル記憶部600、及び分割情報記憶部700は、例えば、DBMSが管理するテーブルやファイルシステムが関するファイルに情報(データ)を管理する。
For example, an operating system, a file system, a DBMS (DataBase Management System) (relational database, NoSQL, etc.), a KVS (Key-Value Store), or the like may be introduced in the information processing apparatus 20. The classification state storage unit 300, the model storage unit 400, the classification result storage unit 500, the label storage unit 600, and the division information storage unit 700 manage information (data) in, for example, a table managed by the DBMS or a file related to the file system. do.

続いて、審査支援システム1が行う処理について順に説明する。 Subsequently, the processes performed by the examination support system 1 will be described in order.

図9は、審査支援装置100が、申請書管理部200から提供される申請データ(分類用データ)について自動審査(分類)を行い分類結果を生成する際に行う処理(以下、「分類処理S900」と称する。)を説明するフローチャートである。 FIG. 9 shows a process performed when the examination support device 100 automatically examines (classifies) application data (classification data) provided by the application form management unit 200 and generates a classification result (hereinafter, “classification process S900”). It is a flowchart explaining).

まず、分類用データ取得部101が、分類状態TBL301を参照しつつ申請書管理部200から分類対象とする申請データ(例えば、ラベルが付与されていない申請データ)を取得し(S911)、取得した申請データを分類用データとして分類器102に入力する(S912)。 First, the classification data acquisition unit 101 acquires application data to be classified (for example, application data without a label) from the application management unit 200 while referring to the classification state TBL301 (S911), and acquires the application data. The application data is input to the classifier 102 as classification data (S912).

続いて、分類器102が、分類用データ取得部101から入力された分類用データの自動審査(分類)に用いるクラスタのモデル記憶部400からの取得を試みる(S913)。分類器102は、分類用データのタイムスタンプが対象期間4015に含まれ、分類モデルの項目群(代表点)と申請データの項目群との間の類似度(距離)が距離閾値4013以下であるクラスタを、モデル記憶部400から取得する。尚、上記距離の算出に際し、分類器102が、項目ごとに重みづけを行うようにしてもよい。 Subsequently, the classifier 102 attempts to acquire the classification data input from the classification data acquisition unit 101 from the model storage unit 400 of the cluster used for automatic examination (classification) (S913). In the classifier 102, the time stamp of the classification data is included in the target period 4015, and the similarity (distance) between the item group (representative point) of the classification model and the item group of the application data is the distance threshold 4013 or less. The cluster is acquired from the model storage unit 400. In calculating the distance, the classifier 102 may perform weighting for each item.

図9に戻り、S914では、分類器102が、クラスタを取得できたか否かを判定する。クラスタを取得できた場合(S914:YES)、分類器102は、取得したクラスタのラベルを分類用データに付与した情報を分類結果として生成する(S915)。一方、クラスタを取得できなかった場合(S914:NO)、分類器102は、クラスタを取得できなかった旨をラベルとして分類用データに付与した情報を分類結果として生成する(S916)。 Returning to FIG. 9, in S914, the classifier 102 determines whether or not the cluster can be acquired. When the cluster can be acquired (S914: YES), the classifier 102 generates the information in which the acquired cluster label is attached to the classification data as the classification result (S915). On the other hand, when the cluster could not be acquired (S914: NO), the classifier 102 generates information added to the classification data as a label indicating that the cluster could not be acquired as the classification result (S916).

S917では、分類器102は、生成した分類結果を分類結果記憶部500に入力する。 In S917, the classifier 102 inputs the generated classification result to the classification result storage unit 500.

図10は、審査支援システム1が、分類モデルを生成(学習)する際に行う処理(以下、「学習処理S1000」と称する。)を説明するフローチャートである。 FIG. 10 is a flowchart illustrating a process (hereinafter, referred to as “learning process S1000”) performed when the examination support system 1 generates (learns) a classification model.

まず、学習データ取得部103が、分割情報TBL701から分割空間7011を一つ選択し(S1011)、選択した分割空間7011の範囲7012に属するラベル付与済の申請データを申請データTBL201から取得し、取得した申請データにラベルTBL601から取得されるラベルを付与することにより学習データを生成し、生成した学習データを学習器104に入力する(S1012)。尚、学習データ取得部103は、申請データがラベルが付与済であるか否かを、分類状態TBL301を参照して判定する。 First, the learning data acquisition unit 103 selects one division space 7011 from the division information TBL701 (S1011), and acquires and acquires the labeled application data belonging to the range 7012 of the selected division space 7011 from the application data TBL201. Training data is generated by adding a label acquired from the label TBL601 to the application data, and the generated training data is input to the learner 104 (S1012). The learning data acquisition unit 103 determines whether or not the application data has been labeled with reference to the classification state TBL301.

続いて、学習器104が、学習データ取得部103から入力された学習データをクラスタリングする(S1013)。 Subsequently, the learning device 104 clusters the learning data input from the learning data acquisition unit 103 (S1013).

続いて、学習器104は、クラスタリングにより得られたクラスタを一つ選択し(S1014)、選択したクラスタに属する全ての学習データのラベルが同一か否かを判定する(S1015)。学習器104は、選択中のクラスタに属する全ての学習データのラベルが同一であると判定すると(S1015:YES)、当該ラベルを、選択中のクラスタに対応づけることにより分類モデルを生成し、生成した分類モデルをモデルTBL401に登録する(S1016)。このとき、学習器104は、代表点4012として、例えば、S1013のクラスタリングに用いた(もしくは算出した)値を設定する。また、距離閾値4013として、予め設定された値(デフォルト値)を設定する。また、学習器104は、対象期間4015の開始日時に現在日時を設定し、対象期間4015の終了日時にnull値を設定する。尚、本例では、選択中のクラスタに属する「全ての学習データのラベルが同一か否か」を判定条件としているが、判定条件は必ずしも例示するものに限定されず、例えば、選択中のクラスタに属する「所定の割合以上の 数の学習データのラベルが共通しているか否か」を判定条件としてもよい。 Subsequently, the learner 104 selects one cluster obtained by clustering (S1014), and determines whether or not the labels of all the training data belonging to the selected cluster are the same (S1015). When the learner 104 determines that the labels of all the training data belonging to the selected cluster are the same (S1015: YES), the learner 104 generates and generates a classification model by associating the label with the selected cluster. The classified model is registered in the model TBL401 (S1016). At this time, the learner 104 sets, for example, the value used (or calculated) for the clustering of S1013 as the representative point 4012. Further, a preset value (default value) is set as the distance threshold value 4013. Further, the learning device 104 sets the current date and time at the start date and time of the target period 4015, and sets the null value at the end date and time of the target period 4015. In this example, the determination condition is "whether the labels of all the training data are the same" belonging to the selected cluster, but the determination condition is not necessarily limited to the example, and for example, the selected cluster. The determination condition may be "whether or not a predetermined ratio or more of the labels of the learning data are common" belonging to.

続いて、学習器104は、S1014で全てのクラスタを選択済か否かを判定する(S1017)。S1014で全てのクラスタを選択済でなければ(S1017:NO)、処理はS1014に戻る。一方、S1014で全てのクラスタを選択済であれば(S1017:YES)、処理はS1018に進む。 Subsequently, the learner 104 determines whether or not all the clusters have been selected in S1014 (S1017). If all the clusters have not been selected in S1014 (S1017: NO), the process returns to S1014. On the other hand, if all the clusters have been selected in S1014 (S1017: YES), the process proceeds to S1018.

S1018では、学習器104は、S1011で全ての分割空間を選択済か否かを判定する。S1011で全ての分割空間を選択済でなければ(S1018:NO)、処理はS1011に戻る。一方、S1011で全ての分割空間を選択済であれば(S1018:YES)、学習処理S1000は終了する。 In S1018, the learner 104 determines whether or not all the divided spaces have been selected in S1011. If all the divided spaces have not been selected in S1011 (S1018: NO), the process returns to S1011. On the other hand, if all the divided spaces have been selected in S1011 (S1018: YES), the learning process S1000 ends.

図11は、審査支援システム1が、分類結果を検証する際に行う処理(以下、「検証処理S1100」と称する。)を説明するフローチャートである。 FIG. 11 is a flowchart illustrating a process (hereinafter, referred to as “verification process S1100”) performed by the examination support system 1 when verifying the classification result.

まず、結果検証部105が、分割情報TBL701から分割空間を一つ選択する(S1111)。 First, the result verification unit 105 selects one division space from the division information TBL701 (S1111).

続いて、結果検証部105は、選択中の分割空間の範囲に属するクラスタをモデルTBL401から一つ選択する(S1112)。 Subsequently, the result verification unit 105 selects one cluster belonging to the range of the divided space being selected from the model TBL401 (S1112).

続いて、結果検証部105は、選択中のクラスタに属する、タイムスタンプ5013が最終検証日時と現在日時との間である分類結果を分類結果TBL501から一つ取得する(S1113)。尚、最終検証日時とは、検証処理S1100が実行された直近の日時であり、結果検証部105によって管理(記憶)される情報である。 Subsequently, the result verification unit 105 acquires one classification result from the classification result TBL501, which belongs to the selected cluster and whose time stamp 5013 is between the final verification date and time and the current date and time (S1113). The final verification date and time is the latest date and time when the verification process S1100 is executed, and is information managed (stored) by the result verification unit 105.

続いて、結果検証部105は、取得した分類結果を個別結果検証部10と連携して検証する(S1114)。 Subsequently, the result verification unit 105 verifies the acquired classification result in cooperation with the individual result verification unit 10 (S1114).

続いて、結果検証部105は、検証結果を判定する(S1115)。検証結果が分類結果が正しいことを示す場合(S1115:NO)、結果検証部105は、S1118からの処理を実行する。一方、検証結果が分類結果が誤りであることを示す場合(S1115:YES)、結果検証部105は、分割情報更新部106と連携し、分割情報を更新する処理(以下、「分割情報更新処理S1116」と称する。)を実行する。その後、処理はS1117に進む。分割情報更新処理S1116の詳細については後述する。 Subsequently, the result verification unit 105 determines the verification result (S1115). When the verification result indicates that the classification result is correct (S1115: NO), the result verification unit 105 executes the process from S1118. On the other hand, when the verification result indicates that the classification result is incorrect (S1115: YES), the result verification unit 105 cooperates with the division information update unit 106 to update the division information (hereinafter, “division information update processing”). S1116 ") is executed. After that, the process proceeds to S1117. The details of the division information update process S1116 will be described later.

S1117では、結果検証部105は、分割情報更新処理S1116の結果に基づき、分類結果TBL501及びラベルTBL601を更新する。その後、処理はS1118に
進む。
In S1117, the result verification unit 105 updates the classification result TBL501 and the label TBL601 based on the result of the division information update process S1116. After that, the process proceeds to S1118.

S1118では、結果検証部105は、S1112で全てのクラスタを選択済か否かを判定する。全てのクラスタを選択済でなければ(S1118:NO)、処理はS1112に戻る。一方、S1112で全てのクラスタを選択済であれば(S1118:YES)、処理はS1119に進む。 In S1118, the result verification unit 105 determines whether or not all the clusters have been selected in S1112. If all the clusters have not been selected (S1118: NO), the process returns to S1112. On the other hand, if all the clusters have been selected in S1112 (S1118: YES), the process proceeds to S1119.

S1019では、結果検証部105は、S1111で全ての分割空間を選択済か否かを判定する。全ての分割空間を選択済でなければ(S1119:NO)、処理はS1111に戻る。一方、S1111で全ての分割空間を選択済であれば(S1119:YES)、検証処理S1100は終了する。 In S1019, the result verification unit 105 determines whether or not all the divided spaces have been selected in S1111. If all the divided spaces have not been selected (S1119: NO), the process returns to S1111. On the other hand, if all the divided spaces have been selected in S1111 (S1119: YES), the verification process S1100 ends.

図12は、図11に示した分割情報更新処理S1116の詳細を説明するフローチャートである。 FIG. 12 is a flowchart illustrating the details of the division information update process S1116 shown in FIG.

まず、結果検証部105は、S1114の検証で誤りと判定された分類結果(以下、「誤った分類結果」と称する。)のタイムスタンプと最終検証日時との差が予め設定されている所定値よりも大きいか否かを判定する(S1211)。結果検証部105が、上記差が所定値よりも大きいと判定した場合(S1211:YES)、処理はS1212に進む。一方、結果検証部105が、上記差が所定値以下であると判定した場合(S1211:NO)、処理はS1217に進む。 First, the result verification unit 105 sets a predetermined difference between the time stamp of the classification result determined to be an error in the verification of S1114 (hereinafter referred to as “wrong classification result”) and the final verification date and time. It is determined whether or not it is larger than (S1211). When the result verification unit 105 determines that the difference is larger than the predetermined value (S1211: YES), the process proceeds to S1212. On the other hand, when the result verification unit 105 determines that the difference is equal to or less than a predetermined value (S1211: NO), the process proceeds to S1217.

S1212~S1216の処理は、上記差が所定値以下となるまで(タイムスタンプと最終検証日時との時間差が十分に小さくなるまで)繰り返し実行されるループ処理である。まず、S1212では、結果検証部105が、誤った分類結果のタイムスタンプと最終検証日時の中間の日時であり、かつ、誤った分類結果との間の類似度が最大の未検証の分類結果を分類結果TBL501から新たに取得する。以下、新たに取得した分類結果のことを「類似分類結果」と称する。 The processing of S1212 to S1216 is a loop processing that is repeatedly executed until the above difference becomes equal to or less than a predetermined value (until the time difference between the time stamp and the final verification date and time becomes sufficiently small). First, in S1212, the result verification unit 105 determines the unverified classification result that is between the time stamp of the erroneous classification result and the final verification date and time and has the maximum similarity between the erroneous classification result. It is newly obtained from the classification result TBL501. Hereinafter, the newly acquired classification result will be referred to as "similar classification result".

続いて、結果検証部105は、個別結果検証部10と連携して類似分類結果を検証する(S1213)。 Subsequently, the result verification unit 105 verifies the similar classification result in cooperation with the individual result verification unit 10 (S1213).

続いて、結果検証部105は、検証結果を判定する(S1214)。検証結果が分類結果が正しいことを示す場合(S1214:NO)、結果検証部105は、最終検証日時を類似分類結果のタイムスタンプに更新する(S1215)。その後、処理はS1211に戻る。一方、検証の結果が誤りであることを示す場合(S1214:YES)、結果検証部105は、誤った分類結果を類似分類結果に設定し直す(処理の対象とする「誤った分類結果」を類似分類結果にすり替える)(S1216)。その後、処理はS1211に戻る。このように検証結果が誤りである場合に、誤った分類結果を類似分類結果に設定し直してS1211からのループ処理を繰り返し実行することで、検証結果が誤りとなった時点、つまり、規則が変化した時点を推定することができる。尚、上記のループ処理は、過去方向への時間的な二分探索により規則が変化した時点を探索していることに相当する)。 Subsequently, the result verification unit 105 determines the verification result (S1214). When the verification result indicates that the classification result is correct (S1214: NO), the result verification unit 105 updates the final verification date and time with the time stamp of the similar classification result (S1215). After that, the process returns to S1211. On the other hand, when it indicates that the verification result is erroneous (S1214: YES), the result verification unit 105 resets the erroneous classification result to the similar classification result (the "wrong classification result" to be processed is set. Substitute with similar classification results) (S1216). After that, the process returns to S1211. When the verification result is erroneous in this way, by resetting the erroneous classification result to the similar classification result and repeatedly executing the loop processing from S1211, the time when the verification result becomes erroneous, that is, the rule It is possible to estimate the time of change. The above loop processing corresponds to searching for a time when the rule changes by a temporal binary search in the past direction).

S1217では、結果検証部105は、選択中のクラスタの対象期間4015の終了日時に、最終検証日時と誤った分類結果の日時との中間の日時を設定する。尚、ここでは中間の日時を設定しているが、必ずしも厳密な意味での中間の日時でなくてもよく、選択中のクラスタの対象期間4015の終了日時に設定する日時は、最終検証日時と誤った分類結果の日時とに基づき分類結果の誤り率が低くなる可能性が高くなるように設定すればよい。 In S1217, the result verification unit 105 sets the end date and time of the target period 4015 of the selected cluster as an intermediate date and time between the final verification date and time and the date and time of the erroneous classification result. Although the intermediate date and time is set here, it does not necessarily have to be the intermediate date and time in the strict sense, and the date and time set as the end date and time of the target period 4015 of the selected cluster is the final verification date and time. It may be set so that the error rate of the classification result is likely to be low based on the date and time of the erroneous classification result.

続いて、結果検証部105は、タイムスタンプが、S1217で対象期間4015の終了日時として設定した日時よりも後の日時の未検証の分類結果を取得し、取得した分類結果について、個別結果検証部10と連携して検証を行う(S1218)。このように、終了日時よりも後の日時の未検証の分類結果について検証を行う(即ち、規則が変化した日時と推定される日時以降の分類結果を検証することで、時間的又は空間的に規則が変化した時点を効率よく高い精度で特定することができる。 Subsequently, the result verification unit 105 acquires unverified classification results whose time stamp is later than the date and time set as the end date and time of the target period 4015 in S1217, and the individual result verification unit for the acquired classification results. Verification is performed in cooperation with 10. (S1218). In this way, by verifying the unverified classification results of the date and time after the end date and time (that is, by verifying the classification results after the date and time estimated to be the date and time when the rule changed, temporally or spatially. It is possible to efficiently identify the time when the rule changes with high accuracy.

続いて、結果検証部105は、S1218の検証結果に基づき分割空間を設定(生成又は更新)し、設定した分割空間を分割情報TBL701に登録する(S1219)。例えば、結果検証部105は、規則が変化した日時を日時70121の開始日時とする分割空間を設定する。また、例えば、結果検証部105は、規則が変化した日時を終了日時とする分割空間を設定する。 Subsequently, the result verification unit 105 sets (generates or updates) the divided space based on the verification result of S1218, and registers the set divided space in the division information TBL701 (S1219). For example, the result verification unit 105 sets a division space in which the date and time when the rule changes is set as the start date and time of the date and time 70121. Further, for example, the result verification unit 105 sets a division space whose end date and time is the date and time when the rule changes.

以上に説明したように、審査支援システム1は、分類用データの審査に用いる分類モデルとして適切なものを選択し、選択した分類モデルを用いて分類用データの審査を行い、分類結果について、分類器による審査が規則に従い正しく行われているか否かを検証する。そして、検証により審査が誤っていることが判明した場合、誤った分類結果に基づき申請書の審査に適用する規則が変化した時点を推定し、推定した時点に基づき分割情報(分割空間)を更新し、更新された分割空間ごとに学習データをクラスタリングして得られるクラスタごとに分類モデルを生成する。このため、例えば、規則が不連続に変化した場合でも、変化した時点を効率よく高い精度で推定することができ、審査が正しく行われるように分類モデルを学習し直すことができる。 As described above, the examination support system 1 selects an appropriate classification model for the examination of the classification data, examines the classification data using the selected classification model, and classifies the classification results. Verify whether the instrumental examination is performed correctly according to the rules. If the verification reveals that the examination is incorrect, the time when the rules applied to the application examination change is estimated based on the incorrect classification result, and the division information (division space) is updated based on the estimated time. Then, the training data is clustered for each updated divided space, and a classification model is generated for each cluster. Therefore, for example, even if the rule changes discontinuously, the time of change can be estimated efficiently and with high accuracy, and the classification model can be retrained so that the examination is performed correctly.

また、審査支援システム1は、このように審査における規則の変化の態様に拘わらず規則の変化を検知することができるので、規則の変化に追随して審査の精度を継続的に維持することができる。 Further, since the examination support system 1 can detect the change in the rule regardless of the mode of the change in the rule in the examination in this way, it is possible to continuously maintain the accuracy of the examination in accordance with the change in the rule. can.

また、分類モデルは、学習データの類似性に基づきクラスタリングされたクラスタごとに生成され、分類用データは、当該分類用データに類似する学習データにより学習した分類モデルにより自動審査(分類)されるので、申請データ(分類用データ)の空間的な違いを考慮しつつ精度よく自動審査を行うことができる。 In addition, the classification model is generated for each cluster clustered based on the similarity of the training data, and the classification data is automatically examined (classified) by the classification model trained by the training data similar to the classification data. , It is possible to perform automatic examination with high accuracy while considering the spatial difference of application data (classification data).

ところで、審査支援システム1は、審査を行うユーザの業務効率の向上を図るため、例えば、以下に示すようなユーザインタフェースを提供する。 By the way, the examination support system 1 provides, for example, the following user interface in order to improve the work efficiency of the user who performs the examination.

図13は、図11のS1114における検証の結果を審査担当者等のユーザに提示する際、審査支援装置100が表示する画面(以下、「検証結果画面1300」と称する。)の一例である。例示する検証結果画面1300は、クラスタID1311で特定されるクラスタごとに、自動審査の誤りが検知された日時(検知日時1312)、当該クラスタについて直近の検証が行われた日時(最終検証日時1313)が表示されている。ユーザは、検証結果画面1300を参照することで、どのような自動審査(クラスタ)に誤りが生じているのかを視覚的に確認することができる。また、自動審査の誤りが検知されたクラスタについては、分割情報の更新を行うか否かを指示するための操作ボタン1314が表示される。ユーザは、操作ボタン1314を操作することで、自動審査の誤りが検知されたクラスタについて、分割情報の更新指示(分割情報更新処理S1116の実行指示)を出すことができる。 FIG. 13 is an example of a screen (hereinafter referred to as “verification result screen 1300”) displayed by the examination support device 100 when presenting the verification result in S1114 of FIG. 11 to a user such as a person in charge of examination. The example verification result screen 1300 shows the date and time when an error in the automatic examination was detected (detection date and time 1312) and the date and time when the latest verification was performed for the cluster (final verification date and time 1313) for each cluster specified by the cluster ID 1311. Is displayed. By referring to the verification result screen 1300, the user can visually confirm what kind of automatic examination (cluster) has an error. Further, for the cluster in which the error of the automatic examination is detected, the operation button 1314 for instructing whether or not to update the division information is displayed. By operating the operation button 1314, the user can issue an instruction to update the division information (execution instruction of the division information update process S1116) for the cluster in which the error of the automatic examination is detected.

図14は、図12のS1218における検証に際し、個別結果検証部10が表示する画面(以下、「個別結果検証画面1400」と称する。)の一例である。例示する個別結果
検証画面1400は、検証の対象となる分類結果の分類用データの申請書ID1411、当該分類用データのタイムスタンプ1412、当該分類用データの元になる申請書のイメージ1413、当該分類用データの各項目の名称(項目名1414)と各項目に設定されている値1415が表示されている。ユーザは、プルダウンリスト1416を操作することで、当該分類用データに設定するラベルを指定することができる。ユーザが登録ボタン1417を操作すると、当該分類用データにプルダウンリスト1416で指定されたラベルがラベルTBL601に反映される。
FIG. 14 is an example of a screen displayed by the individual result verification unit 10 (hereinafter, referred to as “individual result verification screen 1400”) in the verification in S1218 of FIG. The individual result verification screen 1400 exemplified is the application form ID 1411 of the classification data of the classification result to be verified, the time stamp 1412 of the classification data, the image 1413 of the application form which is the source of the classification data, and the classification. The name of each item of the data (item name 1414) and the value 1415 set for each item are displayed. The user can specify a label to be set for the classification data by operating the pull-down list 1416. When the user operates the registration button 1417, the label specified in the pull-down list 1416 is reflected in the label TBL601 in the classification data.

また、申請書管理部200及び個別結果検証部10の機能は、同じ情報処理装置に実装してもよいし、異なる情報処理装置に実装してもよい。 Further, the functions of the application form management unit 200 and the individual result verification unit 10 may be implemented in the same information processing device or in different information processing devices.

図15は、申請書管理部200及び個別結果検証部10の機能を同じ情報処理装置(以下、「ユーザ端末220」と称する。)に実装した場合における審査支援システム1の構成例である。同図に示すように、例示するユーザ端末220は、通信ネットワーク5(LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、専用線
、公衆通信網、シリアル通信装置等)を介して審査支援装置100と通信可能に接続している。申請書管理部200は、通信ネットワーク5を介して審査支援装置100に申請データTBL201の申請データを提供する。審査支援装置100は、例えば、RESTやgRPC等のプロトコルを用いて申請データTBL201の申請データや個別結果検証部10が管理する検証結果を取得する。ユーザ端末220は、審査支援装置100から提供される画面や自身が生成する画面を、例えば、Webページ等の形式でユーザに提示する。
FIG. 15 is a configuration example of the examination support system 1 when the functions of the application form management unit 200 and the individual result verification unit 10 are implemented in the same information processing device (hereinafter referred to as “user terminal 220”). As shown in the figure, the illustrated user terminal 220 is examined via a communication network 5 (LAN (Local Area Network), WAN (Wide Area Network), Internet, leased line, public communication network, serial communication device, etc.). It is communicably connected to the support device 100. The application form management unit 200 provides the application data of the application data TBL201 to the examination support device 100 via the communication network 5. The examination support device 100 acquires the application data of the application data TBL201 and the verification result managed by the individual result verification unit 10 by using a protocol such as REST or gRPC, for example. The user terminal 220 presents the screen provided by the examination support device 100 or the screen generated by the user terminal 220 to the user in the form of, for example, a Web page.

以上、本発明の一実施形態について説明したが、本発明は上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、上記実施形態の構成の一部について、他の構成の追加や削除、置換をすることが可能である。 Although one embodiment of the present invention has been described above, it is needless to say that the present invention is not limited to the above embodiment and can be variously modified without departing from the gist thereof. For example, the above-described embodiment has been described in detail in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to the one including all the described configurations. Further, it is possible to add, delete, or replace a part of the configuration of the above embodiment with another configuration.

上記の各構成、機能部、処理部、処理手段等は、それらの一部又は全部を、例えば、集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、ICカー
ド、SDカード、DVD等の記録媒体に置くことができる。
Each of the above configurations, functional units, processing units, processing means, and the like may be realized by hardware, for example, by designing a part or all of them with an integrated circuit. Further, each of the above configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function. Information such as programs, tables, and files that realize each function can be placed in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.

以上に説明した各情報処理装置の各種機能部、各種処理部、各種データベースの配置形態は一例に過ぎない。各種機能部、各種処理部、各種データベースの配置形態は、これらの装置が備えるハードウェアやソフトウェアの性能、処理効率、通信効率等の観点から最適な配置形態に変更し得る。 The arrangement form of various functional units, various processing units, and various databases of each information processing device described above is only an example. The arrangement form of various function units, various processing units, and various databases can be changed to the optimum arrangement form from the viewpoint of the performance, processing efficiency, communication efficiency, and the like of the hardware and software included in these devices.

前述した各種のデータを格納するデータベースの構成(スキーマ(Schema)等)は、リソースの効率的な利用、処理効率向上、アクセス効率向上、検索効率向上等の観点から柔軟に変更し得る。 The configuration of the database (schema, etc.) for storing various types of data described above can be flexibly changed from the viewpoints of efficient use of resources, improvement of processing efficiency, improvement of access efficiency, improvement of search efficiency, and the like.

1 審査支援システム、10 個別結果検証部、101 分類用データ取得部、102 分類器、103 学習データ取得部、104 学習器、105 結果検証部、106 分割情報更新部、200 申請書管理部、201 申請データTBL、220 ユーザ端末、300 分類状態記憶部、301 分類状態TBL、400 モデル記憶部、401
モデルTBL、500 分類結果記憶部、501 分類結果TBL、600 ラベル記憶部、601 ラベルデータTBL、700 分割情報記憶部、701 分割情報TBL、1300 検証結果画面、1400 個別結果検証画面
1 Examination support system, 10 Individual result verification unit, 101 Classification data acquisition unit, 102 classifier, 103 Learning data acquisition unit, 104 Learner, 105 Result verification unit, 106 Division information update unit, 200 Application form management department, 201 Application data TBL, 220 user terminal, 300 classification status storage unit, 301 classification status TBL, 400 model storage unit, 401
Model TBL, 500 Classification result storage unit, 501 Classification result TBL, 600 Label storage unit, 601 Label data TBL, 700 Division information storage unit, 701 Division information TBL, 1300 Verification result screen, 1400 Individual result verification screen

Claims (14)

申請書の審査を支援する審査支援システムであって、
情報処理装置を用いて構成され、
申請の各項目及び前記各項目の値と、審査の基準として参照される日時であるタイムスタンプと、を含むデータである申請データを記憶するデータベースから、審査の対象とする前記申請データである分類用データを取得する分類用データ取得部と、
前記申請書の審査に適用される規則に従い前記申請データを正しく審査した場合の審査の結果を示すラベルを前記申請書に対応づけて記憶するラベル記憶部と、
前記分類用データを審査する機械学習モデルである分類モデルを記憶するモデル記憶部と、
前記分類用データの審査に用いる前記分類モデルを前記モデル記憶部から選択し、選択した前記分類モデルを用いて前記分類用データを審査する分類器と、
前記審査の結果と前記分類用データとを対応づけた情報である分類結果を記憶する分類結果記憶部と、
前記分類結果について、前記分類器による審査が規則に従い正しく行われているか否かの検証の結果を取得する結果検証部と、
前記分類モデルの学習に用いる学習データの生成に用いる前記申請データを前記データベースから取得する際のサンプリング範囲を示す分割空間に関する情報である分割情報を記憶する分割情報記憶部と、
前記検証により審査が誤っていることが判明した前記分類結果に基づき前記規則が変化した時点を推定し、推定した前記時点に基づき前記分割情報を更新する分割情報更新部と、
前記申請データを前記分割空間ごとに前記データベースからサンプリングし、前記分割空間の夫々に属する前記申請データに基づき前記学習データを生成する学習データ生成部と、
前記分割空間ごとに前記学習データをクラスタリングして得られるクラスタごとに前記分類モデルを生成する学習器と、
を備え、
前記分類器は、審査の対象となる前記分類用データに類似する前記学習データにより学習した前記クラスタの前記分類モデルを選択し、選択した前記分類モデルにより前記分類用データの審査を行う、
審査支援システム。
It is an examination support system that supports the examination of applications.
It is configured using an information processing device and
Classification of the application data to be examined from the database that stores the application data, which is the data including each item of the application, the value of each item, and the time stamp which is the date and time referred to as the examination standard. Data acquisition unit for classification to acquire data for
A label storage unit that stores a label indicating the result of the examination when the application data is correctly examined according to the rules applied to the examination of the application form in association with the application form.
A model storage unit that stores a classification model, which is a machine learning model that examines the classification data,
A classifier that selects the classification model to be used for examining the classification data from the model storage unit and examines the classification data using the selected classification model.
A classification result storage unit that stores classification results, which is information in which the examination results and the classification data are associated with each other.
With respect to the classification result, a result verification unit that acquires the result of verification as to whether or not the examination by the classifier is performed correctly according to the rules, and
A division information storage unit that stores division information that is information about a division space indicating a sampling range when the application data used for generating training data used for learning the classification model is acquired from the database.
A division information update unit that estimates the time when the rule changes based on the classification result found to be incorrect by the verification and updates the division information based on the estimated time.
A learning data generation unit that samples the application data for each divided space from the database and generates the learning data based on the application data belonging to each of the divided spaces.
A learning device that generates the classification model for each cluster obtained by clustering the learning data for each divided space.
Equipped with
The classifier selects the classification model of the cluster trained by the training data similar to the classification data to be examined, and examines the classification data by the selected classification model.
Examination support system.
請求項1に記載の審査支援システムであって、
前記分割情報更新部は、前記誤った分類結果に類似する他の前記分類結果を、前記誤った分類結果の前記タイムスタンプから前回の検証を行った日時である最終検証日時に遡って選択し、選択した前記他の分類結果を検証する処理を、検証結果が正しくなるまで繰り返し実行することにより前記時点を推定する、
審査支援システム。
The examination support system according to claim 1.
The division information update unit selects another classification result similar to the erroneous classification result retroactively from the time stamp of the erroneous classification result to the final verification date and time, which is the date and time when the previous verification was performed. The time point is estimated by repeatedly executing the process of verifying the selected other classification results until the verification results are correct.
Examination support system.
請求項1に記載の審査支援システムであって、
前記結果検証部は、前記タイムスタンプが、前回の検証を行った日時である最終検証日時と現在日時との間の前記分類結果について前記検証を行う、
審査支援システム。
The examination support system according to claim 1.
The result verification unit performs the verification on the classification result between the final verification date and time, which is the date and time when the time stamp was last verified, and the current date and time.
Examination support system.
請求項1に記載の審査支援システムであって、
前記結果検証部が、推定した前記時点よりも後のタイムスタンプの未検証の前記分類結果について検証結果を受け付け、受け付けた前記検証結果に基づき前記時点を推定する、
審査支援システム。
The examination support system according to claim 1.
The result verification unit accepts the verification result for the unverified classification result of the time stamp after the estimated time stamp, and estimates the time point based on the received verification result.
Examination support system.
請求項1に記載の審査支援システムであって、
前記学習器は、前記分類モデルに、当該分類モデルの対象期間と、前記分類用データと当該分類モデルの生成に用いた前記学習データとの間の類似度を判定するための情報と、を設定し、
前記分類器は、前記分類用データの前記タイムスタンプが前記対象期間に含まれ、かつ、前記情報に基づき、前記分類用データと前記学習データとが類似すると判定した前記分類モデルを、前記分類用データの審査に用いる分類モデルとして前記モデル記憶部から選択する、
審査支援システム。
The examination support system according to claim 1.
The learner sets, in the classification model, the target period of the classification model and information for determining the degree of similarity between the classification data and the learning data used for generating the classification model. death,
The classifier uses the classification model for which the time stamp of the classification data is included in the target period and the classification model is determined to be similar to the training data based on the information. Select from the model storage unit as the classification model used for data review.
Examination support system.
請求項1に記載の審査支援システムであって、
前記検証の結果を示す情報を前記クラスタごとにユーザに提示するユーザインタフェースを更に備える、審査支援システム。
The examination support system according to claim 1.
An examination support system further comprising a user interface for presenting information indicating the result of the verification to the user for each cluster.
請求項6に記載の審査支援システムであって、
前記ユーザインタフェースは、前記クラスタごとに前記分割情報の更新指示を受け付け、
前記分割情報更新部は、前記更新指示を受け付けた前記クラスタに関連する前記分割情報を更新する、
審査支援システム。
The examination support system according to claim 6.
The user interface receives an instruction to update the division information for each cluster, and receives an instruction to update the division information.
The division information update unit updates the division information related to the cluster that has received the update instruction.
Examination support system.
請求項1に記載の審査支援システムであって、
前記検証により誤った審査が行われたことが判明した前記分類結果の前記分類用データに対応する前記申請データの内容を提示するユーザインタフェースを更に備える、審査支援システム。
The examination support system according to claim 1.
An examination support system further comprising a user interface for presenting the contents of the application data corresponding to the classification data of the classification result found to have been erroneously examined by the verification.
請求項8に記載の審査支援システムであって、
前記ユーザインタフェースは、前記検証により誤った審査が行われたことが判明した前記分類結果の前記分類用データについての正しい前記ラベルを受け付け、
前記ラベル記憶部は、受け付けた前記ラベルを前記分類用データに対応する前記申請書に対応づけて記憶する、
審査支援システム。
The examination support system according to claim 8.
The user interface accepts the correct label for the classification data of the classification result, which was found to have been erroneously examined by the verification.
The label storage unit stores the received label in association with the application form corresponding to the classification data.
Examination support system.
申請書の審査を支援する方法であって、
情報処理装置が、
申請の各項目及び前記各項目の値と、審査の基準として参照される日時であるタイムスタンプと、を含むデータである申請データを記憶するデータベースから、審査の対象とする前記申請データである分類用データを取得するステップと、
前記申請書の審査に適用される規則に従い前記申請データを正しく審査した場合の審査の結果を示すラベルを前記申請書に対応づけて記憶するステップと、
前記分類用データを審査する機械学習モデルである分類モデルを記憶するステップと、
前記分類用データの審査に用いる前記分類モデルを選択し、選択した前記分類モデルを用いて前記分類用データを審査するステップと、
前記審査の結果と前記分類用データとを対応づけた情報である分類結果を記憶するステップと、
前記分類結果について、前記審査が規則に従い正しく行われているか否かの検証の結果を取得するステップと、
前記分類モデルの学習に用いる学習データの生成に用いる前記申請データを前記データベースから取得する際のサンプリング範囲を示す分割空間に関する情報である分割情報を
記憶するステップと、
前記検証により審査が誤っていることが判明した前記分類結果に基づき前記規則が変化した時点を推定し、推定した前記時点に基づき前記分割情報を更新するステップと、
前記申請データを前記分割空間ごとに前記データベースからサンプリングし、前記分割空間の夫々に属する前記申請データに基づき前記学習データを生成するステップと、
前記分割空間ごとに前記学習データをクラスタリングして得られるクラスタごとに前記分類モデルを生成するステップと、
前記審査の対象となる前記分類用データに類似する前記学習データにより学習した前記クラスタの前記分類モデルを選択し、選択した前記分類モデルにより前記分類用データの審査を行うステップと、
を実行する、審査支援方法。
It ’s a way to support the examination of the application form.
Information processing equipment
Classification of the application data to be examined from the database that stores the application data, which is the data including each item of the application, the value of each item, and the time stamp which is the date and time referred to as the examination standard. Steps to get the data for
A step of storing a label indicating the result of the examination when the application data is correctly examined according to the rules applied to the examination of the application form in association with the application form.
A step of storing a classification model, which is a machine learning model for examining the classification data,
A step of selecting the classification model to be used for examining the classification data and examining the classification data using the selected classification model.
A step of storing the classification result, which is information corresponding to the result of the examination and the data for classification,
With respect to the classification result, a step of acquiring the result of verification as to whether or not the examination is performed correctly according to the rules, and
A step of storing division information which is information about a division space indicating a sampling range when the application data used for generating training data used for learning the classification model is acquired from the database.
A step of estimating the time when the rule changes based on the classification result found to be incorrect by the verification, and updating the division information based on the estimated time.
A step of sampling the application data from the database for each divided space and generating the learning data based on the application data belonging to each of the divided spaces.
A step of generating the classification model for each cluster obtained by clustering the learning data for each divided space, and
A step of selecting the classification model of the cluster learned by the training data similar to the classification data to be examined, and examining the classification data by the selected classification model.
How to support the examination.
請求項10に記載の審査支援方法であって、
前記情報処理装置が、前記誤った分類結果に類似する他の前記分類結果を、前記誤った分類結果の前記タイムスタンプから前回の検証を行った日時である最終検証日時に遡って選択し、選択した前記他の分類結果を検証する処理を、検証結果が正しくなるまで繰り返し実行することにより前記時点を推定するステップ、
を更に実行する、審査支援システム。
The examination support method according to claim 10.
The information processing apparatus selects and selects another classification result similar to the erroneous classification result retroactively from the time stamp of the erroneous classification result to the final verification date and time, which is the date and time when the previous verification was performed. A step of estimating the time point by repeatedly executing the process of verifying the other classification results until the verification result becomes correct.
Examination support system that further executes.
請求項10に記載の審査支援方法であって、
前記情報処理装置が、前記タイムスタンプが、前回の検証を行った日時である最終検証日時と現在日時との間の前記分類結果について前記検証を行うステップを更に実行する、審査支援方法。
The examination support method according to claim 10.
An examination support method in which the information processing apparatus further executes the step of verifying the classification result between the final verification date and time, which is the date and time when the time stamp was previously verified, and the current date and time.
請求項10に記載の審査支援方法であって、
前記情報処理装置が、推定した前記時点よりも後のタイムスタンプの未検証の前記分類結果について検証結果を受け付け、受け付けた前記検証結果に基づき前記時点を推定するステップ、
を更に実行する、審査支援方法。
The examination support method according to claim 10.
A step in which the information processing apparatus receives a verification result for the unverified classification result of a time stamp after the estimated time stamp, and estimates the time point based on the received verification result.
Examination support method to further execute.
請求項10に記載の審査支援方法であって、
前記情報処理装置が、前記分類モデルに、当該分類モデルの対象期間と、前記分類用データと当該分類モデルの生成に用いた前記学習データとの間の類似度を判定するための情報と、を設定するステップと、
前記分類用データの前記タイムスタンプが前記対象期間に含まれ、かつ、前記情報に基づき、前記分類用データと前記学習データとが類似すると判定した前記分類モデルを、前記分類用データの審査に用いる分類モデルとして選択するステップ、
を更に実行する、審査支援方法。

The examination support method according to claim 10.
The information processing apparatus provides the classification model with information for determining the target period of the classification model and the degree of similarity between the classification data and the learning data used to generate the classification model. Steps to set and
The classification model determined that the time stamp of the classification data is included in the target period and that the classification data and the learning data are similar based on the information is used for the examination of the classification data. Steps to select as a classification model,
Examination support method to further execute.

JP2020210382A 2020-12-18 2020-12-18 Examination support system and examination support method Active JP7442430B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020210382A JP7442430B2 (en) 2020-12-18 2020-12-18 Examination support system and examination support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020210382A JP7442430B2 (en) 2020-12-18 2020-12-18 Examination support system and examination support method

Publications (2)

Publication Number Publication Date
JP2022097034A true JP2022097034A (en) 2022-06-30
JP7442430B2 JP7442430B2 (en) 2024-03-04

Family

ID=82165357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020210382A Active JP7442430B2 (en) 2020-12-18 2020-12-18 Examination support system and examination support method

Country Status (1)

Country Link
JP (1) JP7442430B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002202984A (en) 2000-11-02 2002-07-19 Fujitsu Ltd Automatic text information sorter based on rule base model
US11615273B2 (en) 2016-01-27 2023-03-28 Nippon Telegraph And Telephone Corporation Creating apparatus, creating method, and creating program
JP2019200618A (en) 2018-05-16 2019-11-21 日本電信電話株式会社 Creation device, creation method, and creation program

Also Published As

Publication number Publication date
JP7442430B2 (en) 2024-03-04

Similar Documents

Publication Publication Date Title
US10565234B1 (en) Ticket classification systems and methods
US20200050968A1 (en) Interactive interfaces for machine learning model evaluations
CA2953826C (en) Machine learning service
US10902322B2 (en) Classification training techniques to map datasets to a standardized data model
US11797593B2 (en) Mapping of topics within a domain based on terms associated with the topics
JP2022535165A (en) Data classification using information aggregated from many classification modules
WO2019102533A1 (en) Document classification device
CN113051362B (en) Data query method, device and server
WO2022222943A1 (en) Department recommendation method and apparatus, electronic device and storage medium
EP4040311A1 (en) Utilizing machine learning and natural language processing to extract and verify vaccination data
WO2022105496A1 (en) Intelligent follow-up contact method and apparatus, and electronic device and readable storage medium
US11409772B2 (en) Active learning for data matching
US20200183962A1 (en) Identifying and prioritizing candidate answer gaps within a corpus
US20220415203A1 (en) Interface to natural language generator for generation of knowledge assessment items
CN115222443A (en) Client group division method, device, equipment and storage medium
AU2015204339B2 (en) Information processing apparatus and information processing program
JP2022082524A (en) Method and apparatus for providing information using learning model through machine learning
US20210357808A1 (en) Machine learning model generation system and machine learning model generation method
US20230394236A1 (en) Extracting content from freeform text samples into custom fields in a software application
US20230334342A1 (en) Non-transitory computer-readable recording medium storing rule update program, rule update method, and rule update device
JP2019128925A (en) Event presentation system and event presentation device
JP7442430B2 (en) Examination support system and examination support method
US20230026656A1 (en) Machine learning for categorizing text
AU2022204724B1 (en) Supervised machine learning method for matching unsupervised data
JP2021152751A (en) Analysis support device and analysis support method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240220

R150 Certificate of patent or registration of utility model

Ref document number: 7442430

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150