JP2015060432A - Program, computer, and training data generation support method - Google Patents

Program, computer, and training data generation support method Download PDF

Info

Publication number
JP2015060432A
JP2015060432A JP2013194168A JP2013194168A JP2015060432A JP 2015060432 A JP2015060432 A JP 2015060432A JP 2013194168 A JP2013194168 A JP 2013194168A JP 2013194168 A JP2013194168 A JP 2013194168A JP 2015060432 A JP2015060432 A JP 2015060432A
Authority
JP
Japan
Prior art keywords
worker
training data
data
determination
work
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013194168A
Other languages
Japanese (ja)
Other versions
JP6307822B2 (en
Inventor
聡子 岩倉
Satoko Iwakura
聡子 岩倉
友哉 岩倉
Tomoya Iwakura
友哉 岩倉
太田 唯子
Yuiko Ota
唯子 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013194168A priority Critical patent/JP6307822B2/en
Publication of JP2015060432A publication Critical patent/JP2015060432A/en
Application granted granted Critical
Publication of JP6307822B2 publication Critical patent/JP6307822B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a program, a computer, and a training data generation support method capable of determining an operator's operation skill related to generation of training data with a simple method.SOLUTION: Provided is a program causing a computer to execute determining an operation skill of a first operator or a second operator on the basis of first training data generated by operation of the first operate for first data and first processing result data generated for the first data according to first rule data generated by machine learning using second training data generated by operation of the second operator for second data.

Description

本発明は、プログラム、コンピュータおよび訓練データ作成支援方法に関する。   The present invention relates to a program, a computer, and a training data creation support method.

例えば文書管理やインターネット等の分野において、文書の自動整理やスパム除去、検索等を行うために、各文書に対し、あらかじめ与えられたいくつかのカテゴリ(分類)を示すラベルを付与する、文書分類が行われている。   For example, in the field of document management and the Internet, in order to perform automatic document organization, spam removal, search, etc., each document is assigned a label indicating some predetermined category (classification). Has been done.

文書分類においては、文書内容に基づき付与する分類ラベル(以下、ラベルと呼称する)を決定する文書分類器が用いられる場合があり、文書分類器(以下、分類器と呼称する)の生成には、機械学習を用いる方法が知られている。機械学習を用いる場合、予めラベルが付与された文書を訓練データ(学習データまたは教師データとも呼ばれる)として、それらの文書が持つラベルを付与するための規則(分類規則)を自動で獲得する。分類器は、獲得した分類規則を用いて、新しい文書に対し、自動でラベルを付与することができる。   In document classification, a document classifier that determines a classification label (hereinafter referred to as a label) to be applied based on the document content may be used. For generation of a document classifier (hereinafter referred to as a classifier) A method using machine learning is known. In the case of using machine learning, rules (classification rules) for assigning labels possessed by these documents are automatically acquired as training data (also referred to as learning data or teacher data). The classifier can automatically assign a label to a new document using the acquired classification rule.

この訓練データの作成においては、作業者の人手によって文書にラベルが付与される。   In creating the training data, a label is attached to the document by the worker.

特開2009−217528号公報JP 2009-217528 A

機械学習により精度の良い分類器を生成するためには、訓練データの質と量が大きく影響する。よって、訓練データ作成の際には、適正なラベルが文書に付与された訓練データが作られるように、過去に同様の作業を行ったことがある経験者をなるべく作業者として選定することが行われる。しかしながら、ラベル付与対象の文書数が多いとその数に見合った経験者を作業者として確保できず、未経験者や経験の少ない者をしばしば作業者に選定せざるを得ない。未経験者であっても、ラベル付与作業において、期待される技能水準を満たしていることが好ましい。   In order to generate a classifier with high accuracy by machine learning, the quality and quantity of training data are greatly affected. Therefore, when creating training data, it is recommended that experienced workers who have performed similar tasks in the past be selected as workers so that training data with appropriate labels attached to the documents is created. Is called. However, if there are a large number of documents to be labeled, it is not possible to secure an experienced person corresponding to that number as an operator, and an inexperienced person or an inexperienced person often has to be selected as an operator. Even an inexperienced person preferably satisfies the expected skill level in the labeling operation.

そこで、作業者の作業技能を判定する方法が必要になる。そのために、例えば予め付与すべきラベル(正解ラベル)が分かっている技能判定用の文書を準備し、作業者にその文書を作業対象として渡し、作業者がその文書に付与したラベルと正解ラベルとの一致を見て作業者のラベル付与作業技能を判定する方法がある。   Therefore, a method for determining the work skill of the worker is required. For this purpose, for example, a skill determination document in which a label (correct answer label) to be given in advance is known is prepared, the document is handed over to the worker, and the label given to the document by the worker and the correct answer label There is a method of judging the worker's labeling work skill by looking at the match.

しかしながら、上述の方法によれば、正解ラベルの作成を含む技能判定用の文書を準備する工数や、技能判定用の文書にラベルを付与するための作業者の工数が発生するため、対象作業者の人数が多いほど非効率的になり得る。   However, according to the above-described method, man-hours for preparing a document for skill determination including creation of a correct answer label and workers for assigning a label to the document for skill determination are generated. The more people there are, the more inefficient.

本発明の1つの側面では、簡易な方法で、訓練データの作成に関する作業者の作業技能を判定することが可能なプログラム、コンピュータおよび訓練データ作成支援方法を提供することを目的とする。   An object of one aspect of the present invention is to provide a program, a computer, and a training data creation support method that can determine a worker's work skill related to creation of training data by a simple method.

発明の一観点によれば、コンピュータに、第1データを対象にして第1作業者の作業により作成された第1訓練データと、第2データを対象にして第2作業者の作業により作成された第2訓練データを用いた機械学習により生成された第1規則データに従って前記第1データを対象にして生成された第1処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する、ことを実行させるためのプログラムが提供される。   According to one aspect of the invention, the first training data created by the work of the first worker for the first data and the work of the second worker for the second data are created in the computer. Based on the first processing result data generated for the first data according to the first rule data generated by machine learning using the second training data, the first worker or the second worker A program for determining the work skill is executed.

一実施態様によれば、技能判定用のラベル付与済み文書を予め準備する工数や、技能判定用の文書にラベルを付与するための作業者の工数が発生しない、簡易な方法で、訓練データの作成に関する作業者の作業技能を判定することが可能なプログラム、コンピュータおよび訓練データ作成支援方法を提供することができる。   According to one embodiment, the man-hour for preparing a label-added document for skill determination and the man-hour for an operator for giving a label to the document for skill determination do not occur with a simple method, It is possible to provide a program, a computer, and a training data creation support method capable of determining a worker's work skill related to creation.

図1は、訓練データ作成支援システムの一例を示す。FIG. 1 shows an example of a training data creation support system. 図2は、訓練データ作成支援装置のハードウェア構成の一例を示す。FIG. 2 shows an example of the hardware configuration of the training data creation support apparatus. 図3は、訓練データ作成支援装置による訓練データ作成支援方法の一例を示すフローチャートである。FIG. 3 is a flowchart illustrating an example of a training data creation support method by the training data creation support device. 図4は、訓練データDBの一例を示す。FIG. 4 shows an example of the training data DB. 図5は、一致度の判定処理の一例を示すフローチャートである。FIG. 5 is a flowchart illustrating an example of the matching degree determination process. 図6は、分類規則の一例を示す。FIG. 6 shows an example of the classification rule. 図7は、判定作業用DBの一例を示す。FIG. 7 shows an example of the determination work DB. 図8は、ラベル付与結果の一致度判定処理の一例を示すフローチャートである。FIG. 8 is a flowchart illustrating an example of a process for determining the degree of coincidence of label assignment results. 図9は、カウンタの一例を示す。FIG. 9 shows an example of the counter. 図10は、判定結果DBの一例を示す。FIG. 10 shows an example of the determination result DB. 図11は、模範作業者および確認対象者の抽出処理の一例を示すフローチャートである。FIG. 11 is a flowchart illustrating an example of the extraction process of the model worker and the confirmation target person. 図12は、確認対象者DBの一例を示す。FIG. 12 shows an example of the confirmation target person DB. 図13は、模範作業者DBの一例を示す。FIG. 13 shows an example of the model worker DB. 図14は、確認対象者の技能判定処理の一例を示すフローチャートである。FIG. 14 is a flowchart illustrating an example of the skill determination process for the person to be confirmed. 図15は、確認対象者判定用DBの一例を示す。FIG. 15 shows an example of a confirmation target person determination DB. 図16は、ラベル付与結果の一致判定処理の一例を示すフローチャートである。FIG. 16 is a flowchart illustrating an example of a label determination result match determination process. 図17は、ラベル付与結果の一致度判定処理の一例を示すフローチャートである。FIG. 17 is a flowchart illustrating an example of a process for determining a matching degree of a label addition result. 図18は、他の実施形態における訓練データ作成支援システムの一例を示す。FIG. 18 shows an example of a training data creation support system according to another embodiment. 図19は、他の実施形態における訓練データ作成支援装置による訓練データ作成支援方法の一例を示すフローチャートである。FIG. 19 is a flowchart illustrating an example of a training data creation support method by the training data creation support device according to another embodiment. 図20は、模範作業者へのラベル付与指示処理の一例を示すフローチャートである。FIG. 20 is a flowchart illustrating an example of a label assignment instruction process for an exemplary worker. 図21は、他の実施形態における訓練データ作成支援システムの一例を示す。FIG. 21 shows an example of a training data creation support system in another embodiment. 図22は、他の実施形態における訓練データ作成支援装置による訓練データ作成支援方法の一例を示すフローチャートである。FIG. 22 is a flowchart illustrating an example of a training data creation support method by the training data creation support device according to another embodiment. 図23は、付与対象文書の送信処理の一例を示すフローチャートである。FIG. 23 is a flowchart illustrating an example of a transmission process of a grant target document.

以下、本発明の実施形態について、図1乃至図23を参照して具体的に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to FIGS.

図1は、訓練データ作成支援システムの一例を示す。図1に示すように、訓練データ作成支援システムは、訓練データ作成支援装置10と複数の端末装置30とを有する。訓練データ作成支援装置10と複数の端末装置30とは、ネットワーク50を介して相互に通信可能に接続される。   FIG. 1 shows an example of a training data creation support system. As shown in FIG. 1, the training data creation support system includes a training data creation support device 10 and a plurality of terminal devices 30. The training data creation support device 10 and the plurality of terminal devices 30 are connected via a network 50 so that they can communicate with each other.

訓練データ作成支援装置10は、訓練データの作成を支援するコンピュータの一例である。訓練データ作成支援装置10は、訓練データの作成を担う作業者の作業技能が所定の水準を満たしているか否かを判定する。前述のように、訓練データは、自動で文書分類を行う分類器を生成する際の機械学習に利用される。なお、訓練データ作成支援装置10は、例えばパーソナルコンピュータ(PC)、またはサーバ等のコンピュータ・ハードウェアとそのハードウェアにて動作するソフトウェアによって実現される。訓練データ作成支援装置10によって実行される処理は後述される。   The training data creation support apparatus 10 is an example of a computer that supports creation of training data. The training data creation support apparatus 10 determines whether or not the work skill of the worker who is responsible for creating the training data satisfies a predetermined level. As described above, the training data is used for machine learning when generating a classifier that performs document classification automatically. The training data creation support apparatus 10 is realized by computer hardware such as a personal computer (PC) or a server and software operating on the hardware. Processing executed by the training data creation support device 10 will be described later.

端末装置30は、訓練データを作成する各作業者が利用する端末装置である。端末装置30は、例えばPC、携帯電話、スマートフォンまたはタブレット端末等である。各作業者は、個別に与えられたラベル付与対象文書にラベルを付与し、ラベル付与済み文書を作成する。このラベル付与済み文書が訓練データである。そして、各作業者は、作成した訓練データを端末装置30から訓練データ作成支援装置10に送信する。   The terminal device 30 is a terminal device used by each worker who creates training data. The terminal device 30 is, for example, a PC, a mobile phone, a smartphone, a tablet terminal, or the like. Each worker assigns a label to an individually given labeling target document and creates a labeled document. This labeled document is training data. Each worker transmits the created training data from the terminal device 30 to the training data creation support device 10.

ラベルとは、文書の内容がどのようなカテゴリ(分類)に属するのかを示す分類名称である。食のカテゴリであることを示す「FOOD」などがラベルの一例である。ラベルが付与される文書は、例えば、ニュース記事、Twitter(登録商標)やブログなどのソーシャルメディアに書き込まれた文章である。   The label is a classification name indicating what category (classification) the content of the document belongs to. “FOOD” or the like indicating a food category is an example of a label. The document to which the label is given is, for example, a text written on social media such as a news article, Twitter (registered trademark), or a blog.

図1では、ネットワーク50にそれぞれ接続された複数の端末装置30が示されているが、1台の装置(端末装置30もしくはその他の管理端末)が訓練データ作成支援装置10と相互に通信する形態をとり、その1台の装置が各作業者(各端末装置30)からの訓練データを取りまとめて訓練データ作成支援装置10に送信するようにしてもよい。   In FIG. 1, a plurality of terminal devices 30 respectively connected to the network 50 are shown, but one device (terminal device 30 or other management terminal) communicates with the training data creation support device 10 mutually. The one apparatus may collect the training data from each worker (each terminal apparatus 30) and transmit it to the training data creation support apparatus 10.

図1に示すように、訓練データ作成支援装置10は、第1記憶部11、第2記憶部12、受信部13、分類器生成部14、判定部15、分類処理部16、送信部17および出力部18を備える。   As shown in FIG. 1, the training data creation support device 10 includes a first storage unit 11, a second storage unit 12, a reception unit 13, a classifier generation unit 14, a determination unit 15, a classification processing unit 16, a transmission unit 17, and An output unit 18 is provided.

第1記憶部11は、訓練データ作成支援プログラムを記憶する。訓練データ作成支援プログラムは、作業者によって作成された訓練データを用い、訓練データ間の関係を基にして作業者の作業技能を判定する処理を実行するプログラムである。例えば、この作業者の作業技能を判定する処理は、作業技能が所定水準に達していない作業者を特定することである。   The first storage unit 11 stores a training data creation support program. The training data creation support program is a program that uses the training data created by the worker and executes processing for determining the worker's work skill based on the relationship between the training data. For example, the process of determining the work skill of the worker is to identify the worker whose work skill has not reached a predetermined level.

第2記憶部12は、本発明の処理に用いる各種情報を記憶するためのデータベース(DB)を格納する。   The 2nd memory | storage part 12 stores the database (DB) for memorize | storing the various information used for the process of this invention.

受信部13は、各端末装置30から作業者によって作成された訓練データを受信する。受信部13は、端末装置30からの、Hypertext Transfer Protcol(HTTP)やFile Transfer Protcol(FTP)などのプロトコルを利用してのアップロードや、訓練データ作成支援装置10を示すアドレスが宛先に設定された電子メールの送信によって、訓練データを受信することができる。そして、受信部13は、受信した訓練データを訓練データDBに登録する。訓練データDBは、例えば第2記憶部12に格納される。訓練データDBの詳細は後述される。   The receiving unit 13 receives training data created by an operator from each terminal device 30. The receiving unit 13 is set to have an address indicating the training data creation support device 10 or an upload using a protocol such as Hypertext Transfer Protocol (HTTP) or File Transfer Protocol (FTP) from the terminal device 30. Training data can be received by sending an email. Then, the receiving unit 13 registers the received training data in the training data DB. The training data DB is stored, for example, in the second storage unit 12. Details of the training data DB will be described later.

分類器生成部14は、各作業者のラベル付与作業技能の判定に用いるために、受信部13によって受信された訓練データを用いて作業者毎の分類器を生成する。ここでは、作業者毎の分類器の生成とは、作業者毎の分類規則を生成することと同意である。分類器の生成方法は後述される。   The classifier generating unit 14 generates a classifier for each worker using the training data received by the receiving unit 13 for use in determining each worker's labeling work skill. Here, generation of a classifier for each worker is equivalent to generation of a classification rule for each worker. A method for generating the classifier will be described later.

判定部15は、第1作業者によって作成された第1訓練データ群と、第2作業者によって作成された第2訓練データ群を対象に機械学習を用いて生成された分類器とを用いて判定処理を行う。判定部15は、第1訓練データ群を作成する際のラベル付与対象文書に対して、第1作業者が付与したラベルと、前述によって生成された分類器によって自動付与されたラベルとが一致するか否かを判定する。   The determination unit 15 uses a first training data group created by the first worker and a classifier generated using machine learning for the second training data group created by the second worker. Judgment processing is performed. The determination unit 15 matches the label given by the first operator with the label automatically given by the classifier generated as described above for the document to be labeled when creating the first training data group. It is determined whether or not.

また、例えば、判定部15は、作業者の中から、作業技能が所定の水準に達していない疑いがあり、その作業技能を判定すべき作業者(以下、確認対象者と呼称する)と、模範とすべき作業者(以下、模範作業者と呼称する)とを抽出する。ここでの作業者は、例えば訓練データDBに登録されている訓練データの作成者である。そして、判定部15は、抽出した確認対象者に対して作業技能判定処理を実施し、確認対象者の作業技能が所定の水準に達しているか否かを判定する。なお、確認対象者に対して作業技能の判定を行うのは、確認対象者(作業者)の作業技能が所定の水準に達していないのか、それとも、付与すべきラベルの判断が難しい付与対象文書を担当したために、その確認対象者(作業者)が一時的に適切なラベル付与を行えなかったのかを判断するためである。   In addition, for example, the determination unit 15 has a suspicion that the work skill does not reach a predetermined level from among the workers, and the worker (hereinafter, referred to as a confirmation target person) whose work skill is to be determined. An operator who should be a model (hereinafter referred to as a model worker) is extracted. The worker here is, for example, a creator of training data registered in the training data DB. Then, the determination unit 15 performs a work skill determination process on the extracted confirmation target person, and determines whether or not the work skill of the confirmation target person has reached a predetermined level. It should be noted that the work skill is determined for the confirmation target person because the work skill of the confirmation target person (worker) does not reach a predetermined level, or it is difficult to determine the label to be assigned. This is because it is determined whether or not the person to be confirmed (operator) could not temporarily assign an appropriate label.

分類処理部16は、分類器を使用して(分類規則に基づいて)、対象文書にラベルを付与する。   The classification processing unit 16 assigns a label to the target document using a classifier (based on the classification rule).

送信部17は、各端末装置30に対してラベル付与対象文書等の情報を送信する。送信部17は、端末装置30に対し、端末装置30によるHTTPやFTPなどのプロトコルを利用してのダウンロードや、各端末装置30を示すアドレス(端末装置30を利用する作業者のメールアドレス等)が宛先に設定された電子メールの送信によって、ラベル付与対象文書等を送信することができる。   The transmission unit 17 transmits information such as a label addition target document to each terminal device 30. The transmission unit 17 downloads the terminal device 30 by using a protocol such as HTTP or FTP by the terminal device 30, and an address indicating each terminal device 30 (e-mail address of a worker who uses the terminal device 30). By sending an e-mail set as a destination, a labeling target document or the like can be sent.

出力部18は、判定部15による判定結果を基に処理結果を出力する。例えば、出力部18は、確認対象者の作業技能が所定の水準に達しているか否かを示す処理結果を出力する。出力部18は、例えば液晶ディスプレイ、プラズマディスプレイまたは有機ELディスプレイ等の表示装置である。   The output unit 18 outputs a processing result based on the determination result by the determination unit 15. For example, the output unit 18 outputs a processing result indicating whether or not the work skill of the confirmation target person has reached a predetermined level. The output unit 18 is a display device such as a liquid crystal display, a plasma display, or an organic EL display.

なお、前述した各部は、他の部と統合またはそれをさらに細分して、それら各部の機能が実現されるものであってもよい。   Note that the above-described units may be integrated with other units or further subdivided to realize the functions of these units.

次に、訓練データ作成支援装置10のハードウェア構成について説明する。   Next, the hardware configuration of the training data creation support apparatus 10 will be described.

図2は、訓練データ作成支援装置10のハードウェア構成の一例を示す。図2に示すように、訓練データ作成支援装置10は、CPU(Central Processing Unit)61、ROM(Read Only Memory)62、RAM(Random Access Memory)63、ストレージ装置64、ネットワークインタフェース65、及び可搬型記憶媒体用ドライブ66等のハードウェア要素を備える。訓練データ作成支援装置10は、これらハードウェア要素を備えるコンピュータの一例である。これらハードウェア要素は、バス67に接続され、バス67を介して相互にデータ通信可能である。   FIG. 2 shows an example of the hardware configuration of the training data creation support apparatus 10. As shown in FIG. 2, the training data creation support device 10 includes a CPU (Central Processing Unit) 61, a ROM (Read Only Memory) 62, a RAM (Random Access Memory) 63, a storage device 64, a network interface 65, and a portable type. A hardware element such as a storage medium drive 66 is provided. The training data creation support apparatus 10 is an example of a computer that includes these hardware elements. These hardware elements are connected to a bus 67 and can communicate data with each other via the bus 67.

CPU61は、プロセッサの一例である。CPU61は、ROM62あるいはストレージ装置64からリードしたプログラムをRAM63にロードして実行する。このCPU61は、それに替え、Micro−Processing Unit(MPU)やDigital Signal Processor(DSP)、その他の処理回路であってもよい。   The CPU 61 is an example of a processor. The CPU 61 loads the program read from the ROM 62 or the storage device 64 to the RAM 63 and executes it. Instead of this, the CPU 61 may be a micro-processing unit (MPU), a digital signal processor (DSP), or other processing circuit.

ROM62は、BIOS(Basic Input/Output System)やUEFI(Unified Extensible Firmware Interface)などの基本プログラムやそのプログラムの実行の際に使用される各種データを格納する。   The ROM 62 stores basic programs such as BIOS (Basic Input / Output System) and UEFI (Unified Extended Firmware Interface), and various data used when executing the programs.

RAM63は、プログラムや各種データを一時的に格納する揮発性メモリである。RAM63は、CPU61によるプログラムの実行の際にワークエリアとして利用される。   The RAM 63 is a volatile memory that temporarily stores programs and various data. The RAM 63 is used as a work area when the CPU 61 executes a program.

ストレージ装置64は、例えばHard Disk Drive(HDD)やSolid State Drive(SSD)である。ストレージ装置64は、不揮発性記憶装置であることが好ましい。   The storage device 64 is, for example, a hard disk drive (HDD) or a solid state drive (SSD). The storage device 64 is preferably a nonvolatile storage device.

ネットワークインタフェース65は、ネットワークを介して他の装置と通信可能とするために、訓練データ作成支援装置10をネットワークに接続する通信回路である。ネットワーク・インタフェース・カード(NIC)は、ネットワークインタフェース65の一例である。   The network interface 65 is a communication circuit that connects the training data creation support apparatus 10 to the network so that it can communicate with other apparatuses via the network. A network interface card (NIC) is an example of the network interface 65.

可搬型記憶媒体用ドライブ66は、可搬型記憶媒体68にアクセスするためのデバイスである。可搬型記憶媒体用ドライブ66は、上位装置(例えばCPU61)からのコマンドに基づき、可搬型記憶媒体68へのデータライトや可搬型記憶媒体68からのデータリードを行う。可搬型記憶媒体68は、例えば、コンパクトディスク(CD)やDVD(Digital Versatile Disc)などの光ディスク、Universal Serial Bus(USB)メモリ、フレキシブル・ディスク(FD)、光磁気ディスク(MO)、磁気テープ、である。   The portable storage medium drive 66 is a device for accessing the portable storage medium 68. The portable storage medium drive 66 performs data write to the portable storage medium 68 and data read from the portable storage medium 68 based on commands from the host device (for example, the CPU 61). The portable storage medium 68 includes, for example, an optical disc such as a compact disc (CD) and a DVD (Digital Versatile Disc), a universal serial bus (USB) memory, a flexible disc (FD), a magneto-optical disc (MO), a magnetic tape, It is.

ストレージ装置64や可搬型記憶媒体68は、コンピュータ読み取り可能な記憶媒体の一例である。   The storage device 64 and the portable storage medium 68 are examples of computer-readable storage media.

本発明の訓練データ作成支援プログラムは、例えばストレージ装置64に格納される。CPU61(訓練データ作成支援装置10の一例であるコンピュータ)は、ストレージ装置64から訓練データ作成支援プログラムをリードしてRAM63にロードし、訓練データ作成支援プログラムを実行する。これによって、訓練データ作成支援プログラムの各処理が実行され、訓練データ作成支援装置10の各機能が実現される。なお、訓練データ作成支援プログラムは、ROM62や可搬型記憶媒体68に格納されるものであってもよい。その場合、CPU61は、訓練データ作成支援プログラムが格納されている記憶媒体に適宜アクセスして訓練データ作成支援プログラムを取得し、実行すればよい。   The training data creation support program of the present invention is stored in the storage device 64, for example. The CPU 61 (a computer that is an example of the training data creation support apparatus 10) reads the training data creation support program from the storage device 64, loads it into the RAM 63, and executes the training data creation support program. Thereby, each process of the training data creation support program is executed, and each function of the training data creation support apparatus 10 is realized. The training data creation support program may be stored in the ROM 62 or the portable storage medium 68. In that case, CPU61 should just access the storage medium in which the training data creation assistance program is stored, acquire a training data creation assistance program, and run it.

図2における各ハードウェア要素と図1における各機能の対応関係の一例は次の通りである。   An example of the correspondence between each hardware element in FIG. 2 and each function in FIG. 1 is as follows.

CPU61は、図1における分類器生成部14、判定部15および分類処理部16の一例である。   The CPU 61 is an example of the classifier generation unit 14, the determination unit 15, and the classification processing unit 16 in FIG.

また、ROM62、ストレージ装置64、可搬型記憶媒体用ドライブ66あるいは可搬型記憶媒体68は、図1における第1記憶部11の一例である。   The ROM 62, the storage device 64, the portable storage medium drive 66, or the portable storage medium 68 is an example of the first storage unit 11 in FIG.

また、ROM62、RAM63、ストレージ装置64、可搬型記憶媒体用ドライブ66あるいは可搬型記憶媒体68は、図1における第2記憶部12の一例である。   The ROM 62, RAM 63, storage device 64, portable storage medium drive 66, or portable storage medium 68 is an example of the second storage unit 12 in FIG.

また、ネットワークインタフェース65、CPU61は、図1における受信部13、送信部17の一例である。   The network interface 65 and the CPU 61 are examples of the receiving unit 13 and the transmitting unit 17 in FIG.

また、液晶ディスプレイ、プラズマディスプレイまたは有機ELディスプレイ等の図2において不図示の表示装置は、出力部18の一例である。   A display device (not shown) such as a liquid crystal display, a plasma display, or an organic EL display is an example of the output unit 18.

次に、本実施形態における、訓練データ作成支援装置10による訓練データ作成支援方法について説明する。   Next, a training data creation support method by the training data creation support device 10 in this embodiment will be described.

図3は、訓練データ作成支援装置による訓練データ作成支援方法の一例を示すフローチャートである。   FIG. 3 is a flowchart illustrating an example of a training data creation support method by the training data creation support device.

まず、受信部13は、各端末装置30から各作業者によって作成された訓練データを受信する(S101)。受信部13は、各作業者が端末装置30から訓練データを訓練データ作成支援装置10宛に送信することにより、作業者毎に作成された訓練データを受信できる。受信部13は、受信した訓練データを第2記憶部12の訓練データDBに格納する。   First, the receiving unit 13 receives training data created by each worker from each terminal device 30 (S101). The receiving unit 13 can receive training data created for each worker by each worker transmitting training data from the terminal device 30 to the training data creation support device 10. The receiving unit 13 stores the received training data in the training data DB of the second storage unit 12.

なお、事前に各作業者には、付与対象文書と、付与するラベルの候補が配布されている。付与対象文書は作業者毎に異なるものが配布され、付与するラベルの候補は作業者共通である。このとき、各作業者に配布される付与対象文書は、複数個であることが好ましい。その個数は、生成する訓練データの総数や作業者の総数、各作業者の希望などに応じて適宜決定されればよいが、いずれの作業者も一定数以上あることが好ましい。これらの事前配布は、訓練データ作成支援装置10によって行われてもよいし、たとえば作業監督者が各作業者にメールで送信するなど他の手段で行われてもよい。   Note that a document to be given and a candidate for a label to be given are distributed to each worker in advance. Different documents to be assigned are distributed for each worker, and candidate labels to be given are common to the workers. At this time, it is preferable that a plurality of documents to be distributed are distributed to each worker. The number may be appropriately determined according to the total number of training data to be generated, the total number of workers, the desires of each worker, etc., but it is preferable that all workers have a certain number or more. These pre-distributions may be performed by the training data creation support apparatus 10, or may be performed by other means such as a work supervisor sending to each worker by e-mail.

各作業者は、配布された付与対象文書に対し、定められたラベル候補のいずれかを付与して、訓練データを作成する。受信部13は、各作業者によって作成されたこれらの訓練データを受信する。   Each worker assigns one of the defined label candidates to the distributed grant target document, and creates training data. The receiving unit 13 receives these training data created by each worker.

図4は、訓練データDBの一例を示す。図4に示すように、訓練データDBは、作業者、ラベル、文書ID、および付与対象文書の各フィールドを有する。各訓練データは、レコードとして訓練データDBに登録される。   FIG. 4 shows an example of the training data DB. As illustrated in FIG. 4, the training data DB includes fields for an operator, a label, a document ID, and a grant target document. Each training data is registered in the training data DB as a record.

訓練データDBにおけるフィールド「作業者」は、付与対象文書にラベルを付与した作業者を示す。すなわち、フィールド「作業者」は、訓練データを作成した作業者を示す。このフィールドには、作業者を示す識別情報が登録される。   The field “worker” in the training data DB indicates a worker who has given a label to the assignment target document. That is, the field “worker” indicates the worker who created the training data. In this field, identification information indicating the worker is registered.

フィールド「ラベル」は、作業対象となる文書に付与されたラベルを示す。付与対象文書を作業者に配布する際にラベルの候補も通知されており、このフィールドの内容は、作業者が付与対象文書の内容を基に候補の中から該当すると判断したラベル(付与結果ラベル)である。   The field “label” indicates a label given to the document to be worked. Label candidates are also notified when the document to be granted is distributed to the worker, and the contents of this field are the labels that the worker has determined to be applicable from the candidates based on the content of the document to be granted (grant result label). ).

フィールド「文書ID」は、ラベル付与対象文書の識別情報を示す。この文書IDによって、個々の文書が識別される。本実施形態では、互いに異なる付与対象文書が各作業者に配布される。つまり、訓練データDB内にて各訓練データの文書IDはユニークなものとなる。   A field “document ID” indicates identification information of a document to be labeled. Each document is identified by this document ID. In this embodiment, different grant target documents are distributed to each worker. That is, the document ID of each training data is unique in the training data DB.

フィールド「付与対象文書」は、フィールド「文書ID」の識別情報に対応する文書であり、作業者に作業対象として配布したラベル付与対象文書の内容を示す。   The field “assignment target document” is a document corresponding to the identification information of the field “document ID”, and indicates the contents of the label assignment target document distributed as a work target to the worker.

このような構造の訓練データDBについて、本実施形態の処理に伴い以下の処理が行われる。   With respect to the training data DB having such a structure, the following processing is performed in accordance with the processing of this embodiment.

例えば、作業者に付与対象文書を配布する際に、配布先の作業者、配布する付与対象文書に基づき訓練データDBのフィールド「作業者」、「文書ID」、「付与対象文書」に情報を登録する。また、作業者から受信した訓練データに含まれる文書IDを基に、その文書IDと一致する訓練データDBのレコードのフィールド「ラベル」に、付与結果であるラベル内容を登録するようにすればよい。   For example, when distributing a grant target document to a worker, information is provided in the fields “worker”, “document ID”, and “grant target document” of the training data DB based on the grant destination document and the grant target document to be distributed. sign up. In addition, based on the document ID included in the training data received from the worker, the label content as the assignment result may be registered in the field “label” of the record of the training data DB that matches the document ID. .

また、例えば、付与対象文書を作業者に配布する際には訓練データDBには何も登録せず、作業者からの訓練データを受信した際に訓練データに含まれる各情報を対応する各フィールドに登録するようにしてもよい。この場合に、付与対象文書に文書IDを付与せずに配布し、訓練データDBへのレコードの追加に応じてフィールド「文書ID」の値を自動インクリメントして文書IDを登録するようにしてもよい。訓練データDBへの情報登録手順は、適宜の方法が採用されればよい。   Also, for example, when distributing the grant target document to the worker, nothing is registered in the training data DB, and each field corresponding to each piece of information included in the training data when receiving training data from the worker You may make it register to. In this case, the document ID may be distributed without giving the document ID to the grant target document, and the document ID may be registered by automatically incrementing the value of the field “document ID” in accordance with the addition of the record to the training data DB. Good. An appropriate method may be employed as the information registration procedure in the training data DB.

図4に示す訓練データDBは、ラベルの候補を「FOOD」と「Not−FOOD」の2つとし、付与対象文書が食べ物に関連するかどうかを各作業者に判断させ、判断結果を基に候補のいずれかをラベル付与させたときの訓練データを例示している。なお、ラベル「FOOD」は付与対象文書が食べ物に関連する場合に付与すべきラベルとし、ラベル「Not−FOOD」は付与対象文書が食べ物に関連しない場合に付与すべきラベルとしている。このように、訓練データDBを参照することにより、どの作業者がどのような付与対象文書に対してどのようなラベルを付与したのかを把握することができる。   The training data DB shown in FIG. 4 has two label candidates, “FOOD” and “Not-FOOD”, and allows each worker to determine whether the grant target document is related to food, and based on the determination result. The training data when labeling any of the candidates is illustrated. It should be noted that the label “FOOD” is a label to be given when the grant target document is related to food, and the label “Not-FOOD” is a label to be given when the grant target document is not related to food. In this way, by referring to the training data DB, it is possible to grasp what label is assigned to what kind of grant target document by which worker.

受信部13による訓練データの受信と訓練データDBへの訓練データの登録が完了した後、判定部15は、ある作業者(以降、判定対象者と呼称する)が作成した訓練データを用いて機械学習により試験的に分類器(分類規則を含む)を生成し、他の作業者(以降、比較対象者と呼称する)に配布された付与対象文書を対象にしたその分類器によるラベル自動付与結果と、比較対象者によるその付与対象文書に対するラベル付与結果との一致度を判定する(図3のS102)。本例では、ある作業者を判定対象者にしたとき、他のすべての作業者を比較対象者とし、作業者の全組み合わせについて、ラベル自動付与結果と作業者によるラベル付与結果との一致度の判定が行われる。また、本例では、ある作業者を判定対象者にしたときに、その作業者を比較対象者ともしている。   After the reception of the training data by the reception unit 13 and the registration of the training data in the training data DB are completed, the determination unit 15 uses the training data created by a certain worker (hereinafter referred to as a determination target person). A classifier (including classification rules) is generated on a trial basis by learning, and the automatic label assignment result by the classifier for the assignment target document distributed to other workers (hereinafter referred to as comparison target persons) And the degree of coincidence with the label assignment result for the given document by the comparison subject (S102 in FIG. 3). In this example, when a certain worker is set as a judgment target, all other workers are set as comparison targets, and the degree of coincidence between the automatic label assignment result and the label assignment result by the worker for all combinations of workers. A determination is made. In this example, when a certain worker is set as a determination target person, the worker is also set as a comparison target person.

判定対象者の訓練データを基に生成した分類器によるラベル付与結果と比較対象者によるラベル付与結果が著しく相違する場合、判定対象者の作業技能が低いために訓練データの質が悪く、分類器が適切なラベル付与を行えないか、もしくは、比較対象者の作業技能が低いために分類器が付与した適切なラベル付与結果と比較対象者によるラベル付与結果が相違することが考えられる。一方、それらラベル付与結果が一致またはある閾値以上に類似する場合、判定対象者と比較対象者ともに一定の技能水準を満たしていることが考えられる。作業者の全組み合わせについてラベル付与結果の一致度を判定することにより、結果の偏りから、確認対象者と模範作業者を発見することができる。確認対象者および模範作業者の説明は後述される。以下に、一致度の判定処理について説明する。   If the labeling result by the classifier generated based on the training data of the judgment subject is significantly different from the labeling result by the comparison subject, the quality of the training data is poor because the judgment subject's work skills are low, and the classifier May not be able to perform proper labeling, or because the comparison target person's work skill is low, the appropriate labeling result given by the classifier and the labeling result by the comparison target person may be different. On the other hand, if these labeling results match or are similar to a certain threshold value or more, it is considered that both the determination target person and the comparison target person satisfy a certain skill level. By determining the degree of coincidence of label assignment results for all combinations of workers, it is possible to find the person to be confirmed and the model worker from the result bias. The description of the person to be confirmed and the model worker will be described later. Hereinafter, the determination process for the degree of coincidence will be described.

図5は、一致度の判定処理の一例を示すフローチャートである。   FIG. 5 is a flowchart illustrating an example of the matching degree determination process.

まず、判定部15は、第2記憶部12に格納されている訓練データDBを検索し、判定対象者を選択する(S201)。例えば、判定部15は、訓練データDBのレコード順に従って、先頭レコードから最終レコードまでの各レコードにおけるフィールド「作業者」を基に、未だ選択されていない作業者を判定対象者として選択すればよい。   First, the determination unit 15 searches the training data DB stored in the second storage unit 12 and selects a determination target person (S201). For example, the determination unit 15 may select a worker who has not yet been selected as a determination target person based on the field “worker” in each record from the first record to the last record in accordance with the record order of the training data DB. .

続いて、判定部15は、訓練データDBに登録されている、判定対象者によって作成された訓練データを対象とし、分類器生成部14を使用して分類規則を含む分類器を生成する(S202)。分類器生成部14は、例えば決定木やSupport Vector Machinesなど、種々の公知の学習手法を用いて分類器を生成すればよい。生成された分類器は、例えば、第2記憶部12に格納される。   Subsequently, the determination unit 15 targets the training data created by the determination target person registered in the training data DB, and generates a classifier including the classification rule using the classifier generation unit 14 (S202). ). The classifier generation unit 14 may generate a classifier by using various known learning methods such as a decision tree and Support Vector Machines. The generated classifier is stored in the second storage unit 12, for example.

図6は、分類規則の一例を示す。図6に示すように、分類規則は、分類器による処理に使用されるものであり、例えば、条件とラベルの対応情報を含む規則データである。条件は、例えば文字列(キーワード)とその出現位置に関する情報を含む。ラベルは、条件に合致する内容を含む文書に対して付与するラベルを示す。分類器は、このような分類規則を使い、例えば対象文書の内容と条件を比較し、対象文書の内容が条件に合致する場合に、その条件に対応するラベルを対象文書に付与する。なお、図6は、図4に例示する作業者Aによって作成された訓練データを基に生成された分類規則の例を示す。   FIG. 6 shows an example of the classification rule. As shown in FIG. 6, the classification rule is used for processing by the classifier, and is, for example, rule data including correspondence information between conditions and labels. The condition includes, for example, information on a character string (keyword) and its appearance position. The label indicates a label to be given to a document including content that matches the conditions. The classifier uses such a classification rule, for example, compares the content of the target document with a condition, and gives a label corresponding to the condition to the target document when the content of the target document matches the condition. FIG. 6 shows an example of a classification rule generated based on training data created by the worker A illustrated in FIG.

判定部15は、続いて、第2記憶部12に格納されている訓練データDBの中から比較対象者を選択する(S203)。例えば、判定部15は、訓練データDBのレコード順に従って、先頭レコードから最終レコードまでの各レコードにおけるフィールド「作業者」を基に、比較対象者として未だ選択されていない作業者を選択すればよい。なお、本例では、前述のように判定対象者と同一の作業者を比較対象者としても選定している。   Subsequently, the determination unit 15 selects a comparison target person from the training data DB stored in the second storage unit 12 (S203). For example, the determination unit 15 may select a worker who has not yet been selected as a comparison target person based on the field “worker” in each record from the first record to the last record in accordance with the record order of the training data DB. . In this example, as described above, the same worker as the determination target person is also selected as the comparison target person.

そして、判定部15は、分類処理部16に対して、生成された分類器と比較対象者の通知と共にラベル付与を指示する。分類処理部16は、通知された分類器を用いて、通知された比較対象者に作業対象として配布された付与対象文書の各々にラベルを自動付与する(S204)。分類処理部16は、訓練データDBの中から、比較対象者として選択された作業者の識別情報がフィールド「作業者」に登録されたレコードを特定し、特定されたレコードにおけるフィールド「付与対象文書」に登録されている文書を対象に、分類器を用いてラベルを自動付与する。例えば、分類処理部16は、訓練データDBのレコード順に従って、先頭レコードから最終レコードまでの各レコードの中から該当レコードを順次特定し、ラベルを自動付与する。この処理に関連して判定作業用DBが利用され、判定対象者と分類器によるラベル付与結果、比較対象者と比較対象者によるラベル付与結果などが判定作業用DBに登録される。また、分類器によるラベル付与結果と比較対象者によるラベル付与結果との比較判定結果も判定作業用DBに登録される。この判定作業用DBは、例えば第2記憶部12に格納される。以下に、判定作業用DBについて説明する。   Then, the determination unit 15 instructs the classification processing unit 16 to give a label together with the generated classifier and the notification of the comparison target person. The classification processing unit 16 automatically assigns a label to each of the assignment target documents distributed as work targets to the notified comparison target person using the notified classifier (S204). The classification processing unit 16 identifies the record in which the identification information of the worker selected as the comparison target person is registered in the field “worker” from the training data DB, and the field “grant target document” in the identified record. The label is automatically given to the documents registered in "" using the classifier. For example, the classification processing unit 16 sequentially identifies corresponding records from among the records from the first record to the last record in accordance with the record order of the training data DB, and automatically assigns a label. The determination work DB is used in association with this processing, and the label assignment results by the determination target person and the classifier, the label assignment results by the comparison target person and the comparison target person, and the like are registered in the determination work DB. In addition, a comparison determination result between the label assignment result by the classifier and the label assignment result by the person to be compared is also registered in the determination work DB. This determination work DB is stored in, for example, the second storage unit 12. The determination work DB will be described below.

図7は、判定作業用DBの一例を示す。図7に示すように、判定作業用DBは、判定結果、比較対象者、比較対象者によるラベル付与結果、判定対象者、分類器によるラベル付与結果、文書IDおよび付与対象文書の各フィールドを有する。   FIG. 7 shows an example of the determination work DB. As shown in FIG. 7, the determination work DB includes fields for a determination result, a comparison target, a label assignment result by the comparison target, a determination target person, a label assignment result by a classifier, a document ID, and a grant target document. .

判定作業用DBにおけるフィールド「判定結果」は、フィールド「比較対象者によるラベル付与結果」とフィールド「分類器によるラベル付与結果」の比較結果を示す。例えば、フィールド「判定結果」の値が「1」の場合、フィールド「比較対象者によるラベル付与結果」とフィールド「分類器によるラベル付与結果」の内容が一致することを示す。また、例えば、その値が「0」の場合、フィールド「比較対象者によるラベル付与結果」とフィールド「分類器によるラベル付与結果」の内容が不一致であることを示す。   The field “determination result” in the determination work DB indicates a comparison result between the field “label application result by the comparison target” and the field “label application result by the classifier”. For example, when the value of the field “judgment result” is “1”, it indicates that the contents of the field “labeling result by the comparison target” and the field “labeling result by the classifier” match. For example, if the value is “0”, it indicates that the contents of the field “labeling result by comparison target” and the field “labeling result by classifier” do not match.

フィールド「比較対象者」は、図5のS203の処理において選択された比較対象者である作業者の識別情報を示す。このフィールドには、分類処理部16によって特定された訓練データDBのレコードにおけるフィールド「作業者」の内容が登録される。   The field “comparison target” indicates identification information of the worker who is the comparison target selected in the process of S203 of FIG. In this field, the content of the field “worker” in the record of the training data DB specified by the classification processing unit 16 is registered.

フィールド「比較対象者によるラベル付与結果」は、後述するフィールド「文書ID」で示される付与対象文書を対象にした比較対象者によるラベル付与結果を示す。このフィールドには、分類処理部16によって特定された訓練データDBのレコードにおけるフィールド「ラベル」の内容が登録される。   The field “label assignment result by comparison target person” indicates the label assignment result by the comparison target person for the assignment target document indicated by the field “document ID” described later. In this field, the content of the field “label” in the record of the training data DB specified by the classification processing unit 16 is registered.

フィールド「判定対象者」は、図5のS201の処理において選択され、図5のS202における分類器の生成に訓練データが利用された判定対象者である作業者の識別情報を示す。このフィールドには、図5のS204の処理である分類器を用いた分類処理部16によるラベルの自動付与に伴い、判定対象者である作業者の識別情報が登録される。   The field “determination target person” indicates identification information of an operator who is selected in the process of S201 in FIG. 5 and who is a determination target person who has used training data for generating the classifier in S202 of FIG. In this field, the identification information of the worker who is the determination target is registered in accordance with the automatic label assignment by the classification processing unit 16 using the classifier, which is the processing of S204 in FIG.

フィールド「分類器によるラベル付与結果」は、図5のS204の処理において分類処理部16によって生成された処理結果を示す。つまり、分類器を用いた分類処理部16の処理によって、フィールド「文書ID」で示される付与対象文書に自動付与されたラベルを示す。   The field “Labeling result by classifier” indicates the processing result generated by the classification processing unit 16 in the processing of S204 of FIG. That is, the label automatically given to the assignment target document indicated by the field “document ID” by the processing of the classification processing unit 16 using the classifier is shown.

フィールド「文書ID」は、フィールド「比較対象者によるラベル付与結果」で示されるラベルが付与された付与対象文書の文書IDを示す。このフィールドには、分類処理部16によって特定された訓練データDBのレコードにおけるフィールド「文書ID」の内容が登録される。   The field “document ID” indicates the document ID of the assignment target document to which the label indicated by the field “label assignment result by comparison target person” is assigned. In this field, the content of the field “document ID” in the record of the training data DB identified by the classification processing unit 16 is registered.

フィールド「付与対象文書」は、フィールド「文書ID」で示される文書IDに対応する付与対象文書の内容を示す。このフィールドには、分類処理部16によって特定された訓練データDBのレコードにおけるフィールド「文書ID」に対応するフィールド「付与対象文書」の内容が登録される。   The field “assignment target document” indicates the content of the assignment target document corresponding to the document ID indicated by the field “document ID”. In this field, the content of the field “assignment target document” corresponding to the field “document ID” in the record of the training data DB identified by the classification processing unit 16 is registered.

以上の各フィールドに、分類処理部16によって、訓練データDB内にて特定したレコードの内容および判定結果が登録される。   The contents of the record specified in the training data DB and the determination result are registered in the above fields by the classification processing unit 16.

なお、図7に例示される判定作業用DB内の3つのレコードは次のことを示す。   The three records in the determination work DB illustrated in FIG. 7 indicate the following.

この3つのレコードのうち先頭レコードおよび2番目のレコードは、判定対象者として作業者Aが選択され、比較対象者として作業者Bが選択されたときの、作業者Aが作成した訓練データを基に生成された分類器によるラベルの自動付与結果と、作業者Bが作成した訓練データに含まれる付与対象文書に作業者Bにより付与されたラベル付与結果との比較結果を示す。   Of the three records, the first record and the second record are based on training data created by the worker A when the worker A is selected as the determination target person and the worker B is selected as the comparison target person. The comparison result of the automatic label assignment result by the classifier generated in FIG. 5 and the label assignment result given by the worker B to the assignment target document included in the training data created by the worker B is shown.

作業者Bは、文書IDが101および102の付与対象文書に対してそれぞれ「FOOD」のラベルを付与したことを示す。それに対し、それら文書に対し、作業者Aが作成した訓練データを基に生成された分類器は、図6に例示する分類規則を用いて、それぞれ「FOOD」のラベルを自動付与したことを示す。   The worker B indicates that the label “FOOD” is assigned to the assignment target documents whose document IDs are 101 and 102, respectively. On the other hand, the classifiers generated based on the training data created by the worker A for these documents indicate that the labels “FOOD” have been automatically assigned using the classification rules illustrated in FIG. 6. .

3番目のレコードは、判定対象者として作業者Aが選択され、比較対象者として作業者Cが選択されたときの、作業者Aが作成した訓練データを基に生成された分類器によるラベルの自動付与結果と、作業者Cが作成した訓練データに含まれる付与対象文書に作業者Cにより付与されたラベル付与結果との比較結果を示す。   The third record is a label generated by the classifier generated based on the training data created by the worker A when the worker A is selected as the determination target and the worker C is selected as the comparison target. The comparison result of the automatic grant result and the label grant result given by the worker C to the grant target document included in the training data created by the worker C is shown.

作業者Cは文書IDが201の付与対象文書に対して作業者Cは「FOOD」のラベルを付与したことを示す。それに対し、その文書に対し、作業者Aが作成した訓練データを基に生成された分類器は、図6に例示する分類規則を用いて、「Not−FOOD」のラベルを自動付与したことを示す。   The worker C indicates that the worker C has given the label “FOOD” to the assignment target document whose document ID is 201. On the other hand, the classifier generated based on the training data created by the worker A for the document is automatically assigned the “Not-FOOD” label using the classification rule illustrated in FIG. Show.

以上の比較の結果、文書IDが101および102の付与対象文書には同じラベルが付与されたことからフィールド「判定結果」に値「1」が登録され、文書IDが103の付与対象文書には異なるラベルが付与されたことからフィールド「判定結果」に値「0」が登録されたことを示す。   As a result of the above comparison, since the same label is assigned to the assignment target documents having the document IDs 101 and 102, the value “1” is registered in the field “judgment result”, and the assignment target document having the document ID 103 is registered. Since a different label is given, it indicates that the value “0” is registered in the field “judgment result”.

判定部15は、図5のS204の処理での分類処理部16による処理の後、訓練データDBの中で比較対象者として未選択の作業者が存在するか否かを判定する(図5のS205)。   The determination unit 15 determines whether or not there is an unselected worker as a comparison target in the training data DB after the processing by the classification processing unit 16 in the processing of S204 of FIG. 5 (FIG. 5). S205).

比較対象者として未選択の作業者が存在する場合(S205;肯定)、判定部15は、S203に戻り、その作業者を比較対象者として選択し、S204の処理を実行する。判定部15は、比較対象者として未選択の作業者が存在しなくなるまで、S203〜S205の処理を繰り返して実行する。一方、比較対象者として未選択の作業者が存在しない場合(S205;否定)、判定部15は、訓練データDBの中で判定対象者として未選択の作業者が存在するか否かを判定する(S206)。   When there is an unselected worker as a comparison target (S205; affirmative), the determination unit 15 returns to S203, selects the worker as a comparison target, and executes the process of S204. The determination unit 15 repeatedly executes the processes of S203 to S205 until there is no unselected worker as a comparison target person. On the other hand, when there is no unselected worker as a comparison target (S205; No), the determination unit 15 determines whether there is an unselected worker as a determination target in the training data DB. (S206).

訓練データDBの中で判定対象者として未選択の作業者が存在する場合(S206;肯定)、判定部15は、S201に戻り、その作業者を判定対象者として選択し、S202〜S205の処理を実行する。判定部15は、未選択の作業者が存在しなくなるまで、S201〜S206の処理を繰り返して実行する。   When there is an unselected worker as a determination target person in the training data DB (S206; affirmative), the determination unit 15 returns to S201, selects the worker as a determination target person, and performs the processes of S202 to S205. Execute. The determination unit 15 repeatedly executes the processes of S201 to S206 until there are no unselected workers.

一方、判定対象者として未選択の作業者が存在しない場合(S206;否定)、判定部15は、分類処理部16によって作成された判定作業用DBを用い、判定対象者と比較対象者の組み合わせ毎に、分類器によるラベルの自動付与結果と、比較対象者によるその付与対象文書へのラベル付与結果との一致度を判定する(図5のS207)。判定部15は、その判定結果である一致度を判定結果DBに格納する。この判定結果DBは、例えば第2記憶部12に格納される。以下に、ラベル付与結果の一致度判定処理について説明する。   On the other hand, when there is no unselected worker as a determination target person (S206; No), the determination unit 15 uses the determination work DB created by the classification processing unit 16 to combine the determination target person and the comparison target person. Every time, the degree of coincidence between the result of automatic label assignment by the classifier and the result of label assignment to the document to be assigned by the comparison subject is determined (S207 in FIG. 5). The determination unit 15 stores the degree of coincidence that is the determination result in the determination result DB. This determination result DB is stored in, for example, the second storage unit 12. In the following, a process for determining the degree of coincidence of label assignment results will be described.

図8は、ラベル付与結果の一致度判定処理の一例を示すフローチャートである。   FIG. 8 is a flowchart illustrating an example of a process for determining the degree of coincidence of label assignment results.

判定部15は、前処理として、カウンタを生成する(S301)。例えば、判定部15は、判定作業用DBの先頭レコードから最終レコードまでの各レコードについて、フィールド「判定対象者」に登録されている作業者の識別情報を基に各判定対象者を特定し、各レコードにおけるフィールド「比較対象者」を基に、判定対象者ごとに各比較対象者を特定して、判定対象者と比較対象者の全組み合わせに対応するカウンタを生成する。   The determination unit 15 generates a counter as preprocessing (S301). For example, the determination unit 15 identifies each determination target person based on the identification information of the worker registered in the field “determination target person” for each record from the first record to the last record of the determination work DB. Based on the field “comparison subject” in each record, each comparison subject is specified for each judgment subject, and a counter corresponding to all combinations of the judgment subject and the comparison subject is generated.

図9は、カウンタの一例を示す。同図は、判定対象者および比較対象者となる作業者が、作業者A、作業者B、作業者Cであるときのカウンタの例を示している。   FIG. 9 shows an example of the counter. The figure shows an example of a counter when the workers who are the judgment subject and the comparison subject are the worker A, the worker B, and the worker C.

図9(a)は、判定作業用DBの中で、フィールド「判定対象者」に登録された識別情報で示される各作業者とフィールド「比較対象者」に登録された識別情報で示される各作業者との組み合わせ毎に、該当するレコードの総数値を保持するカウンタである。同図(a)において、判定対象者と比較対象者の組み合わせ毎のカウンタはTCNT(m,n)で示されており、例えば、TCNT(A,B)は、判定作業用DBの全レコードのうち、判定対象者が作業者Aかつ比較対象者が作業者Bであるレコード総数を示す。   FIG. 9A shows each worker indicated by the identification information registered in the field “determination person” and identification information registered in the field “comparator” in the determination work DB. It is a counter that holds the total number of corresponding records for each combination with the worker. In FIG. 5A, the counter for each combination of the determination target person and the comparison target person is indicated by TCNT (m, n). For example, TCNT (A, B) indicates all records in the determination work DB. Of these, the total number of records in which the determination target person is the worker A and the comparison target person is the worker B is shown.

図9(b)は、判定作業用DBの中で、フィールド「判定対象者」に登録された識別情報で示される各作業者とフィールド「比較対象者」に登録された識別情報で示される各作業者との組み合わせ毎に、その組み合わせに該当するレコードのうちフィールド「判定結果」に値「1」が登録されたレコードの総数値を保持するカウンタである。つまり、同図(b)のカウンタは、同図(a)の判定対象者と比較対象者の組み合わせに対応するカウンタで示される各レコード総数の中のフィールド「判定結果」に値「1」が登録されたレコードの総数を示す。同図(b)において、例えば、MCNT(A,B)は、判定対象者が作業者Aかつ比較対象者が作業者Bである判定作業用DBの全レコードの中でフィールド「判定結果」に値「1」が登録されたレコードの総数を示す。   FIG. 9B illustrates each worker indicated by the identification information registered in the field “determination person” and identification information registered in the field “comparison person” in the determination work DB. For each combination with the worker, the counter holds the total number of records in which the value “1” is registered in the field “judgment result” among the records corresponding to the combination. That is, the counter of FIG. 7B has a value “1” in the field “determination result” in the total number of records indicated by the counter corresponding to the combination of the determination target person and the comparison target person of FIG. Indicates the total number of registered records. In FIG. 5B, for example, MCNT (A, B) is displayed in the field “determination result” in all the records of the determination work DB in which the determination target person is the worker A and the comparison target person is the worker B. The value “1” indicates the total number of registered records.

なお、判定部15は、S301の処理においてカウンタを生成する際に、生成した各カウンタの値を「0」に初期化する。   The determination unit 15 initializes the value of each generated counter to “0” when generating a counter in the process of S301.

判定部15は、カウンタを生成した後、一致度判定処理のメイン処理を行う。このメイン処理において、判定部15は、判定作業用DB内のレコードを選択する(S302)。例えば、判定部15は、判定作業用DBのレコード順に従って、先頭レコードから最終レコードまでの各レコードの中からメイン処理において未だ選択されていないレコードを選択すればよい。本メイン処理においては、前処理において生成された各カウンタが利用される。   After generating the counter, the determination unit 15 performs the main process of the matching degree determination process. In this main process, the determination unit 15 selects a record in the determination work DB (S302). For example, the determination unit 15 may select a record that has not yet been selected in the main process from each record from the first record to the last record in accordance with the record order of the determination work DB. In the main process, each counter generated in the preprocess is used.

続いて、判定部15は、選択されたレコードのフィールド「判定対象者」およびフィールド「比較対象者」にそれぞれ登録されている作業者の識別情報を基に、図9(a)に示されるカウンタの中で判定対象者と比較対象者の組み合わせに対応するカウンタ値(レコード総数値)をインクリメントする(S303)。つまり、現在のレコード総数値に「1」が加算された値が新たなレコード総数値となる。   Subsequently, the determination unit 15 determines the counter shown in FIG. 9A based on the identification information of the workers registered in the field “determination target person” and the field “comparison target person” of the selected record. In step S303, the counter value (total number of records) corresponding to the combination of the determination target person and the comparison target person is incremented. That is, a value obtained by adding “1” to the current total number of records becomes a new total number of records.

続いて、判定部15は、選択したレコードにおける判定結果が「1」であるか否か判定する(S304)。判定結果が「1」の場合(S304;肯定)、判定部15は、選択したレコードにおけるフィールド「判定対象者」および「比較対象者」にそれぞれ登録されている作業者の識別情報を基に、図9(b)に示されるカウンタの中で判定対象者と比較対象者の組み合わせに対応するカウンタ値(一致総数値)をインクリメントする(S305)。   Subsequently, the determination unit 15 determines whether or not the determination result in the selected record is “1” (S304). When the determination result is “1” (S304; affirmative), the determination unit 15 uses the identification information of the workers registered in the fields “determination target person” and “comparison target person” in the selected record, respectively. In the counter shown in FIG. 9B, the counter value (total number of matches) corresponding to the combination of the determination target person and the comparison target person is incremented (S305).

判定部15は、前述の処理の後、または、判定結果が「1」でない場合(S304;否定)、メイン処理において判定作業用DBの中で未選択のレコードが存在するか否かを判定する(S306)。   The determination unit 15 determines whether or not an unselected record exists in the determination work DB in the main process after the above-described processing or when the determination result is not “1” (No in S304). (S306).

未選択のレコードが存在する場合(S306;肯定)、判定部15は、S302に戻り、そのレコードを選択し、S303〜S305の処理を実行する。判定部15は、メイン処理において未選択のレコードが存在しなくなるまで、S302〜S306の処理を繰り返して実行する。一方、未選択のレコードが存在しない場合(S306;否定)、判定部15は、前述処理で得られたレコード総数値と一致総数値を基に一致度を算出する。判定部15は、例えば、図9(b)で示される判定対象者と比較対象者の組み合わせ毎の各カウンタ値(一致総数値)を図9(a)で示される判定対象者と比較対象者の組み合わせ毎の各カウンタ値(レコード総数値)で除算して、レコード総数値に対する一致総数値の割合(パーセンテージ)を求め、それを一致度とすればよい。判定部15は、その一致度に関連する判定対象者および比較対象者を基に、判定結果DBのレコードおよびフィールドを特定し、算出した一致度を登録する(S307)。   When there is an unselected record (S306; affirmative), the determination unit 15 returns to S302, selects the record, and executes the processes of S303 to S305. The determination unit 15 repeatedly executes the processes of S302 to S306 until there are no unselected records in the main process. On the other hand, when there is no unselected record (S306; No), the determination unit 15 calculates the degree of coincidence based on the record total value and the match total value obtained by the above-described processing. The determination unit 15 determines, for example, each counter value (total number of matches) for each combination of the determination target person and the comparison target person shown in FIG. 9B and the determination target person and the comparison target person shown in FIG. By dividing by each counter value (total number of records) for each combination, a ratio (percentage) of the total number of matching values to the total number of records may be obtained and used as the degree of matching. The determination unit 15 identifies a record and a field of the determination result DB based on the determination target person and the comparison target person related to the matching degree, and registers the calculated matching degree (S307).

図10は、判定結果DBの一例を示す。図10に示すように、判定結果DBは、各作業者対応のレコードを含む。また、各レコードは、各作業者対応のフィールドを有する。図10の例においては、レコードを判定対象者対応とし、フィールドを比較対象者対応として示している。   FIG. 10 shows an example of the determination result DB. As illustrated in FIG. 10, the determination result DB includes a record corresponding to each worker. Each record has a field corresponding to each worker. In the example of FIG. 10, the record is shown as corresponding to the determination target person, and the field is shown as corresponding to the comparison target person.

例えば、図10において、先頭レコードは、作業者A、BおよびCの作成した訓練データに含まれるそれぞれの付与対象文書を対象にして、作業者Aが作成した訓練データを基に生成した分類器を用いてラベルの自動付与を行ったラベル付与結果と、各作業者A、BおよびCがそれぞれ付与したラベル付与結果との一致度を示す。この例では、作業者Aの作成した訓練データに含まれる付与対象文書については、この分類器によるラベルの自動付与結果と作業者Aによるラベルの付与結果の一致度が100%であることを示す。また、作業者Bの作成した訓練データに含まれる付与対象文書については、この分類器によるラベルの自動付与結果と作業者Bによるラベルの付与結果の一致度が85%であることを示す。また、作業者Cの作成した訓練データに含まれる付与対象文書については、この分類器によるラベルの自動付与結果と作業者Cによるラベルの付与結果の一致度が50%であることを示す。   For example, in FIG. 10, the first record is a classifier generated based on the training data created by the worker A for each grant target document included in the training data created by the workers A, B, and C. The degree of coincidence between the label application result obtained by automatically applying the label using the label and the label application result provided by each of the workers A, B and C is shown. In this example, for the document to be included included in the training data created by the worker A, the degree of coincidence between the automatic label assignment result by the classifier and the label assignment result by the worker A is 100%. . In addition, regarding the document to be added included in the training data created by the worker B, the degree of coincidence between the automatic label assignment result by the classifier and the label assignment result by the worker B is 85%. Further, for the document to be included included in the training data created by the worker C, the degree of coincidence between the automatic label assignment result by the classifier and the label assignment result by the worker C is 50%.

これらの処理を行った後、判定部15は、図5に示すフローチャートの処理を終了する。以上により、一致度の判定処理が行われ、その判定結果を示す判定結果DBが構築される。   After performing these processes, the determination unit 15 ends the process of the flowchart shown in FIG. As described above, the degree-of-match determination process is performed, and a determination result DB indicating the determination result is constructed.

次に、判定部15は、確認対象者および模範作業者を抽出する(図3のS103)。以下に、確認対象者および模範作業者の抽出方法について説明する。   Next, the determination unit 15 extracts a confirmation target person and an exemplary worker (S103 in FIG. 3). Hereinafter, a method for extracting the confirmation target person and the model worker will be described.

図11は、模範作業者および確認対象者の抽出処理の一例を示すフローチャートである。   FIG. 11 is a flowchart illustrating an example of the extraction process of the model worker and the confirmation target person.

判定部15は、図10に示す判定結果DBを参照し、判定対象者を選択する(S401)。例えば、判定部15は、判定結果DBのレコード順に従って、本処理において未だ選択されていない判定対象者を選択すればよい。   The determination unit 15 refers to the determination result DB illustrated in FIG. 10 and selects a determination target person (S401). For example, the determination unit 15 may select a determination target person who has not yet been selected in this process according to the record order of the determination result DB.

続いて、判定部15は、S401の処理によって選択された判定対象者に対応する一致度のデータを判定結果DBから取得する(S402)。例えば、判定部15は、判定結果DBから、選択された判定対象者に対する全比較対象者の一致度のデータを抽出する。   Subsequently, the determination unit 15 acquires data of the matching degree corresponding to the determination target person selected by the process of S401 from the determination result DB (S402). For example, the determination unit 15 extracts data on the degree of coincidence of all comparison target persons with respect to the selected determination target person from the determination result DB.

続いて、判定部15は、抽出した一致度のデータをもとに、選択された判定対象者が確認対象者か否かを判定する(S403)。例えば、判定部15は、S402によって抽出された全ての一致度データ数(比較対象者数)と、抽出された全ての一致度データの中の一致度の基準値以下の一致度データ数とをそれぞれ計数する。そして、判定部15は、抽出された全ての一致度データ数に対する、一致度の基準値以下の一致度データ数の割合を算出する。判定部15は、算出された割合が所定閾値を超えるか否かを判定し、所定閾値を超える場合は、選択された判定対象者を確認対象者と判定する。この一致度の基準値および所定閾値は、期待するラベル付与の確度に応じて適宜の値が予め設定されればよい。ここで、所定閾値は、基準値以下割合の判別に用いられる閾値である。   Subsequently, the determination unit 15 determines whether or not the selected determination target person is a confirmation target person based on the extracted data of coincidence (S403). For example, the determination unit 15 calculates the number of all coincidence data extracted in S402 (the number of persons to be compared) and the number of coincidence data below the reference value of the coincidence among all the extracted coincidence data. Count each. Then, the determination unit 15 calculates the ratio of the number of coincidence data that is equal to or less than the reference value of the coincidence with respect to all the extracted coincidence data. The determination unit 15 determines whether or not the calculated ratio exceeds a predetermined threshold value. If the calculated ratio exceeds the predetermined threshold value, the selected determination target person is determined as a confirmation target person. The matching value reference value and the predetermined threshold value may be set in advance according to the expected labeling accuracy. Here, the predetermined threshold value is a threshold value used for determining the ratio below the reference value.

選択された判定対象者が確認対象者であると判定された場合(S403;肯定)、判定部15は、その選択された判定対象者を確認対象者として確認対象者DBに登録する(S404)。確認対象者DBの詳細は後述される。   When it is determined that the selected determination target person is a confirmation target person (S403; affirmative), the determination unit 15 registers the selected determination target person as a confirmation target person in the confirmation target person DB (S404). . Details of the confirmation target person DB will be described later.

一方、選択された判定対象者が確認対象者であると判定されなかった場合(S403;否定)、判定部15は、判定対象者が模範作業者DBに登録されている作業者よりも高い作業技能を有するか否かを判定する(S405)。模範作業者DBには、模範作業者である作業者と、その作業者のスコアが登録されている。模範作業者DBの詳細は後述される。   On the other hand, when it is not determined that the selected determination target person is the confirmation target person (S403; No), the determination unit 15 performs a work in which the determination target person is higher than the worker registered in the exemplary worker DB. It is determined whether or not there is a skill (S405). In the model worker DB, a worker who is a model worker and a score of the worker are registered. Details of the model worker DB will be described later.

判定部15は、例えば、模範作業者の判定のために判定結果DBの一致度のデータを用いる。判定部15は、S402によって抽出された一致度の全データの数値を合算し、その合算値を選択された判定対象者のスコアとする。判定部15は、選択された判定対象者のスコアと模範作業者DBに登録されている模範作業者のスコアを比較する。選択された判定対象者のスコアが模範作業者のスコアよりも大きい場合、判定部15は、選択された判定対象者が模範作業者DBに登録されている作業者よりも高い作業技能を有すると判定する。   For example, the determination unit 15 uses data on the degree of coincidence in the determination result DB for the determination of the model worker. The determination unit 15 adds the numerical values of all the data of the degree of coincidence extracted in S402, and uses the total value as the score of the selected determination target person. The determination unit 15 compares the score of the selected determination target person with the score of the model worker registered in the model worker DB. When the score of the selected determination target person is larger than the score of the model worker, the determination unit 15 has a higher work skill than the worker registered in the model worker DB. judge.

選択された判定対象者が模範作業者DBに登録されている作業者よりも高い作業技能を有すると判定された場合(S405;肯定)、判定部15は、模範作業者DBを更新する(S406)。判定部15は、現在の選択された判定対象者を示す識別情報とそのスコアとを用いて、模範作業者DBの作業者情報とスコア情報を更新する。   When it is determined that the selected determination target person has a higher work skill than the worker registered in the exemplary worker DB (S405; affirmative), the determination unit 15 updates the exemplary worker DB (S406). ). The determination unit 15 updates the worker information and the score information in the exemplary worker DB using the identification information indicating the currently selected determination target person and the score thereof.

一方、選択された判定対象者が模範作業者DBに登録されている作業者よりも高い作業技能を有すると判定されなかった場合(S405;否定)、もしくは、S404にて選択された判定対象者を確認対象者DBに登録した場合、判定部15は、判定結果DBの中で判定対象者として未選択の作業者が存在するか否かを判定する(S407)。   On the other hand, when it is not determined that the selected determination target person has a higher work skill than the worker registered in the exemplary worker DB (S405; No), or the determination target person selected in S404 Is registered in the confirmation target person DB, the determination unit 15 determines whether or not there is an unselected worker as a determination target person in the determination result DB (S407).

判定結果DBの中で未選択の判定対象者が存在する場合(S407;肯定)、判定部15は、S401に戻り、その判定対象者を選択し、S402〜S406の処理を実行する。判定部15は、未選択の判定対象者が存在しなくなるまで、S401〜S407の処理を繰り返して実行する。   When there is an unselected determination target person in the determination result DB (S407; affirmative), the determination unit 15 returns to S401, selects the determination target person, and executes the processes of S402 to S406. The determination unit 15 repeatedly executes the processes of S401 to S407 until there is no unselected determination target person.

一方、未選択の判定対象者が存在しない場合(S407;否定)、判定部15は図11に示すフローチャートの処理を終了する。これらの処理の結果、確認対象者DBには確認対象者となる作業者が登録され、模範作業者DBには訓練データDBに登録されている作業者の中で最も高い作業技能を有すると判定された作業者が模範作業者として登録される。このようにして、確認対象者および模範作業者が抽出される。   On the other hand, when there is no unselected determination target person (S407; No), the determination unit 15 ends the process of the flowchart illustrated in FIG. As a result of these processes, a worker who is a confirmation target person is registered in the confirmation target person DB, and it is determined that the model worker DB has the highest work skill among the workers registered in the training data DB. The registered worker is registered as a model worker. In this way, the confirmation target person and the model worker are extracted.

図12は、確認対象者DBの一例を示す。図12に示すように、確認対象者DBは、確認対象者、一致度、判定結果の各フィールドを有する。確認対象者が複数人となる場合には、各確認対象者に対応するレコードが確認対象者DBに登録される。   FIG. 12 shows an example of the confirmation target person DB. As illustrated in FIG. 12, the confirmation target person DB includes fields for a confirmation target person, a matching degree, and a determination result. When there are a plurality of confirmation subjects, records corresponding to each confirmation subject are registered in the confirmation subject DB.

確認対象者DBにおけるフィールド「確認対象者」は、図11のS403によって確認対象者と判定され図11のS404によって確認対象者DBに登録された判定対象者である作業者の識別情報を示す。   The field “confirmation subject” in the confirmation subject DB indicates identification information of an operator who is a judgment subject who is determined as a confirmation subject in S403 of FIG. 11 and registered in the confirmation subject DB in S404 of FIG.

フィールド「一致度」は、模範作業者と判定された作業者に対して配布し訓練データを取得した付与対象文書を対象に、模範作業者によるラベル付与結果と確認対象者と判定された判定作業者である作業者によるラベル付与結果との一致度を示す。   The field “matching degree” is for the assignment target document that was distributed to the worker who was determined to be a model worker and acquired training data, and the determination work that was determined to be the confirmation result person and the label assignment result by the model worker The degree of coincidence with the label assignment result by the worker who is a worker is shown.

フィールド「判定結果」は、フィールド「一致度」の値が所定閾値以上であるか否かを示す。例えば、フィールド「一致度」の値が所定閾値以上であれば値「1」が登録される。また、例えば、フィールド「一致度」の値が所定閾値に達しない場合は値「0」が登録される。この値は、対応レコードのフィールド「確認対象者」に登録されている作業者が確認対象者と最終認定されるか否かも示す。例えば、値が「0」の場合は、対応レコードのフィールド「確認対象者」に登録されている作業者は確認対象者と最終認定される。   The field “determination result” indicates whether or not the value of the field “matching degree” is equal to or greater than a predetermined threshold value. For example, if the value of the field “degree of matching” is equal to or greater than a predetermined threshold, the value “1” is registered. Further, for example, when the value of the field “degree of matching” does not reach a predetermined threshold value, the value “0” is registered. This value also indicates whether or not the worker registered in the field “confirmation target person” of the corresponding record is finally recognized as the confirmation target person. For example, when the value is “0”, the worker registered in the field “person to be confirmed” of the corresponding record is finally recognized as the person to be confirmed.

なお、フィールド「一致度」および「判定結果」は、後述する図14の処理において利用される。これらフィールドについては、その処理説明において詳述される。   The fields “matching degree” and “judgment result” are used in the process of FIG. 14 described later. These fields will be described in detail in the processing description.

例えば、図10に示す判定結果DBの例では、前述のように、判定作業者として作業者A、BおよびCの一致度に関するレコードが登録されている。一致度の基準値を50%とし、この図10に示す判定結果DBを例にすると、作業者Aについては3個のデータ(100%、85%、50%)のうち1個のデータが一致度の基準値以下であり、作業者Bについては3個のデータ(85%、100%、30%)のうち1個のデータが一致度の基準値以下であり、作業者Cについては3個のデータ(10%、10%、90%)のうち2個のデータが一致度の基準値以下である。   For example, in the example of the determination result DB illustrated in FIG. 10, as described above, records relating to the degree of coincidence of the workers A, B, and C are registered as determination workers. When the reference value of the coincidence is 50% and the determination result DB shown in FIG. 10 is taken as an example, for the worker A, one of the three data (100%, 85%, 50%) matches. Of the three data (85%, 100%, 30%) for the worker B, one of the data is less than the reference value of the matching degree, and three for the worker C Of the data (10%, 10%, 90%) are less than the reference value of the degree of coincidence.

例えば、図11のS403における判定の基準値以下割合の所定閾値を50%とすると、作業者Aについては33%(全3個のうち1個のデータ)、作業者Bについては33%(全3個のうち1個のデータ)、作業者Cについては67%(全3個のうち2個のデータ)となり、図11のS403の処理によって作業者Cが確認対象者と判定され、確認対象者DBに登録される。   For example, if the predetermined threshold value of the ratio below the reference value for determination in S403 in FIG. 11 is 50%, the worker A is 33% (one data out of all three), and the worker B is 33% (all 1 data out of 3) and 67% for worker C (2 data out of all 3), the operator C is determined as a confirmation target by the process of S403 in FIG. Registered in the user DB.

なお、図10に示す判定結果DBのなかのデータのうち比較対象者が判定対象者と同一の作業者の場合のデータを除外して確認対象者の判定を行ってもよい。また、図5のS203の比較対象者の選択処理の際に、判定対象者と同一の作業者を比較対象者として選択しないようにしてもよい。いずれの場合も、同様のデータが確認対象者の判定に使われることになり、図10に示す判定結果DBを例にすると、次のデータが確認対象者の判定処理に使われることになる。   The determination target person may be determined by excluding data in the determination result DB illustrated in FIG. 10 when the comparison target person is the same worker as the determination target person. Further, the same worker as the determination target person may not be selected as the comparison target person in the comparison target person selection process in S203 of FIG. In either case, the same data is used for the determination of the person to be confirmed. Taking the determination result DB shown in FIG. 10 as an example, the following data is used for the determination process for the person to be confirmed.

作業者Aについては2個のデータ(85%(作業者B対応)、50%(作業者C対応))が使われる。一致度の基準値を前述と同様に50%とすると、この場合、2個のデータのうち1個のデータが一致度の基準値以下である。また、作業者Bについては2個のデータ(85%(作業者A対応)、30%(作業者C対応))が使われる。この場合、2個のデータのうち1個のデータが一致度の基準値以下である。また、作業者Cについては2個のデータ(10%(作業者A対応)、10%(作業者B対応))が使われる。この場合、2個のデータのうち2個のデータが一致度の基準値以下である。   For worker A, two pieces of data (85% (for worker B) and 50% (for worker C)) are used. Assuming that the reference value of the coincidence is 50% as described above, in this case, one of the two data is less than or equal to the reference value of the coincidence. For worker B, two pieces of data (85% (for worker A) and 30% (for worker C)) are used. In this case, one of the two pieces of data is equal to or less than the reference value of the matching degree. For worker C, two pieces of data (10% (for worker A) and 10% (for worker B)) are used. In this case, two of the two pieces of data are equal to or less than the reference value of the matching degree.

例えば、図11のS403における判定の基準値以下割合の所定閾値を前述と同様に50%とすると、作業者Aについては50%(全2個のうち1個のデータ)、作業者Bについては50%(全2個のうち1個のデータ)、作業者Cについては100%(全2個のうち2個のデータ)となり、図11のS403の処理によって、基準値以下割合の所定閾値である50%を超える作業者Cが確認対象者と判定され、確認対象者DBに登録される。   For example, if the predetermined threshold value of the ratio below the reference value for determination in S403 in FIG. 11 is 50% as described above, the worker A is 50% (one data out of two), and the worker B is 50% (1 data out of all 2) and 100% for worker C (2 out of 2 data), and the processing of S403 in FIG. A worker C exceeding 50% is determined as a confirmation target person and registered in the confirmation target person DB.

図13は、模範作業者DBの一例を示す。図13に示すように、模範作業者DBは、模範作業者、スコアの各フィールドを有する。   FIG. 13 shows an example of the model worker DB. As illustrated in FIG. 13, the model worker DB includes model worker and score fields.

模範作業者DBにおけるフィールド「模範作業者」は、図11のS405の処理によって、図10に示す判定結果DBに登録されている作業者(判定作業者)の中で最も高い作業技能を持っていると判定される作業者の識別情報を示す。   The field “exemplary worker” in the exemplary worker DB has the highest work skill among the workers (determination workers) registered in the determination result DB shown in FIG. 10 by the processing of S405 in FIG. The identification information of the worker determined to be present.

フィールド「スコア」は、図11のS405の処理によって計算された、フィールド「模範作業者」に登録された作業者のスコアを示す。   The field “score” indicates the score of the worker registered in the field “exemplary worker” calculated by the process of S405 of FIG.

例えば、図10に示す判定結果DBおよび図12に示す確認対象者DBを例にすると、判定結果DBに判定作業者として登録されている作業者A、BおよびCのうち、作業者Cは図11のS403の処理によって確認対象者と判定され、模範作業者候補から除外される。残った作業者AおよびBについて、図11のS405の処理では作業者Aのスコアは235(100+85+50)と計算され、作業者Bのスコアは215(85+100+30)と計算される。これによって、図11のS406の処理によって、作業者AとBのうちスコアが大きい作業者Aの識別情報とスコアが模範作業者DBに登録される。   For example, taking the determination result DB shown in FIG. 10 and the confirmation target person DB shown in FIG. 12 as an example, among the workers A, B, and C registered as determination workers in the determination result DB, the worker C is a figure. 11 is determined as a confirmation target person and is excluded from the exemplary worker candidates. For the remaining workers A and B, the score of worker A is calculated as 235 (100 + 85 + 50) and the score of worker B is calculated as 215 (85 + 100 + 30) in the process of S405 of FIG. Accordingly, the identification information and the score of the worker A having the highest score among the workers A and B are registered in the exemplary worker DB by the process of S406 in FIG.

図3の処理の説明に戻る。判定部15は、図3のS103の処理において確認対象者が抽出されたか否かを判定する(図3のS104)。判定部15は、例えば、確認対象者DBを検索し、確認対象者DBに確認対象者となる作業者の情報が登録されているか否かを判定する。確認対象者DBに作業者の情報が登録されている場合(S104;肯定)、判定部15は、その作業者の作業技能が所定水準に達しているか否かを判定する(S105)。   Returning to the description of the processing in FIG. The determination unit 15 determines whether or not a confirmation target person has been extracted in the process of S103 of FIG. 3 (S104 of FIG. 3). For example, the determination unit 15 searches the confirmation target person DB and determines whether or not the information of the worker who is the confirmation target person is registered in the confirmation target person DB. When the worker information is registered in the confirmation target person DB (S104; affirmative), the determination unit 15 determines whether or not the worker's work skill has reached a predetermined level (S105).

前述の通り、確認対象者は、その作業技能が所定水準に達していない疑いがある作業者である。作業者の作業技能が所定の水準に達していないのか、それとも担当した付与対象文書側の難易度が高く、その作業者が一時的に適切なラベル付与を行えなかったのかを判断するために、別の付与対象文書を用いてその作業者の作業技能レベルを判定する。ここで、S103の処理において作業技能が最も優れていると判定された模範作業者は、付与対象文書に対し適切なラベルを付与している可能性が高いと考えられるので、S101で模範作業者から受信した訓練データ中の付与対象文書をここでの確認対象者の作業技能判定に用いる。以下に、確認対象者の作業技能が所定の水準に達しているか否かを判定する方法について説明する。   As described above, the person to be confirmed is a worker who is suspected of having not reached a predetermined level in the work skill. In order to judge whether the worker's work skill has not reached the predetermined level, or whether the assignment target document he was in charge of has a high degree of difficulty, and the worker has not been able to temporarily assign an appropriate label. The work skill level of the worker is determined using another grant target document. Here, since it is considered that the model worker determined to have the best work skill in the process of S103 is likely to give an appropriate label to the grant target document, the model worker in S101. The document to be assigned in the training data received from is used to determine the work skill of the person to be confirmed here. A method for determining whether or not the work skill of the person to be confirmed has reached a predetermined level will be described below.

図14は、確認対象者の技能判定処理の一例を示すフローチャートである。   FIG. 14 is a flowchart illustrating an example of the skill determination process for the person to be confirmed.

まず、判定部15は、模範作業者の作成した訓練データ中の付与対象文書を確認対象者に送信する(S501)。例えば、訓練データ作成支援装置10の判定部15は、模範作業者DBにアクセスし模範作業者を特定する。そして、判定部15は、訓練データDBに登録されたレコードの中からその模範作業者が作成した訓練データの付与対象文書を特定する。その後、判定部15は、特定した付与対象文書を確認対象者(端末装置30)宛に、送信部17を利用して送信する。なお、この付与対象文書と共にラベルの候補も確認対象者に送信される。ラベルの候補は、確認対象者全員に同じものが配布され、確認対象者が以前作成した訓練データ(図3のS101の処理で受信される訓練データ)とも同一のラベル候補である。   First, the determination unit 15 transmits the grant target document in the training data created by the model worker to the verification target person (S501). For example, the determination unit 15 of the training data creation support apparatus 10 accesses the model worker DB and identifies the model worker. And the determination part 15 specifies the assignment | providing object document of the training data which the model worker created from the records registered into training data DB. Thereafter, the determination unit 15 transmits the specified grant target document to the person to be confirmed (terminal device 30) using the transmission unit 17. A candidate for a label is also transmitted to the person to be confirmed together with the document to be given. The same label candidates are distributed to all the confirmation target persons, and are the same label candidates as the training data previously created by the verification target person (training data received in the process of S101 in FIG. 3).

判定部15は、このように確認対象者に付与対象文書を送付することに伴い、模範作業者、送付した付与対象文書、確認対象者の各情報を確認対象者判定用DBに登録する。また、判定部15は、模範作業者に対して作業対象として配布した付与対象文書を特定した際に、その付与対象文書に対して模範作業者が付与したラベル付与結果を訓練データDBから取得し、確認対象者判定用DBに登録する。   As the determination unit 15 sends the grant target document to the check target person in this way, the determination unit 15 registers each information of the model worker, the sent grant target document, and the check target person in the check target determination DB. In addition, when the determination unit 15 identifies the grant target document distributed as the work target to the model worker, the determination unit 15 acquires the label assignment result given by the model worker to the grant target document from the training data DB. Then, it is registered in the confirmation target person determination DB.

確認対象者は、上述のように配布された付与対象文書とラベルの候補を受け取り、受け取った各付与対象文書にラベルを付与し訓練データを作成する。そして、確認対象者は、作成した訓練データを端末装置30から訓練データ作成支援装置10宛に送信する。   The confirmation target person receives the grant target document and the label candidate distributed as described above, assigns a label to each received grant target document, and creates training data. Then, the person to be confirmed transmits the created training data from the terminal device 30 to the training data creation support device 10.

訓練データ作成支援装置10の受信部13は、端末装置30から送信された確認対象者の作成した訓練データを受信する(S502)。受信部13は、受信した訓練データを第2記憶部12の確認対象者判定用DBに格納する。受信部13は、確認対象者判定用DBへ訓練データを格納する際に、訓練データの文書ID、確認対象者の情報を基に、確認対象者判定用DBを検索して対応レコードを特定し、そのレコードに訓練データ内のラベル付与結果を登録する。なお、本訓練データは、確認対象者判定用のものであり、訓練データDBには追加しない。   The receiving unit 13 of the training data creation support apparatus 10 receives the training data created by the person to be confirmed transmitted from the terminal device 30 (S502). The receiving unit 13 stores the received training data in the confirmation target person determination DB in the second storage unit 12. When storing the training data in the confirmation target person determination DB, the receiving unit 13 searches the confirmation target person determination DB based on the training data document ID and the information on the confirmation target person, and identifies the corresponding record. In this record, the labeling result in the training data is registered. In addition, this training data is for confirmation object person determination, and is not added to training data DB.

続いて、判定部15は、受信部13による訓練データの受信と確認対象者判定用DBへの訓練データの登録が完了した後、確認対象者判定用DB内の各レコードにおける確認対象者によるラベル付与結果と模範作業者によるラベル付与結果の一致判定を行う(S503)。以下に、確認対象者判定用DBとラベル付与結果の一致判定処理について説明する。   Subsequently, after the reception of the training data by the receiving unit 13 and the registration of the training data in the confirmation target person determination DB are completed, the determination unit 15 labels the confirmation target person in each record in the confirmation target person determination DB. A determination is made as to whether the application result matches the label application result by the model worker (S503). In the following, a process for determining a match between a verification target person determination DB and a label assignment result will be described.

図15は確認対象者判定用DBの一例を示す。図15に示すように、確認対象者判定用DBは、判定結果、模範作業者、模範作業者によるラベル付与結果、確認対象者、確認対象者によるラベル付与結果、文書ID、付与対象文書の各フィールドを有する。   FIG. 15 shows an example of a confirmation target person determination DB. As illustrated in FIG. 15, the confirmation target person determination DB includes each of a determination result, a model worker, a label assignment result by the model worker, a confirmation target person, a label assignment result by the confirmation target person, a document ID, and a grant target document. Has a field.

確認対象者判定用DBにおけるフィールド「判定結果」は、フィールド「模範作業者によるラベル付与結果」とフィールド「確認対象者によるラベル付与結果」の比較結果を示す。例えば、フィールド「判定結果」の値が「1」の場合、フィールド「模範作業者によるラベル付与結果」とフィールド「確認対象者によるラベル付与結果」の内容が一致することを示す。また、例えば、その値が「0」の場合、フィールド「模範作業者によるラベル付与結果」とフィールド「確認対象者によるラベル付与結果」の内容が不一致であることを示す。   The field “determination result” in the confirmation target person determination DB indicates a comparison result between the field “label application result by the exemplary worker” and the field “label application result by the confirmation target person”. For example, when the value of the field “determination result” is “1”, it indicates that the contents of the field “label application result by the exemplary worker” and the field “label application result by the confirmation target person” match. Further, for example, when the value is “0”, it indicates that the contents of the field “label application result by the model worker” and the field “label application result by the confirmation target person” do not match.

フィールド「模範作業者」は、図3のS103の処理において決定された模範作業者である作業者の識別情報を示す。従って、この模範作業者は、図13の模範作業者DBに登録されている作業者でもある。   The field “exemplary worker” indicates identification information of the worker who is the exemplary worker determined in the process of S103 of FIG. Therefore, this model worker is also a worker registered in the model worker DB of FIG.

フィールド「模範作業者によるラベル付与結果」は、後述するフィールド「文書ID」で示される付与対象文書を対象にした模範作業者によるラベル付与結果を示す。   The field “label assignment result by the model worker” indicates the label assignment result by the model worker for the document to be assigned indicated by the field “document ID” described later.

フィールド「確認対象者」は、図3のS103の処理において確認対象者DBに登録された作業者の識別情報を示す。   The field “confirmation target person” indicates the identification information of the worker registered in the confirmation target person DB in the process of S103 of FIG.

フィールド「確認対象者によるラベル付与結果」は、図14のS501の処理において後述するフィールド「文書ID」で示される付与対象文書を確認対象者に送信し、図14のS502の処理によって受信された、確認対象者によって付与対象文書に対して付与されたラベルを示す。   The field “result of label assignment by the person to be confirmed” is received by the process of S502 of FIG. 14 by transmitting the document to be given indicated by the field “document ID” described later in the process of S501 of FIG. The label given to the grant target document by the person to be checked is shown.

フィールド「文書ID」は、図14のS501の処理において作業対象として確認対象者に送信したラベル付与対象文書の識別情報を示し、図14のS502の処理によって確認対象者から受信した、確認対象者によってラベル付与された対象文書を示す。   The field “document ID” indicates the identification information of the label assignment target document transmitted to the confirmation target person as the work target in the process of S501 in FIG. 14, and the confirmation target person received from the confirmation target person in the process of S502 in FIG. The target document labeled with is shown.

フィールド「付与対象文書」は、フィールド「文書ID」の識別情報に対応する文書であり、確認対象者に作業対象として配布したラベル付与対象文書の内容を示す。   The field “assignment target document” is a document corresponding to the identification information of the field “document ID”, and indicates the contents of the label assignment target document distributed as a work target to the confirmation target person.

この確認対象者判定用DBにおいて、フィールド「模範作業者によるラベル付与結果」、「文書ID」および「付与対象文書」には、図4に示す訓練データDBにおいて、フィールド「作業者」の情報が模範作業者の識別情報であるレコードの、フィールド「ラベル」、「文書ID」および「付与対象文書」に登録されている内容が登録(転記)される。   In the confirmation target person determination DB, the fields “Label assignment result by model worker”, “Document ID”, and “Grant target document” include information on the field “worker” in the training data DB shown in FIG. The contents registered in the fields “Label”, “Document ID”, and “Granting document” of the record that is the identification information of the model worker are registered (transcribed).

図16は、ラベル付与結果の一致判定処理の一例を示すフローチャートである。   FIG. 16 is a flowchart illustrating an example of a label determination result match determination process.

判定部15は、確認対象者判定用DB内のレコードを選択する(S601)。例えば、判定部15は、確認対象者判定用DBのレコード順に従って、未だ選択されていないレコードを選択すればよい。   The determination unit 15 selects a record in the confirmation target person determination DB (S601). For example, the determination unit 15 may select a record that has not yet been selected in accordance with the record order of the confirmation target person determination DB.

続いて、判定部15は、選択したレコードについて、フィールド「確認対象者によるラベル付与結果」とフィールド「模範作業者によるラベル付与結果」にそれぞれ登録されている内容を基に、確認対象者によるラベル付与結果と模範作業者によるラベル付与結果が一致するか否かを判定する(S602)。確認対象者によるラベル付与結果と模範作業者によるラベル付与結果が一致する場合(S602;肯定)、判定部15は判定結果として選択レコードのフィールド「判定結果」に値「1」を格納する(S603)。一方、確認対象者によるラベル付与結果と模範作業者によるラベル付与結果が一致しない場合(S602;否定)、判定部15は判定結果として選択レコードのフィールド「判定結果」に値「0」を格納する(S604)。   Subsequently, the determination unit 15 labels the selected record based on the contents registered in the field “result of labeling by the person to be confirmed” and the field “result of labeling by the model worker”, respectively. It is determined whether or not the application result matches the label application result by the model worker (S602). When the result of label assignment by the person to be confirmed matches the result of label assignment by the model worker (S602; Yes), the determination unit 15 stores the value “1” in the field “determination result” of the selected record as the determination result (S603). ). On the other hand, if the result of labeling by the person to be confirmed does not match the result of labeling by the exemplary worker (S602; No), the determination unit 15 stores the value “0” in the field “determination result” of the selected record as the determination result. (S604).

判定部15は、前述のようにして確認対象者と模範作業者によるラベル付与結果の一致判定を行い、判定結果を確認対象者判定用DBに格納した後、確認対象者判定用DBの中で未だ選択されていないレコードが存在するか否かを判定する(S605)。   As described above, the determination unit 15 determines whether the confirmation target person and the model worker match the labeling result, stores the determination result in the confirmation target person determination DB, and then determines whether the confirmation target person determination DB stores the determination result. It is determined whether there is a record that has not yet been selected (S605).

未選択のレコードが存在する場合(S605;肯定)、判定部15は、S601に戻り、そのレコードを選択し、S602〜S604の処理を実行する。判定部15は、未選択のレコードが存在しなくなるまで、S601〜S605の処理を繰り返して実行する。一方、未選択のレコードが存在しない場合(S605;否定)、判定部15は、図16に示すフローチャートの処理を終了する。   When there is an unselected record (S605; affirmative), the determination unit 15 returns to S601, selects the record, and executes the processes of S602 to S604. The determination unit 15 repeatedly executes the processing of S601 to S605 until there are no unselected records. On the other hand, when there is no unselected record (S605; No), the determination unit 15 ends the process of the flowchart illustrated in FIG.

次に、判定部15は、確認対象者DBの中から、ある確認対象者を選択する(図14のS504)。以降、このように確認対象者DBの中から選択される確認対象者を、確認判定対象者と呼称する。例えば、判定部15は、確認対象者DBのレコード順に従って、未選択の確認対象者を確認判定対象者として選択すればよい。   Next, the determination unit 15 selects a certain confirmation target person from the confirmation target person DB (S504 in FIG. 14). Hereinafter, the confirmation target person thus selected from the confirmation target person DB is referred to as a confirmation determination target person. For example, the determination unit 15 may select an unselected confirmation target person as the confirmation determination target person in accordance with the record order of the confirmation target person DB.

そして、判定部15は、確認判定対象者によるラベル付与結果と模範作業者によるラベル付与結果との一致度を算出する(S505)。以下に、ラベル付与結果の一致度判定処理について説明する。   Then, the determination unit 15 calculates the degree of coincidence between the label application result by the confirmation determination target person and the label application result by the model worker (S505). In the following, a process for determining the degree of coincidence of label assignment results will be described.

図17は、ラベル付与結果の一致度判定処理の一例を示すフローチャートである。   FIG. 17 is a flowchart illustrating an example of a process for determining a matching degree of a label addition result.

判定部15は、確認対象者判定用DB内のレコードを選択する(S701)。例えば、判定部15は、確認対象者判定用DBのレコード順に従って、未だ選択されていないレコードを選択すればよい。なお、後述するレコード総数値および一致総数値はここで値「0」に初期化されればよい。   The determination unit 15 selects a record in the confirmation target person determination DB (S701). For example, the determination unit 15 may select a record that has not yet been selected in accordance with the record order of the confirmation target person determination DB. Note that a record total value and a matching total value, which will be described later, may be initialized to a value “0” here.

続いて、判定部15は、選択したレコードに登録されている訓練データを作成した確認対象者が確認判定対象者か否かを判定する(S702)。確認対象者が確認判定対象者である場合(S702;肯定)、判定部15は、レコード総数値をインクリメントする(S703)。つまり、現在のレコード総数値に1が加算された値が新たなレコード総数値となる。   Subsequently, the determination unit 15 determines whether the confirmation target person who created the training data registered in the selected record is a confirmation determination target person (S702). When the confirmation target person is the confirmation determination target person (S702; affirmative), the determination unit 15 increments the record total value (S703). That is, a value obtained by adding 1 to the current total number of records becomes a new total number of records.

続いて、判定部15は、選択したレコードにおけるフィールド「判定結果」の値が「1」であるか否か判定する(S704)。フィールド「判定結果」の値が「1」の場合(S704;肯定)、判定部15は、一致総数値をインクリメントする(S705)。   Subsequently, the determination unit 15 determines whether or not the value of the field “determination result” in the selected record is “1” (S704). When the value of the field “determination result” is “1” (S704; affirmative), the determination unit 15 increments the total number of matches (S705).

判定部15は、前述の処理の後、または、確認対象者が確認判定対象者ではないと判定された場合(S702;否定)、または、フィールド「判定結果」の値が「1」ではない場合(S704;否定)、確認対象者判定用DBの中で未選択のレコードが存在するか否かを判定する(S706)。   When the determination unit 15 determines that the person to be confirmed is not the person to be confirmed after the above-described processing (S702; negative), or the value of the field “determination result” is not “1”. (S704; No), it is determined whether or not there is an unselected record in the confirmation target person determination DB (S706).

未選択のレコードが存在する場合(S706;肯定)、判定部15は、S701に戻り、そのレコードを選択し、S702〜S705の処理を実行する。判定部15は、未選択のレコードが存在しなくなるまで、S701〜S706の処理を繰り返して実行する。一方、未選択のレコードが存在しない場合(S706;否定)、判定部15は、レコード総数値と一致総数値を基に一致度を算出する。判定部15は、例えば、一致総数値をレコード総数値で除算して、レコード総数値に対する一致総数値の割合(パーセンテージ)を求め、それを一致度とすればよい。判定部15は、算出した一致度を図12の確認対象者DBにおける確認判定対象者とされた確認対象者に対応するレコードのフィールド「一致度」に登録する(S707)。判定部15は、確認対象者DBにおけるフィールド「確認対象者」の内容が現在の確認判定対象者である作業者の識別情報と一致するレコードを求め、そのレコードのフィールド「一致度」に算出した一致度を登録する。   When there is an unselected record (S706; affirmative), the determination unit 15 returns to S701, selects the record, and executes the processing of S702 to S705. The determination unit 15 repeatedly executes the processes of S701 to S706 until there are no unselected records. On the other hand, when there is no unselected record (S706; No), the determination unit 15 calculates the degree of coincidence based on the record total value and the match total value. For example, the determination unit 15 may divide the total number of matches by the total number of records to obtain a ratio (percentage) of the total number of matches to the total number of records, and use this as the degree of match. The determination unit 15 registers the calculated degree of coincidence in the field “coincidence” of the record corresponding to the confirmation target person as the confirmation determination target person in the confirmation target person DB of FIG. 12 (S707). The determination unit 15 obtains a record in which the content of the field “confirmation target person” in the confirmation target person DB matches the identification information of the worker who is the current confirmation determination target person, and calculates the record in the field “matching degree”. Register the degree of coincidence.

以上のようにして判定対象者によるラベル付与結果と模範作業者によるラベル付与結果の一致度が求められ、判定部15は、その一致度が一致度の基準値を超えるか否かを判定する(図14のS506)。一致度の基準値は、期待する作業技能水準に応じて適宜の値が設定されればよい。   As described above, the degree of coincidence between the labeling result by the person to be judged and the labeling result by the exemplary worker is obtained, and the judging unit 15 judges whether or not the degree of coincidence exceeds the reference value of the degree of coincidence ( S506 in FIG. An appropriate value may be set as the reference value for the degree of coincidence according to the expected work skill level.

一致度が一致度の基準値を超えると判定された場合(S506;肯定)、判定部15は、確認対象者DBにおける確認判定対象者とされた確認対象者に対応するレコードのフィールド「判定結果」に値「1」を格納する(S507)。一方、一致度が一致度の基準値以下の場合(S506;否定)、判定部15は、確認対象者DBにおける確認判定対象者とされた確認対象者に対応するレコードのフィールド「判定結果」に値「0」を格納する(S508)。このように確認対象者DBにおいて、フィールド「判定結果」に値「1」が格納された確認対象者は、その作業技能が所定の水準を満たしていると判定されたことを示し、フィールド「判定結果」に「0」が格納された確認対象者は、その作業技能が所定の水準を満たしていないと判定されたことを示す。   When it is determined that the degree of coincidence exceeds the reference value of the degree of coincidence (S506; affirmative), the determination unit 15 determines the field “determination result of the record corresponding to the confirmation target person as the confirmation determination target person in the confirmation target person DB. The value “1” is stored in “” (S507). On the other hand, when the degree of coincidence is equal to or less than the reference value of the degree of coincidence (S506; No), the determination unit 15 sets the field “determination result” of the record corresponding to the confirmation target person as the confirmation determination target person in the confirmation target person DB. The value “0” is stored (S508). Thus, in the confirmation target person DB, the confirmation target person whose value “1” is stored in the field “determination result” indicates that the work skill has been determined to satisfy the predetermined level, and the field “determination” The confirmation target person with “0” stored in the “result” indicates that the work skill is determined not to satisfy the predetermined level.

判定部15は、前述のようにして判定対象者として選択された各確認対象者の作業技能の判定を行い、判定結果を確認対象者DBに格納した後、確認対象者DBの中で確認判定対象者として未選択の確認対象者(レコード)が存在するか否かを判定する(S509)。   The determination unit 15 determines the work skill of each confirmation target person selected as the determination target person as described above, stores the determination result in the confirmation target person DB, and then confirms the determination in the confirmation target person DB. It is determined whether there is an unselected confirmation target person (record) as the target person (S509).

未選択の確認作業者が存在する場合(S509;肯定)、判定部15は、S504に戻り、その確認作業者を確認判定対象者として選択し、S505〜S508の処理を実行する。判定部15は、未選択の確認作業者が存在しなくなるまで、S504〜S509の処理を繰り返して実行する。一方、判定部15は、未選択の確認対象者が存在しない場合(S509;否定)、判定部15は、確認対象者の作業技能判定処理が完了したものと判定し、図3のS106の処理に移行する。判定部15は、図3のS105による処理に基づき判定結果を出力する(S106)。また、確認対象者DBに作業者の情報が登録されていない場合も(S104;否定)、判定部15は、その結果をS106の処理において出力する。   When there is an unselected confirmation worker (S509; affirmative), the determination unit 15 returns to S504, selects the confirmation worker as a confirmation determination target person, and executes the processing of S505 to S508. The determination unit 15 repeatedly executes the processes of S504 to S509 until there is no unselected confirmation worker. On the other hand, when there is no unselected confirmation target person (S509; No), the determination part 15 determines that the work skill determination process of the confirmation target person is completed, and the process of S106 of FIG. Migrate to The determination part 15 outputs a determination result based on the process by S105 of FIG. 3 (S106). Also, when the worker information is not registered in the confirmation target person DB (S104; No), the determination unit 15 outputs the result in the process of S106.

例えば、判定部15は、判定結果として、確認対象者DBにおいてフィールド「判定結果」の値が「0」である作業者のリストを出力すればよい。このようにして出力されたリストは、作業技能が所定水準に達していないと判定される作業者を示す。また、判定部15は、判定結果として、確認対象者DBの内容そのものを出力してもよい。訓練データ作成支援装置10のユーザは、この出力された確認対象者DBの内容を基に、フィールド「判定結果」の値が「0」の作業者を作業技能が所定水準に達していない作業者として判断できる。さらに、判定部15は、判定結果として、作業者のリストとあわせて、該当する作業者が作成した訓練データの内容を出力してもよい。訓練データDBから、フィールド「作業者」の内容が該当する作業者の識別情報であるレコードを出力すればよい。訓練データ作成支援装置10のユーザは、出力された訓練データの内容を基に、実際に該当作業者がどのような付与対象文書にどのようなラベルを付与したのかを確認することができ、作業技能が所定水準に達していない作業者かどうかを判断できる。   For example, the determination unit 15 may output a list of workers whose field “determination result” is “0” in the confirmation target person DB as the determination result. The list output in this way indicates workers who are determined that their work skills have not reached a predetermined level. Moreover, the determination part 15 may output the content itself of confirmation subject DB as a determination result. The user of the training data creation support apparatus 10 is a worker whose work skill has not reached a predetermined level for a worker whose field “judgment result” is “0” based on the contents of the output confirmation target person DB. Can be judged. Furthermore, the determination part 15 may output the content of the training data which the corresponding worker produced as a determination result with a list | wrist of a worker. What is necessary is just to output the record which is the identification information of the worker to whom the content of the field "worker" corresponds from training data DB. The user of the training data creation support apparatus 10 can confirm what label is assigned to what grant target document by the corresponding worker based on the content of the output training data, It is possible to determine whether or not the worker has not reached a predetermined level of skill.

本実施形態の処理によれば、訓練データを作成した作業技能が不明の各作業者の中から、その訓練データおよびその訓練データの作成のために配布済みの付与対象文書を使って、作業技能が所定水準に達していないと判定される作業者を特定することができる。そのようにして特定された作業者を除外することで、作業技能が高い作業者が特定され、そのような作業技能の高い作業者だけに訓練データの作成(付与対象文書へのラベル付与)を依頼することができる。そのようにして依頼した作業者からは品質の高い訓練データを入手でき、そのような訓練データを用いれば、文書分類を行うにあたって、分類精度の高い分類器(分類規則)を生成できる。   According to the processing of the present embodiment, the work skill is created using the training data and the grant target document that has been distributed for creating the training data, from among the workers whose work skills are unknown. It is possible to specify an operator who is determined not to reach the predetermined level. By excluding the workers identified in this way, workers with high work skills are identified, and training data is created only for those workers with high work skills (labeling the documents to be assigned). Can be requested. High-quality training data can be obtained from the worker who has so requested, and using such training data, a classifier (classification rule) with high classification accuracy can be generated when document classification is performed.

また、判定部15は、判定結果として、作業者のリストを出力するのではなく、訓練データDBの中から、作業技能が所定水準に達していない作業者によって作成された訓練データを削除し(フィールド「作業者」の内容がそのような作業者の識別情報であるレコードを削除し)、削除後の訓練データDBを出力するようにしてもよい。そのように出力された訓練データDBを用いることで、品質の高い訓練データから分類精度の高い分類器(分類規則)を生成できる。   Further, the determination unit 15 does not output a list of workers as a determination result, but deletes training data created by a worker whose work skill does not reach a predetermined level from the training data DB ( It is also possible to delete the record whose field “worker” is the identification information of such a worker) and output the training data DB after the deletion. By using the training data DB thus output, a classifier (classification rule) with high classification accuracy can be generated from high-quality training data.

なお、判定部15は、訓練データを削除するのではなく、作業技能が所定水準に達していないと判定される作業者によって作成された訓練データを使用不可とした訓練データDBを出力してもよい。例えば、訓練データDBに各訓練データの使用を制御可能とするフィールドを設け、そのフィールドの内容に基づいて使用する訓練データが決定され、決定された訓練データを基に分類器(分類規則)が生成されるようにしてもよい。このような形態でも、前述と同様に分類精度の高い分類器(分類規則)を生成できる。   Note that the determination unit 15 does not delete the training data, but may output the training data DB that disables the training data created by the worker who is determined that the work skill does not reach the predetermined level. Good. For example, a field that makes it possible to control the use of each training data is provided in the training data DB, training data to be used is determined based on the contents of the field, and a classifier (classification rule) is based on the determined training data. It may be generated. Even in such a form, a classifier (classification rule) with high classification accuracy can be generated as described above.

以上のような本実施形態の処理によって特定された作業技能が所定水準に達していない作業者に、その作業者の作業技能を向上させるための教育を実施してもよい。それによって分類精度の高い分類器(分類規則)を生成のための作業者人数を確保できるようになる。   Education for improving a worker's work skill may be provided to a worker whose work skill specified by the process of the present embodiment does not reach a predetermined level. As a result, the number of workers for generating a classifier (classification rule) with high classification accuracy can be secured.

また、本実施形態においては、付与対象文書にラベル付与の作業を実施させる作業者の中から、その作業技能が所定水準に達していない作業者を特定するにあたり、技能判定用の文書を別途用意し各作業者が本来の訓練データ作成作業とは別に技能判定用の文書にラベル付与作業を行うことなく、その特定が可能となる。そのため、技能判定用の文書を準備する工数、および各作業者が技能判定用の文書にラベル付与作業を行う工数が発生することのない簡易な方法で、作業者の作業技能を判定することができる。   In this embodiment, a separate document for skill determination is prepared for identifying a worker whose work skill does not reach a predetermined level from among workers who perform label assignment work on the assignment target document. However, it is possible for each worker to specify the skill determination document without performing the label assignment work separately from the original training data creation work. Therefore, it is possible to determine a worker's work skill by a simple method that does not generate man-hours for preparing a document for skill determination and for each worker to perform labeling work on the document for skill determination. it can.

以上、本実施形態を示したがその変形例を以下に説明する。この変形例は、図3のS103の処理、つまり、図11の処理である確認対象者と模範作業者の抽出処理に関し、そのなかの確認対象者の抽出処理に関する。   Although the present embodiment has been described above, modifications thereof will be described below. This modification relates to the process of S103 in FIG. 3, that is, the extraction process of the confirmation target person and the exemplary worker, which is the process of FIG.

図11の処理において、判定部15は、S402およびS403の処理により、判定結果DBの判定対象者対応のレコードにおける、全比較対象者のデータ数(比較対象者数)に対する、一致度の基準値以下のデータ数の割合を算出し、その割合と基準値以下割合の所定閾値とを比較して確認対象者を判定した。このとき、その割合が所定閾値を超える場合に、判定対象者は確認対象者と判定される。つまり、本実施形態の処理では、ある作業者の作業技能を判定する方法として、その作業者により作成された訓練データを基にして生成した分類器が他の作業により作成された訓練データを正しく分類できるか判定しているものである。   In the processing of FIG. 11, the determination unit 15 performs the processing of S402 and S403, and the reference value of the matching degree with respect to the number of data of all comparison target persons (number of comparison target persons) in the record corresponding to the determination target person in the determination result DB The ratio of the following data numbers was calculated, and the confirmation target person was determined by comparing the ratio with a predetermined threshold value of the ratio below the reference value. At this time, when the ratio exceeds a predetermined threshold, the determination target person is determined to be a confirmation target person. That is, in the processing of this embodiment, as a method for determining the work skill of a certain worker, the classifier generated based on the training data created by the worker correctly corrects the training data created by other work. It is determined whether it can be classified.

この処理に関し、変形例においては、ある作業者の作業技能を判定する方法として、その作業者により作成された訓練データの付与対象文書を対象とし、各作業者により作成された訓練データを基に生成された分類器が正しく分類できるかを判定してもよい。例えば、図11のS402の処理における、判定対象者に対応する一致度のデータを取得する際に、判定部15は、図10に示す判定結果DBから各レコードにおける判定対象者である作業者対応のフィールドのデータを抽出すればよい。   With regard to this processing, in a modified example, as a method for determining the work skill of a certain worker, a training data grant target document created by the worker is targeted, and based on the training data created by each worker. It may be determined whether the generated classifier can be correctly classified. For example, in the process of S402 in FIG. 11, when acquiring the data of the matching degree corresponding to the determination target person, the determination unit 15 handles the worker who is the determination target person in each record from the determination result DB illustrated in FIG. It is sufficient to extract the data of the field.

図10に示す判定結果DBの例では、前述のように、判定作業者として作業者A、BおよびCの一致度が登録されている。この図10に示す判定結果DBでは、作業者Aにより作成された訓練データの付与対象文書を対象に、各作業者A、BおよびCにより作成された訓練データを基に生成された各分類器を用いたときの一致度のデータは、100%(作業者A対応)、85%(作業者B対応)、10%(作業者C対応)の3つである。また、作業者Bにより作成された訓練データの付与対象文書を対象に、各作業者A、BおよびCにより作成された訓練データを基に生成された各分類器を用いたときの一致度のデータは、85%(作業者A対応)、100%(作業者B対応)、10%(作業者C対応)の3つである。また、作業者Cにより作成された訓練データの付与対象文書を対象に、各作業者A、BおよびCにより作成された訓練データを基に生成された各分類器を用いたときの一致度のデータは、50%(作業者A対応)、30%(作業者B対応)、90%(作業者C対応)の3つである。   In the example of the determination result DB shown in FIG. 10, as described above, the degree of coincidence of the workers A, B, and C is registered as the determination worker. In the determination result DB shown in FIG. 10, each classifier generated based on the training data created by each worker A, B, and C for the training data grant target document created by the worker A. The data on the degree of coincidence when using is 100% (corresponding to worker A), 85% (corresponding to worker B), and 10% (corresponding to worker C). In addition, the degree of coincidence when using each classifier generated based on the training data created by each worker A, B, and C for the training data grant target document created by the worker B is used. There are three types of data: 85% (for worker A), 100% (for worker B), and 10% (for worker C). Further, the degree of coincidence when each classifier generated based on the training data created by each worker A, B, and C is used for the training data grant target document created by the worker C. There are three types of data: 50% (corresponding to worker A), 30% (corresponding to worker B), and 90% (corresponding to worker C).

前述の実施形態でのS403の判定処理における一致度の基準値を50%とし、基準値以下割合の所定閾値を50%とすると、基準値以下割合は、作業者Aについては33%(全3個のうち1個が一致度の基準値以下)、作業者Bについては33%(全3個のうち1個が一致度の基準値以下)、作業者Cについては67%(全3個のうち2個が一致度の基準値以下)の各割合となる。この結果、作業者Cに関する割合が基準値以下割合の所定閾値を超えるため、この変形例における確認対象者の抽出処理においては、判定部15は、作業者Cを確認対象者と判定し、確認対象者DBに作業者Cを示す識別情報を登録する。   If the reference value of the degree of coincidence in the determination processing of S403 in the above-described embodiment is 50% and the predetermined threshold value of the ratio below the reference value is 50%, the ratio below the reference value is 33% for the worker A (all 3 One of them is below the reference value for the matching degree), 33% for the worker B (one of all three pieces is below the reference value for the matching degree), 67% for the worker C (all three pieces) Two of them are equal to or less than the reference value of the degree of coincidence). As a result, since the ratio regarding the worker C exceeds a predetermined threshold value of the ratio below the reference value, in the verification target person extraction process in this modification, the determination unit 15 determines the worker C as the verification target person, and confirms The identification information indicating the worker C is registered in the target person DB.

なお、この変形例における模範作業者を抽出するための作業者のスコア(図11のS405の処理)も、この変形例における判定対象者に対応する一致度のデータの取得方法と同様にして、次のように計算すればよい。そして、スコアが最も高い作業者を模範作業者とすればよい。   Note that the worker's score (the process of S405 in FIG. 11) for extracting the model worker in this modified example is also the same as the method for obtaining data of the matching degree corresponding to the determination target person in this modified example. What is necessary is to calculate as follows. Then, the worker with the highest score may be the model worker.

上述のように作業者Cは確認対象者と判定されるため、作業者Aと作業者Bのスコアを計算すればよい。図10に示す判定結果DBでは、作業者Aについてスコアは195(100+85+10)と計算され、作業者Bについてスコアは195(85+100+10)と計算される。このように、スコアが同じ場合は、例えば、同じスコアとなる作業者のうち、先にスコア計算がされた作業者、もしくは最後にスコア計算がされた作業者を模範作業者とすればよい。   As described above, since worker C is determined to be a confirmation subject, the scores of worker A and worker B may be calculated. In the determination result DB shown in FIG. 10, the score for worker A is calculated as 195 (100 + 85 + 10), and the score for worker B is calculated as 195 (85 + 100 + 10). In this way, when the scores are the same, for example, among the workers having the same score, the worker whose score is calculated first or the worker whose score is calculated last may be used as the model worker.

また、他の変形例として、前述の実施形態と前述の変形例を統合して、ある作業者の作業技能を判定するようにしてもよい。例えば、判定部15が、判定結果DBに登録されている、判定対象者として選択された作業者に関するすべての一致度のデータを用い、確認対象者か否かを判定してもよい。つまり、ある作業者対応のレコードの各フィールドのデータおよび各レコードにおけるある作業者対応のフィールドのデータをその判定に用いてもよい。   As another modification, the above-described embodiment and the above-described modification may be integrated to determine the work skill of a certain worker. For example, the determination unit 15 may determine whether or not the person is a confirmation target by using data of all the degrees of coincidence regarding the worker selected as the determination target registered in the determination result DB. That is, data of each field of a record corresponding to a certain worker and data of a field corresponding to a certain worker in each record may be used for the determination.

図10に示す判定結果DBの例では、前述のように、判定作業者として作業者A、BおよびCの一致度が登録されている。この図10に示す判定結果DBでは、作業者Aに関連する一致度のデータは、100%、85%、50%、85%、10%の5つが存在する。また、作業者Bに関連する一致度のデータは、85%、100%、30%、85%、10%の5つが判定結果DBに存在する。また、作業者Cに関連する一致度のデータは、10%、10%、90%、50%、30%の5つが判定結果DBに存在する。   In the example of the determination result DB shown in FIG. 10, as described above, the degree of coincidence of the workers A, B, and C is registered as the determination worker. In the determination result DB shown in FIG. 10, there are five data on the degree of coincidence related to the worker A: 100%, 85%, 50%, 85%, and 10%. Further, there are five pieces of coincidence data related to the worker B, 85%, 100%, 30%, 85%, and 10%, in the determination result DB. Further, there are five pieces of coincidence data related to the worker C: 10%, 10%, 90%, 50%, and 30% in the determination result DB.

前述の実施形態での判定における一致度の基準値を50%とし、基準値以下割合の所定閾値を50%とすると、基準値以下割合は、作業者Aについては40%(全5個のうち2個が一致度の基準値以下)、作業者Bについては40%(全5個のうち2個が一致度の基準値以下)、作業者Cについては60%(全5個のうち3個が一致度の基準値以下)の各割合となる。この結果、作業者Cに関する割合が所定閾値を超えるため、この変形例における確認対象者の抽出処理においては、判定部15は、作業者Cを確認対象者と判定し、確認対象者DBに作業者Cを示す識別情報を登録する。   If the reference value of the degree of coincidence in the determination in the above-described embodiment is 50% and the predetermined threshold value of the ratio below the reference value is 50%, the ratio below the reference value is 40% for the worker A (out of all five). 2 is less than the reference value for matching), 40% for worker B (2 out of all 5 are below the reference value for matching), 60% for worker C (3 out of 5) Is equal to or less than the reference value of the degree of coincidence). As a result, since the ratio regarding the worker C exceeds a predetermined threshold, in the extraction process of the confirmation target person in this modification, the determination unit 15 determines the worker C as the confirmation target person and performs the work in the confirmation target person DB. The identification information indicating the person C is registered.

この変形例においても、模範作業者を抽出するための作業者のスコア(図11のS405の処理)を、この変形例における判定対象者に対応する一致度のデータの取得方法と同様にして、次のように計算すればよい。そして、スコアが最も高い作業者を模範作業者とすればよい。   Also in this modified example, the worker's score for extracting the model worker (the process of S405 in FIG. 11) is set in the same manner as in the method for obtaining the matching degree data corresponding to the determination target person in this modified example. What is necessary is just to calculate as follows. Then, the worker with the highest score may be the model worker.

上述のように作業者Cは確認対象者と判定されるため、作業者Aと作業者Bのスコアを計算すればよい。図10に示す判定結果DBでは、作業者Aについてスコアは330(100+85+50+85+10)と計算され、作業者Bについてスコアは310(85+100+30+85+10)と計算される。従って、この変形例においては、スコアが高い作業者Aが模範作業者と判定される。   As described above, since worker C is determined to be a confirmation subject, the scores of worker A and worker B may be calculated. In the determination result DB illustrated in FIG. 10, the score for worker A is calculated as 330 (100 + 85 + 50 + 85 + 10), and the score for worker B is calculated as 310 (85 + 100 + 30 + 85 + 10). Therefore, in this modification, the worker A having a high score is determined as the model worker.

次に、他の実施形態を説明する。   Next, another embodiment will be described.

図3のS105での確認対象者の作業技能を判定する処理において、確認対象者DBに登録されている作業者の作業技能が所定の水準に達していると判定された場合、図3のS101で受信されたその作業者により作成された訓練データの付与対象文書のなかに、ラベルの付与が難しい文書が含まれていた可能性がある。そこで、本実施形態では、模範作業者に対してそのような付与対象文書へのラベル付与作業を指示する構成を設けている。   In the process of determining the work skill of the confirmation target person in S105 of FIG. 3, when it is determined that the work skill of the worker registered in the confirmation target person DB has reached a predetermined level, S101 of FIG. There is a possibility that a document that is difficult to give a label may be included in the training data grant target document created by the worker received in step (1). Therefore, in the present embodiment, a configuration is provided in which an exemplary worker is instructed to perform such label assignment work on the assignment target document.

図18は、他の実施形態における訓練データ作成支援システムの一例を示す。図18に示すように、訓練データ作成支援システムは、訓練データ作成支援装置100と複数の端末装置30とを有する。訓練データ作成支援装置100と複数の端末装置30とは、ネットワーク50を介して相互に通信可能に接続される。   FIG. 18 shows an example of a training data creation support system according to another embodiment. As illustrated in FIG. 18, the training data creation support system includes a training data creation support device 100 and a plurality of terminal devices 30. The training data creation support device 100 and the plurality of terminal devices 30 are connected via a network 50 so that they can communicate with each other.

訓練データ作成支援装置100は、訓練データの作成を支援する装置である。また、端末装置30は、訓練データを作成する各作業者が利用する端末装置である。端末装置30は、図1と同様である。   The training data creation support device 100 is a device that supports creation of training data. The terminal device 30 is a terminal device used by each worker who creates training data. The terminal device 30 is the same as that in FIG.

訓練データ作成支援装置100は、第1記憶部11、第2記憶部12、受信部13、分類器生成部14、分類処理部16、送信部17、出力部18、判定部19および付与指示部20を備える。訓練データ作成支援装置100において図1に示すデータ作成支援装置10と同様の構成については同一の符号を付し、その機能や処理の各説明を割愛する。また、判定部19は、後述する処理について判定部15と異なり、その他については判定部15と同様の処理を行う。判定部19における判定部15と同様の処理についてはその説明を割愛する。   The training data creation support apparatus 100 includes a first storage unit 11, a second storage unit 12, a reception unit 13, a classifier generation unit 14, a classification processing unit 16, a transmission unit 17, an output unit 18, a determination unit 19, and an assignment instruction unit. 20. In the training data creation support apparatus 100, the same components as those in the data creation support apparatus 10 shown in FIG. 1 are denoted by the same reference numerals, and descriptions of functions and processes thereof are omitted. Also, the determination unit 19 is different from the determination unit 15 in the process described later, and performs the same processing as the determination unit 15 in the other processes. The description of the same processing as that of the determination unit 15 in the determination unit 19 is omitted.

また、訓練データ作成支援装置100は、図2と同様のハードウェア構成であり、訓練データ作成支援装置10と同様の前述の各部は、前述した訓練データ作成支援装置10の各部と同様の各ハードウェア要素に対応する。図18における判定部19および付与指示部20に対応するハードウェア要素は、図2のCPU61がその一例となる。訓練データ作成支援装置100を実現するための訓練データ作成支援プログラムは、前述の実施形態と同様にして実行され、訓練データ作成支援装置100の各機能が実現されるものであればよい。以下に、他の実施形態における、訓練データ作成支援装置100による訓練データ作成支援方法について説明する。   Further, the training data creation support apparatus 100 has the same hardware configuration as that in FIG. 2, and the above-described units similar to the training data creation support apparatus 10 have the same hardware as the units of the training data creation support apparatus 10 described above. Corresponds to the wear element. An example of hardware elements corresponding to the determination unit 19 and the assignment instruction unit 20 in FIG. 18 is the CPU 61 in FIG. 2. The training data creation support program for realizing the training data creation support device 100 may be executed in the same manner as in the above-described embodiment, and any function of the training data creation support device 100 may be realized. Hereinafter, a training data creation support method by the training data creation support apparatus 100 according to another embodiment will be described.

図19は、他の実施形態における訓練データ作成支援装置による訓練データ作成支援方法の一例を示すフローチャートである。図19中、図3と同様の処理については同一の符号を付し、その処理の説明を割愛する。なお、S105の処理の一例である図14の処理終了後は、S106ではなく図19のS800の処理に移行する。   FIG. 19 is a flowchart illustrating an example of a training data creation support method by the training data creation support device according to another embodiment. In FIG. 19, the same processes as those in FIG. 3 are denoted by the same reference numerals, and the description of the processes is omitted. Note that after the process of FIG. 14 as an example of the process of S105 ends, the process proceeds to S800 of FIG. 19 instead of S106.

判定部19は、S105の処理の後、模範作業者へのラベル付与を指示する(S800)。判定部19は、付与指示部20にその指示を行う。   The determination unit 19 instructs the exemplary worker to give a label after the process of S105 (S800). The determination unit 19 gives an instruction to the assignment instruction unit 20.

図20は、模範作業者へのラベル付与指示処理の一例を示すフローチャートである。   FIG. 20 is a flowchart illustrating an example of a label assignment instruction process for an exemplary worker.

付与指示部20は、作業技能の判定が行われた確認対象者のなかで作業技能が所定水準を満たしている確認対象者が存在するか否かを判定する(S802)。例えば、付与指示部20は、図12に示す確認対象者DBにおいてフィールド「判定結果」に値「1」が登録されたレコードが存在するか否かを判定すればよい。   The assignment instruction unit 20 determines whether there is a confirmation target person whose work skill satisfies a predetermined level among the confirmation target persons whose work skill has been determined (S802). For example, the assignment instruction unit 20 may determine whether there is a record in which the value “1” is registered in the field “determination result” in the confirmation target person DB illustrated in FIG.

作業技能が所定水準を満たしている確認対象者が存在しない場合(S802;否定)、図3のS106の処理に移行する。   If there is no confirmation target person whose work skill satisfies the predetermined level (S802; No), the process proceeds to S106 in FIG.

一方、作業技能が所定水準を満たしている確認対象者が存在する場合(S802;肯定)、付与指示部20は、その確認対象者である作業者により作成された訓練データの付与対象文書のなかから、模範作業者への送信対象とする付与対象文書を特定する(S804)。   On the other hand, when there is a confirmation target person whose work skill satisfies the predetermined level (S802; affirmative), the assignment instruction unit 20 is among the assignment target documents of the training data created by the worker who is the confirmation target person. From this, the grant target document to be transmitted to the model worker is specified (S804).

例えば、付与指示部20は、図7に示す判定作業用DBの中から、フィールド「比較対象者」に確認対象者である作業者の識別情報、フィールド「判定対象者」に模範作業者である作業者の識別情報がそれぞれ登録され、かつフィールド「判定結果」の値が「0」のレコードを特定すればよい。これによって、確認対象者によるラベル付与結果と模範作業者により作成された訓練データを基に生成した分類器によるラベル付与結果が異なるレコードが特定される。付与指示部20は、その特定されたレコードのフィールド「付与対象文書」に登録されている内容を送信対象の付与対象文書とすればよい。なお、判定作業用DBの中に前述の条件に合致する複数個のレコードが存在する場合、付与指示部20は、それらレコードのフィールド「付与対象文書」に登録されている内容を送信対象の付与対象文書とすればよい。また、作業技能が所定水準を満たす確認対象者が複数人存在する場合、付与指示部20は、各確認対象者を対象にして判定作業用DB内の各レコードを特定すればよい。   For example, the assignment instructing unit 20 is the identification information of the worker who is the confirmation target in the field “comparison person” and the model worker in the field “determination person” from the determination work DB shown in FIG. It is only necessary to identify a record in which the identification information of the worker is registered and the value of the field “judgment result” is “0”. Thereby, a record in which the labeling result by the classifier generated based on the labeling result by the person to be confirmed and the training data created by the model worker is different is specified. The assignment instruction unit 20 may set the content registered in the field “assignment target document” of the specified record as the transmission target assignment target document. When there are a plurality of records that match the above-described conditions in the determination work DB, the assignment instruction unit 20 assigns the contents registered in the field “assignment target document” of those records to the transmission target The target document may be used. In addition, when there are a plurality of confirmation target persons whose work skills satisfy a predetermined level, the assignment instruction unit 20 may specify each record in the determination work DB for each confirmation target person.

そして、付与指示部20は、特定した付与対象文書を模範作業者に送信してラベル付与を指示する(S806)。例えば、付与指示部20は、前述のようにして特定されたレコードにおけるフィールド「付与対象文書」に登録されている内容を送信部17により模範作業者(それに対応する端末装置30宛)に送信すればよい。なお、付与対象文書を送信する際に文書IDを含めておき、模範作業者により作成される訓練データにその文書IDが含まれるようにすればよい。また、模範作業者への付与対象文書の送信の際には、付与対象候補となるラベル(図3のS101で受信した訓練データと同一のラベル)も通知される。   Then, the assignment instruction unit 20 transmits the specified assignment target document to the model worker and instructs label assignment (S806). For example, the assignment instruction unit 20 transmits the contents registered in the field “document to be assigned” in the record specified as described above to the exemplary worker (addressed to the corresponding terminal device 30) by the transmission unit 17. That's fine. It should be noted that the document ID may be included when transmitting the grant target document, and the document ID may be included in the training data created by the exemplary worker. Further, when transmitting the grant target document to the model worker, a label that is a grant target candidate (the same label as the training data received in S101 in FIG. 3) is also notified.

その後、受信部13が、模範作業者によって作成された訓練データを端末装置30から受信し(S808)、その訓練データを図4に示す訓練データDBに格納する(S810)。例えば、受信部13は、訓練データDBの中から、フィールド「文書ID」に登録されている内容が受信された訓練データに含まれる文書IDと一致するレコードを特定すればよい。そして、受信部13は、特定したレコードにおけるフィールド「作業者」に模範作業者である作業者の識別情報を、同レコードにおけるフィールド「ラベル」に模範作業者によって付与されたラベル(訓練データに含まれるラベル)をそれぞれ登録すればよい。つまり、これによって訓練データDBの該当レコードは、模範作業者に関連する情報によって更新される。なお、訓練データDBの該当レコードについて、フィールド「ラベル」に既登録の内容と模範作業者によって付与されたラベルとを比較し、それらが一致する場合、受信部13は該当レコードを更新しなくてもよい。   Thereafter, the receiving unit 13 receives the training data created by the model worker from the terminal device 30 (S808), and stores the training data in the training data DB shown in FIG. 4 (S810). For example, the receiving unit 13 may specify a record that matches the document ID included in the training data in which the content registered in the field “document ID” is received from the training data DB. Then, the receiving unit 13 includes the identification information of the worker who is a model worker in the field “worker” in the specified record, and the label (included in the training data) given to the field “label” in the record by the model worker. Each label) can be registered. That is, the corresponding record in the training data DB is thereby updated with information related to the model worker. For the corresponding record in the training data DB, the content registered in the field “label” is compared with the label given by the model worker, and if they match, the receiving unit 13 does not update the corresponding record. Also good.

以上の他の実施形態によれば、確認対象者によって作成された訓練データが確認対象者よりも作業技能が高いと判定される模範作業者によって作成された訓練データに置き換えられることによって、正しくラベルが付与された訓練データが増加する。その結果、前述の実施形態によって生成される分類器(分類規則)よりもさらに分類精度の高い分類器(分類規則)を生成できる。   According to the other embodiment described above, the training data created by the confirmation target person is correctly replaced by the training data created by the exemplary worker determined to have higher work skills than the confirmation target person. The training data to which is given increases. As a result, a classifier (classification rule) with higher classification accuracy than the classifier (classification rule) generated by the above-described embodiment can be generated.

なお、前述の他の実施形態では、作業技能が所定の水準に達していると判定された確認対象者によって作成された訓練データの付与対象文書のなかから、ラベルの付与が難しいと判定される文書のみを模範作業者に送信した。このような文書のみを模範作業者に送信するのではなく、そのような確認対象者によって作成された訓練データの付与対象文書すべてを模範作業者に送信するようにしてもよい。このようにすることで、正しくラベルが付与された訓練データがさらに増加し、さらに分類精度の高い分類器(分類規則)を生成できる。   In the other embodiments described above, it is determined that it is difficult to give a label from among the training data grant target documents created by the confirmation target person who has been determined that the work skill has reached a predetermined level. Only the document was sent to the model worker. Instead of transmitting only such a document to the model worker, all the training data grant target documents created by such a confirmation target user may be transmitted to the model worker. By doing in this way, the training data correctly labeled is further increased, and a classifier (classification rule) with higher classification accuracy can be generated.

次に、さらに他の実施形態を説明する。   Next, still another embodiment will be described.

内容の偏った付与対象文書が特定の作業者に作業対象として割り当てられて各作業者に付与対象文書が配布された場合、各作業者から受信した訓練データが正しいラベル付与結果であったとしても、その訓練データから生成された分類器が適切なラベル付与を行えない可能性がある。例えば、訓練データの作成に使用された付与対象文書と、その訓練データを基にして生成された分類器によってラベル付与がされる付与対象文書との内容が著しく相違する場合に、その分類器で使用される分類規則が有効に働かない可能性がある。このような場合、図3のS102の処理においてラベル付与結果の一致度判定を行っても、各作業者の作業技能を正確かつ公平に判定できなくなる可能性がある。   Even if the assignment target document with uneven content is assigned as a work target to a specific worker and the grant target document is distributed to each worker, even if the training data received from each worker is the correct label assignment result The classifier generated from the training data may not be able to perform proper labeling. For example, if the content of the grant target document used to create training data differs significantly from the grant target document that is labeled by the classifier generated based on the training data, the classifier The classification rules used may not work effectively. In such a case, there is a possibility that the work skill of each worker cannot be determined accurately and fairly even if the matching degree determination of the label assignment result is performed in the process of S102 of FIG.

そこで、他の実施形態においては、ある作業者に特定の内容の付与対象文書が集中しないようにしながら、各作業者へ作業対象として配布する付与対象文書を決定する。   Therefore, in another embodiment, a grant target document to be distributed as a work target to each worker is determined while preventing a grant target document having specific contents from being concentrated on a certain worker.

図21は、他の実施形態における訓練データ作成支援システムの一例を示す。図21に示すように、訓練データ作成支援システムは、訓練データ作成支援装置200と複数の端末装置30とを有する。訓練データ作成支援装置200と複数の端末装置30とは、ネットワーク50を介して相互に通信可能に接続される。   FIG. 21 shows an example of a training data creation support system in another embodiment. As illustrated in FIG. 21, the training data creation support system includes a training data creation support device 200 and a plurality of terminal devices 30. The training data creation support device 200 and the plurality of terminal devices 30 are connected via a network 50 so that they can communicate with each other.

訓練データ作成支援装置200は、訓練データの作成を支援する装置である。また、端末装置30は、訓練データを作成する各作業者が利用する端末装置である。端末装置30は、図1と同様である。   The training data creation support device 200 is a device that supports creation of training data. The terminal device 30 is a terminal device used by each worker who creates training data. The terminal device 30 is the same as that in FIG.

訓練データ作成支援装置200は、第1記憶部11、第2記憶部12、受信部13、分類器生成部14、判定部15、分類処理部16、送信部17、出力部18、クラスタ生成部21および割当部22を備える。訓練データ作成支援装置200において図1に示すデータ作成支援装置10と同様の構成については同一の符号を付し、その機能や処理の各説明を割愛する。   The training data creation support apparatus 200 includes a first storage unit 11, a second storage unit 12, a reception unit 13, a classifier generation unit 14, a determination unit 15, a classification processing unit 16, a transmission unit 17, an output unit 18, and a cluster generation unit. 21 and an assigning unit 22. In the training data creation support apparatus 200, the same reference numerals are given to the same components as those in the data creation support apparatus 10 shown in FIG. 1, and descriptions of functions and processes thereof are omitted.

クラスタ生成部21は、作業対象となる複数の付与対象文書を対象にしてクラスタ処理を実行する。このクラスタ処理によって、複数の付与対象文書それぞれは、その内容によって複数のカテゴリに分類される。   The cluster generation unit 21 performs cluster processing on a plurality of grant target documents that are work targets. By this cluster processing, each of the plurality of grant target documents is classified into a plurality of categories according to the contents thereof.

割当部22は、クラスタ生成部21の処理結果に基づいて各作業者に配布する付与対象文書を決定する。   The allocating unit 22 determines an assignment target document to be distributed to each worker based on the processing result of the cluster generating unit 21.

なお、訓練データ作成支援装置200は、図2と同様のハードウェア構成であり、訓練データ作成支援装置10と同様の前述の各部は、前述した訓練データ作成支援装置10の各部と同様の各ハードウェア要素に対応する。図21におけるクラスタ生成部21および割当部22に対応するハードウェア要素は、図2のCPU61がその一例となる。訓練データ作成支援装置200を実現するための訓練データ作成支援プログラムは、前述の実施形態と同様にして実行され、訓練データ作成支援装置200の各機能が実現されるものであればよい。以下に、他の実施形態における、訓練データ作成支援装置200による訓練データ作成支援方法について説明する。   The training data creation support apparatus 200 has the same hardware configuration as that in FIG. 2, and the above-described units similar to the training data creation support apparatus 10 have the same hardware as the respective units of the training data creation support apparatus 10 described above. Corresponds to the wear element. An example of the hardware elements corresponding to the cluster generation unit 21 and the allocation unit 22 in FIG. 21 is the CPU 61 in FIG. The training data creation support program for realizing the training data creation support device 200 may be executed in the same manner as in the above-described embodiment, and any function of the training data creation support device 200 may be realized. Hereinafter, a training data creation support method by the training data creation support apparatus 200 in another embodiment will be described.

図22は、他の実施形態における訓練データ作成支援装置による訓練データ作成支援方法の一例を示すフローチャートである。図22中、図3と同様の処理については同一の符号を付し、その処理の説明を割愛する。   FIG. 22 is a flowchart illustrating an example of a training data creation support method by the training data creation support device according to another embodiment. In FIG. 22, the same processes as those in FIG. 3 are denoted by the same reference numerals, and the description of the processes is omitted.

送信部17は、決定された付与対象文書を各作業者に送信する(S900)。図23は、付与対象文書の送信処理の一例を示すフローチャートである。   The transmission unit 17 transmits the determined grant target document to each worker (S900). FIG. 23 is a flowchart illustrating an example of a transmission process of a grant target document.

クラスタ生成部21は、送信対象の付与対象文書を取得する(S902)。例えば、クラスタ生成部21は、第2記憶部12内に予め格納されている付与対象文書を順次取得する。付与対象文書は、例えば前述のように、図4に示す訓練データDBの形態で第2記憶部12内に格納されていてもよい。その場合、訓練データDBの各フィールドのうち、フィールド「文書ID」およびフィールド「付与対象文書」に、各付与対象文書に関する情報が登録されればよい。   The cluster generation unit 21 acquires a grant target document to be transmitted (S902). For example, the cluster generation unit 21 sequentially acquires grant target documents stored in advance in the second storage unit 12. For example, as described above, the grant target document may be stored in the second storage unit 12 in the form of the training data DB illustrated in FIG. In this case, information regarding each grant target document may be registered in the field “document ID” and the field “grant target document” among the fields of the training data DB.

続いて、クラスタ生成部21は、取得した各付与対象文書の内容を基に、内容が類似する付与対象文書をまとめあげた複数のクラスタを生成する(S904)。クラスタの生成においては、k−meansなど種々の公知の手法が用いられればよい。また、例えば、付与対象文書が図4に示す訓練データDBの形態で第2記憶部12内に格納されている場合、クラスタを識別するための情報を登録するフィールドを訓練データDBに追加してもよい。以下、このフィールドをフィールド「クラスタID」と呼称する。そして、クラスタ生成部21は、訓練データDBにおける各付与対象文書対応のレコードのフィールド「クラスタID」に、生成したクラスタ識別情報を登録すればよい。内容が類似する付与対象文書には同じクラスタ識別情報が付与され、内容が相違する付与対象文書には異なるクラスタ識別情報が付与される。このようにすることで、付与対象文書とクラスタの関係情報が作成される。また、訓練データDBにフィールドを追加するのではなく、訓練データDBとは別に各付与対象文書(各文書ID)とクラスタの関係を示すテーブルなどの対応情報を作成し、それを利用するようにしてもよい。   Subsequently, the cluster generation unit 21 generates a plurality of clusters in which grant target documents having similar contents are grouped based on the acquired contents of the grant target documents (S904). In generating the cluster, various known methods such as k-means may be used. For example, when the grant target document is stored in the second storage unit 12 in the form of the training data DB shown in FIG. 4, a field for registering information for identifying the cluster is added to the training data DB. Also good. Hereinafter, this field is referred to as a field “cluster ID”. And the cluster production | generation part 21 should just register the produced | generated cluster identification information in the field "cluster ID" of the record corresponding to each grant object document in training data DB. The same cluster identification information is assigned to grant target documents having similar contents, and different cluster identification information is assigned to grant target documents having different contents. In this way, the relationship information between the grant target document and the cluster is created. Also, instead of adding a field to the training data DB, correspondence information such as a table showing the relationship between each grant target document (each document ID) and the cluster is created and used separately from the training data DB. May be.

割当部22は、クラスタ生成部21によって生成されたクラスタを基に、各作業者への割り当て付与対象文書を決定する(S906)。例えば、割当部22は、前述のようにしてフィールド「クラスタID」が追加された訓練データDBにおいて、フィールド「クラスタID」に同一のクラスタ識別情報が登録された複数の付与対象文書が複数の作業者に分散して割り当てられるよう、各作業者への割り当て付与対象文書を決定すればよい。例えば、各作業者に、同一クラスタ識別情報が登録された付与対象文書が同じ個数ずつ(均等に)割り当てられるようにすればよい。このようにすることで、同一クラスタ内、つまり内容が類似する付与対象文書が別の作業者に割り当てられ、ある作業者に特定の内容の付与対象文書が集中することが防止される。なお、このようにして各作業者への割り当て付与対象文書を決定した場合、割当部22は、訓練データDBのフィールド「作業者」に作業者を示す識別情報を登録すればよい。これにより、訓練データDBのレコード(各付与対象文書)ごとに付与対象文書の作業者が決定される。   The allocating unit 22 determines a document to be allocated to each worker based on the cluster generated by the cluster generating unit 21 (S906). For example, in the training data DB to which the field “cluster ID” is added as described above, the assigning unit 22 performs a plurality of assignment target documents in which the same cluster identification information is registered in the field “cluster ID”. What is necessary is just to determine the assignment | providing object document to each worker so that it may distribute and assign to an operator. For example, the same number (equivalently) of the assignment target documents in which the same cluster identification information is registered may be assigned to each worker. By doing in this way, it is prevented that the grant target documents having the similar contents in the same cluster are assigned to different workers, and the grant target documents having specific contents are not concentrated on a certain worker. When the assignment assignment target document to each worker is determined in this way, the assignment unit 22 may register identification information indicating the worker in the field “worker” of the training data DB. Thereby, the worker of the grant target document is determined for each record (each grant target document) in the training data DB.

割当部22は、各作業者へ付与対象文書の割り当て決定後、送信部17に付与対象文書の送信を指示する。   The assignment unit 22 instructs the transmission unit 17 to transmit the assignment target document after determining the assignment of the assignment target document to each worker.

送信部17は、割当部22からの指示を受け、各作業者に前述のようにして決定された付与対象文書を送信する(S908)。例えば、送信部17は、訓練データDBの各レコードのフィールド「付与対象文書」に登録されている内容を同じレコードのフィールド「作業者」に登録されている識別情報で示される作業者に送信する。送信部17による作業者への付与対象文書の送信方法は前述の実施形態と同様であればよい。また、各作業者からの訓練データの受信およびその後の処理は前述の実施形態と同様であればよい。   The transmission unit 17 receives the instruction from the allocation unit 22 and transmits the document to be assigned determined as described above to each worker (S908). For example, the transmission unit 17 transmits the contents registered in the field “assignment target document” of each record of the training data DB to the worker indicated by the identification information registered in the field “worker” of the same record. . The transmission method of the grant target document to the worker by the transmission unit 17 may be the same as in the above-described embodiment. Moreover, the reception of training data from each worker and the subsequent processing may be the same as in the above-described embodiment.

以上の他の実施形態によれば、ある作業者に特定の内容の付与対象文書が集中しないように各作業者に付与対象文書を均等に割り当てることができるため、訓練データの偏りによる分類器の性能低下を防ぐことができ、作業者の作業技能を適正に判定することができる。なお、本実施形態における訓練データ作成支援装置200における判定部15は、図18の訓練データ作成支援装置100における判定部19であってもよい。   According to the other embodiments described above, since the assignment target documents can be evenly allocated to the respective workers so that the assignment target documents having specific contents are not concentrated on a certain worker, the classifier of the training data is biased. Performance degradation can be prevented, and the operator's work skill can be determined appropriately. Note that the determination unit 15 in the training data creation support apparatus 200 in the present embodiment may be the determination unit 19 in the training data creation support apparatus 100 in FIG.

以上、本発明の好ましい実施例について詳述したが、本発明は特定の実施例に限定されるものではなく、種々の変形や変更を行ってもよい。   The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to specific embodiments, and various modifications and changes may be made.

例えば、図4に例示した訓練データDBは、作業者、ラベル、文書ID、および付与対象文書の各フィールドを有するが、これら情報が異なるDBが分かれる形態であってもよい。例えば、訓練データDBが作業者、ラベルおよび文書IDの各フィールドを有し、他のDBが文書IDと付与対象文書の各フィールドを有する構成であってもよい。これらDB間では、フィールド「文書ID」をキーにしてレコードが関連付けされる。または、訓練データDBがシリアル番号、作業者およびラベルの各フィールドを有し、他のDBがシリアル番号、文書IDおよび付与対象文書の各フィールドを有する構成であってもよい。この場合には、これらDB間では、フィールド「シリアル番号」をキーにしてレコードが関連付けされる。   For example, the training data DB illustrated in FIG. 4 includes fields for an operator, a label, a document ID, and a grant target document, but a DB in which these pieces of information are different may be used. For example, the configuration may be such that the training data DB has fields for workers, labels, and document IDs, and the other DB has fields for document IDs and grant target documents. Records are associated between these DBs using the field “document ID” as a key. Alternatively, the training data DB may have serial number, worker, and label fields, and the other DB may have serial number, document ID, and grant target document fields. In this case, records are associated between these DBs using the field “serial number” as a key.

また、本発明の実施形態は、ラベル付与対象を文書としたが、それに限られるものではない。例えば、画像や動画、音声データ、ユーザアカウント等、その他のデータをラベル付与対象にしてもよい。   In the embodiment of the present invention, the labeling target is a document, but the present invention is not limited to this. For example, other data such as images, moving images, audio data, user accounts, and the like may be set as labels.

以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
コンピュータに、
第1データを対象にして第1作業者の作業により作成された第1訓練データと、第2データを対象にして第2作業者の作業により作成された第2訓練データを用いた機械学習により生成された第1規則データに従って前記第1データを対象にして生成された第1処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるためのプログラム。
(付記2)
前記コンピュータに、
前記第1訓練データと、前記第1処理結果データと、第3データを対象にして第3作業者の作業により作成された第3訓練データと、前記第3データを対象にして前記第1規則データに従って生成された第2処理結果データとに基づき、前記第2作業者の作業技能を判定する、
ことを実行させるための付記1記載のプログラム。
(付記3)
前記コンピュータに、
前記第1訓練データと、前記第1処理結果データと、第3データを対象にして第3作業者の作業により作成された第3訓練データを用いた機械学習により生成された第2規則データに従って前記第1データを対象にして生成された第2処理結果データとに基づき、前記第1作業者の作業技能を判定する、
ことを実行させるための付記1記載のプログラム。
(付記4)
前記コンピュータに、
前記第2訓練データと、前記第1訓練データを用いた機械学習により生成された第2規則データに従って前記第2データを対象にして生成された第2処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるための付記1記載のプログラム。
(付記5)
前記コンピュータに、
前記第1訓練データと前記第1処理結果データとの一致度に基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるための付記1記載のプログラム。
(付記6)
前記コンピュータに、
前記第1訓練データと前記第1処理結果データとの第1の一致度および前記第3訓練データと前記第2処理結果データとの第2の一致度に基づき、前記第2作業者の作業技能を判定する、
ことを実行させるための付記2記載のプログラム。
(付記7)
前記コンピュータに、
前記第1の一致度および前記第2の一致度と基準値との関係に基づき、前記第2作業者の作業技能を判定する、
ことを実行させるための付記6記載のプログラム。
(付記8)
前記コンピュータに、
前記第1訓練データと前記第1処理結果データとの第1の一致度および前記第1訓練データと前記第2処理結果データとの第2の一致度に基づき、前記第1作業者の作業技能を判定する、
ことを実行させるための付記3記載のプログラム。
(付記9)
前記コンピュータに、
前記第1の一致度および前記第2の一致度と基準値との関係に基づき、前記第1作業者の作業技能を判定する、
ことを実行させるための付記8記載のプログラム。
(付記10)
前記コンピュータに、
前記第1訓練データと前記第1処理結果データとの第1の一致度および前記第2訓練データと前記第2処理結果データとの第2の一致度に基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるための付記4記載のプログラム。
(付記11)
前記コンピュータに、
前記第1の一致度および前記第2の一致度と基準値との関係に基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるための付記10記載のプログラム。
(付記12)
前記コンピュータに、
前記第1作業者の作業技能が前記第2作業者の作業技能より高いと判定される場合は前記第2データを対象にした作業を前記第1作業者に依頼し、一方、前記第2作業者の作業技能が前記第1作業者の作業技能より高いと判定される場合は前記第1データを対象にした作業を前記第2作業者に依頼する、
ことを実行させるための付記1乃至11のいずれか1つに記載のプログラム。
(付記13)
前記コンピュータに、
内容の類似性に基づいて複数のデータを対象にしてクラスタ処理を実行し、
異なるクラスタに分類されたデータをそれぞれが含むよう前記複数のデータのなかから前記第1データおよび前記第2データを決定し、
前記決定に基づいて、前記第1データを対象にした作業を前記第1作業者に依頼し、前記第2データを対象にした作業を前記第2作業者に依頼する、
ことを実行させるための付記1乃至12のいずれか1つに記載のプログラム。
(付記14)
前記作業は、対象データの内容に応じて前記対象データにラベルを付与することであり、
前記第1訓練データ、前記第2訓練データおよび前記第1処理結果データはラベル付与結果データである、
付記1乃至13のいずれか1つに記載のプログラム。
(付記15)
前記第1データと前記第2データは異なるデータである、付記1乃至14のいずれか1つに記載のプログラム。
(付記16)
前記第1作業者と前記第2作業者は異なる作業者である、付記1乃至15のいずれか1つに記載のプログラム。
(付記17)
前記第1作業者と前記第2作業者は同一の作業者である、付記1乃至15のいずれか1つに記載のプログラム。
(付記18)
第1データを対象にして第1作業者の作業により作成された第1訓練データと、第2データを対象にして第2作業者の作業により作成された第2訓練データとを受信する受信部と、
前記第2訓練データを用いた機械学習により規則データを生成する生成部と、
前記第1訓練データと、前記規則データに従って前記第1データを対象にして作成された処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する判定部と、
を有することを特徴とするコンピュータ。
(付記19)
コンピュータで実行される訓練データ作成支援方法において、
第1データを対象にして第1作業者の作業により作成された第1訓練データと、第2データを対象にして第2作業者の作業により作成された第2訓練データを用いた機械学習により生成された第1規則データに従って前記第1データを対象にして生成された第1処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを特徴とする訓練データ作成支援方法。
Regarding the above embodiment, the following additional notes are disclosed.
(Appendix 1)
On the computer,
By machine learning using first training data created by the work of the first worker for the first data and second training data created by the work of the second worker for the second data Based on the first processing result data generated for the first data according to the generated first rule data, the work skill of the first worker or the second worker is determined.
A program to make things happen.
(Appendix 2)
In the computer,
The first rule for the first training data, the first processing result data, the third training data created by the work of a third worker for the third data, and the third data Based on the second processing result data generated according to the data, the work skill of the second worker is determined.
The program according to appendix 1 for executing the above.
(Appendix 3)
In the computer,
According to the second rule data generated by machine learning using the first training data, the first processing result data, and the third training data created by the work of the third worker for the third data. Based on the second processing result data generated for the first data, the work skill of the first worker is determined.
The program according to appendix 1 for executing the above.
(Appendix 4)
In the computer,
Based on the second training data and the second processing result data generated for the second data according to the second rule data generated by machine learning using the first training data, the first work Determining the work skill of the worker or the second worker,
The program according to appendix 1 for executing the above.
(Appendix 5)
In the computer,
Based on the degree of coincidence between the first training data and the first processing result data, the work skill of the first worker or the second worker is determined.
The program according to appendix 1 for executing the above.
(Appendix 6)
In the computer,
Based on the first degree of coincidence between the first training data and the first process result data and the second degree of coincidence between the third training data and the second process result data, the work skill of the second worker Determine
The program according to appendix 2 for executing the above.
(Appendix 7)
In the computer,
Based on the relationship between the first coincidence degree and the second coincidence degree and a reference value, the work skill of the second worker is determined.
The program according to appendix 6 for executing the above.
(Appendix 8)
In the computer,
Based on the first degree of coincidence between the first training data and the first process result data and the second degree of coincidence between the first training data and the second process result data, the work skill of the first worker Determine
The program according to attachment 3 for executing the above.
(Appendix 9)
In the computer,
Based on the relationship between the first coincidence degree and the second coincidence degree and a reference value, the work skill of the first worker is determined.
The program according to appendix 8 for executing the above.
(Appendix 10)
In the computer,
Based on the first degree of coincidence between the first training data and the first processing result data and the second degree of coincidence between the second training data and the second processing result data, the first operator or the first 2 Determine work skills of workers,
The program according to appendix 4 for executing the above.
(Appendix 11)
In the computer,
Based on the relationship between the first matching degree and the second matching degree and a reference value, the work skill of the first worker or the second worker is determined.
The program according to supplementary note 10 for executing the above.
(Appendix 12)
In the computer,
If it is determined that the work skill of the first worker is higher than the work skill of the second worker, the work for the second data is requested to the first worker, while the second work If it is determined that the work skill of the worker is higher than the work skill of the first worker, the second worker is requested to work on the first data.
The program according to any one of appendices 1 to 11 for executing the above.
(Appendix 13)
In the computer,
Perform cluster processing on multiple data based on content similarity,
Determining the first data and the second data from the plurality of data so that each includes data classified into different clusters;
Based on the determination, the first worker is requested to work on the first data, and the second worker is requested to work on the second data.
The program according to any one of appendices 1 to 12 for executing the program.
(Appendix 14)
The work is to give a label to the target data according to the content of the target data,
The first training data, the second training data, and the first processing result data are labeling result data,
The program according to any one of appendices 1 to 13.
(Appendix 15)
The program according to any one of appendices 1 to 14, wherein the first data and the second data are different data.
(Appendix 16)
The program according to any one of appendices 1 to 15, wherein the first worker and the second worker are different workers.
(Appendix 17)
The program according to any one of appendices 1 to 15, wherein the first worker and the second worker are the same worker.
(Appendix 18)
A receiving unit that receives the first training data created by the work of the first worker for the first data and the second training data created by the work of the second worker for the second data When,
A generating unit that generates rule data by machine learning using the second training data;
A determination unit for determining work skills of the first worker or the second worker based on the first training data and processing result data created for the first data according to the rule data;
A computer comprising:
(Appendix 19)
In a training data creation support method executed on a computer,
By machine learning using first training data created by the work of the first worker for the first data and second training data created by the work of the second worker for the second data Based on the first processing result data generated for the first data according to the generated first rule data, the work skill of the first worker or the second worker is determined.
A training data creation support method characterized by that.

10:訓練データ作成支援装置
11:第1記憶部
12:第2記憶部
13:受信部
14:分類器生成部
15:判定部
16:分類処理部
17:送信部
18:出力部
100:訓練データ作成支援装置
19:判定部
20:付与指示部
200:訓練データ作成支援装置
21:クラスタ生成部
22:割当部
30:端末装置
50:ネットワーク
61:CPU
62:ROM
63:RAM
64:ストレージ装置
65:ネットワークインタフェース
66:可搬型記憶媒体用ドライブ
67:バス
68:可搬型記憶媒体
10: training data creation support device 11: first storage unit 12: second storage unit 13: reception unit 14: classifier generation unit 15: determination unit 16: classification processing unit 17: transmission unit 18: output unit 100: training data Creation support device 19: Determination unit 20: Assignment instruction unit 200: Training data creation support device 21: Cluster generation unit 22: Assignment unit 30: Terminal device 50: Network 61: CPU
62: ROM
63: RAM
64: Storage device 65: Network interface 66: Portable storage medium drive 67: Bus 68: Portable storage medium

Claims (9)

コンピュータに、
第1データを対象にして第1作業者の作業により作成された第1訓練データと、第2データを対象にして第2作業者の作業により作成された第2訓練データを用いた機械学習により生成された第1規則データに従って前記第1データを対象にして生成された第1処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるためのプログラム。
On the computer,
By machine learning using first training data created by the work of the first worker for the first data and second training data created by the work of the second worker for the second data Based on the first processing result data generated for the first data according to the generated first rule data, the work skill of the first worker or the second worker is determined.
A program to make things happen.
前記コンピュータに、
前記第1訓練データと、前記第1処理結果データと、第3データを対象にして第3作業者の作業により作成された第3訓練データと、前記第3データを対象にして前記第1規則データに従って生成された第2処理結果データとに基づき、前記第2作業者の作業技能を判定する、
ことを実行させるための請求項1記載のプログラム。
In the computer,
The first rule for the first training data, the first processing result data, the third training data created by the work of a third worker for the third data, and the third data Based on the second processing result data generated according to the data, the work skill of the second worker is determined.
The program according to claim 1, for executing the operation.
前記コンピュータに、
前記第1訓練データと、前記第1処理結果データと、第3データを対象にして第3作業者の作業により作成された第3訓練データを用いた機械学習により生成された第2規則データに従って前記第1データを対象にして生成された第2処理結果データとに基づき、前記第1作業者の作業技能を判定する、
ことを実行させるための請求項1記載のプログラム。
In the computer,
According to the second rule data generated by machine learning using the first training data, the first processing result data, and the third training data created by the work of the third worker for the third data. Based on the second processing result data generated for the first data, the work skill of the first worker is determined.
The program according to claim 1, for executing the operation.
前記コンピュータに、
前記第2訓練データと、前記第1訓練データを用いた機械学習により生成された第2規則データに従って前記第2データを対象にして生成された第2処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるための請求項1記載のプログラム。
In the computer,
Based on the second training data and the second processing result data generated for the second data according to the second rule data generated by machine learning using the first training data, the first work Determining the work skill of the worker or the second worker,
The program according to claim 1, for executing the operation.
前記コンピュータに、
前記第1訓練データと前記第1処理結果データとの一致度に基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを実行させるための請求項1記載のプログラム。
In the computer,
Based on the degree of coincidence between the first training data and the first processing result data, the work skill of the first worker or the second worker is determined.
The program according to claim 1, for executing the operation.
前記コンピュータに、
前記第1作業者の作業技能が前記第2作業者の作業技能より高いと判定される場合は前記第2データを対象にした作業を前記第1作業者に依頼し、一方、前記第2作業者の作業技能が前記第1作業者の作業技能より高いと判定される場合は前記第1データを対象にした作業を前記第2作業者に依頼する、
ことを実行させるための請求項1乃至5のいずれか1項に記載のプログラム。
In the computer,
If it is determined that the work skill of the first worker is higher than the work skill of the second worker, the work for the second data is requested to the first worker, while the second work If it is determined that the work skill of the worker is higher than the work skill of the first worker, the second worker is requested to work on the first data.
The program of any one of Claim 1 thru | or 5 for performing this.
前記コンピュータに、
内容の類似性に基づいて複数のデータを対象にしてクラスタ処理を実行し、
異なるクラスタに分類されたデータをそれぞれが含むよう前記複数のデータのなかから前記第1データおよび前記第2データを決定し、
前記決定に基づいて、前記第1データを対象にした作業を前記第1作業者に依頼し、前記第2データを対象にした作業を前記第2作業者に依頼する、
ことを実行させるための請求項1乃至6のいずれか1項に記載のプログラム。
In the computer,
Perform cluster processing on multiple data based on content similarity,
Determining the first data and the second data from the plurality of data so that each includes data classified into different clusters;
Based on the determination, the first worker is requested to work on the first data, and the second worker is requested to work on the second data.
The program of any one of Claims 1 thru | or 6 for performing this.
第1データを対象にして第1作業者の作業により作成された第1訓練データと、第2データを対象にして第2作業者の作業により作成された第2訓練データとを受信する受信部と、
前記第2訓練データを用いた機械学習により規則データを生成する生成部と、
前記第1訓練データと、前記規則データに従って前記第1データを対象にして作成された処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する判定部と、
を有することを特徴とするコンピュータ。
A receiving unit that receives the first training data created by the work of the first worker for the first data and the second training data created by the work of the second worker for the second data When,
A generating unit that generates rule data by machine learning using the second training data;
A determination unit for determining work skills of the first worker or the second worker based on the first training data and processing result data created for the first data according to the rule data;
A computer comprising:
コンピュータで実行される訓練データ作成支援方法において、
第1データを対象にして第1作業者の作業により作成された第1訓練データと、第2データを対象にして第2作業者の作業により作成された第2訓練データを用いた機械学習により生成された第1規則データに従って前記第1データを対象にして生成された第1処理結果データとに基づき、前記第1作業者または前記第2作業者の作業技能を判定する、
ことを特徴とする訓練データ作成支援方法。
In a training data creation support method executed on a computer,
By machine learning using first training data created by the work of the first worker for the first data and second training data created by the work of the second worker for the second data Based on the first processing result data generated for the first data according to the generated first rule data, the work skill of the first worker or the second worker is determined.
A training data creation support method characterized by that.
JP2013194168A 2013-09-19 2013-09-19 Program, computer and training data creation support method Active JP6307822B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013194168A JP6307822B2 (en) 2013-09-19 2013-09-19 Program, computer and training data creation support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013194168A JP6307822B2 (en) 2013-09-19 2013-09-19 Program, computer and training data creation support method

Publications (2)

Publication Number Publication Date
JP2015060432A true JP2015060432A (en) 2015-03-30
JP6307822B2 JP6307822B2 (en) 2018-04-11

Family

ID=52817895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013194168A Active JP6307822B2 (en) 2013-09-19 2013-09-19 Program, computer and training data creation support method

Country Status (1)

Country Link
JP (1) JP6307822B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017211930A (en) * 2016-05-27 2017-11-30 ファナック株式会社 Machine learning device for learning life fault condition, fault prediction device, machine system, and machine learning method
JP2019022477A (en) * 2017-07-19 2019-02-14 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Crowdsourcing and deep learning based segmenting and karyotyping of chromosomes
JP2020024665A (en) * 2018-08-02 2020-02-13 パナソニックIpマネジメント株式会社 Information processing method and information processing system
WO2022113879A1 (en) * 2020-11-27 2022-06-02 ソフトバンク株式会社 Information processing device, information processing method, and information processing program
JP2023022263A (en) * 2020-11-27 2023-02-14 ソフトバンク株式会社 Information processing device, information processing method, and information processing program
US11631028B2 (en) 2018-10-30 2023-04-18 Samsung Electronics Co.. Ltd. Method of updating policy for controlling action of robot and electronic device performing the method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11353365A (en) * 1998-06-10 1999-12-24 Mitsubishi Electric Corp Method and device for managing process
JP2006127446A (en) * 2004-09-29 2006-05-18 Ricoh Co Ltd Image processing device, image processing method, program, and recording medium
JP2009110064A (en) * 2007-10-26 2009-05-21 Toshiba Corp Sorting model learning apparatus and sorting model learning method
JP2009282686A (en) * 2008-05-21 2009-12-03 Toshiba Corp Apparatus and method for learning classification model
WO2013121809A1 (en) * 2012-02-14 2013-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション Device, program and method for clustering documents

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11353365A (en) * 1998-06-10 1999-12-24 Mitsubishi Electric Corp Method and device for managing process
JP2006127446A (en) * 2004-09-29 2006-05-18 Ricoh Co Ltd Image processing device, image processing method, program, and recording medium
JP2009110064A (en) * 2007-10-26 2009-05-21 Toshiba Corp Sorting model learning apparatus and sorting model learning method
JP2009282686A (en) * 2008-05-21 2009-12-03 Toshiba Corp Apparatus and method for learning classification model
WO2013121809A1 (en) * 2012-02-14 2013-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション Device, program and method for clustering documents

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
チャンクワン カイ 外1名: "クラウドソーシングにおけるオンライン学習", 電子情報通信学会技術研究報告, vol. 113, no. 139, JPN6017013675, 11 July 2013 (2013-07-11), JP, pages 19 - 26, ISSN: 0003638857 *
田邊 靖貴 外4名: "物を基準としたADL認識における教師データ管理手法の設計とアプリケーション上での評価", 第4回データ工学と情報マネジメントに関するフォーラム論文集 (第10回日本データベース学会年次大会), JPN6017013678, 13 July 2012 (2012-07-13), JP, pages 1 - 8, ISSN: 0003638858 *
鹿島 久嗣 外1名: "クラウドソーシングと機械学習", 人工知能学会誌, vol. 第27巻 第4号, JPN6017034556, 1 July 2012 (2012-07-01), JP, pages 381 - 388, ISSN: 0003638859 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017211930A (en) * 2016-05-27 2017-11-30 ファナック株式会社 Machine learning device for learning life fault condition, fault prediction device, machine system, and machine learning method
JP2019022477A (en) * 2017-07-19 2019-02-14 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Crowdsourcing and deep learning based segmenting and karyotyping of chromosomes
JP2020024665A (en) * 2018-08-02 2020-02-13 パナソニックIpマネジメント株式会社 Information processing method and information processing system
JP7236694B2 (en) 2018-08-02 2023-03-10 パナソニックIpマネジメント株式会社 Information processing method and information processing system
US11631028B2 (en) 2018-10-30 2023-04-18 Samsung Electronics Co.. Ltd. Method of updating policy for controlling action of robot and electronic device performing the method
WO2022113879A1 (en) * 2020-11-27 2022-06-02 ソフトバンク株式会社 Information processing device, information processing method, and information processing program
JP2022085670A (en) * 2020-11-27 2022-06-08 ソフトバンク株式会社 Information processing device, information processing method, and information processing program
JP7189922B2 (en) 2020-11-27 2022-12-14 ソフトバンク株式会社 Information processing device, information processing method and information processing program
JP2023022263A (en) * 2020-11-27 2023-02-14 ソフトバンク株式会社 Information processing device, information processing method, and information processing program

Also Published As

Publication number Publication date
JP6307822B2 (en) 2018-04-11

Similar Documents

Publication Publication Date Title
US10902076B2 (en) Ranking and recommending hashtags
JP6307822B2 (en) Program, computer and training data creation support method
US20220391773A1 (en) Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence
CN106133727B (en) The user interest promoted by knowledge base
US11727019B2 (en) Scalable dynamic acronym decoder
US9830386B2 (en) Determining trending topics in social media
US20180203835A1 (en) Generating a form response interface in an online application
US20180239832A1 (en) Method for determining news veracity
WO2019061989A1 (en) Loan risk control method, electronic device and readable storage medium
US20160092768A1 (en) Providing application recommendations
CN105721629B (en) User identifier matching process and device
US10691827B2 (en) Cognitive systems for allocating medical data access permissions using historical correlations
US20170300596A1 (en) Presenting a trusted tag cloud
US10332161B2 (en) Retrieving reviews based on user profile information
WO2016099447A1 (en) Personalized application recommendations
KR101346927B1 (en) Search device, search method, and computer-readable memory medium for recording search program
WO2021133471A1 (en) Skill determination framework for individuals and groups
US20160162578A1 (en) Transitive trust social-network system
JP6963372B2 (en) Business card information management system and search result display program
KR20200012086A (en) Personalized keyword extraction system in conversation contents of chat service considering user's relationships and user's propensity
US20150193683A1 (en) Assisting an expert to answer preexisting questions in a time efficient manner
JP2021089700A (en) Information processor, information processing method, and program
US20180039943A1 (en) Systems and methods for matching based on data collection
JP2019053520A (en) Providing apparatus, providing method, and providing program
US20220005368A1 (en) Upskill management

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20160401

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180226

R150 Certificate of patent or registration of utility model

Ref document number: 6307822

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150