JP7038499B2 - Classification system, control method of classification system, and program - Google Patents
Classification system, control method of classification system, and program Download PDFInfo
- Publication number
- JP7038499B2 JP7038499B2 JP2017141042A JP2017141042A JP7038499B2 JP 7038499 B2 JP7038499 B2 JP 7038499B2 JP 2017141042 A JP2017141042 A JP 2017141042A JP 2017141042 A JP2017141042 A JP 2017141042A JP 7038499 B2 JP7038499 B2 JP 7038499B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- teacher
- classification
- input
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、特許公報(出願公開公報、特許掲載公報を含む)などの公報を分類する技術に関する。 The present invention relates to a technique for classifying publications such as patent publications (including application publication publications and patent publication publications).
特許公報には、分類番号が付与されている。例えば、国際特許分類(IPC:International Patent Classification)が付与されたうえで特許公報は発行される。特許文献1には、国際特許分類をユーザが指定する際に、指定しようとする国際特許分類が付与されている特許公報の発明の名称や要約を表示することで、ユーザが国際特許分類を把握し易くする技術が開示されている。
A classification number is given to the patent gazette. For example, a patent gazette is issued after being granted an International Patent Classification (IPC). In
国際特許分類は、世界で共通で使用されている分類である一方、分類方法などをユーザが任意に指定できない。特許調査に不慣れな研究開発部門や技術部門でも特許調査をし易くするために、自社及び他社の特許公報に対して独自の分類(社内分類と呼ぶ)を付与することが行われている。 While the International Patent Classification is a classification commonly used in the world, the user cannot arbitrarily specify the classification method and the like. In order to facilitate patent search even in R & D departments and technical departments that are unfamiliar with patent search, patent gazettes of their own company and other companies are given their own classification (called in-house classification).
社内分類を付与する作業は、分類を付与する担当者が、例えば新着で発行される特許公報を目視して確認して、手入力で分類を付与する作業が行われている。かかる作業は、負荷を生じさせるものである。誤って分類が付与される場合もある。また、分類が正しくない旨のフィードバックが例えば開発部門などから分類担当者に伝達される場合があるが、必ずしもその後の分類作業に反映されているとは限らない。 In the work of assigning an in-house classification, the person in charge of assigning the classification visually confirms, for example, a newly issued patent gazette, and manually assigns the classification. Such work causes a load. Classification may be given by mistake. In addition, feedback that the classification is incorrect may be transmitted from the development department to the person in charge of classification, but it is not always reflected in the subsequent classification work.
また、社内分類を付与する場合には、対象の公報に対して定性的な評価を併せて付与することもあり、このような評価も誤って付与される場合もある。そして、このような定性的な評価は社内分類と常に同時に行われるのではなく、独立して行われることもある。 In addition, when an in-house classification is given, a qualitative evaluation may be given to the target publication together, and such an evaluation may be given by mistake. And, such a qualitative evaluation is not always performed at the same time as the internal classification, but may be performed independently.
本発明にかかる分類システムは、少なくとも1つの公報に関する入力データと、前記入力データに対応する少なくとも1つの前記公報に付与される少なくとも1つの分類を示す出力データとの関係を示す教師データに基づいて、学習モデルを構築するモデル構築部と、少なくとも1つの公報に関する処理対象データを、前記入力データとして、前記学習モデルに入力する処理対象データ入力部と、前記処理対象データの入力に応じて前記学習モデルから出力された結果に従って、前記処理対象データに関する情報をユーザ端末に提供する提供部と、前記ユーザ端末から、前記教師データの元となる教師情報を受信する受信部と、前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入部とを有する。 The classification system according to the present invention is based on teacher data showing the relationship between the input data relating to at least one publication and the output data indicating at least one classification given to at least one publication corresponding to the input data. , The model construction unit that constructs the learning model, the processing target data input unit that inputs the processing target data related to at least one publication as the input data to the training model, and the learning according to the input of the processing target data. According to the result output from the model, the providing unit that provides information on the processing target data to the user terminal, the receiving unit that receives the teacher information that is the source of the teacher data from the user terminal, and the teacher information. It also has a teacher data input unit that inputs the teacher data to the model construction unit.
本発明によれば、社内分類を付与する作業を効率的に行うことができる。また、分類結果のフィードバックを効率的に活用することができる。さらに、本発明によれば、定性的な評価を付与する作業を効率的に行うこともできる。 According to the present invention, the work of assigning an in-house classification can be efficiently performed. In addition, the feedback of the classification result can be effectively utilized. Further, according to the present invention, the work of giving a qualitative evaluation can be efficiently performed.
以下、図面を参照しながら本発明の実施形態について詳細に説明する。なお、以下の実施形態において説明する構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. The configurations described in the following embodiments are merely examples, and the present invention is not limited to the configurations shown.
<社内分類の利用形態>
実施形態の説明に先立って、まず、現在行われている、社内分類が用いられる利用形態を説明する。図1は、社内分類の活用形態の一例を示す図である。社内分類は、例えば特許調査、特許情報のウォッチングなどのワークフローにおいて利用される。
<Usage form of internal classification>
Prior to the description of the embodiment, first, the current usage mode in which the in-house classification is used will be described. FIG. 1 is a diagram showing an example of utilization form of in-house classification. In-house classification is used in workflows such as patent search and patent information watching.
第1のシーンW1においては、調査担当者が所定の検索式と配信先とを設定する。例えば、SDI(Selective Dissemination of Information)検索で用いる検索条件とその配信先とを設定する。SDI検索とは、新たに発行された公報に対して予め設定された検索条件を用いて検索を行うことである。検索結果は、設定された配信先に自動的に配信される。全ての新着公報を分類する必要はないので、第1のシーンW1においては、例えば国際調査分類などの所定の検索条件を用いて大まかに新着公報を絞り込むことが行われる。ここで「公報」とは、特許、実用新案、意匠、商標などの出願公開公報、特許掲載公報などの各種の公報を含む。特許庁が発行する公報のみならず、定期的に発行される技術文献、技術論文を含んでもよい。何かしらの文献に分類を付与する形態であればその対象はいずれのものであってもよい。 In the first scene W1, the person in charge of investigation sets a predetermined search formula and delivery destination. For example, a search condition used in an SDI (Selective Dissemination of Information) search and its delivery destination are set. The SDI search is to perform a search using preset search conditions for newly issued publications. The search results are automatically delivered to the set delivery destination. Since it is not necessary to classify all new publications, in the first scene W1, the new publications are roughly narrowed down by using a predetermined search condition such as an international search classification. Here, the "publication" includes various publications such as patents, utility models, designs, trademark publications, and patent publication publications. It may include not only publications issued by the Japan Patent Office but also technical documents and papers issued on a regular basis. Any object may be used as long as it is in the form of assigning a classification to some document.
第2のシーンW2においては、分類担当者が新着公報に対して社内分類を付与する。社内分類はユーザ企業等において自由に設定が可能である。例えば、開発部門毎や製品毎などで分類が可能である。大分類、中分類、小分類などのように階層的な分類も可能である。一般に社内分類は、新着公報の仕分けのために用いられる。もちろん、新着公報の仕分けは一例であり、多様な形態で社内分類は使用され得る。社内分類が付与された新着公報は、該当する部門に送付される。社内分類は複数付与されてよい。例えば、ある公報P1に対して、分類C1および分類C2という2つの社内分類が付与されてよい。 In the second scene W2, the person in charge of classification assigns an in-house classification to new publications. The in-house classification can be freely set in the user company or the like. For example, it is possible to classify by development department or product. Hierarchical classification such as major classification, middle classification, and minor classification is also possible. In-house classification is generally used for sorting new publications. Of course, the sorting of new publications is an example, and in-house classification can be used in various forms. New publications with in-house classification will be sent to the relevant department. Multiple in-house classifications may be assigned. For example, two in-house classifications, classification C1 and classification C2, may be assigned to a certain publication P1.
第3のシーンW3においては、送付された新着公報を各部門の担当者が確認する。ことのき、分類が間違っている場合には、分類が間違っている旨の連絡を分類担当者に通知する。また、各部門の担当者は、新着公報を確認して、それぞれの公報に評価(重みづけ)を付与する。例えば、自社技術との関連度を示す値であったり、侵害可能性の度合いを示す値など、各種の評価(重みづけ)をユーザ企業等が独自に設定できる。 In the third scene W3, the person in charge of each department confirms the sent new publication. However, if the classification is incorrect, the person in charge of classification will be notified that the classification is incorrect. In addition, the person in charge of each department confirms the new publication and gives an evaluation (weighting) to each publication. For example, a user company or the like can independently set various evaluations (weights) such as a value indicating the degree of relevance to the company's technology and a value indicating the degree of possibility of infringement.
第4のシーンW4においては、各部門で付与された評価(重みづけ)に応じて、調査担当者がその公報の経過をウォッチングし、必要に応じて担当する部門と協議する。 In the fourth scene W4, the investigator watches the progress of the publication according to the evaluation (weighting) given by each department, and discusses with the department in charge as necessary.
以上が一般的に行われる社内分類のワークフローの説明である。 The above is the explanation of the workflow of internal classification that is generally performed.
<実施形態1>
本実施形態においては、例えば図1に示すワークフローの第2のシーンW2の分類作業を、後述する分類システムが処理する形態を説明する。なお、本実施形態で説明する分類システムは図1に示すようなワークフローシステムで用いられなくてもよく、任意の形態で利用可能である。
<
In this embodiment, for example, a mode in which the classification work of the second scene W2 of the workflow shown in FIG. 1 is processed by the classification system described later will be described. The classification system described in this embodiment does not have to be used in the workflow system as shown in FIG. 1, and can be used in any form.
<構成>
図2は、実施形態にかかる分類システム200の構成の一例を示す図である。分類システム200は、モデル構築部201、学習モデル202、教師データ投入部203、処理対象データ入力部204、出力結果提供部205、提供先データベース(DB)206、教師情報受信部207、教師情報統合部208、教師情報反映部209、及び分類済みDB210を有する。図1は構成の一例を示したものに過ぎず、他の構成を含んでもよい。また、図1に記載された構成の全てが必須の要件であるとは限らない。分類システム200は、公報DB250とネットワークを通じて通信可能に構成されてよい。
<Structure>
FIG. 2 is a diagram showing an example of the configuration of the
分類システム200は、情報処理装置として実現することができる。情報処理装置は、CPU、メモリ、HDD、及びネットワークインタフェースを有してよい。図2に示す各部は、HDDに格納されたプログラムが一時的にメモリに読み出され、CPUがメモリに読み出されたプログラムを実行することで、CPUが図2に示す各部として機能してよい。また、図2に示す各部のうちの少なくとも一部が、各種のネットワークを通じて相互に接続された複数の情報処理装置によって実現されてよい。また、図2に示す各部のうちの少なくとも一部(例えばモデル構築部201及び学習モデル202)は、複数の情報処理装置による分散処理によって実現されてよい。
The
分類システム200は、ユーザが使用する端末(以下、ユーザ端末261と呼ぶ)との間で通信が可能に構成されており、ユーザ端末261に検索結果を提供したり、ユーザ端末261から、後述する教師情報を、ネットワークを通じて受信したりしてよい。
The
ユーザ端末261は、パーソナルコンピュータ、タブレット、モバイル端末など任意の種類の端末であってよい。分類システム200は、ユーザをログイン管理しており、ログインしたユーザに固有の検索条件や検索結果などを、ユーザ端末261に提供してもよい。
The
本実施形態の分類システム200は、ユーザ企業毎に異なるように構成してよい。A社がA社用にカスタマイズした教師データに基づいて構築された学習モデル202を、A社と異なるB社が用いると、B社の所望する結果が得られないからである。また、A社がA社用にカスタマイズした学習モデル202を、A社とライバルのC社に使わせることはA社の意図に反し、情報保護の観点からも適切でないからである。したがって、本実施形態の分類システム200は、ユーザ企業毎に学習モデル202がカスタマイズされることになる。なお、ユーザ企業は、企業に限られず、任意の団体、集団などであってよい。
The
モデル構築部201は、学習モデル202を構築する。なお、本明細書において「構築」とは、新たにモデルを生成すること、生成済のモデルを変更または更新すること、及び新たに生成したモデルで既存のモデルを置き換えることを含む概念として用いることとする。例えば、モデル構築部201は、構築されている学習モデルがない場合、新たにモデルを生成してよい。モデル構築部201は、既に構築されている学習モデルがある場合、その学習モデルの一部の構成を変更または更新することで新たに学習モデルを構築してよい。モデル構築部201は、新たに学習モデルを生成し、既に構築されている学習モデルを生成した学習モデルで置き換えてもよい。
The
モデル構築部201は、学習モデル202として、例えば図3に示すようなニューラルネットワークを構築してよい。ニューラルネットワークは、入力層310、中間層320、及び出力層330を含む。それぞれの層は、複数のノードで構成される。図3では、入力層310は、ノード311、312、313を含み、中間層320は、ノード321、322、323を含み、出力層330は、ノード331、332、333を含む例を示している。各層に含まれるノードの数は図示した例に限られるものではなく、多数のノードから構成される形態が一般的である。中間層320は一層に限られるものではなく、複数の層から構成されてよい。それぞれのノードには重みが設定されており、入力されたデータに重みを掛け合わせた値を後段のノードに伝えていく。
The
教師あり学習では、例えば、教師データとして、入力データと入力データに対応する出力データとを用意する。モデル構築部201は、入力データが出力データと等しくなるように各ノードに設定される重みを調整する処理を繰り返す。このようにして、モデル構築部201は学習モデル202を構築する。その後、処理対象のデータが学習モデル202に入力されると、学習モデル202は構築されたモデルに従った結果を出力することになる。
In supervised learning, for example, input data and output data corresponding to the input data are prepared as teacher data. The
本実施形態において、モデル構築部201は、公知の機械学習処理を実行することで学習モデル202を構築してよい。例えば、モデル構築部201は、CNN(Convolutional Neural Network)を用いてもよいし、RNN(Recurrent Neural Network)を用いてもよい。その他の手法を用いてもよい。ニューラルネットワークではなく、SVM(Support Vector Machine)で学習モデル202を構築してもよい。本実施形態において学習モデル202それ自体は任意の種類のものを用いてよい。
In the present embodiment, the
教師データ投入部203は、教師データをモデル構築部201に投入する。初期の段階においては、教師データ投入部203は、分類済みDB210と公報DB250とから得られるデータを教師データとして投入してよい。
The teacher
公報DB250は、例えば利用可能な発行済みの全ての公報が格納されたDBである。公報DB250は、前述のように、特許、実用新案、意匠、商標などの出願公開公報、特許掲載公報などの各種の公報を含み、また、特許庁が発行する公報のみならず、定期的に発行される技術文献、技術論文を含んでもよい。このように、公報DB250は、単一のDBである必要はなく、複数のDBの集合であってよい。公報DB250は、日本国内の公報のみならず、諸外国の公報のDBを含んでよい。
The
分類済みDB210には、例えば公報の識別情報(例えば、出願番号、公開番号など)と、その公報に付与されている社内分類とが関連付けられたデータが格納される。例えば、公報P10には、分類C1および分類C2が付与される、といったデータが格納される。
The
教師データ投入部203は、例えば図4に示すような教師データを初期の教師データとして投入してよい。教師データは、少なくとも1つの公報に関する入力データと、入力データに対応する少なくとも1つの公報に付与される少なくとも1つの分類を示す出力データとの関係を示すデータであってよい。より具体的には、出力データは、社内分類として付与され得る複数の分類それぞれの近似度を示すデータであってよい。図4は、教師データの一例を説明する図である。図4の例においては、社内分類として付与され得る複数の分類が分類C1と分類C2と分類C3とであるものとする。図4に示す教師データにおいては、入力データとして公報P1の要約文のテキストデータを用意し、この入力データに対応する出力データとして公報P1に対する分類C1の近似度を示す値1、及び公報P1に対する分類C2の近似度を示す値0、及び公報P1に対する分類C3の近似度を示す値1を含むデータを用意した例を示している。本実施形態においては値1が最も近似している値を示すものとする。つまり、公報P1は、分類C1及び分類C3に分類すべきことを示す教師データを用意している。一方、本実施形態においては、値0は最も近似していない値を示すものとする。つまり、公報P1は、分類C2には分類すべきではないことを示す教師データを用意している。
The teacher
このように、図4に示すような教師データをモデル構築部201が用いて学習モデル202を構築する。例えば、モデル構築部201は、学習モデル202を構成するニューラルネットワークの各ノードの重みを変えてよい。このように構築された学習モデル202に公報P1を処理対象データとして入力すると、出力として分類C1及びC2のそれぞれの近似度を示すデータが得られることになる。図4の教師データを初期の教師データとして用いている場合には、公報P1を処理対象データとして学習モデル202に入力すると、分類C1及び分類C3のそれぞれの近似度は限りなく1に近い値が得られる。別の公報P11を処理対象データとして学習モデル202に入力すると、分類C1、分類C2、及び分類C3の近似度を示す値がそれぞれ出力されることになる。
In this way, the
図4では、入力データとして要約文のテキストデータを用いる例を示したが、これに限らない。特許請求の範囲のテキストデータでもよいし、全文のテキストデータでもよい。また、ユーザが任意のテキスト文書を入力してもよい。また、入力データとして、書誌データを入力してもよいし、画像データを入力してもよい。また、これらの一部のデータでもよいし、複数の種類のデータを用いてもよい。 FIG. 4 shows an example in which text data of a summary sentence is used as input data, but the present invention is not limited to this. It may be text data in the scope of claims or full-text text data. In addition, the user may input an arbitrary text document. Further, as the input data, bibliographic data may be input or image data may be input. Further, some of these data may be used, or a plurality of types of data may be used.
教師データ投入部203は、初期の教師データとして、入力データに対応する必要なデータ(例えば、公報の要約文のテキストデータ)を公報DB250から取得してよく、出力データに対応する必要なデータ(例えば特定の公報に付与されている分類を示すデータ)を分類済みDB210から取得してよい。なお、入力データに対応する必要なデータが分類済みDB210に格納されている場合(例えば図4の例で、要約文も分類済みDB210に格納されている場合)、教師データ投入部203は、公報DB250を参照せずに
得られる教師データを用いてもよい。
The teacher
教師データには、公報のどの部分(例えば、書誌情報、要約、請求の範囲、図面など)を用いて学習したかを示す付加情報が含まれてよい。処理対象データ入力部204は、付加情報を参照して、処理対象データとして入力される公報の中の対応する箇所を入力データとして用いてよい。
The teacher data may include additional information indicating which part of the publication (eg, bibliographic information, abstracts, claims, drawings, etc.) was used for learning. The processing target
処理対象データ入力部204は、公報DB250から新着情報を取得する。処理対象データ入力部204は、所定のタイミングで新着情報を取得してよい。例えば、公報DB250の更新の都度、新着情報を取得してよい。ウィークリー、マンスリーなどのように、前回の新着情報の取得時期から所定の期間間隔で新着情報を取得してもよい。新着情報とは、処理対象データ入力部204が前回の新着情報を取得した時点から新たに発行された公報としてよい。処理対象データ入力部204は、新着情報で特定される公報を処理対象データとして学習モデル202に入力する。なお、処理対象データ入力部204は、新着情報の中から所定の検索条件で対象を絞り込んだ公報を処理対象データとして用いてよい。
The processing target
また、処理対象データ入力部204は、新着情報で特定される公報以外の任意の公報を処理対象データとして学習モデル202に入力してよい。例えば、社内分類の種別を増やした場合には、既に分類済みの公報を処理対象データとして学習モデル202に入力してよい。また、技術分野の拡大などによって新着情報の絞り込み条件を変更する場合など、これまで処理の対象外の発行済みの公報を処理対象データとして学習モデル202に入力してよい。
Further, the processing target
出力結果提供部205は、処理対象データが学習モデル202に入力され、学習モデル202が出力した結果に従って、処理対象データを識別する識別情報(たとえば出願番号、公開番号、または特許番号など)を、ユーザ端末261に提供してよい。
The output
出力結果提供部205は、学習モデル202が出力した結果に基づいて、処理対象データの公報に付与すべき分類を特定する。たとえば、出力結果提供部205は、学習モデル202が出力する各分類の近似度を示す値が所定の閾値を超えている分類が、処理対象データの公報に付与される分類であると特定してよい。出力結果提供部205は、特定した分類を処理対象データの公報に付与する。出力結果提供部205は、付与した分類に対応するユーザを特定し、特定したユーザのユーザ端末261に処理対象データを識別する識別情報を提供してよい。
The output
提供先DB206は、所定の分類が付与された公報の情報を提供する提供先のユーザを示すデータを格納する。例えば、分類C1が付与された公報の提供先のユーザは、開発部門D1に所属するユーザであることを示すデータであってよい。提供先のユーザは複数であってよい。つまり、開発部門D1に複数のユーザが所属していればその複数のユーザに提供されてよい。また、提供先は複数の部門に跨ってもよい。
The
なお、提供される内容は公報に関する識別情報などの書誌情報でよく、要約など内容に関する一部の情報を含んでもよい。出力結果提供部205は、出力結果が抽出されたことを、提供先のユーザの登録済みのメールアドレスなどに通知する。この通知を受けてユーザ端末261からアクセスがあった場合、出力結果提供部205は、アクセスをしたユーザ端末261に出力結果を提示してもよい。
The content provided may be bibliographic information such as identification information regarding the gazette, and may include some information regarding the content such as a summary. The output
また、出力結果提供部205は、学習モデル202に処理対象データとして入力された公報の識別情報と、学習モデル202から出力された結果が示す分類とを対応付けたデータを分類済みDB210に出力し、分類済みDB210を更新する。本実施形態においては、学習モデル202から出力された結果が示す分類を用いてまず分類済みDB210を更新する。その後、ユーザからの教師情報に基づいて、分類済みDB210に格納されたデータを修正する形態を説明する。しかしながら、この例に限られるものではない。
Further, the output
教師情報受信部207は、出力結果提供部205から出力結果が提供されたことに応じてユーザ端末261から送信される教師情報を受信する。教師情報とは、出力結果提供部205が出力した結果(すなわち、学習モデル202の出力した内容)が正しい(適切か)か、あるいは間違っているか(不適切か)をユーザが指定した情報としてよい。例えば、開発部門D1のメンバーに提供された公報P21が、開発部門D1と関係がない公報であったと想定する。このような場合、開発部門D1のメンバーから、自部門とは関係ない公報である旨の情報が教師情報として通知される。教師情報受信部207は、このような教師情報を受信する。また、開発部門D1のメンバーが、公報P21は、自部門ではなく、むしろ他部門の開発部門D2に関連すると判断できた場合、公報P21に対して新たに分類C2を付与することを指定する教師情報を受信してもよい。
The teacher
教師情報統合部208は、複数の教師情報を教師情報受信部207が受信した場合、教師情報を統合する。教師情報統合部208が統合する態様は、2つの態様がある。
When the teacher
1つは、1つの公報に対して複数の分類が学習モデル202から出力された場合である。つまり、複数の分類先のユーザ端末からそれぞれ教師情報が送られるケースである。例えば、学習モデル202に処理対象データとして公報P3を入力し、学習モデル202から分類C1、C2、C3のいずれも該当する結果が出力されたと想定する。分類C1に対応する開発部門D1のメンバーおよび分類C2に対応する開発部門D2のメンバーからは、自部門とは関係ない公報である旨の情報を、教師情報受信部207が教師情報としてそれぞれ受信したと想定する。すると、教師情報統合部208は、このように受信した教師情報を統合する。すなわち、教師情報統合部208は、複数の教師情報を統合して、公報P3は分類C3を出力することが正しい、という内容の教師情報に統合する。公報P3は分類C1及び分類C2を出力することが正しくない、という内容の教師情報をさらに含めて統合してもよい。統合した教師情報は教師情報反映部209に送信される。
One is a case where a plurality of classifications are output from the
もう一つのケースは、1つの分類の提供先に複数のユーザが登録されている場合である。つまり、同じ部門内の複数のユーザからそれぞれ教師情報を受信するケースである。このような場合、多様な教師情報の採用方法がある。例えば、教師情報統合部208は、全てのユーザが共通の評価をした教師情報のみを、教師情報反映部209に出力してよい。換言すれば、教師情報統合部208は、一部のユーザが異なる評価をした場合には、その公報については教師情報として採用しなくてよい。かかる構成によれば、全てのユーザの意見が一致した教師データが反映されることになるので、より堅固な学習モデル202を構築することができる。
Another case is the case where a plurality of users are registered in the provision destination of one classification. That is, it is a case where teacher information is received from a plurality of users in the same department. In such cases, there are various ways to adopt teacher information. For example, the teacher
教師情報統合部208は、一部のユーザが異なる評価をした場合には、多数決によって教師情報を採用してもよい。多数のユーザが評価を行う場合には、全てのユーザの評価が完全に一致しない場合が多くなることも想定される。採用できる教師情報が少ないと教師データも十分なサンプル数とはならない。この結果、学習モデル202の進化が進まず、十分な成果が得られない場合もある。よって、一部のユーザが異なる評価をした場合には、教師情報統合部208は、多数決によって教師情報を採用してもよい。
The teacher
教師情報統合部208は、ユーザ毎に重みを変えてよい。ユーザ毎に習熟度は異なる。したがって、習熟度の高いユーザには重みを重くし、熟練度の低いユーザには重みを軽くする。そして、それぞれのユーザの評価した値(つまり、教師情報)を重みづけ平均した結果を、教師情報反映部209に出力する教師情報として採用してもよい。例えば、習熟度が低い複数のユーザが、分類は不適切であるという教師情報を出力したとしても、習熟度の高いユーザが分類は不適切であるという判断をしていない場合には、教師情報統合部208は、その分類は不適切であるという教師情報を教師情報反映部209に出力しなくてもよい。
The teacher
教師情報統合部208は、リーダとなるユーザからの指示を受け付け可能に構成してよい。複数のユーザのうち、一部のユーザが異なる評価をした場合には、リーダからの指示によって、教師情報として採用するか否かを決定してもよい。具体的には、教師情報統合部208は、他と異なる教師情報が含まれているか否かを判定する。異なる教師情報が含まれている場合、リーダとして登録されているユーザ端末に、どの教師情報を採用するかを問い合わせるUI画面を提供する。そのユーザ端末から採用すべき教師情報の指定を受信すると、教師情報統合部208は、指定された教師情報を採用する。
The teacher
教師情報反映部209は、教師情報統合部208から出力された教師情報を反映する。教師情報反映部209は、分類済みDB210を教師情報に基づいて更新する。例えば、前述の例のように、公報P3を処理対象データとして学習モデル202に入力した場合において、学習モデル202から出力された分類C1の近似度が0.6、分類C2の近似度が0.7、分類C3の近似度が0.8であった場合を例に挙げて説明する。出力結果提供部205は、この結果を受けて、所定の閾値(例えば、0.5)を超える近似度を有する分類が適切な分類であると判定してよい。この結果、出力結果提供部205は、公報P3に対応する分類は、分類C1、分類C2、及び分類C3であると特定する。そして、公報P3に関する情報をそれぞれの分類に対応するユーザ端末261に出力する。また、出力結果提供部205は、公報P3と分類C1、C2、C3とを関連付けた分類済みデータを分類済みDB210に格納する。このとき、統合された教師情報が、公報P3に対する分類は、分類C3が適切であり、分類C1及び分類C2は不適切であることを示す情報であるとする。すると、教師情報反映部209は、分類済みDB210に既に格納されている公報P3に関する分類データを変更する。すなわち、既に格納されている公報P3に関する分類データを、公報P3と分類C3のみとを関連付けた分類データに変更する。
The teacher
また、教師情報反映部209は、統合された教師情報に基づく教師データを教師データ投入部203に出力する。つまり、公報P3を入力データとし、分類C1の近似度の値0、分類C2の近似度の値0、分類C3の近似度の値1を出力データとする教師データを教師データ投入部203に出力する。これを受けて、教師データ投入部203は、教師データをモデル構築部201に投入し、学習モデル202を再度構築する。かかる処理により、教師データを反映した学習モデルを用いて以降の処理対象データの処理が行われることになる。
Further, the teacher
図5は、本実施形態にかかる処理の一例を示すフローチャートである。図5に示す処理は、ユーザがユーザ端末261を用いて分類システム200にログインし、教師データを用いて学習モデルを構築する際に分類システム200において実行される。
FIG. 5 is a flowchart showing an example of the processing according to the present embodiment. The process shown in FIG. 5 is executed in the
ステップS501において教師データ投入部203は、教師データを取得する。新規で学習モデルを構築する場合には、教師データ投入部203は、分類済みDB210を参照して、過去に分類担当者などが手作業などで分類をした分類済みのデータを、教師データとして取得してよい。
In step S501, the teacher
ステップS502において教師データ投入部203は、取得した教師データをモデル構築部201に投入する。モデル構築部201は、投入された教師データを用いて学習モデル202を構築する。なお、初期の教師データは任意の教師データを用いてよく、説明した例に限定されるものではない。また、既に学習モデルが構築されている状態においては、ステップS501及びステップS502の処理は省略してよい。
In step S502, the teacher
ステップS503において処理対象データ入力部204は、公報DB250から処理対象データを取得する。例えば、処理対象データ入力部204は、所定の期間に発行された公報に関する新着情報を取得する。処理対象データ入力部204は、ユーザ端末261によって設定された配信頻度などの各種の条件に従って新着情報を取得してよい。処理対象データ入力部204は、取得した新着の公報を処理対象データとして学習モデル202に入力する。学習モデル202は、入力された処理対象データに基づく結果を出力する。
In step S503, the processing target
ステップS504において出力結果提供部205は、出力された結果に従って処理対象データに関する情報をユーザ端末に提供する。学習モデル202からは入力データの公報に対応する、それぞれの分類の近似度を示すデータが出力される。出力結果提供部205は、所定の閾値を超える近似度を有する分類を特定する。出力結果提供部205は、提供先DB206を参照して、特定した分類に対応する提供先のユーザを特定する。そして、特定したユーザのユーザ端末に結果を提供する。例えば、出力結果提供部205は、処理対象データを識別する識別情報のリストをユーザ端末に提供してもよい。
In step S504, the output
ステップS505において、教師情報受信部207は、ユーザからの教師情報を受信する。ユーザ端末261には、例えばユーザが属する開発部門に関連する分類が付された公報データや、公報のリストが送付される。ユーザは、ユーザ端末261を用いて公報を確認し、自身の開発部門に関係ないと判断した公報を、不適切な分類がされた公報であることを指定する。
In step S505, the teacher
図6は、ユーザが自身の開発部門に関係ないと判断した公報を、不適切な分類がされた公報であることを指定するUI画面600の一例を示す図である。UI画面600はユーザ端末261に表示される。UI画面600には、ユーザが所属する開発部門D1用の新着の公報のリストが表示されている。ユーザは、リストに並んで表示されているチェックボックスをチェックして、不適切な分類がされた公報であることを指定したり、プルダウンメニューによって適切な分類先を指定したりすることができる。図6はリストの画面例を示しているが、それぞれの公報の詳細を表示する詳細画面においてチェックボックスやプルダウンメニューを表示してもよい。このようなUI画面600を介して不適切な分類がされた公報であることが指定されると、当該情報が教師情報として送信される。また、ユーザが適切な分類先が判断できる場合には、プルダウンメニューによって適切な分類先が指定されてもよく、この場合、適切な分類先も教師情報として送信されてよい。
FIG. 6 is a diagram showing an example of a
ステップS506において教師情報統合部208は、教師情報受信部207で受信した複数の教師情報を統合する。例えば、教師情報統合部208は、ある特定の公報に関して複数の教師情報が教師情報受信部207で受信された場合、当該教師情報を統合する。
In step S506, the teacher
ステップS507において教師情報反映部209は、教師情報を分類済みDB210に反映する。例えば、分類済みDB210においては、公報P3に関連付けられた分類が分類C1、分類C2、分類C3である分類データが格納されているとする。このとき、分類C1と分類C2とが間違っている旨の教師情報が得られた場合、教師情報反映部209は、公報P3に関連付けられる分類をC3のみとする分類データに更新する。
In step S507, the teacher
ステップS508において教師情報反映部209は、教師情報をもとに教師データを生成する。上記の例では、公報P3を入力データとし、分類C1の近似度の値0、分類C2の近似度の値0、分類C3の近似度の値1を出力データとする教師データを生成する。生成した教師データは、教師データ投入部203に出力される。
In step S508, the teacher
ステップS509において教師データ投入部203は、教師データをモデル構築部201に出力する。モデル構築部201は、教師データに基づいて学習モデル202を構築する。
In step S509, the teacher
ステップS510において処理対象データ入力部204は、次の処理対象データがあるかを判定する。例えば、次の新着の公報を取得するタイミングであるかを判定する。次の処理対象データがある場合には、ステップS503に進み、以降、処理を繰り返す。
In step S510, the processing target
なお、図示していないが、ユーザ端末261から分類処理の中止の指示を受け付けた時点で、図5に示す処理が終了してよい。
Although not shown, the process shown in FIG. 5 may be completed when the instruction to stop the classification process is received from the
以上説明したように、本実施形態によれば、社内分類を付与する処理を学習モデル202に実行させることができるので、分類付与を効率的に行うことができる。また、学習モデル202が出力した結果を教師データとして用いることで、学習モデル202を進化させることができ、分類結果のフィードバックを効率的に活用することができる。
As described above, according to the present embodiment, the
<実施形態2>
実施形態1では、特定の公報に関する情報を処理対象データとして入力した場合に、学習モデルがその特定の公報に対するそれぞれの分類の近似度を出力する形態を説明した。「社内分類の利用形態」の項において説明したように、各開発部門では、分類された公報それぞれに対して評価を付すことが行われている。実施形態2においては、評価を、近似度を調整するパラメータとして用いる形態を説明する。実施形態1の例では、教師データとしては、分類が適切であることを示す値1と適切でないかを示す値0とを用いる例を説明した。実施形態2では、評価に応じて、教師データとして用いる出力データの値を、0以上1以下の間の任意の値として用いる形態を説明する。
<Embodiment 2>
In the first embodiment, when information about a specific publication is input as data to be processed, a mode in which the learning model outputs the degree of approximation of each classification to the specific publication has been described. As explained in the section "Usage of in-house classification", each development department evaluates each classified gazette. In the second embodiment, a mode in which the evaluation is used as a parameter for adjusting the degree of approximation will be described. In the example of the first embodiment, an example in which a
また、実施形態1では、学習モデル202から出力される近似度を示す値は、分類が正しいか否かの判定の場面において用いられる形態を説明した。実施形態2では、近似度を示す値に応じてユーザ端末に提供される情報のリストの順序を変更する形態も併せて説明する。
Further, in the first embodiment, the form in which the value indicating the degree of approximation output from the
実施形態2における分類システムの構成は、実施形態1で説明したものと同様とすることができる。 The configuration of the classification system in the second embodiment can be the same as that described in the first embodiment.
実施形態2においては、分類済みDB210には、それぞれの公報に関して少なくとも1つの分類と当該分類の評価とが関連付けられた評価付分類データが格納される。図7は、分類済みDB210に格納される評価付分類データの一例を示す図である。例えば公報P31には、2つの分類C1、C2が関連付けられている。さらに、公報P31の分類C1に関しては、重みづけ大という評価が関連付けられており、公報P31の分類C2に関しては、重みづけ小という評価が関連付けられている。この重みづけ大や重みづけ小といった評価は、各開発部門において付された評価である。例えば、自社技術との関連度を示す評価である。評価が高いほど、つまり、重みづけが大であるほど、自社技術との関連度が高いことを示し注目すべき公報であることを示している。
In the second embodiment, the
実施形態2において教師データ投入部203は、教師データとして、評価が付された分類データを用いる。教師データ投入部203は、図7に示すような評価付分類データをスコア化する。
In the second embodiment, the teacher
図8は、スコア化の例を説明するための図である。図8は、スコアに換算する際に用いられる換算テーブルの一例を示す図である。換算テーブルにおいては、それぞれの評価に対する重みづけのパラメータが設定されている。例えば、公報P31の分類C1に付されている評価が「重みづけ大」である場合、公報P31の分類C1に対しては、値1のスコアが付される。公報P31の分類C2に付されている評価が「重みづけ小」である場合、公報P31の分類C2に対しては、値0.6のスコアが付される。
FIG. 8 is a diagram for explaining an example of scoring. FIG. 8 is a diagram showing an example of a conversion table used when converting to a score. In the conversion table, weighting parameters for each evaluation are set. For example, when the evaluation attached to the classification C1 of the publication P31 is "high weighting", a score of a
図9は、実施形態2における教師データの一例を示す図である。実施形態1で説明したように、それぞれの公報に関して、入力データとして要約文のテキストデータを用いている。一方、実施形態1とは異なり、出力データとして、評価に基づいてスコア化した値を、近似度を示す値として用いている。図9は、図7で示す公報P31及び公報P32を教師データとして用いる例を示している。公報P31には分類C1及び分類C2が付与されており、分類C3は付与されていない。したがって、図9の教師データにおいては、公報P31に対する分類C3の近似度は値0が設定されている。また、公報P31の分類C1に付されている重みづけは「重みづけ大」であるので、図9の教師データにおいては、公報P31に対する分類C1の近似度は値1が設定されている。また、公報P31の分類C2に付されている重みづけは「重みづけ小」であるので、図9の教師データにおいては、公報P31に対する分類C3の近似度は値0.6が設定されている。
FIG. 9 is a diagram showing an example of teacher data in the second embodiment. As described in the first embodiment, the text data of the abstract is used as the input data for each publication. On the other hand, unlike the first embodiment, as the output data, a value scored based on the evaluation is used as a value indicating the degree of approximation. FIG. 9 shows an example in which the publications P31 and P32 shown in FIG. 7 are used as teacher data. Classification C1 and classification C2 are attached to Gazette P31, and classification C3 is not given. Therefore, in the teacher data of FIG. 9, a
教師データ投入部203が、このような教師データをモデル構築部201に投入すると、モデル構築部201は、教師データに従って学習モデル202を構築する。構築した学習モデル202に対して処理対象データ入力部204が処理対象データを入力すると、学習モデル202は出力データとして所定の出力値(近似度を示す値)を出力する。
When the teacher
出力結果提供部205は、学習モデル202から出力された結果をユーザ端末261に提供する。例えば、実施形態1で説明したように、出力結果提供部205は、所定の閾値を超える近似度を有する分類を処理対象データとして入力した公報の分類と特定する。出力結果提供部205は、所定の閾値を超える近似度を有する公報の中で近似度に従って並び順を変えた公報のリストをユーザ端末261に提供してよい。例えば、分類C1として分類された公報のリストを開発部門D1のユーザに提供することを想定する。また、処理対象データとして、新着の公報群が学習モデル202に入力されたものと想定する。この場合、出力結果提供部205は、学習モデル202から出力された、分類C1に関する近似度が所定の閾値を超えている公報を抽出する。そして、抽出した公報の中から、分類C1に関して近似度の値が高い順に公報の並び順を変更したリストを生成する。出力結果提供部205は、このように生成したリストをユーザ端末261に提供してよい。
The output
図10は、出力結果提供部205から提供されたリストをユーザ端末261で表示するUI画面の例を示す図である。実施形態2では、それぞれの公報に対して重みづけを付与することが可能である。このように重みづけが付与された公報が教師情報として教師情報受信部207で受信される。ここで、重みづけの付与にリストボックスを使用したが、値を直接入力するインボックスでもよく、他の画面入力のためのコントロールであってもよい。
FIG. 10 is a diagram showing an example of a UI screen for displaying the list provided by the output
教師情報統合部208は、実施形態1で説明したように、複数の教師情報を統合してよい。例えば、多数決を採用してもよいし、重みづけをすることを採用してもよいし、ユーザが決定することを採用してもよい。
The teacher
教師情報反映部209は、実施形態1で説明したように、教師情報を反映した教師データを生成して、教師データ投入部203に出力する。例えば図8に示すような換算テーブルを用いて重みづけを反映した教師データを生成する。なお、本実施形態においては換算テーブルは全ての分類で共通のものを用いる例を示しているが、これに限られない。分類ごとに異なる換算テーブルを用いてもよい。教師データ投入部203は、教師データをモデル構築部201に投入し、モデル構築部201は、学習モデル202を構築する。
As described in the first embodiment, the teacher
以上説明したように、本実施形態においては、ユーザの評価を教師データの要素に含めることができるので、より適切な分類を出力する学習モデル202を構築することができる。
As described above, in the present embodiment, since the user's evaluation can be included in the element of the teacher data, the
実施形態2においては説明を簡略化するために、大分類だけを用いる例を説明したが、大分類の中に中分類があってもよく、中分類の中にさらに小分類を設ける構成としてもよい。このような場合には、パラメータをより細分化すればよい。 In the second embodiment, in order to simplify the explanation, an example in which only the major classification is used has been described, but there may be a middle classification in the major classification, and a configuration in which a further minor classification is provided in the middle classification is also possible. good. In such a case, the parameters may be further subdivided.
実施形態2においては、近似度が高い順に公報の並び順を変更してユーザ端末261で表示する例を説明したが、実施形態1においても同様の表示態様を採用してよい。すなわち、分類に評価(重みづけ)が付与されず、教師情報としても評価(重みづけ)に関する情報を用いない場合であっても、学習モデル202が出力した近似度に応じて並び順を変更した公報のリストをユーザ端末261に提供してよい。
In the second embodiment, the example in which the order of the publications is changed in descending order of the degree of approximation and displayed on the
<実施形態3>
実施形態1では、特定の公報に関する情報を処理対象データとして入力した場合に、学習モデルがその特定の公報に対するそれぞれの分類の近似度を出力する形態を説明した。実施形態3では、分類の近似度に加え、特定の公報に関する情報を処理対象データとして入力した場合に、学習モデルがその特定の公報に対する危険度を出力する形態を説明する。ここで、危険度とは、対象会社、対象事業、対象製品、対象部品等の対象物の抵触性を意味し、より具体的には、対象物が特定の公報に対して抵触するかどうかを示す度合いである。実施形態3では、まず、実施形態1で説明した分類の近似度に加え、学習モデル202に危険度を学習させ、処理対象データを学習モデルに入力して分類の近似度及び危険度を出力する例を説示する。
<Embodiment 3>
In the first embodiment, when information about a specific publication is input as data to be processed, a mode in which the learning model outputs the degree of approximation of each classification to the specific publication has been described. In the third embodiment, in addition to the degree of approximation of the classification, when information about a specific publication is input as data to be processed, the learning model outputs the degree of risk for the specific publication. Here, the degree of risk means the conflict of the target object such as the target company, the target business, the target product, and the target part, and more specifically, whether or not the target object conflicts with a specific publication. It is the degree to show. In the third embodiment, first, in addition to the approximation degree of classification described in the first embodiment, the
実施形態3における分類システムの構成は、実施形態1で説明したものと同様とすることができる。 The configuration of the classification system in the third embodiment can be the same as that described in the first embodiment.
実施形態3においては、分類済みDB210には、それぞれの公報に関して少なくとも1つの分類と当該分類の近似度と危険度が関連付けられて格納される。
In the third embodiment, the
実施形態3において教師データ投入部203は、教師データとして、分類済みDB210に格納されている公報、この公報に付与されている分類及びその近似度並びに危険度を用いる。
In the third embodiment, the teacher
図11は、実施形態3における教師データの一例を示す図である。実施形態1で説明したように、それぞれの公報に関して、入力データとして要約文のテキストデータを用いている。図11は、公報P1及び公報P2を教師データとして用いる例を示している。公報P1には分類C1に近似度1が付与され、分類C2に近似度0が付与され、分類C3に近似度1が付与され、危険度0.8が付与されている。また、公報P2には分類C1に近似度1が付与され、分類C2に近似度0が付与され、分類C3に近似度0が付与され、危険度1が付与されている。ここで、この例では、一の公報に一の危険度が付与されているが、一の公報の分類一つに危険度が付与されてもよい。
FIG. 11 is a diagram showing an example of teacher data in the third embodiment. As described in the first embodiment, the text data of the abstract is used as the input data for each publication. FIG. 11 shows an example in which Gazette P1 and Gazette P2 are used as teacher data. In the publication P1, the degree of
教師データ投入部203が、このような教師データをモデル構築部201に投入すると、モデル構築部201は、教師データに従って学習モデル202を構築する。構築した学習モデル202に対して処理対象データ入力部204が処理対象データを入力すると、学習モデル202は出力データとして所定の出力値(分類の近似度及び危険度)を出力する。
When the teacher
出力結果提供部205は、学習モデル202から出力された結果をユーザ端末261に提供する。例えば、実施形態1で説明したように、出力結果提供部205は、所定の閾値を超える近似度を有する分類を処理対象データとして入力した公報の分類と特定する。出力結果提供部205は、所定の閾値を超える近似度を有する公報の中で近似度に従って並び順を変えた公報のリストに危険度を含めてユーザ端末261に提供してよい。例えば、分類C1として分類された公報のリストを開発部門D1のユーザに提供することを想定する。また、処理対象データとして、新着の公報群が学習モデル202に入力されたものと想定する。この場合、出力結果提供部205は、学習モデル202から出力された、分類C1に関する近似度が所定の閾値を超えている公報を抽出する。そして、抽出した公報の中から、分類C1に関して近似度の値が高い順に公報の並び順を変更したリストを生成する。出力結果提供部205は、このように生成したリストをユーザ端末261に提供してよい。ここで、リストには危険度も含まれているため、危険度の値が高い順に公報の並び順を変更したリストを生成して用いることもできる。また、ユーザに提示する公報は、近似度が所定の閾値を超えているものでなく、これに代えて、危険度が所定の閾値を超えている公報であってもよい。
The output
図12は、出力結果提供部205から提供されたリストをユーザ端末261で表示するUI画面の例を示す図である。実施形態3では、それぞれの公報に対して分類及び危険度が付与されて表示されている。ここで、この表示されているリスト内で近似度も表示させることもできる。そして、ユーザは分類及びその近似度、並びに、危険度のいずれかを修正することも可能で、対象の公報と、修正された分類及びその近似度、並びに、危険度とが教師情報として教師情報受信部207で受信される。
FIG. 12 is a diagram showing an example of a UI screen for displaying the list provided by the output
教師情報統合部208は、実施形態1で説明したように、複数の教師情報を統合してよい。例えば、多数決を採用してもよいし、重みづけをすることを採用してもよいし、ユーザが決定することを採用してもよい。
The teacher
以上説明したように、本実施形態においては、ユーザの評価を教師データの要素に含めることができるので、より適切な分類及び危険度を出力する学習モデル202を構築することができる。
As described above, in the present embodiment, since the user's evaluation can be included in the element of the teacher data, it is possible to construct a
なお、実施形態3では、1つの学習モデルである学習モデル202が公報、分類、近似度及び危険度を教師データとして学習した構成にて説明したが、分類のための学習モデルと危険度のための学習モデルを分けて構成することもでき、そして、この危険度のための学習モデルはさらに分類別に学習モデルを細分化した構成であってもよい。具体的には、C1、C2という分類があった場合に、分類のための学習モデルは一つであり、危険度のための学習モデルをC1用とC2用で準備する。このような構成の場合、予めユーザにて設定された分類、近似度、危険度を読出し、まずは、対象の公報と、分類及び近似度を分類のための学習モデルに学習させ、次に、分類された公報を、その分類に対応する危険度のための学習モデルに公報及び危険度を用いて学習させる。特定の公報に関する情報を処理対象データとして入力した場合に、まず、分類のための学習モデルが適切な分類を出力し、出力された分類に対応する危険度のための学習モデルで処理させることで対象公報の危険度が出力される。ここでの危険度は、対象分類における危険度と言える。
In the third embodiment, the
また、前記した対象分類における危険度を出力するために、分類に対応する危険度のための学習モデルを、分類のための学習モデルに加えて用いたが、対象分類における危険度だけでなく、対象部署の危険度、対象装置の危険度を出力する構成であってもよく、それぞれ対象部署の危険度のための学習モデル、対象装置の危険度のための学習モデルを構築することで実現することができる。この場合において、入力する教師データは公報データとこの公報データの危険度を、対応する対象部署の危険度のための学習モデル、対応する対象装置の危険度のための学習モデルに学習させることが必要となる。これにより、例えば、ユーザが製品Aに関して抵触可能性がある公報を複数発見し、それぞれ危険度を数量化した値を付与し、製品Aの危険度のための学習モデルに学習させることで、新規の公報をこの学習モデルに処理対象データとして入力した場合に、学習モデルが対象の公報に対する危険度を出力する。つまり、製品Aが対象の公報に抵触する程度である危険度を出力する。加えて、実施形態では学習モデルにより分類を付与することを前提にした説明を行ってきたが、前記した学習モデルにより危険度を付与する構成は、必ずしも分類を付与する動作を含めなくともよく、学習モデルにより対象公報の危険度を出力する動作のみも本願発明の範囲に含まれる。逆に、学習モデルにより危険度を求め、その後に、分類を付与する構成であってもよい。 Further, in order to output the degree of risk in the above-mentioned target classification, a learning model for the degree of risk corresponding to the classification was used in addition to the learning model for classification, but not only the degree of risk in the target classification but also the learning model was used. It may be configured to output the risk level of the target department and the risk level of the target device, which is realized by constructing a learning model for the risk level of the target department and a learning model for the risk level of the target device, respectively. be able to. In this case, the input teacher data may train the gazette data and the risk level of this gazette data to the learning model for the risk level of the corresponding target department and the learning model for the risk level of the corresponding target device. You will need it. As a result, for example, the user discovers a plurality of publications that may conflict with respect to the product A, assigns a quantified value to each of the publications, and trains the learning model for the risk of the product A to be new. When the publication of is input to this learning model as processing target data, the learning model outputs the degree of risk for the target publication. That is, the degree of risk that the product A conflicts with the target publication is output. In addition, although the description has been made on the premise that the classification is given by the learning model in the embodiment, the configuration for giving the degree of risk by the learning model described above does not necessarily include the operation of giving the classification. Only the operation of outputting the risk level of the target publication by the learning model is included in the scope of the present invention. On the contrary, it may be configured to obtain the degree of risk by a learning model and then give a classification.
さらに、実施形態3では危険度を説示したが、図1のW3で重みづけに代えて危険度を開発部門が設定する構成であってもよい。 Further, although the degree of danger is explained in the third embodiment, the degree of danger may be set by the development department instead of the weighting in W3 of FIG.
上述した実施形態においては、主に特許に関する公報の分類を例に挙げて説明したが、これに限られない。任意の種類の公報の分類処理に適用することができる。 In the above-described embodiment, the classification of the publications relating to patents has been mainly described as an example, but the present invention is not limited to this. It can be applied to the classification process of any kind of publication.
<実施形態4>
実施形態1では、特定の公報に関する情報を処理対象データとして入力した場合に、学習モデルがその特定の公報に付与され得る複数の社内分類それぞれの近似度を出力する形態を説明した。実施形態4では、出願に関する情報を処理対象データとして入力した場合に、学習モデルが、IPC、CPC(Cooperative Patent Classification)、ECLA(European Classification)、ICO(In Computer Only)、FI(File Index)、Fターム等、その出願に付与され得る複数の国内外の特許庁及び国際機関等による分類と、その近似度を出力する形態を説明する。
<Embodiment 4>
In the first embodiment, when information about a specific publication is input as data to be processed, a mode in which the learning model outputs the degree of approximation of each of a plurality of in-house classifications that can be given to the specific publication has been described. In the fourth embodiment, when the information regarding the application is input as the processing target data, the learning model is IPC, CPC (Cooperative Patent Classification), ECLA (European Classification), ICO (In Computer Only), FI (File Index), and the like. We will explain the classification by multiple domestic and foreign patent offices and international organizations that can be granted to the application such as F-term, and the form to output the degree of closeness.
実施形態4における分類システムの構成は、実施形態1で説明したものと同様とすることができる。 The configuration of the classification system in the fourth embodiment can be the same as that described in the first embodiment.
本実施形態に係る分類システム200のモデル構築部201は、出願に関する複数の入力データと、出願に付与される少なくとも1つの分類を示す出力データとの関係を示す教師データに基づいて、学習モデルを構築する。モデル構築部201が実行する処理は、実施形態1に記載したものと同様である。ここで、出願は、特許出願、実用新案登録出願、意匠登録出願又は商標登録出願であってよく、出願に関する複数の入力データとは、出願に際して提出される書類や物件に関するデータである。
The
処理対象データ入力部204は、出願に関する複数の処理対象データを、複数の入力データとして、学習モデルに入力する。より具体的には、出願が特許出願又は実用新案登録出願である場合、複数の処理対象データは、願書、明細書、特許請求の範囲又は実用新案登録請求の範囲、図面及び要約書のうち少なくともいずれかを含んでよい。また、出願が意匠登録出願である場合、複数の処理対象データは、願書並びに願書に記載された意匠に係る物品、意匠に係る物品の説明、意匠の説明及び図面のうち少なくともいずれかを含んでよい。ここで、図面は、正面図、左右の側面図、背面図、斜視図等を含んでよい。さらに、出願が商標登録出願である場合、複数の処理対象データは、願書並びに願書に記載された指定商品、指定役務及び商標のうち少なくともいずれかを含んでよい。ここで、商標は、文字、図形、色彩のみ、音、ホログラム等を含んでよい。
The processing target
本実施形態に係る分類システム200は、実施形態1に係る分類システム200と同様に、複数の処理対象データの入力に応じて学習モデルから出力された結果に従って、複数の処理対象データに関する情報をユーザ端末261に提供する提供部(出力結果提供部205)と、ユーザ端末261から、教師データの元となる教師情報を受信する受信部(教師情報受信部207)と、教師情報に応じた教師データをモデル構築部201に投入する教師データ投入部203と、を有する。
Similar to the
さらに、本実施形態に係る分類システム200の提供部は、複数の処理対象データのうち、出願に付与されると判断された少なくとも1つの分類が、付与されると判断された根拠となる処理対象データをユーザ端末261に提供する。
Further, the providing unit of the
図13は、ユーザ端末におけるUI画面の他の例を示す図である。同図に示すUI画面がユーザ端末261に表示されることで、ユーザは、出願に関する複数の入力データを選択して、分類システム200から提供された出願に付与され得る複数の分類と、付与根拠とを確認することができる。
FIG. 13 is a diagram showing another example of the UI screen in the user terminal. By displaying the UI screen shown in the figure on the
ユーザは、入力データ301の項目に、出願に関するデータを入力する。例えば、出願が特許出願の場合、入力データ301の項目に、願書、明細書、特許請求の範囲、図面及び要約書に関するデータを入力してよい。入力データ301の項目にデータを入力すると、項目指定画面302に、入力データ301に含まれる項目が列挙される。ユーザは、項目指定画面302によって、要約書に記載された要約や、特許請求の範囲の全請求項又は一部の請求項を指定して、学習モデルに入力する複数の処理対象データの一部を指定することができる。同様に、段落指定画面303には、入力データ301に含まれる明細書の段落が列挙される。ユーザは、段落指定画面303によって、明細書の段落を指定し、学習モデルに入力する複数の処理対象データの一部を指定することができる。ユーザは、処理対象データの指定を終えた場合、候補抽出ボタン304を押下して、指定した複数の処理対象データを学習モデルに入力し、出願に付与される少なくとも1つの分類を示す出力データを得る。出力データは、入力データに対応する出願に付与され得る複数の分類のそれぞれの近似度を示す値を含む。
The user inputs data related to the application in the item of
UI画面の分類候補305には、出願に付与され得る複数の分類と、複数の分類それぞれの近似度が示される。本例では、出願に付与され得る複数の分類は、「G06F 15/60」と「G06F 17/00」というIPCであり、近似度は、「G06F 15/60」について「近似値1」、「G06F 17/00」について「近似値0.8」である。本例では、近似度の降順にソートして出願に付与され得る複数の分類を表示しているが、表示の順序は任意である。
The
ユーザによって、分類候補305に表示された複数の分類のうちいずれか1つが選択されると、その分類について、付与根拠となった項目が項目単位の付与根拠記載箇所306に表示され、付与根拠となった明細書の段落が段落単位の付与根拠記載箇所307に表示される。さらに、項目単位の付与根拠記載箇所306に表示された項目や、段落単位の付与根拠記載箇所307に表示された段落のうち1つを選択すると、その項目や段落が、付与根拠記載箇所308に全文表示される。なお、分類候補305に表示された複数の分類のうちいずれか1つをダブルクリックすることで、その分類の説明を表示させることができる。このようにしてユーザは、学習モデルによって自動付与された分類の付与根拠となる記載を確認して、分類の妥当性を確かめることができる。
When one of the plurality of categories displayed in the
本実施形態に係る分類システム200は、複数の項目又は複数の段落をそれぞれ別個に学習モデルに入力した場合に、学習モデルの出力データによって示される分類の近似度が所定値以上の項目又は段落を、付与根拠と決定してよい。また、分類システム200は、複数の項目及び複数の段落を学習モデルに入力した場合と、複数の項目及び複数の段落のうち特定の項目又は特定の段落を削除した入力データを学習モデルに入力した場合とで、出力データがどのように変化するかに基づき、分類の付与根拠を決定してよい。例えば、特定の項目又は特定の段落を削除すると、近似度が閾値以上下がる場合には、その特定の項目又は特定の段落を付与根拠としてよい。ここで、付与根拠の粒度を段落とした例を説明したが、同様の処理にて文章単位、句単位、単語単位を付与根拠とすることもできる。そして、付与根拠となった箇所についてハイライトにする構成であってもよい。ハイライトの例としては、付与根拠の段落、文章、句、単語のみ、他の箇所と比べて文字の背景色を変えることや、他の箇所と比べて文字色を変えること、文字に下線を引いたり太字としたりフォントの大きさを大きくして強調表示したりすることが挙げられる。加えて、図13の応用例としては、付与根拠となる段落を付与根拠記載箇所308に表示すると共に、付与根拠の文章、句、単語を更にハイライトする機能を提供してもよい。
In the
ユーザは、分類候補305に表示された複数の分類の中から、出願の特徴を最も良く表していると考えられる分類を選択して、筆頭決定ボタン309を押下することで、その分類を筆頭分類として出願に付与することができる。また、ユーザは、分類候補305に表示された複数の分類の中から、出願の特徴を良く表していると考えられる分類を選択して、分類決定ボタン310を押下することで、その分類を出願に付与することができる。
The user selects the classification that is considered to best represent the characteristics of the application from the plurality of classifications displayed in the
提供部は、ある分類が出願に付与されると判断された根拠となる処理対象データが、複数の処理対象データのうち所定の処理対象データに含まれる場合、その分類を筆頭分類としてユーザ端末に提供してもよい。ここで、所定の処理対象データとは、出願の特徴を良く表していると考えられるデータであり、例えば出願が特許出願の場合、発明の特徴を良く表していると考えらえる要約や上位請求項の記載である。 When the processing target data that is the basis for determining that a certain classification is given to the application is included in the predetermined processing target data among a plurality of processing target data, the providing department sets the classification as the first classification to the user terminal. May be provided. Here, the predetermined data to be processed is data that is considered to well represent the characteristics of the application. For example, when the application is a patent application, a summary or a higher-level claim that is considered to well represent the characteristics of the invention. It is a description of the section.
また、提供部は、出願に付与され得る複数の分類のうち、その近似度が最も高いものを、筆頭分類としてユーザ端末に提供してもよい。また、分類システム200は、付与根拠として提供した記載箇所が、出願の特徴を良く表している記載箇所である場合に、その付与根拠に基づいて付与された分類を筆頭分類としてもよい。
Further, the providing unit may provide the user terminal with the one having the highest degree of approximation among the plurality of classifications that can be given to the application as the first classification. Further, in the
分類システム200の処理対象データ入力部204は、出願に関するテキストデータ及び画像データを、複数の入力データとして、学習モデルに入力し、モデル構築部201は、テキストデータ及び画像データと、出願に付与される少なくとも1つの分類を示す出力データとの関係を示す教師データに基づいて、学習モデルを構築してもよい。ここで、出願が特許出願の場合、テキストデータは、願書、明細書、特許請求の範囲及び要約書を含んでよく、画像データは、図面並びに明細書中に挿入される化学式、数式及び表を含んでよい。この場合、学習モデルは、単一のモデルであり、テキストデータ及び画像データをひとまとまりのデータとして学習される。入力するテキストデータは、図面を説明する明細書の段落に限ってもよいし、図面をOCR(Optical Character Recognition)処理して得られたものであってもよい。
The processing target
分類システム200の処理対象データ入力部204は、出願に関するテキストデータを、複数の入力データの一部として、学習モデルに含まれる第1サブ学習モデルに入力し、出願に関する画像データを、複数の入力データの一部として、学習モデルに含まれる第2サブ学習モデルに入力し、モデル構築部201は、テキストデータと、出願に付与される少なくとも1つの分類を示す出力データとの関係を示す教師データに基づいて、第1サブ学習モデルを構築し、画像データと、出願に付与される少なくとも1つの分類を示す出力データとの関係を示す教師データに基づいて、第2サブ学習モデルを構築してもよい。この場合、学習モデルは、第1サブ学習モデルと第2サブ学習モデルを含み、第1サブ学習モデルにはテキストデータが入力され、第2サブ学習モデルには画像データが入力される。このように、データの種類毎にサブ学習モデルを別々に構築して、サブ学習モデルの出力データを統合して、出願に付与される分類を示す出力データを構成することとしてもよい。
The processing target
国内外の特許庁及び国際機関等による分類は、統廃合を含んで改定されることがある。そのような場合にも、本実施形態に係る分類システム200を用いてよい。分類の改定があった際、学習モデルを新分類に基づいて再構築するか、学習モデルは旧分類に基づいて構築されたもののままとして、学習モデルの出力データに対して新旧分類の変換を施すこととしてよい。
Classifications by domestic and foreign patent offices and international organizations may be revised, including consolidation. Even in such a case, the
また、本例では、IPCが分類候補305に表示される例について説明したが、分類候補305には、CPC、ECLA、ICO、FI又はFタームといった国内外の特許分類が表示されてもよい。
Further, in this example, an example in which the IPC is displayed in the
また、入力データが意匠登録出願に関するデータである場合、分類候補305には、意匠分類やDターム等の国内外の意匠分類が表示されてよい。同様に、入力データが商標登録出願に関するデータである場合、分類候補305には、図形商標の図形分類や指定商品役務の類似群コード、ニース分類等の国内外の商標に関する分類が表示されてよい。この場合、学習モデルは、商標を入力データとして、図形分類等を出力データに含むものであってもよいし、指定商品役務を入力データとして、類似群コードやニース分類を出力データとして含むものであってもよい。
When the input data is data related to a design registration application, the
なお、学習モデルは、指定商品役務を入力データとして、適切な指定商品役務を出力データとした教師データによって構築してもよい。ここで、適切な指定商品役務とは、登録になった指定商品役務をいう。また、学習モデルは、商標を入力データとして、指定商品役務を出力データとした教師データによって構築してもよい。これにより、類似する商標を出願する際に、指定すべき指定商品役務を提案する学習モデルが得られる。また、学習モデルは、商標を入力データとして、称呼を出力データとした教師データによって構築してもよい。 The learning model may be constructed by teacher data using designated goods and services as input data and appropriate designated goods and services as output data. Here, the appropriate designated goods and services refer to the registered designated goods and services. Further, the learning model may be constructed by teacher data using the trademark as input data and the designated goods and services as output data. This provides a learning model that proposes designated goods and services to be designated when filing a similar trademark application. Further, the learning model may be constructed by teacher data using the trademark as input data and the title as output data.
本実施形態4で記載されている事項は、適宜、前記各実施形態1、2及び3に適用することができ、例えば、例示1として、実施形態1、2又は3での社内分類に加え、本実施形態4の公報分類を付与する構成とし、自社出願について社内分類と公報分類を付与することができる。ここで付与された公報分類は、出願人が出願時に付与する公報分類として用いることができ、出願公開時に特許庁が付与した公報分類が公開されてデータとして取り込まれた際に、実施形態4で付与した公報分類を特許庁が付与した公報分類に上書きしてもよい。また、例示2として、実施形態4では公報分類の付与根拠を表示する構成としたように、前記各実施形態1、2及び3においても社内分類の付与根拠を表示する構成であってもよい。
The matters described in the fourth embodiment can be appropriately applied to the first, second and third embodiments, for example, in addition to the in-house classification in the first, second or third embodiment, as an example 1. The configuration is such that the publication classification of the fourth embodiment is given, and the in-house classification and the publication classification can be given to the in-house application. The gazette classification given here can be used as the gazette classification given by the applicant at the time of filing, and when the gazette classification given by the JPO at the time of publication of the application is published and incorporated as data, in the fourth embodiment. The granted gazette classification may be overwritten with the gazette classification granted by the JPO. Further, as Example 2, the configuration may be such that the grounds for granting the in-house classification are displayed in the
逆に、実施形態1、2又は3に記載されている事項を、適宜、本実施形態4に適用することもでき、例えば、実施形態1に記載の、複数ユーザ端末から受信した教師情報を統合する機能(本機能に、複数ユーザ端末からの教師情報が異なる場合に多数決で決定するサブ機能、ユーザ毎の重みを加味して教師情報を決定するサブ機能、リーダからの指示に基づいて教師情報を決定するサブ機能を付加してもよい)を本実施形態4に適用することもできる。 On the contrary, the matters described in the first, second or third embodiment can be appropriately applied to the fourth embodiment, and for example, the teacher information received from the plurality of user terminals described in the first embodiment is integrated. (This function has a sub-function that determines teacher information by majority vote when teacher information from multiple user terminals is different, a sub-function that determines teacher information by adding weight to each user, and teacher information based on instructions from the reader. A sub-function for determining the above may be added) can also be applied to the fourth embodiment.
上述した実施形態の機能を実現するための各部は、例えばハードウェアまたはソフトウェアによって実装することができる。ソフトウェアによって実装される場合、ハードウェアを制御するプログラムコードをCPU、MPUなどの各種のプロセッサによって実行されてもよい。プログラムコードの機能を実現するための回路等のハードウェアを設けてもよい。プログラムコードの一部をハードウェアで実現し、残りの部分を各種プロセッサが実行してもよい。 Each part for realizing the function of the above-described embodiment can be implemented by hardware or software, for example. When implemented by software, the program code that controls the hardware may be executed by various processors such as CPU and MPU. Hardware such as a circuit for realizing the function of the program code may be provided. Part of the program code may be implemented in hardware, and the rest may be executed by various processors.
200 分類システム
201 モデル構築部
202 学習モデル
203 教師データ投入部
204 処理対象データ入力部
205 出力結果提供部205
206 提供先DB
207 教師情報受信部
208 教師情報統合部
209 教師情報反映部
210 分類済みDB
250 公報DB
261 ユーザ端末
200
206 Destination DB
207 Teacher
250 Gazette DB
261 User terminal
Claims (22)
少なくとも1つの公報に関する処理対象データを、前記入力データとして、前記学習モデルに入力する処理対象データ入力部と、
前記処理対象データの入力に応じて前記学習モデルから出力された結果に従って、前記処理対象データに関する情報をユーザ端末に提供する提供部と、
前記ユーザ端末から、前記教師データの元となる教師情報を受信する受信部と、
前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入部と
を有する、分類システム。 Input data relating to at least one gazette, and output data indicating the degree of risk given to the gazette corresponding to the input data, which is a degree indicating whether or not the object conflicts with the gazette. A model building unit that builds a learning model based on teacher data showing the relationship with
A processing target data input unit that inputs processing target data related to at least one publication to the learning model as the input data, and a processing target data input unit.
A providing unit that provides information on the processing target data to the user terminal according to the result output from the learning model in response to the input of the processing target data.
A receiving unit that receives teacher information that is the source of the teacher data from the user terminal, and
A classification system having a teacher data input unit that inputs the teacher data according to the teacher information to the model construction unit.
少なくとも1つの公報に関する処理対象データを、前記入力データとして、前記学習モデルに入力する処理対象データ入力部と、
前記処理対象データの入力に応じて前記学習モデルから出力された結果に従って、前記処理対象データに関する情報をユーザ端末に提供する提供部と、
前記ユーザ端末から、前記教師データの元となる教師情報を受信する受信部と、
前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入部と
を有する、分類システム。 Input data relating to at least one gazette, output data indicating at least one classification given to at least one gazette corresponding to the input data, and output indicating the degree of risk given to the gazette corresponding to the input data. A model building unit that builds a learning model based on teacher data that shows the relationship with the data,
A processing target data input unit that inputs processing target data related to at least one publication to the learning model as the input data, and a processing target data input unit.
A providing unit that provides information on the processing target data to the user terminal according to the result output from the learning model in response to the input of the processing target data.
A receiving unit that receives teacher information that is the source of the teacher data from the user terminal, and
A classification system having a teacher data input unit that inputs the teacher data according to the teacher information to the model construction unit.
請求項1または請求項2に記載の分類システム。 According to the result output from the learning model, the providing unit provides information on the processing target data to which a risk is given to each of the classifications given to one of the publications included in the input data. To provide to
The classification system according to claim 1 or 2 .
前記モデル構築部は、
少なくとも1つの公報に関する入力データと、前記入力データに対応する少なくとも1つの前記公報に付与される少なくとも1つの分類を示す出力データとの関係を示す教師データに基づいて、前記第1の学習モデルを構築し、
少なくとも1つの公報に関する入力データと、前記入力データに対応する前記公報に付与される危険度を示す出力データとの関係を示す教師データに基づいて、前記第2の学習モデルを構築し、
前記処理対象データ入力部は、少なくとも1つの公報に関する前記処理対象データを、前記入力データとして、前記第1の学習モデルおよび前記第2の学習モデルに入力し、
提供部は、前記処理対象データの入力に応じて前記第1の学習モデルおよび前記第2の学習モデルから出力された結果に従って、前記処理対象データに関する情報を前記ユーザ端末に提供する、
請求項1から請求項3のいずれか一項に記載の分類システム。 The learning model includes a first learning model and a second learning model different from the first learning model.
The model building unit
The first learning model is based on the teacher data showing the relationship between the input data relating to at least one publication and the output data indicating at least one classification given to at least one classification corresponding to the input data. Build and
The second learning model is constructed based on the teacher data showing the relationship between the input data relating to at least one publication and the output data indicating the degree of danger given to the publication corresponding to the input data.
The processing target data input unit inputs the processing target data relating to at least one publication to the first learning model and the second learning model as the input data.
The providing unit provides information on the processing target data to the user terminal according to the results output from the first learning model and the second learning model in response to the input of the processing target data.
The classification system according to any one of claims 1 to 3 .
請求項4に記載の分類システム。 The model building unit is based on teacher data showing the relationship between the input data relating to at least one classified gazette and the output data indicating the degree of risk given to the classified gazette corresponding to the input data. Build the second learning model,
The classification system according to claim 4 .
請求項4に記載の分類システム。 The model building unit has input data relating to at least one publication corresponding to at least one of the target department or the target device, and the publication corresponding to at least one of the target department or the target device corresponding to the input data. The second learning model is constructed based on the output data indicating the degree of danger given to the data and the teacher data indicating the relationship between the two.
The classification system according to claim 4 .
前記モデル構築部は、前記教師情報に応じた前記教師データに基づいて、前記特定の公報に前記特定の分類を付与しない学習モデルを構築する、
請求項1から請求項6のいずれか一項に記載の分類システム。 The teacher information transmitted from the user terminal includes information indicating that a specific classification of a specific publication is not appropriate.
The model building unit builds a learning model that does not assign the specific classification to the specific publication based on the teacher data according to the teacher information.
The classification system according to any one of claims 1 to 6 .
請求項1から請求項7のいずれか一項に記載の分類システム。 The output data to which the relationship is indicated by the teacher data includes a value indicating the degree of approximation of each of the plurality of classifications that can be given to at least one of the publications corresponding to the input data.
The classification system according to any one of claims 1 to 7 .
前記近似度を示す値は、前記評価に応じて決定される、
請求項9または請求項10に記載の分類システム。 The receiving unit receives the teacher information including the evaluation, and receives the teacher information.
The value indicating the degree of approximation is determined according to the evaluation.
The classification system according to claim 9 or 10 .
前記提供部は、近似していることを示す値が高い順序で複数の公報の並び順を変更した公報のリストを前記ユーザ端末に提供する、請求項9から請求項11のいずれか一項に記載の分類システム。 The processing target data input unit inputs the processing target data related to a plurality of publications into the learning model.
The provision unit provides to the user terminal a list of publications in which the order of a plurality of publications is changed in descending order of values indicating approximation, according to any one of claims 9 to 11 . The described classification system.
それぞれの分類に対応するユーザを特定する情報を取得し、
取得した前記ユーザを特定する情報に基づいて、前記学習モデルから出力された分類に対応する前記ユーザの前記ユーザ端末に、前記処理対象データに関する情報を提供する、
請求項9から請求項13のいずれか一項に記載の分類システム。 The providing part
Get the information that identifies the user corresponding to each category,
Based on the acquired information that identifies the user, information regarding the processing target data is provided to the user terminal of the user corresponding to the classification output from the learning model.
The classification system according to any one of claims 9 to 13 .
前記処理対象データの入力に応じて前記学習モデルから出力される近似度が所定の閾値を超える場合、当該閾値を超える近似度を有する分類に対応する前記ユーザの前記ユーザ端末に前記処理対象データを提供し、
前記近似度が所定の閾値以下の場合、当該閾値以下の近似度を有する分類に対応する前記ユーザの前記ユーザ端末に前記処理対象データを提供しない、
請求項14に記載の分類システム。 The providing part
When the degree of approximation output from the learning model in response to the input of the processing target data exceeds a predetermined threshold value, the processing target data is transferred to the user terminal of the user corresponding to the classification having the approximation degree exceeding the threshold value. Offer to,
When the degree of approximation is equal to or less than a predetermined threshold value, the data to be processed is not provided to the user terminal of the user corresponding to the classification having the degree of approximation equal to or less than the threshold value.
The classification system according to claim 14 .
前記受信部は、それぞれのユーザ端末から教師情報を受信し、
複数のユーザ端末から受信した教師情報を統合する統合部をさらに有する、
請求項14または請求項15に記載の分類システム。 When the degree of approximation output from the learning model exceeds the threshold value for a plurality of classifications in response to the input of the processing target data, the providing unit sends the processing target data to the user terminal of the user corresponding to each classification. Provide information about
The receiving unit receives teacher information from each user terminal and receives teacher information.
It also has an integration unit that integrates teacher information received from multiple user terminals.
The classification system according to claim 14 or 15 .
請求項16に記載の分類システム。 When the teacher information of some user terminals is different from the teacher information of other user terminals, the integrated unit determines the teacher information to be adopted by a majority vote.
The classification system according to claim 16 .
ユーザ毎に設定された重み情報を取得し、
一部のユーザ端末の教師情報が他のユーザ端末の教師情報と異なっている場合、ユーザ毎の重みを加味して教師情報を決定する、
請求項16に記載の分類システム。 The integrated part is
Acquires the weight information set for each user,
When the teacher information of some user terminals is different from the teacher information of other user terminals, the teacher information is determined by adding the weight of each user.
The classification system according to claim 16 .
ユーザの中でリーダを識別可能であり、
一部のユーザ端末の教師情報が他のユーザ端末の教師情報と異なっている場合、リーダからの指示を受信し、受信した指示に基づいて教師情報を決定する、
請求項16に記載の分類システム。 The integrated part is
The reader can be identified among the users,
When the teacher information of some user terminals is different from the teacher information of other user terminals, the instruction from the reader is received and the teacher information is determined based on the received instruction.
The classification system according to claim 16 .
少なくとも1つの公報に関する処理対象データを、前記入力データとして、前記学習モデルに入力する処理対象データ入力ステップと、
前記処理対象データの入力に応じて前記学習モデルから出力された結果に従って、前記処理対象データに関する情報をユーザ端末に提供する提供ステップと、
前記ユーザ端末から、前記教師データの元となる教師情報を受信する受信ステップと、
前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入ステップと、
を有する、分類システムの制御方法。 Input data relating to at least one gazette, and output data indicating the degree of risk given to the gazette corresponding to the input data, which is a degree indicating whether or not the object conflicts with the gazette. It is a control method of a classification system having a model building unit that builds a learning model based on teacher data showing the relationship with.
A processing target data input step in which processing target data relating to at least one publication is input to the learning model as the input data,
A provision step of providing information on the processing target data to the user terminal according to the result output from the learning model in response to the input of the processing target data, and a provision step.
A reception step for receiving teacher information that is the source of the teacher data from the user terminal, and
A teacher data input step in which the teacher data corresponding to the teacher information is input to the model construction unit, and
A method of controlling a classification system.
少なくとも1つの公報に関する処理対象データを、前記入力データとして、前記学習モデルに入力する処理対象データ入力ステップと、
前記処理対象データの入力に応じて前記学習モデルから出力された結果に従って、前記処理対象データに関する情報をユーザ端末に提供する提供ステップと、
前記ユーザ端末から、前記教師データの元となる教師情報を受信する受信ステップと、
前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入ステップと、
を有する、分類システムの制御方法。 Input data relating to at least one gazette, output data indicating at least one classification given to at least one gazette corresponding to the input data, and output indicating the degree of risk given to the gazette corresponding to the input data. It is a control method of a classification system having a model building unit that builds a learning model based on teacher data showing the relationship with the data.
A processing target data input step in which processing target data relating to at least one publication is input to the learning model as the input data,
A provision step of providing information on the processing target data to the user terminal according to the result output from the learning model in response to the input of the processing target data, and a provision step.
A reception step for receiving teacher information that is the source of the teacher data from the user terminal, and
A teacher data input step in which the teacher data corresponding to the teacher information is input to the model construction unit, and
A method of controlling a classification system.
A program for making a computer function as each part of the classification system according to any one of claims 1 to 19 .
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016150561 | 2016-07-29 | ||
JP2016150561 | 2016-07-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018026119A JP2018026119A (en) | 2018-02-15 |
JP7038499B2 true JP7038499B2 (en) | 2022-03-18 |
Family
ID=61195307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017141042A Active JP7038499B2 (en) | 2016-07-29 | 2017-07-20 | Classification system, control method of classification system, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7038499B2 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6421963B1 (en) * | 2017-11-19 | 2018-11-14 | 径 神谷 | SEARCH INDEX ESTIMATOR, COMPUTER PROGRAM, AND SEARCH INDEX ESTIMATION METHOD |
JP6839123B2 (en) * | 2018-03-26 | 2021-03-03 | Kddi株式会社 | Information processing equipment, information processing methods, and programs |
JP7068596B2 (en) * | 2018-08-15 | 2022-05-17 | 日本電信電話株式会社 | Learning data creation device, learning data creation method, and program |
JP7218856B2 (en) * | 2018-11-05 | 2023-02-07 | 株式会社アイ・アール・ディー | LEARNER GENERATION DEVICE, LEARNER PRODUCTION METHOD, AND PROGRAM |
CN109766440B (en) * | 2018-12-17 | 2023-09-01 | 航天信息股份有限公司 | Method and system for determining default classification information for object text description |
JP7036049B2 (en) * | 2019-01-18 | 2022-03-15 | オムロン株式会社 | Model integration device, model integration method, model integration program, inference system, inspection system, and control system |
JP7329933B2 (en) * | 2019-03-04 | 2023-08-21 | 公立大学法人大阪 | Similar image retrieval device, similar image retrieval method and similar image retrieval program |
CN113536072A (en) * | 2020-11-16 | 2021-10-22 | 厦门市和家健脑智能科技有限公司 | Method and device for model voting combination of cognitive screening data processing modeling |
CN115393639B (en) * | 2022-08-16 | 2023-08-11 | 广州市玄武无线科技股份有限公司 | Intelligent commodity marking method, intelligent commodity marking system, terminal equipment and readable storage medium |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002358407A (en) | 2001-06-01 | 2002-12-13 | Sonzaisha:Kk | Selection system for business model |
JP2004334441A (en) | 2003-05-06 | 2004-11-25 | Ntt Data Technology Corp | Similar document search method |
JP2005309920A (en) | 2004-04-23 | 2005-11-04 | Alliance Group Inc | Majority vote device, its learning method and multi-class identification device |
JP2005316573A (en) | 2004-04-27 | 2005-11-10 | Konica Minolta Holdings Inc | Information retrieval device |
JP2006285460A (en) | 2005-03-31 | 2006-10-19 | Konica Minolta Holdings Inc | Information search system |
JP2012118977A (en) | 2010-11-29 | 2012-06-21 | Palo Alto Research Center Inc | Method and system for machine-learning based optimization and customization of document similarity calculation |
JP2014112283A (en) | 2012-12-05 | 2014-06-19 | Docomo Technology Inc | Information processing device, information processing method, and program |
JP2015026217A (en) | 2013-07-25 | 2015-02-05 | 日本電信電話株式会社 | System parameter learning device, information processing device, method, and program |
US20150206069A1 (en) | 2014-01-17 | 2015-07-23 | Matthew BEERS | Machine learning-based patent quality metric |
JP2016134163A (en) | 2015-01-21 | 2016-07-25 | 株式会社梟システムズ | Information distribution promotion device, information distribution promotion system, information distribution promotion method, and program |
-
2017
- 2017-07-20 JP JP2017141042A patent/JP7038499B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002358407A (en) | 2001-06-01 | 2002-12-13 | Sonzaisha:Kk | Selection system for business model |
JP2004334441A (en) | 2003-05-06 | 2004-11-25 | Ntt Data Technology Corp | Similar document search method |
JP2005309920A (en) | 2004-04-23 | 2005-11-04 | Alliance Group Inc | Majority vote device, its learning method and multi-class identification device |
JP2005316573A (en) | 2004-04-27 | 2005-11-10 | Konica Minolta Holdings Inc | Information retrieval device |
JP2006285460A (en) | 2005-03-31 | 2006-10-19 | Konica Minolta Holdings Inc | Information search system |
JP2012118977A (en) | 2010-11-29 | 2012-06-21 | Palo Alto Research Center Inc | Method and system for machine-learning based optimization and customization of document similarity calculation |
JP2014112283A (en) | 2012-12-05 | 2014-06-19 | Docomo Technology Inc | Information processing device, information processing method, and program |
JP2015026217A (en) | 2013-07-25 | 2015-02-05 | 日本電信電話株式会社 | System parameter learning device, information processing device, method, and program |
US20150206069A1 (en) | 2014-01-17 | 2015-07-23 | Matthew BEERS | Machine learning-based patent quality metric |
JP2016134163A (en) | 2015-01-21 | 2016-07-25 | 株式会社梟システムズ | Information distribution promotion device, information distribution promotion system, information distribution promotion method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2018026119A (en) | 2018-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7038499B2 (en) | Classification system, control method of classification system, and program | |
US9411790B2 (en) | Systems, methods, and media for generating structured documents | |
US20200142545A1 (en) | Document contribution management system | |
Rai | Identifying key product attributes and their importance levels from online customer reviews | |
CN104951456B (en) | A kind of method, apparatus and equipment for obtaining answer information | |
EP3176717A2 (en) | Control method, processing apparatus, and non-transitory computer-readable recording medium | |
US20140188891A1 (en) | Content creation | |
JP6818706B2 (en) | Information providing equipment, information providing method, and program | |
JP2012003572A (en) | Sensitivity analysis system and program | |
EP2682888A1 (en) | Policy arbitration method, policy arbitration server, and program | |
CN109918409A (en) | A kind of equipment portrait construction method, device, storage medium and equipment | |
US9058328B2 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
Yavuz | Iterated beam search for the combined car sequencing and level scheduling problem | |
US20190266220A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP6388212B2 (en) | Tag assignment method, tag assignment device, program, and question answer search method | |
US10599658B2 (en) | Search device, search method, and non-transitory computer readable medium for performing a search for candidate experts and displaying results of the search | |
JP2014074942A (en) | Information collection program, information collection method and information processor | |
JP2012003573A (en) | Sensitivity analyzing system and program | |
JP2020064443A (en) | E-mail evaluation device, e-mail evaluation program, e-mail evaluation method, and e-mail evaluation system | |
JP2019046388A (en) | Chat system, server, screen generation method and computer program | |
Héder | The machine’s role in human’s service automation and knowledge sharing | |
JP6475565B2 (en) | Apparatus, system, program and method capable of classifying scoring targets | |
JP6985322B2 (en) | Document creation support device, document creation support method and program | |
JP6777907B1 (en) | Business support device and business support system | |
US20210097426A1 (en) | Information processing apparatus, information processing method, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200717 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7038499 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |