JP5310196B2 - Classification system revision support program, classification system revision support device, and classification system revision support method - Google Patents

Classification system revision support program, classification system revision support device, and classification system revision support method Download PDF

Info

Publication number
JP5310196B2
JP5310196B2 JP2009086389A JP2009086389A JP5310196B2 JP 5310196 B2 JP5310196 B2 JP 5310196B2 JP 2009086389 A JP2009086389 A JP 2009086389A JP 2009086389 A JP2009086389 A JP 2009086389A JP 5310196 B2 JP5310196 B2 JP 5310196B2
Authority
JP
Japan
Prior art keywords
category
hypothesis
field
information
viewpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009086389A
Other languages
Japanese (ja)
Other versions
JP2010238041A (en
Inventor
一成 田中
勇 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009086389A priority Critical patent/JP5310196B2/en
Publication of JP2010238041A publication Critical patent/JP2010238041A/en
Application granted granted Critical
Publication of JP5310196B2 publication Critical patent/JP5310196B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To support revision of an efficient classification system while maintaining overall consistency. <P>SOLUTION: A common viewpoint field retrieval means 2 extracts at least two fields each provided with a category in a common viewpoint in reference to a classification system information storage means 1. A hypothesis definition means 5 compares the categories provided in the common viewpoint of the extracted fields 3, 4, sets the category present only in a part of the field of the extracted fields as a category to be added, and defines a hypothesis that the category is added to another field. A hypothesis verification means 7 detects additional category matching information belonging to the category to be added when the category to be added is added according to the hypothesis, and decides whether the hypothesis is proper or not based on the amount of the detected additional category matching information. The hypothesis verification means 7 outputs the hypothesis decided that it is proper as a revision idea 8. <P>COPYRIGHT: (C)2011,JPO&amp;INPIT

Description

本発明は分類体系の改正作業を支援する分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法に関する。   The present invention relates to a classification system revision support program, a classification system revision support device, and a classification system revision support method that support revision work of a classification system.

情報通信技術の発達により、コンピュータを用いて膨大な量の文書情報に容易にアクセス可能となっている。このような膨大な文書情報の中から利用者が必要とする文書を見つけ出すのを容易にするために、予め文書情報を分類しておく技術がある。的確な分類体系の下で文書情報を予め分類しておけば、文書情報の利用者は、目的に応じた類型の文書情報の中から、必要な文書を比較的容易に見つけ出すことができる。このような文書情報の分類を有効活用している例としては、特許文献(公開特許公報、特許公報など)の分類体系がある。   With the development of information communication technology, a huge amount of document information can be easily accessed using a computer. There is a technique for classifying document information in advance in order to easily find a document required by a user from such a large amount of document information. If the document information is classified in advance under an accurate classification system, the user of the document information can find out a necessary document relatively easily from the types of document information according to the purpose. As an example of effectively utilizing such classification of document information, there is a classification system of patent documents (open patent gazette, patent gazette, etc.).

多くの国では、特許文献の分類体系として国際特許分類(IPC:International Patent Classification)が用いられている。各国で発行された特許文献には、IPCによる分類情報が付与されている。また、日本国で発行される特許文献には、IPCに加えて、FIやFタームといった複数の分類情報が付与されている。FIは、IPCをさらに展開したものである。Fタームは、日本国特許庁において開発された検索コード体系である。IPC、FI、Fタームといった分類体系は、日本国特許庁内部での特許審査のための先行技術調査や、企業での様々な技術調査に活用されている。   In many countries, the International Patent Classification (IPC) is used as a classification system for patent documents. Classification information by IPC is given to patent documents issued in each country. In addition to IPC, a plurality of classification information such as FI and F-term are given to patent documents issued in Japan. FI is a further development of IPC. F-term is a search code system developed by the Japan Patent Office. Classification systems such as IPC, FI, and F-term are utilized in prior art searches for patent examinations within the Japan Patent Office and various technical searches in companies.

これらの特許分類体系のうち特にFタームでは、各分野に固有の技術要素の細分類など多種多様な観点が設定されている。さらにFタームでは、観点の下に分類の観点に基づいて分類する際のカテゴリを示す数字が設定されている。観点とその観点に基づいて設定されたカテゴリは、分野ごとに設定される。   Among these patent classification systems, especially in the F term, various viewpoints such as fine classification of technical elements unique to each field are set. Further, in the F term, a number indicating a category for classification based on a classification viewpoint is set under the viewpoint. A viewpoint and a category set based on the viewpoint are set for each field.

ところでFタームによる分類では、異なる分野に対して、同じ観点でカテゴリが設定される場合がある。このとき、Aという分野と、Aとは別のBという分野とで同じ観点でカテゴリが細分化されているにもかかわらず、分野Aの下にだけ定義され、分野Bの下に定義されていないカテゴリが存在する場合がある。このように分類体系の一貫性や整合性が保たれていないと、Fタームを使って検索や分析を行うユーザの利便性が低下してしまう。   By the way, in the classification based on F-terms, categories may be set from the same viewpoint for different fields. At this time, although the category is subdivided from the same viewpoint in the field A and the field B different from A, it is defined only under the field A and defined under the field B. There may be no categories. If the consistency and consistency of the classification system is not maintained in this way, the convenience of the user who performs the search and analysis using the F term will be reduced.

ユーザの利便性を上げるように分類体系の見直しを支援する技術としては、例えばユーザの利用状況によって分類を評価する技術がある。この技術には、ユーザの参照頻度が高い情報を、さらにより多くのユーザの目に触れるように情報を分類する技術や、利用者のアクセス履歴を記録し、この記録したアクセス履歴に基づいて各分類の評価値を演算する技術がある。   As a technique for supporting the review of the classification system so as to improve the convenience for the user, for example, there is a technique for evaluating the classification according to the usage status of the user. In this technology, information that is frequently referenced by users is classified into information that can be seen by even more users, and access history of users is recorded, and each information is recorded based on this recorded access history. There is a technique for calculating an evaluation value of classification.

また、既にグループに分類されている情報を参考にして、新たに作成した分類構造に不足している情報を特定し、不足している情報を分類構造への追加候補としてユーザに提示する技術もある。   In addition, with reference to information that has already been classified into groups, there is also a technology that identifies information that is missing in the newly created classification structure and presents the missing information to the user as a candidate for addition to the classification structure. is there.

特開2006−92214号公報JP 2006-92214 A 特開2006−39810号公報JP 2006-39810 A 特開2006−85571号公報JP 2006-85571 A

しかし、従来の分類体系の見直し技術では、同じ観点により共通のカテゴリを設定可能な複数の分野間で、カテゴリの一貫性を高めるような見直しをすることができない。同じ観点で分類するのであれば同じカテゴリを設定可能な複数の分野であるにもかかわらず、各分野で実際に設定されているカテゴリに違いがあると、複数の分野にまたがる検索や分析に必要以上に手間がかかってしまう。例えば、複数の分野にまたがる検索を行う場合に、分野ごとに個別の検索条件を設定する必要が生じる。しかも、分野ごとに検索条件が異なれば、検索結果を統計的に分析する場合、分野ごとの検索結果を対等に比較することができない。   However, in the conventional classification system review technology, it is not possible to perform a review that improves the consistency of categories among a plurality of fields in which a common category can be set from the same viewpoint. It is necessary for search and analysis across multiple fields if there are differences in the categories that are actually set in each field, even if the same category can be set in multiple fields if they are classified from the same viewpoint. More time is required. For example, when searching across multiple fields, it is necessary to set individual search conditions for each field. Moreover, if the search conditions are different for each field, when the search results are statistically analyzed, the search results for each field cannot be compared equally.

なお、観点が同じ場合、その観点で分類するときのカテゴリを全分野で共通にすれば、分類体系としての一貫性は保つことができる。ただし、観点が同一であっても、分野によっては不適切なカテゴリも存在する。そのため、特定の観点で分類するときのカテゴリを全分野で共通にすると、分野によってはほとんど使用されないカテゴリが多数発生してしまう。不必要に分類体系のカテゴリを増やすと、ユーザが情報を検索する際に適切なカテゴリを見つけ出し辛くなり、利便性が低下してしまう。   If the viewpoints are the same, the consistency as the classification system can be maintained if the categories for classification from the viewpoints are the same in all fields. However, even if the viewpoints are the same, some categories are inappropriate depending on the field. For this reason, if categories for classification from a specific point of view are made common in all fields, many categories that are rarely used depending on the field are generated. If the number of categories in the classification system is increased unnecessarily, it becomes difficult for the user to find an appropriate category when searching for information, and convenience is reduced.

このような問題点は、特許文献の分類に用いられるFタームに限らず、大量の情報を分類する場合の分類体系に同様に発生する。例えば、インターネットのサーチエンジンには、アクセス可能な文書をカテゴリ別に分類しておくディレクトリ型のサーチエンジンもある。このようなディレクトリ型のサーチエンジンにより情報検索サービスを行う場合にも、ユーザの利便性の向上のためには、各分野のカテゴリに統一性があることが重要である。   Such a problem occurs not only in the F-term used for classification of patent documents, but also in a classification system when a large amount of information is classified. For example, Internet search engines include directory search engines that classify accessible documents by category. Even when an information search service is performed using such a directory-type search engine, it is important that the categories in each field have uniformity in order to improve user convenience.

本発明はこのような点に鑑みてなされたものであり、全体での整合性を保ちつつも無駄のない分類体系となるように分類体系の改正を支援できる分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法を提供することを目的とする。   The present invention has been made in view of such points, and a classification system revision support program and classification system revision that can support revision of a classification system so as to be a wasteful classification system while maintaining overall consistency. An object is to provide a support device and a classification system revision support method.

上記課題を解決するために、以下の処理をコンピュータに実行させる分類体系改正支援プログラムが提供される。この分類体系改正支援プログラムに基づいて、コンピュータが複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出する。次に、コンピュータは、抽出された分野それぞれの共通の観点で設けられたカテゴリ同士を比較する。次にコンピュータは、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する。次にコンピュータは、分類体系による分類対象となる情報が格納されたデータベースを参照し、仮説に従って追加対象カテゴリが追加された場合に、追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出する。さらにコンピュータは、検出された追加カテゴリ適合情報の量に基づいて仮説の適否を判定する。そしてコンピュータは、適切と判定された仮説を改正案として出力する。   In order to solve the above-described problems, a classification system revision support program that causes a computer to execute the following processing is provided. Based on this classification system revision support program, a computer stores classification system information indicating a classification system in which a viewpoint of classification is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. By referring to the system information storage means, at least two fields in which categories are provided from a common viewpoint are extracted. Next, the computer compares the categories provided from the common viewpoints of the extracted fields. Next, the computer defines a hypothesis that a category that exists only in some of the extracted fields is set as an addition target category and the additional target category is added to another field. Next, the computer refers to a database in which information to be classified by the classification system is stored, and detects additional category conforming information that belongs to the additional target category when the additional target category is added according to the hypothesis. Furthermore, the computer determines the suitability of the hypothesis based on the detected amount of additional category conformance information. Then, the computer outputs the hypothesis determined to be appropriate as a revised proposal.

異なる分野における共通の観点での分類カテゴリの統一案のうち、有用なカテゴリを追加する改正案のみをユーザに提示することができる。   Of the proposals for unifying classification categories from a common viewpoint in different fields, only the revision proposal for adding a useful category can be presented to the user.

実施の形態の概要を示す図である。It is a figure which shows the outline | summary of embodiment. 田植機に関するFタームの例を示す図である。It is a figure which shows the example of F term regarding a rice transplanter. 光源に関するFタームの例を示す図である。It is a figure which shows the example of F term regarding a light source. 本実施の形態のシステム構成例を示す図である。It is a figure which shows the system configuration example of this Embodiment. 本実施の形態に用いる分類体系改正支援装置のハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the classification system revision assistance apparatus used for this Embodiment. 分類体系改正支援装置の機能を示すブロック図である。It is a block diagram which shows the function of a classification system revision assistance apparatus. Fターム定義記憶部のデータ構造例を示す図である。It is a figure which shows the example of a data structure of F term definition memory | storage part. 分類体系改正案作成処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of classification system revision proposal creation processing. 同一観点を含む分野発見処理により発見される整合性検討分野対の例を示す図である。It is a figure which shows the example of the consistency examination field pair discovered by the field discovery process containing the same viewpoint. 仮説設定例を示す図である。It is a figure which shows a hypothesis setting example. 仮説の検証例を示す図である。It is a figure which shows the verification example of a hypothesis. 観点共通分野検索部の内部機能を示すブロック図である。It is a block diagram which shows the internal function of a viewpoint common field search part. 観点共通分野検索処理の手順を示すフローチャートの前半である。It is the first half of the flowchart which shows the procedure of a viewpoint common field search process. 修正候補記憶部内の修正候補テーブルの例を示す図である。It is a figure which shows the example of the correction candidate table in a correction candidate memory | storage part. 観点共通分野検索処理の手順を示すフローチャートの後半である。It is the second half of the flowchart which shows the procedure of a viewpoint common field search process. 比較結果記憶部内の比較テーブルの例を示す図である。It is a figure which shows the example of the comparison table in a comparison result memory | storage part. 判定結果書き込み後の比較テーブルを示す図である。It is a figure which shows the comparison table after determination result writing. 優先度設定後の修正候補テーブルを示す図である。It is a figure which shows the correction candidate table after priority setting. 仮説設定部の内部機能を示すブロック図である。It is a block diagram which shows the internal function of a hypothesis setting part. 仮説設定処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of a hypothesis setting process. 集計された比較テーブルの例を示す図である。It is a figure which shows the example of the totaled comparison table. 仮説記憶部内の仮説テーブルのデータ構造例を示す図である。It is a figure which shows the example of a data structure of the hypothesis table in a hypothesis memory | storage part. 仮説検証部の内部機能を示すブロック図である。It is a block diagram which shows the internal function of a hypothesis verification part. 仮説検証処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of hypothesis verification processing. 追加カテゴリの特徴キーワード抽出処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the feature keyword extraction process of an additional category. 基準分野における特許文献の分類状況を示す図である。It is a figure which shows the classification | category state of the patent document in a reference | standard field | area. 特徴キーワードテーブルのデータ構造例を示す図である。It is a figure which shows the example of a data structure of a characteristic keyword table. 仮説検証完了後の仮説テーブルの例を示す図である。It is a figure which shows the example of the hypothesis table after completion of hypothesis verification. 改正案記憶部のデータ構造例を示す図である。It is a figure which shows the example of a data structure of the revision plan memory | storage part. 第2の実施の形態における仮説検証部の内部機能を示すブロック図である。It is a block diagram which shows the internal function of the hypothesis verification part in 2nd Embodiment. 機械学習を用いた仮説検証処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the hypothesis verification process using machine learning. 調理のレシピに関する情報の分類体系の例を示す図である。It is a figure which shows the example of the classification system of the information regarding a recipe of cooking. ネットワークを介したオークションに関する出品情報の分類体系を示す図である。It is a figure which shows the classification | category system of the exhibition information regarding an auction via a network.

以下、本実施の形態を図面を参照して説明する。
図1は、実施の形態の概要を示す図である。分類体系情報記憶手段1には、分類体系情報が予め記憶されている。分類体系情報には、複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系が示されている。
Hereinafter, the present embodiment will be described with reference to the drawings.
FIG. 1 is a diagram showing an outline of the embodiment. The classification system information storage means 1 stores classification system information in advance. The classification system information shows a classification system in which a viewpoint of classification is defined for each of a plurality of fields, and a category for classification according to the defined viewpoint is provided.

観点共通分野検索手段2は、分類体系情報記憶手段1を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出する。図1の例では、「目的・機能」という共通の観点を有する2つの分野3,4が抽出されている。   The viewpoint common field search means 2 refers to the classification system information storage means 1 and extracts at least two fields in which categories are provided from a common viewpoint. In the example of FIG. 1, two fields 3 and 4 having a common viewpoint of “purpose / function” are extracted.

仮説定義手段5は、抽出された分野3,4それぞれの共通の観点で設けられたカテゴリ同士を比較する。そして仮説定義手段5は、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する。図1の例では、「操作性の向上」、「安全性の向上」といったカテゴリは2つの分野3,4両方に設けられているが、「植付精度の向上」というカテゴリは「田植機の接地部」という分野3にのみ存在する。そこで、仮説定義手段5は、「田植機の要素」の分野4における「目的・機能」の観点での分類に関して、「植付精度の向上」というカテゴリを追加するという仮説を定義する。   The hypothesis definition means 5 compares the categories provided from the common viewpoints of the extracted fields 3 and 4. Then, the hypothesis definition means 5 defines a hypothesis in which a category that exists only in a part of the extracted fields is set as an addition target category and the addition target category is added to another field. In the example of FIG. 1, categories such as “improvement of operability” and “improvement of safety” are provided in both of the two fields 3 and 4, but the category of “improving planting accuracy” It exists only in the field 3 called “grounding part”. Therefore, the hypothesis definition means 5 defines a hypothesis that a category of “improving planting accuracy” is added regarding the classification from the viewpoint of “purpose / function” in the field 4 of “elements of rice transplanter”.

仮説検証手段7は、分類体系による分類対象となる情報が格納されたデータベース6を参照し、仮説に従って追加対象カテゴリが追加された場合に、追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出する。図1の例であれば、データベース6に格納された情報の中から、「田植機の要素」に関する分野の情報であり、かつ「植付精度の向上」に関連する情報が検出される。さらに仮説検証手段7は、検出された追加カテゴリ適合情報の量に基づいて仮説の適否を判定する。例えば仮説検証手段7は、検出された追加カテゴリ適合情報の数が所定数以上であれば、仮説が適切であると判断する。そして仮説検証手段7は、適切と判定された仮説を改正案8として出力する。例えば、仮説検証手段7は、改正案8の内容をモニタに表示し、ユーザに提示する。   The hypothesis verification unit 7 refers to the database 6 in which information to be classified by the classification system is stored, and detects additional category conforming information that belongs to the additional target category when the additional target category is added according to the hypothesis. To do. In the example of FIG. 1, information related to “improvement of planting accuracy” is detected from information stored in the database 6 in the field related to “elements of rice transplanter”. Further, the hypothesis verification means 7 determines the suitability of the hypothesis based on the detected amount of additional category conformance information. For example, the hypothesis verification means 7 determines that the hypothesis is appropriate if the number of detected additional category matching information is a predetermined number or more. Then, the hypothesis verification means 7 outputs the hypothesis determined to be appropriate as a revised plan 8. For example, the hypothesis verification means 7 displays the content of the revised plan 8 on a monitor and presents it to the user.

このようにして、分類体系の改正を考える際に、分類の観点が共通している複数の分野での分類のされ方を考慮して改正の候補を決めることができる。そのため、横断的に分類体系の整合性を保つような改正案をユーザに提示することができる。しかも仮説を検証することで、不必要なカテゴリについては追加提案がされない。その結果、異なる分野における共通の観点での分類カテゴリの統一案のうち、有用なカテゴリを追加する改正案のみをユーザに提示することができる。   In this way, when considering a revision of the classification system, candidates for revision can be determined in consideration of how classification is performed in a plurality of fields having a common viewpoint of classification. Therefore, it is possible to present to the user an amendment that maintains the consistency of the classification system across the cross. Moreover, by verifying the hypothesis, no additional proposals are made for unnecessary categories. As a result, it is possible to present to the user only a revised proposal for adding a useful category among unified proposals for classification categories from a common viewpoint in different fields.

このような分類体系の改正支援技術は、特許文献の分類体系の改正に有効に利用することができる。特許文献は、まず技術分野によって分類される。同じ技術分野の特許文献を、様々な観点で分類できる。このような分類体系としてFタームがある。   Such a classification system revision support technology can be used effectively for revision of a patent document classification system. Patent literature is first classified by technical field. Patent documents in the same technical field can be classified from various viewpoints. There is an F-term as such a classification system.

Fタームでは、技術分野ごとに、技術的な必然性や、発展方向の差により設定されるべきカテゴリが決められる。そこでFタームによる分類体系の改正案を、図1に示すようなシステムで提示するようにすれば、類似の分類が可能な分野ではカテゴリの整合性を保ち、かつ、改正を行う分野においての必要性の高さを評価して改正案を作成することができる。すなわち、全体での整合性を保ちつつも無駄のない改正案を作成できる。   In the F-term, categories to be set are determined for each technical field depending on technical necessity and differences in development direction. Therefore, if the proposed amendment of the classification system by F-term is presented by the system as shown in Fig. 1, the consistency of the category is maintained in the field where similar classification is possible, and it is necessary in the field to be revised. An amendment can be drafted by evaluating the high nature. In other words, it is possible to create a revision plan without waste while maintaining overall consistency.

そこで、特許文献の分類に用いられるFタームに関し、分野間のカテゴリの整合性を高めるための実施の形態について、以下に詳細に説明する。
[第1の実施の形態]
まずFタームについて具体的に説明する。Fタームは分野ごとに所定の観点で分類用のカテゴリが定義されている。
Therefore, an embodiment for enhancing the consistency of categories between fields regarding F terms used for classification of patent documents will be described in detail below.
[First Embodiment]
First, the F term will be described in detail. In the F term, categories for classification are defined for each field from a predetermined viewpoint.

図2は、田植機に関するFタームの例を示す図である。田植機に関する発明は、「田植機の要素」や「田植機の接地部」などの分野に細分化されている。各分野には、カテゴリコードが付与されている。「田植機の要素」のカテゴリコードは「2B062」である。「田植機の接地部」のカテゴリコードは「2B063」である。このカテゴリコードによって、検索対象の分野を一意に特定できる。   FIG. 2 is a diagram illustrating an example of an F term relating to a rice transplanter. Inventions related to rice transplanters are subdivided into fields such as “elements of rice transplanters” and “grounding parts of rice transplanters”. A category code is assigned to each field. The category code of “rice transplanter element” is “2B062”. The category code of “Resting part of rice transplanter” is “2B063”. The category code can uniquely identify the field to be searched.

各分野では、カテゴリ分けをするための観点が定義されている。図2の例では、2つのFタームリスト41,42が示されている。Fタームリスト41は、分野「田植機の要素」に関する特許文献を、「目的・機能」という観点で分類する際のカテゴリを示している。Fタームリスト42は、分野「田植機の接地部」に関する特許文献を、「目的・機能」という観点で分類する際のカテゴリを示している。このように異なる分野の特許文献であっても、同じ観点で分類することができる。   In each field, viewpoints for categorization are defined. In the example of FIG. 2, two F-term lists 41 and 42 are shown. The F-term list 41 indicates categories for classifying patent documents related to the field “elements of rice transplanters” from the viewpoint of “purpose / function”. The F-term list 42 indicates a category for classifying patent documents related to the field “grounding part of rice transplanter” in terms of “purpose / function”. Thus, even patent documents in different fields can be classified from the same viewpoint.

カテゴリは階層構造となっている。文字列の左の「・」の数が、階層の深さを示している。「・」が1つであれば、第1階層のカテゴリである。「・」が2つであれば、第2階層のカテゴリである。「・」が3つであれば、第3階層のカテゴリである。下位の階層のカテゴリは、そのカテゴリより上位階層のカテゴリに含まれるカテゴリである。Fタームリスト41,42では、下位階層のカテゴリが、対応する上位階層のカテゴリの直下に羅列されている。例えばFタームリスト41中の「操作性の向上」のカテゴリは、「移植機等の性能向上」のカテゴリに含まれている。   Categories have a hierarchical structure. The number of “•” on the left of the character string indicates the depth of the hierarchy. If there is only one “•”, it is the category of the first hierarchy. If there are two “•”, it is the category of the second hierarchy. If there are three “•”, it is a category of the third hierarchy. A category in a lower hierarchy is a category included in a category in an upper hierarchy than that category. In the F-term lists 41 and 42, the lower hierarchy categories are listed directly below the corresponding upper hierarchy categories. For example, the category of “improvement of operability” in the F-term list 41 is included in the category of “improvement of performance of transplanter and the like”.

また、各観点での分類のカテゴリには、「その他」というカテゴリが設けられている。「その他」のカテゴリには、設定されているカテゴリに含まれない特許文献が分類される。   In addition, a category “others” is provided as a category of classification from each viewpoint. In the “other” category, patent documents not included in the set category are classified.

このように「田植機の要素」(テーマコード「2B062」)の分野と「田植機の接地部」(テーマコード「2B063」)とにはどちらも「目的・機能」という観点が設定されている。そこで、「田植機の要素」と「田植機の接地部」とのそれぞれを「目的・機能」という観点で分類したときのFタームにおけるカテゴリを比較してみる。   In this way, the field of “rice transplanter element” (theme code “2B062”) and “landering part of rice transplanter” (theme code “2B063”) both have the viewpoint of “purpose / function”. . Therefore, compare the categories in the F-term when classifying the “rice transplanter element” and the “rice transplanter grounding part” in terms of “purpose / function”.

「田植機の要素」と「田植機の接地部」の「目的・機能」の観点でのカテゴリとして、「移植機等の性能・向上」が設定され、さらにその下に「操作性の向上」や「安全性の向上」といったカテゴリが設定されている。   “Performance / Improvement of transplanter etc.” is set as a category in terms of “Purpose / Function” of “Elementary Transplant Elements” and “Grounding Section of Rice Transplanter”, and further under that, “Improved operability” And categories such as “Improving safety” are set.

ここで、「田植機の接地部」に定義されている「植付精度の向上」というカテゴリは「田植機の要素」には設定されておらず、分野領域が近く、分類の観点が同じであっても分類体系として整合性が取れていない。しかも、「田植機の要素」に分類されている特許文献にも「植付精度」という言葉が使われているものもあり、「田植機の要素」の下にも「植付精度の向上」というカテゴリを設定する必要があるかもしれない。   Here, the category of “improving planting accuracy” defined in “grounding part of rice transplanter” is not set to “elements of rice transplanter”, the field area is close, and the viewpoint of classification is the same. Even if it exists, it is not consistent as a classification system. In addition, some patent documents classified as “elements of rice transplanter” also use the term “planting accuracy”, and “improvement of planting accuracy” under “elements of rice transplanter”. You may need to set a category.

図2に示したようなFタームにおいて、例えば田植機全般の特許文献について「植付精度の向上」を表すFタームで検索する場合を考える。この場合、「田植機の要素」と「田植機の接地部」の両方に関連の特許が存在したとしても、「田植機の接地部」の中では検索結果として特許文献を得ることができない。   In the F-term as shown in FIG. 2, for example, a case is considered in which patent documents for rice transplanters in general are searched with an F-term representing “improving planting accuracy”. In this case, even if there is a patent related to both “elements of rice transplanter” and “grounding part of rice transplanter”, patent documents cannot be obtained as search results in “grounding part of rice transplanter”.

このような、分野間でのカテゴリの不統一は、田植機以外においても生じている。
図3は、光源に関するFタームの例を示す図である。図3の例では、「光源」に関する観点を有する分野が3つ示されている。1つめの分野は、「光源の構成」(テーマコード「5D119」)の観点を有する「光学的記録再生4(ヘッド自体)」である。2つ目の分野は、「光源」(テーマコード「2F065」)の観点を有する「光学的手段による測長装置」である。3つ目の分野は、「光源」(テーマコード「2C362」)の観点を有する「レーザービームプリンタ」である。図3には、各分野の該当観点による分類のFタームリスト43〜45が示されている。
Such category inconsistencies between fields also occur outside of rice transplanters.
FIG. 3 is a diagram illustrating an example of an F term relating to a light source. In the example of FIG. 3, three fields having viewpoints related to “light source” are shown. The first field is “optical recording / reproducing 4 (head itself)” having a viewpoint of “configuration of light source” (theme code “5D119”). The second field is “length measuring device by optical means” having the viewpoint of “light source” (theme code “2F065”). The third field is a “laser beam printer” having a viewpoint of “light source” (theme code “2C362”). FIG. 3 shows F-term lists 43 to 45 classified according to the relevant viewpoints of each field.

図3に示したFタームリスト43〜45の光源の種類の分類される第2層のカテゴリを比較すると、「ガスレーザー」や「半導体レーザー」については共通する。しかし、その他のカテゴリは一致しない。   Comparing the categories of the second layer into which the types of light sources in the F-term lists 43 to 45 shown in FIG. 3 are classified, “gas laser” and “semiconductor laser” are common. However, other categories do not match.

ここで、分野「光学的記録再生4(ヘッド自体)」の観点「光源の構成」(テーマコード「5D119」)に含まれるカテゴリ「ランプ」に着目してみる。カテゴリ「ランプ」は、分野「光学的手段による測長装置」の観点「光源」(テーマコード「2F065」)には含まれていない。しかし、実際にテーマコード「2F065」に分類された特許文献をキーワード「ランプ」で検索すると、数百の特許文献がヒットする場合がある。この場合、分野「光学的手段による測長装置」の観点「光源」(テーマコード「2F065」)に「ランプ」というカテゴリを追加することが適切であると推定できる。   Here, attention is paid to the category “lamp” included in the viewpoint “configuration of the light source” (theme code “5D119”) in the field “optical recording / reproducing 4 (head itself)”. The category “lamp” is not included in the viewpoint “light source” (theme code “2F065”) of the field “optical measuring device by optical means”. However, if patent documents actually classified into the theme code “2F065” are searched with the keyword “lamp”, hundreds of patent documents may be hit. In this case, it can be estimated that it is appropriate to add the category “lamp” to the viewpoint “light source” (theme code “2F065”) of the field “optical measuring device by optical means”.

また、カテゴリ「ランプ」は、分野「レーザービームプリンタ」の観点「光源」(テーマコード「2C362」)には含まれていない。しかし、レーザービームプリンタに関する光源の技術で、レーザーに代えてランプが用いられることは想定しづらい。すると、分野「レーザービームプリンタ」の観点「光源」(テーマコード「2C362」)に「ランプ」というカテゴリを追加するのは不適切であることが推定できる。   The category “lamp” is not included in the viewpoint “light source” (theme code “2C362”) of the field “laser beam printer”. However, it is difficult to assume that lamps are used in place of lasers in the light source technology for laser beam printers. Then, it can be estimated that it is inappropriate to add the category “lamp” to the viewpoint “light source” (theme code “2C362”) in the field “laser beam printer”.

このように、異なる分野で共通の観点で分類されていても、カテゴリを統一することが適切な場合と、カテゴリを統一することが不適切な場合とが存在する。そこで、以下に、このようなFタームにおけるカテゴリの統一可能な観点の抽出と、カテゴリの統一の適否判断を自動的に行うことができる分類体系改正支援装置について詳細に説明する。   As described above, there are cases where it is appropriate to unify categories and cases where it is inappropriate to unify categories even if they are classified from a common viewpoint in different fields. Therefore, a classification system revision support device capable of automatically extracting a viewpoint that can unify categories in the F-term and determining whether or not to unify categories is described in detail below.

図4は、本実施の形態のシステム構成例を示す図である。分類体系改正支援装置100は、ネットワーク10を介して特許情報サーバ20や複数の端末装置31〜33に接続されている。特許情報サーバ20は、特許文献データベース(DB)21を有している。特許文献DB21には、各種特許文献がFタームで分類して格納されている。具体的には、各特許文献に対して、その特許文献が属するカテゴリを示すFタームが付与されている。1つの特許文献は複数のカテゴリに属することができる。そのため複数のカテゴリに属する特許文献には複数のFタームが付与されている。特許情報サーバ20は、端末装置31〜33を利用するユーザに対してFタームを用いた情報検索サービスを提供している。   FIG. 4 is a diagram illustrating a system configuration example of the present embodiment. The classification system revision support device 100 is connected to the patent information server 20 and the plurality of terminal devices 31 to 33 via the network 10. The patent information server 20 has a patent document database (DB) 21. In the patent document DB 21, various patent documents are classified and stored by F-term. Specifically, an F term indicating a category to which the patent document belongs is assigned to each patent document. One patent document can belong to a plurality of categories. Therefore, a plurality of F terms are given to patent documents belonging to a plurality of categories. The patent information server 20 provides an information search service using F-terms to users who use the terminal devices 31 to 33.

分類体系改正支援装置100は、Fタームによる分類体系の改正支援を行うコンピュータである。具体的には、分類体系改正支援装置100は、Fタームの定義を利用して整合性を保つべき分野の対を検索する。次に、分類体系改正支援装置100は、得られた対に対してどのような改正を行うべきか仮説を立てる。最後に、分類体系改正支援装置100は、実際にFタームが付与されている特許文献の情報を利用して、検証を行うことによって、改正点を絞り込む。   The classification system revision support device 100 is a computer that supports revision of the classification system using F-terms. More specifically, the classification system revision support apparatus 100 searches for pairs of fields that should maintain consistency by using the definition of the F term. Next, the classification system revision support apparatus 100 makes a hypothesis as to what kind of revision should be performed on the obtained pair. Finally, the classification system revision support apparatus 100 narrows down the revision points by performing verification using the information of the patent document to which the F term is actually assigned.

例えば、ほぼ同様の観点とカテゴリが設定されているAとBという2つの分野があった場合、分類体系改正支援装置100は、分野Aに設定されているカテゴリは分野Bの下にも設定できると仮定する。分類体系改正支援装置100は、この仮定に基づくカテゴリ追加の適否を検証することで、改正案とすべきかどうかを判断する。   For example, when there are two fields A and B in which almost the same viewpoint and category are set, the classification system revision support apparatus 100 can set the category set in the field A also under the field B. Assume that The classification system revision support apparatus 100 determines whether or not the revision should be made by verifying the suitability of the category addition based on this assumption.

図5は、本実施の形態に用いる分類体系改正支援装置のハードウェア構成例を示す図である。分類体系改正支援装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス108を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。   FIG. 5 is a diagram illustrating a hardware configuration example of the classification system revision support device used in the present embodiment. The classification system revision support apparatus 100 is entirely controlled by a CPU (Central Processing Unit) 101. A RAM (Random Access Memory) 102 and a plurality of peripheral devices are connected to the CPU 101 via a bus 108.

RAM102は、分類体系改正支援装置100の主記憶装置として使用される。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。   The RAM 102 is used as a main storage device of the classification system revision support device 100. The RAM 102 temporarily stores at least part of an OS (Operating System) program and application programs to be executed by the CPU 101. The RAM 102 stores various data necessary for processing by the CPU 101.

バス108に接続されている周辺機器としては、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、光学ドライブ装置106、および通信インタフェース107がある。   Peripheral devices connected to the bus 108 include a hard disk drive (HDD) 103, a graphic processing device 104, an input interface 105, an optical drive device 106, and a communication interface 107.

HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、分類体系改正支援装置100の二次記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、二次記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。   The HDD 103 magnetically writes and reads data to and from the built-in disk. The HDD 103 is used as a secondary storage device of the classification system revision support device 100. The HDD 103 stores an OS program, application programs, and various data. Note that a semiconductor storage device such as a flash memory can also be used as the secondary storage device.

グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ11の画面に表示させる。モニタ11としては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。   A monitor 11 is connected to the graphic processing device 104. The graphic processing device 104 displays an image on the screen of the monitor 11 in accordance with a command from the CPU 101. Examples of the monitor 11 include a display device using a CRT (Cathode Ray Tube) and a liquid crystal display device.

入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号をCPU101に送信する。なお、マウス13は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。   A keyboard 12 and a mouse 13 are connected to the input interface 105. The input interface 105 transmits a signal sent from the keyboard 12 or the mouse 13 to the CPU 101. The mouse 13 is an example of a pointing device, and other pointing devices can also be used. Examples of other pointing devices include a touch panel, a tablet, a touch pad, and a trackball.

光学ドライブ装置106は、レーザー光などを利用して、光ディスク14に記録されたデータの読み取りを行う。光ディスク14は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク14には、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。   The optical drive device 106 reads data recorded on the optical disk 14 using laser light or the like. The optical disk 14 is a portable recording medium on which data is recorded so that it can be read by reflection of light. The optical disk 14 includes a DVD (Digital Versatile Disc), a DVD-RAM, a CD-ROM (Compact Disc Read Only Memory), a CD-R (Recordable) / RW (ReWritable), and the like.

通信インタフェース107は、ネットワーク10に接続されている。通信インタフェース107は、ネットワーク10を介して、特許情報サーバ20などの他のコンピュータとの間でデータの送受信を行う。   The communication interface 107 is connected to the network 10. The communication interface 107 transmits / receives data to / from other computers such as the patent information server 20 via the network 10.

以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。なお図5には分類体系改正支援装置100のハードウェア構成例を示したが、特許情報サーバ20や端末装置31〜33も同様のハードウェアで実現することができる。   With the hardware configuration as described above, the processing functions of the present embodiment can be realized. Although FIG. 5 shows a hardware configuration example of the classification system revision support device 100, the patent information server 20 and the terminal devices 31 to 33 can also be realized by similar hardware.

図6は、分類体系改正支援装置の機能を示すブロック図である。分類体系改正支援装置100は、Fターム定義記憶部110、観点共通分野検索部120、修正候補記憶部130、比較結果記憶部140、仮説設定部150、仮説記憶部160、仮説検証部170、改正案記憶部180、および結果表示部190を有する。   FIG. 6 is a block diagram illustrating functions of the classification system revision support device. The classification system revision support apparatus 100 includes an F-term definition storage unit 110, a viewpoint common field search unit 120, a correction candidate storage unit 130, a comparison result storage unit 140, a hypothesis setting unit 150, a hypothesis storage unit 160, a hypothesis verification unit 170, a revision A plan storage unit 180 and a result display unit 190 are provided.

Fターム定義記憶部110には、特許文献を分類するためのFタームの定義内容を記憶する記憶機能である。例えばHDD103の記憶領域の一部がFターム定義記憶部110として使用される。   The F-term definition storage unit 110 has a storage function for storing the definition contents of F-terms for classifying patent documents. For example, a part of the storage area of the HDD 103 is used as the F-term definition storage unit 110.

観点共通分野検索部120は、Fターム定義記憶部110を参照し、各分野のカテゴリ分けの観点に共通性がある2つの分野を検索する。そして観点共通分野検索部120は、検出された2つの分野を、整合性を検討すべ分野の対(整合性検討分野対)とする。この際、観点共通分野検索部120は、整合性検討分野対の一方を修正候補とした修正候補情報を、修正候補記憶部130に格納する。さらに観点共通分野検索部120は、整合性検討分野対における共通の観点で定義されたそれぞれの分野のカテゴリを比較する。観点共通分野検索部120は、カテゴリの比較結果を比較結果記憶部140に格納する。その後、観点共通分野検索部120は、カテゴリの比較完了を仮説設定部150に通知する。   The viewpoint common field search unit 120 refers to the F-term definition storage unit 110 and searches for two fields having commonality in terms of categorization of each field. Then, the common viewpoint search unit 120 sets the two detected fields as a pair of fields whose consistency should be examined (consistency examination field pair). At this time, the viewpoint common field search unit 120 stores the correction candidate information in which one of the consistency examination field pairs is a correction candidate in the correction candidate storage unit 130. Further, the common viewpoint search unit 120 compares the categories of the respective fields defined from the common viewpoint in the consistency examination field pairs. The viewpoint common field search unit 120 stores the category comparison result in the comparison result storage unit 140. Thereafter, the common-view field searching unit 120 notifies the hypothesis setting unit 150 of completion of category comparison.

修正候補記憶部130は、整合性検討分野対の一方で修正候補であることを示す修正候補情報の記憶機能である。例えば、RAM102の記憶領域の一部が修正候補記憶部130として使用される。   The correction candidate storage unit 130 is a function for storing correction candidate information indicating that one of the consistency examination field pairs is a correction candidate. For example, a part of the storage area of the RAM 102 is used as the correction candidate storage unit 130.

比較結果記憶部140は、整合性検討分野対のカテゴリ比較結果を記憶する記憶機能である。例えば、RAM102の記憶領域の一部が比較結果記憶部140として使用される。   The comparison result storage unit 140 is a storage function that stores the category comparison results of the consistency examination field pairs. For example, a part of the storage area of the RAM 102 is used as the comparison result storage unit 140.

仮説設定部150は、観点共通分野検索部120によるカテゴリの比較完了通知を受け取ると、比較結果記憶部140を参照し、追加すべきカテゴリの仮説を定義する。具体的には、仮説設定部150は、異なる2つの分野それぞれで共通の観点で分類していながら、一方にのみ存在し他方に存在しないカテゴリを検出する。そして、仮説設定部150は、カテゴリが不足している分野に該当カテゴリを追加するという仮説を立てる。仮説設定部150は、仮説の内容を仮説記憶部160に格納する。その後、仮説設定部150は、仮説設定の完了を仮説検証部170に通知する。   When the hypothesis setting unit 150 receives a category comparison completion notification from the common viewpoint field search unit 120, the hypothesis setting unit 150 refers to the comparison result storage unit 140 and defines a hypothesis of a category to be added. Specifically, the hypothesis setting unit 150 detects a category that exists only in one and does not exist in the other while classifying from a common viewpoint in two different fields. Then, the hypothesis setting unit 150 makes a hypothesis that the corresponding category is added to the field where the category is insufficient. The hypothesis setting unit 150 stores the contents of the hypothesis in the hypothesis storage unit 160. Thereafter, the hypothesis setting unit 150 notifies the hypothesis verification unit 170 of completion of the hypothesis setting.

仮説検証部170は、仮説設定部150による仮説設定完了通知を受け取ると、仮説の正しさを検証する。具体的には、仮説検証部170は、特許文献DB内の文献を用いて、仮説によって作成されるカテゴリに分類されるべき文献の量が所定量以上の場合、仮説が正しいと判断する。仮説検証部170は、改正案記憶部180に改正案を格納する。   Upon receiving the hypothesis setting completion notification from the hypothesis setting unit 150, the hypothesis verification unit 170 verifies the correctness of the hypothesis. Specifically, the hypothesis verification unit 170 uses the documents in the patent document DB to determine that the hypothesis is correct when the amount of documents to be classified into categories created by the hypothesis is a predetermined amount or more. The hypothesis verification unit 170 stores the revision plan in the revision plan storage unit 180.

改正案記憶部180は、改正案を記憶する記憶機能である。例えばRAM102やHDD103の記憶領域の一部が、改正案記憶部180として使用される。
結果表示部190は、改正案記憶部180に格納された改正案をモニタ11に表示する。
The revision plan storage unit 180 is a storage function that stores the revision plan. For example, a part of the storage area of the RAM 102 or the HDD 103 is used as the revision plan storage unit 180.
The result display unit 190 displays the revision plan stored in the revision plan storage unit 180 on the monitor 11.

以上のような構成において、Fターム定義記憶部110には、予めFタームの定義情報が格納されている。
図7は、Fターム定義記憶部のデータ構造例を示す図である。Fターム定義記憶部110には、Fターム定義テーブル111が格納されている。Fターム定義テーブル111は、テーマコード、Fターム、観点、第一階層、第二階層、および第三階層の欄が設けられている。
In the configuration as described above, F-term definition storage unit 110 stores F-term definition information in advance.
FIG. 7 is a diagram illustrating a data structure example of the F-term definition storage unit. The F term definition storage unit 110 stores an F term definition table 111. The F-term definition table 111 is provided with columns of theme code, F-term, viewpoint, first layer, second layer, and third layer.

テーマコードの欄には、分野の識別コード(テーマコード)が設定される。テーマコードの右に設定されたFターム、観点、第一階層、第二階層、および第三階層の各欄の情報が、該当テーマコードのFターム定義情報である。   A field identification code (theme code) is set in the theme code column. Information in each column of the F term, viewpoint, first layer, second layer, and third layer set to the right of the theme code is the F term definition information of the corresponding theme code.

Fタームの欄には、分類体系内で対応するカテゴリを一意に識別するための識別子(Fターム)が設定される。Fタームは、左から5文字がテーマコードである。テーマコードに続く2文字が、該当分野内での観点の識別コードである。観点の識別コードに続く2文字が、該当観点内でのカテゴリの識別コードである。   In the F-term column, an identifier (F-term) for uniquely identifying the corresponding category in the classification system is set. F-term is the theme code with 5 characters from the left. Two characters following the theme code are an identification code of a viewpoint within the corresponding field. Two characters following the viewpoint identification code are the category identification code within the corresponding viewpoint.

観点の欄には、Fタームで示されるカテゴリの分類時の観点が設定される。第一階層の欄には、Fタームで示されるカテゴリが属する第一階層の属性を示す文字列が設定される。第二階層の欄には、Fタームで示されるカテゴリが属する第二階層の属性を示す文字列が設定される。第三階層の欄には、Fタームで示されるカテゴリが属する第三階層の属性を示す文字列が設定される。なお、Fタームで示されるカテゴリが第一階層のカテゴリの場合、第二階層と第三階層との欄は空欄となる。同様にFタームで示されるカテゴリが第二階層の場合、第三階層の欄は空欄となる。   The viewpoint at the time of classification of the category indicated by the F term is set in the viewpoint column. In the column of the first hierarchy, a character string indicating the attribute of the first hierarchy to which the category indicated by the F term belongs is set. A character string indicating an attribute of the second hierarchy to which the category indicated by the F term belongs is set in the second hierarchy column. A character string indicating the attribute of the third hierarchy to which the category indicated by the F term belongs is set in the third hierarchy column. When the category indicated by the F term is the category of the first hierarchy, the columns of the second hierarchy and the third hierarchy are blank. Similarly, when the category indicated by the F term is the second hierarchy, the third hierarchy column is blank.

このようなFターム定義情報がFターム定義記憶部110に格納されている状態で、ユーザからの分類体系改正案作成指示に応じて、分類体系改正支援装置100が、分類体系改正案作成を行う。   In a state where such F-term definition information is stored in the F-term definition storage unit 110, the classification system revision support device 100 creates a classification system revision plan in response to a classification system revision draft creation instruction from the user. .

図8は、分類体系改正案作成処理の手順を示すフローチャートである。以下、図8に示す処理をステップ番号に沿って説明する。
[ステップS11]まず観点共通分野検索部120は、Fタームの定義を利用して、同一観点を含む分野を検索する。観点共通分野検索部120は、検出された同一観点を含む2つの分野を、整合性を保つべき分野の対(整合性検討分野対)とする。
FIG. 8 is a flowchart showing a procedure of classification system revision proposal creation processing. In the following, the process illustrated in FIG. 8 will be described in order of step number.
[Step S11] First, the common viewpoint search section 120 searches for a field including the same viewpoint using the definition of the F term. The viewpoint common field search unit 120 sets two fields including the detected same viewpoint as a pair of fields that should be consistent (consistency examination field pair).

[ステップS12]次に、仮説設定部150が、ステップS11で得られた整合性検討分野対に対してどのような改正を行うべきかの仮説を立てる。
[ステップS13]最後に、仮説検証部170が、実際にFタームが付けられている公報の情報を利用して、検証を行うことによって、改正点を絞り込む。例えば、ほぼ同様の観点とカテゴリが設定されているAとBという2つの分野があった場合を考える。この場合、仮説検証部170は、もし分野Aにのみ設定されているカテゴリがあったとしたら、そのカテゴリを分野Bの下にも設定できると仮定する。仮説検証部170は、この仮定を検証することで、改正案とすべきかどうかを判断する。
[Step S12] Next, the hypothesis setting unit 150 makes a hypothesis as to what revision should be made to the consistency study field pair obtained in step S11.
[Step S13] Finally, the hypothesis verification unit 170 narrows down the revision points by performing verification using the information of the gazette that is actually attached with the F term. For example, let us consider a case where there are two fields A and B in which almost the same viewpoints and categories are set. In this case, if there is a category set only in the field A, the hypothesis verification unit 170 assumes that the category can also be set under the field B. The hypothesis verification unit 170 verifies this assumption to determine whether or not to make a revised proposal.

ここで、図7に示したFターム定義テーブル111に基づいて、分類体系改正案作成を行う場合を考える。まず、観点共通分野検索部120は、膨大な数のFターム定義情報について、同一の観点、同一のカテゴリが設定されている分野の対を発見する。   Here, a case where a classification system revision proposal is created based on the F-term definition table 111 shown in FIG. First, the viewpoint common field search unit 120 finds pairs of fields in which the same viewpoint and the same category are set for a huge number of F-term definition information.

図9は、同一観点を含む分野発見処理により発見される整合性検討分野対の例を示す図である。図9では、観点の同一性とカテゴリの同一性とを比較するため、各分野51〜54の観点ごとのカテゴリを木構造で示している。例えば、テーマコード「2B062」の分野51では「目的・機能」という観点でカテゴリが生成されている。また、テーマコード「2B063」の分野54も「目的・機能」という観点でカテゴリが生成されている。   FIG. 9 is a diagram showing an example of consistency study field pairs discovered by field discovery processing including the same viewpoint. In FIG. 9, in order to compare the identity of viewpoints and the identity of categories, categories for each viewpoint in each field 51 to 54 are shown in a tree structure. For example, in the field 51 of the theme code “2B062”, a category is generated from the viewpoint of “purpose / function”. A category is also generated from the viewpoint of “purpose / function” in the field 54 of the theme code “2B063”.

分野51の「目的・機能」という観点には「操作性の向上」や「安全性の向上」といったカテゴリが含まれる。また、分野54の「目的・機能」という観点にも、同様に「操作性の向上」や「安全性の向上」というカテゴリが含まれる。しかし、「植付精度の向上」というカテゴリは分野54にのみ存在し、分野51には存在しない。すなわち、分野51と分野54とでは同じ観点で分類を行っているが、該当観点で分類するためのカテゴリは部分的に一致しているのみである。そこで、観点共通分野検索部120は、分野51と分野54とのカテゴリの整合性を検証するための整合性検討分野対とする。   The viewpoint of “purpose / function” in the field 51 includes categories such as “improvement in operability” and “improvement in safety”. Similarly, the “purpose / function” viewpoint of the field 54 includes the categories of “improvement in operability” and “improvement in safety”. However, the category “improving planting accuracy” exists only in the field 54 and does not exist in the field 51. That is, the field 51 and the field 54 are classified from the same viewpoint, but the categories for classification from the corresponding viewpoint are only partially matched. Therefore, the common viewpoint field search unit 120 sets the consistency examination field pair for verifying the consistency of the categories of the field 51 and the field 54.

整合性検討分野対が決定されると、仮説設定部150によるカテゴリ改正の仮説が立てられる。
図10は、仮説設定例を示す図である。仮説設定部150は、同一の観点、同一のカテゴリが設定されている分野51,54の対について、すべてのカテゴリの定義が一致するか否かを比較する。ここで、仮説設定部150は、一致しなかった一部のカテゴリについては、一致させるために、片方にだけ定義されているカテゴリを他方にも定義可能であるという仮説を設定する。
When the consistency examination field pair is determined, a hypothesis of category revision by the hypothesis setting unit 150 is established.
FIG. 10 is a diagram illustrating a hypothesis setting example. The hypothesis setting unit 150 compares whether or not the definitions of all categories match for a pair of fields 51 and 54 in which the same viewpoint and the same category are set. Here, the hypothesis setting unit 150 sets a hypothesis that, for some categories that do not match, a category defined only on one side can be defined on the other in order to match.

図10の例では、「操作性の向上」や「安全性の向上」については、両分野51,54においてカテゴリの定義が一致している。ところが、「植付精度の向上」(Fターム「2B063AA08」)のカテゴリは、田植機の接地部(テーマコード「2B063」)の分野51にだけ設定されている。そこで「植付精度の向上」(Fターム「2B063AA08」)を、田植機の要素(テーマコード「2B062」)の分野54にも定義する必要があるという仮説を設定される。   In the example of FIG. 10, the definitions of categories in both fields 51 and 54 are the same for “improvement in operability” and “improvement in safety”. However, the category of “improving planting accuracy” (F-term “2B063AA08”) is set only in the field 51 of the grounding unit of the rice transplanter (theme code “2B063”). Therefore, a hypothesis is set that “improving planting accuracy” (F-term “2B063AA08”) needs to be defined in the field 54 of the rice transplanter element (theme code “2B062”).

仮説が設定されると、仮説検証部170によって仮説の適否が検証される。
図11は、仮説の検証例を示す図である。仮説検証部170は、仮説設定部150によって設定された仮説について適否を検証する。図11の例では、仮説検証部170は、「植付精度の向上」というカテゴリを田植機の要素(テーマコード「2B062」)の分野にも定義が必要であるという仮説を検証する。
When the hypothesis is set, the hypothesis verification unit 170 verifies the suitability of the hypothesis.
FIG. 11 is a diagram illustrating a hypothesis verification example. The hypothesis verification unit 170 verifies the suitability of the hypothesis set by the hypothesis setting unit 150. In the example of FIG. 11, the hypothesis verification unit 170 verifies the hypothesis that the category “improving planting accuracy” also needs to be defined in the field of the rice transplanter element (theme code “2B062”).

まず仮説検証部170は、特許文献DB21にアクセスし、田植機の接地部(テーマコード「2B063」)の分野において、「目的・機能」の観点(観点の識別コード「AA」)で分類された特許文献の集合(仮説元全体集合61)を取得する。次に仮説検証部170は、「植付精度の向上」(Fターム「2B063AA08」)のコードが付与されている特許文献の集合(仮説元対応カテゴリ集合62)からキーワードを抽出する。例えば「整地」「センサフロート」「田植え機」「感知フロート」・・・といったキーワードが抽出されたものとする。さらに仮説検証部170は、取得した特許文献のうち「植付精度の向上」(Fターム「2B063AA08」)が付与されていない特許文献の集合からキーワードを抽出する。例えば「整地」「フロート」「田植え機」「機体」・・・といったキーワードが抽出されたものとする。   First, the hypothesis verification unit 170 accesses the patent document DB 21 and is classified from the viewpoint of “purpose / function” (identification code “AA” of viewpoint) in the field of the grounding unit of the rice transplanter (theme code “2B063”). A set of patent documents (hypothesis source overall set 61) is acquired. Next, the hypothesis verification unit 170 extracts keywords from a set of patent documents (hypothesis source corresponding category set 62) to which a code of “improving planting accuracy” (F-term “2B063AA08”) is assigned. For example, it is assumed that keywords such as “leveling”, “sensor float”, “rice planting machine”, “sense float”, and the like are extracted. Furthermore, the hypothesis verification unit 170 extracts keywords from a set of patent documents to which “improving planting accuracy” (F-term “2B063AA08”) is not assigned. For example, it is assumed that keywords such as “leveling”, “float”, “rice planting machine”, “machine body”,... Are extracted.

なお、特許文献からキーワードを抽出する場合、例えば仮説検証部170は、特許文献の形態素解析を行い所定の品詞(名詞や動詞など)の文字列をキーワードとして抽出する。なお、特許文献DB21に予め特許文献ごとのキーワードリストが予め用意されている場合、仮説検証部170は、そのキーワードリストを使用することもできる。   When extracting a keyword from a patent document, for example, the hypothesis verification unit 170 performs a morphological analysis of the patent document and extracts a character string of a predetermined part of speech (such as a noun or a verb) as a keyword. When a keyword list for each patent document is prepared in advance in the patent document DB 21, the hypothesis verification unit 170 can also use the keyword list.

さらに仮説検証部170は、仮説元対応カテゴリ集合62から抽出したキーワードのうち、仮説元全体集合61内の仮説元対応カテゴリ集合62に属さない特許文献から抽出したキーワードに含まれないキーワードを抽出する。仮説検証部170は、抽出したキーワードを、仮説元対応カテゴリ集合62の特徴キーワードとする。例えば図11の例では、「センサフロート」「感知フロート」・・・といったキーワードが特徴キーワードとなる。   Further, the hypothesis verification unit 170 extracts keywords that are not included in the keywords extracted from the patent documents that do not belong to the hypothesis source corresponding category set 62 in the hypothesis source total set 61 from the keywords extracted from the hypothesis source corresponding category set 62. . The hypothesis verification unit 170 sets the extracted keyword as a feature keyword of the hypothesis source corresponding category set 62. For example, in the example of FIG. 11, keywords such as “sensor float”, “sense float”,...

その後、仮説検証部170は、特許文献DB21にアクセスし、田植機の要素(テーマコード「2B062」)の分野において、「目的・機能」の観点(観点の識別コード「AA」)で分類された特許文献の集合(仮説対象全体集合63)の検索を行う。この際、仮説検証部170は、仮説対象全体集合63のうち、「その他」のカテゴリに分類された特許文献に対する検索を行う。このときの検索キーワードは、仮説元対応カテゴリ集合62の特徴キーワードである。仮説検証部170は、検索によりヒットした特許文献の件数(ヒット件数M)を、予め設定された閾値Tと比較する。ヒット件数Mが閾値Tより大きければ、仮説が適切であると認定する。すなわち、田植機の要素(テーマコード「2B062」)の分野において、「目的・機能」の観点(観点の識別コード「AA」)での分類カテゴリとして、「植付精度の向上」を追加することが適切であると認定される。   Thereafter, the hypothesis verification unit 170 accesses the patent document DB 21 and is classified in the field of rice transplanter elements (theme code “2B062”) from the viewpoint of “purpose / function” (identification code “AA” of viewpoint). A search for a set of patent documents (hypothesis target overall set 63) is performed. At this time, the hypothesis verification unit 170 searches the patent documents classified in the “other” category in the hypothesis target entire set 63. The search keyword at this time is a feature keyword of the hypothesis source corresponding category set 62. The hypothesis verification unit 170 compares the number of patent documents hit by the search (number of hits M) with a preset threshold T. If the number of hits M is greater than the threshold T, it is determined that the hypothesis is appropriate. That is, in the field of rice transplanter elements (theme code “2B062”), “improving planting accuracy” is added as a classification category from the viewpoint of “purpose / function” (identification code “AA” of viewpoint). Is recognized as appropriate.

このように、設定された仮説の検証を行うことで、「植付精度の向上」のように、新たに追加したカテゴリに属する特許文献が多数存在する場合、そのカテゴリの追加が適切であると認定される。   In this way, by verifying the set hypothesis, when there are many patent documents belonging to the newly added category, such as “improving planting accuracy”, the addition of the category is appropriate. Certified.

なお図2に示すように、田植機の要素(テーマコード「2B062」)の「目的・機能」の観点による「演算処理」のカテゴリは、田植機の接地部(テーマコード「2B063」)の「目的・機能」の観点によるカテゴリに含まれていない。しかし、田植機の接地部という分野において「演算処理」に関する発明は少ない。そのため、そのカテゴリを田植機の接地部に追加しても、追加したカテゴリに属する特許文献は少ない。その結果、検証によって、カテゴリの追加は不適切を判断される。このように、ある分野に特有のカテゴリが仮説元のカテゴリとなったとしても、同じカテゴリの他の分野への追加は検証によりは排除される。   As shown in FIG. 2, the category of “arithmetic processing” from the viewpoint of “purpose / function” of the rice transplanter element (theme code “2B062”) is “ Not included in the category of “purpose / function”. However, there are few inventions related to “arithmetic processing” in the field of the ground contact section of rice transplanters. Therefore, even if the category is added to the grounding part of the rice transplanter, there are few patent documents belonging to the added category. As a result, the addition of the category is judged inappropriate by the verification. As described above, even if a category peculiar to a certain field becomes a hypothesis-based category, addition of the same category to another field is excluded by verification.

なお、図9〜図11に示した例では1つの仮説に関してのみ示したが、実際にはFターム全体の分類体系から多数の仮説が設定され、個々の仮説について検証が行われる。それにより、大規模な分類体系の網羅的な改善を容易に行うことが可能となる。以下、分類体系全体を見直すための機能および処理をより詳細に説明する。   Although the example shown in FIGS. 9 to 11 shows only one hypothesis, actually, a large number of hypotheses are set from the classification system of the entire F term, and each hypothesis is verified. As a result, comprehensive improvement of a large-scale classification system can be easily performed. Hereinafter, functions and processing for reviewing the entire classification system will be described in more detail.

まず、観点共通分野検索部120の機能を詳細に説明する。
図12は、観点共通分野検索部の内部機能を示すブロック図である。観点共通分野検索部120は、観点切出部121、観点同一性判定部122、カテゴリ切出部123、およびカテゴリ比較部124を有する。
First, the function of the viewpoint common field search unit 120 will be described in detail.
FIG. 12 is a block diagram illustrating an internal function of the common viewpoint field search unit. The viewpoint common field search unit 120 includes a viewpoint extraction unit 121, a viewpoint identity determination unit 122, a category extraction unit 123, and a category comparison unit 124.

観点切出部121は、Fターム定義記憶部110を参照し、各分野の観点を示す文字列を抽出する。
観点同一性判定部122は、観点切出部121が抽出した各分野の観点を示す文字列を、すべての分野の組み合わせいついて比較する。次に、観点同一性判定部122は、異なる分野間で、同一観点で分類している2つの分野の対(整合性検討分野対)を判定する。観点同一性判定部122は、整合性検討分野対を修正候補記憶部130に格納する。また、観点同一性判定部122は、整合性検討分野対の同一観点内での一致するカテゴリ数を計数する。そして、観点同一性判定部122は、整合性検討分野対ごとの一致するカテゴリ数を修正候補記憶部130に格納する。
The viewpoint cutout unit 121 refers to the F-term definition storage unit 110 and extracts a character string indicating the viewpoint of each field.
The viewpoint identity determination unit 122 compares the character strings indicating the viewpoints of the respective fields extracted by the viewpoint cutting unit 121 with combinations of all the fields. Next, the viewpoint identity determination unit 122 determines a pair of two fields classified by the same viewpoint (consistency examination field pair) between different fields. The viewpoint identity determination unit 122 stores the consistency study field pair in the correction candidate storage unit 130. In addition, the viewpoint identity determination unit 122 counts the number of matching categories within the same viewpoint of the consistency study field pair. Then, the viewpoint identity determination unit 122 stores the number of matching categories for each consistency examination field pair in the correction candidate storage unit 130.

カテゴリ切出部123は、整合性検討分野対のそれぞれの分野に関し、同一観点により分類した各カテゴリの定義文を切り出す。
カテゴリ比較部124は、整合性検討分野対のそれぞれの分野のカテゴリの定義文を比較する。その際、カテゴリ比較部124は、比較結果を比較結果記憶部140に格納する。カテゴリ比較部124は、カテゴリの比較が完了すると、その旨を仮説設定部150に通知する。
The category cutout unit 123 cuts out definition sentences of each category classified from the same viewpoint with respect to each field of the consistency examination field pair.
The category comparison unit 124 compares category definition sentences in each field of the consistency study field pair. At that time, the category comparison unit 124 stores the comparison result in the comparison result storage unit 140. When category comparison is completed, category comparison unit 124 notifies hypothesis setting unit 150 to that effect.

次に、このような内部機能を有する観点共通分野検索部120における観点共通分野検索処理について詳細に説明する。
図13は、観点共通分野検索処理の手順を示すフローチャートの前半である。以下、図13に示す処理をステップ番号に沿って説明する。
Next, the viewpoint common field search processing in the viewpoint common field search unit 120 having such an internal function will be described in detail.
FIG. 13 is the first half of the flowchart showing the procedure of the viewpoint common field search processing. In the following, the process illustrated in FIG. 13 will be described in order of step number.

[ステップS21]観点切出部121は、Fターム定義記憶部110を参照し、Fターム定義テーブル111を取得する。
[ステップS22]観点切出部121は、変数「i」を1に初期化すると共に、変数「j」を1に初期化する。
[Step S <b> 21] The viewpoint cutout unit 121 refers to the F-term definition storage unit 110 and acquires the F-term definition table 111.
[Step S22] The viewpoint cutout unit 121 initializes the variable “i” to 1 and also initializes the variable “j” to 1.

[ステップS23]観点切出部121は、Fターム定義テーブル111のi番目のテーマコードを取得する。観点切出部121は、取得したテーマコードを変数「Ti」に設定する。変数「Ti」は、仮説を設定する際の参照元となる分野(基準分野)を示す。   [Step S <b> 23] The viewpoint cutout unit 121 acquires the i-th theme code of the F-term definition table 111. The viewpoint cutout unit 121 sets the acquired theme code to the variable “Ti”. The variable “Ti” indicates a field (reference field) that serves as a reference source when setting a hypothesis.

[ステップS24]観点切出部121は、Fターム定義テーブル111のj番目のテーマコードを取得する。観点切出部121は、取得したテーマコードを変数「Tj」に設定する。変数「Tj」は、仮説を設定する際のカテゴリ追加対象となる分野(改正対象分野)を示す。   [Step S24] The viewpoint cutout unit 121 acquires the j-th theme code in the F-term definition table 111. The viewpoint cutout unit 121 sets the acquired theme code to the variable “Tj”. The variable “Tj” indicates a field to be added to a category (revision target field) when setting a hypothesis.

[ステップS25]観点切出部121は、現在の変数iと変数jとの値を比較し、値が異なる(i≠j)か否かを判断する。値が異なれば、処理がステップS27に進められる。値が等しければ、処理がステップS26に進められる。   [Step S25] The viewpoint cutout unit 121 compares the values of the current variable i and the variable j, and determines whether or not the values are different (i ≠ j). If the values are different, the process proceeds to step S27. If the values are equal, the process proceeds to step S26.

[ステップS26]変数iと変数jとの値が等しい場合、観点切出部121は、変数jをインクリメントし、処理をステップS24に進める。このように、「j=i」のときは、同じテーマコードを比較することになってしまうので、比較処理をスキップしてjがインクリメントされる。   [Step S26] When the values of the variable i and the variable j are equal, the viewpoint cutout unit 121 increments the variable j and advances the process to step S24. Thus, when “j = i”, the same theme code is compared, so that the comparison process is skipped and j is incremented.

[ステップS27]変数iと変数jとの値が等しくなければ、観点切出部121は、Fターム定義テーブル111上で変数「Ti」と変数「Tj」とのそれぞれで示される分野に対応するFターム定義情報を取得する。   [Step S27] If the values of the variable i and j are not equal, the viewpoint extraction unit 121 corresponds to the fields indicated by the variable “Ti” and the variable “Tj” on the F-term definition table 111, respectively. F-term definition information is acquired.

[ステップS28]観点切出部121は、取得したFターム定義情報から、変数「Ti」で示される分野の観点と、変数「Tj」で示される分野の観点とを抽出する。
[ステップS29]観点同一性判定部122は、変数「Ti」で示される分野の観点と、変数「Tj」で示される分野の観点とのうち、共通する観点を検出する。具体的には、観点を示す文字列が一致する場合に、共通する観点であると判断される。
[Step S28] The viewpoint cutout unit 121 extracts the viewpoint of the field indicated by the variable “Ti” and the viewpoint of the field indicated by the variable “Tj” from the acquired F-term definition information.
[Step S29] The viewpoint identity determination unit 122 detects a common viewpoint among the viewpoint of the field indicated by the variable “Ti” and the viewpoint of the field indicated by the variable “Tj”. Specifically, when the character strings indicating the viewpoints match, it is determined that the viewpoints are common.

[ステップS30]観点同一性判定部122は、共通する観点の一致カテゴリ数をカウントする。具体的には、観点同一性判定部122は、共通する観点に関する各分野におけるカテゴリを比較し、定義内容が同一となるカテゴリの数を計数する。   [Step S30] The viewpoint identity determination unit 122 counts the number of matching categories of common viewpoints. Specifically, the viewpoint identity determination unit 122 compares the categories in each field related to the common viewpoints, and counts the number of categories having the same definition content.

[ステップS31]観点同一性判定部122は、修正候補記憶部130内の修正候補テーブルに、一致する観点の情報を追加する。具体的には、観点同一性判定部122は、比較対象の2つの分野のテーマコード、一致する観点、および一致するカテゴリ数を、修正候補テーブルに追加する。なお、変数「Ti」で示されるテーマコードの観点と、変数「Tj」で示されるテーマコードの観点とで共通性が無い場合、修正候補テーブルへの情報の追加は行われない。その後、処理がステップS41(図15参照)に進められる。   [Step S <b> 31] The viewpoint identity determination unit 122 adds matching viewpoint information to the correction candidate table in the correction candidate storage unit 130. Specifically, the viewpoint identity determination unit 122 adds the theme codes of the two fields to be compared, the matching viewpoints, and the number of matching categories to the correction candidate table. If there is no commonality between the viewpoint of the theme code indicated by the variable “Ti” and the viewpoint of the theme code indicated by the variable “Tj”, no information is added to the correction candidate table. Thereafter, the process proceeds to step S41 (see FIG. 15).

図14は、修正候補記憶部内の修正候補テーブルの例を示す図である。図14に示すように修正候補記憶部130には、修正候補テーブル131が設けられている。修正候補テーブル131には、テーマコードA、テーマコードB、一致する観点、一致するカテゴリの数、および優先度の欄が設定されている。各欄の横方向に並べられた情報が、1つの修正候補を示す情報となる。   FIG. 14 is a diagram illustrating an example of a correction candidate table in the correction candidate storage unit. As illustrated in FIG. 14, the correction candidate storage unit 130 includes a correction candidate table 131. The correction candidate table 131 includes columns for theme code A, theme code B, matching viewpoints, number of matching categories, and priority. Information arranged in the horizontal direction of each column is information indicating one correction candidate.

テーマコードAの欄には、仮説の参照元となる基準分野のテーマコードが設定される。具体的には、変数「Ti」に設定されているテーマコードが、テーマコードAの欄に設定される。テーマコードBの欄には、仮説によりテーマコードを追加する改正対象分野のテーマコードが設定される。具体的には、変数「Tj」に設定されているテーマコードが、テーマコードBの欄に設定される。テーマコードAに設定されたテーマコードの分野と、テーマコードBに設定されたテーマコードの分野との対が、整合性検討分野対となる。   In the theme code A column, the theme code of the reference field that is the reference source of the hypothesis is set. Specifically, the theme code set in the variable “Ti” is set in the field of the theme code A. In the field of the theme code B, the theme code of the amendment target field to which the theme code is added according to the hypothesis is set. Specifically, the theme code set in the variable “Tj” is set in the field of the theme code B. A pair of the theme code field set in the theme code A and the theme code field set in the theme code B is a consistency examination field pair.

一致する観点の欄には、テーマコードAに設定された分野とテーマコードBに設定された分野とで一致する観点が設定される。一致するカテゴリの数の欄には、一致する観点で分類するためのカテゴリの一致数が設定される。優先度の欄には、対応する整合性検討分野対の整合性を保つための優先度が設定される。なお、図13に示した処理の段階では、優先度の欄は空欄である。   In the matching viewpoint column, a viewpoint that matches the field set in the theme code A and the field set in the theme code B is set. In the column of the number of matching categories, the number of matching categories for classification from the viewpoint of matching is set. In the priority column, a priority for maintaining the consistency of the corresponding consistency examination field pair is set. Note that the priority column is blank at the stage of processing shown in FIG.

図15は、観点共通分野検索処理の手順を示すフローチャートの後半である。以下、図15に示す処理をステップ番号に沿って説明する。
[ステップS41]カテゴリ切出部123は、変数「Ti」で示される分野と、変数「Tj」で示される分野との一致する観点について、それぞれの分野で定義されているカテゴリの定義文を抽出する。
FIG. 15 is the second half of the flowchart showing the procedure of the viewpoint common field search processing. In the following, the process illustrated in FIG. 15 will be described in order of step number.
[Step S41] The category extraction unit 123 extracts category definition sentences defined in each field for the viewpoints that match the field indicated by the variable “Ti” and the field indicated by the variable “Tj”. To do.

[ステップS42]カテゴリ比較部124は、ステップS41で抽出された定義文からキーワードを抽出する。この際、カテゴリ比較部124は、抽出したキーワードはカテゴリの同一性判定に使用するため、助詞や活用語尾などカテゴリの内容を特徴付けないような文字列は削除する。   [Step S42] The category comparison unit 124 extracts keywords from the definition sentence extracted in step S41. At this time, the category comparison unit 124 uses the extracted keyword to determine the identity of the category, and therefore deletes character strings that do not characterize the content of the category, such as particles and inflections.

[ステップS43]カテゴリ比較部124は、比較対象の2分野それぞれからカテゴリを1つずつ選択して得られるすべての組み合わせについて、選択された2つのカテゴリ間のキーワードを比較し、キーワードの一致・不一致を判定する。   [Step S43] The category comparison unit 124 compares keywords between the two selected categories for all combinations obtained by selecting one category from each of the two fields to be compared, and matches or does not match the keywords. Determine.

[ステップS44]カテゴリ比較部124は、比較結果記憶部140内に現在処理対象となっている整合性検討分野対に対応する比較テーブルを作成し、その比較テーブルに比較結果を書き込む。具体的には、カテゴリ比較部124は、キーワードのすべてが一致していれば、一致を示す比較結果を書き込む。またカテゴリ比較部124は、一部のキーワードのみが一致していれば、部分一致を示す比較結果を書き込む。さらにカテゴリ比較部124は、一致するキーワードが存在しない場合、不一致を示す比較結果を書き込む。   [Step S44] The category comparison unit 124 creates a comparison table corresponding to the consistency study field pair currently being processed in the comparison result storage unit 140, and writes the comparison result in the comparison table. Specifically, if all of the keywords match, the category comparison unit 124 writes a comparison result indicating matching. Moreover, the category comparison part 124 will write the comparison result which shows a partial match, if only a part of keywords match. Further, the category comparison unit 124 writes a comparison result indicating mismatch when there is no matching keyword.

[ステップS45]カテゴリ比較部124は、比較対象の2つの分野間で共通する観点の一致するカテゴリ数から優先度を算出する。この際、変数「Ti」と変数「Tj」とで示される2分野の共通の観点において一致するカテゴリの割合が大きいほど整合性が保たれるべきとして、優先度が高く設定される。例えば、カテゴリ比較部124は、以下のような式で優先度を計算する。
優先度=S/((Ai+Aj)/2) ・・・(1)
ここで、Sは、変数「Ti」と変数「Tj」とで示される2分野に共通の観点に関し、2つの分野にそれぞれ定義されているカテゴリの一致数である。Aiは、2分野に共通の観点に関し、変数「Ti」で示される分野において該当観点に定義されているカテゴリの総数である。Ajは、2分野に共通の観点に関し、変数「Tj」で示される分野において該当観点に定義されているカテゴリの総数である。
[Step S <b> 45] The category comparison unit 124 calculates the priority from the number of categories having the same viewpoint in common between the two fields to be compared. At this time, the priority is set higher because the consistency should be maintained as the proportion of the matching categories in the common viewpoints of the two fields indicated by the variable “Ti” and the variable “Tj” increases. For example, the category comparison unit 124 calculates the priority with the following formula.
Priority = S / ((Ai + Aj) / 2) (1)
Here, S is the number of coincidence of categories respectively defined in the two fields with respect to the viewpoint common to the two fields indicated by the variable “Ti” and the variable “Tj”. Ai is the total number of categories defined in the corresponding viewpoint in the field indicated by the variable “Ti” regarding the viewpoint common to the two fields. Aj is the total number of categories defined in the corresponding viewpoint in the field indicated by the variable “Tj” with respect to the viewpoint common to the two fields.

例えば、図2に示すようなカテゴリが定義されていたとする。この場合、一致するカテゴリは、「移植機等の性能向上」「操作性の向上」「安全性の向上」「作業精度向上」「小型化・軽量化又は製造の合理化」の5つである。田植機の要素(2B062)の目的・機能の観点に設定されているカテゴリの総数は12カテゴリである。また、田植機の接地部(2B063)の目的・機能の観点に設定されているカテゴリは13カテゴリである。すると優先度は0.4となる。   For example, assume that a category as shown in FIG. 2 is defined. In this case, there are five matching categories: “Improved performance of transplanter etc.” “Improved operability” “Improved safety” “Improved work accuracy” “Reduced size / weight or rationalized manufacturing”. The total number of categories set for the purpose / function of the rice transplanter element (2B062) is 12 categories. Further, 13 categories are set from the viewpoint of the purpose / function of the grounding unit (2B063) of the rice transplanter. The priority is then 0.4.

優先度を算出したカテゴリ比較部124は、各整合性検討分野対の一致するカテゴリの数と優先度とを、修正候補テーブル131に書き込む。
なお、共通の観点に定義されているカテゴリが、比較対象の2分野で完全に一致している場合、優先度は「1」となる。この場合には、既に整合性が保たれていると言えるので、カテゴリ比較部124は、該当する整合性検討分野対を修正候補テーブル131から削除する。
The category comparison unit 124 that has calculated the priority writes the number of matching categories and the priorities of each consistency examination field pair in the correction candidate table 131.
Note that when the categories defined in the common viewpoint are completely the same in the two comparison target fields, the priority is “1”. In this case, since it can be said that the consistency is already maintained, the category comparison unit 124 deletes the corresponding consistency examination field pair from the correction candidate table 131.

[ステップS46]カテゴリ比較部124は、変数「j」が、Fターム定義テーブルに登録されているテーマコード数に等しいか否かを判断する。変数「j」がテーマコード数に達している場合、処理がステップS48に進められる。変数「j」がテーマコード数未満の場合、処理がステップS47に進められる。   [Step S46] The category comparison unit 124 determines whether or not the variable “j” is equal to the number of theme codes registered in the F-term definition table. If the variable “j” has reached the number of theme codes, the process proceeds to step S48. If the variable “j” is less than the number of theme codes, the process proceeds to step S47.

[ステップS47]カテゴリ比較部124は、変数「j」がテーマコード数未満であれば、jをインクリメントして、処理をステップS24に進める。
[ステップS48]カテゴリ比較部124は、変数「j」がテーマコード数に達していれば、変数「i」が、Fターム定義テーブルに登録されているテーマコード数に等しいか否かを判断する。変数「i」がテーマコード数に達している場合、観点共通分野検索処理が終了する。変数「i」がテーマコード数未満の場合、処理がステップS49に進められる。
[Step S47] If the variable “j” is less than the number of theme codes, the category comparison unit 124 increments j and advances the process to step S24.
[Step S48] If the variable “j” has reached the number of theme codes, the category comparison unit 124 determines whether the variable “i” is equal to the number of theme codes registered in the F-term definition table. . When the variable “i” has reached the number of theme codes, the viewpoint common field search process ends. If the variable “i” is less than the number of theme codes, the process proceeds to step S49.

[ステップS49]カテゴリ比較部124は、変数「i」がテーマコード数未満の場合、iをインクリメントし、処理をステップS23に進める。
以上のようにして、共通する観点が設定されている整合性検討分野対を抽出することができる。そして、比較結果記憶部140には、整合性検討分野対ごとの比較テーブルが格納される。
[Step S49] If the variable “i” is less than the number of theme codes, the category comparison unit 124 increments i and advances the process to step S23.
As described above, it is possible to extract a consistency study field pair for which a common viewpoint is set. The comparison result storage unit 140 stores a comparison table for each consistency examination field pair.

図16は、比較結果記憶部内の比較テーブルの例を示す図である。比較結果記憶部140には、整合性検討分野対ごとの比較テーブル141,142,143,・・・が格納されている。例えば、比較テーブル141は、「田植機の接地部」の分野(テーマコード「2B063」)と「田植機の要素」の分野(テーマコード「2B062」)との整合性検討分野対に対応する。   FIG. 16 is a diagram illustrating an example of a comparison table in the comparison result storage unit. The comparison result storage unit 140 stores comparison tables 141, 142, 143,... For each consistency study field pair. For example, the comparison table 141 corresponds to the consistency examination field pair between the field (theme code “2B063”) of the “rice transplanter grounding portion” and the field of the “rice transplanter element” (theme code “2B062”).

比較テーブル141の作成処理は、表形式のデータ構造作成処理と、そのデータ構造に対する比較結果書き込み処理とに別れる。図16には、表形式のデータ構造作成後の比較テーブル141が示されている。   The creation process of the comparison table 141 is divided into a tabular data structure creation process and a comparison result writing process for the data structure. FIG. 16 shows a comparison table 141 after the creation of a tabular data structure.

カテゴリ比較部124は、表形式の比較テーブル141を作成する。具体的には、カテゴリ比較部124は、整合性検討分野対の一致する観点に関するテーマコードAの各カテゴリのFタームを、比較テーブル141の列ラベルとする。さらにカテゴリ比較部124は、列ラベルの下に、列ラベルに設定されたFタームに対応するカテゴリの定義を設定する。   The category comparison unit 124 creates a tabular comparison table 141. Specifically, the category comparison unit 124 sets the F term of each category of the theme code A regarding the matching viewpoint of the consistency study field pairs as the column label of the comparison table 141. Further, the category comparison unit 124 sets the definition of the category corresponding to the F term set in the column label below the column label.

また、カテゴリ比較部124は、整合性検討分野対の一致する観点に関するテーマコードBの各カテゴリのFタームを、比較テーブル141の行ラベルとする。さらにカテゴリ比較部124は、行ラベルの右に、行ラベルに設定されたFタームに対応するカテゴリの定義を設定する。   Further, the category comparison unit 124 sets the F term of each category of the theme code B related to the matching viewpoint of the consistency examination field pairs as the row label of the comparison table 141. Further, the category comparison unit 124 sets a category definition corresponding to the F-term set in the row label to the right of the row label.

テーマコードBのFタームが設定された最後行の下にが、行ラベルとして「集計」の文字が設定される。
このようにして作成された比較テーブル141のセルに対して、整合性検討分野対の一致する観点に設定されているカテゴリを比較した結果が書き込まれる。
Under the last line in which the F term of the theme code B is set, the characters “total” are set as the line label.
The result of comparing the categories set in the matching viewpoint of the consistency study field pairs is written in the cells of the comparison table 141 created in this way.

図17は、判定結果書き込み後の比較テーブルを示す図である。比較結果として、定義のキーワードが完全一致した場合には「○」、部分一致の場合には「△」、不一致の場合には「×」が書き込まれている。図17の例では、「操作性向上」、「安定性の向上」のカテゴリが完全一致している。また、基準分野(テーマコードA)の「走行性の向上」、「バランス及び安定性」は、改正対象分野(テーマコードB)の「走行性又は安定性の向上」と部分一致している。なお、比較結果を登録した時点では、「集計」欄は空白のままである。   FIG. 17 is a diagram illustrating the comparison table after the determination result is written. As a comparison result, “◯” is written when the definition keywords are completely matched, “Δ” is written when they are partially matched, and “X” is written when they are not matched. In the example of FIG. 17, “operability improvement” and “stability improvement” categories are completely the same. In addition, “improvement in running performance” and “balance and stability” in the reference field (theme code A) partially coincide with “improvement in running ability or stability” in the revision target field (theme code B). Note that when the comparison result is registered, the “total” column is left blank.

その後、カテゴリ比較部124により整合性検討分野対ごとの優先度が計算され、修正候補テーブル131に設定される。
図18は、優先度設定後の修正候補テーブルを示す図である。図18に示すように、各整合性検討分野対に対して優先度が設定される。優先度の値が高い程、整合性を保持する必要性が高いことを意味している。
Thereafter, the category comparison unit 124 calculates the priority for each consistency examination field pair and sets the priority in the correction candidate table 131.
FIG. 18 is a diagram illustrating a correction candidate table after priority setting. As shown in FIG. 18, a priority is set for each consistency study field pair. The higher the priority value, the higher the need to maintain consistency.

図17に示したような整合性検討分野対ごとの比較テーブル141,142,143,・・・と、図18に示したような修正候補テーブル131が作成されると、仮説設定部150による仮説設定処理が実行される。   When the comparison table 141, 142, 143,... For each consistency examination field pair as shown in FIG. 17 and the correction candidate table 131 as shown in FIG. Setting processing is executed.

図19は、仮説設定部の内部機能を示すブロック図である。仮説設定部150は、比較テーブル集計部151と仮説対象抽出部152とを有している。
比較テーブル集計部151は、比較結果記憶部140内の各比較テーブル141,142,143,・・・のカテゴリの一致/不一致に関する情報を集計する。その際、比較テーブル集計部151は、修正候補記憶部130内の修正候補テーブル131に設定されている優先度を参照し、優先度が高い整合性検討分野対から順に、対応する比較テーブルの集計を行う。
FIG. 19 is a block diagram illustrating the internal functions of the hypothesis setting unit. The hypothesis setting unit 150 includes a comparison table totaling unit 151 and a hypothesis target extraction unit 152.
The comparison table totaling unit 151 totals information related to the match / mismatch of the categories of the comparison tables 141, 142, 143,... In the comparison result storage unit 140. At that time, the comparison table totaling unit 151 refers to the priority set in the correction candidate table 131 in the correction candidate storage unit 130, and totals the corresponding comparison tables in order from the consistency examination field pair having the highest priority. I do.

仮説対象抽出部152は、集計結果に基づいて改正対象分野へ追加すべきカテゴリを判定し、仮説テーブルを作成する。仮説テーブルは、仮説記憶部160に格納される。
次に、仮説設定処理を詳細に説明する。
The hypothesis target extraction unit 152 determines a category to be added to the revision target field based on the tabulation result, and creates a hypothesis table. The hypothesis table is stored in the hypothesis storage unit 160.
Next, the hypothesis setting process will be described in detail.

図20は、仮説設定処理の手順を示すフローチャートである。以下、図20に示す処理をステップ番号に沿って説明する。
[ステップS51]比較テーブル集計部151は、優先度の高い順に修正候補テーブル131内のレコードをソートする。優先度が高い整合性検討分野対は、元々整合性が高い。既に高い整合性が得られていれば、少ない修正で、各分野のカテゴリを整合させることができる。そのため、優先度の高い候補を先に処理することとする。
FIG. 20 is a flowchart illustrating the procedure of hypothesis setting processing. In the following, the process illustrated in FIG. 20 will be described in order of step number.
[Step S51] The comparison table totaling unit 151 sorts the records in the correction candidate table 131 in descending order of priority. A consistency study field pair with a high priority is originally highly consistent. If high consistency has already been obtained, the categories of each field can be matched with a small amount of correction. Therefore, a candidate with a high priority is processed first.

[ステップS52]比較テーブル集計部151は、修正候補テーブル131の最も優先度の高い整合性検討分野対を選択する。
[ステップS53]比較テーブル集計部151は、選択した整合性検討分野対に対応する比較テーブルを縦方向に集計する。縦方向に見て「○」がある場合には、該当する列のラベルに設定されている基準分野(「テーマコードA」で示される分野)のカテゴリと一致するカテゴリが、改正対象分野に既に存在していることになる。この場合、改正対象分野(「テーマコードB」で示される分野)に新たなカテゴリを追加する必要がない。そこで、比較テーブル集計部151は、縦方向で少なくとも1つ「○」があれば、該当する列の集計欄に、一致することを示す記号「○」を書き込む。
[Step S <b> 52] The comparison table totaling unit 151 selects the consistency study field pair having the highest priority in the correction candidate table 131.
[Step S53] The comparison table totaling unit 151 totals the comparison tables corresponding to the selected consistency examination field pairs in the vertical direction. If there is a “○” in the vertical direction, a category that matches the category of the reference field (the field indicated by “Theme Code A”) set in the label of the corresponding column has already been included in the amendment target field. It will exist. In this case, it is not necessary to add a new category to the revision target field (the field indicated by “theme code B”). Therefore, if there is at least one “◯” in the vertical direction, the comparison table totaling unit 151 writes a symbol “◯” indicating that it matches in the total column of the corresponding column.

また、比較テーブルを縦方向に見てすべてが「×」の場合、改正対象分野に、基準分野にあるカテゴリと対応付くカテゴリがないことを意味している。この場合、分類体系の改正案として、改正対象分野の下に新たなカテゴリを作成することが仮説として成り立つ。そこで、比較テーブル集計部151は、縦方向ですべて「×」であれば、集計欄に追加対象カテゴリであることを示す記号「×」を書き込む。   Further, when all of the comparison tables in the vertical direction are “x”, it means that there is no category corresponding to the category in the reference field in the revision target field. In this case, the hypothesis is that a new category is created under the revision target field as a revision proposal for the classification system. Therefore, the comparison table totaling unit 151 writes the symbol “X” indicating that the category is the addition target category in the totaling column if all the “×” in the vertical direction.

さらに、縦方向に集計する際に「△」があった場合には、部分的に一致するカテゴリが存在する。本実施の形態では、部分的に一致するカテゴリについては、修正の対象とはしない。ただし、部分的に一致する場合、カテゴリの分割や統合という改正によって、より正確にカテゴリを整合させることもできる。そこで、比較テーブル集計部151は、縦方向にみて「○」が存在せず、少なくとも1つ「△」であれば、該当する列の集計欄に、分割や統合の対象カテゴリであることを示す記号「△」を書き込む。   Furthermore, when “Δ” is present when tallying in the vertical direction, there is a partially matching category. In the present embodiment, partially matching categories are not subject to correction. However, in the case of partial matching, the categories can be more accurately matched by amending the division or integration of categories. Therefore, the comparison table totalization unit 151 indicates that the category is a division or integration target category in the total column of the corresponding column if there is no “◯” in the vertical direction and at least one “Δ”. Write the symbol “△”.

[ステップS54]仮説対象抽出部152は、比較テーブル集計部151による集計対象とされた比較テーブルの集計が完了すると、集計欄の未選択の集計結果を1つ選択する。   [Step S54] When the comparison table aggregation unit 151 completes the aggregation of the comparison table that is the aggregation object, the hypothesis target extraction unit 152 selects one unselected aggregation result in the aggregation column.

[ステップS55]仮説対象抽出部152は、集計結果が「×」か否かを判断する。集計結果が「×」であれば、処理がステップS56に進められる。集計結果が「×」以外であれば、処理がステップS57に進められる。   [Step S55] The hypothesis target extraction unit 152 determines whether or not the counting result is “x”. If the count result is “x”, the process proceeds to step S56. If the count result is other than “x”, the process proceeds to step S57.

[ステップS56]仮説対象抽出部152は、選択した集計結果が「×」であれば、その集計結果の列に設定されている基準分野のカテゴリを、改正対象分野に追加するものとする仮説を、仮説記憶部160内の仮説テーブルに登録する。このように、テーマコードに新しいカテゴリを作成する必要があるときだけ、仮説テーブルに新たな仮説が書き込まれる。   [Step S56] If the selected aggregation result is “x”, the hypothesis target extraction unit 152 selects a hypothesis that the category of the reference field set in the column of the aggregation result is added to the revision target field. And registered in the hypothesis table in the hypothesis storage unit 160. In this way, a new hypothesis is written in the hypothesis table only when a new category needs to be created in the theme code.

[ステップS57]仮説対象抽出部152は、すべての集計結果を選択したか否かを判断する。すべての集計結果が選択されていれば、処理がステップS58に進められる。未選択の集計結果があれば、処理がステップS54に進められ、別の集計結果が選択される。   [Step S57] The hypothesis target extraction unit 152 determines whether all the tabulation results have been selected. If all the tabulation results have been selected, the process proceeds to step S58. If there is an unselected count result, the process proceeds to step S54, and another count result is selected.

[ステップS58]比較テーブル集計部151は、修正候補テーブル内のすべての整合性検討分野対を選択したか否かを判断する。すべての整合性検討分野対の選択が完了した場合、仮説設定処理が終了する。未選択の整合性検討分野対がある場合、処理がステップS52に進められ次の整合性検討分野対が選択される。   [Step S58] The comparison table totaling unit 151 determines whether or not all consistency examination field pairs in the correction candidate table have been selected. When the selection of all consistency study field pairs is completed, the hypothesis setting process ends. If there is an unselected consistency examination field pair, the process proceeds to step S52, and the next consistency examination field pair is selected.

このようにして、比較テーブルの集計を行い、集計結果に基づいて仮説設定部150により仮説が設定される。
図21は、集計された比較テーブルの例を示す図である。比較テーブル141は、列ごとにカテゴリ一致/不一致の判定結果が集計されている。本実施の形態では、集計結果が「×」のカテゴリを改正対象分野へ追加するものとして仮説が立てられる。立てられた仮説は、仮説テーブルに設定される。
In this way, the comparison table is aggregated, and a hypothesis is set by the hypothesis setting unit 150 based on the aggregation result.
FIG. 21 is a diagram showing an example of the tabulated comparison table. In the comparison table 141, the category match / mismatch determination results are tabulated for each column. In the present embodiment, a hypothesis is established as adding a category of “×” as the total result to the revision target field. The established hypothesis is set in the hypothesis table.

図22は、仮説記憶部内の仮説テーブルのデータ構造例を示す図である。仮説記憶部160内の仮説テーブル161は、基準分野、改正対象分野、観点、仮説、および検証結果の欄が設けられている。   FIG. 22 is a diagram illustrating a data structure example of a hypothesis table in the hypothesis storage unit. The hypothesis table 161 in the hypothesis storage unit 160 includes columns for a reference field, a field to be revised, a viewpoint, a hypothesis, and a verification result.

基準分野の欄には、仮説の基準分野のテーマコードが設定される。改正対象分野の欄には、仮説の改正対象分野のテーマコードが設定される。観点の欄には、整合性の保持対象となる観点が設定される。仮説の欄には、改正対象分野に対して行う分類体系の変更内容(仮説)が設定される。例えば、所定のカテゴリを追加することが、仮説として設定される。検証結果の欄には、仮説が適切か否かの検証結果が設定される。なお、仮説設定後、検証前の時点では、検証結果の欄は空欄である。   The theme code of the hypothetical reference field is set in the reference field column. The theme code of the revision target field of the hypothesis is set in the field of the revision target field. In the viewpoint column, a viewpoint to which consistency is to be maintained is set. In the hypothesis column, the change contents (hypotheses) of the classification system to be applied to the revision target field are set. For example, adding a predetermined category is set as a hypothesis. In the verification result column, a verification result indicating whether or not the hypothesis is appropriate is set. Note that the verification result column is blank after the hypothesis setting and before verification.

仮説設定処理が完了すると、仮説検証部170による仮説の検証が行われる。
図23は、仮説検証部の内部機能を示すブロック図である。仮説検証部170は、特徴キーワード抽出部171、特徴キーワード記憶部172、特許文献検索部173、および仮説判定部174を有している。
When the hypothesis setting process is completed, the hypothesis verification unit 170 performs hypothesis verification.
FIG. 23 is a block diagram illustrating an internal function of the hypothesis verification unit. The hypothesis verification unit 170 includes a feature keyword extraction unit 171, a feature keyword storage unit 172, a patent document search unit 173, and a hypothesis determination unit 174.

特徴キーワード抽出部171は、仮説記憶部160内の仮説テーブル161に設定された仮説の基準分野に分類された特許文献を特許文献DB21から取得する。そして特徴キーワード抽出部171は、仮説によって追加対象となっているカテゴリに属する特許文献の特徴キーワードを抽出する。特徴キーワード抽出部171は、抽出した特徴キーワードを、特徴キーワード記憶部172に格納する。   The feature keyword extraction unit 171 acquires from the patent document DB 21 patent documents classified in the hypothesis reference field set in the hypothesis table 161 in the hypothesis storage unit 160. Then, the feature keyword extraction unit 171 extracts feature keywords of patent documents belonging to the category to be added based on the hypothesis. The feature keyword extraction unit 171 stores the extracted feature keyword in the feature keyword storage unit 172.

特徴キーワード記憶部172は、特徴キーワードを記憶する記憶機能である。例えば、RAM102の記憶領域の一部が特徴キーワード記憶部172として使用される。
特許文献検索部173は、仮説によって追加対象となっているカテゴリに属する特許文献の特徴キーワードによって、特許文献DB21内で仮説の改正対象分野に分類されている特許文献の検索を行う。
The feature keyword storage unit 172 is a storage function that stores feature keywords. For example, a part of the storage area of the RAM 102 is used as the feature keyword storage unit 172.
The patent document search unit 173 searches for patent documents classified in the hypothesis revision target field in the patent document DB 21 based on the feature keywords of the patent documents belonging to the category to be added by the hypothesis.

仮説判定部174は、特許文献検索部173による検索結果に応じて、仮説の適否を判定する。仮説判定部174は、仮説が適切であると判定した場合、仮説の内容を改正案記憶部180に格納する。   The hypothesis determination unit 174 determines whether the hypothesis is appropriate according to the search result by the patent document search unit 173. When the hypothesis determination unit 174 determines that the hypothesis is appropriate, the hypothesis determination unit 174 stores the content of the hypothesis in the revision plan storage unit 180.

次に、仮説検証処理の手順について詳細に説明する。
図24は、仮説検証処理の手順を示すフローチャートである。以下、図24に示す処理をステップ番号に沿って説明する。
Next, the procedure of the hypothesis verification process will be described in detail.
FIG. 24 is a flowchart showing the procedure of hypothesis verification processing. In the following, the process illustrated in FIG. 24 will be described in order of step number.

[ステップS61]特徴キーワード抽出部171は、仮説テーブル161内の未処理の仮説を1つ選択する。
[ステップS62]特徴キーワード抽出部171は、追加カテゴリの特徴キーワード抽出処理を行う。この処理の詳細は後述する(図25参照)。
[Step S61] The feature keyword extraction unit 171 selects one unprocessed hypothesis in the hypothesis table 161.
[Step S62] The feature keyword extraction unit 171 performs a feature keyword extraction process for an additional category. Details of this processing will be described later (see FIG. 25).

[ステップS63]特許文献検索部173は、特許文献DB21の改正対象分野の整合性を図る観点で「その他」に分類された特許文献を、追加するカテゴリの特徴キーワードで検索する。このとき特徴キーワードが複数ある場合、各特徴キーワードの論理和(OR)検索が行われる。   [Step S63] The patent document search unit 173 searches the patent keywords classified as “others” with the feature keyword of the category to be added from the viewpoint of achieving consistency in the revision target field of the patent document DB 21. At this time, when there are a plurality of feature keywords, a logical sum (OR) search of each feature keyword is performed.

[ステップS64]特許文献検索部173は、検索によるヒット件数を、変数Zに代入する。
[ステップS65]仮説判定部174は、変数Zに設定されたヒット件数が閾値以上か否かを判断する。ヒット件数が、予め設定された閾値以上であれば、処理がステップS66に進められる。ヒット件数が閾値未満であれば、処理がステップS67に進められる。
[Step S64] The patent document search unit 173 substitutes the variable Z for the number of hits by the search.
[Step S65] The hypothesis determination unit 174 determines whether or not the number of hits set in the variable Z is equal to or greater than a threshold value. If the number of hits is equal to or greater than a preset threshold, the process proceeds to step S66. If the number of hits is less than the threshold, the process proceeds to step S67.

なお、閾値は、特許文献DB21に登録されている特許文献の数に応じて、変更するようにしてもよい。例えば、仮説判定部174において、検索対象として登録されている特許文献の総数に対するヒット率の閾値を予め定義しておく。そして、仮説判定部174では、ヒット件数が、特許文献の総数に閾値を乗算した値以上であれば、ヒット件数が閾値以上であると判定する。   The threshold may be changed according to the number of patent documents registered in the patent document DB 21. For example, in the hypothesis determination unit 174, a threshold value of the hit rate with respect to the total number of patent documents registered as search targets is defined in advance. The hypothesis determination unit 174 determines that the number of hits is equal to or greater than the threshold if the number of hits is equal to or greater than a value obtained by multiplying the total number of patent documents by a threshold.

[ステップS66]仮説判定部174は、ヒット件数が閾値以上であれば、選択した仮説の検証結果欄に、仮説が適切であることを示す記号「○」を設定する。その後、処理がステップS68に進められる。   [Step S66] If the number of hits is equal to or greater than the threshold, the hypothesis determination unit 174 sets a symbol “◯” indicating that the hypothesis is appropriate in the verification result column of the selected hypothesis. Thereafter, the process proceeds to step S68.

[ステップS67]仮説判定部174は、ヒット件数が閾値未満であれば、選択した仮説の検証結果欄に、仮説が不適切であることを示す記号「×」を設定する。
[ステップS68]特徴キーワード抽出部171は、すべての仮説を検証したか否かを判断する。すべての仮説の検証が終了した場合、処理がステップS69に進められる。未処理の仮説があれば、処理がステップS61に進められ次の仮説が選択される。
[Step S67] If the number of hits is less than the threshold, the hypothesis determination unit 174 sets a symbol “x” indicating that the hypothesis is inappropriate in the verification result column of the selected hypothesis.
[Step S68] The feature keyword extraction unit 171 determines whether or not all hypotheses have been verified. If all the hypotheses have been verified, the process proceeds to step S69. If there is an unprocessed hypothesis, the process proceeds to step S61 and the next hypothesis is selected.

[ステップS69]仮説判定部174は、仮説テーブル161の検証結果欄が「○」になった仮説から改正対象分野、観点、仮説を抜き出し、改正案テーブルを生成する。生成された改正案テーブルは、改正案記憶部180に格納される。   [Step S69] The hypothesis determination unit 174 extracts the revision target field, viewpoint, and hypothesis from the hypothesis in which the verification result column of the hypothesis table 161 is “◯”, and generates a revision plan table. The generated revision plan table is stored in the revision plan storage unit 180.

次に、追加カテゴリの特徴キーワード抽出処理について詳細に説明する。
図25は、追加カテゴリの特徴キーワード抽出処理の手順を示すフローチャートである。以下、図25に示す処理をステップ番号に沿って説明する。
Next, the feature keyword extraction process of the additional category will be described in detail.
FIG. 25 is a flowchart showing a procedure of additional keyword feature keyword extraction processing. In the following, the process illustrated in FIG. 25 will be described in order of step number.

[ステップS71]特徴キーワード抽出部171は、特許文献DB21にアクセスする。そして、特徴キーワード抽出部171は、改正対象分野と共通の観点によって基準分野を分類したカテゴリのうち、改正対象分野に追加すると仮定したカテゴリ以外のカテゴリに分類された特許文献の集合からキーワードセットαを抽出する。キーワードセットαの抽出には、既存の技術として一般に知られている形態素解析技術や、複合語抽出技術、情報抽出技術を用いることができる。   [Step S71] The feature keyword extraction unit 171 accesses the patent document DB 21. The feature keyword extraction unit 171 then selects a keyword set α from a set of patent documents classified into a category other than the category that is assumed to be added to the revision target field among the categories in which the reference field is classified from the same viewpoint as the revision target field. To extract. For extracting the keyword set α, a morphological analysis technique, a compound word extraction technique, and an information extraction technique, which are generally known as existing techniques, can be used.

[ステップS72]特徴キーワード抽出部171は、特許文献DB21にアクセスする。そして、特徴キーワード抽出部171は、改正対象分野と共通の観点によって基準分野を分類したカテゴリのうち、改正対象分野に追加すると仮定したカテゴリに分類された特許文献の集合からキーワードセットβを抽出する。   [Step S72] The characteristic keyword extraction unit 171 accesses the patent document DB 21. Then, the feature keyword extraction unit 171 extracts the keyword set β from the set of patent documents classified in the category that is assumed to be added to the revision target field among the categories in which the reference field is classified from the same viewpoint as the revision target field. .

[ステップS73]特徴キーワード抽出部171は、キーワードセットαとキーワードセットβとを統計的に処理し、キーワードセットβに特徴的な特徴キーワードセットδを抽出する。統計量としてはカイ二乗値や、カルバック・ライブラー情報量などを用いることができる。   [Step S73] The feature keyword extraction unit 171 statistically processes the keyword set α and the keyword set β, and extracts a feature keyword set δ characteristic of the keyword set β. As a statistic, a chi-square value, a cullback / librar information amount, or the like can be used.

なお、特徴キーワードセットδのうち、基準分野全体と改正対象分野全体のうちのどちらか一方だけで重み(特徴を示す度合い)が大きくなるキーワードを除外することもできる。これにより、基準分野と改正対象分野でのそれぞれの分野に固有なキーワードによって誤った結果が出るのを防ぐことができる。   In the feature keyword set δ, it is also possible to exclude a keyword whose weight (degree of feature display) is large only in one of the entire reference field and the entire revision target field. As a result, it is possible to prevent an erroneous result from being produced by a keyword specific to each field in the reference field and the field to be revised.

ここで、カイ二乗値とカルバック・ライブラー情報量を用いた特徴キーワードセットδの抽出処理について詳細に説明する。
図26は、基準分野における特許文献の分類状況を示す図である。この例では、「分野A」が基準分野であるものとする。また、改正対象分野に追加するものと仮定されたカテゴリを、「カテゴリc」とする。「分野A」全体に属する特許文献数は「NA」である。
「カテゴリc」に属する特許文献数は「NC」である。
Here, the process of extracting the feature keyword set δ using the chi-square value and the amount of information of the cullback / librar is described in detail.
FIG. 26 is a diagram showing the classification status of patent documents in the reference field. In this example, it is assumed that “field A” is the reference field. Further, a category assumed to be added to the revision target field is “category c”. Patent Document Number belonging to the entire "field A" is "N A".
The number of patent documents belonging to “category c” is “N C ”.

ここで、キーワードKの重みを計算するものとする。その場合、「分野A」全体に対してキーワードKによる検索が行われる。これにより「分野A」全体におけるキーワードKを含む特許文献数KAが得られる。また、「カテゴリc」に属する特許文献に対してキーワードKによる検索が行われる。これにより「カテゴリc」に属する特許文献のうちキーワードKを含む特許文献数KCが得られる。 Here, the weight of the keyword K is calculated. In this case, a search using the keyword K is performed for the entire “field A”. As a result, the number of patent documents K A including the keyword K in the entire “field A” is obtained. In addition, a search using a keyword K is performed for patent documents belonging to “category c”. Thus, the number of patent documents K C including the keyword K among the patent documents belonging to “category c” is obtained.

この場合のカイ二乗値(χ2)の計算式は、以下の通りである。
χ2=(KC−E)2/E ・・・(2)
ここで、Eは分野A全体でのキーワードKの期待値である。このとき、キーワードKの期待値Eは以下のように計算することができる。
E=(KA×NC)/NA ・・・(3)
式(2)、式(3)によって得られるχ2の値が大きい程、キーワードKが、「カテゴリc」の特徴をより強く表していることとなる。
The calculation formula of the chi-square value (χ 2 ) in this case is as follows.
χ 2 = (K C −E) 2 / E (2)
Here, E is an expected value of the keyword K in the entire field A. At this time, the expected value E of the keyword K can be calculated as follows.
E = (K A × N C ) / N A (3)
The larger the value of χ 2 obtained by the equations (2) and (3), the stronger the keyword K represents the feature of “category c”.

また、図26に示した分類状況下で、カルバック・ライブラー情報量DKLは以下の式で計算できる。
KL=P×log(P/Q) ・・・(4)
ここでPは、「カテゴリc」に含まれる特許文献の中で、キーワードKを含む確率である。また、Qは、「分野A」全体でのキーワードKを含む確率である。P,Qは、それぞれ以下の式で表される。
P=KC/NC ・・・(5)
Q=KA/NA ・・・(6)
式(4)〜式(6)によって得られるカルバック・ライブラー情報量DKLの値が大きい程、キーワードKが、「カテゴリc」の特徴をより強く表していることとなる。
Further, under the classification situation shown in FIG. 26, Kullback-Leibler divergence D KL can be calculated by the following equation.
D KL = P × log (P / Q) (4)
Here, P is the probability of including the keyword K among the patent documents included in the “category c”. Q is a probability of including the keyword K in the entire “field A”. P and Q are represented by the following equations, respectively.
P = K C / N C (5)
Q = K A / N A (6)
The larger the value of the Cullback / librar information amount D KL obtained by the equations (4) to (6), the stronger the keyword K represents the feature of the “category c”.

このように、カイ二乗値やカルバック・ライブラー情報量を用いて、任意のキーワードに関する重み(「カテゴリc」の特徴をどの程度強く表しているか)が計算できる。特徴キーワード抽出部171は、「カテゴリc」に属する特許文献から抽出したキーワードセットに含まれる各キーワードについて、重みを求める。そして、特徴キーワード抽出部171は、例えば重みが所定値よりきいキーワードの集合を、特徴キーワードセットδとする。   In this way, using the chi-square value and the Cullback / librar information amount, it is possible to calculate the weight related to an arbitrary keyword (how strongly the feature of “category c” is expressed). The feature keyword extraction unit 171 obtains a weight for each keyword included in the keyword set extracted from the patent document belonging to “category c”. Then, the feature keyword extraction unit 171 sets, for example, a set of keywords whose weight is greater than a predetermined value as a feature keyword set δ.

特徴キーワードセットδに含まれる各キーワードは、RAM102内に設けられた特徴キーワードテーブルに格納される。
図27は、特徴キーワードテーブルのデータ構造例を示す図である。特徴キーワード記憶部172には、特徴キーワードテーブル172aが格納されている。特徴キーワードテーブル172aには、Fターム、カテゴリ、および特徴キーワードの欄が設けられている。
Each keyword included in the feature keyword set δ is stored in a feature keyword table provided in the RAM 102.
FIG. 27 is a diagram illustrating an example of the data structure of the feature keyword table. The feature keyword storage unit 172 stores a feature keyword table 172a. The feature keyword table 172a has columns for F-term, category, and feature keyword.

Fタームの欄には、各カテゴリのFタームが設定される。カテゴリの欄には、カテゴリの定義内容が設定される。特徴キーワードの欄には、対応するカテゴリの特徴キーワードが設定される。   The F term of each category is set in the F term column. The category definition content is set in the category column. In the feature keyword column, the feature keyword of the corresponding category is set.

このような各カテゴリの特徴キーワードに基づいて仮説が検証され、仮説テーブル161の検証結果の欄に、仮説の適否が設定される。
図28は、仮説検証完了後の仮説テーブルの例を示す図である。図28の例では、テーマコード「2B062」の分野における「目的・機能」の観点における分類のカテゴリに「植付精度の向上」を追加する仮説に対し、適切である旨の記号「○」が設定されている。他方、テーマコード「2F065」の分野における「光源」の観点における分類のカテゴリに「ランプ」を追加する仮説に対し、不適切である旨の記号「×」が設定されている。
The hypothesis is verified based on the feature keyword of each category, and the suitability of the hypothesis is set in the verification result column of the hypothesis table 161.
FIG. 28 is a diagram illustrating an example of a hypothesis table after completion of hypothesis verification. In the example of FIG. 28, the symbol “○” indicating that it is appropriate for the hypothesis of adding “improving planting accuracy” to the category of classification in the field of “purpose / function” in the field of the theme code “2B062”. Is set. On the other hand, the symbol “x” indicating that the lamp is inappropriate is set for the hypothesis of adding “lamp” to the category of classification from the viewpoint of “light source” in the field of the theme code “2F065”.

このような検証結果が登録された仮説テーブル161から適切な仮説のみが抽出され、改正案記憶部180に改正案として格納される。
図29は、改正案記憶部のデータ構造例を示す図である。改正案記憶部180には、改正案を登録する改正案テーブル181が格納されている。改正案テーブル181は、テーマコード、観点、および改正案の欄が設けられている。
Only appropriate hypotheses are extracted from the hypothesis table 161 in which such verification results are registered, and stored in the revision plan storage unit 180 as revision plans.
FIG. 29 is a diagram illustrating an example of the data structure of the revision plan storage unit. The revision plan storage unit 180 stores a revision plan table 181 for registering revision plans. The revision plan table 181 includes columns for a theme code, a viewpoint, and a revision plan.

テーマコードの欄には、改正を行うべき分野のテーマコードが設定される。観点の欄には、カテゴリの追加対象となる観点が設定される。改正案の欄には、追加するカテゴリの定義内容が設定される。   The theme code of the field to be revised is set in the theme code column. In the viewpoint column, a viewpoint to which a category is added is set. The definition of the category to be added is set in the revision column.

以上のようにして、観点に基づく分類カテゴリの適切な改正案を作成することができる。改正案テーブル181に格納された改正案は、結果表示部190によって内容がモニタ11に表示される。ユーザはモニタ11に表示された改正案を参照し、Fタームの分類体系の改正に役立てることができる。   As described above, it is possible to create an appropriate revision proposal for the classification category based on the viewpoint. The content of the revision plan stored in the revision plan table 181 is displayed on the monitor 11 by the result display unit 190. The user can refer to the revision plan displayed on the monitor 11 and can use it for the revision of the F-term classification system.

しかも特許文献DB21に登録されている特許文献を用いて仮説を検証する。特許文献DB21はFタームによって既に膨大な量の特許文献が分類されているため、特許文献DB21を利用することで仮説の適否を正確に判定することができる。   In addition, the hypothesis is verified using the patent documents registered in the patent document DB 21. Since patent document DB21 has already classified a huge amount of patent documents by F-term, the suitability of the hypothesis can be accurately determined by using patent document DB21.

[第2の実施の形態]
次に、第2の実施の形態について説明する。第2の実施の形態は、機械学習による分類器を用いて検証を行うものである。第2の実施の形態における処理機能は、仮説検証部の機能のみが第1の実施の形態と異なる。
[Second Embodiment]
Next, a second embodiment will be described. In the second embodiment, verification is performed using a classifier based on machine learning. The processing function in the second embodiment is different from the first embodiment only in the function of the hypothesis verification unit.

図30は、第2の実施の形態における仮説検証部の内部機能を示すブロック図である。第2の実施の形態における仮説検証部170aは、共通キーワード抽出部175、共通キーワード記憶部176、機械学習部177、分類部178、および仮説判定部179を有する。   FIG. 30 is a block diagram illustrating an internal function of the hypothesis verification unit according to the second embodiment. The hypothesis verification unit 170a in the second embodiment includes a common keyword extraction unit 175, a common keyword storage unit 176, a machine learning unit 177, a classification unit 178, and a hypothesis determination unit 179.

共通キーワード抽出部175は、特許文献DB21にアクセスし、仮説記憶部160に格納されている仮説の基準分野と改正対象分野との両方に出現するキーワードを抽出する。共通キーワード抽出部175は、抽出した共通キーワードの集合(共通キーワードセット)を共通キーワード記憶部176に格納する。   The common keyword extraction unit 175 accesses the patent document DB 21 and extracts keywords appearing in both the hypothesis reference field and the revision target field stored in the hypothesis storage unit 160. The common keyword extraction unit 175 stores the set of extracted common keywords (common keyword set) in the common keyword storage unit 176.

共通キーワード記憶部176は、仮説ごとの共通キーワードセットを記憶する記憶機能である。例えば、RAM102の記憶領域の一部が共通キーワード記憶部176として使用される。   The common keyword storage unit 176 is a storage function that stores a common keyword set for each hypothesis. For example, a part of the storage area of the RAM 102 is used as the common keyword storage unit 176.

機械学習部177は、基準分野に分類された特許文献を用いて、共通キーワードセットに基づいて機械学習を行い、追加対象となるカテゴリに関する分類器を生成する。
分類部178は、機械学習によって生成された分類器により、改正対象分野の検討対象観点における「その他」のカテゴリに属する特許文献を分類する。
The machine learning unit 177 performs machine learning based on the common keyword set using patent documents classified in the reference field, and generates a classifier related to the category to be added.
The classifying unit 178 classifies patent documents belonging to the “others” category from the viewpoint of consideration of the revision target field, using a classifier generated by machine learning.

仮説判定部179は、機械学習によって新たに作成された分類器で、追加対象となるカテゴリに分類された特許文献の件数に基づいて、仮説の適否を判定する。
図31は、機械学習を用いた仮説検証処理の手順を示すフローチャートである。以下、図31に示す処理をステップ番号に沿って説明する。
The hypothesis determination unit 179 is a classifier newly created by machine learning, and determines whether the hypothesis is appropriate based on the number of patent documents classified into categories to be added.
FIG. 31 is a flowchart illustrating a procedure of hypothesis verification processing using machine learning. In the following, the process illustrated in FIG. 31 will be described in order of step number.

[ステップS81]共通キーワード抽出部175は、仮説テーブル161内の未処理の仮説を1つ選択する。
[ステップS82]共通キーワード抽出部175は、選択した仮説の基準分野と改正対象分野との両方に出現するキーワードを抽出し、共通キーワードセットγとする。生成された共通キーワードセットγは、共通キーワード記憶部176に格納される。
[Step S81] The common keyword extraction unit 175 selects one unprocessed hypothesis in the hypothesis table 161.
[Step S82] The common keyword extraction unit 175 extracts keywords that appear in both the reference field and the revision target field of the selected hypothesis, and sets them as a common keyword set γ. The generated common keyword set γ is stored in the common keyword storage unit 176.

[ステップS83]機械学習部177は、共通キーワードセットγ内の各キーワードについて、機械学習によって重み付けを行う。具体的には、機械学習部177は、選択した仮説の基準分野において、改正対象分野への追加候補カテゴリに分類されている特許文献を正例とする。また機械学習部177は、選択した仮説の基準分野において、改正対象分野への追加対象となっているカテゴリ以外に分類されている特許文献を負例とする。機械学習部177は、キーワードが正例に多く含まれるほど、および負例に含まれないほど、そのキーワードの重みが大きくなるように、各キーワードの重みを計算する。キーワードごとの重みの情報が、追加するカテゴリに関する分類器となる。   [Step S83] The machine learning unit 177 weights each keyword in the common keyword set γ by machine learning. Specifically, the machine learning unit 177 uses, as a positive example, patent documents classified in an additional candidate category for the revision target field in the reference field of the selected hypothesis. In addition, the machine learning unit 177 uses, as a negative example, patent documents that are classified in categories other than the category to be added to the revision target field in the reference field of the selected hypothesis. The machine learning unit 177 calculates the weight of each keyword so that the more the keyword is included in the positive example and the more the keyword is not included in the negative example, the greater the weight of the keyword. The weight information for each keyword is a classifier for the category to be added.

[ステップS84]分類部178は、分類器を用い、選択された仮説の改正対象分野における検討対象観点での分類において「その他」に分類された特許文献が追加候補カテゴリに属するか否かを分類する。具体的には、分類部178は、分類対象の特許文献からキーワードを抽出し、分類器と照合する。分類器において高い値の重みが設定されているキーワードが、分類対象の特許文献から多く検出されるほど、その特許文献が追加候補カテゴリに属する可能性が高いと判定される。分類部178は、所定以上の可能性で追加候補カテゴリに含まれると判断した特許文献を、そのカテゴリに分類する。   [Step S84] The classification unit 178 uses the classifier to classify whether or not the patent document classified as “Other” in the classification from the viewpoint of examination in the revision target field of the selected hypothesis belongs to the additional candidate category. To do. Specifically, the classification unit 178 extracts keywords from the patent documents to be classified and collates them with the classifier. It is determined that there is a high possibility that the patent document belongs to the additional candidate category as the number of keywords set with a high weight in the classifier is detected from the patent documents to be classified. The classification unit 178 classifies the patent documents that are determined to be included in the additional candidate category with a possibility greater than or equal to a predetermined value into the category.

[ステップS85]分類部178は、追加候補カテゴリに分類された特許文献の件数を、変数Zに代入する。
[ステップS86]仮説判定部179は、変数Zに設定された件数が閾値以上か否かを判断する。件数が予め設定された閾値以上であれば、処理がステップS87に進められる。件数が閾値未満であれば、処理がステップS88に進められる。
[Step S85] The classification unit 178 substitutes the variable Z for the number of patent documents classified in the additional candidate category.
[Step S86] The hypothesis determination unit 179 determines whether or not the number of cases set in the variable Z is equal to or greater than a threshold value. If the number is equal to or greater than a preset threshold, the process proceeds to step S87. If the number is less than the threshold, the process proceeds to step S88.

なお、閾値は、特許文献DB21に登録されている特許文献の数に応じて、変更するようにしてもよい。例えば、仮説判定部179において、分類対象として登録されている特許文献の総数に対する適合率の閾値を予め定義しておく。そして、仮説判定部174では、追加候補カテゴリに分類された件数が、特許文献の総数に閾値を乗算した値以上であれば、追加候補カテゴリに分類された件数が閾値以上であると判定する。   The threshold may be changed according to the number of patent documents registered in the patent document DB 21. For example, the hypothesis determination unit 179 predefines a threshold value of the relevance ratio with respect to the total number of patent documents registered as classification targets. The hypothesis determination unit 174 determines that the number of cases classified into the additional candidate category is equal to or greater than the threshold if the number of cases classified into the additional candidate category is equal to or greater than the value obtained by multiplying the total number of patent documents by the threshold.

[ステップS87]仮説判定部179は、追加候補カテゴリに分類された件数が閾値以上であれば、選択した仮説の検証結果欄に、仮説が適切であることを示す記号「○」を設定する。その後、処理がステップS89に進められる。   [Step S87] If the number of cases classified into the additional candidate category is equal to or greater than the threshold, the hypothesis determination unit 179 sets a symbol “◯” indicating that the hypothesis is appropriate in the verification result column of the selected hypothesis. Thereafter, the process proceeds to step S89.

[ステップS88]仮説判定部179は、追加候補カテゴリに分類された件数が閾値未満であれば、選択した仮説の検証結果欄に、仮説が不適切であることを示す記号「×」を設定する。   [Step S88] If the number of cases classified into the additional candidate category is less than the threshold, the hypothesis determination unit 179 sets a symbol “x” indicating that the hypothesis is inappropriate in the verification result column of the selected hypothesis. .

[ステップS89]共通キーワード抽出部175は、すべての仮説を検証したか否かを判断する。すべての仮説の検証が終了した場合、処理がステップS90に進められる。未処理の仮説があれば、処理がステップS81に進められ次の仮説が選択される。   [Step S89] The common keyword extraction unit 175 determines whether or not all hypotheses have been verified. If all hypotheses have been verified, the process proceeds to step S90. If there is an unprocessed hypothesis, the process proceeds to step S81 and the next hypothesis is selected.

[ステップS90]仮説判定部179は、仮説テーブル161の検証結果欄が「○」になった仮説から改正対象分野、観点、仮説を抜き出し、改正案テーブルを生成する。生成された改正案テーブルは、改正案記憶部180に格納される。   [Step S90] The hypothesis determination unit 179 extracts the revision target field, viewpoint, and hypothesis from the hypothesis in which the verification result column of the hypothesis table 161 is “◯”, and generates a revision plan table. The generated revision plan table is stored in the revision plan storage unit 180.

このようにして、機械学習を用いて、追加候補カテゴリに属する特許文献の数を予測することができる。機械学習を用いれば特許文献の分類を高度なレベルで適切に行うことが可能であり、仮説で設定された追加候補カテゴリの追加の適否判断もより適切に行うことができる。   In this way, the number of patent documents belonging to the additional candidate category can be predicted using machine learning. If machine learning is used, it is possible to appropriately classify patent documents at a high level, and it is also possible to more appropriately determine whether or not to add an additional candidate category set by a hypothesis.

[その他の応用例]
特徴キーワードの抽出技術について、以下のような変形が可能である。
特徴キーワードを、基準分野において非追加候補カテゴリと追加候補カテゴリとを区別するためのキーワードに限定する。そのために、特徴キーワード抽出部171では、非追加候補カテゴリに属する特許文献から抽出されたキーワードと、追加候補カテゴリに属する特許文献から抽出されたキーワードの差分のキーワードを、特徴キーワードとする。
[Other application examples]
The feature keyword extraction technique can be modified as follows.
The feature keyword is limited to a keyword for distinguishing the non-addition candidate category and the addition candidate category in the reference field. Therefore, in the feature keyword extraction unit 171, a difference keyword between a keyword extracted from a patent document belonging to a non-addition candidate category and a keyword extracted from a patent document belonging to an addition candidate category is used as a feature keyword.

基準分野と改正対象分野とでのそれぞれの分野に固有なキーワードによって誤った結果が出るのを防ぐ。そのために、特徴キーワード抽出部171では、得られた特徴キーワードのうち、分野A全体での出現キーワードと分野B全体での出現キーワードとのうちのどちらか一方だけで重みが大きくなるキーワードは、追加候補カテゴリの特徴キーワードとしないものとする。   Prevent erroneous results from keywords that are unique to each of the standard and revised areas. For this purpose, the feature keyword extraction unit 171 adds a keyword whose weight is increased only in one of the appearance keyword in the entire field A and the appearance keyword in the entire field B among the obtained feature keywords. Suppose that it is not a feature keyword of a candidate category.

分類の観点を反映するキーワードをより強調する。そのために特徴キーワード抽出部171では、得られた特徴キーワードのうち、改正対象分野の下での定義済みのカテゴリにはほとんど出現せず、改正対象分野の下の「その他」を表すカテゴリの中で一定以上ヒットした場合にのみ、特徴キーワードとして使用する。   Emphasize keywords that reflect the perspective of classification. Therefore, in the feature keyword extraction unit 171, the obtained feature keywords hardly appear in the defined categories under the amendment target field, and among the categories representing “others” under the amendment target field. It is used as a feature keyword only when it hits more than a certain amount.

上記実施の形態では、既に整合性が高い分野が優先的に整合性検討分野対となる。そこで、優先的に検討した改正案の改正案テーブルの上位に配置し、上位の改正案から順にユーザに提示することができる。これにより、ユーザは、優先的に改正を行うべき分類体系の箇所を知ることができる。   In the above-described embodiment, a field with high consistency is preferentially paired with a consistency examination field. Therefore, it is possible to place the revision plan on the revision plan that has been preferentially studied and present it to the user in order from the higher revision plan. Thereby, the user can know the location of the classification system which should be revised preferentially.

また、仮説を検証する際には、改正により新しいカテゴリが設定されたときにそのカテゴリに入ると予想される特許文献の件数を求めている。そこで、改正案テーブルをユーザに提示する際に、新たなカテゴリに含まれる件数を付加することができる。これにより、カテゴリの追加の要否をユーザが適切に判断できる。   Further, when the hypothesis is verified, the number of patent documents that are expected to be included in a new category when the revision is set is obtained. Therefore, when the revision plan table is presented to the user, the number of cases included in the new category can be added. Thereby, the user can appropriately determine whether or not a category needs to be added.

さらに、改正案で示されたカテゴリの追加の実行指示がユーザによって入力されたとき、特許文献DB21内の追加されるカテゴリに属する特許文献に、自動的に、新規のカテゴリの分類コードを付けることもできる。   In addition, when a user inputs an instruction to add a category indicated in the amendment, a new category classification code is automatically added to a patent document belonging to the added category in the patent document DB 21. You can also.

また、上記実施の形態では、特許文献の分類体系の改善に関して説明したが、観点によって情報を分類する各種分類体系に応用可能である。
図32は、調理のレシピに関する情報の分類体系の例を示す図である。図32に示す料理のレシピの分類体系は、「野菜のおかず」、「サラダ」、「パン」、「お菓子」といった料理種別によって分野が定義されている。そして、各分野において「材料」、「調理法」、「カロリー」といった観点でカテゴリが定義されている。図32に示した観点以外にも、「材料費」といった観点でカテゴリを定義することもできる。
Moreover, although the said embodiment demonstrated the improvement of the classification system of a patent document, it is applicable to the various classification systems which classify | categorize information according to a viewpoint.
FIG. 32 is a diagram illustrating an example of a classification system of information related to cooking recipes. In the cooking recipe classification system shown in FIG. 32, fields are defined according to cooking types such as “vegetable side dishes”, “salad”, “bread”, and “sweets”. In each field, categories are defined in terms of “material”, “cooking method”, and “calorie”. In addition to the viewpoint shown in FIG. 32, categories can also be defined from the viewpoint of “material cost”.

ここで、上記第1,第2の実施の形態に係る分類体系改正支援装置を用いれば、例えば、「お菓子」を基準分野とし、「野菜おかず」における観点「料理法」のカテゴリとして「なべ」を追加する仮説の設定および検証ができる。   Here, if the classification system revision support apparatus according to the first and second embodiments is used, for example, “confectionery” is set as the reference field, and “vegetables” as the category of “cooking” is “pan”. Can be set and verified.

図33は、ネットワークを介したオークションに関する出品情報の分類体系を示す図である。図33に示すオークションの出品情報の分類体系は、「エアコン」、「服」、「バッグ」、「パーソナルコンピュータ」といった商品種別によって分野が定義されている。そして、各分野において「メーカ」、「価格帯」、「CPU」といった観点でカテゴリが定義されている。図33に示した観点以外にも、「仕様」、「オークション終了までの日数」といった観点でカテゴリを定義することができる。   FIG. 33 is a diagram illustrating a classification system of exhibition information related to auctions via a network. In the auction exhibition information classification system shown in FIG. 33, fields are defined by product types such as “air conditioner”, “clothes”, “bag”, and “personal computer”. In each field, categories are defined in terms of “manufacturer”, “price range”, and “CPU”. In addition to the viewpoints shown in FIG. 33, categories can be defined from the viewpoints of “specifications” and “days until the end of the auction”.

ここで、上記第1,第2の実施の形態に係る分類体系改正支援装置を用いれば、例えば、「パソコン」を基準分野とし、「エアコン」における観点「メーカ」のカテゴリとして「N電」を追加する仮説の設定および検証ができる。   Here, if the classification system revision support device according to the first and second embodiments is used, for example, “PC” is set as a reference field, and “N Denki” is set as a category of “manufacturer” in “air conditioner”. You can set and verify additional hypotheses.

図32、図33に示した以外にも、例えばレストランに関する情報の分類体系や音楽に関する情報の分類体系に、上記実施の形態を適用可能である。レストランに関する情報の分類体系であれば、和食、中華、イタリアンといったジャンルで分野を分け、各分野において、地域、や価格帯といった観点のカテゴリを定義できる。そして、これらのカテゴリを上記実施の形態の機能により改善できる。音楽に関する情報の分類体系であれば、ポップス、クラシック、ジャズといった分野を、国、価格帯、歌手の性別、グループ構成とった観点でカテゴリを定義できる。そして、これらのカテゴリを上記実施の形態の機能により改善できる。   In addition to those shown in FIGS. 32 and 33, the above-described embodiment can be applied to, for example, a restaurant information classification system and music information classification system. If it is a classification system of information about restaurants, it is possible to divide fields by genres such as Japanese, Chinese and Italian, and to define categories in terms of areas and price ranges in each field. And these categories can be improved by the function of the said embodiment. If it is a classification system of information about music, categories such as pops, classical music and jazz can be defined from the viewpoint of country, price range, singer's gender and group composition. And these categories can be improved by the function of the said embodiment.

なお、上記の処理機能は、コンピュータによって実現することができる。その場合、分類体系改正支援装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM/RWなどがある。光磁気記録媒体には、MO(Magneto-Optical disc)などがある。   The above processing functions can be realized by a computer. In that case, a program describing the processing contents of the functions that the classification system revision support device should have is provided. By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic storage device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic storage device include a hard disk device (HDD), a flexible disk (FD), and a magnetic tape. Optical discs include DVD, DVD-RAM, CD-ROM / RW, and the like. Magneto-optical recording media include MO (Magneto-Optical disc).

プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。   When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。   The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. Further, each time the program is transferred from the server computer, the computer can sequentially execute processing according to the received program.

また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PDL(Programmable Logic Device)などの電子回路で実現することもできる。   In addition, at least a part of the above processing functions can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PDL (Programmable Logic Device).

以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。   As mentioned above, although embodiment was illustrated, the structure of each part shown by embodiment can be substituted by the other thing which has the same function. Moreover, other arbitrary structures and processes may be added. Further, any two or more configurations (features) of the above-described embodiments may be combined.

以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
(付記1) コンピュータに、
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
処理を実行させることを特徴とする分類体系改正支援プログラム。
The main technical features of the embodiment described above are as follows.
(Supplementary note 1)
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support program characterized by having processing executed.

(付記2) 共通の観点でカテゴリが設けられている少なくとも2つの分野の組み合わせを複数抽出した場合、各分野の前記共通の観点で設けられているカテゴリのうち、定義が一致するカテゴリの数が多い組み合わせほど、仮説設定処理の優先度を高くすることを特徴とする付記1記載の分類体系改正支援プログラム。   (Supplementary Note 2) When a plurality of combinations of at least two fields in which categories are provided from a common viewpoint are extracted, the number of categories whose definitions match among the categories provided from the common viewpoints in each field The classification system revision support program according to appendix 1, wherein the higher the number of combinations, the higher the priority of hypothesis setting processing.

(付記3) 前記追加カテゴリ適合情報を検出する際には、前記コンピュータに、
抽出された分野のうち、前記共通の観点によるカテゴリとして前記追加対象カテゴリを既に有している分野を基準分野とすると共に、前記共通の観点によるカテゴリとして前記追加対象カテゴリを有していない分野を改正対象分野とし、前記データベース内の前記基準分野に属する情報を解析して前記追加対象カテゴリに属する情報の特徴を示す追加対象カテゴリ特徴情報を抽出し、前記データベース内の前記改正対象分野に属する各情報が前記追加対象カテゴリ特徴情報を有するか否かにより、前記改正対象分野に属する各情報が前記追加カテゴリ適合情報に該当するか否かを判定する、
処理を実行させることを特徴とする付記1記載の分類体系改正支援プログラム。
(Supplementary Note 3) When detecting the additional category conformance information,
Among the extracted fields, a field that already has the additional target category as a category according to the common viewpoint is set as a reference field, and a field that does not have the additional target category as a category according to the common viewpoint As the revision target field, the information belonging to the reference field in the database is analyzed to extract the additional target category feature information indicating the characteristics of the information belonging to the additional target category, and each of the revision target fields in the database It is determined whether each piece of information belonging to the revision target field corresponds to the additional category conforming information depending on whether the information includes the additional target category feature information.
The classification system revision support program according to appendix 1, wherein the program is executed.

(付記4) 前記追加対象カテゴリ特徴情報を抽出する際には、前記コンピュータに、
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報から得られるキーワードと、前記追加対象カテゴリに属さない情報から得られるキーワードとを比較して、前記追加対象カテゴリに属する情報の特徴を示す特徴キーワードを判定し、前記特徴キーワードを前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする付記3記載の分類体系改正支援プログラム。
(Supplementary Note 4) When extracting the additional target category feature information,
Information that belongs to the additional target category by comparing a keyword obtained from information belonging to the additional target category among information belonging to the reference field in the database and a keyword obtained from information not belonging to the additional target category A feature keyword indicating a feature of the feature, and the feature keyword as the addition target category feature information,
The classification system revision support program according to appendix 3, wherein the processing is executed.

(付記5) 前記追加対象カテゴリ特徴情報を抽出する際には、前記コンピュータに、
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報を正例、前記追加対象カテゴリに属さない情報を負例とした機械学習を行い、機械学習の結果得られる分類器を前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする付記3記載の分類体系改正支援プログラム。
(Supplementary Note 5) When extracting the additional target category feature information,
A classifier obtained by performing machine learning using information belonging to the additional target category as a positive example and information not belonging to the additional target category as negative examples among information belonging to the reference field in the database, and obtained as a result of machine learning The additional target category feature information
The classification system revision support program according to appendix 3, wherein the processing is executed.

(付記6) 前記仮説を定義する場合、抽出された各分野の共通する観点で作成されたカテゴリを定義する文字列を解析して各カテゴリの特徴を示すキーワードを抽出し、一部の分野のカテゴリを定義する文字列から抽出されたキーワードが、他の分野のいずれのカテゴリからも抽出されていない場合、該当キーワードの抽出元となるカテゴリを、追加対象カテゴリとすることを特徴とする付記1記載の分対体系改正支援プログラム。   (Additional remark 6) When defining the said hypothesis, the character string which defines the category created from the common viewpoint of each extracted field is analyzed, the keyword which shows the characteristic of each category is extracted, Appendix 1 characterized in that if a keyword extracted from a character string defining a category is not extracted from any category in another field, the category from which the keyword is extracted is set as an addition target category. The support system revision support program described.

(付記7) 複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出する観点共通分野検索手段と、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する仮説定義手段と、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、適切と判定された前記仮説を改正案として出力する仮説検証手段と、
を有することを特徴とする分類体系改正支援装置。
(Supplementary note 7) Refer to a classification system information storage unit that stores classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided, A viewpoint common field search means for extracting at least two fields having categories in a common viewpoint;
Compare the categories provided from the common viewpoint of each extracted field, and select categories that exist only in some of the extracted fields as additional target categories, and set the additional target categories as other fields. A hypothesis definition means for defining a hypothesis to be added to
Referring to a database in which information to be classified by the classification system is stored, when the additional target category is added according to the hypothesis, additional category conforming information belonging to the additional target category is detected and detected Hypothesis verification means for determining the suitability of the hypothesis based on the amount of the additional category conforming information that has been determined, and outputting the hypothesis determined to be appropriate as a revision plan;
A classification system revision support device characterized by comprising:

(付記8) コンピュータが、
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
ことを特徴とする分類体系改正支援方法。
(Appendix 8) The computer
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support method characterized by this.

1 分類体系情報記憶手段
2 観点共通分野検索手段
3,4 分野
5 仮説定義手段
6 データベース
7 仮説検証手段
8 改正案
1 Classification system information storage means 2 Perspective common field search means 3, 4 fields 5 Hypothesis definition means 6 Database 7 Hypothesis verification means 8 Revision proposal

Claims (7)

コンピュータに、
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
処理を実行させることを特徴とする分類体系改正支援プログラム。
On the computer,
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support program characterized by having processing executed.
共通の観点でカテゴリが設けられている少なくとも2つの分野の組み合わせを複数抽出した場合、各分野の前記共通の観点で設けられているカテゴリのうち、定義が一致するカテゴリの数が多い組み合わせほど、仮説設定処理の優先度を高くすることを特徴とする請求項1記載の分類体系改正支援プログラム。   When a plurality of combinations of at least two fields in which categories are provided from a common viewpoint are extracted, a combination having a larger number of categories having the same definition among the categories provided from the common viewpoints of each field, 2. The classification system revision support program according to claim 1, wherein the priority of hypothesis setting processing is increased. 前記追加カテゴリ適合情報を検出する際には、前記コンピュータに、
抽出された分野のうち、前記共通の観点によるカテゴリとして前記追加対象カテゴリを既に有している分野を基準分野とすると共に、前記共通の観点によるカテゴリとして前記追加対象カテゴリを有していない分野を改正対象分野とし、前記データベース内の前記基準分野に属する情報を解析して前記追加対象カテゴリに属する情報の特徴を示す追加対象カテゴリ特徴情報を抽出し、前記データベース内の前記改正対象分野に属する各情報が前記追加対象カテゴリ特徴情報を有するか否かにより、前記改正対象分野に属する各情報が前記追加カテゴリ適合情報に該当するか否かを判定する、
処理を実行させることを特徴とする請求項1記載の分類体系改正支援プログラム。
When detecting the additional category conformity information,
Among the extracted fields, a field that already has the additional target category as a category according to the common viewpoint is set as a reference field, and a field that does not have the additional target category as a category according to the common viewpoint As the revision target field, the information belonging to the reference field in the database is analyzed to extract the additional target category feature information indicating the characteristics of the information belonging to the additional target category, and each of the revision target fields in the database It is determined whether each piece of information belonging to the revision target field corresponds to the additional category conforming information depending on whether the information includes the additional target category feature information.
The classification system revision support program according to claim 1, wherein the program is executed.
前記追加対象カテゴリ特徴情報を抽出する際には、前記コンピュータに、
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報から得られるキーワードと、前記追加対象カテゴリに属さない情報から得られるキーワードとを比較して、前記追加対象カテゴリに属する情報の特徴を示す特徴キーワードを判定し、前記特徴キーワードを前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする請求項3記載の分類体系改正支援プログラム。
When extracting the additional target category feature information, the computer,
Information that belongs to the additional target category by comparing a keyword obtained from information belonging to the additional target category among information belonging to the reference field in the database and a keyword obtained from information not belonging to the additional target category A feature keyword indicating a feature of the feature, and the feature keyword as the addition target category feature information,
4. The classification system revision support program according to claim 3, wherein the program is executed.
前記追加対象カテゴリ特徴情報を抽出する際には、前記コンピュータに、
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報を正例、前記追加対象カテゴリに属さない情報を負例とした機械学習を行い、機械学習の結果得られる分類器を前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする請求項3記載の分類体系改正支援プログラム。
When extracting the additional target category feature information, the computer,
A classifier obtained by performing machine learning using information belonging to the additional target category as a positive example and information not belonging to the additional target category as negative examples among information belonging to the reference field in the database, and obtained as a result of machine learning The additional target category feature information
4. The classification system revision support program according to claim 3, wherein the program is executed.
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出する観点共通分野検索手段と、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する仮説定義手段と、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、適切と判定された前記仮説を改正案として出力する仮説検証手段と、
を有することを特徴とする分類体系改正支援装置。
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. A viewpoint common field search means for extracting at least two fields in which categories are provided;
Compare the categories provided from the common viewpoint of each extracted field, and select categories that exist only in some of the extracted fields as additional target categories, and set the additional target categories as other fields. A hypothesis definition means for defining a hypothesis to be added to
Referring to a database in which information to be classified by the classification system is stored, when the additional target category is added according to the hypothesis, additional category conforming information belonging to the additional target category is detected and detected Hypothesis verification means for determining the suitability of the hypothesis based on the amount of the additional category conforming information that has been determined, and outputting the hypothesis determined to be appropriate as a revision plan;
A classification system revision support device characterized by comprising:
コンピュータが、
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
ことを特徴とする分類体系改正支援方法。
Computer
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support method characterized by this.
JP2009086389A 2009-03-31 2009-03-31 Classification system revision support program, classification system revision support device, and classification system revision support method Expired - Fee Related JP5310196B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009086389A JP5310196B2 (en) 2009-03-31 2009-03-31 Classification system revision support program, classification system revision support device, and classification system revision support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009086389A JP5310196B2 (en) 2009-03-31 2009-03-31 Classification system revision support program, classification system revision support device, and classification system revision support method

Publications (2)

Publication Number Publication Date
JP2010238041A JP2010238041A (en) 2010-10-21
JP5310196B2 true JP5310196B2 (en) 2013-10-09

Family

ID=43092288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009086389A Expired - Fee Related JP5310196B2 (en) 2009-03-31 2009-03-31 Classification system revision support program, classification system revision support device, and classification system revision support method

Country Status (1)

Country Link
JP (1) JP5310196B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5310328B2 (en) * 2009-07-08 2013-10-09 富士通株式会社 Classification system revision support program, classification system revision support device, and classification system revision support method
US9477777B2 (en) * 2013-03-15 2016-10-25 Rakuten, Inc. Method for analyzing and categorizing semi-structured data
JP7092836B2 (en) * 2020-09-15 2022-06-28 楽天グループ株式会社 Proposal device for revision of patent classification, proposal method for revision of patent classification, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4796865B2 (en) * 2006-02-28 2011-10-19 株式会社日本総合研究所 Classification correspondence method, classification correspondence system, and classification correspondence program

Also Published As

Publication number Publication date
JP2010238041A (en) 2010-10-21

Similar Documents

Publication Publication Date Title
US9418144B2 (en) Similar document detection and electronic discovery
US9201931B2 (en) Method for obtaining search suggestions from fuzzy score matching and population frequencies
US7562088B2 (en) Structure extraction from unstructured documents
US7769771B2 (en) Searching a document using relevance feedback
KR101231560B1 (en) Method and system for discovery and modification of data clusters and synonyms
JP5391634B2 (en) Selecting tags for a document through paragraph analysis
US20120203584A1 (en) System and method for identifying potential customers
US8019761B2 (en) Recording medium storing a design support program, design support method, and design support apparatus
US9104968B2 (en) Identifying categorized misplacement
US20110264651A1 (en) Large scale entity-specific resource classification
Gao et al. Emerging app issue identification from user feedback: Experience on wechat
US20130110839A1 (en) Constructing an analysis of a document
US20080162455A1 (en) Determination of document similarity
US20130060769A1 (en) System and method for identifying social media interactions
US20090094021A1 (en) Determining A Document Specificity
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
JP5391632B2 (en) Determining word and document depth
JP2009093651A (en) Modeling topics using statistical distribution
US20120117043A1 (en) Measuring Duplication in Search Results
CN108681564A (en) The determination method, apparatus and computer readable storage medium of keyword and answer
JP5310196B2 (en) Classification system revision support program, classification system revision support device, and classification system revision support method
US20210271637A1 (en) Creating descriptors for business analytics applications
JP5310328B2 (en) Classification system revision support program, classification system revision support device, and classification system revision support method
JP2020071678A (en) Information processing device, control method, and program
JP2012003333A (en) Similar document retrieval device, similar document retrieval method, its program and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130617

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees