JP2017078976A - Product retrieval device - Google Patents

Product retrieval device Download PDF

Info

Publication number
JP2017078976A
JP2017078976A JP2015206971A JP2015206971A JP2017078976A JP 2017078976 A JP2017078976 A JP 2017078976A JP 2015206971 A JP2015206971 A JP 2015206971A JP 2015206971 A JP2015206971 A JP 2015206971A JP 2017078976 A JP2017078976 A JP 2017078976A
Authority
JP
Japan
Prior art keywords
keyword
product
occurrence
document data
extraction unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015206971A
Other languages
Japanese (ja)
Inventor
河合 詔之
Noriyuki Kawai
詔之 河合
大介 原田
Daisuke Harada
大介 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daikin Industries Ltd
Original Assignee
Daikin Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daikin Industries Ltd filed Critical Daikin Industries Ltd
Priority to JP2015206971A priority Critical patent/JP2017078976A/en
Publication of JP2017078976A publication Critical patent/JP2017078976A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a product retrieval device capable of achieving visualization of quality information for each product and supporting its quality improvement.SOLUTION: In a product retrieval device 10, a user can view a relation between one keyword dependency pattern and another keyword dependency pattern in a co-occurrence information table for each product, and thus, can know what other kind of information (the co-occurrence information) should be searched for the keyword dependency pattern. At this time, a relation degree between the keyword dependency patterns can be grasped by a number representing their simultaneous generation ratio.SELECTED DRAWING: Figure 7A

Description

本発明は、製品検索装置に関し、特に文書データから製品流通市場におけるトラブル等の製品関連情報を適切な利用に資する製品検索装置に関する。   The present invention relates to a product search apparatus, and more particularly to a product search apparatus that contributes to appropriate use of product-related information such as troubles in the product distribution market from document data.

近年、文書データから人物とキーワードとを抽出し、それらを結びつけた情報を利用するためのツールが広く普及している。例えば、特許文献1(特開2002−56001号公報)に開示されている精通者抽出装置は、文書から専門用語を切り出し、人物ごとに予めその専門用語の属する分野についての精通度を記憶したデータ・ベースから適切な人物を抽出するものである。   In recent years, tools for extracting a person and a keyword from document data and using information obtained by linking them are widely used. For example, a savvy person extraction device disclosed in Patent Document 1 (Japanese Patent Application Laid-Open No. 2002-56001) is a data in which a technical term is cut out from a document, and a degree of familiarity about a field to which the technical term belongs is stored in advance for each person. -Extracting an appropriate person from the base.

しかしながら、特許文献1では、専門用語と人物とを結びつけることによって精通者を特定する方法は開示されているものの、文書データから製品とキーワードとを抽出し、それらを結びつけた情報を利用するためのツールが示されておらず、製品が流通する市場で、製品にどのようなトラブルが起き、そのトラブルが何に起因しているのか等、トラブルに関する情報を適切に利用することができていない。   However, although Patent Document 1 discloses a method for identifying a savvy person by associating a technical term with a person, it is necessary to extract a product and a keyword from document data and use information associated with them. Tools are not shown, and it is not possible to properly use information about troubles such as what kind of troubles occur in products in the market where the products are distributed and what causes the troubles.

本発明の課題は、製品ごとの品質情報の「見える化」を図り、品質改善を支援することができる製品検索装置を提供することにある。   An object of the present invention is to provide a product search apparatus capable of “visualizing” quality information for each product and supporting quality improvement.

本発明の第1観点に係る製品検索装置は、キーワード抽出部と、製品情報抽出部と、製品キーワード抽出部と、共起情報抽出部とを備えている。キーワード抽出部は、メールを含む蓄積された多数の文書データから文書データ毎にキーワードを抽出する。製品情報抽出部は、文書データから文書データ毎に製品の特定情報を抽出する。製品キーワード抽出部は、文書データ毎に製品とキーワードとの関連付け情報を作成して抽出する。共起情報抽出部は、文書データ毎に製品に関連付けられているキーワードに対し共起キーワードを付与して製品別の共起情報を作成して抽出する。   A product search device according to a first aspect of the present invention includes a keyword extraction unit, a product information extraction unit, a product keyword extraction unit, and a co-occurrence information extraction unit. The keyword extracting unit extracts a keyword for each document data from a large number of accumulated document data including mail. The product information extraction unit extracts product specific information for each document data from the document data. The product keyword extracting unit creates and extracts association information between products and keywords for each document data. The co-occurrence information extracting unit creates and extracts co-occurrence information for each product by assigning a co-occurrence keyword to a keyword associated with the product for each document data.

この製品検索装置では、例えば、検索者が「製品名」と「不具合の症状」とを入力することによって、関連するキーワード、それに対する共起キーワードが提供されるので、不具合要因の特定を支援することができる。   In this product search device, for example, when a searcher inputs "product name" and "symptom of failure", a related keyword and a co-occurrence keyword for the keyword are provided. be able to.

本発明の第2観点に係る製品検索装置は、第1観点に係る製品検索装置であって、キーワード・係り受けパターン抽出部をさらに備えている。キーワード・係り受けパターン抽出部は、抽出したキーワードに基づくキーワード・係り受けパターンを作成して抽出する。   A product search apparatus according to a second aspect of the present invention is the product search apparatus according to the first aspect, further comprising a keyword / dependency pattern extraction unit. The keyword / dependency pattern extraction unit creates and extracts a keyword / dependency pattern based on the extracted keyword.

キーワード、共起キーワードが提供されてもその数が非常に多い場合には不具合要因を特定することは容易ではないが、この製品検索装置では、キーワード・係り受けパターンが提供されることによって、不具合要因の特定を容易にすることができる。   Even if keywords and co-occurrence keywords are provided, it is not easy to identify the cause of the problem when the number is very large. However, this product search device provides a problem by providing a keyword / dependency pattern. Factors can be easily identified.

本発明の第3観点に係る製品検索装置は、第1観点又は第2観点に係る製品検索装置であって、共起情報抽出部が、キーワードに対し少なくとも1つの共起キーワードを付与する。   The product search device according to the third aspect of the present invention is the product search device according to the first aspect or the second aspect, and the co-occurrence information extraction unit assigns at least one co-occurrence keyword to the keyword.

本発明の第4観点に係る製品検索装置は、第1観点から第3観点のいずれか1つに係る製品検索装置であって、共起情報抽出部が、共起情報内のキーワード群をマトリックス状に表す共起情報テーブルを作成する。   A product search device according to a fourth aspect of the present invention is the product search device according to any one of the first to third aspects, wherein the co-occurrence information extraction unit matrixes the keyword group in the co-occurrence information. Create a co-occurrence information table.

この製品検索装置では、共起情報内の一のキーワードと他のキーワードとの「結びつき」を一覧することができる。   In this product search apparatus, it is possible to list “ties” between one keyword in the co-occurrence information and another keyword.

本発明の第5観点に係る製品検索装置は、第4観点に係る製品検索装置であって、共起情報テーブルは、行と列との交点に、行に割り当てられたキーワードと列に割り当てられたキーワードとが同時発生する割合を表示する。   A product search device according to a fifth aspect of the present invention is the product search device according to the fourth aspect, wherein the co-occurrence information table is assigned to a keyword and a column assigned to a row at an intersection of the row and the column. Displays the rate of simultaneous occurrence of keywords.

この製品検索装置では、キーワード間の「結びつき度合い(共起度合い)」をそれらが「同時発生する割合(同時発生割合)」という数字で把握することができる(つまり、「結びつき度合い」という特性値の代用特性値が「同時発生割合」である)。   In this product search device, the “association degree (co-occurrence degree)” between keywords can be grasped by the number “the ratio of simultaneous occurrence (simultaneous occurrence ratio)” (that is, the characteristic value of “the degree of association”) The substitute characteristic value of “is the simultaneous occurrence rate”).

本発明の第6観点に係る製品検索装置は、第4観点又は第5観点に係る製品検索装置であって、共起情報抽出部が、共起情報内の一のキーワードと他のキーワードとが同時発生する割合を演算し、同時発生する割合が所定値以上である共起情報を共起情報テーブルに蓄積する。   A product search device according to a sixth aspect of the present invention is the product search device according to the fourth or fifth aspect, wherein the co-occurrence information extraction unit determines whether one keyword and another keyword in the co-occurrence information are present. The ratio of simultaneous occurrence is calculated, and the co-occurrence information with the ratio of simultaneous occurrence equal to or greater than a predetermined value is stored in the co-occurrence information table.

この製品検索装置では、各キーワードを蓄積させるか否かの判断が、他の共起キーワードとの同時発生割合の大きさに基づいて行われることにより、陳腐化した情報の排除、記憶容量の増大化抑制を図ることができる。   In this product search device, whether or not to accumulate each keyword is determined based on the size of the concurrent occurrence with other co-occurrence keywords, thereby eliminating obsolete information and increasing storage capacity. Can be suppressed.

本発明の第7観点に係る製品検索装置は、第1観点から第5観点のいずれか1つに係る製品検索装置であって、共起情報抽出部が、共起情報内の一のキーワードと他のキーワードとが同時発生する割合を演算し、同時発生する割合が所定値以上である前記共起情報を表示する。   A product search device according to a seventh aspect of the present invention is the product search device according to any one of the first to fifth aspects, wherein the co-occurrence information extraction unit includes a keyword in the co-occurrence information, The ratio of the simultaneous occurrence with other keywords is calculated, and the co-occurrence information with the simultaneous occurrence ratio being a predetermined value or more is displayed.

この製品検索装置では、同時発生しているが発生頻度があまりにも低く共起とは言えないようなキーワードの表示を控えることによって、絞り込みを容易にする。   In this product search device, narrowing down is facilitated by refraining from displaying keywords that occur at the same time but are not so frequently occurring.

本発明の第8観点に係る製品検索装置は、第1観点から第6観点のいずれか1つに係る製品検索装置であって、キーワード抽出部が、文書データごとに抽出すべきキーワードの数量を決定する。   A product search device according to an eighth aspect of the present invention is the product search device according to any one of the first to sixth aspects, wherein the keyword extraction unit determines the number of keywords to be extracted for each document data. decide.

この製品検索装置では、全てがキーワードになることを防止することができる。また、文書データの大きさ応じて抽出すべきキーワード数量を決定するようにすれば、文書データの大きさに比例したキーワード数を確保することもできる。   In this product search apparatus, it is possible to prevent everything from becoming keywords. Further, if the number of keywords to be extracted is determined according to the size of the document data, the number of keywords proportional to the size of the document data can be secured.

本発明の第9観点に係る製品検索装置は、請求項2から請求項6のいずれか1つに係る製品検索装置であって、キーワード・係り受けパターン抽出部が、文書データごとに抽出すべきキーワード・係り受けパターンの数量を決定する。   A product search device according to a ninth aspect of the present invention is the product search device according to any one of claims 2 to 6, wherein the keyword / dependency pattern extraction unit should extract each document data Determine the quantity of keywords and dependency patterns.

この製品検索装置では、文書データの大きさ応じて抽出すべきキーワード・係り受けパターンの数量を決定するようにすれば、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することもできる。   In this product search device, if the number of keywords and dependency patterns to be extracted is determined according to the size of the document data, the number of keywords and dependency patterns that are proportional to the size of the document data is secured. You can also.

本発明の第10観点に係る製品検索装置は、第1観点から第6観点のいずれか1つに係る製品検索装置であって、キーワード抽出部が、一の文書データから抽出されるキーワードの数量の上限を文書データの大きさに応じて決定する。   A product search device according to a tenth aspect of the present invention is the product search device according to any one of the first to sixth aspects, wherein the keyword extraction unit extracts the number of keywords extracted from one document data. Is determined according to the size of the document data.

この製品検索装置では、文書データの大きさに比例したキーワード数を確保することができる。   In this product search apparatus, the number of keywords proportional to the size of document data can be secured.

本発明の第11観点に係る製品検索装置は、第2観点から第6観点のいずれか1つに係る製品検索装置であって、キーワード・係り受けパターン抽出部が、一の文書データから抽出されるキーワード・係り受けパターンの数量の上限を文書データの大きさに応じて決定する。   A product search device according to an eleventh aspect of the present invention is the product search device according to any one of the second to sixth aspects, wherein the keyword / dependency pattern extraction unit is extracted from one document data. The upper limit of the number of keywords and dependency patterns to be determined is determined according to the size of the document data.

この製品検索装置では、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することができる。   In this product retrieval apparatus, the number of keywords and dependency patterns proportional to the size of document data can be secured.

本発明の第12観点に係る製品検索装置は、第1観点から第11観点のいずれか1つに係る製品検索装置であって、体系化情報抽出部をさらに備えている。体系化情報抽出部は、共起情報抽出部が作成した製品別の共起情報からキーワード又はキーワード・係り受けパターンの体系化を行い抽出する。   A product search device according to a twelfth aspect of the present invention is the product search device according to any one of the first to eleventh aspects, further comprising a systematic information extraction unit. The systematized information extraction unit systematizes and extracts keywords or keywords / dependency patterns from the co-occurrence information for each product created by the co-occurrence information extraction unit.

本発明の第13観点に係る製品検索装置は、第1観点から第12観点のいずれか1つに係る製品検索装置であって、ワードマップ作成部をさらに備えている。ワードマップ作成部は、製品に関連付けられているキーワードからホットキーワードのマップを作成して抽出する。   A product search device according to a thirteenth aspect of the present invention is the product search device according to any one of the first to twelfth aspects, further comprising a word map creation unit. The word map creation unit creates and extracts a hot keyword map from keywords associated with a product.

本発明の第1観点又は第3観点に係る製品検索装置では、例えば、検索者が「製品名」と「不具合の症状」とを入力することによって、関連するキーワード、それに対する共起キーワードが提供されるので、不具合要因の特定を支援することができる。   In the product search device according to the first aspect or the third aspect of the present invention, for example, when the searcher inputs “product name” and “symptom of failure”, related keywords and co-occurrence keywords are provided. Therefore, it is possible to support the identification of the failure factor.

本発明の第2観点に係る製品検索装置では、係り受けパターンが提供されることによって、不具合要因の特定を容易にすることができる。   In the product search device according to the second aspect of the present invention, the dependency factor can be easily specified by providing the dependency pattern.

本発明の第4観点に係る製品検索装置では、共起情報内の一のキーワードと他のキーワードとの「結びつき」を一覧することができる。   In the product search device according to the fourth aspect of the present invention, it is possible to list “ties” between one keyword in the co-occurrence information and another keyword.

本発明の第5観点に係る製品検索装置では、キーワード間の「結びつき度合い(共起度合い)」をそれらが「同時発生する割合(同時発生割合)」という数字で把握することができる(つまり、「結びつき度合い」という特性値の代用特性値が「同時発生割合」である)。   In the product search device according to the fifth aspect of the present invention, it is possible to grasp the “degree of association (degree of co-occurrence)” between keywords by the number “the rate of simultaneous occurrence (co-occurrence rate)” (that is, The substitute characteristic value of the characteristic value of “degree of association” is the “simultaneous occurrence ratio”).

本発明の第6観点に係る製品検索装置では、各キーワードを蓄積させるか否かの判断が、他の共起キーワードとの同時発生割合の大きさに基づいて行われることにより、陳腐化した情報の排除、記憶容量の増大化抑制を図ることができる。   In the product search device according to the sixth aspect of the present invention, the determination as to whether or not to accumulate each keyword is made based on the size of the simultaneous occurrence ratio with other co-occurrence keywords, thereby making the information obsolete. And the increase in storage capacity can be suppressed.

本発明の第7観点に係る製品検索装置では、同時発生しているが発生頻度があまりにも低く共起とは言えないようなキーワードの表示を控えることによって、絞り込みを容易にする。   In the product search apparatus according to the seventh aspect of the present invention, narrowing down is facilitated by refraining from displaying keywords that occur at the same time but are not so frequently occurring.

本発明の第8観点に係る製品検索装置では、全てがキーワードになることを防止することができる。また、文書データの大きさ応じて抽出すべきキーワード数量を決定するようにすれば、文書データの大きさに比例したキーワード数を確保することもできる。   In the product search device according to the eighth aspect of the present invention, it is possible to prevent everything from becoming keywords. Further, if the number of keywords to be extracted is determined according to the size of the document data, the number of keywords proportional to the size of the document data can be secured.

本発明の第9観点に係る製品検索装置では、文書データの大きさ応じて抽出すべきキーワード・係り受けパターンの数量を決定するようにすれば、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することもできる。   In the product search device according to the ninth aspect of the present invention, if the number of keywords and dependency patterns to be extracted is determined according to the size of the document data, the keywords and dependency proportional to the size of the document data are determined. It is also possible to secure the number of patterns.

本発明の第10観点に係る製品検索装置では、文書データの大きさに比例したキーワード数を確保することができる。   In the product search device according to the tenth aspect of the present invention, the number of keywords proportional to the size of the document data can be ensured.

本発明の第11観点に係る製品検索装置では、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することができる。   In the product search device according to the eleventh aspect of the present invention, the number of keywords and dependency patterns proportional to the size of document data can be ensured.

本発明の第12観点に係る製品検索装置では、共起情報をシステム側でグループ化することによって、人手によるグループ化の工数を削減することができる。   In the product search device according to the twelfth aspect of the present invention, the co-occurrence information is grouped on the system side, thereby reducing the number of man-hours for grouping manually.

本発明の第13観点に係る製品検索装置では、期間を区切り、製品が持つホットキーワードを示すことができる。   In the product search apparatus according to the thirteenth aspect of the present invention, the hot keywords of the product can be shown by dividing the period.

本発明の一実施形態に係る製品検索装置の構成を示すブロック図。The block diagram which shows the structure of the product search apparatus which concerns on one Embodiment of this invention. 製品検索装置の第1の動作を表すフローチャート。The flowchart showing the 1st operation | movement of a product search apparatus. 製品キーワード抽出部が作成した製品ID「101」についての製品キーワードテーブル。A product keyword table for product ID “101” created by the product keyword extraction unit. 製品キーワード抽出部が作成した製品ID「201」についての製品キーワードテーブル。A product keyword table for product ID “201” created by the product keyword extraction unit. 製品キーワード抽出部が作成した製品ID「301」についての製品キーワードテーブル。The product keyword table about product ID "301" which the product keyword extraction part produced. 製品検索装置の第2の動作を表すフローチャート。The flowchart showing the 2nd operation | movement of a product search apparatus. 一つの文書データに係るキーワード・係り受けパターンテーブル。Keyword / dependency pattern table related to one document data. もう一つの文書データに係るキーワード・係り受けパターンテーブル。Another keyword / dependency pattern table for document data. 他の文書データに係るキーワード・係り受けパターンテーブル。Keyword / dependency pattern table related to other document data. 製品検索装置の第3の動作を表すフローチャート。The flowchart showing the 3rd operation | movement of a product search apparatus. 共起情報抽出部が作成したキーワード・係り受けパターンの共起情報テーブル。A keyword / dependency pattern co-occurrence information table created by the co-occurrence information extraction unit. 共起情報抽出部が作成したキーワード・係り受けパターンの共起情報テーブル。A keyword / dependency pattern co-occurrence information table created by the co-occurrence information extraction unit. 共起情報抽出部が作成したキーワードの共起情報テーブル。A keyword co-occurrence information table created by the co-occurrence information extraction unit. 共起情報抽出部が作成した他のキーワードの共起情報テーブル。A co-occurrence information table of other keywords created by the co-occurrence information extraction unit. 製品検索装置が検索端末の画面に表示するキーワード製品マップ。Keyword product map that the product search device displays on the screen of the search terminal. 本発明の変形例に係る製品検索装置の構成を示すブロック図The block diagram which shows the structure of the product search apparatus which concerns on the modification of this invention.

以下、図面を参照しながら、本発明の実施形態について説明する。なお、以下の実施形態は、本発明の具体例であって、本発明の技術的範囲を限定するものではない。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. The following embodiments are specific examples of the present invention and do not limit the technical scope of the present invention.

(1)製品検索装置10の構成
図1は、本発明の一実施形態に係る製品検索装置10の構成を示すブロック図である。図1において、製品検索装置10は、文書データ蓄積部20、キーワード抽出部30と、製品情報抽出部40、製品キーワード抽出部50、キーワード・係り受けパターン抽出部55及び共起情報抽出部60を備えている。
(1) Configuration of Product Search Device 10 FIG. 1 is a block diagram showing a configuration of a product search device 10 according to an embodiment of the present invention. In FIG. 1, the product search device 10 includes a document data storage unit 20, a keyword extraction unit 30, a product information extraction unit 40, a product keyword extraction unit 50, a keyword / dependency pattern extraction unit 55, and a co-occurrence information extraction unit 60. I have.

(2)詳細説明
(2−1)文書データ蓄積部20
文書データ蓄積部20は、製品毎に作成された文書データ(メールを含む)又は人物毎にその人物が作成した文書データ(メールを含む)を随時蓄積する仕組みになっている。文書には少なくとも文書名、製品名及び作成者名若しくは作成者IDが付される。
(2) Detailed description (2-1) Document data storage unit 20
The document data storage unit 20 has a mechanism for storing document data (including mail) created for each product or document data (including mail) created by the person for each person as needed. At least a document name, a product name, and a creator name or creator ID are attached to the document.

(2−2)キーワード抽出部30
キーワード抽出部30は、文書データ内の特徴的な語句、つまりキーワードの抽出を文書データ毎に行う。抽出する語句数は、文書データ毎に指定することができ、全てがキーワードになることを防止している。もちろん、文書データのサイズに応じてキーワード数を決めることもできる。
(2-2) Keyword extraction unit 30
The keyword extraction unit 30 extracts characteristic words / phrases in document data, that is, keywords, for each document data. The number of words to be extracted can be specified for each document data, preventing all from becoming keywords. Of course, the number of keywords can be determined according to the size of the document data.

(2−3)製品情報抽出部40
製品情報抽出部40は、文書データのプロパティ情報、あるいは文書登録時のログイン情報、メールであればフロム・フィールドなどを利用して製品情報を文書データ毎に抽出する。
(2-3) Product information extraction unit 40
The product information extraction unit 40 extracts product information for each document data by using property information of document data, login information at the time of document registration, or from field in the case of mail.

(2−4)製品キーワード抽出部50
製品キーワード抽出部50は、文書データ毎に、製品と、その製品に関して作成された文書データ内に出現するキーワードとを関連つけた製品キーワードテーブルを作成し、それを記憶する。
(2-4) Product keyword extraction unit 50
For each document data, the product keyword extraction unit 50 creates a product keyword table in which products are associated with keywords appearing in the document data created for the products, and stores them.

例えば、図1に示すように、左から順に製品ID、文書ID、文書名、作成日時、キーワードを列挙した表が作成される。製品IDは、製品を特定するためのIDである。文書IDは、その製品が記載された文書データがどのような文書(例えば、品質レポートなど)であるのかを特定するためのIDである。一例として、その人物が2012年に作成した品質レポートであるならば、2012QRというIDが付与される。   For example, as shown in FIG. 1, a table listing product IDs, document IDs, document names, creation dates, and keywords in order from the left is created. The product ID is an ID for specifying a product. The document ID is an ID for specifying what kind of document (for example, a quality report) the document data describing the product is. As an example, if the person is a quality report created in 2012, an ID of 2012 QR is given.

文書名は、通常、その文書の内容に則して決定されるので、最重要キーワードを含んでいる可能性が高い。作成日時は、その文書の作成日時であるが、作成日時又は更新日時のいずれであってもよい。   Since the document name is usually determined according to the contents of the document, there is a high possibility that the most important keyword is included. The creation date / time is the creation date / time of the document, but may be either the creation date / time or the update date / time.

また、図1の製品キーワードテーブルには、文書「2012QR」関連に続いて、他の文書に関連する情報も下方に続いている。そして、このような製品キーワードテーブルが製品別に作成され、記憶されているものとする。   Further, in the product keyword table of FIG. 1, the information related to the other document is also continued below the document “2012QR”. It is assumed that such a product keyword table is created and stored for each product.

(2−5)キーワード・係り受けパターン抽出部55
キーワード・係り受けパターン抽出部55は、製品キーワード抽出部50が作成した「製品キーワードテーブル」に基づき、製品別、且つ文書データ毎に「キーワード・係り受けパターンテーブル」を作成する。
(2-5) Keyword / Dependency Pattern Extraction Unit 55
The keyword / dependency pattern extraction unit 55 creates a “keyword / dependency pattern table” for each product and each document data based on the “product keyword table” created by the product keyword extraction unit 50.

具体例として、「モータ」というキーワードに対して、「・・・を駆動する」或いは「・・・で駆動する」という複数の係り受けパターンが得られる。   As a specific example, for the keyword “motor”, a plurality of dependency patterns “drive by” and “drive by” are obtained.

(2−6)共起情報抽出部60
共起情報抽出部60は、製品キーワード抽出部50が作成した「製品キーワードテーブル」に基づき、製品別に「共起情報テーブル」を作成する。
(2-6) Co-occurrence information extraction unit 60
The co-occurrence information extraction unit 60 creates a “co-occurrence information table” for each product based on the “product keyword table” created by the product keyword extraction unit 50.

この共起情報テーブルは、例えば、図1に示すように、行と列との交点に、行に割り当てられたキーワードと列に割り当てられたキーワードとが同時発生する割合を表示している。これによって、キーワード間の「結びつき度合い(共起度合い)」をそれらが「同時発生する割合(同時発生割合)」という数字で把握することができる。   For example, as shown in FIG. 1, the co-occurrence information table displays a rate at which a keyword assigned to a row and a keyword assigned to a column simultaneously occur at the intersection of the row and the column. Thus, the “degree of association (degree of co-occurrence)” between keywords can be grasped by the number “the rate of simultaneous occurrence (simultaneous occurrence rate)”.

その結果、キーワードに対してそれに関連する一又は複数の製品を探せるだけでなく、各製品が他にどのような情報(共起情報)と関わっているのかを知ることができる。   As a result, not only can one or a plurality of products related to the keyword be searched, but also what information (co-occurrence information) each product is related to can be known.

(2−7)統括制御部100
統括制御部100は、いわゆるCPUであって、OSその他のプログラムに従って、必要な処理を実行する。
(2-7) General control unit 100
The overall control unit 100 is a so-called CPU, and executes necessary processing according to the OS and other programs.

統括制御部100は、利用者が専用端末からキーワードを入力すると、キーワード抽出部30、製品情報抽出部40、製品キーワード抽出部50、キーワード・係り受けパターン抽出部55及び共起情報抽出部60に適宜指令を送り、必要情報を抽出する。   When the user inputs a keyword from the dedicated terminal, the overall control unit 100 sends the keyword extraction unit 30, product information extraction unit 40, product keyword extraction unit 50, keyword / dependency pattern extraction unit 55, and co-occurrence information extraction unit 60. Send commands as needed to extract necessary information.

(2−8)その他
キーワード抽出部30と、製品情報抽出部40、製品キーワード抽出部50、キーワード・係り受けパターン抽出部55及び共起情報抽出部60は、それぞれ抽出したデータを蓄積する記憶領域を個別に又は共通の記憶装置に有しているものとする。
(2-8) Others The keyword extraction unit 30, the product information extraction unit 40, the product keyword extraction unit 50, the keyword / dependency pattern extraction unit 55, and the co-occurrence information extraction unit 60 each store a storage area for storing extracted data Are stored individually or in a common storage device.

(3)製品検索装置10の動作
ここでは、3つの動作について説明する。第1の動作は製品検索装置10に各端末から文書データが入力されたときの動作であり、第2の動作は製品検索装置10に各端末から文書名が入力されたときの動作であり、第3の動作は製品検索装置10に端末から検索のためのキーワードが入力されたときの動作である。
(3) Operation of Product Search Device 10 Here, three operations will be described. The first operation is an operation when document data is input from each terminal to the product search device 10, and the second operation is an operation when a document name is input from each terminal to the product search device 10, The third operation is an operation when a keyword for search is input from the terminal to the product search apparatus 10.

(3−1)製品検索装置10の第1の動作
図2は、製品検索装置10の第1の動作を表すフローチャートである。ここで、第1の動作とは、製品検索装置10が文書データから「製品キーワードテーブル」を作成するまでの動作である。
(3-1) First Operation of Product Search Device 10 FIG. 2 is a flowchart showing a first operation of product search device 10. Here, the first operation is an operation until the product search apparatus 10 creates a “product keyword table” from the document data.

図2において、統括制御部100は、ステップS1において接続された端末のいずれかから文書データの入力があったか否かを判定し、文書データ入力があったときはステップS2へ進み、文書データ入力がないときは引き続き判定を継続する。   In FIG. 2, the overall control unit 100 determines whether or not document data has been input from any of the terminals connected in step S <b> 1. If document data has been input, the overall control unit 100 proceeds to step S <b> 2. If not, continue the determination.

次に統括制御部100は、ステップS2において入力された文書データを文書データ蓄積部20に蓄積し、ステップS3へ進む。   Next, the overall control unit 100 stores the document data input in step S2 in the document data storage unit 20, and proceeds to step S3.

次に統括制御部100は、ステップS3においてキーワード抽出部30を介して、文書データ蓄積部20に蓄積された文書データから文書データ毎にキーワードを抽出し、ステップS4へ進む。   Next, the overall control unit 100 extracts a keyword for each document data from the document data stored in the document data storage unit 20 via the keyword extraction unit 30 in step S3, and proceeds to step S4.

次に統括制御部100は、ステップS4において製品情報抽出部40を介して、文書データ蓄積部20に蓄積された文書データから文書データ毎に製品を抽出し、ステップS5へ進む。   Next, the overall control unit 100 extracts a product for each document data from the document data stored in the document data storage unit 20 via the product information extraction unit 40 in step S4, and proceeds to step S5.

次に統括制御部100は、ステップS5において製品キーワード抽出部50を介して、ステップS3で抽出したキーワードとステップS4で抽出した製品とから製品キーワードテーブルを作成し記憶する。以下、製品キーワードテーブルについて図面を用いて説明する。   Next, the overall control unit 100 creates and stores a product keyword table from the keywords extracted in step S3 and the products extracted in step S4 via the product keyword extraction unit 50 in step S5. Hereinafter, the product keyword table will be described with reference to the drawings.

図3Aは、製品キーワード抽出部50が作成した製品ID「101」のルームエアコンについての製品キーワードテーブルである。図3Aにおいて、エアコンについて登録されている全190件の品質レポートを対象に作成された製品キーワードテーブルから「ルームエアコン」に関する100件の文書が存在することが判明する。   FIG. 3A is a product keyword table for the room air conditioner with the product ID “101” created by the product keyword extraction unit 50. In FIG. 3A, it is found that there are 100 documents related to “room air conditioner” from the product keyword table created for all 190 quality reports registered for the air conditioner.

キーワードの欄には、左から同時発生割合の高いキーワードが表示されている。但し、他の品質レポートで抽出されたキーワードと重複するか否かが分かるようにするため、あえて左詰めで表示していない。   In the keyword column, keywords with a high simultaneous occurrence rate are displayed from the left. However, in order to know whether or not it overlaps with a keyword extracted in another quality report, it is not intentionally left-aligned.

例えば、「2014r」文書では、製品名自体がキーワードとなり、キーワード「ルームエアコン」の下に「フィルタ」、「お掃除機能」、「噛み込み」のキーワードが共起している。   For example, in the “2014r” document, the product name itself becomes a keyword, and the keywords “filter”, “cleaning function”, and “biting” co-occur under the keyword “room air conditioner”.

図3Bは、製品キーワード抽出部50が作成した製品ID「201」の業務用エアコンについての製品キーワードテーブルである。図3Bにおいて、エアコンについて登録されている全190件の品質レポートを対象に作成された製品キーワードテーブルから「業務用エアコン」を含む50件の文書が存在することが判明する。   FIG. 3B is a product keyword table for the commercial air conditioner with the product ID “201” created by the product keyword extraction unit 50. In FIG. 3B, it is found that there are 50 documents including “commercial air conditioner” from the product keyword table created for all 190 quality reports registered for the air conditioner.

例えば、「2014g」文書では、キーワード「業務用エアコン」の下にキーワードが「圧縮機」、「モータ」、「ロータ」、「マグネット」などが共起している。   For example, in the “2014g” document, keywords “compressor”, “motor”, “rotor”, “magnet”, and the like co-occur under the keyword “commercial air conditioner”.

図3Cは、製品キーワード抽出部50が作成した製品ID「301」のパーソナル空調機についての製品キーワードテーブルである。図3Cにおいて、エアコンについて登録されている全190件の文書を対象に作成された製品キーワードテーブルから「パーソナル空調機」を含む40件の文書が存在することが判明する。   FIG. 3C is a product keyword table for the personal air conditioner with the product ID “301” created by the product keyword extraction unit 50. In FIG. 3C, it is found that there are 40 documents including “personal air conditioner” from the product keyword table created for all 190 documents registered for the air conditioner.

例えば、「2013p」文書では、キーワード「パーソナル空調機」の下にキーワードが「冷媒」、「漏れ」、「ピンホール」などが共起している。   For example, in the “2013p” document, the keywords “refrigerant”, “leak”, “pinhole”, and the like co-occur under the keyword “personal air conditioner”.

(3−2)製品検索装置10の第2の動作
例えば、図3B「業務用エアコン」の製品キーワードテーブルを見た検索者が、特定の文書データの共起キーワードに着目した場合、さらなる調査を補助するために、製品検索装置10はその文書データのキーワード・係り受けパターンテーブルを作成し、画面上に表示させることができる。つまり、製品検索装置10は文書データごとにキーワード・係り受けパターンテーブルを作成することができる。
(3-2) Second Operation of Product Search Device 10 For example, when a searcher who looks at the product keyword table in FIG. 3B “Business Air Conditioner” focuses on the co-occurrence keyword of specific document data, further investigation is performed. To assist, the product search apparatus 10 can create a keyword / dependency pattern table of the document data and display it on the screen. That is, the product search apparatus 10 can create a keyword / dependency pattern table for each document data.

図4は、製品検索装置10の第2の動作を表すフローチャートである。ここで、第2の動作とは、製品検索装置10が「製品キーワードテーブル」からキーワード・係り受けパターンテーブルを作成する動作である。   FIG. 4 is a flowchart showing the second operation of the product search apparatus 10. Here, the second operation is an operation in which the product search apparatus 10 creates a keyword / dependency pattern table from the “product keyword table”.

図4において、統括制御部100は、ステップS11において特定の文書ID又は文書名の入力があったか否かを判定し、文書ID又は文書名のいずれかの入力が有ったときはステップS12へ進み、入力がないときは引き続き判定を継続する。   In FIG. 4, the overall control unit 100 determines whether or not a specific document ID or document name has been input in step S11. If either of the document ID or document name has been input, the overall control unit 100 proceeds to step S12. When there is no input, the determination is continued.

次に、統括制御部100は、ステップS12においてキーワード・係り受けパターン抽出部55を介して、入力された文書ID又は文書名の文書データからキーワード・係り受けパターンを抽出し、ステップS13へ進む。   Next, in step S12, the overall control unit 100 extracts a keyword / dependency pattern from the document data of the input document ID or document name via the keyword / dependency pattern extraction unit 55, and proceeds to step S13.

次に、統括制御部100は、ステップS13においてキーワード・係り受けパターンテーブル(図5A〜図5C参照)を作成し、ステップS14へ進む。   Next, the overall control unit 100 creates a keyword / dependency pattern table (see FIGS. 5A to 5C) in step S13, and proceeds to step S14.

そして、統括制御部100は、ステップS14において「キーワード・係り受けパターンテーブル」を検索画面に表示する。以下、「キーワード・係り受けパターンテーブル」について図面を用いて説明する。   Then, in step S14, the overall control unit 100 displays “keyword / dependency pattern table” on the search screen. The “keyword / dependency pattern table” will be described below with reference to the drawings.

図5Aは、一つの文書データに係るキーワード・係り受けパターンテーブルである。図5Aにおいて、キーワード・係り受けパターンテーブルには、製品ID、文書ID、文書データ作成日時、キーワード、キーワード・係り受けパターンで構成されている。   FIG. 5A is a keyword / dependency pattern table related to one document data. In FIG. 5A, the keyword / dependency pattern table includes a product ID, document ID, document data creation date / time, keyword, keyword / dependency pattern.

図5Aより、文書データは、文書ID「2012QR」及び文書名「2012g」から業務用エアコンの品質レポートであることが分かる。また、キーワード/係り受けパターン表示欄の記載から、「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」「モータ/が駆動しない」、「コイル/が短絡している」のキーワード/係り受けパターンが蓄積されていることが分かる。   From FIG. 5A, it can be seen that the document data is a quality report of a commercial air conditioner from the document ID “2012QR” and the document name “2012g”. In addition, from the description of the keyword / dependency pattern display column, keywords such as “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, and “coil / is shorted”. / It can be seen that dependency patterns are accumulated.

そして、検索者は、キーワード/係り受けパターンから、「ワイヤが短絡して、モータが駆動せず、圧縮機が起動しない」という事象を推測することができる。   Then, the searcher can infer from the keyword / dependency pattern an event that “the wire is short-circuited, the motor does not drive, and the compressor does not start”.

図5Bは、もう一つの文書データに係るキーワード・係り受けパターンテーブルである。図5Bにおいて、キーワード・係り受けパターンテーブルには、製品ID、文書ID、文書データ作成日時、キーワード、キーワード・係り受けパターンで構成されている。   FIG. 5B is a keyword / dependency pattern table related to another document data. In FIG. 5B, the keyword / dependency pattern table includes a product ID, document ID, document data creation date / time, keyword, keyword / dependency pattern.

図5Bより、文書データは、文書ID「2013QR」及び文書名「2013g」から業務用エアコンの品質レポートであることが分かる。また、キーワード/係り受けパターン表示欄の記載から、「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」「モータ/が駆動しない」、「コイル/が断線している」のキーワード/係り受けパターンが蓄積されていることが分かる。   From FIG. 5B, it can be seen that the document data is a quality report of a commercial air conditioner from the document ID “2013QR” and the document name “2013g”. In addition, from the keyword / dependency pattern display column, keywords such as “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, and “coil / is disconnected”. / It can be seen that dependency patterns are accumulated.

そして、検索者は、キーワード/係り受けパターンから、「コイルが断線して、モータが駆動せず、圧縮機が起動しない」と推測することができる。   The searcher can then infer from the keyword / dependency pattern that “the coil is disconnected, the motor does not drive, and the compressor does not start”.

このように、図3Bの製品キーワードテーブルだけでは「コイル」という共起キーワードが同じであるので、品質情報として同じ内容と判断される可能性があったが、図5A及び図5Bそれぞれのキーワード・係り受けパターンまで抽出することによって、さらに詳細な「コイル/が短絡している」という事象と、「コイル/が断線している」という事象まで把握することができる。   As described above, since the co-occurrence keyword “coil” is the same in the product keyword table of FIG. 3B alone, there is a possibility that the content is the same as the quality information. By extracting the dependency pattern, it is possible to grasp even more detailed events such as “the coil / is short-circuited” and “the coil / is disconnected”.

図5Cは、他の文書データに係るキーワード・係り受けパターンテーブルである。図5Cにおいて、文書データは、文書ID「2014QR」及び文書名「2014g」から業務用エアコンの品質レポートであることが分かる。また、キーワード/係り受けパターン表示欄の記載から、「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」「モータ/が駆動しない」、「ロータ/が回転しない」、及び「マグネット/が外れている」のキーワード/係り受けパターンが蓄積されていることが分かる。   FIG. 5C is a keyword / dependency pattern table relating to other document data. In FIG. 5C, it can be seen that the document data is a quality report of a commercial air conditioner from the document ID “2014QR” and the document name “2014g”. In addition, from the description of the keyword / dependency pattern display column, “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, “rotor / does not rotate”, and “magnet” It can be seen that the keyword / dependency pattern of “/ is off” is accumulated.

そして、検索者は、キーワード/係り受けパターンから、「マグネットが外れて、モータが駆動せず、圧縮機が起動しない」と推測することができる。   Then, the searcher can infer from the keyword / dependency pattern that “the magnet is removed, the motor does not drive, and the compressor does not start”.

上記のように、「業務用エアコン/が稼動しない」という同一現象のキーワード・係り受けパターンであっても、文書によって「マグネット/が外れている」という要因のキーワード・係り受けパターンが共起する場合もあれば、「コイル/が短絡している」という要因のキーワード・係り受けパターンが共起する場合もある。   As described above, even if the keyword / dependency pattern of the same phenomenon “business-use air conditioner / does not operate”, the keyword / dependency pattern of the factor “magnet / disengaged” co-occurs depending on the document. In some cases, the keyword / dependency pattern of the factor “coil / short-circuited” may co-occur.

それゆえ、本実施形態では、全文書データを対象にキーワードを抽出するのではなく、文書データ毎にキーワードを抽出し、製品と関連付け、共起キーワードを付与して、キーワード・係り受けパターンを作成している。   Therefore, in this embodiment, instead of extracting keywords for all document data, keywords are extracted for each document data, associated with products, and co-occurrence keywords are assigned to create keywords and dependency patterns. doing.

(3−3)製品検索装置10の第3の動作
ここでは、検索者が「エアコン」の市場クレーム実績調査のために、製品検索装置10の専用端末からキーワード「業務用エアコン」を入力したという想定の下で説明する。
(3-3) Third Operation of Product Search Device 10 Here, the searcher inputs the keyword “commercial air conditioner” from the dedicated terminal of the product search device 10 for the market complaint performance survey of “air conditioner”. This will be explained under the assumption.

図6は、製品検索装置10の第3の動作を表すフローチャートである。図6において、統括制御部100は、ステップS21においてキーワードの入力があったか否かを判定し、キーワード入力が有ったときはステップS22へ進み、キーワード入力がないときは引き続き判定を継続する。   FIG. 6 is a flowchart showing a third operation of the product search apparatus 10. In FIG. 6, the overall control unit 100 determines whether or not a keyword has been input in step S21. When there is a keyword input, the overall control unit 100 proceeds to step S22, and when there is no keyword input, continues the determination.

次に、統括制御部100は、ステップS22において製品キーワードテーブルの全てのデータを走査して、入力されたキーワードにヒットする製品キーワードテーブルを抽出し、ステップS23へ進む。   Next, the overall control unit 100 scans all data in the product keyword table in step S22, extracts the product keyword table that hits the input keyword, and proceeds to step S23.

次に、統括制御部100は、ステップS23において製品キーワードテーブル上のキーワードについてキーワード・係り受けパターンデーブルを抽出し、ステップS24へ進む。   Next, in step S23, the overall control unit 100 extracts a keyword / dependency pattern table for the keywords on the product keyword table, and proceeds to step S24.

次に、統括制御部100は、ステップS24において共起情報抽出部60を介して先のステップS22で抽出された「製品キーワードテーブル」に基づき、業務用エアコンの「共起情報テーブル」(図7参照)を作成し、ステップS25へ進む。   Next, the overall control unit 100, based on the “product keyword table” extracted in the previous step S22 via the co-occurrence information extraction unit 60 in step S24, the “co-occurrence information table” (FIG. 7) of the commercial air conditioner. Reference) is created, and the process proceeds to step S25.

次に、統括制御部100は、ステップS25において共起情報抽出部60を介して先のステップS24で抽出された業務用エアコンの「共起情報テーブル」を検索端末の画面に表示する。以下、「共起情報テーブル」について図面を用いて説明する。   Next, the overall control unit 100 displays the “co-occurrence information table” of the commercial air conditioner extracted in the previous step S24 via the co-occurrence information extraction unit 60 in step S25 on the screen of the search terminal. Hereinafter, the “co-occurrence information table” will be described with reference to the drawings.

(3−3−1)共起情報テーブルの詳細説明
共起情報抽出部60は、製品キーワード抽出部50が作成した図3A〜図3Cに記載の「製品キーワードテーブル」に基づき、「共起情報テーブル」を作成する。ここでは、図3Bに記載の「製品キーワードテーブル」に基づく「共起情報テーブル」を例として説明する。
(3-3-1) Detailed Description of Co-occurrence Information Table The co-occurrence information extraction unit 60 is based on the “product keyword table” described in FIG. 3A to FIG. Create a table. Here, a “co-occurrence information table” based on the “product keyword table” illustrated in FIG. 3B will be described as an example.

図3Bの「製品キーワードテーブル」は、業務用エアコンに関する文書データ毎に業務用エアコンに関連付けられているキーワードに対し共起キーワードを付与した上で作成される。   The “product keyword table” in FIG. 3B is created by assigning a co-occurrence keyword to a keyword associated with a commercial air conditioner for each document data related to the commercial air conditioner.

さらに、図5A、図5B、及び図5Cのキーワード・係り受けパターンテーブルは、図3Bの「製品キーワードテーブル」上のキーワードに基づいて作成されている。   Further, the keyword / dependency pattern tables in FIGS. 5A, 5B, and 5C are created based on the keywords on the “product keyword table” in FIG. 3B.

そして、共起情報抽出部60は、これらのキーワード・係り受けパターンからマトリックス状の共起情報テーブルを作成し、行と列との交点に、行に割り当てられたキーワード・係り受けパターンと列に割り当てられたキーワード・係り受けパターンとが同時発生する割合を表示する。   Then, the co-occurrence information extraction unit 60 creates a matrix-like co-occurrence information table from these keywords and dependency patterns, and at the intersections of the rows and columns, the keywords and dependency patterns and columns assigned to the rows are displayed. Displays the rate at which assigned keywords and dependency patterns occur simultaneously.

例えば「圧縮機/が起動しない」というキーワード・係り受けパターンに対し、一つの文書データにおいて共起度合いの高い「ロータ/が回転しない」という共起キーワード・係り受けパターンが存在しても、他の文書データでは全く共起せず、業務用エアコンに絞った共起情報テーブルでは、「ロータ/が回転しない」という共起キーワード・係り受けパターンの共起度合いが低くなる場合もある。   For example, for a keyword / dependency pattern “compressor / does not start”, a co-occurrence keyword / dependency pattern “rotor / does not rotate” with a high degree of co-occurrence exists in one document data. In the co-occurrence information table focused on commercial air conditioners, the co-occurrence degree of the co-occurrence keyword / dependency pattern “rotor / does not rotate” may be low.

図7Aは、共起情報抽出部60が作成した共起情報テーブルである。図7Aにおいて、共起情報テーブルの左端列に「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が短絡している」、「コイル/が断線している」、「ロータ/が回転しない」、「マグネット/が外れている」が上から下へ順に列挙されている。   FIG. 7A is a co-occurrence information table created by the co-occurrence information extraction unit 60. In FIG. 7A, in the leftmost column of the co-occurrence information table, “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, “coil / is shorted”, “ “The coil / is disconnected”, “the rotor / does not rotate”, and “the magnet / is disconnected” are listed in order from top to bottom.

また、共起情報テーブルの上端行に同様にキーワード・係り受けパターンが左から右へ順に列挙されている。   Similarly, keywords and dependency patterns are listed in order from left to right in the top row of the co-occurrence information table.

そして、行と列との交点には、行に割り当てられたキーワード・係り受けパターンと列に割り当てられたキーワード・係り受けパターンとが同時発生する割合が%単位で表示されている。   At the intersection between the row and the column, the ratio of the keyword / dependency pattern assigned to the row and the keyword / dependency pattern assigned to the column is displayed in%.

(3−3−1−1)共起情報テーブルが表す第1の側面
この共起情報テーブルは、2つの側面を表している。第1の側面はキーワード・係り受けパターンから視た共起度合い(同時発生割合)であり、第2の側面は共起キーワード・係り受けパターンから視た共起度合いである。以下、図面を参照しながら具体的に説明する。
(3-3-1-1) First aspect represented by co-occurrence information table This co-occurrence information table represents two aspects. The first aspect is the co-occurrence degree (cooccurrence ratio) viewed from the keyword / dependency pattern, and the second aspect is the co-occurrence degree viewed from the co-occurrence keyword / dependency pattern. Hereinafter, it demonstrates concretely, referring drawings.

先ず、第1の側面である「キーワード・係り受けパターンから視た共起キーワード・係り受けパターンの同時発生割合」を説明する。図7では、背景が網掛け表示されている領域が「キーワード・係り受けパターンから視た共起キーワード・係り受けパターンの同時発生割合」を表示している。   First, “a co-occurrence keyword / dependency pattern occurrence ratio viewed from a keyword / dependency pattern”, which is a first aspect, will be described. In FIG. 7, the area where the background is shaded displays “co-occurrence keyword / dependency pattern simultaneous occurrence ratio viewed from keyword / dependency pattern”.

「業務用エアコン/が稼動しない」の行と「圧縮機/が起動しない」の列との交点に80の数値が表示されている。これは「業務用エアコン/稼動しない」というキーワード・係り受けパターンが100件の文書中に存在し、その内の80件の文書中に「圧縮機/起動しない」が「業務用エアコン/が稼動しない」と共に出現していたという意味である。この場合、「業務用エアコン/が稼動しない」に対して「圧縮機/が起動しない」は共起キーワード・係り受けパターンであって、両者は100件中の80件の文書に共に出現していたので同時発生割合は80%である。   A numerical value of 80 is displayed at the intersection of the row “commercial air conditioner / does not operate” and the column “compressor / does not start”. This is because there is a keyword / dependency pattern of “commercial air conditioner / does not work” in 100 documents, and “compressor / does not start” is “operating air conditioner / does work” in 80 documents. It means that it was appearing with "No". In this case, “compressor / does not start” versus “commercial air conditioner / does not operate” is a co-occurrence keyword / dependency pattern, and both appear in 80 out of 100 documents. Therefore, the rate of simultaneous occurrence is 80%.

また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の65件の文書に「モータ/が駆動しない」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「モータ/が駆動しない」は共起キーワード・係り受けパターンであって、両者は100件のうち65件の文書で共に出現していたので同時発生割合は65%である。   In addition, the keyword / dependency pattern of “Motor / not drive” appeared in 65 documents out of 100 documents in which the keyword / dependency pattern of “business air conditioner / does not operate” appeared. In this case, “Professional air conditioner / does not work” and “Motor / does not drive” are co-occurrence keywords and dependency patterns, and both appear in 65 out of 100 documents. The coincidence rate is 65%.

また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の50件の文書に「コイル/が短絡している」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「コイル/が短絡している」は共起キーワード・係り受けパターンであって、両者は100件のうち25件の文書で共に出現していたので同時発生割合は25%である。   In addition, the keyword / dependency pattern “coil / short-circuited” appeared in 50 documents out of 100 documents where the keyword / dependency pattern “business air conditioner / does not operate” appeared. , “Coil / Short-circuited” is a co-occurrence keyword / dependency pattern with respect to “Professional air conditioner / does not operate”, and both appear in 25 out of 100 documents. Therefore, the simultaneous occurrence rate is 25%.

また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の50件の文書に「コイル/が断線している」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「コイル/が断線している」は共起キーワード・係り受けパターンであって、両者は100件のうち25件の文書で共に出現していたので同時発生割合は25%である。   In addition, the keyword / dependency pattern “coil / disconnected” appears in 50 documents out of 100 documents in which the keyword / dependency pattern “business air conditioner / does not operate” has appeared. In the case of “commercial air conditioner / does not operate”, “coil / disconnected” is a co-occurrence keyword / dependency pattern, and both appear in 25 out of 100 documents. Therefore, the simultaneous occurrence rate is 25%.

また、「業務用エアコン/稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の35件の文書に「ロータ/が回転しない」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「ロータ/が回転しない」は共起キーワード・係り受けパターンであって、両者は100件のうち35件の文書で共に出現していたので同時発生割合は35%である。   In addition, when the keyword / dependency pattern of “rotor / does not rotate” appears in 35 out of 100 documents in which the keyword / dependency pattern of “business air conditioner / does not operate” has appeared , “Rotor / does not rotate” against “commercial air conditioner / does not operate” is a co-occurrence keyword / dependency pattern, both appearing in 35 out of 100 documents at the same time The occurrence rate is 35%.

また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の30件の文書に「マグネット/が外れている」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「マグネット/が外れている」は共起キーワード・係り受けパターンであって、両者は100件のうち30件の文書で共に出現していたので同時発生割合は30%である。   In addition, the keyword / dependency pattern “magnet / disconnected” appears in 30 documents out of 100 documents where the keyword / dependency pattern “commercial air conditioner / does not operate” has appeared. In this case, “magnet / disengaged” is “co-occurrence keyword / dependency pattern” for “commercial air conditioner / does not operate”, and both appear in 30 out of 100 documents. Therefore, the rate of simultaneous occurrence is 30%.

(3−3−1−2)共起情報テーブルが表す第2の側面
次の、第2の側面である「共起キーワード・係り受けパターンから視た他のキーワード・係り受けパターンの同時発生割合」を説明する。
(3-3-1-2) Second aspect represented by co-occurrence information table The following second aspect is “the ratio of simultaneous occurrence of other keywords / dependency patterns viewed from co-occurrence keywords / dependency patterns” Is explained.

先ず、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が短絡している」、「コイル/が断線している」、「ロータ/が回転しない」及び「マグネット/が外れている」それぞれの行と「業務用エアコン/が稼動しない」の列との全ての交点に100の数値が表示されている。これは業務用エアコンに関する全文書100件から抽出されたキーワード・係り受けパターンであるので、必然的に同時発生割合は100%である。   First, “compressor / does not start”, “motor / does not drive”, “coil / is shorted”, “coil / is disconnected”, “rotor / does not rotate” and “magnet / The numerical value of 100 is displayed at all the intersections between each row of “I am off” and the column of “Commercial air conditioner / not working”. Since this is a keyword / dependency pattern extracted from all 100 documents related to commercial air conditioners, the rate of simultaneous occurrence is inevitably 100%.

ここでは、「圧縮機/が起動しない」の列を例にして説明する。「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の65件の文書に「モータ/が駆動しない」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「モータ/が駆動しない」は共起キーワード・係り受けパターンであって、両者は80件のうち65件の文書で共に出現していたので同時発生割合は81%である。   Here, a description will be given by taking the column of “compressor / not start” as an example. If the keyword / dependency pattern “Motor / not drive” appears in 65 documents out of 80 documents where the keyword / dependency pattern “compressor / does not start” appears, “Compressor / does not start” versus “motor / does not drive” is a co-occurrence keyword / dependency pattern, and both of them appeared in 65 documents out of 80. 81%.

また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の25件の文書に「コイル/が短絡している」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「コイル/が短絡している」は共起キーワード・係り受けパターンであって、両者は80件のうち25件の文書で共に出現していたので同時発生割合は31.5%である。   In addition, the keyword / dependency pattern “coil / short-circuited” appears in 25 of the 80 documents in which the keyword / dependency pattern “compressor / does not start” has appeared. When “compressor / does not start”, “coil / shorted” is a co-occurrence keyword / dependency pattern, and both appear in 25 out of 80 documents. Therefore, the simultaneous occurrence rate is 31.5%.

また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の25件の文書に「コイル/が短絡している」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「コイル/が短絡している」は共起キーワード・係り受けパターンであって、両者は80件のうち25件の文書で共に出現していたので同時発生割合は31.5%である。   In addition, the keyword / dependency pattern “coil / short-circuited” appears in 25 of the 80 documents in which the keyword / dependency pattern “compressor / does not start” has appeared. When “compressor / does not start”, “coil / shorted” is a co-occurrence keyword / dependency pattern, and both appear in 25 out of 80 documents. Therefore, the simultaneous occurrence rate is 31.5%.

また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の35件の文書に「ロータ/が回転しない」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「ロータ/が回転しない」は共起キーワード・係り受けパターンであって、両者は80件のうち35件の文書で共に出現していたので同時発生割合は44%である。   In addition, when the keyword / dependency pattern “rotor / does not rotate” appears in 35 of the 80 documents in which the keyword / dependency pattern “compressor / does not start” appears , “Rotor / does not rotate” for “compressor / does not start” is a co-occurrence keyword / dependency pattern, both appearing together in 35 out of 80 documents. The percentage is 44%.

また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の30件の文書に「マグネット/が外れている」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「マグネット/が外れない」は共起キーワード・係り受けパターンであって、両者は80件のうち30件の文書で共に出現していたので同時発生割合は38%である。   In addition, the keyword / dependency pattern “magnet / disconnected” appeared in 30 documents out of 80 documents where the keyword / dependency pattern “compressor / does not start” appeared. In this case, “compressor / does not start” and “magnet / does not come off” are co-occurrence keywords and dependency patterns, and both of them appeared in 30 out of 80 documents at the same time. The generation rate is 38%.

なお、図7Aでは、「業務用エアコン/が稼動しない」→「圧縮機/が起動しない」→「モータ/が駆動しない」→「コイルが/短絡している」→「コイルが/断線している」のように係り受け部分を動詞表現しているが、これに限定されるものではなく、図7Bに示すように「業務用エアコン/稼動」→「圧縮機/起動」→「モータ/駆動」→「コイル/短絡」→「コイル/断線」のように係り受け部分を名詞表現してもよい。   In FIG. 7A, “commercial air conditioner / does not operate” → “compressor / does not start” → “motor / does not drive” → “coil is shorted” → “coil is disconnected / broken. The dependency part is expressed as a verb such as “is”, but is not limited to this, and as shown in FIG. 7B, “commercial air conditioner / operation” → “compressor / startup” → “motor / drive” The dependency portion may be expressed as a noun such as “→ coil / short circuit” → “coil / disconnection”.

(3−3−2)
共起情報抽出部60は、キーワード・係り受けパターンからマトリックス状の共起情報テーブルを作成しているが、もちろんこれに限定されるものではなく、「製品キーワードテーブル」のキーワードだけから図8に示すようなマトリックス状の共起情報テーブルを作成してもよい。
(3-3-2)
The co-occurrence information extracting unit 60 creates a matrix-like co-occurrence information table from keywords and dependency patterns, but of course, the present invention is not limited to this, and only the keywords of the “product keyword table” are shown in FIG. A matrix-like co-occurrence information table as shown may be created.

但し、図7A、図7B及び図8の共起情報テーブルの「コイル」というキーワードを対比すれば明らかなように、キーワードだけによる共起情報テーブルは、係り受け部分が異なりキーワードだけが同じものを統合してしまう点に注意する必要がある。   However, as is clear from the comparison of the keyword “coil” in the co-occurrence information tables of FIGS. 7A, 7B, and 8, the co-occurrence information table using only the keywords has different dependency parts and only the keywords are the same. It should be noted that they will be integrated.

その弊害を解消するため、例えばキーワード・係り受けパターンの「コイル/が短絡している」を「コイル」、「短絡」というキーワードとして扱うことによって、キーワード「短絡」が共起情報テーブルに表示される。それを実践したのが、図9に示す共起情報テーブルである。   In order to eliminate this problem, for example, by treating the keyword / dependency pattern “coil / short-circuited” as the keywords “coil” and “short-circuit”, the keyword “short-circuit” is displayed in the co-occurrence information table. The The co-occurrence information table shown in FIG.

図9に示すように、図8の共起情報テーブルのキーワード・係り受けパターンの「コイル/が短絡している」及び「コイル/が断線している」が、「コイル」、「短絡」「断線」というキーワードとして扱われるようになる。   As shown in FIG. 9, the keywords and dependency patterns of the co-occurrence information table of FIG. 8 are “coil / short circuited” and “coil / disconnected” are “coil”, “short circuit”, “ It will be treated as a keyword “disconnection”.

その結果、キーワード「コイル」に共起する「短絡」及び「断線」が見逃されることを防止することができる。   As a result, it is possible to prevent the “short circuit” and the “break” that co-occur on the keyword “coil” from being overlooked.

(3−3−3)キーワードの組
既に説明した[(3−2)製品検索装置10の第2動作]の欄で登場した品質レポート「2012g」及び「2013g」を例に、「キーワードの組」について説明する。
(3-3-3) Keyword Set Taking the quality reports “2012g” and “2013g” that appeared in the section of [(3-2) Second Operation of Product Search Device 10] as described above as an example, “Keyword Set” Will be described.

例えば、品質レポート「2012g」には「業務用エアコンが稼動しない。・・・圧縮機が起動しない。・・・モータが駆動しない。・・・コイルが短絡している。」と記載され、品質レポート「2013g」には「業務用エアコンが稼動しない。・・・圧縮機が起動しない。・・・モータが駆動しない。・・・コイルが断線している。」と記載されていたとする。   For example, the quality report “2012g” states that “commercial air conditioner does not operate .... compressor does not start .... motor does not drive .... coil is shorted.” It is assumed that the report “2013g” states that “the commercial air conditioner does not operate .... the compressor does not start .... the motor does not drive .... the coil is disconnected.”

製品検索装置10の第2動作に従えば、品質レポート「2012g」からは「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が短絡している」のキーワード・係り受けパターンが抽出され、品質レポート「2013g」からは「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が断線している」のキーワード・係り受けパターンが抽出される。   According to the second operation of the product search device 10, the quality report “2012g” indicates that “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, “coil / “Short-circuited” keyword / dependency pattern is extracted, and from the quality report “2013g”, “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, “ The keyword / dependency pattern “coil / disconnected” is extracted.

また、本実施形態では、「業務用エアコン/稼動」、「圧縮機/起動」、「モータ/駆動」、「コイル/短絡」、「コイル/断線」が[キーワードの組]として抽出される。   In the present embodiment, “commercial air conditioner / operation”, “compressor / startup”, “motor / drive”, “coil / short circuit”, and “coil / disconnection” are extracted as [keyword set].

さらに、品質レポート「2012g」及び「2013g」のいずれかに「業務用エアコンが稼動することは、必ずしも圧縮機が起動することを意味しない。」という記載があった場合、「業務用エアコン/が稼動する」及び「圧縮機/が起動する」というキーワード・係り受けパターンが抽出され、「業務用エアコン/稼動/圧縮機/起動」がキーワードの組となる。   Further, if any of the quality reports “2012g” and “2013g” has a description that “the operation of the commercial air conditioner does not necessarily mean that the compressor is activated”, “the commercial air conditioner / The keywords and dependency patterns “operating” and “compressor / activate” are extracted, and “commercial air conditioner / operation / compressor / activation” becomes a set of keywords.

上記のようなキーワードの組は、成立困難性で言えば、同一文書の共起キーワード群→同一文のキーワードの組→キーワード・係り受けパターンの組の順で成立が困難になる。   In terms of the difficulty of establishment, the above keyword combinations are difficult to establish in the order of co-occurrence keyword group of the same document → keyword group of the same sentence → keyword / dependency pattern group.

つまり、検索者が検索初期に業務用エアコンについて「コイル」というキーワードを入力した場合、図8に示すように、50件の品質レポートが存在することを知ることになる。これに対し、業務用エアコンについて「コイル/短絡」というキーワードの組を入力した場合、係り受けパターンまで知らなくても、図7Bに示すように、当初から25件の品質レポートに絞り込まれるので、品質問題の核心により速く行きつくことができる。   That is, when the searcher inputs the keyword “coil” for the commercial air conditioner at the initial stage of the search, it is known that there are 50 quality reports as shown in FIG. On the other hand, if you enter the keyword set “Coil / Short” for commercial air conditioners, you can narrow down to 25 quality reports from the beginning, as shown in FIG. 7B, without knowing the dependency pattern. You can get to the core of quality issues faster.

したがって、キーワードで検索する場合は共起元が多い単一キーワードによる検索よりも、キーワードと係り受けとの間の文章の共起を利用した「キーワードの組」による検索の方が有効であり、検索対象の母数が大きい場合に有益である。   Therefore, when searching by keyword, a search by “keyword pair” using the co-occurrence of sentences between the keyword and the dependency is more effective than a search by a single keyword having many co-occurrence sources. This is useful when the search target parameter is large.

(3−3−4)キーワード製品マップの説明
図10は、製品検索装置10が検索端末の画面に表示する「キーワード製品マップ」である。図10において、キーワード製品マップは、上位キーワード「業務用エアコン」に関する製品情報がタイプA、タイプB及びタイプCの3種について存在することを表示する。それと同時に、全製品情報に共通して「圧縮機」という共起キーワードが高い頻度で出現していることが理解できる。
(3-3-4) Description of Keyword Product Map FIG. 10 is a “keyword product map” displayed on the screen of the search terminal by the product search device 10. In FIG. 10, the keyword product map displays that product information related to the upper keyword “commercial air conditioner” exists for three types of type A, type B, and type C. At the same time, it can be understood that the co-occurrence keyword “compressor” frequently appears in all product information.

(4)その他の動作
製品検索装置10は、ユーザーが検索端末から所定の操作をすることによって、製品別の「製品キーワードテーブル」、製品別の「共起情報テーブル」、及び「キーワード製品マップ」を画面に個別に表示させることができる。
(4) Other operations The product search apparatus 10 is configured so that the user performs a predetermined operation from the search terminal, whereby a “product keyword table” for each product, a “co-occurrence information table” for each product, and a “keyword product map”. Can be displayed individually on the screen.

(5)特徴
(5−1)
製品検索装置10では、製品別の共起情報テーブル内の一のキーワード・係り受けパターンと他のキーワード・係り受けパターンとの「結びつき」を一覧することができるので、キーワードに対して他にどのような情報(共起情報)で調査するべきかを知ることができる。
(5) Features (5-1)
The product search apparatus 10 can list “associations” between one keyword / dependency pattern and another keyword / dependency pattern in the co-occurrence information table for each product. It is possible to know whether to investigate with such information (co-occurrence information).

(5−2)
その際、キーワード・係り受けパターン間の「結びつき度合い」をそれらの「同時発生割合」という数字で把握することができる。
(5-2)
At that time, the “degree of connection” between the keywords and the dependency patterns can be grasped by the number of the “simultaneous occurrence ratio”.

(6)変形例
(6−1)
上記実施形態では、キーワード・係り受けパターンと共起キーワード・係り受けパターンとの同時発生割合の大きさに関係なく「製品キーワードテーブル」又は「共起情報テーブル」に蓄積することを前提に説明したが、これに限定されるものではない。
(6) Modification (6-1)
The above embodiment has been described on the assumption that the keyword / dependency pattern and the co-occurrence keyword / dependency pattern are stored in the “product keyword table” or the “co-occurrence information table” regardless of the size of the simultaneous occurrence ratio. However, the present invention is not limited to this.

例えば、キーワードと共起キーワードとの同時発生割合の大きさが閾値未満のものを蓄積しないことによって、陳腐化した情報の排除、記憶容量の増大化抑制を図ることができる。   For example, by not accumulating keywords and co-occurrence keywords that have a co-occurrence ratio less than a threshold value, it is possible to eliminate obsolete information and to suppress an increase in storage capacity.

(6−2)
また、上記実施形態では、キーワード・係り受けパターンと共起キーワード・係り受けパターンとの同時発生割合の大きさに関係なく「製品キーワードテーブル」又は「共起情報テーブル」に表示することを前提に説明したが、これに限定されるものではない。
(6-2)
In the above embodiment, it is assumed that the keyword / dependency pattern and the co-occurrence keyword / dependency pattern are displayed in the “product keyword table” or the “co-occurrence information table” regardless of the size of the simultaneous occurrence ratio. Although described, the present invention is not limited to this.

例えば、製品検索装置10では、同時発生割合があまりにも低く共起とは言えないようなキーワード・係り受けパターンの表示を控えることもできる。これによって、絞り込みを容易にすることができる。   For example, the product search apparatus 10 can refrain from displaying keyword / dependency patterns that have a co-occurrence rate that is too low to be co-occurrence. Thereby, narrowing down can be facilitated.

(6−3)
共起情報をシステム側でグループ化することによって、人手によるグループ化の工数を削減することができる。そのために、図11に示すように、製品検索装置10が、共起情報抽出部60が作成した製品別の共起情報からキーワード又はキーワード・係り受けパターンの体系化を行い抽出する体系化情報抽出部71をさらに備えることも可能である。
(6-3)
By grouping co-occurrence information on the system side, it is possible to reduce man-hours for grouping manually. Therefore, as shown in FIG. 11, systematic information extraction in which the product search apparatus 10 systematizes and extracts keywords or keyword / dependency patterns from the co-occurrence information for each product created by the co-occurrence information extraction unit 60. It is possible to further include a unit 71.

(6−4)
期間を区切り、製品が持つホットキーワードを示してもよい。そのために、図11に示すように、製品に関連付けられているキーワードからホットキーワードのマップを作成して抽出する、ワードマップ作成部73をさらに備えることも可能である。
(6-4)
The hot keywords of the product may be indicated by dividing the period. Therefore, as shown in FIG. 11, it is possible to further include a word map creation unit 73 that creates and extracts a hot keyword map from keywords associated with a product.

(7)その他
(7−1)
作成者は、外部から指定する場合もある。外部とは、「UI入力」、「ファイルと作成者との対応ファイル」、「ファイルの所有者を特定している文書」という形式が挙げられる。
(7) Others (7-1)
The creator may be designated from the outside. Examples of the external include “UI input”, “corresponding file between file and creator”, and “document specifying the owner of the file”.

(7−2)
「製品キーワードテーブル」および「共起情報テーブル」は画面への表示の有無に関係なくCPU内で作成され、短期間又は長期間、所定の記憶領域に保存される。
(8)他の実施形態
上記実施形態では、原則、同一ドキュメント/1ファイル中に同時に出現しているキーワードが共起となっているものを「共起キーワード」として扱っている。
(7-2)
The “product keyword table” and the “co-occurrence information table” are created in the CPU regardless of whether or not they are displayed on the screen, and are stored in a predetermined storage area for a short period or a long period.
(8) Other Embodiments In the above embodiments, in principle, keywords that appear simultaneously in the same document / one file are treated as “co-occurrence keywords”.

しかし、検索対象となる文書には、サポートメールのような伝達性を重視して、短い文章で端的に記載されるものもある。この場合、検索して何らかの出力を形成するためのデータが一文書データから得られるのか否か問題になる。この問題については、以下のような方法で解決することができる。   However, some documents to be searched are briefly described in short sentences with an emphasis on communication such as support mail. In this case, it becomes a problem whether data for searching to form some output is obtained from one document data. This problem can be solved by the following method.

例えば、サポートセンターへの問い合わせをする際のサポートメールの場合、発生するシーンで関係する事象をまとめる、という方法を採ることができる。具体例として、パソコンのサポートセンターに送られてくるサポートメールを、保存時、起動時、復電時と言った発生シーン毎に分類し、分類された単位を対象に共起情報テーブルを作成することによって、有用なデータが形成される。   For example, in the case of a support mail when making an inquiry to the support center, it is possible to adopt a method of collecting related events in the scene that occurs. As a specific example, the support email sent to the PC support center is categorized according to the occurrence scene, such as when saving, starting, and when power is restored, and a co-occurrence information table is created for the classified units. As a result, useful data is formed.

10 製品検索装置
30 キーワード抽出部
40 製品情報抽出部
50 製品キーワード抽出部
55 キーワード・係り受けパターン抽出部
60 共起情報抽出部
71 体系化情報抽出部
73 ワードマップ作成部
DESCRIPTION OF SYMBOLS 10 Product search apparatus 30 Keyword extraction part 40 Product information extraction part 50 Product keyword extraction part 55 Keyword and dependency pattern extraction part 60 Co-occurrence information extraction part 71 Systematization information extraction part 73 Word map creation part

特開2002−56001号公報JP 2002-560001 A

Claims (13)

メールを含む蓄積された多数の文書データから前記文書データ毎にキーワードを抽出するキーワード抽出部(30)と、
前記文書データから前記文書データ毎に製品の特定情報を抽出する製品情報抽出部(40)と、
前記文書データ毎に前記製品と前記キーワードとの関連付け情報を作成して抽出する製品キーワード抽出部(50)と、
前記文書データ毎に前記製品に関連付けられている前記キーワードに対し共起キーワードを付与して製品別の共起情報を作成して抽出する共起情報抽出部(60)と、
を備える、
製品検索装置(10)。
A keyword extraction unit (30) for extracting a keyword for each document data from a large number of accumulated document data including mail;
A product information extraction unit (40) for extracting product specific information for each document data from the document data;
A product keyword extraction unit (50) for creating and extracting association information between the product and the keyword for each document data;
A co-occurrence information extracting unit (60) that creates a co-occurrence information for each product by adding a co-occurrence keyword to the keyword associated with the product for each document data; and
Comprising
Product search device (10).
抽出した前記キーワードに基づく係り受けパターンを作成して抽出するキーワード・係り受けパターン抽出部(55)をさらに備える、
請求項1に記載の製品検索装置(10)。
A keyword / dependency pattern extraction unit (55) for creating and extracting a dependency pattern based on the extracted keyword;
The product search device (10) according to claim 1.
前記共起情報抽出部(60)は、前記キーワードに対し少なくとも1つの前記共起キーワードを付与する、
請求項1又は請求項2に記載の製品検索装置(10)。
The co-occurrence information extraction unit (60) assigns at least one co-occurrence keyword to the keyword.
The product search device (10) according to claim 1 or 2.
前記共起情報抽出部(60)は、前記共起情報内のキーワード群をマトリックス状に表す共起情報テーブルを作成する、
請求項1から請求項3のいずれか1項に記載の製品検索装置(10)。
The co-occurrence information extraction unit (60) creates a co-occurrence information table that represents a keyword group in the co-occurrence information in a matrix.
The product search device (10) according to any one of claims 1 to 3.
前記共起情報テーブルは、行と列との交点に、前記行に割り当てられたキーワードと前記列に割り当てられたキーワードとが同時発生する割合を表示する、
請求項4に記載の製品検索装置(10)。
The co-occurrence information table displays the rate at which the keyword assigned to the row and the keyword assigned to the column occur simultaneously at the intersection of the row and the column.
The product search device (10) according to claim 4.
前記共起情報抽出部(60)は、前記共起情報内の一のキーワードと他のキーワードとが同時発生する割合を演算し、前記同時発生する割合が所定値以上である前記共起情報を前記共起情報テーブルに蓄積する、
請求項4又は請求項5に記載の製品検索装置(10)。
The co-occurrence information extraction unit (60) calculates a rate at which one keyword and another keyword in the co-occurrence information are simultaneously generated, and calculates the co-occurrence information in which the rate at which the co-occurrence occurs is a predetermined value or more. Accumulate in the co-occurrence information table;
The product search device (10) according to claim 4 or 5.
前記共起情報抽出部(60)は、前記共起情報内の一のキーワードと他のキーワードとが同時発生する割合を演算し、前記同時発生する割合が所定値以上である前記共起情報を表示する、
請求項1から請求項6のいずれか1項に記載の製品検索装置(10)。
The co-occurrence information extraction unit (60) calculates a rate at which one keyword and another keyword in the co-occurrence information are simultaneously generated, and calculates the co-occurrence information in which the rate at which the co-occurrence occurs is a predetermined value or more. indicate,
The product search device (10) according to any one of claims 1 to 6.
前記キーワード抽出部(30)は、前記文書データごとに抽出すべき前記キーワードの数量を決定する、
請求項1から請求項6のいずれか1項に記載の製品検索装置(10)。
The keyword extraction unit (30) determines the quantity of the keywords to be extracted for each document data.
The product search device (10) according to any one of claims 1 to 6.
前記キーワード・係り受けパターン抽出部(55)は、前記文書データごとに抽出すべき前記キーワード・係り受けパターンの数量を決定する、
請求項2から請求項6のいずれか1項に記載の製品検索装置(10)。
The keyword / dependency pattern extraction unit (55) determines the quantity of the keyword / dependency pattern to be extracted for each document data.
The product search device (10) according to any one of claims 2 to 6.
前記キーワード抽出部(30)は、一の前記文書データから抽出される前記キーワードの数量の上限を前記文書データの大きさに応じて決定する、
請求項1から請求項6のいずれか1項に記載の製品検索装置(10)。
The keyword extraction unit (30) determines an upper limit of the quantity of the keywords extracted from one document data according to the size of the document data.
The product search device (10) according to any one of claims 1 to 6.
前記キーワード・係り受けパターン抽出部(55)は、一の前記文書データから抽出される前記キーワード・係り受けパターンの数量の上限を前記文書データの大きさに応じて決定する、
請求項2から請求項6のいずれか1項に記載の製品検索装置(10)。
The keyword / dependency pattern extraction unit (55) determines the upper limit of the quantity of the keyword / dependency pattern extracted from one document data according to the size of the document data.
The product search device (10) according to any one of claims 2 to 6.
前記共起情報抽出部(60)が作成した製品別の前記共起情報から前記キーワード又は前記キーワード・係り受けパターンの体系化を行い抽出する体系化情報抽出部(71)をさらに備える、
請求項2から請求項11のいずれか1項に記載の製品検索装置(10)。
A systematic information extracting unit (71) for systematizing and extracting the keyword or the keyword / dependency pattern from the co-occurrence information for each product created by the co-occurrence information extracting unit (60);
The product search device (10) according to any one of claims 2 to 11.
前記製品に関連付けられている前記キーワードからホットキーワードのマップを作成して抽出する、ワードマップ作成部(73)をさらに備える、
請求項1から請求項12のいずれか1項に記載の製品検索装置(10)。
A word map creation unit (73) for creating and extracting a hot keyword map from the keywords associated with the product;
The product search device (10) according to any one of claims 1 to 12.
JP2015206971A 2015-10-21 2015-10-21 Product retrieval device Pending JP2017078976A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015206971A JP2017078976A (en) 2015-10-21 2015-10-21 Product retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015206971A JP2017078976A (en) 2015-10-21 2015-10-21 Product retrieval device

Publications (1)

Publication Number Publication Date
JP2017078976A true JP2017078976A (en) 2017-04-27

Family

ID=58665446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015206971A Pending JP2017078976A (en) 2015-10-21 2015-10-21 Product retrieval device

Country Status (1)

Country Link
JP (1) JP2017078976A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7032582B1 (en) 2021-01-29 2022-03-08 Kpmgコンサルティング株式会社 Information analysis program, information analysis method and information analysis device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7032582B1 (en) 2021-01-29 2022-03-08 Kpmgコンサルティング株式会社 Information analysis program, information analysis method and information analysis device
JP2022117019A (en) * 2021-01-29 2022-08-10 Kpmgコンサルティング株式会社 Information analysis program, information analysis method, and information analysis device

Similar Documents

Publication Publication Date Title
US20130021355A1 (en) Method and system for displaying proiritized live thumbnail of process graphic views
JP6346218B2 (en) Search method, apparatus and server for online trading platform
JP2019197551A (en) Designing assist system
KR20140108721A (en) Sequence program creation device
CN103168299A (en) Information display
JP2018206316A (en) Plant operation monitoring system and plant operation monitoring method
JP5185402B2 (en) Document search apparatus, document search method, and document search program
CN110008395B (en) Comment content presentation method and device, storage medium and terminal
JP2013041385A (en) Document retrieval method, document retrieval device, and document retrieval program
JP2017078976A (en) Product retrieval device
JP4992301B2 (en) Search processing method and apparatus
JP5980723B2 (en) Emergency know-how reference support method, emergency know-how reference support device, and emergency know-how reference support program
JP6149836B2 (en) Human resource search device
JPH11238069A (en) Component selection device
JP2008197976A (en) Connection information generation program and connection information generation method
JP5088016B2 (en) Traceability management device
JP2005128872A (en) Document retrieving system and document retrieving program
WO2018084226A1 (en) Document search method and device
CN103473228A (en) Method and device for displaying related keywords
CN104461224A (en) Information processing method and electronic device
JP2015026167A (en) Alarm management system and alarm management method
JP2007156928A (en) Design support program, design support method, and design support system
JP5444071B2 (en) Fault information collection system, method and program
JP2006244298A (en) Text mining method and device
JP6746550B2 (en) INFORMATION SEARCH DEVICE, INFORMATION SEARCH METHOD, AND PROGRAM