JP2017078976A - Product retrieval device - Google Patents
Product retrieval device Download PDFInfo
- Publication number
- JP2017078976A JP2017078976A JP2015206971A JP2015206971A JP2017078976A JP 2017078976 A JP2017078976 A JP 2017078976A JP 2015206971 A JP2015206971 A JP 2015206971A JP 2015206971 A JP2015206971 A JP 2015206971A JP 2017078976 A JP2017078976 A JP 2017078976A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- product
- occurrence
- document data
- extraction unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、製品検索装置に関し、特に文書データから製品流通市場におけるトラブル等の製品関連情報を適切な利用に資する製品検索装置に関する。 The present invention relates to a product search apparatus, and more particularly to a product search apparatus that contributes to appropriate use of product-related information such as troubles in the product distribution market from document data.
近年、文書データから人物とキーワードとを抽出し、それらを結びつけた情報を利用するためのツールが広く普及している。例えば、特許文献1(特開2002−56001号公報)に開示されている精通者抽出装置は、文書から専門用語を切り出し、人物ごとに予めその専門用語の属する分野についての精通度を記憶したデータ・ベースから適切な人物を抽出するものである。 In recent years, tools for extracting a person and a keyword from document data and using information obtained by linking them are widely used. For example, a savvy person extraction device disclosed in Patent Document 1 (Japanese Patent Application Laid-Open No. 2002-56001) is a data in which a technical term is cut out from a document, and a degree of familiarity about a field to which the technical term belongs is stored in advance for each person. -Extracting an appropriate person from the base.
しかしながら、特許文献1では、専門用語と人物とを結びつけることによって精通者を特定する方法は開示されているものの、文書データから製品とキーワードとを抽出し、それらを結びつけた情報を利用するためのツールが示されておらず、製品が流通する市場で、製品にどのようなトラブルが起き、そのトラブルが何に起因しているのか等、トラブルに関する情報を適切に利用することができていない。
However, although
本発明の課題は、製品ごとの品質情報の「見える化」を図り、品質改善を支援することができる製品検索装置を提供することにある。 An object of the present invention is to provide a product search apparatus capable of “visualizing” quality information for each product and supporting quality improvement.
本発明の第1観点に係る製品検索装置は、キーワード抽出部と、製品情報抽出部と、製品キーワード抽出部と、共起情報抽出部とを備えている。キーワード抽出部は、メールを含む蓄積された多数の文書データから文書データ毎にキーワードを抽出する。製品情報抽出部は、文書データから文書データ毎に製品の特定情報を抽出する。製品キーワード抽出部は、文書データ毎に製品とキーワードとの関連付け情報を作成して抽出する。共起情報抽出部は、文書データ毎に製品に関連付けられているキーワードに対し共起キーワードを付与して製品別の共起情報を作成して抽出する。 A product search device according to a first aspect of the present invention includes a keyword extraction unit, a product information extraction unit, a product keyword extraction unit, and a co-occurrence information extraction unit. The keyword extracting unit extracts a keyword for each document data from a large number of accumulated document data including mail. The product information extraction unit extracts product specific information for each document data from the document data. The product keyword extracting unit creates and extracts association information between products and keywords for each document data. The co-occurrence information extracting unit creates and extracts co-occurrence information for each product by assigning a co-occurrence keyword to a keyword associated with the product for each document data.
この製品検索装置では、例えば、検索者が「製品名」と「不具合の症状」とを入力することによって、関連するキーワード、それに対する共起キーワードが提供されるので、不具合要因の特定を支援することができる。 In this product search device, for example, when a searcher inputs "product name" and "symptom of failure", a related keyword and a co-occurrence keyword for the keyword are provided. be able to.
本発明の第2観点に係る製品検索装置は、第1観点に係る製品検索装置であって、キーワード・係り受けパターン抽出部をさらに備えている。キーワード・係り受けパターン抽出部は、抽出したキーワードに基づくキーワード・係り受けパターンを作成して抽出する。 A product search apparatus according to a second aspect of the present invention is the product search apparatus according to the first aspect, further comprising a keyword / dependency pattern extraction unit. The keyword / dependency pattern extraction unit creates and extracts a keyword / dependency pattern based on the extracted keyword.
キーワード、共起キーワードが提供されてもその数が非常に多い場合には不具合要因を特定することは容易ではないが、この製品検索装置では、キーワード・係り受けパターンが提供されることによって、不具合要因の特定を容易にすることができる。 Even if keywords and co-occurrence keywords are provided, it is not easy to identify the cause of the problem when the number is very large. However, this product search device provides a problem by providing a keyword / dependency pattern. Factors can be easily identified.
本発明の第3観点に係る製品検索装置は、第1観点又は第2観点に係る製品検索装置であって、共起情報抽出部が、キーワードに対し少なくとも1つの共起キーワードを付与する。 The product search device according to the third aspect of the present invention is the product search device according to the first aspect or the second aspect, and the co-occurrence information extraction unit assigns at least one co-occurrence keyword to the keyword.
本発明の第4観点に係る製品検索装置は、第1観点から第3観点のいずれか1つに係る製品検索装置であって、共起情報抽出部が、共起情報内のキーワード群をマトリックス状に表す共起情報テーブルを作成する。 A product search device according to a fourth aspect of the present invention is the product search device according to any one of the first to third aspects, wherein the co-occurrence information extraction unit matrixes the keyword group in the co-occurrence information. Create a co-occurrence information table.
この製品検索装置では、共起情報内の一のキーワードと他のキーワードとの「結びつき」を一覧することができる。 In this product search apparatus, it is possible to list “ties” between one keyword in the co-occurrence information and another keyword.
本発明の第5観点に係る製品検索装置は、第4観点に係る製品検索装置であって、共起情報テーブルは、行と列との交点に、行に割り当てられたキーワードと列に割り当てられたキーワードとが同時発生する割合を表示する。 A product search device according to a fifth aspect of the present invention is the product search device according to the fourth aspect, wherein the co-occurrence information table is assigned to a keyword and a column assigned to a row at an intersection of the row and the column. Displays the rate of simultaneous occurrence of keywords.
この製品検索装置では、キーワード間の「結びつき度合い(共起度合い)」をそれらが「同時発生する割合(同時発生割合)」という数字で把握することができる(つまり、「結びつき度合い」という特性値の代用特性値が「同時発生割合」である)。 In this product search device, the “association degree (co-occurrence degree)” between keywords can be grasped by the number “the ratio of simultaneous occurrence (simultaneous occurrence ratio)” (that is, the characteristic value of “the degree of association”) The substitute characteristic value of “is the simultaneous occurrence rate”).
本発明の第6観点に係る製品検索装置は、第4観点又は第5観点に係る製品検索装置であって、共起情報抽出部が、共起情報内の一のキーワードと他のキーワードとが同時発生する割合を演算し、同時発生する割合が所定値以上である共起情報を共起情報テーブルに蓄積する。 A product search device according to a sixth aspect of the present invention is the product search device according to the fourth or fifth aspect, wherein the co-occurrence information extraction unit determines whether one keyword and another keyword in the co-occurrence information are present. The ratio of simultaneous occurrence is calculated, and the co-occurrence information with the ratio of simultaneous occurrence equal to or greater than a predetermined value is stored in the co-occurrence information table.
この製品検索装置では、各キーワードを蓄積させるか否かの判断が、他の共起キーワードとの同時発生割合の大きさに基づいて行われることにより、陳腐化した情報の排除、記憶容量の増大化抑制を図ることができる。 In this product search device, whether or not to accumulate each keyword is determined based on the size of the concurrent occurrence with other co-occurrence keywords, thereby eliminating obsolete information and increasing storage capacity. Can be suppressed.
本発明の第7観点に係る製品検索装置は、第1観点から第5観点のいずれか1つに係る製品検索装置であって、共起情報抽出部が、共起情報内の一のキーワードと他のキーワードとが同時発生する割合を演算し、同時発生する割合が所定値以上である前記共起情報を表示する。 A product search device according to a seventh aspect of the present invention is the product search device according to any one of the first to fifth aspects, wherein the co-occurrence information extraction unit includes a keyword in the co-occurrence information, The ratio of the simultaneous occurrence with other keywords is calculated, and the co-occurrence information with the simultaneous occurrence ratio being a predetermined value or more is displayed.
この製品検索装置では、同時発生しているが発生頻度があまりにも低く共起とは言えないようなキーワードの表示を控えることによって、絞り込みを容易にする。 In this product search device, narrowing down is facilitated by refraining from displaying keywords that occur at the same time but are not so frequently occurring.
本発明の第8観点に係る製品検索装置は、第1観点から第6観点のいずれか1つに係る製品検索装置であって、キーワード抽出部が、文書データごとに抽出すべきキーワードの数量を決定する。 A product search device according to an eighth aspect of the present invention is the product search device according to any one of the first to sixth aspects, wherein the keyword extraction unit determines the number of keywords to be extracted for each document data. decide.
この製品検索装置では、全てがキーワードになることを防止することができる。また、文書データの大きさ応じて抽出すべきキーワード数量を決定するようにすれば、文書データの大きさに比例したキーワード数を確保することもできる。 In this product search apparatus, it is possible to prevent everything from becoming keywords. Further, if the number of keywords to be extracted is determined according to the size of the document data, the number of keywords proportional to the size of the document data can be secured.
本発明の第9観点に係る製品検索装置は、請求項2から請求項6のいずれか1つに係る製品検索装置であって、キーワード・係り受けパターン抽出部が、文書データごとに抽出すべきキーワード・係り受けパターンの数量を決定する。 A product search device according to a ninth aspect of the present invention is the product search device according to any one of claims 2 to 6, wherein the keyword / dependency pattern extraction unit should extract each document data Determine the quantity of keywords and dependency patterns.
この製品検索装置では、文書データの大きさ応じて抽出すべきキーワード・係り受けパターンの数量を決定するようにすれば、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することもできる。 In this product search device, if the number of keywords and dependency patterns to be extracted is determined according to the size of the document data, the number of keywords and dependency patterns that are proportional to the size of the document data is secured. You can also.
本発明の第10観点に係る製品検索装置は、第1観点から第6観点のいずれか1つに係る製品検索装置であって、キーワード抽出部が、一の文書データから抽出されるキーワードの数量の上限を文書データの大きさに応じて決定する。 A product search device according to a tenth aspect of the present invention is the product search device according to any one of the first to sixth aspects, wherein the keyword extraction unit extracts the number of keywords extracted from one document data. Is determined according to the size of the document data.
この製品検索装置では、文書データの大きさに比例したキーワード数を確保することができる。 In this product search apparatus, the number of keywords proportional to the size of document data can be secured.
本発明の第11観点に係る製品検索装置は、第2観点から第6観点のいずれか1つに係る製品検索装置であって、キーワード・係り受けパターン抽出部が、一の文書データから抽出されるキーワード・係り受けパターンの数量の上限を文書データの大きさに応じて決定する。 A product search device according to an eleventh aspect of the present invention is the product search device according to any one of the second to sixth aspects, wherein the keyword / dependency pattern extraction unit is extracted from one document data. The upper limit of the number of keywords and dependency patterns to be determined is determined according to the size of the document data.
この製品検索装置では、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することができる。 In this product retrieval apparatus, the number of keywords and dependency patterns proportional to the size of document data can be secured.
本発明の第12観点に係る製品検索装置は、第1観点から第11観点のいずれか1つに係る製品検索装置であって、体系化情報抽出部をさらに備えている。体系化情報抽出部は、共起情報抽出部が作成した製品別の共起情報からキーワード又はキーワード・係り受けパターンの体系化を行い抽出する。 A product search device according to a twelfth aspect of the present invention is the product search device according to any one of the first to eleventh aspects, further comprising a systematic information extraction unit. The systematized information extraction unit systematizes and extracts keywords or keywords / dependency patterns from the co-occurrence information for each product created by the co-occurrence information extraction unit.
本発明の第13観点に係る製品検索装置は、第1観点から第12観点のいずれか1つに係る製品検索装置であって、ワードマップ作成部をさらに備えている。ワードマップ作成部は、製品に関連付けられているキーワードからホットキーワードのマップを作成して抽出する。 A product search device according to a thirteenth aspect of the present invention is the product search device according to any one of the first to twelfth aspects, further comprising a word map creation unit. The word map creation unit creates and extracts a hot keyword map from keywords associated with a product.
本発明の第1観点又は第3観点に係る製品検索装置では、例えば、検索者が「製品名」と「不具合の症状」とを入力することによって、関連するキーワード、それに対する共起キーワードが提供されるので、不具合要因の特定を支援することができる。 In the product search device according to the first aspect or the third aspect of the present invention, for example, when the searcher inputs “product name” and “symptom of failure”, related keywords and co-occurrence keywords are provided. Therefore, it is possible to support the identification of the failure factor.
本発明の第2観点に係る製品検索装置では、係り受けパターンが提供されることによって、不具合要因の特定を容易にすることができる。 In the product search device according to the second aspect of the present invention, the dependency factor can be easily specified by providing the dependency pattern.
本発明の第4観点に係る製品検索装置では、共起情報内の一のキーワードと他のキーワードとの「結びつき」を一覧することができる。 In the product search device according to the fourth aspect of the present invention, it is possible to list “ties” between one keyword in the co-occurrence information and another keyword.
本発明の第5観点に係る製品検索装置では、キーワード間の「結びつき度合い(共起度合い)」をそれらが「同時発生する割合(同時発生割合)」という数字で把握することができる(つまり、「結びつき度合い」という特性値の代用特性値が「同時発生割合」である)。 In the product search device according to the fifth aspect of the present invention, it is possible to grasp the “degree of association (degree of co-occurrence)” between keywords by the number “the rate of simultaneous occurrence (co-occurrence rate)” (that is, The substitute characteristic value of the characteristic value of “degree of association” is the “simultaneous occurrence ratio”).
本発明の第6観点に係る製品検索装置では、各キーワードを蓄積させるか否かの判断が、他の共起キーワードとの同時発生割合の大きさに基づいて行われることにより、陳腐化した情報の排除、記憶容量の増大化抑制を図ることができる。 In the product search device according to the sixth aspect of the present invention, the determination as to whether or not to accumulate each keyword is made based on the size of the simultaneous occurrence ratio with other co-occurrence keywords, thereby making the information obsolete. And the increase in storage capacity can be suppressed.
本発明の第7観点に係る製品検索装置では、同時発生しているが発生頻度があまりにも低く共起とは言えないようなキーワードの表示を控えることによって、絞り込みを容易にする。 In the product search apparatus according to the seventh aspect of the present invention, narrowing down is facilitated by refraining from displaying keywords that occur at the same time but are not so frequently occurring.
本発明の第8観点に係る製品検索装置では、全てがキーワードになることを防止することができる。また、文書データの大きさ応じて抽出すべきキーワード数量を決定するようにすれば、文書データの大きさに比例したキーワード数を確保することもできる。 In the product search device according to the eighth aspect of the present invention, it is possible to prevent everything from becoming keywords. Further, if the number of keywords to be extracted is determined according to the size of the document data, the number of keywords proportional to the size of the document data can be secured.
本発明の第9観点に係る製品検索装置では、文書データの大きさ応じて抽出すべきキーワード・係り受けパターンの数量を決定するようにすれば、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することもできる。 In the product search device according to the ninth aspect of the present invention, if the number of keywords and dependency patterns to be extracted is determined according to the size of the document data, the keywords and dependency proportional to the size of the document data are determined. It is also possible to secure the number of patterns.
本発明の第10観点に係る製品検索装置では、文書データの大きさに比例したキーワード数を確保することができる。 In the product search device according to the tenth aspect of the present invention, the number of keywords proportional to the size of the document data can be ensured.
本発明の第11観点に係る製品検索装置では、文書データの大きさに比例したキーワード・係り受けパターンの数を確保することができる。 In the product search device according to the eleventh aspect of the present invention, the number of keywords and dependency patterns proportional to the size of document data can be ensured.
本発明の第12観点に係る製品検索装置では、共起情報をシステム側でグループ化することによって、人手によるグループ化の工数を削減することができる。 In the product search device according to the twelfth aspect of the present invention, the co-occurrence information is grouped on the system side, thereby reducing the number of man-hours for grouping manually.
本発明の第13観点に係る製品検索装置では、期間を区切り、製品が持つホットキーワードを示すことができる。 In the product search apparatus according to the thirteenth aspect of the present invention, the hot keywords of the product can be shown by dividing the period.
以下、図面を参照しながら、本発明の実施形態について説明する。なお、以下の実施形態は、本発明の具体例であって、本発明の技術的範囲を限定するものではない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The following embodiments are specific examples of the present invention and do not limit the technical scope of the present invention.
(1)製品検索装置10の構成
図1は、本発明の一実施形態に係る製品検索装置10の構成を示すブロック図である。図1において、製品検索装置10は、文書データ蓄積部20、キーワード抽出部30と、製品情報抽出部40、製品キーワード抽出部50、キーワード・係り受けパターン抽出部55及び共起情報抽出部60を備えている。
(1) Configuration of
(2)詳細説明
(2−1)文書データ蓄積部20
文書データ蓄積部20は、製品毎に作成された文書データ(メールを含む)又は人物毎にその人物が作成した文書データ(メールを含む)を随時蓄積する仕組みになっている。文書には少なくとも文書名、製品名及び作成者名若しくは作成者IDが付される。
(2) Detailed description (2-1) Document
The document
(2−2)キーワード抽出部30
キーワード抽出部30は、文書データ内の特徴的な語句、つまりキーワードの抽出を文書データ毎に行う。抽出する語句数は、文書データ毎に指定することができ、全てがキーワードになることを防止している。もちろん、文書データのサイズに応じてキーワード数を決めることもできる。
(2-2)
The
(2−3)製品情報抽出部40
製品情報抽出部40は、文書データのプロパティ情報、あるいは文書登録時のログイン情報、メールであればフロム・フィールドなどを利用して製品情報を文書データ毎に抽出する。
(2-3) Product
The product
(2−4)製品キーワード抽出部50
製品キーワード抽出部50は、文書データ毎に、製品と、その製品に関して作成された文書データ内に出現するキーワードとを関連つけた製品キーワードテーブルを作成し、それを記憶する。
(2-4) Product
For each document data, the product
例えば、図1に示すように、左から順に製品ID、文書ID、文書名、作成日時、キーワードを列挙した表が作成される。製品IDは、製品を特定するためのIDである。文書IDは、その製品が記載された文書データがどのような文書(例えば、品質レポートなど)であるのかを特定するためのIDである。一例として、その人物が2012年に作成した品質レポートであるならば、2012QRというIDが付与される。 For example, as shown in FIG. 1, a table listing product IDs, document IDs, document names, creation dates, and keywords in order from the left is created. The product ID is an ID for specifying a product. The document ID is an ID for specifying what kind of document (for example, a quality report) the document data describing the product is. As an example, if the person is a quality report created in 2012, an ID of 2012 QR is given.
文書名は、通常、その文書の内容に則して決定されるので、最重要キーワードを含んでいる可能性が高い。作成日時は、その文書の作成日時であるが、作成日時又は更新日時のいずれであってもよい。 Since the document name is usually determined according to the contents of the document, there is a high possibility that the most important keyword is included. The creation date / time is the creation date / time of the document, but may be either the creation date / time or the update date / time.
また、図1の製品キーワードテーブルには、文書「2012QR」関連に続いて、他の文書に関連する情報も下方に続いている。そして、このような製品キーワードテーブルが製品別に作成され、記憶されているものとする。 Further, in the product keyword table of FIG. 1, the information related to the other document is also continued below the document “2012QR”. It is assumed that such a product keyword table is created and stored for each product.
(2−5)キーワード・係り受けパターン抽出部55
キーワード・係り受けパターン抽出部55は、製品キーワード抽出部50が作成した「製品キーワードテーブル」に基づき、製品別、且つ文書データ毎に「キーワード・係り受けパターンテーブル」を作成する。
(2-5) Keyword / Dependency
The keyword / dependency
具体例として、「モータ」というキーワードに対して、「・・・を駆動する」或いは「・・・で駆動する」という複数の係り受けパターンが得られる。 As a specific example, for the keyword “motor”, a plurality of dependency patterns “drive by” and “drive by” are obtained.
(2−6)共起情報抽出部60
共起情報抽出部60は、製品キーワード抽出部50が作成した「製品キーワードテーブル」に基づき、製品別に「共起情報テーブル」を作成する。
(2-6) Co-occurrence
The co-occurrence
この共起情報テーブルは、例えば、図1に示すように、行と列との交点に、行に割り当てられたキーワードと列に割り当てられたキーワードとが同時発生する割合を表示している。これによって、キーワード間の「結びつき度合い(共起度合い)」をそれらが「同時発生する割合(同時発生割合)」という数字で把握することができる。 For example, as shown in FIG. 1, the co-occurrence information table displays a rate at which a keyword assigned to a row and a keyword assigned to a column simultaneously occur at the intersection of the row and the column. Thus, the “degree of association (degree of co-occurrence)” between keywords can be grasped by the number “the rate of simultaneous occurrence (simultaneous occurrence rate)”.
その結果、キーワードに対してそれに関連する一又は複数の製品を探せるだけでなく、各製品が他にどのような情報(共起情報)と関わっているのかを知ることができる。 As a result, not only can one or a plurality of products related to the keyword be searched, but also what information (co-occurrence information) each product is related to can be known.
(2−7)統括制御部100
統括制御部100は、いわゆるCPUであって、OSその他のプログラムに従って、必要な処理を実行する。
(2-7)
The
統括制御部100は、利用者が専用端末からキーワードを入力すると、キーワード抽出部30、製品情報抽出部40、製品キーワード抽出部50、キーワード・係り受けパターン抽出部55及び共起情報抽出部60に適宜指令を送り、必要情報を抽出する。
When the user inputs a keyword from the dedicated terminal, the
(2−8)その他
キーワード抽出部30と、製品情報抽出部40、製品キーワード抽出部50、キーワード・係り受けパターン抽出部55及び共起情報抽出部60は、それぞれ抽出したデータを蓄積する記憶領域を個別に又は共通の記憶装置に有しているものとする。
(2-8) Others The
(3)製品検索装置10の動作
ここでは、3つの動作について説明する。第1の動作は製品検索装置10に各端末から文書データが入力されたときの動作であり、第2の動作は製品検索装置10に各端末から文書名が入力されたときの動作であり、第3の動作は製品検索装置10に端末から検索のためのキーワードが入力されたときの動作である。
(3) Operation of
(3−1)製品検索装置10の第1の動作
図2は、製品検索装置10の第1の動作を表すフローチャートである。ここで、第1の動作とは、製品検索装置10が文書データから「製品キーワードテーブル」を作成するまでの動作である。
(3-1) First Operation of
図2において、統括制御部100は、ステップS1において接続された端末のいずれかから文書データの入力があったか否かを判定し、文書データ入力があったときはステップS2へ進み、文書データ入力がないときは引き続き判定を継続する。
In FIG. 2, the
次に統括制御部100は、ステップS2において入力された文書データを文書データ蓄積部20に蓄積し、ステップS3へ進む。
Next, the
次に統括制御部100は、ステップS3においてキーワード抽出部30を介して、文書データ蓄積部20に蓄積された文書データから文書データ毎にキーワードを抽出し、ステップS4へ進む。
Next, the
次に統括制御部100は、ステップS4において製品情報抽出部40を介して、文書データ蓄積部20に蓄積された文書データから文書データ毎に製品を抽出し、ステップS5へ進む。
Next, the
次に統括制御部100は、ステップS5において製品キーワード抽出部50を介して、ステップS3で抽出したキーワードとステップS4で抽出した製品とから製品キーワードテーブルを作成し記憶する。以下、製品キーワードテーブルについて図面を用いて説明する。
Next, the
図3Aは、製品キーワード抽出部50が作成した製品ID「101」のルームエアコンについての製品キーワードテーブルである。図3Aにおいて、エアコンについて登録されている全190件の品質レポートを対象に作成された製品キーワードテーブルから「ルームエアコン」に関する100件の文書が存在することが判明する。
FIG. 3A is a product keyword table for the room air conditioner with the product ID “101” created by the product
キーワードの欄には、左から同時発生割合の高いキーワードが表示されている。但し、他の品質レポートで抽出されたキーワードと重複するか否かが分かるようにするため、あえて左詰めで表示していない。 In the keyword column, keywords with a high simultaneous occurrence rate are displayed from the left. However, in order to know whether or not it overlaps with a keyword extracted in another quality report, it is not intentionally left-aligned.
例えば、「2014r」文書では、製品名自体がキーワードとなり、キーワード「ルームエアコン」の下に「フィルタ」、「お掃除機能」、「噛み込み」のキーワードが共起している。 For example, in the “2014r” document, the product name itself becomes a keyword, and the keywords “filter”, “cleaning function”, and “biting” co-occur under the keyword “room air conditioner”.
図3Bは、製品キーワード抽出部50が作成した製品ID「201」の業務用エアコンについての製品キーワードテーブルである。図3Bにおいて、エアコンについて登録されている全190件の品質レポートを対象に作成された製品キーワードテーブルから「業務用エアコン」を含む50件の文書が存在することが判明する。
FIG. 3B is a product keyword table for the commercial air conditioner with the product ID “201” created by the product
例えば、「2014g」文書では、キーワード「業務用エアコン」の下にキーワードが「圧縮機」、「モータ」、「ロータ」、「マグネット」などが共起している。 For example, in the “2014g” document, keywords “compressor”, “motor”, “rotor”, “magnet”, and the like co-occur under the keyword “commercial air conditioner”.
図3Cは、製品キーワード抽出部50が作成した製品ID「301」のパーソナル空調機についての製品キーワードテーブルである。図3Cにおいて、エアコンについて登録されている全190件の文書を対象に作成された製品キーワードテーブルから「パーソナル空調機」を含む40件の文書が存在することが判明する。
FIG. 3C is a product keyword table for the personal air conditioner with the product ID “301” created by the product
例えば、「2013p」文書では、キーワード「パーソナル空調機」の下にキーワードが「冷媒」、「漏れ」、「ピンホール」などが共起している。 For example, in the “2013p” document, the keywords “refrigerant”, “leak”, “pinhole”, and the like co-occur under the keyword “personal air conditioner”.
(3−2)製品検索装置10の第2の動作
例えば、図3B「業務用エアコン」の製品キーワードテーブルを見た検索者が、特定の文書データの共起キーワードに着目した場合、さらなる調査を補助するために、製品検索装置10はその文書データのキーワード・係り受けパターンテーブルを作成し、画面上に表示させることができる。つまり、製品検索装置10は文書データごとにキーワード・係り受けパターンテーブルを作成することができる。
(3-2) Second Operation of
図4は、製品検索装置10の第2の動作を表すフローチャートである。ここで、第2の動作とは、製品検索装置10が「製品キーワードテーブル」からキーワード・係り受けパターンテーブルを作成する動作である。
FIG. 4 is a flowchart showing the second operation of the
図4において、統括制御部100は、ステップS11において特定の文書ID又は文書名の入力があったか否かを判定し、文書ID又は文書名のいずれかの入力が有ったときはステップS12へ進み、入力がないときは引き続き判定を継続する。
In FIG. 4, the
次に、統括制御部100は、ステップS12においてキーワード・係り受けパターン抽出部55を介して、入力された文書ID又は文書名の文書データからキーワード・係り受けパターンを抽出し、ステップS13へ進む。
Next, in step S12, the
次に、統括制御部100は、ステップS13においてキーワード・係り受けパターンテーブル(図5A〜図5C参照)を作成し、ステップS14へ進む。
Next, the
そして、統括制御部100は、ステップS14において「キーワード・係り受けパターンテーブル」を検索画面に表示する。以下、「キーワード・係り受けパターンテーブル」について図面を用いて説明する。
Then, in step S14, the
図5Aは、一つの文書データに係るキーワード・係り受けパターンテーブルである。図5Aにおいて、キーワード・係り受けパターンテーブルには、製品ID、文書ID、文書データ作成日時、キーワード、キーワード・係り受けパターンで構成されている。 FIG. 5A is a keyword / dependency pattern table related to one document data. In FIG. 5A, the keyword / dependency pattern table includes a product ID, document ID, document data creation date / time, keyword, keyword / dependency pattern.
図5Aより、文書データは、文書ID「2012QR」及び文書名「2012g」から業務用エアコンの品質レポートであることが分かる。また、キーワード/係り受けパターン表示欄の記載から、「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」「モータ/が駆動しない」、「コイル/が短絡している」のキーワード/係り受けパターンが蓄積されていることが分かる。 From FIG. 5A, it can be seen that the document data is a quality report of a commercial air conditioner from the document ID “2012QR” and the document name “2012g”. In addition, from the description of the keyword / dependency pattern display column, keywords such as “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, and “coil / is shorted”. / It can be seen that dependency patterns are accumulated.
そして、検索者は、キーワード/係り受けパターンから、「ワイヤが短絡して、モータが駆動せず、圧縮機が起動しない」という事象を推測することができる。 Then, the searcher can infer from the keyword / dependency pattern an event that “the wire is short-circuited, the motor does not drive, and the compressor does not start”.
図5Bは、もう一つの文書データに係るキーワード・係り受けパターンテーブルである。図5Bにおいて、キーワード・係り受けパターンテーブルには、製品ID、文書ID、文書データ作成日時、キーワード、キーワード・係り受けパターンで構成されている。 FIG. 5B is a keyword / dependency pattern table related to another document data. In FIG. 5B, the keyword / dependency pattern table includes a product ID, document ID, document data creation date / time, keyword, keyword / dependency pattern.
図5Bより、文書データは、文書ID「2013QR」及び文書名「2013g」から業務用エアコンの品質レポートであることが分かる。また、キーワード/係り受けパターン表示欄の記載から、「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」「モータ/が駆動しない」、「コイル/が断線している」のキーワード/係り受けパターンが蓄積されていることが分かる。 From FIG. 5B, it can be seen that the document data is a quality report of a commercial air conditioner from the document ID “2013QR” and the document name “2013g”. In addition, from the keyword / dependency pattern display column, keywords such as “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, and “coil / is disconnected”. / It can be seen that dependency patterns are accumulated.
そして、検索者は、キーワード/係り受けパターンから、「コイルが断線して、モータが駆動せず、圧縮機が起動しない」と推測することができる。 The searcher can then infer from the keyword / dependency pattern that “the coil is disconnected, the motor does not drive, and the compressor does not start”.
このように、図3Bの製品キーワードテーブルだけでは「コイル」という共起キーワードが同じであるので、品質情報として同じ内容と判断される可能性があったが、図5A及び図5Bそれぞれのキーワード・係り受けパターンまで抽出することによって、さらに詳細な「コイル/が短絡している」という事象と、「コイル/が断線している」という事象まで把握することができる。 As described above, since the co-occurrence keyword “coil” is the same in the product keyword table of FIG. 3B alone, there is a possibility that the content is the same as the quality information. By extracting the dependency pattern, it is possible to grasp even more detailed events such as “the coil / is short-circuited” and “the coil / is disconnected”.
図5Cは、他の文書データに係るキーワード・係り受けパターンテーブルである。図5Cにおいて、文書データは、文書ID「2014QR」及び文書名「2014g」から業務用エアコンの品質レポートであることが分かる。また、キーワード/係り受けパターン表示欄の記載から、「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」「モータ/が駆動しない」、「ロータ/が回転しない」、及び「マグネット/が外れている」のキーワード/係り受けパターンが蓄積されていることが分かる。 FIG. 5C is a keyword / dependency pattern table relating to other document data. In FIG. 5C, it can be seen that the document data is a quality report of a commercial air conditioner from the document ID “2014QR” and the document name “2014g”. In addition, from the description of the keyword / dependency pattern display column, “commercial air conditioner / does not operate”, “compressor / does not start”, “motor / does not drive”, “rotor / does not rotate”, and “magnet” It can be seen that the keyword / dependency pattern of “/ is off” is accumulated.
そして、検索者は、キーワード/係り受けパターンから、「マグネットが外れて、モータが駆動せず、圧縮機が起動しない」と推測することができる。 Then, the searcher can infer from the keyword / dependency pattern that “the magnet is removed, the motor does not drive, and the compressor does not start”.
上記のように、「業務用エアコン/が稼動しない」という同一現象のキーワード・係り受けパターンであっても、文書によって「マグネット/が外れている」という要因のキーワード・係り受けパターンが共起する場合もあれば、「コイル/が短絡している」という要因のキーワード・係り受けパターンが共起する場合もある。 As described above, even if the keyword / dependency pattern of the same phenomenon “business-use air conditioner / does not operate”, the keyword / dependency pattern of the factor “magnet / disengaged” co-occurs depending on the document. In some cases, the keyword / dependency pattern of the factor “coil / short-circuited” may co-occur.
それゆえ、本実施形態では、全文書データを対象にキーワードを抽出するのではなく、文書データ毎にキーワードを抽出し、製品と関連付け、共起キーワードを付与して、キーワード・係り受けパターンを作成している。 Therefore, in this embodiment, instead of extracting keywords for all document data, keywords are extracted for each document data, associated with products, and co-occurrence keywords are assigned to create keywords and dependency patterns. doing.
(3−3)製品検索装置10の第3の動作
ここでは、検索者が「エアコン」の市場クレーム実績調査のために、製品検索装置10の専用端末からキーワード「業務用エアコン」を入力したという想定の下で説明する。
(3-3) Third Operation of
図6は、製品検索装置10の第3の動作を表すフローチャートである。図6において、統括制御部100は、ステップS21においてキーワードの入力があったか否かを判定し、キーワード入力が有ったときはステップS22へ進み、キーワード入力がないときは引き続き判定を継続する。
FIG. 6 is a flowchart showing a third operation of the
次に、統括制御部100は、ステップS22において製品キーワードテーブルの全てのデータを走査して、入力されたキーワードにヒットする製品キーワードテーブルを抽出し、ステップS23へ進む。
Next, the
次に、統括制御部100は、ステップS23において製品キーワードテーブル上のキーワードについてキーワード・係り受けパターンデーブルを抽出し、ステップS24へ進む。
Next, in step S23, the
次に、統括制御部100は、ステップS24において共起情報抽出部60を介して先のステップS22で抽出された「製品キーワードテーブル」に基づき、業務用エアコンの「共起情報テーブル」(図7参照)を作成し、ステップS25へ進む。
Next, the
次に、統括制御部100は、ステップS25において共起情報抽出部60を介して先のステップS24で抽出された業務用エアコンの「共起情報テーブル」を検索端末の画面に表示する。以下、「共起情報テーブル」について図面を用いて説明する。
Next, the
(3−3−1)共起情報テーブルの詳細説明
共起情報抽出部60は、製品キーワード抽出部50が作成した図3A〜図3Cに記載の「製品キーワードテーブル」に基づき、「共起情報テーブル」を作成する。ここでは、図3Bに記載の「製品キーワードテーブル」に基づく「共起情報テーブル」を例として説明する。
(3-3-1) Detailed Description of Co-occurrence Information Table The co-occurrence
図3Bの「製品キーワードテーブル」は、業務用エアコンに関する文書データ毎に業務用エアコンに関連付けられているキーワードに対し共起キーワードを付与した上で作成される。 The “product keyword table” in FIG. 3B is created by assigning a co-occurrence keyword to a keyword associated with a commercial air conditioner for each document data related to the commercial air conditioner.
さらに、図5A、図5B、及び図5Cのキーワード・係り受けパターンテーブルは、図3Bの「製品キーワードテーブル」上のキーワードに基づいて作成されている。 Further, the keyword / dependency pattern tables in FIGS. 5A, 5B, and 5C are created based on the keywords on the “product keyword table” in FIG. 3B.
そして、共起情報抽出部60は、これらのキーワード・係り受けパターンからマトリックス状の共起情報テーブルを作成し、行と列との交点に、行に割り当てられたキーワード・係り受けパターンと列に割り当てられたキーワード・係り受けパターンとが同時発生する割合を表示する。
Then, the co-occurrence
例えば「圧縮機/が起動しない」というキーワード・係り受けパターンに対し、一つの文書データにおいて共起度合いの高い「ロータ/が回転しない」という共起キーワード・係り受けパターンが存在しても、他の文書データでは全く共起せず、業務用エアコンに絞った共起情報テーブルでは、「ロータ/が回転しない」という共起キーワード・係り受けパターンの共起度合いが低くなる場合もある。 For example, for a keyword / dependency pattern “compressor / does not start”, a co-occurrence keyword / dependency pattern “rotor / does not rotate” with a high degree of co-occurrence exists in one document data. In the co-occurrence information table focused on commercial air conditioners, the co-occurrence degree of the co-occurrence keyword / dependency pattern “rotor / does not rotate” may be low.
図7Aは、共起情報抽出部60が作成した共起情報テーブルである。図7Aにおいて、共起情報テーブルの左端列に「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が短絡している」、「コイル/が断線している」、「ロータ/が回転しない」、「マグネット/が外れている」が上から下へ順に列挙されている。
FIG. 7A is a co-occurrence information table created by the co-occurrence
また、共起情報テーブルの上端行に同様にキーワード・係り受けパターンが左から右へ順に列挙されている。 Similarly, keywords and dependency patterns are listed in order from left to right in the top row of the co-occurrence information table.
そして、行と列との交点には、行に割り当てられたキーワード・係り受けパターンと列に割り当てられたキーワード・係り受けパターンとが同時発生する割合が%単位で表示されている。 At the intersection between the row and the column, the ratio of the keyword / dependency pattern assigned to the row and the keyword / dependency pattern assigned to the column is displayed in%.
(3−3−1−1)共起情報テーブルが表す第1の側面
この共起情報テーブルは、2つの側面を表している。第1の側面はキーワード・係り受けパターンから視た共起度合い(同時発生割合)であり、第2の側面は共起キーワード・係り受けパターンから視た共起度合いである。以下、図面を参照しながら具体的に説明する。
(3-3-1-1) First aspect represented by co-occurrence information table This co-occurrence information table represents two aspects. The first aspect is the co-occurrence degree (cooccurrence ratio) viewed from the keyword / dependency pattern, and the second aspect is the co-occurrence degree viewed from the co-occurrence keyword / dependency pattern. Hereinafter, it demonstrates concretely, referring drawings.
先ず、第1の側面である「キーワード・係り受けパターンから視た共起キーワード・係り受けパターンの同時発生割合」を説明する。図7では、背景が網掛け表示されている領域が「キーワード・係り受けパターンから視た共起キーワード・係り受けパターンの同時発生割合」を表示している。 First, “a co-occurrence keyword / dependency pattern occurrence ratio viewed from a keyword / dependency pattern”, which is a first aspect, will be described. In FIG. 7, the area where the background is shaded displays “co-occurrence keyword / dependency pattern simultaneous occurrence ratio viewed from keyword / dependency pattern”.
「業務用エアコン/が稼動しない」の行と「圧縮機/が起動しない」の列との交点に80の数値が表示されている。これは「業務用エアコン/稼動しない」というキーワード・係り受けパターンが100件の文書中に存在し、その内の80件の文書中に「圧縮機/起動しない」が「業務用エアコン/が稼動しない」と共に出現していたという意味である。この場合、「業務用エアコン/が稼動しない」に対して「圧縮機/が起動しない」は共起キーワード・係り受けパターンであって、両者は100件中の80件の文書に共に出現していたので同時発生割合は80%である。 A numerical value of 80 is displayed at the intersection of the row “commercial air conditioner / does not operate” and the column “compressor / does not start”. This is because there is a keyword / dependency pattern of “commercial air conditioner / does not work” in 100 documents, and “compressor / does not start” is “operating air conditioner / does work” in 80 documents. It means that it was appearing with "No". In this case, “compressor / does not start” versus “commercial air conditioner / does not operate” is a co-occurrence keyword / dependency pattern, and both appear in 80 out of 100 documents. Therefore, the rate of simultaneous occurrence is 80%.
また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の65件の文書に「モータ/が駆動しない」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「モータ/が駆動しない」は共起キーワード・係り受けパターンであって、両者は100件のうち65件の文書で共に出現していたので同時発生割合は65%である。 In addition, the keyword / dependency pattern of “Motor / not drive” appeared in 65 documents out of 100 documents in which the keyword / dependency pattern of “business air conditioner / does not operate” appeared. In this case, “Professional air conditioner / does not work” and “Motor / does not drive” are co-occurrence keywords and dependency patterns, and both appear in 65 out of 100 documents. The coincidence rate is 65%.
また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の50件の文書に「コイル/が短絡している」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「コイル/が短絡している」は共起キーワード・係り受けパターンであって、両者は100件のうち25件の文書で共に出現していたので同時発生割合は25%である。 In addition, the keyword / dependency pattern “coil / short-circuited” appeared in 50 documents out of 100 documents where the keyword / dependency pattern “business air conditioner / does not operate” appeared. , “Coil / Short-circuited” is a co-occurrence keyword / dependency pattern with respect to “Professional air conditioner / does not operate”, and both appear in 25 out of 100 documents. Therefore, the simultaneous occurrence rate is 25%.
また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の50件の文書に「コイル/が断線している」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「コイル/が断線している」は共起キーワード・係り受けパターンであって、両者は100件のうち25件の文書で共に出現していたので同時発生割合は25%である。 In addition, the keyword / dependency pattern “coil / disconnected” appears in 50 documents out of 100 documents in which the keyword / dependency pattern “business air conditioner / does not operate” has appeared. In the case of “commercial air conditioner / does not operate”, “coil / disconnected” is a co-occurrence keyword / dependency pattern, and both appear in 25 out of 100 documents. Therefore, the simultaneous occurrence rate is 25%.
また、「業務用エアコン/稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の35件の文書に「ロータ/が回転しない」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「ロータ/が回転しない」は共起キーワード・係り受けパターンであって、両者は100件のうち35件の文書で共に出現していたので同時発生割合は35%である。 In addition, when the keyword / dependency pattern of “rotor / does not rotate” appears in 35 out of 100 documents in which the keyword / dependency pattern of “business air conditioner / does not operate” has appeared , “Rotor / does not rotate” against “commercial air conditioner / does not operate” is a co-occurrence keyword / dependency pattern, both appearing in 35 out of 100 documents at the same time The occurrence rate is 35%.
また、「業務用エアコン/が稼動しない」というキーワード・係り受けパターンが出現した100件の文書の内の30件の文書に「マグネット/が外れている」というキーワード・係り受けパターンが出現していた場合、「業務用エアコン/が稼動しない」に対して「マグネット/が外れている」は共起キーワード・係り受けパターンであって、両者は100件のうち30件の文書で共に出現していたので同時発生割合は30%である。 In addition, the keyword / dependency pattern “magnet / disconnected” appears in 30 documents out of 100 documents where the keyword / dependency pattern “commercial air conditioner / does not operate” has appeared. In this case, “magnet / disengaged” is “co-occurrence keyword / dependency pattern” for “commercial air conditioner / does not operate”, and both appear in 30 out of 100 documents. Therefore, the rate of simultaneous occurrence is 30%.
(3−3−1−2)共起情報テーブルが表す第2の側面
次の、第2の側面である「共起キーワード・係り受けパターンから視た他のキーワード・係り受けパターンの同時発生割合」を説明する。
(3-3-1-2) Second aspect represented by co-occurrence information table The following second aspect is “the ratio of simultaneous occurrence of other keywords / dependency patterns viewed from co-occurrence keywords / dependency patterns” Is explained.
先ず、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が短絡している」、「コイル/が断線している」、「ロータ/が回転しない」及び「マグネット/が外れている」それぞれの行と「業務用エアコン/が稼動しない」の列との全ての交点に100の数値が表示されている。これは業務用エアコンに関する全文書100件から抽出されたキーワード・係り受けパターンであるので、必然的に同時発生割合は100%である。 First, “compressor / does not start”, “motor / does not drive”, “coil / is shorted”, “coil / is disconnected”, “rotor / does not rotate” and “magnet / The numerical value of 100 is displayed at all the intersections between each row of “I am off” and the column of “Commercial air conditioner / not working”. Since this is a keyword / dependency pattern extracted from all 100 documents related to commercial air conditioners, the rate of simultaneous occurrence is inevitably 100%.
ここでは、「圧縮機/が起動しない」の列を例にして説明する。「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の65件の文書に「モータ/が駆動しない」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「モータ/が駆動しない」は共起キーワード・係り受けパターンであって、両者は80件のうち65件の文書で共に出現していたので同時発生割合は81%である。 Here, a description will be given by taking the column of “compressor / not start” as an example. If the keyword / dependency pattern “Motor / not drive” appears in 65 documents out of 80 documents where the keyword / dependency pattern “compressor / does not start” appears, “Compressor / does not start” versus “motor / does not drive” is a co-occurrence keyword / dependency pattern, and both of them appeared in 65 documents out of 80. 81%.
また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の25件の文書に「コイル/が短絡している」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「コイル/が短絡している」は共起キーワード・係り受けパターンであって、両者は80件のうち25件の文書で共に出現していたので同時発生割合は31.5%である。 In addition, the keyword / dependency pattern “coil / short-circuited” appears in 25 of the 80 documents in which the keyword / dependency pattern “compressor / does not start” has appeared. When “compressor / does not start”, “coil / shorted” is a co-occurrence keyword / dependency pattern, and both appear in 25 out of 80 documents. Therefore, the simultaneous occurrence rate is 31.5%.
また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の25件の文書に「コイル/が短絡している」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「コイル/が短絡している」は共起キーワード・係り受けパターンであって、両者は80件のうち25件の文書で共に出現していたので同時発生割合は31.5%である。 In addition, the keyword / dependency pattern “coil / short-circuited” appears in 25 of the 80 documents in which the keyword / dependency pattern “compressor / does not start” has appeared. When “compressor / does not start”, “coil / shorted” is a co-occurrence keyword / dependency pattern, and both appear in 25 out of 80 documents. Therefore, the simultaneous occurrence rate is 31.5%.
また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の35件の文書に「ロータ/が回転しない」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「ロータ/が回転しない」は共起キーワード・係り受けパターンであって、両者は80件のうち35件の文書で共に出現していたので同時発生割合は44%である。 In addition, when the keyword / dependency pattern “rotor / does not rotate” appears in 35 of the 80 documents in which the keyword / dependency pattern “compressor / does not start” appears , “Rotor / does not rotate” for “compressor / does not start” is a co-occurrence keyword / dependency pattern, both appearing together in 35 out of 80 documents. The percentage is 44%.
また、「圧縮機/が起動しない」というキーワード・係り受けパターンが出現した80件の文書の内の30件の文書に「マグネット/が外れている」というキーワード・係り受けパターンが出現していた場合、「圧縮機/が起動しない」に対して「マグネット/が外れない」は共起キーワード・係り受けパターンであって、両者は80件のうち30件の文書で共に出現していたので同時発生割合は38%である。 In addition, the keyword / dependency pattern “magnet / disconnected” appeared in 30 documents out of 80 documents where the keyword / dependency pattern “compressor / does not start” appeared. In this case, “compressor / does not start” and “magnet / does not come off” are co-occurrence keywords and dependency patterns, and both of them appeared in 30 out of 80 documents at the same time. The generation rate is 38%.
なお、図7Aでは、「業務用エアコン/が稼動しない」→「圧縮機/が起動しない」→「モータ/が駆動しない」→「コイルが/短絡している」→「コイルが/断線している」のように係り受け部分を動詞表現しているが、これに限定されるものではなく、図7Bに示すように「業務用エアコン/稼動」→「圧縮機/起動」→「モータ/駆動」→「コイル/短絡」→「コイル/断線」のように係り受け部分を名詞表現してもよい。 In FIG. 7A, “commercial air conditioner / does not operate” → “compressor / does not start” → “motor / does not drive” → “coil is shorted” → “coil is disconnected / broken. The dependency part is expressed as a verb such as “is”, but is not limited to this, and as shown in FIG. 7B, “commercial air conditioner / operation” → “compressor / startup” → “motor / drive” The dependency portion may be expressed as a noun such as “→ coil / short circuit” → “coil / disconnection”.
(3−3−2)
共起情報抽出部60は、キーワード・係り受けパターンからマトリックス状の共起情報テーブルを作成しているが、もちろんこれに限定されるものではなく、「製品キーワードテーブル」のキーワードだけから図8に示すようなマトリックス状の共起情報テーブルを作成してもよい。
(3-3-2)
The co-occurrence
但し、図7A、図7B及び図8の共起情報テーブルの「コイル」というキーワードを対比すれば明らかなように、キーワードだけによる共起情報テーブルは、係り受け部分が異なりキーワードだけが同じものを統合してしまう点に注意する必要がある。 However, as is clear from the comparison of the keyword “coil” in the co-occurrence information tables of FIGS. 7A, 7B, and 8, the co-occurrence information table using only the keywords has different dependency parts and only the keywords are the same. It should be noted that they will be integrated.
その弊害を解消するため、例えばキーワード・係り受けパターンの「コイル/が短絡している」を「コイル」、「短絡」というキーワードとして扱うことによって、キーワード「短絡」が共起情報テーブルに表示される。それを実践したのが、図9に示す共起情報テーブルである。 In order to eliminate this problem, for example, by treating the keyword / dependency pattern “coil / short-circuited” as the keywords “coil” and “short-circuit”, the keyword “short-circuit” is displayed in the co-occurrence information table. The The co-occurrence information table shown in FIG.
図9に示すように、図8の共起情報テーブルのキーワード・係り受けパターンの「コイル/が短絡している」及び「コイル/が断線している」が、「コイル」、「短絡」「断線」というキーワードとして扱われるようになる。 As shown in FIG. 9, the keywords and dependency patterns of the co-occurrence information table of FIG. 8 are “coil / short circuited” and “coil / disconnected” are “coil”, “short circuit”, “ It will be treated as a keyword “disconnection”.
その結果、キーワード「コイル」に共起する「短絡」及び「断線」が見逃されることを防止することができる。 As a result, it is possible to prevent the “short circuit” and the “break” that co-occur on the keyword “coil” from being overlooked.
(3−3−3)キーワードの組
既に説明した[(3−2)製品検索装置10の第2動作]の欄で登場した品質レポート「2012g」及び「2013g」を例に、「キーワードの組」について説明する。
(3-3-3) Keyword Set Taking the quality reports “2012g” and “2013g” that appeared in the section of [(3-2) Second Operation of Product Search Device 10] as described above as an example, “Keyword Set” Will be described.
例えば、品質レポート「2012g」には「業務用エアコンが稼動しない。・・・圧縮機が起動しない。・・・モータが駆動しない。・・・コイルが短絡している。」と記載され、品質レポート「2013g」には「業務用エアコンが稼動しない。・・・圧縮機が起動しない。・・・モータが駆動しない。・・・コイルが断線している。」と記載されていたとする。 For example, the quality report “2012g” states that “commercial air conditioner does not operate .... compressor does not start .... motor does not drive .... coil is shorted.” It is assumed that the report “2013g” states that “the commercial air conditioner does not operate .... the compressor does not start .... the motor does not drive .... the coil is disconnected.”
製品検索装置10の第2動作に従えば、品質レポート「2012g」からは「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が短絡している」のキーワード・係り受けパターンが抽出され、品質レポート「2013g」からは「業務用エアコン/が稼動しない」、「圧縮機/が起動しない」、「モータ/が駆動しない」、「コイル/が断線している」のキーワード・係り受けパターンが抽出される。
According to the second operation of the
また、本実施形態では、「業務用エアコン/稼動」、「圧縮機/起動」、「モータ/駆動」、「コイル/短絡」、「コイル/断線」が[キーワードの組]として抽出される。 In the present embodiment, “commercial air conditioner / operation”, “compressor / startup”, “motor / drive”, “coil / short circuit”, and “coil / disconnection” are extracted as [keyword set].
さらに、品質レポート「2012g」及び「2013g」のいずれかに「業務用エアコンが稼動することは、必ずしも圧縮機が起動することを意味しない。」という記載があった場合、「業務用エアコン/が稼動する」及び「圧縮機/が起動する」というキーワード・係り受けパターンが抽出され、「業務用エアコン/稼動/圧縮機/起動」がキーワードの組となる。 Further, if any of the quality reports “2012g” and “2013g” has a description that “the operation of the commercial air conditioner does not necessarily mean that the compressor is activated”, “the commercial air conditioner / The keywords and dependency patterns “operating” and “compressor / activate” are extracted, and “commercial air conditioner / operation / compressor / activation” becomes a set of keywords.
上記のようなキーワードの組は、成立困難性で言えば、同一文書の共起キーワード群→同一文のキーワードの組→キーワード・係り受けパターンの組の順で成立が困難になる。 In terms of the difficulty of establishment, the above keyword combinations are difficult to establish in the order of co-occurrence keyword group of the same document → keyword group of the same sentence → keyword / dependency pattern group.
つまり、検索者が検索初期に業務用エアコンについて「コイル」というキーワードを入力した場合、図8に示すように、50件の品質レポートが存在することを知ることになる。これに対し、業務用エアコンについて「コイル/短絡」というキーワードの組を入力した場合、係り受けパターンまで知らなくても、図7Bに示すように、当初から25件の品質レポートに絞り込まれるので、品質問題の核心により速く行きつくことができる。 That is, when the searcher inputs the keyword “coil” for the commercial air conditioner at the initial stage of the search, it is known that there are 50 quality reports as shown in FIG. On the other hand, if you enter the keyword set “Coil / Short” for commercial air conditioners, you can narrow down to 25 quality reports from the beginning, as shown in FIG. 7B, without knowing the dependency pattern. You can get to the core of quality issues faster.
したがって、キーワードで検索する場合は共起元が多い単一キーワードによる検索よりも、キーワードと係り受けとの間の文章の共起を利用した「キーワードの組」による検索の方が有効であり、検索対象の母数が大きい場合に有益である。 Therefore, when searching by keyword, a search by “keyword pair” using the co-occurrence of sentences between the keyword and the dependency is more effective than a search by a single keyword having many co-occurrence sources. This is useful when the search target parameter is large.
(3−3−4)キーワード製品マップの説明
図10は、製品検索装置10が検索端末の画面に表示する「キーワード製品マップ」である。図10において、キーワード製品マップは、上位キーワード「業務用エアコン」に関する製品情報がタイプA、タイプB及びタイプCの3種について存在することを表示する。それと同時に、全製品情報に共通して「圧縮機」という共起キーワードが高い頻度で出現していることが理解できる。
(3-3-4) Description of Keyword Product Map FIG. 10 is a “keyword product map” displayed on the screen of the search terminal by the
(4)その他の動作
製品検索装置10は、ユーザーが検索端末から所定の操作をすることによって、製品別の「製品キーワードテーブル」、製品別の「共起情報テーブル」、及び「キーワード製品マップ」を画面に個別に表示させることができる。
(4) Other operations The
(5)特徴
(5−1)
製品検索装置10では、製品別の共起情報テーブル内の一のキーワード・係り受けパターンと他のキーワード・係り受けパターンとの「結びつき」を一覧することができるので、キーワードに対して他にどのような情報(共起情報)で調査するべきかを知ることができる。
(5) Features (5-1)
The
(5−2)
その際、キーワード・係り受けパターン間の「結びつき度合い」をそれらの「同時発生割合」という数字で把握することができる。
(5-2)
At that time, the “degree of connection” between the keywords and the dependency patterns can be grasped by the number of the “simultaneous occurrence ratio”.
(6)変形例
(6−1)
上記実施形態では、キーワード・係り受けパターンと共起キーワード・係り受けパターンとの同時発生割合の大きさに関係なく「製品キーワードテーブル」又は「共起情報テーブル」に蓄積することを前提に説明したが、これに限定されるものではない。
(6) Modification (6-1)
The above embodiment has been described on the assumption that the keyword / dependency pattern and the co-occurrence keyword / dependency pattern are stored in the “product keyword table” or the “co-occurrence information table” regardless of the size of the simultaneous occurrence ratio. However, the present invention is not limited to this.
例えば、キーワードと共起キーワードとの同時発生割合の大きさが閾値未満のものを蓄積しないことによって、陳腐化した情報の排除、記憶容量の増大化抑制を図ることができる。 For example, by not accumulating keywords and co-occurrence keywords that have a co-occurrence ratio less than a threshold value, it is possible to eliminate obsolete information and to suppress an increase in storage capacity.
(6−2)
また、上記実施形態では、キーワード・係り受けパターンと共起キーワード・係り受けパターンとの同時発生割合の大きさに関係なく「製品キーワードテーブル」又は「共起情報テーブル」に表示することを前提に説明したが、これに限定されるものではない。
(6-2)
In the above embodiment, it is assumed that the keyword / dependency pattern and the co-occurrence keyword / dependency pattern are displayed in the “product keyword table” or the “co-occurrence information table” regardless of the size of the simultaneous occurrence ratio. Although described, the present invention is not limited to this.
例えば、製品検索装置10では、同時発生割合があまりにも低く共起とは言えないようなキーワード・係り受けパターンの表示を控えることもできる。これによって、絞り込みを容易にすることができる。
For example, the
(6−3)
共起情報をシステム側でグループ化することによって、人手によるグループ化の工数を削減することができる。そのために、図11に示すように、製品検索装置10が、共起情報抽出部60が作成した製品別の共起情報からキーワード又はキーワード・係り受けパターンの体系化を行い抽出する体系化情報抽出部71をさらに備えることも可能である。
(6-3)
By grouping co-occurrence information on the system side, it is possible to reduce man-hours for grouping manually. Therefore, as shown in FIG. 11, systematic information extraction in which the
(6−4)
期間を区切り、製品が持つホットキーワードを示してもよい。そのために、図11に示すように、製品に関連付けられているキーワードからホットキーワードのマップを作成して抽出する、ワードマップ作成部73をさらに備えることも可能である。
(6-4)
The hot keywords of the product may be indicated by dividing the period. Therefore, as shown in FIG. 11, it is possible to further include a word
(7)その他
(7−1)
作成者は、外部から指定する場合もある。外部とは、「UI入力」、「ファイルと作成者との対応ファイル」、「ファイルの所有者を特定している文書」という形式が挙げられる。
(7) Others (7-1)
The creator may be designated from the outside. Examples of the external include “UI input”, “corresponding file between file and creator”, and “document specifying the owner of the file”.
(7−2)
「製品キーワードテーブル」および「共起情報テーブル」は画面への表示の有無に関係なくCPU内で作成され、短期間又は長期間、所定の記憶領域に保存される。
(8)他の実施形態
上記実施形態では、原則、同一ドキュメント/1ファイル中に同時に出現しているキーワードが共起となっているものを「共起キーワード」として扱っている。
(7-2)
The “product keyword table” and the “co-occurrence information table” are created in the CPU regardless of whether or not they are displayed on the screen, and are stored in a predetermined storage area for a short period or a long period.
(8) Other Embodiments In the above embodiments, in principle, keywords that appear simultaneously in the same document / one file are treated as “co-occurrence keywords”.
しかし、検索対象となる文書には、サポートメールのような伝達性を重視して、短い文章で端的に記載されるものもある。この場合、検索して何らかの出力を形成するためのデータが一文書データから得られるのか否か問題になる。この問題については、以下のような方法で解決することができる。 However, some documents to be searched are briefly described in short sentences with an emphasis on communication such as support mail. In this case, it becomes a problem whether data for searching to form some output is obtained from one document data. This problem can be solved by the following method.
例えば、サポートセンターへの問い合わせをする際のサポートメールの場合、発生するシーンで関係する事象をまとめる、という方法を採ることができる。具体例として、パソコンのサポートセンターに送られてくるサポートメールを、保存時、起動時、復電時と言った発生シーン毎に分類し、分類された単位を対象に共起情報テーブルを作成することによって、有用なデータが形成される。 For example, in the case of a support mail when making an inquiry to the support center, it is possible to adopt a method of collecting related events in the scene that occurs. As a specific example, the support email sent to the PC support center is categorized according to the occurrence scene, such as when saving, starting, and when power is restored, and a co-occurrence information table is created for the classified units. As a result, useful data is formed.
10 製品検索装置
30 キーワード抽出部
40 製品情報抽出部
50 製品キーワード抽出部
55 キーワード・係り受けパターン抽出部
60 共起情報抽出部
71 体系化情報抽出部
73 ワードマップ作成部
DESCRIPTION OF
Claims (13)
前記文書データから前記文書データ毎に製品の特定情報を抽出する製品情報抽出部(40)と、
前記文書データ毎に前記製品と前記キーワードとの関連付け情報を作成して抽出する製品キーワード抽出部(50)と、
前記文書データ毎に前記製品に関連付けられている前記キーワードに対し共起キーワードを付与して製品別の共起情報を作成して抽出する共起情報抽出部(60)と、
を備える、
製品検索装置(10)。 A keyword extraction unit (30) for extracting a keyword for each document data from a large number of accumulated document data including mail;
A product information extraction unit (40) for extracting product specific information for each document data from the document data;
A product keyword extraction unit (50) for creating and extracting association information between the product and the keyword for each document data;
A co-occurrence information extracting unit (60) that creates a co-occurrence information for each product by adding a co-occurrence keyword to the keyword associated with the product for each document data; and
Comprising
Product search device (10).
請求項1に記載の製品検索装置(10)。 A keyword / dependency pattern extraction unit (55) for creating and extracting a dependency pattern based on the extracted keyword;
The product search device (10) according to claim 1.
請求項1又は請求項2に記載の製品検索装置(10)。 The co-occurrence information extraction unit (60) assigns at least one co-occurrence keyword to the keyword.
The product search device (10) according to claim 1 or 2.
請求項1から請求項3のいずれか1項に記載の製品検索装置(10)。 The co-occurrence information extraction unit (60) creates a co-occurrence information table that represents a keyword group in the co-occurrence information in a matrix.
The product search device (10) according to any one of claims 1 to 3.
請求項4に記載の製品検索装置(10)。 The co-occurrence information table displays the rate at which the keyword assigned to the row and the keyword assigned to the column occur simultaneously at the intersection of the row and the column.
The product search device (10) according to claim 4.
請求項4又は請求項5に記載の製品検索装置(10)。 The co-occurrence information extraction unit (60) calculates a rate at which one keyword and another keyword in the co-occurrence information are simultaneously generated, and calculates the co-occurrence information in which the rate at which the co-occurrence occurs is a predetermined value or more. Accumulate in the co-occurrence information table;
The product search device (10) according to claim 4 or 5.
請求項1から請求項6のいずれか1項に記載の製品検索装置(10)。 The co-occurrence information extraction unit (60) calculates a rate at which one keyword and another keyword in the co-occurrence information are simultaneously generated, and calculates the co-occurrence information in which the rate at which the co-occurrence occurs is a predetermined value or more. indicate,
The product search device (10) according to any one of claims 1 to 6.
請求項1から請求項6のいずれか1項に記載の製品検索装置(10)。 The keyword extraction unit (30) determines the quantity of the keywords to be extracted for each document data.
The product search device (10) according to any one of claims 1 to 6.
請求項2から請求項6のいずれか1項に記載の製品検索装置(10)。 The keyword / dependency pattern extraction unit (55) determines the quantity of the keyword / dependency pattern to be extracted for each document data.
The product search device (10) according to any one of claims 2 to 6.
請求項1から請求項6のいずれか1項に記載の製品検索装置(10)。 The keyword extraction unit (30) determines an upper limit of the quantity of the keywords extracted from one document data according to the size of the document data.
The product search device (10) according to any one of claims 1 to 6.
請求項2から請求項6のいずれか1項に記載の製品検索装置(10)。 The keyword / dependency pattern extraction unit (55) determines the upper limit of the quantity of the keyword / dependency pattern extracted from one document data according to the size of the document data.
The product search device (10) according to any one of claims 2 to 6.
請求項2から請求項11のいずれか1項に記載の製品検索装置(10)。 A systematic information extracting unit (71) for systematizing and extracting the keyword or the keyword / dependency pattern from the co-occurrence information for each product created by the co-occurrence information extracting unit (60);
The product search device (10) according to any one of claims 2 to 11.
請求項1から請求項12のいずれか1項に記載の製品検索装置(10)。 A word map creation unit (73) for creating and extracting a hot keyword map from the keywords associated with the product;
The product search device (10) according to any one of claims 1 to 12.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015206971A JP2017078976A (en) | 2015-10-21 | 2015-10-21 | Product retrieval device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015206971A JP2017078976A (en) | 2015-10-21 | 2015-10-21 | Product retrieval device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017078976A true JP2017078976A (en) | 2017-04-27 |
Family
ID=58665446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015206971A Pending JP2017078976A (en) | 2015-10-21 | 2015-10-21 | Product retrieval device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017078976A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7032582B1 (en) | 2021-01-29 | 2022-03-08 | Kpmgコンサルティング株式会社 | Information analysis program, information analysis method and information analysis device |
-
2015
- 2015-10-21 JP JP2015206971A patent/JP2017078976A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7032582B1 (en) | 2021-01-29 | 2022-03-08 | Kpmgコンサルティング株式会社 | Information analysis program, information analysis method and information analysis device |
JP2022117019A (en) * | 2021-01-29 | 2022-08-10 | Kpmgコンサルティング株式会社 | Information analysis program, information analysis method, and information analysis device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20130021355A1 (en) | Method and system for displaying proiritized live thumbnail of process graphic views | |
JP6346218B2 (en) | Search method, apparatus and server for online trading platform | |
JP2019197551A (en) | Designing assist system | |
KR20140108721A (en) | Sequence program creation device | |
CN103168299A (en) | Information display | |
JP2018206316A (en) | Plant operation monitoring system and plant operation monitoring method | |
JP5185402B2 (en) | Document search apparatus, document search method, and document search program | |
CN110008395B (en) | Comment content presentation method and device, storage medium and terminal | |
JP2013041385A (en) | Document retrieval method, document retrieval device, and document retrieval program | |
JP2017078976A (en) | Product retrieval device | |
JP4992301B2 (en) | Search processing method and apparatus | |
JP5980723B2 (en) | Emergency know-how reference support method, emergency know-how reference support device, and emergency know-how reference support program | |
JP6149836B2 (en) | Human resource search device | |
JPH11238069A (en) | Component selection device | |
JP2008197976A (en) | Connection information generation program and connection information generation method | |
JP5088016B2 (en) | Traceability management device | |
JP2005128872A (en) | Document retrieving system and document retrieving program | |
WO2018084226A1 (en) | Document search method and device | |
CN103473228A (en) | Method and device for displaying related keywords | |
CN104461224A (en) | Information processing method and electronic device | |
JP2015026167A (en) | Alarm management system and alarm management method | |
JP2007156928A (en) | Design support program, design support method, and design support system | |
JP5444071B2 (en) | Fault information collection system, method and program | |
JP2006244298A (en) | Text mining method and device | |
JP6746550B2 (en) | INFORMATION SEARCH DEVICE, INFORMATION SEARCH METHOD, AND PROGRAM |