JP2005165754A - Text mining analysis apparatus, text mining analysis method, and text mining analysis program - Google Patents
Text mining analysis apparatus, text mining analysis method, and text mining analysis program Download PDFInfo
- Publication number
- JP2005165754A JP2005165754A JP2003404793A JP2003404793A JP2005165754A JP 2005165754 A JP2005165754 A JP 2005165754A JP 2003404793 A JP2003404793 A JP 2003404793A JP 2003404793 A JP2003404793 A JP 2003404793A JP 2005165754 A JP2005165754 A JP 2005165754A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- comparison
- text mining
- feature
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 220
- 238000005065 mining Methods 0.000 title claims abstract description 123
- 238000010835 comparative analysis Methods 0.000 claims description 26
- 230000010365 information processing Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 31
- 238000000034 method Methods 0.000 description 25
- 238000012545 processing Methods 0.000 description 23
- 230000008859 change Effects 0.000 description 6
- 238000007405 data analysis Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000002354 daily effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、日々蓄積されるテキストデータを分析して有益な情報を抽出するテキストマイニング技術に関し、特に複数の分析結果を比較・編集することにより、定点観測的な分析及び特徴的な傾向の出現を検知可能とするテキストマイニング分析装置、テキストマイニング分析方法、及びテキストマイニング分析プログラムに関する。 The present invention relates to a text mining technique for extracting useful information by analyzing text data accumulated every day, and in particular, by comparing and editing a plurality of analysis results, a fixed point observation analysis and appearance of a characteristic tendency The present invention relates to a text mining analysis apparatus, a text mining analysis method, and a text mining analysis program.
従来、電子化され日々蓄積されるテキストを含むデータ(以下、単にテキストデータと称する。)、例えば、コンタクトセンタに寄せられる問い合わせ履歴や顧客満足度調査アンケートなどは、顧客からの生の声として、企業等の活動にフィードバックして利用されている。
このようなテキストデータは、一般に日次や月次などのタイミングで整理され、様々な分析に利用されており、企業等におけるマーケティングや製品開発、営業活動等に有効に活用可能なものとして注目されている。
このため、このようなテキストデータにもとづき有益な情報を抽出する技術として、種々のテキストマイニング分析技術が提案されている。
Conventionally, data including text that is digitized and accumulated every day (hereinafter simply referred to as text data), for example, inquiry histories sent to contact centers and customer satisfaction survey questionnaires, etc. as raw voices from customers, It is used as feedback in the activities of companies.
Such text data is generally organized at daily and monthly timings, and is used for various analyses, and is attracting attention as being useful for marketing, product development, and sales activities in companies. ing.
For this reason, various text mining analysis techniques have been proposed as techniques for extracting useful information based on such text data.
例えば、自然言語による自由回答記述を含むアンケート回答文をインターネット等のネットワークを通じて自動的に収集して分析し、分析結果をルール形式の知識として要求者に配信することが可能なテキストマイニング分析技術などが提案されている(例えば、特許文献1参照。)。
また、日々蓄積されるテキストデータの傾向を明らかにし、特徴的な個々のデータを発見することが可能なテキストマイニング分析技術なども提案されている(例えば、特許文献2参照。)。
さらに、文書集合の内容を複数の視点から分析することが可能なテキストマイニング機能を提供することにより、文書集合の傾向を容易に分析することの可能なテキストマイニング分析技術なども提案されている(例えば、特許文献3参照。)。
For example, text mining analysis technology that can automatically collect and analyze questionnaire response sentences including free answer descriptions in natural language, and distribute the analysis results to the requester as rule format knowledge Has been proposed (see, for example, Patent Document 1).
In addition, a text mining analysis technique capable of clarifying the tendency of text data accumulated every day and finding characteristic individual data has been proposed (for example, see Patent Document 2).
In addition, a text mining analysis technique that can easily analyze the tendency of a document set by providing a text mining function that can analyze the contents of a document set from a plurality of viewpoints has been proposed ( For example, see
しかしながら、これらの従来のテキストマイニング技術によれば、個々の分析において特徴情報を抽出したり分類することはできるものの、これら複数の分析結果を比較することができないという問題があった。例えば、今月初めて現れたトピックスは何かなどという気づきについては、各々の分析結果を人手で付き合わせる必要があるという問題があった。
また、別のタイミングで分析済みの結果を再利用することができないため、この分析済みの対象データも含めた分析を実施したい場合は、この対象データも含めた分析データを準備して再度テキストマイニング分析を実施する必要があり、分析に多大な時間を要するという問題があった。
However, according to these conventional text mining techniques, although feature information can be extracted and classified in each analysis, there is a problem in that these analysis results cannot be compared. For example, there was a problem that it was necessary to manually associate each analysis result with regard to the awareness of the topic that first appeared this month.
In addition, since the analyzed results cannot be reused at different timings, if you want to perform an analysis that includes this analyzed target data, prepare the analytical data that also includes this target data, and then perform text mining again. There is a problem that it is necessary to carry out the analysis and it takes a lot of time for the analysis.
本発明は、上記の事情にかんがみなされたものであり、複数のテキストマイニング分析結果にもとづいて、その分析結果間の差異や特徴点を抽出し、これらを表示する比較結果を出力することで、テキストデータの定点観測的な分析及び特徴的な傾向の出現を検知可能とするテキストマイニング分析装置、テキストマイニング分析方法、及びテキストマイニング分析プログラムの提供を目的とする。 The present invention is considered in view of the above circumstances, based on a plurality of text mining analysis results, extracting differences and feature points between the analysis results, and outputting a comparison result for displaying these, It is an object of the present invention to provide a text mining analysis apparatus, a text mining analysis method, and a text mining analysis program that can detect fixed point observation of text data and the appearance of a characteristic tendency.
上記目的を達成するため、本発明のテキストマイニング分析装置は、二以上のテキストデータと、各テキストデータをテキストマイニング分析する特徴分析実行手段と、この分析によって得られた特徴語及びこの特徴語に対応する一又は二以上の所定の特徴度を保有する二以上の分析結果データとを備えたテキストマイニング分析装置であって、入力情報にもとづき比較分析の対象とする分析結果データを選択し、選択した分析結果データにもとづき比較一覧を作成し、入力情報にもとづき比較条件を設定して、比較条件に従って比較一覧に対する比較分析を実行し、比較分析による比較結果を出力する比較手段を有する構成としてある。 In order to achieve the above object, a text mining analyzer of the present invention includes two or more text data, a feature analysis execution means for text mining analysis of each text data, a feature word obtained by this analysis, and a feature word A text mining analyzer that includes two or more analysis result data having one or more corresponding predetermined features, and selects and selects analysis result data to be subjected to comparative analysis based on input information A comparison list is created based on the analysis result data, a comparison condition is set based on the input information, a comparison analysis is performed on the comparison list according to the comparison condition, and a comparison result is output according to the comparison analysis. .
テキストマイニング分析装置をこのような構成にすれば、現在のテキストデータに対してテキストマイニング分析を実行することができるのみならず、過去にわたって分析した結果を流用して、分析結果間の比較分析を行うことができるため、リスクやトレンドなどについての気づきや発見等を効率的に行うことが可能となる。
企業においては、顧客の声を分析して、事業活動に活かすことが一般的に行われているが、顧客からの情報を収集するコンタクトセンタに集まるテキストデータは膨大な量となる場合が多い。
If the text mining analyzer is configured in this way, not only text mining analysis can be performed on the current text data, but also the analysis results over the past can be used to perform comparative analysis between the analysis results. Since it can be performed, it becomes possible to efficiently recognize and discover risks and trends.
Enterprises generally analyze customer feedback and use it in business activities, but the amount of text data gathered at a contact center that collects information from customers is often enormous.
例えば、同一月についての10年間の比較を実施しようとした場合、従来のテキストマイニング分析技術によれば、10年分のデータを対象としてテキストマイニング分析を再実行する必要があるため、その分析に使用する必要のあるリソースは甚大なものであった。
本発明によれば、過去に行われた分析結果を利用してテキストマイニング分析を行うことができ、従来の分析技術に比較して、極めて迅速に効果的なテキストマイニング分析を実現することが可能となる。
なお、所定の特徴度とは、例えば、対応する特徴語の出現頻度や各種統計尺度等を意味するものである。
For example, when trying to perform a 10-year comparison for the same month, according to the conventional text mining analysis technology, it is necessary to re-execute the text mining analysis for 10 years of data. The resources that need to be used were enormous.
According to the present invention, it is possible to perform text mining analysis using analysis results performed in the past, and it is possible to realize effective text mining analysis very quickly compared to conventional analysis techniques. It becomes.
The predetermined feature level means, for example, the appearance frequency of various feature words, various statistical scales, and the like.
また、本発明のテキストマイニング分析装置は、比較手段が、比較条件の設定において、入力情報にもとづいて、比較一覧における分析結果データの一をターゲットとして選択するとともに、このターゲットについての比較対象とする一又は二以上の分析結果データを比較一覧の中から指定し、比較分析の実行において、ターゲットに存在するが、比較対象とする分析結果データに存在しない特徴語を、新出単語として検出し、比較結果の出力において、新出単語を強調表示する比較結果を出力する構成としてある。 In the text mining analyzer of the present invention, the comparison means selects one of the analysis result data in the comparison list as a target based on the input information in setting the comparison condition, and sets the comparison target for this target. Specify one or more analysis result data from the comparison list, and detect the feature words that are present in the target but not in the analysis result data to be compared as new words in the comparison analysis. In the output of the comparison result, the comparison result for highlighting the new word is output.
テキストマイニング分析装置をこのような構成にすれば、例えば最新の顧客の声として入力されたテキストデータにもとづき作成された分析結果をターゲットとして選択し、この分析結果を、過去の所定期間に得られた分析結果と比較することにより、新たに出現した特徴語を把握することができ、最新のトレンドなどを効率的に把握することが可能となる。
また、このような比較特徴として得られる結果が、強調表示されるため、すなわち、直感的に把握されやすい形式で出力されて可視化されるため、分析者だけでなく、例えば企業における現場担当者全員に対しても比較結果のフィードバックを容易に行うことができ、比較結果の活用を促進することが可能となる。
If the text mining analyzer is configured in this way, for example, an analysis result created based on text data input as the latest customer voice can be selected as a target, and the analysis result can be obtained in a predetermined period in the past. Compared with the analysis results, it is possible to grasp newly appearing feature words and efficiently grasp the latest trends and the like.
In addition, because the results obtained as such comparison features are highlighted, that is, output and visualized in a format that is easy to grasp intuitively, not only analysts, but also all on-site personnel in the company, for example Therefore, the comparison result can be easily fed back, and the use of the comparison result can be promoted.
また、本発明のテキストマイニング分析装置は、比較手段が、比較条件の設定において、入力情報にもとづいて、比較一覧の中から一又は二以上の分析対象とする特徴語を選択し、比較分析の実行において、比較一覧におけるすべての分析対象とする特徴語を検出して、比較結果の出力において、検出された分析対象とする特徴語を強調表示する比較結果を出力する構成としてある。 In the text mining analysis apparatus of the present invention, the comparison unit selects one or more feature words to be analyzed from the comparison list based on the input information in setting the comparison condition, and performs comparison analysis. In the execution, all the feature words to be analyzed in the comparison list are detected, and in the output of the comparison result, the comparison result for highlighting the detected feature words to be analyzed is output.
テキストマイニング分析装置をこのような構成にすれば、分析者は、注目するキーワードなどが現在又は過去の分析結果において、どのような状況で出現しているのかを容易に把握することができ、その出現状況の変化などを効率的に捉えることが可能となる。 If the text mining analyzer is configured in this way, the analyst can easily grasp the situation in which the keyword of interest appears in the current or past analysis results. It is possible to efficiently capture changes in the appearance status.
また、本発明のテキストマイニング分析装置は、比較手段が、比較結果の出力において、検出された分析対象とする特徴語に対応する特徴度を、比較一覧における分析結果データごとに表示するグラフを出力する構成としてある。
テキストマイニング分析装置をこのような構成にすれば、注目するキーワードなどが現在又は過去の分析結果において、どのような状況で出現しているのかをグラフにより明示することができるため、分析者に対して、トレンド等の把握に効果的に利用可能な比較結果を提供することが可能となる。
In the text mining analysis apparatus of the present invention, the comparison unit outputs a graph that displays, for each analysis result data in the comparison list, the feature degree corresponding to the detected feature word to be analyzed in the output of the comparison result. It is as composition to do.
If the text mining analyzer is configured in this way, it is possible to clearly indicate in what situation the keyword of interest has appeared in the current or past analysis results, so that Thus, it is possible to provide a comparison result that can be effectively used for grasping trends and the like.
また、本発明のテキストマイニング分析装置は、入力情報にもとづいて、所定のアラーム出力基準を設定し、比較一覧又は比較結果からアラーム出力基準を満たす特徴語を検出して、当該特徴語についてのアラーム情報を出力するアラーム出力手段を有する構成としてある。
テキストマイニング分析装置をこのような構成にすれば、分析者は、特に把握したい各種指標にもとづく比較結果について、アラームを出力することができるため、このような比較結果を明確に認識することが可能となる。
例えば、出現頻度の増加率が所定以上の大きさである特徴語が出現した場合に、アラームを出力するように設定しておくことなどによって、分析者は、トレンドやリスク等を一層効果的に把握することが可能となる。
Further, the text mining analyzer of the present invention sets a predetermined alarm output criterion based on input information, detects a feature word satisfying the alarm output criterion from a comparison list or a comparison result, and generates an alarm for the feature word. An alarm output means for outputting information is provided.
If the text mining analyzer is configured in this way, the analyst can output an alarm on the comparison results based on the various indicators that he or she wants to grasp, so that the comparison results can be clearly recognized. It becomes.
For example, if a feature word with an increase rate of appearance frequency larger than a predetermined value appears, the analyst can set trends and risks more effectively by setting an alarm to be output. It becomes possible to grasp.
また、本発明のテキストマイニング分析装置は、比較手段又はアラーム出力手段が、比較結果又はアラーム情報を、当該テキストマイニング分析装置に備えられた出力装置又は当該テキストマイニング分析装置に有線又は無線で接続された情報処理装置に出力する構成としてある。
テキストマイニング分析装置をこのような構成にすれば、分析者は、比較結果をテキストマイニング分析装置のディスプレイで確認したり、印刷することができる。また、この比較結果を、通信回線を介して、例えば、企業部門EIP(Enterprise Information Portal)といった情報共有システムに送信することにより、テキストマイニング分析装置から入力された気づき情報としてのアラーム情報を、速報アラームなどとして活用することが可能となる。
In the text mining analyzer of the present invention, the comparison means or the alarm output means is connected to the output device provided in the text mining analyzer or the text mining analyzer by wire or wirelessly the comparison result or alarm information. The information is output to the information processing apparatus.
If the text mining analyzer is configured in this way, the analyst can check the comparison result on the display of the text mining analyzer or print it. Further, by sending the comparison result to an information sharing system such as an enterprise division EIP (Enterprise Information Portal) via a communication line, alarm information as notice information input from the text mining analyzer is quickly reported. It can be used as an alarm.
また、本発明のテキストマイニング分析装置は、比較手段が、比較一覧における特徴語の選択入力を受けると、この選択された特徴語の抽出元であるテキストデータの情報を表示する構成としてある。
テキストマイニング分析装置をこのような構成にすれば、分析者は、比較一覧や比較結果に表示された分析結果における特徴語が、どのようなテキストデータに記載されているものであるのかを参照することができ、新出単語や注目キーワードなどにもとづいて、顧客の声を把握することが可能となる。
In the text mining analysis apparatus of the present invention, when the comparison unit receives the selection input of the feature word in the comparison list, the text mining analysis apparatus displays the information of the text data from which the selected feature word is extracted.
When the text mining analyzer is configured in this way, the analyst refers to what text data the feature word in the analysis result displayed in the comparison list or comparison result is described in. The customer's voice can be grasped based on a new word or a keyword of interest.
また、本発明のテキストマイニング分析方法は、二以上のテキストデータと、各テキストデータをテキストマイニング分析する特徴分析実行手段と、この分析によって得られた特徴語及びこの特徴語に対応する一又は二以上の所定の特徴度を保有する二以上の分析結果データとを備えたテキストマイニング分析装置を用いて、分析結果データの比較分析を行うテキストマイニング分析方法であって、テキストマイニング分析装置が、入力情報にもとづき比較分析の対象とする分析結果データを選択し、選択した分析結果データにもとづき比較一覧を作成し、入力情報にもとづき比較条件を設定して、比較条件に従って比較一覧に対する比較分析を実行し、比較分析による比較結果を出力する方法としてある。 The text mining analysis method of the present invention includes two or more text data, a feature analysis execution means for text mining analysis of each text data, a feature word obtained by this analysis, and one or two corresponding to the feature word. A text mining analysis method for performing a comparative analysis of analysis result data using a text mining analysis device having two or more analysis result data possessing the above-mentioned predetermined features. Select analysis result data to be subjected to comparative analysis based on information, create a comparison list based on the selected analysis result data, set comparison conditions based on input information, and execute comparison analysis on comparison list according to comparison conditions This is a method for outputting a comparison result by comparative analysis.
また、本発明のテキストマイニング分析方法は、テキストマイニング分析装置が、入力情報にもとづいて、所定のアラーム出力基準を設定し、比較一覧からアラーム出力基準を満たす特徴語を検出して、当該特徴語についてのアラーム情報を出力する方法としてある。 Further, according to the text mining analysis method of the present invention, the text mining analyzer sets a predetermined alarm output criterion based on the input information, detects a feature word satisfying the alarm output criterion from the comparison list, and detects the feature word. As a method of outputting alarm information about
テキストマイニング分析方法をこのような方法にすれば、過去にわたって分析した結果を流用して、分析結果間の比較分析を行うことができるため、リスクやトレンドなどについての気づきや発見等を効率的に行うことが可能となる。
すなわち、このように過去の分析結果を利用することにより、過去のテキストデータを含めた分析を行う場合に、これらのテキストデータを用いて再度テキストマイニング分析を実行する必要がないため、分析に使用するリソースを低減でき、極めて迅速な分析を実現することが可能となる。
さらに、比較分析の結果が所定の基準を満たした場合にアラームを出力することができ、分析者は、リスクやトレンドなどをより効果的に把握することが可能となる。
If the text mining analysis method is used in this way, the analysis results obtained over the past can be used to perform comparative analysis between the analysis results, so that awareness and discovery of risks and trends can be efficiently performed. Can be done.
In other words, by using past analysis results in this way, when performing analysis including past text data, there is no need to perform text mining analysis again using these text data. Resources can be reduced, and extremely quick analysis can be realized.
Furthermore, an alarm can be output when the result of the comparative analysis satisfies a predetermined standard, and the analyst can more effectively grasp risks and trends.
また、本発明のテキストマイニング分析プログラムは、二以上のテキストデータと、各テキストデータをテキストマイニング分析する特徴分析実行手段と、この分析によって得られた特徴語及びこの特徴語に対応する一又は二以上の所定の特徴度を保有する二以上の分析結果データとを備えたテキストマイニング分析装置に、分析結果データの比較分析を行わせるテキストマイニング分析プログラムであって、テキストマイニング分析装置に、入力情報にもとづき比較分析の対象とする分析結果データを選択させ、選択された分析結果データにもとづき比較一覧を作成させ、入力情報にもとづき比較条件を設定させて、比較条件に従って比較一覧に対する比較分析を実行させ、比較分析による比較結果を出力させる構成としてある。 The text mining analysis program of the present invention includes two or more text data, a feature analysis execution means for text mining analysis of each text data, a feature word obtained by this analysis, and one or two corresponding to the feature word. A text mining analysis program that causes a text mining analysis device having two or more analysis result data possessing the above predetermined features to perform a comparative analysis of the analysis result data, the input information to the text mining analysis device Based on the selected analysis result data, select the analysis result data, create a comparison list based on the selected analysis result data, set the comparison condition based on the input information, and execute the comparison analysis for the comparison list according to the comparison condition And a comparison result by comparison analysis is output.
また、本発明のテキストマイニング分析プログラムは、テキストマイニング分析装置に、入力情報にもとづいて、所定のアラーム出力基準を設定させ、比較一覧からアラーム出力基準を満たす特徴語を検出させて、当該特徴語についてのアラーム情報を出力させる構成としてある。 The text mining analysis program of the present invention causes the text mining analyzer to set a predetermined alarm output criterion based on input information, detect a feature word that satisfies the alarm output criterion from a comparison list, and Is configured to output alarm information about the.
テキストマイニング分析プログラムをこのような構成にすれば、テキストマイニング分析装置に、過去の分析結果を用いて、分析結果間の比較分析を実行させ、比較結果を出力させることができるとともに、所定の場合にはアラームを出力させることもできるため、分析者は、リスクやトレンド等を効率的に把握することが可能となる。 If the text mining analysis program is configured in this way, the text mining analyzer can be used to perform comparison analysis between analysis results using past analysis results and output the comparison results. Since an alarm can be output, the analyst can efficiently grasp risks and trends.
本発明によれば、現在のテキストデータに対するテキストマイニング分析を行うことができるとともに、この分析結果と、過去に行ったテキストマイニング分析の結果を用いて、分析結果間の比較分析を行うことができるため、リスクやトレンドなどについての気づきや発見等を効率的に行うことが可能となる。
また、この比較分析によって、新たに出現した特徴語や、注目するキーワードなどの変化状況等を把握することができ、最新のトレンドなどを効率的に把握することが可能となる。
さらに、このような比較特徴として得られる結果が、直感的に把握されやすい形式で出力され、可視化されることにより、分析者だけでなく、例えば企業における現場担当者全員に対しても比較結果のフィードバックを容易に行うことができ、比較結果の活用を促進することが可能となる。
また、特に把握したい各種指標にもとづく比較結果について、アラームを出力することができるため、このような比較結果を明確に認識することができ、分析者は、トレンドやリスク等を一層効果的に把握することが可能となる。
According to the present invention, it is possible to perform a text mining analysis on the current text data, and to perform a comparative analysis between the analysis results using the analysis result and the result of the text mining analysis performed in the past. Therefore, it is possible to efficiently recognize and discover risks and trends.
In addition, by this comparative analysis, it is possible to grasp the state of change of newly appearing feature words, noticed keywords, etc., and it is possible to efficiently grasp the latest trends and the like.
Furthermore, the results obtained as such comparison features are output and visualized in an intuitively easy-to-understand format, so that not only the analyst but also all on-site personnel in the company can compare the results. Feedback can be performed easily, and the use of the comparison result can be promoted.
In addition, alarms can be output for comparison results based on various indicators that you want to understand, so you can clearly recognize such comparison results, and analysts can understand trends and risks more effectively. It becomes possible to do.
以下、本発明に係るテキストマイニング分析装置の好ましい実施形態について、図面を参照しつつ説明する。
なお、以下の実施形態に示す本発明のテキストマイニング分析装置は、プログラムに制御されたコンピュータにより動作するようになっている。プログラムは、コンピュータの各構成要素に指令を送り、テキストマイニング分析装置の動作に必要となる所定の処理、例えば、特徴分析処理、比較設定処理、比較一覧表示処理、比較特徴抽出処理等を行わせる。このように、本発明のテキストマイニング分析装置における各処理,動作は、プログラムとコンピュータとが協働した具体的手段により実現できるものである。
プログラムは予めROM,RAM等の記録媒体に格納され、コンピュータに実装された記録媒体から当該コンピュータにプログラムを読み込ませて実行されるが、例えば通信回線を介してコンピュータに読み込ませることもできる。
また、プログラムを格納する記録媒体は、例えば半導体メモリ,磁気ディスク,光ディスク、その他任意のコンピュータで読取り可能な任意の記録手段により構成できる。
Hereinafter, a preferred embodiment of a text mining analyzer according to the present invention will be described with reference to the drawings.
Note that the text mining analyzer of the present invention shown in the following embodiments is operated by a computer controlled by a program. The program sends a command to each component of the computer to perform predetermined processing necessary for the operation of the text mining analyzer, such as feature analysis processing, comparison setting processing, comparison list display processing, comparison feature extraction processing, etc. . Thus, each process and operation in the text mining analyzer of the present invention can be realized by specific means in which the program and the computer cooperate.
The program is stored in advance in a recording medium such as a ROM and a RAM, and is executed by causing the computer to read the program from a recording medium mounted on the computer. For example, the program may be read by the computer via a communication line.
Further, the recording medium for storing the program can be constituted by, for example, a semiconductor memory, a magnetic disk, an optical disk, or any other recording means readable by any computer.
[第一実施形態]
まず、本発明の第一実施形態の構成について、図1〜図8を参照して説明する。図1は、本実施形態のテキストマイニング分析装置の構成を示すブロック図である。図2〜図8は、順に本実施形態のテキストマイニング分析装置におけるテキストデータ,分析結果データ,比較対象リスト設定画面,比較結果一覧,新出単語抽出表示結果,注目キーワードハイライト表示結果,グラフ表示結果を示す図である。
[First embodiment]
First, the structure of 1st embodiment of this invention is demonstrated with reference to FIGS. FIG. 1 is a block diagram showing the configuration of the text mining analyzer of this embodiment. 2 to 8 show, in order, text data, analysis result data, comparison target list setting screen, comparison result list, new word extraction display result, attention keyword highlight display result, graph display in the text mining analyzer of this embodiment. It is a figure which shows a result.
図1に示すように、本実施形態のテキストマイニング分析装置は、入力装置10,記憶装置20,データ分析処理装置30,出力装置40を有している。
入力装置10は、テキストデータに対するマイニング分析を実施する者(以下、単に分析者と称する。)が、比較分析の条件等をデータ分析処理装置30に入力するためなどに使用するキーボード等の装置である。
As shown in FIG. 1, the text mining analyzer of this embodiment includes an
The
記憶装置20は、情報を記録する装置であり、図1に示すように、複数のテキストデータ21(テキストデータ21−1,・・・,テキストデータ21−n)と、複数の分析結果データ22(分析結果データ22−1,・・・,分析結果データ22−m)とを蓄積する。なお、このテキストデータ21と分析結果データ22とは、必ずしも一対一に対応するものではなく、複数のテキストデータ21にもとづき一の分析結果データ22が作成される場合や、一のテキストデータ21にもとづき複数の分析結果データ22が作成される場合も含まれるものである。
The
テキストデータ21は、アンケートに対する回答や、問合せ、苦情等のテキストを含む否定形型データであり、例えば、図2に示すようなものとすることができる。
同図に示すように、テキストデータ21としては、CSVと呼ばれるコンマ区切りのテキストファイルや、リレーショナルデータベースなどのデータベースから抽出される一定のフォーマットを有するファイル等とすることができ、列と行から構成されている。
The
As shown in the figure, the
図2に示すテキストデータ21は、ある商品に対するアンケートを実施した結果得られたデータの例であり、そのデータ構造として、「日時」,「商品名」,「性別」,「年齢区分」,「評価点」,「意見」,「要望」等の列項目を有している。
「日時」は、データが入力された年月日および時刻情報、「商品名」は、アンケートの対象である商品の名称、「性別」・「年齢区分」は、アンケート回答者の属性情報である。また、「評価点」は、商品に対する回答者の評価の点数(この例では、5点満点の5段階評価)、「意見」・「要望」は、商品に対する回答者の意見・要望(文章で記述されたもの)である。
The
“Date and time” is the date and time information when the data was input, “Product name” is the name of the product that is the subject of the questionnaire, and “Gender” and “Age category” are the attribute information of the survey respondents . The “evaluation score” is the score of the respondent's evaluation for the product (in this example, a five-point scale of 5 points), and the “opinion” and “request” are the opinions and requests of the respondent to the product Is described).
上述のように、このテキストデータ21としては、アンケート以外の情報を用いることができることは言うまでもなく、例えば、コンタクトセンタに寄せられる問い合わせや苦情をデータベース化したものや、営業担当者が書く日報をデータベース化したもの等を用いることも好ましい。また、テキストデータ21の列の項目数は、図2に例示したものに限定されるものではなく、その他数百項目におよぶ場合があり、さらにテキストデータ21の行数は、数百から数百万のように膨大な量になることもある。
As mentioned above, it goes without saying that information other than a questionnaire can be used as the
分析結果データ(以下、単に分析結果と称する。)22は、特徴分析実行手段31が出力した実行結果であり、例えば、図3に示すようなものとすることができる。同図に示すように、そのデータ構造としては、「特徴語」,「頻度」,「総頻度」,「統計尺度」等の列項目を有するものとすることができる。
また、この分析結果22を図やリストなどにより表示することも好ましく、表示された特徴語からその分析元データである対応する原文(特徴語の抽出元のテキストデータ21)を参照可能とすることも好ましい。その方法としては、例えば、分析結果22において個々の特徴語を、例えばクリックなどにより選択可能とし、その選択がされると、特徴分析実行手段31が、選択された特徴語をキーとしてテキストデータ21を検索し、この特徴語を有するテキストデータ21の名称をリスト表示するウィンドウを出力することなどが可能である。
The analysis result data (hereinafter simply referred to as analysis result) 22 is an execution result output by the feature analysis execution means 31 and can be, for example, as shown in FIG. As shown in the figure, the data structure may have column items such as “characteristic word”, “frequency”, “total frequency”, and “statistical scale”.
It is also preferable to display the
データ分析処理装置30は、プログラム制御により動作する情報処理装置であり、特徴分析実行手段31,比較設定手段32,比較一覧表示手段33,比較特徴抽出手段34を有している。
特徴分析実行手段31は、入力されたテキストデータ21に対し、入力装置から設定した条件に従って、テキストマイニング分析を実行し、分析結果22を出力するものである。この特徴分析実行手段31は、本出願人による特許文献である特許文献1に記載のテキスト分類エンジンに相当するものである。
この特徴分析実行手段31は、テキストデータ21から単語を切り出し、係り受けを解析して、特定キーワードとカテゴリから分類ルールを抽出し、その結果を分析結果22及び出力装置40へ出力する。
The data
The feature analysis execution means 31 performs text mining analysis on the
The feature
例えば、図3は、図2に示すテキストデータ21に対し、「性別」=「男性」かつ「年齢区分」=「40歳代」の条件に該当するデータにおける「意見」で使われている特徴的な単語を抽出した結果を表示する例を示したものである。
なお、同図において、「親しみやすい」「若者→好む」といった特徴語が表示されているが、特徴的な単語と判断するルールとしては、例えば、出力頻度が高い単語を特徴的と判断することができる。また、対象とするカテゴリ以外のデータ、この例の場合では、「性別」=「女性」又は「年齢区分」=「40歳代以外」と比べた場合の特徴度を統計処理することにより、特徴的な単語を把握することも可能である。
For example, FIG. 3 shows the characteristics used in the “opinion” in the data corresponding to the condition of “sex” = “male” and “age category” = “40s” with respect to the
In the figure, characteristic words such as “friendly” and “young → prefer” are displayed. As a rule for determining a characteristic word, for example, a word with high output frequency is determined to be characteristic. Can do. In addition, in the case of this example, data other than the target category, in the case of “gender” = “female” or “age category” = “other than the 40s”, statistical processing is performed on the characteristic degree, It is also possible to grasp typical words.
比較設定手段32は、特徴分析実行手段31によって出力された複数の分析結果22にもとづいて、その差異を比較分析するにあたっての分析対象範囲及び比較オプションを設定するものである。この比較設定手段32は、図4に示すような比較対象リスト設定画面を表示し、分析者による選択入力情報にもとづいて、比較一覧表示手段33により表示する比較一覧に表示させる分析結果22を設定する。また、比較設定手段32は、比較一覧に表示させる分析結果22の表示順序を設定することも可能である。また、図示しないが、比較設定手段32は、各種比較オプションを設定するための設定画面を表示でき、分析者の入力情報にもとづいて、比較オプションを設定し、比較特徴抽出手段34は、この比較オプションにもとづき比較分析を実行する。
The
比較一覧表示手段33は、比較設定手段32により設定した条件に従って、比較一覧を出力するものである。図5は、この比較一覧表示手段33により表示された比較一覧である比較結果一覧の例を示している。
このユーザインタフェースによって、各分析結果を一覧表示することができるとともに、特徴度の基準となる頻度や統計尺度にもとづいて、ソート(並べ替え)が行えるようになっている。また、特徴語からその単語が使用されている原文、すなわちその単語の抽出元であるテキストデータ21を参照できるようになっている。その参照方法としては、分析結果22における場合と同様のものとすることができる。なお、特徴度とは、分析結果の特徴を把握するための指標を意味するものである。
The comparison list display means 33 outputs a comparison list according to the conditions set by the comparison setting means 32. FIG. 5 shows an example of a comparison result list that is a comparison list displayed by the comparison list display means 33.
With this user interface, each analysis result can be displayed as a list, and sorting (rearrangement) can be performed on the basis of a frequency or a statistical scale serving as a reference for the characteristic degree. Further, the original text in which the word is used from the feature word, that is, the
比較特徴抽出手段34は、比較一覧表示手段33により作成された比較一覧から所定の条件にもとづいて、分析結果間の差異や特徴点を抽出し、比較結果として出力するものである。このとき、比較特徴抽出手段34は、比較オプションの設定により、複数の分析手法を提供することができる。また、各比較オプションごとに、分析者による入力情報にもとづいて、比較条件を設定し、この比較条件に従って比較一覧に対する比較分析を実行する。
例えば、比較一覧から新出単語を抽出して、表や図やリストといった形式で出力することができる。図6は、このような新出単語の抽出表示結果の例を示すものであり、同図において、特徴分析結果1及び2には表示されておらず、特徴分析結果3において初めて出現した特徴語が、他の語と識別可能に強調表示されている。
The comparison
For example, new words can be extracted from the comparison list and output in the form of a table, a figure, or a list. FIG. 6 shows an example of such a new word extraction display result. In FIG. 6, the feature words that are not displayed in the
また、注目単語のハイライト表示やそのグラフ化を行うことも可能である。図7は、注目キーワードのハイライト表示結果の例を示しており、同図においては、「デザイン」が他の語と識別可能に強調表示されている。もちろん、複数の特徴語をハイライト表示させることも可能である。そして、図8は、このようにして選択された注目キーワードの特徴度の変化を表示するグラフの表示結果を示している。同図の例では、特徴分析結果1〜4に対応する月である9月〜12月における「デザイン」,「信頼する」,「平凡だ」,「使いにくい」の4つのキーワードの出現頻度の変化を表示している。 It is also possible to highlight the attention word and graph it. FIG. 7 shows an example of a highlighted display result of a keyword of interest. In FIG. 7, “design” is highlighted so as to be distinguishable from other words. Of course, a plurality of feature words can be highlighted. FIG. 8 shows a display result of a graph that displays the change in the feature level of the keyword of interest selected in this way. In the example of the figure, the frequency of appearance of the four keywords “design”, “trust”, “ordinary”, and “difficult to use” in September to December, which is the month corresponding to the feature analysis results 1 to 4, is shown. The change is displayed.
出力装置40は、分析結果22、比較一覧表示手段33により作成される比較一覧、及び比較特徴抽出手段34により作成される各種表やグラフ等を出力するディスプレイ装置や印刷装置などの装置である。
The
次に、本実施形態のテキストマイニング分析装置における処理手順について、図1、及び図9〜図11を参照して説明する。
図9〜図11は、順に本実施形態のテキストマイニング分析装置における比較設定処理手順,新出単語抽出処理手順,注目キーワードハイライト・グラフ化処理手順を示すフローチャートである。
Next, a processing procedure in the text mining analyzer of the present embodiment will be described with reference to FIG. 1 and FIGS.
FIG. 9 to FIG. 11 are flowcharts showing the comparison setting processing procedure, the new word extraction processing procedure, and the attention keyword highlight / graphing processing procedure in the text mining analyzer of this embodiment in order.
まず、分析者は、入力装置10から分析対象とするテキストデータ21を指定するとともに、その分析の条件を設定し、特徴分析実行手段31によって分析を実行して、分析結果22を作成し、これを出力装置40に表示する。
このとき、特徴分析実行手段31は、入力装置10から入力したテキストデータ21の指定及び分析条件にもとづいて、テキストデータ21からの単語の切り出し、係り受けの解析、及び特定キーワードとカテゴリにもとづく分類ルールの抽出を実行し、その結果を有する分析結果22を記憶装置20に作成するとともに、これを出力装置40へ出力して表示させる。
First, the analyst designates the
At this time, the feature analysis execution means 31 cuts out words from the
一般に、コンタクトセンタに寄せられる問い合わせの履歴や、顧客満足度調査のアンケートなどについては、企業などの活動にフィードバックする目的で、通常日次あるいは月次といったタイミングで特徴分析が実行され、その分析結果が記憶装置20に逐次記憶され、蓄積されていく。
そして、分析者が、このように蓄積された分析結果と、現在特徴を把握したい対象であるテキストデータ21に対する分析結果22とにもとづいて、定点観測的な分析や特徴的な傾向出現の検知等を行う場合、比較設定手段32を用いて、比較一覧を表示するための条件設定を行う。
In general, with regard to the history of inquiries sent to the contact center and customer satisfaction survey questionnaires, etc., feature analysis is usually performed on a daily or monthly basis for the purpose of providing feedback to company activities. Are sequentially stored and accumulated in the
Then, based on the analysis results accumulated in this way and the analysis results 22 for the
このとき、比較設定手段32は、図9に示すように、分析者が、蓄積されている分析結果22から比較分析の対象とする分析結果を選択すると、この選択情報を入力し(ステップA1)、図4に示すような比較対象リストに追加する(ステップA2)。そして、これらの動作を、所望の分析結果についての選択が完了するまで繰り返す(ステップA3)。 At this time, as shown in FIG. 9, when the analyst selects an analysis result to be subjected to comparative analysis from the accumulated analysis results 22, the comparison setting means 32 inputs this selection information (step A1). 4 is added to the comparison target list as shown in FIG. 4 (step A2). These operations are repeated until selection of a desired analysis result is completed (step A3).
さらに、分析者が、選択を完了した比較対象リストから、分析結果を一つ選択し、比較する順序を指定して設定すると、比較設定手段32は、その選択情報を入力して(ステップA4)、その順序設定を実行する(ステップA5)。そして、これらの動作を、比較対象リストにおけるすべての分析結果22について設定が完了するまで繰り返す(ステップA6)。
この比較順序の設定は、特に、時系列でトレンド分析をしたい場合や、顧客のロイヤリティサイクルによる分析をしたい場合など、比較の並び順に意味を持たせたい場合に行うと効果的なものである。
Furthermore, when the analyst selects one analysis result from the comparison target list for which selection has been completed, and designates and sets the order of comparison, the comparison setting means 32 inputs the selection information (step A4). The order setting is executed (step A5). These operations are repeated until the setting is completed for all the analysis results 22 in the comparison target list (step A6).
This setting of the comparison order is particularly effective when it is desired to make sense in the order of comparison, such as when trend analysis is performed in chronological order or when analysis is performed based on a customer loyalty cycle.
次に、比較一覧表示手段33が、比較設定手段32により比較対象リストとして設定された条件にもとづいて、図5に示すような比較一覧を表示する。
さらに、比較特徴抽出手段34は、分析者により設定されたオプションにもとづいて、分析結果間の差異や特徴点について、図6〜図8に示すような種々の比較結果を出力装置40に表示する。
Next, the comparison list display means 33 displays a comparison list as shown in FIG. 5 based on the conditions set as a comparison target list by the comparison setting means 32.
Further, the comparison feature extraction means 34 displays various comparison results as shown in FIGS. 6 to 8 on the
図10は、比較特徴抽出手段34による処理の一オプションである新出単語を抽出する処理手順を示すフローチャートである。
分析者が、比較条件として、比較一覧に表示された分析結果の中から、ターゲットの分析結果(以下、単にターゲット結果と称する。)を一つ選択するとともに、新出単語抽出範囲を指定すると、比較特徴抽出手段34は、分析者により選択されたターゲット結果の選択情報を入力し(ステップB1)、分析者により指定された新出単語抽出範囲の指定情報を入力する(ステップB2)。このターゲット結果とは、新出単語が出現しているかどうかを判断する対象としての分析結果を意味する。また、新出単語抽出範囲とは、ターゲット結果における特徴語が、出現しているかどうかを判断するための対象としての分析結果を意味する。
FIG. 10 is a flowchart showing a processing procedure for extracting a new word, which is an option of processing by the comparison feature extraction means 34.
When an analyst selects a target analysis result (hereinafter simply referred to as a target result) from the analysis results displayed in the comparison list as a comparison condition, and specifies a new word extraction range, The comparison
次に、比較特徴抽出手段34は、ターゲット結果に特徴語として出力されている単語を一つ選択して(ステップB3)、選択した特徴語が、新出単語抽出範囲に指定されている分析結果に特徴語として出力されているかどうかを判別し、出現していない場合は、その選択した特徴語を新出単語であると判断する(ステップB4)。
そして、その選択した特徴語についての表示切替情報を作成し、比較一覧において、その選択した特徴語の表示を、他の特徴語と識別可能な強調表示に変換させた新出単語抽出表示結果を作成する(ステップB5)。なお、この新出単語のみを表示するリストや図等を作成してもよい。
以上の動作をターゲット結果におけるすべての特徴語について繰り返し(ステップB6)、完成した単語抽出表示結果を出力する。
Next, the comparison
Then, display switching information for the selected feature word is created, and a new word extraction display result obtained by converting the display of the selected feature word into a highlighted display that can be distinguished from other feature words in the comparison list. Create (step B5). In addition, you may create the list, figure, etc. which display only this new word.
The above operation is repeated for all feature words in the target result (step B6), and the completed word extraction display result is output.
図6に示す単語抽出表示結果は、ターゲット結果として特徴分析結果3を選択し、新出単語抽出範囲として特徴分析結果1及び2を指定した場合の例を示したものである。すなわち、この場合は、特徴分析結果1及び2には出現せず、特徴分析結果3に初めて現れた特徴語のみを抽出する処理設定となり、同図に示すように「子供」「使いにくい」「店舗」「販売員」などの単語が、新出単語としてハイライト表示されている。
The word extraction display result shown in FIG. 6 shows an example in which feature
また、図11は、比較特徴抽出手段34による処理の別のオプションである注目キーワードをハイライト出力する処理手順を示すフローチャートである。
分析者が、比較条件として、比較一覧に表示された分析結果の中から、気になる単語を、分析対象とする単語である注目キーワードとして選択して、図示しないハイライト対象リストに追加すると、比較特徴抽出手段34は、この注目キーワードの選択情報を入力し(ステップC1)、ハイライト対象リストに追加する(ステップC2)。そして、これが所望の注目キーワードの数だけ繰り返し実行される(ステップC3)。
FIG. 11 is a flowchart showing a processing procedure for highlight-outputting a keyword of interest, which is another option of processing by the comparison
When an analyst selects, as a comparison condition, a word of interest from the analysis results displayed in the comparison list as an attention keyword that is a word to be analyzed, and adds it to a highlight target list (not shown) The comparison feature extraction means 34 inputs this attention keyword selection information (step C1) and adds it to the highlight target list (step C2). This is repeated for the number of desired keywords of interest (step C3).
そして、比較特徴抽出手段34は、ハイライト対象リストに追加されたそれぞれのキーワードについて、比較一覧における分析結果に特徴語として表示されているかどうかを検索し、表示されている場合は、その特徴語についての表示切替情報を作成して、その表示をハイライト表示に変換して表示する(ステップC4)。
また、比較特徴抽出手段34は、その検索結果にもとづいて、ハイライト対象リストにおける各キーワードについての、特徴度の変化を表示するグラフを作成して、出力装置40に表示する(ステップC5)。
Then, the comparison
Further, the comparison
図7に示す注目キーワードハイライト表示結果は、ハイライト対象リストに「デザイン」を追加し、比較一覧における各分析結果上で「デザイン」のポジションをハイライト表示した例を示している。さらに、同様にして、ハイライト対象リストに「信頼する」「平凡だ」「使いにくい」を追加し、グラフ化した例を図8に示している。図8では、キーワードの特徴度の推移が一覧可能な折れ線グラフが表示されている。もちろん、グラフの種類は折れ線グラフに限定されるものではなく、その他の各種グラフに適宜変更可能とすることも好ましい。 The attention keyword highlight display result shown in FIG. 7 shows an example in which “design” is added to the highlight target list, and the position of “design” is highlighted on each analysis result in the comparison list. Similarly, FIG. 8 shows an example in which “reliable”, “ordinary” and “difficult to use” are added to the highlight target list and graphed. In FIG. 8, a line graph is displayed in which the transition of the keyword characteristic degree can be listed. Of course, the type of the graph is not limited to the line graph, and it is also preferable that the graph can be appropriately changed to various other graphs.
[第二実施形態]
次に、本発明の第二実施形態について、図12を参照して説明する。同図は、本実施形態のテキストマイニング分析装置の構成を示すブロック図である。
本実施形態は、分析者が設定した所定のアラーム出力基準を超えて特徴が出現した場合に、アラーム情報を出力する点で第一実施形態と異なるものである。
本実施形態のテキストマイニング分析装置は、図1に示す第一実施形態の構成に加えて、データ分析処理装置30にアラーム出力手段35を有している。また、このアラーム出力手段35からの出力情報を有線又は無線により受信可能な情報共有サーバ50を有している。
[Second Embodiment]
Next, a second embodiment of the present invention will be described with reference to FIG. FIG. 2 is a block diagram showing the configuration of the text mining analyzer of this embodiment.
The present embodiment is different from the first embodiment in that alarm information is output when a feature appears exceeding a predetermined alarm output standard set by an analyst.
The text mining analyzer of this embodiment has an alarm output means 35 in the
アラーム出力手段35は、分析者による入力情報にもとづいて、所定のアラーム出力基準を設定し、比較一覧からこのアラーム出力基準を満たす単語を検出して、そのアラーム情報を出力するものである。
本実施形態においては、アラーム出力手段35は、分析者により入力された所定の閾値情報にもとづいて、比較一覧における各分析結果から、その閾値情報を超える特徴度を有する特徴語を抽出してアラーム情報を作成し、これを出力装置40や情報共有サーバ50へ出力する。
The alarm output means 35 sets a predetermined alarm output standard based on information input by an analyst, detects a word satisfying this alarm output standard from the comparison list, and outputs the alarm information.
In the present embodiment, the alarm output means 35 extracts a feature word having a characteristic degree exceeding the threshold information from each analysis result in the comparison list based on the predetermined threshold information input by the analyst, and generates an alarm. Information is created and output to the
この閾値情報は、種々の条件情報とすることができる。例えば、特徴度の変化量とすることができ、出現頻度の増加率や減少率などとすることができる。また、特徴度の絶対値とすることもでき、所定の出現総頻度を超える特徴語などをアラーム出力の対象とすることができる。さらに、あらかじめ設定しておいた特定のキーワードが出現したか否かをアラーム出力の対象とすることもできる。これらは、アラーム出力手段35に、オプションとして設定可能とすることができる。
また、アラーム情報は、分析者に警告を与えることが可能なものであれば、特に限定されるものではなく、例えば、警告ウィンドウにアラーム出力の対象として抽出された特徴語をリスト表示するものなどとすることができる。
The threshold information can be various condition information. For example, it can be the amount of change of the feature degree, and can be the increase rate or decrease rate of the appearance frequency. Also, the absolute value of the feature degree can be used, and a feature word exceeding a predetermined total appearance frequency can be set as an alarm output target. Further, whether or not a specific keyword set in advance appears can be set as an alarm output target. These can be set as options in the alarm output means 35.
The alarm information is not particularly limited as long as it can give a warning to the analyst. For example, a list of feature words extracted as alarm output targets in a warning window is displayed. It can be.
情報共有サーバ50は、例えば、企業部門EIPといった情報共有システムと連携して、テキストマイニング分析装置から入力された気づき情報としてのアラーム情報を、速報アラームなどとして活用可能な情報処理装置とすることができる。
The
次に、本実施形態のテキストマイニング分析装置におけるアラーム出力処理手順について、図13を参照して説明する。同図は、本実施形態のテキストマイニング分析装置におけるアラーム出力処理手順を示すフローチャートであり、アラーム出力手段35による処理の一オプションであるキーワード出現増加率についてのアラーム出力処理手順を示すものである。
まず、分析者が、比較一覧表示手段33により表示される比較一覧、又は比較特徴抽出手段34により表示される新出単語抽出表示結果や注目キーワードハイライト表示結果等からターゲット結果を選択して閾値を設定すると、アラーム出力手段35は、選択されたターゲット結果の選択情報を入力し(ステップD1)、閾値の設定を行う(ステップD2)。
Next, an alarm output processing procedure in the text mining analyzer of this embodiment will be described with reference to FIG. FIG. 6 is a flowchart showing an alarm output processing procedure in the text mining analyzer of the present embodiment, and shows an alarm output processing procedure for a keyword appearance increase rate that is one option of processing by the alarm output means 35.
First, the analyst selects a target result from the comparison list displayed by the comparison list display means 33, the new word extraction display result displayed by the comparison feature extraction means 34, the attention keyword highlight display result, etc. Is set, the alarm output means 35 inputs selection information of the selected target result (step D1) and sets a threshold (step D2).
次に、アラーム出力手段35は、分析者による入力情報にもとづいて、選択されたターゲット結果から特徴語を一つ選択し(ステップD3)、ターゲット結果におけるその特徴語の出現頻度と、それ以前の分析結果におけるその特徴語の出現頻度とを比較して、その特徴語の出現増加率が設定した閾値を超えているかを判定する(ステップD4)。
閾値をこえていた場合は、アラーム出力手段35は、その特徴語についてのアラーム情報を生成する(ステップD5)。
そして、ターゲット結果に含まれているすべての特徴語について、出現頻度が閾値を超えているかどうかを判定する処理を繰り返して(ステップD6)、アラーム情報が生成されている場合は、これらのアラーム情報を出力装置40や情報共有サーバ50へ出力する(ステップD7)。
Next, the alarm output means 35 selects one feature word from the selected target result based on the input information by the analyst (step D3), the appearance frequency of the feature word in the target result, and the previous frequency. It compares with the appearance frequency of the feature word in an analysis result, and determines whether the appearance increase rate of the feature word exceeds the set threshold value (step D4).
If the threshold is exceeded, the alarm output means 35 generates alarm information for the feature word (step D5).
Then, for all feature words included in the target result, the process of determining whether the appearance frequency exceeds the threshold is repeated (step D6), and if alarm information is generated, these alarm information Is output to the
なお、ターゲット結果における特徴語の出現頻度と、それ以前の分析結果における特徴語の出現頻度との比較において用いられる以前の分析結果としては、比較分析の対象としている比較一覧に存在するターゲット結果以前のすべての分析結果を用いるようにすることができる。
また、例えば、ステップD1において、第一実施形態における場合と同様に、ターゲット結果の選択とともに、比較の対称とする一又は二以上の分析結果を指定可能とし、ターゲット結果における特徴語の出現頻度と、指定された分析結果における特徴語の出現頻度との比較を行うようにすることも好ましい。
The previous analysis results used in the comparison between the appearance frequency of feature words in the target results and the appearance frequency of feature words in the previous analysis results are those before the target results existing in the comparison list that is the target of the comparative analysis. All analysis results of can be used.
Also, for example, in step D1, as in the first embodiment, together with the selection of the target result, it is possible to specify one or more analysis results that are symmetrical for comparison, and the appearance frequency of feature words in the target result It is also preferable to perform comparison with the appearance frequency of feature words in the designated analysis result.
なお、本発明は以上の実施形態に限定されるものではなく、本発明の範囲内において、種々の変更実施が可能であることは言うまでもない。
例えば、上記実施形態においては、比較特徴抽出手段34により、出力装置40に新出単語抽出表示、注目キーワードハイライト表示、及びグラフ表示を行う構成としているが、さらに多くの比較分析指標にもとづいて、その結果を表示させても勿論かまわない。また、これらの比較分析結果を情報共有サーバ50に送信して出力可能とすることも好ましい。
さらに、アラーム出力手段35によるアラーム情報の送信とともに、情報共有サーバ50に比較一覧を送信する構成とすることなどもでき、その他適宜変更することが可能である。
In addition, this invention is not limited to the above embodiment, It cannot be overemphasized that a various change implementation is possible within the scope of the present invention.
For example, in the above embodiment, the comparison feature extraction means 34 is configured to perform the new word extraction display, the attention keyword highlight display, and the graph display on the
Further, the alarm output means 35 can transmit the alarm information and the comparison list can be transmitted to the
本発明によれば、コンタクトセンタに寄せられた問い合わせや顧客満足度調査アンケートなどの顧客の声から、注目するトレンドや傾向、リスクや問題といった各種情報を抽出する情報マイニング装置や、情報マイニング装置をコンピュータに実現するためのプログラムといった用途に適用することが可能である。 According to the present invention, there is provided an information mining device or an information mining device for extracting various information such as a trend or tendency to be noticed, a risk or a problem from a customer's voice such as an inquiry sent to a contact center or a customer satisfaction survey. The present invention can be applied to uses such as a program for realizing on a computer.
10 入力装置
20 記憶装置
21(21−1〜21−n) テキストデータ
22(22−1〜22−m) 分析結果データ
30 データ分析処理装置
31 特徴分析実行手段
32 比較設定手段
33 比較一覧表示手段
34 比較特徴抽出手段
35 アラーム出力手段
40 出力装置
50 情報共有サーバ
DESCRIPTION OF
Claims (11)
入力情報にもとづき比較分析の対象とする前記分析結果データを選択し、選択した分析結果データにもとづき比較一覧を作成し、入力情報にもとづき比較条件を設定して、前記比較条件に従って前記比較一覧に対する比較分析を実行し、前記比較分析による比較結果を出力する比較手段を有する
ことを特徴とするテキストマイニング分析装置。 Two or more text data, feature analysis execution means for text mining analysis of each text data, and two or more possessing feature words obtained by this analysis and one or more predetermined feature degrees corresponding to the feature words A text mining analyzer with analysis result data of
Select the analysis result data to be subjected to the comparative analysis based on the input information, create a comparison list based on the selected analysis result data, set the comparison condition based on the input information, and perform the comparison list according to the comparison condition. A text mining analysis apparatus comprising: a comparison unit that executes comparison analysis and outputs a comparison result of the comparison analysis.
前記比較条件の設定において、入力情報にもとづいて、前記比較一覧における前記分析結果データの一をターゲットとして選択するとともに、このターゲットについての比較対象とする一又は二以上の分析結果データを前記比較一覧の中から指定し、
前記比較分析の実行において、前記ターゲットに存在するが、前記比較対象とする分析結果データに存在しない特徴語を、新出単語として検出し、
前記比較結果の出力において、前記新出単語を強調表示する比較結果を出力する
ことを特徴とする請求項1記載のテキストマイニング分析装置。 The comparing means is
In the setting of the comparison condition, one of the analysis result data in the comparison list is selected as a target based on input information, and one or more analysis result data to be compared with respect to the target is selected in the comparison list. Specify from
In the execution of the comparative analysis, a feature word that exists in the target but does not exist in the analysis result data to be compared is detected as a new word,
The text mining analysis apparatus according to claim 1, wherein in the output of the comparison result, a comparison result for highlighting the new word is output.
前記比較条件の設定において、入力情報にもとづいて、前記比較一覧の中から一又は二以上の分析対象とする特徴語を選択し、
前記比較分析の実行において、前記比較一覧におけるすべての前記分析対象とする特徴語を検出して、
前記比較結果の出力において、前記検出された分析対象とする特徴語を強調表示する比較結果を出力する
ことを特徴とする請求項1又は2記載のテキストマイニング分析装置。 The comparing means is
In setting the comparison condition, based on the input information, select one or more feature words to be analyzed from the comparison list,
In the execution of the comparative analysis, all feature words to be analyzed in the comparison list are detected,
The text mining analysis apparatus according to claim 1 or 2, wherein in the output of the comparison result, a comparison result for highlighting the detected feature word to be analyzed is output.
前記検出された分析対象とする特徴語に対応する前記特徴度を、前記比較一覧における分析結果データごとに表示するグラフを出力する
ことを特徴とする請求項3記載のテキストマイニング分析装置。 In the output of the comparison result, the comparison means
The text mining analysis apparatus according to claim 3, wherein a graph displaying the feature degree corresponding to the detected feature word to be analyzed for each analysis result data in the comparison list is output.
入力情報にもとづいて、所定のアラーム出力基準を設定し、前記比較一覧又は前記比較結果から前記アラーム出力基準を満たす特徴語を検出して、当該特徴語についてのアラーム情報を出力するアラーム出力手段を有する
ことを特徴とするテキストマイニング分析装置。 The text mining analyzer according to any one of claims 1 to 4,
Alarm output means for setting a predetermined alarm output standard based on input information, detecting a feature word satisfying the alarm output standard from the comparison list or the comparison result, and outputting alarm information for the feature word A text mining analyzer characterized by having.
ことを特徴とする請求項1〜5のいずれかに記載のテキストマイニング分析装置。 The comparison means or the alarm output means outputs the comparison result or the alarm information to an output device provided in the text mining analyzer or an information processing device connected to the text mining analyzer by wire or wirelessly. The text mining analyzer according to any one of claims 1 to 5, wherein:
前記比較一覧における特徴語の選択入力を受けると、この選択された特徴語の抽出元である前記テキストデータの情報を表示する
ことを特徴とする請求項1〜6のいずれかに記載のテキストマイニング分析装置。 The comparing means is
The text mining according to any one of claims 1 to 6, wherein when the selection input of the feature word in the comparison list is received, the information of the text data from which the selected feature word is extracted is displayed. Analysis equipment.
前記テキストマイニング分析装置が、
入力情報にもとづき比較分析の対象とする前記分析結果データを選択し、
選択した分析結果データにもとづき比較一覧を作成し、
入力情報にもとづき比較条件を設定して、
前記比較条件に従って前記比較一覧に対する比較分析を実行し、
前記比較分析による比較結果を出力する
ことを特徴とするテキストマイニング分析方法。 Two or more text data, feature analysis execution means for text mining analysis of each text data, two or more possessing feature words obtained by this analysis and one or more predetermined feature degrees corresponding to the feature words A text mining analysis method for performing a comparative analysis of the analysis result data using a text mining analysis device provided with the analysis result data of
The text mining analyzer is
Select the analysis result data to be subjected to comparative analysis based on the input information,
Create a comparison list based on the selected analysis result data,
Set comparison conditions based on the input information,
Performing a comparative analysis on the comparison list according to the comparison conditions;
A text mining analysis method, comprising: outputting a comparison result by the comparison analysis.
入力情報にもとづいて、所定のアラーム出力基準を設定し、
前記比較一覧から前記アラーム出力基準を満たす特徴語を検出して、
当該特徴語についてのアラーム情報を出力する
ことを特徴とする請求項8記載のテキストマイニング分析方法。 The text mining analyzer is
Based on the input information, set the predetermined alarm output criteria,
Detect feature words that meet the alarm output criteria from the comparison list,
The text mining analysis method according to claim 8, wherein alarm information about the feature word is output.
前記テキストマイニング分析装置に、
入力情報にもとづき比較分析の対象とする前記分析結果データを選択させ、
選択された分析結果データにもとづき比較一覧を作成させ、
入力情報にもとづき比較条件を設定させて、
前記比較条件に従って前記比較一覧に対する比較分析を実行させ、
前記比較分析による比較結果を出力させる
ことを実行させるためのテキストマイニング分析プログラム。 Two or more text data, feature analysis execution means for text mining analysis of each text data, and two or more possessing feature words obtained by this analysis and one or more predetermined feature degrees corresponding to the feature words A text mining analysis program for causing a text mining analysis device comprising the analysis result data to perform a comparative analysis of the analysis result data,
In the text mining analyzer,
Based on the input information, the analysis result data to be subjected to comparative analysis is selected,
Create a comparison list based on the selected analysis result data,
Let the comparison conditions be set based on the input information,
Performing a comparative analysis on the comparison list according to the comparison conditions;
A text mining analysis program for causing a comparison result by the comparison analysis to be output.
入力情報にもとづいて、所定のアラーム出力基準を設定させ、
前記比較一覧から前記アラーム出力基準を満たす特徴語を検出させて、
当該特徴語についてのアラーム情報を出力させる
ことを実行させるための請求項10記載のテキストマイニング分析プログラム。 In the text mining analyzer,
Based on the input information, set a predetermined alarm output standard,
Let the feature words that meet the alarm output criteria be detected from the comparison list,
The text mining analysis program according to claim 10, wherein the alarm information for the feature word is output.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003404793A JP2005165754A (en) | 2003-12-03 | 2003-12-03 | Text mining analysis apparatus, text mining analysis method, and text mining analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003404793A JP2005165754A (en) | 2003-12-03 | 2003-12-03 | Text mining analysis apparatus, text mining analysis method, and text mining analysis program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005165754A true JP2005165754A (en) | 2005-06-23 |
Family
ID=34727697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003404793A Pending JP2005165754A (en) | 2003-12-03 | 2003-12-03 | Text mining analysis apparatus, text mining analysis method, and text mining analysis program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005165754A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183939A (en) * | 2006-01-06 | 2007-07-19 | Internatl Business Mach Corp <Ibm> | Search method, system, program storage device (search service accessing and highlighting local and online available information source accessed before) |
JP2007233850A (en) * | 2006-03-02 | 2007-09-13 | Gifu Univ | Medical treatment evaluation support device, medical treatment evaluation support system and medical treatment evaluation support program |
JP2008209978A (en) * | 2007-02-23 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | Comparative evaluation detection device, comparative evaluation detection method, comparative evaluation detection program mounted with the method, and storage medium recording the program |
JP2008250975A (en) * | 2007-03-08 | 2008-10-16 | Just Syst Corp | Time-series information processor, method and program |
JP2009048482A (en) * | 2007-08-21 | 2009-03-05 | Nippon Hoso Kyokai <Nhk> | Information extraction apparatus, information extraction method, and information extraction program |
WO2011074698A1 (en) * | 2009-12-17 | 2011-06-23 | 日本電気株式会社 | Text mining system, text mining method and recording medium |
US8140337B2 (en) | 2006-08-03 | 2012-03-20 | Nec Corporation | Apparatus, method and program for text mining |
JP2013134612A (en) * | 2011-12-26 | 2013-07-08 | Hitachi Systems Ltd | Attention word analysis method and attention word analysis system |
US8805853B2 (en) | 2009-12-25 | 2014-08-12 | Nec Corporation | Text mining system for analysis target data, a text mining method for analysis target data and a recording medium for recording analysis target data |
-
2003
- 2003-12-03 JP JP2003404793A patent/JP2005165754A/en active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183939A (en) * | 2006-01-06 | 2007-07-19 | Internatl Business Mach Corp <Ibm> | Search method, system, program storage device (search service accessing and highlighting local and online available information source accessed before) |
JP2007233850A (en) * | 2006-03-02 | 2007-09-13 | Gifu Univ | Medical treatment evaluation support device, medical treatment evaluation support system and medical treatment evaluation support program |
US8140337B2 (en) | 2006-08-03 | 2012-03-20 | Nec Corporation | Apparatus, method and program for text mining |
JP2008209978A (en) * | 2007-02-23 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | Comparative evaluation detection device, comparative evaluation detection method, comparative evaluation detection program mounted with the method, and storage medium recording the program |
JP2008250975A (en) * | 2007-03-08 | 2008-10-16 | Just Syst Corp | Time-series information processor, method and program |
JP2009048482A (en) * | 2007-08-21 | 2009-03-05 | Nippon Hoso Kyokai <Nhk> | Information extraction apparatus, information extraction method, and information extraction program |
WO2011074698A1 (en) * | 2009-12-17 | 2011-06-23 | 日本電気株式会社 | Text mining system, text mining method and recording medium |
JP5708496B2 (en) * | 2009-12-17 | 2015-04-30 | 日本電気株式会社 | Text mining system, text mining method and program |
US8805853B2 (en) | 2009-12-25 | 2014-08-12 | Nec Corporation | Text mining system for analysis target data, a text mining method for analysis target data and a recording medium for recording analysis target data |
JP2013134612A (en) * | 2011-12-26 | 2013-07-08 | Hitachi Systems Ltd | Attention word analysis method and attention word analysis system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11102224B2 (en) | Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures | |
JP4772378B2 (en) | Method and apparatus for generating time-series data from a web page | |
US11615079B1 (en) | Graphical user interface for recurring searches | |
US11941137B2 (en) | Use of multi-faceted trust scores for decision making, action triggering, and data analysis and interpretation | |
US20180234328A1 (en) | Service analyzer interface | |
US20040181519A1 (en) | Method for generating multidimensional summary reports from multidimensional summary reports from multidimensional data | |
US20110078160A1 (en) | Recommending one or more concepts related to a current analytic activity of a user | |
US20080195611A1 (en) | Methodologies and analytics tools for locating experts with specific sets of expertise | |
US20150278315A1 (en) | Data fitting selected visualization type | |
US20110078101A1 (en) | Recommending one or more existing notes related to a current analytic activity of a user | |
US20110251977A1 (en) | Ad Hoc Document Parsing | |
JP2008084151A (en) | Information display device and information display method | |
US12020271B2 (en) | Identifying competitors of companies | |
EP1622050A1 (en) | Managing feedback data | |
JP2005165754A (en) | Text mining analysis apparatus, text mining analysis method, and text mining analysis program | |
JP2004021445A (en) | Text data analysis system, text data analysis method and computer program | |
US7992126B2 (en) | Apparatus and method for quantitatively measuring the balance within a balanced scorecard | |
WO2016147220A1 (en) | Text visualization system, text visualization method, and recording medium | |
JP5096850B2 (en) | Search result display method, search result display program, and search result display device | |
JP2005190284A (en) | Information classification device and method | |
JP2019053763A (en) | Text visualization system, text visualization method and program | |
KR20200075630A (en) | Dynamic visualization prototyping system and method for industriy evaluation data | |
JPH09282307A (en) | Commodity sales trend analysis method and system therefor | |
JP2009199576A (en) | Document analysis support device, document analysis support method, program and recording medium | |
JP2019053764A (en) | Text visualization system, text visualization method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080115 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080311 |